Tutoriais & Conceitos
Tag: analisededados
Tutoriais práticos de Python, pipelines de dados e analytics — do conceito ao código. Conteúdo técnico em português, sem enrolação.
Conceitos
Introdução ao Machine Learning - sklearn
Aprenda os conceitos básicos de Machine Learning e como usar a biblioteca sklearn para criar seu primeiro modelo preditivo em Python.
Ler tutorial
Boas Práticas
Limpeza de Dados Avançados: Técnicas Práticas com Pandas
Depois de trabalhar com dados por alguns anos, percebi que 80% do meu tempo é gasto limpando dados. Não é a parte mais glamorosa do trabalho, mas é a mais importante. Nesse post vou mostrar técnicas de limpeza que uso todo dia. Coisas que aprendi na prática, errando muito até acertar. Por que "Avanç...
Projetos
Análise de Sentimento Simples - TextBlob Para Iniciantes
Aprender a discernir comentários na internet é uma coisa muito bacana. Mas, como podemos fazer isso de uma forma simples? Nesse post vamos aprender a fazer análise de sentimento simples usando TextBlob. Você já percebeu como às vezes a gente lê um comentário na internet e já sabe se ele foi escrito ...
Fundamentos
Validação de Dados com Python: Como Evitar Dores de Cabeça
Quando comecei a trabalhar com dados, lembro-me de haver passado 3 horas em uma análise incrível só para descobrir que metade dos dados estavam errados. Idades negativas, e-mails sem "@", datas no futuro... foi frustrante. Apanhei muito. Desde então, sempre valido meus dados antes de começar qualque...
Projetos
Crie seu Primeiro Dashboard em Streamlit
Dashboards são essenciais para visualizar dados de forma clara e interativa. Se você já trabalha com Python e quer criar aplicações web sem complicação, Streamlit é a ferramenta perfeita. Neste post, vamos construir um dashboard completo do zero. Sem enrolação, só código que funciona. O que é Stream...
Conceitos
O que é Desvio Padrão em Ciência de Dados?
Desvio padrão é um conceito muito utilizado em ciência de dados. É uma base fundamental para qualquer cálculo estatístico. Nesse artigo, vamos mergulhar em um dos conceitos mais importantes (e às vezes mal compreendido) da análise de dados: desvio padrão. O que é Desvio Padrão? O desvio padrão é uma...
Conceitos
Agrupando Dados por Mês com groupby + resample
O pandas é uma ferramenta que já conhecemos. Já manipulamos dados em outros posts. Nesse artigo, vamos falar de uma das funcionalidades mais poderosas do pandas: o agrupamento de dados por períodos temporais. Para ser sincero, trabalhar com datas pode ser um pouco intimidador no começo. Quando comec...
Fundamentos
Gráfico de Pizza no Matplotlib em 5 Minutos
O Matplotlib é uma ferramenta que já conhecemos. Já fizemos gráficos em outros posts. Nesse artigo, vamos falar de um outro tipo de gráfico com o matplotlib, o gráfico de pizza. Para ser sincero, o gráfico de pizza é um pouco polêmico. Quando comecei a trabalhar no ramo da ciência de dados, me falar...
Boas Práticas
Programação Orientada a Objetos em Python para Iniciantes
Programação orientada a objetos (POO) é uma ferramenta que permite a criação de códigos mais organizações. Também permite a criação de código que é reutilizável e escalável, o que é ideal para lidar com a complexidade e o volume de dados. Qualquer cientista de dados que deseja aprimorar suas habilid...
Fundamentos
Regex in Python: Introdução às Expressões Regulares
As expressões regulares (regex) é uma ferramenta para trabalhar com padrões em textos. Com elas você pode procurar, validar, extrair, ou substituir informações de formas extremamente flexíveis. Nesse artigo, vamos explicar como funciona o regex em Python, desde os conceitos básicos até exemplos prát...