Introdução ao Machine Learning - sklearn
Aprenda os conceitos básicos de Machine Learning e como usar a biblioteca sklearn para criar seu primeiro modelo preditivo em Python....
Tutoriais, dicas e projetos sobre Data Science e Python
Aprenda os conceitos básicos de Machine Learning e como usar a biblioteca sklearn para criar seu primeiro modelo preditivo em Python....
Depois de trabalhar com dados por alguns anos, percebi que 80% do meu tempo é gasto limpando dados. Não é a parte mais glamorosa do trabalho, mas é a mais importante. Nesse post vou mostrar técnicas de limpeza que uso todo dia. Coisas que aprendi na prática, errando muito até acertar. Por que "Avanç......
Aprender a discernir comentários na internet é uma coisa muito bacana. Mas, como podemos fazer isso de uma forma simples? Nesse post vamos aprender a fazer análise de sentimento simples usando TextBlob. Você já percebeu como às vezes a gente lê um comentário na internet e já sabe se ele foi escrito ......
Quando comecei a trabalhar com dados, lembro-me de haver passado 3 horas em uma análise incrível só para descobrir que metade dos dados estavam errados. Idades negativas, e-mails sem "@", datas no futuro... foi frustrante. Apanhei muito. Desde então, sempre valido meus dados antes de começar qualque......
Dashboards são essenciais para visualizar dados de forma clara e interativa. Se você já trabalha com Python e quer criar aplicações web sem complicação, Streamlit é a ferramenta perfeita. Neste post, vamos construir um dashboard completo do zero. Sem enrolação, só código que funciona. O que é Stream......
Desvio padrão é um conceito muito utilizado em ciência de dados. É uma base fundamental para qualquer cálculo estatístico. Nesse artigo, vamos mergulhar em um dos conceitos mais importantes (e às vezes mal compreendido) da análise de dados: desvio padrão. O que é Desvio Padrão? O desvio padrão é uma......
O pandas é uma ferramenta que já conhecemos. Já manipulamos dados em outros posts. Nesse artigo, vamos falar de uma das funcionalidades mais poderosas do pandas: o agrupamento de dados por períodos temporais. Para ser sincero, trabalhar com datas pode ser um pouco intimidador no começo. Quando comec......
O Matplotlib é uma ferramenta que já conhecemos. Já fizemos gráficos em outros posts. Nesse artigo, vamos falar de um outro tipo de gráfico com o matplotlib, o gráfico de pizza. Para ser sincero, o gráfico de pizza é um pouco polêmico. Quando comecei a trabalhar no ramo da ciência de dados, me falar......
Programação orientada a objetos (POO) é uma ferramenta que permite a criação de códigos mais organizações. Também permite a criação de código que é reutilizável e escalável, o que é ideal para lidar com a complexidade e o volume de dados. Qualquer cientista de dados que deseja aprimorar suas habilid......
Um dos pontos estatisticos mais populares que os "dotados" no assunto de futebol gostam de falar do aproveitamento em casa. Estatisticamente falando, um time jogando em casa tem a vantagem. Estudos estatisticos indicam que times ganham com mais frequencia quando jogando em casa. Será que o campeonat......