O Teorema No-Free-Lunch
Existem centenas, senão milhares, de algoritmos e métodos estatísticos. Quando comecei nessa área, o primeiro método que eu tentava em absolutamente todo dataset era o K-means. Era meu algoritmo de cabeceira....
Tutoriais, dicas e projetos sobre Data Science e Python
Existem centenas, senão milhares, de algoritmos e métodos estatísticos. Quando comecei nessa área, o primeiro método que eu tentava em absolutamente todo dataset era o K-means. Era meu algoritmo de cabeceira....
Não tem um dia sequer em que eu abro as notícias ou as redes sociais sem me deparar com alguma novidade sobre IA. Na semana passada, tentei algo diferente. Conectei meu computador a um servidor VPN no Meio-Oeste dos EUA e, com o navegador em modo privado, acessei o Google News e outros portais de notícias. O resultado foi o mesmo....
Muito cedo no meu programa de doutorado, comecei a trabalhar com hipóteses e testá-las. Um dos primeiros desafios que tive que superar foi entender o p-valor....
Aprenda os conceitos básicos de Machine Learning e como usar a biblioteca sklearn para criar seu primeiro modelo preditivo em Python....
Depois de trabalhar com dados por alguns anos, percebi que 80% do meu tempo é gasto limpando dados. Não é a parte mais glamorosa do trabalho, mas é a mais importante. Nesse post vou mostrar técnicas de limpeza que uso todo dia. Coisas que aprendi na prática, errando muito até acertar. Por que "Avanç......
Aprender a discernir comentários na internet é uma coisa muito bacana. Mas, como podemos fazer isso de uma forma simples? Nesse post vamos aprender a fazer análise de sentimento simples usando TextBlob. Você já percebeu como às vezes a gente lê um comentário na internet e já sabe se ele foi escrito ......
Quando comecei a trabalhar com dados, lembro-me de haver passado 3 horas em uma análise incrível só para descobrir que metade dos dados estavam errados. Idades negativas, e-mails sem "@", datas no futuro... foi frustrante. Apanhei muito. Desde então, sempre valido meus dados antes de começar qualque......
Dashboards são essenciais para visualizar dados de forma clara e interativa. Se você já trabalha com Python e quer criar aplicações web sem complicação, Streamlit é a ferramenta perfeita. Neste post, vamos construir um dashboard completo do zero. Sem enrolação, só código que funciona. O que é Stream......
Desvio padrão é um conceito muito utilizado em ciência de dados. É uma base fundamental para qualquer cálculo estatístico. Nesse artigo, vamos mergulhar em um dos conceitos mais importantes (e às vezes mal compreendido) da análise de dados: desvio padrão. O que é Desvio Padrão? O desvio padrão é uma......
O pandas é uma ferramenta que já conhecemos. Já manipulamos dados em outros posts. Nesse artigo, vamos falar de uma das funcionalidades mais poderosas do pandas: o agrupamento de dados por períodos temporais. Para ser sincero, trabalhar com datas pode ser um pouco intimidador no começo. Quando comec......