Pandas – Explorando dados
Olá, hoje mostrarei uma simples exploração de dados usando python com Pandas e algumas bibliotecas para plotar os dados
Pré-requisitos:
Python (claro rsrs)
Jupyter Notebook
(Biblioteca de pandas, matploblib e seaborn)
Baixe e importe para o seu Jupiter Notebook este * zip abaixo:
Dentro do zip temos 2 arquivos: pokemon.csv e pokemon.ipynb
Você tem que importar o pokemon.ipynb e pokemon.csv dentro do seu Jupyter Notebook
Você pode perceber que usaremos um conjunto de dados de Pokemons para uma explicação mais amigável.

Lendo o conjunto de dados

Então, tudo funcionando, (aparentemente) ahahaha
Aqui basicamente exibimos os 10 primeiros pokemons, sem ordem ou qualquer tipo de filtro
Plotando o primeiro gráfico
Vamos explorar os dados, acima nós vimos um gráfico mostrando o segundo tipo de Pokémon (alguns pokemons
podem ter 2 tipos distintos) e abaixo vemos o gráfico que mostra o tipo obrigatório do Pokémon (Tipo 1)
O Tipo 1 é obrigatório
No tipo 2 temos mais Pokémons Voadores do que o Tipo Água

O Pokémon mais fortes e o mais fraco
Podemos filtrar usando a coluna ataque, a classificação nos exibirá o Pokemon mais forte o mais fraco
Correlação e regressão linear
Podemos traçar também um mapa de correlação e regressão linear dos nossos Pokemons.
Boxplot
Podemos ver o primeiro, segundo, terceiro quartis e outliers do conjunto de dados (olhe para o HP ahahaha)
O objetivo desse post é mostrar alguns exemplos que podem ser aplicados, utilize usa imaginação para trabalhar
na sua exploração de dados!
have fun 🙂
That’s all.