Aplicando Filtros em DataFrames usando Pandas

rafaelarc

Rafaela Carvalho

Posted on June 20, 2023

Aplicando Filtros em DataFrames usando Pandas

Saudações, Cientistas de Dados! 👋

Uma das funcionalidades essenciais do Pandas é a capacidade de filtrar Dataframes, permitindo que os usuários selecionem e extraiam facilmente os dados relevantes para suas análises. Neste artigo, exploraremos como fazer filtros usando o Pandas.

Filtros de Data:

Muitas vezes, trabalhamos com conjuntos de dados que contêm informações temporais. O Pandas facilita a filtragem desses dados com base em datas específicas ou entre datas.

Suponha que no nosso dataframe temos uma coluna chamada "data", vamos filtrar os dados correspondentes a uma data específica da seguinte maneira:

filtro_data = dados[dados['data'] == '2023-06-16']
Enter fullscreen mode Exit fullscreen mode

Podemos também filtrar apenas os dados entre duas datas, como por exemplo, entre '2023-06-10' e '2023-06-15':

filtro_data = dados[(dados['data'] >= '2023-06-10') & (dados['data'] <= '2023-06-15')]
Enter fullscreen mode Exit fullscreen mode

Filtros de Critérios:

Além dos filtros de data, podemos filtrar os dados com base em critérios específicos. Neste exemplo, vamos exibir apenas as linhas em que a coluna "valor" seja maior que 100.

filtro_critério = dados[dados['valor'] > 100]
Enter fullscreen mode Exit fullscreen mode

Podemos também filtrar por um critério em texto, na coluna descrição queremos mostrar apenas os dados que contenham a palavra "importante", desse jeito:

filtro_texto = dados[dados['descrição'].str.contains('importante')]
Enter fullscreen mode Exit fullscreen mode

Encontrando uma Linha:

Às vezes, precisamos encontrar uma linha específica com base em um critério. Vamos encontrar agora a linha que contém o valor máximo na coluna "valor".

linha_max = dados.loc[dados['valor'].idxmax()]
Enter fullscreen mode Exit fullscreen mode

Combinando Critérios:

Em algumas situações, pode ser necessário combinar vários critérios. Vamos filtrar então apenas as linhas em que a idade seja maior que 30 e a cidade seja "São Paulo".

filtro_combinado = dados[(dados['idade'] > 30) & (dados['cidade'] == 'São Paulo')]
Enter fullscreen mode Exit fullscreen mode

Neste artigo, exploramos diferentes tipos de filtros. O Pandas fornece uma sintaxe intuitiva e poderosa para realizar essas operações, permitindo que os usuários selecionem facilmente os dados relevantes para suas análises.

💖 💪 🙅 🚩
rafaelarc
Rafaela Carvalho

Posted on June 20, 2023

Join Our Newsletter. No Spam, Only the good stuff.

Sign up to receive the latest update from our blog.

Related