Aplicando Filtros em DataFrames usando Pandas
Rafaela Carvalho
Posted on June 20, 2023
Saudações, Cientistas de Dados! 👋
Uma das funcionalidades essenciais do Pandas é a capacidade de filtrar Dataframes, permitindo que os usuários selecionem e extraiam facilmente os dados relevantes para suas análises. Neste artigo, exploraremos como fazer filtros usando o Pandas.
Filtros de Data:
Muitas vezes, trabalhamos com conjuntos de dados que contêm informações temporais. O Pandas facilita a filtragem desses dados com base em datas específicas ou entre datas.
Suponha que no nosso dataframe temos uma coluna chamada "data", vamos filtrar os dados correspondentes a uma data específica da seguinte maneira:
filtro_data = dados[dados['data'] == '2023-06-16']
Podemos também filtrar apenas os dados entre duas datas, como por exemplo, entre '2023-06-10' e '2023-06-15':
filtro_data = dados[(dados['data'] >= '2023-06-10') & (dados['data'] <= '2023-06-15')]
Filtros de Critérios:
Além dos filtros de data, podemos filtrar os dados com base em critérios específicos. Neste exemplo, vamos exibir apenas as linhas em que a coluna "valor" seja maior que 100.
filtro_critério = dados[dados['valor'] > 100]
Podemos também filtrar por um critério em texto, na coluna descrição queremos mostrar apenas os dados que contenham a palavra "importante", desse jeito:
filtro_texto = dados[dados['descrição'].str.contains('importante')]
Encontrando uma Linha:
Às vezes, precisamos encontrar uma linha específica com base em um critério. Vamos encontrar agora a linha que contém o valor máximo na coluna "valor".
linha_max = dados.loc[dados['valor'].idxmax()]
Combinando Critérios:
Em algumas situações, pode ser necessário combinar vários critérios. Vamos filtrar então apenas as linhas em que a idade seja maior que 30 e a cidade seja "São Paulo".
filtro_combinado = dados[(dados['idade'] > 30) & (dados['cidade'] == 'São Paulo')]
Neste artigo, exploramos diferentes tipos de filtros. O Pandas fornece uma sintaxe intuitiva e poderosa para realizar essas operações, permitindo que os usuários selecionem facilmente os dados relevantes para suas análises.
Posted on June 20, 2023
Join Our Newsletter. No Spam, Only the good stuff.
Sign up to receive the latest update from our blog.