Tratando colunas no DataFrame com Pandas

rafaelarc

Rafaela Carvalho

Posted on June 24, 2023

Tratando colunas no DataFrame com Pandas

Neste tutorial, vamos explorar algumas técnicas básicas de tratamento de dados utilizando a biblioteca pandas no Python.

Abordaremos tópicos como inclusão e exclusão de colunas, renomeação e ordenação de colunas, ajuste dos valores para letras maiúsculas e minúsculas.

Importando o pandas

Não esqueça de importar o pandas para executar os nossos exemplos:

import pandas as pd
Enter fullscreen mode Exit fullscreen mode

Adicionando novas colunas

Podemos incluir uma nova coluna utilizando diferentes tipos de dados, inclusive fatores lógicos.

Por exemplo, vamos adicionar uma coluna chamada ‘aprovado’ que indica se um aluno foi aprovado ou não com base em sua nota. Suponha que a nota de aprovação seja 7.

df['nota'] = [8, 6, 7, 9, 5]

df['aprovado'] = df['nota'] >= 7
Enter fullscreen mode Exit fullscreen mode

Neste exemplo, a nova coluna ‘aprovado’ terá o valor True para as notas maiores ou iguais a 7 e False para as notas menores que 7.

Excluindo colunas

Para excluir uma coluna, utilizamos o método drop(). O parâmetro axis=1 indica que queremos excluir uma coluna (e não uma linha).

df = df.drop('coluna_indesejada', axis=1)
Enter fullscreen mode Exit fullscreen mode

Renomeando colunas

Podemos renomear colunas utilizando o método rename().

df = df.rename(columns={'coluna_antiga': 'coluna_nova'})
Enter fullscreen mode Exit fullscreen mode

Ajustando as letras para maiúsculas ou minúsculas

Para converter todos os valores de uma coluna para letras maiúsculas, utilizamos o método str.upper().

df['coluna'] = df['coluna'].str.upper()
Enter fullscreen mode Exit fullscreen mode

Para converter para letras minúsculas, utilizamos o método str.lower().

df['coluna'] = df['coluna'].str.lower()
Enter fullscreen mode Exit fullscreen mode

Ordenando colunas

Para mover uma coluna para o início do Dataframe, podemos utilizar a seguinte sintaxe:

df = df[['coluna_movida'] + [coluna for coluna in df.columns if coluna != 'coluna_movida']]
Enter fullscreen mode Exit fullscreen mode

Essa sintaxe cria uma nova ordem para as colunas, colocando ‘coluna_movida’ no início e mantendo a ordem original das demais colunas.

Para mover uma coluna para o fim, podemos usar a seguinte sintaxe:

df = df[[coluna for coluna in df.columns if coluna != 'coluna_movida'] + ['coluna_movida']]
Enter fullscreen mode Exit fullscreen mode

Conclusão

Neste tutorial, aprendemos algumas técnicas básicas de tratamento de dados no Python. Aproveite para explorar esses conceitos nos seus projetos.

💖 💪 🙅 🚩
rafaelarc
Rafaela Carvalho

Posted on June 24, 2023

Join Our Newsletter. No Spam, Only the good stuff.

Sign up to receive the latest update from our blog.

Related