Pandas data analyse (Dutch)
compilerboiler
Posted on February 24, 2020
Panda's is een data-analyse module voor Python. De module werd voor het eerst ontwikkeld in 2008 en is uitgegroeid tot een van de meest populaire data-analyse modules.
Je kunt allerlei soorten data inlezen in Python met panda's.
Bijvoorbeeld het lezen van csv data (data uit txt), het inlezen van een pickle object bestand of zelfs het clipboard.
Data inlezen met panda's
Bij Panda's gaat het om data. Omdat programma's bijna altijd met data werken, is het een goede skill om de panda's-module te kennen.
Als dit uw tekstbestand is (filepath.txt, met tabs)
1 2 3
2 3 4
3 4 5
4 5 6
5 6 7
Kun je het in een pandas-dataframe inlezen met de lijnen:
import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")
Voor een csv bestand kun je het volgende doen:
data = pd.read_csv('output_list.txt', sep=",", header=None)
Je kunt de kolommen handmatig definiëren als uw gegevens geen kolommen hebben
data.columns = ["a", "b", "c", "etc."]
Je kunt dan met het dataframe werken, erop selecteren, filteren enzovoort.
Selecteer zo'n kolom:
import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")
dataset.columns = ["a", "b", "c"]
print(dataset["b"])
Dit toont al uw gegevens uit kolom A
➜ ~ python3 zoo.py
0 3
1 4
2 5
3 6
Naam: b, d-type: int64
Posted on February 24, 2020
Join Our Newsletter. No Spam, Only the good stuff.
Sign up to receive the latest update from our blog.