|
| 1 | +# Daten mit Pandas einlesen |
| 2 | + |
| 3 | +"Pandas" steht für "Python Data Analysis Library" – nicht so offensichtlich, aber umso treffender, wenn man den |
| 4 | +Funktionsumfang betrachtet, den die Bibliothek bietet. |
| 5 | + |
| 6 | +Wie du in der letzten Aufgabe aus dem vorigen Abschnitt schon gesehen hast, geht es bei Pandas ganz oft um sogenannte |
| 7 | +`DataFrames`. |
| 8 | +`DataFrames` kannst du verstehen wie Tabellen, in denen Daten zeilen- und spaltenweise angezeigt, ausgewertet und |
| 9 | +manipuliert werden können. |
| 10 | + |
| 11 | +Wir wollen mit Pandas einige kleine Übungen machen, um ein Gefühl dafür zu bekommen, wie man damit umgeht und welche |
| 12 | +Möglichkeiten es gibt, um mit Daten umzugehen. |
| 13 | + |
| 14 | +In diesem Beispiel soll es darum gehen, die Datei `names.csv` einzulesen. |
| 15 | +Hierbei handelt es sich wieder um eine CSV-Datei – den Umgang damit hast du in der letzten Übung kennengelernt. |
| 16 | +Dieses Mal verwenden wir allerdings Pandas und nicht den CSV-Reader, den Python standardmäßig mitliefert. |
| 17 | + |
| 18 | +Um eine CSV-Datei zu laden, können wir die Funktion `read_csv` verwenden, die `pandas` oder `pd` anbietet: |
| 19 | + |
| 20 | +```python |
| 21 | +dataframe = pd.read_csv(filename) |
| 22 | +``` |
| 23 | + |
| 24 | +Damit erledigen wir innerhalb von einer Zeile das, was mit dem CSV-Reader viele Zeilen benötigt hat – vom Öffnen der |
| 25 | +Datei, das Erzeugen des Readers, das zeilenweise Einlesen der Datei... |
| 26 | + |
| 27 | +Die Funktion `load_names` soll diesen `DataFrame` nun zurückgeben, damit wir damit weiterarbeiten können. |
| 28 | +Beispielsweise gibt uns die Methode `head` des `DataFrame` den "Kopf" der Tabelle aus, die er repräsentiert. |
| 29 | +Im Normalfall sind das die Titel der Spalten und die ersten fünf Zeilen, jedoch kann man als Parameter angeben, wie |
| 30 | +viele Zeilen man anzeigen lassen möchte. |
| 31 | +Da die Datei 20 Zeilen hat, lassen wir uns alle 20 anzeigen. |
| 32 | + |
| 33 | +Versuche nun eigenständig, die Platzhalter im Code zu füllen: |
| 34 | + |
| 35 | +- importiere die Bibliothek Pandas und benenne sie zu `pd` |
| 36 | +- lade in der Funktion `load_names` die CSV-Datei, deren Dateiname als Parameter übergeben wird |
| 37 | +- speichere den `DataFrame` in einer Variablen |
| 38 | +- gib diesen mittels `return` zurück |
| 39 | + |
| 40 | +Wenn du alles richtig gemacht hast, solltest du in der Konsole, wenn du das Programm über den grünen Pfeil neben Zeile |
| 41 | +1 ausführst, eine Liste von Namen sehen. |
0 commit comments