Datenanalyse mit Python Wes Deutsche McKinney Übersetzung von Christian Tismer und Kristian Rother O'REILLY Inhalt 1 Einleitung 1 Wovon handelt dieses Buch? 1 Warum Python Essenzielle 2 4 Einrichtung 7 Community und Konferenzen 10 durch dieses Buch 10 Navigation Typografische Konventionen 12 Benutzung von Codebeispielen 13 Danksagungen 13 Einführende Beispiele 15 l.USA.gov-Daten von bit.ly 16 MovieLens IM Data Set 25 US-Babynamen Fazit und der 3 Datenanalyse? Python-Bibliotheken Installation und 2 zur von Weg 1880 bis 2010 vor 31 Ihnen 43 IPython: Eine interaktive Rechen- und Entwicklungsumgebung 45 IPython-Grundlagen 46 Verwenden der Befehlschronik 58 Interaktion mit dem 61 Werkzeuge IPython Tipps zur Betriebssystem Softwareentwicklung 63 HTML Notebook zur 74 produktiven Codeentwicklung Fortgeschrittene Features von mit IPython 75 IPython 78 Danksagung 80 I v 4 Grundlagen von NumPy: Arrays Das ndarray von NumPy: und vektorisierte Universelle Funktionen: Schnelle elementweise Datenverarbeitung Dateiein- und Lineare mit Berechnung 82 Array-Funktionen 97 99 Arrays -ausgäbe bei Arrays 106 Algebra Erzeugen von 107 Zufallszahlen 109 Beispiel: Random Walks 5 Erste Schritte mit Einführung 110 115 pandas in die Datenstrukturen von pandas Essenzielle Funktionalität Behandlung fehlender deskriptiver Statistik Daten 147 152 Weitere Themen in 157 Laden und pandas Speichern von von Daten sowie Dateiformate Daten im Textformat Binäre Datenformate Interagieren mit HTML und Web-APIs 179 180 Verknüpfen von Datensätzen 183 Umformen und Transponieren 196 Transformieren 201 Manipulation Fallstudie: Die von von Daten Strings 213 USDA-Nahmngsmitteldatenbank Plotten und Visualisieren Kurze Einführung Plotten von in Funktionen in Das Ökosystem Aggregation der von 228 pandas 241 aus der Erdbebenkrise auf Haiti Visualisierungstools in Python Daten und Gruppenoperationen GroupBy-Mechanismen Aggregation von Daten Gruppenweise Operationen und Transformationen | Inhalt 220 227 die matplotlib-API Karten zeichnen: Visualisieren der Daten VI 161 Datenaufbereitung: Säubern, Transformieren, Verknüpfen und Umformen 183 Kombinieren und 9 161 177 Interaktion mit Datenbanken 8 141 Hierarchisches Indizieren Lesen und Schreiben 7 116 126 Zusammenfassen und Berechnen 6 81 Array-Objekt ein mehrdimensionales 252 258 261 262 270 275 Pivot-Tabellen und Kreuztabellierung 285 Fallstudie: Die Datenbank des US-Bundeswahlausschusses von 2012 288 10 Zeitreihen 299 Datentypen und Werkzeuge Grundlagen von Zeitreihen für Datum und Zeit 303 Datumsbereiche, Frequenzen Berücksichtigung von Resampling Plotten Zeitreihen Notizen 11 von und Konvertieren von 313 Perioden von 317 Frequenzen 323 330 gleitenden der aus 332 aus Finanzwelt und 338 Ökonomie 341 Datenklempnerei Gruppentransformationen 12 307 Fenstern Anwendungen auf Daten Weitere Verschiebungen Rechengeschwindigkeit und Speichernutzung zu Themen und Zeitzonen Perioden und Arithmetik Funktionen mit 300 und 341 Analyse 353 Anwendungsbeispiele 358 NumPy für Fortgeschrittene 367 Interna von ndarray-Objekten Fortgeschrittene Manipulation 367 von Arrays 369 Broadcasting 377 Fortgeschrittene Nutzung Strukturierte und Mehr zum ufuncs 382 Record-Arrays 385 Thema Sortieren Die Klasse Matrix in Ein- und von Ausgabe 387 NumPy von 392 Arrays für Fortgeschrittene 393 Tipps für höhere Leistung 395 Anhang: Grundlagen der Programmiersprache Python 399 Index 449 Inhalt | VII