Statistik I Prof. Dr. F. Heiss Sommersemester 2012 Gliederung 1 Einführung 1.1 Wozu Statistik? . . . . . . . . . . . . . . 1.2 Was ist Statistik? . . . . . . . . . . . . . 1.3 Wie funktioniert Statistik? . . . . . . . . 1.4 Statistik und verwandte Fächer in Ihrem 1.5 Anwendungsbezug und Software . . . . . 1.6 Literatur . . . . . . . . . . . . . . . . . . I . . . . . . . . . . . . . . . . . . Studium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beschreibende Statistik 2 3 5 6 7 9 11 14 2 Statistische Merkmale und Variablen 2.1 Statistische Einheiten . . . . . . . . . . . . . . . . . 2.2 Statistische Merkmale und Variablen . . . . . . . . . 2.3 Urlisten und Beobachtungsreihen . . . . . . . . . . . 2.4 Statistische Verteilung von diskreten Variablen . . . 2.4.1 Häufigkeitsverteilung . . . . . . . . . . . . . . 2.4.2 Graphische Darstellungen . . . . . . . . . . . 2.4.3 Häufigkeitsfunktion . . . . . . . . . . . . . . . 2.4.4 Verteilungsfunktion . . . . . . . . . . . . . . . 2.5 Statistische Verteilung von (quasi-)stetigen Variablen 2.5.1 Klassenbildung und Klassenhäufigkeit . . . . 2.5.2 Häufigkeitsdichte h̄(x) und Histogramm . . . 2.5.3 Wahl der Klassen . . . . . . . . . . . . . . . . 3 Maßzahlen zur Beschreibung statistischer Verteilungen 3.1 Was sind Maßzahlen? . . . . . . . . . . . . . . . . . . 3.2 Lagemaße . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Arithmetisches Mittel . . . . . . . . . . . . . 3.2.2 Median . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 16 20 24 28 28 30 33 35 38 40 43 47 . . . . 49 51 52 53 64 3.3 3.4 3.5 3.2.3 Modus . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.4 Geometrisches Mittel . . . . . . . . . . . . . . . . . . 3.2.5 Harmonisches Mittel . . . . . . . . . . . . . . . . . . 3.2.6 Beziehungen zwischen unterschiedlichen Lagemaßen . Steuungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Spannweite . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Mittlere absolute Abweichung . . . . . . . . . . . . . 3.3.3 Varianz und Standardabweichung . . . . . . . . . . . 3.3.4 Variationskoeffizient . . . . . . . . . . . . . . . . . . Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Spezielle Quantile . . . . . . . . . . . . . . . . . . . . 3.4.3 Mittlerer Quartilsabstand . . . . . . . . . . . . . . . Konzentrationsmaße . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Ziel . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.2 Lorenz-Kurve . . . . . . . . . . . . . . . . . . . . . . 3.5.3 Gini-Koeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 71 73 75 76 77 78 78 88 90 90 95 96 99 99 101 107 4 Zweidimensionale Verteilungen, lineare Regressionsrechnung 4.1 Streudiagramm und gemeinsame Verteilung . . . . . . . . 4.2 Randverteilungen . . . . . . . . . . . . . . . . . . . . . . . 4.3 Bedingte Verteilungen . . . . . . . . . . . . . . . . . . . . 4.4 Statistische Unabhängigkeit, Kontingenzkoeffizient . . . . 4.5 Kovarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Korrelationskoeffizient . . . . . . . . . . . . . . . . . . . . 4.7 Rangkorrelation nach Spearman . . . . . . . . . . . . . . . 4.8 Summen zweier Merkmale . . . . . . . . . . . . . . . . . . 4.9 Lineare Regressionsrechnung . . . . . . . . . . . . . . . . . 4.10 Interpretation von linearen Regressionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 115 124 132 138 144 149 156 159 163 183 5 Beschreibung von Zeitreihen 5.1 Zeitreihen . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Bestimmung der glatten Komponente . . . . . . . . . 5.2.1 Anpassung einer linearen Trendfunktion . . . 5.2.2 Höhere Polynome für die glatte Komponente 5.2.3 Gleitende Durchschnitte . . . . . . . . . . . . 5.2.4 Exponentielles Glätten . . . . . . . . . . . . . 5.2.5 Exponentielle Glättung nach Holt-Winters . . 5.3 Saisonkomponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 186 192 193 197 199 208 211 214 . . . . . . . . . . . . . . . . . . . . . . . . 6 Indexzahlen 219 6.1 Messzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 6.2 Preisindizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 6.2.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 2 6.3 6.4 II 6.2.2 Preisindex nach Laspeyres und Paasche . . . . . . . 6.2.3 Alternative Indizes und Weiterentwicklungen . . . . 6.2.4 Preisindizes des Statistischen Bundesamtes . . . . . 6.2.5 Inflationsrate und Deflationierung nominaler Größen Mengenindizes . . . . . . . . . . . . . . . . . . . . . . . . . Wertindizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wahrscheinlichkeitsrechnung 229 231 233 236 240 242 244 7 Elementare Kombinatorik 7.1 Fakultäten und Binomialkoeffizienten . . . . . . . . . . . . . . 7.2 Fundamentalprinzip der Kombinatorik . . . . . . . . . . . . . 7.3 Permutationen . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Alle Elemente unterscheidbar . . . . . . . . . . . . . . 7.3.2 Nicht alle Elemente unterscheidbar . . . . . . . . . . . 7.4 Kombinationen . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 Kombinationen ohne Berücksichtigung der Anordnung 7.4.2 Kombinationen mit Berücksichtung der Anordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 248 255 257 257 261 264 265 268 8 Grundlagen der Wahrscheinlichkeitstheorie 8.1 Zufallsexperimente . . . . . . . . . . . . . . . . 8.2 Ereignisse, Ereignisraum, Ereignismenge . . . . 8.3 Wahrscheinlichkeit und Wahrscheinlichkeitsmaß 8.4 Regeln der Wahrscheinlichkeitsrechnung . . . . 8.5 Typen von Wahrscheinlichkeitsräumen . . . . . 8.6 Bedingte Wahrscheinlichkeiten . . . . . . . . . 8.7 Stochastisch unabhängige Ereignisse . . . . . . 8.8 Totale Wahrscheinlichkeit . . . . . . . . . . . . 8.9 Das Bayes-Theorem . . . . . . . . . . . . . . . . . . . P. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 272 273 279 286 291 299 304 307 310 9 Zufallsvariablen 9.1 Definition Zufallsvariable . . . . . . . . . . 9.2 Beispiele . . . . . . . . . . . . . . . . . . . 9.3 Zufallsstruktur . . . . . . . . . . . . . . . 9.4 Typen von Zufallsvariablen . . . . . . . . 9.5 Verteilungsfunktion einer Zufallsvariablen 9.6 Wahrscheinlichkeitsmasse und -dichte . . . 9.6.1 Diskrete Zufallsvariablen . . . . . . 9.6.2 Stetige Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 313 315 317 318 320 330 330 333 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Maßzahlen für die Verteilung von Zufallsvariablen 341 10.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 10.2 Erwartungswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343 3 10.3 10.4 10.5 10.6 10.7 10.8 Varianz . . . . . . . . . . . . . . . . . . . Standardisierung . . . . . . . . . . . . . . Momente von Zufallsvariablen . . . . . . . Wölbung . . . . . . . . . . . . . . . . . . . Median und Quantile . . . . . . . . . . . . Modus einer Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Mehrdimensionale Zufallsvariablen 11.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Gemeinsame Verteilung diskreter Zufallsvariablen . . 11.3 Randverteilungen diskreter Zufallsvariablen . . . . . 11.4 Gemeinsame Dichtefunktion stetiger Zufallsvariablen 11.5 Randdichten stetiger Zufallsvariablen . . . . . . . . . 11.6 Gemeinsame Verteilungsfunktion . . . . . . . . . . . 11.7 Bedingte Verteilungen . . . . . . . . . . . . . . . . . 11.8 Stochastische Unabhängigkeit . . . . . . . . . . . . . 11.9 Erwartungswerte von Funktionen von X und Y . . . 11.10Kovarianz und Korrelation . . . . . . . . . . . . . . . 11.11Summen von Zufallsvariablen . . . . . . . . . . . . . 11.12Bedingte Erwartungswerte . . . . . . . . . . . . . . . 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349 355 357 361 363 367 . . . . . . . . . . . . 368 369 370 372 377 381 382 384 386 388 390 394 396