Ludwig Fahrmeir • Rita Künstler Iris Pigeot • Gerhard Tutz Statistik Der Weg zur Datenanalyse Zweite, verbesserte Auflage Mit 165 Abbildungen und 34 Tabellen Springer Inhaltsverzeichnis Vorwort v 1 Einführung 1.1 Wo braucht man Statistik? 1.2 Was macht man mit Statistik? 1.3 Was steht am Anfang? 1.3.1 Statistische Einheiten, Merkmale und Gesamtheiten 1.3.2 Merkmalstypen 1.4 Wie gewinnt man Daten? 1.4.1 Elemente der Versuchsplanung 1.4.2 Datengewinnung und Erhebungsarten Einfache Zufallsstichproben Geschichtete Zufallsstichproben Klumpenstichprobe Mehrstufige Auswahlverfahren Bewußte Auswahlverfahren 1.5 Zusammenfassung und Bemerkungen 1.6 Aufgaben 1 1 11 13 13 15 19 20 22 24 24 25 25 26 27 28 2 Univanate Deskription und Exploration von Daten 2.1 Verteilungen und ihre Darstellungen 2.1.1 Häufigkeiten 2.1.2 Graphische Darstellungen Stab- und Kreisdiagramme Stamm-Blatt-Diagramme Histogramme Unimodale und multimodale Verteilungen Symmetrie und Schiefe 2.1.3 Kumulierte Häufigkeitsverteilung und empirische Verteilungsfunktion . 29 29 30 32 32 35 38 45 46 46 viii Inhaltsverzeichnis 2.2 Beschreibung von Verteilungen 2.2.1 Lagemaße Arithmetisches Mittel Median Modus Berechnung der Lagemaße bei gruppierten Daten Lageregeln Das geometrische Mittel Das harmonische Mittel Das getrimmte Mittel 2.2.2 Quantile und Box-Plot 2.2.3 Standardabweichung, Varianz und Variationskoeffizient 2.2.4 Maßzahlen für Schiefe und Wölbung 2.3 Konzentrationsmaße 2.3.1 Relative Konzentration: Lorenzkurve und Gini-Koeffizient Lorenzkurve aus den geordneten Daten Lorenzkurve bei gruppierten Daten Gini-Koeffizient 2.3.2 Alternative Konzentrationsmaße Konzentrationsrate CRg Herfindahl-Index 2.4 Dichtekurven und Normalverteilung 2.4.1 Dichtekurven 2.4.2 Normalverteilungen *Normal-Quantil-Plots *2.4.3 Approximation von Dichtekurven 2.5 Zusammenfassung und Bemerkungen 2.6 Aufgaben 3 Multivariate Deskription und Exploration 3.1 Diskrete und gruppierte Merkmale 3.1.1 Zweidimensionale Daten: Die Kontingenztabelle 3.1.2 Bedingte Häufigkeiten 3.2 Zusammenhangsanalyse in Kontingenztabellen 3.2.1 Chancen und relative Chancen 3.2.2 Kontingenz-und x2-Koeffizient 3.3 Graphische Darstellungen quantitativer Merkmale 3.3.1 Streudiagramm 3.3.2 Zweidimensionale Histogramme und Dichten 3.3.3 Mehrdimensionale Darstellungen 51 51 51 53 55 56 58 59 61 62 62 67 72 74 75 75 78 80 82 82 83 84 84 89 93 98 103 104 109 109 109 115 119 119 122 127 128 130 132 IX 3.4 3.5 3.6 3.7 3.8 Zusammenhangsmaße bei metrischen Merkmalen 3.4.1 Empirischer Korrelationskoeffizient nach Bravais-Pearson 3.4.2 Spearmans Korrelationskoeffizient 3.4.3 Invarianzeigenschaften Korrelation und Kausalität Regression 3.6.1 Das lineare Regressionsmodell 3.6.2 Die Berechnung der Ausgleichsgeraden 3.6.3 Bestimmtheitsmaß und Residualanalyse *3.6.4 Nichtlineare Regression Zusammenfassung und Bemerkungen Aufgaben 135 135 141 146 147 152 152 153 158 165 167 169 Wahrscheinlichkeitsrechnung 171 4.1 Definition und Begriff der Wahrscheinlichkeit 172 4.1.1 Mengen und Mengenoperationen 173 4.1.2 Zufallsereignisse 177 4.1.3 Wahrscheinlichkeiten 179 4.2 Zur empirischen Interpretation von Wahrscheinlichkeiten 185 4.2.1 Die Laplace-Wahrscheinlichkeit 186 4.2.2 Objektive Wahrscheinlichkeiten als Grenzwert relativer Häufigkeiten . 189 4.2.3 Subjektive Wahrscheinlichkeiten 191 4.3 Zufallsstichproben und Kombinatorik 192 4.3.1 Modell mit Zurücklegen 193 4.3.2 Modell ohne Zurücklegen 194 4.3.3 Permutationen 195 4.3.4 Modell ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge 196 4.4 Bedingte Wahrscheinlichkeiten 199 4.5 Unabhängigkeit von zwei Ereignissen 203 4.6 Totale Wahrscheinlichkeit 206 4.7 Der Satz von Bayes 209 4.8 Unendliche Grundgesamtheiten 213 4.9 Zusammenfassung und Bemerkungen 215 4.10 Aufgaben 217 Diskrete Zufallsvariablen 5.1 Zufallsvariablen 5.2 Verteilungen und Parameter von diskreten Zufallsvariablen 5.2.1 Definition und Verteilung 5.2.2 Unabhängigkeit von diskreten Zufallsvariablen 221 221 225 225 236 x Inhaltsverzeichnis 5.2.3 5.3 5.4 5.5 6 7 8 Lageparameter, Quantile und Streuungsparameter einer diskreten Verteilung Spezielle diskrete Verteilungsmodelle 5.3.1 Die Binomialverteilung 5.3.2 Die hypergeometrische Verteilung 5.3.3 Die Poisson- Verteilung Zusammenfassung und Bemerkungen Aufgaben Stetige Zufallsvariablen 6.1 Definition und Verteilung 6.2 Lageparameter, Quantile und Varianz von stetigen Zufallsvariablen 6.3 Spezielle stetige Verteilungsmodelle 6.3.1 Die Normalverteilung 6.3.2 Die logarithmische Normalverteilung 6.3.3 Chi-Quadrat-, Student- und Fisher-Verteilung 6.4 Zusammenfassung und Bemerkungen 6.5 Aufgaben Mehr über Zufallsvariablen und Verteilungen 7.1 Gesetz der großen Zahlen und Grenzwertsätze 7.1.1 Das Gesetz der großen Zahlen und der Hauptsatz der Statistik 7.1.2 Der zentrale Grenzwertsatz 7.2 Approximation von Verteilungen *7.3 Zufallszahlen und Simulation *7.4 Einige Ergänzungen 7.4.1 Zufallsvariablen als Abbildungen 7.4.2 Verteilungsfunktion und ihre Eigenschaften 7.4.3 Ungleichung von Tschebyscheff 7.4.4 Maßzahlen für Schiefe und Wölbung 7.5 Zusammenfassung und Bemerkungen 7.6 Aufgaben Mehrdimensionale Zufallsvariablen 8.1 Begriff mehrdimensionaler Zufallsvariablen 8.2 Zweidimensionale diskrete Zufallsvariablen 8.3 Zweidimensionale stetige Zufallsvariablen 8.4 Unabhängigkeit von Zufallsvariablen 8.5 Kovarianz und Korrelation 8.6 Die zweidimensionale Normalverteilung 239 250 250 256 258 262 264 267 267 279 289 289 297 298 302 304 307 307 309 312 315 318 321 321 323 325 327 328 329 331 331 334 339 342 345 353 Inhaltsverzeichnis 8.7 8.8 Zusammenfassung und Bemerkungen Aufgaben xi 357 357 9 Parameterschätzung 9.1 Punktschätzung 9.2 Eigenschaften von Schätzstatistiken 9.2.1 Erwartungstreue 9.2.2 Erwartete mittlere quadratische Abweichung und Konsistenz 9.2.3 Wirksamste Schätzstatistiken 9.3 Konstruktion von Schätzfunktionen 9.3.1 Maximum Likelihood-Schätzung 9.3.2 Kleinste-Quadrate-Schätzung 9.4 Intervallschätzung 9.4.1 Konfidenzintervalle für Erwartungswert und Varianz 9.4.2 Konfidenzintervalle für den Anteilswert 9.5 Zusammenfassung und Bemerkungen 9.6 Aufgaben 359 360 362 362 366 369 371 372 375 376 378 382 383 384 10 Testen von Hypothesen 10.1 Der Binomial-und der Gauß-Test 10.1.1 Der exakte Binomialtest 10.1.2 Der approximative Binomialtest 10.1.3 Der Gauß-Test 10.2 Prinzipien des Testens Fehlentscheidungen Statistische Tests und Konfidenzintervalle Überschreitungswahrscheinlichkeit Gütefunktion *Multiple Testprobleme 10.3 Zusammenfassung und Bemerkungen 10.4 Aufgaben 387 387 391 394 397 401 404 407 408 409 416 417 419 11 Spezielle Testprobleme 11.1 Ein-Stichproben-Fall 11.1.1 Tests zu Lagealternativen 11.1.2 Anpassungstests 11.2 Vergleiche aus unabhängigen Stichproben 11.2.1 Tests zu Lagealternativen 11.2.2 x2-Homogenitätstest 11.3 Vergleiche aus verbundenen Stichproben 421 422 423 432 441 442 448 450 xii Inhaltsverzeichnis 11.4 Zusammenhangsanalyse 11.4.1 x2-Unabhängigkeitstest 11.4.2 Korrelation bei metrischen Merkmalen 11.5 Zusammenfassung und Bemerkungen 11.6 Aufgaben 452 452 454 456 457 12 Regressionsanalyse 12.1 Lineare Einfachregression 12.1.1 Das Modell der linearen Einfachregression 12.1.2 Schätzen, Testen und Prognose 12.1.3 Residualanalyse 12.2 Multiple lineare Regression 12.2.1 Das multiple lineare Regressionsmodell 12.2.2 Schätzen, Testen und Prognose *12.2.3 Multiple lineare Regression in Matrixnotation *12.3 Nichtlineare und nichtparametrische Regression 12.4 Zusammenfassung und Bemerkungen 12.5 Aufgaben 459 460 460 463 473 476 478 479 488 490 494 495 13 Varianzanalyse 13.1 Einfaktorielle Varianzanalyse 13.2 Zweifaktorielle Varianzanalyse mit festen Effekten 13.3 Zusammenfassung und Bemerkungen 13.4 Aufgaben 497 498 507 521 522 14 Zeitreihen 14.1 Indizes 14.2 Komponentenmodelle 14.3 Globale Regressionsansätze 14.3.1 Trendbestimmung 14.3.2 Bestimmung der Saisonkomponente 14.4 Lokale Ansätze 14.4.1 Trendbestimmung Gleitende Durchschnitte Lokale Regression *Spline-Glättung 14.4.2 Bestimmung der Saisonkomponente Gleitende Durchschnitte und lokale Regression *Spline-Glättung 14.5 Zusammenfassung und Bemerkungen 525 528 532 534 534 536 537 538 538 539 542 544 544 546 547 • Inhaltsverzeichnis 14.6 Aufgaben xiii 547 Tabellen A Standardnormalverteilung B Binomialverteilung C x2-Verteilung D Students t-Verteilung E F-Verteilung . . . F Wilcoxon-Vorzeichen-Rang-Test G Wilcoxon-Rangsummen-Test 551 551 552 567 568 569 578 578 Literatur 581 Sachverzeichnis 585