Taschenbuch der Statistik herausgegeben von Prof. Dr. Werner Voß 2., verbesserte Auflage Mit 165 Bildern und 126 Tabellen FACHBUCHVERLAG LEI im Carl Hanser Verlag Inhaltsverzeichnis 1 1.1 1.2 1.3 Grundlagen ................................................................... 17 Methoden der Datenbereitstellung........... 1.1.1 Sekundärstatistik 1.1.2 Primärstatistik .. Gmndbegriffe ....................................................................... Skalierung ....................... ............................... 1.3.1 Nicht-metrische 1.3.2 Metrische Skale 1.3.3 Skalentransformation................................................ 23 .............................. .............................. Anwendungsbeispiele............................................................ 33 35 40 27 1.4 1.5 1.6 1.7 1.8 2 2.1 2.2 2.3 2.4 Literaturhinweise... ............................................. Stichprobenverfahren 47 Aufgaben der Stichprobentheorieund -Planung.................... 47 Auswahlverfahren ................................................................. 51 2.2.1 Gesamtheiten............................................................. 51 2.2.2 Einteilung der Auswahlverfahren ............................. 52 2.2.3 Willkürliche Auswahl .. ....................................... 53 2.2.4 Bewußte Auswahlen .... ....................................... 54 56 2.2.5 Zufallsauswahlen ........................................... 2.2.6 Praktische Realisierung von Zufallsauswahlen......... 62 Schätzverfahren..................................................................... 71 2.3.1 Kenngrößen und Stichprobenfunktionen..................71 77 2.3.2 Einfache Zufallsstichproben...................................... 2.3.3 Gebundene Hochrechnungen.................................... 81 2.3.4 Geschichtete Stichproben.......................................... 85 2.3.5 Klumpen- bzw . Flächenstichproben.......................... 95 104 Ergänzungen........................................................................ 2.4.1 Rückfangmethode zur Schätzung von N . 2.4.2 Planung des Stichprobenumfmgs ........... 2.4.3 Auswertungsmöglichkeiten für Daten aus komplexen Stichprobendesigns........................... 107 8 Inhaltsverzeichnis 2.4.4 2.5 Nicht stichprobenbedingteFehler und Verzerrungen ....................................................... Literaturhinweise................................................................. 109 11C 3 Mittelwerte .................................................................. 113 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 Zielsetzung .......................................................................... Ein begleitendes Beispiel .................................................... Arithmetischer Mittelwert ................................................... Harmonischer Mittelwert .................................................... Geometrischer Mittelwert.................................................... Median ................................................................................ Modus (häufigster Wert) ..................................................... Anwendungsbeispiele.......................................................... Problemlösungen mit SPSS ................................................. Literaturhinweise................................................................. 4 Streuungs.. Konzentration.. Schiefeund Wölbungsmaße ............................................... 4.1 4.2 4.3 4.4 4.5 4.6 5 5.1 5.2 Streuungsmaße.................................................................... 4.1.1 Die Spannweite ....................................................... 4.1.2 Der mittlere Quartilsabstand ................................... 4.1.3 Das Streuungsmaß von Gini.................................... 4.1.4 Die mittlere absolute Abweichung.......................... 4.1.5 Varianz und Standardabweichung........................... Konzentrationsmaße............................................................ Schiefe- und Wölbungsmaße............................................... 4.3.1 Die statistischen Momente ...................................... 4.3.2 Maßzahlen der Schiefe............................................ 4.3.3 Maßzahlen der Wölbung ......................................... Anwendungsbeispiel........................................................... Problemlösungenmit SPSS ................................................. Literaturhinweise................................................................. Bivariate Statistik.................................................... Übersicht ............................................................................. Zweidimensionale Häufigkeitsverteilungen........................ 5.2.1 Grundbegriffe.......................................................... 5.2.2 Randverteilungen.................................................... 5.2.3 Bedingte Verteilung ................................................ 5.2.4 Unabhängigkeit von Merkmalen ............................. 113 115 12C 122 125 131 134 131 13t 135 131 14C 141 144 14147 15C 162 162 16' 16: 16t 16C 16; 165 165 17( 17( 17: 172 171 Inhaltsverzeichnis 9 5.7 5.8 5.9 5.10 Metrisch meßbare Merkmale: Regression und Korrelation .............................................................. 176 176 5.3.1 Lineare Regression.................................................. 5.3.2 Nichtlineare Regression .......................................... 183 185 Zusammenhangsmaßefür metrische Daten......................... 5.4.1 Streuungszerlegungund Bestimmtheitsmaß...........185 5.4.2 Korrelationskoeffizientnach Bravais-Pearson........ 187 189 5.4.3 Korrelationsindex.................................................... 190 Ordinal meßbare Merkmale................................................. 5.5.1 Rangkorrelationskoeffizientnach Spearman........... 191 5.5.2 Rangkorrelationskoeffizient(Konkordanzkoeffizient) nach Goodman und Kruskal .............195 5.5.3 Rangkorrelationskoeffizient (Konkordanz196 koeffizient) nach Kendall .................................... Nominal meßbare Merkmale: Assoziationsmaße................ 196 5.6.1 Assoziationsmaße auf Basis der Größe (Chi-Quadrat): Kontingenzkoeffizienten............. 197 199 5.6.2 Maße der prädikativen Assoziation......................... Zusammenfassung............................................................... 202 202 Anwendungsbeispiele.......................................................... Problemlösungen mit SPSS ................................................. 204 Literaturhinweise................................................................. 207 6 Verhältnis- und Indexzahlen.............. 5.3 5.4 5.5 5.6 6.1 6.2 6.3 7 7.1 7.2 Verhältniszahlen.................................................................. 6.1.1 Begriff. Arten und Eigenschaften von Verhältniszahlen.................................................. 6.1.2 Rechnen mit Wachstumsraten................................. 6.1.3 Aggregation, Strukturabhängigkeit. Standardisierung.................................................. Indexzahlen ......................................................................... 6.2.1 Direkte Indexformeln.............................................. 6.2.2 Axiome und Axiomensysteme................................ 6.2.3 Neuere Vorschläge für Indexformeln...................... 6.2.4 Kettenindizes........................................................... Literaturhinweise................................................................. Zeitreihenanalyse.................................................... 209 209 209 213 217 220 221 225 230 239 241 243 Definitionen und Beispiele.................................................. 243 Das traditionelle Zeitreihen-Komponentenmodell..............247 10 Inhaltsverzeichnis 1.5 7.6 7.7 7.8 Saisonbereinigungsverfahren .................................. 7.3.1 Zielsetzung............................ 7.3.2 Saisonbereinigungim additiv modell bei konstanter und variabler Saisonfigur . 249 250 7.3.3 In der Praxis eingesetzte Verfahren ........................ 7.3.4 Einige praktische e der Saisonbereinigung258 Prognosen ......................... ..................................... 259 7.4.1 Klassifikation von everfahren .................... 259 260 7.4.2 Linearer Trend ........................................................ 7.4.3 Exponential smoothing ........................................... 262 Stochastische Zeitreihenmodelle..... Anwendungsbeispiel........................................................... 273 274 Problemlösungenmit SPSS ................................................. 276 Literaturhinweise................................................................. 8 Kombinatorik ............................................................ 7.3 7.4 8.1 8.2 8.3 8.4 8.5 8.6 9 9.1 9.2 9.3 Allgemeines................................................................. Anordnung von Elementen (Permutation)................... Auswahl von Elementen (Variationen und Kombinationen) ...................................................... 8.3.1 Variation mit Wiede 8.3.2 Variation ohne Wiede ............................. 8.3.3 Kombination mit Wie 8.3.4 Kombination ohne Wiederholung........................... Anwendungsbeispiele.......................................................... Problemlösungen mit SPSS ................................................. ...................................... Wahrscheinlichkeitsrechnung............. 277 280 282 282 283 283 284 285 Grundbegriffe...................................................................... 285 Wahrscheinlichkeiten.......................................................... 292 292 9.2.1 Zur Geschichte........................................................ 9.2.2 Wahrscheinlichkeitsbegriff ............................. Elementare Wahrscheinlichkeitsmodelle ............................ 295 9.3.1 Gleichmöglichkeitsmodell(Laplace-Modell)oder klassisches Wahrscheinlichkeitsrnodell...............295 9.3.2 Das Bernoulli-Modell ............................................. 296 9.3.3 Statistisches Wahrscheinlichkeitsrnodellund von-Mises-Modell................................................ 296 9.3.4 Weitere elementare Wahrscheinlichkeitsmodelle ... 298 Inhaltsverzeichnis 11 9.5 9.6 Bedingte Wahrscheinlichkeit.Multiplikationssatz. Unabhängigkeit von Ereignissen............................. 299 9.4.1 Bedingte Wahrscheinlichkeit.................................. 299 301 9.4.2 Multiplikationssatz.................................................. 301 9.4.3 Stochastische Unabhängigkeit ................................ Einige Sätze der Wahrscheinlichkeitsrechnung..................304 307 Literaturhinweise................................................................. 10 Wahrscheinlichkeitsverteilungen ..................309 9.4 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 Grundkonzepte .................................................................... 309 10.1.1 Zufallsvariablen ...................................................... 309 10.1.2 Wahrscheinlichkeitsfunktion und Dichtefunktion...3 10 313 10.1.3 Verteilungsfunktion................................................ 10.1.4 Parameter für Wahrscheinlichkeitsverteilungen..... 314 10.1.5 Funktionen von Zufallsvariablen ............................ 317 Gleichverteilung.................................................................. 318 Binomialverteilung................................................ Multinomiale Verteilung .............. Geometrische Verteilung................................. HypergeometrischeVerteilung............................................ 331 Poisson-Verteilung................................................ ..335 338 Normalverteilung ................................................................ Exponentialverteilung......................................................... 342 Chi-Quadrat-Verteilung...................................................... 343 t-Verteilung ................................................................ F-Verteilung ........................................................................ 346 348 Anwendungsbeispiele.......................................................... 348 Problemlösungen mit SPSS................................................. Literaturhinweise................................................................. 349 Stochastische Prozesse.......................................... 351 Grundbegriffe...................................................................... 351 Gesetze der großen Zahlen .................................................. 352 352 11.2.1 Satz von Tschebyscheff .......................................... 11.2.2 Schwaches Gesetz der großen Zahlen in der Form von Tschebyscheff............................................... 353 11.2.3 Schwaches Gesetz der großen Zahlen in der Form von Bemoulli ....................................................... 353 11.2.4 Schwaches Gesetz der großen Zahlen nach 354 Chintschin............................................................ 11.2.5 Starkes Gesetz der großen Zahlen von Kolmogorov355 12 11.3 11.4 11.5 11.6 11.7 12 12.1 12.2 12.3 12.4 12.5 12.6 13 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9 13.10 13.11 Inhaltsverzeichnis 11.2.6 Starkes Gesetz der großen Zahlen von Bore1 und Cantelli................................................................. 355 Zentrale Grenzwertsätze...................................................... 356 11.3.1 Zentraler Grenzwertsatz nach Lindeberg und Levy 356 11.3.2 Zentraler Grenzwertsatz von deMoivre und Laplace ................................................................ 358 11.3.3 Zentraler Grenzwertsatz nach Ljapunoff .................359 Allgemeine Beschreibung stochastischer Prozesse .............361 11.4.1 Grundlagen.............................................................. 361 364 11.4.2 Kennzahlen ............................................................. 367 Klassen spezieller stochastischer Prozesse.......................... Stationäre Prozesse.............................................................. 374 Literaturhinweise................................................................. 381 .................. Statistische Schätztheorie 383 Einleitung ............................................................................ 383 Bayesianische Schätztheorie ............................................... 384 12.2.1 Bayesianische Punkt- und Bereichsschätzer...........385 386 12.2.2 Schätzung einer Wahrscheinlichkeit....................... Frequentistische Schätztheorie............................................ 389 12.3.1 Maximum-Likelihood-Methode.............................. 389 389 12.3.2 Gütekriterien ........................................................... 12.3.3 Weitere Konstruktionsprinzipienfür Punktschätzer401 12.3.4 Bereichsschatzer ..................................................... 405 Anwendungsbeispiele.......................................................... 418 Softwarelösungen................................................................ 419 419 Literaturhinweise................................................................. Parametrische Tests bei großen Stichproben ................................................................. Grundkonzepte.................................................................... 421 421 422 Test des arithmetischen Mittels ........................................... Test für den Anteilswert...................................................... 429 Test für die Standardabweichung........................................ 430 431 Test für die Differenz zweier Mittelwerte ........................... 433 Test für die Differenz zweier Anteilswerte ......................... Test für die Differenz zweier Standardabweichungen.........434 Die Güte eines Tests............................................................ 435 436 Varianzanalyse .................................................................... Ergänzungen........................................................................ 439 Anwendungsbeispiele.......................... Inhaltsverzeichnis 13 13.12 13.13 Problemlösungen mit SPSS ................................................. Literaturhinweise ................................................................. 14 Nichtparametrische Tests................................... 445 Chi-Quadrat-Unabhängigkeitstest................. ............446 14.1 14.2 14.3 14.4 14.5 14.6 14.7 14.8 14.9 14.10 14.11 14.12 14.13 14.14 15 15.1 441 444 Chi-Quadrat-Anpassungstest ..................................... 451 ..................................... 457 Chi-Quadrat-Homogenitätste Test auf Zufälligkeit ............................................................ 460 463 Binomialtest ........................................................................ ........................................... 466 Fisher-Test.......................... Vorzeichentest für zwei verbundene Stichproben und der Median-Test ............................................................ 470 14.7.1 Vorzeichentest für zwei verbundene Stichproben... 470 14.7.2 Mediantest ............................................................... 473 Wilcoxon-Rangtest für zwei verbundene Stichproben ........476 Wilcoxon-Rangsummentest für k=2 unabhängige Stichproben (Man-Whitney-U-Test) ....................... 480 Kruskal-Wallis-Test ............................................................ 484 Kolmogorov-Smirnov-Test ................................................. 488 McNemar-Test .................................................................... 493 Anwendungsbeispiele und Problemlösungen mit SPSS ...... 496 Literaturhinweise ....................................................... Multiple Regression und Korrelation.........511 Grundkonzepte ........ .............. .................... 511 15.1.1 Zentrale Beg ........................................... 15.1.2 Konzepte ................................................................. 511 512 ........................................ 518 15.3 15.4 15.5 15.6 15.7 Anwendungsbeispiele ............................. Problemlösungen mit SPSS ................................................. Literaturhinweise ................................................................. 524 526 528 16 Faktorenanalyse ....................................................... 531 15.2 15.2.1 Formeln 16.1 16.2 Grundidee ............................................................................ Faktorenextraktion .............................................................. 531 533 14 Inhaltsverzeichnis 16.3 16.4 16.5 16.6 16.7 Kommunalitäten und Faktorenzahl ..................................... 542 Das Rotationsproblem......................................................... 548 553 Bestimmung der Faktorwerte .............................................. Anwendungsbeispielund Problemlösung mit SPSS ...........559 Literaturhinweise................................................................. 563 17 Clusteranalyse........................................................... 565 17.1 17.1.2 Zentrale Begriffe ..................................................... 17.1.3 Voraussetzungen..................................................... Konzepte .............................. 17.2.1 Standardisierung ...... 17.2.2 Ahnlichkeitsniaße ................................................... 17.2.3 Distanzmaße............................................................ 17.2.4 Gemischtes Skalenniveau ....................................... Verfahren der Klassenbi 17.3.1 Hierarchisch-ag 17.3.2 Partitionierende ...................................... 17.3.3 Algorithmen für die hierarchisch-agglomerative 565 566 17.4 17.5 17.6 17.7 17.8 17.9 Klassendiagnose.................................................................. Klassifikation auf stochastischer Basis ............................... Hinweise auf andere Verfahren... Anwendungsbeispiel........................... Problemlösung mit SPSS..................................................... Literaturhinweise................................................................. 575 576 18 Diskriminanzanalyse............................................. 17.2 17.3 18.1 18.2 18.3 18.4 18.5 18.6 18.7 18.8 18.9 Begriff der Klassifikation.................................................... Geometrie der linearen Diskriminanzanalyse...................... Allgemeine Kriterien zur Wahl von Klassifikationsregeln............................................... Lineare Diskriminanzanalyse.............................................. Klassifikationsbeurteilung ................................................... Besonderheitenbei der Anwendung von Diskriminanzanalysen............................................. Anwendungsbeispiel........................................................... Problemlösung mit SPSS..................................................... Literaturhinweise.............. ............................................ 568 570 570 572 579 581 583 583 585 588 591 595 599 500 601 607 Inhaltsverzeichnis 19 19.1 19.2 19.3 19.4 19.5 19.6 19.7 19.8 20 20.1 20.2 20.3 20.4 20.5 20.6 20.7 20.8 20.9 20.10 Logit- und Probit-Modelle................................. ..................................................................... 15 609 609 Modellierung ...................................................... 19.2.1 Das lineare Wahrscheinlichkeitsmodell. 19.2.2 Logit- und Probit-Modelle ..................... Schätzung der Parameter ..................................................... 617 618 19.3.1 Die Maximum-Likelihood-Methode ....................... 19.3.2 Berechnung der Schätzwerte ...... 19.3.3 Eigenschaften der ML-Schätzer. Modelldiagnostik und Hypothesentests. ..............................623 19.4.1 Gütemaße ................................................................ 623 19.4.2 Gruppierte Daten: ................. 628 19.4.3 Tests linearer Hypothesen .... Prädiktion, marginale Aus ,,Odds-ratio"............................................................. 63 1 Zwei Beispiele ..................................................................... 635 19.6.1 Ein Probit-Modell ................................ 19.6.2 Logit-Modell und SPSS-Anwendung ..................... 638 Ergänzungen und Erweiterungen ........................................ 641 Literaturhinweise ................................................................. 643 Unscharfe Daten....................................................... Einleitung ............................................................ Unscharfe Zahlen ........................... Unscharfe Vektoren. .......................... 645 649 Funktionen unscharfer Größen ............................ Schätzungen bei unscharfen Daten.. ..... 20.11 20.12 Unscharfe Daten und statistische Tests ............................... 663 Bayes'sche Analyse................................................... 20.10.1 Das Bayes'sche Theorem für unscharfe Daten .......665 20.10.2Unscharfe Bayes'sche Vertrauensbereiche .............668 670 20.10.3 Unscharfe Prognoseverteilungen ........................... ............................................................... 671 Ausblick .... .671 Literaturhinweise .......................................... 21 Data Mining ................................................................ 21.1 21.2 673 Was ist Data Mining? .......................................................... 673 Allgemeine methodische Grundlagen .................................675 16 Inhaltsverzeichnis 21.3 21.4 21.5 21.6 Data Mining mittels Assoziationsregeln ............................. 678 Klassifikation ...................................................................... 683 690 Data Mining Software ......................................................... Literaturhinweise................................................................ .69 1 22 Graphentheoretische Modelle in der Statistik 22.1. 22.2 22.3 22.4 22.5 22.6 22.7 ....................................................... 693 .......................................................... 693 693 hkeitstheorie..................................... 22.1.2 Graphentheorie........................................................ 694 Einleitung .. .....695 Konstruktion von Graphen .................................................. 698 22.3.1 Ableitung von Graphen aus der gemei W ahrscheinlichkeitsverteilung........ 22.3.2 Ableitung von Graphen aus Unabhängigkeitsannahmen....... 22.3.3 Ableitung von Graphen aus Gleichungssystemen...702 22.3.4 Die Markov ung .......................................... 704 d-Separation ........... 22.4.1 Separierung 22.4.2 Unabhängigkeitsbedingunge 22.4.3 Perfekte Abbildungen ............................................. 710 Kausale Modelle und kausale Effekte ............. 22.5.1 Kausale Modelle ....... ...................... 22.5.2 Kausale Effekte ......... ...................... Software-unterstützteGenerierung von Graphen ................7 16 717 22.6.1 Ablauf des Verfahrens ............................................ ............721 Literaturhinweise............................................ ................................................................... SPSS-Datenbestände.............................................. Register 723 741