Taschenbuch der Statistik

Werbung
Taschenbuch
der Statistik
herausgegeben von
Prof. Dr. Werner Voß
2., verbesserte Auflage
Mit 165 Bildern und 126 Tabellen
FACHBUCHVERLAG LEI
im Carl Hanser Verlag
Inhaltsverzeichnis
1
1.1
1.2
1.3
Grundlagen ...................................................................
17
Methoden der Datenbereitstellung...........
1.1.1 Sekundärstatistik
1.1.2 Primärstatistik ..
Gmndbegriffe .......................................................................
Skalierung .......................
...............................
1.3.1 Nicht-metrische
1.3.2 Metrische Skale
1.3.3 Skalentransformation................................................
23
..............................
..............................
Anwendungsbeispiele............................................................
33
35
40
27
1.4
1.5
1.6
1.7
1.8
2
2.1
2.2
2.3
2.4
Literaturhinweise...
.............................................
Stichprobenverfahren
47
Aufgaben der Stichprobentheorieund -Planung....................
47
Auswahlverfahren ................................................................. 51
2.2.1 Gesamtheiten............................................................. 51
2.2.2 Einteilung der Auswahlverfahren .............................
52
2.2.3 Willkürliche Auswahl .. ....................................... 53
2.2.4 Bewußte Auswahlen .... ....................................... 54
56
2.2.5 Zufallsauswahlen ...........................................
2.2.6 Praktische Realisierung von Zufallsauswahlen......... 62
Schätzverfahren.....................................................................
71
2.3.1 Kenngrößen und Stichprobenfunktionen..................71
77
2.3.2 Einfache Zufallsstichproben......................................
2.3.3 Gebundene Hochrechnungen.................................... 81
2.3.4 Geschichtete Stichproben..........................................
85
2.3.5 Klumpen- bzw . Flächenstichproben..........................
95
104
Ergänzungen........................................................................
2.4.1 Rückfangmethode zur Schätzung von N .
2.4.2 Planung des Stichprobenumfmgs ...........
2.4.3 Auswertungsmöglichkeiten für Daten aus
komplexen Stichprobendesigns...........................
107
8
Inhaltsverzeichnis
2.4.4
2.5
Nicht stichprobenbedingteFehler und
Verzerrungen .......................................................
Literaturhinweise.................................................................
109
11C
3
Mittelwerte ..................................................................
113
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
Zielsetzung ..........................................................................
Ein begleitendes Beispiel ....................................................
Arithmetischer Mittelwert ...................................................
Harmonischer Mittelwert ....................................................
Geometrischer Mittelwert....................................................
Median ................................................................................
Modus (häufigster Wert) .....................................................
Anwendungsbeispiele..........................................................
Problemlösungen mit SPSS .................................................
Literaturhinweise.................................................................
4
Streuungs.. Konzentration.. Schiefeund Wölbungsmaße ...............................................
4.1
4.2
4.3
4.4
4.5
4.6
5
5.1
5.2
Streuungsmaße....................................................................
4.1.1 Die Spannweite .......................................................
4.1.2 Der mittlere Quartilsabstand ...................................
4.1.3 Das Streuungsmaß von Gini....................................
4.1.4 Die mittlere absolute Abweichung..........................
4.1.5 Varianz und Standardabweichung...........................
Konzentrationsmaße............................................................
Schiefe- und Wölbungsmaße...............................................
4.3.1 Die statistischen Momente ......................................
4.3.2 Maßzahlen der Schiefe............................................
4.3.3 Maßzahlen der Wölbung .........................................
Anwendungsbeispiel...........................................................
Problemlösungenmit SPSS .................................................
Literaturhinweise.................................................................
Bivariate Statistik....................................................
Übersicht .............................................................................
Zweidimensionale Häufigkeitsverteilungen........................
5.2.1 Grundbegriffe..........................................................
5.2.2 Randverteilungen....................................................
5.2.3 Bedingte Verteilung ................................................
5.2.4 Unabhängigkeit von Merkmalen .............................
113
115
12C
122
125
131
134
131
13t
135
131
14C
141
144
14147
15C
162
162
16'
16:
16t
16C
16;
165
165
17(
17(
17:
172
171
Inhaltsverzeichnis
9
5.7
5.8
5.9
5.10
Metrisch meßbare Merkmale: Regression und
Korrelation .............................................................. 176
176
5.3.1 Lineare Regression..................................................
5.3.2 Nichtlineare Regression ..........................................
183
185
Zusammenhangsmaßefür metrische Daten.........................
5.4.1 Streuungszerlegungund Bestimmtheitsmaß...........185
5.4.2 Korrelationskoeffizientnach Bravais-Pearson........ 187
189
5.4.3 Korrelationsindex....................................................
190
Ordinal meßbare Merkmale.................................................
5.5.1 Rangkorrelationskoeffizientnach Spearman........... 191
5.5.2 Rangkorrelationskoeffizient(Konkordanzkoeffizient) nach Goodman und Kruskal .............195
5.5.3 Rangkorrelationskoeffizient (Konkordanz196
koeffizient) nach Kendall ....................................
Nominal meßbare Merkmale: Assoziationsmaße................ 196
5.6.1 Assoziationsmaße auf Basis der Größe
(Chi-Quadrat): Kontingenzkoeffizienten............. 197
199
5.6.2 Maße der prädikativen Assoziation.........................
Zusammenfassung............................................................... 202
202
Anwendungsbeispiele..........................................................
Problemlösungen mit SPSS ................................................. 204
Literaturhinweise................................................................. 207
6
Verhältnis- und Indexzahlen..............
5.3
5.4
5.5
5.6
6.1
6.2
6.3
7
7.1
7.2
Verhältniszahlen..................................................................
6.1.1 Begriff. Arten und Eigenschaften von
Verhältniszahlen..................................................
6.1.2 Rechnen mit Wachstumsraten.................................
6.1.3 Aggregation, Strukturabhängigkeit.
Standardisierung..................................................
Indexzahlen .........................................................................
6.2.1 Direkte Indexformeln..............................................
6.2.2 Axiome und Axiomensysteme................................
6.2.3 Neuere Vorschläge für Indexformeln......................
6.2.4 Kettenindizes...........................................................
Literaturhinweise.................................................................
Zeitreihenanalyse....................................................
209
209
209
213
217
220
221
225
230
239
241
243
Definitionen und Beispiele.................................................. 243
Das traditionelle Zeitreihen-Komponentenmodell..............247
10
Inhaltsverzeichnis
1.5
7.6
7.7
7.8
Saisonbereinigungsverfahren ..................................
7.3.1 Zielsetzung............................
7.3.2 Saisonbereinigungim additiv
modell bei konstanter und variabler Saisonfigur . 249
250
7.3.3 In der Praxis eingesetzte Verfahren ........................
7.3.4 Einige praktische
e der Saisonbereinigung258
Prognosen .........................
..................................... 259
7.4.1 Klassifikation von
everfahren .................... 259
260
7.4.2 Linearer Trend ........................................................
7.4.3 Exponential smoothing ........................................... 262
Stochastische Zeitreihenmodelle.....
Anwendungsbeispiel...........................................................
273
274
Problemlösungenmit SPSS .................................................
276
Literaturhinweise.................................................................
8
Kombinatorik ............................................................
7.3
7.4
8.1
8.2
8.3
8.4
8.5
8.6
9
9.1
9.2
9.3
Allgemeines.................................................................
Anordnung von Elementen (Permutation)...................
Auswahl von Elementen (Variationen und
Kombinationen) ......................................................
8.3.1 Variation mit Wiede
8.3.2 Variation ohne Wiede
.............................
8.3.3 Kombination mit Wie
8.3.4 Kombination ohne Wiederholung...........................
Anwendungsbeispiele..........................................................
Problemlösungen mit SPSS .................................................
......................................
Wahrscheinlichkeitsrechnung.............
277
280
282
282
283
283
284
285
Grundbegriffe......................................................................
285
Wahrscheinlichkeiten.......................................................... 292
292
9.2.1 Zur Geschichte........................................................
9.2.2 Wahrscheinlichkeitsbegriff .............................
Elementare Wahrscheinlichkeitsmodelle ............................
295
9.3.1 Gleichmöglichkeitsmodell(Laplace-Modell)oder
klassisches Wahrscheinlichkeitsrnodell...............295
9.3.2 Das Bernoulli-Modell ............................................. 296
9.3.3 Statistisches Wahrscheinlichkeitsrnodellund
von-Mises-Modell................................................
296
9.3.4 Weitere elementare Wahrscheinlichkeitsmodelle ... 298
Inhaltsverzeichnis
11
9.5
9.6
Bedingte Wahrscheinlichkeit.Multiplikationssatz.
Unabhängigkeit von Ereignissen.............................
299
9.4.1 Bedingte Wahrscheinlichkeit..................................
299
301
9.4.2 Multiplikationssatz..................................................
301
9.4.3 Stochastische Unabhängigkeit ................................
Einige Sätze der Wahrscheinlichkeitsrechnung..................304
307
Literaturhinweise.................................................................
10
Wahrscheinlichkeitsverteilungen ..................309
9.4
10.1
10.2
10.3
10.4
10.5
10.6
10.7
10.8
Grundkonzepte ....................................................................
309
10.1.1 Zufallsvariablen ...................................................... 309
10.1.2 Wahrscheinlichkeitsfunktion und Dichtefunktion...3 10
313
10.1.3 Verteilungsfunktion................................................
10.1.4 Parameter für Wahrscheinlichkeitsverteilungen..... 314
10.1.5 Funktionen von Zufallsvariablen ............................
317
Gleichverteilung.................................................................. 318
Binomialverteilung................................................
Multinomiale Verteilung ..............
Geometrische Verteilung.................................
HypergeometrischeVerteilung............................................
331
Poisson-Verteilung................................................
..335
338
Normalverteilung ................................................................
Exponentialverteilung......................................................... 342
Chi-Quadrat-Verteilung......................................................
343
t-Verteilung ................................................................
F-Verteilung ........................................................................
346
348
Anwendungsbeispiele..........................................................
348
Problemlösungen mit SPSS.................................................
Literaturhinweise................................................................. 349
Stochastische Prozesse..........................................
351
Grundbegriffe......................................................................
351
Gesetze der großen Zahlen .................................................. 352
352
11.2.1 Satz von Tschebyscheff ..........................................
11.2.2 Schwaches Gesetz der großen Zahlen in der Form
von Tschebyscheff...............................................
353
11.2.3 Schwaches Gesetz der großen Zahlen in der Form
von Bemoulli .......................................................
353
11.2.4 Schwaches Gesetz der großen Zahlen nach
354
Chintschin............................................................
11.2.5 Starkes Gesetz der großen Zahlen von Kolmogorov355
12
11.3
11.4
11.5
11.6
11.7
12
12.1
12.2
12.3
12.4
12.5
12.6
13
13.1
13.2
13.3
13.4
13.5
13.6
13.7
13.8
13.9
13.10
13.11
Inhaltsverzeichnis
11.2.6 Starkes Gesetz der großen Zahlen von Bore1 und
Cantelli.................................................................
355
Zentrale Grenzwertsätze...................................................... 356
11.3.1 Zentraler Grenzwertsatz nach Lindeberg und Levy 356
11.3.2 Zentraler Grenzwertsatz von deMoivre und
Laplace ................................................................
358
11.3.3 Zentraler Grenzwertsatz nach Ljapunoff .................359
Allgemeine Beschreibung stochastischer Prozesse .............361
11.4.1 Grundlagen.............................................................. 361
364
11.4.2 Kennzahlen .............................................................
367
Klassen spezieller stochastischer Prozesse..........................
Stationäre Prozesse.............................................................. 374
Literaturhinweise................................................................. 381
..................
Statistische Schätztheorie
383
Einleitung ............................................................................ 383
Bayesianische Schätztheorie ............................................... 384
12.2.1 Bayesianische Punkt- und Bereichsschätzer...........385
386
12.2.2 Schätzung einer Wahrscheinlichkeit.......................
Frequentistische Schätztheorie............................................
389
12.3.1 Maximum-Likelihood-Methode..............................
389
389
12.3.2 Gütekriterien ...........................................................
12.3.3 Weitere Konstruktionsprinzipienfür Punktschätzer401
12.3.4 Bereichsschatzer .....................................................
405
Anwendungsbeispiele.......................................................... 418
Softwarelösungen................................................................ 419
419
Literaturhinweise.................................................................
Parametrische Tests bei großen
Stichproben .................................................................
Grundkonzepte....................................................................
421
421
422
Test des arithmetischen Mittels ...........................................
Test für den Anteilswert...................................................... 429
Test für die Standardabweichung........................................ 430
431
Test für die Differenz zweier Mittelwerte ...........................
433
Test für die Differenz zweier Anteilswerte .........................
Test für die Differenz zweier Standardabweichungen.........434
Die Güte eines Tests............................................................ 435
436
Varianzanalyse ....................................................................
Ergänzungen........................................................................
439
Anwendungsbeispiele..........................
Inhaltsverzeichnis
13
13.12
13.13
Problemlösungen mit SPSS .................................................
Literaturhinweise .................................................................
14
Nichtparametrische Tests................................... 445
Chi-Quadrat-Unabhängigkeitstest.................
............446
14.1
14.2
14.3
14.4
14.5
14.6
14.7
14.8
14.9
14.10
14.11
14.12
14.13
14.14
15
15.1
441
444
Chi-Quadrat-Anpassungstest
..................................... 451
..................................... 457
Chi-Quadrat-Homogenitätste
Test auf Zufälligkeit ............................................................ 460
463
Binomialtest ........................................................................
........................................... 466
Fisher-Test..........................
Vorzeichentest für zwei verbundene Stichproben und der
Median-Test ............................................................ 470
14.7.1 Vorzeichentest für zwei verbundene Stichproben... 470
14.7.2 Mediantest ............................................................... 473
Wilcoxon-Rangtest für zwei verbundene Stichproben ........476
Wilcoxon-Rangsummentest für k=2 unabhängige
Stichproben (Man-Whitney-U-Test) .......................
480
Kruskal-Wallis-Test ............................................................ 484
Kolmogorov-Smirnov-Test .................................................
488
McNemar-Test ....................................................................
493
Anwendungsbeispiele und Problemlösungen mit SPSS ...... 496
Literaturhinweise .......................................................
Multiple Regression und Korrelation.........511
Grundkonzepte ........
.............. .................... 511
15.1.1 Zentrale Beg
...........................................
15.1.2 Konzepte .................................................................
511
512
........................................
518
15.3
15.4
15.5
15.6
15.7
Anwendungsbeispiele
.............................
Problemlösungen mit SPSS .................................................
Literaturhinweise .................................................................
524
526
528
16
Faktorenanalyse .......................................................
531
15.2
15.2.1 Formeln
16.1
16.2
Grundidee ............................................................................
Faktorenextraktion ..............................................................
531
533
14
Inhaltsverzeichnis
16.3
16.4
16.5
16.6
16.7
Kommunalitäten und Faktorenzahl ..................................... 542
Das Rotationsproblem......................................................... 548
553
Bestimmung der Faktorwerte ..............................................
Anwendungsbeispielund Problemlösung mit SPSS ...........559
Literaturhinweise.................................................................
563
17
Clusteranalyse...........................................................
565
17.1
17.1.2 Zentrale Begriffe .....................................................
17.1.3 Voraussetzungen.....................................................
Konzepte ..............................
17.2.1 Standardisierung ......
17.2.2 Ahnlichkeitsniaße ...................................................
17.2.3 Distanzmaße............................................................
17.2.4 Gemischtes Skalenniveau .......................................
Verfahren der Klassenbi
17.3.1 Hierarchisch-ag
17.3.2 Partitionierende
......................................
17.3.3 Algorithmen für die hierarchisch-agglomerative
565
566
17.4
17.5
17.6
17.7
17.8
17.9
Klassendiagnose..................................................................
Klassifikation auf stochastischer Basis ...............................
Hinweise auf andere Verfahren...
Anwendungsbeispiel...........................
Problemlösung mit SPSS.....................................................
Literaturhinweise.................................................................
575
576
18
Diskriminanzanalyse.............................................
17.2
17.3
18.1
18.2
18.3
18.4
18.5
18.6
18.7
18.8
18.9
Begriff der Klassifikation....................................................
Geometrie der linearen Diskriminanzanalyse......................
Allgemeine Kriterien zur Wahl von
Klassifikationsregeln...............................................
Lineare Diskriminanzanalyse..............................................
Klassifikationsbeurteilung ...................................................
Besonderheitenbei der Anwendung von
Diskriminanzanalysen.............................................
Anwendungsbeispiel...........................................................
Problemlösung mit SPSS.....................................................
Literaturhinweise.............. ............................................
568
570
570
572
579
581
583
583
585
588
591
595
599
500
601
607
Inhaltsverzeichnis
19
19.1
19.2
19.3
19.4
19.5
19.6
19.7
19.8
20
20.1
20.2
20.3
20.4
20.5
20.6
20.7
20.8
20.9
20.10
Logit- und Probit-Modelle.................................
.....................................................................
15
609
609
Modellierung ......................................................
19.2.1 Das lineare Wahrscheinlichkeitsmodell.
19.2.2 Logit- und Probit-Modelle .....................
Schätzung der Parameter ..................................................... 617
618
19.3.1 Die Maximum-Likelihood-Methode .......................
19.3.2 Berechnung der Schätzwerte ......
19.3.3 Eigenschaften der ML-Schätzer.
Modelldiagnostik und Hypothesentests. ..............................623
19.4.1 Gütemaße ................................................................ 623
19.4.2 Gruppierte Daten:
................. 628
19.4.3 Tests linearer Hypothesen ....
Prädiktion, marginale Aus
,,Odds-ratio".............................................................
63 1
Zwei Beispiele ..................................................................... 635
19.6.1 Ein Probit-Modell ................................
19.6.2 Logit-Modell und SPSS-Anwendung .....................
638
Ergänzungen und Erweiterungen ........................................ 641
Literaturhinweise ................................................................. 643
Unscharfe Daten.......................................................
Einleitung ............................................................
Unscharfe Zahlen ...........................
Unscharfe Vektoren.
..........................
645
649
Funktionen unscharfer Größen ............................
Schätzungen bei unscharfen Daten.. .....
20.11
20.12
Unscharfe Daten und statistische Tests ...............................
663
Bayes'sche Analyse...................................................
20.10.1 Das Bayes'sche Theorem für unscharfe Daten .......665
20.10.2Unscharfe Bayes'sche Vertrauensbereiche .............668
670
20.10.3 Unscharfe Prognoseverteilungen ...........................
............................................................... 671
Ausblick ....
.671
Literaturhinweise ..........................................
21
Data Mining ................................................................
21.1
21.2
673
Was ist Data Mining? .......................................................... 673
Allgemeine methodische Grundlagen .................................675
16
Inhaltsverzeichnis
21.3
21.4
21.5
21.6
Data Mining mittels Assoziationsregeln .............................
678
Klassifikation ...................................................................... 683
690
Data Mining Software .........................................................
Literaturhinweise................................................................ .69 1
22
Graphentheoretische Modelle in der
Statistik
22.1.
22.2
22.3
22.4
22.5
22.6
22.7
.......................................................
693
.......................................................... 693
693
hkeitstheorie.....................................
22.1.2 Graphentheorie........................................................
694
Einleitung ..
.....695
Konstruktion von Graphen .................................................. 698
22.3.1 Ableitung von Graphen aus der gemei
W ahrscheinlichkeitsverteilung........
22.3.2 Ableitung von Graphen aus
Unabhängigkeitsannahmen.......
22.3.3 Ableitung von Graphen aus Gleichungssystemen...702
22.3.4 Die Markov
ung ..........................................
704
d-Separation ...........
22.4.1 Separierung
22.4.2 Unabhängigkeitsbedingunge
22.4.3 Perfekte Abbildungen .............................................
710
Kausale Modelle und kausale Effekte .............
22.5.1 Kausale Modelle .......
......................
22.5.2 Kausale Effekte .........
......................
Software-unterstützteGenerierung von Graphen ................7 16
717
22.6.1 Ablauf des Verfahrens ............................................
............721
Literaturhinweise............................................
...................................................................
SPSS-Datenbestände..............................................
Register
723
741
Herunterladen