4. Die Familie der Normalverteilungen Die Werte der

Werbung
4. Die Familie der Normalverteilungen
Die Werte der Verteilungsfunktion von Normalverteilungen sind nicht durch eine
Formel berechenbar. Nur die Dichtefunktion kann mit Hilfe einer Formel berechnet
werden.
Definition: f ist die Dichtefunktion einer normalverteilten Zufallsvariable genau dann,
1 x 2
wenn fx  1 e  2   
 2
Ein Nachweis, dass f wirklich eine Dichtefunktion einer

Wahrscheinlichkeitsverteilung ist, besteht im Beweis von 

1
 2
1
e 2 
x


2
 1.
Um auszudrücken, dass eine stetige Zufallsvariable normal verteilt ist, scheiben
wir: X  N,  2 . Der Erwartungswert  und die Varianz  2 stellen die Parameter
der Verteilung dar.
Übung: Wir nehmen an, es gelte X  N4, 9. Berechnen Sie für
x i  1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 die Funktionswerte fx i  der entsprechenden
Dichtefunktion und tragen Sie die Punkte in einem Koordinatensystem ab.
Lösung:
Die Dichtefunktion ist: fx 
3
3
3
3
3
3
1
2
1
2
1
2
1
2
1
2
1
2
2
1
14
3
1
04
3
2
e 2
1
14
3
2
1
24
3
2
34
3
2
44
3
2
e 2
e 2
e 2
1
e 2
1
e 2
 3. 315 9  10
1
3 2
2
 0. 0 546 7
 8. 065 7  10 2
 0. 106 48
 0. 125 79
1
e 2
x4
3
2
1
1
e 2
3 2
1
1
e 2
3 2
1
1
e 2
3 2
1
1
e 2
3 2
1
1
e 2
3 2
94
3
2
 3. 315 9  10 2 ;
2
84
3
74
3
2
64
3
2
54
3
2
 0. 0 546 7
 8. 065 7  10 2
 0. 106 48;
 0. 125 79;
 0. 132 98
Wir stellen fest, dass die Werte symmetrisch um 4   liegen.
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 105
Graphische Darstellung:
Verbinden wir die Punkte, erhalten wir:
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 106
Die Dichtefunktionen der Normalverteilungen sind um  ( Erwartungswert)
symmetrische Funktionen. Somit fällt der Median mit dem Erwartungswert
zusammen.
Durch Veränderung von  können wir die Kurve nach links oder nach rechts
verschieben. Je grösser , desto mehr wird die Kurve nach rechts verschoben.
Beispiele:
  4;   3
  2;   3
  0;   3
  2;   3
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 107
Die Varianz  2 gibt an, wie steil oder wie flach die Dichtefunktion einer
Normalverteilung ist: Je kleiner die Varianz ist, desto steiler läuft die Kurve beim
Erwartungswert zusammen.
  4;   1
  4;   2
  4;   3
  4;   5
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 108
Die Standardabweichung schneidet beidseitig des Erwartungswertes ca. 0.68 ab.
D.h. P    X      0. 68. (ca. 2/3)
P  2  X    2  0. 955 (ca. 95%)
P  3  X    3  0. 9994 (ca 99.9%).
  10,   3
2σ
4σ
Eine Zufallsvariable X, für die gilt: X  N0, 1, ist ”standardnormalverteilt”.
Für die Formel der entsprechenden Dichtefunktion gilt:
2
1
x0 2
1
f X x  1 e  2 1
 f X x  1 e  2 x
1 2
2
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 109
Berechnung der Werte Px  X  y für X  N,  2 
Die entsprechenden Werte werden mit Näherungsverfahren berechnet. In der
Praxis benutzen wir zur Bestimmung von Wahrscheinlichkeiten bei normalverteilten
Zufallsvariablen Rechner, Computerprogramme oder Tabellen.
Um das Gefühl für die Normalverteilung und das, was sie ausdrückt, zu
verbessern, berechnen wir näherungsweise eine Teilfläche unter der
Dichtefunktion. Wir wollen die Fläche im Intervall ]0. 8, 1. 6]  ]a, b] unter der
Dichtefunktion der Standardnormalverteilung berechnen.
Dreieck
Rechteck
a
b
Die zu berechnende Fläche ist aus einem Rechteck und aus einem
näherungsweisen Dreieck zusammengesetzt. Wir können diese berechnen (f ist
die Dichtefunktion).
Für das Rechteck: Basis  Höhe
Die Basis beträgt dabei (1. 6  0. 8) und die Höhe f1. 6. Wir erhalten somit:
1
2
1. 6  0. 8 
1
2
e  2 1.6  8. 873 7  10 2
Für das Dreieck: BasisHöhe
:
2
Die Basis beträgt (1. 6  0. 8) und die Höhe f0. 8  f1. 6 :
0.8
2

1
2
1
2
e  2 0.8 
1
2
1
e  2 1.6
2
 7. 150 8  10 2
Somit ist die Fläche näherungsweise: 8. 873 7  10 2  7. 150 8  10 2  0. 160 25
Wir vergleichen das Resultat mit dem Resultat von Excel:
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 110
F1. 6  F0. 8  0. 157056044
Die Näherung ist um weniger als 4 o / oo daneben. Sie könnte beliebig verbessert
werden, indem wir die zu berechnende Fläche in kleinere Intervalle einteilen und
jeweils deren Fläche berechnen. Dies wäre vor allem in den Intervallen
angemessen, wo die Dichtefunktion der Standardnormalverteilung stärker
gekrümmt ist und damit durch die Hypotenuse des Dreiecks weniger gut
angenähert wird als im Beispiel.
Allgemein ist die Fläche im Intervall ]a, b] (für a, b  0) näherungsweise:
b  a
1
2
1
e  2 b
2
ba
2

1
2
1
2
2

1
2
e  2 a 
1
2
e  2 b
1
2
1
e  2 b
2
Wir vereinfachen:

2ba
2
1
2
1
e  2 b
2

ba
2
2
1
2

ba
2
1
2
e  2 b 
1
e  2 b
1
ba
2

2
2
1
2

1
e  2 a
1
2
1
e  2 b
ba
2

1
2
1
1
2

e  2 a
1
e  2 a
2
2
2
Wir berechnen die näherungsweise Fläche A im betrachteten Intervall [0. 8, 1. 6] bei
einer zusätzlichen Unterteilung des Intervalls in 0. 8, 1. 2  1. 2, 1. 6 0. 8, 1. 6
A2
A1
A1  A2  A
A1 
1.61.2
2
1
2
e  2 1.6 
A2 
1.20.8
2
1
2
e  2 1.2 
1
2
1
2
e  2 1.2
1
2
 6. 102 1  10 2
1
2
1
2
e  2 0.8
1
2
 9. 677 6  10 2
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 111
A  6. 102 1  10 2  9. 677 6  10 2  0. 1578
Die Näherung ist schon bedeutend besser geworden. Es ist einfach, z.B. mit Excel
noch bessere Näherungen zu berechnen, indem die Unterteilung durch zusätzliche
Intervalle verfeinert wird.
In der Praxis werden wir die Werte Pa  X  b bei normalverteilten
Zufallsvariablen nicht auf diese Art berechnen. Wir verwenden Programme,
Rechner oder Tabellen:
Mit Excel: Statistikfunktionen, NORMVERT liefert Px  X für X  N,  2 . Dabei
wird unter x der Wert x eingegeben, unter ”Mittelwert” , unter
”Standardabweichung” , unter ”kumuliert” 1 (0 liefert den Wert der Dichtefunktion
in x).
Mit dem HP: Der HP48G liefert unter mth, NXT, PROB, NXT, UTPN die Werte für
PX  x. Bevor der Befehl ausgeführt wird, müssen die folgenden Werte der
Reihe nach in die Stackebenen gegeben werden: ,  2 , x (Es lohnt sich, ein
Miniprogramm mit einer entsprechenden Abfrage zu machen, siehe HP-Blätter).
Mit Tabellen: In Tabellen werden nur die Werte für die Standardnormalverteilung
geliefert. Daten, die normalverteilt sind, können jedoch leicht in Daten transformiert
werden, die standardnormalverteilt sind. Dies geschieht durch die
z-Transformation. Wir möchten PX  x i  berechnen mit X  N,  2 . Dann können
x 
wir PZ  z i  berechnen mit z i  i und Z  N0, 1.
Wir verwenden künftig  als Abkürzung für die Verteilungsfunktion der
Standardnormalverteilung.
Die näherungsweise berechneten Punkte der Normalverteilung erlauben es, eine
punktweise Zeichnung der kumulativen Verteilungsfunktion  zu erstellen, wobei
die Punke von Hand verbunden werden können. Der Plot der Funktion
{-0.25,1-0.5987, -0.5,1-0.6915, -0.75,1-0.7734, -1,1-0.8413,
-1.25,1-0.8944, -1.5,1-0.9332, -1.75,1-0.9599, -2,1-0.97725,
-2.25,1-0.98778, -2.5,1-0.99379, -2.75,1-0.99702, -3,1-0.998650,
0,0.5, 0.25,0.5987, 0.5,0.6915, 0.75,0.7734, 1,0.8413, 1.25,0.8944,
1.5,0.9332, 1.75,0.9599, 2,0.97725, 2.25,0.98778, 2.5,0.99379,
2.75,0.99702, 3,0.998650} ergibt die folgende Graphik.
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 112
Zeichnen wir die punktweise empirische Verteilungsfunktion von z-standardisierten
Daten, so können wir davon ausgehen, dass sie normalverteilt sind, wenn die
Punkte ungefähr auf der obigen gedachten Kurve liegen (Die Kurve ist
punktsymmetrisch in 0, 0.5 und steigt stark nahe bei 0 und schwächer für
Punkte, die weiter weg von 0 liegen).
Die z-Transformation
Daten mit beliebiger Verteilung können durch die z-Transformation in Daten mit
dem Mittelwert 0 und der Standardabweichung 1 verwandelt werden. Die
z-Transformation ist definiert als:
zi 
x i x

(wir verwenden Variablen mit Querstrich für die empirischen Kennzahlen.  2 ist
somit die empirische Varianz einer empirischen Verteilung. Während  2 die
Varianz einer theoretischen Verteilung ist).
Beispiel: Gegeben sind die Daten x i  4, 5, 6, 7
Deren Mittelwert ist: x 
4567
4
 5. 5
45.5 2 55.5 2 65.5 2 75.5 2
Deren Standardabweichung ist:  
41
Wir transformieren die Werte:
z 1  1.45.5
  1. 161 9;
z 2  1.55.5
 . 387 3;
291
291
65.5
75.5
z 3  1. 291  . 387 3;
z 4  1. 291  1. 161 9
 1. 291
(Bei grossen Datensätzen verwenden wir dazu den Computer. Übung: Wählen Sie
einen Datensatz aus den Beispielen von SPSS und darin eine metrisch und stetig
skalierte Variable. Berechnen Sie eine z-Transformation der Daten).
Der Mittelwert der z-transformierten Daten z i ist: z 
1. 16190.38730.38731.1619
4
0
Die Standardabweichung der z-transformierten Daten z i ist:
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 113
1.16190 2 0.38730 2 0.38730 2 1.16190 2
41
 z 
1
Wir zeigen für beliebige empirische Verteilungen: Der Mittelwert z-transformierter
Daten ist 0 und deren Varianz 1.
Die Formel für den Mittelwert und die Varianz lautet:
x 
1
n
n
 xi
1
n1
 2 
i1
n
x i  x  2
i1
n
Für den Mittelwert: z 
x  1n nx


x x


0

Für die Varianz:  2z 
1
n1
n
 z 2i 
i1
1
n1
1
n
n
1
n
n

x i x

z i  z 2 
1
n1
 zi 
i1
1
n
i1
n
 x i  1n  x
i1


i1

0
1
n1
n
i1
n
 x ix  2 
i1
1
n1
n

i1
x i x  2
 2
n
z i  0 2 
i1
n
1
n1

x i x  2
i1
 2

 2
 2
1
Übung: Wir haben folgende Daten zur Verfügung:
9. 21, 9. 52, 9. 62, 9. 63, 9. 61, 9. 71, 9. 83. Transformieren Sie diese Werte mit einer
z-Transformation und zeigen sie, dass der Mittelwert der z-Werte  0 und die
Varianz der Werte  1 (um wirklich diese Werte zu erhalten, müssen möglichst
viele Stellen berechnet und verwendet werden).
Lösung: Wir berechnen x und  : x 
  0. 193304595565.)
z1 
z2 
z3 
z7 
9.219.59
0.193304595565
9.529.59
0.193304595565
9.629.59
0.193304595565
9.839.59
0.193304595565
 1. 965 8 z 4 
 . 362 12 z 5 
9.219.529.629.639.619.719.83
7
9.639.59
0.193304595565
9.619.59
0.193304595565
9.719.59
0.193304595565
. 155 2
z6 
 1. 241 6
z  0;  z  1
 9. 59;
. 206 93
. 103 46
. 620 78
Excel liefert die z-Transformation unter den Statistikfunktionen mit
”Standardisierung”.
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 114
Zusammenhang von Normalverteilung und Binomialverteilung
Es besteht ein enger Zusammenhang zwischen den Binomialverteilungen und der
Standardnormalverteilung. Wir können die Binomialverteilung durch eine Art
Dichtefunktion darstellen, indem wir die Wahrscheinlichkeiten, die den Werten der
Zufallsvariable zugeordnet sind, durch Flächen repräsentieren, so dass
(i) F i  PX  x i  (F i ist die Fläche, die wir x i zuordnen)
(ii) sich die jeweiligen Rechtecke berühren und
(iii) die Rechtecke symmetrisch um die x i liegen.
Für n  5 und p  0. 5 erhalten wir das folgende ”Hystogramm”:
Dabei sind die jeweiligen Intervallgrenzen der Rechtecke auf der x-Achse durch
g i  x i  0. 5 gegeben. Die Basis der Rechtecke ist jeweils 1 und die Höhe
PX  x i .
Wir führen nun eine z-Transformation auf die so erhaltenen Intervallgrenzen g i
x i 0.5np
durch, d.h. g i  np1p
. Dann berechnen wir die Flächen über den
transformierten Intervallgrenzen, so dass für die Intervalle
x i 0.5np
np1p
x i 0.5np
np1p
x i 0.5np
np1p
,
x i 0.5np
np1p
gilt:
PX  x i   h 

und zeichnen das Ganze zusammen mit der
Standardnormalverteilung in ein Koordinatennetz. Wir erhalten z.B. für n  5 und
p  0. 5:
xi
P(X=xi)
0
1
2
3
4
5
0.03125
0.15625
0.3125
0.3125
0.15625
0.03125
Intervallgrenzen
z-transformierte
Höhen
Intervallgrenzen
-0.5
-2.68328157
0.5
-1.78885438
1.5
-0.89442719
2.5
0
3.5
0.89442719
4.5
1.78885438
5.5
2.68328157
0.03493856
0.17469281
0.34938562
0.34938562
0.17469281
0.03493856
Dies ergibt die folgende Zeichnung (samt der Dichtefunktion der
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 115
Standardnormalverteilung):
Wir betrachten noch die Zeichnung für n  10, p  0. 5 :
Wir stellen fest, dass sich die Obergrenze des Treppenkörpers der Dichtefunktion
der Standardnormalverteilung mit steigendem n nähert.
Wir legen folgendes fest:
(1) f ist die Grenzfunktion einer Folge von Funktionen f n (symbolisch: lim
f  f
n n
genau dann, wenn fx  lim
f x für alle x  R.
n n
PXx i 
(2) für X  Bn, p sei f n x 
x i 0.5np
np1p

0
x i 0.5np
np1p
für x 
x i 0.5np
np1p
,
x i 0.5np
np1p
und 0  i  n
sonst
Dann könnte man beweisen, dass gilt: die Standardnormalverteilung ist die
f f
Grenzfunktion der Funktionenfolge f n , d.h. lim
n n
Auf Grund des Zusammenhangs der Standardnormalverteilung und der Familie der
Binomialverteilungen können wir die Standardnormalverteilung verwenden, um
näherungsweise Werte der Binomialverteilung zu berechnen. Man möchte PX  3
für X  B40, 0. 5 berechnen. Traditionell war eine solche Berechnung mühsam.
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 116
Deshalb war früher das Näherungsverfahren nützlicher als heute. Wir erhalten den
folgenden exakten Wert: PX  3  0. 00000421516597271. Mit der
Standardnormalverteilung erhalten wir für
X  N0, 1 : PX  3300.52   0. 000005885142
300.5
wobei
3300.5
300.5 2
  4. 381 8.
Die Differenz zwischen den beiden Werten ist unbedeutend. Als Richtwert nimmt
man im Allgemeinen an, dass die Näherung genügend genau ist, wenn
n  p  1  p  9 (Obwohl im obigen Beispiel dieser Wert nicht erreicht wird 30  0. 5  0. 5  7. 5 -, ist die Näherung doch schon gut).
Übungen
Berechnen Sie folgende Wahrscheinlichkeiten:
1) X  N5, 36 :
a) PX  7
b) P5  X  8
c) P6  X  9
d) P8. 5  X.
e) PX  3
f) P2  X  4
2) a) X  N3, 8 : PX  7
b) X  N6, 8 : P5  X  8
c) X  N10, 80 : P6  X  9
d) X  N9, 70 : P8. 5  X.
e) X  N5, 16 : P2  X  8
f) X  N5, 16 : PX  5.
3) Berechnen Sie mit Excel und dem oben angegeben Näherungsverfahren die Fläche
zwischen der Dichtefunktion der Standardnormalverteilung und der x-Achse im Intervall
]0. 5, 1], indem Sie zuerst das gesamte Intervall betrachten, dann eine Zweiteilung und
eine Vierteilung des Intervalls vornehmen. Vergleichen Sie die Lösungen mit den
Ergebnis NORMVERT von Excel.
4) Berechnen Sie mit Hilfe der Normalverteilung die folgenden Werte der folgenden
Binomialverteilungen (wobei Sie jeweils die Voraussetzung für die Näherung
überprüfen):
a) PX  23 für X  B40, 0. 4
b) PX  30 für X  B45, 0. 5
c) PX  18 für X  B50, 0. 3
d) PX  2 für X  B40, 0. 45
e) PX  24 für X  B100, 0. 44
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 117
Lösungen:
In den folgenden Lösungen werden Zwischenschritte für jene geliefert, die mit einer
Tabelle arbeiten. Mit dem HP oder einem ähnlichen Rechner kann man unmittelbar
oder nach einer kleinen Umrechnung die entsprechenden Resultate erhalten.
a) PX  7  0. 630558659818
Mit Tabelle: F X 7   75
  0. 3333  0. 6293
6
Bei Berechnung der zusätzlichen Stellen durch Interpolation:
0. 6293  13 0. 6331  0. 6293  0. 630 57
b) P5  X  8  PX  8  PX  5  0. 191462461274
   55

Mit Tabelle:  85
6
6
3
 6   0  0. 6915  0. 5  0. 191 5
c) P6  X  9  F X 9  F X 6  0. 566183832622
   65

Mit Tabelle:  95
6
6
4
1
 6    6   0. 7454  0. 5636  0. 181 8
(Bei Berücksichtigung zusätzlicher Stellen:  46   0. 7454 
747 53
 16   0. 5636  23 0. 5675  0. 5636  0. 566 2
Somit ist  46    16   0. 747 53  0. 566 2  0. 181 33
2
3
0. 7486  0. 7454  0.
d) P8. 5  X  1  F X 8. 5  0. 279344636
Mit Tabelle: 1   8.55
  1   3.5

6
6
 1  0. 583 33  1  0. 7190  0. 281
e) PX  3  F X 3  0. 369441340182
Mit Tabelle: 1    35
 1   26
6
 1  0. 6293  0. 370 7
f) P2  X  4  F X 4  F X 2  0. 125278628663
Mit Tabelle: 1    45
 1    25

6
6
3
1
1 6  1 6
 1  0. 5636  1  0. 6915  0. 127 9
B) a) X  N3, 8 : PX  7  F X 7  0. 921350396475
Mit Tabelle:  73  1. 4142  0. 9207
8
b) X  N6, 8 : P5  X  8  F X 8  F X 5  0. 398413133991
Mit Tabelle:  86   56  0. 7580  1  0. 35355 
8
8
0. 7580  0. 36173  0. 396 27
c) X  N10, 80 : P6  X  9  F X 9  F X 6  0. 128129223246
Mit Tabelle:  910   610  1  0. 1118  1  0. 44721 
80
80
1  0. 5438  1  0. 6700  0. 126 2
d) X  N9, 70 : P8. 5  X  1  F X 8. 5  0. 523827177663
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 118
Mit Tabelle: 1  
8.59
70
 1  1  0. 059761  0. 5199.
e)X  N5, 16 : P2  X  8  F X 8  F X 2  0. 546745295246
Mit Tabelle:  25
   85

4
4
3
3
1   4    4   1  20. 75  1  0. 45325  0. 546 75
f) X  N5, 16 : PX  5  0. 5
3) Folgende Formel muss eingegeben werden:
(((B1-A1)/2)*((1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(B1)^2)
(1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(A1)^2)))
(Statt ”((1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(B1)^2)” könnte man aber auch
kürzer ”(NORMVERT(B1;0;1;0)” und statt
”(1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(A1)^2))” kürzer
”(NORMVERT(A1;0;1;0)”eingeben).
In die Spalten B und A setzen wir die Intervallgrenzen b und a und wir erhalten:
Beim gesamten Intervall: 0.148509013
Bei Zweiteilung: 0.149538864
Bei Vierteilung: 0.149796428
Mit Excelbefehl NORMVERT: 0. 149882273
a
0.5
0.5
0.75
0.5
0.625
0.75
0.875
b
1
0.75
1
0.625
0.75
0.875
1
Summen
0.14850901
0.08165034
0.06788852
0.04251414
0.03933115
0.03582453
0.03212661
0.14953886
0.14979643
4) a) Die Voraussetzung: 0. 4  0. 6  40  9. 6  9 ist erfüllt.
23400.4
 2. 259 2  0. 0119354734175
1
400.60.4
Der genaue Wert ist: 0. 008341770891.
b) Die Voraussetzung: 0. 5  0. 5  45  11. 25  9 ist erfüllt.
1   29450.5
 1  1. 937 9  0. 0263177119897
450.50.5
Der genaue Wert ist: 0. 017848901776
c) Die Voraussetzung: 0. 3  0. 7  50  10. 5  9 ist erfüllt.
 18500.3
 0. 925 82  0. 822730234184
500.30.7
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 119
Der genaue Wert ist: 0. 859440123612
d) Die Voraussetzung: 0. 45  0. 55  40  9. 9  9 ist erfüllt.

1400.45
400.450.55
 5. 403 0  0. 000000032768
Der genaue Wert ist: 1. 38831751973  10 9
e) Die Voraussetzung: 0. 44  0. 56  100  24. 64  9 ist erfüllt.
 1  4. 230 6  0. 99998834656
1   231000.44
1000.440.56
Der genaue Wert ist:0. 999989953116
Man beachte: Die Näherungswerte können verbessert werden, wenn man statt der
Werte x i die Werte x i  0. 5 verwendet. Computer und Rechnungsmaschinen
verwenden bei grossen n bei der Berechnung von Wahrscheinlichkeiten der
Binomialverteilung oft auch ein Näherungsverfahren.
Lernziele
- Die Wahrscheinlichkeiten bezüglich Normalverteilungen
- mit Excel berechnen können
- mit einem Rechner oder mit Tabellen bestimmen können.
- Die Funktionswerte der Dichtefunktion ausrechnen können (die Formel muss man
nicht auswendig kennen).
- Die Idee des Näherungsverfahrens für die Berechnung von Flächen unter der
Dichtefunktion beschreiben können.
- Wissen, dass die Dichtefunktion der Normalverteilungen eine symmetrische
Verteilungen sind und dass deshalb der Erwartungswert und der Median
zusammenfallen.
- Die Abkürzung X  N,  2  verstehen.
- Daten z-transformieren können.
- Wahrscheinlichkeiten PX  x und PX  x für X  Bn, p mit Hilfe der
Normalverteilung näherungsweise berechnen können.
- Wissen, dass ein enger Zusammenhang zwischen der Familie der
Binomialverteilungen und der Standardnormalverteilung besteht.
- Übungen der Art 1), 2) und 4) machen können.
Anhang: Die Tabellierung der genäherten Werte der
Standardnormalverteilung
In der Tabelle der ”Formeln und Tafeln - Mathematik - Physik” Orell Füssli Verlag
Zürich (siehe Kopie) können die Wahrscheinlichkeiten wie folgt abgelesen werden.
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 120
u sind die z-transformierten Werte der Zufallsvariable. In der ersten Spalte stehen
die Werte u (eine Stelle vor dem Komma, eine Stelle nach dem Komma). In der
ersten Zeile steht die jeweils zweite Stelle nach dem Komma). In den übrigen
Spalten (ohne die erste Zeile) stehen die entsprechenden Wahrscheinlichkeiten für
x
u  0, wobei statt F X s u  F X s    ( Verteilungsfunktion einer
standardnormalverteilten Zufallsvariable) bei der Standardnormalverteilung die
x
Symbolisierung u     gebräuchlich ist ( wird gelesen als ”phi” oder
”Grossphi”, wenn Kleinphi ebenfalls verwendet wird. Kleinphi ist ). Bei Daten mit *
ist der Vordruck der unteren Zeile zu verwenden (Beispiel: 2. 35  0. 99061.
Da die Normalverteilung symmetrisch ist, können wir mit Hilfe der Werte u  0 auch
die Wahrscheinlichkeiten für die Werte u  0 berechnen: Für u  0 ist
PX  u  u  1  u.
Denn die ganze Fläche unter der Dichtefunktion ist mit 1 identisch. Da die Funktion
symmetrisch um den 0-Punkt ist, ist auch die Fläche unter der Dichtefunktion
symmetrisch um den 0-Punkt. Ziehen wir parallel zur f-Achse zwei Geraden durch
a und a (für a  0), so entstehen rechts der Gerade g a und links der Gerade g a
gleich grosse Flächen unter der Dichtefunktion. Die Fläche rechts von g a ist mit
1  u identisch). Somit ist u  1  u. Die folgende Graphik
veranschaulicht diesen Zusammenhang:
FX(-2.1) = Φ(-2.1) = 1 - Φ(2.1)
1 - Φ(2.1)
Beispiele:
Sei X  N4, 25.
PX  7  F X 7   74
  0. 6  0. 7257
5
   54

P5  X  8  F X 8  F X 5   84
5
5
0. 8  0. 2  0. 7881  0. 5793  0. 2088
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 121
PX  2  F X 2   24
   2
  1   25   1  0. 6554  0. 3446
5
5
PX  9  1  F X 9  1   94
  1   55   1  1 
5
1  0. 8413  0. 158 7
P1  X  3  F X 3  F X 1   34
   14
   1
   3

5
5
5
5
3
1
1   5   1   5   1  0. 5793  1  0. 7257  0. 146 4
   34
   25    1

P3  X  6  F X 6  F X 3   64
5
5
5
1
0. 6554  1   5   0. 6554  1  0. 5793  0. 234 7
Mit   u wird im Tafelbuch die Fläche bezeichnet, die im Intervall u, u zwischen
der x-Achse und der Dichtefunktion um den Erwartungswert 0 herum liegt. Als von
besonderer Bedeutung wird sich die Fläche 1    u erweisen. Für   u gilt:
  u  2u  1.
(Denn   u  u  u  u  1  u  2u  1.
Beispiel: Sei X  N15, 49 :
Wie hoch ist die Wahrscheinlichkeit P15  5  X  15  5  P10  X  20
Wir berechnen den z-transformierten Wert von 20: 2015
 0. 714 29  u
7
Laut obiger Formel gilt dann:
P10  X  20  20. 71429  1  2  0. 7611  1  0. 5222
Kommen zusätzliche Stellen der uWerte vor, so kann man diese durch lineare
Interpolation zwischen den gegebenen Punkte näherungsweise berechen. Möchten
wir z.B. 2. 03789 berechnen, so finden wir für 2. 03 den Wert 0. 97882, für 2. 04
den Wert:0. 97932. Die Differenz beträgt: 0. 97932  0. 97882  0. 000 5. Wir
berechnen den entsprechenden Anteil: 0. 789  0. 0005  3. 945  10 4 und zählen
diesen zum Wert von 2.03: 0. 97882  3. 945  10 4  0. 979 21. Solche
Berechnungen drängen sich jedoch im Allgemeinen nicht auf, da die
Unsicherheiten allzu grosse Genauigkeit als sinnlos erscheinen lassen.
Übungshalber sollten in den folgenden Aufgaben die entsprechenden Näherungen
in den ersten zwei Beispielen, wo zusätzliche Stellen auftreten, berechnet werden.
___________________________________________________________________
Normalverteilung.tex 2. HSW Siders P.R. Seite 122
5. P-P-Plots und Q-Q-Plots
Bisher haben wie eine Möglichkeit gesehen, um graphisch zu überprüfen, ob ein
Modell zu einem Datensatz passt. Wir zeichneten die empirische
Verteilungsfunktion und das Modell ins gleiche Koordinatennetz und überprüften
die Anpassung von Auge. Wir betrachten nun eine weitere, häufig verwendete
Methode. Um zu überprüfen, ob n Daten eine bestimmte Verteilung haben, können
wir auch sogenannte P-P-Plots (Probability-Probability-Plots) oder Q-Q-Plots
(Quantil-Quantil-Plots) zeichnen.
P-P-Plots
Wir tragen die folgenden Punkte in ein Koordinatennetz ein:
 Hx i , Fx i  
Hx i  sind die Werte der empirischen Verteilungsfunktion der x i (Hx i  ist der Anteil
der Daten, die kleiner gleich x i sind). Damit gilt für das i-te Datum x i eines
geordeten Datensatzes: Hx i   ni .
Fx i  sind die Werte der theoretischen Verteilungsfunktion, d.h. Fx i   PX  x i .
Es gilt: Die Punkte  Hx i , Fx i   befinden sich im ersten Quadranten, und zwar
im Quadrat 0, 1  0, 1.
Passt die theoretische Verteilung zu den Daten, so dürfen die Daten nur gering um
die yx-Achse streuen und keine systematische Abweichungen vorliegen.
P-P-Plots sind für beliebige Verteilungen erstellbar, gebräuchlich sind sie vor allem
für die Normalverteilung.
Beispiel: Wir wollen überprüfen, ob die folgenden Daten normalverteilt sind
(Schraubenlängen):
0.04992132
0.07626878
0.09694301
0.24706014
0.33711828
0.48861922
0.51154522
0.5559821
0.58895487
0.9406725
Wir berechnen die Wahrscheinlichkeiten FX  x i . n  10. Somit ist Hx i  
i
10
.
(in der Tabelle wurde auch die Berechnungsart für Tabellen angeführt.
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
123
x  0. 389308545,   0. 282461202, z i    x ix   Fx i  :
xi
0.04992132
0.07626878
0.09694301
0.24706014
0.33711828
0.48861922
0.51154522
0.5559821
0.58895487
0.9406725
zi
-1.20153572
-1.10825757
-1.0350644
-0.50360334
-0.18476968
0.3515905
0.43275563
0.59007592
0.70680973
1.9519989
Φ(zi) mit Tabelle
0.1151
0.1357
0.1515
0.3085
0.4286
0.6368
0.6664
0.7224
0.758
0.9744
H(zi)
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Φ(zi) mit Excel
0.11477179
0.13387534
0.15031944
0.30727006
0.42670486
0.63742724
0.66740381
0.72243017
0.76015771
0.9745309
(Bei ”mit Tabelle” wurden keine Interpolationen berechnet, um die Kontrolle zu
erleichtern. Bei Interpolationen würden die Ergebnisse näher bei denen von Excel
liegen)
Wir tragen die entsprechenden Punkte in ein Koordinatensystem ein (samt der
Achse y  x):
P-P-Diagramm von Normal von Schraubenlängen
1
Erwartete Kum. Wahrsch.
1
1
0
0
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Daten sind vermutlich nicht normalverteilt - es handelt sich in der Tat um
uniform verteilte Zufallszahlen. Allerdings muss beachtet werden, dass zu einer
relativ zuverlässigen Beurteilung acht Daten wenig sind. Eine bessere Beurteilung
ist mit mehr Daten möglich. Der obige, kleine Datensatz ist als Beispiel gedacht,
um die Berechnung mit manuellen Mitteln nachvollziehbar zu machen. (Die obige
Tabelle wurde mit SPSS erstellt. SPSS staucht die empirische Verteilungsfunktion
etwas nach links, so dass das letzte Datum nicht auf die Linie zu liegen kommt.
Dies wirkt sich auf die gesamte Zeichnung aus: bei einer Zeichnung von Hand oder
mit Excel brauchen nicht gleichviele Daten ob oder unter der Linie liegen, wie bei
der SPSS-Zeichnung. Dies spielt jedoch keine Rolle, da es um die Tendenz geht).
Trendbereinigte P-P-Plots
Dieses Diagramm zeigt die Differenzen zwischen den beobachteten und den
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
124
erwarteten Werten. Wenn die Stichprobe aus der vermuteten Verteilung stammt,
sollten die Punkte in einem horizontalen Streifen um 0 liegen. Es sollte kein Muster
zu erkennen sein. (Vorgehen: wir tragen die Punkte  ni , Hx i   Fx i   ab; auch
hier gilt, dass bei einer Zeichnung mit Excel nicht genau gleich viele Punkt ob und
unter die x-Achse zu liegen kommen, siehe Kommentar oben).
Trendbereinigtes P-P-Diagramm von Schraubenlän
0
Abweichung von Normal
0
0
-0
0.0
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Q-Q-Plots
Bei Q-Q-Plots tragen wir, wie es der Name sagt, Quantile ab. Auf der x-Achse
tragen wir die geordneten, empirischen Daten ab. Auf der y-Achse tragen wir die
1
theoretischen Quantile der empirischen Verteilungsfunktion Hx i   ni  2n
ab (für
1
1  i  n; 2n zählen wir ab, da z.B. das Standardnormalquantil von 1 nicht definiert
1
ist). Wir berechnen damit x in Fx  ni  2n
, d.h.berechnen die Werte der
Umgkehrfunktion von Fx. Wir tragen somit die Punkte x i , F 1 Hx i  in einem
Koordinatennetz ab. Entspricht die Verteilung der Daten dem Modell, sollten die
Punkte ungefähr auf die y  x-Achse zu liegen kommen. (bei Normalverteilungen
werden Q-Q-Plots oft für vorgängig z-standardisierte Daten erstellt).
Am Beispiel der obigen Daten:
Beispiel:
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
125
xi
0.04992132
0.07626878
0.09694301
0.24706014
0.33711828
0.48861922
0.51154522
0.5559821
0.58895487
0.9406725
zi H(zi)
-1.20153572 0.05
-1.10825757 0.15
-1.0350644 0.25
-0.50360334 0.35
-0.18476968 0.45
0.3515905 0.55
0.43275563 0.65
0.59007592 0.75
0.70680973 0.85
1.9519989 0.95
Φ-1(H(zi))
-1.644853
-1.03643288
-0.67449037
-0.38532107
-0.12566147
0.12566147
0.38532107
0.67449037
1.03643288
1.644853
Mit Excel werden die Quantile der Standardnormalverteilung durch
”NORMINV(Hx i ; x ;  ; 1)” berechnet.
Q-Q-Diagramm von Schraubenlängen
1
1
Erwarteter Wert von Normal
1
0
0
0
-0
-.2
0.0
.2
.4
.6
.8
1.0
Beobachteter Wert
Auch hier zeigt sich, dass die Daten kaum normalverteilt sind. (Auf Grund der zu
den P-P-Plots umgekehrten Beschriftung der Achsen ergibt sich eine
spiegelbildliche Punktwolke zu den P-P-Plots).
Trendbereinigte Q-Q-Plots
Es werden die Punkte  x i , x i  F 1 Hx i   abgetragen:
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
126
Trendbereinigtes Q-Q-Diagramm Schraubenlänge
0
Abweichung von Normal
0
0
-0
-0
0.0
.2
.4
.6
.8
1.0
Beobachteter Wert
Die P-P-Plots und die Q-Q-Plots drücken dasselbe auf andere Art aus. Beachten
Sie dabei die unterschiedlichen Skalierungen der Achsen. Beim P-P-Plot tragen wir
Wahrscheinlichkeiten ab. Entsprechend liegen die Punkte im Intervallen [0,1] 
[0,1]. Bei Q-Q-Plots hingegen werden Punkte in der Skala der Daten abgetragen.
Die Punkte streuen also auf der x-Achse wie die Daten und es kann Punkte im
negativen Bereich geben.
Mit SPSS: Graphik, Q-Q-Plot (oder P-P-Plot), Variable eingeben, Verteilung
wählen, ok.
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
127
Übungen:
1) Erstellen Sie von Hand einen P-P-Plot (Q-Q-Plot) für folgende Daten, für die man eine
Normalverteilung vermutet (Gewinne verschieder Anlagen in einem Jahr auf 100
Dollar): 12.1, 13.8, 35.1, 19.3, 17.8, 17.9, 7, 13.3, 14.2, 20.9;
2) Untersuchen Sie mit Hilfe eines P-P-Plots (Q-Q-Plots) (Excel und SPSS), ob der
folgenden Datensatz normal verteilt ist (Verkauf pro Kunde in einer Filiale pro Tag):
16.7090764; 20.350331; 9.49757703; 13.0819701; 15.8324089; 11.0518444;
14.2472014; 19.1787961; 15.8355977; 6.96558361; 9.68912787; 17.0146915;
18.0455811; 7.13073542; 12.2620171; 14.0556059; 20.4693469; 10.4759563;
3.49079246; 17.0248672; 8.07377959; 8.51256487; 5.70229396; 15.6089443;
15.4502649; 6.26185394; 8.84991275; 9.5862209; 13.9361382; 22.3721157;
13.2451837; 10.2205918; 9.88363286; 16.9850175; 9.3665414; 11.4631264;
8.93809311; 12.7620113; 13.9647017; 12.0080272;
3) Untersuchen Sie mit Hilfe eines P-P-Plots (Q-Q-Plots) (Excel und SPSS), ob die
folgenden Daten exponentialverteilt sind (Schraubenlängen). 0.52828951; 1.14054574;
2.41666192; 2.57346307; 5.21889714; 1.98974451; 2.36506952; 0.1376392; 0.8809238;
0.10367222; 0.78430983; 0.32307721; 0.38162831; 0.5893029; 1.92235677;
0.57235211; 0.89260063; 3.85346309; 0.09012127; 5.30014709; 1.01098906;
0.24083929; 1.0902879; 1.03788597; 0.57558138; 0.60578198; 2.0368181; 0.37201537;
0.34162725; 0.7648745; 0.88494973; 2.88791311; 1.51858196; 0.00340302;
4.76449416; 0.7487179; 0.03009279; 4.17205665; 2.0760818; 0.26855188;
4) Erstellen Sie mit Excel vier uniform verteilte Serien von Zufallszahlen (50
Zufallszahlen), so dass gilt: X  U0, 5 Stellen Sie den entsprechenden P-P-Plot
(Q-Q-Plot) dar (Excel liefert Zufallszahlen im Intervall [0, 1]).
5) Erstellen Sie mit Excel uniform verteilte Zufallszahlen (50), so dass X  U3, 10. Wir
nehmen an, Sie wüssten nicht, dass es sich um uniform verteilte Zufallszahlen handelt.
Sie vermuten eine Normalverteilung. Erstellen Sie den P-P-Plot (Q-Q-Plot).
6) Erstellen Sie mit Excel einen Plot der Eckpunkte der empirischen Verteilungsfunktion
der folgenden Zufallszahlen (Zeit bis zum Ausfallen von Maschinen): 0.00796309;
0.01035715; 0.01887473; 0.04201975; 0.07417555; 0.10848376; 0.19346396;
0.19884847; 0.23938679; 0.31927002; 0.42171485; 0.47483774; 0.47770191;
0.48868425; 0.53928661; 0.58079235; 0.60269043; 0.63258499; 0.64245762;
0.65190357; 0.67447831; 0.92996552; 0.97763892; 1.07643373; 1.10892512;
1.23057078; 1.23139329; 1.29979894; 1.33227431; 1.38814792; 1.62531017;
1.77926689; 1.91046378; 2.0367062; 2.2950552; 2.30601712; 2.31086672; 2.50746966;
2.55770944; 2.60612436; 2.62581743; 2.89392323; 2.96469366; 3.0165084;
3.36895465; 3.45288528; 3.47118886; 3.50256492; 3.60976966; 3.72613945;
3.76135495; 3.8909708; 3.93345011; 3.978998; 3.98298587; 4.53349737; 4.96503135;
5.53090861; 5.58186665; 7.10029001
Zu welcher Vermutung verleitet Sie der Plot. Überprüfen Sie Ihre Vermutung.
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
128
Lösungen
1) Wir erstellen die z-Transformation der Daten (nur nötig, wenn man mit Tabelle
arbeitet): (x  17. 14222138;   7. 486475804
zi
-0.6669833
-0.44753831
2.39782445
0.29079182
0.09014831
0.09978538
-1.35413302
-0.5154508
-0.39314836
0.49870382
zi
-1.35413302
-0.6669833
-0.5154508
-0.44753831
-0.39314836
0.09014831
0.09978538
0.29079182
0.49870382
2.39782445
H (z i)
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Φ (z i) m it T abelle
0.0885
0.2546
0.305
0.33
0.3483
0.5359
0.5398
0.6141
0.6879
0.99158
P-P-Diagramm von Betrag
Φ (z i) m it Ex cel
0.08784703
0.25239133
0.30311901
0.32724324
0.347105
0.53591538
0.5397427
0.61439467
0.69100598
0.99175362
Trendbereinigtes P-P-Diagramm Betrag
1
0
1
Abweichung von Normal
Erwartete Kum. Wahrsch.
0
1
0
0
0.00
.25
.50
.75
1.00
0
-0
0.0
Beobachtete Kum. Wahrsch.
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Q-Q-Diagramm Betrag
Trendbereinigtes Q-Q-Diagramm Betrag
30
8
6
4
Abweichung von Normal
Erwarteter Wert von Normal
20
10
0
0
10
Beobachteter Wert
20
30
40
2
0
-2
-4
0
10
20
30
40
Beobachteter Wert
Die Daten sind vermutlich nicht normalverteilt. Auch hier gilt, dass wir zuwenig
Daten haben. Die folgenden Übungen weisen grössere Datensätze auf und
müssen entsprechend mit Computer gelöst werden.
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
129
2) Wir erhalten:
P-P-Diagramm Verkauf
Trendbereinigtes P-P-Diagramm Verkauf
1
0
0
0
Abweichung von Normal
Erwartete Kum. Wahrsch.
1
1
0
0
0.00
.25
.50
.75
1.00
0
0
-0
-0
-0
0.0
Beobachtete Kum. Wahrsch.
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Q-Q-Diagramm Verkauf
Trendbereinigtes Q-Q-Diagramm Verkauf
30
2
1
1
Abweichung von Normal
Erwarteter Wert von Normal
20
10
0
0
Beobachteter Wert
10
20
30
0
-1
-1
0
10
20
30
Beobachteter Wert
Die Daten sind nach den P-P- und Q-Q-Plots ziemlich normalverteilt, nach den
trendbereichnigten Plots ergibt sich zwar in einem Bereich eine systematische
Abweichung. Diese gilt jedoch nicht für den gesamten Bereich. Wir würden die
Normalverteilungsannahme gelten lassen (die Daten entstammen einem Satz
normalverteilter Zufallszahlen).
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
130
3) Wir erhalten:
P-P-Diagramm Schrauben
Trendbereinigtes P-P-Diagramm Schrauben
1
0
0
0
Abweichung von Exponential
Erwartete Kum. Wahrsch.
1
1
0
0
0.00
.25
.50
.75
1.00
0
0
0
-0
-0
-0
0.0
Beobachtete Kum. Wahrsch.
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Q-Q-Diagramm Schrauben
Trendbereinigtes Q-Q-Diagramm Schrauben
7
1
6
1
1
5
Abweichung von Exponential
Erwarteter Wert von Exponential
.2
4
3
2
1
0
-1
-1
0
1
2
3
4
5
Beobachteter Wert
6
7
0
0
0
-0
-0
-1
-1
-1
0
1
2
3
4
5
6
Beobachteter Wert
Die Daten sind exponentialverteilt.
4) Bei der Übung geht es darum, ein Gefühl dafür zu bekommen, wie
Zufallszahlen, die zu einer bestimmten Verteilung gehören, um die entsprechende
theoretische Verteilung streuen. Die folgenden P-P-Plots sind das Resultat von
Zufallszahlen. Entsprechend werden Sie nicht dasselbe Resultat erhalten. Es
werden nur die P-P-Plots geliefert:
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
131
P-P-Diagramm von Gleich von Satz 1
Trendbereinigtes P-P-Diagramm Satz 1
1
0
0
1
Abweichung von Gleich
Erwartete Kum. Wahrsch.
0
1
0
0
0.00
.25
.50
.75
1.00
0
0
-0
-0
0.0
Beobachtete Kum. Wahrsch.
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Diesen Satz würden wir als uniform bezeichnen (mit Zweifeln jedoch)
Trendbereinigtes P-P-Diagramm Satz 2
0
1
0
Abweichung von Gleich
Erwartete Kum. Wahrsch.
P-P-Diagramm von Gleich von Satz 2
1
1
0
0
0.00
.25
.50
.75
1.00
0
-0
-0
0.0
Beobachtete Kum. Wahrsch.
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Diesen Satz würden wir nicht als uniform verteilt bezeichnen.
P-P-Diagramm von Gleich von Satz 3
Trendbereinigtes P-P-Diagramm Satz 3
1
0
0
0
1
Abweichung von Gleich
Erwartete Kum. Wahrsch.
0
1
0
0
0.00
.25
.50
Beobachtete Kum. Wahrsch.
.75
1.00
0
0
0
-0
-0
-0
0.0
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Diese Satz würden wir knapp als uniform verteilt bezeichnen.
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
132
P-P-Diagramm von Gleich von Satz 4
Trendbereinigtes P-P-Diagramm Satz 4
1
0
0
0
1
Abweichung von Gleich
Erwartete Kum. Wahrsch.
0
1
0
0
0.00
.25
.50
.75
1.00
0
-0
-0
-0
-0
0.0
Beobachtete Kum. Wahrsch.
.2
.4
.6
.8
1.0
Beobachtete Kum. Wahrsch.
Diesen Satz würden wir als uniform verteilt bezeichnen.
5) Je nach den erhaltenen Zufallszahlen ergibt sich ein anderer P-P-Plot. Es ist
durchaus möglich, dass Sie einen Plot erhalten, der mit einer Normalverteilung
verträglich wäre. Typisch ist die S-förmige Struktur um die yx-Achse.
P-P-Diagramm Verkaufszahlen
Trendbereinigtes P-P-Diagramm Verkaufszahle
1
0
Abweichung von Normal
Erwartete Kum. Wahrsch.
1
1
0
0
0.00
.25
.50
.75
1.00
0
-0
0.0
Beobachtete Kum. Wahrsch.
10
1
8
1
6
4
2
0
2
Beobachteter Wert
4
6
.4
.6
.8
1.0
Trendbereinigtes Q-Q-Diagramm Verkaufszahl
2
Abweichung von Normal
Erwarteter Wert von Normal
Q-Q-Diagramm Verkaufszahlen
12
0
.2
Beobachtete Kum. Wahrsch.
8
10
12
0
-1
-1
-2
3
4
5
6
7
8
9
10
Beobachteter Wert
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
133
6)
1.2
1
0.8
0.6
0.4
0.2
0
0
2
4
6
8
Die Daten könnten exponentialverteilt sein. Wir überprüfen dies:
P-P-Diagramm Ausfallzeit
Trendbereinigtes P-P-Diagramm Ausfallzeit
1
0
0
0
Abweichung von Exponential
Erwartete Kum. Wahrsch.
1
1
0
0
0.00
.25
.50
.75
1.00
0
0
0
-0
-0
-0
0.0
Beobachtete Kum. Wahrsch.
10
3
8
2
6
4
2
0
-2
2
Beobachteter Wert
4
6
.6
.8
1.0
Trendbereinigtes Q-Q-Diagramm Ausfallzeit
3
Abweichung von Exponential
Erwarteter Wert von Exponential
Q-Q-Diagramm Ausfallzeit
0
.4
Beobachtete Kum. Wahrsch.
12
-2
.2
8
10
12
14
2
1
1
0
-1
-2
0
2
4
6
8
10
12
14
Beobachteter Wert
Es scheint keine systematische Abweichung zu geben. Die Daten können als
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
134
exponentialverteilt betrachtet werden.
___________________________________________________________________
PPplots.tex
2. HSW Siders P.R.
135
6. Zufallszahlen und stetige Verteilungen
Excel liefert uns Zufallszahlen z i aus einer uniform verteilten Zufallsvariable Z
 U0, 1 (Befehl: Zufallszahl). Es ist manchmal nützlich, anders verteilte
Zufallszahlen zur Verfügung zu haben. Um Zufallszahlen x i aus X  Ua, b zu
erhalten, berechnen wir x i  z i b  a. (Begründung: bei x i  z i b wird 0 zu 0 und 1 zu
b. Damit erhalten wir ein uniform verteilte Daten zwischen 0 und b. Nun
verschieben wir diese noch um a nach links oder nach rechts). Für nicht uniform
verteilte Verteilungen gibt es ein ebenso einfaches Verfahren, sofern die
Umkehrfunktion F 1 der Verteilungsfunktion F existiert.
Theorem: Seien z i uniform verteilte Zufallszahlen aus Z  U0, 1 und
F 1 z i   x i ,
dann gilt: die Zufallszahlen x i sind F-verteilt.
Beispiel Exponentialverteilung: Die Umkehrfunktion von Fx  1  e x ist:
ln1x
F 1 x  
Denn: y  1  e x  y  1  e x  1  y  e x 
ln1y
lny  1  x ln e  x  x   .
Durch Variablentausch erhalten wir das obige Resultat.
Für X  Exp0. 5 erhalten wir somit: F 1 x 
ln1x
0.5
Wir berechnen die exponentialverteilten Zufallszahlen e i also durch:
ei 
ln1x i 
0.5
Am Beispiel konkreter, geordneter Zahlen:
uniform verteile
Zufallszahlen
exponential
verteilte
Zufallszahlen
(λ = 0.5)
0.06435278
0.12196884
0.21450318
0.25610738
0.31724025
0.42785353
0.66084151
0.73581462
0.84670575
0.94889655
0.13303355
0.2601464
0.48287774
0.59171717
0.76322449
1.11672051
2.16257553
2.66220845
3.75079194
5.94780637
___________________________________________________________________
Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R.
135
Wir veranschaulichen das Resultat mit einer Graphik.
Beweis des Theorems: Es gilt (siehe Graphik): z i  Fa  z genau dann, wenn
F 1 z i   x i  a. Für die entsprechenden Wahrscheinlichkeiten gilt dann:
PZ  z  Fa  PX  a  F 1 z. Da dies für alle a gilt, haben die
Zufallszahlen x i die richtige Verteilung: Fx  PX  x. q.e.d.
F (x ) = 0 .8 x
2
z = F (a)
a = F
-1
(z)
z i  Fx i   z genau dann, wenn F 1 z i   x i  a
Die Verteilungsfunktion der Standardnormalverteilung ist nicht als Formel
angebbar. Entsprechend können wir die Umkehrfunktion nicht berechnen. Wir
können jedoch näherungsweise standardnormalverteilte Zufallszahlen mit Hilfe der
folgenden Formel berechnen:
n
 x i  n2
yj 
i1
n
12
.
n Anzahl der Zufallszahlen, die für die Berechnung von einer
standardnormalverteilten Zufallszahl y j verwendet wird; 1  i  n
___________________________________________________________________
Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R.
136
(Bei der Berechnung von standardnormalverteilten Zufallszahlen ordnen wir somit
nicht jeder uniform verteilten Zufallszahl eine normalverteilte Zufallszahl zu,
sondern einer durch Operationen transformierten Summe von uniform verteilten
Zufallszahlen eine normalverteilte Zufallszahl! Im nächsten Kapitel wird diese
Berechnungsart gerechtfertigt).
Übungen
1) Berechnen Sie mit Hilfe von Excel vier Sätze von exponentialverteilten Zufallszahlen (je
50) und erstellen Sie einen Plot der empirischen Verteilungsfunktion. Diskutieren Sie die
Resultate mit Ihrem Tischnachbarn. (  2
2) Berechnen Sie mit Hilfe von Excel einen Satz (60) von F-verteilten Zufallszahlen, wobei
F im Intervall, wo Fx  0 und Fx  1 durch F X x  0. 005x 2 bestimmt ist.
Zeichnen Sie einen Plot der empirischen Verteilungsfunktion und beurteilen Sie die
Anpassung an das Modell F X x  0. 005x 2 .
3) Berechnen Sie einen Satz von 40 normalverteilten Zufallszahlen, indem sie jeweils einen
Satz von 50 uniform verteilten Zufallszahlen (Excel) verwenden. Erstellen Sie den Plot
der Eckpunkte der empirischen Verteilungsfunktion und beurteilen Sie die Anpassung an
das Modell.
4) Als Vorarbeit für das nächste Kapitel: Berechnen Sie
(a) 20 Sätze von exponentialverteilten Zufallszahlen (je 50,   1
(b) Berechnen Sie den empirischen Mittelwert x i .für jeden der 20 Sätze
(c) Zeichnen Sie einen Plot der empirischen Verteilungsfunktion der x i und
kommentieren Sie das Ergebnis.
(d) Berechnen Sie PX  0. 7. (Verwenden Sie die empirischen Werte für den
Mittelwert und die Standardabweichung).
(e) Berechnen Sie P0. 9  X  1. 1.
(f) Sind die  i normalverteilt?
5) Eine Spanplattenfabrik misst während einiger Zeit die Dicke der produzierten
Spanplatten und kommt zu folgendem Ergebnis: (siehe Exceldatei: Aufgabe 5
Zufallszahlen).
a) Finden Sie eine passende Verteilung für die Daten.
b) Platten, die dünner als 1. 9 cm sind, können dem Auftraggeber nicht verkauft werden.
Wie gross ist der Ausschuss bei künftiger Produktion im Durchschnitt?
c) Berechnen Sie P1. 85 cm  X  2. 15 cm
6) Eine Firma überlegt die Anschaffung von neuen Maschinen, um die Verluste durch
ungenaue Verpackung zu verringern. Dabei geht es um die Abfüllung von Kaffee. Die
Gläser sollen möglichst genau 500 g Kaffee enthalten. Gläser, die weniger als 495
Gramm enthalten, dürfen nicht verkauft werden. Gläser, die mehr als 500 g enthalten,
verbleiben im Verkauf, führen aber zu Verlusten, da nur 500 g verrechnet werden dürfen.
Auf Grund eines Experimentes wurden folgende Daten für die Maschine A und folgende
für die Maschine B ermittelt (Siehe Excel-Datei Aufgabe 6 Zufallszahlen). Die Maschine
A kostet 50’000, die Maschine B 70’000. Ab welcher Menge ist die Maschine B
günstiger, wenn das Gramm nicht berechneten Kaffees 0.007 Fr. kostet und ein
ausgemustertes Glas Kosten von 0.02 Franken verursacht.
7) Berechnen Sie die mittlere Abweichung von exponentialverteilten Zufallszahlen von
___________________________________________________________________
Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R.
137
ihrem Modell ( Mittelwert der Differenzen zwischen den Werten der theoretischen und
der empirischen Verteilungsfunktion) (  0. 5 für 10, 50, 100 und 1000 Daten.
Diskutieren Sie das Resultat.
Lösungen
1 Siehe Exceldatei: Lösung Übung 1 Zufallszahlen
2 Fx  0. 005x 2 bestimmt die Funktion im folgenden Intervall: [0, 14.142], da
Fx  1  0. 005x 2 nach x aufgelöst 14. 142 ergibt. Zudem verläuft die Kurve durch 0.
x
. Um aus uniform verteilten
Wenn Fx  0. 005x 2 , dann ist F 1 x  2 0.005
zi
Zufallszahlen z i F-verteilte zu erhalten, berechnen wir: x i  2 0.005
 14. 142 z i
Für eine Lösung mit spezfischen Zufallszahlen siehe Exceldatei: Lösung Übung 2
Zufallszahlen
3 Siehe Exceldatei: Lösung Übung 3 Zufallszahlen
4) Siehe Exceldatei: Lösung Übung 4 Zufallszahlen
(c) Der Mittelwert der Mittelwerte stellt eine Realisierungen einer Zufallsvariable dar.
Ebenso die empirische Varianz der Mittelwerte. Für den Mittelwert der Mittelwerte
erhalten wir: 1. 001215947 und für die Standardabweichungder Mittelwerte
0. 118842402.
Die Punkte (siehe Zeichnung) passen zu einer Normalverteilung.
Punkteplot der Verteilungsfunktion
P-P-Plot
1.2
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
0
0.5
(d) PX  0. 7  
1
0.71.001215947
0.118842402
1.5
0
0
0.2
0.4
0.6
0.8
1
 0. 005629082
(e) P0. 8  X  1. 2  PX  1. 2  PX  0. 8  0. 952803829  0. 045215084 
 0. 907 59
(f) Die  i Daten passen zu einer Normalverteilung:
___________________________________________________________________
Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R.
138
P - P - P l o t ( n o r m a l)
empirische Verteilungsfunktion
-1.5
-1.3
-1.1
-0.9
-0.7
1
0 .9
0 .8
0 .7
0 .6
0 .5
0 .4
0 .3
0 .2
0 .1
0
1
0.8
0.6
0.4
0.2
0
-0.5
0
0 .2
0 .4
0 .6
0 .8
5 Wir erhalten den P-P-Plot:
1
0 .9
0 .8
0 .7
0 .6
0 .5
0 .4
0 .3
0 .2
0 .1
0
0
0 .2
0 .4
0 .6
0 .8
1
Die Daten sind offensichtlich normalverteilt. Entsprechend können wir die
Normalverteilung verwenden, um die entsprechenden Wahrscheinlichkeiten zu
berechnen.
1.92.0066
 0. 184202614 (ca: 18.4%)
b) PX  1. 9 cm   0.118514961
2.152.0066
1.852.0066
c) P1. 85 cm  X  2. 15 cm   0.118514961
  0.118514961

0. 886855468  0. 093192047  0. 793 66
6) Ab einer Menge von 6259540 Gläsern. Bei den auszusondernden Gläsern genügt es,
die Menge der produzierten Gläser * PX  498 * die Kosten pro Glas zu rechnen.
Bei den Kosten, die durch Überfüllung verursacht werden, begnügen wir uns mit einer
Näherung: Wir berücksichtigen nur ganze Gramm. Dazu müssen wir Pn  1  X  n
für alle relevanten n : 501, 502, 503, etc berechnen.
Diese Zahlen multiplizieren wir mit der Anzahl Gläser, um den Anteil der Gläser zu
erhalten, die in die entsprechende Kategorie fallen. Die Anzahl der Gläser pro Kategorie
multiplizieren wir dann mit der Anzahl Gramm, die zuviel sind. Dieses Resultat
mulitplizieren wir mit den Kosten pro Gramm. Das Endresultat wurde durch Versuchen
ermittelt (siehe Lösung Übung 6 Zufallszahlen).
7) siehe Excel-Datei: Lösung Übung 7 Zufallszahlen. Für das konkrete Beispiel erhalten
wir die folgenden mittleren Abweichungen: für 10: 0.086775863; für 50: 0.041784468;
für 100: 0.024725104; für 1000: 0.006701792
Je mehr Daten wir haben, desto kleiner ist die mittlere Abweichung vom Modell (Gesetz
der grossen Zahlen). Daraus folgt dann: je mehr Daten wir haben, desto kleiner muss die
mittlere Abweichung sein, damit wir die Daten als zu einem Modell passend beurteilen
___________________________________________________________________
Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R.
139
1
dürfen.
Lernziele
- P-P-Plots von Hand, mit Excel und mit SPSS zeichnen können. Erläutern können,
was P-P-Plots ausdrücken.
- Q-Q-Plots mit SPSS zeichnen können. Erkläutern können, was Q-Q-Plots
ausdrücken.
- Wissen, dass (i) Daten aus einer spezifischen Verteilung immer um die ideale
Verteilung streuen. Eine zu genaue Anpassung ist unwahrscheinlich und deutet auf
Manipulationen hin. (ii) solange es nicht deutlich systematische Abweichungen gibt
(z.B. S-Form), kann man i.A. das Modell als zu den Daten passend betrachten (iii)
je mehr Daten, desto kleiner muss die Streuung um die x-y-Achse sein.
- Wissen, dass für beliebig verteilte Datensätze mit Hilfe von Zufallszahlen
entsprechend verteiltes Datenmaterial ”fabriziert” werden kann, sofern die
Umkehrfunktion der Verteilungsfunktion existiert. Diese existiert immer, wenn die
Verteilungsfunktion in geschlossener Form mit Hilfe einer Gleichung ausgedrückt
werden kann und wenn sie strikt monoton steigend ist. Für einfache Funktionen die
Umkehrfunktion berechnen und entsprechend verteilte Datensätze mit Hilfe von
Zufallszahlen produzieren können.
- Uniform-, exponential- und normalverteilte Datensätze mit Hilfe von Zufallszahlen
von Hand und mit Hilfe von Excel herstellen können.
___________________________________________________________________
Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R.
140
7. Verteilung des Mittelwertes
Bei der Einführung von Zufallsvariablen haben wir gesehen, dass nicht nur die
Ausprägungen von Daten als Werte von Zufallsvariablen betrachtet werden
können, sondern auch etwa Kennzahlen wie der Mittelwert, die Varianz, die
Standardabweichung oder der Median. Ebenso könnte man weitere Zahlen, die auf
Grund von Daten berechnet werden, als Werte von Zufallsvariablen auffassen (z.B.
die Summe der quadrierten Abweichungen der Daten vom Modell, die
durchschnittliche Abweichung der Daten vom Modell, etc.). Kennen wir von solchen
Zufallsvariablen die Verteilung, ist dies für die Teststatistik, wie wir sehen werden,
von besonderer Bedeutung. Um entsprechende Modelle und Methoden
einzuführen, sind ein paar Vorüberlegungen und einige Theoreme nötig.
Das Produkt von Ereignissen aus verschiedenen Stichprobenräumen
Wir betrachten ein Beispiel: Wie gross ist die Wahrscheinlichkeit, dass beim
Werfen zweier Würfel, der erste die 6 und der zweite Würfel die 5 zeigen? Wir
können die Situation von verschiedenen Seiten her anschauen:
(1) Der Stichprobenraum S besteht aus den Zahlenpaaren 1,1, 1,2,...,6,6
(d.h. S   i, j : i, j  N 6 . Es gilt:|S|  36. Das Ereignis E, ”Es werden eine 6 und
eine 5 in dieser Reihenfolge geworfen”, besteht aus dem Element  6, 5  S. Wir
setzen gleiche Wahrscheinlichkeit der Elementarereignisse voraus. Wir haben also
36 mögliche und 1 günstiges Ergebnis, d.h. PE  361 .
(2) Wir können die Fragestellung aber auch unter einem anderen Gesichtspunkt
betrachten: Sei S 1  1, 2, 3, 4, 5, 6 der Stichprobenraum fürs Werfen mit dem
ersten Würfel und S 2  1, 2, 3, 4, 5, 6 der Stichprobenraum fürs Werfen mit dem
zweiten Würfel. Damit gilt S  S 1  S 2 (S ist das kartesische Produkt von S 1 und S 2 ).
Eine bestimmte Teilmenge der Ereignisse von S können wir unmittelbar mit Hilfe
der Ereignisse von S i ausgedrücken. Ist E   6, 5   S, so ist mit E 1  6
und E 2  5, E  E 1  E 2  6  5. Fürs Beispiel gilt nun offenbar:
PE  361  16  16  P 1 E 1   P 2 E 2 .
wobei P i die Wahrscheinlichkeitsverteilungen auf PS i  sind (PS i   Potenzmenge
von S i .
Ist E   2, 3 ,  5, 6 ,  2, 6 ,  5, 3   S , so gilt:
PE  364  P 1 2, 5  P 2 3, 6  26  26  364 .
Wobei wiederum gilt: E  E 1  E 2  2, 5  3, 6.
PE 1  E 2   P 1 E 1   P 2 E 2  gilt nicht für das kartesische Produkt beliebiger
Stichprobenräume, sondern nur dann, wenn die Ereignisse der unterschiedlichen
Stichprobenräume sich gegenseitig nicht beeinflussen. Würde sich beim Würfeln
von 6 im ersten Wurf für das Würfeln einer 5 im zweiten Wurf eine andere
Wahrscheinlichkeit ergeben als beim Würfeln einer 5 im ersten Wurf, so wären die
Ereignisse nicht unabhängig.
Dies führt uns zur folgenden Definition:
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
141
Definition: Für A  S 1 und B  S 2 und P i Wahrscheinlichkeitsverteilung
auf PS i  : A und B sind unabhängig genau dann, wenn
PA  B  P 1 A  P 2 B.
Diesen Unabhängigkeitsbegriff verwenden wir auch für Zufallsvariablen:
Definition: Seien P i Wahrscheinlichkeitsverteilungen auf die
Wertebereiche S X i der Zufallsvariablen X i . Zwei Zufallsvariablen X 1 und X 2
sind unabhängig, genau dann, wenn für alle Ereignisse A  S X 1 und
B  S X 2 gilt: PA  B  P 1 A  P 2 B.
Man beachte, dass es Ereignisse von S (S   i, j : i, j  N 6  gibt, die sich nicht
unmittelbar durch E 1  E 2 mit E 1  S 1 und E 2  S 2 ausdrücken lassen. z.B. Ist
E   2, 3 ,  5, 6   S, so finden wir keine Teilmengen von S 1 und S 2 , so dass
E deren kartesisches Produkt ist. Es gilt jedoch: E  2  3  5  6 und
PE  362  P 1 2  P 2 3  P 1 5  P 2 6. Alle Ereignisse von S lassen
sich derart als Vereinigungsmengen von kartesischen Produkten E 1  E 2 (mit
E 1  S 1 , E 2  S 2  ausdrücken.
Beispiele: (1) Wir betrachten drei Urnen. Die erste enthalte 50 Steine, die von 1
bis 50 durchnummeriert sind. Die zweite enthalte 35 Steine, die von 100 bis 134
durchnummeriert sind, die dritte enthalte 10 Steine, die von 1001 bis 1010
durchnummeriert sind. Wir setzen jeweils gleiche Wahrscheinlichkeiten der
Elementarereignisse voraus. Wir ziehen aus jeder Urne einen Stein. Wieviel
beträgt die Wahrscheinlichkeit,  25, 104, 1002  zu ziehen?.
P 25, 104, 1002   P25  104  1002. Es ist vernünftig, davon
auszugehen, dass die Ergebnisse der verschiedenen Züge sich gegenseitig nicht
beeinflussen. Somit gilt dann:
P25  104  1002  P 1 25  P 2 104  P 3 1002  501  351  101 
1
17 500
(2) Es werde aus einer Urne mit 99 Steinen (mit 99 verschiedenen Zahlen i:
i  N 99  zweimal je ein Stein gezogen (mit Zurücklegen, gutes Durchmischen nach
jedem Zug). Wie hoch ist die Wahrscheinlichkeit eine 3 und eine 4 zu erhalten
(Reihenfolge spielt keine Rolle). S i  N 99 . S  S 1  S 2 .
E   3, 4 ,  4, 3   3  4  4  3
PE  P3  4  P4  3  P 1 3  P 2 4  P 1 4  P 2 3 
1
1
1
2
 991  99
 99
 9801
(wir setzen wiederum voraus, dass die Ergebnisse
99
des ersten Zuges die Wahrscheinlichkeit des Ergebnisses des zweiten Zuges nicht
beeinflussen).
Die Summe von Zufallsvariablen
Eine besondere Rolle für die Verteilung von Mittelwerten spielt die Summe von
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
142
Zufallsvariablen, berechnen wir doch Mittelwerte u.a. durch Summierung der Daten
eines Datensatzes. Bei der Summenbildung im Rahmen der
Wahrscheinlichkeitstheorie interessiert dabei die Wahrscheinlichkeit der jeweiligen
Summen, unabhängig vom Zustandekommen dieser Summe. Entsprechende
Beispiele haben wir bereits gesehen. Seien X i (i  1, 2 die Zufallsvariablen, die
den verschiedenen Augenzahlen beim Würfeln (zwei Würfel) jeweils die
entsprechende Zahl zuordnen. Wir setzen gleiche Wahrscheinlichkeit der
Elementarereignisse der S i voraus und Unabhängigkeit der Zufallsvariablen. Es ist
möglich, spezifische Summen auf verschiedene Arten zu erlangen: so gilt z.B.
1  5  2  4  6. Als Zufallsvariable Š (Š für ”Summe”) erhalten wir damit:
Š   1, 1 , 2 ,  1, 2 , 3 ,  1, 3 , 4 ,  1, 5 , 6 ,  1, 6 , 7 ,
 2, 1 , 3 ,  2, 2 , 4 ,  2, 3 , 5 ,  2, 4 , 6 ,  2, 5 , 7 ,  2, 6 , 8 ,
 3, 1 , 4 ,  3, 2 , 5 ,  3, 3 , 6 ,  3, 4 , 7 ,  3, 5 , 8 ,  3, 6 , 9 ,
 4, 1 , 5 ,  4, 2 , 6 ,  4, 3 , 7 ,  4, 4 , 8 ,  4, 5 , 9 ,  4, 6 , 10 ,
 5, 1 , 6 ,  5, 2 , 7 ,  5, 3 , 8 ,  5, 4 , 9 ,  5, 5 , 10 ,  5, 6 , 11 ,
 6, 1 , 7 ,  6, 2 , 8 ,  6, 3 , 9 ,  6, 4 , 10 ,  6, 5 , 11 ,  6, 6 , 12 
Somit definieren wir die Addition von Zufallsvariablen nicht mit Hilfe der
”punktweisen Addition” (d.h. f  gx  fx  gx), sondern mit:
X 1 x  X 2 y  X 1  X 2  x, y   x  y. (für x  S 1 und y  S 2 .
Die Wahrscheinlichkeitsfunktion von Š ist nun bestimmt durch
1
(i)  i, j   36
( P i, j  (Unabhängigkeit der Zufallsvariablen und
gleiche Wahrscheinlichkeit der Elementarereignisse) und
(ii) Anzahl der geordneten Paare, die eine spezifische Summe ergeben.
Der Wertebereich von Š  X 1  X 2  2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Im obigen Fall erhalten wir die folgende Wahrscheinlichkeitsfunktion:
3
2
 2, 361 ,  3, 36
,  4, 36
,  5, 364 ,  6, 365 ,  7, 366 ,
3
4
 8, 365 ,  9, 36
,  10, 36
,  11, 362 ,  12, 361 .
W-Funktion der Zufallsvariable Xi
(Würfel)
W-Funktion der Zufallsvariable X1+X2
0.16
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.14
0.12
P(x)
P(x)
0.18
0.1
0.08
0.06
0.04
0.02
0
0
1
2
3
4
x
5
6
7
0
1
2
3
4
5
6
7
8
9 10 11 12 13
x
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
143
Für die Wahrscheinlichkeitsverteilung der Summe von Zufallsvariablen berechnen
wir somit:
Theorem 1: Seien X 1 und X 2 zwei Zufallsvariablen, dann ist die Verteilung von
s
Š  X 1  X 2 bestimmt durch PŠ  s  PX 1  k und X 2  s  k
k0
Wenn s  5, müssen wir somit alle k berücksichtigen, so dass k  s  k  s. Wenn
1, 2, 3, 4, 5 als Werte des Wertebereichs von S vorkommen, wären dies 1 (denn
1  4  5); 2 (denn 2  3  5); 3 (denn 3  2  5); 4 ( denn 4  1  5).
Im Würfelbeispiel gehört die Summe zweier Zufallsvariablen nicht zur gleichen
Familie von Verteilungen wie die Summanden. Dies gilt jedoch nicht für alle
Verteilungen. Wir können darauf hinweisen, dass die Summe zweier unabhängiger,
bernoulli-verteilter Zufallsvariable X i mit X i  B1, 0. 5 eine Zufallfallsvariable ergibt,
die binomialverteilt ist:
Der Wertebereich von X i  0, 1.
Definitionsbereich von X 1  X 2   0, 0 ,  0, 1 ,  1, 0 ,  1, 1 
Š  X 1  X 2   0, 0 , 0 ,  0, 1 , 1 ,  1, 0  1 ,  1, 1 , 2 .
Wertebereich von Š  0, 1, 2. Wir erhalten die folgende
Wahrscheinlichkeitsfunktion: (wir setzen Gleichwahrscheinlichkeit der
Elementarereignisse von X i und Unabhängigkeit von X i voraus):
 0, 14 ,  1, 12 ,  2, 14 
Damit gilt: Š  X 1  X 2  B2, 0. 5, wie Sie kontrollieren können.
Ohne Beweis halten wir für unabhängige Zufallsvariablen X i fest:
Theorem 2: Für X 1  Bn, p und X 1  Bm, pgilt: X 1  X 2  Bm  n, p
Für X 1  P 1  und X 2  P 2  gilt: X 1  X 2  P 1   2 
Für X 1  N0,  21  und X 2  N0,  22 gilt: X 1  X 2  N0,  21   22 
Es folgen ein paar für die weitere Entwicklung wichtige Theoreme: Dabei
verwenden wir statt  X die Bezeichnung EX und statt  X die Bezeichung VX.
WX ist der Wertebereich der Zufallsvariable X.
Theorem 3: Ea  a (a ist eine beliebige reelle Zahl).
Beweis: a ist eine konstante Funktion. Es handelt sich somit um eine Zufallsvariable, die
allen Werten des Stichprobenraums dieselbe Zahl a zuordnet. In die Definition
EX   xPX  x eingesetzt erhalten wir:
xWX
Ea   aPX  a  a  PX  a  a
xWX
xWX
Denn  PX  a  1 (laut Wahrscheinlichkeitstheorie ist die Summe der
xWX
Wahrscheinlichkeiten aller Werte der Zufallsvariable bei diskreten Zufallsvariablen mit 1
identisch). )
Theorem 4: EEX  EX
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
144
Beweis: EX ist eine Konstante. Laut Theorem 3 gilt damit der Satz.
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
145
Theorem 5: EbX  bEX
(b  R
Beweis: EbX   bxPbX  bx 
xWX
b  xPbX  bx
xWX
Nun ist bX  bx  X  x
.
Somit gilt dann: b  xPbX  bx  b  xPX  x  bEX.
xWX
xWX
Ohne Beweis halten wir fest:
Theorem 6: EX  Y  EX  EY
Theorem7: Ea  bX  a  bEX
Beweis: Ea  bX

Theorem 6
(a, b  R, b  0
Ea  EbX

Theoreme 3,5
a  bEX
Theorem 8: EXEY  EYEX
Beweis: Da EY eine Konstante ist, gilt der Satz unmittelbar mit Satz 3 und der
Kommutativität der Multiplikation.
Theorem 9: VX  EX  EX 2 
Beweis: (i) VX   x  EX 2 PX  x
xWX
(ii) Ex  EX 2    x  EX 2 P X  EX 2  x  EX 2
2
xWX
Nun ist: X  EX  x  EX 2  X  EX  x  EX  X  x
Damit erhalten wir:
 x  EX 2 P X  EX 2  x  EX 2 
xWX
 x  EX 2 PX  x
xWX

VX
siehe (i)
Theorem 10: VX  EX 2   EX 2
Beweis: VX  EX  EX 2   E X 2  2XEX  EX 2

Theorem 6
2
EX 2   E2XEX  EEX 2  EX 2   2EXEX  EX
(der zweite Ausdruck durch Anwendung der Theorem 3 und 5. EX 2 ist eine
Konstante. Somit ist EEX 2   EX 2 . Somit gilt:
EX 2   2EXEX  EX 2  EX 2   2EX 2  EX 2  EX 2   EX 2
Theorem 11: Va  0
(a  R
Beweis: Va  Ea 2   Ea 2  a 2  a 2  0
Theorem 12: VbX  b 2 VX
(b  R
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
146
Beweis: VbX  EbX 2   EbX 2   Eb 2 X 2   bEX 2 
b 2 EX 2   b 2 EX 2  b 2 EX 2   EX 2   b 2 VX.
Theorem 13: Va  bX  b 2 VX
(b, a  R, b  0
Beweis: Va  bX  EEa  bX 2   Ea  bX 2 
(i) Ea  bX 2   Ea 2  2abX  b 2 X 2   a 2  2abEX  b 2 EX 2 
(ii) Ea  bX 2  a  bEX 2  a 2  2abEX  b 2 EX 2
Somit gilt: Ea  bX 2   Ea  bX 2  b 2 EX 2   b 2 EX 2 
b 2 EX 2   EX 2   b 2 VX
Definition Kovarianz: KOVX 1 X 2   EX 1 X 2   EX 1 EX 2 
Theorem 14: KOVX 1 X 1   VX 1 
Beweis: Folgt unmittelbar aus der Definition der Kovarianz durch Einsetzen.
Theorem 15: KOVX 1 X 2   0 genau dann, wenn EX 1 X 2   EX 1 EX 2 
Beweis: folgt unmittelbar aus der Definition:
Definition:Wir sagen: X 1 und X 2 sind unkorreliert genau dann, wenn
KOVX 1 X 2   0.
Für die Varianz können wir folgendes Resultat festhalten:
Theorem 16: VX 1  X 2   VX 1   VX 2   KOVX 1 X 2 
Beweis: VX 1  X 2   EX 1  X 2  2   EX 1  X 2  2 
EX 21  2X 1 X 2  X 22   EX 1   EX 2  2 
EX 21   2EX 1 X 2   EX 22   EX 1  2  2EX 1 EX 2   EX 2  2 
EX 21   EX 1  2  EX 22   EX 2  2  2EX 1 X 2   EX 1 EX 2  
VX 1   VX 2   2KOVX 1 X 2 .
Theorem 17: Wenn X 1 und X 2 unkorreliert sind, dann VX 1  X 2   VX 1   VX 2 
Beweis: Seien X 1 und X 2 unkorreliert. Damit gilt: KOVX 1 X 2   0
Und VX 1  X 2   VX 1   VX 2   2KOVX 1 X 2   VX 1  X 2   VX 1   VX 2 
Ohne Beweis halten wir fest:
Theorem 18: Wenn X 1 und X 2 unabhängig sind, dann gilt: EX 1 X 2   EX 1 EX 2 
Theorem 19: Wenn X 1 und X 2 unabhängig sind, dann sind X 1 und X 2 unkorreliert.
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
147
Beweis: Folgt unmittelbar aus Satz 18 und 14.
Die Umkehrung gilt nicht: Unkorrelierte Zufallsvariablen können abhängig sein.
Damit müssen die beiden Begriffe der Unabhängigkeit und der Korreliertheit sauber
auseinandergehalten werden. Die wichtige Folgerung aus Theorem 19 ist: bei
unabhängigen Zufallsvariablen verhalten sich die Varianzen additiv.
Diese Resultate werden wir verwenden, um interessante Resultate für die
Verteilung des Mittelwertes von Zufallsvariablen zu erhalten.
Wahrscheinlichkeitsverteilung des Mittelwertes von Zufallsvariablen
Von besonderem Interesse für die Teststatistik ist die Verteilung des Mittelwertes.
Wollen wir z.B. eine neue Mastmethode beurteilen, möchten wir das
Durchschnittsgewicht der Schweine, die nach zwei verschiedenen Methoden
gemästet wurden, vergleichen. Kennen wir die Wahrscheinlichkeitsverteilung des
Mittelwerts von Zufallsstichproben, so können wir eventuelle Unterschiede mit Hilfe
des Wahrscheinlichkeitsmodells beurteilen. Sind die bestehenden Unterschiede
durch Zufall erklärbar oder ist deren zufälliges Zustandekommen eher
unwahrscheinlich? Wir können in einer Zufallsstichprobe von n Elementen jede der
Ausprägungen als Realisierung eine Zufallsvariable betrachten. Somit entsprechen
den n Ausprägungen einer Stichprobe n Zufallsvariablen X i . Bei Zufallsstichproben
können wir zudem oft voraussetzen, dass die Zufallsvariablen unabhängig sind.
Der Mittelwert der Stichprobe kann dabei als Realisierung einer neuen
Zufallsvariable X betrachtet werden. Es wäre nun günstig, wenn wir die
Wahrscheinlichkeitsverteilung der Zufallsvariable X aus den
Wahrscheinlichkeitsverteilungen der n unabhängigen Zufallsvariablen X i berechnen
könnten. In der Tat haben wir für einfache Beispiele entsprechende Berechnungen
bereits durchgeführt.
Seien X 1 und X 2 zwei Zufallsvariablen mit den Werten {1,2,3,4,5,6} (Werfen je
eines Würfels, es werden als Zahl die Anzahl der Augen zugeordnet). Wir setzen
die gleiche Wahrscheinlichkeit der Elementarereignisse von S i und die
Unabhängigkeit der Ereignisse aus den beiden Stichprobenräumen voraus (
Unabhängigkeit der beiden Zufallsvariablen). Wir erhalten denselben Mittelwert,
wenn wir die selben Summen der beiden Würfe erhalten: so ist z.B. 25
 16
.
2
2
Entspechend ergeben sich für verschiedene Mittelwerte unter Umständen
unterschiedliche Wahrscheinlichkeiten des Eintreffens. Wir zählen die möglichen
Varianten und ihre Wahrscheinlichkeiten auf:
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
148
Mittelwerte x
11
2
12
2
13
2
14
2
15
2
16
2
26
2
36
2
46
2
56
2
66
6
P X x 
Paare
1
 1, 1 
 1. 5
 1, 2 ,  2, 1 
2

24
2
3
 3. 5
4
 4. 5
5
22
2
 1, 3 ,  3, 1 ,  2, 2 
 2. 5
 1, 4 ,  4, 1 ,  2, 3 ,  3, 2 
24
 33
2
2
25
 2  34
2
35
44
 2
2
 45
2
55
2
 1, 5 ,  5, 1 ,  2, 4 ,  4, 2 ,  3, 3 
 2, 5 ,  5, 2 ,  1, 6 ,  6, 1 ,  3, 4 ,  4, 3 
 2, 6 ,  6, 2 ,  3, 5 ,  5, 3 ,  4, 4 
 3, 6 ,  6, 3 ,  4, 5 ,  5, 4 
 4, 6 ,  6, 4 ,  5, 5 
 5. 5
 5, 6 ,  6, 5 
6
 6, 6 
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Wir zeichnen die Wahrscheinlichkeitsfunktion:
Wahrscheinlichkeiten
Wahrscheinlichkeitsfunktion des
Mittelwertes von X1 und X2
0.2
0.15
0.1
0.05
0
0
2
4
6
8
Mittelwerte
Wir fassen damit X 2 als eine Zufallsvariable auf. Deren Definitionsbereich S ist das
kartesische Produkt von S 1 und S 2 (S  S 1  S 2  und deren Funktionswerte die
Mittelwerte der Elemente von S (d.h. die möglichen Mittelwerte des Wurfes zweier
Würfel): {1,1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6}. Oben haben wir die
Wahrscheinlichkeitsfunktion der Zufallsvariable X 2 berechnet.
Wir nennen X 2 ”den Mittelwert der 2 Zufallsvariablen X i ”. Zu beachten ist, dass X 2
eine Funktion ist. Diese nimmt konkrete Mittelwerte von Datensätzen (die aus zwei
Daten bestehen) zufällig als Werte an.
Ebenso könnten wir nun die Wahrscheinlichkeitsfunktion des Mittelwertes dreier
oder mehrerer gleichverteilter und unabhängiger Zufallsvariablen berechnen:Für 3
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
149
Zufallsvariablen mit der obigen Art ergibt sich das folgende Bild:
Wahrscheinlichkeitsfunktion der Mittelwerte dreier uniform verteilter
Wahrscheinlichkeiten
Zufallsvariablen X i (S i  1, 2, 3, 4, 5, 6
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
2
4
6
8
Mittelwerte
Es fällt auf, dass sich die Verteilung einer Normalverteilung nähert. Wir kommen
darauf in Kürze zurück.
Wir können das verwendete Verfahren nun allgemeiner betrachten. Um die
Zufallsvariable ”Mittelwert” zu berechnen, müssen wir die Summe X 1  X 2 der
beiden Zufallsvariablen berechnen und diese mit 12 multiplizieren (dabei
multiplizieren wir die Funktionswerte von X 1  X 2 mit 12 . Wir erhalten:
X 2  12 X 1  X 2  oder
X 2  x, y  
1
2
X 1  X 2  x, y  
1
2
x  y 
xy
2
Dies führt uns zur folgenden Definition des Mittelwertes von n Zufallsvariablen:
Definition: Der Mittelwert X n von n gleichverteilten Zufallsvariablen X i wird
n
definiert als: X n  1n  X i .
i1
Man beachte: X n ist eine Zufallsvariable (somit eine Funktion!) und nicht eine Zahl.
Die Werte der Funktion X n sind die Mittelwerte x , die den möglichen Datensätzen
mit n Daten zugeordnet sind (der Definitionsbereich von X n enthält somit n-Tupel
von Daten!). .
Für gleichverteilte Zufallsvariablen erhalten wir ein paar sehr handliche Formeln.
Definition: Zwei Zufallsvariablen X 1 und X 2 sind gleichverteilt, genau
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
150
dann, wenn F X 1  F X 2
Sind die Zufallsvariablen X i gleichverteilt, folgt aus Theorem 6:
n
Theorem 20: Seien X i gleichverteilt. Dann gilt: E X i   nEX i 
n
Beweis: E X i 
i1
i1
n
 EX i . Da die X i gleichverteilt sind, gilt: EX i   EX j  für

Theorem 6 i1
n
alle 1  i, j  n . Somit gilt:  EX i   nEX i .
i1
Dies führt uns zum folgenden fürs weitere Vorgehen wesentliche Theorem:
Theorem 21: Bei n gleichverteilten X i gilt: EX i   EX n 
Beweis: EX i  
E
1
n
n
 Xi
i1
n
n
EX i  

Definition X n
1
n
nEX i 

n
Theorem 20
E X i 
i1

Theorem 5
EX n 
Das Theorem besagt: Der Erwartungswert des Mittelwerts gleichverteilter
Zufallsvariablen fällt mit dem Erwartungswert der einzelnen Zufallsvariable
zusammen.
Theorem 22:Wenn die Zufallsvariablen X 1 und X 2 unabhängig und gleichverteilt sind, gilt:
VX 1  X 2   VX 1   VX 2   2VX 1   2VX 2 
Beweis:
VX 1  X 2   VX 1   VX 2   2KOVX 1 X 2 

wegen Unabhängigkeit
VX 1   VX 2   2VX 1 
(da gleichverteilte Zufallsvariablen dieselbe Varianz haben).
Theorem 23: Für die Summe von n unabhängigen und gleichverteilten Zufallsvariablen X i
n
n
i1
i1
gilt: V X i    VX i   nVX i 
Beweis: Verallgemeinerung von Satz 22.
Statt ”n unabhängig und gleichverteilte Zufallsvariablen” verwenden wir künftig
auch ”n i.i.d.-Zufallsvariablen” (i.i.d.  independant and identically distributed).
Das folgende Theorem ist von fundamentaler Bedeutung:
Theorem 24: Seien X i i.i.d., dann gilt: VX n  
Beweis: VX n 
1
n2
n
V  Xi
i1

n
Definition X n

Theorem 23
V 1n  X i 
1
n2
i1
nVX i  
VX i 
n

Theorem 12
1
n
VX i 
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
151
Das Theorem besagt: Die Varianz des Mittelwertes von n i.i.d.-Zufallsvariablen ist
n-mal kleiner als die Varianz der einzelnen Zufallsvariable. Für n gegen Unendlich
wird die Varianz 0. Damit haben wir - bis auf den Beweis der Theoreme 6 und 18 eine Variante des Gesetzes der grossen Zahlen bewiesen (für n gegen Unendlich
strebt die Wahrscheinlichkeit, dass der Mittelwert mehr als ein beliebig kleines
  0 vom Erwartungswert abweicht, gegen 0).
Der zentrale Grenzwertsatz
Wir haben oben festgestellt, dass die Wahrscheinlichkeitsfunktion der Verteilung
des Mittelwertes dreier gleich und uniformverteilter, unabhängiger Zufallsvariablen
der Dichtfunktion einer Normalverteilung ähnelt. Wir betrachten noch die
entsprechenden Verteilungsfunktionen:
Wahrscheinlichkeiten
1.2
1
Verteilungsfunktion
Mittelwerte
0.8
0.6
Verteilungsfunktion
Standard-Normal
0.4
0.2
0
-4
-2
0
2
4
Z-transformierte Mittelwerte
Ohne Beweis formulieren wir nun den für die Test-Statistik wichtigen zentralen
Grenzwertsatz: X n sei der Mittelwert von n i.i.d.- Zufallsvariablen X i .
Theorem 22: Für beliebig verteilte i.i.d. Zufallsvariablen X i : Für steigendes n nähert sich
X EX 
die Verteilung der Zufallsvariable Z n  n VX  i beliebig nahe einer
n
i
Standardnormalverteilung.
Alternative Forumulierung. F Z n x  x für n  .
Z n 
X n EX i 
VX i 
n
stellt die z-Transformation von X n dar, da
VX i 
n
die Varianz von X n und
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
152
EX i  der Erwartungswert von X n ist.
Der zentrale Grenzwertsatz begründet u.a. die bedeutende Rolle der
Normalverteilung in der Statistik.
Betrachten wir nun jedes einzelne Datum eines Datensatzes als Realisierung (
Wert) einer Zufallsvariablen, können wir den empirischen Mittelwert des
Datensatzes als Realisierung der Zufallsvariable X n betrachten. Können wir zudem
davon ausgehen, dass die Zufallsvariablen i.i.d. sind (z.B. im Falle einer
Zufallsstichprobe, wo jedes Datum dieselbe Wahrscheinlichkeit hat, in die
Stichprobe aufgenommen zu werden), so kennen wir bis auf die Parameter das
Modell für die Verteilung der empirischen Mittelwerte: bei grossen Datensätzen ist
die Verteilung des z-standardisierten Mittelwertes von Datensätzen, die identisch
und unabhängig verteilt sind, nahezu standardnormal. Statt den zentralen
Grenzwertsatz zu beweisen, werden wir in den Übungen einige Aufgaben machen,
die den Satz durch die Ergebnisse empirisch bestätigen.
Anwendungen des zentralen Grenzwertsatzes
Mit Hilfe des zentralen Grenzwertsatzes können wir nun zeigen, dass man die
Werte PX  x einer Binomialverteilung bei genügend grossem n mit Hilfe einer
Normalverteilung berechnen kann. B1, p verteilte Zufallsvariablen X i (
Bernoulli-verteilt) können wir verwenden, um beliebige Bn, p verteilte
Zufallsvariablen X als Summen darzustellen, da gilt: wenn X 1  Bn, p und
X 2  Bm, p, dann X 1  X 2  Bm  n, p. Entsprechend gilt dann: Wenn
n
n
n
X i  B1, p, dann  X i  Bn, p. Nun ist  X i  n 1n  X i  nX (im letzten Schritt
i1
i1
i1
verwenden wir die Definition des Mittelwerts von Zufallsvariablen). Für X i  B1, p
gilt: EX i   p und VX i   p1  p. Laut den eingeführten Theoremen gilt dann:
EX   p und: VX   1n p1  p Wir erhalten als standardisierte Zufallsvariable:
n
1
n
n
 X i p
i1
p1p
n
n 1n
i1

n
 X i np
n
p1p
n
 X i np

i1
np1p
 N0, 1.
Beispiel: Wieviel beträgt die Wahrscheinlichkeit, bei 200 Zügen mindestens 15 zu
lange Schrauben zu ziehen (p  0. 05). Anders formuliert: Wieviel beträgt
PX  15, wenn X  B200, 0. 05. 15 ist im Beispiel der konkrete Wert der
n
Zufallsvariable  X i . Mit Hilfe des Näherungsverfahrens erhalten wir:
i1

152000.05
2000.050.95
 1. 622 2  0. 947622098
Ohne Näherungsverfahren erhalten wir:
15
15
i0
i0
PX  15   PX  i    200
0. 05 i 0. 95 1i  0. 955644371
i
(mit Excel: Computer-Programme wechseln ebenfalls auf ein Näherungsverfahren,
sobald die exakte Berechnung zu aufwendig wird). Im Beispiel beträgt die
Abweichung des Näherungsverfahrens vom ”tatsächlichen” Wert:
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
153
0. 955644371  0. 947622098  0. 0080223.
Wie bereits früher bemerkt, ist die Verwendung des Näherungsverfahrens ist i.A.
gerechtfertigt, wenn np1  p  9. Im obigen Beispiele beträgt dieses Produkt:
200  0. 05  0. 95  9. 5. Je grösser diese Zahl, desto besser ist die Näherung. Der
Faktor p1  p  p  p 2 erreicht sein Maximum in p  0. 5. (Beweis:
d
p  p 2   1  2p  0 genau dann, wenn p  12 ; dpd 1  2p  2  0. Somit muss
dp
in diesem Fall n  0.59 2  36 sein. Je mehr p von 0. 5 abweicht, desto grösser muss
n sein.
Auf Grund ähnlicher Überlegungen können wir die Werte PX  x von
Poissonverteilungen ebenfalls mit Hilfe der Normalverteilung berechnen, wenn 
genügend gross ist. Es gilt nämlich, wie bereits erwähnt: X 1  X 2  P 1   2 ,
wenn X 1  P 1  und X 2  P 2 . Betrachten wir nun n   gleichverteilte
n
Zufallsvariablen X i  1 (d.h.  i  1,   n i , so gilt deshalb:  X i  Pn i . Es
n
gilt wie oben:  X i 
i1
1
n
i1
n
n  X i  nX . X ist für grosse n wiederum näherungsweise
i1
normalverteilt. Da bei der Poissonverteilungen gilt: EX i    i , gilt laut den
n
eingeführten Theoremen: EX   E 1n  X i    i . Zudem gilt: VX i    i : Laut
i1
Varianz-Theorem für den Mittelwert gilt dann: VX  
n
Zufallsvariable X erhalten wir:
n
X  i
i
n
1
n

n
 X i  i
i1
. Für die standardisierte
n
 X i n i

i
n
i
n
i1
n
i
n
 X i n i

i1
n i
 N0, 1. Da
 X i 
  n i , erhalten wir:
i1

 N0, 1.
Beispiel: Die Anzahl der Maschinenstillstände pro Tag sei poissonverteilt (mit
  15. Wieviel beträgt die Wahrscheinlichkeit, dass mindestens 8 Maschinen an
einem Tag stillstehen. Auch hier fassen wir 7 als der konkrete Werte der
n
Zufallsvariable  X i auf. Mit Hilfe der Näherungsformel erhalten wir für
PX  7  
i1
715
15
 2. 065 6  1  0. 980566934.  0. 01943 3
Die gesuchte Wahrscheinlichkeit ist somit: 1  0. 01943 3  0. 980566934
7
Als exakten Wert erhalten wir PX  8  1  
i0
15 i e 15
i!
 1  0. 018002193  0. 982.
(Mit Excel: POISSON(7,15,1)). Die Differenz zwischen dem tatsächlichen und dem
näherungsweisen Wert beträgt somit: 0. 982  0. 980566934  0. 001433 1
Im Allgemeinen ist es möglich, bei Poissonverteilungen die Normalverteilung zu
verwenden, wenn gilt:   9.
Wir können laut dem zentralen Grenzwertsatz beliebig verteilte Zufallszahlen
verwenden, um normalverteilte Zufallszahlen zu erhalten. Die jeweiligen Mittelwerte
sind näherungsweise normalverteilt. Die gelieferte Produktionsanleitung für
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
154
standardnormalverteilte Zufallszahlen stellt den folgenden Spezialfall dar: wir
verwenden uniform verteilte Zufallszahlen im Intervall [0,1], wobei statt des
empirischen Mittelwertes und der empirischen Standardabweichung für die
Standardisierung die Werte des Modells verwendet werden (Ist X  U0, 1, gilt
VX  121 und EX  12 . Wir erhalten:
n
1
n
n
 x i  12
i1
1
12
1
n

n
 x i  12
i1
1
12
 x i  n2

i1
n
12
 N0, 1
Übungen:
1) Überprüfen Sie die Aussage X 1  X 2  B10, 0. 5. (X i  B5, 0. 5 rechnerisch (mit
Hilfe von Excel)
2) Bilden Sie die Summe zweier identisch verteilter poisson-verteilter Zufallsvariablen:
X i  P5 (für 0  s  5).
3) Für die Poissonverteilung gilt: Wenn X 1  P 1  und X 2  P 2 , dann
X 1  X 2  P 1   2 . Überprüfen Sie diese Aussage an der Übung 2.
4) Erstellen Sie 100 Sätze uniform verteilter Zufallszahlen (50) und zeichnen sie den
P-P-Plot der Verteilung der Mittelwerte.
5) Erstellen Sie 100 Sätze normalverteileter Zufallszahlen (50) und zeichnen sie den
P-P-Plot der Verteilung der Mittelwerte.
6) Erstellen Sie 100 Sätze von Zufallszahlen (50) mit der Verteilung Fx  0. 02x 4 und
zeichnen Sie den P-P-Plot der Verteilung der Mittelwerte.
7) Erstellen Sie für 10, 50 und 100 Sätze von exponentialverteilten Zufallszahlen (à 50,
  0. 7 die Verteilung der Mittelwerte. Berechnen Sie die mittlere Abweichung der
z-standardisierten Mittelwerte von der Standardnormalverteilung und kommentieren Sie.
8) Berechnen Sie für 100 Sätze exponentialverteilter Zufallszahlen (50) die mittlere
quadrierte Abweichung vom Modell (  0. 8 und überprüfen Sie mit Hilfe eines
P-P-Plots die Verteilung der erhaltenen Werte auf Normalverteilung.
9) Berechnen Sie für 50 Sätze exponentialverteilter Zufallszahlen (50,  1. 2) den Median
und überprüfen Sie, ob die Mediane normalverteilt ist.
10) Berechnen Sie für 50 Sätze uniformverteilter Zufallzahlen (50) die Varianz und
überprüfen Sie, ob die Varianzen normalverteilt sind.
11) Berechnen Sie die folgenden Werte der folgenden Binomialverteilungen:
PX  7, X  B300, 0. 04;
PX  7, X  B50, 0. 2
12) Berechnen Sie die folgenden Werte der folgenden Poissonverteilungen:
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
155
PX  6, X  P13;
PX  4, X  P5
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
156
Lösungen:
PŠ  0  PX 1  0 und X 2  0  PX 1  0  PX 2  0 
5
0. 5 0  0. 5 5  50 0. 5 0  0. 5 5  0. 0009765 6  100 0. 5 0  0. 5 10  9. 765 6  10 4
0
PŠ  1  PX 1  1 und X 2  0  PX 1  0 und X 2  1 
5
0. 5 0  0. 5 5   51 0. 5 1  0. 5 4
 51 0. 5 1  0. 5 4  50 0. 5 0  0. 5 5 
0
 0. 009765 6   10
0. 5 1  0. 5 9  9. 765 6  10 3
1
PŠ  2  PX 1  2 und X 2  0  PX 1  1 und X 2  1  PX 1  0 und X 2  2 
 52 0. 5 2  0. 5 3  50 0. 5 0  0. 5 5   51 0. 5 1  0. 5 4   51 0. 5 1  0. 5 4  
5
0. 5 0  0. 5 5   52 0. 5 2  0. 5 3  0. 04394 5   102 0. 5 2  0. 5 8  4. 394 5  10 2
0
PŠ  3  PX 1  3 und X 2  0  PX 1  2 und X 2  1  PX 1  1 und X 2  2 
PX 1  0 und X 2  3 
5
0. 5 3  0. 5 2  50 0. 5 0  0. 5 5   52 0. 5 2  0. 5 3   51 0. 5 1  0. 5 4  
3
5
0. 5 0  0. 5 5  53 0. 5 3  0. 5 2  0. 117 19
 51 0. 5 1  0. 5 4   52 0. 5 2  0. 5 3  
0
 103 0. 5 3  0. 5 7  . 117 19
PŠ  4  PX 1  4 und X 2  0  PX 1  3 und X 2  1  PX 1  2 und X 2  2 
PX 1  1 und X 2  3  PX 1  0 und X 2  4 
5
0. 5 3  0. 5 2   51 0. 5 1  0. 5 4 
 54 0. 5 4  0. 5 1  50 0. 5 0  0. 5 5 
3
 52 0. 5 2  0. 5 3   52 0. 5 2  0. 5 3    51 0. 5 1  0. 5 4  53 0. 5 3  0. 5 2 
5
0. 5 0  0. 5 5   54 0. 5 4  0. 5 1  0. 205 08   104 0. 5 4  0. 5 6  . 205 08
0
etc. (für 0  s  10  2  5.
x 
2) PŠ  0  PX 1  0 und X 2  0   x!e
0 5
5
5
5 0 e 5
 5 0!e  1e1  1e0!  4. 54  10 5
0!

 x e 
x!

PŠ  1  PX 1  1 und X 2  0  PX 1  0 und X 2  1 
0 5
0 5
5
5e 5
 5 0!e
 5 0!e  5e1!
 4. 54  10 4
1!
PŠ  2  PX 1  1 und X 2  0  PX 1  1 und PX 2  1  PX 1  0 und
X 2  2 
0 5
5
5
0 5
2 5
5 2 e 5
 5 0!e
 5e1!  5e1!
 5 0!e  5 2!e
 . 00 227
2!
PŠ  3  PX 1  3 und X 2  0  PX 1  2 und PX 2  1 
PX 1  1 und X 2  2  PX 1  0 und X 2  3 
0 5
2 5
5
5
2 5
0 5
3 5
5 3 e 5
 5 0!e
 5 2!e  5e1!
 5e1!  5 2!e
 5 0!e  5 3!e
3!
 7. 566 7  10 3
PŠ  4  PX 1  4 und X 2  0  PX 1  3 und PX 2  1 
PX 1  2 und X 2  2  PX 1  1 und X 2  3  PX 1  0 und X 2  4 
0 5
3 5
5
2 5
2 5
5 4 e 5
 5 0!e
 5 3!e  5e1!
 5 2!e  5 2!e

4!
5e 5
5 3 e 5
5 0 e 5
5 4 e 5
2
 3!

 4!
 1. 891 7  10
1!
0!
PŠ  5  PX 1  5 und X 2  0  PX 1  4 und PX 2  1 
PX 1  3 und X 2  2  PX 1  2 und X 2  3  PX 1  1 und X 2  4 
PX 1  0 und X 2  5 
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
157
5 5 e 5
5!
5 2 e 5
2!


5 0 e 5
0!
5 3 e 5
3!
5 4 e 5
4!
5e 5
1!


0
3) PŠ 2  0  10 0!e
1 10
PŠ 2  1  10 1!e
2 10
PŠ 2  2  10 2!e
3 10
PŠ 2  3  10 3!e
4 10
PŠ 2  4  10 4!e
5 10
PŠ 2  5  10 5!e
10







5e 5
1!
5 4 e 5
4!


5 3 e 5
3!
5 0 e 5
0!


5 2 e 5
2!
5 5 e 5
5!

 3. 783 3  10 2
 4. 54  10 5
4. 54  10 4
. 00 227
7. 566 7  10 3
1. 891 7  10 2
3. 783 3  10 2
4) Siehe Excel-Datei ”Lösung Aufgabe 4 Verteilung von Kennzahlen”
empirische Verteilungsfunktion
P-P-Plot
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
-4
-2
0
0
2
4
0
0.2
0.4
0.6
0.8
1
Die Mittelwerte sind deutlich normalverteilt.
5) Siehe Excel-Datei ”Lösung Aufgabe 5 Verteilung von Kennzahlen”
empirische Verteilungsfunktion
P-P-Plot (Normal)
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-3
-2
-1
1
0.8
0.6
0.4
0.2
0
0
1
2
3
0
0.2
0.4
0.6
0.8
1
Die Mittelwerte sind normalverteilt.
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
158
6) Siehe Excel-Datei ”Lösung Aufgabe 6 Verteilung von Kennzahlen”
x
Für F 1 von F bei Fx  0. 02x 4 gilt: F 1 x  4 0.02
empirische Verteilungsfunktion
P-P-Plot (Normal)
1
1
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0
-4
-3
-2
-1
0
0
1
2
3
0
0.2
0.4
0.6
0.8
1
Die Mittelwerte sind deutlich normalverteilt.
7) Siehe Excel-Datei ”Lösung Aufgabe 7 Verteilung von Kennzahlen”
Im konkreten Beispiel erhalten wir mittlere Abweichung von:
für 20 Sätze: 0.079481396.
für 50 Sätze: 0.019563624
für 100 Sätze: 0.025807526 (Da die mittlere Abweichung selber eine Zufallszahl
mit einer Verteilung ist, muss die mittlere Abweichung nicht in jedem Fall sinken).
8) Die mittleren Abstände sind deutlich nicht normalverteilt.
empirische Verteilungsfunktion
P-P-Plot Normal
-2
-1
Werte (Normalverteilung)
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0
1
2
3
4
0.2
0.4
0.6
0.8
1
Emp. Vert.
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
159
9)
empirische Verteilungsfunktion
P-P-Plot Mediane
1
theoretische relative
Häufigkeit
Empirische Verteilung
1.2
0.8
0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1
empirische relative Häufigkeit
Mediane
Die Werte scheinen systematisch von der Geraden abzuweichen (Schlangenform).
Die Mediane einer Exponentialverteilung sind nicht normalverteilt.
10)
P -P -P lo t (n o rm a l)
empirische Verteilungsfunktion
1.2
Werte (normal)
1
0.8
0.6
0.4
0.2
0
-3
-2
-1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0
1
2
0.2
3
0 .4
0.6
0.8
e m p . H ä u fi g k e i t
Die Varianzen sind nicht normalverteilt.
11) Da 300  0. 04  0. 96  11. 52  9, dürfen wir die Normalverteilung verwenden, um
die Wahrscheinlichkeit zu berechnen:
n
 X i np
i1
np1p

73000.04
3000.040.96
  1. 473 1  1. 473 1  0. 07036 2
Der tatsächliche Wert: 0. 085106059 (Differenz: 0. 085106059  0. 070362072  0. 01
474 4
Da 50  0. 2  0. 8  8, dürfen wir nicht die Normalverteilung verwenden. Mit Hilfe von
Excel berechnen wir: 0. 190409812 (bei der Verwendung der Normalverteilung würden
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
160
1
wir erhalten: 
7500.2
500.20.8
 1. 0607  0. 144413158, der Wert ist also um 4.5%
daneben).
12) Da   13  9, dürfen wir die Normalverteilung verwenden:
613
  1. 941 5; 1. 9415  0. 02609876  PX  7
13
Der genaue Wert beträgt: 0. 025886915
Da   5  9, dürfen wir nicht die Normalverteilung verwenden:
Der genaue Wert beträgt:
PX  4, X  P5;
PX  4  0. 440493285
(Mit der Normalverteilung würden wir erhalten: 45  . 447 21
5
PX  4  0. 327361743  0. 44721 - was doch bedeutend daneben wäre).
Lernziele
- Die Definition der Unabhängigkeit von Zufallsvariablen erkläutern können.
- Die Summenbildung von einfachen diskreten Zufallsvariablen durchführen können
und die Wahrscheinlichkeiten der Wahrscheinlichkeitsfunktion der Summe
berechnen können.
- Die Rechenregeln bezüglich des Erwartungswertes (Theoreme 3, 4, 5, t, 7 und 8)
anwenden können.
- Die Rechenregeln bezüglich der Varianz (Theoreme 11, 12, 13) anwenden
können.
- Die Definition der Kovarianz und der Unkorreliertheit kennen.
- Für diskrete Zufallsvariablen X i die Zufallsvariable X samt
Wahrscheinlichkeitsfunktion berechnen können.
- Definition der Gleichverteiltheit von Zufallsvariablen kennen.
- Den Inhalt der Theoreme 20, 21, 22, 23 und 24 erläutern können.
- Den Zentralen Grenzwertsatz in Worten formulieren können.
- Übungen der Art 4 - 10 mit Excel machen können.
___________________________________________________________________
Verteilung von Kennzahlen.tex 2. HSW Visp P.R.
Statistik
161
8. Weitere stetige Verteilungsfamilien
Wir werden in diesem Rahmen nicht sämtliche, mit Namen versehenen
Verteilungsfamilien betrachten, sondern nur jene, die eine besondere Rolle in der
Test-Statistik spielen: Die  2 Verteilung (Chi-Quadrat), die t-Verteilung und die
F-Verteilung. Diese Verteilungen werden von der Normalverteilung hergeleitet. Es
handelt sich um Verteilungen, die den Verteilungen von komplizierteren
Zufallsvariablen entsprechen (z.B. Zufallsvariablen, welche die Varianz von
Zufallsvariablen enthalten).
Die  2n -Verteilungen
Definition: Y ist eine  2n -verteilte Zufallsvariable mit n Freiheitsgraden
n
genau dann, wenn Y   X 2i und X i sind unabhängige,
i1
standardnormalverteilte Zufallsvariablen.
wobei das Produkt von Zufallsvariablen (X 2  X  X die übliche Multiplikation von
Funktionen bezeichnet (d.h. f  g  h genau dann, wenn fx  gx  hx). Die
Anzahl der Freiheitsgrade ist mit der Anzahl der unabhängigen Zufallsvariablen
identisch. Je nach dieser Anzahl sieht die Verteilung etwas anders aus.
Die Dichtefunktion der  2n -Quadratverteilung mit n Freiheitsgraden ist:
f  2n 
n
2
n
1
2 
n
2
x
 x 2 1  e  2
(für x  0).
wobei  ”Gammafunktion” genannt wird.
Es folgen ein paar Bemerkungen zur Gammfunktion, die Sie natürlich übergehen

können: Die Gammafunktion ist definiert durch: x   t x1 e t dt. Die
0
Gammafunktion ist die Funktion, welche die diskrete Funktion n! stetig fortführt,
d.h. so verbindet, dass eine stetige Funktion ohne überflüssige Krümmungen
entsteht. Es gilt nämlich: n  1  n! Damit ist z.B. 6  5  1  5!  120.
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 159
Die Gammafunktion
Die Werte der Gammfunktion für x  1 bis x  2 sind z.B. im Buch ”Formeln und
Tafeln, Orell-Füssli-Verlag” tabelliert. Dies genügt für die Berechnung beliebiger
Werte, da für die Gammafunktion zusätzlich gilt: x  1  xx. Wollen wir z.B.
6. 25 berechnen, gilt:
6. 25  5. 25  1  5. 25  5. 25  5. 25  4. 25  1 
5. 25  4. 25  4. 25  5. 25  4. 25  3. 25  1  5. 25  4. 25  3. 25  3. 25 
5. 25  4. 25  3. 25  2. 25  1  5. 25  4. 25  3. 25  2. 25  2. 25 
5. 25  4. 25  3. 25  2. 25  1. 25  1  5. 25  4. 25  3. 25  2. 25  1. 25  1. 25
Faktisch berechnen wir in den hier verwendeten Formeln die Gammewerte von
ganz- oder halbzahligen Werten. Dabei gilt:  12    .
In Excel (Befehl: GAMMALN()) werden die logarithmierten Werte der
Gammafunktion geliefert (natürlicher Logarithmus ln). Die Werte der Gammfunktion
erhalten wir somit durch: expGAMMALN()  x; der HP48 liefert die Werte bei
der Taste ! unter MTH, NXT, PROB - d. h wie die Fakultäten.
Konkrete Dichtefunktionen von  2n -Quadratverteilungen mit n Freiheitsgraden
erhalten wir, indem wir in der obigen Formel n durch eine spezifische natürliche
Zahl und  n2  durch den entsprechenden Wert der Gamma-Funktion ersetzen.
Für einen Freiheitsgrad erhalten wir die Verteilung:
1
0. 5  1. 772453851 
 0. 39894 .
1.772453851 2
1
1
1
2
2 
1
2
x
 x 2 1  e  2  0. 398 94  x 0.5 e 0.5x  0. 398 94xe 0.5x
Wir erhalten den Graphen:
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 160
Die Kurve ist nicht symmetrisch. Entsprechend fallen der Median und der Mittelwert
nicht zusammen.
Für zwei Freiheitsgrade erhalten wir:  22   1  1
2
1
2
2
2 
2
2
x
 x 2 1  e  2 
1
2
1
e 2 x
Wir erhalten den Graphen:
Für n Freiheitsgrade erhalten wir:
n  3:
n  4:
1
3
2
2 
3
2
1
4
2
2 
4
2
3
x
4
x
 x 2 1  e  2  0. 398 94 x e 0.5x
 x 2 1  e  2  0. 25xe 0.5
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 161
n  5:
n  8:
n  10:
2 
5
2
2 
8
2
1
2
10
2

x
8
x
 x 2 1  e  2  0. 01 041 7x 3 e 0.5x
1
8
2
5
 x 2 1  e  2  0. 132 98 x 3 e 0.5x
1
5
2
10
2
x
10
2
1
x
 e  2  0. 001302 1x 4 e 0.5x
Graphik:
n=3
n=4
n=5
n=8
n = 10
Die Graphen haben nun im Gegensatz zu n  1 und n  2 ein Maximum in x  0.
Für beliebige  2n -Verteilung gilt: Der Erwartungswert ist mit n identisch und die
Varianz mit 2n.
An den obigen Graphiken stellen wir fest: mit steigendem n werden die Kurven
immer flacher. Die Kurven werden zudem symmetrischer. In der Tat unterscheidet
sich die Kurve bei hohem n nur mehr geringfügig von einer Normalverteilung mit
  n und  2  2n. Als Beispiel betrachten wir X  N50, 100 und X   250 . Wir
erhalten die folgenden Formeln und Graphiken:
x 
1
10 2
4. 803 4  10
e 0.5
x50
10
32 24 0.5x
x e
und f  250 x 
1
2
50
2

50
2
x
50
2
1
x
 e 2 
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 162
fχ(x)
fΦ(x)
Auch hier gibt es für die Verteilungsfunktion keine geschlossene Formel. Wir
könnten die Werte der Funktion durch eine Näherungsmethode bestimmen
(Verfahren siehe Normalverteilung). Wir werden die Werte jedoch in Tabellen
nachschauen, mit Hilfe von Excel oder eines Taschenrechners bestimmen. In
Tabellen werden gewöhnlich nur Werte in den Intervallen p  0. 95 und p  0. 05
angegeben, da i.a. nur Werte in diesen Bereichen in der Teststatistik verwendet
werden. Anwendungsbeispiele werden wir im Rahmen der Teststatistik sehen.
Übungen: Bestimmen Sie mit Hilfe einer Tabelle, einem Taschenrechner oder mit
Hilfe von Excel die folgenden Werte: (Excel: chivert(Wert;Freiheitsgrade); Excel
(und viele Tabellen) liefern dabei die Werte , wobei   1  F  n x, wobei F  n
die Verteilungsfunktion der  2n -Verteilung ist). Auch der HP48 gibt diesen Wert an
(upper tail probability für  2n : utpc, im selben Menu wie die Werte der
Normalverteilung; eingegeben werden die folgenden Werte in der folgenden
Reihenfolge: Freiheitsgrade, x):
1) X   26 : PX  1. 64
2) X   211 : PX  21. 9
3) X   24 : PX  14. 9
4) X   25 : PX  0. 6
5) X   250 : P28  X  80
Lösungen:
1) Mit Hilfe von Excel: 1  0. 949658734  0. 05034 1
Mit der Tabelle (Formeln und Tafeln): 1  0. 95  0. 05
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 163
0.95 = α=1-(F(6)(1.64))
2) Excel: 1  0. 025159503  0. 974 84, Mit der Tabelle: 1  0. 025  0. 975
3) Excel: 0. 004913182; Mit der Tabelle: 0. 005.
4) Excel: 0. 988003243; Mit der Tabelle: Wert zwischen 0. 99 und 0. 975 (wir könnten
z.B. linear interpolieren).
5) Mit Excel: 0. 994980108  0. 004482657  0. 990 5 Mit der Tabelle:
0. 995  0. 005  0. 99
Die t-Verteilungen
Definition: Y ist eine t-verteilte Zufallsvariable mit n Freiheitsgraden genau
Xo
dann, wenn Y 
, und X i und X 0 sind unabhängig und
n
1
n
 X 2i
i1
standardnormalverteilt.
t Verteilungen sind symmetrische Verteilungen mit dem Erwartungswert 0 (für
n
. sofern dieser Term positiv ist, d.h. n  2).
n  2) und der Varianz n2
Die Dichtefunktion der t-Verteilung ist:
f t x 
Für n  1 : f t 1 x 
Für n  2 : f t 2 x 

11
2
1
2

21
2



2
2
2
1
n1
2


n
2
1
n
 11
2
x2
1
x2
2
1

 21
2
x2
n
 n1
2
0.318 31
1x 2

0.353 55
10.5x 2 
3
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 164
Für n  10 : f t 10 x 


10
2
101
2
10
1
x2
10
 101
2

0.389 11
10.1x 2 
11
Graphik:
Dichtefunktion der
Standardnormalverteilung
ft10
ft2
ft1
Wir stellen fest: Die t-Verteilungen sind flacher als die Standardnormalverteilung.
Sie nähern sich für steigende n aber zunehmend einer Standardnormalverteilung
an.
Die Werte der t-Verteilung können wir mit Hilfe von Näherungsverfahren aus der
Dichtefunktion berechnen. In der Praxis werden wir sie aus Tabellen, mit dem
Taschenrechner oder mit Hilfe von Excel bestimmen.
Anwendungsbeispiele werden wir im Rahmen der Teststatistik sehen.
Übungen: Geben sie die folgenden Wahrscheinlichkeiten an: (Excel gibt - wie
häufig auch bei Tabellen - den Wert   1  F t x an, wobei F t die
Verteilungsfunktion der t-Verteilung ist. Befehl: tvert(Wert;Freiheitsgrade;1;
Mit dem HP48: UTPT. Es werden zuerst die Freiheitsgrade, dann die Zahl x
eingegeben).
1) X
2) X
3) X
4) X




t3 : PX  4. 54
t25 : PX  2. 06
t10 : PX  2. 23
t30 : P1. 7  X  3. 39
Lösungen:
1) Mit Excel: 1  0. 010004169  0. 99; Mit der Tabelle: 1  0. 01  0. 99.
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 165
2) Mit Excel: 1  0. 024976248  0. 97502. Mit der Tabelle: 1  0. 025  0. 975
3) Mit Excel: 0. 024921235. Mit der Tabelle: 0. 025
4) Mit Excel: 0. 048751508 Mit der Tabelle: 0. 05  0. 001  0. 049
Die F-Verteilungen
Definition: Eine Zufallsvariable Y ist F-verteilt mit m und n Freiheitsgraden
m
1
m
 X 2i
i1
n
genau dann, wenn Y 
1
n

. X i sind
X 2i
i1
standardnormalverteilte,unabhängige Zufallsvariablen)
Die Dichtefunktion der F-Verteilung ist:
f F m,n 
m 1
m
2
 mn  2
 m  n
2
2
 mn
2
x
1 
m
n
x 
mn
2
für x  0.
Wir zeichnen ein paar Dichtefunktionen von F-Verteilungen.
Wenn m  4 und n  40, so gilt:
4
4
2
10
4
10


2
2
 410
2
4 1
f F 4,10 
x2
f F 4,40 
x2
f F 40,4 
x
f F 40,40 
4
4
2
40
 4  40
2
2
 440
2
4 1
40 1
2
40
4
1 
4
10
x 
410
2

24x
510.4x 7
1 
4
40
x 
440
2

4.2x
10.1x 22
40
2
 40  4
2
2
 404
2
x
40 1
2
40
40
 40  40
2
2
 4040
2
40
2
1 
1 
40
4
40
40
x 
404
2
x 
4040
2
 4. 2  10 22
x 19
110x 22
 1. 378 5  10 12
x 19
1x 40
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 166
f40,40
f4,40
f4,10
f40,4
Der Erwartungswert der F-Verteilung ist:  F 
Nennerfreiheitsgrade)
n
n2
(n  2; n 
Anwendungen der F-Verteilung werden wir im Rahmen der Teststatistik sehen.
Übungen:
Schauen Sie die folgenden Wahrscheinlichkeiten nach (Excel liefert wieder die
Werte von   1  F F x, wobei F F die Verteilungsfunktion der F-Verteilung ist.
Befehl: FVERT(Wert;Freiheitsgrade m; Freiheitsgrade n;
mit dem HP48 wird derselbe Wert wie bei Excel geliefert: Eingabe: Freiheitsgrade
des Zählers, Freiheitsgrade des Nenners, x)
1) X  F10, 8 : PX  3. 347
2) X  F3, 6 : PX  3. 289
3) X  F9, 3 : PX  14. 47
4) X  F4, 4 : P4. 107  X  15. 98
Lösungen:
1) Mit Excel: 1  0. 050006472  0. 949 99. Mit der Tabelle: 0.95
2) Mit Excel: 1  0. 099987384  0. 900 01. Mit der Tabelle: 0.90
3) Mit Excel: 0. 025007557. Mit der Tabelle: 1  0. 975  0. 025
4) Mit Excel: 0. 090012472 Mit der Tabelle: 0. 99  0. 90  0. 09
Lernziele
- Mit Excel und einer anderen Methode (nicht an Computer gebunden) die
Wahrscheinlichkeiten für  2 -, t- und F-verteilte Zufallsvariablen berechnen können.
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 167
- Wissen, was Freiheitsgrade ausdrücken (Anzahl unabhängiger Zufallsvariablen,
die in die jeweiligen Summen einfliessen).
___________________________________________________________________
weitere stetige Verteilungen.tex 2. HSW Siders, P.R.
Seite 168
Univariate schliessende Statistik
In der schliessenden Statistik geht es um folgende drei Grundprobleme:
(a) Ist eine bestimmte Hypothese mit den Ergebnissen eines Experimentes
verträglich? Unterscheiden sich zwei Testergebnisse? (z.B. Sind zwei Rohstoffe
bezüglich der Qualität des Endproduktes unterscheidbar? Führt eine bestimmte
Investition in den Maschinenpark zu einer besseren Qualität? Hat ein bestimmtes
Medikament die gewünschte Wirkung? Führt eine neue Mastmethode zu höheren
Erträgen? etc.).
(b) Schätzen von Parametern einer Grundgesamtheit mit Hilfe einer Stichprobe
(Anteile, Mittelwerte: Beispiel: Meinungsumfragen, Marktforschung).
(c) Welche Annahmen über die Grundgesamtheit sind mit einer bestimmten
Stichprobe verträglich (Vertrauensintervalle: z.B. Bei einer Marktforschungsstudie
bemängeln 45% der Befragten einen bestimmten Aspekt eines Produktes. Dieser
Wert ist als Wert einer Zufallsvariablen zu betrachten. Es wäre nützlich zu wissen,
in welchem Intervall sich der tatsächliche Wert mit einer Wahrscheinlichkeit von
95% findet).
Wir werden in der Folge diese drei Grundprobleme eingehender behandeln.
Testen von Hypothesen
1. Diskrete Verteilungen und Tests - Grundbegriffe
Wir wollen uns das Problem des Testens von Hypothesen zuerst an einem
einfachen Beispiel I klar machen. Eine Person behauptet, die Fähigkeit zu haben,
Walliser Dôle von Wadtländer Gamay in einem Blindtest unterscheiden zu können.
Wir überreden die Person, sich einem statistischen Test zu unterziehen. Wir
nehmen z.B. folgende Anordnung vor. Wir füllen 16 Gläser mit Dôle und mit
Gamay von jeweils verschiedenen Produzenten (Die entsprechenden Anteile der
Gläser können beliebig festgelegt werden, z.B. 7 und 9 oder 8 und 8. Die
Versuchsperson darf die Anteile nicht kennen. Wir setzen voraus, dass die
Wahrscheinlichkeit einer zufälligen, richtigen Entscheidung vom Vorliegen von
Gamay oder Dôle nicht beeinflusst wird). Wir ordnen die Gläser nach dem
Zufallsprinzip (indem wir z.B. den Gläsern der Reihe nach Zufallszahlen zuordnen
und die Gläser dann der Grösse der Zufallszahlen nach auf einem Tisch anordnen.
Wir fordern die Versuchsperson auf, die Gläser der Reihe nach zu probieren und
jeweils festzulegen, ob es sich um Dôle oder Gamay handelt.
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
169
Wie gross ist die Wahrscheinlichkeit, zufälliger weise alle Gläser richtig als Dôle
oder als Gamay zu klassifizieren? Die Wahrscheinlichkeit, bezüglich eines
bestimmten Glases die richtige Entscheidung zu treffen, beträgt bei zufälliger
Entscheidung 0. 5. Somit beträgt die Wahrscheinlichkeit, alle Gläser zufälliger weise
richtig zu klassifizieren 0. 5 16  0. 00001525 9  PX  16  16
0. 5 16 0. 5 0 . Gelingt
16
es der Versuchsperson, alle Gläser richtig zu klassieren, ist es zwar immer noch
denkmöglich, dass sie in Tat und Wahrheit die beiden Weinsorten blind nicht
unterscheiden kann und dass sie zufälliger weise die richtige Wahl getroffen hat.
Die Wahrscheinlichkeit dafür ist jedoch sehr klein. Entsprechend sind wir in diesem
Falle bereit, die Hypothese zu verwerfen, dass sie die Gläser nicht unterscheiden
kann.
Nullhypothese und Alternativhypothese
Wir sind im allgemeinen bereit, eine Hypothese H zu verwerfen, wenn die
Wahrscheinlichkeit sehr klein ist, dass bei der Annahme von H das spezifische
Testergebnis zufällig zustande kommt. Im Beispiel nehmen wir an, die
Versuchsperson könne die Weinsorten nicht unterscheiden. Dann ist die
Wahrscheinlichkeit sehr klein, dass sie z.B. mindestens 15 richtige Entscheidungen
trifft, d.h. 15 oder 16 richtige Entscheidungen trifft. Die Hypothese H, die wir
verwerfen, wenn das Testergebnis bei der Annahme von H unwahrscheinlich ist,
nennen wir künftig Nullhypothese H o . Die Alternativhypothese bezeichnen wir mit
H A . Im Weinbeispiel ist
H 0 : ”Die Versuchsperson kann die Weingläser nicht unterscheiden”
H A : ”Die Versuchsperson kann die Weingläser unterscheiden”.
Signifikanzniveau
Traditionell legt man ein bestimmtes Niveau für die Verwerfung der Nullhypothese
fest. Das Verwerfungsniveau wird Signifikanzniveau genannt und gewöhnlich auf
  0. 05 oder   0. 01 festgelegt. Fällt das Testergebnis in einen Bereich, in den
Testergebnisse (bei Annahme der Nullhypothese) nur mit einer Wahrscheinlichkeit
von höchstens 0. 05 oder 0. 01 fallen, so verwerfen wir die Nullhypothese
(gewöhnlich spricht man dann von einem statistisch signifikanten Testergebnis).
Signifikanzniveaus sind jeweils vor einem Test festzulegen. Oft wird die Signifikanz
von Testergebnissen mit einen Stern für das 0. 05 Niveau, mit zwei Sternen für
das 0. 01 Niveau und mit drei Sternen für das 0. 001 Niveau gekennzeichnet.
Legen wir im obigen Beispiel 0. 05 als Signifikanzniveau fest, sind wir bereit, die
Nullhypothese zu verwerfen, wenn für das Testergebnis x des Versuchs bei
Gültigkeit der Nullhypothese gilt: PX  x  0. 05. Die Wahrscheinlichkeit, zufälliger
weise mindestens 15 Gläser richtig zu bestimmen, ist: PX  15  PX  16. Für
die Zufallsvariable X gilt: X  B16, 0. 5 (es gibt nämlich verschiedene
Möglichkeiten, zufälliger weise 15 richtige Entscheidungen zu treffen, nämlich
16
. Jede dieser Möglichkeiten hat eine Wahrscheinlichkeit des Eintreffens von
15
15
0. 5 0. 5 1 . Somit gilt PX  15  16
0. 5 15 0. 5 1  0. 0002441 4). Berechnen wir die
15
entsprechende (umgekehrte), kumulative, relative Wahrscheinlichkeitsverteilung,
erhalten wir:
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
170
Testergebnis xi
16
15
14
13
12
11
10
P(xi)
1.52588E-05
0.000244141
0.001831055
0.008544922
0.027770996
0.066650391
0.122192383
kumulativ
1.52588E-05
0.000259399
0.002090454
0.010635376
0.038406372
0.105056763
0.227249146
Somit sind wir bereit, die Nullhypothese zu verwerfen, wenn die Versuchsperson
mindestens 12 richtige Zuordnungen vornimmt.
Zweiseitige und einseitige Tests
Im obigen Beispiel können wir festlegen, dass wir die Nullhypothese verwerfen,
wenn die Versuchsperson mindestens 12 richtige Entscheidungen trifft. Wir
sprechen in diesem Falle von einem einseitigen Test.
W ahrscheinlichkeitsfunktion
von X ~ B(16,0.5)
0.25
P(xi)
0.2
0.15
0.1
0.05
0
0
5
10
15
xi
α = 0.05
20
Einseitiger Test:   0. 05. Verwerfen der Nullhypothese
bei mindestens 12 richtigen Klassierungen.
Es ist auch möglich, auf Grund inhaltlicher Überlegungen bei einem einseitigen
Test den Verwerfungsbereich (der Nullhypothese) auf der linken Seite der
Verteilung festzulegen.
Beim einseitigen Test interessierten wir uns nicht für den Fall, dass eine Person
fast alle oder alle Entscheidungen falsch trifft. Nehmen wir an, die Person würde 16
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
171
falsche Enscheidungen treffen. Es wäre dann wohl sinnvoll anzunehmen, sie
könne die Weine unterscheiden, würde diesen aber jeweils falsche Ausdrücke
zuordnen. Entsprechend müssten wir den Verwerfungsbereich auf beiden Seiten
der Verteilung festlegen. Bei 0. 05 ergibt sich auf beiden Seiten ein
Verwerfungsbereich von je 0. 025. Betrachten wir wieder unser Beispiel: Bei
beidseitigem Vewerfungsbereich würden wir die Nullhypothese verwerfen, wenn
höchstens 3 oder mindestens 13 richtige Entscheidungen getroffen werden (bei
p  0. 5, ist die Binomialverteilung symmetrisch. Wir können somit durch die
Bestimmung einer Grenze mit Hilfe der obigen Tabelle auch die andere Grenze
bestimmen). Ob beidseitig oder einseitig getestet werden soll, muss vorgängig zu
einem Test auf dem Hintergrund von inhaltlichen Überlegungen festgelegt werden.
P(xi)
Wahrscheinlichkeitsfunktion
von X ~ B(16,0.5)
0.25
0.2
0.15
0.1
0.05
0
0
α/2=0.025
5
10
15
xi
α/2=0.025
20
Zweiseitiger Test:   0. 05. Verwerfen der Nullhypothese
bei höchstens 3 oder mindestens 13 richtigen Klassierungen
p-Wert
Trifft in einem rechtsseitigen, einseitigen Test das Testergebnis x ein, so wird
PX  x ” p-Wert” des Testergebnisses genannt. Im linkseitigen, einseitigen Fall ist
der p-Wert des Testergebnisses x die Wahrscheinlichkeit PX  x.
Im beidseitigen Test ist der p-Wert: 2  minFx, 1  Fx (wobei F die
Verteilungsfunktion ist und minx, y  x genau dann, wenn x  y und minx, y  y
genau dann, wenn y  x. Betrachten wir ein Beispiel: wir legen vorgängig zum
Weinbeispiel fest, dass wir zweiseitig testen wollen. Die Versuchsperson
entscheidet 10 mal richtig. FX  10  0. 894943237. Somit gilt:
1  0. 894943237  0. 105056763 und min0. 894943237, 0. 105056763  0. 105056763.
Der p-Wert ist entsprechend 2  0. 105056763  0. 21011 (wir multiplizieren mit zwei,
da bei einem zweiseitigen Test beide Seiten der Verteilung berücksichtigt werden
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
172
müssen).
Das Verwerfungsprinzip kann für alle drei Fälle wie folgt formuliert werden: Wir
verwerfen die Nullhypothese dann, wenn gilt: bei Zugrundelegung der
Nullhypothese gilt: p-Wert  .
Der Vorteil der Angabe des p Wertes gegenüber einer alleinigen Feststellung der
Signifikanz besteht darin, dass der Leser sieht, ob ein Resultat knapp signifikant ist
oder nicht, oder ob ein Resultat bei weitem nicht signifikant ist.
Verwerfungsprinzip: Wenn
(1) x eintrifft und
(2) p Wert (von x  , bei der Annahme von H 0
dann verwerfen wir H 0 ( ist das Signifikanzniveau;   0. 05 oder   0. 01)
Fehler erster und zweiter Ordnung
Wir nehmen an, dass wir ein Testergebnis erhalten, für dessen p Wert gilt:
p Wert  . Es ist zwar recht unwahrscheinlich, aber trotzdem möglich, dass die
Nullhypothese wahr ist. In diesem Falle verwerfen wir die Nullhypothese
fälschlicher weise. Ein Verwerfen der richtigen Nullhypothese wird ”Fehler erster
Ordnung” genannt (Wenn man einen Test mit einem Signifikanzniveau von 0. 05
und einer richtigen Nullhypothese 100 mal wiederholt, so werden wir mit hoher
Wahrscheinlichkeit einige signifikante Resultate erhalten, nämlich ca. 5 auf 100. Die
Anzahl der signifikanten Resultate ist dabei als Wert einer Zufallsvariable zu
betrachten). Handkehrum ist es möglich, dass wir einen nicht-signifikanten p Wert
erhalten, obwohl die Nullhypothese nicht zutrifft. Diesen Fehler nennt man ”Fehler
zweiter Ordnung”.
Die eingeführten Grundbegriffe (einseitiger und zweiseitiger Test,
Verwerfungsniveau  Signifikanzniveau, Nullhypothese, Alternativhypothese,
p-Wert, Fehler erster und zweiter Ordnung) werden auch für Tests, die eine stetige
Verteilung voraussetzen, verwendet.
Beispiel II. Einer Firma wird vorgeworfen, die Asbest-Grenzwerte in ihren Hallen
nicht einzuhalten. Man einigt sich auf folgenden Test: Es werden 10 mal jeweils ein
Liter Luft untersucht und die Anzahl Asbestfasern gezählt. Der offizielle Grenzwert
liegt bei höchstens 3 Fasern pro Liter. Die Nullhypothese ist: ”Die tatsächliche
Anzahl liegt auf dem Grenzwert (und ist damit noch akzeptabel)”. Die
Alternativhypothese ist: Der Grenzwert wird überschritten ( rechtsseitiger Test).
Wir erhalten für die Proben folgende Resultate: 1, 3, 5, 7, 2, 6, 4, 3, 2, 1 (Anzahl
Fasern pro Liter). Wir können hier mit einer Poisson-Verteilung arbeiten.
(X  P30). 1  3  5  7  2  6  4  3  2  1  34. Durchschnittich liegt das
Resultat somit über dem Grenzwert. Es stellt sich die Frage, ob das Testergebnis
die Nullhypothese wiederlegt. Wir berechnen PX  34  0. 797308325 für
X  P30. Der P-Wert (1  0. 7977308325  0. 202 27 liegt unter dem
Signifikanzniveau. Die Nullhypothese kann nicht verworfen werden. Da
PX  39  0. 953746962 für X  P30, müsste somit die Nullhypothese erst bei 39
Fasern verworfen werden (  0. 05
Übungen:
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
173
1) Eine Person gibt vor, hellseherische Kräfte zu haben. Insbesondere will sie
voraussagen können, ob sich bei einem Münzwurf Kopf oder Zahl ergibt. Denken
Sie sich einen statistischen Test aus, um diese Behauptung zu überprüfen (Legen
sie dabei H 0 und  fest, sowie ob einseitig oder zweiseitig getestet werden soll).
2) Eine Firma beschwert sich bei einem Lieferanten über unterschiedliche
Qualitäten von Lieferungen. Dabei könnten von Auge deutlich zwei Qualitäten
unterschieden werden. Der Lieferant bestreitet die Behauptung. Man einigt sich auf
folgenden Test: 10 Personen untersuchen je 10 Stichproben, die aus den
(angeblich oder wirklich) unterschiedlichen Qualitäten stammen. Als
Signifikanzniveau wird 0. 01 festgelegt. Man testet beidseitig. Legen Sie die
Nullhypothese und die Alternativhypothese fest und berechnen x i , so dass der
p-Wert von x i  0. 01.
3) Eine Firma wird von der Gewerkschaft beschuldigt, weniger als durchschnittlich
für die Sicherheit ihrer Mitarbeiter vorzukehren, da die Unfallquote im Jahre 2000
10 auf 1000 betrug, während sie in vergleichbaren Firmen nur 5 auf 1000 betrug.
Kann die vorliegende Unfallhäufigkeit auch durch Zufall erklärt werden?
(Signifikanzniveau 0. 05
4) In einer Zeitung steht, die Unfälle mit Todesfolge hätten in der Schweiz massiv
zugenommen, da sie von 1000 auf 1100 gestiegen sind. Testen Sie!
5) Eine Unternehmung fertigt mit einer Maschine täglich 100  000 elektronische
Bauteile. Darunter fallen durchschnittlich 5 defekte an. Es wird eine neue Maschine
getestet. In einem Versuch produziert sie nur 2 defekte Bauteile auf 100  000. Ist die
neue Maschine besser?   0. 05
6) Bei einer Lieferung von mechanischen Bauteilen dürfen durchschnittlich nur 5
auf 100000 unbrauchbar sein. Die Lieferungen werden mit folgendem Test
untersucht. Es werden 100 Bauteile (mit Zurücklegen) zufällig gezogen. Wir
nehmen an, bei einer solchen Stichprobe seien 3 Bauteile unbrauchbar. Entspricht
die Lieferung den Qualitätsanforderungen? (Signifikanzniveau 0.05)
7) Bei einer Lieferung von Rohstoffteilen dürfen laut Liefervertrag durchschnittlich
nur 0. 5% mangelhaft sein. Dabei wird der folgende Test verwendet, um die
Einhaltung der Lieferbedingungen zu überprüfen: Es werden 20 Teile zufällig
gezogen (ohne Zurücklegen). Wir nehmen an, bei einer solchen Stichprobe und
einer Lieferung von 200 Teilen seien 2 Bauteile fehlerhaft gewesen. Entspricht die
Lieferung den Lieferbedingungen?
8) Bei einer Lieferung von Zwischenprodukten dürften laut Liefervertrag
durchschnittlich nur 1% mangelhaft sein. Dabei wird der folgende Test verwendet,
um die Einhaltung der Lieferbedingungen zu überprüfen: Es werden 20 Teile
zufällig gezogen (ohne Zurücklegen). Wir nehmen an, bei einer solchen Stichprobe
und einer Lieferung von 500 Teilen seien 2 Bauteile fehlerhaft gewesen. Entspricht
die Lieferung den Lieferbedingungen? (  0. 05
9) Denken Sie sich je eine betriebswirtschaftlich relevante Problemlage aus, die
Sie mit Hilfe eines Binomial- und eines Poisson-Testes lösen können.
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
174
Lösungen
1) H o :”Die Testperson hat keine hellseherische Kräfte”.
H A : Die Testperson hat hellseherische Kräfte und kann mehrheitlich richtige
Voraussagen machen ( rechtsseitiger Test).(Man könnte ähnlich wie oben auch
für einen zweiseitigen Test argumentieren: wenn die Person systematisch falsch
liegt, scheint sie hellseherische Fähigkeiten zu haben. Man könnte die Person in
diesem Falle durchaus bei entsprechenden Spielen einsetzen, um oft zu gewinnen.
Man müsste jeweils auf das Gegenteil dessen setzen, das sie voraussagt. In
diesem Fall würden wir die Alternativhypothese wie folgt formulieren: Die
Testperson kann mehrheitlich richtige oder mehrheitlich falsche Voraussagen
machen). Als Signifikanzniveau legen wir 0.05 fest. Wir könnten z.B. die folgende
Versuchsanordnung festlegen. Wir werfen 20 Münzen. Die entsprechenden
Ereignisse sind binomialverteilt (B20, 0. 5). Wir testen rechtseitig. Mit Hilfe von
Excel erhalten wir:
Anzahl richtiger
Voraussagen xi
20
19
18
17
16
15
14
13
P(xi) umgekehrt kumulativ
9.53674E-07
1.90735E-05
0.000181198
0.001087189
0.004620552
0.014785767
0.036964417
0.073928833
9.5367400E-07
2.0027174E-05
2.0122517E-04
1.2884142E-03
5.9089662E-03
2.0694733E-02
5.7659150E-02
1.3158798E-01
Beim festgelegten Signifikanzniveau wird die Nullhypothese verworfen, wenn die
Testperson mindestens 15 richtige Voraussagen macht.
2) H o : Die zwei Qualitäten können nicht unterschieden werden.
H A : Die zwei Qualitäten können unterschieden werden ( zweiseitiger Test).
Man wählt eine spezifische Anzahl m von Stichproben aus der ersten Qualität, und
die restlichen 100  m aus der anderen Qualität. Wir ordnen den Stichproben
Zufallszahlen zu und ordnen sie der Grösse nach. Je zehn werden dann den
Versuchspersonen zugeteilt. Wir können das ganze als einen Binomial-Test mit
X  B100, 0. 5 ansehen. Mit Excel erhalten wir: mindestens 64 müssen richtig
klassiert werden oder höchstens 100  64  36 (denn
2  0. 00331856  0. 006637 1  0. 01, während 2  0. 006016488  0. 01203 3  0. 01.
xi
P(xi)
66
65
64
63
62
0.000458105
0.000863856
0.001559739
0.002697928
0.00447288
(umgekehrt)
kumulativ
0.000894965
0.001758821
0.00331856
0.006016488
0.010489368
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
175
Wir könnten auch die Normalverteilung verwenden:
x1000.5
1000.5 2
 0. 2x  10  N0, 1.
0. 2x  10  0. 995. Wir erhalten somit: 0. 2x  10  2. 58  x  62. 9. Wir
müssten somit mindestens 63 richtige oder höchstens 100  63  37 richtige
Klassierungen haben. Bei dieser Berechnungsart liegen wir mit der
Signifikanzgrenze etwas zu tief. (Es wäre im Beispiel offensichtlich weniger
aufwendig, wenn man n kleiner ansetzen würde).
3) Wir verwenden die Poisson-Verteilung. H 0 : Die Unfallquote der Firma weicht
nicht von der durchschnittlichen Unfallquote ab. H A : Die Unfallquote der Firma ist
grösser als die durchschnittliche Unfallquote ( rechtsseitiger Test). Wir
berechnen somit PX  10 für X  P5.
PX  10  1  PX  10  1  0. 968171943  0. 03182 8. Somit ist die Abweichung
von der durchschnittlichen Unfallquote als signifikant zu bezeichnen. Die Firma
sollte etwas für den Unfallschutz unternehmen.
4) H o : Die Unfallzahlen unterscheiden sich nicht. H A : Die Unfallzahlen im zweiten
Jahr sind höher ( rechtsseitiger Test). Da sowohl 1000 als auch 1100 als Werte
einer Zufallsvariablen zu betrachten sind, wäre es hier ungünstig, so wie im
Beispiel 3 vorzugehen. Wir können jedoch die Situation so deuten, dass ein Unfall
im ersten Jahr erfolgt oder nicht. Laut Nullhypothese ist dann die
Wahrscheinlichkeit, dass ein Unfall im ersten Jahr erfolgt  0. 5. Wir verwenden
entsprechend eine Binomialverteilung: Wir berechnen PX  1100 für
X  B2100, 0. 5. Mit der Näherungsformel für die Normalverteilung erhalten wir:
110021000.5
1
 1  2. 182 2  1  0. 985452664  0. 01454 7.
21000.50.5
Somit ist das Resultat auf einem Signifikanzniveau von 0. 05 signifikant, auf einem
Niveau von 0. 01 nicht signifikant.
5) H 0 : Die Maschine ist nicht besser. H A : Die Maschine ist besser, d.h. produziert
weniger Ausschuss ( linksseitiger Test). Wir verwenden die Binomialverteilung:
2
X  B100000, 0. 00002. p  100000
 0. 000 02. Wir berechnen den p-Wert:
PX  2  0. 676676416192  0. 05. (Die Normalverteilung darf nicht verwendet
werden, da 100000  0. 00002  1  0. 00002  2  9 Somit gilt: Die Abweichung
vom Mittelwert ist nicht signifikant.
6) H 0 : Die Lieferung entspricht den Qualitätsansprüchen. H A : Die Lieferung
entspricht den Qualitätsansprüchen nicht und weist zuviele defekte Teile auf (
rechtsseitiger Test). Wir wenden einen Binomialtest an: Zu berechnen ist somit
5
PX  3 für X  B100, 100000
 0. 00005. Dabei gilt: PX  2  0. 99999998. Somit
gilt: PX  3  1  PX  2  1  0. 99999998  2. 0  10 8 . Die Abweichung ist
hochsignifikant. Die Lieferung entspricht den Qualitätsansprüchen nicht.
7) H 0 : Die Lieferung entspricht den Qualitätsanforderungen
H 1 : Die Lieferung entspricht den Qualitätsanforderungen nicht ( rechtsseitiger
Test)
  0. 01
Verzichten wir auf Zurücklegen, wird die Hypergeometrische Verteilung
angewendet. Da 0.5% von 200 1 ist, kann es in keiner Stichprobe 2 haben. Somit
ist PX  2  0. Die Nullhypothese muss verworfen werden. Verwenden wir mit
Zurücklegen einen Binomialtest erhalten wir folgendes Resultat:
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
176
Wir berechnen: PX  2  1  PX  2 für X  B20, 0. 005 und erhalten
1  0. 9998663.  1. 337  10 4
Die Nullhypothese ist widerlegt.
8) H 0 : Die Lieferung entspricht den Lieferbedingungen.
H A : Die Lieferung entspricht den Lieferbedingungen nicht.
1% auf 500 macht 5. Wir verwenden einen Hypergeometrischen Test. Wir
berechnen PX  2 für X  HN, M, n  H500, 5, 20 (N für Anzahl
Grundgesamtheit; M für Anzahl Defekte in der Grundgesamtheit; n 
Stichprobengrösse; die Reihenfolge der Angabe der Parameter kann von Buch zu
Buch verschieden sein. Bei Exel wird z.B. eine andere Reihenfolge gewählt).
Anzahl defekte xi
2
3
4
5
Summe:
P(xi)
0.013634848
0.000513446
9.11126E-06
6.07417E-08
0.014157466
Somit ist die Abweichung signifikant. Die Lieferung entspricht den
Lieferbedingungen nicht.
9) (Beispiele der 2. HSW 2000/01
a) Innerhalb eines Jahres gibt es in einer Firma durchschnittlich 5 Ausfälle im
Computersystem mit Schadenfolgen. Die Firma führt ein Qualitätssystem ein. Nach
der Einführung ergeben sich noch 3 Ausfälle. (  0. 05. Hat sich die Einführung
des Qualitätssystems gelohnt?
H 0 : Durch die Einführung des Qualitätssystems hat sich nichts geändert.
H A : Durch die Einführung des Qualitätssystems ergeben sich weniger Ausfälle (
linksseitiger Test).
Wir verwenden einen Poissontest: Wir berechnen PX  3 für X  P5.
Anzahl Ausfälle xi
0
1
2
3
Summe
P(xi)
0.006737947
0.040427682
0.124652019
0.265025915
0.436843564
Das System lohnt sich (unabhängig von allfälligen Kosten) nicht.
b) Bei der Prüfung der Zielerreichung in einer Unternehmung wird eine Stichprobe
von 1000 Mt. (aus 10000) gezogen. Laut Zielvorgabe dürfen höchstens 12 auf
10’000 das Ziel nicht erreichen. Die Stichprobe weist 4 Mt auf, welche das Ziel
nicht erreicht haben. (  0. 05.
H 0 : Die Produktion entspricht den Anforderungen.
H A : Die Produktion entspricht den Qualitätsanforderungen nicht (ist schlechter als
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
177
erwünscht)( rechtsseitiger Test).
(Problem mit der Aufgabenstellung: 1000 Stück für die Stichprobe ist zuviel - kostet
zu viel! Zwar wird das Vertrauensintervall bei grossen Stichproben kleiner, der
Aufwand wird sich jedoch kaum lohnen). Deshalb wählen wir eine kleinere
Stichprobe: 50 und nehmen an, 2 auf 50 hätten das Ziel nicht erreicht. Wir können
einen Binomialtest anwenden - auch wenn wir nicht zurücklegen. Wir müssen
PX  2 für X  P50, 0. 0012 berechnen (1  PX  2  1  0. 998302326  1.
697 7  10 3 ) Es gilt: PX  2  0. 05. Somit muss die Nullhypothese abgelehnt
werden. Mit der Hypergeometrischen Verteilung erhalten wir für
PX  2  0. 001566215 für X  H10000, 12, 50
c) Von 300 dürfen bei der Endkontrolle höchstens 3 Endprodukte fehlerhaft sein.
Wieviele fehlerhaft Stücke dürfen bei einer Stichprobe von 50 Stücken auftreten,
damit die Produktion die Anforderungen erfüllt? Ziehen wir 50 auf 300 ohne
Zurücklegen, müssen wir die Hypergeometrische Verteilung verwenden, bei
Zurücklegen die Binomialverteilung (fehlerhafte Stücke möchte man ja im
Allgemeinen nicht zurücklegen!!!).   0. 05. Wir berechnen somit das maximale x i ,
so dass PX  x i   0. 05 für X  H300, 3, 50.
Anzahl
fehlerhaft xi
P(xi)
umgekehrt
kumulativ
3
2
1
0
0.004399452
0.068741442
0.349318758
0.577540347
0.004399452
0.073140895
0.422459653
1
Wir erhalten:PX  3  0. 004399. Es darf höchstens zwei fehlerhafte Endprodukt
in der Stichprobe haben. Sonst muss die Nullhypothese verworfen werden.
Mit der Binomialverteilung (samt Zurücklegen) erhalten wir: PX  1  0. 910564687
und PX  2  0. 986182729 für X  B50, 0. 01. Somit darf die Stichprobe bei
Verwendung dieser Verteilung höchstens ein fehlerhaftes Stück aufweisen.
d) Typfehler bei der Eingabe von Buchungen. Von der Lehrtochter wurden 200
Buchungen vorgenommen. Diese werden vom Ausbildungschef stichprobenweise
überprüft. Es wird eine Zufallsstichprobe von 20 gezogen, wobei entdeckte Fehler
jeweils korrigiert werden. Der Ausbildungschef betrachtet bei Anfängerinnen und
Anfängern Buchungen mit 2% Fehler als akzeptabel. In der Stichprobe entdeckt
der Ausbildungschef 3 Fehler.
H 0 : Die Lehrtochter macht nicht zuviele Fehler.
H A : Die Lehrtochter macht zuviele Fehler ( rechtsseitiger Test).
Wollen wir eine Hypergeometrische Verteilung verwenden, müssten wir die
Versuchsanordnung ändern: Die Fehler dürften nicht nur korrigiert werden, sondern
müssten auch der Grundgesamtheit entnommen werden. Dies gilt auch für
fehlerlose Buchungen. Man sieht ohne Rechnung, dass es nicht möglich ist, 3
Fehler zu machen, wenn in der Grundgesamtheit 2 vorkommen. Entsprechend gilt
für pX  3  0 für X  H200, 2, 20. Die Nullhypothese muss verworfen werden.
Verwenden wir einen Binomialtest müssen die gezogenen Buchungen jeweils in
die Grundgesamtheit ”zurückgelegt” werden. Damit der Ausbildungschef die Fehler
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
178
trotzdem verbessern kann, kann er Buchungen verbessern und sie entsprechend
markieren. Wird eine solche Buchung nochmals gezogen, gilt sie für die
Berechnung als fehlerhaft. Wir erhalten: PX  3  1  PX  3 
1  0. 992931307  0. 007068 7 für X  B20, 0. 02. Die Lehrtochter macht zuviele
Fehler (Befinden sich zwei Fehler in der Stichprobe, wäre das auch schon zuviel!
Nur bei einem Fehler, muss die Nullhypothese knapp nicht verworfen werden).
___________________________________________________________________
Univariate Teststatistik.tex 2. HSW Siders P.R.
179
2. Univariate Tests mit stetigen Verteilungen
2.1. Einstichprobentests
Im Einstichprobentest vergleichen wir einen Parameter einer Stichprobe mit einem
vorgegebenen Parameter einer Grundgesamtheit, um zu untersuchen ob die
Abweichung signifikant ist oder nicht (wir haben eine Stichprobe, die wir mit
bekannten Parametern einer Grundgesamtheit vergleichen!)
2.1.1. z-Test
Ziel: Getestet wird die Abweichung des Mittelwertes x (Wert der Zufallsvariable X )
einer Stichprobe vom bekannten Mittelwert  o einer Grundmenge
Voraussetzungen: die Zufallsvariablen X i , als deren Werte die Daten x i der
Stichprobe betrachtet werden, sind unabhängig und identisch verteilt. Die Varianz
 2o der Grundmenge ist bekannt (bei kleinen Stichproben - n  30 - müssen die
Daten normalverteilt sein) (stetig, metrisch skaliert).
Beispiel 1: Wir wollen testen, ob sich nach der Einführung einer neuen
Mastmethode das durchschnittliche Gewicht x von n Schweinen signifikant erhöht
hat, wobei die Standardabweichung  o und der Mittelwert  o der Ergebnisse der
traditionellen Mastmethode bekannt ist. Wir nehmen an, die Einzelergebnisse x i ,
die zum Mittelwert x führen, seien voneinander unabhängig, was bei Schweinemast
recht problematisch ist (ansteckende Krankheiten, die sich aufs Gewicht
auswirken!); Zudem nehmen wir an, die Einzelwerte seien gleich verteilt. In einem
konkreten Fall möge gelten:
x  20. 5 kg ( zu testende Grösse);
 o  19. 5 kg
o  2
n  50
H o : Die Ergebnisse der verschiedenen Mastmethoden unterscheiden sich nicht.
H A : Der Mittelwert der neuen Mastmethode ist grösser als der Mittelwert der alten
Mastmethode ( einseitiger, rechtsseitiger Test).
Signifikanzniveau: 0. 01.
Da die standardisierten Mittelwerte (für n unabhängige und gleichverteilte
Zufallsvariablen X i ) laut dem zentralen Grenzwertsatz für genügend grosse n
näherungsweise standardnormalverteilt sind, können wir die Normalverteilung
verwenden, um einen sogenannten z-Test durchzuführen:
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
179
Modell ( Verteilung der zu testenden Grösse):
Z
X  o
o
n
 N0, 1
Zufallsvariable X mit dem Wert x (Mittelwert der n Daten)
 o : Mittelwert der Grundmenge
 o : Standardabweichung der Grundmenge
Man überlege sich die intuitive Bedeutung der Formel
X  o
o
n
: Der Testwert Z weicht
mehr von 0 ab, wenn die Differenz zwischen X und  o grösser ist. Zudem wird der
Testwert kleiner, wenn die Varianz grösser ist (je mehr die Daten streuen, desto
weniger ist die Differenz von X und  o bedeutsam). Der Testwert steigt, wenn die
Zahl der Daten grösser wird (je grösser die Stichprobe, desto eher wird die
Differenz von X und  o bedeutsam.
Fürs Beispiel berechnen wir:
20.519.5
2
50
 3. 535 5. Da 3. 5355  0. 999796456, ist
der p-Wert  1  0. 999796456  2. 035 4  10 4  0. 01. Damit ist der Unterschied
hochsignifikant.
Bei kleinen Stichproben müssen wir prüfen, ob die Daten normalverteilt sind, da
nur der Mittelwert normalverteilter Daten kleiner Stichproben normalverteilt ist. Die
Verteilung der Mittelwerte anderer Verteilungen ist jedoch nur für genügend grosse
n näherungsweise normal.
Beispiel 2: Die durchschnittliche Lebensdauer von Transmissionsriemen eines
bestimmten Typs betrage 7 Monate (Standardabweichung: 1). Bei einem Test wird
eine neue Generation von Riemen untersucht, die zwar teurer sind, für welche die
Werbung jedoch eine längere Lebensdauer verspricht. Es werden 30 Riemen
getestet, die durchschnittlich 7.2 Monate halten. Ist der Unterschied signifikant?
H 0 : Die durchschnittliche Lebensdauer unterscheidet sich nicht.
H A : Die Lebensdauer der neuen Riemen ist länger ( rechtsseitiger Test).
Wir nehmen an, die Lebensdauer der Riemen sei unabhängig und gleichverteilt.
Entsprechend können wir einen z-Test durchführen (Signifikanzniveau 0.01):

7.27
1
30
 1. 095 4  0. 863329244. Der P-Wert ist somit: 1  0. 863329244 
0. 136 67  0. 01.
Der Unterschied der durchschnittlichen Lebensdauer ist nicht signifikant.
2.1.2. Test auf abweichende Varianz (normalverteilte Daten)
Ziel: Getestet wird die Abweichung der Varianz  2 einer Stichprobe von der
bekannten Varianz  20 einer Grundmenge.
Voraussetzungen: Die Zufallsvariablen X i , als deren Werte wir die Daten x i
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
180
auffassen, sind identisch normalverteilt und unabhängig. Die Varianz der
Grundmenge ist bekannt (stetig, metrisch skaliert)
Beispiel 3: Eine Abfüllanlage führt durch zu grosse Streuung zu hohen Verlusten.
Die Streuung der Abfüllanlage ist bekannt und beträgt  o . Die Firma überlegt sich
die Anschaffung einer neuen Maschine, die eine signifikant kleinere Streuung
aufweisen sollte. Als Streuungsmass wird die Varianz verwendet. Die neue
Maschine wird getestet, indem 100 Gläser abgefüllt werden.
H 0 : Die Varianzen unterscheiden sich nicht.
H A : Die Varianz der neuen Abfüllanlage ist kleiner ( linksseitiger Test).
Um das Beispiel zu lösen, brauchen wir einen Ausdruck, der uns die Verteilung der
n
Varianz angibt. Wir definieren die Zufallsvariable S 2 : 1 X  X  2 . Diese
n1
i1

Zufallsvariable weist konkrete Varianzen als Werte auf. Wenn die Xi X
o
standardnormalverteilt und unabhängig sind (und das gilt genau dann, wenn die
Daten x i normalverteilt und unabhängig sind), dann gilt für den Ausdruck laut
n

Definition der  2n Verteilung::  Xi X
 2   2n1 (n ist die Anzahl der unabhängigen
o
i1
Zufallsvariablen X i . Da X aus den X i berechnet wird, gilt für die Zufallszahlen
D i  X i  X : n unabhängige X i ergibt n  1 unabhängige D i . Sind nämlich n  1
Daten und der Mittelwert gegeben, dann ist auch die n  te Zahl bestimmt. Beispiel:
Der Mittelwert von 5 Zahlen 1, 3, 10, 4, x sei 6. Nun kann x berechnet werden:
13104x
 6  x  12).
5
n
Wir erhalten: 
i1
X i X
o
2
 
1
 2o
n
X i  X  2 
i1
1 n1
 2o n1
n
X i  X  2 
i1
n1S 2
 2o
  2n1
Im ersten Schritt klammern wir 12 aus.
o
Im zweiten Schritt erweitern wir mit n  1.
Im dritten Schritt wenden wir die Definition von S 2 an.
Es gilt also:
n1S 2
 2o
  2n1
Zufallsvariable S 2 mit dem Wert  2 der Stichprobe
 2o : Varianz der Grundmenge
n : Anzahl Daten
Nehmen wir nun an, wir haben für die alte Abfüllanlage eine Standardabweichung
von 15 g, für die neue eine solche von 10 g. Es stellt sich die Frage, ob die
Abweichung signifikant ist (  0. 01). Wir müssen zuerst mit Hilfe eines P-P-Plots
untersuchen, ob die Daten normalverteilt sind. Wenn die
Normalverteilungsannahme akzeptiert werden kann, können wir berechnen:
10 2
99  44;
15 2
 299 44  1  0. 999999679  0. 01. Die Varianz der neuen Abfüllanlage
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
181
unterscheidet sich (hoch) signifikant von der alten.
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
182
2.1.3. Test auf Kennzahlen mit bekannter, nicht-normaler Verteilung
Ziel: Getestet wird die Abweichung der Kennzahl einer Stichprobe von der
bekannten Kennzahl einer Grundmenge.
Voraussetzungen: Die Verteilung der Zufallsvariablen X i , als deren Werte wir die
Daten x i auffassen, ist bekannt. Die Kennzahl der Grundmenge ist bekannt. (stetig
metrisch skaliert)
Um eine Näherung der Werte der Verteilung der Kennzahl zu berechnen, erstellen
wir mit Excel 1000 (oder mehr - möglichst viele) Datensätze mit der bekannten
Verteilung. Für jeden Datensatz berechnen wir die entsprechende Kennzahl und
die empirische, relative, kumulative Häufigkeitsverteilung der Kennzahlen. Im Test
verwenden wir dann die Werte dieser relativen Häufigkeitsverteilung.
Beispiel 4: Eine Firma möchte die Varianz der Lebensdauer eines Produktes
verringern. Auf Grund langjähriger und vieler Daten weiss man, dass die Produkte,
die dem gegenwärtigen Produktionsprozess entstammen, exponentialverteilt sind
(  1   2  1. Der neue Produktionsprozess führt zu einer Varianz von 0. 7,
wobei 50 Produkte getestet wurden. Ist der Unterschied der Varianzen signifikant?
H 0 : Die Varianzen unterscheiden sich nicht.
H A : Die Varianz der Stichprobe ist kleiner als die Varianz der alten Daten (
linksseitiger Test). (  0. 05. Kennen wir die Verteilung der Varianz nicht, so
können wir z.B. 1000 exponentialverteilte Datensätze erstellen (siehe Excel-Datei:
”Verteilung Varianz exponentialverteilter Daten.xls”, wo 1020 Sätze verwendet
wurden). Im Beispiel finden wir PX  0. 7  0. 245. Somit ist die Abweichung nicht
signifikant. Signifikant unterschiedlich auf dem 0.05-Niveau wäre eine Varianz von
ca. 0. 64.
Kennen wir die Verteilung der Daten nicht und hat man viele Daten, so gibt es
ebenfalls Verfahren, um die Verteilung von Kennzahlen näherungsweise empirisch
zu bestimmen. So kann man 1000 Zufallsstichproben (z.B. à 50 Daten, mit
Zurücklegen) aus dem Datensatz ziehen und berechnet die Kennzahl für jede
dieser Zufallsstichproben. Die empirische Verteilung der Kennzahlen der
Datensätze entspricht näherungsweise der Verteilung der Kennzahl der Daten.
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
183
2.1.4. t-Test
Ziel: Getestet wird die Abweichung des Mittelwertes einer Stichprobe vom
bekannten Mittelwert einer Grundmenge
Voraussetzungen: die Zufallsvariablen X i , als deren Werte die Daten x i der
Stichprobe betrachtet werden, sind unabhängig und identisch normalverteilt. Die
Varianz der Grundmenge ist unbekannt und wird aus den Daten geschätzt (stetig
metrisch skaliert).
Da wir die Varianz aus den Daten schätzen müssen, ist die empirische Varianz als
n
Wert einer Zufallsvariable S 2  1 X i  X  2 aufzufassen.
n1
Es gilt:
X 
S
n
Zudem gilt:
X 

S2
n
X 

n

1

X 
1

S2
n

1

1
n
i1
X 
S2
2

1

1
n
X 
n1S 2
n1 2

X 

n
n1S 2
n1 2
 N0, 1, wenn n  30 oder wenn die Daten normalverteilt sind
und
- wie bereits gezeigt:
n1S 2
2
  n1 , sofern die Daten normalverteilt sind.
Laut Definition der t-Verteilung gilt somit:
X 

n
n1S 2
n1 2
 t n1 für normalverteilte Daten.
Wir fassen zusammen:
X  0
S
n
 t n1
 0 Mittelwert der Grundgesamtheit
X : Zufallsvariable mit x der Stichprobe als Wert
S : Zufallsvariable mit  der Stichprobe als Wert.
n: Anzahl der Daten
Wir sehen, dass gegenüber dem z-Test nur  0 durch S ersetzt wird, dass jedoch
die Verteilung ändert.
Beispiel: In einem Test wurden die folgenden Bremswege (in Meter) für ein Profil
A ermittelt:
44.5; 55.1; 52.5; 50.2; 45.3; 46.1; 52.1; 50.5; 50.6; 49.2 (
 2  11. 55433333, x  49. 61; n  10).
Für das Profil B ergab sich bisher ein Mittelwert von 55. Ist der Unterschied
signifikant? (  0. 01
H 0 : Die mittleren Bremswege unterscheiden sich nicht.
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
184
H A : Der mittlere Bremsweg von Profil A unterscheidet sich ( zweiseitiger Test).
Wir überprüfen die Daten mit einem P-P-Plot auf Normalverteilung. Mit SPSS
(Graphiken, P-P-Diagramm, Normal) erhalten wir:
P-P-Diagramm von Normal von REIFEN
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Wir entscheiden, dass die Daten (knapp) der Normalverteilungsannahme
entsprechen.
T
49.6155
1
10
11.55433333
  5. 014 4  t 9 .
Wir berechnen mit Excel: t 9 5. 014 4  PT  5. 014 4  0. 000724597  0. 005
(die t-Verteilung ist symmetrisch und Excel liefert die  Werte, d.h.
  1  PT  x). Somit ist das Ergebnis hochsignifikant.
Mit SPSS: Analysieren, Mittelwerte vergleichen, t-Test bei einer Stichprobe,
Mittelwert der Grundgesamtheit (55) für ”Testwert” eingeben. Wir erhalten das
folgende Resultat:
Test bei einer Sichprobe
Testwert = 55
REIFEN
T
-5.014
df
9
Sig. (2-seitig)
.001
Mittlere
Differenz
-5.3900
95% Konfidenzintervall
der Differenz
Untere
Obere
-7.8216
-2.9584
Dabei bezeichnet
T: der obige T-Wert; df: Anzahl Freiheitsgrade (degrees of freedom). ; Sig.
(2-seitig): es wird zweiseitig getestet und das Resultat ist signifikant auf dem
0.001-Niveau. ; Mittlere Differenz: Es wird die mittlere Differenz der Werte der
Stichprobe vom Mittelwert 55 berechnet. ; Konfidenzintervall (Vertrauensintervall)
der Differenzen: Mit einer Wahrscheinlichkeit von 95% befindet sich die mittlere
Differenz im Intervall [-7.8189; -2.9811].
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
185
2.1.5. Vorzeichentest
Ziel: Getestet wird, ob Daten x i einer Stichprobe zum bekannten Median med o einer
Grundmenge passen
Voraussetzungen: die Zufallsvariablen X i , als deren Werte die Daten x i der
Stichprobe betrachtet werden, sind unabhängig. (ordinal oder metrisch skaliert)
Die Vorausetzungen des t-Testes sind recht stark (Normalverteilung der Daten).
Auch beim z-Test müssen wir bei kleinen Datensätzen die Normalverteilung der
Daten voraussetzen. Mit weniger Voraussetzungen kommt der Vorzeichentest aus.
Wir berechnen x i  med o und zählen beim linksseitigen Test die Anzahl der
negativen Vorzeichen (d.h. wir zählen die Anzahl m der Daten x i  med o . Passen
die Daten zum Median, so beträgt die Wahrscheinlichkeit, dass ein Datum kleiner
als der Median ist, 0.5. Wir können somit einen Binomialtest anwenden. Für die
Anzahl der positiven Vorzeichen gilt (wenn keine Daten exakt auf den alten Median
fallen): r  n  m, wobei n die Stichprobengrösse ist. Wir erhalten als p-Wert:
PX  m für X  Bn, 0. 5
für den linksseitigen Test
PX  r für X  Bn, 0. 5
für den rechtsseitigen Test
2 minPX  m, PX  r für X  Bn, 0. 5 für den zweiseitigen Test
Im Reifenbeispiel sei med o  55.
H 0 : Die Daten passen zu einer Verteilung mit dem Median 55
H A : Die Daten passen nicht zu einer Verteilung mit dem Median 55 und liegen
tiefer ( linksseitiger Test). (  0. 05
Wir berechnen nun alle Differenzen x i  55 und zählen die Anzahl der negativen
Vorzeichen dieser Differenzen (d.h. wir zählen die Anzahl m der Bremswege x i , für
die gilt: x i  55. Es sind dies 9 negative Vorzeichen auf 10 Daten. Wir berechnen
also: PX  9 mit X  B10, 0. 5. PX  9  0. 010742188  0. 05. Das Ergebnis ist
signifikant.
Mächtigkeit von Tests
Der Vorzeichentest verwendet nicht alle Informationen der metrisch skalierten
Daten: er berücksichtigt nicht, ob die Daten nahe oder weit vom alten Median
entfernt sind. Damit läuft man Gefahr, Opfer des Fehlers zweiter Ordnung zu
werden. Verringert ein Test A die Gefahr eines Fehlers zweiter Ordnung gegenüber
einem Test B, so sagen wir, dass A mächtiger ist als B. Die Wahrscheinlichkeit
dafür, die falsche Nullhypothese zu verwerfen, wird Macht oder Güte des Testes
genannt. Wir können somit feststellen: Der Vorzeichentest macht weniger
Voraussetzungen, er ist aber weniger mächtig als der t- oder der z-Test bei Daten,
die die Voraussetzungen dieser Tests erfüllen.
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
186
2.1.6. Test auf Anteile
Ziel: Bei den Tests bezüglich Anteilen geht es darum, zu untersuchen, ob der
Anteil einer Stichprobe zum Anteil einer Grundgesamtheit passt.
Wir können bei Einstichproben-Anteilstest die Binomialverteilung verwenden:
Beispiel: Wir nehmen an, der Anteil der Frauen bei den Konsumenten eines
Produktes betrage 0.3. Die Branche möchte diesen Anteil erhöhen und lanciert
eine Werbekampagne. Nach der Kampagne wird eine Stichprobe gezogen, um zu
überprüfen, ob die Kampagne wirksam war. Wir nehmen an, in der Stichprobe (n 
50; die Stichprobe umfasst nur Konsumenten des Produktes) habe sich ein Anteil
Frauen von 0.4 ergeben. Ist der Unterschied signifikant?
H 0 : Die Anteile unterscheiden sich nicht
H A : Der Anteil der Frauen ist gestiegen ( rechtsseitiger Test;   0. 05.
Unter der Nullhypothese beträgt die Wahrscheinlichkeit, eine Frau zu ziehen 0. 3.
Die Situation kann offensichtlich mit Hilfe einer Binomialverteilung modelliert
werden, wenn die Grundgesamtheit genügend gross ist, so dass wir auf
Zurücklegen verzichten können. 0. 4  50  20. Gesucht ist somit PX  20 für
B  50, 0. 3.
Wir erhalten: PX  20  1  PX  20  0. 084803  0. 05.
Der Unterschied der Anteile ist nicht signifikant.
Übungen:
1) Eine Firma untersucht, ob ein neuer Typ von Glühbirnen für ihre Fabrikationsgebäude
sie billiger zu stehen kommt. Die neuen Birnen konsumieren gleichviel Strom wie die
alten, kosten jedoch etwas mehr. Der Lieferant verspricht für die neuen Birnen einen
längere Lebensdauer. Die Firma kennt die durchschnittliche Lebensdauer der alten
Glühbirnensorte: 13 Monate (Standardabweichung: 2). Bevor Sie auf die neuen Birnen
umsteigt, will Sie in einer der Hallen diese testen. 35 Birnen brennen durchschnittlich 14
Monate lang. Ist der Unterschied signifikant (  0. 01? Wieviel darf der
Preisunterschied betragen, damit sich die neuen Birnen lohnen?
2) Eine Eisenwarenfabrik möchte bei der Produktion von Schrauben eine tiefere Varianz
der Länge der Schrauben herbringen, um den Ausschuss zu verringern. Dazu werden
verschiedene neue Maschinen getestet. Die Länge von Schrauben sei normalverteilt. Die
Varianz der bekannten Grundgesamtheit sei 1 mm. Es wird eine Zufallsstichprobe von 50
Schrauben aus einem von einer neuen Maschine produzierten Haufen gezogen
(  0. 01. Für die Messresultate siehe Exceldatei ”Übung 2 Testen auf Varianz.xls” (in
cm). Testen Sie!
3) Ein Produktionsstätte hat bei der Schraubenproduktion für Schrauben, die genau 10 cm
haben sollten, einen mittleren Wert von 9. 9. Sie justiert die Maschine und zieht eine
Stichprobe von 50 Schrauben (für die Messresultate siehe Exceldatei ”Übung 3 Testen
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
187
auf Mittelwert.xls”. Testen Sie (  0. 01.
4) Der Median der Noten einer Klasse (ohne des Fach Buchhaltung) betrage 4.45. In
Buchhaltung werden folgende Noten erzielt: 5.5; 4.5; 4; 3; 3.5; 3.7; 3.3; 5; 4.5; 4.7; 4.8;
4.1; 4.2; 4.3; 4.25. Passen die Daten zum Median der Gesamtnoten? (  0. 01
5) Anton behauptet, 45% der Bevölkerung seien für eine bestimmte politische Vorlage. Es
wird eine Zufallsstichprobe gezogen (50 Personen). Dabei sprechen sich 15 Personen für
die Vorlage aus. Ist die These Antons haltbar? (  0. 05)
6) Finden Sie zu jeder der obigen Problemstellungen eine betriebswirtschaftliche Aufgabe
und lösen Sie diese.
Lösungen
1) H 0 : Die durchschnittliche Lebensdauer der neuen Birnen unterscheidet sich nicht von
der der alten Birnen
H A : Die durchschnittliche Lebensdauer der neuen Birnen ist grösser als jene der alten
Birnen ( rechstseitiger Test).Wir nehmen an, dass die Lebensdauer der Birnen
voneinander unabhängig ist und dass Gleichverteilung vorliegt. Wir können somit den
Z-Test verwenden:

1413
2
35
 2. 958  0. 998451721. Der p-Wert ist somit:
0. 998451721  0. 001548 3  0. 01.
Der Unterschied in der Lebensdauer ist signifikant.
y
Durschnittlich kostet eine neue Birne pro Monat 14x und eine alte 13 (x und y sind die
Preise der jeweiligen Birnen). Die neuen Birnen lohnen sich, wenn
y
x
 13 . xy  14
(da y  0). Somit muss das Preisverhältnis xy  14
 1. 076 9
14
13
13
sein (die neue Birne darf nicht mehr als 7. 69% teurer sein).
2) H 0 : Die Varianzen unterscheiden sich nicht.
H A : Die Varianz der Stichprobe ist kleiner als die Varianz der alten Grundgesamtheit
( linksseitiger Test).
Wir überprüfen die Daten auf Normalverteilung (mit P-P-Plot):
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
188
P-P-Diagramm von Normal von Reifen
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Daten sind deutlich normalverteilt
Die Varianz der Stichprobe beträgt:  2  0. 01
2
50  1  4. 9   249
Wir erhalten: S 2 n  1  0.01
0.1
o
Für 4.9 erhalten mir mit Excel den näherungsweisen  Wert 1: Da wir linksseitig testen,
gilt pX  4. 9  1  1  0  0. 01.
Die Differenz ist signifikant.
3) H 0 : Die Mittelwerte unterschieden sich nicht.
H A : Der neue Mittelwert liegt höher ( rechtsseitiger Test).
Da wir die Varianz der Grundmenge nicht haben, müssen wir den t-Test verwenden.
Wir überprüfen die Daten auf Normalverteilung (mit P-P-Plot).
Mit SPSS erhalten wir:
P-P-Diagramm von Normal von SCHRAUBE Übung 3
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
189
Die Daten können knapp als normalverteilt betrachtet werden.
Die Varianz der Stichprobe beträgt:  2  0. 001652244; der Mittelwert: 9. 99.
X 
9.999.9
Wir erhalten als Testgrösse: S 0  0.001652244
 15. 656  t 49
n
50
Mit Excel erhalten wir: p  Wert  5. 28185E  21
Die Abweichung ist hochsignifikant.
Mit SPSS erhalten wir:
Test bei einer Sichprobe
Testwert = 9.9
SCHRAUBE
T
15.656
df
49
Sig. (2-seitig)
.000
Mittlere
Differenz
9.000E-02
95% Konfidenzintervall
der Differenz
Untere
Obere
7.845E-02
.1016
4) Noten sind ordinalskaliert. Somit kommen der z-Test und der t-Test nicht in Frage.
H 0 : Die Buchhaltungsnoten weichen nicht von den übrigen Noten ab.
H A : Die Buchhaltungsnoten liegen signifikant tiefer ( linksseitiger Test).
Wir verwenden den Vorzeichentest: Wir zählen die Noten, die kleiner als 4. 45 sind. Es
sind dies 9 auf 15. Wir berechnen für X  B15, 0. 5
PX  9  1  pX  9  0. 303619385  0. 01. Die Buchhaltungsnoten unterscheiden
sich nicht-signifikant von den übrigen Noten.
5) Wir testen zweiseitig:
H 0 : Die Zufallsstichprobe passt zu einem Anteil von 0.45.
H A : Die Zufallstrichprobe passt nicht zu einem Anteil von 0.45.
Wir erhalten: PX  15  1  0. 010383581 für X  B50; 0. 45
Wir erhalten: PX  15  0. 010383581.
Der p-Wert ist somit: 2  0. 010383581  0. 02076 7  0. 05.
Die Abweichung ist signifikant. Die Erhebungsresultate sind mit der Meinung Antons
nicht verträglich.
Lernziele
- Grundbegriffe der Testtheorie kennen und korrekt anwenden können (Nullhypothese;
Alternativhypothese; Signifikanzniveau; rechtseitiger, linksseitiger und zweiseitiger Test;
p-Wert; Fehler 1. und 2. Ordnung).
- Verwertungsprinzip formulieren und anwenden können
- Tests mit diskreten Verteilungen (Binomial, Poisson, Hypergeometrisch) durchführen
können (Übungen von der Art des Übungsblocks lösen können).
- Den Begriff des ”Einstichprobentests” kennen und die Situation beschreiben können, für
die Einstichprobentests verwendet werden. Folgende Einstichprobentests
situationsgerecht auswählen und durchführen können: z- Test, Test auf abweichende
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
190
Varianz, t-Test, Vorzeichentest, Test auf Anteile.
- Begriff der ”Mächtigkeit eines Tests” kennen
- Übungen von der Art des Übungsblocks lösen können (von Hand, mit Excel, mit SPSS).
___________________________________________________________________
Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R.
191
2.2. Zweistichprobentests
2.2.1. Verbundene Stichproben
Von verbundenen Stichproben reden wir, wenn zwei Stichproben vorliegen und
Messungen x i und y i beider Stichproben x und y jeweils zu denselben Objekten i
gehören (z.B. 17 Personen werden darauf hin untersucht, wie sie auf Alkohol
reagieren, indem die jeweilige Reaktionszeit in Sekunden gemessen wird. Für jede
der 17 Personen wird die Reaktionszeit vor und nach dem Alkoholgenuss
gemessen, wobei jeder Person das Äquivalent von 0. 0005  G (G  Gewicht in
Kilogramm) in Gramm Alkohol verabreicht wird
2.2.1.1. t-Test
Ziel: Zwei gepaarte Stichproben werden verglichen, um zu entscheiden, ob sie zur
selben Grundgesamtheit gehören.
Voraussetzungen: Die Differenzen der Daten sind unabhängig und gleichverteilt.
Die Varianz der Differenzen wird aus den Daten geschätzt. Die Differenzen
müssen normalverteilt sein (metrisch skaliert)
Wir können diesen Fall auf den Einstichprobenfall zurückführen, indem wir die
Differenzen der gepaarten Daten verwenden und den Mittelwert der
Null-Hypothese mit 0 identifizieren. Wir erhalten:
T

D
Sd
 t n1
n
 : Zufallsvariable mit dem Mittelwert der Differenzen d als Wert
D
S d : Zufallsvariable mit der Standardabweichung  d der Diffferenzen als Wert
n: Anzahl Differenzen
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 191
Beispiel 1: Wir nehmen an, es würde sich für die Personen die folgenden
Reaktionszeiten vor und nach dem Alkoholgenuss ergeben: (Die Daten finden Sie
unter ”Verbundene Stichproben, Beispiel 1.xls)”
Proband
vorher
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1.0094457
1.14380179
1.1352306
0.94454264
1.06805223
0.85907117
0.87344145
1.07597525
1.01924109
0.88134543
1.00395228
0.95419014
1.05589406
1.0181175
1.22965021
0.90778402
0.95258204
nachher
Differenzen
1.88997984
-0.88053414
2.11894739
-0.9751456
2.01103206
-0.87580146
1.79720411
-0.85266147
1.93721726
-0.86916503
1.66888887
-0.8098177
1.72031967
-0.84687822
1.96575519
-0.88977994
1.89280853
-0.87356744
1.82893329
-0.94758786
1.91036646
-0.90641418
1.85323718
-0.89904704
1.9774006
-0.92150653
1.88238345
-0.86426594
2.13653477
-0.90688455
1.81336351
-0.90557949
1.88715504
-0.934573
Wir müssen die Differenzen auf Normalverteilung prüfen.
P-P-Diagramm Normal Differenzen
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Differenzen können als normalverteilt angesehen werden.
Der Mittelwert der Differenzen beträgt: 0. 891718213
Die Standardabweichung der Differenzen beträgt: 0. 040089677
H o : Die Reaktionszeit verändert sich nicht.
H A : Die Reaktionszeit ist länger ( rechtsseitiger Test). (  0. 05
Die t-Verteilung ist symmetrisch. Je nachdem, ob wir die erste Reihe von der
zweiten oder die zweite von der ersten abzählen, erhalten wir ein anderes
Vorzeichen des Mittelwertes. So wie wir oben abgezählt haben, wird der
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 192
rechtsseitige Test zum linksseitigen Test.
Wir berechnen: t 16 

D
Sd

n
0.891718213
0.040089677
17
 91. 711
t91. 711  1. 65978E  23. Die Nullhypothese muss verworfen werden.
t-Test für verbundene Stichproben mit Excel
Befehl: Statistik, ttest
Syntax
TTEST(Matrix1;Matrix2;Seiten;Typ)
Matrix1 ist die erste Datengruppe.
Matrix2 ist die zweite Datengruppe.
Seiten bestimmt die Anzahl der Endflächen (Schwänze). Ist Seiten  1, verwendet
TTEST eine Endfläche (einseitiger Test). Ist Seiten  2, verwendet TTEST zwei
Endflächen (zweiseitiger Test).
Typ bestimmt die Form des durchzuführenden t-Testes.
Ist Typ gleich
Wird folgender Test ausgeführt
1
Gepaart
2
Zwei Stichproben, gleiche Varianz (homoskedastisch)
3
Zwei Stichproben, ungleiche Varianz (heteroskedastisch)
Für die obigen Daten erhalten wir als P-Wert 1.65989E-23
t-Test für verbundene Stichproben mit SPSS
Befehl: Analysieren, Mittelwerte vergleichen, t-Test bei gepaarten Stichproben. Wir
erhalten als Resultat für die obigen Daten:
Test bei gepaarten Stichproben
Gepaarte Differenzen
VORHER NACHHER
Mittelwert
Standardab
weichung
Standardfe
hler des
Mittelwertes
-.8917
4.009E-02
9.723E-03
95% Konfidenzintervall
der Differenz
Untere
Obere
-.9123
-.8711
T
df
-91.71
16
Dabei ist der ”Standardfehler des Mittelwertes” die geschätzte Standabweichung
des Mittelwertes der Differenzen.
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 193
Sig.
(2-seitig)
.000
2.2.1.2. Vorzeichentest
Ziel: Zwei gepaarte Stichproben werden verglichen, um zu entscheiden, ob sie zur
selben Grundgesamtheit gehören.
Voraussetzungen: Die Differenzen der Daten sind unabhängig und gleichverteilt.
(metrisch oder ordinal skaliert)
Den Vorzeichentest können wir verwenden, wenn die Annahmen des t-Testes nicht
erfüllt sind oder wenn wir ordinalskalierte Daten verwenden. Bei metrisch skalierten
Daten berechnen wir die Differenz der Daten und zählen die negativen oder
positiven Vorzeichen. Bei ordinalskalierten Daten steht eine Relation R zur
Verfügung (z.b. des Besserseins). Wir zählen die Anzahl der Paare x i , y i   R.
Unter der Nullhypothese setzen wir die Binomialverteilung voraus (p  0.5).
Beispiel 2 (metrisch skaliert): 10 Personen werden darauf hin untersucht, wie
ihre Konzentrationsfähigkeit bei der Arbeit von Musik abhängt. Die
Konzentrationsfähigkeit wird mit in Geld messbarem Output pro Tag gemessen. An
einem Tag arbeiten die Personen mit Musik ihrer Wahl, am anderen Tag ohne
Musik (dabei ist auf Gleichheit der übrigen Bedingungen zu achten. Es wäre
ungünstig, eine Messung an einem Hochdrucktag und die andere an einem
Föhntag vorzunehmen!). Wir nehmen an, wir würden die folgenden Daten erhalten
(die Daten finden Sie unter ”Verbundene Stichproben, Beispiel 2.xls”).
mit Musik
349
358
364
351
342
403
412
377
374
381
ohne Musik
365
370
365
365
350
390
400
380
380
370
Differenzen
16
12
1
14
8
-13
-12
3
6
-11
Da wir nicht wissen, ob sich Musik positiv oder negativ auf die
Konzentrationsfähigkeit (so wie sie gemessen wird) auswirkt, machen wir einen
zweiseitigen Test:
H 0 : Musik wirkt sich nicht auf die Konzentration aus.
H A : Musik macht einen Unterschied ( zweiseitiger Test) (  0. 05
Da die Daten metrisch skaliert sind, denken wir zuerst an einen t-Test. Deshalb
überprüfen wir die Differenzen auf Normalverteilung:
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 194
P-P-Diagramm Normal Musik
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Wir kommen zum Schluss, dass die Differenzen eventuell nicht normalverteilt sind.
Deshalb verwenden wir einen Vorzeichentest. Wir haben 3 negative Differenzen
(auf 10). Unter der Nullhypothese betrage die Wahrscheinlichkeit, eine positive
oder eine negative Differenz zu haben,   0. 05. Als p-Wert erhalten wir somit:
2  pX  3  2  0. 171875  0. 343 75  0. 05 (oder 0. 171875  0. 025. Die
Nullhypothese kann nicht verworfen werden mit X  B10, 0. 5.
Vorzeichentest für verbundene Stichproben auf SPSS
Der zweiseitige Vorzeichentest für gepaarte Stichproben wird von SPSS
angeboten. Befehle: Analysieren, Nicht-Parametrische Tests, zwei verbundene
Stichproben, Vorzeichentest.
Für die obigen Daten erhalten wir:
Häufigkeiten
N
OHNE - MUSIK
Negative Differenzena
Positive Differenzenb
Bindungen c
Gesamt
3
7
0
10
a. OHNE < MUSIK
b. OHNE > MUSIK
c. MUSIK = OHNE
Als ”verbunden” werden von SPSS Differenzen bezeichnet, die 0 sind.
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 195
Statistik für Testb
OHNE MUSIK
Exakte Signifikanz
(2-seitig)
a
.344
a. Verwendetete Binomialverteilung.
b. Vorzeichentest
Beispiel 3: (ordinal skaliert): Wir überprüfen, ob sich die Probanden mit oder
ohne Musik bei der Arbeit subjektiv besser fühlen. Durch Befragung haben wir
folgende Resultate erhalten. (Ich fühle mich sehr gut (5), gut (4), ziemlich gut
(3), ungut (2), schlecht (1).
Proband
mit Musik
1
2
3
4
5
6
7
8
9
10
11
12
ohne Musik
4
1
2
3
2
5
5
2
3
3
3
3
3
2
4
1
1
2
4
3
1
5
1
2
H 0 : Musik hat keinen Einfluss auf die Befindlichkeit. H A : Musik hat einen positiven
Einfluss auf die Befindlichkeit ( rechtsseitiger Test) (  0. 05
Es ergeben sich die folgenden Resultate ( für ”es geht besser mit Musik” und - für
”es geht besser ohne”).
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 196
Proband
Vorzeichen
der
Änderung
1
2
3
4
5
6
7
8
9
10
11
12
+
+
+
+
+
+
+
+
8 auf 12 Personen fühlen sich mit Musik bei der Arbeit besser, 4 hingegen
schlechter. Wir erhalten für PX  8  0. 193847656 für X  B12, 0. 5. Der p-Wert
ist grösser als das Signifikanzniveau. Das Resultat ist nicht signifikant.
Mit SPSS können wir einen solchen Vorzeichentest mit dem Binomialtest
ausführen, indem wir die die obige Veränderungsspalte verwenden, wobei wir z.B.
”” durch ”2” und ”-” durch ”1” ersetzen. (Analysieren, nicht parametrische Tests,
Binomial). Wir erhalten mit der ersten Spalte:
Test auf Binomialverteilung
besser mit Musik
Gruppe 1
Gruppe 2
Gesamt
Kategorie
2.00
1.00
N
8
4
12
Beobachteter
Anteil
.67
.33
1.00
Für den einseitigen Test erhalten wir somit einen p-Wert von
Testanteil
.50
0.388
2
Exakte
Signifikanz
(2-seitig)
.388
 0. 194
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 197
2.2.1.3. Rangsummentest für verbundene Stichproben (Wilcoxon-Test)
Ziel: Zwei verbundene Stichproben werden verglichen, um zu entscheiden, ob sie
zur selben Grundgesamtheit gehören.
Voraussetzungen: Die Differenzen der Daten sind unabhängig und gleichverteilt.
(metrisch skaliert) (es sollte nicht zuviele gleiche Differenzen geben und diese
Gruppen von Differenzen sollten nicht zu gross sein). Die Differenzen sollten
symmetrisch um ihr arithmetisches Mittel liegen.
Der Vorzeichentest berücksichtigt nicht, wie stark die Abweichungen der
Differenzen vom Mittelwert sind. Diesem Nachteil entgeht der Rangsummentest.
Wir ordnen den Betrag der Differenzen der Grösse nach. 0-Differenzen lassen wir
weg. In einem ersten Durchlauf nummerieren wir die verbleibenden Differenzen der
Grösse nach. In einem zweiten Durchlauf ordnen wir gleichen Differenzen (
verbundenen Rängen) das arithmetische Mittel der zugeordneten Nummern zu.
Beispiel:
Betrag der
Differenzen
Summen
Nummerierung Ränge
7
1
1
6
2
2
5
3
4
5
4
4
5
5
4
4.5
6
6
4
7
7.5
4
8
7.5
3.5
9
9
3
10
10
55
55
Das Beispiel enthält für die Anwendung des Wilcoxon-Testes zu viele verbundenen
Ränge. Es ging hier aber ums Beispiel für die Berechnugn der Ränge bei
verbundenen Rängen.
Wir zählen nun die Ränge der negativen (oder positiven) Differenzen zusammen.
Wir bezeichnen diese Zahl mit R  oder R  . R i ist als Wert einer Zufallsvariable zu
nn1
betrachten, wobei gilt: R   R   2 (n  Anzahl der von 0 verschiedenen
nn1
Differenzen, 2  Summe aller Ränge).
Die kritischen Werte dieser Verteilung für n  25 (n  Anzahl der von 0
verschiedenen Differenzen) sind für die jeweils kleinere Rangsumme in Tabellen
angegeben:
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 198
Kritische Werte (einseitige Fragestellung) bei α=
0.025
0.01
0.005
Kritische Werte (zweiseitige Fragestellung) bei α=
0.05
0.02
0.01
6
0
7
2
0
8
4
2
0
9
6
3
2
10
8
5
3
11
11
7
5
12
14
10
7
13
17
13
10
14
21
16
13
15
25
20
16
16
30
24
20
17
35
28
23
18
40
33
28
19
46
38
32
20
52
43
38
21
59
49
43
22
66
56
49
23
73
62
55
24
81
69
61
25
89
77
68
n
Für n  25 kann die Standardnormalverteilung verwendet werden, wobei bei der
z-Standardisierung der folgende Wert für die Standardabweichung eingesetzt wird:
nn12n1
R 
24
n die Anzahl der Differenzen. Die Summe aller Ränge beträgt
Entsprechend ist der Erwartungswert  0 dann
Wir erhalten Z 
Ri
nn1
4
nn12n1
24
nn1
2
2

nn1
4
nn1
2
.
.
 N0, 1.
Beispiel 4: Die SUVA macht eine Unfallverhütungskampagne in Betrieben und
möchte deren Wirkung überprüfen. In 12 zufällig ausgewählten Betrieben wird die
Unfallhäufigkeit vor und nach der Kampagne während eines Jahres erhoben.
H 0 : Die Kampagne hat nichts bewirkt.
H A : Die Kampagne hat die Unfallhäufigkeit gesenkt ( linksseitiger Test).
  0. 025
Bei der Erhebung ergaben sich folgende Daten:
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 199
Betrieb;
vorher
1
2
3
4
5
6
7
8
9
10
11
12
78
di
nachher
7
22
7
11
3
8
13
5
20
9
12
10
Summen
2
15
5
12
5
7
9
12
15
6
6
2
Beträge
5
7
2
-1
-2
1
4
-7
5
3
6
8
5
7
2
1
2
1
4
7
5
3
6
8
Wir ordnen die Beträge und erhalten:
Betrieb
vorher
4
6
3
5
10
7
1
9
11
2
8
12
78
nachher
11
8
7
3
9
13
7
20
12
22
5
10
Beträge
di
12
7
5
5
6
9
2
15
6
15
12
2
-1
1
2
-2
3
4
5
5
6
7
-7
8
no(di)
1
1
2
2
3
4
5
5
6
7
7
8
1
2
3
4
5
6
7
8
9
10
11
12
r(di)
1.5
1.5
3.5
3.5
5
6
7.5
7.5
9
10.5
10.5
12
78
Wenn die Kampagne die Unfallhäufigkeit senkt, muss die Anzahl der positiven
Differenzen die Anzahl der negativen Differenzen übersteigen. Je grösser die
Abweichung der Unfallhäufigkeiten ist, desto grösser werden die positiven
Differenzen ausfallen und desto kleiner die negativen Differenzen. Dies wird sich
auf die entsprechenden Rangsummen auswirken.
Wir zählen nun die Summe der Ränge der negativen Differenzen
k
zusammen:R   rd i  für d i  0

i1
1. 5  3. 5  10. 5  15. 5
Entsprechend haben die Differenzen mit positiven Vorzeichen die Rangsumme
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 200
78  15. 5  62. 5.
Wäre die Kampagne wirkungslos gewesen, müsste sich für die Summe der Ränge
der negativen Differenzen ein Wert geben, der nicht zu stark von 782  39 abweicht.
Je mehr die Summe der Ränge der negativen Differenzen davon abweicht, desto
unwahrscheinlicher ist das Ergebnis unter der Nullhypothese. Laut Tabelle ist 14
der kritische Wert für den einseitigen Test. Entsprechend ist eine Rangsumme von
15.5 nicht genügend. Die Nullhypothese kann (knapp) nicht abgelehnt werden.
Überprüfung der Symmetrie erfolgt graphisch mit SPSS. Wir erstellen eine neue
Variable, die wir z.B. mit 1 auffüllen. Dann Graphiken, Streudiagramm, x-Achse
Daten, y-Achse die neue Variable mit 1. Fürs obige Beispiel erhalten wir:
1.6
1.4
1.2
1.0
.8
DUMM
.6
.4
-8
-6
-4
-2
0
2
4
6
8
10
Differenzen
Mittelwert:2.5833
Die Daten sind nicht ausgeprägt symmetrisch verteilt. Wir verzichten allerdings auf
die Anwendung des Testes nur bei grober Verletzung der
Symmetrie-Voraussetzung.
Betrachten wir den Fall, dass sich bei der obigen Alternativhypothese für R  der
Wert 70 ergibt. H 0 kann in diesem Fall nicht zurückgewiesen werden, da wir einen
linksseitigen Test durchführen. Im Falle von H A : ”Es hat sich eine Änderung
ergeben” ( zweiseitig), könnte die Nullhypothese jedoch zurückgewiesen werden,
da 78  70  8 und bei   0. 025 für n  12 die kritische Grenze bei 10 (für
zweiseitig, die Tabelle gibt den Wert für   0. 02  0. 025 an) liegt.
Rangsummentest für verbundene Stichproben mit SPSS (Wilcoxon-Test)
Befehl: Analysieren, nicht-parametrische Tests, zwei verbundene Stichproben,
Wilcoxon-Test
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 201
Ränge
N
NACHHER - VORHER
Negative Ränge
Positive Ränge
Bindungen
Gesamt
9a
3b
0c
12
Mittlerer Rang
6.94
5.17
Rangsumme
62.50
15.50
a. NACHHER < VORHER
b. NACHHER > VORHER
c. VORHER = NACHHER
Statistik für Testb
Z
Asymptotische
Signifikanz (2-seitig)
NACHHER VORHER
-1.846a
.065
a. Basiert auf positiven Rängen.
b. Wilcoxon-Test
Zu beachten ist, dass SPSS einen zweiseitigen Test ausführt. Wir führten jedoch
einen linksseitigen Test aus. Der Output von SPSS kann jedoch leicht jeweils
umgerechnet werden. SPSS liefert den p-Wert unter ”Signifkanz”. Den p-Wert für
den einseitigen Test erhalten wir durch Halbieren. Somit wäre bei einem   0. 05
(einseitiger Test) das Ergebnis signifikant.
Übungen
1) Wir nehmen an, bei der Verabreichung eines Medikamentes würden sich die
Reaktionszeiten wie folgt verändern (Daten: verbundene Stichproben, Übung 1.xls)
Testen Sie, ob die Verabreichung des Medikamentes einen Einfluss hat.
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 202
Proband
Reaktionszeit
Reaktionszeit
vorher
nachher
1
1.44926179
2.53774216
2
1.51860562
2.51134779
3
1.54930178
2.39915452
4
1.51186391
2.47228287
5
1.5549234
2.29781149
6
1.7348597
1.61129094
7
1.35740422
2.732258
8
1.56744031
2.52955866
9
1.56329322
2.50735359
10
1.39828206
2.60729835
11
2.1989989
1.8989809
12
1.48037192
2.39604065
13
1.63532618
2.29897119
14
1.44102105
2.26772705
15
1.49037659
2.35503986
2) In einem Lieferdienst wird der Fahrzeugpark bezüglich der Effizienz zweier
Schmieröle überprüft. Für die Daten siehe ”verbundene Stichproben, Übung 2”.
Testen Sie, ob Schmieröl 2 besser ist.
3) Denken Sie sich für jede der obigen Fragestellungen ein betriebswirtschaftliches
Problem aus und lösen Sie es.
Lösungen:
1) H 0 : Das Medikament hat keinen Einfluss.
H A : Das Medikament hat einen Einfluss ( zweiseitiger Test). (  0. 05
Wir möchten einen t-Test anwenden und überprüfen deshalb zuerst die
Normalverteilungsannahme:
P-P-Diagramm Normal Medikament
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Daten sind kaum normalverteilt. Entsprechend müssen wir einen Vorzeichen
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 203
oder eine Rangsummentest durchführen. Für den Rangsummentest erhalten wir
mit SPSS:
Ränge
N
NACHHER - VORHER
Negative Ränge
Positive Ränge
Bindungen
Gesamt
2a
13b
0c
15
Mittlerer Rang
1.50
9.00
Rangsumme
3.00
117.00
a. NACHHER < VORHER
b. NACHHER > VORHER
c. VORHER = NACHHER
Statistik für Testb
Z
Asymptotische
Signifikanz (2-seitig)
NACHHER VORHER
-3.237a
.001
a. Basiert auf negativen Rängen.
b. Wilcoxon-Test
Das Resultat ist hoch signfikant.
Wir berechnen das Ganze noch von Hand:
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 204
Proband
Reaktions
Reaktions
Differenzen di
Beträge
no(di) r(di)
zeit vorher
zeit nachher
geordnet
6
1.7348597 1.61129094
0.12356876
0.12356876
1
1
11
2.1989989
1.8989809
0.300018
0.300018
2
2
13 1.63532618 2.29897119
-0.66364501
0.66364501
3
3
5
1.5549234 2.29781149
-0.74288809
0.74288809
4
4
14 1.44102105 2.26772705
-0.826706
0.826706
5
5
3 1.54930178 2.39915452
-0.84985274
0.84985274
6
6
15 1.49037659 2.35503986
-0.86466327
0.86466327
7
7
12 1.48037192 2.39604065
-0.91566873
0.91566873
8
8
9 1.56329322 2.50735359
-0.94406037
0.94406037
9
9
4 1.51186391 2.47228287
-0.96041897
0.96041897
10
10
8 1.56744031 2.52955866
-0.96211835
0.96211835
11
11
2 1.51860562 2.51134779
-0.99274217
0.99274217
12
12
1 1.44926179 2.53774216
-1.08848036
1.08848036
13
13
10 1.39828206 2.60729835
-1.2090163
1.2090163
14
14
7 1.35740422
2.732258
-1.37485378
1.37485378
15
15
120
120
Es gibt zwei positive Differenzen mit den Rängen 1 und 2.
Dies ergibt für die kleinere Rangsumme 3: Dies liegt weit unter jeglichen kritischen
Werte für n  15 (nämlich 25, 20, 16).
Überprüfung der Symmetrievoraussetzung:
1.6
1.4
1.2
1.0
.8
DUM
.6
.4
-1.5
-1.0
-.5
0.0
.5
Differenzen
Mittelwert: -.7981
Auch hier gilt, dass die Symmetriebedingungen nicht besonders gut erfüllt ist.
Trotzdem würden wir den Test anwenden. Es empfiehlt sich aber in diesem Fall
gewiss noch den Vorzeichentest auszuführen, der nicht auf der
Symmetriebedingung fusst.
Mit Hilfe des Vorzeichentests erhalten wir: 2 auf 15 sind positiv. Dies ergibt:
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 205
0. 003692627  0. 025
Somit ist das Ergebnis signifikant. Mit SPSS erhalten wir:
Häufigkeiten
N
NACHHER - VORHER
Negative Differenzena
Positive Differenzenb
Bindungen c
Gesamt
2
13
0
15
a. NACHHER < VORHER
b. NACHHER > VORHER
c. VORHER = NACHHER
Statistik für Testb
NACHHER VORHER
Exakte Signifikanz
(2-seitig)
a
.007
a. Verwendetete Binomialverteilung.
b. Vorzeichentest
2) H 0 : Die beiden Öle unterscheiden sich nicht.
H A : Die beiden Öle unterscheiden sich. ( zweiseitiger Test).
Wir denken an einen t-Test und überprüfen die Differenzen auf Normalverteilung.
P-P-Diagramm Normal Schmieröl
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Normalverteilungsannahme ist offenbar haltbar. Wir können somit den t-Test
anwenden. Wir berechnen die Differenzen, den Mittelwert der Differenzen und
deren Standardabweichung: wir erhalten: d  5. 018708587;  d  3. 832234822
In die Formel eingesetzt erhalten wir:
5.018708587
3.832234822
58
  9. 973 6
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 206
t 57 9. 9736  2. 07131E  14
Das Testergebnis ist hoch signifikant.
Mit SPSS erhalten wir:
Test bei gepaarten Stichproben
Gepaarte Differenzen
Schmieröl 1 Schmieröl 2
Mittelwert
Standardab
weichung
Standardfe
hler des
Mittelwertes
-5.0187
3.8322
.5032
95% Konfidenzintervall
der Differenz
Untere
Obere
-6.0263
-4.0111
T
df
Sig.
(2-seitig)
-9.974
57
.000
___________________________________________________________________
Zweistichprobentestes.text 2. HSW Siders P.R. Seite 207
2.2. Unverbundene Stichproben
Es werden zwei Stichproben gezogen, so dass die Daten unverbunden sind, d.h.
die Daten der zwei Stichproben gehören nicht zu jeweils gleichen Objekten. Dabei
wird überprüft, ob es haltbar ist, dass die zwei Stichproben zu Populationen mit
identischen Parametern gehören.
2.2.1. Testen von Varianzen
Ziel: Die Varianzen zweier Stichproben werden verglichen, um zu entscheiden, ob
die zwei Populationen, aus denen sie gezogen wurden, identische Varianzen  21
und  22 aufweisen.
Voraussetzungen: Die Daten sind unabhängig und identisch normalverteilt
(metrisch skaliert).
Sind die Daten normalverteilt, dann gilt - wie bereits gezeigt - für die Zufallsvariable
n 1 1S 21
n 1S 2
  n2 1 1 . Ebenso gilt für 2 2 2   n2 2 1 . Laut Definition der F-Verteilung gilt
1
dann
n 1 1S 2
1
1
1
n 1 1
n 2 1S 2
1
2
2
n 2 1
erhalten somit:

S2
1
1
S2
2
2
 Fn 1  1, n 2  1. Unter der Nullhypothese gilt  1   2 Wir
S 21
S 22
 Fn 1  1, n 2  1
S 21 : Zufallsvariable mit  21 als Wert
S 22 : Zufallsvariable mit  22 als Wert
n 1 : Umfang der ersten Stichprobe
n 2 : Umfang der zweiten Stichprobe
Beispiel: Zwei Maschinen werden auf die Varianz des Outputs hin untersucht,
wobei eine tiefere Varianz vorzuziehen ist. Wir nehmen an,die Daten seien
normalverteilt (Wir überprüfen jede der Stichproben auf Normalverteilung). Wir
ziehen für beide Maschinen eine Stichprobe von je 100, d.h. n 1  n 2 und hätten als
Varianzen die folgenden Werte erhalten:  21  90;  22  80. Wir überprüfen, ob der
Unterschied signifikant ist.
H 0 : Die Varianzen unterscheiden sich nicht.
H A : Die Varianzen unterscheiden sich ( zweiseitiger Test) (  0. 05.
S 21
S 22

90
80
 1. 125  F99, 99.
F 99,99 1. 125  1  0. 279503524; 0. 279503524  0. 025 
Die Varianz des Outputs der beiden Maschinen unterscheiden sich nicht
signifikant.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
209
2.2.2. z-Test (signifikant verschiedene Varianzen)
Ziel: Es wird überprüft, ob zwei Grundgesamtheiten, aus denen Stichproben
gezogen werden, identische Mittelwerte  1 und  2 aufweisen.
Voraussetzungen: Die Daten sind unabhängig und identisch normalverteilt
(metrisch skaliert). Die Varianzen werden aus den Daten geschätzt und sind
signifikant verschieden. n 1  50; n 2  50
Zwei Stichproben des Umfangs n 1 und n 2 werden aus zwei Grundgesamtheiten
gezogen. Die Nullhypothese besagt:  1   2 (oder äquivalent:  1   2  0. Die
Alternativhypothese besagt beim zweiseitigen Test.  1   2  0 (beim einseitigen
Test,  1   2  0 oder  1   2  0
Wir betrachten zuerst die unrealistische Situation, dass die Varianzen der beiden
Populationen, aus denen Stichproben gezogen werden, bekannt sind. Für
normalverteilte Datensätze i gilt: X i ist normalverteilt. Ebenso gilt für die Differenz
X 1  X 2 , dass sie normalverteilt ist, da die Summe von normalverteilten,
unabhängiger Zufallsvariablen wieder normalverteilt ist.
Für normalverteilte, unabhängige Zufallsvariablen könnte zudem gezeigt werden,
dass für W  aX  bY (X und Y sind normalverteilte, unabhängige Zufallsvariablen,
a, b  R gilt: VW  a 2 VX  b 2 VY.
2
2


Da gilt: VX 1   n 11 und VX 2   n 22 , erhalten wir für die Varianz der Differenz
2
2
2
2
X 1  X 2 :  2X 1 X 2  1 2 n 11  1 2 n 22  n 11  n 22 Somit ist die Zufallsvariable
X X   
Z  1 22 12 2 standardnormalverteilt. Die Nullhypothese postuliert  1   2  0.
1
n1

2
n2
Somit gilt für die Zufallsvariable Z : Z 
X 1 X 2
2
1
n1

2
2
n2
 N0, 1.
Betrachten wir nun den realistischeren Fall, dass die Varianzen der zwei
Populationen nicht bekannt sind und aus den Stichproben geschätzt werden
müssen. Für genügend grosse Stichproben n 1 , n 2  50 ist der Ausdruck
 
Z  X21 X 22 näherungsweise standardnormalverteilt, sofern die Daten
S1
n1
S
 n 22
normalverteilt sind.
Z
X 1 X 2
S2
1
n1
S2
 N0, 1
 n 22
X i : Zufallsvariable mit x i als Wert
S 2i : Zufallsvariable mit  2i als Wert
n 1 : Umfang der ersten Stichprobe
n 2 : Umfang der zweiten Stichprobe
Für kleinere Stichprobengrössen ist die Verteilung unbekannt. (Wir verwenden in
diesem Fall einen Rangtest, siehe unten). Ob die Varianzen zu einer gleichen
Verteilung gehören oder nicht, können wir z.B. mit einem F-Test entscheiden
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
210
(siehe oben, Testen zweier Varianzen; oft werden auch andere, geeignete Tests
verwendet). Wird die Hypothese, dass die Varianzen zur selben Verteilung
gehören, verworfen, können wir bei n 1 , n 2  50 den obigen z-Test anwenden.
Beispiel 1: (Daten siehe unverbundene Daten/Beispiel 1.xls) Verkäufer 1 erzielt
einen durchschnittlichen Tagesumsatz von 100. 7251579 (Anzahl Tage: 95,
 1  4. 142825345) und Verkäufer 2 (Anzahl Tage 113,  2  2. 88585642) einen
durchschnittlichen Tagesumsatz von 104. 7855357 Geldeinheiten
H 0 : Die durchschnittlichen Umsätze der beiden Verkäufer unterscheiden sich
nicht.
H A : Die durchschnittlichen Umsätze der beiden Verkäufer unterscheiden sich (
beidseitiger Test,   0. 05.
Wir überprüfen die Normalverteilungsannahme:
P-P-Diagramm Normal VERKÄUFER 2
1.00
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal VERKÄUFER 1
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Normalverteilungsannahme kann akzeptiert werden.
2.88585642 2
 0. 48524  F111, 94.
n 1  95; n 2  112  50;
4.142825345 2
F 111,94 0. 48524  0. 0001355 2  0. 05.
Wir verwerfen die Hypothese, dass die beiden Populationen die selbe Varianz
haben und verwenden den obigen z-Test:
Z .
X 1 X 2
S2
1
n1

S2
2
n2

100.7251579104.7855357
4.142825345 2
95
 2.88585642
112
2
 8. 040
Das Ergebnis ist hochsignifikant 8. 040  0  0. 025
Mit Excel: t-Test zweiseitig, Typ 3. Für obiges Beispiel: 1. 69593E  13  0. 025
Mit SPSS sind für das obige Beispiel einige Vorarbeiten nötig. In SPSS hat man
bezüglich des t-Testes (mit zwei unabhängigen Stichproben) folgende Situation vor
Augen. Zwei Maschinen werden bezüglich der produzierten Schraubenlänge
getestet. Diese Situation wird als dichotome, nominalskalierte Variable aufgefasst
(Schraube wurde mit Maschine 1 hergestellt oder wurde mit Maschine 2
hergestellt). Jede Schraube ist ein Objekt, für das auf einer Zeile die
Ausprägungen der zwei Variablen Länge und ”produziert durch Maschine i”
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
211
angeführt werden. Der Test verläuft nun wie folgt: Analysieren, Mittelwerte
vergleichen, unverbundene Stichproben. Zu testenden Grössen (Länge) kommen
in das Feld ”Testgrösse”, die Gruppenvariable ist die Variable, welche die zwei zu
vergleichenden ”Gruppen” festlegt (im Beispiel ”produziert durch Maschine i”. Unter
”Gruppen def.” müssen dann die Ausprägungen der dichotomen Variable
eingetragen werden (1 und 2 im Maschinenbeispiel).
In unserem Tagesumsatz-Beispiel müssen wir als Objekte der Population Tage
sehen. Diese Tage nehmen unter der Variable ”Umsatz” die entsprechenden
Tagesumsätze an und unter der Variable ”Verkäufer” 1 oder 2 (je nach Verkäufer).
Die Daten aus Excel müssen entsprechend behandelt werden. Wir fügen die Daten
des Verkäufers 1 in die erste Spalte von SPSS. Wir produzieren nun die Variable
”Verkäuf1” und fügen mit ”Transformieren”, ”Umkodieren”, ”in andere Variable”, bei
”Name” Variablenname eingeben, mit ”ändern” bestätigen, ”alte und neue Werte”,
neuer Wert ”1”, ”alle anderen Werte”, ”hinzufügen”, ”weiter”, ”ok”.
Dann fügen wir die Umsätze des zweiten Verkäufers an die Umsätze des ersten
Verkäufers (in dieselbe Spalte) und ergänzen die Variable ”Verkäufer” für den
zweiten Verkäufer mit ”2”. (Vorgehen: ”Umkodieren”, ”in andere Variable”, bei
”Name” Variablennamen (Verkäuf) eingeben (eventuell noch Label), mit ”ändern”
bestätigen, ”alte und neue Werte”, alter Wert 1, neuer Wert 1, alter Wert ”fehlend”,
neuer Wert ”2”, ”weiter”, ”ok”. (schneller wäre es allerdings, die Daten in Excel
entsprechend vorzubereiten und dann in SPSS einzufügen).
Nun können wir den t-Test laufen lassen und erhalten folgendes Resultat.
Gruppenstatistiken
UMSÄTZE
Verkäufer
1.00
2.00
N
95
112
Mittelwert
100.7252
104.7855
Standardab
weichung
4.1428
2.8859
Standardfe
hler des
Mittelwertes
.4250
.2727
Der ”Standardfehler des Mittelwertes” ist die Standardabweichung des
Mittelwertes. Bei Kennzahlen wird oft ”Standardfehler” statt ”Standardabweichung”
verwendet.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
212
Test bei unabhängigen Stichproben
Levene-Test der
Varianzgleichhei
t
F
UMSÄTZE
Varianzen
gleich
Varianzen
nicht gleich
7.394
Sign.
.007
T-Test für die Mittelwertgleichheit
T
df
Sig.
(2-seitig)
Mittlere
Differenz
Standardfehler
der Differenz
-8.274
205
.000
-4.0604
.4908
-8.040
163.8
.000
-4.0604
.5050
SPSS liefert den Test für signifikant verschiedene und nicht verschiedene  2i . Bei F
steht der F-Wert des Levene-Tests (es handelt sich um einen alternativen Test
zum obigen F-Test). Da die Varianzen signifikant verschieden sind, ist nur die
zweite Zeile (Varianzen nicht gleich) in Betracht zu ziehen.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
213
2.2.3. t-Test (nicht signifikant verschiedene Varianzen)
Ziel: Es wird überprüft, ob zwei Grundgesamtheiten, aus denen Stichproben
gezogen werden, identische Mittelwerte  1 und  2 aufweisen.
Voraussetzungen: Die Daten sind unabhängig und identisch normalverteilt
(metrisch skaliert). Die Varianzen werden aus den Daten geschätzt und
unterschieden sich nicht signifikant.
Wir betrachten zuerst wieder den unrealistischen Fall, dass die Varianzen der zwei
Populationen bekannt sind. Zudem seien diese Varianzen identisch. Somit gilt für
 
 
X 1 X 2
 21   22   2 : Z  X21 X 22  X21 X 22 

2
2
X 1 X 2
n 2  2 n 1  2
n1n2
1
n1
X 1 X 2

 2 n 2 n 1 
n1n2

2
n2


n1
X 1 X 2

n 2 n 1 
n1n2


n2
n2
n1n2

n1
n1n2
 N0, 1
Ist nun die Varianz der Grundpopulationen nicht bekannt, muss diese aus den
 
Daten geschätzt werden. Die obige Zufallsvariable wird zu: T  Xn1 Xn2 
S
2 1
n1n2
Wir zeigen, dass die Zufallsvariable T t-verteilt ist.
(a) Sei  2i der Wert der Zufallsvariable S 2i (i  1, 2.Für S 2 gilt - wie bereits
gezeigt:
S 21 n 1 1
2
  n2 1 1 und
S 22 n 2 1
2
  n2 2 1 .
Ohne Beweis halten wir fest: Wenn X   2n und Y   2m , dann X  Y   2nm .
Somit gilt: U 
S 21 n 1 1
2

S 22 n 2 1
2
  n2 1 n 2 2
Z
(b) Laut Definition der t-Verteilung gilt dann:
U
n 1 n 2 2
 t n 1 n 2 2
X 1 X 2
Nun gilt:
Z
U
n 1 n 2 2

X 1 X 2
n 2 n 1 
n1n2
2
S2
1 n 1 1S 2 n 2 1
n 1 n 2 2
Somit ist für S 

n 2 n 1 
n1n2
2
S2
1 n 1 1  S 2 n 2 1
2
2
n 1 n 2 2
X 1 X 2


n 2 n 1 
n1n2
1

2
S2
1 n 1 1S 2 n 2 1
n 1 n 2 2

 t n 1 n 2 2
S 21 n 1 1S 22 n 2 1
n 1 n 2 2
die obige Zufallsvariable T t-verteilt.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
214
X 1 X 2
T
2
n 1 1S 2
1 n 2 1S 2
n 1 1n 2 1
 t n 1 n 2 2
1
n1
 n12
X 1 : Zufallsvariable mit dem Mittelwert x 1 der Stichpobe 1 als Wert
X 2 : Zufallsvariable mit dem Mittelwert x 2 der Stichprobe 2 als Wert
S 21 : Zufallsvariable mit der Varianz  21 der Stichprobe 1 als Wert.
S 22 :Zufallsvariable mit der Varianz  22 der Stichprobe 2 als Wert
n 1 : Anzahl Daten der Stichprobe 1
n 2 : Anzahl Daten der Stichprobe 2
Beispiel: Zwei Produktionsstätten produzieren folgende Mengeneinheiten an
verkaufbaren Produkten pro Tag (Daten: Unverbundene Stichproben, Beispiel
2.xls). Ist der Unterschied signifikant?
(n 1  52;  21  7. 375786375, x 1  1000. 22908;
n 2  75,  22  7. 55534469, x 2  1005. 509322)
H 0 : Die beiden Produktionsstätten unterscheiden sich nicht.
H A : Die zweite Produktionsstätte ist besser ( einseitiger Test;   0. 05.
Wir denken an einen z- oder an einen t-Test. Entsprechend überprüfen wir die
Daten zuerst auf Normalverteilung:
P-P-Diagramm Normal Produktion 2
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal Produktion 1
1.00
.50
.25
0.00
0.00
.25
.50
.75
1.00
.50
.25
0.00
0.00
Beobachtete Kum. Wahrsch.
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Normalverteilungsannahme ist wohl haltbar.
Als nächstes testen wir die Varianzen.
7.375786375
7.55534469
 0. 976 23;
F 51,74 0. 976 23  1  0. 530760322  0. 469 24
Die Varianzen unterscheiden sich nicht signifikant. Entsprechend verwenden wir
den t-Test:
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
215
T
X 1 X 2
2
n 1 1S 2
1 n 2 1S 2
n 1 1n 2 1
1000.229081005.509322

1
n1

517.375786375747.55534469
5174
1
n2
1
52
1
 75
  10. 697
t 52752 10. 697  1  t 125 10. 697  1  1. 16665E  19
p-Wert: 1. 16665E  19  0. 05.
Das Testergebnis ist hochsignifikant.
Mit dem t-Test von Excel erhalten wir (TTest, einseitig, Typ 2:
1. 16488E  19  0. 05
Mit SPSS erhalten wir:
Gruppenstatistiken
Output
Produktionsstätte
1.00
2.00
N
Mittelwert
1000.2291
1005.5093
52
75
Standardab
weichung
2.7158
2.7487
Standardfe
hler des
Mittelwertes
.3766
.3174
Test bei unabhängigen Stichproben
Levene-Test der
Varianzgleichheit
F
Output
Varianzen
sind
gleich
Varianzen
sind nicht
gleich
.215
Signifikanz
.644
T-Test für die Mittelwertgleichheit
T
df
Sig.
(2-seitig)
Mittlere
Differenz
Standardfehle
r der Differenz
-10.70
125
.000
-5.2802
.4936
-10.72
110.7
.000
-5.2802
.4925
Auch vom Levene-Test wird die Verschiedenheit der Varianzen abgelehnt.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
216
2.2.4. Rangtest von Mann-Withney (U-Test von Mann-Withney genannt)
Ziel: Es wird überprüft, ob zwei Grundgesamtheiten, aus denen Stichproben
gezogen werden, ähnliche Verteilungen aufweisen.
Voraussetzungen: Die Daten sind unabhängig und identisch verteilt (metrisch oder
ordinal skaliert).
Der Rangtest hat bedeutend schwächere Voraussetzungen als der z- oder t- Test.
Er sollte im allgemeinen vorgezogen werden.
Wir ordnen die Daten der beiden Stichproben der Grösse nach und ordnen ihnen
nach derselben Methode wie beim Wilcoxon-Test Ränge zu.
Von verbundenen Rängen sprechen wir, wenn Daten die selbe Ausprägung haben.
Im Gegensatz zum Wilcoxon-Test werden jedoch nicht die Rangsummen gebildet.
Es wird gezählt, wieviele Male U 1 die Ränge der ersten Stichprobe Ränge der
zweiten Stichprobe übertreffen. Dieser Wert kann auch durch
U1  n1n2 
n 1 n 1 1
2
n1
 R 1 berechnet werden, wobei R i   r i i die Rangsumme der
i1
n n 1
 R 2 . Im
i-ten Stichprobe ist. Für U 1 gilt: U 1  n 1 n 2  U 2 , wobei U 2  n 1 n 2  2 22
Test verwenden wir jeweils U  minU 1 , U 2 } (d.h. das kleinere der beiden U i 
In Tabellen werden die kritischen U-Werte angegeben.
für den einseitigen Test bei α = 0.01, für den
zweiseitigen Test bei α = 0.02
n i 9 10 11 12 13 14 15 16 17
18
19 20
1
2
0
0
0
0
0
0
1
1
3
1
1
1
2
2
2
3
3
4
4
4
5
4
3
3
4
5
5
6
7
7
8
9
9 10
5
5
6
7
8
9 10 11 12 13
14
15 16
6
7
8
9 11 12 13 15 16 18
19
20 22
7
9 11 12 14 16 17 19 21 23
24
26 28
8 11 13 15 17 20 22 24 26 28
30
32 34
9 14 16 18 21 23 26 28 31 33
36
38 40
10 16 19 22 24 27 30 33 36 38
41
44 47
11 18 22 25 28 31 34 37 41 44
47
50 53
12 21 24 28 31 35 38 42 46 49
53
56 60
13 23 27 31 35 39 43 47 51 55
59
63 67
14 26 30 34 38 43 47 51 56 60
65
69 73
15 28 33 37 42 47 51 56 61 66
70
75 80
16 31 36 41 46 51 56 61 66 71
76
82 87
17 33 38 44 49 55 60 66 71 77
82
88 93
18 36 41 47 53 59 65 70 76 82
88
94 100
19 38 44 50 56 63 69 75 82 88
94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
217
für den einseitigen Test bei α = 0.025, für den zweiseitigen
Test bei α = 0.05
ni 9 10 11 12 13 14 15 16 17 18 19 20
1
2 0 0 0 1 1 1 1 1
2
2
2
2
3 2 3 3 4 4 5 5 6
6
7
7
8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 16 17 19 21 22 24 25 27
7 12 14 16 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 65 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
16 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
19 45 52 58 65 72 78 85 92 99 106 113 119
20 48 55 62 69 76 83 90 98 105 112 119 127
für den einseitigen Test bei α = 0.05, für den
zweiseitigen Test bei α = 0.1
ni 9 10 11 12 13 14 15 16 17
1
2 1 1 1 2 2 2
3
3
3
3 3 4 5 5 6 7
7
8
9
4 6 7 8 9 10 11 12 14 15
5 9 11 12 13 15 16 18 19 20
6 12 14 16 17 19 21 23 25 26
7 15 17 19 21 24 26 28 30 33
8 18 20 23 26 28 31 33 36 39
9 21 24 27 30 33 36 39 42 45
10 24 27 31 34 37 41 44 48 51
11 27 31 34 38 42 46 50 54 57
12 30 34 38 42 47 51 55 60 64
13 33 37 42 47 51 56 61 65 70
14 36 41 46 51 56 61 66 71 77
15 39 44 50 55 61 66 72 77 83
16 42 48 54 60 65 71 77 83 89
17 45 51 57 64 70 77 83 89 96
18 48 55 61 68 75 82 88 95 102
19 51 58 65 72 80 87 94 101 109
20 54 62 69 77 84 92 100 107 115
18
4
9
16
22
28
35
41
48
55
61
68
75
82
88
95
102
109
116
123
19
0
4
10
17
23
30
37
44
51
58
65
72
80
87
94
101
109
116
123
130
20
0
4
11
18
25
32
39
47
54
62
69
77
84
92
100
107
115
123
130
138
Bei n 1  n 2  30 ist die Verteilung der U-Werte näherungsweise normal. Um die
U-Werte zu standardisieren, verwenden wir  U  n 12n 2 und die
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
218
n 1 n 2 n 1 n 2 1
12
Standardabweichung  s 
.
Bei verbundenen Rängen wird die Standardabweichung
 sg 
n1n2
nn1
n 3 n
12
k

i1
t 3i t i
12
verwendet (t i Anzahl der Daten mit dem jeweils
selben Rang i; k Anzahl der Datengruppen mit verbundenen Rängen).
Wir machen die Verwendung der letzte Formel mit einem Beispiel deutlich (das
Beispiel hätte für den Test etwas viele verbundene Ränge. Es geht hier allerdings
darum, die obige Formel anwenden zu können).
Gruppe
Daten
Ränge
1
2
1
2
1
1
2
1
1
2
2
1
2
2
2
1
1
2
2
3
3
3
4
4
4
4
5
5
6
7
Summen
k
Wir erhalten 
i1
t 3i t i
12

2 3 2
12

2 3 2
12
Wir berechnen als Testwert: Z 

3 3 3
12
U U
s
no
1.5
1.5
3.5
3.5
6
6
6
9.5
9.5
9.5
9.5
12.5
12.5
14
15
120

4 3 4
12

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
120
2 3 2
12
 8. 1667
 N0, 1
Beispiel 3 (für metrisch skalierte Daten)
Für ein Produkt wird ein Zusatz getestet, der sich positiv auf die Lebensdauer des
Produktes (in Monaten) auswirken soll.
H 0 : Der Zusatz hat keine Wirkung
H A : Der Zusatz verlängert die Lebensdauer des Produktes ( rechtsseitiger Test,
  0. 01
Es wurden dabei folgende Daten erhoben:
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
219
Lebensdauer ohne Lebensdauer mit
Zusatz
Zusatz
85
96
106
105
118
104
81
108
138
86
90
84
112
99
119
101
107
78
95
124
88
121
103
97
129
87
109
Im Beispiel gibt es keine Bindungen. Entsprechend gilt dann: noi  ri für alle i.
Wir erhalten:
Daten geordnet
no(i)
78
81
84
85
86
87
88
90
95
96
97
99
101
103
104
105
106
107
108
109
112
118
119
121
124
129
138
Summen:
2
1
2
1
2
2
1
1
1
2
2
2
2
1
2
2
1
1
2
2
1
1
1
2
2
2
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
r(i)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
378
r1(i)
r2(i)
0
2
0
4
0
0
7
8
9
0
0
0
0
14
0
0
17
18
0
0
21
22
23
0
0
0
27
172
1
0
3
0
5
6
0
0
0
10
11
12
13
0
15
16
0
0
19
20
0
0
0
24
25
26
0
206
Um zu wissen, welche Daten zu welcher Stichprobe gehören, kennzeichnen wir
diese Zugehörigkeit vor dem Ordnen durch 1 und 2. In der zweitletzten Spalte sind
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
220
die Ränge für die Daten der ersten Stichprobe angeführt, in der letzten Spalte die
Ränge der Daten der zweiten Stichprobe. Die Summen der beiden Rangsummen
R 1  R 2 muss mit der Summe der ri identisch sein.
Wir berechnen U 1  n 1 n 2 
n 1 n 1 1
2
12121
2
 R 1  12  15 
 172  86
U 2  12  15  86  94  U  86:
Da n 1  n 2  30, müssen wir den Wert in einer Tabelle nachschauen. Wir erhalten
als kritische Grenze 42. Da 86  42, ist das Resultat nicht signifikant.
Übungshalber verwenden wir die Normalverteilung, um den grob genäherten
n 1 n 2 n 1 n 2 1
121512151
p-Wert zu berechnen:  s 

 20. 494.
12
12
n1n2
2

1215
2
 90
Wir erhalten: Z 
8690
20.495
 0. 19517
0. 19517  1  0. 19517  1  0. 577370049  0. 422 63  0. 01.
Das Resultat ist bei weitem nicht signifikant.
Mit SPSS: Analysieren, Nicht-parametrische Tests, unverbundene Stichproben,
Mann-Withney-Test (Auch hier müssen die zwei Stichproben durch eine eigene
Variable charakterisiert werden und die Werte der Stichproben in einer Spalte
eingegeben werden). Wir erhalten:
Ränge
Lebensdauer
Produktionsstätte
1.00
2.00
Gesamt
N
12
15
27
Mittlerer Rang
14.33
13.73
Rangsumme
172.00
206.00
Statistik für Testb
Mann-Whitney-U
Wilcoxon-W
Z
Asymptotische
Signifikanz (2-seitig)
Exakte Signifikanz
[2*(1-seitig Sig.)]
Lebensdauer
86.000
206.000
-.195
.845
a
.867
a. Nicht für Bindungen korrigiert.
b. Gruppenvariable: Produktionsstätte
Mann-Whitney-U ist der obige Testwert U; Wilcoxon-W ist die tiefere Rangsumme
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
221
R i , im vorliegenden Fall R 1 . Z ist der Wert der standardnormalisierten
Zufallsvariable Z. Dieser Wert wird bei der asymtotischen Signifikanzberechnung
verwendet (Standardnormalverteilung). Die Exakte Signifikanz ist die p-Wert, der
mit kombinatorischen Mitteln berechnet wird. Es wird jeweils der p-Wert für den
zweiseitigen Test geliefert. Beim einseitigen Test ist der gelieferte p-Wert zu
halbieren. In unserem Fall erhalten wir: 0.845
 0. 422 5 für den asymtotischen Wert
2
0.867
und 2  0. 433 5 für den exakten p-Wert.
Man sieht, dass bei n 1  n 2  27 durch die Normalverteilung bereits recht gute
Näherungen erreicht werden.
Beispiel 4 (für ordinal skalierte Daten): (Daten unverbundene Stichproben/Beispiel
5.xls).
Bei einem betriebsinternen Rating werden die Gesamtleistungen
(Zusammenarbeit, Mitdenken, Leistung, etc). von Mitarbeitern der zwei Standorte
von einem Vorgesetzten auf einer Ordinalskale von 1 - 10 bewertet. Es ergibt sich
die folgende Tabelle:
Standort 1
5
6
4
6.5
7
8
9.5
10
8.5
Standort 2
5.5
6
4.5
6.75
7.5
8.25
9
6.25
8.75
9.25
9.75
4.75
H 0 : Die beiden Produktionsstätten unterscheiden sich nicht.
H A : Die beiden Produktionsstätten unterscheiden sich ( zweiseitiger Test,
  0. 05.
Die Mediane unterschieden sich wie folgt: erste Stichprobe hat einen Median von
7, die zweite einen Median von 7.125.
Wir ordnen die Daten (mit Excel kann man auch direkt Ränge zuordnen und dann
die Ränge samt den Daten ordnen. Bei Gruppen mit gleichen Werten wird der
entsprechende Mittelwert zugeordnet):
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
222
geordnete Daten
Standort
4
4.5
4.75
5
5.5
6
6
6.25
6.5
6.75
7
7.5
8
8.25
8.5
8.75
9
9.25
9.5
9.75
10
no(i)
1
2
2
1
2
1
2
2
1
2
1
2
1
2
1
2
2
2
1
2
1
ra(i)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Summen
und berechnen U 1  n 1 n 2 
n 1 n 1 1
2
 R 1  9  12 
1
2
3
4
5
6.5
6.5
8
9
10
11
12
13
14
15
16
17
18
19
20
21
231
991
2
ra1(i)
1
0
0
4
0
6.5
0
0
9
0
11
0
13
0
15
0
0
0
19
0
21
99.5
ra2(i)
0
2
3
0
5
0
6.5
8
0
10
0
12
0
14
0
16
17
18
0
20
0
131.5
 99. 5  53. 5
U 2  9  12  53. 5  54. 5  U  53. 5
Mit der Tabelle erhalten wir als kritischen Wert 26. Der Unterschied ist nicht
signifikant.
Verwenden wir die Normalverteilung, erhalten wir:
912
21211
 sg 
U 
n1n2
2

912
2
21 3 21
12

2 3 2
12
 14. 067
 54
U
Z   s gU  53.554
 0. 03554 4 
14.067
0. 03554 4  1  0. 514177078  0. 485 82
p-Wert für zweiseitig:2  0. 485 82  0. 971 64  0. 05
Mit SPSS erhalten wir:
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
223
Ränge
Beurteilung
Produktionsstätte
1.00
2.00
Gesamt
N
9
12
21
Mittlerer Rang
11.06
10.96
Rangsumme
99.50
131.50
Statistik für Testb
Mann-Whitney-U
Wilcoxon-W
Z
Asymptotische
Signifikanz (2-seitig)
Exakte Signifikanz
[2*(1-seitig Sig.)]
Beurteilung
53.500
131.500
-.036
.972
a
.972
a. Nicht für Bindungen korrigiert.
b. Gruppenvariable: Produktionsstätte
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
224
2.2.5. Test auf Anteile
Ziel: Es sollen überprüft werden, ob die Anteile in zwei Stichproben zur selben
Grundgesamtheit passen.
Voraussetzungen: Stichprobengrösse: n i  50. Die Daten sind Werte von
unabhängigen, gleichverteilten Zufallsvariablen.
Beispiel: Es wird untersucht, ob sich der Jugendanteil ( 30 Jahre) bei den
Konsumenten eines Produktes in zwei Kantonen unterscheiden (Zürich; Waadt). In
beiden Kantonen wird eine Zufallsstichprobe gezogen (je 50). Wir nehmen an, es
hätten sich folgende Anteile ergeben: 0.3 und 0.46. Ist zu vermuten, dass die
Konsumentenstruktur der beiden Kantone sich unterscheidet?
H 0 : Die Jugendanteile unterscheiden sich nicht.
H A : Die Jungendanteile unterscheiden sich ( beidseitiger Test,   0. 05.
Nicht nur die Anzahl x 1 der ausgezeichneten Ereignisse kann als Wert einer
Zufallsvariable X 1 betrachtet werden. Auch nx 11 kann als Wert einer Zufallsvariable
X1
n 1 betrachtet werden.
Da EX 1   p 1 n 1 (Binomialverteilung),
ist E Xn 11  
1
n1
p1n1
n1
EX 1  
 p1
Da Anteilswerte binomialverteilt sind, sind sie standardisiert bei genügend grossem
n (np1  p  9) näherungsweise standardnormalverteilt. Die Differenzen
standardnormalverteilter Grössen sind wiederum standardnormalverteilt.
Für die Differenz D 
X1
n1

X2
n2
gilt dann im Falle der Nullhypothese: ED  0.
Für die Varianz gilt: Da VX 1   n 1 p 1 1  p 1  (Binomialverteilung)
gilt für V Xn 11  
1
n 21
VX 1  
n 1 p 1 1p 1 
n 21
p 1 1p 1 
n1

Zudem gilt (unter Voraussetzung der Unabhängigkeit der X i :
VD  V
V
X1
n1
X1
n1

 1 2 V
X2
n2
V
X2
n2
V
X1
n1
 V  Xn 22
X1
n1
V

X2
n2
Somit gilt dann unter der Nullhypothese p 1  p 2 :
V Xn 11 
X2
n2

p 1 1p 1 
n1

p 2 1p 2 
n2
 p1  p n11 
1
n2

Die z-Standardisierung ist somit:
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
225
Z 
X1
n1

X2
n2
 N0, 1
p1p n11  n12 
Allerdings müssen wir p aus den Stichproben schätzen. p 
X 1 X 2
n 1 n 2
Entsprechend ist p eine Zufallsvariable und Z ist nur für grosse n 1 und n 2
näherungsweise normalverteilt (für n i  50.
Wir fassen zusammen:
X1
n1
Z
X 1 X 2
n 1 n 2
1

X2
n2
X 1 X 2
n 1 n 2
 n11  n12 

 N0, 1
X1
n1
: Zufallsvariable mit dem Anteil
x1
n1
an der Stichprobe 1 als Wert
X2
n2
: Zufallsvariable mit dem Anteil
x2
n2
an der Stichprobe 2 als Wert
n 1 : Grösse der Stichprobe 1
n 2 : Grösse der Stichprobe 2
Fürs Beispiel erhalten wir entsprechend:
X1
n1
 0. 3  X 1  50  0. 3  15
X2
n2
 0. 46  X 2  50  0. 46  23
X 1 X 2
n 1 n 2

1523
5050
 0. 38
0.30.46
1  1 
0.3810.38 50
50
  1. 648 2
1. 6482  0. 049655802
Da wir zweiseitig testen gilt: 0. 049655802  0. 025.
Der Unterschied ist somit nicht signifikant.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
226
2.2.6. Übungen
1) Bei der Produktion mit zwei verschiedenen Maschinen wurden folgende Daten gemessen
(Unverbundene Stichproben, Übung 1.xls). Überprüfen Sie, ob die Varianzen signifikant
voneinander abweichen (  0. 01
2) Daten: unter Unverbundene Stichproben/Übung 2.xls
Zwei Anlagen produzieren die pro Tag angegebenen Mengen eines chemischen
Feinproduktes (in Liter). Unterscheiden sich die beiden Anlagen?   0. 05
3) Zwei Versicherungs-Vertreter werden bezüglich ihrer Abschlüsse verglichen (Daten:
Unverbundene Stichproben/Übung 3.xls). Überprüfen Sie, ob die beiden Vertreter in
ihren Leistungen signifikant voneinander abweichen.   0. 05
4) Zwei Fonds-Manager werden bezüglich Ihrer Performance getestet (Gewinne pro Tag).
(Daten: Unverbundene Stichproben /Übung 4.xls).
5) Zwei Diäten werden bei Dauerläufern bezüglich der Leistung geprüft. (Daten:
Unverbundene Stichproben/Übung 5.xls). Unterscheiden sich die Leistungen?
6) Im April 02 ergeben sich in der 2. HSW die folgenden Resultate in einer
Mathematikprüfung:
Geschlecht
w
w
m
m
w
w
m
w
m
m
m
m
m
m
m
m
Punkte
19.25
19
18
18
17.5
17
16.5
16.25
16
15.75
13.25
12.75
11.875
11
7.5
1.5
(w für ”weiblich”, ”m” für ”männlich”). Die Hypothese sei, dass die Frauen signifikant
besser abgeschnitten haben. Überprüfen Sie diese Hypothese.   0. 05
8) Die politische Einstellung der Bevölkerungen Genfs und Zürichs bezüglich eines
spezifischen Themas sollen verglichen werden. Dabei werden 60 Personen in Genf und
70 Personen in Zürich befragt. Es ergibt sich folgendes Bild: 15 Personen in Genf sind
positiv eingestellt und 10 Personen in Zürich. Handelt es sich um einen relevanten
Unterschied?
9) Wie gross müssen n 1 und n 2 sein, damit ein Anteilsunterschied von
signifikant werden kann?
15
60

10
70
 0. 10714
10) Finden Sie je ein betriebswirtschaftliches Problem, das mit den behandelten Methoden
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
227
gelöst werden kann.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
228
2.2.7. Lösungen
1) H 0 : Die Varianzen unterscheiden sich nicht.
H A : Die Varianzen unterscheiden sich ( zweiseitiger Test,   0. 01
Wir überprüfen die Daten auf Normalverteilung:
P-P-Diagramm Normal Maschine 2
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal Maschine 1
1.00
.50
.25
0.00
0.00
.25
.50
.75
1.00
.50
.25
0.00
0.00
Beobachtete Kum. Wahrsch.
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Daten können als normalverteilt betrachtet werden. Wir können somit den
S2
eingeführten F-Test verwenden. S 12  6.017110135
 0. 45943
13.09697008
2
F 104,107 0. 45943  0. 00004280 4  0. 005
Die Abweichung ist hochsignifikant.
2) H 0 : Die Anlagen unterscheiden sich nicht.
H A : Die Anlagen unterscheiden sich ( zweiseitiger Test).
Wir denken an einen z- oder t-Test. Wir überprüfen die Daten auf Normalverteilung:
P-P-Diagramm Normal Anlage 2
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal Anlage 1
1.00
.50
.25
0.00
0.00
.25
.50
Beobachtete Kum. Wahrsch.
.75
1.00
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Die Daten sind nicht normalverteilt. Entsprechend verwenden wir den U-Test von
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
229
Mann und Witney.
Wir erhalten für die tiefere Rangsumme 1596 (alle tiefsten Ränge gehören zur
ersten Stichprobe; entsprechend wird das Resultat hochsignifikant sein). Wir
berechnen den asymptotischen Z-Wert:
n n 1
Da 1 21
 R 1 (d.h. die Daten der ersten Stichprobe besetzen alle ersten Ränge),
gilt U 1  n 1 n 2  56  63  3528. Entsprechend ist U 2  n 1 n 2  U 1  0  U  0.
n 1 n 2 n 1 n 2 1
12
s 
n1n2
2

5663
2

566356631
12
 187. 83
 1764.
Wir erhalten Z 
01764
187.83
 9. 3915
9. 3915  0  0. 01.
Das Ergebnis ist hoch signifikant.
Mit SPSS:
Ränge
Output
Maschine
1.00
2.00
Gesamt
N
56
63
119
Mittlerer Rang
28.50
88.00
Rangsumme
1596.00
5544.00
Statistik für Testa
Mann-Whitney-U
Wilcoxon-W
Z
Asymptotische
Signifikanz (2-seitig)
Output
.000
1596.000
-9.391
.000
a. Gruppenvariable: Maschine
Da n 1  n 2 viel grösser ist als 30, wird hier von SPSS nur mehr die asymtotische
Signifikanz berechnet.
3) H 1 : Die Vertreter unterscheiden sich nicht.
H A : Die Vertreter unterscheiden sich ( zweiseitiger Test)
Wir überprüfen auf Normalverteilung:
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
230
P-P-Diagramm Normal Abschlüsse 2
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal Abschlüsse 1
1.00
.50
.25
0.00
0.00
.25
.50
.75
.50
.25
0.00
0.00
1.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Beobachtete Kum. Wahrsch.
Die Daten des zweiten Vertreters sind kaum normalverteilt. Wir müssen einen
U-Test verwenden.
R 1  250
U1  n1n2 
n 1 n 1 1
2
 R 1  16  19 
16161
2
 250  190
U 2  16  19  190  114  U  114
Mit der Tabelle erhalten wir als kritischen Wert 101. Der Unterschied ist nicht
signifikant.
Verwenden wir die Normalverteilung, erhalten wir:
n 1 n 2 n 1 n 2 1
12
s 
n1n2
2

1619
2

161916191
12
 30. 199
 152
Wir erhalten: Z 
152190
30.199
  1. 258 3
1. 2583  1  1. 2583  1  0. 895858294  0. 104 14  0. 05. oder:
2  0. 10414  0. 208 28  0. 1
Das Resultat ist nicht signifikant.
Ränge
Abschlüsse
Vertreter
1.00
2.00
Gesamt
N
19
16
35
Mittlerer Rang
20.00
15.63
Rangsumme
380.00
250.00
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
231
Statistik für Testb
Mann-Whitney-U
Wilcoxon-W
Z
Asymptotische
Signifikanz (2-seitig)
Exakte Signifikanz
[2*(1-seitig Sig.)]
Abschlüsse
114.000
250.000
-1.258
.208
a
.217
a. Nicht für Bindungen korrigiert.
b. Gruppenvariable: Vertreter
Die beiden Vertreter unterscheiden sich nicht signifikant.
4) H 0 : Die Fonds-Manager unterscheiden sich nicht.
H A : Die Fonds-Manager unterscheiden sich. ( zweiseitiger Test,   0. 05
Wir versuchen einen z- oder t-Test anzuwenden. Wir überprüfen die Daten auf
Normalverteilung:
P-P-Diagramm Normal Manager 2
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal Manager 1
1.00
.50
.25
0.00
0.00
.25
.50
.75
1.00
.50
.25
0.00
0.00
Beobachtete Kum. Wahrsch.
.25
.50
.75
Beobachtete Kum. Wahrsch.
Die Daten können (knapp) als normalverteilt betrachtet werden.
Wir überprüfen die Homogenität der Varianzen:
25295974.46
26889353
 0. 940 74
F 88,101 0. 94074  0. 614266055. Die Varianzen unterscheiden sich nicht signifikant.
Wir können den t-Test verwenden:
T
X 1 X 2
2
n 1 1S 2
1 n 2 1S 2
n 1 1n 2 1

1
n1
 n12
4571.5219623731.514532
8725295974.4610026889353
87100
1  1 
 88
101
 1. 1265
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
232
1.00
t 187 1. 1265  1  0. 130698735, p-Wert (zweiseitig): 2  0. 130698735  0. 26140
Mit Excel: (Typ 2: p-Wert für zweiseitig: 0.261393737)
Mit SPSS:
Gruppenstatistiken
Gewinne
Manager
1.00
2.00
N
88
101
Standardab
weichung
5029.5104
5185.4945
Mittelwert
4571.5220
3731.5145
Standardfe
hler des
Mittelwertes
536.1476
515.9760
Test bei unabhängigen Stichproben
Levene-Test der
Varianzgleichheit
F
Gewinne
Varianzen
gleich
Varianzen
nicht
gleich
.221
Signifikanz
.639
T-Test für die Mittelwertgleichheit
T
df
Sig.
(2-seitig)
Mittlere
Differenz
Standardfehler
der Differenz
1.127
187
.261
840.0074
745.6732
1.129
184.840
.260
840.0074
744.1004
Der Unterschied ist nicht signifikant. Die Nullhypothese kann nicht abgelehnt
werden.
5) H 0 : Die Diäten unterscheiden sich nicht.
H A : Die Diäten unterscheiden sich (zweiseitiger Test;   0. 05
Wir denken an einen z- oder t-Test. Wir überprüfen die Daten auf
Normalverteilung:
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
233
P-P-Diagramm Normal Makler 2
1.00
.75
.75
Erwartete Kum. Wahrsch.
Erwartete Kum. Wahrsch.
P-P-Diagramm Normal Makler 1
1.00
.50
.25
0.00
0.00
.25
.50
.75
1.00
.50
.25
0.00
0.00
Beobachtete Kum. Wahrsch.
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Wir entscheiden, dass die Daten (knapp) normalverteilt sind.
Wir überprüfen die Homogenität der Varianz:
37.22076984
167.2132034
 0. 222 59
F 56,45 0. 2259  1. 299 7  10 7
Die Varianzen sind signifikant verschieden.
Wir überprüfen: n 1 , n 2  50.
Wir können somit den z-Test verwenden:
Z .
X 1 X 2
S2
1
n1

S2
2
n2

29.5766831736.78387577
37.22076984
56
  3. 443 5
 167.2132034
45
3. 4435  1  0. 999712833  0. 00028717  0. 025
Der Unterschied ist hochsignifikant.
Mit Excel: (Typ 3). 0.001056405
Mit SPSS:
Gruppenstatistiken
Umsatz
Makler
1.00
2.00
N
56
45
Mittelwert
29.5767
36.7839
Standardab
weichung
6.1009
12.9311
Standardfe
hler des
Mittelwertes
.8153
1.9277
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
234
Test bei unabhängigen Stichproben
Levene-Test der
Varianzgleichheit
F
Umsatz
Varianzen
gleich
Varianzen nicht
gleich
T-Test für die Mittelwertgleichheit
Signifikanz
22.157
.000
T
df
Sig.
(2-seitig)
Mittlere
Differenz
Standardfehler
der Differenz
-3.694
99
.000
-7.2072
1.9512
-3.444
59.62
.001
-7.2072
2.0930
6) H 0 : Die Resultate von Männern und Frauen unterscheiden sich nicht.
H A : Die Frauen schneiden besser ab als die Männer.
Das Noten ordinalskaliert sind, müssen wir den Mann-Withney-Test verwenden.
Wir erhalten:
Geschlecht
w
w
m
m
w
w
m
w
m
m
m
m
m
m
m
m
U 1  5  11 
56
2
Punkte
19.25
19
18
18
17.5
17
16.5
16.25
16
15.75
13.25
12.75
11.875
11
7.5
1.5
Ränge
1
2
3.5
3.5
5
6
7
8
9
10
11
12
13
14
15
16
Rangsummen
Ränge W
Ränge M
1
2
3.5
3.5
5
6
7
8
22
9
10
11
12
13
14
15
16
114
 22  48
U 2  5  11  48  7
minU 1 , U 2   min7, 48  7.
Wir schauen in der Tabelle nach: unter n 1  5 und n 2  11 : ist signifikant auf dem
0.01 Niveau.
7) Für Genf: x 1  15
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
235
n 1  60
Für Zürich: x 2  10
n 2  70
X 1 X 2
1510
n 1 n 2  6070  0. 192 31
X1
n1
X 1 X 2
n 1 n 2
1

X2
n2
X 1 X 2
n 1 n 2
 n11  n12 

15
60
 10
70
1  1 
0.192 3110.192 31 60
70
 1. 5452
1. 5452  0. 938851038
Der Unterschied ist nicht signifikant
8) ( 15
 0. 25;
60
10
70
 0. 142 86. Es muss gelten:
0.250.14286
0.192 3110.192 31 n11  n12 
 1. 96 (für
  0. 05; zweiseitig! Wir müssen x von x  0. 975 finden. Dies ist
näherungsweise 1. 96)

0.250.14286
1.96
2
0.192 3110.192 31
 0. 01923 7 
1
n1

1
n2
n 1 und n 2 sind nicht beide durch diese Gleichung bestimmt. Wir können somit n 1
bestimmen, wobei n11  0. 01923 7 sein muss (sonst erhalten wir für n12 eine
1
 n 1  51. 983
negative Zahl!). Somit gilt: n 1  0.01923
7
Wir wählen z.B. n 1  52.
1
Somit ist dann: 0. 01923 7  52
 0. 000006230 8
1
n 2  0. 000006230 8  n 2  16049
Es wäre allerdings besser, möglichst gleich grosse Stichproben zu wählen.
Entsprechend würden wir n 1  n 2 setzen und erhalten:
0. 01923 7  2n  n  103. 97
Wir müssen so nur zwei Stichproben à 104 wählen (2  104  208, was viel
weniger ist als 52  16049  16101.
Aus dem Beispiel ist folgendes ersichtlich (das folgende gilt nicht nur bezüglich der
Anteiltests, sondern bezüglich beliebiger Tests):
(1) Haben wir die Vermutung, dass Abweichungen relativ unbedeutend sind,
müssen wir grosse Stichproben haben, um sie als signifikant nachweisen zu
können: je kleiner die Abweichung, desto grösser die Stichproben. Bezüglich
vermuteter Abweichungen kann die minimale Stichprobengrösse berechnet
werden. Umgekehrt gilt: wählen wir sehr grosse Stichproben, werden auch
unbedeutende Differenzen signifikant. Das folgende Vorgehen ist zu empfehlen. In
betriebswirtschaftlichem Zusammenhang kann man mit Hilfe von
Kostenüberlegungen eine minimale Differenz berechnen, die aus Nutzengründen
gerade noch interessant ist. Unterschiede darunter sind ökonomisch unattraktiv. Es
wird dann bezüglich der gerade noch ökonomisch attraktiven Differenz die
minimale Stichprobengrösse berechnet, die den Unterschied als signifikant
nachweisen kann. Dann wird noch eine Sicherheitsreserve für Ausfälle
hinzugezählt.
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
236
(2) Stichproben sollten möglichst gleichgross sein (dann wird die nötige Fallzahl
kleiner). Entsprechend wird bei empirischen Untersuchungen der Forschungsplan
gleich grossen Stichproben vorsehen. Die Formeln mit n 1  n 2 bleiben nützlich, da
sich in der Praxis immer durch Ausfälle irgendwelcher Art verschieden grosse
Stichproben ergeben.
2.2.8. Lernziele
- Die angegebenen Zweistichprobentests für Datenmaterial korrekt auswählen und
durchführen können (mit Excel und SPSS). Bei der Auswahl richtige Beurteilung der
Voraussetzungen vornehmen können.
- Die Bemerkung (1) bei der letzten Aufgabe des letzten Übungsblockes kennen und
anwenden können.
- Übungen von der Art der angegebenen lösen können.
Univariate Tests
diskret verteilte Zufallsvariablen stetig verteilte Zufallsvariablen
Binomialtest
Poissontest
Hypergeometrische Tests
etc.
Einstichprobentests Zweistichprobentests
verbundene Stichproben unverbundene Stichproben
Mittelwertvergleich
z-Test (> 30 oder NV)
t-Test (NV)
t-Test (NV)
z-Test (ungleiche Varianz, n1,n2 > 50,NV)
t-Test (gleiche Varianz) (NV)
Verteilungsvergleich
Vorzeichentest
Vorzeichentest
Wilcoxontest (symm. V.)
Mann-Whitney-Test (symm. V.)
Varianzvergleich
Chiquadrattest (NV)
F-Test (NV)
Anteilsvergleich
Binomialtest
z-Test (n1,n2>50,NV)
___________________________________________________________________
Unverbundene Stichproben.tex 2. HSW Siders P.R.
237
3. Schätzen von Kennzahlen theoretischer Verteilungen
Bei der Einführung von stetigen Verteilungen haben wir die Anpassung von
Modellen an Daten diskutiert. Kamen wir auf Grund einer Graphik zum Schluss,
dass z.B. eine Exponentialverteilung als Modell geeignet sein könnte, berechneten
wir den Mittelwert der Daten und identifizierten diesen mit dem Mittelwert der
theoretischen Verteilung: d.h. wir schätzten den Mittelwert des Modells aus den
Daten. Das Problem des Schätzens kann entsprechend wie folgt allgemein
formuliert werden: Hat man Daten und ein parametrisches Modell für sie, so will
man eine eindeutige Beschreibung der Daten durch ein Modell erhalten, indem
man die Werte der Parameter festlegt, so dass das Modell möglichst gut zu den
Daten passt.
Für die Wahl von Schätzern (z.B. das arithmetische Mittel versus Median) gibt es
Kriterien, die wir kurz diskutieren wollen.
1) Erwartungstreue: Die konkrete Kennzahl einer Stichprobe ist als Wert einer
Zufallsvariable zu betrachten. Diese Zufallsvariable nennen wir ”Schätzfunktion T”.
Sie weist als Werte die realsierbaren Parameter der Stichprobe auf. T weist zudem
eine Verteilung auf - mit Erwartungswert und Standardabweichung. Wir nehmen
an, die Daten entstammten einer spezifischen Verteilung F mit dem Parameter .
Der empirische Parameter der Daten ist im allgemeinen nicht mit  identisch,
sondern streut um die Kennzahl der theoretischen Verteilung. Wir nennen eine
Schätzfunktion (oder einen Schätzer) T erwartungstreu genau dann, wenn der
Erwartungswert von T mit  identisch ist, d.h. ET  . Gilt ET  , so wird
ET   ”systematischer Fehler” oder ”Bias” genannt.
2) Effizienz: Gegeben seien zwei Schätzfunktionen. Die Schätzfunktion mit der
kleineren Varianz gilt als effizienter. Gibt es unter den erwartungstreuen
Schätzfunktionen eine, die am effizientesten ist, nennt man diese ”effizient”.
3) Konsistenz: Ein Schätzer ist konsistent, wenn lim
ET    0 (n 
n
Stichprobenumfang). Somit sind erwartungstreue Schäzter konsistent.
Arithmetische Mittel und Median
Das arithmetische Mittel einer Stichprobe i ist ein erwartungstreuer Schätzer des
Erwartungswertes der Verteilung, aus der i stammt. Wir müssen zeigen, dass
EX   , wobei  der Erwartungswert der Verteilung ist, aus der die Stichprobe
stammt, deren Mittelwert Wert der Schätzfunktion X ist. Diesen Beweis haben wir
bereits geführt (siehe Verteilung des Mittelwertes):
n
EX   E 1n  X i  
i1
1
n
n
 EX i  
i1
1
n
n
 
i1
1
n
n  
Ohne die jeweiligen Beweise erfolgen ein paar Bemerkungen zum Verhältnis der
Schätzer ”Median” und ”Mittelwert”. Bei symmetrischen Verteilungen fällt der
___________________________________________________________________
Schätzungen.tex Statistik 2. HSW Siders P.R.
237
Median mit dem Mittelwert zusammen. Entsprechend ist dann auch der Median ein
erwartungstreuer Schätzer des theoretischen Medians. Die Medianschätzfunktion
unterscheidet sich allerdings von der Mittelwertschätzfunktion durch den Umstand,
dass erstere bei normalverteilten Daten eine grössere Varianz hat. Der Median ist
als Schätzer somit weniger effizient als das arithmetische Mittel, sofern die Daten
normalverteilt sind. Der Median ist bei asymmetrischen Verteilungen nicht
erwartungstreu, ist jedoch konsistent, d.h. je grösser der Datensatz, desto
erwartungstreuer ist der Median. Der Mittelwert hat den Nachteil, sehr sensitiv auf
Ausreisser zu reagieren (nicht robust). Der Median ist ein sehr robuster Schätzer.
Ist die Normalverteilungsannahme nicht gegeben, ist der Mittelwert oft nicht
effizienter als der Median.
Varianz
Wir zeigen, dass die Varianz einer Stichprobe i ein erwartungstreuer Schätzer der
Varianz der theoretischen Verteilung ist, aus der i stammt. Wir müssen zeigen,
dass ES   2 , wobei  2 die Varianz der theoretischen Verteilung ist. Es gilt:
S2 
1
n1
n
n
X i  X  2 
i1
1
n1
n
n
X 2i  2X i X  X 2  
i1
1
n1
 X 2i  2 nn  X i X  nX 2
1
n1
 X 2i  2nX 2  nX 2
i1
n
1
n1

i1

i1
1
n1
n
n
1
n1
n
n
n
i1
i1
i1
 X 2i  2  X i X   X 2
 X 2i  2nX X  nX 2


i1
 X 2i  nX 2
i1
Im folgenden setzen wir EX i   0, da die Varianz von der Lage der Verteilung
unabhängig ist. Zudem verwenden wir Theoreme aus dem Kapitel ”Verteilung des
Mittelwertes”:
ES 2   E
1
n1
n
 X 2i  nX 2
i1
Da EX i   0, gilt
EX 2i 

1
n1
n
 EX 2i   nEX 2 
i1
n
 EX i  EX i   VX i . Somit ist  EX 2i   nVX i 
2
2
Da EX   EX i   0, gilt: EX 2   EX  EX   VX  
VX

Somit ist dann: nEX 2   n n i  VX i 
Deshalb gilt:
1
n1
1
n1
n
 EX 2i   nEX 2  
i1
1
n1
i1
VX i 
n
nVX i   VX i  
VX i n  1  VX i .
Somit ist die Varianz einer Stichprobe ein erwartungstreuer Schätzer der Varianz
der theoretischen Verteilung. Dieser Beweis stellt eine Rechtfertigung für die
1
Definition der Varianz mit n1
dar. Bei einer Definition mit 1n wäre eine Nachweis
der Erwartungstreue der Varianz nicht möglich.
Es gibt verschiedene Methoden, um für beliebige Verteilungen Parameter zu
schätzen. Wir werden im Rahmen der Regressionsgleichung die Methode der
kleinsten Quadrate kennenlernen. Gebräuchlich ist zudem die
Maximum-Likelihood-Methode.
___________________________________________________________________
Schätzungen.tex Statistik 2. HSW Siders P.R.
238
4. Vertrauensintervalle
Wir nehmen an, in einem spezifischen Test würde ein konkreter Wert b zu einem
signifikanten Resultat führen. So hätte etwa eine Mastmethode zu einem mittleren
Gewicht von x geführt, das zur Verwerfung der Nullhypothese mit Mittelwert der
Grundgesamtheit  0 geführt hat. Würden wir die neue Mastmethode auf alle Tiere
der Art anwenden, würden wir somit ein neues  0 erhalten, da es unwahrscheinlich
ist, dass x aus einer Grundgesamtheit mit  0 stammt. Wir können den konkreten
Wert x des Testergebnisses als Wert der Stichprobe aus einer neuen
Grundgesamtheit mit  0 betrachten. Entsprechend ist x als Wert einer
Zufallsvariable zu betrachten und schwankt um den tatsächlichen, aber
unbekannten Wert  0 der ”neuen” Grundgesamtheit. Es wäre nun nützlich zu
wissen, in welchem Intervall um x sich  0 mit einer angebbarer Wahrscheinlichkeit
von  befindet.
Erhalten wir einen spezifischen Testwert b, können wir uns fragen, welche
Verteilungsparameter mit diesem Wert verträglich sind ( nicht zur Verwerfung der
jeweiligen Nullhypothese führen). Es sind ja genau diese Werte, zu denen b als
Testresultat passt. Bei anderen Werten wäre b als Testresultat unwahrscheinlich.
Deshalb ist es vernünftig, ”Vertrauensintervall” wie folgt zu definieren:
Definition: Das  Vertrauensintervall oder  Konfidenzintervall V  b  b i : b i
führt bei einem Testergebnis von b bei einem Signifikanzniveau von   1   nicht
zur Verwerfung der Nullhypothese
Die Grenzen  g i des Vertrauensinvervalls sind somit die Parameter  g i , die genau
zur Verwerfung der Null-Hypothese führen. Es gilt dann: u i  V  b genau dann,
wenn  g l  u i   g r . Die Intervallgrenzen  g i gehören nicht zum Vertrauensintervall.
Die Angabe eines Testwertes ohne die Angabe eines Intervalls, in dem der
tatsächliche, aber unbekannte Parameter der ”neuen” Grundgesamtheit mit
angebbarer Wahrscheinlichkeit liegt, ist eigentlich nicht sinnvoll. Ist dieses Intervall
gross, so ist der Unterschied zwischen der Nullhypothese und der
Alternativhypothese unter Umständen ökonomisch nicht relevant. Ein Wechsel der
Produktionsmethoden würde in einem solchen Fall nur Kosten verursachen, ohne
ökonomisch interessante Verbesserungen.
Wir betrachten das Beispiel eines Einstichprobentests (z-Test).
Beispiel 1: Es sei X i normalverteilt oder n genügend gross und  20 aus der
Grundgesamtheit bekannt. Wir hätten im Test einen konkreten Wert x als
Ausprägung der Zufallsvariable X erhalten. Wir können uns fragen, welche  i mit
diesem x verträglich sind ( bei einem Signifikanzniveau von  nicht zur
Verwerfung der Nullhypothese führen). Die Nullhypothese wird nicht verworfen,
X 
x 
wenn für 0 i  N0, 1 gilt:  1  1
  0 i   1   1
.
2
2
n
n
Um die Intervallgrenzen zu finden, lösen nach  g auf:
___________________________________________________________________
Vertrauensintervalle.tex 2. HSW Siders P.R.
Seite 239
Untere Grenze:  1  1

2

x   g   1  1
2
0
1 1
x    2  n
Obere Grenze::
x   g   1  
x   1   1

2
0
n
0
n

  g  x   1  1

2
x  i
  1  
0
n
1
2
0
n
x  i

0
n
1
2
0
n
 g 

  g  x   1  
1
2

0
n

Nun gilt wegen der 0-Symmetrie der Standardnormalverteilung:
 1  1
 n0    1   1
 n0 . Wir können somit für die Grenzen des
2
2
Vertrauensintervalles zusammenfassen:
 g  x   1  
1
2


n
Für   0. 95 (95%-Vertrauensintervalle) müssen wir somit  1 0. 975  1. 96
berechnen. Entsprechend erhalten wir als Grenze des Vertrauensintervalles
 g  x   1  
 1  
1
2
1
2


n
 x  1. 96

n
  1. 96 für   0. 95
 g  Intervallgrenze des   0. 95 Vertrauensintervalles.
Konkretes Beispiel: Wir erhalten den Testwert x  10 (Mittelwert der Stichprobe)
und kennen die Standardabweichung der Grundgesamtheit:  0  0. 5. (n  30): Wir
erhalten als Grenzen des Vertrauensintervall: 10  1. 96 0.5  10. 179
10  1. 96
0.5
30
30
 9. 821 1. Das 95%-Vertrauensintervall ist somit 9. 8211, 10. 179.
Man sieht an der Formel x  1. 96

n
unmittelbar, dass das Vertrauensintervall
grösser wird, wenn die Standardabweichung grösser ist. Zudem ist das
Vertrauensintervall kleiner, wenn n grösser ist: je grösser die Stichprobe, desto
kleiner das Vertrauensintervall.
Mit Excel können wir die Quantile der Standardnormalverteilung für spezifische
Wahrscheinlichkeiten durch ”norminv” finden: für (0. 025, 0, 1) erhalten wir:
1. 959961082  1. 96.
für (0. 975, 0, 1) erhalten wir: 1. 959961082  1. 96.
Am Beispiel 1 können wir die Grundüberlegungen bezüglich der
Vertrauensintervalle noch etwas deutlicher machen.
___________________________________________________________________
Vertrauensintervalle.tex 2. HSW Siders P.R.
Seite 240
Vertrauensintervall
je 0.025
Ein  i  10. 179 führt bei einem Testresultat von 10 zur Verwerfung der
Nullhypothese, ist somit mit dem Testresultat nicht verträglich.
Ein  i  9. 8211 führt bei einem Testresultat von 10 ebenfalls zur Verwerfung der
Nullhypothese.
9. 8211   i  10. 179 führt bei einem Testresultat von 10 nicht zur Verwerfung der
Nullhypohtese. Somit ist das Vertrauensintervall 9. 8211, 10. 179.
Eine andere Betrachtungsweise führt zum selben Resultat: Wir können uns die
Verteilung um 10 herum denken. Die Grenzen des Vertrauensintervalls sind dann
die  g , die symmetrisch um 10 zwischen der x-Achse und der Dichtefunktion der
Normalverteilung mit   10 und   0.5 eine Fläche von 0.95 ausschneiden:
30
___________________________________________________________________
Vertrauensintervalle.tex 2. HSW Siders P.R.
Seite 241
je 0.025
Vertrauensintervall
Die Vertrauensintervalle berechnen wir mit Hilfe eines Testwertes, der Wert einer
Zufallsvariable ist. Entsprechend ist ein Vertrauensintervall selber Wert einer
Zufallsvariable. Wir können jedoch davon ausgehen, dass der tatsächliche Wert
sich mit einer Wahrscheinlichkeit von  im Vertrauensintervall um das Testresultat
herum befindet.
Vertrauensintervalle sind informativer als das Testresultat ”signifikant” oder
”nicht-signifikant”. Es gilt offenbar. Ein Testergebnis ist genau dann signifikant,
wenn der Parameter der Nullhypothese ausserhalb des Vertrauensintervalles des
Testergebnisses liegt. Somit kann man aus Vertrauensintervallen Signifikanz
unmittelbar herauslesen, während man aus dem Ergebnis ”signifikant” allein keine
Vertrauensintervalle herleiten kann.
Beispiel 2: Es gelte X i  N,  20  mit unbekanntem  20 .
X 
Wir hätten einen t-Test verwendet: S  t n1 .
n
Bei einem Testergebnis von x wird die Nullhypothese nicht verworfen, wenn
x 
1
1
t n1
 1
   i  t n1
  1
.
2
2
n
(  Standardabweichung der Stichprobe, n  Stichprobengrösse, die t-Verteilung
ist symmetrisch).
Wir lösen nach  g auf und erhalten wie oben:
1
  1
 n .
 g  x  t n1
2
Konkretes Beispiel: n  50; x  20;   2.
___________________________________________________________________
Vertrauensintervalle.tex 2. HSW Siders P.R.
Seite 242
1
Wir suchen in einer Tabelle oder mit Hilfe von Excel t 501
0. 975 : 2. 009574018.
(Excel liefert die entsprechenden Quantile unter ”tinv” für den zweiseitigen Fall an.
Im Beispiel würden wir für somit (0.05; 49) eingeben und erhalten: 2.009574018)
Wir erhalten somit: 20  2. 009574018 2  20. 568 für ”” und 19. 432 für ””.
50
Das Vertrauensintervall ist somit 19. 432, 20. 568
Bei asymmetrischen Verteilungen (z.B. F- und  2 Verteilungen) müssen wir die
rechte und die linke Intervallgrenze separat berechnen.
Wir betrachten noch ein Beispiel mit einer diskreten Verteilung:
Beispiel 3: Bei der Messung von 10 Proben Luft würden wir 45 Asbestfasern
erhalten (Grenzwert 30). Wir berechnen:
PX  45  1  0. 993731385  6. 268 6  10 3 für X  P30. Da 45 zur Verwerfung
der Nullhypothese mit   30 führt, gehört 30 nicht zum Vertrauensintervall von 45.
Wir fragen uns, welcher Parameter  in X  P mit 45 verträglich wären, d.h. nicht
zur Verwerfung der entsprechenden Nullhypothese führen (auf einem spezifischen
Signifikanzniveau, z.B. 0. 05, zweiseitig).
Wir berechnen PX  45 für   31, 32, 33,etc. um die Intervallgrenze zu finden. Auf
der anderen Seite berechnen wir PX  45 für   56, 57, 58, 59, etc.
λ=
30
31
32
33
34
35
36
37
P(X > 45
0.00626861
0.01064678
0.0172969
0.02696198
0.04043834
0.05850936
0.08186538
0.11101977
λ=
56
57
58
59
60
61
62
63
P(X < 45
0.07668825
0.05981402
0.04613935
0.03520735
0.02658206
0.0198627
0.01469207
0.01076026
Wir erhalten: PX  45  0. 026961979 für X  P33 als ersten Wert, der über 0. 025
liegt und damit nicht zur Verwerfung der Nullhypothese führt. Auf der anderen Seite
von 45 gilt: PX  45  0. 026582065 für X  P60 als erstem Wert, der über 0. 025
liegt und damit nicht zur Verwerfung der Nullhypothese führt. Das
Vertrauensintervall für 45 wäre entsprechend 33, 60  N oder 32, 61N. Mit einer
Wahrscheinlichkeit von 95% liegt der tatsächliche Wert in diesem Intervall, wenn
der Testwert 45 beträgt.
Übungen:
1) Berechnen Sie das 95%-Vertrauensintervall für n  10;  2  11. 55433333;   55,
x  49. 61 (siehe Beispiel für Einstichproben-t-Test)
2) Berechnen Sie das 95%-Vertrauensintervall für das Beispiel 1,
Einstichprobentests (z-Test).
3) Berechnen Sie das 95%-Vertrauensintervall für das Beispiel 1, gepaarte
___________________________________________________________________
Vertrauensintervalle.tex 2. HSW Siders P.R.
Seite 243
Stichproben.
4) Berechnen Sie das 98%-Vertrauensintervall für Übung 2 dieses Kapitels).
Lösungen
1
1) t 9
0. 975  2. 262
Wir erhalten somit: 49. 61  2. 262
11.5543333
10
 52. 041
 47. 179
49. 61  2. 262 11.5543333
10
Das Vertrauensintervall ist somit 47. 179; 52. 041
Von SPSS wird in diesem Zusammenhang das Vertrauensintervall der Differenzen
(der Mittelwerte) angegeben. Wir können dies wie folgt berechnen: 55  47. 179  7.
821 sowie 55  52. 041  2. 959
Wir erhalten somit:   7. 821, 2. 959
2) Indem wir die obigen Formeln verwenden gilt: x  1. 96
20. 5  1. 95
20. 5  1. 95
2
50
2
50
0
n

 21. 052
 19. 948
19. 948, 21. 052
1
3) Indem wir die obigen Formeln verwenden, gilt: x  t n1
0. 975
1
t 16
0. 975  2. 12
Wir erhalten somit:0. 891718213  2. 12 0.040089677  0. 871 11
0. 891718213  2. 12 0.040089677   0. 912 33
  0. 91233, 0. 87111.

n
;
17
17
4) Wir berechnen das 0.99-Quantil der Standardnormalverteilung (mit Excel):
2. 326341928
d.h. 2. 326341928  0. 99.
Indem wir die obigen Formeln verwenden gilt: x  2. 326341928
20. 5  2. 326341928
20. 5  2. 326341928
19. 842, 21. 158
2
50
2
50
0
n

 21. 158
 19. 842
Wie zu erwarten, gilt: 19. 948, 21. 05219. 842, 21. 158.
___________________________________________________________________
Vertrauensintervalle.tex 2. HSW Siders P.R.
Seite 244
Stichprobentheorie
Oft will man eine Kennzahl einer Grundgesamtheit auf Grund einer Stichprobe
schätzen (z.B. in einer Umfrage möchte man den Anteil der Befürworter, Gegner
und Unentschiedenen bezüglich einer Abstimmung oder die Interessenten eines
Produktes oder einer Dienstleistung schätzen; man möchte das
Durchschnittseinkommen einer Population kennen, usw.). Bei Schätzungen ist
jeweils ein Wert anzugeben sowie ein Vertrauensintervall. Ergibt sich bei
Meinungsumfragen, die zeitlich gestaffelt vorgenommen werden, ein Unterschied
von 3% und beträgt das Vertrauensintervall für beide Werte   2%;   2%, wobei
 der geschätzte Anteil an Befürwortern ist, so kann da offensichtlich kein Trend
herausgelesen werden - ein häufiger Fehler bei der Interpretation von
Umfrageergebnissen. Entsprechend sind Umfrageergebnisse ohne die Angabe von
Vertrauensintervallen nicht sinnvoll.
Wir betrachten eine Population mit N Objekten. Aus dieser wird eine
Zufallsstichprobe S (ohne Zurücklegen) gezogen. Dazu werden z.B. den Objekten
der Population willkürlich Zufallszahlen zugeordnet. Die Zufallszahlen werden dann
der Grösse nach geordnet. Bei einer Stichprobengrösse von n wählen wir die n
Objekte mit den n kleinsten Zufallszahlen.
Es gibt  Nn  mögliche Stichproben, die auf diese Art gezogen werden können. Jede
dieser Stichproben S ist gleich wahrscheinlich. Entsprechend ist die
Wahrscheinlichkeit, eine spezifische Stichprobe S zu ziehen, PS   1N  .
n
Die Wahrscheinlichkeit eines spezifischen Objektes, Element der Stichprobe S zu
sein, kann ebenfalls angegeben werden. x i gehört zur Stichprobe S genau dann,
wenn x i zu den n Objekten mit den n kleinsten Zufallszahlen gehört. Die
Wahrscheinlichkeit dazuzugehören, beträgt offensichtlich Nn .
Bezüglich der Objekte x i interessieren uns spezifische Merkmale y i . Sei y S das
Stichprobenmittel der metrisch skalierten Merkmale y i der Stichprobe S. Dann ist y S
als Wert einer Zufallsvariable Y S zu betrachten. Wie verhält sich Y S in bezug auf die
Populationsparameter y 0 ( Mittelwert der Ausprägung y i der Gesamtpopulation)?
An einem Beispiel wollen wir zuerst zeigen, dass der Erwartungswert von Y S mit y 0
übereinstimmt. Zudem ist die Standardabweichung von Y S ( Standardfehler)
kleiner als die Standardabweichung der Grundgesamtheit.
Beispiel 1: Gegeben sei die Minipopulation P a, b, c, d, e, f mit den
Ausprägungen y 1 , y 2 , y 3 , y 4 , y 5 , y 6   3, 1, 10, 4, 8, 2. Der Mittelwert y der Population
bezüglich der Variable y ist dann:
y P  3110482
 4 23
6
Die Standardabweichung ist:
P 
34 23
2
 14 23
2
 104 23
2
 44 23
61
2
 84 23
2
 24 23
2
 3. 559026084
Wir ziehen nun alle möglichen Stichproben S i der grösse n  2:
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 245
Es gibt  62   15 solcher Stichproben S i :
Wir listen diese auf (samt ihrem jeweiligen Mittelwert y S i ):
Stichprobe S
a
a
a
a
a
b
b
b
b
c
c
c
d
d
e
b
c
d
e
f
c
d
e
f
d
e
f
e
f
f
Werte yi,1, yi,2 der Stichprobe Si
Mittelwerte der Stichprobe Si
3
1
2
3
10
6.5
3
4
3.5
3
8
5.5
3
2
2.5
1
10
5.5
1
4
2.5
1
8
4.5
1
2
1.5
10
4
7
10
8
9
10
2
6
4
8
6
4
2
3
8
2
5
Erwartungswert
4.66666667
Standabw.
2.05480467
Wir stellen fest: der Erwartungswert
k
15
i1
i1
EY S    PS i   y S i  
1
15
y S i 
1
15
15
 y S i  4. 6666667, stimmt mit dem
i1
Populationsmittel y 0 überein. Mit anderen Worten: das Stichprobenmittel ist ein
erwartungstreuer Schätzer des Populationsmittelwertes. Die Standardabweichung
der Mittelwerte der Stichproben ist hingegen kleiner als die Varianz der Daten der
Population.
Wir formulieren diese und weitere Resultate nun formal und leiten manche davon
her:
I. Schätzen des Mittelwertes und des Totals einer Gesamtpopulation
Theorem 1: EY S   y 0
(Y S Zufallsvariable mit Stichprobenmitteln als Werte; y 0 Mittelwert der
Gesamtpopulation).
Beweis: Wir müssen zeigen: EY S  
1
N
N
 y j  y 0
j1
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 246
Für das arithmetische Mittel y S i der Stichprobe S i der Grösse n gilt: 
 Nn 
 Nn 
i1
i1
EY S    PS i y S i  
1
 Nn 
 Nn 

i1
1
n
n
 yj 
1
y S i 
 Nn 
1
 Nn 
n
 yj
jS i
 Nn 
 y S i 
i1
 Nn  n
 Nn n
jS i
1
1
n
  yj
i1 jS i
 Nn  n
  y j ist die Summe der Summen der Ausprägungen y j einer jeden Stichprobe
i1 jS i
Si.
Jedes y i kommt genau in  N1
 Stichproben vor. Beweis: Wir betrachten ein
n1
spezifizisches y i und die Menge P   P\y i . Jede Teilmenge von P  mit n  1
Elementen kann verwendet werden, um {y i } zu einer Stichprobe des Umfangs n zu
ergänzen. In P  gibt es  N1
 Stichproben des Umfangs n  1. Somit kommt y i in
n1
N1
 n1  Stichproben des Umfangs n vor. Die Summe der Summen aller Strichproben
enthält somit jedes y i  N1
 mal als Summand. Entsprechend ist sie das
n1
N1
 n1  fache der Summe aller y i .
 Nn  n
 Nn  n
i1 jS i
i1 jS i
N
Wir können also   y j wie folgt umschreiben:   y j   N1
  yj
n1
Wir erhalten: EY S  
Nun ist  N1

n1
und:  Nn  
1
 Nn n
 N1

n1
N
 N1   y j
 N n n1
1
n
j1
N1!
N1n1!n1!
N!
Nn!n!

N1!
Nn!n1!
. Somit ist
N1!Nn!n!
N!Nn!n1!n
Somit ist EY S  
j1
1
 Nn n


N1
n1
N1!Nn!n!
N!Nn!n!
N
  yj 
j1
1
N

N
N1!
N!
 y j  y 0

1
N
q.e.d.
j1
Beispiel 2: Wir möchten den durchschnittlichen Weinkonsum einer Stadt erfassen
(100’000 Einwohner). Dazu ziehen wir eine Zufallsstichprobe von 200 Personen
und erheben ihren Weinkonsum (z.B. durch Befragung). Wir erhalten 200
Ergebnisse y i . Wir bilden den Mittelwert y S der 200 Ergebnisse y i und können
diesen als erwartungsstreuen Schätzer des durchschnittlichen Weinkonsums der
100’000 Einwohner betrachten.
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 247
Wir behandeln nun das Schätzen von Totalen. Sei Y die Summe der y i , i  N (Y ist
N
somit das Populationstotal der y i , d.h.  y i  Y)
i1
N
N
i1
i1
Theorem 2: ENY S   NEY S   Ny 0  N N1  y i   y i  Y
(N  Anzahl Objekte der Gesamtpopulation; Y S  Zufallsvariable mit den
Mittelwerten der Stichprobe der Grösse n als Werte; y i  Datum des Objektes x i ;
y 0  Mittelwert der Gesamtpopulation).
Der Erwartungswert des N-fachen des Stichprobenmittels ist gleich der Summe der
y i der Grundgesamtheit. Entsprechend ist NY S ein erwartungstreuer Schätzer des
Populationstotals Y
Beispiel 3 : Wir führen das vorangehende Beispiel 2 fort. Wir möchte wissen,
wieviel der Gesamtweinkonsum der Stadt ist. Wir multiplizieren den geschätzten
durchschnittlichen Weinkonsum mit 100’000 und erhalten den geschätzten totalen
Weinkonsum.
II. Vertrauensintervalle für Schätzungen des Mittelwertes und des Totals
Ohne Beweis halten wir fest:
Theorem 3: VY S  
1
n
1 
n
N
 20
(Y S ist die Zufallsvariable mit den Stichprobenmitteln als Werte; n  Grösse der
Stichprobe; N  Grösse der Gesamtpopulation;  20  Varianz der Variable y der
Gesamtpopulation, wobei gilt:  20 
1
N1
N
y i  y 0  2 
i1
Entsprechend ist VY S  kein erwartungstreuer Schätzer von  20 . Demgegenüber
VY 
wäre 1 Sn ein erwartungtreuer Schätzer von  20 .
n
1 N
Im betrachteten Beispiel 1 erhalten wir für den Standardfehler des Mittelwertes (
Standardabweichung des Mittelwertes, manchmal auch ”Stichprobenfehler”
genannt):
1
2
1  26 3. 559026084 2  2. 0548. (Überprüfen Sie die Übereinstimmung mit dem
Ergebnis in der Tabelle).
Sei  2S die Varianz einer konkreten Stichprobe S. Dann gilt:
Theorem 4: 1n 1  Nn  2S ist ein erwartungstreuer Schätzer der Varianz
VY S   1n 1  Nn  20 der Zufallsvariable Y S .
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 248
(n  Stichprobengrösse; N  Grösse der Gesamtpopulation;  2S 
1
n1
Varianz der Stichprobe S;  20 Varianz der Gesamtpopulation).
n
y i  y S  2  
i1
Entsprechend werden wir diese Formel dazu verwenden können, um
Vertrauensintervalle zu berechnen.
Der Faktor 1  Nn  wird Endlichkeitskorrektur genannt. In der Praxis wird er
vernachlässigt, wenn Nn  0. 1 ist (die Stichprobe im Verhältnis zur
Grundgesamtheit klein ist). Beim Wegfallen der Endlichkeitskorrektur erhalten wir
somit für die geschätzte Varianz der Stichprobenmittel:  2y  1n  2S . Dies ergibt
einen geschätzten Standardfehler von:  y  nS .
Bei der Berechnung von Vertrauensintervallen geht man im Allgemeinen davon
aus, dass die Zufallsvariable Y S , normalverteilt ist, selbst wenn VY S  aus der
Stichprobe geschätzt wird (in diesem Fall wäre eigentlich eine t-Verteilung
angebracht und man müsste Normalverteilung der Daten voraussetzen). Dies ist
gerechtfertigt, da die Stichproben im Allgemeinen mehrere Hundert Daten umfasst.
Die Normalverteilungsannahme ist jedoch nicht gerechtfertigt, wenn extrem schiefe
Verteilungen mit extremen Ausreissern vorliegen (häufig bei Einkommensdaten
oder Investitionen). Zur Berechnung von  Vertrauensintervallen können wir bei
Voraussetzung einer Normalverteilung entwickeln:
Ohne Endlichkeitskorrektur:
y g y S
 y
y g y S

S
  1  
1
2

n
 1 ist die Umkehrfunktion der Standardnormalverteilungsfunktion.
Wir lösen nach y g auf und erhalten als Intervallgrenzen des Vertrauensintervalls:
y g  y S   1  
1
2

S
n
ohne Endlichkeitskorrektur
  Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95)
y g  Intervallgrenzen des Vertrauensintervalls
y S  Mittelwert der Stichprobe
 S  Standardabweichung der Stichprobe
n  Stichprobengrösse
Mit Endlichkeitskorrektur:
y g y S
 y

y g y S
1
n
1
n
N
 2S
  1  
1
2
.
Wir lösen nach y g auf und erhalten:
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 249
y g  y S   1  
1
2
1
n

1 
n
N
 2S
mit Endlichkeitskorrektur
  Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95)
y g  Intervallgrenzen des Vertrauensintervalls
y S  Mittelwert der Stichprobe
 S  Standardabweichung der Stichprobe
n  Stichprobengrösse
N  Grösse der Grundgesamtheit
Beispiel 4: Wir wollen den durchschnittlichen Konsum elektronischer
Unterhaltungsgüter einer Population schätzen (in Franken). Dazu soll ein
Vertrauensintervall von 95% angegeben werden. Die Population weise 500’000
Personen auf. Es wird eine Zufallstichprobe von 500 Personen gezogen. Wir
500
nehmen an, y s  700.  und  S  200. . Wir berechnen: 500000
 0. 001  0. 1. Wir
können somit die Endlichkeitskorrektur vernachlässigen. Wir erhalten als
geschätzten Standardfehler:  y  200  8. 9443. (Mit der Endlichkeitskorrektur
500
erhalten wir:  y 
1
n
1 
n
N
 2S 
1
500
1
500
500000
200 2  8. 9398
Wir berechnen nun das 95%-Vertrauensintervall (ohne Endlichkeitskorrektur):
y g 700
 1. 96   1 0. 975
8.9443
Wir rechnen nach y g aus und erhalten:
y g 700
8.9443
 1. 96  y g  717. 53.
Da die Normalverteilung symmetrisch ist, erhalten wir für die andere Seite
700  17. 53  682. 47 und damit: ]682. 47; 717. 53. Mit einer Wahrscheinlichkeit von
95% befindet sich der tatsächliche Mittelwert der Grundgesamtheit in diesem
Intervall, wenn wir in der Stichprobe einen Mittelwert von 700 haben.
Mit Hilfe der obigen Formeln erhalten wir dieses Resultat schneller:

y g  y S   1   1
 Sn  700  1. 96  200  682. 47 für ”” und 717. 53 für ””.
2
500
Das Vertrauensintervall ist somit: ]682. 47, 717. 53.
Mit Hilfe der Formel samt Endlichkeitskorrektur erhalten wir:
y g  y S   1   1
 1n 1  Nn  2S  700  1. 96 
2
für ”” und 717. 52 für ””.
Das Vertrauensintervall ist somit: [682. 48;717. 52].
1
500
1 
500
500000
  200  682. 48
Berechnung der Stichprobengrösse: Sofern wir aus früheren Daten die vermutliche
Varianz der Grundgesamtheit schätzen können, können wir mit den obigen
Formeln auch die Stichprobengrösse festlegen, die zu einer spezifischen Breite
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 250
des Vertrauensintervalles führt.
Wir betrachten die Formel ohne Endlichkeitskorrektur: y g  y S   1  
1
2

S
n
Die Breite des Vertrauensintervalls ist 2|y g  y S | : 2.
Wir erhalten somit: 2  2 1  
   1  
1
2

0
n
1
2

0
n

.
Wir lösen dies nach n auf und erhalten:
 1  1

2
n
2 2
0
2
ohne Endlichkeitskorrektur
  Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95)
  die Hälfte der Breite des Vertrauensintervalles
 20  Standardabweichung der Gesamtpopulation (gewöhnlich
geschätzt durch frühere Stichprobe)
n  Stichprobengrösse
Bei der Berücksichtigung der Endlichkeitskorrektur erhalten wir:
2  2 1  
n   20 N
1
2
1
n

n
N
 2S 
2
 1  1

2
 20  1  1

2
1 
2
 2 N
Beispiel 5: Wir führen das Beispiel 4 fort. Wir nehmen an, wir würden nochmals
eine Untersuchung vornehmen und möchten ein 95%-Vertrauensintervall mit einer
Breite von 10 haben (oben betrug die Breite 17. 52. Wie gross muss die
Stichprobe sein? Wir schätzen  0 mit Hilfe der Standardabweichung der ersten
1.96 2 200 2
Stichprobe und erhalten: n 
 1536. 6
2
10
Wir müssen somit eine Stichprobengrösse von 1537 wählen. Wir sehen, dass die
Grösse der Stichprobe recht massiv erhöht werden muss, um das
Vertrauensintervall in dieser Grössenordnung zu senken (Faustregel: um das
Vertrauensintervall zu halbieren, muss man die Stichprobengrösse vervierfachen).
Mit Hilfe der Formel mit Endlichkeitskorrektur:
n   20 N
2
 1  1

2
 20  1  1

2
2
 2 N
 200 2  500000 
1.96 2
200 2 1.96 2 10 2 500000
 1531. 9
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 251
Bei der Berechnung des Vertrauensintervalls von Totalen gilt:
VY  VNy   N 2 Vy  
N2
n
1 
n
N
 20
Wiederum schätzen wir im Allgemeinen  20 durch  2S .
Somit erhalten wir als Schätzung für VY :
N2
n
1 
n
N
 2S
Wir setzen wiederum Normalverteilung voraus und erhalten:
Y g Y S
N2
n
1
n
N
 2S
  1  
1
2

Wobei Y S das aus der Stichprobe geschätzte Total ist.
Wir lösen nach Y g auf: Y g  Y S   1  
1
2

N2
n
1 
n
N
 2S
Bei Vernachlässigung der Endlichkeitskorrektur: Y g  Y S   1  
1
2

N2
n
 2S
Beispiel 6: Wir führen das Beispiel 4 fort. Wir wollen den Gesamtkonsum
elektronischer Unterhaltungsgüter einer Population schätzten (in Franken). Dazu
soll ein 95%-Vertrauensintervall angegeben werden. Die Population weise 500’000
Personen auf. Es wird eine Zufallstichprobe von 500 Personen gezogen. Wir
500
nehmen an, y s  700.  und  S  200. . Wir berechnen: 500000
 0. 001  0. 1. Wir
können somit die Endlichkeitskorrektur vernachlässigen.

Y g  Y S   1   1
2
3. 587 7  10 8 für ””.
N2
n
 2S  500000  700  1. 96
500000 2
500
200 2 
Dabei ist Y S  500000  700  3. 5  10 8 ; 3. 5  10 8  3. 5877  10 8   8. 77  10 6
Wir erhalten somit folgendes Vertrauensintervall:
3. 5  10 8  8. 77  10 6 ; 3. 5  10 8  8. 77  10 6 
Mit einer Wahrscheinlichkeit von 95% befindet sich die tatsächliche Gesamtsumme
in diesem Intervall, wenn der geschätzte Wert 3. 5  10 8 ist.
Wie im Falle des Mittelwertes, kann auch hier bei bekannter Varianz eine Formel
für die nötige Sichtprobengrösse für ein spezifisches Vertrauensintervall
angegeben werden (das Vorgehen ist dabei mit dem obigen identisch).
III. Schätzen von Anteilen
Für Anteile können wir (ohne Beweise) festhalten: (U  Grundgesamtheit; A  U, A
ist die Teilmenge von U, deren zahlenmässigen Anteil wir schätzen wollen; N
Anzahl Objekte von U, N A Anzahl Objekte von A, der Anteil p U von A an U ist somit:
p U  NNA ). Dieser Anteil wird erwartungstreu geschätzt durch den Anteil p s  nnA in
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 252
der Stichprobe (n A  Anzahl der Elemente der Menge A s  A in der Stichprobe S
(A s  S; n  Stichprobengrösse)
p s ist damit Wert einer Zufallsvariable P S . Für deren Varianz lässt sich zeigen:
VP s  
p U 1p U  Nn
n
N1
Sie wird geschätzt durch:  2P s  1 
n
N

p s 1p s 
n1
,
wobei 1  Nn  auch hier die Endlichkeitskorrektur ist. Wir gehen wiederum davon
aus, dass Anteile normalverteilt sind. Damit ergeben sich für Vertrauensintervalle
die folgenden Formeln:
p g p S
1
n
N

p s 1p s 
n1
  1  
p g  p S   1  
1
2
1
2

n
N
 1 

p s 1p s 
n1
mit Endlichkeitskorrektur
  Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95)
p g  Grenze des Vertrauensintervalls
p S  Anteil in der Stichprobe S
N  Grösse der Gesamtpopulation
n  Stichprobengrösse
ohne Endlichkeitskorrektor ergibt sich: p g  p S   1  
1
2

p s 1p s 
n1
Beispiel 7: Es soll der Anteil an Jugendlichen bei den Konsumenten von
Mobiltelephonie in einer Stadt erhoben werden (N  200’000). Dazu wird eine
Zufallsstichprobe von 400 Personen unter den Mobiltelephonbenutzern gezogen.
Es ergebe sich ein Anteil von 100 Jugendlichen. Wir berechnen das 95%- (das
98%-) Vertrauensintervall.
pg 
100
400
100
400
 1. 96  1 
400
200000

100
400
1 100

400
4001
 0. 292 45 für ””.
 0. 292 45   0. 042 45.
 0. 042 45  0. 207 55. Damit
Somit erhalten wir für die linke Intervallgrenze: 100
400
erhalten wir das Intervall: 0. 20755, 0. 29245. Mit einer Wahrscheinlichkeit von 95%
befindet sich der tatsächliche Anteil von Jugendlichen in diesem Intervall, wenn der
Stichprobenanteil 100
 0. 25 beträgt.
400
100
1 100 
Ohne Endlichkeitskorrektur: p g  100
 1. 96  4004001400  0. 292 49 für ”” und
400
0. 25  0. 25  0. 29249  0. 207 51 für ””. Dies ergibt das Intervall:
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 253
0. 207 51, 0. 292 49
Für das 98% Intervall erhalten wir ohne Endlichkeitskorrektor:
100
1 100 
p g  100
 2. 326341928  4004001400  0. 300 43 für ”” und
400
0. 25  0. 25  0. 30043  0. 199 57 für ”” und damit das Intervall: 0. 199 57, 0. 300 43
Auch hier kann die Stichprobengrösse, wenn die Varianz aus früheren Erhebungen
geschätzt werden kann, in Hinblick auf ein gewünschtes Vertrauensintervall im
Voraus bestimmt werden.
IV. Schätzen des Medians und von Quartilen
Der Median der Populationswerte kann durch den Median der Stichprobe geschätzt
werden. Die Quartile der Populationswerte werden durch die Quartile der
Stichprobe geschätzt. Der Median hat gegenüber dem arithmetischen Mittel den
Vorteil, durch Ausreisser nicht beeinflusst zu werden. Entsprechend ist die
Verwendung des Medians angemessen, wenn die Stichprobe Ausreisser enthalten
(z.B. beim Schätzen des Einkommens einer Kleinstadt, wenn ein Milliardär in der
Stichprobe vorkommt).
Eine grobe Abschätzung der Standardabweichung des Stichproben-Medians unter
0.93Q 3 Q 1 
Annahme einer Normalverteilung liefert
. Deshalb versagt diese Angabe
n
genau dann, wenn die Verwendung des Medians vorteilhaft ist. Damit wird die
Angabe von Vertrauensintervallen bei nicht-normalverteilten Zufallsvariablen
schwierig. Man kann allerdings die Streuung des Medians simulieren, indem man
aus Zufallszahlen, die wie die Stichprobendaten gestreut sind, ein paar Tausend
Stichproben zieht und dann das Vertrauensintervall aus der erhaltenen
empirischen Verteilung des Medians bestimmt.
V. Geschichtete Zufallsstichproben
Weiss man, dass bestimmte Merkmale der Population korrelieren (z.B. Frauen
kaufen mehr Äpfel als Männer) und möchte man eine Erhebung über den
Apfelkonsum der Bevölkerung machen, so kann man die Vertrauensintervalle bei
gegebener Stichprobengrösse verkleinern (oder die Stichprobengrösse bei
gegebenem Vertrauensintervall verkleinern), wenn man die verschiedenen
Gruppen gesondert betrachtet. Die Untergruppen werden ”Schichten” genannt. Die
Schichten können wiederum geschichtet werden. Wenige Schichtungsebenen
können die Vertrauensintervalle stark reduzieren, wenn die geeigneten
Schichtungen vorgenommen werden. Wächst die Anzahl der Schichtungsebenen
aber allzu sehr, so wird der Nutzen immer kleiner. Die Anzahl Objekte pro Schicht
muss grösser als 2 sein, da sonst keine Varianz berechnet werden kann. Oft muss
man bei Erhebungen damit rechnen, dass nur 50% der Personen erfasst werden
können. Dieser Umstand muss bei der Berechnung der Stichprobengrösse
berücksichtigt werden - umso mehr bei Schichtungen.
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 254
Innerhalb der Schichten können die bisher betrachteten Techniken verwendet
werden. So ist z.B. das Schichtmittel y S ein erwartungstreuer Schätzer des
Mittelwertes der entsprechenden Untergruppe in der Gesamtpopulation. Ebenso
können die schichtspezifischen, Anteile, Varianzen, etc. berechnet werden. Für die
Berechnung der entsprechenden Gesamtwerte sind die Werte der Schichten zu
gewichten und dann zusammenzuzählen. Als Gewicht wählen wir beim Mittelwert
nS
n (n S  Anzahl Objekte der Schicht, n  Anzahl Objekte der jeweiligen
Obermenge (bei Unterschichten ist n die Anzahl der Objekte der Obermenge der
Schichten). Für die Varianz des Stichprobenmittels kann folgender Term
L
hergeleitet werden: VY    W 2h 
h1
1
nh
 1 
nh
Nh
   2h
Dabei bezeichnet:
L die Anzahl der Schichten einer Schichtebene;
Wh 
Nh
N
 Anteil der Schicht in der Gesamtpopulation;
n h  Anzahl der Objekte der Schicht in der Stichprobe.
N h  Anzahl der Objekte der Schicht in der Gesamtpopulation;
 2h 
1
N h 1
Nh
 y i  y U h  2 die Varianz der Objekte der Schicht in der Gesamtpopulation mit
iU h
U h  Menge der Indizes der Objekte der Schicht in der Gesamtpopulation;
y U h  Mittelwert der Ausprägung y i der Schicht in der Gesamtpopulation.
 2h
wird geschätzt durch
 2S h

1
n h 1
nh
 y i  y S h  2 mit
iS h
S h  Menge der Indizes der Schicht in der Stichprobe und
y S h  Schichtmittel in der Stichprobe).
Mit Hilfe eines Beispiels können wir zeigen, dass die Varianz der Mittelwerte bei
Schichtung kleiner ist als ohne Schichtung (dies liegt daran, dass bei der
Summenbildung die Varianz zwischen den Schichten wegfällt!).
Beispiel 8: In einer Studie werden die Ausgaben für Musikprodukte in einem
Kanton erhoben. Es wird vermutet, dass junge Leute mehr für Musikprodukte
ausgeben als Ältere. Der Anteil der Jungen an der Population betrage 20%. Die
Stichprobengrösse betrage 500, N  250’000 ( N h der Jungen  0. 2  250000 
50000, N h der Älteren  200000. Wir ziehen eine Zufallsstichprobe unter den
Jungen und eine Zufallsstichprobe unter den Älteren (Resultate siehe Excel-Datei
Beispiel 8.xls).
Die Varianz in der Gesamtstichprobe beträgt 634.0460471.
Die Varianz in der Stichprobe bei den Jungen beträgt: 237.3241657
Die Varianz in der Stichprobe bei den Älteren beträgt: 204.6009063
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 255
Wir erhalten als geschätzte Gesamtvarianz der Mittelwerte (bei Schichtung):
100
400
1
1
0. 2 2  100
 1  50000
  237. 3241657  0. 8 2  400
 1  200000
  204. 6009063 
0. 421 45
Wir erhalten als geschätze Gesamtvarianz der Mittelwerte (ohne Schichtung):
500
1
 1  250000
  634. 0460471  1. 265 6.
500
Für die Vertrauensintervalle gilt dabei:
y g  y S   1  
1
2
y g y S
VY 
  1  
1
2

 VY 
Die Schichtbilding wirkt sich auf die 95%-Vertrauensintervalle am Beispiel wie folgt
aus:
Ohne Schichtung:
y g  y S  1. 96  1. 265 6  y S  2. 205 0  59. 7636  2. 205 0
Mit Schichtung erhalten wir: y g  y S  1. 96  0. 421 45  y S  1. 272 4
Dies ist eine Verkleinerung des Vertrauensintervalls um einen Faktor von
0. 577 05
1. 272 4
2.205 0

Um diese Verkleinerung des Vertrauensintervalles ohne Schichtung durch eine
Erhöhung der Stichprobe zu erhalten, müssten wir folgendes n erreichen:
n   2S N
5
2
 1  1

2
 2S  1  1

2
2
 2 N
2
1.96
 634. 0460471  250000 634.04604711.96
2 1. 272 4 2 250000  1495.
Bei der Schichtung werden für die Zielgruppen gesondert Zufallsstichproben
erhoben. Möglich ist ein weiteres Verfahren, das man ”Nachschichtung” nennt.
Dabei wird eine Stichprobe in der Gesamtpopulation erhoben und die Schichten
erst im Nachhinein unterschieden. Dabei müssen die Anteile der Schichten an der
Gesamtpopulation bekannt sein. Bei der Nachschichtung sind die
Stichprobengrössen der Schichten Werte einer Zufallsvariable. Der folgende
Schätzer stellt bei genügend grossen Stichproben einen erwartungstreuen
Schätzer des Gesamtvarianz bei einer Nachschichtung dar:
L
VY    W 2h 
h1
1
nh
 1 
nh
Nh
   2h
(Interpretation wie oben)
Beispiel 9: Wir wollen den durschnittlichen Konsum elektronischer
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 256
Unterhaltungsgüter einer Population schätzen (in Franken). Dazu soll ein
95% Vertrauensintervall angegeben werden. Die Population weise 500000
Personen auf. Wir vermuten, dass ältere Leute ( 60 weniger
Unterhaltungselektronik konsumieren als andere Altersegmente. Es wird eine
Zufallstichprobe von 500 Personen gezogen. Wir untersuchen die beiden
Altergruppen im Nachhinein getrennt. Wir unterteilen entsprechend die Stichprobe
von 500 Personen in zwei Schichten A(lter) und B. Auf Grund der Daten (siehe
Beispiel 8.xls) erhalten wir folgende Resultate: Zur Schicht der Älteren gehören 93,
zur Schicht der Jüngeren gehören 500  93  407. Der Anteil der Älteren an der
Gesamtpopulation beträgt 22%.
Wir berechnen die Standardabweichung für die Gesamtstichprobe, um diese mit
der Summe der Varianzen der Schichten zu vergleichen.
Varianz der Gesamtstichprobe: 3210. 01891
Varianz in der Altergruppen der Älteren: 141. 8137735
Varianz in der Altersgruppe der Anderen: 2094. 9
Geschätze Gesamtvarianz des Mittelwertes bei Schichtung:
 y 
78
100
2
22
100
2
1
 407
93
1
 93
 1  0.22500000
  141. 8137735 
407
 1  0.78500000   2094. 9  3. 202
Geschätzte Gesamtvarianz des Mittelwertes ohne Schichtung:
 y 
1
500
1 
500
500000
3210. 01891  6. 413 6
Wir erhalten entsprechend folgende 95%-Vertrauenintervalle mit und ohne
Nachschichtung für dieselbe Stichprobe:
Mit Nachschichtung: y g  y S  1. 96 3. 202  y S  3. 507 3
Ohne Nachschichtung: y g  y S  1. 96 6. 413 6  y S  4. 963 7
Das Vertrauensintervall kann somit um einen Faktor von
verkleinert werden.
3. 471 5
4.963 7
 0. 699 38
Wollten wir eine solche Verkleinerung ohne Schichtung durch die Erhöhung der
Stichprobe errreichen, müssten wir (ohne Endlichkeitskorrektur) eine Stichprobe
von n 
 1  1

2
2
2 2
0

1.96 2 3210.01891
3. 507 3 2
 1002. 5 erheben.
VI.. Schlussbemerkungen
Hiermit wurden nur einige kurze erste Schritte in die Stichprobentheorie getan, ein
Gebiet, das bei professioneller Anwendung durchaus technisch komplex wird. So
wurde die Behandlung von Klumpenstichproben und die von gemischten
Stichprobenplänen (Klumpen, aus denen Zufallsstichproben gezogen werden)
unterlassen. Klumpen sind Mengen von Objekten, die alle in die Untersuchung
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 257
gelangen (z.B. bei einer Untersuchung werden Schüler ausgewählt, indem auf der
Basis eine Liste aller Klassen eine Zufallstichprobe von Klassen gezogen wird. In
die Untersuchung kommen dann alle Schüler der gezogenen Klassen. Es handelt
sich hier nicht mehr um eine Zufallstichprobe).
Heikel ist auch die Behandlung von Ausreissern. Datenmaterial ist immer auf
Plausibilität hin zu untersuchen. Es ist zu überprüfen, ob ein Ausreisser durch
falsche Datenerhebung oder - eingabe entstand. Ist der Ausreisser echt, gibt es
verschiedene Verfahren, um damit umzugehen. So können Ausreisser bei der
Auswertung weggelassen werden, um z.B. den Mittelwert nicht allzusehr zu
verfälschen (gestutztes Mittel). Manchmal werden Ausreisser auch auf eine
äussere Grenze zurückgesetzt, oder es werden robuste Schätzer wie der Median
verwendet.
Ein besonderes Probem stellen Antwortausfälle dar. Bei der Befragung von
Haushalten rechnet das Bundesamt für Statistik mit Antwortausfällen von 20 bis
50%. Bei Umfragen bei Unternehmern rechnet man sogar mit 40 bis 80%
Ausfällen. Das besondere Problem von Antworteausfällen besteht darin, dass
Personen antworten oder nicht antworten, die vermutlich spezfische
Charakteristiken aufweisen. Dadurch werden die Ergebnisse systematisch
verfälscht. Macht man z.B. eine Umfrage über durchschnittliche
Kosmektikausgaben, und antworten mehrheitlich nur Mittelschicht- und
Oberschichtfrauen, so werden die Resultate eine systematische Verzerrung (
Bias) aufweisen. Im Beispiel könnte man z.B. die Stichprobe nachschichten und
die Schichtresultate dann entsprechend den Anteilen an der Gesamtpopulation
hochrechnen. Allerdings werden durch Hochrechnen die Varianz und damit die
Vertrauensintervalle vergrössert.
Ein spezielles Problem stellt sich zudem mit partiellen Antworteausfällen (Personen
beantworten nicht alle Fragen). Manchmal werden solche Antworteausfälle mit
Hilfe von Schätzungen kompensiert (Imputation). Angesichts dieser Probleme zu
jeweils zufriedenstellenden Resultaten zu gelangen verlangt einiges an Erfahrung
und an statistischem Detailwissen, das über den hier gelieferten Apparat hinaus
geht. Deshalb folgt eine Miniliteraturliste.
Literatur:
Cochran, W.G. (1977). Sampling Techniques (3 ed.), Wiley, New York (Klassiker,
gut und genügend detailliert).
Leiner, B. (1989), Stichprobentheorie: Grundlagen, Theorie und Technik,
Oldenbourg, München (mathematisch).
Grosbras, J.-M (1987), Méthodes statistiques des sondages, Economica, Paris.
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 258
Übungen
1) Im Wallis versucht ein Marktforschungsunternehmen die durchschnittlichen Ausgaben
der Touristen für typische Walliser Lebensmittel (Bindenfleisch, Roggenbrot, Käse, etc.)
zu ermitteln. Dabei wird unter den Touristen eine Zufallsstichprobe von 500 Personen
gezogen. Es ergeben sich folgende Ausgaben für solche Produkte pro Person (siehe
Excel-Datei Übung 1). Berechnen Sie die durchschnittlichen Ausgaben und ein
95%-Vertrauensintervall für den erhaltenen Wert. (Berechne Sie auch ein 98%Vertrauensintervall)
2) Im Auftrag der Tourismusbranche im Oberwallis soll die ”Studien- und Marktforschungs
GmbH Oberwallis” das Total der Ausgaben für Ferien pro erwachsene Person im
Oberwallis erheben (in Franken). Dabei werden 600 erwachsene OberwalliserInnen
befragt (siehe Excel-Datei Übung 2). Berechnen Sie das geschätzte Total der Ausgaben
für die erwachsene Oberwalliser Bevölkerung (N  45’000) und ein 95%Vertrauensintervall (98%-Vertrauensintervall).
3) Eine Studie soll den Anteil der Befürworter höherer Militärausgaben unter der
stimmberechtigten Bevölkerung der Schweiz ermitteln. Es wird eine Zufallsstichprobe
von 700 Personen gezogen. Es ergeben sich die folgenden Resultate (siehe Excel-Datei
Übung 3). Ermitteln Sie den Anteil und ein 95%-Vertrauenintervall. Wie gross muss n
sein, um eine Vertrauensintervallbreite von 0. 02 (entspricht 1% zu erhalten? (Bei
Meinungsumfragen ist Schichtung die Regel, wir verzichten aber im Beispiel darauf).
4) Im Oberwallis soll das Mobilitätsverhalten von Erwachsenen untersucht werden. Dazu
werden anteilsmässig insgesamt 500 Personen befragt, unter anderem zur Frage, wieviele
Kilometer sie ungefähr pro Jahr im Auto sitzen (Resultate siehe Excel-Datei Übung 4). N
 45’000. Der Anteil der Personen, die im Beruf Auto fahren, betrage 0.33 (bezüglich der
der Menge aller Autorfahrer). Versuchen Sie bei der Stichprobe eine Nachschichtung
vorzunehmen. Bestimmten Sie die Vertrauensintervall mit und ohne Nachschichtung.
5) Im Oberwallis soll das Mobilitätsverhalten von Erwachsenen untersucht werden. Dazu
werden 501 Personen befragt, unter anderem zur Frage, wieviele Kilometer sie ungefähr
pro Jahr im Auto sitzen (Resultate siehe Excel-Datei Übung 5). N  45’000. Der Anteil
der Personen, die im Beruf Auto fahren, betrage 13 (bezüglich der Menge aller
Autorfahrer). Nehmen Sie bei der Stichprobe eine Nachschichtung vor. Bestimmten Sie
die Vertrauensintervall mit und ohne Nachschichtung.
Lösungen
1) Ein erhebliches Problem wird sich bei der Ziehung einer wirklichen Zufallsstichprobe
ergeben. Man müsste dazu eigentlich eine Liste aller Touristen haben und dann daraus
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 259
mit Hilfe von Zufallszahlen eine Stichprobe ziehen. Insbesondere dürfte man nicht z.B.
in Brig im Sommer auf der Strasse einfach Touristen befragen.
Wir erhalten: Mittelwert: 49.348
Standardabweichung: 28.9928278
(ohne Endlichkeitskorrektur) y g  49. 348  1. 96 28.9928278
500
Für : 51. 889 46. 807, 51, 889
98%-Vertrauensintervall: y g  49. 348  2. 326341928 28.9928278
500
Für : 52. 364 46. 332, 52. 364
2) Arithmetisches Mittel der Stichprobe: y S  611. 1883333
Varianz der Stichprobe: 21836. 5196
Ohne Endlichkeitskorrektur: Die geschätzten Gesamtausgaben betragen somit:
Y S  45000  611. 1883333  2. 750 3  10 7
2
Wir erhalten als 95%-Intervallgrenzen: Y g  Y S  1. 96 45000 21836.5196

600
2. 750 3  10 7  5. 320 9  10 5
2
600
Mit Endlichkeitskorrektur: Y g  Y S  1. 96 1  45000
 45000 21836.5196

600
7
5
2. 750 3  10  5. 285 3  10
2
Für das 98%-Vertrauensintervall: Y g  Y S  2. 326341928 45000 21836.5196

600
7
5
2. 750 3  10  6. 315 4  10 (ohne Endlichkeitskorrektur). Mit Endlichkeitskorrektur:
2
600
 45000 21836.5196
 2. 750 3  10 7  6. 273 2  10 5
Y g  Y S  2. 326341928 1  45000
600
3) Wir erhalten 400 Befürworter und 300 Gegner (mit Excel: zählenwenn). Damit beträgt
der Anteil der Befürworter 400
 0. 571 43.
700
Für das Vertrauensintervall ohne Endlichkeitskorrektur:
0.571 4310.571 43
p g  p s  1. 96
 0. 571 43  3. 668 7  10 2
7001
Mit Endlichkeitskorrektur: p g  p s  1. 96 1 
0. 571 43  3. 668 4  10 2
700
4500000

0.571 4310.571 43
7001

4) Wir berechnen mit Excel die Kennzahlen Mittelwert und Varianz für die
Gesamtstichprobe und die Schichten:
Gesamtstichprobe: Mittelwert: 90888.902; Varianz: 81370215186
Fährt im Beruf:Mittelwert: 263203.9222; Varianz: 1.99747E11
Fährt nicht im Beruf: Mittelwert: 4472.660661; Varianz: 1074205.466
Wir erhalten ohne Schichtung das 95%-Vertrauensintervall:
y g  y S  1. 96 81370215186
 y S  24979.
501
Wir erhalten mit Schichtung das 95%-Vertrauensintervall: Die Varianz des Mittelwertes
ist:
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 260
L
VY    W 2h 
1
3
2
3
h1
2 1
167
2
1 
1
501167
1
nh
1
3
 1 
167
45000
1 
nh
Nh
  D 2h

1. 99747  10 11
501167
2 45000
3

1074205. 466
 1. 314 2  10 8
y g  y S  1. 96 1. 314 2  10 8  y S  22469.
Das Vertrauensintervall hat sich nicht wie erwartet massiv verringert, weil die
Mittelwerte der beiden Schichten stark auseinander liegen. Dies liegt an der sehr grossen
Varianz bei den Fahrern im Beruf. (es gibt Verfahren, um bei solchen Fällen die Varianz
der Mittelwerte zu vermindern, indem die bei der Schicht mit grosser Varianz eine
grössere Stichprobe zieht).
(Die Resultate erhalten wir in SPSS mit ”Analysieren, Berichte, Olap-Würfel”. Wir
können dann bei Statistik die gewünschten Kennzahlen bestimmen - auch den
Standardfehler des Mittelwertes. Durch Doppelklick auf die Tabelle erscheint ein
Pull-Down-Menue, in dem wir statt ”Insgesamt”, ”Privatfahrer” oder ”Fährt im Beruf”
anklicken können. Es erscheinen die jeweiligen Kennzahlen pro Schicht).
OLAP-Würfel
Fahrertyp: Insgesamt
N
Gefahrene Kilometer
500
Mittelwert
90888.90
Standardfe
hler des
Mittelwertes
12756.9758
Varianz
8.1E+10
Standardfe
hler des
Mittelwertes
34584.5162
Varianz
2.0E+11
Standardfe
hler des
Mittelwertes
56.7965
Varianz
1074205
OLAP-Würfel
Fahrertyp: Fährt im Beruf
N
Gefahrene Kilometer
167
Mittelwert
263203.9
OLAP-Würfel
Fahrertyp: Fährt nicht im Beruf
N
Gefahrene Kilometer
333
Mittelwert
4472.6607
5) Wir führen eine Nachschichtung durch: Personen, die beruflich im Auto unterwegs sind
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 261
und Personen, die nicht im Auto unterwegs sind. Wir erhalten für die beiden Gruppen die
für Privatfahrer und 122
für ”Fährt im Beruf” (erhalten wir in
folgenden Anteile: 378
500
500
SPSS mit Analysieren, deskriptive Statistiken, Häufigkeiten). Wir erhalten die folgenden
Varianzen und Mittelwerte.
OLAP-Würfel
OLAP-Würfel
Fahrertyp: Privatfahrer
Kilometer
Mittelwert
4505.0344
Fahrertyp: Fährt im Beruf
Varianz
1066213
Kilometer
Mittelwert
46784.69
Varianz
430414.9
OLAP-Würfel
Fahrertyp: Insgesamt
Kilometer
Mittelwert
14821.27
Varianz
3.3E+08
Wir vergleichen die Vertrauensintervalle mit und ohne Schichtung:
Mit Schichtung:
378
1
122
1
  378
 1066213  0. 33 2  1  0.3345000
  122
 430414. 9
0. 67 2  1  0.6745000
1631. 4
y g  y S  1. 96 1631. 4  y S  79. 166
8
 y S  1592. 3
Ohne Schichtung: y g  y S  1. 96 3.310
500
Da die Mittelwerte der Schichten sehr weit auseinander liegen, ergibt sich ein markanter
Unterschied in den Vertrauensintervallen. (Die Daten zum Beispiel 4 wurden abgeändert.
Somit sind die Unterschiede in den Resultaten der beiden Aufgaben nicht den Methoden
- Schichtung oder Nachschichtung - zuzuschreiben).
___________________________________________________________________
Stichprobentheorie.tex 2. HSW Siders P.R.
Seite 262
Bivariate schliessende Statistik
In der bivariaten schliessenden Statistik geht es um den Zusammenhang von zwei
Variablen. Rauchen Männer mehr als Frauen (Variable ”Geschlecht” und Variable
”gerauchte Zigaretten pro Tag”)? Kaufen Junge mehr Süssigkeiten (Variable
”Alter”, Variable ”Süssigkeiten in Franken”). Gibt es einen Zusammenhang
zwischen Einkommen und Ausgaben für Schmuck?
Gewöhnlich wird eine der Variablen als unabhängige (beeinflussende) Variable
betrachtet, während die andere als die zu erklärende Variable festgelegt wird.
Dabei ergibt sich das Problem, dass Variablen statistisch zusammenhängen
können, ohne dass ein ”wirklicher” und ”kausaler” Zusammenhang besteht. Ein
Beispiel kann dies klar machen: der Geburtenrückgang in Westeuropa im 20.
Jahrhundert erfolgte im Gleichschritt mit dem Rückgang der Störche. Es scheint
aber unvernünftig zu sein, den Rückgang der Störche als ”Ursache” für den
Rückgang der Geburten zu betrachten, oder den Rückgang der Geburten als
”Ursache” für den Rückgang der Störche. Es gibt im vorliegenden Fall eine dritte
”Ursache” - die Industrialierung, die auf beide Variablen einwirkt. Allerdings ist der
Begriff der Ursache nicht präzis zu fassen. A ist Ursache von B, wenn wir A auf
dem Hintergrund eines bestimmten historischen Wissenstandes zur Erklärung von
B heranziehen. Das wissenschaftliche Fortschreiten kann jedoch dazu führen, dass
solches Erklären als Scheinerklärung erkannt wird und man neue ”Ursachen” für B
anführt (Wir wissen genug über die Fortpflanzung, so dass wir nicht in Versuchung
geraten, den Geburtenrückgang durch den Storchenrückgang zu erklären. Es gibt
aber genügend Wissensgebiete, wo wir wenig wissen, und wo wir auf Grund
statistischer Zusammenhänge Gefahr laufen, Kausalität zu postulieren, wo diese
vielleicht nicht vorliegt).
Je nach der Skalierung der Variablen gibt es verschiedene Methoden, um die
Unabhängigkeit oder die Abhängigkeit der Ausprägungen zweier Variablen zu
testen.
- Untersuchen wir den Einfluss einer nominalskalierten Variable mit n
Ausprägungen auf eine nominalskalierte Variablen mit m Ausprägungen,
so wird der  2 Test verwendet (z.B. Frauen, Männer - Raucher,
Nichtraucher)
- Untersuchen wir den Einfluss einer nominalskalierten Variable mit mehr
als zwei Ausprägungen auf eine metrisch skalierte Variable, so verwenden
wir oft die Varianzanalyse (z.B. drei Sorten Weizen werden auf ihre
Erträge hin untersucht).
- Untersuchen wir den Einfluss einer metrisch skalierten Variable auf eine
metrisch skalierte Variable, verwenden wir die Regressionsanalyse
(Einkommen in Franken und Ausgaben für Schmuck in Franken).
Damit haben wir noch nicht alle möglichen Kombinationen angeführt: möglich sind
noch:
___________________________________________________________________
Bivariate Teststatistik.tex
2. HSW Siders P.R.
Seite 263
ordinalskaliert  ordinalskaliert
ordinalskaliert  metrisch skaliert
ordinalskaiert  nominalskaliert
nomalskaliert  ordinalskaliert
metrisch skaliert  ordinalskaliert
metrisch skaliert  nominalskaliert
In der zweiten Hälfte des 20. Jahrhunderts wurden bivariate Methoden entwickelt,
die solche Probleme zu lösen vermögen, auf die wir jedoch nicht eingehen können
(weiterführende Literatur: Agresti, Alan, Categorical Data Analysis, New York, John
Wiley, 1990; das Buch führt auch in die multivariate Statistik nominal- und
ordinalskalierter Daten ein).
___________________________________________________________________
Bivariate Teststatistik.tex
2. HSW Siders P.R.
Seite 264
 2 Test
I. Testen auf Unabhängigkeit in Kreuztabellen
Ziel: Es soll überprüft werden, ob die Verteilung von Objekten in einer Kreuztabelle
zufällig ist oder ob ein ”Zusammenhang” zwischen verschiedenen Variablen
besteht.
Voraussetzungen: Die erwartete Häufigkeit pro Feld sollte nicht bei mehr als 20%
der Felder kleiner sein als 5. (nominalskalierte Daten). Die Zufallsvariablen sind
identisch verteilt und unabhängig.
Da nur ein nominales Skalenniveau vorausgesetzt wird, wird der  2 Test (auch
 2 Unabhängigkeitstest genannt) in den Sozial- und Wirtschaftswissenschaften
häufig angewendet. Da auch höher skalierte Daten als nominalskalierte aufgefasst
werden können (bei Inkaufnahme von Informaitonsverlusten), sind  2 Test auch
auf Daten mit höheren Skalenniveaus anwendbar.
Beispiel 1: Wir nehmen an, man hätte eine Stichprobe von 100 Personen
gezogen, darunter 46 Männer und 54 Frauen. Davon rauchen 12 Männer und 10
Frauen. Kann der Unterschied in der Stichprobe zwischen Frauen und Männer
durch Zufall erklärt werden oder weisen die Frauen und Männer insgesamt
unterschiedliches Raucherverhalten auf?
Geschlecht * Raucherverhalten Kreuztabelle
Anzahl
Geschlecht
Gesamt
Männer
Frauen
Raucherverhalten
Raucher
Nichtraucher
12
34
11
43
23
77
Gesamt
46
54
100
H 0 : Das Rauchverhalten von Frauen und Männern unterscheidet sich nicht.
H A : Das Rauchverhalten von Männern und Frauen unterscheidet sich (Wie wir in
Kürze argumentieren werden, beinhaltet dies einen rechtsseitigen Test,   0. 05.
Wir können folgende erwartete Häufigkeiten für die zufällige Verteilung pro Zelle
errechnen. Bei jeweils anteilsmässiger Verteilung der Objekte sollte der Anteil der
Raucher unter den Männern dem Anteil der Männer an der Stichprobe
entsprechen. Da 46/100 Männer sind, sollten sie unter den Rauchern (23) genau
46
diesen Anteil ausmachen. Dies ergibt für die rauchenden Männer: 100
 23  10. 58
54
Für die rauchenden Frauen ergibt sich: 100
 23  12. 42
46
Für die nichtrauchenden Männer: 100
 77  35. 42
54
Für die nichtrauchenden Frauen: 100  77  41. 58
Allgemein für die erwartete, absolute Häufigkeit der Zelle i, j: (i Zeile und j Spalte)
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 265
E ij 
sisj
st
Mit: s t  Summe total; s i  Randsumme der Zeile i; s j  Randsumme der Spalte j.
Wir erhalten somit die folgende Tabelle der erwarteteten Häufigkeiten:
Raucher
Nichraucher
Summen
10.58
35.42
46
12.42
41.58
54
23
77
100
Männer
Frauen
Summen
Je mehr die Verteilung der Daten von den erwarteten Häufigkeiten abweichen,
desto weniger sind sie mit der Nullhypothese einer anteilsmässigen Verteilung der
Objekte auf die Felder verträglich.
Wir führen noch folgendes Symbol ein: H i,j für die absolute, empirische Häufigkeit
der Zelle i, j.
Ohne Beweis halten wir für eine m  n-Tabelle fest:
m
n

i
H i,j E i,j
j
2
2

  m1n1
E i,j
H i,j : empirische absolute Häufigkeiten
E i,j : erwartete absolute Häufigkeiten
m : Anzahl der Zeilen
n : Anzahl der Spalten
Dies gilt näherungsweise und für genügend grosse Stichprobengrössen. Die
Anzahl der Freiheitsgrade der  2 Verteilung beträgt: m  1  n  1 (Anzahl der
Zeilen weniger 1 multipliziert mit der Anzahl der Spalten weniger 1; 1 wird jeweils
abgezählt, weil die letzte Zelle einer Zeile oder einer Spalte festgelegt ist, wenn die
Randsummen und die übrigen Zellen feststehen. Die unabhängigen Zellen werden
entsprechend durch die Matrix gebildet, bei der eine Zeile und eine Spalte
gestrichen werden. Es verbleiben m  1  n  1 unabhängige Zellen).
m
n
Im obigen Beispiel erhalten wir:  
1210.58 2
1112.42 2

10.58
12.42
2
 2121
0. 45836 
3435.42 2
i
H i,j E i,j
E i,j
j
4341.58 2
41.58
2

 35.42 
 0. 45836
1  0. 498391429  p  Wert : 0. 498391429  0. 05
Die Unterschiede zwischen Frauen und Männern bezüglich Rauchverhalten sind
nicht signifikant.
Bei einem  2 Test vergleichen wir die Häufigkeiten zweier Tabellen. Je mehr sie
sich die jeweiligen absoluten Häufigkeiten pro Zelle unterscheiden, desto grösser
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 266
wird der Testwert. Wir lehnen die Nullhypothese ab, wenn diese Unterschiede ein
gewisses Mass überschreiten. Entsprechend testen wir jeweils rechtsseitig. Liegt
linksseitig ein signifikantes Ergebnis vor, bedeutet dies eine Überanpassung der
empirischen Daten an die erwarteten Häufigkeiten. Es könnte dann z.B. eine
Fälschung der Daten vorliegen.
Mit Excel: Es müssen die erwarteten und die faktischen Häufigkeiten in je einer
Matrix dargestellt werden. Dann wird ”Funktionen”, ”Statistik”, ”CHITEST”
aufgerufen und die Matrizen in die entsprechenden Felder eingegeben. ok. Fürs
obige Beispiel erhalten wir den p-Wert: 0. 498391516
Mit SPSS: Die Daten müssen in zwei Spalten eingegeben werden (fürs Beispiel:
eine Spalte fürs Geschlecht, wo wir z.B. 46 mal 1 eingeben für die Männer und 54
mal 2 für die Frauen. die zweite Spalte 12 mal 1 für die rauchenden Männer, den
Rest der Männer füllen wir mit 2 auf (für Nichtraucher). Dann schreiben wir 11 mal
1 für die rauchenden Frauen, den Rest der Frauen füllen wir mit 2 auf (für
Nichtraucher). Den Test führen wir mit Hilfe der folgenden Befehle durch:
”Analysieren”, ”Deskriptive Statistiken”, ”Kreuztabellen”, ”Statistik”,
”Chiquadrattest”.
Wir erhalten:
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Kontinuitätskorrektura
Likelihood-Quotient
Exakter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
b
.458
1
.498
.192
.457
1
1
.661
.499
Exakte
Signifikanz
(2-seitig)
.634
.454
1
Exakte
Signifikanz
(1-seitig)
.330
.501
100
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
ist 10.58.
Wir erhalten die Werte für den eingeführten Test unter ”Chiquadrat nach Pearson”.
”Zweiseitig” bedeutet hier nicht, dass der  2 Test zweiseitig druchgeführt wird,
sondern dass die Richtung des Unterschiedes zwischen Männern und Frauen
gleich behandelt wird - ob die Frauen mehr rauchen als die Männer oder
umgekehrt, der Test kann das selbe Resultat liefern. Es folgt eine kurze
Erläuterung der übrigen SPSS-Ausgabe:
Die Kontinuitätskorrektor beinhaltet eine Berücksichtigung der Tatsache, dass die
zu verwendende Verteilung eigentlich diskret wäre, wir aber eine stetige Verteilung
im Test brauchen. Die Korrektur erfolgt durch die Verwendung der folgenden
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 267
m
n
i
j
Formel:  
H i,j E i,j 0.5
2
E i,j
2
  m1n1
|1210.58|0.5 2
|1112.42|0.5 2
|3435.42|0.5 2
|4341.58|0.5 2
Am Beispiel:



 0. 192 4 (in
10.58
12.42
35.42
41.58
2
SPSS bei ”Kontinuitätskorrektur” angegeben).  2121
0. 1925  0. 660843984.
Der ”Likelihood-Quotient” beinhaltet einen alternativen Chi-Quadrat-Test.
m
n
Berechnet wird der Ausdruck 2   H ij ln
2 12 ln
10.58
12
  11 ln
12.42
11
i1 j1
35.42
34
 34 ln
E ij
H ij
 43 ln
2
  m1n1
. Fürs Beispiel:
41.58
43
 0. 457 16
Im Beispiel erhalten wir somit einen p-Wert, der kaum von ”Chi-Quadrat nach
Person” abweicht. Wir behandeln diesen Test nicht.
m
n
i
j
Im Vierfelderfall ist der Testwert  
H i,j E i,j
E i,j
2
hypergeometrisch verteilt (auf einen
Beweis verzichten wir). Der exakte Test nach Fischer nutzt für den Vierfelderfall
diese exakte Verteilung. Wir behandeln diesen Test nicht.
Zusammenhang ”linear mit linear” ( Mantel-Haenszel-Test): Das Quadrat des
Pearsonschen Korrelationskoeffizienten r wird mit der Anzahl der Fälle (minus 1)
n
1
n1
x i x y i y 
i1
2
mulitpliziert: r 2 n  1   m1n1
, wobei r 
und  x die
 x  y
Standardabweichung von x ist und  y die Standardabweichung von y.
Entsprechend ist der Test für nominale Daten bedeutungslos. Wir behandeln
diesen Test nicht. Der Korrelationskoeffizient wird später behandelt. (x 
x 1 , . . . x n , y  y 1 , . . . y n  sind Vektoren von Ausprägungen von Daten).
Wollen wir wissen, wo die massgeblichen Differenzen zwischen erwarteteten und
empirischen Häufigkeiten liegen, können wir mit SPSS wie folgt vorgehen:
Analysieren, deskriptive Statistik, Kreuztabellen, Zellen und Häufigkeiten
”beobachtete”, ”erwartete” sowie Residuen ”standardisiert” anklicken. Wir erhalten
im Beispiel:
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 268
Raucherverhalten * Geschlecht Kreuztabelle
Raucherverhalten
Raucher
Anzahl
Erwartete Anzahl
Standardisierte Residuen
Anzahl
Erwartete Anzahl
Standardisierte Residuen
Anzahl
Erwartete Anzahl
Nichtraucher
Gesamt
Geschlecht
Männer
Frauen
12
11
10.6
12.4
.4
-.4
34
43
35.4
41.6
-.2
.2
46
54
46.0
54.0
H i,j E i,j
Gesamt
23
23.0
77
77.0
100
100.0
2
Unter Standardisierte Residuen werden die Werte
der i  j Zelle
E i,j
angegeben. Wir sehen, welche Zellen am meisten und welche am wenigsten zum
Testwert beitragen (Bei Nicht-Standardisierte Residuen werden die Differenzen
zwischen den erwarteten und den empirischen Häufigkeiten angegeben).
m
n
i
j
Eine Teilrechtfertigung für die Formel  
H i,j E i,j
E i,j
2
2

erhalten wir durch
  m1n1
die folgende Überlegung: Gibt es nur 2 Zellen, so erhalten wir als Testwert:
H 1 E 1  2
E1

H 2 E 2  2
E2
Dabei ist E 1  np 1 , wenn p 1 die Wahrscheinlichkeit dafür ist, dass ein Objekt in die
erste Zelle fällt. Da die Objekte in die erste oder die zweite Zelle fallen, gilt dann für
E 2 : E 2  n  E 1  n  np 1  n1  p 1 .
Für H 2 gilt ähnlich: H 2  n  H 1
Wir erhalten:
H 1 np 1  2
np 1

nH 1 n1p 1  2
n1p 1 
2
2
1 1p 1 H 1 np 1  p 1 nH 1 n1p 1 
n
p 1 1p 1 


1
n

H 1 np 1  2
H 1 np 1
p1

nH 1 n1p 1  2
1p 1

2
np 1 1p 1 
Da gilt:
1  p 1 H 1  np 1  2
1  p 1 H 1  np 1  2
1  p 1 H 1  np 1  2
1  p 1 H 1  np 1  2
H 1  np 1  2
Der Ausdruck
 p 1 n  H 1  n1  p 1  2 
 p 1 n  H 1  n  np 1  2 
 p 1 n  H 1  n  np 1  2 
 p 1 H 1  np 1  2  H 1  np 1  2 1  p 1  p 1  
H 1 np 1
np 1 1p 1 
entspricht dem Ausdruck einer z-standardisierten
binomialverteilten Zufallsvariable (siehe Kapitel über die Verteilung des
Mittelwertes). Entsprechend ist der Ausdruck in der Klammer näherungsweise
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 269
standardnormalverteilt (für genügend grosse n). Entsprechend ist dann der
Ausdruck
2
H 1 np 1
np 1 1p 1 
näherungsweise  2 verteilt mit einem Freiheitsgrad.
Beispiel 2: In einer Firma wird mit verschiedenen Arbeitsformen experimentiert
(keine Gruppenarbeit, mittlere Gruppenarbeit und vorwiegend Arbeit in Gruppen).
Die Arbeitnehmer der verschiedenen Arbeitsformen werden befragt, wie sich ihre
Arbeitssituation verändert habe. Dabei wurden folgende Daten erhoben.
Realisierungsniveau von Gruppenarbeit * Veränderung der Arbeitssituation Kreuztabelle
Anzahl
Realisierungsniveau
von Gruppenarbeit
Veränderung der Arbeitssituation
verbessert
unverändert
verschlechtert
101
48
17
41
43
8
20
36
15
162
127
40
hoch
mittler
gering
Gesamt
Gesamt
166
92
71
329
H 0 : Die Arbeitssituation hat sich nicht verändert.
H A : Die Arbeitssituation hat sich verändert ( rechtsseitiger Test,   0. 05.
Wir erhalten die folgende Tabelle für die erwarteten Häufigkeiten:
erwartete Häufigkeiten:
Veränderung der Arbeitssituation
verbessert
unverändert
verschlechtert
hoch
81.7386018
64.0790274
20.1823708
mittler
45.3009119
35.5136778
11.1854103
gering
34.9604863
27.4072948
8.63221884
Summen
162
127
40
Realisierungsniveau von
Gruppenarbeit
m
n
Wir berechnen:  
i
j
H i,j E i,j
2
E i,j

10181.73860182 2
81.73860182

4864.07902736 2
64.07902736
1720.18237082 2
20.18237082

4145.30091185 2
45.30091185

4335.51367781 2
35.51367781

811.18541033 2
11.18541033
2034.96048632 2
34.96048632

3627.40729483 2
27.40729483

158.632218845 2
8.632218845
 25. 762
Summen
166
92
71
329


 24 25. 762  1  3. 53406E  05; der p-Wert ist somit: 3. 53406E  05  0. 05. Die
Abweichung der faktischen Häufigkeiten von den erwarteten Häufigkeiten ist
hochsignifikant.
Mit Excel erhalten wir: 3.53369E-05
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 270
Mit SPSS:
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
25.762
Asymptotisch
e Signifikanz
(2-seitig)
df
a
4
.000
25.952
4
.000
19.130
1
.000
329
a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 8.63.
 2 Tests können ebenfalls verwendet werden, um die Häufigkeiten zweier
Tabellen zu vergleichen, auch wenn die erwarteten Häufigkeiten nicht aus der
empirischen Kreuztabelle berechnet werden. Wir nehmen an, in der Schweiz
gilt:51% sind Frauen, 49% Männer, 24% der Frauchen rauchen, 28% der Männer
rauchen. Wir wollen überprüfen, ob im Oberwallis eine ähnliche Verteilung auf die
Raucher vorliegt und ziehen eine Zufallsstichprobe von 100 Personen. Dabei
würden wir folgendes Resultat erhalten:
Raucher Nicht Raucher Summen
Männer
28
20
48
Frauen
6
46
52
66
100
Summen 34
Wir müssen nun eine entsprechende Tabelle mit absoluten Häufigkeiten für die
Schweiz berechnen (diese Tabelle entspricht der Tabelle mit den erwarteten
Häufigkeiten):
Raucher
Nicht Raucher
Summen
Männer
0. 28  49  13. 72 0. 72  49  35. 28 49
Frauen
0. 24  51  12. 24 0. 76  51  38. 76 51
Summen 25. 96
Wir erhalten den Testwert:
100
74. 04
2813.72 2
13.72

2035.28 2
35.28

612.24 2
12.24

4638.76 2
38.76
 26. 014
 21 26. 014  1  3. 3895E  07. Der p-Wert ist somit: 3. 3895E  07. Die Häufigkeiten
unterscheiden sich signifikant.
Häufige Fehler bei  2 Tests:
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 271
 Es werden relative statt absolute Häufigkeiten im Test verwendet. z.B. 60% der
Männer rauchen nicht, 40% rauchen, 70% der Frauen rauchen nicht, 30% rauchen.
Wir erhalten die unsinnige Kreuztabelle:
Nichtraucher
Männer
Frauen
Summen
Raucher
60
70
130
Summen
40
100
30
100
70
200
Bei der Berechnung der erwarteten Häufigkeiten mit Hilfe dieser Tabelle würden
wir den Test falsch anwenden. Beim Vorliegen einer Tabelle mit relativen
Häufigkeiten kann man bei Kenntnis der Grösse der Stichprobe und der
entsprechenden Anteile die absoluten Häufigkeiten zurückberechnen. Auf diese
Daten ist dann der Test anwendbar. Im Beispiel. Wir nehmen an, die Stichprobe
betrage 150 Personen und der Anteil der Frauen betrage 48%. Wir erhalten die
folgende Kreuztabelle (mit entsprechendem Runden):
150  0. 48  72
72  0. 7  50. 4  50
72  0. 3  21. 6  22
150  0. 52  78
78  0. 60  46. 8  47
78  0. 4  31. 2  31
Nichtraucher
Männer
Frauen
Summen
Raucher
47
50
97
Summen
31
22
53
78
72
150
Auf diese Tabelle können wir nun den Test ausführen (machen Sie das zur Übung
von Hand, mit Excel und mit SPSS).
 Die Daten werden in der Kreuztabelle falsch aufgeschlüsselt. Beispiel: Wenn die
Ausprägung y 1 der Variable y in 2 von 10 Fällen eintritt und die Ausprägung y 2 in 5
von 18 Fällen, so wird statt der richtigen Kreuztabelle:
Randsummen
Randsummen
2
5
7
8
13
21
10
18
28
die falsche Kreuztabelle:
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 272
Randsummen
2
5
7
Randsummen
10
18
18 X
12
23
erstellt. Letztere Tabelle ist offenbar unsinnig: die Summen der Randsummen
ergeben unterschiedliche Resultate (7  18  25  35  12  23.
 Bei  2 Tests sollten nicht mehr als 20% der Zellen eine erwartete Häufigkeit
unter 5 haben (es handelt sich um eine recht konservative Regel, die laut manchen
Autoren besonders bei grossen Kreuztabellen nicht beachtet werden muss).
Manchmal wird diese Regel fälschlicher Weise auf die empirischen (statt die
erwarteten) Werte der Tabelle angewendet. Sind die erwarteten Werte zu klein, so
können die entsprechenden Spalten oder Zeilen mit benachbarten Spalten oder
Zeilen zu neuen Kategorien zusammengefasst werden. Man darf dann nicht
vergessen, die Freiheitsgrade neu zu zählen.
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 273
Übungen
1) Erstellen Sie die Tabelle der erwarteten Häufigkeiten für die folgenden
Kreuztabellen:
20 30
10 80
10 50 30 8
11 22 40 20
14 7
8
4
20 60
8
40
2) Ein Marktforschungsinstitut überprüft mit Hilfe einer Umfrage die Hypothese, ob
Frauen tatsächlich weniger im Internet surfen. Es wird eine Zufallsstichprobe von
80 Personen gezogen. Dabei ergeben sich die folgenden Daten:
Internetnutzer Nicht Internetnutzer Summen
Männer
12
26
38
Frauen
5
37
42
63
80
Summen 17
Testen Sie von Hand, mit Excel und SPSS.
3) Eine Marktforschungsfirma macht im Auftrag einer KMU einen Umfrage bei
Konsumenten und kommt zu folgenden Resultaten: siehe Daten:
chiquadrattest/Übung3.sav. Lassen sich Gruppen finden, die sich bezüglich ihrer
Einstellung zum Produkt signifikant von anderen unterscheiden.
4) Die Einstellung bezüglich einer politischen Fragestellung werden untersucht.
Dabei ergibt sich folgendes Bild: (Daten: chiquadrat/Übung 4.sav):
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 274
Einstellung * Geschlecht und Alter Kreuztabelle
Anzahl
Einstellung
Frauen < 35
50
30
20
10
5
115
Dafür
eher dafür
weiss nicht
eher dagegen
dagegen
Gesamt
Geschlecht und Alter
Frauen >=35 Männer < 35
40
60
30
40
30
10
20
5
10
5
130
120
Männer >=35
50
40
5
10
10
115
Gesamt
200
140
65
45
30
480
Unterscheiden sich die Einstellungen der Gruppen?
Lösungen:
Wir berechnen die Spalten und Zeilensummen (Randsummen):
Spalte 1 Spalte 2 Summen
Zeile 1
20
30
50
Zeile 2
10
80
90
110
140
Summen 30
Nun berechnen wir E ij 
E 1,1  5030
 10. 714
140
9030
E 2,1  140  19. 286
E 1,2  50110
 39. 286
140
90110
E 2,2  140  70. 714
s j s i
st
Wir erhalten also:
Spalte 1 Spalte 2 Summen
Zeile 1
10.714
39.286
50
Zeile 2
19.286
70.714
90
110
140
Summen 30
Wir können die Aufgabe auch mit Excel lösen:
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 275
empirische Häufigkeiten
Spalte 1
Spalte 2
20
10
30
Zeile 1
Zeile 2
Summen
Summen
30
80
110
50
90
140
erwartete Häufigkeiten
Spalte 1
Spalte 2
Summen
10.7142857
39.2857143
50
19.2857143
70.7142857
90
30
110
140
Zeile 1
Zeile 2
Summen
Die Randsummen der beiden Tabellen müssen übereinstimmen!
Bei grösseren Tabellen erfolgt eine Lösung mit Excel schneller:
Spalte 1
Zeile 1
Zeile 2
Zeile 3
Zeile 4
Summen
Zeile 1
Zeile 2
Zeile 3
Zeile 4
Summen
Spalte 2
10
11
14
4
39
Spalte 3
Spalte 4
50
22
7
8
87
30
40
8
20
98
Summen
8
20
40
60
128
98
93
69
92
352
Spalte 1
Spalte 2
Spalte 3
Spalte 4
Summen
10.8579545
24.2215909
27.2840909
35.6363636
98
10.3039773
22.9857955
25.8920455
33.8181818
93
7.64488636
17.0539773
19.2102273
25.0909091
69
10.1931818
22.7386364
25.6136364
33.4545455
92
39
87
98
128
352
2) H 0 : Frauen und Männer unterscheiden sich nicht.
H A : Das Verhalten der Frauen unterscheidet sich von dem der Männer. (
einseitiger Test;   0. 05
Wir berechnen die erwarteten Zellenhäufigkeiten:
Internetnutzer Nicht Internetnutzer Summen
Männer
Frauen
3817
80
4217
80
Summen 17
 8. 075
 8. 925
3863
80
4263
80
 29. 925
38
 33. 075
42
63
Wir erhalten als Testwert:
128.075 2
2629.925 2
58.925 2



8.075
29.925
8.925
80
3733.075 2
33.075
 4. 6145
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 276
Wir berechnen  21 4. 6145  1  0. 03170274. Der p-Wert ist somit
0. 03170274  0. 05. Der Unterschied ist auf dem festgelegten Niveau signifikant.
Mit Excel erhalten wir: 0. 031702293
Mit SPSS: Wir müssen die Kreuztabelle in Datenform darstellen. Diese
Vorbereitung machen wir am besten mit Hilfe von Excel. Für die entsprechende
Darstellung in SPSS siehe ”chiquadrattests/Übung2.sav”.
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Kontinuitätskorrektura
Likelihood-Quotient
Exakter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
4.615
b
3.514
4.700
1
.032
1
1
.061
.030
Exakte
Signifikanz
(2-seitig)
.054
4.557
1
Exakte
Signifikanz
(1-seitig)
.030
.033
80
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
ist 8.07.
3) Untersuchungen sollten jeweils durch Hypothesen, die vor der Untersuchung
schriftlich niedergelegt werden, begleitet werden. Testen wir bei 14 Variablen jede
gegen jede, erhalten wir über Hundert Tests (bei Fragebogen ist es ein leichtes,
mehr als 14 Variablen zu gewinnen). Dabei erhalten wir mit einer hohen
Wahrscheinlichkeit ein paar signifikante Ergebnisse (Fehler erster Ordnung! Bei
einem Signifikanzniveau von 5% erhalten wir durchschnittlich 5 signifikante
Ergebnisse auf 100, bei einem Signifikanzniveau von 1% durchschnittlich ein
signifikantes Ergebnis auf 100). Es ist deshalb sinnlos, solche Ergebnisse, die man
ohne vorgängige Hypothese erhalten hat, verwenden zu wollen: man wird mit
hoher Wahrscheinlichkeit Opfer des Fehlers erster Ordnung. Entdeckt man derart
signifikante Ergebnisse, können diese jedoch für eine neue Erhebung als
Hypothesen dienen. Die erste Erhebung dient dann der sogannt ”explorativen”
Phase, während die zweite Erhebung die Ergebnisse der explorativen Phase
testet. Im Beispiel sind die erhobenen Daten somit nur als Hypothesenlieferant für
eine spätere Testphase zu verwenden.
Für die verschiedenen Tabellen ist die jeweilige Nullhypothese: Die Einstellung
zum Produkt ist von der Variable unabhängig. Alternativhypothese: Die Einstellung
zum Produkt ist von der Variable abhängig. Wir erhalten:
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 277
Einstellung zum Produkt * Geschlecht Kreuztabelle
Anzahl
Einstellung zum
Produkt
positive Einstellung
negative Einstellung
Gesamt
Geschlecht
Männer
Frauen
10
8
33
29
43
37
Gesamt
18
62
80
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Kontinuitätskorrektura
Likelihood-Quotient
Exakter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
.030
b
.000
.031
1
.861
1
1
1.000
.861
Exakte
Signifikanz
(2-seitig)
Exakte
Signifikanz
(1-seitig)
1.000
.030
1
.539
.862
80
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
ist 8.32.
Einstellung zum Produkt * Altersgruppe Kreuztabelle
Anzahl
Altersgruppe
-20
Einstellung
zum Produkt
Gesamt
positive Einstellung
negative Einstellung
2
9
11
21-35
4
12
16
36-50
4
15
19
51-65
6
9
15
662
17
19
Gesamt
18
62
80
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 278
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
4.394
a
4
.355
4.346
4
.361
.072
1
.788
80
a. 5 Zellen (50.0%) haben eine erwartete Häufigkeit kleiner 5.
Die minimale erwartete Häufigkeit ist 2.48.
Die Hälfte der Zellen weisen einen Erwartungswert kleiner als 5 auf, eine sogar nur
einen solchen von 2.48. Entsprechend dürfte der Test so nicht angewandt werden.
Das Ergebnis ist zudem nicht signifikant, obwohl vermutlich die Altersgruppe 66besonders negativ eingestellt ist (Überdeckungseffekt des Testes von vermutlich
signifikanten Zusammenhängen durch die anderen Ausprägungen). Wir können
der Sache auf den Grund gehen, indem wir die übrigen Altersgruppen
zusammenfassen und gegen die Altersgruppe 66- testen. Dazu schaffen wir eine
neue Variable (mit Transformieren, Umkodieren, In andere Variable, alte und neue
Werte, ”alter Wert 5, neuer Wert 5”, ”andere Werte, neuer Wert 1”. weiter, für
Ausgabenvariable Name und Label eingeben, o.k). Wir erhalten:
Einstellung zum Produkt * Alter 65- gegen übrige Kreuztabelle
Anzahl
Einstellung zum
Produkt
Gesamt
positive Einstellung
negative Einstellung
Alter 65- gegen übrige
1.00
5.00
16
2
45
17
61
19
Gesamt
18
62
80
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 279
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Kontinuitätskorrektura
Likelihood-Quotient
Exakter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
2.049
b
1.247
2.315
1
.152
1
1
.264
.128
Exakte
Signifikanz
(2-seitig)
.214
2.023
1
Exakte
Signifikanz
(1-seitig)
.130
.155
80
a. Wird nur für eine 2x2-Tabelle berechnet
b. 1 Zellen (25.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit
ist 4.28.
Entgegen unserer Vermutung liegt kein signifikanter Zusammenhang vor. Der
p-Wert ist jedoch kleiner geworden. Nur mehr eine Zelle (25%) hat eine kleinere
erwartete Häufigkeit als 5. Allerdings liegt der Wert nicht stark unter 5. Wir würden
in der Praxis den Test trotzdem anwenden.
Einstellung zum Produkt * Wohnort Kreuztabelle
Anzahl
Wohnort
Land
Einstellung zum
Produkt
Gesamt
positive Einstellung
negative Einstellung
Stadt
4
19
23
8
23
31
Agglomer
ation
6
20
26
Gesamt
18
62
80
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 280
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
.544
a
2
.762
.558
2
.756
.203
1
.652
80
a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 5.18.
Es ergeben sich keine signifikante Zusammenhänge zwischen der Einstellung zum
Produkt und den Variablen Alter, Wohnort und Geschlecht (und wenn wir welche
gefunden hätten, würde dies ohne vergängige, entsprechende Hypothesen noch
wenig bedeuten).
4)
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
41.066
Asymptotisch
e Signifikanz
(2-seitig)
df
a
12
.000
42.847
12
.000
2.053
1
.152
480
a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 7.19.
Die Verteilung der Daten weicht von einer anteilsmässigen Verteilung signifikant
ab. Um spezifische Effekte herauszufiltrieren, müssten wir nun z.B. die Männer
gegen die Frauen, sowie die alten gegen die jungen testen. Auch hier handelt es
sich, ohne vorgängige Formulierung von Hypothesen, um ein exploratives
Vorgehen. Dazu erzeugen wir mit SPSS die passenden Variablen. Wir erhalten:
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 281
Einstellung * Geschlecht Kreuztabelle
Anzahl
Einstellung
Dafür
eher dafür
weiss nicht
eher dagegen
dagegen
Gesamt
Geschlecht
Frauen
Männer
90
110
60
80
50
15
30
15
15
15
245
235
Gesamt
200
140
65
45
30
480
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
28.507
Asymptotisch
e Signifikanz
(2-seitig)
df
a
4
.000
29.642
4
.000
9.925
1
.002
480
a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 14.69.
Die Einstellungen von Frauen unterscheiden sich vermutlich signifikant von der von
Männern.
Einstellung * Alter Kreuztabelle
Anzahl
Einstellung
Gesamt
Dafür
eher dafür
weiss nicht
eher dagegen
dagegen
Alter
1.00
2.00
110
90
70
70
30
35
15
30
10
20
235
245
Gesamt
200
140
65
45
30
480
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 282
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Likelihood-Quotient
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
10.514
Asymptotisch
e Signifikanz
(2-seitig)
df
a
4
.033
10.675
4
.030
9.925
1
.002
480
a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 14.69.
Auch der Alterseffekt ist vermultich signifikant.
Eine Dimension ist ordinalskaliert. Somit braucht der Test nicht alle Informationen.
Lernziele
- Situationen erkennen können, in denen der  2 -Test angewandt werden kann
(diese insbesondere von den Situationen mit Anteiltests untescheiden können)
- den  2 -Test durchführen können (Bedingungen überprüfen; Übungen von der
obigen Art durchführen können).
- die häufigsten Fehler beim  2 -Test kennen und vermeiden können.
___________________________________________________________________
chiquadrattest.tex
2. HSW Siders P.R. Seite 283
II. Der  2
Anpassungstest
Ziel: Es soll die Anpassung eines Wahrscheinlichkeitsmodells
(Wahrscheinlichkeitsverteilung) an Daten überprüft werden.
Voraussetzungen: Die erwarteten Häufigkeiten sind grösser als 5 (dieskreter Fall)
oder die Abweichungen der Daten vom Modell sind standardnormalverteilt.
Bei der Behandlung stetiger Verteilungen versuchten wir Modelle an Daten
anzupassen, um Wahrscheinlichkeiten berechnen zu können (z.B. Berechnung der
Ausfallwahrscheinlichkeit bei der Festlegung der Garantiedauer). Beim
 2 Anpassungstest geht es darum zu testen, ob ein Modell zu den Daten passt.
Wir können somit mit Hilfe eines solchen Tests überprüfen, ob die Anpassung
eines Modells an die Daten gut gelang. Der  2 Anpassungstest ist eine alternative
Methode zur graphischen Überprüfung des Passens von Daten zu einem Modell
(mit P-P-Plots, Q-Q-Plots).
Stammen Daten aus einer Verteilung, so werden die relativen Häufigkeiten als
Werte einer Zufallsvariable um die jeweiligen theoretischen Wahrscheinlichkeiten
streuen. Weichen die Daten aber zu stark vom Modell ab, so passt das Modell
nicht zu den Daten. Ein Test sollte entsprechend stark abweichende Daten stark
gewichten, schwach abweichende jedoch wenig. Die Summe der quadrierten
Abweichungen zwischen den empirischen und der theoretischen Werten entspricht
dieser Anforderung. Man kann zeigen, dass die Summe der quadrierten
Abweichungen der Daten vom Modell unter der Nullhypothese näherungsweise
 2 verteilt ist. Ein solcher Test kann allerdings die graphische Überprüfung nicht
ersetzen. Insbesondere deckt der  2 Anpassungstest bei stetigen Verteilungen
Ausreisser je nach Klassenbildung nicht auf.
Wir betrachten zuerst den Fall diskreter Verteilungen. Wir können für jede
Ausprägung i (bei der Poissonverteilung würde wir die unendlich vielen rechten
Ausläufer zu einer Klasse zusammenziehen) sowohl die empirische absolute
Häufigkeit (H i ) als auch die theoretische Wahrscheinlichkeit (p i  berechnen. Es gilt
dann näherungsweise:
m

i1
H i  np i  2

  2m1
np i
Wobei m die Anzahl der Ausprägungen ist und n die Anzahl der Daten. Werden k
Parameter aus den Daten geschätzt, so muss k bei den Freiheitsgraden zusätzlich
weggezählt werden.
Beispiel 1: Es wird überprüft, ob ein Würfel gut in dem Sinne ist, dass alle Seiten
dieselbe Wahrscheinlichkeit haben, gewürfelt zu werden. Dazu werden 1000 Würfe
gemacht. Es ergeben sich die folgenden Daten:
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 283
1
2
3
4
5
6
150
160
180
175
174
161
H 0 : Die Daten passen zu einer diskreten uniformen Verteilung (k  6).
H A : Die Daten passen nicht zu einer diskreten uniformen Verteilung. (  0. 05
n
Wir testen : 
i1
150 1000
2
6
1000
6

H i np i  2
np i
160 1000
2
6
1000
6


180 1000
2
6
1000
6

175 1000
2
6
1000
6

174 1000
2
6
1000
6

161 1000
2
6
1000
6
 3. 932
ChiSquareDist3. 932; 5  0. 440 75  0. 025.
Die Daten passen zu einem guten Würfel. Wir halbieren das Signifikanzniveau,
wenn wir Überanpassung auch als nicht zu den Daten passend qualifizieren.
Interessiert uns dieser Fall nicht, würden wir auf 0.05 einseitig testen.
Beispiel 2: Wir wollen überprüfen, ob die Anzahl der Betriebe bezüglich
bestimmter Versicherungsmeldungen pro Jahr und pro Betrieb bei 43 Betrieben
poisson-verteilt ist   8. Es wurden folgende Daten erhoben (Beispiel 2
(Anpassung).xls)
xi
>=10
Summen
0
1
2
3
4
5
6
7
8
9
Hi
1
2
3
4
5
8
8
4
3
1
4
43
hi
0.0232
0.0465
0.0697
0.0930
0.1162
0.1860
0.1860
0.0930
0.0697
0.0232
0.0930
1
pi
0.0026837
0.0107348
0.02862614
0.05725229
0.09160366
0.13958653
0.13958653
0.05725229
0.02862614
0.0026837
0.4413642
1
npi
2
0.115399144
0.461596576
1.230924203
2.461848405
3.938957448
6.002220874
6.002220874
2.461848405
1.230924203
0.115399144
18.97866072
43
(Hi-npi) /npi
6.78097469
5.12717212
2.54250357
0.96103006
0.28581454
0.66494078
0.66494078
0.96103006
2.54250357
6.78097469
11.8217128
39.1335977
n  43; m  11
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 284
m
Wir erhalten als Testwert: 
i1
H i np i  2
np i
 39. 13359769
Nun ist: ChiSquareDist39. 13359769; 10  0. 999 98
Der p-Wert ist: 1  0. 999 98  0. 000 02  0. 05
Damit stammen die Daten nicht aus einer poisson-verteilten Zufallsvariable oder
wenigstens nicht aus einer poisson-verteilten Zufallsvariable mit dem Parameter
  8.
Als nächstes betrachten wir stetig verteilte Zufallsvariablen. Sind die
Abweichungen der Daten vom Modell standardnormalverteilt, kann direkt ein
 2 Test durchgeführt werden (Es wird der p-Wert für die Summe der quadrierten
Abweichungen berechnet; df  n  k, wenn k Parameter des Modells aus den n
Daten geschätzt wurden). Das Problem mit einem solchen Verfahren besteht darin,
dass wir ja die Normalverteilungsannahme ebenfalls überprüfen müssten. Dazu
können wir einen P-P-Plot zeichnen. Allerdings wird dann die Angemessenheit der
ursprüngliche Verteilung nicht rechnerisch, sondern letztlich wiederum zeichnerisch
überprüft - was in der Praxis allerdings nicht unbedingt von Nachteil ist. Eine rein
rechnerische Methode besteht darin, dass wir die stetige Verteilung "diskretisieren"
und dann den obigen Test für diskrete Verteilungen anwenden: Wir zerlegen die
x-Achse in Intervalle (die Wahl der Länge der Intervalle ist willkürlich und die
Intervalle müssen nicht gleich lang sein). Für die entsprechenden Intervalle werden
dann die Wahrscheinlichkeiten berechnet, sowie die relative Häufigkeit der
empirischen Fälle im Intervall.
Beispiel 3: Wir möchten testen, ob die folgenden Daten normalverteilt sind
(Beispiel 3 (Anpassung).xls):
487.467907
574.158283
476.566045
620.092103
443.358986
413.070374
508.125322
399.099342
509.672372
477.090374
500.528246
465.015376
537.286713
480.039337
464.580033
511.624486
609.116622
514.107879
525.40597
518.528521
Wir ordnen die Daten, bestimmen Intervallgrenzen, zählen die Anzahl der Daten
pro Intervall und berechnen die theoretischen Wahrscheinlichkeiten für die
Intervalle.
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 285
xi
5 Intervalle
399.099342
413.070374
443.358986
464.580033
465.015376
476.566045
477.090374
480.039337
487.467907
500.528246
508.125322
509.672372
511.624486
514.107879
518.528521
525.40597
537.286713
574.158283
609.116622
620.092103
501.746715
56.0516458
Hi
p (Intervall- pi =
p(xu<X<xo)
grenzen)
hi
(Hi-npi)2/npi
npi
<=440
2
0.1
0.135316
0.1353169
2.706339
0.18435076
440<x=<480
5 0.25
0.349016
0.2136998
4.273996
0.12332279
480<x=<520
8
0.4
0.627655
0.2786389
5.572779
1.05717397
520<x=<560
560 < x
2 0.1
3 0.15
0.850662
0.149337
0.2230066
0.1493375
4.460132
2.986751
1.35696689
5.8767E-05
20
2.72187318
0.60539255
Mittelwert
Stabw.
20
1 Summen
1
p-Wert:
Dabei ist x u die untere Intervallgrenze und x o die obere Intervallgrenze. Somit ist p i
die Wahrscheinlichkeit, dass ein Wert der Zufallsvariable ins Intervall ]x u , x o ] fällt.
Die erwarteten Häufigkeiten erreichen den Wert 5 oft nicht. Deshalb müsste man
hier auf die Anwendung des Testes verzichten. Übungshalber berechnen wir:
 24 2. 721873189  1  0. 60539255
Der p Wert ist: 0. 60539255  0. 05.
Die Normalverteilungsannahme wäre bei einem solchen Resultat haltbar, wenn die
Voraussetzung erfüllt wäre.
Mit SPSS:
Mit SPSS gibt es eine i.A. etwas unhandliche Möglichkeit, Verteilungen mit dem
 2 Test zu überprüfen (Analysieren, Nicht-Parametrische Tests,  2 Test). Ein
Beispiel, das sich so leicht überprüfen lässt, sind die empirischen Werte beim
Werfen eines Würfels. Wir würden z.B. folgende Resultate erhalten:
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 286
Zahl beim Würfeln
Gültig
1
2
3
4
5
6
Gesamt
Häufigkeit
100
90
108
104
121
88
611
Prozent
16.4
14.7
17.7
17.0
19.8
14.4
100.0
Gültige
Prozente
16.4
14.7
17.7
17.0
19.8
14.4
100.0
Kumulierte
Prozente
16.4
31.1
48.8
65.8
85.6
100.0
Bei SPSS müssen wir die Urdaten verwenden (die Daten, die wir fortlaufend beim
Würfeln erhalten; eine Spalte mit 100 Einern, 90 Zweiern, etc.). Die erwartete
Häufigkeit für jede Ausprägung ist dieselbe (dies ist die Voreinstellung). Wir
erhalten:
Zahl beim Würfeln
1
2
3
4
5
6
Gesamt
Beobachtetes
N
100
90
108
104
121
88
611
Erwartete
Anzahl
101.8
101.8
101.8
101.8
101.8
101.8
Residuum
-1.8
-11.8
6.2
2.2
19.2
-13.8
Statistik für Test
Chi-Quadrata
df
Asymptotische Signifikanz
Zahl beim
Würfeln
7.314
5
.198
a. Bei 0 Zellen (.0%) werden weniger als
5 Häufigkeiten erwartet. Die kleinste
erwartete Zellenhäufigkeit ist 101.8.
Die Resultate des Würfelns sind mit dem Modell (diskret uniform) verträglich.
Bei einem Würfel, der nicht dieselbe Wahrscheinlichkeiten für jede Ausprägung
hat, müssen wir unter ”erwartete Werte” die jeweiligen Anteile eingeben (in
aufsteigender Ordnung den Ausprägungen der Variable entsprechend): Wir
nehmen an, es würde folgende Wahrscheinlichkeitsfunktion vorliegen:
{1,0.2,2,0.2,3,0.2,4,0.2,5,0.1,6,0.1}. Wir geben somit bei ”erwartete
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 287
Werte” die Zahlen 0.2, 0.2, 0.2, 0.2, 0.1, 0.1 ein. Wir erhalten das folgende
Resultat:
Zahl beim Würfeln
1
2
3
4
5
6
Gesamt
Beobachtetes
N
100
90
108
104
121
88
611
Erwartete
Anzahl
122.2
122.2
122.2
122.2
61.1
61.1
Residuum
-22.2
-32.2
-14.2
-18.2
59.9
26.9
Statistik für Test
Chi-Quadrata
df
Asymptotische Signifikanz
Zahl beim
Würfeln
87.445
5
.000
a. Bei 0 Zellen (.0%) werden weniger als
5 Häufigkeiten erwartet. Die kleinste
erwartete Zellenhäufigkeit ist 61.1.
Die empirischen Befunde sind mit diesem Modell nicht verträglich.
Übungen
1) Wir nehmen an, im Oberwallis weise die kinderreichste Familie 12 Kinder auf.
Es gibt sich dabei für den Kinderreichtum der Famillien die folgende Tabelle (so
haben z.B. 706 Familien je 2 Kinder und 448 Familien haben keine Kinder; die
Daten sind frei erfunden).
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 288
Anzahl
Kinder
Anzahl
Familien
0
1
2
3
4
5
6
7
8
9
10
11
12
448
823
706
359
133
13
3
2
0
0
0
0
1
Überprüfen Sie, ob die Anzahl der Familien pro spezifische Kinderzahl
binomialverteilt ist (B(12; 0.13) (Übung 1 (Anpassung).xls)
2) Die Unfallhäufigkeit in den KMUs der Schweiz weise folgende Verteilung auf:
(frei erfundene Daten, Übung 2 (Anpassung).xls). Versuchen Sie eine
Poisson-Verteilung an die Häufigkeiten der Betriebe pro Unfallhäufigkeit
anzupassen und testen Sie die Angemessenheit.
3) Überprüfen Sie die folgenden Daten auf Normalverteilung (Übung 3
(Anpassung).xls) (Wenn Sie zwecks Überprüfung dieselben Klasseneinteilungen
vornehmen wollen wie in der Antwort verwendet: ], 20’000[, [20’000, 30’000[,
[30’000, 40’000[, [40’000, 50’000[, [50’000, 60’000[, [60’000, ). Sollten die Daten
nicht normalverteilt sein, versuchen Sie eine andere Verteilungsfunktion an die
Daten anzupassen.
4) Überprüfen Sie die folgenden Daten auf Exponentialverteilung (Übung 4
(Anpassung).xls).
5) Es wird behauptet, ein fallengelassener Fünfliber bleibe mit einer
Wahrscheinlichkeit von 0.6 mit dem Wilhelm Tell nach unten liegen. Die These wird
überprüft, indem ein Fünfliber 50 mal geworfen wird. Dabei bleibt er 25 mal mit
dem Tell nach unten liegen, 25 mal mit der Zahl nach unten. Ist die These haltbar?
Lösungen
1) Die Lösung finden Sie unter Tabelle 2, (Übung 1 (Anpassung).xls). Der p-Wert
ist 0 (12 Freiheitsgrade, da es 13 Ausprägungen von X  B12,  gibt). Das Modell
passt nicht. Dies ist vor allem dem letzten Wert zuzschreiben, der weitaus am
meisten zum grossen Testwert beiträgt. Vermutlich müssten wir, um ein Modell
anzupassen, den Ausreisser weglassen und es mit den restlichen Daten
versuchen. Zu berechnen ist:  212 16. 49924021  1  p-Wert  1  0. 169424562.
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 289
Der p-Wert von 0. 169424562 (Lösungsweg siehe ”Tabelle 3”) führt nicht zur
Verwerfung des Modells. Das Beispiel zeigt die Bedeutung von Ausreissern.
2) Wir berechnen die durchschnittliche Unfallhäufigkeit pro Betrieb und setzen
diese mit  gleich: es gilt also   3. 160287081. Dann berechnen wir die
theoretischen absoluten Häufigkeiten und den Chi-Quadrat-Testwert (siehe Tabelle
2). Zu berechnen ist:  213 622. 4127309  1  1. 2737E  124. Es gibt 15 Kategorien,
somit verwenden wir 14 Freiheitsgrade. Da wir zusätzlich das  aus den Daten
schätzen, müssen wir einen zusätzlichen Freiheitsgrad abziehen. Der p-Wert ist
:1. 2737E  124  0. 05. Die Daten sind nicht mit dem Modell verträglich.
3) Wir erhalten den Testwert: für 13.12571706 und 5 Freiheitsgrade:
p-Wert:0.022228719  0.05. Die Daten sind kaum normalverteilt (Lösungsweg:
Tabelle 2; die erwartete Häufigkeit unterscheidet bei den gewählten Klassen an
einem Ort 5. Wir würden den Test trotzdem durchführen. Man kann aber auch die
Klassengrenzen so bestimmen, dass die erwarteten Häufigkeiten überall grösser
als 5 sind). Ein Blick auf den P-P-Plot normal ergibt die selbe Antwort:
P-P-Diagramm Normal
1.00
Erwartete Kum. Wahrsch.
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Beobachtete Kum. Wahrsch.
Um eine passende Verteilungsfamilie zu finden, zeichnen wir eine Plot der
Eckpunkte der empirischen, kumulativen, relativen Häufigkeitsverteilung (Tabelle 3)
empirische Verteilungsfunktion
relative Häufigkeiten
1
0.87
0.8
0.6
0.4
0.2
0.06
0
0
20000
40000
60000
80000
Ausprägungen
Die Zeichnung lässt eher eine uniforme Verteilung vermuten. Wir berechnen eine
Gerade durch zwei Punkte, die wir willkürlich wählen, die aber eine möglichst gute
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 290
Anpassung erlauben. Wir wählen z.B. 21224.61775, 0.06 und 61297.44128,
0.87 und erhalten:
0. 06  21224. 61775a  b
0. 87  61297. 44128a  b
a  2. 021 3  10 , b  0. 369 02
5
Dies ergibt die Gleichung: y  0. 000020213x  0. 36902.
Nullstelle: y  0. 000020213x  0. 36902  0  x  18257.
Schnittstelle mit y  1: 0. 000020213x  0. 36902  1  x  67730.
Dies ergibt die folgende Verteilungsfunktion:
0
Fx 
für x  18257
y  0. 000020213x  0. 36902 für ]18257, 67730]
1
fürx  67730
Wir überprüfen das Modell (Tabelle 4): Wir erhalten bei einer Klasseneinteilung
[, 30  000[, [30’000, 40’000[, [40’000, 50’000[, [50’000, 60’000[, [60’000, ] einen
Testwert von: 3.68043546. Es wurden 5 Klassen gewählt. Entsprechend ergeben
sich 4 Freiheitsgrade.
 24 3. 68043546 : p-Wert: 0.450977878. Die Daten sind mit der konstruierten
theoretischen Verteilung verträglich (Sie wurden in der Tat mit Hilfe einer lineraren
Transformation aus uniform verteilten Zufallszahlen mit X  U0, 1 hergestellt.
4) Zuerst muss man  mit Hilfe der Daten schätzen. Dann werden Klassen
gebildet: im Lösungsbeispiel (Tabelle 2): [, 0. 1[, [0.1, 0.3[, [0.3, 0.7[, [0.7, [
Testwert: 1.293197229, 4 Klassen, 3 df; Da wir einen Parameter aus den Daten
geschätzt haben, wird ein zusätzlicher Freiheitsgrad abgezählt:
ChiSquareDist1. 293197229; 2  0. 476 18  0. 25. Das Modell ist mit den Daten
verträglich.
5)
0.50.6 2
0.6

0.50.6 2
0.6
 3. 333 3  10 2
ChiSquareDist3. 333 3  10 2 ; 1  0. 144 87  0. 025
Das Ergebnis ist mit der Hypothese verträglich.
___________________________________________________________________
Chiquadrat Anpassung.tex
2. HSW Visp
P.R.
Seite 291
Herunterladen