4. Die Familie der Normalverteilungen Die Werte der Verteilungsfunktion von Normalverteilungen sind nicht durch eine Formel berechenbar. Nur die Dichtefunktion kann mit Hilfe einer Formel berechnet werden. Definition: f ist die Dichtefunktion einer normalverteilten Zufallsvariable genau dann, 1 x 2 wenn fx 1 e 2 2 Ein Nachweis, dass f wirklich eine Dichtefunktion einer Wahrscheinlichkeitsverteilung ist, besteht im Beweis von 1 2 1 e 2 x 2 1. Um auszudrücken, dass eine stetige Zufallsvariable normal verteilt ist, scheiben wir: X N, 2 . Der Erwartungswert und die Varianz 2 stellen die Parameter der Verteilung dar. Übung: Wir nehmen an, es gelte X N4, 9. Berechnen Sie für x i 1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 die Funktionswerte fx i der entsprechenden Dichtefunktion und tragen Sie die Punkte in einem Koordinatensystem ab. Lösung: Die Dichtefunktion ist: fx 3 3 3 3 3 3 1 2 1 2 1 2 1 2 1 2 1 2 2 1 14 3 1 04 3 2 e 2 1 14 3 2 1 24 3 2 34 3 2 44 3 2 e 2 e 2 e 2 1 e 2 1 e 2 3. 315 9 10 1 3 2 2 0. 0 546 7 8. 065 7 10 2 0. 106 48 0. 125 79 1 e 2 x4 3 2 1 1 e 2 3 2 1 1 e 2 3 2 1 1 e 2 3 2 1 1 e 2 3 2 1 1 e 2 3 2 94 3 2 3. 315 9 10 2 ; 2 84 3 74 3 2 64 3 2 54 3 2 0. 0 546 7 8. 065 7 10 2 0. 106 48; 0. 125 79; 0. 132 98 Wir stellen fest, dass die Werte symmetrisch um 4 liegen. ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 105 Graphische Darstellung: Verbinden wir die Punkte, erhalten wir: ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 106 Die Dichtefunktionen der Normalverteilungen sind um ( Erwartungswert) symmetrische Funktionen. Somit fällt der Median mit dem Erwartungswert zusammen. Durch Veränderung von können wir die Kurve nach links oder nach rechts verschieben. Je grösser , desto mehr wird die Kurve nach rechts verschoben. Beispiele: 4; 3 2; 3 0; 3 2; 3 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 107 Die Varianz 2 gibt an, wie steil oder wie flach die Dichtefunktion einer Normalverteilung ist: Je kleiner die Varianz ist, desto steiler läuft die Kurve beim Erwartungswert zusammen. 4; 1 4; 2 4; 3 4; 5 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 108 Die Standardabweichung schneidet beidseitig des Erwartungswertes ca. 0.68 ab. D.h. P X 0. 68. (ca. 2/3) P 2 X 2 0. 955 (ca. 95%) P 3 X 3 0. 9994 (ca 99.9%). 10, 3 2σ 4σ Eine Zufallsvariable X, für die gilt: X N0, 1, ist ”standardnormalverteilt”. Für die Formel der entsprechenden Dichtefunktion gilt: 2 1 x0 2 1 f X x 1 e 2 1 f X x 1 e 2 x 1 2 2 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 109 Berechnung der Werte Px X y für X N, 2 Die entsprechenden Werte werden mit Näherungsverfahren berechnet. In der Praxis benutzen wir zur Bestimmung von Wahrscheinlichkeiten bei normalverteilten Zufallsvariablen Rechner, Computerprogramme oder Tabellen. Um das Gefühl für die Normalverteilung und das, was sie ausdrückt, zu verbessern, berechnen wir näherungsweise eine Teilfläche unter der Dichtefunktion. Wir wollen die Fläche im Intervall ]0. 8, 1. 6] ]a, b] unter der Dichtefunktion der Standardnormalverteilung berechnen. Dreieck Rechteck a b Die zu berechnende Fläche ist aus einem Rechteck und aus einem näherungsweisen Dreieck zusammengesetzt. Wir können diese berechnen (f ist die Dichtefunktion). Für das Rechteck: Basis Höhe Die Basis beträgt dabei (1. 6 0. 8) und die Höhe f1. 6. Wir erhalten somit: 1 2 1. 6 0. 8 1 2 e 2 1.6 8. 873 7 10 2 Für das Dreieck: BasisHöhe : 2 Die Basis beträgt (1. 6 0. 8) und die Höhe f0. 8 f1. 6 : 0.8 2 1 2 1 2 e 2 0.8 1 2 1 e 2 1.6 2 7. 150 8 10 2 Somit ist die Fläche näherungsweise: 8. 873 7 10 2 7. 150 8 10 2 0. 160 25 Wir vergleichen das Resultat mit dem Resultat von Excel: ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 110 F1. 6 F0. 8 0. 157056044 Die Näherung ist um weniger als 4 o / oo daneben. Sie könnte beliebig verbessert werden, indem wir die zu berechnende Fläche in kleinere Intervalle einteilen und jeweils deren Fläche berechnen. Dies wäre vor allem in den Intervallen angemessen, wo die Dichtefunktion der Standardnormalverteilung stärker gekrümmt ist und damit durch die Hypotenuse des Dreiecks weniger gut angenähert wird als im Beispiel. Allgemein ist die Fläche im Intervall ]a, b] (für a, b 0) näherungsweise: b a 1 2 1 e 2 b 2 ba 2 1 2 1 2 2 1 2 e 2 a 1 2 e 2 b 1 2 1 e 2 b 2 Wir vereinfachen: 2ba 2 1 2 1 e 2 b 2 ba 2 2 1 2 ba 2 1 2 e 2 b 1 e 2 b 1 ba 2 2 2 1 2 1 e 2 a 1 2 1 e 2 b ba 2 1 2 1 1 2 e 2 a 1 e 2 a 2 2 2 Wir berechnen die näherungsweise Fläche A im betrachteten Intervall [0. 8, 1. 6] bei einer zusätzlichen Unterteilung des Intervalls in 0. 8, 1. 2 1. 2, 1. 6 0. 8, 1. 6 A2 A1 A1 A2 A A1 1.61.2 2 1 2 e 2 1.6 A2 1.20.8 2 1 2 e 2 1.2 1 2 1 2 e 2 1.2 1 2 6. 102 1 10 2 1 2 1 2 e 2 0.8 1 2 9. 677 6 10 2 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 111 A 6. 102 1 10 2 9. 677 6 10 2 0. 1578 Die Näherung ist schon bedeutend besser geworden. Es ist einfach, z.B. mit Excel noch bessere Näherungen zu berechnen, indem die Unterteilung durch zusätzliche Intervalle verfeinert wird. In der Praxis werden wir die Werte Pa X b bei normalverteilten Zufallsvariablen nicht auf diese Art berechnen. Wir verwenden Programme, Rechner oder Tabellen: Mit Excel: Statistikfunktionen, NORMVERT liefert Px X für X N, 2 . Dabei wird unter x der Wert x eingegeben, unter ”Mittelwert” , unter ”Standardabweichung” , unter ”kumuliert” 1 (0 liefert den Wert der Dichtefunktion in x). Mit dem HP: Der HP48G liefert unter mth, NXT, PROB, NXT, UTPN die Werte für PX x. Bevor der Befehl ausgeführt wird, müssen die folgenden Werte der Reihe nach in die Stackebenen gegeben werden: , 2 , x (Es lohnt sich, ein Miniprogramm mit einer entsprechenden Abfrage zu machen, siehe HP-Blätter). Mit Tabellen: In Tabellen werden nur die Werte für die Standardnormalverteilung geliefert. Daten, die normalverteilt sind, können jedoch leicht in Daten transformiert werden, die standardnormalverteilt sind. Dies geschieht durch die z-Transformation. Wir möchten PX x i berechnen mit X N, 2 . Dann können x wir PZ z i berechnen mit z i i und Z N0, 1. Wir verwenden künftig als Abkürzung für die Verteilungsfunktion der Standardnormalverteilung. Die näherungsweise berechneten Punkte der Normalverteilung erlauben es, eine punktweise Zeichnung der kumulativen Verteilungsfunktion zu erstellen, wobei die Punke von Hand verbunden werden können. Der Plot der Funktion {-0.25,1-0.5987, -0.5,1-0.6915, -0.75,1-0.7734, -1,1-0.8413, -1.25,1-0.8944, -1.5,1-0.9332, -1.75,1-0.9599, -2,1-0.97725, -2.25,1-0.98778, -2.5,1-0.99379, -2.75,1-0.99702, -3,1-0.998650, 0,0.5, 0.25,0.5987, 0.5,0.6915, 0.75,0.7734, 1,0.8413, 1.25,0.8944, 1.5,0.9332, 1.75,0.9599, 2,0.97725, 2.25,0.98778, 2.5,0.99379, 2.75,0.99702, 3,0.998650} ergibt die folgende Graphik. ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 112 Zeichnen wir die punktweise empirische Verteilungsfunktion von z-standardisierten Daten, so können wir davon ausgehen, dass sie normalverteilt sind, wenn die Punkte ungefähr auf der obigen gedachten Kurve liegen (Die Kurve ist punktsymmetrisch in 0, 0.5 und steigt stark nahe bei 0 und schwächer für Punkte, die weiter weg von 0 liegen). Die z-Transformation Daten mit beliebiger Verteilung können durch die z-Transformation in Daten mit dem Mittelwert 0 und der Standardabweichung 1 verwandelt werden. Die z-Transformation ist definiert als: zi x i x (wir verwenden Variablen mit Querstrich für die empirischen Kennzahlen. 2 ist somit die empirische Varianz einer empirischen Verteilung. Während 2 die Varianz einer theoretischen Verteilung ist). Beispiel: Gegeben sind die Daten x i 4, 5, 6, 7 Deren Mittelwert ist: x 4567 4 5. 5 45.5 2 55.5 2 65.5 2 75.5 2 Deren Standardabweichung ist: 41 Wir transformieren die Werte: z 1 1.45.5 1. 161 9; z 2 1.55.5 . 387 3; 291 291 65.5 75.5 z 3 1. 291 . 387 3; z 4 1. 291 1. 161 9 1. 291 (Bei grossen Datensätzen verwenden wir dazu den Computer. Übung: Wählen Sie einen Datensatz aus den Beispielen von SPSS und darin eine metrisch und stetig skalierte Variable. Berechnen Sie eine z-Transformation der Daten). Der Mittelwert der z-transformierten Daten z i ist: z 1. 16190.38730.38731.1619 4 0 Die Standardabweichung der z-transformierten Daten z i ist: ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 113 1.16190 2 0.38730 2 0.38730 2 1.16190 2 41 z 1 Wir zeigen für beliebige empirische Verteilungen: Der Mittelwert z-transformierter Daten ist 0 und deren Varianz 1. Die Formel für den Mittelwert und die Varianz lautet: x 1 n n xi 1 n1 2 i1 n x i x 2 i1 n Für den Mittelwert: z x 1n nx x x 0 Für die Varianz: 2z 1 n1 n z 2i i1 1 n1 1 n n 1 n n x i x z i z 2 1 n1 zi i1 1 n i1 n x i 1n x i1 i1 0 1 n1 n i1 n x ix 2 i1 1 n1 n i1 x i x 2 2 n z i 0 2 i1 n 1 n1 x i x 2 i1 2 2 2 1 Übung: Wir haben folgende Daten zur Verfügung: 9. 21, 9. 52, 9. 62, 9. 63, 9. 61, 9. 71, 9. 83. Transformieren Sie diese Werte mit einer z-Transformation und zeigen sie, dass der Mittelwert der z-Werte 0 und die Varianz der Werte 1 (um wirklich diese Werte zu erhalten, müssen möglichst viele Stellen berechnet und verwendet werden). Lösung: Wir berechnen x und : x 0. 193304595565.) z1 z2 z3 z7 9.219.59 0.193304595565 9.529.59 0.193304595565 9.629.59 0.193304595565 9.839.59 0.193304595565 1. 965 8 z 4 . 362 12 z 5 9.219.529.629.639.619.719.83 7 9.639.59 0.193304595565 9.619.59 0.193304595565 9.719.59 0.193304595565 . 155 2 z6 1. 241 6 z 0; z 1 9. 59; . 206 93 . 103 46 . 620 78 Excel liefert die z-Transformation unter den Statistikfunktionen mit ”Standardisierung”. ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 114 Zusammenhang von Normalverteilung und Binomialverteilung Es besteht ein enger Zusammenhang zwischen den Binomialverteilungen und der Standardnormalverteilung. Wir können die Binomialverteilung durch eine Art Dichtefunktion darstellen, indem wir die Wahrscheinlichkeiten, die den Werten der Zufallsvariable zugeordnet sind, durch Flächen repräsentieren, so dass (i) F i PX x i (F i ist die Fläche, die wir x i zuordnen) (ii) sich die jeweiligen Rechtecke berühren und (iii) die Rechtecke symmetrisch um die x i liegen. Für n 5 und p 0. 5 erhalten wir das folgende ”Hystogramm”: Dabei sind die jeweiligen Intervallgrenzen der Rechtecke auf der x-Achse durch g i x i 0. 5 gegeben. Die Basis der Rechtecke ist jeweils 1 und die Höhe PX x i . Wir führen nun eine z-Transformation auf die so erhaltenen Intervallgrenzen g i x i 0.5np durch, d.h. g i np1p . Dann berechnen wir die Flächen über den transformierten Intervallgrenzen, so dass für die Intervalle x i 0.5np np1p x i 0.5np np1p x i 0.5np np1p , x i 0.5np np1p gilt: PX x i h und zeichnen das Ganze zusammen mit der Standardnormalverteilung in ein Koordinatennetz. Wir erhalten z.B. für n 5 und p 0. 5: xi P(X=xi) 0 1 2 3 4 5 0.03125 0.15625 0.3125 0.3125 0.15625 0.03125 Intervallgrenzen z-transformierte Höhen Intervallgrenzen -0.5 -2.68328157 0.5 -1.78885438 1.5 -0.89442719 2.5 0 3.5 0.89442719 4.5 1.78885438 5.5 2.68328157 0.03493856 0.17469281 0.34938562 0.34938562 0.17469281 0.03493856 Dies ergibt die folgende Zeichnung (samt der Dichtefunktion der ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 115 Standardnormalverteilung): Wir betrachten noch die Zeichnung für n 10, p 0. 5 : Wir stellen fest, dass sich die Obergrenze des Treppenkörpers der Dichtefunktion der Standardnormalverteilung mit steigendem n nähert. Wir legen folgendes fest: (1) f ist die Grenzfunktion einer Folge von Funktionen f n (symbolisch: lim f f n n genau dann, wenn fx lim f x für alle x R. n n PXx i (2) für X Bn, p sei f n x x i 0.5np np1p 0 x i 0.5np np1p für x x i 0.5np np1p , x i 0.5np np1p und 0 i n sonst Dann könnte man beweisen, dass gilt: die Standardnormalverteilung ist die f f Grenzfunktion der Funktionenfolge f n , d.h. lim n n Auf Grund des Zusammenhangs der Standardnormalverteilung und der Familie der Binomialverteilungen können wir die Standardnormalverteilung verwenden, um näherungsweise Werte der Binomialverteilung zu berechnen. Man möchte PX 3 für X B40, 0. 5 berechnen. Traditionell war eine solche Berechnung mühsam. ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 116 Deshalb war früher das Näherungsverfahren nützlicher als heute. Wir erhalten den folgenden exakten Wert: PX 3 0. 00000421516597271. Mit der Standardnormalverteilung erhalten wir für X N0, 1 : PX 3300.52 0. 000005885142 300.5 wobei 3300.5 300.5 2 4. 381 8. Die Differenz zwischen den beiden Werten ist unbedeutend. Als Richtwert nimmt man im Allgemeinen an, dass die Näherung genügend genau ist, wenn n p 1 p 9 (Obwohl im obigen Beispiel dieser Wert nicht erreicht wird 30 0. 5 0. 5 7. 5 -, ist die Näherung doch schon gut). Übungen Berechnen Sie folgende Wahrscheinlichkeiten: 1) X N5, 36 : a) PX 7 b) P5 X 8 c) P6 X 9 d) P8. 5 X. e) PX 3 f) P2 X 4 2) a) X N3, 8 : PX 7 b) X N6, 8 : P5 X 8 c) X N10, 80 : P6 X 9 d) X N9, 70 : P8. 5 X. e) X N5, 16 : P2 X 8 f) X N5, 16 : PX 5. 3) Berechnen Sie mit Excel und dem oben angegeben Näherungsverfahren die Fläche zwischen der Dichtefunktion der Standardnormalverteilung und der x-Achse im Intervall ]0. 5, 1], indem Sie zuerst das gesamte Intervall betrachten, dann eine Zweiteilung und eine Vierteilung des Intervalls vornehmen. Vergleichen Sie die Lösungen mit den Ergebnis NORMVERT von Excel. 4) Berechnen Sie mit Hilfe der Normalverteilung die folgenden Werte der folgenden Binomialverteilungen (wobei Sie jeweils die Voraussetzung für die Näherung überprüfen): a) PX 23 für X B40, 0. 4 b) PX 30 für X B45, 0. 5 c) PX 18 für X B50, 0. 3 d) PX 2 für X B40, 0. 45 e) PX 24 für X B100, 0. 44 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 117 Lösungen: In den folgenden Lösungen werden Zwischenschritte für jene geliefert, die mit einer Tabelle arbeiten. Mit dem HP oder einem ähnlichen Rechner kann man unmittelbar oder nach einer kleinen Umrechnung die entsprechenden Resultate erhalten. a) PX 7 0. 630558659818 Mit Tabelle: F X 7 75 0. 3333 0. 6293 6 Bei Berechnung der zusätzlichen Stellen durch Interpolation: 0. 6293 13 0. 6331 0. 6293 0. 630 57 b) P5 X 8 PX 8 PX 5 0. 191462461274 55 Mit Tabelle: 85 6 6 3 6 0 0. 6915 0. 5 0. 191 5 c) P6 X 9 F X 9 F X 6 0. 566183832622 65 Mit Tabelle: 95 6 6 4 1 6 6 0. 7454 0. 5636 0. 181 8 (Bei Berücksichtigung zusätzlicher Stellen: 46 0. 7454 747 53 16 0. 5636 23 0. 5675 0. 5636 0. 566 2 Somit ist 46 16 0. 747 53 0. 566 2 0. 181 33 2 3 0. 7486 0. 7454 0. d) P8. 5 X 1 F X 8. 5 0. 279344636 Mit Tabelle: 1 8.55 1 3.5 6 6 1 0. 583 33 1 0. 7190 0. 281 e) PX 3 F X 3 0. 369441340182 Mit Tabelle: 1 35 1 26 6 1 0. 6293 0. 370 7 f) P2 X 4 F X 4 F X 2 0. 125278628663 Mit Tabelle: 1 45 1 25 6 6 3 1 1 6 1 6 1 0. 5636 1 0. 6915 0. 127 9 B) a) X N3, 8 : PX 7 F X 7 0. 921350396475 Mit Tabelle: 73 1. 4142 0. 9207 8 b) X N6, 8 : P5 X 8 F X 8 F X 5 0. 398413133991 Mit Tabelle: 86 56 0. 7580 1 0. 35355 8 8 0. 7580 0. 36173 0. 396 27 c) X N10, 80 : P6 X 9 F X 9 F X 6 0. 128129223246 Mit Tabelle: 910 610 1 0. 1118 1 0. 44721 80 80 1 0. 5438 1 0. 6700 0. 126 2 d) X N9, 70 : P8. 5 X 1 F X 8. 5 0. 523827177663 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 118 Mit Tabelle: 1 8.59 70 1 1 0. 059761 0. 5199. e)X N5, 16 : P2 X 8 F X 8 F X 2 0. 546745295246 Mit Tabelle: 25 85 4 4 3 3 1 4 4 1 20. 75 1 0. 45325 0. 546 75 f) X N5, 16 : PX 5 0. 5 3) Folgende Formel muss eingegeben werden: (((B1-A1)/2)*((1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(B1)^2) (1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(A1)^2))) (Statt ”((1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(B1)^2)” könnte man aber auch kürzer ”(NORMVERT(B1;0;1;0)” und statt ”(1/((2*3.1415926535)^(1/2)))*EXP(-(1/2)*(A1)^2))” kürzer ”(NORMVERT(A1;0;1;0)”eingeben). In die Spalten B und A setzen wir die Intervallgrenzen b und a und wir erhalten: Beim gesamten Intervall: 0.148509013 Bei Zweiteilung: 0.149538864 Bei Vierteilung: 0.149796428 Mit Excelbefehl NORMVERT: 0. 149882273 a 0.5 0.5 0.75 0.5 0.625 0.75 0.875 b 1 0.75 1 0.625 0.75 0.875 1 Summen 0.14850901 0.08165034 0.06788852 0.04251414 0.03933115 0.03582453 0.03212661 0.14953886 0.14979643 4) a) Die Voraussetzung: 0. 4 0. 6 40 9. 6 9 ist erfüllt. 23400.4 2. 259 2 0. 0119354734175 1 400.60.4 Der genaue Wert ist: 0. 008341770891. b) Die Voraussetzung: 0. 5 0. 5 45 11. 25 9 ist erfüllt. 1 29450.5 1 1. 937 9 0. 0263177119897 450.50.5 Der genaue Wert ist: 0. 017848901776 c) Die Voraussetzung: 0. 3 0. 7 50 10. 5 9 ist erfüllt. 18500.3 0. 925 82 0. 822730234184 500.30.7 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 119 Der genaue Wert ist: 0. 859440123612 d) Die Voraussetzung: 0. 45 0. 55 40 9. 9 9 ist erfüllt. 1400.45 400.450.55 5. 403 0 0. 000000032768 Der genaue Wert ist: 1. 38831751973 10 9 e) Die Voraussetzung: 0. 44 0. 56 100 24. 64 9 ist erfüllt. 1 4. 230 6 0. 99998834656 1 231000.44 1000.440.56 Der genaue Wert ist:0. 999989953116 Man beachte: Die Näherungswerte können verbessert werden, wenn man statt der Werte x i die Werte x i 0. 5 verwendet. Computer und Rechnungsmaschinen verwenden bei grossen n bei der Berechnung von Wahrscheinlichkeiten der Binomialverteilung oft auch ein Näherungsverfahren. Lernziele - Die Wahrscheinlichkeiten bezüglich Normalverteilungen - mit Excel berechnen können - mit einem Rechner oder mit Tabellen bestimmen können. - Die Funktionswerte der Dichtefunktion ausrechnen können (die Formel muss man nicht auswendig kennen). - Die Idee des Näherungsverfahrens für die Berechnung von Flächen unter der Dichtefunktion beschreiben können. - Wissen, dass die Dichtefunktion der Normalverteilungen eine symmetrische Verteilungen sind und dass deshalb der Erwartungswert und der Median zusammenfallen. - Die Abkürzung X N, 2 verstehen. - Daten z-transformieren können. - Wahrscheinlichkeiten PX x und PX x für X Bn, p mit Hilfe der Normalverteilung näherungsweise berechnen können. - Wissen, dass ein enger Zusammenhang zwischen der Familie der Binomialverteilungen und der Standardnormalverteilung besteht. - Übungen der Art 1), 2) und 4) machen können. Anhang: Die Tabellierung der genäherten Werte der Standardnormalverteilung In der Tabelle der ”Formeln und Tafeln - Mathematik - Physik” Orell Füssli Verlag Zürich (siehe Kopie) können die Wahrscheinlichkeiten wie folgt abgelesen werden. ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 120 u sind die z-transformierten Werte der Zufallsvariable. In der ersten Spalte stehen die Werte u (eine Stelle vor dem Komma, eine Stelle nach dem Komma). In der ersten Zeile steht die jeweils zweite Stelle nach dem Komma). In den übrigen Spalten (ohne die erste Zeile) stehen die entsprechenden Wahrscheinlichkeiten für x u 0, wobei statt F X s u F X s ( Verteilungsfunktion einer standardnormalverteilten Zufallsvariable) bei der Standardnormalverteilung die x Symbolisierung u gebräuchlich ist ( wird gelesen als ”phi” oder ”Grossphi”, wenn Kleinphi ebenfalls verwendet wird. Kleinphi ist ). Bei Daten mit * ist der Vordruck der unteren Zeile zu verwenden (Beispiel: 2. 35 0. 99061. Da die Normalverteilung symmetrisch ist, können wir mit Hilfe der Werte u 0 auch die Wahrscheinlichkeiten für die Werte u 0 berechnen: Für u 0 ist PX u u 1 u. Denn die ganze Fläche unter der Dichtefunktion ist mit 1 identisch. Da die Funktion symmetrisch um den 0-Punkt ist, ist auch die Fläche unter der Dichtefunktion symmetrisch um den 0-Punkt. Ziehen wir parallel zur f-Achse zwei Geraden durch a und a (für a 0), so entstehen rechts der Gerade g a und links der Gerade g a gleich grosse Flächen unter der Dichtefunktion. Die Fläche rechts von g a ist mit 1 u identisch). Somit ist u 1 u. Die folgende Graphik veranschaulicht diesen Zusammenhang: FX(-2.1) = Φ(-2.1) = 1 - Φ(2.1) 1 - Φ(2.1) Beispiele: Sei X N4, 25. PX 7 F X 7 74 0. 6 0. 7257 5 54 P5 X 8 F X 8 F X 5 84 5 5 0. 8 0. 2 0. 7881 0. 5793 0. 2088 ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 121 PX 2 F X 2 24 2 1 25 1 0. 6554 0. 3446 5 5 PX 9 1 F X 9 1 94 1 55 1 1 5 1 0. 8413 0. 158 7 P1 X 3 F X 3 F X 1 34 14 1 3 5 5 5 5 3 1 1 5 1 5 1 0. 5793 1 0. 7257 0. 146 4 34 25 1 P3 X 6 F X 6 F X 3 64 5 5 5 1 0. 6554 1 5 0. 6554 1 0. 5793 0. 234 7 Mit u wird im Tafelbuch die Fläche bezeichnet, die im Intervall u, u zwischen der x-Achse und der Dichtefunktion um den Erwartungswert 0 herum liegt. Als von besonderer Bedeutung wird sich die Fläche 1 u erweisen. Für u gilt: u 2u 1. (Denn u u u u 1 u 2u 1. Beispiel: Sei X N15, 49 : Wie hoch ist die Wahrscheinlichkeit P15 5 X 15 5 P10 X 20 Wir berechnen den z-transformierten Wert von 20: 2015 0. 714 29 u 7 Laut obiger Formel gilt dann: P10 X 20 20. 71429 1 2 0. 7611 1 0. 5222 Kommen zusätzliche Stellen der uWerte vor, so kann man diese durch lineare Interpolation zwischen den gegebenen Punkte näherungsweise berechen. Möchten wir z.B. 2. 03789 berechnen, so finden wir für 2. 03 den Wert 0. 97882, für 2. 04 den Wert:0. 97932. Die Differenz beträgt: 0. 97932 0. 97882 0. 000 5. Wir berechnen den entsprechenden Anteil: 0. 789 0. 0005 3. 945 10 4 und zählen diesen zum Wert von 2.03: 0. 97882 3. 945 10 4 0. 979 21. Solche Berechnungen drängen sich jedoch im Allgemeinen nicht auf, da die Unsicherheiten allzu grosse Genauigkeit als sinnlos erscheinen lassen. Übungshalber sollten in den folgenden Aufgaben die entsprechenden Näherungen in den ersten zwei Beispielen, wo zusätzliche Stellen auftreten, berechnet werden. ___________________________________________________________________ Normalverteilung.tex 2. HSW Siders P.R. Seite 122 5. P-P-Plots und Q-Q-Plots Bisher haben wie eine Möglichkeit gesehen, um graphisch zu überprüfen, ob ein Modell zu einem Datensatz passt. Wir zeichneten die empirische Verteilungsfunktion und das Modell ins gleiche Koordinatennetz und überprüften die Anpassung von Auge. Wir betrachten nun eine weitere, häufig verwendete Methode. Um zu überprüfen, ob n Daten eine bestimmte Verteilung haben, können wir auch sogenannte P-P-Plots (Probability-Probability-Plots) oder Q-Q-Plots (Quantil-Quantil-Plots) zeichnen. P-P-Plots Wir tragen die folgenden Punkte in ein Koordinatennetz ein: Hx i , Fx i Hx i sind die Werte der empirischen Verteilungsfunktion der x i (Hx i ist der Anteil der Daten, die kleiner gleich x i sind). Damit gilt für das i-te Datum x i eines geordeten Datensatzes: Hx i ni . Fx i sind die Werte der theoretischen Verteilungsfunktion, d.h. Fx i PX x i . Es gilt: Die Punkte Hx i , Fx i befinden sich im ersten Quadranten, und zwar im Quadrat 0, 1 0, 1. Passt die theoretische Verteilung zu den Daten, so dürfen die Daten nur gering um die yx-Achse streuen und keine systematische Abweichungen vorliegen. P-P-Plots sind für beliebige Verteilungen erstellbar, gebräuchlich sind sie vor allem für die Normalverteilung. Beispiel: Wir wollen überprüfen, ob die folgenden Daten normalverteilt sind (Schraubenlängen): 0.04992132 0.07626878 0.09694301 0.24706014 0.33711828 0.48861922 0.51154522 0.5559821 0.58895487 0.9406725 Wir berechnen die Wahrscheinlichkeiten FX x i . n 10. Somit ist Hx i i 10 . (in der Tabelle wurde auch die Berechnungsart für Tabellen angeführt. ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 123 x 0. 389308545, 0. 282461202, z i x ix Fx i : xi 0.04992132 0.07626878 0.09694301 0.24706014 0.33711828 0.48861922 0.51154522 0.5559821 0.58895487 0.9406725 zi -1.20153572 -1.10825757 -1.0350644 -0.50360334 -0.18476968 0.3515905 0.43275563 0.59007592 0.70680973 1.9519989 Φ(zi) mit Tabelle 0.1151 0.1357 0.1515 0.3085 0.4286 0.6368 0.6664 0.7224 0.758 0.9744 H(zi) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Φ(zi) mit Excel 0.11477179 0.13387534 0.15031944 0.30727006 0.42670486 0.63742724 0.66740381 0.72243017 0.76015771 0.9745309 (Bei ”mit Tabelle” wurden keine Interpolationen berechnet, um die Kontrolle zu erleichtern. Bei Interpolationen würden die Ergebnisse näher bei denen von Excel liegen) Wir tragen die entsprechenden Punkte in ein Koordinatensystem ein (samt der Achse y x): P-P-Diagramm von Normal von Schraubenlängen 1 Erwartete Kum. Wahrsch. 1 1 0 0 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Daten sind vermutlich nicht normalverteilt - es handelt sich in der Tat um uniform verteilte Zufallszahlen. Allerdings muss beachtet werden, dass zu einer relativ zuverlässigen Beurteilung acht Daten wenig sind. Eine bessere Beurteilung ist mit mehr Daten möglich. Der obige, kleine Datensatz ist als Beispiel gedacht, um die Berechnung mit manuellen Mitteln nachvollziehbar zu machen. (Die obige Tabelle wurde mit SPSS erstellt. SPSS staucht die empirische Verteilungsfunktion etwas nach links, so dass das letzte Datum nicht auf die Linie zu liegen kommt. Dies wirkt sich auf die gesamte Zeichnung aus: bei einer Zeichnung von Hand oder mit Excel brauchen nicht gleichviele Daten ob oder unter der Linie liegen, wie bei der SPSS-Zeichnung. Dies spielt jedoch keine Rolle, da es um die Tendenz geht). Trendbereinigte P-P-Plots Dieses Diagramm zeigt die Differenzen zwischen den beobachteten und den ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 124 erwarteten Werten. Wenn die Stichprobe aus der vermuteten Verteilung stammt, sollten die Punkte in einem horizontalen Streifen um 0 liegen. Es sollte kein Muster zu erkennen sein. (Vorgehen: wir tragen die Punkte ni , Hx i Fx i ab; auch hier gilt, dass bei einer Zeichnung mit Excel nicht genau gleich viele Punkt ob und unter die x-Achse zu liegen kommen, siehe Kommentar oben). Trendbereinigtes P-P-Diagramm von Schraubenlän 0 Abweichung von Normal 0 0 -0 0.0 .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Q-Q-Plots Bei Q-Q-Plots tragen wir, wie es der Name sagt, Quantile ab. Auf der x-Achse tragen wir die geordneten, empirischen Daten ab. Auf der y-Achse tragen wir die 1 theoretischen Quantile der empirischen Verteilungsfunktion Hx i ni 2n ab (für 1 1 i n; 2n zählen wir ab, da z.B. das Standardnormalquantil von 1 nicht definiert 1 ist). Wir berechnen damit x in Fx ni 2n , d.h.berechnen die Werte der Umgkehrfunktion von Fx. Wir tragen somit die Punkte x i , F 1 Hx i in einem Koordinatennetz ab. Entspricht die Verteilung der Daten dem Modell, sollten die Punkte ungefähr auf die y x-Achse zu liegen kommen. (bei Normalverteilungen werden Q-Q-Plots oft für vorgängig z-standardisierte Daten erstellt). Am Beispiel der obigen Daten: Beispiel: ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 125 xi 0.04992132 0.07626878 0.09694301 0.24706014 0.33711828 0.48861922 0.51154522 0.5559821 0.58895487 0.9406725 zi H(zi) -1.20153572 0.05 -1.10825757 0.15 -1.0350644 0.25 -0.50360334 0.35 -0.18476968 0.45 0.3515905 0.55 0.43275563 0.65 0.59007592 0.75 0.70680973 0.85 1.9519989 0.95 Φ-1(H(zi)) -1.644853 -1.03643288 -0.67449037 -0.38532107 -0.12566147 0.12566147 0.38532107 0.67449037 1.03643288 1.644853 Mit Excel werden die Quantile der Standardnormalverteilung durch ”NORMINV(Hx i ; x ; ; 1)” berechnet. Q-Q-Diagramm von Schraubenlängen 1 1 Erwarteter Wert von Normal 1 0 0 0 -0 -.2 0.0 .2 .4 .6 .8 1.0 Beobachteter Wert Auch hier zeigt sich, dass die Daten kaum normalverteilt sind. (Auf Grund der zu den P-P-Plots umgekehrten Beschriftung der Achsen ergibt sich eine spiegelbildliche Punktwolke zu den P-P-Plots). Trendbereinigte Q-Q-Plots Es werden die Punkte x i , x i F 1 Hx i abgetragen: ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 126 Trendbereinigtes Q-Q-Diagramm Schraubenlänge 0 Abweichung von Normal 0 0 -0 -0 0.0 .2 .4 .6 .8 1.0 Beobachteter Wert Die P-P-Plots und die Q-Q-Plots drücken dasselbe auf andere Art aus. Beachten Sie dabei die unterschiedlichen Skalierungen der Achsen. Beim P-P-Plot tragen wir Wahrscheinlichkeiten ab. Entsprechend liegen die Punkte im Intervallen [0,1] [0,1]. Bei Q-Q-Plots hingegen werden Punkte in der Skala der Daten abgetragen. Die Punkte streuen also auf der x-Achse wie die Daten und es kann Punkte im negativen Bereich geben. Mit SPSS: Graphik, Q-Q-Plot (oder P-P-Plot), Variable eingeben, Verteilung wählen, ok. ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 127 Übungen: 1) Erstellen Sie von Hand einen P-P-Plot (Q-Q-Plot) für folgende Daten, für die man eine Normalverteilung vermutet (Gewinne verschieder Anlagen in einem Jahr auf 100 Dollar): 12.1, 13.8, 35.1, 19.3, 17.8, 17.9, 7, 13.3, 14.2, 20.9; 2) Untersuchen Sie mit Hilfe eines P-P-Plots (Q-Q-Plots) (Excel und SPSS), ob der folgenden Datensatz normal verteilt ist (Verkauf pro Kunde in einer Filiale pro Tag): 16.7090764; 20.350331; 9.49757703; 13.0819701; 15.8324089; 11.0518444; 14.2472014; 19.1787961; 15.8355977; 6.96558361; 9.68912787; 17.0146915; 18.0455811; 7.13073542; 12.2620171; 14.0556059; 20.4693469; 10.4759563; 3.49079246; 17.0248672; 8.07377959; 8.51256487; 5.70229396; 15.6089443; 15.4502649; 6.26185394; 8.84991275; 9.5862209; 13.9361382; 22.3721157; 13.2451837; 10.2205918; 9.88363286; 16.9850175; 9.3665414; 11.4631264; 8.93809311; 12.7620113; 13.9647017; 12.0080272; 3) Untersuchen Sie mit Hilfe eines P-P-Plots (Q-Q-Plots) (Excel und SPSS), ob die folgenden Daten exponentialverteilt sind (Schraubenlängen). 0.52828951; 1.14054574; 2.41666192; 2.57346307; 5.21889714; 1.98974451; 2.36506952; 0.1376392; 0.8809238; 0.10367222; 0.78430983; 0.32307721; 0.38162831; 0.5893029; 1.92235677; 0.57235211; 0.89260063; 3.85346309; 0.09012127; 5.30014709; 1.01098906; 0.24083929; 1.0902879; 1.03788597; 0.57558138; 0.60578198; 2.0368181; 0.37201537; 0.34162725; 0.7648745; 0.88494973; 2.88791311; 1.51858196; 0.00340302; 4.76449416; 0.7487179; 0.03009279; 4.17205665; 2.0760818; 0.26855188; 4) Erstellen Sie mit Excel vier uniform verteilte Serien von Zufallszahlen (50 Zufallszahlen), so dass gilt: X U0, 5 Stellen Sie den entsprechenden P-P-Plot (Q-Q-Plot) dar (Excel liefert Zufallszahlen im Intervall [0, 1]). 5) Erstellen Sie mit Excel uniform verteilte Zufallszahlen (50), so dass X U3, 10. Wir nehmen an, Sie wüssten nicht, dass es sich um uniform verteilte Zufallszahlen handelt. Sie vermuten eine Normalverteilung. Erstellen Sie den P-P-Plot (Q-Q-Plot). 6) Erstellen Sie mit Excel einen Plot der Eckpunkte der empirischen Verteilungsfunktion der folgenden Zufallszahlen (Zeit bis zum Ausfallen von Maschinen): 0.00796309; 0.01035715; 0.01887473; 0.04201975; 0.07417555; 0.10848376; 0.19346396; 0.19884847; 0.23938679; 0.31927002; 0.42171485; 0.47483774; 0.47770191; 0.48868425; 0.53928661; 0.58079235; 0.60269043; 0.63258499; 0.64245762; 0.65190357; 0.67447831; 0.92996552; 0.97763892; 1.07643373; 1.10892512; 1.23057078; 1.23139329; 1.29979894; 1.33227431; 1.38814792; 1.62531017; 1.77926689; 1.91046378; 2.0367062; 2.2950552; 2.30601712; 2.31086672; 2.50746966; 2.55770944; 2.60612436; 2.62581743; 2.89392323; 2.96469366; 3.0165084; 3.36895465; 3.45288528; 3.47118886; 3.50256492; 3.60976966; 3.72613945; 3.76135495; 3.8909708; 3.93345011; 3.978998; 3.98298587; 4.53349737; 4.96503135; 5.53090861; 5.58186665; 7.10029001 Zu welcher Vermutung verleitet Sie der Plot. Überprüfen Sie Ihre Vermutung. ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 128 Lösungen 1) Wir erstellen die z-Transformation der Daten (nur nötig, wenn man mit Tabelle arbeitet): (x 17. 14222138; 7. 486475804 zi -0.6669833 -0.44753831 2.39782445 0.29079182 0.09014831 0.09978538 -1.35413302 -0.5154508 -0.39314836 0.49870382 zi -1.35413302 -0.6669833 -0.5154508 -0.44753831 -0.39314836 0.09014831 0.09978538 0.29079182 0.49870382 2.39782445 H (z i) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Φ (z i) m it T abelle 0.0885 0.2546 0.305 0.33 0.3483 0.5359 0.5398 0.6141 0.6879 0.99158 P-P-Diagramm von Betrag Φ (z i) m it Ex cel 0.08784703 0.25239133 0.30311901 0.32724324 0.347105 0.53591538 0.5397427 0.61439467 0.69100598 0.99175362 Trendbereinigtes P-P-Diagramm Betrag 1 0 1 Abweichung von Normal Erwartete Kum. Wahrsch. 0 1 0 0 0.00 .25 .50 .75 1.00 0 -0 0.0 Beobachtete Kum. Wahrsch. .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Q-Q-Diagramm Betrag Trendbereinigtes Q-Q-Diagramm Betrag 30 8 6 4 Abweichung von Normal Erwarteter Wert von Normal 20 10 0 0 10 Beobachteter Wert 20 30 40 2 0 -2 -4 0 10 20 30 40 Beobachteter Wert Die Daten sind vermutlich nicht normalverteilt. Auch hier gilt, dass wir zuwenig Daten haben. Die folgenden Übungen weisen grössere Datensätze auf und müssen entsprechend mit Computer gelöst werden. ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 129 2) Wir erhalten: P-P-Diagramm Verkauf Trendbereinigtes P-P-Diagramm Verkauf 1 0 0 0 Abweichung von Normal Erwartete Kum. Wahrsch. 1 1 0 0 0.00 .25 .50 .75 1.00 0 0 -0 -0 -0 0.0 Beobachtete Kum. Wahrsch. .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Q-Q-Diagramm Verkauf Trendbereinigtes Q-Q-Diagramm Verkauf 30 2 1 1 Abweichung von Normal Erwarteter Wert von Normal 20 10 0 0 Beobachteter Wert 10 20 30 0 -1 -1 0 10 20 30 Beobachteter Wert Die Daten sind nach den P-P- und Q-Q-Plots ziemlich normalverteilt, nach den trendbereichnigten Plots ergibt sich zwar in einem Bereich eine systematische Abweichung. Diese gilt jedoch nicht für den gesamten Bereich. Wir würden die Normalverteilungsannahme gelten lassen (die Daten entstammen einem Satz normalverteilter Zufallszahlen). ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 130 3) Wir erhalten: P-P-Diagramm Schrauben Trendbereinigtes P-P-Diagramm Schrauben 1 0 0 0 Abweichung von Exponential Erwartete Kum. Wahrsch. 1 1 0 0 0.00 .25 .50 .75 1.00 0 0 0 -0 -0 -0 0.0 Beobachtete Kum. Wahrsch. .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Q-Q-Diagramm Schrauben Trendbereinigtes Q-Q-Diagramm Schrauben 7 1 6 1 1 5 Abweichung von Exponential Erwarteter Wert von Exponential .2 4 3 2 1 0 -1 -1 0 1 2 3 4 5 Beobachteter Wert 6 7 0 0 0 -0 -0 -1 -1 -1 0 1 2 3 4 5 6 Beobachteter Wert Die Daten sind exponentialverteilt. 4) Bei der Übung geht es darum, ein Gefühl dafür zu bekommen, wie Zufallszahlen, die zu einer bestimmten Verteilung gehören, um die entsprechende theoretische Verteilung streuen. Die folgenden P-P-Plots sind das Resultat von Zufallszahlen. Entsprechend werden Sie nicht dasselbe Resultat erhalten. Es werden nur die P-P-Plots geliefert: ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 131 P-P-Diagramm von Gleich von Satz 1 Trendbereinigtes P-P-Diagramm Satz 1 1 0 0 1 Abweichung von Gleich Erwartete Kum. Wahrsch. 0 1 0 0 0.00 .25 .50 .75 1.00 0 0 -0 -0 0.0 Beobachtete Kum. Wahrsch. .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Diesen Satz würden wir als uniform bezeichnen (mit Zweifeln jedoch) Trendbereinigtes P-P-Diagramm Satz 2 0 1 0 Abweichung von Gleich Erwartete Kum. Wahrsch. P-P-Diagramm von Gleich von Satz 2 1 1 0 0 0.00 .25 .50 .75 1.00 0 -0 -0 0.0 Beobachtete Kum. Wahrsch. .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Diesen Satz würden wir nicht als uniform verteilt bezeichnen. P-P-Diagramm von Gleich von Satz 3 Trendbereinigtes P-P-Diagramm Satz 3 1 0 0 0 1 Abweichung von Gleich Erwartete Kum. Wahrsch. 0 1 0 0 0.00 .25 .50 Beobachtete Kum. Wahrsch. .75 1.00 0 0 0 -0 -0 -0 0.0 .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Diese Satz würden wir knapp als uniform verteilt bezeichnen. ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 132 P-P-Diagramm von Gleich von Satz 4 Trendbereinigtes P-P-Diagramm Satz 4 1 0 0 0 1 Abweichung von Gleich Erwartete Kum. Wahrsch. 0 1 0 0 0.00 .25 .50 .75 1.00 0 -0 -0 -0 -0 0.0 Beobachtete Kum. Wahrsch. .2 .4 .6 .8 1.0 Beobachtete Kum. Wahrsch. Diesen Satz würden wir als uniform verteilt bezeichnen. 5) Je nach den erhaltenen Zufallszahlen ergibt sich ein anderer P-P-Plot. Es ist durchaus möglich, dass Sie einen Plot erhalten, der mit einer Normalverteilung verträglich wäre. Typisch ist die S-förmige Struktur um die yx-Achse. P-P-Diagramm Verkaufszahlen Trendbereinigtes P-P-Diagramm Verkaufszahle 1 0 Abweichung von Normal Erwartete Kum. Wahrsch. 1 1 0 0 0.00 .25 .50 .75 1.00 0 -0 0.0 Beobachtete Kum. Wahrsch. 10 1 8 1 6 4 2 0 2 Beobachteter Wert 4 6 .4 .6 .8 1.0 Trendbereinigtes Q-Q-Diagramm Verkaufszahl 2 Abweichung von Normal Erwarteter Wert von Normal Q-Q-Diagramm Verkaufszahlen 12 0 .2 Beobachtete Kum. Wahrsch. 8 10 12 0 -1 -1 -2 3 4 5 6 7 8 9 10 Beobachteter Wert ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 133 6) 1.2 1 0.8 0.6 0.4 0.2 0 0 2 4 6 8 Die Daten könnten exponentialverteilt sein. Wir überprüfen dies: P-P-Diagramm Ausfallzeit Trendbereinigtes P-P-Diagramm Ausfallzeit 1 0 0 0 Abweichung von Exponential Erwartete Kum. Wahrsch. 1 1 0 0 0.00 .25 .50 .75 1.00 0 0 0 -0 -0 -0 0.0 Beobachtete Kum. Wahrsch. 10 3 8 2 6 4 2 0 -2 2 Beobachteter Wert 4 6 .6 .8 1.0 Trendbereinigtes Q-Q-Diagramm Ausfallzeit 3 Abweichung von Exponential Erwarteter Wert von Exponential Q-Q-Diagramm Ausfallzeit 0 .4 Beobachtete Kum. Wahrsch. 12 -2 .2 8 10 12 14 2 1 1 0 -1 -2 0 2 4 6 8 10 12 14 Beobachteter Wert Es scheint keine systematische Abweichung zu geben. Die Daten können als ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 134 exponentialverteilt betrachtet werden. ___________________________________________________________________ PPplots.tex 2. HSW Siders P.R. 135 6. Zufallszahlen und stetige Verteilungen Excel liefert uns Zufallszahlen z i aus einer uniform verteilten Zufallsvariable Z U0, 1 (Befehl: Zufallszahl). Es ist manchmal nützlich, anders verteilte Zufallszahlen zur Verfügung zu haben. Um Zufallszahlen x i aus X Ua, b zu erhalten, berechnen wir x i z i b a. (Begründung: bei x i z i b wird 0 zu 0 und 1 zu b. Damit erhalten wir ein uniform verteilte Daten zwischen 0 und b. Nun verschieben wir diese noch um a nach links oder nach rechts). Für nicht uniform verteilte Verteilungen gibt es ein ebenso einfaches Verfahren, sofern die Umkehrfunktion F 1 der Verteilungsfunktion F existiert. Theorem: Seien z i uniform verteilte Zufallszahlen aus Z U0, 1 und F 1 z i x i , dann gilt: die Zufallszahlen x i sind F-verteilt. Beispiel Exponentialverteilung: Die Umkehrfunktion von Fx 1 e x ist: ln1x F 1 x Denn: y 1 e x y 1 e x 1 y e x ln1y lny 1 x ln e x x . Durch Variablentausch erhalten wir das obige Resultat. Für X Exp0. 5 erhalten wir somit: F 1 x ln1x 0.5 Wir berechnen die exponentialverteilten Zufallszahlen e i also durch: ei ln1x i 0.5 Am Beispiel konkreter, geordneter Zahlen: uniform verteile Zufallszahlen exponential verteilte Zufallszahlen (λ = 0.5) 0.06435278 0.12196884 0.21450318 0.25610738 0.31724025 0.42785353 0.66084151 0.73581462 0.84670575 0.94889655 0.13303355 0.2601464 0.48287774 0.59171717 0.76322449 1.11672051 2.16257553 2.66220845 3.75079194 5.94780637 ___________________________________________________________________ Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R. 135 Wir veranschaulichen das Resultat mit einer Graphik. Beweis des Theorems: Es gilt (siehe Graphik): z i Fa z genau dann, wenn F 1 z i x i a. Für die entsprechenden Wahrscheinlichkeiten gilt dann: PZ z Fa PX a F 1 z. Da dies für alle a gilt, haben die Zufallszahlen x i die richtige Verteilung: Fx PX x. q.e.d. F (x ) = 0 .8 x 2 z = F (a) a = F -1 (z) z i Fx i z genau dann, wenn F 1 z i x i a Die Verteilungsfunktion der Standardnormalverteilung ist nicht als Formel angebbar. Entsprechend können wir die Umkehrfunktion nicht berechnen. Wir können jedoch näherungsweise standardnormalverteilte Zufallszahlen mit Hilfe der folgenden Formel berechnen: n x i n2 yj i1 n 12 . n Anzahl der Zufallszahlen, die für die Berechnung von einer standardnormalverteilten Zufallszahl y j verwendet wird; 1 i n ___________________________________________________________________ Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R. 136 (Bei der Berechnung von standardnormalverteilten Zufallszahlen ordnen wir somit nicht jeder uniform verteilten Zufallszahl eine normalverteilte Zufallszahl zu, sondern einer durch Operationen transformierten Summe von uniform verteilten Zufallszahlen eine normalverteilte Zufallszahl! Im nächsten Kapitel wird diese Berechnungsart gerechtfertigt). Übungen 1) Berechnen Sie mit Hilfe von Excel vier Sätze von exponentialverteilten Zufallszahlen (je 50) und erstellen Sie einen Plot der empirischen Verteilungsfunktion. Diskutieren Sie die Resultate mit Ihrem Tischnachbarn. ( 2 2) Berechnen Sie mit Hilfe von Excel einen Satz (60) von F-verteilten Zufallszahlen, wobei F im Intervall, wo Fx 0 und Fx 1 durch F X x 0. 005x 2 bestimmt ist. Zeichnen Sie einen Plot der empirischen Verteilungsfunktion und beurteilen Sie die Anpassung an das Modell F X x 0. 005x 2 . 3) Berechnen Sie einen Satz von 40 normalverteilten Zufallszahlen, indem sie jeweils einen Satz von 50 uniform verteilten Zufallszahlen (Excel) verwenden. Erstellen Sie den Plot der Eckpunkte der empirischen Verteilungsfunktion und beurteilen Sie die Anpassung an das Modell. 4) Als Vorarbeit für das nächste Kapitel: Berechnen Sie (a) 20 Sätze von exponentialverteilten Zufallszahlen (je 50, 1 (b) Berechnen Sie den empirischen Mittelwert x i .für jeden der 20 Sätze (c) Zeichnen Sie einen Plot der empirischen Verteilungsfunktion der x i und kommentieren Sie das Ergebnis. (d) Berechnen Sie PX 0. 7. (Verwenden Sie die empirischen Werte für den Mittelwert und die Standardabweichung). (e) Berechnen Sie P0. 9 X 1. 1. (f) Sind die i normalverteilt? 5) Eine Spanplattenfabrik misst während einiger Zeit die Dicke der produzierten Spanplatten und kommt zu folgendem Ergebnis: (siehe Exceldatei: Aufgabe 5 Zufallszahlen). a) Finden Sie eine passende Verteilung für die Daten. b) Platten, die dünner als 1. 9 cm sind, können dem Auftraggeber nicht verkauft werden. Wie gross ist der Ausschuss bei künftiger Produktion im Durchschnitt? c) Berechnen Sie P1. 85 cm X 2. 15 cm 6) Eine Firma überlegt die Anschaffung von neuen Maschinen, um die Verluste durch ungenaue Verpackung zu verringern. Dabei geht es um die Abfüllung von Kaffee. Die Gläser sollen möglichst genau 500 g Kaffee enthalten. Gläser, die weniger als 495 Gramm enthalten, dürfen nicht verkauft werden. Gläser, die mehr als 500 g enthalten, verbleiben im Verkauf, führen aber zu Verlusten, da nur 500 g verrechnet werden dürfen. Auf Grund eines Experimentes wurden folgende Daten für die Maschine A und folgende für die Maschine B ermittelt (Siehe Excel-Datei Aufgabe 6 Zufallszahlen). Die Maschine A kostet 50’000, die Maschine B 70’000. Ab welcher Menge ist die Maschine B günstiger, wenn das Gramm nicht berechneten Kaffees 0.007 Fr. kostet und ein ausgemustertes Glas Kosten von 0.02 Franken verursacht. 7) Berechnen Sie die mittlere Abweichung von exponentialverteilten Zufallszahlen von ___________________________________________________________________ Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R. 137 ihrem Modell ( Mittelwert der Differenzen zwischen den Werten der theoretischen und der empirischen Verteilungsfunktion) ( 0. 5 für 10, 50, 100 und 1000 Daten. Diskutieren Sie das Resultat. Lösungen 1 Siehe Exceldatei: Lösung Übung 1 Zufallszahlen 2 Fx 0. 005x 2 bestimmt die Funktion im folgenden Intervall: [0, 14.142], da Fx 1 0. 005x 2 nach x aufgelöst 14. 142 ergibt. Zudem verläuft die Kurve durch 0. x . Um aus uniform verteilten Wenn Fx 0. 005x 2 , dann ist F 1 x 2 0.005 zi Zufallszahlen z i F-verteilte zu erhalten, berechnen wir: x i 2 0.005 14. 142 z i Für eine Lösung mit spezfischen Zufallszahlen siehe Exceldatei: Lösung Übung 2 Zufallszahlen 3 Siehe Exceldatei: Lösung Übung 3 Zufallszahlen 4) Siehe Exceldatei: Lösung Übung 4 Zufallszahlen (c) Der Mittelwert der Mittelwerte stellt eine Realisierungen einer Zufallsvariable dar. Ebenso die empirische Varianz der Mittelwerte. Für den Mittelwert der Mittelwerte erhalten wir: 1. 001215947 und für die Standardabweichungder Mittelwerte 0. 118842402. Die Punkte (siehe Zeichnung) passen zu einer Normalverteilung. Punkteplot der Verteilungsfunktion P-P-Plot 1.2 1 1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 0 0.5 (d) PX 0. 7 1 0.71.001215947 0.118842402 1.5 0 0 0.2 0.4 0.6 0.8 1 0. 005629082 (e) P0. 8 X 1. 2 PX 1. 2 PX 0. 8 0. 952803829 0. 045215084 0. 907 59 (f) Die i Daten passen zu einer Normalverteilung: ___________________________________________________________________ Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R. 138 P - P - P l o t ( n o r m a l) empirische Verteilungsfunktion -1.5 -1.3 -1.1 -0.9 -0.7 1 0 .9 0 .8 0 .7 0 .6 0 .5 0 .4 0 .3 0 .2 0 .1 0 1 0.8 0.6 0.4 0.2 0 -0.5 0 0 .2 0 .4 0 .6 0 .8 5 Wir erhalten den P-P-Plot: 1 0 .9 0 .8 0 .7 0 .6 0 .5 0 .4 0 .3 0 .2 0 .1 0 0 0 .2 0 .4 0 .6 0 .8 1 Die Daten sind offensichtlich normalverteilt. Entsprechend können wir die Normalverteilung verwenden, um die entsprechenden Wahrscheinlichkeiten zu berechnen. 1.92.0066 0. 184202614 (ca: 18.4%) b) PX 1. 9 cm 0.118514961 2.152.0066 1.852.0066 c) P1. 85 cm X 2. 15 cm 0.118514961 0.118514961 0. 886855468 0. 093192047 0. 793 66 6) Ab einer Menge von 6259540 Gläsern. Bei den auszusondernden Gläsern genügt es, die Menge der produzierten Gläser * PX 498 * die Kosten pro Glas zu rechnen. Bei den Kosten, die durch Überfüllung verursacht werden, begnügen wir uns mit einer Näherung: Wir berücksichtigen nur ganze Gramm. Dazu müssen wir Pn 1 X n für alle relevanten n : 501, 502, 503, etc berechnen. Diese Zahlen multiplizieren wir mit der Anzahl Gläser, um den Anteil der Gläser zu erhalten, die in die entsprechende Kategorie fallen. Die Anzahl der Gläser pro Kategorie multiplizieren wir dann mit der Anzahl Gramm, die zuviel sind. Dieses Resultat mulitplizieren wir mit den Kosten pro Gramm. Das Endresultat wurde durch Versuchen ermittelt (siehe Lösung Übung 6 Zufallszahlen). 7) siehe Excel-Datei: Lösung Übung 7 Zufallszahlen. Für das konkrete Beispiel erhalten wir die folgenden mittleren Abweichungen: für 10: 0.086775863; für 50: 0.041784468; für 100: 0.024725104; für 1000: 0.006701792 Je mehr Daten wir haben, desto kleiner ist die mittlere Abweichung vom Modell (Gesetz der grossen Zahlen). Daraus folgt dann: je mehr Daten wir haben, desto kleiner muss die mittlere Abweichung sein, damit wir die Daten als zu einem Modell passend beurteilen ___________________________________________________________________ Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R. 139 1 dürfen. Lernziele - P-P-Plots von Hand, mit Excel und mit SPSS zeichnen können. Erläutern können, was P-P-Plots ausdrücken. - Q-Q-Plots mit SPSS zeichnen können. Erkläutern können, was Q-Q-Plots ausdrücken. - Wissen, dass (i) Daten aus einer spezifischen Verteilung immer um die ideale Verteilung streuen. Eine zu genaue Anpassung ist unwahrscheinlich und deutet auf Manipulationen hin. (ii) solange es nicht deutlich systematische Abweichungen gibt (z.B. S-Form), kann man i.A. das Modell als zu den Daten passend betrachten (iii) je mehr Daten, desto kleiner muss die Streuung um die x-y-Achse sein. - Wissen, dass für beliebig verteilte Datensätze mit Hilfe von Zufallszahlen entsprechend verteiltes Datenmaterial ”fabriziert” werden kann, sofern die Umkehrfunktion der Verteilungsfunktion existiert. Diese existiert immer, wenn die Verteilungsfunktion in geschlossener Form mit Hilfe einer Gleichung ausgedrückt werden kann und wenn sie strikt monoton steigend ist. Für einfache Funktionen die Umkehrfunktion berechnen und entsprechend verteilte Datensätze mit Hilfe von Zufallszahlen produzieren können. - Uniform-, exponential- und normalverteilte Datensätze mit Hilfe von Zufallszahlen von Hand und mit Hilfe von Excel herstellen können. ___________________________________________________________________ Zufallszahlen und Verteilungen.tex 2. HSW Siders P.R. 140 7. Verteilung des Mittelwertes Bei der Einführung von Zufallsvariablen haben wir gesehen, dass nicht nur die Ausprägungen von Daten als Werte von Zufallsvariablen betrachtet werden können, sondern auch etwa Kennzahlen wie der Mittelwert, die Varianz, die Standardabweichung oder der Median. Ebenso könnte man weitere Zahlen, die auf Grund von Daten berechnet werden, als Werte von Zufallsvariablen auffassen (z.B. die Summe der quadrierten Abweichungen der Daten vom Modell, die durchschnittliche Abweichung der Daten vom Modell, etc.). Kennen wir von solchen Zufallsvariablen die Verteilung, ist dies für die Teststatistik, wie wir sehen werden, von besonderer Bedeutung. Um entsprechende Modelle und Methoden einzuführen, sind ein paar Vorüberlegungen und einige Theoreme nötig. Das Produkt von Ereignissen aus verschiedenen Stichprobenräumen Wir betrachten ein Beispiel: Wie gross ist die Wahrscheinlichkeit, dass beim Werfen zweier Würfel, der erste die 6 und der zweite Würfel die 5 zeigen? Wir können die Situation von verschiedenen Seiten her anschauen: (1) Der Stichprobenraum S besteht aus den Zahlenpaaren 1,1, 1,2,...,6,6 (d.h. S i, j : i, j N 6 . Es gilt:|S| 36. Das Ereignis E, ”Es werden eine 6 und eine 5 in dieser Reihenfolge geworfen”, besteht aus dem Element 6, 5 S. Wir setzen gleiche Wahrscheinlichkeit der Elementarereignisse voraus. Wir haben also 36 mögliche und 1 günstiges Ergebnis, d.h. PE 361 . (2) Wir können die Fragestellung aber auch unter einem anderen Gesichtspunkt betrachten: Sei S 1 1, 2, 3, 4, 5, 6 der Stichprobenraum fürs Werfen mit dem ersten Würfel und S 2 1, 2, 3, 4, 5, 6 der Stichprobenraum fürs Werfen mit dem zweiten Würfel. Damit gilt S S 1 S 2 (S ist das kartesische Produkt von S 1 und S 2 ). Eine bestimmte Teilmenge der Ereignisse von S können wir unmittelbar mit Hilfe der Ereignisse von S i ausgedrücken. Ist E 6, 5 S, so ist mit E 1 6 und E 2 5, E E 1 E 2 6 5. Fürs Beispiel gilt nun offenbar: PE 361 16 16 P 1 E 1 P 2 E 2 . wobei P i die Wahrscheinlichkeitsverteilungen auf PS i sind (PS i Potenzmenge von S i . Ist E 2, 3 , 5, 6 , 2, 6 , 5, 3 S , so gilt: PE 364 P 1 2, 5 P 2 3, 6 26 26 364 . Wobei wiederum gilt: E E 1 E 2 2, 5 3, 6. PE 1 E 2 P 1 E 1 P 2 E 2 gilt nicht für das kartesische Produkt beliebiger Stichprobenräume, sondern nur dann, wenn die Ereignisse der unterschiedlichen Stichprobenräume sich gegenseitig nicht beeinflussen. Würde sich beim Würfeln von 6 im ersten Wurf für das Würfeln einer 5 im zweiten Wurf eine andere Wahrscheinlichkeit ergeben als beim Würfeln einer 5 im ersten Wurf, so wären die Ereignisse nicht unabhängig. Dies führt uns zur folgenden Definition: ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 141 Definition: Für A S 1 und B S 2 und P i Wahrscheinlichkeitsverteilung auf PS i : A und B sind unabhängig genau dann, wenn PA B P 1 A P 2 B. Diesen Unabhängigkeitsbegriff verwenden wir auch für Zufallsvariablen: Definition: Seien P i Wahrscheinlichkeitsverteilungen auf die Wertebereiche S X i der Zufallsvariablen X i . Zwei Zufallsvariablen X 1 und X 2 sind unabhängig, genau dann, wenn für alle Ereignisse A S X 1 und B S X 2 gilt: PA B P 1 A P 2 B. Man beachte, dass es Ereignisse von S (S i, j : i, j N 6 gibt, die sich nicht unmittelbar durch E 1 E 2 mit E 1 S 1 und E 2 S 2 ausdrücken lassen. z.B. Ist E 2, 3 , 5, 6 S, so finden wir keine Teilmengen von S 1 und S 2 , so dass E deren kartesisches Produkt ist. Es gilt jedoch: E 2 3 5 6 und PE 362 P 1 2 P 2 3 P 1 5 P 2 6. Alle Ereignisse von S lassen sich derart als Vereinigungsmengen von kartesischen Produkten E 1 E 2 (mit E 1 S 1 , E 2 S 2 ausdrücken. Beispiele: (1) Wir betrachten drei Urnen. Die erste enthalte 50 Steine, die von 1 bis 50 durchnummeriert sind. Die zweite enthalte 35 Steine, die von 100 bis 134 durchnummeriert sind, die dritte enthalte 10 Steine, die von 1001 bis 1010 durchnummeriert sind. Wir setzen jeweils gleiche Wahrscheinlichkeiten der Elementarereignisse voraus. Wir ziehen aus jeder Urne einen Stein. Wieviel beträgt die Wahrscheinlichkeit, 25, 104, 1002 zu ziehen?. P 25, 104, 1002 P25 104 1002. Es ist vernünftig, davon auszugehen, dass die Ergebnisse der verschiedenen Züge sich gegenseitig nicht beeinflussen. Somit gilt dann: P25 104 1002 P 1 25 P 2 104 P 3 1002 501 351 101 1 17 500 (2) Es werde aus einer Urne mit 99 Steinen (mit 99 verschiedenen Zahlen i: i N 99 zweimal je ein Stein gezogen (mit Zurücklegen, gutes Durchmischen nach jedem Zug). Wie hoch ist die Wahrscheinlichkeit eine 3 und eine 4 zu erhalten (Reihenfolge spielt keine Rolle). S i N 99 . S S 1 S 2 . E 3, 4 , 4, 3 3 4 4 3 PE P3 4 P4 3 P 1 3 P 2 4 P 1 4 P 2 3 1 1 1 2 991 99 99 9801 (wir setzen wiederum voraus, dass die Ergebnisse 99 des ersten Zuges die Wahrscheinlichkeit des Ergebnisses des zweiten Zuges nicht beeinflussen). Die Summe von Zufallsvariablen Eine besondere Rolle für die Verteilung von Mittelwerten spielt die Summe von ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 142 Zufallsvariablen, berechnen wir doch Mittelwerte u.a. durch Summierung der Daten eines Datensatzes. Bei der Summenbildung im Rahmen der Wahrscheinlichkeitstheorie interessiert dabei die Wahrscheinlichkeit der jeweiligen Summen, unabhängig vom Zustandekommen dieser Summe. Entsprechende Beispiele haben wir bereits gesehen. Seien X i (i 1, 2 die Zufallsvariablen, die den verschiedenen Augenzahlen beim Würfeln (zwei Würfel) jeweils die entsprechende Zahl zuordnen. Wir setzen gleiche Wahrscheinlichkeit der Elementarereignisse der S i voraus und Unabhängigkeit der Zufallsvariablen. Es ist möglich, spezifische Summen auf verschiedene Arten zu erlangen: so gilt z.B. 1 5 2 4 6. Als Zufallsvariable Š (Š für ”Summe”) erhalten wir damit: Š 1, 1 , 2 , 1, 2 , 3 , 1, 3 , 4 , 1, 5 , 6 , 1, 6 , 7 , 2, 1 , 3 , 2, 2 , 4 , 2, 3 , 5 , 2, 4 , 6 , 2, 5 , 7 , 2, 6 , 8 , 3, 1 , 4 , 3, 2 , 5 , 3, 3 , 6 , 3, 4 , 7 , 3, 5 , 8 , 3, 6 , 9 , 4, 1 , 5 , 4, 2 , 6 , 4, 3 , 7 , 4, 4 , 8 , 4, 5 , 9 , 4, 6 , 10 , 5, 1 , 6 , 5, 2 , 7 , 5, 3 , 8 , 5, 4 , 9 , 5, 5 , 10 , 5, 6 , 11 , 6, 1 , 7 , 6, 2 , 8 , 6, 3 , 9 , 6, 4 , 10 , 6, 5 , 11 , 6, 6 , 12 Somit definieren wir die Addition von Zufallsvariablen nicht mit Hilfe der ”punktweisen Addition” (d.h. f gx fx gx), sondern mit: X 1 x X 2 y X 1 X 2 x, y x y. (für x S 1 und y S 2 . Die Wahrscheinlichkeitsfunktion von Š ist nun bestimmt durch 1 (i) i, j 36 ( P i, j (Unabhängigkeit der Zufallsvariablen und gleiche Wahrscheinlichkeit der Elementarereignisse) und (ii) Anzahl der geordneten Paare, die eine spezifische Summe ergeben. Der Wertebereich von Š X 1 X 2 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 Im obigen Fall erhalten wir die folgende Wahrscheinlichkeitsfunktion: 3 2 2, 361 , 3, 36 , 4, 36 , 5, 364 , 6, 365 , 7, 366 , 3 4 8, 365 , 9, 36 , 10, 36 , 11, 362 , 12, 361 . W-Funktion der Zufallsvariable Xi (Würfel) W-Funktion der Zufallsvariable X1+X2 0.16 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0.14 0.12 P(x) P(x) 0.18 0.1 0.08 0.06 0.04 0.02 0 0 1 2 3 4 x 5 6 7 0 1 2 3 4 5 6 7 8 9 10 11 12 13 x ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 143 Für die Wahrscheinlichkeitsverteilung der Summe von Zufallsvariablen berechnen wir somit: Theorem 1: Seien X 1 und X 2 zwei Zufallsvariablen, dann ist die Verteilung von s Š X 1 X 2 bestimmt durch PŠ s PX 1 k und X 2 s k k0 Wenn s 5, müssen wir somit alle k berücksichtigen, so dass k s k s. Wenn 1, 2, 3, 4, 5 als Werte des Wertebereichs von S vorkommen, wären dies 1 (denn 1 4 5); 2 (denn 2 3 5); 3 (denn 3 2 5); 4 ( denn 4 1 5). Im Würfelbeispiel gehört die Summe zweier Zufallsvariablen nicht zur gleichen Familie von Verteilungen wie die Summanden. Dies gilt jedoch nicht für alle Verteilungen. Wir können darauf hinweisen, dass die Summe zweier unabhängiger, bernoulli-verteilter Zufallsvariable X i mit X i B1, 0. 5 eine Zufallfallsvariable ergibt, die binomialverteilt ist: Der Wertebereich von X i 0, 1. Definitionsbereich von X 1 X 2 0, 0 , 0, 1 , 1, 0 , 1, 1 Š X 1 X 2 0, 0 , 0 , 0, 1 , 1 , 1, 0 1 , 1, 1 , 2 . Wertebereich von Š 0, 1, 2. Wir erhalten die folgende Wahrscheinlichkeitsfunktion: (wir setzen Gleichwahrscheinlichkeit der Elementarereignisse von X i und Unabhängigkeit von X i voraus): 0, 14 , 1, 12 , 2, 14 Damit gilt: Š X 1 X 2 B2, 0. 5, wie Sie kontrollieren können. Ohne Beweis halten wir für unabhängige Zufallsvariablen X i fest: Theorem 2: Für X 1 Bn, p und X 1 Bm, pgilt: X 1 X 2 Bm n, p Für X 1 P 1 und X 2 P 2 gilt: X 1 X 2 P 1 2 Für X 1 N0, 21 und X 2 N0, 22 gilt: X 1 X 2 N0, 21 22 Es folgen ein paar für die weitere Entwicklung wichtige Theoreme: Dabei verwenden wir statt X die Bezeichnung EX und statt X die Bezeichung VX. WX ist der Wertebereich der Zufallsvariable X. Theorem 3: Ea a (a ist eine beliebige reelle Zahl). Beweis: a ist eine konstante Funktion. Es handelt sich somit um eine Zufallsvariable, die allen Werten des Stichprobenraums dieselbe Zahl a zuordnet. In die Definition EX xPX x eingesetzt erhalten wir: xWX Ea aPX a a PX a a xWX xWX Denn PX a 1 (laut Wahrscheinlichkeitstheorie ist die Summe der xWX Wahrscheinlichkeiten aller Werte der Zufallsvariable bei diskreten Zufallsvariablen mit 1 identisch). ) Theorem 4: EEX EX ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 144 Beweis: EX ist eine Konstante. Laut Theorem 3 gilt damit der Satz. ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 145 Theorem 5: EbX bEX (b R Beweis: EbX bxPbX bx xWX b xPbX bx xWX Nun ist bX bx X x . Somit gilt dann: b xPbX bx b xPX x bEX. xWX xWX Ohne Beweis halten wir fest: Theorem 6: EX Y EX EY Theorem7: Ea bX a bEX Beweis: Ea bX Theorem 6 (a, b R, b 0 Ea EbX Theoreme 3,5 a bEX Theorem 8: EXEY EYEX Beweis: Da EY eine Konstante ist, gilt der Satz unmittelbar mit Satz 3 und der Kommutativität der Multiplikation. Theorem 9: VX EX EX 2 Beweis: (i) VX x EX 2 PX x xWX (ii) Ex EX 2 x EX 2 P X EX 2 x EX 2 2 xWX Nun ist: X EX x EX 2 X EX x EX X x Damit erhalten wir: x EX 2 P X EX 2 x EX 2 xWX x EX 2 PX x xWX VX siehe (i) Theorem 10: VX EX 2 EX 2 Beweis: VX EX EX 2 E X 2 2XEX EX 2 Theorem 6 2 EX 2 E2XEX EEX 2 EX 2 2EXEX EX (der zweite Ausdruck durch Anwendung der Theorem 3 und 5. EX 2 ist eine Konstante. Somit ist EEX 2 EX 2 . Somit gilt: EX 2 2EXEX EX 2 EX 2 2EX 2 EX 2 EX 2 EX 2 Theorem 11: Va 0 (a R Beweis: Va Ea 2 Ea 2 a 2 a 2 0 Theorem 12: VbX b 2 VX (b R ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 146 Beweis: VbX EbX 2 EbX 2 Eb 2 X 2 bEX 2 b 2 EX 2 b 2 EX 2 b 2 EX 2 EX 2 b 2 VX. Theorem 13: Va bX b 2 VX (b, a R, b 0 Beweis: Va bX EEa bX 2 Ea bX 2 (i) Ea bX 2 Ea 2 2abX b 2 X 2 a 2 2abEX b 2 EX 2 (ii) Ea bX 2 a bEX 2 a 2 2abEX b 2 EX 2 Somit gilt: Ea bX 2 Ea bX 2 b 2 EX 2 b 2 EX 2 b 2 EX 2 EX 2 b 2 VX Definition Kovarianz: KOVX 1 X 2 EX 1 X 2 EX 1 EX 2 Theorem 14: KOVX 1 X 1 VX 1 Beweis: Folgt unmittelbar aus der Definition der Kovarianz durch Einsetzen. Theorem 15: KOVX 1 X 2 0 genau dann, wenn EX 1 X 2 EX 1 EX 2 Beweis: folgt unmittelbar aus der Definition: Definition:Wir sagen: X 1 und X 2 sind unkorreliert genau dann, wenn KOVX 1 X 2 0. Für die Varianz können wir folgendes Resultat festhalten: Theorem 16: VX 1 X 2 VX 1 VX 2 KOVX 1 X 2 Beweis: VX 1 X 2 EX 1 X 2 2 EX 1 X 2 2 EX 21 2X 1 X 2 X 22 EX 1 EX 2 2 EX 21 2EX 1 X 2 EX 22 EX 1 2 2EX 1 EX 2 EX 2 2 EX 21 EX 1 2 EX 22 EX 2 2 2EX 1 X 2 EX 1 EX 2 VX 1 VX 2 2KOVX 1 X 2 . Theorem 17: Wenn X 1 und X 2 unkorreliert sind, dann VX 1 X 2 VX 1 VX 2 Beweis: Seien X 1 und X 2 unkorreliert. Damit gilt: KOVX 1 X 2 0 Und VX 1 X 2 VX 1 VX 2 2KOVX 1 X 2 VX 1 X 2 VX 1 VX 2 Ohne Beweis halten wir fest: Theorem 18: Wenn X 1 und X 2 unabhängig sind, dann gilt: EX 1 X 2 EX 1 EX 2 Theorem 19: Wenn X 1 und X 2 unabhängig sind, dann sind X 1 und X 2 unkorreliert. ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 147 Beweis: Folgt unmittelbar aus Satz 18 und 14. Die Umkehrung gilt nicht: Unkorrelierte Zufallsvariablen können abhängig sein. Damit müssen die beiden Begriffe der Unabhängigkeit und der Korreliertheit sauber auseinandergehalten werden. Die wichtige Folgerung aus Theorem 19 ist: bei unabhängigen Zufallsvariablen verhalten sich die Varianzen additiv. Diese Resultate werden wir verwenden, um interessante Resultate für die Verteilung des Mittelwertes von Zufallsvariablen zu erhalten. Wahrscheinlichkeitsverteilung des Mittelwertes von Zufallsvariablen Von besonderem Interesse für die Teststatistik ist die Verteilung des Mittelwertes. Wollen wir z.B. eine neue Mastmethode beurteilen, möchten wir das Durchschnittsgewicht der Schweine, die nach zwei verschiedenen Methoden gemästet wurden, vergleichen. Kennen wir die Wahrscheinlichkeitsverteilung des Mittelwerts von Zufallsstichproben, so können wir eventuelle Unterschiede mit Hilfe des Wahrscheinlichkeitsmodells beurteilen. Sind die bestehenden Unterschiede durch Zufall erklärbar oder ist deren zufälliges Zustandekommen eher unwahrscheinlich? Wir können in einer Zufallsstichprobe von n Elementen jede der Ausprägungen als Realisierung eine Zufallsvariable betrachten. Somit entsprechen den n Ausprägungen einer Stichprobe n Zufallsvariablen X i . Bei Zufallsstichproben können wir zudem oft voraussetzen, dass die Zufallsvariablen unabhängig sind. Der Mittelwert der Stichprobe kann dabei als Realisierung einer neuen Zufallsvariable X betrachtet werden. Es wäre nun günstig, wenn wir die Wahrscheinlichkeitsverteilung der Zufallsvariable X aus den Wahrscheinlichkeitsverteilungen der n unabhängigen Zufallsvariablen X i berechnen könnten. In der Tat haben wir für einfache Beispiele entsprechende Berechnungen bereits durchgeführt. Seien X 1 und X 2 zwei Zufallsvariablen mit den Werten {1,2,3,4,5,6} (Werfen je eines Würfels, es werden als Zahl die Anzahl der Augen zugeordnet). Wir setzen die gleiche Wahrscheinlichkeit der Elementarereignisse von S i und die Unabhängigkeit der Ereignisse aus den beiden Stichprobenräumen voraus ( Unabhängigkeit der beiden Zufallsvariablen). Wir erhalten denselben Mittelwert, wenn wir die selben Summen der beiden Würfe erhalten: so ist z.B. 25 16 . 2 2 Entspechend ergeben sich für verschiedene Mittelwerte unter Umständen unterschiedliche Wahrscheinlichkeiten des Eintreffens. Wir zählen die möglichen Varianten und ihre Wahrscheinlichkeiten auf: ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 148 Mittelwerte x 11 2 12 2 13 2 14 2 15 2 16 2 26 2 36 2 46 2 56 2 66 6 P X x Paare 1 1, 1 1. 5 1, 2 , 2, 1 2 24 2 3 3. 5 4 4. 5 5 22 2 1, 3 , 3, 1 , 2, 2 2. 5 1, 4 , 4, 1 , 2, 3 , 3, 2 24 33 2 2 25 2 34 2 35 44 2 2 45 2 55 2 1, 5 , 5, 1 , 2, 4 , 4, 2 , 3, 3 2, 5 , 5, 2 , 1, 6 , 6, 1 , 3, 4 , 4, 3 2, 6 , 6, 2 , 3, 5 , 5, 3 , 4, 4 3, 6 , 6, 3 , 4, 5 , 5, 4 4, 6 , 6, 4 , 5, 5 5. 5 5, 6 , 6, 5 6 6, 6 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Wir zeichnen die Wahrscheinlichkeitsfunktion: Wahrscheinlichkeiten Wahrscheinlichkeitsfunktion des Mittelwertes von X1 und X2 0.2 0.15 0.1 0.05 0 0 2 4 6 8 Mittelwerte Wir fassen damit X 2 als eine Zufallsvariable auf. Deren Definitionsbereich S ist das kartesische Produkt von S 1 und S 2 (S S 1 S 2 und deren Funktionswerte die Mittelwerte der Elemente von S (d.h. die möglichen Mittelwerte des Wurfes zweier Würfel): {1,1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6}. Oben haben wir die Wahrscheinlichkeitsfunktion der Zufallsvariable X 2 berechnet. Wir nennen X 2 ”den Mittelwert der 2 Zufallsvariablen X i ”. Zu beachten ist, dass X 2 eine Funktion ist. Diese nimmt konkrete Mittelwerte von Datensätzen (die aus zwei Daten bestehen) zufällig als Werte an. Ebenso könnten wir nun die Wahrscheinlichkeitsfunktion des Mittelwertes dreier oder mehrerer gleichverteilter und unabhängiger Zufallsvariablen berechnen:Für 3 ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 149 Zufallsvariablen mit der obigen Art ergibt sich das folgende Bild: Wahrscheinlichkeitsfunktion der Mittelwerte dreier uniform verteilter Wahrscheinlichkeiten Zufallsvariablen X i (S i 1, 2, 3, 4, 5, 6 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 2 4 6 8 Mittelwerte Es fällt auf, dass sich die Verteilung einer Normalverteilung nähert. Wir kommen darauf in Kürze zurück. Wir können das verwendete Verfahren nun allgemeiner betrachten. Um die Zufallsvariable ”Mittelwert” zu berechnen, müssen wir die Summe X 1 X 2 der beiden Zufallsvariablen berechnen und diese mit 12 multiplizieren (dabei multiplizieren wir die Funktionswerte von X 1 X 2 mit 12 . Wir erhalten: X 2 12 X 1 X 2 oder X 2 x, y 1 2 X 1 X 2 x, y 1 2 x y xy 2 Dies führt uns zur folgenden Definition des Mittelwertes von n Zufallsvariablen: Definition: Der Mittelwert X n von n gleichverteilten Zufallsvariablen X i wird n definiert als: X n 1n X i . i1 Man beachte: X n ist eine Zufallsvariable (somit eine Funktion!) und nicht eine Zahl. Die Werte der Funktion X n sind die Mittelwerte x , die den möglichen Datensätzen mit n Daten zugeordnet sind (der Definitionsbereich von X n enthält somit n-Tupel von Daten!). . Für gleichverteilte Zufallsvariablen erhalten wir ein paar sehr handliche Formeln. Definition: Zwei Zufallsvariablen X 1 und X 2 sind gleichverteilt, genau ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 150 dann, wenn F X 1 F X 2 Sind die Zufallsvariablen X i gleichverteilt, folgt aus Theorem 6: n Theorem 20: Seien X i gleichverteilt. Dann gilt: E X i nEX i n Beweis: E X i i1 i1 n EX i . Da die X i gleichverteilt sind, gilt: EX i EX j für Theorem 6 i1 n alle 1 i, j n . Somit gilt: EX i nEX i . i1 Dies führt uns zum folgenden fürs weitere Vorgehen wesentliche Theorem: Theorem 21: Bei n gleichverteilten X i gilt: EX i EX n Beweis: EX i E 1 n n Xi i1 n n EX i Definition X n 1 n nEX i n Theorem 20 E X i i1 Theorem 5 EX n Das Theorem besagt: Der Erwartungswert des Mittelwerts gleichverteilter Zufallsvariablen fällt mit dem Erwartungswert der einzelnen Zufallsvariable zusammen. Theorem 22:Wenn die Zufallsvariablen X 1 und X 2 unabhängig und gleichverteilt sind, gilt: VX 1 X 2 VX 1 VX 2 2VX 1 2VX 2 Beweis: VX 1 X 2 VX 1 VX 2 2KOVX 1 X 2 wegen Unabhängigkeit VX 1 VX 2 2VX 1 (da gleichverteilte Zufallsvariablen dieselbe Varianz haben). Theorem 23: Für die Summe von n unabhängigen und gleichverteilten Zufallsvariablen X i n n i1 i1 gilt: V X i VX i nVX i Beweis: Verallgemeinerung von Satz 22. Statt ”n unabhängig und gleichverteilte Zufallsvariablen” verwenden wir künftig auch ”n i.i.d.-Zufallsvariablen” (i.i.d. independant and identically distributed). Das folgende Theorem ist von fundamentaler Bedeutung: Theorem 24: Seien X i i.i.d., dann gilt: VX n Beweis: VX n 1 n2 n V Xi i1 n Definition X n Theorem 23 V 1n X i 1 n2 i1 nVX i VX i n Theorem 12 1 n VX i ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 151 Das Theorem besagt: Die Varianz des Mittelwertes von n i.i.d.-Zufallsvariablen ist n-mal kleiner als die Varianz der einzelnen Zufallsvariable. Für n gegen Unendlich wird die Varianz 0. Damit haben wir - bis auf den Beweis der Theoreme 6 und 18 eine Variante des Gesetzes der grossen Zahlen bewiesen (für n gegen Unendlich strebt die Wahrscheinlichkeit, dass der Mittelwert mehr als ein beliebig kleines 0 vom Erwartungswert abweicht, gegen 0). Der zentrale Grenzwertsatz Wir haben oben festgestellt, dass die Wahrscheinlichkeitsfunktion der Verteilung des Mittelwertes dreier gleich und uniformverteilter, unabhängiger Zufallsvariablen der Dichtfunktion einer Normalverteilung ähnelt. Wir betrachten noch die entsprechenden Verteilungsfunktionen: Wahrscheinlichkeiten 1.2 1 Verteilungsfunktion Mittelwerte 0.8 0.6 Verteilungsfunktion Standard-Normal 0.4 0.2 0 -4 -2 0 2 4 Z-transformierte Mittelwerte Ohne Beweis formulieren wir nun den für die Test-Statistik wichtigen zentralen Grenzwertsatz: X n sei der Mittelwert von n i.i.d.- Zufallsvariablen X i . Theorem 22: Für beliebig verteilte i.i.d. Zufallsvariablen X i : Für steigendes n nähert sich X EX die Verteilung der Zufallsvariable Z n n VX i beliebig nahe einer n i Standardnormalverteilung. Alternative Forumulierung. F Z n x x für n . Z n X n EX i VX i n stellt die z-Transformation von X n dar, da VX i n die Varianz von X n und ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 152 EX i der Erwartungswert von X n ist. Der zentrale Grenzwertsatz begründet u.a. die bedeutende Rolle der Normalverteilung in der Statistik. Betrachten wir nun jedes einzelne Datum eines Datensatzes als Realisierung ( Wert) einer Zufallsvariablen, können wir den empirischen Mittelwert des Datensatzes als Realisierung der Zufallsvariable X n betrachten. Können wir zudem davon ausgehen, dass die Zufallsvariablen i.i.d. sind (z.B. im Falle einer Zufallsstichprobe, wo jedes Datum dieselbe Wahrscheinlichkeit hat, in die Stichprobe aufgenommen zu werden), so kennen wir bis auf die Parameter das Modell für die Verteilung der empirischen Mittelwerte: bei grossen Datensätzen ist die Verteilung des z-standardisierten Mittelwertes von Datensätzen, die identisch und unabhängig verteilt sind, nahezu standardnormal. Statt den zentralen Grenzwertsatz zu beweisen, werden wir in den Übungen einige Aufgaben machen, die den Satz durch die Ergebnisse empirisch bestätigen. Anwendungen des zentralen Grenzwertsatzes Mit Hilfe des zentralen Grenzwertsatzes können wir nun zeigen, dass man die Werte PX x einer Binomialverteilung bei genügend grossem n mit Hilfe einer Normalverteilung berechnen kann. B1, p verteilte Zufallsvariablen X i ( Bernoulli-verteilt) können wir verwenden, um beliebige Bn, p verteilte Zufallsvariablen X als Summen darzustellen, da gilt: wenn X 1 Bn, p und X 2 Bm, p, dann X 1 X 2 Bm n, p. Entsprechend gilt dann: Wenn n n n X i B1, p, dann X i Bn, p. Nun ist X i n 1n X i nX (im letzten Schritt i1 i1 i1 verwenden wir die Definition des Mittelwerts von Zufallsvariablen). Für X i B1, p gilt: EX i p und VX i p1 p. Laut den eingeführten Theoremen gilt dann: EX p und: VX 1n p1 p Wir erhalten als standardisierte Zufallsvariable: n 1 n n X i p i1 p1p n n 1n i1 n X i np n p1p n X i np i1 np1p N0, 1. Beispiel: Wieviel beträgt die Wahrscheinlichkeit, bei 200 Zügen mindestens 15 zu lange Schrauben zu ziehen (p 0. 05). Anders formuliert: Wieviel beträgt PX 15, wenn X B200, 0. 05. 15 ist im Beispiel der konkrete Wert der n Zufallsvariable X i . Mit Hilfe des Näherungsverfahrens erhalten wir: i1 152000.05 2000.050.95 1. 622 2 0. 947622098 Ohne Näherungsverfahren erhalten wir: 15 15 i0 i0 PX 15 PX i 200 0. 05 i 0. 95 1i 0. 955644371 i (mit Excel: Computer-Programme wechseln ebenfalls auf ein Näherungsverfahren, sobald die exakte Berechnung zu aufwendig wird). Im Beispiel beträgt die Abweichung des Näherungsverfahrens vom ”tatsächlichen” Wert: ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 153 0. 955644371 0. 947622098 0. 0080223. Wie bereits früher bemerkt, ist die Verwendung des Näherungsverfahrens ist i.A. gerechtfertigt, wenn np1 p 9. Im obigen Beispiele beträgt dieses Produkt: 200 0. 05 0. 95 9. 5. Je grösser diese Zahl, desto besser ist die Näherung. Der Faktor p1 p p p 2 erreicht sein Maximum in p 0. 5. (Beweis: d p p 2 1 2p 0 genau dann, wenn p 12 ; dpd 1 2p 2 0. Somit muss dp in diesem Fall n 0.59 2 36 sein. Je mehr p von 0. 5 abweicht, desto grösser muss n sein. Auf Grund ähnlicher Überlegungen können wir die Werte PX x von Poissonverteilungen ebenfalls mit Hilfe der Normalverteilung berechnen, wenn genügend gross ist. Es gilt nämlich, wie bereits erwähnt: X 1 X 2 P 1 2 , wenn X 1 P 1 und X 2 P 2 . Betrachten wir nun n gleichverteilte n Zufallsvariablen X i 1 (d.h. i 1, n i , so gilt deshalb: X i Pn i . Es n gilt wie oben: X i i1 1 n i1 n n X i nX . X ist für grosse n wiederum näherungsweise i1 normalverteilt. Da bei der Poissonverteilungen gilt: EX i i , gilt laut den n eingeführten Theoremen: EX E 1n X i i . Zudem gilt: VX i i : Laut i1 Varianz-Theorem für den Mittelwert gilt dann: VX n Zufallsvariable X erhalten wir: n X i i n 1 n n X i i i1 . Für die standardisierte n X i n i i n i n i1 n i n X i n i i1 n i N0, 1. Da X i n i , erhalten wir: i1 N0, 1. Beispiel: Die Anzahl der Maschinenstillstände pro Tag sei poissonverteilt (mit 15. Wieviel beträgt die Wahrscheinlichkeit, dass mindestens 8 Maschinen an einem Tag stillstehen. Auch hier fassen wir 7 als der konkrete Werte der n Zufallsvariable X i auf. Mit Hilfe der Näherungsformel erhalten wir für PX 7 i1 715 15 2. 065 6 1 0. 980566934. 0. 01943 3 Die gesuchte Wahrscheinlichkeit ist somit: 1 0. 01943 3 0. 980566934 7 Als exakten Wert erhalten wir PX 8 1 i0 15 i e 15 i! 1 0. 018002193 0. 982. (Mit Excel: POISSON(7,15,1)). Die Differenz zwischen dem tatsächlichen und dem näherungsweisen Wert beträgt somit: 0. 982 0. 980566934 0. 001433 1 Im Allgemeinen ist es möglich, bei Poissonverteilungen die Normalverteilung zu verwenden, wenn gilt: 9. Wir können laut dem zentralen Grenzwertsatz beliebig verteilte Zufallszahlen verwenden, um normalverteilte Zufallszahlen zu erhalten. Die jeweiligen Mittelwerte sind näherungsweise normalverteilt. Die gelieferte Produktionsanleitung für ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 154 standardnormalverteilte Zufallszahlen stellt den folgenden Spezialfall dar: wir verwenden uniform verteilte Zufallszahlen im Intervall [0,1], wobei statt des empirischen Mittelwertes und der empirischen Standardabweichung für die Standardisierung die Werte des Modells verwendet werden (Ist X U0, 1, gilt VX 121 und EX 12 . Wir erhalten: n 1 n n x i 12 i1 1 12 1 n n x i 12 i1 1 12 x i n2 i1 n 12 N0, 1 Übungen: 1) Überprüfen Sie die Aussage X 1 X 2 B10, 0. 5. (X i B5, 0. 5 rechnerisch (mit Hilfe von Excel) 2) Bilden Sie die Summe zweier identisch verteilter poisson-verteilter Zufallsvariablen: X i P5 (für 0 s 5). 3) Für die Poissonverteilung gilt: Wenn X 1 P 1 und X 2 P 2 , dann X 1 X 2 P 1 2 . Überprüfen Sie diese Aussage an der Übung 2. 4) Erstellen Sie 100 Sätze uniform verteilter Zufallszahlen (50) und zeichnen sie den P-P-Plot der Verteilung der Mittelwerte. 5) Erstellen Sie 100 Sätze normalverteileter Zufallszahlen (50) und zeichnen sie den P-P-Plot der Verteilung der Mittelwerte. 6) Erstellen Sie 100 Sätze von Zufallszahlen (50) mit der Verteilung Fx 0. 02x 4 und zeichnen Sie den P-P-Plot der Verteilung der Mittelwerte. 7) Erstellen Sie für 10, 50 und 100 Sätze von exponentialverteilten Zufallszahlen (à 50, 0. 7 die Verteilung der Mittelwerte. Berechnen Sie die mittlere Abweichung der z-standardisierten Mittelwerte von der Standardnormalverteilung und kommentieren Sie. 8) Berechnen Sie für 100 Sätze exponentialverteilter Zufallszahlen (50) die mittlere quadrierte Abweichung vom Modell ( 0. 8 und überprüfen Sie mit Hilfe eines P-P-Plots die Verteilung der erhaltenen Werte auf Normalverteilung. 9) Berechnen Sie für 50 Sätze exponentialverteilter Zufallszahlen (50, 1. 2) den Median und überprüfen Sie, ob die Mediane normalverteilt ist. 10) Berechnen Sie für 50 Sätze uniformverteilter Zufallzahlen (50) die Varianz und überprüfen Sie, ob die Varianzen normalverteilt sind. 11) Berechnen Sie die folgenden Werte der folgenden Binomialverteilungen: PX 7, X B300, 0. 04; PX 7, X B50, 0. 2 12) Berechnen Sie die folgenden Werte der folgenden Poissonverteilungen: ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 155 PX 6, X P13; PX 4, X P5 ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 156 Lösungen: PŠ 0 PX 1 0 und X 2 0 PX 1 0 PX 2 0 5 0. 5 0 0. 5 5 50 0. 5 0 0. 5 5 0. 0009765 6 100 0. 5 0 0. 5 10 9. 765 6 10 4 0 PŠ 1 PX 1 1 und X 2 0 PX 1 0 und X 2 1 5 0. 5 0 0. 5 5 51 0. 5 1 0. 5 4 51 0. 5 1 0. 5 4 50 0. 5 0 0. 5 5 0 0. 009765 6 10 0. 5 1 0. 5 9 9. 765 6 10 3 1 PŠ 2 PX 1 2 und X 2 0 PX 1 1 und X 2 1 PX 1 0 und X 2 2 52 0. 5 2 0. 5 3 50 0. 5 0 0. 5 5 51 0. 5 1 0. 5 4 51 0. 5 1 0. 5 4 5 0. 5 0 0. 5 5 52 0. 5 2 0. 5 3 0. 04394 5 102 0. 5 2 0. 5 8 4. 394 5 10 2 0 PŠ 3 PX 1 3 und X 2 0 PX 1 2 und X 2 1 PX 1 1 und X 2 2 PX 1 0 und X 2 3 5 0. 5 3 0. 5 2 50 0. 5 0 0. 5 5 52 0. 5 2 0. 5 3 51 0. 5 1 0. 5 4 3 5 0. 5 0 0. 5 5 53 0. 5 3 0. 5 2 0. 117 19 51 0. 5 1 0. 5 4 52 0. 5 2 0. 5 3 0 103 0. 5 3 0. 5 7 . 117 19 PŠ 4 PX 1 4 und X 2 0 PX 1 3 und X 2 1 PX 1 2 und X 2 2 PX 1 1 und X 2 3 PX 1 0 und X 2 4 5 0. 5 3 0. 5 2 51 0. 5 1 0. 5 4 54 0. 5 4 0. 5 1 50 0. 5 0 0. 5 5 3 52 0. 5 2 0. 5 3 52 0. 5 2 0. 5 3 51 0. 5 1 0. 5 4 53 0. 5 3 0. 5 2 5 0. 5 0 0. 5 5 54 0. 5 4 0. 5 1 0. 205 08 104 0. 5 4 0. 5 6 . 205 08 0 etc. (für 0 s 10 2 5. x 2) PŠ 0 PX 1 0 und X 2 0 x!e 0 5 5 5 5 0 e 5 5 0!e 1e1 1e0! 4. 54 10 5 0! x e x! PŠ 1 PX 1 1 und X 2 0 PX 1 0 und X 2 1 0 5 0 5 5 5e 5 5 0!e 5 0!e 5e1! 4. 54 10 4 1! PŠ 2 PX 1 1 und X 2 0 PX 1 1 und PX 2 1 PX 1 0 und X 2 2 0 5 5 5 0 5 2 5 5 2 e 5 5 0!e 5e1! 5e1! 5 0!e 5 2!e . 00 227 2! PŠ 3 PX 1 3 und X 2 0 PX 1 2 und PX 2 1 PX 1 1 und X 2 2 PX 1 0 und X 2 3 0 5 2 5 5 5 2 5 0 5 3 5 5 3 e 5 5 0!e 5 2!e 5e1! 5e1! 5 2!e 5 0!e 5 3!e 3! 7. 566 7 10 3 PŠ 4 PX 1 4 und X 2 0 PX 1 3 und PX 2 1 PX 1 2 und X 2 2 PX 1 1 und X 2 3 PX 1 0 und X 2 4 0 5 3 5 5 2 5 2 5 5 4 e 5 5 0!e 5 3!e 5e1! 5 2!e 5 2!e 4! 5e 5 5 3 e 5 5 0 e 5 5 4 e 5 2 3! 4! 1. 891 7 10 1! 0! PŠ 5 PX 1 5 und X 2 0 PX 1 4 und PX 2 1 PX 1 3 und X 2 2 PX 1 2 und X 2 3 PX 1 1 und X 2 4 PX 1 0 und X 2 5 ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 157 5 5 e 5 5! 5 2 e 5 2! 5 0 e 5 0! 5 3 e 5 3! 5 4 e 5 4! 5e 5 1! 0 3) PŠ 2 0 10 0!e 1 10 PŠ 2 1 10 1!e 2 10 PŠ 2 2 10 2!e 3 10 PŠ 2 3 10 3!e 4 10 PŠ 2 4 10 4!e 5 10 PŠ 2 5 10 5!e 10 5e 5 1! 5 4 e 5 4! 5 3 e 5 3! 5 0 e 5 0! 5 2 e 5 2! 5 5 e 5 5! 3. 783 3 10 2 4. 54 10 5 4. 54 10 4 . 00 227 7. 566 7 10 3 1. 891 7 10 2 3. 783 3 10 2 4) Siehe Excel-Datei ”Lösung Aufgabe 4 Verteilung von Kennzahlen” empirische Verteilungsfunktion P-P-Plot 1 1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 -4 -2 0 0 2 4 0 0.2 0.4 0.6 0.8 1 Die Mittelwerte sind deutlich normalverteilt. 5) Siehe Excel-Datei ”Lösung Aufgabe 5 Verteilung von Kennzahlen” empirische Verteilungsfunktion P-P-Plot (Normal) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -3 -2 -1 1 0.8 0.6 0.4 0.2 0 0 1 2 3 0 0.2 0.4 0.6 0.8 1 Die Mittelwerte sind normalverteilt. ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 158 6) Siehe Excel-Datei ”Lösung Aufgabe 6 Verteilung von Kennzahlen” x Für F 1 von F bei Fx 0. 02x 4 gilt: F 1 x 4 0.02 empirische Verteilungsfunktion P-P-Plot (Normal) 1 1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 -4 -3 -2 -1 0 0 1 2 3 0 0.2 0.4 0.6 0.8 1 Die Mittelwerte sind deutlich normalverteilt. 7) Siehe Excel-Datei ”Lösung Aufgabe 7 Verteilung von Kennzahlen” Im konkreten Beispiel erhalten wir mittlere Abweichung von: für 20 Sätze: 0.079481396. für 50 Sätze: 0.019563624 für 100 Sätze: 0.025807526 (Da die mittlere Abweichung selber eine Zufallszahl mit einer Verteilung ist, muss die mittlere Abweichung nicht in jedem Fall sinken). 8) Die mittleren Abstände sind deutlich nicht normalverteilt. empirische Verteilungsfunktion P-P-Plot Normal -2 -1 Werte (Normalverteilung) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0 1 2 3 4 0.2 0.4 0.6 0.8 1 Emp. Vert. ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 159 9) empirische Verteilungsfunktion P-P-Plot Mediane 1 theoretische relative Häufigkeit Empirische Verteilung 1.2 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 empirische relative Häufigkeit Mediane Die Werte scheinen systematisch von der Geraden abzuweichen (Schlangenform). Die Mediane einer Exponentialverteilung sind nicht normalverteilt. 10) P -P -P lo t (n o rm a l) empirische Verteilungsfunktion 1.2 Werte (normal) 1 0.8 0.6 0.4 0.2 0 -3 -2 -1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0 1 2 0.2 3 0 .4 0.6 0.8 e m p . H ä u fi g k e i t Die Varianzen sind nicht normalverteilt. 11) Da 300 0. 04 0. 96 11. 52 9, dürfen wir die Normalverteilung verwenden, um die Wahrscheinlichkeit zu berechnen: n X i np i1 np1p 73000.04 3000.040.96 1. 473 1 1. 473 1 0. 07036 2 Der tatsächliche Wert: 0. 085106059 (Differenz: 0. 085106059 0. 070362072 0. 01 474 4 Da 50 0. 2 0. 8 8, dürfen wir nicht die Normalverteilung verwenden. Mit Hilfe von Excel berechnen wir: 0. 190409812 (bei der Verwendung der Normalverteilung würden ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 160 1 wir erhalten: 7500.2 500.20.8 1. 0607 0. 144413158, der Wert ist also um 4.5% daneben). 12) Da 13 9, dürfen wir die Normalverteilung verwenden: 613 1. 941 5; 1. 9415 0. 02609876 PX 7 13 Der genaue Wert beträgt: 0. 025886915 Da 5 9, dürfen wir nicht die Normalverteilung verwenden: Der genaue Wert beträgt: PX 4, X P5; PX 4 0. 440493285 (Mit der Normalverteilung würden wir erhalten: 45 . 447 21 5 PX 4 0. 327361743 0. 44721 - was doch bedeutend daneben wäre). Lernziele - Die Definition der Unabhängigkeit von Zufallsvariablen erkläutern können. - Die Summenbildung von einfachen diskreten Zufallsvariablen durchführen können und die Wahrscheinlichkeiten der Wahrscheinlichkeitsfunktion der Summe berechnen können. - Die Rechenregeln bezüglich des Erwartungswertes (Theoreme 3, 4, 5, t, 7 und 8) anwenden können. - Die Rechenregeln bezüglich der Varianz (Theoreme 11, 12, 13) anwenden können. - Die Definition der Kovarianz und der Unkorreliertheit kennen. - Für diskrete Zufallsvariablen X i die Zufallsvariable X samt Wahrscheinlichkeitsfunktion berechnen können. - Definition der Gleichverteiltheit von Zufallsvariablen kennen. - Den Inhalt der Theoreme 20, 21, 22, 23 und 24 erläutern können. - Den Zentralen Grenzwertsatz in Worten formulieren können. - Übungen der Art 4 - 10 mit Excel machen können. ___________________________________________________________________ Verteilung von Kennzahlen.tex 2. HSW Visp P.R. Statistik 161 8. Weitere stetige Verteilungsfamilien Wir werden in diesem Rahmen nicht sämtliche, mit Namen versehenen Verteilungsfamilien betrachten, sondern nur jene, die eine besondere Rolle in der Test-Statistik spielen: Die 2 Verteilung (Chi-Quadrat), die t-Verteilung und die F-Verteilung. Diese Verteilungen werden von der Normalverteilung hergeleitet. Es handelt sich um Verteilungen, die den Verteilungen von komplizierteren Zufallsvariablen entsprechen (z.B. Zufallsvariablen, welche die Varianz von Zufallsvariablen enthalten). Die 2n -Verteilungen Definition: Y ist eine 2n -verteilte Zufallsvariable mit n Freiheitsgraden n genau dann, wenn Y X 2i und X i sind unabhängige, i1 standardnormalverteilte Zufallsvariablen. wobei das Produkt von Zufallsvariablen (X 2 X X die übliche Multiplikation von Funktionen bezeichnet (d.h. f g h genau dann, wenn fx gx hx). Die Anzahl der Freiheitsgrade ist mit der Anzahl der unabhängigen Zufallsvariablen identisch. Je nach dieser Anzahl sieht die Verteilung etwas anders aus. Die Dichtefunktion der 2n -Quadratverteilung mit n Freiheitsgraden ist: f 2n n 2 n 1 2 n 2 x x 2 1 e 2 (für x 0). wobei ”Gammafunktion” genannt wird. Es folgen ein paar Bemerkungen zur Gammfunktion, die Sie natürlich übergehen können: Die Gammafunktion ist definiert durch: x t x1 e t dt. Die 0 Gammafunktion ist die Funktion, welche die diskrete Funktion n! stetig fortführt, d.h. so verbindet, dass eine stetige Funktion ohne überflüssige Krümmungen entsteht. Es gilt nämlich: n 1 n! Damit ist z.B. 6 5 1 5! 120. ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 159 Die Gammafunktion Die Werte der Gammfunktion für x 1 bis x 2 sind z.B. im Buch ”Formeln und Tafeln, Orell-Füssli-Verlag” tabelliert. Dies genügt für die Berechnung beliebiger Werte, da für die Gammafunktion zusätzlich gilt: x 1 xx. Wollen wir z.B. 6. 25 berechnen, gilt: 6. 25 5. 25 1 5. 25 5. 25 5. 25 4. 25 1 5. 25 4. 25 4. 25 5. 25 4. 25 3. 25 1 5. 25 4. 25 3. 25 3. 25 5. 25 4. 25 3. 25 2. 25 1 5. 25 4. 25 3. 25 2. 25 2. 25 5. 25 4. 25 3. 25 2. 25 1. 25 1 5. 25 4. 25 3. 25 2. 25 1. 25 1. 25 Faktisch berechnen wir in den hier verwendeten Formeln die Gammewerte von ganz- oder halbzahligen Werten. Dabei gilt: 12 . In Excel (Befehl: GAMMALN()) werden die logarithmierten Werte der Gammafunktion geliefert (natürlicher Logarithmus ln). Die Werte der Gammfunktion erhalten wir somit durch: expGAMMALN() x; der HP48 liefert die Werte bei der Taste ! unter MTH, NXT, PROB - d. h wie die Fakultäten. Konkrete Dichtefunktionen von 2n -Quadratverteilungen mit n Freiheitsgraden erhalten wir, indem wir in der obigen Formel n durch eine spezifische natürliche Zahl und n2 durch den entsprechenden Wert der Gamma-Funktion ersetzen. Für einen Freiheitsgrad erhalten wir die Verteilung: 1 0. 5 1. 772453851 0. 39894 . 1.772453851 2 1 1 1 2 2 1 2 x x 2 1 e 2 0. 398 94 x 0.5 e 0.5x 0. 398 94xe 0.5x Wir erhalten den Graphen: ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 160 Die Kurve ist nicht symmetrisch. Entsprechend fallen der Median und der Mittelwert nicht zusammen. Für zwei Freiheitsgrade erhalten wir: 22 1 1 2 1 2 2 2 2 2 x x 2 1 e 2 1 2 1 e 2 x Wir erhalten den Graphen: Für n Freiheitsgrade erhalten wir: n 3: n 4: 1 3 2 2 3 2 1 4 2 2 4 2 3 x 4 x x 2 1 e 2 0. 398 94 x e 0.5x x 2 1 e 2 0. 25xe 0.5 ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 161 n 5: n 8: n 10: 2 5 2 2 8 2 1 2 10 2 x 8 x x 2 1 e 2 0. 01 041 7x 3 e 0.5x 1 8 2 5 x 2 1 e 2 0. 132 98 x 3 e 0.5x 1 5 2 10 2 x 10 2 1 x e 2 0. 001302 1x 4 e 0.5x Graphik: n=3 n=4 n=5 n=8 n = 10 Die Graphen haben nun im Gegensatz zu n 1 und n 2 ein Maximum in x 0. Für beliebige 2n -Verteilung gilt: Der Erwartungswert ist mit n identisch und die Varianz mit 2n. An den obigen Graphiken stellen wir fest: mit steigendem n werden die Kurven immer flacher. Die Kurven werden zudem symmetrischer. In der Tat unterscheidet sich die Kurve bei hohem n nur mehr geringfügig von einer Normalverteilung mit n und 2 2n. Als Beispiel betrachten wir X N50, 100 und X 250 . Wir erhalten die folgenden Formeln und Graphiken: x 1 10 2 4. 803 4 10 e 0.5 x50 10 32 24 0.5x x e und f 250 x 1 2 50 2 50 2 x 50 2 1 x e 2 ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 162 fχ(x) fΦ(x) Auch hier gibt es für die Verteilungsfunktion keine geschlossene Formel. Wir könnten die Werte der Funktion durch eine Näherungsmethode bestimmen (Verfahren siehe Normalverteilung). Wir werden die Werte jedoch in Tabellen nachschauen, mit Hilfe von Excel oder eines Taschenrechners bestimmen. In Tabellen werden gewöhnlich nur Werte in den Intervallen p 0. 95 und p 0. 05 angegeben, da i.a. nur Werte in diesen Bereichen in der Teststatistik verwendet werden. Anwendungsbeispiele werden wir im Rahmen der Teststatistik sehen. Übungen: Bestimmen Sie mit Hilfe einer Tabelle, einem Taschenrechner oder mit Hilfe von Excel die folgenden Werte: (Excel: chivert(Wert;Freiheitsgrade); Excel (und viele Tabellen) liefern dabei die Werte , wobei 1 F n x, wobei F n die Verteilungsfunktion der 2n -Verteilung ist). Auch der HP48 gibt diesen Wert an (upper tail probability für 2n : utpc, im selben Menu wie die Werte der Normalverteilung; eingegeben werden die folgenden Werte in der folgenden Reihenfolge: Freiheitsgrade, x): 1) X 26 : PX 1. 64 2) X 211 : PX 21. 9 3) X 24 : PX 14. 9 4) X 25 : PX 0. 6 5) X 250 : P28 X 80 Lösungen: 1) Mit Hilfe von Excel: 1 0. 949658734 0. 05034 1 Mit der Tabelle (Formeln und Tafeln): 1 0. 95 0. 05 ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 163 0.95 = α=1-(F(6)(1.64)) 2) Excel: 1 0. 025159503 0. 974 84, Mit der Tabelle: 1 0. 025 0. 975 3) Excel: 0. 004913182; Mit der Tabelle: 0. 005. 4) Excel: 0. 988003243; Mit der Tabelle: Wert zwischen 0. 99 und 0. 975 (wir könnten z.B. linear interpolieren). 5) Mit Excel: 0. 994980108 0. 004482657 0. 990 5 Mit der Tabelle: 0. 995 0. 005 0. 99 Die t-Verteilungen Definition: Y ist eine t-verteilte Zufallsvariable mit n Freiheitsgraden genau Xo dann, wenn Y , und X i und X 0 sind unabhängig und n 1 n X 2i i1 standardnormalverteilt. t Verteilungen sind symmetrische Verteilungen mit dem Erwartungswert 0 (für n . sofern dieser Term positiv ist, d.h. n 2). n 2) und der Varianz n2 Die Dichtefunktion der t-Verteilung ist: f t x Für n 1 : f t 1 x Für n 2 : f t 2 x 11 2 1 2 21 2 2 2 2 1 n1 2 n 2 1 n 11 2 x2 1 x2 2 1 21 2 x2 n n1 2 0.318 31 1x 2 0.353 55 10.5x 2 3 ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 164 Für n 10 : f t 10 x 10 2 101 2 10 1 x2 10 101 2 0.389 11 10.1x 2 11 Graphik: Dichtefunktion der Standardnormalverteilung ft10 ft2 ft1 Wir stellen fest: Die t-Verteilungen sind flacher als die Standardnormalverteilung. Sie nähern sich für steigende n aber zunehmend einer Standardnormalverteilung an. Die Werte der t-Verteilung können wir mit Hilfe von Näherungsverfahren aus der Dichtefunktion berechnen. In der Praxis werden wir sie aus Tabellen, mit dem Taschenrechner oder mit Hilfe von Excel bestimmen. Anwendungsbeispiele werden wir im Rahmen der Teststatistik sehen. Übungen: Geben sie die folgenden Wahrscheinlichkeiten an: (Excel gibt - wie häufig auch bei Tabellen - den Wert 1 F t x an, wobei F t die Verteilungsfunktion der t-Verteilung ist. Befehl: tvert(Wert;Freiheitsgrade;1; Mit dem HP48: UTPT. Es werden zuerst die Freiheitsgrade, dann die Zahl x eingegeben). 1) X 2) X 3) X 4) X t3 : PX 4. 54 t25 : PX 2. 06 t10 : PX 2. 23 t30 : P1. 7 X 3. 39 Lösungen: 1) Mit Excel: 1 0. 010004169 0. 99; Mit der Tabelle: 1 0. 01 0. 99. ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 165 2) Mit Excel: 1 0. 024976248 0. 97502. Mit der Tabelle: 1 0. 025 0. 975 3) Mit Excel: 0. 024921235. Mit der Tabelle: 0. 025 4) Mit Excel: 0. 048751508 Mit der Tabelle: 0. 05 0. 001 0. 049 Die F-Verteilungen Definition: Eine Zufallsvariable Y ist F-verteilt mit m und n Freiheitsgraden m 1 m X 2i i1 n genau dann, wenn Y 1 n . X i sind X 2i i1 standardnormalverteilte,unabhängige Zufallsvariablen) Die Dichtefunktion der F-Verteilung ist: f F m,n m 1 m 2 mn 2 m n 2 2 mn 2 x 1 m n x mn 2 für x 0. Wir zeichnen ein paar Dichtefunktionen von F-Verteilungen. Wenn m 4 und n 40, so gilt: 4 4 2 10 4 10 2 2 410 2 4 1 f F 4,10 x2 f F 4,40 x2 f F 40,4 x f F 40,40 4 4 2 40 4 40 2 2 440 2 4 1 40 1 2 40 4 1 4 10 x 410 2 24x 510.4x 7 1 4 40 x 440 2 4.2x 10.1x 22 40 2 40 4 2 2 404 2 x 40 1 2 40 40 40 40 2 2 4040 2 40 2 1 1 40 4 40 40 x 404 2 x 4040 2 4. 2 10 22 x 19 110x 22 1. 378 5 10 12 x 19 1x 40 ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 166 f40,40 f4,40 f4,10 f40,4 Der Erwartungswert der F-Verteilung ist: F Nennerfreiheitsgrade) n n2 (n 2; n Anwendungen der F-Verteilung werden wir im Rahmen der Teststatistik sehen. Übungen: Schauen Sie die folgenden Wahrscheinlichkeiten nach (Excel liefert wieder die Werte von 1 F F x, wobei F F die Verteilungsfunktion der F-Verteilung ist. Befehl: FVERT(Wert;Freiheitsgrade m; Freiheitsgrade n; mit dem HP48 wird derselbe Wert wie bei Excel geliefert: Eingabe: Freiheitsgrade des Zählers, Freiheitsgrade des Nenners, x) 1) X F10, 8 : PX 3. 347 2) X F3, 6 : PX 3. 289 3) X F9, 3 : PX 14. 47 4) X F4, 4 : P4. 107 X 15. 98 Lösungen: 1) Mit Excel: 1 0. 050006472 0. 949 99. Mit der Tabelle: 0.95 2) Mit Excel: 1 0. 099987384 0. 900 01. Mit der Tabelle: 0.90 3) Mit Excel: 0. 025007557. Mit der Tabelle: 1 0. 975 0. 025 4) Mit Excel: 0. 090012472 Mit der Tabelle: 0. 99 0. 90 0. 09 Lernziele - Mit Excel und einer anderen Methode (nicht an Computer gebunden) die Wahrscheinlichkeiten für 2 -, t- und F-verteilte Zufallsvariablen berechnen können. ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 167 - Wissen, was Freiheitsgrade ausdrücken (Anzahl unabhängiger Zufallsvariablen, die in die jeweiligen Summen einfliessen). ___________________________________________________________________ weitere stetige Verteilungen.tex 2. HSW Siders, P.R. Seite 168 Univariate schliessende Statistik In der schliessenden Statistik geht es um folgende drei Grundprobleme: (a) Ist eine bestimmte Hypothese mit den Ergebnissen eines Experimentes verträglich? Unterscheiden sich zwei Testergebnisse? (z.B. Sind zwei Rohstoffe bezüglich der Qualität des Endproduktes unterscheidbar? Führt eine bestimmte Investition in den Maschinenpark zu einer besseren Qualität? Hat ein bestimmtes Medikament die gewünschte Wirkung? Führt eine neue Mastmethode zu höheren Erträgen? etc.). (b) Schätzen von Parametern einer Grundgesamtheit mit Hilfe einer Stichprobe (Anteile, Mittelwerte: Beispiel: Meinungsumfragen, Marktforschung). (c) Welche Annahmen über die Grundgesamtheit sind mit einer bestimmten Stichprobe verträglich (Vertrauensintervalle: z.B. Bei einer Marktforschungsstudie bemängeln 45% der Befragten einen bestimmten Aspekt eines Produktes. Dieser Wert ist als Wert einer Zufallsvariablen zu betrachten. Es wäre nützlich zu wissen, in welchem Intervall sich der tatsächliche Wert mit einer Wahrscheinlichkeit von 95% findet). Wir werden in der Folge diese drei Grundprobleme eingehender behandeln. Testen von Hypothesen 1. Diskrete Verteilungen und Tests - Grundbegriffe Wir wollen uns das Problem des Testens von Hypothesen zuerst an einem einfachen Beispiel I klar machen. Eine Person behauptet, die Fähigkeit zu haben, Walliser Dôle von Wadtländer Gamay in einem Blindtest unterscheiden zu können. Wir überreden die Person, sich einem statistischen Test zu unterziehen. Wir nehmen z.B. folgende Anordnung vor. Wir füllen 16 Gläser mit Dôle und mit Gamay von jeweils verschiedenen Produzenten (Die entsprechenden Anteile der Gläser können beliebig festgelegt werden, z.B. 7 und 9 oder 8 und 8. Die Versuchsperson darf die Anteile nicht kennen. Wir setzen voraus, dass die Wahrscheinlichkeit einer zufälligen, richtigen Entscheidung vom Vorliegen von Gamay oder Dôle nicht beeinflusst wird). Wir ordnen die Gläser nach dem Zufallsprinzip (indem wir z.B. den Gläsern der Reihe nach Zufallszahlen zuordnen und die Gläser dann der Grösse der Zufallszahlen nach auf einem Tisch anordnen. Wir fordern die Versuchsperson auf, die Gläser der Reihe nach zu probieren und jeweils festzulegen, ob es sich um Dôle oder Gamay handelt. ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 169 Wie gross ist die Wahrscheinlichkeit, zufälliger weise alle Gläser richtig als Dôle oder als Gamay zu klassifizieren? Die Wahrscheinlichkeit, bezüglich eines bestimmten Glases die richtige Entscheidung zu treffen, beträgt bei zufälliger Entscheidung 0. 5. Somit beträgt die Wahrscheinlichkeit, alle Gläser zufälliger weise richtig zu klassifizieren 0. 5 16 0. 00001525 9 PX 16 16 0. 5 16 0. 5 0 . Gelingt 16 es der Versuchsperson, alle Gläser richtig zu klassieren, ist es zwar immer noch denkmöglich, dass sie in Tat und Wahrheit die beiden Weinsorten blind nicht unterscheiden kann und dass sie zufälliger weise die richtige Wahl getroffen hat. Die Wahrscheinlichkeit dafür ist jedoch sehr klein. Entsprechend sind wir in diesem Falle bereit, die Hypothese zu verwerfen, dass sie die Gläser nicht unterscheiden kann. Nullhypothese und Alternativhypothese Wir sind im allgemeinen bereit, eine Hypothese H zu verwerfen, wenn die Wahrscheinlichkeit sehr klein ist, dass bei der Annahme von H das spezifische Testergebnis zufällig zustande kommt. Im Beispiel nehmen wir an, die Versuchsperson könne die Weinsorten nicht unterscheiden. Dann ist die Wahrscheinlichkeit sehr klein, dass sie z.B. mindestens 15 richtige Entscheidungen trifft, d.h. 15 oder 16 richtige Entscheidungen trifft. Die Hypothese H, die wir verwerfen, wenn das Testergebnis bei der Annahme von H unwahrscheinlich ist, nennen wir künftig Nullhypothese H o . Die Alternativhypothese bezeichnen wir mit H A . Im Weinbeispiel ist H 0 : ”Die Versuchsperson kann die Weingläser nicht unterscheiden” H A : ”Die Versuchsperson kann die Weingläser unterscheiden”. Signifikanzniveau Traditionell legt man ein bestimmtes Niveau für die Verwerfung der Nullhypothese fest. Das Verwerfungsniveau wird Signifikanzniveau genannt und gewöhnlich auf 0. 05 oder 0. 01 festgelegt. Fällt das Testergebnis in einen Bereich, in den Testergebnisse (bei Annahme der Nullhypothese) nur mit einer Wahrscheinlichkeit von höchstens 0. 05 oder 0. 01 fallen, so verwerfen wir die Nullhypothese (gewöhnlich spricht man dann von einem statistisch signifikanten Testergebnis). Signifikanzniveaus sind jeweils vor einem Test festzulegen. Oft wird die Signifikanz von Testergebnissen mit einen Stern für das 0. 05 Niveau, mit zwei Sternen für das 0. 01 Niveau und mit drei Sternen für das 0. 001 Niveau gekennzeichnet. Legen wir im obigen Beispiel 0. 05 als Signifikanzniveau fest, sind wir bereit, die Nullhypothese zu verwerfen, wenn für das Testergebnis x des Versuchs bei Gültigkeit der Nullhypothese gilt: PX x 0. 05. Die Wahrscheinlichkeit, zufälliger weise mindestens 15 Gläser richtig zu bestimmen, ist: PX 15 PX 16. Für die Zufallsvariable X gilt: X B16, 0. 5 (es gibt nämlich verschiedene Möglichkeiten, zufälliger weise 15 richtige Entscheidungen zu treffen, nämlich 16 . Jede dieser Möglichkeiten hat eine Wahrscheinlichkeit des Eintreffens von 15 15 0. 5 0. 5 1 . Somit gilt PX 15 16 0. 5 15 0. 5 1 0. 0002441 4). Berechnen wir die 15 entsprechende (umgekehrte), kumulative, relative Wahrscheinlichkeitsverteilung, erhalten wir: ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 170 Testergebnis xi 16 15 14 13 12 11 10 P(xi) 1.52588E-05 0.000244141 0.001831055 0.008544922 0.027770996 0.066650391 0.122192383 kumulativ 1.52588E-05 0.000259399 0.002090454 0.010635376 0.038406372 0.105056763 0.227249146 Somit sind wir bereit, die Nullhypothese zu verwerfen, wenn die Versuchsperson mindestens 12 richtige Zuordnungen vornimmt. Zweiseitige und einseitige Tests Im obigen Beispiel können wir festlegen, dass wir die Nullhypothese verwerfen, wenn die Versuchsperson mindestens 12 richtige Entscheidungen trifft. Wir sprechen in diesem Falle von einem einseitigen Test. W ahrscheinlichkeitsfunktion von X ~ B(16,0.5) 0.25 P(xi) 0.2 0.15 0.1 0.05 0 0 5 10 15 xi α = 0.05 20 Einseitiger Test: 0. 05. Verwerfen der Nullhypothese bei mindestens 12 richtigen Klassierungen. Es ist auch möglich, auf Grund inhaltlicher Überlegungen bei einem einseitigen Test den Verwerfungsbereich (der Nullhypothese) auf der linken Seite der Verteilung festzulegen. Beim einseitigen Test interessierten wir uns nicht für den Fall, dass eine Person fast alle oder alle Entscheidungen falsch trifft. Nehmen wir an, die Person würde 16 ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 171 falsche Enscheidungen treffen. Es wäre dann wohl sinnvoll anzunehmen, sie könne die Weine unterscheiden, würde diesen aber jeweils falsche Ausdrücke zuordnen. Entsprechend müssten wir den Verwerfungsbereich auf beiden Seiten der Verteilung festlegen. Bei 0. 05 ergibt sich auf beiden Seiten ein Verwerfungsbereich von je 0. 025. Betrachten wir wieder unser Beispiel: Bei beidseitigem Vewerfungsbereich würden wir die Nullhypothese verwerfen, wenn höchstens 3 oder mindestens 13 richtige Entscheidungen getroffen werden (bei p 0. 5, ist die Binomialverteilung symmetrisch. Wir können somit durch die Bestimmung einer Grenze mit Hilfe der obigen Tabelle auch die andere Grenze bestimmen). Ob beidseitig oder einseitig getestet werden soll, muss vorgängig zu einem Test auf dem Hintergrund von inhaltlichen Überlegungen festgelegt werden. P(xi) Wahrscheinlichkeitsfunktion von X ~ B(16,0.5) 0.25 0.2 0.15 0.1 0.05 0 0 α/2=0.025 5 10 15 xi α/2=0.025 20 Zweiseitiger Test: 0. 05. Verwerfen der Nullhypothese bei höchstens 3 oder mindestens 13 richtigen Klassierungen p-Wert Trifft in einem rechtsseitigen, einseitigen Test das Testergebnis x ein, so wird PX x ” p-Wert” des Testergebnisses genannt. Im linkseitigen, einseitigen Fall ist der p-Wert des Testergebnisses x die Wahrscheinlichkeit PX x. Im beidseitigen Test ist der p-Wert: 2 minFx, 1 Fx (wobei F die Verteilungsfunktion ist und minx, y x genau dann, wenn x y und minx, y y genau dann, wenn y x. Betrachten wir ein Beispiel: wir legen vorgängig zum Weinbeispiel fest, dass wir zweiseitig testen wollen. Die Versuchsperson entscheidet 10 mal richtig. FX 10 0. 894943237. Somit gilt: 1 0. 894943237 0. 105056763 und min0. 894943237, 0. 105056763 0. 105056763. Der p-Wert ist entsprechend 2 0. 105056763 0. 21011 (wir multiplizieren mit zwei, da bei einem zweiseitigen Test beide Seiten der Verteilung berücksichtigt werden ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 172 müssen). Das Verwerfungsprinzip kann für alle drei Fälle wie folgt formuliert werden: Wir verwerfen die Nullhypothese dann, wenn gilt: bei Zugrundelegung der Nullhypothese gilt: p-Wert . Der Vorteil der Angabe des p Wertes gegenüber einer alleinigen Feststellung der Signifikanz besteht darin, dass der Leser sieht, ob ein Resultat knapp signifikant ist oder nicht, oder ob ein Resultat bei weitem nicht signifikant ist. Verwerfungsprinzip: Wenn (1) x eintrifft und (2) p Wert (von x , bei der Annahme von H 0 dann verwerfen wir H 0 ( ist das Signifikanzniveau; 0. 05 oder 0. 01) Fehler erster und zweiter Ordnung Wir nehmen an, dass wir ein Testergebnis erhalten, für dessen p Wert gilt: p Wert . Es ist zwar recht unwahrscheinlich, aber trotzdem möglich, dass die Nullhypothese wahr ist. In diesem Falle verwerfen wir die Nullhypothese fälschlicher weise. Ein Verwerfen der richtigen Nullhypothese wird ”Fehler erster Ordnung” genannt (Wenn man einen Test mit einem Signifikanzniveau von 0. 05 und einer richtigen Nullhypothese 100 mal wiederholt, so werden wir mit hoher Wahrscheinlichkeit einige signifikante Resultate erhalten, nämlich ca. 5 auf 100. Die Anzahl der signifikanten Resultate ist dabei als Wert einer Zufallsvariable zu betrachten). Handkehrum ist es möglich, dass wir einen nicht-signifikanten p Wert erhalten, obwohl die Nullhypothese nicht zutrifft. Diesen Fehler nennt man ”Fehler zweiter Ordnung”. Die eingeführten Grundbegriffe (einseitiger und zweiseitiger Test, Verwerfungsniveau Signifikanzniveau, Nullhypothese, Alternativhypothese, p-Wert, Fehler erster und zweiter Ordnung) werden auch für Tests, die eine stetige Verteilung voraussetzen, verwendet. Beispiel II. Einer Firma wird vorgeworfen, die Asbest-Grenzwerte in ihren Hallen nicht einzuhalten. Man einigt sich auf folgenden Test: Es werden 10 mal jeweils ein Liter Luft untersucht und die Anzahl Asbestfasern gezählt. Der offizielle Grenzwert liegt bei höchstens 3 Fasern pro Liter. Die Nullhypothese ist: ”Die tatsächliche Anzahl liegt auf dem Grenzwert (und ist damit noch akzeptabel)”. Die Alternativhypothese ist: Der Grenzwert wird überschritten ( rechtsseitiger Test). Wir erhalten für die Proben folgende Resultate: 1, 3, 5, 7, 2, 6, 4, 3, 2, 1 (Anzahl Fasern pro Liter). Wir können hier mit einer Poisson-Verteilung arbeiten. (X P30). 1 3 5 7 2 6 4 3 2 1 34. Durchschnittich liegt das Resultat somit über dem Grenzwert. Es stellt sich die Frage, ob das Testergebnis die Nullhypothese wiederlegt. Wir berechnen PX 34 0. 797308325 für X P30. Der P-Wert (1 0. 7977308325 0. 202 27 liegt unter dem Signifikanzniveau. Die Nullhypothese kann nicht verworfen werden. Da PX 39 0. 953746962 für X P30, müsste somit die Nullhypothese erst bei 39 Fasern verworfen werden ( 0. 05 Übungen: ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 173 1) Eine Person gibt vor, hellseherische Kräfte zu haben. Insbesondere will sie voraussagen können, ob sich bei einem Münzwurf Kopf oder Zahl ergibt. Denken Sie sich einen statistischen Test aus, um diese Behauptung zu überprüfen (Legen sie dabei H 0 und fest, sowie ob einseitig oder zweiseitig getestet werden soll). 2) Eine Firma beschwert sich bei einem Lieferanten über unterschiedliche Qualitäten von Lieferungen. Dabei könnten von Auge deutlich zwei Qualitäten unterschieden werden. Der Lieferant bestreitet die Behauptung. Man einigt sich auf folgenden Test: 10 Personen untersuchen je 10 Stichproben, die aus den (angeblich oder wirklich) unterschiedlichen Qualitäten stammen. Als Signifikanzniveau wird 0. 01 festgelegt. Man testet beidseitig. Legen Sie die Nullhypothese und die Alternativhypothese fest und berechnen x i , so dass der p-Wert von x i 0. 01. 3) Eine Firma wird von der Gewerkschaft beschuldigt, weniger als durchschnittlich für die Sicherheit ihrer Mitarbeiter vorzukehren, da die Unfallquote im Jahre 2000 10 auf 1000 betrug, während sie in vergleichbaren Firmen nur 5 auf 1000 betrug. Kann die vorliegende Unfallhäufigkeit auch durch Zufall erklärt werden? (Signifikanzniveau 0. 05 4) In einer Zeitung steht, die Unfälle mit Todesfolge hätten in der Schweiz massiv zugenommen, da sie von 1000 auf 1100 gestiegen sind. Testen Sie! 5) Eine Unternehmung fertigt mit einer Maschine täglich 100 000 elektronische Bauteile. Darunter fallen durchschnittlich 5 defekte an. Es wird eine neue Maschine getestet. In einem Versuch produziert sie nur 2 defekte Bauteile auf 100 000. Ist die neue Maschine besser? 0. 05 6) Bei einer Lieferung von mechanischen Bauteilen dürfen durchschnittlich nur 5 auf 100000 unbrauchbar sein. Die Lieferungen werden mit folgendem Test untersucht. Es werden 100 Bauteile (mit Zurücklegen) zufällig gezogen. Wir nehmen an, bei einer solchen Stichprobe seien 3 Bauteile unbrauchbar. Entspricht die Lieferung den Qualitätsanforderungen? (Signifikanzniveau 0.05) 7) Bei einer Lieferung von Rohstoffteilen dürfen laut Liefervertrag durchschnittlich nur 0. 5% mangelhaft sein. Dabei wird der folgende Test verwendet, um die Einhaltung der Lieferbedingungen zu überprüfen: Es werden 20 Teile zufällig gezogen (ohne Zurücklegen). Wir nehmen an, bei einer solchen Stichprobe und einer Lieferung von 200 Teilen seien 2 Bauteile fehlerhaft gewesen. Entspricht die Lieferung den Lieferbedingungen? 8) Bei einer Lieferung von Zwischenprodukten dürften laut Liefervertrag durchschnittlich nur 1% mangelhaft sein. Dabei wird der folgende Test verwendet, um die Einhaltung der Lieferbedingungen zu überprüfen: Es werden 20 Teile zufällig gezogen (ohne Zurücklegen). Wir nehmen an, bei einer solchen Stichprobe und einer Lieferung von 500 Teilen seien 2 Bauteile fehlerhaft gewesen. Entspricht die Lieferung den Lieferbedingungen? ( 0. 05 9) Denken Sie sich je eine betriebswirtschaftlich relevante Problemlage aus, die Sie mit Hilfe eines Binomial- und eines Poisson-Testes lösen können. ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 174 Lösungen 1) H o :”Die Testperson hat keine hellseherische Kräfte”. H A : Die Testperson hat hellseherische Kräfte und kann mehrheitlich richtige Voraussagen machen ( rechtsseitiger Test).(Man könnte ähnlich wie oben auch für einen zweiseitigen Test argumentieren: wenn die Person systematisch falsch liegt, scheint sie hellseherische Fähigkeiten zu haben. Man könnte die Person in diesem Falle durchaus bei entsprechenden Spielen einsetzen, um oft zu gewinnen. Man müsste jeweils auf das Gegenteil dessen setzen, das sie voraussagt. In diesem Fall würden wir die Alternativhypothese wie folgt formulieren: Die Testperson kann mehrheitlich richtige oder mehrheitlich falsche Voraussagen machen). Als Signifikanzniveau legen wir 0.05 fest. Wir könnten z.B. die folgende Versuchsanordnung festlegen. Wir werfen 20 Münzen. Die entsprechenden Ereignisse sind binomialverteilt (B20, 0. 5). Wir testen rechtseitig. Mit Hilfe von Excel erhalten wir: Anzahl richtiger Voraussagen xi 20 19 18 17 16 15 14 13 P(xi) umgekehrt kumulativ 9.53674E-07 1.90735E-05 0.000181198 0.001087189 0.004620552 0.014785767 0.036964417 0.073928833 9.5367400E-07 2.0027174E-05 2.0122517E-04 1.2884142E-03 5.9089662E-03 2.0694733E-02 5.7659150E-02 1.3158798E-01 Beim festgelegten Signifikanzniveau wird die Nullhypothese verworfen, wenn die Testperson mindestens 15 richtige Voraussagen macht. 2) H o : Die zwei Qualitäten können nicht unterschieden werden. H A : Die zwei Qualitäten können unterschieden werden ( zweiseitiger Test). Man wählt eine spezifische Anzahl m von Stichproben aus der ersten Qualität, und die restlichen 100 m aus der anderen Qualität. Wir ordnen den Stichproben Zufallszahlen zu und ordnen sie der Grösse nach. Je zehn werden dann den Versuchspersonen zugeteilt. Wir können das ganze als einen Binomial-Test mit X B100, 0. 5 ansehen. Mit Excel erhalten wir: mindestens 64 müssen richtig klassiert werden oder höchstens 100 64 36 (denn 2 0. 00331856 0. 006637 1 0. 01, während 2 0. 006016488 0. 01203 3 0. 01. xi P(xi) 66 65 64 63 62 0.000458105 0.000863856 0.001559739 0.002697928 0.00447288 (umgekehrt) kumulativ 0.000894965 0.001758821 0.00331856 0.006016488 0.010489368 ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 175 Wir könnten auch die Normalverteilung verwenden: x1000.5 1000.5 2 0. 2x 10 N0, 1. 0. 2x 10 0. 995. Wir erhalten somit: 0. 2x 10 2. 58 x 62. 9. Wir müssten somit mindestens 63 richtige oder höchstens 100 63 37 richtige Klassierungen haben. Bei dieser Berechnungsart liegen wir mit der Signifikanzgrenze etwas zu tief. (Es wäre im Beispiel offensichtlich weniger aufwendig, wenn man n kleiner ansetzen würde). 3) Wir verwenden die Poisson-Verteilung. H 0 : Die Unfallquote der Firma weicht nicht von der durchschnittlichen Unfallquote ab. H A : Die Unfallquote der Firma ist grösser als die durchschnittliche Unfallquote ( rechtsseitiger Test). Wir berechnen somit PX 10 für X P5. PX 10 1 PX 10 1 0. 968171943 0. 03182 8. Somit ist die Abweichung von der durchschnittlichen Unfallquote als signifikant zu bezeichnen. Die Firma sollte etwas für den Unfallschutz unternehmen. 4) H o : Die Unfallzahlen unterscheiden sich nicht. H A : Die Unfallzahlen im zweiten Jahr sind höher ( rechtsseitiger Test). Da sowohl 1000 als auch 1100 als Werte einer Zufallsvariablen zu betrachten sind, wäre es hier ungünstig, so wie im Beispiel 3 vorzugehen. Wir können jedoch die Situation so deuten, dass ein Unfall im ersten Jahr erfolgt oder nicht. Laut Nullhypothese ist dann die Wahrscheinlichkeit, dass ein Unfall im ersten Jahr erfolgt 0. 5. Wir verwenden entsprechend eine Binomialverteilung: Wir berechnen PX 1100 für X B2100, 0. 5. Mit der Näherungsformel für die Normalverteilung erhalten wir: 110021000.5 1 1 2. 182 2 1 0. 985452664 0. 01454 7. 21000.50.5 Somit ist das Resultat auf einem Signifikanzniveau von 0. 05 signifikant, auf einem Niveau von 0. 01 nicht signifikant. 5) H 0 : Die Maschine ist nicht besser. H A : Die Maschine ist besser, d.h. produziert weniger Ausschuss ( linksseitiger Test). Wir verwenden die Binomialverteilung: 2 X B100000, 0. 00002. p 100000 0. 000 02. Wir berechnen den p-Wert: PX 2 0. 676676416192 0. 05. (Die Normalverteilung darf nicht verwendet werden, da 100000 0. 00002 1 0. 00002 2 9 Somit gilt: Die Abweichung vom Mittelwert ist nicht signifikant. 6) H 0 : Die Lieferung entspricht den Qualitätsansprüchen. H A : Die Lieferung entspricht den Qualitätsansprüchen nicht und weist zuviele defekte Teile auf ( rechtsseitiger Test). Wir wenden einen Binomialtest an: Zu berechnen ist somit 5 PX 3 für X B100, 100000 0. 00005. Dabei gilt: PX 2 0. 99999998. Somit gilt: PX 3 1 PX 2 1 0. 99999998 2. 0 10 8 . Die Abweichung ist hochsignifikant. Die Lieferung entspricht den Qualitätsansprüchen nicht. 7) H 0 : Die Lieferung entspricht den Qualitätsanforderungen H 1 : Die Lieferung entspricht den Qualitätsanforderungen nicht ( rechtsseitiger Test) 0. 01 Verzichten wir auf Zurücklegen, wird die Hypergeometrische Verteilung angewendet. Da 0.5% von 200 1 ist, kann es in keiner Stichprobe 2 haben. Somit ist PX 2 0. Die Nullhypothese muss verworfen werden. Verwenden wir mit Zurücklegen einen Binomialtest erhalten wir folgendes Resultat: ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 176 Wir berechnen: PX 2 1 PX 2 für X B20, 0. 005 und erhalten 1 0. 9998663. 1. 337 10 4 Die Nullhypothese ist widerlegt. 8) H 0 : Die Lieferung entspricht den Lieferbedingungen. H A : Die Lieferung entspricht den Lieferbedingungen nicht. 1% auf 500 macht 5. Wir verwenden einen Hypergeometrischen Test. Wir berechnen PX 2 für X HN, M, n H500, 5, 20 (N für Anzahl Grundgesamtheit; M für Anzahl Defekte in der Grundgesamtheit; n Stichprobengrösse; die Reihenfolge der Angabe der Parameter kann von Buch zu Buch verschieden sein. Bei Exel wird z.B. eine andere Reihenfolge gewählt). Anzahl defekte xi 2 3 4 5 Summe: P(xi) 0.013634848 0.000513446 9.11126E-06 6.07417E-08 0.014157466 Somit ist die Abweichung signifikant. Die Lieferung entspricht den Lieferbedingungen nicht. 9) (Beispiele der 2. HSW 2000/01 a) Innerhalb eines Jahres gibt es in einer Firma durchschnittlich 5 Ausfälle im Computersystem mit Schadenfolgen. Die Firma führt ein Qualitätssystem ein. Nach der Einführung ergeben sich noch 3 Ausfälle. ( 0. 05. Hat sich die Einführung des Qualitätssystems gelohnt? H 0 : Durch die Einführung des Qualitätssystems hat sich nichts geändert. H A : Durch die Einführung des Qualitätssystems ergeben sich weniger Ausfälle ( linksseitiger Test). Wir verwenden einen Poissontest: Wir berechnen PX 3 für X P5. Anzahl Ausfälle xi 0 1 2 3 Summe P(xi) 0.006737947 0.040427682 0.124652019 0.265025915 0.436843564 Das System lohnt sich (unabhängig von allfälligen Kosten) nicht. b) Bei der Prüfung der Zielerreichung in einer Unternehmung wird eine Stichprobe von 1000 Mt. (aus 10000) gezogen. Laut Zielvorgabe dürfen höchstens 12 auf 10’000 das Ziel nicht erreichen. Die Stichprobe weist 4 Mt auf, welche das Ziel nicht erreicht haben. ( 0. 05. H 0 : Die Produktion entspricht den Anforderungen. H A : Die Produktion entspricht den Qualitätsanforderungen nicht (ist schlechter als ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 177 erwünscht)( rechtsseitiger Test). (Problem mit der Aufgabenstellung: 1000 Stück für die Stichprobe ist zuviel - kostet zu viel! Zwar wird das Vertrauensintervall bei grossen Stichproben kleiner, der Aufwand wird sich jedoch kaum lohnen). Deshalb wählen wir eine kleinere Stichprobe: 50 und nehmen an, 2 auf 50 hätten das Ziel nicht erreicht. Wir können einen Binomialtest anwenden - auch wenn wir nicht zurücklegen. Wir müssen PX 2 für X P50, 0. 0012 berechnen (1 PX 2 1 0. 998302326 1. 697 7 10 3 ) Es gilt: PX 2 0. 05. Somit muss die Nullhypothese abgelehnt werden. Mit der Hypergeometrischen Verteilung erhalten wir für PX 2 0. 001566215 für X H10000, 12, 50 c) Von 300 dürfen bei der Endkontrolle höchstens 3 Endprodukte fehlerhaft sein. Wieviele fehlerhaft Stücke dürfen bei einer Stichprobe von 50 Stücken auftreten, damit die Produktion die Anforderungen erfüllt? Ziehen wir 50 auf 300 ohne Zurücklegen, müssen wir die Hypergeometrische Verteilung verwenden, bei Zurücklegen die Binomialverteilung (fehlerhafte Stücke möchte man ja im Allgemeinen nicht zurücklegen!!!). 0. 05. Wir berechnen somit das maximale x i , so dass PX x i 0. 05 für X H300, 3, 50. Anzahl fehlerhaft xi P(xi) umgekehrt kumulativ 3 2 1 0 0.004399452 0.068741442 0.349318758 0.577540347 0.004399452 0.073140895 0.422459653 1 Wir erhalten:PX 3 0. 004399. Es darf höchstens zwei fehlerhafte Endprodukt in der Stichprobe haben. Sonst muss die Nullhypothese verworfen werden. Mit der Binomialverteilung (samt Zurücklegen) erhalten wir: PX 1 0. 910564687 und PX 2 0. 986182729 für X B50, 0. 01. Somit darf die Stichprobe bei Verwendung dieser Verteilung höchstens ein fehlerhaftes Stück aufweisen. d) Typfehler bei der Eingabe von Buchungen. Von der Lehrtochter wurden 200 Buchungen vorgenommen. Diese werden vom Ausbildungschef stichprobenweise überprüft. Es wird eine Zufallsstichprobe von 20 gezogen, wobei entdeckte Fehler jeweils korrigiert werden. Der Ausbildungschef betrachtet bei Anfängerinnen und Anfängern Buchungen mit 2% Fehler als akzeptabel. In der Stichprobe entdeckt der Ausbildungschef 3 Fehler. H 0 : Die Lehrtochter macht nicht zuviele Fehler. H A : Die Lehrtochter macht zuviele Fehler ( rechtsseitiger Test). Wollen wir eine Hypergeometrische Verteilung verwenden, müssten wir die Versuchsanordnung ändern: Die Fehler dürften nicht nur korrigiert werden, sondern müssten auch der Grundgesamtheit entnommen werden. Dies gilt auch für fehlerlose Buchungen. Man sieht ohne Rechnung, dass es nicht möglich ist, 3 Fehler zu machen, wenn in der Grundgesamtheit 2 vorkommen. Entsprechend gilt für pX 3 0 für X H200, 2, 20. Die Nullhypothese muss verworfen werden. Verwenden wir einen Binomialtest müssen die gezogenen Buchungen jeweils in die Grundgesamtheit ”zurückgelegt” werden. Damit der Ausbildungschef die Fehler ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 178 trotzdem verbessern kann, kann er Buchungen verbessern und sie entsprechend markieren. Wird eine solche Buchung nochmals gezogen, gilt sie für die Berechnung als fehlerhaft. Wir erhalten: PX 3 1 PX 3 1 0. 992931307 0. 007068 7 für X B20, 0. 02. Die Lehrtochter macht zuviele Fehler (Befinden sich zwei Fehler in der Stichprobe, wäre das auch schon zuviel! Nur bei einem Fehler, muss die Nullhypothese knapp nicht verworfen werden). ___________________________________________________________________ Univariate Teststatistik.tex 2. HSW Siders P.R. 179 2. Univariate Tests mit stetigen Verteilungen 2.1. Einstichprobentests Im Einstichprobentest vergleichen wir einen Parameter einer Stichprobe mit einem vorgegebenen Parameter einer Grundgesamtheit, um zu untersuchen ob die Abweichung signifikant ist oder nicht (wir haben eine Stichprobe, die wir mit bekannten Parametern einer Grundgesamtheit vergleichen!) 2.1.1. z-Test Ziel: Getestet wird die Abweichung des Mittelwertes x (Wert der Zufallsvariable X ) einer Stichprobe vom bekannten Mittelwert o einer Grundmenge Voraussetzungen: die Zufallsvariablen X i , als deren Werte die Daten x i der Stichprobe betrachtet werden, sind unabhängig und identisch verteilt. Die Varianz 2o der Grundmenge ist bekannt (bei kleinen Stichproben - n 30 - müssen die Daten normalverteilt sein) (stetig, metrisch skaliert). Beispiel 1: Wir wollen testen, ob sich nach der Einführung einer neuen Mastmethode das durchschnittliche Gewicht x von n Schweinen signifikant erhöht hat, wobei die Standardabweichung o und der Mittelwert o der Ergebnisse der traditionellen Mastmethode bekannt ist. Wir nehmen an, die Einzelergebnisse x i , die zum Mittelwert x führen, seien voneinander unabhängig, was bei Schweinemast recht problematisch ist (ansteckende Krankheiten, die sich aufs Gewicht auswirken!); Zudem nehmen wir an, die Einzelwerte seien gleich verteilt. In einem konkreten Fall möge gelten: x 20. 5 kg ( zu testende Grösse); o 19. 5 kg o 2 n 50 H o : Die Ergebnisse der verschiedenen Mastmethoden unterscheiden sich nicht. H A : Der Mittelwert der neuen Mastmethode ist grösser als der Mittelwert der alten Mastmethode ( einseitiger, rechtsseitiger Test). Signifikanzniveau: 0. 01. Da die standardisierten Mittelwerte (für n unabhängige und gleichverteilte Zufallsvariablen X i ) laut dem zentralen Grenzwertsatz für genügend grosse n näherungsweise standardnormalverteilt sind, können wir die Normalverteilung verwenden, um einen sogenannten z-Test durchzuführen: ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 179 Modell ( Verteilung der zu testenden Grösse): Z X o o n N0, 1 Zufallsvariable X mit dem Wert x (Mittelwert der n Daten) o : Mittelwert der Grundmenge o : Standardabweichung der Grundmenge Man überlege sich die intuitive Bedeutung der Formel X o o n : Der Testwert Z weicht mehr von 0 ab, wenn die Differenz zwischen X und o grösser ist. Zudem wird der Testwert kleiner, wenn die Varianz grösser ist (je mehr die Daten streuen, desto weniger ist die Differenz von X und o bedeutsam). Der Testwert steigt, wenn die Zahl der Daten grösser wird (je grösser die Stichprobe, desto eher wird die Differenz von X und o bedeutsam. Fürs Beispiel berechnen wir: 20.519.5 2 50 3. 535 5. Da 3. 5355 0. 999796456, ist der p-Wert 1 0. 999796456 2. 035 4 10 4 0. 01. Damit ist der Unterschied hochsignifikant. Bei kleinen Stichproben müssen wir prüfen, ob die Daten normalverteilt sind, da nur der Mittelwert normalverteilter Daten kleiner Stichproben normalverteilt ist. Die Verteilung der Mittelwerte anderer Verteilungen ist jedoch nur für genügend grosse n näherungsweise normal. Beispiel 2: Die durchschnittliche Lebensdauer von Transmissionsriemen eines bestimmten Typs betrage 7 Monate (Standardabweichung: 1). Bei einem Test wird eine neue Generation von Riemen untersucht, die zwar teurer sind, für welche die Werbung jedoch eine längere Lebensdauer verspricht. Es werden 30 Riemen getestet, die durchschnittlich 7.2 Monate halten. Ist der Unterschied signifikant? H 0 : Die durchschnittliche Lebensdauer unterscheidet sich nicht. H A : Die Lebensdauer der neuen Riemen ist länger ( rechtsseitiger Test). Wir nehmen an, die Lebensdauer der Riemen sei unabhängig und gleichverteilt. Entsprechend können wir einen z-Test durchführen (Signifikanzniveau 0.01): 7.27 1 30 1. 095 4 0. 863329244. Der P-Wert ist somit: 1 0. 863329244 0. 136 67 0. 01. Der Unterschied der durchschnittlichen Lebensdauer ist nicht signifikant. 2.1.2. Test auf abweichende Varianz (normalverteilte Daten) Ziel: Getestet wird die Abweichung der Varianz 2 einer Stichprobe von der bekannten Varianz 20 einer Grundmenge. Voraussetzungen: Die Zufallsvariablen X i , als deren Werte wir die Daten x i ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 180 auffassen, sind identisch normalverteilt und unabhängig. Die Varianz der Grundmenge ist bekannt (stetig, metrisch skaliert) Beispiel 3: Eine Abfüllanlage führt durch zu grosse Streuung zu hohen Verlusten. Die Streuung der Abfüllanlage ist bekannt und beträgt o . Die Firma überlegt sich die Anschaffung einer neuen Maschine, die eine signifikant kleinere Streuung aufweisen sollte. Als Streuungsmass wird die Varianz verwendet. Die neue Maschine wird getestet, indem 100 Gläser abgefüllt werden. H 0 : Die Varianzen unterscheiden sich nicht. H A : Die Varianz der neuen Abfüllanlage ist kleiner ( linksseitiger Test). Um das Beispiel zu lösen, brauchen wir einen Ausdruck, der uns die Verteilung der n Varianz angibt. Wir definieren die Zufallsvariable S 2 : 1 X X 2 . Diese n1 i1 Zufallsvariable weist konkrete Varianzen als Werte auf. Wenn die Xi X o standardnormalverteilt und unabhängig sind (und das gilt genau dann, wenn die Daten x i normalverteilt und unabhängig sind), dann gilt für den Ausdruck laut n Definition der 2n Verteilung:: Xi X 2 2n1 (n ist die Anzahl der unabhängigen o i1 Zufallsvariablen X i . Da X aus den X i berechnet wird, gilt für die Zufallszahlen D i X i X : n unabhängige X i ergibt n 1 unabhängige D i . Sind nämlich n 1 Daten und der Mittelwert gegeben, dann ist auch die n te Zahl bestimmt. Beispiel: Der Mittelwert von 5 Zahlen 1, 3, 10, 4, x sei 6. Nun kann x berechnet werden: 13104x 6 x 12). 5 n Wir erhalten: i1 X i X o 2 1 2o n X i X 2 i1 1 n1 2o n1 n X i X 2 i1 n1S 2 2o 2n1 Im ersten Schritt klammern wir 12 aus. o Im zweiten Schritt erweitern wir mit n 1. Im dritten Schritt wenden wir die Definition von S 2 an. Es gilt also: n1S 2 2o 2n1 Zufallsvariable S 2 mit dem Wert 2 der Stichprobe 2o : Varianz der Grundmenge n : Anzahl Daten Nehmen wir nun an, wir haben für die alte Abfüllanlage eine Standardabweichung von 15 g, für die neue eine solche von 10 g. Es stellt sich die Frage, ob die Abweichung signifikant ist ( 0. 01). Wir müssen zuerst mit Hilfe eines P-P-Plots untersuchen, ob die Daten normalverteilt sind. Wenn die Normalverteilungsannahme akzeptiert werden kann, können wir berechnen: 10 2 99 44; 15 2 299 44 1 0. 999999679 0. 01. Die Varianz der neuen Abfüllanlage ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 181 unterscheidet sich (hoch) signifikant von der alten. ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 182 2.1.3. Test auf Kennzahlen mit bekannter, nicht-normaler Verteilung Ziel: Getestet wird die Abweichung der Kennzahl einer Stichprobe von der bekannten Kennzahl einer Grundmenge. Voraussetzungen: Die Verteilung der Zufallsvariablen X i , als deren Werte wir die Daten x i auffassen, ist bekannt. Die Kennzahl der Grundmenge ist bekannt. (stetig metrisch skaliert) Um eine Näherung der Werte der Verteilung der Kennzahl zu berechnen, erstellen wir mit Excel 1000 (oder mehr - möglichst viele) Datensätze mit der bekannten Verteilung. Für jeden Datensatz berechnen wir die entsprechende Kennzahl und die empirische, relative, kumulative Häufigkeitsverteilung der Kennzahlen. Im Test verwenden wir dann die Werte dieser relativen Häufigkeitsverteilung. Beispiel 4: Eine Firma möchte die Varianz der Lebensdauer eines Produktes verringern. Auf Grund langjähriger und vieler Daten weiss man, dass die Produkte, die dem gegenwärtigen Produktionsprozess entstammen, exponentialverteilt sind ( 1 2 1. Der neue Produktionsprozess führt zu einer Varianz von 0. 7, wobei 50 Produkte getestet wurden. Ist der Unterschied der Varianzen signifikant? H 0 : Die Varianzen unterscheiden sich nicht. H A : Die Varianz der Stichprobe ist kleiner als die Varianz der alten Daten ( linksseitiger Test). ( 0. 05. Kennen wir die Verteilung der Varianz nicht, so können wir z.B. 1000 exponentialverteilte Datensätze erstellen (siehe Excel-Datei: ”Verteilung Varianz exponentialverteilter Daten.xls”, wo 1020 Sätze verwendet wurden). Im Beispiel finden wir PX 0. 7 0. 245. Somit ist die Abweichung nicht signifikant. Signifikant unterschiedlich auf dem 0.05-Niveau wäre eine Varianz von ca. 0. 64. Kennen wir die Verteilung der Daten nicht und hat man viele Daten, so gibt es ebenfalls Verfahren, um die Verteilung von Kennzahlen näherungsweise empirisch zu bestimmen. So kann man 1000 Zufallsstichproben (z.B. à 50 Daten, mit Zurücklegen) aus dem Datensatz ziehen und berechnet die Kennzahl für jede dieser Zufallsstichproben. Die empirische Verteilung der Kennzahlen der Datensätze entspricht näherungsweise der Verteilung der Kennzahl der Daten. ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 183 2.1.4. t-Test Ziel: Getestet wird die Abweichung des Mittelwertes einer Stichprobe vom bekannten Mittelwert einer Grundmenge Voraussetzungen: die Zufallsvariablen X i , als deren Werte die Daten x i der Stichprobe betrachtet werden, sind unabhängig und identisch normalverteilt. Die Varianz der Grundmenge ist unbekannt und wird aus den Daten geschätzt (stetig metrisch skaliert). Da wir die Varianz aus den Daten schätzen müssen, ist die empirische Varianz als n Wert einer Zufallsvariable S 2 1 X i X 2 aufzufassen. n1 Es gilt: X S n Zudem gilt: X S2 n X n 1 X 1 S2 n 1 1 n i1 X S2 2 1 1 n X n1S 2 n1 2 X n n1S 2 n1 2 N0, 1, wenn n 30 oder wenn die Daten normalverteilt sind und - wie bereits gezeigt: n1S 2 2 n1 , sofern die Daten normalverteilt sind. Laut Definition der t-Verteilung gilt somit: X n n1S 2 n1 2 t n1 für normalverteilte Daten. Wir fassen zusammen: X 0 S n t n1 0 Mittelwert der Grundgesamtheit X : Zufallsvariable mit x der Stichprobe als Wert S : Zufallsvariable mit der Stichprobe als Wert. n: Anzahl der Daten Wir sehen, dass gegenüber dem z-Test nur 0 durch S ersetzt wird, dass jedoch die Verteilung ändert. Beispiel: In einem Test wurden die folgenden Bremswege (in Meter) für ein Profil A ermittelt: 44.5; 55.1; 52.5; 50.2; 45.3; 46.1; 52.1; 50.5; 50.6; 49.2 ( 2 11. 55433333, x 49. 61; n 10). Für das Profil B ergab sich bisher ein Mittelwert von 55. Ist der Unterschied signifikant? ( 0. 01 H 0 : Die mittleren Bremswege unterscheiden sich nicht. ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 184 H A : Der mittlere Bremsweg von Profil A unterscheidet sich ( zweiseitiger Test). Wir überprüfen die Daten mit einem P-P-Plot auf Normalverteilung. Mit SPSS (Graphiken, P-P-Diagramm, Normal) erhalten wir: P-P-Diagramm von Normal von REIFEN 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Wir entscheiden, dass die Daten (knapp) der Normalverteilungsannahme entsprechen. T 49.6155 1 10 11.55433333 5. 014 4 t 9 . Wir berechnen mit Excel: t 9 5. 014 4 PT 5. 014 4 0. 000724597 0. 005 (die t-Verteilung ist symmetrisch und Excel liefert die Werte, d.h. 1 PT x). Somit ist das Ergebnis hochsignifikant. Mit SPSS: Analysieren, Mittelwerte vergleichen, t-Test bei einer Stichprobe, Mittelwert der Grundgesamtheit (55) für ”Testwert” eingeben. Wir erhalten das folgende Resultat: Test bei einer Sichprobe Testwert = 55 REIFEN T -5.014 df 9 Sig. (2-seitig) .001 Mittlere Differenz -5.3900 95% Konfidenzintervall der Differenz Untere Obere -7.8216 -2.9584 Dabei bezeichnet T: der obige T-Wert; df: Anzahl Freiheitsgrade (degrees of freedom). ; Sig. (2-seitig): es wird zweiseitig getestet und das Resultat ist signifikant auf dem 0.001-Niveau. ; Mittlere Differenz: Es wird die mittlere Differenz der Werte der Stichprobe vom Mittelwert 55 berechnet. ; Konfidenzintervall (Vertrauensintervall) der Differenzen: Mit einer Wahrscheinlichkeit von 95% befindet sich die mittlere Differenz im Intervall [-7.8189; -2.9811]. ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 185 2.1.5. Vorzeichentest Ziel: Getestet wird, ob Daten x i einer Stichprobe zum bekannten Median med o einer Grundmenge passen Voraussetzungen: die Zufallsvariablen X i , als deren Werte die Daten x i der Stichprobe betrachtet werden, sind unabhängig. (ordinal oder metrisch skaliert) Die Vorausetzungen des t-Testes sind recht stark (Normalverteilung der Daten). Auch beim z-Test müssen wir bei kleinen Datensätzen die Normalverteilung der Daten voraussetzen. Mit weniger Voraussetzungen kommt der Vorzeichentest aus. Wir berechnen x i med o und zählen beim linksseitigen Test die Anzahl der negativen Vorzeichen (d.h. wir zählen die Anzahl m der Daten x i med o . Passen die Daten zum Median, so beträgt die Wahrscheinlichkeit, dass ein Datum kleiner als der Median ist, 0.5. Wir können somit einen Binomialtest anwenden. Für die Anzahl der positiven Vorzeichen gilt (wenn keine Daten exakt auf den alten Median fallen): r n m, wobei n die Stichprobengrösse ist. Wir erhalten als p-Wert: PX m für X Bn, 0. 5 für den linksseitigen Test PX r für X Bn, 0. 5 für den rechtsseitigen Test 2 minPX m, PX r für X Bn, 0. 5 für den zweiseitigen Test Im Reifenbeispiel sei med o 55. H 0 : Die Daten passen zu einer Verteilung mit dem Median 55 H A : Die Daten passen nicht zu einer Verteilung mit dem Median 55 und liegen tiefer ( linksseitiger Test). ( 0. 05 Wir berechnen nun alle Differenzen x i 55 und zählen die Anzahl der negativen Vorzeichen dieser Differenzen (d.h. wir zählen die Anzahl m der Bremswege x i , für die gilt: x i 55. Es sind dies 9 negative Vorzeichen auf 10 Daten. Wir berechnen also: PX 9 mit X B10, 0. 5. PX 9 0. 010742188 0. 05. Das Ergebnis ist signifikant. Mächtigkeit von Tests Der Vorzeichentest verwendet nicht alle Informationen der metrisch skalierten Daten: er berücksichtigt nicht, ob die Daten nahe oder weit vom alten Median entfernt sind. Damit läuft man Gefahr, Opfer des Fehlers zweiter Ordnung zu werden. Verringert ein Test A die Gefahr eines Fehlers zweiter Ordnung gegenüber einem Test B, so sagen wir, dass A mächtiger ist als B. Die Wahrscheinlichkeit dafür, die falsche Nullhypothese zu verwerfen, wird Macht oder Güte des Testes genannt. Wir können somit feststellen: Der Vorzeichentest macht weniger Voraussetzungen, er ist aber weniger mächtig als der t- oder der z-Test bei Daten, die die Voraussetzungen dieser Tests erfüllen. ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 186 2.1.6. Test auf Anteile Ziel: Bei den Tests bezüglich Anteilen geht es darum, zu untersuchen, ob der Anteil einer Stichprobe zum Anteil einer Grundgesamtheit passt. Wir können bei Einstichproben-Anteilstest die Binomialverteilung verwenden: Beispiel: Wir nehmen an, der Anteil der Frauen bei den Konsumenten eines Produktes betrage 0.3. Die Branche möchte diesen Anteil erhöhen und lanciert eine Werbekampagne. Nach der Kampagne wird eine Stichprobe gezogen, um zu überprüfen, ob die Kampagne wirksam war. Wir nehmen an, in der Stichprobe (n 50; die Stichprobe umfasst nur Konsumenten des Produktes) habe sich ein Anteil Frauen von 0.4 ergeben. Ist der Unterschied signifikant? H 0 : Die Anteile unterscheiden sich nicht H A : Der Anteil der Frauen ist gestiegen ( rechtsseitiger Test; 0. 05. Unter der Nullhypothese beträgt die Wahrscheinlichkeit, eine Frau zu ziehen 0. 3. Die Situation kann offensichtlich mit Hilfe einer Binomialverteilung modelliert werden, wenn die Grundgesamtheit genügend gross ist, so dass wir auf Zurücklegen verzichten können. 0. 4 50 20. Gesucht ist somit PX 20 für B 50, 0. 3. Wir erhalten: PX 20 1 PX 20 0. 084803 0. 05. Der Unterschied der Anteile ist nicht signifikant. Übungen: 1) Eine Firma untersucht, ob ein neuer Typ von Glühbirnen für ihre Fabrikationsgebäude sie billiger zu stehen kommt. Die neuen Birnen konsumieren gleichviel Strom wie die alten, kosten jedoch etwas mehr. Der Lieferant verspricht für die neuen Birnen einen längere Lebensdauer. Die Firma kennt die durchschnittliche Lebensdauer der alten Glühbirnensorte: 13 Monate (Standardabweichung: 2). Bevor Sie auf die neuen Birnen umsteigt, will Sie in einer der Hallen diese testen. 35 Birnen brennen durchschnittlich 14 Monate lang. Ist der Unterschied signifikant ( 0. 01? Wieviel darf der Preisunterschied betragen, damit sich die neuen Birnen lohnen? 2) Eine Eisenwarenfabrik möchte bei der Produktion von Schrauben eine tiefere Varianz der Länge der Schrauben herbringen, um den Ausschuss zu verringern. Dazu werden verschiedene neue Maschinen getestet. Die Länge von Schrauben sei normalverteilt. Die Varianz der bekannten Grundgesamtheit sei 1 mm. Es wird eine Zufallsstichprobe von 50 Schrauben aus einem von einer neuen Maschine produzierten Haufen gezogen ( 0. 01. Für die Messresultate siehe Exceldatei ”Übung 2 Testen auf Varianz.xls” (in cm). Testen Sie! 3) Ein Produktionsstätte hat bei der Schraubenproduktion für Schrauben, die genau 10 cm haben sollten, einen mittleren Wert von 9. 9. Sie justiert die Maschine und zieht eine Stichprobe von 50 Schrauben (für die Messresultate siehe Exceldatei ”Übung 3 Testen ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 187 auf Mittelwert.xls”. Testen Sie ( 0. 01. 4) Der Median der Noten einer Klasse (ohne des Fach Buchhaltung) betrage 4.45. In Buchhaltung werden folgende Noten erzielt: 5.5; 4.5; 4; 3; 3.5; 3.7; 3.3; 5; 4.5; 4.7; 4.8; 4.1; 4.2; 4.3; 4.25. Passen die Daten zum Median der Gesamtnoten? ( 0. 01 5) Anton behauptet, 45% der Bevölkerung seien für eine bestimmte politische Vorlage. Es wird eine Zufallsstichprobe gezogen (50 Personen). Dabei sprechen sich 15 Personen für die Vorlage aus. Ist die These Antons haltbar? ( 0. 05) 6) Finden Sie zu jeder der obigen Problemstellungen eine betriebswirtschaftliche Aufgabe und lösen Sie diese. Lösungen 1) H 0 : Die durchschnittliche Lebensdauer der neuen Birnen unterscheidet sich nicht von der der alten Birnen H A : Die durchschnittliche Lebensdauer der neuen Birnen ist grösser als jene der alten Birnen ( rechstseitiger Test).Wir nehmen an, dass die Lebensdauer der Birnen voneinander unabhängig ist und dass Gleichverteilung vorliegt. Wir können somit den Z-Test verwenden: 1413 2 35 2. 958 0. 998451721. Der p-Wert ist somit: 0. 998451721 0. 001548 3 0. 01. Der Unterschied in der Lebensdauer ist signifikant. y Durschnittlich kostet eine neue Birne pro Monat 14x und eine alte 13 (x und y sind die Preise der jeweiligen Birnen). Die neuen Birnen lohnen sich, wenn y x 13 . xy 14 (da y 0). Somit muss das Preisverhältnis xy 14 1. 076 9 14 13 13 sein (die neue Birne darf nicht mehr als 7. 69% teurer sein). 2) H 0 : Die Varianzen unterscheiden sich nicht. H A : Die Varianz der Stichprobe ist kleiner als die Varianz der alten Grundgesamtheit ( linksseitiger Test). Wir überprüfen die Daten auf Normalverteilung (mit P-P-Plot): ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 188 P-P-Diagramm von Normal von Reifen 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Daten sind deutlich normalverteilt Die Varianz der Stichprobe beträgt: 2 0. 01 2 50 1 4. 9 249 Wir erhalten: S 2 n 1 0.01 0.1 o Für 4.9 erhalten mir mit Excel den näherungsweisen Wert 1: Da wir linksseitig testen, gilt pX 4. 9 1 1 0 0. 01. Die Differenz ist signifikant. 3) H 0 : Die Mittelwerte unterschieden sich nicht. H A : Der neue Mittelwert liegt höher ( rechtsseitiger Test). Da wir die Varianz der Grundmenge nicht haben, müssen wir den t-Test verwenden. Wir überprüfen die Daten auf Normalverteilung (mit P-P-Plot). Mit SPSS erhalten wir: P-P-Diagramm von Normal von SCHRAUBE Übung 3 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 189 Die Daten können knapp als normalverteilt betrachtet werden. Die Varianz der Stichprobe beträgt: 2 0. 001652244; der Mittelwert: 9. 99. X 9.999.9 Wir erhalten als Testgrösse: S 0 0.001652244 15. 656 t 49 n 50 Mit Excel erhalten wir: p Wert 5. 28185E 21 Die Abweichung ist hochsignifikant. Mit SPSS erhalten wir: Test bei einer Sichprobe Testwert = 9.9 SCHRAUBE T 15.656 df 49 Sig. (2-seitig) .000 Mittlere Differenz 9.000E-02 95% Konfidenzintervall der Differenz Untere Obere 7.845E-02 .1016 4) Noten sind ordinalskaliert. Somit kommen der z-Test und der t-Test nicht in Frage. H 0 : Die Buchhaltungsnoten weichen nicht von den übrigen Noten ab. H A : Die Buchhaltungsnoten liegen signifikant tiefer ( linksseitiger Test). Wir verwenden den Vorzeichentest: Wir zählen die Noten, die kleiner als 4. 45 sind. Es sind dies 9 auf 15. Wir berechnen für X B15, 0. 5 PX 9 1 pX 9 0. 303619385 0. 01. Die Buchhaltungsnoten unterscheiden sich nicht-signifikant von den übrigen Noten. 5) Wir testen zweiseitig: H 0 : Die Zufallsstichprobe passt zu einem Anteil von 0.45. H A : Die Zufallstrichprobe passt nicht zu einem Anteil von 0.45. Wir erhalten: PX 15 1 0. 010383581 für X B50; 0. 45 Wir erhalten: PX 15 0. 010383581. Der p-Wert ist somit: 2 0. 010383581 0. 02076 7 0. 05. Die Abweichung ist signifikant. Die Erhebungsresultate sind mit der Meinung Antons nicht verträglich. Lernziele - Grundbegriffe der Testtheorie kennen und korrekt anwenden können (Nullhypothese; Alternativhypothese; Signifikanzniveau; rechtseitiger, linksseitiger und zweiseitiger Test; p-Wert; Fehler 1. und 2. Ordnung). - Verwertungsprinzip formulieren und anwenden können - Tests mit diskreten Verteilungen (Binomial, Poisson, Hypergeometrisch) durchführen können (Übungen von der Art des Übungsblocks lösen können). - Den Begriff des ”Einstichprobentests” kennen und die Situation beschreiben können, für die Einstichprobentests verwendet werden. Folgende Einstichprobentests situationsgerecht auswählen und durchführen können: z- Test, Test auf abweichende ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 190 Varianz, t-Test, Vorzeichentest, Test auf Anteile. - Begriff der ”Mächtigkeit eines Tests” kennen - Übungen von der Art des Übungsblocks lösen können (von Hand, mit Excel, mit SPSS). ___________________________________________________________________ Tests mit stetigen Verteilungen I.tex 2. HSW Siders P.R. 191 2.2. Zweistichprobentests 2.2.1. Verbundene Stichproben Von verbundenen Stichproben reden wir, wenn zwei Stichproben vorliegen und Messungen x i und y i beider Stichproben x und y jeweils zu denselben Objekten i gehören (z.B. 17 Personen werden darauf hin untersucht, wie sie auf Alkohol reagieren, indem die jeweilige Reaktionszeit in Sekunden gemessen wird. Für jede der 17 Personen wird die Reaktionszeit vor und nach dem Alkoholgenuss gemessen, wobei jeder Person das Äquivalent von 0. 0005 G (G Gewicht in Kilogramm) in Gramm Alkohol verabreicht wird 2.2.1.1. t-Test Ziel: Zwei gepaarte Stichproben werden verglichen, um zu entscheiden, ob sie zur selben Grundgesamtheit gehören. Voraussetzungen: Die Differenzen der Daten sind unabhängig und gleichverteilt. Die Varianz der Differenzen wird aus den Daten geschätzt. Die Differenzen müssen normalverteilt sein (metrisch skaliert) Wir können diesen Fall auf den Einstichprobenfall zurückführen, indem wir die Differenzen der gepaarten Daten verwenden und den Mittelwert der Null-Hypothese mit 0 identifizieren. Wir erhalten: T D Sd t n1 n : Zufallsvariable mit dem Mittelwert der Differenzen d als Wert D S d : Zufallsvariable mit der Standardabweichung d der Diffferenzen als Wert n: Anzahl Differenzen ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 191 Beispiel 1: Wir nehmen an, es würde sich für die Personen die folgenden Reaktionszeiten vor und nach dem Alkoholgenuss ergeben: (Die Daten finden Sie unter ”Verbundene Stichproben, Beispiel 1.xls)” Proband vorher 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1.0094457 1.14380179 1.1352306 0.94454264 1.06805223 0.85907117 0.87344145 1.07597525 1.01924109 0.88134543 1.00395228 0.95419014 1.05589406 1.0181175 1.22965021 0.90778402 0.95258204 nachher Differenzen 1.88997984 -0.88053414 2.11894739 -0.9751456 2.01103206 -0.87580146 1.79720411 -0.85266147 1.93721726 -0.86916503 1.66888887 -0.8098177 1.72031967 -0.84687822 1.96575519 -0.88977994 1.89280853 -0.87356744 1.82893329 -0.94758786 1.91036646 -0.90641418 1.85323718 -0.89904704 1.9774006 -0.92150653 1.88238345 -0.86426594 2.13653477 -0.90688455 1.81336351 -0.90557949 1.88715504 -0.934573 Wir müssen die Differenzen auf Normalverteilung prüfen. P-P-Diagramm Normal Differenzen 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Differenzen können als normalverteilt angesehen werden. Der Mittelwert der Differenzen beträgt: 0. 891718213 Die Standardabweichung der Differenzen beträgt: 0. 040089677 H o : Die Reaktionszeit verändert sich nicht. H A : Die Reaktionszeit ist länger ( rechtsseitiger Test). ( 0. 05 Die t-Verteilung ist symmetrisch. Je nachdem, ob wir die erste Reihe von der zweiten oder die zweite von der ersten abzählen, erhalten wir ein anderes Vorzeichen des Mittelwertes. So wie wir oben abgezählt haben, wird der ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 192 rechtsseitige Test zum linksseitigen Test. Wir berechnen: t 16 D Sd n 0.891718213 0.040089677 17 91. 711 t91. 711 1. 65978E 23. Die Nullhypothese muss verworfen werden. t-Test für verbundene Stichproben mit Excel Befehl: Statistik, ttest Syntax TTEST(Matrix1;Matrix2;Seiten;Typ) Matrix1 ist die erste Datengruppe. Matrix2 ist die zweite Datengruppe. Seiten bestimmt die Anzahl der Endflächen (Schwänze). Ist Seiten 1, verwendet TTEST eine Endfläche (einseitiger Test). Ist Seiten 2, verwendet TTEST zwei Endflächen (zweiseitiger Test). Typ bestimmt die Form des durchzuführenden t-Testes. Ist Typ gleich Wird folgender Test ausgeführt 1 Gepaart 2 Zwei Stichproben, gleiche Varianz (homoskedastisch) 3 Zwei Stichproben, ungleiche Varianz (heteroskedastisch) Für die obigen Daten erhalten wir als P-Wert 1.65989E-23 t-Test für verbundene Stichproben mit SPSS Befehl: Analysieren, Mittelwerte vergleichen, t-Test bei gepaarten Stichproben. Wir erhalten als Resultat für die obigen Daten: Test bei gepaarten Stichproben Gepaarte Differenzen VORHER NACHHER Mittelwert Standardab weichung Standardfe hler des Mittelwertes -.8917 4.009E-02 9.723E-03 95% Konfidenzintervall der Differenz Untere Obere -.9123 -.8711 T df -91.71 16 Dabei ist der ”Standardfehler des Mittelwertes” die geschätzte Standabweichung des Mittelwertes der Differenzen. ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 193 Sig. (2-seitig) .000 2.2.1.2. Vorzeichentest Ziel: Zwei gepaarte Stichproben werden verglichen, um zu entscheiden, ob sie zur selben Grundgesamtheit gehören. Voraussetzungen: Die Differenzen der Daten sind unabhängig und gleichverteilt. (metrisch oder ordinal skaliert) Den Vorzeichentest können wir verwenden, wenn die Annahmen des t-Testes nicht erfüllt sind oder wenn wir ordinalskalierte Daten verwenden. Bei metrisch skalierten Daten berechnen wir die Differenz der Daten und zählen die negativen oder positiven Vorzeichen. Bei ordinalskalierten Daten steht eine Relation R zur Verfügung (z.b. des Besserseins). Wir zählen die Anzahl der Paare x i , y i R. Unter der Nullhypothese setzen wir die Binomialverteilung voraus (p 0.5). Beispiel 2 (metrisch skaliert): 10 Personen werden darauf hin untersucht, wie ihre Konzentrationsfähigkeit bei der Arbeit von Musik abhängt. Die Konzentrationsfähigkeit wird mit in Geld messbarem Output pro Tag gemessen. An einem Tag arbeiten die Personen mit Musik ihrer Wahl, am anderen Tag ohne Musik (dabei ist auf Gleichheit der übrigen Bedingungen zu achten. Es wäre ungünstig, eine Messung an einem Hochdrucktag und die andere an einem Föhntag vorzunehmen!). Wir nehmen an, wir würden die folgenden Daten erhalten (die Daten finden Sie unter ”Verbundene Stichproben, Beispiel 2.xls”). mit Musik 349 358 364 351 342 403 412 377 374 381 ohne Musik 365 370 365 365 350 390 400 380 380 370 Differenzen 16 12 1 14 8 -13 -12 3 6 -11 Da wir nicht wissen, ob sich Musik positiv oder negativ auf die Konzentrationsfähigkeit (so wie sie gemessen wird) auswirkt, machen wir einen zweiseitigen Test: H 0 : Musik wirkt sich nicht auf die Konzentration aus. H A : Musik macht einen Unterschied ( zweiseitiger Test) ( 0. 05 Da die Daten metrisch skaliert sind, denken wir zuerst an einen t-Test. Deshalb überprüfen wir die Differenzen auf Normalverteilung: ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 194 P-P-Diagramm Normal Musik 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Wir kommen zum Schluss, dass die Differenzen eventuell nicht normalverteilt sind. Deshalb verwenden wir einen Vorzeichentest. Wir haben 3 negative Differenzen (auf 10). Unter der Nullhypothese betrage die Wahrscheinlichkeit, eine positive oder eine negative Differenz zu haben, 0. 05. Als p-Wert erhalten wir somit: 2 pX 3 2 0. 171875 0. 343 75 0. 05 (oder 0. 171875 0. 025. Die Nullhypothese kann nicht verworfen werden mit X B10, 0. 5. Vorzeichentest für verbundene Stichproben auf SPSS Der zweiseitige Vorzeichentest für gepaarte Stichproben wird von SPSS angeboten. Befehle: Analysieren, Nicht-Parametrische Tests, zwei verbundene Stichproben, Vorzeichentest. Für die obigen Daten erhalten wir: Häufigkeiten N OHNE - MUSIK Negative Differenzena Positive Differenzenb Bindungen c Gesamt 3 7 0 10 a. OHNE < MUSIK b. OHNE > MUSIK c. MUSIK = OHNE Als ”verbunden” werden von SPSS Differenzen bezeichnet, die 0 sind. ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 195 Statistik für Testb OHNE MUSIK Exakte Signifikanz (2-seitig) a .344 a. Verwendetete Binomialverteilung. b. Vorzeichentest Beispiel 3: (ordinal skaliert): Wir überprüfen, ob sich die Probanden mit oder ohne Musik bei der Arbeit subjektiv besser fühlen. Durch Befragung haben wir folgende Resultate erhalten. (Ich fühle mich sehr gut (5), gut (4), ziemlich gut (3), ungut (2), schlecht (1). Proband mit Musik 1 2 3 4 5 6 7 8 9 10 11 12 ohne Musik 4 1 2 3 2 5 5 2 3 3 3 3 3 2 4 1 1 2 4 3 1 5 1 2 H 0 : Musik hat keinen Einfluss auf die Befindlichkeit. H A : Musik hat einen positiven Einfluss auf die Befindlichkeit ( rechtsseitiger Test) ( 0. 05 Es ergeben sich die folgenden Resultate ( für ”es geht besser mit Musik” und - für ”es geht besser ohne”). ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 196 Proband Vorzeichen der Änderung 1 2 3 4 5 6 7 8 9 10 11 12 + + + + + + + + 8 auf 12 Personen fühlen sich mit Musik bei der Arbeit besser, 4 hingegen schlechter. Wir erhalten für PX 8 0. 193847656 für X B12, 0. 5. Der p-Wert ist grösser als das Signifikanzniveau. Das Resultat ist nicht signifikant. Mit SPSS können wir einen solchen Vorzeichentest mit dem Binomialtest ausführen, indem wir die die obige Veränderungsspalte verwenden, wobei wir z.B. ”” durch ”2” und ”-” durch ”1” ersetzen. (Analysieren, nicht parametrische Tests, Binomial). Wir erhalten mit der ersten Spalte: Test auf Binomialverteilung besser mit Musik Gruppe 1 Gruppe 2 Gesamt Kategorie 2.00 1.00 N 8 4 12 Beobachteter Anteil .67 .33 1.00 Für den einseitigen Test erhalten wir somit einen p-Wert von Testanteil .50 0.388 2 Exakte Signifikanz (2-seitig) .388 0. 194 ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 197 2.2.1.3. Rangsummentest für verbundene Stichproben (Wilcoxon-Test) Ziel: Zwei verbundene Stichproben werden verglichen, um zu entscheiden, ob sie zur selben Grundgesamtheit gehören. Voraussetzungen: Die Differenzen der Daten sind unabhängig und gleichverteilt. (metrisch skaliert) (es sollte nicht zuviele gleiche Differenzen geben und diese Gruppen von Differenzen sollten nicht zu gross sein). Die Differenzen sollten symmetrisch um ihr arithmetisches Mittel liegen. Der Vorzeichentest berücksichtigt nicht, wie stark die Abweichungen der Differenzen vom Mittelwert sind. Diesem Nachteil entgeht der Rangsummentest. Wir ordnen den Betrag der Differenzen der Grösse nach. 0-Differenzen lassen wir weg. In einem ersten Durchlauf nummerieren wir die verbleibenden Differenzen der Grösse nach. In einem zweiten Durchlauf ordnen wir gleichen Differenzen ( verbundenen Rängen) das arithmetische Mittel der zugeordneten Nummern zu. Beispiel: Betrag der Differenzen Summen Nummerierung Ränge 7 1 1 6 2 2 5 3 4 5 4 4 5 5 4 4.5 6 6 4 7 7.5 4 8 7.5 3.5 9 9 3 10 10 55 55 Das Beispiel enthält für die Anwendung des Wilcoxon-Testes zu viele verbundenen Ränge. Es ging hier aber ums Beispiel für die Berechnugn der Ränge bei verbundenen Rängen. Wir zählen nun die Ränge der negativen (oder positiven) Differenzen zusammen. Wir bezeichnen diese Zahl mit R oder R . R i ist als Wert einer Zufallsvariable zu nn1 betrachten, wobei gilt: R R 2 (n Anzahl der von 0 verschiedenen nn1 Differenzen, 2 Summe aller Ränge). Die kritischen Werte dieser Verteilung für n 25 (n Anzahl der von 0 verschiedenen Differenzen) sind für die jeweils kleinere Rangsumme in Tabellen angegeben: ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 198 Kritische Werte (einseitige Fragestellung) bei α= 0.025 0.01 0.005 Kritische Werte (zweiseitige Fragestellung) bei α= 0.05 0.02 0.01 6 0 7 2 0 8 4 2 0 9 6 3 2 10 8 5 3 11 11 7 5 12 14 10 7 13 17 13 10 14 21 16 13 15 25 20 16 16 30 24 20 17 35 28 23 18 40 33 28 19 46 38 32 20 52 43 38 21 59 49 43 22 66 56 49 23 73 62 55 24 81 69 61 25 89 77 68 n Für n 25 kann die Standardnormalverteilung verwendet werden, wobei bei der z-Standardisierung der folgende Wert für die Standardabweichung eingesetzt wird: nn12n1 R 24 n die Anzahl der Differenzen. Die Summe aller Ränge beträgt Entsprechend ist der Erwartungswert 0 dann Wir erhalten Z Ri nn1 4 nn12n1 24 nn1 2 2 nn1 4 nn1 2 . . N0, 1. Beispiel 4: Die SUVA macht eine Unfallverhütungskampagne in Betrieben und möchte deren Wirkung überprüfen. In 12 zufällig ausgewählten Betrieben wird die Unfallhäufigkeit vor und nach der Kampagne während eines Jahres erhoben. H 0 : Die Kampagne hat nichts bewirkt. H A : Die Kampagne hat die Unfallhäufigkeit gesenkt ( linksseitiger Test). 0. 025 Bei der Erhebung ergaben sich folgende Daten: ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 199 Betrieb; vorher 1 2 3 4 5 6 7 8 9 10 11 12 78 di nachher 7 22 7 11 3 8 13 5 20 9 12 10 Summen 2 15 5 12 5 7 9 12 15 6 6 2 Beträge 5 7 2 -1 -2 1 4 -7 5 3 6 8 5 7 2 1 2 1 4 7 5 3 6 8 Wir ordnen die Beträge und erhalten: Betrieb vorher 4 6 3 5 10 7 1 9 11 2 8 12 78 nachher 11 8 7 3 9 13 7 20 12 22 5 10 Beträge di 12 7 5 5 6 9 2 15 6 15 12 2 -1 1 2 -2 3 4 5 5 6 7 -7 8 no(di) 1 1 2 2 3 4 5 5 6 7 7 8 1 2 3 4 5 6 7 8 9 10 11 12 r(di) 1.5 1.5 3.5 3.5 5 6 7.5 7.5 9 10.5 10.5 12 78 Wenn die Kampagne die Unfallhäufigkeit senkt, muss die Anzahl der positiven Differenzen die Anzahl der negativen Differenzen übersteigen. Je grösser die Abweichung der Unfallhäufigkeiten ist, desto grösser werden die positiven Differenzen ausfallen und desto kleiner die negativen Differenzen. Dies wird sich auf die entsprechenden Rangsummen auswirken. Wir zählen nun die Summe der Ränge der negativen Differenzen k zusammen:R rd i für d i 0 i1 1. 5 3. 5 10. 5 15. 5 Entsprechend haben die Differenzen mit positiven Vorzeichen die Rangsumme ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 200 78 15. 5 62. 5. Wäre die Kampagne wirkungslos gewesen, müsste sich für die Summe der Ränge der negativen Differenzen ein Wert geben, der nicht zu stark von 782 39 abweicht. Je mehr die Summe der Ränge der negativen Differenzen davon abweicht, desto unwahrscheinlicher ist das Ergebnis unter der Nullhypothese. Laut Tabelle ist 14 der kritische Wert für den einseitigen Test. Entsprechend ist eine Rangsumme von 15.5 nicht genügend. Die Nullhypothese kann (knapp) nicht abgelehnt werden. Überprüfung der Symmetrie erfolgt graphisch mit SPSS. Wir erstellen eine neue Variable, die wir z.B. mit 1 auffüllen. Dann Graphiken, Streudiagramm, x-Achse Daten, y-Achse die neue Variable mit 1. Fürs obige Beispiel erhalten wir: 1.6 1.4 1.2 1.0 .8 DUMM .6 .4 -8 -6 -4 -2 0 2 4 6 8 10 Differenzen Mittelwert:2.5833 Die Daten sind nicht ausgeprägt symmetrisch verteilt. Wir verzichten allerdings auf die Anwendung des Testes nur bei grober Verletzung der Symmetrie-Voraussetzung. Betrachten wir den Fall, dass sich bei der obigen Alternativhypothese für R der Wert 70 ergibt. H 0 kann in diesem Fall nicht zurückgewiesen werden, da wir einen linksseitigen Test durchführen. Im Falle von H A : ”Es hat sich eine Änderung ergeben” ( zweiseitig), könnte die Nullhypothese jedoch zurückgewiesen werden, da 78 70 8 und bei 0. 025 für n 12 die kritische Grenze bei 10 (für zweiseitig, die Tabelle gibt den Wert für 0. 02 0. 025 an) liegt. Rangsummentest für verbundene Stichproben mit SPSS (Wilcoxon-Test) Befehl: Analysieren, nicht-parametrische Tests, zwei verbundene Stichproben, Wilcoxon-Test ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 201 Ränge N NACHHER - VORHER Negative Ränge Positive Ränge Bindungen Gesamt 9a 3b 0c 12 Mittlerer Rang 6.94 5.17 Rangsumme 62.50 15.50 a. NACHHER < VORHER b. NACHHER > VORHER c. VORHER = NACHHER Statistik für Testb Z Asymptotische Signifikanz (2-seitig) NACHHER VORHER -1.846a .065 a. Basiert auf positiven Rängen. b. Wilcoxon-Test Zu beachten ist, dass SPSS einen zweiseitigen Test ausführt. Wir führten jedoch einen linksseitigen Test aus. Der Output von SPSS kann jedoch leicht jeweils umgerechnet werden. SPSS liefert den p-Wert unter ”Signifkanz”. Den p-Wert für den einseitigen Test erhalten wir durch Halbieren. Somit wäre bei einem 0. 05 (einseitiger Test) das Ergebnis signifikant. Übungen 1) Wir nehmen an, bei der Verabreichung eines Medikamentes würden sich die Reaktionszeiten wie folgt verändern (Daten: verbundene Stichproben, Übung 1.xls) Testen Sie, ob die Verabreichung des Medikamentes einen Einfluss hat. ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 202 Proband Reaktionszeit Reaktionszeit vorher nachher 1 1.44926179 2.53774216 2 1.51860562 2.51134779 3 1.54930178 2.39915452 4 1.51186391 2.47228287 5 1.5549234 2.29781149 6 1.7348597 1.61129094 7 1.35740422 2.732258 8 1.56744031 2.52955866 9 1.56329322 2.50735359 10 1.39828206 2.60729835 11 2.1989989 1.8989809 12 1.48037192 2.39604065 13 1.63532618 2.29897119 14 1.44102105 2.26772705 15 1.49037659 2.35503986 2) In einem Lieferdienst wird der Fahrzeugpark bezüglich der Effizienz zweier Schmieröle überprüft. Für die Daten siehe ”verbundene Stichproben, Übung 2”. Testen Sie, ob Schmieröl 2 besser ist. 3) Denken Sie sich für jede der obigen Fragestellungen ein betriebswirtschaftliches Problem aus und lösen Sie es. Lösungen: 1) H 0 : Das Medikament hat keinen Einfluss. H A : Das Medikament hat einen Einfluss ( zweiseitiger Test). ( 0. 05 Wir möchten einen t-Test anwenden und überprüfen deshalb zuerst die Normalverteilungsannahme: P-P-Diagramm Normal Medikament 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Daten sind kaum normalverteilt. Entsprechend müssen wir einen Vorzeichen ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 203 oder eine Rangsummentest durchführen. Für den Rangsummentest erhalten wir mit SPSS: Ränge N NACHHER - VORHER Negative Ränge Positive Ränge Bindungen Gesamt 2a 13b 0c 15 Mittlerer Rang 1.50 9.00 Rangsumme 3.00 117.00 a. NACHHER < VORHER b. NACHHER > VORHER c. VORHER = NACHHER Statistik für Testb Z Asymptotische Signifikanz (2-seitig) NACHHER VORHER -3.237a .001 a. Basiert auf negativen Rängen. b. Wilcoxon-Test Das Resultat ist hoch signfikant. Wir berechnen das Ganze noch von Hand: ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 204 Proband Reaktions Reaktions Differenzen di Beträge no(di) r(di) zeit vorher zeit nachher geordnet 6 1.7348597 1.61129094 0.12356876 0.12356876 1 1 11 2.1989989 1.8989809 0.300018 0.300018 2 2 13 1.63532618 2.29897119 -0.66364501 0.66364501 3 3 5 1.5549234 2.29781149 -0.74288809 0.74288809 4 4 14 1.44102105 2.26772705 -0.826706 0.826706 5 5 3 1.54930178 2.39915452 -0.84985274 0.84985274 6 6 15 1.49037659 2.35503986 -0.86466327 0.86466327 7 7 12 1.48037192 2.39604065 -0.91566873 0.91566873 8 8 9 1.56329322 2.50735359 -0.94406037 0.94406037 9 9 4 1.51186391 2.47228287 -0.96041897 0.96041897 10 10 8 1.56744031 2.52955866 -0.96211835 0.96211835 11 11 2 1.51860562 2.51134779 -0.99274217 0.99274217 12 12 1 1.44926179 2.53774216 -1.08848036 1.08848036 13 13 10 1.39828206 2.60729835 -1.2090163 1.2090163 14 14 7 1.35740422 2.732258 -1.37485378 1.37485378 15 15 120 120 Es gibt zwei positive Differenzen mit den Rängen 1 und 2. Dies ergibt für die kleinere Rangsumme 3: Dies liegt weit unter jeglichen kritischen Werte für n 15 (nämlich 25, 20, 16). Überprüfung der Symmetrievoraussetzung: 1.6 1.4 1.2 1.0 .8 DUM .6 .4 -1.5 -1.0 -.5 0.0 .5 Differenzen Mittelwert: -.7981 Auch hier gilt, dass die Symmetriebedingungen nicht besonders gut erfüllt ist. Trotzdem würden wir den Test anwenden. Es empfiehlt sich aber in diesem Fall gewiss noch den Vorzeichentest auszuführen, der nicht auf der Symmetriebedingung fusst. Mit Hilfe des Vorzeichentests erhalten wir: 2 auf 15 sind positiv. Dies ergibt: ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 205 0. 003692627 0. 025 Somit ist das Ergebnis signifikant. Mit SPSS erhalten wir: Häufigkeiten N NACHHER - VORHER Negative Differenzena Positive Differenzenb Bindungen c Gesamt 2 13 0 15 a. NACHHER < VORHER b. NACHHER > VORHER c. VORHER = NACHHER Statistik für Testb NACHHER VORHER Exakte Signifikanz (2-seitig) a .007 a. Verwendetete Binomialverteilung. b. Vorzeichentest 2) H 0 : Die beiden Öle unterscheiden sich nicht. H A : Die beiden Öle unterscheiden sich. ( zweiseitiger Test). Wir denken an einen t-Test und überprüfen die Differenzen auf Normalverteilung. P-P-Diagramm Normal Schmieröl 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Normalverteilungsannahme ist offenbar haltbar. Wir können somit den t-Test anwenden. Wir berechnen die Differenzen, den Mittelwert der Differenzen und deren Standardabweichung: wir erhalten: d 5. 018708587; d 3. 832234822 In die Formel eingesetzt erhalten wir: 5.018708587 3.832234822 58 9. 973 6 ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 206 t 57 9. 9736 2. 07131E 14 Das Testergebnis ist hoch signifikant. Mit SPSS erhalten wir: Test bei gepaarten Stichproben Gepaarte Differenzen Schmieröl 1 Schmieröl 2 Mittelwert Standardab weichung Standardfe hler des Mittelwertes -5.0187 3.8322 .5032 95% Konfidenzintervall der Differenz Untere Obere -6.0263 -4.0111 T df Sig. (2-seitig) -9.974 57 .000 ___________________________________________________________________ Zweistichprobentestes.text 2. HSW Siders P.R. Seite 207 2.2. Unverbundene Stichproben Es werden zwei Stichproben gezogen, so dass die Daten unverbunden sind, d.h. die Daten der zwei Stichproben gehören nicht zu jeweils gleichen Objekten. Dabei wird überprüft, ob es haltbar ist, dass die zwei Stichproben zu Populationen mit identischen Parametern gehören. 2.2.1. Testen von Varianzen Ziel: Die Varianzen zweier Stichproben werden verglichen, um zu entscheiden, ob die zwei Populationen, aus denen sie gezogen wurden, identische Varianzen 21 und 22 aufweisen. Voraussetzungen: Die Daten sind unabhängig und identisch normalverteilt (metrisch skaliert). Sind die Daten normalverteilt, dann gilt - wie bereits gezeigt - für die Zufallsvariable n 1 1S 21 n 1S 2 n2 1 1 . Ebenso gilt für 2 2 2 n2 2 1 . Laut Definition der F-Verteilung gilt 1 dann n 1 1S 2 1 1 1 n 1 1 n 2 1S 2 1 2 2 n 2 1 erhalten somit: S2 1 1 S2 2 2 Fn 1 1, n 2 1. Unter der Nullhypothese gilt 1 2 Wir S 21 S 22 Fn 1 1, n 2 1 S 21 : Zufallsvariable mit 21 als Wert S 22 : Zufallsvariable mit 22 als Wert n 1 : Umfang der ersten Stichprobe n 2 : Umfang der zweiten Stichprobe Beispiel: Zwei Maschinen werden auf die Varianz des Outputs hin untersucht, wobei eine tiefere Varianz vorzuziehen ist. Wir nehmen an,die Daten seien normalverteilt (Wir überprüfen jede der Stichproben auf Normalverteilung). Wir ziehen für beide Maschinen eine Stichprobe von je 100, d.h. n 1 n 2 und hätten als Varianzen die folgenden Werte erhalten: 21 90; 22 80. Wir überprüfen, ob der Unterschied signifikant ist. H 0 : Die Varianzen unterscheiden sich nicht. H A : Die Varianzen unterscheiden sich ( zweiseitiger Test) ( 0. 05. S 21 S 22 90 80 1. 125 F99, 99. F 99,99 1. 125 1 0. 279503524; 0. 279503524 0. 025 Die Varianz des Outputs der beiden Maschinen unterscheiden sich nicht signifikant. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 209 2.2.2. z-Test (signifikant verschiedene Varianzen) Ziel: Es wird überprüft, ob zwei Grundgesamtheiten, aus denen Stichproben gezogen werden, identische Mittelwerte 1 und 2 aufweisen. Voraussetzungen: Die Daten sind unabhängig und identisch normalverteilt (metrisch skaliert). Die Varianzen werden aus den Daten geschätzt und sind signifikant verschieden. n 1 50; n 2 50 Zwei Stichproben des Umfangs n 1 und n 2 werden aus zwei Grundgesamtheiten gezogen. Die Nullhypothese besagt: 1 2 (oder äquivalent: 1 2 0. Die Alternativhypothese besagt beim zweiseitigen Test. 1 2 0 (beim einseitigen Test, 1 2 0 oder 1 2 0 Wir betrachten zuerst die unrealistische Situation, dass die Varianzen der beiden Populationen, aus denen Stichproben gezogen werden, bekannt sind. Für normalverteilte Datensätze i gilt: X i ist normalverteilt. Ebenso gilt für die Differenz X 1 X 2 , dass sie normalverteilt ist, da die Summe von normalverteilten, unabhängiger Zufallsvariablen wieder normalverteilt ist. Für normalverteilte, unabhängige Zufallsvariablen könnte zudem gezeigt werden, dass für W aX bY (X und Y sind normalverteilte, unabhängige Zufallsvariablen, a, b R gilt: VW a 2 VX b 2 VY. 2 2 Da gilt: VX 1 n 11 und VX 2 n 22 , erhalten wir für die Varianz der Differenz 2 2 2 2 X 1 X 2 : 2X 1 X 2 1 2 n 11 1 2 n 22 n 11 n 22 Somit ist die Zufallsvariable X X Z 1 22 12 2 standardnormalverteilt. Die Nullhypothese postuliert 1 2 0. 1 n1 2 n2 Somit gilt für die Zufallsvariable Z : Z X 1 X 2 2 1 n1 2 2 n2 N0, 1. Betrachten wir nun den realistischeren Fall, dass die Varianzen der zwei Populationen nicht bekannt sind und aus den Stichproben geschätzt werden müssen. Für genügend grosse Stichproben n 1 , n 2 50 ist der Ausdruck Z X21 X 22 näherungsweise standardnormalverteilt, sofern die Daten S1 n1 S n 22 normalverteilt sind. Z X 1 X 2 S2 1 n1 S2 N0, 1 n 22 X i : Zufallsvariable mit x i als Wert S 2i : Zufallsvariable mit 2i als Wert n 1 : Umfang der ersten Stichprobe n 2 : Umfang der zweiten Stichprobe Für kleinere Stichprobengrössen ist die Verteilung unbekannt. (Wir verwenden in diesem Fall einen Rangtest, siehe unten). Ob die Varianzen zu einer gleichen Verteilung gehören oder nicht, können wir z.B. mit einem F-Test entscheiden ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 210 (siehe oben, Testen zweier Varianzen; oft werden auch andere, geeignete Tests verwendet). Wird die Hypothese, dass die Varianzen zur selben Verteilung gehören, verworfen, können wir bei n 1 , n 2 50 den obigen z-Test anwenden. Beispiel 1: (Daten siehe unverbundene Daten/Beispiel 1.xls) Verkäufer 1 erzielt einen durchschnittlichen Tagesumsatz von 100. 7251579 (Anzahl Tage: 95, 1 4. 142825345) und Verkäufer 2 (Anzahl Tage 113, 2 2. 88585642) einen durchschnittlichen Tagesumsatz von 104. 7855357 Geldeinheiten H 0 : Die durchschnittlichen Umsätze der beiden Verkäufer unterscheiden sich nicht. H A : Die durchschnittlichen Umsätze der beiden Verkäufer unterscheiden sich ( beidseitiger Test, 0. 05. Wir überprüfen die Normalverteilungsannahme: P-P-Diagramm Normal VERKÄUFER 2 1.00 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal VERKÄUFER 1 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Normalverteilungsannahme kann akzeptiert werden. 2.88585642 2 0. 48524 F111, 94. n 1 95; n 2 112 50; 4.142825345 2 F 111,94 0. 48524 0. 0001355 2 0. 05. Wir verwerfen die Hypothese, dass die beiden Populationen die selbe Varianz haben und verwenden den obigen z-Test: Z . X 1 X 2 S2 1 n1 S2 2 n2 100.7251579104.7855357 4.142825345 2 95 2.88585642 112 2 8. 040 Das Ergebnis ist hochsignifikant 8. 040 0 0. 025 Mit Excel: t-Test zweiseitig, Typ 3. Für obiges Beispiel: 1. 69593E 13 0. 025 Mit SPSS sind für das obige Beispiel einige Vorarbeiten nötig. In SPSS hat man bezüglich des t-Testes (mit zwei unabhängigen Stichproben) folgende Situation vor Augen. Zwei Maschinen werden bezüglich der produzierten Schraubenlänge getestet. Diese Situation wird als dichotome, nominalskalierte Variable aufgefasst (Schraube wurde mit Maschine 1 hergestellt oder wurde mit Maschine 2 hergestellt). Jede Schraube ist ein Objekt, für das auf einer Zeile die Ausprägungen der zwei Variablen Länge und ”produziert durch Maschine i” ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 211 angeführt werden. Der Test verläuft nun wie folgt: Analysieren, Mittelwerte vergleichen, unverbundene Stichproben. Zu testenden Grössen (Länge) kommen in das Feld ”Testgrösse”, die Gruppenvariable ist die Variable, welche die zwei zu vergleichenden ”Gruppen” festlegt (im Beispiel ”produziert durch Maschine i”. Unter ”Gruppen def.” müssen dann die Ausprägungen der dichotomen Variable eingetragen werden (1 und 2 im Maschinenbeispiel). In unserem Tagesumsatz-Beispiel müssen wir als Objekte der Population Tage sehen. Diese Tage nehmen unter der Variable ”Umsatz” die entsprechenden Tagesumsätze an und unter der Variable ”Verkäufer” 1 oder 2 (je nach Verkäufer). Die Daten aus Excel müssen entsprechend behandelt werden. Wir fügen die Daten des Verkäufers 1 in die erste Spalte von SPSS. Wir produzieren nun die Variable ”Verkäuf1” und fügen mit ”Transformieren”, ”Umkodieren”, ”in andere Variable”, bei ”Name” Variablenname eingeben, mit ”ändern” bestätigen, ”alte und neue Werte”, neuer Wert ”1”, ”alle anderen Werte”, ”hinzufügen”, ”weiter”, ”ok”. Dann fügen wir die Umsätze des zweiten Verkäufers an die Umsätze des ersten Verkäufers (in dieselbe Spalte) und ergänzen die Variable ”Verkäufer” für den zweiten Verkäufer mit ”2”. (Vorgehen: ”Umkodieren”, ”in andere Variable”, bei ”Name” Variablennamen (Verkäuf) eingeben (eventuell noch Label), mit ”ändern” bestätigen, ”alte und neue Werte”, alter Wert 1, neuer Wert 1, alter Wert ”fehlend”, neuer Wert ”2”, ”weiter”, ”ok”. (schneller wäre es allerdings, die Daten in Excel entsprechend vorzubereiten und dann in SPSS einzufügen). Nun können wir den t-Test laufen lassen und erhalten folgendes Resultat. Gruppenstatistiken UMSÄTZE Verkäufer 1.00 2.00 N 95 112 Mittelwert 100.7252 104.7855 Standardab weichung 4.1428 2.8859 Standardfe hler des Mittelwertes .4250 .2727 Der ”Standardfehler des Mittelwertes” ist die Standardabweichung des Mittelwertes. Bei Kennzahlen wird oft ”Standardfehler” statt ”Standardabweichung” verwendet. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 212 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichhei t F UMSÄTZE Varianzen gleich Varianzen nicht gleich 7.394 Sign. .007 T-Test für die Mittelwertgleichheit T df Sig. (2-seitig) Mittlere Differenz Standardfehler der Differenz -8.274 205 .000 -4.0604 .4908 -8.040 163.8 .000 -4.0604 .5050 SPSS liefert den Test für signifikant verschiedene und nicht verschiedene 2i . Bei F steht der F-Wert des Levene-Tests (es handelt sich um einen alternativen Test zum obigen F-Test). Da die Varianzen signifikant verschieden sind, ist nur die zweite Zeile (Varianzen nicht gleich) in Betracht zu ziehen. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 213 2.2.3. t-Test (nicht signifikant verschiedene Varianzen) Ziel: Es wird überprüft, ob zwei Grundgesamtheiten, aus denen Stichproben gezogen werden, identische Mittelwerte 1 und 2 aufweisen. Voraussetzungen: Die Daten sind unabhängig und identisch normalverteilt (metrisch skaliert). Die Varianzen werden aus den Daten geschätzt und unterschieden sich nicht signifikant. Wir betrachten zuerst wieder den unrealistischen Fall, dass die Varianzen der zwei Populationen bekannt sind. Zudem seien diese Varianzen identisch. Somit gilt für X 1 X 2 21 22 2 : Z X21 X 22 X21 X 22 2 2 X 1 X 2 n 2 2 n 1 2 n1n2 1 n1 X 1 X 2 2 n 2 n 1 n1n2 2 n2 n1 X 1 X 2 n 2 n 1 n1n2 n2 n2 n1n2 n1 n1n2 N0, 1 Ist nun die Varianz der Grundpopulationen nicht bekannt, muss diese aus den Daten geschätzt werden. Die obige Zufallsvariable wird zu: T Xn1 Xn2 S 2 1 n1n2 Wir zeigen, dass die Zufallsvariable T t-verteilt ist. (a) Sei 2i der Wert der Zufallsvariable S 2i (i 1, 2.Für S 2 gilt - wie bereits gezeigt: S 21 n 1 1 2 n2 1 1 und S 22 n 2 1 2 n2 2 1 . Ohne Beweis halten wir fest: Wenn X 2n und Y 2m , dann X Y 2nm . Somit gilt: U S 21 n 1 1 2 S 22 n 2 1 2 n2 1 n 2 2 Z (b) Laut Definition der t-Verteilung gilt dann: U n 1 n 2 2 t n 1 n 2 2 X 1 X 2 Nun gilt: Z U n 1 n 2 2 X 1 X 2 n 2 n 1 n1n2 2 S2 1 n 1 1S 2 n 2 1 n 1 n 2 2 Somit ist für S n 2 n 1 n1n2 2 S2 1 n 1 1 S 2 n 2 1 2 2 n 1 n 2 2 X 1 X 2 n 2 n 1 n1n2 1 2 S2 1 n 1 1S 2 n 2 1 n 1 n 2 2 t n 1 n 2 2 S 21 n 1 1S 22 n 2 1 n 1 n 2 2 die obige Zufallsvariable T t-verteilt. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 214 X 1 X 2 T 2 n 1 1S 2 1 n 2 1S 2 n 1 1n 2 1 t n 1 n 2 2 1 n1 n12 X 1 : Zufallsvariable mit dem Mittelwert x 1 der Stichpobe 1 als Wert X 2 : Zufallsvariable mit dem Mittelwert x 2 der Stichprobe 2 als Wert S 21 : Zufallsvariable mit der Varianz 21 der Stichprobe 1 als Wert. S 22 :Zufallsvariable mit der Varianz 22 der Stichprobe 2 als Wert n 1 : Anzahl Daten der Stichprobe 1 n 2 : Anzahl Daten der Stichprobe 2 Beispiel: Zwei Produktionsstätten produzieren folgende Mengeneinheiten an verkaufbaren Produkten pro Tag (Daten: Unverbundene Stichproben, Beispiel 2.xls). Ist der Unterschied signifikant? (n 1 52; 21 7. 375786375, x 1 1000. 22908; n 2 75, 22 7. 55534469, x 2 1005. 509322) H 0 : Die beiden Produktionsstätten unterscheiden sich nicht. H A : Die zweite Produktionsstätte ist besser ( einseitiger Test; 0. 05. Wir denken an einen z- oder an einen t-Test. Entsprechend überprüfen wir die Daten zuerst auf Normalverteilung: P-P-Diagramm Normal Produktion 2 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal Produktion 1 1.00 .50 .25 0.00 0.00 .25 .50 .75 1.00 .50 .25 0.00 0.00 Beobachtete Kum. Wahrsch. .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Normalverteilungsannahme ist wohl haltbar. Als nächstes testen wir die Varianzen. 7.375786375 7.55534469 0. 976 23; F 51,74 0. 976 23 1 0. 530760322 0. 469 24 Die Varianzen unterscheiden sich nicht signifikant. Entsprechend verwenden wir den t-Test: ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 215 T X 1 X 2 2 n 1 1S 2 1 n 2 1S 2 n 1 1n 2 1 1000.229081005.509322 1 n1 517.375786375747.55534469 5174 1 n2 1 52 1 75 10. 697 t 52752 10. 697 1 t 125 10. 697 1 1. 16665E 19 p-Wert: 1. 16665E 19 0. 05. Das Testergebnis ist hochsignifikant. Mit dem t-Test von Excel erhalten wir (TTest, einseitig, Typ 2: 1. 16488E 19 0. 05 Mit SPSS erhalten wir: Gruppenstatistiken Output Produktionsstätte 1.00 2.00 N Mittelwert 1000.2291 1005.5093 52 75 Standardab weichung 2.7158 2.7487 Standardfe hler des Mittelwertes .3766 .3174 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit F Output Varianzen sind gleich Varianzen sind nicht gleich .215 Signifikanz .644 T-Test für die Mittelwertgleichheit T df Sig. (2-seitig) Mittlere Differenz Standardfehle r der Differenz -10.70 125 .000 -5.2802 .4936 -10.72 110.7 .000 -5.2802 .4925 Auch vom Levene-Test wird die Verschiedenheit der Varianzen abgelehnt. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 216 2.2.4. Rangtest von Mann-Withney (U-Test von Mann-Withney genannt) Ziel: Es wird überprüft, ob zwei Grundgesamtheiten, aus denen Stichproben gezogen werden, ähnliche Verteilungen aufweisen. Voraussetzungen: Die Daten sind unabhängig und identisch verteilt (metrisch oder ordinal skaliert). Der Rangtest hat bedeutend schwächere Voraussetzungen als der z- oder t- Test. Er sollte im allgemeinen vorgezogen werden. Wir ordnen die Daten der beiden Stichproben der Grösse nach und ordnen ihnen nach derselben Methode wie beim Wilcoxon-Test Ränge zu. Von verbundenen Rängen sprechen wir, wenn Daten die selbe Ausprägung haben. Im Gegensatz zum Wilcoxon-Test werden jedoch nicht die Rangsummen gebildet. Es wird gezählt, wieviele Male U 1 die Ränge der ersten Stichprobe Ränge der zweiten Stichprobe übertreffen. Dieser Wert kann auch durch U1 n1n2 n 1 n 1 1 2 n1 R 1 berechnet werden, wobei R i r i i die Rangsumme der i1 n n 1 R 2 . Im i-ten Stichprobe ist. Für U 1 gilt: U 1 n 1 n 2 U 2 , wobei U 2 n 1 n 2 2 22 Test verwenden wir jeweils U minU 1 , U 2 } (d.h. das kleinere der beiden U i In Tabellen werden die kritischen U-Werte angegeben. für den einseitigen Test bei α = 0.01, für den zweiseitigen Test bei α = 0.02 n i 9 10 11 12 13 14 15 16 17 18 19 20 1 2 0 0 0 0 0 0 1 1 3 1 1 1 2 2 2 3 3 4 4 4 5 4 3 3 4 5 5 6 7 7 8 9 9 10 5 5 6 7 8 9 10 11 12 13 14 15 16 6 7 8 9 11 12 13 15 16 18 19 20 22 7 9 11 12 14 16 17 19 21 23 24 26 28 8 11 13 15 17 20 22 24 26 28 30 32 34 9 14 16 18 21 23 26 28 31 33 36 38 40 10 16 19 22 24 27 30 33 36 38 41 44 47 11 18 22 25 28 31 34 37 41 44 47 50 53 12 21 24 28 31 35 38 42 46 49 53 56 60 13 23 27 31 35 39 43 47 51 55 59 63 67 14 26 30 34 38 43 47 51 56 60 65 69 73 15 28 33 37 42 47 51 56 61 66 70 75 80 16 31 36 41 46 51 56 61 66 71 76 82 87 17 33 38 44 49 55 60 66 71 77 82 88 93 18 36 41 47 53 59 65 70 76 82 88 94 100 19 38 44 50 56 63 69 75 82 88 94 101 107 20 40 47 53 60 67 73 80 87 93 100 107 114 ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 217 für den einseitigen Test bei α = 0.025, für den zweiseitigen Test bei α = 0.05 ni 9 10 11 12 13 14 15 16 17 18 19 20 1 2 0 0 0 1 1 1 1 1 2 2 2 2 3 2 3 3 4 4 5 5 6 6 7 7 8 4 4 5 6 7 8 9 10 11 11 12 13 13 5 7 8 9 11 12 13 14 15 17 18 19 20 6 10 11 13 14 16 17 19 21 22 24 25 27 7 12 14 16 18 20 22 24 26 28 30 32 34 8 15 17 19 22 24 26 29 31 34 36 38 41 9 17 20 23 26 28 31 34 37 39 42 45 48 10 20 23 26 29 33 36 39 42 45 48 52 55 11 23 26 30 33 37 40 44 47 51 55 58 62 12 26 29 33 37 41 45 49 53 57 61 65 69 13 28 33 37 41 45 50 54 59 63 67 72 76 14 31 36 40 45 50 55 59 64 67 74 78 83 15 34 39 44 49 54 59 64 70 75 80 85 90 16 37 42 47 53 59 64 70 75 81 86 92 98 17 39 45 51 57 63 67 75 81 87 93 99 105 18 42 48 55 61 67 74 80 86 93 99 106 112 19 45 52 58 65 72 78 85 92 99 106 113 119 20 48 55 62 69 76 83 90 98 105 112 119 127 für den einseitigen Test bei α = 0.05, für den zweiseitigen Test bei α = 0.1 ni 9 10 11 12 13 14 15 16 17 1 2 1 1 1 2 2 2 3 3 3 3 3 4 5 5 6 7 7 8 9 4 6 7 8 9 10 11 12 14 15 5 9 11 12 13 15 16 18 19 20 6 12 14 16 17 19 21 23 25 26 7 15 17 19 21 24 26 28 30 33 8 18 20 23 26 28 31 33 36 39 9 21 24 27 30 33 36 39 42 45 10 24 27 31 34 37 41 44 48 51 11 27 31 34 38 42 46 50 54 57 12 30 34 38 42 47 51 55 60 64 13 33 37 42 47 51 56 61 65 70 14 36 41 46 51 56 61 66 71 77 15 39 44 50 55 61 66 72 77 83 16 42 48 54 60 65 71 77 83 89 17 45 51 57 64 70 77 83 89 96 18 48 55 61 68 75 82 88 95 102 19 51 58 65 72 80 87 94 101 109 20 54 62 69 77 84 92 100 107 115 18 4 9 16 22 28 35 41 48 55 61 68 75 82 88 95 102 109 116 123 19 0 4 10 17 23 30 37 44 51 58 65 72 80 87 94 101 109 116 123 130 20 0 4 11 18 25 32 39 47 54 62 69 77 84 92 100 107 115 123 130 138 Bei n 1 n 2 30 ist die Verteilung der U-Werte näherungsweise normal. Um die U-Werte zu standardisieren, verwenden wir U n 12n 2 und die ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 218 n 1 n 2 n 1 n 2 1 12 Standardabweichung s . Bei verbundenen Rängen wird die Standardabweichung sg n1n2 nn1 n 3 n 12 k i1 t 3i t i 12 verwendet (t i Anzahl der Daten mit dem jeweils selben Rang i; k Anzahl der Datengruppen mit verbundenen Rängen). Wir machen die Verwendung der letzte Formel mit einem Beispiel deutlich (das Beispiel hätte für den Test etwas viele verbundene Ränge. Es geht hier allerdings darum, die obige Formel anwenden zu können). Gruppe Daten Ränge 1 2 1 2 1 1 2 1 1 2 2 1 2 2 2 1 1 2 2 3 3 3 4 4 4 4 5 5 6 7 Summen k Wir erhalten i1 t 3i t i 12 2 3 2 12 2 3 2 12 Wir berechnen als Testwert: Z 3 3 3 12 U U s no 1.5 1.5 3.5 3.5 6 6 6 9.5 9.5 9.5 9.5 12.5 12.5 14 15 120 4 3 4 12 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 120 2 3 2 12 8. 1667 N0, 1 Beispiel 3 (für metrisch skalierte Daten) Für ein Produkt wird ein Zusatz getestet, der sich positiv auf die Lebensdauer des Produktes (in Monaten) auswirken soll. H 0 : Der Zusatz hat keine Wirkung H A : Der Zusatz verlängert die Lebensdauer des Produktes ( rechtsseitiger Test, 0. 01 Es wurden dabei folgende Daten erhoben: ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 219 Lebensdauer ohne Lebensdauer mit Zusatz Zusatz 85 96 106 105 118 104 81 108 138 86 90 84 112 99 119 101 107 78 95 124 88 121 103 97 129 87 109 Im Beispiel gibt es keine Bindungen. Entsprechend gilt dann: noi ri für alle i. Wir erhalten: Daten geordnet no(i) 78 81 84 85 86 87 88 90 95 96 97 99 101 103 104 105 106 107 108 109 112 118 119 121 124 129 138 Summen: 2 1 2 1 2 2 1 1 1 2 2 2 2 1 2 2 1 1 2 2 1 1 1 2 2 2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 r(i) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 378 r1(i) r2(i) 0 2 0 4 0 0 7 8 9 0 0 0 0 14 0 0 17 18 0 0 21 22 23 0 0 0 27 172 1 0 3 0 5 6 0 0 0 10 11 12 13 0 15 16 0 0 19 20 0 0 0 24 25 26 0 206 Um zu wissen, welche Daten zu welcher Stichprobe gehören, kennzeichnen wir diese Zugehörigkeit vor dem Ordnen durch 1 und 2. In der zweitletzten Spalte sind ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 220 die Ränge für die Daten der ersten Stichprobe angeführt, in der letzten Spalte die Ränge der Daten der zweiten Stichprobe. Die Summen der beiden Rangsummen R 1 R 2 muss mit der Summe der ri identisch sein. Wir berechnen U 1 n 1 n 2 n 1 n 1 1 2 12121 2 R 1 12 15 172 86 U 2 12 15 86 94 U 86: Da n 1 n 2 30, müssen wir den Wert in einer Tabelle nachschauen. Wir erhalten als kritische Grenze 42. Da 86 42, ist das Resultat nicht signifikant. Übungshalber verwenden wir die Normalverteilung, um den grob genäherten n 1 n 2 n 1 n 2 1 121512151 p-Wert zu berechnen: s 20. 494. 12 12 n1n2 2 1215 2 90 Wir erhalten: Z 8690 20.495 0. 19517 0. 19517 1 0. 19517 1 0. 577370049 0. 422 63 0. 01. Das Resultat ist bei weitem nicht signifikant. Mit SPSS: Analysieren, Nicht-parametrische Tests, unverbundene Stichproben, Mann-Withney-Test (Auch hier müssen die zwei Stichproben durch eine eigene Variable charakterisiert werden und die Werte der Stichproben in einer Spalte eingegeben werden). Wir erhalten: Ränge Lebensdauer Produktionsstätte 1.00 2.00 Gesamt N 12 15 27 Mittlerer Rang 14.33 13.73 Rangsumme 172.00 206.00 Statistik für Testb Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) Exakte Signifikanz [2*(1-seitig Sig.)] Lebensdauer 86.000 206.000 -.195 .845 a .867 a. Nicht für Bindungen korrigiert. b. Gruppenvariable: Produktionsstätte Mann-Whitney-U ist der obige Testwert U; Wilcoxon-W ist die tiefere Rangsumme ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 221 R i , im vorliegenden Fall R 1 . Z ist der Wert der standardnormalisierten Zufallsvariable Z. Dieser Wert wird bei der asymtotischen Signifikanzberechnung verwendet (Standardnormalverteilung). Die Exakte Signifikanz ist die p-Wert, der mit kombinatorischen Mitteln berechnet wird. Es wird jeweils der p-Wert für den zweiseitigen Test geliefert. Beim einseitigen Test ist der gelieferte p-Wert zu halbieren. In unserem Fall erhalten wir: 0.845 0. 422 5 für den asymtotischen Wert 2 0.867 und 2 0. 433 5 für den exakten p-Wert. Man sieht, dass bei n 1 n 2 27 durch die Normalverteilung bereits recht gute Näherungen erreicht werden. Beispiel 4 (für ordinal skalierte Daten): (Daten unverbundene Stichproben/Beispiel 5.xls). Bei einem betriebsinternen Rating werden die Gesamtleistungen (Zusammenarbeit, Mitdenken, Leistung, etc). von Mitarbeitern der zwei Standorte von einem Vorgesetzten auf einer Ordinalskale von 1 - 10 bewertet. Es ergibt sich die folgende Tabelle: Standort 1 5 6 4 6.5 7 8 9.5 10 8.5 Standort 2 5.5 6 4.5 6.75 7.5 8.25 9 6.25 8.75 9.25 9.75 4.75 H 0 : Die beiden Produktionsstätten unterscheiden sich nicht. H A : Die beiden Produktionsstätten unterscheiden sich ( zweiseitiger Test, 0. 05. Die Mediane unterschieden sich wie folgt: erste Stichprobe hat einen Median von 7, die zweite einen Median von 7.125. Wir ordnen die Daten (mit Excel kann man auch direkt Ränge zuordnen und dann die Ränge samt den Daten ordnen. Bei Gruppen mit gleichen Werten wird der entsprechende Mittelwert zugeordnet): ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 222 geordnete Daten Standort 4 4.5 4.75 5 5.5 6 6 6.25 6.5 6.75 7 7.5 8 8.25 8.5 8.75 9 9.25 9.5 9.75 10 no(i) 1 2 2 1 2 1 2 2 1 2 1 2 1 2 1 2 2 2 1 2 1 ra(i) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Summen und berechnen U 1 n 1 n 2 n 1 n 1 1 2 R 1 9 12 1 2 3 4 5 6.5 6.5 8 9 10 11 12 13 14 15 16 17 18 19 20 21 231 991 2 ra1(i) 1 0 0 4 0 6.5 0 0 9 0 11 0 13 0 15 0 0 0 19 0 21 99.5 ra2(i) 0 2 3 0 5 0 6.5 8 0 10 0 12 0 14 0 16 17 18 0 20 0 131.5 99. 5 53. 5 U 2 9 12 53. 5 54. 5 U 53. 5 Mit der Tabelle erhalten wir als kritischen Wert 26. Der Unterschied ist nicht signifikant. Verwenden wir die Normalverteilung, erhalten wir: 912 21211 sg U n1n2 2 912 2 21 3 21 12 2 3 2 12 14. 067 54 U Z s gU 53.554 0. 03554 4 14.067 0. 03554 4 1 0. 514177078 0. 485 82 p-Wert für zweiseitig:2 0. 485 82 0. 971 64 0. 05 Mit SPSS erhalten wir: ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 223 Ränge Beurteilung Produktionsstätte 1.00 2.00 Gesamt N 9 12 21 Mittlerer Rang 11.06 10.96 Rangsumme 99.50 131.50 Statistik für Testb Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) Exakte Signifikanz [2*(1-seitig Sig.)] Beurteilung 53.500 131.500 -.036 .972 a .972 a. Nicht für Bindungen korrigiert. b. Gruppenvariable: Produktionsstätte ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 224 2.2.5. Test auf Anteile Ziel: Es sollen überprüft werden, ob die Anteile in zwei Stichproben zur selben Grundgesamtheit passen. Voraussetzungen: Stichprobengrösse: n i 50. Die Daten sind Werte von unabhängigen, gleichverteilten Zufallsvariablen. Beispiel: Es wird untersucht, ob sich der Jugendanteil ( 30 Jahre) bei den Konsumenten eines Produktes in zwei Kantonen unterscheiden (Zürich; Waadt). In beiden Kantonen wird eine Zufallsstichprobe gezogen (je 50). Wir nehmen an, es hätten sich folgende Anteile ergeben: 0.3 und 0.46. Ist zu vermuten, dass die Konsumentenstruktur der beiden Kantone sich unterscheidet? H 0 : Die Jugendanteile unterscheiden sich nicht. H A : Die Jungendanteile unterscheiden sich ( beidseitiger Test, 0. 05. Nicht nur die Anzahl x 1 der ausgezeichneten Ereignisse kann als Wert einer Zufallsvariable X 1 betrachtet werden. Auch nx 11 kann als Wert einer Zufallsvariable X1 n 1 betrachtet werden. Da EX 1 p 1 n 1 (Binomialverteilung), ist E Xn 11 1 n1 p1n1 n1 EX 1 p1 Da Anteilswerte binomialverteilt sind, sind sie standardisiert bei genügend grossem n (np1 p 9) näherungsweise standardnormalverteilt. Die Differenzen standardnormalverteilter Grössen sind wiederum standardnormalverteilt. Für die Differenz D X1 n1 X2 n2 gilt dann im Falle der Nullhypothese: ED 0. Für die Varianz gilt: Da VX 1 n 1 p 1 1 p 1 (Binomialverteilung) gilt für V Xn 11 1 n 21 VX 1 n 1 p 1 1p 1 n 21 p 1 1p 1 n1 Zudem gilt (unter Voraussetzung der Unabhängigkeit der X i : VD V V X1 n1 X1 n1 1 2 V X2 n2 V X2 n2 V X1 n1 V Xn 22 X1 n1 V X2 n2 Somit gilt dann unter der Nullhypothese p 1 p 2 : V Xn 11 X2 n2 p 1 1p 1 n1 p 2 1p 2 n2 p1 p n11 1 n2 Die z-Standardisierung ist somit: ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 225 Z X1 n1 X2 n2 N0, 1 p1p n11 n12 Allerdings müssen wir p aus den Stichproben schätzen. p X 1 X 2 n 1 n 2 Entsprechend ist p eine Zufallsvariable und Z ist nur für grosse n 1 und n 2 näherungsweise normalverteilt (für n i 50. Wir fassen zusammen: X1 n1 Z X 1 X 2 n 1 n 2 1 X2 n2 X 1 X 2 n 1 n 2 n11 n12 N0, 1 X1 n1 : Zufallsvariable mit dem Anteil x1 n1 an der Stichprobe 1 als Wert X2 n2 : Zufallsvariable mit dem Anteil x2 n2 an der Stichprobe 2 als Wert n 1 : Grösse der Stichprobe 1 n 2 : Grösse der Stichprobe 2 Fürs Beispiel erhalten wir entsprechend: X1 n1 0. 3 X 1 50 0. 3 15 X2 n2 0. 46 X 2 50 0. 46 23 X 1 X 2 n 1 n 2 1523 5050 0. 38 0.30.46 1 1 0.3810.38 50 50 1. 648 2 1. 6482 0. 049655802 Da wir zweiseitig testen gilt: 0. 049655802 0. 025. Der Unterschied ist somit nicht signifikant. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 226 2.2.6. Übungen 1) Bei der Produktion mit zwei verschiedenen Maschinen wurden folgende Daten gemessen (Unverbundene Stichproben, Übung 1.xls). Überprüfen Sie, ob die Varianzen signifikant voneinander abweichen ( 0. 01 2) Daten: unter Unverbundene Stichproben/Übung 2.xls Zwei Anlagen produzieren die pro Tag angegebenen Mengen eines chemischen Feinproduktes (in Liter). Unterscheiden sich die beiden Anlagen? 0. 05 3) Zwei Versicherungs-Vertreter werden bezüglich ihrer Abschlüsse verglichen (Daten: Unverbundene Stichproben/Übung 3.xls). Überprüfen Sie, ob die beiden Vertreter in ihren Leistungen signifikant voneinander abweichen. 0. 05 4) Zwei Fonds-Manager werden bezüglich Ihrer Performance getestet (Gewinne pro Tag). (Daten: Unverbundene Stichproben /Übung 4.xls). 5) Zwei Diäten werden bei Dauerläufern bezüglich der Leistung geprüft. (Daten: Unverbundene Stichproben/Übung 5.xls). Unterscheiden sich die Leistungen? 6) Im April 02 ergeben sich in der 2. HSW die folgenden Resultate in einer Mathematikprüfung: Geschlecht w w m m w w m w m m m m m m m m Punkte 19.25 19 18 18 17.5 17 16.5 16.25 16 15.75 13.25 12.75 11.875 11 7.5 1.5 (w für ”weiblich”, ”m” für ”männlich”). Die Hypothese sei, dass die Frauen signifikant besser abgeschnitten haben. Überprüfen Sie diese Hypothese. 0. 05 8) Die politische Einstellung der Bevölkerungen Genfs und Zürichs bezüglich eines spezifischen Themas sollen verglichen werden. Dabei werden 60 Personen in Genf und 70 Personen in Zürich befragt. Es ergibt sich folgendes Bild: 15 Personen in Genf sind positiv eingestellt und 10 Personen in Zürich. Handelt es sich um einen relevanten Unterschied? 9) Wie gross müssen n 1 und n 2 sein, damit ein Anteilsunterschied von signifikant werden kann? 15 60 10 70 0. 10714 10) Finden Sie je ein betriebswirtschaftliches Problem, das mit den behandelten Methoden ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 227 gelöst werden kann. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 228 2.2.7. Lösungen 1) H 0 : Die Varianzen unterscheiden sich nicht. H A : Die Varianzen unterscheiden sich ( zweiseitiger Test, 0. 01 Wir überprüfen die Daten auf Normalverteilung: P-P-Diagramm Normal Maschine 2 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal Maschine 1 1.00 .50 .25 0.00 0.00 .25 .50 .75 1.00 .50 .25 0.00 0.00 Beobachtete Kum. Wahrsch. .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Daten können als normalverteilt betrachtet werden. Wir können somit den S2 eingeführten F-Test verwenden. S 12 6.017110135 0. 45943 13.09697008 2 F 104,107 0. 45943 0. 00004280 4 0. 005 Die Abweichung ist hochsignifikant. 2) H 0 : Die Anlagen unterscheiden sich nicht. H A : Die Anlagen unterscheiden sich ( zweiseitiger Test). Wir denken an einen z- oder t-Test. Wir überprüfen die Daten auf Normalverteilung: P-P-Diagramm Normal Anlage 2 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal Anlage 1 1.00 .50 .25 0.00 0.00 .25 .50 Beobachtete Kum. Wahrsch. .75 1.00 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Die Daten sind nicht normalverteilt. Entsprechend verwenden wir den U-Test von ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 229 Mann und Witney. Wir erhalten für die tiefere Rangsumme 1596 (alle tiefsten Ränge gehören zur ersten Stichprobe; entsprechend wird das Resultat hochsignifikant sein). Wir berechnen den asymptotischen Z-Wert: n n 1 Da 1 21 R 1 (d.h. die Daten der ersten Stichprobe besetzen alle ersten Ränge), gilt U 1 n 1 n 2 56 63 3528. Entsprechend ist U 2 n 1 n 2 U 1 0 U 0. n 1 n 2 n 1 n 2 1 12 s n1n2 2 5663 2 566356631 12 187. 83 1764. Wir erhalten Z 01764 187.83 9. 3915 9. 3915 0 0. 01. Das Ergebnis ist hoch signifikant. Mit SPSS: Ränge Output Maschine 1.00 2.00 Gesamt N 56 63 119 Mittlerer Rang 28.50 88.00 Rangsumme 1596.00 5544.00 Statistik für Testa Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) Output .000 1596.000 -9.391 .000 a. Gruppenvariable: Maschine Da n 1 n 2 viel grösser ist als 30, wird hier von SPSS nur mehr die asymtotische Signifikanz berechnet. 3) H 1 : Die Vertreter unterscheiden sich nicht. H A : Die Vertreter unterscheiden sich ( zweiseitiger Test) Wir überprüfen auf Normalverteilung: ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 230 P-P-Diagramm Normal Abschlüsse 2 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal Abschlüsse 1 1.00 .50 .25 0.00 0.00 .25 .50 .75 .50 .25 0.00 0.00 1.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Beobachtete Kum. Wahrsch. Die Daten des zweiten Vertreters sind kaum normalverteilt. Wir müssen einen U-Test verwenden. R 1 250 U1 n1n2 n 1 n 1 1 2 R 1 16 19 16161 2 250 190 U 2 16 19 190 114 U 114 Mit der Tabelle erhalten wir als kritischen Wert 101. Der Unterschied ist nicht signifikant. Verwenden wir die Normalverteilung, erhalten wir: n 1 n 2 n 1 n 2 1 12 s n1n2 2 1619 2 161916191 12 30. 199 152 Wir erhalten: Z 152190 30.199 1. 258 3 1. 2583 1 1. 2583 1 0. 895858294 0. 104 14 0. 05. oder: 2 0. 10414 0. 208 28 0. 1 Das Resultat ist nicht signifikant. Ränge Abschlüsse Vertreter 1.00 2.00 Gesamt N 19 16 35 Mittlerer Rang 20.00 15.63 Rangsumme 380.00 250.00 ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 231 Statistik für Testb Mann-Whitney-U Wilcoxon-W Z Asymptotische Signifikanz (2-seitig) Exakte Signifikanz [2*(1-seitig Sig.)] Abschlüsse 114.000 250.000 -1.258 .208 a .217 a. Nicht für Bindungen korrigiert. b. Gruppenvariable: Vertreter Die beiden Vertreter unterscheiden sich nicht signifikant. 4) H 0 : Die Fonds-Manager unterscheiden sich nicht. H A : Die Fonds-Manager unterscheiden sich. ( zweiseitiger Test, 0. 05 Wir versuchen einen z- oder t-Test anzuwenden. Wir überprüfen die Daten auf Normalverteilung: P-P-Diagramm Normal Manager 2 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal Manager 1 1.00 .50 .25 0.00 0.00 .25 .50 .75 1.00 .50 .25 0.00 0.00 Beobachtete Kum. Wahrsch. .25 .50 .75 Beobachtete Kum. Wahrsch. Die Daten können (knapp) als normalverteilt betrachtet werden. Wir überprüfen die Homogenität der Varianzen: 25295974.46 26889353 0. 940 74 F 88,101 0. 94074 0. 614266055. Die Varianzen unterscheiden sich nicht signifikant. Wir können den t-Test verwenden: T X 1 X 2 2 n 1 1S 2 1 n 2 1S 2 n 1 1n 2 1 1 n1 n12 4571.5219623731.514532 8725295974.4610026889353 87100 1 1 88 101 1. 1265 ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 232 1.00 t 187 1. 1265 1 0. 130698735, p-Wert (zweiseitig): 2 0. 130698735 0. 26140 Mit Excel: (Typ 2: p-Wert für zweiseitig: 0.261393737) Mit SPSS: Gruppenstatistiken Gewinne Manager 1.00 2.00 N 88 101 Standardab weichung 5029.5104 5185.4945 Mittelwert 4571.5220 3731.5145 Standardfe hler des Mittelwertes 536.1476 515.9760 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit F Gewinne Varianzen gleich Varianzen nicht gleich .221 Signifikanz .639 T-Test für die Mittelwertgleichheit T df Sig. (2-seitig) Mittlere Differenz Standardfehler der Differenz 1.127 187 .261 840.0074 745.6732 1.129 184.840 .260 840.0074 744.1004 Der Unterschied ist nicht signifikant. Die Nullhypothese kann nicht abgelehnt werden. 5) H 0 : Die Diäten unterscheiden sich nicht. H A : Die Diäten unterscheiden sich (zweiseitiger Test; 0. 05 Wir denken an einen z- oder t-Test. Wir überprüfen die Daten auf Normalverteilung: ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 233 P-P-Diagramm Normal Makler 2 1.00 .75 .75 Erwartete Kum. Wahrsch. Erwartete Kum. Wahrsch. P-P-Diagramm Normal Makler 1 1.00 .50 .25 0.00 0.00 .25 .50 .75 1.00 .50 .25 0.00 0.00 Beobachtete Kum. Wahrsch. .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Wir entscheiden, dass die Daten (knapp) normalverteilt sind. Wir überprüfen die Homogenität der Varianz: 37.22076984 167.2132034 0. 222 59 F 56,45 0. 2259 1. 299 7 10 7 Die Varianzen sind signifikant verschieden. Wir überprüfen: n 1 , n 2 50. Wir können somit den z-Test verwenden: Z . X 1 X 2 S2 1 n1 S2 2 n2 29.5766831736.78387577 37.22076984 56 3. 443 5 167.2132034 45 3. 4435 1 0. 999712833 0. 00028717 0. 025 Der Unterschied ist hochsignifikant. Mit Excel: (Typ 3). 0.001056405 Mit SPSS: Gruppenstatistiken Umsatz Makler 1.00 2.00 N 56 45 Mittelwert 29.5767 36.7839 Standardab weichung 6.1009 12.9311 Standardfe hler des Mittelwertes .8153 1.9277 ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 234 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit F Umsatz Varianzen gleich Varianzen nicht gleich T-Test für die Mittelwertgleichheit Signifikanz 22.157 .000 T df Sig. (2-seitig) Mittlere Differenz Standardfehler der Differenz -3.694 99 .000 -7.2072 1.9512 -3.444 59.62 .001 -7.2072 2.0930 6) H 0 : Die Resultate von Männern und Frauen unterscheiden sich nicht. H A : Die Frauen schneiden besser ab als die Männer. Das Noten ordinalskaliert sind, müssen wir den Mann-Withney-Test verwenden. Wir erhalten: Geschlecht w w m m w w m w m m m m m m m m U 1 5 11 56 2 Punkte 19.25 19 18 18 17.5 17 16.5 16.25 16 15.75 13.25 12.75 11.875 11 7.5 1.5 Ränge 1 2 3.5 3.5 5 6 7 8 9 10 11 12 13 14 15 16 Rangsummen Ränge W Ränge M 1 2 3.5 3.5 5 6 7 8 22 9 10 11 12 13 14 15 16 114 22 48 U 2 5 11 48 7 minU 1 , U 2 min7, 48 7. Wir schauen in der Tabelle nach: unter n 1 5 und n 2 11 : ist signifikant auf dem 0.01 Niveau. 7) Für Genf: x 1 15 ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 235 n 1 60 Für Zürich: x 2 10 n 2 70 X 1 X 2 1510 n 1 n 2 6070 0. 192 31 X1 n1 X 1 X 2 n 1 n 2 1 X2 n2 X 1 X 2 n 1 n 2 n11 n12 15 60 10 70 1 1 0.192 3110.192 31 60 70 1. 5452 1. 5452 0. 938851038 Der Unterschied ist nicht signifikant 8) ( 15 0. 25; 60 10 70 0. 142 86. Es muss gelten: 0.250.14286 0.192 3110.192 31 n11 n12 1. 96 (für 0. 05; zweiseitig! Wir müssen x von x 0. 975 finden. Dies ist näherungsweise 1. 96) 0.250.14286 1.96 2 0.192 3110.192 31 0. 01923 7 1 n1 1 n2 n 1 und n 2 sind nicht beide durch diese Gleichung bestimmt. Wir können somit n 1 bestimmen, wobei n11 0. 01923 7 sein muss (sonst erhalten wir für n12 eine 1 n 1 51. 983 negative Zahl!). Somit gilt: n 1 0.01923 7 Wir wählen z.B. n 1 52. 1 Somit ist dann: 0. 01923 7 52 0. 000006230 8 1 n 2 0. 000006230 8 n 2 16049 Es wäre allerdings besser, möglichst gleich grosse Stichproben zu wählen. Entsprechend würden wir n 1 n 2 setzen und erhalten: 0. 01923 7 2n n 103. 97 Wir müssen so nur zwei Stichproben à 104 wählen (2 104 208, was viel weniger ist als 52 16049 16101. Aus dem Beispiel ist folgendes ersichtlich (das folgende gilt nicht nur bezüglich der Anteiltests, sondern bezüglich beliebiger Tests): (1) Haben wir die Vermutung, dass Abweichungen relativ unbedeutend sind, müssen wir grosse Stichproben haben, um sie als signifikant nachweisen zu können: je kleiner die Abweichung, desto grösser die Stichproben. Bezüglich vermuteter Abweichungen kann die minimale Stichprobengrösse berechnet werden. Umgekehrt gilt: wählen wir sehr grosse Stichproben, werden auch unbedeutende Differenzen signifikant. Das folgende Vorgehen ist zu empfehlen. In betriebswirtschaftlichem Zusammenhang kann man mit Hilfe von Kostenüberlegungen eine minimale Differenz berechnen, die aus Nutzengründen gerade noch interessant ist. Unterschiede darunter sind ökonomisch unattraktiv. Es wird dann bezüglich der gerade noch ökonomisch attraktiven Differenz die minimale Stichprobengrösse berechnet, die den Unterschied als signifikant nachweisen kann. Dann wird noch eine Sicherheitsreserve für Ausfälle hinzugezählt. ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 236 (2) Stichproben sollten möglichst gleichgross sein (dann wird die nötige Fallzahl kleiner). Entsprechend wird bei empirischen Untersuchungen der Forschungsplan gleich grossen Stichproben vorsehen. Die Formeln mit n 1 n 2 bleiben nützlich, da sich in der Praxis immer durch Ausfälle irgendwelcher Art verschieden grosse Stichproben ergeben. 2.2.8. Lernziele - Die angegebenen Zweistichprobentests für Datenmaterial korrekt auswählen und durchführen können (mit Excel und SPSS). Bei der Auswahl richtige Beurteilung der Voraussetzungen vornehmen können. - Die Bemerkung (1) bei der letzten Aufgabe des letzten Übungsblockes kennen und anwenden können. - Übungen von der Art der angegebenen lösen können. Univariate Tests diskret verteilte Zufallsvariablen stetig verteilte Zufallsvariablen Binomialtest Poissontest Hypergeometrische Tests etc. Einstichprobentests Zweistichprobentests verbundene Stichproben unverbundene Stichproben Mittelwertvergleich z-Test (> 30 oder NV) t-Test (NV) t-Test (NV) z-Test (ungleiche Varianz, n1,n2 > 50,NV) t-Test (gleiche Varianz) (NV) Verteilungsvergleich Vorzeichentest Vorzeichentest Wilcoxontest (symm. V.) Mann-Whitney-Test (symm. V.) Varianzvergleich Chiquadrattest (NV) F-Test (NV) Anteilsvergleich Binomialtest z-Test (n1,n2>50,NV) ___________________________________________________________________ Unverbundene Stichproben.tex 2. HSW Siders P.R. 237 3. Schätzen von Kennzahlen theoretischer Verteilungen Bei der Einführung von stetigen Verteilungen haben wir die Anpassung von Modellen an Daten diskutiert. Kamen wir auf Grund einer Graphik zum Schluss, dass z.B. eine Exponentialverteilung als Modell geeignet sein könnte, berechneten wir den Mittelwert der Daten und identifizierten diesen mit dem Mittelwert der theoretischen Verteilung: d.h. wir schätzten den Mittelwert des Modells aus den Daten. Das Problem des Schätzens kann entsprechend wie folgt allgemein formuliert werden: Hat man Daten und ein parametrisches Modell für sie, so will man eine eindeutige Beschreibung der Daten durch ein Modell erhalten, indem man die Werte der Parameter festlegt, so dass das Modell möglichst gut zu den Daten passt. Für die Wahl von Schätzern (z.B. das arithmetische Mittel versus Median) gibt es Kriterien, die wir kurz diskutieren wollen. 1) Erwartungstreue: Die konkrete Kennzahl einer Stichprobe ist als Wert einer Zufallsvariable zu betrachten. Diese Zufallsvariable nennen wir ”Schätzfunktion T”. Sie weist als Werte die realsierbaren Parameter der Stichprobe auf. T weist zudem eine Verteilung auf - mit Erwartungswert und Standardabweichung. Wir nehmen an, die Daten entstammten einer spezifischen Verteilung F mit dem Parameter . Der empirische Parameter der Daten ist im allgemeinen nicht mit identisch, sondern streut um die Kennzahl der theoretischen Verteilung. Wir nennen eine Schätzfunktion (oder einen Schätzer) T erwartungstreu genau dann, wenn der Erwartungswert von T mit identisch ist, d.h. ET . Gilt ET , so wird ET ”systematischer Fehler” oder ”Bias” genannt. 2) Effizienz: Gegeben seien zwei Schätzfunktionen. Die Schätzfunktion mit der kleineren Varianz gilt als effizienter. Gibt es unter den erwartungstreuen Schätzfunktionen eine, die am effizientesten ist, nennt man diese ”effizient”. 3) Konsistenz: Ein Schätzer ist konsistent, wenn lim ET 0 (n n Stichprobenumfang). Somit sind erwartungstreue Schäzter konsistent. Arithmetische Mittel und Median Das arithmetische Mittel einer Stichprobe i ist ein erwartungstreuer Schätzer des Erwartungswertes der Verteilung, aus der i stammt. Wir müssen zeigen, dass EX , wobei der Erwartungswert der Verteilung ist, aus der die Stichprobe stammt, deren Mittelwert Wert der Schätzfunktion X ist. Diesen Beweis haben wir bereits geführt (siehe Verteilung des Mittelwertes): n EX E 1n X i i1 1 n n EX i i1 1 n n i1 1 n n Ohne die jeweiligen Beweise erfolgen ein paar Bemerkungen zum Verhältnis der Schätzer ”Median” und ”Mittelwert”. Bei symmetrischen Verteilungen fällt der ___________________________________________________________________ Schätzungen.tex Statistik 2. HSW Siders P.R. 237 Median mit dem Mittelwert zusammen. Entsprechend ist dann auch der Median ein erwartungstreuer Schätzer des theoretischen Medians. Die Medianschätzfunktion unterscheidet sich allerdings von der Mittelwertschätzfunktion durch den Umstand, dass erstere bei normalverteilten Daten eine grössere Varianz hat. Der Median ist als Schätzer somit weniger effizient als das arithmetische Mittel, sofern die Daten normalverteilt sind. Der Median ist bei asymmetrischen Verteilungen nicht erwartungstreu, ist jedoch konsistent, d.h. je grösser der Datensatz, desto erwartungstreuer ist der Median. Der Mittelwert hat den Nachteil, sehr sensitiv auf Ausreisser zu reagieren (nicht robust). Der Median ist ein sehr robuster Schätzer. Ist die Normalverteilungsannahme nicht gegeben, ist der Mittelwert oft nicht effizienter als der Median. Varianz Wir zeigen, dass die Varianz einer Stichprobe i ein erwartungstreuer Schätzer der Varianz der theoretischen Verteilung ist, aus der i stammt. Wir müssen zeigen, dass ES 2 , wobei 2 die Varianz der theoretischen Verteilung ist. Es gilt: S2 1 n1 n n X i X 2 i1 1 n1 n n X 2i 2X i X X 2 i1 1 n1 X 2i 2 nn X i X nX 2 1 n1 X 2i 2nX 2 nX 2 i1 n 1 n1 i1 i1 1 n1 n n 1 n1 n n n i1 i1 i1 X 2i 2 X i X X 2 X 2i 2nX X nX 2 i1 X 2i nX 2 i1 Im folgenden setzen wir EX i 0, da die Varianz von der Lage der Verteilung unabhängig ist. Zudem verwenden wir Theoreme aus dem Kapitel ”Verteilung des Mittelwertes”: ES 2 E 1 n1 n X 2i nX 2 i1 Da EX i 0, gilt EX 2i 1 n1 n EX 2i nEX 2 i1 n EX i EX i VX i . Somit ist EX 2i nVX i 2 2 Da EX EX i 0, gilt: EX 2 EX EX VX VX Somit ist dann: nEX 2 n n i VX i Deshalb gilt: 1 n1 1 n1 n EX 2i nEX 2 i1 1 n1 i1 VX i n nVX i VX i VX i n 1 VX i . Somit ist die Varianz einer Stichprobe ein erwartungstreuer Schätzer der Varianz der theoretischen Verteilung. Dieser Beweis stellt eine Rechtfertigung für die 1 Definition der Varianz mit n1 dar. Bei einer Definition mit 1n wäre eine Nachweis der Erwartungstreue der Varianz nicht möglich. Es gibt verschiedene Methoden, um für beliebige Verteilungen Parameter zu schätzen. Wir werden im Rahmen der Regressionsgleichung die Methode der kleinsten Quadrate kennenlernen. Gebräuchlich ist zudem die Maximum-Likelihood-Methode. ___________________________________________________________________ Schätzungen.tex Statistik 2. HSW Siders P.R. 238 4. Vertrauensintervalle Wir nehmen an, in einem spezifischen Test würde ein konkreter Wert b zu einem signifikanten Resultat führen. So hätte etwa eine Mastmethode zu einem mittleren Gewicht von x geführt, das zur Verwerfung der Nullhypothese mit Mittelwert der Grundgesamtheit 0 geführt hat. Würden wir die neue Mastmethode auf alle Tiere der Art anwenden, würden wir somit ein neues 0 erhalten, da es unwahrscheinlich ist, dass x aus einer Grundgesamtheit mit 0 stammt. Wir können den konkreten Wert x des Testergebnisses als Wert der Stichprobe aus einer neuen Grundgesamtheit mit 0 betrachten. Entsprechend ist x als Wert einer Zufallsvariable zu betrachten und schwankt um den tatsächlichen, aber unbekannten Wert 0 der ”neuen” Grundgesamtheit. Es wäre nun nützlich zu wissen, in welchem Intervall um x sich 0 mit einer angebbarer Wahrscheinlichkeit von befindet. Erhalten wir einen spezifischen Testwert b, können wir uns fragen, welche Verteilungsparameter mit diesem Wert verträglich sind ( nicht zur Verwerfung der jeweiligen Nullhypothese führen). Es sind ja genau diese Werte, zu denen b als Testresultat passt. Bei anderen Werten wäre b als Testresultat unwahrscheinlich. Deshalb ist es vernünftig, ”Vertrauensintervall” wie folgt zu definieren: Definition: Das Vertrauensintervall oder Konfidenzintervall V b b i : b i führt bei einem Testergebnis von b bei einem Signifikanzniveau von 1 nicht zur Verwerfung der Nullhypothese Die Grenzen g i des Vertrauensinvervalls sind somit die Parameter g i , die genau zur Verwerfung der Null-Hypothese führen. Es gilt dann: u i V b genau dann, wenn g l u i g r . Die Intervallgrenzen g i gehören nicht zum Vertrauensintervall. Die Angabe eines Testwertes ohne die Angabe eines Intervalls, in dem der tatsächliche, aber unbekannte Parameter der ”neuen” Grundgesamtheit mit angebbarer Wahrscheinlichkeit liegt, ist eigentlich nicht sinnvoll. Ist dieses Intervall gross, so ist der Unterschied zwischen der Nullhypothese und der Alternativhypothese unter Umständen ökonomisch nicht relevant. Ein Wechsel der Produktionsmethoden würde in einem solchen Fall nur Kosten verursachen, ohne ökonomisch interessante Verbesserungen. Wir betrachten das Beispiel eines Einstichprobentests (z-Test). Beispiel 1: Es sei X i normalverteilt oder n genügend gross und 20 aus der Grundgesamtheit bekannt. Wir hätten im Test einen konkreten Wert x als Ausprägung der Zufallsvariable X erhalten. Wir können uns fragen, welche i mit diesem x verträglich sind ( bei einem Signifikanzniveau von nicht zur Verwerfung der Nullhypothese führen). Die Nullhypothese wird nicht verworfen, X x wenn für 0 i N0, 1 gilt: 1 1 0 i 1 1 . 2 2 n n Um die Intervallgrenzen zu finden, lösen nach g auf: ___________________________________________________________________ Vertrauensintervalle.tex 2. HSW Siders P.R. Seite 239 Untere Grenze: 1 1 2 x g 1 1 2 0 1 1 x 2 n Obere Grenze:: x g 1 x 1 1 2 0 n 0 n g x 1 1 2 x i 1 0 n 1 2 0 n x i 0 n 1 2 0 n g g x 1 1 2 0 n Nun gilt wegen der 0-Symmetrie der Standardnormalverteilung: 1 1 n0 1 1 n0 . Wir können somit für die Grenzen des 2 2 Vertrauensintervalles zusammenfassen: g x 1 1 2 n Für 0. 95 (95%-Vertrauensintervalle) müssen wir somit 1 0. 975 1. 96 berechnen. Entsprechend erhalten wir als Grenze des Vertrauensintervalles g x 1 1 1 2 1 2 n x 1. 96 n 1. 96 für 0. 95 g Intervallgrenze des 0. 95 Vertrauensintervalles. Konkretes Beispiel: Wir erhalten den Testwert x 10 (Mittelwert der Stichprobe) und kennen die Standardabweichung der Grundgesamtheit: 0 0. 5. (n 30): Wir erhalten als Grenzen des Vertrauensintervall: 10 1. 96 0.5 10. 179 10 1. 96 0.5 30 30 9. 821 1. Das 95%-Vertrauensintervall ist somit 9. 8211, 10. 179. Man sieht an der Formel x 1. 96 n unmittelbar, dass das Vertrauensintervall grösser wird, wenn die Standardabweichung grösser ist. Zudem ist das Vertrauensintervall kleiner, wenn n grösser ist: je grösser die Stichprobe, desto kleiner das Vertrauensintervall. Mit Excel können wir die Quantile der Standardnormalverteilung für spezifische Wahrscheinlichkeiten durch ”norminv” finden: für (0. 025, 0, 1) erhalten wir: 1. 959961082 1. 96. für (0. 975, 0, 1) erhalten wir: 1. 959961082 1. 96. Am Beispiel 1 können wir die Grundüberlegungen bezüglich der Vertrauensintervalle noch etwas deutlicher machen. ___________________________________________________________________ Vertrauensintervalle.tex 2. HSW Siders P.R. Seite 240 Vertrauensintervall je 0.025 Ein i 10. 179 führt bei einem Testresultat von 10 zur Verwerfung der Nullhypothese, ist somit mit dem Testresultat nicht verträglich. Ein i 9. 8211 führt bei einem Testresultat von 10 ebenfalls zur Verwerfung der Nullhypothese. 9. 8211 i 10. 179 führt bei einem Testresultat von 10 nicht zur Verwerfung der Nullhypohtese. Somit ist das Vertrauensintervall 9. 8211, 10. 179. Eine andere Betrachtungsweise führt zum selben Resultat: Wir können uns die Verteilung um 10 herum denken. Die Grenzen des Vertrauensintervalls sind dann die g , die symmetrisch um 10 zwischen der x-Achse und der Dichtefunktion der Normalverteilung mit 10 und 0.5 eine Fläche von 0.95 ausschneiden: 30 ___________________________________________________________________ Vertrauensintervalle.tex 2. HSW Siders P.R. Seite 241 je 0.025 Vertrauensintervall Die Vertrauensintervalle berechnen wir mit Hilfe eines Testwertes, der Wert einer Zufallsvariable ist. Entsprechend ist ein Vertrauensintervall selber Wert einer Zufallsvariable. Wir können jedoch davon ausgehen, dass der tatsächliche Wert sich mit einer Wahrscheinlichkeit von im Vertrauensintervall um das Testresultat herum befindet. Vertrauensintervalle sind informativer als das Testresultat ”signifikant” oder ”nicht-signifikant”. Es gilt offenbar. Ein Testergebnis ist genau dann signifikant, wenn der Parameter der Nullhypothese ausserhalb des Vertrauensintervalles des Testergebnisses liegt. Somit kann man aus Vertrauensintervallen Signifikanz unmittelbar herauslesen, während man aus dem Ergebnis ”signifikant” allein keine Vertrauensintervalle herleiten kann. Beispiel 2: Es gelte X i N, 20 mit unbekanntem 20 . X Wir hätten einen t-Test verwendet: S t n1 . n Bei einem Testergebnis von x wird die Nullhypothese nicht verworfen, wenn x 1 1 t n1 1 i t n1 1 . 2 2 n ( Standardabweichung der Stichprobe, n Stichprobengrösse, die t-Verteilung ist symmetrisch). Wir lösen nach g auf und erhalten wie oben: 1 1 n . g x t n1 2 Konkretes Beispiel: n 50; x 20; 2. ___________________________________________________________________ Vertrauensintervalle.tex 2. HSW Siders P.R. Seite 242 1 Wir suchen in einer Tabelle oder mit Hilfe von Excel t 501 0. 975 : 2. 009574018. (Excel liefert die entsprechenden Quantile unter ”tinv” für den zweiseitigen Fall an. Im Beispiel würden wir für somit (0.05; 49) eingeben und erhalten: 2.009574018) Wir erhalten somit: 20 2. 009574018 2 20. 568 für ”” und 19. 432 für ””. 50 Das Vertrauensintervall ist somit 19. 432, 20. 568 Bei asymmetrischen Verteilungen (z.B. F- und 2 Verteilungen) müssen wir die rechte und die linke Intervallgrenze separat berechnen. Wir betrachten noch ein Beispiel mit einer diskreten Verteilung: Beispiel 3: Bei der Messung von 10 Proben Luft würden wir 45 Asbestfasern erhalten (Grenzwert 30). Wir berechnen: PX 45 1 0. 993731385 6. 268 6 10 3 für X P30. Da 45 zur Verwerfung der Nullhypothese mit 30 führt, gehört 30 nicht zum Vertrauensintervall von 45. Wir fragen uns, welcher Parameter in X P mit 45 verträglich wären, d.h. nicht zur Verwerfung der entsprechenden Nullhypothese führen (auf einem spezifischen Signifikanzniveau, z.B. 0. 05, zweiseitig). Wir berechnen PX 45 für 31, 32, 33,etc. um die Intervallgrenze zu finden. Auf der anderen Seite berechnen wir PX 45 für 56, 57, 58, 59, etc. λ= 30 31 32 33 34 35 36 37 P(X > 45 0.00626861 0.01064678 0.0172969 0.02696198 0.04043834 0.05850936 0.08186538 0.11101977 λ= 56 57 58 59 60 61 62 63 P(X < 45 0.07668825 0.05981402 0.04613935 0.03520735 0.02658206 0.0198627 0.01469207 0.01076026 Wir erhalten: PX 45 0. 026961979 für X P33 als ersten Wert, der über 0. 025 liegt und damit nicht zur Verwerfung der Nullhypothese führt. Auf der anderen Seite von 45 gilt: PX 45 0. 026582065 für X P60 als erstem Wert, der über 0. 025 liegt und damit nicht zur Verwerfung der Nullhypothese führt. Das Vertrauensintervall für 45 wäre entsprechend 33, 60 N oder 32, 61N. Mit einer Wahrscheinlichkeit von 95% liegt der tatsächliche Wert in diesem Intervall, wenn der Testwert 45 beträgt. Übungen: 1) Berechnen Sie das 95%-Vertrauensintervall für n 10; 2 11. 55433333; 55, x 49. 61 (siehe Beispiel für Einstichproben-t-Test) 2) Berechnen Sie das 95%-Vertrauensintervall für das Beispiel 1, Einstichprobentests (z-Test). 3) Berechnen Sie das 95%-Vertrauensintervall für das Beispiel 1, gepaarte ___________________________________________________________________ Vertrauensintervalle.tex 2. HSW Siders P.R. Seite 243 Stichproben. 4) Berechnen Sie das 98%-Vertrauensintervall für Übung 2 dieses Kapitels). Lösungen 1 1) t 9 0. 975 2. 262 Wir erhalten somit: 49. 61 2. 262 11.5543333 10 52. 041 47. 179 49. 61 2. 262 11.5543333 10 Das Vertrauensintervall ist somit 47. 179; 52. 041 Von SPSS wird in diesem Zusammenhang das Vertrauensintervall der Differenzen (der Mittelwerte) angegeben. Wir können dies wie folgt berechnen: 55 47. 179 7. 821 sowie 55 52. 041 2. 959 Wir erhalten somit: 7. 821, 2. 959 2) Indem wir die obigen Formeln verwenden gilt: x 1. 96 20. 5 1. 95 20. 5 1. 95 2 50 2 50 0 n 21. 052 19. 948 19. 948, 21. 052 1 3) Indem wir die obigen Formeln verwenden, gilt: x t n1 0. 975 1 t 16 0. 975 2. 12 Wir erhalten somit:0. 891718213 2. 12 0.040089677 0. 871 11 0. 891718213 2. 12 0.040089677 0. 912 33 0. 91233, 0. 87111. n ; 17 17 4) Wir berechnen das 0.99-Quantil der Standardnormalverteilung (mit Excel): 2. 326341928 d.h. 2. 326341928 0. 99. Indem wir die obigen Formeln verwenden gilt: x 2. 326341928 20. 5 2. 326341928 20. 5 2. 326341928 19. 842, 21. 158 2 50 2 50 0 n 21. 158 19. 842 Wie zu erwarten, gilt: 19. 948, 21. 05219. 842, 21. 158. ___________________________________________________________________ Vertrauensintervalle.tex 2. HSW Siders P.R. Seite 244 Stichprobentheorie Oft will man eine Kennzahl einer Grundgesamtheit auf Grund einer Stichprobe schätzen (z.B. in einer Umfrage möchte man den Anteil der Befürworter, Gegner und Unentschiedenen bezüglich einer Abstimmung oder die Interessenten eines Produktes oder einer Dienstleistung schätzen; man möchte das Durchschnittseinkommen einer Population kennen, usw.). Bei Schätzungen ist jeweils ein Wert anzugeben sowie ein Vertrauensintervall. Ergibt sich bei Meinungsumfragen, die zeitlich gestaffelt vorgenommen werden, ein Unterschied von 3% und beträgt das Vertrauensintervall für beide Werte 2%; 2%, wobei der geschätzte Anteil an Befürwortern ist, so kann da offensichtlich kein Trend herausgelesen werden - ein häufiger Fehler bei der Interpretation von Umfrageergebnissen. Entsprechend sind Umfrageergebnisse ohne die Angabe von Vertrauensintervallen nicht sinnvoll. Wir betrachten eine Population mit N Objekten. Aus dieser wird eine Zufallsstichprobe S (ohne Zurücklegen) gezogen. Dazu werden z.B. den Objekten der Population willkürlich Zufallszahlen zugeordnet. Die Zufallszahlen werden dann der Grösse nach geordnet. Bei einer Stichprobengrösse von n wählen wir die n Objekte mit den n kleinsten Zufallszahlen. Es gibt Nn mögliche Stichproben, die auf diese Art gezogen werden können. Jede dieser Stichproben S ist gleich wahrscheinlich. Entsprechend ist die Wahrscheinlichkeit, eine spezifische Stichprobe S zu ziehen, PS 1N . n Die Wahrscheinlichkeit eines spezifischen Objektes, Element der Stichprobe S zu sein, kann ebenfalls angegeben werden. x i gehört zur Stichprobe S genau dann, wenn x i zu den n Objekten mit den n kleinsten Zufallszahlen gehört. Die Wahrscheinlichkeit dazuzugehören, beträgt offensichtlich Nn . Bezüglich der Objekte x i interessieren uns spezifische Merkmale y i . Sei y S das Stichprobenmittel der metrisch skalierten Merkmale y i der Stichprobe S. Dann ist y S als Wert einer Zufallsvariable Y S zu betrachten. Wie verhält sich Y S in bezug auf die Populationsparameter y 0 ( Mittelwert der Ausprägung y i der Gesamtpopulation)? An einem Beispiel wollen wir zuerst zeigen, dass der Erwartungswert von Y S mit y 0 übereinstimmt. Zudem ist die Standardabweichung von Y S ( Standardfehler) kleiner als die Standardabweichung der Grundgesamtheit. Beispiel 1: Gegeben sei die Minipopulation P a, b, c, d, e, f mit den Ausprägungen y 1 , y 2 , y 3 , y 4 , y 5 , y 6 3, 1, 10, 4, 8, 2. Der Mittelwert y der Population bezüglich der Variable y ist dann: y P 3110482 4 23 6 Die Standardabweichung ist: P 34 23 2 14 23 2 104 23 2 44 23 61 2 84 23 2 24 23 2 3. 559026084 Wir ziehen nun alle möglichen Stichproben S i der grösse n 2: ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 245 Es gibt 62 15 solcher Stichproben S i : Wir listen diese auf (samt ihrem jeweiligen Mittelwert y S i ): Stichprobe S a a a a a b b b b c c c d d e b c d e f c d e f d e f e f f Werte yi,1, yi,2 der Stichprobe Si Mittelwerte der Stichprobe Si 3 1 2 3 10 6.5 3 4 3.5 3 8 5.5 3 2 2.5 1 10 5.5 1 4 2.5 1 8 4.5 1 2 1.5 10 4 7 10 8 9 10 2 6 4 8 6 4 2 3 8 2 5 Erwartungswert 4.66666667 Standabw. 2.05480467 Wir stellen fest: der Erwartungswert k 15 i1 i1 EY S PS i y S i 1 15 y S i 1 15 15 y S i 4. 6666667, stimmt mit dem i1 Populationsmittel y 0 überein. Mit anderen Worten: das Stichprobenmittel ist ein erwartungstreuer Schätzer des Populationsmittelwertes. Die Standardabweichung der Mittelwerte der Stichproben ist hingegen kleiner als die Varianz der Daten der Population. Wir formulieren diese und weitere Resultate nun formal und leiten manche davon her: I. Schätzen des Mittelwertes und des Totals einer Gesamtpopulation Theorem 1: EY S y 0 (Y S Zufallsvariable mit Stichprobenmitteln als Werte; y 0 Mittelwert der Gesamtpopulation). Beweis: Wir müssen zeigen: EY S 1 N N y j y 0 j1 ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 246 Für das arithmetische Mittel y S i der Stichprobe S i der Grösse n gilt: Nn Nn i1 i1 EY S PS i y S i 1 Nn Nn i1 1 n n yj 1 y S i Nn 1 Nn n yj jS i Nn y S i i1 Nn n Nn n jS i 1 1 n yj i1 jS i Nn n y j ist die Summe der Summen der Ausprägungen y j einer jeden Stichprobe i1 jS i Si. Jedes y i kommt genau in N1 Stichproben vor. Beweis: Wir betrachten ein n1 spezifizisches y i und die Menge P P\y i . Jede Teilmenge von P mit n 1 Elementen kann verwendet werden, um {y i } zu einer Stichprobe des Umfangs n zu ergänzen. In P gibt es N1 Stichproben des Umfangs n 1. Somit kommt y i in n1 N1 n1 Stichproben des Umfangs n vor. Die Summe der Summen aller Strichproben enthält somit jedes y i N1 mal als Summand. Entsprechend ist sie das n1 N1 n1 fache der Summe aller y i . Nn n Nn n i1 jS i i1 jS i N Wir können also y j wie folgt umschreiben: y j N1 yj n1 Wir erhalten: EY S Nun ist N1 n1 und: Nn 1 Nn n N1 n1 N N1 y j N n n1 1 n j1 N1! N1n1!n1! N! Nn!n! N1! Nn!n1! . Somit ist N1!Nn!n! N!Nn!n1!n Somit ist EY S j1 1 Nn n N1 n1 N1!Nn!n! N!Nn!n! N yj j1 1 N N N1! N! y j y 0 1 N q.e.d. j1 Beispiel 2: Wir möchten den durchschnittlichen Weinkonsum einer Stadt erfassen (100’000 Einwohner). Dazu ziehen wir eine Zufallsstichprobe von 200 Personen und erheben ihren Weinkonsum (z.B. durch Befragung). Wir erhalten 200 Ergebnisse y i . Wir bilden den Mittelwert y S der 200 Ergebnisse y i und können diesen als erwartungsstreuen Schätzer des durchschnittlichen Weinkonsums der 100’000 Einwohner betrachten. ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 247 Wir behandeln nun das Schätzen von Totalen. Sei Y die Summe der y i , i N (Y ist N somit das Populationstotal der y i , d.h. y i Y) i1 N N i1 i1 Theorem 2: ENY S NEY S Ny 0 N N1 y i y i Y (N Anzahl Objekte der Gesamtpopulation; Y S Zufallsvariable mit den Mittelwerten der Stichprobe der Grösse n als Werte; y i Datum des Objektes x i ; y 0 Mittelwert der Gesamtpopulation). Der Erwartungswert des N-fachen des Stichprobenmittels ist gleich der Summe der y i der Grundgesamtheit. Entsprechend ist NY S ein erwartungstreuer Schätzer des Populationstotals Y Beispiel 3 : Wir führen das vorangehende Beispiel 2 fort. Wir möchte wissen, wieviel der Gesamtweinkonsum der Stadt ist. Wir multiplizieren den geschätzten durchschnittlichen Weinkonsum mit 100’000 und erhalten den geschätzten totalen Weinkonsum. II. Vertrauensintervalle für Schätzungen des Mittelwertes und des Totals Ohne Beweis halten wir fest: Theorem 3: VY S 1 n 1 n N 20 (Y S ist die Zufallsvariable mit den Stichprobenmitteln als Werte; n Grösse der Stichprobe; N Grösse der Gesamtpopulation; 20 Varianz der Variable y der Gesamtpopulation, wobei gilt: 20 1 N1 N y i y 0 2 i1 Entsprechend ist VY S kein erwartungstreuer Schätzer von 20 . Demgegenüber VY wäre 1 Sn ein erwartungtreuer Schätzer von 20 . n 1 N Im betrachteten Beispiel 1 erhalten wir für den Standardfehler des Mittelwertes ( Standardabweichung des Mittelwertes, manchmal auch ”Stichprobenfehler” genannt): 1 2 1 26 3. 559026084 2 2. 0548. (Überprüfen Sie die Übereinstimmung mit dem Ergebnis in der Tabelle). Sei 2S die Varianz einer konkreten Stichprobe S. Dann gilt: Theorem 4: 1n 1 Nn 2S ist ein erwartungstreuer Schätzer der Varianz VY S 1n 1 Nn 20 der Zufallsvariable Y S . ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 248 (n Stichprobengrösse; N Grösse der Gesamtpopulation; 2S 1 n1 Varianz der Stichprobe S; 20 Varianz der Gesamtpopulation). n y i y S 2 i1 Entsprechend werden wir diese Formel dazu verwenden können, um Vertrauensintervalle zu berechnen. Der Faktor 1 Nn wird Endlichkeitskorrektur genannt. In der Praxis wird er vernachlässigt, wenn Nn 0. 1 ist (die Stichprobe im Verhältnis zur Grundgesamtheit klein ist). Beim Wegfallen der Endlichkeitskorrektur erhalten wir somit für die geschätzte Varianz der Stichprobenmittel: 2y 1n 2S . Dies ergibt einen geschätzten Standardfehler von: y nS . Bei der Berechnung von Vertrauensintervallen geht man im Allgemeinen davon aus, dass die Zufallsvariable Y S , normalverteilt ist, selbst wenn VY S aus der Stichprobe geschätzt wird (in diesem Fall wäre eigentlich eine t-Verteilung angebracht und man müsste Normalverteilung der Daten voraussetzen). Dies ist gerechtfertigt, da die Stichproben im Allgemeinen mehrere Hundert Daten umfasst. Die Normalverteilungsannahme ist jedoch nicht gerechtfertigt, wenn extrem schiefe Verteilungen mit extremen Ausreissern vorliegen (häufig bei Einkommensdaten oder Investitionen). Zur Berechnung von Vertrauensintervallen können wir bei Voraussetzung einer Normalverteilung entwickeln: Ohne Endlichkeitskorrektur: y g y S y y g y S S 1 1 2 n 1 ist die Umkehrfunktion der Standardnormalverteilungsfunktion. Wir lösen nach y g auf und erhalten als Intervallgrenzen des Vertrauensintervalls: y g y S 1 1 2 S n ohne Endlichkeitskorrektur Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95) y g Intervallgrenzen des Vertrauensintervalls y S Mittelwert der Stichprobe S Standardabweichung der Stichprobe n Stichprobengrösse Mit Endlichkeitskorrektur: y g y S y y g y S 1 n 1 n N 2S 1 1 2 . Wir lösen nach y g auf und erhalten: ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 249 y g y S 1 1 2 1 n 1 n N 2S mit Endlichkeitskorrektur Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95) y g Intervallgrenzen des Vertrauensintervalls y S Mittelwert der Stichprobe S Standardabweichung der Stichprobe n Stichprobengrösse N Grösse der Grundgesamtheit Beispiel 4: Wir wollen den durchschnittlichen Konsum elektronischer Unterhaltungsgüter einer Population schätzen (in Franken). Dazu soll ein Vertrauensintervall von 95% angegeben werden. Die Population weise 500’000 Personen auf. Es wird eine Zufallstichprobe von 500 Personen gezogen. Wir 500 nehmen an, y s 700. und S 200. . Wir berechnen: 500000 0. 001 0. 1. Wir können somit die Endlichkeitskorrektur vernachlässigen. Wir erhalten als geschätzten Standardfehler: y 200 8. 9443. (Mit der Endlichkeitskorrektur 500 erhalten wir: y 1 n 1 n N 2S 1 500 1 500 500000 200 2 8. 9398 Wir berechnen nun das 95%-Vertrauensintervall (ohne Endlichkeitskorrektur): y g 700 1. 96 1 0. 975 8.9443 Wir rechnen nach y g aus und erhalten: y g 700 8.9443 1. 96 y g 717. 53. Da die Normalverteilung symmetrisch ist, erhalten wir für die andere Seite 700 17. 53 682. 47 und damit: ]682. 47; 717. 53. Mit einer Wahrscheinlichkeit von 95% befindet sich der tatsächliche Mittelwert der Grundgesamtheit in diesem Intervall, wenn wir in der Stichprobe einen Mittelwert von 700 haben. Mit Hilfe der obigen Formeln erhalten wir dieses Resultat schneller: y g y S 1 1 Sn 700 1. 96 200 682. 47 für ”” und 717. 53 für ””. 2 500 Das Vertrauensintervall ist somit: ]682. 47, 717. 53. Mit Hilfe der Formel samt Endlichkeitskorrektur erhalten wir: y g y S 1 1 1n 1 Nn 2S 700 1. 96 2 für ”” und 717. 52 für ””. Das Vertrauensintervall ist somit: [682. 48;717. 52]. 1 500 1 500 500000 200 682. 48 Berechnung der Stichprobengrösse: Sofern wir aus früheren Daten die vermutliche Varianz der Grundgesamtheit schätzen können, können wir mit den obigen Formeln auch die Stichprobengrösse festlegen, die zu einer spezifischen Breite ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 250 des Vertrauensintervalles führt. Wir betrachten die Formel ohne Endlichkeitskorrektur: y g y S 1 1 2 S n Die Breite des Vertrauensintervalls ist 2|y g y S | : 2. Wir erhalten somit: 2 2 1 1 1 2 0 n 1 2 0 n . Wir lösen dies nach n auf und erhalten: 1 1 2 n 2 2 0 2 ohne Endlichkeitskorrektur Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95) die Hälfte der Breite des Vertrauensintervalles 20 Standardabweichung der Gesamtpopulation (gewöhnlich geschätzt durch frühere Stichprobe) n Stichprobengrösse Bei der Berücksichtigung der Endlichkeitskorrektur erhalten wir: 2 2 1 n 20 N 1 2 1 n n N 2S 2 1 1 2 20 1 1 2 1 2 2 N Beispiel 5: Wir führen das Beispiel 4 fort. Wir nehmen an, wir würden nochmals eine Untersuchung vornehmen und möchten ein 95%-Vertrauensintervall mit einer Breite von 10 haben (oben betrug die Breite 17. 52. Wie gross muss die Stichprobe sein? Wir schätzen 0 mit Hilfe der Standardabweichung der ersten 1.96 2 200 2 Stichprobe und erhalten: n 1536. 6 2 10 Wir müssen somit eine Stichprobengrösse von 1537 wählen. Wir sehen, dass die Grösse der Stichprobe recht massiv erhöht werden muss, um das Vertrauensintervall in dieser Grössenordnung zu senken (Faustregel: um das Vertrauensintervall zu halbieren, muss man die Stichprobengrösse vervierfachen). Mit Hilfe der Formel mit Endlichkeitskorrektur: n 20 N 2 1 1 2 20 1 1 2 2 2 N 200 2 500000 1.96 2 200 2 1.96 2 10 2 500000 1531. 9 ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 251 Bei der Berechnung des Vertrauensintervalls von Totalen gilt: VY VNy N 2 Vy N2 n 1 n N 20 Wiederum schätzen wir im Allgemeinen 20 durch 2S . Somit erhalten wir als Schätzung für VY : N2 n 1 n N 2S Wir setzen wiederum Normalverteilung voraus und erhalten: Y g Y S N2 n 1 n N 2S 1 1 2 Wobei Y S das aus der Stichprobe geschätzte Total ist. Wir lösen nach Y g auf: Y g Y S 1 1 2 N2 n 1 n N 2S Bei Vernachlässigung der Endlichkeitskorrektur: Y g Y S 1 1 2 N2 n 2S Beispiel 6: Wir führen das Beispiel 4 fort. Wir wollen den Gesamtkonsum elektronischer Unterhaltungsgüter einer Population schätzten (in Franken). Dazu soll ein 95%-Vertrauensintervall angegeben werden. Die Population weise 500’000 Personen auf. Es wird eine Zufallstichprobe von 500 Personen gezogen. Wir 500 nehmen an, y s 700. und S 200. . Wir berechnen: 500000 0. 001 0. 1. Wir können somit die Endlichkeitskorrektur vernachlässigen. Y g Y S 1 1 2 3. 587 7 10 8 für ””. N2 n 2S 500000 700 1. 96 500000 2 500 200 2 Dabei ist Y S 500000 700 3. 5 10 8 ; 3. 5 10 8 3. 5877 10 8 8. 77 10 6 Wir erhalten somit folgendes Vertrauensintervall: 3. 5 10 8 8. 77 10 6 ; 3. 5 10 8 8. 77 10 6 Mit einer Wahrscheinlichkeit von 95% befindet sich die tatsächliche Gesamtsumme in diesem Intervall, wenn der geschätzte Wert 3. 5 10 8 ist. Wie im Falle des Mittelwertes, kann auch hier bei bekannter Varianz eine Formel für die nötige Sichtprobengrösse für ein spezifisches Vertrauensintervall angegeben werden (das Vorgehen ist dabei mit dem obigen identisch). III. Schätzen von Anteilen Für Anteile können wir (ohne Beweise) festhalten: (U Grundgesamtheit; A U, A ist die Teilmenge von U, deren zahlenmässigen Anteil wir schätzen wollen; N Anzahl Objekte von U, N A Anzahl Objekte von A, der Anteil p U von A an U ist somit: p U NNA ). Dieser Anteil wird erwartungstreu geschätzt durch den Anteil p s nnA in ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 252 der Stichprobe (n A Anzahl der Elemente der Menge A s A in der Stichprobe S (A s S; n Stichprobengrösse) p s ist damit Wert einer Zufallsvariable P S . Für deren Varianz lässt sich zeigen: VP s p U 1p U Nn n N1 Sie wird geschätzt durch: 2P s 1 n N p s 1p s n1 , wobei 1 Nn auch hier die Endlichkeitskorrektur ist. Wir gehen wiederum davon aus, dass Anteile normalverteilt sind. Damit ergeben sich für Vertrauensintervalle die folgenden Formeln: p g p S 1 n N p s 1p s n1 1 p g p S 1 1 2 1 2 n N 1 p s 1p s n1 mit Endlichkeitskorrektur Wahrscheinlichkeit, dass Grösse im Vertrauensintervall liegt (z.B. 0.95) p g Grenze des Vertrauensintervalls p S Anteil in der Stichprobe S N Grösse der Gesamtpopulation n Stichprobengrösse ohne Endlichkeitskorrektor ergibt sich: p g p S 1 1 2 p s 1p s n1 Beispiel 7: Es soll der Anteil an Jugendlichen bei den Konsumenten von Mobiltelephonie in einer Stadt erhoben werden (N 200’000). Dazu wird eine Zufallsstichprobe von 400 Personen unter den Mobiltelephonbenutzern gezogen. Es ergebe sich ein Anteil von 100 Jugendlichen. Wir berechnen das 95%- (das 98%-) Vertrauensintervall. pg 100 400 100 400 1. 96 1 400 200000 100 400 1 100 400 4001 0. 292 45 für ””. 0. 292 45 0. 042 45. 0. 042 45 0. 207 55. Damit Somit erhalten wir für die linke Intervallgrenze: 100 400 erhalten wir das Intervall: 0. 20755, 0. 29245. Mit einer Wahrscheinlichkeit von 95% befindet sich der tatsächliche Anteil von Jugendlichen in diesem Intervall, wenn der Stichprobenanteil 100 0. 25 beträgt. 400 100 1 100 Ohne Endlichkeitskorrektur: p g 100 1. 96 4004001400 0. 292 49 für ”” und 400 0. 25 0. 25 0. 29249 0. 207 51 für ””. Dies ergibt das Intervall: ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 253 0. 207 51, 0. 292 49 Für das 98% Intervall erhalten wir ohne Endlichkeitskorrektor: 100 1 100 p g 100 2. 326341928 4004001400 0. 300 43 für ”” und 400 0. 25 0. 25 0. 30043 0. 199 57 für ”” und damit das Intervall: 0. 199 57, 0. 300 43 Auch hier kann die Stichprobengrösse, wenn die Varianz aus früheren Erhebungen geschätzt werden kann, in Hinblick auf ein gewünschtes Vertrauensintervall im Voraus bestimmt werden. IV. Schätzen des Medians und von Quartilen Der Median der Populationswerte kann durch den Median der Stichprobe geschätzt werden. Die Quartile der Populationswerte werden durch die Quartile der Stichprobe geschätzt. Der Median hat gegenüber dem arithmetischen Mittel den Vorteil, durch Ausreisser nicht beeinflusst zu werden. Entsprechend ist die Verwendung des Medians angemessen, wenn die Stichprobe Ausreisser enthalten (z.B. beim Schätzen des Einkommens einer Kleinstadt, wenn ein Milliardär in der Stichprobe vorkommt). Eine grobe Abschätzung der Standardabweichung des Stichproben-Medians unter 0.93Q 3 Q 1 Annahme einer Normalverteilung liefert . Deshalb versagt diese Angabe n genau dann, wenn die Verwendung des Medians vorteilhaft ist. Damit wird die Angabe von Vertrauensintervallen bei nicht-normalverteilten Zufallsvariablen schwierig. Man kann allerdings die Streuung des Medians simulieren, indem man aus Zufallszahlen, die wie die Stichprobendaten gestreut sind, ein paar Tausend Stichproben zieht und dann das Vertrauensintervall aus der erhaltenen empirischen Verteilung des Medians bestimmt. V. Geschichtete Zufallsstichproben Weiss man, dass bestimmte Merkmale der Population korrelieren (z.B. Frauen kaufen mehr Äpfel als Männer) und möchte man eine Erhebung über den Apfelkonsum der Bevölkerung machen, so kann man die Vertrauensintervalle bei gegebener Stichprobengrösse verkleinern (oder die Stichprobengrösse bei gegebenem Vertrauensintervall verkleinern), wenn man die verschiedenen Gruppen gesondert betrachtet. Die Untergruppen werden ”Schichten” genannt. Die Schichten können wiederum geschichtet werden. Wenige Schichtungsebenen können die Vertrauensintervalle stark reduzieren, wenn die geeigneten Schichtungen vorgenommen werden. Wächst die Anzahl der Schichtungsebenen aber allzu sehr, so wird der Nutzen immer kleiner. Die Anzahl Objekte pro Schicht muss grösser als 2 sein, da sonst keine Varianz berechnet werden kann. Oft muss man bei Erhebungen damit rechnen, dass nur 50% der Personen erfasst werden können. Dieser Umstand muss bei der Berechnung der Stichprobengrösse berücksichtigt werden - umso mehr bei Schichtungen. ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 254 Innerhalb der Schichten können die bisher betrachteten Techniken verwendet werden. So ist z.B. das Schichtmittel y S ein erwartungstreuer Schätzer des Mittelwertes der entsprechenden Untergruppe in der Gesamtpopulation. Ebenso können die schichtspezifischen, Anteile, Varianzen, etc. berechnet werden. Für die Berechnung der entsprechenden Gesamtwerte sind die Werte der Schichten zu gewichten und dann zusammenzuzählen. Als Gewicht wählen wir beim Mittelwert nS n (n S Anzahl Objekte der Schicht, n Anzahl Objekte der jeweiligen Obermenge (bei Unterschichten ist n die Anzahl der Objekte der Obermenge der Schichten). Für die Varianz des Stichprobenmittels kann folgender Term L hergeleitet werden: VY W 2h h1 1 nh 1 nh Nh 2h Dabei bezeichnet: L die Anzahl der Schichten einer Schichtebene; Wh Nh N Anteil der Schicht in der Gesamtpopulation; n h Anzahl der Objekte der Schicht in der Stichprobe. N h Anzahl der Objekte der Schicht in der Gesamtpopulation; 2h 1 N h 1 Nh y i y U h 2 die Varianz der Objekte der Schicht in der Gesamtpopulation mit iU h U h Menge der Indizes der Objekte der Schicht in der Gesamtpopulation; y U h Mittelwert der Ausprägung y i der Schicht in der Gesamtpopulation. 2h wird geschätzt durch 2S h 1 n h 1 nh y i y S h 2 mit iS h S h Menge der Indizes der Schicht in der Stichprobe und y S h Schichtmittel in der Stichprobe). Mit Hilfe eines Beispiels können wir zeigen, dass die Varianz der Mittelwerte bei Schichtung kleiner ist als ohne Schichtung (dies liegt daran, dass bei der Summenbildung die Varianz zwischen den Schichten wegfällt!). Beispiel 8: In einer Studie werden die Ausgaben für Musikprodukte in einem Kanton erhoben. Es wird vermutet, dass junge Leute mehr für Musikprodukte ausgeben als Ältere. Der Anteil der Jungen an der Population betrage 20%. Die Stichprobengrösse betrage 500, N 250’000 ( N h der Jungen 0. 2 250000 50000, N h der Älteren 200000. Wir ziehen eine Zufallsstichprobe unter den Jungen und eine Zufallsstichprobe unter den Älteren (Resultate siehe Excel-Datei Beispiel 8.xls). Die Varianz in der Gesamtstichprobe beträgt 634.0460471. Die Varianz in der Stichprobe bei den Jungen beträgt: 237.3241657 Die Varianz in der Stichprobe bei den Älteren beträgt: 204.6009063 ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 255 Wir erhalten als geschätzte Gesamtvarianz der Mittelwerte (bei Schichtung): 100 400 1 1 0. 2 2 100 1 50000 237. 3241657 0. 8 2 400 1 200000 204. 6009063 0. 421 45 Wir erhalten als geschätze Gesamtvarianz der Mittelwerte (ohne Schichtung): 500 1 1 250000 634. 0460471 1. 265 6. 500 Für die Vertrauensintervalle gilt dabei: y g y S 1 1 2 y g y S VY 1 1 2 VY Die Schichtbilding wirkt sich auf die 95%-Vertrauensintervalle am Beispiel wie folgt aus: Ohne Schichtung: y g y S 1. 96 1. 265 6 y S 2. 205 0 59. 7636 2. 205 0 Mit Schichtung erhalten wir: y g y S 1. 96 0. 421 45 y S 1. 272 4 Dies ist eine Verkleinerung des Vertrauensintervalls um einen Faktor von 0. 577 05 1. 272 4 2.205 0 Um diese Verkleinerung des Vertrauensintervalles ohne Schichtung durch eine Erhöhung der Stichprobe zu erhalten, müssten wir folgendes n erreichen: n 2S N 5 2 1 1 2 2S 1 1 2 2 2 N 2 1.96 634. 0460471 250000 634.04604711.96 2 1. 272 4 2 250000 1495. Bei der Schichtung werden für die Zielgruppen gesondert Zufallsstichproben erhoben. Möglich ist ein weiteres Verfahren, das man ”Nachschichtung” nennt. Dabei wird eine Stichprobe in der Gesamtpopulation erhoben und die Schichten erst im Nachhinein unterschieden. Dabei müssen die Anteile der Schichten an der Gesamtpopulation bekannt sein. Bei der Nachschichtung sind die Stichprobengrössen der Schichten Werte einer Zufallsvariable. Der folgende Schätzer stellt bei genügend grossen Stichproben einen erwartungstreuen Schätzer des Gesamtvarianz bei einer Nachschichtung dar: L VY W 2h h1 1 nh 1 nh Nh 2h (Interpretation wie oben) Beispiel 9: Wir wollen den durschnittlichen Konsum elektronischer ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 256 Unterhaltungsgüter einer Population schätzen (in Franken). Dazu soll ein 95% Vertrauensintervall angegeben werden. Die Population weise 500000 Personen auf. Wir vermuten, dass ältere Leute ( 60 weniger Unterhaltungselektronik konsumieren als andere Altersegmente. Es wird eine Zufallstichprobe von 500 Personen gezogen. Wir untersuchen die beiden Altergruppen im Nachhinein getrennt. Wir unterteilen entsprechend die Stichprobe von 500 Personen in zwei Schichten A(lter) und B. Auf Grund der Daten (siehe Beispiel 8.xls) erhalten wir folgende Resultate: Zur Schicht der Älteren gehören 93, zur Schicht der Jüngeren gehören 500 93 407. Der Anteil der Älteren an der Gesamtpopulation beträgt 22%. Wir berechnen die Standardabweichung für die Gesamtstichprobe, um diese mit der Summe der Varianzen der Schichten zu vergleichen. Varianz der Gesamtstichprobe: 3210. 01891 Varianz in der Altergruppen der Älteren: 141. 8137735 Varianz in der Altersgruppe der Anderen: 2094. 9 Geschätze Gesamtvarianz des Mittelwertes bei Schichtung: y 78 100 2 22 100 2 1 407 93 1 93 1 0.22500000 141. 8137735 407 1 0.78500000 2094. 9 3. 202 Geschätzte Gesamtvarianz des Mittelwertes ohne Schichtung: y 1 500 1 500 500000 3210. 01891 6. 413 6 Wir erhalten entsprechend folgende 95%-Vertrauenintervalle mit und ohne Nachschichtung für dieselbe Stichprobe: Mit Nachschichtung: y g y S 1. 96 3. 202 y S 3. 507 3 Ohne Nachschichtung: y g y S 1. 96 6. 413 6 y S 4. 963 7 Das Vertrauensintervall kann somit um einen Faktor von verkleinert werden. 3. 471 5 4.963 7 0. 699 38 Wollten wir eine solche Verkleinerung ohne Schichtung durch die Erhöhung der Stichprobe errreichen, müssten wir (ohne Endlichkeitskorrektur) eine Stichprobe von n 1 1 2 2 2 2 0 1.96 2 3210.01891 3. 507 3 2 1002. 5 erheben. VI.. Schlussbemerkungen Hiermit wurden nur einige kurze erste Schritte in die Stichprobentheorie getan, ein Gebiet, das bei professioneller Anwendung durchaus technisch komplex wird. So wurde die Behandlung von Klumpenstichproben und die von gemischten Stichprobenplänen (Klumpen, aus denen Zufallsstichproben gezogen werden) unterlassen. Klumpen sind Mengen von Objekten, die alle in die Untersuchung ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 257 gelangen (z.B. bei einer Untersuchung werden Schüler ausgewählt, indem auf der Basis eine Liste aller Klassen eine Zufallstichprobe von Klassen gezogen wird. In die Untersuchung kommen dann alle Schüler der gezogenen Klassen. Es handelt sich hier nicht mehr um eine Zufallstichprobe). Heikel ist auch die Behandlung von Ausreissern. Datenmaterial ist immer auf Plausibilität hin zu untersuchen. Es ist zu überprüfen, ob ein Ausreisser durch falsche Datenerhebung oder - eingabe entstand. Ist der Ausreisser echt, gibt es verschiedene Verfahren, um damit umzugehen. So können Ausreisser bei der Auswertung weggelassen werden, um z.B. den Mittelwert nicht allzusehr zu verfälschen (gestutztes Mittel). Manchmal werden Ausreisser auch auf eine äussere Grenze zurückgesetzt, oder es werden robuste Schätzer wie der Median verwendet. Ein besonderes Probem stellen Antwortausfälle dar. Bei der Befragung von Haushalten rechnet das Bundesamt für Statistik mit Antwortausfällen von 20 bis 50%. Bei Umfragen bei Unternehmern rechnet man sogar mit 40 bis 80% Ausfällen. Das besondere Problem von Antworteausfällen besteht darin, dass Personen antworten oder nicht antworten, die vermutlich spezfische Charakteristiken aufweisen. Dadurch werden die Ergebnisse systematisch verfälscht. Macht man z.B. eine Umfrage über durchschnittliche Kosmektikausgaben, und antworten mehrheitlich nur Mittelschicht- und Oberschichtfrauen, so werden die Resultate eine systematische Verzerrung ( Bias) aufweisen. Im Beispiel könnte man z.B. die Stichprobe nachschichten und die Schichtresultate dann entsprechend den Anteilen an der Gesamtpopulation hochrechnen. Allerdings werden durch Hochrechnen die Varianz und damit die Vertrauensintervalle vergrössert. Ein spezielles Problem stellt sich zudem mit partiellen Antworteausfällen (Personen beantworten nicht alle Fragen). Manchmal werden solche Antworteausfälle mit Hilfe von Schätzungen kompensiert (Imputation). Angesichts dieser Probleme zu jeweils zufriedenstellenden Resultaten zu gelangen verlangt einiges an Erfahrung und an statistischem Detailwissen, das über den hier gelieferten Apparat hinaus geht. Deshalb folgt eine Miniliteraturliste. Literatur: Cochran, W.G. (1977). Sampling Techniques (3 ed.), Wiley, New York (Klassiker, gut und genügend detailliert). Leiner, B. (1989), Stichprobentheorie: Grundlagen, Theorie und Technik, Oldenbourg, München (mathematisch). Grosbras, J.-M (1987), Méthodes statistiques des sondages, Economica, Paris. ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 258 Übungen 1) Im Wallis versucht ein Marktforschungsunternehmen die durchschnittlichen Ausgaben der Touristen für typische Walliser Lebensmittel (Bindenfleisch, Roggenbrot, Käse, etc.) zu ermitteln. Dabei wird unter den Touristen eine Zufallsstichprobe von 500 Personen gezogen. Es ergeben sich folgende Ausgaben für solche Produkte pro Person (siehe Excel-Datei Übung 1). Berechnen Sie die durchschnittlichen Ausgaben und ein 95%-Vertrauensintervall für den erhaltenen Wert. (Berechne Sie auch ein 98%Vertrauensintervall) 2) Im Auftrag der Tourismusbranche im Oberwallis soll die ”Studien- und Marktforschungs GmbH Oberwallis” das Total der Ausgaben für Ferien pro erwachsene Person im Oberwallis erheben (in Franken). Dabei werden 600 erwachsene OberwalliserInnen befragt (siehe Excel-Datei Übung 2). Berechnen Sie das geschätzte Total der Ausgaben für die erwachsene Oberwalliser Bevölkerung (N 45’000) und ein 95%Vertrauensintervall (98%-Vertrauensintervall). 3) Eine Studie soll den Anteil der Befürworter höherer Militärausgaben unter der stimmberechtigten Bevölkerung der Schweiz ermitteln. Es wird eine Zufallsstichprobe von 700 Personen gezogen. Es ergeben sich die folgenden Resultate (siehe Excel-Datei Übung 3). Ermitteln Sie den Anteil und ein 95%-Vertrauenintervall. Wie gross muss n sein, um eine Vertrauensintervallbreite von 0. 02 (entspricht 1% zu erhalten? (Bei Meinungsumfragen ist Schichtung die Regel, wir verzichten aber im Beispiel darauf). 4) Im Oberwallis soll das Mobilitätsverhalten von Erwachsenen untersucht werden. Dazu werden anteilsmässig insgesamt 500 Personen befragt, unter anderem zur Frage, wieviele Kilometer sie ungefähr pro Jahr im Auto sitzen (Resultate siehe Excel-Datei Übung 4). N 45’000. Der Anteil der Personen, die im Beruf Auto fahren, betrage 0.33 (bezüglich der der Menge aller Autorfahrer). Versuchen Sie bei der Stichprobe eine Nachschichtung vorzunehmen. Bestimmten Sie die Vertrauensintervall mit und ohne Nachschichtung. 5) Im Oberwallis soll das Mobilitätsverhalten von Erwachsenen untersucht werden. Dazu werden 501 Personen befragt, unter anderem zur Frage, wieviele Kilometer sie ungefähr pro Jahr im Auto sitzen (Resultate siehe Excel-Datei Übung 5). N 45’000. Der Anteil der Personen, die im Beruf Auto fahren, betrage 13 (bezüglich der Menge aller Autorfahrer). Nehmen Sie bei der Stichprobe eine Nachschichtung vor. Bestimmten Sie die Vertrauensintervall mit und ohne Nachschichtung. Lösungen 1) Ein erhebliches Problem wird sich bei der Ziehung einer wirklichen Zufallsstichprobe ergeben. Man müsste dazu eigentlich eine Liste aller Touristen haben und dann daraus ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 259 mit Hilfe von Zufallszahlen eine Stichprobe ziehen. Insbesondere dürfte man nicht z.B. in Brig im Sommer auf der Strasse einfach Touristen befragen. Wir erhalten: Mittelwert: 49.348 Standardabweichung: 28.9928278 (ohne Endlichkeitskorrektur) y g 49. 348 1. 96 28.9928278 500 Für : 51. 889 46. 807, 51, 889 98%-Vertrauensintervall: y g 49. 348 2. 326341928 28.9928278 500 Für : 52. 364 46. 332, 52. 364 2) Arithmetisches Mittel der Stichprobe: y S 611. 1883333 Varianz der Stichprobe: 21836. 5196 Ohne Endlichkeitskorrektur: Die geschätzten Gesamtausgaben betragen somit: Y S 45000 611. 1883333 2. 750 3 10 7 2 Wir erhalten als 95%-Intervallgrenzen: Y g Y S 1. 96 45000 21836.5196 600 2. 750 3 10 7 5. 320 9 10 5 2 600 Mit Endlichkeitskorrektur: Y g Y S 1. 96 1 45000 45000 21836.5196 600 7 5 2. 750 3 10 5. 285 3 10 2 Für das 98%-Vertrauensintervall: Y g Y S 2. 326341928 45000 21836.5196 600 7 5 2. 750 3 10 6. 315 4 10 (ohne Endlichkeitskorrektur). Mit Endlichkeitskorrektur: 2 600 45000 21836.5196 2. 750 3 10 7 6. 273 2 10 5 Y g Y S 2. 326341928 1 45000 600 3) Wir erhalten 400 Befürworter und 300 Gegner (mit Excel: zählenwenn). Damit beträgt der Anteil der Befürworter 400 0. 571 43. 700 Für das Vertrauensintervall ohne Endlichkeitskorrektur: 0.571 4310.571 43 p g p s 1. 96 0. 571 43 3. 668 7 10 2 7001 Mit Endlichkeitskorrektur: p g p s 1. 96 1 0. 571 43 3. 668 4 10 2 700 4500000 0.571 4310.571 43 7001 4) Wir berechnen mit Excel die Kennzahlen Mittelwert und Varianz für die Gesamtstichprobe und die Schichten: Gesamtstichprobe: Mittelwert: 90888.902; Varianz: 81370215186 Fährt im Beruf:Mittelwert: 263203.9222; Varianz: 1.99747E11 Fährt nicht im Beruf: Mittelwert: 4472.660661; Varianz: 1074205.466 Wir erhalten ohne Schichtung das 95%-Vertrauensintervall: y g y S 1. 96 81370215186 y S 24979. 501 Wir erhalten mit Schichtung das 95%-Vertrauensintervall: Die Varianz des Mittelwertes ist: ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 260 L VY W 2h 1 3 2 3 h1 2 1 167 2 1 1 501167 1 nh 1 3 1 167 45000 1 nh Nh D 2h 1. 99747 10 11 501167 2 45000 3 1074205. 466 1. 314 2 10 8 y g y S 1. 96 1. 314 2 10 8 y S 22469. Das Vertrauensintervall hat sich nicht wie erwartet massiv verringert, weil die Mittelwerte der beiden Schichten stark auseinander liegen. Dies liegt an der sehr grossen Varianz bei den Fahrern im Beruf. (es gibt Verfahren, um bei solchen Fällen die Varianz der Mittelwerte zu vermindern, indem die bei der Schicht mit grosser Varianz eine grössere Stichprobe zieht). (Die Resultate erhalten wir in SPSS mit ”Analysieren, Berichte, Olap-Würfel”. Wir können dann bei Statistik die gewünschten Kennzahlen bestimmen - auch den Standardfehler des Mittelwertes. Durch Doppelklick auf die Tabelle erscheint ein Pull-Down-Menue, in dem wir statt ”Insgesamt”, ”Privatfahrer” oder ”Fährt im Beruf” anklicken können. Es erscheinen die jeweiligen Kennzahlen pro Schicht). OLAP-Würfel Fahrertyp: Insgesamt N Gefahrene Kilometer 500 Mittelwert 90888.90 Standardfe hler des Mittelwertes 12756.9758 Varianz 8.1E+10 Standardfe hler des Mittelwertes 34584.5162 Varianz 2.0E+11 Standardfe hler des Mittelwertes 56.7965 Varianz 1074205 OLAP-Würfel Fahrertyp: Fährt im Beruf N Gefahrene Kilometer 167 Mittelwert 263203.9 OLAP-Würfel Fahrertyp: Fährt nicht im Beruf N Gefahrene Kilometer 333 Mittelwert 4472.6607 5) Wir führen eine Nachschichtung durch: Personen, die beruflich im Auto unterwegs sind ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 261 und Personen, die nicht im Auto unterwegs sind. Wir erhalten für die beiden Gruppen die für Privatfahrer und 122 für ”Fährt im Beruf” (erhalten wir in folgenden Anteile: 378 500 500 SPSS mit Analysieren, deskriptive Statistiken, Häufigkeiten). Wir erhalten die folgenden Varianzen und Mittelwerte. OLAP-Würfel OLAP-Würfel Fahrertyp: Privatfahrer Kilometer Mittelwert 4505.0344 Fahrertyp: Fährt im Beruf Varianz 1066213 Kilometer Mittelwert 46784.69 Varianz 430414.9 OLAP-Würfel Fahrertyp: Insgesamt Kilometer Mittelwert 14821.27 Varianz 3.3E+08 Wir vergleichen die Vertrauensintervalle mit und ohne Schichtung: Mit Schichtung: 378 1 122 1 378 1066213 0. 33 2 1 0.3345000 122 430414. 9 0. 67 2 1 0.6745000 1631. 4 y g y S 1. 96 1631. 4 y S 79. 166 8 y S 1592. 3 Ohne Schichtung: y g y S 1. 96 3.310 500 Da die Mittelwerte der Schichten sehr weit auseinander liegen, ergibt sich ein markanter Unterschied in den Vertrauensintervallen. (Die Daten zum Beispiel 4 wurden abgeändert. Somit sind die Unterschiede in den Resultaten der beiden Aufgaben nicht den Methoden - Schichtung oder Nachschichtung - zuzuschreiben). ___________________________________________________________________ Stichprobentheorie.tex 2. HSW Siders P.R. Seite 262 Bivariate schliessende Statistik In der bivariaten schliessenden Statistik geht es um den Zusammenhang von zwei Variablen. Rauchen Männer mehr als Frauen (Variable ”Geschlecht” und Variable ”gerauchte Zigaretten pro Tag”)? Kaufen Junge mehr Süssigkeiten (Variable ”Alter”, Variable ”Süssigkeiten in Franken”). Gibt es einen Zusammenhang zwischen Einkommen und Ausgaben für Schmuck? Gewöhnlich wird eine der Variablen als unabhängige (beeinflussende) Variable betrachtet, während die andere als die zu erklärende Variable festgelegt wird. Dabei ergibt sich das Problem, dass Variablen statistisch zusammenhängen können, ohne dass ein ”wirklicher” und ”kausaler” Zusammenhang besteht. Ein Beispiel kann dies klar machen: der Geburtenrückgang in Westeuropa im 20. Jahrhundert erfolgte im Gleichschritt mit dem Rückgang der Störche. Es scheint aber unvernünftig zu sein, den Rückgang der Störche als ”Ursache” für den Rückgang der Geburten zu betrachten, oder den Rückgang der Geburten als ”Ursache” für den Rückgang der Störche. Es gibt im vorliegenden Fall eine dritte ”Ursache” - die Industrialierung, die auf beide Variablen einwirkt. Allerdings ist der Begriff der Ursache nicht präzis zu fassen. A ist Ursache von B, wenn wir A auf dem Hintergrund eines bestimmten historischen Wissenstandes zur Erklärung von B heranziehen. Das wissenschaftliche Fortschreiten kann jedoch dazu führen, dass solches Erklären als Scheinerklärung erkannt wird und man neue ”Ursachen” für B anführt (Wir wissen genug über die Fortpflanzung, so dass wir nicht in Versuchung geraten, den Geburtenrückgang durch den Storchenrückgang zu erklären. Es gibt aber genügend Wissensgebiete, wo wir wenig wissen, und wo wir auf Grund statistischer Zusammenhänge Gefahr laufen, Kausalität zu postulieren, wo diese vielleicht nicht vorliegt). Je nach der Skalierung der Variablen gibt es verschiedene Methoden, um die Unabhängigkeit oder die Abhängigkeit der Ausprägungen zweier Variablen zu testen. - Untersuchen wir den Einfluss einer nominalskalierten Variable mit n Ausprägungen auf eine nominalskalierte Variablen mit m Ausprägungen, so wird der 2 Test verwendet (z.B. Frauen, Männer - Raucher, Nichtraucher) - Untersuchen wir den Einfluss einer nominalskalierten Variable mit mehr als zwei Ausprägungen auf eine metrisch skalierte Variable, so verwenden wir oft die Varianzanalyse (z.B. drei Sorten Weizen werden auf ihre Erträge hin untersucht). - Untersuchen wir den Einfluss einer metrisch skalierten Variable auf eine metrisch skalierte Variable, verwenden wir die Regressionsanalyse (Einkommen in Franken und Ausgaben für Schmuck in Franken). Damit haben wir noch nicht alle möglichen Kombinationen angeführt: möglich sind noch: ___________________________________________________________________ Bivariate Teststatistik.tex 2. HSW Siders P.R. Seite 263 ordinalskaliert ordinalskaliert ordinalskaliert metrisch skaliert ordinalskaiert nominalskaliert nomalskaliert ordinalskaliert metrisch skaliert ordinalskaliert metrisch skaliert nominalskaliert In der zweiten Hälfte des 20. Jahrhunderts wurden bivariate Methoden entwickelt, die solche Probleme zu lösen vermögen, auf die wir jedoch nicht eingehen können (weiterführende Literatur: Agresti, Alan, Categorical Data Analysis, New York, John Wiley, 1990; das Buch führt auch in die multivariate Statistik nominal- und ordinalskalierter Daten ein). ___________________________________________________________________ Bivariate Teststatistik.tex 2. HSW Siders P.R. Seite 264 2 Test I. Testen auf Unabhängigkeit in Kreuztabellen Ziel: Es soll überprüft werden, ob die Verteilung von Objekten in einer Kreuztabelle zufällig ist oder ob ein ”Zusammenhang” zwischen verschiedenen Variablen besteht. Voraussetzungen: Die erwartete Häufigkeit pro Feld sollte nicht bei mehr als 20% der Felder kleiner sein als 5. (nominalskalierte Daten). Die Zufallsvariablen sind identisch verteilt und unabhängig. Da nur ein nominales Skalenniveau vorausgesetzt wird, wird der 2 Test (auch 2 Unabhängigkeitstest genannt) in den Sozial- und Wirtschaftswissenschaften häufig angewendet. Da auch höher skalierte Daten als nominalskalierte aufgefasst werden können (bei Inkaufnahme von Informaitonsverlusten), sind 2 Test auch auf Daten mit höheren Skalenniveaus anwendbar. Beispiel 1: Wir nehmen an, man hätte eine Stichprobe von 100 Personen gezogen, darunter 46 Männer und 54 Frauen. Davon rauchen 12 Männer und 10 Frauen. Kann der Unterschied in der Stichprobe zwischen Frauen und Männer durch Zufall erklärt werden oder weisen die Frauen und Männer insgesamt unterschiedliches Raucherverhalten auf? Geschlecht * Raucherverhalten Kreuztabelle Anzahl Geschlecht Gesamt Männer Frauen Raucherverhalten Raucher Nichtraucher 12 34 11 43 23 77 Gesamt 46 54 100 H 0 : Das Rauchverhalten von Frauen und Männern unterscheidet sich nicht. H A : Das Rauchverhalten von Männern und Frauen unterscheidet sich (Wie wir in Kürze argumentieren werden, beinhaltet dies einen rechtsseitigen Test, 0. 05. Wir können folgende erwartete Häufigkeiten für die zufällige Verteilung pro Zelle errechnen. Bei jeweils anteilsmässiger Verteilung der Objekte sollte der Anteil der Raucher unter den Männern dem Anteil der Männer an der Stichprobe entsprechen. Da 46/100 Männer sind, sollten sie unter den Rauchern (23) genau 46 diesen Anteil ausmachen. Dies ergibt für die rauchenden Männer: 100 23 10. 58 54 Für die rauchenden Frauen ergibt sich: 100 23 12. 42 46 Für die nichtrauchenden Männer: 100 77 35. 42 54 Für die nichtrauchenden Frauen: 100 77 41. 58 Allgemein für die erwartete, absolute Häufigkeit der Zelle i, j: (i Zeile und j Spalte) ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 265 E ij sisj st Mit: s t Summe total; s i Randsumme der Zeile i; s j Randsumme der Spalte j. Wir erhalten somit die folgende Tabelle der erwarteteten Häufigkeiten: Raucher Nichraucher Summen 10.58 35.42 46 12.42 41.58 54 23 77 100 Männer Frauen Summen Je mehr die Verteilung der Daten von den erwarteten Häufigkeiten abweichen, desto weniger sind sie mit der Nullhypothese einer anteilsmässigen Verteilung der Objekte auf die Felder verträglich. Wir führen noch folgendes Symbol ein: H i,j für die absolute, empirische Häufigkeit der Zelle i, j. Ohne Beweis halten wir für eine m n-Tabelle fest: m n i H i,j E i,j j 2 2 m1n1 E i,j H i,j : empirische absolute Häufigkeiten E i,j : erwartete absolute Häufigkeiten m : Anzahl der Zeilen n : Anzahl der Spalten Dies gilt näherungsweise und für genügend grosse Stichprobengrössen. Die Anzahl der Freiheitsgrade der 2 Verteilung beträgt: m 1 n 1 (Anzahl der Zeilen weniger 1 multipliziert mit der Anzahl der Spalten weniger 1; 1 wird jeweils abgezählt, weil die letzte Zelle einer Zeile oder einer Spalte festgelegt ist, wenn die Randsummen und die übrigen Zellen feststehen. Die unabhängigen Zellen werden entsprechend durch die Matrix gebildet, bei der eine Zeile und eine Spalte gestrichen werden. Es verbleiben m 1 n 1 unabhängige Zellen). m n Im obigen Beispiel erhalten wir: 1210.58 2 1112.42 2 10.58 12.42 2 2121 0. 45836 3435.42 2 i H i,j E i,j E i,j j 4341.58 2 41.58 2 35.42 0. 45836 1 0. 498391429 p Wert : 0. 498391429 0. 05 Die Unterschiede zwischen Frauen und Männern bezüglich Rauchverhalten sind nicht signifikant. Bei einem 2 Test vergleichen wir die Häufigkeiten zweier Tabellen. Je mehr sie sich die jeweiligen absoluten Häufigkeiten pro Zelle unterscheiden, desto grösser ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 266 wird der Testwert. Wir lehnen die Nullhypothese ab, wenn diese Unterschiede ein gewisses Mass überschreiten. Entsprechend testen wir jeweils rechtsseitig. Liegt linksseitig ein signifikantes Ergebnis vor, bedeutet dies eine Überanpassung der empirischen Daten an die erwarteten Häufigkeiten. Es könnte dann z.B. eine Fälschung der Daten vorliegen. Mit Excel: Es müssen die erwarteten und die faktischen Häufigkeiten in je einer Matrix dargestellt werden. Dann wird ”Funktionen”, ”Statistik”, ”CHITEST” aufgerufen und die Matrizen in die entsprechenden Felder eingegeben. ok. Fürs obige Beispiel erhalten wir den p-Wert: 0. 498391516 Mit SPSS: Die Daten müssen in zwei Spalten eingegeben werden (fürs Beispiel: eine Spalte fürs Geschlecht, wo wir z.B. 46 mal 1 eingeben für die Männer und 54 mal 2 für die Frauen. die zweite Spalte 12 mal 1 für die rauchenden Männer, den Rest der Männer füllen wir mit 2 auf (für Nichtraucher). Dann schreiben wir 11 mal 1 für die rauchenden Frauen, den Rest der Frauen füllen wir mit 2 auf (für Nichtraucher). Den Test führen wir mit Hilfe der folgenden Befehle durch: ”Analysieren”, ”Deskriptive Statistiken”, ”Kreuztabellen”, ”Statistik”, ”Chiquadrattest”. Wir erhalten: Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Kontinuitätskorrektura Likelihood-Quotient Exakter Test nach Fisher Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df b .458 1 .498 .192 .457 1 1 .661 .499 Exakte Signifikanz (2-seitig) .634 .454 1 Exakte Signifikanz (1-seitig) .330 .501 100 a. Wird nur für eine 2x2-Tabelle berechnet b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 10.58. Wir erhalten die Werte für den eingeführten Test unter ”Chiquadrat nach Pearson”. ”Zweiseitig” bedeutet hier nicht, dass der 2 Test zweiseitig druchgeführt wird, sondern dass die Richtung des Unterschiedes zwischen Männern und Frauen gleich behandelt wird - ob die Frauen mehr rauchen als die Männer oder umgekehrt, der Test kann das selbe Resultat liefern. Es folgt eine kurze Erläuterung der übrigen SPSS-Ausgabe: Die Kontinuitätskorrektor beinhaltet eine Berücksichtigung der Tatsache, dass die zu verwendende Verteilung eigentlich diskret wäre, wir aber eine stetige Verteilung im Test brauchen. Die Korrektur erfolgt durch die Verwendung der folgenden ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 267 m n i j Formel: H i,j E i,j 0.5 2 E i,j 2 m1n1 |1210.58|0.5 2 |1112.42|0.5 2 |3435.42|0.5 2 |4341.58|0.5 2 Am Beispiel: 0. 192 4 (in 10.58 12.42 35.42 41.58 2 SPSS bei ”Kontinuitätskorrektur” angegeben). 2121 0. 1925 0. 660843984. Der ”Likelihood-Quotient” beinhaltet einen alternativen Chi-Quadrat-Test. m n Berechnet wird der Ausdruck 2 H ij ln 2 12 ln 10.58 12 11 ln 12.42 11 i1 j1 35.42 34 34 ln E ij H ij 43 ln 2 m1n1 . Fürs Beispiel: 41.58 43 0. 457 16 Im Beispiel erhalten wir somit einen p-Wert, der kaum von ”Chi-Quadrat nach Person” abweicht. Wir behandeln diesen Test nicht. m n i j Im Vierfelderfall ist der Testwert H i,j E i,j E i,j 2 hypergeometrisch verteilt (auf einen Beweis verzichten wir). Der exakte Test nach Fischer nutzt für den Vierfelderfall diese exakte Verteilung. Wir behandeln diesen Test nicht. Zusammenhang ”linear mit linear” ( Mantel-Haenszel-Test): Das Quadrat des Pearsonschen Korrelationskoeffizienten r wird mit der Anzahl der Fälle (minus 1) n 1 n1 x i x y i y i1 2 mulitpliziert: r 2 n 1 m1n1 , wobei r und x die x y Standardabweichung von x ist und y die Standardabweichung von y. Entsprechend ist der Test für nominale Daten bedeutungslos. Wir behandeln diesen Test nicht. Der Korrelationskoeffizient wird später behandelt. (x x 1 , . . . x n , y y 1 , . . . y n sind Vektoren von Ausprägungen von Daten). Wollen wir wissen, wo die massgeblichen Differenzen zwischen erwarteteten und empirischen Häufigkeiten liegen, können wir mit SPSS wie folgt vorgehen: Analysieren, deskriptive Statistik, Kreuztabellen, Zellen und Häufigkeiten ”beobachtete”, ”erwartete” sowie Residuen ”standardisiert” anklicken. Wir erhalten im Beispiel: ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 268 Raucherverhalten * Geschlecht Kreuztabelle Raucherverhalten Raucher Anzahl Erwartete Anzahl Standardisierte Residuen Anzahl Erwartete Anzahl Standardisierte Residuen Anzahl Erwartete Anzahl Nichtraucher Gesamt Geschlecht Männer Frauen 12 11 10.6 12.4 .4 -.4 34 43 35.4 41.6 -.2 .2 46 54 46.0 54.0 H i,j E i,j Gesamt 23 23.0 77 77.0 100 100.0 2 Unter Standardisierte Residuen werden die Werte der i j Zelle E i,j angegeben. Wir sehen, welche Zellen am meisten und welche am wenigsten zum Testwert beitragen (Bei Nicht-Standardisierte Residuen werden die Differenzen zwischen den erwarteten und den empirischen Häufigkeiten angegeben). m n i j Eine Teilrechtfertigung für die Formel H i,j E i,j E i,j 2 2 erhalten wir durch m1n1 die folgende Überlegung: Gibt es nur 2 Zellen, so erhalten wir als Testwert: H 1 E 1 2 E1 H 2 E 2 2 E2 Dabei ist E 1 np 1 , wenn p 1 die Wahrscheinlichkeit dafür ist, dass ein Objekt in die erste Zelle fällt. Da die Objekte in die erste oder die zweite Zelle fallen, gilt dann für E 2 : E 2 n E 1 n np 1 n1 p 1 . Für H 2 gilt ähnlich: H 2 n H 1 Wir erhalten: H 1 np 1 2 np 1 nH 1 n1p 1 2 n1p 1 2 2 1 1p 1 H 1 np 1 p 1 nH 1 n1p 1 n p 1 1p 1 1 n H 1 np 1 2 H 1 np 1 p1 nH 1 n1p 1 2 1p 1 2 np 1 1p 1 Da gilt: 1 p 1 H 1 np 1 2 1 p 1 H 1 np 1 2 1 p 1 H 1 np 1 2 1 p 1 H 1 np 1 2 H 1 np 1 2 Der Ausdruck p 1 n H 1 n1 p 1 2 p 1 n H 1 n np 1 2 p 1 n H 1 n np 1 2 p 1 H 1 np 1 2 H 1 np 1 2 1 p 1 p 1 H 1 np 1 np 1 1p 1 entspricht dem Ausdruck einer z-standardisierten binomialverteilten Zufallsvariable (siehe Kapitel über die Verteilung des Mittelwertes). Entsprechend ist der Ausdruck in der Klammer näherungsweise ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 269 standardnormalverteilt (für genügend grosse n). Entsprechend ist dann der Ausdruck 2 H 1 np 1 np 1 1p 1 näherungsweise 2 verteilt mit einem Freiheitsgrad. Beispiel 2: In einer Firma wird mit verschiedenen Arbeitsformen experimentiert (keine Gruppenarbeit, mittlere Gruppenarbeit und vorwiegend Arbeit in Gruppen). Die Arbeitnehmer der verschiedenen Arbeitsformen werden befragt, wie sich ihre Arbeitssituation verändert habe. Dabei wurden folgende Daten erhoben. Realisierungsniveau von Gruppenarbeit * Veränderung der Arbeitssituation Kreuztabelle Anzahl Realisierungsniveau von Gruppenarbeit Veränderung der Arbeitssituation verbessert unverändert verschlechtert 101 48 17 41 43 8 20 36 15 162 127 40 hoch mittler gering Gesamt Gesamt 166 92 71 329 H 0 : Die Arbeitssituation hat sich nicht verändert. H A : Die Arbeitssituation hat sich verändert ( rechtsseitiger Test, 0. 05. Wir erhalten die folgende Tabelle für die erwarteten Häufigkeiten: erwartete Häufigkeiten: Veränderung der Arbeitssituation verbessert unverändert verschlechtert hoch 81.7386018 64.0790274 20.1823708 mittler 45.3009119 35.5136778 11.1854103 gering 34.9604863 27.4072948 8.63221884 Summen 162 127 40 Realisierungsniveau von Gruppenarbeit m n Wir berechnen: i j H i,j E i,j 2 E i,j 10181.73860182 2 81.73860182 4864.07902736 2 64.07902736 1720.18237082 2 20.18237082 4145.30091185 2 45.30091185 4335.51367781 2 35.51367781 811.18541033 2 11.18541033 2034.96048632 2 34.96048632 3627.40729483 2 27.40729483 158.632218845 2 8.632218845 25. 762 Summen 166 92 71 329 24 25. 762 1 3. 53406E 05; der p-Wert ist somit: 3. 53406E 05 0. 05. Die Abweichung der faktischen Häufigkeiten von den erwarteten Häufigkeiten ist hochsignifikant. Mit Excel erhalten wir: 3.53369E-05 ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 270 Mit SPSS: Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle 25.762 Asymptotisch e Signifikanz (2-seitig) df a 4 .000 25.952 4 .000 19.130 1 .000 329 a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 8.63. 2 Tests können ebenfalls verwendet werden, um die Häufigkeiten zweier Tabellen zu vergleichen, auch wenn die erwarteten Häufigkeiten nicht aus der empirischen Kreuztabelle berechnet werden. Wir nehmen an, in der Schweiz gilt:51% sind Frauen, 49% Männer, 24% der Frauchen rauchen, 28% der Männer rauchen. Wir wollen überprüfen, ob im Oberwallis eine ähnliche Verteilung auf die Raucher vorliegt und ziehen eine Zufallsstichprobe von 100 Personen. Dabei würden wir folgendes Resultat erhalten: Raucher Nicht Raucher Summen Männer 28 20 48 Frauen 6 46 52 66 100 Summen 34 Wir müssen nun eine entsprechende Tabelle mit absoluten Häufigkeiten für die Schweiz berechnen (diese Tabelle entspricht der Tabelle mit den erwarteten Häufigkeiten): Raucher Nicht Raucher Summen Männer 0. 28 49 13. 72 0. 72 49 35. 28 49 Frauen 0. 24 51 12. 24 0. 76 51 38. 76 51 Summen 25. 96 Wir erhalten den Testwert: 100 74. 04 2813.72 2 13.72 2035.28 2 35.28 612.24 2 12.24 4638.76 2 38.76 26. 014 21 26. 014 1 3. 3895E 07. Der p-Wert ist somit: 3. 3895E 07. Die Häufigkeiten unterscheiden sich signifikant. Häufige Fehler bei 2 Tests: ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 271 Es werden relative statt absolute Häufigkeiten im Test verwendet. z.B. 60% der Männer rauchen nicht, 40% rauchen, 70% der Frauen rauchen nicht, 30% rauchen. Wir erhalten die unsinnige Kreuztabelle: Nichtraucher Männer Frauen Summen Raucher 60 70 130 Summen 40 100 30 100 70 200 Bei der Berechnung der erwarteten Häufigkeiten mit Hilfe dieser Tabelle würden wir den Test falsch anwenden. Beim Vorliegen einer Tabelle mit relativen Häufigkeiten kann man bei Kenntnis der Grösse der Stichprobe und der entsprechenden Anteile die absoluten Häufigkeiten zurückberechnen. Auf diese Daten ist dann der Test anwendbar. Im Beispiel. Wir nehmen an, die Stichprobe betrage 150 Personen und der Anteil der Frauen betrage 48%. Wir erhalten die folgende Kreuztabelle (mit entsprechendem Runden): 150 0. 48 72 72 0. 7 50. 4 50 72 0. 3 21. 6 22 150 0. 52 78 78 0. 60 46. 8 47 78 0. 4 31. 2 31 Nichtraucher Männer Frauen Summen Raucher 47 50 97 Summen 31 22 53 78 72 150 Auf diese Tabelle können wir nun den Test ausführen (machen Sie das zur Übung von Hand, mit Excel und mit SPSS). Die Daten werden in der Kreuztabelle falsch aufgeschlüsselt. Beispiel: Wenn die Ausprägung y 1 der Variable y in 2 von 10 Fällen eintritt und die Ausprägung y 2 in 5 von 18 Fällen, so wird statt der richtigen Kreuztabelle: Randsummen Randsummen 2 5 7 8 13 21 10 18 28 die falsche Kreuztabelle: ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 272 Randsummen 2 5 7 Randsummen 10 18 18 X 12 23 erstellt. Letztere Tabelle ist offenbar unsinnig: die Summen der Randsummen ergeben unterschiedliche Resultate (7 18 25 35 12 23. Bei 2 Tests sollten nicht mehr als 20% der Zellen eine erwartete Häufigkeit unter 5 haben (es handelt sich um eine recht konservative Regel, die laut manchen Autoren besonders bei grossen Kreuztabellen nicht beachtet werden muss). Manchmal wird diese Regel fälschlicher Weise auf die empirischen (statt die erwarteten) Werte der Tabelle angewendet. Sind die erwarteten Werte zu klein, so können die entsprechenden Spalten oder Zeilen mit benachbarten Spalten oder Zeilen zu neuen Kategorien zusammengefasst werden. Man darf dann nicht vergessen, die Freiheitsgrade neu zu zählen. ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 273 Übungen 1) Erstellen Sie die Tabelle der erwarteten Häufigkeiten für die folgenden Kreuztabellen: 20 30 10 80 10 50 30 8 11 22 40 20 14 7 8 4 20 60 8 40 2) Ein Marktforschungsinstitut überprüft mit Hilfe einer Umfrage die Hypothese, ob Frauen tatsächlich weniger im Internet surfen. Es wird eine Zufallsstichprobe von 80 Personen gezogen. Dabei ergeben sich die folgenden Daten: Internetnutzer Nicht Internetnutzer Summen Männer 12 26 38 Frauen 5 37 42 63 80 Summen 17 Testen Sie von Hand, mit Excel und SPSS. 3) Eine Marktforschungsfirma macht im Auftrag einer KMU einen Umfrage bei Konsumenten und kommt zu folgenden Resultaten: siehe Daten: chiquadrattest/Übung3.sav. Lassen sich Gruppen finden, die sich bezüglich ihrer Einstellung zum Produkt signifikant von anderen unterscheiden. 4) Die Einstellung bezüglich einer politischen Fragestellung werden untersucht. Dabei ergibt sich folgendes Bild: (Daten: chiquadrat/Übung 4.sav): ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 274 Einstellung * Geschlecht und Alter Kreuztabelle Anzahl Einstellung Frauen < 35 50 30 20 10 5 115 Dafür eher dafür weiss nicht eher dagegen dagegen Gesamt Geschlecht und Alter Frauen >=35 Männer < 35 40 60 30 40 30 10 20 5 10 5 130 120 Männer >=35 50 40 5 10 10 115 Gesamt 200 140 65 45 30 480 Unterscheiden sich die Einstellungen der Gruppen? Lösungen: Wir berechnen die Spalten und Zeilensummen (Randsummen): Spalte 1 Spalte 2 Summen Zeile 1 20 30 50 Zeile 2 10 80 90 110 140 Summen 30 Nun berechnen wir E ij E 1,1 5030 10. 714 140 9030 E 2,1 140 19. 286 E 1,2 50110 39. 286 140 90110 E 2,2 140 70. 714 s j s i st Wir erhalten also: Spalte 1 Spalte 2 Summen Zeile 1 10.714 39.286 50 Zeile 2 19.286 70.714 90 110 140 Summen 30 Wir können die Aufgabe auch mit Excel lösen: ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 275 empirische Häufigkeiten Spalte 1 Spalte 2 20 10 30 Zeile 1 Zeile 2 Summen Summen 30 80 110 50 90 140 erwartete Häufigkeiten Spalte 1 Spalte 2 Summen 10.7142857 39.2857143 50 19.2857143 70.7142857 90 30 110 140 Zeile 1 Zeile 2 Summen Die Randsummen der beiden Tabellen müssen übereinstimmen! Bei grösseren Tabellen erfolgt eine Lösung mit Excel schneller: Spalte 1 Zeile 1 Zeile 2 Zeile 3 Zeile 4 Summen Zeile 1 Zeile 2 Zeile 3 Zeile 4 Summen Spalte 2 10 11 14 4 39 Spalte 3 Spalte 4 50 22 7 8 87 30 40 8 20 98 Summen 8 20 40 60 128 98 93 69 92 352 Spalte 1 Spalte 2 Spalte 3 Spalte 4 Summen 10.8579545 24.2215909 27.2840909 35.6363636 98 10.3039773 22.9857955 25.8920455 33.8181818 93 7.64488636 17.0539773 19.2102273 25.0909091 69 10.1931818 22.7386364 25.6136364 33.4545455 92 39 87 98 128 352 2) H 0 : Frauen und Männer unterscheiden sich nicht. H A : Das Verhalten der Frauen unterscheidet sich von dem der Männer. ( einseitiger Test; 0. 05 Wir berechnen die erwarteten Zellenhäufigkeiten: Internetnutzer Nicht Internetnutzer Summen Männer Frauen 3817 80 4217 80 Summen 17 8. 075 8. 925 3863 80 4263 80 29. 925 38 33. 075 42 63 Wir erhalten als Testwert: 128.075 2 2629.925 2 58.925 2 8.075 29.925 8.925 80 3733.075 2 33.075 4. 6145 ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 276 Wir berechnen 21 4. 6145 1 0. 03170274. Der p-Wert ist somit 0. 03170274 0. 05. Der Unterschied ist auf dem festgelegten Niveau signifikant. Mit Excel erhalten wir: 0. 031702293 Mit SPSS: Wir müssen die Kreuztabelle in Datenform darstellen. Diese Vorbereitung machen wir am besten mit Hilfe von Excel. Für die entsprechende Darstellung in SPSS siehe ”chiquadrattests/Übung2.sav”. Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Kontinuitätskorrektura Likelihood-Quotient Exakter Test nach Fisher Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df 4.615 b 3.514 4.700 1 .032 1 1 .061 .030 Exakte Signifikanz (2-seitig) .054 4.557 1 Exakte Signifikanz (1-seitig) .030 .033 80 a. Wird nur für eine 2x2-Tabelle berechnet b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 8.07. 3) Untersuchungen sollten jeweils durch Hypothesen, die vor der Untersuchung schriftlich niedergelegt werden, begleitet werden. Testen wir bei 14 Variablen jede gegen jede, erhalten wir über Hundert Tests (bei Fragebogen ist es ein leichtes, mehr als 14 Variablen zu gewinnen). Dabei erhalten wir mit einer hohen Wahrscheinlichkeit ein paar signifikante Ergebnisse (Fehler erster Ordnung! Bei einem Signifikanzniveau von 5% erhalten wir durchschnittlich 5 signifikante Ergebnisse auf 100, bei einem Signifikanzniveau von 1% durchschnittlich ein signifikantes Ergebnis auf 100). Es ist deshalb sinnlos, solche Ergebnisse, die man ohne vorgängige Hypothese erhalten hat, verwenden zu wollen: man wird mit hoher Wahrscheinlichkeit Opfer des Fehlers erster Ordnung. Entdeckt man derart signifikante Ergebnisse, können diese jedoch für eine neue Erhebung als Hypothesen dienen. Die erste Erhebung dient dann der sogannt ”explorativen” Phase, während die zweite Erhebung die Ergebnisse der explorativen Phase testet. Im Beispiel sind die erhobenen Daten somit nur als Hypothesenlieferant für eine spätere Testphase zu verwenden. Für die verschiedenen Tabellen ist die jeweilige Nullhypothese: Die Einstellung zum Produkt ist von der Variable unabhängig. Alternativhypothese: Die Einstellung zum Produkt ist von der Variable abhängig. Wir erhalten: ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 277 Einstellung zum Produkt * Geschlecht Kreuztabelle Anzahl Einstellung zum Produkt positive Einstellung negative Einstellung Gesamt Geschlecht Männer Frauen 10 8 33 29 43 37 Gesamt 18 62 80 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Kontinuitätskorrektura Likelihood-Quotient Exakter Test nach Fisher Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df .030 b .000 .031 1 .861 1 1 1.000 .861 Exakte Signifikanz (2-seitig) Exakte Signifikanz (1-seitig) 1.000 .030 1 .539 .862 80 a. Wird nur für eine 2x2-Tabelle berechnet b. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 8.32. Einstellung zum Produkt * Altersgruppe Kreuztabelle Anzahl Altersgruppe -20 Einstellung zum Produkt Gesamt positive Einstellung negative Einstellung 2 9 11 21-35 4 12 16 36-50 4 15 19 51-65 6 9 15 662 17 19 Gesamt 18 62 80 ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 278 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df 4.394 a 4 .355 4.346 4 .361 .072 1 .788 80 a. 5 Zellen (50.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 2.48. Die Hälfte der Zellen weisen einen Erwartungswert kleiner als 5 auf, eine sogar nur einen solchen von 2.48. Entsprechend dürfte der Test so nicht angewandt werden. Das Ergebnis ist zudem nicht signifikant, obwohl vermutlich die Altersgruppe 66besonders negativ eingestellt ist (Überdeckungseffekt des Testes von vermutlich signifikanten Zusammenhängen durch die anderen Ausprägungen). Wir können der Sache auf den Grund gehen, indem wir die übrigen Altersgruppen zusammenfassen und gegen die Altersgruppe 66- testen. Dazu schaffen wir eine neue Variable (mit Transformieren, Umkodieren, In andere Variable, alte und neue Werte, ”alter Wert 5, neuer Wert 5”, ”andere Werte, neuer Wert 1”. weiter, für Ausgabenvariable Name und Label eingeben, o.k). Wir erhalten: Einstellung zum Produkt * Alter 65- gegen übrige Kreuztabelle Anzahl Einstellung zum Produkt Gesamt positive Einstellung negative Einstellung Alter 65- gegen übrige 1.00 5.00 16 2 45 17 61 19 Gesamt 18 62 80 ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 279 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Kontinuitätskorrektura Likelihood-Quotient Exakter Test nach Fisher Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df 2.049 b 1.247 2.315 1 .152 1 1 .264 .128 Exakte Signifikanz (2-seitig) .214 2.023 1 Exakte Signifikanz (1-seitig) .130 .155 80 a. Wird nur für eine 2x2-Tabelle berechnet b. 1 Zellen (25.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 4.28. Entgegen unserer Vermutung liegt kein signifikanter Zusammenhang vor. Der p-Wert ist jedoch kleiner geworden. Nur mehr eine Zelle (25%) hat eine kleinere erwartete Häufigkeit als 5. Allerdings liegt der Wert nicht stark unter 5. Wir würden in der Praxis den Test trotzdem anwenden. Einstellung zum Produkt * Wohnort Kreuztabelle Anzahl Wohnort Land Einstellung zum Produkt Gesamt positive Einstellung negative Einstellung Stadt 4 19 23 8 23 31 Agglomer ation 6 20 26 Gesamt 18 62 80 ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 280 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df .544 a 2 .762 .558 2 .756 .203 1 .652 80 a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 5.18. Es ergeben sich keine signifikante Zusammenhänge zwischen der Einstellung zum Produkt und den Variablen Alter, Wohnort und Geschlecht (und wenn wir welche gefunden hätten, würde dies ohne vergängige, entsprechende Hypothesen noch wenig bedeuten). 4) Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle 41.066 Asymptotisch e Signifikanz (2-seitig) df a 12 .000 42.847 12 .000 2.053 1 .152 480 a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 7.19. Die Verteilung der Daten weicht von einer anteilsmässigen Verteilung signifikant ab. Um spezifische Effekte herauszufiltrieren, müssten wir nun z.B. die Männer gegen die Frauen, sowie die alten gegen die jungen testen. Auch hier handelt es sich, ohne vorgängige Formulierung von Hypothesen, um ein exploratives Vorgehen. Dazu erzeugen wir mit SPSS die passenden Variablen. Wir erhalten: ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 281 Einstellung * Geschlecht Kreuztabelle Anzahl Einstellung Dafür eher dafür weiss nicht eher dagegen dagegen Gesamt Geschlecht Frauen Männer 90 110 60 80 50 15 30 15 15 15 245 235 Gesamt 200 140 65 45 30 480 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle 28.507 Asymptotisch e Signifikanz (2-seitig) df a 4 .000 29.642 4 .000 9.925 1 .002 480 a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 14.69. Die Einstellungen von Frauen unterscheiden sich vermutlich signifikant von der von Männern. Einstellung * Alter Kreuztabelle Anzahl Einstellung Gesamt Dafür eher dafür weiss nicht eher dagegen dagegen Alter 1.00 2.00 110 90 70 70 30 35 15 30 10 20 235 245 Gesamt 200 140 65 45 30 480 ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 282 Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Likelihood-Quotient Zusammenhang linear-mit-linear Anzahl der gültigen Fälle 10.514 Asymptotisch e Signifikanz (2-seitig) df a 4 .033 10.675 4 .030 9.925 1 .002 480 a. 0 Zellen (.0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 14.69. Auch der Alterseffekt ist vermultich signifikant. Eine Dimension ist ordinalskaliert. Somit braucht der Test nicht alle Informationen. Lernziele - Situationen erkennen können, in denen der 2 -Test angewandt werden kann (diese insbesondere von den Situationen mit Anteiltests untescheiden können) - den 2 -Test durchführen können (Bedingungen überprüfen; Übungen von der obigen Art durchführen können). - die häufigsten Fehler beim 2 -Test kennen und vermeiden können. ___________________________________________________________________ chiquadrattest.tex 2. HSW Siders P.R. Seite 283 II. Der 2 Anpassungstest Ziel: Es soll die Anpassung eines Wahrscheinlichkeitsmodells (Wahrscheinlichkeitsverteilung) an Daten überprüft werden. Voraussetzungen: Die erwarteten Häufigkeiten sind grösser als 5 (dieskreter Fall) oder die Abweichungen der Daten vom Modell sind standardnormalverteilt. Bei der Behandlung stetiger Verteilungen versuchten wir Modelle an Daten anzupassen, um Wahrscheinlichkeiten berechnen zu können (z.B. Berechnung der Ausfallwahrscheinlichkeit bei der Festlegung der Garantiedauer). Beim 2 Anpassungstest geht es darum zu testen, ob ein Modell zu den Daten passt. Wir können somit mit Hilfe eines solchen Tests überprüfen, ob die Anpassung eines Modells an die Daten gut gelang. Der 2 Anpassungstest ist eine alternative Methode zur graphischen Überprüfung des Passens von Daten zu einem Modell (mit P-P-Plots, Q-Q-Plots). Stammen Daten aus einer Verteilung, so werden die relativen Häufigkeiten als Werte einer Zufallsvariable um die jeweiligen theoretischen Wahrscheinlichkeiten streuen. Weichen die Daten aber zu stark vom Modell ab, so passt das Modell nicht zu den Daten. Ein Test sollte entsprechend stark abweichende Daten stark gewichten, schwach abweichende jedoch wenig. Die Summe der quadrierten Abweichungen zwischen den empirischen und der theoretischen Werten entspricht dieser Anforderung. Man kann zeigen, dass die Summe der quadrierten Abweichungen der Daten vom Modell unter der Nullhypothese näherungsweise 2 verteilt ist. Ein solcher Test kann allerdings die graphische Überprüfung nicht ersetzen. Insbesondere deckt der 2 Anpassungstest bei stetigen Verteilungen Ausreisser je nach Klassenbildung nicht auf. Wir betrachten zuerst den Fall diskreter Verteilungen. Wir können für jede Ausprägung i (bei der Poissonverteilung würde wir die unendlich vielen rechten Ausläufer zu einer Klasse zusammenziehen) sowohl die empirische absolute Häufigkeit (H i ) als auch die theoretische Wahrscheinlichkeit (p i berechnen. Es gilt dann näherungsweise: m i1 H i np i 2 2m1 np i Wobei m die Anzahl der Ausprägungen ist und n die Anzahl der Daten. Werden k Parameter aus den Daten geschätzt, so muss k bei den Freiheitsgraden zusätzlich weggezählt werden. Beispiel 1: Es wird überprüft, ob ein Würfel gut in dem Sinne ist, dass alle Seiten dieselbe Wahrscheinlichkeit haben, gewürfelt zu werden. Dazu werden 1000 Würfe gemacht. Es ergeben sich die folgenden Daten: ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 283 1 2 3 4 5 6 150 160 180 175 174 161 H 0 : Die Daten passen zu einer diskreten uniformen Verteilung (k 6). H A : Die Daten passen nicht zu einer diskreten uniformen Verteilung. ( 0. 05 n Wir testen : i1 150 1000 2 6 1000 6 H i np i 2 np i 160 1000 2 6 1000 6 180 1000 2 6 1000 6 175 1000 2 6 1000 6 174 1000 2 6 1000 6 161 1000 2 6 1000 6 3. 932 ChiSquareDist3. 932; 5 0. 440 75 0. 025. Die Daten passen zu einem guten Würfel. Wir halbieren das Signifikanzniveau, wenn wir Überanpassung auch als nicht zu den Daten passend qualifizieren. Interessiert uns dieser Fall nicht, würden wir auf 0.05 einseitig testen. Beispiel 2: Wir wollen überprüfen, ob die Anzahl der Betriebe bezüglich bestimmter Versicherungsmeldungen pro Jahr und pro Betrieb bei 43 Betrieben poisson-verteilt ist 8. Es wurden folgende Daten erhoben (Beispiel 2 (Anpassung).xls) xi >=10 Summen 0 1 2 3 4 5 6 7 8 9 Hi 1 2 3 4 5 8 8 4 3 1 4 43 hi 0.0232 0.0465 0.0697 0.0930 0.1162 0.1860 0.1860 0.0930 0.0697 0.0232 0.0930 1 pi 0.0026837 0.0107348 0.02862614 0.05725229 0.09160366 0.13958653 0.13958653 0.05725229 0.02862614 0.0026837 0.4413642 1 npi 2 0.115399144 0.461596576 1.230924203 2.461848405 3.938957448 6.002220874 6.002220874 2.461848405 1.230924203 0.115399144 18.97866072 43 (Hi-npi) /npi 6.78097469 5.12717212 2.54250357 0.96103006 0.28581454 0.66494078 0.66494078 0.96103006 2.54250357 6.78097469 11.8217128 39.1335977 n 43; m 11 ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 284 m Wir erhalten als Testwert: i1 H i np i 2 np i 39. 13359769 Nun ist: ChiSquareDist39. 13359769; 10 0. 999 98 Der p-Wert ist: 1 0. 999 98 0. 000 02 0. 05 Damit stammen die Daten nicht aus einer poisson-verteilten Zufallsvariable oder wenigstens nicht aus einer poisson-verteilten Zufallsvariable mit dem Parameter 8. Als nächstes betrachten wir stetig verteilte Zufallsvariablen. Sind die Abweichungen der Daten vom Modell standardnormalverteilt, kann direkt ein 2 Test durchgeführt werden (Es wird der p-Wert für die Summe der quadrierten Abweichungen berechnet; df n k, wenn k Parameter des Modells aus den n Daten geschätzt wurden). Das Problem mit einem solchen Verfahren besteht darin, dass wir ja die Normalverteilungsannahme ebenfalls überprüfen müssten. Dazu können wir einen P-P-Plot zeichnen. Allerdings wird dann die Angemessenheit der ursprüngliche Verteilung nicht rechnerisch, sondern letztlich wiederum zeichnerisch überprüft - was in der Praxis allerdings nicht unbedingt von Nachteil ist. Eine rein rechnerische Methode besteht darin, dass wir die stetige Verteilung "diskretisieren" und dann den obigen Test für diskrete Verteilungen anwenden: Wir zerlegen die x-Achse in Intervalle (die Wahl der Länge der Intervalle ist willkürlich und die Intervalle müssen nicht gleich lang sein). Für die entsprechenden Intervalle werden dann die Wahrscheinlichkeiten berechnet, sowie die relative Häufigkeit der empirischen Fälle im Intervall. Beispiel 3: Wir möchten testen, ob die folgenden Daten normalverteilt sind (Beispiel 3 (Anpassung).xls): 487.467907 574.158283 476.566045 620.092103 443.358986 413.070374 508.125322 399.099342 509.672372 477.090374 500.528246 465.015376 537.286713 480.039337 464.580033 511.624486 609.116622 514.107879 525.40597 518.528521 Wir ordnen die Daten, bestimmen Intervallgrenzen, zählen die Anzahl der Daten pro Intervall und berechnen die theoretischen Wahrscheinlichkeiten für die Intervalle. ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 285 xi 5 Intervalle 399.099342 413.070374 443.358986 464.580033 465.015376 476.566045 477.090374 480.039337 487.467907 500.528246 508.125322 509.672372 511.624486 514.107879 518.528521 525.40597 537.286713 574.158283 609.116622 620.092103 501.746715 56.0516458 Hi p (Intervall- pi = p(xu<X<xo) grenzen) hi (Hi-npi)2/npi npi <=440 2 0.1 0.135316 0.1353169 2.706339 0.18435076 440<x=<480 5 0.25 0.349016 0.2136998 4.273996 0.12332279 480<x=<520 8 0.4 0.627655 0.2786389 5.572779 1.05717397 520<x=<560 560 < x 2 0.1 3 0.15 0.850662 0.149337 0.2230066 0.1493375 4.460132 2.986751 1.35696689 5.8767E-05 20 2.72187318 0.60539255 Mittelwert Stabw. 20 1 Summen 1 p-Wert: Dabei ist x u die untere Intervallgrenze und x o die obere Intervallgrenze. Somit ist p i die Wahrscheinlichkeit, dass ein Wert der Zufallsvariable ins Intervall ]x u , x o ] fällt. Die erwarteten Häufigkeiten erreichen den Wert 5 oft nicht. Deshalb müsste man hier auf die Anwendung des Testes verzichten. Übungshalber berechnen wir: 24 2. 721873189 1 0. 60539255 Der p Wert ist: 0. 60539255 0. 05. Die Normalverteilungsannahme wäre bei einem solchen Resultat haltbar, wenn die Voraussetzung erfüllt wäre. Mit SPSS: Mit SPSS gibt es eine i.A. etwas unhandliche Möglichkeit, Verteilungen mit dem 2 Test zu überprüfen (Analysieren, Nicht-Parametrische Tests, 2 Test). Ein Beispiel, das sich so leicht überprüfen lässt, sind die empirischen Werte beim Werfen eines Würfels. Wir würden z.B. folgende Resultate erhalten: ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 286 Zahl beim Würfeln Gültig 1 2 3 4 5 6 Gesamt Häufigkeit 100 90 108 104 121 88 611 Prozent 16.4 14.7 17.7 17.0 19.8 14.4 100.0 Gültige Prozente 16.4 14.7 17.7 17.0 19.8 14.4 100.0 Kumulierte Prozente 16.4 31.1 48.8 65.8 85.6 100.0 Bei SPSS müssen wir die Urdaten verwenden (die Daten, die wir fortlaufend beim Würfeln erhalten; eine Spalte mit 100 Einern, 90 Zweiern, etc.). Die erwartete Häufigkeit für jede Ausprägung ist dieselbe (dies ist die Voreinstellung). Wir erhalten: Zahl beim Würfeln 1 2 3 4 5 6 Gesamt Beobachtetes N 100 90 108 104 121 88 611 Erwartete Anzahl 101.8 101.8 101.8 101.8 101.8 101.8 Residuum -1.8 -11.8 6.2 2.2 19.2 -13.8 Statistik für Test Chi-Quadrata df Asymptotische Signifikanz Zahl beim Würfeln 7.314 5 .198 a. Bei 0 Zellen (.0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 101.8. Die Resultate des Würfelns sind mit dem Modell (diskret uniform) verträglich. Bei einem Würfel, der nicht dieselbe Wahrscheinlichkeiten für jede Ausprägung hat, müssen wir unter ”erwartete Werte” die jeweiligen Anteile eingeben (in aufsteigender Ordnung den Ausprägungen der Variable entsprechend): Wir nehmen an, es würde folgende Wahrscheinlichkeitsfunktion vorliegen: {1,0.2,2,0.2,3,0.2,4,0.2,5,0.1,6,0.1}. Wir geben somit bei ”erwartete ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 287 Werte” die Zahlen 0.2, 0.2, 0.2, 0.2, 0.1, 0.1 ein. Wir erhalten das folgende Resultat: Zahl beim Würfeln 1 2 3 4 5 6 Gesamt Beobachtetes N 100 90 108 104 121 88 611 Erwartete Anzahl 122.2 122.2 122.2 122.2 61.1 61.1 Residuum -22.2 -32.2 -14.2 -18.2 59.9 26.9 Statistik für Test Chi-Quadrata df Asymptotische Signifikanz Zahl beim Würfeln 87.445 5 .000 a. Bei 0 Zellen (.0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 61.1. Die empirischen Befunde sind mit diesem Modell nicht verträglich. Übungen 1) Wir nehmen an, im Oberwallis weise die kinderreichste Familie 12 Kinder auf. Es gibt sich dabei für den Kinderreichtum der Famillien die folgende Tabelle (so haben z.B. 706 Familien je 2 Kinder und 448 Familien haben keine Kinder; die Daten sind frei erfunden). ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 288 Anzahl Kinder Anzahl Familien 0 1 2 3 4 5 6 7 8 9 10 11 12 448 823 706 359 133 13 3 2 0 0 0 0 1 Überprüfen Sie, ob die Anzahl der Familien pro spezifische Kinderzahl binomialverteilt ist (B(12; 0.13) (Übung 1 (Anpassung).xls) 2) Die Unfallhäufigkeit in den KMUs der Schweiz weise folgende Verteilung auf: (frei erfundene Daten, Übung 2 (Anpassung).xls). Versuchen Sie eine Poisson-Verteilung an die Häufigkeiten der Betriebe pro Unfallhäufigkeit anzupassen und testen Sie die Angemessenheit. 3) Überprüfen Sie die folgenden Daten auf Normalverteilung (Übung 3 (Anpassung).xls) (Wenn Sie zwecks Überprüfung dieselben Klasseneinteilungen vornehmen wollen wie in der Antwort verwendet: ], 20’000[, [20’000, 30’000[, [30’000, 40’000[, [40’000, 50’000[, [50’000, 60’000[, [60’000, ). Sollten die Daten nicht normalverteilt sein, versuchen Sie eine andere Verteilungsfunktion an die Daten anzupassen. 4) Überprüfen Sie die folgenden Daten auf Exponentialverteilung (Übung 4 (Anpassung).xls). 5) Es wird behauptet, ein fallengelassener Fünfliber bleibe mit einer Wahrscheinlichkeit von 0.6 mit dem Wilhelm Tell nach unten liegen. Die These wird überprüft, indem ein Fünfliber 50 mal geworfen wird. Dabei bleibt er 25 mal mit dem Tell nach unten liegen, 25 mal mit der Zahl nach unten. Ist die These haltbar? Lösungen 1) Die Lösung finden Sie unter Tabelle 2, (Übung 1 (Anpassung).xls). Der p-Wert ist 0 (12 Freiheitsgrade, da es 13 Ausprägungen von X B12, gibt). Das Modell passt nicht. Dies ist vor allem dem letzten Wert zuzschreiben, der weitaus am meisten zum grossen Testwert beiträgt. Vermutlich müssten wir, um ein Modell anzupassen, den Ausreisser weglassen und es mit den restlichen Daten versuchen. Zu berechnen ist: 212 16. 49924021 1 p-Wert 1 0. 169424562. ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 289 Der p-Wert von 0. 169424562 (Lösungsweg siehe ”Tabelle 3”) führt nicht zur Verwerfung des Modells. Das Beispiel zeigt die Bedeutung von Ausreissern. 2) Wir berechnen die durchschnittliche Unfallhäufigkeit pro Betrieb und setzen diese mit gleich: es gilt also 3. 160287081. Dann berechnen wir die theoretischen absoluten Häufigkeiten und den Chi-Quadrat-Testwert (siehe Tabelle 2). Zu berechnen ist: 213 622. 4127309 1 1. 2737E 124. Es gibt 15 Kategorien, somit verwenden wir 14 Freiheitsgrade. Da wir zusätzlich das aus den Daten schätzen, müssen wir einen zusätzlichen Freiheitsgrad abziehen. Der p-Wert ist :1. 2737E 124 0. 05. Die Daten sind nicht mit dem Modell verträglich. 3) Wir erhalten den Testwert: für 13.12571706 und 5 Freiheitsgrade: p-Wert:0.022228719 0.05. Die Daten sind kaum normalverteilt (Lösungsweg: Tabelle 2; die erwartete Häufigkeit unterscheidet bei den gewählten Klassen an einem Ort 5. Wir würden den Test trotzdem durchführen. Man kann aber auch die Klassengrenzen so bestimmen, dass die erwarteten Häufigkeiten überall grösser als 5 sind). Ein Blick auf den P-P-Plot normal ergibt die selbe Antwort: P-P-Diagramm Normal 1.00 Erwartete Kum. Wahrsch. .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Beobachtete Kum. Wahrsch. Um eine passende Verteilungsfamilie zu finden, zeichnen wir eine Plot der Eckpunkte der empirischen, kumulativen, relativen Häufigkeitsverteilung (Tabelle 3) empirische Verteilungsfunktion relative Häufigkeiten 1 0.87 0.8 0.6 0.4 0.2 0.06 0 0 20000 40000 60000 80000 Ausprägungen Die Zeichnung lässt eher eine uniforme Verteilung vermuten. Wir berechnen eine Gerade durch zwei Punkte, die wir willkürlich wählen, die aber eine möglichst gute ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 290 Anpassung erlauben. Wir wählen z.B. 21224.61775, 0.06 und 61297.44128, 0.87 und erhalten: 0. 06 21224. 61775a b 0. 87 61297. 44128a b a 2. 021 3 10 , b 0. 369 02 5 Dies ergibt die Gleichung: y 0. 000020213x 0. 36902. Nullstelle: y 0. 000020213x 0. 36902 0 x 18257. Schnittstelle mit y 1: 0. 000020213x 0. 36902 1 x 67730. Dies ergibt die folgende Verteilungsfunktion: 0 Fx für x 18257 y 0. 000020213x 0. 36902 für ]18257, 67730] 1 fürx 67730 Wir überprüfen das Modell (Tabelle 4): Wir erhalten bei einer Klasseneinteilung [, 30 000[, [30’000, 40’000[, [40’000, 50’000[, [50’000, 60’000[, [60’000, ] einen Testwert von: 3.68043546. Es wurden 5 Klassen gewählt. Entsprechend ergeben sich 4 Freiheitsgrade. 24 3. 68043546 : p-Wert: 0.450977878. Die Daten sind mit der konstruierten theoretischen Verteilung verträglich (Sie wurden in der Tat mit Hilfe einer lineraren Transformation aus uniform verteilten Zufallszahlen mit X U0, 1 hergestellt. 4) Zuerst muss man mit Hilfe der Daten schätzen. Dann werden Klassen gebildet: im Lösungsbeispiel (Tabelle 2): [, 0. 1[, [0.1, 0.3[, [0.3, 0.7[, [0.7, [ Testwert: 1.293197229, 4 Klassen, 3 df; Da wir einen Parameter aus den Daten geschätzt haben, wird ein zusätzlicher Freiheitsgrad abgezählt: ChiSquareDist1. 293197229; 2 0. 476 18 0. 25. Das Modell ist mit den Daten verträglich. 5) 0.50.6 2 0.6 0.50.6 2 0.6 3. 333 3 10 2 ChiSquareDist3. 333 3 10 2 ; 1 0. 144 87 0. 025 Das Ergebnis ist mit der Hypothese verträglich. ___________________________________________________________________ Chiquadrat Anpassung.tex 2. HSW Visp P.R. Seite 291