Statistik 5. Beurteilende Statistik 5. Beurteilende Statistik 5.1. Einführung - Grundprobleme Anhand der Beispiele 1 und 2 werden zwei typische Fragestellungen der beurteilenden Statistik deutlich. Beispiel 1 führt auf das Problem der Parameterschätzung (Punktschätzung) und der Konfidenzintervalle (Vertrauensintervalle). Beispiel 1 Aus 50 Messwerten ergaben sich für die Reißfestigkeit einer Garnsorte der arithmetische Mittelwert x 21,45 N und die empirische Standardabweichung s 0,47 N. Jede andere Stichprobe vom gleichen Umfang würde sicher etwas andere Werte liefern. x und s sind also nur Näherungswerte für Erwartungswert und Standardabweichung der entsprechenden Grundgesamtheit. Wie erhält man Aussagen über die Güte dieser Näherungen? Beispiel 2 ist typisch für das Testen von Hypothesen. Beispiel 2 Zur Überprüfung der Symmetrie eines Würfels wurde er 6000-mal geworfen; das Ergebnis dieses Würfeltests ist in einer Häufigkeitstabelle zusammengefasst xi 1 2 3 4 5 6 n ( xi ) 1076 1008 992 1059 923 942 Man sieht sofort, dass die hohen Augenzahlen 5 und 6 seltener auftreten als die niedrigen Zahlen 1 und 2. Berechnet man den Mittelwert, so ergibt sich aus diesen Daten x 3,4285 . Wie sind diese Unsymmetrie und die Abweichung des Mittelwerts vom Erwartungswert 3,5 zu erklären? Handelt es sich um eine zufällige Abweichung bei einem idealen Würfel oder besteht auf Grund der beobachteten Häufigkeiten Anlass zu einem Zweifel an der Symmetrie des Würfels? In beiden Fällen erkennt man das Grundproblem der beurteilenden Statistik: Welche Schlüsse kann man von einer Stichprobe auf die zugehörige Grundgesamtheit ziehen, und wie zuverlässig sind derartige Schlüsse? 109 Statistik 5. Beurteilende Statistik 5.2. Bemerkungen zur Stichprobenauswahl Um subjektive Einflussmöglichkeiten auszuschließen, müssen Stichproben repräsentativ sein. Die Stichprobe in Beispiel 1 muss eine Zufallsauswahl darstellen, alle Elemente der Grundgesamtheit müssen unabhängig voneinander mit der gleichen Wahrscheinlichkeit in die Stichprobe kommen. Beim zufälligen Ziehen mit Zurücklegen sind diese Voraussetzungen erfüllt. Soll etwa die Lebensdauer von Glühbirnen einer bestimmten Serie untersucht werden, so ist dabei ein Entnehmen mit Zurücklegen prinzipiell nicht möglich. Bei sehr umfangreichen Grundmengen wirkt sich der Unterschied bei den Ziehungen mit bzw. ohne Zurücklegen praktisch nicht aus, so dass obige Voraussetzungen auch bei derartigen Problemen getroffen werden können. Will man etwa n aus N Gegenständen zufällig auswählen, so könnte man die N Elemente der Grundgesamtheit nummerieren und aus einer Urne mit den Zahlen 1 bis N n Zahlen zufällig ziehen. Statt der Urne benutzt man einfacher eine Tabelle von (gleichmäßig verteilten) Zufallszahlen. Auszug aus einer Tabelle mit vierstelligen Zufallszahlen 3393 6270 4228 6069 9407 1865 8549 3217 2351 8410 9108 2330 2157 7416 0398 6173 1703 8132 9065 6717 7891 3590 2502 5945 3402 0491 4328 2365 6175 7695 9085 6307 6910 9174 1753 1797 9229 3422 9861 8357 2638 2908 6368 0398 5495 3283 0031 5955 6544 3883 1313 8338 0623 8600 4950 5414 7131 0134 7241 0651 3897 4202 3814 3505 1599 1649 2784 1994 5775 1406 4380 9543 1646 2850 8415 9120 8062 2421 6161 4634 1618 6309 7909 0874 0401 4301 4517 9197 3350 0434 4858 4676 7363 9141 6133 0549 1972 3461 7116 1496 110 Statistik 5. Beurteilende Statistik Regeln: 1. Wahl eines beliebigen Startpunkts in der Tabelle 2. entweder horizontal oder vertikal aufeinanderfolgende Zufallszahlen aufschreiben Je nach Umfang n der Grundgesamtheit k-stellige Zahlen entnehmen mit N 10 k (von der letzten Stelle der gegebenen Zahl ausgehend) 3. Zahlen > N und doppelt auftretende Zahlen weglassen. Beispiel 3 Aus 80 Elementen soll eine Stichprobe vom Umfang 8 gezogen werden (mit Hilfe der Zufallszahlen-Tabelle) Lösung: Wahl von Startpunkt und Richtung: z.B. Zeile 3, Spalte 4; horizontal → → 5945 3402 0491 4328 2365 6175 7695 9085 6307 6910 9174 1753 . . . 45 2 91 28 65 75 95 85 7 10 74 53 Ergebnis: Zufallsstichprobe vom Umfang 8 aus 80 Elementen 45, 2, 28, 65, 75, 7, 10, 74, 53 Bemerkungen: 1. Neben reinen Zufallszahlen spielen in der praktischen Anwendung Pseudozufallszahlen eine immer größere Rolle. Diese Zahlen sind keine „echten“ Zufallszahlen; sie werden durch Rechenprogramme erzeugt und weisen damit eine Periodizität auf. Sie haben jedoch den großen Vorteil, dass sie beim Einsatz von Rechnern unmittelbar vom Computer „geliefert“ werden können. 2. Zufallszahlen und Pseudozufallszahlen kommen auch bei der näherungsweisen Lösung komplizierter deterministischer Probleme zur Anwendung. (Monte-Carlo-Methoden → Literatur) 3. Neben uneingeschränkter Zufallsauswahl sei auf weiter Auswahlverfahren wie Schichten- Quoten- und Klumpen-Auswahl (→ Kapitel 1) verwiesen. 111 Statistik 5.3. 5. Beurteilende Statistik Statistische Schätzverfahren Die Aufgabenstellung von Schätzverfahren ist die Schätzung unbekannter Parameter oder der unbekannten Verteilung einer Grundgesamtheit aus den Werten einer Stichprobe. Im Folgenden wird nur auf die Parameterschätzung eingegangen. Man unterscheidet zwischen Punktschätzungen: Hierbei wird für den zu schätzenden Parameter ein einzelner Wert bestimmt und Intervallschätzungen: Dabei wird ein Intervall bestimmt, das den wahren, unbekannten Wert des Parameters mit einer vorgegebenen Wahrscheinlichkeit überdeckt 5.3.1. Punktschätzung und Schätzfunktionen Häufig ist der Verteilungstyp der Zufallsvariablen im voraus bekannt; aus der Stichprobe müssen dann nur noch die charakteristischen Parameter geschätzt werden. Zufallsvariable Verteilung zu schätzende Parameter u Messfehler Produktionsfehler ... Normalverteilung , Bernoulli-Schema (Erfolg – Misserfolg) Binomialverteilung p ( bzw. n p ) seltene Ereignisse Poissonverteilung Die Schätzung dieser Parameter erfolgt stets mit Hilfe einer Stichprobe: aus n beobachteten Werten x , x , . . . x 1 2 n wird ein Schätzwert û für den zu schätzenden Parameter u der zugrundeliegenden Zufallsvariablen X ermittelt. Die einzelnen Stichprobenwerte hängen vom Zufall ab, sie sind Werte der Zufallsvariablen X 1 , X 2 , . . . X n , die alle identisch verteilt sind wie X ; damit ist natürlich auch der aus einer bestimmten Stichprobe ermittelte Wert û ein Wert einer Zufallsvariablen Û (1) Uˆ g ( X 1 , X 2 , . . . X n ) Die Funktion g heißt Schätzfunktion für den Parameter u . 112 Statistik 5. Beurteilende Statistik Geeignete Schätzwerte für den Erwartungswert und die Varianz sind der arithmetische 2 Mittelwert x und die empirische Varianz s (s. Kapitel 2): x (2) 2 s2 (3) Beispiel 4 1 n n i 1 1 n 1 xi n ( xi x )2 i 1 Simulation eines Würfels - Schätzung des Erwartungswertes Entnehmen Sie der Zufallszahlen-Tafel auf Seite 110 geeignete Stichproben vom Umfang 10 und bestimmen Sie Näherungen für den Erwartungswert Lösung: a) 1. Zeile, 3. Spalte, hor.: 5, 1, 6, 3, 3, 2, 5, 1, 2, 5 x 3,3 b) 1. Zeile, 3. Spalte, vert.: 2, 3, 4, 6, 3, 6, 5, 4, 5, 4 x 4,2 c) 4. Zeile, 2. Spalte, hor.: 4, 3, 2, 1, 5, 3, 1, 5, 4, 3 x3 3,1 d) 6. Zeile, 1. Spalte, vert.: 3, 2, 3, 6, 2, 3, 4, 6, 3, 6 x 3,8 1 2 4 Die Ergebnisse streuen alle um den Erwartungswert 3,5 . Die Streuung dieser arithmetischen Mittelwerte ist aber geringer als die Streuung der Werte der Zufallsvariablen „Augenzahlen eines idealen Würfels“; man wird erwarten, dass diese Streuung mit wachsendem Stichprobenumfang immer kleiner wird. Vergleiche hierzu auch Beispiel 20 auf Seite 92 113 Statistik 5. Beurteilende Statistik Eine Schätzfunktion g für den Parameter u ist sicher nur dann sinnvoll, wenn die Werte der Zufallsvariablen Û um den zu schätzenden Parameter u der Grundgesamtheit streuen; man wird verlangen, dass der Erwartungswert von Û mit u übereinstimmt. Definition Erwartungstreue Schätzfunktion Eine Schätzfunktion g ( x , x , . . . x ) für den Parameter u heißt erwartungstreu, wenn 1 2 n für die zugehörige Zufallsvariable gilt (4) E [ g( X 1, X 2 , . . . X n ) ] u Erwartungstreue einer Schätzfunktion allein ist aber sicher zu wenig. Man fordert zusätzlich: Û streut möglichst wenig um u (5) (Streuung von Û ) → 0 . . . Wirksamkeit für n → . . . Konsistenz Auf diese beiden Eigenschaften soll hier aber nicht weiter eingegangen werden. Von Bedeutung für die Parameterschätzung sind die folgenden Sätze: Satz 1 Das arithmetische Mittel aus n Beobachtungen der Zufallsvariablen X (6) x 1 1 n ( x1 x2 . . . xn ) xi n n i 1 ist eine erwartungstreue Schätzfunktion für den Erwartungswert E ( X ) . 2 Satz 2 Hat eine Zufallsvariable X die Varianz , so hat der Stichprobenmittelwert 1 X X i die Varianz n (7) Satz 3 (8) E [( X ) ] 2 2 n Die empirische Varianz aus n Beobachtungen der Zufallsvariablen X 1 s n 1 2 n ( xi x ) 2 i 1 ist eine erwartungstreue Schätzfunktion für die Varianz 114 2 Var ( X ) . Statistik 5. Beurteilende Statistik Beweis von Satz 1 Man betrachtet die zugehörige Zufallsvariable, das Stichproben-Mittel X 1 ( X1 X 2 . . . X n ) n Für den Erwartungswert von X erhält man wegen der Linearität des ErwartungswertOperators (s. Abschnitt 4.2.4) und mit E ( X ) i E( X ) E [ 1 n Xi ] 1 1 E[ Xi ] n n [ E ( X i )] 1 n n Bemerkung zu Satz 2 Der Beweis von (7) erfolgt unmittelbar mit den Eigenschaften (46) aus Kapitel 4.5. 1 1 1 2 2 Var( X ) Var( X i ) 2 Var( X i ) 2 n n n n n Satz 2 bestätigt die anschaulich einleuchtende Tatsache, dass das Stichprobenmittel weniger streut als die zugehörige Zufallsvariable (vgl. auch Beispiel 4 und Beispiel 20 aus Kap. 4). Aus (7) folgt auch sofort die Konsistenz der Schätzfunktion (6). Bemerkung zu Satz 3 Würde man in (8) den Faktor 1 1 durch den Faktor ersetzen, so ergäbe sich für diese n 1 n 1 2 Schätzfunktion der Erwartungswert (1 ) ; diese Schätzfunktion wäre nicht n erwartungstreu, sondern negativ verzerrt. Vor allem bei kleinen Stichproben würde die Varianz damit systematisch unterschätzt. Dies ist auch der Grund für die zunächst etwas merkwürdig erscheinende Definition der empirischen Varianz in Kapitel 2 . Methoden zur Konstruktion von Schätzfunktionen sind: Maximum-Likelihood-Schätzung ( Methode der maximalen Mutmaßlichkeit) Kleinste-Quadrate-Schätzung (→ Literatur) 115 Statistik 5. Beurteilende Statistik 5.3.2. Konfidenzintervalle 5.3.2.1. Problemstellung und Bezeichnungen Die Parameterschätzungen aus 5.3. sind Punktschätzungen mit begrenztem Aussagewert; sie sagen nichts darüber aus, wie groß die Wahrscheinlichkeit ist, dass der zu schätzende wahre Grundgesamtheitsparameter in der Nähe der Punktschätzung liegt. Um eine Vorstellung über die Genauigkeit einer Schätzung zu bekommen, kann man zu Intervallschätzungen übergehen. Bei der näherungsweisen Bestimmung von Nullstellen wird die Genauigkeit häufig angegeben durch Fehlerschranken; so bedeutet die Angabe x 1,76 0,03 dass die 0 Nullstelle x mit Sicherheit im Intervall 1,73 x 1,79 liegt. 0 In der Statistik gibt es solche sicheren Schlüsse aus einer Stichprobe auf die Grundgesamtheit nicht: man kann zu einem Schätzwert û kein (kleines) Intervall [ Uˆ 1 , Uˆ 2 ] angeben, das den unbekannten Parameter u der Zufallsvariablen mit Sicherheit überdeckt; man kann nur, abhängig von der Wahrscheinlichkeitsverteilung von X , gewisse Wahrscheinlichkeitsaussagen machen. Man kann etwa nach einem Intervall [ Uˆ 1 , Uˆ 2 ] fragen, das den gesuchten Parameter u mit einer vorgegebenen Wahrscheinlichkeit enthält: (9) P ( Uˆ 1 u Uˆ 2 ) Die Schranken Uˆ 1 , Uˆ 2 hängen dabei sicher ab von der verwendeten Stichprobe, sind also selbst Zufallsvariablen. Kennt man Formeln zur Berechnung von Uˆ 1 , Uˆ 2 aus einer gegebenen Stichprobe, so nennt man das Intervall [ Uˆ 1 , Uˆ 2 ] ein Konfidenzintervall oder Vertrauensintervall für den unbekannten Parameter u zur Konfidenzzahl ( Konfidenzniveau, Vertrauenswahrscheinlichkeit, statistische Sicherheit ) ; die Wahrscheinlichkeit 1 heißt Irrtumswahrscheinlichkeit. Die Konfidenzzahl 1 ist die Wahrscheinlichkeit dafür, dass das Zufallsintervall [ Uˆ 1 , Uˆ 2 ] den unbekannten Parameter u überdeckt. Anders ausgedrückt: in 100 % aller prinzipiell möglichen Stichproben gleichen Umfangs ergeben sich Konfidenzintervalle, die den Parameter u enthalten, in 100 % aller Stichproben ergeben sich Konfidenzintervalle, 116 Statistik 5. Beurteilende Statistik die u nicht enthalten. Vertrauenswahrscheinlichkeit bzw. Irrtumswahrscheinlichkeit sind vor Beginn der Schätzung entsprechend der Problemstellung festzulegen; häufig verwendete Werte sind 0,9 ; 0,95 ; 0,99 ; 0,999 bzw. 0,1; 0,05 ; 0,01; 0,001 Dass ein Konfidenzintervall ein Zufallsintervall (Intervall, dessen Grenzen Zufallsvariable sind) ist, veranschaulicht die folgende Abbildung: 117 Statistik 5. Beurteilende Statistik 5.3.2.2. Konfidenzintervalle für den Erwartungswert einer Normalverteilung bei bekannter Varianz 2 Satz 4 Sei X eine N ( ; ) verteilte Zufallsvariable. Dann ist das Stichprobenmittel n 1 X n Xi eine N ( ; i 1 2 n ) verteilte Zufallsvariable. Anschaulich bedeutet das, dass alle aus Stichproben vom Umfang n ermittelten 2 arithmetischen Mittelwerte normalverteilt sind mit Erwartungswert und Varianz . n Man sucht nun ausgehend von einer Stichprobe vom Umfang n ein symmetrisch zu x gelegenes Intervall, das mit vorgegebener Wahrscheinlichkeit den tatsächlichen (unbekannten) Erwartungswert der Grundgesamtheit enthält. Durch Standardisierung der Variablen lässt es sich dabei wieder erreichen, dass alle erforderlichen Berechnungen an einer N ( 0 ; 1) verteilten Zufallsvariablen durchgeführt werden können. Nach Satz 4 ist X N ( ; 2 n ) verteilt; dann ist die standardisierte Variable Z X n N ( 0 ; 1) verteilt. Zur Konfidenzzahl bestimmt man für die Variable Z Intervallgrenzen c aus der Bedingung (10) P( c Z c) (c) ( c) 2(c) 1 mit Hilfe der (z ) Tabelle. Für praktisch wichtige Fälle von erhält man folgende cWerte 0,90 0,95 0,99 0,999 c 1,645 1,960 2,576 3,291 (11) Die Ungleichung für Z in Gleichung (10) wird in eine Ungleichung für umgeformt: c Z c a X a c X n c | a X a 118 n mit a c n Statistik 5. Beurteilende Statistik Daraus folgt schließlich die Ungleichung X a X a (12) Die Bedingung (10) für das Konfidenzintervall ist also äquivalent zur Gleichung P( X a X a ) (13) a c mit n ; das heißt: mit der Wahrscheinlichkeit nehmen die Zufallsvariablen Uˆ 1 X a und Uˆ 2 X a Werte an, die den unbekannten Erwartungswert einschließen. Der aus der Stichprobe ermittelte Wert x ist eine Realisierung der Zufallsvariablen X ; setzt man diesen Wert x in (12) ein, so erhält man ein konkretes Konfidenzintervall (14) x a x a mit a c n ( c abhängig von gemäß (10) ) Zusammenfassung: Konfidenzintervall für bei gegebener Varianz 2 (Normalverteilung) 1. Stichprobe liefert n; x 2. Zur gegebenen Konfidenzzahl bestimmt man c gemäß Gleichung (10) 3. Die halbe Länge des Konfidenzintervalls ist a c 4. Damit ist das gesuchte Konfidenzintervall x a n x a Beispiel 5 Bei einer Abfüllmaschine für 0,5-Liter-Flaschen ist die Abfüllmenge normalverteilt mit einem unbekannten, von der Maschineneinstellung abhängigen Mittelwert und der praktisch 3 konstanten Standardabweichung 10 cm . Bei n 75 zufällig ausgewählten Flaschen 3 wird der arithmetische Mittelwert x 495 cm bestimmt. Gesucht ist ein 95%Konfidenzintervall für den Erwartungswert . 119 Statistik 5. Beurteilende Statistik Lösung: 3 1. n 75 ; x 495 cm 2. 0,95 c 1,960 3. a c 4. Konfidenzintervall n 1,96 10 75 2,26 cm3 492,74 cm 3 497,26 cm 3 0,95 5.3.2.3. Konfidenzintervalle für eine Wahrscheinlichkeit p (Binomialverteilung) Bei n-maliger Durchführung eines Bernoulli-Experiments ist die Variable X = Anzahl der Erfolge bei n Versuchen binomialverteilt mit E ( X ) B n p und Var ( X ) B2 n p (1 p ) (15) Die zugehörige standardisierte Zufallsvariable Z (16) X B B X n p n p (1 p ) ist nach dem deMoivre-Lapace-Grenzwertsatz für große n näherungsweise N ( 0 ; 1) verteilt. Zur Konfidenzzahl bestimmt man wie in 5.4.2 für die Variable Z Intervallgrenzen c aus der Bedingung P( c Z c) (c) ( c) 2(c) 1 (17) mit Hilfe der (z ) Tabelle; die Werte aus (11) können also direkt übernommen werden. Die Ungleichung für Z wird umgeformt in eine Ungleichung für p: (18) c X n p c n p (1 p ) X n p c n p (1 p ) Quadrieren und umformen führt auf die quadratische Ungleichung für p (n c 2 ) p 2 (2 X c 2 ) p X2 0 n 120 Statistik 5. Beurteilende Statistik Aus der zugehörigen quadratischen Gleichung ergeben sich die Werte (19) p1,2 1 n c2 c2 X (n X ) c 2 X c 2 n 4 Für alle Werte von p zwischen diesen beiden Werten gilt die Ungleichung (18) und damit auch die Bedingung (17). Die in einer Stichprobe vom Umfang n beobachtete Zahl k der Erfolge ist eine Realisierung der Zufallsvariablen X . Aus (19) erhält man für X k eine Realisierung der Grenzen des gesuchten Intervalls (20) p1,2 1 n c2 c2 k (n k ) c 2 k c 2 n 4 Sind n, k, n – k groß, dann kann man in (20) folgende Näherungen einführen n c ; 2 k c ; 2 k (n k ) c2 h (1 h ) n n 4 und erhält so als Näherung für das gesuchte Konfidenzintervall (21) k k a p a n n Dabei ist die relative Häufigkeit h mit a c k (n k ) h(1 h) c n n n k ein Schätzwert für die unbekannte n Wahrscheinlichkeit p. 121 Statistik 5. Beurteilende Statistik Zusammenfassung: Konfidenzintervall für p 1. Stichprobe liefert n und k , bzw. h k n 2. Zur gegebenen Konfidenzzahl bestimmt man c gemäß Gleichung (17) 3. Die halbe Länge des Konfidenzintervalls ist a c k (n k ) h(1 h) c n n n 4. Damit ist das gesuchte Konfidenzintervall h a p h a h mit (bzw. genauer: Intervall mit den Grenzen p , p 1 2 k n gemäß (20) ) Beispiel 6 zeigt eine wichtige Anwendung dieses Verfahrens zur Schätzung des Anteilswerts einer Grundgesamtheit. Beispiel 6 Eine Zufallsstichprobe an einer Hochschule vom Umfang n = 400 enthält 120 Studentinnen. In welchen Grenzen liegt der unbekannte Anteilswert weiblicher Studierender in der Grundgesamtheit aller Studierenden bei einem Konfidenzniveau von 90 %. Lösung: 1. n = 400 ; k =120 ; h = 0,3 2. 0,90 c 1,645 3. a 1,645 4. Konfidenzintervall 0,3 0,7 400 0,038 (gerundet) 0,262 p 0,338 0,90 mit einer Wahrscheinlichkeit von 90% (schlampig: mit 90% Sicherheit) liegt der Anteil weiblicher Studierender zwischen 26,2 und 33,8 %. 122 Statistik 5. Beurteilende Statistik 5.3.2.4. Länge des Konfidenzintervalls Die Länge L des Konfidenzintervalls ist ein Maß für die Genauigkeit der Schätzung; sie hängt sowohl vom Stichprobenumfang n wie auch von der gewählten Vertrauenszahl bzw. von c ab. Im Falle der Schätzung des Erwartungswertes einer normalverteilten Zufallsvariablen erhält man aus (14) (22) 2c , n L 2a im Falle der Schätzung der Wahrscheinlichkeit p (Schätzung des Anteilswerts) folgt aus (21) (23) 2 c h (1 h ) n L 2a In beiden Fällen ist also (24) L ~ c n ; c wächst monoton mit Um L zu halbieren, d.h. die Genauigkeit zu verdoppeln, muss man (bei gleicher Vertrauenszahl ) den Stichprobenumfang vervierfachen. Wegen L 0 für n werden die Aussagen (14) und (21) mit wachsendem n zwar genauer, aber nicht sicherer. Damit die Aussagen sicherer werden, muss man vergrößern; mit wird c größer, damit wächst aber auch die Länge L . Will man die Sicherheit der Schätzung vergrößern, so nimmt bei gleichem Stichprobenumfang die Genauigkeit ab, die Länge des Vertrauensintervalls nimmt zu. 123 Statistik 5. Beurteilende Statistik Beispiel 7 Im Rahmen einer Marktanalyse interessiert sich ein Unternehmen für den Bekanntheitsgrad eines seiner Produkte. Eine Umfrage unter 400 zufällig ausgewählten Hausfrauen ergab, dass 132 von ihnen das Produkt kannten. a) Gesucht ist ein Konfidenzintervall, das den wahren Bekanntheitsgrad des Produkts unter allen Hausfrauen mit einer Vertrauenswahrscheinlichkeit von 95% überdeckt. b) Wie viele Hausfrauen müssen mindestens befragt werden, um für den unbekannten Bekanntheitsgrad ein 99%-Konfidenzintervall zu erhalten, dessen Länge höchstens 0,05 ist? Lösung: a) 1. n 400 ; k 132 ; h k 132 0,33 n 400 2. 0,95 c 1,960 3. a c h(1 h) 0,046 n 4. Konfidenzintervall: 0,330 0,046 p 0,330 0,046 b) 0,284 p 0,376 0,95 0,99 c 2,576 L 2c Bedingung 4c 2 h(1 h) 0,05 ; n quadrieren, auflösen nach n 2 4 c h(1 h) h(1 h) 0,0025 n n 0,0025 (*) Falls h unbekannt ist – etwa vor der Durchführung einer Stichprobe – weiß man nur, dass die Funktion f (h) h(1 h) bei h 0,5 ihr Maximum f max 0,25 annimmt. Mit der Abschätzung h(1 h) 0,25 folgt aus (*) weiter 2 n c 2654 0,0025 Unter Verwendung des Ergebnisses aus der Stichprobe in a) erhält man einen kleineren Wert für den erforderlichen Stichprobenumfang n 4 2,576 2 0,33 0,67 2347 0,0025 124 Statistik 5. Beurteilende Statistik 5.3.2.5. Quantile der Normalverteilung Die Werte der Umkehrfunktion der N ( 0 ; 1) Verteilungsfunktion z ( ) werden als Quantile der Standardnormalverteilung bezeichnet: das Quantil z erhält man aus der Forderung P( Z z ) ( z ) Anschaulich bedeutet das, dass links vom z Quantil 100 % , rechts von z 100 (1 ) % aller Werte liegen. Die Zahl z zum Beispiel mit P( Z z) 0.95 heißt 95% - Quantil der Standardnormalverteilung. Der Zahlenwert dieses Quantils ist 1,645; man schreibt hierfür z0,95 1,645 Für die wichtigsten Quantile stehen Tabellen zur Verfügung (s. Anhang) Mit dieser Schreibweise lauten die c - Werte zur Berechnung der Grenzen der Konfidenzintervalle in den vorangehenden Abschnitten (s. Graphik) c z1 / 2 ( 1 ) (z ) 2 2 -c c z Während in den vorigen Abschnitten die zur Berechnung der Intervallgrenzen zu Grunde gelegten Zufallsvariablen N (0 ; 1) - verteilt sind, entstammen im folgenden Abschnitt die zur Konstruktion der Intervallgrenzen entstehenden Zufallsvariablen anderen theoretischen Verteilungen. 125 Statistik 5. Beurteilende Statistik 5.3.2.6. Weitere Konfidenzintervalle a. Konfidenzintervall für den Erwartungswert einer Normalverteilung bei unbekannter Varianz In 5.3.2.2. erfolgte die Ermittlung des Konfidenzintervalls für bei bekannter Varianz 2 aus einer Stichprobe vom Umfang n im Wesentlichen mit Hilfe der N (0 ; 1) - verteilten Zufallsvariablen Z X n . Ersetzt man den unbekannten Parameter 2 durch die 2 empirische Varianz S , so erhält man die neue Zufallsvariable (25) T X n S Die Verteilung der Zufallsvariable T heißt t-Verteilung mit n-1 Freiheitsgraden; n ist der Stichprobenumfang. Die t – Verteilung ist wie die Normalverteilung symmetrisch; mit wachsendem n strebt sie gegen die N (0 ; 1) - Verteilung. Dichte der t – Verteilung ( n 1 Freiheitsgrade) Die Herleitung des Verfahrens zur Ermittlung des Konfidenzintervalls in 5.3.2.2. lässt sich sinngemäß übertragen; gegenüber der Prozedur auf Seite 118 ändert sich nur die Bestimmung von c. Zur Konfidenzzahl bestimmt man den Wert ct so, dass (26) P( ct T ct ) gilt. Die Werte ct sind die Quantile der t –Verteilung. Diese werden mit tn 1; bezeichnet; links vom tn 1; - Quantil liegen 100 % aller Werte der t –Verteilung. Wegen der Symmetrie der Verteilung ist (s. auch Graphik auf Seite 125): 126 Statistik 5. Beurteilende Statistik ct tn 1,1 (27) 2 Für die Quantile der t – Verteilung stehen Tabellen zur Verfügung (s. Anhang). Die Ungleichung ct T ct ct X n ct S wird umgeformt in eine Ungleichung für . Man erhält analog zu (14) mit x und s 2 als Realisierungen der Zufallsvariablen X und S 2 ct s c s x t x n n (28) Zusammenfassung: Konfidenzintervall für bei unbekannter Varianz (Normalverteilung) 2 1. Stichprobe liefert n; x und s 2. Zur gegebenen Konfidenzzahl bestimmt man ct gemäß Gleichung (26) bzw. mit (27) 3. Die halbe Länge des Konfidenzintervalls ist at ct 4. Damit ist das gesuchte Konfidenzintervall 127 x at s n x at Statistik 5. Beurteilende Statistik b. Konfidenzintervall für die Varianz einer Normalverteilung Die Zufallsvariable (29) Y (n 1) S2 2 ist 2 - verteilt mit n 1 Freiheitsgraden. Dichte der 2 - Verteilung ( n 1 Freiheitsgrade) Die 2 - Verteilung ist keine symmetrische Verteilung; zur Konfidenzzahl werden deshalb zwei Werte c1 und c2 so ermittelt, dass P( c1 Y c2 ) (30) bzw. P(Y c1 ) P(Y c2 ) gilt. (s. Graphik) 2 c1 2 c2 Die Zahlenwerte c1 und c2 können als Quantile der 2 - Verteilung aus entsprechenden Tabellen (s. Anhang) entnommen werden. Es ist (31) c1 2n 1, 2 c2 2n 1,1 2 , Die Ungleichung c1 Y c2 c1 (n 1) Wird umgeformt in eine Ungleichung für 2: n 1 2 n 1 2 S 2 S c2 c1 128 S2 2 c2 Statistik 5. Beurteilende Statistik 2 2 Setzt man die empirische Varianz s als Realisierung der Zufallsvariable S ein, so erhält man das Konfidenzintervall (32) a2 2 a1 mit ( n 1) s 2 a1 c1 Zusammenfassung: Konfidenzintervall für die Varianz 2 ( n 1) s 2 , a2 c2 einer Normalverteilung 1. Aus der Stichprobe vom Umfang n berechnet man s2 1 ( xi x )2 n 1 2. Zur gegebenen Konfidenzzahl Hilfe der Quantile (31) 3. Man berechnet a1 ( n 1) s 2 c1 , x 1 xi n bestimmt man die Zahlenwerte c1 und c2 mit , a2 4. Damit ist das gesuchte Konfidenzintervall ( n 1) s 2 c2 a2 2 a1 Konfidenzintervalle bei beliebigen Verteilungen Ist eine Zufallsvariable X nicht normalverteil, so ist nach dem Zentralen Grenzwertsatz das 1 Stichprobenmittel X X i trotzdem näherungsweise normalverteilt. Bei großem n Stichprobenumfang kann man deshalb die vorangehenden Prozeduren verwenden. 129 Statistik 5. Beurteilende Statistik 5.4. Signifikanztests (Hypothesentests) 5.4.1. Schema eines Signifikanztests In der Praxis müssen auf der Grundlage des Stichprobenmaterials Entscheidungen gefällt werden, die einen unbekannten Parameter der Grundgesamtheit betreffen. Die Grundidee eines Hypothesentests wird an Hand des Beispiels 8 erläutert. Die einzelnen Schritte beinhalten das Schema des Einstichproben-Gaußtests: 2 2 Betrachtet wird eine N ( ; ) verteilte Grundgesamtheit G mit bekannter Varianz . Über den unbekannten Erwartungswert bestehe die Hypothese (Vermutung) (33) H 0 : 0 Diese Hypothese wird anhand der Ergebnisse aus einer Stichprobe überprüft. Dabei wird H 0 als statistisch widerlegt angesehen und abgelehnt oder verworfen, wenn das Stichprobenergebnis in signifikantem Gegensatz zu ihr steht. Beispiel 8 ( aus: Bamberg/Bauer: Statistik; R. Oldenbourg Verlag) Eine Abfüllanlage füllt Bier in Flaschen, wobei die Füllmenge X als normalverteilte Zufallsvariable mit bekannter Standardabweichung angesehen werden kann. Die Hypothese H 0 , dass der Erwartungswert dieser Normalverteilung gleich dem Sollwert 0 500 cm3 ist, soll mit Hilfe einer Stichprobe vom Umfang n überprüft werden Aufgrund der Interessenlage der Personen, die die Untersuchung vornehmen, kann man drei Fälle unterscheiden: Die Prüfung erfolgt durch a) eine Eichkommission, die an einer Abweichung vom Sollwert 0 500 cm3 sowohl nach unten wie auch nach oben interessiert ist, b) eine Verbraucherorganisation, deren Interesse nur der Frage gilt, ob der wahre Wert kleiner ist als der Sollwert, c) den Brauereibesitzer, der lediglich wissen will, ob im Mittel zu viel abgefüllt wird. Beispiel 8 zeigt, dass es zur Null-Hypothese H 0 : 0 verschiedene Gegenhypothesen (Alternativhypothesen) geben kann, je nach Interessenlage der untersuchenden Person. Hier sind drei Fälle möglich: 130 Statistik (34) 5. Beurteilende Statistik a) H1(1) : 0 ( Eichkommission ) b) H1( 2) : 0 ( Verbraucherschutz ) c) H1(3) : 0 ( Brauereibesitzer ) Das Stichprobenmittel X ist eine erwartungstreue Schätzfunktion für den unbekannten Erwartungswert , der arithmetische Mittelwert x als Realisierung von X wird also in der Regel nicht allzu sehr von abweichen. Man wird deshalb die Nullhypothese als statistisch widerlegt ansehen und verwerfen oder ablehnen, wenn sich x stark von unterscheidet: 0 H 0 : 0 wird abgelehnt gegenüber (35) a) H1(1) : 0 , wenn b) H1( 2) : 0 , wenn x „viel kleiner“ als 0 ist c) H1(3) : 0 , wenn x „viel größer“ als 0 ist x 0 „sehr groß“ ist Diese vage Entscheidungsvorschrift muss selbstverständlich präzisiert werden: Große Abweichungen zwischen x und 0 sind auch dann nicht völlig ausgeschlossen, wenn 0 zutrifft; die Vorschrift (35) kann also auch zur Ablehnung der Nullhypothese führen, obwohl diese richtig ist. Man fordert nun, dass die Fehlentscheidung „Ablehnung von H 0 , wenn H 0 richtig ist“ (Fehler 1. Art) lediglich mit einer als zulässig vorgegebenen kleinen Irrtumswahrscheinlichkeit , dem so genannten Signifikanzniveau , vorkommen darf. Dazu benutzt man wieder das N ( 0 ; 1) verteilte standardisierte Stichprobenmittel als Testfunktion (Testvariable) (36) Z X 0 Mit Hilfe ihrer Realisierung z n x 0 n (arithmetischen Mittelwert x einsetzen in (36)) erhält man dann folgende Entscheidungsregel: 131 Statistik 5. Beurteilende Statistik H 0 : 0 ist zu verwerfen (ist abzulehnen) (1) : 0 , falls | z | c1 ( 2) : 0 , falls z c2 (3) : 0 , falls z c2 a) gegen H1 b) gegen H1 c) gegen H1 (37) Die Grenzen des Verwerfungsbereichs (Ablehnungsbereichs) c1 , c2 erhält man mit Hilfe der Standardnormalverteilung entsprechend den drei skizzierten Fällen: (z ) (z ) (z ) c1 ist dabei das (1 2 ) -Quantil, c2 das (1 ) -Quantil der Normalverteilung: (38) c1 z1 2 , c2 z1 132 Statistik 5. Beurteilende Statistik Als Verwerfungsbereich erhält man (vgl. Diagramme auf Seite 132) a) B(1) ( ; c1 ) ( c1 ; ) bei H1(1) : 0 b) B( 2) ( ; c2 ) bei H1( 2) : 0 c) B(3) ( c2 ; ) bei H1(3) : 0 Beispiel 8 - Fortsetzung Aus einer Stichprobe mit n 25 Flaschen ergab sich der Mittelwert x 499,28 [cm3]. Testen Sie mit Irrtumswahrscheinlichkeit 0,01 die Hypothese H : 500 [cm3] 0 bei bekannter Standardabweichung 1,5 [cm3] vom Standpunkt a) der Eichkommission, b) der Verbraucherorganisation, c) des Brauereibesitzers Lösung: 1. Irrtumswahrscheinlichkeit 0,01 2. Wert der Testfunktion z 499,28 500 25 2,4 1,5 3. Mit den Grenzen (Quantile der N ( 0 ; 1) Verteilung) 0,01 c1 z10,005 z 0,995 2,576 ; c 2 z10,01 z 0,99 2,326 ergeben sich die Ablehnungsbereiche (Verwerfungsbereiche) (1) ( ; 2,576) ( 2,576 ; ) a) B b) B ( 2) ( ; 2,326 ) c) B (3) ( 2,326 ; ) (1) 4. a) z 2,4 B : die Eichkommission kommt zu keiner Ablehnung der Hypothese H 0 b) z 2,4 B ( 2) : die Verbraucherorganisation verwirft die Hypothese H 0 (3) c) z 2,4 B : der Brauereibesitzer verwirft H 0 nicht ( auch ohne die Schritte 2 und 3 klar, wegen x 0 ) 133 Statistik 5. Beurteilende Statistik 5.4.2. Überblick und Bezeichnungen, Fehler bei Signifikanztests In 5.4.1. wurde das Schema eines Signifikanztests für den Mittelwert einer Normalverteilung ausführlich dargestellt. Allgemein lässt sich für einen Signifikanztest für einen beliebigen, unbekannten Parameter z einer beliebig verteilten Grundgesamtheit zusammenfassen: Wahl eines Signifikanzniveaus Ermitteln einer geeigneten Testvariablen Z Aufstellen der Nullhypothese: führt zu drei Typen von Alternativhypothesen: Z Z0 (1) I) H1 : a1 z a2 P( Z a1 oder Z a2 / H 0 ) II) H 0 : Z Z0 H1( 2) : Z Z 0 a ( z0 ... „Sollwert“) H1(3) : Z Z0 III) z P( Z a / H 0 ) z a P( Z a / H 0 ) Testentscheidung: Die Nullhypothese H 0 ist auf dem Signifikanzniveau zu Gunsten der Alternativhypothese H 1 abzulehnen, wenn der Wert der Testvariablen Z in den Ablehnungsbereich („kritischer Bereich“) fällt. Die Grenzen a zu diesen Bereichen heißen Annahmegrenzen oder Annahmekennzahlen. In den obigen Fällen sind die Ablehnungsbereiche: I) ( , a1 ) ( a2 , ) ( , a ) II) III) ( a , ) Man unterscheidet also zwei Typen von Hypothesentests: Fall I) Zweiseitiger Hypothesentest und Fälle II) und III) Einseitige Hypothesentests Ein zweiseitiger Test wird immer dann benutzt, wenn vermutet wird, dass ein Parameter u einer Verteilung einen ganz bestimmten Wert u0 hat (Punkthypothese), bzw. wenn das 134 Statistik 5. Beurteilende Statistik Gegenteil, die Alternativhypothese „u weicht signifikant von u0 ab“ vermutet wird. Ein einseitiger Test wird immer dann benutzt, wenn vermutet wird, dass ein Parameter u einer Verteilung einen ganz bestimmten Wert u0 nicht unter- bzw. überschreitet, bzw. wenn das Gegenteil „u ist signifikant kleiner als u0 “ oder „u ist signifikant größer als u0 “ vermutet wird. Warnung: Aus der Nichtablehnung einer Nullhypothese kann nicht auf ihre Richtigkeit geschlossen werden! Fehler 1. Art: Ablehnung einer wahren Nullhypothese, weil der Wert der Testvariablen in den Ablehnungsbereich fällt; die Wahrscheinlichkeit dafür ist (Signifikanzniveau oder „Irrtumswahrscheinlichkeit“) Fehler 2. Art: Falsche Nullhypothese wird nicht abgelehnt, weil der Wert der Testvariablen in den nichtkritischen Bereich fällt; die Wahrscheinlichkeit dafür wird 1 bezeichnet. Graphik für einen einseitigen Test: 1 Z0 a Z1 kritischer Bereich Dichte von Z , wenn H 0 : Z Z 0 wahr ist Dichte von Z , wenn die Alternative Z Z1 Z 0 wahr ist Je nach Lage von z1 ergibt ergibt sich ein mehr oder weniger große Wahrscheinlichkeit 1 . 1 bzw. sind Funktionen von z1 . 135 Statistik 5. Beurteilende Statistik 1 ( z1 ) heißt Operationscharakteristik ( z1 ) heißt Gütefunktion OC - Kurven 1 oder Macht des Tests. 1 1 ( z1 ) 1 ( z1 ) P( Z a / Z Z1 ) n größer z0 z1 Eine Erhöhung des Stichprobenumfangs n führt zu einer Verkleinerung von 1 und zu einer Verkleinerung von . Dies führt zu einer größeren Trennschärfe, d.h. ein Unter- schied wird häufiger als signifikant erkannt. Unter einem trennschärfsten Test versteht man einen Test, der garantiert, dass falsche Nullhypothesen mit größtmöglicher Wahrscheinlichkeit abgelehnt werden. Alternativtests spielen eine Rolle unter anderem in der statistischen Qualitätskontrolle, wenn es um die Annahme oder Ablehnung einer Lieferung geht. Als „Produzentenrisiko“ bezeichnet man dort den Fehler 1. Art; als „Konsumentenrisiko“ den Fehler 2. Art. Bemerkungen: 1. Neben dem Verteilungstyp der Grundgesamtheit benötigt man bei einem Signifikanztest die Verteilung der Testvariablen. Ohne bekannte Verteilung der Testgrößen ist es nicht möglich die Grenzen des Annahme- bzw. Ablehnungsbereichs zu bestimmen. 2. Das Signifikanzniveau heißt auch Irrtumswahrscheinlichkeit. Mit der VertrauensWahrscheinlichkeit (Konfidenzzahl) aus 5.3.2. gilt 1 . Während für eine große Wahrscheinlichkeit gewählt wird, ist immer eine klein Wahrscheinlichkeit. 3. Unterschied zwischen Intervallschätzung (Konfidenzintervall) und Testverfahren: Die Beispiele 5 und 8 verdeutlichen den Unterschied: Das Konfidenzintervall im Beispiel 5 ist symmetrisch zum Stichprobenmittelwert x , dagegen ist der Annahmebereich unter der ersten Gegenhypothese H (1) 1 (zweiseitige Abgrenzung) symmetrisch zum Sollwert 0 . Im ersten Fall spricht man von einem Vertrauensbereich für , im zweiten Fall von einem Zufallsstreubereich für x . Die Länge der beiden Intervalle sind gleich; im ersten Fall wird jedoch 136 Statistik 5. Beurteilende Statistik von x auf geschlossen, im zweiten Fall von auf x ! Bei Parametertests könnte man auf die Testvariable verzichten. Bei einer Testentscheidung bräuchte man nur zu überprüfen, ob der Stichprobenwert für den entsprechenden Parameter in den Zufallsstreubereich fällt. Arten von Hypothesentests Parametertests: Hypothese über den numerischen Wert eines unbekannten Parameters, z. B. eines Lage- oder Streuungsparameters. Anpassungstests: Dabei werde Hypothesen über den Typ der Verteilung eines Merkmals geprüft, z.B. ob eine Normalverteilung vorliegt. Unabhängigkeitstests: Hypothesen über die Abhängigkeit bzw. Unabhängigkeit verschiedener Merkmale. Bei allen drei Arten von Tests wird geprüft, ob eine Zufallsstichprobe eine signifikante Abweichung von der Nullhypothese liefert. 137 Statistik 5.4.3. 5. Beurteilende Statistik Parametertests 5.4.3.1. Test über den Erwartungswert einer Normalverteilung a. bei bekannter Varianz (vergl. Beispiel 8) Es liegt eine Stichprobe x1 , x2 , ... , xn vor. Die Werte sind Realisierungen von n unabhängigen N ( , 2 ) - verteilten Zufallsvariablen mit unbekanntem Erwartungswert aber bekannter Varianz 2 . 1. Festlegung des Signifikanzniveaus . 2. Testvariable Z (39) X 0 H 0 : 0 Nullhypothese ( N ( 0 ; 1) verteilt) n ( 0 ... „Sollwert“) 3. mit Hilfe der Stichprobenwerte ergibt sich z als Realisierung von Z ; die Nullhypothese ist zugunsten der Alternativhypothese H 1 abzulehnen, wenn die Werte von z in die folgenden Ablehnungsbereiche fallen: Ablehnungsbereich H1 I) H1(1) : 0 z z1 2 II) H1( 2) : 0 z z1 III) H1(3) : z z1 0 (40) Zweiseitiger Test Einseitige Tests z1 2 , z1 Quantile der N ( 0 ; 1) Verteilung b. bei unbekannter Varianz Wieder liegt eine Stichprobe x1 , x2 , ... , xn vor, deren Werte sind Realisierungen von n unabhängigen N ( , 2 ) - verteilten Zufallsvariablen mit unbekanntem Erwartungswert und unbekannter Varianz 2 sind. Die unbekannte Standardabweichung wird durch die empirische Standardabweichung s aus der Stichprobe geschätzt. Die sich ergebende Testvariable T ist t-verteilt mit n 1 Freiheitsgraden. 138 Statistik 5. Beurteilende Statistik 1. Festlegung des Signifikanzniveaus . 2. Testvariable (41) T 3. Nullhypothese X 0 s (t-verteilt mit n 1 Freiheitsgraden) n H 0 : 0 ( 0 ... „Sollwert“) 4. Die Vorgehensweise ist die gleiche wie in a. Für die Grenzen der Ablehnungsbereiche werden nur die entsprechenden Quantile der t-Verteilung verwendet. Ablehnungsbereich H1 I) H1(1) : 0 t tn 1;1 2 II) H1( 2) : 0 t tn 1;1 III) H1(3) : t tn 1;1 0 Zweiseitiger Test Einseitige Tests (42) Beispiel 9 Eine Maschine soll Stücke mit einem Sollmaß von 120 mm produzieren. Es wird vermutet, dass dies nicht genau der Fall ist. Eine Stichprobe im Umfang n = 5 ergibt: x = 121 mm und s = 0,5 mm. a) Zu testen ist die Nullhypothese H 0 : 120 gegen die zweiseitige Hypothese 120 a1) auf dem Signifikanzniveau 5% a2) auf dem Signifikanzniveau 1% b) Zu testen ist die Nullhypothese H 0 : 120 auf dem Signifikanzniveau 5% gegen die einseitige Hypothese 120 . Lösung: 121 120 5 4,47 0.5 n 1 4 tn 1;1 2 t4 ; 0,975 2,776 Wert der Testvariablen: a1) 5% t Wegen t 2,775 ist H 0 auf dem Signifikanzniveau 5% abzulehnen; mit 95 % - iger Wahrscheinlichkeit stimmt der Mittelwert der Maschine nicht. a2) b) 1% t4 ; 0,995 4,604 Niveau von 1% nicht abgelehnt werden. t t4 ; 0,995 die Nullhypothese kann auf dem t4 ;0,95 2,132 d.h. t t4 ; 0,95 Maschine produziert mit 95 % - iger Wahrscheinlichkeit zu große Stücke. 139 Statistik 5. Beurteilende Statistik 5.4.3.2. Test über die Varianz 2 einer Normalverteilung 2 Eine Stichprobe vom Umfang n liefert die empirische Varianz s . Zu testen ist die Nullhypothese H 0 : 2 02 (1) gegen gegen die zweiseitige Alternative H1 : ( 2) bzw. gegen die einseitigen Alternativen H1 2 02 : 2 02 oder häufiger H1(3) : 2 02 . 1. Festlegung des Signifikanzniveaus . 2. Testvariable (43) Y 3. Nullhypothese S2 (n 1) H 0 : 2 02 2 ( 2 -verteilt mit n 1 Freiheitsgraden) („Sollwert“) 4. Die Nullhypothese ist zugunsten der Alternativhypothese H 1 abzulehnen, wenn die Werte von y in die folgenden Ablehnungsbereiche fallen; die Grenzen für die Ablehnungsbereiche ergeben sich aus der Tabelle der Quantile der 2 - Verteilung. Dabei ist zu beachten, dass die 2 - Verteilung nicht symmetrisch ist! Ablehnungsbereich H1 I) H1(1) : 2 02 y n21; 2 oder y n 1;1 II) H1( 2) : 2 02 y n21; III) H1(3) : 2 y n 1;1 02 Zweiseitiger Test 2 Einseitige Tests (44) 140 Statistik 5. Beurteilende Statistik 5.4.3.3. Vergleich der Parameter 1 und 2 zweier Normalverteilungen („Zwei-Stichproben-t-Test“) Es liegen zwei Stichproben vor. Die m Werte x1 , x2 , ... , xm sind Realisierungen von N ( 1 , 12 ) - verteilten Zufallsvariablen; die n Werte y1 , y 2 , ... , y n Realisierungen von N ( 2 , 22 ) - verteilten Zufallsvariablen. Alle Zufallsvariablen sind voneinander unabhängig. Frage: Stimmen die beiden Mittelwerte 1 und 2 überein oder weichen sie signifikant voneinander ab? Getestet werden auf dem Signifikanzniveau Nullhypothesen über den Unterschied der beiden unbekannten Erwartungswerte gegen entsprechende Alternativhypothesen. a. 1 und 2 bekannt: Die Zufallsvariable D X Y N ( 1 2 ; ist 12 m 22 n ) - verteilt. Die Nullhypothesen H 0(1) : 1 2 (45) 1 2 0 d.h. H 0( 2) : 1 2 H 0(3) : 1 2 sind zu testen gegen die zweiseitige Hypothese H1(1) : 1 2 bzw. die einseitigen Hypothesen H1( 2) : 1 2 , H1(3) : 1 2 . Mit D2 12 m 22 n ist die Testvariable (46) Z X Y D N (0 ;1) - verteilt. Mit den Stichprobenrealisierungen x und y können für die Testentscheidung deshalb die Ablehnungsbereiche in der Tabelle (40) verwendet werden. 141 Statistik 5. Beurteilende Statistik b. 1 und 2 unbekannt: Vorausgesetzt wird jedoch 1 = 2 . 1. Festlegung des Signifikanzniveaus . 2. Die Testvariable Txy (47) m n ( m n 2) X Y mn (m 1) S x2 (n 1) S 2y Ist t-verteilt mit m n 2 Freiheitsgraden. 3. Nullhypothesen H 0(1) : 1 2 , H 0( 2) : 1 2 , H 0(3) : 1 2 4. Mit den empirischen Mittelwerte x , y und den empirischen Varianzen s x2 , s 2y der Stichproben ist die Nullhypothese ist zugunsten der Alternativhypothesen H 1 abzulehnen, wenn die sich damit ergebenden Werte von t xy in die folgenden Ablehnungsbereiche fallen; die Grenzen für die Ablehnungsbereiche ergeben sich aus der Tabelle der Quantile der t- Verteilung. H0 H1 Ablehnungsbereich I) H 0(1) : 1 2 H1(1) : 1 2 t tm n 2 ;1 2 II) H 0( 2) : 1 2 H1( 2) : 1 2 t tm n 2 ;1 : 1 2 H1(3) : 1 2 t tm n 2 ;1 ( 3) III) H 0 (48) 142 Statistik 5.4.4. 5. Beurteilende Statistik Anpassungstests 5.4.4.1. Testen hypothetischer Wahrscheinlichkeiten Einteilung eines Zufallsexperiments in m disjunkte Klassen: A1 A2 ... Am mit Ai A j für i j Die Wahrscheinlichkeiten für die Ereignisse Ai : P( Ai ) sind nicht bekannt. Es wird vermutet H 0 : P( Ai ) pi Nullhypothese , i 1, ... , m Eine Stichprobe im Umfang n n1 n2 ... nm liefert die Häufigkeiten ni der Ereignisse Ai in der Stichprobe. Mit n pi bezeichnet man die unter der Hypothese H 0 zu erwartende Besetzungszahl ni die tatsächliche Besetzungszahl in der Stichprobe. mit m ( m n pi ni n i 1 ) i 1 Die Testvariable (n pi ni ) 2 Z n pi i 1 m (49) ist 2 - verteilt mit m 1 Freiheitsgraden Gilt für den mit den Stichprobenwerten ermittelten Wert z 2 z m 1;1 (50) 2 - Verteilung) (Tabelle der Quantile der So ist die Nullhypothese H 0 auf dem Signifikanzniveau abzulehnen. Faustregeln: 1. Bei nur zwei Klassen A1 , A2 sollte n > 30 gelten 2. n pi 5 , andernfalls neue Klasseneinteilung. Beispiel 10 In einem Werk liegen Angaben über die Anzahl der Maschinenstillstände in den einzelnen Stunden einer Acht-Stunden-Schicht vor: Schichtstunden 1 2 3 4 5 6 7 8 Anzahl der Maschinenstillstände 16 17 18 25 28 20 19 17 143 Statistik 5. Beurteilende Statistik Vermutet wird, dass die Wahrscheinlichkeit eines Maschinenstillstands für gewisse Stunden der Schicht besonders groß ist. Zu testen ist daher die Nullhypothese, dass sich die einzelnen Schichtstunden hinsichtlich dieser Wahrscheinlichkeit nicht unterscheiden, vielmehr diese Wahrscheinlichkeit immer 1 ist. Signifikanzniveau sei Lösung: 8 0,05 . H 0 : P(Maschinenstillstand in der i-ten Stunde) = 18 (20 ni )2 5,6 20 i 1 8 8 n ni 160 n pi 20 : z i 1 0,05 , 7 72;0.95 14,4 z 72;095 d.h. keine Ablehnung von H 0 , die Schwankungen sind zufällig. 5.4.4.2. Der 2 - Anpassungstest Testen einer Hypothese über die Art der Verteilung, z.B. Hypothese, dass eine N ( ; ) 2 Verteilung vorliegt. Im Wesentlichen kann auf das Verfahren in 5.4.4.1. zurückgegriffen werden. Es wird mit derselben Testvariablen (49) gearbeitet. Beispiel 11 Eine Stichprobe im Umfang n = 100 ergab für die Bruchfestigkeit eines mechanischen Bauteils (in N) die in nachfolgender Tabelle aufgeführten Werte xi . Die Werte wurden in m = 9 Klassen eingeteilt; ni bezeichnet die absolute Klassenhäufigkeit: xi ni pi n pi < 255 255 - 265 265 - 275 275 - 285 285 - 295 295 - 305 305 - 315 315 - 325 > 325 8 7 11 15 17 14 12 8 8 100 0,0808 0,0779 0,1156 0,1464 0,1586 0,1464 0,1156 0,0779 0,0808 1,0000 8,08 7,79 11,56 14,64 15,86 14,64 11,56 7,79 8,08 100 144 Statistik 5. Beurteilende Statistik Die Werte pi und n pi werden auf der Basis der Vermutung (Nullhypothese) H 0 : die Werte entstammen einer N (290 ; 252 ) - Verteilung Berechnet, z.B. p1 P( X 255) ( 255 290 ) 1 (1,4) 0,0808 25 265 290 255 290 ) ( ) 25 25 1 (1) (1 (1,4)) 0,9192 0,8413 0,0779 p2 P( 255 X 265) ( …. Mit (49) ergibt sich für z 0,25 Wird der Test auf dem Signifikanzniveau von 0,05 durchgeführt, so ergibt sich mit 9 1 8: z 82; 0,95 15,507 d.h. die Nullhypothese kann nicht abgelehnt werden; die Werte entstammen einer Normalverteilung. Wenn man die Werte für und 2 nicht (wie oben = 290 und 2 = 625) 2 in die Hypothese mit einbezieht, sondern durch die Stichprobenwerte x und s schätzt, so muss man die Freiheitsgrade um die Anzahl der geschätzten Parameter vermindern. Im Beispiel ergibt sich x = 290,5 und s = 22,7 *) Damit ist 9 1 2 6 und 62; 0,95 12,592 d.h. ebenfalls keine Ablehnung von H 0 . *) Die Werte wurden mit den Näherungsformeln x 1 m ni ai' n i 1 , s2 1 m ni ( ai' x ) 2 n 1 i 1 ' ( ai … Klassenmitten, vergl. (15) , (16) Kap. 2.1.3.) 145 Statistik 5.4.5. Der 5. Beurteilende Statistik Der 2 - Unabhängigkeitstest 2 - Unabhängigkeitstest wird zur Überprüfung einer Hypothese über die gemeinsame Verteilung zweier Merkmale verwendet. Das Verfahren ist prinzipiell das gleiche wie in 5.4.4. beschriebene. Al s Nullhypothese formuliert man dabei immer die Unabhängigkeit der Merkmale. Eine Kontingenz-Tafel enthält Stichprobenergebnisse mit zwei Merkmalen, die in k bzw. m Ausprägungen vorliegen. (Vergl. Kapitel 2.2.2.) Beispiel 12 In einer Menge von n = 2400 Wahlberechtigten sind 1. Merkmal: Lebensalter (Einteilung in drei Altersklassen) 2. Merkmal: Gewählte Partei (Partei A, B, C) 2. Merkmal 1. Merkmal k = m =3 Randsumme 1. Merkmal A B 18 … 25 n11 155 n12 111 n13 25 n1 291 25 … 40 n21 248 n22 304 n23 55 n2 607 > 40 n31 592 n32 778 n33 132 n3 1502 n1 995 n 2 1193 n3 212 n 2400 Randsumme 2. Merk. Randsummen: m C k nij ; n j nij i 1, .....,k j 1,.....,m ni j 1 k ; i 1 ni i 1 m n j n j 1 Nullhypothese: H 0 : P(1. Merkmal i-te Ausprägung) P(2. Merkmal j-te Ausprägung) = P(1. Merkmal i-te Ausprägung und 2. Merkmal j-te Ausprägung) (Definition der Unabhängigkeit, vergl. (18) Kapitel 3.4.2.) Schätzwerte für P(1. Merkmal i-te Ausprägung) : P(2. Merkmal j-te Ausprägung) : 146 ni n n j n Statistik 5. Beurteilende Statistik die zu erwartende Besetzungszahl in der Kontingenztafel wäre unter der Annahme H 0 : ni n j ni n j n n n n (51) Die Testgöße (vergl. (49)) k m z (52) ( i 1 j 1 ni n j nij ) 2 n ni n j n ist 2 - verteilt mit (k 1) (m 1) Freiheitsgraden. Gilt z (2k 1)(m 1) ;1 (53) so ist H 0 auf dem Niveau , abzulehnen. Fortsetzung Beispiel 12 Mit (51) ergibt sich sie Kontingenztafel mit den zu erwartenden Besetzungszahlen: Für 120,6 144,7 25,7 251,7 301,7 53,6 622,7 746,6 132,7 z = 20,6 0,01 , (m 1)( k 1) 4 42; 0,99 13,277 z , d.h. die Null- hypothese ist abzulehnen, das „Wahlverhalten ist Lebensalterspezifisch“ . 147 Statistik 5. Beurteilende Statistik 148 Statistik 5. Beurteilende Statistik 149 Statistik 5. Beurteilende Statistik 5.5. Aufgaben 1. Die Länge X einer Strecke wurde 25-mal mit einem Gerät ohne systematische Fehler gemessen, dessen zufällige Messfehler normalverteilt sind mit der Standardabweichung 10 m. Bestimmen Sie ein Konfidenzintervall für den Erwartungswert bei einer Sicherheit von 99%, wenn der Mittelwert der 25 Messungen 100 m beträgt. 2. Vor einer Wahl möchte ein Meinungsforschungsinstitut eine Prognose über den prozentualen Stimmenanteil abgeben, den eine bestimmte Partei in dieser Wahl erreichen wird. a) Wie viele zufällig ausgewählte Wahlberechtigte müssen mindestens befragt werden, um für den prozentualen Stimmenanteil ein 95% - Konfidenzintervall zu erhalten, dessen Länge höchstens 2% ist ? b) Was ändert sich, wenn die Länge des Konfidenzintervalls L höchstens 1% sein soll bei gleich bleibender Sicherheit von 95% ? c) ... Länge 2% bei Sicherheit von 99% ? 2 3. Die Lebensdauer X in km einer Autoreifensorte sei N ( ; 5000 ) - verteilt. Durch Änderung der Rohstoffzusammensetzung ist die mittlere Lebensdauer der Reifen einer Produktionsserie veränderbar, während sich die Standardabweichung nicht ändert. a) Die Rohstoffzusammensetzung sei so gewählt, dass die mittlere Lebensdauer dieser Serie 50 000 km beträgt. a1) Bei wie viel Prozent der Reifen übersteigt die Lebensdauer 60 000 km ? a2) Bei wie viel Prozent weicht die Lebensdauer um mehr als 8 000 km von ab? b) Wie groß muss die mittlere Lebensdauer mindestens sein, damit höchstens 2% der Reifen eine Lebensdauer von weniger als 40 000 km haben? c) Aus einer Stichprobe vom Umfang n = 100 wird eine mittlere Lebensdauer x 49700 km ermittelt. Geben Sie ein 95% - Konfidenzintervall für die mittlere Lebensdauer dieser Serie an. d) Wie groß müsste der Stichprobenumfang mindestens sein, damit mit 95% Sicherheit die Länge des Konfidenzintervalls höchstens 2 000 km beträgt? 4. Die Füllmenge einer 1-Liter-Flaschenabfüllmaschine sei normalverteilt. Aus einer Stichprobe von 100 Flaschen ergibt sich ein arithmetischer Mittelwert x 990 cm 3 und die empirische Standardabweichung s 38 cm 3 . Ermitteln Sie ein 95 % - Konfidenzintervall für den Erwartungswert der Füllmenge. 5. Eine Maschine produziert Bolzen mit Soll-Durchmesser 40 mm. 100 Bolzen wurden nachgemessen. Dabei erhielt man das arithmetische Mittel x 38,96 mm und die 150 Statistik 5. Beurteilende Statistik empirische Varianz s 2 1,1808 mm2 . Die Bolzendicke ist näherungsweise normalverteilt. a) Bestimmen Sie ein 99 % - Konfidenzintervall für den Mittelwert . Kann man auf Grund dieses Ergebnisses mit 99 % Sicherheit behaupten, dass kleiner ist als der Sollwert? b) Bestimmen Sie ein 95 % – Konfidenzintervall für die Varianz 2 und für die Standartabweichung . 6. Eine Abfüllmaschine, die die Pakete mit einer Nettomasse von 250 g herstellen soll, arbeitet erfahrungsgemäß nach einer Normalverteilung. Es besteht aber der Verdacht, dass der Mittelwert vom Sollmaß 250 g abweicht. a) Eine geeignete Nullhypothese soll auf dem Signifikanzniveau von 5 % sowie 1 % zweiseitig sowie einseitig auf Grund des gleichen Stichprobenmaterials getestet werden: n = 10 x 253,4 g , s = 5,2 g . Inwiefern ist bei einer vorschnellen Interpretation des „Nicht-Ablehnen-Könnens“ als „Annahme“ eine offensichtliche Möglichkeit der Manipulation gegeben? b) Nach Festlegung des Signifikanzniveaus 1 % und des Stichprobenumfangs n = 40 soll auf Grund eines einseitigen Tests eine Entscheidung zwischen „Ablehnung“ und „Annahme“ der Hypothese herbeigeführt werden. Die Stichprobe habe x 252,6 g , s = 5,8 g ergeben. 7. Auf dem Signifikanzniveau 5 % soll geprüft werden, ob die Streuung des (normalverteilten) Durchmessers X von Wellen, die auf einer Maschine produziert werden, den Sollwert 0,5 mm einhält. Eine Stichprobe vom Umfang n = 10 hat hierzu x 26,2 mm und s = 0,7 mm ergeben. Was würde der Test auf dem Niveau 1 % ergeben? 8. Eine Münze wurde n = 2500 Mal geworfen. Es ergab sich 1184 Mal „Wappen“ und 1316 Mal „Zahl“. Kann man die Münze auf dem Signifikanzniveau 1 % als regelmäßig ansehen? Hinweis: Approximation durch die Normalverteilung. 9. Bei Geschwindigkeitsmessungen auf einem Autobahnteilstück ergaben sich bei 200 gemessenen PKW folgende Werte: Geschwindigkeit in km/h Anzahl der PKW < 80 20 80…100 35 100…120 120…140 70 60 > 140 15 a) Ist auf dem Signifikanzniveau 5 % die Stichprobe mit der Hypothese einer Normalverteilung mit 110 km/h und 25 km/h verträglich? 151 Statistik 5. Beurteilende Statistik b) Was ergibt sich bei gleichem Signifikanzniveau 5 % , wenn und durch die Stichprobenwerte x und s geschätzt werden? x und s sind dabei näherungsweise mit Hilfe der Klassenmitten zu ermitteln. 10. In der Elektrizitätsversorgung einer Region wurden über einen längeren Zeitraum Tage mit und ohne Netzausfall registriert, um einen vermuteten Zusammenhang mit Temperaturextremen aufzudecken: Tage bei mit Netzausfall ohne Netzausfall Σ TemperaturMaxima 2 12 14 TemperaturMinima 5 11 16 kein Temp.Extremum 34 296 330 41 319 360 Prüfen Sie auf dem Signifikanzniveau 1 % , ob ein Zusammenhang zwischen Netzausfällen und Temperaturextremen besteht. 152