1 8 Konfidenzintervalle Kapitel 8: Konfidenzintervalle A: Beispiele Beispiel 1: Im WS 2000/01 wurden im Rahmen der Statistik–Vorlesung 124 Studenten u.a. zu ihrer Körpergröße befragt. Man erhielt folgendes Ergebnis: Körpergröße x in [m] 1.50 – 1.60 1.60 – 1.70 1.70 – 1.80 1.80 – 1.90 1.90 – 2.00 2.00 – 2.10 Häufigkeit 1 5 49 53 15 1 a) Berechnen Sie ein Konfidenzintervall zum Konfidenzniveau von 0.9 für die durchschnittliche Körpergröße aller Göttinger Studenten des WS 2000/01. b) Für den Anteil der Göttinger Studenten des WS 2000/01, die größer als 1.70 m waren, wurde das Konfidenzintervall [0.468 ; 0.644] konstruiert. Bestimmen Sie die Konfidenzniveau dieses Intervalls. Lösung: a) Körpergröße x 1.50 – 1.60 1.60 – 1.70 1.70 – 1.80 1.80 – 1.90 1.90 – 2.00 2.00 – 2.10 P Häufigkeit ni 1 5 49 53 15 1 124 Intervallmitte xiM 1.55 1.65 1.75 1.85 1.95 2.05 224.9 2 ni · xiM xiM · ni 1.55 8.25 85.75 98.05 29.25 2.05 2.4025 13.6125 150.0625 181.3925 57.0375 4.2025 408.71 2 8 Konfidenzintervalle 224.9 = 1.814 124 n 2 124 408.71 2 ∗ 2 S = S = − (1.814) = 0.0055 n−1 123 124 √ S∗ = S∗ 2 = 0.074 x= Konfidenzintervall für µ: α/2 = 0.05 ; n − 1 = 123 =⇒ t123;0.05 = 1.657 ∗ S S∗ ; x + tn−1;α/2 √ x − tn−1;α/2 √ n n 0.074 0.074 = 1.814 − 1.657 · √ ; 1.814 + 1.657 · √ 124 124 = [1.803 ; 1.825] b) Konfidenzintervall für π (π = Anteil der Studenten, die größer als 1.70 waren) " # r r πb(1 − πb) πb(1 − πb) πb − zα/2 · ; πb + zα/2 · n n 69 πb = = 0.556 124 r r πb(1 − πb) 0.556 · 0.444 = = 0.045 n 124 r πb(1 − πb) πb − zα/2 · = 0.534 n 0.556 − zα/2 · 0.045 = 0.468 zα/2 = 1.96 ⇒ α/2 = 0.025 Konfidenzniveau (1 − α) = 0.95 3 8 Konfidenzintervalle B: Übungsaufgaben [1] Ein bayrischer Landwirt (ohne Rundfunk und Fernsehen) sagt an 80 von 100 zufällig über einen längeren Zeitraum verteilten Tagen das Wetter für den folgenden Tag richtig voraus. Geben Sie die Grenzen des 95%-Konfidenzintervalls für den Anteil richtiger Vorhersagen an. Die Grenzen des Konfidenzintervalls sind: [ ; ] [2] Ein Unternehmer will mit Hilfe einer Stichprobe vom Umfang n den Marktanteil seines Produktes ermitteln. Wie groß muss n mindestens sein, wenn der Stichprobenanteil vom tatsächlichen Marktanteil mit einer Wahrscheinlichkeit von mindestens 95 % um höchstens 1% abweichen soll? n≥ [3] Aus einer Grundgesamtheit wird eine Zufallsstichprobe vom Umfang n=144 gezogen und für den unbekannten Mittelwert µ ein Konfidenzintervall [64.2 ; 66.6] zur Konfidenzniveau (1 − α) = 0.928 berechnet. Wie groß ist die Standardabweichung in der Stichprobe? S∗ = 4 8 Konfidenzintervalle [4] Das Konfidenzintervall für den unbekannten Parameter µ einer normalverteilten Zufallsvariable mit bekannter Varianz sei σ σ ; x + zα/2 · √ ] [x − zα/2 · √ n n Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Je größer die angestrebte Sicherheit (1 − α), desto gröber (ungenauer) die Intervallschätzung für µ. ( ) b) Die Länge des Konfidenzintervalls hängt vom Zufall ab. ( ) c) Die Lage des Konfidenzintervalls hängt vom Zufall ab. ( ) d) Da zα/2 mit wachsender Konfidenzzahl (1 − α) abnimmt, nimmt auch die Länge des Intervalls mit wachsender Konfidenzzahl ab. ( ) e) Die Länge des Konfidenzintervalls ist abhängig von den beobachteten Werten von x. ( ) [5] Eine Kaffeemaschine in der Mensa füllt laut Betriebsanleitung durchschnittlich 100 ml je Tasse ab. Es kann angenommmen werden, dass die Füllmenge annähernd normalverteilt ist. Zur Überprüfung der Genauigkeit der angegebenen Abfüllmenge wurde eine Stichprobe der Größe 9 gezogen. Dabei ergaben sich folgende Werte (in ml): 104 103 107 105 102 109 105 104 106 Die Mensaverwaltung interessiert, ob das 95% Konfidenzintervall den vom Hersteller angegebenen Wert überdeckt. Geben Sie dazu die Grenzen des 95% Konfidenzintervalls an: [ ; ] [6] Welche der folgenden Aussagen sind WAHR? Kreuzen Sie diese an. a) ( ) ( ) c) Das Konfidenzintervall mit Wahrscheinlichkeit 0.90 ist immer kürzer als das entspre- ( chende Konfidenzintervall mit Wahrscheinlichkeit 0.99. ) d) Bei größeren Stichproben erwartet man Konfidenzintervalle größerer Länge. ( ) e) Wenn bei den verschiedensten (unabhängigen) Anwendungen Konfidenzintervalle mit ( Wahrscheinlichkeit 0.90 berechnet werden, enthalten im Durchschnitt 90% dieser Intervalle den Wert des zu schätzenden Parameters. ) b) Die Grenzen eines Konfidenzintervalls sind Zufallsvariablen. X Ist X verteilt wie b(n, π), so ist (bei πb = , n > 30) n ! r r πb(1 − πb) πb(1 − πb) P πb − z0.05 ≤ π ≤ πb + z0.05 n n ≈ 0.90 . 5 8 Konfidenzintervalle [7] Ein Teetrinker führt bei 16 zufällig ausgewählten 100 g-Dosen seiner Lieblingssorte Gewichtskontrollen des Inhaltes durch. Er nimmt an, dass das Abfüllgewicht X normalverteilt ist. P Als Gesamtgewicht aller Doseninhalte ermittelt er 1552 g ( xi2 = 151328 g2 ). a) Bestimmen Sie das 95%-Konfidenzintervall unter der Annahme, dass die Varianz der Grundgesamtheit bekannt ist. (σ 2 = 36 g2 ) [ ; ] Enthält das Konfidenzintervall um x den Sollwert von 100 g ? b) Ermitteln Sie nun unter der Voraussetzung , dass σ 2 Ihnen unbekannt ist, das entsprechende 95%-Konfidenzintervall. [ ; ] [8] Für den unbekannten Anteilswert π der von einer Maschine fehlerfrei produzierten Stücke sei das Konfidenzintervall [0.734 ; 0.866] berechnet worden. Die zugrundeliegende Stichprobe bestand aus 100 produzierten Stücken. Der Wert des geschätzten Anteilswertes πb ist: Das zugrundeliegende Konfidenzniveau (1 − α) ist: [9] Eine Molkereigenossenschaft beabsichtigt, Milchtüten doppelten Inhalts einzuführen, die auf der bisherigen Maschine abgefüllt werden sollen. Aus langjähriger Erfahrung weiß man, dass die derzeitige Füllmenge annähernd normalverteilt ist, bei einer Varianz von σ 2 = 36. Um die neue tatsächliche mittlere Füllmenge µ zu bestimmen, soll eine Stichprobe gezogen werden. Wie groß muss der Stichprobenumfang n mindestens gewählt werden, wenn µ nicht mehr als 1.5 von x bei einer vorgegebenen Konfidenzniveau von mindestens 95.4% abweichen soll? Stichprobenumfang n ≥ 6 8 Konfidenzintervalle [ 10 ] S∗ S∗ Das Konfidenzintervall x − tn−1;α/2 · √ ; x + tn−1;α/2 · √ sei für den unbekannten Parameter µ n n einer Grundgesamtheit berechnet worden. Welche der folgenden Aussagen sind WAHR? Kreuzen Sie sie an. a) Das Konfidenzintervall ist umso länger, je größer der Stichprobenumfang ist. ( ) b) Die Lage des Intervalls hängt vom Zufall ab. ( ) c) Die Länge des Intervalls hängt vom Zufall ab. ( ) d) Das angegebene Konfidenzintervall überdeckt µ mit der Wahrscheinlichkeit α. ( ) e) Das Konfidenzintervall ist umso länger, je größer das gewählte Konfidenzniveau 1 − α ist. ( ) [ 11 ] Eine Zufallsvariable sei normalverteilt. Es wurden eine Stichprobe der Größe n = 10 gezogen. Als Stichprobenvarianz ergab sich S2 = 5. Berechnen Sie nun ein 90%-Konfidenzintervall für σ 2 . HINWEISE: Es genügt, die Unter- und Obergrenze des Intervalls als ungekürzten Bruch anzugeben ! Für das 100(1 − α)% Konfidenzintervall für σ 2 gilt: " # nS2 nS2 ; 2 2 χ(n−1;α/2) χ(n−1;1−α/2) Für das 90% Konfidenzintervall für σ 2 gilt: [ ; ] Welche der folgenden Aussagen sind im Zusammenhang mit obigem Konfidenzintervall für σ 2 WAHR ? Kreuzen Sie sie an. a) Das Konfidenzintervall ist symmetrisch um S2 . ( ) b) Die Länge des Intervalls hängt vom Zufall ab. ( ) c) Die Lage des Intervalls hängt vom Zufall ab. ( ) d) Je höher das Konfidenzniveau 100(1 − α)% gewählt wird, desto breiter wird das Kon- ( fidenzintervall. ) e) Das angegebene Konfidenzintervall überdeckt σ 2 mit der Wahrscheinlichkeit 1 − α. ) ( 7 8 Konfidenzintervalle [ 12 ] Welche Aussagen im Zusammenhang mit Konfidenzintervallen sind WAHR? Kreuzen Sie sie an. a) Der Stichprobenumfang hat wesentlichen Einfluss auf die Breite eines Konfidenzinter- ( valls. ) b) Konfidenzintervalle werden in Ergänzung zu den Punktschätzern eingesetzt, um Aus- ( sagen über die Genauigkeit der Punktschätzer machen zu können. ) c) Konfidenzintervalle sind immer symmetrisch um den zu schätzenden Parameter. ( ) d) Der zu schätzende Parameter wird nie von dem berechneten Konfidenzintervall über- ( deckt. ) e) Zumindest die Lage von Konfidenzintervallen ist zufällig, da es möglich ist, je nach ( Stichprobe verschiedene Punktschätzer zu erhalten, und diese die Grundlage für die Berechnung der Intervalle darstellen. ) 8 Konfidenzintervalle C: Klausuraufgaben [ 13 ] II07S1 Eine Milchabfüllanlage füllt laut Herstellerangaben durchschnittlich 1 Liter Milch pro Packung ab. Eine Stichprobe der Größe n = 10 ergab die folgenden Werte (in ml), die in R unter dem Namen milch gespeichert wurden. 994, 998, 1005, 998, 1002, 991, 1004, 1001, 996, 1003 var(milch) [1] 21.06667 > sum(milch) [1] 9992 > sum(milch^2) [1] 9984196 Berechnen Sie ein Konfidenzintervall für µ zum Niveau 0.90: Konfidenzintervall: [ 14 ] IV07S Sie sollen im Folgenden eine Untersuchung zu den Ernteerträgen von Gerste auf einem bestimmten Feld in einem bestimmten Zeitraum durchführen. Dazu steht Ihnen eine Stichprobe der Größe n=10 zur Verfügung: > gerste [1] 108 185 143 153 135 189 110 191 191 112 > sum(gerste) [1] 1517 > sum(gerste^2) [1] 241299 > var(gerste) [1] 1241.122 Berechnen Sie ein Konfidenzintervall für µ zum Konfidenzniveau 0.95. Konfidenzintervall: 8 8 Konfidenzintervalle [ 15 ] II07S Bei der Produktion von Streichhölzern sollen diese auf Ihre Funktionsfähigkeit überprüft werden. Dazu wurden 100 Streichhölzer der laufenden Produktion entnommen. 80 Streichhölzer waren brauchbar, die verbleibenden 20 konnten entweder nicht entzündet werden oder knickten ab. Konstruieren Sie ein Konfidenzintervall zum Niveau 1 − α = 0.95 für den wahren Anteilswert funktionierender Streichhölzer. Geben Sie jeweils vier Stellen nach dem Dezimalpunkt an. Als Alternative können Sie auch den R-Befehl zur Berechnung der oberen Grenze des Konfidenzintervalls angeben. Konfidenzintervall: 9 8 Konfidenzintervalle D: Lösungen 1) [0.722; 0.878] 2) 9604 3) 8 4) a, c 5) [103.369; 106.631] 6) a, b, c, e 7) [94.06; 99.94] ; nein ; [93.15; 100.85] 8) 0.8 ; 0.902 9) 256 10) b, c, e 50 50 11) ; ; b, c, d, e 16.92 3.33 12) a, b, e 13) [996.544; 1001.856] 14) [126.522; 176.878] 15) [0.7216; 0.8784] 10