Aufgabe 1: Eine Maschine produziert Bauteile. Die Wahrscheinlichkeit, dass dabei bei der Produktion eines einzelnen Bauteils ein Fehler auftritt, beträgt p. Die einzelnen Produktionsvorgänge sind unabhängig voneinander. (a) Angenommen, es gilt p = 0.1. Geben Sie die Wahrscheinlichkeiten, dass von 50 produzierten Bauteilen genau 2 defekt sind, mit einer Formel an. (Der Zahlenwert muss nicht ausgerechnet werden.) (b) Nun ist p unbekannt. Man untersucht n = 50 zufällige Bauteile und stellt fest, dass genau k = 2 davon defekt sind. (i) Geben Sie eine Maximum-Likelihood-Schätzung für p ab. (ii) Geben Sie eine Gleichung für die obere Grenze pO eines (rechtsseitig begrenzten) Konfidenzintervalls [0, pO ] für p zum Konfidenzniveau δ = 0.9 an. (Sie müssen die Gleichung nicht lösen. Ersetzen Sie aber alle bekannten Werte durch die entsprechenden Zahlen.) (iii) • Erläutern Sie, warum der Wahrheitsgehalt der Aussage p ∈ [0, pO ] vom Zufall abhängt. • Was weiß man über die Wahrscheinlichkeit, dass die Aussage wahr ist? (iv) Ordnen Sie die folgenden drei Konfidenzintervalle den Konfidenzniveaus 0.8, 0.9 und 0.95 zu: I1 = [0 , 0.103] I2 = [0 , 0.084] I3 = [0 , 0.121] Begründen Sie Ihre Antwort mit einem Vergleich der Breite der Intervalle. Aufgabe 2: In einer Untersuchung werden n = 20 Mädchen (im Alter von 8 Jahren) gewogen. Zu der zufälligen Größe X : Gewicht der Mädchen liegt damit also eine Stichprobe X1 , . . . , X20 vor. Man berechnet daraus X = 27.52 und sX = 5.73 (jeweils in Kilogramm) Nun soll die Nullhypothese H0 : µX ≥ 30 mit einem t-Test untersucht werden. (a) • Welche Voraussetzung muss die zufällige Größe X (theoretisch) erfüllen, damit der t-Test angewendet werden darf? • Nennen Sie ein Testverfahren, mit dem diese Voraussetzung (empirisch) untersucht werden kann. (b) Berechnen Sie die Teststatistik T des t-Tests. (c) Wie berechnet man aus dieser Teststatistik T den p-Wert? (Antworten Sie mit einer Formel, in der eine Verteilung vorkommt, zu der Sie auch die Zahl der Freiheitsgrade angeben.) (d) Es ergibt sich ein p-Wert von 0.0340. • Wie ist dies bei einem Signifikanzniveau α = 0.05 zu interpretieren? • Welcher Fehler kann dabei (möglicherweise) aufgetreten sein? (e) Zum Vergleich werden nun auch 15 Jungen gleichen Alters gewogen. Man erhält eine Stichprobe Y1 , . . . , Y15 . • Handelt es sich bei X1 , . . . , X20 und Y1 , . . . , Y15 um unabhängige oder um verbundene Stichproben? • Nennen Sie ein Testverfahren, mit dem man die Nullhypothese H0 : Jungen sind im erwarteten Durchschnitt mindestens 3kg schwerer als Mädchen. untersuchen kann. Aufgabe 3: Gegeben ist die folgende Stichprobe einer zufälligen Größe X (die Werte wurden bereits der Größe nach sortiert): 18, 32, 42, 46, 48, 50, 66, 68, 86, 102, 154, 184, 200, 234, 256, 308, 312, 314, 544, 936 (a) Angenommen X ist exponentialverteilt. Geben Sie eine Punktschätzung für den unbekannten Parameter λ ab. Hinweis: Die Summe der 20 oben angegebenen Werte ist 4000. (b) Angenommen X ist exponentialverteilt und es gilt λ = 0.005. Berechnen Sie die Wahrscheinlichkeit: P (100 < X ≤ 250) (c) Zur Nullhypothese H0 : X ist exponentialverteilt (mit irgendeinem Parameter). soll nun ein χ2 -Test durchgeführt werden. Dazu werden die möglichen Werte von X in die folgenden drei Klassen eingeteilt: A1 = [0, 100] A2 =]100, 250] A3 =]250, ∞[ (i) Bestimmen Sie die absoluten Klassenhäufigkeiten h1 , h2 , h3 aus der Stichprobe. (ii) Bestimmen Sie die (unter H0 ) erwartete absolute Klassenhäufigkeiten h˜2 für die Klasse A2 mit Hilfe der in (b) berechneten Wahrscheinlichkeit. (iii) Berechnen Sie die Teststatistik T des χ2 -Tests. Hinweis: Neben dem in (ii) berechneten Wert für h˜2 können Sie benutzen, dass: h˜1 = 7.86 und h˜3 = 7.66 Lösung zu Aufgabe 1: (a) Binomialverteilung: n = 50, p = 0.1: 50 50 W (genau 2 Treffer) = · (0.1)2 · (1 − 0.1)50−2 = · (0.1)2 · (0.9)48 2 2 (b) (i) p wird geschätzt durch k n = 2 50 = 0.04 (ii) Allgemein: k X n j=0 hier: · pO j · (1 − pO )n−j = 1 − δ 2 X 50 j=0 (iii) j j · pO j · (1 − pO )50−j = 0.1 • Die Trefferzahl k ist zufällig. Daher ist auch das aus k berechnete pO zufällig. (Die wahre Trefferwahrscheinlichkeit p ist zwar unbekannt, aber nicht zufällig.) Ob die Aussage p ∈ [0, pO ] wahr ist, hängt von dem (zufälligen) pO ab. • Es gilt immer: W (p ∈ [0, pO ]) ≥ δ Also hier: W (p ∈ [0, pO ]) ≥ 0.9 (iv) Je größer das Konfindenzniveau gewählt wird, desto breiter muss notwendigerweise das zugehörige Konfindenzintervall sein, damit das Konfindenzintervall eingehalten wird. Also gehört: I1 zu 0.9 , I2 zu 0.8 , I3 zu 0.95 Lösung zu Aufgabe 2: (a) • X muss normalverteilt sein. • Die Normalverteilungshypothese kann zum Beispiel mit einem Shapiro-WilksTest untersucht werden. (b) Wir haben die Nullhypothese H0 : µX ≥ µ0 mit µ0 = 30: T = √ n· X − µ0 √ 27.52 − 30 = 20 · = −1.936 sX 5.73 (c) Der p-Wert ergibt sich zu T19 (T ). Dabei bezeichnet T19 die t-Verteilung mit 19 Freiheitsgraden. (d) • Da der p-Wert ≤ α ist, kann H0 zum Signifikanzniveau α abgelehnt werden. • H0 könnte trotzdem wahr sein. In diesem Fall würde ein α-Fehler bzw. Fehler erster Art vorliegen. (Anmerkung: Falls H0 wahr ist, ist die Wahrscheinlichkeit für einen α-Fehler stets ≤ α.) (e) • Die Stichproben sind unabhängig. • Zweistichproben t-Test (Welch-Test) oder Einfaktorielle Varianzanalyse Lösung zu Aufgabe 3: (a) n X= 1X 4000 Xj = = 200 n 20 j=1 Der unbekannte Parameter λ wird geschätzt durch 1 X = 1 200 = 0.005. (b) Die Verteilungsfunktion von X ist gegeben durch F (x) = 1 − exp(−λ · x). Also: P (100 < X ≤ 250) = F (250) − F (100) = 1 − exp(−λ · 250) − 1 − exp(−λ · 100) = exp(−0.005 · 100) − exp(−0.005 · 250) = 0.320 (c) (i) Durch Abzählen bestimmt man: h1 = 9 , h2 = 5 , h3 = 6 (ii) (b) h˜2 = n · W (X ∈ A2 |H0 ) = 20 · 0.320 = 6.40 (iii) T h1 − h˜1 2 h2 − h˜2 2 h3 − h˜3 2 + + h˜1 h˜2 h˜3 (9 − 7.86)2 (5 − 6.40)2 (6 − 7.66)2 = + + 7.86 6.40 7.66 = 0.831 =