Aufgabe 1 - Universität Koblenz · Landau

Werbung
Aufgabe 1:
Eine Maschine produziert Bauteile. Die Wahrscheinlichkeit, dass dabei bei der Produktion
eines einzelnen Bauteils ein Fehler auftritt, beträgt p. Die einzelnen Produktionsvorgänge
sind unabhängig voneinander.
(a) Angenommen, es gilt p = 0.1. Geben Sie die Wahrscheinlichkeiten, dass von 50 produzierten Bauteilen genau 2 defekt sind, mit einer Formel an. (Der Zahlenwert muss nicht
ausgerechnet werden.)
(b) Nun ist p unbekannt. Man untersucht n = 50 zufällige Bauteile und stellt fest, dass
genau k = 2 davon defekt sind.
(i) Geben Sie eine Maximum-Likelihood-Schätzung für p ab.
(ii) Geben Sie eine Gleichung für die obere Grenze pO eines (rechtsseitig begrenzten)
Konfidenzintervalls [0, pO ] für p zum Konfidenzniveau δ = 0.9 an. (Sie müssen die
Gleichung nicht lösen. Ersetzen Sie aber alle bekannten Werte durch die entsprechenden
Zahlen.)
(iii)
• Erläutern Sie, warum der Wahrheitsgehalt der Aussage
p ∈ [0, pO ]
vom Zufall abhängt.
• Was weiß man über die Wahrscheinlichkeit, dass die Aussage wahr ist?
(iv) Ordnen Sie die folgenden drei Konfidenzintervalle den Konfidenzniveaus 0.8, 0.9
und 0.95 zu:
I1 = [0 , 0.103]
I2 = [0 , 0.084]
I3 = [0 , 0.121]
Begründen Sie Ihre Antwort mit einem Vergleich der Breite der Intervalle.
Aufgabe 2:
In einer Untersuchung werden n = 20 Mädchen (im Alter von 8 Jahren) gewogen. Zu der
zufälligen Größe
X : Gewicht der Mädchen
liegt damit also eine Stichprobe X1 , . . . , X20 vor. Man berechnet daraus
X = 27.52
und sX = 5.73
(jeweils in Kilogramm)
Nun soll die Nullhypothese H0 : µX ≥ 30 mit einem t-Test untersucht werden.
(a)
• Welche Voraussetzung muss die zufällige Größe X (theoretisch) erfüllen, damit
der t-Test angewendet werden darf?
• Nennen Sie ein Testverfahren, mit dem diese Voraussetzung (empirisch) untersucht werden kann.
(b) Berechnen Sie die Teststatistik T des t-Tests.
(c) Wie berechnet man aus dieser Teststatistik T den p-Wert? (Antworten Sie mit einer
Formel, in der eine Verteilung vorkommt, zu der Sie auch die Zahl der Freiheitsgrade angeben.)
(d) Es ergibt sich ein p-Wert von 0.0340.
• Wie ist dies bei einem Signifikanzniveau α = 0.05 zu interpretieren?
• Welcher Fehler kann dabei (möglicherweise) aufgetreten sein?
(e) Zum Vergleich werden nun auch 15 Jungen gleichen Alters gewogen. Man erhält eine
Stichprobe Y1 , . . . , Y15 .
• Handelt es sich bei X1 , . . . , X20 und Y1 , . . . , Y15 um unabhängige oder um verbundene Stichproben?
• Nennen Sie ein Testverfahren, mit dem man die Nullhypothese
H0 : Jungen sind im erwarteten Durchschnitt mindestens 3kg schwerer als Mädchen.
untersuchen kann.
Aufgabe 3:
Gegeben ist die folgende Stichprobe einer zufälligen Größe X (die Werte wurden bereits
der Größe nach sortiert):
18, 32, 42, 46, 48, 50, 66, 68, 86, 102, 154, 184, 200, 234, 256, 308, 312, 314, 544, 936
(a) Angenommen X ist exponentialverteilt. Geben Sie eine Punktschätzung für den unbekannten Parameter λ ab.
Hinweis: Die Summe der 20 oben angegebenen Werte ist 4000.
(b) Angenommen X ist exponentialverteilt und es gilt λ = 0.005. Berechnen Sie die Wahrscheinlichkeit:
P (100 < X ≤ 250)
(c) Zur Nullhypothese
H0 : X ist exponentialverteilt (mit irgendeinem Parameter).
soll nun ein χ2 -Test durchgeführt werden. Dazu werden die möglichen Werte von X
in die folgenden drei Klassen eingeteilt:
A1 = [0, 100]
A2 =]100, 250]
A3 =]250, ∞[
(i) Bestimmen Sie die absoluten Klassenhäufigkeiten h1 , h2 , h3 aus der Stichprobe.
(ii) Bestimmen Sie die (unter H0 ) erwartete absolute Klassenhäufigkeiten h˜2 für die
Klasse A2 mit Hilfe der in (b) berechneten Wahrscheinlichkeit.
(iii) Berechnen Sie die Teststatistik T des χ2 -Tests.
Hinweis: Neben dem in (ii) berechneten Wert für h˜2 können Sie benutzen, dass:
h˜1 = 7.86
und h˜3 = 7.66
Lösung zu Aufgabe 1:
(a) Binomialverteilung: n = 50, p = 0.1:
50
50
W (genau 2 Treffer) =
· (0.1)2 · (1 − 0.1)50−2 =
· (0.1)2 · (0.9)48
2
2
(b)
(i) p wird geschätzt durch
k
n
=
2
50
= 0.04
(ii)
Allgemein:
k X
n
j=0
hier:
· pO j · (1 − pO )n−j = 1 − δ
2 X
50
j=0
(iii)
j
j
· pO j · (1 − pO )50−j = 0.1
• Die Trefferzahl k ist zufällig. Daher ist auch das aus k berechnete pO zufällig.
(Die wahre Trefferwahrscheinlichkeit p ist zwar unbekannt, aber nicht zufällig.)
Ob die Aussage p ∈ [0, pO ] wahr ist, hängt von dem (zufälligen) pO ab.
• Es gilt immer: W (p ∈ [0, pO ]) ≥ δ
Also hier: W (p ∈ [0, pO ]) ≥ 0.9
(iv) Je größer das Konfindenzniveau gewählt wird, desto breiter muss notwendigerweise das zugehörige Konfindenzintervall sein, damit das Konfindenzintervall eingehalten wird. Also gehört:
I1 zu 0.9
,
I2 zu 0.8
,
I3 zu 0.95
Lösung zu Aufgabe 2:
(a)
• X muss normalverteilt sein.
• Die Normalverteilungshypothese kann zum Beispiel mit einem Shapiro-WilksTest untersucht werden.
(b) Wir haben die Nullhypothese H0 : µX ≥ µ0 mit µ0 = 30:
T =
√
n·
X − µ0 √
27.52 − 30
= 20 ·
= −1.936
sX
5.73
(c) Der p-Wert ergibt sich zu T19 (T ). Dabei bezeichnet T19 die t-Verteilung mit 19 Freiheitsgraden.
(d)
• Da der p-Wert ≤ α ist, kann H0 zum Signifikanzniveau α abgelehnt werden.
• H0 könnte trotzdem wahr sein. In diesem Fall würde ein α-Fehler bzw. Fehler
erster Art vorliegen. (Anmerkung: Falls H0 wahr ist, ist die Wahrscheinlichkeit
für einen α-Fehler stets ≤ α.)
(e)
• Die Stichproben sind unabhängig.
• Zweistichproben t-Test (Welch-Test) oder Einfaktorielle Varianzanalyse
Lösung zu Aufgabe 3:
(a)
n
X=
1X
4000
Xj =
= 200
n
20
j=1
Der unbekannte Parameter λ wird geschätzt durch
1
X
=
1
200
= 0.005.
(b) Die Verteilungsfunktion von X ist gegeben durch F (x) = 1 − exp(−λ · x). Also:
P (100 < X ≤ 250) = F (250) − F (100)
=
1 − exp(−λ · 250) −
1 − exp(−λ · 100)
= exp(−0.005 · 100) − exp(−0.005 · 250)
= 0.320
(c)
(i) Durch Abzählen bestimmt man:
h1 = 9 ,
h2 = 5 ,
h3 = 6
(ii)
(b)
h˜2 = n · W (X ∈ A2 |H0 ) = 20 · 0.320 = 6.40
(iii)
T
h1 − h˜1
2
h2 − h˜2
2
h3 − h˜3
2
+
+
h˜1
h˜2
h˜3
(9 − 7.86)2 (5 − 6.40)2 (6 − 7.66)2
=
+
+
7.86
6.40
7.66
= 0.831
=
Herunterladen