Übungen zu Angewandte Stochastik II - Blatt 6

Werbung
Dr. Claudia Redenbach
Malte Spiess
WS 2009/10
11. 1. 2010
Übungen zu Angewandte Stochastik II - Blatt 6
Abgabe: 19. 1. 2010 in der Vorlesung
Aufgabe 1
Konstruiere einen asymptotischen Test zum Niveau α für eine Stichprobe von unabhängigen und Exp(λ)-verteilten Zufallsvariablen und die Hypothesen H0 : λ = λ0
vs. H1 : λ 6= λ0 .
(3)
Aufgabe 2
Betrachte den schlaf.txt-Datensatz und führe mit ihm ein paar Tests durch.
Verwende dafür ausschließlich die in R eingebauten t.test()-Methode. Orientiere
Dich dafür am besten an der Hilfeseite in R, um die jeweiligen Parameter richtig
zu übergeben.
Die Daten sind dabei wie folgt erhoben worden:
Data which show the effect of two soporific drugs (increase in hours
of sleep compared to control) on 10 patients.
Die Bezeichnung der Variablen ist dabei die folgende:
extra: increase in hours of sleep;
group: drug given;
Alle Tests sollen zum Niveau α = 0.05 durchgeführt werden. Gib aber auch stets
den p-Wert an. Du kannst davon ausgehen, dass die Stichproben unabhängig und
normalverteilt sind. Ferner seien die Zufallsvariablen in beiden Gruppen jeweils
identisch verteilt.
(a) In dieser Teilaufgabe seien beide Gruppen als gleich (also identisch verteilt)
vorausgesetzt. Teste H0 : der Erwartungswert ist Null gegen H1 : der Erwartungswert ist nicht Null in einem gemeinsamen Test für beide Gruppen.
(2)
(b) Teste H0 : der Erwartungswert der Gruppen ist gleich gegen H1 : der Erwartungswert der zweiten Gruppe ist größer.
(2)
(c) Wiederhole den Test aus Teil (b) unter der Annahme, dass es eine verbundene
Stichprobe ist.
(1)
(d) Wiederhole den Test aus Teil (b) unter der Annahme, dass die Varianzen der
Messwerte in beiden Gruppen gleich sind.
(1)
In den folgenden Aufgaben wird der Datensatz babyboom.dat verwendet, Beschreibung siehe Rückseite.
Aufgabe 3
(a) Für ein λ < 1 erzeuge eine Stichprobe x1 , . . . , x50 von 50 i.i.d. Exp(λ)verteilten Zufallsvariablen X1 , . . . , X50 . Verwende für die folgenden Teilaufgaben immer dieselbe konkrete Stichprobe.
(1)
(b) Plotte ihre empirische Verteilungsfunktion und die passende theoretische Verteilungsfunktion in ein gemeinsames Schaubild (also übereinander). Für die
empirische Verteilungsfunktion ist hier die Funktion ecdf() nützlich.
(3)
(c) Berechne den Kolmogorov-Abstand zwischen der empirischen und der theoretischen Verteilungsfunktion. Verwende dabei folgende Formel für den
Kolmogorov-Abstand Dn :
(3)
Dn = max max F (X(i) − 0) −
i∈1,...,n
i−1 i
n ,n
− F (X(i) ) .
Hinweis: Bei stetigen Verteilungsfunktionen F gilt, dass
F (x − 0) = lim F (x − ε) = F (x) für x ∈ R.
ε→0+
(d) Berechne den Kolmogorov-Abstand mit der Funktion ks.test().
(2)
Hinweis: Auf der Hilfeseite zu ks.test() ist unten ein Beispiel zur Angabe
einer parametrischen Verteilung.
(e) Zu babyboom.dat: Es wird vermutet, dass die Zeit, die zwischen zwei Geburten vergeht, exponentialverteilt ist und unabhängig von den anderen Zeiten.
Stelle ein passendes stochastisches Modell und geeignete Hypothesen auf und
überprüfe sie, indem Du erst den Parameter λ der Verteilung schätzt und
dann ks.test() anwendest. Welchen p-Wert erhältst Du?
(3)
Aufgabe 4
Es sei X1 , . . . , Xn eine N(µ, σ 2 )-verteilte Stichprobe von i.i.d. Zufallsvariablen.
Bekanntermaßen ist (n−1)Sn2 /σ 2 eine χ2n−1 -verteilte Zufallsvariable und deshalb ist
die Funktion 1{(n−1)Sn2 /σ02 > χ2n−1,1−α } ein Test zum Niveau α für die Hypothesen
H0 : σ ≤ σ0 vs. H1 : σ > σ0 .
(a) Da die Nullhypothese hier verworfen werden soll, falls die Testgröße
T = (n − 1)Sn2 /σ02 zu groß wird, ist der p-Wert die Wahrscheinlichkeit, dass
T größere Werte annimmt als das konkrete T (ω). Berechne für beliebige
konkrete t = T (ω) > 0 den p-Wert. Dabei kannst Du im Ergebnis die Verteilungsfunktion der χ2 -Verteilung verwenden.
(2)
(b) Zu babyboom.dat: Das Gewicht der Babys wird als normalverteilt angenommen. Berechne den p-Wert für den obigen Test, wobei σ0 = 100 sei.
(2)
Beschreibung von babyboom.dat:
The data give the birth weight, gender, and time of birth of 44 babies
born in the 24-hour period of 18 December 1997 at the Mater Mother’s
Hospital in Brisbane, Australia. (At the time, this was a record number
of births in one 24-hour period.)
Die Bezeichnung der Variablen ist dabei die folgende:
Time:
Gender:
Weight:
Minutes:
The
The
The
The
time of the birth, as recorded on a 24-hour clock
gender of the baby: 1 means a girl; 2 means a boy
birth weight in grams
minutes since midnight when the birth occurred.
Herunterladen