Übungsheft zur Mathematischen Statistik1

Werbung
Übungsheft
zur
Mathematischen Statistik
WS 2011/ 2012
A. Pichler
Institut für
Statistik und
Operations Systems
Universität Wien
1 Basierend auf einer Sammlung von G. Pug.
Überarbeitet und angepasst.
1
1
1
WAHRSCHEINLICHKEITSVERTEILUNGEN
1
2
Wahrscheinlichkeitsverteilungen
Ziele:
•
Zusammenhang zwischen Wahrscheinlichkeitsmaÿ, Verteilungsfunktion und Dichte verstehen.
•
Kenntnis wichtiger Verteilungen aus den 2 praktisch bedeutsamen Klassen der atomaren und
atomfreien Maÿe.
•
Rechnen mit erzeugenden Funktionen.
•
Verteilung von transformierten Zufallsvariablen. Wichtiger Spezialfall: Faltungen.
1.1 Wiederholung lineare Algebra
1.1
Bestimmen Sie den Rang folgenden Vektorsystems
(c1 , c2 , c3 , c4 ),
wobei

 
 
 

2
4
3
1
2
2
2
0
 
 
 
 
c1 =   , c2 =   , c3 =   , c4 =  
0
2
1
1
1
1.2
2
1
Bestimmen Sie den Rang folgender Matrizen!
1
2
(a)
1.3
3
3
0
!
1
2
(b)
!
2
4

(c)
1

0
0
2
−1
0

3

3
3
Eine Matrix ist orthogonal, wenn ihre Spaltenvektoren orthogonal sind. Ist die Länge der Spaltenvektoren
gleich 1, so heiÿt die Matrix orthonormal.
Untersuchen Sie, ob die folgenden Matrizen orthogonal bzw. orthonormal sind!

(a)
1
2
 √
A =  21 3
√
− 12 3
1
2
0
1.4
0

0

0
1
√
(b)
B=
√1
13
3
−2
!
2
3
(c)
C=
3
 √2
 2
 √4
2
4
− 12
√
6
4
√
6
4
Berechnen Sie die Determinante!
(a)
1
A=
5
2 10
(b)
1
B=
5
2 10
(c)
1
C = 0
1
2
−1
1
0
1
1
0
√


2
2 
√
2
2
−
1
WAHRSCHEINLICHKEITSVERTEILUNGEN
3
1.2 Maÿe, Verteilungen, Dichten
1.5 Grundbegrie
(i)Was ist ein
Wahrscheinlichkeitsraum
(Ω, Σ, P),
(a)Ereignismenge (sample space)
Sigmaalgebra,
(b)eine
(c)ein
Maÿ (measure)?
(ii)Was ist
Zufallsvariable?
(a)eine
state space,
(b)der
(c)eine
Statistik ?
(iii)Was ist
(a)eine Verteilungsfunktion (cumulative distribution function, cdf ),
(b)eine Dichte (probability density function, pdf ),
(c)eine Quantilsfunktion?
reellwertigen Zufallsvariablen.
einer
1.6 Atome
Erklären Sie inhaltlich: Was ist ein Atom?
2 Geben Sie Beispiele von Verteilungen mit Atomen. Was
bedeutet die Existenz eines Atoms für die Verteilungsfunktion, die Quantilsfunktion bzw. für die Dichte?
1.7 Die Verteilungsfunktion
Denieren Sie
auch
FX )
und
F (x) := P (X ≤ x) (um die Zufallsvariable
F −1 (α) := inf {x : F (x) ≥ α}.
(i)Zeigen Sie, dass
(ii)Zeigen Sie für
F
rechtsseitig und
F −1 linksseitig stetig ist. Für welche α ist F −1 (α) wohldeniert?
0 < α < 1:
−1
(p) ≤ x genau dann, wenn p ≤ F (x),
−1
(b)F F
(α) ≥ α für 0 ≤ α ≤ 1,
−1
(c)F
(F (x)) ≤ x für −∞ < x < ∞, aber
−1
(d)P F
(F (X)) = X = 1.
(a)F
1.8
Zeigen Sie
−1
(i)F
◦ F ◦ F −1 = F −1 ,
◦ F −1 ◦ F = F ,
−1
−1
F −1
= F und (F ◦ G) = G−1 ◦ F −1 .
(ii)F
(iii)
1.9
Sei
F
stetig,
g
monoton und linksseitig stetig, dann ist
−1
g(X)
= g F −1
−1
g(X)
(α) = g F −1 (1 − α)
(i)F
(ii)F
falls
g
steigend, bzw.
falls
ist.
2 ω ∈ Ω ist ein Atom falls P [{ω}] > 0
zusätzlich zu kennzeichnen schreibt man oft
g
fallend
1
WAHRSCHEINLICHKEITSVERTEILUNGEN
4
1.10 Diracmaÿ 3
(
Diskutieren Sie die Maÿe
δω (A) :=
1
0
(i)Welche Eigenschaften sind für die
falls
ω∈A
sonst
pi s
und
P (A) :=
Pn
i=1
pi δωi .
notwendig?
(ii)Es sei
X:Ω→R
ω 7→ xω
eine Zufallsvariable. Geben Sie
(iii)Es sei
1.11
Es sei
F
Ω=R
und
i (ω) = ω
EX
an bezüglich des Maÿes
die Identität. Bestimmen Sie
f
die Verteilungsfunktion und
die Dichtefunktion von
P.
Ei.
X
und
g
eine Funktion. Zeigen Sie durch
partielle Integration
ˆ
1
g F −1 (p) dp
ˆ0
ˆ
ˆ
= g (x) dF (x) = g (x) F 0 (x) dx = g (x) f (x) dx
ˆ ∞
= g (a) +
g 0 (x) (1 − F (x)) dx falls P [g (X) ≥ g (a)] = 1
E [g (X)] =
ˆ
a
b
g 0 (x) F (x) dx
= g (b) −
falls
P [g (X) ≤ g (b)] = 1.
−∞
1.12
eine Zufallsgröÿe mit Verteilungsfunktion


0
F (x) = x2


1
Kann man
1.13
für
für
für
x≤0
0≤x≤1
x > 1.
zwei verschiedene Dichten nden, die zur obigen Verteilungsfunktion gehören?
Haben die folgenden Zufallsvariablen atomare oder atomfreie Maÿe? (oder weder noch)?
(i)Poissonverteilung mit Parameter
θ > 0:
Poisson-Verteilung
P (X = x) = e−θ
(ii)Exponentialverteilung mit Parameter
θx
x!
x = 0, 1, 2, . . .
θ:
(
1 − e−(x−θ)
P (X ≤ x) =
0
x ≥ θ,
x < θ.
(iii)Die Verteilung
1
P (X ≤ x) = x2 1(0, 1 ) (x) + 1( 1 ,2) (x) + 1[2,∞) (x) ,
2
2 2
1 die Indikatorfunktion
0 < p < 1 und n ∈ N.
wobei
(iv)Sei
bezeichnet. (Hinweis: Zeichnen Sie die Verteilungsfunktion.)
P (X ≤ x) =
X n
i≤x
3 Paul Dirac (1902 1984)
i
pi (1 − p)n−i .
1
1.14
WAHRSCHEINLICHKEITSVERTEILUNGEN
5
(+)Bestimmen Sie den Erwartungswert und die Varianz zur Verteilungsfunktion aus letztem Beispiel,
3). Geben Sie an, welche Formeln der Beispiele 1.10 und 1.11 dazu geeignet sind, welche können nicht
verwendet werden?
1.15
Ernden Sie je zwei atomare und atomfreie Maÿe. (Wenn möglich, nicht einfach Standardverteilungen
der Statistik wählen!)
1.16
Man beweise folgende Eigenschaften der Eulerschen
ˆ
Γ-Funktion,
die durch
∞
us−1 e−u du
Γ (s) =
0
gegeben ist:
(i)Γ(x)
= (x − 1)Γ(x)
= (n − 1)!
√
(iii)Γ(1/2) =
π.
(ii)Γ(n)
für
für
x > 1.
n ∈ N.
Hinweis: Dichte der Normalverteilung.
1.17
Man bestimme die Konstante
(i)f (x)
(ii)f (x)
= Cx3 e−x
4
für
p−1 −bxp
= Cx
(iii)f (x)
=
(iv)f (x)
=
e
,
C
so, dass
f (x)
eine Wahrscheinlichkeitsdichte wird:
x ≥ 0.
x ≥ 0, b > 0, p > 0.
Weibull-Verteilung
e−x
C (1+e
−x )2 ,
1
C 1+x
2.
Logistische Verteilung
Cauchy-Verteilung
1.3 Satz von Bayes
1.18 Multiplikationssatz.
Zeige, bzw. unter welchen Voraussetzungen gilt
P [A1 ∩ A2 . . . An ] = P [A1 ] · P [A2 | A1 ] · P [A3 | A1 ∩ A2 ] · . . . P [An | A1 ∩ A2 ∩ . . . An−1 ]?
1.19 Satz von der totalen Wahrscheinlichkeit.
Sei
Bi
P [Bi ∩ Bj ] = 0 und P [∪j Bj ] = 1).
X
P [A] =
P [A| Bi ] P [Bi ]
ein vollständiges Ereignissystem (ie.
i
und
X
P [A| C] =
P [A| Bi ∩ C] P [Bi |C] .
i
1.20 Satz von Bayes.
Sei
Bi
ein vollständiges Ereignissystem. Zeige, dass
P [A| Bi0 ] · P [Bi0 ]
P [Bi0 | A] = P
i P [A| Bi ] P [Bi ]
und
P
P [A| C] =
i
P [A| Bi ∩ C] P [C| Bi ] P [Bi ]
P
.
i P [C| Bi ] P [Bi ]
Zeige, dass
1
WAHRSCHEINLICHKEITSVERTEILUNGEN
6
Anwendungen des Satzes von Bayes
1.21
Von einem zuverlässigen Test zur TBC Diagnose weiÿ man, dass dieser Test in 94 von 100 Fällen negativ
ausfällt, falls die Testperson nicht TBC hat und in 96 von 100 Fällen positiv ausfällt, falls die Terstperson
an TBC erkrankt ist. Aus Erfahrung weiÿ man, dass im Durchschnitt von 250 Personen, die sich einer
Reihenuntersuchung unterziehen, eine Person tatsächlich TBC hat. Wie groÿ ist die Wahrscheinlichkeit
dafür, dass eine Person in Wirklichkeit TBC hat, wenn bei ihr dieser Test positiv ausgefallen ist?
Ist das Ergebnis verblüend? Interpretieren Sie es!
1.22
John visits the doctor claiming some discomfort. The doctor is led to believe that he may have some
disease A. He then takes some standard procedures for this case: he examines John, carefully observes
the symptoms and prescribes routine laboratory examinations.
Let
θ
be the unknown quantity of interest, indicating whether John has disease A or not. The doctor
assumes that
P (θ = 1|H) = 0.7. H
(history) in this case contains the information John gave him and
all other relevant knowledge he has obtained from former patients. To improve the evidence about the
independent examination.
illness, the doctor asks John to undertake an
Examination
X
is related to
θ
and provides an uncertain result of the positive negative type with the
following probability distribution:
(
P (X = 1|θ = 0) = 0.40 (test positive, provided non-disease
P (X = 1|θ = 1) = 0.95 (test positive, provided disease A)
Suppose that John goes through the examination and that his result is
A)
X = 1.
(i)What should the doctor infer about John's disease?
(ii)The doctor decides to ask John to undertake a second more ecient but also more expensive test
Y
with the following probability distribution:
(
P (Y = 1|θ = 0) = 0.04
P (Y = 1|θ = 1) = 0.99
What result can the doctor predict for the second test?
(iii)The observed result of the second test is
1.23
Let
θ ∼ N µ, τ 2
and
X|θ ∼ N θ, σ 2
Y = 0. What should the doctor infer about John's disease?
with
σ2
known. What is the posterior distribution of
θ,
given
X?
1.24
Two physicists, A and B want to determine the value of a physical constant. Physicist A, having a long
experience in the area, species his prior as
more uncertain prior
θ ∼ N 800, 80
2
θ ∼ N 900, 202
. On the other side, physicist B stated a
θ, denoted by X ,
X = 850 is observed.
. Both physicists agree to make an evaluation of
using a calibrated device with sampling distribution
(i)What do the physicists infer about
X|θ ∼ N θ|402
. The value
θ?
(ii)Interpret the result.
1.25
Let
Xi |θ, i = 1, ..., n
be bernoulli trials with parameter
θ ∈ [0, 1].
distributions for the joint sampling density.
1.26
Prove that the class of
Γ
distributions is closed under multiplication.
Find a conjugate family of prior
1
1.27
WAHRSCHEINLICHKEITSVERTEILUNGEN
Let
2
L1 (δ, θ) = (δ − θ)
7
be the loss associated with the estimation of
θ
by
δ.
Show that
δ = E (θ)
minimizes the bayesian risk.
1.4 Mehrdimensionale Verteilungen
1.28
Diskutieren Sie die Verteilungs- (cdf ) und Dichtefunktion (pdf )
F (x1 , x2 , . . . xn ) := P [X1 ≤ x1 , . . . Xn ≤ xn ] ,
∂n
F (x1 , x2 , . . . xn )
f (x1 , x2 , . . . xn ) :=
∂x1 . . . ∂xn
einer mehrdimensionaler Zufallsvariablen
sind die Unterschiede zu einer
1.29
X : Ω → Rn .
Wann lassen sie sich problemlos denieren? Wo
R−wertigen Zufallsvariablen? Kann man eine Quantilsfunktion denieren?
Give the cdf. and pdf for both distributions of
X
and
Y.
Moreover, compute the expectation, variance
and in particular the covariance of both following bivariate distributions:
P
1.30
1.31
x1 = 3
x2 = 4
x3 = 6
10 %
10 %
0 %
0 %
30 %
0 %
0 %
10 %
40 %
X = xi ,
Y = yi
y1 = 2
y2 = 5
y3 = 7
P
and
x1 = 3
x2 = 4
Ein zufälliger Punkt
(−1, −1).
2
0 %
0 %
20 %
0 %
10 %
20 %
10 %
40 %
0 %
(iii)|X
(X, Y )
ist gleichverteilt auf dem Quadrat mit Eckpunkten
(1, 1), (1, −1), (−1, 1),
Bestimme die Wahrscheinlichkeiten folgender Ereignisse
√
2
2 ,
+Y2 <
− Y > 0,
(ii)3X
+Y|<
Gegeben
X1
1
2.
und
X2
mit der Wahrscheinlichkeitsfunktion
(x1 , x2 )
p(x1 , x2 )
(0, 0)
(0, 1)
(1, 0)
(1, 1)
(2, 0)
(2, 1)
2
18
2
18
2
18
5
18
4
18
3
18
Berechnen Sie die Randverteilungen und die bedingten Erwartungswerte!
1.33
x3 = 6
Give another bivariate distribution such that the covariance in example 1.29 vanishes (is 0).
(i)X
1.32
X = xi ,
Y = yi
y1 = 2
y2 = 5
y3 = 7
Eine Dichtefunktion ist gegeben durch
(
f (x, y) =
(i)Berechne die Konstante
c(x2 + 2y)
0
für
0 ≤ x ≤ 2, 0 < y < 1
sonst.
c.
(ii)Berechne die Randverteilung von
X.
(iii)Berechne die gemeinsame Verteilungsfunktion von
(iv)Berechne die Dichtefunktion der Zufallsvariablen
X
und
Y.
Z = 3/(X + 1)2 .
1
1.34
WAHRSCHEINLICHKEITSVERTEILUNGEN
8
Eine Dichtefunktion sei gegeben durch
f (x, y) =
(i)Berechne die Konstante
c(x3 + 2xy)
0
0 ≤ x, y ≤ 2,
sonst.
c.
(ii)Berechne die Randverteilung von
X.
(iii)Berechne die gemeinsame Verteilungsfunktion von
X
und
Y.
(iv)Berechne den bedingten Erwartungswert und die bedingte Varianz von
1.35
Y
wenn
X = 1.
P X 2 < Y < X falls X und Y
(
x
,
0 ≤ x < 1, 0 ≤ y < 4,
f (x, y) = 2
0
sonst
Berechne die Wahrscheinlichkeit
als gemeinsame Dichte haben.
1.36
Die gemeinsame Dichte von
1.37
Die (zufällige) Lebensdauer eines Geräts sei durch
1
28 (4x1 + 3x2 ), 0
Berechnen Sie den bedingten Erwartungswert und die bedingte Varianz von
X > x0
an der Stelle
x0
X1
und
X2
sei
f (x1 , x2 ) =
X
< x1 < 2, 0 < x2 < 2.
X2 gegeben X1 = x1 .
gegeben. Die bedingte Dichte von
X
gegeben
nennt man Hazardfunktion.
(i)Berechnen Sie die Hazardfunktion für
X
mit der Dichte
f
und der Verteilungsfunktion
(ii)Wie lautet die Hazardfunktion der Exponentialverteilung? (Dichte
f (x) = 3e
−3x
,
F.
x ≥ 0.) Berechne
P (X > 3|X > 1).
1.38
f (x1 |x2 ) = c1 x1 /x22 , 0 < x1 < x2 , 0 < x2 < 1, Null sonst, und f2 (x2 ) = c2 x42 , 0 < x2 < 1,
sonst, die bedingte Dichte von X1 gegeben X2 und die Randdichte von X2 .
Seien
(i)Bestimmen Sie
c1
und
c2 .
(ii)Wie lautet die gemeinsame Dichte von
(iii)Berechnen Sie
P
1
4
Null
< X1 <
1
2 |X2
=
5
8
X1
)
und
und
P
X2 ?
1
4
< X1 <
1
2 .
1.39 Faltung
X und Y seien unabhängige Zufallsvariablen mit den Dichten fX und fY . Geben Sie die
fX+Y (z) für die Zufallsvariable Z := X + Y an! Man schreibt auch oft fX ∗ fY := fX+Y .
Dichte für
1.40 Die Faltung von Normalverteilungen.
Wie ist
X +Y
verteilt, wenn
2
X ∼ N µX , σX
und
Y ∼ N µY , σY2
?
1.41 Die Faltung von Cauchy-Verteilungen ist Cauchy
Es sei
f (x) =
1
π(1+x2 ) die Dichte einer Zufallsvariablen
(i)Berechne den Erwartungswert von
X1 +X2
(ii)Man nde die Dichte von
2
X1
und
X2 .
X1 .
= Z (X1 , X2
unabhängig).
Cauchy-Verteilung
1
1.42
WAHRSCHEINLICHKEITSVERTEILUNGEN
9
Unter den Angaben der letzten Aufgabe: Berechne die Dichte von
X1 − X2 .
1.43 Die Faltung von Exponential und Erlang-Verteilungen
Angenommen
X1 , . . . , Xn
sind unabhängig und exponentialverteilt mit der Dichte
(i)Welche Dichte hat dann
(ii)Berechnen Sie
1.44
Pn
i=1
Xi ?
1 −x/λ
λe
Erlang-E
x, λ > 0.
(n, λ)Verteilung
E (n, λ) ∗ E (m, λ)
Zeigen Sie für unabhängige Poisson-verteilte Zufallsgröÿen mit Parametern
λ
und
µ:
X ∼ P (λ), Y ∼ P (µ) ⇒ X + Y ∼ P (λ + µ).
1.45 Charakteristische Funktion
Mit
χX (t) := EeitX
bezeichnet man die charakteristische Funktion der Zufallsvariablen
(i)Zeigen Sie, dass
(ii)Zeigen Sie, dass
χX+Y (t) = χX (t) · χY (t),
χX
t
n
n
X
und
Y
unabhängig sind.
χλX (t) = χX (λt),
(iii)Verizieren Sie die Taylorentwicklung
(iv)Für eine Folge
falls
X.
X , Xi
χX (t) = 1 + itEX −
t2
2
2 EX
+ O t3
.
unabhängiger und gleichmäÿig verteilter Zufallsvariablen ist
χ n1 Pni=1 Xi (t) =
.
(v)Zeigen Sie, dass für
t2
Pn
n
(vi)Auch für die Zufallsvariable
2
(t) → e− 2 EX .
t2 2
Z ∼ N 0, σ 2 gilt χZ (t) = e− 2 σ .
EX = 0, χ √1
i=1
Xi
1.5 Absolutstetigkeit
1.46
Betrachte die Maÿe
P1 , P2 , P3 die jeweils die Standardnormalverteilung, die Gleichverteilung auf [0, 1]
0, 21 beschreiben. Sei weiters P4 das zur Poissonverteilung mit λ = 1
und die Gleichverteilung auf
gehörige Maÿ.
Betrachte jeweils eines der angegebenen Maÿe und bestimme, welche der Maÿe
(Pi
Pj )
P1 , . . . , P 4
absolutstetig
und welche singulär (weder/noch ist auch möglich!) bezüglich des betrachteten Maÿes ist.
1.47 Gestutzte Verteilung.
Angenommen
X
ist normal
N (µ, σ 2 )
verteilt.
(i)Berechne die bedingte Verteilungsfunktion von
X,
gegeben
a ≤ X ≤ b. (a
und
b
sind beliebige
Konstanten.)
(ii)Ermittle aus der bedingten Verteilungsfunktion die bedingte Dichtefunktion von
X ≤ b.
1.48
(iii)Berechne den bedingten Erwartungswert von
X,
gegeben
0 ≤ X ≤ 1.
(iv)Berechne den bedingten Erwartungswert von
X,
gegeben
X ≥ 0.
Löse Aufgabe 1.47 falls
X
gleichverteilt auf
[−2, 2]
ist.
X,
gegeben
a≤
1
1.49
WAHRSCHEINLICHKEITSVERTEILUNGEN
10
Für einen nicht fairen Würfel seien die Wahrscheinlichkeiten 1, 2, 3, 4 oder 5 zu würfeln jeweils
zufällige Variable
X
1
7 . Die
gebe die Augenzahl an.
(i)Deniere für dieses Beispiel den Wahrscheinlichkeitsraum.
(ii)Zeichne die Verteilungsfunktion von
(iii)Sei
λ
das Lebesgue Maÿ auf
R.
X.
µ λ,
Was ist richtig:
λ µ?
Erklärung!
(iv)Berechne mittels der erzeugenden Funktion Erwartungswert und Varianz.
1.50 Sigmaalgebren.
(i)Ist die Familie aller oenen Mengen von
(ii)Sei
A
eine
σ -Algebra?
eine
R
σ -Algebra und µ ein Wahrscheinlichkeitsmaÿ auf A.
A, B ∈ A und A ⊂ B dann gilt µ(A) ≤ µ(B).
Zeige: Wenn
1.51
Eine zufällige Variable
X
sei gleichverteilt im Intervall
(i)Bestimme Verteilungsfunktion und Dichte von
X
[0, 2].
und berechne anschlieÿend Erwartungswert und
Varianz.
(ii)Sei
1.52
Y := X 2 ,
berechne die Dichte der zufälligen Variable
Berechne Mittelwert und Standardabweichung der folgenden Verteilung:
F (x) =


Hinweis: Skizziere zuvor
1−e
F (x).
Sei die zufällige Variable
µ
X
und Standardabweichung
standardnormalverteilt, und die Variable
σ.
(i)Zeige die Äquivalenz von
(ii)Berechne die Dichte von
1.54
Seien
X
und
Y
x ≤ 0,
0 < x ≤ 1,
x > 1.
0
1+x2
4
−x

1.53
Seien
PX
PX
PX
und
und
PY
bezüglich
PY
und die Dichte von
(ii)Berechne den Erwartungswert von
eine
R.
PY
bezüglich
PX .
s ≤ 0,
s > 0.
0
e−s
(i)Bestimme die Wahrscheinlichkeitsdichte der Variable
X
normalverteilt mit Mittelwert
unabhängige zufällige Variable, jeweils mit Dichte
Es sei
Y
die Maÿe der entsprechenden Verteilungen auf
PY .
f (s) =
1.55
Y.
N (0, 1)
ungerade Funktion (g
Bestimmen Sie die durch
g
Y /X .
g :R→R
eine stetige streng monoton wachsende
mit
lim g(x) = ∞,
x→∞
p
Z.
verteilte Zufallsvariable und
(−x) = −g (x))
Z :=
lim g(x) = −∞ .
x→−∞
erzeugte Gruppenfamilie.
1
1.56
WAHRSCHEINLICHKEITSVERTEILUNGEN
Seien
X1
und
X2
unabhängige, identisch verteilte Zufallsvariablen mit Dichte
(
f (x) =
Zeigen Sie, dass
Hinweis:
11
Y1 = X1 + X2
und
Y2 =
e−x
0
für
x ≥ 0,
sonst.
X1
X1 +X2 unabhängig sind.
Berechnen Sie die gemeinsame Dichte von
Y1
und
Y2 ,
sowie die beiden zugehörigen Rand-
dichten. Beim Lösen eines nichtlinearen Gleichungssystems ist es mitunter sinnvoll, Gleichungen zu
manipulieren anstatt zu addieren.
1.57
Bestimmen Sie Mittelwert und Varianz einer Zufallsvariablen
X
mit Verteilungsfunktion
2
F (x) = x · 1(0, 1 ) (x) + 1[ 1 ,2) (x) + 1[2,∞) (x) ,
2
3 2
wobei
1A
die Indikatorfunktion der Menge
A
bezeichnet.
1.6 Erzeugende Funktionen
1.58
Sei
X
eine diskrete Zufallsvariable mit
(i)Zeigen Sie, dass
G(s) =
∞
P
pk sk
pk = P(X = k), k = 0, 1, 2, . . .
(erzeugende Funktion) für
und
|s| ≤ 1
∞
P
pk = 1.
k=0
existiert (d.h. endlich ist).
k=0
(ii)Wie hängen die Momente von
X
mit den höheren Ableitungen von
G
an der Stelle
1
zusammen?
G0 (1) =? G00 (1) =?
G, sowie Erwartungswert und Varianz für die geometrische
pk = p(1 − p)k , k = 0, 1, 2, . . ..
geometrische-Verteilung
(iii)Berechnen Sie die erzeugende Funktion
Verteilung:
1.59
Berechnen Sie den Erwartungswert und die Varianz der Poisson-Verteilung mit Parameter
pk = e−λ
λk
, k = 0, 1, 2, . . .
k!
mittels der erzeugenden Funktion.
1.60
Gegeben seien zwei Zufallsgröÿen
X
und
Y
mit gemeinsamer Dichte
√
f (x, y) =
Ermittle die Korrelation zwischen
X
5 − 1 (x2 −√3xy+2y2 )
e 2
,
4π
und
−∞ < x, y < ∞.
Y!
Hinweis: Welche bekannte bivariate Verteilung hat (X, Y )?
1.7 Transformation von Zufallsvariablen
1.61
X
sei gleichverteilt auf
π π
−2, 2 .
Man bestimme die Dichte von
Y = tan X .
λ:
1
1.62
WAHRSCHEINLICHKEITSVERTEILUNGEN
Angenommen
von
X
log (X − a)
12
sei normalverteilt mit Mittel
µ
und Varianz
Zeigen Sie, dass die Dichte
gegeben ist durch:
(
1 √
e−
σ(x−a) 2π
f (x) =
[log(x−a)−µ]2
2σ 2
x > a,
x ≤ a.
0
1.63
σ2 .
Beschreiben Sie die
(i)Dichte,
(ii)Erwartungswert und Varianz
der Log-Normal-Verteilung
1.64
M
Zeigen Sie, dass für
2
eN (µ,σ ) .
Log-Normal-Verteilung
unabhängige,
Variablen
Sr =
exp(λ)-verteilte
r
X
Zk /
k=1
M
X
Zj ,
Zufallsvariablen
Z1 , . . . , Z M
die transformierten
r = 1, . . . , M − 1
j=1
eine Dichte der folgenden Form besitzen:
g(s1 , s2 , . . . , sM −1 ) = (M − 1)!
für
0 ≤ s1 ≤ s2 ≤ . . . ≤ sM −1 ≤ 1
Hinweis: Betrachten Sie zunächst die Zufallsvariablen V1 = Z1 , V2 = Z1 + Z2 , . . . ,
VM = Z1 + . . . + ZM , führen Sie dann eine zusätzliche Zufallsvarible SM = VM ein und bestimmen
g(s1 , . . . , sM −1 ) durch Herausintegrieren von SM aus der gemeinsamen Dichte von S1 , . . . , SM .
Sie
1.65 Transformationssatz für Dichten
Bezeichne
fX
die Dichte der Zufallsvariablen
fg(X) (y) = fX g
−1
X
bzw.
fg(X)
die Dichte von
Y := g (X).
Zeige, dass
0
(y) g −1 (y).
NB: In höheren Dimensionen ist
g −1
0
die Jakobimatrix und
|.|
die Determinante.
1.66 Erzeugung von Zufallsvariablen
Wie kann man Bsp. 1.65 einsetzen, um eine Zufallsvariable mit gegebener Verteilungsfunktion
F
zu
erzeugen?
1.67
Erzeugung normalverteilter Zufallsvariablen
Seien
U
und
V
unabhängig gleichverteilt auf dem Intervall
X=
Y =
√
√
(0, 1).
Zeigen Sie, dass
−2 ln U · cos(2πV )
−2 ln U · sin(2πV )
unabhängig und standardnormalverteilt sind.
1.68
Eine Alternative zu Aufgabe 1.67, die approximativ standard-normalverteilte Zufallszahlen liefert, funktioniert folgendermaÿen:
Erzeuge 12 Zufallszahlen
Ui ,
(i)Begründen Sie, warum
die gleichverteilt auf
X
[0, 1]
sind, und berechne dann
X :=
P12
i=1
Ui − 6.
annähernd normalverteilt ist!
(ii)Diskutieren Sie Vor- und Nachteile im Vergleich mit Bsp. 1.67 und 1.65.
(iii)Untersuchen Sie, wie gut (oder schlecht) die Approximation ist, indem sie die ersten vier Momente
EX , EX 2 , EX 3
und
EX 4
mit jenen der Standardnormalverteilung vergleichen.
1
1.69
WAHRSCHEINLICHKEITSVERTEILUNGEN
Die
13
n-dimensionale Zufallsvariable X sei normalverteilt mit Mittelwertsvektor µ und Varianz-KovarianzΣ. Berechnen Sie die Dichte von Y := CX + d, wobei C eine nichtsinguläre n × n-Matrix ist.
Matrix
(i)Welche Verteilung hat
C
Y , wenn X
(ii)Welche Kovarianzmatrix hat
Σ
von
1.70
X
unabhängige standardnormalverteilte Komponenten
Xi
hat und
orthogonal ist?
χ2 (n)-verteilt
Y X
/n.
F =m
sei zentral
variablen
Hinweis:
Y,
C
wenn
die transponierte Matrix der normierten Eigenvektoren
ist?
Y
und
sei nichtzentral
χ2λ (m)-verteilt.
Berechnen Sie die Dichte der Zufalls-
1
xn/2−1 e−x/2 ,
2n/2 Γ(n/2)
∞
X
(λ/2)k
f(χ2m+2k ) (y).
fχ2λ (m) (y) =
e−λ/2
k!
fχ2 (n) (x) =
k=0
1.71
Seien
X1
und
X2
unabhängig
χ2 (2)verteilt.
Bestimmen Sie die Dichte von
Y1 = 21 (X1 − X2 ).
Hinweis: Für die Dichten von X1
Y2
Zufallsvariable
von
Y1
und
Y2 .
und
X2
siehe den Hinweis zu Bsp. 1.70. Führen Sie eine geeignete
ein und berechnen Sie die Dichte von
Y1
als Randdichte der gemeinsamen Verteilung
Beachten Sie die Integrationsgrenzen!
1.8 Ordnungsstatistik
1.72
Seien
X1 , . . . , Xn
unabhängige auf
[0, 1]
gleichverteilte Zufallsgröÿen. Welche Verteilungsfunktion und
welche Dichte hat
(i)X(1)
(ii)X(n)
:= min (X1 , . . . , Xn ),
:= max (X1 , . . . , Xn )?
Wogegen konvergiert
1.73
Es seien
Xi
n
λ X(1) in Verteilung, wenn
n → ∞?
unabhängig. Zeigen Sie für die Ordnungsstatistik
X(0) ≤ X(1) ≤ . . . X(n) :
Pn
j+1
n−j
FX(k) (z) = P X(k) ≤ z = j=k n+1
· (1 − F (z))
,
j+1 F (z)
k
n−k
n
fX(k) (z) = (n + 1) k F (z) · f (x) · (1 − F (z))
.
(i)Die Verteilungsfunktion ist
(ii)die Dichte ist
Interpretieren Sie die Gleichungen!
1.74
n
1
1
i=1 1{Xi ≤t} = n
n
(der Ordnung n), das dazugehörige Maÿ ist P
Die Funktion
Fn (t) :=
P
(i)Begründen Sie, warum (für festes
Pn
=
1
(X ) heiÿt empirische Verteilungsfunktion
i=1
P(−∞,x) i
1
δ
.
X
Xi
i seien iid. mit Verteilungsfunktion F (x)
n
x) Fn (x)
binomialverteilt ist mit Parameter
p = P [X ≤ x] =
F (x);
√
D
n (Fn (x) − F (x)) −→ N (0, F (x) (1 − F (x))) (Konvergenz in Verteilung, CLT);
√
√
(iii)Die Kovarianz von
n (Fn (x1 ) − F (x1 )) und n (Fn (x2 ) − F (x2 )) ist F (x1 ∧ x2 )−F (x1 )·F (x2 ).4
(ii)Zeigen Sie, dass
Ist die Korrelation positiv oder negativ?
4 x ∧ x = min {x , x }.
1
2
1
2
1
WAHRSCHEINLICHKEITSVERTEILUNGEN
14
1.75 Satz von Kolmogorov
Unter recht allgemeinen Voraussetzungen gilt
h√
i
2
(n)
n supx∈R FX (x) − FX (x) ≤ z = 1 − e−2z bzw.
i
h√
P∞
2 2
(n)
k
(ii)limn→∞ P
n supx∈R FX (x) − FX (x) ≤ z = 1 + 2 k=1 (−1) e−2k z .
(i)limn→∞
P
Interpretieren Sie die Aussage und geben Sie die Quantile für
α =90
%, 95 %, 99 %, 99,5 % und 99,9 %
an. Bringen Sie die empirische Verteilungsfunktion ferner mit den Ordnungsstatistiken Beispiel 1.73 in Verbindung.
1.9 Konvergenz von Zufallsfolgen
1.76
Zeigen Sie, dass die unten angeführten Folgen von Zufallsgröÿen zwar in Wahrscheinlichkeit, aber nicht
fast sicher konvergieren.
(i)Die Folge von unabhängigen Zufallsgröÿen
(ii)Sei
1.77
1.78
Pn
Ω = [0, 1], rn = ( i=1 1i )mod1
P
(
1
Xn (ω) =
0
Betrachte die zufälligen Variablen
und
Xn = 2 +
X1 , X2 , . . . mit P (Xn = 1) =
P (Xn = 0) = 1− n1 .
das Lebesgue-Maÿ.
auf
rn , min rn + n1 , 1 ,
sonst.
1
n und
(i)Konvergiert
Xn
in Verteilung gegen
(ii)Konvergiert
Xn
fast sicher gegen
(iii)Konvergiert
Xn
in Wahrscheinlichkeit gegen
Diskutiere die folgenden Fragen
1
n und
X = 2.
Diskutiere die folgenden Fragen:
X?
X?
X?
generell für Zufallsvariablen:
(i)Konvergiert
Xn
in Verteilung gegen
X?
(ii)Konvergiert
Xn
fast sicher gegen
(iii)Konvergiert
Xn
in Wahrscheinlichkeit gegen
X?
X?
1.79 Stichprobenmittel
Pn
1
i=1
n
tisch verteilt, Zeigen Sie, dass
Die Zufallsvariable
X̄n :=
X̄n = E [X],
1
(ii)var X̄n =
n var [X] = O
Xi
heiÿt
Stichprobenmittel. Seien
Xi
(und
X)
unabhängig und iden-
(i)E
1
n .
1.80 Stichprobenvarianz mit Bessel-Korrektur
Die Statistik
Sn2 :=
Wie oben seien
1
n−1
X , Xi
Pn
i=1
Xi − X̄n
2
heiÿt
(korrigierte) Stichprobenvarianz.
unabhängig und identisch verteilt. Zeige
2
Sn = varX ,
2
1
(ii)var Sn =
n µ4 −
(i)E
n−3 4
n−1 σ
=O
1
n , wobei
h
i
4
µ4 = E (X − E [X])
und
h
i
2
σ 2 = E (X − EX) .
1
WAHRSCHEINLICHKEITSVERTEILUNGEN
15
1.81 Stichprobenvarianz mit Bessel-Korrektur
2
2
(n1 −1)Sn
+(n2 −1)Sn
1
2
(Erwartungstreue) resultierend aus zwei
n1 +n2 −2
σ2 =
n1 bzw. n2 .
(i)Diskutieren Sie den Schätzers
Stichproben vom Umfang
(ii)Gilt auch
1.82
Zeigen Sie für
E [Sn ] =
N µ, σ 2
√
varX ?
verteilte Zufallsvariablen:
•X̄n und Sn2 sind unabhängig,
Pn Xj −µ 2
∼ χ2n , wobei fχ2 (x|n) =
• j=1
σ
2
•X̄n ∼ N µ, σn ,
n
x
x 2 −1 e− 2
n
2 2 Γ( n
2)
χ2 -Verteilung
mit n Freiheitsgraden
2
2
• n−1
σ 2 Sn ∼ χn−1 ,
√ n
• n X̄
S 2 ∼ tn−1 ,
wobei
n
Γ( n+1
2 )
√
nπΓ( n
2)
ft (x|n) =
1+
x2
n
− n+1
2
Student's t-Verteilung mit n
Freiheitsgraden
1.83
Es seien
X1 . . . Xn ∼ N (µX , σX )
•F :=
und
p
und
Fisher F-Verteilung
q
(n − 1)
und
(m − 1)
Freiheitsgraden. Die Dichte der F-Verteilung
Freiheitsgraden ist
fF (x|p, q) =
Zeigen Sie, dass für den Erwartungswert
1.84
unabhängige Zufallstichproben, dann hat
SX /σY
SY /σY
eine Fisher-Snedecor-Verteilung mit
mit
Y1 . . . Yn ∼ N (µY , σY )
Zeigen Sie, dass die
χ2 -Verteilung
eine
Γ
Γ
p
2
p2
p
q
q
Γ 2
p+q
2
EFp,q =
p
x 2 −1
.
p+q
2
1 + x pq
q
1
q−2 gilt. Weiters, dass Fp,q
Γ-Verteilung
∼ Fq,p
gilt.
ist (vgl. Bsp. 4.20).
1.85 Stichprobenkorrelationskoezient
Die Statistik
(n)
RX,Y :=
1
n−1
Pn
√i=12 (
Xi −X̄n )(Yi −Ȳn )
√
Sn (X)·
heiÿt Stichprobenkorrelationskoefzient. Zeigen Sie:
2 (Y )
Sn
h
i
(n)
RX,Y = 0,
(n)
1
,
(ii)var RX,Y
= n−1
(i)E
(iii)Für
1.86
X, Y
normalverteilt ist
√
(n)
n − 2q
RX,Y
(n)2
1−RX,Y
∼ tn−2 .
Berechnen Sie Mittelwert und Varianz (Standardabweichung) der
χ2n -Verteilung
und der
tn -Verteilung.
2
BINÄRE EXPERIMENTE
16
1.87 Die Formeln von Wald
Es seien
(i)Xi ,
N
vollständig unabhängig und quadratisch integrierbar,
(ii)Xi (und
(iii)P [N
X)
identisch verteilt und
∈ N] = 1.
Deniere die Zufallsvariable
(i)E [Z]
(ii)varZ
2
Z := X1 + X2 + . . . XN
und zeige
= E [X] · E [N ],
= varX · EN + (EX) 2 · varN .
Binäre Experimente
Ziele:
•
Einen sinnvollen Stichprobenraum zu einem statistischen Problem nennen können.
•
Randomisierte Testfunktionen beschreiben und erklären können.
•
Welche Bedeutung hat die Randomisierung in Theorie und Praxis?
•
Berechnung des Fehlers erster und zweiter Art und der Güte in einfacheren Beispielen. Wahl der
Randomisierung, sodass ein bestimmter Fehler erster Art erzielt wird.
2.1
Geben sie jeweils einen sinnvollen Stichprobenraum zu den unten angeführten Testproblemen an. Welche
σ Algebren
könnte man auf den Stichprobenräumen dann wählen?
(i)Eine Münze wird 5 mal geworfen. Die Nullhypothese, dass Kopf und Zahl gleich wahrscheinlich
sind, soll getestet werden.
(ii)Um zu testen ob die mittlere Lebensdauer von Bildröhren mindestens 10000 Stunden beträgt wird
die Lebensdauer von 20 Testbildröhren gemessen.
2.2
Betrachten Sie die Nullhypothese aus Beispiel 2.1 i) und die Alternative, dass der Anteil von Kopf (p)
gleich
0.7
ist. Wie lauten die Verteilungen
P
und
Q
zu diesem binären Experiment?
Finden Sie einen (gegebenenfalls randomisierten) Test für den die Wahrscheinlichkeit eines Fehlers 1.
Art
2.3
0.05
ist.
In einer Urne benden sich Lose einer Lotterie auf denen die Namen der Teilnehmer(innen) vermerkt
sind. Wir wollen testen, ob der Anteil der Männer, die Lose einsenden, gleich dem Anteil der Frauen ist,
oder ob der Männeranteil (wie bei einer vergleichbaren ausländischen Lotterie)
0.4 beträgt. Dazu werden
8 Lose (ohne Zurücklegen) gezogen und notiert wie viele davon von Männern stammen. Wir wollen
die notierte Anzahl mit
P
und
Q
von
T
T
bezeichnen. Formulieren Sie
H0
und
H1
als unterschiedliche Verteilungen
und konstruieren Sie dann einen (gegebenenfalls randomisierten) Test für den die
Wahrscheinlichkeit eines Fehlers 1. Art 5% beträgt. Welchen Fehler 2. Art hat dieser Test?
2
2.4
BINÄRE EXPERIMENTE
17
Ein Würfel wird dreimal geworfen. Die Ergebnisse werden mit
X1 , X2 , X3
bezeichnet. Wir betrachten
zwei Hypothesen über die Verteilung der Würfelergebnisse:
P : P ({1}) = · · · = P ({6}) =
Q : Q({1}) = · · · = Q({5}) =
Wir wollen
H0 : P ⊗3
gegen
H1 : Q⊗3
1
6
4
, Q({6}) = 1/5
25
testen und betrachten dazu die Zufallsgröÿe
N (X1 , X2 , X3 )
die
die Anzahl der gewürfelten Sechsen angibt. Berechnen Sie für die folgenden Testfunktionen jeweils den
Fehler erster Art und den Fehler zweiter Art.
(i)
(
1
Φ1 (X1 , X2 , X3 ) =
0
falls
N (X1 , X2 , X3 ) = 1
sonst.
(ii)
Φ1 (X1 , X2 , X3 ) =


1
falls
49
 75
falls

0
N (X1 , X2 , X3 ) = 3
N (X1 , X2 , X3 ) = 2
sonst.
(iii)
(
1
Φ1 (X1 , X2 , X3 ) =
0
falls
N (X1 , X2 , X3 ) = 3
sonst.
(iv)
Φ1 (X1 , X2 , X3 ) =

1

8
1
5

2.5
0
falls
falls
N (X1 , X2 , X3 ) = 6
N (X1 , X2 , X3 ) = 6, X3 6= 6
sonst.
Eine Münze wird 5 mal geworfen. Die Nullhypothese, dass Kopf und Zahl gleich wahrscheinlich sind, soll
getestet werden. Finden Sei einen (gegebenenfalls randomisierten) Test, für den die Wahrscheinlichkeit
eines Fehlers 1. Art 10 % ist.
2.1 Neyman-Pearson Tests
Ziel: Optimale Tests bei gegebenem Fehler erster Art für binäre Experimente angeben können.
2.6
Von einer Gattung der Familie der
Asteracae wachsen auf den Inseln der Ägäis zwei nahe verwandte
Arten, die sich in der Länge des Blütenstiels und der Anzahl der Haare auf den Blättern unterscheiden.
Die Unterscheidung zwischen den Arten wird aber durch die individuelle Variation innerhalb der Art
µA,1 = 9.4
σ12 = 5.5 cm2 .
erschwert: Die Länge der Blütenstiele ist normalverteilt, wobei bei Art A
µB,1 = 10.2
cm beträgt. Die Varianz beträgt bei beiden Arten
Die Anzahl der Haare auf einer Blattäche von
A ist
µA,2 = 48
während bei Art B
µB,2 = 61
1 cm2
cm und bei Art B
ist ebenfalls (annähernd) normalverteilt: Bei Art
beträgt. In beiden Fällen ist
σ22 = 34.
Weiters kann man
annehmen, dass die Merkmale Blütenstiellänge und Haarzahl voneinander unabhängig sind.
Biologen wollen nun testen, ob auf einer noch nicht untersuchten Insel Art A oder Art B vorkommt.
(Aus Erfahrung ist bekannt, dass niemals beide Arten gleichzeitig auf einer Insel vorkommen, da Art A
genetisch vitaler ist und Art B verdrängen würde.)
Da auf den meisten benachbarten Inseln Art A vorkommt, wird als Nullhypothese Art A kommt vor
gewählt. Wie entscheidet der optimale Test zum Niveau
α = 0.05, wenn auf der betreenden Insel bei
9.7 cm und eine mittlere Anzahl von 36
30 gesammelten Individuen eine mittlere Blütenstiellänge von
Haaren beobachtet wurde?
2
2.7
BINÄRE EXPERIMENTE
X1 , . . . , Xn
18
N (µ, σ 2 )
seien unabhängige
verteilte Zufallsgröÿen. Finden Sie den optimalen Test zu den
Hypothesen:
H0 : σ 2 = σ02
H1 : σ 2 = σ12
(σ12 > σ02 )
2.8
ist bekannt.
)
[0, 1] oder einer Dreiecks[0, 1] verteilt ist (Dreiecksverteilung: g(x) = 4x für 0 ≤ x ≤ 12 , g(x) = 4−4x für 21 ≤ x ≤ 1).
konstruiere den besten Test für α = 5% auf Grund einer Beobachtung.
Es sei
X
(µ
eine Zufallsvariable, die entweder nach einer Gleichverteilung in
verteilung in
Man
2.9
F (x; λ) = λ1 e−x/λ , 0 < x < ∞. Basierend auf einer Zufallsstichprobe
vom Umfang 2 soll die einfache Hypothese H0 : λ = 1 gegen die einfache Alternativhypothese H1 : λ =
3/2 getestet werden. Der kritische Bereich des Tests ϕ sei (x1 , x2 ) : 5.5 ≤ x1 + x2 < ∞.
Die Dichte der Zufallsvariablen sei
(i)Bestimmen Sie Fehler erster und zweiter Art des Tests
(ii)Bestimmen sie die Gütefunktion des Tests
(iii)Ist
(iv)Sei
ϕ
mit obigem kritischen Bereich.
mit obigem kritischen Bereich.
unverfälscht?
α
die Wahrscheinlichkeit eines Fehlers 1. Art für
Niveau
2.10
ϕ
ϕ
α
für die Hypothese
H0 : λ ≤ 1
ϕ.
Ist
ϕ
ein gleichmäÿig bester Test zum
gegen die Alternativhypothese
H1 : λ > 1?
Von einer archäologischen Ausgrabung soll das Alter bestimmt werden; es existieren 2 Expertenmeinungen:
H0 :
H1 : Alter 6.000 Jahre. Durch die Messung der Radioaktivität soll
H0 zutrit, ist die Anzahl der pro Minute emittierten Teilchen nach
H1 nach Poisson mit λ = 3/2. Man berechne die Fehler 1. und 2. Art
Alter 5.000 Jahre und
das Alter festgelegt werden. Falls
1
2 verteilt, unter
für den Test, bei dem für H0 entschieden wird, falls weniger als 1 Teilchen pro Minute gezählt wird. Wie
Poisson mit
λ=
lange muÿ man zählen, damit die Wahrscheinlichkeit
H1
fälschlicherweise abzulehnen, kleiner als
0.005
ist?
Hinweis: zählt man n Minuten, gilt unter H0 : λ = n/2, unter H1 : λ = 3n/2).
(
2.11
X1 , . . . , Xn
seien unabhängig mit der Dichte
I[0,1] (x)
(unter
1
I[θ,θ+2] (x)
2
(unter
(i)Geben Sie einen optimalen (randomisierten)
(ii)Wie sieht
h(α) =
(iii)Angenommen
1 beträgt?
´
ϕα dQ
α = 0.025.
H0 )
und
H1 ) (θ = 1/8) .
α-Niveau
Test an.
aus? Zeichnen Sie die Funktion für
Wie groÿ muÿ
n
α ∈ [0, 1]
und
n = 3!
mindestens gewählt werden, damit die Macht des Tests
2
2.12
BINÄRE EXPERIMENTE
Es seien
X1 , . . . , Xn
19
E (λ),
unabhängige exponentialverteilte Zufallsvariablen mit Dichte
Exponential-Verteilung
1 −x/λ
e
λ
x, λ > 0.
(i)Man bestimme den trennscharfen Test für die Hypothese
H1 : λ = λ 1
falls
λ1 < λ0
und
(ii)Bestimmen Sie den kleinsten Stichprobenumfang bei
Macht mindestens
2.13
0.95
gegen die Alternative
α = 0.05, λ1 = 500, λ0 = 700,
wenn die
sein soll.
P die Gleichverteilung auf (−2, 2) (Dichte f (x)) und Q die Standardnormalverteilung N (0, 1) (Dichte
g(x)). Man möchte testen, ob X nach P oder nach Q verteilt ist.
Sei
(i)Wie lautet der Neyman-Pearson Test für
X
(ii)Für welche Werte von
(iii)Zeichne den Dichtequotienten
Pearson Test zum Niveau
X1 , . . . , Xn
H0 : P
gegen
H1 : Q?
nimmt der Neyman-Pearson Test zum Niveau
an? Für welche Werte zum Niveau
2.14
H0 : λ = λ0
α = 0.01.
seien unabhängige
α=
α = 0.05 die Nullhypothese
α = 0.01?
g(x)
f (x) und markiere den Wertebereich von
0.05 die Nullhypothese annimmt.
N (µ, σ 2 )
X
für den der Neyman-
verteilte Zufallsgröÿen.
Wir betrachten die Hypothesen
H0 :µ = µ0 (Dichte f )
H1 :µ = µ1 (Dichte g)
(σ 2
ist bekannt,
µ1 > µ0 )
(i)Zeigen Sie, dass für den Likelihood-Quotienten gilt:
g(x1 , . . . , xn )
= exp
f (x1 , . . . , xn )
n
µ21 − µ20
µ1 − µ0 X
x
−
n
i
σ2
2σ 2
i=1
(ii)Für welche Werte des Likelihood-Quotienten lehnt ein bester
(iii)Berechnen Sie die die eziente Randfunktion für
ϕα
α-Niveau
!
.
Test
ϕα
ab?
aus b):
ˆ
h(α) =
Verizieren Sie, dass
(iv)Wie groÿ muÿ man
h0 (α)
n
ϕα dQ.
gleich dem kritischen Wert für den Likelihood Quotienten ist.
wählen, um bei
α = 0, 05
eine Güte
h(α) = 0, 95
zu erhalten?
Hinweis: Den ersten Teil der Lösung kann man dem Skriptum Bsp. 2.16 entnehmen.)
(
2.15
Angenommen eine Messung
X
dardnormalverteilt ist (Dichte
soll vorgenommen werden, von der man glaubt, dass sie entweder stan-
f (x)),
oder die Dichte
(i)Wie lautet der Neyman-Pearson Test zu
(ii)Finde alle Werte von
X ≤ d
g(x) =
H0 : X ∼ f
α für die der Annahmebereich
d als Funktion von α.
und bestimme
1
2
exp(−|x|)
gegen
hat.
H1 : X ∼ g .
die Form hat: Entscheide für
H0 ,
falls
−d ≤
2
2.16
BINÄRE EXPERIMENTE
20
Betrachte nun zu obigem Beispiel zwei (unabhängige) Beobachtungen mit den entsprechenden Verteilungen unter
(i
= 1, 2)
H0
und
mit Dichte
H1 , aber mit unbekanntem Mittelwert. Man kann das so formalisieren: Anstatt Xi
f oder g beobachten wir die Zufallsvariablen Yi = Xi + µ, wobei µ unbekannt ist.
(i)Welche möglichen Verteilungen hat dann
(Y1 , Y2 )
unter
H0
und welche unter
H1 ?
Bezeichnen wir
die beiden Mengen der möglichen Verteilungen (oder Wahrscheinlichkeitsmaÿe) mit
(ii)Finde eine Gruppe von Transformationen, bezüglich der
P0
und
P1
P0
und
P1 .
invariant sind und formuliere
das invariante Testproblem.
(iii)Ist obiges Testproblem ein Strukturmodell?
(iv)Finde eine maximalinvariante Statistik
hat
T
T
zur Transformationsgruppe aus b). Welche Bedeutung
bei der Konstruktion des gleichmäÿig besten invarianten Tests?
(v)Finde den gleichmäÿig besten invarianten Test.
2.17
Betrachte einen Test
Wenn
2.18
ϕ
ϕ
für
H0 : P
gegen
H1 : Q
mit Fehler erster Art
ein bester Test (Skriptum Def. 2.8) ist, dann gilt
H0 : P
Angenommem wir wollen einen schlechtesten Test für
Test
ϕ∗
schlechtesten Test, falls es keinen Test
ψ
α
und Fehler 2. Art
β.
Zeige:
α + β ≤ 1.
gegen
H1 : Q
nden. Wir nennen einen
gibt mit
ˆ
ˆ
ϕ∗ dP ≤
ψ dP,
ˆ
ˆ
∗
ϕ dQ >
und
ψ dQ.
(Vergl. mit der Def. 2.8 aus dem Skriptum für beste Tests.)
Zeige: Wenn
Niveau
2.19
ϕ
ein bester Test zum Niveau
1−α
ist, dann ist
ϕ∗ = 1 − ϕ
ein schlechtester Test zum
α.
(i)Wie lautet der schlechteste Test in 2.8? (Siehe Bsp. 2.18.) Zeichne die eziente Randfunktion
h(α) =
´
Funktion
ϕα dQ für´ den besten Test zum Niveau α aus Beispiel 2.8. Zeichne dann eine analoge
h∗ (α) = ϕ∗α dQ für die schlechtesten Tests ein und markiere den Bereich, der durch
beide Kurven begrenzt wird.
(ii)Welche Tests im markierten Bereich aus a) sind beste Tests?
(α, β) im markierten Bereich kann man einen Test mit Fehler erster Art α und
1 − β konstruieren. Finde ein Konstruktionsverfahren für solche Tests! Wie groÿ
n wählen, um bei α = 0, 05 eine Güte h(α) = 0, 95 zu erhalten?
(iii)Zu jedem Punkt
Fehler zweiter Art
muÿ man
Hinweis: Den ersten Teil der Lösung kann man dem Skriptum Bsp. 2.16 entnehmen.)
(
2.20
Löse Aufgabe 2.19, wenn die Alternative die Dichte
2.21
Manchmal ist die Hypothese von Interesse, dass Erwartungswert und Varianz von normalverteilten
g(x) = 3x2 (0 ≤ x ≤ 1)
hat.
Zufallsgröÿen in einem bestimmten Zusammenhang stehen. Wir betrachten daher Hypothesen der Form,
X1 , . . . , Xn
dass θ > 0.)
dass
für ein bestimmtes
a nach N (µ = θ, σ 2 = aθ) verteilt sind. (Natürlich setzen wir voraus,
X1 , . . . , Xn
Xi ∼ N (θ, 2θ))?
(i)Wie lautet der beste Test beruhend auf den Beobachtungen
a=1
(also
Xi ∼ N (θ, θ))
gegen
H1 : a = 2
(also
(ii)Angenommen die betrachteten Verteilungen sind von der Form
analog zu a) den besten Test für
H0 : a = 1
gegen
H1 : a = 2.
zu den Hypothesen
N (µ = θ, σ 2 = aθ2 ).
H0 :
Berechne
2
2.22
BINÄRE EXPERIMENTE
X1 , X2
H1 : θ = 1/8 zu
21
Angenommen
sind unabhängig und gleichverteilt auf dem Intervall
gegen
testen betrachten wir zwei Tests:
(
1
ϕ1 (X1 ) =
0
(
1
ϕ2 (X1 , X2 ) =
0
Berechne
C
sodass,
ϕ1
und
ϕ2
H0 : θ = 0
X1 > 0.95
sonst.
falls
X1 + X2 > C
sonst.
ϕ2
ist der Fehler zweiter Art kleiner als bei
ϕ1 .
(Mit der Konstanten
aus (a).)
(ii)Können Sie einen besseren Test als
2.23
Um
den gleichen Fehler erster Art haben.
(i)Beweise oder widerlege: Bei
C
falls
(θ, θ + 1).
X
Y = X 2θ
ϕ2
nden? (Mit gleichem oder kleinerem Fehler erster Art.)
f (x) = 1
Angenommen
hat die Dichtefunktion
riablen
liegt eine Beobachtung vor.
(i)Finde den besten Test zum Niveau
für
α = 0.1
0≤x≤1
für
und
H0 : θ = 1
f (x) = 0
gegen
sonst. Von der Zufallsva-
H1 : θ = 2
aufgrund dieser
Beobachtung.
(ii)Berechne den Fehler zweiter Art für diesen Test.
2.24
Es wäre ein Miÿbrauch von Tests zum Niveau
α, wenn man α so wählt (nachdem man die Daten gesehen
hat), dass die Nullhypothese auf jeden Fall abgelehnt (oder angenommen) wird. Um zu sehen was die
wahren Fehler erster und zweiter Art bei so einer Vorgehensweise sind, berechne
α−
und
β−
Fehler für
folgende triviale Tests:
(i)Lehne
H0
immer ab, egal welche Daten beobachtet wurden. (Äquivalent zur Praxis
α so zu wählen,
dass eine Ablehnung erzwungen wird.)
(ii)Nimm
H0
immer an, egal welche Daten beobachtet wurden. (äquivalent zur Praxis
α so zu wählen,
dass eine Annahme erzwungen wird.)
2.25
Eine Stichprobe
X1 , . . . , Xn
optimalen Test zum Niveau
2.26
wird einer
α = 0.05
für
N (µ, θ)-verteilten Population entnommen. Konstruiere
H0 : θ = 1 gegen die Alternative H1 : θ = 2.
einen
Von einer Population kennt man die Dichtefunktion
f (x, θ) =
wobei
θ > 0.
Basierend auf einer Stichprobe
(i)Konstruiere einen kritischen Bereich
Hinweis:
G
θxθ−1
0
X1 , X2
x ∈ [0, 1],
sonst,
wollen wir
zum Niveau
0.05
H0 : θ = 2
gegen
H1 : θ = 3
testen.
mit maximaler Power.
Der kritische Bereich besteht aus all jenen Ereignissen, die unter der Nullhypothese
abgelehnt werden. Die Gleichung
k 2 (1 − 2 log(k)) = 0.95
hat die näherungsweise Lösung
k = 0.84.
(ii)Berechne unter obigen Bedingungen die Güte der Alternative.
3
2.27
EINFACHE ALTERNATIVEN
22
Eine Zufallsgröÿe sei exponentialverteilt
(
f (x, θ) =
und
X1 , . . . , XN zufällige Stichproben.
H1 : θ = 2.
1 −x
θ
θe
x≥0
0
sonst
Finde den optimalen Test zu den Hypothesen
H0 : θ = 1
gegen
die Alternative
Hinweis: Mit Hilfe der Faltung berechnet man als ersten Schritt leicht die Dichte von X1 + X2 , ebenso
leicht als nächsten Schritt die Dichte von
2.28
Eine Zufallsvariable sei binomialverteilt
X1 + X2 + X3
und dann verallgemeinert für
B(n, θ).
(i)Konstruiere einen gleichmäÿig optimalen Test zum Niveau
gegen die Alternative
X1 + · · · + XN .
α
für die Hypothese
H0 : θ ∈ [0, θ0 ]
H1 : θ ∈ (θ0 , 1].
(ii)Führe folgendes Experiment durch: Wirf eine Münze mindestens 20 mal und notiere jeweils den
Ausgang (Kopf oder Zahl). Teste zum Niveau
und
α = 0.05
obige Hypothesen für
θ0 = 0.4, θ0 = 0.5
θ0 = 0.6.
2.2 Bayes Tests
2.29
Bei welchen Verlusten für die fälschliche Ablehnung von
H0
und
H1
ist der der Test aus 2.9 ein Bayes-
Test?
2.30
Bestimmen Sie den Bayes-Test zu Beispiel 2.8 für
λ = 1, λ = 0.4
und
λ = 0.5
und berechnen Sie jeweils
Fehler 1. Art und Fehler 2. Art. Interpretieren Sie den Zusammenhang zwischen
λ und den resultierenden
Fehlern erster und zweiter Art!
λ
Für welchen Wert von
hat der Bayes-Test aus 2.8 einen Fehler 1. Art von 5%? Wie groÿ ist dann der
Fehler 2.Art?
2.31
Löse Beispiel 2.30 für das Testproblem aus 2.13.
3
Einfache Alternativen
(Skriptum, Kapitel 3.)
Ziele: Erkennen der Struktur des Testproblems als Optimierungsproblem unter
Nebenbedingungen. Bei endlichem Stichprobenraum ist das auftretende Problem mit Methoden der
linearen Programmierung lösbar.
3.1
0 und 1. Wir betrachten drei VerteilungsP1 (1) = 0.6, P2 (1) = 0.2 und Q(1) = 0.5. Wir wollen zum Niveau
Beobachtung) die Hypothese H0 : P1 oder P2 gegen H1 : Q testen.
Ein Zufallsexperiment liefert die zwei möglichen Ergebnisse
hypothesen
α = 0.1
P1 , P2
und
(aufgrund einer
Q,
wobei
(i)Wie lautet das lineare Programm mit dem man den optimalen Test bestimmen kann?
(ii)Bestimme den optimalen Test!
3.2
Löse Beispiel 3.1 falls
P1 (1) = 0.3, P2 (1) = 0.4
und
Q(1) = 0.6.
4
3.3
ZUSAMMENGESETZTE ALTERNATIVEN
23
Betrachten Sie folgende Testprobleme für eine Binomialverteilung
H0 :
H1a : p =
1
8
1
1
≤p<
4
2
bzw.
zum Niveau
α:
1
3
<p≤ ,
2
4
oder
H1b : p =
B(1, p)
7
8
bzw.
H1c : p =
1
.
2
(i)Wie lauten die linearen Programme für die 3 Testprobleme?
(ii)Ermittlen Sie graphisch den jeweils besten Test.
αNiveau Tests gegen H1a und H1b
H 0 1a : p ∈ [0, 1/4) bzw. H 0 1b : p ∈ (3/4, 1] sind.
(iii)Verizieren Sie, dass die besten
Niveau Tests gegen
(iv)Finden Sie die zu
H1a
bis
H1c
auch gleichmäÿig beste
α
gehörigen ungünstigsten a-priori Verteilungen. (I.e. die Lösungen
der dualen Optimierungsaufgabe.)
4
Zusammengesetzte Alternativen
4.1 Begrie
Ziel: Begrie üben: Test zum Niveau α, unverfälscht, zulässig.
4.1
Unter den Annahmen von Beispiel 2.22 aber für die Hypothesen
(i)Prüfe ob
4.2
ϕ1
und
ϕ2
(mit C aus 2.22) Tests zum Niveau
(ii)Sind
ϕ1
und
ϕ2
unverfälschte Tests zum Niveau
(iii)Sind
ϕ1
und
ϕ2
zulässige Tests?
H0 : θ ≤ 0
α = 0.05
gegen
H1 : θ > 0:
sind!
α = 0.05?
Pθ mit Pθ ({1}) = · · · = Pθ ({5}) = θ, (Pθ ({6}) = 1 − 5θ) und dazu die
H0 : θ = 1/6, H1 : 1/10 < θ < 1/6. Betrachte nochmals die Tests ϕ1 , ϕ2 , ϕ3 aus Beispiel
Gegeben die Verteilungen
Hypothesen
2.4.
(i)Prüfe ob
(ii)Sind
ϕ1 , ϕ2 , ϕ3
ϕ1 , ϕ2
und
ϕ3
Tests zum Niveau
α = 0.05
sind!
unverfälschte Tests zum Niveau
α = 0.05?
(iii)Sind die Tests zulässig zu Ihrem jeweiligen Niveau?
4.3
Führe nochmals das Münzwurfexperiment von Bsp 5b des 2. Übungsblattes durch, teste nun jedoch
zweiseitig, ob die Münze fair ist.
4.4
Eine Stichprobe
X1 , . . . , Xn
wird einer
N (µ, σ 2 )-verteilten
Population entnommen, wobei die Varianz
bekannt sei.
(i)Konstruiere einen gleichmäÿig besten einseitigen Test zum Niveau
die Alternative
α = 0.1
(ii)Konstruiere einen gleichmäÿig besten unverfälschten Test zum Niveau
µ=1
für
H0 : µ ≤ 0
gegen
H1 : µ > 0.
gegen die Alternative
µ 6= 1.
α = 0.1
für die Hypothese
4
4.5
ZUSAMMENGESETZTE ALTERNATIVEN
24
Eine Zufallsgröÿe sei Poisson verteilt
f (x, θ) :=
und X1 , . . . , XN
H0 : θ < 4 gegen
Hinweis:
θx −θ
e
x ∈ N,
x!
seien zufällige Stichproben. Finde den gleichmäÿig besten Test zu den Hypothesen
die Alternative
H1 : θ ≥ 4.
Beachte, dass die Summe unabhängiger Poissonverteilter Zufallsgröÿen wiederum Poisson
verteilt ist (zu welchem Parameter?).
4.6
Eine Stichprobe 0.2, 2.6, 1.1, -0.1, -1.3, 0.4, 1.7, 0.6 entstamme einer
(i)Wie lautet der gleichmäÿig beste einseitigen Test zum Niveau
Alternative
H1 : µ > 0.
N (µ, σ 2 )-verteilten
α = 0.05
für
Population.
H0 : µ ≤ 0
gegen die
Wie lautet die Teststatistik? Wird die Nullhypothese für die vorliegenden
Daten beigehalten?
(ii)Führe den zweiseitigen Test für die Hypothese
4.7
µ=0
(i)Teste für die Stichprobe aus Beispiel 1 die Hypothese
gegen die Alternative
H0 : σ ≤ 1
µ 6= 0
durch.
gegen die Alternative
H1 : σ > 1.
(Wie lautet der beste unverfälschte Test)?
(ii)Welche Power hat der Test gegen die Alternative
4.8
H2 : σ = 2?
Betrachte die Stichprobe aus Beispiel 1 und eine zweite Stichprobe 0.8, -1.2, -1.8, 0.6, 0.1, -0.3. Wir
nehmen an beide Stichproben entstammen einer normalverteilten Population.
(i)Teste auf Gleichheit der beiden Mittelwerte.
(ii)Teste auf Gleichheit der Varianzen.
(iii)Angenommen es ist bekannt, dass beide Verteilungen den Mittelwert
µ=0
haben. Wie sieht nun
der Test auf Gleichheit der Varianzen aus?
Bemerkung: Es genügt zum Testen auf Gleichheit der Varianz die in der Vorlesung besprochene Methode der Bestimmung des Ablehnungsbereichs zu wählen (Herleitung des besten unverfälschten Testes
ist zu schwierig).
4.2 Familien mit monotonem Dichtequotienten
4.9
4.10
Sind die Tests aus Beispiel 2.21 auch gleichmäÿig beste Tests für
Sei
fθ (x) =
e(x−θ)
1 + e(x−θ)
2 ,
−∞ < x < ∞,
H0 : a = 1
gegen
H1 : a > 1?
−∞ < θ < ∞,
die Dichte einer logistischen Verteilung.
(i)Zeige: Die durch die Dichten
(ii)Wie lautet der beste
Beobachtung
X .)
fθ (x)
α-Niveau
denierte Verteilungsfamilie hat monotonen Dichtequotienten.
Test für
H0 : θ = 0
(iii)Zeige: Der Test aus b) ist auch gleichmäÿig bester
H1 : θ = 1?
α = 0.2 ist?
gegen
Wie groÿ ist der Fehler zweiter Art, wenn
α-Niveau
Test für
(Basierend auf einer
H0 : θ ≤ 0
gegen
H1 : θ > 0 .
4
4.11
ZUSAMMENGESETZTE ALTERNATIVEN
Gegeben eine Beobachtung
X
25
von einer Cauchy-Verteilung mit Dichte
1
1
,
π 1 + (x − θ)2
θ ∈ R.
(i)Hat obige Verteilungsfamilie monotonen Dichtequotienten?
(ii)Zeige, dass der Test
(
ϕ(x) =
ein bester Test für
H0 : θ = 0
gegen
1
0
1 < x < 3,
falls
sonst.
H1 : θ = 1
zu seinem Niveau ist. Welchen Fehler erster und
zweiter Art hat dieser Test?
(iii)Ist der Test aus b) ein gleichmäÿig bester Test für
4.12
H0 : θ ≤ 0
gegen
H1 : θ > 0?
Gegeben die Cauchy-Skalenverteilungsfamilie mit Dichten
θ
1
,
2
π θ + x2
θ ∈ R.
X . Zeige: Die Verteilungsfamile hat keinen monotonen Dichtequotienten (in
x). Betrachte jetzt die Verteilungen von |X|. Hat diese Verteilungsfamilie monotonen Dichtequotienten?
und dazu eine Beobachtung
4.13
Seien
X1 , . . . , Xn
[0, θ].
H0 : θ = θ0 gegen H1 : θ 6= θ0 .
Testprobleme H0 : θ = θ0 , H1 : θ > θ0 und H0 : θ = θ0 , H1 : θ < θ0 .
eine Stichprobe gleichverteilter Zufallsgröÿen auf
Finden Sie den gleichmäÿig besten Test für
Hinweis: Betrachte zunächst die
Vergleichen Sie die resultierenden optimalen Teststatistiken.
4.14
Sei
X
eine Zufallsvariable mit stetiger streng monotoner Verteilungsfunktion
Welche Verteilung hat
4.15
Seien
X1 , . . . , Xn
F (x)
und sei
Y = F (X).
Y?
1 −(x−µ)/λ
für x ≥ µ.
λe
µ0 gegen H1 : µ 6= µ0 (λ ist bekannt).
unabhängig und exponentialverteilt mit der Dichte
Bestimmen Sie den gleichmäÿig besten Test für
H0 : µ =
Hinweis: Verwenden Sie, dass nach Bsp. 4.14 Ui = F (Xi ) gleichverteilt ist. Dann kann man Bsp. 4.13
verwenden.
4.16
Sei
α die Wahrscheinlichkeit eines Fehlers 1. Art für ϕ aus Beispiel 2.9. Ist ϕ ein gleichmäÿig bester Test
α für die Hypothese H0 : λ ≤ 1 gegen die Alternativhypothese H1 : λ > 1? (Begründung!)
zum Niveau
4.17
X1 , X2 , . . . , X8 mit Wahrscheinlichkeitsfunkf (x, θ) = θx (1 − θ)1−x , für x ∈ {0, 1}, null sonst. Wir betrachten die Hypothesen H0 : θ = 1/3 und
P8
H1 : θ < 1/3. Berechne die Gütefunktion G(θ) des Tests, der H0 genau dann ablehnt, falls i=1 Xi ≤ 1
Gegeben eine (unabhängige) Zufallsstichprobe der Gröÿe 8:
tion
ist.
Hinweis: Die Xi sind Bernoulliverteilt. Welche gutbekannte Verteilung hat
4.18
P
Xi ?
X1 , X2 , . . . , X5 mit Wahrscheinlichkeitsfunkf (x, θ) = θx (1 − θ)1−x , für x ∈ {0, 1}, null sonst. Wir betrachten die Hypothesen H0 : θ = 1/2,
H1 : θ < 1/2 und den Test, der
P5
P5
H0 genau dann ablehnt, falls i=1 Xi ≤ c ist. c ist eine Konstante. ( i=1 Xi ist binomialverteilt.)
Gegeben eine (unabhängige) Zufallsstichprobe der Gröÿe 5
tion
(i)Zeige: Der oben beschriebene Test ist ein gleichmäÿig bester Test.
(ii)Finde das Signikanzniveau
(iii)Finde das Signikanzniveau
α,
α,
c = 1.
c = 0.
dass α = 1/10.
falls
falls
(iv)Randomisiere den obigen Test so,
4
4.19
ZUSAMMENGESETZTE ALTERNATIVEN
26
X1 , . . . , X4 mit Dichte 1/θ, 0 < x < θ, null sonst. Wir
H0 : θ = 2 und H1 : θ 6= 2. Berechne die Gütefunktion G(θ) des Tests, der
falls max1≤i≤4 Xi kleiner gleich 3/4 oder gröÿer 2 ist.
Gegeben eine (unabhängige) Zufallsstichprobe
betrachten die Hypothesen
H0
genau dann ablehnt,
4.3 Exponentialfamilien
Ziel: Bekannte Verteilungsfamilien als Exponentialfamilien identizieren. Warum sind Exponentialfamilien in der Statistik wichtig? (Welche (für das Ableiten optimaler Tests) günstige Eigenschaften haben
Sie?) (VO Abschnitt 4.2.)
4.20
Bezüglich welcher (natürlicher) Parameter sind die folgenden Verteilungsfamilien bei festen anderen
Parametern Exponentialfamilien?
•fΓ (x|α, β) =
αβ
β−1 −αx
e
;
Γ(β) x
(x > 0; α > 0, β ≥ 1)
•fExp (x|µ, λ) = λ1 e−(x−µ)/λ ;
•fE (x|λ, n) =
Γ-Verteilung
(x > µ, λ > 0)
Exponential-Verteilung
(λx)n−1
−λx
(n−1)! λe
Erlang-Verteilung
Γ(α+β) α−1
•fB (x|α, β) = Γ(α)Γ(β)
x
(1 − x)β−1 ;
(0 ≤ x ≤ 1, α ≥ 1, β ≥ 1)
n x
•f (x|θ) =
θ (1 − θ)n−x ;
x ∈ N0 , 0 < θ < 1
k
•f (x|α, γ) =
α γ α+1
γ (x)
Beta-Verteilung
Binomial-Verteilung
(x > γ)
Pareto-Verteilung
4.21
Stellen Sie einen Zusammenhang zwischen Erlang und Exponentialverteilung her.
4.22
Bildet das Produkt von
n Normalverteilungsdichten mit bekanntem Mittelwert µ0 und unbekannter
σ 2 eine Exponentialfamilie? Wie lautet der zugehörige natürliche Parameter θ und die zugehörige
Statistik T (x)?
Varianz
4.23
Die Gammaverteilung hat die Dichte
fΓ (x|α, β) =
Zeige dass sowohl für
α
als auch für
β
αβ β−1 −αx
x
e
;
Γ(β)
x > 0; α > 0, β ≥ 1.
eine einparametrige Exponentialfamilie vorliegt, wenn der jeweils
andere Parameter festgehalten wird. Wie lautet der entsprechende natürliche Parameter
zugehörige Teststatistik
θ
sowie die
T (x).
Zeige explizit, dass ein monotoner Dichtequotient vorliegt.
4.4 Beste unverfälschte Tests
4.24
Ist der Test aus 2.9 unverfälscht?
4.25
Tn /σ 2
sei
χ2 verteilt
mit
n
Freiheitsgraden. Finden Sie für die Hypothesen
H0 : σ 2 = 1 ,
H1 : σ 2 6= 1
αNiveau Test (α = 0.1). Wie groÿ muÿ n sein
σ 2 ≤ 1/2 mindestens 0.9 beträgt? Könnte man n kleiner
Tests zum Niveau α betrachten?
den besten unverfälschten
für
σ 2 ≥ 3/2
unverfälschte
und
damit die Macht gleichzeitig
wählen, wenn wir auch nicht
5
4.26
LINEARE MODELLE
27
Gegeben unabgängige Beobachtungen
X1 , . . . , Xn
N (µ0 , σ 2 )
verteilt nach
wobei
µ0
bekannt sei. Finde
den gleichmäÿig besten unverfälschten Test zu
H0 : σ 2 = 2 ,
H1 : σ 2 6= 2
für
4.27
α = 0.05
und
n = 12.
Zeigen Sie:
Jeder gleichmäÿig beste unverfälschte Test zum Niveau
4.28
α
ist zulässig.
1
1
4 gegen H1 : p 6= 4
testen. Bestimme den Annahmebereich des gleichmäÿig besten unverfälschten Tests im Falle n = 12 und
Wir wollen aufgrund einer binomialverteilten Zufallsgröÿe die Hypothesen
H0 : p =
α = 0.05.
4.29
Bei einem Versuch wurden 15 Realisierungen unabhängiger Poissonverteilter Zufallsgröÿen (mit Parameter
λ) ermittelt. Man möchter H0 : λ = 0.6 gegen H1 : λ 6= 0.6 testen. Lehnt der UMPU (gleichmäÿig
P
α = 0.05 ab, falls die Summe der 15 Realisierungen
xi = 3
beste unverfälschte) Test zum Niveau
beträgt? (Hinweis: Die Summe Poissonverteilter Zufallsgröÿen ist wieder Poissonverteilt. (Aber mit welchem neuen Parameter
5
λ?))
Lineare Modelle
Skriptum: Kapitel 4.
5.1 Invariante Tests
Ziele: Begrie verstehen: Invariante Testprobleme und Statistiken, Strukturmodell, maximalinvariante
Statistiken.
Rolle von maximalinvarianten Statistiken zur Konstruktion bester invarianter Tests.
5.1
Wir betrachten nochmals Aufgabe 2.15 haben jetzt aber zwei (unabhängige) Beobachtungen mit Verteilung aus 2.15 aber mit unbekanntem Mittelwert. Man kann das so formalisieren: Anstatt
beobachten mit Dichte
f
oder
g
beobachten wir die Zufallsvariablen
Yi = Xi + µ,
wobei
Xi (i = 1, 2)
µ unbekannt
ist.
(a) Welche möglichen Verteilungen hat dann
(Y1 , Y2 )
unter
H0
und welche unter
H1 ?
Bezeichnen
wir die beiden Mengen der möglichen Verteilungen (oder Wahrscheinlichkeitsmaÿe) mit
P0
und
P1 .
(b) Finde eine Gruppe von Transformationen, bezüglich der
P0
und
P1
invariant sind und formuliere
das invariante Testproblem.
(c) Ist obiges Testproblem ein Strukturmodell?
(d) Finde eine maximalinvariante Statistik
hat
5.2
T
T
zur Transformationsgruppe aus b). Welche Bedeutung
bei der Konstruktion des gleichmäÿig besten invarianten Tests?
Löse Beispiel 5.1 für den Fall, dass der Mittelwert der Beobachtungen bekannt ist (o.B.d.A null) aber
die Varianz unbekannt. Man kann das analog so formalisieren: Anstatt
Zufallsvariablen
Yi = σXi ,
wobei
σ
unbekannt ist.
Xi (i = 1, 2)
beobachten wir die
5
5.3
LINEARE MODELLE
28
Löse Beispiel 5.1 für den Fall, dass
mit Dichte
g(x) =
X1
und
X2
entweder standardnormalverteilt sind oder Cauchyverteilt
1 1
π 1+x2 .
5.4
Finde den gleichmäÿig besten invarianten Test zu Beispiel 5.1 (mit Fehler erster Art
α = 0.05)!
5.5
Finde den gleichmäÿig besten invarianten Test zu Beispiel 5.3 (mit Fehler erster Art
α = 0.01)!
5.6
Finde den gleichmäÿig besten invarianten Test zu Beispiel 5.3, aber mit
f
als Dichte der doppelten
Exponentialverteilung (und nicht als Dichte der Standardnormalverteilung). Wähle den Fehler erster
Art
5.7
α = 0.01!
Erklären Sie in eigenen Worten: Welche Eigenschaft ergibt sich aus dem Satz von Hunt-Stein (Skriptum
Satz 4.16) für die in 5.4 und 5.5 abgeleiteten Tests?
5.8
Man betrachte die Gruppe aller Transformationen
πσ [(x1 , . . . , xn )] = (σx1 , . . . , σxn )
auf der Stichprobe
(x1 , . . . , xn ).
Eine Statistik
T (x1 , . . . , xn )
heiÿt invariant bezüglich
π,
falls
T (π[x1 , . . . , xn ]) = T (x1 , . . . , xn ).
(a) Ist
(
( xx12 , . . . , xxn1 )
T (x1 , . . . , xn ) =
(0, . . . , 0)
für
für
x1 =
6 0,
x1 = 0
invariant?
1
(b) Ist
Pn
T (x1 , . . . , xn ) = √n1
n
5.9
i=1
Pn
xi
i=1
x2i
invariant?
Zeige, dass die Menge aller Permutationen
πs [(x1 , . . . , xn )] = (xs(1) , . . . , xs(n) )
(s : bijektiv {1, . . . , n} → {1, . . . , n})
eine Gruppe bildet.
5.10
Man betrachte die Rangstatistik
(x1 , . . . , xn )
T (x1 , . . . , xn ) = (r1 , . . . , rn ) (ri = j
falls
xi
das
ist. Gleiche Elemente bekommen den gleichen Rang.)
(a) Man betrachte die Gruppe aller Transformationen
πF [(x1 , . . . , xn )] = (F (x1 ), . . . , F (xn )) .
Dabei sei
F
eine beliebige streng monoton wachsende Funktion
Ist
T
bezügliche dieser Gruppe invariant?
(b) Ist
T
bezüglich der Gruppe aller Permutationen
πs [(x1 , . . . , xn )] = (xs(1) , . . . , xs(n) )
R → R.
invariant?
(s : bijektiv {1, . . . , n} → {1, . . . , n})
j kleinste Element von
5
5.11
LINEARE MODELLE
29
Man betrachte die Statistik
T (x1 , . . . , xn ) = x(n) − x(1)
(Spannweite)
(a) Ist
T
bezüglich der Gruppe aller Permutationen invariant? (siehe Bsp. 5.10)
(b) Ist
T
bezüglich der Lagertransformationen
πµ [(x1 , . . . , xn )] = (x1 + µ, . . . , xn + µ) µ ∈ R
invariant?
5.12
5.13
Welche Statistiken aus 5.8, 5.10 und 5.11 sind maximalinvariant?
X1 , . . . , Xn und Y1 , . . . , Yn jeweils aus den Verteilungen
H0 : τ 2 = σ 2 gegen H1 : τ 2 6= σ 2 ist invariant bezüglich der
Gegeben sind zwei (unabhängige) Stichproben
N (ξ, σ 2 )
und
N (η, τ 2 ).
Das Testproblem
durch die Transformationen
Xi0 = aXi + b,
Yi0 = aYi + b,
Xi0 = Yi ,
und
(a 6= 0),
Yi0 = Xi
G invariante Test lehnt H0
Pn
Pn
2
2
i=1 (Xi − X̄)
i=1 (Yi − Ȳ )
P
P
,
.
W = max
n
n
2
2
i=1 (Xi − X̄)
i=1 (Yi − Ȳ )
erzeugten Gruppe. Zeige: Der gleichmäÿig beste, unter
Hinweis: Der Quotient der Dichten von W
τ 2 /σ 2 = ∆ und τ 2 /σ 2 = 1
n−1 n−1
1+w
1+w
+
,
∆+w
1 + ∆w
falls
w ≥ 0.
unter
Die Ableitung des obigen Ausdrucks ist für alle
ab, falls
W ≥k
mit
ist proportional zu
∆ ≥ 0.
5.2 p-Werte
5.14
Wir untersuchen das Testproblem
normalverteilter (N (µ, σ
2
))
H0 : µ ≤ 0, H1 : µ > 0
T =
und den Test, der
H0
ablehnt, falls
(a) Welche Verteilungsfunktion
T
Fµ
hat
T
Wir untersuchen das Testproblem
1 − exp(−x/λ).
c
n=4
µ?
?
und
σ = 1,
H0 : λ ≤ 1, H1 : λ > 1
für
µ = −1/4, µ = 0
H0
ablehnt, falls
(a) Welche Verteilungsfunktion
T
einen kritischen Wert
Fλ
hat
(b) Welche Verteilung hat der p-Wert
T
(c) Skizziere die Dichte des p-Werts für
c
überschreitet.
in Abhängigkeit von
1 − F1 (T )
λ = 1/2
bzw. für
µ = 1/2!
für eine exponentialverteilte Zufallsgröÿe
Betrachte die Statistik
T =X
und den Test, der
unabhängiger
überschreitet.
in Abhängigkeit von
1 − F0 (T )
(c) Skizziere die Dichte des p-Werts bei
mit Verteilung
X1 , . . . , Xn
X̄
σX̄
einen kritischen Wert
(b) Welche Verteilung hat der p-Wert
5.15
für eine Stichprobe
Zufallsgröÿen mit bekannter Varianz. Betrachte die Statistik
λ?
?
bzw. für
λ = 1/2!
X
5
LINEARE MODELLE
30
5.3 Multiples Testen
Skriptum: Abschnitt 4.1
5.16
Ein den Blutdruck senkendes Medikament besteht unseren Kontrolltest, wenn die mittlere Blutdrucksenkung 1 Stunde nach der Einnahme mindestens 20 beträgt. Zu fünf Medikamenten wurde jeweils an 10
Patienten die Blutdruckdierenz (vorher minus nachher) gemessen. Es ergaben sich folgende Ergebnisse:
Medikament
1
2
3
4
5
25
29
32
31
24
3
3
4
4
2
Wirkung
Mittel
sx̄
Wir wollen aufgrund obiger Daten die 5 Medikamente testen. Dabei ist jeweils
µ > 20.
H0 : µ ≤ 20
und
H1 :
Wir nehmen dazu an, dass die Beobachtungen Realisierungen normalverteilter Zufallsgröÿen
sind.
(a) Teste die 5 Medikamente! (Mittels Standard-t-Test jeweils zum Niveau
α = 0.05.)
(b) Fasse nun obige 5 Tests als eine einzige multiple Testprozedur auf. Hält diese Prozedur das
multiple Niveau
α = 0.05?
Erklären Sie in eigenen Worten, was Halten des multiplen Niveaus
im Zusammenhang unseres Beispiels bedeutet.
(c) Führen Sie den multiplen Test nach Bonferroni zu obigen Daten durch. Welche Medikamente
bestehen nun unseren Kontrolltest? (Vgl. mit a.)
(d) Welche Medikamente bestehen den Kontrolltest, wenn Holm's multipler Test durchgeführt wird?
α
(e) Welches multiple Niveau
hat die Testprozedur aus a? Bei welchem Niveau
ellen Tests beträgt das multiple Niveau genau
5.17
Löse Aufgabe 5.16 für das multiple Niveau
α = 0.1
γ
für die individu-
α = 0.05?
mit folgenden Meÿergebnissen:
Medikament
Wirkung
Mittel
sx̄
5.18
5.19
1
2
3
4
5
23
28.5
30
25.5
24
1
3
4
2
2
Beweise das Abschluÿtestprinzip.
k Populationen
H0,i,j : µi = µj , H1,i,j : µi 6= µj für
Wie kann man Holm's Test als Spezialfall des Abschluÿtestprinzips herleiten, wenn für
alle paarweisen Mittelwertsdierenzen von Interesse sind? (D.h.
i 6= j .)
5.20
Gegeben drei Populationen mit (unbekannten) Mittelwerten
Hypothesen abgeschlossen? Wenn nicht bilde den Abschluÿ!
(a)
H0 : µ1 = µ2 , H0 : µ1 = µ3 .
(b) Alle paarweisen Vergleiche
(c)
H0,ij : µi = µj . (i 6= j ).
H0 : µ1 = µ2 , H0 : µ1 = µ2 = µ3 .
µ1 , µ2 , µ3 .
Sind folgende Familien von
6
SCHÄTZMETHODEN
31
5.4 Asymptotischer Vergleich von Tests
5.21
Löse Beispiel 4.4 des Skriptums, wenn die konkurrenzierenden Teststatistiken Stichprobenmedian und
arithmetisches Mittel sind. Wie groÿ ist die ARE für den Mediantest im Vergleich zum Test, der das
arithmetische Mittel verwendet?
Hinweis:
Für u.i.v. Zufallsgröÿen mit Verteilungsfunktion F
√
n(Mn − F −1 (1/2)) → N (0, [2f (F −11(1/2))]2 )
Mn :
5.22
und stetiger Dichte
f
gilt für den Median
in Verteilung.
Wir wollen die Mittelwerte zweier Populationen mit Verteilung
F (x − θ1 )
bzw.
von gepaarten Stichproben vergleichen. Berechne die ARE für die Teststatistik
F (x − θ2 ) aufgrund
X̄1 − X̄2 gegen den
Vorzeichentest für
(a)
F
gleich der Standardnormalverteilung.
(b) Löse a) auch für den Fall, dass die Varianz bekannt ist und statt dem t-Test der Normalverteilungstest verwendet wird.
6
Schätzmethoden
(Skriptum: Kapitel 5)
6.1
Seien
X(1) , X(2)
und
X(3)
die Ordnungsstatistiken einer (unabhängigen) Zufallsstichprobe der Gröÿe 3
aus der Gleichverteilung auf
[θ, 1 + θ].
(a) Berechnen Sie die Dichte von
T := (X(1) + X(3) )/2.
Wie kann man aus
T
einen Schätzer für
θ
konstruieren?
(b) Berechnen Sie die Dichte des Medians
X(2)
Wie kann man aus
X(2)
einen Schätzer für
θ
kon-
struieren?
(c) Dasselbe für das Minimum
X(1) .
(d) Dasselbe für das arithmetische Mittel
(X1 + X2 + X3 )/3.
(e) Welcher der Schätzer ist aufgrund obiger Überlegungen am besten?
6.2
Berechnen Sie die Fisher-Information für
(a)
N (0, σ 2 ).
(b) Poisson
(c)
6.3
(λ).
B(n, p), n.
fest
(fϑ (x)) = f (x − ϑ)
Zeigen Sie, dass für eine Lageparameterfamilie
hängig von
ϑ
6.4
Sei
6.5
Finden Sie eine Funktion
ξ = g(ϑ)
die Fisher-Information
ist.
und
ϑ = h(ξ) = g −1 (ξ).
ξ = g(p)
Man zeige:
derart, dass
I(ξ) = I(h(ξ)).(h0 (ξ))2
I(ξ)
für eine
B(n, p)-Verteilung
konstant ist.
I(ϑ)
unab-
6
SCHÄTZMETHODEN
32
6.6
(a) Für das Binomialmodell
Beta(a, b)
(b) Wählen Sie
6.7
Es sei
f (x)
B(n, p)
mit der Dichte
a
und
b
nde man den Bayes-Schätzer in bezug auf die Vorbewertung
Γ(a+b) a−1
(1 − p)b−1 .
Γ(a)Γ(b) p
so, dass dieser Bayes-Schätzer konstantes Risiko hat.
die Dichte einer ZV
X.
Der Quartilsabstand der Verteilung ist deniert durch
S(0.5) = x(0.75) − x(0.25)
wobei
x(p)
als Lösung der Gleichung
p=
´ x(p)
−∞
f (x)dx
deniert ist.
Man bestimme mittels der Substitutionsmethode eine Schätzung für
S(0,5) .
Unterscheidet sich dieser
Schätzer vom üblichen Quartilsabstand der deskriptiven Statistik?
6.8
(Getrimmtes Mittel) Für eine Verteilung mit Dichte
µα =
1
1−α
ˆ
f (x)
sei der Parameter
µα
durch
x(1−α/2)
xf (x)dx
x(α/2)
deniert. (x(p) wie in Bsp. 6.7)
Man zeige, dass
für
6.9
µα
ein Lageparameter ist und bestimme mit der Substitutionsmethode eine Schätzung
µα .
Man bestimme den Maximum-Likelihood Schätzer für
der Dichte
(
fγ (x) =
6.10
Man bestimme den Momentschätzer für
(
f (y) =
α
γ
von gleichverteilten zufälligen Variablen mit
1 γ − 12 ≤ x ≤ γ +
0 sonst.
und
β
1
2
,
der Betaverteilung mit der Dichte
Γ(α+β) α−1
(1
Γ(α)Γ(β) y
− y)β−1
0
0 < y < 1,
sonst.
Welche Probleme treten bei der Bestimmung des Maximum Likelihood-Schätzers auf ?
6.11
Es seien
X1 , X2 , . . . , Xn
unabhängige ZV die nach einer Gleichverteilung
(
f (x, θ) =
1
θ
0 ≤ x ≤ θ,
0
sonst
verteilt sind.
(a) Man zeige
θ̂ = max(X1 , . . . , Xn )
ist der Maximum Likelihoodschätzer für den Parameter
(b) Man bestimme eine Schätzung von
6.12
θ
mit der Momentmethode.
Man bestimme den Momentschätzer für die Parameter
α
und
β
der Gammaverteilung.
θ.
6
6.13
SCHÄTZMETHODEN
33
µ und λ der
Man bestimme die Maximum Likelihood-Schätzer für die Parameter
f (x; µ, λ) =
beruhend auf
n
1 −(x−µ)/λ
e
;
λ
Exponentialverteilung
x > µ, λ > 0
voneinander unabhängigen Beobachtungen.
Hinweis: Es ist gleichbedeutend die Likelihood oder den Logarithmus der Likelihood zu maximieren.
6.14
Es seien
X1 , . . . , Xn
unabhängige identisch verteilte Beobachtungen mit Dicht
die Likelihoodfunktion für folgende spezielle Dichten
f (x, h).
Man bestimme
n = 10:
(a) Poissonverteilung
f (x, θ) = e−θ
θx
x!
x = 1, 2, . . . .
(b) Exponentialverteilung
f (x, θ) = e−(x−θ) ;
Wie hängt die Likelihoodfunktion von
6.15
X
n
x ≥ θ.
ab?
nehme die Werte 1 und 0 mit Wahrscheinlichkeit
p bzw. (1−p) an. Es sei bekannt, dass 1/3 ≤ p ≤ 2/3.
(a) Finden Sie den MaximumLikelihood Schätzer für
p.
(b) Man vergleiche den Schätzer aus (a) mit dem Schätzer
Ep (T (x) − p)
6.16
2
1
2 hinsichtlich des MSE. (M SEp (T )=
T (x) ≡
).
Man berechne den MaximumLikelihood Schätzer zur doppelten Exponentialverteilung:
(X1 , . . . , Xn unabhängig, identisch verteilt mit
6.17
(Bei einer Beobachtung).
f (x, µ) = 21 e−|x−µ| ).
Bei einem neuen Intelligenztest nimmt man an, dass die Ergebnisse normalverteilt sind mit unbekanntem
Mittelwert
µ
und Varianz 10.
Unter der Annahme einer Gleichverteilung im Intervall (90,110) als Aprioriverteilung für
µ
und 20
unabhängigen identisch verteilten Beobachtungen zeige man, dass für die Posterioriverteilung gilt:
2
1
1
p(µ|x) = √
e−(x̄−µ)
110−x̄
90−x̄
π Φ( √ ) − Φ( √ )
1/ 2
wobei
x̄
90 < µ < 110
1/ 2
den Mittelwert der zwanzig Beobachtungen bedeutet. Man bestimme den BayesSchätzer für
µ.
6.18
Die Zeiten eines 100 yard Läufers seien gleichverteilt im Intervall
gleichwahrscheinlichen Fälle
α = 9.5
oder
9.7
Man bestimme die Posterioriverteilung, wenn man eine Laufzeit von
6.19
(α; 10.5).
Es seien
P
λ
f (x1 , . . . , xn |λ) = Q
xi
xi !
10.0
e−nλ
(Poissonverteilung) als LikelihoodFunktion und
p(λ) =
1 m + 1 m+1 m −(m+1)λ/λ0
(
)
λ e
m! λ0
(γ Verteilung) als apriori Verteilung gegeben.
Man bestimme den Bayesschätzer für
λ
Für
α
seien die beiden
möglich.
gestoppt hat.
6
6.20
SCHÄTZMETHODEN
Es seien
3n
34
Beobachtungen
X1 . . . Xn , Y1 . . . Yn , Z1 . . . Zn
σ2
alle mit gleicher Varianz
(unbekannt) ge-
geben. Es gelte
E(Xi ) = m1
E(Yi ) = m2
Man bestimme die kleinste Quadratschätzung für
6.21
m1 , m2
=
θ1
= −θ1
= −2θ2
Man bestimme die kleinsten Quadratschätzungen für
Seien
X1 , . . . , Xn
σ2 .
für
E(X 2 ) < ∞
Pn i
1
2
σ (X̄n = n i=1 Xi ).
Man zeige, dass
+ θ2
+ θ2
+ θ3
θ1 , θ2 , θ3
+
+
θ3
θ3
sowie die Schätzung von
σ2 .
unabhängige zufällige Variable, die alle dieselbe Verteilung besitzen.
Man zeige: Wenn
6.23
und die Schätzung für
Es seien wieder Beobachtungen wie in Aufgabe 26 gegeben und
E(Xi )
E(Yi )
E(Zi )
6.22
E(Zi ) = m1 + m2
S =
√
S
2
ist, dann ist die Schätzung
im allgemeinen
betrachte unabhängige nach
N (a, σ 2 )
1
n−1
Pn
i=1 (Xi
− X̄n )2
nicht erwartungstreu ( ie. biased) für
verteilte Variable
(n − 1) Freiheitsgraden.
√
S
betrachte E(
σ n − 1) und E(S; σ).
Sn2 =
X1 , . . . Xn ;
σ
dann besitzt
erwartungstreu
ist. Anleitung: Man
S2
σ 2 (n
− 1)
eine
χ2 Verteilung mit
Man
6.24
Alternativ: Man verwende Jensens Ungleichung.
max1≤i≤n (Xi ) ein erwartungstreuer Schätzer für den Parameter
T (X1 , . . . , Xn ) = (n+1)
n
α einer Gleichverteilung auf (0, α) ist. Anleitung: Man betrachte die Verteilungsfunktion F von max(Xi )
Man zeige, dass
und nde durch Dierenzieren die Dichte.
6.25
T1
σ22 .
T2
Es seien
und
σ12
Dann ist auch
und
zwei unabhängige erwartungstreue Schätzungen für einen Parameter
Wann ist die Varianz von
6.26
T = (1 − a)T1 + aT2
T
erwartungstreu für
θ
für jedes
θ mit Varianzen
a.
minimal?
Xi
erwartungstreuer SchätX1 . . . Xn gleichverteilt in (a − 12 , a + 12 ); dann ist W = max Xi +min
2
a. Anleitung: Man betrachte die Verteilungsfunktion von max Xi und nde die Dichte durch
Es seien
zer für
Dierenzieren.
6.27
Es seien
X1 . . . Xn
Zufallsvariable mit
E(Xi ) = µ
(a) Man nde eine Bedingung für die
ai
und
VarXi = ki σ 2 .
Es sei
P
ai Xi
ein Schätzer für
µ.
derart, dass der obige Schätzer erwartungstreu wird.
(b) Unter der Bedingung aus a) bestimme man die
ai
so, dass die Varianz des Schätzers minimal
wird.
6.28
µ zu einer Stichprobe von n normal N (µ, 1) verteilten Zufallsgröÿen,
µ die Standardnormalverteilung ist und (wie im Skriptum) die quadratische
Berechne den Bayes-Schätzer für
wenn die Vorbewertung für
Verlustfunktion gewählt wird.
6.29
6
SCHÄTZMETHODEN
Sei
f (x, θ) = θ1 I[0,θ]
35
die Dichte zu einer Beobachtung
X.
(a) Nach der ChapmanRobbins Ungleichung läÿt sich die Varianz eines beliebigen erwartungstreuen
Schätzers
T
durch
Vθ0 T ≥ supθ∈Θ0
abschätzen. Dabei ist
(θ − θ0 )2
{ V ar}θ0 Lθ0 ,θ
Θ0 = {θ ∈ Θ \ {θ0 }|Pθ Pθ0 }
(
Lθ0 ,θ =
und
f (x,θ)
f (x,θ0 )
falls
0
sonst
f (x, θ0 ) > 0 ,
der LikelihoodQuotient. Berechnen Sie die ChapmanRobbinsSchranke für unser Beispiel.
(b) Nach Aufgabe (30)
Berechnen Sie
(n = 1)
{ V ar}θ0 T
ist
T (x) = 2x
ein erwartungstreuer Schätzer für
θ0 .
in diesem Fall.
(c) Nach dem Satz von Rao hat ein erwartungstreuer Schätzer
T
genau dann gleichmäÿig kleinste
Varianz (unter allen erwartungstreuen Schätzern), falls gilt:
Eθ T ô = 0 ∀θ ∈ Θ,
Dabei ist
Eθ ô = 0
∀ô ∈ E.
E die Menge aller L2 (Θ) Nullschätzer, d.h.
∀θ ∈ Θ und { V ar}θ ô < ∞ ∀θ ∈ Θ.
die Menge aller Funktionen
Man beweise mittels des Satzes von Rao die Optimalität (kleinste Varianz) von
Man vergleiche nun
{ V ar}θ0 T
Anleitung: man zeige, dass
E
aus Punkt b).
nur Funktionen enthält, die fast überall Null sind.
T
unter den erwartungtreuen Schätzern optimal, falls
auch suzient und vollständig ist. Man verwende diesen Sachverhalt um nachzuweisen, dass
im Falle einer Stichprobe mit
n
Beobachtungen
T (X1 , . . . , Xn ) :=
ein optimaler Schätzer für
6.30
sodass
aus b) mit der ChapmanRobbins Schranke.
(d) Nach dem Satz von LehmannScheé ist
T
T
ô,
θ
n+1
max1≤i≤n (Xi )
n
ist.
Man zeige
(a)
(b)
1
n
P
(Xi − µ)2 ist ezient für σ 2 einer Familie N (µ, σ 2 ).
P
1
(Xi − X̄)2 ist nicht ezient für σ 2 einer Familie N (µ, σ 2 ).
n−1
6.31
Man untersuche ob
6.32
Man bestimme eine eziente erwartungstreue Schätzung für den Parameter
6.33
Man zeige, dass in einer einparametrigen Exponentialfamilie
T (X)
1
n
P
Xi
eine eziente Schätzung für
ein ezienter erwartungstreuer Schätzer für
p
einer Binomialverteilung ist.
λ
einer Poissonverteilung.
f (x, θ) = e(c(θ)T (X)+d(θ)+S(x))
0
(θ)
m(θ) = − dc0 (θ)
ist.
die Statistik
6
6.34
SCHÄTZMETHODEN
36
Gegeben seien die Zufallsvariablen
X1 , . . . , Xn mit Dichte f ( xiσ−µ ). Eine Statistik T
ist Lageequivariant,
falls gilt:
a∈R
T (x1 + a, . . . , xn + a) = T (x1 , . . . , xn ) + a
Eine Statistik
T
ist Skalenequivariant, falls
T (σx1 , . . . , σxn ) = σ r T (x1 , . . . , xn ) σ > 0
für eine Potenz
r.
Untersuche, welche der folgenden Statistiken Lage- bzw. Skalenequivariant sind!
(a)
1
n
Pn
xi .
1
n
Pn
x2i .
i=1
(b)
T (x1 , . . . , xn ) =
(c)
T (x1 , . . . , xn ) = min1≤i≤n xi − c .
(
x1 fallsx3 ≥ 0 ,
T (x1 , x2 , x3 ) =
x2 fallsx3 < 0 .
(d)
6.35
T (x1 , . . . , xn ) =
i=1
Gegeben seien die Zufallsvariablen
x1 , . . . , x n
mit Dichte
Lageequivariante Schätzer, der das quadratische Risiko
´∞
T (x1 , . . . , xn ) = ´−∞
∞
f (x1 − µ, . . . , xn − µ). In diesem Fall
Eµ (T − µ)2 minimiert, die Gestalt
ufµ=0 (x1 − u, . . . , xn − u) du
−∞
fµ=0 (x1 − u, . . . , xn − u) du
hat der
.
Man berechne den (hinsichtlich dieses Kriteriums) optimalen Schätzer im Falle einer Stichprobe unabhängiger exponentialverteilter Zufallsvariablen mit unbekanntem
µ
und bekanntem
λ.
(siehe Bsp.
4.20)
6.36
Seien
X1 , . . . , Xn
µ = 0 (siehe Bsp. 4.20). Mit
T kann man einen optimalen equivarianten Schätzer hinsichtlich
2
] konstruieren. Es hat die Form:
Eλ [ (T −λ)
λ2
unabhängig und exponentialverteilt mit
equivarianten Statistik
schen Risikos
T∗ = T
X1
n
Z = (X
,..., X
Xn ).
n
Pn
Wähle T =
i=1 Xi und
einer Skalen
des quadrati-
Eλ=1 [T |Z]
Eλ=1 [T 2 |Z]
mit
berechne
T ∗!
Hinweis: Da T eine suziente und vollständige Statistik ist und zudem Z nicht von λ abhängt folgt, dass
T
6.37
und
Z
unabhängig sind. (Satz von Basu). Was ergibt sich damit für den bedingten Erwartungswert?
Zeigen Sie:
Die Familie der Wahrscheinlichkeitsverteilungen
ϑ)2 ϑn , n = 0, 1, 2, . . ., 0 < ϑ < 1
f1 , . . . mit
Pϑ (0 < ϑ < 1)
mit
Pϑ ({−1}) = ϑ, Pϑ ({n}) = (1 −
f−1 , f0 ,
ist nicht vollständig, d.h. es existiert eine nicht-triviale Folge
∞
X
fn Pϑ ({n}) = 0 ∀ ϑ .
n=−1
6.38
Zeigen Sie:
Die Familie der Binomialverteilungen
B(n, p), 0 ≤ p ≤ 1
ist suzient (und vollständig).
6
6.39
SCHÄTZMETHODEN
Seien
X1 , . . . , Xn
37
unabhängig und Poisson-verteilt mit Parameter
1
n
ist eine suziente Statistik für
6.40
Seien
X1 , . . . , Xn
n
X
n
Y
Xj ,
j=1
(α, β).
bekanntem β .
ist suzient für
6.41
Es seienX1 und
Xi
i=1
unabhängig und Gamma-verteilt (siehe Beispiel 4.20). Zeigen Sie:

bei
Zeigen Sie:
λ.

α
λ.
X2
Speziell ist
Qn
j=1
Xj
n
X

Xi 
i=1
suzient für
β
bei bekanntem
α
und
Pn
i=1
ϑ > 0.
suzient für
durch folgende Wahrscheinlichkeitsfunktion bestimmt und unabhängig:
f (0, ϑ) = e−ϑ , f (1, ϑ) = ϑe−ϑ , f (2, ϑ) = 1 − e−ϑ − ϑe−ϑ , f (x, ϑ) = 0
wobei
Xi
Man zeige, dass
X1 + X2
nicht suzient für
ϑ
sonst,
ist.
6.42
Man zeige, dass
6.43
Welches der folgenden Modelle ist nichtparametrisch, semiparametrisch, parametrisch? Was sind gege-
Pn
1
i=1 Xi weder suzient noch eine konsistente Schätzung für den Parameter
n
1
einer Cauchyverteilung mit Dichte f (x) =
π[1+(x−µ)2 ] ist.
Tn =
µ
benenfalls die die Parameter?
(i)lineare Regression
(ii)empirische Verteilungsfunktion als Schätzer für die Verteilungsfunktion
(iii)Eine Verteilungsfunktion
6.44
Für die Fisher-Information sind die folgenden Beziehungen oft sehr nützlich:
(i)Zeigen Sie die Beziehung
"
E
2 #
∂2
∂
l (θ)
= E − 2 l (θ) .
∂θ
∂θ
Welche Voraussetungen müssen dazu gemacht werden?
(ii)Zeigen Sie, dass in diesem Fall auch
I (θ) = V ar
gilt. (Hinweis: Zeigen Sie zunächst
E
∂
∂θ l (θ)
∂
l (θ)
∂θ
= 0
und benützen Sie obige Aussage, um diese
Aussage zu zeigen)
6.45
Beschreiben Sie die Vorgehensweise für das Newton-Raphson Verfahren, oder für das Fisher-scoring am
Beispiel der Weibull-Verteilung.
6.46
Take one observation -
X
- from the distribution:

(1 − ϑ)/4 , x = −2




ϑ/12
, x = −1

1/2
, x=0 , 0≤ϑ≤1
P (X = x|ϑ) =


(3
−
ϑ)/12
, x=1



ϑ/4
, x=2
Find an unbiased estimator of
ϑ.
Obtain the maximum likelihood estimator
is not unique. Is any choice of MLE unbiased?
ϑ̂(x)
of
ϑ
and show that it
Herunterladen