Kapitel 5 (deutsch)

Werbung
5
5.1
Konfidenzschätzung
Einige Grundbegriffe zur Konfidenzschätzung
Diesem Kapitel liegt das parametrische Modell {X , BX , P } mit P ∈ {Pθ |θ ∈
Θ} zugrunde.
{Θ, BΘ } sei ein Meßraum über Θ und µ ein σ-finites Maß auf BΘ .
Definition 5.1.1:
Gegeben sei eine meßbare (BX − BΘ -meßbare) Abbildung S : X −→ BΘ ,
wobei S von x ∈ X , jedoch nicht von einem θ ∈ Θ abhängt.
Die Familie {S(x)|x ∈ X } heißt eine Familie zufälliger Mengen (in Θ).
Ist für Θ ⊂ IR S(x) ein Intervall, bezeichnet mit (θ(x), θ̄(x)), wobei θ und
θ̄ von X ∈ X , jedoch nicht von einem θ ∈ Θ abhängen, so heißt S(x) ein
zufälliges Intervall mit θ(x) und θ̄(x) als unterer bzw. oberer Grenze. Dabei
kann θ(x) = −∞ und θ̄(x) = +∞ gelten.
Das Problem der Konfidenzschätzung für einen Parameter θ ∈ Θ besteht
darin, eine Abbildung S : X −→ BΘ zu finden, so dass für gegebenes α mit
0<α<1
Pθ (S(X) 3 θ) ≥ 1 − α
∀ θ ∈ Θ.
(1)
Definition 5.1.2:
Sei Θ ⊂ IR und 0 < α < 1. Eine Abbildung
θ(X) mit Pθ (θ(X) ≤ θ) ≥ 1 − α
∀ θ∈Θ
(2)
heißt untere Konfidenzgrenze für θ zum Konfidenzniveau 1 − α. Eine Abbildung
θ(X) mit
Pθ (θ ≤ θ(X)) ≥ 1 − α
heißt obere Konfidenzgrenze für θ zum Konfidenzniveau 1 − α.
inf Pθ (θ(X) ≤ θ) bzw. inf Pθ (θ ≤ θ(X))
θ∈Θ
θ∈Θ
heißt Konfidenzkoeffizient.
1
(3)
Definition 5.1.3 Eine meßbare Abbildung θ(θ̄) : X −→ IR, die unter der
Bedingung (5.1.2)
Pθ (θ(X) ≤ θ0 ) für alle θ0 < θ
bzw. Pθ (θ0 ≤ θ̄(X)) für alle θ0 > θ
minimiert, heißt gleichmäßig genaueste untere (bzw. obere) (UMA) Konfidenzgrenze für θ zum Konfidenzniveau 1 − α.
Entsprechend heißt S(X) eine Konfidenzmenge zum Konfidenzniveau 1 − α,
wenn es (5.1.1) erfüllt.
Im Fall S(x) = (θ(x), θ̄(x)) heißt S(X) ein Konfidenzintervall zum Konfidenzniveau 1 − α, vorausgesetzt
Pθ (θ(X) < θ < θ̄(X)) ≥ 1 − α
∀θ ∈ Θ.
Bemerkung 1: Die Aussage, θ liegt in S(X) mit Wahrscheinlichkeit ≥ 1 − α
ist falsch. θ ist fest. S(X) ist zufällig. Für ein festes x ∈ X liegt θ entweder
in S(X) oder nicht.
Häufigkeitsinterpretation: S(X) enthält θ in einem Anteil von wenigstens
1 − α der Fälle!
Definition 5.1.4: Eine Familie von Konfidenzmengen {S(X)} zum Konfidenzniveau 1 − α heißt eine gleichmäßig genaueste Familie (UMA) Familie von
Konfidenzmengen zum Konfidenzniveau 1 − α, wenn
Pθ0 {S(X)enthält θ} ≤ Pθ0 (S 0 (X) enthältθ)
(4)
für alle θ, θ0 ∈ Θ und (1 − α)-Konfidenzmengen S 0 (X).
2
Beispiel: X1 , . . . , Xn u.i.v. N (µ, σ 2 ). MLE für µ ist X̄ ∼ N (µ, σn )
√
σ 2 bekannt: Aus P (c1 < X̄−µ
n < c2 ) = P (X̄ − c2 √σn < µ < X̄ − c1 √σn ) =
σ
1−
α folgt mit c2 = u1−α/2 und c1 = uα/2
= −u1−α/2
P X̄ − u1−α/2 √σn < µ < X̄ + u1−α/2 √σn = 1 − α.
Die Intervallänge ist
L=
2σu1−α/2
√
.
n
Für vorgeschriebene Präzision L ≤ 2d ergibt sich
n≥
σ 2 u21−α/2
.
d2
2
Für σ unbekannt ist c1 = tn−1,α/2 , c2 = tn−1,1−α/2 und die Intervallänge
2S
L = √ tn−1,1−α/2
n
ist eine Zufallsvariable.
Beispiel 2: Im obigen Beispiel 1 sei bei unbekannten µ ein (1−α)-Konfidenzintervall
für σ 2 gesucht.
Da (n−1)S 2 /σ 2 ∼ χ2n−1 , können wir z. B. die Grenzen χ2n−1,α/2 und χ2n−1,1−α/2
wählen, so daß
P (χ2n−1,α/2 <
(n − 1)S 2
< χ2n−1,1−α/2 ) = 1 − α oder
2
σ


P
2
2
(X
−
X̄)
(n
−
1)S
i
2

P 2
<σ <
χn−1,1−α/2
χ2n−1,α/2
Beispiel 3: Im Beispiel 1 sei eine (1 − α)- Konfidenzmenge für (µ, σ2 ) gesucht.
Wir benutzen die als Boolsche Ungleichung bekannte Abschätzung
P (A ∩ B) ≥ 1 − P (Ā) − P (B̄).
(
S
S
P (X̄ − tn−1,1−α1 /2 √ < µ < X̄ + tn−1,1−α1 /2 √ ) und
n
n
P
(Xi − X̄)2

< σ2 <
χ2n−1,1−α2 /2

(Xi − X̄)2 
≥ 1 − α1 − α2

χ2n−1,α2 /2
P
liefert die Konfidenzmenge
P
S
S
(Xi − X̄)2
S(X) = X̄ − tn−1,1−α1 /2 √ , X̄ + tn−1,1−α1 /2 √
× 2
,
n
n
χn−1,1−α2 /2
!
zum Konfidenzniveau 1 − α1 − α2 .
Satz 5.1.5:
Die Statistik T : X × Θ −→ IR sei für jedes x ∈ X streng isoton (antiton)
in θ. Sei Λ = T (X , Θ) ⊂ IR das Bild von T und für jedes λ ∈ Λ besitze die
Gleichung λ = T (x, •) eine eindeutige Lösung θ = θα .
Ist die Verteilung von T (X, θ) unabhängig von θ, so kann zu jedem Niveau
1 − α (0 < α < 1) ein Konfidenzintervall konstruiert werden.
3

(Xi − X̄)2 
χ2n−1,α2 /2
P
Beweis: Zu beliebigem α ∈ (0, 1) können Paare λ1 (α) und λ2 (α) aus Λ
gewählt werden, so daß
P (λ1 (α) < T (X, θ) < λ2 (α)) ≥ 1 − α
∀ θ ∈ Θ.
(5)
Da die Verteilung von T (X, θ) nicht von θ abhängt, sind λ1 (α) und λ2 (α)
nicht von θ abhängig. Da T monoton in θ ist, gibt es zu jedem x ∈ X eine
eindeutige Lösung θ bzw. θ̄ von
T (X, θ) = λ1 (α) und T (X, θ̄) = λ2 (α).
Daraus folgt:
Pθ θ(X) < θ < θ̄(X) ≥ 1 − α
∀θ∈Θ
mit den Zufallsvariablen θ(X) und θ̄(X) als Intervallgrenzen.
Bemerkung 2: Eine monotone Funktion T , deren Verteilung unabhängig von
θ ist, läßt sich häufig finden. Ist etwa Fθ stetig in x und monoton in θ, so
wähle
T (X, θ) =
n
Y
Fθ (Xi )
i=1
Wegen der Stetigkeit von F ist Fθ (Xi ) U [0, 1]-verteilt. Damit hat die ZufallsVariable
−logT (X, θ) = −
n
X
logFθ (Xi )
i=1
(da die Summanden eine G(1, 1)-Verteilung haben) die Verteilung G(n,1), die
unabhängig von θ ist und es können Grenzen λ1 und λ2 gefunden werden, so
daß
1 Z −logλ1 n−1 −x
Pθ (−logλ2 < −logT (X, θ) < −logλ1 ) =
x e dx = 1 − α
Γ(n) −logλ2
Daraus folgt
Pθ (λ1 < T (X, θ) < λ2 ) = 1 − α
⇔
Pθ (θ(X) < θ < θ(X)) = 1 − α
Im stetigen Fall können KI’s gefunden werden mit Gleichheitszeichen rechts.
Bei diskreten Verteilungen ist dies i.a. nicht der Fall.
4
Bemerkung 3: Eine Ungleichung der Art (5.1.5) läßt sich auch dann finden,
wenn T nicht streng isoton (antiton) ist. In diesem Fall kann die Umkehrung
der Ungleichungen zu einer Menge von Intervallen in Θ anstelle eines KI
führen.
Bemerkung 4: Die Aussage von Satz 5.1.5 kann auf multivariate Parameter ausgedehnt werden.
Bemerkung 5: Gilt für T (x, θ) ein zentraler Grenzwertsatz und ist n genügend
groß, dann kann i.a. relativ einfach ein approximatives Konfidenzintervall gefunden werden.
Beispiel 4: X1 , . . . , Xn seien u.i.v. mit endlicher Varianz σ 2 . Dann gilt
Xn − µ√ d
n −→ N (0, 1).
σ
√
Für große n ist auch XnS−µ n approx. N (0, 1)-verteilt. Somit ist
S
S
(X n + u α2 √ , X n + u1− α2 √ )
n
n
ein approximatives KI für θ = µ.
Für große n ist unter den weiter oben angegebenen Regularitätsvoraussetzungen der MLE θbn ungefähr normalverteilt, d.h.
√ b
d
n(θM L − θ) −→ N (0, σ 2 )
mit
ϑlogf (X, θ) 2 −1
} ] = [I(θ)]−1
ϑθ
Daraus erhält man als approximatives KI
σ
σ
(θbM L + u α2 √ , θbM L + u1− α2 √ ).
n
n
σ 2 = [Eθ {
Für große n läßt sich auch das obige σ 2 schätzen und der Schätzer in das
approximative KI einsetzen.
Eine grobe Abschätzung liefert auch die Tschebyschev’sche Ungleichung
q
P (|θ̂ − θ| < ε E[(θ̂ − θ)2 ]) ≥ 1 −
5
1
,
ε2
woraus man
q
(θ̂ − ε E[(θ̂ −
zum Niveau 1 −
1
ε2
θ)2 ], θ̂
q
+ ε E[(θ̂ − θ)2 ])
erhält.
Beispiel: X1 , . . . , Xn u.i. U (0, θ)-verteilt. Der MLE (und minimal suffiziente Statistik) ist θˆn = X(n) mit Dichte

 nxn−1 θ −n
f(n) (x) =
 0,
, 0<t<θ
, sonst.
Die Statistik Tn = X(n) /θ hat die Dichte

 ntn−1
h(t) = 
0,
, 0<x<1
, sonst,
die unabhängig von T ist. Gemäß Satz 5.1.5 suchen wir λ1 (α) undλ2 (α), so
daß
P (λ1 (α) < Tn < λ2 (α)) = 1 − α
n
Z
λ2
λ1
∀θ
⇐⇒
tn−1 dt = 1 − α ⇒ λn2 − λn1 = 1 − α
Es gibt ∞ viele Lösungen. Für λ2 = 1 erhalten wir z.B. λ1 = α1/n , und ein
1 − α - KI für θ hat die Form (X(n) , X(n) α−1/n ).
(Dies ist das kleinste KI für θ unter allen (1 − α)- Konfidenzintervallen.)
6
5.2
Konfidenzintervalle kürzester Länge
In der Praxis ist man daran interessiert, zu gegebenem Konfidenzniveau ein
Konfidenzintervall möglichst kleiner Länge zu finden (Präzision der Aussage).
Sei T (X; θ) eine Zufallsvariable, deren Verteilung nicht von θ abhängt. λ1 =
λ1 (α) und λ2 = λ2 (α) seien so gewählt, daß
P (λ1 < T (X; 0) < λ2 ) = 1 − α
und es sei möglich, diese Gleichung so umzuschreiben, daß
P (θ(X) < θ < θ) = 1 − α.
Im allgmeinen können für gegebenes T λ1 und λ2 auf viele Arten gewählt
werden. Gewünscht ist eine Wahl, so daß θ − θ minimal wird. Dies ist ein auf
T basierendes kleinstes Konfidenzintervall.
Natürlich kann es Statistiken T ∗ geben mit kleinerem kleinstem KI zu gegebenem Niveau 1 − α.
Definition 5.2.1:
Eine ZV T (X; θ), deren Verteilung nicht von θ ∈ Θ abhängt, heißt ein Pivot.
Beispiel: Bei einer Stichprobe aus einer N (µ, σ 2 ) ist bei bekannter Varianz
√
σ2
(X − µ) n/σ ein Pivot.
√
Ist σ unbekannt, so ist (X − µ) n/S ein Pivot.
P
Bei einem KI für σ 2 ist (Xi − µ)2 /σ 2 ein Pivot, und falls σ unbekannt, ist
S 2 /σ 2 ein Pivot.
Bemerkung 1: Eine Alternative zur Minimierung der Länge eines gegebenen
KI ist die Minmierung der erwarteten Länge Eθ [θ(X) − θ(X)]. Im allgemeinen gibt es aber kein Element der Klasse der (1 − α)-Konfidenzintervalle, das
Eθ [θ(X) − θ(X)]
∀θ ∈ Θ minimiert.
Die auf einem Pivot basierenden Prozeduren sind jedoch auch anwendbar
beim Aufinden eines KI mit minimaler erwarteter Länge.
Beispiel 1:
Seien X1 , . . . , Xn u.i. N (µ, σ 2 )-verteilt, σ 2 bekannt.
P ivot = Tµ (X) =
X − µ√
n
σ
⇒
7
X − µ√
n < b)
σ
σ
σ
= P (X − b √ < µ < X − a √
n
n
1 − α = P (a <
Länge L =
√σ (b
n
− a), so daß
Z b
1 Z b −x2 /2
Φ(b) − Φ(a) = √
e
dx =
ϕ(x)dx = 1 − α
()
a
2π a
dL
σ db
= √ ( − 1) und
n da
da
db
db
ϕ(a)
ϕ(b) − ϕ(a) = 0 oder
=
.
da
da
ϕ(b)
Es gibt Lösungen ϕ(a) = ϕ(b), also a = b oder a = −b. Nur letztere erfüllt
().
⇒ kürzestes KI ist
σ
σ
(X + uα/2 √ , X + u1−α/2 √ ).
n
n
Länge = 2u1−α/2 √σn . Bei vorgeschriebener Präzision 2d ergibt sich daraus
2
n ≥ u21−α/2 σd2 .
Beispiel 2: Im obigen Fall sei µ bekannt und ein KI kürzester Länge für
σ 2 gesucht. Pivot
(Xi − µ)2
T (X; σ ) =
, T ∼ χ2n .
2
σ
P
(Xi − µ)2
P (a <
< b) = 1 − α ⇒
σ2 P
P
(Xi − µ)2
(Xi − µ)2
P(
< σ2 <
)=1−α
b
a
Z b
1 1 X
2
L = ( − ) (Xi − µ) bzgl.
fn (t)dt = 1 − α
a b
a
dL
1
1 db X
db
fn (a)
= ( 2 − 2 ) (Xi − µ)2
=
⇒
da
a
b da
da
fn (b)
dL
1
1 fn (a) X
=[ 2 − 2
] (Xi − µ)2 = 0 ⇔
da
a
b fn (b)
1
1 fn (a)
= 2
⇔
2
a
b fn (b)
b2
fn (a)
=
2
a
fn (b)
2
P
numerisch zu lösen!
8
5.3
Zusammenhänge zwischen dem Testen von Hypothesen und Konfidenzschätzung
Sei etwa ein Test zum Niveau α von H0 : θ = θ0 gegeben. Ist es möglich, ein
entsprechendes 1 − α KI für θ0 zu konstruieren und umgekehrt?
Beispiel 1: Für X1 , . . . , Xn u.i. N (µ, σ02 ) verteilt und σ02 bekannt hatten wir
das (1 − α)- KI
σ0
σ0
(X − u1− α2 √ , X + u1− α2 √ )
n
n
Ein Test ϕ verwirft die Hypothese µ = µ0 genau dann, wenn µ0 außerhalb
dieses Intervalls liegt. D.h. wenn
√
n|X − µ | 0 ≥ u1−α/2 ,
σ0
so gilt
√
Pµ 0
!
n|X − µ0 |
≥ u1−α/2 = α
σ0
und der Test ϕ ist ein α− Niveau-Test für µ = µ0 gegen H1 µ 6= µ0 . Umgekehrt erzeugt eine Familie von α− Niveau-Tests für die Hypothese µ = µ0
eine Familie von Konfidenzintervallen für µ, indem man jene Werte µ0 als
Konfidenzintervall nimmt, für welche die Hypothese µ = µ0 nicht abgelehnt
werden kann.
Beispiel 1 ist ein Spezialfall eines allgemeineren Dualitätsprinzips. Im folgenden werden nur nichtrandomisierte Tests (Konfidenziintervalle) betrachtet
und für H0 : θ = θ0 schreiben wir kurz H0 (θ0 ) und entsprechend H1 (θ0 ) für
die zusammengesetzte Alternative.
Satz 5.3.1: Sei A(θ0 ) ⊂ X , θ0 ∈ Θ der Annahmebereich eines α−NiveauTests für H0 (θ0 ). Für jedes x ∈ X sei S(x) die Menge
S(x) := {θ ∈ Θ|x ∈ A(θ)}
Dann ist S(x) eine Familie von Konfidenzmengen für θ zum Niveau 1 − α.
Ist darüber hinaus A(θ0 ) Annahmebereich eines UMP-Tests für das Problem
(α, H0 (θ0 ), H1 (θ1 )), dann minimiert S(X)
Pθ (S(X) 3 θ0 ) für alle θ ∈ H1 (θ0 )
9
unter allen (1 − α)– K-Niveau Familien von Konfidenzmengen.
Beweis: Es gilt S(x) 3 θ ⇔ x ∈ A(θ),
so daß
Pθ (S(X) 3 θ) = Pθ (X 3 A(θ)) ≥ 1 − α .
Ist S ∗ (X) eine andere Familie von (1 − α) -Niveau Konfidenzmengen, so sei
A∗ (θ) = {x ∈ X |S ∗ (x) 3 θ}. Dann gilt
Pθ {X ∈ A∗ (θ)} = Pθ {S ∗ (X) 3 θ} ≥ 1 − α für jedes θ ∈ H1 (θ0 ).
Da A(θ0 ) Annahmebereich eines UMP-Tests für (α, H0 (θ0 ), H1 (θ0 )) ist gilt,
Pθ {X ∈ A∗ (θ0 )} ≥ Pθ {X ∈ A(θ0 )}
Also
Pθ {S ∗ (X) 3 θ0 } ≥ Pθ {X ∈ A(θ0 )} = Pθ {S(X) 3 θ0 }
für alle θ ∈ H1 (θ0 ) q.e.d.
Bemerkung 1: Eine Familie von Konfidenzmengen, die assoziert ist mit dem
Annahmebereich eines UMP-Tests ist gemäß Def. 5.1.4 eine UMA-Familie
zum Niveau 1 − α.
Beispiel 2: Die Verteilung der Zufallsvariable X gehöre zu einer einparametrigen Exponentialfamilie mit λ-Dichte
fθ (x) = exp{Q(θ)T (X) + S 0 (X) + D(θ)}.
Q sei eine nichtabnehmende Funktion von θ.
Sei H0 : θ = θ0 gegen H1 : θ < θ0 . In diesem Fall ist der Annahmebereich
eines UMP-Tests zum Niveau α für H0 von der Form
A(θ0 ) = {x|T (x) > c(θ0 )}.
Da für θ ≥ θ0
Pθ0 (T (X) ≤ c(θ0 )) = α = Pθ (T (X) ≤ c(θ)) ≤ Pθ0 (T (X) ≤ c(θ))
gilt, kann c(.) als nichtabnehmend gewählt werden.
Die letzte Ungleichung gilt, da die Gütefunktion eines UMP-Tests mindestens
10
gleich α ist.
Es ist
S(x) = {θ|x ∈ A(θ)}
d.h., S(x) hat die Form
(−∞, c−1 (T (x))) oder (−∞, c−1 (T (x))],
wobei c−1 definiert ist durch c−1 (T (x)) = supθ∈Θ {θ|c(θ) ≤ T (x)}. Ist z.B.
fθ (x) =


1 − xθ
e
θ
 0,
, x>0
, sonst.
dann ist T (x) = x und der Annahmebereich beim UMP-Test der Hypothese
H0 : θ = θ0 gegen H1 : θ < θ0 ist von der Form
A(θ0 ) = {x|x ≥ c(θ0 )}
mit
c(θ0 ) = θ0 log
1
,
1−α
0 < α < 1.
Die UMA-Familie eines (1 − α) - Konfidenzintervalls ist von der Form
S(x) = {θ|x ∈ A(θ)} = {θ|θ ≤
x
1 }
log 1−α
#
x
= −0,
, da
1
log 1−α
(1 − α) = P (X ≥ c(θ)) =
Z
∞
c(θ)
h
i
x ∞
1 −x
e θ dx = −e− θ
c(θ)
θ
c(θ)
1 − α = e− θ
c(θ)
ln(1 − α) = −
θ
c(θ)
− ln(1 − α) =
θ
1
c(θ)
ln
=
1−α
θ
c(θ) = θ ln
1
.
1−α
Da UMP-Tests i.a. nicht existieren, haben wir uns im vorigen Kapitel auf
11
kleinere Klassen, insbesondere auf die Betrachtung von UMPU (unbiased)
Tests beschränkt.
Die Dualitätsbetrachtung führt von UMP unbiased Tests zu UMA - unverfälschten Konfidenzmengen.
Definition 5.3.2: Eine Familie {S(x)} von Konfidenzmengen für einen Parameter θ ∈ Θ heißt unverfälscht zum Konfidenzniveau 1 − α, wenn
Pθ {S(X) 3 θ}
≥1−α
Pθ0 {S(X) 3 θ}
≤ 1 − α ∀ θ, θ0 ∈ Θ,
,
θ = θ0
(5.3.1)
und
θ0 6= θ . (5.3.2)
Ist S(X) mit der obigen Eigenschaft ein Intervall, so sprechen wir von einem unverfälschten (1−α)-Konfidenzintervall. Ist eine Familie unverfälschter
Konfidenzmengen zum Niveau 1 − α UMA in der Klasse aller unverfälschten
(1 − α)-Konfidenzmengen, so heißt sie eine UMA unverfälschte (UMAU) Familie von Konfidenzmengen zum Niveau 1 − α.
Bemerkung 2: Gemäß obiger Definition ist eine Familie S(X) von Konfidenzmengen für θ ∈ Θ zum Niveau 1 − α unverfälscht, wenn S(X) den wahren
Paramter mit einer Wahrscheinlichkeit von mindestens 1 − α enthält und
einen falschen Parameter mit Wahrscheinlickeit von höchstens 1 − α. S(X)
enthält also wahre Parameter öfters als falsche.
Satz 5.3.3: Sei A(θ0 ) Annahmebereich eines UMPU α−Niveau-Tests von
H0 (θ0 ) : θ = θ0 gegen H1 := θ 6= θ0 ∀ θ0 ∈ Θ. Dann ist S(x) = {θ|x ∈
A(θ)}, x ∈ X , eine UMAU-Familie von Konfidenzmengen zum Niveau 1 − α.
Beweis: Um zu sehen, daß S(X) unverfälscht ist, beachte man, daß, da A(θ)
Annahmebereich eines unverfälschten Tests ist,
Pθ0 {S(X) 3 θ} = Pθ0 {x ∈ A(θ)}
≤1−α .
Um zu sehen, daß S(X) UMA ist, betrachte eine beliebige Familie S ∗ (X)
unverfälschter (1−α)-Niveau Konfidenzmengen mit A∗ (θ) = {x ∈ X |S ∗ (x) 3
θ}. Dann gilt Pθ0 {X ∈ A∗ (θ)} = Pθ0 {S ∗ (X) 3 θ} ≤ 1 − α und A∗ (θ) ist
Annahmebereich eines unverfälschten α−Niveau-Tests. Daraus folgt
Pθ0 {S ∗ (X) 3 θ} = Pθ0 {X ∈ A∗ (θ)} ≥ Pθ0 {X ∈ A(θ)} = Pθ0 {S(X) 3 θ} .
12
Die Ungleichung gilt, da A(θ) Annahmebereich eines UMPU-Tests.
Beispiel 3: X1 , . . . , Xn u.i. N (µ, σ 2 )-verteilt, µ und σ 2 unbekannt. Der UMPUTest von H0 := µ = µ0 gegen H1 := µ 6= µ0 ist von der Art

 1
ϕ(x) =
 0,
√
0 )|
, | n(X−µ
>c
S
, sonst.
Aus
)
( √
n(X − µ ) 0 α = Pµ=µ0 >c
S
folgt
c = tn−1,1−α/2 .
Daraus ergibt sich
( √
)
n(X − µ ) 0 A(µ0 ) = x ≤ tn−1,1−α/2
S
ist der Annahmebereich eines UMPU α-Niveau-Tests von H0 : µ = µ0 gegen
H1 : µ 6= µ0 . Aus Satz 5.3.3 folgt, daß
(
S
S
S(x) = {µ|x ∈ A(µ)} = X̄ − √ tn−1,1− α2 ≤ µ ≤ X̄ + √ tn−1,1− α2
n
n
)
eine UMAU Familie von Konfidenzmengen zum Niveau 1 − α ist.
Bemerkung 3: Beispiel 3 und die Überlegungen zu unverfälschten Tests zeigen, daß das Konzept von der Unverfälschtheit sich besonders dort eignet,
wo UMP-Tests nicht existieren. Dies ist beispielsweise der Fall, wenn Θ aus
Punkten (θ, τ ) besteht, wobei beide unbekannt sind und eine Konfidenzmenge nur für einen Parameter, etwa θ, gesucht wird. Der andere Parameter τ
wird dann als nuisance-Parameter bezeichnet.
Bemerkung 4: Bereits weiter oben wurde festgestellt, daß Konfidenzintervalle kürzester Länge häufig nicht existieren. Es kann gezeigt werden, daß die
Einschränkung auf die Klasse unverfälschter Konfidenzintervalle es möglich
macht, zumindest für viele in der Praxis auftretende Probleme (1−α)-Niveau
Konfidenzintervalle zu finden, die gleichmäßig kleinste erwartete Länge in der
Klasse aller unverfälschten (1 − α)-Niveau Konfidenzintervalle haben.
5.4. Unverfälschte Konfidenzintervalle
Satz 5.4.1: Sei Θ ⊂ IR ein Intervall, fθ eine µ-Dichte für X und S(X) =
13
(θ(X), θ̄(X)) eine Familie von (1 − α)-Niveau Konfidenz(mengen)intervallen
mit stochastisch endlicher Länge, d.h. sei Pθ (θ̄(X) − θ(X) < ∞) = 1. Dann
gilt
Z
Z
[θ̄(x) − θ(x)]fθ (x)µ(dx) =
Pθ (S(X) 3 θ0 )dθ0
∀θ ∈ Θ.
θ6=θ0
Rθ̄
Beweis: Es ist θ̄ − θ = dθ0 .
=⇒
∀θ ∈ Θ
dθ0 =
Z
θ
Eθ [θ̄(X) − θ(X)] = Eθ
Zθ̄
X
θ
=
Z (Z
θ
=
Z
θ̄
fθ (x)
(Z
θ̄(x)
)
dθ0 µ(dx) =
θ(x)
)
fθ (x)µ(dx) dθ0
Pθ {S(X) 3 θ0 } dθ0 =
Z
θ6=θ0
Pθ {S(X) 3 θ0 } dθ0 .
Satz 5.4.1 sagt mit anderen Worten aus, daß die erwartete Länge eines Konfidenzintervalls gleich der Wahrscheinlichkeit dafür ist, daß S(X) θ enthält,
gemittelt über alle falschen Parameterwerte.
Bemerkung 1: Ist S(X) eine Familie von UMAU Konfidenzintervallen zum
Niveau 1 − α, dann ist die erwartete Länge von S(X) minimal. Denn die
linke Seite der Gleichung (5.4.1) ist die erwartete Länge, da S(X) UMAU ist
(Satz 5.3.3), gleichmäßig in θ, bezüglich aller unverfälschter (1 − α)-Niveau
Konfidenzintervalle.
Beispiel:
X1 , . . . , Xn u.i. N (µ, σ 2 )-verteilt. Das Konfidenzintervall für µ,
S
S
S(X) = (X̄ − tn−1,1− α2 √ , X̄ + tn−1,1− α2 √ )
n
n
hat kürzeste Länge und ist, da von einem UMPU-Test abgeleitet, gemäß Satz
5.3.3 UMAU. Gemäß obiger Bemerkung ist damit die erwartete Intervallänge
minimal.
Die folgende Prozedur zur Bestimmung unverfälschter Konfidenzintervalle
14
(1)
führt häufig zum Ziel.
Sei T (X, θ) ein Pivot und die Gleichung
P (λ1 (α) < T (X, θ) < λ2 (λ) = 1 − α
lasse sich umformen zu
Pθ (θ(X) < θ < θ̄(X) = 1 − α.
Damit (θ(X) < θ < θ̄(X)) unverfälscht ist, muß gelten
P (θ, θ0 ) := Pθ (θ(X) < θ0 < θ̄(X)) = 1 − α, falls θ = θ0
(2)
und
P (θ, θ0 ) < 1 − α, falls θ 6= θ0 .
(3)
Hängt P (θ, θ0 ) nur von einer Funktion γ von θ und θ0 ab, so können wir
schreiben

 1−α
P (θ, θ0 ) = P (γ) = 
<1−α
für θ = θ0
für θ < θ0
(4)
Damit ist P (γ) maximal für θ = θ0 .
Im obigen Beispiel sei
(n − 1)S 2
∼ χ2n−1 ,
σ2
(n − 1)S 2
P (λ1 <
< λ2 ) = 1 − α
σ2
T (X, σ 2 ) =
oder
S2
S2
2
< σ < (n − 1) ) = 1 − α.
P ((n − 1)
λ2
λ1
Dann ist
2
02
P (σ , σ ) = Pσ2
= P
mit γ =
σ 02
.
σ2
S2
S2
0
(n − 1)
< σ 2 < (n − 1)
λ2
λ1
!
2
2
T (X, σ )
T (X, σ )
<γ<
λ2
λ1
⇒
P (γ) = P (λ1 γ < T (X, σ 2 ) < λ2 γ)
15
!
Damit ergibt sich aus (5.4.2) und (5.4.3)
P (1) = 1 − α (a)
und
P (γ) < 1 − α.
λ1 und λ2 sind also so zu wählen, daß P (1) = 1 − α und
dP (γ)
|γ=1 = λ2 fn−1 (λ2 ) − λ1 fn−1 (λ1 ) = 0
dγ
(b)
(a) und (b) sind numerisch zu lösen (siehe Take & Klett, IASA 1959). Die
Lösung ist ein unverfälschtes (1 − α) KI, das auch UMAU ist.
Beispiel: n = 11, n − 1 = 10, α = 0.10 : Länge des symmetrischen Konfidenzintervalls:
"
1
χ210,0.5
−
1
χ210,0.95
#
=
1
1
−
= 0.199
3.940 18.307
Länge
des
kürzesten KI mit λ1 = 24.350, λ2 = 4.758
h
i
1
1
1
1
− λ1 = 4.758
− 24.350
= 0.169
λ2
0.169
0.199
= 0.85 . D.h. das kürzeste KI ist um 15% kürzer als das ”symmetrische” KI.
16
Herunterladen