5 5.1 Konfidenzschätzung Einige Grundbegriffe zur Konfidenzschätzung Diesem Kapitel liegt das parametrische Modell {X , BX , P } mit P ∈ {Pθ |θ ∈ Θ} zugrunde. {Θ, BΘ } sei ein Meßraum über Θ und µ ein σ-finites Maß auf BΘ . Definition 5.1.1: Gegeben sei eine meßbare (BX − BΘ -meßbare) Abbildung S : X −→ BΘ , wobei S von x ∈ X , jedoch nicht von einem θ ∈ Θ abhängt. Die Familie {S(x)|x ∈ X } heißt eine Familie zufälliger Mengen (in Θ). Ist für Θ ⊂ IR S(x) ein Intervall, bezeichnet mit (θ(x), θ̄(x)), wobei θ und θ̄ von X ∈ X , jedoch nicht von einem θ ∈ Θ abhängen, so heißt S(x) ein zufälliges Intervall mit θ(x) und θ̄(x) als unterer bzw. oberer Grenze. Dabei kann θ(x) = −∞ und θ̄(x) = +∞ gelten. Das Problem der Konfidenzschätzung für einen Parameter θ ∈ Θ besteht darin, eine Abbildung S : X −→ BΘ zu finden, so dass für gegebenes α mit 0<α<1 Pθ (S(X) 3 θ) ≥ 1 − α ∀ θ ∈ Θ. (1) Definition 5.1.2: Sei Θ ⊂ IR und 0 < α < 1. Eine Abbildung θ(X) mit Pθ (θ(X) ≤ θ) ≥ 1 − α ∀ θ∈Θ (2) heißt untere Konfidenzgrenze für θ zum Konfidenzniveau 1 − α. Eine Abbildung θ(X) mit Pθ (θ ≤ θ(X)) ≥ 1 − α heißt obere Konfidenzgrenze für θ zum Konfidenzniveau 1 − α. inf Pθ (θ(X) ≤ θ) bzw. inf Pθ (θ ≤ θ(X)) θ∈Θ θ∈Θ heißt Konfidenzkoeffizient. 1 (3) Definition 5.1.3 Eine meßbare Abbildung θ(θ̄) : X −→ IR, die unter der Bedingung (5.1.2) Pθ (θ(X) ≤ θ0 ) für alle θ0 < θ bzw. Pθ (θ0 ≤ θ̄(X)) für alle θ0 > θ minimiert, heißt gleichmäßig genaueste untere (bzw. obere) (UMA) Konfidenzgrenze für θ zum Konfidenzniveau 1 − α. Entsprechend heißt S(X) eine Konfidenzmenge zum Konfidenzniveau 1 − α, wenn es (5.1.1) erfüllt. Im Fall S(x) = (θ(x), θ̄(x)) heißt S(X) ein Konfidenzintervall zum Konfidenzniveau 1 − α, vorausgesetzt Pθ (θ(X) < θ < θ̄(X)) ≥ 1 − α ∀θ ∈ Θ. Bemerkung 1: Die Aussage, θ liegt in S(X) mit Wahrscheinlichkeit ≥ 1 − α ist falsch. θ ist fest. S(X) ist zufällig. Für ein festes x ∈ X liegt θ entweder in S(X) oder nicht. Häufigkeitsinterpretation: S(X) enthält θ in einem Anteil von wenigstens 1 − α der Fälle! Definition 5.1.4: Eine Familie von Konfidenzmengen {S(X)} zum Konfidenzniveau 1 − α heißt eine gleichmäßig genaueste Familie (UMA) Familie von Konfidenzmengen zum Konfidenzniveau 1 − α, wenn Pθ0 {S(X)enthält θ} ≤ Pθ0 (S 0 (X) enthältθ) (4) für alle θ, θ0 ∈ Θ und (1 − α)-Konfidenzmengen S 0 (X). 2 Beispiel: X1 , . . . , Xn u.i.v. N (µ, σ 2 ). MLE für µ ist X̄ ∼ N (µ, σn ) √ σ 2 bekannt: Aus P (c1 < X̄−µ n < c2 ) = P (X̄ − c2 √σn < µ < X̄ − c1 √σn ) = σ 1− α folgt mit c2 = u1−α/2 und c1 = uα/2 = −u1−α/2 P X̄ − u1−α/2 √σn < µ < X̄ + u1−α/2 √σn = 1 − α. Die Intervallänge ist L= 2σu1−α/2 √ . n Für vorgeschriebene Präzision L ≤ 2d ergibt sich n≥ σ 2 u21−α/2 . d2 2 Für σ unbekannt ist c1 = tn−1,α/2 , c2 = tn−1,1−α/2 und die Intervallänge 2S L = √ tn−1,1−α/2 n ist eine Zufallsvariable. Beispiel 2: Im obigen Beispiel 1 sei bei unbekannten µ ein (1−α)-Konfidenzintervall für σ 2 gesucht. Da (n−1)S 2 /σ 2 ∼ χ2n−1 , können wir z. B. die Grenzen χ2n−1,α/2 und χ2n−1,1−α/2 wählen, so daß P (χ2n−1,α/2 < (n − 1)S 2 < χ2n−1,1−α/2 ) = 1 − α oder 2 σ P 2 2 (X − X̄) (n − 1)S i 2 P 2 <σ < χn−1,1−α/2 χ2n−1,α/2 Beispiel 3: Im Beispiel 1 sei eine (1 − α)- Konfidenzmenge für (µ, σ2 ) gesucht. Wir benutzen die als Boolsche Ungleichung bekannte Abschätzung P (A ∩ B) ≥ 1 − P (Ā) − P (B̄). ( S S P (X̄ − tn−1,1−α1 /2 √ < µ < X̄ + tn−1,1−α1 /2 √ ) und n n P (Xi − X̄)2 < σ2 < χ2n−1,1−α2 /2 (Xi − X̄)2 ≥ 1 − α1 − α2 χ2n−1,α2 /2 P liefert die Konfidenzmenge P S S (Xi − X̄)2 S(X) = X̄ − tn−1,1−α1 /2 √ , X̄ + tn−1,1−α1 /2 √ × 2 , n n χn−1,1−α2 /2 ! zum Konfidenzniveau 1 − α1 − α2 . Satz 5.1.5: Die Statistik T : X × Θ −→ IR sei für jedes x ∈ X streng isoton (antiton) in θ. Sei Λ = T (X , Θ) ⊂ IR das Bild von T und für jedes λ ∈ Λ besitze die Gleichung λ = T (x, •) eine eindeutige Lösung θ = θα . Ist die Verteilung von T (X, θ) unabhängig von θ, so kann zu jedem Niveau 1 − α (0 < α < 1) ein Konfidenzintervall konstruiert werden. 3 (Xi − X̄)2 χ2n−1,α2 /2 P Beweis: Zu beliebigem α ∈ (0, 1) können Paare λ1 (α) und λ2 (α) aus Λ gewählt werden, so daß P (λ1 (α) < T (X, θ) < λ2 (α)) ≥ 1 − α ∀ θ ∈ Θ. (5) Da die Verteilung von T (X, θ) nicht von θ abhängt, sind λ1 (α) und λ2 (α) nicht von θ abhängig. Da T monoton in θ ist, gibt es zu jedem x ∈ X eine eindeutige Lösung θ bzw. θ̄ von T (X, θ) = λ1 (α) und T (X, θ̄) = λ2 (α). Daraus folgt: Pθ θ(X) < θ < θ̄(X) ≥ 1 − α ∀θ∈Θ mit den Zufallsvariablen θ(X) und θ̄(X) als Intervallgrenzen. Bemerkung 2: Eine monotone Funktion T , deren Verteilung unabhängig von θ ist, läßt sich häufig finden. Ist etwa Fθ stetig in x und monoton in θ, so wähle T (X, θ) = n Y Fθ (Xi ) i=1 Wegen der Stetigkeit von F ist Fθ (Xi ) U [0, 1]-verteilt. Damit hat die ZufallsVariable −logT (X, θ) = − n X logFθ (Xi ) i=1 (da die Summanden eine G(1, 1)-Verteilung haben) die Verteilung G(n,1), die unabhängig von θ ist und es können Grenzen λ1 und λ2 gefunden werden, so daß 1 Z −logλ1 n−1 −x Pθ (−logλ2 < −logT (X, θ) < −logλ1 ) = x e dx = 1 − α Γ(n) −logλ2 Daraus folgt Pθ (λ1 < T (X, θ) < λ2 ) = 1 − α ⇔ Pθ (θ(X) < θ < θ(X)) = 1 − α Im stetigen Fall können KI’s gefunden werden mit Gleichheitszeichen rechts. Bei diskreten Verteilungen ist dies i.a. nicht der Fall. 4 Bemerkung 3: Eine Ungleichung der Art (5.1.5) läßt sich auch dann finden, wenn T nicht streng isoton (antiton) ist. In diesem Fall kann die Umkehrung der Ungleichungen zu einer Menge von Intervallen in Θ anstelle eines KI führen. Bemerkung 4: Die Aussage von Satz 5.1.5 kann auf multivariate Parameter ausgedehnt werden. Bemerkung 5: Gilt für T (x, θ) ein zentraler Grenzwertsatz und ist n genügend groß, dann kann i.a. relativ einfach ein approximatives Konfidenzintervall gefunden werden. Beispiel 4: X1 , . . . , Xn seien u.i.v. mit endlicher Varianz σ 2 . Dann gilt Xn − µ√ d n −→ N (0, 1). σ √ Für große n ist auch XnS−µ n approx. N (0, 1)-verteilt. Somit ist S S (X n + u α2 √ , X n + u1− α2 √ ) n n ein approximatives KI für θ = µ. Für große n ist unter den weiter oben angegebenen Regularitätsvoraussetzungen der MLE θbn ungefähr normalverteilt, d.h. √ b d n(θM L − θ) −→ N (0, σ 2 ) mit ϑlogf (X, θ) 2 −1 } ] = [I(θ)]−1 ϑθ Daraus erhält man als approximatives KI σ σ (θbM L + u α2 √ , θbM L + u1− α2 √ ). n n σ 2 = [Eθ { Für große n läßt sich auch das obige σ 2 schätzen und der Schätzer in das approximative KI einsetzen. Eine grobe Abschätzung liefert auch die Tschebyschev’sche Ungleichung q P (|θ̂ − θ| < ε E[(θ̂ − θ)2 ]) ≥ 1 − 5 1 , ε2 woraus man q (θ̂ − ε E[(θ̂ − zum Niveau 1 − 1 ε2 θ)2 ], θ̂ q + ε E[(θ̂ − θ)2 ]) erhält. Beispiel: X1 , . . . , Xn u.i. U (0, θ)-verteilt. Der MLE (und minimal suffiziente Statistik) ist θˆn = X(n) mit Dichte nxn−1 θ −n f(n) (x) = 0, , 0<t<θ , sonst. Die Statistik Tn = X(n) /θ hat die Dichte ntn−1 h(t) = 0, , 0<x<1 , sonst, die unabhängig von T ist. Gemäß Satz 5.1.5 suchen wir λ1 (α) undλ2 (α), so daß P (λ1 (α) < Tn < λ2 (α)) = 1 − α n Z λ2 λ1 ∀θ ⇐⇒ tn−1 dt = 1 − α ⇒ λn2 − λn1 = 1 − α Es gibt ∞ viele Lösungen. Für λ2 = 1 erhalten wir z.B. λ1 = α1/n , und ein 1 − α - KI für θ hat die Form (X(n) , X(n) α−1/n ). (Dies ist das kleinste KI für θ unter allen (1 − α)- Konfidenzintervallen.) 6 5.2 Konfidenzintervalle kürzester Länge In der Praxis ist man daran interessiert, zu gegebenem Konfidenzniveau ein Konfidenzintervall möglichst kleiner Länge zu finden (Präzision der Aussage). Sei T (X; θ) eine Zufallsvariable, deren Verteilung nicht von θ abhängt. λ1 = λ1 (α) und λ2 = λ2 (α) seien so gewählt, daß P (λ1 < T (X; 0) < λ2 ) = 1 − α und es sei möglich, diese Gleichung so umzuschreiben, daß P (θ(X) < θ < θ) = 1 − α. Im allgmeinen können für gegebenes T λ1 und λ2 auf viele Arten gewählt werden. Gewünscht ist eine Wahl, so daß θ − θ minimal wird. Dies ist ein auf T basierendes kleinstes Konfidenzintervall. Natürlich kann es Statistiken T ∗ geben mit kleinerem kleinstem KI zu gegebenem Niveau 1 − α. Definition 5.2.1: Eine ZV T (X; θ), deren Verteilung nicht von θ ∈ Θ abhängt, heißt ein Pivot. Beispiel: Bei einer Stichprobe aus einer N (µ, σ 2 ) ist bei bekannter Varianz √ σ2 (X − µ) n/σ ein Pivot. √ Ist σ unbekannt, so ist (X − µ) n/S ein Pivot. P Bei einem KI für σ 2 ist (Xi − µ)2 /σ 2 ein Pivot, und falls σ unbekannt, ist S 2 /σ 2 ein Pivot. Bemerkung 1: Eine Alternative zur Minimierung der Länge eines gegebenen KI ist die Minmierung der erwarteten Länge Eθ [θ(X) − θ(X)]. Im allgemeinen gibt es aber kein Element der Klasse der (1 − α)-Konfidenzintervalle, das Eθ [θ(X) − θ(X)] ∀θ ∈ Θ minimiert. Die auf einem Pivot basierenden Prozeduren sind jedoch auch anwendbar beim Aufinden eines KI mit minimaler erwarteter Länge. Beispiel 1: Seien X1 , . . . , Xn u.i. N (µ, σ 2 )-verteilt, σ 2 bekannt. P ivot = Tµ (X) = X − µ√ n σ ⇒ 7 X − µ√ n < b) σ σ σ = P (X − b √ < µ < X − a √ n n 1 − α = P (a < Länge L = √σ (b n − a), so daß Z b 1 Z b −x2 /2 Φ(b) − Φ(a) = √ e dx = ϕ(x)dx = 1 − α () a 2π a dL σ db = √ ( − 1) und n da da db db ϕ(a) ϕ(b) − ϕ(a) = 0 oder = . da da ϕ(b) Es gibt Lösungen ϕ(a) = ϕ(b), also a = b oder a = −b. Nur letztere erfüllt (). ⇒ kürzestes KI ist σ σ (X + uα/2 √ , X + u1−α/2 √ ). n n Länge = 2u1−α/2 √σn . Bei vorgeschriebener Präzision 2d ergibt sich daraus 2 n ≥ u21−α/2 σd2 . Beispiel 2: Im obigen Fall sei µ bekannt und ein KI kürzester Länge für σ 2 gesucht. Pivot (Xi − µ)2 T (X; σ ) = , T ∼ χ2n . 2 σ P (Xi − µ)2 P (a < < b) = 1 − α ⇒ σ2 P P (Xi − µ)2 (Xi − µ)2 P( < σ2 < )=1−α b a Z b 1 1 X 2 L = ( − ) (Xi − µ) bzgl. fn (t)dt = 1 − α a b a dL 1 1 db X db fn (a) = ( 2 − 2 ) (Xi − µ)2 = ⇒ da a b da da fn (b) dL 1 1 fn (a) X =[ 2 − 2 ] (Xi − µ)2 = 0 ⇔ da a b fn (b) 1 1 fn (a) = 2 ⇔ 2 a b fn (b) b2 fn (a) = 2 a fn (b) 2 P numerisch zu lösen! 8 5.3 Zusammenhänge zwischen dem Testen von Hypothesen und Konfidenzschätzung Sei etwa ein Test zum Niveau α von H0 : θ = θ0 gegeben. Ist es möglich, ein entsprechendes 1 − α KI für θ0 zu konstruieren und umgekehrt? Beispiel 1: Für X1 , . . . , Xn u.i. N (µ, σ02 ) verteilt und σ02 bekannt hatten wir das (1 − α)- KI σ0 σ0 (X − u1− α2 √ , X + u1− α2 √ ) n n Ein Test ϕ verwirft die Hypothese µ = µ0 genau dann, wenn µ0 außerhalb dieses Intervalls liegt. D.h. wenn √ n|X − µ | 0 ≥ u1−α/2 , σ0 so gilt √ Pµ 0 ! n|X − µ0 | ≥ u1−α/2 = α σ0 und der Test ϕ ist ein α− Niveau-Test für µ = µ0 gegen H1 µ 6= µ0 . Umgekehrt erzeugt eine Familie von α− Niveau-Tests für die Hypothese µ = µ0 eine Familie von Konfidenzintervallen für µ, indem man jene Werte µ0 als Konfidenzintervall nimmt, für welche die Hypothese µ = µ0 nicht abgelehnt werden kann. Beispiel 1 ist ein Spezialfall eines allgemeineren Dualitätsprinzips. Im folgenden werden nur nichtrandomisierte Tests (Konfidenziintervalle) betrachtet und für H0 : θ = θ0 schreiben wir kurz H0 (θ0 ) und entsprechend H1 (θ0 ) für die zusammengesetzte Alternative. Satz 5.3.1: Sei A(θ0 ) ⊂ X , θ0 ∈ Θ der Annahmebereich eines α−NiveauTests für H0 (θ0 ). Für jedes x ∈ X sei S(x) die Menge S(x) := {θ ∈ Θ|x ∈ A(θ)} Dann ist S(x) eine Familie von Konfidenzmengen für θ zum Niveau 1 − α. Ist darüber hinaus A(θ0 ) Annahmebereich eines UMP-Tests für das Problem (α, H0 (θ0 ), H1 (θ1 )), dann minimiert S(X) Pθ (S(X) 3 θ0 ) für alle θ ∈ H1 (θ0 ) 9 unter allen (1 − α)– K-Niveau Familien von Konfidenzmengen. Beweis: Es gilt S(x) 3 θ ⇔ x ∈ A(θ), so daß Pθ (S(X) 3 θ) = Pθ (X 3 A(θ)) ≥ 1 − α . Ist S ∗ (X) eine andere Familie von (1 − α) -Niveau Konfidenzmengen, so sei A∗ (θ) = {x ∈ X |S ∗ (x) 3 θ}. Dann gilt Pθ {X ∈ A∗ (θ)} = Pθ {S ∗ (X) 3 θ} ≥ 1 − α für jedes θ ∈ H1 (θ0 ). Da A(θ0 ) Annahmebereich eines UMP-Tests für (α, H0 (θ0 ), H1 (θ0 )) ist gilt, Pθ {X ∈ A∗ (θ0 )} ≥ Pθ {X ∈ A(θ0 )} Also Pθ {S ∗ (X) 3 θ0 } ≥ Pθ {X ∈ A(θ0 )} = Pθ {S(X) 3 θ0 } für alle θ ∈ H1 (θ0 ) q.e.d. Bemerkung 1: Eine Familie von Konfidenzmengen, die assoziert ist mit dem Annahmebereich eines UMP-Tests ist gemäß Def. 5.1.4 eine UMA-Familie zum Niveau 1 − α. Beispiel 2: Die Verteilung der Zufallsvariable X gehöre zu einer einparametrigen Exponentialfamilie mit λ-Dichte fθ (x) = exp{Q(θ)T (X) + S 0 (X) + D(θ)}. Q sei eine nichtabnehmende Funktion von θ. Sei H0 : θ = θ0 gegen H1 : θ < θ0 . In diesem Fall ist der Annahmebereich eines UMP-Tests zum Niveau α für H0 von der Form A(θ0 ) = {x|T (x) > c(θ0 )}. Da für θ ≥ θ0 Pθ0 (T (X) ≤ c(θ0 )) = α = Pθ (T (X) ≤ c(θ)) ≤ Pθ0 (T (X) ≤ c(θ)) gilt, kann c(.) als nichtabnehmend gewählt werden. Die letzte Ungleichung gilt, da die Gütefunktion eines UMP-Tests mindestens 10 gleich α ist. Es ist S(x) = {θ|x ∈ A(θ)} d.h., S(x) hat die Form (−∞, c−1 (T (x))) oder (−∞, c−1 (T (x))], wobei c−1 definiert ist durch c−1 (T (x)) = supθ∈Θ {θ|c(θ) ≤ T (x)}. Ist z.B. fθ (x) = 1 − xθ e θ 0, , x>0 , sonst. dann ist T (x) = x und der Annahmebereich beim UMP-Test der Hypothese H0 : θ = θ0 gegen H1 : θ < θ0 ist von der Form A(θ0 ) = {x|x ≥ c(θ0 )} mit c(θ0 ) = θ0 log 1 , 1−α 0 < α < 1. Die UMA-Familie eines (1 − α) - Konfidenzintervalls ist von der Form S(x) = {θ|x ∈ A(θ)} = {θ|θ ≤ x 1 } log 1−α # x = −0, , da 1 log 1−α (1 − α) = P (X ≥ c(θ)) = Z ∞ c(θ) h i x ∞ 1 −x e θ dx = −e− θ c(θ) θ c(θ) 1 − α = e− θ c(θ) ln(1 − α) = − θ c(θ) − ln(1 − α) = θ 1 c(θ) ln = 1−α θ c(θ) = θ ln 1 . 1−α Da UMP-Tests i.a. nicht existieren, haben wir uns im vorigen Kapitel auf 11 kleinere Klassen, insbesondere auf die Betrachtung von UMPU (unbiased) Tests beschränkt. Die Dualitätsbetrachtung führt von UMP unbiased Tests zu UMA - unverfälschten Konfidenzmengen. Definition 5.3.2: Eine Familie {S(x)} von Konfidenzmengen für einen Parameter θ ∈ Θ heißt unverfälscht zum Konfidenzniveau 1 − α, wenn Pθ {S(X) 3 θ} ≥1−α Pθ0 {S(X) 3 θ} ≤ 1 − α ∀ θ, θ0 ∈ Θ, , θ = θ0 (5.3.1) und θ0 6= θ . (5.3.2) Ist S(X) mit der obigen Eigenschaft ein Intervall, so sprechen wir von einem unverfälschten (1−α)-Konfidenzintervall. Ist eine Familie unverfälschter Konfidenzmengen zum Niveau 1 − α UMA in der Klasse aller unverfälschten (1 − α)-Konfidenzmengen, so heißt sie eine UMA unverfälschte (UMAU) Familie von Konfidenzmengen zum Niveau 1 − α. Bemerkung 2: Gemäß obiger Definition ist eine Familie S(X) von Konfidenzmengen für θ ∈ Θ zum Niveau 1 − α unverfälscht, wenn S(X) den wahren Paramter mit einer Wahrscheinlichkeit von mindestens 1 − α enthält und einen falschen Parameter mit Wahrscheinlickeit von höchstens 1 − α. S(X) enthält also wahre Parameter öfters als falsche. Satz 5.3.3: Sei A(θ0 ) Annahmebereich eines UMPU α−Niveau-Tests von H0 (θ0 ) : θ = θ0 gegen H1 := θ 6= θ0 ∀ θ0 ∈ Θ. Dann ist S(x) = {θ|x ∈ A(θ)}, x ∈ X , eine UMAU-Familie von Konfidenzmengen zum Niveau 1 − α. Beweis: Um zu sehen, daß S(X) unverfälscht ist, beachte man, daß, da A(θ) Annahmebereich eines unverfälschten Tests ist, Pθ0 {S(X) 3 θ} = Pθ0 {x ∈ A(θ)} ≤1−α . Um zu sehen, daß S(X) UMA ist, betrachte eine beliebige Familie S ∗ (X) unverfälschter (1−α)-Niveau Konfidenzmengen mit A∗ (θ) = {x ∈ X |S ∗ (x) 3 θ}. Dann gilt Pθ0 {X ∈ A∗ (θ)} = Pθ0 {S ∗ (X) 3 θ} ≤ 1 − α und A∗ (θ) ist Annahmebereich eines unverfälschten α−Niveau-Tests. Daraus folgt Pθ0 {S ∗ (X) 3 θ} = Pθ0 {X ∈ A∗ (θ)} ≥ Pθ0 {X ∈ A(θ)} = Pθ0 {S(X) 3 θ} . 12 Die Ungleichung gilt, da A(θ) Annahmebereich eines UMPU-Tests. Beispiel 3: X1 , . . . , Xn u.i. N (µ, σ 2 )-verteilt, µ und σ 2 unbekannt. Der UMPUTest von H0 := µ = µ0 gegen H1 := µ 6= µ0 ist von der Art 1 ϕ(x) = 0, √ 0 )| , | n(X−µ >c S , sonst. Aus ) ( √ n(X − µ ) 0 α = Pµ=µ0 >c S folgt c = tn−1,1−α/2 . Daraus ergibt sich ( √ ) n(X − µ ) 0 A(µ0 ) = x ≤ tn−1,1−α/2 S ist der Annahmebereich eines UMPU α-Niveau-Tests von H0 : µ = µ0 gegen H1 : µ 6= µ0 . Aus Satz 5.3.3 folgt, daß ( S S S(x) = {µ|x ∈ A(µ)} = X̄ − √ tn−1,1− α2 ≤ µ ≤ X̄ + √ tn−1,1− α2 n n ) eine UMAU Familie von Konfidenzmengen zum Niveau 1 − α ist. Bemerkung 3: Beispiel 3 und die Überlegungen zu unverfälschten Tests zeigen, daß das Konzept von der Unverfälschtheit sich besonders dort eignet, wo UMP-Tests nicht existieren. Dies ist beispielsweise der Fall, wenn Θ aus Punkten (θ, τ ) besteht, wobei beide unbekannt sind und eine Konfidenzmenge nur für einen Parameter, etwa θ, gesucht wird. Der andere Parameter τ wird dann als nuisance-Parameter bezeichnet. Bemerkung 4: Bereits weiter oben wurde festgestellt, daß Konfidenzintervalle kürzester Länge häufig nicht existieren. Es kann gezeigt werden, daß die Einschränkung auf die Klasse unverfälschter Konfidenzintervalle es möglich macht, zumindest für viele in der Praxis auftretende Probleme (1−α)-Niveau Konfidenzintervalle zu finden, die gleichmäßig kleinste erwartete Länge in der Klasse aller unverfälschten (1 − α)-Niveau Konfidenzintervalle haben. 5.4. Unverfälschte Konfidenzintervalle Satz 5.4.1: Sei Θ ⊂ IR ein Intervall, fθ eine µ-Dichte für X und S(X) = 13 (θ(X), θ̄(X)) eine Familie von (1 − α)-Niveau Konfidenz(mengen)intervallen mit stochastisch endlicher Länge, d.h. sei Pθ (θ̄(X) − θ(X) < ∞) = 1. Dann gilt Z Z [θ̄(x) − θ(x)]fθ (x)µ(dx) = Pθ (S(X) 3 θ0 )dθ0 ∀θ ∈ Θ. θ6=θ0 Rθ̄ Beweis: Es ist θ̄ − θ = dθ0 . =⇒ ∀θ ∈ Θ dθ0 = Z θ Eθ [θ̄(X) − θ(X)] = Eθ Zθ̄ X θ = Z (Z θ = Z θ̄ fθ (x) (Z θ̄(x) ) dθ0 µ(dx) = θ(x) ) fθ (x)µ(dx) dθ0 Pθ {S(X) 3 θ0 } dθ0 = Z θ6=θ0 Pθ {S(X) 3 θ0 } dθ0 . Satz 5.4.1 sagt mit anderen Worten aus, daß die erwartete Länge eines Konfidenzintervalls gleich der Wahrscheinlichkeit dafür ist, daß S(X) θ enthält, gemittelt über alle falschen Parameterwerte. Bemerkung 1: Ist S(X) eine Familie von UMAU Konfidenzintervallen zum Niveau 1 − α, dann ist die erwartete Länge von S(X) minimal. Denn die linke Seite der Gleichung (5.4.1) ist die erwartete Länge, da S(X) UMAU ist (Satz 5.3.3), gleichmäßig in θ, bezüglich aller unverfälschter (1 − α)-Niveau Konfidenzintervalle. Beispiel: X1 , . . . , Xn u.i. N (µ, σ 2 )-verteilt. Das Konfidenzintervall für µ, S S S(X) = (X̄ − tn−1,1− α2 √ , X̄ + tn−1,1− α2 √ ) n n hat kürzeste Länge und ist, da von einem UMPU-Test abgeleitet, gemäß Satz 5.3.3 UMAU. Gemäß obiger Bemerkung ist damit die erwartete Intervallänge minimal. Die folgende Prozedur zur Bestimmung unverfälschter Konfidenzintervalle 14 (1) führt häufig zum Ziel. Sei T (X, θ) ein Pivot und die Gleichung P (λ1 (α) < T (X, θ) < λ2 (λ) = 1 − α lasse sich umformen zu Pθ (θ(X) < θ < θ̄(X) = 1 − α. Damit (θ(X) < θ < θ̄(X)) unverfälscht ist, muß gelten P (θ, θ0 ) := Pθ (θ(X) < θ0 < θ̄(X)) = 1 − α, falls θ = θ0 (2) und P (θ, θ0 ) < 1 − α, falls θ 6= θ0 . (3) Hängt P (θ, θ0 ) nur von einer Funktion γ von θ und θ0 ab, so können wir schreiben 1−α P (θ, θ0 ) = P (γ) = <1−α für θ = θ0 für θ < θ0 (4) Damit ist P (γ) maximal für θ = θ0 . Im obigen Beispiel sei (n − 1)S 2 ∼ χ2n−1 , σ2 (n − 1)S 2 P (λ1 < < λ2 ) = 1 − α σ2 T (X, σ 2 ) = oder S2 S2 2 < σ < (n − 1) ) = 1 − α. P ((n − 1) λ2 λ1 Dann ist 2 02 P (σ , σ ) = Pσ2 = P mit γ = σ 02 . σ2 S2 S2 0 (n − 1) < σ 2 < (n − 1) λ2 λ1 ! 2 2 T (X, σ ) T (X, σ ) <γ< λ2 λ1 ⇒ P (γ) = P (λ1 γ < T (X, σ 2 ) < λ2 γ) 15 ! Damit ergibt sich aus (5.4.2) und (5.4.3) P (1) = 1 − α (a) und P (γ) < 1 − α. λ1 und λ2 sind also so zu wählen, daß P (1) = 1 − α und dP (γ) |γ=1 = λ2 fn−1 (λ2 ) − λ1 fn−1 (λ1 ) = 0 dγ (b) (a) und (b) sind numerisch zu lösen (siehe Take & Klett, IASA 1959). Die Lösung ist ein unverfälschtes (1 − α) KI, das auch UMAU ist. Beispiel: n = 11, n − 1 = 10, α = 0.10 : Länge des symmetrischen Konfidenzintervalls: " 1 χ210,0.5 − 1 χ210,0.95 # = 1 1 − = 0.199 3.940 18.307 Länge des kürzesten KI mit λ1 = 24.350, λ2 = 4.758 h i 1 1 1 1 − λ1 = 4.758 − 24.350 = 0.169 λ2 0.169 0.199 = 0.85 . D.h. das kürzeste KI ist um 15% kürzer als das ”symmetrische” KI. 16