§6 Testtheorie

Werbung
§6 Testtheorie
Das mit Abstand wichtigste und umfangreichste Teilgebiet der Statistik ist die Testtheorie, welche ihrerseits
wieder in eine Reihe von Unterdisziplinen zerfällt. Wir werden in diesem Kapitel lediglich die Aufgabe der
Testtheorie formulieren und damit verbundene Begriffsbildungen kennen lernen. Konkrete Tests für die
verschiedensten Problemstellungen werden in den folgenden Kapiteln behandelt.
6.1 Die Aufgabe der Testtheorie
Wir formulieren zuerst die Aufgabe der Testtheorie, wobei wir uns der Einfachheit halber auf univariate (eine
Messgröße) Einstichprobenprobleme (eine Grundgesamtheit) beschränken. Was man unter einem multivariaten
Testproblem bzw einem Mehrstichprobenproblem versteht, wird an Hand von einigen typischen Fragestellungen
verdeutlicht.
6.1.1 Die Aufgabe der Testtheorie: Sei X ein a-priori Modell für die Verteilung der Zufallsvariable X. Von
der Verteilung X dieser Zufallsvariablen ist also nur bekannt, dass sie ein Element der Menge X ist. Die
Aufgabe der Testtheorie besteht darin, aufgrund einer nach dem Verteilungsgesetz X ausgewählten konkreten
Stichprobe x = 8x1 , x2 , …, xn < vom Umfang n zu entscheiden, ob die unbekannte Verteilung X Element
einer vorgegebenen Teilmenge 0 von X ist oder aber einer dazu disjunkten Teilmenge 1 von X angehört. 0 heißt dabei die zu testende Hypothese, 1 heißt die zugehörige Alternative.
ô
Etwas respektlos lässt sich die Aufgabe der Testtheorie folgendermaßen beschreiben: Der "Liebe Gott" kennt in
seiner Allwissendheit natürlich das Verteilungsgesetz X , mit dem experimentiert wurde, und weiß damit auch, ob
X œ 0 ist. Wir kennen nur eine nach dem Verteilungsgesetz X ausgewählte konkrete Stichprobe x vom
Umfang n und versuchen, allein aus dieser Kenntnis heraus zu entscheiden, ob X œ 0 ist.
Einige typische Fragestellungen der Testtheorie zusammen mit dem zugehörigen Modell:
ä Fragestellung 1: Ist die Intensität (also die mittlere Anzahl der je Zeiteinheit zerfallenden Teilchen) eines aStrahlers gleich einem gewissen Wert l0 oder ist diese Intensität größer als l0 ?
X = 8@lD ˝ l > 0<
0 = 8@lD ˝ l = l0 <
1 = 8@lD ˝ l > l0 <
ä Fragestellung 2: Ist der Erwartungswert einer normalverteilten Messgröße X kleiner oder höchstens gleich einem
gewissen Wert m0 oder ist dieser Erwartungswert größer als m0 ?
X = 8@m, sD ˝ m œ , s > 0<
0 = 8@m, sD ˝ m § m0 , s > 0<
1 = 8@m, sD ˝ m > m0 , s > 0<
ä Fragestellung 3: Ist die Zufallsvariable X normalverteilt oder genügt X einer anderen stetigen Verteilung?
X = Menge aller stetigen W-Maße auf 0 = 8@m, sD ˝ m œ , s > 0<
1 = X - 0
ä Fragestellung 4: Ist die Körpergröße X von Ehemänner im Durchschnitt gleich der Körpergröße Y ihrer Ehefrauen
oder sind Ehemänner im Durchschnitt größer als ihre Ehefrauen?
X ,Y = 8@m, SD ˝ m = 8m x m y < œ 2 , S œ 22 positiv definitD<
0 = 8@m, SD ˝ m = 8m x , m y < œ 2 mit m x = m y , S œ 22 positiv definit<
06_Testtheorie.nb
2
8@
<
2
2
2
1 = 8@m, SD ˝ m = 8m x , m y < œ mit m x > m y , S œ 2 positiv definit<
D˝
8
<
ä Fragestellung 5: Ist die Körpergröße X von Männern im Durchschnitt gleich der Körpergröße Y von Frauen oder
sind Männer im Durchschnitt größer als Frauen?
X µY = 88@m x , s x D, @m y , s y D< ˝ m x , m y œ , s x , s y > 0<
0 = 88@m, s x D, @m, s y D< ˝ m œ , s x , s y > 0<
1 = 88@m x , s x D, @m y , s y D< ˝ m x > m y œ , s x , s y > 0<
ä Fragestellung 6: Hat die Art des verwendeten Düngemittels (es stehen s verschiedene Düngemittel zur Verfügung)
einen Einfluss auf den Hektarertrag von Mais?
X µ X µ… µ Xs = 88@m1 , sD, @m2 , sD, …, @ms , sD< ˝ m1 , m2 …, ms œ , s > 0<
1
2
0 = 88@m, sD, @m, sD, …, @m, sD< ˝ m œ , s > 0<
1 = X µ X µ…µ Xs - 0
1
2
Bei diesen 6 Fragestellungen handelt es sich um ganz unterschiedliche Problemstellungen,
6.1.2 Begriffsbildungen der Testtheorie:
ä Bei der dritten Fragestellung handelt es sich um ein nichtparametrisches Testproblem, bei allen anderen
Fragestellungen handelt es sich um parametrische Testprobleme.
ä Bei der vierten Fragestellung handelt es sich um ein bivariates Einstichprobenproblem - man hat es mit einer
Grundgesamtheit (Ehepaare) und zwei Messgrößen (Körpergröße des Ehemanns, Körpergröße der Ehefrau) zu
tun.
ä Bei der fünften Fragestellung liegt ein univariates Zweistichprobenproblem vor - man hat es mit zwei
Grundgesamtheiten (Männer, Frauen) und einer Messgröße (Körpergröße) zu tun.
ä Bei der sechsten Fragestellung handelt es sich um ein univariates Mehrstichprobenproblem - man hat es mit s
Grundgesamtheiten (verschiedene Düngemittel) und einer Messgröße (Hektarertrag) zu tun.
Mit dem folgenden einfachen Beispiel soll die Situation verdeutlicht werden, mit der ein Statistiker im Rahmen der
Testtheorie konfrontiert ist:
6.1.3 Beispiel: Wir betrachten das Testproblem
X = 8@lD ˝ l > 0<
0 = 8@l0 D<
1 = 8@lD ˝ l > l0 <
Zuerst erzeuge man eine @l0 D-verteilte Stichprobe x = 8x1 , x2 , …, xn < vom Umfang n und stelle diese
Stichprobe graphisch dar. Nun vergesse man, mit welchem l0 diese Stichprobe erzeugt wurde und versuche,
ausgehend von dieser Stichprobe zu entscheiden, ob die Hypothese 0 angenommen werden soll (es spricht
nichts gegen die Annahme, dass diese Stichprobe nach dem Verteilungsgesetz @l0 D ausgewählt wurde) oder
ob die Hypothese 0 abgelehnt und dafür die Alternative 1 angenommen werden soll (es scheint, dass diese
Stichprobe nach einem Verteilungsgesetz @lD mit l > l0 ausgewählt wurde).
ô
Lösung: Wir erzeugen in der üblichen Weise n nach dem Verteilungsgesetz @l0 D ausgewählte Zufallszahlen und
veranschaulichen diese Stichprobe x = 8x1 , x2 , …, xn < mit Hilfe von ListPlot graphisch
06_Testtheorie.nb
3
n = 25; l0 = 3;
x = RandomReal@ExponentialDistribution@l0D, 8n<D
ListPlot@Thread@8x, 0<D, PlotStyle Æ [email protected], Red<, Axes Æ 8True, None<, AspectRatio Æ 0.1D
80.0377072, 0.131562, 0.0214648, 0.294971, 0.0360856,
0.121161, 0.121704, 0.413344, 0.0141943, 1.04212, 0.453068,
0.187257, 0.162643, 0.491198, 0.166538, 0.651322, 1.09263, 0.267207,
0.207223, 0.165102, 0.318691, 0.799391, 0.155465, 0.438699, 0.104339<
0.0
0.2
0.4
0.6
0.8
1.0
Vergisst man nun, mit welchem Wert l0 diese Stichprobe erzeugt wurde, so liefert weder diese Stichprobe noch
deren graphische Darstellung einen offensichtlichen Hinweis darauf, ob die Hypothese 0 angenommen oder
abgelehnt werden soll. Erinnert man sich aber daran, dass x-1 ein guter Schätzwert für den unbekannten Parameter
l einer Exponentialverteilung ist, so liegt es nahe, die Hypothese 0 abzulehnen und die Alternative 1
anzunehmen, wenn dieser Schätzwert "deutlich größer" als l0 ist:
1 ê Mean@xD
Clear@n, l0, xD
3.16653
Wie dieses "deutlich größer" zu interpretieren ist, bleibt aber noch offen.
Abhängig vom vorliegenden Testproblem werden wir also nach geeigneten Abbildungen t : n Ø 80, 1< suchen und
im Fall t@xD = 0 die Hypothese 0 annehmen und im Fall t@xD = 1 die Hypothese 0 verwerfen und die Alternative
1 annehmen. Man beachte, dass es sich beim Vektor x = 8x1 , x2 , …, xn < um eine nach dem Verteilungsgesetz X
ausgewählte Stichprobe vom Umfang n handelt und das Annehmen bzw Ablehnen der Hypothese 0 den Entscheidungen X œ 0 bzw X œ 1 entspricht.
Das Annehmen der Hypothese 0 bedeutet dabei nur, dass nichts Gravierendes gegen die Annahme spricht, dass
jenes Verteilungsgesetz X , nach dem die Stichprobe x = 8x1 , x2 , …, xn < ausgewählt wurde, ein Element von 0
ist. Wie in den Naturwissenschaften üblich, heißt dies aber nicht!, dass die Hypothese 0 tatsächlich richtig ist.
Das Ablehnen der Hypothese 0 und Annehmen der Alternative 1 bedeutet hingegen, dass jenes Verteilungsgesetz X , nach dem die Stichprobe x = 8x1 , x2 , …, xn < ausgewählt wurde, in krassem Widerspruch zur Hypothese
0 steht, es also sehr unwahrscheinlich ist, mit einem Verteilungsgesetz X œ 0 die vorliegende Stichprobe
x = 8x1 , x2 , …, xn < zu erzeugen.
Natürlich hängt der Wert t@xD und damit auch die getroffene Entscheidung über die Annahme bzw Ablehnung der
Hypothese 0 von der jeweiligen konkreten Stichprobe x = 8x1 , x2 , …, xn < ab. Soll auf den zufälligen Charakter
dieser Entscheidung t@xD näher eingegangen werden, so verwendet man dazu die Statistik T = t@X D.
Wir definieren in diesem Zusammenhang:
6.1.4 Definition: Ist X ein (parametrisches oder nichtparametrisches) a-priori Modell für die Verteilung der
Zufallsvariablen X, sind 0 und 1 zwei disjunkte Teilmengen von X und ist X = 8X1 , X2 , …, Xn < eine
nach dem Verteilungsgesetz X ausgewählte mathematische Stichprobe vom Umfang n, so nennt man jede
Statistik T = t@X D, welche nur die beiden Werte 0 und 1 annehmen kann, einen möglichen Test für die
Hypothese 0 gegen die Alternative 1 . Das Ereignis 8T = 0< nennt man den Annahmebereich, das Ereignis
8T = 1< den Ablehnungsbereich des Tests T.
6.1.5 Bemerkung: Üblicherweise lässt sich der Ablehnungsbereich 8T = 1< eines Tests T in der Form 8S > <
06_Testtheorie.nb
4
Üblicherweise lässt sich der Ablehnungsbereich 8T 1< eines Tests T in der Form 8S <
darstellen. Man nennt dann die Statistik S = s@X D die zum Test T gehörende Teststatistik und den zugehörigen Schwellwert.
6.1.6 Beispiel: Wir betrachten nochmals das Testproblem
X = 8@lD ˝ l > 0<
0 = 8@l0 D<
1 = 8@lD ˝ l > l0 <
aus Beispiel 6.1.3. Gesucht ist ein möglicher Test sowie die zugehörige Teststatistik.
ô
Lösung: Wir haben in Beispiel 6.1.3 bereits erkannt, dass es naheliegt, die Hypothese 0 abzulehnen und die
Alternative 1 anzunehmen, wenn der Schätzwert x-1 "deutlich größer" als l0 ist. Also ist
T =:
1
0
falls X -1 > falls X -1 § ein möglicher Test für die Hypothese 0 gegen die Alternative 1 und S = X -1 die zugehörige Teststatistik. Der
Ablehnungsbereich 8T = 1< dieses Tests hat damit die Form 8X -1 > <, wobei aber noch nicht klar ist, wie dieser
Schwellwert gewählt werden soll.
6.2 Die Güte von Tests
Sei X ein (parametrisches oder nichtparametrisches) a-priori Modell für die Verteilung von X, seien 0 und 1
zwei disjunkte Teilmengen von X und sei X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathematische Stichprobe vom Umfang n. Im Prinzip könnte man natürlich jede beliebige Statistik
T = t@X D, welche nur die beiden Werte 0 und 1 annimmt, als Test für die Hypothese 0 gegen die Alternative 1
verwenden. Es ist aber wieder klar, dass sich einige Statistiken dafür besser eignen als andere.
Wir werden uns daher als erstes mit der Frage befassen, wie sich die "Güte von Tests" beschreiben lässt:
6.2.1 Definition:
a) Unter einer Fehlentscheidung 1. Art versteht man das irrtümliche Ablehnen der Hypothese 0 (in Wirklichkeit wurde die Stichprobe x = 8x1 , x2 , …, xn < nach einem Verteilungsgesetz X œ 0 ausgewählt; wegen
t@xD = 1 wird die Hypothese 0 aber verworfen und dafür 1 angenommen).
b) Unter einer Fehlentscheidung 2. Art versteht man das irrtümliche Annehmen der Hypothese 0 (in Wirklichkeit wurde die Stichprobe x = 8x1 , x2 , …, xn < nach einem Verteilungsgesetz X œ 1 ausgewählt; wegen
t@xD = 0 wird die Hypothese 0 aber angenommen).
c) Ist T ein Test für die Hypothese 0 gegen die Alternative 1 , so nennt man die Abbildung
XT : X Ø 80, 1<
mit
XT @ X D = @8T = 1<; X D
die Operationscharakteristik von T.
d) Ein Test T für die Hypothese 0 gegen die Alternative 1 besitzt das Signifikanzniveau a, wenn die
Wahrscheinlichkeit einer Fehlentscheidung 1. Art stets durch a beschränkt ist, wenn also für alle X œ 0
@8T = 1<; X D § a
gilt. In Zukunft werden wir einfach von einem Test mit Signifikanz a reden.
e) Sind T1 und T2 zwei Test für die Hypothese 0 gegen die Alternative 1 mit Signifikanz a, so heißt der
Test T1 mächtiger (more effective) als der Test T2 , wenn die Wahrscheinlichkeit einer Fehlentscheidung 2. Art
bei Verwendung von T1 stets kleiner ist als bei Verwendung von T2 , wenn also für alle X œ 1 die folgende
06_Testtheorie.nb
bei Verwendung von T1 stets kleiner ist als bei Verwendung von T2 , wenn also für alle X
Beziehung gilt:
5
1 die folgende
@8T1 = 0<; X D § @8T2 = 0<; X D
f) Ist T ein Test für die Hypothese 0 gegen die Alternative 1 , ist S = s@X D die zugehörige Teststatistik (hat
also der Ablehnungsbereich 8T = 1< von T die Form 8S > <, wobei ein geeigneter Schwellwert ist) und ist
x = 8x1 , x2 , …, xn < eine nach dem Verteilungsgesetz X œ X ausgewählte Stichprobe vom Umfang n, so
nennt man die Zahl
@xD = Max@@8S > s@xD<; X D ˝ X œ 0 D
den zu dieser Stichprobe x gehörenden p-Wert des Tests T. Je kleiner dieser p-Wert @xD ausfällt, umso
deutlicher widerspricht die Stichprobe x der Hypothese 0 und führt damit zu deren Ablehnung.
Zu dieser Definition sind einige Bemerkungen angebracht:
† Bei Fehlentscheidungen 1. Art spricht man auch vom Produzentenrisiko, weil eine derartige Fehlentscheidung
dann eintritt, wenn ein der Norm entsprechendes Los bei der Qualitätskontrolle irrtümlich zurückgehalten wird und
damit dem Produzenten Kosten erwachsen. Bei Fehlentscheidung 2. Art spricht man auch vom Konsumentenrisiko,
weil eine derartige Fehlentscheidung dann eintritt, wenn ein der Norm nicht entsprechendes Los die Quali-tätskontrolle irrtümlich passiert und damit der Konsument den Schaden hat.
† Besitzt ein Test T für die Hypothese 0 gegen die Alternative 1 das Signifikanzniveau a, so wissen wir, dass
die Wahrscheinlichkeit einer Fehlentscheidung 1. Art durch a beschränkt ist. Über die Wahrscheinlichkeit einer
Fehlentscheidung 2. Art wissen wir damit jedoch praktisch nichts. Man wird deshalb das Testproblem nach
Möglichkeit so formulieren, dass Fehlentscheidungen 1. Art die "gefährlichen" Fehlentscheidungen sind und das
Hauptaugenmerk stets auf das Zurückweisen der Hypothese 0 legen. Man beachte also die Merkregel: Was
bewiesen werden soll, ist als Alternative zu formulieren.
† Üblicherweise verwendet man für das Signifikanzniveau die Werte a = 0.05 (man erlaubt, dass die Hypothese in
fünf von 100 gleich gelagerten Fällen irrtümlich abgelehnt wird) oder a = 0.01 (man erlaubt, dass die Hypothese
nur in einem von 100 gleich gelagerten Fällen irrtümlich abgelehnt wird). Je kleiner das Signifikanzniveau a
gewählt wird, umso deutlicher widerspricht das Datenmaterial im Falle einer Ablehnung der Hypothese 0 .
† Mit Hilfe der Operationscharakteristik XT lässt sich die "Güte" eines Tests T sehr einprägsam beschreiben. Man
erkennt dabei, dass die Wahrscheinlichkeit einer Fehlentscheidung 1. Art durch den sogenannten Alpha-Fehler
Max@@8T = 1<; X D ˝ X œ 0 D
und die Wahrscheinlichkeit einer Fehlentscheidung 2. Art durch den sogenannten Beta-Fehler
Max@@8T = 0<; X D ˝ X œ 1 D = 1 - Min@@8T = 1<; X D ˝ X œ 1 D
beschränkt ist. Man beachte ferner, dass das Signifikanzniveau a eines Tests T stets mindestens so groß ist, wie
dessen Alpha-Fehler. In der Regel stimmen das Signifikanzniveau a eines Tests T und dessen Alpha-Fehler überein.
06_Testtheorie.nb
6
XT @ X D
1.0
Beta-Fehler
0.8
Wahrscheinlichkeit einer
Fehlentscheidung 2. Art
0.6
0.4
Wahrscheinlichkeit einer
Fehlentscheidung 1. Art
Alpha-Fehler
0.2
X
0
1
† An Hand der Operationscharakteristik XT erkennt man, dass es unmöglich ist, sowohl den Alpha-Fehler als auch
den Beta-Fehler gleichzeitig klein zu machen. Da man sich in der Regel auf das Ablehnen der Hypothese 0
konzentriert, wird man versuchen, den Alpha-Fehler klein zu halten. Es gibt aber auch Fälle, in denen das Ablehnen
der Alternative 1 im Vordergrund steht. Da der Beta-Fehler jedoch oft nicht berechnet werden kann, wird man in
diesen Fällen einfach mit einem großen Alpha-Fehler arbeiten.
† Ist T ein Test für die Hypothese 0 gegen die Alternative 1 und ist S = s@X D die zugehörige Teststatistik, so
entspricht der zur Stichprobe x gehörende p-Wert @xD dem Alpha-Fehler des Tests mit Ablehnungsbereich
9S ¥ s@xD=. Statt anzugeben, für welchen Schwellwert a der Test T mit dem Ablehnungsbereich 8S ¥ a < gerade
noch das Signifikanzniveau a besitzt, und anschließend zu prüfen, ob aufgrund der vorliegenden Stichprobe x die
Hypothese 0 wegen s@xD ¥ a abgelehnt werden soll, gibt man oft nur den p-Wert @xD dieser Stichprobe x an. Je
kleiner dieser p-Wert ausfällt, umso signifikanter widerspricht die Stichprobe x der Hypothese 0 .
An Hand von konkreten Beispielen sollen diese Begriffe näher erläutert werden:
6.2.2 Beispiel: Wir betrachten nochmals das Testproblem
X = 8@lD ˝ l > 0<
0 = 8@l0 D<
1 = 8@lD ˝ l > l0 <
aus Beispiel 6.1.3. Wie muss der Schwellwert des in Beispiel 6.1.6 angeführten Tests T für die Hypothese
0 gegen die Alternative 1 gewählt werden, damit dieser Test das Signifikanzniveau a besitzt?
ô
Lösung: Der Ablehnungsbereich des in Beispiel 6.1.6 angeführten Tests T hat die Form
8X -1 > < = 8X  1 ê<
Damit dieser Test T das Signifikanzniveau a besitzt, muß
@88X  1 ê<<; @l0 DD = @88X1 + X2 + … + Xn  n ê<<; @l0 DD = a
gelten. Nun ist aber X1 + X2 + … + Xn bekanntlich @n, l0 D-verteilt. Wählt man daher für den Schwellwert den
Wert = n ên,l ;a , wobei n,m; das -Quantil der @n, mD-Verteilung bezeichnet, so besitzt dieser Test offenbar
0
das Signifikanzniveau a.
Wir demonstrieren die Arbeitsweise dieses Tests: Dazu erzeugen wir zuerst eine @lD-verteilte Stichprobe vom
Umfang n und testen anschließend, ob die Hypothese 0 = 8@l0 D< bei Verwendung des Signifikanzniveaus a
abgelehnt und damit die Alternative 1 = 8@lD ˝ l > l0 < angenommen wird, wobei wir auch den zugehörigen p-
06_Testtheorie.nb
7
abgelehnt und damit die Alternative 1 8@ D ˝
0 < angenommen wird, wobei wir auch den zugehörigen pWert angeben (man beachte, dass bekanntlich @n, mD = amma@n, 1 ê mD gilt):
n = 25; l = 5; l0 = 3; a = 0.05;
x = RandomReal@ExponentialDistribution@lD, 8n<D;
If @n Mean@xD < Quantile@GammaDistribution@n, 1 ê l0D, aD,
Print@"Reject null hypothesis at significance level Æ ", aD,
Print@"Fail to reject null hypothesis at significance level Æ ", aDD
Print@"p-value = ", CDF@GammaDistribution@n, 1 ê l0D, n Mean@xDDD
Clear@n, l, l0, a, xD
Fail to reject null hypothesis at significance level → 0.05
p−value = 0.0731951
Wir erkennen: Je größer der Stichprobenumfang n ist, um so eher plädiert dieser Test im Fall l > l0 auf Ablehnung
der Hypothese 0 = 8@l0 D<. Ist l = l0 , so wird dieser Test die Hypothese 0 = 8@l0 D< in etwa 100 a von 100
Fällen ungerechtfertigt ablehnen.
6.2.3 Beispiel: Für das "einseitige" Testproblem
X = 8@m, s0 D ˝ m œ <
0 = 8@m, s0 D ˝ m § m0 <
1 = 8@m, s0 D ˝ m > m0 <
ist ein Test T mit Signifikanz a gesucht. Für diesen Test ist die Operationscharakteristik XT zu zeichnen.
ô
Lösung:
a) Der Mittelwert X HnL ist bekanntlich ein erwartungstreuer (und damit guter) Schätzer für den unbekannten
Parameter m. Es liegt daher nahe, die Hypothese 0 abzulehnen, wenn X HnL deutlich größer als m0 ist. Damit der
Test T mit dem Ablehnungsbereich 8T = 1< = 8X HnL -m0 > < das vorgegebene Signifikanzniveau a besitzt, muss
der Schwellwert so gewählt werden, dass für alle m § m0 die Beziehung
@8X HnL -m0 > <; @m, s0 DD § a
gilt. Die Faltungsformeln und der Satz über die affine Transformation liefern für alle m § m0 die Abschätzung
@8X HnL -m0 > <; @m, s0 DD = @8
X HnL - m
s0
n >
- m + m0
s0
n <; @m, s0 DD § 1 - f@
s0
nD
wobei f die Verteilungsfunktion der @0, 1D-Verteilung bezeichnet. Da die beiden Aussagen
1 - f@
s0
n D=a
und
s0
n = 1-a
offenbar gleichbedeutend sind (mit bezeichnen wir das -Quantil der @0, 1D-Verteilung), besitzt der Test T für
die Hypothese 0 gegen die Alternative 1 mit dem Ablehnungsbereich
8T = 1< = 8X HnL - m0 > < = 8
X HnL - m0
s0
n > 1-a <
das Signifikanzniveau a.
b) Für diesen Test T zeichnen wir nun die Operationscharakteristik XT , wobei wir auf der x-Achse den Parameter m
und auf der y-Achse die zugehörigen Wahrscheinlichkeiten
06_Testtheorie.nb
8
XT @mD = @8T = 1<; @m, s0 DD = @8
= @8
X HnL - m
s0
n > 1-a -
X HnL - m0
s0
m - m0
s0
n > 1-a <; @m, s0 DD =
n <; @m, s0 DD = 1 - f@
1-a -
m - m0
s0
nD
auftragen (das Signifikanzniveau a sowie der Stichprobenumfang n ist dabei dynamisch wählbar):
m0 = 2; s0 = 2;
ManipulateAq = Quantile@NormalDistribution@0, 1D, 1 - aD;
PlotA1 - CDF@NormalDistribution@0, 1D, q - Hm - m0L Sqrt@nD ê s0D, 8m, 0, 4<, AxesOrigin Æ 80, 0<,
AspectRatio Æ 0.5, PlotStyle Æ [email protected], AxesLabel Æ 9"m", "@8T=1<; @m,s0 DD"=,
ImageSize Æ 8200, 100<E,
8a, 0.01, 0.5, Appearance Æ "Labeled"<, 8n, 20, 100, 1, Appearance Æ "Labeled"<E
6.2.4 Beispiel: Für das "zweiseitige" Testproblem
X = 8@m, s0 D ˝ m œ <
0 = 8@m0 , s0 D<
1 = 8@m, s0 D ˝ m ∫ m0 <
ist ein Test T mit Signifikanz a gesucht. Für diesen Test ist die Operationscharakteristik XT zu zeichnen.
ô
Lösung:
a) Da der Mittelwert X HnL bekanntlich ein erwartungstreuer (und damit guter) Schätzer für den unbekannten
Parameter m ist, liegt es nahe, die Hypothese 0 dann abzulehnen, wenn sich X HnL -m0 dem Betrag nach deutlich
von 0 unterscheidet. Damit der Test T mit dem Ablehnungsbereich 8T = 1< = 8 X HnL -m0 > < das vorgegebene
Signifikanzniveau a besitzt, muss der Schwellwert so gewählt werden, dass
@8 X HnL - m0 > <; @m0 , s0 DD = a
ist. Aus den Faltungsformeln und dem Satz über die affine Transformation folgt aber
@8 X HnL - m0 > <; @m0 , s0 DD = @8
X HnL - m0
s0
n >
s0
n <; @m0 , s0 DD = 2 f@-
s0
nD
wobei f wieder die Verteilungsfunktion der @0, 1D-Verteilung bezeichnet. Da die beiden Aussagen
2 f@-
s0
n D=a
und
s0
n = 1-aê2
offenbar gleichbedeutend sind, besitzt der Test T für die Hypothese 0 gegen die Alternative 1 mit dem
Ablehnungsbereich
8T = 1< = 8 X HnL - m0 > < = 8
X HnL - m0
s0
n > 1-aê2 <
das Signifikanzniveau a.
b) Für diesen Test T zeichnen wir nun die Operationscharakteristik XT , wobei wir auf der x-Achse den Parameter m
und auf der y-Achse die zugehörigen Wahrscheinlichkeiten
XT @mD = @8T = 1<; @m, s0 DD = @8
X HnL - m0
s0
n
> 1-aê2 <; @m, s0 DD =
06_Testtheorie.nb
9
= 1 - @8-
1-aê2 §
X HnL - m0
s0
= 1 - @8-
1-aê2 -
m - m0
s0
= 1 - f@
1-aê2 -
m - m0
s0
n § 1-aê2 <; @m, s0 DD =
HnL
n § X -m
s0
n D + f@-
1-aê2 -
n § 1-aê2 m - m0
s0
m - m0
s0
n <; @m, s0 DD =
nD
auftragen (das Signifikanzniveau a sowie der Stichprobenumfang ist dabei wieder dynamisch wählbar)::
m0 = 2; s0 = 2;
ManipulateAq = Quantile@NormalDistribution@0, 1D, 1 - a ê 2D;
PlotA1 - CDF@NormalDistribution@0, 1D, q - Hm - m0L Sqrt@nD ê s0D +
CDF@NormalDistribution@0, 1D, -q - Hm - m0L Sqrt@nD ê s0D, 8m, 0, 4<, AxesOrigin Æ 80, 0<,
AspectRatio Æ 0.5, PlotStyle Æ [email protected], AxesLabel Æ 9"m", "@8T=1<; @m,s0 DD"=,
ImageSize Æ 8200, 100<E,
8a, 0.01, 0.5, Appearance Æ "Labeled"<, 8n, 20, 100, Appearance Æ "Labeled"<E
Herunterladen