§6 Testtheorie Das mit Abstand wichtigste und umfangreichste Teilgebiet der Statistik ist die Testtheorie, welche ihrerseits wieder in eine Reihe von Unterdisziplinen zerfällt. Wir werden in diesem Kapitel lediglich die Aufgabe der Testtheorie formulieren und damit verbundene Begriffsbildungen kennen lernen. Konkrete Tests für die verschiedensten Problemstellungen werden in den folgenden Kapiteln behandelt. 6.1 Die Aufgabe der Testtheorie Wir formulieren zuerst die Aufgabe der Testtheorie, wobei wir uns der Einfachheit halber auf univariate (eine Messgröße) Einstichprobenprobleme (eine Grundgesamtheit) beschränken. Was man unter einem multivariaten Testproblem bzw einem Mehrstichprobenproblem versteht, wird an Hand von einigen typischen Fragestellungen verdeutlicht. 6.1.1 Die Aufgabe der Testtheorie: Sei X ein a-priori Modell für die Verteilung der Zufallsvariable X. Von der Verteilung X dieser Zufallsvariablen ist also nur bekannt, dass sie ein Element der Menge X ist. Die Aufgabe der Testtheorie besteht darin, aufgrund einer nach dem Verteilungsgesetz X ausgewählten konkreten Stichprobe x = 8x1 , x2 , …, xn < vom Umfang n zu entscheiden, ob die unbekannte Verteilung X Element einer vorgegebenen Teilmenge 0 von X ist oder aber einer dazu disjunkten Teilmenge 1 von X angehört. 0 heißt dabei die zu testende Hypothese, 1 heißt die zugehörige Alternative. ô Etwas respektlos lässt sich die Aufgabe der Testtheorie folgendermaßen beschreiben: Der "Liebe Gott" kennt in seiner Allwissendheit natürlich das Verteilungsgesetz X , mit dem experimentiert wurde, und weiß damit auch, ob X œ 0 ist. Wir kennen nur eine nach dem Verteilungsgesetz X ausgewählte konkrete Stichprobe x vom Umfang n und versuchen, allein aus dieser Kenntnis heraus zu entscheiden, ob X œ 0 ist. Einige typische Fragestellungen der Testtheorie zusammen mit dem zugehörigen Modell: ä Fragestellung 1: Ist die Intensität (also die mittlere Anzahl der je Zeiteinheit zerfallenden Teilchen) eines aStrahlers gleich einem gewissen Wert l0 oder ist diese Intensität größer als l0 ? X = 8@lD ˝ l > 0< 0 = 8@lD ˝ l = l0 < 1 = 8@lD ˝ l > l0 < ä Fragestellung 2: Ist der Erwartungswert einer normalverteilten Messgröße X kleiner oder höchstens gleich einem gewissen Wert m0 oder ist dieser Erwartungswert größer als m0 ? X = 8@m, sD ˝ m œ , s > 0< 0 = 8@m, sD ˝ m § m0 , s > 0< 1 = 8@m, sD ˝ m > m0 , s > 0< ä Fragestellung 3: Ist die Zufallsvariable X normalverteilt oder genügt X einer anderen stetigen Verteilung? X = Menge aller stetigen W-Maße auf 0 = 8@m, sD ˝ m œ , s > 0< 1 = X - 0 ä Fragestellung 4: Ist die Körpergröße X von Ehemänner im Durchschnitt gleich der Körpergröße Y ihrer Ehefrauen oder sind Ehemänner im Durchschnitt größer als ihre Ehefrauen? X ,Y = 8@m, SD ˝ m = 8m x m y < œ 2 , S œ 22 positiv definitD< 0 = 8@m, SD ˝ m = 8m x , m y < œ 2 mit m x = m y , S œ 22 positiv definit< 06_Testtheorie.nb 2 8@ < 2 2 2 1 = 8@m, SD ˝ m = 8m x , m y < œ mit m x > m y , S œ 2 positiv definit< D˝ 8 < ä Fragestellung 5: Ist die Körpergröße X von Männern im Durchschnitt gleich der Körpergröße Y von Frauen oder sind Männer im Durchschnitt größer als Frauen? X µY = 88@m x , s x D, @m y , s y D< ˝ m x , m y œ , s x , s y > 0< 0 = 88@m, s x D, @m, s y D< ˝ m œ , s x , s y > 0< 1 = 88@m x , s x D, @m y , s y D< ˝ m x > m y œ , s x , s y > 0< ä Fragestellung 6: Hat die Art des verwendeten Düngemittels (es stehen s verschiedene Düngemittel zur Verfügung) einen Einfluss auf den Hektarertrag von Mais? X µ X µ… µ Xs = 88@m1 , sD, @m2 , sD, …, @ms , sD< ˝ m1 , m2 …, ms œ , s > 0< 1 2 0 = 88@m, sD, @m, sD, …, @m, sD< ˝ m œ , s > 0< 1 = X µ X µ…µ Xs - 0 1 2 Bei diesen 6 Fragestellungen handelt es sich um ganz unterschiedliche Problemstellungen, 6.1.2 Begriffsbildungen der Testtheorie: ä Bei der dritten Fragestellung handelt es sich um ein nichtparametrisches Testproblem, bei allen anderen Fragestellungen handelt es sich um parametrische Testprobleme. ä Bei der vierten Fragestellung handelt es sich um ein bivariates Einstichprobenproblem - man hat es mit einer Grundgesamtheit (Ehepaare) und zwei Messgrößen (Körpergröße des Ehemanns, Körpergröße der Ehefrau) zu tun. ä Bei der fünften Fragestellung liegt ein univariates Zweistichprobenproblem vor - man hat es mit zwei Grundgesamtheiten (Männer, Frauen) und einer Messgröße (Körpergröße) zu tun. ä Bei der sechsten Fragestellung handelt es sich um ein univariates Mehrstichprobenproblem - man hat es mit s Grundgesamtheiten (verschiedene Düngemittel) und einer Messgröße (Hektarertrag) zu tun. Mit dem folgenden einfachen Beispiel soll die Situation verdeutlicht werden, mit der ein Statistiker im Rahmen der Testtheorie konfrontiert ist: 6.1.3 Beispiel: Wir betrachten das Testproblem X = 8@lD ˝ l > 0< 0 = 8@l0 D< 1 = 8@lD ˝ l > l0 < Zuerst erzeuge man eine @l0 D-verteilte Stichprobe x = 8x1 , x2 , …, xn < vom Umfang n und stelle diese Stichprobe graphisch dar. Nun vergesse man, mit welchem l0 diese Stichprobe erzeugt wurde und versuche, ausgehend von dieser Stichprobe zu entscheiden, ob die Hypothese 0 angenommen werden soll (es spricht nichts gegen die Annahme, dass diese Stichprobe nach dem Verteilungsgesetz @l0 D ausgewählt wurde) oder ob die Hypothese 0 abgelehnt und dafür die Alternative 1 angenommen werden soll (es scheint, dass diese Stichprobe nach einem Verteilungsgesetz @lD mit l > l0 ausgewählt wurde). ô Lösung: Wir erzeugen in der üblichen Weise n nach dem Verteilungsgesetz @l0 D ausgewählte Zufallszahlen und veranschaulichen diese Stichprobe x = 8x1 , x2 , …, xn < mit Hilfe von ListPlot graphisch 06_Testtheorie.nb 3 n = 25; l0 = 3; x = RandomReal@ExponentialDistribution@l0D, 8n<D ListPlot@Thread@8x, 0<D, PlotStyle Æ [email protected], Red<, Axes Æ 8True, None<, AspectRatio Æ 0.1D 80.0377072, 0.131562, 0.0214648, 0.294971, 0.0360856, 0.121161, 0.121704, 0.413344, 0.0141943, 1.04212, 0.453068, 0.187257, 0.162643, 0.491198, 0.166538, 0.651322, 1.09263, 0.267207, 0.207223, 0.165102, 0.318691, 0.799391, 0.155465, 0.438699, 0.104339< 0.0 0.2 0.4 0.6 0.8 1.0 Vergisst man nun, mit welchem Wert l0 diese Stichprobe erzeugt wurde, so liefert weder diese Stichprobe noch deren graphische Darstellung einen offensichtlichen Hinweis darauf, ob die Hypothese 0 angenommen oder abgelehnt werden soll. Erinnert man sich aber daran, dass x-1 ein guter Schätzwert für den unbekannten Parameter l einer Exponentialverteilung ist, so liegt es nahe, die Hypothese 0 abzulehnen und die Alternative 1 anzunehmen, wenn dieser Schätzwert "deutlich größer" als l0 ist: 1 ê Mean@xD Clear@n, l0, xD 3.16653 Wie dieses "deutlich größer" zu interpretieren ist, bleibt aber noch offen. Abhängig vom vorliegenden Testproblem werden wir also nach geeigneten Abbildungen t : n Ø 80, 1< suchen und im Fall t@xD = 0 die Hypothese 0 annehmen und im Fall t@xD = 1 die Hypothese 0 verwerfen und die Alternative 1 annehmen. Man beachte, dass es sich beim Vektor x = 8x1 , x2 , …, xn < um eine nach dem Verteilungsgesetz X ausgewählte Stichprobe vom Umfang n handelt und das Annehmen bzw Ablehnen der Hypothese 0 den Entscheidungen X œ 0 bzw X œ 1 entspricht. Das Annehmen der Hypothese 0 bedeutet dabei nur, dass nichts Gravierendes gegen die Annahme spricht, dass jenes Verteilungsgesetz X , nach dem die Stichprobe x = 8x1 , x2 , …, xn < ausgewählt wurde, ein Element von 0 ist. Wie in den Naturwissenschaften üblich, heißt dies aber nicht!, dass die Hypothese 0 tatsächlich richtig ist. Das Ablehnen der Hypothese 0 und Annehmen der Alternative 1 bedeutet hingegen, dass jenes Verteilungsgesetz X , nach dem die Stichprobe x = 8x1 , x2 , …, xn < ausgewählt wurde, in krassem Widerspruch zur Hypothese 0 steht, es also sehr unwahrscheinlich ist, mit einem Verteilungsgesetz X œ 0 die vorliegende Stichprobe x = 8x1 , x2 , …, xn < zu erzeugen. Natürlich hängt der Wert t@xD und damit auch die getroffene Entscheidung über die Annahme bzw Ablehnung der Hypothese 0 von der jeweiligen konkreten Stichprobe x = 8x1 , x2 , …, xn < ab. Soll auf den zufälligen Charakter dieser Entscheidung t@xD näher eingegangen werden, so verwendet man dazu die Statistik T = t@X D. Wir definieren in diesem Zusammenhang: 6.1.4 Definition: Ist X ein (parametrisches oder nichtparametrisches) a-priori Modell für die Verteilung der Zufallsvariablen X, sind 0 und 1 zwei disjunkte Teilmengen von X und ist X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathematische Stichprobe vom Umfang n, so nennt man jede Statistik T = t@X D, welche nur die beiden Werte 0 und 1 annehmen kann, einen möglichen Test für die Hypothese 0 gegen die Alternative 1 . Das Ereignis 8T = 0< nennt man den Annahmebereich, das Ereignis 8T = 1< den Ablehnungsbereich des Tests T. 6.1.5 Bemerkung: Üblicherweise lässt sich der Ablehnungsbereich 8T = 1< eines Tests T in der Form 8S > < 06_Testtheorie.nb 4 Üblicherweise lässt sich der Ablehnungsbereich 8T 1< eines Tests T in der Form 8S < darstellen. Man nennt dann die Statistik S = s@X D die zum Test T gehörende Teststatistik und den zugehörigen Schwellwert. 6.1.6 Beispiel: Wir betrachten nochmals das Testproblem X = 8@lD ˝ l > 0< 0 = 8@l0 D< 1 = 8@lD ˝ l > l0 < aus Beispiel 6.1.3. Gesucht ist ein möglicher Test sowie die zugehörige Teststatistik. ô Lösung: Wir haben in Beispiel 6.1.3 bereits erkannt, dass es naheliegt, die Hypothese 0 abzulehnen und die Alternative 1 anzunehmen, wenn der Schätzwert x-1 "deutlich größer" als l0 ist. Also ist T =: 1 0 falls X -1 > falls X -1 § ein möglicher Test für die Hypothese 0 gegen die Alternative 1 und S = X -1 die zugehörige Teststatistik. Der Ablehnungsbereich 8T = 1< dieses Tests hat damit die Form 8X -1 > <, wobei aber noch nicht klar ist, wie dieser Schwellwert gewählt werden soll. 6.2 Die Güte von Tests Sei X ein (parametrisches oder nichtparametrisches) a-priori Modell für die Verteilung von X, seien 0 und 1 zwei disjunkte Teilmengen von X und sei X = 8X1 , X2 , …, Xn < eine nach dem Verteilungsgesetz X ausgewählte mathematische Stichprobe vom Umfang n. Im Prinzip könnte man natürlich jede beliebige Statistik T = t@X D, welche nur die beiden Werte 0 und 1 annimmt, als Test für die Hypothese 0 gegen die Alternative 1 verwenden. Es ist aber wieder klar, dass sich einige Statistiken dafür besser eignen als andere. Wir werden uns daher als erstes mit der Frage befassen, wie sich die "Güte von Tests" beschreiben lässt: 6.2.1 Definition: a) Unter einer Fehlentscheidung 1. Art versteht man das irrtümliche Ablehnen der Hypothese 0 (in Wirklichkeit wurde die Stichprobe x = 8x1 , x2 , …, xn < nach einem Verteilungsgesetz X œ 0 ausgewählt; wegen t@xD = 1 wird die Hypothese 0 aber verworfen und dafür 1 angenommen). b) Unter einer Fehlentscheidung 2. Art versteht man das irrtümliche Annehmen der Hypothese 0 (in Wirklichkeit wurde die Stichprobe x = 8x1 , x2 , …, xn < nach einem Verteilungsgesetz X œ 1 ausgewählt; wegen t@xD = 0 wird die Hypothese 0 aber angenommen). c) Ist T ein Test für die Hypothese 0 gegen die Alternative 1 , so nennt man die Abbildung XT : X Ø 80, 1< mit XT @ X D = @8T = 1<; X D die Operationscharakteristik von T. d) Ein Test T für die Hypothese 0 gegen die Alternative 1 besitzt das Signifikanzniveau a, wenn die Wahrscheinlichkeit einer Fehlentscheidung 1. Art stets durch a beschränkt ist, wenn also für alle X œ 0 @8T = 1<; X D § a gilt. In Zukunft werden wir einfach von einem Test mit Signifikanz a reden. e) Sind T1 und T2 zwei Test für die Hypothese 0 gegen die Alternative 1 mit Signifikanz a, so heißt der Test T1 mächtiger (more effective) als der Test T2 , wenn die Wahrscheinlichkeit einer Fehlentscheidung 2. Art bei Verwendung von T1 stets kleiner ist als bei Verwendung von T2 , wenn also für alle X œ 1 die folgende 06_Testtheorie.nb bei Verwendung von T1 stets kleiner ist als bei Verwendung von T2 , wenn also für alle X Beziehung gilt: 5 1 die folgende @8T1 = 0<; X D § @8T2 = 0<; X D f) Ist T ein Test für die Hypothese 0 gegen die Alternative 1 , ist S = s@X D die zugehörige Teststatistik (hat also der Ablehnungsbereich 8T = 1< von T die Form 8S > <, wobei ein geeigneter Schwellwert ist) und ist x = 8x1 , x2 , …, xn < eine nach dem Verteilungsgesetz X œ X ausgewählte Stichprobe vom Umfang n, so nennt man die Zahl @xD = Max@@8S > s@xD<; X D ˝ X œ 0 D den zu dieser Stichprobe x gehörenden p-Wert des Tests T. Je kleiner dieser p-Wert @xD ausfällt, umso deutlicher widerspricht die Stichprobe x der Hypothese 0 und führt damit zu deren Ablehnung. Zu dieser Definition sind einige Bemerkungen angebracht: † Bei Fehlentscheidungen 1. Art spricht man auch vom Produzentenrisiko, weil eine derartige Fehlentscheidung dann eintritt, wenn ein der Norm entsprechendes Los bei der Qualitätskontrolle irrtümlich zurückgehalten wird und damit dem Produzenten Kosten erwachsen. Bei Fehlentscheidung 2. Art spricht man auch vom Konsumentenrisiko, weil eine derartige Fehlentscheidung dann eintritt, wenn ein der Norm nicht entsprechendes Los die Quali-tätskontrolle irrtümlich passiert und damit der Konsument den Schaden hat. † Besitzt ein Test T für die Hypothese 0 gegen die Alternative 1 das Signifikanzniveau a, so wissen wir, dass die Wahrscheinlichkeit einer Fehlentscheidung 1. Art durch a beschränkt ist. Über die Wahrscheinlichkeit einer Fehlentscheidung 2. Art wissen wir damit jedoch praktisch nichts. Man wird deshalb das Testproblem nach Möglichkeit so formulieren, dass Fehlentscheidungen 1. Art die "gefährlichen" Fehlentscheidungen sind und das Hauptaugenmerk stets auf das Zurückweisen der Hypothese 0 legen. Man beachte also die Merkregel: Was bewiesen werden soll, ist als Alternative zu formulieren. † Üblicherweise verwendet man für das Signifikanzniveau die Werte a = 0.05 (man erlaubt, dass die Hypothese in fünf von 100 gleich gelagerten Fällen irrtümlich abgelehnt wird) oder a = 0.01 (man erlaubt, dass die Hypothese nur in einem von 100 gleich gelagerten Fällen irrtümlich abgelehnt wird). Je kleiner das Signifikanzniveau a gewählt wird, umso deutlicher widerspricht das Datenmaterial im Falle einer Ablehnung der Hypothese 0 . † Mit Hilfe der Operationscharakteristik XT lässt sich die "Güte" eines Tests T sehr einprägsam beschreiben. Man erkennt dabei, dass die Wahrscheinlichkeit einer Fehlentscheidung 1. Art durch den sogenannten Alpha-Fehler Max@@8T = 1<; X D ˝ X œ 0 D und die Wahrscheinlichkeit einer Fehlentscheidung 2. Art durch den sogenannten Beta-Fehler Max@@8T = 0<; X D ˝ X œ 1 D = 1 - Min@@8T = 1<; X D ˝ X œ 1 D beschränkt ist. Man beachte ferner, dass das Signifikanzniveau a eines Tests T stets mindestens so groß ist, wie dessen Alpha-Fehler. In der Regel stimmen das Signifikanzniveau a eines Tests T und dessen Alpha-Fehler überein. 06_Testtheorie.nb 6 XT @ X D 1.0 Beta-Fehler 0.8 Wahrscheinlichkeit einer Fehlentscheidung 2. Art 0.6 0.4 Wahrscheinlichkeit einer Fehlentscheidung 1. Art Alpha-Fehler 0.2 X 0 1 † An Hand der Operationscharakteristik XT erkennt man, dass es unmöglich ist, sowohl den Alpha-Fehler als auch den Beta-Fehler gleichzeitig klein zu machen. Da man sich in der Regel auf das Ablehnen der Hypothese 0 konzentriert, wird man versuchen, den Alpha-Fehler klein zu halten. Es gibt aber auch Fälle, in denen das Ablehnen der Alternative 1 im Vordergrund steht. Da der Beta-Fehler jedoch oft nicht berechnet werden kann, wird man in diesen Fällen einfach mit einem großen Alpha-Fehler arbeiten. † Ist T ein Test für die Hypothese 0 gegen die Alternative 1 und ist S = s@X D die zugehörige Teststatistik, so entspricht der zur Stichprobe x gehörende p-Wert @xD dem Alpha-Fehler des Tests mit Ablehnungsbereich 9S ¥ s@xD=. Statt anzugeben, für welchen Schwellwert a der Test T mit dem Ablehnungsbereich 8S ¥ a < gerade noch das Signifikanzniveau a besitzt, und anschließend zu prüfen, ob aufgrund der vorliegenden Stichprobe x die Hypothese 0 wegen s@xD ¥ a abgelehnt werden soll, gibt man oft nur den p-Wert @xD dieser Stichprobe x an. Je kleiner dieser p-Wert ausfällt, umso signifikanter widerspricht die Stichprobe x der Hypothese 0 . An Hand von konkreten Beispielen sollen diese Begriffe näher erläutert werden: 6.2.2 Beispiel: Wir betrachten nochmals das Testproblem X = 8@lD ˝ l > 0< 0 = 8@l0 D< 1 = 8@lD ˝ l > l0 < aus Beispiel 6.1.3. Wie muss der Schwellwert des in Beispiel 6.1.6 angeführten Tests T für die Hypothese 0 gegen die Alternative 1 gewählt werden, damit dieser Test das Signifikanzniveau a besitzt? ô Lösung: Der Ablehnungsbereich des in Beispiel 6.1.6 angeführten Tests T hat die Form 8X -1 > < = 8X 1 ê< Damit dieser Test T das Signifikanzniveau a besitzt, muß @88X 1 ê<<; @l0 DD = @88X1 + X2 + … + Xn n ê<<; @l0 DD = a gelten. Nun ist aber X1 + X2 + … + Xn bekanntlich @n, l0 D-verteilt. Wählt man daher für den Schwellwert den Wert = n ên,l ;a , wobei n,m; das -Quantil der @n, mD-Verteilung bezeichnet, so besitzt dieser Test offenbar 0 das Signifikanzniveau a. Wir demonstrieren die Arbeitsweise dieses Tests: Dazu erzeugen wir zuerst eine @lD-verteilte Stichprobe vom Umfang n und testen anschließend, ob die Hypothese 0 = 8@l0 D< bei Verwendung des Signifikanzniveaus a abgelehnt und damit die Alternative 1 = 8@lD ˝ l > l0 < angenommen wird, wobei wir auch den zugehörigen p- 06_Testtheorie.nb 7 abgelehnt und damit die Alternative 1 8@ D ˝ 0 < angenommen wird, wobei wir auch den zugehörigen pWert angeben (man beachte, dass bekanntlich @n, mD = amma@n, 1 ê mD gilt): n = 25; l = 5; l0 = 3; a = 0.05; x = RandomReal@ExponentialDistribution@lD, 8n<D; If @n Mean@xD < Quantile@GammaDistribution@n, 1 ê l0D, aD, Print@"Reject null hypothesis at significance level Æ ", aD, Print@"Fail to reject null hypothesis at significance level Æ ", aDD Print@"p-value = ", CDF@GammaDistribution@n, 1 ê l0D, n Mean@xDDD Clear@n, l, l0, a, xD Fail to reject null hypothesis at significance level → 0.05 p−value = 0.0731951 Wir erkennen: Je größer der Stichprobenumfang n ist, um so eher plädiert dieser Test im Fall l > l0 auf Ablehnung der Hypothese 0 = 8@l0 D<. Ist l = l0 , so wird dieser Test die Hypothese 0 = 8@l0 D< in etwa 100 a von 100 Fällen ungerechtfertigt ablehnen. 6.2.3 Beispiel: Für das "einseitige" Testproblem X = 8@m, s0 D ˝ m œ < 0 = 8@m, s0 D ˝ m § m0 < 1 = 8@m, s0 D ˝ m > m0 < ist ein Test T mit Signifikanz a gesucht. Für diesen Test ist die Operationscharakteristik XT zu zeichnen. ô Lösung: a) Der Mittelwert X HnL ist bekanntlich ein erwartungstreuer (und damit guter) Schätzer für den unbekannten Parameter m. Es liegt daher nahe, die Hypothese 0 abzulehnen, wenn X HnL deutlich größer als m0 ist. Damit der Test T mit dem Ablehnungsbereich 8T = 1< = 8X HnL -m0 > < das vorgegebene Signifikanzniveau a besitzt, muss der Schwellwert so gewählt werden, dass für alle m § m0 die Beziehung @8X HnL -m0 > <; @m, s0 DD § a gilt. Die Faltungsformeln und der Satz über die affine Transformation liefern für alle m § m0 die Abschätzung @8X HnL -m0 > <; @m, s0 DD = @8 X HnL - m s0 n > - m + m0 s0 n <; @m, s0 DD § 1 - f@ s0 nD wobei f die Verteilungsfunktion der @0, 1D-Verteilung bezeichnet. Da die beiden Aussagen 1 - f@ s0 n D=a und s0 n = 1-a offenbar gleichbedeutend sind (mit bezeichnen wir das -Quantil der @0, 1D-Verteilung), besitzt der Test T für die Hypothese 0 gegen die Alternative 1 mit dem Ablehnungsbereich 8T = 1< = 8X HnL - m0 > < = 8 X HnL - m0 s0 n > 1-a < das Signifikanzniveau a. b) Für diesen Test T zeichnen wir nun die Operationscharakteristik XT , wobei wir auf der x-Achse den Parameter m und auf der y-Achse die zugehörigen Wahrscheinlichkeiten 06_Testtheorie.nb 8 XT @mD = @8T = 1<; @m, s0 DD = @8 = @8 X HnL - m s0 n > 1-a - X HnL - m0 s0 m - m0 s0 n > 1-a <; @m, s0 DD = n <; @m, s0 DD = 1 - f@ 1-a - m - m0 s0 nD auftragen (das Signifikanzniveau a sowie der Stichprobenumfang n ist dabei dynamisch wählbar): m0 = 2; s0 = 2; ManipulateAq = Quantile@NormalDistribution@0, 1D, 1 - aD; PlotA1 - CDF@NormalDistribution@0, 1D, q - Hm - m0L Sqrt@nD ê s0D, 8m, 0, 4<, AxesOrigin Æ 80, 0<, AspectRatio Æ 0.5, PlotStyle Æ [email protected], AxesLabel Æ 9"m", "@8T=1<; @m,s0 DD"=, ImageSize Æ 8200, 100<E, 8a, 0.01, 0.5, Appearance Æ "Labeled"<, 8n, 20, 100, 1, Appearance Æ "Labeled"<E 6.2.4 Beispiel: Für das "zweiseitige" Testproblem X = 8@m, s0 D ˝ m œ < 0 = 8@m0 , s0 D< 1 = 8@m, s0 D ˝ m ∫ m0 < ist ein Test T mit Signifikanz a gesucht. Für diesen Test ist die Operationscharakteristik XT zu zeichnen. ô Lösung: a) Da der Mittelwert X HnL bekanntlich ein erwartungstreuer (und damit guter) Schätzer für den unbekannten Parameter m ist, liegt es nahe, die Hypothese 0 dann abzulehnen, wenn sich X HnL -m0 dem Betrag nach deutlich von 0 unterscheidet. Damit der Test T mit dem Ablehnungsbereich 8T = 1< = 8 X HnL -m0 > < das vorgegebene Signifikanzniveau a besitzt, muss der Schwellwert so gewählt werden, dass @8 X HnL - m0 > <; @m0 , s0 DD = a ist. Aus den Faltungsformeln und dem Satz über die affine Transformation folgt aber @8 X HnL - m0 > <; @m0 , s0 DD = @8 X HnL - m0 s0 n > s0 n <; @m0 , s0 DD = 2 f@- s0 nD wobei f wieder die Verteilungsfunktion der @0, 1D-Verteilung bezeichnet. Da die beiden Aussagen 2 f@- s0 n D=a und s0 n = 1-aê2 offenbar gleichbedeutend sind, besitzt der Test T für die Hypothese 0 gegen die Alternative 1 mit dem Ablehnungsbereich 8T = 1< = 8 X HnL - m0 > < = 8 X HnL - m0 s0 n > 1-aê2 < das Signifikanzniveau a. b) Für diesen Test T zeichnen wir nun die Operationscharakteristik XT , wobei wir auf der x-Achse den Parameter m und auf der y-Achse die zugehörigen Wahrscheinlichkeiten XT @mD = @8T = 1<; @m, s0 DD = @8 X HnL - m0 s0 n > 1-aê2 <; @m, s0 DD = 06_Testtheorie.nb 9 = 1 - @8- 1-aê2 § X HnL - m0 s0 = 1 - @8- 1-aê2 - m - m0 s0 = 1 - f@ 1-aê2 - m - m0 s0 n § 1-aê2 <; @m, s0 DD = HnL n § X -m s0 n D + f@- 1-aê2 - n § 1-aê2 m - m0 s0 m - m0 s0 n <; @m, s0 DD = nD auftragen (das Signifikanzniveau a sowie der Stichprobenumfang ist dabei wieder dynamisch wählbar):: m0 = 2; s0 = 2; ManipulateAq = Quantile@NormalDistribution@0, 1D, 1 - a ê 2D; PlotA1 - CDF@NormalDistribution@0, 1D, q - Hm - m0L Sqrt@nD ê s0D + CDF@NormalDistribution@0, 1D, -q - Hm - m0L Sqrt@nD ê s0D, 8m, 0, 4<, AxesOrigin Æ 80, 0<, AspectRatio Æ 0.5, PlotStyle Æ [email protected], AxesLabel Æ 9"m", "@8T=1<; @m,s0 DD"=, ImageSize Æ 8200, 100<E, 8a, 0.01, 0.5, Appearance Æ "Labeled"<, 8n, 20, 100, Appearance Æ "Labeled"<E