Testverfahren zur Prüfung von Hypothesen über Parameter oder

Werbung
Testverfahren zur Prüfung von
Hypothesen über Parameter oder
Verteilungen
Einführung und Begriffe beim Hypothesentest
Hypothesentest für den Mittelwert
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
1
Bibliografie
¾ Prof. Dr. Kück
Universität Rostock
Statistik, Vorlesungsskript, Abschnitt 7.2.1 und 7.2.2
¾ Bleymüller / Gehlert / Gülicher
Verlag Vahlen
Statistik für Wirtschaftswissenschaftler
¾ MM*Stat. Eine interaktive Einführung in die Welt der Statistik
PC Pool WISO-Fakultät
\\zeus\statistik\MMstat\start
¾ Dr. Roland Jeske, Universität Konstanz
http://www.wiwi.uni-konstanz.de/heiler/os2/
¾ Dr. H.-J. Mittag, Fernuniversität Hagen
http://www.fernuni-hagen.de/newstatistics
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
2
1
Testverfahren
¾ Zusammen mit dem Schätzen bildet das Testen von Hypothesen
den Kernbereich der schließenden oder induktiven Statistik.
¾ Statistische Tests sind Verfahren zur Überprüfung von Annahmen
bzw. Hypothesen über unbekannte Parameterwerte oder über die
unbekannte Verteilung eines Merkmals in der Grundgesamtheit
auf Basis der Ergebnisse einer Zufallsstichprobe.
¾ Hypothesen können auf theoretischen Überlegungen, früheren
Beobachtungen, Sollwerten, Güteanforderungen, Erfahrungen,
Behauptungen usw. basieren. Sie haben bis zum Beweis des
Gegenteils ihre Gültigkeit, sie werden also zum Zweck der
empirischen Widerlegung oder Bekräftigung aufgestellt.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
3
Testverfahren I
Realität
Gericht - Beispiel
Unschuld
Schuld
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Freispruch
Freispruch
Verurteilung
Verurteilung
Gerichtsverfahren
zum Beweis des
Gegenteils, wobei
in der Demokratie die
Unschuldshypothese
Ausgangshypothese
ist. Verfahren
endet mit Spruch.
Testverfahren I
Entscheidung
4
2
Düngemittelwerk - Beispiel
Zufallsgröße X: Gewicht der Säcke
Sollgewicht der Säcke: E(X)=µ0 =50 kg
Düngemittelwerk
Verpackungsautomat
Stichprobemittelwert: X
Abweichung zwischen Stichprobemittelwert X und Sollwert µ0: | X − µ 0 |
| X − µ 0 | ≤ k ⇒ die Abweichung ist nur zufällig⇔ Der Automat ist richtig eingestellt oder
arbeitet fehlerfrei.
| X − µ 0 | > k ⇒ die Abweichung ist nicht nur zufällig⇔ Der Automat wurde falsch
eingestellt oder arbeitetXfehlerhaft.
Mit Hilfe statistischer Testverfahren kann in einem solchen Fall bestimmt werden,
wie groß die Abweichung mindestens sein muss, damit mit ausreichender
Wahrscheinlichkeit auf einen falsch eingestellten bzw. defekten
Verpackungsautomaten geschlossen werden kann. Diese Verfahren finden in der
modernen Industrie unter dem Begriff der statistischen Produktionskontrolle
massenhaft Anwendung.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
5
Statistische Hypothesen eines Tests
¾ In einem statistischen Test werden zwei gegensätzliche Hypothesen
gegenüber gestellt. Die eine Hypothese negiert die andere.
¾ Eine Hypothese wird Nullhypothese genannt und mit H0
bezeichnet. Sie beinhaltet immer das Gleichheitszeichen.
¾ Die andere Hypothese wird Alternativhypothese genannt und mit
H1 bzw. HA bezeichnet. Weil Alternativhypothese und
Forschungsvermutung oft übereinstimmen, wird H1 auch
Forschungshypothese genannt.
¾ Null- und Alternativhypothese sind stets disjunktiv. Die Ablehnung
der einen bedeutet die Annahme der anderen und umgekehrt. Um
Missverständnisse zu vermeiden, wird hier meistens nur über die
Ablehnung oder die Annahme von H0 geredet.
H0 vs. H1
H0: Nullhypothese
H1 : Alternativhypothese oder Forschungshypothese
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
6
3
Treffen von Entscheidungen in einem
statistischen Hypothesentest
Aus der Sicht der Statistik gibt es zwei Möglichkeiten, eine Entscheidung
über die Annahme oder Ablehnung einer Hypothese zu treffen.
¾Deterministisch, wenn der Wert des Parameters oder die Verteilung in der
Grundgesamtheit auf Grund einer Totalerhebung berechnet werden kann. Es
reicht ein simpler Vergleich, um die Entscheidung ohne Irrtum zu treffen.
¾Stochastisch oder statistisch, wenn der wahre Wert des Parameters oder
die Verteilung in der Grundgesamtheit aus praktischen Gründen nicht
bestimmt, sondern nur mittels einer zufällig ausgewählten Stichprobe vom
Umfang n geschätzt werden kann. In diesem Fall ist nicht gesichert, dass die
Entscheidung fehlerfrei ist. Hier sind zwei Zustände möglich: Treffen oder
Irrtum. Treffen oder berechtigte Entscheidung, wenn eine in der Realität
zutreffende Hypothese angenommen oder eine nicht zutreffende Hypothese
abgelehnt wird. Irrtum oder Fehler, wenn eine zutreffende Hypothese
abgelehnt oder eine nicht zutreffende Hypothese angenommen wird.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
7
Testverfahren I
Fehlertyp bei einem statistischen
Hypothesentest
Entscheidung
Realität
durch H0 ausgedrückt durch H1 ausgedrückt
Annahme von H0
Treffen
Irrtum
(Fehler zweiter Art)
Ablehnung von H0
Irrtum
(Fehler erster Art)
Treffen
Lehnt man H0 in einem Test ab, wenn in der Wirklichkeit H0 zutrifft, dann
macht man einen Fehler. Wird H0 angenommen (nicht abgelehnt), wenn
H0 nicht zutrifft, dann macht man auch einen Fehler. Beide Fehler
unterscheiden sich inhaltlich. Sie werden Fehler erster Art bzw. Fehler
zweiter Art genannt. Zwei richtige Entscheidungen (Treffen) sind auch
möglich. In der Tabelle werden die vier möglichen Zustände bei einem
statistischen Test zusammengefasst dargestellt.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
8
4
Fehlermessung bei einer
stochastischen Entscheidung
Die Größen der Fehler eines Tests werden mit Hilfe ihrer Wahrscheinlichkeit gemessen
und mit W(I) bzw. W(II) bezeichnet. Man kann dann unterscheiden:
¾W(I) =W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu)
¾W(II)=W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu)
In der empirischen Forschung legt man großen Wert darauf, dass der Fehler bei der
Annahme einer nicht zutreffenden Forschungshypothese H1 (Ablehnung von H0, wenn
H0 zutrifft) so klein wie möglich bleibt. Dazu setzt man eine obere Grenze α für die
Wahrscheinlichkeit dieses Fehlers. Der Wert α, der nicht überschritten werden soll,
wird Signifikanzniveau des Tests genannt. Es gilt dann W(Fehler 1. Art) ≤ α .
Die obere Grenze für die Größe des Fehlers 2. Art wird mit β bezeichnet. Es gilt
W(Fehler 2. Art) ≤ β. Die Differenz 1-β wird Macht oder Power des Tests genannt.
1-β ist die Wahrscheinlichkeit dafür, dass man eine zutreffende Forschungshypothese
(Alternativhypothese) H1 fehlerfrei annimmt. Es ist natürlich auch erwünscht, einen Test
durchzuführen, bei dem diese Wahrscheinlichkeit so groß wie möglich zu erhalten ist.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
9
Testverfahren I
Fehlermessung - Zusammenfassung
Entscheidung
Realität
durch H0 ausgedrückt durch H1 ausgedrückt
Annahme von H0
Treffen
Irrtum
W(Fehler 2. Art) ≤ β
Ablehnung von H0
Irrtum
W(Fehler 1. Art) ≤ α
α: Signifikanzniveau
Treffen
W(H0 wird abgelehnt|H1 trifft zu)
≥ 1- β: Macht
W(I) = W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu) ≤α
W(II)= W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu) ≤ β
W(fehlerfreie Annahme einer zutreffenden Forschungshypothese H1)
= W(H0 wird abgelehnt|H0 trifft nicht zu)
= 1- W(H0 wird nicht abgelehnt|H0 trifft nicht zu) = 1 - W(II) ≥ 1 - β (Macht)
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
10
5
Prüfgröße, kritischer Bereich
Um eine statistische Entscheidung über die Richtigkeit einer Hypothese auf Grund einer
zufällig gezogenen Stichprobe (X1, X2, . . . , Xn) zu treffen, definiert man eine geeignete
Stichprobenfunktion γ̂ n und teilt den Wertebereich dieser Funktion in zwei ausschließende
Teile: einen Teilbereich K und seiner Komplement K , so dass, wenn der Wert der Funktion
in den Teilbereich K hinfällt, H0 abgelehnt wird. Fällt der Wert der Stichprobenfunktion in
den anderen Teilbereich, dann wird H0 nicht abgelehnt (H0 wird angenommen). Die
Stichprobenfunktion und die Teilbereiche werden in diesem Zusammenhang Prüfgröße,
Ablehnungsbereich (Ablehnung von H0) und Annahmebereich (Annahme von H0)
genannt. Der Ablehnungsbereich von H0 wird auch kritischer Bereich genannt.
γ̂ n ∈ K ⇒ H 0 wird abgelehnt (H 1 wird angenommen )
γ̂ n ∉ K ⇔ γ̂ n ∈ K ⇒ H 0 wird angenommen (H 0 wird nicht abgelehnt)
Es gilt für die Wahrscheinlichkeit des Irrtums erster Art:
W(γ̂ n ∈ K | H 0 trifft in der Realität zu) = W(H 0 wird abgelehnt | H 0 trifft in der Realität zu)
= W(Fehler 1. Art) ≤ α
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
11
Klassifizierung von statistischen Tests
¾ Nach dem Inhalt der Hypothese:
- Parametrische Tests (Tests über die Parameter einer unbekannten Verteilung)
- Verteilungstests (Tests über eine unbekannte Verteilung)
¾ Nach der Abhängigkeit der Verteilung der Stichprobenfunktion von der Verteilung der
Grundgesamtheit:
- Verteilungsgebundene Tests
- Verteilungsfreie Tests
¾ Nach der Anzahl der Stichproben, die für den Hypothesentest notwendig sind:
- Einstichprobentest
- Zweistichprobentest
- Mehrstichprobentest
¾ Nach der Form des kritischen Bereiches
- Zweiseitige Tests
- Einseitige Tests (rechtsseitige Tests bzw. linksseitige Tests)
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
12
6
Bestandteile eines Hypothesentests
Ein Hypothesentest besteht aus sieben Elementen:
1. zwei entgegengesetzt formulierten Hypothesen (H0 und H1)
2. einem von vornherein festgelegten Signifikanzniveau α
3. einer bzw. mehreren Stichproben
4. einer Stichprobenfunktion oder Prüfgröße bzw. Testgröße
5. einem Ablehnungsbereich bzw. einem Annahmebereich für H0
6. einer Entscheidungsregel
7. einer Entscheidung
Zusammen mit dem Schätzen bildet das Testen von Hypothesen
den Kernbereich der schließenden oder induktiven Statistik.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
13
Testverfahren I
Parametrische Einstichprobentests
In diesem Abschnitt werden folgende Parametertests behandelt, über deren
Annahmen eine Stichprobenuntersuchung Aufschluss geben soll:
¾ Parametertest über den Mittelwert
(1) H0: µ=µ0
vs.
H1: µ≠ µ0
(Zweiseitiger Test)
(2) H0: µ≥ µ0
vs.
H1: µ< µ0
(Linksseitiger Test)
(3) H0: µ≤ µ0
vs.
H1: µ> µ0
(Rechtsseitiger Test)
¾ Parametertest über die Varianz einer Normalverteilung
(1) H0: σ²= σ²0
vs.
H1: σ² ≠ σ²0
(2) H0: σ² ≥ σ²0
vs.
H1: σ2 < σ²0
(3) H0: σ² ≤ σ²0
vs.
H1: σ² > σ²0
¾ Parametertest über den Anteilwert
(1) H0: θ= θ0
vs.
H1: θ ≠ θ0
(2) H0: θ ≥ θ0
vs.
H1: θ < θ0
(3) H0: θ ≤ θ0
vs.
H1: θ > θ0
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
14
7
Zweiseitiger Test für den Mittelwert einer
Normalverteilung mit bekannter Varianz (A)
Sei X eine normalverteilte Zufallsvariable in einer Grundgesamtheit mit dem unbekannten
Mittelwert µ und der bekannten Varianz σ², X~ N(µ, σ²). Es wird auf einem
Signifikanzniveau α getestet, ob der Parameter µ gleich µ0 ist oder nicht, d. h. es wird
zwischen den folgenden Hypothesen entschieden:
H0: µ=µ0 vs.
H1: µ≠ µ0
(Zweiseitiger Test)
Null- und Alternativhypothese
W(H 0 wird abgelehnt | µ = µ 0 ) = W(Fehler 1. Art) = α
α : Signifikanzniveau
Sei (X1, X2, . . . , Xn) eine Stichprobe vom Umfang n. Es gilt für jede Xi ~ N(µ, σ²).
Um eine Entscheidung über den Mittelwert µ der Grundgesamtheit zu treffen ist es
zweckmäßig, den Stichprobenmittelwert anzuwenden. Für diese Stichprobenfunktion
(Prüfgröße bzw. Testgröße) gilt:
X ~ N(µ ;
σ²
X− µ
)⇔Z=
~ N(0 ; 1)
σ
n
n
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
15
Testverfahren I
Zweiseitiger Test für den Mittelwert einer
Normalverteilung mit bekannter Varianz (B)
Der kritische Bereich K ist die Menge aller möglichen Werte des
Stichprobenmittelwertes, für welche gilt:
1. der Abstand von µ0 ist so groß, dass man die Nullhypothese ablehnen soll,
2. die Wahrscheinlichkeit, dass der Fehler bei dieser Entscheidung nicht größer als α ist.
{
K = X : X − µ 0 > c und W( X − µ 0 > c | µ = µ 0 ) ≤ α
}
W( X − µ 0 > c | µ = µ 0 ) = α ⇔ W( X − µ 0 ≤ c | µ = µ 0 ) = 1 − α
⇔ W(− c ≤ X − µ 0 ≤ c | µ = µ 0 ) = 1 − α ⇔ W(
− c X− µ0
c
≤
≤
| µ = µ0 ) = 1 − α
σ
σ
σ
n
n
n
−c
c
⇔ W(
≤Z≤
) = 1− α
σ
σ
n
n
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
16
8
Zweiseitiger Test für den Mittelwert einer
Normalverteilung mit bekannter Varianz (C)
W(
−c
c
≤Z≤
) = 1− α
σ
σ
n
n
c
σ
=Z α ⇒c=
⋅Z α
1−
σ
n 1− 2
2
n
K = {X :| X − µ 0 | > c und W(| X − µ 0 | > c | µ = µ 0 ) = α}
K(α ) = {X :| X − µ 0 | >
σ
n
⋅Z
1−
α
2
} = {X : |
X− µ0
| > Z α}
1−
σ
2
n
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
17
Testverfahren I
Zweiseitiger Test für den Mittelwert einer
Normalverteilung mit bekannter Varianz (D)
Entscheidungsregel und Treffen der Entscheidung:
X ∈ K(α ) ⇒ H 0 wird abgelehnt (H 1 wird angenommen )
Die Fehlerwahrscheinlichkeit liegt unter α.
W[X ∈ K(α ) | µ = µ 0 ] = α
Diese Aussage ist richtig vor der Ziehung der konkreten Stichprobe. Zieht man
eine konkrete Stichprobe, dann ist der berechnete Stichprobenmittelwert keine
Zufallsvariable mehr und deswegen hat es keinen Sinn, nach der Ziehung der
SP eine Wahrscheinlichkeitsaussage zu machen. Da der Wert von α nahe Eins
gewählt wird, kann man nur hoffen, dass die Entscheidung richtig ist.
X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen )
Die Fehlerwahrscheinlichkeit bei dieser Entscheidung ist unbekannt.
W[ X ∉ K(α ) | µ ≠ µ 0 ] = W[H 0 wird nicht abgelehnt | H 0 trifft nicht zu] = β
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
18
9
Zweiseitiger Test für den Mittelwert einer
Normalverteilung mit bekannter Varianz
- Zusammenfassung 1.
H0: µ=µ0
vs.
H1: µ≠ µ0
2. Signifikanzniveau: α
(Zweiseitiger Test)
3. Stichprobe vom Umfang n: (X1, X2, . . . , Xn)
4. Prüfgröße bzw. Testgröße:
X ~ N(µ ;
5. Kritischer Bereich:
X− µ0
X− µ
σ²
σ
⋅ Z α } = {X : |
| > Z α}
)⇔Z=
~ N(0 ; 1) K(α ) = {X :| X − µ 0 | >
1−
σ
σ
n
n 1− 2
2
n
n
7.
6. Entscheidungsregel:
Treffen der Entscheidung
X ∈ K(α ) ⇒ H 0 wird abgelehnt (H 1 wird angenommen )
X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen )
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
auf Basis einer
konkreten
Stichprobe
(x1, x2, . . . , xn)
19
Testverfahren I
Zusammenhang zwischen den Größen beider Fehler
H0: µ=µ0
vs.
H1: µ ≠ µ0
α: (Signifikanzniveau): Größe des
Fehlers erster Art (Vorgegeben)
(1)
µ0
(µ = µ1 )
β: Größe des Fehlers zweiter Art
(Im Allgemeinen unbekannt)
µ1
(3)
(2)
µ0
µ0
µ1
α 1> α2> α3 ⇒ β1< β2< β3
Beide Fehler wachsen umgekehrt.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
µ1
Testverfahren I
20
10
Test für den Mittelwert einer Normalverteilung
mit bekannter Varianz - Beispiel
Beispiel: Das Durchschnittsgewicht von Masthähnchen lag in der Vergangenheit bei
492,5 g mit einer Standardabweichung von 18,9 g. Nach Übergang zu einem neuen
Futtermittel liefert eine Stichprobe im Umfang von 81 ein Durchschnittsgewicht von
496,3 g. Kann man aufgrund dieses Stichprobenergebnisses unter der Annahme
einer gleichgebliebenen Standardabweichung mit einem Signifikanzniveau von 1 %
schließen, dass sich das Durchschnittsgewicht in der Grundgesamtheit verändert hat?
H0: µ=µ0
vs.
H1: µ ≠ µ0
H0: µ=492,5
vs.
H1: µ ≠ 492,5
Z=
X− µ0
σ
K(α ) = {X : |
(µ0 = 492,5 )
Z
α=0,01
1−
α
2
= Z 0,995 = 2,58
x = 496,3
496,3 − 492,5
X− µ0
X − 492,5
= 1,81
| > Z α } = {X : |
| > 2,58} z =
1−
σ
18,9
18,9
2
n
n
81
81
Entscheidung: Da |1,81|<2,58 gilt, wird H0 nicht abgelehnt.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
21
Testverfahren I
Einseitige Tests für den Mittelwert einer
Normalverteilung mit bekannter Varianz
Ein einseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz
unterscheidet sich von dem zweiseitigen Test nur in seinem entsprechenden kritischen Bereich.
5. Kritische Bereiche:
Linksseitiger Test
(2) H0: µ≥ µ0 vs.
K(α ) = {X : X < µ 0 −
σ
n
Rechtsseitiger Test
H1: µ< µ0
⋅ Z1−α } = {X :
(3) H0: µ≤ µ0
X− µ0
< - Z1−α }
σ
K(α ) = {X : X > µ 0 +
vs.
σ
n
H1: µ> µ0
⋅ Z1−α } = {X :
X− µ0
> Z1− α }
σ
n
n
α
α
-Z1-α
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Z1-α
Testverfahren I
22
11
Tests für den Mittelwert einer
Normalverteilung mit unbekannter Varianz
Die Tests für den Mittelwert einer Normalverteilung mit unbekannter Varianz
unterscheiden sich von den vorigen Tests nur in der Prüfgröße und den
entsprechenden kritischen Bereichen.
Prüfgröße
X ~ N(µ ;
X− µ0
σ²
)⇔T=
~ t n −1
S
n
n
Test
Kritischer Bereich:
(1) H0: µ=µ0
vs.
S
H1: µ≠ µ0
K(α ) = {X :| X - µ 0 | >
(2) H0: µ≥ µ0 vs.
H1: µ< µ0
K(α ) = {X : X < µ 0 −
S
(3) H0: µ≤ µ0 vs.
H1: µ> µ0
K(α ) = {X : X > µ 0 +
S
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
n
n
n
⋅t
n −1 ; 1−
α
2
} = {X : | T | > t
n −1 ; 1−
α
2
}
⋅ t n −1 ; 1−α } = {X : T < - t n −1 ; 1−α }
⋅ t n −1 ; 1−α } = {X : T > t n −1 ; 1−α }
23
Testverfahren I
Test für den Mittelwert einer Normalverteilung
mit unbekannter Varianz - Beispiel
Beispiel: Eine Maschine stellt Plättchen her, deren Dicke normalverteilt ist, mit
dem Sollwert (Mittelwert) 0,25 cm. Eine Stichprobe von 10 Plättchen liefert ein
arithmetisches Mittel von 0,253 cm bei einer Standardabweichung von 0,003 cm.
Die Hypothese, dass die Maschine noch exakt arbeitet, ist auf einem
Signifikanzniveau von 0,05 zu überprüfen.
H0: µ=µ0
vs.
H1: µ ≠ µ0
H0: µ=0,25
vs.
H1: µ ≠ 0,25
T=
X− µ0
S
K(α ) = {X : | X - µ 0 | >
n
(µ0 = 0,25 )
t
α=0,05
n −1 ; 1−
α
2
= t 9 ; 0,975 = 2,262
x = 0,253
S
n
⋅t
n −1 ; 1−
α
2
} = {X : | T | > 2,262}
t=
s = 0,003
0,253 − 0,25
= 3,162
0,003
10
Entscheidung: Da |3,162|>2,262 ist, wird H0 abgelehnt.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
24
12
Tests für den Mittelwert einer unbekannten
Verteilung für große Stichproben
Für die unbekannte Verteilung in der GG und großen Stichprobenumfang (n>30) gilt:
Man kann in diesem Fall den
Stichprobenmittelwert oder eine Funktion
von ihm als Prüfgröße für den Test über den
X− µ0
σ²
X ~ N(µ ; ) ⇔ T =
~ t n −1 → Z ~ N(0 ; 1)
S
Mittelwert nutzen. Die entsprechenden
n
kritischen Bereiche werden durch
n
Verwendung der Normalverteilung bestimmt.
Prüfgröße
Kritischer Bereich:
Test
S
vs.
H1: µ≠ µ0
K(α ) = {X :| X - µ 0 | >
(2) H0: µ≥ µ0 vs.
H1: µ< µ0
K(α ) = {X : X < µ 0 −
S
(3) H0: µ≤ µ0 vs.
H1: µ> µ0
K(α ) = {X : X > µ 0 +
S
(1) H0: µ=µ0
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
n
⋅Z
1−
α
2
} = {X : | T | > Z
1−
α
2
}
⋅ Z1−α } = {X : T < - Z1−α }
n
n
⋅ Z1−α } = {X : T > Z1−α }
25
Testverfahren I
Test für den Mittelwert einer unbekannten
Verteilung – Beispiel (1)
Beispiel: Bei der Überprüfung des Verpackungsautomaten im Düngemittelwerk
werden 31 Säcke nachgewogen, für die ein Durchschnittsgewicht 50,1 kg und eine
Standardabweichung 250 g berechnet werden. Aufgrund dieses
Stichprobenbefundes ist eine Entscheidung über die Arbeit des Automaten
(fehlerhaft/ nicht fehlerhaft) zu treffen. Die Entscheidung soll bei 5 prozentiger
Irrtumswahrscheinlichkeit getroffen werden.
Über die Verteilung des Gewichtes der
Säcke liegt keine Information vor.
H0: µ=50
T=
X− µ0
S
vs.
α=0,05
n
n −1 ; 1−
α
2
x = 50,1
H1: µ ≠ 50
K(α ) = {X : | X - µ 0 | >
t
S
n
⋅t
n −1 ; 1−
α } = { X : | T | > 2,042}
2
= t 30 ; 0,975 = 2,042
s = 0,250
t=
50,1 − 50
= 2,227
0,250
31
Entscheidung: Da |2,227|>2,042 ist, wird H0 abgelehnt, d. h. man
kann annehmen, dass der Automat fehlerhaft arbeitet.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
26
13
Test für den Mittelwert einer unbekannten
Verteilung – Beispiel (2)
Beispiel: 2003 beträgt das Durchschnittsalter der Zuzüge aus anderen Kreisen MV
nach Rostock 30 Jahre. Im Jahr 2004 liegt, bei einer Stichprobe von 100 Personen,
das Durchschnittsalter der Zuzüge bei 29,2 Jahre mit einer Standardabweichung
von 14,65 Jahren. Hat sich der Wert im Jahr 2004 signifikant verringert, bei einem
Signifikanzniveau von 0,05? Quelle: Statistische Berichte 2003.
Über die Verteilung des Alters liegt
keine Information vor.
α=0,05
s = 14,65
x = 29,2
H0: µ≥30 vs. H1: µ < 30
T=
t n −1 ; 1−α = t 99 ; 0,95 = 1,66
29,2 − 30
X − µ 0 K(α ) = {X : (X - µ ) < - S ⋅ t
t=
= −0,55
0
n −1 ; 1− α } = { X : T < -1,66}
14,65
n
S
100
n
Entscheidung: Da -0,55>-1,66 ist, wird H0 nicht abgelehnt, d. h. die
Verringerung des durchschnittlichen Wanderungsalters (Zuzüge) ist nicht signifikant.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
27
Testverfahren I
Test für den Mittelwert einer unbekannten
Verteilung – Beispiel (3)
Beispiel: Das durchschnittliche Nettoeinkommen liegt im März 2004 bei 1.603 €.
Bei einer Stichprobe von 200 Personen im Juni 2004 lag das durchschnittliche
Nettoeinkommen bei 1.715 € mit einer Standardabweichung von 1.227 €. Hat sich
das durchschnittliche monatliche Nettoeinkommen bei einem Signifikanzniveau von
0,05 statistisch signifikant erhöht? Quelle: Mikrozensus 2004, Tabelle 36.
Über die Verteilung des Nettoeinkommen
liegt keine Information vor.
H0: µ≤1.603
T=
vs.
α=0,05
H1: µ > 1.603
t n −1 ; 1−α = t199 ; 0,95 = 1,645
x = 1.715
S
X− µ0
K(α ) = {X : (X - µ 0 ) >
⋅ t n −1 ; 1−α } = {X : T > 1,645} t =
S
n
n
s = 1.227
1.715 − 1.603
= 1,291
1.227
200
Entscheidung: Da 1,291<1,645 ist, wird H0 nicht abgelehnt, d. h. das
durchschnittliche Nettoeinkommen im Juni 2004 ist nicht signifikant höher als im
März 2004.
Dr. Ricabal Delgado/Prof. Kück
Lehrstuhl Statistik
Testverfahren I
28
14
Herunterladen