Parametrische Einstichprobentests Bibliografie

Werbung
Parametrische Einstichprobentests
¾ Einführung und Begriffe beim
Hypothesentest
¾ Hypothesentest für den Mittelwert
¾ Hypothesentest für die Varianz
¾ Hypothesentest für den Anteilswert
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
1
Bibliografie
” Bleymüller / Gehlert / Gülicher
Verlag Vahlen
Statistik für Wirtschaftswissenschaftler
” Bleymüller / Gehlert
Verlag Vahlen
Statistische Formeln, Tabellen und Programme
” PowerPointPräsentationen (Prof. Kück / Dr. Ricabal)
” Vorlesungsskript für Statistik I (Dr. Pu Chen)
” Vorlesungsskript für Statistik II (Prof. Mohr, Private
Hanseuniversität Rostock)
” http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
2
1
Testverfahren
¾ Zusammen mit dem Schätzen bildet das Testen von
Hypothesen den Kernbereich der schließenden oder
induktiven Statistik.
¾ Statistische Tests sind Verfahren zur Überprüfung von
Hypothesen (Annahmen) über unbekannte Parameter oder
über Verteilungen auf Basis einer bzw. mehreren
Zufallsstichproben.
¾ Hypothesen können auf theoretischen Überlegungen,
früheren Beobachtungen, Sollwerten, Güteanforderungen,
Erfahrungen, Behauptungen usw. basieren. Sie haben bis
zum Beweis des Gegenteils ihre Gültigkeit, sie werden also
zum Zweck der empirischen Widerlegung oder Bekräftigung
aufgestellt.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
3
Realität
Beispiel: Gericht
Unschuld
Schuld
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Freispruch
Freispruch
Verurteilung
Verurteilung
Gerichtsverfahren
zum Beweis des
Gegenteils, wobei
in der Demokratie die
Unschuldshypothese
Ausgangshypothese
ist. Verfahren
endet mit Spruch.
Testverfahren I
Entscheidung
4
2
Beispiel: Düngemittelwerk
Düngemittelwerk
Verpackungsautomat
Abweichung zwischen Stichprobemittelwert X und Sollwert µ0: | X − µ 0 |
Mit Hilfe statistischer Testverfahren kann in einem solchen Fall
bestimmt werden, wie groß die Abweichung mindestens sein muss,
damit mit ausreichender Wahrscheinlichkeit auf einen falsch
eingestellten bzw. defekten Verpackungsautomaten geschlossen
werden kann. Diese Verfahren finden in der modernen Industrie unter
dem Begriff der statistischen Produktionskontrolle massenhaft
Anwendung.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
5
Statistische Hypothesen eines Tests
¾ In einem statistischen Test werden zwei gegensätzliche Hypothesen
gegenüber gestellt. Die eine Hypothese negiert die andere.
¾ Eine Hypothese wird Nullhypothese genannt und mit H0
bezeichnet. Sie beinhaltet immer das Gleichheitszeichen.
¾ Die andere Hypothese wird Alternativhypothese genannt und mit
H1 bzw. HA bezeichnet. Weil Alternativhypothese und
Forschungsvermutung oft übereinstimmen, wird H1 auch
Forschungshypothese genannt.
¾ Null- und Alternativhypothese sind stets disjunktiv. Die Ablehnung
der einen bedeutet die Annahme der anderen und umgekehrt. Um
Missverständnisse zu vermeiden, wird hier meistens nur über die
Ablehnung oder die Annahme der Nullhypothese H0 geredet.
H0 vs. H1
Nullhypothese (H0) versus Alternativhypothese (H1)
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
6
3
Treffen von Entscheidungen in einem
statistischen Hypothesentest
Aus der Sicht der Statistik gibt es zwei Möglichkeiten, eine Entscheidung
über die Annahme oder Ablehnung einer Hypothese zu treffen.
¾ Deterministisch, wenn der Wert des Parameters oder die Verteilung in
der Grundgesamtheit auf Grund einer Totalerhebung berechnet werden
kann. Es reicht ein simpler Vergleich, um die Entscheidung ohne Irrtum
zu treffen.
¾ Stochastisch oder statistisch, wenn der wahre Wert des Parameters
oder die Verteilung in der Grundgesamtheit aus praktischen Gründen nicht
bestimmt, sondern nur mittels einer zufällig ausgewählten Stichprobe vom
Umfang n geschätzt werden kann. In diesem Fall ist nicht gesichert, dass die
Entscheidung fehlerfrei ist. Hier sind zwei Zustände möglich: Treffen oder
Irrtum.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
7
Fehlertyp bei einem statistischen
Hypothesentest
Test:
H0
vs.
Entscheidung
H1
Realität
H0 trifft zu
H1 trifft zu
Annahme von H0
Treffen
Irrtum
(Fehler zweiter Art)
Ablehnung von H0
Irrtum
(Fehler erster Art)
Treffen
Lehnt man H0 in einem Test ab, wenn in der Wirklichkeit H0 zutrifft, dann
macht man einen Fehler. Wird H0 angenommen (nicht abgelehnt), wenn H0
nicht zutrifft, dann macht man auch einen Fehler. Beide Fehler unterscheiden
sich inhaltlich. Sie werden Fehler erster Art bzw. Fehler zweiter Art
genannt. Zwei richtige Entscheidungen (Treffen) sind auch möglich. In der
Tabelle werden die vier möglichen Zustände bei einem statistischen Test
zusammengefasst dargestellt.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
8
4
Fehlermessung bei einer
stochastischen Entscheidung
Die Größen der Fehler eines Tests werden mit Hilfe
ihrer Wahrscheinlichkeit gemessen und mit W(I) bzw.
W(II) bezeichnet. Man kann dann unterscheiden:
¾ W(I) = W(Fehler 1. Art)
= W(H0 wird abgelehnt |H0 trifft zu)
¾ W(II) = W(Fehler 2. Art)
= W(H0 wird nicht abgelehnt |H0 trifft nicht zu)
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
9
Größe des Fehlers erster Art
¾ W(I) =W(Fehler 1. Art)
= W(H0 wird abgelehnt|H0 trifft zu)
In der empirischen Forschung legt man großen Wert
darauf, dass der Fehler bei der Annahme einer nicht
zutreffenden Forschungshypothese H1 (Ablehnung von
H0, wenn H0 zutrifft) so klein wie möglich bleibt. Dazu
setzt man eine obere Grenze α für die
Wahrscheinlichkeit dieses Fehlers (Fehler erster Art).
Der Wert α, der nicht überschritten werden soll, wird
Signifikanzniveau des Tests genannt.
Es gilt dann W(Fehler 1. Art) ≤ α .
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
10
5
Größe des Fehlers zweiter Art
¾ W(II)=W(Fehler 2. Art)
= W(H0 wird nicht abgelehnt|H0 trifft nicht zu)
Die obere Grenze für die Größe des Fehlers zweiter Art
wird mit β bezeichnet. Es gilt W(Fehler 2. Art) ≤ β.
Die Differenz 1-β wird als Macht oder Power des
Tests genannt. 1-β ist die Wahrscheinlichkeit dafür,
dass man eine zutreffende Forschungshypothese bzw.
Alternativhypothese H1 fehlerfrei annimmt.
Es ist natürlich auch erwünscht, einen Test
durchzuführen, bei dem diese Wahrscheinlichkeit so
groß wie möglich zu erhalten ist.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
11
Fehlermessung - Zusammenfassung
Entscheidung
Realität
H0 trifft zu
H1 trifft nicht zu
Annahme von H0
Treffen
Irrtum
W(Fehler 2. Art) ≤ β
Ablehnung von H0
Irrtum
W(Fehler 1. Art) ≤ α
α: Signifikanzniveau
Treffen
W(H0 wird abgelehnt|H1
trifft zu) ≥ 1- β: Macht
W(I) = W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu) ≤α
W(II)= W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu) ≤ β
W(fehlerfreie Annahme einer zutreffenden Forschungshypothese H1)
= W(H0 wird abgelehnt|H0 trifft nicht zu)
= 1- W(H0 wird nicht abgelehnt|H0 trifft nicht zu) = 1 - W(II) ≥ 1 - β
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
12
6
Prüfgröße, kritischer Bereich
Test:
H0
vs.
H1
Um eine statistische Entscheidung über die Richtigkeit einer
Hypothese auf Grund einer zufällig gezogenen Stichprobe
(X1, X2, . . . , Xn) zu treffen, definiert man eine geeignete
Stichprobenfunktion γ̂ n und teilt den Wertebereich dieser Funktion
in zwei ausschließende Teile: einen Teilbereich K und seiner
Komplement K, so dass, wenn der Wert der Funktion in den
Teilbereich K hinfällt, H0 abgelehnt wird. Fällt der Wert der
Stichprobenfunktion in den anderen Teilbereich, dann wird H0 nicht
abgelehnt (H0 wird angenommen). Die Stichprobenfunktion und die
Teilbereiche werden in diesem Zusammenhang Prüfgröße,
Ablehnungsbereich (Ablehnung von H0) und Annahmebereich
(Annahme von H0) genannt. Der Ablehnungsbereich von H0 wird
auch kritischer Bereich genannt.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
13
Entscheidungsregeln
γ̂ n ∈ K ⇒ H 0 wird abgelehnt
γ̂ n ∉ K ⇔ γ̂ n ∈ K ⇒ H 0 wird nicht abgelehnt
Es gilt für die Wahrscheinlichkeit des Irrtums erster Art:
W(γ̂ n ∈ K | H 0 trifft in der Realität zu)
= W(H 0 wird abgelehnt | H 0 trifft in der Realität zu)
= W(Fehler 1. Art) ≤ α
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
14
7
Klassifizierung von statistischen Tests
(1)
¾Nach dem Inhalt der Hypothese:
-Parametrische Tests (Tests über die Parameter
einer bekannten Verteilung)
-Verteilungstests (Tests über eine unbekannte
Verteilung)
¾Nach der Abhängigkeit der Verteilung der
Stichprobenfunktion von der Verteilung der
Grundgesamtheit:
-Verteilungsgebundene Tests
-Verteilungsfreie Tests
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
15
Klassifizierung von statistischen Tests
(2)
¾Nach der Anzahl der Stichproben, die für den
Hypothesentest notwendig sind:
-Einstichprobentest
-Zweistichprobentest
-Mehrstichprobentest
¾Nach der Form des kritischen Bereiches
-Zweiseitige Tests
-Einseitige Tests (rechtsseitige Tests bzw. linksseitige
Tests)
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
16
8
Bestandteile eines Hypothesentests
Ein Hypothesentest besteht aus sieben Elementen:
1.
zwei entgegengesetzt formulierten Hypothesen (H0 und H1)
2. einem von vornherein festgelegten Signifikanzniveau α
3. einer bzw. mehreren Stichproben
4. einer Stichprobenfunktion oder Prüfgröße bzw. Testgröße
5. einem Ablehnungsbereich bzw. einem Annahmebereich für H0
6. einer Entscheidungsregel
7.
einer Entscheidung
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
17
Einstichprobentests über den Mittelwert
In diesem Abschnitt werden folgende
Einstichprobentests über den Mittelwert einer
Grundgesamtheit behandelt:
(1) H0: µ = µ0 vs. H1: µ ≠ µ0
(Zweiseitiger Test)
(2) H0: µ ≥ µ0 vs. H1: µ < µ0
(Linksseitiger Test)
(3) H0: µ ≤ µ0 vs. H1: µ > µ0
(Rechtsseitiger Test)
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
18
9
Einstichprobentests über die Varianz
In diesem Abschnitt werden folgende
Einstichprobentests über die Varianz einer
Grundgesamtheit behandelt:
(1) H0: σ²= σ²0
vs. H1: σ² ≠ σ²0 (zweiseitiger Test)
(2) H0: σ² ≥ σ²0
vs. H1: σ²< σ²0
(3) H0: σ² ≤ σ²0
vs. H1: σ² > σ²0 (rechtsseitiger Test)
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
(linksseitiger Test)
Testverfahren I
19
Einstichprobentests über den Anteilwert
In diesem Abschnitt werden folgende
Einstichprobentests über die Varianz einer
Grundgesamtheit behandelt:
(1) H0: θ = θ0
vs. H1: θ ≠ θ0
(zweiseitiger Test)
(2) H0: θ ≥ θ0
vs. H1: θ < θ0
(linksseitiger Test)
(3) H0: θ ≤ θ0
vs. H1: θ > θ0
(rechtsseitiger Test)
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
20
10
Zweiseitiger Test für den Mittelwert
Sei X eine normalverteilte Zufallsvariable in einer
Grundgesamtheit mit dem unbekannten Mittelwert µ und
der bekannten Varianz σ², X~ N(µ, σ²).
Es wird auf einem Signifikanzniveau α getestet, ob der
Parameter µ gleich µ0 ist oder nicht, d. h. es wird zwischen
den folgenden Hypothesen entschieden:
H0: µ = µ0 vs. H1: µ ≠ µ0
(Zweiseitiger Test)
W(H 0 wird abgelehnt | µ = µ 0 ) = W(Fehler 1. Art) = α
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
21
Prüfgröße für den Test über den Mittelwert einer
Normalverteilung mit bekannter Varianz
Sei (X1, X2, . . . , Xn) eine Stichprobe vom Umfang n. Es
gilt für jede Xi ~ N(µ, σ²).
Um eine Entscheidung über den Mittelwert µ der
Grundgesamtheit zu treffen, scheint es zweckmäßig zu
sein, den Stichprobenmittelwert oder eine Transformation
von ihm anzuwenden.
Prüfgröße:
Z=
X − µ0
σ
n
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
22
11
Kritischer Bereich des zweiseitigen Test für den
Mittelwertes einer N(µ, σ²) mit bekannter σ²
Der kritische Bereich K für diesen Test ist die Menge aller
möglichen Werte der Prüfgröße, für welche gilt:
1. der Abstand von µ0 ist so groß, dass man die Nullhypothese
ablehnen soll,
2. die Wahrscheinlichkeit, dass der Fehler bei dieser Entscheidung
(Fehler erster Art) nicht größer als α ist.
{
K = X : X − µ 0 > c und W( X − µ 0 > c | µ = µ 0 ) ≤ α
X ~ N(µ ;
α/2
α/2
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
}
σ²
X− µ
)⇒Z=
~ N(0, 1)
σ
n
n
Testverfahren I
23
Berechnung des kritischen Bereiches
{
K = X : X − µ 0 > c und W( X − µ 0 > c | µ = µ 0 ) ≤ α
}
W( X − µ0 > c | µ = µ0 ) = α ⇔ W( X − µ0 ≤ c | µ = µ0 ) = 1 − α
⇔ W(− c ≤ X − µ 0 ≤ c | µ = µ0 ) = 1 − α ⇔ W(
⇔ W(
c
c
−c
) = 1− α ⇒
≤Z≤
=Z α
1−
σ
σ
σ
2
n
n
n
K(α) = {X :| X − µ 0 | >
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
c
− c X − µ0
| µ = µ0 ) = 1 − α
≤
≤
σ
σ
σ
n
n
n
σ
⇒c=
⋅Z α
n 1− 2
X − µ0
σ
⋅ Z α } = {X : |
| > Z α } = {X : | Z | > Z α }
1−
1−
σ
n 1− 2
2
2
n
Testverfahren I
24
12
Entscheidungsregel und Treffen der
Entscheidung
X ∈ K(α ) ⇒ H 0 wird abgelehnt (H 1 wird angenommen )
W[X ∈ K(α ) | µ = µ 0 ] = α
Die Fehlerwahrscheinlichkeit ist α.
Diese Aussage ist richtig vor der Ziehung der konkreten Stichprobe.
Zieht man eine konkrete Stichprobe, dann ist der berechnete
Stichprobenmittelwert keine Zufallsvariable mehr und deswegen hat
es keinen Sinn, nach der Ziehung der SP eine Wahrscheinlichkeitsaussage zu machen. Da der Wert von α nahe Null gewählt wird, kann
man nur hoffen, dass die Entscheidung richtig ist.
X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen )
Die Fehlerwahrscheinlichkeit bei dieser Entscheidung ist unbekannt.
W[ X ∉ K(α ) | µ ≠ µ 0 ] = W[H 0 wird nicht abgelehnt | H 0 trifft nicht zu] = β
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
25
Zweiseitiger Test für den Mittelwert
- Zusammenfassung 1.
H0: µ=µ0
vs.
H1: µ≠ µ0
3.
Stichprobe vom Umfang n: (X1, X2, . . . , Xn)
4.
Prüfgröße:
Signifikanzniveau: α
5. Kritischer Bereich:
X − µ0
Z=
σ
n
6.
2.
K(α) = {X : | Z | > Z
1−
α
2
}
Entscheidungsregel:
X ∈ K( α ) ⇒ H 0 wird abgelehnt
X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen )
7. Treffen der Entscheidung aus der konkreten Stichproben
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
26
13
Zusammenhang
zwischen den Größen beider Fehler
H0: µ=µ0
vs.
H1: µ ≠ µ0
(1)
µ0
(µ = µ1 )
α: (Signifikanzniveau): Größe des
Fehlers erster Art (Vorgegeben)
β: Größe des Fehlers zweiter Art
(Im Allgemeinen unbekannt)
µ1
(3)
(2)
µ0
µ0
µ1
Beide Fehler wachsen gegenläufig.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
µ1
α 1> α2> α3 ⇒ β1< β2< β3
Testverfahren I
27
Beispiel: Test für den Mittelwert einer
Normalverteilung mit bekannter Varianz
Das Durchschnittsgewicht von Masthähnchen lag in der Vergangenheit bei
492,5 g mit einer Standardabweichung von 18,9 g. Nach Übergang zu einem
neuen Futtermittel liefert eine Stichprobe im Umfang von 81 ein
Durchschnittsgewicht von 496,3 g. Kann man aufgrund dieses
Stichprobenergebnisses unter der Annahme einer gleichgebliebenen
Standardabweichung mit einem Signifikanzniveau von 1 % schließen, dass sich
das Durchschnittsgewicht in der Grundgesamtheit verändert hat?
H0: µ = µ0 vs. H1: µ ≠ µ0 (µ0 = 492,5 )
α = 0,01
Z
H0: µ = 492,5
x = 496,3
n = 81
vs.
H1: µ ≠ 492,5
K(α) = {X : | Z | > Z
1−
α
2
}
Z=
X − µ0
σ
n
z=
1−
α
2
= Z 0,995 = 2,58
σ = 18,9
496,3 − 492,5
= 1,81
18,9
81
Entscheidung: Da |1,81|< 2,58 gilt, wird H0 nicht abgelehnt.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
28
14
Einseitige Tests für den Mittelwert
Ein einseitiger Test für den Mittelwert einer Normalverteilung mit
bekannter Varianz unterscheidet sich von dem zweiseitigen Test nur
in seinem entsprechenden kritischen Bereich.
Linksseitiger Test
Rechtsseitiger Test
(2) H0: µ≥ µ0 vs.
(3) H0: µ≤ µ0 vs.
H1: µ< µ0
Z=
Prüfgröße:
K(α ) = {X : Z < - Z1−α }
X − µ0
σ
n
H1: µ> µ0
K(α ) = {X : Z > Z1−α }
Kritischer
α
α
Bereich:
-Z1-α
Z1-α
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
29
Tests für den Mittelwert bei
unbekannter Varianz
Die Tests für den Mittelwert einer Normalverteilung mit unbekannter
Varianz unterscheiden sich von den vorigen Tests nur in der
Prüfgröße und den entsprechenden kritischen Bereichen.
Prüfgröße: T =
X − µ0
~ t n −1
S
n
Kritischer Bereich:
Tests:
(1) H0: µ=µ0 vs. H1: µ≠ µ0
K(α) = {X : | T | > t
n −1 ; 1−
α
2
}
(2) H0: µ≥ µ0 vs. H1: µ< µ0
K(α) = {X : T < - t n −1 ; 1−α }
(3) H0: µ≤ µ0 vs. H1: µ> µ0
K(α) = {X : T > t n −1 ; 1−α }
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
30
15
Beispiel: Test für den Mittelwert bei
unbekannter Varianz
Eine Maschine stellt Plättchen her, deren Dicke normalverteilt ist, mit
dem Sollwert (Mittelwert) 0,25 cm. Eine Stichprobe von 10 Plättchen
liefert ein arithmetisches Mittel von 0,253 cm bei einer Standardabweichung von 0,003 cm. Die Hypothese, dass die Maschine noch
exakt arbeitet, ist auf einem Signifikanzniveau von 0,05 zu überprüfen.
H0: µ = µ0
vs. H1: µ ≠ µ0 (µ0 = 0,25 )
H0: µ = 0,25 vs. H1: µ ≠ 0,25
T=
X− µ0
S
t
K(α) = {X : | T | > t
n −1 ; 1−
α
2
}
n
Entscheidung:
Da |3,162| > 2,262 ist, wird H0 abgelehnt.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
α = 0,05
n −1 ; 1−
α
2
= t 9 ; 0,975 = 2,262
n = 10 x = 0,253 s = 0,003
t=
0,253 − 0,25
= 3,162
0,003
10
Testverfahren I
31
Tests für den Mittelwert einer unbekannten
Verteilung für große Stichproben
Für die unbekannte Verteilung in der Grundgesamtheit und großen
Stichprobenumfang (n>30) lässt sich die t-Verteilung durch die
Standardnormalverteilung approximieren. Dadurch gelten:
Prüfgröße:
T=
X − µ0
~ t n −1 → Z ~ N(0 ; 1)
S
n
Kritischer Bereich:
Test:
(1) H0: µ = µ0 vs. H1: µ ≠ µ0
K(α) = {X : | T | > Z
(2) H0: µ ≥ µ0 vs. H1: µ < µ0
K(α) = {X : T < - Z1−α }
(3) H0: µ ≤ µ0 vs. H1: µ > µ0
K(α) = {X : T > Z1−α }
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
1−
α
2
}
32
16
Beispiel 1: Test für den Mittelwert einer
unbekannten Verteilung
Bei der Überprüfung des Verpackungsautomaten im Düngemittelwerk
werden 31 Säcke nachgewogen, für die ein Durchschnittsgewicht
50,1 kg und eine Standardabweichung 250 g berechnet werden.
Aufgrund dieses Stichprobenbefundes ist eine Entscheidung über die
Arbeit des Automaten (fehlerhaft/ nicht fehlerhaft) zu treffen. Die Entscheidung soll bei 5-%ger Irrtumswahrscheinlichkeit getroffen werden.
α=0,05
Über die Verteilung des Gewichtes
der Säcke liegt keine Information vor.
H0: µ=50 vs.
T=
X− µ0
S
n −1 ; 1−
α
2
K(α) = {X : | T | > t
α
n −1 ; 1−
2
t=
}
= t 30 ; 0,975 = 2,042
x = 50,1 s = 0,250
n = 31
H1: µ ≠ 50
n
t
50,1 − 50
= 2,227
0,250
31
Entscheidung: Da |2,227| > 2,042 ist, wird H0 abgelehnt, d.
h. man kann annehmen, dass der Automat fehlerhaft arbeitet.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
33
Beispiel 2: Test für den Mittelwert einer
unbekannten Verteilung
2003 beträgt das Durchschnittsalter der Zuzüge aus anderen Kreisen MV
nach Rostock 30 Jahre. Im Jahr 2004 liegt, bei einer Stichprobe von 100
Personen, das Durchschnittsalter der Zuzüge bei 29,2 Jahre mit einer
Standardabweichung von 14,65 Jahren. Hat sich der Wert im Jahr 2004
signifikant verringert, bei einem Signifikanzniveau von 0,05?
Quelle: Statistische Berichte 2003.
Über die Verteilung des Alters
liegt keine Information vor.
n = 100
H0: µ≥30 vs. H1: µ < 30
K(α ) = {X : T < − t n −1 ; 1−α }
t n −1 ; 1−α = t 99 ; 0,95 = 1,66
α=0,05
T=
X− µ0
S
n
x = 29,2
t=
s = 14,65
29,2 − 30
= −0,55
14,65
100
Entscheidung:
Da -0,55>-1,66 ist, wird H0 nicht abgelehnt, d. h. die Verringerung
des durchschnittlichen Wanderungsalters (Zuzüge) ist nicht signifikant.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
34
17
Beispiel 3: Test für den Mittelwert einer
unbekannten Verteilung
Das durchschnittliche Nettoeinkommen liegt im März 2004 bei
1.603 €. Bei einer Stichprobe von 200 Personen im Juni 2004 lag das
durchschnittliche Nettoeinkommen bei 1.715 € mit einer
Standardabweichung von 1.227 €. Hat sich das durchschnittliche
monatliche Nettoeinkommen bei einem Signifikanzniveau von 0,05
statistisch signifikant erhöht? Quelle: Mikrozensus 2004, Tabelle 36.
α=0,05
Über die Verteilung des NE liegt
keine Information vor.
n = 100
H0: µ ≤ 1.603 vs. H1: µ > 1.603
K(α) = {X : T > t n −1 ; 1−α }
T=
X− µ0
S
t n −1 ; 1−α = t199 ; 0,95 = 1,645
s = 1.227
x = 1.715
t=
1.715 − 1.603
= 1,291
1.227
n
200
Entscheidung:
Da 1,291<1,645 ist, wird H0 nicht abgelehnt, d. h. das durchschnittliche
Nettoeinkommen im Juni 2004 ist nicht signifikant höher als im März 2004.
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
35
Einstichprobentest für die Varianz
(1) H0: σ²= σ²0 vs.
H1: σ² ≠ σ²0 (Zweiseitiger Test)
(2) H0: σ² ≥ σ²0 vs.
H1: σ2 < σ²0 (Linksseitiger Test)
(3) H0: σ² ≤ σ²0 vs.
H1: σ² > σ²0 (Rechtsseitiger Test)
Modifizierte Stichprobenvarianz
als Stichprobenfunktion:
S2 =
1 n
∑ (X i − X) 2
n − 1 i =1
Theoretische Verteilung der modifizierten
Stichprobenvarianz bei Normalverteilung der
Grundgesamtheit und einfacher Zufallsstichprobe:
Prüfgröße:
χ2 =
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
χ2 =
(n- 1) S ²
~ χ 2n −1
2
σ0
(n- 1) S ²
σ 02
Testverfahren I
36
18
Kritische Bereiche für die Tests
über die Varianz
α: Signifikanzniveau
α α
(1)
2
+
2
=α
K(α) = {S ² :
H0: σ² = σ²0
H1: σ² ≠ σ²0
χ2
n −1;
χ2
α
oder
n−1; 1−
2
α
2
S ²(n − 1)
< χ2 α
n −1;
σ 02
2
S ²(n − 1)
> χ2 α }
n −1;1−
σ 02
2
(2)
α
H0: σ² ≥ σ²0
H1: σ² < σ²0
K(α ) = {S ² :
S ²(n − 1)
< χ 2n −1;α }
σ 02
K(α ) = {S ² :
S ²(n − 1)
> χ 2n −1;1−α }
σ 02
χ n2−1; α
(3)
α
H0: σ² ≤ σ²0
H1: σ² > σ²0
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
χ n2−1;
1−α
Testverfahren I
37
Beispiel: Einstichprobentest für die Varianz
In der Vergangenheit betrug die Varianz der normalverteilten Lebensdauer
einer bestimmten Batteriesorte 1,1 Jahre². Es soll nun auf Stichprobenbasis
mit einem Signifikanzniveau von 0,01 geprüft werden, ob sich durch
Einführung eines kostengünstigeren Produktionsverfahrens die Varianz der
Lebensdauer erhöht. Eine Stichprobe von 25 nach dem neuen Verfahren
gefertigten Batterien liefert eine Varianz von 1,6 Jahre².
H0: σ² ≤ 1,1 vs. H1: σ² > 1,1
χ
Kritischer Bereich:
K(α ) = {S ² :
α = 0,01
α = 0,01
2
n −1; 1− α
=χ
2
24; 0,99
S ²(n − 1)
> χ n2 −1;1−α }
σ 02
Prüfgröße:
= 42,980
χ2 =
χ2 =
(n- 1) S ²
~ χ 2n −1
σ 02
(n- 1) s ² 24 ⋅ 1,6
=
= 34,91
1,1
σ 02
Entscheidung: 34,91<42,980 ⇒H0 kann nicht
abgelehnt werden, d. h. aus dem Stichprobenergebnis
kann nicht auf eine signifikante Erhöhung der Varianz
der Grundgesamtheit geschlossen werden.
42,98
χ2
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
38
19
Einstichprobentest für den Anteilswert
(1) H0: θ= θ0
vs.
H1: θ ≠ θ0
(Zweiseitiger Test)
(2) H0: θ ≥ θ0
vs.
H1: θ < θ0
(Linksseitiger Test)
(3) H0: θ ≤ θ0
vs.
H1: θ > θ0
(Rechtsseitiger Test)
Xi: Bernoulliverteilt mit dem Parameter θ0
P: Stichprobenanteilswert
i
n
⇒ n⋅ P = ∑ X i
n
i =1
Prüfgröße:
P=
i =1
Z=
P− θ 0
n·P: Binomialverteilt mit den Parameter n und θ0
Für nθ0(1-θ0) ≥ 9 gilt:
P− θ 0
Z=
θ 0 (1 − θ 0 )
n
f (0) = W(Xi = 0) =1−θ
f (1) = W(Xi = 1) = θ
n
∑X
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
θ 0 (1 − θ 0 )
n
~ N(0,1)
Testverfahren I
39
Kritische Bereiche
für die Tests über den Anteilswert
Signifikanzniveau α
α
(1)
2
+
α
2
Für nθ0(1-θ0) ≥ 9
=α
K(α) = {P : |
H0: θ = θ0
H1: θ ≠ θ0
(2)
α
K(α) = {P :
H0: θ ≥ θ0
H1: θ < θ0
-Z1-α
α
(3)
K(α) = {P :
H0: θ≤ θ0
H1: θ> θ0
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Z1-α
Testverfahren I
P− θ 0
θ 0 (1 − θ 0 )
n
P− θ 0
θ 0 (1 − θ 0 )
n
P− θ 0
θ 0 (1 − θ 0 )
n
| >Z
1−
α
2
}
< - Z1−α }
> Z1−α }
40
20
Beispiel: Einstichprobentest für den
Anteilswert
Der Fabrikant eines bestimmten Artikels behauptet gegenüber einem
Abnehmer, dass der Ausschussanteil in einer von ihm angebotenen Lieferung
genau 0,10 bzw. 10 % beträgt. In einer zur Qualitätsüberprüfung gezogenen
Stichprobe ohne Zurücklegen im Umfang von 100 werden 13 Ausschussartikel gefunden. Ist damit die Behauptung des Fabrikanten bei einem
Signifikanzniveau von 0,05 widerlegt?
H0: θ= 0,10 vs. H1: θ≠ 0,10
Prüfgröße:
Kritischer Bereich:
Z=
K(α) = {P : | Z | > Z
1−
α
2
+
α
2
α}
2
=α
α=0,05
Z
1−
α
2
= Z 0,975
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
P− θ 0
Es gilt nθ0(1−θ0) =9.
0,13 − 0,10
0,03
0,03
θ 0 (1 − θ 0 ) z = 0,10 ⋅ 0,90 = 0,0009 = 0,03 = 1
n
100
Entscheidung:
1<1,96 ⇔ 1 ∉ K(a) ⇒H0 kann nicht
abgelehnt werden, d. h. aus dem
= 1,96 SP-Ergebnis kann die Behauptung des
Fabrikanten nicht widerlegt werden.
Testverfahren I
41
Hypothesentests und ihre Bestandteile
- Zusammenfassung Zusammen mit dem Schätzen bildet das Testen von Hypothesen den
Kernbereich der schließenden oder induktiven Statistik.
Ein Hypothesentest besteht aus sieben Elementen:
1. zwei entgegengesetzt formulierten Hypothesen (H0 und H1)
2. einem von vornherein festgelegten Signifikanzniveau α
3. einer bzw. mehreren Stichproben
4. einer Stichprobenfunktion (Prüfgröße bzw. Testgröße)
5. einem Ablehnungsbereich bzw. einem Annahmebereich für H0
6. einer Entscheidungsregel
7. einer Entscheidung
Dr. Ricabal Delgado / Prof. Kück
Lehrstuhl Statistik
Testverfahren I
42
21
Herunterladen