Modul 141 Statistik

Werbung
Modul 141
Statistik
1. Studienjahr
11. Sitzung
Signifikanztests
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3.
Einseitige oder zweiseitige Fragestellung
4.
Signifikanzniveau
5.
Auswahl der Testfunktion
6.
Berechnung des Testwertes
7.
Entscheidung
8.
Der t-Test
1
Einführung – sind die Österreicher Zwerge? …
Österreicher stammen von Zwergen ab!
In einer Boulevardzeitung wird behauptet, dass es in
Österreich früher viele Zwerge gab, die inzwischen in der
Bevölkerung aufgegangen sind. Als Indiz hierfür wird die
Tatsache herangezogen, dass die Österreicher im Mittel
kleiner seien als die Deutschen.
Die Größe der deutschen Bevölkerung ist normalverteilt
mit einem Mittelwert von 175 cm und einer Standardabweichung von 8.34 cm ist.
Die Zeitung ermittelte die Durchschnittsgröße in Österreich
anhand einer Stichprobe von 25 Personen und kam zum
Schluss, dass die Größe der österreichischen Bevölkerung
ebenfalls normalverteilt ist und einen Mittelwert von 173
cm bei einer Standardabweichung von 8.2 cm aufweist.
Einführung – sind die Österreicher Zwerge? …
Sind die Österreicher nun tatsächlich kleiner als die
Deutschen?
Oder ist der Unterschied eher Zufall weil die
Stichprobe vielleicht nicht wirklich repräsentativ
war?
Österreich NV(174;8.2)
Deutschland NV(175;8.34)
14
4
14
7
15
0
15
3
15
6
15
9
16
2
16
5
16
8
17
1
17
4
17
7
18
0
18
3
18
6
18
9
19
2
19
5
19
8
Zur Beantwortung
bietet die Statistik die
SIGNIFIKANZTESTS
2
Signifikanztests…
In den vorangegangenen Sitzungen wurde davon
ausgegangen, dass einzelne empirische Verteilungen
durch entsprechende theoretische Verteilungen
wiedergegeben werden können.
Auf dieser Grundlage wurden Wahrscheinlichkeiten
berechnet. Die Frage ob die empirischen Verteilungen
tatsächlich den theoretischen entsprechen oder die aus
der Stichprobe berechneten Parameter die der
Grundgesamtheit wiedergeben, blieb dabei
unbeantwortet.
Signifikanztests…
Zur Klärung dieser Frage stellt die schließende Statistik
die Signifikanztests zur Verfügung mit denen geprüft
werden kann ob:
• Ein einzelner Parameter (z.B. der Mittelwert oder die
Varianz) einer Stichprobe gleich, ungleich, größer oder
kleiner dem Mittelwert oder der Varianz der
Grundgesamtheit ist (Parametertests
Parametertests)
• Ein bestimmter Anteil einer Stichprobe gleich, ungleich,
größer oder kleiner dem Anteil an der Grundgesamtheit
ist (Anteilstest
Anteilstest)
• Ob der Unterschied zwischen zwei Parametern zweier
Stichproben zufällig ist oder nicht (Differenzentest
Differenzentest)
• Die empirische Verteilung durch eine theoretische
Verteilung erklärt werden kann (Anpassungstests
Anpassungstests)
3
Signifikanztests…
Zur Beantwortung entsprechender Fragestellungen
werden in der Statistik Signifikanztests durchgeführt die
nach folgendem Schema aufgebaut sind:
1. Spezifikation einer Null- und einer Alternativhypothese
2. Festlegung eines Signifikanzniveaus
3. Auswahl einer geeigneten Testfunktion
4. Berechnung des Testwertes
5. Entscheidung
Signifikanztests…
1. Spezifikation einer Null- und einer Alternativhypothese
2. Festlegung eines Signifikanzniveaus
3. Auswahl einer geeigneten Testfunktion
4. Berechnung des Testwertes und Entscheidung
Für jeden dieser vier Schritte existieren klare Vorgaben,
die von der Fragestellung, die jeweils untersucht wird,
abhängen. Unterschieden werden generell:
• Parametrische Tests – die sich mit der
Untersuchung von einzelnen Parametern (µ, σ, σ² ...)
befassen, und
• Nichtparametrische Tests – die sich mit Aussagen
über die Verteilung (z.B. Normalverteilung) befassen
4
Signifikanztests…
Beispiel für einen parametrischen Test:
Test Von der Abfüllanlage
einer Brauerei werden Flaschen gefüllt, wobei die Füllmenge X
pro Flasche gewissen Schwankungen unterliegt. In den
Herstellerangaben der Abfüllanlage wurde angegeben, dass die
durchschnittliche Füllmenge µ0 = 500 cm³, mit einer
Standardabweichung von σ = 1.5, betrage. Anhand einer
Stichprobe vom Umfang n = 45 wurde die durchschnittliche
Füllmenge von 499.46 cm³ (= µ1) empirisch ermittelt. Anhand
diese beiden Werte können nun unterschiedliche
Fragestellungen untersucht werden, abhängig von der
Interessenlage der Personen, die die Untersuchung durchführen.
a.) eine Eichkommission ist an der generellen Abweichung vom
Sollwert interessiert.
b.) ein Verbraucherschutzverband ist daran interessiert ob der
Istwert deutlich kleiner als der Sollwert ist.
c.) der Brauereibesitzer ist daran interessiert ob im Mittel
zuviel abgefüllt wird.
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2. Formulierung der Hypothesen
3.
Einseitige oder zweiseitige Fragestellung
4.
Signifikanzniveau
5.
Auswahl der Testfunktion
6.
Berechnung des Testwertes
7.
Entscheidung
8.
Der t-Test
5
Formulierung der Hypothesen …
Beim Aufbau eines Signifikanztests werden immer zwei
Hypothesen formuliert:
Die Nullhypothese die mit H0 bezeichnet wird und immer
die Gleichheit beschreibt. Für das Beispiel wäre H0:
„Ist der Mittelwert der Stichprobe gleich dem Mittelwert,
den der Hersteller angegeben hat?“ Also: H0: µ0 = µ1
Eine Alternativhypothese,
Alternativhypothese die mit HA oder H1
bezeichnet wird und sich als Gegenhypothese aus der
Fragestellung und H0 ergibt. Für das Beispiel können
folgende HA formuliert werden:
a.) HA: µ0 ≠ µ1
b.) HA: µ1 < µ0
c.) HA: µ1 > µ0
Formulierung der Hypothesen …
Bei der Bestimmung des Mittelwertes µ1 aus einer
Stichprobe ist zu erwarten, dass nicht genau der
tatsächliche Wert der Grundgesamtheit getroffen wird. Ist
die Stichprobe repräsentativ kann aber davon ausgegangen
werden das µ1 nicht allzu sehr vom tatsächlichen Wert µ0
abweicht. Für die formulierten Hypothesen bedeutet dies:
H0 (µ1 = µ0) wird abgelehnt und damit die
Alternativhypothese angenommen, wenn je nach
Fragestellung gilt:
a.) HA: µ0 ≠µ1, wenn |µ1 - µ0| sehr groß ist
b.) HA: µ1 < µ0, wenn µ1 sehr viel kleiner als µ0 ist
c.) HA: µ1 > µ0, wenn µ1 sehr viel größer als µ0 ist.
Zur Präzisierung der Entscheidungen ob die Abweichungen
sehr groß oder sehr viel größer bzw. kleiner sind wird das
Signifikanzniveau festgelegt.
6
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3. Signifikanzniveau
4.
Einseitige oder zweiseitige Fragestellung
5.
Auswahl der Testfunktion
6.
Berechnung des Testwertes
7.
Entscheidung
8.
Der t-Test
Signifikanzniveau …
Das Signifikanzniveau bezeichnet die akzeptierte
Irrtumswahrscheinlichkeit mit der die Nullhypothese
abgelehnt wird obwohl sie richtig ist.
Die Festlegung eines geeigneten Signifikanzniveaus ist
problemorientiert, entsprechend der Fragestellung
vorzunehmen.
Alternativ kann das Signifikanzniveau auch als Risiko
betrachtet werden, wenn es beispielsweise darum geht die
Wahrscheinlichkeit für Schäden zu beziffern.
In der Wasserwirtschaft werden Deiche oft so konstruiert,
dass das Risiko eines Überflutens zu 95% ausgeschlossen
ist. Für die Sicherheit von Kernkraftwerken ist ein
niedrigeres Risiko wünschenswert, so dass Unfälle mit
nahezu 100%iger Sicherheit ausgeschlossen werden können.
7
Signifikanzniveau …
Für das Beispiel sei ein Signifikanzniveau α = 0.01
vorgegeben.
Das bedeutet, dass die Wahrscheinlichkeit für die
Entscheidung die Nullhypothese abzulehnen obwohl sie
richtig ist bei 1% liegt.
Auf der anderen Seite liegt aber auch die Wahrscheinlichkeit
für die Annahme der Nullhypothese obwohl sie falsch ist bei
99%.
Sehr oft muss α nicht frei bestimmt werden sondern ist
durch die Vorgaben der Interessensgruppe oder durch die
Aufgabenstellung a priori festgelegt.
Denkbar wäre beispielsweise, dass die Eichkommission
höhere Anforderungen an die Güte des Testes stellt als die
Verbraucherschutzorganisationen.
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3.
Signifikanzniveau
4. Einseitige oder zweiseitige Fragestellung
5.
Auswahl der Testfunktion
6.
Berechnung des Testwertes
7.
Entscheidung
8.
Der t-Test
8
Zweiseitige Fragestellung …
H0: µ1 = µ0
Zustimmungsbereich (H0)
Testwert liegt in einem
HA: µ1 ≠ µ0
1- α breiten Intervall der Testverteilung
α = 0.1
Breite
α/2
Breite
α/2
Breite = 1 - α
F ( z) = α
2
F ( z) = 1 − α
2
Ablehnungsbereich (HA) – Testwert liegt rechts oder
links ausserhalb des 1- α breiten
Zustimmungsbereichs der Testverteilung
Einseitige Fragestellung …
H0: µ1 = µ0
Zustimmungsbereich (H0)
Testwert liegt im linken,
1-α breiten Bereich der Testverteilung
HA: µ1 > µ0
α = 0.1
Breite
α
Breite = 1 - α
F (z ) = 1 − α
Ablehnungsbereich (HA) – Testwert liegt rechts
ausserhalb des 1-α breiten Zustimmungsbereichs der
Testverteilung
9
Einseitige Fragestellung …
Zustimmungsbereich (H0)
Testwert liegt im rechten,
1-α breiten Bereich der Testverteilung
Breite = α
H0: µ1 = µ0
HA: µ1 < µ0
α = 0.1
Breite = 1 - α
F (z ) = α
Ablehnungsbereich (HA) – Testwert liegt links
ausserhalb des 1-α breiten Zustimmungsbereichs der
Testverteilung
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3.
Einseitige oder zweiseitige Fragestellung
4.
Signifikanzniveau
5. Auswahl der Testfunktion
6.
Berechnung des Testwertes
7.
Entscheidung
8.
Der t-Test
10
Auswahl der Testfunktion …
Die Auswahl einer geeigneten Testfunktion ist von
verschiedenen Kriterien abhängig:
1. Von der Art des Tests: parametrisch oder
nichtparametrisch
2. Vom Parameter, der durch die Nullhypothese
untersucht werden soll; µ, σ, σ²
3. Von der Verteilung der Grundgesamtheit aus der die
Stichprobe ermittelt wurde.
4. Von der Größe der Stichprobe
Die Testfunktion beschreibt nicht die Verteilung der
Grundgesamtheit sondern die Verteilung der Testgröß
e
Testgröße
(im Falle des Beispieles des Mittelwerts).
Auswahl der Testfunktion …
Beim Beispiel handelte es sich um:
1. Einen parametrischen Test
(Mittelwert wird untersucht)
2. Der Stichprobenumfang betrug 45
3. Die Grundgesamtheit war normalverteilt mit µ = 500
und σ = 1.5
Aus diesen Kriterien folgt, dass die Testgröße normalverteilt
ist.
D.h. würden sehr viele
Stichproben aus der
Grundgesamtheit gezogen
und die Verteilung der
Mittelwerte betrachtet,
wäre diese normalverteilt.
Die Testfunktion ist dann
die SNV.
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
11
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3.
Einseitige oder zweiseitige Fragestellung
4.
Signifikanzniveau
5.
Auswahl der Testfunktion
6. Berechnung des Testwertes
7.
Entscheidung
8.
Der t-Test
Berechnung des Testwertes …
Bei einem normalverteilten Testparameter und einem
Stichprobenumfang von n ≥ 30 wird ein Gauß
Gaußtest durchgeführt der auf der Standardnormalverteilung basiert.
Die Testgröße v ist standardnormalverteilt und berechnet
sich dabei nach:
X − µ0
v=
n
σ
Die Testgröße wird
nun gegen die Werte
der Standardnormalverteilung an den
Signifikanzstellen
verglichen um zu einer
Entscheidung zu
gelangen.
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
12
Berechnung des Testwertes …
Bei einem Signifikanzniveau von α = 0.01 bedeutet dies:
Die Nullhypothese: H0: µ0 = µ1 wird verworfen wenn:
a.) HA: µ1 ≠ µ0 Æ v außerhalb eines zentralen 99% Intervalls
liegt
0.45
b.) HA: µ1 < µ0
0.40
v kleiner als der
1% Wert ist.
0.35
0.30
0.25
c.) HA: µ1 > µ0
v größer als der
99% Wert ist.
0.20
0.15
0.10
0.05
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Berechnung des Testwertes …
Es müssen also folgende Sachverhalte für die drei
unterschiedlichen Fragestellungen bestimmt werden:
H0: µ1 = µ0 ist zu verwerfen
a.) gegen
HA: µ1 ≠ µ0 falls v < -X1-α/2 oder v > X1-α/2
b.) gegen
HA: µ1 < µ0 falls v < -X1-α
c.) gegen
HA: µ1 > µ0 falls v > X1-α
Beispiel: Als Stichprobenmittel der n=45 Flaschen wurde
eine Füllmenge von 499.46 cm³ ermittelt.
Damit berechnet sich v nach:
v=
X − µ0
σ
n=
499.46 − 500
45 = −2.41
1.5
13
Berechnung des Testwertes …
v=
X − µ0
σ
n=
499.46 − 500
45 = −2.41
1.5
Die Werte der Standardnormalverteilung für:
Z(α/2), Z(1-α/2), Z(α) und Z(1-α) werden wie in der
letzten Sitzung dargestellt aus Tabellen ermittelt. Es ergibt
sich:
Für a.) Z(α/2)
Z(1-α/2)
= Z(0.005) = -2.575 und
= Z(0.995) = 2.575
Für b.) Z(α) = Z(0.01) = -2.327
Für c.) Z(1-α) = Z(0.99) = 2.327
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3.
Einseitige oder zweiseitige Fragestellung
4.
Signifikanzniveau
5.
Auswahl der Testfunktion
6.
Berechnung des Testwertes
7. Entscheidung
8.
Der t-Test
14
Entscheidung …
Mit den berechneten Parametern lassen sich nun die
Hypothesen prüfen:
H0: µ1 = µ0 ist zu verwerfen
a.) gegen HA: µ1 ≠ µ0 falls -2.41 < -2.575 oder -2.41 > 2.575
b.) gegen HA: µ1 < µ0 falls -2.41 < -2.372
c.) gegen HA: µ1 > µ0 falls -2.41 > 2.372
Die Ergebnisse lassen sich folgendermaßen interpretieren:
a.) Die Eichkommission kommt zum Schluss, dass die mittlere
Füllmenge der Stichprobe dem Sollwert entspricht.
b.) Die Verbraucherschutzkommission kommt zum Schluss,
dass die mittlere Füllmenge nicht dem Sollwert entspricht.
c.) Der Brauereibesitzer kommt zum Schluss, die mittlere
Füllmenge entspricht dem Sollwert.
Entscheidung …
gegen HA: µ1 ≠ µ0 falls -2.41 < -2.575 oder 2.41 > 2.575
0.45
0.40
0.35
AblehnungsAblehnungsbereich
µ0 ≠ µ1
0.30
0.25
0.20
Zustimmungsbereich µ0 = µ1
Die Eichkommission
kommt zum Schluss,
dass die mittlere
Füllmenge dem
Sollwert entspricht.
AblehnungsAblehnungsbereich
µ0 ≠ µ1
0.15
0.10
0.05
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
15
Entscheidung …
gegen HA: µ1 < µ0 falls -2.41 < -2.372
0.45
AblehnungsAblehnungsbereich
µ0 < µ1
0.40
0.35
Zustimmungsbereich µ0 = µ1
Die Verbraucherschutzkommission
kommt zum Schluss,
dass die mittlere
Füllmenge nicht dem
Sollwert entspricht.
0.30
0.25
0.20
0.15
0.10
0.05
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Entscheidung …
gegen HA: µ1 > µ0 falls -2.41 > 2.372
0.45
Zustimmungsbereich µ0 = µ1
0.40
AblehnungsAblehnungsbereich
µ0 > µ1
Der Brauereibesitzer
kommt zum Schluss,
dass die mittlere
Füllmenge dem
Sollwert entspricht.
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
-5
-4
-3
-2
-1
0
1
2
3
4
5
16
Inhalt der 11. Sitzung …
1.
Parametrische Signifikanztests
2.
Formulierung der Hypothesen
3.
Einseitige oder zweiseitige Fragestellung
4.
Signifikanzniveau
5.
Auswahl der Testfunktion
6.
Berechnung des Testwertes
7.
Entscheidung
8. Der tt-Test
Der t-Test …
Der t-Test kommt zur Anwendung, wenn ein Mittelwerttest
mit einer Stichprobe (mit n ≤ 30) aus einer
Grundgesamtheit, bei der σ oder σ² nicht bekannt ist,
durchgeführt werden soll.
Der Testfunktionswert v ergibt sich dabei nach:
v=
x − µ0
n
s
Anstelle der unbekannten Standardabweichung σ der
Grundgesamtheit wird hier die Standardabweichung der
Stichprobe s benutzt. Sie berechnet sich nach:
1 n
2
s=
( xi − x )
∑
n − 1 i =1
17
Der t-Test …
Die t-Verteilung ist der Standardnormalverteilung sehr
ähnlich. Ihre Funktionswerte sind von der Anzahl der
Freiheitsgrade abhängig. Mit zunehmenden FG nähert sie
sich immer mehr der SNV an.
Die FG
berechnen
sich aus dem
Stichprobenumfang n
nach:
0.400
FG = n − 1
0.150
FG = 3
FG = 7
FG = 25
0.350
0.300
0.250
0.200
0.100
0.050
0.000
-4
-3
-2
-1
0
1
2
3
4
Der t-Test …
Beispiel für die Anwendung des t-Tests:
Zehn Hohlkarabiner einer bestimmten Marke wurden der
Produktion entnommen und dem Zerreißversuch
unterzogen, d.h. die Belastung des Karabiners wurde
solange erhöht, bis er brach. Der Bruch geschah bei
folgenden Werten xi:
2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230,
2200 [kp]
Aus versicherungstechnischen Gründen soll nun überprüft
werden, ob der vom Hersteller angegebene Sollwert von
2200 kp mit 99%iger Sicherheit gewährleistet ist.
Hypothesen:
H0: µ1 = µ0 HA: µ1 < µ0
Signifikanzniveau: α = 0.01
18
Der t-Test …
Beispiel für die Anwendung des t-Tests:
xi: 2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150,
2230, 2200 [kp]
Hypothesen: Signifikanzniveau: Freiheitsgrad:
H0: µ1 = µ0 α = 0.01
FG = n – 1 = 9
HA: µ1 < µ0
µ1 =
1 n
∑ X i = 2164
n i =1
v=
1 n
2
( xi − x ) = 2960 = 54.4
∑
n − 1 i =1
s=
2164 − 2200
X − µ0
n=
10 = −2.325
s
54.4
Der Wert der t-Verteilung für FG=9 und α = 0.01 wird
der Tabelle entnommen und beträgt: -2.8214
Der t-Test …
Beispiel für die Anwendung des t-Tests:
Hypothesen:
Signifikanzniveau:
Freiheitsgrad:
H0: µ1 = µ0
α = 0.01
FG = n – 1 = 9
HA: µ1 < µ0
t(0.01) = -2.821
Entscheidung:
HA wird verworfen, da
0.350
0.300
v nicht kleiner als t
0.250
H0 wird deswegen
angenommen.
Der Hersteller geht also
davon aus, dass seine
Karabiner dem Sollwert
entsprechen.
v = -2.325
0.200
0.150
0.100
0.050
0.000
-4
-3
-2
-1
0
1
2
3
4
19
Parametrische Signifikanztests …
Eine einfache
Stichprobe
H0: µ1 = µ0
G beliebig verteilt,
n hinreichend groß
H0: σ²1 = σ²0
G ist N(µ,σ) verteilt
σ
bekannt
Approximativer
Gaußtest
Gaußtest
G ist N(µ,σ) verteilt
σ
unbekannt
oder n < 30
t-Test
χ²-Test für die
Varianz
Einführung – sind die Österreicher Zwerge? …
Österreicher stammen von Zwergen ab!
In einer Boulevardzeitung wird behauptet, dass es in
Österreich früher viele Zwerge gab, die inzwischen in der
Bevölkerung aufgegangen sind. Als Indiz hierfür wird die
Tatsache herangezogen, dass die Österreicher im Mittel
kleiner seien als die Deutschen.
Die Größe der deutschen Bevölkerung ist normalverteilt
mit einem Mittelwert von 175 cm und einer Standardabweichung von 8.34 cm ist.
Die Zeitung ermittelte die Durchschnittsgröße in Österreich
anhand einer Stichprobe von 25 Personen und kam zum
Schluss, dass die Größe der österreichischen Bevölkerung
ebenfalls normalverteilt ist und einen Mittelwert von 173
cm bei einer Standardabweichung von 8.2 cm aufweist.
20
Einführung – sind die Österreicher Zwerge? …
Sind die Österreicher nun tatsächlich kleiner als die
Deutschen?
Oder ist der Unterschied eher Zufall weil die
Stichprobe vielleicht nicht wirklich repräsentativ
war?
Österreich NV(174;8.2)
Deutschland NV(175;8.34)
14
4
14
7
15
0
15
3
15
6
15
9
16
2
16
5
16
8
17
1
17
4
17
7
18
0
18
3
18
6
18
9
19
2
19
5
19
8
Zur Beantwortung
bietet die Statistik die
SIGNIFIKANZTESTS
Einführung – sind die Österreicher Zwerge?…
gegeben:
normalverteilte Grundgesamtheit mit:
µ0 = 175; σ0 = 8.34
normalverteilte Stichprobe mit:
n = 25; µ1 = 173; σ1 = 8.2
1. Formulierung der Hypothesen
2. Signifikanzniveau z.B. α = 0.1
3. Einseitige oder zweiseitige
Fragestellung
4. Auswahl der Testfunktion
5. Berechnung des Testwertes
6. Entscheidung
21
Herunterladen