Statistik II für Betriebswirte Vorlesung 3

Werbung
Statistik II für Betriebswirte
Vorlesung 3
Prof. Dr. Hans-Jörg Starkloff
TU Bergakademie Freiberg
Institut für Stochastik
2. November 2016
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
1
Wilcoxon-Rangsummentest
I
Der Wilcoxon-Rangsummentest dient zum Vergleich zweier
unabhängiger Stichproben hinsichtlich ihrer Lage.
I
Er kann im Fall von nicht-normalverteilten Grundgesamtheiten an
Stelle des doppelten t−Tests verwendet werden.
I
Er wird auch als Rangtest nach Wilcoxon bezeichnet und ist
äquivalent zum U-Test von Mann-Whitney.
I
Geg.: 2 unabhängige Stichproben
X1 , . . . , Xn1 mit stetiger Verteilungsfunktion FX und
Y1 , . . . , Yn2 mit stetiger Verteilungsfunktion FY , wobei
FY (t) = FX (t + a) mit einer reellen Zahl a vorausgesetzt wird
(falls Erwartungswerte existieren gilt µX = EX = EY + a = µY + a).
I
Er kann als zweiseitiger oder als einseitiger Test ausgeführt werden.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
2
Wilcoxon-Rangsummentest – kleine Stichprobenumfänge
I
Hypothesen: H0 : a = 0 ,
HA : a 6= 0
(zweiseitiger Test)
(bzw. H0 : µX = µY , HA : µX 6= µY ).
I
In der gemeinsamen Stichprobe werden die Ränge bestimmt. Die
Testgröße T = R1 ist die Summe der Ränge zu der ersten
Stichprobe.
I
Kritischer Bereich (n1 , n2 klein):
K = {t > 0 : t ≤ wn1 ,n2 ;α/2 } ∪ {t > 0 : t ≥ wn1 ,n2 ;1−α/2 } ;
die Quantile wn1 ,n2 ;α/2 und wn1 ,n2 ;1−α/2 kann man in Tabellen
finden, dabei gilt
wn1 ,n2 ;1−α = n1 (n1 + n2 + 1) − wn1 ,n2 ;α .
I
Grundüberlegung: Beide Stichproben sollten sich unter H0
ungefähr gleichartig in der gemeinsamen geordneten Stichprobe
durchmischen.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
3
Wilcoxon-Rangsummentest – große Stichprobenumfänge
I
Hypothesen: H0 : a = 0 ,
HA : a 6= 0
(zweiseitiger Test)
(bzw. H0 : µX = µY , HA : µX 6= µY ).
I
Testgröße: Mit der Summe R1 der Ränge zur ersten Stichprobe
in der gemeinsamen Stichprobe nutzt man
R1 − 1 n1 (n1 + n2 + 1)
T =q 2
.
1
n
n
(n
+
n
+
1)
2
12 1 2 1
I
Kritischer Bereich (n1 , n2 groß):
(Faustregel: n1 ≥ 4 , n2 ≥ 4 , n1 + n2 ≥ 20)
K = {t ∈ R : |t| > z1−α/2 }
(da T näherungsweise standardnormalverteilt ist).
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
4
Beispiel: Flugschrauber
I
Mit zwei Typen von Flugschraubern wurden jeweils 6 Flüge zwischen
zwei Flughäfen durchgeführt und die totale Flugzeit in Minuten
gemessen. Wird diese Strecke im Mittel gleich schnell bewältigt ?
I
Daten: (Quelle: Aczel, Sounderpandian: Complete Business
Statistics, 2006, Bsp.14-4)
Modell A
Modell B
I
35
29
38
27
40
30
42
33
41
39
36
37
Ordnen und Rangvergabe (Ränge zur ersten Stichprobe in rot):
A
35 36
38
40 41 42
B
27 29 30 33
37
39
Rang
1
2
3
4
5
6
7
8
9 10 11 12
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
5
Fortsetzung Beispiel: Flugschrauber
HA : µA 6= µB ,
I
Hypothesen: H0 : µA = µB ,
I
Wert der Testgröße des Wilcoxon-Rangsummentests:
t = r1 = 5 + 6 + 8 + 10 + 11 + 12 = 52 .
I
Kritischer Bereich: aus Tabelle
w6,6;0.025 = 26 ,
⇒
I
α = 0.05 .
w6,6;0.975 = 6 · 13 − 26 = 52 ,
K = {t > 0 : t ≤ 26} ∪ {t > 0 : t ≥ 52} .
Testergebnis: t ∈ K , H0 wird abgelehnt, die Flugzeiten sind
signifikant unterschiedlich.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
6
Bindungen
I
I
Bei Vorzeichen- oder auf Rängen basierten Tests kann es trotz der
Stetigkeitsannahme der entsprechenden Verteilungen vorkommen,
dass in der Stichprobe gleiche Werte vorkommen. Man spricht dann
von auftretenden Bindungen (engl. ties“).
”
Der Testaufbau sieht Bindungen eigentlich nicht vor (die
Wahrscheinlichkeit dafür ist Null), deshalb muss man die Tests
geeignet modifizieren.
I
Beim Auftreten von Bindungen mittelt man die Rangzahlen.
I
Besonders kritisch sind Bindungen bei Vorzeichentests, wenn im
Einstichprobenproblem einige Werte gleich dem Median sind bzw.
im Zweistichprobenproblem einige Differenzen gleich Null sind.
I
Bei bestimmten Tests, wie z.B. dem Wilcoxon-Rangsummentest
oder dem Kruskal-Wallis-Test (er wird später behandelt) muss die
Testgröße beim Vorliegen von Bindungen in der Stichprobe
entsprechend angepasst werden (siehe Literatur).
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
7
Bindungen bei Vorzeichentests
Einige mögliche Vorgehensweisen:
I
Oft kann man Bindungen vermeiden, indem man die
Messgenauigkeit erhöht.
I
Beobachtungen mit Bindung werden nicht berücksichtigt
(⇒ geringerer Stichprobenumfang).
I
Beobachtungen mit Bindung werden zu gleichen Teilen beiden
Gruppen (+ bzw. −, etc.) zugeordnet, bei ungerader Anzahl der
Bindungen wird eine Beobachtung nicht berücksichtigt.
I
Die Beobachtungen mit Bindung werden zufällig mit einer
Wahrscheinlichkeit von 0.5 einer der beiden Gruppen zugeordnet.
I
Nulldifferenzen erhalten das seltenere Vorzeichen.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
8
Verteilungstests
I
Eine weitere Klasse von Tests beschäftigt sich mit der Prüfung, ob
die Werte der Stichprobe aus einer Grundgesamtheit mit einer
speziellen hypothetischen Verteilungsfunktion stammen.
I
Ausführlicher wird hier der χ2 −Anpassungstest behandelt.
I
Kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auch
Kolmogorow-Anpassungstest genannt) und der Shapiro-Wilk-Test.
I
Weitere Tests, die zum Teil für ganz bestimmte Typen von
Verteilungsfunktionen entwickelt wurden, kann man in der Literatur
finden.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
9
Der χ2 −Anpassungstest
I
Test, ob die vorliegende Stichprobe aus einer Grundgesamtheit mit
einer hypothetischen Verteilungsfunktion F0 entstammt .
I
Prinzipielles Vorgehen:
I
I
I
Klasseneinteilung der Stichprobe;
Vergleich mit der hypothetischen Verteilung;
falls die Abweichungen zu groß sind erfolgt eine Ablehnung der
Nullhypothese.
I
Dieser Test ist ein asymptotischer Test, d.h. man rechnet mit der
asymptotischen Verteilung (für n → ∞) der Testgröße unter H0 .
I
Hypothesen:
H0 : F (x) = F0 (x) , x ∈ R , F0 ist eine Verteilungsfunktion,
x −µ
falls X ∼ N(µ, σ 2 ) ;
z.B. F0 (x) = Φ
σ
HA : F (x) 6= F0 (x) für mindestens ein x ∈ R .
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
10
χ2 −Anpassungstest – Testgröße T
I
Einteilung der gesamten Merkmalsachse in k Klassen
A1 = (−∞, a1 ), A2 = [a1 , a2 ), . . . , Ak = [ak−1 , ∞) .
I
Bestimmung der absoluten Klassenhäufigkeiten H1 , H2 , . . . , Hk
(Anzahl der Stichprobenwerte in der jeweiligen Klasse).
I
Bestimmung der theoretischen Wahrscheinlichkeiten für die
Klassenzugehörigkeiten unter der Annahme der Gültigkeit von H0 ,
p1 = PH0 (A1 ) = PH0 (X < a1 ) = F0 (a1 ) ,
p2 = PH0 (A2 ) = PH0 (a1 ≤ X < a2 ) = F0 (a2 ) − F0 (a1 ) ,
...
pk = PH0 (Ak ) = PH0 (ak−1 ≤ X ) = 1 − F0 (ak−1 )
I
k
X
(Hj − npj )2
Testgröße: T =
npj
j=1
( χ2 −Abstandsfunktion“),
”
diese Größe ist unter H0 asymptotisch χ2k−1 −verteilt.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
11
χ2 −Anpassungstest – Kritischer Bereich
I
Kritischer Bereich:
I
Bemerkungen:
I
I
I
I
K = {t ∈ R : t > χ2k−1;1−α } .
Der Stichprobenumfang n sollte nicht zu klein sein.
Die Anzahl und die Größe der Klassen Aj sollte so sein, dass
npj = nPH0 (X ∈ Aj ) > 1 für alle j = 1, . . . , k gilt (und zusätzlich
npj ≥ 5 für mindestens 80% der Klassen; ggf. Klassen
zusammenfassen oder gesamte Klasseneinteilung ändern).
Bei diskreten Verteilungen und nicht zu kleinen
Einzelwahrscheinlichkeiten sollte pro Merkmalswert jeweils eine Klasse
gewählt werden.
Modifikation:
Unbekannte Parameter in der Verteilungsfunktion F0 können durch
(Maximum-Likelihood-)Schätzungen ersetzt werden.
Sind m Parameter zu schätzen, so ist anstelle der
χ2k−1 −Verteilung die χ2k−m−1 −Verteilung zu benutzen.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
12
Beispiel: Test auf gerechten Würfel
I
I
I
Anhand einer Stichprobe von n = 90 Würfelergebnissen soll mit
α = 0.05 getestet werden, ob der Würfel gerecht ist, d.h. ob für die
1
Augenzahl X gilt: H0 : pi = P(X = i) = , i = 1, . . . , 6 .
6
Daten:
Augenzahl 1
2
3
4
5
6
Hj
19 13 14 12 17 15
npj
15 15 15 15 15 15
Wert der Testgröße:
t=
16
4
1
9
4
0
34
+
+
+
+
+
=
= 2.26 .
15 15 15 15 15 15
15
K = (χ25;0.95 , ∞) = (11.07 , ∞) .
I
Kritischer Bereich:
I
Testergebnis: t 6∈ K , H0 wird nicht abgelehnt,
die Abweichungen der beobachteten Häufigkeiten von einer diskreten
Gleichverteilung sind nicht signifikant.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
13
Beispiel: technisches Nennmaß
I
I
X . . . Abweichung vom Nennmaß;
X ∼ N(µ, σ 2 ) wird getestet.
x −µ
, x ∈ R;
H0 : F (x) = Φ
σ
x −µ
HA : F (x) 6= Φ
für mindestens ein x ∈ R .
σ
I
α = 0.05 .
I
n = 150 Messungen,
µ̂ = x = 40.48 , σ̂ = s = 5.71
⇒
m = 2 Schätzparameter.
aj − x
Sei k = 8 (Anzahl der Klassen); zj =
, j = 1, . . . , k .
s
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
14
Beispiel: technisches Nennmaß – Daten und Test
I
I
aj
Hj
zj
Φ(zj )
pj
npj
. . . 30.5
30.5 . . . 33.5
33.5 . . . 36.5
36.5 . . . 39.5
39.5 . . . 42.5
42.5 . . . 45.5
45.5 . . . 48.5
48.5 . . .
5
13
23
22
29
29
16
13
150
-1.75
-1.22
-0.70
-0.17
0.35
0.88
1.40
0.04006
0.11123
0.24196
0.43250
0.63683
0.81085
0.91924
0.04006
0.07117
0.13073
0.19054
0.20433
0.17402
0.10839
0.08076
1.0000
6.009
10.676
19.610
28.581
30.650
26.103
16.259
12.114
k
X
(Hj − npj )2
= 3.25 , K = (χ28−2−1;0.95 = 11.1, ∞) ,
t=
npj
j=1
t 6∈ K , H0 wird nicht abgelehnt, zum Niveau von 5% sind die
Abweichungen zur Normalverteilung nicht signifikant.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
15
Der Kolmogorow-Smirnow-Test
I
Der Kolmogorow-Smirnow-Test (Kolmogorow-Anpassungstest)
basiert auf der empirischen Verteilungsfunktion F̂n zur Stichprobe
(vom Umfang n):
F̂n (x) :=
Anzahl Stichprobenwerte < x
,
n
x ∈ R.
I
Voraussetzung: Die hypothetische Verteilungsfunktion F0 ist
stetig und enthält keine unbekannten Parameter.
I
Hypothesen:
H0 : F (x) = F0 (x) , x ∈ R ;
HA : F (x) 6= F0 (x) für mindestens ein x ∈ R .
I
Testgröße:
T = sup |F̂n (x) − F0 (x)| .
x∈R
I
Der Test wird günstigerweise mit einem Computerprogramm
durchgeführt.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
16
Bemerkungen zum Kolmogorow-Smirnow-Test
I
Der Kolmogorow-Smirnow-Test (kurz auch K-S-Test“) ist im
”
Gegensatz zum χ2 −Anpassungstest auch für kleine Stichproben
anwendbar und das Testergebnis hängt nicht von einer
Klasseneinteilung ab.
I
Man kann einseitige Tests mit dem K-S-Test durchführen.
I
Es gibt Verallgemeinerungen des K-S-Tests, bei denen statt
festgelegter Parameterwerte der hypothetischen Verteilung F0
geeignete Schätzwerte eingesetzt werden
(z.B. der Lilliefors-Test im Fall von Normalverteilungen).
I
Man kann mit einer Version des K-S-Testes auch prüfen, ob zwei
Stichproben aus einer Grundgesamtheit stammen, also
übereinstimmende Verteilungen zugrundeliegen.
I
Der K-S-Test kann auch für diskrete Verteilungen genutzt werden,
besitz dann aber eine geringere Güte.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
17
Der Shapiro-Wilk-Test zur Normalverteilungsprüfung
I
Der Shapiro-Wilk-Test prüft ausschließlich, ob bei einer Stichprobe
eine Normalverteilung vorliegt.
I
Dieser Test besitzt eine hohe Güte, insbesondere auch im Fall von
kleinen Stichprobenumfängen.
I
Grundlage des Tests sind bestimmte Eigenschaften der
Ordnungsstatistiken einer Stichprobe aus einer normalverteilten
Grundgesamtheit.
I
Der Test ist sehr rechenintensiv und sollte mit Statistik-Software
durchgeführt werden.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
18
Der χ2 −Unabhängigkeitstest
I
Mit dem χ2 −Unabhängigkeitstest überprüft man, ob zwei Merkmale
X und Y stochastisch unabhängig sind, d.h. ob für beliebige
(zulässige) Mengen A , B gilt:
P(X ∈ A , Y ∈ B) = P(X ∈ A) · P(Y ∈ B) .
I
Konkreter prüft man, ob die relativen Häufigkeiten (berechnet aus
einer verbundenen Stichprobe) näherungsweise diese Produktregel
erfüllen.
I
Hypothesen:
I
Verbundene Stichproben:
I
Einteilung der Merkmalsachsen in Klassen:
für X : A1 , . . . , Ak ; für Y : B1 , . . . , B` .
Prof. Dr. Hans-Jörg Starkloff
H0 : X und Y sind stochastisch unabhängig,
HA : X und Y sind abhängig.
x1 ,
y1 ,
x2 ,
y2 ,
...,
...,
Statistik II für Betriebswirte Vorlesung 3
xn ;
yn .
Version: 1. November 2016
19
Kontingenztafel (vgl. Statistik I Vorl. 10)
I
Absolute Häufigkeiten:
Hij : Anzahl der Beobachtungen bei denen das Merkmal X in der
Klasse Ai und gleichzeitig das dazugehörige Merkmal Y in Bj
liegt.
I
Randhäufigkeiten: Hi• =
`
X
Hij ,
H•j =
j=1
I
I
Kontingenztafel:
X \Y
A1
..
.
B1
H11
Ak
Hk1
H•1
k
X
Hij .
i=1
...
B`
H1`
H1•
Hk`
H•`
Hk•
n
Im Fall k = ` = 2 wird eine solche Tafel auch Vierfeldertafel oder
2 × 2−Felder-Tafel genannt. Sie wird häufig bei nominellen
Merkmalen mit zwei Ausprägungen (dichotome Merkmale) benutzt.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
20
χ2 −Unabhängigkeitstest – Testgröße, kritischer Bereich
I
Testgröße: ( empirische Kontingenz“)
”
Hi• H•j 2
k
`
H
−
XX
ij
n
T =
.
H H
i•
i=1 j=1
•j
n
I
Für eine Vierfeldertafel kann die Testgröße einfacher berechnet
werden durch
n (H11 H22 − H12 H21 )2
.
T =
H1• H2• H•1 H•2
I
Kritischer Bereich: K = {t ∈ R : t > χ2(k−1)(`−1);1−α } .
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
21
χ2 −Unabhängigkeitstest – Bemerkungen
I
Von den Klassenhäufigkeiten sollten höchstens 20% kleiner als 5
sein, aber alle mindestens gleich 1.
I
Der χ2 −Unabhängigkeitstest mit Hilfe einer Vierfeldertafel sollte
für Stichprobenumfänge n < 20 nicht verwendet werden (sondern
der exakte Test von Fisher“).
”
Für 20 ≤ n ≤ 60 eignet sich die nach Yates korrigierte Teststatistik
I
n |H11 H22 − H12 H21 | −
T =
H1• H2• H•1 H•2
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
n 2
2
.
Version: 1. November 2016
22
Beispiel: Eignung vom Studienabschluß
I
30 Wirtschaftsingenieure (b1 ), 35 graduierte Betriebswirte (b2 ) und
35 Diplomkaufleute (b3 ), die sich bei einem Unternehmen beworben
haben, werden nach einer Eignungsprüfung in die Kategorien
geeignet“ (a1 ) und ungeeignet“ (a2 ) eingeordnet. Ist diese
”
”
Eignung vom Studienabschluß abhängig oder nicht.
I
Merkmal A (Eignung), Merkmal B (Studienabschluss); α = 0.05 .
I
Hypothesen:
H0 : Merkmal A und Merkmal B sind unabhängig,
HA : Merkmal A und Merkmal B sind abhängig.
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
23
Beispiel: Eignung vom Studienabschluß
I
Kontingenztafel: (Quelle: Bleymüller, Gehlert, Gülicher: Statistik
für Wirtschaftswissenschaftler, 2004, Abschn. 19.2.)
A\B b1 b2 b3
a1
14 10 16 40
a2
16 25 19 60
30 35 35 100
I
Berechnung Testgröße:
Hi• H•j
:
n
12
18
14
21
14
21
(14 − 12)2 (10 − 14)2 (16 − 14)2 (16 − 18)2
+
+
+
+
12
14
14
18
(25 − 21)2 (19 − 21)2
+
= 2.937 < χ22;0.95 = 5.99 .
21
21
Die Hypothese H0 : A und B sind unabhängig“ wird nicht
”
abgelehnt, man kann nicht davon ausgehen, dass die Eignung
signifikant vom Studienabschluss abhängt.
t=
I
Prof. Dr. Hans-Jörg Starkloff
Statistik II für Betriebswirte Vorlesung 3
Version: 1. November 2016
24
Herunterladen