Statistik II für Betriebswirte Vorlesung 3 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 2. November 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 1 Wilcoxon-Rangsummentest I Der Wilcoxon-Rangsummentest dient zum Vergleich zweier unabhängiger Stichproben hinsichtlich ihrer Lage. I Er kann im Fall von nicht-normalverteilten Grundgesamtheiten an Stelle des doppelten t−Tests verwendet werden. I Er wird auch als Rangtest nach Wilcoxon bezeichnet und ist äquivalent zum U-Test von Mann-Whitney. I Geg.: 2 unabhängige Stichproben X1 , . . . , Xn1 mit stetiger Verteilungsfunktion FX und Y1 , . . . , Yn2 mit stetiger Verteilungsfunktion FY , wobei FY (t) = FX (t + a) mit einer reellen Zahl a vorausgesetzt wird (falls Erwartungswerte existieren gilt µX = EX = EY + a = µY + a). I Er kann als zweiseitiger oder als einseitiger Test ausgeführt werden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 2 Wilcoxon-Rangsummentest – kleine Stichprobenumfänge I Hypothesen: H0 : a = 0 , HA : a 6= 0 (zweiseitiger Test) (bzw. H0 : µX = µY , HA : µX 6= µY ). I In der gemeinsamen Stichprobe werden die Ränge bestimmt. Die Testgröße T = R1 ist die Summe der Ränge zu der ersten Stichprobe. I Kritischer Bereich (n1 , n2 klein): K = {t > 0 : t ≤ wn1 ,n2 ;α/2 } ∪ {t > 0 : t ≥ wn1 ,n2 ;1−α/2 } ; die Quantile wn1 ,n2 ;α/2 und wn1 ,n2 ;1−α/2 kann man in Tabellen finden, dabei gilt wn1 ,n2 ;1−α = n1 (n1 + n2 + 1) − wn1 ,n2 ;α . I Grundüberlegung: Beide Stichproben sollten sich unter H0 ungefähr gleichartig in der gemeinsamen geordneten Stichprobe durchmischen. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 3 Wilcoxon-Rangsummentest – große Stichprobenumfänge I Hypothesen: H0 : a = 0 , HA : a 6= 0 (zweiseitiger Test) (bzw. H0 : µX = µY , HA : µX 6= µY ). I Testgröße: Mit der Summe R1 der Ränge zur ersten Stichprobe in der gemeinsamen Stichprobe nutzt man R1 − 1 n1 (n1 + n2 + 1) T =q 2 . 1 n n (n + n + 1) 2 12 1 2 1 I Kritischer Bereich (n1 , n2 groß): (Faustregel: n1 ≥ 4 , n2 ≥ 4 , n1 + n2 ≥ 20) K = {t ∈ R : |t| > z1−α/2 } (da T näherungsweise standardnormalverteilt ist). Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 4 Beispiel: Flugschrauber I Mit zwei Typen von Flugschraubern wurden jeweils 6 Flüge zwischen zwei Flughäfen durchgeführt und die totale Flugzeit in Minuten gemessen. Wird diese Strecke im Mittel gleich schnell bewältigt ? I Daten: (Quelle: Aczel, Sounderpandian: Complete Business Statistics, 2006, Bsp.14-4) Modell A Modell B I 35 29 38 27 40 30 42 33 41 39 36 37 Ordnen und Rangvergabe (Ränge zur ersten Stichprobe in rot): A 35 36 38 40 41 42 B 27 29 30 33 37 39 Rang 1 2 3 4 5 6 7 8 9 10 11 12 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 5 Fortsetzung Beispiel: Flugschrauber HA : µA 6= µB , I Hypothesen: H0 : µA = µB , I Wert der Testgröße des Wilcoxon-Rangsummentests: t = r1 = 5 + 6 + 8 + 10 + 11 + 12 = 52 . I Kritischer Bereich: aus Tabelle w6,6;0.025 = 26 , ⇒ I α = 0.05 . w6,6;0.975 = 6 · 13 − 26 = 52 , K = {t > 0 : t ≤ 26} ∪ {t > 0 : t ≥ 52} . Testergebnis: t ∈ K , H0 wird abgelehnt, die Flugzeiten sind signifikant unterschiedlich. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 6 Bindungen I I Bei Vorzeichen- oder auf Rängen basierten Tests kann es trotz der Stetigkeitsannahme der entsprechenden Verteilungen vorkommen, dass in der Stichprobe gleiche Werte vorkommen. Man spricht dann von auftretenden Bindungen (engl. ties“). ” Der Testaufbau sieht Bindungen eigentlich nicht vor (die Wahrscheinlichkeit dafür ist Null), deshalb muss man die Tests geeignet modifizieren. I Beim Auftreten von Bindungen mittelt man die Rangzahlen. I Besonders kritisch sind Bindungen bei Vorzeichentests, wenn im Einstichprobenproblem einige Werte gleich dem Median sind bzw. im Zweistichprobenproblem einige Differenzen gleich Null sind. I Bei bestimmten Tests, wie z.B. dem Wilcoxon-Rangsummentest oder dem Kruskal-Wallis-Test (er wird später behandelt) muss die Testgröße beim Vorliegen von Bindungen in der Stichprobe entsprechend angepasst werden (siehe Literatur). Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 7 Bindungen bei Vorzeichentests Einige mögliche Vorgehensweisen: I Oft kann man Bindungen vermeiden, indem man die Messgenauigkeit erhöht. I Beobachtungen mit Bindung werden nicht berücksichtigt (⇒ geringerer Stichprobenumfang). I Beobachtungen mit Bindung werden zu gleichen Teilen beiden Gruppen (+ bzw. −, etc.) zugeordnet, bei ungerader Anzahl der Bindungen wird eine Beobachtung nicht berücksichtigt. I Die Beobachtungen mit Bindung werden zufällig mit einer Wahrscheinlichkeit von 0.5 einer der beiden Gruppen zugeordnet. I Nulldifferenzen erhalten das seltenere Vorzeichen. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 8 Verteilungstests I Eine weitere Klasse von Tests beschäftigt sich mit der Prüfung, ob die Werte der Stichprobe aus einer Grundgesamtheit mit einer speziellen hypothetischen Verteilungsfunktion stammen. I Ausführlicher wird hier der χ2 −Anpassungstest behandelt. I Kurz vorgestellt werden auch der Kolmogorow-Smirnow-Test (auch Kolmogorow-Anpassungstest genannt) und der Shapiro-Wilk-Test. I Weitere Tests, die zum Teil für ganz bestimmte Typen von Verteilungsfunktionen entwickelt wurden, kann man in der Literatur finden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 9 Der χ2 −Anpassungstest I Test, ob die vorliegende Stichprobe aus einer Grundgesamtheit mit einer hypothetischen Verteilungsfunktion F0 entstammt . I Prinzipielles Vorgehen: I I I Klasseneinteilung der Stichprobe; Vergleich mit der hypothetischen Verteilung; falls die Abweichungen zu groß sind erfolgt eine Ablehnung der Nullhypothese. I Dieser Test ist ein asymptotischer Test, d.h. man rechnet mit der asymptotischen Verteilung (für n → ∞) der Testgröße unter H0 . I Hypothesen: H0 : F (x) = F0 (x) , x ∈ R , F0 ist eine Verteilungsfunktion, x −µ falls X ∼ N(µ, σ 2 ) ; z.B. F0 (x) = Φ σ HA : F (x) 6= F0 (x) für mindestens ein x ∈ R . Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 10 χ2 −Anpassungstest – Testgröße T I Einteilung der gesamten Merkmalsachse in k Klassen A1 = (−∞, a1 ), A2 = [a1 , a2 ), . . . , Ak = [ak−1 , ∞) . I Bestimmung der absoluten Klassenhäufigkeiten H1 , H2 , . . . , Hk (Anzahl der Stichprobenwerte in der jeweiligen Klasse). I Bestimmung der theoretischen Wahrscheinlichkeiten für die Klassenzugehörigkeiten unter der Annahme der Gültigkeit von H0 , p1 = PH0 (A1 ) = PH0 (X < a1 ) = F0 (a1 ) , p2 = PH0 (A2 ) = PH0 (a1 ≤ X < a2 ) = F0 (a2 ) − F0 (a1 ) , ... pk = PH0 (Ak ) = PH0 (ak−1 ≤ X ) = 1 − F0 (ak−1 ) I k X (Hj − npj )2 Testgröße: T = npj j=1 ( χ2 −Abstandsfunktion“), ” diese Größe ist unter H0 asymptotisch χ2k−1 −verteilt. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 11 χ2 −Anpassungstest – Kritischer Bereich I Kritischer Bereich: I Bemerkungen: I I I I K = {t ∈ R : t > χ2k−1;1−α } . Der Stichprobenumfang n sollte nicht zu klein sein. Die Anzahl und die Größe der Klassen Aj sollte so sein, dass npj = nPH0 (X ∈ Aj ) > 1 für alle j = 1, . . . , k gilt (und zusätzlich npj ≥ 5 für mindestens 80% der Klassen; ggf. Klassen zusammenfassen oder gesamte Klasseneinteilung ändern). Bei diskreten Verteilungen und nicht zu kleinen Einzelwahrscheinlichkeiten sollte pro Merkmalswert jeweils eine Klasse gewählt werden. Modifikation: Unbekannte Parameter in der Verteilungsfunktion F0 können durch (Maximum-Likelihood-)Schätzungen ersetzt werden. Sind m Parameter zu schätzen, so ist anstelle der χ2k−1 −Verteilung die χ2k−m−1 −Verteilung zu benutzen. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 12 Beispiel: Test auf gerechten Würfel I I I Anhand einer Stichprobe von n = 90 Würfelergebnissen soll mit α = 0.05 getestet werden, ob der Würfel gerecht ist, d.h. ob für die 1 Augenzahl X gilt: H0 : pi = P(X = i) = , i = 1, . . . , 6 . 6 Daten: Augenzahl 1 2 3 4 5 6 Hj 19 13 14 12 17 15 npj 15 15 15 15 15 15 Wert der Testgröße: t= 16 4 1 9 4 0 34 + + + + + = = 2.26 . 15 15 15 15 15 15 15 K = (χ25;0.95 , ∞) = (11.07 , ∞) . I Kritischer Bereich: I Testergebnis: t 6∈ K , H0 wird nicht abgelehnt, die Abweichungen der beobachteten Häufigkeiten von einer diskreten Gleichverteilung sind nicht signifikant. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 13 Beispiel: technisches Nennmaß I I X . . . Abweichung vom Nennmaß; X ∼ N(µ, σ 2 ) wird getestet. x −µ , x ∈ R; H0 : F (x) = Φ σ x −µ HA : F (x) 6= Φ für mindestens ein x ∈ R . σ I α = 0.05 . I n = 150 Messungen, µ̂ = x = 40.48 , σ̂ = s = 5.71 ⇒ m = 2 Schätzparameter. aj − x Sei k = 8 (Anzahl der Klassen); zj = , j = 1, . . . , k . s Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 14 Beispiel: technisches Nennmaß – Daten und Test I I aj Hj zj Φ(zj ) pj npj . . . 30.5 30.5 . . . 33.5 33.5 . . . 36.5 36.5 . . . 39.5 39.5 . . . 42.5 42.5 . . . 45.5 45.5 . . . 48.5 48.5 . . . 5 13 23 22 29 29 16 13 150 -1.75 -1.22 -0.70 -0.17 0.35 0.88 1.40 0.04006 0.11123 0.24196 0.43250 0.63683 0.81085 0.91924 0.04006 0.07117 0.13073 0.19054 0.20433 0.17402 0.10839 0.08076 1.0000 6.009 10.676 19.610 28.581 30.650 26.103 16.259 12.114 k X (Hj − npj )2 = 3.25 , K = (χ28−2−1;0.95 = 11.1, ∞) , t= npj j=1 t 6∈ K , H0 wird nicht abgelehnt, zum Niveau von 5% sind die Abweichungen zur Normalverteilung nicht signifikant. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 15 Der Kolmogorow-Smirnow-Test I Der Kolmogorow-Smirnow-Test (Kolmogorow-Anpassungstest) basiert auf der empirischen Verteilungsfunktion F̂n zur Stichprobe (vom Umfang n): F̂n (x) := Anzahl Stichprobenwerte < x , n x ∈ R. I Voraussetzung: Die hypothetische Verteilungsfunktion F0 ist stetig und enthält keine unbekannten Parameter. I Hypothesen: H0 : F (x) = F0 (x) , x ∈ R ; HA : F (x) 6= F0 (x) für mindestens ein x ∈ R . I Testgröße: T = sup |F̂n (x) − F0 (x)| . x∈R I Der Test wird günstigerweise mit einem Computerprogramm durchgeführt. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 16 Bemerkungen zum Kolmogorow-Smirnow-Test I Der Kolmogorow-Smirnow-Test (kurz auch K-S-Test“) ist im ” Gegensatz zum χ2 −Anpassungstest auch für kleine Stichproben anwendbar und das Testergebnis hängt nicht von einer Klasseneinteilung ab. I Man kann einseitige Tests mit dem K-S-Test durchführen. I Es gibt Verallgemeinerungen des K-S-Tests, bei denen statt festgelegter Parameterwerte der hypothetischen Verteilung F0 geeignete Schätzwerte eingesetzt werden (z.B. der Lilliefors-Test im Fall von Normalverteilungen). I Man kann mit einer Version des K-S-Testes auch prüfen, ob zwei Stichproben aus einer Grundgesamtheit stammen, also übereinstimmende Verteilungen zugrundeliegen. I Der K-S-Test kann auch für diskrete Verteilungen genutzt werden, besitz dann aber eine geringere Güte. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 17 Der Shapiro-Wilk-Test zur Normalverteilungsprüfung I Der Shapiro-Wilk-Test prüft ausschließlich, ob bei einer Stichprobe eine Normalverteilung vorliegt. I Dieser Test besitzt eine hohe Güte, insbesondere auch im Fall von kleinen Stichprobenumfängen. I Grundlage des Tests sind bestimmte Eigenschaften der Ordnungsstatistiken einer Stichprobe aus einer normalverteilten Grundgesamtheit. I Der Test ist sehr rechenintensiv und sollte mit Statistik-Software durchgeführt werden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 18 Der χ2 −Unabhängigkeitstest I Mit dem χ2 −Unabhängigkeitstest überprüft man, ob zwei Merkmale X und Y stochastisch unabhängig sind, d.h. ob für beliebige (zulässige) Mengen A , B gilt: P(X ∈ A , Y ∈ B) = P(X ∈ A) · P(Y ∈ B) . I Konkreter prüft man, ob die relativen Häufigkeiten (berechnet aus einer verbundenen Stichprobe) näherungsweise diese Produktregel erfüllen. I Hypothesen: I Verbundene Stichproben: I Einteilung der Merkmalsachsen in Klassen: für X : A1 , . . . , Ak ; für Y : B1 , . . . , B` . Prof. Dr. Hans-Jörg Starkloff H0 : X und Y sind stochastisch unabhängig, HA : X und Y sind abhängig. x1 , y1 , x2 , y2 , ..., ..., Statistik II für Betriebswirte Vorlesung 3 xn ; yn . Version: 1. November 2016 19 Kontingenztafel (vgl. Statistik I Vorl. 10) I Absolute Häufigkeiten: Hij : Anzahl der Beobachtungen bei denen das Merkmal X in der Klasse Ai und gleichzeitig das dazugehörige Merkmal Y in Bj liegt. I Randhäufigkeiten: Hi• = ` X Hij , H•j = j=1 I I Kontingenztafel: X \Y A1 .. . B1 H11 Ak Hk1 H•1 k X Hij . i=1 ... B` H1` H1• Hk` H•` Hk• n Im Fall k = ` = 2 wird eine solche Tafel auch Vierfeldertafel oder 2 × 2−Felder-Tafel genannt. Sie wird häufig bei nominellen Merkmalen mit zwei Ausprägungen (dichotome Merkmale) benutzt. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 20 χ2 −Unabhängigkeitstest – Testgröße, kritischer Bereich I Testgröße: ( empirische Kontingenz“) ” Hi• H•j 2 k ` H − XX ij n T = . H H i• i=1 j=1 •j n I Für eine Vierfeldertafel kann die Testgröße einfacher berechnet werden durch n (H11 H22 − H12 H21 )2 . T = H1• H2• H•1 H•2 I Kritischer Bereich: K = {t ∈ R : t > χ2(k−1)(`−1);1−α } . Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 21 χ2 −Unabhängigkeitstest – Bemerkungen I Von den Klassenhäufigkeiten sollten höchstens 20% kleiner als 5 sein, aber alle mindestens gleich 1. I Der χ2 −Unabhängigkeitstest mit Hilfe einer Vierfeldertafel sollte für Stichprobenumfänge n < 20 nicht verwendet werden (sondern der exakte Test von Fisher“). ” Für 20 ≤ n ≤ 60 eignet sich die nach Yates korrigierte Teststatistik I n |H11 H22 − H12 H21 | − T = H1• H2• H•1 H•2 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 n 2 2 . Version: 1. November 2016 22 Beispiel: Eignung vom Studienabschluß I 30 Wirtschaftsingenieure (b1 ), 35 graduierte Betriebswirte (b2 ) und 35 Diplomkaufleute (b3 ), die sich bei einem Unternehmen beworben haben, werden nach einer Eignungsprüfung in die Kategorien geeignet“ (a1 ) und ungeeignet“ (a2 ) eingeordnet. Ist diese ” ” Eignung vom Studienabschluß abhängig oder nicht. I Merkmal A (Eignung), Merkmal B (Studienabschluss); α = 0.05 . I Hypothesen: H0 : Merkmal A und Merkmal B sind unabhängig, HA : Merkmal A und Merkmal B sind abhängig. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 23 Beispiel: Eignung vom Studienabschluß I Kontingenztafel: (Quelle: Bleymüller, Gehlert, Gülicher: Statistik für Wirtschaftswissenschaftler, 2004, Abschn. 19.2.) A\B b1 b2 b3 a1 14 10 16 40 a2 16 25 19 60 30 35 35 100 I Berechnung Testgröße: Hi• H•j : n 12 18 14 21 14 21 (14 − 12)2 (10 − 14)2 (16 − 14)2 (16 − 18)2 + + + + 12 14 14 18 (25 − 21)2 (19 − 21)2 + = 2.937 < χ22;0.95 = 5.99 . 21 21 Die Hypothese H0 : A und B sind unabhängig“ wird nicht ” abgelehnt, man kann nicht davon ausgehen, dass die Eignung signifikant vom Studienabschluss abhängt. t= I Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 3 Version: 1. November 2016 24