Statistik II für Betriebswirte Privat-Doz. Dr. H. Haase Inst. f. Math. u. Inf. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 12.05.2017 Vorlesung 5 12.05.2017 1 / 56 Übersicht 1 Zusammenfassung Vorlesung 4 2 Binomialverteilte Grundgesamtheiten 3 Odds Ratio 4 Chiquadrat-Tests 5 Wiederholung zu Statistik I Markow-Ketten Einfache Warteschlangen Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 2 / 56 Zweiseitiger t-Test −4 −2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 2 4 x Vorlesung 5 12.05.2017 3 / 56 Einseitiger t-Test −4 −2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 2 4 x Vorlesung 5 12.05.2017 4 / 56 Fehler beim Alternativtest −4 −2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 2 4 6 x Vorlesung 5 12.05.2017 5 / 56 Binomialverteilte Grundgesamtheiten I Wir behandeln folgende Probleme: 1 2 Prüfen der Wahrscheinlichkeit für das Eintreten eines Ereignisses Prüfen der Gleichheit zweier Wahrscheinlichkeiten Das Eintreten eines Ereignisses - Indikatorfunktion X beschrieben. Die Grundgesamtheit X ist dichotom. Es gilt dann P (X = 1) = p . Wir testen: 1 2 im zweiseitigen Fall H0 : p = p0 gegen H1 : p 6= p0 . In den einseitigen Fällen haben wir H0 : p ≤ p0 gegen H1 : p > p0 bzw. H0 : p ≥ p0 gegen H1 : p < p0 . Ist (X , . . . , Xn ) eine mathematische Stichprobe von X , so ist 1 X −p √ n T=p n p (1 − p ) unter der Nullhypothese näherungsweise standardnormalverteilt. Minimalforderung np (1 − p ) ≥ 9 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 6 / 56 Binomialverteilte Grundgesamtheiten II exakter Test mit Testgröÿe T = X + . . . + Xn T mit n und p binomialverteilt ist. Ablehnungsbereich zum Signikanzniveau α : a) zweiseitig: Wähle 0 ≤ k < k ≤ n mit 1 1 2 k1 n ∑ j= 0 α k1 + p j (1 − p )n−j ≤ < ∑ j 2 j= 1 0 sowie n n ∑ j =k j n j p (1 − p )n−j j α p j (1 − p )n−j ≤ < 2 2 n n j p (1 − p )n−j j ∑ j =k2 − 1 also K = {0, 1, . . . , k } ∪ {k , k + 1, . . . , n} als Ablehnungsbereich denn die Wahrscheinlichkeiten der Werte 0, 1, . . . , k und k , k + 1, . . . , n von T sollen insgesamt α nicht übersteigen. 1 2 2 1 2 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 7 / 56 Binomialverteilte Grundgesamtheiten III Ablehnungsbereich zum Signikanzniveau α : b) einseitig (nach unten): Wähle 0 ≤ k ≤ n mit k n p j (1 − p )n−j ≤ α < ∑ j= j k + n ∑ j pj (1 − p)n−j j= 1 0 0 also K = {0, 1, . . . , k } c) einseitig (nach oben): Wähle 0 ≤ k ≤ n mit n n ∑ j =k j p j (1 − p )n−j ≤ α < n n ∑ j =k − 1 j p j (1 − p )n−j also K = {k , k + 1, . . . , n} Beispiel: 10% aller Eier sind Knickeier. Testen Sie, ob in einem Hühnerbestand diese Norm eingehalten wird, wenn a) 4 von 10 Eiern Knickeier bzw. b) 20 von 100 Eiern Knickeier waren Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 8 / 56 Binomialverteilte Grundgesamtheiten IV exakte Lösung für n = 10. Nullhypothese: p ≤ 0.1 gegen p > 0.1 Berechnung der Testgröÿe T , die mit n = 10 und p = 0.1 binomialverteilt ist, zu t = 4 Bestimmung eines kritischen Bereiches bzw. eines kritischen Wertes mit 10 10 j −j ∑ j 0.1 · 0.9 ≤ 0.05 < ∑ j 0.1j · 0.9 −j j =k j =k − 10 10 10 10 1 bzw. k − 10 1 ∑ j 0.1j · 0.9 j= 10 −j ≥ 0.95 0 Dazu berechnen wir die Einzelwahrscheinlichkeiten, soweit erforderlich: j pj 0 1 2 3 0.34868 0.38742 0.19371 5. 7396 × 10− Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 5 ... ... 12.05.2017 9 / 56 Binomialverteilte Grundgesamtheiten V kumulieren der pj : 10 ∑ j 0.1j · 0.9 j= −j = 0.92981 10 ∑ j 0.1j · 0.9 j= −j = 0.9872 2 10 0 3 10 0 kritischer Bereich K = {3, 4, . . . , 10} Wegen t ∈ K wird die Nullhypothese verworfen. jetzt n = 100 Nullhypothese: p ≤ 0.1 gegen p > 0.1 Testgröÿe X −p √ n T=p n p (1 − p ) unter der Nullhypothese näherungsweise standardnormalverteilt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 10 / 56 Binomialverteilte Grundgesamtheiten VI Berechnung der Testgröÿe 20 = 0.2 100 0.2 − 0.1 √ 100 = 3. 3333 t=p 0.1 · (1 − 0.1) xn = Bestimmung des kritischen Wertes k . = 1.96 (aus einer Tabelle, kennen wir inzwischen auswendig!!!) Wegen k . < t wird die Nullhypothese verworfen. Vorgehensweise in R? 0 975 0 975 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 11 / 56 Binomialverteilte Grundgesamtheiten VII exakter Binomialtest: binom.test(x, n, p = 0.5, alternative = c("two.sided", "less", "greater"), conf.level = 0.95) Bedeutung der Parameter (aus der Hilfe): x number of successes, or a vector of length 2 giving the numbers of successes and failures, respectively. n number of trials; ignored if x has length 2. p hypothesized probability of success. alternative indicates the alternative hypothesis and must be one of "two.sided", "greater" or "less". You can specify just the initial letter. conf.level condence level for the returned condence interval. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 12 / 56 Binomialverteilte Grundgesamtheiten VIII zur Erinnerung: Knickeierbeispiel: n = 10, p = 0.1 mit p -Wert 10 p = P (T ≥ 4 ) = ∑ j= 4 10 0.1j · 0.9 j −j 10 = 1. 2795 × 10−2 R-Skript: binom.test(4, 10, 0.1, alternative = "greater") ## ## ## ## ## ## ## ## ## ## ## Exact binomial test data: 4 and 10 number of successes = 4, number of trials = 10, p-value = 0.0128 alternative hypothesis: true probability of success is greater than 0.1 95 percent confidence interval: 0.15 1.00 sample estimates: probability of success 0.4 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 13 / 56 Binomialverteilte Grundgesamtheiten IX Prüfen der Gleichheit zweier Wahrscheinlichkeiten von zwei unabhängigen Ereignissen 1 2 bei hinreichend groÿen Stichprobenumfang mit einer Testgröÿe, die näherungsweise normal verteilt kleine Stichproben mit dem exakten Fisher-Test Konstruktion der Teststatistik für groÿe Stichprobenumfänge: zu testende Wahrscheinlichkeiten pi für i = 1, 2 durch die dichotome Grundgesamten X und Y erfaÿt. Stichprobenumfänge ni für i = 1, 2 zugehörige absoluten Häugkeiten Ti mit ni und pi binomialverteilt zugehörigen relativen Häugkeiten Tnii sind dann näherungsweise mit den Parametern pi (für den Erwartungswert) und pi (1 − pi ) ni (für die Varianz) normalverteilt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 14 / 56 Binomialverteilte Grundgesamtheiten X Konstruktion der Teststatistik für groÿe Stichprobenumfänge: D die Dierenz beider relativen Häugkeiten auch normalverteilt mit 0 und p ((1 − p) n1 + n1 1 2 für die Varianz unter der Nullhypothese H0 : p = p1 = p2 . D muÿ jetzt standardisiert werden Wahrscheinlichkeit wird p durch p2 n 2 pb = p1 nn1 + +n 1 geschätzt. nale Teststatistik 2 D T=r pb (1 − pb) n1 1 + n12 , ist näherungsweise standardisiert normalverteilt Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 15 / 56 Binomialverteilte Grundgesamtheiten XI Beispiel: 2 Umfragen in zwei Städten erbrachten jeweils eine Zustimmung von 30% bzw. 32% bei Beteilungen von 300 bzw. 400 Bürgern. Kann die Zustimmung als gleich eingeschätzt werden? Nullhypothese: p = p = p Berechnung der Testgröÿe: a) Dierenz der relativen Häugkeiten: d = 0.3 − 0.32 = −0.02 b) Schätzwert bp = · . ++ · . = 0.31143 c) Teststatistik 1 2 300 0 3 400 0 32 300 400 −0.02 t=q 0.31143 · (1 − 0.31143) 1 1 + 400 300 = −0.56548 Bestimmung des kritischen Wertes k . (α = 0.05) zu k . = 1.96 Wegen 0.56548 < 1.96 wird die Nullhypothese angenommen. 0 975 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 0 975 12.05.2017 16 / 56 Binomialverteilte Grundgesamtheiten XI mit R? prop.test(x, n, p = NULL, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, correct = TRUE) prop.test(x <- c(90, 128), c(300, 400)) ## ## ## ## ## ## ## ## ## ## ## ## 2-sample test for equality of proportions with continuity correction data: x <- c(90, 128) out of c(300, 400) X-squared = 0.2333, df = 1, p-value = 0.6291 alternative hypothesis: two.sided 95 percent confidence interval: -0.09205 0.05205 sample estimates: prop 1 prop 2 0.30 0.32 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 17 / 56 Binomialverteilte Grundgesamtheiten XII für kleinere Stichproben: exakter Fisher-Test Nullhypothese: p = p = p gegen p 6= p . Betrachtung von 1 2 1 P (T = a|T + T = b) = 1 1 2 2 P ([T = a] ∩ [T + T = b]) P (T + T = b ) 1 1 1 2 2 T und T sind unabhängig: 1 2 P (T = a|T + T = b) = 1 1 2 P (T = a) P (T = b − a) P (T + T = b ) 1 2 1 2 T , T und T + T mit p und n , n sowie n + n binomialverteilte Zufallsgröÿen, wenn die Nullhypothese gilt. 1 2 1 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 Vorlesung 5 2 1 2 12.05.2017 18 / 56 Binomialverteilte Grundgesamtheiten XII Es gilt: P (T = a|T + T = b) n1 p a (1 − p )n1 −a n2 p b−a (1 − p )n2 −b+a b−a = a n1 +n2 p b (1 − p )n1 +n2 −b b 1 1 2 n1 · n2 = a n1 +nb2−a . b bedingte Verteilung von T vorausgesetzt, daÿ T + T gegeben hypergeometrische Verteilung Denition: X ist mit den Parametern n ≤ M < N und n ≤ N − M hypergeometrisch verteilt, wenn für k = 0, 1, . . . , n 1 1 2 M N −M P (X = k ) = k Nn−k n Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 19 / 56 Binomialverteilte Grundgesamtheiten XIII Festlegung des kritischen Bereiches K für α gegeben: Wähle ku ≤ n1 maximal mit P (T1 ≤ ku |T1 + T2 = b) ≤ α2 Wähle ko minimal mit ko ≤ min {b, n1 }: P (T1 ≥ ko |T1 + T2 = b) ≤ α2 K = {0, 1, . . . , ku } ∪ {ko , ko + 1, . . . , min {b, n1 }} Falls nicht lösbar K = ∅. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 20 / 56 Binomialverteilte Grundgesamtheiten XIV Beispiel: Bei 20 lateinamerikanischen Staaten wurde das Niveau der Industrialisierung und das wirtschaftliche Wachstum verglichen. Es wurde festgestellt, daÿ die Menge der vier am schnellsten wachsenden Staaten keinen der vier am höchsten industrialisierten Staaten enthielt wie auch die folgende Tabelle anzeigt: Wachstum Industrialisierung am schnellsten andere . am höchsten 0 4 andere 4 12 X sei die Indikatorfunktion dafür, daÿ ein am höchsten industrialisiertes Land am schnellsten wächst, und Y der Indikator, daÿ ein anders industrialisiertes Land am schnellsten wächst. Die Stichprobendaten zu X ndet man in der ersten Zeile und die von Y in der zweiten Zeile. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 21 / 56 Binomialverteilte Grundgesamtheiten XV T mit n = 4 und p binomialverteilt. T mit n = 16 und p binomialverteilt Nullhypothese p = p = p 0 gehört immer zum kritischen Bereich (falls nicht leer): 1 1 2 2 1 2 P (T = 0|T + T = 4) = 1 1 2 4 0 · 16 4 = 0.37564 20 4 (a = 0, b = 4 sowie n = 4, n = 16) mit anderen Worten Nullhypothese kann nicht verworfen werden!!! 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 5 12.05.2017 22 / 56 Binomialverteilte Grundgesamtheiten XVI mit R? M <- matrix(ncol = 2, nrow = 2, c(0, 4, 4, 12)) fisher.test(M) ## ## ## ## ## ## ## ## ## ## ## Fisher's Exact Test for Count Data data: M p-value = 0.5377 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.000 6.809 sample estimates: odds ratio 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 23 / 56 Der Tee-Test der englischen Lady I Ein (berühmtes) Beispiel: A British woman claimed to be able to distinguish whether milk or tea was added to the cup rst. To test, she was given 8 cups of tea, in four of which milk was added rst. The null hypothesis is that there is no association between the true order of pouring and the woman's guess, the alternative that there is a positive association (that the odds ratio is greater than 1). TeaTasting <- matrix(c(3, 1, 1, 3), nrow = 2, dimnames = list(Guess = c("Mi "Tea"), Truth = c("Milk", "Tea"))) TeaTasting ## Truth ## Guess Milk Tea ## Milk 3 1 ## Tea 1 3 und als Testergebnis Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 24 / 56 Der Tee-Test der englischen Lady II fisher.test(TeaTasting, alternative = "greater") ## ## ## ## ## ## ## ## ## ## ## Fisher's Exact Test for Count Data data: TeaTasting p-value = 0.2429 alternative hypothesis: true odds ratio is greater than 1 95 percent confidence interval: 0.3136 Inf sample estimates: odds ratio 6.408 Obwohl in 6 von 8 Veruschen richtig immer noch rein zufällig!! Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 25 / 56 Odds Ratio I Maÿzahlen zur Darstellung des Wirkungsunterschieds bei kategoriellen Daten Gesundheitsmanagment (Spezialisierung in Greifswald) Vergleich von 2 Behandlungen Kreuztabelle: wirksam nicht wirksam Behandlung 1 a b a+b Behandlung 2 c d c +d a+c b+d a+b+c +d Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 26 / 56 Odds Ratio II Denition: Odds-Ratio Der Odds (engl. für Chance) ist der Quotient der Wahrscheinlichkeit, daÿ das Zielereignis eintritt, zu der Wahrscheinlichkeit, daÿ es nicht eintritt, also Behandlung 1: Zielereignis Behandlung 1 ist wirksam, d.h. a/(a + b) und Behandlung 1 ist nicht wirksam, d.h. b/(a + b), also Analog Odds Behandlung 1 = a b Odds Behandlung 2 = c d Odds-Ratio-Punktschätzer Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) d= OR a/b ad = c /d bc Vorlesung 5 12.05.2017 27 / 56 Odds Ratio III Berechnung von Kondenzintervallen für den Odds-Ratio: X -Indikatorfunktion für Behandlungen, Y - Indikator für Wirksamkeit X , . . . , Xn bzw. Y , . . . , Yn math. Stichproben dazu (n = a + b + c + d ): der Log-Schätzer von OR 1 1 ln(OR ) = ln(OR (X , . . . , Xn ; Y , . . . , Yn )) 1 1 ist asymptotisch normalverteilt. asymptotische Standardfehler für ln(OR ) se = r 1 1 1 1 + + + a b c d (1 − α) −Kondenzintervall h i d − q1−α/2 · se , ln OR d + q1−α/2 · se ln OR mit q −α/2 1 Quantil der Standardnormalverteilung. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 28 / 56 Chiquadrat-Tests I Fragestellungen: Anpassungstest: Stammt eine Stichprobe von Daten aus einer speziellen Verteilung? Mit anderen Worten kann man die Daten an eine solche Verteilung anpassen. Unabhängigkeitstest: Zwei Merkmale werden über eine Kreuztabelle ausgewertet (bei stetigen über eine Klassierung). Getestet soll werden, ob die Unabhängigkeit der beiden Merkmale in Zweifel gezogen werden kann. Homogenitätstest: Gegeben zwei Stichproben. Getestet soll werden, ob die gleiche Verteilung zugrunde liegt. gemeinsame Grundlage ist die χ -Statistik als Testgröÿe Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 5 12.05.2017 29 / 56 Chiquadrat-Tests II Der Anpassungstest Grundgesamtheit X . Nullhypothese F = F gegen F 6= F F - bekannte Verteilungsfunktion F − Verteilungsfunktion von X . mathematische Stichprobe (X , . . . , Xn ) Daten in k Klassen Ki für i = 1, 2, . . . , k aufteilen Ni bezeichne die zufällige absolute Häugkeit, daÿ die X , . . . , Xn in die i -te Klasse fallen Ki = [ai , bi [, pi - Wahrscheinlichkeit, in diese zu fallen: 0 0 0 1 1 pi = F (bi ) − F (ai ) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 Vorlesung 5 0 12.05.2017 30 / 56 Chiquadrat-Tests III Der Anpassungstest Ni mit n und pi binomialverteilt. Teststatistik k (N − npi ) T=∑ i npi i= 2 1 T ist für einen hinreichend groÿen Stichprobenumfang n mit k − 1 − r Freiheitsgraden χ - verteilt. r - Anzahl der Parameter bezeichnet, die in die Verteilungsfunktion F vorhanden sind. Faustregel: für nicht mehr als 20% aller benutzten Klassen npi < 5 Zu Signikanzniveau α kritischen Wert kα mit GT ,k − −r (kα ) = 1 − α (GT ,k − −r - Verteilungsfunktion), falls für das konkrete t > kα wird Nullhypothese verworfen. 2 0 1 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 31 / 56 Chiquadrat-Tests IV Der Anpassungstest Beispiel: Es soll untersucht werden, ob die folgenden klassierten Daten x einer Normalverteilung folgen: Klasse −∞ < x ≤ 3 3 < x ≤ 5 5 < x ≤ 7 7 < x < ∞ Anzahl 3 12 10 4 Nullhypothese: F = F Wie bestimmt man F ? 0 0 Normalverteilung (!) Schätzen von µ und σ Klassenmitten als Ersatzwerte mit angegebener Häugkeit Schätzung von µ durch + 10 · 6 + 4 · 8 x = 3 · 2 + 12 · 429 = 5. 0345 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 32 / 56 Chiquadrat-Tests V Der Anpassungstest Wie bestimmt man F ? 0 Schätzung von σ durch x2 = 3 · 2 2 + 12 · 42 + 10 · 62 + 4 · 82 29 = 28. 276 29 2 · x − (x )2 28 29 = · 28. 276 − (5. 0345)2 = 3. 0344 28 √ σ = 3. 0344 = 1. 7420 σ2 = Berechnung der Klassenwahrscheinlichkeiten: p1 = F0 (3) 3 − 5. 0345 1. 7420 = Φ (−1. 1679) = 1 − Φ (1. 1679) =Φ Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 33 / 56 Chiquadrat-Tests VI Der Anpassungstest Wie bestimmt man F ? 0 Berechnung der Klassenwahrscheinlichkeiten: p1 = 1 − Φ (1. 1679) = 1 − 0.8785764 = 0.12142 Ablesen der folgenden Werte mit Hilfe einer Tabelle: Φ (2. 316) = 0.9897209 und Φ (1. 1679) = 0.8785764 p1 = 0.9897209 − 0.8785764 = 0.11114 Analoge Bestimung von p2 , p3 und p4 . 0345 p2 = Φ 5 −1.57420 3 − 5. 0345 −Φ 1. 7420 −2 = Φ −1. 9805 × 10 − Φ (−1. 1679) = 0.37068 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 34 / 56 Chiquadrat-Tests VII Der Anpassungstest Wie bestimmt man F ? 0 Analoge Bestimung von p2 , p3 und p4 . 0345 p2 = Φ 5 −1.57420 3 − 5. 0345 −Φ 1. 7420 −2 − Φ (−1. 1679) = 0.37068 = Φ −1. 9805 × 10 7 − 5. 0345 . 0345 p3 = Φ 1. 7420 − Φ 5 −1.57420 = Φ (1. 1283) − Φ −1. 9805 × 10−2 = 0.3783 . 0345 p4 = 1 − Φ 7 −1.57420 = 1 − Φ (1. 1283) = 0.12960 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 35 / 56 Chiquadrat-Tests VIII Der Anpassungstest Zusammenfassung: p p p p 0.11114 0.37068 0.3783 0.12960 n n n n 3 12 10 4 1 2 3 4 1 2 3 4 Berechnung der Testgröÿe: n = 29 (n − npi ) t=∑ i npi i= 2 4 1 (3 − 29 · 0.11114)2 (12 − 29 · 0.37068)2 = + 29 · 0.11114 29 · 0.37068 2 (10 − 29 · 0.3783) (4 − 29 · 0.12960)2 + + 29 · 0.3783 29 · 0.12960 = 0.26227 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 36 / 56 Chiquadrat-Tests IX Der Anpassungstest Freiheitgrade: also (4 − 1) − 2 = 1 k . , 0 95 1 = 3.841459 Somit kann wegen 0.26227 < k . , die Annahme einer Normalverteilung nicht widerlegt werden. Kritisch: geringe Fallzahlen an den Rändern Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 95 1 Vorlesung 5 12.05.2017 37 / 56 Chiquadrat-Tests X Der Chiquadrat-Unabhängigkeitstest X und Y seien zwei diskrete Grundgesamtheiten Werte 1, . . . , m bzw. 1, . . . , r Grundgesamtheiten durch Klassieren entstanden sind. Nullypothese: X und Y sind unabhängig Unter H gilt dann 0 pik = P (X = i , Y = k ) = P (X = i ) P (Y = k ) = pi · p·k , Hik für die absolute Häugkeit von Xj = i und Yj = k für j = 1, . . . , n Abkürzung für Zeilen und Spaltensummen der Häugkeiten: Hi · = r m ∑ Hik und H·k = ∑ Hik i= k= 1 1 b pi · = Hni · und bp·k = Hn·k für i = 1, . . . , m; k = 1, . . . , r sind Schätzer für pi · und p·k Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 38 / 56 Chiquadrat-Tests XI Der Chiquadrat-Unabhängigkeitstest Die Testgröÿe T =n∑ ∑ i= k= 1 Hik − Hi ·n·H·k Hi · · H·k m r 1 2 ist schlieÿlich mit mr − (m + r − 2) − 1 = (m − 1) (r − 1) Freiheitsgraden näherungsweise χ -verteilt. Vorgehensweise: 2 1 2 3 4 Nullhypothese: X und Y unabhängig Berechnung des konkreten Testwertes t Bestimmung von kα,(m−1)(r −1) mit FT ,(m−1)(r −1) kα,(m−1)(r −1) = 1 − α Ablehnung der Nullhypothese, wenn t > kα,(m−1)(r −1) . Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 39 / 56 Chiquadrat-Tests XII Der Chiquadrat-Unabhängigkeitstest Beispiel: Die Bewerber für ein duales Studium an einer Betriebsakademie weisen die folgenden Noten in den Fächern Mathematik und Englisch auf En 1 Ma 1 60 2 12 3 3 2 10 9 2 3 1 3 0 Testen Sie mit α = 0, 05, ob die Leistungen in beiden Fächern unabhängig sind! Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 40 / 56 Chiquadrat-Tests XIII Der Chiquadrat-Unabhängigkeitstest Nullhypothese: Leistungen in Mathematik und Englisch sind unabhängig Berechnung der Testgröÿe Hik − Hi ·n·H·k Hi · · H·k 3 t =n∑ 3 ∑ i= k= 1 1 2 mit n = 60 + 10 + 1 + 12 + 9 + 3 + 3 + 2 + 0 = 100. Wir berechnen die erwarteten Anzahlen Eik = Hi ·n·H·k in einer gesonderten Tabelle, z.B: (60 + 10 + 1) · (60 + 12 + 3) = 53. 25 E = 100 53. 25 14. 91 2. 84 18.0 5. 04 0.96 3. 75 1. 05 0.2 11 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 41 / 56 Chiquadrat-Tests XIV Der Chiquadrat-Unabhängigkeitstest Einsetzen in die Formel der Testgröÿe: Hik − Hi ·n·H·k (Hi · · H·k ) /n 3 t=∑ 3 ∑ i= k= 1 1 2 60 10 1 Die beobachten Werte: 12 9 3 3 2 0 die erwarteten Werte: Dann 53. 25 14. 91 2. 84 18.0 5. 04 0.96 3. 75 1. 05 0.2 (60 − 53. 25)2 (0 − 0.2)2 t= +...+ = 14. 321. 53. 25 0.2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 42 / 56 Chiquadrat-Tests XV Der Chiquadrat-Unabhängigkeitstest Verteilung: χ -verteilt mit 4 Freiheitgraden kritischer Wert k . , = 9.487729 2 0 95 4 Wegen 14. 321 > k . , 0 95 4 wird die Nullhypothese abgelehnt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 43 / 56 Chiquadrat-Tests XVI Der Chiquadrat-Test auf Homogenität Gegeben zwei Merkmale X , Y mit den Werten 1, 2, . . . , m 1 2 3 ... Tabelle mit beobachteten Werten: x H H H . . . y H0 H0 H0 . . . 1 2 3 1 2 3 m Hm Hm0 Nullhypothese: Verteilungen von X und Y stimmen überein Testgröÿe m (H 0 − H ) T=∑ 0 i = (H + H ) 2 1 1 1 1 1 ist mit m − 1-Freiheitsgraden χ -verteilt. kritischer Wert kα,m− mit FT ,m− (kα,m− ) = 1 − α Wenn für den konkreten Testwert t > kα,m− Ablehnung der Nullhypothese 2 1 1 1 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 44 / 56 Chiquadrat-Tests XVIII Der Chiquadrat-Test auf Homogenität Beispiel: Der Umsatz zweier Jahre in Mill. 2010 2011 ¿ war wie folgt: Q1 Q2 Q3 Q4 4 3 5 4 6 4 4 5 Ist die Umsatzverteilung für gleiche Quartale als gleich anzusehen? Nullhypothese: Umsätze beider Jahre verfügen über die gleiche Verteilung Berechnung der Testgröÿe t= (6 − 4)2 10 kritischer Werte k . + , (3 − 4)2 0 95 3 7 + (5 − 4)2 9 + (5 − 4)2 9 = 0.76508 = 7.814728, Annahme der Nullhypothese Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 45 / 56 Chiquadrat-Tests XX Beispiel: duales Studium an einer Betriebsakademie R-Skript: M <- matrix(c(60, 10, 1, 12, 9, 3, 3, 2, 0), ncol = 3) # M Pruefen ob die richtige Matrix chisq.test(M) ## Warning: Chi-squared approximation may be incorrect ## ## Pearson's Chi-squared test ## ## data: M ## X-squared = 14.32, df = 4, p-value = 0.006339 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 46 / 56 Markow-Ketten I Aufgabe: Die Nachfrage nach einem bestimmten Automodell ist gleichmäÿig zwischen 0 und 4 Autos pro Monat gleichverteilt. Ein Autohaus hat zwischen 3 und 5 Autos dieses Modells am Lager. Übersteigt die Nachfrage das Angebot des Händlers, so wird der Lagerbestand immer auf 5 aufgefüllt. Es müssen aber auch immer mindestens 3 Auto auf dem Hof des Händlers stehen. a) Zeichnen Sie den stochastischen Graphen! b) Geben Sie die Übergangsmatrix an! c) Berechnen Sie die stationäre Verteilung! d) Welche Durchschnittszahl an Autos dieses Modells steht auf dem Hof des Händlers? Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 47 / 56 Markow-Ketten II a) Lösung: Wir erhalten wegen: 0 1 2 3 4 1/5 1/5 1/5 1/5 1/5 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 48 / 56 Markow-Ketten III b) Es gilt 1/5 0 4/5 U = 1/5 1/5 3/5 1/5 1/5 3/5 c) Zuussregel: a = a + a + a a = a + a a +a +a = 1 1 3 5 4 3 3 1 5 4 1 5 4 1 4 5 1 5 5 5 5 a = ,a = ,a = d) Durchschnittliche Anzahl an Autos: 3 1 5 4 4 25 5 µ= Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 16 25 1 4 16 · 3 + · 4 + · 5 = 4. 44 5 25 25 Vorlesung 5 12.05.2017 49 / 56 Einfache Warteschlangen I Aufgabe: In einem Herrensalon werden die männlichen Kunden durch 2 attraktive Kolleginnen bedient. Jede schat 3 Haarschnitte pro Stunden. Pro Stunde suchen 5 Herren den Salon auf. Sie warten immer. a) Welcher Anteil der männlicher Kunden kommt sofort ran? b) Wieviele Kunden µW warten im Durchschnitt? Was wird benötigt? Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 50 / 56 Warteschlangen mit M Schaltern und Kunden warten I M Schalter, alle Schalter besetzt, so wartet der Kunde λn = λ und für die Bedienrate µn = pn ? Antwort: pn = nµ 0 ≤ n ≤ M M µ n ≥ M. n p · ρn! 0 ≤ n ≤ M p · M !Mρ n−M n ≥ M . Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 0 n 0 Vorlesung 5 12.05.2017 51 / 56 Warteschlangen mit M Schaltern und Kunden warten II Aufaddieren p · " 0 M ρk # ρ M ∞ ρ k + · =1 k ! M ! k∑ M =1 ∑ k= 0 Auösen nach p 0 p = 0 " M ρk ∑ k= 0 ρ M ∞ ρ k + · k ! M ! k∑ M =1 #−1 . für ρ ≥ M ist p = 0 (Divergenz der Reihe), also pn = 0 Warteschlange von unendlicher Länge 0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 52 / 56 Warteschlangen mit M Schaltern und Kunden warten III mittlere Schlangenlänge für ρ < M ? S zufällige Länge dieser Schlange: S = 0 falls höchstens M Kunden im System sind und S = n − M , falls n Kunden im System sind, wobei n > M ist. Berechnung von E (S ): pM +n = p · 0 E (S ) = ρ n ρ n+M = p · M M M !M n ∞ ρ n ∞ ∑ n · pM +n = pM ∑ n M n= n= 1 = pM · Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 ρ M . 1 − Mρ 2 Vorlesung 5 12.05.2017 53 / 56 Einfache Warteschlangen II Lösung: M = 2, λn = λ = 5 und für die Grundbedienrate µ = 3 µn = Dann ist die Verteilung mit ρ = pn = ( Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) nµ 0 ≤ n ≤ 2 2µ n ≥ M . 5 3 n p · ρn! 0 ≤ n ≤ 2 n p · ρn−1 n ≥ 2. 0 0 2 Vorlesung 5 12.05.2017 54 / 56 Einfache Warteschlangen III und #−1 (5/3)k (5/3)2 ∞ 5/3 k + ·∑ p0 = ∑ 2 k =1 2 k =0 k ! " 2 = [11]−1 = 1 . 11 Dann gilt, wenn X die zufällige Anzahl der Herren, die sich gerade die Haare schneiden lassen wollen: P (X ≤ 1) = p + p = + · / = (gesuchter Anteil) 0 1 1 1 5 3 8 11 11 1 33 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 5 12.05.2017 55 / 56 Einfache Warteschlangen IV Es gilt 25 1 = p = · 11 2 198 5 2 3 2 E (S ) = p · 2 ρ 2 1− ρ 2 2 25 = 3. 7879 · 198 1 − 5 = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 6 5 2 6 Vorlesung 5 12.05.2017 56 / 56