Statistik II für Betriebswirte

Werbung
Statistik II für Betriebswirte
Privat-Doz. Dr. H. Haase
Inst. f. Math. u. Inf.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
12.05.2017
Vorlesung 5
12.05.2017
1 / 56
Übersicht
1
Zusammenfassung Vorlesung 4
2
Binomialverteilte Grundgesamtheiten
3
Odds Ratio
4
Chiquadrat-Tests
5
Wiederholung zu Statistik I
Markow-Ketten
Einfache Warteschlangen
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
2 / 56
Zweiseitiger t-Test
−4
−2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
2
4
x
Vorlesung 5
12.05.2017
3 / 56
Einseitiger t-Test
−4
−2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
2
4
x
Vorlesung 5
12.05.2017
4 / 56
Fehler beim Alternativtest
−4
−2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
2
4
6
x
Vorlesung 5
12.05.2017
5 / 56
Binomialverteilte Grundgesamtheiten I
Wir behandeln folgende Probleme:
1
2
Prüfen der Wahrscheinlichkeit für das Eintreten eines Ereignisses
Prüfen der Gleichheit zweier Wahrscheinlichkeiten
Das Eintreten eines Ereignisses - Indikatorfunktion X beschrieben.
Die Grundgesamtheit X ist dichotom. Es gilt dann P (X = 1) = p .
Wir testen:
1
2
im zweiseitigen Fall H0 : p = p0 gegen H1 : p 6= p0 .
In den einseitigen Fällen haben wir H0 : p ≤ p0 gegen H1 : p > p0 bzw.
H0 : p ≥ p0 gegen H1 : p < p0 .
Ist (X , . . . , Xn ) eine mathematische Stichprobe von X , so ist
1
X −p √
n
T=p n
p (1 − p )
unter der Nullhypothese näherungsweise standardnormalverteilt.
Minimalforderung np (1 − p ) ≥ 9
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
6 / 56
Binomialverteilte Grundgesamtheiten II
exakter Test mit Testgröÿe T = X + . . . + Xn
T mit n und p binomialverteilt ist.
Ablehnungsbereich zum Signikanzniveau α :
a) zweiseitig: Wähle 0 ≤ k < k ≤ n mit
1
1
2
k1 n
∑
j=
0
α k1 +
p j (1 − p )n−j ≤ < ∑
j
2 j=
1
0
sowie
n n
∑
j =k j
n j
p (1 − p )n−j
j
α
p j (1 − p )n−j ≤ <
2
2
n
n j
p (1 − p )n−j
j
∑
j =k2 −
1
also K = {0, 1, . . . , k } ∪ {k , k + 1, . . . , n} als Ablehnungsbereich
denn die Wahrscheinlichkeiten der Werte 0, 1, . . . , k und
k , k + 1, . . . , n von T sollen insgesamt α nicht übersteigen.
1
2
2
1
2
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
7 / 56
Binomialverteilte Grundgesamtheiten III
Ablehnungsbereich zum Signikanzniveau α :
b) einseitig (nach unten): Wähle 0 ≤ k ≤ n mit
k n
p j (1 − p )n−j ≤ α <
∑
j= j
k + n
∑ j pj (1 − p)n−j
j=
1
0
0
also K = {0, 1, . . . , k }
c) einseitig (nach oben): Wähle 0 ≤ k ≤ n mit
n n
∑
j =k j
p j (1 − p )n−j ≤ α <
n n
∑
j =k −
1
j
p j (1 − p )n−j
also K = {k , k + 1, . . . , n}
Beispiel: 10% aller Eier sind Knickeier. Testen Sie, ob in einem
Hühnerbestand diese Norm eingehalten wird, wenn
a) 4 von 10 Eiern Knickeier bzw.
b) 20 von 100 Eiern Knickeier waren
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
8 / 56
Binomialverteilte Grundgesamtheiten IV
exakte Lösung für n = 10.
Nullhypothese: p ≤ 0.1 gegen p > 0.1
Berechnung der Testgröÿe T , die mit n = 10 und p = 0.1
binomialverteilt ist, zu t = 4
Bestimmung eines kritischen Bereiches bzw. eines kritischen Wertes
mit
10
10
j
−j
∑ j 0.1 · 0.9 ≤ 0.05 < ∑ j 0.1j · 0.9 −j
j =k
j =k −
10
10
10
10
1
bzw.
k − 10
1
∑ j 0.1j · 0.9
j=
10
−j
≥ 0.95
0
Dazu berechnen wir die Einzelwahrscheinlichkeiten, soweit erforderlich:
j
pj
0
1
2
3
0.34868 0.38742 0.19371 5. 7396 × 10−
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 5
...
...
12.05.2017
9 / 56
Binomialverteilte Grundgesamtheiten V
kumulieren der pj :
10
∑ j 0.1j · 0.9
j=
−j
= 0.92981
10
∑ j 0.1j · 0.9
j=
−j
= 0.9872
2
10
0
3
10
0
kritischer Bereich K = {3, 4, . . . , 10}
Wegen t ∈ K wird die Nullhypothese verworfen.
jetzt n = 100
Nullhypothese: p ≤ 0.1 gegen p > 0.1
Testgröÿe
X −p √
n
T=p n
p (1 − p )
unter der Nullhypothese näherungsweise standardnormalverteilt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
10 / 56
Binomialverteilte Grundgesamtheiten VI
Berechnung der Testgröÿe
20
= 0.2
100
0.2 − 0.1 √
100 = 3. 3333
t=p
0.1 · (1 − 0.1)
xn =
Bestimmung des kritischen Wertes k . = 1.96 (aus einer Tabelle,
kennen wir inzwischen auswendig!!!)
Wegen k . < t wird die Nullhypothese verworfen.
Vorgehensweise in R?
0 975
0 975
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
11 / 56
Binomialverteilte Grundgesamtheiten VII
exakter Binomialtest:
binom.test(x, n, p = 0.5, alternative = c("two.sided", "less",
"greater"), conf.level = 0.95)
Bedeutung der Parameter (aus der Hilfe):
x
number of successes, or a vector of length 2 giving the numbers
of successes and failures, respectively.
n
number of trials; ignored if x has length 2.
p
hypothesized probability of success.
alternative
indicates the alternative hypothesis and must be one of
"two.sided", "greater" or "less". You can specify just the initial letter.
conf.level
condence level for the returned condence interval.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
12 / 56
Binomialverteilte Grundgesamtheiten VIII
zur Erinnerung: Knickeierbeispiel: n = 10, p = 0.1 mit p -Wert
10
p = P (T ≥ 4 ) = ∑
j=
4
10
0.1j · 0.9
j
−j
10
= 1. 2795 × 10−2
R-Skript:
binom.test(4, 10, 0.1, alternative = "greater")
##
##
##
##
##
##
##
##
##
##
##
Exact binomial test
data: 4 and 10
number of successes = 4, number of trials = 10, p-value = 0.0128
alternative hypothesis: true probability of success is greater than 0.1
95 percent confidence interval:
0.15 1.00
sample estimates:
probability of success
0.4
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
13 / 56
Binomialverteilte Grundgesamtheiten IX
Prüfen der Gleichheit zweier Wahrscheinlichkeiten von zwei
unabhängigen Ereignissen
1
2
bei hinreichend groÿen Stichprobenumfang mit einer Testgröÿe, die
näherungsweise normal verteilt
kleine Stichproben mit dem exakten Fisher-Test
Konstruktion der Teststatistik für groÿe Stichprobenumfänge:
zu testende Wahrscheinlichkeiten pi für i = 1, 2 durch die dichotome
Grundgesamten X und Y erfaÿt.
Stichprobenumfänge ni für i = 1, 2
zugehörige absoluten Häugkeiten Ti mit ni und pi binomialverteilt
zugehörigen relativen Häugkeiten Tnii sind dann näherungsweise mit
den Parametern pi (für den Erwartungswert) und
pi (1 − pi )
ni
(für die Varianz) normalverteilt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
14 / 56
Binomialverteilte Grundgesamtheiten X
Konstruktion der Teststatistik für groÿe Stichprobenumfänge:
D die Dierenz beider relativen Häugkeiten
auch normalverteilt mit 0 und
p ((1 − p) n1 + n1
1
2
für die Varianz unter der Nullhypothese H0 : p = p1 = p2 .
D muÿ jetzt standardisiert werden
Wahrscheinlichkeit wird p durch
p2 n 2
pb = p1 nn1 +
+n
1
geschätzt.
nale Teststatistik
2
D
T=r
pb (1 − pb) n1
1
+ n12
,
ist näherungsweise standardisiert normalverteilt
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
15 / 56
Binomialverteilte Grundgesamtheiten XI
Beispiel: 2 Umfragen in zwei Städten erbrachten jeweils eine Zustimmung
von 30% bzw. 32% bei Beteilungen von 300 bzw. 400 Bürgern. Kann die
Zustimmung als gleich eingeschätzt werden?
Nullhypothese: p = p = p
Berechnung der Testgröÿe:
a) Dierenz der relativen Häugkeiten:
d = 0.3 − 0.32 = −0.02
b) Schätzwert bp = · . ++ · . = 0.31143
c) Teststatistik
1
2
300 0 3
400 0 32
300
400
−0.02
t=q
0.31143 · (1 − 0.31143)
1
1
+ 400
300
= −0.56548
Bestimmung des kritischen Wertes k . (α = 0.05) zu k . = 1.96
Wegen 0.56548 < 1.96 wird die Nullhypothese angenommen.
0 975
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
0 975
12.05.2017
16 / 56
Binomialverteilte Grundgesamtheiten XI
mit R?
prop.test(x, n, p = NULL, alternative = c("two.sided", "less",
"greater"), conf.level = 0.95, correct = TRUE)
prop.test(x <- c(90, 128), c(300, 400))
##
##
##
##
##
##
##
##
##
##
##
##
2-sample test for equality of proportions with continuity
correction
data: x <- c(90, 128) out of c(300, 400)
X-squared = 0.2333, df = 1, p-value = 0.6291
alternative hypothesis: two.sided
95 percent confidence interval:
-0.09205 0.05205
sample estimates:
prop 1 prop 2
0.30 0.32
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
17 / 56
Binomialverteilte Grundgesamtheiten XII
für kleinere Stichproben: exakter Fisher-Test
Nullhypothese: p = p = p gegen p 6= p .
Betrachtung von
1
2
1
P (T = a|T + T = b) =
1
1
2
2
P ([T = a] ∩ [T + T = b])
P (T + T = b )
1
1
1
2
2
T und T sind unabhängig:
1
2
P (T = a|T + T = b) =
1
1
2
P (T = a) P (T = b − a)
P (T + T = b )
1
2
1
2
T , T und T + T mit p und n , n sowie n + n binomialverteilte
Zufallsgröÿen, wenn die Nullhypothese gilt.
1
2
1
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
Vorlesung 5
2
1
2
12.05.2017
18 / 56
Binomialverteilte Grundgesamtheiten XII
Es gilt:
P (T = a|T + T = b)
n1 p a (1 − p )n1 −a n2 p b−a (1 − p )n2 −b+a
b−a
= a
n1 +n2 p b (1 − p )n1 +n2 −b
b
1
1
2
n1 · n2 = a n1 +nb2−a .
b
bedingte Verteilung von T vorausgesetzt, daÿ T + T gegeben hypergeometrische Verteilung
Denition: X ist mit den Parametern n ≤ M < N und n ≤ N − M
hypergeometrisch verteilt, wenn für k = 0, 1, . . . , n
1
1
2
M N −M P (X = k ) = k Nn−k
n
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
19 / 56
Binomialverteilte Grundgesamtheiten XIII
Festlegung des kritischen Bereiches K für α gegeben:
Wähle ku ≤ n1 maximal mit
P (T1 ≤ ku |T1 + T2 = b) ≤ α2
Wähle ko minimal mit ko ≤ min {b, n1 }:
P (T1 ≥ ko |T1 + T2 = b) ≤ α2
K = {0, 1, . . . , ku } ∪ {ko , ko + 1, . . . , min {b, n1 }}
Falls nicht lösbar K = ∅.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
20 / 56
Binomialverteilte Grundgesamtheiten XIV
Beispiel: Bei 20 lateinamerikanischen Staaten wurde das Niveau der
Industrialisierung und das wirtschaftliche Wachstum verglichen. Es wurde
festgestellt, daÿ die Menge der vier am schnellsten wachsenden Staaten
keinen der vier am höchsten industrialisierten Staaten enthielt wie auch die
folgende Tabelle anzeigt:
Wachstum
Industrialisierung am schnellsten andere
.
am höchsten
0
4
andere
4
12
X sei die Indikatorfunktion dafür, daÿ ein am höchsten industrialisiertes
Land am schnellsten wächst, und Y der Indikator, daÿ ein anders
industrialisiertes Land am schnellsten wächst. Die Stichprobendaten zu X
ndet man in der ersten Zeile und die von Y in der zweiten Zeile.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
21 / 56
Binomialverteilte Grundgesamtheiten XV
T mit n = 4 und p binomialverteilt.
T mit n = 16 und p binomialverteilt
Nullhypothese p = p = p
0 gehört immer zum kritischen Bereich (falls nicht leer):
1
1
2
2
1
2
P (T = 0|T + T = 4) =
1
1
2
4
0
·
16
4 = 0.37564
20
4
(a = 0, b = 4 sowie n = 4, n = 16)
mit anderen Worten Nullhypothese kann nicht verworfen werden!!!
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 5
12.05.2017
22 / 56
Binomialverteilte Grundgesamtheiten XVI
mit R?
M <- matrix(ncol = 2, nrow = 2, c(0, 4, 4, 12))
fisher.test(M)
##
##
##
##
##
##
##
##
##
##
##
Fisher's Exact Test for Count Data
data: M
p-value = 0.5377
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.000 6.809
sample estimates:
odds ratio
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
23 / 56
Der Tee-Test der englischen Lady I
Ein (berühmtes) Beispiel: A British woman claimed to be able to
distinguish whether milk or tea was added to the cup rst. To test, she was
given 8 cups of tea, in four of which milk was added rst. The null
hypothesis is that there is no association between the true order of pouring
and the woman's guess, the alternative that there is a positive association
(that the odds ratio is greater than 1).
TeaTasting <- matrix(c(3, 1, 1, 3), nrow = 2, dimnames = list(Guess = c("Mi
"Tea"), Truth = c("Milk", "Tea")))
TeaTasting
##
Truth
## Guess Milk Tea
##
Milk
3
1
##
Tea
1 3
und als Testergebnis
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
24 / 56
Der Tee-Test der englischen Lady II
fisher.test(TeaTasting, alternative = "greater")
##
##
##
##
##
##
##
##
##
##
##
Fisher's Exact Test for Count Data
data: TeaTasting
p-value = 0.2429
alternative hypothesis: true odds ratio is greater than 1
95 percent confidence interval:
0.3136
Inf
sample estimates:
odds ratio
6.408
Obwohl in 6 von 8 Veruschen richtig immer noch rein zufällig!!
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
25 / 56
Odds Ratio I
Maÿzahlen zur Darstellung des Wirkungsunterschieds bei kategoriellen
Daten
Gesundheitsmanagment (Spezialisierung in Greifswald)
Vergleich von 2 Behandlungen
Kreuztabelle:
wirksam nicht wirksam
Behandlung 1
a
b
a+b
Behandlung 2
c
d
c +d
a+c
b+d
a+b+c +d
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
26 / 56
Odds Ratio II
Denition: Odds-Ratio
Der Odds (engl. für Chance) ist der Quotient der Wahrscheinlichkeit,
daÿ das Zielereignis eintritt, zu der Wahrscheinlichkeit, daÿ es nicht
eintritt,
also Behandlung 1: Zielereignis Behandlung 1 ist wirksam, d.h.
a/(a + b) und Behandlung 1 ist nicht wirksam, d.h. b/(a + b), also
Analog
Odds
Behandlung 1
=
a
b
Odds
Behandlung 2
=
c
d
Odds-Ratio-Punktschätzer
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
d=
OR
a/b ad
=
c /d bc
Vorlesung 5
12.05.2017
27 / 56
Odds Ratio III
Berechnung von Kondenzintervallen für den Odds-Ratio:
X -Indikatorfunktion für Behandlungen, Y - Indikator für Wirksamkeit
X , . . . , Xn bzw. Y , . . . , Yn math. Stichproben dazu
(n = a + b + c + d ):
der Log-Schätzer von OR
1
1
ln(OR ) = ln(OR (X , . . . , Xn ; Y , . . . , Yn ))
1
1
ist asymptotisch normalverteilt.
asymptotische Standardfehler für ln(OR )
se =
r
1 1 1 1
+ + +
a b c d
(1 − α) −Kondenzintervall
h i
d − q1−α/2 · se , ln OR
d + q1−α/2 · se
ln OR
mit q
−α/2
1
Quantil der Standardnormalverteilung.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
28 / 56
Chiquadrat-Tests I
Fragestellungen:
Anpassungstest:
Stammt eine Stichprobe von Daten aus einer speziellen Verteilung? Mit
anderen Worten kann man die Daten an eine solche Verteilung
anpassen.
Unabhängigkeitstest:
Zwei Merkmale werden über eine Kreuztabelle ausgewertet (bei
stetigen über eine Klassierung). Getestet soll werden, ob die
Unabhängigkeit der beiden Merkmale in Zweifel gezogen werden kann.
Homogenitätstest:
Gegeben zwei Stichproben. Getestet soll werden, ob die gleiche
Verteilung zugrunde liegt.
gemeinsame Grundlage ist die χ -Statistik als Testgröÿe
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 5
12.05.2017
29 / 56
Chiquadrat-Tests II
Der Anpassungstest
Grundgesamtheit X .
Nullhypothese F = F gegen F 6= F
F - bekannte Verteilungsfunktion
F − Verteilungsfunktion von X .
mathematische Stichprobe (X , . . . , Xn )
Daten in k Klassen Ki für i = 1, 2, . . . , k aufteilen
Ni bezeichne die zufällige absolute Häugkeit, daÿ die X , . . . , Xn in
die i -te Klasse fallen
Ki = [ai , bi [, pi - Wahrscheinlichkeit, in diese zu fallen:
0
0
0
1
1
pi = F (bi ) − F (ai )
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
Vorlesung 5
0
12.05.2017
30 / 56
Chiquadrat-Tests III
Der Anpassungstest
Ni mit n und pi binomialverteilt.
Teststatistik
k (N − npi )
T=∑ i
npi
i=
2
1
T ist für einen hinreichend groÿen Stichprobenumfang n mit k − 1 − r
Freiheitsgraden χ - verteilt.
r - Anzahl der Parameter bezeichnet, die in die Verteilungsfunktion F
vorhanden sind.
Faustregel: für nicht mehr als 20% aller benutzten Klassen npi < 5
Zu Signikanzniveau α kritischen Wert kα mit GT ,k − −r (kα ) = 1 − α
(GT ,k − −r - Verteilungsfunktion), falls für das konkrete t > kα wird
Nullhypothese verworfen.
2
0
1
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
31 / 56
Chiquadrat-Tests IV
Der Anpassungstest
Beispiel: Es soll untersucht werden, ob die folgenden klassierten Daten x
einer Normalverteilung folgen:
Klasse −∞ < x ≤ 3 3 < x ≤ 5 5 < x ≤ 7 7 < x < ∞
Anzahl
3
12
10
4
Nullhypothese: F = F
Wie bestimmt man F ?
0
0
Normalverteilung (!)
Schätzen von µ und σ
Klassenmitten als Ersatzwerte mit angegebener Häugkeit
Schätzung von µ durch
+ 10 · 6 + 4 · 8
x = 3 · 2 + 12 · 429
= 5. 0345
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
32 / 56
Chiquadrat-Tests V
Der Anpassungstest
Wie bestimmt man F ?
0
Schätzung von σ durch
x2 = 3 · 2
2 + 12 · 42 + 10 · 62 + 4 · 82
29
= 28. 276
29 2
· x − (x )2
28
29 =
· 28. 276 − (5. 0345)2 = 3. 0344
28
√
σ = 3. 0344 = 1. 7420
σ2 =
Berechnung der Klassenwahrscheinlichkeiten:
p1 = F0 (3)
3 − 5. 0345
1. 7420
= Φ (−1. 1679) = 1 − Φ (1. 1679)
=Φ
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
33 / 56
Chiquadrat-Tests VI
Der Anpassungstest
Wie bestimmt man F ?
0
Berechnung der Klassenwahrscheinlichkeiten:
p1 = 1 − Φ (1. 1679)
= 1 − 0.8785764 = 0.12142
Ablesen der folgenden Werte mit Hilfe einer Tabelle:
Φ (2. 316) = 0.9897209 und Φ (1. 1679) = 0.8785764
p1 = 0.9897209 − 0.8785764 = 0.11114
Analoge Bestimung von p2 , p3 und p4
. 0345
p2 = Φ 5 −1.57420
3 − 5. 0345
−Φ
1. 7420
−2
= Φ −1. 9805 × 10
− Φ (−1. 1679)
= 0.37068
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
34 / 56
Chiquadrat-Tests VII
Der Anpassungstest
Wie bestimmt man F ?
0
Analoge Bestimung von p2 , p3 und p4
. 0345
p2 = Φ 5 −1.57420
3 − 5. 0345
−Φ
1. 7420
−2
− Φ (−1. 1679) = 0.37068
= Φ −1. 9805 × 10
7 − 5. 0345
. 0345
p3 = Φ 1. 7420 − Φ 5 −1.57420
= Φ (1. 1283) − Φ −1. 9805 × 10−2 = 0.3783
. 0345
p4 = 1 − Φ 7 −1.57420
= 1 − Φ (1. 1283) = 0.12960
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
35 / 56
Chiquadrat-Tests VIII
Der Anpassungstest
Zusammenfassung:
p
p
p
p
0.11114 0.37068 0.3783 0.12960
n
n
n
n
3
12
10
4
1
2
3
4
1
2
3
4
Berechnung der Testgröÿe: n = 29
(n − npi )
t=∑ i
npi
i=
2
4
1
(3 − 29 · 0.11114)2 (12 − 29 · 0.37068)2
=
+
29 · 0.11114
29 · 0.37068
2
(10 − 29 · 0.3783)
(4 − 29 · 0.12960)2
+
+
29 · 0.3783
29 · 0.12960
= 0.26227
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
36 / 56
Chiquadrat-Tests IX
Der Anpassungstest
Freiheitgrade:
also
(4 − 1) − 2 = 1
k
.
,
0 95 1
= 3.841459
Somit kann wegen 0.26227 < k . , die Annahme einer
Normalverteilung nicht widerlegt werden.
Kritisch: geringe Fallzahlen an den Rändern
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0 95 1
Vorlesung 5
12.05.2017
37 / 56
Chiquadrat-Tests X
Der Chiquadrat-Unabhängigkeitstest
X und Y seien zwei diskrete Grundgesamtheiten
Werte 1, . . . , m bzw. 1, . . . , r
Grundgesamtheiten durch Klassieren entstanden sind.
Nullypothese: X und Y sind unabhängig
Unter H gilt dann
0
pik = P (X = i , Y = k ) = P (X = i ) P (Y = k ) = pi · p·k ,
Hik für die absolute Häugkeit von Xj = i und Yj = k für j = 1, . . . , n
Abkürzung für Zeilen und Spaltensummen der Häugkeiten:
Hi · =
r
m
∑ Hik und H·k = ∑ Hik
i=
k=
1
1
b
pi · = Hni · und bp·k = Hn·k für i = 1, . . . , m; k = 1, . . . , r sind Schätzer für
pi · und p·k
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
38 / 56
Chiquadrat-Tests XI
Der Chiquadrat-Unabhängigkeitstest
Die Testgröÿe
T =n∑
∑
i= k=
1
Hik − Hi ·n·H·k
Hi · · H·k
m r
1
2
ist schlieÿlich mit
mr − (m + r − 2) − 1 = (m − 1) (r − 1)
Freiheitsgraden näherungsweise χ -verteilt.
Vorgehensweise:
2
1
2
3
4
Nullhypothese: X und Y unabhängig
Berechnung des konkreten Testwertes t
Bestimmung von kα,(m−1)(r −1) mit FT ,(m−1)(r −1) kα,(m−1)(r −1) = 1 − α
Ablehnung der Nullhypothese, wenn t > kα,(m−1)(r −1) .
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
39 / 56
Chiquadrat-Tests XII
Der Chiquadrat-Unabhängigkeitstest
Beispiel: Die Bewerber für ein duales Studium an einer Betriebsakademie
weisen die folgenden Noten in den Fächern Mathematik und Englisch auf
En
1
Ma 1 60
2 12
3 3
2
10
9
2
3
1
3
0
Testen Sie mit α = 0, 05, ob die Leistungen in beiden Fächern unabhängig
sind!
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
40 / 56
Chiquadrat-Tests XIII
Der Chiquadrat-Unabhängigkeitstest
Nullhypothese: Leistungen in Mathematik und Englisch sind
unabhängig
Berechnung der Testgröÿe
Hik − Hi ·n·H·k
Hi · · H·k
3
t =n∑
3
∑
i= k=
1
1
2
mit n = 60 + 10 + 1 + 12 + 9 + 3 + 3 + 2 + 0 = 100.
Wir berechnen die erwarteten Anzahlen Eik = Hi ·n·H·k in einer gesonderten
Tabelle, z.B:
(60 + 10 + 1) · (60 + 12 + 3)
= 53. 25
E =
100
53. 25 14. 91 2. 84
18.0 5. 04 0.96
3. 75 1. 05 0.2
11
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
41 / 56
Chiquadrat-Tests XIV
Der Chiquadrat-Unabhängigkeitstest
Einsetzen in die Formel der Testgröÿe:
Hik − Hi ·n·H·k
(Hi · · H·k ) /n
3
t=∑
3
∑
i= k=
1
1
2
60 10 1
Die beobachten Werte: 12 9 3
3 2 0
die erwarteten Werte:
Dann
53. 25 14. 91 2. 84
18.0 5. 04 0.96
3. 75 1. 05 0.2
(60 − 53. 25)2
(0 − 0.2)2
t=
+...+
= 14. 321.
53. 25
0.2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
42 / 56
Chiquadrat-Tests XV
Der Chiquadrat-Unabhängigkeitstest
Verteilung: χ -verteilt mit 4 Freiheitgraden
kritischer Wert
k . , = 9.487729
2
0 95 4
Wegen 14. 321 > k
.
,
0 95 4
wird die Nullhypothese abgelehnt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
43 / 56
Chiquadrat-Tests XVI
Der Chiquadrat-Test auf Homogenität
Gegeben zwei Merkmale X , Y mit den Werten 1, 2, . . . , m
1 2 3 ...
Tabelle mit beobachteten Werten: x H H H . . .
y H0 H0 H0 . . .
1
2
3
1
2
3
m
Hm
Hm0
Nullhypothese: Verteilungen von X und Y stimmen überein
Testgröÿe
m (H 0 − H )
T=∑ 0
i = (H + H )
2
1
1
1
1
1
ist mit m − 1-Freiheitsgraden χ -verteilt.
kritischer Wert kα,m− mit FT ,m− (kα,m− ) = 1 − α
Wenn für den konkreten Testwert t > kα,m− Ablehnung der
Nullhypothese
2
1
1
1
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
44 / 56
Chiquadrat-Tests XVIII
Der Chiquadrat-Test auf Homogenität
Beispiel: Der Umsatz zweier Jahre in Mill.
2010
2011
¿ war wie folgt:
Q1 Q2 Q3 Q4
4
3
5
4
6
4
4
5
Ist die Umsatzverteilung für gleiche Quartale als gleich anzusehen?
Nullhypothese: Umsätze beider Jahre verfügen über die gleiche
Verteilung
Berechnung der Testgröÿe
t=
(6 − 4)2
10
kritischer Werte k
.
+
,
(3 − 4)2
0 95 3
7
+
(5 − 4)2
9
+
(5 − 4)2
9
= 0.76508
= 7.814728, Annahme der Nullhypothese
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
45 / 56
Chiquadrat-Tests XX
Beispiel: duales Studium an einer Betriebsakademie
R-Skript:
M <- matrix(c(60, 10, 1, 12, 9, 3, 3, 2, 0), ncol = 3)
# M Pruefen ob die richtige Matrix
chisq.test(M)
## Warning: Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: M
## X-squared = 14.32, df = 4, p-value = 0.006339
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
46 / 56
Markow-Ketten I
Aufgabe: Die Nachfrage nach einem bestimmten Automodell ist
gleichmäÿig zwischen 0 und 4 Autos pro Monat gleichverteilt. Ein
Autohaus hat zwischen 3 und 5 Autos dieses Modells am Lager. Übersteigt
die Nachfrage das Angebot des Händlers, so wird der Lagerbestand immer
auf 5 aufgefüllt. Es müssen aber auch immer mindestens 3 Auto auf dem
Hof des Händlers stehen.
a) Zeichnen Sie den stochastischen Graphen!
b) Geben Sie die Übergangsmatrix an!
c) Berechnen Sie die stationäre Verteilung!
d) Welche Durchschnittszahl an Autos dieses Modells steht auf
dem Hof des Händlers?
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
47 / 56
Markow-Ketten II
a) Lösung: Wir erhalten wegen:
0
1
2
3
4
1/5 1/5 1/5 1/5 1/5
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
48 / 56
Markow-Ketten III
b) Es gilt
1/5 0 4/5
U =  1/5 1/5 3/5 
1/5 1/5 3/5

c) Zuussregel:

a = a + a + a
a = a + a
a +a +a = 1
1
3
5
4
3
3
1
5
4
1
5
4
1
4
5
1
5
5
5
5
a = ,a = ,a =
d) Durchschnittliche Anzahl an Autos:
3
1
5
4
4
25
5
µ=
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
16
25
1
4
16
· 3 + · 4 + · 5 = 4. 44
5
25
25
Vorlesung 5
12.05.2017
49 / 56
Einfache Warteschlangen I
Aufgabe: In einem Herrensalon werden die männlichen Kunden durch 2
attraktive Kolleginnen bedient. Jede schat 3 Haarschnitte pro Stunden.
Pro Stunde suchen 5 Herren den Salon auf. Sie warten immer.
a) Welcher Anteil der männlicher Kunden kommt sofort ran?
b) Wieviele Kunden µW warten im Durchschnitt?
Was wird benötigt?
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
50 / 56
Warteschlangen mit M Schaltern und Kunden warten I
M Schalter, alle Schalter besetzt, so wartet der Kunde
λn = λ und für die Bedienrate
µn =
pn ?
Antwort:
pn =
nµ 0 ≤ n ≤ M
M µ n ≥ M.
n


p · ρn! 0 ≤ n ≤ M

p · M !Mρ n−M n ≥ M .
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
n
0
Vorlesung 5
12.05.2017
51 / 56
Warteschlangen mit M Schaltern und Kunden warten II
Aufaddieren
p ·
"
0
M ρk
#
ρ M ∞ ρ k
+
·
=1
k ! M ! k∑
M
=1
∑
k=
0
Auösen nach p
0
p =
0
"
M ρk
∑
k=
0
ρ M ∞ ρ k
+
·
k ! M ! k∑
M
=1
#−1
.
für ρ ≥ M ist p = 0 (Divergenz der Reihe), also pn = 0
Warteschlange von unendlicher Länge
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
52 / 56
Warteschlangen mit M Schaltern und Kunden warten III
mittlere Schlangenlänge für ρ < M ?
S zufällige Länge dieser Schlange: S = 0 falls höchstens M Kunden im
System sind und S =
n − M , falls n Kunden im System sind, wobei n > M ist.
Berechnung von E (S ):
pM +n = p ·
0
E (S ) =
ρ n
ρ n+M
=
p
·
M M
M !M n
∞
ρ n
∞
∑ n · pM +n = pM ∑ n M
n=
n=
1
= pM ·
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
ρ
M .
1 − Mρ
2
Vorlesung 5
12.05.2017
53 / 56
Einfache Warteschlangen II
Lösung: M = 2, λn = λ = 5 und für die Grundbedienrate µ = 3
µn =
Dann ist die Verteilung mit ρ =
pn =
(
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
nµ 0 ≤ n ≤ 2
2µ n ≥ M .
5
3
n
p · ρn! 0 ≤ n ≤ 2
n
p · ρn−1 n ≥ 2.
0
0
2
Vorlesung 5
12.05.2017
54 / 56
Einfache Warteschlangen III
und
#−1
(5/3)k (5/3)2 ∞ 5/3 k
+
·∑
p0 = ∑
2
k =1 2
k =0 k !
"
2
= [11]−1 =
1
.
11
Dann gilt, wenn X die zufällige Anzahl der Herren, die sich gerade die
Haare schneiden lassen wollen:
P (X ≤ 1) = p + p = + · / = (gesuchter Anteil)
0
1
1
1
5 3
8
11
11
1
33
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 5
12.05.2017
55 / 56
Einfache Warteschlangen IV
Es gilt
25
1
=
p = ·
11 2
198
5
2
3
2
E (S ) = p ·
2
ρ
2
1− ρ
2
2
25
= 3. 7879
·
198 1 − 5
=
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
6
5
2
6
Vorlesung 5
12.05.2017
56 / 56
Herunterladen