Vorlesung4 05 05 2017

Werbung
Statistik II für Betriebswirte
Privat-Doz. Dr. H. Haase
Inst. f. Math. u. Inf.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
05.05.2017
Vorlesung 4
05.05.2017
1 / 63
Wiederholung Schätztheorie
−4
−2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
2
4
x
Vorlesung 4
05.05.2017
2 / 63
Übersicht
1
2
3
Grundlagen der Testtheorie
Normalverteilte Grundgesamtheiten
Einstichprobenprobleme
Zweistichprobenprobleme
Wiederholung zu Statistik I
Wahrscheinlichkeitsräume
Bedingte Wahrscheinlichkeiten
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
3 / 63
Grundlagen der Testtheorie I
Gegeben ist eine Grundgesamtheit X , deren Verteilung zumindestens
teilweise unbekannt ist.
Unter dem Hypothesenraum versteht man dann alle für X möglichen
Verteilungen.
Hängen die Verteilungen nur von der Festlegung von Parametern
γ ∈ Γ, d.h. bestimmten Zahlenwerten, ab, so liegt ein parametrisches
Testproblem vor.
Z. B. könnte die Verteilung normalverteilt sein, wobei lediglich der
Erwartungswert unbekannt sein soll.
Ist dies nicht der Fall, so hat man ein nichtparametrisches
Testproblem
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
4 / 63
Grundlagen der Testtheorie II
Im Falle eines parametrischen Testproblems wird der Hypothesenraum,
hier der Parameterraum Γ, in zwei Teilmengen Γ und Γ aufgeteilt.
Sie dienen zu Formulierung der sogenannten Null- bzw.
Alternativhypothese.
Die Nullhypothese, d.h. die Hypothese, die angezweifelt werden soll,
wird mit H bezeichnet.
H steht für eine Aussage der Form γ ∈ Γ .
Die Alternativhypothese H beinhaltet eine Aussage der Gestalt
γ ∈Γ .
Weiterhin unterteilt man die parametrischen Tests in Signikanztests
und Alternativtests
Setzt man
d = inf {|γ − γ | ; γ ∈ Γ , γ ∈ Γ } ,
so gilt d = 0 für einen Signikanztest und d > 0 für einen
Alternativtest.
0
1
0
0
0
1
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
1
0
Vorlesung 4
0
1
1
05.05.2017
5 / 63
Grundlagen der Testtheorie III
Mit Hilfe einer konkreten Stichprobe (x , . . . , xn ) soll eine Entscheidung
darüber getroen werden, ob
1
die Nullhypothese
H0 abgelehnt oder
beibehalten wird.
Dazu wird eine Testgröÿe T benötigt:
T ist eine Statistik, die von einer mathematischen Stichprobe
(X1 , . . . , Xn ) der Grundgesamtheit X abhängt.
T (X1 , . . . , Xn ) ist also eine (reelle) Zufallsgröÿe.
Die Wahl von T erfolgt im allgemeinen so, als wäre der entsprechende
Parameter
γ
zu schätzen.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
6 / 63
Grundlagen der Testtheorie IV
Der Wertebereich von T wird in den kritischen Bereich K und den
Annahmebereich K c (Komplement zu K ) unterteilt.
Die Testentscheidung ndet nach folgenden Regeln statt:
T (x1 , . . . , xn ) ∈ K wird H0 abgelehnt.
T (x1 , . . . , xn ) ∈/ K wird H0 beibehalten
Eine Bestätigung der Nullhypothese bedeutet die zweite Entscheidung,
falls sie getroen würde, jedoch bei Signikanztests nicht.
Da d = 0 ist, kann man beliebig dicht liegende Alternativwerte
angeben.
Für
Für
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
7 / 63
Grundlagen der Testtheorie V
Bei der Durchführung eines statistischen Tests können zwei Sorten von
Fehlern auftreten:
Die richtige Nullhypothese wird abgelehnt (
Fehler 1. Art).
Fehler
Die Nullhypothese wird nicht abgelehnt, obwohl sie falsch ist (
2. Art)
Wir holen jetzt die Festlegung des kritischen Bereichs K nach.
Zu einem vorgegebenen
Signikanzniveau 0 < α < 1 muÿ für K
P γ (T (X1 , . . . , Xn ) ∈ K ) ≤ α
für alle
α
γ ∈ Γ0
eingehalten werden.
kontrolliert somit die Wahrscheinlichkeiten
P γ (T (X1 , . . . , Xn ) ∈ K )
für einen Fehler erster Art.
Man könnte natürlich auch einen kritischen Bereich einfach festlegen.
Dann hat man keinen der beiden möglichen Fehler unter Kontrolle.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
8 / 63
Grundlagen der Testtheorie VI
Beispiel:
12 unabhängige Versuche
entweder mit einem Würfel oder mit einer Münze
Dies ist nicht bekannt!!!!
Ein Erfolg sei entweder das Werfen der Sechs und von Wappen.
Hätten wir höchstens 3 Erfolge, so würde dies gegen die Münze
sprechen.
Mit anderen Worten:
H0 : Verwendung der Münze
gegen H1 : Verwendung des Würfels
Festlegung vonK = {0, 1, 2, 3} als Ablehnungsbereich für H
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
9 / 63
Grundlagen der Testtheorie VII
Beispiel (Fortsetzung):
Betrachtung der absoluten Häugkeit T als Testgröÿe
(binomialverteilt mit n = 12 und p )
Fehler erster Art durch p = und T ≤ 3 beschrieben:
1
2
12
3
α=
1
∑
k= k 2
12
= 7. 2998 × 10−2
0
Fehler zweiter Art durch p =
12
β=
1
6
und T ≥ 4:
k 12−k
12 1
5
∑ k
k =4
6
6
= 0.12518
als Wahrscheinlichkeit für den Fehler zweiter Art.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
10 / 63
Grundlagen der Testtheorie VIII
Die Gütefunktion
G (γ) = P γ (T (X , . . . , Xn ) ∈ K )
1
gibt für jedes γ ∈ Γ die Ablehnungswahrscheinlichkeit für dieses γ an.
Wir nennen dann einen Test unverfälsch, wenn
G (γ) ≥ α
für alle γ ∈ Γ gilt.
Wenn also die Alternativhypothese richtig ist (γ ∈ Γ ), so wird die
Nullhypothese, die ja dann falsch ist, mit gröÿerer Wahrscheinlichkeit
abgelehnt als in Fällen, wo die Nullhypothese (γ ∈ Γ ) richtig ist.
Diese Eigenschaft ist eine Minimalforderung an einen Test.
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
0
Vorlesung 4
05.05.2017
11 / 63
Grundlagen der Testtheorie IX
Beispiel:
Wir nehmen an, daÿ X dichotom sei.
Für K = {n − 1, n} als kritischen Bereich erhalten wir für die mit n
und γ ∈ [0, 1] binomialverteilte Testgröÿe T
G (γ) = Pγ (T ≥ n − 1)
= γ n + nγ n− (1 − γ)
= nγ n− − (n − 1) γ n
1
1
als Gütefunktion.
Für die erste Ableitung gilt
G (γ) = n (n − 1) γ n− − n (n − 1) γ n−
= n (n − 1) γ n− (1 − γ) ≥ 0
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
1
2
Vorlesung 4
05.05.2017
12 / 63
Grundlagen der Testtheorie X
Beispiel (Fortsetzung):
Damit ist G auf dem Denitionsbereich [0, 1] des Parameters γ
monoton wachsend.
Somit existiert zu jedem Signikanzniveau α < 1 ein γ ∈ [0, 1], so daÿ
G (γ ) = α .
1
1
Für γ ≤ γ ist
1
G (γ) ≥ α.
Wenn Γ = [γ , 1] ist der Test mit dem kritischen Bereich K und α
unverfälscht.
1
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
13 / 63
Grundlagen der Testtheorie XI
Der allgemeine Testablauf umfaÿt 7 Punkte, wobei man die ersten vier, die
nächsten zwei und den letzten auch zu drei Schwerpunkten
zusammenfassen kann:
1
Bestimmung der Verteilungsklasse der Grundgesamtheit bzw. des
Wertebereiches des zu testenden Parameters.
2
Formulierung der Hypothesen H und H .
3
Festlegung des Signikanzniveaus α.
4
Festlegung einer Testgröÿe T in Abhängigkeit von einer
mathematischen Stichprobe vom Umfang n mit vollständig bekannter
Verteilung unter der Nullhypothese.
5
Wahl des kritischen Bereiches K unter Beachtung von
0
1
sup Pγ (T (X , . . . , Xn ) ∈ K ) ≤ α .
1
γ∈Γ0
6
7
Berechnung des konkreten Testwertes t = T (x , . . . , xn ) mit Hilfe einer
konkreten Stichprobe.
Anwenden der Entscheidungsregel.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
Vorlesung 4
05.05.2017
14 / 63
Grundlagen der Testtheorie XII
Bei der Abfassung der Hypothesen unterscheidet man zwischen
zweiseitigen und einseitigen Fragestellungen.
Die Formulierung
H0 : γ = γ0 gegen H1 : γ 6= γ0 nennt man die
zweiseitige Fragestellung.
H0 : γ = γ0 gegen H1 : γ > γ0 eine einseitige Fragestellung.
Statt H : γ = γ wird dann oft auch H : γ ≤ γ geschrieben.
Für einseitige Fragestellungen gibt es mehrere Möglichkeiten.
Das folgende Beispiel zeigt, warum eine solche Unterteilung in
zweiseitige und einseitige Fragestellungen sinnvoll sein kann.
Hingegen ist
0
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
0
Vorlesung 4
0
05.05.2017
15 / 63
Grundlagen der Testtheorie XIII
Beispiel:
Füllmenge einer Ware in einer Verpackung, z. B. Waschpulver
Standpunkte:
eines Gesetzgebers, der eine Abfüllordnung festlegt,
eines Verbrauchers
und eines Erzeugers.
Signikanztest: Zweifel an der Nullhypothese
Nullhypothese: aufgedruckte Füllmenge gleich wahre Füllmenge
Die zweiseitige Fragestellung ist für den Gesetzgeber interessant
Verbraucher verwerfen die Nullhypothese, wenn die wahre Füllmenge
deutlich geringer ausfällt.
Erzeuger verwerfen die Nullhypothese hingegen, wenn die wahre
Füllmenge gröÿer als die vorgeschriebene Füllmenge ist, was
verständlich sein dürfte.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
16 / 63
Einstichprobenprobleme I
Probleme, die mit einer normalverteilten Grundgesamtheit X im
Zusammenhang stehen.
Für die beiden Parameter µ und σ gibt es 4 verschiedene
Testsituationen.
Für einen zu testenden Parameter kann der zweite entweder bekannt
oder unbekannt sein.
Das Prüfen des Mittelwertes bei bekannter Varianz nennt man auch
einen einfachen Gauÿtest.
Diese Bezeichnung rührt von der Verteilung der verwendeten
Testgröÿe her.
Testgröÿe - standardisierte Normalverteilung.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
17 / 63
Einstichprobenprobleme II
Der Gauss-Test
X normalverteilte Grundgesamtheit, µ unbekannt, σ = σ bekannt.
(X , . . . , Xn ) Stichprobe vom Umfang n
Nullhypothese: µ = µ
Testgröÿe
X −µ √
T=
n
0
1
0
0
σ0
ist standardnormalverteilt.
Bestimmung des kritischen Wertes kα zum vorgegebenen
Signikanzniveau α aus
Φ (kα ) = 1 −
α
2
Ablehnung der Nullhypothese, wenn der konkrete Testwert
x −µ √
t=
n
0
σ0
die Ungleichung |t | ≥ kα erfüllt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
18 / 63
Einstichprobenprobleme III
Der Gauss-Test, Beispiel
Für ein Sixpack an Getränkeaschen gilt die Norm 500 ± 10.
Ein Stichprobe ergibt die Werte x = 490.
Ist die Norm statistisch gesehen eingehalten?
Testdurchführung:
6
Nullhypothese:
µ = 500
Berechnung der konkreten Testgröÿe
t=
x − µ0 √ 490 − 500 √
n=
6 = −2. 449 5
10
σ0
Bestimmung des kritischen Wertes (kritischer Bereich) für
(falls nicht explizit ein anderes
α = 0.05
α ):
Φ(kα ) = 0.975 =⇒ kα = 1.96
Testentscheidung:
|t | > kα =⇒
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Nullhypothese wird verworfen.
Vorlesung 4
05.05.2017
19 / 63
Einstichprobenprobleme IV
Da man selten eine bekannte Varianz zur Verfügung hat, ist ein Test,
der den Mittelwert bei unbekannter Varianz prüft, von gröÿerer
Bedeutung.
Dieser Test wird einfacher t-Test genannt in Anlehnung an die
Verteilung der Testgröÿe.
Wir betrachten zunächst die möglichen Hypothesen:
H0 : µ = µ0 gegen H1 : µ 6= µ0 bei zweiseitiger Fragestellung und
H0 : µ ≤ µ0 gegen H1 : µ > µ0 bzw. H0 : µ ≥ µ0 gegen H1 : µ < µ0 bei
einseitiger Fragestellung.
µ hat in der Regel die Bedeutung eines Sollwertes bei zweiseitiger
Fragestellung.
Bei einseitiger Fragestellung wird angezweifelt, ob ein Grenzwert über
oder unterschritten wird.
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
20 / 63
Einstichprobenprobleme V
Mit diesem µ und einer mathematischen Stichprobe (X , . . . , Xn ) wird
die Testgröÿe
X −µ √
n
T=
S
gebildet, wobei
1 n
S =
Xk − X
∑
n − 1 k=
0
1
0
2
2
1
T ist mit n − 1 Freiheitsgraden t -verteilt.
Zu vorgebenem Signikanzniveau α werden die drei möglichen
kritischen Bereiche folgendermaÿen bestimmt.
Für die zweiseitige Fragestellung setzt man den kritischen Bereich K
aus zwei Intervallen
K = ]−∞, −c [ ∪ ]c , ∞[
1
1
zusammen, wobei FT ,n− (c ) = 1 − α ist.
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
2
Vorlesung 4
05.05.2017
21 / 63
Einstichprobenprobleme VI
Dabei beachten wir, daÿ FT die Verteilungsfunktion von T ist, die
über eine symmetrische Dichte verfügt.
Den beiden einseitigen Fragestellungen entsprechen dann
K = ]c , ∞[ bzw. K = ]−∞, −c [
2
2
als kritische Bereiche mit FT (c ) = 1 − α , wenn Abweichungen nach
oben bzw. nach unten zur Ablehnung der Nullhypothese führen sollen.
Hinweise für die Abfassung einseitiger Fragestellungen:
2
Wenn konkret
Wenn konkret
x < µ0 , so bestehen Zweifel an µ ≥ µ0
x > µ0 , so bestehen Zweifel an µ ≤ µ0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
22 / 63
Einstichprobenprobleme VII
Beispiel: Die folgenden Daten sind die Dieselpreise in ¿ an 20 freien
Tankstellen in Vorpommern (vor einigen Jahren!) 1,489 1,503 1,488
1,490 1,506 1,510 1,512 1,498 1,499 1,487 1,478 1,490 1,477 1,500
1,504 1,503 1,500 1,488 1,498 1,486. Testen, ob 1,500 der mittlere
Dieselpreis ist!
Vorgehensweise:
Per Hand für die kleine Stichprobe 1,489 1,503 1,488
Für die groÿe Stichprobe mit R-Skript.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
23 / 63
Einstichprobenprobleme VIII
Nullhypothese: µ = 1.5 (µ ) (zweiseitig)
Testgröÿe:
a)
X −µ √
1 n
T=
n mit S =
Xk − X
∑
S
n − 1 k=
0
0
2
2
1
b)
1.489 + 1.503 + 1.488
= 1. 4933
3
1.489 + 1.503 + 1.488
x =
= 2. 2301
3
3
s = x − (x ) = 2.3267 × 10−
2
x=
2
2
2
2
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 4
2
4
05.05.2017
24 / 63
Einstichprobenprobleme IX
Testgröÿe:
c) Dann ist
x −µ √
1. 4933 − 1.5 √
n= √
· 3
s
2. 3267 × 10−
= −0.76079
t=
0
4
Bestimmung des kritischen Wertes aus einer Tafel:
Freiheitsgrad
1
0.975-Quantil
12.706
2
4.302
3
4
5
3.182
2.776
2.570
k = 4.302
Testentscheidung: Wegen |t | < k kann die Nullhypothese nicht
verworfen werden.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
25 / 63
Einstichprobenprobleme mit R I
Testdurchführung mit R:
in der R-Hilfe (Taste F1)
t.test(x, y = NULL, alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...)
RScript:
Einlesen der Daten mit dem c-Operator (Vektor bilden!)
Punkt statt Komma !
t.test mit geeigneten Parametern aufrufen!
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
26 / 63
Einstichprobenprobleme mit R II
x <- c(1.489, 1.503, 1.488, 1.49, 1.506, 1.51, 1.512, 1.498, 1.499, 1.487,
1.49, 1.477, 1.5, 1.504, 1.503, 1.5, 1.488, 1.498, 1.486)
t.test(x, mu = 1.5)
##
##
##
##
##
##
##
##
##
##
##
One Sample t-test
data: x
t = -2.12, df = 19, p-value = 0.04742
alternative hypothesis: true mean is not equal to 1.5
95 percent confidence interval:
1.491 1.500
sample estimates:
mean of x
1.495
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
27 / 63
Einstichprobenprobleme X
Interpretation:
Testwert
p-Wert (für Testentscheidung wichtig)
Angabe der Alternativhypothese
Angabe des 95%-Kondenzintervalls (kann geändert werden!)
Mittelwert der Daten
einseitige Fragestellung?
1.4953
< 1.5,
also Zweifel an
µ ≥ µ0
(Alternative:
µ < µ0 =⇒
Option:
less")
Änderung im R-Skript:
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
28 / 63
Einseitiger Test mit R
t.test(x, mu = 1.5, alternative = "less")
##
##
##
##
##
##
##
##
##
##
##
One Sample t-test
data: x
t = -2.12, df = 19, p-value = 0.02371
alternative hypothesis: true mean is less than 1.5
95 percent confidence interval:
-Inf 1.499
sample estimates:
mean of x
1.495
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
29 / 63
Einstichprobenprobleme XI
Prüfen auf eine bestimmte Varianz σ
Nullhypothese: σ = σ
Testgröÿe:
2
0
2
T=
2
0
2
(n − 1) S 2
1 n
2
mit
S
=
Xk − X
∑
2
n − 1 k =1
σ0
ist unter der Nullhypothese H : σ = σ mit n − 1 Freiheitsgraden
χ -verteilt.
Bestimmung zweier kritischer Werte kα/ und k −α/ mit
0
2
2
0
2
2
F kα/ =
α
und F k
1
2
= 1−
α
2
2
Ablehnung der Nullhypothese, wenn für das konkrete t
2
−α/2
1
t < kα/ oder t > k
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 4
−α/2
1
05.05.2017
30 / 63
Einstichprobenprobleme XII
kleine Dieselpreisstichprobe 1,489 1,503 1,488
Nullhypothese: σ = 0.01,
Signikanzniveau: α = 0.05
Berechnung der Testgröÿe
2
T=
s =
Also
2
3
2
x − (x )
2
2
2
(n − 1) S 2
1 n
2
mit
S
=
Xk − X
∑
2
n − 1 k =1
σ0
t=
= 32 · 2. 2301 − 1. 49332 = 2. 3267 × 10−4
2 · 2. 3267 × 10−
= 4. 6534 × 10−
0.01
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
4
2
Vorlesung 4
05.05.2017
31 / 63
Einstichprobenprobleme XIII
Bestimmung des kritischen Wertes aus einer Tafel der χ -Verteilung:
2
Freiheitgrad q .
q.
1
0.001 5.0238
2
0.0506 7.3777
3
0.2157 9.3484
−
Wegen 4. 6534 × 10 < 0.0506 wird die Nullhypothese abgelehnt.
Test mit R für die groÿe Stichprobe?
Man muÿ sich etwas zusammen basteln!!!
0 025
0 975
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
32 / 63
Test mit R für die groÿe Stichprobe
n <- length(x)
df <- n - 1
sigma2 <- 0.01
t <- sd(x) * sd(x) * (n - 1)/sigma2
pchisq(t, df)
## [1] 1.342e-16
Dieses Mal wird .... ?
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
33 / 63
Zweistichprobenprobleme I
Gleichheit der Varianzen
zwei Grundgesamtheiten X und Y , wobei (X , . . . , Xn1 ) und
(Y , . . . , Yn2 ) zwei mathematische Stichproben vom Umfang n und n
sind
X und Y normalverteilt mit µk und σk für k = 1, 2 verfügen.
Nullhypothese:
1
1
1
2
H0 : σ12 = σ22 gegen die Alternativhypothese H1 : σ12 6= σ22 bei
zweiseitiger Fragestellung
H0 : σ12 ≤ σ22 gegen H1 : σ12 > σ22 bei einseitiger Fragestellung
Die Testgröÿe ist nämlich
S
T = X (SX und SY die Stichprobenvarianzen).
SY
2
2
2
2
Sie ist mit n − 1 und n − 1 Freiheitsgraden F -verteilt ( F-Test)
1
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
34 / 63
Zweistichprobenprobleme II
Gleichheit der Varianzen
Wahl des kritischen Bereiches:
Bei zweiseitiger Fragestellung
K = [0, c1 [ ∪ ]c2 , ∞[
für für das Signikanzniveau
α
FT (c1 ) =
α
und die beiden kritischen Grenzen
und
2
FT (c2 ) = 1 −
α
2
c1 , c2
.
Bei einseitiger Fragestellung
K = ]c , ∞[
mit
F T (c ) = 1 − α
stets wird angenommen: SX ≥ SY (Symmetrie)
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
2
Vorlesung 4
05.05.2017
35 / 63
Zweistichprobenprobleme III
Gleichheit der Varianzen
Beispiel: Vergleich der Varianzen der Kühlschrankpreise, des
Ottoversands für die Herbst-Wintersaison 2011/2012 mit der für die
Frühjahrs-Sommersaison 2010. Für den zuerst genannten Zeitraum
ndet man 549 679 899 899 499 799 769 699 389 449 529 549 599
729 699 und für den zweiten 679 599 549 899 869 799 699 389 499
629 529 899 699 599 899 jeweils in ¿.
kleine Stichproben:
¿
Herbst-Wintersaison 2011/2012: 549, 679, 899, 899,Frühjahrs-Sommersaison 2010: 679, 599, 549,-
¿
Nullhypothese: H : σ = σ gegen die Alternativhypothese
H : σ 6= σ
Berechnung der Testgröÿe
0
1
2
1
2
1
2
2
2
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
S
T = X,
SY
2
2
Vorlesung 4
05.05.2017
36 / 63
Zweistichprobenprobleme IV
Gleichheit der Varianzen
Berechnung der Testgröÿe (Fortsetzung):
Hilfsgröÿe
sx2 :
x=
x2 =
sx2 =
Hilfsgröÿe
549 + 679 + 899 + 899
4
549
2 + 6792 + 8992 + 8992
4
4
3
·
= 756. 5
5
5. 947 1 × 10
= 5. 947 1 × 105
− 756. 52 = 29890.0
sy2 :
y=
679 + 599 + 549
= 609.0
3
y2 =
679
sy2 =
3
2 + 5992 + 5492
3
2
·
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
5
3. 737 5 × 10
Vorlesung 4
= 3. 737 5 × 105
− 609.02 = 4303. 5
05.05.2017
37 / 63
Zweistichprobenprobleme V
Gleichheit der Varianzen
Also:
s
29890.0
t= x =
= 6. 9455
sy
4303. 5
2
2
Bestimmung der kritischen Werte c , c mit Hilfe einer
Verteilungstabelle für 1 − α = 0.975
1
2
2
1
2
3
1
2
3
1 647.8 38.5 17.4
0.0015 0.001 0.001
2 799.5 39.0 16.0
0.025 0.025 0.025
3 864.2 39.16 15.4
0.057 0.062 0.064
Nullhypothese kann nicht verworfen werden.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
38 / 63
Testdurchführung mit R I
Test mit R:
R-Hilfe:
var.test(x, y,ratio = 1, alternative = c("two.sided", "less", "greater"),
conf.level = 0.95, ...)
R-Skript:
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
39 / 63
Testdurchführung mit R II
x <- c(549, 679, 899, 899, 499, 799, 769, 699, 389, 449, 529, 549, 599, 729
699)
y <- c(679, 599, 549, 899, 869, 799, 699, 389, 499, 629, 529, 899, 699, 599
899)
var.test(x, y)
##
##
##
##
##
##
##
##
##
##
##
F test to compare two variances
data: x and y
F = 0.9284, num df = 14, denom df = 14, p-value = 0.8913
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3117 2.7652
sample estimates:
ratio of variances
0.9284
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
40 / 63
Zweistichprobenprobleme VI
Gleichheit der Mittelwerte zweier unabhängiger Grundgesamtheiten
Dabei gibt es drei Verfahren in Abhängigkeit von der Tatsache, ob
beide Varianzen bekannt,
beide unbekannt , aber gleich, oder
beide verschieden und unbekannt sind.
Voraussetzungen:
normalverteilte unabhängige Grundgesamtheiten
X
und
Y
von einander unabhängige mathematische Stichproben
(X1 , . . . , Xn1 )
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
und
Vorlesung 4
(Y1 , . . . , Yn2 )
05.05.2017
41 / 63
Zweistichprobenprobleme VII
Der doppelte Gauÿtest, wenn beide Varianzen bekannt
Nullhypothese H : µ = µ gegen µ 6= µ
Testgröÿe
√
X −Y
T=q
· n n
n σ +n σ
0
1
2
1
2
1
2
2
1
1
2
2
2
ist standardisiert normalverteilt.
Bestimmung des kritischen Werten kα (für α = 0.95) aus einer Tabelle
kα = 1.96
Wenn für den konkreten Testwert t
|t | > kα
wird die Nullhypothese abgelehnt.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
42 / 63
Zweistichprobenprobleme VIII
Der doppelte Gauÿtest, wenn beide Varianzen bekannt
Beispiel: Kühlschrankdatensatz, Varianzen als bekannt angenommen
Nullhypothese: µ = µ gegen µ 6= µ
Berechnung der Testgröÿe:
Wir benutzen R, um die Hilfsgröÿen zu bestimmen. Wir erhalten:
1
2
1
2
x = 649, σ = 24371 und n = 15
y = 682, σ = 26252. und n = 15
2
1
1
2
2
2
Dann
√
x −y
t=q
· n n
n σ +n σ
√
649 − 682
=√
· 15 · 15
15 · 24371 + 15 · 26252
= −0.56805
Wegen |−0.56805| < 1.96 Nullhypothese nicht verworfen.
1
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
1
1
2
2
2
Vorlesung 4
05.05.2017
43 / 63
Zweistichprobenprobleme IX
Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz
Nullhypothese: µ = µ gegen µ 6= µ
Testgröÿe
r
X −Y
nn
T=
S
n +n
unter der Hypothese H : µ = µ bei zweiseitiger Fragestellung bzw.
bei beiden einseitigen Fragestellungen t -verteilt mit n + n − 2
Freiheitsgraden, wobei
(n − 1) SX + (n − 1) SY
S =
n +n −2
die gepoolte Stichprobenvarianz
Ablesen des kritischen Wertes kα zu vorgegebenen Signikanzniveau α
aus einer Tabelle
Ablehnen der Nullhypothese, wenn für den konkreten Testwert t
|t | > kα
1
2
1
2
1
1
0
1
2
2
2
1
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
1
1
Vorlesung 4
2
2
2
2
05.05.2017
44 / 63
Zweistichprobenprobleme X
Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz
Beispiel: In zwei Waldächen wurden 3 bzw. 4 Bäume gefällt, die die
folgenden Festmeter erbrachten:
W1 1,2 1,1 2,0
W2 1,1 1,0 1,5 1,4
Kann man davon ausgehen, daÿ beide Flächen gleich ergiebig sind?
Nullhypothese: µ = µ (mittlere Festmeter sind gleich)
Berechnung der Testgröÿe: (Hilfsgröÿen)
1.2 + 1.1 + 2
x=
= 1. 4333,
3
1.1 + 1 + 1.5 + 1.4
y=
= 1. 25
4
1.2 + 1.1 + 2
= 2. 2167,
x =
3
1.1 + 1 + 1.5 + 1.4
y =
= 1. 605
4
1
2
2
2
2
2
2
2
2
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
45 / 63
Zweistichprobenprobleme XI
Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz
Beispiel Fortsetzung:
Berechnung der Testgröÿe: gepoolte Stichprobenvarianz
3
sX = x − (x )
2
3
= · 2. 2167 − 1. 4333 = 0.24353
2
4
SY = y − (y )
3
4
= · 1. 605 − 1. 25 = 5. 6667 × 10−
3
(n − 1) sX + (n − 1) sY
s =
n +n −2
2 · 0.24353 + 3 · 5. 6667 × 10−
=
3+4−2
= 0.13141.
2
2
2
2
2
2
2
2
2
2
1
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
1
2
2
2
2
2
Vorlesung 4
05.05.2017
46 / 63
Zweistichprobenprobleme XII
Der doppelte t-Test, wenn eine gemeinsame unbekannte Varianz
Beispiel Fortsetzung:
Berechnung der Testgröÿe: (konkreter Testwert)
x −y
nn
t=
s
n +n
r
1. 4333 − 1. 25
12
= √
·
= 0.66205
7
0.13141
r
1
1
2
2
Bestimmung des kritischen Wertes aus einer Tabelle (1 − α/2 = 0.975,
5 Freiheitsgrade:
Freiheitsgrad
1
2
3
4
5
6
7
0.975-Quantil 12.70 4.3 3.18 2.77 2.57 2.44 2.36
Wegen 0.66205 < 2.57 kann die Nullhypothese nicht verworfen
werden.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
47 / 63
Zweistichprobenprobleme XIII
Der Welch-Test, wenn beide Varianzen unbekannt und ungleich
Nullhypothese: µ = µ gegen µ 6= µ (σ 6= σ )
näherungsweise Testgröÿe
1
2
1
2
1
2
2
2
X − Y T=q 2
SX SY2
n1 + n2
ist t -verteilt mit annähernd ν− Freiheitsgraden (Runden!)
s
s
v= x+ y
n n
2
2
1
2
!2
sy /n
sx /n
+
n −1
n −1
2
/
1
1
2
2
2
2 !
2
Rest wie beim doppelten t-Test
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
48 / 63
Zweistichprobenprobleme XIV
Der Welch-Test, wenn beide Varianzen unbekannt und ungleich
Beispiel: Ergiebigkeit von zwei Waldächen
Nullhypothese:
µ1 = µ2
(mittlere Festmeter sind gleich)
n1 = 3, n2 = 4
sx2 = 0.243 53 und sy2 = 5. 666 7 × 10−2
x = 1. 433 3 und y = 1. 25
Berechnung der Testgröÿe:
Testwert:
|x − y |
t = q 2 s2
sx
y
n1 + n2
=q
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
|1. 433 3 − 1. 25|
0.243 53
3
+ 5. 666 74×10
Vorlesung 4
−2
= 0.593 63
05.05.2017
49 / 63
Zweistichprobenprobleme XV
Der Welch-Test, wenn beide Varianzen unbekannt und ungleich
Berechnung der Testgröÿe: (Freiheitsgrade)
s
s
v= x+ y
n n
2
2
1
2
!2
sy /n
sx /n
+
n −1
n −1
2
/
2
2
1
2
2 !
2
0.24353 5. 6667 × 10
+
/
3
4
!
5. 6667 × 10− /4
(0.24353/3)
+
3−1
4−1
−2 2
=
1
2
2
2
= 2.70408
kritischer Wertes aus Tabelle auf Folie 46: k = 3.18
Wegen 0.59363 < 3.18 kann die Nullhypothese nicht verworfen
werden.
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
50 / 63
Testdurchführung mit R (Variante I)
x <- c(1.2, 1.1, 2)
y <- c(1.1, 1, 1.5, 1.4)
t.test(x, y)
##
##
##
##
##
##
##
##
##
##
##
Welch Two Sample t-test
data: x and y
t = 0.5939, df = 2.705, p-value = 0.5985
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.8626 1.2292
sample estimates:
mean of x mean of y
1.433
1.250
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
51 / 63
Testdurchführung mit R (Variante II)
x <- c(1.2, 1.1, 2, 1.1, 1, 1.5, 1.4)
g <- c(rep("I", 3), rep("II", 4))
t.test(x ~ g)
##
##
##
##
##
##
##
##
##
##
##
Welch Two Sample t-test
data: x by g
t = 0.5939, df = 2.705, p-value = 0.5985
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.8626 1.2292
sample estimates:
mean in group I mean in group II
1.433
1.250
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
52 / 63
Zweistichprobenprobleme XVI
Gleichheit der Mittelwerte aus einer verbundenen Stichprobe
verbundenen Stichprobe: die beiden Grundgesamtheiten X und Y
abhängig (matched-pair design)
Nullhypothese: H : µ = µ gegen µ 6= µ
Testgröÿe:
0
1
2
1
2
Zum Testen der Nullhypothese wird die Zufallsgröÿe
gebildet.
mathematische Stichprobe
(D1 , . . . , Dn )
D = X −Y
und als Testgröÿe
D√
n,
SD
T=
n − 1 Freiheitsgraden t -verteilt ist.
Bestimmung des kritischen Wertes k −α/ mit FT ,n− k
Bei |t | > k −α/ Ablehnung der Nullhypothese
die mit
1
1
2
1
−α/2
1
= 1 − α2
2
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
53 / 63
Zweistichprobenprobleme XVII
Gleichheit der Mittelwerte aus einer verbundenen Stichprobe
Beispiel: Gegeben
x 1.1 1.1 1
y 1 1.2 1.1
Sind die beiden (theoretischen) Mittelwerte gleich?
Nullhypothese: µ = µ gegen µ 6= µ
Berechnung des Testwertes: d 0.1 −0.1 −0.1
1
d =−
1
30
und d =
2
1
2
100
1
1
: sd = ·
2
3
2
2
1
1
− − 30
100
2 = 0.013333
√
Es ist T = √ .− 30 · 3 = −0.50001
Bestimmung des kritischen Wertes aus einer Tabelle:
0 013333
Freiheitsgrad
1
2
3
0.975-Quantil 12.70 4.3 3.18
Nullhypothese nicht verwerfen
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
54 / 63
Testdurchführung mit R
x <- c(1.2, 1.1, 1)
y <- c(1, 1.2, 1.1)
t.test(x, y, paired = TRUE)
##
##
##
##
##
##
##
##
##
##
##
Paired t-test
data: x and y
t = 0, df = 2, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.4303 0.4303
sample estimates:
mean of the differences
0
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
55 / 63
Regeln für Ereignisse und Wahrscheinlichkeiten
Gegeben seien:
Ω
Σ
eine nichtleere Menge von Elementarereignissen
eine sogenannte
σ -Algebra
von Ereignissen
P ein Wahrscheinlichkeitsmaÿ.
Eigenschaften von Σ:
Ω ∈ Σ (das sichere Ereignis)
A ∈ Σ, dann auch Ac ∈ Σ (gegenteilige
A, B ∈ Σ, dann auch A ∪ B ∈ Σ
Ereignis)
Für P gilt:
P (Ω) = 1 (Normierungsbedingung)
Additivitätsaxiom: A, B ∈ Σ, A ∩ B = ∅ (gegenseitiger Ausschluss):
P (A ∪ B ) = P (A) + P (B ).
P (A) = 1 − P (A).
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
56 / 63
Beispielaufgabe
Wie groÿ ist die Wahrscheinlichkeit bei 5 Würfen mindesten eine 6 zu
werfen?
Lösung:
E - Ereignis mindestens eine 6 in 5 Würfen
E - Ereignis keine 6 in 5 Würfen
Es gilt (Würfe sind unabhängige Ereignisse):
p E =
5
6
5
Folglich
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
P (E ) = 1 − P (E )
5
= 1−
6
= 0.59812.
5
Vorlesung 4
05.05.2017
57 / 63
Diskrete Wahrscheinlichkeitsräume
Ω = {ω1 , . . . , ωn }
Σ = ℘(Ω)
∑ni=1 pi = 1: p ({ωi }) = pi
und
analog Ω = {ω , . . . , ωn , . . .} mit einer unendliche Folge von
Elementarereignissen
Beispiel:
( Bis zum ersten Mal eine
) Sechs fällt:
1
Ω=
6, 66, 666, . . . , 66
. . 66}, . . .
| .{z
Dann wäre
n
n−1
5
1
·
p 66 . . . 66 =
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
6
Vorlesung 4
6
05.05.2017
58 / 63
Der Begri der bedingten Wahrscheinlichkeit
Beispielaufgabe
An einer Tagung nehmen Männer und Frauen, die sich zum Frühstück
entweder Kae oder Tee bestellen:
Kaee Tee
weiblich
10
20 . . .
männlich
30
20 . . .
...
...
...
a) Ergänzen Sie obige Tabelle!
b) Wie groÿ ist die Wahrscheinlichkeit, daÿ ein weiblicher Gast,
der zum Frühstück kommt, Tee trinkt?
c) Wie groÿ ist die Wahrscheinlichkeit, daÿ ein Kaetrinker ein
Mann ist?
d) Sind die Merkmale Geschlecht des Tagungsteilnehmers und
Getränkewahl unabhängig?
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
59 / 63
Rechenregeln für bedingte Wahrscheinlichkeiten
Pfadregel
E1 , E2 , . . . , En beliebige Ereignisse
P (E1 ) > 0, P (E1 ∩ E2 ) > 0, . . . , P (E1 ∩ E2 ∩ . . . ∩ En−1 ) > 0
P (E1 ∩ . . . ∩ En ) =
P (E1 ) P (E2 |E1 ) P (E3 |E1 ∩ E2 ) · . . . · P (En |E1 ∩ E2 ∩ . . . ∩ En−1 )
Formel von der totalen Wahrscheinlichkeit
vollständiges Ereignissystem: E1 , . . . , En für n ∈ N , n ≥ 2
P (E ) = ∑ni=1 P (Ei ) · P (E |Ei )
Satz von Bayes
vollständiges Ereignissystem: E1 , . . . , En für n ∈ N , n ≥ 2
E irgendein Ereignis mit P (E ) > 0
Dann gilt:
P (E ) · P (E |Ei )
P (Ei |E ) = n i
∑j =1 P (Ej ) · P (E |Ej )
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
60 / 63
Die 1. Mittelwertsregel für stochastische Graphen
Zustandmenge aus inneren und Randzuständen
Vorgabe einer Zielmenge Z ⊂ R
1. Mittelwertsregel stochastische Graphen: pi Wahrscheinlichkeit bei Start
in i in nach Z zu gelangen:
Für i ∈ Z gilt pi = 1 und für i ∈ R \ Z hat man pi = 0
i ∈ I (innerer Zustand):
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
n
pi = ∑ pij · pj .
j =1
Vorlesung 4
05.05.2017
61 / 63
Beispiel I
Lernfähigkeit von Insekten:
Insekten haben die Möglichkeit entweder nach links bis zum Gift zu
gelangen oder nach rechts bis zum Nektar.
Gesucht wird die Wahrscheinlichkeit p
vom Nest aus zum Nektar zu
gelangen.
Bezeichnungen:
p nach rechts, q nach links, p + q = 1
p , p , p , p und p
Absorptionswahrscheinlichkeiten bei
Start in den zugehörigen Zuständen
Nest
Nest
Gift
L
R
Nektar
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
Vorlesung 4
05.05.2017
62 / 63
Beispiel II
Gleichungen:
p = 0, p
Gift
Nektar
=1
p
p = p·p
= q ·p +p·p
pR = p + q · p
L
Nest
Nest
L
R
Nest
Durch Einsetzen:
p
p
(1 − 2pq ) p
Nest
= q · p · pNest + p · (p + q · pNest )
Nest
= 2pqpNest + p 2
Nest
= p2
p
Nest
p
p
=
.
(1 − 2pq ) 2p − 2p + 1
2
2
=
Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.)
2
Vorlesung 4
05.05.2017
63 / 63
Herunterladen