1 Wichtige Begriffe 2 Diskrete Zufallsvariable 3 Binomialverteilung

Werbung
Wahrscheinlichkeitsbe-
σ[aX+b] =
Var[aX + b] =
PrdisV (X < xk ) = F(xk−1 )
Eine Zufallsvariable X ist eine Zuordnungsvorschrift, die jedem möglichen Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet
X: Ω →
R
ω 7→ X(ω)
A oder A heisst A ∪ B mit Pr(A ∪ B) = Pr(A) + Pr(B),
falls A und B stochastich unabhängig
PrdisV (X > xk ) = 1 − F(xk )
Verteilungsfunktion



0,
x ≤ x0




F(x) = 
F(x
),
x
i−1
i−1 ≤ x < xi ; i = 1, . . . ; n




 1,
x ≥ xn
PrdisV (xi < X ≤ x j ) = F(x j ) − F(xi )
PrdisV (xi ≤ X ≤ x j ) = F(x j ) − F(xi−1 )
PrdisV (xi ≤ X < x j ) = F(x j−1 ) − F(xi−1 )
F(x)
X ist weniger als x heisst X < x
PrdisV (|X − a| ≤ b) = PrdisV (a − b ≤ X ≤ a + b)
1
X ist mehr als x heisst X > x
PrdisV (|X − a| < b) = PrdisV (a − b < X < a + b)
PrdisV (|X − a| ≥ b) = 1 − PrdisV (|X − a| ≤ b − 1)
X ist mindestens x heisst X ≥ x
a2 Var[X] = |a|σ[X]
Var[X] = σ2 [X]
PrdisV (xi < X < x j ) = F(x j−1 ) − F(xi )
A und A heisst A ∩ B mit Pr(A ∩ B) = Pr(A) ∗ Pr(B)
p
E[|X − E[X]|] ≤ σ[X]
PrdisV (X ≥ xk ) = 1 − F(xk−1 )
Ereignismenge Ω
F(x1 )
PrdisV (|X − a| > b) = 1 − PrdisV (|X − a| ≤ b)
=
P
xk fdisV (xk )
=
k
F(x0 )
k
Diskrete Zufallsvariable
P
Varianz Var[X] =
(xk − E[X])2 fdisV (xk )
k
P
(xk − E[X])2 PrdisV (X = xk )
=
xk
x
xn
Gegenereignis A mit Pr(A) = 1 − Pr(A)
Erwartungswert E[X]
P
xk PrdisV (X = xk )
x0
X ist höchstens x heisst X ≤ x
2
√
x1
Der
griff
E[aX + b] = aE[X] + b
fdisV (xk ) = PrdisV (X = xk ) mit
P
fdisV (xk ) = 1
k
Var[X] = E[X 2 ] − (E[X])2
fdisV (xk ) ≥ 0
2
Die Verteilung einer diskreten Zufallsvariable X
sei ((xk , PrdisV (X = xk ))|k = 1, 2, . . . ) mit xk < xk+1
FdisV (xk ) = PrdisV (X ≤ xk ) =
P
i≤k
f (xi )
3
Var[X] = E[(X − a) ] − (E[X] − a)
Binomialverteilung
2
fBin(n,p) (k) = PrBin(n,p) (X = k) =
2
Var[aX + b] = a Var[X]
Standardabweichung σ[X] =
√
Var[X]
n
k
pk (1 − p)n−k
E[X] = np
Var[X] = np(1 − p)
1
PrdisV (X ≤ xk ) = F(xk )
Abbildung 2.1: Graph der Verteilungsfunktion
Var[X] ≥ 0
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
1
4
j=0
j
j
p (1 − p)
n− j
F Poi(λ) (k) = PrPoi(λ) (X ≤ k) =
Die geometrische Verteilung
1
p
Var[X] =
1− p
p2
fDiG(a;d;n) (xk ) = PrDiG(a;d;n) (X = xk ) =
a + dk; k = 0, 1, 2, . . . , n
Var[X] =
Als Verteilungsfunktion einer stetigen Zufallsvariable bezeichnet man die Beziehung
=
F steV (x) = Pr steV (X ≤ x) =
xk − a + d
d(n + 1)
F DiG(a;d;n) (Rg(k)) = PrDiG(a;d;n) (Rg(X) ≤ k) =
k+1
n+1
E[X] =
+∞
R
−∞
f steV (t)dt
E[X] =
λk −λ
k! e ,
−∞
t fS eG(a,b) (t)dt =
9
a+b
2
+∞
R
−∞
+∞
R
(t − E[X])2 fS eG(a,b) (t)dt =
(b−a)2
12
Allgemeine Normal–
Gauss–Verteilung
E[aX + b] = aE[X] + b
Var[X] =≥ 0
F Nor(µ,σ2 ) (x) = PrNor(µ,σ2 ) (X ≤ x)
−∞
Var[X] =
wobei λ > 0
+∞
R
Var[X] =
t f steV (t)dt
a≤x≤b
sonst
(x − µ)2
−
1
fNor(µ,σ2 ) (x) := √ · e 2σ2 ; x ∈ R
σ 2π
Var[X] =
Poisson Verteilung
(t − E[X])2 f steV (t)dt
+∞
R
2
2
2
t f steV (t)dt−(E[X]) = E[X ]−(E[X])
−∞
Var[aX + b] = a2 Var[X]
√
σ[X] = Var[X]
2
X ∼ Nor(µ, σ2 ) ⇒ Z =
X−µ
σ
oder
∼ Nor(0, 1)
PrNor(µ,σ2 ) (a ≤ X ≤ b) = PrNor(0,1) ( a−µ
σ ≤Z ≤
b−µ
σ )
≤ Z ≤
PrNor(µ,σ2 ) (|X − a| ≤ b) = PrNor(0,1) ( a−b−µ
σ
a+b−µ
σ )
2
Var[X] = λ
t=x
R
a2 Var[X] = |a|σ[X]



0,
x<a



 x−a
FS eG(a,b) (x) = 

b−a , a ≤ x < b



 1,
x≥b
−∞
Pr steV (X ≥ a) = 1 − F steV (a)
d 2 n(n+2)
12
E[X] = λ
f steV (t)dt = 1
d.h. die Gesamtfläche zwischen x–Achse und der
Dichte f steV (x) ist gleich 1.
1
n+1 , xk
p
Rechteckverteilung bzw. stetige Gleichverteilung


1

,
 b−a
fS eG(a,b) (x) = 

 0,
−∞
k
dn
2
fPoi(λ) (k) = PrPoi(λ) (X = k) =
8
Pr steV (a ≤ X ≤ b) = F steV (b) − F steV (a)
F DiG(a;d;n) (xk ) = PrDiG(a;d;n) (X ≤ xk ) =
6
+∞
R
Var[aX + b] =
E[|X − E[X]|] ≤ σ[X]
Die Funktion f steV (x) heisst Dichtefunktion (oder
Wahrscheinlichkeitsdichte) von X.
Normierungseigenschaft:
Diskrete Gleichverteilung
E[X] = a +
λ −λ
j! e
Nichtnegativität: f steV (x) ≥ 0 für alle x ∈ R
FGeo(p) (k) = PrGeo(p) (X ≤ k) = 1 − (1 − p)
5
j=0
√
j
7 Stetige Zufallsvariable
fGeo(p) (k) = PrGeo(p) (X = k) = (1 − p)k−1 p; k =
1, 2, 3, . . .
E[X] =
k
P
σ[aX+b] =
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
F Bin(n,p) (k) = PrBin(n,p) (X ≤ k) =
k P
n
F Nor(µ,σ2 ) (x) = F Nor(0,1) ( x−µ
σ )
10 Test auf µ unter Normalverteilung bei bekannter Varianz
11 Test auf µ unter Normalverteilung bei unbekannter Varianz
x(Nor(µ, σ2 ), π) = σ · x(Nor(0, 1), π) + µ
PrNor(0,1) (Z ≤ z) = π ⇒ z = x(Nor(0, 1), π)
Modell
Signifikanz
niveau
α
Stichprobe
n Werte, x1 , x2 , . . . , xn
Stichprobenmittel
wert
Hypothesen
Teststatistik
Quantil
.
Xi ∼ Nor(µ, σ2 ) für i = 1, . . . , n
H0
ablehnen,
wenn
X=
n
P
i=1
n
Xi ∼ Nor(µ, σ2 ) für i = 1, . . . , n
Signifikanz
niveau
α
Stichprobe
n Werte, x1 , x2 , . . . , xn
n
P
xi
i=1
xi
2
∼ Nor(µ0 , σn )
H0 : µ ≤ µ0
H0 : µ = µ0
H0 : µ ≥ µ0
H1 : µ > µ0
H1 : µ , µ0
H1 : µ < µ0
Zbere =
Modell
X − µ0
Hypothesen
Teststatistik
∼ Nor(0, 1)
x(Nor(0, 1),
1 − α)
σ
√
n
x(Nor(0, 1),
1 − α2 )
x(Nor(0, 1),
1 − α)
Zbere
>
x(Nor(0, 1),
1 − α)
|Zbere |
>
x(Nor(0, 1),
1 − α2 )
Zbere
<
−x(Nor(0, 1),
1 − α)
Quantil
.
H0
ablehnen,
wenn
e
s=
X=
n
v
u
u
n
tP
(xi − X)2
i=1
n−1
H0 : µ ≤ µ0
H0 : µ = µ0
H0 : µ ≥ µ0
H1 : µ > µ0
H1 : µ , µ0
H1 : µ < µ0
T bere =
X − µ0
x(T (n
−
1), 1 − α)
∼ T (n − 1)
e
s
√
n
x(T (n
− x(T (n
−
1), 1 − α2 )
1), 1 − α)
T bere
>
x(T (n
−
1), 1 − α)
|T bere|
>
x(T (n
−
1), 1 − α2 )
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
PrNor(µ,σ2 ) (|X − a| ≥ b) = 1 − PrNor(0,1) ( a−b−µ
≤
σ
Z ≤ a+b−µ
)
σ
T bere
<
−x(T (n −
1), 1 − α)
3
Modell
2
Xi ∼ Nor(µ, σ ) für i = 1, . . . , n
Signifikanz
niveau
α
Versuche
n
Erfolge
k
geschätztes
Hypothesen
Teststatistik
Quantil
.
H0
ablehnen,
wenn
b
p=
· √
n−1
q
xi
√
e
s·
n−1
x(χ2 (n − 1), α2 )
k
n
H0 : p ≥ p 0
H1 : p > p 0
H1 : p , p 0
H1 : p < p 0
∼ Nor(0, 1)
x(Nor(0, 1),
1 − α)
σ
√
n
x(Nor(0, 1),
1 − α2 )
x(Nor(0, 1),
1 − α)
Zbere
>
x(Nor(0, 1),
1 − α)
|Zbere |
>
x(Nor(0, 1),
1 − α2 )
Zbere
<
−x(Nor(0, 1),
1 − α)
13 Konfidenzintervall für den
Erwartungswert unter Normalverteilung Bei unbekannter Varianz
1 − α–Konfidenzintervall I1−α = [Iunten ; Ioben ]
√
n−1
x(χ2 (n − 1), 1 − α2 )
15 Chi Quadrat Unabhängigkeitstest
Länge des 1 − α–Konfidenzintervalls L1−α
e
s
2 · x(T (n − 1), 1 − α2 ) · √
n−1
=
14 Konfidenzintervall für die
Standardabweichung unter
Normalverteilung bei unbekanntem Erwartungswert
1 − α–Konfidenzintervall I1−α = [Iunten ; Ioben ]
√
e
s· n−1
Iunten = q
x(χ2 (n − 1), 1 − α2 )
√
e
s· n−1
Ioben = q
x(χ2 (n − 1), α2 )
n
P
xi
i=1
Mittelwert X =
n
Sicherheitswahrscheinlichkeit γ = 1 − α
v
u
u
n
tP
(xi − X)2
i=1
e
s=
n−1
Länge des 1 − α–Konfidenzintervalls L1−α
j=1
Y1
...
...
j=m
Ym
Σ
i=1
..
.
X1
..
.
a1,1
..
.
...
..
.
a1,m
..
.
a1,•
.
..
.
i=n
Xn
an,1
...
an,m
an,•
Σ
a•,1
...
a•,m
a•,•
H0 : X und Y sind unabhängig
H1 : X und Y sind abhängig
absolute Häufigkeit ai, j
erwartete Häufigkeit ei, j
ei, j =
ai,• · a•, j
a•,•
Bedingung ei, j > 5 für alle i und j
Test-statistik: Xbere =
n P
m (ai, j − ei, j )2
P
ei, j
i=1 j=1
α sonst α = 0.05
Der kritischer Wert x(χ2 ((n − 1) · (m − 1)); 1 − α) ist
aus einem Tafelwerk abzulesen
falls Xbere > x(χ2 ((n − 1) · (m − 1)); 1 − α), ist
H0 auf dem α–Signifikanzniveau abzulehnen
=
4
e
s
Iunten = X − x(T (n − 1), 1 − α2 ) · √
n−1
− q
e
s·
i=1
Sicherheitswahrscheinlichkeit γ = 1 − α
H0 : p = p 0
b
p − p0
n
P
e
s
Mittelwert X =
n
v
u
u
n
tP
(xi − X)2
i=1
e
s=
n−1
H0 : p ≤ p 0
Zbere =
Ioben = X + x(T (n − 1), 1 −
α
2)
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
12 Test für einen Anteilswert p
Das einfache zentrale Schwankungsintervall ist
[µ − σ; µ + σ]
a=
pi gegeben bzw. gerechnet
b
p gegeben bzw. geschätzt b
p=
absolute Häufigkeit ai
erwartete Häufigkeit ei = api
ei > 1 für alle i und ei > 5 für mindestens 80%
alle i, sonst Nachbarklassen zusammenfassen
Das dreifache zentrale Schwankungsintervall ist
[µ − 3σ; µ + 3σ]
H0 : Pr(xi ) = pi für alle i
• im Intervall [µ − 3σ; µ + 3σ] mindestens 89%
Der kritischer Wert x(χ2 (n − 1); 1 − α) ist aus einem Tafelwerk abzulesen
i
xi
ai
pi
ei
1
x1
a1
p1
e1
2
..
.
x2
..
.
a2
..
.
p2
..
.
e2
..
.
n−1
xn−1
an−1
pn−1
en−1
xn
an
pn = 1 + p1 -. . . -pn−1
en
a
1
a
n
.
Σ
i=1
absolute Häufigkeit ai
H1 : Es liegt nicht eine Diskrete Gleichverteilung
vor
Test-statistik: Xbere =
n (ai − ei )2
P
ei
i=1
α sonst α = 0.05
Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus
einem Tafelwerk abzulesen
18 Chi Anpassungstest für die
Wahrscheinlichkeiten einer
Diskrete Gleichverteilung
i
xi
ai
pi
ei
1
x1
a1
p1
e1
2
..
.
x2
..
.
a2
..
.
p2
..
.
e2
..
.
n−1
xn−1
an−1
pn−1
en−1
xn
an
pn
en
a
1
a
n
ai
Anzahl der geschätzten Parameter m
Σ
falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf
dem α–Signifikanzniveau abzulehnen
.
5
a=
n
P
2
falls Xbere > x(χ (n − 1); 1 − α), ist H0 auf dem
α–Signifikanzniveau abzulehnen
17 Chi Anpassungstest für diskreten Wahrscheinlichkeiten
pi = b
p
H0 : Es liegt eine Diskrete Gleichverteilung vor
α sonst α = 0.05
aller xi –Werte zu erwarten
n
ei > 1 für alle i und ei > 5 für mindestens 80%
alle i, sonst Nachbarklassen zusammenfassen
n (ai − ei )2
P
=
ei
i=1
• im Intervall [µ − 2σ; µ + 2σ] mindestens 75%
• im Intervall [µ − 4σ; µ + 4σ] mindestens
93.75%
1
erwartete Häufigkeit ei = api
H1 : Pr(x j ) , p j für mindestens ein j
Test-statistik: Xbere
ai
i=1
Das zweifache zentrale Schwankungsintervall ist
[µ − 2σ; µ + 2σ]
Bei jeder Zufallsvariable X sind wegen Pr(|X −
1
E[X]| ≥ kσ[X]) ≤ 2
k
n
P
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
16 zentrale Schwankungsintervall
i
ai
pi
ei
1
a1
p1
e1
2
..
.
a2
..
.
p2
..
.
e2
..
.
n−1
an−1
pn−1
en−1
>n
..
.
an
..
.
pn = 1 - p1 -. . . -pn−1
..
.
en
..
.
Σ
a
1
a
a=
X=
n
P
iai
i=1
a
b
p gegeben bzw. geschätzt b
p=
n (ai − ei )2
P
ei
i=1
absolute Häufigkeit ai
erwartete Häufigkeit ei = api
α sonst α = 0.05
Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus
einem Tafelwerk abzulesen
ei > 1 für alle i und ei > 5 für mindestens 80%
alle i, sonst Nachbarklassen zusammenfassen
falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf
dem α–Signifikanzniveau abzulehnen
H0 : Es liegt eine Binomialverteilung vor
.
ai
i=1
n
P
Test-statistik: Xbere =
1
X
pi = PrGeo(bp) (X = i) für i < n
Anzahl der geschätzten Parameter m
absolute Häufigkeit ai
Test-statistik: Xbere =
20 Chi Anpassungstest für die
Wahrscheinlichkeiten einer
Binomialverteilung
i
ai
pi
ei
0
a0
p0
e0
1
a1
p1
e1
2
..
.
a2
..
.
p2
..
.
e2
..
.
n−1
an−1
pn−1
en−1
n
an
pn = 1 - p1 -. . . -pn−1
en
Σ
a
1
a
a=
erwartete Häufigkeit ei = api
ei > 1 für alle i und ei > 5 für mindestens 80%
alle i, sonst Nachbarklassen zusammenfassen
H0 : Es liegt eine Geometrische Verteilung vor
X=
n
P
ai
i=0
n
P
iai
i=0
a
b
p gegeben bzw. geschätzt b
p=
X
n
pi = PrBin(n,bp) (X = i) für i < n
H1 : Es liegt nicht eine Geometrische Verteilung
vor
H1 : Es liegt nicht eine Binomialverteilung vor
Anzahl der geschätzten Parameter m
n (ai − ei )2
P
ei
i=0
α sonst α = 0.05
Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus
einem Tafelwerk abzulesen
falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf
dem α–Signifikanzniveau abzulehnen
.
21 Chi Anpassungstest für die
Wahrscheinlichkeiten einer
Poissonverteilung
ai
pi
ei
0
a0
p0
e0
1
a1
p1
e1
2
..
.
a2
..
.
p2
..
.
e2
..
.
n−1
an−1
pn−1
en−1
>n
..
.
an
..
.
pn = 1 - p1 -. . . -pn−1
...
en
..
.
Σ
a
1
a
.
6
i
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
19 Chi Anpassungstest für die
Wahrscheinlichkeiten einer
Geometrische Verteilung
X=
n
P
22 Chi Anpassungstest für die
Wahrscheinlichkeiten einer
Normalverteilung
ai
i=0
n
P
iai
i=0
a



F Nor(bµ,bσ2 ) (x1 )
,i = 1




pi = 
F Nor(bµ,bσ2 ) (xi ) − F Nor(bµ,bσ2 ) (xi−1 ) , 1 < i < n





1 − p1 − · · · − pn−1
,i = n
b
λ gegeben bzw. geschätzt b
λ=X
i
Klassen
ai
pi
ei
Anzahl der geschätzten Parameter m
1
a1
p1
e1
absolute Häufigkeit ai
Anzahl der geschätzten Parameter m
2
..
.
] − ∞, x1 ]
]x1 , x2 ]
..
.
a2
..
.
p2
..
.
e2
..
.
]xn−2 , xn−1 ]
an−1
pn−1
en−1
]xn−1 , +∞[
an
pn
en
a
1
a
pi = PrPoi(bλ) (X = i) für i < n
absolute Häufigkeit ai
erwartete Häufigkeit ei = api
n−1
n
Σ
ei > 1 für alle i und ei > 5 für mindestens 80%
alle i, sonst Nachbarklassen zusammenfassen
H0 : Es liegt eine Poissonverteilung vor
H1 : Es liegt nicht eine Poissonverteilung vor
Test-statistik: Xbere
n (ai − ei )2
P
=
ei
i=0
a=
2
falls Xbere > x(χ (n − 1 − m); 1 − α), ist H0 auf
dem α–Signifikanzniveau abzulehnen
erwartete Häufigkeit ei = api
ei > 1 für alle i und ei > 5 für mindestens 80%
alle i, sonst Nachbarklassen zusammenfassen
H0 : Es liegt eine Normalverteilung vor
H1 : Es liegt nicht eine Normalverteilung vor
ai
i=1



x1




Klassenmitte ci = 
0.5(xi + xi−1 )





xn−1
α sonst α = 0.05
Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus
einem Tafelwerk abzulesen
n
P
.
X=
n
P
,i = 1
,1 < i < n
,i = n
Test-statistik: Xbere =
n (ai − ei )2
P
ei
i=1
α sonst α = 0.05
Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus
einem Tafelwerk abzulesen
ci a i
i=1
falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf
dem α–Signifikanzniveau abzulehnen
a
b
µ gegeben bzw. geschätzt b
µ=X
v
u
u
n
tP
b
σ gegeben bzw. geschätzt b
σ=
(ci − b
µ)2 ai
i=1
Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected]
a=
a
7
Herunterladen