Formeln Wht - Hochschule Bochum

Werbung
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Kombinatorik
Satz:
Eine Anordnung von n Elementen heißt Permutation. Die Anzahl der Permutationen von n
Satz:
verschiedenen Elementen ist n!
d.h.: Bei einer Gesamtheit von n verschiedenen Elementen gibt es n!
Anordnungsmöglichkeiten in einer Reihe.
Die Anzahl der Permutationen von n Elementen, von denen jeweils n1, …, nk Elemente
ununterscheidbar sind, ist
n!
n1!⋅n 2 !⋅....n k !
Satz:
Die Anzahl der Variationen von n Elementen zur k-ten Klasse mit Wiederholung bzw.
Satz:
Zurücklegen ist n
d.h.: Einer Gesamtheit von n Elementen kann man nk geordnete Stichproben mit
Wiederholung bzw. Zurücklegen vom Umfang k entnehmen.
Es sei k ≤ n. Die Anzahl der Variationen von n Elementen zur k-ten Klasse ohne
k
Wiederholung bzw. Zurücklegen ist
n!
(n − k )!
n!
geordnete
( n − k )!
d.h.: Einer Gesamtheit von n verschiedenen Elementen kann man
Satz:
Stichproben ohne Wiederholung bzw. Zurücklegen vom Umfang k entnehmen.
Es sei k ≤ n. Die Anzahl der Kombinationen von n Elementen zur k-ten Klasse ohne
Wiederholung bzw. ohne Zurücklegen ist (sprich: „n über k“).
n
n!
Diese Formel heißt auch Binomialkoeffizient.   =
 k  k!(n − k )!
n
n!
d.h.: Einer Gesamtheit von n verschiedenen Elementen kann man   =
 k  k!( n − k )!
 
ungeordnete Stichproben ohne Wiederholung bzw. Zurücklegen vom Umfang k
entnehmen.
Wahrscheinlichkeitsrechnung
Klassische Definition der Wahrscheinlichkeit:
P( A) =
Anzahl der für A günstigen Fälle
Anzahl aller gleichmöglichen Fälle
Additionssatz der Wahrscheinlichkeitsrechnung:
Die Wahrscheinlichkeit der Vereinigung von mehreren Ereignissen, die einander gegenseitig
ausschließen, d.h. die unabhängig sind, ist die Summe der Einzelwahrscheinlichkeiten.
A∪B Menge alle Ereignisse, die zu A oder B gehören.
Durchschnitt zweier Ereignisse:
Die Wahrscheinlichkeit des Durchschnitts von mehreren Ereignissen, die sich gegenseitig
ausschließen, d.h. die unabhängig sind, ist gleich dem Produkt der
Einzelwahrscheinlichkeiten.
A∩B Menge aller Ereignisse, die zu A und zu B gehören.
P(A∩B)=P(A)*P(B)
Additionssatz der Wahrscheinlichkeitsrechnung, wenn sich die Ereignisse nicht gegenseitig ausschließen,
d.h. bei abhängigen Ereignissen:
P(A∪B)=P(A)+ P(B) – P(A∩B), A∩B≠∅ (leere Menge)
Die Elemente in der Schnittmenge dürfen nicht doppelt erfasst werden.
P(„gerade“ oder „größer gleich 3“)=
1 2 1 5
+ − =
2 3 3 6
Komplementärereignis:
Ein zum Ereignis A komplementäres Ereignis
P( A )=1-P(A)
A tritt genau dann ein, wenn A nicht eintritt.
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Zufallsvariablen
Analogie zwischen der Zufallsvariablen X und dem Merkmal/Variable X aus der deskriptiven Statistik :
Zufallsvariable X
Merkmal X
Realisation x
Merkmalsausprägung/Merkmalswert x
Wahrscheinlichkeit
Relative Häufigkeit
Wahrscheinlichkeitsfunktion bei diskreten ZV bzw.
Relative Häufigkeitsverteilung
Dichtefunktion bei stetigen ZV
Verteilungsfunktion
Kumulierte relative Häufigkeitsverteilung
Erwartungswert
Arithmetisches Mittel
Varianz
Varianz
Diskrete und stetige ZV
Wahrscheinlichkeitsfunktion (GENAU-Aussagen): P(X=xi)=f(xi) und
wenn es n verschiedene
n
Realisationen für die ZV gibt, gilt:
∑ f (x ) = 1
i
i =1
Verteilungsfunktion (HÖCHSTENS-Aussagen) F(x)=P(X≤x)
Es gilt: F(x)=
∑ f ( x ) = ∑ P( X = x )
i
xi ≤ x
i
xi ≤ x
Die Wahrscheinlichkeitsfunktion einer stetigen ZV heißt Dichtefunktion
Eigenschaften der Dichtefunktion:
∞
f(x)≥0 und
∫
b
f ( x )dx = 1 , P( a ≤ X ≤ b) = ∫ f ( x )dx ,
−∞
a
Die Wahrscheinlichkeit, dass bei einer stetigen ZV ein ganz spezieller Wert angenommen
wird, ist 0, P(X=x)=0.
Eigenschaften der Verteilungsfunktion:
Die Ableitung der Verteilungsfunktion ist die Dichtefunktion, F ' ( x ) = f ( x ) . Das
Integral (Aufleitung) der Dichtefunktion ist die Verteilungsfunktion,
x
F ( x ) = P( X ≤ x ) =
∫ f (v)dv
−∞
0≤F(x)≤1
P( X ≤ a ) = F ( a ) und P( X ≤ b ) = F (b ) und
P(a≤X≤b)
Erwartungswert E(X) oder µ:
=P(X≤b)- P(X≤a)=F(b)-F(a)
n
E ( X ) = µ = ∑ xi f ( xi ) für diskrete ZV.
i =1
∞
E( X ) = µ =
∫ x ⋅ f ( x )dx für stetige ZV.
−∞
Varianz σ2
n
Var ( X ) = σ 2 = ∑ [ xi − E ( X )]2 f ( xi ) für diskrete ZV
i =1
∞
Var ( X ) = σ 2 =
∫x
2
⋅ f ( x )dx − [ E ( X )]2 für stetige ZV.
−∞
Binomialverteilung
Die Wahrscheinlichkeit, dass ein Ereignis bei einem einmaligen Versuch mit der Wahrscheinlichkeit p auftritt
und bei n Versuchen k-mal auftritt ist:
mit
1-p
 n
P( X = k ) = f ( k ) = B( k | n; p ) =   p k (1 − p ) n − k
k 
p
= Eintrittswahrscheinlichkeit des Ereignisses A
= Eintrittswahrscheinlichkeit des Ereignisses A
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
n
= Anzahl der durchgeführten Experimente.
 n
n!
  =
,
 k  k ! ( n − k )!
Die Verteilungsfunktion gibt die Wahrscheinlichkeit dafür an, dass bei n Versuchen
höchstens k Ereignisse auftreten.
P( X ≤ k ) = F ( k )
Die funktionale Form der Verteilungsfunktion wird hier nicht genauer angegeben, da sie im
Weiteren für die Berechnungen nicht benötigt wird.
Der Erwartungswert und Varianz einer binomialverteilten Zufallsvariable sind:
E ( X ) = n ⋅ p Var ( X ) = n ⋅ p ⋅ (1 − p )
Hypergeometrische Verteilung
ohne Zurücklegen.
Eine vorgegebene Menge umfasst N Elemente. Davon besitzen M Element die Eigenschaft A;
Von den N Elemente werden n ohne Zurücklegen entnommen,
Die der hypergeometrische Verteilung kann durch die Binomialverteilung B(n;p) mit p=
approximiert werden.
Approximationsbedingungen
n
< 0,05 klein und
N
Auswahlsatz bzw. Entnahmesatz
Anteile
M
zwischen 0,1 und 0,9, d.h. keine extremen Wahrscheinlichkeiten.
N
Poisson-Verteilung
„Gesetz der kleinen Zahlen“ bzw. „Verteilung der seltenen Ereignisse“
Die Poisson-Verteilung kann durch die Binomialverteilung approximiert werden.
Approximationsbedingungen:
n ≥ 30 und
p ≤ 0,1 oder p ≥ 0,9
Gleichverteilung
Der Erwartungswert und die Varianz der Gleichverteilung sind:
E( X ) =
a+b
2
und Var ( X ) =
(b − a ) 2
12
2
Normalverteilung N(µ;σ )
Die Dichtefunktion der Normalverteilung ist
f N ( x | µ;σ ) =
1
σ ⋅ 2π
e
 x−µ 
−

 σ 
2
für − ∞ < x < ∞
mit µ dem Erwartungswert und σ die Standardabweichung der Normalverteilung.
Der Erwartungswert und die Varianz der Normalverteilung ist
E ( X ) = µ und Var ( X ) = σ 2
Die Verteilungsfunktion der Normalverteilung ist
FN ( x0 | µ ;σ ) =
1
σ ⋅ 2π
x0
∫
−∞
e
1  x−µ 
− 

2 σ 
2
dx
M
N
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Wenn eine Zufallsvariable X normalverteilt mit Erwartungswert µ und Varianz σ2 ist, X~N(µ,σ2),dann ist die
Zufallsvariable
Z=
X −µ
σ
~ N(0,1) standardnormalverteilt
Der Erwartungswert und die Varianz der Standardnormalverteilung ist:
E ( Z ) = 0 und Var ( Z ) = 1
Wichtige Eigenschaften der Standardnormalverteilung:
Zwischen den 1-σ
σ-Grenzen liegt 68,27% der Fläche bzw. der Wahrscheinlichkeit.
Zwischen den 2-σ
σ-Grenzen liegt 95,45% der Fläche bzw. der Wahrscheinlichkeit.
Zwischen den 3-σ
σ-Grenzen liegt 99,73% der Fläche bzw. der Wahrscheinlichkeit.
Symmetrie: FN(-z)=1-FN(z)
Wahrscheinlichkeit im Intervall: P(-z≤Z≤z)=2⋅ FN(z)-1
Das z 0,975 -Quantil der Standardnormalverteilung ist 1,96.
Das z 0,995 -Quantil der Standardnormalverteilung ist 2,575.
Approximation der Binomialverteilung durch die Normalverteilung
n ⋅ p ⋅ (1 − p ) ≥ 9 oder n ≥ 30
0,1 < p < 0,9
Zentraler Grenzwertsatz:
Sind die Zufallsvariablen X1, X2, ..., Xn unabhängig und identisch verteilt mit E(Xi)=µ und Var(Xi)=σ2, dann ist
1 n
σ2
X
normalverteilt
mit
E
(
X
)
=
µ
und
Var
(
X
)
=
∑
i
n i =1
n
Das gilt für n ≥ 30 .
die ZV
X =
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Kleines Symbolverzeichnis für Parameter der Grundgesamtheit und der Stichprobe:
Parameter in der Grundgesamtheit
Mittelwert,
Erwartungswert
Stichprobenmittel
∞
µ=
Parameter in der Stichprobe
∫ x ⋅ f ( x)dx
x=
−∞
1 n
∑ xi
n i=1
N
µ = ∑ xi ⋅ f ( xi )
i =1
Varianz
σ2 =
1
N
N
∑(x
− µ )2
i
Stichprobenvarianz
s2 =
i =1
1
n
( xi − x ) 2
∑
i =1
n −1
∞
σ = ∫ [ x − µ ]2 f ( x )dx
2
−∞
Standardabweichung
Stichprobenstandardabweichung
σ = σ2
s = s2
s =
Anzahl der Elemente
Anteilswert
Stichprobenumfang
N
p=
Anteilswert
M
N
1
n
∑ ( xi − x ) 2
n − 1 i =1
n
pˆ =
m
n
s
Standardfehler des Mittelwertes: s M =
n
Das Konfidenzintervall für den Erwartungswert µ der Grundgesamtheit errechnet sich bei kleinen Stichproben
als :
x −t
t
1−
α das 1 −
2
α
2
1−
α
⋅ sM < µ < x + t
2
1−
α
⋅ sM
2
-Quantil der Student-t-Verteilung mit n-1 Freiheitsgraden.
Das Konfidenzintervall für den Erwartungswert µ der Grundgesamtheit errechnet sich bei großen Stichproben ab
n>30 als :
x−z
1−
α
2
⋅ sM < µ < x + z
1−
α
2
⋅ sM
Prof. Dr. Waike Moos
FB Wirtschaft
Mit z
1−
α das 1 −
2
Formelsammlung Induktive Statistik
α
2
s
-Quantil der Standardnormalverteilung, s M =
der Standardfehler des Mittelwertes.
n
Falls die Varianz bzw. Standardabweichung σ der Grundgesamtheit bekannt sein sollte, errechnet sich das
Konfidenzintervall für den Erwartungswert µ der als :
x−z
1−
Definition:
σ
⋅
α
n
2
<µ<x+z
1−
σ
⋅
α
n
2
Aus einer gegebenen Stichprobe wird ein Konfidenzintervall zum Konfidenzniveau 1-α derart
gebildet, dass die Wahrscheinlichkeit, dass diese Konfidenzintervall den wahren, aber
unbekannten Parameter µ der Grundgesamtheit überdeckt, (1-α)% beträgt,
P( x − z ⋅ σ M ≤ µ ≤ x + z ⋅ σ M ) = 1 − α
Das Konfidenzintervall für den Anteilswert ist
pˆ − z
1−
α
⋅
pˆ ⋅ (1 − pˆ )
2
falls die Approximationsbedingung gilt:
n −1
< p < pˆ + z
1−
n ⋅ pˆ ⋅ (1 − pˆ ) > 9 .
mit
p der wahre Anteil in der Grundgesamtheit
p̂ der errechnete Anteil in der Stichprobe
z
1−
α
2
das 1 −
α
2
-Quantil der Standardnormalverteilung.
Teststatistik Test auf Mittelwertunterschiede :
Degrees of freeedom:
DF =
x1 − x2
t=
s12 s22
+
n1 n2
n1 + n 2 − 2
2
Teststatistik Test auf den Erwartungswert:
t=
x−µ
σ
n
α
2
⋅
pˆ ⋅ (1 − pˆ )
n −1
Prof. Dr. Waike Moos
FB Wirtschaft
Formelsammlung Induktive Statistik
Herunterladen