Document

Werbung
MAS 2 / Statisik Formelsammlung
Seite 1 / 7
Statistik
Kombinatorik
Anzahl Kombinationen:
nk
Anzahl Möglichkeiten k aus n Elementen,
⎛ n⎞
n!
⎜ ⎟=
k
k
!
n
− k )!
(
⎝ ⎠
n!
wenn Reihenfolge eine Rolle spielt:
( n − k )!
wenn Reihenfolge keine Rolle spielt:
wie viele Möglichkeiten/Kombinationen?
TR = Kombinat(n, x)
(Permutation)
Wahrscheinlichkeitsrechnung
p=
Anzah l_ günstiger _ Fälle
Anzahl _ möglicher _ Fälle
Laplace - Wahrscheinlichkeit
Rechnen / Lehrsätze
sowohl als auch; logisch und = * (Multiplikation)
Multiplikationssatz
unabhängige Z-Variablen:
W ( A ∩ B ) = W ( A) *W ( B )
abhängige Z-Variablen: (allgemeine Formel)
W ( A ∩ B ) = W ( A) *W ( B / A) = W ( B ) *W ( A / B )
Additionssatz
gegenseitig ausschliessend:
entweder oder; logisch oder = +
(Addition)
W ( A ∪ B ) = W ( A) + W ( B)
gegenseitig nicht ausschliessend: (allgemeine Formel)
W ( A ∪ B ) = W ( A) + W ( B ) − W ( A ∩ B )
bedingte Wahrscheinlichkeit
unabhängige Z-Variablen:
W ( A / B ) = W ( A)
abhängige Z-Variablen: (allgemeine Formel)
W ( A ∩ B)
W ( A / B) =
W ( B)
A unter der Bedingung von B,
bzw. A nachdem B eingetroffen ist
Differenz von Wahrscheinlichkeiten
W ( D) = W ( B − A) = W (B) − W ( A ∩ B)
Zufallsexperiment / Zufallsvariablen
Erwartungswert
diskrete Zufallsvariable X: (einzelne Werte)
n
E ( X ) = ∑ xi * f ( xi ) = µ
E(X) = wie viel im Durchschnitt ?
i =1
stetige Zufallsvariable X:
f(xi) = Wahrscheinlichkeit bzw. Häufigkeit / Anteil
(Messung)
∞
E( X ) =
∫ x * f ( x)dx = µ
−∞
Varianz
diskrete Zufallsvariable X:
n
VAR( X ) = V ( X ) = ∑ ⎡⎣ xi 2 * f ( xi ) ⎤⎦ − µ 2 = σ 2
i =1
stetige Zufallsvariable X:
∞
VAR ( X ) = V ( X ) =
∫ ⎡⎣ x
−∞
2
f(x) = Wahrscheinlichkeit
V(X) = Streuung
* f ( x) ⎤⎦ dx − µ 2 = σ 2
Standardabweichung
σ = V (X ) = σ 2
Sabina Düringer
Standardabweichung: ca. 2/3 der Werte liegen
plus/minus dem arithmetischen Mittel
MAS 2 / Statisik Formelsammlung
Rechnen
Seite 2 / 7
Rechnen mit Zufallsvariablen
immer möglich:
E(X+Y) = E(X) + E(Y)
E(a*X) = a * E(X)
V(a*X) = a2 * V(X)
bei unabhängigen:
σ ( X + Y ) = σ 2 ( X ) + σ 2 (Y )
für die Summe von n unabhängigen Zufallsvariablen mit
gleichen µ und σ gilt:
µz = n * µ
σ z = n *σ
1. Binominalverteilung
(diskrete Verteilung, Bernoulli-Experiment, Charakteristik: n-mal ziehen, 2 Möglichkeiten, mit Zurücklegen)
Kuzschreibweise: B (n, p)
Tabellen Nr. 7, S: 12, Binominalverteilung für Wahrscheinlichkeits- und Verteilungsfunktion
Wahrscheinlichkeitsfunktion
Zufallsvariable: X
Parameter: n und Θ (bzw. p)
W ( X = x)
⎛n⎞
⎝ x⎠
f B ( x; p; n ) = ⎜ ⎟ * p x * (1 − p )
n−x
für nur 1 Möglichkeit
(z.B. 5 blaue von 6: x = 5, n = 6)
X = Diskrete Zufallsgrösse,
Anzahl der Erfolge
n = Anzahl Versuche
p = Wahrscheinlichkeit eines Erfolges
bei einem Versuch
TR = Kombinat(n, x)
Verteilungsfunktion
W ( X ≤ x)
x
⎛n⎞
n−v
FB ( x; p; n ) = ∑ ⎜ ⎟ * p v * (1 − p )
v =0 ⎝ v ⎠
FB (x;p;n) gibt die Wahrscheinlichkeit an, mit der
eine B (n, p)-verteilten Zufallsvariable X
höchstens den Wert x annehmen kann.
W ( X x) = 1−W ( X ≤ x)
Verteilungsparameter
Erwartungswert:
µ = E(X) = n * Θ = n * p
Varianz:
2
σ = V(X) = n * Θ * (1 - Θ) = n * p * (1-p)
Standardabweichung
σ=
V (X ) =
n * Θ * (1 − Θ ) =
n * p * (1 − p )
Hypothesentestverfahren
(Binominaltest)
Verfahren
H0 Nullhypothese (so ist es)
H1 Alternativhypothese (das wäre falsch)
Sabina Düringer
Prüfung H0:
- Verwerfungsbereich definieren für α
- p von H0
- n (Stichprobe)
Prüfung H1:
- Annahmebereich definieren für β
- p von H1
- n (Stichprobe)
(≠ bedeutet zweiseitiger Test mit VL und VR)
α=
Signifikanzniveau
z.B.: W ( X ≤ 5 )
(Wahrscheinlichkeit fälschlicherweise
abgelehnt = im Ablehnungsbereich zu sein)
1 – α = Vertrauenswahrscheinlichkeit
β=
(Wahrscheinlichkeit fälschlicherweise
angenommen = im Annahmebereich)
MAS 2 / Statisik Formelsammlung
Seite 3 / 7
2. Hypergeometrische Verteilung
(diskrete Verteilung, abhängige Variablen, ohne Zurücklegen)
Kuzschreibweise: H ( N, M, n)
Tabellen Nr. 6, S: 11, für Wahrscheinlichkeits- und Verteilungsfunktion
Beispiel: Lotto (Wahrscheinlichkeit für einen „Vierer“ Æ N: 45, M: 6, n: 6, X: 4)
Wahrscheinlichkeitsfunktion
fH =
W ( X = x)
wenn:
⎛M ⎞ ⎛N −M ⎞
⎜ ⎟ *⎜
⎟
⎝ x ⎠ ⎝ n−x ⎠
f H ( x; N , M , n ) =
⎛N⎞
⎜ ⎟
⎝n⎠
n
0, 05
N
kann binominal gerechnet werden
für x = 0, 1, 2, …, n (sont: fH = 0)
N = Gesamt-Anzahl
M = Anzahl „gute“ (gesucht)
n = Anzahl Stichproben (wie viel genommen?)
X = Diskrete Zufallsgrösse, Anzahl Erfolge
Verteilungsfunktion
FH =
W ( X ≤ x)
⎛M ⎞ ⎛N −M ⎞
⎜ ⎟ *⎜
⎟
v
n−v ⎠
FH ( x; N , M , n ) = ∑ ⎝ ⎠ ⎝
⎛N⎞
v =0
⎜ ⎟
⎝n⎠
x
für x = 0, 1, 2, …, n
Verteilungsparameter
Erwartungswert:
µ = E( X ) = n *
M
N
Varianz:
σ 2 = V (X ) = n*
M
N
⎛ M
* ⎜1 −
N
⎝
⎞ ⎛ N −n⎞
⎟ *⎜
⎟
⎠ ⎝ N −1 ⎠
3. Poissonverteilung
(diskrete Verteilung, typisch: n sehr gross; p sehr klein)
Kuzschreibweise: P ( λ )
Tabellen Nr. 8, S: 14, für Wahrscheinlichkeits- und Verteilungsfunktion
Beispiel: Anzahl Geburten / Tag, Anzahl Telefongespräche / Min., Anzahl Maschinenausfälle / Monat etc.
-
Als vereinfachte Approximation der Binominalverteilung bei grossem Stichprobenraum (n gross) und
seltenen Ereignissen (p klein)
Wenn nur der Erwartungswert λ, nicht jedoch n und p bekannt sind.
-
Wahrscheinlichkeitsfunktion
W ( X = x ) = f p ( x, λ ) =
λx
x!
* e− λ
mit λ = n * p
für x = 0, 1, 2… (sonst fP = 0)
Verteilungsfunktion
x
λv
v =0
v!
W ( X ≤ x ) = FP ( x; λ ) = ∑
Verteilungsparameter
Erwartungswert:
µ = E(X) = λ = n * p
Varianz:
2
σ = V(X) = λ
Sabina Düringer
* e − λ mit λ = n * p
für x = 0, 1, 2…
MAS 2 / Statisik Formelsammlung
Seite 4 / 7
3. Normalverteilung
(stetige Verteilung, glockenförmige Verteilung durch viele einzelne Zufallsvariablen die unabhängig sind)
2
Kuzschreibweise: N ( µ, σ )
Tabellen Nr. 10, S: 11 ff., für Dichte- und Verteilungsfunktion
Dichtefunktion
fN =
( z; µ , σ ) = σ * 12 * π * e
2
−
( x − µ )2
2*σ
2
f N ( z; 0;1) = z.B.( z = 1; 0,1)
Dichtefunktion ist keine Wahrscheinlichkeit!
(nur der Abstand zwischen Kurve und x-Achse.
Wahrscheinlichkeit ist somit immer 0)
e = 2,71828… (Eulersche Zahl)
2
( 0 = µ, 1 = σ )
µz = n * µ
Eigenschaften: für f (x) = fN (x; µ, σ )
Rechnen:
ƒ x = µ ist wo f (x) maximal wird
ƒ µ bestimmt Lage der Kurve (wo auf der X-Achse)
ƒ σ bestimmt die Form der Kurve
ƒ Wendepunkte liegen bei x = µ - σ bzw. µ + σ
ƒ die gesamte Fläche zwischen f (x) u. der x-Achste = 1
Verteilungsfunktion
Æ f ′ ( µ) = 0
2
( z;0,1) = ∫
(Maximalstelle)
Æ f ″ ( µ ± σ ) = 0 (Wendepunkt)
Verteilungsfunktion ist eine Wahrscheinlichkeit.
z
FN =
σ z = n *σ
;
f ( z )dz
−∞
FN ist Integralfunktion
FN ( - z1) = 1 – FN ( z1)
-∞ bis z1
FN:
FN*:
0 bis z1
FN**:
0 ± z1
Drei-Sigmaregel:
µ±σ
µ ± 2σ
µ ± 3σ
=
=
=
68,27%
95,45%
99,73%
Standardisierung:
z1 =
Beispiele:
a−µ
σ
z2 =
b−µ
W (a ≤ X ≤ b) = W ( z1 ≤ Z ≤ z2 ) = FN ( z2 ) − FN ( z1 )
σ
W ( X ≥ a) = 1 − W ( X ≤ a)
W ( X − µ ≤ b) = W ( Z ≤
b
) = W ( Z ≤ c ) = FN** (c )
σ
W ( µ − r *σ ≤ X ≤ µ + r *σ ) = FN** (r )
Sabina Düringer
MAS 2 / Statisik Formelsammlung
Seite 5 / 7
Approximation
(diskreter Verteilungen durch die Normalverteilung)
Binominalverteilung B(n;p)
Laplacebedingung:
µ = n* p
Für
σ 2 9; (σ 3)
kann eine binominalver-
teilte Zufallsvariable X als normalverteilt
behandelt werden.
σ = n * p *(1 − p)
W (a ≤ X ≤ b) = W ( z1 ≤ Z ≤ z2 ) = FN ( z2 ) − FN ( z1 )
mit:
z1 =
a − np
b − np
und z2 =
np (1 − p )
np(1 − p )
Stetigkeitskorrektur:
1
a − − np
2
z1 =
np (1 − p)
Interpolation wenn verlangt
und
1
b + − np
2
z2 =
np(1 − p)
Poissonverteilung P(λ)
hinreichende Genauigkeit für
µ =λ
σ 2 = λ ;(σ = λ )
mit:
z1 =
a−λ
λ
und
z2 =
b−λ
λ
Interpolation wenn verlangt
Stetigkeitskorrektur:
z1 =
Sabina Düringer
a−
1
−λ
2
λ
und
z2 =
b+
1
−λ
2
λ
λ ≥9
MAS 2 / Statisik Formelsammlung
Seite 6 / 7
Stichprobenverfahren
Schätzverfahren
Schätzgrössen werden mit ^ gekennzeichnet.
Punktschätzung
N:
n:
Stichprobenparameter:
∧
Mittelwert:
Anzahl Elemente der GG
Stichprobenumfang der SP (alle gl.gross)
X i : Mittelwert der i-ten SP
X →µ=X
∧
n
Standardabweichung: s → σ = s *
n −1
si :
µ:
σ:
k:
Standardabweichung der i-ten SP
Mittelwert der GG
Standardabweichung der GG
Anzahl Stichproben (k Æ ∞)
(Berechnung von s war durch n, sollte aber durch
n-1 sein -> deshalb * n durch n-1)
Konfidenzintervall für Mittelwerte
Erwartungswert:
E( X ) = µX = µ
Standardfehler:
σX =
der GG
„Mittelwert aller Mittelwerte“
σ
n
mit Endlichkeitskorrekturfaktor:
V (X ) = σ X =
∧
Schätzwert:
σX =
σ
n
s
n −1
*
N −n
N −1
; für
n
≤ 0, 05
N
mit Endlichkeitskorrekturfaktor:
∧
σX =
s
N −n
*
n −1
N −1
W ( X − z *σ X ≤ µ ≤ X + z *σ X ) = 1 − α
Nicht notwendig für
α=
Fehlerrisiko
(Signifikanzniveau, Irrtumswahrscheinl.)
1 - α = Vertrauensintervall
(Konfidenz-, Sicherheitsniveau)
X=
µ=
σX
=
e=z*
Mittelwert der Stichprobe
Mittelwert der GG
Standardfehler des Mittelwerts
σX
= absoluter Fehler des Mittelwerts
aus Tabelle FN**
z=
Vorgehen:
n
≤ 0.05
N
z=
1. Endlichkeitskorrektur ?
2. σ X berechnen
X −µ
^
σX
(Wenn σ X
3. z aus der Tabelle lesen
Normalverteilung, wenn
geschätzt dann Studentenverteilung.)
Beispiel 95%-Konfidenzintervall: z aus Tabelle
lesen (= 1,96)
Konfidenzintervall für Anteilswerte
p=
∧
Mittelwertschätzung:
X →µ
σP =
k
n
- Anteil p entspricht der Wahrscheinlichk. Aus der
Stichprobe
- Anteil Θ aus der Grundgesamtheit
Anteilswertschätzung: p Æ Θ
Standardfehler:
also %-Anteil
θ * (1 − θ )
n
p = Anteilswert der SP
Θ = Anteilswert der GG
∧
σ P = geschätzter Standardfehler
mit Endlichkeitskorrekturfaktor:
σP =
Sabina Düringer
θ * (1 − θ
n
N −n
*
n −1
Nicht notwendig für
n
≤ 0.05
N
MAS 2 / Statisik Formelsammlung
Seite 7 / 7
p * (1 − p )
n −1
∧
Schätzwert:
σP =
; für
n
≤ 0, 05
N
mit Endlichkeitskorrekturfaktor:
∧
σP =
p * (1 − p)
N −n
*
n −1
N −1
^
^
W ( p − z *σ p ≤ θ ≤ p + z *σ p ) = 1 − α
z=
z=
Vorgehen:
1. p = k/n
^
2.
σp
aus Tabelle FN**
berechnen (ggf. Endlichkeitskorr)
3. z aus der Tabelle lesen
p −θ
^
σp
Beispiel 95%-Konfidenzintervall: z aus Tabelle
lesen (= 1,96)
1 - α = FN** (z) = 0,97 Æ z = 2,17
Stichprobenumfang n
Æ Ergebnis ganzzahlig (aufgerundet) angeben!
e = absoluter Fehler (z.B: ± 1) Æ Abweichung
Mittelwert-Schätzung
σ ⎞
⎛
e = z * σ X wobei ⎜ σ X =
⎟
n⎠
⎝
Notwendiger Stichprobenumfang:
n≥
z 2 *σ 2
e2
mit Endlichkeitskorrekturfaktor:
n≥
für
n
0, 05
N
(kann meist erst am Schluss geprüft werden, da
n unbekannt ist)
z 2 * N *σ 2
e * ( N − 1) + z 2 * σ 2
2
Schätzung des unbekannten σ:
∧
nv
nv − 1
σ = sv *
mit Endlichkeitskorrekturfaktor:
∧
σ = sv *
nv
N − nv
*
nv − 1
N −1
für
n
0, 05
N
für
n
0, 05
N
für
n
0, 05
N
Anteilswert-Schätzung
Notwendiger Stichprobenumfang:
n≥
z 2 *θ *(1 − θ )
e2
mit Endlichkeitskorrekturfaktor:
n≥
z 2 * N *θ * (1 − θ )
e 2 *( N − 1) + z 2 *θ * (1 − θ )
Schätzung des unbekannten σ:
θn
* (1 − θ ) = pv * (1 − pv ) *
nv
nv − 1
mit Endlichkeitskorrekturfaktor:
θn
* (1 − θ ) = pv * (1 − pv ) *
Sabina Düringer
nv
N − nv
*
nv − 1 N − 1
Herunterladen