n √∏n harmon. H(x)

Werbung
Mittel
arithmeth.
ungew.
n
1 ∑
xi
n
i=1
√
∏
n
n
x
geometr.
G(x)
harmon.
H(x)
gewichtet
∑n
i=1 wi ·xi
∑
n
i=1 wi
√
∏n
w
xwi
∑n i=1 i
w
∑ni=1 wii
i=1 xi
∑nn
1
i=1 xi
i=1 xi
Es gilt: H(x) ≤ G(x) ≤{x (
)
1
x[np] + x[np+1] , np ∈ Z
2
p%-Quantile: up% =
x[⌈np⌉]
, sonst
{
, n mod 2 = 1
x[ n+1 ]
2
Median: x
e :=
1
+ x[ n +1] } , n mod 2 = 0
2 {x[ n
2]
√2 ∑
n
Standardabweich.: σx = n1 ni=1 (xi − x)2
√ (
)
∑n
∑
n
2 − 1 ( n x )2
effizienter mit: σx = n1
x
i=1 i
i=1 i
n
√
∑
n
1
2
empir. Streuung: sx = n−1
i=1 (xi − x)
σxn2
s2x
Varianz:
empir. Varianz:
Datenpaare (xi , yi )
n
1 ∑
empir. Kovarianz: sxy = n−1
((xi − x)(yi − y))
i=1
wobei sxx =
n
s2x
min
xi
i=1
~
x
u25%
u75%
n
max
xi
i=1
Boxplot
Wahrscheinlichkeitsmodelle
a) Ergebnismenge Ω
Menge aller möglichen Ausgänge des Experiments
b) Ereignis-System A mit Ereignissen Ai ⊂ Ω
Menge aller Ereignisse Ai heißt Ereignis-System A
c) Wahrscheinlichkeit P
(Mengen)-σ-Algebra
c
Ω∈A; A∈A ⇒
∪∞A ∈ A
A1 , A2 , ... ∈ A ⇒ i=1 Ai ∈ A
Wahrscheinlichkeiten
0 ≥ P (A) ≤ 1; P (Ω) = 1, P (∅) = 0
P (A1 + A2 + ...) = P (A1 ) + P (A2 ) + ...; P (A) = |A|
|Ω|
stoch. Unabhängigkeit: P (AB) = P (A)P (B)
rel. Häufigkeit: HN = ANN
Bedingte Wahrscheinlichkeit: P (A|B) = P P(A∩B)
(B)
∑
∑
totale W.: P (A) =
P (ABi ) =
P (Bi )P (A|Bi )
i∈I
i∈I
Verkett.regel: P (ABC) = P (A) · P (B|A) · P (C|AB)
)P (A|Bk )
Formel von Bayes: P (Bk |A) = ∑ P (BPk(B
i )P (A|Bi )
i∈I
Laplace-Experiment: P (1) = ... = P (N ) =
1
N
Erwartungswert
∫∞
∑
k · P (X = k); EX =
x · f X (x)dx
EX =
k∈Ω′
−∞
monoton: a ≤ X ≤ Y ⇒ a ≤ EX ≤ EY
linear: E(aX + b) = a · EX + b
E(X + Y ) = EX + EY
X,Y st.u. ∫⇔ E(XY ) = EX · EY
∞
Eg(X) = −∞ g(x)f X (x)dx
∫∞ ∫∞
Eh(X, Y ) = −∞ −∞ h(x, y)f (X,Y ) (x, y)dxdy
E(X − a)2 = Var(X) + (EX − a)2
Integration im Rn ∫ ∫
Substitutionsregel
G
(
)f (x, y)dxdy
∂(x,y)
∂(u,v)
∫∫
∂x(u,v)
∂u
∂y(u,v)
∂u
=
G f (x, y)d(x, y)
∫∫
∂x(u,v)
∂v
∂y(u,v)
∂v
=
)
(
∂(x,y) f
(x(u,
v),
y(u,
v))
det
H
∂(u,v) d(u, v)
Mehrdim. Normalverteilung N (⃗a, K)
Lin. Transformation Y = g(X) = ⃗a + AX
EYi = ai
EXi2 = 1, EXk Xl = 0 → Kov(Yi , Yj ) = AAT
Dichte
(
)n 1
T
−1
√1
e− 2 (⃗y−⃗a) (K )(⃗y−⃗a)
f Y (⃗y ) = √ 1
2π
| det K|
Z = ⃗b + BY wobei Y ∼ N (⃗a, K)
→ Z ∼ N (⃗b + B⃗a, BKBT )
zufällige Summe S =
Y
∑
Xi
i=1
ES = EY · EX1
VarS = EY · VarX1 + VarY · (VarEX1 )2
Gesetze der großen Zahl
st
stochastisch Yn → Y
Es gilt: lim P (|Yn − Y | ≥ ϵ) = 0
n→∞
∀ϵ > 0
(r)
im r-ten Mittel Yn → Y
Es gilt: E|Yn − Y |r → 0
V
nach Verteilung Yn → Y
Es gilt: F Yn (x) → F Y (x)
Ungl. Chebychew-Markow: P (|Y | ≥ ϵ) ≤ ϵ1r E|Y |r
für r = 2, EY exist.: P (|Y − EY | ≥ ϵ) ≤ ϵ12 VarY
Zentraler ∑Grenzwertsatz
n
X −n·EX1 n→∞
Sn −ESn
i=1
√ i
∼ N (0, 1)
StrSn =
nStrX
1
Varianz
Var(x) = E(X − EX)2 = EX 2 − (EX)2
Var(a + X) = Var(X); Var(aX) = a2 Var(X)
Var(X + Y ) = Var(X) + Var(Y ) + 2 · Kov(X, Y )
Kovarianz Kov(X, Y ) = EXY − EXEY
X,Y st.u → Kov(X, Y ) = 0
)
Korrelationskoeffizient korr(X, Y ) = Kov(X,Y
StrXStrY
Riemann-Dichte: P ((a, b]) =
∫b
a
f (x)dx
i-te Randdichte
∑
∑
∑
∑
f Xi (ωi ) =
...
...
f (ω1 , ..., ωn )
ω1 ∈Ω1 ωi−1 ∈Ωi−1 ωi+1 ∈Ωi+1 ωn ∈Ωn
∫ ∫
f Xi (xi ) = R ... R f (x1 , ..., xn )dx1 ...dxi−1 dxi+1 ...dxn
Gamma-Funktion
Γ(ν + 1) = ν · Γ(ν), Γ(1) = 1,
Γ(ν) = (ν − 1)!
ν∈N
Γ(0.5) =
√
π
Schätzverfahren
rel. Wirksamkeit η =
Var(Θ̂1 )
Var(Θ̂2 )
n
∏
Likelihood-Fkt L(x1 , ..., xn ; Θ) =
Summen unabh. ZVs & Faltung
z
∑
f X+Y (z) = (f X ∗ f Y )(z) =
f X (x)f Y (z − x)
P (X = xi ; Θ)
i=1
!
!
dL
Zum Schätzen: dΘ
= 0 oder dlnL
dΘ = 0
Erwartungstreue: E(Θ̂) = Θ
asympt. Erw.treue: lim E(Θ̂(X1 , ..., Xn )) = Θ
n→∞
Konsistent: lim P (|Θ̂(X1 , ..., Xn ) − Θ| < ϵ) = 1
n→∞
n→∞
Konsistenzkriterium: Var(Θ̂(X1 , ..., Xn )) → 0 ⇒
n→∞
Θ̂)
→ 0
P (|Θ̂(X1 , ..., Xn ) − Θ| > ϵ) ≤ Var(
ϵ2
Konfidenzschätzung
N
(
)
für µ, σ bekannt: x − z1− α2 √σn ; x + z1− α2 √σn
(
)
sn
sn
√
α
α
für µ, σ unbek.: xn − √
x
+
t
;
t
n
1−
,n−1
1−
,n−1
n
n
2
(
) 2
2
2
(n−1)·s
(n−1)·s
für σ 2 : χ2
; χ2
1− α
2 ;n−1
α ;n−1
2
Konfidenzschätzung B(p) z := z1− α2
(
)
√
( z )2
X(1−X)
z2
n
pmax/min = n−z X + 2n ± z
+ 2n
n
Hypothesentests
nicht abgelehnt abgelehnt
H0 richtig → ok
Fehler 1.Art
p1 = 1 − α
p2 = α
H0 falsch Fehler 2.Art
→ ok
p3 = β
p1 = 1 − β
Signifikanztest: Verzicht auf Fehler 2.Art
Test für N (µ, σ 2 ), H0 = {N (µ, σ 2 ), µ = µ0 }, σ bek.
√
0
u = X−µ
n ∼ N (0, 1)
σ
zweiseit.: P (|U | ≥ z1− α2 |H0 ) = α; |u| ≥ z1− α2 → ¬H0
einseit.: P (U ≥ z1−α |H0 ) = α; u ≥ z1−α → ¬H0
oder P (U ≤ z1−α |H0 ) = α; u ≤ z1−α → ¬H0
Test für N (µ, σ 2 ), H0 = {N (µ, σ 2 ), µ = µ0 }, σ unbek.
√
0
n ∼ tm mit m = n − 1
u = X−µ
s
zweis.: P (|U | ≥ t1− α2 ,m |H0 ) = α;|u| ≥ t1− α2 ,m → ¬H0
eins.: P (U ≥ t1−α,m |H0 ) = α; u ≥ t1−α,m → ¬H0
oder P (U ≤ t1−α,m |H0 ) = α; u ≤ t1−α,m → ¬H0
Gleichheitstest
√
n1 n2 (n1 +n2 −2)
X−Y
∼ tm=n1 +n2 −2
u= √
2
2
n1 +n2
(n1 −1)sx +(n2 −1)sy
zweis.: P (|U | ≥ t1− α2 ;m ) = α; |u| ≥ t1− α2 ;m → ¬H0
χ2 - Anpassungstest
k
∑
(hm −npm )2
u=
∼ χ2k−r−1
npm
m=1
k Klassen, r unbek. Variablen
P (u ≥ χ21−α;k−r−1 |H0 ) = α
→ u ≥ χ21−α;k−r−1 → H0 ablehnen
Markow-Ketten
Matrix: Zeilensumme = 1
irreduzibel: Jeder Zustand von jedem Zustand aus mit
positiver Wahrsch. erreichbar.
∃n : ∀Pijn > 0 → irreduzibel + aperiodisch
Gleichgewichtsverteilung
∑
π · P = π; πi ≥ 0;
j∈I πj = 1
( T
)
!
Berechnen von π: P − 1 · I · π = ⃗0
f X+Y (z)
=
(f X
∗
f Y )(z)
=
x=0
∫z
f X (x)f Y (z − x)dx
0
Binom.vert. B(n + m, p) = B(n, p) ∗ B(m, p)
Poissonvert. π(λ1 ) ∗ π(λ2 ) = π(λ1 + λ2 )
N b+ (1, p) = Geo+ (p)
N b+ (r1 + r2 , p) = N b+ (r1 , p) ∗ N b+ (r2 , p)
N (a, σ 2 ) ∗ N (b, τ 2 ) = N (a + b, σ 2 + τ 2 )
Zusammenhänge & Approximationen
N (a, σ 2 ) → N (0, 1) : Φ(a,σ) (X) → Φ( X−a
σ )
n→∞
B(n, p) ⇝ N (np, np(1 − p))
p→0
n→∞
B(n, p) ⇝ π(n · p)
N b+ (1, p) = Geo+ (p)
Regressionsanalyse N
Regressionsgerade
s
r(x) = ax + b mit a = sxy
2 , b = y − ax
x
n
1 ∑
2
emp. Restvarianz: sR = n−2
(yi − y(xi ))2
i=1
Prüfen β2 : H0 : β2 = β20
20
u = b2s−β
∼ tm mit s2β2 =
β
2
s2R
(n−1)s2X
|u| ≥ t1− α2 ;n−2 → H0 ablehnen
Prüfen β1 : H0 : β1 = β10
(
)
b1 −β10
1
x2
2
2
u = sβ ∼ tm mit sβ1 = sR n + (n−1)s2
x
1
|u| ≥ t1− α2 ;n−2 → H0 ablehnen
Konfidenzintervall
β
)2 , β1 analog
(
b2 −β2 P sβ < t1− α2 ;n−2 = 1 − α
2
⇒ b2 − t1− α2 ;n−2 sβ2 < β2 < b2 + t1− α2 ;n−2 sβ2
Konfidenzintervall η
y(x) − t1− α2 ;n−2 sη < η(x) < y(x) + t1− α2 ;n−2 sη
√ (
)
(x−x)2
mit sη (x) = s2R n1 + (n−1)s
2
x
Korrelationsanalyse N
Ziel: Entscheiden ob X,Y st. u.
H0 : ρXY√ = korr(X, Y ) = 0
n−2
XY
u = r√
∼ tn−2
2
1−rXY
|u| ≥ t1− α2 ;n−2 → H0 ablehnen
(
)
XY
oder: W = 12 ln 1+r
(
) 1−rXY
1+r
1
r
µW = 2 ln 1−r + 2(n−1)
2 = 1
σW
n−3
w
u = w−µ
σw ∼ N (0, 1)
|u| ≥ za− α2 → H0 ablehnen
Name
diskret
Bernoulli
Binomial
Einpunkt
Geo.
H(N, K, n)
B(p)
B(n, p)
ϵa
Geo+ (p)
Geo0 (p)
Hypergeo.
L({1, ..., N })
Nb+ (p)
Dichte
f Wr (k) =
Laplace
Neg. Binomial
Nb0 (p)
π(λ; k) = e−λ λk!
· 1(0,∞) (x)
Γ(µ+ν) µ−1
(1
Γ(µ)Γ(ν) x
α
π(α2 +x2 )
n
x
x 2 −1 e− 2
n
2 2 Γ( n
)
2
f X (x) = αe−αx 1(0,∞) (x)
(
)
(x−a)2
2σ 2
√1 e−
σ 2π
x2
√1 e− 2
2π
)n
t2
n
)
2 +...+x2
x1
n
2
− n+1
2
e−
2 − 2
Γ( n+1
)
2
= √nπΓ(
1 + tn
n
)
2
αν ν−1 −αx
e
1(0,∞) (x)
Γ(ν) x
n+1
− x)ν−1 1(0,1) (x)
f X1 (1) = p ( )
b(n, p; k) = nk pk (1 − p)n−k
f X (a) = 1
f W1 (k) = p(1 − p)k−1
′
f W1 (k) = p(1 − p)k
(K )(N −K )
f Zn (k) = k Nn−k
(n)
f X (k) = N1
( ) r
k
f Wr (k) = k−1
r−1 p (1 − p)
) r
(k+r−1
k
r−1 p (1 − p)
π(λ)
beµ,ν (x) =
f X (x) =
′
Poisson
Be(µ, ν)
C(α)
fn (x) =
k
stetig
Beta
Cauchy
χn2
Exp(α)
f Zn (t)
Chi2
Expontential
Fischer-F
γ(x) =
ϕa,σ (x) =
Γα,ν
N (a, σ 2 )
Gamma
Normal
ϕ0,1 (x) =
(
1
b−a 1(a,b) (x)
√1
2π
f X (x) =
Γ( n+1 )
√ 2 n
nπΓ( 2 )
(
1+
f Zn (t) =
f X (x1 , ..., xn ) =
N (0, 1)
t
R(a, b)
Std.-Normal
Std.-Normaln
Rechteck
Student-t
k=0
n
∑
λk
k!
Verteilungsfunktion
Fλ (X) = e−λ
x−a
b−a
1
2
dt
x≤a
a<x≤b
x>b
(t−a)
∫x
−
√1
2σ 2
−∞ σ 2π e
t2
√1 e− 2 dt
2π


 0
−∞
∫x
F (x) = (1 − e−αx ) · 1(0,∞) (x)
Φ(x) =
Φ(x) =
F (x) =
µ
µ+ν
λ
N +1
2
r
p
r(1−p)
p
nK
N
1
p
1−p
p
p
np
a
E
µν
(µ+ν+1)(µ+ν)2
λ
N 2 −1
12
r(1−p)
p2
r(1−p)
p2
N −K N −n
nK
N N N −1
1−p
p2
1−p
p2
p(1 − p)
np(1 − p)
0
Var
a+b
2
0
a
ν
α
1
α
n
n
n−2
(b−a)2
12
1
σ2
ν
α2
1
α2
2n
Ex. nicht
0
Herunterladen