Mittel arithmeth. ungew. n 1 ∑ xi n i=1 √ ∏ n n x geometr. G(x) harmon. H(x) gewichtet ∑n i=1 wi ·xi ∑ n i=1 wi √ ∏n w xwi ∑n i=1 i w ∑ni=1 wii i=1 xi ∑nn 1 i=1 xi i=1 xi Es gilt: H(x) ≤ G(x) ≤{x ( ) 1 x[np] + x[np+1] , np ∈ Z 2 p%-Quantile: up% = x[⌈np⌉] , sonst { , n mod 2 = 1 x[ n+1 ] 2 Median: x e := 1 + x[ n +1] } , n mod 2 = 0 2 {x[ n 2] √2 ∑ n Standardabweich.: σx = n1 ni=1 (xi − x)2 √ ( ) ∑n ∑ n 2 − 1 ( n x )2 effizienter mit: σx = n1 x i=1 i i=1 i n √ ∑ n 1 2 empir. Streuung: sx = n−1 i=1 (xi − x) σxn2 s2x Varianz: empir. Varianz: Datenpaare (xi , yi ) n 1 ∑ empir. Kovarianz: sxy = n−1 ((xi − x)(yi − y)) i=1 wobei sxx = n s2x min xi i=1 ~ x u25% u75% n max xi i=1 Boxplot Wahrscheinlichkeitsmodelle a) Ergebnismenge Ω Menge aller möglichen Ausgänge des Experiments b) Ereignis-System A mit Ereignissen Ai ⊂ Ω Menge aller Ereignisse Ai heißt Ereignis-System A c) Wahrscheinlichkeit P (Mengen)-σ-Algebra c Ω∈A; A∈A ⇒ ∪∞A ∈ A A1 , A2 , ... ∈ A ⇒ i=1 Ai ∈ A Wahrscheinlichkeiten 0 ≥ P (A) ≤ 1; P (Ω) = 1, P (∅) = 0 P (A1 + A2 + ...) = P (A1 ) + P (A2 ) + ...; P (A) = |A| |Ω| stoch. Unabhängigkeit: P (AB) = P (A)P (B) rel. Häufigkeit: HN = ANN Bedingte Wahrscheinlichkeit: P (A|B) = P P(A∩B) (B) ∑ ∑ totale W.: P (A) = P (ABi ) = P (Bi )P (A|Bi ) i∈I i∈I Verkett.regel: P (ABC) = P (A) · P (B|A) · P (C|AB) )P (A|Bk ) Formel von Bayes: P (Bk |A) = ∑ P (BPk(B i )P (A|Bi ) i∈I Laplace-Experiment: P (1) = ... = P (N ) = 1 N Erwartungswert ∫∞ ∑ k · P (X = k); EX = x · f X (x)dx EX = k∈Ω′ −∞ monoton: a ≤ X ≤ Y ⇒ a ≤ EX ≤ EY linear: E(aX + b) = a · EX + b E(X + Y ) = EX + EY X,Y st.u. ∫⇔ E(XY ) = EX · EY ∞ Eg(X) = −∞ g(x)f X (x)dx ∫∞ ∫∞ Eh(X, Y ) = −∞ −∞ h(x, y)f (X,Y ) (x, y)dxdy E(X − a)2 = Var(X) + (EX − a)2 Integration im Rn ∫ ∫ Substitutionsregel G ( )f (x, y)dxdy ∂(x,y) ∂(u,v) ∫∫ ∂x(u,v) ∂u ∂y(u,v) ∂u = G f (x, y)d(x, y) ∫∫ ∂x(u,v) ∂v ∂y(u,v) ∂v = ) ( ∂(x,y) f (x(u, v), y(u, v)) det H ∂(u,v) d(u, v) Mehrdim. Normalverteilung N (⃗a, K) Lin. Transformation Y = g(X) = ⃗a + AX EYi = ai EXi2 = 1, EXk Xl = 0 → Kov(Yi , Yj ) = AAT Dichte ( )n 1 T −1 √1 e− 2 (⃗y−⃗a) (K )(⃗y−⃗a) f Y (⃗y ) = √ 1 2π | det K| Z = ⃗b + BY wobei Y ∼ N (⃗a, K) → Z ∼ N (⃗b + B⃗a, BKBT ) zufällige Summe S = Y ∑ Xi i=1 ES = EY · EX1 VarS = EY · VarX1 + VarY · (VarEX1 )2 Gesetze der großen Zahl st stochastisch Yn → Y Es gilt: lim P (|Yn − Y | ≥ ϵ) = 0 n→∞ ∀ϵ > 0 (r) im r-ten Mittel Yn → Y Es gilt: E|Yn − Y |r → 0 V nach Verteilung Yn → Y Es gilt: F Yn (x) → F Y (x) Ungl. Chebychew-Markow: P (|Y | ≥ ϵ) ≤ ϵ1r E|Y |r für r = 2, EY exist.: P (|Y − EY | ≥ ϵ) ≤ ϵ12 VarY Zentraler ∑Grenzwertsatz n X −n·EX1 n→∞ Sn −ESn i=1 √ i ∼ N (0, 1) StrSn = nStrX 1 Varianz Var(x) = E(X − EX)2 = EX 2 − (EX)2 Var(a + X) = Var(X); Var(aX) = a2 Var(X) Var(X + Y ) = Var(X) + Var(Y ) + 2 · Kov(X, Y ) Kovarianz Kov(X, Y ) = EXY − EXEY X,Y st.u → Kov(X, Y ) = 0 ) Korrelationskoeffizient korr(X, Y ) = Kov(X,Y StrXStrY Riemann-Dichte: P ((a, b]) = ∫b a f (x)dx i-te Randdichte ∑ ∑ ∑ ∑ f Xi (ωi ) = ... ... f (ω1 , ..., ωn ) ω1 ∈Ω1 ωi−1 ∈Ωi−1 ωi+1 ∈Ωi+1 ωn ∈Ωn ∫ ∫ f Xi (xi ) = R ... R f (x1 , ..., xn )dx1 ...dxi−1 dxi+1 ...dxn Gamma-Funktion Γ(ν + 1) = ν · Γ(ν), Γ(1) = 1, Γ(ν) = (ν − 1)! ν∈N Γ(0.5) = √ π Schätzverfahren rel. Wirksamkeit η = Var(Θ̂1 ) Var(Θ̂2 ) n ∏ Likelihood-Fkt L(x1 , ..., xn ; Θ) = Summen unabh. ZVs & Faltung z ∑ f X+Y (z) = (f X ∗ f Y )(z) = f X (x)f Y (z − x) P (X = xi ; Θ) i=1 ! ! dL Zum Schätzen: dΘ = 0 oder dlnL dΘ = 0 Erwartungstreue: E(Θ̂) = Θ asympt. Erw.treue: lim E(Θ̂(X1 , ..., Xn )) = Θ n→∞ Konsistent: lim P (|Θ̂(X1 , ..., Xn ) − Θ| < ϵ) = 1 n→∞ n→∞ Konsistenzkriterium: Var(Θ̂(X1 , ..., Xn )) → 0 ⇒ n→∞ Θ̂) → 0 P (|Θ̂(X1 , ..., Xn ) − Θ| > ϵ) ≤ Var( ϵ2 Konfidenzschätzung N ( ) für µ, σ bekannt: x − z1− α2 √σn ; x + z1− α2 √σn ( ) sn sn √ α α für µ, σ unbek.: xn − √ x + t ; t n 1− ,n−1 1− ,n−1 n n 2 ( ) 2 2 2 (n−1)·s (n−1)·s für σ 2 : χ2 ; χ2 1− α 2 ;n−1 α ;n−1 2 Konfidenzschätzung B(p) z := z1− α2 ( ) √ ( z )2 X(1−X) z2 n pmax/min = n−z X + 2n ± z + 2n n Hypothesentests nicht abgelehnt abgelehnt H0 richtig → ok Fehler 1.Art p1 = 1 − α p2 = α H0 falsch Fehler 2.Art → ok p3 = β p1 = 1 − β Signifikanztest: Verzicht auf Fehler 2.Art Test für N (µ, σ 2 ), H0 = {N (µ, σ 2 ), µ = µ0 }, σ bek. √ 0 u = X−µ n ∼ N (0, 1) σ zweiseit.: P (|U | ≥ z1− α2 |H0 ) = α; |u| ≥ z1− α2 → ¬H0 einseit.: P (U ≥ z1−α |H0 ) = α; u ≥ z1−α → ¬H0 oder P (U ≤ z1−α |H0 ) = α; u ≤ z1−α → ¬H0 Test für N (µ, σ 2 ), H0 = {N (µ, σ 2 ), µ = µ0 }, σ unbek. √ 0 n ∼ tm mit m = n − 1 u = X−µ s zweis.: P (|U | ≥ t1− α2 ,m |H0 ) = α;|u| ≥ t1− α2 ,m → ¬H0 eins.: P (U ≥ t1−α,m |H0 ) = α; u ≥ t1−α,m → ¬H0 oder P (U ≤ t1−α,m |H0 ) = α; u ≤ t1−α,m → ¬H0 Gleichheitstest √ n1 n2 (n1 +n2 −2) X−Y ∼ tm=n1 +n2 −2 u= √ 2 2 n1 +n2 (n1 −1)sx +(n2 −1)sy zweis.: P (|U | ≥ t1− α2 ;m ) = α; |u| ≥ t1− α2 ;m → ¬H0 χ2 - Anpassungstest k ∑ (hm −npm )2 u= ∼ χ2k−r−1 npm m=1 k Klassen, r unbek. Variablen P (u ≥ χ21−α;k−r−1 |H0 ) = α → u ≥ χ21−α;k−r−1 → H0 ablehnen Markow-Ketten Matrix: Zeilensumme = 1 irreduzibel: Jeder Zustand von jedem Zustand aus mit positiver Wahrsch. erreichbar. ∃n : ∀Pijn > 0 → irreduzibel + aperiodisch Gleichgewichtsverteilung ∑ π · P = π; πi ≥ 0; j∈I πj = 1 ( T ) ! Berechnen von π: P − 1 · I · π = ⃗0 f X+Y (z) = (f X ∗ f Y )(z) = x=0 ∫z f X (x)f Y (z − x)dx 0 Binom.vert. B(n + m, p) = B(n, p) ∗ B(m, p) Poissonvert. π(λ1 ) ∗ π(λ2 ) = π(λ1 + λ2 ) N b+ (1, p) = Geo+ (p) N b+ (r1 + r2 , p) = N b+ (r1 , p) ∗ N b+ (r2 , p) N (a, σ 2 ) ∗ N (b, τ 2 ) = N (a + b, σ 2 + τ 2 ) Zusammenhänge & Approximationen N (a, σ 2 ) → N (0, 1) : Φ(a,σ) (X) → Φ( X−a σ ) n→∞ B(n, p) ⇝ N (np, np(1 − p)) p→0 n→∞ B(n, p) ⇝ π(n · p) N b+ (1, p) = Geo+ (p) Regressionsanalyse N Regressionsgerade s r(x) = ax + b mit a = sxy 2 , b = y − ax x n 1 ∑ 2 emp. Restvarianz: sR = n−2 (yi − y(xi ))2 i=1 Prüfen β2 : H0 : β2 = β20 20 u = b2s−β ∼ tm mit s2β2 = β 2 s2R (n−1)s2X |u| ≥ t1− α2 ;n−2 → H0 ablehnen Prüfen β1 : H0 : β1 = β10 ( ) b1 −β10 1 x2 2 2 u = sβ ∼ tm mit sβ1 = sR n + (n−1)s2 x 1 |u| ≥ t1− α2 ;n−2 → H0 ablehnen Konfidenzintervall β )2 , β1 analog ( b2 −β2 P sβ < t1− α2 ;n−2 = 1 − α 2 ⇒ b2 − t1− α2 ;n−2 sβ2 < β2 < b2 + t1− α2 ;n−2 sβ2 Konfidenzintervall η y(x) − t1− α2 ;n−2 sη < η(x) < y(x) + t1− α2 ;n−2 sη √ ( ) (x−x)2 mit sη (x) = s2R n1 + (n−1)s 2 x Korrelationsanalyse N Ziel: Entscheiden ob X,Y st. u. H0 : ρXY√ = korr(X, Y ) = 0 n−2 XY u = r√ ∼ tn−2 2 1−rXY |u| ≥ t1− α2 ;n−2 → H0 ablehnen ( ) XY oder: W = 12 ln 1+r ( ) 1−rXY 1+r 1 r µW = 2 ln 1−r + 2(n−1) 2 = 1 σW n−3 w u = w−µ σw ∼ N (0, 1) |u| ≥ za− α2 → H0 ablehnen Name diskret Bernoulli Binomial Einpunkt Geo. H(N, K, n) B(p) B(n, p) ϵa Geo+ (p) Geo0 (p) Hypergeo. L({1, ..., N }) Nb+ (p) Dichte f Wr (k) = Laplace Neg. Binomial Nb0 (p) π(λ; k) = e−λ λk! · 1(0,∞) (x) Γ(µ+ν) µ−1 (1 Γ(µ)Γ(ν) x α π(α2 +x2 ) n x x 2 −1 e− 2 n 2 2 Γ( n ) 2 f X (x) = αe−αx 1(0,∞) (x) ( ) (x−a)2 2σ 2 √1 e− σ 2π x2 √1 e− 2 2π )n t2 n ) 2 +...+x2 x1 n 2 − n+1 2 e− 2 − 2 Γ( n+1 ) 2 = √nπΓ( 1 + tn n ) 2 αν ν−1 −αx e 1(0,∞) (x) Γ(ν) x n+1 − x)ν−1 1(0,1) (x) f X1 (1) = p ( ) b(n, p; k) = nk pk (1 − p)n−k f X (a) = 1 f W1 (k) = p(1 − p)k−1 ′ f W1 (k) = p(1 − p)k (K )(N −K ) f Zn (k) = k Nn−k (n) f X (k) = N1 ( ) r k f Wr (k) = k−1 r−1 p (1 − p) ) r (k+r−1 k r−1 p (1 − p) π(λ) beµ,ν (x) = f X (x) = ′ Poisson Be(µ, ν) C(α) fn (x) = k stetig Beta Cauchy χn2 Exp(α) f Zn (t) Chi2 Expontential Fischer-F γ(x) = ϕa,σ (x) = Γα,ν N (a, σ 2 ) Gamma Normal ϕ0,1 (x) = ( 1 b−a 1(a,b) (x) √1 2π f X (x) = Γ( n+1 ) √ 2 n nπΓ( 2 ) ( 1+ f Zn (t) = f X (x1 , ..., xn ) = N (0, 1) t R(a, b) Std.-Normal Std.-Normaln Rechteck Student-t k=0 n ∑ λk k! Verteilungsfunktion Fλ (X) = e−λ x−a b−a 1 2 dt x≤a a<x≤b x>b (t−a) ∫x − √1 2σ 2 −∞ σ 2π e t2 √1 e− 2 dt 2π 0 −∞ ∫x F (x) = (1 − e−αx ) · 1(0,∞) (x) Φ(x) = Φ(x) = F (x) = µ µ+ν λ N +1 2 r p r(1−p) p nK N 1 p 1−p p p np a E µν (µ+ν+1)(µ+ν)2 λ N 2 −1 12 r(1−p) p2 r(1−p) p2 N −K N −n nK N N N −1 1−p p2 1−p p2 p(1 − p) np(1 − p) 0 Var a+b 2 0 a ν α 1 α n n n−2 (b−a)2 12 1 σ2 ν α2 1 α2 2n Ex. nicht 0