MAS 2 / Statisik Formelsammlung Seite 1 / 7 Statistik Kombinatorik Anzahl Kombinationen: nk Anzahl Möglichkeiten k aus n Elementen, ⎛ n⎞ n! ⎜ ⎟= k k ! n − k )! ( ⎝ ⎠ n! wenn Reihenfolge eine Rolle spielt: ( n − k )! wenn Reihenfolge keine Rolle spielt: wie viele Möglichkeiten/Kombinationen? TR = Kombinat(n, x) (Permutation) Wahrscheinlichkeitsrechnung p= Anzah l_ günstiger _ Fälle Anzahl _ möglicher _ Fälle Laplace - Wahrscheinlichkeit Rechnen / Lehrsätze sowohl als auch; logisch und = * (Multiplikation) Multiplikationssatz unabhängige Z-Variablen: W ( A ∩ B ) = W ( A) *W ( B ) abhängige Z-Variablen: (allgemeine Formel) W ( A ∩ B ) = W ( A) *W ( B / A) = W ( B ) *W ( A / B ) Additionssatz gegenseitig ausschliessend: entweder oder; logisch oder = + (Addition) W ( A ∪ B ) = W ( A) + W ( B) gegenseitig nicht ausschliessend: (allgemeine Formel) W ( A ∪ B ) = W ( A) + W ( B ) − W ( A ∩ B ) bedingte Wahrscheinlichkeit unabhängige Z-Variablen: W ( A / B ) = W ( A) abhängige Z-Variablen: (allgemeine Formel) W ( A ∩ B) W ( A / B) = W ( B) A unter der Bedingung von B, bzw. A nachdem B eingetroffen ist Differenz von Wahrscheinlichkeiten W ( D) = W ( B − A) = W (B) − W ( A ∩ B) Zufallsexperiment / Zufallsvariablen Erwartungswert diskrete Zufallsvariable X: (einzelne Werte) n E ( X ) = ∑ xi * f ( xi ) = µ E(X) = wie viel im Durchschnitt ? i =1 stetige Zufallsvariable X: f(xi) = Wahrscheinlichkeit bzw. Häufigkeit / Anteil (Messung) ∞ E( X ) = ∫ x * f ( x)dx = µ −∞ Varianz diskrete Zufallsvariable X: n VAR( X ) = V ( X ) = ∑ ⎡⎣ xi 2 * f ( xi ) ⎤⎦ − µ 2 = σ 2 i =1 stetige Zufallsvariable X: ∞ VAR ( X ) = V ( X ) = ∫ ⎡⎣ x −∞ 2 f(x) = Wahrscheinlichkeit V(X) = Streuung * f ( x) ⎤⎦ dx − µ 2 = σ 2 Standardabweichung σ = V (X ) = σ 2 Sabina Düringer Standardabweichung: ca. 2/3 der Werte liegen plus/minus dem arithmetischen Mittel MAS 2 / Statisik Formelsammlung Rechnen Seite 2 / 7 Rechnen mit Zufallsvariablen immer möglich: E(X+Y) = E(X) + E(Y) E(a*X) = a * E(X) V(a*X) = a2 * V(X) bei unabhängigen: σ ( X + Y ) = σ 2 ( X ) + σ 2 (Y ) für die Summe von n unabhängigen Zufallsvariablen mit gleichen µ und σ gilt: µz = n * µ σ z = n *σ 1. Binominalverteilung (diskrete Verteilung, Bernoulli-Experiment, Charakteristik: n-mal ziehen, 2 Möglichkeiten, mit Zurücklegen) Kuzschreibweise: B (n, p) Tabellen Nr. 7, S: 12, Binominalverteilung für Wahrscheinlichkeits- und Verteilungsfunktion Wahrscheinlichkeitsfunktion Zufallsvariable: X Parameter: n und Θ (bzw. p) W ( X = x) ⎛n⎞ ⎝ x⎠ f B ( x; p; n ) = ⎜ ⎟ * p x * (1 − p ) n−x für nur 1 Möglichkeit (z.B. 5 blaue von 6: x = 5, n = 6) X = Diskrete Zufallsgrösse, Anzahl der Erfolge n = Anzahl Versuche p = Wahrscheinlichkeit eines Erfolges bei einem Versuch TR = Kombinat(n, x) Verteilungsfunktion W ( X ≤ x) x ⎛n⎞ n−v FB ( x; p; n ) = ∑ ⎜ ⎟ * p v * (1 − p ) v =0 ⎝ v ⎠ FB (x;p;n) gibt die Wahrscheinlichkeit an, mit der eine B (n, p)-verteilten Zufallsvariable X höchstens den Wert x annehmen kann. W ( X x) = 1−W ( X ≤ x) Verteilungsparameter Erwartungswert: µ = E(X) = n * Θ = n * p Varianz: 2 σ = V(X) = n * Θ * (1 - Θ) = n * p * (1-p) Standardabweichung σ= V (X ) = n * Θ * (1 − Θ ) = n * p * (1 − p ) Hypothesentestverfahren (Binominaltest) Verfahren H0 Nullhypothese (so ist es) H1 Alternativhypothese (das wäre falsch) Sabina Düringer Prüfung H0: - Verwerfungsbereich definieren für α - p von H0 - n (Stichprobe) Prüfung H1: - Annahmebereich definieren für β - p von H1 - n (Stichprobe) (≠ bedeutet zweiseitiger Test mit VL und VR) α= Signifikanzniveau z.B.: W ( X ≤ 5 ) (Wahrscheinlichkeit fälschlicherweise abgelehnt = im Ablehnungsbereich zu sein) 1 – α = Vertrauenswahrscheinlichkeit β= (Wahrscheinlichkeit fälschlicherweise angenommen = im Annahmebereich) MAS 2 / Statisik Formelsammlung Seite 3 / 7 2. Hypergeometrische Verteilung (diskrete Verteilung, abhängige Variablen, ohne Zurücklegen) Kuzschreibweise: H ( N, M, n) Tabellen Nr. 6, S: 11, für Wahrscheinlichkeits- und Verteilungsfunktion Beispiel: Lotto (Wahrscheinlichkeit für einen „Vierer“ Æ N: 45, M: 6, n: 6, X: 4) Wahrscheinlichkeitsfunktion fH = W ( X = x) wenn: ⎛M ⎞ ⎛N −M ⎞ ⎜ ⎟ *⎜ ⎟ ⎝ x ⎠ ⎝ n−x ⎠ f H ( x; N , M , n ) = ⎛N⎞ ⎜ ⎟ ⎝n⎠ n 0, 05 N kann binominal gerechnet werden für x = 0, 1, 2, …, n (sont: fH = 0) N = Gesamt-Anzahl M = Anzahl „gute“ (gesucht) n = Anzahl Stichproben (wie viel genommen?) X = Diskrete Zufallsgrösse, Anzahl Erfolge Verteilungsfunktion FH = W ( X ≤ x) ⎛M ⎞ ⎛N −M ⎞ ⎜ ⎟ *⎜ ⎟ v n−v ⎠ FH ( x; N , M , n ) = ∑ ⎝ ⎠ ⎝ ⎛N⎞ v =0 ⎜ ⎟ ⎝n⎠ x für x = 0, 1, 2, …, n Verteilungsparameter Erwartungswert: µ = E( X ) = n * M N Varianz: σ 2 = V (X ) = n* M N ⎛ M * ⎜1 − N ⎝ ⎞ ⎛ N −n⎞ ⎟ *⎜ ⎟ ⎠ ⎝ N −1 ⎠ 3. Poissonverteilung (diskrete Verteilung, typisch: n sehr gross; p sehr klein) Kuzschreibweise: P ( λ ) Tabellen Nr. 8, S: 14, für Wahrscheinlichkeits- und Verteilungsfunktion Beispiel: Anzahl Geburten / Tag, Anzahl Telefongespräche / Min., Anzahl Maschinenausfälle / Monat etc. - Als vereinfachte Approximation der Binominalverteilung bei grossem Stichprobenraum (n gross) und seltenen Ereignissen (p klein) Wenn nur der Erwartungswert λ, nicht jedoch n und p bekannt sind. - Wahrscheinlichkeitsfunktion W ( X = x ) = f p ( x, λ ) = λx x! * e− λ mit λ = n * p für x = 0, 1, 2… (sonst fP = 0) Verteilungsfunktion x λv v =0 v! W ( X ≤ x ) = FP ( x; λ ) = ∑ Verteilungsparameter Erwartungswert: µ = E(X) = λ = n * p Varianz: 2 σ = V(X) = λ Sabina Düringer * e − λ mit λ = n * p für x = 0, 1, 2… MAS 2 / Statisik Formelsammlung Seite 4 / 7 3. Normalverteilung (stetige Verteilung, glockenförmige Verteilung durch viele einzelne Zufallsvariablen die unabhängig sind) 2 Kuzschreibweise: N ( µ, σ ) Tabellen Nr. 10, S: 11 ff., für Dichte- und Verteilungsfunktion Dichtefunktion fN = ( z; µ , σ ) = σ * 12 * π * e 2 − ( x − µ )2 2*σ 2 f N ( z; 0;1) = z.B.( z = 1; 0,1) Dichtefunktion ist keine Wahrscheinlichkeit! (nur der Abstand zwischen Kurve und x-Achse. Wahrscheinlichkeit ist somit immer 0) e = 2,71828… (Eulersche Zahl) 2 ( 0 = µ, 1 = σ ) µz = n * µ Eigenschaften: für f (x) = fN (x; µ, σ ) Rechnen: x = µ ist wo f (x) maximal wird µ bestimmt Lage der Kurve (wo auf der X-Achse) σ bestimmt die Form der Kurve Wendepunkte liegen bei x = µ - σ bzw. µ + σ die gesamte Fläche zwischen f (x) u. der x-Achste = 1 Verteilungsfunktion Æ f ′ ( µ) = 0 2 ( z;0,1) = ∫ (Maximalstelle) Æ f ″ ( µ ± σ ) = 0 (Wendepunkt) Verteilungsfunktion ist eine Wahrscheinlichkeit. z FN = σ z = n *σ ; f ( z )dz −∞ FN ist Integralfunktion FN ( - z1) = 1 – FN ( z1) -∞ bis z1 FN: FN*: 0 bis z1 FN**: 0 ± z1 Drei-Sigmaregel: µ±σ µ ± 2σ µ ± 3σ = = = 68,27% 95,45% 99,73% Standardisierung: z1 = Beispiele: a−µ σ z2 = b−µ W (a ≤ X ≤ b) = W ( z1 ≤ Z ≤ z2 ) = FN ( z2 ) − FN ( z1 ) σ W ( X ≥ a) = 1 − W ( X ≤ a) W ( X − µ ≤ b) = W ( Z ≤ b ) = W ( Z ≤ c ) = FN** (c ) σ W ( µ − r *σ ≤ X ≤ µ + r *σ ) = FN** (r ) Sabina Düringer MAS 2 / Statisik Formelsammlung Seite 5 / 7 Approximation (diskreter Verteilungen durch die Normalverteilung) Binominalverteilung B(n;p) Laplacebedingung: µ = n* p Für σ 2 9; (σ 3) kann eine binominalver- teilte Zufallsvariable X als normalverteilt behandelt werden. σ = n * p *(1 − p) W (a ≤ X ≤ b) = W ( z1 ≤ Z ≤ z2 ) = FN ( z2 ) − FN ( z1 ) mit: z1 = a − np b − np und z2 = np (1 − p ) np(1 − p ) Stetigkeitskorrektur: 1 a − − np 2 z1 = np (1 − p) Interpolation wenn verlangt und 1 b + − np 2 z2 = np(1 − p) Poissonverteilung P(λ) hinreichende Genauigkeit für µ =λ σ 2 = λ ;(σ = λ ) mit: z1 = a−λ λ und z2 = b−λ λ Interpolation wenn verlangt Stetigkeitskorrektur: z1 = Sabina Düringer a− 1 −λ 2 λ und z2 = b+ 1 −λ 2 λ λ ≥9 MAS 2 / Statisik Formelsammlung Seite 6 / 7 Stichprobenverfahren Schätzverfahren Schätzgrössen werden mit ^ gekennzeichnet. Punktschätzung N: n: Stichprobenparameter: ∧ Mittelwert: Anzahl Elemente der GG Stichprobenumfang der SP (alle gl.gross) X i : Mittelwert der i-ten SP X →µ=X ∧ n Standardabweichung: s → σ = s * n −1 si : µ: σ: k: Standardabweichung der i-ten SP Mittelwert der GG Standardabweichung der GG Anzahl Stichproben (k Æ ∞) (Berechnung von s war durch n, sollte aber durch n-1 sein -> deshalb * n durch n-1) Konfidenzintervall für Mittelwerte Erwartungswert: E( X ) = µX = µ Standardfehler: σX = der GG „Mittelwert aller Mittelwerte“ σ n mit Endlichkeitskorrekturfaktor: V (X ) = σ X = ∧ Schätzwert: σX = σ n s n −1 * N −n N −1 ; für n ≤ 0, 05 N mit Endlichkeitskorrekturfaktor: ∧ σX = s N −n * n −1 N −1 W ( X − z *σ X ≤ µ ≤ X + z *σ X ) = 1 − α Nicht notwendig für α= Fehlerrisiko (Signifikanzniveau, Irrtumswahrscheinl.) 1 - α = Vertrauensintervall (Konfidenz-, Sicherheitsniveau) X= µ= σX = e=z* Mittelwert der Stichprobe Mittelwert der GG Standardfehler des Mittelwerts σX = absoluter Fehler des Mittelwerts aus Tabelle FN** z= Vorgehen: n ≤ 0.05 N z= 1. Endlichkeitskorrektur ? 2. σ X berechnen X −µ ^ σX (Wenn σ X 3. z aus der Tabelle lesen Normalverteilung, wenn geschätzt dann Studentenverteilung.) Beispiel 95%-Konfidenzintervall: z aus Tabelle lesen (= 1,96) Konfidenzintervall für Anteilswerte p= ∧ Mittelwertschätzung: X →µ σP = k n - Anteil p entspricht der Wahrscheinlichk. Aus der Stichprobe - Anteil Θ aus der Grundgesamtheit Anteilswertschätzung: p Æ Θ Standardfehler: also %-Anteil θ * (1 − θ ) n p = Anteilswert der SP Θ = Anteilswert der GG ∧ σ P = geschätzter Standardfehler mit Endlichkeitskorrekturfaktor: σP = Sabina Düringer θ * (1 − θ n N −n * n −1 Nicht notwendig für n ≤ 0.05 N MAS 2 / Statisik Formelsammlung Seite 7 / 7 p * (1 − p ) n −1 ∧ Schätzwert: σP = ; für n ≤ 0, 05 N mit Endlichkeitskorrekturfaktor: ∧ σP = p * (1 − p) N −n * n −1 N −1 ^ ^ W ( p − z *σ p ≤ θ ≤ p + z *σ p ) = 1 − α z= z= Vorgehen: 1. p = k/n ^ 2. σp aus Tabelle FN** berechnen (ggf. Endlichkeitskorr) 3. z aus der Tabelle lesen p −θ ^ σp Beispiel 95%-Konfidenzintervall: z aus Tabelle lesen (= 1,96) 1 - α = FN** (z) = 0,97 Æ z = 2,17 Stichprobenumfang n Æ Ergebnis ganzzahlig (aufgerundet) angeben! e = absoluter Fehler (z.B: ± 1) Æ Abweichung Mittelwert-Schätzung σ ⎞ ⎛ e = z * σ X wobei ⎜ σ X = ⎟ n⎠ ⎝ Notwendiger Stichprobenumfang: n≥ z 2 *σ 2 e2 mit Endlichkeitskorrekturfaktor: n≥ für n 0, 05 N (kann meist erst am Schluss geprüft werden, da n unbekannt ist) z 2 * N *σ 2 e * ( N − 1) + z 2 * σ 2 2 Schätzung des unbekannten σ: ∧ nv nv − 1 σ = sv * mit Endlichkeitskorrekturfaktor: ∧ σ = sv * nv N − nv * nv − 1 N −1 für n 0, 05 N für n 0, 05 N für n 0, 05 N Anteilswert-Schätzung Notwendiger Stichprobenumfang: n≥ z 2 *θ *(1 − θ ) e2 mit Endlichkeitskorrekturfaktor: n≥ z 2 * N *θ * (1 − θ ) e 2 *( N − 1) + z 2 *θ * (1 − θ ) Schätzung des unbekannten σ: θn * (1 − θ ) = pv * (1 − pv ) * nv nv − 1 mit Endlichkeitskorrekturfaktor: θn * (1 − θ ) = pv * (1 − pv ) * Sabina Düringer nv N − nv * nv − 1 N − 1