Formelsammlung – Statistik Christian Reinboth Formelsammlung – Statistik 1 Empirische Verteilungsfunktion Empirische Verteilungsfunktion 0 für x a 1 j F ( x) fi für a j x und a j 1 x i 1 für x a k 1 Stetige empirische Verteilungsfunktion 0 für x g 0 x gi 1 F ( x) F ( gi 1 ) * f i für gi 1 x gi di für x g k 1 2 Statistische Lagemaße Arithmetisches Mittel a) bei unklassierten Daten x 1 n xi n i 1 b) bei klassierten Daten k xg mi * f i i 1 Median a) bei einer ungeraden Anzahl von Werten b) bei einer geraden Anzahl von Werten xmed x n1 xmed ( 2 ) 1 (x n x n ) ( 1) 2 (2) 2 Perzentilwerte a) ergibt (n * p) keinen ganzzahligen Wert, b) ergibt (n * p) einen ganzzahligen Wert, ist k die auf (n * p) folgende ganze Zahl entspricht k dem Ergebnis von (n * p) x p x(k ) 1 x p ( x( k ) x( k 1) ) 2 Modus xmod ax max (nur interpretierbar, wenn die Häufigkeitsverteilung ein eindeutiges Maximum besitzt) Seite 1 von 6 Hochschule Harz Formelsammlung – Statistik Christian Reinboth Geometrisches Mittel Harmonisches Mittel x geom n x1 * ... * xn x har n n 1 x i 1 i 3 Streuungsmaße / Dispersionsparameter Spannweite Interquartilsabstand (IQR) ds xmax xmin IQR x( 0,75) x( 0, 25) Empirische Varianz Standardabweichung 1 n ( xi x) 2 n i 1 s2 s s2 Variationskoeffizient v s x (nur berechenbar, wenn das arithmetische Mittel positiv ausfällt) Fünf-Werte-Zusammenfassung x min ; x0, 25 ; xmed ; x0,75 ; xmax 4 Verteilungsmaße Momentenkoeffizient der Schiefe m3 s3 1 n m3 ( xn x)3 n i1 gm 1 n s ( xi x) 2 n i1 3 3 Quartilskoeffizient der Schiefe g 0, 25 ( x0, 75 xmed ) ( xmed x0, 25 ) x0,75 x0, 25 Seite 2 von 6 Hochschule Harz Formelsammlung – Statistik Christian Reinboth Kurtosis / Exzeß m4 3 s4 1 n m4 ( x j x) 4 n j 1 gk 1 n s ( xi x) 2 n i 1 4 4 5 Zusammenhangsmaße Bravais-Pearson-Korrelationskoeffizient n (x * y ) n * x * y r i 1 i n i ( xi2 ) n * x * 2 i 1 n (y i 1 2 i ) n* y 2 Konkordanzkoeffizient nach Kendall 2 * ( K D) n * (n 1) tau Rangkorrelationskoeffizient nach Spearman 6 * d i2 rho 1 2 (n 1) * n 6 Lineare Regression Berechnung des Regressionskoeffizienten Berechnung des konstanten Glieds n b (x * y ) n * x * y i i 1 i n (x ) n * x i 1 2 i 2 a y b* x Bestimmtheitsmaß der Regressionsfunktion R2 ESS TSS TSS = Total Sum of Squares ESS = Explained Sum of Squares Seite 3 von 6 Hochschule Harz Formelsammlung – Statistik Christian Reinboth 7 Regeln für das Rechnen mit Mengen Kommutativgesetz Assoziativgesetz A B B A A B B A ( A B) C A ( B C ) ( A B) C A ( B C ) Distributivgesetz De Morgansche Regel ( A B) C ( A C ) ( B C ) ( A B) C ( A C ) ( B C ) ( A B) A B ( A B) A B 8 Die drei Axiome von Kolmogoroff Axiom I: Die Wahrscheinlichkeit des Eintretens eines Ereignisses A eines Zufallsvorgangs ist stets eine nichtnegative reelle Zahl. P( A) 0 Axiom II: Die Wahrscheinlichkeiten aller möglichen Elementarereignisse eines Zufallsvorgangs ergeben zusammen den Wert 1. P() 1 Axiom III: Axiom 3: Die Wahrscheinlichkeit der Vereinigungsmenge zweier oder mehrerer Ereignisse eines Zufallsvorgangs berechnet sich aus der Summe der Einzelwahrscheinlichkeiten der Ereignisse, wenn diese paarweise disjunkt sind. P( A B) P( A) P( B) falls P( A B) 9 Rechnen mit Wahrscheinlichkeiten Klassische Wahrscheinlichkeitsdefinition (nach Piere-Simon Maquis de Laplace) P( A) Summe für A günstigerElementarereignisse Summe aller möglichen Elementarereignisse Additionssatz für unvereinbare Ereignisse P( A B) P( A) P( B) Additionssatz für beliebige Ereignisse P( A B) P( A) P( B) P( A B) Multiplikationssatz bei stochastischer Unabhängigkeit P( A B) P( A) * P( B) Seite 4 von 6 Hochschule Harz Formelsammlung – Statistik Christian Reinboth Satz der totalen Wahrscheinlichkeit Satz von Bayes k P( B) P( B | Ai ) * P( Ai ) P( Ai | B) i 1 P( B | Ai ) * P( Ai ) P( B) 10 Kombinatorik Wie viele Möglichkeiten existieren für die Auswahl von k aus n Elementen? Variation (Reihenfolge spielt eine Rolle) im Modell ohne Zurücklegen n! (im Sonderfall der Permutation - Auswahl aller Elemente: n! ) (n k )! Variation (Reihenfolge spielt eine Rolle) im Modell mit Zurücklegen nk Kombination (Reihenfolge spielt keine Rolle) im Modell ohne Zurücklegen n! k!*(n k )! Kombination (Reihenfolge spielt keine Rolle) im Modell mit Zurücklegen (n k 1)! ’ (n 1)!*k! 11 Rechnen mit Zufallsvariablen Wahrscheinlichkeitsfunktion Verteilungsfunktion P( X x) f ( xi ) P( X g ) f ( xi ) F ( g ) Erwartungswert einer Zufallsvariablen Varianz einer Zufallsvariablen E ( X ) xi * pi Var ( X ) ( xi E ( X ))2 * pi xi g i 1 i i 12 Konfidenzintervalle um den Erwartungswert Konfidenzintervall um μ bei bekanntem σ P( x z z (1 (1 ) 2 bei ) 2 * n xz (1 ) 2 * 1 – α = 0,95 und df = 1: 1,96 Seite 5 von 6 n ) 1 z (1 bei ) 2 1 – α = 0,99 und df = 1: 2,58 Hochschule Harz Formelsammlung – Statistik Christian Reinboth Konfidenzintervall um μ bei unbekanntem σ P( x t t (1 ; n 1) 2 (1 ; n 1) 2 * s s xt * ) 1 ( 1 ; n 1 ) n 1 n 1 2 bei 1 – α = 0,95 und df = 19: 2,093 t (1 ; n 1) 2 bei 1 – α = 0,99 und df = 19: 2,861 13 Chi²-Test auf stochastische Unabhängigkeit Tabellierte Quantile der Chi-Quadrat-Verteilung nach ausgewählten Wahrscheinlichkeiten und Freiheitsgraden df/p 1 2 3 4 5 0,005 0,00 0,01 0,07 0,21 0,41 0,01 0,00 0,02 0,11 0,30 0,55 0,025 0,00 0,05 0,22 0,48 0,83 0,05 0,00 0,10 0,35 0,71 1,15 0,1 0,02 0,21 0,58 1,06 1,61 0,5 0,45 1,39 2,37 3,36 4,35 0,9 2,71 4,61 6,25 7,78 9,24 0,95 3,84 5,99 7,81 9,49 11,07 0,975 5,02 7,38 9,35 11,14 12,83 0,99 6,63 9,21 11,34 13,28 15,09 0,995 7,88 10,60 12,84 14,86 16,75 14 Bestimmung der minimalen Stichproben-Größe nach Cochran Z2 * p*q e2 n 2 Z * p*q 1 e2 1 N mit: n = Stichprobenumfang N = Größe der Grundgesamtheit e = Breite des Konfidenzintervalls p = Stichprobenanteil (falls unbekannt: 0,5) Seite 6 von 6 q = (1-p) Z = Z-Wert aus der Standardnormalverteilung für die avisierte Sicherheit des Konfidenzintervalls Hochschule Harz