∑ ∑ - Hochschule Harz

Werbung
Formelsammlung – Statistik
Christian Reinboth
Formelsammlung – Statistik
1 Empirische Verteilungsfunktion
Empirische Verteilungsfunktion
 0 für x  a
1
 j
F ( x)   fi für a j  x und a j 1  x
 i 1 für x  a
k
 1
Stetige empirische Verteilungsfunktion

0
für x  g 0

x  gi 1
F ( x)   F ( gi 1 ) 
* f i für gi 1  x  gi
di

für x  g k

1
2 Statistische Lagemaße
Arithmetisches Mittel
a) bei unklassierten Daten
x
1 n
 xi
n i 1
b) bei klassierten Daten
k
xg   mi * f i
i 1
Median
a) bei einer ungeraden Anzahl von Werten
b) bei einer geraden Anzahl von Werten
xmed  x n1
xmed 
(
2
)
1
(x n  x n )
( 1)
2 (2)
2
Perzentilwerte
a) ergibt (n * p) keinen ganzzahligen Wert,
b) ergibt (n * p) einen ganzzahligen Wert,
ist k die auf (n * p) folgende ganze Zahl
entspricht k dem Ergebnis von (n * p)
x p  x(k )
1
x p  ( x( k )  x( k 1) )
2
Modus
xmod  ax max
(nur interpretierbar, wenn die Häufigkeitsverteilung ein eindeutiges Maximum besitzt)
Seite 1 von 6
Hochschule Harz
Formelsammlung – Statistik
Christian Reinboth
Geometrisches Mittel
Harmonisches Mittel
x geom  n x1 * ... * xn
x har 
n
n
1
x
i 1
i
3 Streuungsmaße / Dispersionsparameter
Spannweite
Interquartilsabstand (IQR)
ds  xmax  xmin
IQR  x( 0,75)  x( 0, 25)
Empirische Varianz
Standardabweichung
1 n
 ( xi  x) 2
n i 1
s2 
s   s2
Variationskoeffizient
v
s
x
(nur berechenbar, wenn das arithmetische Mittel positiv ausfällt)
Fünf-Werte-Zusammenfassung
x
min
; x0, 25 ; xmed ; x0,75 ; xmax 
4 Verteilungsmaße
Momentenkoeffizient der Schiefe
m3
s3
1 n
m3   ( xn  x)3
n i1
gm 
 1 n

s 
( xi  x) 2 

 n i1



3
3
Quartilskoeffizient der Schiefe
g 0, 25 
( x0, 75  xmed )  ( xmed  x0, 25 )
x0,75  x0, 25
Seite 2 von 6
Hochschule Harz
Formelsammlung – Statistik
Christian Reinboth
Kurtosis / Exzeß
m4
3
s4
1 n
m4   ( x j  x) 4
n j 1
gk 
 1 n

s 
( xi  x) 2 

 n i 1



4
4
5 Zusammenhangsmaße
Bravais-Pearson-Korrelationskoeffizient
n
 (x * y )  n * x * y
r
i 1
i
n
i
 ( xi2 )  n * x *
2
i 1
n
(y
i 1
2
i
)  n* y
2
Konkordanzkoeffizient nach Kendall
2 * ( K  D)
n * (n  1)
tau 
Rangkorrelationskoeffizient nach Spearman
6 *  d i2
rho  1  2
(n  1) * n
6 Lineare Regression
Berechnung des Regressionskoeffizienten
Berechnung des konstanten Glieds
n
b
(x * y )  n * x * y
i
i 1
i
n
(x )  n * x
i 1
2
i
2
a  y b* x
Bestimmtheitsmaß der Regressionsfunktion
R2 
ESS
TSS
TSS = Total Sum of Squares
ESS = Explained Sum of Squares
Seite 3 von 6
Hochschule Harz
Formelsammlung – Statistik
Christian Reinboth
7 Regeln für das Rechnen mit Mengen
Kommutativgesetz
Assoziativgesetz
A B  B  A
A B  B  A
( A  B)  C  A  ( B  C )
( A  B)  C  A  ( B  C )
Distributivgesetz
De Morgansche Regel
( A  B)  C  ( A  C )  ( B  C )
( A  B)  C  ( A  C )  ( B  C )
( A  B)  A  B
( A  B)  A  B
8 Die drei Axiome von Kolmogoroff
Axiom I: Die Wahrscheinlichkeit des Eintretens eines Ereignisses
A eines Zufallsvorgangs ist stets eine nichtnegative reelle Zahl.
P( A)  0
Axiom II: Die Wahrscheinlichkeiten aller möglichen Elementarereignisse eines Zufallsvorgangs ergeben zusammen den Wert 1.
P()  1
Axiom III: Axiom 3: Die Wahrscheinlichkeit der Vereinigungsmenge zweier oder mehrerer Ereignisse
eines Zufallsvorgangs berechnet sich aus der Summe der Einzelwahrscheinlichkeiten der Ereignisse,
wenn diese paarweise disjunkt sind.
P( A  B)  P( A)  P( B) falls P( A  B)  
9 Rechnen mit Wahrscheinlichkeiten
Klassische Wahrscheinlichkeitsdefinition
(nach Piere-Simon Maquis de Laplace)
P( A) 
Summe für A günstigerElementarereignisse
Summe aller möglichen Elementarereignisse
Additionssatz für unvereinbare Ereignisse
P( A  B)  P( A)  P( B)
Additionssatz für beliebige Ereignisse
P( A  B)  P( A)  P( B)  P( A  B)
Multiplikationssatz bei stochastischer Unabhängigkeit
P( A  B)  P( A) * P( B)
Seite 4 von 6
Hochschule Harz
Formelsammlung – Statistik
Christian Reinboth
Satz der totalen Wahrscheinlichkeit
Satz von Bayes
k
P( B)   P( B | Ai ) * P( Ai )
P( Ai | B) 
i 1
P( B | Ai ) * P( Ai )
P( B)
10 Kombinatorik
Wie viele Möglichkeiten existieren für die Auswahl von k aus n Elementen?
Variation (Reihenfolge spielt eine Rolle) im Modell ohne Zurücklegen
n!
(im Sonderfall der Permutation - Auswahl aller Elemente: n! )
(n  k )!
Variation (Reihenfolge spielt eine Rolle) im Modell mit Zurücklegen
nk
Kombination (Reihenfolge spielt keine Rolle) im Modell ohne Zurücklegen
n!
k!*(n  k )!
Kombination (Reihenfolge spielt keine Rolle) im Modell mit Zurücklegen
(n  k  1)!
’
(n  1)!*k!
11 Rechnen mit Zufallsvariablen
Wahrscheinlichkeitsfunktion
Verteilungsfunktion
P( X  x)  f ( xi )
P( X  g )   f ( xi )  F ( g )
Erwartungswert einer Zufallsvariablen
Varianz einer Zufallsvariablen
E ( X )   xi * pi
Var ( X )   ( xi  E ( X ))2 * pi
xi  g
i 1
i i
12 Konfidenzintervalle um den Erwartungswert
Konfidenzintervall um μ bei bekanntem σ
P( x  z
z
(1

(1 )
2
 bei
)
2
*

n
  xz

(1 )
2
*
1 – α = 0,95 und df = 1: 1,96
Seite 5 von 6

n
) 1
z
(1
 bei
)
2
1 – α = 0,99 und df = 1: 2,58
Hochschule Harz
Formelsammlung – Statistik
Christian Reinboth
Konfidenzintervall um μ bei unbekanntem σ
P( x  t
t


(1 ; n 1)
2
(1 ; n 1)
2
*
s
s
   xt 
*
) 1
(
1

;
n

1
)
n 1
n 1
2
bei 1 – α = 0,95 und df = 19: 2,093
t

(1 ; n 1)
2
bei 1 – α = 0,99 und df = 19: 2,861
13 Chi²-Test auf stochastische Unabhängigkeit
Tabellierte Quantile der Chi-Quadrat-Verteilung nach
ausgewählten Wahrscheinlichkeiten und Freiheitsgraden
df/p
1
2
3
4
5
0,005
0,00
0,01
0,07
0,21
0,41
0,01
0,00
0,02
0,11
0,30
0,55
0,025
0,00
0,05
0,22
0,48
0,83
0,05
0,00
0,10
0,35
0,71
1,15
0,1
0,02
0,21
0,58
1,06
1,61
0,5
0,45
1,39
2,37
3,36
4,35
0,9
2,71
4,61
6,25
7,78
9,24
0,95
3,84
5,99
7,81
9,49
11,07
0,975
5,02
7,38
9,35
11,14
12,83
0,99
6,63
9,21
11,34
13,28
15,09
0,995
7,88
10,60
12,84
14,86
16,75
14 Bestimmung der minimalen Stichproben-Größe nach Cochran
Z2 * p*q
e2
n
2
Z * p*q
1
e2
1
N
mit:
n = Stichprobenumfang
N = Größe der Grundgesamtheit
e = Breite des Konfidenzintervalls
p = Stichprobenanteil (falls unbekannt: 0,5)
Seite 6 von 6
q = (1-p)
Z = Z-Wert aus der Standardnormalverteilung für die avisierte
Sicherheit des Konfidenzintervalls
Hochschule Harz
Herunterladen