Formelsammlung Statistik für Business Administration 1

Werbung
Fachbereich Grundlagenwissenschaften
Prof. Dr. Viola Weiß
Sommersemester 2011
Fachhochschule Jena
University of Applied Sciences Jena
Formelsammlung Statistik für Business Administration
1
1.1
Deskriptive Statistik
Eindimensionale Häufigkeitsverteilungen
Merkmal: X
Datenmenge (Stichprobe) vom Umfang n ∈ N: x1 , x2 , ..., xn
geordnete Stichprobe: x(1) , x(2) , ..., x(n) mit x(1) ≤ x(2) ≤ ... ≤ x(n)
Ausprägungen von X (falls X nicht stetiges Merkmal): a1 , a2 , ..., am mit m ∈ N
1.1.1
Häufigkeiten
Absolute Häufigkeit: H(ai ) für i = 1, ..., m
Anzahl des Vorkommens der Ausprägung ai vom Merkmal X in der Stichprobe.
Es gilt: 0 ≤ H(ai ) ≤ n für alle Ausprägungen ai
H(a1 ) + H(a2 ) + ... + H(am ) = n .
Relative Häufigkeit:
h(ai ) =
1
n
H(ai )
für i = 1, ..., m
Anteil des Vorkommens der Ausprägung ai vom Merkmal X in der Stichprobe.
Es gilt: 0 ≤ h(ai ) ≤ 1 für alle Ausprägungen ai
h(a1 ) + h(a2 ) + ... + h(am ) = 1 .
1.1.2
Summenhäufigkeiten (kumulative Häufigkeiten)
Voraussetzung: Die Ausprägungen vom Merkmal X lassen sich der Größe nach ordnen, d.h.
a1 < a2 < ... < am .
Absolute Summenhäufigkeit:
S(ai ) = H(a1 ) + H(a2 ) + ... + H(ai )
i
X
X
=
H(ak ) =
H(ak )
für i = 1, ..., m.
ak ≤ai
k=1
Anzahl des Vorkommens aller Ausprägungen vom Merkmal X in der Stichprobe, die kleiner
oder gleich ai sind.
Es gilt: 0 ≤ S(a1 ) ≤ S(a2 ) ≤ ... ≤ S(am ) = n.
Relative Summenhäufigkeit:
s(ai ) = n1 S(ai ) = h(a1 ) + h(a2 ) + ... + h(ai )
i
X
X
=
h(ak ) =
h(ak )
für i = 1, ..., m.
ak ≤ai
k=1
Anteil des Vorkommens aller Ausprägungen vom Merkmal X in der Stichprobe, die kleiner oder
gleich ai sind.
Es gilt: 0 ≤ s(a1 ) ≤ s(a2 ) ≤ ... ≤ s(am ) = 1.
1
1.1.3
Empirische Verteilungsfunktion
F : R −→ [0, 1] mit

0
x < a1




s(a
)
a

1
1 ≤ x < a2



s(a2 )
a2 ≤ x < a3
X
F (x) =
h(ai ) =
:


:
ai ≤x




s(a
m−1 ) am−1 ≤ x < am


1
am ≤ x
Eigenschaften der empirischen Verteilungsfunktion:
• Treppenfunktion
• monoton wachsend
• Sprungstellen (Unstetigkeitsstellen): Merkmalsausprägungen a1 , ..., am
• Sprunghöhe an Sprungstelle ai : relative Häufigkeit h(ai ), i = 1, ..., m
• rechtsseitig stetig
1.1.4
Mittelwerte
1. Modalwert: xD
Ausprägung vom Merkmal X mit größter vorkommender Häufigkeit in der Stichprobe.
(xD muß nicht eindeutig bestimmt sein.)
2. Median (Zentralwert): xZ
Wert in der Mitte der geordneten Stichprobe, d.h.
(
n ungerade
x( n+1 )
2
xZ =
1
x( n2 ) + x( n2 +1) n gerade
2
(xZ muß nicht mit einem Wert der Stichprobe übereinstimmen.)
3. arithmetisches Mittel: x
n
1X
1
xi
(x1 + x2 + ... + xn ) =
x =
n
n i=1
m
m
X
1X
=
H(ai ) · ai =
h(ai ) · ai
n i=1
i=1
4. geometrisches Mittel: xG
xG =
√
n
x1 · ... · xn =
q
n
H(a1 )
a1
H(am )
· ... · am
h(a1 )
= a1
h(am )
· ... · am
,
falls alle xi , ai > 0.
Äquivalente Formel: lg xG = n1 (lg x1 + ... + lg xn )
5. harmonisches Mittel: xH
xH =
Es gilt:
1
x1
n
+ ... +
1
xn
=
n
H(a1 )
a1
+ ... +
xH ≤ xG ≤ x .
2
H(am )
am
=
1
h(a1 )
a1
+ ... +
h(am )
am
1.1.5
Quantile
α - Quantil für α ∈ (0, 1): xα
Aufteilung der geordneten Stichprobe bezüglich α · 100%, d.h. mindestens α · 100% der Daten
sind kleiner oder gleich xα und mindestens
− α) · 100% derDaten sind größer oder gleich xα .
( (1
1
αn ganzzahling
x(αn) + x(αn+1)
2
Berechnungsvorschrift für xα :
xα =
x([αn]+1)
αn nicht ganzzahlig
[αn] bedeutet ganzzahliger Anteil von αn, z.B. [5, 61] = 5.
Es gilt: x0.5 = xZ .
x0.25 , x0.5 , x0.75 heißen Quartile.
x0.75 − x0.25 heißt Quartilsabstand.
1.1.6
Streuungsmaße
1. Spannweite: w = max{x1 , ..., xn } − min{x1 , ..., xn } = x(n) − x(1)
2. mittlere absolute Abweichung von einem Mittelwert:
n
1X
|xi − x|
dx =
mittlere absolute Abweichung vom arithmetischen Mittel
n i=1
n
1X
|xi − xZ |
dxZ =
mittlere absolute Abweichung vom Zentralwert
n i=1
analoge Formeln mit absoluten oder relativen Häufigkeiten, z.B.:
m
m
X
1X
|ai − xZ | · H(ai ) =
|ai − xZ | · h(ai )
dxZ =
n i=1
i=1
3. Varianz und Standardabweichung:
Varianz s2 – mittlere quadratische Abweichung vom arithmetischen Mittel:
n
m
m
1 X
1 X
n X
2
2
2
(xi − x) =
(ai − x) · H(ai ) =
(ai − x)2 · h(ai )
s =
n − 1 i=1
n − 1 i=1
n − 1 i=1
s
n
√
1 X
Standardabweichung: s = s2 =
(xi − x)2
n − 1 i=1
!
n
X
1
2
2
andere Berechnungsvorschrift für s2 : s2 =
x − n(x)
n − 1 i=1 i
4. Variationskoeffizient: v =
1.1.7
s
falls x 6= 0.
x
Klassierte Daten
Klasseneinteilung der Daten (Stichprobenumfang n) in disjunkte Klassen K1 , ..., Km mit Klassenmitten x∗1 , ..., x∗m und absoluten bzw. relativen Klassenhäufigkeiten der i-ten Klasse H(Ki ), h(Ki ),
i = 1, ..., m.
m
m
X
1X ∗
xi · H(Ki ) =
x∗i · h(Ki )
Dann gilt: x =
n i=1
i=1
m
m
1 X ∗
n X ∗
s =
(xi − x)2 · H(Ki ) =
(xi − x)2 · h(Ki )
n − 1 i=1
n − 1 i=1
2
Andere Formeln analog mit x∗i als Repräsentant für die i-te Klasse Ki , i = 1, ..., m.
3
1.2
Zweidimensionale Häufigkeitsverteilungen
Merkmal X mit Ausprägungen a1 , ..., ap , p ∈ N
Merkmal Y mit Ausprägungen b1 , ..., bq , q ∈ N
Datenmenge (x1 , y1 ), ..., (xn , yn ), n ∈ N
1.2.1
Häufigkeiten, bedingte Häufigkeiten, Unabhängigkeit
Häufigkeiten:
Absolute Häufigkeit: H(ai , bj ) für i = 1, ..., p, j = 1, ..., q
Anzahl des Vorkommens von (ai , bj ) in der Stichprobe.
Relative Häufigkeit: h(ai , bj ) = n1 H(ai , bj ) für i = 1, ..., p, j = 1, ..., q
Absolute Randhäufigkeit für X: H(ai ) = H(ai , b1 ) + ... + H(ai , bq ) für i = 1, ..., p
Relative Randhäufigkeit für X:
h(ai ) = n1 H(ai ) = h(ai , b1 ) + ... + h(ai , bq ) für i = 1, ..., p
Absolute Randhäufigkeit für Y : H(bj ) = H(a1 , bj ) + ... + H(ap , bj ) für j = 1, ..., q
Relative Randhäufigkeit für Y :
h(bj ) = n1 H(bj ) = h(a1 , bj ) + ... + h(ap , bj ) für j = 1, ..., q
Randverteilung von X: H(a1 ), ..., H(ap ) bzw. h(a1 ), ..., h(ap )
Randverteilung von Y : H(b1 ), ..., H(bq ) bzw. h(b1 ), ..., h(bq )
Darstellung: Kontingenztabelle
X
a1
a2
..
.
ap
Spaltensumme
b1
...
bq
Zeilensumme
H(a1 , b1 )
H(a2 , b1 )
..
.
H(ap , b1 )
H(b1 )
...
...
H(a1 , bq )
H(a2 , bq )
..
.
H(ap , bq )
H(bq )
H(a1 )
H(a2 )
..
.
H(ap )
n
Y
...
...
Bedingte Häufigkeiten:
h(ai | bj ) =
h(ai , bj )
H(ai , bj )
=
H(bj )
h(bj )
i = 1, ..., p, j = 1, ..., q und H(bj ) 6= 0
Relative Häufigkeit für das Auftreten der Ausprägung ai unter der Bedingung, daß Y die Ausprägung bj annimmt.
h(bj | ai ) =
H(ai , bj )
h(ai , bj )
=
H(ai )
h(ai )
i = 1, ..., p, j = 1, ..., q und H(ai ) 6= 0
Relative Häufigkeit für das Auftreten der Ausprägung bj unter der Bedingung, daß X die Ausprägung ai annimmt.
Empirische Unabhängigkeit von zwei Merkmalen:
Zwei Merkmale heißen empirisch unabhängig, wenn für alle i = 1, ..., p und j = 1, ..., q gilt:
1
H(ai , bj ) = H(ai ) · H(bj ) bzw. h(ai , bj ) = h(ai ) · h(bj ) .
n
4
1.2.2
Zusammenhangsmaße
1. Kontingenzkoeffizient nach Pearson (für nominale Merkmale X und Y ):
s
χ2
C=
mit
χ2 + n
2
χ =
q
p
X
X
(H(ai , bj ) − Ĥ(ai , bj ))2
Ĥ(ai , bj )
i=1 j=1
und Ĥ(ai , bj ) = n1 H(ai ) · H(bj ) .
Es gilt:
• X,Y empirisch unabhängig ⇐⇒ χ2 = 0 ⇐⇒ C = 0 .
• Je stärker die Abhängigkeit von X und Y ist, desto größer ist C.
s
min(p, q) − 1
<1
• 0≤C≤
min(p, q)
s
C
min(p, q) − 1
.
• Korrigierter Kontingenzkoeffizient: Ckorr =
mit Cmax =
Cmax
min(p, q)
Für Ckorr gilt 0 ≤ Ckorr ≤ 1.
2. Korrelationskoeffizient nach Pearson (für metrische Merkmale X und Y ):
Maßzahl für die Stärke des linearen Zusammenhangs von X und Y :
rXY
n
P
(xi − x)(yi − y)
Cov(X, Y )
i=1
r
rn
=
=
n
P
P
sX · sY
(xi − x)2 ·
(yi − y)2
i=1
mit
i=1
n
1
1 X
(xi − x)(yi − y) =
Cov(X, Y ) =
n − 1 i=1
n−1
n
X
i=1
xi yi − nx y
!
empirische Kovarianz der Merkmale X und Y und
sX , sY – Standardabweichung von X bzw. Y
Es gilt:
• −1 ≤ rXY ≤ 1
• X,Y empirisch unabhängig =⇒ Cov(X, Y ) = 0 =⇒ rXY = 0 .
• Umkehrung gilt nicht, d.h. rXY = 0 6=⇒ X, Y empirisch unabhängig.
• rXY > 0: Je größer rXY , desto stärker ist der lineare Zusammenhang zwischen X, Y .
Der lineare Zusammenhang hat positiven Anstieg, wachsende Werte für X bedeuten
ebenfalls wachsende Werte für Y .
(Analog für rXY < 0, dann hat der lineare Zusammenhang negativen Anstieg.)
3. Rangkorrelationskoeffizient nach Spearman (für ordinale Merkmale X und Y ):
6
rSP = 1 −
n
P
i=1
(Ri − Ri′ )2
(n − 1)n(n + 1)
mit
Ri – Positionsnummer von xi in der geordneten Stichprobe x(1) ≤ ... ≤ x(n) und
Ri′ – Positionsnummer von yi in der geordneten Stichprobe y(1) ≤ ... ≤ y(n)
5
Es gilt:
• −1 ≤ rSP ≤ 1
• rSP > 0: Je größer rSP , desto stärker ist der Zusammenhang zwischen X, Y , wobei
zu wachsenden Rangzahlen Ri von X auch wachsende Rangzahlen Ri′ von Y gehören.
(Analog für rSP < 0, dann gehören zu wachsenden Rangzahlen Ri von X fallende
Rangzahlen Ri′ von Y .)
1.2.3
Regressionsanalyse
Hinweis: Das
P
- Zeichen steht in allen Formeln für
a =
b =
n
.
i=1
1. Gerade (y-x – Regression):
P
n
P
ŷ = a + bx
P
P
P
P
P
y x2i − x (xi yi )
x2i · yi − xi · (xi yi )
P
P
=
n x2i − ( xi )2
(n − 1)s2X
P
P
P
(xi yi ) − xi · yi
Cov(X, Y )
P 2
P 2
=
n xi − ( xi )
s2X
x̂ = a′ + b′ y
2. Gerade (x-y – Regression):
P
P
P 2 P
P
P
x yi2 − y (xi yi )
yi · xi − yi · (xi yi )
′
P
P
=
a =
n yi2 − ( yi )2
(n − 1)s2Y
b
′
=
n
P
P
P
(xi yi ) − xi · yi
Cov(X, Y )
P 2
P 2
=
n yi − ( yi )
s2Y
Es gilt: Die linearen y-x – und x-y – Regressionsfunktionen schneiden sich im Punkt (x, y).
Verwendete Formeln:
3. Parabel:
a, b und
P
yi
P
xi yi
P 2
xi yi
P
xi und y = n1
yi
P
P
1
1
s2X = n−1
(xi − x)2 und s2Y = n−1
(yi − y)2
P
1
Cov(X, Y ) = n−1
(xi − x)(yi − y)
x=
1
n
P
ŷ = a + bx + cx2
c sind Lösung des linearen
P
= a·n
+ b · xi
P
P
= a · xi + b · x2i
P
P
= a · x2i + b · x3i
4. Potenzfunktion:
ŷ = a · xb
Gleichungssystems:
P
+ c · x2i
P
+ c · x3i
P
+ c · x4i
P
P
P
P
(log xi )2 · log yi − log xi · (log xi · log yi )
P
P
log a =
n (log xi )2 − ( log xi )2
b =
n
P
P
P
(log xi · log yi ) − log xi · log yi
P
P
n (log xi )2 − ( log xi )2
6
5. Exponentialfunktion:
P
log a =
n
log b =
x2i ·
P
P
ŷ = a · bx ,
b>0
P
P
log yi − xi · (xi · log yi )
P
P
n x2i − ( xi )2
P
P
(xi · log yi ) − xi · log yi
P
P
n x2i − ( xi )2
k
, b < 0 mit bekannter Sättigungsgrenze k
1 + ea+bx
P 2 P
P
P
xi · ln( yki − 1) − xi · (xi · ln( yki − 1))
P
P
a =
n x2i − ( xi )2
6. Logistische Funktion:
b =
n
P
ŷ =
P
P
(xi · ln( yki − 1)) − xi · ln( yki − 1)
P
P
n x2i − ( xi )2
Bestimmtheitsmaß:
n
P
B = i=1
n
P
i=1
(ŷi − y)2
(yi −
mit ŷi = f (xi ) für die Regressionsfunktion f .
y)2
Bei dieser Definition von B muß die Regressionsfunktion f von einem der oben genannten
Funktionstypen sein (linear in den Regressionsparametern).
Es gilt:
• 0≤B≤1
• B beschreibt den Anteil der Varianz der Stichprobe, der durch die gewählte Regressionsfunktion erklärt wird. D.h. je größer B ist, umso besser ist der gewählte Funktionstyp
geeignet zur Beschreibung des Zusammenhangs von X und Y .
2
• Bei linearer Regression gilt B = rXY
.
1.3
Zeitreihen
Metrisches Merkmal X, Beobachtungszeitpunkte t1 , ..., tn
Stichprobe (t1 , x1 ), ..., (tn , xn )
Komponenten einer Zeitreihe: Trend T
konjunkturelle Komponente K
Saisonkomponente S
Restkomponente R
vereinfachte Modelle:
additives Modell
X =T +S
multiplikatives Modell
X =T ·S
7
1.3.1
Methoden der Trendermittlung
1. Regression
Formeln siehe Regressionsanalyse bei zweidimensionalen Häufigkeitsverteilungen, z.B.
Gerade:
x̂ = a + bt
P 2 P
P
P
ti · xi − ti · (ti xi )
P
P
a =
n t2i − ( ti )2
P
P
P
n (ti xi ) − ti · xi
P
P
b =
n t2i − ( ti )2
Hinweise: Auf Transformation der Zeitpunkte achten!
n
P
P
.
Das
- Zeichen steht in allen Formeln für
i=1
2. Glättung durch gleitende Durchschnitte
Ordnung: Anzahl benachbarter Werte der Zeitreihe, aus denen das arithmetische
Mittel gebildet wird.
• ungerade Ordnung, d.h. j = 3, 5, 7, ...:
1
(x1
j
1
(x2
j
+ ... + xj )
+ ... + xj+1 )
.
.
.
1
(xn−j+1 + ... + xn )
j
Aus n Werten der Zeitreihe ergeben sich nach dem Glätten mit ungerader Ordnung
j noch n − j + 1 Werte.
• gerade Ordnung, d.h. j = 2, 4, 6, ...:
1 1
( x
j 2 1
1 1
( x
j 2 2
+ x2 + ... + xj + 12 xj+1 )
+ x3 + ... + xj+1 + 12 xj+2 )
.
.
.
1 1
( x
+ xn−j+1 + ... + xn−1 + 12 xn )
j 2 n−j
Aus n Werten der Zeitreihe ergeben sich nach dem Glätten mit gerader Ordnung j
noch n − j Werte.
3. Exponentielles Glätten
Exponentielles Glätten 1. Ordnung mit Startwert x̃1 und Glättungsfaktor α ∈ (0, 1):
für t = 2, ..., n
x̃t = αxt−1 + (1 − α)x̃t−1
Wahl des Startwertes x̃1 z.B. x̃1 = x1 .
Auswirkung des Glättungsfaktors α:
α dicht bei 1 =⇒ starke Brücksichtigung „ jüngerer“ Werte der Zeitreihe,
α dicht bei 0 =⇒ starke Brücksichtigung „älterer“ Werte der Zeitreihe.
Erstellung kurzfristiger Prognosen: x∗ = x̃n+1 = αxn + (1 − α)x̃n
8
1.3.2
Ermittlung der Saisonkomponente
Ausgangspunkt:
Gegeben:
Bezeichnungen:
Zeitreihe mit periodischen saisonalen Einflüssen
Beobachtungswerte von X für P Perioden mit je k Unterzeiträumen
z.B. P Jahre mit je 12 Monaten oder je 4 Quartalen
xp,j – Beobachtungswert für den j-ten Unterzeitraum in der p-ten Periode,
p = 1, ..., P , j = 1, ..., k
x̂p,j – Trendwert für den j-ten Unterzeitraum in der p-ten Periode,
p = 1, ..., P , j = 1, ..., k (ermittelt z.B. durch Regression)
Saisonkomponente sp,j für den j-ten Unterzeitraum in der p-ten Periode, p = 1, ..., P ,
j = 1, ..., k:
für additives Modell:
sp,j = xp,j − x̂p,j
,
für multiplikatives Modell:
sp,j =
xp,j
x̂p,j
.
mittlere Saisonkomponente sj für den j-ten Unterzeitraum, j = 1, ..., k:
sj =
1
(s1,j
P
+ ... + sP,j )
Prognosewert x∗P +1,j für den j-ten Unterzeitraum in Periode P + 1, j = 1, ..., k:
für additives Modell:
x∗P +1,j = x̂P +1,j + sj
für multiplikatives Modell:
x∗P +1,j = x̂P +1,j · sj
9
,
.
1.4
Indexzahlen
Hinweis: Das
P
- Zeichen steht in allen Formeln für
n
P
. Dabei bezeichnet n die Anzahl der
i=1
betrachteten Güter.
Index nach
Preisindex
P
ILA;t
0 ,t
LASPEYRES
PAASCHE
IPPA;t0 ,t
LOWE
P
ILO;t
0 ,t
FISHER
IFP;t0 ,t =
P
=P
P
=P
Mengenindex
(t) (0)
p i qi
(0) (0)
p i qi
P
M
ILA;t
0 ,t
=P
(t) (t)
p i qi
(0) (t)
p i qi
P
=P
IPMA;t0 ,t
=P
(t)
p i qi
(0)
p i qi
q
P
ILA;t
· IPPA;t0 ,t
0 ,t
M
ILO;t
0 ,t
IFM;t0 ,t =
P
q
(t) (0)
qi p i
(0) (0)
qi p i
(t) (t)
qi p i
(0) (t)
qi p i
P
=P
(t)
qi p i
(0)
qi p i
M
ILA;t
· IPMA;t0 ,t
0 ,t
Dabei bedeuten für i = 1, ..., n
qi
(0)
:
Menge des Gutes i in der Basisperiode t0 ,
(t)
qi
(0)
pi
(t)
pi
:
Menge des Gutes i in der Berichtsperiode t,
:
Preis des Gutes i in der Basisperiode t0 ,
:
Preis des Gutes i in der Berichtsperiode t.
Hinweis zu den Größen qi und pi in den Formeln von LOWE, i = 1, ..., n:
t
1 X (k)
qi =
q
t + 1 k=0 i
(arithmetisches Mittel der Werte der Perioden 0 bis t),
t
1 X (k)
p
pi =
t + 1 k=0 i
(arithmetisches Mittel der Werte der Perioden 0 bis t).
10
2
Wahrscheinlichkeitsrechnung
2.1
Zufällige Ereignisse und Wahrscheinlichkeiten
Zufallsexperiment: Experiment, dessen mögliche Versuchsausgänge bekannt sind, dessen konkretes Ergebnis aber nicht vorhersagbar ist.
Grundraum Ω: Menge aller möglichen Versuchsausgänge eines Zufallsexperiments.
Zufälliges Ereignis A: Teilmenge vom Grundraum, d.h. A ⊆ Ω.
Das zufällige Ereignis A tritt ein bei Durchführung des Zufallsexperimentes, wenn der konkrete
Versuchsausgang ω zu A gehört, d.h. ω ∈ A.
Elementarereignis: {ω}, einelementige Teilmenge von Ω, {ω} ⊆ Ω,
sicheres Ereignis: Ω, tritt immer ein bei Durchführung des Zufallsexperimentes, Ω ⊆ Ω,
unmögliches Ereignis: ∅, tritt nie ein bei Durchführung des Zufallsexperimentes, ∅ ⊆ Ω.
Zufällige Ereignisse sind Mengen!
Übertragung von Operationen für Mengen auf zufällige Ereignisse:
A⊆B
A zieht B nach sich, d.h.,
wenn A eintritt, dann tritt auch B ein.
C = A ∪ B Summe der Ereignisse A und B, d.h.
C tritt genau dann ein, wenn mindestens eins der Ereignisse A, B eintritt.
Analog für C = A1 ∪ ... ∪ An .
D = A ∩ B Produkt der Ereignisse A und B, d.h.
D tritt genau dann ein, wenn beide Ereignisse A, B eingetreten sind.
Analog für D = A1 ∩ ... ∩ An .
E = A \ B Differenz der Ereignisse, d.h.
E tritt genau dann ein, wenn A eintritt und B nicht eintritt.
Die Differenz ist nicht kommutativ, d.h. A \ B 6= B \ A.
A = Ω \ A komplementäres Ereignis (Gegenereignis), d.h.
A tritt genau dann ein, wenn A nicht eintritt.
Es gilt: A ∪ A = Ω , A ∩ A = ∅ , (A) = A ,
A∪B =A∩B , A∩B =A∪B ,
A\B =A∩B ,
(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) , (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) .
Zwei Ereignisse A und B heißen disjunkt (unvereinbar), wenn sie nicht gleichzeitig eintreten
können, d.h. A ∩ B = ∅.
Das Mengensystem F heißt Ereignisfeld zum Grundraum Ω, wenn gilt:
1. Ω ∈ F .
2. Wenn A ∈ F =⇒ A ∈ F .
∞
S
Ai ∈ F) .
3. Wenn A, B ∈ F =⇒ A ∪ B ∈ F . (Wenn A1 , A2 , ... ∈ F =⇒
i=1
1. Klassische Definition der Wahrscheinlichkeit (Laplace):
Voraussetzungen Laplace-Prinzip:
• Endlicher Grundraum Ω = {ω1 , ..., ωn } bestehend aus n möglichen Versuchsausgängen und
• alle Versuchsausgänge sind gleichberechtigt hinsichtlich der Chance ihres Eintretens
bei Durchführung des Zufallsexperimentes.
11
Dann gilt für k ≤ n und A = {ωi1 , ..., ωik } ⊆ Ω
P (A) =
k
Anzahl günstiger Fälle für das Eintreten von A
=
n
Anzahl aller möglichen Fälle
Damit gilt für die Elementarereignisse: P ({ω1 }) = ... = P ({ωn }) =
1
n
.
.
Anwendung: Urnenmodell
Aus einer Urne mit N Kugeln, wobei M der Kugeln weiß und N −M schwarz sind, werden
n Kugeln ohne Zurücklegen gezogen, M ≤ N , n ≤ N . Es sei Ak das zufällige Ereignis,
daß genau k weiße Kugeln gezogen werden, k ≤ n und k ≤ M . Dann gilt:
P (Ak ) =
M
k
N −M
·
n−k
N
n
.
2. Statistische Definition der Wahrscheinlichkeit (von Mises):
n
m
hn (A) =
m
n
– Anzahl der Durchführungen eines Zufallsexperimentes,
– Anzahl des Eintretens eines zufälligen Ereignisses A, m ≤ n,
– relative Häufigkeit für das Eintreten von A.
Statistische Wahrscheinlichkeit für A:
P (A) = lim hn (A)
n→∞
.
3. Axiomatische Definition der Wahrscheinlichkeit (Kolmogorov):
Für einen Grundraum Ω mit Ereignisfeld F heißt die Funktion P : F −→ [0, 1], die jedem
A ∈ F eine reelle Zahl P (A) zuordnet, Wahrscheinlichkeit (Wahrscheinlichkeitsmaß),
wenn gilt:
Axiom 1:
Axiom 2:
Axiom 3:
Axiom 3a:
0 ≤ P (A) ≤ 1 für alle A ∈ F .
P (Ω) = 1 .
Für A, B ∈ F mit A ∩ B = ∅ gilt
P (A ∪ B) = P (A) + P (B) (Additivität).
Für A1 , A2 , ... ∈ F mit Ai ∩ Aj = ∅ für alle i 6= j gilt
P (A1 ∪ A2 ∪ ...) = P (A1 ) + P (A2 ) + ... (σ-Additivität).
Das Tripel [Ω, F, P ] heißt Wahrscheinlichkeitsraum.
Aus den Axiomen werden weitere Eigenschaften von P abgeleitet:
1. P (∅) = 0 ,
2. P (A) = 1 − P (A) für alle A ∈ F ,
3. P (A) ≤ P (B) für A, B ∈ F mit A ⊆ B ,
4. P (B \ A) = P (B) − P (A ∩ B) für alle A, B ∈ F und
P (B \ A) = P (B) − P (A) für A, B ∈ F mit A ⊆ B ,
5. P (A ∪ B) = P (A) + P (B) − P (A ∩ B) für alle A, B ∈ F ,
6. P (A) = P ({ωi1 }) + ... + P ({ωik }) für A ∈ F mit A = {ωi1 , ..., ωik }
12
Bedingte Wahrscheinlichkeit:
Es sei [Ω, F, P ] ein Wahrscheinlichkeitsraum und A, B ∈ F seien zwei zufällige Ereignisse mit
P (B) > 0.
Dann ist die bedingte Wahrscheinlichkeit des Eintretens von A unter der Bedingung B
gegeben durch
P (A|B) =
P (A ∩ B)
P (B)
.
Multiplikationssatz:
Für zwei Ereignisse A, B gilt:
P (A ∩ B) = P (A|B) · P (B) = P (B|A) · P (A)
.
Für n Ereignisse A1 , ..., An gilt:
P (A1 ∩ ... ∩ An ) = P (A1 ) · P (A2 |A1 ) · P (A3 |A1 ∩ A2 ) · ... · P (An |A1 ∩ ...An−1 )
.
Unabhängigkeit von zufälligen Ereignissen:
Zwei Ereignisse A, B heißen stochastisch unabhängig, wenn gilt
P (A ∩ B) = P (A) · P (B)
.
Die Ereignisse A1 , ..., An heißen vollständig unabhängig, wenn für jede Teilmenge bestehend
aus k Ereignissen Ai1 , ...Aik , 2 ≤ k ≤ n, i1 , ..., ik ∈ {1, ..., n} gilt
.
P (Ai1 ∩ ... ∩ Aik ) = P (Ai1 ) · ... · P (Aik )
Formel der totalen Wahrscheinlichkeit:
Es sei A1 , ..., An ein vollständiges System zufälliger Ereignisse, d.h.
A1 ∪ ... ∪ An = Ω,
Ai ∩ Aj = ∅ für alle i, j ∈ {1, ..., n} mit i 6= j und
P (Ai ) > 0 für alle i = 1, ..., n.
Dann gilt für das Ereignis B ∈ F
P (B) = P (B|A1 ) · P (A1 ) + ... + P (B|An ) · P (An )
.
Formel von Bayes:
Unter obigen Voraussetzungen gilt für B ∈ F mit P (B) > 0 und für i = 1, ..., n
P (Ai |B) =
2.2
P (B|Ai ) · P (Ai )
P (B|Ai ) · P (Ai )
= Pn
P (B)
k=1 P (B|Ak ) · P (Ak )
.
Zufallsgrößen und ihre Verteilungen
Zufallsgröße: Eine Zufallsgröße X : Ω −→ R ist eine Funktion, die jedem
Versuchsausgang ω ∈ Ω eine reelle Zahl X(ω) zuordnet.
(Außerdem muß für alle t ∈ R gelten X −1 ((−∞, t]) ∈ F.)
Verteilungsfunktion: Für eine Zufallsgröße X heißt die Funktion FX : R −→ [0, 1] mit
FX (x) = P (X ≤ x)
Verteilungsfunktion der Zufallsgröße X.
13
Die Verteilungsfunktion FX hat folgende Eigenschaften:
• lim FX (x) = 0 ,
x→−∞
lim FX (x) = 1 .
x→∞
• FX ist monoton wachsend.
• FX ist rechtsseitig stetig.
Umgekehrt ist jede Funktion mit diesen Eigenschaften Verteilungsfunktion einer Zufallsgröße.
2.2.1
Diskrete Zufallsgrößen
Eine Zufallsgröße X heißt diskret, wenn X endlich viele Realisierungen x1 , ..., xn oder abzählbar
unendlich viele Realisierungen x1 , x2 , ... hat.
Verteilung von X:
P (X = x1 ) = p1 , ... , P (X = xn ) = pn mit p1 + ... + pn = 1 bzw.
P (X = x1 ) = p1 , P (X = x2 ) = p2 , .... mit p1 + p2 + ... = 1
Verteilungsfunktion von X:
FX (x) = P (X ≤ x) =
X
pk
k:xk ≤x
Die Verteilungsfunktion einer diskreten Zufallsgröße ist eine Treppenfunktion mit Sprungstellen
x1 , x2 , ... und Sprunghöhe pk an Sprungstelle xk für k = 1, ..., n bzw. k = 1, 2, ...
Erwartungswert EX von X:
EX =
n
X
k=1
xk · P (X = xk ) =
(EX existiert, wenn
∞
X
k=1
n
X
k=1
xk · pk bzw. EX =
∞
X
k=1
xk · P (X = xk ) =
∞
X
k=1
xk · p k
|xk | · pk < ∞.) Varianz (Streuung) Var(X) von X:
Var(X) = E(X − EX)2 =
n
X
k=1
(xk − EX)2 · P (X = xk ) =
Andere Berechnungsvorschrift: Var(X) =
n
X
k=1
n
X
(xk − EX)2 · pk
k=1
x2k · pk − (EX)2 .
Analoge Formeln, wenn X abzählbar unendlich viele Werte annehmen kann.
p
Standardabweichung: Var(X)
2.2.2
Stetige Zufallsgrößen
Eine Zufallsgröße X heißt stetig, falls sich die Verteilungsfunktion FX schreiben läßt als:
FX (x) =
Zx
fX (t)dt
−∞
wobei fX eine reellwertige nichtnegative Funktion ist.
Man nennt dann fX Dichte der Zufallsgröße X.
14
,
Die Dichte fX hat folgende Eigenschaften:
Z∞
fX (t)dt = 1
•
−∞
• FX′ (x) = fX (x) für alle Stetigkeitsstellen x von FX .
• Für x1 < x2 gilt:
P (x1 < X ≤ x2 ) = P (X ≤ x2 ) − P (X ≤ x1 ) = FX (x2 ) − FX (x1 ) =
Erwartungswert EX von X:
EX =
Z∞
Zx2
fX (t)dt
x1
x · fX (x)dx
−∞
Varianz Var(X) von X:
Var(X) =
Z∞
(x − EX)2 · fX (x)dx
−∞
(Erwartungswert und Varianz existieren, falls
Z∞
|x| · fX (x)dx < ∞.)
−∞
Standardabweichung:
p
Var(X)
Quantile xq von X:
Für eine stetige Zufallsgröße X mit Verteilungsfunktion FX und Dichte fX und für q mit
0 < q < 1 heißt die reelle Zahl xq Quantil der Ordnung q (q-Quantil), wenn gilt:
FX (xq ) = P (X ≤ xq ) =
Zxq
fX (t)dt = q .
−∞
Für q = 0.5 heißt das 0.5-Quantil x0.5 Median von X.
Eigenschaften von Erwartungswert und Varianz diskreter und stetiger Zufallsgrößen:
Für zwei Zufallsgrößen X, Y und reelle Zahlen a, b ∈ R gilt:
E(aX + b) = aEX + b ,
Var(aX + b) = a2 Var(X) ,
E(X + Y ) = EX + EY .
Für zwei unabhängige Zufallsgrößen X, Y gilt außerdem:
E(X · Y ) = EX · EY ,
Var(X + Y ) = Var(X) + Var(Y ) .
2.2.3
Spezielle diskrete Zufallsgrößen
1. Diskrete Gleichverteilung auf x1 , ..., xn
P (X = x1 ) = ... = P (X = xn ) =
Erwartungswert:
Varianz:
EX = n1 (x1 + ... + xn )
Var(X) = n1 (x21 + ... + x2n ) −
15
1
(x1
n2
1
n
+ ... + xn )2
2. Hypergeometrische Verteilung
Parameter M, N, n ∈ N mit M ≤ N und n ≤ N
N −M
M
·
n−k
k
für k = 0, 1, ..., n
P (X = k) =
mit k ≤ M und k ≥ n + M − N
N
n
Erwartungswert:
Varianz:
Schreibweise:
EX = n · M
N
· (1 −
Var(X) = n · M
N
X ∼ H(N ; M ; n)
M
)
N
· (1 −
n−1
)
N −1
Modell: Aus einer Urne mit N Kugeln, von denen M weiß und N −M schwarz sind, werden
nach dem Laplace-Prinzip n Kugeln entnommen (ohne Zurücklegen). Die Zufallsgröße X,
die die Anzahl entnommener weißer Kugeln zählt, ist hypergeometrisch verteilt.
3. Binomialverteilung
Parameter n ∈ N und p ∈ [0, 1]
P (X = k) =
Erwartungswert:
Varianz:
Schreibweise:
n
k
pk (1 − p)n−k
für k = 0, 1, ..., n
EX = n · p
Var(X) = n · p · (1 − p)
X ∼ B(n; p)
Modell: Ein zufälliges Ereignis A tritt mit Wahrscheinlichkeit p bei Durchführung eines
Zufallsexperiments ein. Dieses Experiment wird n mal unabhängig voneinander unter
gleichen Bedingungen durchgeführt. Die Zufallsgröße X, die zählt, wie oft das Ereignis A
eintritt, ist binomialverteilt.
Dieses Modell entspricht dem Urnenmodell und Ziehen von Kugeln mit Zurücklegen.
Zusammenhang Binomialverteilung - hypergeometrische Verteilung:
−M
und n ≤ N 10
kann man die Binomialverteilung mit p =
Für n ≤ M
10
die hypergeometrische Verteilung verwenden.
M
N
als Näherung für
4. Poisson-Verteilung
Parameter λ > 0
P (X = k) =
Erwartungswert:
Varianz:
Schreibweise:
λk −λ
·e
k!
für k = 0, 1, ...
EX = λ
Var(X) = λ
X ∼ Π(λ)
Anwendung: Man betrachtet Ereignisse, die unabhängig voneinander eintreten, z.B Telefonanrufe in einer Zentrale, zerfallende Atomkerne einer radioaktiven Substanz, Verkehrsunfälle an einer Kreuzung. Im Mittel treten λ solcher Ereignisse in einem Zeitraum ein.
Die Zufallsgröße X, die die Anzahl eintretender Ereignisse zählt, ist poisson-verteilt.
Zusammenhang Binomialverteilung - Poissonverteilung:
Für großes n und kleines p (Faustregel: n ≥ 100, n·p ≤ 9) kann man die Poisson-Verteilung
mit Parameter λ = n · p als Näherung für die Binomialverteilung verwenden.
16
5. Geometrische Verteilung
Parameter p ∈ (0, 1)
P (X = k) = (1 − p)k−1 · p für k = 1, 2, ...
1
p
Erwartungswert:
EX =
Varianz:
Var(X) =
1−p
p2
Modell: Ein zufälliges Ereignis A tritt mit Wahrscheinlichkeit p bei Durchführung eines
Zufallsexperiments ein. Die Zufallsgröße X, die die Versuche bis zum ersten Eintreten von
A zählt, ist geometrisch verteilt.
2.2.4
Spezielle stetige Zufallsgrößen
1. Stetige Gleichverteilung im Intervall [a, b]

x < a oder b ≤ x
 0
Dichte fX (x):
fX (x) =
1

a≤x<b
b−a


0
x<a


x−a
Verteilungsfunktion FX (x):
FX (x) =
a≤x<b

a

 b−
1
b≤x
a+b
2
Erwartungswert:
EX =
Varianz:
Var(X) =
(b−a)2
12
2. Normalverteilung
Parameter µ ∈ R und σ > 0
Dichte fX (x):
Erwartungswert:
Varianz:
Schreibweise:
(x−µ)2
1
fX (x) = √ · e− 2σ2
σ 2π
EX = µ
Var(X) = σ 2
Standardabweichung: σ
X ∼ N (µ, σ) oder X ∼ N (µ, σ 2 )
Die zugehörige Verteilungsfunktion FX (x) = Φµ,σ2 (x) kann nicht explizit angegeben werden.
Wichtiger Spezialfall: µ = 0 und σ 2 = 1.
N (0, 1) heißt Standardnormalverteilung.
Die Verteilungsfunktion Φ0,1 der Standardnormalverteilung ist in tabellarischer Form gegeben (siehe Kapitel 4).
x−µ
Φµ,σ2 (x) = Φ0,1
.
Es gilt folgender Zusammenhang:
σ
Für die Standardnormalverteilung gilt:
Φ0,1 (−x) = 1 − Φ0,1 (x) für alle x ∈ R .
17
Berechnung von Wahrscheinlichkeiten für X ∼ N (µ, σ 2 ):
• P (X ≤ x) = Φµ,σ2 (x) = Φ0,1 ( x−µ
)
σ
) = Φ0,1 ( µ−x
)
• P (X ≥ x) = 1 − P (X ≤ x) = 1 − Φµ,σ2 (x) = 1 − Φ0,1 ( x−µ
σ
σ
• P (a ≤ X ≤ b) = P (X ≤ b) − P (X ≤ a) =
= Φµ,σ2 (b) − Φµ,σ2 (a) = Φ0,1 ( b−µ
) − Φ0,1 ( a−µ
)
σ
σ
Anwendung: Eine Zufallsgröße X, die z.B. zufällige Meß- und Beobachtungsfehler oder
zufällige Größen-, Längen-, Gewichtsangaben oder zufällige Abweichungen von einem Sollwert beschreibt, ist normalverteilt.
3. Exponentialverteilung
Parameter a > 0
fX (x) =
Dichte fX (x):
Verteilungsfunktion FX (x):
Erwartungswert:
Varianz:
Schreibweise:
0
ae−ax
x≤0
x>0
FX (x) =
0
1 − e−ax
x≤0
x>0
EX = a1
Var(X) = a12
X ∼ exp(a)
Anwendung: Eine Zufallsgröße X, die z.B. die Lebensdauer von Bauelementen oder die
Bedienzeit von Kunden oder Reparaturzeiten oder Zerfallszeiten radioaktiver Substanzen
beschreibt, ist exponentialverteilt.
18
3
Induktive Statistik
3.1
Parameterschätzungen
Mathematische Stichprobe:
(X1 , ...Xn )
unabhängig identisch verteilte Zufallsgrößen
Konkrete Stichprobe:
(x1 , ..., xn ) ∈ Rn
Realisierungen der Zufallsgrößen
Schätzfunktion:
(oder Stichprobenfunktion)
T (X1 , ..., Xn )
(T (X1 , ..., Xn ) ist eine neue Zufallsgröße mit Wert
T (x1 , ..., xn ) bei konkreter Stichprobe (x1 , ..., xn ).)
3.1.1
Punktschätzungen
Ziel: Schätzung eines unbekannten Parameters ϑ der Verteilung von X1 , ..., Xn durch eine geeignete Stichprobenfunktion T (X1 , ..., Xn ), die gewissen Gütekriterien (siehe Vorlesung, Literatur)
genügt.
Spezielle Punktschätzer:
n
• Schätzung für den Erwartungswert der X1 , ..., Xn :
1X
X=
Xi
n i=1
n
• Schätzung für die Varianz der X1 , ..., Xn :
S2 =
1 X
(Xi − X)2
n − 1 i=1
• Für Xi 0-1-verteilt, d.h. P (Xi = 1) = p und P (Xi = 0) = 1 − p für i = 1, ..., n
n
1X
Schätzung für die Wahrscheinlichkeit p von Xi :
Xi
P̂ =
n i=1
Berechnung des konkreten Schätzwertes x, s2 , p̂ durch Einsetzen der Werte x1 , ..., xn der konkreten Stichprobe in die jeweilige Schätzfunktion X, S 2 , P̂ .
3.1.2
Intervallschätzungen
Ziel: Bestimmen von Zufallsgrößen Gu (X1 , ..., Xn ) und Go (X1 , ..., Xn ), so daß für den unbekannten Parameter ϑ gilt:
P (Gu (X1 , ..., Xn ) ≤ ϑ ≤ Go (X1 , ..., Xn )) = 1 − α , 0 < α < 1 .
Dann heißt:
[Gu ; Go ] –
1−α
–
α
–
zweiseitiges Konfidenzintervall
Konfidenzniveau
Irrtumswahrscheinlichkeit
Mit einer Wahrscheinlichkeit von 1 − α überdeckt das Konfidenzintervall [Gu ; Go ] den unbekannten Parameter ϑ.
19
Einseitige Konfidenzintervalle:
(−∞ ; Go ) mit P (ϑ ≤ Go (X1 , ..., Xn )) = 1 − α bzw.
(Gu ; ∞) mit P (ϑ ≥ Gu (X1 , ..., Xn )) = 1 − α
Spezielle zweiseitige Konfidenzintervalle:
für Stichprobenumfang n und Konfidenzniveau 1 − α
• Konfidenzintervall für den Erwartungswert µ einer Normalverteilung bei bekannter
Varianz σ 2 :
X −z
1− α
2
σ
σ
· √ ; X + z1− α2 · √
n
n
Dabei ist z1− α2 das (1 − α2 )-Quantil der Standardnormalverteilung (siehe Kapitel 4) und
n
P
X = n1
Xi .
i=1
• Konfidenzintervall für den Erwartungswert µ einer Normalverteilung bei unbekannter
Varianz σ 2 :
X − tn−1,1− α2
S
S
· √ ; X + tn−1,1− α2 · √
n
n
Dabei ist tn−1,1− α2 das (1 − α2 )-Quantil der t-Verteilung mit n − 1 Freiheitsgraden (siehe
n
n
P
P
1
Xi und S 2 = n−1
(Xi − X)2 .
Kapitel 4) und X = n1
i=1
i=1
• Asymptotisches Konfidenzintervall für die Wahrscheinlichkeit p einer 0-1-Verteilung
(d.h. P (X = 1) = p, P (X = 0) = 1 − p):

 P̂ − z1− α ·
2
s
P̂ (1 − P̂ )
; P̂ + z1− α2 ·
n
s

P̂ (1 − P̂ ) 
n
Voraussetzung: np̂(1 − p̂) > 9
Dabei ist z1− α2 das (1 − α2 )-Quantil der Standardnormalverteilung (siehe Kapitel 4) und
n
P
P̂ = n1
Xi .
i=1
3.2
3.2.1
Parametertests
Schritte zur Durchführung eines Parametertests für einen unbekannten Parameter ϑ
1. Aufstellen der Nullhypothese H0 mit ϑ0 ∈ R
Zweiseitiger Test: H0 : ϑ = ϑ0
Alternativhypothese H1 : ϑ 6= ϑ0
Einseitiger Test: H0 : ϑ ≤ ϑ0 bzw. H0 : ϑ ≥ ϑ0
Alternativhypothese H1 : ϑ > ϑ0 bzw. ϑ < ϑ0
20
2. Wählen des Signifikanzniveaus 1 − α (α ∈ (0, 1) – Irrtumswahrscheinlichkeit, Wahrscheinlichkeit für das Ablehnen der Nullhypothese H0 , obwohl H0 wahr ist)
3. Auswahl einer geeigneten Testgröße T (X1 , ..., Xn ) (Stichprobenfunktion) für den unbekannten Parameter ϑ, deren Verteilung unter H0 bekannt ist.
4. Bestimmen von cu , co (in Abhängigkeit von α) mit
P (cu ≤ T ≤ co )H0 = 1 − α (zweiseitiger Test)
und damit Festlegung vom kritischen Bereich K = (−∞, cu ) ∪ (co , ∞)
Einseitiger Test:
c mit P (T ≤ c)H0 = 1 − α bzw. P (T ≥ c)H0 = 1 − α
und kritischer Bereich K = (c, ∞) bzw. K = (−∞, c)
5. Berechnung des Wertes der Testgröße T (x1 , ..., xn ) = t̂ ∈ R aus der konkreten Stichprobe.
Testentscheidung:
t̂ ∈ K =⇒ H0 wird abgelehnt.
t̂ 6∈ K =⇒ gegen H0 ist auf Grund dieser Stichprobe nichts einzuwenden.
Fehlerquellen:
Fehler 1. Art - Nullhypothese H0 wird abgelehnt, obwohl sie wahr ist.
Fehler 2. Art - Nullhypothese H0 wird nicht abgelehnt, obwohl sie falsch ist.
3.2.2
Spezielle Parametertests:
• Test für den unbekannten Erwartungswert µ einer normalverteilten Zufallsgröße bei
bekannter Varianz σ 2 (Gauß-Test)
Nullhypothese
Alternativhypothese
Testgröße
H0 : µ = µ0
H1 : µ 6= µ0
T =
√
H0 : µ ≥ µ0
H 1 : µ < µ0
T =
√
H0 : µ ≤ µ0
H 1 : µ > µ0
T =
√
Kritischer Bereich
n·
X−µ0
σ
K = (−∞; −z1− α2 ) ∪ (z1− α2 ; ∞)
n·
X−µ0
σ
K = (−∞; −z1−α )
n·
X−µ0
σ
K = (z1−α ; ∞)
21
• Test für den unbekannten Erwartungswert µ einer normalverteilten Zufallsgröße bei
unbekannter Varianz σ 2 (einfacher t-Test)
Nullhypothese
Alternativhypothese
Testgröße
H0 : µ = µ0
H1 : µ 6= µ0
T =
√
H0 : µ ≥ µ0
H 1 : µ < µ0
T =
√
H0 : µ ≤ µ0
H 1 : µ > µ0
T =
√
Kritischer Bereich
n·
X−µ0
s
K = (−∞; −tn−1,1− α2 ) ∪ (tn−1,1− α2 ; ∞)
n·
X−µ0
s
K = (−∞; −tn−1,1−α )
n·
X−µ0
s
K = (tn−1,1−α ; ∞)
• Test für die unbekannte Wahrscheinlichkeit p einer 0-1-Verteilung
(Voraussetzung : np0 (1 − p0 ) > 9)
Nullhypothese
Alternativ- Testgröße
hypothese
Kritischer Bereich
H0 : p = p0
H1 : p 6= p0
T =
q
n
p0 (1−p0 )
· (P̂ − p0 ) K = (−∞; −z1− α2 ) ∪ (z1− α2 ; ∞)
H0 : p ≥ p0
H1 : p < p0
T =
q
n
p0 (1−p0 )
· (P̂ − p0 ) K = (−∞; −z1−α )
H0 : p ≤ p0
H1 : p > p0
T =
q
n
p0 (1−p0 )
· (P̂ − p0 ) K = (z1−α ; ∞)
22
4
Tabellen
4.1
Verteilungsfunktion der Standardnormalverteilung
1
Φ0,1 (x) = P (X ≤ x) = √
2π
Zx
t2
e− 2 dt
−∞
Hinweise: Für x < 0 ist Φ0,1 (x) = 1 − Φ0,1 (−x) zu verwenden.
Für x > 3, 9 ist Φ0,1 (x) = 1 zu setzen.
x
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,1
0,2
0,3
0,4
0,50000
0,53983
0,57926
0,61791
0,65542
0,50399
0,54380
0,58317
0,62172
0,65910
0,50798
0,54776
0,58706
0,62552
0,66276
0,51197
0,55172
0,59095
0,62930
0,66640
0,51595
0,55567
0,59483
0,63307
0,67003
0,51994
0,55962
0,59871
0,63683
0,67364
0,52392
0,56356
0,60257
0,64058
0,67724
0,52790
0,56749
0,60642
0,64431
0,68082
0,53188
0,57142
0,61026
0,64803
0,68439
0,53586
0,57535
0,61409
0,65173
0,68793
0,5
0,6
0,7
0,8
0,9
0,69146
0,72575
0,75804
0,78814
0,81594
0,69497
0,72907
0,76115
0,79103
0,81859
0,69847
0,73237
0,76424
0,79389
0,82121
0,70194
0,73565
0,76730
0,79673
0,82381
0,70540
0,73891
0,77035
0,79955
0,82639
0,70884
0,74215
0,77337
0,80234
0,82894
0,71226
0,74537
0,77637
0,80511
0,83147
0,71566
0,74857
0,77935
0,80785
0,83398
0,71904
0,75175
0,78230
0,81057
0,83646
0,72240
0,75490
0,78524
0,81327
0,83891
1,0
1,1
1,2
1,3
1,4
0,84134
0,86433
0,88493
0,90320
0,91924
0,84375
0,86650
0,88686
0,90490
0,92073
0,84614
0,86864
0,88877
0,90658
0,92220
0,84849
0,87076
0,89065
0,90824
0,92364
0,85083
0,87286
0,89251
0,90988
0,92507
0,85314
0,87493
0,89435
0,91149
0,92647
0,85543
0,87698
0,89617
0,91308
0,92785
0,85769
0,87900
0,89796
0,91466
0,92922
0,85993
0,88100
0,89973
0,91621
0,93056
0,86214
0,88298
0,90147
0,91774
0,93189
1,5
1,6
1,7
1,8
1,9
0,93319
0,94520
0,95543
0,96407
0,97128
0,93448
0,94630
0,95637
0,96485
0,97193
0,93574
0,94738
0,95728
0,96562
0,97257
0,93699
0,94845
0,95818
0,96638
0,97320
0,93822
0,94950
0,95907
0,96712
0,97381
0,93943
0,95053
0,95994
0,96784
0,97441
0,94062
0,95154
0,96080
0,96856
0,97500
0,94179
0,95254
0,96164
0,96926
0,97558
0,94295
0,95352
0,96246
0,96995
0,97615
0,94408
0,95449
0,96327
0,97062
0,97670
2,0
2,1
2,2
2,3
2,4
0,97725
0,98214
0,98610
0,98928
0,99180
0,97778
0,98257
0,98645
0,98956
0,99202
0,97831
0,98300
0,98679
0,98983
0,99224
0,97882
0,98341
0,98713
0,99010
0,99245
0,97932
0,98382
0,98745
0,99036
0,99266
0,97982
0,98422
0,98778
0,99061
0,99286
0,98030
0,98461
0,98809
0,99086
0,99305
0,98077
0,98500
0,98840
0,99111
0,99324
0,98124
0,98537
0,98870
0,99134
0,99343
0,98169
0,98574
0,98899
0,99158
0,99361
2,5
2,6
2,7
2,8
2,9
0,99379
0,99534
0,99653
0,99744
0,99813
0,99396
0,99547
0,99664
0,99752
0,99819
0,99413
0,99560
0,99674
0,99760
0,99825
0,99430
0,99573
0,99683
0,99767
0,99831
0,99446
0,99585
0,99693
0,99774
0,99836
0,99461
0,99598
0,99702
0,99781
0,99841
0,99477
0,99609
0,99711
0,99788
0,99846
0,99492
0,99621
0,99720
0,99795
0,99851
0,99506
0,99632
0,99728
0,99801
0,99856
0,99520
0,99643
0,99736
0,99807
0,99861
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0,99865
0,99903
0,99931
0,99952
0,99966
0,99977
0,99984
0,99989
0,99993
0,99995
23
4.2
Quantile zq der Standardnormalverteilung
Hinweis: Für q < 0, 5 ist zq = −z1−q zu verwenden.
q
zq
q
zq
q
zq
0,5
0,55
0,6
0,65
0,7
0
0,125661
0,253347
0,385320
0,524401
0,91
0,92
0,93
0,94
0,95
1,340755
1,405072
1,475791
1,554774
1,644854
0,975
0,98
0,985
0,99
0,995
1,959964
2,053749
2,170090
2,326348
2,575829
0,75
0,8
0,85
0,9
0,674490
0,841621
1,036433
1,281552
0,955
0,96
0,965
0,97
1,695398
1,750686
1,811911
1,880794
0,999
0,9995
0,9999
3,090232
3,290527
3,719016
4.3
Quantile tn,q der t-Verteilung (n - Zahl der Freiheitsgrade)
n
q = 0, 9
q = 0, 95
q = 0, 975
q = 0, 99
q = 0, 995
q = 0, 999
q = 0, 9995
1
2
3
4
5
6
7
8
9
3,08
1,89
1,64
1,53
1,48
1,44
1,41
1,40
1,38
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
31,82
6,96
4,54
3,75
3,36
3,14
3,00
2,90
2,82
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
318,31
22,33
10,21
7,17
5,89
5,21
4,79
4,50
4,30
636,62
31,60
12,92
8,61
6,87
5,96
5,41
5,04
4,78
10
11
12
13
14
15
16
17
18
19
1,37
1,36
1,36
1,35
1,35
1,34
1,34
1,33
1,33
1,33
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
4,14
4,02
3,93
3,85
3,79
3,73
3,69
3,65
3,61
3,58
4,59
4,44
4,32
4,22
4,14
4,07
4,01
3,97
3,92
3,88
20
21
22
23
24
25
26
27
28
29
1,33
1,32
1,32
1,32
1,32
1,32
1,31
1,31
1,31
1,31
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,53
2,52
2,51
2,50
2,49
2,49
2,48
2,47
2,47
2,46
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
3,55
3,53
3,50
3,48
3,47
3,45
3,43
3,42
3,41
3,40
3,85
3,82
3,79
3,77
3,75
3,73
3,71
3,69
3,67
3,66
30
40
50
100
500
1000
10000
1,31
1,30
1,30
1,29
1,28
1,28
1,28
1,70
1,68
1,68
1,66
1,65
1,65
1,65
2,04
2,02
2,01
1,98
1,96
1,96
1,96
2,46
2,42
2,40
2,36
2,33
2,33
2,33
2,75
2,70
2,68
2,63
2,59
2,58
2,58
3,39
3,31
3,26
3,17
3,11
3,10
3,09
3,65
3,55
3,50
3,39
3,31
3,30
3,29
24
Herunterladen