Wahrscheinlichkeitsrechnung und Statistik

Wahrscheinlichkeitsrechnung und Statistik
12. Vorlesung
Wahrscheinlichkeitsrechnung und Statistik
Quantil der Ordnung α für die Verteilung des beobachteten
Merkmals X ist der Wert zα ∈ R für welchen gilt
P(X < zα ) ≤ α ≤ P(X ≤ zα ).
z 1 heißt Median.
2
• Falls X stetige zufällige Variable ist, dann zα Quantil der
Ordnung α =⇒ P(X ≤ zα ) = α =⇒ FX (zα ) = α
• α · 100% der Werte von X sind kleiner oder gleich mit zα
Wahrscheinlichkeitsrechnung und Statistik
Statistische Teste
Eine Grundgesamtheit wird bezüglich des Merkmals X
untersucht, die Verteilung von X hängt vom unbekannten
Parameter θ ab.
Statistischer Test: Überprüfung von Hypothesen bezüglich θ,
anhand einer Stichprobe
x1 , . . . , xn ,→ statistische Daten (Beobachtungen,
Stichprobenwerte) für das Merkmal X
X1 , . . . , Xn ,→ Stichprobenvariablen sind unabhängige ZG mit
derselben Verteilung wie X .
Wahrscheinlichkeitsrechnung und Statistik
Statistische Teste
Seien gegeben α ∈ (0, 1) das Signifikanzniveau (Irrtumswahrscheinlichkeit)
und θ0 .
H 0 : θ = θ0
H1 : θ 6= θ0
H 0 : θ ≤ θ0
H1 : θ > θ 0
H0 : θ ≥ θ 0
H1 : θ < θ 0
H0 : Nullhypothese, H1 : alternative Hypothese
Man sucht einen kritischen Bereich (Ablehnungsbereich) U ⊂ Rn so dass für
gegebenes Signifikanzniveau α gilt P((X1 , . . . , Xn ) ∈
/ U|H0 ) = 1 − α.
Schlussfolgerung des Tests:
(x1 , . . . , xn ) ∈
/ U ⇒ H0 wird angenommen
(x1 , . . . , xn ) ∈ U ⇒ man lehnt H0 ab, zugunsten von H1
Wahrscheinlichkeitsrechnung und Statistik
Man testet eine Grundgesamtheit bezüglich des Merkmals X .
Test für den theoretischen Erwartungswert E (X )
wenn die Varianz bekannt ist: Gauß Test (Z-Test)
wenn die Varianz unbekannt ist: Student Test
p (T-Test)
Test für die theoretische Standardabweichung V (X ) oder
Varianz V (X ): χ2 -Test
Test für den Anteilswert (approximativer Gauß Test)
Wahrscheinlichkeitsrechnung und Statistik
Bei statistischen Tests geht man schrittweise vor:
Welcher Parameter soll getestet werden?
Was ist die Hypothese und was die Alternative?
Welcher ist der Wert von α ?
Welcher Test ist geeignet?
Berechnen der Teststatistik mit konkreten statistischen Daten
Schlussfolgerung
Wahrscheinlichkeitsrechnung und Statistik
Test für den Erwartungswert m = E (X ) des beobachteten Merkmals X ,
wenn die Varianz des Merkmals σ 2 = V (X ) bekannt ist: Gauß Test, Z-Test
I Gegeben: α ∈ (0, 1), m0 ∈ R, σ > 0 .
X̄n − m
∼ N(0, 1) (Satz 21)
I falls X ∼ N(m, σ 2 ) oder n > 30, dann
σ
√
n
I anhand der statistischen Daten x1 , . . . , xn berechnet man z =
x̄n − m0
√σ
n
I man berechnet das Quantil der Ordnung α der normalen Verteilung
N(0, 1): zα = norminv (α, 0, 1)
H0 : m = m 0
H 0 : m ≤ m0
H0 : m ≥ m 0
H1 : m 6= m0
H 1 : m > m0
H1 : m < m 0
Man akzeptiert H0 , wenn
|z| < z1− α2
z < z1−α
z > zα
Man lehnt H0 ab,
zugunsten von H1 , wenn
|z| ≥ z1− α2
z ≥ z1−α
z ≤ zα
Wahrscheinlichkeitsrechnung und Statistik
Test für den Erwartungswert m = E (X ) des Merkmals X , wenn die Varianz
des Merkmals σ 2 = V (X ) unbekannt ist: Student Test, T-Test
I Gegeben: α ∈ (0, 1), m0 ∈ R (σ 2 unbekannt)
X̄n − m
I falls X ∼ N(m, σ 2 ) oder n > 30, dann
∼ Student(n − 1)
S̃n
√
n
I anhand der statistischen Daten x1 , . . . , xn berechnet man t =
x̄n − m0
s̃n
√
n
I man berechnet das Quantil der Ordnung α der Studentverteilung mit
n − 1 Freiheitsgraden: tα = tinv (α, n − 1)
H0 : m = m 0
H 0 : m ≤ m0
H0 : m ≥ m 0
H1 : m 6= m0
H 1 : m > m0
H1 : m < m 0
Man akzeptiert H0 , wenn
|t| < t1− α2
t < t1−α
t > tα
Man lehnt H0 ab,
zugunsten von H1 , wenn
|t| ≥ t1− α2
t ≥ t1−α
t ≤ tα
Wahrscheinlichkeitsrechnung und Statistik
Test für Standardabweichung σ =
Chi-Quadrat Test
p
V (X ) des beobachteten Merkmals X :
I Gegeben: α ∈ (0, 1), σ0 > 0
I wenn X ∼ N(m, σ 2 ), dann n−1
S̃ 2 ∼ χ2 (n − 1) (Satz 22)
σ2 n
n−1 2
· s̃n
σ02
I man berechnet das Quantil der Ordnung α der χ2 Verteilung mit n − 1
Freiheitsgraden: qα = chi2inv (α, n − 1)
I anhand der statistischen Daten x1 , . . . , xn berechnet man q =
H0 : σ = σ 0
H1 : σ =
6 σ0
H0 : σ ≤ σ0
H1 : σ > σ 0
H0 : σ ≥ σ0
H1 : σ < σ 0
Man akzeptiert H0 , wenn
q α2 < q < q1− α2
q < q1−α
q > qα
Man lehnt H0 ab,
zugunsten von H1 , wenn
q∈
/ (q α2 , q1− α2 )
q ≥ q1−α
q ≤ qα
Wahrscheinlichkeitsrechnung und Statistik
Test für Anteilswert p des beobachteten Merkmals X ∼ Bernoulli(p):
Approximativer Gauß Test
I Gegeben: α ∈ (0, 1), p0 ∈ (0, 1) .
X̄n − p
I falls X ∼ Bernoulli(p) und np(1 − p) ≥ 10, dann q
∼ N(0, 1)
p(1−p)
n
x̄n − p0
I anhand der statistischen Daten x1 , . . . , xn berechnet man z = q
p0 (1−p0 )
n
I man berechnet das Quantil der Ordnung α der normalen Verteilung
N(0, 1): zα = norminv (α, 0, 1)
I Test kann durchgeführt werden, wenn np0 (1 − p0 ) ≥ 10:
H0 : p = p 0
H0 : p ≤ p0
H0 : p ≥ p0
H1 : p 6= p0
H1 : p > p0
H1 : p < p0
Man akzeptiert H0 , wenn
|z| < z1− α2
z < z1−α
z > zα
Man lehnt H0 ab,
zugunsten von H1 , wenn
|z| ≥ z1− α2
z ≥ z1−α
z ≤ zα
Wahrscheinlichkeitsrechnung und Statistik
Beispiel 1: Ein Autohersteller behauptet, dass der Benzinverbrauch für
einen neuen Autotyp im Mittel höchstens 6 Liter ist (pro 100 km). Dabei
kann er davon ausgehen, dass der Verbrauch normalverteilt ist mit σ = 0.3
Liter. Eine Verbraucherzentrale vermutet, dass der Hersteller einen zu
niedrigen Mittelwert angegeben hat und überprüft 20 Autos des neuen Typs
aud ihren Verbrauch und berechnet einen empirischen Mittelwert von 6.1
Liter. a) Kann hiermit die Behauptung des Herstellers widerlegt werden? b)
Wie groß muss der durchschnittliche Benzinverbrauch einer Stichprobe mit
n = 20 und σ = 0.3 mindestens sein, damit die Behauptung des Herstellers
widerlegt wird? (α = 0.01)
Wahrscheinlichkeitsrechnung und Statistik
Lösung: H0 : m ≤ 6 mit H1 : m > 6, Varianz ist bekannt σ 2 = 0.09, n = 20,
x̄n = 6.1
x̄n − m0
6.1 − 6
a) z =
= 0.3 ≈ 1.4907 < z1−α = norminv (1 − α) ≈ 2.3263
σ
√
n
√
20
⇒ H0 wird akzeptiert ⇒ die Behauptung des Herstellers kann nicht
widerlegt werden
x̄n − 6
x̄n − m0
= 0.3 ≥ z1−α = norminv (1 − α) ≈ 2.3263⇒ x̄n ≥
b) z =
σ
√
6 + z1−α ·
n
0.3
√
20
√
20
≈ 6.1561
Wahrscheinlichkeitsrechnung und Statistik
Beispiel 2: Die Anleitungen eines Medikaments geben an, dass jede Tablette
durchschnittlich 2.4 g aktive Substanzen enthält. 100 zufällig gewählte
Tabletten werden untersucht und man stellt fest, dass im Mittel 2.5 g aktive
Substanzen enthalten mit einer Standardabweichung von 0.2 g. Kann man
behaupten, dass das Medikament die Angaben respektiert? (α = 0.01)
Lösung: H0 : m = 2.4 mit H1 : m 6= 2.4, Varianz ist unbekannt, n = 100,
x̄n = 2.5, s̃n = 0.2
⇒t=
x̄n − m0
s̃n
√
n
=
2.5 − 2.4
√0.2
100
= 5 > t1−α/2 = tinv (1 − α/2, n − 1) ≈ 2.6264
⇒ H0 wird abgelehnt ⇒ die Angaben werden nicht respektiert
Wahrscheinlichkeitsrechnung und Statistik