Wahrscheinlichkeitsrechnung und Statistik

Werbung
Wahrscheinlichkeitsrechnung und Statistik
12. Vorlesung
Wahrscheinlichkeitsrechnung und Statistik
Quantil der Ordnung α für die Verteilung des beobachteten
Merkmals X ist der Wert zα ∈ R für welchen gilt
P(X < zα ) ≤ α ≤ P(X ≤ zα ).
z 1 heißt Median.
2
• Falls X stetige zufällige Variable ist, dann zα Quantil der
Ordnung α =⇒ P(X ≤ zα ) = α =⇒ FX (zα ) = α
• α · 100% der Werte von X sind kleiner oder gleich mit zα
Wahrscheinlichkeitsrechnung und Statistik
Statistische Teste
Eine Grundgesamtheit wird bezüglich des Merkmals X
untersucht, die Verteilung von X hängt vom unbekannten
Parameter θ ab.
Statistischer Test: Überprüfung von Hypothesen bezüglich θ,
anhand einer Stichprobe
x1 , . . . , xn ,→ statistische Daten (Beobachtungen,
Stichprobenwerte) für das Merkmal X
X1 , . . . , Xn ,→ Stichprobenvariablen sind unabhängige ZG mit
derselben Verteilung wie X .
Wahrscheinlichkeitsrechnung und Statistik
Statistische Teste
Seien gegeben α ∈ (0, 1) das Signifikanzniveau (Irrtumswahrscheinlichkeit)
und θ0 .
H 0 : θ = θ0
H1 : θ 6= θ0
H 0 : θ ≤ θ0
H1 : θ > θ 0
H0 : θ ≥ θ 0
H1 : θ < θ 0
H0 : Nullhypothese, H1 : alternative Hypothese
Man sucht einen kritischen Bereich (Ablehnungsbereich) U ⊂ Rn so dass für
gegebenes Signifikanzniveau α gilt P((X1 , . . . , Xn ) ∈
/ U|H0 ) = 1 − α.
Schlussfolgerung des Tests:
(x1 , . . . , xn ) ∈
/ U ⇒ H0 wird angenommen
(x1 , . . . , xn ) ∈ U ⇒ man lehnt H0 ab, zugunsten von H1
Wahrscheinlichkeitsrechnung und Statistik
Man testet eine Grundgesamtheit bezüglich des Merkmals X .
Test für den theoretischen Erwartungswert E (X )
wenn die Varianz bekannt ist: Gauß Test (Z-Test)
wenn die Varianz unbekannt ist: Student Test
p (T-Test)
Test für die theoretische Standardabweichung V (X ) oder
Varianz V (X ): χ2 -Test
Test für den Anteilswert (approximativer Gauß Test)
Wahrscheinlichkeitsrechnung und Statistik
Bei statistischen Tests geht man schrittweise vor:
Welcher Parameter soll getestet werden?
Was ist die Hypothese und was die Alternative?
Welcher ist der Wert von α ?
Welcher Test ist geeignet?
Berechnen der Teststatistik mit konkreten statistischen Daten
Schlussfolgerung
Wahrscheinlichkeitsrechnung und Statistik
Test für den Erwartungswert m = E (X ) des beobachteten Merkmals X ,
wenn die Varianz des Merkmals σ 2 = V (X ) bekannt ist: Gauß Test, Z-Test
I Gegeben: α ∈ (0, 1), m0 ∈ R, σ > 0 .
X̄n − m
∼ N(0, 1) (Satz 21)
I falls X ∼ N(m, σ 2 ) oder n > 30, dann
σ
√
n
I anhand der statistischen Daten x1 , . . . , xn berechnet man z =
x̄n − m0
√σ
n
I man berechnet das Quantil der Ordnung α der normalen Verteilung
N(0, 1): zα = norminv (α, 0, 1)
H0 : m = m 0
H 0 : m ≤ m0
H0 : m ≥ m 0
H1 : m 6= m0
H 1 : m > m0
H1 : m < m 0
Man akzeptiert H0 , wenn
|z| < z1− α2
z < z1−α
z > zα
Man lehnt H0 ab,
zugunsten von H1 , wenn
|z| ≥ z1− α2
z ≥ z1−α
z ≤ zα
Wahrscheinlichkeitsrechnung und Statistik
Test für den Erwartungswert m = E (X ) des Merkmals X , wenn die Varianz
des Merkmals σ 2 = V (X ) unbekannt ist: Student Test, T-Test
I Gegeben: α ∈ (0, 1), m0 ∈ R (σ 2 unbekannt)
X̄n − m
I falls X ∼ N(m, σ 2 ) oder n > 30, dann
∼ Student(n − 1)
S̃n
√
n
I anhand der statistischen Daten x1 , . . . , xn berechnet man t =
x̄n − m0
s̃n
√
n
I man berechnet das Quantil der Ordnung α der Studentverteilung mit
n − 1 Freiheitsgraden: tα = tinv (α, n − 1)
H0 : m = m 0
H 0 : m ≤ m0
H0 : m ≥ m 0
H1 : m 6= m0
H 1 : m > m0
H1 : m < m 0
Man akzeptiert H0 , wenn
|t| < t1− α2
t < t1−α
t > tα
Man lehnt H0 ab,
zugunsten von H1 , wenn
|t| ≥ t1− α2
t ≥ t1−α
t ≤ tα
Wahrscheinlichkeitsrechnung und Statistik
Test für Standardabweichung σ =
Chi-Quadrat Test
p
V (X ) des beobachteten Merkmals X :
I Gegeben: α ∈ (0, 1), σ0 > 0
I wenn X ∼ N(m, σ 2 ), dann n−1
S̃ 2 ∼ χ2 (n − 1) (Satz 22)
σ2 n
n−1 2
· s̃n
σ02
I man berechnet das Quantil der Ordnung α der χ2 Verteilung mit n − 1
Freiheitsgraden: qα = chi2inv (α, n − 1)
I anhand der statistischen Daten x1 , . . . , xn berechnet man q =
H0 : σ = σ 0
H1 : σ =
6 σ0
H0 : σ ≤ σ0
H1 : σ > σ 0
H0 : σ ≥ σ0
H1 : σ < σ 0
Man akzeptiert H0 , wenn
q α2 < q < q1− α2
q < q1−α
q > qα
Man lehnt H0 ab,
zugunsten von H1 , wenn
q∈
/ (q α2 , q1− α2 )
q ≥ q1−α
q ≤ qα
Wahrscheinlichkeitsrechnung und Statistik
Test für Anteilswert p des beobachteten Merkmals X ∼ Bernoulli(p):
Approximativer Gauß Test
I Gegeben: α ∈ (0, 1), p0 ∈ (0, 1) .
X̄n − p
I falls X ∼ Bernoulli(p) und np(1 − p) ≥ 10, dann q
∼ N(0, 1)
p(1−p)
n
x̄n − p0
I anhand der statistischen Daten x1 , . . . , xn berechnet man z = q
p0 (1−p0 )
n
I man berechnet das Quantil der Ordnung α der normalen Verteilung
N(0, 1): zα = norminv (α, 0, 1)
I Test kann durchgeführt werden, wenn np0 (1 − p0 ) ≥ 10:
H0 : p = p 0
H0 : p ≤ p0
H0 : p ≥ p0
H1 : p 6= p0
H1 : p > p0
H1 : p < p0
Man akzeptiert H0 , wenn
|z| < z1− α2
z < z1−α
z > zα
Man lehnt H0 ab,
zugunsten von H1 , wenn
|z| ≥ z1− α2
z ≥ z1−α
z ≤ zα
Wahrscheinlichkeitsrechnung und Statistik
Beispiel 1: Ein Autohersteller behauptet, dass der Benzinverbrauch für
einen neuen Autotyp im Mittel höchstens 6 Liter ist (pro 100 km). Dabei
kann er davon ausgehen, dass der Verbrauch normalverteilt ist mit σ = 0.3
Liter. Eine Verbraucherzentrale vermutet, dass der Hersteller einen zu
niedrigen Mittelwert angegeben hat und überprüft 20 Autos des neuen Typs
aud ihren Verbrauch und berechnet einen empirischen Mittelwert von 6.1
Liter. a) Kann hiermit die Behauptung des Herstellers widerlegt werden? b)
Wie groß muss der durchschnittliche Benzinverbrauch einer Stichprobe mit
n = 20 und σ = 0.3 mindestens sein, damit die Behauptung des Herstellers
widerlegt wird? (α = 0.01)
Wahrscheinlichkeitsrechnung und Statistik
Lösung: H0 : m ≤ 6 mit H1 : m > 6, Varianz ist bekannt σ 2 = 0.09, n = 20,
x̄n = 6.1
x̄n − m0
6.1 − 6
a) z =
= 0.3 ≈ 1.4907 < z1−α = norminv (1 − α) ≈ 2.3263
σ
√
n
√
20
⇒ H0 wird akzeptiert ⇒ die Behauptung des Herstellers kann nicht
widerlegt werden
x̄n − 6
x̄n − m0
= 0.3 ≥ z1−α = norminv (1 − α) ≈ 2.3263⇒ x̄n ≥
b) z =
σ
√
6 + z1−α ·
n
0.3
√
20
√
20
≈ 6.1561
Wahrscheinlichkeitsrechnung und Statistik
Beispiel 2: Die Anleitungen eines Medikaments geben an, dass jede Tablette
durchschnittlich 2.4 g aktive Substanzen enthält. 100 zufällig gewählte
Tabletten werden untersucht und man stellt fest, dass im Mittel 2.5 g aktive
Substanzen enthalten mit einer Standardabweichung von 0.2 g. Kann man
behaupten, dass das Medikament die Angaben respektiert? (α = 0.01)
Lösung: H0 : m = 2.4 mit H1 : m 6= 2.4, Varianz ist unbekannt, n = 100,
x̄n = 2.5, s̃n = 0.2
⇒t=
x̄n − m0
s̃n
√
n
=
2.5 − 2.4
√0.2
100
= 5 > t1−α/2 = tinv (1 − α/2, n − 1) ≈ 2.6264
⇒ H0 wird abgelehnt ⇒ die Angaben werden nicht respektiert
Wahrscheinlichkeitsrechnung und Statistik
Herunterladen