Wahrscheinlichkeitsrechnung und Statistik 12. Vorlesung Wahrscheinlichkeitsrechnung und Statistik Quantil der Ordnung α für die Verteilung des beobachteten Merkmals X ist der Wert zα ∈ R für welchen gilt P(X < zα ) ≤ α ≤ P(X ≤ zα ). z 1 heißt Median. 2 • Falls X stetige zufällige Variable ist, dann zα Quantil der Ordnung α =⇒ P(X ≤ zα ) = α =⇒ FX (zα ) = α • α · 100% der Werte von X sind kleiner oder gleich mit zα Wahrscheinlichkeitsrechnung und Statistik Statistische Teste Eine Grundgesamtheit wird bezüglich des Merkmals X untersucht, die Verteilung von X hängt vom unbekannten Parameter θ ab. Statistischer Test: Überprüfung von Hypothesen bezüglich θ, anhand einer Stichprobe x1 , . . . , xn ,→ statistische Daten (Beobachtungen, Stichprobenwerte) für das Merkmal X X1 , . . . , Xn ,→ Stichprobenvariablen sind unabhängige ZG mit derselben Verteilung wie X . Wahrscheinlichkeitsrechnung und Statistik Statistische Teste Seien gegeben α ∈ (0, 1) das Signifikanzniveau (Irrtumswahrscheinlichkeit) und θ0 . H 0 : θ = θ0 H1 : θ 6= θ0 H 0 : θ ≤ θ0 H1 : θ > θ 0 H0 : θ ≥ θ 0 H1 : θ < θ 0 H0 : Nullhypothese, H1 : alternative Hypothese Man sucht einen kritischen Bereich (Ablehnungsbereich) U ⊂ Rn so dass für gegebenes Signifikanzniveau α gilt P((X1 , . . . , Xn ) ∈ / U|H0 ) = 1 − α. Schlussfolgerung des Tests: (x1 , . . . , xn ) ∈ / U ⇒ H0 wird angenommen (x1 , . . . , xn ) ∈ U ⇒ man lehnt H0 ab, zugunsten von H1 Wahrscheinlichkeitsrechnung und Statistik Man testet eine Grundgesamtheit bezüglich des Merkmals X . Test für den theoretischen Erwartungswert E (X ) wenn die Varianz bekannt ist: Gauß Test (Z-Test) wenn die Varianz unbekannt ist: Student Test p (T-Test) Test für die theoretische Standardabweichung V (X ) oder Varianz V (X ): χ2 -Test Test für den Anteilswert (approximativer Gauß Test) Wahrscheinlichkeitsrechnung und Statistik Bei statistischen Tests geht man schrittweise vor: Welcher Parameter soll getestet werden? Was ist die Hypothese und was die Alternative? Welcher ist der Wert von α ? Welcher Test ist geeignet? Berechnen der Teststatistik mit konkreten statistischen Daten Schlussfolgerung Wahrscheinlichkeitsrechnung und Statistik Test für den Erwartungswert m = E (X ) des beobachteten Merkmals X , wenn die Varianz des Merkmals σ 2 = V (X ) bekannt ist: Gauß Test, Z-Test I Gegeben: α ∈ (0, 1), m0 ∈ R, σ > 0 . X̄n − m ∼ N(0, 1) (Satz 21) I falls X ∼ N(m, σ 2 ) oder n > 30, dann σ √ n I anhand der statistischen Daten x1 , . . . , xn berechnet man z = x̄n − m0 √σ n I man berechnet das Quantil der Ordnung α der normalen Verteilung N(0, 1): zα = norminv (α, 0, 1) H0 : m = m 0 H 0 : m ≤ m0 H0 : m ≥ m 0 H1 : m 6= m0 H 1 : m > m0 H1 : m < m 0 Man akzeptiert H0 , wenn |z| < z1− α2 z < z1−α z > zα Man lehnt H0 ab, zugunsten von H1 , wenn |z| ≥ z1− α2 z ≥ z1−α z ≤ zα Wahrscheinlichkeitsrechnung und Statistik Test für den Erwartungswert m = E (X ) des Merkmals X , wenn die Varianz des Merkmals σ 2 = V (X ) unbekannt ist: Student Test, T-Test I Gegeben: α ∈ (0, 1), m0 ∈ R (σ 2 unbekannt) X̄n − m I falls X ∼ N(m, σ 2 ) oder n > 30, dann ∼ Student(n − 1) S̃n √ n I anhand der statistischen Daten x1 , . . . , xn berechnet man t = x̄n − m0 s̃n √ n I man berechnet das Quantil der Ordnung α der Studentverteilung mit n − 1 Freiheitsgraden: tα = tinv (α, n − 1) H0 : m = m 0 H 0 : m ≤ m0 H0 : m ≥ m 0 H1 : m 6= m0 H 1 : m > m0 H1 : m < m 0 Man akzeptiert H0 , wenn |t| < t1− α2 t < t1−α t > tα Man lehnt H0 ab, zugunsten von H1 , wenn |t| ≥ t1− α2 t ≥ t1−α t ≤ tα Wahrscheinlichkeitsrechnung und Statistik Test für Standardabweichung σ = Chi-Quadrat Test p V (X ) des beobachteten Merkmals X : I Gegeben: α ∈ (0, 1), σ0 > 0 I wenn X ∼ N(m, σ 2 ), dann n−1 S̃ 2 ∼ χ2 (n − 1) (Satz 22) σ2 n n−1 2 · s̃n σ02 I man berechnet das Quantil der Ordnung α der χ2 Verteilung mit n − 1 Freiheitsgraden: qα = chi2inv (α, n − 1) I anhand der statistischen Daten x1 , . . . , xn berechnet man q = H0 : σ = σ 0 H1 : σ = 6 σ0 H0 : σ ≤ σ0 H1 : σ > σ 0 H0 : σ ≥ σ0 H1 : σ < σ 0 Man akzeptiert H0 , wenn q α2 < q < q1− α2 q < q1−α q > qα Man lehnt H0 ab, zugunsten von H1 , wenn q∈ / (q α2 , q1− α2 ) q ≥ q1−α q ≤ qα Wahrscheinlichkeitsrechnung und Statistik Test für Anteilswert p des beobachteten Merkmals X ∼ Bernoulli(p): Approximativer Gauß Test I Gegeben: α ∈ (0, 1), p0 ∈ (0, 1) . X̄n − p I falls X ∼ Bernoulli(p) und np(1 − p) ≥ 10, dann q ∼ N(0, 1) p(1−p) n x̄n − p0 I anhand der statistischen Daten x1 , . . . , xn berechnet man z = q p0 (1−p0 ) n I man berechnet das Quantil der Ordnung α der normalen Verteilung N(0, 1): zα = norminv (α, 0, 1) I Test kann durchgeführt werden, wenn np0 (1 − p0 ) ≥ 10: H0 : p = p 0 H0 : p ≤ p0 H0 : p ≥ p0 H1 : p 6= p0 H1 : p > p0 H1 : p < p0 Man akzeptiert H0 , wenn |z| < z1− α2 z < z1−α z > zα Man lehnt H0 ab, zugunsten von H1 , wenn |z| ≥ z1− α2 z ≥ z1−α z ≤ zα Wahrscheinlichkeitsrechnung und Statistik Beispiel 1: Ein Autohersteller behauptet, dass der Benzinverbrauch für einen neuen Autotyp im Mittel höchstens 6 Liter ist (pro 100 km). Dabei kann er davon ausgehen, dass der Verbrauch normalverteilt ist mit σ = 0.3 Liter. Eine Verbraucherzentrale vermutet, dass der Hersteller einen zu niedrigen Mittelwert angegeben hat und überprüft 20 Autos des neuen Typs aud ihren Verbrauch und berechnet einen empirischen Mittelwert von 6.1 Liter. a) Kann hiermit die Behauptung des Herstellers widerlegt werden? b) Wie groß muss der durchschnittliche Benzinverbrauch einer Stichprobe mit n = 20 und σ = 0.3 mindestens sein, damit die Behauptung des Herstellers widerlegt wird? (α = 0.01) Wahrscheinlichkeitsrechnung und Statistik Lösung: H0 : m ≤ 6 mit H1 : m > 6, Varianz ist bekannt σ 2 = 0.09, n = 20, x̄n = 6.1 x̄n − m0 6.1 − 6 a) z = = 0.3 ≈ 1.4907 < z1−α = norminv (1 − α) ≈ 2.3263 σ √ n √ 20 ⇒ H0 wird akzeptiert ⇒ die Behauptung des Herstellers kann nicht widerlegt werden x̄n − 6 x̄n − m0 = 0.3 ≥ z1−α = norminv (1 − α) ≈ 2.3263⇒ x̄n ≥ b) z = σ √ 6 + z1−α · n 0.3 √ 20 √ 20 ≈ 6.1561 Wahrscheinlichkeitsrechnung und Statistik Beispiel 2: Die Anleitungen eines Medikaments geben an, dass jede Tablette durchschnittlich 2.4 g aktive Substanzen enthält. 100 zufällig gewählte Tabletten werden untersucht und man stellt fest, dass im Mittel 2.5 g aktive Substanzen enthalten mit einer Standardabweichung von 0.2 g. Kann man behaupten, dass das Medikament die Angaben respektiert? (α = 0.01) Lösung: H0 : m = 2.4 mit H1 : m 6= 2.4, Varianz ist unbekannt, n = 100, x̄n = 2.5, s̃n = 0.2 ⇒t= x̄n − m0 s̃n √ n = 2.5 − 2.4 √0.2 100 = 5 > t1−α/2 = tinv (1 − α/2, n − 1) ≈ 2.6264 ⇒ H0 wird abgelehnt ⇒ die Angaben werden nicht respektiert Wahrscheinlichkeitsrechnung und Statistik