Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung II. Schlüsse von der Stichprobe auf die Population III. t-Test für unabhängige und abhängige Stichproben 1 Stichprobenkennwerte Population Kennwerte Stichprobe Sampling Theoretische Statistik x Welche Verteilung von Kennwerten wird sich ergeben, Wenn man den Sampling Vorgang unendlich oft wiederholt? • Herleitung der Kennwerte-Verteilung (Sampling – Distribution) und Beschreibung ihrer Parameter. • Methoden zur Schätzung der Parameter aus Stichprobendaten • sowohl für univariate, als auch für multivariate Kennwerteverteilungen 2 Stichprobenkennwerte Population Verteilung von Stichprobenmittelwerten Stichprobe des Umfangs N x Tue dies k - mal: Kennwert (Erwartungswert) E x m x1 x1 xk „Kennwerteverteilung“ Erwartungswert E x m Die Kennwerteverteilung hat denselben Erwartungswert wie die Population, aus der die Stichproben gezogen wurden. Schätzstatistiken, die denselben Erwartungswert haben wie die Population, heissen erwartungstreu. Stichprobenmittelwerte sind erwartungstreue Schätzungen des Populationsparameters m 3 Stichprobenkennwerte Population Tue dies k - mal: Stichprobe des Umfangs N s2 Varianz 2 Bias E s 2 1 2 N 2 Verteilung von Stichprobenvarianzen 2 s 1 s22 sk2 Erwartungswert der Stichprobenvarianzen N 1 2 E s N 1 2 2 N 2 Die Stichprobenvarianz unterschätzt die Populationsvarianz tendenziell Stichprobenvarianzen sind keine erwartungstreuen Schätzungen des Populationsvarianz 2 4 Korrektur 1 2 E s 2 x2 N 2 2 Der Bias bei der Schätzung der Pop.Varianz aus der Stichprobenvarianz ist die Varianz der Stichprobenmittelwerte. Korrektur: E s 2 2 1 2 N 1 2 N N N 1 N 2 2 ˆ s x x i N 1 N 1 i 1 2 Die Stichprobenvarianz berechnet aus korrigiertem Umfang N-1 ist eine erwartungstreue Schätzung der Populationsvarianz Stichprobenvarianzen sind keine erwartungstreuen Schätzungen des Populationsvarianz 2 5 Varianz der Stichprobenmittelwerte Population Verteilung von Stichprobenmittelwerten Stichprobe des Umfangs N x Tue dies k - mal: Varianz 2 x1 xk x1 „Kennwerteverteilung“ Varianz 2 x 2 N Der Faktor 1/N bezieht die Populationsvarianz auf die Varianz der Stichprobenmittel Für N = 1 sind beide Varianzen gleich Für N geht die Varianz der Mittelwerte gegen Null. 6 Form der Verteilung von Mittelwerten Zentraler Grenzwertsatz: f (x) Die Verteilung von Mittelwerten aus Stichproben der Größe N 30 geht mit wachsendem Stichprobenumfang in eine Normalverteilung über, unabhängig von der Verteilungsform der Werte in der Population. Wahrscheinlichkeitsdichte 0.10 x 0.05 Es gilt: 1. E x m 0.00 -15 -10 -5 0 m 5 10 15 x 2. x E x pop Der zentrale Grenzwertsatz ermöglicht die Schätzung von Parametern unter Angabe statistischer Sicherheiten N 7 [Math-Beispiel] Form der Verteilung von Mittelwerten Schätzung des Standardfehlers ˆ x f (x) ˆ x Wahrscheinlichkeitsdichte 0.10 ˆ pop N s N 1 da x 0.05 ˆ pop 0.00 -15 -10 -5 0 m 5 10 15 x 1 2 xi x N 1 i N 2 s N 1 Der Standardfehler wird geschätzt über die Schätzung der Populationsvarianz aus der Stichprobenvarianz 8 Konfidenzintervalle in der Verteilung der Mittelwerte Fragestellungen: 1. 2. Man habe einen Mittelwert aus einer Stichprobe der Größe N vorliegen. In welchem Bereich um den Mittelwert kann man den Populationsparameter m mit einer bestimmten Wahrscheinlichkeit erwarten ? Der Populationsparameter m sei bekannt. Mit welcher Wahrscheinlichkeit kann ein Mittelwert wie der beobachtete oder ein extremerer auftreten? 1. P x z1 / 2 x m x z1 / 2 x 1 2. P m z1 / 2 x x m z1 / 2 x 1 Konfidenzintervalle geben Intervalle um einen Kennwert an, in denen ein gesuchter Wert mit einer bestimmten WK liegt. 9 Hypothesen Wissenschaftliche Vermutung über einen Sachverhalt Aussage Gegenaussage (komplementär) A: Neue Unterrichtsmethode ist besser als die alte A: Neue Unterrichtsmethode ist schlechter oder gleich gut Statistisch: H1 : m1 m0 H 0 : m1 m0 (gerichtet) H1 : m1 m0 H 0 : m1 m0 (ungerichtet) Hypothesen als Aussagen über Populationsparameter 10 Entscheidungsregeln (ungerichtet) Sei ein vorgegebenes Signifikanzniveau (Konvention: = 0.05) und z0 der beobachtete z- Wert. Regel 1 (Überschreitungswahrscheinlichkeit): Wenn P z z0 verwerfe H0 Regel 2 (Kritischer Wert z1-/2): Wenn Grundlage: z0 z1 / 2 verwerfe H0 P z0 z1 / 2 1 P z0 z1 / 2 Vergleich mit kritischem Wert oder Signifikanzniveau 11 Entscheidungsregeln (gerichtet) Sei ein vorgegebenes Signifikanzniveau (Konvention: = 0.05) und z0 der beobachtete z- Wert. Regel 1 (Überschreitungswahrscheinlichkeit): Wenn P z z0 verwerfe H0 Regel 2 (Kritischer Wert z1-): Wenn Grundlage: z0 z1 verwerfe H0 P z0 z1 1 P z0 z1 Vergleich mit kritischem Wert oder Signifikanzniveau 12 Fehler 1. und 2. Art In der Population gilt H0 Entscheidung für H1 H0 H1 Correct Rejection P H0 H0 Miss (Fehler 2. Art) P H 0 H1 False Alarm (Fehler 1. Art) P H1 H 0 Hit P H 1 H1 [Entscheidungsaufgabe] Hypothesenwahrscheinlichkeiten : bedingte WKn 13