Statistik – Einführung Stichprobenverteilung Kapitel 6 Statistik – WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.0/26 Lernziele 1. Beschreiben Eigenschaften von Schätzern. 2. Beschreiben Stichprobenverteilungen. 3. Beschreiben den Zusammenhang zwischen Grundgesamtheit und Stichprobenverteilung. 4. Formulieren den zentralen Grenzwertsatz. [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.1/26 Statistische Methoden Statistische Methoden Beschreibende Schließende Statistik Statistik [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.2/26 Umfasst Schätzen Hypothesen testen Zweck mittels einer Stichprobe auf eine Grundgesamtheit schließen. Beispiel: 100 Telefoninterviews nach einer TV-Diskussion: Wer hat besser abgeschnitten, Kandidat A oder Kandidat B? Angenommen Kandidat A wird von 60% der Befragten bevorzugt. Gilt dies auch für die 2 Mio. Seher? [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.3/26 Statistisches Schließen Schätzwerte & Tests Stichprobenstatistik ( X̄) [email protected] – (2003) Grundgesamtheit (µ ) Stichprobe Statistik – Einführung // Stichprobenverteilung – 6 – p.4/26 Schätzer Zufallsvariable werden benutzt um Parameter der Grundgesamtheit zu schätzen. Stichprobenmittelwert, Stichprobenanteil, Stichprobenvarianz sind Zufallsvariable. Beispiel: Stichprobenmittelwert X̄ ist Schätzer für den Erwartungswert µ der Grundgesamtheit. Ist X̄ Ist X̄ 3, so ist 3 ein (Punkt-)Schätzer für µ . 4, so ist 4 ein Schätzer für µ . Die theoretische Basis für die Eigenschaften unserer Schätzer bildet die zugehörige Stichprobenverteilung. [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.5/26 Die Stichprobenverteilung ist eine theoretische Verteilung. Die Stichprobenstatistik ist eine Zufallsvariable. Ihr Wert hängt von der jeweils gezogenen Stichprobe ab. Z.B.: Stichprobenmittelwert, Stichprobenanteilswert, . . . Die Stichprobenverteilung erhält man durch Ziehen aller möglichen Stichproben fixer Größe. Für jede mögliche Stichprobe berechnet man z.B. das Stichprobenmittel. Die Stichprobenverteilung ist die Liste x̄, f x̄ x̄ für z.B. das Stichprobenmittel. [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.6/26 Bestimmung der Stichprobenverteilung Beispiel: Urne mit 4 Kugeln mit Gewinnzahlen 1 bis 4. Ziehen mit Zurücklegen. Zufallsvariable X, 1-maliges Ziehen, ist diskret gleich verteilt. Werte für X: x P X 1 1, 2, 3, 4 ... P X 4 1 4 [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.7/26 Bestimmung der Stichprobenverteilung Parameter der Grundgesamtheit: N 1 ∑ xi N µ i 1 1 2 3 4 4 2.5 σ N ∑ i 1 1 xi µ 2 N 0 1 2 3 4 1.12 [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.8/26 16 Stichprobenmuster 16 Stichprobenmittelwerte 2. Beobachtung 1 2 3 4 1 1/1 1/2 1/3 1/4 2 2/1 2/2 2/3 2/4 3 3/1 3/2 3/3 3/4 4 4/1 4/2 4/3 4/4 1. Beobachtung 1. Beobachtung 2. Beobachtung 1 2 3 4 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 Ziehen mit Zurücklegen [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.9/26 Verteilung aller Stichprobenmittelwerte 16 Stichprobenmittelwerte 1. Beobachtung 2. Beobachtung 1 2 3 4 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 0 [email protected] – (2003) 1 2 3 4 Statistik – Einführung // Stichprobenverteilung – 6 – p.10/26 Parameter Stichprobenverteilung ∑iN 1 x̄i N 2.5 µ x̄ 1.0 1.5 1.5 2.0 . . . 4.0 16 ∑iN 1 x̄i µ x̄ N 1.0 2.5 2 σ x̄2 2 1.5 2.5 2 1.5 2.5 16 2 ... 4.0 2.5 2 0.792 [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.11/26 Grundgesamtheit 0 1 2 µ 3 σ 4 Stichprobe 0 1 2 2.5 µ x̄ 1.12 σ x̄ [email protected] – (2003) 3 4 2.5 0.79 Statistik – Einführung // Stichprobenverteilung – 6 – p.12/26 Standardfehler des Mittelwertes Ist die Standardabweichung aller möglichen Stichprobenmittelwerte X̄. Misst die Streuung unter allen möglichen (verschiedenen) Stichprobenmittelwerten. Kleiner als Standardabweichung der Grundgesamtheit (außer n 1). Formel (für Ziehen mit Zurücklegen): σ x̄ [email protected] – (2003) σ n Statistik – Einführung // Stichprobenverteilung – 6 – p.13/26 Eigenschaften der Stichprobenverteilung [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.14/26 Unverzerrtheit Der Mittelwert der Stichprobenverteilung ist gleich dem Mittelwert der Grundgesamtheit (Erwartungswert). Effizienz Der Mittelwert der Stichprobenverteilung ist näher am Mittelwert der Grundgesamtheit als irgendein anderer unverzerrter Schätzer. Konsistenz Bei steigender Stichprobengröße wird die Abweichung des Stichprobenmittelwertes vom Mittelwert der Grundgesamtheit kleiner und geht mit n gegen unendlich gegen Null. [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.15/26 Unverzerrtheit unverzerrt verzerrt µ µ x̄ x µ x̃ Vergleich zweier Schätzer für µ : x̄ und x̃. [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.16/26 Effizienz (Vergleich bei festem n) Stichprobenverteilung des Mittels Stichprobenverteilung des Medians µ [email protected] – (2003) x Statistik – Einführung // Stichprobenverteilung – 6 – p.17/26 f x̄ größere Stichprobe kleinere Stichprobe µ x̄ µ x̄ [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.18/26 Normalverteilte Grundgesamtheit Grundgesamtheit Mittelwert: µ x̄ µ σ Standardabweichung: σ σ x̄ n µ 10 x 50 Stichprobe n 16, σ x̄ (Ziehen mit Zurücklegen, bzw. sehr große Grundgesamtheit) n µ x̄ [email protected] – (2003) 2.5 4, σ x̄ 5 x̄ 50 Statistik – Einführung // Stichprobenverteilung – 6 – p.19/26 Standardisieren der Stichprobenverteilung Z f x̄ X̄ µ x̄ σ x̄ X̄ µ f z Stichprobenverteilung σ n Standardisierte Stichprobenverteilung σ x̄ µ x̄ [email protected] – (2003) σ x̄ µ 0 1 z Statistik – Einführung // Stichprobenverteilung – 6 – p.20/26 Ferngespräche, die von einer Telefongesellschaft abgewickelt werden, seien normalverteilt mit µ 8 min und σ 2 min. Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Gesprächsdauer von 25 zufällig ausgewählten Telefonaten zwischen 7.8 und 8.2 Minuten liegt? [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.21/26 Stichprobenverteilung // Lösung z2 x̄2 µ σ n 8.2 8 2 25 0.5 0.5 Standardisierte Stichprobenverteilung Stichprobenverteilung σ x̄ 7.8 8 2 25 x̄1 µ σ n z1 0.4 σ 1 0.3830 0.1915 0.1915 7.8 µ x̄ 8 8.2 x̄ [email protected] – (2003) 0.5 µ 0 z 0.5 Statistik – Einführung // Stichprobenverteilung – 6 – p.22/26 Nicht-Normalverteilte Grundgesamtheit Grundgesamtheit Mittelwert: µ x̄ µ Standardabweichung: σ σ x̄ n σ µ 10 x 50 Stichprobe n (Ziehen mit Zurücklegen, bzw. sehr große Grundgesamtheit) n µ x̄ [email protected] – (2003) 30, σ x̄ 50 1.8 4, σ x̄ 5 x̄ Statistik – Einführung // Stichprobenverteilung – 6 – p.23/26 Zentraler Grenzwertsatz [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.24/26 Zentraler Grenzwertsatz Bei hinreichend großer Stichprobengröße (n 30) wird Stichprobenverteilung annäherend normalverteilt mit σ x̄ [email protected] – (2003) σ . n Statistik – Einführung // Stichprobenverteilung – 6 – p.25/26 Zusammenfassung 1. Beschrieben Eigenschaften von Schätzern. 2. Beschrieben Stichprobenverteilungen. 3. Beschrieben Zusammenhang zwischen Grundgesamtheit und Stichprobenverteilung. 4. Formulierten zentralen Grenzwertsatz. [email protected] – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.26/26