Statistik – Einführung

Werbung
Statistik – Einführung
Stichprobenverteilung
Kapitel 6
Statistik – WU Wien
Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold
Günter Tirler Rosmarie Wakolbinger
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.0/26
Lernziele
1. Beschreiben Eigenschaften von Schätzern.
2. Beschreiben Stichprobenverteilungen.
3. Beschreiben den Zusammenhang zwischen Grundgesamtheit
und Stichprobenverteilung.
4. Formulieren den zentralen Grenzwertsatz.
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.1/26
Statistische Methoden
Statistische
Methoden
Beschreibende
Schließende
Statistik
Statistik
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.2/26
Umfasst
Schätzen
Hypothesen testen
Zweck
mittels einer Stichprobe auf eine Grundgesamtheit
schließen.
Beispiel:
100 Telefoninterviews nach einer TV-Diskussion:
Wer hat besser abgeschnitten, Kandidat A oder
Kandidat B?
Angenommen Kandidat A wird von 60% der Befragten
bevorzugt. Gilt dies auch für die 2 Mio. Seher?
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.3/26
Statistisches Schließen
Schätzwerte & Tests
Stichprobenstatistik ( X̄)
[email protected] – (2003)
Grundgesamtheit (µ )
Stichprobe
Statistik – Einführung // Stichprobenverteilung – 6 – p.4/26
Schätzer
Zufallsvariable werden benutzt um Parameter der
Grundgesamtheit zu schätzen.
Stichprobenmittelwert, Stichprobenanteil,
Stichprobenvarianz sind Zufallsvariable.
Beispiel: Stichprobenmittelwert X̄ ist Schätzer für den
Erwartungswert µ der Grundgesamtheit.
Ist X̄
Ist X̄
3, so ist 3 ein (Punkt-)Schätzer für µ .
4, so ist 4 ein Schätzer für µ .
Die theoretische Basis für die Eigenschaften unserer
Schätzer bildet die zugehörige Stichprobenverteilung.
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.5/26
Die Stichprobenverteilung ist eine theoretische Verteilung.
Die Stichprobenstatistik ist eine Zufallsvariable. Ihr Wert hängt
von der jeweils gezogenen Stichprobe ab.
Z.B.: Stichprobenmittelwert, Stichprobenanteilswert, . . .
Die Stichprobenverteilung erhält man durch Ziehen aller
möglichen Stichproben fixer Größe.
Für jede mögliche Stichprobe berechnet man z.B. das
Stichprobenmittel.
Die Stichprobenverteilung ist die Liste x̄, f x̄ x̄ für z.B. das
Stichprobenmittel.
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.6/26
Bestimmung der Stichprobenverteilung
Beispiel:
Urne mit 4 Kugeln mit Gewinnzahlen 1 bis 4. Ziehen mit
Zurücklegen.
Zufallsvariable X, 1-maliges Ziehen, ist diskret gleich verteilt.
Werte für X: x
P X
1
1, 2, 3, 4
...
P X
4
1
4
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.7/26
Bestimmung der Stichprobenverteilung
Parameter der Grundgesamtheit:
N
1
∑ xi N
µ
i 1
1 2 3 4
4
2.5
σ
N
∑
i 1
1
xi µ 2
N
0
1
2
3
4
1.12
[email protected]n.ac.at – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.8/26
16 Stichprobenmuster
16 Stichprobenmittelwerte
2. Beobachtung
1
2
3
4
1
1/1
1/2
1/3
1/4
2
2/1
2/2
2/3
2/4
3
3/1
3/2
3/3
3/4
4
4/1
4/2
4/3
4/4
1. Beobachtung
1. Beobachtung
2. Beobachtung
1
2
3
4
1
1.0
1.5
2.0
2.5
2
1.5
2.0
2.5
3.0
3
2.0
2.5
3.0
3.5
4
2.5
3.0
3.5
4.0
Ziehen mit Zurücklegen
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.9/26
Verteilung aller Stichprobenmittelwerte
16 Stichprobenmittelwerte
1. Beobachtung
2. Beobachtung
1
2
3
4
1
1.0
1.5
2.0
2.5
2
1.5
2.0
2.5
3.0
3
2.0
2.5
3.0
3.5
4
2.5
3.0
3.5
4.0
0
[email protected] – (2003)
1
2
3
4
Statistik – Einführung // Stichprobenverteilung – 6 – p.10/26
Parameter Stichprobenverteilung
∑iN 1 x̄i
N
2.5
µ x̄
1.0 1.5 1.5 2.0 . . . 4.0
16
∑iN 1 x̄i µ x̄ N
1.0 2.5 2 σ x̄2
2
1.5 2.5 2 1.5 2.5 16
2 ... 4.0 2.5 2
0.792
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.11/26
Grundgesamtheit
0
1
2
µ
3
σ
4
Stichprobe
0
1
2
2.5
µ x̄
1.12
σ x̄
[email protected] – (2003)
3
4
2.5
0.79
Statistik – Einführung // Stichprobenverteilung – 6 – p.12/26
Standardfehler des Mittelwertes
Ist die Standardabweichung aller möglichen
Stichprobenmittelwerte X̄.
Misst die Streuung unter allen möglichen (verschiedenen)
Stichprobenmittelwerten.
Kleiner als Standardabweichung der Grundgesamtheit
(außer n 1).
Formel (für Ziehen mit Zurücklegen):
σ x̄
[email protected] – (2003)
σ
n
Statistik – Einführung // Stichprobenverteilung – 6 – p.13/26
Eigenschaften der
Stichprobenverteilung
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.14/26
Unverzerrtheit
Der Mittelwert der Stichprobenverteilung ist gleich dem
Mittelwert der Grundgesamtheit (Erwartungswert).
Effizienz
Der Mittelwert der Stichprobenverteilung ist näher am
Mittelwert der Grundgesamtheit als irgendein anderer
unverzerrter Schätzer.
Konsistenz
Bei steigender Stichprobengröße wird die Abweichung des
Stichprobenmittelwertes vom Mittelwert der Grundgesamtheit
kleiner und geht mit n gegen unendlich gegen Null.
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.15/26
Unverzerrtheit
unverzerrt
verzerrt
µ
µ x̄
x
µ x̃
Vergleich zweier Schätzer für µ : x̄ und x̃.
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.16/26
Effizienz (Vergleich bei festem n)
Stichprobenverteilung des Mittels
Stichprobenverteilung des Medians
µ
[email protected] – (2003)
x
Statistik – Einführung // Stichprobenverteilung – 6 – p.17/26
f x̄
größere Stichprobe
kleinere Stichprobe
µ
x̄
µ x̄
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.18/26
Normalverteilte Grundgesamtheit
Grundgesamtheit
Mittelwert:
µ x̄
µ
σ
Standardabweichung:
σ
σ x̄
n
µ
10
x
50
Stichprobe
n
16, σ x̄
(Ziehen mit Zurücklegen, bzw.
sehr große Grundgesamtheit)
n
µ x̄
[email protected] – (2003)
2.5
4, σ x̄
5
x̄
50
Statistik – Einführung // Stichprobenverteilung – 6 – p.19/26
Standardisieren der Stichprobenverteilung
Z
f x̄ X̄ µ x̄
σ x̄
X̄ µ
f z
Stichprobenverteilung
σ
n
Standardisierte
Stichprobenverteilung
σ x̄
µ x̄
[email protected] – (2003)
σ
x̄
µ
0
1
z
Statistik – Einführung // Stichprobenverteilung – 6 – p.20/26
Ferngespräche, die von einer Telefongesellschaft abgewickelt
werden, seien normalverteilt mit µ 8 min und σ 2 min.
Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche
Gesprächsdauer von 25 zufällig ausgewählten Telefonaten
zwischen 7.8 und 8.2 Minuten liegt?
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.21/26
Stichprobenverteilung // Lösung
z2
x̄2 µ
σ
n
8.2 8
2 25
0.5
0.5
Standardisierte
Stichprobenverteilung
Stichprobenverteilung
σ x̄
7.8 8
2 25
x̄1 µ
σ
n
z1
0.4
σ
1
0.3830
0.1915 0.1915
7.8
µ x̄
8
8.2
x̄
[email protected] – (2003)
0.5
µ
0
z
0.5
Statistik – Einführung // Stichprobenverteilung – 6 – p.22/26
Nicht-Normalverteilte Grundgesamtheit
Grundgesamtheit
Mittelwert:
µ x̄
µ
Standardabweichung:
σ
σ x̄
n
σ
µ
10
x
50
Stichprobe
n
(Ziehen mit Zurücklegen, bzw.
sehr große Grundgesamtheit)
n
µ x̄
[email protected] – (2003)
30, σ x̄
50
1.8
4, σ x̄
5
x̄
Statistik – Einführung // Stichprobenverteilung – 6 – p.23/26
Zentraler Grenzwertsatz
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.24/26
Zentraler Grenzwertsatz
Bei hinreichend großer Stichprobengröße (n 30) wird
Stichprobenverteilung annäherend normalverteilt mit σ x̄
[email protected] – (2003)
σ
.
n
Statistik – Einführung // Stichprobenverteilung – 6 – p.25/26
Zusammenfassung
1. Beschrieben Eigenschaften von Schätzern.
2. Beschrieben Stichprobenverteilungen.
3. Beschrieben Zusammenhang zwischen Grundgesamtheit und
Stichprobenverteilung.
4. Formulierten zentralen Grenzwertsatz.
[email protected] – (2003)
Statistik – Einführung // Stichprobenverteilung – 6 – p.26/26
Herunterladen