Folien

Werbung
Thema der Stunde
I. Die Form der Stichprobenkennwerteverteilung
II. Schlüsse von der Stichprobe auf die Population
III. t-Test für unabhängige und abhängige Stichproben
1
Stichprobenkennwerte
Population
Kennwerte
Stichprobe
Sampling
Theoretische
Statistik
x 
Welche Verteilung von Kennwerten wird sich ergeben,
Wenn man den Sampling Vorgang unendlich oft wiederholt?
• Herleitung der Kennwerte-Verteilung (Sampling – Distribution)
und Beschreibung ihrer Parameter.
• Methoden zur Schätzung der Parameter aus Stichprobendaten
• sowohl für univariate, als auch für multivariate
Kennwerteverteilungen
2
Stichprobenkennwerte
Population
Verteilung von
Stichprobenmittelwerten
Stichprobe des Umfangs N
x
Tue dies k - mal:
Kennwert
(Erwartungswert)
E x  m
 x1
x1
xk 
„Kennwerteverteilung“
Erwartungswert
E x   m
Die Kennwerteverteilung hat denselben Erwartungswert wie die Population, aus der die
Stichproben gezogen wurden. Schätzstatistiken, die denselben Erwartungswert haben wie die
Population, heissen erwartungstreu.
Stichprobenmittelwerte sind erwartungstreue
Schätzungen des Populationsparameters m
3
Stichprobenkennwerte
Population
Tue dies k - mal:
Stichprobe des Umfangs N
s2
Varianz

2
Bias  E s   
2
1 2
  
N
2
Verteilung von
Stichprobenvarianzen
2
s
1
s22
sk2 
Erwartungswert der
Stichprobenvarianzen
N 1 2
E s  

N
1 2
2
  
N
2
Die Stichprobenvarianz unterschätzt die Populationsvarianz tendenziell
Stichprobenvarianzen sind keine erwartungstreuen
Schätzungen des Populationsvarianz 2
4
Korrektur
1 2
E s        2   x2
N
2
2
Der Bias bei der Schätzung der Pop.Varianz aus der Stichprobenvarianz ist die Varianz
der Stichprobenmittelwerte.
Korrektur:
E s 2    2 
1 2 N 1 2
 

N
N
N
1 N
2
2
ˆ 
s 
x

x


 i
N 1
N  1 i 1
2
Die Stichprobenvarianz berechnet aus korrigiertem Umfang N-1 ist eine
erwartungstreue Schätzung der Populationsvarianz
Stichprobenvarianzen sind keine erwartungstreuen
Schätzungen des Populationsvarianz 2
5
Varianz der Stichprobenmittelwerte
Population
Verteilung von
Stichprobenmittelwerten
Stichprobe des Umfangs N
x
Tue dies k - mal:
Varianz

2
 x1
xk 
x1
„Kennwerteverteilung“
Varianz
 
2
x
2
N
Der Faktor 1/N bezieht die Populationsvarianz auf die Varianz der Stichprobenmittel
Für N = 1 sind beide Varianzen gleich
Für N  geht die Varianz der Mittelwerte gegen Null.
6
Form der Verteilung von Mittelwerten
Zentraler Grenzwertsatz:
f (x)
Die Verteilung von Mittelwerten aus Stichproben
der Größe N  30 geht mit wachsendem
Stichprobenumfang in eine Normalverteilung über,
unabhängig von der Verteilungsform der Werte in
der Population.
Wahrscheinlichkeitsdichte
0.10
x
0.05
Es gilt:
1. E x  m
0.00
-15
-10
-5
0
m
5
10
15
x
2.
x 
 E x
 pop
Der zentrale Grenzwertsatz ermöglicht die Schätzung von
Parametern unter Angabe statistischer Sicherheiten
N
7
[Math-Beispiel]
Form der Verteilung von Mittelwerten
Schätzung des Standardfehlers ˆ x
f (x)
ˆ x 
Wahrscheinlichkeitsdichte
0.10
ˆ pop
N

s
N 1
da
x
0.05
ˆ pop 
0.00
-15
-10
-5
0
m
5
10
15
x

1
2
 xi  x 

N 1 i
N 2
s
N 1
Der Standardfehler wird geschätzt über die Schätzung der
Populationsvarianz aus der Stichprobenvarianz
8
Konfidenzintervalle in der Verteilung der Mittelwerte
Fragestellungen:
1.
2.
Man habe einen Mittelwert aus einer Stichprobe der Größe N vorliegen. In
welchem Bereich um den Mittelwert kann man den Populationsparameter m mit
einer bestimmten Wahrscheinlichkeit erwarten ?
Der Populationsparameter m sei bekannt. Mit welcher Wahrscheinlichkeit kann
ein Mittelwert wie der beobachtete oder ein extremerer auftreten?
1. P  x  z1 / 2   x  m  x  z1 / 2   x   1  
2. P  m  z1 / 2   x  x  m  z1 / 2   x   1  
Konfidenzintervalle geben Intervalle um einen Kennwert an, in
denen ein gesuchter Wert mit einer bestimmten WK liegt.
9
Hypothesen
Wissenschaftliche Vermutung über einen Sachverhalt
Aussage
Gegenaussage
(komplementär)
A: Neue Unterrichtsmethode ist besser als die alte
A: Neue Unterrichtsmethode ist schlechter oder gleich gut
Statistisch:
H1 : m1  m0
H 0 : m1  m0
(gerichtet)
H1 : m1  m0
H 0 : m1  m0
(ungerichtet)
Hypothesen als Aussagen über Populationsparameter
10
Entscheidungsregeln (ungerichtet)
Sei  ein vorgegebenes Signifikanzniveau (Konvention:  = 0.05)
und z0 der beobachtete z- Wert.
Regel 1 (Überschreitungswahrscheinlichkeit):
Wenn
P  z  z0   
verwerfe H0
Regel 2 (Kritischer Wert z1-/2):
Wenn
Grundlage:
z0  z1 / 2
verwerfe H0
P  z0  z1 / 2   1  
P  z0  z1 / 2   
Vergleich mit kritischem Wert oder Signifikanzniveau
11
Entscheidungsregeln (gerichtet)
Sei  ein vorgegebenes Signifikanzniveau (Konvention:  = 0.05)
und z0 der beobachtete z- Wert.
Regel 1 (Überschreitungswahrscheinlichkeit):
Wenn
P  z  z0   
verwerfe H0
Regel 2 (Kritischer Wert z1-):
Wenn
Grundlage:
z0  z1
verwerfe H0
P  z0  z1   1  
P  z0  z1   
Vergleich mit kritischem Wert oder Signifikanzniveau
12
Fehler 1. und 2. Art
In der Population gilt
H0
Entscheidung für
H1
H0
H1
Correct
Rejection
P  H0 H0 
Miss
(Fehler 2. Art)
P  H 0 H1 
False Alarm
(Fehler 1. Art)
P  H1 H 0 
Hit
P  H 1 H1 
[Entscheidungsaufgabe]
Hypothesenwahrscheinlichkeiten : bedingte WKn
13
Herunterladen