Sampling - Methodenlehre - Johannes Gutenberg

Werbung
Methoden der
Psychologie
Evaluation
&
Forschungsstrategien
WS2011/12
Prof. Dr. G. Meinhardt
Johannes Gutenberg Universität Mainz
Methoden der
Psychologie
Prinzipien des statistischen Schliessens
Sampling - Modellvorstellung
Population
Kennwerte
Sampling
Theoretische
Statistik
Stichprobe
x 
Welche Verteilung von Kennwerten wird sich ergeben,
Wenn man den Sampling Vorgang unendlich oft wiederholt?
• Herleitung der Kennwerte-Verteilung (Sampling – Distribution)
und Beschreibung ihrer Parameter.
• Methoden zur Schätzung der Parameter aus Stichprobendaten
• sowohl für univariate, als auch für multivariate
Kennwerteverteilungen
Methoden der
Psychologie
Sampling
Distribution
(1D)
Univariate - Verteilung der Stichprobenmittelwerte
Sampling - Modellvorstellung
Population
Bilde Mittelwert
Stichprobe des Umfangs n
1. - mal:
2. - mal:
k. - mal:
 x1
x1
xk 
x
x1
x2
xk
k- maliges Samplen von Stichproben derselben Größe n und
Berechnen der Stichprobenmittelwerte führt auf eine Verteilung
von Stichprobenmittelwerten (Sampling – Distribution)
Methoden der
Psychologie
Mittelwerte
Univariate - Verteilung der Stichprobenmittelwerte
Sampling - Modellvorstellung
Population
k - Stichproben des
Umfangs n
x
Verteilung von
Stichprobenmitteln
 x1
x1
xk 
„Sampling Distribution“
Erwartungstreue
Erwartungswert
Erwartungswert
E x  
E x   
Die Sampling Distribution hat denselben Erwartungswert wie die
Population, aus der die Stichproben gezogen wurden.
Schätzstatistiken, die denselben Erwartungswert haben wie die
Population, heissen erwartungstreu.
Stichprobenmittelwerte sind erwartungstreue Schätzungen des
Populationsparameters 
Methoden der
Psychologie
Univariate - Verteilung der Stichprobenmittelwerte
Sampling - Modellvorstellung
Varianz
Population
k - Stichproben des
Umfangs n 2
s
Varianz
2
Erwartungstreue:
Bias  E s 2    2
1
   2
n
Verteilung von
Stichprobenvarianzen
s
2
1
sk2 
s22
n 1 2

n
1
2  2
n
E s 2  
Die Stichprobenvarianz unterschätzt die Populationsvarianz
tendenziell:
 Stichprobenvarianzen sind keine erwartungstreuen Schätzungen
des Populationsvarianz 2
Methoden der
Psychologie
Univariate - Verteilung der Stichprobenmittelwerte
Sampling - Modellvorstellung
Bias-Faktor
1
E s 2    2   2   2   x2
n
Der Bias bei der Schätzung der Pop.Varianz aus der
Stichprobenvarianz ist die Varianz der Stichprobenmittelwerte.
1
n 1 2
E s 2    2   2 

n
n
n
1 n
2
2
ˆ 
s 
x

x


 i
n 1
n  1 i 1
2
Erwartungstreue:
Die Stichprobenvarianz berechnet aus korrigiertem Umfang n-1 ist
eine erwartungstreue Schätzung der Populationsvarianz
Methoden der
Psychologie
Central Limit
Theorem
Univariate - Verteilung der Stichprobenmittelwerte
Die Verteilung von Sampling-Mittelwerten nähern sich
mit wachsendem Umfang der Sample-Stichproben
einer Normalverteilung an. Für n > 30 ist die
Approximation schon gut.
Wahrscheinlichkeitsdichte
f x
1. E x    E x
0.10
x
0.05
0.00
Theoretische
Sampling
Distribution
Es gilt:
2 x
 x

2.
+ x
+2 x
x 
 pop
n
x
Die theoretische Sampling Distribution ist die Grundlage des
statistischen Schliessens. Aussagen über den Zusammenhang
von Stichprobenmittelwerten und Populationen werden mithilfe
dieser Verteilung gewonnen (Inferenzstatistischer Schluss).
Methoden der
Psychologie
Univariate - Verteilung der Stichprobenmittelwerte
Anwendung
KonfidenzIntervalle
WKAussagen
z- Verteilung
1. P  x  z1 / 2   x    x + z1 / 2   x   1  
2. P    z1 / 2   x  x   + z1 / 2   x   1  
1.
Man habe einen Mittelwert aus einer Stichprobe der Größe n
vorliegen. In welchem Bereich um den Mittelwert kann man den
Populationsparameter  mit der Wahrscheinlichkeit 1- erwarten?
2.
Der Populationsparameter  sei bekannt. In welchem Bereich um
ihn liegen Mittelwerte mit der Wahrscheinlichkeit 1-?
z0 
x 
x
P  z  z0   1    z0 
Mit  der Verteilungsfunktion der Standardnormalverteilung.
Für n < 50 sollte die t- Verteilung mit df = n – 1 verwendet
werden.
Methoden der
Psychologie
Univariate - Verteilung der Stichprobenmittelwerte
Hypothesen
t - und F-Test
H0:   0
t
H1:   0

x  0
ˆ / n
P  t   t   2 1   t ;df   t 

mit df  n  1
Es gilt
t2 – FÄquivalenz
tdf2  F1;df 
Äquivalenz von t- und F- Test
TestÄquivalenz:
Eine zweiseitige Wahrscheinlichkeitsbestimmung auf der t – Verteilung
ist der (grundsätzlich einseitigen) Wahrscheinlichkeitsbestimmung auf
der F - Verteilung äquivalent.
 x  0 
2 1
t 
  n  x  0  ˆ   x  0 
 ˆ / n 
2
Bemerke:
2
Methoden der
Psychologie
Univariate Mittelwertevergleiche
t- Test für unabhängige Stichproben
H 0 : 1  0
H1 : 1  0
Hypothese
(ungerichtet)
x  0
H0: Der Erwartungswert der Differenzen von Mittelwerten ist Null
f  x 
Wahrscheinlichkeitsdichte
Sampling
Distribution
1.
2.
0.10
2 x  x
0
x  0
 x wird geschätzt aus
beiden Stichproben
3. x ist t- verteilt.
 x
0.05
0.00
[t-Test ausführlich?]
Es gilt:
 x
2 x
x
Methoden der
Psychologie
Univariate Mittelwertevergleiche
t- Test für unabhängige Stichproben
Statistik
Entscheidung:
a) Krit. t-Wert
b) Überschreitungs-WK
Voraussetzung
t
x
 x  ˆ
 x
2
pooled
1 1
 + 
 n0 n1 
Prüfgrösse t- verteilt mit n0 + n1 – 2 Freiheitsgraden
t  t df ;1 / 2
P  t  t   
Ablehnung von H0,
sonst Beibehaltung
oder
Ablehnung von H0,
sonst Beibehaltung
1. Für n0 + n1 < 50 normalverteilte Stichprobendaten
2. Homogene Stichprobenvarianzen
3. Unabhängige Messeinheiten innerhalb und zwischen
den Samples.
Methoden der
Psychologie
Univariate Mittelwertevergleiche
t- Test für abhängige Stichproben
H 0 : 1  0
H1 : 1  0
Hypothese
(ungerichtet)
  0
H0: Der Erwartungswert der Mittelwerte von Differenzen ist Null
f 
Wahrscheinlichkeitsdichte
Sampling
Distribution
Es gilt:
1.
2.
0.10
0.00
Differenzenstichprobe
3.  ist t- verteilt.

0.05
2 
 
0
  0
  wird geschätzt aus

2 

Methoden der
Psychologie
Univariate Mittelwertevergleiche
t- Test für abhängige Stichproben
Statistik
Entscheidung:
a) Krit. t-Wert
b) Überschreitungs-WK
Voraussetzung
t


1
 
s02 + s12  2Cov( x0 , x1 ) 

n 1
Prüfgrösse t- verteilt mit n – 1 Freiheitsgraden (n = Anzahl Paare)
t  t df ;1 / 2
P  t  t   
Ablehnung von H0,
sonst Beibehaltung
oder
Ablehnung von H0,
sonst Beibehaltung
1. Für n < 30 normalverteilte Stichprobendaten
2. Homogene Stichprobenvarianzen müssen nicht
vorliegen
3. Korrelation der Meßreihen erhöht die Teststärke.
Methoden der
Psychologie
Univariate und multivariate Mittelwertevergleiche
Sample
Meßeinheiten
SamplingDistribution
Test-Statistik
univariat
multivariat
unabhängig
abhängig
unabhängig
Differenzen
von
Mittelwerten
gepoolte Varianzen
Mittelwerte
von
Differenzen
Differenzvektor
von
Centroiden
Gepoolte
Var-Covar Mat.
t
t
T2
abhängig
Centroide
von
Differenzvektoren
T2
Multivariate Mittelwertsvergleiche sind die direkte Entsprechung zu
univariaten Vergleichen. Es gelten dieselben Prinzipien, lediglich
angewendet auf mehrstellige Mittelwerte-Vektoren und VarianzCovarianz Matrizen statt Varianzen.
Herunterladen