Primer - Methodenlehre

Werbung
Empirische
Methoden
Primer
Primer:
Inferenzstatistik 1.0
Dr. Malte Persike
[email protected]
methodenlehre.com
twitter.com/methodenlehre
methodenlehre.com/g+
iversity.org/schoolinger
Empirische
Methoden
Jetzt & Gleich
Primer
Inhalte
der nächsten Minuten
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
 Absolute Beginner: Mittelwert, Varianz und Standardabweichung
(abhängig)
 Ein paar Wenige gegen Alle: Der 1-Stichproben t-Test
2-Stichproben t-Test
 Selbstkonfrontation: Der t-Test für abhängige Stichproben
(unabhängig)
 Wenn zwei sich streiten: Der t-Test für unabhängige Stichproben
Empirische
Methoden
Jetzt & Gleich
Primer
Kennwerte
Mittelwert
Kennwerte
1-Stichproben t-Test
 Der Mittelwert einer Variable X ist ein Kennwert, der die Lage der
Verteilung von Messwerten auf ihrer Skala (der „x-Achse“) beschreibt
1 n
x   xi
n i 1
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
mit
xi = Der Wert des i-ten Merkmalsträgers in der Datenreihe
n = Größe der Stichprobe, also die Anzahl der Merkmalsträger
Empirische
Methoden
Jetzt & Gleich
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Primer
Empirische
Methoden
Jetzt & Gleich
Primer
Kennwerte
Varianz
Kennwerte
1-Stichproben t-Test
 Die Varianz ist ein Kennwert, der die Breite der Verteilung von Daten auf
ihrer Skala (der „x-Achse“) beschreibt
n
1
2
s 2    xi  x 
n i 1
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
mit
xi = Der Wert des i-ten Merkmalsträgers in der Datenreihe
x = Der Mittelwert aller Merkmalsträger
n = Größe der Stichprobe, also die Anzahl der Merkmalsträger
Empirische
Methoden
Jetzt & Gleich
Primer
Kennwerte
Standardabweichung
Kennwerte
1-Stichproben t-Test
 Die Standardabweichung ist die Wurzel der Varianz und beschreibt die
Breite der Datenverteilung besser als die Varianz
2-Stichproben t-Test
n
1
2
2
s s 
 xi  x 

n i 1
(abhängig)
2-Stichproben t-Test
(unabhängig)
mit
xi = Der Wert des i-ten Merkmalsträgers in der Datenreihe
x = Der Mittelwert aller Merkmalsträger
n = Größe der Stichprobe, also die Anzahl der Merkmalsträger
Empirische
Methoden
Jetzt & Gleich
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Primer
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Beispiel
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
12.1:11.8
Sekunden
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Quickie: Intervallskala
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Einführung
Kennwerte
1-Stichproben t-Test
 Aus den gemessenen Daten wurde ein
Mittelwert
2-Stichproben t-Test
x
(abhängig)
2-Stichproben t-Test
(unabhängig)
("x quer")
berechnet
 Der Mittelwert ist ein Kennwert für die
konkret gemessene Stichprobe
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Der gegebene Vergleichswert heißt

Fahrzeit (x)
in se c
("mü")
und wird Erwartungswert genannt
 Der Erwartungswert repräsentiert den
„wahren“ Mittelwert, der in der Population
gilt, aus der die Stichprobe kommt
(oder erwartungsgemäß kommen soll)
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12 7
Theorie
Kennwerte
Daten, Empirie
Einführung
Zufallsauswahl
Stichprobe
Population
(alle Gezogenen)
(alle Möglichen)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12 7
Theorie
Kennwerte
Daten, Empirie
Einführung
Zufallsauswahl
Stichprobe
Population
(alle Gezogenen)
(alle Möglichen)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12 7
Theorie
Kennwerte
Daten, Empirie
Einführung
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
 Problem: Man hat zwei Zahlen, die in
der Hypothese enthalten sind
x 
2-Stichproben t-Test
(unabhängig)
allerdings können wir den p-Wert nur
sinnvoll für eine Zahl berechnen.
 Ziel: Wir müssen auf eine Zahl
herunterkommen.
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Um zwei Zahlen auf eine zu reduzieren,
kann einfach die Differenz von beiden
gebildet werden:
  x 
(unabhängig)
 Wenn die Nullhypothese gilt und der Zufall
„perfekt funktioniert“ hat, sollte der
Unterschied zwischen x und μ Null sein
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Frage: Beruht eine Unterschiedlichkeit
  x  0
a) auf Zufall oder
b) auf einem „echten“ Effekt?
(hier: der Beziehungszeit)
 Man braucht also eine Möglichkeit, um
„Zufall“ von einem systematischen
Effekt zu unterscheiden.
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
12.1:11.8
Sekunden
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
0.3
Sekunden
Die Zahl ist
zu klein
normal
zu groß
Theorie
Kennwerte
Daten, Empirie
Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Der Vergleichsmaßstab
Kennwerte
0.3
1-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Wahrscheinlichkeit
2-Stichproben t-Test
0.25
0.2
0.15
0.1
0.05
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95 100
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Eckdaten
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Steckbrief
Was tut man?
Man zieht eine Stichprobe aus einer Population
Was kommt raus?
Je Ziehung ein Messwert
(Zeit in Sekunden)
Was nimmt man an? a) n unabhängige Ziehungen
b) Intervallskalierte Messungen
Was misst man?
Den Mittelwert x aller Messungen x
Was testet man?
Der Mittelwert ist identisch mit einem Erwartungswert μ
(Die Stichprobe stammt aus der erwarteten Population)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
 William Sealy Gosset hat 1908 versucht, die
Wahrscheinlichkeitsverteilung für
  x 
2-Stichproben t-Test
(unabhängig)
herzuleiten und sich dabei zunächst
mit der Wahrscheinlichkeitsverteilung
für Mittelwerte alleine beschäftigt
x
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Die Prüfgröße
(abhängig)
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Warum die Normalverteilung – Zentraler Grenzwertsatz
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Dabei kam ihm der Zentrale Grenzwertsatz (Central Limit Theorem) zu Hilfe:
Die Summe einer großen Zahl unabhängiger, identisch verteilter (iid = „independent
and identically distributed“) Zufallsvariablen ist approximativ normalverteilt.
 Dies veranlasste Sir Francis Galton (1889) zu der enthusiasmierten Lobpreisung
„Ich kenne kaum etwas, das unsere Imaginationskraft so bewegen kann wie die wundervolle
Form kosmischer Ordnung, die sich im ‚Gesetz der Verteilung von Fehlern‘ ausdrückt. Hätten die
Griechen es gekannt, sie hätten es personifiziert und als Gottheit angebetet. Es herrscht mit
bescheidener Gelassenheit in der wildesten Konfusion. Je gewaltiger die Horde, je ärger die
augenscheinliche Anarchie, um so souveräner ist seine Herrschaft. Wann immer eine Menge
chaotischer Elemente nach ihrer Größe angeordnet wird, tritt es hinter dem Schleier des Chaos als
unverhoffte und wunderschöne Form der Regelmäßigkeit hervor.“
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Gosset wusste, dass der Mittelwert nichts
anderes ist als eine Summe von Zufallsvariablen
1
 X1  X 2    X n 
n
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Gosset wusste, dass der Mittelwert nichts
anderes ist als eine Summe von Zufallsvariablen
1
 X1  X 2    X n 
n
 Wenn man das Experiment also sehr oft
durchführen würde, müsste die Wahrscheinlichkeitsverteilung der vielen daraus berechneten
Mittelwerte eine Normalverteilung sein
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Dichtefunktion
1  x  
 
1

f ( x ,  , ) 
e 2  
2
2
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
 Der Parameter μ der Normalverteilung ist in
unserem Fall bekannt, weil gegeben
(in unserem Beispiel μ = 11.8)
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Der zweite Parameter σ ist unbekannt, kann
nach Gosset aber aus den gemessenen Daten
geschätzt werden
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Die Prüfgröße
(abhängig)
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Die Prüfgröße
(abhängig)
2-Stichproben t-Test
(unabhängig)
Streuung
Stichprobe
(von Daten)
Streuung
Population
Population
(von Werten)
(von Mittelwerten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
 Schritt 1: Berechnung der Standardabweichung s
für die Stichprobendaten
1 n
2
s
 xi  x 

n i1
 Schritt 2: Korrektur der Standardabweichung s zur
geschätzten Populationsstandardabweichung σ
n
ˆ 
s
n 1
 Schritt 3: Teilen der geschätzten Populationsstandardabweichung σ durch die Wurzel aus der
Stichprobengröße n zum Standardfehler SE
1
 ˆ
SE 
n
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Also müsste die Wahrscheinlichkeitsverteilung
der Mittelwerte einer Normalverteilung mit den
Parametern μ und SE folgen
f ( x ,  , ) 
(unabhängig)
11.1
11.2
11.3
1
e
2
11.4
11.5
1 x 
 
2
11.6



11.7
2
11.8
11.9
12
12.1
12.2
 Tut sie aber nicht, denn Gosset entdeckte, dass
die Normalverteilung in der Praxis nicht passt
12.3
12.4
12.5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 William Sealy Gosset fand schließlich, dass die
korrekte Wahrscheinlichkeitsverteilung für
  x 
(unabhängig)
ein recht komplexer Formelausdruck ist.
 Er wich deshalb auf die in der Statistik beliebte
Idee der Prüfgröße aus.
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Gosset bewies, dass die Differenz noch ein wenig transformiert werden
muss, bevor eine handhabbare Wahrscheinlichkeitsverteilung entsteht
x 
t
SE
 Diese Prüfgröße wird auch als Student‘s t bezeichnet
 Dabei gilt: Je größer die ursprüngliche Differenz Δ, desto größer auch t
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die t-Verteilung
Kennwerte
1-Stichproben t-Test
 Beim t-Test für 1 Stichprobe gilt für die Dichte (fast eine Wahrscheinlichkeit)
eines konkreten Wertes t für die Prüfgröße

2-Stichproben t-Test
(abhängig)
f  t , df  
2-Stichproben t-Test
(unabhängig)

 0
df 
df 1
1

2
e

 
0
mit
d
df
1

2
e

t2 
1  
df 
d 

df 1
2
Dies ist die
t-Verteilung
t = Wert der Prüfgröße
df = Freiheitsgrade, beim 1-Stichproben t-Test immer df = n-1
(„degrees of freedom“)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die t-Verteilung
Kennwerte
1-Stichproben t-Test
 Beim t-Test für 1 Stichprobe gilt für die Dichte (fast eine Wahrscheinlichkeit)
eines konkreten Wertes t für die Prüfgröße

2-Stichproben t-Test
(abhängig)
f t,
2-Stichproben t-Test

 
0
(unabhängig)

1
1

2


 0
mit
d
e
2
1
e 
t2 

1 



d

1
2
Dies ist die
t-Verteilung
t = Wert der Prüfgröße
df = Freiheitsgrade, beim 1-Stichproben t-Test immer df = n-1
(„degrees of freedom“)
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Die t-Verteilung
SE
Dichtefunktion
Kennwerte

f t,
0.45
1-Stichproben t-Test

0.40
2-Stichproben t-Test
0.35
(abhängig)
0.30

 0

1
1

2
d
e

 
2
1
e 
t2 

1 


d 
0
0.25
2-Stichproben t-Test
(unabhängig)
0.20
0.15
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4

1
2
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Die t-Verteilung
SE
Dichtefunktion
Kennwerte

f t,
0.45
1-Stichproben t-Test

0.40
2-Stichproben t-Test
0.35
(abhängig)
0.30

 0

1
1

2
d
e

 
2
1
e 
t2 

1 


d 
0
0.25
2-Stichproben t-Test
(unabhängig)
0.20
0.15
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4

1
2
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Die t-Verteilung
SE
Dichtefunktion
Kennwerte

f t,
0.45
1-Stichproben t-Test

0.40
2-Stichproben t-Test
0.35
(abhängig)
0.30

 0

1
1

2
d
e

 
2
1
e 
t2 

1 


d 
0
0.25
2-Stichproben t-Test
(unabhängig)
0.20
0.15
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße
1
2
3
4

1
2
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Von der Zahl zur Entscheidung
Kennwerte
1-Stichproben t-Test
Ablauf des t-Test für 1 Stichprobe
Annahmen machen
Die Wahrscheinlichkeiten der Prüfgrößenwerte t sind
t-verteilt mit df = n-1 Freiheitsgraden
Hypothesen
H0: Stichprobenmittel und Erwartungswert sind gleich
H1: Stichprobenmittel und Erwartungswert sind ungleich
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
(beim t-Test gerichtet oder ungerichtet)
Signifikanznivau
Es wird getestet auf α = 0.05 oder α = 0.01
p-Wert bestimmen
Den p-Wert aus der Verteilungsfunktion ablesen
Entscheiden
Vergleich von p mit α und Entscheidung für/gegen die H1
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Die Wahrscheinlichkeitsverteilung
SE
Dichtefunktion
Kennwerte

f t,
0.45
1-Stichproben t-Test
(unabhängig)
 0

1
1

2
d
e

 
2
1
e 
t2 

1 


d 
0
0.35
0.30
Dichte
2-Stichproben t-Test

0.40
2-Stichproben t-Test
(abhängig)

0.25
0.20
0.15
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4

1
2
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Durchführung
Kennwerte
Verteilungsfunktion
2-Stichproben t-Test
(abhängig)

H0 : x  
H1 : x  
0.40
0.35
(unabhängig)
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30 Wahrscheinlichkeit, der „p-Wert“
Bedingte
0.25
2-Stichproben t-Test
F t,
Signifikanzniveau
Hypothesenrichtung
0.45
1-Stichproben t-Test
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Durchführung
Kennwerte
Verteilungsfunktion
2-Stichproben t-Test
(abhängig)

H0 : x  
0.40
H1 : x  
0.35
(unabhängig)
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30
Bedingte
Wahrscheinlichkeit, der „p-Wert“
0.25
2-Stichproben t-Test
F t,
Signifikanzniveau
Hypothesenrichtung
0.45
1-Stichproben t-Test
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
2.56
t-Wert
Theorie
Kennwerte
Daten, Empirie
Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
0.3
Sekunden
Theorie
Kennwerte
Daten, Empirie
Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
12.1:11.8
Sekunden
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Fahrzeit (x)
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12 7
Theorie
Kennwerte
Daten, Empirie
Einführung
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Voraussetzungen
Kennwerte
1-Stichproben t-Test
 Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die
Prüfgröße gehalten werden kann, muss 1 Voraussetzung erfüllt sein
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
Die Stichprobengröße muss n > 30 betragen
(unabhängig)
 Ist diese Voraussetzung nicht erfüllt, müssen die Stichprobendaten
normalverteilt sein, damit deren Mittelwerteverteilung t-verteilt ist
(Prüfung durch z.B. QQ-Plot, Shapiro-Wilks-Test oder Cramér-von-Mises-Test)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Beispiel
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
12.1:11.8
Sekunden
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Die Wahrscheinlichkeitsverteilung
SE
Dichtefunktion
Kennwerte

f t,
0.45
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)


 0

0.40
1
1

2
d
e

 
2
1
e 
t2 

1 


d 
0
0.35
0.30
0.25
2-Stichproben t-Test
(unabhängig)
0.20
0.15
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4

1
2
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Die Verteilungsfunktion
(unabhängig)
F t,


0.40
Die Dichtefunktion
liefert die (nicht interpretierbare) Dichte für
genau einen
gegebenen Wert t
0.35
2-Stichproben t-Test
0.30
Dichte
2-Stichproben t-Test
SE
Verteilungsfunktion
f t,
0.45
1-Stichproben t-Test
t
Dichtefunktion
Kennwerte
(abhängig)
Prüfgröße
x 
0.25
0.20
0.15
Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Durchführung
Kennwerte
Verteilungsfunktion
2-Stichproben t-Test
(abhängig)

H0 : x  
H1 : x  
0.40
0.35
(unabhängig)
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30 Wahrscheinlichkeit, der „p-Wert“
Bedingte
0.25
2-Stichproben t-Test
F t,
Signifikanzniveau
Hypothesenrichtung
0.45
1-Stichproben t-Test
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 1 Stichprobe
t
Durchführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Verteilungsfunktion
(unabhängig)
F t,

Signifikanzniveau
Hypothesenrichtung
H 0 0.45
: x 
H1 : x  
0.40
0.35
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30 Wahrscheinlichkeit, der „p-Wert“
Bedingte
0.25
2-Stichproben t-Test
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
2.56
t-Wert
Theorie
Kennwerte
Daten, Empirie
Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
0.3
Sekunden
Theorie
Kennwerte
Daten, Empirie
Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
12.1:11.8
Sekunden
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Entscheidung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 1 Stichprobe
Entscheidung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Beispiel
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
12.1:12.7
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Einführung
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Einführung
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
 Aus den gemessenen Daten können zwei
Mittelwerte berechnet werden
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
x1
x2
(unabhängig)
 Die Mittelwerte sind Kennwerte für die
konkret gemessenen Stichproben
Fahrzeit (x )
1
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Fahrzeit (x2)
in sec
13.6
14.0
12.8
11.7
11.1
13.5
16.2
12.1
11.4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Die zugehörigen Erwartungswerte heißen
x
x
1
2
 Wenn die Personen zu beiden
Messzeitpunkten aus derselben Population
stammen, muss gelten
x  x  
1
2
Fahrzeit (x )
1
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Fahrzeit (x2)
in sec
13.6
14.0
12.8
11.7
11.1
13.5
16.2
12.1
11.4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
 Problem: Das für beide Messungen geltende

2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
ist unbekannt.
 Idee: Die Mittelwerte aus beiden Messzeitpunkten sollten theoretisch gleich sein
x1  x2
Fahrzeit (x )
1
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Fahrzeit (x2)
in sec
13.6
14.0
12.8
11.7
11.1
13.5
16.2
12.1
11.4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
 Problem II: Damit hat man wieder zwei
Zahlen, was zu viel für den p-Wert ist
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
x1
x2
 Man kann nun einfach die Differenz von
beiden bilden:
 x  x2  x1
Fahrzeit (x )
1
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Fahrzeit (x2)
in sec
13.6
14.0
12.8
11.7
11.1
13.5
16.2
12.1
11.4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Frage: Beruht eine Unterschiedlichkeit
 x  x1  x2  0
a) auf Zufall oder
b) auf einem „echten“ Effekt?
(hier: der Beziehungszeit)
 Man braucht also eine Möglichkeit, um
„Zufall“ von einem systematischen
Effekt zu unterscheiden.
Fahrzeit (x )
1
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10 5
Fahrzeit (x2)
in sec
13.6
14.0
12.8
11.7
11.1
13.5
16.2
12.1
11.4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
12.1:12.7
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
0.6
Sekunden
Die Zahl ist
zu klein
normal
zu groß
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Vergleichsmaßstab
Kennwerte
0.3
1-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Wahrscheinlichkeit
2-Stichproben t-Test
0.25
0.2
0.15
0.1
0.05
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95 100
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Eckdaten
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Steckbrief
Was tut man?
Man zieht zwei abhängige Stichproben
Was kommt raus?
Je Ziehung einen Messwert
(Zeit in Sekunden)
Was nimmt man an? a) n unabhängige Ziehungen zu jedem Messzeitpunkt
b) intervallskalierte Messwerte
Was misst man?
Die Mittelwerte x1 und x2 aller Messungen
Was testet man?
Die Mittelwerte sind identisch
(Die Stichproben stammt aus derselben Population)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Die Wahrscheinlichkeitsverteilung für
 x  x1  x2
ist ein sehr theoretisches Konstrukt
Fahrzeit (x )
1
in se c
13.1
13.2
13.3
10.6
10.7
13.1
13.4
11.3
12.3
12.7
10.5
11.2
13.1
13.8
13 0
Fahrzeit (x2)
in sec
13.6
14.0
12.8
11.7
11.1
13.5
16.2
12.1
11.4
12.5
11.8
13.5
12.0
6
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Die Prüfgröße
(abhängig)
2-Stichproben t-Test
(unabhängig)
Streuung
Stichprobe
(von Daten)
Streuung
Population
Population
(von Werten)
(von Mittelwerten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Weil die Personen zu beiden Messzeitpunkten
paarweise zuzuordnen sind, kann man die Differenz
 i  xi 2  xi1
(unabhängig)
für jede einzelne der Personen i aus allen
n Personen bilden
 Man hat dann n Differenzen statt 2×n Messungen
Δ Fahrzeit
in se c
0.5
0.8
-0.5
1.1
0.4
0.4
2.8
0.8
-0.9
-0.2
1.3
2.3
-1.1
0.8
0.5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Weil die Personen zu beiden Messzeitpunkten
paarweise zuzuordnen sind, kann man die Differenz
 i  xi 2  xi1
(unabhängig)
für jede einzelne der Personen i aus allen
n Personen bilden
 Man hat dann n Messungen (von Differenzen)
Δ Fahrzeit
in se c
0.5
0.8
-0.5
1.1
0.4
0.4
2.8
0.8
-0.9
-0.2
1.3
2.3
-1.1
0.8
0.5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Der Mittelwert aus diesen Differenzen ist nichts
anderes ist als eine Summe von Zufallsvariablen
1
   1   2     n 
n

 Man rechnet also eigentlich wieder einen
t
1-Stichproben t-Test… aber was ist das μ?
SE
Δ Fahrzeit
in se c
0.5
0.8
-0.5
1.1
0.4
0.4
2.8
0.8
-0.9
-0.2
1.3
2.3
-1.1
0.8
0.5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Idee: Wenn die Stichproben aus derselben Population stammen, ist die erwartete Differenz Null
  0
(unabhängig)
 μ ist damit bekannt, SE berechnet sich
0
t
wie üblich – nur eben auf den Differenzen.
SE
Δ Fahrzeit
in se c
0.5
0.8
-0.5
1.1
0.4
0.4
2.8
0.8
-0.9
-0.2
1.3
2.3
-1.1
0.8
0.5
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
 Schritt 1: Berechnung der Standardabweichung s
für die Stichprobendifferenzen
2
1 n
s
i   


n i 1
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Schritt 2: Korrektur der Standardabweichung s zur
geschätzten Populationsstandardabweichung σ
n
ˆ 
s
n 1
 Schritt 3: Teilen der geschätzten Populationsstandardabweichung σ durch die Wurzel aus der
Stichprobengröße n zum Standardfehler SE
1
 ˆ
SE 
n
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Falle – Von der Zahl zur Entscheidung
Kennwerte
1-Stichproben t-Test
Ablauf des t-Test für 2 abhängige Stichproben
Annahmen machen
Die Wahrscheinlichkeiten der Prüfgrößenwerte t sind
t-verteilt mit df = n-1 Freiheitsgraden
Hypothesen
H0: Der Erwartungswert der Differenzen ist Null
H1: Der Erwartungswert der Differenzen ist nicht Null
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
(beim t-Test gerichtet oder ungerichtet)
Signifikanznivau
Es wird getestet auf α = 0.05 oder α = 0.01
p-Wert bestimmen
Den p-Wert aus der Verteilungsfunktion ablesen
Entscheiden
Vergleich von p mit α und Entscheidung für/gegen die H1
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 2 Stichproben
t
Der abhängige Fall – Durchführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
(unabhängig)
F t,

H 0 0.45
: x2  x1
0.40
H1 : x2  x1
0.35
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30 Wahrscheinlichkeit, der „p-Wert“
Bedingte
0.25
2-Stichproben t-Test
Verteilungsfunktion
Signifikanzniveau
Hypothesenrichtung
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 2 Stichproben
t
Der abhängige Fall – Durchführung
Kennwerte
2-Stichproben t-Test
(abhängig)
0.40
H1 : x2  x1
0.35
(unabhängig)
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30
Bedingte
Wahrscheinlichkeit, der „p-Wert“
0.25
2-Stichproben t-Test
F t,

H 0 : x2  x1
0.45
1-Stichproben t-Test
Verteilungsfunktion
Signifikanzniveau
Hypothesenrichtung
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
5.285
t-Wert
Die Zahl ist
zu klein
normal
zu groß
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
0.6
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
12.1:12.7
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Unterschied ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der abhängige Fall – Entscheidung
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der abhängige Fall – Voraussetzungen
Kennwerte
1-Stichproben t-Test
 Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die
Prüfgröße gehalten werden kann, muss 1 Voraussetzung erfüllt sein
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
Die Stichprobengröße muss n > 30 betragen
(unabhängig)
 Ist diese Voraussetzung nicht erfüllt, müssen die Stichprobendaten
normalverteilt sein, damit deren Mittelwerteverteilung t-verteilt ist
(Prüfung durch z.B. Shapiro-Wilks-Test oder Cramér-von-Mises-Test)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Beispiel
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Datenlage
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
10.0
10.5
11.0
11.5
12.0
12.5
13.0
13.5
14.0
14.5
15.0
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
12.26:11.9
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Einführung
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Einführung
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
 Aus den gemessenen Daten können zwei
Mittelwerte berechnet werden
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
x1
x2
(unabhängig)
 Die Mittelwerte sind Kennwerte für die
konkret gemessenen Stichproben mit den
Größen n1 und n2
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrze it (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Die zugehörigen Erwartungswerte heißen
x
x
1
2
 Wenn die Personen in beiden Stichproben
aus derselben Population stammen, muss
gelten
x  x  
1
2
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrze it (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
 Problem: Das für beide Stichproben geltende

2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
ist unbekannt.
 Idee: Die Mittelwerte aus beiden Stichproben sollten theoretisch gleich sein
x1  x2
Fahrzeit (x1)
in se c (n = 40 )
13.1
13.2
13.3
10.7
13.1
13.4
11.3
12.3
12.7
11.2
11.4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
 Problem II: Damit hat man wieder zwei
Zahlen, was zu viel für den p-Wert ist
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
x1
x2
 Man kann nun einfach die Differenz von
beiden bilden:
 x  x2  x1
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrze it (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Einführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Frage: Beruht eine Unterschiedlichkeit
 x  x2  x1  0
a) auf Zufall oder
b) auf einem „echten“ Effekt?
(hier: der Beziehungszeit)
 Man braucht also eine Möglichkeit, um
„Zufall“ von einem systematischen
Effekt zu unterscheiden.
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrze it (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Hypothese
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothese
Annahmen
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
12.26:11.9
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
0.36
Sekunden
Die Zahl ist
zu klein
normal
zu groß
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Schema
Annahmen
Hypothese
über den Vergleichsmaßstab
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Vergleichsmaßstab
Kennwerte
0.3
1-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Wahrscheinlichkeit
2-Stichproben t-Test
0.25
0.2
0.15
0.1
0.05
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95 100
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Eckdaten
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Steckbrief
Was tut man?
Man zieht zwei unabhängige Stichproben
Was kommt raus?
Je Ziehung einen Messwert
(Zeit in Sekunden)
Was nimmt man an? a) n unabhängige Ziehungen zu jedem Messzeitpunkt
b) intervallskalierte Messwerte
Was misst man?
Die Mittelwerte x1 und x2 aller Messungen
Was testet man?
Die Mittelwerte sind identisch
(Die Stichproben stammt aus derselben Population)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Die Wahrscheinlichkeitsverteilung für
 x  x2  x1
bei unabhängigen Stichproben ist ein
ziemlich theoretisches Konstrukt
Fahrze it (x1)
in se c (n = 40 )
13.Fa
1 hrzeit (x2)
in se c (n = 32 )
13.2
10.6
13.3
10.5
10.7
13.1
13.1
13.8
13.4
13.0
11.3
11.1
12.3
11.4
12.7
12.7
11.2
14.1
11.4
11.1
13.2
11.8
11.9
12.1
11.5
10.8
11.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
 Die Differenz von Mittelwerten ist nichts anderes
ist als eine Summe von Zufallsvariablen
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
x 
1
1
x12  x22    xn2 2 
x11  x21    xn11
n2
n1



(unabhängig)
 
 Das weist auf eine t-Prüfgröße
t x
hin Aber was ist das μ?
SE

Fahrze it (x1)
in se c (n = 40 )
13.Fa
1 hrzeit (x2)
in se c (n = 32 )
13.2
10.6
13.3
10.5
10.7
13.1
13.1
13.8
13.4
13.0
11.3
11.1
12.3
11.4
12.7
12.7
11.2
14.1
11.4
11.1
13.2
11.8
11.9
12.1
11.5
10.8
11.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Idee: Wenn die Stichproben aus derselben Population stammen, ist die erwartete Differenz Null
  0
x
(unabhängig)
 μ ist damit bekannt, fehlt nur
noch der Standardfehler SE
t
x  0
SE
Fahrze it (x1)
in se c (n = 40 )
13.Fa
1 hrzeit (x2)
in se c (n = 32 )
13.2
10.6
13.3
10.5
10.7
13.1
13.1
13.8
13.4
13.0
11.3
11.1
12.3
11.4
12.7
12.7
11.2
14.1
11.4
11.1
13.2
11.8
11.9
12.1
11.5
10.8
11.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Die Prüfgröße
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
(von Daten)
Population
(von Werten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Die Prüfgröße
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
(von Daten)
Population
(von Werten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Die Prüfgröße
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
(von Daten)
Population
(von Werten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Die Prüfgröße
(abhängig)
2-Stichproben t-Test
(unabhängig)
Stichprobe
(von Mittelwerten)
Population
(von Werten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Die Prüfgröße
(abhängig)
2-Stichproben t-Test
(unabhängig)
Stichprobe
(einer Mittelwertedifferenz)
(von Mittelwerten)
Population
Population
(von Mittelwerten)
(von Differenzen von Mittelwerten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Die Prüfgröße
Streuung
2-Stichproben t-Test
(unabhängig)
Streuung
Streuung
Stichprobe
(von Daten)
Population
Population
(von Mittelwerten)
(von Differenzen von Mittelwerten)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Ziel ist es nun, von den Streuungen der Stichproben
auf eine vernünftige Schätzung der Streuung der
Mittelwertedifferenz zu kommen
 Startpunkt sind die Standardabweichungen
(unabhängig)
sx1
 Aber welche von beiden?
sx2
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrzeit (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
13.2
11.1
11.9
11.8
11.5
12.1
11.8
10.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
 Idee: Die Standardabweichungen könnten
„gemittelt“ werden
 Die Methode wird als Pooling bezeichnet
2-Stichproben t-Test
(unabhängig)
s pooled
n1s12  n2 s22

n1  n2
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrzeit (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
13.2
11.1
11.9
11.8
11.5
12.1
11.8
10.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Idee: Aus der gepoolten Standardabweichung der
Stichprobe kann dann wieder die Populationsstandardabweichung geschätzt werden
n1  n2
 s pooled
ˆ 
n1  n2  2
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrzeit (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
13.2
11.1
11.9
11.8
11.5
12.1
11.8
10.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
 Abkürzung: Man kann Pooling und Schätzkorrektur
in einem Schritt erledigen
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
ˆ pooled
n1s12  n2 s22

n1  n2  2
Fahrzeit (x1)
in se c (n = 40 )
13.1
Fahrzeit (x2)
13.2 in sec (n = 32)
13.3
10.6
10.7
10.5
13.1
13.1
13.4
13.8
11.3
13.0
12.3
11.1
12.7
11.4
11.2
12.7
11.4
14.1
13.2
11.1
11.9
11.8
11.5
12.1
11.8
10.8
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Schritt 1: Berechnung der Standardabweichungen
s1 und s2 für die Stichproben
1 n1
2
s1 
x

x
 i1 1 

n1 i 1
 Schritt 2: Poolen und Korrektur von s1 und s2 zur
geschätzten Populationsstandardabweichung σ
n1s12  n2 s22
ˆ 
n1  n2  2
 Schritt 3: Teilen der geschätzten Populationsstandardabweichung durch die Wurzel aus den
Stichprobengrößen n1 und n2 zum Standardfehler
SE
SE 
1 1
  ˆ
n1 n2
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Die Prüfgröße
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
x 
t
SE
mit df = n1 + n2 – 2 Freiheitsgraden
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Falle – Von der Zahl zur Entscheidung
Kennwerte
1-Stichproben t-Test
Ablauf des t-Test für 2 abhängige Stichproben
Annahmen machen
Die Wahrscheinlichkeiten der Prüfgrößenwerte t sind
t-verteilt mit df = n1+n2-2 Freiheitsgraden
Hypothesen
H0: Der Erwartungswert der Differenzen ist Null
H1: Der Erwartungswert der Differenzen ist nicht Null
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
(beim t-Test gerichtet oder ungerichtet)
Signifikanznivau
Es wird getestet auf α = 0.05 oder α = 0.01
p-Wert bestimmen
Den p-Wert aus der Verteilungsfunktion ablesen
Entscheiden
Vergleich von p mit α und Entscheidung für/gegen die H1
Empirische
Methoden
Jetzt & Gleich
Primer
Prüfgröße
x 
t-Test für 2 Stichproben
t
Der unabhängige Fall – Durchführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
(unabhängig)
F t,

H 0 0.45
: x2  x1
0.40
H1 : x2  x1
0.35
p(
| H0 )
0.20
0.15

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
0.30 Wahrscheinlichkeit, der „p-Wert“
Bedingte
0.25
2-Stichproben t-Test
Verteilungsfunktion
Signifikanzniveau
Hypothesenrichtung
SE
0.10
0.05
0.00
‐4
‐3
‐2
‐1
0
Prüfgröße t
1
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Durchführung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
Hypothesenrichtung
H 0 : x2  x1
H1 : x2  x1

Signifikanzniveau
Bedingte Wahrscheinlichkeit, der „p-Wert“
p(
| H0 )
Prüfgröße
x 
t
SE
Verteilungsfunktion
F t,

Die Verteilungsfunktion liefert die
Wahrscheinlichkeit für
höchstens einen
gegebenen Wert t
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
1.541
t-Wert
Die Zahl ist
zu klein
normal
zu groß
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
0.36
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Die Zahl ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
12.26:11.9
Sekunden
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Entscheidung
Annahmen
Hypothese
über den Vergleichsmaßstab
(unabhängig)
Unterschied ist
zu klein
normal
zu groß
Vergleich
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
Theorie
Kennwerte
Daten, Empirie
Der unabhängige Fall – Entscheidung
Zufallsauswahl
2-Stichproben t-Test
(unabhängig)
Zufallsauswahl
Stichprobe
Population
(ein Mittelwert)
(alle Mittelwerte)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Entscheidung
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
10.0
10.5
11.0
11.5
12.0
12.5
13.0
13.5
14.0
14.5
15.0
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Voraussetzungen
Kennwerte
1-Stichproben t-Test
 Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die
Prüfgröße gehalten werden kann, müssen 2 Voraussetzungen erfüllt sein
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
I. Die kombinierte Stichprobengröße muss n1+n2 > 50 betragen
(unabhängig)
 Ist diese Voraussetzung nicht erfüllt, müssen die Stichprobendaten
normalverteilt sein, damit deren Mittelwerteverteilung t-verteilt ist
(Prüfung durch z.B. Shapiro-Wilks-Test oder Cramér-von-Mises-Test)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Der unabhängige Fall – Voraussetzungen
Kennwerte
1-Stichproben t-Test
 Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die
Prüfgröße gehalten werden kann, müssen 2 Voraussetzungen erfüllt sein
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
II. Die Streuungen der Populationen müssen gleich sein
(unabhängig)
 Ist diese Voraussetzung nicht erfüllt, sollte Welch‘s Test verwendet werden
(Prüfung durch z.B. Levene-Test oder F-Test)
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Abhängig oder Unabhängig, das ist hier die Frage
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Abhängig oder Unabhängig, das ist hier die Frage
Kennwerte
1-Stichproben t-Test
 Der unabhängige t-Test scheint zunächst teststärker, weil er fast doppelt so
viele Freiheitsgrade hat wie der abhängige t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
2
3
4
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Abhängig oder Unabhängig, das ist hier die Frage
t‐Wert bei unterschiedlichen Korrelationen
Kennwerte
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
 Viel entscheidender ist die Größe des Standardfehlers
Mittelwert  
t
SE
4
t‐Wert
1-Stichproben t-Test
5
3
2
1
(unabhängig)
 Dieser ist beim abhängigen t-Test kleiner, solange die
Messwerte positiv zusammenhängen („korrelieren“)
0
‐1
0
Zusammenhang zwischen den Stichproben
 Nur bei keinem/negativem Zusammenhang ist der unabhängige t-Test stärker
1
Empirische
Methoden
Jetzt & Gleich
Primer
t-Test für 2 Stichproben
Abhängig oder Unabhängig, das ist hier die Frage
t‐Wert bei unterschiedlichen Korrelationen
Kennwerte
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 In der Praxis ist der abhängige Fall dem unabhängigen
hinsichtlich der Teststärke zumeist klar überlegen.
 Aber: Für jedes Untersuchungsdesign mit abhängigen
Stichproben gelten dieselben kritische Punkte, u.a.
4
t‐Wert
1-Stichproben t-Test
5
3
2
1
1. Carry-Over Effekte zwischen den
Messzeitpunkten (z.B. Lerneffekte)
2. Drop-Outs zu späteren Messzeitpunkten
reduzieren die gesamte Stichprobe
0
‐1
0
Zusammenhang zwischen den Stichproben
1
Empirische
Methoden
Jetzt & Gleich
Primer
Die Effektstärke
Einführung
Effektstärke
Multiples Testen
Empirische
Methoden
Jetzt & Gleich
Primer
Die Effektstärke
Einführung
Effektstärke
Multiples Testen
Mittelwert  
t
SE
Empirische
Methoden
Jetzt & Gleich
Primer
Die Effektstärke
Einführung
Effektstärke
Multiples Testen
t
Mittelwert  
Empirische
Methoden
Jetzt & Gleich
Primer
Die Effektstärke
Das Problem
Effektstärke
Multiples Testen
 Der Standardfehler SE Der wird mit steigender
Stichprobengröße n immer kleiner
…und die Prüfgröße t damit immer größer
…und somit jeder t-Test irgendwann signifikant
 Jacob Cohen (1992) schlug deshalb die Berechnung
der so genannten Effektstärke vor
Empirische
Methoden
Jetzt & Gleich
Primer
Die Effektstärke
Die Antwort – Cohen‘s d
Effektstärke
Multiples Testen
 Cohen‘s d als Maß der Effektstärke berechnet sich grundsätzlich als
Mittelwert  
d
ˆ
 Es ist also praktisch dasselbe wie die t-Prüfgröße, nur mit der
geschätzten Populationsstandardabweichung im Nenner
Empirische
Methoden
Jetzt & Gleich
Primer
Die Effektstärke
Die Antwort – Cohen‘s d
Effektstärke
Multiples Testen
 Cohen hat Faustregeln zur Bewertung der Effektstärke d definiert
d  .2  kleiner Effekt
d  .5  mittlerer Effekt
d  .8  großer Effekt
Empirische
Methoden
Jetzt & Gleich
Primer
α-Fehler Kumulierung
Einführung
Effektstärke
Multiples Testen
Empirische
Methoden
Jetzt & Gleich
Primer
α-Fehler Kumulierung
Das Problem
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 In vielen Untersuchungen hat man mehr als 2 Gruppen
oder Messzeitpunkte
 Zwischen allen kann man paarweise t-Tests berechnen
Empirische
Methoden
Jetzt & Gleich
Primer
α-Fehler Kumulierung
Bonferroni- und Dunn-Šidák Korrektur
Kennwerte
1-Stichproben t-Test
2-Stichproben t-Test
(abhängig)
2-Stichproben t-Test
(unabhängig)
 Die Bonferroni-Korrektur nimmt an, dass bei k Tests
das α-Niveau um 1/k verringert werden muss, um
die erhöhte Irrtumswahrscheinlichkeit auszugleichen
 Die Dunn-Šidak Korrektur berechnet das neue α-Niveau
über die komplementäre Wahrscheinlichkeit, dass bei k
Stichproben nur α·k signifikant werden.
 Die Bonferroni Korrektur ist marginal(st) konservativer.
 neu 

k
 neu  1  (1   )
1
k
Herunterladen