Empirische Methoden Primer Primer: Inferenzstatistik 1.0 Dr. Malte Persike [email protected] methodenlehre.com twitter.com/methodenlehre methodenlehre.com/g+ iversity.org/schoolinger Empirische Methoden Jetzt & Gleich Primer Inhalte der nächsten Minuten Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test Absolute Beginner: Mittelwert, Varianz und Standardabweichung (abhängig) Ein paar Wenige gegen Alle: Der 1-Stichproben t-Test 2-Stichproben t-Test Selbstkonfrontation: Der t-Test für abhängige Stichproben (unabhängig) Wenn zwei sich streiten: Der t-Test für unabhängige Stichproben Empirische Methoden Jetzt & Gleich Primer Kennwerte Mittelwert Kennwerte 1-Stichproben t-Test Der Mittelwert einer Variable X ist ein Kennwert, der die Lage der Verteilung von Messwerten auf ihrer Skala (der „x-Achse“) beschreibt 1 n x xi n i 1 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) mit xi = Der Wert des i-ten Merkmalsträgers in der Datenreihe n = Größe der Stichprobe, also die Anzahl der Merkmalsträger Empirische Methoden Jetzt & Gleich Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Primer Empirische Methoden Jetzt & Gleich Primer Kennwerte Varianz Kennwerte 1-Stichproben t-Test Die Varianz ist ein Kennwert, der die Breite der Verteilung von Daten auf ihrer Skala (der „x-Achse“) beschreibt n 1 2 s 2 xi x n i 1 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) mit xi = Der Wert des i-ten Merkmalsträgers in der Datenreihe x = Der Mittelwert aller Merkmalsträger n = Größe der Stichprobe, also die Anzahl der Merkmalsträger Empirische Methoden Jetzt & Gleich Primer Kennwerte Standardabweichung Kennwerte 1-Stichproben t-Test Die Standardabweichung ist die Wurzel der Varianz und beschreibt die Breite der Datenverteilung besser als die Varianz 2-Stichproben t-Test n 1 2 2 s s xi x n i 1 (abhängig) 2-Stichproben t-Test (unabhängig) mit xi = Der Wert des i-ten Merkmalsträgers in der Datenreihe x = Der Mittelwert aller Merkmalsträger n = Größe der Stichprobe, also die Anzahl der Merkmalsträger Empirische Methoden Jetzt & Gleich Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Primer Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Beispiel Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 12.1:11.8 Sekunden 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Quickie: Intervallskala Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Einführung Kennwerte 1-Stichproben t-Test Aus den gemessenen Daten wurde ein Mittelwert 2-Stichproben t-Test x (abhängig) 2-Stichproben t-Test (unabhängig) ("x quer") berechnet Der Mittelwert ist ein Kennwert für die konkret gemessene Stichprobe Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Der gegebene Vergleichswert heißt Fahrzeit (x) in se c ("mü") und wird Erwartungswert genannt Der Erwartungswert repräsentiert den „wahren“ Mittelwert, der in der Population gilt, aus der die Stichprobe kommt (oder erwartungsgemäß kommen soll) 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12 7 Theorie Kennwerte Daten, Empirie Einführung Zufallsauswahl Stichprobe Population (alle Gezogenen) (alle Möglichen) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12 7 Theorie Kennwerte Daten, Empirie Einführung Zufallsauswahl Stichprobe Population (alle Gezogenen) (alle Möglichen) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12 7 Theorie Kennwerte Daten, Empirie Einführung Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Problem: Man hat zwei Zahlen, die in der Hypothese enthalten sind x 2-Stichproben t-Test (unabhängig) allerdings können wir den p-Wert nur sinnvoll für eine Zahl berechnen. Ziel: Wir müssen auf eine Zahl herunterkommen. Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Um zwei Zahlen auf eine zu reduzieren, kann einfach die Differenz von beiden gebildet werden: x (unabhängig) Wenn die Nullhypothese gilt und der Zufall „perfekt funktioniert“ hat, sollte der Unterschied zwischen x und μ Null sein Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Frage: Beruht eine Unterschiedlichkeit x 0 a) auf Zufall oder b) auf einem „echten“ Effekt? (hier: der Beziehungszeit) Man braucht also eine Möglichkeit, um „Zufall“ von einem systematischen Effekt zu unterscheiden. Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 12.1:11.8 Sekunden 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 0.3 Sekunden Die Zahl ist zu klein normal zu groß Theorie Kennwerte Daten, Empirie Schema Annahmen Hypothese über den Vergleichsmaßstab Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Der Vergleichsmaßstab Kennwerte 0.3 1-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Wahrscheinlichkeit 2-Stichproben t-Test 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Eckdaten Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Steckbrief Was tut man? Man zieht eine Stichprobe aus einer Population Was kommt raus? Je Ziehung ein Messwert (Zeit in Sekunden) Was nimmt man an? a) n unabhängige Ziehungen b) Intervallskalierte Messungen Was misst man? Den Mittelwert x aller Messungen x Was testet man? Der Mittelwert ist identisch mit einem Erwartungswert μ (Die Stichprobe stammt aus der erwarteten Population) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) William Sealy Gosset hat 1908 versucht, die Wahrscheinlichkeitsverteilung für x 2-Stichproben t-Test (unabhängig) herzuleiten und sich dabei zunächst mit der Wahrscheinlichkeitsverteilung für Mittelwerte alleine beschäftigt x Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Die Prüfgröße (abhängig) 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Warum die Normalverteilung – Zentraler Grenzwertsatz Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Dabei kam ihm der Zentrale Grenzwertsatz (Central Limit Theorem) zu Hilfe: Die Summe einer großen Zahl unabhängiger, identisch verteilter (iid = „independent and identically distributed“) Zufallsvariablen ist approximativ normalverteilt. Dies veranlasste Sir Francis Galton (1889) zu der enthusiasmierten Lobpreisung „Ich kenne kaum etwas, das unsere Imaginationskraft so bewegen kann wie die wundervolle Form kosmischer Ordnung, die sich im ‚Gesetz der Verteilung von Fehlern‘ ausdrückt. Hätten die Griechen es gekannt, sie hätten es personifiziert und als Gottheit angebetet. Es herrscht mit bescheidener Gelassenheit in der wildesten Konfusion. Je gewaltiger die Horde, je ärger die augenscheinliche Anarchie, um so souveräner ist seine Herrschaft. Wann immer eine Menge chaotischer Elemente nach ihrer Größe angeordnet wird, tritt es hinter dem Schleier des Chaos als unverhoffte und wunderschöne Form der Regelmäßigkeit hervor.“ Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Gosset wusste, dass der Mittelwert nichts anderes ist als eine Summe von Zufallsvariablen 1 X1 X 2 X n n Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Gosset wusste, dass der Mittelwert nichts anderes ist als eine Summe von Zufallsvariablen 1 X1 X 2 X n n Wenn man das Experiment also sehr oft durchführen würde, müsste die Wahrscheinlichkeitsverteilung der vielen daraus berechneten Mittelwerte eine Normalverteilung sein Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Dichtefunktion 1 x 1 f ( x , , ) e 2 2 2 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test Der Parameter μ der Normalverteilung ist in unserem Fall bekannt, weil gegeben (in unserem Beispiel μ = 11.8) (abhängig) 2-Stichproben t-Test (unabhängig) Der zweite Parameter σ ist unbekannt, kann nach Gosset aber aus den gemessenen Daten geschätzt werden Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Die Prüfgröße (abhängig) 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Die Prüfgröße (abhängig) 2-Stichproben t-Test (unabhängig) Streuung Stichprobe (von Daten) Streuung Population Population (von Werten) (von Mittelwerten) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test Schritt 1: Berechnung der Standardabweichung s für die Stichprobendaten 1 n 2 s xi x n i1 Schritt 2: Korrektur der Standardabweichung s zur geschätzten Populationsstandardabweichung σ n ˆ s n 1 Schritt 3: Teilen der geschätzten Populationsstandardabweichung σ durch die Wurzel aus der Stichprobengröße n zum Standardfehler SE 1 ˆ SE n 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Also müsste die Wahrscheinlichkeitsverteilung der Mittelwerte einer Normalverteilung mit den Parametern μ und SE folgen f ( x , , ) (unabhängig) 11.1 11.2 11.3 1 e 2 11.4 11.5 1 x 2 11.6 11.7 2 11.8 11.9 12 12.1 12.2 Tut sie aber nicht, denn Gosset entdeckte, dass die Normalverteilung in der Praxis nicht passt 12.3 12.4 12.5 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test William Sealy Gosset fand schließlich, dass die korrekte Wahrscheinlichkeitsverteilung für x (unabhängig) ein recht komplexer Formelausdruck ist. Er wich deshalb auf die in der Statistik beliebte Idee der Prüfgröße aus. Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Gosset bewies, dass die Differenz noch ein wenig transformiert werden muss, bevor eine handhabbare Wahrscheinlichkeitsverteilung entsteht x t SE Diese Prüfgröße wird auch als Student‘s t bezeichnet Dabei gilt: Je größer die ursprüngliche Differenz Δ, desto größer auch t Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die t-Verteilung Kennwerte 1-Stichproben t-Test Beim t-Test für 1 Stichprobe gilt für die Dichte (fast eine Wahrscheinlichkeit) eines konkreten Wertes t für die Prüfgröße 2-Stichproben t-Test (abhängig) f t , df 2-Stichproben t-Test (unabhängig) 0 df df 1 1 2 e 0 mit d df 1 2 e t2 1 df d df 1 2 Dies ist die t-Verteilung t = Wert der Prüfgröße df = Freiheitsgrade, beim 1-Stichproben t-Test immer df = n-1 („degrees of freedom“) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die t-Verteilung Kennwerte 1-Stichproben t-Test Beim t-Test für 1 Stichprobe gilt für die Dichte (fast eine Wahrscheinlichkeit) eines konkreten Wertes t für die Prüfgröße 2-Stichproben t-Test (abhängig) f t, 2-Stichproben t-Test 0 (unabhängig) 1 1 2 0 mit d e 2 1 e t2 1 d 1 2 Dies ist die t-Verteilung t = Wert der Prüfgröße df = Freiheitsgrade, beim 1-Stichproben t-Test immer df = n-1 („degrees of freedom“) Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Die t-Verteilung SE Dichtefunktion Kennwerte f t, 0.45 1-Stichproben t-Test 0.40 2-Stichproben t-Test 0.35 (abhängig) 0.30 0 1 1 2 d e 2 1 e t2 1 d 0 0.25 2-Stichproben t-Test (unabhängig) 0.20 0.15 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 1 2 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Die t-Verteilung SE Dichtefunktion Kennwerte f t, 0.45 1-Stichproben t-Test 0.40 2-Stichproben t-Test 0.35 (abhängig) 0.30 0 1 1 2 d e 2 1 e t2 1 d 0 0.25 2-Stichproben t-Test (unabhängig) 0.20 0.15 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 1 2 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Die t-Verteilung SE Dichtefunktion Kennwerte f t, 0.45 1-Stichproben t-Test 0.40 2-Stichproben t-Test 0.35 (abhängig) 0.30 0 1 1 2 d e 2 1 e t2 1 d 0 0.25 2-Stichproben t-Test (unabhängig) 0.20 0.15 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße 1 2 3 4 1 2 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Von der Zahl zur Entscheidung Kennwerte 1-Stichproben t-Test Ablauf des t-Test für 1 Stichprobe Annahmen machen Die Wahrscheinlichkeiten der Prüfgrößenwerte t sind t-verteilt mit df = n-1 Freiheitsgraden Hypothesen H0: Stichprobenmittel und Erwartungswert sind gleich H1: Stichprobenmittel und Erwartungswert sind ungleich 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) (beim t-Test gerichtet oder ungerichtet) Signifikanznivau Es wird getestet auf α = 0.05 oder α = 0.01 p-Wert bestimmen Den p-Wert aus der Verteilungsfunktion ablesen Entscheiden Vergleich von p mit α und Entscheidung für/gegen die H1 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Die Wahrscheinlichkeitsverteilung SE Dichtefunktion Kennwerte f t, 0.45 1-Stichproben t-Test (unabhängig) 0 1 1 2 d e 2 1 e t2 1 d 0 0.35 0.30 Dichte 2-Stichproben t-Test 0.40 2-Stichproben t-Test (abhängig) 0.25 0.20 0.15 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 1 2 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Durchführung Kennwerte Verteilungsfunktion 2-Stichproben t-Test (abhängig) H0 : x H1 : x 0.40 0.35 (unabhängig) p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Wahrscheinlichkeit, der „p-Wert“ Bedingte 0.25 2-Stichproben t-Test F t, Signifikanzniveau Hypothesenrichtung 0.45 1-Stichproben t-Test SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Durchführung Kennwerte Verteilungsfunktion 2-Stichproben t-Test (abhängig) H0 : x 0.40 H1 : x 0.35 (unabhängig) p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Bedingte Wahrscheinlichkeit, der „p-Wert“ 0.25 2-Stichproben t-Test F t, Signifikanzniveau Hypothesenrichtung 0.45 1-Stichproben t-Test SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 2.56 t-Wert Theorie Kennwerte Daten, Empirie Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 0.3 Sekunden Theorie Kennwerte Daten, Empirie Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 12.1:11.8 Sekunden 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Fahrzeit (x) in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12 7 Theorie Kennwerte Daten, Empirie Einführung Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Voraussetzungen Kennwerte 1-Stichproben t-Test Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die Prüfgröße gehalten werden kann, muss 1 Voraussetzung erfüllt sein 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Die Stichprobengröße muss n > 30 betragen (unabhängig) Ist diese Voraussetzung nicht erfüllt, müssen die Stichprobendaten normalverteilt sein, damit deren Mittelwerteverteilung t-verteilt ist (Prüfung durch z.B. QQ-Plot, Shapiro-Wilks-Test oder Cramér-von-Mises-Test) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Beispiel Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 12.1:11.8 Sekunden 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Die Wahrscheinlichkeitsverteilung SE Dichtefunktion Kennwerte f t, 0.45 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 0 0.40 1 1 2 d e 2 1 e t2 1 d 0 0.35 0.30 0.25 2-Stichproben t-Test (unabhängig) 0.20 0.15 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 1 2 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Die Verteilungsfunktion (unabhängig) F t, 0.40 Die Dichtefunktion liefert die (nicht interpretierbare) Dichte für genau einen gegebenen Wert t 0.35 2-Stichproben t-Test 0.30 Dichte 2-Stichproben t-Test SE Verteilungsfunktion f t, 0.45 1-Stichproben t-Test t Dichtefunktion Kennwerte (abhängig) Prüfgröße x 0.25 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Durchführung Kennwerte Verteilungsfunktion 2-Stichproben t-Test (abhängig) H0 : x H1 : x 0.40 0.35 (unabhängig) p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Wahrscheinlichkeit, der „p-Wert“ Bedingte 0.25 2-Stichproben t-Test F t, Signifikanzniveau Hypothesenrichtung 0.45 1-Stichproben t-Test SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 1 Stichprobe t Durchführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Verteilungsfunktion (unabhängig) F t, Signifikanzniveau Hypothesenrichtung H 0 0.45 : x H1 : x 0.40 0.35 p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Wahrscheinlichkeit, der „p-Wert“ Bedingte 0.25 2-Stichproben t-Test SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 2.56 t-Wert Theorie Kennwerte Daten, Empirie Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 0.3 Sekunden Theorie Kennwerte Daten, Empirie Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 12.1:11.8 Sekunden 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Entscheidung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 1 Stichprobe Entscheidung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Beispiel Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 12.1:12.7 Sekunden Theorie Kennwerte Daten, Empirie Der abhängige Fall – Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der abhängige Fall – Einführung Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der abhängige Fall – Einführung Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Einführung Kennwerte 1-Stichproben t-Test Aus den gemessenen Daten können zwei Mittelwerte berechnet werden 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test x1 x2 (unabhängig) Die Mittelwerte sind Kennwerte für die konkret gemessenen Stichproben Fahrzeit (x ) 1 in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Fahrzeit (x2) in sec 13.6 14.0 12.8 11.7 11.1 13.5 16.2 12.1 11.4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Die zugehörigen Erwartungswerte heißen x x 1 2 Wenn die Personen zu beiden Messzeitpunkten aus derselben Population stammen, muss gelten x x 1 2 Fahrzeit (x ) 1 in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Fahrzeit (x2) in sec 13.6 14.0 12.8 11.7 11.1 13.5 16.2 12.1 11.4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Einführung Kennwerte 1-Stichproben t-Test Problem: Das für beide Messungen geltende 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) ist unbekannt. Idee: Die Mittelwerte aus beiden Messzeitpunkten sollten theoretisch gleich sein x1 x2 Fahrzeit (x ) 1 in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Fahrzeit (x2) in sec 13.6 14.0 12.8 11.7 11.1 13.5 16.2 12.1 11.4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Einführung Kennwerte 1-Stichproben t-Test Problem II: Damit hat man wieder zwei Zahlen, was zu viel für den p-Wert ist 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) x1 x2 Man kann nun einfach die Differenz von beiden bilden: x x2 x1 Fahrzeit (x ) 1 in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Fahrzeit (x2) in sec 13.6 14.0 12.8 11.7 11.1 13.5 16.2 12.1 11.4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Frage: Beruht eine Unterschiedlichkeit x x1 x2 0 a) auf Zufall oder b) auf einem „echten“ Effekt? (hier: der Beziehungszeit) Man braucht also eine Möglichkeit, um „Zufall“ von einem systematischen Effekt zu unterscheiden. Fahrzeit (x ) 1 in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10 5 Fahrzeit (x2) in sec 13.6 14.0 12.8 11.7 11.1 13.5 16.2 12.1 11.4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 12.1:12.7 Sekunden Theorie Kennwerte Daten, Empirie Der abhängige Fall – Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 0.6 Sekunden Die Zahl ist zu klein normal zu groß Theorie Kennwerte Daten, Empirie Der abhängige Fall – Schema Annahmen Hypothese über den Vergleichsmaßstab Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Vergleichsmaßstab Kennwerte 0.3 1-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Wahrscheinlichkeit 2-Stichproben t-Test 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Eckdaten Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Steckbrief Was tut man? Man zieht zwei abhängige Stichproben Was kommt raus? Je Ziehung einen Messwert (Zeit in Sekunden) Was nimmt man an? a) n unabhängige Ziehungen zu jedem Messzeitpunkt b) intervallskalierte Messwerte Was misst man? Die Mittelwerte x1 und x2 aller Messungen Was testet man? Die Mittelwerte sind identisch (Die Stichproben stammt aus derselben Population) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Die Wahrscheinlichkeitsverteilung für x x1 x2 ist ein sehr theoretisches Konstrukt Fahrzeit (x ) 1 in se c 13.1 13.2 13.3 10.6 10.7 13.1 13.4 11.3 12.3 12.7 10.5 11.2 13.1 13.8 13 0 Fahrzeit (x2) in sec 13.6 14.0 12.8 11.7 11.1 13.5 16.2 12.1 11.4 12.5 11.8 13.5 12.0 6 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Die Prüfgröße (abhängig) 2-Stichproben t-Test (unabhängig) Streuung Stichprobe (von Daten) Streuung Population Population (von Werten) (von Mittelwerten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Weil die Personen zu beiden Messzeitpunkten paarweise zuzuordnen sind, kann man die Differenz i xi 2 xi1 (unabhängig) für jede einzelne der Personen i aus allen n Personen bilden Man hat dann n Differenzen statt 2×n Messungen Δ Fahrzeit in se c 0.5 0.8 -0.5 1.1 0.4 0.4 2.8 0.8 -0.9 -0.2 1.3 2.3 -1.1 0.8 0.5 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Weil die Personen zu beiden Messzeitpunkten paarweise zuzuordnen sind, kann man die Differenz i xi 2 xi1 (unabhängig) für jede einzelne der Personen i aus allen n Personen bilden Man hat dann n Messungen (von Differenzen) Δ Fahrzeit in se c 0.5 0.8 -0.5 1.1 0.4 0.4 2.8 0.8 -0.9 -0.2 1.3 2.3 -1.1 0.8 0.5 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Der Mittelwert aus diesen Differenzen ist nichts anderes ist als eine Summe von Zufallsvariablen 1 1 2 n n Man rechnet also eigentlich wieder einen t 1-Stichproben t-Test… aber was ist das μ? SE Δ Fahrzeit in se c 0.5 0.8 -0.5 1.1 0.4 0.4 2.8 0.8 -0.9 -0.2 1.3 2.3 -1.1 0.8 0.5 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Idee: Wenn die Stichproben aus derselben Population stammen, ist die erwartete Differenz Null 0 (unabhängig) μ ist damit bekannt, SE berechnet sich 0 t wie üblich – nur eben auf den Differenzen. SE Δ Fahrzeit in se c 0.5 0.8 -0.5 1.1 0.4 0.4 2.8 0.8 -0.9 -0.2 1.3 2.3 -1.1 0.8 0.5 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test Schritt 1: Berechnung der Standardabweichung s für die Stichprobendifferenzen 2 1 n s i n i 1 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Schritt 2: Korrektur der Standardabweichung s zur geschätzten Populationsstandardabweichung σ n ˆ s n 1 Schritt 3: Teilen der geschätzten Populationsstandardabweichung σ durch die Wurzel aus der Stichprobengröße n zum Standardfehler SE 1 ˆ SE n Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Falle – Von der Zahl zur Entscheidung Kennwerte 1-Stichproben t-Test Ablauf des t-Test für 2 abhängige Stichproben Annahmen machen Die Wahrscheinlichkeiten der Prüfgrößenwerte t sind t-verteilt mit df = n-1 Freiheitsgraden Hypothesen H0: Der Erwartungswert der Differenzen ist Null H1: Der Erwartungswert der Differenzen ist nicht Null 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) (beim t-Test gerichtet oder ungerichtet) Signifikanznivau Es wird getestet auf α = 0.05 oder α = 0.01 p-Wert bestimmen Den p-Wert aus der Verteilungsfunktion ablesen Entscheiden Vergleich von p mit α und Entscheidung für/gegen die H1 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 2 Stichproben t Der abhängige Fall – Durchführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) (unabhängig) F t, H 0 0.45 : x2 x1 0.40 H1 : x2 x1 0.35 p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Wahrscheinlichkeit, der „p-Wert“ Bedingte 0.25 2-Stichproben t-Test Verteilungsfunktion Signifikanzniveau Hypothesenrichtung SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 2 Stichproben t Der abhängige Fall – Durchführung Kennwerte 2-Stichproben t-Test (abhängig) 0.40 H1 : x2 x1 0.35 (unabhängig) p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Bedingte Wahrscheinlichkeit, der „p-Wert“ 0.25 2-Stichproben t-Test F t, H 0 : x2 x1 0.45 1-Stichproben t-Test Verteilungsfunktion Signifikanzniveau Hypothesenrichtung SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 5.285 t-Wert Die Zahl ist zu klein normal zu groß Theorie Kennwerte Daten, Empirie Der abhängige Fall – Entscheidung Annahmen Hypothese über den Vergleichsmaßstab Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 0.6 Sekunden Theorie Kennwerte Daten, Empirie Der abhängige Fall – Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 12.1:12.7 Sekunden Theorie Kennwerte Daten, Empirie Der abhängige Fall – Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Unterschied ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der abhängige Fall – Entscheidung Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der abhängige Fall – Voraussetzungen Kennwerte 1-Stichproben t-Test Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die Prüfgröße gehalten werden kann, muss 1 Voraussetzung erfüllt sein 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Die Stichprobengröße muss n > 30 betragen (unabhängig) Ist diese Voraussetzung nicht erfüllt, müssen die Stichprobendaten normalverteilt sein, damit deren Mittelwerteverteilung t-verteilt ist (Prüfung durch z.B. Shapiro-Wilks-Test oder Cramér-von-Mises-Test) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Beispiel Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Datenlage Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 10.0 10.5 11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5 15.0 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 12.26:11.9 Sekunden Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Einführung Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Einführung Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Einführung Kennwerte 1-Stichproben t-Test Aus den gemessenen Daten können zwei Mittelwerte berechnet werden 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test x1 x2 (unabhängig) Die Mittelwerte sind Kennwerte für die konkret gemessenen Stichproben mit den Größen n1 und n2 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrze it (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Die zugehörigen Erwartungswerte heißen x x 1 2 Wenn die Personen in beiden Stichproben aus derselben Population stammen, muss gelten x x 1 2 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrze it (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Einführung Kennwerte 1-Stichproben t-Test Problem: Das für beide Stichproben geltende 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) ist unbekannt. Idee: Die Mittelwerte aus beiden Stichproben sollten theoretisch gleich sein x1 x2 Fahrzeit (x1) in se c (n = 40 ) 13.1 13.2 13.3 10.7 13.1 13.4 11.3 12.3 12.7 11.2 11.4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Einführung Kennwerte 1-Stichproben t-Test Problem II: Damit hat man wieder zwei Zahlen, was zu viel für den p-Wert ist 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) x1 x2 Man kann nun einfach die Differenz von beiden bilden: x x2 x1 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrze it (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Einführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Frage: Beruht eine Unterschiedlichkeit x x2 x1 0 a) auf Zufall oder b) auf einem „echten“ Effekt? (hier: der Beziehungszeit) Man braucht also eine Möglichkeit, um „Zufall“ von einem systematischen Effekt zu unterscheiden. Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrze it (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Hypothese Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothese Annahmen Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 12.26:11.9 Sekunden Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Schema Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 0.36 Sekunden Die Zahl ist zu klein normal zu groß Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Schema Annahmen Hypothese über den Vergleichsmaßstab Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Vergleichsmaßstab Kennwerte 0.3 1-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Wahrscheinlichkeit 2-Stichproben t-Test 0.25 0.2 0.15 0.1 0.05 0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Eckdaten Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Steckbrief Was tut man? Man zieht zwei unabhängige Stichproben Was kommt raus? Je Ziehung einen Messwert (Zeit in Sekunden) Was nimmt man an? a) n unabhängige Ziehungen zu jedem Messzeitpunkt b) intervallskalierte Messwerte Was misst man? Die Mittelwerte x1 und x2 aller Messungen Was testet man? Die Mittelwerte sind identisch (Die Stichproben stammt aus derselben Population) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Die Wahrscheinlichkeitsverteilung für x x2 x1 bei unabhängigen Stichproben ist ein ziemlich theoretisches Konstrukt Fahrze it (x1) in se c (n = 40 ) 13.Fa 1 hrzeit (x2) in se c (n = 32 ) 13.2 10.6 13.3 10.5 10.7 13.1 13.1 13.8 13.4 13.0 11.3 11.1 12.3 11.4 12.7 12.7 11.2 14.1 11.4 11.1 13.2 11.8 11.9 12.1 11.5 10.8 11.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test Die Differenz von Mittelwerten ist nichts anderes ist als eine Summe von Zufallsvariablen 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test x 1 1 x12 x22 xn2 2 x11 x21 xn11 n2 n1 (unabhängig) Das weist auf eine t-Prüfgröße t x hin Aber was ist das μ? SE Fahrze it (x1) in se c (n = 40 ) 13.Fa 1 hrzeit (x2) in se c (n = 32 ) 13.2 10.6 13.3 10.5 10.7 13.1 13.1 13.8 13.4 13.0 11.3 11.1 12.3 11.4 12.7 12.7 11.2 14.1 11.4 11.1 13.2 11.8 11.9 12.1 11.5 10.8 11.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Idee: Wenn die Stichproben aus derselben Population stammen, ist die erwartete Differenz Null 0 x (unabhängig) μ ist damit bekannt, fehlt nur noch der Standardfehler SE t x 0 SE Fahrze it (x1) in se c (n = 40 ) 13.Fa 1 hrzeit (x2) in se c (n = 32 ) 13.2 10.6 13.3 10.5 10.7 13.1 13.1 13.8 13.4 13.0 11.3 11.1 12.3 11.4 12.7 12.7 11.2 14.1 11.4 11.1 13.2 11.8 11.9 12.1 11.5 10.8 11.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Die Prüfgröße Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe (von Daten) Population (von Werten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Die Prüfgröße Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe (von Daten) Population (von Werten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Die Prüfgröße Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe (von Daten) Population (von Werten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Die Prüfgröße (abhängig) 2-Stichproben t-Test (unabhängig) Stichprobe (von Mittelwerten) Population (von Werten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Die Prüfgröße (abhängig) 2-Stichproben t-Test (unabhängig) Stichprobe (einer Mittelwertedifferenz) (von Mittelwerten) Population Population (von Mittelwerten) (von Differenzen von Mittelwerten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Die Prüfgröße Streuung 2-Stichproben t-Test (unabhängig) Streuung Streuung Stichprobe (von Daten) Population Population (von Mittelwerten) (von Differenzen von Mittelwerten) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Ziel ist es nun, von den Streuungen der Stichproben auf eine vernünftige Schätzung der Streuung der Mittelwertedifferenz zu kommen Startpunkt sind die Standardabweichungen (unabhängig) sx1 Aber welche von beiden? sx2 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrzeit (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 13.2 11.1 11.9 11.8 11.5 12.1 11.8 10.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Idee: Die Standardabweichungen könnten „gemittelt“ werden Die Methode wird als Pooling bezeichnet 2-Stichproben t-Test (unabhängig) s pooled n1s12 n2 s22 n1 n2 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrzeit (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 13.2 11.1 11.9 11.8 11.5 12.1 11.8 10.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Idee: Aus der gepoolten Standardabweichung der Stichprobe kann dann wieder die Populationsstandardabweichung geschätzt werden n1 n2 s pooled ˆ n1 n2 2 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrzeit (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 13.2 11.1 11.9 11.8 11.5 12.1 11.8 10.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test Abkürzung: Man kann Pooling und Schätzkorrektur in einem Schritt erledigen 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) ˆ pooled n1s12 n2 s22 n1 n2 2 Fahrzeit (x1) in se c (n = 40 ) 13.1 Fahrzeit (x2) 13.2 in sec (n = 32) 13.3 10.6 10.7 10.5 13.1 13.1 13.4 13.8 11.3 13.0 12.3 11.1 12.7 11.4 11.2 12.7 11.4 14.1 13.2 11.1 11.9 11.8 11.5 12.1 11.8 10.8 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Schritt 1: Berechnung der Standardabweichungen s1 und s2 für die Stichproben 1 n1 2 s1 x x i1 1 n1 i 1 Schritt 2: Poolen und Korrektur von s1 und s2 zur geschätzten Populationsstandardabweichung σ n1s12 n2 s22 ˆ n1 n2 2 Schritt 3: Teilen der geschätzten Populationsstandardabweichung durch die Wurzel aus den Stichprobengrößen n1 und n2 zum Standardfehler SE SE 1 1 ˆ n1 n2 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Die Prüfgröße Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) x t SE mit df = n1 + n2 – 2 Freiheitsgraden Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Falle – Von der Zahl zur Entscheidung Kennwerte 1-Stichproben t-Test Ablauf des t-Test für 2 abhängige Stichproben Annahmen machen Die Wahrscheinlichkeiten der Prüfgrößenwerte t sind t-verteilt mit df = n1+n2-2 Freiheitsgraden Hypothesen H0: Der Erwartungswert der Differenzen ist Null H1: Der Erwartungswert der Differenzen ist nicht Null 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) (beim t-Test gerichtet oder ungerichtet) Signifikanznivau Es wird getestet auf α = 0.05 oder α = 0.01 p-Wert bestimmen Den p-Wert aus der Verteilungsfunktion ablesen Entscheiden Vergleich von p mit α und Entscheidung für/gegen die H1 Empirische Methoden Jetzt & Gleich Primer Prüfgröße x t-Test für 2 Stichproben t Der unabhängige Fall – Durchführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) (unabhängig) F t, H 0 0.45 : x2 x1 0.40 H1 : x2 x1 0.35 p( | H0 ) 0.20 0.15 Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t 0.30 Wahrscheinlichkeit, der „p-Wert“ Bedingte 0.25 2-Stichproben t-Test Verteilungsfunktion Signifikanzniveau Hypothesenrichtung SE 0.10 0.05 0.00 ‐4 ‐3 ‐2 ‐1 0 Prüfgröße t 1 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Durchführung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Hypothesenrichtung H 0 : x2 x1 H1 : x2 x1 Signifikanzniveau Bedingte Wahrscheinlichkeit, der „p-Wert“ p( | H0 ) Prüfgröße x t SE Verteilungsfunktion F t, Die Verteilungsfunktion liefert die Wahrscheinlichkeit für höchstens einen gegebenen Wert t Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 1.541 t-Wert Die Zahl ist zu klein normal zu groß Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Entscheidung Annahmen Hypothese über den Vergleichsmaßstab Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 0.36 Sekunden Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Die Zahl ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test 12.26:11.9 Sekunden Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Entscheidung Annahmen Hypothese über den Vergleichsmaßstab (unabhängig) Unterschied ist zu klein normal zu groß Vergleich Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) Theorie Kennwerte Daten, Empirie Der unabhängige Fall – Entscheidung Zufallsauswahl 2-Stichproben t-Test (unabhängig) Zufallsauswahl Stichprobe Population (ein Mittelwert) (alle Mittelwerte) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Entscheidung Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 10.0 10.5 11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5 15.0 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Voraussetzungen Kennwerte 1-Stichproben t-Test Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die Prüfgröße gehalten werden kann, müssen 2 Voraussetzungen erfüllt sein 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test I. Die kombinierte Stichprobengröße muss n1+n2 > 50 betragen (unabhängig) Ist diese Voraussetzung nicht erfüllt, müssen die Stichprobendaten normalverteilt sein, damit deren Mittelwerteverteilung t-verteilt ist (Prüfung durch z.B. Shapiro-Wilks-Test oder Cramér-von-Mises-Test) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Der unabhängige Fall – Voraussetzungen Kennwerte 1-Stichproben t-Test Damit die Annahme der t-Verteilung als Vergleichsmaßstab für die Prüfgröße gehalten werden kann, müssen 2 Voraussetzungen erfüllt sein 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test II. Die Streuungen der Populationen müssen gleich sein (unabhängig) Ist diese Voraussetzung nicht erfüllt, sollte Welch‘s Test verwendet werden (Prüfung durch z.B. Levene-Test oder F-Test) Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Abhängig oder Unabhängig, das ist hier die Frage Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Abhängig oder Unabhängig, das ist hier die Frage Kennwerte 1-Stichproben t-Test Der unabhängige t-Test scheint zunächst teststärker, weil er fast doppelt so viele Freiheitsgrade hat wie der abhängige t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) 2 3 4 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Abhängig oder Unabhängig, das ist hier die Frage t‐Wert bei unterschiedlichen Korrelationen Kennwerte 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test Viel entscheidender ist die Größe des Standardfehlers Mittelwert t SE 4 t‐Wert 1-Stichproben t-Test 5 3 2 1 (unabhängig) Dieser ist beim abhängigen t-Test kleiner, solange die Messwerte positiv zusammenhängen („korrelieren“) 0 ‐1 0 Zusammenhang zwischen den Stichproben Nur bei keinem/negativem Zusammenhang ist der unabhängige t-Test stärker 1 Empirische Methoden Jetzt & Gleich Primer t-Test für 2 Stichproben Abhängig oder Unabhängig, das ist hier die Frage t‐Wert bei unterschiedlichen Korrelationen Kennwerte 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) In der Praxis ist der abhängige Fall dem unabhängigen hinsichtlich der Teststärke zumeist klar überlegen. Aber: Für jedes Untersuchungsdesign mit abhängigen Stichproben gelten dieselben kritische Punkte, u.a. 4 t‐Wert 1-Stichproben t-Test 5 3 2 1 1. Carry-Over Effekte zwischen den Messzeitpunkten (z.B. Lerneffekte) 2. Drop-Outs zu späteren Messzeitpunkten reduzieren die gesamte Stichprobe 0 ‐1 0 Zusammenhang zwischen den Stichproben 1 Empirische Methoden Jetzt & Gleich Primer Die Effektstärke Einführung Effektstärke Multiples Testen Empirische Methoden Jetzt & Gleich Primer Die Effektstärke Einführung Effektstärke Multiples Testen Mittelwert t SE Empirische Methoden Jetzt & Gleich Primer Die Effektstärke Einführung Effektstärke Multiples Testen t Mittelwert Empirische Methoden Jetzt & Gleich Primer Die Effektstärke Das Problem Effektstärke Multiples Testen Der Standardfehler SE Der wird mit steigender Stichprobengröße n immer kleiner …und die Prüfgröße t damit immer größer …und somit jeder t-Test irgendwann signifikant Jacob Cohen (1992) schlug deshalb die Berechnung der so genannten Effektstärke vor Empirische Methoden Jetzt & Gleich Primer Die Effektstärke Die Antwort – Cohen‘s d Effektstärke Multiples Testen Cohen‘s d als Maß der Effektstärke berechnet sich grundsätzlich als Mittelwert d ˆ Es ist also praktisch dasselbe wie die t-Prüfgröße, nur mit der geschätzten Populationsstandardabweichung im Nenner Empirische Methoden Jetzt & Gleich Primer Die Effektstärke Die Antwort – Cohen‘s d Effektstärke Multiples Testen Cohen hat Faustregeln zur Bewertung der Effektstärke d definiert d .2 kleiner Effekt d .5 mittlerer Effekt d .8 großer Effekt Empirische Methoden Jetzt & Gleich Primer α-Fehler Kumulierung Einführung Effektstärke Multiples Testen Empirische Methoden Jetzt & Gleich Primer α-Fehler Kumulierung Das Problem Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) In vielen Untersuchungen hat man mehr als 2 Gruppen oder Messzeitpunkte Zwischen allen kann man paarweise t-Tests berechnen Empirische Methoden Jetzt & Gleich Primer α-Fehler Kumulierung Bonferroni- und Dunn-Šidák Korrektur Kennwerte 1-Stichproben t-Test 2-Stichproben t-Test (abhängig) 2-Stichproben t-Test (unabhängig) Die Bonferroni-Korrektur nimmt an, dass bei k Tests das α-Niveau um 1/k verringert werden muss, um die erhöhte Irrtumswahrscheinlichkeit auszugleichen Die Dunn-Šidak Korrektur berechnet das neue α-Niveau über die komplementäre Wahrscheinlichkeit, dass bei k Stichproben nur α·k signifikant werden. Die Bonferroni Korrektur ist marginal(st) konservativer. neu k neu 1 (1 ) 1 k