Dr. Henning Brand Diplom-Psychologe Mk 1.2 Universität zu Köln WS 08 / 09 Meine Anforderungen: Credit Points: 2 = aktive Mitarbeit, inklusive der kleinen Übungsaufgaben 3 = wie 2 plus Test 4 = wie 3 plus Abschlußdiskussion Seminarmaterialien unter: www.henningbrand.de/uni/seminar.html e-mail: [email protected] Grundlagen 1: Variablen und wie wir sie beschreiben: Parameter Was bisher geschah: Bei ethnologischen Studien in Riesenland und Zwergenland haben wir festgestellt, daß sich die Bewohner der beiden Länder durch ihre Körpergröße unterscheiden. Die beste Angabe zur Körpergröße einer Nation ist der Mittelwert M. Wir erhalten die mittlere Körpergrösse, indem wir die Summe ∑ der Einzelwerte xi bilden und durch die Anzahl N der Einzelwerte dividieren: ∑ xi M= N “Körpergröße” ist eine Variable. Das heißt: sie ändert ihre Werte. Es gibt verschiedene Ausprägungen der Variablen “Körpergröße”. Der Mittelwert M ist der Wert, den eine Variable am wahrscheinlichsten annimmt. Wir können uns diesen Wert als “Schwerpunkt” oder “Gravitationszentrum” vorstellen. Der Mittelwert ist das Gleichbleibende an einer Variablen. Es reicht nicht aus, nur den Mittelwert einer Variablen zu kennen. Denn wir müssen auch wissen, wie stark sie sich verändert (variiert). Das Mass dafür heißt Varianz. Berechnung der Varianz: a) Bestimme die Abweichung jedes Einzelwertes xi vom Mittelwert M. b) Es gilt immer: ∑ (M - xi) = 0 V M M = Mittelwert / V = Varianz / „Wasserstand “ „Seegang “ Lösung des Problems: c) Quadriere die Abweichungen (M - xi)! d) Die Varianz s2 ist dann: s2 = ∑ (M - xi)2 N e) Die Standardabweichung s ist die Wurzel aus der Varianz. Frage: Warum? Wieso wird nicht statt dessen mit dem Betrag der Abweichung gerechnet? Antwort: Pythagoras x2 M - x2 M M - x1 x1 Dividieren wir vor dem Wurzelziehen durch N, so entspricht √(M-x)2+(M-x2)2 der Standardabweichung s. Grundlagen 2: Zufall, Wahrscheinlichkeit, Wahrscheinlichkeitsverteilungen Definition von Zufall: Zufällig ist ein Ereignis, wenn es durch keine bekannte Gesetzmäßigkeit vorhersagbar ist Die Standardnormalverteilung QuickTime™ and a GIF decompressor are needed to see this picture. Eigenschaften 68% der Fälle innerhalb einer Standardabweichung von . 10% der Fälle sind mehr als 1.65 Standardabweichungen von entfernt. 5% > 1.96 Standardabweichungen von . Der zentrale Grenzwertsatz Die Normalverteilung kann angewendet werden, auch wenn eine Variable in der Population nicht normalverteilt ist: Die Summenwerte von unabhängigen Zufallsprozessen nähern sich mit steigender Anzahl von Beobachtungen der Normalverteilung an. Der zentrale Grenzwertsatz QuickTime™ and a GIF decompressor are needed to see this picture. Freischütz : “Sechse treffen, sieben äffen” Vpn 1 2 3 4 5 6 7 Sum Mea n X 5 3 8 6 3 8 2 35 5 (M-x) 0 2 -3 -1 2 -3 3 0 Freiheitsgrade degrees of freedom df THEMEN 1. Hypothesen testen 2. Unterschiede 3. Experiment und Quasiexperiment 4. Zusammenhänge 5. Messen 6. Messen und Rechnen unter Extrembedingungen: Nonparametrische Statistik 1. Hypothesentesten Hypothesentest: Prüfgröße = die beobachtete Abweichung kritischer Wert = die theoretische Grenze, (z.B. 5%) des Zufallsbereichs gerichtete Hypothese: sagt vorher, in welcher Richtung ein Unterschied oder Zusammenhang liegt. ungerichtete Hypothese: sagt, daß überhaupt ein Unterschied/Zusammenhang besteht Das beeinflußt, wo der kritische Wert liegt: einseitiges vs. zweiseitiges Testen Statistik („Bestandsaufnahme“) Zusammenhänge beschreiben Unterschiede erklären 2. Unterschiede Kausalität “For X to be a cause of Y, two conditions must hold: first, that X and Y both happen; and second, that Y would not have happened if X had been otherwise.” from David Deutsch: “The Fabric of Reality”, p. 274 X Y Xdiff non Y Unterschiede Zusammenhänge Multiplikation soll im Mathematikunterricht nach zwei verschiedenen Methoden unterrichtet werden: a) In Addition umwandeln (z.B. 3*3 = 3+3+3) b) Geometrisch (3*3 ist Fläche mit neun Kästchen) Je drei Klassen werden nach einer der beiden Methoden unterrichtet. Nach einiger Zeit wird als Erfolgskontrolle ein Test geschrieben, der zehn Aufgaben hat. Wir betrachten im folgenden, wie sich die Ergebnisse auswerten lassen. Methode: Methode: Addition Graphisch Klasse 1 Klasse 2 Klasse 3 2 3 1 6 7 5 Mean Sum of Squares (SS) 2 2 6 2 Overall Mean Overall SS 4 28 Die Varianzanalyse (ANOVA) Methode: Methode: Addition Graphisch Klasse 1 Klasse 2 Klasse 3 2 3 1 6 7 5 Mean Sum of Squares (SS) 2 2 6 2 Overall Mean Overall SS 4 28 Grundidee 1: Es gibt Unterschiede innerhalb der Gruppen. Grundidee 2: Es gibt Unterschiede zwischen den Gruppen. Die Quadratsummen (SS) innerhalb der Gruppen sind Fehlerterme. Sie geben die zufällige Abweichung der einzelnen Klassen im Test wieder. Die Quadratsummen zwischen den Gruppen sind die interessanten: Sie geben an, wie stark der Unterschied ist, der auf die Unterrichtsmethode zurückzuführen ist. Varianzanalyse Haupteffekt SS Effect 24,0 Error 4,0 df 1 4 MS F 24,0 24,0 1,0 p .008 Die Varianzanalyse ist die Methode der Wahl zur Analyse von Gruppenunterschieden. Sie zeigt die verschiedenen Varianzquellen auf. Sie ist geeignet, mehr als zwei Gruppen miteinander zu vergleichen. Beispiel: In unserem Beispiel haben wir gemischte Klassen. Dabei werden Kinder mit Lernstörungen zusammen mit Kindern unterrichtet, die keine Schwierigkeiten, speziell nicht im Mathematikunterricht haben. Ein mögliches Ergebnis der Studie: Methode: Addition Methode: Graphisch Lernstörung 2 3 1 6 7 5 M 2 6 keine Lernstörung 5 6 4 6 7 5 M 5 6 Interpretation: Die Wirkung der Unterrichtsmethode ist abhängig von der Schülergruppe (LB + / LB -). Die Schüler mit Lernstörungen profitieren stärker von der graphischen Methode. M 6 2 Addition Graphisch Definition: Interaktion in der Varianzanalyse Die Wirksamkeit der Unterrichtsmethode ist abhängig von der Schülergruppe, die unterrichtet wird. Die Schüler mit Lernstörung profitieren stärker. Die Auswirkung der Variablen „Unterrichtsmethode“ ist abhängig von der Ausprägung der Variablen „Lernstörung“ Allgemein: Die Auswirkung einer unabhängigen Variablen ist abhängig von der Ausprägung einer anderen unabhängigen Variablen. 3. Was ist ein Experiment? Unabhängige Variable: Wird in einer Untersuchung kontrolliert verändert. Frage ist diese Schulstudie ein Experiment? Merkmale des Experiments: Das Experiment ermöglicht das Testen von kausalen Hypothesen durch: kontrollierte Veränderung der unabhängigen Variablen zufällige Verteilung der Versuchsteilnehmer auf die Bedingungen (Randomisierung) Kontrolle von Störvariablen Unterschied zwischen Experiment und QuasiExperiment: Fehlende Randomisierung Fehlende Parallelisierung In der Schulstudie werden die Schüler nicht zufällig auf die Unterrichtsmethoden „Addition“/„Graphisch“ verteilt. Es handelt sich daher um eine quasiexperimentelle Studie. Der Solomon - Vier-Gruppenplan Gruppe 1: O - T - O Gruppe 2: O Gruppe 3: Gruppe 4: O T-O O Gruppe 1 Gruppe 3 Gruppe 2 Gruppe 4 Messung 1 Messung 2 4. Zusammenhänge In einer Schulklasse von 15 Kindern werden drei Grössen untersucht: a) Erziehungsstil der Eltern 0=liberal bis 10=autoritär b) Motorische Unruhe der Kinder 0=ruhig bis 10=unruhig c) Selbstvertrauen der Kinder 0=gering bis 10=sehr hoch Annahme: Es besteht ein Zusammenhang zwischen Autoritarismus (A) und Selbstvertrauen (S). Es wird vermutet, daß autoritärer Erziehungsstil mit geringem Selbstvertrauen der betroffenen Kinder einhergeht. Bei Autoritarismus (A) und Selbstvertrauen (S) handelt es sich um Variablen. Fragen bei einer Variablen: Wie stark ändert sie sich? Was verändert sich nicht? M - „Wie autoritär sind sie insgesamt?“ V - „Wie stark schwanken die Einzelwerte?“ V M M = Mittelwert / „Wasserstand“ V = Varianz / „Seegang“ Grundidee der Korrelation X Y Wenn ein Zusammenhang der Schwankungen von X und Y besteht, dann muss sich die Variabilität ∑(Mx - xi)2 bzw. ∑(My - yi)2 ausdrücken lassen durch: ∑(Mx - xi)*(My - yi) Ist der Zusammenhang perfekt, dann gilt : ∑(Mx - xi)2 = ∑(My - yi)2 = ∑(Mx - xi)*(My - yi) so dass: r= ∑ (Mx - xi)*( My - yi) √ ∑(M - x )2 * ∑(M - y )2 x i y i =1 Wenn der Zusammenhang nicht perfekt ist, wird ∑(Mx - xi)*(My - yi) < √∑(Mx - xi)2 * ∑(My - yi)2 so dass r < 1 wird. Wenn die Wellen im Aquarium 2 genau entgegengesetzt ausschlagen, ist - ∑(Mx r = - 1 wird. - xi) = ∑ (My - yi) so dass Vpn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Sum Mean Aut 7 2 1 3 9 4 0 3 3 6 8 1 9 2 2 60 4 M-x -3 2 3 1 -5 0 4 1 1 -2 -4 3 -5 2 2 0 (M-x)2 Selb 9 3 4 8 9 9 1 7 25 3 0 5 16 9 1 6 1 6 4 3 16 2 9 5 25 7 4 8 4 9 128 90 6 M-x (M-x)2 Mot 3 9 5 -2 4 0 -3 9 0 -1 1 0 3 9 8 1 1 1 -3 9 2 0 0 4 0 0 4 3 9 7 4 16 6 1 1 1 -1 1 5 -2 4 1 -3 9 1 0 82 45 3 M -x (M-x)2 -2 4 3 9 3 9 3 9 -5 25 2 4 1 1 -1 1 -1 1 -4 16 -3 9 2 4 -2 4 2 4 2 4 0 104 Berechnung der Covarianz Sum Aut 7 2 1 3 9 4 0 3 3 6 8 1 8 2 2 60 M-x -3 2 3 1 -5 0 4 1 1 -2 -4 3 -5 2 2 0 (M-x)2 9 4 9 1 25 0 16 1 1 4 16 9 25 4 4 128 Selb 3 8 9 7 3 5 9 6 6 3 2 5 7 8 9 90 M-y (M-x)(M-y) 3 -9 -2 -4 -3 -9 -1 -1 3 -15 1 0 -3 -12 0 0 0 0 3 -6 4 -16 1 3 -1 5 -2 -4 -3 -6 0 -74 Bivariate Korrelation Autoritarismus / Selbstvertrauen -74 r= √128*82 = -.72 Autoritarismus / Motorische Unruhe r= 95 = .82 √128*104 Selbstvertrauen / Motorische Unruhe r= -70 √82*104 = -.76 Daraus folgt: Der Korrelationskoeffizient r ist abhängig von den Parametern M (Mittelwert) und S2 (Varianz). Er heisst daher parametrischer Korrelationskoeffizient. Er kann Werte zwischen 1 und - 1 annehmen. Dieser Koeffizient wird auch Pearson-Korrelation genannt. Er setzt intervallskalierte Variablen voraus. 5. Messen Messen in der Statistik => Skalierung einer Variablen Nominalskalierung Kategoriale Daten / qualitative Unterschiede z.B.Männer/Frauen Es gibt keine Abstände zwischen Kategorien, Unterschiede sind nicht interpretierbar im Sinne von „mehr“ oder „weniger“ Ordinalskalierung Ordinale Daten / quantitative Unterschiede z.B. Schulnoten. Es gibt Abstände zwischen Kategorien, Unterschiede sind interpretierbar, im Sinne von „mehr“ oder „weniger“, die Abstände sind nicht gleich. Intervallskalierung metrische Daten, quantitative Unterschiede z.B. Testleistung in einem Konzentrationstest, Unterschiede interpretierbar, Abstände sind gleich, denn: 4 Fehler sind doppelt soviel wie 2 Fehler Quantitative Variablen beschreiben, wieviel Einheiten einer Größe vorhanden sind. Qualitative Variablen beschreiben, wie etwas beschaffen ist. Beispiel 1: quantitativ Vpn 1 2 3 4 5 6 7 Sum Mea n X 5 3 8 6 3 8 2 35 5 (M-x) 0 2 -3 -1 2 -3 3 0 Beispiel 2:qualitativ Männer Frauen 6. Parameterfreie Statistik Thema 2 - Hypothesentest Ein Referendar glaubt, dass mathematische Begabung geschlechtsspezifisch und invariant sei. Er hält seine männlichen Schüler daher für grundsätzlich begabt und seine Schülerinnen für unbegabt. Als Fachleiterin beobachten Sie den Unterricht der Lehrkraft und beobachten, dass die Jungen in der Klasse anders behandelt werden als die Mädchen. Während der Lehrer die Jungen eher mit Lob aufbaut und ermutigt, scheint er die Mädchen eher zu tadeln und zu entmutigen. Um dem Problem auf den Grund zu gehen, bilden Sie Kategorien für lobendes und tadelndes Lehrerverhalten, filmen eine Unterrichtssequenz und lassen diese durch zwei unabhängige Beobachter be urteilen. Die Beobachter kommen zu folgendem Ergebnis: (N = 15 beobachtete Verhaltenseinheiten) Tadel Lob Jungen 1 8 Mädchen 4 2 Der Referendar behauptet, sein Unterricht sei fair, die Wahrscheinlichkeit für Lob und Tadel sei für Jungen und Mädchen gleich, und nur von der fachlichen Leistung abhängig. Wir erforschen hypothesengeleitet den Wahrheits gehalt dieser Aussage: Hypothesentestende Forschung H0 = Lob/Tadel sind unabhängig vom Geschlecht (Nullhypothese) H1 = Lob/Tadel sind abhängig vom Geschlecht (Alternativhypothese) Beachten Sie: Die Forschungshypothese, die wir inhaltlich formulieren, ist die Alternativhypothese H1. Wir gehen also zunächst davon aus, dass die Nullhypothese H0 zutrifft. Wir testen konservativ. Die Forschungshypothese lässt sich als Zusammenhangshypothese formulieren: Es gibt einen Zusammenhang zwischen dem Geschlecht der Schüler und dem Lehrerverhalten. Die Forschungshypothese lässt sich als Unterschiedshypothese formulieren: Jungen werden gegenüber Mädchen bevorzugt Erster Schritt: Wir ermitteln die Erwartungswerte Tadel Lob Jungen 1 8 9 Mädchen 4 2 6 5 10 N = 15 Randsummen Tadel Lob Jungen 9*5 15 =3 9*10 15 =6 9 Mädchen 6*5 15 =2 6*10 15 =4 6 5 10 Erwartungswert : = Ausprägung einer Variablen, oder einer Kombination von Variablen, die wir erwarten zu beobachten, falls bestimmte Annahmen bezüglich dieser Variablen zutreffen. Hier: Häufigkeiten von Lob / Tadel bei Jungen und Mädchen, die wir erwarten, falls „Lehrerverhalten“und „Geschlecht der Schüler“ unabhängige Ereignisse sind. Tadel Lob Jungen beobachtet: 1 erwartet: (3) 1-3=-2 beobachtet: 8 erwartet: (6) 8-6=2 9 Mädchen beobachtet: 4 erwartet: (2) 4-2=2 beobachtet: 2 erwartet: (4) 2-4=-2 6 5 10 N = 15 c2 = = n=1 (1-3)2 (8-6)2 (4-2)2 (2-4)2 + + 4 + 6 3 2 1,3 + 0,7 + 2 + 1 =5 Freiheitsgrade / df (degrees of freedom) c2 p < .05 0 3.84 Die Chi-Quadrat Funktion in Abhängigkeit von ihren Freiheitsgraden (df) QuickTime™ and a GIF decompressor are needed to see this picture. Chi-Quadrat Anpassungstest Prüfgröße: c2 =5 c2 = 5 > c2krit = 3.84 Der Test ist signifikant. Die Nullhypothese Ho wird verworfen. Es besteht ein signifikanter Zusammenhang zwischen dem Lehrerverhalten (Lob/Tadel) und dem Geschlecht der Schüler. Jungen werden gegenüber Mädchen bevorzugt. Die Wahrscheinlichkeit, dass dieses Ergebnis zufällig beobachtet wurde (Irrtumswahrscheinlichkeit) ist p<.05. Borchert, J., & Runow, V. (2003). Effektive Intervention im sonderpädagogischen Arbeitsfeld- ein Vergleich zwischen Forschungsergebnissen und Lehrereinschätzungen. Zeitschrift für Heilpädagogische Forschung,4, 189-203.