Dr. Henning Brand Diplom-Psychologe Mk 1.2 Universität zu Köln SS 06 Meine Anforderungen: Regelmässige Teilnahme (max. zwei Fehltermine) Credit Points: 2 = Regelmässige Teilnahme und aktive Mitarbeit, inklusive der kleinen Übungsaufgaben 3 = wie 2 plus Klausur 4 = wie 3 plus eine schriftliche Ausarbeitung über eine im Seminar behandelte Originalarbeit Seminarmaterialien unter: www.henningbrand.de/uni/seminar.html e-mail: [email protected] Sprechzeiten: Donnerstag 12.00 nach Vereinbarung Was bisher geschah: Bei ethnologischen Studien in Riesenland und Zwergenland haben wir festgestellt, daß sich die Bewohner der beiden Länder durch ihre Körpergröße unterscheiden. Die beste Angabe zur Körpergröße einer Nation ist der Mittelwert M. Wir erhalten die mittlere Körpergrösse, indem wir die Summe ∑ der Einzelwerte xi bilden und durch die Anzahl N der Einzelwerte dividieren: ∑ xi M= N “Körpergröße” ist eine Variable. Das heißt: sie ändert ihre Werte. Es gibt verschiedene Ausprägungen der Variablen “Körpergröße”. Der Mittelwert M ist der Wert, den eine Variable am wahrscheinlichsten annimmt. Wir können uns diesen Wert als “Schwerpunkt” oder “Gravitationszentrum” vorstellen. Der Mittelwert ist das Gleichbleibende an einer Variablen. Es reicht nicht aus, nur den Mittelwert einer Variablen zu kennen. Denn wir müssen auch wissen, wie stark sie sich verändert (variiert). Das Mass dafür heißt Varianz. Berechnung der Varianz: a) Bestimme die Abweichung jedes Einzelwertes xi vom Mittelwert M. b) Es gilt immer: ∑ (M - xi) = 0 V M M = Mittelwert / „Wasserstand“ V = Varianz / „Seegang“ Lösung des Problems: c) Quadriere die Abweichungen (M - xi)! d) Die Varianz s2 ist dann: s2 = ∑ (M - xi)2 N e) Die Standardabweichung s ist die Wurzel aus der Varianz. Frage: Warum? Wieso wird nicht statt dessen mit dem Betrag der Abweichung gerechnet? Antwort: Pythagoras x2 M - x2 M -x M √( 2 ) -x 2 M ( )2 + M - x1 x1 Dividieren wir vor dem Wurzelziehen durch N, so entspricht √(M-x)2+(M-x2)2 der Standardabweichung s. Messen in der Statistik => Skalierung einer Variablen Nominalskalierung Kategoriale Daten / qualitative Unterschiede z.B.Männer/Frauen Es gibt keine Abstände zwischen Kategorien, Unterschiede sind nicht interpretierbar im Sinne von „mehr“ oder „weniger“ Ordinalskalierung Ordinale Daten / quantitative Unterschiede z.B. Schulnoten. Es gibt Abstände zwischen Kategorien, Unterschiede sind interpretierbar, im Sinne von „mehr“ oder „weniger“, die Abstände sind nicht gleich. Intervallskalierung metrische Daten, quantitative Unterschiede z.B. Testleistung in einem Konzentrationstest, Unterschiede interpretierbar, Abstände sind gleich, denn: 4 Fehler sind doppelt soviel wie 2 Fehler Statistik („Bestandsaufnahme“) Zusammenhänge beschreiben Unterschiede erklären „Es gibt einen Zusammenhang zwischen Verhaltensauffälligkeiten bei Kindern und dem Erziehungsstil der Eltern“ „Kinder, die mit Erziehungsstil X erzogen werden, zeigen mehr Verhaltensauffälligkeiten als Kinder, die mit Erziehungsstil Y erzogen werden.“ VA (X) > VA (Y) ⇒ Eine Aussage über Zusammenhänge ist immer beschreibend. ⇒ Ziel der Wissenschaft: Erklärung Auch Unterschiede lassen sich beschreiben - wir verstehen unter VA (X) > VA (Y) jedoch mehr : Der Erziehungsstil erklärt die Verhaltensauffälligkeiten Wann kann ich sagen, dass der Erziehungsstil VA erklärt? Erklärung impliziert, Zusammenhänge zu vergleichen; um den Einfluss von Erziehungsstil auf Verhalten zu erklären, muss ich mindestens zwei Erziehungsstile miteinander vergleichen. Kausalität “For X to be a cause of Y, two conditions must hold: first, that X and Y both happen; and second, that Y would not have happened if X had been otherwise.” from David Deutsch: “The Fabric of Reality”, p. 274 Unterschiede X Y Xdiff non Y Zusammenhänge Bildzeitung: “Wissenschaftler zeigen: Kinderlose haben Erfolg im Beruf.” Die Grundannahme des Induktivismus Beobachtungen Vorhersage Verallgemeinerung „Theorie“ Hühner & andere Problem des Induktivismus Wissenschaftliches Problemlösen Problem Lösungsvorschlag / Theorie Kritik /experimentelles Testen Verwerfen falscher Theorien neues Problem Voraussetzung jeder Beobachtung: Ich habe schon eine Annahme / Frage / Theorie. Beobachtung ist nie „einfach so“ Rolle der statistischen Methoden Kritik / Testen von Annahmen: => Bestehen erwartete (Kausal-)zusammenhänge? => Bestehen erwartete Unterschiede? Die statistische Sprache kann sowohl Zusammenhänge als auch Unterschiede ausdrücken - kann sie auch erklären? Nein - wenn gilt VA (X) > VA (Y), dann ist die Erklärung dafür in inhaltlichen Merkmalen von X und Y zu suchen. Thema 1 : Beschreibung von Zusammenhängen In einer Schulklasse von 15 Kindern werden drei Grössen untersucht: a) Erziehungsstil der Eltern 0=liberal bis 10=autoritär b) Motorische Unruhe der Kinder 0=ruhig bis 10=unruhig c) Selbstvertrauen der Kinder 0=gering bis 10=sehr hoch Annahme: Es besteht ein Zusammenhang zwischen Autoritarismus (A) und Selbstvertrauen (S). Es wird vermutet, daß autoritärer Erziehungsstil mit geringem Selbstvertrauen der betroffenen Kinder einhergeht. Bei Autoritarismus (A) und Selbstvertrauen (S) handelt es sich um Variablen. Fragen bei einer Variablen: ⇒ Wie stark ändert sie sich? ⇒Was verändert sich nicht? ⇒ M - „Wie autoritär sind sie insgesamt?“ ⇒ V - „Wie stark schwanken die Einzelwerte?“ V M M = Mittelwert / „Wasserstand“ V = Varianz / „Seegang“ Grundidee der Korrelation X Y Wenn ein Zusammenhang der Schwankungen von X und Y besteht, dann muss sich die Variabilität ∑(Mx - xi)2 bzw. ∑(My - yi)2 ausdrücken lassen durch: ∑(Mx - xi)*(My - yi) Ist der Zusammenhang perfekt, dann gilt : ∑(Mx - xi)2 = ∑(My - yi)2 = ∑(Mx - xi)*(My - yi) so dass: r= ∑ (Mx - xi)*( My - yi) √ ∑(M - x )2 * ∑(M - y )2 x i y i =1 Wenn der Zusammenhang nicht perfekt ist, wird ∑(Mx - xi)*(My - yi) < √∑(Mx - xi)2 * ∑(My - yi)2 so dass r < 1 wird. Wenn die Wellen im Aquarium 2 genau entgegengesetzt ausschlagen, ist r = - 1 wird. ∑(Mx - xi) = ∑ (My - yi) so dass Vpn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Sum Mean Aut 7 2 1 3 9 4 0 3 3 6 8 1 9 2 2 60 4 M-x -3 2 3 1 -5 0 4 1 1 -2 -4 3 -5 2 2 0 (M-x)2 Selb 9 3 4 8 9 9 1 7 25 3 0 5 16 9 1 6 1 6 4 3 16 2 9 5 25 7 4 8 4 9 128 90 6 M-x (M-x)2 Mot 3 9 5 -2 4 0 -3 9 0 -1 1 0 3 9 8 1 1 1 -3 9 2 0 0 4 0 0 4 3 9 7 4 16 6 1 1 1 -1 1 5 -2 4 1 -3 9 1 0 82 45 3 M -x (M-x)2 -2 4 3 9 3 9 3 9 -5 25 2 4 1 1 -1 1 -1 1 -4 16 -3 9 2 4 -2 4 2 4 2 4 0 104 Berechnung der Covarianz Sum Aut 7 2 1 3 9 4 0 3 3 6 8 1 8 2 2 60 M-x -3 2 3 1 -5 0 4 1 1 -2 -4 3 -5 2 2 0 (M-x)2 9 4 9 1 25 0 16 1 1 4 16 9 25 4 4 128 Selb 3 8 9 7 3 5 9 6 6 3 2 5 7 8 9 90 M-y (M-x)(M-y) 3 -9 -2 -4 -3 -9 -1 -1 3 -15 1 0 -3 -12 0 0 0 0 3 -6 4 -16 1 3 -1 5 -2 -4 -3 -6 0 -74 Bivariate Korrelation Autoritarismus / Selbstvertrauen r= -74 √128*82 = -.72 Autoritarismus / Motorische Unruhe 95 r= = .82 √128*104 Selbstvertrauen / Motorische Unruhe r= -70 √82*104 = -.76 Daraus folgt: Der Korrelationskoeffizient r ist abhängig von den Parametern M (Mittelwert) und S2 (Varianz). Er heisst daher parametrischer Korrelationskoeffizient. Er kann Werte zwischen 1 und - 1 annehmen. Dieser Koeffizient wird auch Pearson-Korrelation genannt. Er setzt intervallskalierte Variablen voraus. Der Korrelationskoeffizient ist ein gängiges statistisches Mass, um Zusammenhänge zu beschreiben. Problem: ⇒ Ich habe in der Praxis oft kleine Gruppen. ⇒ Ich interessiere mich für Merkmale, die ich nur qualitativ messen kann. Aufgabe: Finden Sie eine Fragestellung aus Ihrem Studium, bei der Ihnen der Korrelationskoeffizient hilft und eine, bei der Sie einen Zusammenhang zwischen qualitativen Merkmalen untersuchen würden! Beispiele für Korrelationen in der Praxis: ⇒Testverfahren (basieren auf korrelativen Methoden) ⇒Diagnostik in der Schulpraxis ⇒Sonderpädagogische Forschung z. B. zur Studienund Arbeitsmotivation Beispiele für qualitative Variablen: ⇒ Geschlecht ⇒ Ausbildung der Eltern ⇒ Kategoriensysteme zur Verhaltensbeobachtung 24.11.05 - Themen des Tages Freiheitsgrade Quantitative vs. Qualitative Methoden Hypothesentest Erwartungswert Wahrscheinlichkeitsverteilungen … an einem schulpraktischen Beispiel Quantitative Variablen beschreiben, wieviel Einheiten einer Größe vorhanden sind. Qualitative Variablen beschreiben, wie etwas beschaffen ist. Beispiel 1: quantitativ Vpn 1 2 3 4 5 6 7 Sum Mean X 5 3 8 6 3 8 2 35 5 (M-x) 0 2 -3 -1 2 -3 3 0 Beispiel 2:qualitativ Männer Frauen Freischütz : “Sechse treffen, sieben äffen” Vpn 1 2 3 4 5 6 7 Sum Mean X 5 3 8 6 3 8 2 35 5 (M-x) 0 2 -3 -1 2 -3 3 0 Freiheitsgrade degrees of freedom df Würfel Würfel 1 Sum 2 1 1 2 1 2 3 1 3 4 1 4 5 1 5 6 1 6 7 2 1 3 2 2 4 2 3 5 2 4 6 2 5 7 2 6 8 3 1 4 3 2 5 3 3 6 3 4 7 3 5 8 3 6 9 4 1 5 4 2 6 4 3 7 4 4 8 4 5 9 4 6 10 5 1 6 5 2 7 5 3 8 5 4 9 5 5 10 5 6 11 6 1 7 6 2 8 6 3 9 6 4 10 6 5 11 6 6 12 A A A B B B A A B B B B A B B B B C B B B B C C B B B C C C B B C C C C Erwartungswert: 7 A (Sum = 1- 4): 6 B (Sum = 5- 8): 20 C (Sum = 9-12): 10 Die Standardnormalverteilung Eigenschaften 68% der Fälle innerhalb einer Standardabweichung von µ. 10% der Fälle sind mehr als 1.65 Standardabweichungen von µ entfernt. 5% > 1.96 Standardabweichungen von µ. Warum ist die Normalverteilung so wichtig? ⇒Größen (IQ, Körpergröße u.a.) können normalverteilt sein. ⇒Der Messfehler, den wir bei jeder Messung in Pädagogik / Psychologie machen ist ein Zufallsereignis und folgt der Normalverteilung ⇒Wenn wir von einer normalverteilten Größe Stichproben ziehen, sind Mittelwerte und Varianzen der Stichproben normalverteilt egal wie gross (oder klein) die Stichproben sind. ⇒Wenn, und nur wenn eine Population normalverteilt ist, sind bei unabhängigen Stichproben die Varianzen und Mittelwerte unabhängig voneinander. Der zentrale Grenzwertsatz Die Normalverteilung kann angewendet werden, auch wenn eine Variable in der Population nicht normalverteilt ist. Wenn eine Population eine endliche Varianz σ2 und einen endlichen Mittelwert µ hat, dann wird mit steigendem Stichprobenumfang N die Stichprobenverteilung des Mittelwerts und der Varianz annähernd normal. Erwartungswert der Stichprobenmittelwerte ist µ. Erwartungswert der Stichprobenvarianz ist σ2 /N. Bei N=30 ist diese Annäherung bereits sehr gut. Der zentrale Grenzwertsatz Die Untersuchung von Unterschieden: Gruppenvergleiche Frage 1: Wie können wir Unterschiede untersuchen? Grundüberlegung: Wahrscheinlichkeitsverteilungen Beispiel: IQ-Test Ein IQ-Test ist so normiert, dass der Mittelwert µ = 100 und die Standardabweichung σ = 10 ist. Das bedeutet: Die Population, auf die sich der Test bezieht, hat den Mittelwert µ = 100 und die Standardabweichung σ = 10. Sie haben in einer vierten Klasse einen Intelligenztest durchgeführt. Der Test ist so normiert, daß µ=100 und σ=10 ist. Sie haben zwei Schüler, Dieter und Thomas. Dieter hat einen Testwert von 120. Thomas hat einen Testwert von 80. Wie können wir solche Ergebnisse interpretieren? Grundannahme: Die Verteilung der Testwerte folgt einer Gesetzmäßigkeit, wonach Werte, die weit vom Mittelwert entfernt liegen, seltener (d.h. unwahrscheinlicher) sind, als solche, die nah am Mittelwert liegen. Grundmodell: Normalverteilung Thema 2 - Hypothesentest Ein Referendar glaubt, dass mathematische Begabung geschlechtsspezifisch und invariant sei. Er hält seine männlichen Schüler daher für grundsätzlich begabt und seine Schülerinnen für unbegabt. Als Fachleiterin beobachten Sie den Unterricht der Lehrkraft und beobachten, dass die Jungen in der Klasse anders behandelt werden als die Mädchen. Während der Lehrer die Jungen eher mit Lob aufbaut und ermutigt, scheint er die Mädchen eher zu tadeln und zu entmutigen. Um dem Problem auf den Grund zu gehen, bilden Sie Kategorien für lobendes und tadelndes Lehrerverhalten, filmen eine Unterrichtssequenz und lassen diese durch zwei unabhängige Beobachter be urteilen. Die Beobachter kommen zu folgendem Ergebnis: (N = 15 beobachtete Verhaltenseinheiten) Tadel Lob Jungen 1 8 Mädchen 4 2 Der Referendar behauptet, sein Unterricht sei fair, die Wahrscheinlichkeit für Lob und Tadel sei für Jungen und Mädchen gleich, und nur von der fachlichen Leistung abhängig. Wir erforschen hypothesengeleitet den Wahrheits gehalt dieser Aussage: Hypothesentestende Forschung H0 = Lob/Tadel sind unabhängig vom Geschlecht (Nullhypothese) H1 = Lob/Tadel sind abhängig vom Geschlecht (Alternativhypothese) Beachten Sie: ⇒ Die Forschungshypothese, die wir inhaltlich formulieren, ist die Alternativhypothese H1. ⇒Wir gehen also zunächst davon aus, dass die Nullhypothese H0 zutrifft. Wir testen konservativ. ⇒Die Forschungshypothese lässt sich als Zusammenhangshypothese formulieren: Es gibt einen Zusammenhang zwischen dem Geschlecht der Schüler und dem Lehrerverhalten. ⇒Die Forschungshypothese lässt sich als Unterschiedshypothese formulieren: Jungen werden gegenüber Mädchen bevorzugt Erster Schritt: Wir ermitteln die Erwartungswerte Tadel Lob Jungen 1 8 9 Mädchen 4 2 6 5 10 N = 15 Randsummen Tadel Lob Jungen 9*5 15 =3 9*10 15 =6 Mädchen 6*5 15 =2 6*10 15 =4 5 10 9 6 Erwartungswert : = Ausprägung einer Variablen, oder einer Kombination von Variablen, die wir erwarten zu beobachten, falls bestimmte Annahmen bezüglich dieser Variablen zutreffen. Hier: Häufigkeiten von Lob / Tadel bei Jungen und Mädchen, die wir erwarten, falls „Lehrerverhalten“und „Geschlecht der Schüler“ unabhängige Ereignisse sind. Tadel Jungen Mädchen Lob beobachtet: 1 erwartet: (3) 1-3=-2 beobachtet: 8 erwartet: (6) 8-6=2 9 beobachtet: 4 erwartet: (2) 4-2=2 beobachtet: 2 erwartet: (4) 2-4=-2 6 5 10 N = 15 χ2 = = (1-3)2 (8-6)2 (4-2)2 (2-4)2 + + 4 + 6 3 2 1,3 + 0,7 + 2 + 1 =5 ν = 1 Freiheitsgrade / df (degrees of freedom) χ2 p < .05 0 3.84 ∞ Die Chi-Quadrat Funktion in Abhängigkeit von ihren Freiheitsgraden (df) Chi-Quadrat Anpassungstest Prüfgröße: χ2 =5 χ2 = 5 > χ2krit = 3.84 Der Test ist signifikant. Die Nullhypothese Ho wird verworfen. Es besteht ein signifikanter Zusammenhang zwischen dem Lehrerverhalten (Lob/Tadel) und dem Geschlecht der Schüler. Jungen werden gegenüber Mädchen bevorzugt. Die Wahrscheinlichkeit, dass dieses Ergebnis zufällig beobachtet wurde (Irrtumswahrscheinlichkeit) ist p<.05. Sie können die Zahlen aus diesem Beispiel auch erhalten, wenn sie auf unsere erste Studie zurückgreifen: ja Autoritär nein ja 1 8 nein 4 2 Selbstvertrauen Wir haben eine Menge getan: ⇒Gezeigt, dass sich Zusammenhänge ganz einfach messen lassen (kategoriale, dichotome Variablen) ⇒Wir haben eine Wahrscheinlichkeitsverteilung eingesetzt, um zu entscheiden, ob ein Zusammenhang „überzufällig“ ist, oder nicht. ⇒Wir haben die Hypothesen getestet. ⇒Wir haben die wichtigste Wahrscheinlichkeitsverteilung kennengelernt. ⇒Wir haben den Unterschied von Deskriptiv- und Inferenzstatistik erarbeitet. Statistische Grundbegriffe, die wir kennengelernt haben !Klausurtraining! ⇒bivariate Korrelation (Pearson-Korrelation) ⇒Variable ⇒arithmetisches Mittel ⇒Varianz / Standardabweichung ⇒Nominalskala/kategoriale Daten/dichotome Variable ⇒Ordinalskala ⇒Intervallskala (metrische Skala) ⇒Hypothese (Nullhypothese H0, Alternativhypothese H1) ⇒Hypothesentest ⇒Prüfgrösse ⇒Zusammenhangshypothese ⇒Unterschiedshypothese ⇒Veränderungshypothese (wichtig für Evaluation) ⇒gerichtete / ungerichtete Hypothese ⇒Erwartungswert ⇒Wahrscheinlichkeitsverteilung ⇒Freiheitsgrade ⇒Chi-Quadrat Test ⇒Deskriptivstatistik ⇒Inferenzstatistik Lesen Sie für die nächste Sitzung: Borchert, J., & Runow, V. (2003). Effektive Intervention im sonderpädagogischen Arbeitsfeld- ein Vergleich zwischen Forschungsergebnissen und Lehrereinschätzungen. Zeitschrift für Heilpädagogische Forschung,4, 189-203. (Bibliothek und Raum 329 bei Frau Murawski) 1.) Inwiefern sind die Lehrkräfte über den aktuellen Forschungsstand bezüglich effektiver Intervention informiert? 2.) Welche Interventionen halten Lehrkräfte für sehr effektiv? 3.) Welche Interventionen erweisen sich in der pädagogischen Forschung als sehr effektiv? Welche als wenig effektiv? 4.) Wie erklären Sie sich die Ergebnisse dieser Untersuchung? 5.) Überlegen Sie sich Beispiele für den Unterrichtseinsatz von Interventionen mit sehr hoher Effektivität! Die Vier - Punkte Aufgabe Abgabe: Klausurtermin am 02.02.05 Ritalin statt Peer-Tutoring und Training sozialer Kompetenzen? a) Nach Borchert und Runow ist Ritalin wirksamer als o.g. Interventionsmethoden. Welche Methodischen Probleme könnten für die unterschiedliche Wirksam keit der Interventionsmethoden verantwortlich sein, die in dem Artikel besprochen werden? b) Informieren Sie sich über Training sozialer Kompetenzen. Welche Methoden und Möglichkeiten gibt es? Wie wirksam sind diese Methoden? c) Vergleichen Sie das Training sozialer Kompetenzen mit den hoch wirksamen Interventionsmethoden. Diskutieren Sie dabei die praktischen Einsatzmöglichkeiten der verschiedenen Interventionsmethoden im Unterricht. d) Sind die Ergebnisse von Borchert und Runow wirklich so “katastrophal” für SonderschullehrerInnen? Begründen Sie Ihre Position! Der Solomon - Vier-Gruppenplan Gruppe 1: O - T - O Gruppe 2: O Gruppe 3: Gruppe 4: O T-O O Gruppe 1 Gruppe 3 Gruppe 2 Gruppe 4 Messung 1 Messung 2 Merkmale des Experiments ⇒Kontrolle von Störfaktoren ⇒Wiederholbarkeit ⇒Reproduzierbarkeit ⇒kontrollierte Manipulation der unabhängigen Variablen ⇒Zufallsaufteilung der Teilnehmer auf die Versuchsbedingungen (Randomisierung) Multiplikation soll im Mathematikunterricht nach zwei verschiedenen Methoden unterrichtet werden: a) In Addition umwandeln (z.B. 3*3 = 3+3+3) b) Geometrisch (3*3 ist Fläche mit neun Kästchen) Je drei Klassen werden nach einer der beiden Methoden unterrichtet. Nach einiger Zeit wird als Erfolgskontrolle ein Test geschrieben, der zehn Aufgaben hat. Wir betrachten im folgenden, wie sich die Ergebnisse auswerten lassen. Methode: Addition Methode: Graphisch Klasse 1 Klasse 2 Klasse 3 2 3 1 6 7 5 Mean Sum of Squares (SS) 2 2 6 2 Overall Mean Overall SS 4 28 Methode 1: t-Test für unabhängige Stichproben H0: µ1 = µ2 H1: µ1 ≠ µ2 Problem: Die Standardabweichung der Population ist unbekannt. Wir können nicht die Normalverteilung zum testen nehmen, da wir z nicht bestimmen können. Wir schätzen daher σ und benutzen die t-Verteilung. 4*0.67 * 6 estσ = 4 9 4 t= = 8,51 0,47 = 0,47 Die Freiheitsgrade für den t-Test für Differenzen sind N1 + N2 - 2 = 4 in diesem Beispiel. Der kritische t - Wert in unserem Beispiel ist t = 2.78 für perror < .05 Die Prüfgrösse t = 8,51 ist grösser als tkrit = 2.78 ⇒Die Nullhypothese wird verworfen. ⇒Es besteht ein signifikanter Unterschied zwischen den Gruppen. Zusammenfassung: Der t-Test vergleicht Unterschiede zwischen zwei Gruppen. Dabei wird die Populationsvarianz aus der Stichprobenvarianz geschätzt. Dies ist besonders bei kleinen Stichproben erforderlich. Methode 2 : Die Varianzanalyse (ANOVA) Methode: Addition Methode: Graphisch Klasse 1 Klasse 2 Klasse 3 2 3 1 6 7 5 Mean Sum of Squares (SS) 2 2 6 2 Overall Mean Overall SS 4 28 Grundidee 1: Es gibt Unterschiede innerhalb der Gruppen. Grundidee 2: Es gibt Unterschiede zwischen den Gruppen. Die Quadratsummen (SS) innerhalb der Gruppen sind Fehlerterme. Sie geben die zufällige Abweichung der einzelnen Klassen im Test wieder. Die Quadratsummen zwischen den Gruppen sind die interessanten: Sie geben an, wie stark der Unterschied ist, der auf die Unterrichtsmethode zurückzuführen ist. Varianzanalyse Haupteffekt SS Effect 24,0 Error 4,0 df 1 4 MS F 24,0 24,0 1,0 p .008 Die Varianzanalyse kann alles, was der t-Test leistet. Sie kann aber noch mehr als der t-Test, und ist deshalb als Methode zu bevorzugen. ⇒Sie zeigt die verschiedenen Varianzquellen auf. ⇒Sie ist geeignet, mehr als zwei Gruppen miteinander zu vergleichen. Beispiel: In unserem Beispiel haben wir gemischte Klassen. Dabei werden Kinder mit Lernstörungen zusammen mit Kindern unterrichtet, die keine Schwierigkeiten, speziell nicht im Mathematikunterricht haben. Ein mögliches Ergebnis der Studie: Methode: Addition Methode: Graphisch Lernstörung 2 3 1 6 7 5 M 2 6 keine Lernstörung 5 6 4 6 7 5 M 5 6 Interpretation: Die Wirkung der Unterrichtsmethode ist abhängig von der Schülergruppe (LB + / LB -). Die Schüler mit Lernstörungen profitieren stärker von der graphischen Methode. M 6 2 Addition Graphisch Definition: Interaktion in der Varianzanalyse Die Wirksamkeit der Unterrichtsmethode ist abhängig von der Schülergruppe, die unterrichtet wird. Die Schüler mit Lernstörung profitieren stärker. Die Auswirkung der Variablen „Unterrichtsmethode“ ist abhängig von der Ausprägung der Variablen „Lernstörung“ Allgemein: Die Auswirkung einer unabhängigen Variablen ist abhängig von der Ausprägung einer anderen unabhängigen Variablen. Unabhängige Variable: Wird in einer Untersuchung kontrolliert verändert. Frage ist diese Schulstudie ein Experiment? Merkmale des Experiments: Das Experiment ermöglicht das Testen von kausalen Hypothesen durch: ⇒kontrollierte Veränderung der unabhängigen Variablen ⇒zufällige Verteilung der Versuchsteilnehmer auf die Bedingungen (Randomisierung) ⇒Kontrolle von Störvariablen In der Schulstudie werden die Schüler nicht zufällig auf die Unterrichtsmethoden „Addition“/„Graphisch“ verteilt. Es handelt sich daher um eine quasiexperimentelle Studie. Unterschied zwischen Experiment und QuasiExperiment: Fehlende Randomisierung Fehlende Parallelisierung Schüler/-in Testwert vorher Testwert nachher 01.) Horst- Kevin 12 20 02.) Dennis 15 19 03.) Yvonne 10 13 04.) Hulk 1 10 05.) Henk 7 1 06.) Karl 12 18 07.) Peter 10 12 08.) Bart 4 6 09.) Livia 19 19 10.) Nicole 17 18 11.) Hoss 3 4 12.) Tara 10 4 Karl Josef Klauer (2002): Wie viele haben denn nun wirklich vom Training profitiert? Eine noch nicht eindeutig zu beantwortende Frage. 1.) Was ist die Fragestellung des Textes? 2.) Welche Methoden stehen zur Verfügung, um die Wirksamkeit eines Trainings auf Einzelfallebene zu prüfen? 3.) Welchen Versuchsplan benötigt man, um die Wirksamkeit eines Trainings zu testen, und warum? 4.) Welche Vorteile hat es, mehrere abhängige Variablen zu untersuchen? 5.) Welche Fehlerquellen sind zu bedenken? Ein Überblick über die Wahrscheinlichkeitsverteilungen: Normalverteilung nähert sich bei df=50 an χ2 Zufallsvariable Quadratsummen Abweichungen von Mittelwerten / Erwartungswerten nähert sich bei df=50 an F Quotient aus 2 χ2 - Verteilungen, jeweils dividiert durch ihre df. Einsatz: Mittelwertvergleiche ANOVA u.a. t-Verteilung Zufallsvariable wird eingesetzt für Gruppenvergleiche wenn Populationsvarianz unbekannt