Die Arbeit ist in einen theoretischen und einen empirischen Teil

Werbung
Inhaltsverzeichnis
i
Inhaltsverzeichnis
Vorwort und Anmerkungen
1
Einleitung ....................................................................................................................... 4
2
Stand der Forschung ...................................................................................................... 6
2.1
Multiple Determinanten des Schulerfolgs .............................................................. 6
2.1.1
Aggregation der Determinanten...................................................................... 6
2.1.2
Das Problem inhaltlicher Überlappung der Determinanten ......................... 10
2.2
Kognitive Determinanten des Schulerfolgs ........................................................... 11
2.2.1
Die Allgemeine Intelligenz als bester Prädiktor ............................................. 11
2.2.2
Lernen und Vorwissen ................................................................................... 12
2.2.3
Generalfaktor und Kristalline Intelligenz ....................................................... 13
2.2.4
Schulleistung als Kriterium und Kontributor ................................................. 14
2.3
Affektive und Motivationale Determinanten des Schulerfolgs ............................ 15
2.3.1
Einleitender Überblick ................................................................................... 15
2.3.2
Selbstkonzept ................................................................................................. 17
2.3.3
Interesse ........................................................................................................ 20
2.3.4
Leistungsmotivation und der Zusammenhang mit Hoffnung auf Erfolg und
Furcht vor Misserfolg ................................................................................................... 22
2.3.5
2.4
3
Anstrengungsvermeidung.............................................................................. 26
Vorausgehende vergleichbare Studien ................................................................. 27
2.4.1
Sauer und Gattringer (1986) .......................................................................... 28
2.4.2
Helmke (1992)................................................................................................ 29
2.4.3
Gagné und St Père (2001) .............................................................................. 30
2.4.4
Spinath et al. (2006) ....................................................................................... 31
2.4.5
Gegenüberstellung der Studien ..................................................................... 32
Fragestellungen und Erwartungen .............................................................................. 36
3.1
Dimensionalität motivationaler und kognitiver Konstrukte ................................. 36
Inhaltsverzeichnis
3.2
4
Vorhersage des Schulerfolgs ................................................................................. 36
Methode ...................................................................................................................... 38
4.1
Angewandte Untersuchungsverfahren ................................................................. 38
4.1.1
Leistungstests ................................................................................................ 39
4.1.2
Motivationsskalen.......................................................................................... 43
4.2
Aufbau des eingesetzten Testheftes ..................................................................... 48
4.3
Datenerhebung ..................................................................................................... 49
4.3.1
Planung der Datenerhebung.......................................................................... 49
4.3.2
Ablauf der Datenerhebung ............................................................................ 50
4.4
Beschreibung der Stichprobe ................................................................................ 52
4.4.1
Vorläufige Stichprobe .................................................................................... 52
4.4.2
Endgültige Stichprobe .................................................................................... 53
4.5
Auswertungsplan................................................................................................... 53
4.5.1
Vorgehen bei der Datenaufbereitung............................................................ 53
4.5.2
Vorgehen bei der Ergebnisberechnung ......................................................... 57
4.6
Verwendete Verfahren der Datenanalyse ............................................................ 58
4.6.1
Faktorenanalyse ............................................................................................. 58
4.6.2
Parallelanalyse ............................................................................................... 60
4.6.3
Item- und Reliabilitätsanalyse ....................................................................... 60
4.6.4
Produkt-Moment-Korrelation........................................................................ 62
4.6.5
Hierarchische Regressionsanalyse ................................................................. 62
4.6.6
Kommunalitätenanalyse ................................................................................ 63
4.7
5
ii
Voraussetzungen zur Anwendung der Verfahren ................................................. 64
Darstellung der Ergebnisse .......................................................................................... 68
5.1
Dimensionsanalysen.............................................................................................. 68
5.1.1
Struktur der Allgemeinen Intelligenz ............................................................. 69
Inhaltsverzeichnis
5.1.2
5.2
Struktur motivationaler Skalen ...................................................................... 70
Item- und Skalenanalysen ..................................................................................... 75
5.2.1
Leistungstests ................................................................................................ 75
5.2.2
Motivationsskalen.......................................................................................... 77
5.3
Regressionsanalysen ............................................................................................. 78
5.3.1
Vorhersageleistung der Schulleistung ........................................................... 78
5.3.2
Vorhersageleistung für das Fach Deutsch ..................................................... 79
5.3.3
Vorhersageleistung für das Fach Physik ........................................................ 80
5.3.4
Vergleich Schulbezogene und Fächerspezifische Betrachtungsweise .......... 80
5.4
6
iii
Kommunalitätenanalysen ..................................................................................... 81
Diskussion der Ergebnisse............................................................................................ 83
6.1
Stichprobe und Instrumente ................................................................................. 83
6.2
Dimensionsanalysen.............................................................................................. 83
6.3
Vorhersage des Schulerfolgs ................................................................................. 85
6.4
Anteile spezifischer und konfundierter Varianz.................................................... 86
6.5
Bezug zu vergleichbaren Studien .......................................................................... 90
7
Grenzen und Stärken der Studie .................................................................................. 91
8
Zusammenfassung ....................................................................................................... 94
9
Literaturverzeichnis# ................................................................................................... 96
10 Inhaltsindex#................................................................................................................ 96
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 1
ff
Vorwort und Anmerkungen
Die vorliegende Diplomarbeit befasst sich mit der Fragestellung, welche eigenständige
prädiktive Kraft die Allgemeine Intelligenz und verschiedene motivationale Variablen bei
der Vorhersage des Schulerfolgs besitzen. Ferner ist es Ziel herauszufinden, ob sich die
Vorhersageleistung bei fächerspezifischer Betrachtungsweise erhöht.
Die Arbeit ist in einen theoretischen und einen empirischen Teil aufgegliedert. Nach der
Einleitung wird der aktuelle Stand der Forschung und die psychologischen Konstrukte
beschrieben, die in der vorliegenden Studie erfasst werden. Im dritten Kapitel stelle ich
Hypothesen auf und leite daraus die spezifischen Fragestellungen ab. Das vierte Kapitel
beschäftigt sich ausführlich mit Instrumenten und Methoden, die zur Generierung des
Datensatzes verwendet wurden. Zunächst beschreibe ich kurz die eingesetzten
Leistungstests und Fragebögen, sowie den Aufbau des eingesetzten Testheftes. Es wird
über die Erhebung der Daten und die daraus resultierende Stichprobe berichtet.
Außerdem erläutere ich das Vorgehen bei der Ergebnisberechnung, sowie die
eingesetzten statistischen Analyseverfahren. Die Ergebnisse der Studie werden im fünften
Kapitel dargestellt und im sechsten Kapitel inhaltlich diskutiert. Dabei werden die
Resultate kritisch diskutiert und im Kontext anderen Studien beleuchtet. Das siebte
Kapitel beschäftigt sich mit den Grenzen der vorliegenden Arbeit und gibt einen Ausblick
auf aufgeworfene Fragen. Das achte Kapitel schließt mit einer Zusammenfassung der
Studie.
Um eine größere Stichprobe zu erhalten, arbeitete ich bei der Erstellung des Testheftes
und der Erhebung der Daten mit Jens Pfeiffer zusammen. Jeder einzelne von uns beiden
stellte mit dem gemeinsamen Datensatz eigenständige Berechnungen an, so dass nicht
auszuschließen ist, dass wir aufgrund unterschiedlicher Ausreißerklassifikationen etc. zu
geringfügig anderen Werten kommen. An der inhaltlichen Interpretation der Ergebnisse
sollte sich dadurch freilich nichts ändern. Da der Umfang der erhobenen Daten den
Rahmen einer einzigen Diplomarbeit exzessiv ausgereizt hätte, teilten wir die
Fragestellung inhaltlich auf. So führe ich in meiner Diplomarbeit nicht alle
psychometrischen Kennwerte auf und beschränke mich bei den Ergebnissen der
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
Seite 2
you want to appear here.
Faktorenanalysen auf meinen Teil. Die andere Hälfte befindet sich in der Diplomarbeit
ff
von Pfeiffer (2007) mit dem Titel: „Be smart or try hard − Zur Bedeutung von Intelligenz
und Motivation bei der Vorhersage von Schulleistungen“. Im Anhang unter T-1 findet sich
eine Tabelle in der die Aufteilung, sowie die Abkürzungen der verwendeten Leistungstests
und Motivationsskalen aufgeführt sind.
Die erhobenen Daten lassen sich in zwei grobe Gruppen aufgliedern. Die Subtests des
ersten Blocks dienen der Bestimmung der Allgemeinen Intelligenz und werden um den
Leistungsaspekt hervorzuheben als „Leistungstests“ bezeichnet. Der zweite Block erfasst
verschiedene schulbezogene motivationale und affektive Aspekte. Diese werden mit
verschiedenen Fragebögen untersucht und generalisiert als „Motivationsskalen“
bezeichnet.
Dem Leser werden zwei Wörter recht häufig begegnen: „schulbezogen“ und
„fächerspezifisch“. Der erste Ausdruck wird immer dann verwendet, wenn sich die
Aussage allgemein auf die Schule bezieht, ohne zwischen den verschiedenen Fächern zu
differenzieren. Der Begriff „fächerspezifisch“ kommt überall dort zum Einsatz, wo explizit
zwischen den verschiedenen Schulfächern differenziert wird.
Ebenso finden die Substantive „Schulleistung“ und „Schulerfolg“ vielfache Verwendung.
Die beiden Wörter werden synonym benutzt und beziehen sich dabei auf die Leistung von
Seiten des Schülers, nicht die der Schule.
Noch ein Hinweis zur Nummerierung von Tabellen: Jede Tabellenüberschrift enthält zwei
Ziffern, die durch einen Punkt voneinander getrennt sind. Die erste Zahl bezieht sich auf
die Kapitelnummer, um das Auffinden im Text zu erleichtern. Die zweite Nummer ist
innerhalb
eines
jeden
Kapitels
fortlaufend
durchnummeriert.
Dasselbe
Benennungsschema wurde für Abbildungen bzw. Diagramme verwendet.
Es sei darauf hingewiesen, dass der Einfachheit halber durchgehend darauf verzichtet
wurde, bei Personen zusätzlich zur männlichen die weibliche Wortform zu verwenden. Ist
die Rede beispielsweise von „Schülern“, so bezieht sich diese Bezeichnung wenn nicht
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
Seite 3
you want to appear here.
anderweitig erwähnt, auf die gesamte Stichprobe, bestehend aus männlichen und
ff
weiblichen Jugendlichen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 4
ff
1 Einleitung
„Kognitive und motivationale Determinanten der Schulleistung: Verändert sich die
Vorhersage bei fächerspezifischer Betrachtungsweise?“ So lautet der Titel meiner
Diplomarbeit und beschreibt die inhaltlichen Schwerpunkte der vorliegenden
Untersuchung. Zunächst stellt sich die Frage, was ist Schulleistung? Auch wenn die Schule
bzw. die Lehrer einen erheblichen Einfluss ausüben, ist mit dem Begriff „Schulleistung“
die Leistung von Seiten des Schülers gemeint. Köller und Baumert (2002, S. 756)
verstehen Schulleistungen als „das auf den Lehrplänen basierende deklarative und
prozedurale Wissen in verschiedenen Domänen […], dessen Erwerb zu einem erheblichen
Teil an Lerngelegenheiten im jeweiligen Fachunterricht gebunden ist.“
Experten gehen davon aus, dass der Schulerfolg multipel determiniert und in einer
komplexen Wechselwirkung mit individuellen, schulinternen und außerschulischen
Bedingungsfaktoren steht (vgl. Haertel, Walberg & Weinstein, 1983). Der soziale,
familiäre und schulische Kontext ist nicht Untersuchungsgegenstand dieser Studie. Die
vorliegende Untersuchung beschränkt sich bei der Vorhersage des Schulerfolgs auf
individuumsspezifische psychologische Variablen.
Im Titel der Diplomarbeit wird ein Substantiv aus der Wortfamilie des Verbs
„determinieren“ verwendet. Das bedeutet nach dem Wörterbuch der deutschen
Gegenwartssprache „etwas (im voraus) bestimmen, festlegen“. Ziel meiner Arbeit ist also
zu untersuchen, welche Faktoren die Leistung der Schüler in der Schule bedingen. Der
Begriff „Vorhersage“ ist dabei nicht als Prognose für die Zukunft zu verstehen (obwohl bei
hinreichender Merkmalsstabilität eine Voraussicht durchaus Sinn macht). Vielmehr geht
es darum, mit welcher Zuverlässigkeit ich Annahmen über die Schulleistung eines Schülers
aufstellen kann, wenn ich über Kenntnisse über die aktuellen psychologisch-relevanten
Determinanten verfüge.
Hierbei wird zwischen kognitiven und motivationalen Bedingungsfaktoren unterschieden.
Der Begriff „kognitiv“ bezieht sich auf dispositionale intellektuelle Fähigkeiten, bzw. die
Allgemeine Intelligenz. Helmke und Weinert (1997) führen zwei Gründe an, wieso
intellektuelle Fähigkeiten mit schulischen Leistungen zusammenhängen (S. 106):
„Intelligentere sind im Vergleich zu weniger intelligenten Menschen besser in der Lage, sich auf neue
Aufgaben einzustellen, effektive Problemlösungsstrategien zu entwickeln und lösungsrelevante
Regeln zu erkennen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 5
ff
Intelligentere haben im Vergleich zu weniger intelligenten Menschen in kumulativen Lernsequenzen
unter vergleichbarer Zeit- und Instruktionsbedingungen mit einer gewissen Wahrscheinlichkeit in der
Vergangenheit mehr und intelligenter organisiertes (tiefer verstandenes, vernetztes, multiple
repräsentiertes und flexibel nutzbares) Wissen erworben. Diese bereichsspezifischen Vorkenntnisse
erleichtern die darauf aufbauenden weiteren Lernprozesse.“
Kurz gesagt, Intelligentere greifen bei der Auseinandersetzung mit einer Aufgabe nicht
nur auf bessere Lösungsstrategien zurück, sie haben in der Vergangenheit mit einer
höheren Wahrscheinlichkeit bereichsspezifische Vorkenntnisse (Expertise) erworben. Dies
gilt auch für die Schule, wo intelligentere Schüler mehr vom Unterricht profitieren, da sie
neue Lerninhalte besser vernetzten und speichern.
Die „motivationalen Determinanten“ beziehen sich auf Persönlichkeitsaspekte, die den
Schüler motivieren, sich mit dem Schulstoff auseinanderzusetzen. Dazu gehören alle
affektiven, emotionalen und motivationalen, sowie das Fähigkeitsselbstbild betreffende
Faktoren. Dabei spielt die Gerichtetheit der Emotionen keine Rolle: Es ist egal, ob der
Schüler lernt, weil er Freude an dem Fach findet, oder aus Angst, schlechte Noten zu
bekommen.
Spinath, Spinath, Harlaar und Plomin (2006) unterscheiden in ihrer Studie bei der
Vorhersage des Schulerfolgs zwischen verschiedenen inhaltlichen Bereichen auf
Schulfachebene. Diese Idee greife ich auf und gehe der Fragestellung nach, ob sich die
Vorhersagekraft kognitiver und motivationaler Variablen durch die fächerspezifische
Betrachtungsweise verändert. Die Vorhersage der Schulleistung erfolgt bei der
vorliegenden Untersuchung sowohl allgemein schulbezogen, als auch separat für die
Fächer Mathematik, Deutsch, Physik und Englisch.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 6
ff
2 Stand der Forschung
2.1 Multiple Determinanten des Schulerfolgs
2.1.1 Aggregation der Determinanten
Die Fragestellung, welche Faktoren sich auf die Schulleistung eine Schülers auswirken, ist
in der Pädagogischen Psychologie schon seit langem Forschungsgegenstand. Es gibt
etliche Studien mit einer unüberschaubaren Anzahl an Determinanten, die jedoch zu
instabilen, oder gar widersprüchlichen Ergebnissen kommen (vgl. Helmke & Weinert,
1997). Dies ist auf unterschiedliche Kontextbedingungen, inkongruente Stichproben,
unzureichende Kontrolle moderierender Faktoren (z. B. ist der Einfluss der
Bedingungsfaktoren
altersabhängig),
den
uneinheitlichen
Sprachgebrauch
und
unterschiedliche Indikatorvariablen des Kriteriums Schulleistung zurückzuführen. In der
Untersuchung von Helmke (1992) fallen die Ergebnisse – abhängig davon ob Schulnoten
oder Schulleistungstests als Kriterium herangezogen werden – recht unterschiedlich aus.
Dies verdeutlicht, dass man Vergleiche mit anderen Studien nur mit Vorsicht anstellen
sollte, da für unterschiedliche Konstrukte teilweise ein und dasselbe Wort Verwendung
findet. Diese Problematik ist insbesondere bei Metaanalysen zu beachten.
Wie bereits in der Einleitung erwähnt, beschränkt sich die vorliegende Untersuchung bei
der Vorhersage des Schulerfolgs auf individuumsspezifische Bedingungsfaktoren (bzw. die
Schülerkompetenz), während Kontextvariablen keine Berücksichtigung erfahren. Doch ist
dies angesichts des breiten Spektrums an Determinanten zu rechtfertigen? Helmke und
Weinert (1997, S. 99) halten fest, „dass der Lernende mit seinen dispositionalen
Merkmalen und seinem aktuellen Verhalten die wichtigste dynamische Determinante der
Schulleistung […] darstellt.“
Für verschiedene Modelle des schulischen Lernens gibt es Schätzwerte, in welcher
Größenordnung die unterschiedlichen Faktorgruppen einzustufen sind. Diese Werte
weichen teilweise recht stark voneinander ab, eine Tendenz ist dennoch zu erkennen: Für
motivationale Bedingungsfaktoren werden zwischen 20 und 25 Prozent (Helmke &
Weinert, 1997, S. 111), für intellektuelle Fähigkeiten zwischen 25 und 45 Prozent der
Schulleistungsvarianz veranschlagt. Bei der Metaanalyse von Fraser et al. (1987, S. 207)
wird die Korrelation zur Schulleistung für Schülermerkmale mit .24 angegeben. Die
Autoren schreiben, dass „Ability“ einer der stärksten und beständigsten Prädiktoren
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
Seite 7
you want to appear here.
darstellt, während sie bei „Motivation“ von einem bedeutenden, unabhängigen Faktor
ff
sprechen (S. 222).
2.1.1.1 Walbergs Produktivitätsmodell schulischen Lernens
Da die theoretischen Modelle bis Anfang der 80er Schwächen aufweisen und nicht
ausreichend empirisch gesichert werden konnten, gab es mehrere Versuche die
wichtigsten Bedingungsfaktoren schulischer Leistung im Rahmen von Metaanalysen
zusammenzufassen (vgl. Haertel, Walberg & Weinstein, 1983). Ein theoriegenerierendes
Resultat dieser Bemühungen ist das Produktivitätsmodell von Walberg aus dem Jahre
1981, das in Abbildung 2.1 dargestellt ist. Es teilt neun Produktivitätsfaktoren in drei
übergeordnete Gruppen ein, die direkte Auswirkung auf das Lernen in der Schule haben
und sich gegenseitig beeinflussen: Aptitude (als Schülerkompetenz), Instruction (als
Unterrichtsvariable) und Psychological Environment (als bildungsbegünstigendes,
außerschulisches
psychologisches
Umfeld).
Die
ersten
fünf
aufgeführten
Produktivitätsfaktoren korrespondieren mit anderen Modellen zur Erklärung der
Lernleistung; unter anderem den Modellen Bloom, Carroll und Glaser (vgl. Fraser et al.,
1987). Jeder dieser Faktoren ist eine notwendige Voraussetzung für schulisches Lernen
und muss zumindest eine Mindestausprägung besitzen. Walberg geht davon aus, dass z.
B. ein hohes Fähigkeitsniveau in Kombination mit viel Instruktion nur dann das Potential
eines Schülers voll ausschöpft, wenn er motiviert ist und die Instruktion in angemessener
Weise erfolgt.
Die vier restlichen Faktoren beziehen sich auf die Umwelt. Familie, der außerschulische
Freundeskreis und die Klassengemeinschaft wirken sich auf in zweierlei Arten auf das
Lernen aus: Schüler lernen direkt von ihrer Umwelt und profitieren indirekt davon, dass
der Umgang ihre Fähigkeiten und ihre Lernmotivation (im guten Fall) fördert (vgl. Fraser
et al., 1987). Übermäßiger Medienkonsum beansprucht Zeit, die ansonsten in
schulbezogene Aktivitäten investiert werden könnte und wirkt sich dadurch negativ auf
den Erfolg in der Schule aus.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 8
ff
Anmerkung: Der direkte Einfluss auf das Lernen ist durch die doppelt gezeichneten Pfeile dargestellt.
Pfeile mit zwei Pfeilspitzen stehen für gegenseitige Beeinflussung.
Abbildung 2.1 – Produktivitätsmodell: Schulische Bedingungsfaktoren nach Walberg (aus Fraser et al.,
1987, S. 158)
Dieses Modell gilt als guter Ansatz und dient als Basis weiterer theoretischer
Überlegungen. Es wurde in vielen empirischen Studien untersucht und Borger (1983,
zitiert nach Reynolds & Walberg, 1991) konnte im Rahmen einer Metaanalyse (neun
Studien mit insgesamt über 15 Tausend Versuchspersonen) zeigen, dass 91 Prozent der
Korrelationen die durch das Produktivitätsmodell vorhergesagte Richtung aufwiesen.
2.1.1.2 Atkinsons Modell des kumulativen Lernens
Atkinson (1974) entwickelt zur Erklärung des Lernerfolges ein motivationspsychologisches
Modell des kumulativen Lernens. Er sieht (schulische) Leistungen als das Resultat
kumulativer Lernprozesse, die maßgeblich von der Motivation beeinflusst werden. Und
zwar in zweierlei Hinsicht: Zum einen ist von der Motivation abhängig, wie viel Zeit ein
Schüler mit einer Handlung verbringt, zum anderen beeinflusst die Motivation das
Leistungsniveau, wenn diese Handlung ausgeführt wird (Atkinson, 1975).
Die kumulierte Lernleistung resultiert aus dem Niveau der Leistung, sowie der
aufgewendeten Arbeitszeit, die negativ von der Motivation beeinflusst wird sich mit
Alternativen zu beschäftigen. Dabei ergibt sich das Niveau der Leistung über die Effizienz,
bedingt durch Fähigkeit, Art der Aufgabe und Motivationsstärke. Letztere ist abhängig von
Motiven, Überzeugungen und den Anreizen, die diese (Lern-)Handlung bietet. Außerdem
berücksichtig das Modell den rückwirkenden Effekt der aufgewendeten Arbeitszeit auf die
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
Seite 9
you want to appear here.
Fähigkeit der Person, den Heckhausen (1989, S. 270) mit dem Sprichwort „Übung macht
ff
den Meister“ zusammenfasst.
Abbildung 2.2 – Modell des kumulativen Lernens in Anlehnung an Atkinson und Lens (1980, aus Helmke,
1992, S. 29)
Atkinsons Modell beinhaltet eine zeitliche Komponente und eignet sich somit gut zum
Vorhersagen und Erklären von Entwicklungsverläufen. Zum Beispiel erklärt Atkinson mit
dem Modell Underachievement über eine niedrige Motivstärke und die dadurch
resultierende kurze Arbeitszeit, die für eine niedrige kumulative Steigerung der Fähigkeit
verantwortlich ist (Heckhausen, 1989, S. 270). Bei einzelnen kurzfristigen Aufgaben sieht
er intellektuelle Fähigkeiten, Vorwissen und Motivation als Leistungsdeterminanten. Bei
Aufgaben, die über einen langfristigen Zeitraum ausgeführt werden (wie beispielsweise
die Schulleistung), ist die Motivation in Abhängigkeit von Anreizen der Aufgabe die
ausschlaggebende Variable, wobei die Stärke der Motivation für konkurrierende
Aktivitäten eine wichtige Rolle einnimmt. Somit kommt Interesse als indirekte
Einflussgröße ins Spiel und das Modell erhält eine inhaltsspezifische Dimension. Das
Fähigkeitsselbstkonzept ist über die Variablen Fähigkeiten, sowie Überzeugungen und
Vorstellungen abgedeckt (Helmke, 1992).
Während die meisten Modelle der Motivation eine untergeordnete Bedeutung
zuschreiben, schätzt Atkinson, dass über das beschriebene Modell drei Viertel
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 10
you want to appear here.
kumulierter Lernleistungen über die Motivation erklärt werden können: 50 Prozent
ff
aufgabenbezogene Motivation, 25 Prozent Vorhandensein oder Fehlen konkurrierender
Interessen und 25 Prozent über Fähigkeitsunterschiede (Helmke & Weinert, 1997, S. 82).
Diese Schätzwerte konnten empirisch jedoch nicht bestätigt werden. Jedoch gibt es nach
Helmke und Weinert (1997) valide Hinweise dafür, dass der (inhaltsspezifischen)
Motivation eine enorme Bedeutung beim Erwerb langfristiger Lernleistungen in Form von
Expertise, oder beim Erreichen von Höchstleistungen zukommt.
Das Modell des kumulativen Lernens erfasst Umgebungsfaktoren nur im Ansatz, ohne
differenziert auf soziale Bedingungsfaktoren einzugehen. Korrelationsstudien konnten
jedoch niedrige Zusammenhänge mit dem sozioökonomischen Status oder dem Einfluss
von Gleichaltrigen auf die Schulleistung nachweisen (vgl. Fraser et al., 1987). Helmke
(1992) kritisiert an dem Modell, dass sich die Motivationsstärke nur über die
aufgewendete Arbeitszeit auf die kumulierte Schulleistung auswirken soll. Ferner wird der
rückwirkende Effekt der Effizienz auf die Arbeitszeit nicht berücksichtigt.
2.1.2 Das Problem inhaltlicher Überlappung der Determinanten
Besonders bei den motivationalen Bedingungsfaktoren schulischer Leistungen überlappen
sich die Konstrukte inhaltlich. So ist es auch für den Laien augenscheinlich, dass
beispielsweise Prüfungsangst und Furcht vor Misserfolg irgendetwas miteinander zu tun
haben. Elliot und McGregor (1999, S. 639) untersuchten diese Konstrukte und kamen zu
dem Schluss, dass sie sich faktorenanalytisch auf einen Faktor reduzieren lassen. Die
einzelnen Determinanten der Schulleistung weisen nicht nur konzeptuelle Überlappungen
auf, sondern interagieren miteinander (vgl. Helmke & Schrader, 2006). Das bedeutet, dass
bestimmte
Defizite
durch
andere
Variablen
kompensiert
werden
können
(Kompensationsmodell), solange die Merkmale nicht unter einem bestimmten
Schwellenwert liegen (Krug & Rheinberg, 1980). Dabei wird die Kompensation eines
Defizits wird umso schwerer, je näher die Ausprägung an der Schwelle liegt.
Beispielsweise kann ein Schüler mangelnde Begabung ein Stück weit durch Fleiß
ausgleichen.
Andererseits
geht
man
davon
aus,
dass
eine
Kopplung
der
Bedingungsfaktoren notwendig ist (Kopllungsmodell), um Hochleistungen zu erbringen.
So reicht es weder aus nur hochbegabt, oder nur fleißig zu sein – um herausragende
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 11
you want to appear here.
Leistungen in zu erbringen müssen beide Bedingungen gegeben sein. Dadurch ergibt sich
ff
bei der Prognose von Schulleistung ein methodisches Problem: Die einfachen
Korrelationen zwischen den verschiedenen Determinanten und dem Kriterium des
Schulerfolgs sind für eine verlässliche Vorhersage nicht ausreichend. Um die wahre
prädiktive Kraft der Variablen zu bestimmten, müssen die Interdependenzen zwischen
den einzelnen Bedingungsmerkmalen und ihre hierarchische Struktur berücksichtigt
werden (vgl. Sauer, 2006). Dies erschwert die Interpretation empirischer Studien, da man
nicht ohne Weiteres zwischen Einflussfaktoren, Moderatorvariablen und damit
korrelierten irrelevanten Indikatorvariablen unterscheiden kann.
Am Anfang des Abschnitts wurde bereits darauf hingewiesen, dass sich die
Determinanten des Schulerfolgs inhaltlich überlappen. Das hat zur Folge, dass die
prädiktive Kraft einer einzelnen Variable umso stärker überschätzt wird, je geringer die
Anzahl der erfassten Konstrukte ist, und je höher ihr gemeinsame Varianzanteil mit nicht
erfassten Variablen ausfällt. Eine einfache Lösung für dieses Problem ist die Erfassung
eines möglichst breiten Spektrums an Bedingungsfaktoren. Doch das alleine reicht noch
nicht aus: Die Korrelation allein sagt nichts über den Anteil der spezifischen Varianz einer
Variablen aus. Es gibt nur einige wenige Studien, die den gemeinsamen Varianzanteil
korrespondierender Determinanten thematisieren und bei der Ergebnisberechnung
beachten. Ein möglicher Ansatz ist die Verwendung von Kommunalitätenanalysen (siehe
Abschnitt 4.6.6), mit deren Hilfe die Anteile spezifischer und gemeinsamer Varianz
ermittelt werden können.
2.2 Kognitive Determinanten des Schulerfolgs
2.2.1 Die Allgemeine Intelligenz als bester Prädiktor
Zur prädiktiven Kraft der Allgemeinen Intelligenz im Bezug zum Schulerfolg gibt es eine
Vielzahl von Studien mit einem breiten Spektrum an Befunden. Das liegt vor allem daran,
dass sich die erhobenen Indikatorvariablen von Intelligenz und Schulerfolg je nach Studie
deutlich voneinander unterscheiden. Die inhaltlichen Differenzen beginnen bereits bei
der Auswahl eines Intelligenztests mit dem Schwerpunkt auf verbalen bzw. nonverbalen
Aufgaben. Außerdem spielt die Definition des Konstrukts „Schulerfolg“, sowie Alter,
Geschlecht und Herkunft der Stichprobe neben weiteren Merkmalen eine wichtige Rolle.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 12
you want to appear here.
Die Spannweite der empirisch ermittelten Korrelationen ist dementsprechend hoch und
ff
reicht von .10 bis .89 (vgl. Sauer & Gamsjäger, 1996). Die Allgemeine Intelligenz stellt
nach Ansicht vieler Experten den besten Prädiktor für den Schulerfolg dar, wobei die
Korrelation bei etwa .5 liegt (vgl. Helmke & Weinert, 1987). Dieser Befund wurde in vielen
Studien repliziert und durch Metaanalysen gesichert (z. B. Fraser, Walberg, Welch &
Hattie, 1987). Die Vorhersageleistung lässt sich laut Kleber (1977) durch die linearer
Kombination mehrerer Intelligenzwerte auf zirka 50 Prozent der Varianzaufklärung
erhöhen. In den meisten Studien liegt der Aufklärungsanteil von Intelligenztests zwischen
25 und 45 Prozent der Schulleistungsvarianz (Sauer & Gattringer, 1986). Gaedike wies
bereits 1974 (zitiert nach Sauer & Gattringer, 1986) darauf hin, dass eher die verbale
Intelligenz mit dem Schulerfolg zusammenhangt. Messé, Crano, Messé und Rice (1979)
untermauerten diese These, da verbale Aufgaben in ihrer Untersuchung höhere
Korrelationen zur Schulleistung aufweisen als Nonverbale.
Das
Hervorheben
der
Allgemeinen
Intelligenz
als
dominierende
Schulleistungsdeterminante führte zum in der Öffentlichkeit viel diskutierten Phänomen
der sogenannten Underachiever. Diesen „erwartungswidrig minderleistenden Schülern“
(Sparfeldt & Schilling, 2006, S. 804) wird aufgrund ihrer kognitiven Fähigkeiten unterstellt,
sie müssten eine bessere Schulleistung erbringen. Doch was für Gründe lassen sich
anführen, dass intelligentere Schüler im Regelfall bessere Schulnoten aufweisen?
2.2.2 Lernen und Vorwissen
In der Fachliteratur ist die Meinung weit verbreitet, Intelligenz ist die Fähigkeit zu lernen
(Simrall, 1947). Nach dieser Auffassung kann man die prädiktive Kraft der Intelligenz für
die Leistungen eines Schülers über den Zusammenhang zwischen Intelligenz und
Lernerfolg erklären. Die Korrelationen zwischen Intelligenz und verbalem Lernen liegen in
Studien zwischen Null und .7 (Kleber, 1977, S. 72) – woraus Kleber aufgrund der
uneinheitlichen Befunde folgert, dass das globale Intelligenzkonzept allein keine
brauchbare Erklärung für das Lernverhalten in der Schule liefert. Kleber (1997, S. 73) hebt
die Meinung anderer Autoren hervor: „Lernen ist in seiner Lernrate und seinem
Lernerfolg teilweise durch Intelligenz determiniert. Die Abhängigkeit ist nicht
überwältigend hoch…“
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 13
you want to appear here.
In der Einleitung wurde bereits darauf hingewiesen, dass intelligentere Schüler bei der
ff
Bearbeitung einer Aufgabe auf effektivere Lösungsstrategien zurückgreifen und sich so
besser auf neue Aufgaben einstellen können. Außerdem haben sie in der Vergangenheit
mit einer höheren Wahrscheinlichkeit bereichsspezifische Vorkenntnisse (Expertise)
erworben und dieses Wissen besser vernetzt und so organisiert, dass es flexibel genutzt
werden kann (vgl. Helmke & Weinert, 1997). Stern bringt dies wie folgt auf den Punkt
(2004, S. 45): „…hohe Intelligenz [ist] nur von Vorteil, wenn sie zuvor in
bereichsspezifisches Wissen umgesetzt wurde.“ Neben der Intelligenz ist also das
Vorwissen von zentraler Bedeutung als kognitive Determinante der Schulleistung. Mit
zunehmendem Alter der Schüler nimmt die Bedeutung der Intelligenz für die
Schulleistung ab, während der Effekt des Vorwissens auf die Schulleistung zunimmt
(Köller & Baumert, 2002). Stern (2004) weist darauf hin, dass mangelnde Intelligenz bis zu
einem gewissen Grad durch Wissen kompensiert werden kann, während sich fehlendes
Wissen nicht durch hohe Intelligenz ausgleichen lässt.
2.2.3 Generalfaktor und Kristalline Intelligenz
Spearman (1927) ging davon aus, dass die unterschiedlichen kognitiven Leistungen durch
einen einzigen Generalfaktor – den g-Faktor – determiniert sind. Demnach
interkorrelieren die verschiedenen Fassetten der Intelligenz und sind faktorenanalytisch
auf einen einzigen Faktor zu bündeln.
Cattell (1963) ist von einer hierarchischen Struktur der Intelligenz überzeugt und
unterschiedet auf oberster Ebene (im Gegensatz zu Spearman) zwischen „Kristalliner“ und
„Fluider
Intelligenz“.
Letztere
Verarbeitungsgeschwindigkeit,
ist
weitgehend
schlussfolgerndem
angeboren
Denken
und
und
basiert
auf
räumlich-visuelle
Fähigkeiten. Zur Kristallinen Intelligenz gehören übungs- und bildungsabhängige
Leistungen, die durch Kumulierung von Lernerfahrung erworben werden. Da die
Unabhängigkeit der Faktoren in Studien widerlegt wurde, erweiterte Cattell (1971) sein
Modell um einen übergeordneten Faktor, der sich – entgegen seiner Auffassung – als gFaktor interpretieren lässt. Aus der Theorie erschließt sich die Problematik, dass
Intelligenztests die Kristalline Intelligenz erfassen, Personen mit „fremdem“ kulturellen
Hintergrund (aufgrund der Wortschatz- und Wissenskomponente) benachteiligen. Um
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 14
you want to appear here.
Intelligenz „culture-fair“ zu messen, sollten Tests ganz auf Sprache verzichtet und lediglich
ff
fluide Komponenten erfassen.
In der Investmenttheorie des Wissenserwerbs von Cattell (1987) „kristallisiert“ sich die
geistige Energie im Laufe der Entwicklung zu spezifischeren Fähigkeiten, die wiederum
den Erwerb von bereichsspezifischem Wissen steuern (vgl. Stern, 2001). Cattell geht
davon aus, dass der Lernerfolg bei komplexen Inhalten vom Niveau der Fluiden Intelligenz
abhängig ist: Fluide Intelligenz wird in komplexe Lernaufgaben investiert und führt zum
Erwerb kristalliner Fähigkeiten. Nach der Investmenttheorie sollte Fluider der Kristallinen
Intelligenz während der Entwicklung (im Schulalter) vorausgehen. Außerdem setzt das
Erreichen hoher Kristalliner Intelligenz ein hohes Niveau fluider Fähigkeiten voraus. Stern
(2001) weist darauf hin, dass die Ergebnisse verschiedener Studien sich nicht mit den
abgeleiteten Hypothesen der Investmenttheorie decken.
Nach Cattel (1971, zitiert nach Sauer & Gattringer, 1986, S. 250) kann die Fluide
Intelligenz bis zu 30 Prozent der Schulleistungsvarianz aufklären. Liegt die prozentuelle
Varianzaufklärung eines Intelligenztests über diesem Wert, so ist dies auf nicht-fluide
Faktoren zurückzuführen, die sich mit den Aspekten der Intelligenz und dem Kriterium der
Schulleistung überlappen. Als Erstes kommt mir hier die Kristalline Intelligenz in den Sinn,
die gemäß der Investmenttheorie für den Aufbau von bereichsspezifischem Wissen – und
somit zumindest teilweise für das Vorwissen eines Schülers verantwortlich ist. Nach
Schmalt (1976, zitiert nach Sauer & Gattringer, 1986) spielt – besonders bei länger
andauernden Intelligenztests – die Motivation der Versuchsperson eine Rolle. Demnach
ist ein langer Intelligenztests nicht als reiner Fähigkeits-, sondern gleichzeitig als
Leistungs(motivations)test zu interpretieren.
2.2.4 Schulleistung als Kriterium und Kontributor
Es gibt auch Stimmen, die die Dominanz der Intelligenz als Schulleistungsdeterminante in
Frage stellen. Mercer (1978, zitiert nach Messé et al. 1979, S. 234) kritisiert die inhaltliche
Ähnlichkeit von Schulleistungs- und Intelligenztests und die daraus hervorgehende
Überschätzung der prognostischen Validität der Allgemeinen Intelligenz. Die auf
Lehrerbeurteilungen basierte Schulnote ist demnach ein validerer Indikator der wahren
Schulleistung. Die Befunde von Helmke (1992) sprechen für diese These: Er konnte bei
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 15
you want to appear here.
Fünftklässlern nachweisen, dass der Anteil spezifischer Varianz motivationaler Variablen
ff
zur Vorhersage der Mathematiknote größer war, als der spezifische Varianzanteil
kognitiver Variablen. Im Gegensatz dazu stellten kognitive Variablen den besseren
Prädiktor dar, wenn ein Mathematiktest als Kriteriumsvariable herangezogen wurde.
Neben dem Schluss, dass mit zunehmender Intelligenz die Wahrscheinlichkeit für eine
gute Lernleistung und somit gute Schulnoten steigt, sollte die Frage nach der Kausalität
nicht gänzlich vergessen werden. Köller und Karim (2001, zitiert nach Oerter, 2002)
zeigten, dass steigende Schulanforderungen eine besondere Ausschöpfung kognitiver
Begabungsreserven zur Folge hat und somit die Entwicklung der Allgemeinen Intelligenz
begünstigt.
Demnach
ist
die
Auseinandersetzung
mit
komplexen
Aufgaben
(beispielsweise im Rahmen der Hausaufgaben oder beim Besuch von optionalen AGs in
der Schule) förderlich für die Entfaltung der Allgemeinen Intelligenz. StelzI, Merz, Ehlers
und Remer (1995) konnten die intelligenzfördernde Wirkung des Schulbesuchs mit einer
quasi-experimentellen
Untersuchung
nachweisen.
Demnach
ist
die
Steigerung
intellektueller Fähigkeiten, die 10-jährigen Kinder innerhalb eines Jahres erfahren,
hauptsächlich auf den Schulbesuch zurückzuführen.
2.3 Affektive und Motivationale Determinanten des Schulerfolgs
2.3.1 Einleitender Überblick
In einer Untersuchung von Pekrun, Hochstadt und Kramer (1996) wurde deutlich, dass in
Prüfungssituationen neben Angst ein breites Spektrum an Emotionen – ein Drittel davon
positiver Art – empfunden wird. Doch nicht nur während der Prüfung spielen Gefühle
eine Rolle. Im Vorfeld können Emotionen Lern- und Prüfungsmotivation auslösen,
aufrechterhalten, verstärken oder abschwächen. Doch wie ist der Zusammenhang
zwischen Emotion und Motivation zu erklären? „Emotions serve the functions of
preparing and sustaining reactions to important events and states by providing
motivational and physiological energy, by focusing attention and modulating thinking,
and by triggering action-related wishes and intentions“ (Pekrun, Götz, Titz & Perry, 2002,
S. 96). Auf die Schule bezogen sorgt die Ankündigung einer Prüfung für emotionale
Reaktionen, die den Schüler (im günstigen Fall) aktivieren und sein Denken dahingehend
modifizieren, dass er die Motivation und Intention verspürt sich auf die Prüfung
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 16
you want to appear here.
vorzubereiten. Pekrun geht davon aus, dass Emotionen einen indirekten Effekt auf Lernen
ff
und Leistung ausüben, moderiert über kognitive und motivationale Mechanismen. Der
Zusammenhang von Emotionen zu Motivation und Schul- bzw. Studienleistung konnte in
Korrelationsstudien (Pekrun et al., 2002) klar nachgewiesen werden.
Welche
Variablen
gehören
zu
dem
pädagogisch-psychologischen
Konstrukt
„motivationale Determinanten der Schulleistung“? Gemeint sind motivationale, affektive
und emotionale Bedingungsfaktoren, die Einfluss auf die Leistung eines Schülers ausüben.
In meiner Untersuchung wurden die motivationalen Konstrukte Fähigkeitsbezogenes
Selbstkonzept (Abschnitt 2.3.2), Interesse (Abschnitt 2.3.3), Hoffnung auf Erfolg und
Furcht vor Misserfolg (Abschnitt 2.3.4), sowie Anstrengungsvermeidung (Abschnitt 2.3.5)
erfasst. Nach Helmke (1989) ist es wenig sinnvoll zwischen motivationalen und affektiven
Konstrukten zu unterscheiden, da sie gemeinsame Varianzanteile besitzen. Stattdessen
schlägt er vor inhaltlich ähnliche Konstrukte zu breiteren Faktoren zusammenzufassen.
In der Vergangenheit dominierte die Intelligenz klar als primäre individuelle
Bedingungsvariable der Schulleistung. Erst Ende der 80er Jahre wurde Studien mehr
Beachtung geschenkt, die motivationalen Variablen eine größere Vorhersageleistung
einräumten.
Mithilfe
von
Längsschnittstudien
und
der
Verwendung
von
Kommunalitätenanalysen konnte gezeigt werden, dass die prädiktive Kraft motivationale
Variablen lange Zeit unterschätzt wurde (vgl. Sauer & Gattringer, 1986). Eine mögliche
Erklärung lautet, dass sich motivationale Faktoren zu einem erheblichen Teil nur indirekt
auf die Schulleistung auswirken (vgl. Schiefele, Krapp & Schreyer, 1993) und somit
schwieriger zu identifizieren sind.
In den meisten Studien dominieren intellektuelle Fähigkeiten bei der Vorhersage von
Schulerfolg (z. B. Gagné & St Père, 2001; Spinath et al., 2006). In der Metaanalyse von
Fraser et al. (1987, S. 207) wird für kognitive Bedingungsmerkmale ein mittlerer
Korrelationskoeffizient zur Schulleistung von .44, gegenüber einem Wert von .12 für
affektive Determinanten (basierend auf acht Studien) angegeben. Uguroglu und Walberg
(1979, S. 385) kamen dagegen bei einer Analyse von 40 Studien auf eine mittlere
Korrelation von .34 nach der sie folgerten, dass 11.4 Prozent der Schulleistungsvarianz
über die Motivation aufgeklärt wird. Dabei stiegen die Aufklärungswerte mit
zunehmender Klassenstufe an (bis zu einem Aufklärungsanteil von 20 Prozent in Klasse
12).
Es
sollte
nicht
vergessen
werden,
dass
ein
substantieller
Teil
der
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 17
you want to appear here.
Schulleistungsvarianz nur durch kognitive und motivationale Variablen gemeinsam
ff
aufgeklärt wird (vgl. Helmke & Schrader, 2006).
Während viele Experten die Dominanz kognitiver Variablen hervorheben, sind andere von
der Bedeutung motivationaler Determinanten überzeugt: „…motivational factors do
indeed have a powerful influence on achievements“ (Howe, 1987, S. 134, zitiert nach
Helmke, 1989); „motivational factors may exert as much influence on […] school
performance as do cognitive skills and abilities“ (Hill & Wigfield, 1984, S. 106, zitiert nach.
Helmke, 1989). Helmke (1989) weist darauf hin, dass motivationale Bedingungsfaktoren
die Schulleistung hauptsächlich auf indirektem Weg beeinflussen und in einer zyklischen
Wechselwirkung stehen (S. 929): „Affective variables influence achievement and are in
turn modified and changed by achievement outcomes, forming a basic cycle of school
performance“.
2.3.2 Selbstkonzept
Nach Moschner und Dickhäuser (2006, S. 685) versteht man unter dem Begriff
Selbstkonzept „das mentale Modell einer Person über ihre Fähigkeiten und
Eigenschaften“. Dabei beinhaltet das Selbstkonzept deskriptiv-kognitive, sowie affektive
evaluative Komponenten, die jedoch schwer voneinander zu trennen sind (Rost &
Sparfeldt, 2002). Im Sinne der kognitiven Selbstbeschreibung wird das Selbstkonzept als
„deklaratives Konzept der Kognition einer Person über sich selbst verstanden“ (Moschner
& Dickhäuser, 2006, S. 685). Dagegen geht die affektive Selbstbewertung auf die
Attribution von Merkmalen, Eigenschaften und Fähigkeiten zurück, die die Person sich
selbst zuschreibt und beurteilt.
Im schulischen Kontext findet man in der Literatur häufig den Begriff „Akademisches
Selbstkonzept“ oder „Fähigkeitsbezogenes Selbstkonzept“. Gemeint ist in beiden Fällen
die „hochdifferenzierte kognitive Repräsentationen der eigenen Leistungsfähigkeiten“
(Fend & Stöckli, 1997, zitiert nach Schilling, Sparfeldt, Rost & Nickels, 2004, S. 21). Nach
Shavelson, Hubner und Stanton (1976) ist das Selbstkonzept ein multidimensionales
Konstrukt und in einer hierarchischen Struktur organisiert. Dieses Modell ist in Abbildung
2.3 dargestellt: Miteinander korrelierende Selbstkonzeptfassetten bilden die Basis; aus
diesen Fassetten setzen sich übergeordnete Selbstkonzepte auf einer höheren
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 18
you want to appear here.
hierarchischen Ebene zusammen. Das globale Selbstkonzept besteht aus dem
ff
Akademischen Selbstkonzept (das fächerspezifisch aufgegliedert werden kann), sowie
dem sozialen, emotionalen und körperlichen Selbstkonzept usw. Es besteht ein Konsens
über eine mehrdimensionale Konzeption des Selbstkonzepts (Schilling et al., 2005) und
die fächerspezifische Struktur konnte in empirische Studien faktorenanalytisch bestätigt
werden (z. B. Marsh, 1990b; Rost & Sparfeldt, 2002).
Abbildung 2.3 – Das hierarchisches Selbstkonzeptmodell in Anlehnung an Shavelson et al. (1976,
Moschner & Dickhäuser, 2006, S. 687)
Im pädagogisch-psychologischen Bereich wird verstärkt der Zusammenhang zwischen
Selbstkonzept und Schulleistung untersucht. In der Metaanalyse von Hansford und Hattie
(1982) resultierte eine durchschnittliche Korrelation von .20 zwischen dem generellem
Selbstkonzept und Leistungsindikatoren. Dieser Zusammenhang stieg auf .42 an, wenn
nur Studien in die Analyse eingingen, die das akademische Selbstkonzept erfassten (vgl.
Lamsfuß & Rost, 1992, S. 154). Gemäß dem Modell des hierarchischen Selbstkonzepts
wächst der Zusammenhang zwischen Selbstkonzept und Leistung, wenn die
Indikatorvariablen auf einer niedrigen Hierarchieebene erfasst werden und inhaltlich
korrespondieren. Schilling et al. (2004, S. 27) berichten mittlere Korrelationen von .57
zwischen fächerspezifischen Selbstkonzeptskalen und den entsprechenden Zensuren.
Helmke (1992) spricht dem Selbstkonzept im Bezug zu anderen nicht-kognitiven Variablen
eine Schlüsselrolle bei der Prädiktion der Schulleistung zu. Im Kontext kognitiver
Variablen hängt die prädiktive Kraft davon ab, ob man die Schulnote, oder die Ergebnisse
von Schulleistungstests als Indikator für die Schulleistung heranzieht. Bei letzterem sind
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 19
you want to appear here.
die kognitiven Determinanten vorrangig, während bei der Schulnote als
ff
Kriteriumsvariable das Selbstkonzept dominiert. Helmkes Begründung lautet, dass sich
„für die Beeinflussung der Note wesentlich mehr Möglichkeiten ergeben, die durch das
jeweilige
Intelligenz-
und
Vorkenntnisniveau
gegebenen
Lern-
bzw.
Leistungsbeschränkung zu kompensieren“.
In
einer
Studie
von
Marsh
und
Yeung (1997)
wurde deutlich, dass das
Fähigkeitsselbstkonzept nicht nur Schulnoten, sondern auch die Kurswahl mitbestimmt:
Das Selbstkonzept war ein besserer Prädiktor für die Wahl von Schulfächern als die
Schulnote im entsprechenden Fach. Die herausragende prädiktive Bedeutung des
Fähigkeitsselbstkonzepts bei der Kurswahl im Fach Mathematik wurde von Köller, Daniels,
Schnabel und Baumert (2000) erneut bestätigt.
Die Selbstkonzeptforschung beschäftigt sich nicht nur mit der Fragestellung, wie hoch der
Zusammenhang zwischen Selbstkonzept und Schulleistung ist, sondern beschäftigt sich
mit der Frage der Kausalität. Nach Helmke und van Aken (1995) basiert das
Fähigkeitsselbstbild von Schülern gemäß dem Skill-Development-Ansatz zumindest
teilweise auf vorhergehenden Erfolgen oder Misserfolgen und die bewertende
Rückmeldung anderer Personen. Im schulischen Kontext geschieht dies über Lehrer, die
die Leistung des Schülers relativiert an der Klassennorm beurteilen. Eine andere
Sichtweise bietet das Self-Enhancement-Modell, das davon ausgeht, dass das
Selbstkonzept bedeutend zur Vorhersage späterer Leistungen beiträgt. Demnach ist
beispielsweise ein hohes Fähigkeitsselbstkonzept eine begünstigende Voraussetzung für
das Aufnehmen und Aufrechterhalten von Lernanstrengungen (Helmke, 1992). Shavelson
und Bolus (1982) kommen zu dem Befund, dass die Schulleistung eher das LeistungsSelbstkonzept kausal mitbestimmt als umgekehrt das Leistungs-Selbstkonzept die
Schulleistung.
Wichtig ist, dass das Selbstkonzept nicht isoliert betrachtet wird, sondern der Effekt
weiterer Moderatorvariablen berücksichtigt wird. Ein Beispiel hierfür wäre das Alter: Das
Fähigkeitsselbstbild beeinflusst in der Grundschule die Leistung noch nicht entscheidend
(Helmke & van Aken, 1995). Dies ändert sich jedoch nach der Grundschule, wo es
deutlichen Einfluss auf die Leistung gewinnt (Helmke, 1992).
Wie beeinflusst das Selbstkonzept die Schulleistung? Wenn ein Schüler in einem
Vokabeltest das Wort nicht kennt, hilft es ihm auch nicht weiter, wenn er meint gut in
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 20
you want to appear here.
Sprachen zu sein. Das fähigkeitsbezogene Selbstkonzept hat jedoch Einfluss auf eine
ff
Reihe von Variablen, die wiederum direkten Einfluss auf die Leistung in der Schule
nehmen. Helmke und Weinert (1997) führen Anstrengungsintensität (insbesondere
während der Hausaufgabe), Anstrengungsinitiierung und kognitives Engagement
(insbesondere während des Unterrichts) auf. Außerdem dient laut Helmke und Weinert
(1997, S. 148) ein hohes Selbstkonzept in „…selbstwertrelevanten Unterrichts- und
Leistungssituationen als Puffer gegen aufgabenirrelevante, leistungsbehindernde
Selbstzweifel.“
2.3.3 Interesse
Die Person-Gegenstands-Theorie sieht Interesse als „herausgehobene, subjektiv
bedeutsam erlebte Beziehung zwischen einer Person und einem Gegenstandsbereich“
(Krapp, 1989, S. 235). Dieser Gegenstandsbereich außerhalb der Person spielt dann eine
wichtige Rolle im Streben der Person. Die interessenorientierte Auseinandersetzung mit
der Umwelt hat dabei nicht nur Auswirkung auf die handelnde Person, sondern auch auf
die im Interessenhandeln einbezogenen Umweltgegenstände. Das heißt, es findet eine
wechselseitige Beeinflussung im Sinn einer Transaktion statt. Interessengegenstände
können in diesem relationalen Konstrukt konkrete Dinge, Tätigkeiten, aber auch abstrakte
Wissensbereiche oder Schulfächer sein. Interessen sind bedeutend für die Entwicklung
einer Person und ihren Wissenserwerb.
Person
Interessenorientierte Handlung
Gegenstand von
Interesse
Abbildung 2.4 – Person-Gegenstands-Theorie: Interesse als relationales Konstrukt
Nach Edelmann (1993) zeichnet sich Interesse dadurch aus, dass die Neugier sich immer
wieder auf bestimmte Bereiche konzentriert, sozusagen kanalisiert wird. Diese Neugierde
sieht er als wesentliche Voraussetzung für kognitives Lernen. Auf kognitiver Ebene bildet
sich eine komplexe Wissensstruktur.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 21
you want to appear here.
Auf affektiver Ebene geht Interesse mit positiven Gefühlen einher. Nach der Cognitive
ff
Evaluation Theory (Deci & Ryan, 1985) wird die Auseinandersetzung mit dem Gegenstand
von Interesse wird als angenehm empfunden, da die eigene Kompetenz dabei zunimmt
und das grundlegende psychologische Bedürfnis nach Autonomie und Kompetenz
befriedigt wird. Ein weiterer Ansatz ist, dass durch die optimale Passung zwischen
Fähigkeits- und Anforderungsniveau eine Art „Flow“ entstehen kann (Krapp, 1992).
Nach Meinung vieler Lehrer, spielt auch das Interesse als Bedingungsfaktor der
Schulleistung eine Rolle. In diesem Zusammenhang bezeichnen Schiefele et al. (1993, S.
121) das Interesse als „spezifische Präferenz für bestimmte Lerninhalte“ und vermuten
eine herausragende Bedeutung innerhalb der Gruppe motivationaler Schülermerkmale.
Helmke und Schrader (2006, S. 85) sehen Interesse als „zentrales Element
selbstbestimmten Handelns und Bestandteil intrinsischer Motivation“. Helmke und
Weinert (1997) weisen darauf hin, dass die Bedeutung des Interesses im Laufe der
Schulzeit zunimmt und bei Jungen eine größere Bedeutung hat als bei Mädchen.
Schiefele et al. (1993, S. 120) untersuchten 21 Studien im Rahmen einer Metaanalyse und
kamen dabei auf eine mittlere Korrelation von .30 zwischen fachspezifischem Interesse
und schulischer Leistung. Dabei ergaben sich zwischen den Fächern teilweise signifikante
Unterschiede. Das Ausmaß des Einflusses von Interesse auf die Leistung hängt also
zumindest teilweise vom untersuchten Fach ab. Naturwissenschaftliche „schwierige“
Fächer sind über das Interesse besser vorherzusagen als Nebenfächer. Die Autoren geben
als Begründung an, dass Schüler mit einem geringen Interesse in einem Fach schnell
aufgeben wenn es schwierig wird, während fachspezifisch interessierte Schüler
Durchhaltevermögen an den Tag legen.
Wissenschaftliche Arbeiten haben gezeigt, dass Interesse am behandelten Thema beim
Lesen von Texten und der Lernerfolg in positivem Zusammenhang stehen (Schiefele et al.,
1993). Dies kann man über eine erhöhte Aufmerksamkeit erklären (Hidi, 1990), die zu
einer höheren physiologischen Aktivierung und damit besserer Lernleistung einhergeht.
Schiefele (1996) konnte in einer Studie zeigen, dass „quality of experience“ während dem
Lesen mit steigendem Interesse am Thema zunimmt. Zu den zentralen Dimensionen
dieses Konstrukt gehören Aktivierung (im Sinne einer Energetisierung), Affekte (z.B. gute
Laune) und Konzentrationsfähigkeit. Schiefele (2001, S. 185) fand in mehreren
Untersuchungen niedrige bis mittlere Korrelationen (zwischen .24 und .57) zwischen
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 22
you want to appear here.
Aktivierung und Interesse beim Textelesen. Zur moderierenden Wirkung von Aktivierung
ff
auf die Behaltensleistung gibt es jedoch keine klare Befundlage. Die positiven
Korrelationen zwischen Interesse und potentiellen Moderatorvariablen, sowie die
Zusammenhänge zwischen diesen Variablen und dem Lernerfolg lassen jedoch vermuten,
dass Interesse indirekten Einfluss auf den Lernerfolg ausübt.
Wie ist die prognostische Kraft von Interesse für die Schulleistung zu erklären? Interesse
ist ein zentrales Konzept wenn es um die Erklärung des Auftretens intrinsischer
Motivation geht (Deci, 1992, zitiert nach Schiefele et al., 1993). Nach Krapp (2006) spielen
Interessen eine wichtige Rolle zur Beschreibung und Erklärung von Lernmotivation.
Andererseits weist er darauf hin, dass Schüler ihr Lernverhalten eher auf Prüfungs-,
anstatt auf Interesseninhalte ausrichten.
2.3.4 Leistungsmotivation und der Zusammenhang mit Hoffnung auf Erfolg
und Furcht vor Misserfolg
Heckhausen (1965, zitiert nach Rheinberg, 1998, S. 127) definiert Leistungsmotivation als
„das Bestreben, die eigene Tüchtigkeit in all jenen Tätigkeiten zu steigern oder möglichst
hoch zu halten, in denen man einen Gütemaßstab für verbindlich hält“. Es geht also um
den Vergleich der eigenen Leistung mit einem Anspruchsniveau, das man der sich selbst
setzt, oder von anderen Personen auferlegt bekommt. „Leistung ist immer bewertete
Leistung“ (Edelmann, 1993, S. 389). Deshalb entstehen bei der Auseinandersetzung mit
einer Aufgabe und dem Resultat Gefühle, die einen wesentlichen Impuls zum Ausführen
einer Handlung darstellen: Zentral erscheint die Empfindung von Stolz bei Erfolg und
Scham bei Misserfolg, wobei die Stärke der Empfindung von der Diskrepanz zum
gesetzten Anspruchsniveau abhängt, und welchen Ursachen das Ergebnis zugeschrieben
wird.
2.3.4.1 Atkinsons Risikowahl-Modell
Atkinson
(1957)
Leistungsmotivation
hat
mit
seinem
erheblich
Risikowahl-Modell
geprägt.
Der
Ansatz
die
Diskussion
vereint
um
personen-
die
und
situationsspezifische Variablen und hilft bei der Vorhersage der individuell bevorzugten
Aufgabenschwierigkeit bzw. des Anspruchsniveaus. Leistungsmotivation ist laut Atkinson
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 23
you want to appear here.
(1957, S. 360) das Ergebnis eines Konflikts zwischen Annäherungs- („The general aim […]
ff
is to maximize satisfaction of some kind“) und Vermeidungstendenzen („The aim […] is to
minimize pain“). Das Annäherungsmotiv sieht er als Disposition Erfolg anzustreben, das
Vermeidungsmotiv als Disposition Versagen zu vermeiden bzw. die Fähigkeit Scham als
Konsequenz des Versagens zu ertragen. Die Tendenz Erfolg anzustreben besteht gemäß
Atkinsons (1957) aus drei multiplikativ verknüpften Variablen: dem Erfolgsmotiv (als
dispositionelles Leistungsbedürfnis), der subjektiven Erfolgswahrscheinlichkeit (dass die
Handlung positiv abgeschlossen wird) und dem Erfolgsanreiz (als Situationsvariable).
Analog dazu besteht die Tendenz Misserfolg zu vermeiden aus dem Misserfolgsmotiv, der
subjektiven Misserfolgswahrscheinlichkeit und dem Misserfolgsanreiz (vgl. Edelmann,
1993). Bei der Entscheidung, ob eine Person eine Leistung in Angriff nimmt, werden die
beiden Faktoren „Hoffnung auf Erfolg“ (mit dem nachfolgenden Gefühl von Stolz und
Zufriedenheit) und „Furcht vor Misserfolg“ (mit dem einhergehenden Gefühl von Scham)
gegeneinander abgewogen. Entscheidend ist, dass nach Atkinson (1957) immer das
stärkere der beiden Motive bestimmt, ob eine Leistungssituation aufgesucht oder
vermieden wird.
Demnach sollte Hoffnung auf Erfolg positiv, Furcht vor Misserfolg dagegen negativ mit
dem
Schulerfolg
korrelieren.
Diese
Hypothese
konnte
in
wissenschaftlichen
Untersuchungen bestätigt werden. Gjesme (1971) teilte Schüler fähigkeitsheterogener
Klassen entsprechend ihrer Intelligenz in Gruppen ein. Erwartungsgemäß korrelierte nur
in der Gruppe der Schüler mittlerer Intelligenz Hoffnung auf Erfolg positiv, Furcht vor
Misserfolg dagegen negativen mit der Schulleistung. Elliot und McGregor (1999, zitiert
nach Lang & Fries, 2006) sehen Prüfungsangst als fächerspezifische Variante von Furcht
vor Misserfolg. Zwischen diesen beiden Konstrukten fanden Lang und Fries (2006)
mittlere Korrelationen von .4 (S. 222).
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 24
Motivation
ff
Subjektive Aufgabenschwierigkeit
Abbildung 2.5 – Kurve präferierter Leistungsmotivation nach Atkinson (1957,
Modifikation nach Rheinberg, 1995, S.71)
Welche praktischen Schlüsse lassen sich aus diesem theoretischen Modell ableiten? Das
Modell eignet sich zur Vorhersage der präferierten Aufgabenschwierigkeit bzw. des
individuellen Anspruchsniveaus (Abbildung 2.5): Ist die Erfolgswahrscheinlichkeit extrem
hoch, oder extrem niedrig, kommt es zu einer geringen Leistungsmotivation. Ist die
Aufgabe extrem schwer stehen die Chancen schlecht diese zu bewältigen. Ist eine
Aufgabe jedoch zu leicht, ist der Anreiz zu gering, um bei erfolgter Bewältigung Stolz zu
empfinden. Rheinberg (1995) weist darauf hin, dass die Aufgabenschwierigkeit keine
absolute Variable ist, sondern von der subjektiven Einschätzung der eigenen Fähigkeiten
einer Person abhängt.
2.3.4.2 Eccles Model of Achievement-Related Choices
Die Expectancy-Value Theory of Achievement Motivation nach Eccles und ihren Kollegen
(1983) fasst verschiedene Aspekte zusammen und stellt somit einen Schritt in Richtung
der theoretischen Integration verschiedener Modelle dar. Neben individuellen
Dispositionen und Prozessen, die innerhalb der Person ablaufen, berücksichtigt das
Modell auch Einflüsse der sozialen und kulturellen Umwelt. Im Kern steht ein ErwartungsWert-Modell („Achievement-Related Choices“) zur Erklärung der (Leistungs-) Motivation
von Kindern bzw. Jugendlichen. Auf dieses werde ich mich im Folgenden konzentrieren,
um die für meine Arbeit relevanten Aspekte darzustellen. Eccles sieht die persönlichen
Erfolgserwartungen (Expectation of Success) und den subjektiv beigemessenen
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 25
you want to appear here.
Aufgabenwert (Subjective Task Value) als die zentralen Einflussgrößen auf die Stärke der
ff
in einer Situation wirksamen Motivation. Der Wert einer Aufgabe ist eine Funktion der
wahrgenommenen Eigenschaften dieser Aufgabe und der individuellen Bedürfnisse, Ziele
und Selbstwahrnehmungen einer Person (Eccles, 1983, S. 90), sowie der Interpretation
früherer Ereignisse. Die Erfolgserwartungen ergeben sich aus dem Selbstbild der eigenen
Fähigkeiten, sowie der subjektiv wahrgenommenen Aufgabenschwierigkeit. Die Effekte
sämtlicher anderer Faktoren (nur die letzten zwei „Ebenen“ der Einflussfaktoren sind in
Abbildung 2.6 dargestellt) laufen in den Erinnerungen und den Selbstschemata
zusammen.
Child's Goals and
General Self-Schemata
▪ Self-schemata
▪ Short-term Goals
▪ Long-term Goals
▪ Ideal self
▪ Self-concept of
one's abilities
▪ Perceptions of
task demands
Child's Affective
Memories
Expectation of Success
Achievement-Related
Choices
Subjektive Task Value
▪ Incentive and
Attainment Value
▪ Utility Value
▪ Cost
Abbildung 2.6 – Der zentrale Teil des Erwartungs-Wert-Modells der Leistungsmotivation nach Eccles et al.
(Ausschnitt aus Wigfield & Eccles, 2000, S. 69)
Der Erwartungsaspekt beschreibt die subjektive Erfolgszuversicht eines Schülers bei einer
bestimmten Aufgabe – die Wertvariablen den Anreiz, den ein Erfolg in dieser Aufgabe
bieten kann. Den Wert, den eine Person einer Aufgabe beimisst, ergibt sich nach Eccles
(1983, S. 89) durch die Hauptkomponenten: Erfolgswert („importance of doing well on
the task“), intrinsischer Wert („immediate enjoyment one gets from engaging in an
activity“), Nützlichkeitswert („importance of the task for some future goal“) minus den
Kosten. Dies sind die durch die Ausführung der Aufgabe entstehenden Einschränkungen
in anderen Bereichen (z. B. Hausaufgaben machen, anstatt Fußball zu spielen), aber auch
die erwarteten negativen Affekte wie Furcht vor Misserfolg, Anstrengung, etc.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 26
you want to appear here.
Eccles (1993, zitiert nach Wigfield & Eccles, 2000, S. 74) fand heraus, dass das
ff
Fähigkeitsselbstkonzept und die damit einhergehenden Erfolgserwartungen von Schülern
eine fächerspezifische Struktur aufweisen. Innerhalb dieser Domänen konnten
Fähigkeitsselbstbild und die subjektiven Werte faktorenanalytisch getrennt werden:
„…children appear to have distinct beliefs about what they are good at and what they
value in different achievement domains“ (Wigfield & Eccles, 2000, S. 75). Dies ist eine
notwendige Voraussetzung für das Erwartungs-Wert-Modell. In einer Längsschnittstudie
von Denissen, Zarrett und Eccles (2007) bedingen sich die Faktoren fachspezifische
Leistungsmotivation, Selbstkonzept und Interesse gegenseitig. Kurz gesagt: Schüler fühlen
sich kompetent in Gebieten, in denen sie gut abschneiden und interessierten sich für
Gebiete, in denen sie ihre persönlichen Stärken sehen. Diese Zusammenhänge nehmen
im Laufe der Jahre zu (erste bis zwölfte Klasse). Demnach macht es wenig Sinn
motivationale Konstrukte isoliert zu betrachten, sondern erfordert die Berücksichtigung
des Bedingungsgeflechts, um ein Verständnis für motivationale Prozesse zu entwickeln. In
diesem Sinne stellt die Expectancy-Value Theory of Achievement Motivation von Eccles
einen guten Ansatz dar.
Ein wichtiger Aspekt des Modells ist die Aufgabenspezifität von Erwartungs- und
Wertvariablen. Dies ist auch für die vorliegende Arbeit in Anbetracht der
fächerspezifischen Herangehensweise von Relevanz, da sich Leistungsdispositionen von
einem Leistungsbereich nicht auf die Person generalisieren lassen.
2.3.5 Anstrengungsvermeidung
Rollett hat mir der Entwicklung eines Diagnostikinstruments zur Anstrengungsvermeidung
selbigen Forschungsgegenstand entscheidend geprägt. Sie geht davon aus, dass
Anstrengungsvermeider sich in einem bestimmten Tätigkeitsgebiet nicht den von ihnen
abverlangten Leistungen stellen, sondern darauf bestrebt sind, der Anstrengung durch
„den aktiven Einsatz geeigneter Strategien“ (Rollett, 2006, S. 14) zu entgehen. Sirsch und
Jirasko (1996) verstehen Anstrengungsvermeidung als ein handlungssteuerndes Motiv,
das „Nicht-Leistung“ anstrebt mit dem Ziel, eine von anderen Personen geforderte
Leistung nicht zu erreichen. Daneben existiert eine Anstrengungsvermeidungsmotivation,
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 27
you want to appear here.
die „den negativen Folgen einer überlastenden Fixierung auf ‚Leistung um jeden Preis‘
ff
entgegenwirkt“ (Sirsch & Jirasko, 1996, S. 185)
Die Entstehung dieses Phänomens ist nach Rollett auf aversive Gefühle zurückzuführen,
die der Anstrengungsvermeider erfährt, wenn er sich mit einer Handlung in dem
spezifischen Tätigkeitsfeld auseinandersetzten muss. Bei zunehmender Belastung wird
man normalerweise zunächst seine Anstrengung intensivieren, um den Anforderungen in
diesem Bereich gerecht zu werden. Übersteigen die aversiven Gefühle dabei ein
bestimmtes Ausmaß, so wird man seine Leistungsbemühungen reduzieren, um den
Organismus vor Überlastung zu schützen. Die empirischen Befunde von Schönpflug (1983,
zitiert nach Rollett, 2006) deckten sich mit diesem theoretischen Ansatz.
Übt die soziale Umwelt Druck auf den Anstrengungsvermeider aus und verhindert so,
dass er der Konfrontation mit dem als aversiv erlebten Tätigkeitsfeld umgeht, kann sich
daraus ein langfristiges Anstrengungsvermeidungsmotiv entwickeln. Auf den schulischen
Kontext bezogen könnte dies bei einem Schüler passieren, der schlechte Mathenoten
erhält und von den Eltern dazu gezwungen wird, sich mit mathematischen Aufgaben zu
beschäftigen. Da es keine Möglichkeit gibt der aversiv belegten Tätigkeit dauerhaft zu
entgehen, wird der Schüler die unangenehmen Anstrengungen im mathematischen
Bereich reduzieren, indem er sehr schnell und oberflächlich arbeitet (desorganisierter
Arbeitsstil), um das geforderte Ziel ohne Qualitätsanspruch zu erreichen. Oder er
entwickelt einen apathischen Arbeitsstil, bei dem die langsame Vorgehensweise dazu
führt, dass er nur einen Teil des Geforderten erledigt.
Anstrengungsvermeidung tritt nach den Beobachtungen von Rollett bereichsspezifisch
auf. Eine Studie von Rollett und Bertram (1974, zitiert nach Sirsch & Jirasko, 1996, S. 188)
kommt zu einer negativen Korrelation zwischen Anstrengungsvermeidung und
Leistungsmotivation von -.33. Zu Furcht vor Misserfolg wird ein niedriger positiver
Zusammenhang von .26 (Jopt, 1982, S. 330) berichtet.
2.4 Vorausgehende vergleichbare Studien
Auf den vorhergehenden Seiten wurden die für meine Studie relevanten psychologischen
Konstrukte erläutert und ihr Bezug zur Schulleistung beleuchtet. Es gibt zwar eine Vielzahl
von Studien, die den Zusammenhang zwischen jeweils einem Konstrukts und der
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 28
you want to appear here.
Schulnote untersuchen – jedoch ohne den Einfluss der anderen Variablen zu
ff
berücksichtigen. Die daraus resultierende Überschätzung der Vorhersageleistung und
eine möglich Lösung dieses methodischen Problems wurde in Abschnitt 2.1.2
angesprochen. Es gibt nur einige wenige Studien die der Fragestellung nachgehen, ob
motivatonale Variablen zur Vorhersage von Schulleistung beitragen, wenn der Einfluss der
Allgemeinen Intelligenz kontrolliert wird. Hinter diesem Ansatz steht die Vermutung, dass
bei Nichtbeachtung der Allgemeinen Intelligenz die konfundierte Varianz von kognitiven
und motivationalen Variablen letzteren zugeschrieben wird. Es wäre sogar denkbar, dass
motivationalen Konstrukten so eine prädiktive Kraft zugesprochen wird, obwohl sie
eigenständig – also ohne einen eigenen spezifischen Varianzanteil – nicht zur Vorhersage
von Schulerfolg beitragen. Auf den folgenden Seiten stelle ich vier Studien vor, die bei der
Vorhersage des Schulerfolgs sowohl kognitive, als auch motivationale Konstrukte
erfassen.
2.4.1 Sauer und Gattringer (1986)
Im Rahmen einer Querschnittuntersuchung erhoben Sauer und Gattringer (1986) an 651
Viertklässlern aus Salzburg Daten mit dem Ziel, die Schulleistung vorherzusagen. Dieses
Kriterium wurde über die gemittelten Schulnoten der Hauptfächer (Deutsch, Lesen,
Rechnen,
Sachunterricht),
sowie
über
die
Leistung
eines
standardisierten
Schulleistungstests erfasst. Auf Seiten der Prädiktoren trennten Sauer und Gattringer
zwischen kognitiven und motivationalen Variablen. Die Intelligenz wurde mit dem PSB
(Prüfsystem für Schul- und Bildungsberatung) und dem Zahlen-Verbindungs-Test erfasst.
Die motivationalen Faktoren setzten sich aus den Skalen Hoffnung auf Erfolg, Furcht vor
Misserfolg und Furcht vor sozialen Konsequenzen bei Misserfolg, sowie der
Attributionsvoreingenommenheit zusammen.
Nach der Auswertung der Daten liegt der Anteil an aufgeklärter Varianz für das Kriterium
Schulnoten mit 49.1 Prozent knapp zehn Prozentpunkte über dem aufgeklärten
Varianzanteil (von 39.9 Prozent) der abhängigen Variable Schulleistungstest. Mit dem
Schulleistungstest als Kriteriumsvariable werden durch die Intelligenz 24.8 Prozent und
durch die Motivation 3.4 Prozent spezifisch aufgeklärt, bei einer Kommunalität von 10.7
Prozent. Bezogen auf die Schulnote erkennt die Kommunalitätenanalyse bei der
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 29
you want to appear here.
Intelligenz einen spezifischen Varianzanteil von 30.7 Prozent, gegenüber einer Spezifität
ff
von 5.1 Prozent für die Motivation, bei einer konfundierten Varianz von 13.3 Prozent. Es
zeigt sich also, dass die Intelligenz alleine etwa sechsmal soviel Varianz aufklärt wie die
spezifische Motivation. Die Kommunalitäten machen etwa ein Viertel der aufgeklärten
Varianz aus.
Von Besonderem Interesse ist für meine Untersuchung der Einsatz des ZVT. Er korreliert
in der Untersuchung von Sauer und Gattringer zu .41 mit den Schulnoten und kann den
durch den PSB aufgeklärten Varianzanteil geringfügig inkrementell steigern. Bei den
Leistungsmotivationsskalen ist die Skala Furcht vor Misserfolg mit einer Korrelation von
.28 zur Schulleistung für die prädiktive Kraft verantwortlich, während bei Hoffnung auf
Erfolg kein Zusammenhang zum Schulerfolg zu erkennen ist.
2.4.2 Helmke (1992)
Helmke (1992) unterscheidet bei seiner methodisch anspruchsvollen Langzeitstudie bei
der Vorhersage des Schulerfolgs in Mathematik über kognitive und motivationale
Prädiktorvariablen zwischen Schulleistungstests und Schulnoten als Kriteriumsvariable. Er
sammelt in einem Zeitraum von Anfang der 5. bis zum Ende der 6. Klasse an insgesamt
vier Zeitpunkten an 813 Hauptschülern Daten. Als Prädiktorvariablen dienen die
Allgemeine Intelligenz, erfasst über drei Subtests des Kognitiven Fähigkeitstests, sowie
das leistungsbezogene Selbstkonzept in Mathematik, dessen Items auf einer fünfstufigen
Skala beantwortet wurden. Neben dem Selbstkonzept erfasst Helmke sechs weitere
motivationale Variablen.
Die erfassten Prädiktorvariablen klärten zusammen 76.9 Prozent der Mathenote auf,
gegenüber 70.4 Prozent im Mathetest. Die Anteile der spezifischen und konfundierten
Varianzen sind in Tabelle 2.1 eingetragen. Beim Vergleich der Werte der beiden
Kriteriumsvariablen fällt auf, dass die größte Spezifität bei der Mathenote von der
Motivation gestellt wird (31.9 Prozent), während beim Mathetest die Intelligenz den
größten spezifischen Beitrag leistet (21.0 Prozent).
Tabelle 2.1 – Vergleich spezifischer und gemeinsamer Varianzanteile der Helmke-Studie (1992, S. 152)
Kriteriumsvariable
Aufgeklärte
Gesamtvarianz
Spezifität der
Motivation
Konfundierte
Varianz
Spezifität der
Intelligenz
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 30
ff
Mathenote
Mathetest
76.9
70.4
31.9
16.3
40.8
33.1
4.2
21.0
Anmerkung: Prognose mit Daten Anfang der 5. Klasse für die Mathematikleistung Ende der 5. Klasse.
Alle Angaben in Prozent. Der höhere Wert ist beim Vergleich der Kriteriumsvariablen fett gedruckt.
Das leistungsbezogene Selbstkonzept ist das mit Abstand vorhersagestärkste der sieben
erfassten Motivationsskalen. Dabei ist der prognostische Wert bei der Mathenote (R² =
.46) als Kriteriumsvariable höher, als beim Mathetest (R² = .26). Gefolgt von Variablen der
fachunspezifischen Kompetenz und des allgemeinen Selbstwertgefühls (Note als
Kriterium). Das leistungsbezogene Selbstkonzept teilt mit den anderen motivationalen
Variablen eine substantielle Kommunalität (R² = .16 Note, .11 Test), dabei ist seine
Spezifität (R² = .29 Note, .19 Test) etwa doppelt so hoch. Daraus folgt, dass das
leistungsbezogene Selbstkonzept über die Hälfte der Varianz der motivationalen
Variablen abdeckt.
2.4.3 Gagné und St Père (2001)
Gagné und St Père (2001) stellten sich die Frage: „When IQ is controlled, does motivation
still predict achievement?“ An der Studie nahmen 208 (bei einer Teilnahmequote von 58
Prozent) Schülerinnen zwischen 12 und 14 Jahren der achten Klasse einer privaten
Mädchen-High-School bei Montreal teil. Sie absolvierten die Intelligenztests „Raven’s
Progressive Matrices“ und „Otis-Lennon Mental Ability Test“ und schnitten größtenteils
überdurchschnittlich ab. Außerdem füllten sie zweimal im Semester einen Fragebogen
aus, der Intrinsische Motivation, Extrinsische Motivation und Persistenz auf einer
siebenstufigen Likertskala erfasste. Ein Elternteil und zwei Lehrer schätzten die drei
Motivationsvariablen ihrer Tochter bzw. ihrer Schülerin zum gleichen Zeitpunkt ein. Die
Kriteriumsvariable Schulleistung wurde aus dem Durchschnitt der Noten aus Französisch
(als Muttersprache), Mathe, Englisch und Geschichte berechnet.
Das Ergebnis der Untersuchung sieht die Allgemeine Intelligenz als alleinigen Prädiktor
der Schulleistung. Die Raven-Matrizen korrelieren mit .63 zum Schulerfolg, die OtisLennon-Skalen tragen einen sehr geringen Betrag zur Vorhersage des Schulerfolgs bei.
Dies führt zu einem Determinationskoeffizienten von .43 für den Effekt beider Tests über
beide Erhebungen gebündelt. Die motivationalen Variablen klären bei Selbstbeurteilung
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 31
you want to appear here.
keine spezifische Varianz auf und tragen nicht signifikant zur Vorhersage des Schulerfolgs
ff
bei. Bei der Bündelung der Effekte über die zwei Erhebungen, ergibt sich ein
Determinationskoeffizient von .43, dessen Effekt jedoch nur bei den Eltern (adj. R² = .42)
signifikant ist. Gagné liefert keine Informationen über die Höhe von spezifischen und
konfundierten Varianzanteilen.
Gagnés Entscheidung die Daten an einer privaten Mädchenschule zu erheben und so eine
hochselektive Stichprobe mit überdurchschnittlicher Intelligenz zu untersuchen erscheint
mir fragwürdig. So lassen die Ergebnisse sich nicht generalisieren und man muss sich die
Frage
stellen,
welche
motivationale
Auswirkungen
der
Besuch
einer
reinen
Mädchenschule haben könnte. Außerdem stellt sich die Frage, ob die niedrige
Teilnahmequote von 58 Prozent und die daraus resultierende kleine Stichprobe von rund
200 Versuchspersonen ausreicht, um die Daten zuverlässig zu analysieren. Es ist
anzuzweifeln, dass die Eltern die Schulleistung ihrer Tochter besser einschätzen können,
als sie selbst. Dies spricht nicht für die interne Validität der eingesetzten Fragebögen und
wirft die Frage auf, was sie inhaltlich erfassen. Auch das Ergebnis, dass motivationale
Variablen keine spezifische Vorhersageleistung besitzen, stimmt einen in Anbetracht der
empirischen Analysen von Helmke, sowie Sauer und Gattringer, kritisch.
2.4.4 Spinath et al. (2006)
Im Jahr 2006 untersuchten Spinath und Kollegen 1678 neunjährige Grundschulkinder im
Rahmen der Längsschnittstudie Twins Early Development Study (TEDS) in Großbritannien.
Die Eltern fungierten bei der Datenerhebung ihrer eigenen Kinder als Testleiter und
schickten die Unterlagen zur Auswertung zurück in die TEDS-Zentrale.
Die Allgemeine Intelligenz wurde mit Subtests der „Wechsler Intelligence Scale for
Children“ und dem „Cognitive Abilities Test 3“ erfasst und zu einer Skala aggregiert. Die
Schulleistung der Kinder wurde von ihren Lehrern auf einer fünfstufigen Skala
eingeschätzt,
gemessen
an
Bewertungsschlüsseln
nationaler
Lernziele.
Das
Fähigkeitsbezogene Selbstkonzept und die Intrinsische Motivation wurden mit jeweils
drei Items erfasst, die sich inhaltlich an den Bewertungskriterien der Lehrer orientierten.
Die Schüler gaben dabei auf einer fünfstufigen Antwortskala an, wie gut sie in dem Fach
sind, bzw. wie sehr sie sich dafür interessieren. Bei der Schulleistung, dem Selbstkonzept
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 32
you want to appear here.
und der Intrinsischen Motivation wurden die Daten spezifisch für die Fächer Mathematik,
ff
Englisch (als Muttersprache) und dem Sammelfach Naturwissenschaften abgefragt.
Die Ergebnisse der Studie lauten wie folgt: Die Prädiktorvariablen klären zusammen etwa
30 Prozent (in Naturwissenschaften etwa 20 Prozent) der Varianz der Schulleistung auf.
Intelligenz ist der beste Prädiktor, Selbstkonzept und Intrinsische Motivation tragen
inkrementell zur Aufklärung des Schulerfolgs bei. Im Fach Naturwissenschaften ist
Intelligenz jedoch der einzig relevante Prädiktor. Die Kommunalitätenanalyse schlüsselt
auf, dass das Fähigkeitsbezogenen Selbstkonzept bis zu 31 Prozent spezifisch und bis zu
24 Prozent der Varianz gemeinsam mit der Intelligenz aufklärt (im Fach Englisch). Bei der
Intrinsischen Motivation wird hingegen bis zu 14 Prozent spezifisch und bis zu 8 Prozent
gemeinsam mit der Intelligenz aufgeklärt.
Ohne Zweifel haben Spinath und Kollegen bei ihrer Untersuchung vieles richtig gemacht,
dennoch gibt es einige Dinge, die man verbessern könnte. Die größten Schwierigkeiten
sehe ich in der Tatsache, dass die Eltern bei der Datenerhebung als Versuchsleiter ihrer
eigenen Kinder fungieren. Ungeschulte, voreingenommene Versuchsleiter in einer
unstandardisierten Testsituation sind keine guten Bedingungen für die Objektivität.
Spinath arbeitet mit den Daten der TEDS und erhält so eine selektive Stichprobe. Man
muss sich die Frage stellen, ob das Vorhandensein eines Zwillings Auswirkungen auf
Selbstkonzept und Motivation hat. Ferner ist es möglich, dass über die geringe
Teilnahmequote von lediglich 60 Prozent die Stichprobe selektiv eingeschränkt ist. Die
Testautoren führt bei der Auswertung eine Kommunalitätenanalyse durch, benutzen
dabei aber neben der Intelligenz jeweils nur eine Prädiktorvariable. So erhalt man keine
Kenntnisse über die Kommunalität von Selbstkonzept und Motivation, bzw. aller drei
Prädiktorgruppen.
2.4.5 Gegenüberstellung der Studien
Die Ergebnisse der vorgestellten Studien lassen sich aufgrund der unterschiedlichen
Konzeptionen und der verschiedenen eingesetzten Testverfahren nur bedingt
miteinander vergleichen. Obwohl Helmke und Gagné ihre Daten im Rahmen einer
Längsschnittstudie erfassten, werde ich mich lediglich auf ihre Querschnittdaten (1.
Erhebungszeitpunkt) beziehen, um sie mit den Ergebnissen der beiden anderen Studien
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 33
you want to appear here.
vergleichen zu können. Tabelle 2.2 ist die stichwortartige Gegenüberstellung der
ff
Konzepte der vorgestellten Studien.
Tabelle 2.2 – Tabellarische Gegenüberstellung der Konzepte der vorgestellten Studien
Merkmal
(Schul-) Alter
Stichprobe
Sauer & Gattringer
Ende 4. Klasse
651
Schulart
Grundschule
Konzept
Erhebungen
Testdurchführung
Beurteilung
Motivation
Querschnittb
2
Geschulte Testleiter,
vormittags
Schüler
Fassetten der
Motivation
Hoffnung auf Erfolg,
Furcht vor Misserfolg,
Kausalattribution
Fassetten der
Verbal, Reasoning,
Intelligenz
Space, Speed
Betrachtungsebe Schulbezogen
ne
Kriterium
ø Deutscha, Lesen,
Note
Rechnen,
Sachunterricht
Kriterium
Standardisierter
Test
Schulleistungstest
Analyse
Kommunalitäten-
Helmke
5. bis Anfang 6. Klasse
813 (große Vielfalt
sozialer Bedingungen)
Hauptschule
Längsschnitt
4
Gagné & St Père
8. Klasse
202 (Mädchen)
Spinath
9 Jahre
1678 (Zwillinge)
Private Mädchen
High School
Längsschnitt
2
Grundschule
Querschnitt
1
Eltern (Instruktion
per Post)
Schüler
Schüler, Lehrer,
Unterrichtsbeobachtun
g
Leistungsbezogenes
Selbstkonzept und 6
weitere Variablen
Verbal, Reasoning,
Space
Mathe
Schüler, Eltern,
Lehrer
Schulbezogen
Fächerspezifisch
Mathe
ø Französischa,
Mathe, Englisch,
Geschichte
Mathe, Englischa,
„Science“
Regressions-
Kommunalitätenan
alyse mit 2
Prädiktoren
Standardisierter
Mathetest, Speed
Kommunalitäten-
Intrinsic, Extrinsic, Ability selfPersistence
perceptions,
Intrinsic Values
Verbal, Reasoning Verbal, Reasoning
a Dies ist die Muttersprache.
b Die Daten stammen aus einer Längsschnittstudie.
Sauer und Gattringer sowie Helmke unterscheiden in ihren Studien zwischen
Schulleistungstests und Schulnoten als Kriteriumsvariable. Sie berichten, dass die
Bedeutung motivationaler Variablen bei Schulnoten größer ist als bei Schulleistungstests
und dementsprechend auch der insgesamt aufgeklärte Varianzanteil. Während bei Sauer
und Gattringer die Intelligenz bei beiden Kriteriumsvariablen die größte spezifische
Varianz aufweist, besitzen bei Helmke die konfundierten motivationalen Variablen die
größte Spezifität bei der Vorhersage der Mathenote. Woran könnte das liegen? Zunächst
ist festzustellen, dass Helmke mit sieben motivationalen Konstrukten ein ziemlich breites
Spektrum abdeckt und es dementsprechend nicht verwunderlich ist, dass die einzelnen
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 34
you want to appear here.
motivationalen Aspekte inkrementell den prognostischen Wert steigern. Bei den Studien
ff
von Helmke und Spinath besitzt das Selbstkonzept den höchsten prognostischen Wert der
motivationalen Variablen. Dementsprechend fällt der Einfluss der Motivation bei Sauer
und Gattringer erheblich niedriger aus, da sie das Selbstkonzept nicht in ihr Konzept
miteinbeziehen.
Gagné verwendet Regressionsanalysen, beschränkt sich aber im Gegensatz zu seinen
Kollegen bei der Darstellung der Ergebnisse auf die Determinationskoeffizienten. Die
Gesamtvarianz, die er in seiner Studie aufklärt liegt verglichen mit den anderen
Ergebnissen im Mittelfeld – allerdings mit dem Unterschied, dass motivationale Variablen
praktisch
keinen
eigenen
prognostischen
Wert
besitzen.
Da
er
keine
Kommunalitätenanalyse durchführt, erfährt man nichts über den gemeinsamen
Varianzanteil von kognitiven und motivationalen Variablen. Persistenz korreliert als
einzige motivationale Variable niedrig mit den Schulnoten. Selbst das fehlende
Selbstkonzept als Prädiktor reicht nicht als Erklärung aus, wieso motivationale Variablen
bei Gagné keinen signifikanten Einfluss ausüben. Zum Vergleich: Bei Spinath beträgt der
spezifische Varianzanteil intrinsischer Variablen zur Vorhersage der Mathenote 7 Prozent,
bei einer Kommunalität von 14 Prozent.
Tabelle 2.3 – Tabellarische Gegenüberstellung der Ergebnisse der vorgestellten Studien
Merkmal
Sauer & Gattringera
Aufgeklärte Gesamtvarianz
49
Spezifität Intelligenz
31
Spezifität Motivationale
5
Variablen
Konfundierte Varianz
13
Selbstkonzept
Helmkeb
77
4
32
41
R² = .46
Gagné & St Pèrea
R² = .40
praktisch
Null
Spinathbc
32
53
25
22
R² = .15
Hinweis: Soweit nicht anders aufgeführt, sind die Angaben der Tabelle in Prozent angegeben.
a Die Angaben beziehen sich auf die Kriteriumsvariable Schulnote bzw. den Schnitt aus mehreren Fächern.
b Die Angaben beziehen sich auf die Kriteriumsvariable Mathenote.
c Die Angaben beziehen sich auf die Prädiktorvariable Selbstkonzept.
Aus den Ergebnissen der Studien lassen sich folgende Schlussfolgerungen ableiten:
Hinweis: Hinter einer Aussage ist angegeben, aus welcher/n Studien sich die Schlussfolgerung ableiten lässt.
Um zu verdeutlichen, dass dies nicht die Meinung des Autors widerspiegelt, habe ich geschweifter
Klammern {} verwendet.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 35
you want to appear here.
a) Wenn eine niedrige Korrelation zwischen Prädiktor und Kriteriumsvariable vorliegt
ff
heißt das nicht unbedingt, dass die sie auch zur Aufklärung des Kriteriums beiträgt.
{Gagné}
b) Kommunalitätenanalysen bewahren einen davor, den prognostischen Wert eines
Prädiktors zu unter- oder überschätzen, indem sie spezifische Varianzanteile sichtbar
machen. {Sauer und Gattringer}
c) Schulnoten sind bei Verwendung kognitiver und motivationaler Prädiktorvariablen
besser zu prognostizieren als Schulleistungstests. {Helmke}
d) Das liegt daran, dass bei Schulnoten als Kriterium der prognostische Wert
motivationaler Variablen größer ist. {Helmke} Dieser Befund kann mit Atkinsons
Modell des kumulativen Lernens erklärt werden, nachdem zum Erreichen langfristiger
Leistungen (wie bei Schulnoten) Motivation stärker mitverantwortlich ist, als bei
kurzfristigen Leistungen (in diesem Fall ein Schulleistungstest).
e) Das Selbstkonzept ist der stärkste Prädiktor in der Gruppe motivationaler Variablen.
{Helmke, Spinath}
f) Neben dem Selbstkonzept können weitere motivationale Variablen inkrementell zur
Vorhersage der Schulnote beitragen. Dabei ergibt sich zwischen den motivationalen
Variablen ein beträchtlicher Anteil konfundierter Varianz. {Helmke}
Mit der Spinath-Studie haben wir eine Untersuchung kennengelernt, die bei der
Vorhersage des Schulerfolgs ein zufriedenstellend weitgefasstes Spektrum kognitiver und
motivationaler Variablen miteinbezieht, kommunalitätenanalytisch vorgeht und dabei
zwischen verschiedenen Schulfächern differenziert. Eine Untersuchung mit solch einem
Versuchsplan ist mir für die gymnasiale Mittelstufe nicht bekannt. Hier setzt die
vorliegende wissenschaftliche Arbeit von Pfeiffer und Reinert an. Wir haben den
Anspruch, die kleinen Schwächen vorhergehender Studien zu verbessern und so unser
Wissen über die Spezifitäten und Kommunalitäten kognitiver und motivationaler
Variablen bei der Vorhersage des Schulerfolgs zu vertiefen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 36
ff
3 Fragestellungen und Erwartungen
3.1 Dimensionalität motivationaler und kognitiver Konstrukte
1. Fragestellung: Kann man faktorenanalytisch aus den verschiedenen IntelligenzSubtests einen gemeinsamen g-Faktor extrahieren? Ist es möglich den Generalfaktor
zu extrahieren spricht dies für die Validität der Intelligenztests, da der Generalfaktor
in vielen Untersuchungen zur Intelligenz ein g-Faktor extrahiert werden konnte.
2. Fragestellung: Welche Struktur hat das allgemeine akademische Selbstkonzept?
Gemäß früherer Studien (vgl. Rost & Sparfeldt, 2002) wird erwartet, dass nur eine
einzige Generalkomponente bei der Faktorenanalyse über die schulbezogenen
Selbstkonzeptitems extrahiert wird. Kann diese Hypothese nicht bestätigt werden,
steht dies in Konflikt mit dem Modell des hierarchischen Selbstkonzepts, das nach
Marsh und Shavelson (1985) ein konsistentes akademisches Selbstkonzept
voraussetzt.
3. Fragestellung: Welche Struktur hat das fächerspezifische Selbstkonzept? Geht man
nach den Ergebnissen früherer Studien (vgl. Rost & Sparfeldt, 2002), sollten nach einer
Hauptkomponentenanalayse
mit
Rotation
die
Selbstkonzept-Fassetten
der
Schulfächer als Komponenten zu erkennen sein.
4. Fragestellung: Ist die fächerspezifische dimensionale Struktur des Selbstkonzepts auf
andere motivationale Konstrukte übertragbar?
3.2 Vorhersage des Schulerfolgs
5. Fragestellung: Besteht ein Zusammenhang zwischen der Schulnote und den
verschiedenen kognitiven und motivationalen Variablen? Dies müsste entsprechend
vorausgehender Studien der Fall sein.
6. Fragestellung: Die meisten Studien sehen Intelligenz als den stärksten Prädiktor für
Schulerfolg. Jetzt will ich wissen, wie viel motivationale Variablen neben der
Intelligenz inkrementell zur Aufklärung des Schulerfolgs beitragen.
7. Fragestellung: Wie hoch sind die prozentualen Anteile spezifischer und gemeinsamer
Varianz an der aufgeklärten Varianz? Da ich ein relativ breites Spektrum
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 37
you want to appear here.
motivationaler Variablen abdecke, ist mit einem hohen Anteil an gemeinsamer
ff
Varianz zu rechnen (vgl. Helmke, 1992).
8. Fragestellung: Welches Konstrukt der motivationalen Variablen besitzt die beste
Vorhersageleistung? Gemäß dem Model of Achievement-Related Choices von Eccles
et al. (1983) wird erwartet, dass das Fähigkeitsselbstkonzept der stärkste Prädiktor
der motivationalen Variablen ist. Diese Tendez wurde bereits in anderen Studien
beobachtet (z. B. Spinath et al., 2006).
9. Fragestellung: Studien zufolge nimmt die Korrelation zwischen Motivation und
Schulleistung mit steigender Klassenstufe zu (Uguroglu & Walberg 1979). Demnach
müsste die prädiktive Kraft motivationaler Bedingungsfaktoren höher ausfallen als bei
Studien, die jedoch auf eine jüngere Stichprobe zurückgreifen. Insbesondere der
Vergleich mit der Untersuchung von Spinath et al. (2006) erscheint aufgrund des
ähnlichen Untersuchungsaufbaus von Interesse.
10. Fragestellung: Lässt sich die prädiktive Kraft motivationaler Variablen steigern, wenn
fächerspezifisch differenziert wird? Es wird erwartet, dass durch fächerspezifische
Unterscheidung
mehr
Varianz
aufgeklärt
Betrachtungsweise (vgl. Rost & Sparfeldt 2002).
wird
als
bei
fachübergreifender
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 38
ff
4 Methode
4.1 Angewandte Untersuchungsverfahren
In diesem Abschnitt werden die bei der Untersuchung eingesetzten psychometrischen
Tests und Fragebögen namentlich aufgeführt und auf den folgenden Seiten detailliert
beschreiben. Der genaue Aufbau des Testheftes ist in Abschnitt 4.2 dargestellt.
Um
die
Intelligenz
zu
erfassen
wurden
bestimmte
Subtests
aus
dem
„Leistungsprüfsystem“ (LPS) von Horn (1983) und dem „Intelligenz-Struktur-Test“ (IST)
von Liepmann, Beauducel, Brocke und Amthauer (2001) gezielt ausgewählt. Außerdem
kam der „Zahlenverbindungstest“ (Oswald & Roth, 1987) zum Einsatz. Die verwendeten
Subtests der Verfahren sind in Abschnitt 4.1.1 aufgeführt und beschrieben.
Neben der Intelligenz wurden motivationale Variablen mit Hilfe von Fragebögen erfasst,
deren Anwendung sich in vorhergehenden Studien bewährt hat. Es wurden also keine
völlig neuen Fragebögen gebildet oder Items generiert. Um möglichst viele motivationale
Variablen in der vorgegebenen Zeit (von zwei Schulstunden) zu erfassen, wurden die
Skalen gekürzt und modifiziert. Die Items wurden dahingehend verändert, dass die
Aussagen zunächst schulbezogen, sowie separat fächerspezifisch für die Fächer
Mathematik, Deutsch, Physik und Englisch auf einer sechsstufigen Antwortskala
einzuschätzen waren. Um das schulische Selbstkonzept zu erfassen wurde das
„Differentielle Schulische Selbstkonzept-Gitter mit Skala zur Erfassung des Selbstkonzepts
schulischer Leistungen und Fähigkeiten“ (DISK-Gitter mit SKSLF-8) von Rost, Sparfeldt und
Schilling
(2007)
herangezogen.
Außerdem
fand
das
„Schulfachspezifische
Interessengitter“ (SFSPIG) von Sparfeldt, Rost und Schilling (2004) Verwendung. Die
motivationalen Konstrukte „Hoffnung auf Erfolg“ und „Furcht vor Misserfolg“ wurden mit
einer von Lang und Fries (2006) überarbeiteten deutschen Form der „Achievement
Motives Scale” (AMS-R) untersucht. Ferner wurde der „Anstrengungsvermeidungstest“
(AVT) von Rollett und Bartram (1998) in einer gekürzten und modifzierten Version
eingesetzt. Die verwendeten Items sowie eine Beschreibung der eingesetzten
Motivationsskalen findet man in Abschnitt 4.1.2.
Zusätzlich zu den mit psychometrischen Tests gewonnenen Daten wurden die Schulnoten
aus dem letzten (Halbjahres-) Zeugnis der Fächer Mathematik, Deutsch, Physik und
Englisch, sowie Alter und Geschlecht der Schüler abgefragt.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 39
ff
4.1.1 Leistungstests
4.1.1.1 Intelligenz-Struktur-Test
Der Intelligenz-Struktur-Test 2000 R von Liepmann, Beauducel, Brocke, und Amthauer
(2001) ist ab einem Alter von 15 Jahren anwendbar. Er basiert auf einer theoretisch
fundierten und empirisch begründeten Intelligenzstruktur: Die Autoren gehen davon aus,
dass die Intelligenz hierarchisch organisiert ist und unterscheiden auf oberster Ebene
zwischen kristalliner und fluider Intelligenz, wobei die Generalfaktoren gemeinsame
Varianzanteile besitzen. Auf der untersten Ebene befinden sich zwölf verschiedenen
Aspekte der Intelligenz, wobei der modulare Aufbau des IST das Herausgreifen einzelner
Subtests und somit die gezielte Erfassung spezifischer Intelligenzfassetten begünstigt. Der
IST wird zusammen mit einer pseudoparallelen B-Form ausgeliefert. Beide Formen fanden
in der vorliegenden Untersuchung Anwendung, da die Benutzung verschiedener Formen
das Abschreiben während der Gruppentestung erschwert. In meiner Studie kamen die
Aufgabengruppen 2 (Zahlenreihen = ZR) und 5 (Analogien = AN) zum Einsatz. Bei zweiten
Subtest des IST müssen Zahlenreihen vervollständigt werden, die mathematischen
Operationen unterliegen. Es sind sieben Zahlen vorgegeben, die Achte muss
entsprechend der vorliegenden Gesetzmäßigkeit ergänzt werden. Beim fünften Subtest
geht es um Analogien. Es sind drei Wörter vorgegeben, wobei zwischen dem ersten und
dem zweiten Wort eine Beziehung besteht. Zwischen dem dritten und einem der
folgenden fünf Wahlwörter besteht eine ähnliche Beziehung. Die Versuchsperson muss
entscheiden,
welches
der
fünf
Wahlwörter
analog
am
Besten
passt.
Zur
Veranschaulichung dieses Aufgabentyps ist im IST folgende Beispielaufgabe aufgeführt:
Wald : Bäume = Wiese : ?
a) Gräser
b) Heu
c) Futter
d) Grün
e) Weide
Das Handbuch führt einige Validitätsbelege in Form von multivariaten Analysen auf und
folgert, dass die im Grundmodul angebotenen Skalen abgesichert werden konnten. Es
finden sich Zusammenhänge zu anderen Intelligenztests, die in Abhängigkeit der Skala
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 40
you want to appear here.
meist schwach oder mittel ausfallen (z. B. zum HAWIE-R finden sich Korrelationen
ff
zwischen .3 und .48). Für meine Untersuchung sind die angegebenen Korrelationen
zwischen den Skalen des Grundmodels und Schulnoten von Interesse, die allesamt
negativ, bis zu einen Maximalwert von -.45 (schlussfolgerndes Denken mit Mathematik)
reichen.
Im Manual wird für die Aufgabengruppe 2 (Analogien) bei einer gymnasialen Stichprobe
(N=1892) Cronbachs Alpha mit .68 angegeben, wobei die Trennschärfe zwischen .1 und
.41, der Schwierigkeitsindex zwischen .25 und .97 liegt. Bei der Aufgabengruppe 5
(Zahlenreihen) findet sich für dieselbe Stichprobe ein (Cronbachs) Alpha von .9, für
Trennschärfe und Schwierigkeitsindex Werte zwischen .19 und .68 bzw. .29 und .97.
4.1.1.2 Leistungsprüfsystem
Das
Leistungsprüfsystem
(LPS)
von
Horn
(1983)
basiert
auf
Thurstones
Primärfaktorenmodell und ist in einem Altersbereich zwischen 9 und 50 Jahren
anwendbar. Der Intelligenztest erfasst über insgesamt 14 Subtests 7 – der Theorie nach
unabhängige – Primärfaktoren der Intelligenz. In der vorliegenden Studie wurden lediglich
die Subtests 1 und 2 (verbal comprehension), 4 (reasoning), sowie 7 und 9 (space)
verwendet. Um das Abschreiben zu erschweren, wurden für den LPS 1+2 (Reihenfolge: 1.
Item LPS1, 1. Item LPS2, 2. Item LPS1 …), sowie für den LPS 4 (Itemreihenfolge: 1, 3, 2, 4…)
eine pseudoparallele B-Form generiert.
Beim LPS 1+2 erhält der Proband Wörter vorgegeben, bei denen jeweils genau ein
Buchstabe falsch geschrieben ist. Die Aufgabe des Probanden besteht darin, den
Rechtschreibfehler zu markieren. Es sei angemerkt, dass die fehlerhaften Buchstaben
klangliche Ähnlichkeiten zum „richtigen“ Buchstaben aufweisen. So wurde beispielsweise
ein „t“ durch ein „d“, oder ein „w“ durch ein „v“ ersetzt. Auch beim LPS 4 geht es darum
den Fehler in einer Zeile zu identifizieren und zu markieren. Damit der Proband dies
erfolgreich bewerkstelligen kann, muss er die Gesetzmäßigkeit erkennen, die in der
Reihenfolge aus Zahlen und Buchstaben steckt. Der LPS 7 besteht aus Zeilen zu je fünf
Buchstaben bzw. Zahlen. Jedes dieser Schriftzeichen ist in einem beliebigen Winkel
rotiert, eine einziges wurde zusätzlich gespiegelt. Der Proband soll das gespiegelte
Zeichen in jeder Zeile markieren. Beim LPS 9 wird die Versuchsperson mit soliden
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 41
you want to appear here.
dreidimensionalen Körpern konfrontiert. Aufgabe ist es, die Anzahl der Oberflächen zu
ff
zählen und die entsprechende Nummer anzukreuzen.
Die Retest-Reliabilität ist beim LPS 1+2 im Handbuch mit .94 (ermittelt mit 91
erwachsenen Männern) angegeben, beim LPS 4 mit .77. Für die Untertests 7 und 9 findet
man Werte von .61 bzw. .75. Die nach der Spearman-Brown‘schen Formel korrigierten
Halbierungszuverlässigkeiten der Untertests liegen über .88 (nach Tent, 100 Kinder, 4.
Klasse). Zwischen dem LPS und dem IST besteht eine Korrelation von .74 (N=37,
vorwiegend männliche Studenten; Groffmann & Schneevoigt, 1964).
Horn weist darauf hin, dass der LPS „die üblichen Schulleistungen nur begrenzt erfasst“
(1983, S. 21). Insbesondere die Aufgabengruppen 7 bis 10 korrelieren nur niedrig mit der
Schulleistung (r = .16 mit Lehrerurteil, N=175, 4. Volksschuljahr). Bei Gymnasiasten (N=74)
sind jedoch bei den Untertests 1+2 mittlere Korrelation zu Schulnoten zu verzeichnen: zu
Deutsch mit .47, zu Mathematik mit .44 und zu Fremdsprachen mit .36. Laut dem Manual
stellte Aurin signifikante (bei Gymnasiasten höhere) Korrelationen zwischen den Noten in
Deutsch bzw. Englisch und den Untertests 1+2 und 4 fest.
4.1.1.3 Zahlenverbindungstest
Der Zahlenverbindungstest (ZVT) von Oswald und Roth (1987) ist ein spezifischer
Intelligenztest und dient der Ermittlung der „kognitiven Leistungsgeschwindigkeit“, sowie
der Konzentrationsfähigkeit. Die Messung von Wahlreaktionszeiten erfordert weder eine
sprachliche Leistung noch eine dem Alter angepasste Aufgabenstruktur und ist ab einem
Alter von 8 Jahren verwendbar. Der ZVT kann als Einzel- oder Gruppentest durchgeführt
werden. Bei Letzerem wird ein Zeitlimit (ab 10 Jahren von 30 Sekunden je Matrix) gesetzt
und man schaut, wie weit der Proband gekommen ist. Die Aufgabe besteht darin Zahlen
nacheinander in numerisch aufsteigender Reihenfolge von 1 bis 90 miteinander zu
verbinden. Dabei ist die nächsthöhere Zahl jeweils in unmittelbarer Nachbarschaft der
vorherigen Zahl zu finden. Es gibt vier Durchläufe des Tests mit unterschiedlichen
Matrizen.
Der ZVT zeichnet sich durch eine hohe Zuverlässigkeit aus. Bei der Testwiederholung nach
6 Wochen (N=96, 14-jährige Gymnasiasten) wird eine Retest-Reliabilität von .94, nach 6
Monaten von .85 angegeben. Nach dem Manual liegen die Korrelation des ZVT zu
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 42
you want to appear here.
umfassenden Intelligenztests bei mindestens -.69 (ZVT Zeit und IST, N=40; ZVT Zeit und
ff
PSB, N=90, Durchschnittsalter=14.3). Rindermann und Neubauer (2000) berichten, dass
sich bei Hinzunahme der Informationsverarbeitungsgeschwindigkeit zur Intelligenz in
schrittweisen Regressionsanalysen die Prognosekraft für den Notenschnitt bedeutsam
erhöht. Oswald und Roth (1978, zitiert nach Sauer & Gattringer, 1986, S. 239) ermittelten
in einer Untersuchung – unter anderem an Gymnasien – niedrigere Korrelationen von .3
zur Schulleistung. In der Studie von Sauer & Gattringer (1986) trug der ZVT inkrementell
zur Vorhersage von Grundschulnoten bei, jedoch war der spezifische Varianzanteil zu
gering, um von praktischer Bedeutung zu sein.
4.1.1.4 Konzept bei der Auswahl der Leistungstests
Bei der Auswahl der Subskalen der Leistungstests wurde viel Wert darauf gelegt,
möglichst viele Aspekte der Allgemeinen Intelligenz möglichst reliabel in der kurzen
vorgegebenen Zeit zu erfassen. Da kein „umfassender“ Intelligenztest all diese Kriterien
erfüllt, wurden Subtests aus verschiedenen Instrumenten der Intelligenzdiagnostik
entnommen. Die verwenden Subtests enthalten verbales, numerisches, sowie figuralräumliches Material. Dabei profitiert die Versuchsperson neben sprachlichen und
mathematischen Fähigkeiten von schlussfolgerndem Denken und einer hohen
Verarbeitungsgeschwindigkeit. Es bleibt anzumerken, dass durch das Zeitlimit bei den
Aufgabengruppen eine schnelle Vorgehensweise nicht nur beim ZVT von Vorteil ist.
Personen, die sich nicht an einem Stimulus „festbeißen“, sondern ein schwieriges Item
auslassen und zum Nächsten übergehen sparen so Zeit und können dadurch einen
höheren Testwert erreichen.
Verbal
Numerisch
Figural-räumlich
Verarbeitungsgeschwindigkeit
Sprachliche
Mathematische Schlussfolgernd
Fähigkeiten
Fähigkeiten
es Denken
LPS 1 + 2
IST AN
IST ZR
LPS 4
ZVT
LPS 7, LPS 9
Abbildung 4.1 – Tabellarische Kategorisierung der verwendeten Leistungstests nach Materialart (Zeilen)
und Fähigkeitsausrichtung (Spalten)
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
4.1.2 Motivationsskalen
Seite 43
ff
4.1.2.1 Differentielles Schulisches Selbstkonzept-Gitter mit Skala zur Erfassung
des Selbstkonzepts schulischer Leistungen und Fähigkeiten
Zur Erfassung des schulbezogenen Selbstkonzepts wurde eine auf fünf Items gekürzte
Fassung der „Skala zur Erfassung des Selbstkonzepts schulischer Leistungen und
Fähigkeiten“ (SKSLF) von Rost und Lamsfuß (1992) verwendet. Die Items stammen
ursprünglich aus dem Fragebogen „Self-Concept as a Learner“ (SCAL) von Waetjen (1985,
zitiert nach Lamsfuß & Rost, 1993) und der SIQ-Subskala „Leistungsselbstkonzept“ von
Seiffge-Krenke (1985, zitiert nach Lamsfuß & Rost, 1993). Zur Dimensionierung der
entliehenen 54 Selbstkonzept-Items wurde eine Hauptkomponentenanalyse mit
anschließender Varimax-Rotation durchgeführt. Mithilfe von Markiervariablen wurden
die Items inhaltlich analysiert und so die Anzahl auf zehn Items reduziert. Aus ihnen
wurde die SKSLF gebildet, die 2002 von Rost und Sparfeldt weiterentwickelt wurde als ein
„Verfahren zur Messung des differentiellen Selbstkonzepts schulischer Leistungen und
Fähigkeiten“, um neben dem „allgemeinen akademischen Selbstkonzept“ auch
„schulfachspezifische Selbstkonzepte“ zu erfassen. Das Paket wurde unter dem Namen
„Differentielles
Schulisches
Selbstkonzept-Gitter
mit
Skala
zur
Erfassung
des
Selbstkonzepts schulischer Leistungen und Fähigkeiten“ (DISK-GITTER mit SKSLF-8) 2007
von Rost, Sparfeldt und Schilling veröffentlicht.
In der aktuellen Fassung besteht die SKSLF aus acht Aussagen, wobei man zwischen Items
trennen kann die eher fähigkeitsbezogene (Item 2 bis 5) oder eher leistungsbezogene
Aspekte (Item 6 bis 8) erfassen (Item 1 erfasst beide Aspekte). Bei der vorliegenden
Studie kamen das erste Item, sowie die Items fünf bis acht zum Einsatz.
Die Items der SKSLF bestehen aus Aussagen, die sich eindeutig auf die Schule beziehen
(„in der Schule“) und auf einer Ratingskala einzustufen sind. Dabei reicht die Skala von
einem Zahlenwert von eins („trifft gar nicht zu“) bis sechs („trifft genau zu“). Die Aussagen
sind beim Disk-Gitter bis auf eine Ausnahme identisch: Bei der Erfassung
schulfachspezifischer Selbstkonzepte wird der Ausdruck „in der Schule“ durchgängig
durch einen Freiraum („in …“) ersetzt. Der Schüler setzt dort in Gedanken „in
Mathematik“ oder ein beliebiges anderes Fach analog ein. Die Aussagen sind beim DISKGitter tabellarisch angeordnet: jedes Item erhält eine eigene Zeile, jedes Schulfach eine
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 44
you want to appear here.
eigene Spalte. Somit kann der Schüler eine große Anzahl von fachspezifischen Aussagen
ff
sehr platzsparend bewerten.
Das Disk-Gitter kann als Einzel-, oder als Gruppentest durchgeführt werden und eignet
sich für Gymnasial- und Realschulklassen der siebten bis zehnten Klassenstufe. Die
Bearbeitungsdauer wird für beide Verfahren (SKSLF-8 und DISK-Gitter) mit unter 10
Minuten angegeben. Die Retest-Reliabilitäten der verschiedenen Selbstkonzeptfassetten
schwanken in Abhängigkeit der Selbstkonzeptfassetten und der vergangener Zeit (vier bis
sechs Wochen) zwischen .70 und .90. Cronbachs Alpha liegt für die SKSLF-8 bei .81, für
das DISK-Gitter bei .91. Für die Validität des Verfahrens spricht die empirisch belegte
fächerspezifische Faktorenstruktur, sowie die hohen Korrelationen (SDQ zu DSIK-Gitter,
Mathe .92, Deutsch .85) zu korrespondierenden Verfahren und die mittleren
Korrelationen zur Schulnoten (Schilling et al., 2004, S. 25).
Verwendete Items des DISK-Gitters
1)
Ich weiß in … die Antwort auf eine Frage schneller als die Anderen.
2)
Es fällt mir in … leicht, Probleme zu lösen.
3)
In … fallen mir gute Noten zu.
4)
Ich gehöre in … zu den Guten.
5)
Ich habe ein gutes Gefühl, was meine Arbeit in … angeht.
Hinweis: In das leere Feld wird das spezifische Schulfach oder „in der Schule“ eingesetzt.
4.1.2.2 Schulfachspezifisches Interessengitter
Sparfeldt,
Rost
und
Schilling
veröffentlichten
2004
das
schulfachspezifische
Interessengitter (SFSPIG) mit der Intention, einen ökonomischen Fragebogen mit
moderner Sprachgestaltung zur simultanen Erfassung schulfachspezifischer Interessen bei
Jugendlichen zu entwickeln. Die Itemgenerierung erfolgte nach Sparfeldt et al. (2004) „auf
dem Hintergrund einschlägiger Studien“ (S. 215), wobei die Items 5, 7 und 8 am
„Fragebogen zum Studieninteresse“ (FSI, von Schiefele, Krapp, Wild & Winteler, 1993)
angelehnt
sind.
Das
schulfachspezifische
Interessengitter
berücksichtigt
nicht
verschiedene theoriebasierte Aspekten von Interesse, da diese in Untersuchungen hoch
untereinander korrelieren (Eccles, Barber, Updegraff & O’Brien, 1988, zitiert nach
Sparfeldt et al., 2004).
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 45
you want to appear here.
Der Aufbau orientiert sich am DISK-Gitter und enthält acht Items, die in tabellarischer
ff
Form dargeboten werden. Dabei steht in jeder Zeile eine neue Aussage, die separat für
jedes der Fächer in den Spalten bewertet werden soll. Die Ratingskala reicht von einem
Zahlenwert von eins („trifft gar nicht zu“) bis hin zur sechs („trifft genau zu“). In meiner
Studie kam eine leicht modifizierte und auf vier Items (Nummer 1, 4, 5, 6) reduzierte
Form der SFSPIG zum Einsatz. In einem weiteren Schritt wurden die Aussagen so
umformuliert, dass sie sich nicht mehr auf ein spezifisches Schulfach, sondern allgemein
auf die Schule beziehen.
Die Bearbeitung des Fragebogens nimmt etwa fünf Minuten in Anspruch und wurde an
einer Stichprobe von Gymnasiasten der neunten und zehnten Klasse erprobt (N = 411).
Faktorenalysen bestätigen die erwarteten Befunde, dass jedes Fach über einen Faktor
verkörper wird. Die Daten der Multitrait-Multimethod-Matrix sprechen für die
prognostizierte fächerspezifische Struktur. Die Homogenitäten (berechnet für die
unterschiedlichen Fächer) können mit einem Alpha oberhalb .92 als sehr gut bezeichnet
werden.
Verwendete Items des Interessengitters
1)
Das Fach … interessiert mich.
2)
Ich beschäftige mich gerne mit Dingen, die mit … zu tun haben.
3)
Es macht mir Spaß, Aufgaben in … zu bearbeiten.
4)
Für … zu arbeiten ist eine schöne Sache.
Hinweis: In das leere Feld wird das spezifische Schulfach oder „in der Schule“ eingesetzt.
4.1.2.3 Achievement Motives Scale
Gjesme und Nygard veröffentlichten 1970 die „Achievement Motives Scale“, die 1980 von
Göttert und Kuhl ins Deutsche übertragen wurde. Der Fragebogen thematisiert im
Original
mit
jeweils
15
Items
affektive
Erlebnisinhalte
in
verschiedenen
Leistungssituationen: positive Affekte in der Skala „Hoffnung auf Erfolg“ und negative in
der Skala „Furcht vor Misserfolg“. Da bei dem ursprünglichen Itempool das theoretisch
prognostizierte zwei-Skalen Modell faktorenanalytisch nicht bestätigt werden konnte,
veröffentlichten Lang und Fries (2006) die überarbeitete, auf 10 Items reduzierte AMS-R.
In der vorliegenden Studie wurden diese fünf Items der Skala „Hoffnung auf Erfolg“ und
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 46
you want to appear here.
die fünf Items der Skala „Furcht vor Misserfolg“ verwendet. Diese Items erhielten eine
ff
sechsstufige Antwortskala, um die Konsistenz der Motivationsskalen zu gewährleisten.
Außerdem wurden sie in eine Gitterform gebracht, um die fächerspezifische Fragestellung
zu vereinfachen.
Lang und Fries (2006) konnten für die AMS-R die erwartete zweifaktorielle Struktur
faktorenanalytisch nachweisen und kreuzvalidieren. Dabei wurden die beiden Faktoren
bei Betrachtung der Ladungsmatrix klar als Hoffnung auf Erfolg und Furcht vor Misserfolg
identifiziert. Die Korrelationen zu korrespondierenden Konstrukten und zum originalen
AMS wiesen die erwartete Richtung auf. Am höchsten war mit .40 der Zusammenhang
zwischen Furcht vor Misserfolg und Prüfungsangst (Lang & Fries, 2006, S. 222).
Verwendete Items der Skala Hoffnung auf Erfolg
1)
Ich mag Situationen, in denen ich feststellen kann, wie gut ich in … bin.
2)
Wenn mir in … ein Problem gestellt wird, das ich vielleicht lösen kann, dann reizt es mich, damit
sofort anzufangen.
3)
Situationen, in denen ich von meinen Fähigkeiten in … Gebrauch machen kann, machen mir Spaß.
4)
Mich reizen Situationen, in denen ich meine Fähigkeiten in … testen kann.
5)
Ich fühle mich in … zu Arbeiten hingezogen, in denen ich die Möglichkeit habe, meine Fähigkeiten
zu prüfen.
Hinweis: In das leere Feld wird das spezifische Schulfach oder „in der Schule“ eingesetzt.
Verwendete Items der Skala Furcht vor Misserfolg
1)
In etwas schwierigen Situationen in …, in denen viel von mir selbst abhängt, habe ich Angst zu
versagen.
2)
Es beunruhigt mich, etwas in … zu tun, wenn ich nicht sicher bin, dass ich es kann.
3)
Arbeiten in …, die ich nicht schaffen kann, machen mir Angst, auch dann, wenn niemand meinen
Misserfolg bemerkt.
4)
Auch wenn niemand zuguckt, fühle ich mich in neuen Situationen in … ziemlich ängstlich.
5)
Wenn ich in … ein Problem nicht sofort verstehe, werde ich ängstlich.
Hinweis: In das leere Feld wird das spezifische Schulfach oder „in der Schule“ eingesetzt.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
4.1.2.4 Anstrengungsvermeidungstest
Seite 47
ff
Der Anstrengungsvermeidungstest (AVT) von Rollett und Bartram (1998) dient der
Diagnose schulbezogener Anstrengungsvermeidung. Eine ausführliche Erläuterung dieses
psychologischen Konstrukts findet sich in Abschnitt 2.3.5. Eine zweite Skala ermittelt den
schulischen Pflichteifer. Der AVT kann als Gruppen- oder Einzeltest bei Schülern der
fünften bis neunten Klasse (10 bis 15 Jahre) von Haupt- und weiterführenden Schulen
durchgeführt werden. Im Original beinhaltet der Fragebogen 41 Items mit den
Antwortalternativen „stimmt“ bzw. „stimmt nicht“.
Bei der vorliegenden Untersuchung wurden der Skala Anstrengungsvermeidung acht
Items entnommen. Zunächst wurden die Fragen schulbezogen gestellt, bevor die Items in
eine dem DISK-Gitter ähnelnde Struktur gebracht wurden, um die Fragen auch
fächerspezifisch stellen zu können. Im Gegensatz zum originalen Fragebogen, sollten die
Schüler die Aussagen auf einer sechsstufigen Antwortskala bewerten, um die Konsistenz
mit den anderen Motivationsskalen zu gewährleisten.
Der AVT weist signifikante Korrelationen (zwischen .22 und .32) zu Schulnoten auf
(Pollmann, 1996, S. 197): Je stärker die Anstrengungsvermeidungstendenz ausgeprägt ist,
desto schlechter sind die Schulnoten. Rollet und Bartram (1973, zitiert Pollmann, 1996)
erklären dies damit, dass Anstrengungsvermeider weniger genau und gewissenhaft
arbeiten.
Ferner
werden
niedrige
Korrelationen
in
erwarteter
Richtung
zu
Leistungsmotivation und Furcht vor Misserfolg berichtet (Sirsch & Jirasko, 1996, S. 188).
Dies spricht für die Validität der Skala. Im Handbuch wird die interne Konsistenz der
Anstrengungsvermeidungsskala mit .80 (N = 3093 Schüler aller Schultypen) angegeben.
Verwendete Items der Skala Anstrengungsvermeidung
1)
Ich kann nichts dafür, wenn ich in … das, was ich auswendig lernen soll, nicht behalten kann.
2)
Ich habe in … oft Langeweile.
3)
In … werde ich oft nicht fertig, weil mein Nachbar mich stört.
4)
Warum soll ich am Wochenende für … lernen, wenn die anderen Leute auch nicht arbeiten?
5)
Wenn ich für … lange schreiben muss, werde ich ganz müde.
6)
Mit meinen Aufgaben in … werde ich oft nicht fertig, weil ich dazwischen zu lange nachdenken
muss.
7)
Was mich in … nicht interessiert, will ich gar nicht machen.
8)
Wenn ich in … keine Hausaufgaben aufbekäme, könnte ich in der Schule viel besser aufpassen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 48
ff
Hinweis: In das leere Feld wird das spezifische Schulfach oder „in der Schule“ eingesetzt.
4.2 Aufbau des eingesetzten Testheftes
Um ein Abschreiben bei den Leistungstests zu erschweren kamen zwei pseudoparallele
Formen des Testheftes zum Einsatz. Wie dies erreicht wurde ist bei der jeweiligen
Testbeschreibung aufgeführt. Einen tabellarischen Überblick über den Aufbau des
Testheftes mit Angaben zur Durchführungsdauer der eingesetzten Subtests und den
Unterschieden zwischen der A- und der B-Form findet man im Anhang unter M-2. Das
komplette Testheft ist unter M-3 abgedruckt.
Das Testheft besteht aus zwei getrennten Teilen zu je zehn und elf Seiten und ist auf der
Rückseite mit einer Nummer bedruckt, um die Hefte eindeutig einer Versuchsperson
zuordnen zu können. Bei der Konstruktion des Testheftes wurde Wert darauf gelegt, dass
die Leistungstests vor dem Fragebogenteil bearbeitetet werden. Ziel ist die beste Leistung
der Schüler zu erfassen, bevor ihre Konzentrationsfähigkeit abfällt. Die Unterteilung des
Heftes in zwei Teile ermöglicht das Einschieben einer fünfminütigen Pause. So wird das
reguläre Pausenintervall eingehalten, und die Schüler haben die Möglichkeit sich zu
erholen. Nach dieser Unterbrechung geht es im zweiten Teil mit Leistungstests weiter,
ehe die restlichen Fragen zu beantworten sind.
Auf dem Deckblatt des Testheftes wird darauf hingewiesen, dass die Untersuchung
anonym ist und keine Informationen an Eltern oder Lehrer weitergegeben werden. Ein
deutlich sichtbares [A] bzw. [B] macht deutlich, dass mit unterschiedlichen Formen
gearbeitet wird. Es folgt die Instruktion für die erste Aufgabe mit einem Beispiel und der
Anweisung, wie die Lösung zu markieren sei. Die Zeile „HALT! Bitte warte jetzt auf das
Zeichen zu Beginn. Vorher nicht umblättern!“ am unteren Rand des Blattes macht darauf
aufmerksam, dass das Umblättern erst auf Kommando des Versuchsleiters gestattet war.
Auf Seite zwei sind die Analogien der Subtests eins und zwei des LPS abgebildet. Seite drei
enthält Instruktionen für die auf der folgenden Seite abgedruckten Zahlenreihen aus dem
IST. Dieser alternierende Wechsel zwischen Instruktions- und Aufgabenseite wurde bei
den Leistungstests eingehalten (beim LPS 7 und LPS 9 wurde aus Gründen der Ökonomie
darauf verzichtet), um dem Versuchsleiter eine bessere Kontrolle zu ermöglichen. Auf
Seite sechs stehen die Zahlen- und Buchstabenreihen aus Subtest 4 des LPS. Seite sieben
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 49
you want to appear here.
enthält den siebten Untertest des LPS, mit einer gespiegelten Ziffer in jeder Zeile. Gefolgt
ff
vom neunten Aufgabenteil des LPS auf Seite acht, bei dem die Oberflächen geometrischer
Körper zu zählen sind. Auf Seite neun stehen fünf schulbezogene Aussagen aus der SKSLF,
sowie vier schulbezogene Aussagen aus
dem SFSPIG. Die Aussagen sind auf einer
sechsstufigen Skala (von 1 = „trifft gar nicht zu“ bis 6 = „trifft genau zu“) zu bewerten.
Dieses Antwortschema findet in dieser Form im gesamten Fragebogenteil Verwendung.
Auf Seite zehn befinden sich die Aussagen der vorhergehenden Seite, diesmal allerdings
in Gitterform und mit einer separaten Bewertung für die Fächer Mathematik, Deutsch,
Physik und Englisch.
Auf der ersten Seite des zweiten Teils des Testheftes finden sich die Instruktionen für die
Analogien aus dem IST, die auf der darauffolgenden Seite zu bearbeiten sind. Auf Seite
drei stehen Instruktionen sowie Übungsaufgaben für den Zahlenverbindungstest. Der ZVT
nimmt mit vier Durchläufen Seite vier bis sieben in Anspruch. Auf Seite acht stehen zehn
schulbezogene Aussagen aus dem AMS, sowie acht schulbezogene Aussagen aus dem
AVT. Diese acht Aussagen werden in Gitterform mit einer separaten Bewertung für die
Fächer Mathematik, Deutsch, Physik und Englisch auf Seite neun erneut dargeboten. Seite
zehn greift die zehn Aussagen des AMS von Seite acht auf und erfordert auch hier die
separate Bewertung für die vier Fächer. Auf der letzten Seite wird der Schüler darum
gebeten seine Noten des letzten Zeugnisses für die Fächer Mathematik, Deutsch, Physik
und Englisch, sowie Alter und Geschlecht anzugeben.
4.3 Datenerhebung
4.3.1 Planung der Datenerhebung
Um einen möglichst großen Datensatz zu erhalten arbeiteten Jens Pfeiffer und ich bei der
Erstellung des Testheftes und der Erhebung der Daten zusammen. Er sammelte Daten im
Großraum Marburg-Biedenkopf und Gießen in Hessen, während ich Schulen im Umkreis
von Schwäbisch Gmünd in Baden-Württemberg aufsuchte. Wir untersuchten Klassen an
Gymnasien der Jahrgangsstufe neun und zehn. Der Zeitraum der Datenerhebung lag
zwischen Februar und April 2007. Für detaillierte Informationen zur Vorgehensweise von
Jens Pfeiffer empfiehlt sich ein Blick in seine im Jahr 2007 veröffentlichte Diplomarbeit
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 50
you want to appear here.
„Be smart or try hard - Zur Bedeutung von Intelligenz und Motivation bei der Vorhersage
ff
von Schulleistungen“.
In Baden-Württemberg benötigt man für die Erhebung von Daten an Schulen die
Genehmigung des Kultusministeriums, die Unterstützung des Schulleiters, sowie die
Unterschrift der Eltern teilnehmender Schüler. Nachdem ich vom Kultusministerium in
Stuttgart die Genehmigung erhalten hatte, nahm ich telefonischen Kontakt zu den
Schulleitern auf und stellte das Projekt unter dem Titel „Wissenschaftliche Befragung zu
Motivation und Schulerfolg“ vor. Im ersten Gespräch wurden Sinn und praktische
Relevanz der Studie, sowie die wichtigsten Informationen erläutert. Diejenigen
Schulleiter, die ihre Bereitschaft zur Teilnahme an der Studie signalisierten, erhielten per
Post detaillierte Informationen und eine Kopie des Testheftes zugeschickt. Nachdem die
Schulleitung ihr Einverständnis bekundet hatte, nahm ich telefonischen Kontakt zu den
Klassenlehrern der Klassen auf, die mir von der Schulleitung zugeteilt worden waren. Ich
warb um die Unterstützung des Projektes und bat um die Mithilfe beim Einsammeln der
Unterschriften der Eltern. Die entsprechenden Informationsbriefe an die Eltern, sowie
Instruktionen für die Klassenlehrer wurden an die Schulen gesendet und dort an die
entsprechenden Lehrkräfte weitergeleitet. Bevor ich persönlich zur Schule kam um die
Daten zu erheben, erfolgte wiederholt telefonischer Kontakt mit Klassenlehrern und
Schulleitung, um den Erhebungstermin zu vereinbaren, Unklarheiten zu beseitigen und
die Motivation der Lehrkräfte aufrechtzuerhalten.
Die Informationsbriefe an die Schulleitung (M-4), Lehrer (M-5) und Eltern (M-6) können
im Anhang eingesehen werden.
4.3.2 Ablauf der Datenerhebung
Die Datenerhebung fand vormittags während der regulären Unterrichtszeit statt, um die
bestmögliche Konzentration und Motivation der Schüler zu gewährleisten. Für die
Untersuchung in der Klasse waren zwei Schulstunden zu je 45 Minuten vorgesehen. Die
eigentliche Bearbeitung des Testheftes benötigte inklusive den Instruktionen und einer
kurzen Pause 80 Minuten. Wenn ein Schüler keine Teilnahmebestätigung der Eltern
abgegeben hatte, erhielt er Aufgaben vom zuständigen Lehrer und durfte nicht an der
Befragung teilnehmen. Eine Lehrkraft war stets anwesend um die Aufsichtspflicht zu
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 51
you want to appear here.
wahren und wurde so postiert, dass die Schüler sich möglichst wenig beobachtet fühlten.
ff
Die meisten Lehrer zeigten sich interessiert in der Untersuchung, versuchten sich selbst
an den Leistungstests und blieben unauffällig im Hintergrund.
Um den Schülern das Abschreiben zu erschweren wurden sie so weit es ging auseinander
gesetzt. Außerdem kamen zwei pseudoparallele Versionen des Testhefts zum Einsatz.
Diese wurden in alternierender Reihenfolge in der Klasse durch Schüler ausgegeben. Der
Versuchsleiter bat die Schüler die Seiten lediglich auf das entsprechende Kommando hin
umzublättern und zu kontrollieren, ob die Nummer vom ersten und zweiten Teil des
Testheftes
miteinander
übereinstimmen.
Die
Testinstruktionen
wurden
in
standardisierter Form vom Versuchsleiter laut vorgelesen (die Durchführungsanweisung
befindet sich im Anhang, M-1) und einige Subtests mit Beispielen an der Tafel erläutert.
Vor jedem Testblock gab es eine Übungsaufgabe und die Möglichkeit Fragen zu stellen.
Auf das Startsignal des Versuchsleiters hin, sollten die Schüler mit der höchsten ihnen
möglichen Geschwindigkeit die Aufgaben bearbeiten. Nach Ablauf der vorgegebenen Zeit
wurden die Schüler dazu aufgefordert das Arbeiten einzustellen und den Stift hinzulegen.
Nach den ersten elf Seiten war der erste Teil des Testheftes abgeschlossen und wurde
vom Versuchsleiter eingesammelt. Es folgte eine kurze Pause von wenigen Minuten und
die Möglichkeit den Raum zu verlassen. Nach Rückkehr aller Schüler wurde der zweite Teil
nach bekanntem Schema bearbeitet. Wer mit dem Fragebogenteil fertig war konnte den
zweiten Teil des Testheftes beim Versuchsleiter abgeben und das Zimmer verlassen.
Die Datenerhebung an den Schulen verlief recht problemlos. Die meisten Schüler
arbeiteten konzentriert und strengten sich an, oder konnten durch einer Aufforderung zur
Mitarbeit motiviert werden. Das Bearbeiten der Leistungstests erforderte eine hohe
Konzentration und erzeugte einen hohen Redebedarf. Die Schüler nutzten die kurze
Unterbrechung zwischen zwei Testblöcken, um sich auszutauschen. Der Großteil der
Schüler hielt sich durchgehend an die Instruktionen des Versuchsleiters, aber besonders
beim ZVT gab es einige Probanden, die mehrmals ermahnt werden mussten. Sie konnten
es nicht erwarten, ihr Blatt erst auf Kommando hin umzublättern. Nach der Bearbeitung
des LPS 1 und 2 waren die Schüler meist aufgebracht, da sie die Aufgaben aufgrund der
knapp bemessenen Zeit nicht vollständig bearbeiten konnten. Sie ließen sich aber schnell
mit der Begründung beruhigen, dass der Test auch für höhere Schulklassen konzipiert
wurde. Dagegen schien die Zeit für das Lösen der Analogien beim IST zu großzügig
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 52
you want to appear here.
bemessen. Gegen Ende des zweiten Fragebogenblocks hatte ich den Eindruck, dass
ff
manche Schüler sehr zügig zu Werke gingen und sich bei ihrer Entscheidung nur wenig
Zeit ließen. Um die Schüler unvoreingenommen zu testen wurde das Wort
„Intelligenztest“ vermieden und stattdessen von „Denksportaufgaben“ gesprochen. Einige
Gymnasiasten, die anderweitig mit Intelligenzdiagnostik konfrontiert worden waren,
stellten schnell Ähnlichkeiten fest, so dass ich regelmäßig mit entsprechenden Fragen
konfrontiert wurde. Fragen dieser Art ließ ich zunächst unbeantwortet und verwies auf
die Möglichkeit am Ende der Untersuchung weitere Informationen zu erhalten.
4.4 Beschreibung der Stichprobe
4.4.1 Vorläufige Stichprobe
Acht Schulen aus Baden-Württemberg in der Umgebung von Schwäbisch Gmünd nahmen
an der Untersuchung teil: vier Klassen des Ernst-Abbe-Gymnasiums in Oberkochen, drei
Klassen des Hariolf-Gymnasiums in Ellwangen, drei Klassen des Kopernikus-Gymnasiums
in Aalen, zwei Klassen des Michelberg-Gymnasiums in Geislingen a. d. Steige, drei Klassen
des Peutinger-Gymnasiums in Ellwangen, zwei Klassen des Rechberg-Gymnasiums in
Donzdorf, zwei Klassen des Rosenstein-Gymnasiums in Heubach, sowie eine Klasse des
Schenk-von-Limpurg-Gymnasiums in Gaildorf. Die Klassengröße schwankt zwischen 18
und 32 Schülern. Die aufgeführten Gymnasien besitzen zwischen 500 und 900 Schüler und
liegen hauptsächlich in ländlichen Gebieten. Der daraus resultierende Datensatz
bestehend aus 483 Schülerinnen und Schülern wurde mit dem Datensatz von Jens Pfeiffer
zusammengeführt, um eine größere Stichprobe zu erhalten. Alle Angaben beziehen sich
ab hier auf diesen gemeinsamen Datensatz.
Addiert man die Klassengrößen hatten 1164 Schüler aus 44 unterschiedlichen
Schulklassen von insgesamt 16 verschiedenen Gymnasien die Möglichkeit an der
Untersuchung teilzunehmen. 16 Probanden hatten nicht die Unterschrift der Eltern dabei
und durften dementsprechend nicht teilnehmen (fünf davon hatten den Rücklaufzettel
vergessen). 42 Schüler waren zum Zeitpunkt der Datenerhebung krank, 22 weitere durch
sonstige
Gründe
(Schüleraustausch
etc.)
verhindert.
Demnach
verbleibt
eine
Stichprobengröße von 1084 Versuchspersonen, das entspricht einer Teilnahmequote von
93.1 Prozent.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 53
ff
4.4.2 Endgültige Stichprobe
Die 1084 Schüler der endgültigen Stichprobe hatten ein durchschnittliches Alter von 15.3
Jahren (SD = .76, bei 22 fehlenden Angaben), wobei die Altersspanne zwischen 13 und 18
Jahren
lag.
Die
genaue
Verteilung
ist
Abbildung
4.2
zu
entnehmen.
Die
Geschlechterverteilung war recht ausgeglichen (51.2 Prozent Mädchen). 22 Schüler
hatten keine Angaben zu ihrem Alter gemacht, dies entspricht einem Prozentsatz von
exakt zwei Prozent. An der Untersuchung hatten 547 (50.5 Prozent) Schüler der neunten,
sowie 537 (49.5 Prozent) Schüler der zehnten Klassenstufe teilgenommen.
477
500
406
400
300
200
133
100
42
2
2
22
18
K.A.
0
13
14
15
16
17
Abbildung 4.2 – Darstellung der Altersverteilung der Stichprobe
4.5 Auswertungsplan
4.5.1 Vorgehen bei der Datenaufbereitung
Die erhobenen Daten der Testhefte wurden in den Computer eingegeben, so dass
Datenmatrizen entstanden. Jeder zehnte Fragebogen (108 Stück) wurde nach der
Übertragung in die digitale Form Korrektur gelesen. Dabei wurden 59 fehlerhafte Zeichen
korrigiert, was einer Fehlerrate von .13 Prozent entspricht. Die Datenmatrizen wurden in
das Statistikprogramm SPSS importiert und dabei die pseudoparallele Version
angeglichen. Ein Großteil der Berechnungen wurde mit SPSS durchgeführt. Für kleinere
Rechenaufgaben und um das Datenmaterial ansprechender zu veranschaulichen habe ich
auf Microsoft Excel zurückgegriffen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 54
you want to appear here.
Zunächst wurden die Skalenwerte berechnet. Dazu wurden bei den Motivationsskalen die
ff
Mittelwerte aus den Rohwerten gebildet. Dieses Vorgehen erfolgte separat für jedes
Schulfach für jede Skala. Dabei wurden die Rohwerte einer Versuchsperson nicht in die
Berechnung einer Skala miteinbezogen, wenn der Proband mindestens eine Antwort in
dieser spezifischen Skala nicht angekreuzt hatte. Bei den Leistungstests wurde die Summe
der richtigen Antworten für jede Skala separat aufaddiert. Hierbei wurde nicht
unterschieden, ob die Schüler eine falsche, oder gar keine Lösung angegeben hatten.
Ausnahme bildete der ZVT, für den ein Durchschnittswert aus den vier Durchläufen
berechnet wurde. Aus den Schulnoten der vier Fächer Mathematik, Deutsch, Physik und
Englisch wurde eine Durchschnittsnote gebildet, die die allgemeine Schulleistung der
Schüler
repräsentiert.
Es
sei
angemerkt,
dass
in
Baden-Württemberg
im
Halbjahreszeugnis Leistungen mit einem Intervall von einer viertel Schulnote beurteilt
werden. Die Verteilungsform der Schulnoten wird in Tabelle 4.1 behandelt, die
klassenweise z-standardisierte Häufigkeitsverteilung für die Fächer Deutsch und Physik ist
in Abbildung 4.4 bzw. Abbildung 4.3 dargestellt.
Tabelle 4.1 – Verteilungsform der Schulnoten
Fach
Mathe
Deutsch
Physik
Englisch
Schnitt
vVpn
1084
1084
1081
1082
1079
K.A.
0
0
3
2
5
Min
1
1
1
1
1
Max
5.5
5.0
5.5
5.5
4.8
MW
2.89
2.69
2.82
2.81
2.81
SD
1.0
.77
.97
.87
.65
Schiefe
.15
.16
.12
.01
-.03
Exzess
-.67
-.30
-.53
-.51
-.29
Spaltenüberschriften: vVpn: verbleibende Versuchspersonen; Min: niedrigste Note; Max: höchste Note.
Als nächstes stand die z-Transformation der Skalenwerte an. Schulnoten und
Motivationsskalen wurden auf Klassenebene z-standardisiert um den Effekt der
Klassenzugehörigkeit auszuschalten, da Schulnoten vom klasseninternen Bezugsrahmen
abhängig sind (Tent, 2001, zitiert nach Rost & Sparfeldt, 2002).
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 55
ff
Abbildung 4.4 - Häufigkeitsverteilung der
klassenweise z-standardisierten Deutschnoten
Abbildung 4.3 - Häufigkeitsverteilung der
klassenweise z-standardisierten Physiknoten
Die Leistungstests wurden auf Ebene der Klassenstufe z-standardisiert da es keinen Grund
zur Annahme gibt, dass Intelligenz klassenspezifisch beeinflusst wird. Außerdem wurde
ein Wert für die Allgemeine Intelligenzleistung gebildet, indem der Durchschnitt aus den
z-standardisierten Werten aller Subtests der Leistungstests berechnet wurde. Es sei
angemerkt, dass wir nicht daran interessiert sind, wie die kognitive Leistung der Schüler
auf der IQ-Skala einzustufen ist, da das für den linearen Zusammenhang zur Schulnote
keinerlei Bedeutung hat.
Abbildung 4.5 - Häufigkeitsverteilung der z-standardisierten Intelligenzleistung
Aus der im Abschnitt 3 erläuterten Fragestellung ergibt sich eine grobe rechnerische
Vorgehensweise. Im Folgenden wird der chronologische Ablauf der Berechnungen
beschrieben und kurz begründet, wieso diese statistischen Analysemethoden
angewendet wurden. Eine detaillierte Beschreibung der eingesetzten Rechenverfahren
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 56
you want to appear here.
findet sich unter Abschnitt 4.6, die Ergebnisse der Berechnungen sind im Abschnitt 5
ff
aufgeführt.
Um die umfassenderen Hypothesen regressionsanalytisch überprüfen zu können, müssen
verschiedene Voraussetzungen gegeben sein. Deshalb soll zunächst die dimensionale
Struktur des akademischen, sowie des fächerspezifischen Selbstkonzepts kontrolliert
werden. Ferner interessiert mich, ob die angenommene hierarchische Struktur auf die
anderen motivationalen Skalen übertragbar ist. Aus den verschiedenen Subtests aus dem
Block der Leistungstests sollte ein einziger Faktor, der Generalfaktor extrahiert werden.
Um
die
faktorielle
Struktur
der
Skalen
zu
analysieren,
eignet
sich
die
Hauptkomponentenanalyse, wobei die extrahierten Komponenten nach dem VarimaxVerfahren rotiert werden, um die Interpretation zu vereinfachen. Ein Problem der
Faktorenanalyse besteht darin, dass es keine festen Kriterien gibt, nach denen
Komponenten
extrahiert
werden.
Deshalb
wurden
zusätzlich
Parallelanalysen
durchgeführt, die Eigenwerte aus normalverteilten Zufallsvariablen bilden. Liegen die
tatsächlichen Eigenwerte der Faktoren über den Eigenwerten der Zufallsvariablen, so ist
dies ein Hinweis für die berechtigte Extraktion dieser Faktoren.
Die Kernfrage meiner Studie beschäftigt sich mit dem linearen Zusammenhang zwischen
Schulnoten
und
verschiedenen
kognitiven
und
motivationalen
Variablen.
Die
rechnerischen Analysemethoden reagieren empfindlich auf Ausreißer, was zur
Verfälschung der Ergebnisse führen kann. Dem will ich vorbeugen, indem ich die
Ausreißer identifiziere und für die anstehenden Berechnungen aus dem Datensatz
herausfiltere. In Abschnitt werden die zur Ausreißerklassifikation angelegten Kriterien
erläutert und die aus den Berechnungen resultierenden psychometrischen Kennwerte
tabellarisch dargestellt.
Trotz sorgfältiger Auswahl der verwendeten Subtests ist nicht auszuschließen, dass
einzelne Items Artefakte messen (es wäre beispielsweise möglich, dass ein Item einen zu
hohen Schwierigkeitsgrad besitzt und nur von Schülern „gelöst“ wird, die zufälliges
Ankreuzen präferieren, anstatt es auszulassen und zum Nächsten weiterzugehen) und
dadurch die Validität der Skala mindern. Die Kontrolle über Item-Skala-Analysen bietet die
Möglichkeit solche Items zu identifizieren und aus den anstehenden Berechnungen
auszuschließen. Dazu wurden die psychometrischen Kennwerte auf Itemebene wie
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 57
you want to appear here.
Itemschwierigkeit und Trennschärfe, sowie Interne Konsistenzen auf Skalenebene
ff
berechnet. Beim LPS 1 und 2 fiel Item 83 raus, da es keine Antwortvarianz erzeugte. Beim
LPS 4 wurden bis auf zwei Ausnahmen die ersten 14 Items gestrichen, da sie geringe
Trennschärfen aufwiesen. Diese Items waren zu leicht und halfen nicht ausreichend bei
der Differenzierung zwischen den Schülern. Alle Items der übrigen Skalen (auch aus dem
motivationalen Bereich) behielten ihre Gültigkeit. Die internen Konsistenzen sämtlicher
Skalen waren in Ordnung (Cronbachs Alpha zwischen .55 und .96) und können im Detail
Tabelle 5.10 entnommen werden. Ein weiteres Augenmerk lag auf der Verteilung der
Skalen um zu überprüfen, ob die Voraussetzungen für die weiterführenden
Analysemethoden zufriedenstellend erfüllt sind.
4.5.2 Vorgehen bei der Ergebnisberechnung
Mein primäres Interesse gilt der Vorhersageleistung der erhobenen kognitiven und
motivationalen Skalen auf die Schulleistung in Form der Schulnoten des letzten Halbjahrs.
Ich berechnete eine lineare Regression mit den Skalen als Prädiktorvariablen und der
Schulnote als Kriteriumsvariable. Um die für die anstehende Kommunalitätenanalyse
benötigten Daten zu erhalten, wurden mehrere hierarchische Regressionsanalysen
gerechnet. Dabei werden die Prädiktorvariablen zu Blöcken zusammengefasst und diese
Blöcke in einer vorher festgelegten Reihenfolge als Prädiktoren hinzugefügt. Dadurch lässt
sich nicht nur der prognostische Wert der Variablen ermitteln: Man kann die
inkrementelle Varianzaufklärung der Variablen beobachten und bei mehreren
Durchläufen mit variierter Reihenfolge der Blöcke den Anteil ihrer spezifischen Varianz
herausbekommen. So erhalten wir über die Kommunalitätenanalyse die Anteile der
spezifischen Varianz, sowie den Anteil der gemeinsamen Varianz an der aufgeklärten
Varianz. Dieses Vorgehen wurde getrennt für schulbezogene Variablen, sowie jeweils
fächerspezifisch für Mathematik, Deutsch, Physik und Englisch durchgeführt.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 58
ff
4.6 Verwendete Verfahren der Datenanalyse
4.6.1 Faktorenanalyse
Die Faktorenanalyse ist ein statistisches Verfahren, mit dem man für die wechselseitige
Beziehung vieler Variablen ein einfaches Erklärungsmodell sucht (Bortz, 2005). Sie stellt
Zusammenhänge zwischen mehreren Variablen dar, indem sie diese anhand ihrer
Korrelationen in möglichst wenige, nicht überlappende Gruppen (Faktoren) aufteilt. Dabei
soll die Zusammenfassung so erfolgen, dass ein möglichst großer Teil der gemeinsamen
Varianz der Variablen erklärt und berücksichtigt wird. Es bleibt hinzuzufügen, dass ich bei
meiner Datenanalyse explorative – keine konfirmatorischen Faktorenanalysen gerechnet
habe. Dies macht deshalb Sinn, weil die Befundlage insbesondere bei den motivationalen
Variablen keine einheitlichen Ergebnisse liefert und es somit schwierig ist, das
Ladungsmuster zu schätzen. Explorative Faktorenanalysen sind als das „konservativere“
Verfahren anzusehen und sind überdies nicht so anfällig für Manipulation. Die
Faktorlösung
einer
explorativen
Faktorenanalyse
sollte
sich
auch
über
eine
konfirmatorische Faktorenanalyse finden lassen – umgekehrt ist das hingegen nicht
immer der Fall.
4.6.1.1 Hauptkomponentenanalyse
Die Hauptkomponentenanalyse (PCA von Principal Components Analysis) dient wie die
Faktorenanalyse dazu, umfangreiche Datensätze zu vereinfachen, indem eine Mehrzahl
statistischer
Variablen
durch
eine
geringere
Zahl
möglichst
aussagekräftiger
Linearkombinationen genähert wird. Es liegt die Annahme zugrunde, dass die Varianz
jeder Ausgangsvariablen vollständig durch die Faktoren erklärt werden kann, die
Kommunalität also bei Eins liegt. Da jeder Test Messfehler enthält, ist dieser Ansatz mit
einer funktionalen Interpretation von vornherein nicht vereinbar. Ziel ist hier lediglich, die
Vielzahl von Testvariablen auf einige wenige Faktoren zu reduzieren, die die in den
Testvariablen enthaltene Information möglichst gut repräsentieren. Zunächst wird der
erste Faktor (Hauptkomponente) so bestimmt, dass durch ihn ein möglichst großer Teil
der Gesamtvarianz erklärt wird. Der zweite Faktor wird dann so bestimmt, dass er
orthogonal zum ersten Faktor steht (also unkorreliert ist) und gleichzeitig einen möglichst
großen Teil der verbliebenen Restvarianz erklärt. Auf diese Weise lassen sich theoretisch
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 59
you want to appear here.
so lange Faktoren ziehen, bis ein Faktor auf jede beobachtete Variable kommt, wobei in
ff
diesem Fall auch die Gesamtvarianz vollständig erklärt wäre. Es muss also ein Kompromiss
gefunden werden zwischen dem Grad der Dimensionsreduktion und der Genauigkeit des
Modells. Es existieren keine allgemeingültigen Kriterien zur Bestimmung der Anzahl
bedeutsamer Komponenten, so dass zwei Personen bei gleicher Fragestellung zu
unterschiedlichen Ergebnissen gelangen können. Ich habe mich bei den durchgeführten
Hauptkomponentenanalysen zunächst an das Kaiser-Guttman-Kriterium (Kaiser &
Dickmann, 1959, zitiert nach Bortz, 2005) gehalten: Dabei werden nur Faktoren mit einem
Eigenwert größer als Eins extrahiert, da die Faktoren nur in diesem Fall mehr Varianz als
die ursprünglichen, z-standardisierten Variablen binden. Dieses Kriterium neigt dazu –
insbesondere bei großen Variablenzahlen – die Anzahl der Faktoren zu überschätzen.
(Bortz, 2005, S. 544) Bei diesem Datensatz lieferte es aber eine recht gute Passung zu
theoriegeleiteten Überlegungen. Zur Validierung der Befunde habe ich die Anzahl der
extrahierten Faktoren mit den Ergebnissen der Parallelanalyse (siehe Abschnitt 4.6.2)
verglichen. Die inhaltliche Plausibilität sollte die letzte Instanz bei der Auswahl der
Faktorenlösung darstellen, um eine inhaltliche Begründung gemäß der Theorie und eine
sinnvolle Interpretation zu ermöglichen.
4.6.1.2 Rotationstechniken
Wenn eine Faktorenlösung vorliegt, lassen sich durch Rotation weitere Lösungen
herstellen, die die Korrelationsmatrix genauso gut reproduzieren. Die Rotation hat zum
Ziel eine möglichst einfache, gut interpretierbare Lösung zu finden. Dazu werden die
Faktoren in eine Lage mit Einfachstruktur gebracht, so dass für jede Variable gilt: eine
möglichst hohe Korrelation mit einem Faktor und möglichst niedrige Korrelationen mit
den übrigen Faktoren. Dabei bleibt die Gesamtvarianz der Variablen erhalten, die
Transformation führt jedoch zu einer anderen Verteilung der Varianz auf die anderen
Achsen.
Man
unterscheidet
grundsätzlich
zwischen
obliquen
und
orthogonalen
Rotationstechniken. Letztere führen zu voneinander unabhängigen Faktoren, während
oblique Rotationsmethoden zulassen, dass die Faktoren interkorrelieren. In letzterem Fall
lässt
sich
die
Faktorenstrukturen
zwar
besser
interpretieren,
aufgrund
der
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 60
you want to appear here.
Interkorrelationen weisen die Faktoren jedoch „zum Teil redundante Informationen [auf],
ff
womit eine entscheidende Funktion der Faktorenanalyse, die Datenreduktion, wieder
aufgegeben wird“ (Bortz, 2005, S. 547). Die mir vorliegenden Skalen weisen
Intrakorrelationen auf, dennoch verwendete ich bei meinen Dimensionsanalysen die
Varimax-Rotationstechnik.
Er
ist
der
am
Häufigsten
verwendete
orthogonale
Rotationsalgorithmus und maximiert die Varianz der quadrierten Faktorladungen
innerhalb der Faktoren. Um den Effekt dieser methodischen Verletzung zu kontrollieren,
berechnete ich zusätzlich eine oblique Direct-Oblimin-Rotation, die aber nur
unwesentliche Änderungen der Ergebnisse erbrachte. Dies entspricht der Erfahrungen
von Gorsuch (1970, zitiert nach Bortz, 2005, S. 548), der in einer Vergleichsstudie
berichtet, „dass die Varimax-Rotation zu ähnlich interpretierbaren Ergebnissen führt wie
die am häufigsten eingesetzten obliquen Rotationstechniken.“ Und Rost (2005, S. 168)
meint, „im Zweifelsfall ist eine orthogonale Lösung, da sie sparsamer ist und ihre
Resultate weniger stichprobenspezifisch sind, einer korrelierten vorzuziehen.“
4.6.2 Parallelanalyse
Bei der Parallelanalyse nach Horn (1965) vergleicht man den tatsächlich ermittelten
Eigenwertverlauf mit dem Eigenwertverlauf der Korrelationen zwischen zufällig
generierter normalverteilter Variablen. Grafisch lässt sich das mit einem Screeplotähnlichen Diagramm veranschaulichen, in das man die beiden Eigenwertverläufe
einzeichnet. Die Interpretation spricht denjenigen Eigenwerten Bedeutung zu, die vor
dem Schnittpunkt der beiden Eigenwertverläufe liegen. Zur Berechnung der
Parallelanalyse verwendete ich eine vorgefertigte Syntax für SPSS von O’Connor (2000).
4.6.3 Item- und Reliabilitätsanalyse
4.6.3.1 Item- und Skalenkennwerte
Im Rahmen der Item- und Skalenanalyse wurden folgende psychometrische Kennwerte
berechnet: korrigierte Trennschärfe, Itemschwierigkeit, Mittelwert (MW), kleinster
Skalenwert (Min), größter Skalenwert (Max), Standardabweichung (SD), Schiefe und
Exzess. Die Trennschärfe gibt die korrigierte Korrelation eines Items mit der
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 61
you want to appear here.
entsprechenden Skala wieder und ist ein Maß für die skalenbezogene Validität des Items.
ff
Hohe Trennschärfen stellen sicher, dass alle Items einer Skala dasselbe Merkmal erfassen.
Die Itemschwierigkeit (oder auch Schwierigkeitsindex) gibt bei dichotomen Merkmalen
den Prozentsatz an Personen wieder, die dieses Item richtig beantwortet haben. Um das
gesamte Leistungsspektrum eines Merkmals zu erfassen, sollte ein Test hauptsächlich
Items mittlerer Schwierigkeit beinhalten, aber auch einige Items mit „extremen“
Lösungswahrscheinlichkeiten einschließen. Sehr schwierige oder sehr leichte Items klären
Varianz im oberen bzw. unteren Leistungsbereich auf und differenzieren zwischen sehr
guten bzw. sehr schlechten Versuchspersonen.
4.6.3.2 Interne Konsistenz
Die Interne Konsistenz wurde durch die Berechnung von Cronbachs Alpha (Cronbach,
1951) geschätzt. Dabei wird Alpha (α) von der Zahl der Items und allen bivariaten
Korrelationen zwischen den Items beeinflusst. Alpha kann – bei perfekter Konsistenz – ein
Maximum von Eins erreichen, je kleiner der Wert, desto geringer ist die Konsistenz der
Skala. Interne Konsistenz bedeutet, dass die einzelnen Items mit der Gesamtheit der
übrigen Items zusammenhängen, und gilt als Maß der Homogenität der Skala. Cronbachs
Alpha schätzt die untere Grenze der wahren Reliabilität.
4.6.3.3 Klassifikation
Eine generelle Beurteilung der Höhe von Testkennwerten ist schwierig, da diese in den
meisten Fällen kontextabhängig sind. Wie zum Beispiel der Art des verwendeten Tests,
oder die Größe der Stichprobe. Dennoch ist eine Einigung auf sprachlicher Ebene
erforderlich, um ein Verständnis zwischen verschiedenen Lesern zu gewährleisten. Die
Richtlinien bezüglich der Höhe von Testkennwerten sind Fisseni (2004) entnommen und
sind in Tabelle 4.2 niedergeschrieben.
Tabelle 4.2 – Beurteilung der Höhe von Testkennwerten
Kennwert
Schwierigkeit
Trennschärfe (korrigiert)
Reliabilität: Retest
Cronbachs Alpha
Kürzel
p
ritc
rtt
α
Niedrig
> .8
< .3
< .8
< .8
Mittel
.8 – .2
.3 – .5
.8 – .9
.8 – .9
Hoch
< .2
> .5
> .9
>.9
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 62
ff
nach Weise (1975, zitiert nach Fisseni, 2004, S. 80)
4.6.4 Produkt-Moment-Korrelation
Der Korrelationskoeffizient nach Pearson spiegelt den linearen Zusammenhang zwischen
zwei intervallskalierten Variablen wieder, unabhängig davon in welcher Einheit die Werte
angegeben sind. Der Wertebereich erstreckt sich von minus bis plus Eins, wobei bei plus
eins ein perfekter positiver, bei minus eins ein perfekter negativer Zusammenhang
vorliegt. Je näher der Korrelationskoeffizient an Null liegt, desto geringer ist der lineare
Zusammenhang.
Die Produkt-Moment-Korrelation stellt die Basis für eine Vielzahl psychometrischer Werte
und multivariater Analysemethoden dar, wie beispielsweise der Trennschärfe, dem
Determinationskoeffizienten
oder bei der Faktorenanalyse. Arbeitet
man
mit
Korrelationen, sollte die Betrachtung von Ausreißerwerten nicht außer Acht gelassen
werden, da Korrelationen davon stark beeinträchtigt sein können, so Bühner (2006). Das
heißt, je nach Lage der Ausreißer, kann sie überhöht oder zu gering ausfallen. Nach
Brosius (2002, S. 501) spricht man ab .2 von schwachen, ab .4 von mittleren, ab .6 von
starken und ab .8 von sehr starken Korrelationen. Abhängig von der Fragestellung,
können auch schon geringe Korrelationen von Bedeutung sein.
4.6.5 Hierarchische Regressionsanalyse
Die hierarchische Regressionsanalyse ist eine spezielle multiple lineare Regression und
ermöglicht Untersuchungen über den Erklärungsbeitrag inhaltlich strukturierter
Merkmalsmengen. Es wird untersucht, inwieweit sich die verschiedenen Merkmalsblöcke
(Gruppen von Unabhängigen Variablen) auf das Kriterium auswirken. Dabei werden die
Prädiktorvariablen auf Grundlage von theoriebasierten Überlegungen a-priori zu Blöcken
zusammengefasst und diese Blöcke in einer festgelegten Reihenfolge nacheinander in die
Regressionsrechnung aufgenommen. Man beobachtet, wie hoch der Anstieg des
Determinationskoeffizienten (R²) ausfällt und erhält so Aufschluss über die inkrementelle
Varianz des spezifischen Merkmalsblocks.
Voraussetzung für die multiple Regression sind intervallskalierte und normalverteilte
Variablen. Es muss ein linearer Zusammenhang zwischen Prädiktorvariablen und
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 63
you want to appear here.
Kriteriumsvariable bestehen. Ferner darf die Abhängigkeit der Prädiktorvariablen
ff
untereinander nicht zu groß sein („moderate to high intercorrelations“, Stevens, 2002, S.
76), um Multikollinearität zu vermeiden. Dies hat nach Stevens (2002) zur Folge, dass die
Höhe des Determinationskoeffizienten stark limitiert ist, da die Prädiktoren beim
Kriterium denselben Anteil an Varianz aufklären. Ferner erschwert Multikollinearität die
Diagnose der Bedeutung eines einzelnen Prädiktors, da die Effekte der Variablen aufgrund
der Interkorrelationen konfundiert sind. Und schließlich erhöht Multikollinearität die
Varianz der Regressionskoeffizienten, was in einer instabilen Regressionsgleichung
resultiert.
Die Gefahr von Multikollinearität wächst mit zunehmender Höhe der Korrelationen
zwischen den Prädiktorvariablen. Die entsprechenden Korrelationsmatrizen sind Tabelle
5.1 zu entnehmen.
4.6.6 Kommunalitätenanalyse
Die inkrementelle Varianzaufklärung unterschätzt die wahre Vorhersagekraft eines
Prädiktors, wenn die Prädiktorvariablen untereinander korrelieren
und somit
gemeinsame Varianz besitzen. Diese Kommunalität wird bei der Regressionsanalyse
derjenigen Prädiktorvariablen zugeschrieben, die als erstes in die Regressionsgleichung
aufgenommen wird (Spinath et al., 2006).
Bei
der
hierarchischen
Regressionsanalyse
lässt
sich
über
den
Determinationskoeffizienten (R²) erkennen, wie hoch der spezifische Anteil eines
Prädiktors an der aufgeklärten Varianz ist. Dazu wird die Prädiktorvariable als letzter
Block in die Regression aufgenommen. Die inkrementelle Varianzaufklärung des letzten
Blocks (∆R²) entspricht dann dem Anteil der spezifischen Varianz dieses Prädiktors. Führt
man mehrere hierarchische Regressionsanalysen in Folge aus und variiert dabei die
Prädiktorvariable im letzten Block, so erhält man sämtliche spezifische Varianzanteile. Um
den Anteil der gemeinsamen Varianz aller Prädiktoren zu erhalten, bildet man die Summe
der Spezifitäten der Prädiktorvariablen und subtrahiert diese von Eins. Bei mehr als zwei
Prädiktoren, lassen sich die „spezifischen“ Kommunalitäten zwischen zwei Variablen,
sowie der gemeinsame Varianzanteil aller Variablen gesondert berechnen (Capraro,
2001). Auf diese aufwendige Analyse habe ich in meiner Untersuchung verzichtet, und
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 64
you want to appear here.
beschränke mich darauf, die einzelnen Spezifitäten der Prädiktoren, sowie den
ff
gemeinsamen Varianzanteil aller Variablen anzugeben.
4.7 Voraussetzungen zur Anwendung der Verfahren
Die im vorhergehenden Abschnitt beschriebenen statistischen Analysemethoden sind an
eine Reihe von Voraussetzungen gebunden, ohne die eine sinnvolle Interpretation der
Ergebnisse nicht möglich ist. Eine Verletzung kann eine Verfälschung der Ergebnisse zur
Folge haben. Die verwendeten multivariaten Verfahren haben gemeinsam, dass sie
intervallskalierte
und
normalverteilte
Daten
voraussetzen.
In
der
üblichen
Forschungspraxis verzichtet man auf die empirische Kontrolle des Skalenniveaus da man
davon ausgeht, dass die eingesetzten Verfahren das jeweilige Merkmal metrisch messen.
Dahinter steht nach Bortz (2005, S. 26) die Überzeugung, „dass die Bestätigung einer
Forschungshypothese durch die Annahme eines falschen Skalenniveaus eher erschwert
wird“. Dieser Praxis folgend habe ich die Daten der Motivationsskalen z-transformiert und
bin davon ausgegangen, dass die sechsstufige Antwortskala nicht nur Rang- sondern
Intervallskalenniveau besitzt.
Die zweite notwendige Voraussetzung der in dieser Arbeit eingesetzten Verfahren betrifft
die Verteilungsform: Aussagen über Varianz bzw. Standardabweichung sind nur bei
normalverteilten Stichproben aussagekräftig. Die Produkt-Moment-Korrelation erfordert,
dass die Grundgesamtheit bivariat normalverteilt ist. In der Praxis stößt diese
Überprüfung auf Schwierigkeiten, weshalb man sich nach Bortz (2005, S. 213) darauf
beschränkt, die Normalität der beiden Merkmale nachzuweisen. Stevens (1996) schlägt
eine Überprüfung der Normalverteilung der einzelnen Variablen in den unterschiedlichen
Gruppen vor. Zur Überprüfung der Normalverteilung führte ich den Kolmogorov-SmirnovAnpassungstest für die verschiedenen Skalen durch. Bei einem Signifikanz-Niveau von .01
stellte dieser Test bei 12 von 31 (39 Prozent der) untersuchten Skalen signifikante
Unterschiede zu einer Normalverteilung fest. Allerdings muss berücksichtigt werden, dass
bei einer großen Stichprobe auch schon ein sehr kleiner Unterschied zwischen den
beobachteten Werten und der Normalverteilungsform zu einem signifikanten Ergebnis
führt. Hier empfiehlt es sich, Schiefe und Exzess der Verteilung zu betrachten, um so
Erkenntnis über Art und Ausmaß der Abweichung von der Normalverteilung zu gewinnen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 65
you want to appear here.
Nach Kline (2005, S. 50) gibt es dazu wenig klare Richtlinien, doch konnten
ff
Computersimulationsstudien zeigen, dass Werte kleiner als 3 für die Schiefe und
unterhalb von 8 für den Exzess akzeptabel sind. Von diesen Richtwerten sind die
Verteilungen mit einem Maximalwert der Schiefe von -.71 (bei dem Subtest
„Zahlenreihen“, IST_ZR) in vorliegender Studie weit entfernt. Beim Exzess bildet die Skala
„Interesse für Physik“ (INT_P) mit einem Wert von -1.17 den Maximalwert, alle übrigen
Exzesswerte der Skalen liegen noch näher an Null. Die genauen Skalenwerte der
Leistungstests sind Tabelle 5.10, die Werte der Motivationsskalen Tabelle 5.11 zu
entnehmen.
Bei großen Stichproben hat sich gezeigt, dass sich parametrische uni- und multivariate
Analysen recht robust gegenüber Verletzungen der Voraussetzungen erwiesen haben. So
zeigten
Havlicek
und
Peterson
(1977),
dass
der
Pearson-Produkt-Moment-
Korrelationskoeffizient sehr robust gegenüber Verteilungsform und Skalenniveau ist.
Bei der Hauptkomponentenanalyse sollte man vorher die Korrelationsmatrix auf
Tauglichkeit überprüfen: Wenn die erhobenen Variablen nur schwach untereinander
korrelieren, so ist es unwahrscheinlich, dass sich Faktoren finden lassen, die die Variablen
auf eine geringere Zahl von Faktoren reduzieren. Der Bartlett-Test auf Sphärizität prüft,
ob die Daten aus einer Grundgesamtheit stammen, in der die Variablen unabhängig
voneinander sind. Da dieser Test bei großen Stichproben sehr leicht zu einem positiven
Ergebnis führt, gilt er nur bei kleinen Stichproben als sinnvoll (Schendera, 2004). Auch bei
meiner Studie waren alle Ergebnisse signifikant. Besser ist die Betrachtung der diagonalen
Werte der Anti-Image-Korrelationsmatrix. Diese geben an, wie groß der Anteil der Varianz
der einzelnen Variablen ist, der sich nicht durch die anderen Variablen erklären lässt.
Hieraus leitet sich das Kaiser-Meyer-Olkin-Kriterium (KMO) ab, das möglichst hohe Werte
bis hin zur Eins annehmen sollte. Nach Bühner (2006, S. 207) ist ein Wert von über .7 als
mittel, von über .8 als gut zu bezeichnen. Dementsprechend waren bei der vorliegenden
Studie alle KMO-Werte zufriedenstellend, mit dem niedrigsten Wert von .76 bis hin zu
Werten von .89. Die Stabilität der Faktorenlösung nimmt mit steigender Reliabilität der
Items und mit wachsender Stichprobengröße zu, wobei eine Stichprobengröße von 1000
als „exzellent“ (Bühner, 2006, S. 193) bezeichnet wird.
Als Fazit kann man festhalten, dass die Ergebnisse statistischer Analysen zuverlässiger
interpretiert werden können, wenn ihre Voraussetzungen erfüllt sind. Verschiedene
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 66
you want to appear here.
Untersuchungen kamen jedoch zum Ergebnis, dass die in dieser Arbeit verwendeten
ff
Verfahren robust gegenüber Verletzungen ihrer Voraussetzungen reagieren. So schreibt
Rost (2000, S. 62), dass die „Voraussetzungen zur Durchführung uni- und multivariater
Tests […] zwar theoretisch als sehr begründet, in ihren Auswertungen aber in vielen Fällen
als praktisch weniger bedeutsam angesehen werden […]“. Insbesondere trifft dies auf
große Stichproben zu, eine Bezeichnung, die auch auf die vorliegende Studie zutrifft.
Bühner (2006, S. 196) schreibt, dass Normalverteilung und Intervallskalenniveau keine
zwingenden Voraussetzungen für die Durchführung einer Hauptkomponentenanalyse
darstellen, beides jedoch für optimale Bedingungen gegeben sein muss.
Nachdem im Abschnitt 4.7 die Voraussetzungen für die Faktorenanalyse abgeklärt
wurden, wenden wir uns jetzt den Dimensionsanalysen des Itempools zu. Hierzu wurden
Hauptkomponentenanalysen (PCA) mit anschließender Varimax-Rotation gerechnet. Die
zum Vergleich angestellten Hauptkomponentenanalysen unter Verwendung der Direct
Oblimin-Rotationstechnik sind aus Gründen der Übersichtlichkeit nicht aufgeführt. Bei
allen PCAs wurden zunächst Faktoren mit Eigenwerten größer Eins extrahiert und zur
Validierung dieser Befunde eine Parallelanalyse gerechnet.
Bei den Leistungstests ist es sinnvoll den Extremwerten Beachtung zu schenken. Es
besteht die Möglichkeit, dass der betreffende Schüler die Aufgabenstellung nicht
verstanden hat, was sehr schlechte Werte zu Folge hätte. Andererseits sind Probanden
mit einer sehr hohen Punktezahl zu berücksichtigen, da diese sich möglicherweise nicht
an die Testanweisung gehalten und früher als die anderen Schüler mit der Bearbeitung
der Aufgaben begonnen haben.
Für die erhobenen Schulnoten wurden keine Skalen- bzw. Ausreißeranalysen gerechnet.
Besonders gute bzw. schlechte Schüler gehören zum Schulalltag dazu und es erscheint
nicht sinnvoll diese selektiv auszusortieren und somit künstlich die Varianz
einzuschränken. Die Verteilungsform der Schulnoten wurde bereits in Tabelle 4.1
behandelt.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 67
you want to appear here.
Die Kommunalitätenanalyse schlüsselt die prozentualen Anteile der spezifischen
ff
Varianzen der verschiedenen Prädiktoren auf und gibt Auskunft über den Anteil, den sie
gemeinsam zur Vorhersage des Schulerfolgs heranziehen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 68
ff
5 Darstellung der Ergebnisse
Hinweis: Gemäß der inhaltlichen Aufteilung (siehe Anhang, T-1) führe ich für die
Subtests LPS 4, LPS 9 und IST AN nur in begrenztem Umfang psychometrische
Kennwerte auf. Dies gilt ebenso für die Skalen Interesse (INT), Hoffnung auf Erfolg
(HE) und Anstrengungsvermeidung (AVT). Außerdem beschränke ich mich bei der
Darstellung
der
fächerspezifischen
Faktoren-,
Regressions-
und
Kommunalitätenanalysen auf die Fächer Deutsch und Physik. Die fehlenden Daten
sind der Diplomarbeit von Pfeiffer (2007) zu entnehmen.
5.1 Dimensionsanalysen
Die in Tabelle 5.1 dargestellte Korrelationsmatrix gibt einen ersten Überblick über die
Beziehungen zwischen den erfassten Variablen. Gemäß den Erwartungen weisen die
Leistungstests (LT), Selbstkonzept (SK), Interesse (INT) und Hoffnung auf Erfolg (HE)
positive Korrelationen zu den Schulnoten auf, während das Vorzeichen bei
Anstrengungsvermeidung (AVT) und Furcht vor Misserfolg (FM) negativ ausfällt. Entgegen
meinen Erwartungen weisen nicht Leistungstests, sondern das Selbstkonzept die
höchsten Korrelationen zu den Schulnoten auf.
Physik
Deutsch
Schule
Tabelle 5.1 – Korrelationsmatrix: Prädiktoren und ihre Kriteriumsvariable
Variablen
Notenschnitt
LT
SK
Int
AVT
HE
Schulnote
LT
SK
Int
AVT
HE
Schulnote
LT
SK
Int
AVT
HE
LT
-.32**
SK
-.67**
.24**
INT
-.26**
.06**
.42**
AVT
.23**
.02**
-.27**
-.38**
HE
-.21**
.11**
.31**
.28**
-.10**
-.19**
-.61**
.08**
-.40**
< .01**
.73**
.26**
.07**
-.37**
-.46**
-.28**
-.02**
.52**
.55**
-.34**
-.25**
-.70**
.19**
-.51**
.14**
.80**
.32**
-.04**
-.44**
-.48**
-.38**
.07**
.58**
.62**
-.40**
FM
.05**
-.08**
-.13**
.02**
.11**
-.09**
.13**
-.10**
-.14**
-.05**
.20**
-.01**
.20**
-.12**
-.34**
-.26**
.30**
-.21**
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 69
ff
Verwendete Abkürzungen: LT = Leistungstests, SK = Selbstkonzept, INT = Interesse, AVT =
Anstrengungsvermeidung, HE = Hoffnung auf Erfolg, FM = Furcht vor Misserfolg.
* signifikant auf dem Niveau von .05 (zweiseitig).
** signifikant auf dem Niveau von .01 (zweiseitig).
5.1.1 Struktur der Allgemeinen Intelligenz
Die gerechnete Hauptkomponentenanalyse über die verwendeten z-standardisierten
Intelligenz-Subtests
resultiert
gemäß
dem
Kaiser-Guttman-Kriterium
in
einer
zweifaktoriellen Lösung, die 51.6 Prozent der Gesamtvarianz aufklärt. Auch die
Parallelanalyse präferiert eine zweifaktorielle Lösung, da die tatsächlich ermittelten
empirischen Eigenwerte beim dritten Faktor geringer sind als die Mittelwerte
randomisierter Rohdaten (siehe Tabelle 5.2). Die in Tabelle 5.3 aufgeführte rotierte
Komponentenmatrix lässt erkennen, dass auf dem ersten Faktor Subtests laden, die
hauptsächlich Fluide Intelligenz erfordern, während auf den zweiten Faktor Subtests
laden, die auf Kristalliner Intelligenz basieren.
Eigenwerte
randomisierter
Rohdaten
Empirisch ermittelte
Eigenwerte
Abbildung 5.1 – Intelligenzsubtests: Eigenwertverläufe bei der Parallelanalyse
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 70
ff
Tabelle 5.3 – Leistungssubtests: Rotierte
Komponentenmatrix der zweifaktoriellen Lösung
Subtests
IST ZR
Faktor 1
Faktor 2
.75
-.01
Tabelle 5.2 – Leistungssubtests: Vergleich der
Eigenwerte bei der Parallelanalyse
Faktor
1
Empirisch
PA MW
PA 95
2.53
1.12
1.16
.22
2
1.08
1.07
1.10
.10
3
.84
1.03
1.06
LPS 4
.68
ZVT
.63
LPS 7
.62
.01
LPS 9
.60
.20
IST An
.04
.86
LPS 1+2
.23
.74
Spaltenüberschriften: Empirisch = empirische
Eigenwerte; PA MW = Mittelwerte randomisierter
Rohdaten; PA 95 = 95-prozentige Perzentile der
Zufallsvariablen.
Beim genauen Studieren der Eigenwertverläufen fällt auf, dass beim zweiten Faktor die
tatsächlich ermittelten empirischen Eigenwerte mit einem Wert von 1.08 zwar größer
sind als die Eigenwerte randomisierter Rohdaten (1.07), jedoch kleiner als die Eigenwerte
95-prozentiger Perzentile der Zufallsvariablen (1.10). Demnach kann man nur mit einer
geringen Wahrscheinlichkeit davon ausgehen, dass der zweite Faktor eine empirische
Bedeutung hat. Ich berechne also erneut eine Hauptkomponentenanalyse, erzwinge
diesmal aber eine einfaktorielle Lösung. Diese klärt 36.1 Prozent der Gesamtvarianz auf
und entspricht inhaltlich der Extraktion des Generalfaktors der Allgemeinen Intelligenz.
Tabelle 5.4 – Leistungssubtests: Komponentenmatrix der einfaktoriellen Lösung
Subtest
Faktorladung
LPS 4
.71
ZVT
.66
IST ZR
.62
LPS 7
.61
LPS 9
.59
LPS 1+2
.55
IST AN
.43
5.1.2 Struktur motivationaler Skalen
Im späteren Verlauf der Datenanalyse werde ich eine hierarchische Regressionsanalyse
durchführen. Um zu bestimmen, wie die Motivationsskalen (SK, INT, HE, FM, AVT) bei
dieser
Operation
in
Blöcke
aufgeteilt
werden,
rechnete
ich
eine
Hauptkomponentenanalyse über die Motivationsskalen, separat für jedes Schulfach. Es
stellt sich heraus, dass nach dem Kaiser-Guttman-Kriterium für die auf das Fach Deutsch
und für die auf die Schule bezogenen Motivationsskalen eine zweifaktorielle Lösung
vorzuziehen ist. Die anderen Fächer und die Parallelanalyse präferieren jedoch nur einen
einzigen Faktor zu extrahieren.
#Tabelle Eigenwerte
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 71
ff
Empirisch ermittelte
Eigenwerte
Empirisch ermittelte
Eigenwerte
Eigenwerte
randomisierter
Rohdaten
Eigenwerte
randomisierter
Rohdaten
Abbildung 5.3 – Motivationsvariablen für
Deutsch: Eigenwertverläufe der Parallelanalyse
Abbildung 5.2 – Motivationsvariablen für Physik:
Eigenwertverläufe bei der Parallelanalyse
Da es keine eindeutige Befundlage gibt und ein weiterer Faktor die Möglichkeit einer
differenzierteren Betrachtung der Variablen ermöglicht, entschied ich mich für die
zweifaktorielle Lösung. Demnach bilden Interesse, Selbstkonzept und Hoffnung auf Erfolg
den ersten Faktor, während die Skala Furcht vor Misserfolg den zweiten Faktor darstellt.
Die Komponentenmatrizen dieser Lösung sind Tabelle 5.5 zu entnehmen.
Tabelle 5.5 – Motivationsskalen: Rotierte Komponentenmatrix der zweifaktoriellen Lösung
Fach
Schule
Mathe
Deutsch
Physik
Englisch
Faktor
Interesse
Selbstkonzept
1
2
1
2
1
2
1
2
1
2
.79
.20
.90
-.19
.90
-.02
.91
-.14
.91
-.07
.78
-.15
.86
-.02
.87
-.17
.87
-.25
.87
-.21
Hoffnung
auf Erfolg
.66
-.15
.86
-.32
.80
.09
.83
-.05
.84
-.02
Furcht vor
Misserfolg
-.06
.97
-.16
.98
-.03
.99
-.15
.99
-.10
.99
kumulierter
%Anteil Varianz
41.6
67.4
57.4
84.7
54.8
80.3
57.6
84.0
57.6
83.3
5.1.2.1 Selbstkonzept
Zunächst soll überprüft werden, ob ein konsistentes akademisches (bzw. allgemein
schulbezogenes) Selbstkonzept gefunden werden kann. Dazu rechne ich eine
Faktorenanalyse über die schulbezogenen Selbstkonzeptitems. Es wird gemäß dem
Kaiser-Guttmann-Kriterium ein Faktor extrahiert, der Ladungswerte zwischen .69 und .87
aufweist und (mit einem Eigenwert von 3.09) 61.9 Prozent der Gesamtvarianz aufdeckt.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 72
ff
Tabelle 5.6 – Schulbezogenes Selbstkonzept: einfaktorielle Lösung
Anfängliche Eigenwerte
unr. EW % Varianz
% kum
3.09
61.9
61.9
.68
13.7
75.5
.53
10.6
86.2
.43
8.7
94.8
.26
5.1
100
Faktor
1
2
3
4
5
Summe quadrierte Faktorladungen
unr. EW % Varianz
% kum
3.09
61.9
61.9
Hinweis: Als Variablen werden fünf schulbezogene Items zum Selbstkonzept herangezogen.
Spaltenüberschriften: PA MW = Mittelwerte randomisierter Rohdaten; unr. EW = unrotierte Eigenwerte; %
Varianz = Prozent der Varianz; % kum = Prozent der kumulierten Varianz; rot. EW = rotierte Eigenwerte.
Es soll überprüft werden, ob das Selbstkonzept bei fächerspezifischer Betrachtungsweise
seine Eindimensionalität behält. Dazu wird eine Faktorenanalyse über alle Items der
fächerspezifischen
Selbstkonzeptskalen
gerechnet.
Die
Eigenwertverläufe
der
Parallelanalyse (Abbildung 5.4) sprechen für eine Lösung mit vier Faktoren. Denn gemäß
den Daten in Tabelle 5.7 sind beim fünften Faktor die Eigenwerte randomisierter
Variablen (1.12) größer, als die empirischen Eigenwerte mit (.57).
Eigenwerte
randomisierter
Rohdaten
Empirisch ermittelte
Eigenwerte
Abbildung 5.4 – Fächerspezifisches Selbstkonzept: Eigenwertverläufe bei der Parallelanalyse
Tabelle 5.7 – Selbstkonzept: unrotierte und rotierte vierfaktorielle Lösung
Faktor
1
2
3
4
5
6
7
8
PA MW
1.25
1.21
1.72
1.14
1.12
1.10
1.07
1.05
unr. EW
6.66
5.23
2.35
2.05
.57
.46
.34
.32
% Varianz
33.29
26.17
11.74
10.27
2.88
2.33
1.68
1.62
% kum
33.29
59.46
71.20
81.47
84.38
86.71
88.38
90.01
rot. EW
4.24
4.23
4.10
3.72
% Varianz
21.22
21.16
20.48
18.61
%kum
21.22
42.38
62.86
81.47
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 73
ff
…20
…
…
…
…
Anmerkung: Auszug aus der vollständigen Tabelle. Die Variablenzahl beläuft sich auf 4 Fächer x 5 Items zum
Selbstkonzept = 20 Variablen.
Spaltenüberschriften: PA MW = Mittelwerte randomisierter Rohdaten; unr. EW = unrotierte Eigenwerte; %
Varianz = Prozent der Varianz; % kum = Prozent der kumulierten Varianz; rot. EW = rotierte Eigenwerte.
Die Analyse der rotierten Komponentenmatrix in Tabelle 5.8 lässt erkennen, dass jedes
der vier Schulfächer genau auf einen Faktor lädt. Dies deckt sich mit den Befunden
vorhergehender Studien und entspricht unseren Erwartungen.
Tabelle 5.8 - Selbstkonzept: rotierte Komponentenmatrix der vierfaktoriellen Lösung
Items
Faktor1 Faktor2 Faktor3 Faktor4
skm_01
.25
.88
-.09
-.06
skm_02
.25
.88
-.08
-.06
skm_03
.23
.87
.01
-.03
skm_04
.26
.91
-.02
-.03
skm_05
.22
.87
-.04
-.02
skd_01
.01
-.08
.16
.84
skd_02
-.04
-.08
.19
.84
skd_03
.00
.03
.20
.80
skd_04
.03
-.01
.18
.89
skd_05
.00
-.02
.14
.84
skp_01
.89
.24
-.04
-.03
skp_02
.90
.22
-.05
.00
skp_03
.86
.25
.01
-.01
skp_04
.90
.28
-.02
.03
skp_05
.89
.21
-.01
.02
ske_01
-.02
-.09
.88
.19
ske_02
-.06
-.08
.88
.18
ske_03
.00
-.01
.89
.16
ske_04
.01
.00
.91
.19
ske_05
-.04
-.04
.87
.20
Anmerkung: Je dunkler die „Färbung“, desto höher die Faktorladung.
Kodierung: skm_01 bedeutet Skala Selbstkonzept, Fach Mathematik, erstes Item.
5.1.2.2 Furcht vor Misserfolg
Analog zum Selbstkonzept wird überprüft, ob es ein konsistentes Konstrukt allgemeine
schulbezogene Furcht vor Misserfolg gibt. Die Faktorenanalyse über die fünf zugehörigen
Items befürwortet eine einfaktorielle Lösung, die (mit einem Eigenwert von 2.89) 58
Prozent der Gesamtvarianz aufklärt. Die Ladungswerte der Items liegen zwischen .73 und
.79.
Die Faktorenanalyse über die insgesamt 20 fächerspezifischen Items zur Skala Furcht vor
Misserfolg ergibt ein unstimmiges Bild. Das Kaiser-Guttman-Kriterium schlägt eine
Extraktion von fünf Faktoren vor, die Zahlen der Parallelanalyse deuten auf eine
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 74
you want to appear here.
dreifaktorielle Lösung hin. Die grafische Darstellung des Eigenwertverlaufs der
ff
Parallelanalyse in Abbildung 5.5 lässt erkennen, dass die Kurve der empirischen
Eigenwerte nach dem vierten Faktor einen Knick macht. Gemäß der Screeplot-Analyse
wäre hier eine vierfaktorielle Lösung denkbar. Nach J. Sparfeldt (persönliche Mitteilung,
Dezember 2007) lässt sich die vierfaktorielle Lösung über eine konfirmatorische
Faktorenanalyse bestätigen. Demnach gehe ich davon aus, dass es sinnvoll ist die Skala
Furcht vor Misserfolg über vier Faktoren zu erklären, die den einzelnen Schulfächern
entsprechen.
Eigenwerte
randomisierter
Rohdaten
Empirisch ermittelte
Eigenwerte
Abbildung 5.5 – Fächerspezifische Furcht vor Misserfolg: Eigenwertverläufe bei der Parallelanalyse
Tabelle 5.9 – Furcht vor Misserfolg: unrotierte und rotierte vierfaktorielle Lösung
Faktor
1
2
3
4
5
6
7
8
…20
PA MW
1.25
1.21
1.18
1.15
1.12
1.10
1.07
1.05
…
unr. EW
9.62
1.75
1.44
1.08
1.00
.93
.88
.78
…
% Varianz
48.11
8.77
7.22
5.41
5.02
4.62
4.39
3.89
…
% kum
48.11
56.88
64.10
69.51
74.23
78.85
83.24
87.13
…
rot. EW
4.04
3.94
3.23
2.63
% Varianz
20.21
19.68
16.16
13.16
%kum
20.21
39.90
56.05
69.21
Anmerkung: Auszug aus der vollständigen Tabelle. Die Variablenzahl beläuft sich auf 4 Fächer mal 5 Items zu
Furcht vor Misserfolg = 20 Variablen.
Spaltenüberschriften: PA MW = Mittelwerte randomisierter Rohdaten; unr. EW = unrotierte Eigenwerte; %
Varianz = Prozent der Varianz; % kum = Prozent der kumulierten Varianz; rot. EW = rotierte Eigenwerte.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
5.1.2.3 Interesse, Hoffnung auf Erfolg, Anstrengungsvermeidung
Seite 75
ff
Pfeiffer (2007) stellte bei den Motivationsskalen Interesse und Hoffnung auf Erfolg über
Faktorenanalysen eine fächerspezifische Struktur fest. Die Eindimensionalität ließ sich
beim
Anstrengungs-Vermeidungs-Test
weder
allgemein
schulbezogen,
noch
fächerspezifisch über Faktorenanalysen nachweisen (vgl. Pfeiffer, 2007). Da die
Konsistenz eine notwendige Voraussetzung für die angenommene hierarchische Struktur
darstellt, gingen die Daten dieses Fragebogens nicht die die folgenden Regressions- und
Kommunalitätenanalysen ein.
5.2 Item- und Skalenanalysen
5.2.1 Leistungstests
Das Kriterium, ab wann ein Proband als Ausreißer klassifiziert und aus dem Datensatz
ausgefiltert wird, lautet wie folgt: Hat ein Schüler einen Skalenwert, der einer z-WertDifferenz größer oder gleich 3 zum Stufenmittelwert
entspricht, gilt er in dem
entsprechenden Subtest als Ausreißer. Beim ZVT gab es das Problem, dass einige Schüler
sich augenscheinlich nicht an die Zeitvorgabe gehalten hatten. Sie stellten zunächst eine
Matrize komplett fertig, bevor sie zur nächsten übergingen und dort dann zunehmend
unter Zeitnot gerieten. Deshalb wurden hier zusätzliche Kriterien angelegt: Schüler, die
mindestens einen Durchgang komplett abgeschlossen hatten (dies war bei zehn
Versuchspersonen der Fall), oder bei denen nach vier Durchgängen eine Varianz größer
gleich 193 vorlag, wurden nicht in weitere Berechnungen aufgenommen. Dieser Wert
wurde nach Betrachtung der Rohwerte der einzelnen Durchgänge willkürlich festgelegt.
Betroffen waren elf Versuchspersonen, die in einem der vier Durchläufe – verglichen mit
ihrer sonstigen Leistung – „aus dem Rahmen“ fielen. (Ich kann mich z. B. an einen Schüler
erinnern, dem während der Testung die Bleistiftmine abgebrochen war.) Zusammen
wurden bei den verschiedenen Leistungstests 73 Versuchspersonen als Ausreißer
klassifiziert.
Beim LPS 4 wurden die Daten einer kompletten Klasse fallengelassen, da 12 von 24
Schülern die Ausreißerkriterien erfüllten. Während der Testung waren mir keine
Besonderheiten aufgefallen, so dass sich über die Gründe nur Spekulationen anstellen
lassen.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 76
ff
Tabelle 5.10 – Skalenanalyse und Informationen zu den Leistungstests
Subtest
LPS 1+2
LPS 4
LPS 7
LPS 9
IST AN
IST ZR
ZVT
vVpn
1082
1047
1081
1077
1084
1084
1048
Ausr.
2
*37
3
7
0
0
36
Min
20
8
3
14
1
0
30
Max
64
27
40
41
18
20
77
MW
37.77
16.51
21.10
28.56
9.95
13.64
51.07
SD
7.48
3.26
6.52
4.42
2.82
4.70
7.52
α
.85
.66
.90
.77
.55
.87
.89
ø rit
.22
.19
.38
.23
.45
.18
.77
Schiefe
.51
.16
.11
-.22
-.12
-.71
.21
Exzess
.21
-.30
-.12
.16
-.12
-.08
-.07
Spaltenüberschriften: vVpn = verbleibende Versuchspersonen; Ausr. = Ausreißer; Min = minimaler
Skalenwert; Max = maximaler Skalenwert; α = Cronbachs Alpha; ø rit = mittlere Trennschärfe.
* die Daten einer kompletten Klasse wurden fallengelassen, da 12 von 24 Schülern als Ausreißer
klassifiziert wurden.
Die Interne Konsistenz der Skalen wird als Cronbachs Alpha angegeben. Bei den
verschiedenen Aufgabenkategorien der Leistungstests liegt Alpha zwischen .55 (IST AN)
und .90 (LPS 7). Wie durch die Alpha-Koeffizienten in Tabelle 5.10 ersichtlich, kann die
Interne Konsistenz bei vier der sieben Subtests als gut bezeichnet werden. Demnach
besitzen die verwendeten Subtests bis auf die Analogien (IST AN) und den LPS 4 eine
zufriedenstellende Homogenität. Eine mögliche Erklärung bietet der Ansatz, dass zum
Lösen der Analogien nicht nur schlussfolgerndes Denken, sondern auch ein gut
organisierten deutscher Wortschatz gegeben sein muss.
Nach Bühner (2004) werden korrigierte Trennschärfen unter einem Wert von .3 als
niedrig und oberhalb von .5 als hoch bezeichnet. Die Mittelwerte der korrigierten
Trennschärfen der einzelnen Leistungstests sind somit bis auf zwei Ausnahmen als niedrig
zu klassifizieren. Den geringsten Wert hat der LPS 4, der nach der Entfernung von zwölf
Items (mit einer Trennschärfe kleiner als .06) auf einen neuen Skalenmittelwert von .19
kommt. Die Skala Analogien des IST besitzt eine mittlere (.45), der ZVT (.77) eine hohe
gemittelte Trennschärfe.
Die Testanalyse auf Itemebene kam zu folgendem Ergebnis: Beim LPS 1 + 2 wird ein Item
nicht weiter berücksichtigt, da es eine Nullvarianz aufweist (keiner konnte das Item richtig
lösen). Das gleiche Schicksal wiederfährt zwölf Items des LPS 4. Auch hier ist eine
Differenzierung praktisch nicht gegeben. Die entfernten Items besitzen eine
Itemschwierigkeit größer gleich .98 und einer Trennschärfe kleiner als .07.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
5.2.2 Motivationsskalen
Seite 77
ff
Bei den Motivationsskalen wurden die Varianzen über die Subskalen für jede
Versuchsperson berechnet mit dem Ziel, ein ungewöhnliches Ankreuzverhalten
aufzudecken. Drei Probanden fielen bei Betrachtung der Häufigkeitsverteilung der
Varianzen ins Auge. Ihre Subskalen mit einer Varianz von Null wurden nicht gewertet. Ein
größerer Datenverlust ergab sich dadurch, dass einige Probanden den Fragebogen nicht
vollständig zu Ende bearbeiteten. Tabelle 5.11 ist zu entnehmen, wie viele
Versuchspersonen in den einzelnen Tests keine Angaben machten, bzw. als Ausreißer
klassifiziert wurden. Insgesamt verringerte sich durch fehlende Angaben bei den
Motivationsskalen der Datensatz um 29 Versuchspersonen.
Tabelle 5.11 – Skalenanalyse für die Motivationsskalen
Skala
SK_S
SK_M
SK_D
SK_P
SK_E
FM_S
FM_M
FM_D
FM_P
FM_E
Int_S
Int_M
Int_D
Int_P
Int_E
HE_S
HE_M
HE_D
HE_P
vVpn
1082
1084
1084
1083
1084
1084
1081
1080
1081
1081
1081
1084
1081
1083
1083
1084
1081
1080
1078
K.A.
2
0
0
1
0
0
3
4
3
3
3
0
3
1
1
0
3
4
6
MW
3.63
3.52
3.89
3.20
3.85
3.21
2.91
2.56
2.88
2.68
2.93
3.35
3.39
3.07
3.87
4.58
4.14
3.90
3.69
SD
0.96
1.44
1.06
1.42
1.22
1.06
1.28
1.05
1.25
1.16
1.06
1.52
1.33
1.58
1.34
0.89
1.30
1.21
1.34
α
.85
.95
.91
.96
.95
.82
.87
.84
.87
.87
.87
.95
.93
.95
.93
.82
.90
.89
.90
ø rit
.66
.87
.77
.88
.85
.61
.70
.65
.70
.69
.72
.87
.83
.88
.84
.61
.74
.74
.75
Schiefe
.09
-.02
-.08
.23
-.14
.13
.42
.51
.49
.53
.27
.07
.05
.26
-.26
-.70
-.43
-.26
-.09
Exzess
-.40
-1.14
-.52
-.95
-.62
-.45
-.57
.04
-.42
-.28
-.34
-.13
-.79
-1.17
-.70
.38
-.63
-.47
-.84
Hinweis: Alle Aussagen der Motivationsskalen wurden auf einer sechsstufigen Antwortskala bewertet.
Dementsprechend reichen die Rohwerte von Eins bis Sechs.
Spaltenüberschriften: vVpn = verbleibende Versuchspersonen; K.A. = Anzahl der Schüler ohne Angaben; Min
= minimaler Skalenwert; Max = maximaler Skalenwert; α = Cronbachs Alpha; ø rit = mittlere
Trennschärfe.
Cronbachs Alpha liegt wie in Tabelle 5.11 aufgeführt, zwischen .82 (HE Schule) und .96
(SK Physik). Die Interne Konsistenz der Motivationsskalen ist somit als gut bis sehr gut zu
bezeichnen. Nach Bühner (2004) werden korrigierte Trennschärfen über einem Wert von
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 78
you want to appear here.
.5 als gut klassifiziert. Die Mittelwerte, gebildet aus den korrigierten Trennschärfen der
ff
spezifischen Motivationsskalen, liegen oberhalb dieses Werts (zwischen .61 und .88).
5.3 Regressionsanalysen
5.3.1 Vorhersageleistung der Schulleistung
In diesem Rechenschritt wird die Schulleistung, verkörpert durch den Notenschnitt der
vier Fächer Mathe, Deutsch, Physik und Englisch über verschiedene Prädiktorvariablen
vorhergesagt. Als erster Block wird in die hierarchische Regressionsanalyse der Mittelwert
der verschiedenen Leistungs- bzw. Intelligenztests (LT) eingegeben. Den zweiten Block
bilden die separaten Skalen Selbstkonzept, Interesse und Hoffnung auf Erfolg (im
fortlaufenden Text als SIHE bezeichnet). Entsprechend der faktorenanalytisch ermittelten
Struktur des Selbstkonzepts wird die Skala Furcht vor Misserfolg (FM) als dritter Block in
die hierarchische Regressionsanalyse eingegeben. Insgesamt 106 Schüler werden aus dem
Datensatz ausgefiltert, weil sie in den verschiedenen Skalen als Ausreißer klassifiziert
wurden, oder nicht alle Fragen beantwortet haben. Mit den verbleibenden 978 Schülern
werden nach dem eben beschriebenen Schema hierarchische Regressionsanalysen
gerechnet.
Tabelle 5.12 – Hierarchische Regressionsanalysen: Modellzusammenfassung für Schule
Block
1-1
1-2
1-3
2-1
2-2
2-3
3-1
3-2
3-3
Prädiktorena
SIHE
FM
LT
LT
SIHE
FM
FM
LT
SIHE
R
.672
.673
.692
.318
.690
.692
.054
.319
.692
R²
.451
.453
.479
.101
.476
.479
.003
.102
.479
∆R²
.451
.002
.026
.101
.375
.002
.003
.099
.377
∆F
267
3.1
48
109.8
232.4
4.4
2.8
107
234
∆p
<.001
.077
<.001
<.001
<.001
.037
.093
<.001
<.001
Hinweis: Regressand ist die Durchschnittsnote aus Mathe, Deutsch, Physik und Englisch. N = 978.
Spaltenüberschriften: R² = Bestimmtheitsmaß; ∆R² = Zuwachs des Bestimmtheitsmaßes; ∆F = Zuwachs in F;
∆p = Änderung in Signifikanz von F.
a LT = Leistungstests; SIHE = Selbstkonzept, Interesse, Hoffnung auf Erfolg; FM = Furcht vor Misserfolg.
In Tabelle 5.12 sind die Ergebnisse der hierarchischen Regressionsanalysen mit der
Kriteriumsvariable
Schulnoten
aufgeführt.
Aufgelistet
sind
drei
Modellzusammenfassungen, bei denen ich die Reihenfolge, mit der die Prädiktorvariablen
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 79
you want to appear here.
in die Regressionsgleichung aufgenommen wurden, verändert habe. Das
ff
Bestimmtheitsmaß lässt auf der letzten Stufe (bei Eingabe aller drei Prädiktorblöcke)
erkennen, dass die drei Blöcke zusammen 47.9 Prozent der Varianz des Regressanden
aufklären. Bei Eingabe von LT als dritte Prädiktorvariable, ist ein Zuwachs des
Bestimmtheitsmaßes von .026 gegenüber der vorhergehenden Stufe zu verzeichnet. Das
bedeutet, dass 2.6 Prozent der Schulnoten spezifisch über die kumulierten Leistungstests
erklärt wird. FM trägt auf dritter Stufe nur geringfügig zur Vorhersage des Schulerfolgs bei
und besitzt eine marginale inkrementelle Varianzaufklärung von .2 Prozentpunkten. Den
größten Zuwachs des Bestimmtheitsmaßes ist bei Eingabe von Block SIHE auf dritter Stufe
zu verzeichnen, der einem spezifischen Varianzanteil von 37.7 Prozent entspricht.
5.3.2 Vorhersageleistung für das Fach Deutsch
Die Deutschnote, als Indikator des Schulerfolgs im Fach Deutsch, stellt den Regressanden
dar. Sie wird über drei Blöcke von Prädiktorvariablen vorhergesagt. Den ersten Block
bildet der Durchschnittswert der Leistungstests, bzw. die Allgemeine Intelligenz. Der
zweite Block besteht aus den über Fragebögen ermittelten Skalenwerten zu
Selbstkonzept, Interesse und Hoffnung auf Erfolg im Fach Deutsch. Zu guter Letzt wird der
Wert der Skala Furcht vor Misserfolg im Fach Deutsch als eigenständiger Block in die
Regressionsgleichung aufgenommen.
Nach den Ergebnissen aus Tabelle 5.13 liegt die kumulierte Vorhersageleistung der
Prädiktoren bei 38.8 Prozent. Wie schon bei der auf die Schule bezogenen
Regressionsanalyse klärt der Block SIHE am meisten Varianz auf. Die Kategorie LT trägt
signifikant zur Vorhersage der Deutschnote bei, während der inkrementelle Beitrag der
Skala FM zu gering ist, um von einer statistischen Bedeutung zu sprechen.
Tabelle 5.13 – Hierarchische Regressionsanalyse: Modellzusammenfassung für Deutsch
Block
1
2
3
Prädiktorena
LT
SIHE
FM
R
.192
.622
.623
R²
.037
.387
.388
∆R²
.037
.351
<.001
∆F
37.4
185.2
.6
∆p
<.001
<.001
.421
Hinweis: Regressand ist die Deutschnote. N = 976.
Spaltenüberschriften: R² = Bestimmtheitsmaß; ∆R² = Zuwachs des Bestimmtheitsmaßes; ∆F = Zuwachs in F;
∆p = Änderung in Signifikanz von F.
a LT = Leistungstests; SIHE = Selbstkonzept, Interesse, Hoffnung auf Erfolg; FM = Furcht vor Misserfolg.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 80
ff
5.3.3 Vorhersageleistung für das Fach Physik
Analog zum Fach Deutsch wird dieselbe Prozedur mit Physik wiederholt. Die Zahlen aus
Tabelle 5.14 lassen erkennen, dass 50.8 Prozent der Varianz der Physiknote aufgeklärt
wird. Wie auch bei den anderen Fächern, hat der Block SIHE die beste Vorhersageleistung,
gefolgt von der Allgemeinen Intelligenz. Die Skala FM trägt nur in sehr geringem Ausmaß
inkrementell zur Varianzaufklärung bei.
Tabelle 5.14 – Hierarchische Regressionsanalyse: Modellzusammenfassung für Physik
Block
1
2
3
Prädiktorena
LT
SIHE
FM
R
.259
.711
.713
R²
.067
.506
.508
∆R²
.067
.439
.002
∆F
69.6
287.4
4.2
∆p
<.001
<.001
.040
Hinweis: Regressand ist die Physiknote. N = 974.
Spaltenüberschriften: R² = Bestimmtheitsmaß; ∆R² = Zuwachs des Bestimmtheitsmaßes; ∆F = Zuwachs in F;
∆p = Änderung in Signifikanz von F.
a LT = Leistungstests; SIHE = Selbstkonzept, Interesse, Hoffnung auf Erfolg; FM = Furcht vor Misserfolg.
5.3.4 Vergleich Schulbezogene und Fächerspezifische Betrachtungsweise
Ein weiteres Ziel der Untersuchung ist es herauszufinden, ob sich die Vorhersageleistung
des Schulerfolgs durch die Differenzierung auf Schulfachebene erhöht. Diese Frage lässt
sich mit einem klaren „jein“ beantworten. Drei der vier in dieser Untersuchung erfassten
Fächer profitieren von der Differenzierung und lassen sich über einen höheren
Varianzanteil aufklären. Der größte Varianzzuwachs ist mit einem Aufklärungsanteil der
Gesamtvarianz von 53.4 Prozent im Schulfach Mathematik zu beobachten. Dies entspricht
einem
Zuwachs
von
11.5
Prozentpunkten
gegenüber
der
schulbezogenen
Betrachtungsweise mit einem Aufklärungsanteil der Gesamtvarianz von 47.9 Prozent.
Dagegen liegt die Vorhersageleistung im Fach Deutsch mit einem Aufklärungsanteil von
38.8
Prozent
9.1
Prozentpunkte
unter
dem
Aufklärungsanteil bei
allgemein
schulbezogenen Fragestellung. In Abbildung 5.6 sind die Anteile aufgeklärter
Gesamtvarianz der untersuchten Fächer gegenübergestellt.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 81
Prozent
ff
50
40
53.4
47.9
50.8
52.0
Physik
Englisch
38.8
30
20
10
0
Schule
Mathe
Deutsch
Abbildung 5.6 – Gegenüberstellung der prozentualen Anteile aufgeklärter Gesamtvarianz
5.4 Kommunalitätenanalysen
Tabelle 5.15 – Prozentuale Anteile spezifischer und gemeinsamer Varianz an der aufgeklärten Varianz
Konstrukt
Aufgeklärte Varianza
Block SIHEbc
Allgemeine Intelligenzc
Furcht vor Misserfolgc
Gemeinsame Varianz
Schule
47.9
78.8
5.4
.4
15.4
Mathe
53.4
71.9
2.6
.2
25.3
Deutsch
38.8
87.6
4.9
0
7.5
Physik
50.8
81.5
2.8
.4
15.4
Englisch
52.0
87.7
2.5
.4
9.8
Hinweis: Alle Angaben der Tabelle in Prozent.
a Prozentualer Anteil der kumulierten aufgeklärten Varianz der Schulnote.
b Der Block SIHE besteht aus den Motivationsskalen Selbstkonzept, Interesse und Hoffnung auf Erfolg.
c Prozentuale Anteile spezifischer Varianz.
Tabelle 5.15 listet separat für jedes Fach (und allgemein schulbezogen) die prozentualen
Anteile spezifischer und gemeinsamer Varianz auf. Der Block Selbstkonzept macht in allen
Bereichen
–
sowohl
bei
schulbezogener,
als
auch
bei
fächerspezifischer
Betrachtungsweise – den mit Abstand größten spezifischen Varianzanteil aus. Dabei liegt
der Prozentsatz zwischen 71.9 und 87.7 Prozent. Die Allgemeine Intelligenz trägt
inkrementell zur Vorhersage des Schulerfolgs bei, der prozentuale Anteil der spezifischen
Varianz liegt dabei zwischen 2.5 und 5.4 Prozent. Die Skala „Furcht vor Misserfolg“ hat
eine sehr geringe spezifische Vorhersageleistung. Der prozentuale Anteil der spezifischen
Varianz macht bis zu .4 Prozent aus, beim Fach Deutsch gab es keine signifikante
Steigerung über die inkrementelle Varianzaufklärung. Der Anteil der gemeinsamen
Varianz schwankte von 7.5 Prozent im Fach Deutsch, bis zu 25.3 Prozentpunkten im Fach
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 82
you want to appear here.
Mathematik. Die nachfolgenden Diagramme dienen der grafischen Darstellung dieser
ff
Zahlen für die Fächer Deutsch und Physik.
1%
Selbstkonzept + Interesse
+ Hoffnung auf Erfolg
15%
5%
Allgemeine Intelligenz
Furcht vor Misserfolg
79%
Gemeinsame Varianz
Abbildung 5.7 - Schulfachübergreifend: Anteile spezifischer und gemeinsamer Varianz
Selbstkonzept + Interesse
+ Hoffnung auf Erfolg
5%
7%
Allgemeine Intelligenz
Furcht vor Misserfolg
88%
Gemeinsame Varianz
Abbildung 5.8 - Deutsch: Anteile spezifischer und gemeinsamer Varianz
0%
Selbstkonzept + Interesse
+ Hoffnung auf Erfolg
15%
Allgemeine Intelligenz
3%
Furcht vor Misserfolg
82%
Gemeinsame Varianz
Abbildung 5.9 - Physik: Anteile spezifischer und gemeinsamer Varianz
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 83
ff
6 Diskussion der Ergebnisse
6.1 Stichprobe und Instrumente
Die Stichprobe weist eine sehr ausgeglichene Geschlechterverteilung auf. Die meisten
Neunt- und Zehntklässler sind 15 bzw. 16 Jahre alt und besuchen Gymnasien in Städten in
überwiegend ländlichen Gegenden. Die nach den Ausreißeranalysen verbleibende
Stichprobengröße schwankt (je nach Fragestellung) um die 980 Versuchspersonen. Dieser
Datensatz besitzt eine ausreichende Größe, um als solide Basis der Analysen zu dienen.
Die Ergebnisse der Studie sollten sich auf andere Klassen entsprechender Jahrgangsstufe
deutscher Gymnasien übertragen lassen. Allerdings mit der Einschränkung, dass sich die
Größe der besuchten Schulen auf Verhalten, Einstellungen und Zufriedenheit der Schüler
und damit auch auf die Leistungen der Schüler auswirken kann (vgl. Hemke & Weinert,
1997).
Die Aufgabengruppe Zahlenreihen des IST, der ZVT, sowie die Aufgabengruppen 1+2 des
LPS besitzen eine gute, der LPS 7 eine sehr gute interne Konsistenz. Beim LPS 1+2 und
dem LPS 4 wurden einige Items bei der Auswertung nicht berücksichtigt, da sie praktisch
keine Varianz aufklären. Wie ist dies zu erklären? Der Zeitrahmen ist beim LPS 1+2 sehr
knapp bemessen, so dass die meisten Schüler nur einen Teil der Items bearbeiteten.
Allein dadurch besitzen einige Items eine sehr niedrige Itemschwierigkeit. Beim LPS 4
hingegen ist die Itemschwierigkeit zu hoch, so dass beinahe alle Versuchspersonen das
erste Drittel der Aufgaben lösen konnten.
Die Skala Furcht vor Misserfolg besitzt eine gute, die Skala Selbstkonzept eine sehr gute
interne Konsistenz.
6.2 Dimensionsanalysen
Aus den verschiedenen Aufgabengruppen zur Intelligenzdiagnostik lässt sich ein
gemeinsamer Generalfaktor extrahieren. Die Eindimensionalität ist nicht die einzig
sinnvolle Interpretationsmöglichkeit, rechtfertigt aber die Verwendung der Allgemeinen
Intelligenz zur Vorhersage des fächerspezifischen Schulerfolgs. Wäre es nicht möglich
gewesen den Generalfaktor zu extrahieren hätte man untersuchen müssen, ob sich die
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 84
you want to appear here.
verschiedenen Bereiche der Intelligenz unterschiedlich stark auf die einzelnen Fächer
ff
auswirken. Als Alternative kommt eine zweifaktorielle Lösung in Betracht. In diesem Fall
laden auf den ersten Faktor Subtests, die aufgrund des zeitlichen Limits von einer hohen
Verarbeitungsgeschwindigkeit der Versuchsperson profitieren und die Erkennung von
Gesetzmäßigkeiten, sowie mentale Rotation voraussetzen. Dagegen enthält der zweite
Faktor Wortschatz-relevante Aufgaben und beinhaltet durch die Analogien eine
Wissenskomponente. Diese Struktur entspricht der Differenzierung zwischen Fluider und
Kristalliner Intelligenz: In einer Studie von Horn und Cattell (1967, zitiert nach Stelzl et al.,
1995) luden die Subtests „vocabulary and verbal analogies“ am Höchsten auf den Faktor
Fluide Intelligenz. Dass meine Analysen diese Befunde bestätigen spricht für die Validität
und die Zusammenstellung der Intelligenzskalen.
Der eingesetzte Fragebogen AVT hat nicht die erwartete Struktur. Bei zwei der vier
Fächern kann die Eindimensionalität auf Schulfachebene faktorenanalytisch nicht
bestätigt werden. Auch die eingesetzte Gitterversion des AVTs weist nicht die erwartete
vierfaktorielle Struktur auf, die Fächer bilden hier keine separaten Faktoren. Somit erfasst
die verwendete AVT-Skala keine fächerspezifische Anstrengungsvermeidung und wird
nicht zur Vorhersage des Schulerfolgs herangezogen.
Die übrigen Motivationsskalen lassen sich einzeln analysiert, sowohl bei schulbezogener,
als auch bei fächerspezifischer Betrachtungsweise jeweils über einen einzigen Faktor
aufklären. Die Eindimensionalität der Skalen belegt nicht das Vorliegen eines
übergeordneten allgemeinen Selbstkonzepts, (eines globalen Interesses, usw.) ist
allerdings eine notwendige Voraussetzung hierfür. In anderen Studien wurde
insbesondere das Selbstkonzept hinreichend untersucht, so dass die hierarchische
Struktur als gesichert gilt.
Die separate Analyse der einzelnen Motivationsskalen auf Schulfachebene lässt eine
vierfaktorielle Lösung erkennen, wobei ein Schulfach je einen Faktor bildet. Bei der Skala
Furcht vor Misserfolg lässt sich die eben beschriebene Struktur nicht mit einer
explorativen
Faktorenanalyse
finden,
wohl aber
durch
eine
konfirmatorische
Faktorenanalyse bestätigen. Somit konnte für jede Skala (außer beim AVT) die
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 85
you want to appear here.
fächerspezifische Struktur belegt werden. Dies ist eine notwendige Grundvoraussetzung,
ff
um eine Vorhersage des Schulerfolgs auf Fachebene zu legitimieren.
Die Motivationsskalen lassen sich faktorenanalytisch in zwei inhaltliche Bereiche
aufteilen: Interesse, Selbstkonzept und Hoffnung auf Erfolg bilden den ersten Faktor,
während die Skala Furcht vor Misserfolg den zweiten Faktor darstellt. Dieser Befund gilt
für allgemein auf die Schule bezogene Skalen, hat aber auch bei fächerspezifischer
Betrachtungsweise seine Gültigkeit. Der erste Faktor beschreibt die intrinsische
Motivation und die positive Einstellung und Erwartungshaltung dem Fach gegenüber.
Man beschäftigt sich mit dem Fach, weil man Spaß an der Thematik hat und in dem Fach
ein positives Selbstbild unterhält. Furcht vor Misserfolg hingegen beinhaltet die negativen
Emotionen die einen dazu bringen, sich mit dem Schulstoff auseinanderzusetzen. Man
arbeitet, um der Bestrafung in Form einer schlechten Note zu entgehen.
6.3 Vorhersage des Schulerfolgs
Die Schulnote als Regressand
Das Hauptziel der Studie liegt in der Vorhersage des Schulerfolgs über verschiedene
kognitive und motivationale Variablen. Dabei werden die Schulnoten des letzten Schul(halb)jahres als Indikatoren für den Schulerfolg genutzt. Natürlich stellt sich die Frage,
inwiefern diese Lehrerbeurteilung ein valides Maß für die Schulleistung darstellt. Kritisch
kann man argumentieren, dass Lehrer ihre Schüler nicht objektiv beurteilen, und dass
Schulleistungstests besser differenzieren und eine höhere Reliabilität besitzen. All das
ändert jedoch nichts an der praktischen Relevanz von Schulnoten. Sie sind das Maß, nach
denen die Leistung der Schüler beurteilt wird und mit denen sie sich nach Beendigung der
Schulzeit bewerben. Ein weiterer spezifischer Vorteil der Schulnoten für diese
Untersuchung ist neben der hohen Ökonomie die Abhängigkeit vom klasseninternen
Bezugsrahmen (zitiert nach Rost & Sparfeldt, 2002, S. 132). Dies ist hochgradig relevant,
da die motivationalen Variablen ebenfalls vom Klassenverband beeinflusst werden, und
die Klasse somit als Moderatorvariable fungiert.
Gemäß den Dimensionsanalysen werden die erhobenen Daten in drei Blöcke aufgeteilt
und zur Vorhersage der Schulleistung verwendet: Die verschiedenen Leistungs- bzw.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 86
you want to appear here.
Intelligenztests (LT) werden zu einem Generalfaktor zusammengefasst. Die Konstrukte
ff
Selbstkonzept, Interesse und Hoffnung auf Erfolg (SIHE) werden als weiterer Block in
Regressionanalysen aufgenommen, die Skala Furcht vor Misserfolg bildet (FM) eine
eigene Prädiktorvariable.
Fächerspezifische Fragestellung
Über die differenzierte Betrachtung der verschiedenen Schulfächer erhoffte ich mir eine
bessere Vorhersageleistung, als bei einer allgemein Schulbezogenen Fragestellung. Geht
man von einer hierarchischen Struktur der motivationalen Skalen aus erscheint es logisch,
dass man auf einer niedrigen Hierarchieebene bei spezifischer Fragestellung präzisere
Antworten erhält, als bei global formulierten Fragen. Bei drei der vier Schulfächer ließ sich
die erwartete Verbesserung der Vorhersageleistung beobachten. Im Fach Deutsch ist die
Vorhersageleistung der Prädiktorvariablen hingegen geringer als bei Schulbezogener
Fragestellung. Das liegt hauptsächlich daran, dass der wichtige Block SIHE weniger Varianz
aufklärt, als in den anderen Fächern. Eine mögliche Erklärung für dieses Phänomen wäre,
dass die inhaltlichen Bereiche des Deutschunterrichts mit verschiedenen Lektüren und
Themenschwerpunkten eine hohe Varianz aufweisen. So ist es vorstellbar, dass es kein
Konstrukt „globale Motivation im Fach Deutsch“ gibt, sondern dass die Motivation der
Schüler themenabhängig variiert. Jemand, der zum Beispiel Interesse an einer
bestimmten Lektüre zeigt, muss nicht unbedingt Gefallen an Gedichtinterpretationen
finden.
6.4 Anteile spezifischer und konfundierter Varianz
Im Vorfeld der Untersuchung bin ich davon ausgegangen, dass die Allgemeine Intelligenz
die höchste prädiktive Kraft besitzt, während das Selbstkonzept und die anderen
motivationalen Variablen inkrementell zur Varianzaufklärung beitragen. Diese Erwartung
wird weder bei schulbezogener, noch bei fächerspezifischer Betrachtungsweise erfüllt.
Der Block SIHE leistet durchgehend den mit Abstand größten Beitrag zur Vorhersage des
Schulerfolgs, während die Intelligenz inkrementell zur Varianzaufklärung beiträgt. Die
prädiktive Kraft der Skala Furcht vor Misserfolg lässt sich (außer im Fach Deutsch)
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 87
you want to appear here.
statistisch signifikant nachweisen, ist jedoch so gering, dass sie praktisch keine Bedeutung
ff
hat.
Analyse des Blocks SIHE
Als größte prädiktive Kraft verdient der Block SIHE besondere Aufmerksamkeit. Um
herauszufinden, welche der drei enthaltenen Motivationsskalen am meisten spezifische
Varianz aufklärt, rechnete ich erneut hierarchische Regressionsanalysen nach dem
bekannten Schema. Diesmal fungierten die Motivationsskalen Selbstkonzept, Interesse
und Hoffnung auf Erfolg als eigenständige Prädiktorvariablen für den Schulerfolg. Das
Ergebnis war in allen Fächern eindeutig: Die aufgeführten motivationalen Skalen
überlappen sich inhaltlich und ziehen etwa 50 Prozent der Vorhersagekraft aus ihre
gemeinsamen Varianz. Die zweite Hälfte stammt aus der spezifischen Varianz der Skala
Selbstkonzept, während die spezifische Varianz von Interesse und Hoffnung auf Erfolg
praktisch keine Bedeutung hat. Bei Schulbezogener Betrachtungsweise verändert sich das
Verhältnis von spezifischer zu gemeinsamer Varianz auf Vier zu Eins. Diese Daten zeigen,
dass die entsprechende Faktorenanalyse Recht mit dem Vorschlag hatte, die drei Skalen
zu einem einzigen Block zusammenzufassen. Interesse und Hoffnung auf Erfolg tragen in
den meisten Fächern inkrementell zur Varianzaufklärung bei. Ihre spezifische
Varianzaufklärung ist jedoch so gering, dass praktisch kein Nutzen daraus gezogen wird.
Wir können also festhalten, dass die Skala Selbstkonzept die mit Abstand beste
Vorhersage der Schulleistung ermöglicht, weit vor den anderen motivationalen Skalen
oder der Allgemeinen Intelligenz.
Analyse der Skala Selbstkonzept
Dieser Befund ist umso erstaunlicher wenn man bedenkt, dass die verwendete Version
des Disk-Gitters auf fünf Items reduziert wurde. Wie kann man diese Gegebenheit
erklären? Ein Blick auf die Formulierung der Items zeigt, dass sich zwei Items direkt auf
die Leistung in der Schule beziehen. Die Aussage „In [der Schule] fallen mir gute Noten
zu“ beinhaltet implizit die Einschätzung der eigenen Schulnote, während das Item „Ich
gehöre in [der Schule] zu den Guten“ die eigene (Schul-)Leistung mit denen der
Klassenkameraden in Beziehung setzt. Einerseits lässt sich argumentieren, dass diese
Items den Schüler dazu bringen seine Leistung im Klassenverbund einzuschätzen, und so
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 88
you want to appear here.
über den sozialen Vergleich ein realistisches Selbstbild (bzw. Fächerspezifisches
ff
Selbstkonzept) erhält, das mit dem Fragebogen erfasst wird. Bei kritischer Betrachtung
lässt sich feststellen, dass diese zwei Aussagen in inhaltlichem Zusammenhang zur
Schulnote stehen. Demnach fragt man mit diesen beiden Items indirekt nach dem
Regressanden, was die hohe Korrelation (r < -.6) als einen banalen Zusammenhang
erscheinen lässt. Um dieser Vermutung nachzugehen rechnete ich abermals eine
hierarchische Regressionsanalyse. Dabei bildeten die auf Klassenebene z-standardisierten
Werte der beiden kritischen Items (Nummer 3 und 4) einen eigenständigen Block,
während die restlichen Items (Nummer 1, 2 und 5) zu einer Gruppe zusammengefasst
wurden. Die anschließende Kommunalitätenanalyse der beiden Blöcke deckt auf, dass die
beiden leistungsbezogenen Items 3 und 4 zusammen etwa ein Drittel (bis zu 35 Prozent)
der aufgeklärten Varianz spezifisch vorhersagen. Der spezifische Varianzanteil der
anderen Items ist so gering, dass er zu vernachlässigen ist, während der gemeinsame
Varianzanteil der Prädiktorblöcke zwei Drittel (über 64 Prozent) der aufgeklärten Varianz
ausmacht. Die Ergebnisse der Regressionsanalysen sind im Anhang aufgelistet, die
Aufschlüsselung der Kommunalitäten befindet sich unter. Zusammenfassend lässt sich
festhalten, dass die leistungsbezogenen Items den größten Anteil der spezfischen Varianz
auf sich vereinen, der Anteil der gemeinsamen Varianz aber etwa doppelt so hoch liegt.
Damit wäre bewiesen, dass die Vorhersagekraft der Skala Selbstkonzept inkrementell
über die leistungsbezogenen Items gesteigert wird und die hohe prädiktive Kraft der Skala
zum Teil von diesen Items herrührt. Aber selbst ohne diese Items bleibt die Skala
Selbstkonzept die beste Prädiktorvariable der in dieser Studie erfassten kognitiven und
motivationalen Komponenten.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 89
ff
Aufgeklärte Varianz
47.9
Spezifitäten
Prädiktoren
gemeinsam
15
SIHE
79
LT
5
Spezifitäten
Block SIHE
gemeinsam
~50
SK
50
IHE
~0
Spezifitäten
Selbstkonzept
gemeinsam
64
Leistungsbezogen 35
Rest
1
FM
1
Abbildung 6.1 - Schulbezogen: Hierarchische Aufschlüsselung von Spezifitäten und Kommunalitäten
Allgemeine Intelligenz
Die Enge des Zusammenhangs zwischen Schulleistung und Intelligenz variiert in
verschiedenen Studien sehr stark, abhängig von der Auswahl der Verfahren, sowie Alter,
Geschlecht und internierenden Persönlichkeitsvariablen der Versuchspersonen (Sauer &
Gamsjäger, 1996). In der Literatur (Sauer, 2006) wird beschrieben, dass Intelligenztests
zwischen 25 und 45 Prozent der Schulleistungsvarianz aufklären, wobei die Korrelation zu
sprachlichen und naturwissenschaftlichen Fächern in der Sekundarstufe bei .3 liegt. In der
vorliegenden Studie fallen die Zusammenhänge für die Fächer Deutsch und Physik
deutlich kleiner aus. Wie lässt sich erklären, dass der Zusammenhang zwischen
Schulerfolg und Allgemeiner Intelligenz in dieser Studie so gering ist?
Die Schulleistung wird stärker von der Kristallinen, als der Fluiden Intelligenz beeinflusst.
Die Kristalline Intelligenz beschreibt Leistungen, die auf Sprachverständnis und
erfahrungsgeleitetem Sachwissen beruhen. Bei der vorliegenden Studie konnte ich
faktorenanalytisch zeigen, dass nur zwei der sieben Aufgabengruppen auf dem Faktor
Kristalline Intelligenz laden. Diese beiden Subtests beinhalten verbales Material, während
mit den restlichen Aufgabengruppen sprachfreie Aspekte der Intelligenz erfasst werden
(über numerisches und räumliches Material). Gaedike weist (1974, zitiert nach Sauer &
Gattringer, 1986) darauf hin, „…dass längst nicht alle kognitiven Faktoren für Erfolg in der
Schule garantieren. Es kommt also nicht darauf an, intelligent oder gar kreativ zu sein,
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 90
you want to appear here.
sondern bevorzugt werden Schüler, die in ganz bestimmter Weise intelligent sind
ff
(vorwiegend verbal).“ Durch eine andere Zusammenstellung der Subtests mit dem
Schwerpunkt auf verbalen Komponenten könnte sich demnach die Vorhersageleistung
der Intelligenz verbessern.
Die Erhebung wurde an Gymnasien und somit an einer selektiven Stichprobe
durchgeführt. Es ist davon auszugehen, dass die durchschnittliche Intelligenz der
Gymnasialschüler über dem Populationsmittelwert liegt und somit die Varianz
eingeschränkt ist. Hätte die Untersuchung an Schülern einer Gesamtschule stattgefunden,
wäre mit einer höheren Vorhersageleistung der Allgemeinen Intelligenz zu rechnen.
6.5 Bezug zu vergleichbaren Studien
###
Der positive Zusammenhang zwischen Selbstkonzept und dem Schulerfolg konnte auch in
anderen Studien nachgewiesen werden. Helmke und Weinert schreiben zu diesem
Zusammenhang (1997, S. 113): „Er ist umso stärker, je älter die Schüler sind und je höher
das Fähigkeitsniveau ist.“
Die Korrelationen fallen besonders hoch aus, wenn die Daten bereichsspezifischer
erhoben werden, und wenn anstelle von Tests Schulnoten und Lehrerurteile
herangezogen werden (Helmke & van Aken, 1995). Nach diesen Informationen ist mit
einer hohen Vorhersageleistung des Selbstkonzepts in der vorliegenden Studie zu
rechnen.
Vergleich mit der Spinath-Studie?
Wie ist die prädiktive Kraft der genutzten Variablen zu bewerten? Nach dem Modell von
Quelle wirken zur Vorhersage des Schulerfolgs
Wenn
man
bedenkt,
dass
zur
Vorhersage
der
Schulleistung
lediglich
individuumsspezifische Faktoren genutzt wurden,
Die aufgeklärte Gesamtvarianz (von etwa 50 Prozent) für das Kriterium Schulnoten
entspricht bei meiner Studie den Ergebnissen der Untersuchung von Sauer & Gattringer
(1986).
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 91
ff
7 Grenzen und Stärken der Studie
Bei der Stichprobengewinnung lässt sich kritisieren, dass die teilnehmenden Klassen nicht
zufällig ausgewählt, sondern von der Schulleitung zugewiesen wurden. Dies geschah auf
Basis von praktischen und organisatorischen Überlegungen. Ausschlaggebend war
beispielsweise, welche Klasse an dem angefragten Termin eine Doppelstunde hatte, oder
gerade nicht an einem Schüleraustausch beteiligt war. Obwohl durch diese Faktoren eine
gewisse Randomisierung gegeben ist kann man nicht ausschließen, dass die Schulleiter
mir „Musterklassen“ zuwiesen, um im Vergleich mit den anderen Gymnasien gut
dazustehen. Diese Problematik lässt sich umgehen, indem man die gesamte Population
einer Jahrgangsstufe der teilnehmenden Gymnasien testet. Dies war mir leider nicht
flächendeckend möglich, da die meisten Schulen aufgrund des Unterrichtsausfalls nur
wenige Klassen zur Verfügung stellten.
Die allgemeine Schulleistung wurde aus den Noten von vier (Haupt-) Fächern berechnet.
Es wurde versucht, je ein Fach der wichtigsten akademischen Bereiche in die Studie
einzubeziehen, um auch mit einer geringen Anzahl an Fächern eine gute Validität zu
erreichen: Die Leistungen aus Mathematik, Deutsch (als Muttersprache), Physik (als ein
naturwissenschaftliches Fach) und Englisch (als die erste Fremdsprache) wurden in der
Studie berücksichtigt. Man kann davon ausgehen, dass Schüler mit einer sprachlichen
oder naturwissenschaftlichen Begabung gleichermaßen gut abschneiden. Dagegen nimmt
die Untersuchung keine Notiz von Nebenfächern, so dass gute Leistungen in den
Geisteswissenschaften oder im musikalisch-künstlerischen Bereich keine Beachtung
finden. Man muss davon ausgehen, dass diese Fächer dennoch eine Rolle bei der
Ausbildung des fächerübergreifenden „akademischen“ Selbstkonzepts spielen. Die Folge
daraus ist, dass die wahre Vorhersageleistung des schulbezogenen Selbstkonzepts in
dieser Studie unterschätzt wird.
Im Hinblick auf weiterführende Untersuchungen bietet sich zunächst ein Vergleich mit
Schülern aus Real- und Hauptschule an. Eine entsprechende Studie kann Auskunft
darüber geben, ob sich die Ergebnisse auf andere Schulformen übertragen lassen. Es wäre
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 92
you want to appear here.
interessant zu beobachten, ob mit der Verschiebung der Intelligenzverteilung eine
ff
Veränderung der prädiktiven Kraft der Allgemeinen Intelligenz einhergeht.
Ein interessantes Projekt wäre zu untersuchen, inwiefern man die Vorhersageleistung der
Intelligenz verbessern kann. Dabei bietet sich die faktorenanalytische Zerlegung der
Allgemeinen Intelligenz in verschiedene Bereiche auf Grundlage des zu bearbeitenden
Materials an. Diese Unterteilung ist insofern sinnvoll da man erwartet, dass die Schüler in
naturwissenschaftlichen Fächern mehr von mathematischen und räumlichen kognitiven
Fähigkeiten profitieren. Dagegen sollte der Erfolg in lernlastigen Fächern stärker auf
verbalen kognitiven Fähigkeiten, bzw. Kristalliner Intelligenz basieren. Ich kann mir
vorstellen, dass eine weitergehende Strukturanalyse und die daraus resultierende
Zerlegung der Intelligenz in „fächerspezifische“ Bereiche einen zusätzlichen Gewinn
bringt. Das Berliner Intelligenzstrukturmodell würde sich aufgrund der Unterteilung in
Materialarten und „Leistungsklassen“ gut eignen. Allerdings setzt dies voraus, dass man
Kenntnis darüber besitzt, welche Fächer von welchen spezifischen Bereichen der
Intelligenz profitieren.
Im vorherigen Abschnitt wurde diskutiert, inwiefern die Formulierung der Items für die
prädiktive Kraft des Selbstkonzepts verantwortlich ist. Man kann an der Studie kritisieren,
dass zumindest zwei der fünf Aussagen inhaltlich in direkter Beziehung zur Schulnote
stehen und somit ein ganz banaler Zusammenhang gemessen wurde. Dieser Kritikpunkt
ist nicht unberechtigt, könnte aber in einer weiteren Studie überprüft werden. Dazu
müsste man erneut die in dieser Studie verwendeten Verfahren durchführen, anstelle der
Schulnote aber das Ergebnis eines Schulleistungstests als Regressanden verwenden.
Meine Untersuchung beschäftigt sich lediglich mit den linearen Zusammenhängen der
Variablen, lässt jedoch keinen Rückschluss auf ihre Kausalität zu. Dabei wäre in
Anbetracht der großen Vorhersageleistung des Selbstkonzepts die Frage wichtig, wie sich
Schulerfolg und Fähigkeitsselbstkonzept gegenseitig bedingen. Hat das Selbstkonzept der
Schüler primär Einfluss auf ihre Schulleistung, oder entwickelt sich aus der Rückmeldung
der Lehrer in Form von Schulnoten ein fächerspezifisches Selbstkonzept? Eine
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 93
you want to appear here.
Längsschnittuntersuchung ist enorm aufwendig, könnte diese Fragestellung aber
ff
beantworten.
Mit einer Längsschnittstudie ließe sich ebenfalls untersuchen, wie sich die Anteile
kognitiver und motivationaler Determinanten im Verlauf der Schulzeit verschieben. Es
existieren bereits Studien, die unterschiedliche Bereiche einzeln untersuchen, jedoch auf
Basis von Querschnittdaten. Will man aber den kontextuellen Zusammenhang erkennen
und
sehen,
wie
sich
die
Variablen
gegenseitig
beeinflussen,
ist
eine
individuumsspezifische Betrachtungsweise erforderlich.
Studien haben gezeigt, dass sich das Geschlecht auf Selbstkonzept und Interesse auswirkt,
sowie deren Einfluss auf die Schulleistung moderiert (Denissen et al., 2007). Köller et al.
(2001) führten das unterschiedliche Kurswahlverhalten von Mädchen und Jungen
hauptsächlich auf das Selbstkonzept zurück und unterstreichen damit den prognostischen
Wert dieses Konstrukts. Auch in meiner Studie konnte die besondere Stellung des
Selbstkonzepts als Prädiktorvariable bestätigt werden. Mir ging es in der vorliegenden
Untersuchung nicht darum, geschlechtsspezifischen Gruppenvergleiche anzustellen. In
Anbetracht der Befundlage erscheint es jedoch sinnvoll, der Rolle des Geschlechts im
Bezug zum Selbstkonzept bei der Vorhersage des Schulerfolgs mehr Beachtung zu
schenken.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
Seite 94
ff
8 Zusammenfassung
Ziel der Studie war die Vorhersage des Schulerfolgs in Form von Schulnoten über
verschiedene kognitive und motivationale Variablen. Dabei wurde auf Schulfachebene
differenziert und die Anteile spezifischer und gemeinsamer Vorhersagekraft ermittelt.
Die
Allgemeine
Leistungsprüfsystem
Intelligenz
(LPS),
wurde
dem
mit
ausgewählten
Intelligenz-Struktur-Test
Subtests
(IST),
aus
dem
sowie
dem
Zahlenverbindungstest (ZVT) erfasst. Die Fragebögen der Motivationsskalen wurden
jeweils auf wenige Items gekürzt, auf ein sechsstufiges Antwortformat und in eine
Gitterform gebracht. Die Aussagen waren auf die Fächer Mathematik, Deutsch, Physik
und Englisch, sowie allgemein auf die Schule bezogen. Zur Erfassung des Selbstkonzepts
wurde das DISK-Gitter herangezogen. Ferner wurden das Interessengitter und der
Anstrengungsvermeidungstest (AVT) eingesetzt. Die Konstrukte Hoffnung auf Erfolg und
Furcht vor Misserfolg wurden mit einer deutschen Form der Achievement Motives Scale
(AMS) untersucht.
Die Stichprobe bestand aus 1084 Schülern der Jahrgangsstufe 9 und 10 mit einem
durchschnittlichen Alter von 15.3 Jahren an Gymnasien in Hessen und BadenWürttemberg.
Aus den Subtests zur Bestimmung der Intelligenzleistung lässt sich erwartungsgemäß der
g-Faktor extrahieren. Bei den Motivationsskalen wurde die vorausgesetzte hierarchische
fächerspezifische Struktur faktorenanalytisch bestätigt. Außer beim AVT, der aus diesem
Grund nicht in die Regressionsanalysen einbezogen wurde, sind die SelbstkonzeptFassetten der Schulfächer als einzelne Faktoren zu erkennen. Die Prädiktorvariablen
klären bei schulbezogener 48, bei fächerspezifischer Betrachtungsweise zwischen 39 und
53 Prozent der Varianz der Schulnoten auf. Das Selbstkonzept ist in allen Bereichen der
mit Abstand beste Prädiktor. Etwa die Hälfte der Varianzaufklärung erfolgt allein über
seinen spezifischen Anteil. Zusammen mit den kumulierten Varianzanteilen von Interesse
und Hoffnung auf Erfolg wird je nach Fach zwischen 72 und 88 Prozent der Varianz
aufgeklärt. Der spezifische Varianzanteil der Allgemeinen Intelligenz liegt zwischen 2.6
und 5.4 Prozent. Die Motivationsskalen überlappen sich inhaltlich, was in einem großen
Anteil an gemeinsamer Varianz zum Ausdruck kommt. Sie tragen inkrementell zur
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that Seite 95
you want to appear here.
Varianzaufklärung bei, ihr spezifischer Anteil ist neben dem Selbstkonzept jedoch so
ff
gering, dass er keine praktische Bedeutung hat.
Error! Use the Home tab to apply Überschrift 1 to the text that you want to
appear here.. Error! Use the Home tab to apply Überschrift 1 to the text that
you want to appear here.
ff
9 Literaturverzeichnis#
10 Inhaltsindex#
Seite 96
Herunterladen