Korrekturen, Kommentare, Aufgaben (1

Werbung
02. 11. 2010
U. Mortensen
Korrekturen, Kommentare, Aufgaben (1)
Faktorenanalyse
Nach einem Veranstaltungsblock (ein Donnerstag-Freitag-Termin) liefere ich Ihnen
in diesen Texten Kommentare und Aufgaben zu dem Stoff, der im Block behandelt
wurde. Zuerst aber werden Korrekturen von Fehlern gegeben, die auf den Folien
bzw. im Skriptum aufgetaucht sind und vor der Vorlesung nicht von mir entdeckt
worden sind.
1
Korrekturen
Leider ist man als Verfasser von Skripten und ppt-Präsentationen beim Korrekturlesen
gelegentlich mit Blindheit geschlagen, so dass Tippfehler - aber leider manchmal auch
echte Fehler – überlesen werden. Die mir bis jetzt bekannten Fehler werden hier korrigiert.
1. Skriptum ’Faktorenanalyse’:
√ Seite 7, Gleichung (19): es muß natürlich k~xk =
etc heißen, nicht k~yk = ~x ′ ~x.
√
~x ′ ~x
2. Folie 4 der ppt-Präsentation ’Vektoren und Matrizen’, Normierung von Vektoren:
Man muß die Komponenten
eines Vektors ~x = x = (x1 , x2 , . . . , xn )′ nicht mit
p
dem Faktor λ = 1/ kxk = 1/kxk−1/2 multiplizieren, sondern mit dem Faktor
λ = 1/kxk = kxk−1 . Vergl. die korrigierte Folie 4, wo gezeigt wird, dass die Multiplikation mit diesem Faktor tatsächlich auf eine ’Normalisierung’ hinausläuft, d.h.
das der Vektor ~y = λ~x tatsächlich die Länge 1 hat.
Vergl. auch Skript ’Faktorenanalyse’ Seite 8, die Gleichung für λ zwischen den
Gleichungen (20) und (21), wo der korrekte Ausdruck für λ angegeben wurde.
3. Folie 6 der ppt-Präsentation ’Vektoren und Matrizen’: hier wird eigentlich kein
Fehler korrigiert, sondern nur eine bessere Darstellung gegeben. Es wird gezeigt,
dass der Produkt-Moment-Korrelationskoeffizient (i) ein Skalarprodukt ist, und
(ii), dass rxy = cos θxy ist, wobei θxy der Winkel zwischen den Vektoren ~x und ~y
ist. Diese Beziehung erweist sich als hilfreich bei der inhaltlichen Diskussion von
Korrelationen und Skalarprodukten allgemein.
4. Matrixmultiplikation: Die Regel der Matrixmultiplikation läßt sich wie in der Abb.
1 dargestellt veranschaulichen. Herzlichen Dank an den Kommilitonen, der mich
an diese Darstellung erinnert hat!
1
Abbildung 1: Veranschaulichung der Matrixmultiplikation; A × B = C. Das Element
cij (i-te Zeile, j-te Spalte von C) ist gleich dem Skalarprodukt der i-ten Zeile (i-ter
Zeilenvektor) von A mit der j-ten Spalte (j-ter Spaltenvektor) von B. Damit dieses
Skalarprodukt gebildet werden kann, muß die Matrix A so viele Spalten n haben, wie die
Matrix B Zeilen hat. Die Anzahl m der Zeilen von A und die Anzahl p der Spalten von
B ist jeweils beliebig; C hat jedenfalls m Zeilen und p Spalten.
j
j-te Spalte
n
p
p
j-te Spalte
i-te Zeile
=
i
C
n
m
2
c ij
i-te Zeile
B
A
m
Kommentare
Nach einer bisher sehr allgemeinen Einführung in die Idee der Faktorenanalyse sind
vornehmlich formale Aspekte dieses Verfahrens besprochen worden; insbesondere wurden
die Grundbegriffe des Vektor– und Matrixkalküls vorgestellt. Die folgenden Kommentare
sollen Sie etwas mehr mit den psychologischen Aspekten diese Ansatzes vertraut machen;
im Verlauf der Veranstaltung werden die Aspekte (hoffentlich!) noch klarer werden.
2.1
Verstehen und formale Methoden
Spätestens seit Dilthey1 in seiner Schrift ”Ideen über eine beschreibende und zergliedernde Psychologie ”2 den Satz ”Die Natur erklären wir, das Seelenleben verstehen wir”
formulierte, wird die Psychologie von einigen Psychologen und vielen Nicht-Psychologen
als eine mit formalen und statistischen Methoden inkompatible Wissenschaft verstanden.
Stegmüller (1983)3 hat zwar nach tiefgehender Analyse die Dichotomie von Verstehen und
Erklären als völlig fruchtlos erklärt, aber seine Argumentation hat die breitere Öffentlichkeit nicht erreicht oder wird, auf der Basis eher intuitiver Plausibilitätsbetrachtungen,
für irrelevant erklärt.
Die Pro- und Kontra-Argumentationen können hier nicht noch nicht einmal skizziert
werden. Es soll einfach darauf hingewiesen werden, dass ’verstehende’ Betrachtungen und
statistische Modelle eine eher komplementäre und keine kontradiktorische Rolle in der
Psychologie spielen. Statistische Modelle dienen zum Teil der Exploration von Daten,
mehr noch aber der Überprüfung theoretischer Annahmen, die von einer introspekti1 Wilhelm Dilthey (1833 - 1911), Philosoph – er entwickelte die ’Lebensphilosophie’ – plädierte für
eine geisteswissenschaftliche Psychologie.
2 Wiederabdruck in Dilthey, W.: Die Philosophie des Lebens. Eine Auswahl aus seinen Schriften.
Göttingen 1961
3 Stegmüller,W.: Erklärung, Begründung, Kausalität. Berlin 1983
2
ven,’verstehenden’ Psychologie (im Sinne Diltheys) nicht geleistet werden kann. In Bezug auf die Faktorenanalyse (und die sie approximierenden Verfahren) läßt sich diese
Beziehung zwischen Theorie und Daten leicht illustrieren.
Man betrachte zunächst den Intelligenzbegriff. Spearmans g-Faktor-Theorie erwies
sich bekanntlich bald als nicht geeignet, eine hinreichende Erklärung für die empirischen
Befunde liefern zu können. Treibt man beim Lösen von Problemen etwas Introspektion
– also ’verstehendes’ Nachvollziehen – so erscheint es bald als naheliegend, dass in vielen
Aufgaben zum Problemlösen verschiedene kognitive Aktivitäten gleichzeitig gefordert
werden: oft werden gewisse Fähigkeiten im Kopfrechnen, im räumlichen Vorstellungsvermögen, in der verbalen Artikulationsfähigkeit etc. verlangt, um eine Aufgabe lösen
zu können. Man beobachtet bei sich und bei Probanden, dass manche Aufgaben nicht
unter den gegebenen Randbedingungen gelöst werden können, weil eine dieser kognitiven Funktionen aus was für Gründen auch immer nicht in hinreichendem Maße zur
Verfügung steht. Man kommt nach einigem Nachdenken zu der Vermutung (wie die Geschichte der Psychologie, insbesondere der Entwicklung psychometrischer Tests zeigt, hat
dieser Prozess viele Jahre gedauert), dass eine Reihe grundlegender kognitiver Fähigkeiten unabhängig voneinander von einer Person zur anderen in ihrer Ausprägung variieren
können. Eine dem Diltheyschen Verstehen weitgehend entsprechenden Betrachtung führt
schließlich zu einer Theorie (oder besser: Hypothese), derzufolge eine komplexe Aufgabe
dann gelöst werden kann, wenn die Person, der die Aufgabe gegeben wird, die notwendigen Teilfähigkeiten in einem Ausmaß besitzt, das es der Person ermöglicht, die Aufgabe
zu lösen. Eventuell kann es gelingen, den Anteil der Teilfähigkeiten, die zur Lösung der
Aufgabe benötigt werden, abzuschätzen.
Bis hierher ist die Theorie des Problemlösens qualitativ entwickelt worden. Die Frage
ist, wie man sie testet. Denn es ist keineswegs klar, ob die Theorie der Wirklichkeit des
Problemlösens entspricht. Es gibt alternative Theorien, etwa die, dass die Lösung für eine
Aufgabe ein ganzheitlicher, gestalthafter Prozess ist, aus dem sich keine Komponenten
isolieren lassen. Es kommt nun zu einem zweiten Schritt, nämlich der Formulierung eines
Modells des Problemlösens, das der bis jetzt nur verbal formulierten Theorie entspricht
und das eine Überprüfung der Theorie gestattet. Dazu geht man zunächst davon aus,
dass die Theorie ja die Existenz kognitiver Komponenten behauptet. Demnach muß man
annehmen, dass die gesamte kognitive Aktivität, die zu Lösungsfindung benötigt wird,
sich gewissermaßen prozentual in Komponenten aufteilen läßt, etwa 10% Kopfrechen, 20
% räumliches Vorstellungsvermögen, 20% sprachliche Artikulationsfähigkeit, etc. Dann
muß man annehmen, dass die getestete Person diese Fähigkeiten mit bestimmten Ausmaßen besitzt, und in Abhängigkeit von diesen Ausmaßen wird sie die Aufgabe lösen oder
nicht lösen. Weiter muß man eine Hypothese darüber, wie die kognitiven Komponenten
zusammenwirken, aufstellen. Wenn die Aufgabe durch prozentuale Anteile von notwendigen Teilfähigkeiten charakterisiert ist und die notwendige Gesamtleistung gleich 100%
gesetzt wird, liegt es nahe, einen additiven Ansatz zu versuchen: der Punktwert, den sich
die Person beim Lösen von Aufgaben eines gegebenen Typs verdient, sollte dann durch
einen Ausdruck wie
x = a1 F1 + a2 F2 + · · · + an Fn
(1)
gegeben sein. Die a1 , a2 , . . . , an repräsentieren die für die Lösung notwendigen Maße an
Fähigkeiten in der Aufgabenstellung, und die F1 , F2 , . . . , Fn repräsentieren hier die Ausmaße der Teilfähigkeiten (kognitive Komponenten), über die die getestete Person verfügt.
3
Die Gleichung ist gewissermaßen eine Regressionsgleichung, bei der die F1 , F2 , . . . , Fn die
Rolle der Werte von Prädiktoren haben und die a1 , a2 , . . . , an die Rolle der Regressionsgewichte spielen, von denen der Punktwert x abhängt. Dass man noch einen Fehlerterm
e hinzufügen kann, ist für die hier durchgeführte Betrachtung irrelevant. Es müßte jetzt
noch der Fall diskutiert werden, dass x nur die Werte 1 (für ”gelöst”) und 0 (für ”nicht gelöst”) annehmen kann, aber technische Details wie diese können hier zunächst übergangen
werden.
Mit (1) ist man bei einem faktorenanalytischen Modell angelangt. Es fehlt nur noch
der Index i für die i-te getestete Person und der Index j für die j-te Aufgabe. Denn
natürlich sind weder die Fk noch die ak , k = 1, . . . , n, bekannt, müssen also aus den Daten
geschätzt werden. Dieses Schätzproblem führt dann zur Matrixrechnung: ein befreundeter
Mathematiker hat unserer Psychologin, die die obige Theorie aufgestellt hat, geraten,
sich mit dem Matrizenkalkül bekannt zu machen, über ihn könne eine Lösung für das
Schätzproblem gefunden werden, insbesondere dann, wenn noch postuliert wird, dass die
Fk in der Population der Probanden unabhängig voneinander variieren.
Dies ist eine zugegebenermaßen sehr geraffte Skizze des Wechselspiels von Verstehen
im Diltheyschen Sinne und Erklären durch ein formales Modell, das der zuerst auf der
Basis des Verstehens artikulierten Theorie in den wesentlichen Zügen entspricht. Theorien sind üblicherweise allgemeiner als ein spezielles Modell, das zum Zwecke des Tests
der Theorie entwickelt wurde. Entspricht ein Modell also nicht den Daten, so folgt noch
nicht, dass die Theorie grundsätzlich falsch ist: Ein alternatives Modell repräsentiert möglicherweise die Theorie besser as das ursprünglich formulierte. Eine weitere Diskussion
des Wechselspiels zwischen Theorien und Modellen würde in wissenschaftstheoretische
Betrachtungen führen, für die hier nicht der Ort ist. Es genügt zunächst, festzuhalten,
dass hermeneutische, also ’verstehende’ Betrachtungen und formale, ”nur” erklärende
Modelle sich keineswegs ausschließen, sondern eher in einem komplementären Verhältnis
zueinander stehen.
2.2
Ein Modell und die Schätzung der Parameter
Ein Modell entsteht aus einer allgemeinen Theorie, indem spezifizierende Annahmen gemacht werden. Bei der PCA als Approximation der Faktorenanalyse sind die Annahmen:
• Annahme 1: Die latenten Variablen sind unkorreliert, so dass keine dieser Variablen durch die übrigen im Sinne einer linearen Regression ”vorhergesagt” werden
kann. Sind L1 , L2 , . . . , Lj , . . . , Ln latente Variablen, so soll es also nicht möglich
sein, etwa Lj in der Form
Lj = b1 L1 + · · · + bj−1 Lj−1 + bj+1 Lj+1 + · · · + bn Ln
zu berechnen. ”Nicht möglich” bedeutet, dass es keine Koeffizienten b1 , . . . , bn gibt,
die die Lj in der angebenen Weise zu berechnen gestatten. Jede latente Variable
repräsentiert dann Information über eine Person, die in keiner der übrigen latenten
Variablen vorhanden ist.
4
• Annahme 2: Der Messwert für die i-te Person bei der j-ten Variablen (oder das
j-te Item in einem Fragebogen) ist eine lineare Funktion
xij = aj1 Li1 + aj2 Li2 + · · · + ajn Lin
(2)
der Li1 , . . . , Lin . Die Annahme (2) ist Ausdruck des Wunsches, die Daten mit einem
möglichst einfachen Modell zu beschreiben bzw. zu interpretieren. Der Wunsch entspricht dem Prinzip des Ockhamschen Rasierers4 , demzufolge die einfachstmögliche
Theorie zur Erklärung von Daten formuliert werden sollte: Annahmen, die nicht
unbedingt nötig sind, um die Daten zu erklären, etwa eine nichtlineare Beziehung
zwischen latenten Variablen und Messwerten, werden gewissermaßen wegrasiert.
Kommentare
• Das lineare Modell (2) sieht keine Wechselwirkungen zwischen latenten Variablen
vor, wie man sie aus der Varianzanalyse kennt. Für ein 2-faktorielles ANOVADesign hat man die allgemeine Strukturgleichung
xij = µ + µi + µj + µij + eij ,
(3)
wobei µ der allgemeine Mittelwert ist, µi und µj repräsentieren den i-ten bzw.
j-ten Haupteffekt der beiden unabhängigen Variablen, und µij bildet den Wechselwirkungseffekt ab; eij ist, wie üblich, der ”Fehler”. Die Wechselwirkung muß
notwendig durch eine nichtlineare Funktion φ(µi , µj ) der Haupteffekte µi und µj
erklärt werden: Wäre φ linear, so hätte φ die Form
φ(µi , uj ) = αµi + βµj ,
und die Strukturgleichung lautete
xij = µ + µi + µj + αµi + βµj + eij = (α + 1)µi + (β + 1)µj ,
wobei dann α + 1 und β + 1 in die Schätzungen für µi und µj ”absorbiert” werden
könnten. Eine lineare Wechselwirkung ist eben gar keine, denn sie führt wieder auf
eine Strukturgleichung ohne Wechselwirkung! Einer der einfachsten Ausdrücke für
φ ist dann
µij = φ(µi , uj ) = µi µj ,
die Effekte gehen dann nicht nur additiv, sondern auch multiplikativ und damit
eben nichtlinear in xij ein. Die inhaltliche Deutung dieses Produkts muß an den
konkreten, im Experiment untersuchten Variablen vorgenommen werden. Im Modell (2) kommt ein analoger Ausdruck der Form ar Lj Lk nicht vor.
Man muß sich klar machen, dass aus psychologischen Gründen ein solcher Ausdruck
aber Sinn machen könnte: es stehe etwa Lj für ’sprachliche Kompetenz’, Lk für
’logische Kompetenz’. Bei bestimmten Aufgabentypen könnte aber eine Interaktion
der Form
sprachliche Kompetenz × logische Kompetenz
4 William of Ockham, um 1285 in Ockham in der Grafschaft Surrey, England, geboren; Philosoph
und Theologe, wurde der Häresie beschuldigt und fand schließlich beim König von Bayern Unterschlupf.
Ockham starb 1347 in München. O. hat als einer der ersten das Sparsamkeitsprinzip (Ockham’s Razor)
für wissenschaftliche Theorien aufgestellt.
5
durchaus von Bedeutung sein, weil oft die sprachliche Umformulierung eines Problems die logische Analyse erleichtert und insofern auch den Punktwert xij beeinflußt; die Lösungskompetenz wird neben den ”Haupteffekten” aj Lj und ak Lk noch
durch einen Term beschrieben, demzufolge die sprachliche Kompetenz proportional
zur logischen Kompetenz bzw. die logische Kompetenz proportional zur sprachlichen Kompetenz wirksam wird. Eine solche Wechselwirkung widerspricht nicht der
Forderung, dass die Ausprägungen von sprachlicher Kompetenz einerseits und logischer Kompetenz andererseits unkorreliert sind, die eine Fähigkeit also nicht auf
Grund der anderen vorausgesagt werden kann.
• Die Items bzw die gemessenen Variablen werden durch die – für das j-te Item –
Gewichte aj1 , . . . , ajn auf den maximal n latenten Variablen repräsentiert. Sie repräsentieren nur das j-te Item, ohne Bezug auf eine Person, und können als Anteile
interpretiert werden, mit denen das j-te Item oder die j-te gemessene Variable die
in den Personen wirkenden latenten Variablen erfordert.
Die Personen i = 1, . . . , m werden wiederum durch die Li1 , . . . , Lin repräsentiert,
ohne Bezug auf irgendwelche Items.
• Gemäß (2) wird der Messwert xij ist durch ein Skalarprodukt definiert. Es sei
~i = (Li1 , . . . , Lin )′ . Äquivalent zu (2) hat man also
~aj = (aj1 , . . . , ajn )′ und S
~i′~aj .
xij = S
(4)
Die Korrelation zwischen zwei Variablen entspricht formal einem Skalarprodukt.
~ ′~aj und damit der Messwert
Umgekehrt kann man sagen, dass das Skalarprodukt S
i
xij einer Korrelation zwischen den Anteilen aj1 , . . . , ajn und den Ausprägungen
Li1 , . . . , Lin entspricht, mit dem Unterschied allerdings, dass xij nicht auf das Intervall (-1, 1) beschränkt ist, weil die ajk und Lik nicht in geeigneter Weise normiert
sind.
Man kann sich an dieser Beziehung verdeutlichen, in welcher Weise der Messwert
xij von den Ausprägungen Lik der latenten Variablen Lk bei der i-ten Person und
den Anteilen ajk , mit denen die j-te Variable das k-te latente Merkmal erfasst,
abhängt. Denn für das Skalarprodukt gilt die allgemeine Beziehung (vergl. Folie 5
der ppt-Präsentation ’Vektoren und Matrizen’)
cos θij =
~ ′~aj
S
i
,
~i kk~aj k
kS
(5)
~i und dem Vektor ~aj ist. Man muß
wobei θij der Winkel zwischen dem Vektor S
~
generell kSi k 6= 0 und k~aj k 6= 0 voraussetzen, weil sonst cos θij nicht definiert ist.
Dies bedeutet, dass vorausgesetzt wird, dass jede Person auf mindestens einer der
latenten Variablen eine Ausprägung ungleich Null hat (im Intelligenztest: sie muß
über mindestens eine von Null verschiedene Grundfähigkeit verfügen), und jede
Variable (Item, Aufgabe) muß mindestens eine der latenten Variablen erfassen.
~i beschreiben das Eigenschafts- oder Fähigkeitsprofil der
Die Komponenten von S
~i k des Vektors gibt an, wie ausgeprägt diese Merkmale
i-ten Person; die Länge kS
~i k. Analog
insgesamt sind, – je größer die Lij -Werte sind, desto größer wird kS
6
dazu gibt k~aj k an, in welchem Ausmaß eine Variable (Item, Aufgabe) die latenten
Variablen überhaupt erfaßt.
Man kann nun anhand von (5) zeigen, welchen Wert xij maximal annehmen kann.
Der maximale Wert von cos θij ist Eins: cos θij = 1 (die Kosinus-Funktion kann
nur Werte zwischen -1 und +1 annehmen). cos θij = 1 dann, wenn etwa θij = 0 ist;
~i und ~aj die gleiche Orientierung. Dies bedeutet, dass die
in diesem Fall haben S
~i und ajk proportional zueinander sind, so dass Lik = αajk
Komponenten Lik von S
für alle k = 1, . . . , n, wobei die Proportionalitätskonstante α für alle k identisch ist.
Die Bedingung cos θij = 1 impliziert nach (5) dann
~i ′~aj
S
= 1,
~i kk~aj k
kS
also
~i ′~aj = kS
~i kk~aj k,
xij = S
(6)
~i und ~aj sein! Für
d.h. xij kann höchstens so groß wie das Produkt der Längen von S
~
eine gegebene Person mit einer Merkmalsausstattung Si ist der maximalmögliche
Messwert also ”klein”, wenn k~aj k klein ist, die j-te Aufgabe oder die j-te Variable
die latenten Variablen also nur wenig erfasst. Umgekehrt kann der Maximalwert für
~i k verfügt.
xij ”klein” sein, wenn die Person nur über eine mickrige Ausstattung kS
~i k und k~aj k können auch beide groß sein, und trotzdem kann
Aber die Längen kS
~i ′~aj klein
xij einen Wert nahe Null haben, – wenn nämlich das Skalarprodukt S
0
ist. Dies ist der Fall, wenn θij einen Wert nahe 90 hat, wenn die beiden Vektoren
senkrecht oder nahezu senkrecht aufeinander stehen. Man kann etwas salopp sagen,
dass xij dann klein oder nahezu Null ist, wenn das Aufgaben- oder Merkmalsprofil
~i – und das Aufgabenprofil – also die Komponenten
– also die Komponenten von S
von ~aj – nicht oder nur gering miteinander korrelieren.
• Das Modell (2) kann und wird auf nahezu beliebige Daten angewendet, denn es zeigt
sich, dass die ajk und die Lik fast immer geschätzt werden können. Das Modell ist
anhand von Problemlöseaufgaben plausibel gemacht worden. Die Frage ist aber, ob
es auch für alle Antwortprozesse ein vernünftiges Modell ist.
Man betrachte z.B. die Ratings, die eine Person auf Skalen liefert, wenn sie eine
Vorlesung begutachtet. Die Skalen sind die ”Items” oder die ”gemessenen Variablen”. Wendet man das Modell (2) auf die Ratings an, so nimmt man damit an,
dass es latente Variablen L1 , . . . , Ln gibt, die eine Art Bezugssystem für alle im Fragebogen vorkommenden Items bilden. Man muß auch fragen, was die Lik in diesem
Zusammenhang bedeuten. Es werden ja Meinungen, nicht Fähigkeiten abgefragt.
Man kann annehmen, dass die Lik die Relevanz des k-ten latenten Merkmals für
die i-te Person bei der Beurteilung der Vorlesung abbilden.
Es ist aber doch denkbar, dass einige Items nur eine bestimmte ”latente” Variable
erfassen, also ein Merkmal, das für die Beurteilung einer Vorlesung von Belang ist,
und andere Items wieder ganz andere Merkmale. Weiter wird implizit angenommen,
dass die L1 , . . . , Ln ein Bezugssystem für alle beurteilenden Personen darstellt, –
7
denkbar ist aber doch, dass verschiedene Personen auch verschiedene Bezugssysteme haben, und etwa die latente Variable L1 nur von einigen, keineswegs aber von
allen Personen berücksichtigt wird.
Tatsächlich kann das Modell (2) zumindest im Prinzip diesen Fall abbilden. Denn
es werden ja keine weiteren Einschränkungen bezüglich der Anteile ajk gemacht.
Erfassen einige Items nur L1 , andere wieder nur das Merkmal L2 , etc., so für die
ersten Items nur aj1 6= 0, und alle anderen ajk sind gleich Null. Analog dazu sind
für die Items der zweiten Art nur die aj2 6= 0 und alle übrigen sind gleich Null,
etc. Eine analoge Betrachtung zeigt, dass Personen, die etwa L1 gar nicht in ihrem
persönlichen Bezugssystem haben, durchaus ihre Berücksichtigung im Modell haben: Für sie ist einfach Li1 = 0 und damit geht L1 nicht in ihr Urteil ein. Benutzt
eine Person Pi ein Bezugssystem mit latenten Variablen, die von keiner anderen
Person benutzt werden, so haben alle Personen Pi′ 6= Pi , die keine der Variablen
von Pi benutzen, für diese Personen einen Ausprägungs- oder Relevanzwert von 0.
Es gibt hier aber gewisse Einschränkungen mathematischer Art, auf die in der Vorlesung noch eingegangen wird. Jedenfalls scheint das Modell hinreichend allgemein
zu sein, um gewissermaßen als Omnibus-Modell auf alle möglichen Fragestellungen
anwendbar zu sein. Gleichwohl sollte man stets inhaltliche Überlegungen anstellen,
um zu prüfen, ob das Modell sinnvolle Interpretationen für die Daten liefert. Darauf
wird in der Vorlesung noch gesondert eingegangen werden.
3
Aufgaben:
Die Aufgaben dienen (i) dem Umgang mit Vektoren und Matrizen, (ii) der Vertiefung
des Verständnisses für das Modell.
1. Es sei
T =
1 2
3 4
,
~x =
2
3
.
Berechnen Sie den Vektor ~y = T ~x. Zeichnen Sie beide Vektoren in ein Koordinatensystem ein, wobei die Anfangspunkte der Vektoren in den Koordinatenursprung
gelegt werden. Welchen Wert hat das Skalarprodukt ~x ′ ~y? Welchen Wert hat der
Kosinus des Winkels θxy zwischen den beiden Vektoren?
2. Es sei
B=
2 1
2 3
.
Bestimmen Sie (i) die Produkte C = T B und D = BT . Berechnen Sie (ii) ebenfalls
die Produkte B ′ T ′ und T ′ B ′ ; wird die Regel (T B)′ = B ′ T ′ bestätigt?
3. Die Antworten auf den Rating-Skalen (Items) zur Bewertung einer Vorlesung werden durch zwei latente Dimensionen bestimmt: D1 : Der Stoffumfang ist angemessen, D2 : Der Dozent ist fachlich kompetent. Die i-te befragte Person beziehe sich
mit den Maßen Li1 = .25 und Li2 = .75 auf diese Dimensionen, wenn sie ihre
Antworten auf die Items angibt. Die j-te Rating-Skala ’Der Dozent kann komplexe
Sachverhalte anschaulich darstellen’ erfasse die erste latente Dimension mit dem
8
Anteil aj1 = .4, die zweite mit dem Anteil aj2 = .36. Welchen Wert xij kreuzt diese
~i k und k~aj k?
Person auf der j-ten Skala an? Welche Werte haben die Längen kS
~
Welchen Winkel θij bilden die Vektoren Si und ~aj ? Was wäre der maximalmög~i k und k~aj k fest vorgegeben sind? In welchem
liche xij -Wert, wenn die Längen kS
~i und ~aj dann zueinander?
Verhältnis stehen die Komponenten der Vektoren S
~ ′~aj = 0, wenn also die Kom4. Es ist oben festgestellt worden, dass xij = 0, wenn S
i
ponenten Lik nicht mit den Komponenten ajk ”korrelieren”. Wie können Sie dieses
Ergebnis veranschaulichen? Hinweis: betrachten Sie die Regressionsgerade für die
~ ′~aj = 0 läßt sich
Punkte (Lik , ajk ) für k = 1, . . . , n. Die Aussage xij = 0 wenn S
i
dann inhaltlich ’verstehen’.
9
Herunterladen