Nagl, Multilevel-Materialien, Intraclass Seite 1 Messung der Abhängigkeit von Messungen in Gruppen Bei den üblichen statistischen Verfahren wird unterstellt, dass die Messungen stochastisch unabhängig sind. Dabei wird nicht adäquat berücksichtigt, dass wohl die Messungen etwa auf Ebene 1, die zur gleichen UE der Ebene 2 gehören, eventuell ähnlicher sind im Vergleich zu den Messungen an einer anderen UE der Ebene 2. Falls das zuträfe, wären die Voraussetzungen der üblichen statistischen Voraussetzungen nicht gegeben. Die bei der Analyse von Mehrebenendaten zu berücksichtigenden Abhängigkeiten bezüglich einer Variablen y innerhalb von Gruppen setzt Maße solcher Abhängigkeiten voraus. Ein solches Maß ist die Korrelation der Werte innerhalb der Gruppen, der sogenannte Intraclass-Korrelationskoeffizient(IC). Intraclass-Korrelationskoeffizient Definition des Koeffizienten Die Messungen einer Variablen y zweier UEen aus unterschiedlichen Gruppen sind unkorreliert(IC=0); die Messungen einer Variablen y zweier UEen aus der gleichen Gruppe korrelieren(IC0). Diese Korrelation IC (oder kurz: ) heißt Intraclass-Korrelation. Konkret werden für zwei UEen nur zwei y-Werte gemessen. Die Konzeption der Korrelation setzt voraus, dass die zwei Werte nur als Realisationen zweier Zufallsvariablen betrachtet werden. Mit Hilfe der Zufallsvariablen wird die Idee beschrieben, dass zwischen den Messungen zweier UEen aus derselben Gruppe etwa eine Art Ansteckungs -Prozess existiert oder etwa eine Art Gleichklang allein auf Grund der Gruppenzugehörigkeit herrscht oder aus irgendwelchen anderen Gründen eine Abhängigkeit besteht; würden etwa die Werte der beiden UEen wiederholt real etwa in zeitlichem Abstand erhoben, würde die Korrelation die Wertepaare beobachtbar. Eine negative Intraclass-Korrelation kommt dabei relativ selten vor, ist aber ebenfalls denkbar etwa infolge eines gegenseitigen Abgrenzungsprozesses oder anderer Restriktionen. Die Zufallsvariablen eines Messwertpaares werden hier durch y-Großbuchstaben beschrieben (Yij, Ykj´) für alle j UEen der 2. Stufe (j=1,...,J); innerhalb von j variiert i bzw. k jeweils von 1 bis nj. Für die Korrelation der Zufallsvariablenpaare gilt 1, für i k, j j Korr (Yij , Ykj ) IC für j j , 0 für j j wobei die Korrelation IC (oder kurz: ) IntraclassKorrelation heißt. Beispiel: Seien 3 Gruppen mit jeweils 5, 3 und zwei UEen gegeben. Dann korrelieren die Zufallvariablen mit sich selbst mit 1, miteinander in jeder Gruppe mit ; zwischen Gruppen mit 0. Y11 Y21 Y31 Y41 Y51 Y12 Y22 Y32 Y13 Y23 Y11 Y21 Y31 Y41 Y51 Y12 Y22 Y32 Y13 Y23 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 Die Korrelation zweier Variablen ist i.a. definiert als das Verhältnis der Kovarianz zum Produkt der Standardabweichungen der beiden Variablen. Da hier die 1. Variable des Paares die gleiche Varianz wie die 2. hat, kann die Korrelation auch als Verhältnis der Kovarianz der Paare zur Varianz des 1. Paarvariablen (oder der 2.) geschrieben werden: Cov (Yij , Ykj ) IC IC IC , mit . 2 2y y Var (Yij ) Var (Ykj ) Die Kovarianz IC kann auch als Intraclass-Kovarianz bezeichnet werden. Für lineare Modelle mit einem zufälligen UE2-Faktor ist IC gleich der Varianz des UE2-Faktors. Die Annahme gleicher Korrelation zwischen allen Paaren, die in der gleichen Gruppe sind, ist sicherlich sehr restriktiv. Diese restriktive Annahme kann dann etwas gelockert werden, wenn mehr über die Struktur der Abhängigkeiten bekannt ist (etwa über die gegenseitige Sympathie oder Antipathie der Mitglieder einer Gruppe oder die räumliche bzw. zeitliche Nähe der UEen, für die Messwerte vorliegen). Nagl, Multilevel-Materialien, Intraclass Seite 2 Konsequenzen der Korreliertheit der Beobachtungen Die oben besprochene Problematik, die bei Abhängigkeit zwischen Beobachtungen vorliegt, betrifft zentrale Eigenschaften von Schätzern, besonders die der Varianzschätzung. CP yy Der übliche Schätzer für die Varianz ( ˆ 2y ) ist i. a. erwartungstreu (weil die Summe der Quadrate der n 1 Abweichungen vom Mittelwert (=CPYY) durch n-1 dividiert wird). Denn es kann gezeigt werden, dass gilt: E(CPYY) = (n 1) 2y . Bei Vorliegen von Abhängigkeiten in der besprochenen Art ist dieser Schätzer für die Varianz nicht mehr erwar n 2j j 2 tungstreu, da nun gilt: E(CPYY) = y (n 1) IC 1 . Bei positiver Intraclass-Korrelation wird daher n die Varianz (bei üblicher Schätzung) stark überschätzt, besonders bei großen Gruppen. Da die Varianzschätzung selbst wiederum die Basis zur Berechnung der Konfidenzintervalle des Mittelwerts ist, werden die Konfidenzintervalle von Mittelwerten zu breit. Entsprechend sind auch die Konsequenzen für das Testen von Hypothesen gravierend. Berechnung des Koeffizienten mit Hilfe der Intraclass-Korrelationstabelle YULE G. U. & KENDALL M. G. (4. Auflage, 1964) haben für die Berechnung eine Methode vorgeschlagen, die auch die Interpretation des Koeffizienten erleichtert. Diese Berechnungsmethode sollte aber nur für die Population verwendet werden, als Schätzmethode für Stichproben ist sie nicht geeignet, wie unten gezeigt wird. Zuerst wird die sogenannte Intraclass-Korrelationstabelle erstellt. Erstellen der Intraclass-Korrelationstabelle Die Messwerte einer Variablen y für die verschiedenen UEen der ersten Ebene können innerhalb der fortlaufend nummerierten Einheiten der zweiten Ebene in eine Liste gebracht werden. Als Messwertpaare, über die korreliert werden soll, denke man sich folgenden Datensatz: alle möglichen UE1Paare aus der 1. UE2, danach alle möglichen UE1-Paare aus der 2. UE2 usw. werden untereinandergestapelt. Die so entstehende Liste heißt Intraclass-Korrelationstabelle Die Messwerte seien yij, wobei j der Index der UEen der 2. Ebene seien (j = 1, ..., J). In der j. Ebene seien nj UEen der 1. Ebene. Im Allgemeinen kann die Anzahl nj für die verschiedenen j unterschiedlich groß sein. Der 1. Index i nummeriert die UEen der ersten Ebene. Die verschiedenen Messwertpaare sind nun: (yij, ykj) für alle j, innerhalb von j variiert i bzw. k jeweils von 1 bis nj; die Werte, die zur gleichen UE der 1. Ebene gehören, werden meist weggelassen (Diagonale). 5, 5 5, 5 5, 5 4,5 1, 5 5, 5 4,5 1, 5 Beispiel: Seien Messwerte (z.B. Mathematik-Scores) für drei Leistungsgruppen gegeben . y1 1 y 21 y31 y 41 y51 y1 2 y 22 y32 y1 3 y 23 In der ersten Gruppe seien 5, in der 2. Gruppe 3 und in der 3. Gruppe 2 Schüler mit nebenstehenden Werten. Der erste Index der y-Werte sei die Nummer der Schüler innerhalb der Leistungsgruppennummern. 5,5 5,5 4,5 1, 5 5, 4 5, 4 5, 4 = 5 5 5 4 1 4 2 3 1 0 5 ,1 5 ,1 5 ,1 4 ,1 1, 4 4, 2 2, 4 3, 4 4,3 2,3 3, 2 1, 0 0 ,1 Die Wertepaare insgesamt als gestapelte Liste untereinander geschrieben heißt dann Intraclass-Korrelationstabelle. Nagl, Multilevel-Materialien, Intraclass Seite 3 Berechnen der Intraclass-Kovarianz, Varianz und Intraclass-Korrelation Nach YULE & KENDALL ist die übliche PEARSON-Korrelation der Werte aus der Intraclass-Korrelationstabelle der Intraclass-Korrelationskoeffizient IC . Bei ungleichen Gruppengrößen führt diese Art der Berechnung zu überproportionaler Gewichtung der großen Gruppen; daher wird hier eine Berechnungsvariante verwendet, bei der die Wertepaare jeweils mit der inversen Gruppengröße (1/(nj-1)) gewichtet werden. Bei gleichen Gruppengrößen ist das Ergebnis mit oder ohne Gewichtung identisch. Für die gewichtete Berechnung wird im Folgenden vorausgesetzt, dass in jeder Gruppe mindestens zwei Werte vorhanden sind(die Daten für UE1 aus Gruppen mit nur einer UE1 müssten vorher gestrichen werden). Die Berechnung der Korrelation kann dann in folgenden Schritten durchgeführt werden: J Beispiel: n 5*4 + 3*2 + 2*1 =28. Die Anzahl der Paare ist gleich n n (n 1) j1 j j Der Mittelwert der ersten Werte der Paarwerte (= y ) ist gleich dem Mittelwert der zweiten Werte der Paarwerte(= y ) und infolge der Gewichtung gleich dem Mittelwert der y-Werte selbst y = y = y 1 n Bei ungleichen Gruppengrößen stimmen diese Mittelwerte dank der vorgenommenen inversen Gewichtung mit dem Mittelwert der y-Werte ( y = 3) überein. j1 i 1 nj mit CP yy ( y ij y ) 2 j1 i 1 Die Intraclass-Kovarianz der Paare ist gleich Cov ( y , y ) CP yy nj nj J n 1 ( y ij y )( y kj y ) . n j1 j 1 i 1 k i mit dem Kreuzprodukt CP yy Intraclass-Korrelationskoeffizient IC y = 3 . Dieser Wert ist gleich dem Mittelwert der 2. Werte (da die gleichen Werte nur in anderer Reihenfolge angeschrieben gedacht werden können). nj J y ij Die Varianz der ersten Werte der Paarwerte ist wiederum gleich der Varianz der zweiten Werte der Paarwerte und gleich der Varianz der 1 y-Werte selbst: Var ( y ) = Var ( y ) = Var ( y) CP yy , n J Der Mittelwert der ersten Werte Die Kreuzprodukt der ersten Werte der Paare = CPyy = 32. Var ( y) = 3.2 Die zweiten Werte der Paare sind wiederum nur eine andere Reihenfolge der ersten, daher ist auch die Varianz der zweiten gleich der Varianz der ersten. Das Kreuzprodukt der ersten Werte mit den zweiten Werten der Paare = CPyy = 13; Cov ( y , y ) = 1.3 In der Berechnungsformel für CPyy bleibt das Gewicht erhalten. CP yy Schätzvorschlag für den Intraclass- CP yy Korrelationskoeffizienten IC = 13 = 0.41. 32 Kreuzprodukt der 1. und 2. Werte und die Quadratsumme zwischen den Gruppen (=BSS) BSS(=Between Sum of Squares) stellt die Unterschiede zwischen den Gruppen (genauer den GruppenmittelwerJ ten) dar: BSS n j ( y j y ) 2 . j1 Das gewichtete Kreuzprodukt der 1. und 2. Werte der Paare CPyy ist im wesentlichen gleich der Between Sum of Squares, genauer der Differenz von BSS zu einer relativ kleinen Korrektursumme (=GWSS). J J j1 n j 1 ( y ij y j ) 2 j1 n j 1 i 1 CP yy n j ( y j y ) 2 = BSS GWSS ; mit GWSS = J n j1 Beispiel: Das Kreuzprodukt des jeweils 1. mit dem 2. Wert des Paares CPyy = 13. BSS = 17.5. nj 1 ( y ij y j ) 2 1 i 1 j Daher ist GWSS = 4.5. GWSS ist eine gewichtete Form der sogenannten Within Quadratsumme (Variation innerhalb der Gruppen). In dieser Terminologie wird auch das Kreuzprodukt der y-Variable mit sich selbst als Total Sum of Squares J nj bezeichnet: TSS = CP yy ( y ij y ) 2 . j1 i 1 Nagl, Multilevel-Materialien, Intraclass Seite 4 Schätzung der Varianz, Intraclass-Kovarianz und Intraclass-Korrelation Wie schon oben erwähnt, sollte die obige Methode der Berechnung nicht als Schätzmethode in Stichproben verwendet werden. Denn Schätzer sollten bestimmten Anforderungen (Konsistenz, Erwartungstreue usw.) genügen. Bereits oben bei der Behandlung der Konsequenzen der Abhängigkeit wurde deutlich, dass die Varianz von y nicht durch die übliche Formel erwartungstreu geschätzt werden kann, egal ob durch n oder (n-1) dividiert wird. Das gilt auch für die Intraclass-Kovarianz. Denn die Erwartungswerte der beiden in Kreuzproduktform geschrieben sind: j n 2j E(CP YY ) IC n 1 q 2y , mit q n E(CP YY ) 2y (n 1) IC q 1 Schätzung mit Hilfe der Kreuzprodukte nach der Momentenmethode (Erwartungswertmethode) Erwartungstreue Schätzer für 2y und IC können aber aus den obigen beiden Gleichungen nach der in diesem Zusammenhang klassischerweise verwendeten Momentenmethode konstruiert werden, wobei die Erwartungswerte der Kreuzprodukte den Stichprobenkreuzprodukten schätzartig gleichgesetzt werden E(CPYY ) CPyy und E(CPYY ) CPyy . Die Lösung des Gleichungssystems liefert Schätzer, die erwartungstreu sind: ˆ IC ˆ 2y 1 n ( n q ) 1 n ( n q ) CP YY CP YY (n 1) CP YY (n (q 1)) CP YY (q 1) Daraus folgt auch, dass rIC CP yy CP yy , mit q j n 2j n Beispiel: Bei Interpretation der Daten als Stichprobe mit q=3.8 und n=10: ˆ IC (32+13*9)/(10*6.2) = 149/62 = 2.4. ̂ 2y =(32*(10-2.8)+13*2.8)/62 = 4.3. kaum ein vernünftiges Schätzanalogon zu IC IC 2y ist. Auch wenn das Verhältnis zweier erwartungstreuer Schätzer nicht notwendigerweise ein erwartungstreuer Schätzer für das Verhältnis der Parameter ist, ist sicherlich der auf den erwartungstreuen Schätzern aufbauende ein besserer Schätzer als das Verhältnis der beiden Kreuzprodukte. Daher der Vorschlag zur Schätzung des Intraclass-KorrelationskoeffiDie Schätzung für den Intraclasszienten auf der Basis der erwartungstreuen Schätzer für 2y und IC : Korrelationskoeffizienten ergibt: ̂ IC = 2.4 / 4.3 j n 2j ˆ CP YY CP YY (n 1) = (32 + 13*9) / (32*(10-2.8)+13*2.8) = 0.5585 ˆ IC IC , mit q CP YY (n (q 1)) CP YY (q 1) n ˆ 2y Schätzung mit Hilfe von BSS nach der Momentenmethode (Erwartungswertmethode) Bei den Kreuzprodukten der ersten mit den 2. Werten der Paare muss immer die Voraussetzung erfüllt sein, dass in jeder Gruppe mindestens 2 UEen vorhanden sind. Für die Berechnung von BSS ist eine solche Voraussetzung nicht nötig, ebenfalls nicht für TSS. Daher können die Schätzer auch unter Verwendung dieser beiden Statistiken aufgebaut werden. Die Erwartungswerte der beiden sind: j n 2j E(BSS ) 2y (J 1) IC (n q (J 1)) , mit q n E(TSS ) 2y (n 1) IC q 1 Die Lösung des Gleichungssystems nach der Momentenmethode liefert wiederum erwartungstreue Schätzer: ~ IC ~2 y 1 BSS (n 1) TSS(J 1) ( n J )( n q ) 1 TSS(n q (J 1)) BSS (q 1) ( n J )( n q ) , mit q j n 2j Beispiel: BSS = 17.5, TSS=32, q=3.8 und n=10: ~ (17.5*9-32*2)/(7*6.2) = 2.1544. IC n ~ 2 =(32*(10-3.8-2)+17.5*2.8)/(7*6.2) = 4.228. y Nagl, Multilevel-Materialien, Intraclass Seite 5 Wie an Hand des Beispiels deutlich wird, liefern diese beiden Schätzer leider nicht das gleiche Ergebnis wie die vorherigen Schätzer. Die beiden Schätzer würden das gleiche Ergebnis dann liefern, wenn alle Gruppen gleich groß wären. Speziell wegen der Problematik ungleicher Gruppengrößen wurden Maximum-Likelihood-Schätzer entwickelt, die bevorzugen sind. Beschreibung der Daten durch ein lineares Modell Für jede der J Gruppen werden nj Responsewerte(=y) erhoben. Bei der Darstellung der Daten sollte das Modell zumindest zwei Quellen der Variation berücksichtigen, die gruppenspezifische (2. Ebene) und die der 1. Ebene. Die beiden Komponenten werden im linearen Modell addiert (es werden hier und nachfolgend i. a. der Einfachheit halber auch für die Bezeichnung der Zufallsvariablen Kleinbuchstaben verwendet; aus dem Zusammenhang sollte ersichtlich sein, wann der Buchstabe eine Realisation oder eine Zufallsvariable darstellt). Der Responsewert Für die i. UE 1. Ebene der j. Gruppe gelte: werde als lineare y ij a j e ij , mit Funktion des UEena j als Effekt der j. Gruppe und Effekts und einer Störgröße dargestellt. e ij als Störgröße Beispiel: Der Mathematikscore (y) eines Schülers ist beschreibbar als Summe aus dem Leistungsniveau der Gruppe (aj) und der individuellen Komponente (= eij). Die Modellgleichung y ij a j e ij ist nicht nur als Beschreibung der Daten für eine Realisation zu lesen, sondern als die Beschreibung des Vorgangs, wie die Werte entstehen. I. a. wird unterstellt, dass die Störgröße e ij für jede i. UE1 innerhalb der j. Gruppe zufällig aus der gleichen Verteilung von Störgrößen gezogen wird. Sie ist daher auf jeden Fall eine Zufallsvariable (infolgedessen ist auch yij eine Zufallsvariable). Status des Gruppeneffekts (fix oder stochastisch): Der Effekt der j. Gruppe aj könnte eventuell als feste (fixe) Größe konzipiert werden, wenn sich die Überlegungen auf eine fest abgegrenzte (meist gut überschaubare) Population von Gruppen bezieht, die vollständig erhoben wird. Das ist immer dann möglich, wenn die Gruppen inhaltlich beschrieben werden (z.B. die Gruppen von Männer und Frauen bzw. die Gruppen der Unterschicht, Mittelschicht und Oberschicht usw.). Andererseits sind Gruppen oft selbst eine Zufallsauswahl aus einer Gesamtheit von Gruppen. Auf der Entdeckung von Unterschieden zwischen Gruppen liegt dann der Schwerpunkt der Überlegungen (nicht den Unterschieden zwischen speziellen Gruppen gilt das Interesse). Die Stichprobe der Gruppen ist dann nur ein Mittel zum Zweck des Schließens auf die Gesamtheit der Gruppen. Falls diese Konzeption vorliegt, wird aj als Zufallsvariable aufgefasst (die Effekte aj werden dann auch stochastisch bzw. random genannt). Die Effekte aj aller möglichen Gruppen zusammen bilden die Populationsverteilung der Effekte. Dadurch dass eine Gruppe zufällig ausgewählt wird, wird implizit gleichzeitig der Effekt zufällig aus dieser Populationsverteilung der Effekte gezogen. Der Effekt ist aber durchaus fest mit der ausgewählten Gruppe verbunden. Da die Gruppen bei Mehrebenenanalysen selten vollständig erhoben werden, wird meistens die Idee der zufälligen Auswahl der Gruppen und damit die Idee stochastischer Gruppeneffekte verwendet. Stochastische Unabhängigkeit von Störgrößen und Gruppeneffekten Drei Arten von Unabhängigkeitsforderungen können unterschieden werden: Jede der Störgrößen (eij) ist von allen andern Störgrößen (ei´j´) stochastisch unabhängig. In Stichprobensprache ausgedrückt heißt das, dass alle Störgrößen unabhängig voneinander gezogen werden. Jeder der stochastischen Gruppeneffekte (aj) ist von allen andern stochastischen Gruppeneffekten (aj´) stochastisch unabhängig. In Stichprobensprache ausgedrückt heißt das, dass alle Gruppeneffekte unabhängig voneinander gezogen werden. Alle Störgrößen (eij) sind stochastisch unabhängig von allen Gruppeneffekte (aj). In Stichprobensprache ausgedrückt heißt das, dass das Ziehen der Störgrößen unabhängig von den Gruppeneffekten gezogen werden. Nagl, Multilevel-Materialien, Intraclass Seite 6 Für manche Folgerungen reicht die Forderung der Unkorreliertheit; die Unabhängigkeit impliziert die Unkorreliertheit. Umgekehrt impliziert die Unkorreliertheit nur bei normalverteilten Größen die stochastische Unabhängigkeit. Mittelwerte bzw. Varianzen von Größen in der Population entsprechen den Erwartungswerten bzw. Varianzen der Zufallsgrößen (beim einmaligen Ziehen). y ij a j e ij , mit E(a j ) a , Var (a j ) 2u und E(e ij ) 0 , Var (e ji ) e2 Meist wird der Gruppeneffekt selbst zentriert dargestellt mit u j a j a . Das Modell kann mit diesen Größen dann so formuliert werden: y ij a u j e ij , mit E(u j ) 0 , Var (u j ) 2u und E(e ij ) 0 , Var (e ji ) e2 Wegen der Unabhängigkeit der Zufallsgrößen sind auch alle Kovarianzen (und Korrelationen) zwischen irgendwelchen Stör- bzw. Effektgrößen gleich Null. Die Varianz von yij ist gleich der Summe dieser beiden Varianzen Var ( y ij ) 2u e2 . Denn: Var ( y ij ) = Var (a u j e ij ) = (a ist eine Konstante, Konstanten ändern die Varianz nicht) = Var (u j e ij ) = (Die Varianz einer Summe von unkorrelierten Zufallsvariablen ist die Summe der Varianzen der Summanden) = 2 2 Var (u j ) Var (e ij ) = u e . Qed. Die im vorigen Abschnitt allgemein konzipierte Varianz Var ( y ij ) 2y ist gleich Summe der Varianzen der stochastischen Gruppeneffekte und der Störgröße. Intraclass-Kovarianz und –Korrelation für die Population Auf Grund der Annahmen für dieses Modell kann die Intraclass-Kovarianz direkt berechnet werden, das ist die Kovarianz innerhalb der gleichen Gruppe j zwischen zwei verschiedenen UEen i und i´: Cov ( y ij , y ij ) 2u Denn: Cov( y ij , y ij ) = Cov(a u j e ij , a u j e ij ) = (a ist eine Konstante, Konstanten ändern die Kovarianzen nicht) = Cov(u j e ij , u j e ij ) = (Die Kovarianz einer Summe ist die Summe der Kovarianzen aller Summandenpaare) = Cov(u j , u j ) Cov(u j , e ij ) Cov(e ij , u j ) Cov(e ij , e ij ) = (wegen der Unabhängigkeitsforderung sind alle Kovarianzen außer der 1. null) riablen) = Var (u j ) = Cov(u j , u j ) = (Die Kovarianz einer Zufallsvariablen mit sich selbst ist gleich der Varianz der Va- = 2u . Qed. Die im vorigen Abschnitt allgemein konzipierte Kovarianz Cov( y ij , y ij ) IC ist nun im Rahmen des vorliegenden linearen Modells mit stochastischen Gruppeneffekten gleich der Varianz der stochastischen Gruppeneffekte. Cov ( y ij , y ij ) 2u 2 Daher ist die Intraclass-Korrelation gleich IC 2 2 u 2 . Diese Form kann auch interVar ( y ij ) y u e pretiert werden als Verhältnis der Varianz des Gruppeneffekts zur Varianz von y. Determinationskoeffizient 1. Art (= 2) für die Population Der Determinationskoeffizient 1. Art (auch als eta**2 = 2 bekannt) kann als Anteil der durch Berücksichtigung der Gruppeneffekte erklärte Varianz interpretiert werden im folgenden Sinn: Auf Grund der Kenntnis der Gruppeneffekte können die Einzelwerte besser ‚erraten’ werden als auf Grund des Gesamteffekts (=a). Der Prädiktionsfehler kann mittels der Varianz gemessen werden. Der Prädiktionsfehler MIT Berücksichtigung der Gruppeneffekte ist die Varianz der Störgröße: e2 . Der Prädiktionsfehler OHNE Berücksichtigung der Gruppeneffekte ist die Varianz von y selbst: 2y 2u e2 . Das PRE-Maß (Proportional Reduction of Error) = Prädiktion sfehler(OH NE) Prädiktion sfehler(OH NE) Prädiktion sfehler(OH NE) Nagl, Multilevel-Materialien, Intraclass = Seite 7 ( 2u e2 ) e2 2u e2 2u 2y 2u 2u e2 : 2 Der Determinationskoeffizient 1. Art ist im vorliegenden Modell gleich der Intraclass-Korrelation. Schätzung der Modellparameter Die Schätzung der Modellparameter baut i.a. auf der ANOVA-Tabelle einer einfaktoriellen Varianzanalyse auf: ANOVA-Tabelle DF = Source Freiheitsgrade Gruppe J-1 Error n-J C. Total Mit q n-1 1 n j n 2j . Beispiel: n = 10, J = 3. (1) Sum of Squares (2)= (1)/ DF =MS(=Mean Square) (3) Erwartungswert von(1) = E(SS) SS(Gruppe) MS(Gruppe) (J 1)e2 (n q)2u SS(Error) SS(Total) (n J)e2 MS(Error) MS(Total) (n 1)e2 (n q)2u Falls alle Gruppen gleich groß (= I) wären, wäre q= I. und n = IJ. Source DF (1) Sum of Squares (2) = (1)/ DF =MS (3) Erwartungswert von(1) = E(SS) Gruppe 2 17.5 8.75 2e2 6.22u Error 7 14.5 2.07 C. Total 9 32 3.55 7e2 9e2 6.22u Im vorliegenden Fall sind die 3 Gruppen unterschiedlich groß (5, 3, 2); daher ist q=(25+9+4)/10=3.8. Die Quadratsumme SSQ(Gruppe) wird auch als Between-SS (=BSS), die Quadratsumme SS(Error) als WithinSS(=WSS) und die Total-Quadratsumme als TSS bezeichnet, wobei gilt: TSS = WSS + BSS. Diese Bezeichnungen wurden schon oben eingeführt. Schätzung der Varianzen nach der Momentenmethode (Erwartungswertmethode) Die Erwartungswerte der Quadratsummen wurden bereits in der obigen ANOVA-Tabelle eingefügt. Die Gleichsetzung der Erwartungswerte der Quadratsumme mit den Quadratsummen (=Momentenmethode) führt zum Gleichungssystem, deren Lösung die erwartungstreuen Schätzer liefert: ˆ 2u ˆ e2 1 ( n J )( n q ) BSS (n 1) TSS(J 1) 1 (n J) WSS , mit q j n 2j n Beispiel: BSS = 17.5, TSS=32, q=3.8 und n=10: ˆ 2u (17.5*9-32*2)/(7*6.2) = 2.1544. ̂ e2 =14.5/7 = 2.0714. In speziellen Datensituationen kann der Schätzers 2u leider negative Werte annehmen. Andere Schätzmethoden für die Varianzen Für ungleiche Gruppengrößen wurden ML-Schätzer entwickelt, die i. a. zu bevorzugen sind. Ein Nachteil der ML-Schätzer besteht darin, dass keine expliziten Schätzformeln angegeben werden können; sie können nur iterativ berechnet werden. Zudem sind die ML-Schätzer i. a. nicht erwartungstreu, wohl aber konsistent und asymptotisch effizient; zusätzlich sind sie approximativ normalverteilt. Weiters sind Funktionen von ML-Schätzern wiederum ML-Schätzer. Damit diese Eigenschaften gelten, müssen die Stichproben groß sein. Wegen der Problematik der Erwartungstreue wurden REML-Schätzer Beispiel: Die mit der REML-Methode ermittelten (Restricted ML) entwickelt, die immerhin im Fall gleicher GruppenSchätzwerte sind größen die gleichen Schätzer liefern wie die erwartungstreuen Moˆ 2u 2.352 und ̂ e2 = 2.089. menten-Schätzer. Determinationskoeffizienten 1. Art (= 2) für die Stichprobe Der Determinationskoeffizient für die Stichprobe wird nach dem gleichen Muster wie für die Population berechnet. Dabei werden zwei Varianten unterschieden. Zusätzlich zum üblichen Determinationskoeffizienten, bei dem die Abweichungsquadratsummen als Fehlermaß verwendet wird, wird in den meisten Programmen auch der sogenannte adjustierte Determinationskoeffizient ausgedruckt, bei dem die Mean Squares als Fehlermaß verwendet wird. Nagl, Multilevel-Materialien, Intraclass Seite 8 Beispiel: Fehler(OHNE Gruppe)= TSS = 32 Fehler(MIT Gruppe)= WSS = 14.5. Determinationskoeffizient 1. Art = 0.547 Fehler(OHNE Gruppe)= TSS. Fehler(MIT Gruppe)= WSS Determinationskoeffizient 1. Art= 1 – WSS/TSS= BSS/TSS Der adjustierte Determinationskoeffizient 1. Art (=adj. 2) ist das PRE-Maß mit Mean Sum of Squares als Fehlermaß. Wiederum werden die zwei Modelle verglichen. Beispiel: Fehler(OHNE Gruppe) = MS(Total) = 3.55 Fehler(MIT Gruppe)= MS(Error) = 2.07. Adj. Determinationskoeffizient 1. Art = 0.417. Fehler(OHNE Gruppe)= MS(Total) = TSS/(n-1). Fehler(MIT Gruppe)= MS(Error) = WSS/(n-J). Adj. Determinationskoeffizient 1. Art =1- MS(Error)/MS(Total) Der adjustierte Determinationskoeffizient kann leider auch negativ werden. Erwartungstreue der beiden Determinationskoeffizienten Der Erwartungswert eines Verhältnis kann recht gut durch das Verhältnis der Erwartungswerte von Zähler und Nenner approximiert werden (das ist allerdings nur das erste Glied im Rahmen einer Taylorentwicklung); es soll aber beachtet werden, dass der Erwartungswert eines Verhältnis nicht gleich dem Verhältnis der Erwartungswerte ist. Falls die beiden Koeffizienten erwartungstreu wären, müsste der Erwartungswert der Koeffizienten mit dem 2 Populationsdeterminationskoeffizienten 1. Art = 2 u 2 übereinstimmen. u e Der Determinationskoeffizient 1. Art überschätzt den Populationsdeterminationskoeffizienten, besonders stark bei kleinem n und vielen Gruppen. Der Erwartungswert des Zählers ist E(BSS) (J 1)e2 (n q)2u . Der Erwartungswert des Nenners ist E(TSS) (n 1)e2 (n q)2u . Der Erwartungswert des Verhältnisses der Quadratsummen kann durch das Verhältnis der Erwartungswerte der Quadratsummen E(BSS ) E(BSS ) (J 1) e2 (n q) 2u BSS E( ) angenähert werden, wobei gilt: = = TSS E(TSS ) E(TSS) (n 1) e2 (n q) 2u ( J 1) ( n q ) e2 2u ( n 1) ( n q ) e2 2u . Hier stört im Vergleich zum Populationsdeterminationskoeffizienten im Zähler vor allem der Ausdruck ( J 1) ( n q ) e2 , der besonders groß wird bei kleinem n und vielen Gruppen. Der adjustierte Determinationskoeffizient 1. Art kommt sehr nahe an den Populationsdeterminationskoeffizienten ran. Der Erwartungswert des Nenners ist E(TSS/(n-1)) = e2 (nnq1) 2u . Der Erwartungswert des Zählers ist E(TSS/(n-1) - WSS/(n-J)) = e2 ( n q ) n 1 2u e2 = ( n q ) n 1 2u . Das Verhältnis kann wiederum angenähert werden. Daher E(Adj. Determinationskoeffizient 1. Art) ( n q ) 2 u n 1 ( n q ) e2 n 1 2u = 2u n 1 n q e2 2u . Da- bei wird deutlich, dass der adjustierte Koeffizient wesentlich näher an den Populationskoeffizienten ran kommt. Nagl, Multilevel-Materialien, Intraclass Seite 9 Anhang: Zur Kreuzprodukte-Berechnung mit der Intraclass-Wertepaartabelle. Ungewichtete Berechnung Die Berechnung der Kovarianz zwischen den ersten und zweiten Werten der Paare nach dem Vorschlag von YULE & KENDALL führt bei ungleichen Gruppengrößen zu folgenden Formeln: Die Anzahl der Paare ist gleich n j1 n j (n j 1) J Beispiel: Der Mittelwert der ersten Werte der Paarwerte (= y ) ist gleich dem Mittelwert der zweiten Werte der Paarwerte(= y ), da die zweiten Werte die gleichen Werte wie die ersten sind (sie sind nur in einer anderen Reihenfolge angeschrieben). y = y n j 1 J (n j 1) y ij , dieser Mittelwert stimmt i. a. nicht n j1 i 1 mit dem Mittelwert der Werte überein: y 1 n J Der Mittelwert der ersten Werte y = 99/28 = 3.536. Dieser Wert ist gleich dem Mittelwert der 2. Werte (das sind die gleichen Werte in anderer Reihenfolge angeschrieben werden). Bei ungleichen Gruppengrößen stimmt dieser Mittelwert i.a. nicht überein mit dem Mittelwert der ursprünglichen Werte y = 3. nj y ij . j1 i 1 Die Varianz der ersten Werte der Paarwerte ist wiederum gleich der Varianz der zweiten Werte der Paarwerte Var ( y ) = Var ( y ) n 5*4 + 3*2 + 2*1 =28. n j 1 J (n j 1) ( y ij y ) 2 n j1 i 1 Die Kovarianz der Paare ist gleich Cov ( y , y ) CP yy n mit dem Die Varianz der ersten Werte der Paare = Var ( y ) = 76.96 / 28 = 2.75. Die zweiten Werte der Paare sind wiederum nur eine andere Reihenfolge der ersten, daher ist auch die Varianz der zweiten gleich der Varianz der ersten. Die Kovarianz der ersten Werte mit den zweiten Werte der Paare = Cov ( y , y ) = 9.694 / 28 = 0.356. J nj nj Kreuzprodukt. CP yy ( y ij y )( y kj y ) j1 i 1 k i Die Intraclass-Korrelation rIC rIC = 9.694 / 28 = 0.13. 76.96 / 28 Cov ( y , y ) Var ( y ) Bei diesem Vorschlag ist besonders der Mittelwert ein recht kompliziertes, intuitiv schwer nachvollziehbares nj J 1 J 1 J 1 J 1 J (n j 1) y ij = Gebilde: y (n j 1)n j y j = n 2j y j n j y j = n 2j y j ny . n j1 n j1 n j1 i 1 j1 n j1 Das hängt damit zusammen, dass die Werte der Gruppen implizit mit der Größe minus 1 (= n j -1) gewichtet werden; dadurch wird der Mittelwert vorwiegend durch die großen Gruppen bestimmt. Gewichtete Berechnung Der Sinn einer solchen Gewichtung ist schwer nachvollziehbar. Daher wird hier der Vorschlag gemacht, diese 1 Gewichtung rückgängig zu machen; das kann dadurch erreicht werden, dass die Werte pro Person mit n j 1 gewichtet werden; dadurch wird die unpassende implizite Gewichtung der oberen Form ausgeglichen. Da auf diese Art schon pro Person implizit gewichtet wird, muss nun für die Berechnung des Gesamtmittelwerts nicht mehr durch n´´ dividiert, sondern durch n dividiert werden: Nagl, Multilevel-Materialien, Intraclass Seite 10 Der Mittelwert der ersten Werte der Paarwerte (= y ) ist gleich dem Mittelwert der zweiten Werte der Paarwerte(= y ) und infolge der Gewichtung gleich dem Mittelwert der y-Werte selbst 1 n y = y = y J nj y ij nj mit CP yy ( y ij y ) 2 j1 i 1 Die Intraclass-Kovarianz der Paare ist gleich Cov ( y , y ) CP yy n nj nj J 1 ( y ij y )( y kj y ) . j1 n j 1 i 1 k i mit dem Kreuzprodukt CP yy y = 3 . Dieser Wert ist gleich dem Mittelwert der 2. Werte (da die gleichen Werte nur in anderer Reihenfolge angeschrieben gedacht werden können). Bei ungleichen Gruppengrößen stimmen diese Mittelwerte dank der vorgenommenen inversen Gewichtung mit dem Mittelwert der y-Werte ( y = 3) überein. j1 i 1 Die Varianz der ersten Werte der Paarwerte ist wiederum gleich der Varianz der zweiten Werte der Paarwerte und gleich der Varianz der 1 y-Werte selbst: Var ( y ) = Var ( y ) = Var ( y) CP yy , n J Beispiel: Der Mittelwert der ersten Werte Die Kreuzprodukt der ersten Werte der Paare = CPyy = 32. Var ( y) = 3.2 Die zweiten Werte der Paare sind wiederum nur eine andere Reihenfolge der ersten, daher ist auch die Varianz der zweiten gleich der Varianz der ersten. Das Kreuzprodukt der ersten Werte mit den zweiten Werten der Paare = CPyy = 13; Cov ( y , y ) = 1.3 In der Berechnungsformel für CPyy bleibt das Gewicht erhalten. Dieses Kreuzprodukt kann als Differenz der Between-Quadratsumme minus einer gewichteten WithinQuadratsumme dargestellt werden: J Beispiel: Das Kreuzprodukt des jeweils 1. mit dem 2. Wert des Paares CPyy = 13. n J j 1 ( y ij y j ) 2 j1 n j 1 i 1 CP yy n j ( y j y ) 2 j1 J n = BSS GWSS ; mit GWSS = j1 BSS = 17.5. nj 1 ( y ij y j ) 2 1 i 1 j Daher ist GWSS = 4.5. GWSS ist eine gewichtete Form der Within-Quadratsumme. J Vorweg eine Hilfsüberlegungen: n j1 n j 1 ( y ij y j y j y ) 2 = (nach der Formel (a+b)2 ) = j 1 i 1 nj J n j 1 n 1 ( ( y ij y j ) 2 2( y j y ) ( y ij y j ) n j ( y j y ) 2 ) j1 j i 1 i 1 J = n j1 nj J nj 1 ( y ij y j ) 2 ( y j y ) 2 j1 n j 1 j 1 i 1 n J Beweis: n n j j j J 1 1 ( y ij y )( y kj y ) ( y ij y ) 2 n 1 n 1 j1 j i 1 k 1 j1 j i 1 CP yy J = n j1 n der Mittelwert für die j. Gruppe J n n j j j J 1 1 ( y ij y ) ( y kj y ) ( y ij y ) 2 = k 1 j1 n j 1 i 1 j 1 i 1 yj J nj 1 nj y kj ist) = k 1 J nj ( ( y kj y ) = n j (y j y ) , da k 1 n j J 1 1 n 1 n 2j ( y j y ) 2 n 1 ( y ij y ) 2 j1 j j1 j i 1 n j 1 1 n 2j ( y j y ) 2 ( y ij y j y j y ) 2 = (wegen der obigen Hilfsüberlegung) j1 n j 1 j1 n j 1 i 1 = nj J J nj 1 1 2 2 n ( y y ) n 1 j j n 1 ( y ij y j ) 2 n 1 ( y j y ) 2 = (Vereinfachen) j1 j j1 j i 1 j1 j J = Nagl, Multilevel-Materialien, Intraclass J n j 1 j1 n j 1 = Seite 11 n J j 1 ( y ij y j ) 2 . Kürzen liefert die behauptete Form. Daher gilt n 1 j1 j i 1 n j ( y j y ) 2 J n J j 1 ( y ij y j ) 2 . Qed j1 n j 1 i 1 CP yy n j ( y j y ) 2 j1 Spezialfall: gleiche Gruppengrößen. Falls alle Gruppen gleich groß sind (I = nj, für alle j=1, ..., J) sind die Formeln für die gewichtete und ungewichtete Berechnung äquivalent. Die Anzahl der Beobachtungen ist gleich n = I*J. Ungewichtete Version Gewichtete Version Die Anzahl der Paare ist gleich n JI(I 1) . Der Mittelwert der ersten Werte der Paarwerte (= y ) und der Mittelwert der zweiten Werte (= y ) sind gleich dem Mittelwert der ursprünglichen Werte: J I 1 1 J I y = y (I 1) y ij = y ij . IJ (I 1) j1 IJ j1 i 1 i 1 Die Varianz der ersten Werte der Paarwerte und die Varianz der zweiten Werte der Paarwerte ist identisch mit der Varianz der ursprünglichen Werte: J I 1 Var ( y ) = Var ( y ) (I 1) ( y ij y ) 2 IJ (I 1) j1 i 1 Bei Gewichtung ist diese Gleichheit mit dem Gesamtmittelwert auch ohne Spezialfall gegeben: y = y = y J nj y ij j1 i 1 Bei Gewichtung ist diese Gleichheit mit dem Gesamtmittelwert auch ohne Spezialfall gegeben: 1 Var ( y ) = Var ( y ) = Var ( y) CP yy , n J nj mit CP yy ( y ij y ) 2 1 J I = ( y ij y ) 2 Var ( y) . IJ j1 i 1 Die Kovarianz der Paare ist gleich J I I 1 Cov ( y , y ) = ( y ij y )( y kj y ) IJ (I 1) j1 i 1 k i Dieser Ausdruck ist gleich der gewichteten Variante (siehe rechts). 1 n j1 i 1 Die Kovarianz der Paare ist gleich CP yy mit dem Kreuzprodukt Cov ( y , y ) IJ 1 J I I CP yy ( y ij y )( y kj y ) . I 1 j1 i 1 k i Auch die Darstellung in den Between- und Within-Quadratsummen kann einfacher formuliert werden. Für beide Varianten gilt nun: J J J 1 I 1 J I CP yy I( y j y ) 2 ( y ij y j ) 2 = I( y j y ) 2 ( y ij y j ) 2 = I 1 I 1 j1 j1 i 1 j1 j1 i 1 = BSS I11 WSS ; J mit WSS = nj ( y ij y j ) 2 als Within-Quadratsumme. j1 i 1 Im Spezialfall mit gleichen Gruppengrößen reichen BSS und WSS aus, die Kreuzproduktsumme der ersten und zweiten Werte der Paare zu beschreiben, bzw. auch BSS und TSS: CPyy = BSS I11 WSS = I11 (I BSS TSS) . Nagl, Multilevel-Materialien, Intraclass Seite 12 Erwartungswerte quadratischer Formen unter Intraclass-Korrelation Cov (Yij , Ykj ) IC mit 2 . Unter Berücksichtigung der y Var (Yij ) Var (Ykj ) Intraclass-Korrelation werden hier für einige quadratische Formen die Erwartungswerte berechnet. Die Gruppengrößen für die J Gruppen werden mit nj abgekürzt. Die Intraclass-Korrelation sei IC IC 2y , Satz E1. Der Erwartungswert der Summe der quadratischen Abweichungen vom Mittelwert J nj j n 2j 2 2 CP YY (Yij Y ) ist gleich E(CPYY ) y (n 1) IC q 1, mit q . n j1 i 1 nj J Beweis: E (CP YY ) E (Yij Y ) 2 = Der Erwartungswert von CPYY ist j1 i 1 a) Der Summand allein J nj E(( Yij ) (Y )) 2 . j1 i 1 E(( Yij ) (Y )) = E(Yij ) 2E(Yij )( Y ) E(Y ) 2 2 2 Die einzelnen Summanden dieses Ausdrucks werden getrennt analysiert E(Yij )(Y ) = E(Yij )( b) 1 2 y (n j 1) IC = n E(Y ) 2 = E( c) 1 = n2 J 1 n k 1 1 nj 1 n Yij ) 2 = j1 i 1 = k 1 i 1 1 Einsetzen der Ausdrücke b) und c) in a) liefert 1 2 1 y (n j 1) IC 2 n n nj J k 1 1 nj 1 n j1 i 1 J nj E(Yij )( Yk ) k 1 1 J 1 2 n y IC n k (n k 1) 2 n k 1 nj nj E(Yik )( Yk ) J 1 (Yk )) = n E(Yij )( Yk ) J nj J 1 n E(( Yij ) (Y )) 2 J 2 n y IC n k (n k 1) k 1 = 2y 2 = 2 1 1 2y (1 ) IC (n j 1) 2 n n n J k 1 n k (n k 1) . 2 1 1 J E(CP YY ) 2y (1 ) IC (n j 1) 2 n k (n k 1) n n k 1 j1 i 1 n 2 J 1 n J 1 J n 2y (1 ) IC n j (n j 1) 2 n k (n k 1) = 2y (n 1) IC n j (n j 1) n j1 n n j1 n k 1 J nj Daher folgt: = j1 n 2j J = 2y (n 1) IC ( n 1) . Qed. J Satz E2. Der Erwartungswert von BSS n j (Y j Y ) 2 ist gleich E(BSS ) 2y (J 1) IC (n (J 1) q) , j1 mit q n2 j j n . J Beweis: Der Erwartungswert von BSS ist E(BSS ) n j E(Y j Y ) 2 J = j1 n j E(( Y j ) (Y )) 2 . j1 2 2 2 a) Der Summand allein E(( Y j ) (Y )) = E(Y j ) 2E(Y j )( Y ) E(Y ) Die einzelnen Summanden dieses Ausdrucks werden getrennt analysiert. Nagl, Multilevel-Materialien, Intraclass b) E(Y j )(Y ) = E( Seite 13 nj 1 nj (Yij )( i 1 1 n J nk (Yk )) = k 1 1 J n j nk E(Yij )( Yk ) k 1 i 1 1 = 1 2 y (n j 1) IC . n c) E(Y ) 2 = siehe beim letzten Beweis oben unter c) = d) E ( Y j ) 2 = E ( = 1 n jn 1 nj nj (Yij )( i 1 J 1 2 n y IC n k (n k 1) . 2 n k 1 nj 1 nj nj nj 1 (Yj )) = E(Yj )( Yij ) n 2j 1 i 1 1 1 2 y (n j 1) IC . nj E(( Y j ) (Y )) 2 Einsetzen der Ausdrücke b) bis d) in a) liefert J 2 n y IC n k (n k 1) k 1 J 1 2 1 1 2 1 = y ( ) IC ( )( n j 1) 2 n k (n k 1) . nj n n k 1 nj n J 1 2 1 1 J 2 1 ) IC ( )( n j 1) 2 n k (n k 1) Daher folgt: E ( BSS ) n j y ( nj n nj n n k 1 j1 = 1 2 1 1 y (n j 1) IC 2 2y (n j 1) IC 2 nj n n = 2y (1 J j1 = = J k 1 J k 1 2n j nj ) IC (1 )( n j 1) 2 n n n nj 2 J n 2y (J 1) IC n J n j (n j 1) 2 n n j1 2y (J 1) IC (n (J 1) J n2 j1 j n k (n k 1) 1 J j1 n k (n k 1) = 2y (J 1) IC n J n n j (n j 1) ) . Qed. n n J j 1 ( y ij y j ) 2 ist gleich E(GWSS ) J( 2y IC ) . j1 n j 1 i 1 Satz E3. Der Erwartungswert von GWSS n J Beweis: Der Erwartungswert von GWSS ist J = n j1 j 1 E(Yij Y j ) 2 n 1 j1 j i 1 E(GWSS ) n j 1 E(( Yij ) (Y j )) 2 . j 1 i 1 a) Der Summand allein E(( Yij ) (Y j )) 2 = E(Yij ) 2 2E(Yij )( Y j ) E(Y j ) 2 . Die einzelnen Summanden dieses Ausdrucks werden getrennt analysiert b) E(Yij )(Y j ) = E (( Yij )( 1 nj nj (Yj )) = 1 c) E ( Y j ) = (siehe beim letzten Beweis unter d) = 2 Einsetzen der Ausdrücke b) und c) in a) liefert = 2y 2 1 nj nj E(Yij )( Yj ) = 1 1 2 y (n j 1) IC nj E(( Yij ) (Y j )) 2 n j 1 2 1 2 1 2 y (n j 1) IC y (n j 1) IC = ( y IC ) . nj nj nj n j n j 1 2 ( y IC ) j1 n j 1 n j J Daher folgt: E(GWSS ) = J( 2y IC ) . Qed. 1 2 y (n j 1) IC nj Nagl, Multilevel-Materialien, Intraclass Seite 14 nj J Satz E4. Der Erwartungswert von WSS ( y ij y j ) 2 ist gleich E( WSS) (n J)( 2y IC ) . j1 i 1 J nj Beweis: Der Erwartungswert von GWSS ist E(GWSS ) E(Yij Y j ) 2 = j1 i 1 a) Der Summand allein J nj E(( Yij ) (Y j )) 2 . j1 i 1 E(( Yij ) (Y j )) = E(Yij ) 2E(Yij )( Y j ) E(Y j ) 2 2 2 Die einzelnen Summen werden dieses Ausdrucks werden getrennt analysiert b) 1 2 y (n j 1) IC nj E(Yij )(Y j ) = (siehe oben) = c) E ( Y j ) 2 = (siehe oben) = 1 2 y (n j 1) IC nj Einsetzen der Ausdrücke b) und c) in a) liefert Daher folgt: E(( Yij ) (Y j )) 2 = (siehe oben) = J n j 1 2 E( WSS) n j ( y IC ) j1 nj = n J ( y j y ) 2 j j1 E(CP YY ) IC n 1 q 2y , mit q Beweis: Der Erwartungswert von CPyy ist n j 1 nj ( 2y IC ) . (n J)( 2y IC ) . Qed. J Satz E5. Der Erwartungswert von CP yy j1 1 n j 1 nj (y ij yj )2 ist i 1 j n 2j . n E(C YY ) E(BSS GWSS ) = E(BSS ) E(GWSS ) = ( 2y (J 1) IC (n (J 1) q)) J( 2y IC ) = 2y IC (n 1 q )) . Qed. Satz E6: Die beiden Arten von Momenten-Schätzern für die Varianz der ersten (bzw. zweiten) Messwerte der Paare und deren Kovarianz sind bei gleichen Gruppengrößen (=k) in allen J Gruppen gleich. Erläuterung: Die auf Grund der Quadratsummenformeln nach der Momentenmethode geschätzte Intraclass~ 1 BSS (n 1) TSS(J 1) IC ( n J )( n q ) Kovarianz- bzw. Varianzformeln sind ~ 2 . 1 TSS(n q (J 1)) BSS (q 1) ( n J )( n q ) y Die auf Grund der Kreuzprodukte nach der Momentenmethode geschätzte Intraclass-Kovarianz- bzw. Varianz1 CP YY CP YY (n 1) ˆ IC j n 2j n ( n q ) formeln sind . , mit q ˆ 2y n ( n1q ) CP YY (n (q 1)) CP YY (q 1) n Diese beiden Arten von Schätzern liefern i. a. unterschiedliche Ergebnisse. Falls aber alle Gruppen gleich sind, sind die Ergebnisse gleich. Beweis: Falls alle Gruppen gleich groß(=I) sind, gilt n = I*J und daher q = I. Zudem gilt 1 I 1 GWSS = 1 J I ( y ij y j ) 2 I 1 j1 i 1 = WSS . Wegen TSS=BSS+WSS folgt für das Kreuzprodukt der ersten und 2. Werte J J I CP yy I ( y j y ) 2 I11 ( y ij y j ) 2 j1 j1 i 1 = BSS 1 I 1 WSS = 1 (I * BSS TSS) . I 1 Die Gleichheit der Schätzer wird erst nach Umformungen der beiden Schätzpaare deutlich; zuerst folgt die Umformung der ersten Schätzer: Nagl, Multilevel-Materialien, Intraclass ~ IC ~2 y Seite 15 1 BSS (IJ 1) TSS (J 1) ( IJ J )( IJ I ) 1 TSS (I 1)( J 1)) BSS (I 1) ( IJ J )( IJ I ) ~ IC ~2 y 1 BSS (IJ 1) TSS(J 1) IJ ( I 1)( J 1) 1 TSS (J 1) BSS IJ ( J 1) Ersetzen der Kreuzproduktformeln durch die entsprechenden Quadratsummenformeln im 2. Schätzpaar ergibt ˆ IC ˆ 2y 1 IJ ( J 1) I 1 IJ ( J 1) I ˆ IC ˆ 2y TSS I11 (I * BSS TSS)( IJ 1) TSS(IJ (I 1)) I * BSS TSS ( IJ 1) I I ( J 1) 1 BSS TSS I 1 IJ ( J 1) I I 1 1 TSS (J 1) BSS IJ ( J 1) ˆ IC ˆ 2y ˆ IC ˆ 2y ( IJ 1) I ( IJ I ) 1 BSS TSS I 1 IJ ( J 1) I I 1 1 TSS (J 1) BSS IJ ( J 1) 1 BSS (IJ 1) TSS(J 1) IJ ( I 1)( I 1) 1 TSS(J 1) BSS IJ ( J 1) Der Vergleich des jeweils letzten Ausdruckpaars macht die Gleichheit deutlich. Qed. .