Die Aggregationsfragestellung

Nagl, Multilevel-Materialien, Intraclass
Seite 1
Messung der Abhängigkeit von Messungen in Gruppen
Bei den üblichen statistischen Verfahren wird unterstellt, dass die Messungen stochastisch unabhängig sind.
Dabei wird nicht adäquat berücksichtigt, dass wohl die Messungen etwa auf Ebene 1, die zur gleichen UE der
Ebene 2 gehören, eventuell ähnlicher sind im Vergleich zu den Messungen an einer anderen UE der Ebene 2.
Falls das zuträfe, wären die Voraussetzungen der üblichen statistischen Voraussetzungen nicht gegeben. Die bei
der Analyse von Mehrebenendaten zu berücksichtigenden Abhängigkeiten bezüglich einer Variablen y innerhalb
von Gruppen setzt Maße solcher Abhängigkeiten voraus. Ein solches Maß ist die Korrelation der Werte innerhalb der Gruppen, der sogenannte Intraclass-Korrelationskoeffizient(IC).
Intraclass-Korrelationskoeffizient
Definition des Koeffizienten
Die Messungen einer Variablen y zweier UEen aus unterschiedlichen Gruppen sind unkorreliert(IC=0); die
Messungen einer Variablen y zweier UEen aus der gleichen Gruppe korrelieren(IC0). Diese Korrelation IC
(oder kurz: ) heißt Intraclass-Korrelation.
Konkret werden für zwei UEen nur zwei y-Werte gemessen. Die Konzeption der Korrelation setzt voraus, dass
die zwei Werte nur als Realisationen zweier Zufallsvariablen betrachtet werden. Mit Hilfe der Zufallsvariablen
wird die Idee beschrieben, dass zwischen den Messungen zweier UEen aus derselben Gruppe etwa eine Art
Ansteckungs -Prozess existiert oder etwa eine Art Gleichklang allein auf Grund der Gruppenzugehörigkeit
herrscht oder aus irgendwelchen anderen Gründen eine Abhängigkeit besteht; würden etwa die Werte der beiden
UEen wiederholt real etwa in zeitlichem Abstand erhoben, würde die Korrelation die Wertepaare beobachtbar.
Eine negative Intraclass-Korrelation kommt dabei relativ selten vor, ist aber ebenfalls denkbar etwa infolge eines
gegenseitigen Abgrenzungsprozesses oder anderer Restriktionen.
Die Zufallsvariablen eines Messwertpaares werden
hier durch y-Großbuchstaben beschrieben
(Yij, Ykj´)
für alle j UEen der 2. Stufe (j=1,...,J); innerhalb
von j variiert i bzw. k jeweils von 1 bis nj.
Für die Korrelation der Zufallsvariablenpaare gilt
 1, für i  k, j  j

Korr (Yij , Ykj )   IC für
j  j ,
 0 für
j  j

wobei die Korrelation IC (oder kurz: ) IntraclassKorrelation heißt.
Beispiel: Seien 3 Gruppen
mit jeweils 5,
3 und zwei
UEen gegeben.
Dann korrelieren die Zufallvariablen mit
sich selbst mit
1, miteinander
in jeder Gruppe mit ; zwischen Gruppen mit 0.
Y11 Y21 Y31 Y41 Y51 Y12 Y22 Y32 Y13 Y23
Y11
Y21
Y31
Y41
Y51
Y12
Y22
Y32
Y13
Y23




0
0
0
0
0

1



0
0
0
0
0




1


1


0
0
0
0
0
0
0
0
0
0




1
0
0
0
0
0
0
0
0
0
0
1


0
0
0
0
0
0
0
0
0
0
0
0


1


1
0
0
0
0
0
0
0
0
0
0
0
0
1

0
0
0
0
0
0
0
0

1
1
Die Korrelation zweier Variablen ist i.a. definiert als das Verhältnis der Kovarianz zum Produkt der Standardabweichungen der beiden Variablen. Da hier die 1. Variable des Paares die gleiche Varianz wie die 2. hat,
kann die Korrelation auch als Verhältnis der Kovarianz der Paare zur Varianz des 1. Paarvariablen (oder der 2.)
geschrieben werden:
 Cov (Yij , Ykj )
 IC


 IC  IC
,
mit
.

2

 2y
  y  Var (Yij )  Var (Ykj )
Die Kovarianz IC kann auch als Intraclass-Kovarianz bezeichnet werden. Für lineare Modelle mit einem zufälligen UE2-Faktor ist IC gleich der Varianz des UE2-Faktors.
Die Annahme gleicher Korrelation zwischen allen Paaren, die in der gleichen Gruppe sind, ist sicherlich sehr
restriktiv. Diese restriktive Annahme kann dann etwas gelockert werden, wenn mehr über die Struktur der Abhängigkeiten bekannt ist (etwa über die gegenseitige Sympathie oder Antipathie der Mitglieder einer Gruppe
oder die räumliche bzw. zeitliche Nähe der UEen, für die Messwerte vorliegen).
Nagl, Multilevel-Materialien, Intraclass
Seite 2
Konsequenzen der Korreliertheit der Beobachtungen
Die oben besprochene Problematik, die bei Abhängigkeit zwischen Beobachtungen vorliegt, betrifft zentrale
Eigenschaften von Schätzern, besonders die der Varianzschätzung.
CP yy
Der übliche Schätzer für die Varianz ( ˆ 2y 
) ist i. a. erwartungstreu (weil die Summe der Quadrate der
n 1
Abweichungen vom Mittelwert (=CPYY) durch n-1 dividiert wird). Denn es kann gezeigt werden, dass gilt:
E(CPYY) = (n  1) 2y .
Bei Vorliegen von Abhängigkeiten in der besprochenen Art ist dieser Schätzer für die Varianz nicht mehr erwar  n 2j

 j

2
tungstreu, da nun gilt: E(CPYY) =  y (n  1)   IC 
 1 . Bei positiver Intraclass-Korrelation wird daher
 n



die Varianz (bei üblicher Schätzung) stark überschätzt, besonders bei großen Gruppen.
Da die Varianzschätzung selbst wiederum die Basis zur Berechnung der Konfidenzintervalle des Mittelwerts ist,
werden die Konfidenzintervalle von Mittelwerten zu breit. Entsprechend sind auch die Konsequenzen für das
Testen von Hypothesen gravierend.
Berechnung des Koeffizienten mit Hilfe der Intraclass-Korrelationstabelle
YULE G. U. & KENDALL M. G. (4. Auflage, 1964) haben für die Berechnung eine Methode vorgeschlagen, die
auch die Interpretation des Koeffizienten erleichtert. Diese Berechnungsmethode sollte aber nur für die Population verwendet werden, als Schätzmethode für Stichproben ist sie nicht geeignet, wie unten gezeigt wird. Zuerst
wird die sogenannte Intraclass-Korrelationstabelle erstellt.
Erstellen der Intraclass-Korrelationstabelle
Die Messwerte einer Variablen y für die verschiedenen
UEen der ersten Ebene können innerhalb der fortlaufend
nummerierten Einheiten der
zweiten Ebene in eine Liste
gebracht werden.
Als Messwertpaare, über die
korreliert werden soll, denke
man sich folgenden Datensatz: alle möglichen UE1Paare aus der 1. UE2, danach
alle möglichen UE1-Paare
aus der 2. UE2 usw. werden
untereinandergestapelt. Die
so entstehende Liste heißt
Intraclass-Korrelationstabelle
Die Messwerte seien
yij,
wobei j der Index der UEen der 2.
Ebene seien (j = 1, ..., J).
In der j. Ebene seien nj UEen der 1. Ebene. Im
Allgemeinen kann die Anzahl nj für die verschiedenen j unterschiedlich groß sein. Der 1.
Index i nummeriert die UEen der ersten Ebene.
Die verschiedenen
Messwertpaare sind
nun:
(yij, ykj)
für alle j, innerhalb von
j variiert i bzw. k jeweils
von 1 bis nj; die Werte,
die zur gleichen UE der
1. Ebene gehören, werden meist weggelassen
(Diagonale).
5, 5
5, 5
5, 5
4,5
1, 5
5, 5
4,5
1, 5
Beispiel: Seien Messwerte (z.B.
Mathematik-Scores) für drei
Leistungsgruppen gegeben .
y1 1
y 21
y31
y 41
y51
y1 2
y 22
y32
y1 3
y 23
In der ersten Gruppe seien 5, in
der 2. Gruppe 3 und in der 3.
Gruppe 2 Schüler mit nebenstehenden Werten.
Der erste Index der y-Werte sei
die Nummer der Schüler innerhalb der Leistungsgruppennummern.
5,5
5,5
4,5
1, 5
5, 4
5, 4
5, 4
=
5
5
5
4
1
4
2
3
1
0
5 ,1
5 ,1
5 ,1
4 ,1
1, 4
4, 2
2, 4
3, 4
4,3
2,3
3, 2
1, 0
0 ,1
Die Wertepaare insgesamt als gestapelte Liste untereinander geschrieben heißt dann Intraclass-Korrelationstabelle.
Nagl, Multilevel-Materialien, Intraclass
Seite 3
Berechnen der Intraclass-Kovarianz, Varianz und Intraclass-Korrelation
Nach YULE & KENDALL ist die übliche PEARSON-Korrelation der Werte aus der Intraclass-Korrelationstabelle
der Intraclass-Korrelationskoeffizient  IC .
Bei ungleichen Gruppengrößen führt diese Art der Berechnung zu überproportionaler Gewichtung der großen
Gruppen; daher wird hier eine Berechnungsvariante verwendet, bei der die Wertepaare jeweils mit der inversen
Gruppengröße (1/(nj-1)) gewichtet werden. Bei gleichen Gruppengrößen ist das Ergebnis mit oder ohne Gewichtung identisch.
Für die gewichtete Berechnung wird im Folgenden vorausgesetzt, dass in jeder Gruppe mindestens zwei Werte
vorhanden sind(die Daten für UE1 aus Gruppen mit nur einer UE1 müssten vorher gestrichen werden). Die Berechnung der Korrelation kann dann in folgenden Schritten durchgeführt werden:
J
Beispiel: n   5*4 + 3*2 + 2*1 =28.
Die Anzahl der Paare ist gleich n  
n (n  1)
 j1
j
j
Der Mittelwert der ersten Werte der Paarwerte (= y  ) ist gleich dem
Mittelwert der zweiten Werte der Paarwerte(= y  ) und infolge der
Gewichtung gleich dem Mittelwert der y-Werte selbst
y  = y  = y  
1
n
Bei ungleichen Gruppengrößen stimmen diese
Mittelwerte dank der vorgenommenen inversen
Gewichtung mit dem Mittelwert der y-Werte
( y  = 3) überein.
j1 i 1
nj
mit CP yy    ( y ij  y  ) 2
j1 i 1
Die Intraclass-Kovarianz der Paare ist gleich Cov ( y , y ) 
CP yy
nj nj
J
n
1
  ( y ij  y  )( y kj  y  ) .
n
j1 j  1 i 1 k  i
mit dem Kreuzprodukt CP yy  
Intraclass-Korrelationskoeffizient  IC 
y  = 3 . Dieser
Wert ist gleich dem Mittelwert der 2. Werte (da
die gleichen Werte nur in anderer Reihenfolge
angeschrieben gedacht werden können).
nj
J
  y ij
Die Varianz der ersten Werte der Paarwerte ist wiederum gleich der
Varianz der zweiten Werte der Paarwerte und gleich der Varianz der
1
y-Werte selbst: Var ( y ) = Var ( y ) = Var ( y)  CP yy ,
n
J
Der Mittelwert der ersten Werte
Die Kreuzprodukt der ersten Werte der Paare =
CPyy = 32. Var ( y) = 3.2
Die zweiten Werte der Paare sind wiederum nur
eine andere Reihenfolge der ersten, daher ist auch
die Varianz der zweiten gleich der Varianz der
ersten.
Das Kreuzprodukt der ersten Werte mit den
zweiten Werten der Paare =
CPyy = 13; Cov ( y , y ) = 1.3
In der Berechnungsformel für CPyy bleibt das
Gewicht erhalten.
CP yy
Schätzvorschlag für den Intraclass-
CP yy
Korrelationskoeffizienten
 IC =
13
= 0.41.
32
Kreuzprodukt der 1. und 2. Werte und die Quadratsumme zwischen den Gruppen (=BSS)
BSS(=Between Sum of Squares) stellt die Unterschiede zwischen den Gruppen (genauer den GruppenmittelwerJ
ten) dar: BSS   n j ( y  j  y  ) 2 .
j1
Das gewichtete Kreuzprodukt der 1. und 2. Werte der Paare CPyy ist im wesentlichen gleich der Between
Sum of Squares, genauer der Differenz von BSS zu einer relativ kleinen Korrektursumme (=GWSS).
J
J
j1
n
j
1
( y ij  y  j ) 2

j1 n j  1 i 1
CP yy   n j ( y  j  y  ) 2  
= BSS  GWSS ; mit GWSS =
J
n
j1
Beispiel: Das Kreuzprodukt des jeweils 1. mit
dem 2. Wert des Paares CPyy = 13.
BSS = 17.5.
nj
1
 ( y ij  y  j ) 2

1
i 1
j
Daher ist GWSS = 4.5.
GWSS ist eine gewichtete Form der sogenannten Within Quadratsumme (Variation innerhalb der Gruppen).
In dieser Terminologie wird auch das Kreuzprodukt der y-Variable mit sich selbst als Total Sum of Squares
J nj
bezeichnet: TSS = CP yy    ( y ij  y  ) 2 .
j1 i 1
Nagl, Multilevel-Materialien, Intraclass
Seite 4
Schätzung der Varianz, Intraclass-Kovarianz und Intraclass-Korrelation
Wie schon oben erwähnt, sollte die obige Methode der Berechnung nicht als Schätzmethode in Stichproben
verwendet werden. Denn Schätzer sollten bestimmten Anforderungen (Konsistenz, Erwartungstreue usw.) genügen. Bereits oben bei der Behandlung der Konsequenzen der Abhängigkeit wurde deutlich, dass die Varianz von
y nicht durch die übliche Formel erwartungstreu geschätzt werden kann, egal ob durch n oder (n-1) dividiert
wird. Das gilt auch für die Intraclass-Kovarianz. Denn die Erwartungswerte der beiden in Kreuzproduktform
geschrieben sind:
 j n 2j
E(CP YY )   IC n  1  q    2y
,
mit
q

n
E(CP YY )   2y (n  1)   IC q  1
Schätzung mit Hilfe der Kreuzprodukte nach der Momentenmethode (Erwartungswertmethode)
Erwartungstreue Schätzer für  2y und  IC können aber aus den obigen beiden Gleichungen nach der in diesem
Zusammenhang klassischerweise verwendeten Momentenmethode konstruiert werden, wobei die Erwartungswerte der Kreuzprodukte den Stichprobenkreuzprodukten schätzartig gleichgesetzt werden E(CPYY )  CPyy
und E(CPYY )  CPyy . Die Lösung des Gleichungssystems liefert Schätzer, die erwartungstreu sind:
ˆ IC 
ˆ 2y 
1
n ( n q )
1
n ( n q )
CP YY  CP YY (n  1)
CP YY (n  (q  1))  CP YY (q  1)
Daraus folgt auch, dass rIC 
CP yy
CP yy
, mit q 
 j n 2j
n
Beispiel: Bei Interpretation der Daten als Stichprobe mit q=3.8 und n=10:
ˆ IC  (32+13*9)/(10*6.2) = 149/62 = 2.4.
̂ 2y =(32*(10-2.8)+13*2.8)/62 = 4.3.
kaum ein vernünftiges Schätzanalogon zu  IC 
 IC
 2y
ist. Auch wenn das
Verhältnis zweier erwartungstreuer Schätzer nicht notwendigerweise ein erwartungstreuer Schätzer für das Verhältnis der Parameter ist, ist sicherlich der auf den erwartungstreuen Schätzern aufbauende ein besserer Schätzer
als das Verhältnis der beiden Kreuzprodukte.
Daher der Vorschlag zur Schätzung des Intraclass-KorrelationskoeffiDie Schätzung für den Intraclasszienten auf der Basis der erwartungstreuen Schätzer für  2y und  IC : Korrelationskoeffizienten ergibt:
̂ IC = 2.4 / 4.3
 j n 2j
ˆ
CP YY  CP YY (n  1)
=
(32 + 13*9) / (32*(10-2.8)+13*2.8) = 0.5585
ˆ IC  IC 
, mit q 
CP YY (n  (q  1))  CP YY (q  1)
n
ˆ 2y
Schätzung mit Hilfe von BSS nach der Momentenmethode (Erwartungswertmethode)
Bei den Kreuzprodukten der ersten mit den 2. Werten der Paare muss immer die Voraussetzung erfüllt sein, dass
in jeder Gruppe mindestens 2 UEen vorhanden sind. Für die Berechnung von BSS ist eine solche Voraussetzung
nicht nötig, ebenfalls nicht für TSS. Daher können die Schätzer auch unter Verwendung dieser beiden Statistiken
aufgebaut werden. Die Erwartungswerte der beiden sind:
 j n 2j
E(BSS )   2y (J  1)   IC (n  q  (J  1))
, mit q 
n
E(TSS )   2y (n  1)   IC q  1
Die Lösung des Gleichungssystems nach der Momentenmethode liefert wiederum erwartungstreue Schätzer:
~ 

IC
~2 

y


1
BSS (n  1)  TSS(J  1)
( n  J )( n q )
1
TSS(n  q  (J  1))  BSS (q  1)
( n  J )( n q )


, mit q 
 j n 2j
Beispiel: BSS = 17.5, TSS=32, q=3.8 und n=10:
~  (17.5*9-32*2)/(7*6.2) = 2.1544.

IC
n
~ 2 =(32*(10-3.8-2)+17.5*2.8)/(7*6.2) = 4.228.

y
Nagl, Multilevel-Materialien, Intraclass
Seite 5
Wie an Hand des Beispiels deutlich wird, liefern diese beiden Schätzer leider nicht das gleiche Ergebnis wie die
vorherigen Schätzer. Die beiden Schätzer würden das gleiche Ergebnis dann liefern, wenn alle Gruppen gleich
groß wären.
Speziell wegen der Problematik ungleicher Gruppengrößen wurden Maximum-Likelihood-Schätzer entwickelt,
die bevorzugen sind.
Beschreibung der Daten durch ein lineares Modell
Für jede der J Gruppen werden nj Responsewerte(=y) erhoben. Bei der Darstellung der Daten sollte das Modell
zumindest zwei Quellen der Variation berücksichtigen, die gruppenspezifische (2. Ebene) und die der 1. Ebene.
Die beiden Komponenten werden im linearen Modell addiert (es werden hier und nachfolgend i. a. der Einfachheit halber auch für die Bezeichnung der Zufallsvariablen Kleinbuchstaben verwendet; aus dem Zusammenhang
sollte ersichtlich sein, wann der Buchstabe eine Realisation oder eine Zufallsvariable darstellt).
Der Responsewert
Für die i. UE 1. Ebene der j. Gruppe gelte:
werde als lineare
y ij  a j  e ij , mit
Funktion des UEena j als Effekt der j. Gruppe und
Effekts und einer
Störgröße dargestellt.
e ij als Störgröße
Beispiel: Der Mathematikscore (y) eines Schülers ist beschreibbar als Summe aus dem Leistungsniveau der Gruppe (aj) und der individuellen Komponente (= eij).
Die Modellgleichung y ij  a j  e ij ist nicht nur als Beschreibung der Daten für eine Realisation zu lesen, sondern als die Beschreibung des Vorgangs, wie die Werte entstehen. I. a. wird unterstellt, dass die Störgröße e ij
für jede i. UE1 innerhalb der j. Gruppe zufällig aus der gleichen Verteilung von Störgrößen gezogen wird. Sie ist
daher auf jeden Fall eine Zufallsvariable (infolgedessen ist auch yij eine Zufallsvariable).
Status des Gruppeneffekts (fix oder stochastisch):
Der Effekt der j. Gruppe aj könnte eventuell als feste (fixe) Größe konzipiert werden, wenn sich die Überlegungen auf eine fest abgegrenzte (meist gut überschaubare) Population von Gruppen bezieht, die vollständig
erhoben wird. Das ist immer dann möglich, wenn die Gruppen inhaltlich beschrieben werden (z.B. die
Gruppen von Männer und Frauen bzw. die Gruppen der Unterschicht, Mittelschicht und Oberschicht
usw.).
Andererseits sind Gruppen oft selbst eine Zufallsauswahl aus einer Gesamtheit von Gruppen. Auf der Entdeckung von Unterschieden zwischen Gruppen liegt dann der Schwerpunkt der Überlegungen (nicht den
Unterschieden zwischen speziellen Gruppen gilt das Interesse). Die Stichprobe der Gruppen ist dann nur ein
Mittel zum Zweck des Schließens auf die Gesamtheit der Gruppen. Falls diese Konzeption vorliegt, wird aj
als Zufallsvariable aufgefasst (die Effekte aj werden dann auch stochastisch bzw. random genannt). Die Effekte aj aller möglichen Gruppen zusammen bilden die Populationsverteilung der Effekte. Dadurch dass eine
Gruppe zufällig ausgewählt wird, wird implizit gleichzeitig der Effekt zufällig aus dieser Populationsverteilung der Effekte gezogen. Der Effekt ist aber durchaus fest mit der ausgewählten Gruppe verbunden.
Da die Gruppen bei Mehrebenenanalysen selten vollständig erhoben werden, wird meistens die Idee der zufälligen Auswahl der Gruppen und damit die Idee stochastischer Gruppeneffekte verwendet.
Stochastische Unabhängigkeit von Störgrößen und Gruppeneffekten
Drei Arten von Unabhängigkeitsforderungen können unterschieden werden:
 Jede der Störgrößen (eij) ist von allen andern Störgrößen (ei´j´) stochastisch unabhängig. In Stichprobensprache ausgedrückt heißt das, dass alle Störgrößen unabhängig voneinander gezogen werden.
 Jeder der stochastischen Gruppeneffekte (aj) ist von allen andern stochastischen Gruppeneffekten (aj´)
stochastisch unabhängig. In Stichprobensprache ausgedrückt heißt das, dass alle Gruppeneffekte unabhängig voneinander gezogen werden.
 Alle Störgrößen (eij) sind stochastisch unabhängig von allen Gruppeneffekte (aj). In Stichprobensprache ausgedrückt heißt das, dass das Ziehen der Störgrößen unabhängig von den Gruppeneffekten gezogen werden.
Nagl, Multilevel-Materialien, Intraclass
Seite 6
Für manche Folgerungen reicht die Forderung der Unkorreliertheit; die Unabhängigkeit impliziert die Unkorreliertheit. Umgekehrt impliziert die Unkorreliertheit nur bei normalverteilten Größen die stochastische Unabhängigkeit.
Mittelwerte bzw. Varianzen von Größen in der Population entsprechen den Erwartungswerten bzw. Varianzen
der Zufallsgrößen (beim einmaligen Ziehen).
y ij  a j  e ij ,
mit E(a j )  a , Var (a j )   2u
und E(e ij )  0 , Var (e ji )   e2
Meist wird der Gruppeneffekt selbst zentriert dargestellt mit u j  a j  a . Das Modell kann mit diesen Größen
dann so formuliert werden:
y ij  a  u j  e ij ,
mit E(u j )  0 , Var (u j )   2u
und E(e ij )  0 , Var (e ji )   e2
Wegen der Unabhängigkeit der Zufallsgrößen sind auch alle Kovarianzen (und Korrelationen) zwischen irgendwelchen Stör- bzw. Effektgrößen gleich Null.
Die Varianz von yij ist gleich der Summe dieser beiden Varianzen Var ( y ij )   2u   e2 .
Denn: Var ( y ij ) = Var (a  u j  e ij ) = (a ist eine Konstante, Konstanten ändern die Varianz nicht)
= Var (u j  e ij )
= (Die Varianz einer Summe von unkorrelierten Zufallsvariablen ist die Summe der Varianzen der Summanden) =
2
2
Var (u j )  Var (e ij ) =  u   e . Qed.
Die im vorigen Abschnitt allgemein konzipierte Varianz Var ( y ij )   2y ist gleich Summe der Varianzen der
stochastischen Gruppeneffekte und der Störgröße.
Intraclass-Kovarianz und –Korrelation für die Population
Auf Grund der Annahmen für dieses Modell kann die Intraclass-Kovarianz direkt berechnet werden, das ist die
Kovarianz innerhalb der gleichen Gruppe j zwischen zwei verschiedenen UEen i und i´:
Cov ( y ij , y ij )   2u
Denn: Cov( y ij , y ij ) = Cov(a  u j  e ij , a  u j  e ij ) = (a ist eine Konstante, Konstanten ändern die Kovarianzen nicht)
=
Cov(u j  e ij , u j  e ij ) = (Die Kovarianz einer Summe ist die Summe der Kovarianzen aller Summandenpaare) =
Cov(u j , u j )  Cov(u j , e ij )  Cov(e ij , u j )  Cov(e ij , e ij ) = (wegen der Unabhängigkeitsforderung sind alle Kovarianzen außer der 1. null)
riablen) = Var (u j )
= Cov(u j , u j ) = (Die Kovarianz einer Zufallsvariablen mit sich selbst ist gleich der Varianz der Va-
=  2u . Qed.
Die im vorigen Abschnitt allgemein konzipierte Kovarianz Cov( y ij , y ij )   IC ist nun im Rahmen des vorliegenden linearen Modells mit stochastischen Gruppeneffekten gleich der Varianz der stochastischen Gruppeneffekte.
Cov ( y ij , y ij )  2u
2
Daher ist die Intraclass-Korrelation gleich  IC 
 2  2 u 2 . Diese Form kann auch interVar ( y ij )
 y u  e
pretiert werden als Verhältnis der Varianz des Gruppeneffekts zur Varianz von y.
Determinationskoeffizient 1. Art (= 2) für die Population
Der Determinationskoeffizient 1. Art (auch als eta**2 = 2 bekannt) kann als Anteil der durch Berücksichtigung
der Gruppeneffekte erklärte Varianz interpretiert werden im folgenden Sinn: Auf Grund der Kenntnis der Gruppeneffekte können die Einzelwerte besser ‚erraten’ werden als auf Grund des Gesamteffekts (=a).
Der Prädiktionsfehler kann mittels der Varianz gemessen werden. Der Prädiktionsfehler MIT Berücksichtigung
der Gruppeneffekte ist die Varianz der Störgröße:  e2 . Der Prädiktionsfehler OHNE Berücksichtigung der
Gruppeneffekte ist die Varianz von y selbst:  2y   2u   e2 .
Das PRE-Maß (Proportional Reduction of Error) =
Prädiktion sfehler(OH NE)  Prädiktion sfehler(OH NE)
Prädiktion sfehler(OH NE)
Nagl, Multilevel-Materialien, Intraclass
=
Seite 7
( 2u   e2 )   e2

 2u   e2
 2u
 2y

 2u
 2u   e2
:  2
Der Determinationskoeffizient 1. Art ist im vorliegenden Modell gleich der Intraclass-Korrelation.
Schätzung der Modellparameter
Die Schätzung der Modellparameter baut i.a. auf der ANOVA-Tabelle einer einfaktoriellen Varianzanalyse auf:
ANOVA-Tabelle
DF =
Source Freiheitsgrade
Gruppe
J-1
Error
n-J
C. Total
Mit q 
n-1
1
n
 j n 2j .
Beispiel: n = 10, J = 3.
(1)
Sum of
Squares
(2)= (1)/ DF
=MS(=Mean
Square)
(3) Erwartungswert
von(1) = E(SS)
SS(Gruppe) MS(Gruppe) (J  1)e2  (n  q)2u
SS(Error)
SS(Total)
(n  J)e2
MS(Error)
MS(Total)
(n  1)e2  (n  q)2u
Falls alle Gruppen gleich groß (= I) wären, wäre q=
I. und n = IJ.
Source
DF
(1)
Sum of
Squares
(2)
= (1)/ DF
=MS
(3) Erwartungswert von(1) =
E(SS)
Gruppe
2
17.5
8.75
2e2  6.22u
Error
7
14.5
2.07
C. Total
9
32
3.55
7e2
9e2
 6.22u
Im vorliegenden Fall sind die 3 Gruppen unterschiedlich groß
(5, 3, 2); daher ist q=(25+9+4)/10=3.8.
Die Quadratsumme SSQ(Gruppe) wird auch als Between-SS (=BSS), die Quadratsumme SS(Error) als WithinSS(=WSS) und die Total-Quadratsumme als TSS bezeichnet, wobei gilt: TSS = WSS + BSS. Diese Bezeichnungen wurden schon oben eingeführt.
Schätzung der Varianzen nach der Momentenmethode (Erwartungswertmethode)
Die Erwartungswerte der Quadratsummen wurden bereits in der obigen ANOVA-Tabelle eingefügt. Die Gleichsetzung der Erwartungswerte der Quadratsumme mit den Quadratsummen (=Momentenmethode) führt zum
Gleichungssystem, deren Lösung die erwartungstreuen Schätzer liefert:
ˆ 2u 
ˆ e2

1
( n  J )( n q )
BSS (n  1)  TSS(J  1)
1
(n J)
WSS
, mit q 
 j n 2j
n
Beispiel: BSS = 17.5, TSS=32, q=3.8 und n=10:
ˆ 2u  (17.5*9-32*2)/(7*6.2) =
2.1544.
̂ e2 =14.5/7 = 2.0714.

In speziellen Datensituationen kann der Schätzers  2u leider negative Werte annehmen.
Andere Schätzmethoden für die Varianzen
Für ungleiche Gruppengrößen wurden ML-Schätzer entwickelt, die i. a. zu bevorzugen sind. Ein Nachteil der
ML-Schätzer besteht darin, dass keine expliziten Schätzformeln angegeben werden können; sie können nur iterativ berechnet werden. Zudem sind die ML-Schätzer i. a. nicht erwartungstreu, wohl aber konsistent und asymptotisch effizient; zusätzlich sind sie approximativ normalverteilt. Weiters sind Funktionen von ML-Schätzern wiederum ML-Schätzer. Damit diese Eigenschaften gelten, müssen die Stichproben groß sein.
Wegen der Problematik der Erwartungstreue wurden REML-Schätzer Beispiel: Die mit der REML-Methode ermittelten
(Restricted ML) entwickelt, die immerhin im Fall gleicher GruppenSchätzwerte sind
größen die gleichen Schätzer liefern wie die erwartungstreuen Moˆ 2u  2.352 und ̂ e2 = 2.089.
menten-Schätzer.
Determinationskoeffizienten 1. Art (= 2) für die Stichprobe
Der Determinationskoeffizient für die Stichprobe wird nach dem gleichen Muster wie für die Population berechnet. Dabei werden zwei Varianten unterschieden. Zusätzlich zum üblichen Determinationskoeffizienten, bei dem
die Abweichungsquadratsummen als Fehlermaß verwendet wird, wird in den meisten Programmen auch der
sogenannte adjustierte Determinationskoeffizient ausgedruckt, bei dem die Mean Squares als Fehlermaß verwendet wird.
Nagl, Multilevel-Materialien, Intraclass
Seite 8
Beispiel: Fehler(OHNE Gruppe)= TSS = 32
Fehler(MIT Gruppe)= WSS = 14.5.
Determinationskoeffizient 1. Art = 0.547
Fehler(OHNE Gruppe)= TSS. Fehler(MIT Gruppe)= WSS
Determinationskoeffizient 1. Art= 1 – WSS/TSS= BSS/TSS
Der adjustierte Determinationskoeffizient 1. Art (=adj. 2) ist das PRE-Maß mit Mean Sum of Squares als
Fehlermaß. Wiederum werden die zwei Modelle verglichen.
Beispiel: Fehler(OHNE Gruppe)
= MS(Total) = 3.55
Fehler(MIT Gruppe)= MS(Error) = 2.07.
Adj. Determinationskoeffizient 1. Art = 0.417.
Fehler(OHNE Gruppe)= MS(Total) = TSS/(n-1).
Fehler(MIT Gruppe)= MS(Error) = WSS/(n-J).
Adj. Determinationskoeffizient 1. Art =1- MS(Error)/MS(Total)
Der adjustierte Determinationskoeffizient kann leider auch negativ werden.
Erwartungstreue der beiden Determinationskoeffizienten
Der Erwartungswert eines Verhältnis kann recht gut durch das Verhältnis der Erwartungswerte von Zähler und
Nenner approximiert werden (das ist allerdings nur das erste Glied im Rahmen einer Taylorentwicklung); es soll
aber beachtet werden, dass der Erwartungswert eines Verhältnis nicht gleich dem Verhältnis der Erwartungswerte ist.
Falls die beiden Koeffizienten erwartungstreu wären, müsste der Erwartungswert der Koeffizienten mit dem
2
Populationsdeterminationskoeffizienten 1. Art = 2 u 2 übereinstimmen.
u  e

Der Determinationskoeffizient 1. Art überschätzt den Populationsdeterminationskoeffizienten, besonders
stark bei kleinem n und vielen Gruppen. Der Erwartungswert des Zählers ist E(BSS)  (J  1)e2  (n  q)2u .
Der Erwartungswert des Nenners ist E(TSS)  (n  1)e2  (n  q)2u . Der Erwartungswert des Verhältnisses
der Quadratsummen kann durch das Verhältnis der Erwartungswerte der Quadratsummen
E(BSS )
E(BSS ) (J  1) e2  (n  q) 2u
BSS
E(
)
angenähert werden, wobei gilt:
=
=
TSS
E(TSS )
E(TSS) (n  1) e2  (n  q) 2u
( J 1)
( n q )
 e2   2u
( n 1)
( n q )
 e2   2u
.
Hier stört im Vergleich zum Populationsdeterminationskoeffizienten im Zähler vor allem der Ausdruck
( J 1)
( n q )

 e2 , der besonders groß wird bei kleinem n und vielen Gruppen.
Der adjustierte Determinationskoeffizient 1. Art kommt sehr nahe an den Populationsdeterminationskoeffizienten ran. Der Erwartungswert des Nenners ist E(TSS/(n-1)) = e2  (nnq1) 2u . Der Erwartungswert des
Zählers ist E(TSS/(n-1) - WSS/(n-J)) =  e2 
( n q )
n 1
 2u   e2 =
( n q )
n 1
 2u . Das Verhältnis kann wiederum
angenähert werden. Daher E(Adj. Determinationskoeffizient 1. Art) 
( n q ) 2
u
n 1
( n q )
 e2  n 1  2u
=
 2u
n 1
n q
 e2   2u
. Da-
bei wird deutlich, dass der adjustierte Koeffizient wesentlich näher an den Populationskoeffizienten ran
kommt.
Nagl, Multilevel-Materialien, Intraclass
Seite 9
Anhang: Zur Kreuzprodukte-Berechnung mit der Intraclass-Wertepaartabelle.
Ungewichtete Berechnung
Die Berechnung der Kovarianz zwischen den ersten und zweiten Werten der Paare nach dem Vorschlag von
YULE & KENDALL führt bei ungleichen Gruppengrößen zu folgenden Formeln:
Die Anzahl der Paare ist gleich n    j1 n j (n j  1)
J
Beispiel:
Der Mittelwert der ersten Werte der Paarwerte (= y  ) ist gleich dem
Mittelwert der zweiten Werte der Paarwerte(= y  ), da die zweiten
Werte die gleichen Werte wie die ersten sind (sie sind nur in einer
anderen Reihenfolge angeschrieben).
y  = y  
n
j
1 J
(n j  1) y ij , dieser Mittelwert stimmt i. a. nicht

n  j1
i 1
mit dem Mittelwert der Werte überein: y  
1
n
J
Der Mittelwert der ersten Werte
y  = 99/28 =
3.536. Dieser Wert ist gleich dem Mittelwert der
2. Werte (das sind die gleichen Werte in anderer
Reihenfolge angeschrieben werden).
Bei ungleichen Gruppengrößen stimmt dieser
Mittelwert i.a. nicht überein mit dem Mittelwert
der ursprünglichen Werte y  = 3.
nj
  y ij .
j1 i 1
Die Varianz der ersten Werte der Paarwerte ist wiederum gleich der
Varianz der zweiten Werte der Paarwerte
Var ( y ) = Var ( y ) 
n   5*4 + 3*2 + 2*1 =28.
n
j
1 J
(n j  1) ( y ij  y  ) 2

n  j1
i 1
Die Kovarianz der Paare ist gleich Cov ( y , y ) 
CP yy
n 
mit dem
Die Varianz der ersten Werte der Paare =
Var ( y ) = 76.96 / 28 = 2.75.
Die zweiten Werte der Paare sind wiederum nur
eine andere Reihenfolge der ersten, daher ist auch
die Varianz der zweiten gleich der Varianz der
ersten.
Die Kovarianz der ersten Werte mit den zweiten
Werte der Paare =
Cov ( y , y ) = 9.694 / 28 = 0.356.
J nj nj
Kreuzprodukt. CP yy     ( y ij  y  )( y kj  y  )
j1 i 1 k  i
Die Intraclass-Korrelation rIC 
rIC =
9.694 / 28
= 0.13.
76.96 / 28
Cov ( y , y )
Var ( y )
Bei diesem Vorschlag ist besonders der Mittelwert ein recht kompliziertes, intuitiv schwer nachvollziehbares
nj
J
 1  J

1 J
1  J
1 J
(n j  1) y ij =
Gebilde: y  
(n j  1)n j y  j =   n 2j y  j   n j y  j  =   n 2j y  j  ny   .






n  j1
n   j1
n  j1
i 1
j1
 n   j1

Das hängt damit zusammen, dass die Werte der Gruppen implizit mit der Größe minus 1 (= n j -1) gewichtet werden; dadurch wird der Mittelwert vorwiegend durch die großen Gruppen bestimmt.
Gewichtete Berechnung
Der Sinn einer solchen Gewichtung ist schwer nachvollziehbar. Daher wird hier der Vorschlag gemacht, diese
1
Gewichtung rückgängig zu machen; das kann dadurch erreicht werden, dass die Werte pro Person mit
n j 1
gewichtet werden; dadurch wird die unpassende implizite Gewichtung der oberen Form ausgeglichen. Da auf
diese Art schon pro Person implizit gewichtet wird, muss nun für die Berechnung des Gesamtmittelwerts nicht
mehr durch n´´ dividiert, sondern durch n dividiert werden:
Nagl, Multilevel-Materialien, Intraclass
Seite 10
Der Mittelwert der ersten Werte der Paarwerte (= y  ) ist gleich dem
Mittelwert der zweiten Werte der Paarwerte(= y  ) und infolge der
Gewichtung gleich dem Mittelwert der y-Werte selbst
1
n
y  = y  = y  
J nj
  y ij
nj
mit CP yy    ( y ij  y  ) 2
j1 i 1
Die Intraclass-Kovarianz der Paare ist gleich Cov ( y , y ) 
CP yy
n
nj nj
J
1
  ( y ij  y  )( y kj  y  ) .
j1 n j  1 i 1 k  i
mit dem Kreuzprodukt CP yy  
y  =
3 . Dieser Wert ist gleich dem Mittelwert der 2.
Werte (da die gleichen Werte nur in anderer
Reihenfolge angeschrieben gedacht werden
können).
Bei ungleichen Gruppengrößen stimmen diese
Mittelwerte dank der vorgenommenen inversen
Gewichtung mit dem Mittelwert der y-Werte
( y  = 3) überein.
j1 i 1
Die Varianz der ersten Werte der Paarwerte ist wiederum gleich der
Varianz der zweiten Werte der Paarwerte und gleich der Varianz der
1
y-Werte selbst: Var ( y ) = Var ( y ) = Var ( y)  CP yy ,
n
J
Beispiel: Der Mittelwert der ersten Werte
Die Kreuzprodukt der ersten Werte der Paare =
CPyy = 32. Var ( y) = 3.2
Die zweiten Werte der Paare sind wiederum nur
eine andere Reihenfolge der ersten, daher ist auch
die Varianz der zweiten gleich der Varianz der
ersten.
Das Kreuzprodukt der ersten Werte mit den
zweiten Werten der Paare =
CPyy = 13; Cov ( y , y ) = 1.3
In der Berechnungsformel für CPyy bleibt das
Gewicht erhalten.
Dieses Kreuzprodukt kann als Differenz der Between-Quadratsumme minus einer gewichteten WithinQuadratsumme dargestellt werden:
J
Beispiel: Das Kreuzprodukt des jeweils 1. mit
dem 2. Wert des Paares CPyy = 13.
n
J
j
1
( y ij  y  j ) 2

j1 n j  1 i 1
CP yy   n j ( y  j  y  ) 2  
j1
J
n
= BSS  GWSS ; mit GWSS =
j1
BSS = 17.5.
nj
1
 ( y ij  y  j ) 2

1
i 1
j
Daher ist GWSS = 4.5.
GWSS ist eine gewichtete Form der Within-Quadratsumme.
J
Vorweg eine Hilfsüberlegungen:
n
j1
n
j
1
( y ij  y  j  y  j  y  ) 2 = (nach der Formel (a+b)2 ) =

j  1 i 1
nj
J
n
j
1
 n  1 ( ( y ij  y  j ) 2  2( y  j  y  ) ( y ij  y  j )  n j ( y  j  y  ) 2 )
j1 j
i 1
i 1
J
=
n
j1
nj
J
nj
1
( y ij  y  j ) 2  
( y  j  y  ) 2

j1 n j  1
j  1 i 1
n
J
Beweis:
n
n
j
j
j
J
1
1
( y ij  y  )( y kj  y  )  
( y ij  y  ) 2



n

1
n

1
j1 j
i 1 k 1
j1 j
i 1
CP yy  
J
=
n
j1
n
der Mittelwert für die j. Gruppe
J
n
n
j
j
j
J
1
1
( y ij  y  )  ( y kj  y  )  
( y ij  y  ) 2 =


k 1
j1 n j  1 i 1
j  1 i 1
yj 
J
nj
1
nj
 y kj ist) =
k 1
J
nj
(  ( y kj  y  ) = n j (y  j  y ) , da
k 1
n
j
J
1
1
 n  1 n 2j ( y  j  y  ) 2   n  1  ( y ij  y  ) 2
j1 j
j1 j
i 1
n
j
1
1
n 2j ( y  j  y  ) 2  
( y ij  y  j  y  j  y  ) 2 = (wegen der obigen Hilfsüberlegung)

j1 n j  1
j1 n j  1 i 1
=
nj
J
J
nj
1
1
2
2


n
(
y

y
)

 n  1 j  j   n  1  ( y ij  y  j ) 2   n  1 ( y  j  y  ) 2 = (Vereinfachen)
j1 j
j1 j
i 1
j1 j
J
=
Nagl, Multilevel-Materialien, Intraclass
J
n j 1
j1
n j 1
=
Seite 11
n
J
j
1
( y ij  y  j ) 2 . Kürzen liefert die behauptete Form. Daher gilt

n

1
j1 j
i 1
n j ( y  j  y  ) 2  
J
n
J
j
1
( y ij  y  j ) 2 . Qed

j1 n j  1 i 1
CP yy   n j ( y  j  y  ) 2  
j1
Spezialfall: gleiche Gruppengrößen.
Falls alle Gruppen gleich groß sind (I = nj, für alle j=1, ..., J) sind die Formeln für die gewichtete und ungewichtete Berechnung äquivalent.
Die Anzahl der Beobachtungen ist gleich n = I*J.
Ungewichtete Version
Gewichtete Version
Die Anzahl der Paare ist gleich n   JI(I  1) .
Der Mittelwert der ersten Werte der Paarwerte (= y  )
und der Mittelwert der zweiten Werte (= y  ) sind
gleich dem Mittelwert der ursprünglichen Werte:
J
I
1
1 J I
y  = y  
(I  1) y ij =

  y ij .
IJ (I  1) j1
IJ j1 i 1
i 1
Die Varianz der ersten Werte der Paarwerte und die
Varianz der zweiten Werte der Paarwerte ist identisch
mit der Varianz der ursprünglichen Werte:
J
I
1
Var ( y ) = Var ( y ) 
(I  1) ( y ij  y  ) 2

IJ (I  1) j1
i 1
Bei Gewichtung ist diese Gleichheit mit dem Gesamtmittelwert auch ohne Spezialfall gegeben:
y  = y  = y  
J
nj
  y ij
j1 i 1
Bei Gewichtung ist diese Gleichheit mit dem Gesamtmittelwert auch ohne Spezialfall gegeben:
1
Var ( y ) = Var ( y ) = Var ( y)  CP yy ,
n
J
nj
mit CP yy    ( y ij  y  ) 2
1 J I
=
 ( y ij  y  ) 2  Var ( y) .
IJ j1 i 1
Die Kovarianz der Paare ist gleich
J I I
1
Cov ( y , y ) =

 ( y ij  y  )( y kj  y  )
IJ (I  1) j1 i 1 k i
Dieser Ausdruck ist gleich der gewichteten Variante
(siehe rechts).
1
n
j1 i 1
Die Kovarianz der Paare ist gleich
CP yy
mit dem Kreuzprodukt
Cov ( y , y ) 
IJ
1 J I I
CP yy 
  ( y ij  y  )( y kj  y  ) .
I  1 j1 i 1 k i
Auch die Darstellung in den Between- und Within-Quadratsummen kann einfacher formuliert werden. Für beide
Varianten gilt nun:
J
J
J
1 I
1 J I
CP yy   I( y  j  y  ) 2  
( y ij  y  j ) 2 =  I( y  j  y  ) 2 

 ( y ij  y  j ) 2 =
I

1
I

1
j1
j1
i 1
j1
j1 i 1
= BSS  I11 WSS ;
J
mit WSS =
nj
  ( y ij  y  j ) 2
als Within-Quadratsumme.
j1 i 1
Im Spezialfall mit gleichen Gruppengrößen reichen BSS und WSS aus, die Kreuzproduktsumme der ersten und
zweiten Werte der Paare zu beschreiben, bzw. auch BSS und TSS: CPyy = BSS  I11 WSS = I11 (I BSS  TSS) .
Nagl, Multilevel-Materialien, Intraclass
Seite 12
Erwartungswerte quadratischer Formen unter Intraclass-Korrelation
 Cov (Yij , Ykj )

 IC
mit  2
. Unter Berücksichtigung der

  y  Var (Yij )  Var (Ykj )
Intraclass-Korrelation werden hier für einige quadratische Formen die Erwartungswerte berechnet. Die Gruppengrößen für die J Gruppen werden mit nj abgekürzt.
Die Intraclass-Korrelation sei  IC 
 IC
 2y
,
Satz E1. Der Erwartungswert der Summe der quadratischen Abweichungen vom Mittelwert
J nj
j n 2j
2
2
CP YY    (Yij  Y )
ist gleich E(CPYY )   y (n  1)   IC q  1, mit q 
.
n
j1 i 1
nj
J
Beweis:
E (CP YY )    E (Yij  Y ) 2 =
Der Erwartungswert von CPYY ist
j1 i 1
a) Der Summand allein
J
nj
  E(( Yij  )  (Y  )) 2 .
j1 i 1
E(( Yij  )  (Y  )) = E(Yij  )  2E(Yij  )( Y  )  E(Y  ) 2
2
2
Die einzelnen Summanden dieses Ausdrucks werden getrennt analysiert
E(Yij  )(Y  ) = E(Yij  )(
b)

1 2
 y  (n j  1) IC
=
n
E(Y  ) 2 = E(
c)
1
=
n2
J
1
n
k 1  1
nj
1
n
  Yij  ) 2 =
j1 i 1
=
k 1 i 1  1
Einsetzen der Ausdrücke b) und c) in a) liefert


1 2
1
 y  (n j  1) IC  2
n
n
nj
J
k 1  1
nj
1
 n
j1 i 1
J
nj
  E(Yij  )( Yk  )
k 1  1
J

1  2
 n y   IC  n k (n k  1) 
2
n 
k 1

nj nj
   E(Yik  )( Yk  )
J
1
  (Yk  )) = n   E(Yij  )( Yk  )

J
nj
J
1
n
E(( Yij  )  (Y  )) 2
J
 2

 n y   IC  n k (n k  1) 
k 1


=
 2y  2
=
2
1
1
 2y (1  )   IC 
(n j  1)  2
n
n
 n
J

k 1

 n k (n k  1)  .

2

1
1 J
E(CP YY )     2y (1  )   IC 
(n j  1)  2  n k (n k  1)  


n
n k 1
j1 i 1 
 n

 2 J

1
n J
1 J
n 2y (1  )   IC 
n j (n j  1)  2  n k (n k  1)  =  2y (n  1)   IC  n j (n j  1)

 n j1

n
n j1
n k 1


J nj
Daher folgt:
=
 j1 n 2j
J
=
 2y (n  1)   IC (
n
 1) . Qed.
J
Satz E2. Der Erwartungswert von BSS  n j (Y j  Y ) 2 ist gleich E(BSS )   2y (J  1)   IC (n  (J  1)  q) ,
j1
mit q 

n2
j j
n
.
J
Beweis:
Der Erwartungswert von BSS ist
E(BSS )   n j E(Y j  Y ) 2
J
=
j1
 n j E(( Y j  )  (Y  )) 2 .
j1
2
2
2
a) Der Summand allein E(( Y j  )  (Y  )) = E(Y j  )  2E(Y j  )( Y  )  E(Y  )
Die einzelnen Summanden dieses Ausdrucks werden getrennt analysiert.
Nagl, Multilevel-Materialien, Intraclass
b)
E(Y j  )(Y  ) = E(

Seite 13
nj
1
nj
 (Yij  )(
i 1
1
n
J nk
  (Yk  )) =
k 1  1
J
n j nk
   E(Yij  )( Yk  )
k 1 i 1  1

=
1 2
 y  (n j  1) IC .
n
c)
E(Y  ) 2 = siehe beim letzten Beweis oben unter c) =
d) E ( Y j  ) 2 = E (
=
1
n jn

1
nj
nj
 (Yij  )(
i 1
J

1  2
 n y   IC  n k (n k  1)  .
2 
n 
k 1

nj
1
nj
nj nj
1
 (Yj  )) =
  E(Yj  )( Yij  )
n 2j
 1
i 1  1

1 2
 y  (n j  1) IC .
nj
E(( Y j  )  (Y  )) 2
Einsetzen der Ausdrücke b) bis d) in a) liefert




J
 2

 n y   IC  n k (n k  1) 
k 1


J
 1 2

1
1
2 1
= y (
 )   IC  (  )( n j  1)  2  n k (n k  1)  .


nj n
n k 1
 nj n

J

 1 2

1
1 J
2 1
 )   IC  (  )( n j  1)  2  n k (n k  1)  
Daher folgt: E ( BSS )   n j   y (
 nj n


nj n
n k 1
j1



=
1 2
1
1
 y  (n j  1) IC  2  2y  (n j  1) IC  2
nj
n
n
=
   2y (1 
J

j1 
=
=
J

k 1

J


k 1


2n j
nj

)   IC  (1 
)( n j  1)  2
n
n
n

nj

2 J
n
 2y (J  1)   IC  n  J   n j (n j  1)  2

n
n
j1

 2y (J  1)   IC (n  (J  1) 

J
n2
j1 j
 n k (n k  1)  
1
J

j1

 n k (n k  1)  =  2y (J  1)   IC  n  J  n  n j (n j  1) 
) . Qed.
n
n
J
j
1
( y ij  y  j ) 2 ist gleich E(GWSS )  J( 2y   IC ) .

j1 n j  1 i 1
Satz E3. Der Erwartungswert von GWSS  
n
J
Beweis:
Der Erwartungswert von GWSS ist
J
=
n
j1
j
1
E(Yij  Y j ) 2

n

1
j1 j
i 1
E(GWSS )  
n
j
1
E(( Yij  )  (Y j  )) 2 .

j  1 i 1
a) Der Summand allein
E(( Yij  )  (Y j  )) 2 = E(Yij  ) 2  2E(Yij  )( Y j  )  E(Y j  ) 2 .
Die einzelnen Summanden dieses Ausdrucks werden getrennt analysiert
b)
E(Yij  )(Y j  ) = E (( Yij  )(
1
nj
nj
 (Yj  )) =
 1
c) E ( Y j  ) = (siehe beim letzten Beweis unter d) =
2
Einsetzen der Ausdrücke b) und c) in a) liefert
=
 2y  2


1
nj
nj
 E(Yij  )( Yj  ) =
 1

1 2
 y  (n j  1) IC
nj

E(( Yij  )  (Y j  )) 2


n j 1 2
1 2
1 2
 y  (n j  1) IC 
 y  (n j  1) IC =
( y   IC ) .
nj
nj
nj

n j  n j 1 2

( y   IC ) 


j1 n j  1  n j

J
Daher folgt:
E(GWSS )  
=
J( 2y   IC ) . Qed.

1 2
 y  (n j  1) IC
nj

Nagl, Multilevel-Materialien, Intraclass
Seite 14
nj
J
Satz E4. Der Erwartungswert von WSS    ( y ij  y  j ) 2 ist gleich E( WSS)  (n  J)(  2y   IC ) .
j1 i 1
J nj
Beweis:
Der Erwartungswert von GWSS ist
E(GWSS )    E(Yij  Y j ) 2 =
j1 i 1
a) Der Summand allein
J
nj
  E(( Yij  )  (Y j  )) 2 .
j1 i 1
E(( Yij  )  (Y j  )) = E(Yij  )  2E(Yij  )( Y j  )  E(Y j  ) 2
2
2
Die einzelnen Summen werden dieses Ausdrucks werden getrennt analysiert
b)

1 2
 y  (n j  1) IC
nj
E(Yij  )(Y j  ) = (siehe oben) =
c) E ( Y j  ) 2 = (siehe oben) =

1 2
 y  (n j  1) IC
nj
Einsetzen der Ausdrücke b) und c) in a) liefert
Daher folgt:

E(( Yij  )  (Y j  )) 2 = (siehe oben) =
J
 n j 1 2

E( WSS)   n j 
( y   IC ) 


j1
 nj

=
n
J
( y  j  y  ) 
2
j
j1
E(CP YY )   IC n  1  q    2y , mit q 
Beweis:
Der Erwartungswert von
CPyy ist
n j 1
nj
( 2y   IC ) .
(n  J)(  2y   IC ) . Qed.
J
Satz E5. Der Erwartungswert von CP yy 


j1
1
n j 1
nj
 (y
ij
 yj )2
ist
i 1
 j n 2j
.
n
E(C YY )  E(BSS  GWSS ) = E(BSS )  E(GWSS ) =
( 2y (J  1)   IC (n  (J  1)  q))  J( 2y   IC ) =   2y   IC (n  1  q )) . Qed.
Satz E6: Die beiden Arten von Momenten-Schätzern für die Varianz der ersten (bzw. zweiten) Messwerte der
Paare und deren Kovarianz sind bei gleichen Gruppengrößen (=k) in allen J Gruppen gleich.
Erläuterung: Die auf Grund der Quadratsummenformeln nach der Momentenmethode geschätzte Intraclass~ 
1
BSS (n  1)  TSS(J  1) 

IC
( n  J )( n  q )
Kovarianz- bzw. Varianzformeln sind ~ 2
.
1
TSS(n  q  (J  1))  BSS (q  1) 
 
( n  J )( n  q )
y
Die auf Grund der Kreuzprodukte nach der Momentenmethode geschätzte Intraclass-Kovarianz- bzw. Varianz1
CP YY  CP YY (n  1)
ˆ IC 
 j n 2j
n ( n q )
formeln sind
.
, mit q 
ˆ 2y  n ( n1q ) CP YY (n  (q  1))  CP YY (q  1) 
n
Diese beiden Arten von Schätzern liefern i. a. unterschiedliche Ergebnisse. Falls aber alle Gruppen gleich sind,
sind die Ergebnisse gleich.
Beweis:
Falls alle Gruppen gleich groß(=I) sind, gilt n = I*J und daher q = I. Zudem gilt
1
I 1
GWSS =
1 J I
 ( y ij  y  j ) 2
I  1 j1 i 1
=
WSS . Wegen TSS=BSS+WSS folgt für das Kreuzprodukt der ersten und 2. Werte
J
J
I
CP yy  I ( y  j  y  ) 2  I11  ( y ij  y  j ) 2
j1
j1 i 1
= BSS  1
I 1
WSS =
1
(I * BSS  TSS) .
I 1
Die Gleichheit der Schätzer wird erst nach Umformungen der beiden Schätzpaare deutlich; zuerst folgt die Umformung der ersten
Schätzer:
Nagl, Multilevel-Materialien, Intraclass
~ 

IC
~2 

y
Seite 15


1
BSS (IJ  1)  TSS (J  1)
( IJ  J )( IJ  I )
1
TSS (I  1)( J  1))  BSS (I  1)
( IJ  J )( IJ  I )


~ 

IC
~2 


y

1
BSS (IJ  1)  TSS(J  1)
IJ ( I 1)( J 1)
1
TSS (J  1)  BSS
IJ ( J 1)


Ersetzen der Kreuzproduktformeln durch die entsprechenden Quadratsummenformeln im 2. Schätzpaar ergibt
ˆ IC 
ˆ 2y 

1
IJ ( J 1) I
1
IJ ( J 1) I
ˆ IC 
ˆ 2y

TSS  I11 (I * BSS  TSS)( IJ  1)
TSS(IJ  (I  1))  I * BSS  TSS 

( IJ 1) I
I ( J 1)
1
BSS  TSS I 1
IJ ( J 1) I
I 1
1
TSS (J  1)  BSS
IJ ( J 1)





ˆ IC 
ˆ 2y
ˆ IC 
ˆ 2y



( IJ 1) I
( IJ  I )
1
BSS  TSS I 1
IJ ( J 1) I
I 1
1
TSS (J  1)  BSS
IJ ( J 1)




1
BSS (IJ  1)  TSS(J  1)
IJ ( I 1)( I 1)
1
TSS(J  1)  BSS
IJ ( J 1)
Der Vergleich des jeweils letzten Ausdruckpaars macht die Gleichheit deutlich. Qed.




.