8. Diskriminanzanalyse

Werbung
Verarbeitung geographischer Daten
SS 2002
Diskriminanzanalyse
Referentinnen:
Florentina Dobre, Iulia Pascu, Nikola Sander
1.Einleitung
2. Das Verfahren
2.1 Definition der Gruppen und Variablen
2.2 Formulierung der Diskriminanzfunktion
2.3 Schätzung der Diskriminanzfunktion
2.4 Prüfung der Diskriminanzfunktion
2.5 Prüfung der Merkmalsvariablen
2.6 Klassifizierung von neuen Elementen
3. Mehr Gruppen – mehr Variablen Fall
4. Die Anwendung des SPSS-Programms
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
„Die Diskriminanzanalyse ist eine
Methode zur Überprüfung von
Gruppen- und Klassenunterschieden.“
(Bahrenberg 1992, 316)
Merkmale:
• Erklärung von abhängigen durch
unabhängige Variablen
• Zusammenhänge zwischen Variablen
• konfirmatorisches Verfahren
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Fragestellungen:
• Ist die Gruppierung die bestmögliche?
• Zu welcher Gruppe gehört ein bisher
nicht klassifiziertes Element?
• Gibt es signifikante Gruppenunterschiede hinsichtlich der
Variablen?
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Diskriminanzanalyse in der Geographie:
• Trennung von Raumeinheiten
• Zuordnung nicht klassifizierter
Raumeinheiten
• Überprüfung einer erstellten
Raumgliederung
• Analyse der Unterschiede zwischen
Raumtypen
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Voraussetzungen:
• metrisch skalierte Variablen
• Normalverteilung der Daten
• kein Element darf mehreren Gruppen
angehören
• STP-Umfang mind. Doppelt so groß
wie Anzahl der Variablen
• Gruppenanzahl kleiner als
Variablenanzahl
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
zwei Gruppen – zwei Variablen Fall
•Anwendungsproblem
• vorgeschaltete Analyse
• Festlegung der Gruppenanzahl
• Beispiel:
23 Klimastationen in 2 Gruppen
laut Clusteranalyse

 

 





 




 



TunesienBeispiel

Klimastation
Gruppe A
Gruppe B
http://dev.lib.utexas.
edu/maps/africa/
tunisia_pol_1990.jpg
(Stand: 09.06.2002)
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
• Projektion der Gruppenelemente auf
die beiden Merkmalsachsen
-> Überschneidungsbereiche
Abb.1 Trennung durch die Ausgangsvariablen x1 und x2 Quelle: Bahrenberg 1992, 319.
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
•Funktion (Achse) zur optimalen
Trennung der Gruppen zu bestimmen
-> Diskriminanzachse
Abb.2 Trennung durch verschiedene Diskriminanzachsen Quelle: Bahrenberg 1992, 321
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Diskriminanzfunktion Y
 Linearkombination der beiden
Merkmalsvariablen X1 und X2
Y = v1x1 + v2x2
Y = Diskriminanzvariable (Funktion)
x1, x2 = Merkmalsvariablen
v1, v2 = Diskriminanzkoeffizienten für
die Merkmalsvariablen
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Annahme:
Die Diskriminanzachse verläuft durch
den Ursprung
 allein die Steigung bestimmt
die Qualität der Trennung
durch folgendes Verhältnis:
v2
x2 = v― x1
1
 v1 und v2 sind aufgrund der Daten der
Merkmalsausprägungen zu schätzen
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Diskriminanzkriterium
 Messung der Unterschiedlichkeit
der Gruppen
 Berücksichtigt auch die Streuung
innerhalb der Gruppen
 Verhältnis von erklärter und nicht
erklärter Streuung
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Komponenten des Diskriminanzkriteriums:
1. Maximierung der Streuung zwischen
den Gruppen (erklärte Streuung):
_ _
d² = (yA – yB)²
_
_
- yA und yB - Gruppenmittelpunkte
2. Minimierung der Streuung innerhalb
der Gruppen (nicht erklärte Streuung):
nA
_
nB
_
s² = Σ (yAj – yA)² + Σ (yBj –
j=1
j=1
yB)²
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Maximierung des Diskriminanzkriteriums
 Bedingung für möglichst kleine
Überschneidungebereiche
d²
γ = —  max
s²
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
 Durch partielle Differentiation von γ
nach v1 und v2 erhält man folgende
Bestimmungsgleichungen:
v1*s11+v2*s12=d1
v1*s12+v2*s22=d2
d1, d2 – Mittelwertabweichungen
s11, s22 – Varianz der beiden Variablen
s12
- Kovarianz
 Benötigt zur Berechnung der
Diskriminanzfunktion
 Beispiel: y = 0,414*x1-0,037*x2
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
 Messung der Unterschiedlichkeit
der Gruppen
 Analyse der Trennkraft der
Funktion
Zwei Möglichkeiten der Prüfung:
1. Vergleich mit dem Kritischen
Diskriminanzwert
2. Betrachtung des
Diskriminanzkriteriums
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
1. Vergleich mit kritischem Diskriminanzwert
• Berechnung eines Wertes auf der
Diskriminanzachse für jedes Element j
yj = v1x1j + v2x2j
Berechnung des kritischen
Diskriminanzwertes:
 arithmetisches Mittel (gleichgroße Cluster)
 gewichtetes arithmetisches Mittel
•
(unterschiedlich große Cluster)
_
_
1. Vergleich mit kritischem Diskriminanzwert
nAyA + nByB
yT = n + n
A
B
=
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
= 14,06
17 * 14,34 + 6 * 13,29
17 + 6
Einteilung der Diskriminanzwerte in Gruppen
 wenn:
yj > yT: Zuordnung zu Gruppe A
yj < vT: Zuordnung zu Gruppe B
yj = yT: Keine Zuordnung möglich
Vergleich im Beispiel:
fehlerhafte Zuordnung der Klimastationen
Kairouan und El Djem
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
1. Vergleich mit kritischem Diskriminanzwert
Quantitative Aussage über die Trennkraft der
Diskriminanzfunktion anhand der
Klassifikationsmatrix
Gruppenzugehörigkeit nach
der Diskriminanzanalyse
Cluster A
Vorgegebene
Gruppenzugehörigkeit
Cluster A
Cluster B
∑
15 (88,24%)
0
15
Cluster B
2 (11,76%)
∑
17
6
(100%)
8
6
23
Trefferquote:
Aussage über tatsächliche Trennkraft der
Diskriminanzfunktion

 

 





 




 



TunesienBeispiel

Klimastation
Gruppe A
Gruppe B
http://dev.lib.utexas.
edu/maps/africa/
tunisia_pol_1990.jpg
(Stand: 09.06.2002)
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
2. Betrachtung des Diskriminanzkriteriums
Eigenwert γ (Maximalwert des
Diskriminanzkriteriums):
 Maß für die Trennkraft / Güte
der Diskriminanzfunktion
 Nachteil: nicht auf Werte zwischen
Null und Eins normiert
 zwei Alternativen
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
2. Betrachtung des Diskriminanzkriteriums
●Kanonischer Korreltationskoeffizient
cK =
γ
1+γ
 Im zwei Gruppen – zwei Variablen
Fall ist CK = B
 Je größer der kanonische
Korrelationskoeffizient,
desto höher ist die Trennkraft
der Diskriminanzfunktion
 Beispiel: CK = 0,7158
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
2. Betrachtung des Diskriminanzkriteriums
• Wilks`Lambda
1
Lk =
1+γ
 Inverses Gütemaß: je kleiner die
Werte desto höher die Trennkraft
 Beispiel: Lk = 0,4875
 Ermöglicht eine statistische
Signifikanzprüfung der
Diskriminanzfunktion durchzuführen
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Überprüfung des Einflusses der
Variablen auf die Zuordnung der
Elemente
• Wichtig:
 Erklärung der
Gruppenunterschiedlichkeit
 Entfernung nicht aussagekräftiger Variablen
•
• Betrachtung der Diskrimianzkoeffizienten v
 Skalierungsabhängig
 Standardisierung
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
C1 = sX1* v1
= 1,1427 * 0,414 = 0,473
C2 = sx2* v2 = 1,760 * -0,037 = -0,065
• je größer das Ergebnis, desto stärker
der Einfluss
• das Vorzeichen der Werte ist unwichtig
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
• Klassifizierung
neuer Elemente mit
Hilfe der Diskriminanzfunktion
• Einsetzen der Merkmalsvariablen des
neuen Elements in die Diskriminanzfunktion
• Vergleich des Wertes mit kritischem
Diskriminanzwert
• Einteilung in eine Gruppe
 Je nachdem, ob neuer Wert
größer oder kleiner als
kritischer Diskriminanzwert ist
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
Mehr Gruppen – mehr Variablen Fall
• Praxisbezogen
• Ermittlung mehrerer Diskriminanzfunktionen (Achsen)
• mehrere Methoden der Klassifizierung
neuer Elemente
1. Distanzkonzept
(min. Abstand zwischen Elementen und
Gruppencentroid)
2. Wahrscheinlichkeitskonzept
(höchste Wahrscheinlichkeit der
Gruppenzugehörigkeit)
1. Einleitung
2. Verfahren
2.1. Gruppendefinition
2.2 Funktionsformulierung
2.3 Funktionsschätzung
2.4 Funktionsprüfung
2.5 Variablenprüfung
2.6 Zuordnung
neuer
Elemente
3.MehrGruppen
mehrVariablen
Fall
4. SPSS
SPSS
• Geeignet für den Mehr Gruppen –
Mehr Variablen Fall
• Notwendigkeit, eine Spalte für die
Gruppen (als abhängige Variable) zu
erstellen
• im Menu „Statistiken“
 „Klassifizieren“
 „Diskriminanzanalyse“
• abhängige und unabhängige Variablen wählen
• Bereich definieren
• zwischen „unabhängige Variable zusammen aufnehmen“ und
„schrittweise Methode verwenden“ wählen
• „Auswählen“: Analyse auf bestimmte Fälle beschränken
• „Statistik“
 Deskriptivstatistiken
 zusätzliche Funkionskoeffizienten
 Kovrianz- und Korrelationsmatrizen innerhalb
der Gruppen und der Gesamtstichprobe
• Minimalprogramm
 folgende Optionen aktivieren
• Bei „Speichern“ lassen sich folgende Ergebnisse als
neue Variablen speichern:
Ende
Herunterladen