Verarbeitung geographischer Daten SS 2002 Diskriminanzanalyse Referentinnen: Florentina Dobre, Iulia Pascu, Nikola Sander 1.Einleitung 2. Das Verfahren 2.1 Definition der Gruppen und Variablen 2.2 Formulierung der Diskriminanzfunktion 2.3 Schätzung der Diskriminanzfunktion 2.4 Prüfung der Diskriminanzfunktion 2.5 Prüfung der Merkmalsvariablen 2.6 Klassifizierung von neuen Elementen 3. Mehr Gruppen – mehr Variablen Fall 4. Die Anwendung des SPSS-Programms 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS „Die Diskriminanzanalyse ist eine Methode zur Überprüfung von Gruppen- und Klassenunterschieden.“ (Bahrenberg 1992, 316) Merkmale: • Erklärung von abhängigen durch unabhängige Variablen • Zusammenhänge zwischen Variablen • konfirmatorisches Verfahren 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Fragestellungen: • Ist die Gruppierung die bestmögliche? • Zu welcher Gruppe gehört ein bisher nicht klassifiziertes Element? • Gibt es signifikante Gruppenunterschiede hinsichtlich der Variablen? 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Diskriminanzanalyse in der Geographie: • Trennung von Raumeinheiten • Zuordnung nicht klassifizierter Raumeinheiten • Überprüfung einer erstellten Raumgliederung • Analyse der Unterschiede zwischen Raumtypen 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Voraussetzungen: • metrisch skalierte Variablen • Normalverteilung der Daten • kein Element darf mehreren Gruppen angehören • STP-Umfang mind. Doppelt so groß wie Anzahl der Variablen • Gruppenanzahl kleiner als Variablenanzahl 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS zwei Gruppen – zwei Variablen Fall •Anwendungsproblem • vorgeschaltete Analyse • Festlegung der Gruppenanzahl • Beispiel: 23 Klimastationen in 2 Gruppen laut Clusteranalyse TunesienBeispiel Klimastation Gruppe A Gruppe B http://dev.lib.utexas. edu/maps/africa/ tunisia_pol_1990.jpg (Stand: 09.06.2002) 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Projektion der Gruppenelemente auf die beiden Merkmalsachsen -> Überschneidungsbereiche Abb.1 Trennung durch die Ausgangsvariablen x1 und x2 Quelle: Bahrenberg 1992, 319. 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS •Funktion (Achse) zur optimalen Trennung der Gruppen zu bestimmen -> Diskriminanzachse Abb.2 Trennung durch verschiedene Diskriminanzachsen Quelle: Bahrenberg 1992, 321 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Diskriminanzfunktion Y Linearkombination der beiden Merkmalsvariablen X1 und X2 Y = v1x1 + v2x2 Y = Diskriminanzvariable (Funktion) x1, x2 = Merkmalsvariablen v1, v2 = Diskriminanzkoeffizienten für die Merkmalsvariablen 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Annahme: Die Diskriminanzachse verläuft durch den Ursprung allein die Steigung bestimmt die Qualität der Trennung durch folgendes Verhältnis: v2 x2 = v― x1 1 v1 und v2 sind aufgrund der Daten der Merkmalsausprägungen zu schätzen 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Diskriminanzkriterium Messung der Unterschiedlichkeit der Gruppen Berücksichtigt auch die Streuung innerhalb der Gruppen Verhältnis von erklärter und nicht erklärter Streuung 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Komponenten des Diskriminanzkriteriums: 1. Maximierung der Streuung zwischen den Gruppen (erklärte Streuung): _ _ d² = (yA – yB)² _ _ - yA und yB - Gruppenmittelpunkte 2. Minimierung der Streuung innerhalb der Gruppen (nicht erklärte Streuung): nA _ nB _ s² = Σ (yAj – yA)² + Σ (yBj – j=1 j=1 yB)² 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Maximierung des Diskriminanzkriteriums Bedingung für möglichst kleine Überschneidungebereiche d² γ = — max s² 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Durch partielle Differentiation von γ nach v1 und v2 erhält man folgende Bestimmungsgleichungen: v1*s11+v2*s12=d1 v1*s12+v2*s22=d2 d1, d2 – Mittelwertabweichungen s11, s22 – Varianz der beiden Variablen s12 - Kovarianz Benötigt zur Berechnung der Diskriminanzfunktion Beispiel: y = 0,414*x1-0,037*x2 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Messung der Unterschiedlichkeit der Gruppen Analyse der Trennkraft der Funktion Zwei Möglichkeiten der Prüfung: 1. Vergleich mit dem Kritischen Diskriminanzwert 2. Betrachtung des Diskriminanzkriteriums 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 1. Vergleich mit kritischem Diskriminanzwert • Berechnung eines Wertes auf der Diskriminanzachse für jedes Element j yj = v1x1j + v2x2j Berechnung des kritischen Diskriminanzwertes: arithmetisches Mittel (gleichgroße Cluster) gewichtetes arithmetisches Mittel • (unterschiedlich große Cluster) _ _ 1. Vergleich mit kritischem Diskriminanzwert nAyA + nByB yT = n + n A B = 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS = 14,06 17 * 14,34 + 6 * 13,29 17 + 6 Einteilung der Diskriminanzwerte in Gruppen wenn: yj > yT: Zuordnung zu Gruppe A yj < vT: Zuordnung zu Gruppe B yj = yT: Keine Zuordnung möglich Vergleich im Beispiel: fehlerhafte Zuordnung der Klimastationen Kairouan und El Djem 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 1. Vergleich mit kritischem Diskriminanzwert Quantitative Aussage über die Trennkraft der Diskriminanzfunktion anhand der Klassifikationsmatrix Gruppenzugehörigkeit nach der Diskriminanzanalyse Cluster A Vorgegebene Gruppenzugehörigkeit Cluster A Cluster B ∑ 15 (88,24%) 0 15 Cluster B 2 (11,76%) ∑ 17 6 (100%) 8 6 23 Trefferquote: Aussage über tatsächliche Trennkraft der Diskriminanzfunktion TunesienBeispiel Klimastation Gruppe A Gruppe B http://dev.lib.utexas. edu/maps/africa/ tunisia_pol_1990.jpg (Stand: 09.06.2002) 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums Eigenwert γ (Maximalwert des Diskriminanzkriteriums): Maß für die Trennkraft / Güte der Diskriminanzfunktion Nachteil: nicht auf Werte zwischen Null und Eins normiert zwei Alternativen 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums ●Kanonischer Korreltationskoeffizient cK = γ 1+γ Im zwei Gruppen – zwei Variablen Fall ist CK = B Je größer der kanonische Korrelationskoeffizient, desto höher ist die Trennkraft der Diskriminanzfunktion Beispiel: CK = 0,7158 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS 2. Betrachtung des Diskriminanzkriteriums • Wilks`Lambda 1 Lk = 1+γ Inverses Gütemaß: je kleiner die Werte desto höher die Trennkraft Beispiel: Lk = 0,4875 Ermöglicht eine statistische Signifikanzprüfung der Diskriminanzfunktion durchzuführen 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Überprüfung des Einflusses der Variablen auf die Zuordnung der Elemente • Wichtig: Erklärung der Gruppenunterschiedlichkeit Entfernung nicht aussagekräftiger Variablen • • Betrachtung der Diskrimianzkoeffizienten v Skalierungsabhängig Standardisierung 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS C1 = sX1* v1 = 1,1427 * 0,414 = 0,473 C2 = sx2* v2 = 1,760 * -0,037 = -0,065 • je größer das Ergebnis, desto stärker der Einfluss • das Vorzeichen der Werte ist unwichtig 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS • Klassifizierung neuer Elemente mit Hilfe der Diskriminanzfunktion • Einsetzen der Merkmalsvariablen des neuen Elements in die Diskriminanzfunktion • Vergleich des Wertes mit kritischem Diskriminanzwert • Einteilung in eine Gruppe Je nachdem, ob neuer Wert größer oder kleiner als kritischer Diskriminanzwert ist 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS Mehr Gruppen – mehr Variablen Fall • Praxisbezogen • Ermittlung mehrerer Diskriminanzfunktionen (Achsen) • mehrere Methoden der Klassifizierung neuer Elemente 1. Distanzkonzept (min. Abstand zwischen Elementen und Gruppencentroid) 2. Wahrscheinlichkeitskonzept (höchste Wahrscheinlichkeit der Gruppenzugehörigkeit) 1. Einleitung 2. Verfahren 2.1. Gruppendefinition 2.2 Funktionsformulierung 2.3 Funktionsschätzung 2.4 Funktionsprüfung 2.5 Variablenprüfung 2.6 Zuordnung neuer Elemente 3.MehrGruppen mehrVariablen Fall 4. SPSS SPSS • Geeignet für den Mehr Gruppen – Mehr Variablen Fall • Notwendigkeit, eine Spalte für die Gruppen (als abhängige Variable) zu erstellen • im Menu „Statistiken“ „Klassifizieren“ „Diskriminanzanalyse“ • abhängige und unabhängige Variablen wählen • Bereich definieren • zwischen „unabhängige Variable zusammen aufnehmen“ und „schrittweise Methode verwenden“ wählen • „Auswählen“: Analyse auf bestimmte Fälle beschränken • „Statistik“ Deskriptivstatistiken zusätzliche Funkionskoeffizienten Kovrianz- und Korrelationsmatrizen innerhalb der Gruppen und der Gesamtstichprobe • Minimalprogramm folgende Optionen aktivieren • Bei „Speichern“ lassen sich folgende Ergebnisse als neue Variablen speichern: Ende