Metrik

Werbung
Christian
Eine kleine Einführung
in echte und falsche
Kaernbach
Metriken,
Normen,
und ihre potentielle
Anwendung in der Psychologie der
Bedeutung und der Kreativität
Euklidische Metrik –
der Normalfall
• Gegeben zwei Punkte [x1, y1] und [x2, y2]
• Abstandsvektor [x2 – x1, y2 – y1] = [x, y]
• Abstand = Länge des Abstandsvektors:
d =  (x² + y²)
• Beispiel:
–
–
–
–
Punkt 1: [-7,3 3,5]
Punkt 2: [-4,3 7,5]
Abstandsvektor [3 4]
Abstand:  (3² + 4²) =  25 = 5
Definition Metrik
• Eine Metrik ist eine Funktion, die zwei Elementen eines Raumes
einen „Abstand“ d  0 zuweist, so daß gilt:
–
–
–
–
d (p, p) = 0
d (p, q) = 0  p = q
d (p, q) = d (q, p)
d (p, q)  d (p, u) + d (u, q)
(identische Punkte haben den Abstand 0)
(nichtidentische Punkte haben nicht Abstand 0)
(Symmetrie)
(Dreiecksungleichung: Umwege lohnen nicht)
• In einem Vektorraum mit ⇨ „Norm“
(Vektoren besitzen wohldefinierte Länge)
gibt es immer eine Metrik:
– d (p, q) = || p – q ||
(siehe Euklidische Metrik)
• Metrik ohne Norm: z. B. diskrete Metrik
– d (p, q) = 0 für p = q
– d (p, q) = 1 für p  q
q
p
u
Definition Norm
• Eine Norm ist eine Funktion, die einem Element v eines
Vektorraumes eine „Länge“ || v ||  0 zuweist, so daß gilt:
– || v || = 0  v = 0
(Definitheit)
nichtdefinit: Halbnorm
– ||  ∙ v || = || ∙ || v ||
(Homogenität) Verallgemeinerung der Symmetrie
– || v + w ||  || v || + || w || (Dreiecksungleichung)
• Beispiel: Euklidische Norm
– || v || =  ( vi²)
• verallgemeinert: p-Norm
– || v || = ( |vi|p) 1/p (p  1)
• p = 1: Betragssummennorm, Manhattan-Metrik
|| v || =  |vi|
• p = 2: Euklidische Norm/Metrik
• p = : Maximumsnorm, || v || = max(|vi|)
legale p-Normen
• Konturenplots
–
–
–
–
|| v || = ( |vi|p) 1/p mit p  1
Kontur = Menge aller Vektoren mit || v || = c
c = 1: „ Einheits kreis “ (grün)
c = 0: „Nullmenge“ (grau)
p=1
p=2
p = 10
Betragssummennorm
Manhattan-Metrik
Euklidische
Norm/Metrik
geht in Richtung
Maximumsnorm
illegale p-Normen
• Konturenplots
–
–
–
–
|| v || = ( |vi|p) 1/p mit p < 1
Kontur = Menge aller Vektoren mit || v || = c
c = 1: „ Einheits kreis “ (grün)
c = 0: „Nullmenge“ (grau)
p = 0.5
p = -2
p = -10
geht in Richtung
„Minimumsnorm“
– auch illegale p-Normen sind homogen
– p < 1: „Norm“ verletzt Dreiecksungleichung
– p < 0: „Norm“ verletzt Definitheit (|| v || = 0  v = 0) illegale Halbnorm
Schnitt
• Mathematik
• Psychologie
Semantische Räume
• Aktivierungsausbreitung im Langzeitgedächtnis:
Perlmutter & Anderson (unveröffentlicht)
Hund
-K
Zocker
-K
„Katze“
„Karte“
Knochen - F
Knochen - F
„Fleisch“
„Fleisch“
...
• RZ: 1.41 s
RZ: 1.53 s
120 ms Priming Effekt
Hund
Knochen
Katze
Fleisch
Zocker
Karte
Hund
Katze
Zocker
Multidimensionale
Skalierung
Karte
Fleisch
Knochen
• Semantische Ähnlichkeitsurteile führen zur Schätzung einer
Konfiguration der Begriffe in einem mehrdimensionalen Raum
– Beispiel: Konfiguration von
8 Emotionsbegriffen in einer Ebene
•
•
•
•
•
•
•
•
A
D
G
J
M
P
T
W
Abscheu
Billigung
Erwartung
Freude
Furcht
Traurigkeit
Überraschung
Wut
– Vorausgesetzt wird: Es gibt einen mehrdimensionalen semantischen Raum
mit euklidischer Metrik. Gefragt wird höchstens:
• Was bedeuten die Achsen?
• Wie hoch-dimensional ist der semantische Raum?
Zocker
Katze
Hund
Multidimensionale
Skalierung
Karte
Fleisch
Knochen
• Abhängigkeit des Stresses (Abweichungsmaß) für verschiedene
angenommene Dimensionszahlen von der tatsächlichen
Dimensionalität
– 20 items
– 30 Wiederholungen
Scharparameter:
tatsächliche Dimensionalität,
1.0 1.1 1.2 ... 4.8 4.9 5.0
Streß
Dimensionalität von 1.2
angenommene Dimensionszahl
Assoziationen
Fragestellungen:
• Ist es sinnvoll, zwischen Begriffen (z. B. Knotenpunkten
im Gedächtnismodel) „Abstände“ definieren zu wollen?
• Sollten diese „Abstände“ die Dreiecksungleichung erfüllen?
– Intuitives Gegenargument: Bei Assoziationen helfen „Eselsbrücken“,
d. h. Umwege können Abkürzungen sein.
• Was verbindet Wurst mit Gruppe?
Der „Abstand“ von Assoziationen könnte durch den kürzesten
„Partialabstand“ (Material, Funktion, ...) bestimmt sein („Minimumsnorm“).
• Ist es mathematisch sinnvoll / für die Modellbildung hilfreich /
für die Empirie fruchtbar, „Abstände“ zwischen Begriffen mit
illegalen Normen zu beschreiben?
Gedächtnismodelle
• Klassisches Netzwerkmodell
Hund
Knochen
Katze
Fleisch
• parallel distributed processing,
PDP, neuronale Netzwerke
– Ähnlichkeiten von Zuständen
werden über Korrelationen
definiert
Zocker
Karte
Korrelationen
Fragestellungen:
• Sind die bei neuronalen Netzwerken zur Beschreibung der
Ähnlichkeit zweier Zustände verwendeten Korrelationen
besser geeignet als „Abstände“ zur Beschreibung der
Beziehungen von semantischen Begriffen?
• Wie würde man Korrelationen in Abstände übersetzen?
•
•
•
•
Negative Korrelationen würden in positive übersetzt.
c (A, A) = 1  aus Korrelation 1 mach Abstand d1 = 0  Halbmetrik
Maximaler Abstand d0 wenn c (A, B) = 0
Wenn die Dreiecksungleichung gelten soll,
c(a...b,c...d) = 0,
muß d0 endlich sein: d0  2∙d0,5
c(a...b,a...d) = c(a...d,c...d) = 0,5
• Korrelationsmetrik entspricht
a...d
Metrik auf Halbkugeloberfläche.
a...b
c...d
Fazit
Zocker
Karte
Hund
Knochen
Katze
Fleisch
• Eine an Korrelationen orientierte
Metrik erhält die Dreiecksungleichung.
Bei dieser Metrik gibt es einen maximalen Abstand.
– Können wir mit der Vorstellung eines maximalen Abstands
von Assoziationen leben?
• Lokal kann sie durch eine euklidische Metrik angenähert werden.
– MDS verwandter Begriffe wäre sinnvoll und möglich.
• Eselsbrücken scheinen die Dreiecksungleichung zu verletzen.
• Aufgabe:
Experimentelle Überprüfung der Dreiecksungleichung...
– ... aber wie?
Ausblick
Zocker
Karte
Hund
Katze
Knochen
Fleisch
• Aufgabe:
Experimentelle Überprüfung der Dreiecksungleichung...
– ... aber wie?
– Man kann nicht irgendein Assoziationsmaß A
• Ratings
• Priming
• Koinzidenz in Texten [Google])
direkt auf die Dreiecksungleichung testen,
weil A mit d nicht linear zusammenhängen muß
• Sei d die Euklidische Metrik. Dann ist A = d² keine Metrik.
Sei d (a, b) = d (b, c) = 1, d (a, c) = 2.
Es gilt 1 + 1  2, aber nicht 1² + 1²  2².
– Multidimensionale Skalierung läßt beliebigen Funktionszusammenhang
zwischen A und d zu. Wenn man nur Monotonität fordert, wird A = f (d)
rekonstruiert. Wenn die Dreiecksungleichung nicht gilt, sollte man das am
Streß erkennen.
Probleme
Zocker
Karte
Hund
Knochen
Katze
Fleisch
• Aufgabe:
Experimentelle Überprüfung der Dreiecksungleichung...
– Multidimensionale Skalierung läßt beliebigen Funktionszusammenhang
zwischen A und d zu. Wenn man nur Monotonität fordert, wird A = f (d)
rekonstruiert. Wenn die Dreiecksungleichung nicht gilt, sollte man das
am Streß erkennen...???
• Monotone MDS birgt das Risiko der Entartung
• Simulationen mit Daten, die aus illegalen p-Normen erzeugt werden
– führen vermutlich zu erhöhten Streß-Werten. So weit so gut...
• Einfluß von Rauschen (Datenfehlern)
– verwechselbar mit Streß wegen Verletzung der Dreiecksungleichung?
• Einfluß von gekrümmten Topologien
– möglicherweise erkennbar an der Streßverteilung:
sollte eher Streß bei hohen Abständen ergeben als bei niedrigen.
• Sensitivität der MDS-Methode
für Verletzungen der zugrundeliegenden Annahmen
confused
Danke
Herunterladen