Verzerrungsarme Einbettungen in

Werbung
Verzerrungsarme Einbettungen in
Hochdimensionalen Vektorräumen
Ein elementarer Beweis für das
Johnson-Lindenstrauss Lemma
Patrick Kaster
[email protected]
Institut für Informatik III
Rheinische Friedrich-Wilhelms-Universität Bonn
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.1/28
Das Johnson-Lindenstrauss Lemma
Theorem 1 (Johnson-Lindenstrauss Lemma) Für
jedes 0 < < 1 und jedes n ∈ N sei
log n
k=O
.
2
Dann existiert für jede Menge V von n Punkten im Rd
eine Abbildung f : Rd → Rk , so dass für alle u, v ∈ V gilt:
(1 − )ku − vk2 ≤ kf (u) − f (v)k2 ≤ (1 + )ku − vk2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.2/28
Johnson-Lindenstrauss Klartext
Es existiert eine Abbildung die bei Reduktion auf
eine lediglich logarithmische Anzahl an Dimensionen
Distanzen bis auf eine Verzerrung von (1 ± ) erhält.
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.3/28
Johnson-Lindenstrauss Klartext
Es existiert eine Abbildung die bei Reduktion auf
eine lediglich logarithmische Anzahl an Dimensionen
Distanzen bis auf eine Verzerrung von (1 ± ) erhält.
Abbildung lässt sich in randomisierter polynomieller
Zeit finden.
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.3/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- kompliziert
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- elegant
Péter Frankl & Hiroshi Maehara (1988)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- elegant
Péter Frankl & Hiroshi Maehara (1988)
- Vereinfachung durch geometrische Einsichten
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- elegant
Péter Frankl & Hiroshi Maehara (1988)
- Vereinfachung durch geometrische Einsichten
- Matoušek: Maßkonzentration auf der Sphäre lässt
auf dieser definierte Zufallsvariablen und deren
Summen abschätzen
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- elegant
Péter Frankl & Hiroshi Maehara (1988)
- Vereinfachung durch geometrische Einsichten
- Matoušek: Maßkonzentration auf der Sphäre lässt
auf dieser definierte Zufallsvariablen und deren
Summen abschätzen
Sanjoy Dasgupta & Anupam Gupta (1999)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- elegant
Péter Frankl & Hiroshi Maehara (1988)
- Vereinfachung durch geometrische Einsichten
- Matoušek: Maßkonzentration auf der Sphäre lässt
auf dieser definierte Zufallsvariablen und deren
Summen abschätzen
Sanjoy Dasgupta & Anupam Gupta (1999)
- lediglich elementare Wahrscheinlichkeitsrechnung
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Beweise
William B. Johnson & Joram Lindenstrauss (1984)
- orthogonale Projektionen zwischen euklidischen
Räumen, Lipschitz-Distanz, Maßtheorie
- elegant
Péter Frankl & Hiroshi Maehara (1988)
- Vereinfachung durch geometrische Einsichten
- Matoušek: Maßkonzentration auf der Sphäre lässt
auf dieser definierte Zufallsvariablen und deren
Summen abschätzen
Sanjoy Dasgupta & Anupam Gupta (1999)
- lediglich elementare Wahrscheinlichkeitsrechnung
- bessere Schranke als Frankl & Maehara
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.4/28
Schranke k
Theorem 1 (Johnson-Lindenstrauss Lemma) Für
jedes 0 < < 1 und jedes n ∈ N sei
log n
k=O
.
2
Dann existiert für jede Menge V von n Punkten im Rd
eine Abbildung f : Rd → Rk , so dass für alle u, v ∈ V gilt:
(1 − )ku − vk2 ≤ kf (u) − f (v)k2 ≤ (1 + )ku − vk2
Gupta & Dasgupta:
4
k≥ 2
ln n
3
( /2 − /3)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.5/28
Beweisidee
Projektion f : Rd → Rk
Projektion Einheitsvektor auf zufällig gewählten
Unterraum Rk
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.6/28
Beweisidee
Projektion f : Rd → Rk
Projektion zufällig erzeugter Einheitsvektor auf festen
Unterraum Rk
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.6/28
Beweisidee
Projektion f : Rd → Rk
Projektion zufällig erzeugter Einheitsvektor auf festen
Unterraum Rk
betrachte von ersten k Koordinatenvektoren
aufgespannten Rk
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.6/28
Beweisidee
Projektion f : Rd → Rk
Projektion zufällig erzeugter Einheitsvektor auf festen
Unterraum Rk
betrachte von ersten k Koordinatenvektoren
aufgespannten Rk
projiziere zufällig erzeugten Einheitsvektor von
Rd → R k
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.6/28
Beweisidee
Projektion f : Rd → Rk
Projektion zufällig erzeugter Einheitsvektor auf festen
Unterraum Rk
betrachte von ersten k Koordinatenvektoren
aufgespannten Rk
projiziere zufällig erzeugten Einheitsvektor von
Rd → R k
Idee: Länge des Vektors ist unter Projektion scharf um
den Erwartungswert konzentriert
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.6/28
Beweisschluss
dann: wende “union bound” an
⇓
für kein Paar von n Punkten fällt die Verzerrung mit
Wahrscheinlichkeit
O
1
n2
schlechter aus als
(1 ± )
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.7/28
Definitionen
X1 , . . . , Xd ∼ N (0, 1)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.8/28
Definitionen
X1 , . . . , Xd ∼ N (0, 1)
Y =
1
kXk
(X1 , X2 , . . . , Xd )
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.8/28
Definitionen
X1 , . . . , Xd ∼ N (0, 1)
Y =
1
kXk
(X1 , X2 , . . . , Xd )
- Punkt auf S d−1
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.8/28
Definitionen
X1 , . . . , Xd ∼ N (0, 1)
Y =
1
kXk
(X1 , X2 , . . . , Xd )
- Punkt auf S d−1
Z ∈ Rk
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.8/28
Definitionen
X1 , . . . , Xd ∼ N (0, 1)
Y =
1
kXk
(X1 , X2 , . . . , Xd )
- Punkt auf S d−1
Z ∈ Rk
- Projektion von Y auf die ersten k
Koordinatenvektoren
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.8/28
Definitionen
X1 , . . . , Xd ∼ N (0, 1)
Y =
1
kXk
(X1 , X2 , . . . , Xd )
- Punkt auf S d−1
Z ∈ Rk
- Projektion von Y auf die ersten k
Koordinatenvektoren
L = kZk2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.8/28
Abweichung von der erwarteten Länge
Idee: Länge L ist unter Projektion scharf um den
Erwartungswert konzentriert
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
Erwartungswert ?
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
k
µ = EL =
d
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
k
µ = EL =
d
Lemma 1 Sei k < d. Dann folgt
1 (a) Sei β < 1 dann gilt
P [L ≤ βEL]
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
k
µ = EL =
d
Lemma 1 Sei k < d. Dann folgt
1 (a) Sei β < 1 dann gilt
ki
P L≤β
d
h
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
k
µ = EL =
d
Lemma 1 Sei k < d. Dann folgt
1 (a) Sei β < 1 dann gilt
h
P L≤β
ki
d
≤β
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
k
µ = EL =
d
Lemma 1 Sei k < d. Dann folgt
1 (a) Sei β < 1 dann gilt
h
ki
h
ki
P L≤β
1 (b) Sei β > 1
P L≥β
d
d
≤β
≤β
k
2
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
(1 − β)k
1+
(d − k)
(d−k)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.9/28
Abweichung von der erwarteten Länge
β
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
≤ exp
k
(1 − β + ln β)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.10/28
Abweichung von der erwarteten Länge
β
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
≤ exp
k
(1 − β + ln β)
2
⇓
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.10/28
Abweichung von der erwarteten Länge
β
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
≤ exp
k
(1 − β + ln β)
2
⇓
Lemma 1 Sei k < d. Dann folgt
1 (a) Sei β < 1 dann gilt
h
ki
h
ki
P L≤β
1 (b) Sei β > 1
P L≥β
d
d
≤β
≤β
k
2
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
(1 − β)k
1+
(d − k)
(d−k)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.10/28
Abweichung von der erwarteten Länge
β
k
2
(1 − β)k
1+
(d − k)
(d−k)
2
≤ exp
k
(1 − β + ln β)
2
⇓
Lemma 1 Sei k < d. Dann folgt
1 (a) Sei β < 1 dann gilt
h
i
k
k
(1 − β + ln β)
P L≤β
≤ exp
d
2
1 (b) Sei β > 1
h
P L≥β
ki
d
≤ exp
k
(1 − β + ln β)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.10/28
Beweis des Theorems
vi , vk ∈ R d
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems
vi , vk ∈ R d
f : Rd → Rk
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems
vi , vk ∈ R d
f : Rd → Rk
f (vi ) = vi0 , f (vj ) = vj0 ∈ Rk
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems
vi , vk ∈ R d
f : Rd → Rk
f (vi ) = vi0 , f (vj ) = vj0 ∈ Rk
Lvij0 = kvi0 − vj0 k
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems
vi , vk ∈ R d
f : Rd → Rk
f (vi ) = vi0 , f (vj ) = vj0 ∈ Rk
Lvij0 = kvi0 − vj0 k
2
µ = EL = kd kvi − vj k2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems
vi , vk ∈ R d
f : Rd → Rk
f (vi ) = vi0 , f (vj ) = vj0 ∈ Rk
Lvij0 = kvi0 − vj0 k
2
µ = EL = kd kvi − vj k2
P [L ≤ (1 − )µ] bzw. P [L ≥ (1 + )µ] ?
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems
vi , vk ∈ R d
f : Rd → Rk
f (vi ) = vi0 , f (vj ) = vj0 ∈ Rk
Lvij0 = kvi0 − vj0 k
2
µ = EL = kd kvi − vj k2
P [L ≤ (1 − )µ] bzw. P [L ≥ (1 + )µ] ?
Wahl der Waffen: Lemma 1(a) und 1(b)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.11/28
Beweis des Theorems: Hilfsmittel
Für den Logarithmus gelten folgende Approximationen:
x2
ln(1 − x) ≤ −x −
2
(1)
x2 x3
ln(1 + x) ≤ x −
+
2
3
(2)
sowie
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.12/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
h
P L≤β
ki
d
≤ exp
k
(1 − β + ln β)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
Es gilt:
x2
ln(1 − x) ≤ −x −
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
= exp
1−1+− +
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
1−1+− +
= exp
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
= exp
− +
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
= exp
−−
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
−−
= exp
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2 k
= exp
−
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
= exp −
4
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
= exp −
4
≤ exp(−2 ln n)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit untere Abweichung
Setze (1 − ) =: β .
Nach Lemma 1(a):
P [L ≤ (1 − )µ] ≤ exp
k
(1 − (1 − ) + ln(1 − ))
2
2
k
≤ exp
1 − (1 − ) − +
2
2
2
k
= exp −
4
1
≤ exp(−2 ln n) = 2
n
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.13/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
h
P L≥β
ki
d
≤ exp
k
(1 − β + ln β)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
Es gilt:
x2 x3
ln(1 + x) ≤ x −
+
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
2
3
k
= exp
1−1−+ − +
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
2
3
k
1−1−+ − +
= exp
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
2
3
k
= exp
− + − +
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
2
3
k
= exp
− + − +
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
2
3
k
= exp
− + − +
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
2
3
k
= exp
− +
2
2
3
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
!
2
3
k( 2 − 3 )
= exp −
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
!
2
3
k( 2 − 3 )
= exp −
2
≤ exp(−2 ln n)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit obere Abweichung
Setze (1 + ) =: β .
Nach Lemma 1(b):
P [L ≥ (1 + )µ] ≤ exp
k
(1 − (1 + ) + ln(1 + ))
2
2
3
k
≤ exp
1 − (1 + ) + − +
2
2
3
!
2
3
k( 2 − 3 )
= exp −
2
1
≤ exp(−2 ln n) = 2
n
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.14/28
Wahrscheinlichkeit der Abweichung EL
Damit haben wir gezeigt:
1
P [L ≤ (1 − )µ] ≤ 2
n
und
1
P [L ≥ (1 + )µ] ≤ 2
n
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.15/28
Beweisschluss: “union bound”
jetzt: wähle Abbildung f (vi ) =
q d
k
vi0
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.16/28
Beweisschluss: “union bound”
jetzt: wähle Abbildung f (vi ) =
q d
k
vi0
für beliebiges Punktepaar ist die Wahrscheinlichkeit
einer “starken” Abweichung, d.h. um mehr als 1 ± ,
höchstens n12 + n12 = n22
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.16/28
Beweisschluss: “union bound”
jetzt: wähle Abbildung f (vi ) =
q d
k
vi0
für beliebiges Punktepaar ist die Wahrscheinlichkeit
einer “starken” Abweichung, d.h. um mehr als 1 ± ,
höchstens n12 + n12 = n22
n
es gibt 2 Paare von Punkten
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.16/28
Beweisschluss: “union bound”
jetzt: wähle Abbildung f (vi ) =
q d
k
vi0
für beliebiges Punktepaar ist die Wahrscheinlichkeit
einer “starken” Abweichung, d.h. um mehr als 1 ± ,
höchstens n12 + n12 = n22
n
es gibt 2 Paare von Punkten
dann folgt nach “union bound”:
n
2
P [“ein Punktepaar ist stark verzerrt”] ≤
× 2
2
n
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.16/28
Beweisschluss: “union bound”
jetzt: wähle Abbildung f (vi ) =
q d
k
vi0
für beliebiges Punktepaar ist die Wahrscheinlichkeit
einer “starken” Abweichung, d.h. um mehr als 1 ± ,
höchstens n12 + n12 = n22
n
es gibt 2 Paare von Punkten
dann folgt nach “union bound”:
n(n − 1) 2
P [“ein Punktepaar ist stark verzerrt”] ≤
· 2
2
n
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.16/28
Beweisschluss: “union bound”
jetzt: wähle Abbildung f (vi ) =
q d
k
vi0
für beliebiges Punktepaar ist die Wahrscheinlichkeit
einer “starken” Abweichung, d.h. um mehr als 1 ± ,
höchstens n12 + n12 = n22
n
es gibt 2 Paare von Punkten
dann folgt nach “union bound”:
1
P [“ein Punktepaar ist stark verzerrt”] ≤ 1 −
n
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.16/28
Beweisschluss
1
P [“ein Punktepaar ist stark verzerrt”] ≤ 1 −
n
f erfüllt unsere Forderung hinsichtlich der Verzerrung
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.17/28
Beweisschluss
1
P [“ein Punktepaar ist stark verzerrt”] ≤ 1 −
n
f erfüllt unsere Forderung hinsichtlich der Verzerrung
O(n)-fache Wiederholung der Projektion lässt jede
konstante Erfolgswahrscheinlichkeit erreichen
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.17/28
Beweisschluss
1
P [“ein Punktepaar ist stark verzerrt”] ≤ 1 −
n
f erfüllt unsere Forderung hinsichtlich der Verzerrung
O(n)-fache Wiederholung der Projektion lässt jede
konstante Erfolgswahrscheinlichkeit erreichen
damit ergibt sich ein randomisiert polynomieller
Algorithmus
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.17/28
Beweis Abweichung von EL
OK. Aber ist die Abschätzung zur Abweichung von EL
korrekt?
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.18/28
Beweis Abweichung von EL
OK. Aber ist die Abschätzung zur Abweichung von EL
korrekt?
Rekapitulation
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.18/28
Beweis Abweichung von EL
OK. Aber ist die Abschätzung zur Abweichung von EL
korrekt?
Rekapitulation
X1 , . . . , Xd ∼ N (0, 1)
Y =
1
kXk
(X1 , X2 , . . . , Xd )
Z ∈ Rk
L = kZk2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.18/28
Beweis Abweichung von EL
Bevor wir mit dem Beweis von Lemma 1 beginnen,
2
(tX
) ].
betrachten wir den Erwartungswert E[e
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.19/28
Beweis Abweichung von EL
Bevor wir mit dem Beweis von Lemma 1 beginnen,
2
(tX
) ].
betrachten wir den Erwartungswert E[e
Lemma 2 Sei X normalverteilt, d.h. X ∼ N (0, 1) mit
Dichte
2
1
X
f (X) = √ exp −
2
2π
Dann ist der Erwartungswert definiert als
Z ∞
E[exp(tX 2 )] :=
exp(tX 2 )f (X) dX
−∞
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.19/28
Beweis Abweichung von EL
Bevor wir mit dem Beweis von Lemma 1 beginnen,
2
(tX
) ].
betrachten wir den Erwartungswert E[e
Lemma 2 Sei X normalverteilt, d.h. X ∼ N (0, 1) mit
Dichte
2
1
X
f (X) = √ exp −
2
2π
Dann ist der Erwartungswert definiert als
Z ∞
E[exp(tX 2 )] :=
exp(tX 2 )f (X) dX
−∞
Z ∞
2
1
X
2
exp(tX ) √ exp −
=
2
2π
−∞
dX
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.19/28
Beweis Abweichung von EL
Bevor wir mit dem Beweis von Lemma 1 beginnen,
2
(tX
) ].
betrachten wir den Erwartungswert E[e
Lemma 2 Sei X normalverteilt, d.h. X ∼ N (0, 1) mit
Dichte
2
1
X
f (X) = √ exp −
2
2π
Dann ist der Erwartungswert definiert als
Z ∞
E[exp(tX 2 )] :=
exp(tX 2 )f (X) dX
−∞
=
1
√
1 − 2t
,
1
für − ∞ < t <
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.19/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
k
P [L ≤ β ]
d
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
"
P
(X12
+ ...
+ Xk2 )
βk 2
≤
(X1 + . . . + Xd2 )
d
#
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
"
P
"
(X12
+ ...
+ Xk2 )
βk 2
≤
(X1 + . . . + Xd2 )
d
#
= P kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ) ≥ 0
#
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
"
P
(X12
+ ...
+ Xk2 )
βk 2
≤
(X1 + . . . + Xd2 )
d
"
#
= P kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ) ≥ 0
#
Um P [X ≥ 0] abzuschätzen betrachten von etX
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
"
P
(X12
+ ...
+ Xk2 )
βk 2
≤
(X1 + . . . + Xd2 )
d
"
#
= P kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ) ≥ 0
#
Markov-Ungleichung: P [etX > 1] ≤ E[etX ]
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
"
P
(X12
+ ...
+ Xk2 )
βk 2
≤
(X1 + . . . + Xd2 )
d
"
#
= P kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ) ≥ 0
#
Markov-Ungleichung: P [etX > 1] ≤ E[etX ]
"
= P exp(t(kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ))) ≥ 1
"
≤ E exp(t(kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 )))
#
#
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
Beweis 1 (Lemma 1(a))
"
P
(X12
+ ...
+ Xk2 )
βk 2
≤
(X1 + . . . + Xd2 )
d
"
#
= P kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ) ≥ 0
Markov-Ungleichung: P [etX > 1] ≤ E[etX ]
"
#
= P exp(t(kβ(X12 + . . . + Xd2 ) − d(X12 + . . . + Xk2 ))) ≥ 1
"
≤ E e
t(kβ−d)X 2
#k "
E e
tkβX 2
#
#(d−k)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.20/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
#k "
E e
tkβX 2
#(d−k)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
#k "
E e
tkβX 2
#(d−k)
Lemma 2
1
E[exp(tX )] = √
1 − 2t
2
,
1
für − ∞ < t <
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
= (1 − 2tkβ)
#k "
− (d−k)
2
E e
tkβX 2
#(d−k)
(1 − 2t(kβ − d))
− k2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
= (1 − 2tkβ)
− (d−k)
2
#k "
E e
tkβX 2
#(d−k)
(1 − 2t(kβ − d))
− k2
=: g(t)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
= (1 − 2tkβ)
− (d−k)
2
#k "
E e
tkβX 2
#(d−k)
(1 − 2t(kβ − d))
1
⇒ tkβ < ,
2
− k2
=: g(t)
1
t(kβ − d) <
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
= (1 − 2tkβ)
− (d−k)
2
#k "
E e
tkβX 2
#(d−k)
(1 − 2t(kβ − d))
1
⇒ tkβ < ,
2
− k2
=: g(t)
1
t(kβ − d) <
2
1
t ≥ 0 ⇒ 0 < t < kβ
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
"
E e
t(kβ−d)X 2
= (1 − 2tkβ)
− (d−k)
2
#k "
E e
tkβX 2
#(d−k)
(1 − 2t(kβ − d))
1
⇒ tkβ < ,
2
− k2
=: g(t)
1
t(kβ − d) <
2
1
t ≥ 0 ⇒ 0 < t < kβ
2
Minimiere g(t) über diesem Intervall!
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.21/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
Maximiere f (t) !
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
Maximiere f (t) !
ableiten t0 =
(1−β)
2β(d−kβ)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
Maximiere f (t) !
ableiten t0 =
(1−β)
2β(d−kβ)
einsetzen f (t0 ) =
d−k
d−kβ
(d−k) k
1
β
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
Maximiere f (t) !
ableiten t0 =
(1−β)
2β(d−kβ)
einsetzen f (t0 ) =
d−k
d−kβ
(d−k) k
1
β
g(t0 )
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
Maximiere f (t) !
ableiten t0 =
(1−β)
2β(d−kβ)
einsetzen f (t0 ) =
d−k
d−kβ
(d−k) k
g(t0 ) = p
1
β
1
f (to )
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(a)
Statt g(t) zu minimieren, definiere:
f (t) = (1 − 2tkβ)
(d−k)
k
(1 − 2t(kβ − d)) = (g
−1
2
(t))
Maximiere f (t) !
ableiten t0 =
(1−β)
2β(d−kβ)
einsetzen f (t0 ) =
g(t0 ) = p
1
f (to )
d−k
d−kβ
=β
k
2
(d−k) k
1
β
(1 − β)k
1+
(d − k)
(d−k)
2
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.22/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
k
P [L ≥ β ]
d
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
P
"
(X12
+ ...
+ Xk2 )
βk 2
≥
(X1 + . . . + Xd2 )
d
#
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
P
"
"
(X12
+ ...
+ Xk2 )
βk 2
≥
(X1 + . . . + Xd2 )
d
#
= P d(X12 + . . . + Xk2 ) − kβ(X12 + . . . + Xd2 ) ≥ 0
#
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
P
"
(X12
+ ...
+ Xk2 )
βk 2
≥
(X1 + . . . + Xd2 )
d
"
#
= P d(X12 + . . . + Xk2 ) − kβ(X12 + . . . + Xd2 ) ≥ 0
#
analoges Vorgehen liefert schliesslich:
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
P
"
(X12
+ ...
+ Xk2 )
βk 2
≥
(X1 + . . . + Xd2 )
d
"
#
= P d(X12 + . . . + Xk2 ) − kβ(X12 + . . . + Xd2 ) ≥ 0
= (1 + 2tkβ)
− (d−k)
2
(1 + 2t(kβ − d))
#
− k2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
P
"
(X12
+ ...
+ Xk2 )
βk 2
≥
(X1 + . . . + Xd2 )
d
#
"
= P d(X12 + . . . + Xk2 ) − kβ(X12 + . . . + Xd2 ) ≥ 0
= (1 + 2tkβ)
− (d−k)
2
(1 + 2t(kβ − d))
− k2
#
=: g(−t)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
Beweis 2 (Lemma 1(b))
P
"
(X12
+ ...
+ Xk2 )
βk 2
≥
(X1 + . . . + Xd2 )
d
#
"
= P d(X12 + . . . + Xk2 ) − kβ(X12 + . . . + Xd2 ) ≥ 0
= (1 + 2tkβ)
− (d−k)
2
(1 + 2t(kβ − d))
− k2
#
=: g(−t)
1
⇒ 0 < t < (d − kβ)
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.23/28
Beweis Lemma 1(b)
g(−t) nimmt für β > 1 ihr Minimum in −t0 an
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.24/28
Beweis Lemma 1(b)
g(−t) nimmt für β > 1 ihr Minimum in −t0 an
einsetzen von −t0 in g(−t)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.24/28
Beweis Lemma 1(b)
g(−t) nimmt für β > 1 ihr Minimum in −t0 an
einsetzen von −t0 in g(−t)
"
P (X12 + . . . + Xk2 ) ≥
βk
2
(X
1
d
≤
β
k
2
1+
(1−β)k
(d−k)
+ . . . + Xd2 )
(d−k)
2
#
2
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.24/28
Einbettung in beliebige Dimensionen
jeder gewichtete Graph lässt sich in k ≤ C log n
Dimensionen mit Lipschitz-Verzerrung
√
3/2
O(n2/k (log n) / k) einbetten
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.25/28
Einbettung in beliebige Dimensionen
jeder gewichtete Graph lässt sich in k ≤ C log n
Dimensionen mit Lipschitz-Verzerrung
√
3/2
O(n2/k (log n) / k) einbetten
einbetten des Graphen in `2 mit Verzerrung O(log n)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.25/28
Einbettung in beliebige Dimensionen
jeder gewichtete Graph lässt sich in k ≤ C log n
Dimensionen mit Lipschitz-Verzerrung
√
3/2
O(n2/k (log n) / k) einbetten
einbetten des Graphen in `2 mit Verzerrung O(log n)
dann: Projektion auf k Dimensionen mittels
diskutierter Projektionstechnik
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.25/28
Clustering von Proteinsequenzen
“Clustering” von Datenpunkten in hochdimensionalen
oder nicht-metrischen Räumen schwierig
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.26/28
Clustering von Proteinsequenzen
“Clustering” von Datenpunkten in hochdimensionalen
oder nicht-metrischen Räumen schwierig
Einbettung in niedrigere Dimensionen wertvolles
Hilfsmittel
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.26/28
Clustering von Proteinsequenzen
“Clustering” von Datenpunkten in hochdimensionalen
oder nicht-metrischen Räumen schwierig
Einbettung in niedrigere Dimensionen wertvolles
Hilfsmittel
Beispiel: Datenraum aller bekannten Proteine
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.26/28
Clustering von Proteinsequenzen
“Clustering” von Datenpunkten in hochdimensionalen
oder nicht-metrischen Räumen schwierig
Einbettung in niedrigere Dimensionen wertvolles
Hilfsmittel
Beispiel: Datenraum aller bekannten Proteine
Distanzmaße zur Schätzung von funktionalen,
strukturellen, evolutionären Zusammenhängen
(FASTA, BLAST)
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.26/28
Zusammenfassung
Einbettung in niedrig dimensionale Räume mit
geringer Verzerrung möglich
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.27/28
Zusammenfassung
Einbettung in niedrig dimensionale Räume mit
geringer Verzerrung möglich
Beweis lässt sich mit elementar probabilistischen
Techniken führen
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.27/28
Zusammenfassung
Einbettung in niedrig dimensionale Räume mit
geringer Verzerrung möglich
Beweis lässt sich mit elementar probabilistischen
Techniken führen
Einbettung kann in randomisiert polynomieller Zeit
erfolgen
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.27/28
“ this is the end
my only friend, the end ”
- Jim Morrison
¨
Verzerrungsarme Einbettungen in Hochdimensionalen Vektorraumen
– p.28/28
Herunterladen