Kein Folientitel

Werbung
Teil 7. Gauß’sche Mischmodelle
Fragen A
A1. Definitionen
 Wie ist Σ auf Seite 5 definiert?
 Wie ist µ auf S. 5 definiert? Wie kann man µ mit Schätzwerten initialisieren?
A2. Kovarianzmatrix I
 Schätzen Sie aus dem Graph auf Seite 6 gk und µk ab.
 Welche Σk sind diagonal, welche nicht?
A3. EM-Algorithmus I
 Welche Probleme treten beim EM-Algorithmus auf, wenn nur wenige Merkmalsvektoren
einer Klasse zugeordnet werden?
 Wie können diese Probleme vermieden werden?
A4. EM-Algorithmus II
 Was ist die Bedeutung der Variable γ(zk(n))?
 Warum wird ein GMM auch als multivariates Dichtemodell bezeichnet?
Digitale
Signalverarbeitung
und System
Systemtheorie|
und Audiosignalverarbeitung
Erkennung und Audioeffekte
Digital Signal
Processing and
Theory Sprach| First Name
Family Name| Title of–Presentation
Seite 1
Teil 7. Gauß’sche Mischmodelle
Antworten A
A1. Definitionen
 Σ ist definiert durch die Kovarianzen Σi,j = cov(xi,xj).
 µ ist definiert über den Mittelwert bzw. den Mittelpunkt der Gaußglocke.
µ kann z.B. mittels eines Codebuches initialisiert werden.
A2. Kovarianzmatrix I
 Die Mittelwerte µk entsprechen den Koordinaten der Maxima der Gaußglocken,
die Gewichte gk entsprechen den Volumenverhältnissen der Gaußglocken.
 Alle Σk sind diagonal, bis auf das der Gaußglocke bei µk = (-0,5; -0,5).
A3. EM-Algorithmus I
 Es entsteht ein beliebig hoher und schmaler Peak (siehe Seiten 13, 14).
 Vermeiden durch Festlegen einer unteren Grenze für die Varianz.
A4. EM-Algorithmus II
 γ(zk(n)) stellt die “gewichtete” Zugehörigkeit eines Merkmalsvektors zur k-ten
Gaußverteilung dar.
 Die Wahrscheinlichkeitsverteilung einer mehrdimensionalen Zufallsvariable nennt man
mehrdimensionale oder auch multivariate Verteilung.
Digitale
Signalverarbeitung
und System
Systemtheorie|
und Audiosignalverarbeitung
Erkennung und Audioeffekte
Digital Signal
Processing and
Theory Sprach| First Name
Family Name| Title of–Presentation
Seite 2
Teil 7. Gauß’sche Mischmodelle
Fragen B
B1. EM-Algorithmus III
 Begründen Sie die Äquivalenz der beiden Gleichungen für p(X|g,µ,Σ) auf Seite 9.
 Über was wird dabei “außen” summiert/multipliziert, über was “innen”?
 Was bewirkt der Nenner in den beiden Gleichungen auf Seite 10?
B2. Kovarianzmatrix II
 Welche Dimension hat (x(n)-µkneu), welche ihre Transposition (Gl. Seite 11 oben)?
 Wo kann die Varianz jeder Merkmalsdimension in der Matrix (x(n)-µknew) (x(n)-µknew)T
gefunden werden?
B3. Latente Zufallsvariablen
 Was ist eine latente Zufallsvariable?
 Zu welchem Zweck wird sie hier eingeführt?
B4. EM-Algorithmus IV
 Wie kann ein GMM initialisiert werden?
Digitale
Signalverarbeitung
und System
Systemtheorie|
und Audiosignalverarbeitung
Erkennung und Audioeffekte
Digital Signal
Processing and
Theory Sprach| First Name
Family Name| Title of–Presentation
Seite 3
Teil 7. Gauß’sche Mischmodelle
Antworten B
B1. EM-Algorithmus III
 Das Produktzeichen kann aus dem Logarithmus „herausgenommen“ werden und wird
dadurch zur Summation; Da log monoton steigend ist, wird das argmax nicht verändert.
 “Innen”, k: Anzahl der Gaußglocken; “außen”, n: (Zeit-) Index der Merkmalsvektoren
 Der Nenner bewirkt hier eine Normierung der Wahrscheinlichkeiten.
B2. Kovarianzmatrix II
 (Dx1) bzw. (1xD). Das Ergebnis der Multiplikation hat Dimension (DxD), entsprechend der
Dimension der Kovarianzmatrix.
 Die Varianz jeder Merkmalsdimension kann auf der Hauptdiagonalen der DxD –Matrix
gefunden werden.
B3. Latente Zufallsvariablen
 Eine latente Zufallsvariable ist eine “verborgene” Zufallsvariable, die Einfluss auf die
eigentliche Zufallsvariable nimmt und nicht direkt gemessen werden kann.
 Die “latente” Zufallsvariable ist die Zugehörigkeit zu einer bestimmten Gaußglocke, die
nicht direkt gemessen werden kann.
B4. EM-Algorithmus IV
 Siehe Seite 29.
Digitale
Signalverarbeitung
und System
Systemtheorie|
und Audiosignalverarbeitung
Erkennung und Audioeffekte
Digital Signal
Processing and
Theory Sprach| First Name
Family Name| Title of–Presentation
Seite 4
Herunterladen