Lehrstuhl für Finanzierung Vorlesung „Finanzmanagement“ Bayes-Diskriminanzanalyse: Ergänzung Professor Dr. Jochen Wilhelm Bayes-Diskriminanzanalyse im Mehrklassenfall Die betrachtete, in einzelne Klassen zerlegte Grundgesamtheit ist wie üblich Ω = Ω1 ∪ ∪Ωk mit Ωi ∩Ω j = ∅ für alle i ≠ j , der Merkmalsvektor X : Ω → R , die (a priori) Wahrscheinlichkeit µ , die bedingten Wahrscheinlichkeiten p µ j ( A) = µ ( A ∩Ω j ) (1) µ (Ω j ) sind gegeben ( A ⊂ Ω messbar). Die zu konstruierende Entscheidungsfunktion (Strategie) sei e : R p → {1, 2,…, k } . Diese Funktion ordnet den Merkmalsausprägungen x die Klasse zu, zu der das betreffende Objekt mutmaßlich gehört (Klassifikation). Die Entscheidungsfunktion soll die Eigenschaft haben, dass die Fehlklassifikationswahrscheinlichkeit minimal ist. Die Fehlklassifikationswahrscheinlichkeit ergibt sich zu k ∑ µ {ω ∈ Ω e ( X (ω )) ≠ j} . (2) j j =1 Nun gilt gemäß der Definition (1) der bedingten Wahrscheinlichkeit { } { } µ ω ∈ Ω j e ( X (ω )) ≠ j = µ ω ∈ Ω e ( X (ω )) ≠ j ∩Ω j { = µ (Ω j )⋅ µ j ω ∈ Ω e ( X (ω )) ≠ j } und { } { } µ j ω ∈ Ω e ( X (ω )) ≠ j = 1− µ j ω ∈ Ω e ( X (ω )) = j , so dass die Fehlklassifikationswahrscheinlichkeit sich zu k { 1− ∑ µ (Ω j ) µ j ω ∈ Ω e ( X (ω )) = j j =1 } (3) ergibt. Man minimiert daher die Fehlklassifikationswahrscheinlichkeit, wenn man den Ausdruck k ∑ µ (Ω ) µ {ω ∈ Ω e ( X (ω )) = j} j j (4) j =1 maximiert. Unter der Annahme, dass der Merkmalsvektor X als Zufallsvariable eine gemeinsame Dichtefunktion besitzt, bezeichnen wir mit f j ( x ) die unter Ω j bedingte Dichtefunktion ( j = 1,…, k ) . Dann ist (4) in der Form -2- k ∑ ∫∫∫ j =1 k µ (Ω j )⋅1B j ( x )⋅ f j ( x )⋅ dx = ∫∫∫ ∑ µ (Ω j )⋅1B j ( x)⋅ f j ( x)⋅ dx j=1 { mit B j = x ∈ R e ( x ) = j p } zu schreiben (1 A (5) 1 für x ∈ A ). Da der Integrand von (5) 0 sonst ( x) = überall nicht negativ ist, wird das Integral maximal, wenn man den Integranden für jeden Wert von x maximal macht (die festzulegenden Mengen B j sind – müssen sein - paarweise disjunkt, ihre Vereinigung ist R ). Daraus ergibt sich die folgende Festlegung für die einzelnen Zuordnungsbereiche p x ∈ B j ⇒ ∀ i∈{1,…, k } : µ (Ω j )⋅ f j ( x ) ≥ µ (Ωi )⋅ f i ( x) . (6) Sind die jeweiligen Maxima in (6) nicht eindeutig, ist die Zuordnung im Überschneidungsbereich beliebig festzulegen. Die Entscheidungsfunktion lautet dann e ( x) = j ⇔ x ∈ B j Bayes-Diskriminanzanalyse im Zweiklassenfall Wenden wir Definition (6) auf den Zweiklassenfall an, so ergibt sich das Kriterium x ∈ B1 ⇔ µ (Ω1 )⋅ f1 ( x ) ≥ µ (Ω2 )⋅ f 2 ( x) x ∈ B2 = R p B1 ⇔ µ (Ω1 )⋅ f1 ( x ) < µ (Ω2 )⋅ f 2 ( x) , woraus sich mit der Annahme multivariater Normalverteilung der Merkmale die Quadratische Diskriminanzanalyse folgern lässt.