Bayes-Diskriminanzanalyse: Ergänzung

Werbung
Lehrstuhl für Finanzierung
Vorlesung „Finanzmanagement“
Bayes-Diskriminanzanalyse: Ergänzung
 Professor Dr. Jochen Wilhelm
Bayes-Diskriminanzanalyse im Mehrklassenfall
Die betrachtete, in einzelne Klassen zerlegte Grundgesamtheit ist wie üblich
Ω = Ω1 ∪
∪Ωk mit Ωi ∩Ω j = ∅ für alle i ≠ j ,
der Merkmalsvektor X : Ω → R , die (a priori) Wahrscheinlichkeit µ , die bedingten
Wahrscheinlichkeiten
p
µ j ( A) =
µ ( A ∩Ω j )
(1)
µ (Ω j )
sind gegeben ( A ⊂ Ω messbar).
Die zu konstruierende Entscheidungsfunktion (Strategie) sei
e : R p → {1, 2,…, k } .
Diese Funktion ordnet den Merkmalsausprägungen x die Klasse zu, zu der das betreffende Objekt
mutmaßlich gehört (Klassifikation). Die Entscheidungsfunktion soll die Eigenschaft haben, dass
die Fehlklassifikationswahrscheinlichkeit minimal ist. Die Fehlklassifikationswahrscheinlichkeit
ergibt sich zu
k
∑ µ {ω ∈ Ω e ( X (ω )) ≠ j} .
(2)
j
j =1
Nun gilt gemäß der Definition (1) der bedingten Wahrscheinlichkeit
{
}
{
}
µ ω ∈ Ω j e ( X (ω )) ≠ j = µ  ω ∈ Ω e ( X (ω )) ≠ j ∩Ω j 


{
= µ (Ω j )⋅ µ j ω ∈ Ω e ( X (ω )) ≠ j
}
und
{
}
{
}
µ j ω ∈ Ω e ( X (ω )) ≠ j = 1− µ j ω ∈ Ω e ( X (ω )) = j ,
so dass die Fehlklassifikationswahrscheinlichkeit sich zu
k
{
1− ∑ µ (Ω j ) µ j ω ∈ Ω e ( X (ω )) = j
j =1
}
(3)
ergibt. Man minimiert daher die Fehlklassifikationswahrscheinlichkeit, wenn man den Ausdruck
k
∑ µ (Ω ) µ {ω ∈ Ω e ( X (ω )) = j}
j
j
(4)
j =1
maximiert. Unter der Annahme, dass der Merkmalsvektor X als Zufallsvariable eine gemeinsame
Dichtefunktion besitzt, bezeichnen wir mit f j ( x ) die unter Ω j bedingte Dichtefunktion
( j = 1,…, k ) . Dann ist (4) in der Form
-2-
k
∑ ∫∫∫
j =1
 k

µ (Ω j )⋅1B j ( x )⋅ f j ( x )⋅ dx = ∫∫∫ ∑ µ (Ω j )⋅1B j ( x)⋅ f j ( x)⋅ dx
 j=1

{
mit B j = x ∈ R e ( x ) = j
p
} zu schreiben (1
A
(5)
1 für x ∈ A

). Da der Integrand von (5)


 0 sonst
( x) = 
überall nicht negativ ist, wird das Integral maximal, wenn man den Integranden für jeden Wert von
x maximal macht (die festzulegenden Mengen B j sind – müssen sein - paarweise disjunkt, ihre
Vereinigung ist R ). Daraus ergibt sich die folgende Festlegung für die einzelnen Zuordnungsbereiche
p
x ∈ B j ⇒ ∀ i∈{1,…, k } : µ (Ω j )⋅ f j ( x ) ≥ µ (Ωi )⋅ f i ( x) .
(6)
Sind die jeweiligen Maxima in (6) nicht eindeutig, ist die Zuordnung im Überschneidungsbereich
beliebig festzulegen. Die Entscheidungsfunktion lautet dann
e ( x) = j ⇔ x ∈ B j
Bayes-Diskriminanzanalyse im Zweiklassenfall
Wenden wir Definition (6) auf den Zweiklassenfall an, so ergibt sich das Kriterium
x ∈ B1 ⇔ µ (Ω1 )⋅ f1 ( x ) ≥ µ (Ω2 )⋅ f 2 ( x)
x ∈ B2 = R p B1 ⇔ µ (Ω1 )⋅ f1 ( x ) < µ (Ω2 )⋅ f 2 ( x)
,
woraus sich mit der Annahme multivariater Normalverteilung der Merkmale die Quadratische
Diskriminanzanalyse folgern lässt.
Herunterladen