Schließende Statistik mit unscharfen Stichproben

Schließende Statistik
mit
unscharfen Stichproben
von
Volker Steinmetz
Dezember 1998
LATEX-Version der Nr. A9802, Diskussionsbeiträge Fachbereich Wirtschaftswissenschaft, Universität des Saarlandes
Inhaltsverzeichnis
1 Einleitung
3
2 Fuzzy-Mengen reeller Zahlen
6
3 Schätzen und Testen mit unscharfen Stichproben
25
3.1 Parameterpunktschätzungen
26
3.2 Alternativtests
30
3.3 Konf idenzbereichsschätzungen
34
4 Die formale Struktur statistischer Entscheidungsmodelle mit
unscharfen Stichproben
39
5 Zusammenfassung und Ergänzungen
43
6 Anhang
45
7 Literaturverzeichnis
50
2
1
Einleitung
Sowohl im alltägliche Leben als auch bei der wissenschaftlichen Arbeit werden
wir mit unvollkommenen oder imperfekten 1 Informationen konfrontiert: Unsere Sinnesorgane erzeugen nur grobe Abbilder der Realität, Meßgeräte und
statistische Erhebungen liefern Angaben von begrenzter Genauigkeit, sprachliche Begriﬀe und Formulierungen sind - von der standardisierten, präzisen
Sprache der Mathematik einmal abgesehen - von kaum zu vermeidender Vieldeutigkeit, komplexe Systeme sind notgedrungen oft nur approximativ darzustellen und folglich auch nur ungenau zu analysieren. Schließlich ist das
Eintreten zukünftiger Ereignisse für uns häuﬁg mit Unsicherheit behaftet.
Zur Modellierung und Untersuchung des zuletzt genannten Typs von Imperfektion stellen Wahrscheinlichkeitstheorie und schließende Statistik seit langem bewährte Hilfsmittel bereit, man spricht in diesem Fall von stochastischer
Imperfektion oder Unsicherheit. Auch einen Teil der Meß- und Erhebungsfehler kann man dieser Kategorie der Unvollkommenheit zurechnen. Es ist
charakteristisch, daß die interessierenden Phänomene im Idealfall präzise deﬁniert sind, über ihr Auftreten jedoch Unsicherheit besteht.
Um einen anderen Typ von Imperfektion handelt es sich, wenn beispielsweise
eine Wirtschaftszeitung die Nettoumsatzrendite eines deutschen Industrieunternehmens als durchschnittlich bezeichnet. Auch wenn man weiß, daß die
Umsatzrendite aller deutschen Industrieunternehmen zu Beginn der neunziger Jahre im Durchschnitt etwas über 2 % lag, hat man durch die in der
Zeitschrift gegebene Information nur eine vage Vorstellung von der Umsatzrentabilität des angegebenen Unternehmens, man bezeichnet diese nichtstochastische Imperfektion als Unschärfe. Die Bedeutung des oben verwendeten
Begriﬀs ‘durchschnittlich‘ ist kontextabhängig; wenn z.B. in demselben Artikel auch die Eigenkapitalrendite als durchschnittlich bezeichnet wird, ist
damit ein ganz anderer Zahlenbereich angedeutet. Zusätzlich variiert die Interpretation dieses vagen Begriﬀs auch noch von Leser zu Leser, sie ist subjektiv. Aber trotz der oﬀensichtlich fehlenden Eindeutigkeit kann beispielsweise
auch der Anlageberater einer Bank mit einer derartigen Bewertung arbeiten,
um die Informationsﬂut, die bei der Beurteilung eines Unternehmens anfällt,
überschaubar zu gestalten.
Die menschliche Sprache, und folglich auch das menschliche Denken, arbeiten
1
Zum Terminus ‘imperfekt‘ als Oberbegriﬀ für ‘unsicher‘ und ‘unscharf‘ vgl. Biewer
1997, S. 24, insbesondere seinen Hinweis auf Kruse, Gebhard, Klawonn.
3
überwiegend mit unscharfen Begriﬀen. Trotzdem haben diese sich nicht nur
im alltäglichen Leben, sondern auch in der Wissenschaft zur Beschreibung
und Analyse von Ausschnitten aus der Erscheinungswelt bewährt. Folgerichtig bemüht man sich in wachsendem Maße auch bei der Erarbeitung und
Anwendung formaler Modelle, die geschilderte Unschärfe nicht durch evtl.
nur scheinbar präzise Angaben zu verdecken, sondern sie adäquat darzustellen und zu verarbeiten, mit dem Ziel, die Realitätsnähe der theoretischen
Überlegungen zu vergrößern.
Der Zusammenhang zwischen Imperfektion, Unsicherheit und Unschärfe wird
durch die folgende Graphik nochmals verdeutlicht:
Imperfektion
Unsicherheit
(stochastisch)
Unschärfe
(nichtstochastisch)
Abb. 1
Wie erwähnt ist die geschilderte Vagheit unserer Sprache nicht die alleinige Ursache für die Imperfektion unserer Informationen und unseres Wissens2 . Zusätzlich liefern Meßinstrumente, statistische Erhebungen, Sinnesorgane o.ä. i.a. Daten, deren Unschärfe aus prinzipiellen oder Kostengründen
bis auf triviale Ausnahmen nicht zum Verschwinden gebracht werden kann.
Hochkomplexe, vor allem nichtlineare, Zusammenhänge können wir nur in
vereinfachter Form verarbeiten. Auch kann das interessierende Objekt - etwa
ein Tintenklecks auf Löschpapier - selbst unscharf sein. Man gliedert deshalb
den Begriﬀ der Unschärfe, wie in Abbildung 2 gezeigt, noch weiter auf:
Unschärfe
linguistische informationale
Unschärfe
oder lexikalische
Unschärfe
Abb. 2
2
Im folgenden wird zwischen Information und Wissen als gespeicherter Information
nicht streng unterschieden.
4
Schließlich sind in der Praxis Unsicherheit und Unschärfe oft gleichzeitig zu
beobachten.3
Zur formalen Darstellung von Unschärfe wurde zu Beginn der sechziger Jahre
in den USA von Lotﬁ A. Zadeh das Konzept der fuzzy4 sets - unscharfe Mengen, Fuzzy-Mengen - entwickelt und 1965 publiziert (Zadeh 1965). Es stieß,
ebenso wie das logische Pendant, die Fuzzy-Logik - fuzzy logic -, nur auf geringe Resonanz, teilweise sogar auf entschiedene Ablehnung. Erst nachdem
Zadehs Ansatz 1974 in Europa bei der Prozeßregelung eines Kraftwerkes (vgl.
v.Altrock 1995, S. 7) eine praktische Verwendung gefunden und sich bewährt
hatte, bahnte sich eine Änderung an. Vor allem in Japan schnellte die Zahl
der technischen Anwendungen und auch der theoretischen Arbeiten in die
Höhe. ’Heute ist die Behandlung des Fuzzy-Themas in der Forschung und in
der industriellen Anwendung ein Muß’ stellt H.-H. Bothe kurz und bündig
fest (Bothe 1995, S. VIII).
Wie bei einem relativ jungen Gebiet - hier der Fuzzy-Theorie - nicht anders zu erwarten, ist die Terminologie noch sehr uneinheitlich. Es soll nur
erwähnt werden, daß man statt von Imperfektion oft auch von Unschärfe
spricht und dann Unsicherheit als stochastische Unschärfe von linguistischer
und informationaler Unschärfe, beides auch als Vagheit bezeichnet, abgrenzt.
In den folgenden Abschnitten werden zunächst als Sonderfälle der allgemeinen Fuzzy-Mengen die Fuzzy-Zahlen und Fuzzy-Intervalle behandelt und das
wichtige Erweiterungsprinzip von Zadeh erläutert. Nachdem dann mit diesem Hilfsmittel die skalare Multiplikation und die Addition eingeführt wurden, werden an Hand eines immer wieder fortgeführten Grundbeispiels die
drei klassischen statistischen Entscheidungsverfahren - (Parameter)punktschätzung, (nichtrandomisierter) Alternativtest, (Konﬁdenz)bereichsschätzung
- rekapituliert und die Auswirkung nichtstochastischer Imperfektion der Zufallsstichprobe dargestellt. Die allgemeine Struktur der hier gewählten Verknüpfung von stochastischer und nichtstochastischer Imperfektion wird in
einem weiteren Abschnitt vorgestellt. Schließlich werden hier nicht näher behandelte Gebiete der Fuzzy-Theorie kurz gestreift. Im Anhang werden einige
formale Hilfsmittel bereitgestellt.
3
Auch wurde der Begriﬀ des Wahrscheinlichkeitsmaßes zum Begriﬀ des Fuzzy-Maßes
verallgemeinert, der es ermöglicht, daß in der Unschärfetheorie auch Unsicherheitsaspekte
eingebracht werden können. Dieser Ansatz wird hier nicht weiter verfolgt.
4
Nach Webster’s New Encyclopedic Dictionary zurückgehend auf niederdeutsch ’fussig’
für locker, schwammig.
5
2
Fuzzy-Mengen reeller Zahlen
Zunächst soll der allgemeine Begriff der Fuzzy-Menge am Sonderfall unscharfer Zahlenmengen erläutert werden: Es sei R die Menge der reellen Zahlen.
Oft verwendete klassische Teilmengen sind die Intervalle, z.B. ist
A := [2, 6] = {x ∈ R | 2 ≤ x ≤ 6}
das (abgeschlossene) Intervall aller reellen Zahlen x, die mindestens 2 und
höchstens 6 sind. Man kann eine derartige Teilmenge der Menge der reellen
Zahlen auf der Zahlengeraden etwa in der folgenden Art veranschaulichen:
A
[
-1
0
]
1
✲
x
5
Abb. 3
Eine für die anschließenden Überlegungen nützliche Darstellung von Teilmengen A der reellen Zahlen R benutzt die sog. Indikatorfunktion von A,
eine Abbildung µA von R in die Menge {0, 1}, die jedem x ∈ R, das auch zu
A gehört, den Wert 1 zuordnet und sonst konstant 0 ist:
2.1
Def inition:
Es sei A eine Teilmenge von R. Man bezeichnet die Abbildung µA : R →
{0, 1} mit
1 : x∈A
µA (x) =
0 : x ∈ A
als Indikatorfunktion oder charakteristische Funktion von A bzgl. R.
Für A = [2, 6] gilt
µA (x) =
1 : 2≤x≤6
0 : x < 2 oder 6 < x.
Der Graph dieser Funktion ist in der folgenden Abbildung dargestellt:
6
µ (x)
1
✻A
0
✉
✉
❡
❡
1
✲
x
5
Abb.4
Für jedes x ∈ R ist abzulesen, ob es zu A gehört oder nicht, d.h. die Indikatorfunktion beschreibt die Menge in eineindeutiger Weise.
Man kann diese Funktion auch verwenden, um jede Teilmenge A der Menge
R der reellen Zahlen in einer für die klassische Mengelehre ungewöhnlichen,
aber für die Fuzzy-Mengenlehre nützlichen Form darzustellen:
Jedes x ∈ R wird mit dem zugehörigen Funktionswert µA (x) ∈ {0, 1} zu
einem geordneten Paar (x, µA (x)) zusammengefaßt, aus diesen Paaren wird
eine neue (klassische) Menge
2.2
{(x, µA (x)) | x ∈ R}
gebildet. Diese Menge charakterisiert ebenfalls in eineindeutiger Weise die
Ausgangsmenge A ⊆ R.
Die Indikatorfunktion läßt für jedes x ∈ R nur jeweils eine der beiden folgenden Möglichkeiten zu: Entweder gilt µA (x) = 1, d.h. x ∈ A, oder man
hat µA (x) = 0 und folglich x ∈ A. Genau an diesem Punkt setzen die Überlegungen Zadehs an. In vielen Situationen empfindet man die Abgrenzung
von Teilmengen, wie sie in der klassischen Mengenlehre praktiziert wird, als
übertrieben scharf und für die Anwendungen unzweckmäßig. Ein ﬂießender
Übergang von einer Menge A zu ihrem Komplement kann praktikabler sein.
Beispielsweise könnte ein Anlageberater in o.g. Beispiel Umsatzrenditen zwischen 2 % und 2,5 % ohne Einschränkung als durchschnittlich bezeichnen,
seine Vorstellung von durchschnittlichen Renditen würde aber vermutlich
durch die folgende Graphik nicht zufriedenstellend wiedergegeben:
7
µ(x)
1
✻
0
1
✉
✉
❡
❡
2
✲
x
3
Umsatzrendite in %
Abb.5
Er wäre möglicherweise damit einverstanden, Renditen x ≤ 1% als mit Sicherheit zu niedrig und x ≥ 3% als mit Sicherheit zu hoch für durchschnittliche Werte zu bezeichnen, aber Probleme bereiten die Zwischenwerte. Wenn
2 % noch als durchschnittlicher Wert angesehen werden kann, ist dann 1,9 %
ganz dezidiert genauso als nichtdurchschnittlich zu bewerten wie beispielsweise 0,5 %, oder sollte man nicht besser in der formalen Darstellung andeuten,
daß 1,9 % noch als ziemlich durchschnittlich anzusehen sei, aber zum Beispiel
1,5 % doch schon deutlich weniger?
Zadeh löste dieses Problem, indem er zur Beschreibung der Zugehörigkeit
eines Objektes x zu einer Menge A nicht nur den Wert 1 (und 0 bei Nichtzugehörigkeit) zuließ, sondern Werte zwischen 0 und 1 zur Beschreibung einer
abgeschwächten Zugehörigkeit einführte. Der im Beispiel erwähnte Anlageberater könnte die Gesamtheit der durchschnittlichen Renditen beispielsweise
durch folgende Funktion
µ : R → [0, 1]
charakterisieren:
µ(x)
✻
✉
1
✉
0
✉
✉
1
2
Abb.6
8
3
✲
x
Man bezeichnet µ als Zugehörigkeitsfunktion der Fuzzy-Menge der durchschnittlichen Umsatzrenditen und µ(x) als Zugehörigkeitsgrad von x ∈ R zu
dieser Fuzzy-Menge. Man sieht an der Abbildung, daß für den Anlageberater
z.B. 1,9 % mit wesentlich größerem Zugehörigkeitsgrad zur Fuzzy-Menge der
durchschnittlichen Werte gehört als z.B. 1,5 %, aber daß er 1,9 % gleichzeitig
nicht so dezidiert als durchschnittlich bezeichnet wie z.B. 2 %.
Oﬀensichtlich kann man die Indikatorfunktion der klassischen Mengenlehre
als Sonderfall derartiger Zugehörigkeitsfunktionen auﬀassen, bei ihr kommen
eben als Funktionswerte nicht alle Elemente des Einheitsintervalls [0,1] in
Frage, sondern nur dessen Endpunkte 0 und 1.
In mehr mathematisch orientierten Abhandlungen ist es üblich, die FuzzyMengen direkt mit ihren Zugehörigkeitsfunktionen zu identifizieren. Die stärker
auf den Einsteiger und mathematisch weniger trainierten Anwender ausgerichtete Literatur bevorzugt vielfach eine an 2.2 angelehnte Definition:
2.3
Def inition:
Es sei
µ : R → [0, 1]
eine Abbildung. Man bezeichnet
A := {(x, µ(x)) | x ∈ R}
als unscharfe Menge, Fuzzy-Menge (F-Menge)5 in R mit der Zugehörigkeitsfunktion
µA := µ.
Für jedes x ∈ R heißt µA (x) der Zugehörigkeitsgrad von x zur F-Menge A.6
Die Menge aller F-Mengen in R heißt die Fuzzy-Potenzmenge von R und
wird mit FP(R) bezeichnet.
In den folgenden Abbildungen sind die Zugehörigkeitsfunktionen einiger FMengen in R jeweils mit in einem bestimmten Kontext denkbaren verbalen
Interpretationen angegeben.
5
Statt von einer F-Menge in R spricht man auch von einer F-Teilmenge von R.
Natürlich kann man ganz analog auch F-Mengen in beliebigen Mengen Ω = ∅
(Grundmengen, Universalmengen) definieren. Im Unterschied zu den F-Mengen werden
in dieser Arbeit die klassischen Mengen als C-Mengen (Englisch crisp=scharf) bezeichnet.
Sie sind ein Sonderfall der F-Mengen.
6
9
µ (x)
✻ A1
1
✲
x
0
1
2
Abb.7
A1 könnte man als F-Menge aller reellen Zahlen interpretieren, die erheblich
größer als 1 sind.
µ (x)
µ (x)
✻ A2
✻ A3
1
1
✲
-1
0
1
✲
x
-1
0
Abb. 8
1
Abb. 9
A2 und A3 könnten F-Mengen sein, welche durch die definierende unscharfe
Eigenschaft ungefähr 0 sein “ gegeben sind.
”
µ (x)
✻ A4
1
✲
x
0
1
2
3
Abb.10
10
4
x
A4 ist eine mögliche F-Menge zur Darstellung der Zahlen, die in der Nähe
von 2 oder 4 liegen.
Die Beispiele verdeutlichen, daß der Übersetzung unscharfer, verbaler Zahlenangaben in F-Mengen eine gewisse Willkür anhaftet. In der Technik haben
sich einfache, aus Geradenstücken zusammengesetzte Kurven wie in Abb. 8
und Abb. 10 bewährt (vgl. v. Altrock 1995, S. 154). Bei technischen Anwendungen handelt es sich oft um mit Fuzzy-Methoden arbeitende Regelkreise,
die in schneller Folge immer wieder durchlaufen werden. Unterschiedliche Zugehörigkeitsfunktionen führen zwar möglicherweise bei dem einzelnen Regelvorgang zu unterschiedlichen Abweichungen des Ist-Wertes vom Soll-Wert,
aber da es in der Logik des Regelkreises liegt, durch aufeinander folgende
Regelvorgänge Abweichungen zwischen Ist- und Soll-Werten verschwinden
zu lassen, werden auch die Einﬂüsse unterschiedlicher Zugehörigkeitsfunktionen im Zeitablauf kompensiert. In anderen Situationen verwendet man
auch kompliziertere Kurven, etwa wie in Abb. 7 und Abb. 9 dargestellt. Dort
werden waagerechte Kurventeile nicht abrupt in einem Knick verlassen, sondern in diﬀerenzierbarer Form. Auf jeden Fall sollte man einen Modellansatz
überdenken, wenn das Ergebnis von Proberechnungen sehr sensitiv auf kleine Variationen der Zugehörigkeitsfunktionen reagiert; letzteres würde einem
Grundanliegen der Fuzzy-Theorie, ohne vorgetäuschte Präzision zu arbeiten,
diametral widersprechen. Um die Unbestimmtheit bei der Festlegung von
Zugehörigkeitsfunktionen in die Überlegungen explizit mit aufzunehmen hat
man versucht, die Zugehörigkeitsfunktionen selbst wieder unscharf darzustellen, also zu F-Mengen 2. Stufe überzugehen. Da die Handhabung derartiger
Gebilde mühselig wird, hat man bisher auf die Anwendung dieses Ansatzes
weitgehend verzichtet.
Ein Sonderfall der F-Mengen in R sind die Fuzzy-Zahlen und Fuzzy-Intervalle.
Hier sollen die besonders einfach zu handhabenden und für den Anwender
wichtigen F-Zahlen mit Dreiecksgestalt und F-Intervalle mit Trapezgestalt
vorgestellt werden, Beispiele ihrer Zugehörigkeitsfunktionen sind in den folgenden beiden Abbildungen gegeben:
11
µ (x)
1
✻A
✲
x
0
1
2
3
F1
M
4
F2
Abb.11
Die F-Menge A könnte man als F-Zahl mit Dreiecksgestalt ungefähr 3“interpretieren.
”
Oﬀensichtlich ist die F-Zahl A durch Angabe der beiden Dreiecksfußpunkte
F1 und F2 sowie des sog. Gipfelpunktes M vollständig festgelegt. Statt F1 , F2
und M anzugeben, genügen auch die drei Werte
M, l := M − F1 , r := F2 − M.
µ (x)
1
✻A
✲
x
0
1
2
F1
M1
3
4
M2
5
6
F2
Abb.12
In diesem Fall könnte man die F-Menge A als F-Intervall mit Trapezgestalt
bezeichnen und beispielsweise deuten als ungefähr zwischen 2 und 3,5 “.
”
Hier genügen zur Festlegung der Zugehörigkeitsfunktion die Werte F1 , F2
und M1 , M2 bzw.
M1 , M2 , l := M1 − F1 , r := F2 − M2 .
In der folgenden Definition werden diese Überlegungen in allgemeiner Form
festgehalten.
12
2.4
Def inition:
Gegeben seien M1 , M2 , l, r, ∈ R mit M1 ≤ M2 , l > 0 und r > 0. Man bezeichnet die F-Menge A in R als Fuzzy- Intervall mit Trapezgestalt, wenn für ihre
Zugehörigkeitsfunktion µA gilt
2.4.1
µA (x) =




x−M1
l



M2 −x
r
+1
1
+1
0
:
:
:
:
M1 − l ≤ x ≤ M1
M1 ≤ x ≤ M2
M2 ≤ x ≤ M2 + r
sonst
gilt M1 = M2 =: M , so bezeichnet man A als Fuzzy-Zahl mit Dreiecksgestalt
oder kurz F-Dreieckszahl mit dem Gipfelpunkt M , der linken Dehnung (Spreizung) l und der rechten Dehnung (Spreizung) r. Im folgenden werden auch
die Kurzschreibweisen A = (M1 , M2 , l, r) bzw. A = (M, l, r) verwendet. Man sieht sofort, daß man für die formale Darstellung die Zugehörigkeitsfunktion einer F-Zahl mit Dreiecksgestalt in 2.4.1 die zweite Zeile hinter der
Klammer streichen kann.
In der Praxis ist man daran interessiert, neben F-Mengen reeller Zahlen
auch präzise Werte wie bisher verwenden zu können. Die folgende Definition
schaﬀt die Möglichkeit, das Rechnen mit (scharfen) reellen Zahlen in die
Fuzzy-Welt (F-Welt)7 mit einzubeziehen:
2.5
Def inition:
Es sei a ∈ R eine reelle Zahl. Die F-Menge A in R mit der Zugehörigkeitsfunktion µA , für die gilt
µA (x) =
1 : x=a
0 : x = a
für alle x ∈ R,
bezeichnet man als Singleton mit dem Trägerpunkt a und schreibt
µA =: µa .
7
Die Welt der scharfen (crisp) Mengen, Zahlen etc. werde als C-Welt bezeichnet.
13
2.6
Vereinbarung:
Da in dieser Arbeit nur F-Intervalle mit Trapezgestalt und F-Zahlen mit
Dreiecksgestalt vorkommen, soll im folgenden kurz von F-Intervallen und FZahlen gesprochen werden. Die vorangehende Definition legt es nahe, auch
die Singletons als Spezialfall unter dem Begriﬀ F-Zahlen zu subsumieren
und sie als Grenzfall der F-Dreieckszahlen mit gegen 0 gehender linker und
rechter Spreizung sogar zur Menge der F-Dreieckszahlen hinzuzunehmen. Für
das Singleton mit dem Trägerpunkt a ∈ R soll konsequenterweise auch die
Darstellung
(a, 0, 0)
eingeführt werden.
Ganz entsprechend wird man auch die klassichen Intervalle als Spezialfall
unter den Begriﬀ der F-Intervalle subsumieren. Abgeschlossene Intervalle
[M1 , M2 ] sollen hier durch
(M1 , M2 , 0, 0)
dargestellt werden.
Ehe im nächsten Abschnitt die Anwendung klassischer statistischer Verfahren auf unscharfe Stichprobenergebnisse untersucht werden kann, muß noch
ein wichtiges mathematisches Hilfsmittel bereitgestellt werden: Man benötigt
ein Verfahren, mit dem Funktionen aus der C-Welt in die F-Welt fortgesetzt
werden können. Dadurch wird es insbesondere möglich, die gängigen Rechenoperationen wie Addition, Multiplikation usw. von den reellen Zahlen auf
Fuzzy-Zahlen zu übertragen. Ein solches Verfahren ist in dem Zadehschen
Erweiterungsprinzip gegeben, das anschließend zunächst motiviert und dann
präzise definiert werden soll.
Der Graph einer Funktion
f :R→R
sei durch die folgende Abbildung gegeben:
14
y ✻
f (x)
✲
x
x
Abb.13
Jedem (scharfen) Urbildpunkt x ∈ R wird durch f genau ein (scharfer) Bildpunkt y := f (x) ∈ R zugeordnet.
Liegt nun nur ein unscharfer Urbildpunkt ungefähr x “vor, so ist zu erwar”
ten, daß auch der zugehörige Funktionswert nur unscharf angegeben werden
kann, etwa ungefähr f (x) “. Genauer geht es darum, aus der Zugehörig”
keitsfunktion einer unscharfen Teilmenge des Definitionsbereichs mit Hilfe
der Zuordnungsvorschrift f die Zugehörigkeitsfunktion einer passenden unscharfen Teilmenge des Wertevorrates zu ermitteln. Zunächst soll mit Hilfe
der folgenden Abbildung an ein bekanntes Vorgehen aus der klassischen Mengenlehre erinnert werden:
y ✻
fˆ(A)
✉
✉
✉
A
Abb. 14
15
✲
x
Gegeben sei die auf der Abszisse eingezeichnete Teilmenge A des Definitionsbereichs
R. Gesucht ist diejenige Teilmenge des Wertevorrates R, deren Elemente
(mindestens) einen Urbildpunkt in A haben. Als Lösung erhält man die auf
der Ordinale eingezeichnete Menge fˆ(A), formal wird definiert
2.7
fˆ(A) := {y ∈ R | (∃x ∈ A)(y = f (x))}.8
Es sei P(R) := {A | A ⊆ R} die Menge aller Teilmengen von R, die Potenzmenge von R. Da man die obige Konstruktion für alle A ⊆ R durchführen
kann, ist durch 2.7 eine Abbildung
fˆ : P(R) → P(R)
definiert worden, die sog. durch f induzierte Abbildung fˆ.
Gesucht ist eine Möglichkeit, dieses Konstruktionsverfahren aus der C-Welt
in die F-Welt zu verallgemeinern. Da F-Mengen durch ihre Zugehörigkeitsfunktion festgelegt werden, bietet es sich an, zunächst die C-Mengen A und
fˆ(A) durch ihre Indikatorfunktionen µA : R → {0, 1} und µfˆ(A) : R → {0, 1}
darzustellen, das in 2.7 angegebene Konstruktionsverfahren auf die Verwendung dieser Funktionen umzuschreiben und dann für den Übergang in die
F-Welt in dem erhaltenen Rezept die Indikatorfunktionen durch die allgemeineren Zugehörigkeitsfunktionen zu ersetzen. Zunächst werde die Abb. 14
um die entsprechenden Indikatorfunktionen ergänzt:
8
∃ ist das Kürzel für es gibt (mindestens) ein “.
”
16
y
y
✻
✉
y3
❡
✻
fˆ(A)
y1
✉
❡
y2
µfˆ(A) (y)
✛
x11
1
A
x12 x13
x14
✲
x
µA (x)
1
✻
0
x21
✉
✉
❡
❡
x22
✲
x
Abb.15
Zu y1 gehören die Urbildpunkte x11 , x12 , x13 und x14 . Davon liegen x12 und
x13 in A, so daß y1 nach Konstruktion (2.7) zu fˆ(A) gehört. Es gilt
1 = µfˆ(A) (y1 ) =
=
sup{µA (x11 ), µA (x12 ), µA (x13 ), µA (x14 )}
sup µA (x)
x∈R
f (x)=y1
Der Punkt y2 hat die Urbildpunkte x21 und x22 . Beide gehören nicht zu
A, deshalb gilt y2 ∈ fˆ(A). Es folgt
0 = µfˆ(A) (y2 ) =
=
sup{µA (x21 ), µA (x22 )}
sup µA (x)
x∈R
f (x)=y2
17
Schließlich hat y3 überhaupt keinen Urbildpunkt und gehört deshalb nach
2.7 auch nicht zu fˆ(A). Da die Indikatorfunktionen durch 0 nach unten beschränkt sind, vereinbart man
2.8
sup µA (x) := 0
x∈∅
und erhält somit in Übereinstimmung mit den vorangehenden Fällen
0 = µfˆ(A) (y3 ) = sup µA (x)
x∈R
f (x)=y3
Man kann beweisen, daß generell für jedes A ⊆ R gilt
µfˆ(A) (y) = sup µA (x) für alle y ∈ R
x∈R
f (x)=y
und überträgt nun dieses Rezept in die F-Welt, indem man von den Indikatorfunktionen scharfer Mengen in R zu den Zugehörigkeitsfunktionen von
F-Mengen in R übergeht:
2.9
Satz und Def inition:
Es sei
f :R→R
eine Abbildung. Dann ist zu jeder F-Menge A ∈ F P(R) mit der Zugehörigkeitsfunktion
µA : R → [0, 1]
durch die Festsetzung
2.9.1
µfˆ(A) (y) :=
=
sup µA (x)
für alle y ∈ R
x∈R
f (x)=y
sup
x∈f −1 ({y})
µA (x) 9
die Zugehörigkeitsfunktion einer F-Menge fˆ(A) ∈ F P(R) und somit eine
Abbildung
9
Man definiert in der klassischen Mengenlehre für beliebiges B ⊆ R
f −1 (B) := {x ∈ R | f (x) ∈ B}, hat also f −1 ({y}) = {x ∈ R | f (x) = y}.
18
fˆ : F P(R) → F P(R)
gegeben. Man sagt, die Abbildung f sei nach dem Erweiterungsprinzip von Zadeh
zur Abbildung fˆ erweitert worden. 10
2.10
Beispiel:
Gegeben seien die Funktion f : R → R mit
f (x) = (x − 3)2 für alle x ∈ R
und die F-Menge A ∈ F P(R) mit

0, 2 : x = 2



0, 8 : x = 4
yA (x) =
0, 6 : x = 5



0 : sonst.
Es sei fˆ : F P(R) → F P(R) die nach dem Erweiterungsprinzip von Zadeh
aus f hervorgegangene Abbildung. Für das Bild fˆ(A) erhält man nach 2.9.1
µfˆ(A) (1) =
sup µA (x)
x∈R
1=(x−3)2
= sup{µA (2), µA (4)}
= sup{0, 2; 0, 8}
= 0, 8
µfˆ(A) (4) =
sup µA (x)
x∈R
4=(x−3)2
=
=
=
µfˆ(A) (y) =
sup{µA (1), µA (5)}
sup{0; 0, 6}
0, 6
0 für alle y ∈ {1, 4}.
Die Graphen der Funktion f und der Zugehörigkeitsfunktionen µA und µfˆ(A)
sind in der folgenden Abbildung dargestellt:
10
Diese Überlegungen lassen sich ohne Probleme auf den allgemeineren Fall übertragen,
daß man von Abbildungen f : Ω → Γ mit beliebigen Mengen Ω = ∅ und Γ = ∅ ausgeht.
19
y
y
✻
✻
10
✉
µfˆ(A) (y)
✉
✛
1
❡
❡1
5
1
✲
0
0
x
1
5
µ (x)
1
✻A
✉
✉
✉
❡
0
1
❡
3
❡
5
Abb.16
In der schließenden Statistik arbeitet man i.a. nicht mit Stichproben vom
Umfang n = 1, sondern zieht umfangreicheres Datenmaterial heran. Dementsprechend sind die Stichprobenrealisationen vielfach nicht Elemente x ∈ R,
sondern (x1 , . . . , xn ) ∈ Rn := R × · · · × R mit n > 1. Folglich reicht
beim Übergang von der C-Welt in die F-Welt das Erweiterungsprinzip in
der zuvor erarbeiteten Form, als Abbildungen f : R → R zu Abbildungen fˆ : F P(R) − F P(R) erweitert werden, nicht aus. Es liegt nahe, jetzt
von Abbildungen f : Rn → R auszugehen. Der Übergang zu Abbildungen
fˆ : F P(Rn ) − F P(R) ist durch direkte Übertragung der Formel 2.9.1 unproblematisch, wie auch in Fußnote 10 angedeutet wurde. Dieses Vorgehen paßt
aber nicht zu den im folgenden zu behandelnden Anwendungen der klassischen statistischen Entscheidungsverfahren auf Stichprobenrealisationen, die
aus unscharfen Einzelbeobachtungen zusammengesetzt sind:
20
✲
x
Die Elemente der Menge F P(Rn ) sind unscharfe Teilungen des Rn , unscharfe Stichprobenrealisationen sind aber i.a. aus unscharfen Einzelergebnissen
A1 ∈ F P(R), . . . , An ∈ F P(R) zusammengesetzte n-Tupel, das heißt man
hat unscharfe Stichprobenrealisationen der Form
(A1 , . . . , An ) ∈ F P(R) × · · · × F P(R) = [F P(R)]n
vorliegen. Wegen
F P(R) × · · · × F P(R) = F P(R)n für n > 1
ist das ‘Rezept‘ 2.9.1 nicht direkt übertragbar. Die Motivation einer geeigneten Modifikation von 2.9.1 ist ohne Schwierigkeit möglich und sollte z.B. in
einer einschlägigen Vorlesung auch nicht fehlen; da sie aber für die hier verfolgten Ziele zu aufwendig ist, soll gleich Zadehs Ergebnis angegeben werden:
2.11
Satz und Def inition:
Es seien
f : Rn → R
eine Abbildung und n ∈ N. Dann ist zu jedem n-Tupel
(A1 , . . . , An ) ∈ F P(R) × · · · × F P(R) = [F P(R)]n
durch die Festsetzung
µfˆ(A1 , . . . , An )(y) :=
sup
(x1 ,... ,xn )∈Rn
f (x1 ,... ,xn )=y
min{µA1 (x1 ), . . . , µAn (xn )}
die Zugehörigkeitsfunktion einer F-Menge
fˆ : (A1 , ..., An ) ∈ F P(R)
gegeben. Man sagt, f sei nach dem Erweiterungsprinzip von Zadeh zur Abbildung
fˆ : [F P(R)]n → F P(R)
erweitert worden.11
Man sieht sofort, daß man für n = 1 wieder die Formeln aus 2.9 erhält,
11
Diese Überlegungen lassen sich ohne Probleme auf den allgemeineren Fall übertragen,
daß man von Abbildungen f : Ω1 × · · · × Ωn → Γ mit beliebigen Mengen Ωi = ∅(i =
1, ..., n) und Γ = ∅ ausgeht.
21
so daß man in 2.9 und 2.11 ohne weitere Unterscheidung von dem Erweiterungsprinzip von Zadeh sprechen kann.
Mit Hilfe des Erweiterungsprinzips lassen sich insbesondere die Rechenoperationen der klassischen Mathematik in die F-Welt übertragen. Erweitert man
z.B. die Abbildung
f :R×R→R
mit
z := f (x, y) := x + y
für alle (x, y) ∈ R × R
zu der entsprechenden Abbildung
fˆ : F P(R) × F P(R) → F P(R),
so kann man für zwei F-Zahlen A, B ∈ F P(R) ihre Summe
A ❢B := fˆ(A, B)
einführen. Die Erweiterung einer Abbildung
ga : R → R a ∈ R fest
mit
y := ga (x) = ax für alle x ∈ R
zu der entsprechenden Abbildung
ĝa : F P(R) → F P(R)
führt zu der skalaren Multiplikation einer F-Zahl A ∈ F P(R) mit einer reellen
Zahl a ∈ R durch die Definition
p A := ĝ (A).
a ❢
a
Entsprechend überträgt man auch andere Rechenoperationen. Die Anwendung des Erweiterungsprinzips kann im konkreten Fall sehr mühselig sein.
Ein sehr einfaches Ergebnis für F-Dreieckszahlen ist ohne Beweis 12 im folgenden Satz angegeben:
12
Einen Beweis findet man z.B. bei Rommelfanger 1994, S. 41.
22
2.12
Satz:
Es seien A1 = (M1 , l1 , r1 ) und A2 = (M2 , l2 , r2 ) F-Dreieckszahlen aus F P(R)
und a ∈ R eine reelle Zahl. Durch Anwendung des Erweiterungsprinzips
erhält man als Summe A1 ❢A2 die F-Dreieckszahl
2.12.1
A1 ❢A2 := (M1 + M2 , l1 + l2 , r1 + r2 ),
p A die F-Dreieckszahl
und als skalares Produkt a ❢
1
2.12.2
a p❢A1 :=
(aM1 , al1 , ar1 ) : a ≥ 0
(aM1 , −ar1 , −al1 ) : a ≤ 0.
In Vereinbarung 2.6 werden die reellen Zahlen als Spezialfälle unter den Begriﬀ der F-Dreickszahlen subsumiert. Man prüft leicht nach, daß 2.12.1 und
2.12.2 im Fall reeller Zahlen zu den in der klassischen Mathematik gewohnten
Ergebnissen führt. Multiplikation und Division von F-Dreieckszahlen werden
hier nicht behandelt, da sie in den folgenden Abschnitten nicht benötigt werden.
Die Operationen aus Satz 2.12 werden in dem folgenden Beispiel angewendet:
2.13
Beispiel:
Gegeben seien die F-Dreieckszahlen
A1 = (1, 2, 4),
A2 = (6, 4, 3)
und die reellen Zahlen a = 2, b = −2.
Dann gilt
A1 ❢A2 = (7, 6, 7)
p A = (2, 4, 8)
a ❢
1
p A = (−2, 8, 4)
b ❢
1
23
✻
µ(x)
1
A2
A1 ❢A2
A1
✲
-10
x
0
-5
5
10
15
✻
µ(x)
p A
−2 ❢
1
p A
2 ❢
1
1
✲
-10
-5
x
0
5
10
15
Abb.17
In der Zeichnung werden die waagerechten Teile der Funktionsgraphen, die
mit der Abszisse zusammenfallen, fortgelassen, um die Übersichtlichkeit zu
verbessern. Es ist deutlich zu sehen, wie sich die Unschärfe bei der Addition unscharfer Zahlen und bei der skalaren Multiplikation mit Werten, die
betragsmäßig größer als 1 sind, vergrößert.
24
3
Schätzen und Testen mit unscharfen Stichproben
In diesem Abschnitt werden die drei grundlegenden Entscheidungsverfahren
der Statistik - Parameterpunktschätzungen, (nichtrandomisierte) Alternativtests, (Konfidenz)bereichsschätzungen - jeweils an einem einfachen Beispiel
rekapituliert und die Konsequenzen unscharfer Stichprobenrealisationen demonstriert:
Von einer Zufallsvariablen Y, die einen interessierenden Umweltausschnitt
beschreibt, werde vorausgesetzt, daß sie einer Normalverteilung mit bekannter Varianz Var Y = σ02 aber unbekanntem Erwartungswert EY = µ genügt,
also N (µ, σ02 )-verteilt ist. Weiterhin sei X = (X1 , ..., Xn ) eine einfache Stichprobe vom Umfang n ∈ N zu Y , d.h. die Xi sollen identisch wie Y verteilt
sein und stochastisch unabhängig ( Stichprobe mit Zurücklegen “).
”
In der klassischen Statistik geht man davon aus, daß die Realisierungen xi
der Stichprobenvariablen Xi präzise beobachtet werden können. Diese Voraussetzung soll im folgenden in der Weise abgeschwächt werden, daß man
statt der reellen Zahlen xi nur Fuzzy-Zahlen Bi (i = 1, ..., n) wahrnimmt. Mit
Hilfe des Zadehschen Erweiterungsprinzips werden anschließend die aus den
unscharfen Daten resultierenden unschafen Ergebnisse der statistischen Entscheidungsfunktionen ermittelt. 13
In den folgenden drei Abschnitten werde von folgender Situation ausgegangen: Gegeben seien die o.g. Voraussetzungen mit σ02 = 4 und n = 5, weiterhin
werde zunächst als Beobachtungsergebnis protokolliert
x = (x1 , ..., x5 ) = (6, 1, 5, 7, 2),
eine Überprüfung des Beobachtungsvorgangs gebe dann jedoch Anlaß zu der
Vermutung, daß die Beobachtungsergebnisse etwas nach unten verzerrt seien, aber auch eine geringe Überschätzung nicht ganz ausgeschlossen werden
könne: Die näheren Umstände sollen eine Darstellung der einzelnen Ergebnisse als F-Dreieckszahlen mit einer linken Spreizung l = 3 und einer rechten
Spreizung r = 1 als angemessen erscheinen lassen:
B = (B1 , ..., B5 ) mit Bi = (xi , 3, 1) für i = 1, ..., 5.
13
vgl. dazu Viertl 1992, S. 124 f. und 1996, S. 101 f., Frühwirth-Schnatter 1992.
25
µ (u)
✻ Bi
B2
1
B5
B3
B1
B4
✲
-1
0
1
5
Abb.18
3.1
14
Parameterpunktschätzungen
Unter den getroﬀenen klassischen Annahmen ist der Stichprobenmittelwert
1
Xi =: X
δ(X) :=
n i=1
n
eine sehr gute Punktschätzfunktion für das unbekannte µ, eine Stichprobenrealisation x = (x1 , ..., xn ) liefert den Schätzwert
1
δ(x) =
xi =: x,
n i=1
n
und man erhält folglich mit den beispielhaft angenommenen Zahlenwerten
1
(6 + 1 + 5 + 7 + 2)
5
= 4, 2 = x.
δ(x1 , ..., x5 ) =
Dabei ist zu beachten: Auch wenn von scharfen Beobachtungswerten xi ausgegangen wird, kann man nicht schließen, daß δ(x1 , ..., x5 ) = 4, 2 der wahre
Erwartungswert von Y ist; man muß im Gegenteil unter den gegebenen Voraussetzungen davon ausgehen, daß der wahre Wert bei jeder Punktschätzung
mit Wahrscheinlichkeit 1 verfehlt wird. Dies ist eine Konsequenz der speziellen hier gegebenen (stochastischen) Unsicherheit.
14
Da x als übliches Kürzel für die Stichprobenrealisation schon vergeben ist, sei für die
unabhängige Variable hier der Buchstabe u gewählt.
26
10
u
Wird nun zusätzlich die durch die Unschärfe der Beobachtungen gegebene
(nichtstochastische) Unschärfe berücksichtigt, erhält man mit den in Abschnitt 2 hergeleiteten Rechenregeln für F-Dreieckszahlen
1
δ̂(B1 , ..., B5 ) = (B1 ❢· · · ❢B5 ).
5
Die Summe
B1 ❢· · · ❢B5 =: B0 = (MB0 , lB0 , rB0 )
ist wieder eine F-Dreieckszahl, nach 2.12.1 berechnet man
(MB0 , lB0 , rB0 = (M1 + · · · + M5 , l1 + · · · + l5 , r1 + · · · + r5 )
= (21, 15, 5).
Wegen
1
5
> 0 folgt nach 2.12.2 schließlich
1
B0
5
= (4, 2; 3; 1)
=: (MB , lB , rB ).
B := δ̂(B1 , ..., B5 ) =
In der folgenden Abbildung ist das unscharfe Ergebnis der Punktschätzung
dargestellt:
µ (u)
✻B
1
✲
-1
0
1
5
u
Abb.19
Oft stellt die Punktschätzung nur einen Zwischenschritt bei der Lösung eines
umfangreicheren Anwendungsproblems dar, man kann gezwungen sein, die FSchätzung durch einen Zahlenwert zu ersetzen, man spricht von Defuzzifizierung.
Ein zunächst naheliegendes Verfahren ist es, den Gipfelpunkt
1
MB = (M1 + · · · + M5 ) = 4, 2
5
27
des unscharfen Schätzergebnisses als Approximation für das unbekannte µ
zu wählen, also in unserer Beispielsituation die in der Stichprobe gegebene
Unschärfe einfach zu vergessen. Aber gerade hier scheint dieser Weg wenig plausibel: Die Schätzung B hat eine stark asymmetrische Zugehörigkeitsfunktion, die Wahl von MB berücksichtigt nicht die durch lB rB
angedeutete Tendenz, daß die zur (stochastischen) Unsicherheit hinzukommende (nichtstochastische) Unschärfe Werte kleiner als MB eher möglich
erscheinen läßt als größere Werte. Dieser Mangel wird beispielsweise durch
die sog. Schwerpunktmethode vermieden, bei der man den Abszissenwert us
des Schwerpunktes der Fläche zwischen Abszisse und Zugehörigkeitsfunktion
als scharfen Ersatzwert für B nimmt:
µ (u)
✻B
1
✲
-1
0
uS
1
MB
5
u
Abb.20
Zur Schreibvereinfachung sei
µ(.) := µB (.)
gesetzt. Man erhält als u-Koordinate des Flächenschwerpunktes
∞
us =
uµ(u)du
−∞
∞
15
µ(u)du
−∞
Die Auswertung (siehe Anhang Satz 6.3) ergibt im vorliegenden Beispiel
us = 4, 2 +
1−3
= 4, 2 − 0, 6 ≈ 3, 53
3
d.h. hier bewirken die Berücksichtigung der nichtstochastischen Unschärfe
und die Defuzzifizierung mit Hilfe der Schwerpunktmethode eine gegenüber
15
Der Nenner des Quotienten sei positiv.
28
der klassischen Schätzung x = 4, 2 deutliche Korrektur.
Dieses einfache Beispiel stützt folgende allgemeine Empfehlung:
a) Man versuche die Zuverlässigkeit der gegebenen Daten zu beurteilen,
b) ggf. beschreibe man die nichtstochastische Unschärfe der Daten durch
geeignete (subjektiv festzulegende) Zugehörigkeitsfunktionen,
c) man berechne die unscharfe Schätzung und defuzzifiziere ggf.,
d) man kontrolliere evtl. die Sensitivität des Ergebnisses gegenüber Variationen der Zugehörigkeitsfunktion.
Zu Beginn dieses Abschnittes wurde der F-Schätzwert B = 15 (B1 ❢· · · ❢B5 )
für µ aus der C-Welt-Schätzung x = 15 (x1 + · · · + x5 ) = δ(x1 , ..., x5 ) hergeleitet, indem einfach in dieser Formel die scharfen Beobachtungswerte xi
durch die F-Beobachtungen Bi (i = 1, ..., 5) ersetzt wurden; die Zugehörigkeitsfunktion µB war wegen der hier verwendeten F-Dreieckszahlen leicht zu
bestimmen. Natürlich kann man die C-Schätzfunktion δ : R5 → R auch mit
Hilfe des Erweiterungsprinzips übertragen, man erhält die F-Schätzfunktion δ̂ : [F P(R)]5 → F P(R), die Stichprobe B = (B1 , ..., B5 ) liefert die FSchätzung δ̂(B) mit
3.1.1
µδ̂(B) (u) =
sup
(x1 ,...,x5 )∈R5
x=u
min{µB1 (u), ..., µB5 (u)} für alle u ∈ R.
Man könnte direkt nachrechnen, daß beide Wege dasselbe Ergebnis haben.
Weiterführender ist aber, sich allgemein klar zu machen, daß die Übereinstimmung auf mehrfacher Anwendung des Satzes 6.1 (und Bemerkung 6.2)
aus dem Anhang beruht.
29
3.2
Alternativtests
Gegeben seien die auf Seite 25 geschilderten Voraussetzungen. Mit einem
Signifikanzniveau α = 0, 05 soll für µ0 = 2 die
Nullhypothese H0 : µ = µ0
gegen die
Gegenhypothese H1 : µ = µ0
getestet werden. Auf der Basis einer einfachen Stichprobe X = (X1 , ..., Xn )
mit der Realisation x = (x1 , ..., xn ) ∈ Rn wird für die Teststatistik
T (X) =
X − µ0 √
n
σ0
ihre Realisation
x − µ0 √
n
σ0
berechnet. Für die N(0,1)-Verteilung (Gaußverteilung) ist das 0,975-Quantil
λ0,975 = 1, 96. Ein gleichmäßig bester unverzerrter Test für die o.g. Hypothesen zum Niveau α ist dann durch die folgende Entscheidungsvorschrift
gegeben:
H0 annehmen, falls − λ0,975 ≤ T (x) ≤ λ0,975 ,
T (x) =
H1 annehmen in den übrigen Fällen.
Mit dem beispielhaft gewählten Stichprobenbefund x = (x1 , ...x5 ) = (6, 1, 5, 7, 2)
folgt
4, 2 − 2
2, 24 = 2, 46 > 1, 96 = λ0,975 ,
T (x) =
2
H0 wird abgelehnt, der wahre Erwartungwert µ ist signifikant von dem hypothetischen Wert µ0 = 2 verschieden. Ehe die Auswertung von zusätzlicher
nichtstochastischer Imperfektion des empirischen Befundes analysiert wird,
soll zunächst die formale Struktur des geschilderten Alternativtests genauer
dargestellt werden:
Durch die Teststatistik ist eine Abbildung
T : Rn → R
des Stichprobenraumes X = Rn in die Menge der reellen Zahlen R gegeben,
in der zwei Mengen
A∗ = [−λ0,975 , λ0,975 ]
und
K ∗ =] − ∞, −λ0,975 [∪]λ0,975 , ∞[
30
ausgezeichnet sind; T (x) ∈ A∗ führt zur Annahme von H0 und T (x) ∈ K ∗
zur Annahme von H1 .
Kürzt man die Entscheidung Annahme von H0 “ mit d0 und Annahme
”
”
von H1 “mit d1 ab, kann man eine weitere Abbildung
δ ∗ : R → D := {d0 , d1 }
definieren mit
∗
δ (t) =
Die Verknüpfung
: t ∈ A∗
: t ∈ K∗
d0
d1
δ := δ ∗ ◦ T
wird als Alternativtest für H0 gegen H1 bezeichnet, D als sein Entscheidungsraum,
A := {(x1 , ..., xn ) ∈ Rn | δ(x1 , ..., xn ) = d0 }
als sein Annahmebereich und
K := {(x1 , ..., xn ) ∈ Rn | δ(x1 , ..., xn ) = d1 }
als sein kritischer Bereich oder Verwerfungsbereich. Es gilt
d0 : x ∈ A
δ(x) =
d1 : x ∈ K
Der Zusammenhang zwischen T, δ ∗ und δ ist in der folgenden Abbildung veranschaulicht.
δ
Rn
T
✇
R
Abb.21
31
✲ {d0 , d1 } = D
✼
Nun werde von der F-Stichprobenrealisation B = (B1 , ..., B5 ) ausgegangen.
Erweitert man die Abbildung
T : R5 → R
mit
x − µ0 √
5 für alle (x1 , ..., x5 ) ∈ R5
σ0
nach dem Erweiterungsprinzip zu der Abbildung
T (x1 , ..., x5 ) =
T̂ : [F P(R)]5 → F P(R),
erhält man für B = (B1 , ..., B5 ) mit Bi = (xi ; 3, 1) und i=1,...,5
B − µ0 √
5
σ0
(4, 2; 3; 1) − (2; 0, 0)
≈
2, 24
2
= (2, 46; 3, 36; 1, 12) ∈ F P(R),
T̂ (B1 , ..., B5 ) =
diese F-Zahl ist mit den Schwellenwerten −λ0,975 und λ0,975 in der folgenden
Graphik dargestellt.
µ
✻ T̂ (B)
(u)
1
0,86
✲
2
-1
0
MT̂ (B)
1 us
−λ0,975
u
5
λ0,975
Abb.22
Defuzzifizierung mit Hilfe des Gipfelpunktes führt wie in der C-Welt zur Ablehnung von H0 wegen MT̂ (B) = 2, 46 > 1, 96 = λ0,975 . Allerdings weist die
stark asymmetrische Zugehörigkeitsfunktion auf erhebliches Gewicht “links
”
von λ0,975 hin, Zweifel an der gewonnenen Entscheidung scheinen nicht unberechtigt. Eine Defuzzifizierung mit Hilfe der Schwerpunktmethode (siehe
Anhang Satz 6.3) liefert
us = 2, 46 +
1, 12 − 3, 36
= 1, 71
3
32
d.h.
−λ0,975 = −1, 96 ≤ us = 1, 71 ≤ 1, 96 = λ0,975 .
Damit wird jetzt die Nullhypothese H0 akzeptiert. Man sieht, daß die Berücksichtigung der nichtstochastischen Imperfektion zumindest Zweifel an der
Stringenz der in der C-Welt getroﬀenen Entscheidung weckt.
Deutlicher wird die Problematik noch, wenn auch die Abbildung
δ ∗ : R → D = {d0 , d1 }
mit Hilfe des Erweiterungsprinzips zu einer Abbildung
δ̂ ∗ : F P(R) → F P(D)
erweitert wird. Für jedes H ∈ F P(R) erhält man als Bild δ̂ ∗ (H) ∈ F P(D)
mit der Zugehörigkeitsfunktion
µδ̂∗ (H) (d0 ) =
(u)
sup µH
u∈R
δ ∗ (u)=d0
(u)
= sup µH
u∈A∗
µδ̂∗ (H) (d1 ) =
(u)
sup µH .
u∈K ∗
Man erhält (vgl. Anhang Beispiel 6.4)
µδ̂∗ (T̂ (B)) (d0 ) = 0, 86
µδ̂∗ (T̂ (B)) (d1 ) = 1.
Hier wird d1 zwar mit dem Akzeptanzgrad 1 bewertet, aber d0 wird der
Akzeptanzgrad 0,86 zugebilligt, man wird in der Praxis die Ablehnung von
H0 nicht mehr als so klar wie durch das Niveau α = 0, 05 suggeriert ansehen,
ggf. weitere Stichproben ziehen und dabei die Unschärfe der Messungen zu
verringern versuchen. Es überlagern sich zwei Fehlermöglichkeiten: Einmal
durch die Stochastik bedingt, dann auch durch die Ungenauigkeit der Daten.
Die Fuzzy- Entscheidung ist gegeben durch die F-Menge
{(d0 ; 0, 86), (d1 ; 1)} ∈ F P(D)
in D = {d0 , d1 }.
33
3.3
Konf idenzbereichsschätzungen
Es werde wieder von den auf Seite 25 gegebenen Voraussetzungen ausgegangen. Der in 3.1 verwendete Schätzer δ(X) = n1 ΣXi = X liefert zwar
bei gegebener Stichprobenrealisation x = (x1 , ..., xn ) einen präzisen Schätzwert x = n1 Σxi für das unbekannte µ und hat unter den getroﬀenen Annahmen auch sehr nützliche statistische Eigenschaften (Erwartungstreue,
Eﬀizienz etc.), triﬀt aber mit Wahrscheinlichkeit 1 daneben “. Man ergänzt
”
Punktschätzungen deshalb durch Schätzverfahren, die mit vorzugebender Sicherheitswahrscheinlichkeit den unbekannten wahren Parameterwert überdecken, muß dafür aber einen Verlust an Präzision in Kauf nehmen; diese
Konfidenzbereichsschätzfunktionen liefern i.a. ein Kontinuum von Parameterwerten als Näherungswerte.
Es sei α ∈]0, 1[ eine kleine Zahl. In unserem Beispiel ist eine Konfidenzbereichsschätzung
für µ ∈ Θ = R durch die Abbildung
δ : Rn → P(Θ)
gegeben mit
3.3.1
σ0
σ0
δ(x1 , ..., xn ) = x − √ λ1− α2 , x + √ λ1− α2 ,
n
n
man bezeichnet diesen Schätzbereich speziell als ein (1−α)- Konfidenzintervall.
Für die Beispielsdaten erhält man mit n = 5, x = (x1 , ..., x5 ) = (6, 1, 5, 7, 2), α =
0, 05 und λ1− α2 = λ0,975 = 1, 96 das Konfidenzintervall
δ(x) = [4, 2 − 1, 75; 4, 2 + 1, 75]
= [2, 45; 5, 95].
Man beachte, daß die gewählte Bereichsschätzfunktion mit 95 % Sicherheitswahrscheinlichkeit ein Konfidenzintervall liefert, das den wahren unbekannten Wert µ überdeckt, aber natürlich für den konkreten Schätzbereich mit
Sicherheit entweder nur µ ∈ δ(x) oder µ ∈
/ δ(R) gilt.
Nun soll zusätzlich die nichtstochastische Imperfektion durch die F-Stichprobenrealisation
B = (B1 , ..., B5 ) mit Bi = (xi , 3, 1) berücksichtigt werden.
Bereichsschätzfunktionen gelten bereits in der C-Welt als die unhandlichsten
der drei klassichen Entscheidungsverfahren, da ihr Entscheidungsraum16 D
16
vgl. S. 38
34
die Potenzmenge einer i.a. selbst schon überabzählbaren Menge ist - in unserem Fall hat man D = P(Θ) mit Θ = R -, während für die zuvor behandelte Punktschätzung D = Θ = R und für den Alternativtest sogar
D = {d0 , d1 } gilt. Vor diesem Hintergrund ist es nicht überraschend, daß bei
Bereichsschätzungen der Übergang in die F-Welt mühselig sein wird.
Durch das Erweiterungsprinzip wird die Konfidenzbereichsschätzung
δ : Rn → P(Θ)
überführt in die Abbildung
δ̂ : [F P(R)]n → F P(P(Θ)),
d.h. einer F-Stichprobe B = (B1 , ..., Bn ) ∈ [F P(R)]n wird eine F-Menge
δ̂(B) ∈ F P(P(Θ)) zugeordnet, deren Zugehörigkeitsfunktion µδ̂(B) für jede
Menge H ∈ P(Θ) einen Zugehörigkeitswert µδ̂(B) (H) festlegt. Dieser Zugehörigkeitswert gibt für jedes H ∈ P(Θ) den Grad an, mit dem es aufgrund
des unscharfen Stichprobenbefundes als (1 − α)-Konfidenzschätzbereich in
Frage kommt. Nach Satz und Definition 2.11 erhält man
3.3.2
µδ̂(B) (H) =
sup
(x1 ,...,xn )∈Rn
δ(x1 ,...,xn )=H
min{µB1 (x1 ), ..., µBn (xn )} für alle H ∈ P(Θ).
Diese Zugehörigkeitsfunktion soll nun für die Beispielsdaten mit n = 5 und
σ0
√
λ α = 1, 75 numerisch bestimmt werden. Für alle (x1 , ..., x5 ) ∈ R5 gilt
n 1− 2
δ(x1 , ..., x5 ) = [x − 1, 75; x + 1, 75],
die Menge aller derartigen Konfidenzintervalle ist gegeben durch
J := {[h − 1, 75; h + 1, 75] | h ∈ R}.
Da als Bildpunkte der Bereichsschätzung δ nur die Elemente von J auftreten,
folgt für alle H ∈ [P(Θ) − J]
µδ̂(B) (H) =
sup
(x1 ,...,x5 )∈R5
δ(x1 ,...,x5 )=H
min{µB1 (x1 ), ..., µB5 (x5 )}
= sup min{µB1 (x1 ), ..., µB5 (x5 )}
∅
= 0
35
und für alle H ∈ J mit H = [h − 1, 75; h + 1, 75] erhält man
µδ̂(B) (H) =
sup
(x1 ,...,x5 )∈R5
x=h
min{µB1 (x1 ), ..., µB5 (x5 )},
nach 3.1.1 von Seite 29 gilt in diesem Fall weiter
µδ̂(B) (H) = µB (h).
3.3.3
In der folgenden Grafik sind die Zugehörigkeitsfunktion µB (.) und drei Intervalle H = [h−1, 75; h+1, 75] so dargestellt, daß auch ihre Zugehörigkeitswerte
µδ̂(B) (H) = µB (h) abgelesen werden können:
µB (h)
✻
✒
h
✲
h=6
5
✲
1
h = 4, 2
✲
t
h=3
1
✲
0
1
5
10
t
Abb.23
Die zu der Abbildung gehörenden Zahlenwerte sind in der folgenden Tabelle
zusammengestellt
h h-1,75
3
1,25
4,2 2,45
6
4,25
h+1,75 µB (h)
4,75
0,6
5,95
1
7,75
0
36
t
t
Wäre nur stochastische Imperfektion mit dem Stichprobenbefund x = (6,1,5,7,2)
gegeben, so hätte man mit x = h = 4, 2 das einzige Konfidenzintervall
[2, 45; 5, 95] erhalten. Da aber zusätzlich nichtstochastische Imperfektion aufgetreten ist, besteht das Ergebnis aus einer F-Menge in P(Θ), positive Zugehörigkeitswerte weisen nun gewisse Intervalle auf, von denen zwei in der
Zeichnung dargestellt sind. Das Resultat ist nicht unplausibel, aber selbst in
dem einfachen Beispielsfall kompliziert und wenig anschaulich.
Die nachfolgend geschilderte Vorgehensweise ermöglicht - unter Inkaufnahme eines Informationsverlustes - den Übergang von dem schwer zugänglichen
Wertevorrat F P(P(Θ)) der F-Bereichsschätzung δ̂ zu der leichter vorstellbaren Menge F P(Θ).
Für jedes t ∈ Θ wird die maximale Akzeptanz bestimmt, das wahre, unbekannte µ zu sein, indem der maximale Zugehörigkeitswert berechnet wird,
den ein H ∈ P(Θ) mit t ∈ H bzgl. µδ̂(B) aufweist. Durch diese Konstruktionsvorschrift wird eine F-Menge in P(Θ) festgelegt, sie werde als durch
δ̂ in P(Θ) induzierte F-Konfidenzbereichsschätzung bezeichnet, das Symbol
sei G(δ̂(B)). Man hat also
3.3.4
sup µδ̂(B) (H) für alle t ∈ Θ.
µG(δ̂(B)) (t) =
H∈P(Θ)
t∈H
Da im vorliegenden Beispiel alle H ∈ [P(Θ) − J] den Zugehörigkeitswert
µδ̂(B) (H) = 0 haben, folgt weiter mit 3.3.3
µG(δ̂(B)) (t) = sup µδ̂(B) (H) für alle t ∈ Θ
H∈J
t∈H
=
sup
t∈[h−1,75;h+1,75]
=
sup
t−1,75≤h≤t+1,75
µB (h)
µB (h).
Wegen µB (h) = 0 für h ≤ 1, 2 oder h ≥ 5, 2 und µB (h) = 1 für h=4,2 folgt
0 für t ≤ −0, 55 oder t ≥ 6, 95
µG(δ̂(B)) (t) =
1 für
2, 45 ≤ t ≤ 5, 95
Da B eine F-Dreieckszahl ist, erhält man weiter
µB (t + 1, 75) für −0, 55 ≤ t ≤ 2, 45
µG(δ̂(B)) (t) =
µB (t − 1, 75) für 5, 95 ≤ t ≤ 6, 95
Der Graph dieser Zugehörigkeitsfunktion ist in der folgenden Abbildung gegeben:
37
µ
1
✻ G(δ̂(B))
(t)
✲
-1
0
1
5
Abb.24
Hier weisen alle t aus dem C-Konfidenzintervall [2, 45; 5, 95] den Zugehörigkeitsgrad 1 auf, werden also voll als mögliche Kandidaten für das unbekannte,
wahre µ akzeptiert, aber eine Reihe von Werten außerhalb dieses Intervalls
wird nicht strikt verworfen, sondern mit nach außen “abnehmender Akzep”
tanz noch in Erwägung gezogen.
Im nächsten Abschnitt wird auf Seite 42 erläutert, wie mit Hilfe der Gleichung 3.3.4 eine zusätzliche Abbildung G(δ̂)(.) mit
δ̂
G
[F P(R)]n −→ F P(P(Θ)) −→ F P(Θ)
eingeführt wird, um die Struktur der vorangegangenen Überlegungen deutlich
werden zu lassen.
38
t
4
Die formale Struktur statistischer Entscheidungsmodelle mit unscharfen Stichproben
Den zuvor behandelten statistischen Entscheidungsverfahren - Punktschätzungen, Alternativtests, Bereichsschätzungen - liegen die im folgenden dargestellten Bausteine zugrunde:
Eine Zufallsvariable Y : Ω̃ → R mit ganz oder teilweise unbekannter Wahrscheinlichkeitsverteilung QY,ϑ beschreibt den interessierenden Umweltausschnitt; dabei ist ϑ ein unbekannter Parameter aus dem zugehörigen Parameterraum Θ; Ω̃ und R sind Ergebnisräume von Wahrscheinlichkeitrsräumen
(Ω̃, F̃, P̃ ) bzw. (R, B1 , QY,ϑ ).
Eine weitere Zufallsvariable X = (X1 , ..., Xn ) : Ω → Rn mit der Wahrscheinlichkeitsverteilung QX,ϑ modelliert die Stichprobenziehung vom Umfang n zu Y, die entsprechenden Wahrscheinlichkeitsräume sind (Ω, F, P ) und
(Rn , Bn , QX,ϑ ). Liegt für jede Stichprobenrealisation x = (x1 , ..., xn ) ∈ Rn
die statistische Entscheidung δ(x) (Punktschätzung, Testentscheidung bzw.
Schätzbereich) fest, hat man eine Abbildung δ : Rn → D vorliegen, für deren
sog. Entscheidungsraum D gilt
4.1 D = Θ
Parameterpunktschätzung17
4.2 D = {d0 , d1 } Alternativtest18
4.3 D = P(Θ)
Bereichsschätzung17
Der in dieser Arbeit gewählte Zugang zum Gebiet der Statistik mit unscharfen Stichproben geht davon aus, daß nicht die exakte Stichprobenrealisation x = (x1 , ..., xn ) ∈ Rn beobachtet wird, sondern nur ein unscharfes Bild
L(x) ∈ [F P(R)]n . Die somit vorliegende Abbildung
L : Rn → [F P(R)]n
soll hier als Fuzziness-erzeugende-Funktion (FE-Funktion) bezeichnet werden.
Natürlich wird man bei einem unscharfen Stichprobenbefund zunächst nur
mit einer unscharfen statistischen Entscheidung rechnen können, die ursprüngliche statistische Entscheidungsfunktion δ : Rn → D wird mit Hilfe
des Erweiterungsprinzips von Zadeh zu einer Entscheidungsfunktion
17
In zahlreichen Anwendungsfällen interessiert man sich nicht für ϑ ∈ Θ selbst, sondern
für eine transformierte Größe γ(ϑ).
Man hat dann in 4.1 D = γ(Θ) und in 4.3 D = P(γ(Θ)).
18
Zu d0 , d1 siehe Abschnitt 3.2.
39
δ̂ : [F P(R)]n → F P(D) verallgemeinert. Im folgenden Diagramm sind die
Zusammenhänge noch einmal übersichtlich dargestellt:
(Ω̃, F̃, P̃ )
(R, B1 , QY,ϑ )
Y
Ω̃ −−−→
R
(Rn , Bn , QX,ϑ )
(Ω, F, P )
Ω
X
L
Rn


δ
−−−→
−−−→ [F P(R)]n


δ̂ F P(D)
D
C-Welt
(stochastische Imperfektion,
Unsicherheit)
F-Welt
(nichtstochastische Imperfektion,
Fuzziness, Unschärfe)
Durch die Verknüpfung L o X überlagern sich beide Arten der Imperfektion
Abb.25
Liegt eine Punktschätzung mit D = Θ vor, so wird man, wie in Abschnitt
3.1 geschildert, das unscharfe Schätzergebnis δ̂(B1 , ..., Bn ) ∈ F P(Θ) ggf. noch
defuzzifizieren zu einem scharfen Schätzwert M (δ̂(B1 , ..., Bn )), das obige Diagramm ist in diesem Fall um eine Abbildung M : F P(Θ) → Θ, welche die
gewählte Defuzzifizierungsmethode beschreibt, zu erweitern:
L
−→ Rn −→ [F P(R)]n




δ
δ̂ F P(Θ)


M
Θ
Θ
Abb.26
Ist man im Fall des Alternativtests gezwungen, eine scharfe Entscheidung
zu treﬀen, wird man die Entscheidung δ(x) wählen und δ̂(B) unberücksichtigt lassen, die Defuzzifizierung durch eine Abbildung M erübrigt sich. Bei
Alternativtests wird aber ein anderes Problem deutlich: Wie in Abschnitt
3.2 geschildert, konstruiert man i.a. in der C-Welt nicht direkt die gesuchte
40
Entscheidungsfunktion δ : Rn → D = {d0 , d1 }, sondern transformiert den
Ergebnisraum Rn mit einer Abbildung ( Statistik “) T : Rn → R in einen
”
niedrigdimensionalen Raum, hier die Menge R. Erst in einem zweiten Schritt
wird durch die Abbildung δ ∗ : R → D auf der Basis des transformierten
Stichprobenbefundes T (x) die Entscheidung δ ∗ (T (x)) = (δ ∗ ◦ T )(x) =: δ(x)
festgelegt, der Zusammenhang ist durch die folgende Abbildung veranschaulicht:
δ
✲ D = {d0 , d1 }
Rn
✼
T
❘
δ∗
R
Abb.27
Folglich treten auch beim Übergang in die F-Welt drei entsprechende Funktionen T̂ , δ̂ ∗ und δ̂ auf. In der C-Welt wird definiert δ := δ ∗ ◦ T. Wendet man
das Erweiterungsprinzip auf die Abbildungen T, δ ∗ und δ an, erhebt sich die
Frage, ob der obige Zusammenhang gültig bleibt, d.h. ob δ̂ = δ̂ ∗ ◦ T̂ gilt, wie
in der folgenden Abbildung dargestellt:
δ̂
[FP(R)]n
T̂
✲ FP(D)
✼
δ̂ ∗
❘
FP(R)
Abb.28
Der anschließende Satz hält die positive Antwort in etwas allgemeinerer Form
fest, sein Beweis ist im Anhang auf den Seiten 45 f. gegeben.
4.1
Satz (Anhang Satz 6.1):
Es seien Ω = ∅, M = ∅, Λ = ∅ C-Mengen und
f :Ω→Γ
g:Γ→Λ
g◦f :Ω→Λ
41
Abbildungen. Dann gilt für die nach dem Erweiterungsprinzip von Zadeh
ermittelten Abbildungen
fˆ : F P(Ω) → F P(Γ)
ĝ : F P(Γ) → F P(Λ)
(g ◦ f ) : F P(Ω) → f P(Λ)
der Zusammenhang
(g
◦ f ) = ĝ ◦ fˆ,
d.h. es ist gleichgültig, ob man Abbildungen zunächst in der C-Welt verknüpft
und dann das Ergebnis in die F-Welt erweitert oder erst in die F-Welt übergeht und dort die entsprechenden Erweiterungen verknüpft.
Es sei daran erinnert, daß auf der Anwendung dieses Satzes auch das in
Abschnitt 3.1 Parameterpuntschätzungen “geschilderte Verfahren beruht,
”
n
xi zu
durch Austausch der xi gegen die Bi von der C-Welt-Formel x = n1
i=1
der entsprechenden F-Welt-Schätzung zu gelangen.
Zum Schluß dieses Abschnitts soll auf die Modellstruktur bei Bereichsschätzungen eingegangen werden:
In 3.3 wurde dargestellt, daß die C-Welt Bereichsschätzung δ : Rn → P(Θ) in
der F-Welt in die Abbildung δ̂ : [F P(R)]n → F P(P(Θ)) mit einem sehr unhandlichen Wertevorrat übergeht. Deshalb wurde in 3.3 dem F-Konfidenzbereich
δ̂(B) ∈ F P(P(Θ)) in Gleichung 3.3.4 ein induzierter F-Konfidenzbereich
G(δ̂(B)) ∈ F P(Ω) zugeordnet. Diese Zuordnung kann man für jede F-Menge
δ̂(B) vornehmen. Setzt man für alle F-Mengen aus F P(P(Θ)) − δ̂([F P(R)]n )
als Bildpunkt z.B. die leere Menge fest, hat man eine Abbildung
G : F P(P(Θ)) → F P(Θ) definiert, das folgende Diagramm veranschaulicht
den Zusammenhang:
−→
L
Rn −→


δ
P(Θ)
[F P(R)]n


δ̂ F P(P(Θ))


G
F P(Θ)
Abb.29
Es ist zu beachten, daß die Abbildung G nicht mit Hilfe des Zadehschen
Erweiterungsprinzips hergeleitet wird, also keine Entsprechung in der C-Welt
hat.
42
5
Zusammenfassung und Ergänzungen
Wir beschreiben und analysieren die Realität mit Hilfe von Modellen und
Theorien. Die Informationen über die Realität sind mehr oder weniger unscharf. Oft wird man diese Unschärfe wegen des ohnehin nur approximativen Charakters unserer Überlegungen vernachlässigen können. Je genauer
wir aber den uns interessierenden Umweltausschnitt darstellen, desto größere
Bedeutung kommt der Unschärfe der Daten zu, desto wichtiger kann es sein,
diese Unschärfe explizit in Rechnung zu stellen.
In den vorausgehenden Abschnitten wurde zunächst ein interessierender Umweltausschnitt durch ein klassisches wahrscheinlichkeitstheoretisch- statistisches Modell dargestellt und dann in einem zweiten Schritt die Auswirkung einer zusätzlichen nichtstochastischen Imperfektion der Zufallsstichprobe analysiert. Durch die Hintereinanderschaltung von C-Welt und F-Welt ist
es möglich, die Güte der angewendeten statistischen Entscheidungsverfahren
im Rahmen der klassischen Theorie zu beurteilen. Dieses Vorgehen ist relativ einfach nachzuvollziehen, kann aber nur vorläuﬁgen Charakter haben: Es
liegt auf der Hand, in einem nächsten Schritt direkt die zusammengesetzte
Funktion L ◦ X aus der nachfolgenden Abbildung
X
L
Ω −→ Rn −→ [F P(R)]n
L◦X
Abb.30
zu betrachten und sie durch eine geeignete Erweiterung des Modells als FZufallsvariable über dem Wahrscheinlichkeitsraum (Ω, F, P ) aufzufassen. Ein
grundlegender Ansatz, den Begriﬀ der Zufallsvariablen von der C-Welt in die
F-Welt zu verallgemeinern, geht auf Kwakernaak (1978) zurück (vgl. auch
Kruse, H., Meyer, K.D. (1987)). Allerdings würde die Verfolgung dieses Weges
den Rahmen der vorliegenden einführenden Abhandlung sprengen. Eine interessante Anwendung könnte z.B. bei der F-Punktschätzung darin bestehen,
die bisher sehr unbefriedigend begründete Auswahl einer Defuzziﬁzierungsmethode im Rahmen einer F-statistischen Entscheidungstheorie mit Hilfe
geeigneter Optimalitätskriterien zu objektivieren.
Ebenfalls zu aufwendig für dieses Einstiegspaper wäre ein Abriß der FuzzyLogik. Deshalb soll nur ein für den Anwender besonders interessanter Gegenstand erwähnt werden. In der klassischen Logik ist der Modus ponens
eine häuﬁg verwendete Schlußregel: Es seien A und B Aussagen und es gelte
43
A impliziert B “. Beobachtet man A, so folgt zwingend die Gültigkeit von
”
B. In der Praxis stellt man oft fest, daß die Aussagen oder auch die Implikation nur angenähert gelten. Während in der klassischen Logik allein die
Wahrheitswerte 1 (wahr) und 0 (falsch) zugelassen sind, eröﬀnet die FuzzyLogik, die als Wertebereich der Wahrheitswerte das ganze Kontinuum [0, 1]
zur Verfügung hat, die Möglichkeit, den Umgang mit nur näherungsweise
geltenden Aussagen und Relationen exakt darzustellen (vgl. z.B. Biewer, S.
274 ﬀ und Kahlert, J., Frank, S. 41 ﬀ).
In der Einleitung wurde darauf hingewiesen, daß Fuzzy-Methoden eine neue
Möglichkeit bieten, in Modellen und Theorien die Datenqualität besser als
bisher explizit zu berücksichtigen und somit ggf. die Realitätsnähe der Überlegungen zu verbessern. Bereits die einfachen vorangehenden Beispiele zeigten andererseits, daß man diesen Vorteil mit erhöhtem formalen Aufwand
bezahlen muß, es gilt stets abzuwägen, ob die Berücksichtigung nichtstochastischer Imperfektion dem jeweiligen Problem angemessen ist. Dazu ist eine
sorgfältige Problem- und Datenanalyse nicht zu umgehen, Fuzzy-Methoden
machen sie nicht überﬂüssig, sondern erfordern zusätzliche präzise Überlegungen. Sehr einprägsam wurde von P.T. Johnston 1988 formuliert: Fuzzy
”
mathematics is not an excuse for fuzzy thinking “.
44
6
6.1
Anhang
Satz:
Es seien
Ω = ∅, Γ = ∅, Λ = ∅ C-Mengen und
f :Ω→Γ g:Γ:Λ
g◦f :Ω→Λ
Abbildungen. Dann gilt für die nach dem Erweiterungsprinzip von Zadeh
ermittelten Abbildungen
fˆ : F P(Ω) → F P(Γ) ĝ : F P(Γ) → F P(Λ)
(g ◦ f ) : F P(Ω) → F P(Ω)
der Zusammenhang
(g
◦ f ) = ĝ ◦ fˆ.
6.1.1
Beweis:
Es seien A ∈ F P(Ω) eine F-Menge mit der Zugehörigkeitsfunktion
µA : Ω → [0, 1] und λ ∈ Λ. Dann gilt für die Zugehörigkeitsfunktion der
F-Menge (g
◦ f )(A) nach Satz und Deﬁnition 2.9
µ(
(λ) =
g◦f )(A)
sup
ω∈(g◦f )−1 ({λ})
=
µA (ω)
sup
ω∈f −1 (g −1 ({λ}))
µA (ω) =: r,
für die Zugehörigkeitsfunktion der F-Menge (ĝ ◦ fˆ)(A) erhält man
µ(ĝ◦fˆ)(A) (λ) = µĝ(fˆ(A)) (λ)
=
sup
γ∈g −1 ({λ})
=
µfˆ(A) (γ)
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({λ})
µA (ω) =: s
In der folgenden Abbildung ist der Zusammenhang zwischen den auftretenden C-Mengen dargestellt:
45
✲
f
Ω
✬
g
Γ
✲
Λ
✩
✬
✩
✬✩
{λ}
{γ}
✫✪
✫
✫
✪
✪
f −1 ({γ}) f −1 (g −1 ({λ}))
g −1 ({λ})
Abb.31
a) Gilt f −1 (g −1 ({λ})) = ∅, so folgt
(∀γ ∈ g −1 ({λ}))(f −1 ({γ}) = ∅)
und mit 2.8
r=
sup
ω∈f −1 (g −1 ({λ}))
µA (ω) = 0 =
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({γ})
µA (ω) = s,
also die Behauptung 6.1.1 des Satzes.
b) Es gelte nun f −1 (g −1 ({λ})) = ∅ und folglich auch g −1 ({λ}) = ∅. Für
alle γ ∈ g −1 ({λ}) folgt
f −1 ({γ}) ⊆ f −1 (g −1 ({λ}))
und somit
sup
ω∈f −1 ({γ})
µA (ω) ≤
sup
ω∈f −1 (g −1 ({λ}))
µA (ω),
weiter erhält man
6.1.2
Es seien
s=
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({γ})
µA (ω) ≤
sup
ω∈f −1 (g −1 ({λ}))
µA (ω) = r.
ω1 , ω2 , ... ∈ f −1 (g −1 ({λ})) mit sup µA (ωi ) = r
i∈N
und
γ1 , γ2 , ... ∈ g −1 ({λ}) mit ωi ∈ f −1 ({γi })
gewählt. Dann gilt
46
6.1.3
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({γ})
s=
≥ sup
i∈N
≥ sup
i∈N
µA (ω)
sup
ω∈f −1 ({γi })
µA (ω)
sup
ωi ∈f −1 ({γi })
µA (ω1 ) = sup µA (ωi ) = r.
i∈N
Aus 6.1.2 und 6.1.3 folgt r = s und damit auch für den Fall b) die Behauptung
6.1.1 des Satzes.
6.2
Bemerkung:
Man überlegt sich leicht, daß die Aussage des Satzes entsprechend auch bei
Anwendung des Erweiterungsprinzips aus Satz und Definition 2.11 gilt.
6.3
Satz:
Es sei (M, l, r) mit l = 0 = r eine F-Dreieckszahl mit der Zugehörigkeitsfunktion µ.
Dann gilt für den Abszissenwert xs ihres Flächenschwerpunktes s
xs = M +
r−1
.
3
Beweis:
µ(x)
1
✻
Schwerpunkt
✉
✲
M −l
M
xS
M +r
x
Abb.32
Für die Zugehörigkeitsfunktion µ gilt

0
:
x ≤ M −l


 1
1
x+1− lM
: M −l ≤ x ≤ M
l
µ(x) =
1
1
x
+
1
+
M
:
M
≤ x ≤ M +r
−

r

 r
0
: M + r ≤ x.
47
Damit folgt
∞
xs =
xµ(x)dx
−∞
∞
µ(x)dx
−∞
M
−l
=
M
0dx +
−∞
M −1
M
−l
= M+
M
0dx +
−∞
6.4
x(1 +
(1 +
M −1
x
l
−
M
)dx
l
+
x
l
−
M
)dx
l
+
M+r
M
M+r
M
x(1 −
(1 −
x
r
x
r
+
+
M
)dx
r
M
)dx
r
+
+
∞
0dx
M +r
∞
0dx
M +r
r−l
.
3
Beispiel:
In Abschnitt 3.2 wird auf S. 33 die Funktion δ ∗ : R → D = {d0 , d1 } mit
d0 : t ∈ A∗ = [−1, 96; 1, 96]
∗
δ (t) =
d1 : t ∈ K ∗ =] − ∞; −1, 96[∪]1, 96; ∞[
zu δ̂ ∗ : F P(R) → F P(D) erweitert.
Die Zugehörigkeitsfunktion µT̂ (B1 ,...,B5 ) =: µ
der Dreieckszahl T̂ (B) := T̂ (B1 , ..., B5 ) = (2, 46; 3, 36; 1, 12) ∈ F P(R) ist in
der folgenden Abbildung dargestellt
µ(t)
1 ✻
0,86
✲
-2
−λ0,975
-1
0
1
5
λ0,975 = 1, 96
Abb.33
48
t
Es gilt nach dem Beweis zu Satz 6.3

0



0, 3t + 0, 27
µ(t) =
−0, 89t + 3, 2



0
:
t ≤ −0, 9
: −0, 9 ≤ t ≤ 2, 46
: 2, 46 ≤ t ≤ 3, 58
: 3, 58 ≤ t
(Die Zahlen sind auf zwei Nachkommastellen gerundet).
Mit dem Erweiterungsprinzip von Zadeh erhält man
µδ̂∗ (T̂ (B)) (d0 ) = sup µT̂ (B) (t)
t∈A∗
= 0, 3 · 1, 96 + 0, 27
= 0, 86
µδ̂∗ (T̂ (B)) (d1 ) = sup µT̂ (B) (t)
t∈K ∗
= 0, 3 · 2, 46 + 0, 27
= 1
Damit gilt
δ̂ ∗ (T̂ (B)) = {(d0 ; 0, 86), (d1 ; 1)} ∈ F P(D).
49
7
Literaturverzeichnis
Altrock, C.v.:
Fuzzy-Logic, Bd. 1 Technologie,
München, Wien, 1995
Biewer, B.:
Fuzzy-Methoden,
Berlin et al. 1997
Bothe, H.H.:
Fuzzy-Logic, Einführung in Theorie und Anwendungen,
Berlin et al. 1995
Frühwirth-Schnatter, S.:
On Statistical Inference for Fuzzy Data with Applications
to Descriptive Statistics,
Fuzzy Sets and Systems 50, 1992, 143-165
Kahlert, J., Frank, H.:
Fuzzy-Logik und Fuzzy-Control,
Braunschweig, Wiesbaden 1994
Kruse, R., Meyer, K.D.:
Statistics with Vague Data,
Dordrecht et al. 1987
Kwakernaak, H.:
Fuzzy Random Variables - I. Deﬁnitions and Theorems,
Information Sciences 15, 1978, 1-29
Rommelfanger, H.:
Fuzzy-Decision Support-Systeme; Entscheiden bei Unschärfe,
Berlin et al. 1994
Viertl,R.:
Statistical Methods for Non-Precise Data,
N.Y. et al. 1996
Viertl,R.:
On Statistical Inference Based on Non-precise Data,
Bandemer, H.(Hrsg.): Modelling Uncertain Data, Berlin 1992
Zadeh, L.A.:
Fuzzy Sets
Information and Control 8, 1965, 338-353
50