Schließende Statistik mit unscharfen Stichproben

Werbung
Schließende Statistik
mit
unscharfen Stichproben
von
Volker Steinmetz
Dezember 1998
LATEX-Version der Nr. A9802, Diskussionsbeiträge Fachbereich Wirtschaftswissenschaft, Universität des Saarlandes
Inhaltsverzeichnis
1 Einleitung
3
2 Fuzzy-Mengen reeller Zahlen
6
3 Schätzen und Testen mit unscharfen Stichproben
25
3.1 Parameterpunktschätzungen
26
3.2 Alternativtests
30
3.3 Konf idenzbereichsschätzungen
34
4 Die formale Struktur statistischer Entscheidungsmodelle mit
unscharfen Stichproben
39
5 Zusammenfassung und Ergänzungen
43
6 Anhang
45
7 Literaturverzeichnis
50
2
1
Einleitung
Sowohl im alltägliche Leben als auch bei der wissenschaftlichen Arbeit werden
wir mit unvollkommenen oder imperfekten 1 Informationen konfrontiert: Unsere Sinnesorgane erzeugen nur grobe Abbilder der Realität, Meßgeräte und
statistische Erhebungen liefern Angaben von begrenzter Genauigkeit, sprachliche Begriffe und Formulierungen sind - von der standardisierten, präzisen
Sprache der Mathematik einmal abgesehen - von kaum zu vermeidender Vieldeutigkeit, komplexe Systeme sind notgedrungen oft nur approximativ darzustellen und folglich auch nur ungenau zu analysieren. Schließlich ist das
Eintreten zukünftiger Ereignisse für uns häufig mit Unsicherheit behaftet.
Zur Modellierung und Untersuchung des zuletzt genannten Typs von Imperfektion stellen Wahrscheinlichkeitstheorie und schließende Statistik seit langem bewährte Hilfsmittel bereit, man spricht in diesem Fall von stochastischer
Imperfektion oder Unsicherheit. Auch einen Teil der Meß- und Erhebungsfehler kann man dieser Kategorie der Unvollkommenheit zurechnen. Es ist
charakteristisch, daß die interessierenden Phänomene im Idealfall präzise definiert sind, über ihr Auftreten jedoch Unsicherheit besteht.
Um einen anderen Typ von Imperfektion handelt es sich, wenn beispielsweise
eine Wirtschaftszeitung die Nettoumsatzrendite eines deutschen Industrieunternehmens als durchschnittlich bezeichnet. Auch wenn man weiß, daß die
Umsatzrendite aller deutschen Industrieunternehmen zu Beginn der neunziger Jahre im Durchschnitt etwas über 2 % lag, hat man durch die in der
Zeitschrift gegebene Information nur eine vage Vorstellung von der Umsatzrentabilität des angegebenen Unternehmens, man bezeichnet diese nichtstochastische Imperfektion als Unschärfe. Die Bedeutung des oben verwendeten
Begriffs ‘durchschnittlich‘ ist kontextabhängig; wenn z.B. in demselben Artikel auch die Eigenkapitalrendite als durchschnittlich bezeichnet wird, ist
damit ein ganz anderer Zahlenbereich angedeutet. Zusätzlich variiert die Interpretation dieses vagen Begriffs auch noch von Leser zu Leser, sie ist subjektiv. Aber trotz der offensichtlich fehlenden Eindeutigkeit kann beispielsweise
auch der Anlageberater einer Bank mit einer derartigen Bewertung arbeiten,
um die Informationsflut, die bei der Beurteilung eines Unternehmens anfällt,
überschaubar zu gestalten.
Die menschliche Sprache, und folglich auch das menschliche Denken, arbeiten
1
Zum Terminus ‘imperfekt‘ als Oberbegriff für ‘unsicher‘ und ‘unscharf‘ vgl. Biewer
1997, S. 24, insbesondere seinen Hinweis auf Kruse, Gebhard, Klawonn.
3
überwiegend mit unscharfen Begriffen. Trotzdem haben diese sich nicht nur
im alltäglichen Leben, sondern auch in der Wissenschaft zur Beschreibung
und Analyse von Ausschnitten aus der Erscheinungswelt bewährt. Folgerichtig bemüht man sich in wachsendem Maße auch bei der Erarbeitung und
Anwendung formaler Modelle, die geschilderte Unschärfe nicht durch evtl.
nur scheinbar präzise Angaben zu verdecken, sondern sie adäquat darzustellen und zu verarbeiten, mit dem Ziel, die Realitätsnähe der theoretischen
Überlegungen zu vergrößern.
Der Zusammenhang zwischen Imperfektion, Unsicherheit und Unschärfe wird
durch die folgende Graphik nochmals verdeutlicht:
Imperfektion
Unsicherheit
(stochastisch)
Unschärfe
(nichtstochastisch)
Abb. 1
Wie erwähnt ist die geschilderte Vagheit unserer Sprache nicht die alleinige Ursache für die Imperfektion unserer Informationen und unseres Wissens2 . Zusätzlich liefern Meßinstrumente, statistische Erhebungen, Sinnesorgane o.ä. i.a. Daten, deren Unschärfe aus prinzipiellen oder Kostengründen
bis auf triviale Ausnahmen nicht zum Verschwinden gebracht werden kann.
Hochkomplexe, vor allem nichtlineare, Zusammenhänge können wir nur in
vereinfachter Form verarbeiten. Auch kann das interessierende Objekt - etwa
ein Tintenklecks auf Löschpapier - selbst unscharf sein. Man gliedert deshalb
den Begriff der Unschärfe, wie in Abbildung 2 gezeigt, noch weiter auf:
Unschärfe
linguistische informationale
Unschärfe
oder lexikalische
Unschärfe
Abb. 2
2
Im folgenden wird zwischen Information und Wissen als gespeicherter Information
nicht streng unterschieden.
4
Schließlich sind in der Praxis Unsicherheit und Unschärfe oft gleichzeitig zu
beobachten.3
Zur formalen Darstellung von Unschärfe wurde zu Beginn der sechziger Jahre
in den USA von Lotfi A. Zadeh das Konzept der fuzzy4 sets - unscharfe Mengen, Fuzzy-Mengen - entwickelt und 1965 publiziert (Zadeh 1965). Es stieß,
ebenso wie das logische Pendant, die Fuzzy-Logik - fuzzy logic -, nur auf geringe Resonanz, teilweise sogar auf entschiedene Ablehnung. Erst nachdem
Zadehs Ansatz 1974 in Europa bei der Prozeßregelung eines Kraftwerkes (vgl.
v.Altrock 1995, S. 7) eine praktische Verwendung gefunden und sich bewährt
hatte, bahnte sich eine Änderung an. Vor allem in Japan schnellte die Zahl
der technischen Anwendungen und auch der theoretischen Arbeiten in die
Höhe. ’Heute ist die Behandlung des Fuzzy-Themas in der Forschung und in
der industriellen Anwendung ein Muß’ stellt H.-H. Bothe kurz und bündig
fest (Bothe 1995, S. VIII).
Wie bei einem relativ jungen Gebiet - hier der Fuzzy-Theorie - nicht anders zu erwarten, ist die Terminologie noch sehr uneinheitlich. Es soll nur
erwähnt werden, daß man statt von Imperfektion oft auch von Unschärfe
spricht und dann Unsicherheit als stochastische Unschärfe von linguistischer
und informationaler Unschärfe, beides auch als Vagheit bezeichnet, abgrenzt.
In den folgenden Abschnitten werden zunächst als Sonderfälle der allgemeinen Fuzzy-Mengen die Fuzzy-Zahlen und Fuzzy-Intervalle behandelt und das
wichtige Erweiterungsprinzip von Zadeh erläutert. Nachdem dann mit diesem Hilfsmittel die skalare Multiplikation und die Addition eingeführt wurden, werden an Hand eines immer wieder fortgeführten Grundbeispiels die
drei klassischen statistischen Entscheidungsverfahren - (Parameter)punktschätzung, (nichtrandomisierter) Alternativtest, (Konfidenz)bereichsschätzung
- rekapituliert und die Auswirkung nichtstochastischer Imperfektion der Zufallsstichprobe dargestellt. Die allgemeine Struktur der hier gewählten Verknüpfung von stochastischer und nichtstochastischer Imperfektion wird in
einem weiteren Abschnitt vorgestellt. Schließlich werden hier nicht näher behandelte Gebiete der Fuzzy-Theorie kurz gestreift. Im Anhang werden einige
formale Hilfsmittel bereitgestellt.
3
Auch wurde der Begriff des Wahrscheinlichkeitsmaßes zum Begriff des Fuzzy-Maßes
verallgemeinert, der es ermöglicht, daß in der Unschärfetheorie auch Unsicherheitsaspekte
eingebracht werden können. Dieser Ansatz wird hier nicht weiter verfolgt.
4
Nach Webster’s New Encyclopedic Dictionary zurückgehend auf niederdeutsch ’fussig’
für locker, schwammig.
5
2
Fuzzy-Mengen reeller Zahlen
Zunächst soll der allgemeine Begriff der Fuzzy-Menge am Sonderfall unscharfer Zahlenmengen erläutert werden: Es sei R die Menge der reellen Zahlen.
Oft verwendete klassische Teilmengen sind die Intervalle, z.B. ist
A := [2, 6] = {x ∈ R | 2 ≤ x ≤ 6}
das (abgeschlossene) Intervall aller reellen Zahlen x, die mindestens 2 und
höchstens 6 sind. Man kann eine derartige Teilmenge der Menge der reellen
Zahlen auf der Zahlengeraden etwa in der folgenden Art veranschaulichen:
A
[
-1
0
]
1
✲
x
5
Abb. 3
Eine für die anschließenden Überlegungen nützliche Darstellung von Teilmengen A der reellen Zahlen R benutzt die sog. Indikatorfunktion von A,
eine Abbildung µA von R in die Menge {0, 1}, die jedem x ∈ R, das auch zu
A gehört, den Wert 1 zuordnet und sonst konstant 0 ist:
2.1
Def inition:
Es sei A eine Teilmenge von R. Man bezeichnet die Abbildung µA : R →
{0, 1} mit
1 : x∈A
µA (x) =
0 : x ∈ A
als Indikatorfunktion oder charakteristische Funktion von A bzgl. R.
Für A = [2, 6] gilt
µA (x) =
1 : 2≤x≤6
0 : x < 2 oder 6 < x.
Der Graph dieser Funktion ist in der folgenden Abbildung dargestellt:
6
µ (x)
1
✻A
0
✉
✉
❡
❡
1
✲
x
5
Abb.4
Für jedes x ∈ R ist abzulesen, ob es zu A gehört oder nicht, d.h. die Indikatorfunktion beschreibt die Menge in eineindeutiger Weise.
Man kann diese Funktion auch verwenden, um jede Teilmenge A der Menge
R der reellen Zahlen in einer für die klassische Mengelehre ungewöhnlichen,
aber für die Fuzzy-Mengenlehre nützlichen Form darzustellen:
Jedes x ∈ R wird mit dem zugehörigen Funktionswert µA (x) ∈ {0, 1} zu
einem geordneten Paar (x, µA (x)) zusammengefaßt, aus diesen Paaren wird
eine neue (klassische) Menge
2.2
{(x, µA (x)) | x ∈ R}
gebildet. Diese Menge charakterisiert ebenfalls in eineindeutiger Weise die
Ausgangsmenge A ⊆ R.
Die Indikatorfunktion läßt für jedes x ∈ R nur jeweils eine der beiden folgenden Möglichkeiten zu: Entweder gilt µA (x) = 1, d.h. x ∈ A, oder man
hat µA (x) = 0 und folglich x ∈ A. Genau an diesem Punkt setzen die Überlegungen Zadehs an. In vielen Situationen empfindet man die Abgrenzung
von Teilmengen, wie sie in der klassischen Mengenlehre praktiziert wird, als
übertrieben scharf und für die Anwendungen unzweckmäßig. Ein fließender
Übergang von einer Menge A zu ihrem Komplement kann praktikabler sein.
Beispielsweise könnte ein Anlageberater in o.g. Beispiel Umsatzrenditen zwischen 2 % und 2,5 % ohne Einschränkung als durchschnittlich bezeichnen,
seine Vorstellung von durchschnittlichen Renditen würde aber vermutlich
durch die folgende Graphik nicht zufriedenstellend wiedergegeben:
7
µ(x)
1
✻
0
1
✉
✉
❡
❡
2
✲
x
3
Umsatzrendite in %
Abb.5
Er wäre möglicherweise damit einverstanden, Renditen x ≤ 1% als mit Sicherheit zu niedrig und x ≥ 3% als mit Sicherheit zu hoch für durchschnittliche Werte zu bezeichnen, aber Probleme bereiten die Zwischenwerte. Wenn
2 % noch als durchschnittlicher Wert angesehen werden kann, ist dann 1,9 %
ganz dezidiert genauso als nichtdurchschnittlich zu bewerten wie beispielsweise 0,5 %, oder sollte man nicht besser in der formalen Darstellung andeuten,
daß 1,9 % noch als ziemlich durchschnittlich anzusehen sei, aber zum Beispiel
1,5 % doch schon deutlich weniger?
Zadeh löste dieses Problem, indem er zur Beschreibung der Zugehörigkeit
eines Objektes x zu einer Menge A nicht nur den Wert 1 (und 0 bei Nichtzugehörigkeit) zuließ, sondern Werte zwischen 0 und 1 zur Beschreibung einer
abgeschwächten Zugehörigkeit einführte. Der im Beispiel erwähnte Anlageberater könnte die Gesamtheit der durchschnittlichen Renditen beispielsweise
durch folgende Funktion
µ : R → [0, 1]
charakterisieren:
µ(x)
✻
✉
1
✉
0
✉
✉
1
2
Abb.6
8
3
✲
x
Man bezeichnet µ als Zugehörigkeitsfunktion der Fuzzy-Menge der durchschnittlichen Umsatzrenditen und µ(x) als Zugehörigkeitsgrad von x ∈ R zu
dieser Fuzzy-Menge. Man sieht an der Abbildung, daß für den Anlageberater
z.B. 1,9 % mit wesentlich größerem Zugehörigkeitsgrad zur Fuzzy-Menge der
durchschnittlichen Werte gehört als z.B. 1,5 %, aber daß er 1,9 % gleichzeitig
nicht so dezidiert als durchschnittlich bezeichnet wie z.B. 2 %.
Offensichtlich kann man die Indikatorfunktion der klassischen Mengenlehre
als Sonderfall derartiger Zugehörigkeitsfunktionen auffassen, bei ihr kommen
eben als Funktionswerte nicht alle Elemente des Einheitsintervalls [0,1] in
Frage, sondern nur dessen Endpunkte 0 und 1.
In mehr mathematisch orientierten Abhandlungen ist es üblich, die FuzzyMengen direkt mit ihren Zugehörigkeitsfunktionen zu identifizieren. Die stärker
auf den Einsteiger und mathematisch weniger trainierten Anwender ausgerichtete Literatur bevorzugt vielfach eine an 2.2 angelehnte Definition:
2.3
Def inition:
Es sei
µ : R → [0, 1]
eine Abbildung. Man bezeichnet
A := {(x, µ(x)) | x ∈ R}
als unscharfe Menge, Fuzzy-Menge (F-Menge)5 in R mit der Zugehörigkeitsfunktion
µA := µ.
Für jedes x ∈ R heißt µA (x) der Zugehörigkeitsgrad von x zur F-Menge A.6
Die Menge aller F-Mengen in R heißt die Fuzzy-Potenzmenge von R und
wird mit FP(R) bezeichnet.
In den folgenden Abbildungen sind die Zugehörigkeitsfunktionen einiger FMengen in R jeweils mit in einem bestimmten Kontext denkbaren verbalen
Interpretationen angegeben.
5
Statt von einer F-Menge in R spricht man auch von einer F-Teilmenge von R.
Natürlich kann man ganz analog auch F-Mengen in beliebigen Mengen Ω = ∅
(Grundmengen, Universalmengen) definieren. Im Unterschied zu den F-Mengen werden
in dieser Arbeit die klassischen Mengen als C-Mengen (Englisch crisp=scharf) bezeichnet.
Sie sind ein Sonderfall der F-Mengen.
6
9
µ (x)
✻ A1
1
✲
x
0
1
2
Abb.7
A1 könnte man als F-Menge aller reellen Zahlen interpretieren, die erheblich
größer als 1 sind.
µ (x)
µ (x)
✻ A2
✻ A3
1
1
✲
-1
0
1
✲
x
-1
0
Abb. 8
1
Abb. 9
A2 und A3 könnten F-Mengen sein, welche durch die definierende unscharfe
Eigenschaft ungefähr 0 sein “ gegeben sind.
”
µ (x)
✻ A4
1
✲
x
0
1
2
3
Abb.10
10
4
x
A4 ist eine mögliche F-Menge zur Darstellung der Zahlen, die in der Nähe
von 2 oder 4 liegen.
Die Beispiele verdeutlichen, daß der Übersetzung unscharfer, verbaler Zahlenangaben in F-Mengen eine gewisse Willkür anhaftet. In der Technik haben
sich einfache, aus Geradenstücken zusammengesetzte Kurven wie in Abb. 8
und Abb. 10 bewährt (vgl. v. Altrock 1995, S. 154). Bei technischen Anwendungen handelt es sich oft um mit Fuzzy-Methoden arbeitende Regelkreise,
die in schneller Folge immer wieder durchlaufen werden. Unterschiedliche Zugehörigkeitsfunktionen führen zwar möglicherweise bei dem einzelnen Regelvorgang zu unterschiedlichen Abweichungen des Ist-Wertes vom Soll-Wert,
aber da es in der Logik des Regelkreises liegt, durch aufeinander folgende
Regelvorgänge Abweichungen zwischen Ist- und Soll-Werten verschwinden
zu lassen, werden auch die Einflüsse unterschiedlicher Zugehörigkeitsfunktionen im Zeitablauf kompensiert. In anderen Situationen verwendet man
auch kompliziertere Kurven, etwa wie in Abb. 7 und Abb. 9 dargestellt. Dort
werden waagerechte Kurventeile nicht abrupt in einem Knick verlassen, sondern in differenzierbarer Form. Auf jeden Fall sollte man einen Modellansatz
überdenken, wenn das Ergebnis von Proberechnungen sehr sensitiv auf kleine Variationen der Zugehörigkeitsfunktionen reagiert; letzteres würde einem
Grundanliegen der Fuzzy-Theorie, ohne vorgetäuschte Präzision zu arbeiten,
diametral widersprechen. Um die Unbestimmtheit bei der Festlegung von
Zugehörigkeitsfunktionen in die Überlegungen explizit mit aufzunehmen hat
man versucht, die Zugehörigkeitsfunktionen selbst wieder unscharf darzustellen, also zu F-Mengen 2. Stufe überzugehen. Da die Handhabung derartiger
Gebilde mühselig wird, hat man bisher auf die Anwendung dieses Ansatzes
weitgehend verzichtet.
Ein Sonderfall der F-Mengen in R sind die Fuzzy-Zahlen und Fuzzy-Intervalle.
Hier sollen die besonders einfach zu handhabenden und für den Anwender
wichtigen F-Zahlen mit Dreiecksgestalt und F-Intervalle mit Trapezgestalt
vorgestellt werden, Beispiele ihrer Zugehörigkeitsfunktionen sind in den folgenden beiden Abbildungen gegeben:
11
µ (x)
1
✻A
✲
x
0
1
2
3
F1
M
4
F2
Abb.11
Die F-Menge A könnte man als F-Zahl mit Dreiecksgestalt ungefähr 3“interpretieren.
”
Offensichtlich ist die F-Zahl A durch Angabe der beiden Dreiecksfußpunkte
F1 und F2 sowie des sog. Gipfelpunktes M vollständig festgelegt. Statt F1 , F2
und M anzugeben, genügen auch die drei Werte
M, l := M − F1 , r := F2 − M.
µ (x)
1
✻A
✲
x
0
1
2
F1
M1
3
4
M2
5
6
F2
Abb.12
In diesem Fall könnte man die F-Menge A als F-Intervall mit Trapezgestalt
bezeichnen und beispielsweise deuten als ungefähr zwischen 2 und 3,5 “.
”
Hier genügen zur Festlegung der Zugehörigkeitsfunktion die Werte F1 , F2
und M1 , M2 bzw.
M1 , M2 , l := M1 − F1 , r := F2 − M2 .
In der folgenden Definition werden diese Überlegungen in allgemeiner Form
festgehalten.
12
2.4
Def inition:
Gegeben seien M1 , M2 , l, r, ∈ R mit M1 ≤ M2 , l > 0 und r > 0. Man bezeichnet die F-Menge A in R als Fuzzy- Intervall mit Trapezgestalt, wenn für ihre
Zugehörigkeitsfunktion µA gilt
2.4.1
µA (x) =




x−M1
l



M2 −x
r
+1
1
+1
0
:
:
:
:
M1 − l ≤ x ≤ M1
M1 ≤ x ≤ M2
M2 ≤ x ≤ M2 + r
sonst
gilt M1 = M2 =: M , so bezeichnet man A als Fuzzy-Zahl mit Dreiecksgestalt
oder kurz F-Dreieckszahl mit dem Gipfelpunkt M , der linken Dehnung (Spreizung) l und der rechten Dehnung (Spreizung) r. Im folgenden werden auch
die Kurzschreibweisen A = (M1 , M2 , l, r) bzw. A = (M, l, r) verwendet. Man sieht sofort, daß man für die formale Darstellung die Zugehörigkeitsfunktion einer F-Zahl mit Dreiecksgestalt in 2.4.1 die zweite Zeile hinter der
Klammer streichen kann.
In der Praxis ist man daran interessiert, neben F-Mengen reeller Zahlen
auch präzise Werte wie bisher verwenden zu können. Die folgende Definition
schafft die Möglichkeit, das Rechnen mit (scharfen) reellen Zahlen in die
Fuzzy-Welt (F-Welt)7 mit einzubeziehen:
2.5
Def inition:
Es sei a ∈ R eine reelle Zahl. Die F-Menge A in R mit der Zugehörigkeitsfunktion µA , für die gilt
µA (x) =
1 : x=a
0 : x = a
für alle x ∈ R,
bezeichnet man als Singleton mit dem Trägerpunkt a und schreibt
µA =: µa .
7
Die Welt der scharfen (crisp) Mengen, Zahlen etc. werde als C-Welt bezeichnet.
13
2.6
Vereinbarung:
Da in dieser Arbeit nur F-Intervalle mit Trapezgestalt und F-Zahlen mit
Dreiecksgestalt vorkommen, soll im folgenden kurz von F-Intervallen und FZahlen gesprochen werden. Die vorangehende Definition legt es nahe, auch
die Singletons als Spezialfall unter dem Begriff F-Zahlen zu subsumieren
und sie als Grenzfall der F-Dreieckszahlen mit gegen 0 gehender linker und
rechter Spreizung sogar zur Menge der F-Dreieckszahlen hinzuzunehmen. Für
das Singleton mit dem Trägerpunkt a ∈ R soll konsequenterweise auch die
Darstellung
(a, 0, 0)
eingeführt werden.
Ganz entsprechend wird man auch die klassichen Intervalle als Spezialfall
unter den Begriff der F-Intervalle subsumieren. Abgeschlossene Intervalle
[M1 , M2 ] sollen hier durch
(M1 , M2 , 0, 0)
dargestellt werden.
Ehe im nächsten Abschnitt die Anwendung klassischer statistischer Verfahren auf unscharfe Stichprobenergebnisse untersucht werden kann, muß noch
ein wichtiges mathematisches Hilfsmittel bereitgestellt werden: Man benötigt
ein Verfahren, mit dem Funktionen aus der C-Welt in die F-Welt fortgesetzt
werden können. Dadurch wird es insbesondere möglich, die gängigen Rechenoperationen wie Addition, Multiplikation usw. von den reellen Zahlen auf
Fuzzy-Zahlen zu übertragen. Ein solches Verfahren ist in dem Zadehschen
Erweiterungsprinzip gegeben, das anschließend zunächst motiviert und dann
präzise definiert werden soll.
Der Graph einer Funktion
f :R→R
sei durch die folgende Abbildung gegeben:
14
y ✻
f (x)
✲
x
x
Abb.13
Jedem (scharfen) Urbildpunkt x ∈ R wird durch f genau ein (scharfer) Bildpunkt y := f (x) ∈ R zugeordnet.
Liegt nun nur ein unscharfer Urbildpunkt ungefähr x “vor, so ist zu erwar”
ten, daß auch der zugehörige Funktionswert nur unscharf angegeben werden
kann, etwa ungefähr f (x) “. Genauer geht es darum, aus der Zugehörig”
keitsfunktion einer unscharfen Teilmenge des Definitionsbereichs mit Hilfe
der Zuordnungsvorschrift f die Zugehörigkeitsfunktion einer passenden unscharfen Teilmenge des Wertevorrates zu ermitteln. Zunächst soll mit Hilfe
der folgenden Abbildung an ein bekanntes Vorgehen aus der klassischen Mengenlehre erinnert werden:
y ✻
fˆ(A)
✉
✉
✉
A
Abb. 14
15
✲
x
Gegeben sei die auf der Abszisse eingezeichnete Teilmenge A des Definitionsbereichs
R. Gesucht ist diejenige Teilmenge des Wertevorrates R, deren Elemente
(mindestens) einen Urbildpunkt in A haben. Als Lösung erhält man die auf
der Ordinale eingezeichnete Menge fˆ(A), formal wird definiert
2.7
fˆ(A) := {y ∈ R | (∃x ∈ A)(y = f (x))}.8
Es sei P(R) := {A | A ⊆ R} die Menge aller Teilmengen von R, die Potenzmenge von R. Da man die obige Konstruktion für alle A ⊆ R durchführen
kann, ist durch 2.7 eine Abbildung
fˆ : P(R) → P(R)
definiert worden, die sog. durch f induzierte Abbildung fˆ.
Gesucht ist eine Möglichkeit, dieses Konstruktionsverfahren aus der C-Welt
in die F-Welt zu verallgemeinern. Da F-Mengen durch ihre Zugehörigkeitsfunktion festgelegt werden, bietet es sich an, zunächst die C-Mengen A und
fˆ(A) durch ihre Indikatorfunktionen µA : R → {0, 1} und µfˆ(A) : R → {0, 1}
darzustellen, das in 2.7 angegebene Konstruktionsverfahren auf die Verwendung dieser Funktionen umzuschreiben und dann für den Übergang in die
F-Welt in dem erhaltenen Rezept die Indikatorfunktionen durch die allgemeineren Zugehörigkeitsfunktionen zu ersetzen. Zunächst werde die Abb. 14
um die entsprechenden Indikatorfunktionen ergänzt:
8
∃ ist das Kürzel für es gibt (mindestens) ein “.
”
16
y
y
✻
✉
y3
❡
✻
fˆ(A)
y1
✉
❡
y2
µfˆ(A) (y)
✛
x11
1
A
x12 x13
x14
✲
x
µA (x)
1
✻
0
x21
✉
✉
❡
❡
x22
✲
x
Abb.15
Zu y1 gehören die Urbildpunkte x11 , x12 , x13 und x14 . Davon liegen x12 und
x13 in A, so daß y1 nach Konstruktion (2.7) zu fˆ(A) gehört. Es gilt
1 = µfˆ(A) (y1 ) =
=
sup{µA (x11 ), µA (x12 ), µA (x13 ), µA (x14 )}
sup µA (x)
x∈R
f (x)=y1
Der Punkt y2 hat die Urbildpunkte x21 und x22 . Beide gehören nicht zu
A, deshalb gilt y2 ∈ fˆ(A). Es folgt
0 = µfˆ(A) (y2 ) =
=
sup{µA (x21 ), µA (x22 )}
sup µA (x)
x∈R
f (x)=y2
17
Schließlich hat y3 überhaupt keinen Urbildpunkt und gehört deshalb nach
2.7 auch nicht zu fˆ(A). Da die Indikatorfunktionen durch 0 nach unten beschränkt sind, vereinbart man
2.8
sup µA (x) := 0
x∈∅
und erhält somit in Übereinstimmung mit den vorangehenden Fällen
0 = µfˆ(A) (y3 ) = sup µA (x)
x∈R
f (x)=y3
Man kann beweisen, daß generell für jedes A ⊆ R gilt
µfˆ(A) (y) = sup µA (x) für alle y ∈ R
x∈R
f (x)=y
und überträgt nun dieses Rezept in die F-Welt, indem man von den Indikatorfunktionen scharfer Mengen in R zu den Zugehörigkeitsfunktionen von
F-Mengen in R übergeht:
2.9
Satz und Def inition:
Es sei
f :R→R
eine Abbildung. Dann ist zu jeder F-Menge A ∈ F P(R) mit der Zugehörigkeitsfunktion
µA : R → [0, 1]
durch die Festsetzung
2.9.1
µfˆ(A) (y) :=
=
sup µA (x)
für alle y ∈ R
x∈R
f (x)=y
sup
x∈f −1 ({y})
µA (x) 9
die Zugehörigkeitsfunktion einer F-Menge fˆ(A) ∈ F P(R) und somit eine
Abbildung
9
Man definiert in der klassischen Mengenlehre für beliebiges B ⊆ R
f −1 (B) := {x ∈ R | f (x) ∈ B}, hat also f −1 ({y}) = {x ∈ R | f (x) = y}.
18
fˆ : F P(R) → F P(R)
gegeben. Man sagt, die Abbildung f sei nach dem Erweiterungsprinzip von Zadeh
zur Abbildung fˆ erweitert worden. 10
2.10
Beispiel:
Gegeben seien die Funktion f : R → R mit
f (x) = (x − 3)2 für alle x ∈ R
und die F-Menge A ∈ F P(R) mit

0, 2 : x = 2



0, 8 : x = 4
yA (x) =
0, 6 : x = 5



0 : sonst.
Es sei fˆ : F P(R) → F P(R) die nach dem Erweiterungsprinzip von Zadeh
aus f hervorgegangene Abbildung. Für das Bild fˆ(A) erhält man nach 2.9.1
µfˆ(A) (1) =
sup µA (x)
x∈R
1=(x−3)2
= sup{µA (2), µA (4)}
= sup{0, 2; 0, 8}
= 0, 8
µfˆ(A) (4) =
sup µA (x)
x∈R
4=(x−3)2
=
=
=
µfˆ(A) (y) =
sup{µA (1), µA (5)}
sup{0; 0, 6}
0, 6
0 für alle y ∈ {1, 4}.
Die Graphen der Funktion f und der Zugehörigkeitsfunktionen µA und µfˆ(A)
sind in der folgenden Abbildung dargestellt:
10
Diese Überlegungen lassen sich ohne Probleme auf den allgemeineren Fall übertragen,
daß man von Abbildungen f : Ω → Γ mit beliebigen Mengen Ω = ∅ und Γ = ∅ ausgeht.
19
y
y
✻
✻
10
✉
µfˆ(A) (y)
✉
✛
1
❡
❡1
5
1
✲
0
0
x
1
5
µ (x)
1
✻A
✉
✉
✉
❡
0
1
❡
3
❡
5
Abb.16
In der schließenden Statistik arbeitet man i.a. nicht mit Stichproben vom
Umfang n = 1, sondern zieht umfangreicheres Datenmaterial heran. Dementsprechend sind die Stichprobenrealisationen vielfach nicht Elemente x ∈ R,
sondern (x1 , . . . , xn ) ∈ Rn := R × · · · × R mit n > 1. Folglich reicht
beim Übergang von der C-Welt in die F-Welt das Erweiterungsprinzip in
der zuvor erarbeiteten Form, als Abbildungen f : R → R zu Abbildungen fˆ : F P(R) − F P(R) erweitert werden, nicht aus. Es liegt nahe, jetzt
von Abbildungen f : Rn → R auszugehen. Der Übergang zu Abbildungen
fˆ : F P(Rn ) − F P(R) ist durch direkte Übertragung der Formel 2.9.1 unproblematisch, wie auch in Fußnote 10 angedeutet wurde. Dieses Vorgehen paßt
aber nicht zu den im folgenden zu behandelnden Anwendungen der klassischen statistischen Entscheidungsverfahren auf Stichprobenrealisationen, die
aus unscharfen Einzelbeobachtungen zusammengesetzt sind:
20
✲
x
Die Elemente der Menge F P(Rn ) sind unscharfe Teilungen des Rn , unscharfe Stichprobenrealisationen sind aber i.a. aus unscharfen Einzelergebnissen
A1 ∈ F P(R), . . . , An ∈ F P(R) zusammengesetzte n-Tupel, das heißt man
hat unscharfe Stichprobenrealisationen der Form
(A1 , . . . , An ) ∈ F P(R) × · · · × F P(R) = [F P(R)]n
vorliegen. Wegen
F P(R) × · · · × F P(R) = F P(R)n für n > 1
ist das ‘Rezept‘ 2.9.1 nicht direkt übertragbar. Die Motivation einer geeigneten Modifikation von 2.9.1 ist ohne Schwierigkeit möglich und sollte z.B. in
einer einschlägigen Vorlesung auch nicht fehlen; da sie aber für die hier verfolgten Ziele zu aufwendig ist, soll gleich Zadehs Ergebnis angegeben werden:
2.11
Satz und Def inition:
Es seien
f : Rn → R
eine Abbildung und n ∈ N. Dann ist zu jedem n-Tupel
(A1 , . . . , An ) ∈ F P(R) × · · · × F P(R) = [F P(R)]n
durch die Festsetzung
µfˆ(A1 , . . . , An )(y) :=
sup
(x1 ,... ,xn )∈Rn
f (x1 ,... ,xn )=y
min{µA1 (x1 ), . . . , µAn (xn )}
die Zugehörigkeitsfunktion einer F-Menge
fˆ : (A1 , ..., An ) ∈ F P(R)
gegeben. Man sagt, f sei nach dem Erweiterungsprinzip von Zadeh zur Abbildung
fˆ : [F P(R)]n → F P(R)
erweitert worden.11
Man sieht sofort, daß man für n = 1 wieder die Formeln aus 2.9 erhält,
11
Diese Überlegungen lassen sich ohne Probleme auf den allgemeineren Fall übertragen,
daß man von Abbildungen f : Ω1 × · · · × Ωn → Γ mit beliebigen Mengen Ωi = ∅(i =
1, ..., n) und Γ = ∅ ausgeht.
21
so daß man in 2.9 und 2.11 ohne weitere Unterscheidung von dem Erweiterungsprinzip von Zadeh sprechen kann.
Mit Hilfe des Erweiterungsprinzips lassen sich insbesondere die Rechenoperationen der klassischen Mathematik in die F-Welt übertragen. Erweitert man
z.B. die Abbildung
f :R×R→R
mit
z := f (x, y) := x + y
für alle (x, y) ∈ R × R
zu der entsprechenden Abbildung
fˆ : F P(R) × F P(R) → F P(R),
so kann man für zwei F-Zahlen A, B ∈ F P(R) ihre Summe
A ❢B := fˆ(A, B)
einführen. Die Erweiterung einer Abbildung
ga : R → R a ∈ R fest
mit
y := ga (x) = ax für alle x ∈ R
zu der entsprechenden Abbildung
ĝa : F P(R) → F P(R)
führt zu der skalaren Multiplikation einer F-Zahl A ∈ F P(R) mit einer reellen
Zahl a ∈ R durch die Definition
p A := ĝ (A).
a ❢
a
Entsprechend überträgt man auch andere Rechenoperationen. Die Anwendung des Erweiterungsprinzips kann im konkreten Fall sehr mühselig sein.
Ein sehr einfaches Ergebnis für F-Dreieckszahlen ist ohne Beweis 12 im folgenden Satz angegeben:
12
Einen Beweis findet man z.B. bei Rommelfanger 1994, S. 41.
22
2.12
Satz:
Es seien A1 = (M1 , l1 , r1 ) und A2 = (M2 , l2 , r2 ) F-Dreieckszahlen aus F P(R)
und a ∈ R eine reelle Zahl. Durch Anwendung des Erweiterungsprinzips
erhält man als Summe A1 ❢A2 die F-Dreieckszahl
2.12.1
A1 ❢A2 := (M1 + M2 , l1 + l2 , r1 + r2 ),
p A die F-Dreieckszahl
und als skalares Produkt a ❢
1
2.12.2
a p❢A1 :=
(aM1 , al1 , ar1 ) : a ≥ 0
(aM1 , −ar1 , −al1 ) : a ≤ 0.
In Vereinbarung 2.6 werden die reellen Zahlen als Spezialfälle unter den Begriff der F-Dreickszahlen subsumiert. Man prüft leicht nach, daß 2.12.1 und
2.12.2 im Fall reeller Zahlen zu den in der klassischen Mathematik gewohnten
Ergebnissen führt. Multiplikation und Division von F-Dreieckszahlen werden
hier nicht behandelt, da sie in den folgenden Abschnitten nicht benötigt werden.
Die Operationen aus Satz 2.12 werden in dem folgenden Beispiel angewendet:
2.13
Beispiel:
Gegeben seien die F-Dreieckszahlen
A1 = (1, 2, 4),
A2 = (6, 4, 3)
und die reellen Zahlen a = 2, b = −2.
Dann gilt
A1 ❢A2 = (7, 6, 7)
p A = (2, 4, 8)
a ❢
1
p A = (−2, 8, 4)
b ❢
1
23
✻
µ(x)
1
A2
A1 ❢A2
A1
✲
-10
x
0
-5
5
10
15
✻
µ(x)
p A
−2 ❢
1
p A
2 ❢
1
1
✲
-10
-5
x
0
5
10
15
Abb.17
In der Zeichnung werden die waagerechten Teile der Funktionsgraphen, die
mit der Abszisse zusammenfallen, fortgelassen, um die Übersichtlichkeit zu
verbessern. Es ist deutlich zu sehen, wie sich die Unschärfe bei der Addition unscharfer Zahlen und bei der skalaren Multiplikation mit Werten, die
betragsmäßig größer als 1 sind, vergrößert.
24
3
Schätzen und Testen mit unscharfen Stichproben
In diesem Abschnitt werden die drei grundlegenden Entscheidungsverfahren
der Statistik - Parameterpunktschätzungen, (nichtrandomisierte) Alternativtests, (Konfidenz)bereichsschätzungen - jeweils an einem einfachen Beispiel
rekapituliert und die Konsequenzen unscharfer Stichprobenrealisationen demonstriert:
Von einer Zufallsvariablen Y, die einen interessierenden Umweltausschnitt
beschreibt, werde vorausgesetzt, daß sie einer Normalverteilung mit bekannter Varianz Var Y = σ02 aber unbekanntem Erwartungswert EY = µ genügt,
also N (µ, σ02 )-verteilt ist. Weiterhin sei X = (X1 , ..., Xn ) eine einfache Stichprobe vom Umfang n ∈ N zu Y , d.h. die Xi sollen identisch wie Y verteilt
sein und stochastisch unabhängig ( Stichprobe mit Zurücklegen “).
”
In der klassischen Statistik geht man davon aus, daß die Realisierungen xi
der Stichprobenvariablen Xi präzise beobachtet werden können. Diese Voraussetzung soll im folgenden in der Weise abgeschwächt werden, daß man
statt der reellen Zahlen xi nur Fuzzy-Zahlen Bi (i = 1, ..., n) wahrnimmt. Mit
Hilfe des Zadehschen Erweiterungsprinzips werden anschließend die aus den
unscharfen Daten resultierenden unschafen Ergebnisse der statistischen Entscheidungsfunktionen ermittelt. 13
In den folgenden drei Abschnitten werde von folgender Situation ausgegangen: Gegeben seien die o.g. Voraussetzungen mit σ02 = 4 und n = 5, weiterhin
werde zunächst als Beobachtungsergebnis protokolliert
x = (x1 , ..., x5 ) = (6, 1, 5, 7, 2),
eine Überprüfung des Beobachtungsvorgangs gebe dann jedoch Anlaß zu der
Vermutung, daß die Beobachtungsergebnisse etwas nach unten verzerrt seien, aber auch eine geringe Überschätzung nicht ganz ausgeschlossen werden
könne: Die näheren Umstände sollen eine Darstellung der einzelnen Ergebnisse als F-Dreieckszahlen mit einer linken Spreizung l = 3 und einer rechten
Spreizung r = 1 als angemessen erscheinen lassen:
B = (B1 , ..., B5 ) mit Bi = (xi , 3, 1) für i = 1, ..., 5.
13
vgl. dazu Viertl 1992, S. 124 f. und 1996, S. 101 f., Frühwirth-Schnatter 1992.
25
µ (u)
✻ Bi
B2
1
B5
B3
B1
B4
✲
-1
0
1
5
Abb.18
3.1
14
Parameterpunktschätzungen
Unter den getroffenen klassischen Annahmen ist der Stichprobenmittelwert
1
Xi =: X
δ(X) :=
n i=1
n
eine sehr gute Punktschätzfunktion für das unbekannte µ, eine Stichprobenrealisation x = (x1 , ..., xn ) liefert den Schätzwert
1
δ(x) =
xi =: x,
n i=1
n
und man erhält folglich mit den beispielhaft angenommenen Zahlenwerten
1
(6 + 1 + 5 + 7 + 2)
5
= 4, 2 = x.
δ(x1 , ..., x5 ) =
Dabei ist zu beachten: Auch wenn von scharfen Beobachtungswerten xi ausgegangen wird, kann man nicht schließen, daß δ(x1 , ..., x5 ) = 4, 2 der wahre
Erwartungswert von Y ist; man muß im Gegenteil unter den gegebenen Voraussetzungen davon ausgehen, daß der wahre Wert bei jeder Punktschätzung
mit Wahrscheinlichkeit 1 verfehlt wird. Dies ist eine Konsequenz der speziellen hier gegebenen (stochastischen) Unsicherheit.
14
Da x als übliches Kürzel für die Stichprobenrealisation schon vergeben ist, sei für die
unabhängige Variable hier der Buchstabe u gewählt.
26
10
u
Wird nun zusätzlich die durch die Unschärfe der Beobachtungen gegebene
(nichtstochastische) Unschärfe berücksichtigt, erhält man mit den in Abschnitt 2 hergeleiteten Rechenregeln für F-Dreieckszahlen
1
δ̂(B1 , ..., B5 ) = (B1 ❢· · · ❢B5 ).
5
Die Summe
B1 ❢· · · ❢B5 =: B0 = (MB0 , lB0 , rB0 )
ist wieder eine F-Dreieckszahl, nach 2.12.1 berechnet man
(MB0 , lB0 , rB0 = (M1 + · · · + M5 , l1 + · · · + l5 , r1 + · · · + r5 )
= (21, 15, 5).
Wegen
1
5
> 0 folgt nach 2.12.2 schließlich
1
B0
5
= (4, 2; 3; 1)
=: (MB , lB , rB ).
B := δ̂(B1 , ..., B5 ) =
In der folgenden Abbildung ist das unscharfe Ergebnis der Punktschätzung
dargestellt:
µ (u)
✻B
1
✲
-1
0
1
5
u
Abb.19
Oft stellt die Punktschätzung nur einen Zwischenschritt bei der Lösung eines
umfangreicheren Anwendungsproblems dar, man kann gezwungen sein, die FSchätzung durch einen Zahlenwert zu ersetzen, man spricht von Defuzzifizierung.
Ein zunächst naheliegendes Verfahren ist es, den Gipfelpunkt
1
MB = (M1 + · · · + M5 ) = 4, 2
5
27
des unscharfen Schätzergebnisses als Approximation für das unbekannte µ
zu wählen, also in unserer Beispielsituation die in der Stichprobe gegebene
Unschärfe einfach zu vergessen. Aber gerade hier scheint dieser Weg wenig plausibel: Die Schätzung B hat eine stark asymmetrische Zugehörigkeitsfunktion, die Wahl von MB berücksichtigt nicht die durch lB rB
angedeutete Tendenz, daß die zur (stochastischen) Unsicherheit hinzukommende (nichtstochastische) Unschärfe Werte kleiner als MB eher möglich
erscheinen läßt als größere Werte. Dieser Mangel wird beispielsweise durch
die sog. Schwerpunktmethode vermieden, bei der man den Abszissenwert us
des Schwerpunktes der Fläche zwischen Abszisse und Zugehörigkeitsfunktion
als scharfen Ersatzwert für B nimmt:
µ (u)
✻B
1
✲
-1
0
uS
1
MB
5
u
Abb.20
Zur Schreibvereinfachung sei
µ(.) := µB (.)
gesetzt. Man erhält als u-Koordinate des Flächenschwerpunktes
∞
us =
uµ(u)du
−∞
∞
15
µ(u)du
−∞
Die Auswertung (siehe Anhang Satz 6.3) ergibt im vorliegenden Beispiel
us = 4, 2 +
1−3
= 4, 2 − 0, 6 ≈ 3, 53
3
d.h. hier bewirken die Berücksichtigung der nichtstochastischen Unschärfe
und die Defuzzifizierung mit Hilfe der Schwerpunktmethode eine gegenüber
15
Der Nenner des Quotienten sei positiv.
28
der klassischen Schätzung x = 4, 2 deutliche Korrektur.
Dieses einfache Beispiel stützt folgende allgemeine Empfehlung:
a) Man versuche die Zuverlässigkeit der gegebenen Daten zu beurteilen,
b) ggf. beschreibe man die nichtstochastische Unschärfe der Daten durch
geeignete (subjektiv festzulegende) Zugehörigkeitsfunktionen,
c) man berechne die unscharfe Schätzung und defuzzifiziere ggf.,
d) man kontrolliere evtl. die Sensitivität des Ergebnisses gegenüber Variationen der Zugehörigkeitsfunktion.
Zu Beginn dieses Abschnittes wurde der F-Schätzwert B = 15 (B1 ❢· · · ❢B5 )
für µ aus der C-Welt-Schätzung x = 15 (x1 + · · · + x5 ) = δ(x1 , ..., x5 ) hergeleitet, indem einfach in dieser Formel die scharfen Beobachtungswerte xi
durch die F-Beobachtungen Bi (i = 1, ..., 5) ersetzt wurden; die Zugehörigkeitsfunktion µB war wegen der hier verwendeten F-Dreieckszahlen leicht zu
bestimmen. Natürlich kann man die C-Schätzfunktion δ : R5 → R auch mit
Hilfe des Erweiterungsprinzips übertragen, man erhält die F-Schätzfunktion δ̂ : [F P(R)]5 → F P(R), die Stichprobe B = (B1 , ..., B5 ) liefert die FSchätzung δ̂(B) mit
3.1.1
µδ̂(B) (u) =
sup
(x1 ,...,x5 )∈R5
x=u
min{µB1 (u), ..., µB5 (u)} für alle u ∈ R.
Man könnte direkt nachrechnen, daß beide Wege dasselbe Ergebnis haben.
Weiterführender ist aber, sich allgemein klar zu machen, daß die Übereinstimmung auf mehrfacher Anwendung des Satzes 6.1 (und Bemerkung 6.2)
aus dem Anhang beruht.
29
3.2
Alternativtests
Gegeben seien die auf Seite 25 geschilderten Voraussetzungen. Mit einem
Signifikanzniveau α = 0, 05 soll für µ0 = 2 die
Nullhypothese H0 : µ = µ0
gegen die
Gegenhypothese H1 : µ = µ0
getestet werden. Auf der Basis einer einfachen Stichprobe X = (X1 , ..., Xn )
mit der Realisation x = (x1 , ..., xn ) ∈ Rn wird für die Teststatistik
T (X) =
X − µ0 √
n
σ0
ihre Realisation
x − µ0 √
n
σ0
berechnet. Für die N(0,1)-Verteilung (Gaußverteilung) ist das 0,975-Quantil
λ0,975 = 1, 96. Ein gleichmäßig bester unverzerrter Test für die o.g. Hypothesen zum Niveau α ist dann durch die folgende Entscheidungsvorschrift
gegeben:
H0 annehmen, falls − λ0,975 ≤ T (x) ≤ λ0,975 ,
T (x) =
H1 annehmen in den übrigen Fällen.
Mit dem beispielhaft gewählten Stichprobenbefund x = (x1 , ...x5 ) = (6, 1, 5, 7, 2)
folgt
4, 2 − 2
2, 24 = 2, 46 > 1, 96 = λ0,975 ,
T (x) =
2
H0 wird abgelehnt, der wahre Erwartungwert µ ist signifikant von dem hypothetischen Wert µ0 = 2 verschieden. Ehe die Auswertung von zusätzlicher
nichtstochastischer Imperfektion des empirischen Befundes analysiert wird,
soll zunächst die formale Struktur des geschilderten Alternativtests genauer
dargestellt werden:
Durch die Teststatistik ist eine Abbildung
T : Rn → R
des Stichprobenraumes X = Rn in die Menge der reellen Zahlen R gegeben,
in der zwei Mengen
A∗ = [−λ0,975 , λ0,975 ]
und
K ∗ =] − ∞, −λ0,975 [∪]λ0,975 , ∞[
30
ausgezeichnet sind; T (x) ∈ A∗ führt zur Annahme von H0 und T (x) ∈ K ∗
zur Annahme von H1 .
Kürzt man die Entscheidung Annahme von H0 “ mit d0 und Annahme
”
”
von H1 “mit d1 ab, kann man eine weitere Abbildung
δ ∗ : R → D := {d0 , d1 }
definieren mit
∗
δ (t) =
Die Verknüpfung
: t ∈ A∗
: t ∈ K∗
d0
d1
δ := δ ∗ ◦ T
wird als Alternativtest für H0 gegen H1 bezeichnet, D als sein Entscheidungsraum,
A := {(x1 , ..., xn ) ∈ Rn | δ(x1 , ..., xn ) = d0 }
als sein Annahmebereich und
K := {(x1 , ..., xn ) ∈ Rn | δ(x1 , ..., xn ) = d1 }
als sein kritischer Bereich oder Verwerfungsbereich. Es gilt
d0 : x ∈ A
δ(x) =
d1 : x ∈ K
Der Zusammenhang zwischen T, δ ∗ und δ ist in der folgenden Abbildung veranschaulicht.
δ
Rn
T
✇
R
Abb.21
31
✲ {d0 , d1 } = D
✼
Nun werde von der F-Stichprobenrealisation B = (B1 , ..., B5 ) ausgegangen.
Erweitert man die Abbildung
T : R5 → R
mit
x − µ0 √
5 für alle (x1 , ..., x5 ) ∈ R5
σ0
nach dem Erweiterungsprinzip zu der Abbildung
T (x1 , ..., x5 ) =
T̂ : [F P(R)]5 → F P(R),
erhält man für B = (B1 , ..., B5 ) mit Bi = (xi ; 3, 1) und i=1,...,5
B − µ0 √
5
σ0
(4, 2; 3; 1) − (2; 0, 0)
≈
2, 24
2
= (2, 46; 3, 36; 1, 12) ∈ F P(R),
T̂ (B1 , ..., B5 ) =
diese F-Zahl ist mit den Schwellenwerten −λ0,975 und λ0,975 in der folgenden
Graphik dargestellt.
µ
✻ T̂ (B)
(u)
1
0,86
✲
2
-1
0
MT̂ (B)
1 us
−λ0,975
u
5
λ0,975
Abb.22
Defuzzifizierung mit Hilfe des Gipfelpunktes führt wie in der C-Welt zur Ablehnung von H0 wegen MT̂ (B) = 2, 46 > 1, 96 = λ0,975 . Allerdings weist die
stark asymmetrische Zugehörigkeitsfunktion auf erhebliches Gewicht “links
”
von λ0,975 hin, Zweifel an der gewonnenen Entscheidung scheinen nicht unberechtigt. Eine Defuzzifizierung mit Hilfe der Schwerpunktmethode (siehe
Anhang Satz 6.3) liefert
us = 2, 46 +
1, 12 − 3, 36
= 1, 71
3
32
d.h.
−λ0,975 = −1, 96 ≤ us = 1, 71 ≤ 1, 96 = λ0,975 .
Damit wird jetzt die Nullhypothese H0 akzeptiert. Man sieht, daß die Berücksichtigung der nichtstochastischen Imperfektion zumindest Zweifel an der
Stringenz der in der C-Welt getroffenen Entscheidung weckt.
Deutlicher wird die Problematik noch, wenn auch die Abbildung
δ ∗ : R → D = {d0 , d1 }
mit Hilfe des Erweiterungsprinzips zu einer Abbildung
δ̂ ∗ : F P(R) → F P(D)
erweitert wird. Für jedes H ∈ F P(R) erhält man als Bild δ̂ ∗ (H) ∈ F P(D)
mit der Zugehörigkeitsfunktion
µδ̂∗ (H) (d0 ) =
(u)
sup µH
u∈R
δ ∗ (u)=d0
(u)
= sup µH
u∈A∗
µδ̂∗ (H) (d1 ) =
(u)
sup µH .
u∈K ∗
Man erhält (vgl. Anhang Beispiel 6.4)
µδ̂∗ (T̂ (B)) (d0 ) = 0, 86
µδ̂∗ (T̂ (B)) (d1 ) = 1.
Hier wird d1 zwar mit dem Akzeptanzgrad 1 bewertet, aber d0 wird der
Akzeptanzgrad 0,86 zugebilligt, man wird in der Praxis die Ablehnung von
H0 nicht mehr als so klar wie durch das Niveau α = 0, 05 suggeriert ansehen,
ggf. weitere Stichproben ziehen und dabei die Unschärfe der Messungen zu
verringern versuchen. Es überlagern sich zwei Fehlermöglichkeiten: Einmal
durch die Stochastik bedingt, dann auch durch die Ungenauigkeit der Daten.
Die Fuzzy- Entscheidung ist gegeben durch die F-Menge
{(d0 ; 0, 86), (d1 ; 1)} ∈ F P(D)
in D = {d0 , d1 }.
33
3.3
Konf idenzbereichsschätzungen
Es werde wieder von den auf Seite 25 gegebenen Voraussetzungen ausgegangen. Der in 3.1 verwendete Schätzer δ(X) = n1 ΣXi = X liefert zwar
bei gegebener Stichprobenrealisation x = (x1 , ..., xn ) einen präzisen Schätzwert x = n1 Σxi für das unbekannte µ und hat unter den getroffenen Annahmen auch sehr nützliche statistische Eigenschaften (Erwartungstreue,
Effizienz etc.), trifft aber mit Wahrscheinlichkeit 1 daneben “. Man ergänzt
”
Punktschätzungen deshalb durch Schätzverfahren, die mit vorzugebender Sicherheitswahrscheinlichkeit den unbekannten wahren Parameterwert überdecken, muß dafür aber einen Verlust an Präzision in Kauf nehmen; diese
Konfidenzbereichsschätzfunktionen liefern i.a. ein Kontinuum von Parameterwerten als Näherungswerte.
Es sei α ∈]0, 1[ eine kleine Zahl. In unserem Beispiel ist eine Konfidenzbereichsschätzung
für µ ∈ Θ = R durch die Abbildung
δ : Rn → P(Θ)
gegeben mit
3.3.1
σ0
σ0
δ(x1 , ..., xn ) = x − √ λ1− α2 , x + √ λ1− α2 ,
n
n
man bezeichnet diesen Schätzbereich speziell als ein (1−α)- Konfidenzintervall.
Für die Beispielsdaten erhält man mit n = 5, x = (x1 , ..., x5 ) = (6, 1, 5, 7, 2), α =
0, 05 und λ1− α2 = λ0,975 = 1, 96 das Konfidenzintervall
δ(x) = [4, 2 − 1, 75; 4, 2 + 1, 75]
= [2, 45; 5, 95].
Man beachte, daß die gewählte Bereichsschätzfunktion mit 95 % Sicherheitswahrscheinlichkeit ein Konfidenzintervall liefert, das den wahren unbekannten Wert µ überdeckt, aber natürlich für den konkreten Schätzbereich mit
Sicherheit entweder nur µ ∈ δ(x) oder µ ∈
/ δ(R) gilt.
Nun soll zusätzlich die nichtstochastische Imperfektion durch die F-Stichprobenrealisation
B = (B1 , ..., B5 ) mit Bi = (xi , 3, 1) berücksichtigt werden.
Bereichsschätzfunktionen gelten bereits in der C-Welt als die unhandlichsten
der drei klassichen Entscheidungsverfahren, da ihr Entscheidungsraum16 D
16
vgl. S. 38
34
die Potenzmenge einer i.a. selbst schon überabzählbaren Menge ist - in unserem Fall hat man D = P(Θ) mit Θ = R -, während für die zuvor behandelte Punktschätzung D = Θ = R und für den Alternativtest sogar
D = {d0 , d1 } gilt. Vor diesem Hintergrund ist es nicht überraschend, daß bei
Bereichsschätzungen der Übergang in die F-Welt mühselig sein wird.
Durch das Erweiterungsprinzip wird die Konfidenzbereichsschätzung
δ : Rn → P(Θ)
überführt in die Abbildung
δ̂ : [F P(R)]n → F P(P(Θ)),
d.h. einer F-Stichprobe B = (B1 , ..., Bn ) ∈ [F P(R)]n wird eine F-Menge
δ̂(B) ∈ F P(P(Θ)) zugeordnet, deren Zugehörigkeitsfunktion µδ̂(B) für jede
Menge H ∈ P(Θ) einen Zugehörigkeitswert µδ̂(B) (H) festlegt. Dieser Zugehörigkeitswert gibt für jedes H ∈ P(Θ) den Grad an, mit dem es aufgrund
des unscharfen Stichprobenbefundes als (1 − α)-Konfidenzschätzbereich in
Frage kommt. Nach Satz und Definition 2.11 erhält man
3.3.2
µδ̂(B) (H) =
sup
(x1 ,...,xn )∈Rn
δ(x1 ,...,xn )=H
min{µB1 (x1 ), ..., µBn (xn )} für alle H ∈ P(Θ).
Diese Zugehörigkeitsfunktion soll nun für die Beispielsdaten mit n = 5 und
σ0
√
λ α = 1, 75 numerisch bestimmt werden. Für alle (x1 , ..., x5 ) ∈ R5 gilt
n 1− 2
δ(x1 , ..., x5 ) = [x − 1, 75; x + 1, 75],
die Menge aller derartigen Konfidenzintervalle ist gegeben durch
J := {[h − 1, 75; h + 1, 75] | h ∈ R}.
Da als Bildpunkte der Bereichsschätzung δ nur die Elemente von J auftreten,
folgt für alle H ∈ [P(Θ) − J]
µδ̂(B) (H) =
sup
(x1 ,...,x5 )∈R5
δ(x1 ,...,x5 )=H
min{µB1 (x1 ), ..., µB5 (x5 )}
= sup min{µB1 (x1 ), ..., µB5 (x5 )}
∅
= 0
35
und für alle H ∈ J mit H = [h − 1, 75; h + 1, 75] erhält man
µδ̂(B) (H) =
sup
(x1 ,...,x5 )∈R5
x=h
min{µB1 (x1 ), ..., µB5 (x5 )},
nach 3.1.1 von Seite 29 gilt in diesem Fall weiter
µδ̂(B) (H) = µB (h).
3.3.3
In der folgenden Grafik sind die Zugehörigkeitsfunktion µB (.) und drei Intervalle H = [h−1, 75; h+1, 75] so dargestellt, daß auch ihre Zugehörigkeitswerte
µδ̂(B) (H) = µB (h) abgelesen werden können:
µB (h)
✻
✒
h
✲
h=6
5
✲
1
h = 4, 2
✲
t
h=3
1
✲
0
1
5
10
t
Abb.23
Die zu der Abbildung gehörenden Zahlenwerte sind in der folgenden Tabelle
zusammengestellt
h h-1,75
3
1,25
4,2 2,45
6
4,25
h+1,75 µB (h)
4,75
0,6
5,95
1
7,75
0
36
t
t
Wäre nur stochastische Imperfektion mit dem Stichprobenbefund x = (6,1,5,7,2)
gegeben, so hätte man mit x = h = 4, 2 das einzige Konfidenzintervall
[2, 45; 5, 95] erhalten. Da aber zusätzlich nichtstochastische Imperfektion aufgetreten ist, besteht das Ergebnis aus einer F-Menge in P(Θ), positive Zugehörigkeitswerte weisen nun gewisse Intervalle auf, von denen zwei in der
Zeichnung dargestellt sind. Das Resultat ist nicht unplausibel, aber selbst in
dem einfachen Beispielsfall kompliziert und wenig anschaulich.
Die nachfolgend geschilderte Vorgehensweise ermöglicht - unter Inkaufnahme eines Informationsverlustes - den Übergang von dem schwer zugänglichen
Wertevorrat F P(P(Θ)) der F-Bereichsschätzung δ̂ zu der leichter vorstellbaren Menge F P(Θ).
Für jedes t ∈ Θ wird die maximale Akzeptanz bestimmt, das wahre, unbekannte µ zu sein, indem der maximale Zugehörigkeitswert berechnet wird,
den ein H ∈ P(Θ) mit t ∈ H bzgl. µδ̂(B) aufweist. Durch diese Konstruktionsvorschrift wird eine F-Menge in P(Θ) festgelegt, sie werde als durch
δ̂ in P(Θ) induzierte F-Konfidenzbereichsschätzung bezeichnet, das Symbol
sei G(δ̂(B)). Man hat also
3.3.4
sup µδ̂(B) (H) für alle t ∈ Θ.
µG(δ̂(B)) (t) =
H∈P(Θ)
t∈H
Da im vorliegenden Beispiel alle H ∈ [P(Θ) − J] den Zugehörigkeitswert
µδ̂(B) (H) = 0 haben, folgt weiter mit 3.3.3
µG(δ̂(B)) (t) = sup µδ̂(B) (H) für alle t ∈ Θ
H∈J
t∈H
=
sup
t∈[h−1,75;h+1,75]
=
sup
t−1,75≤h≤t+1,75
µB (h)
µB (h).
Wegen µB (h) = 0 für h ≤ 1, 2 oder h ≥ 5, 2 und µB (h) = 1 für h=4,2 folgt
0 für t ≤ −0, 55 oder t ≥ 6, 95
µG(δ̂(B)) (t) =
1 für
2, 45 ≤ t ≤ 5, 95
Da B eine F-Dreieckszahl ist, erhält man weiter
µB (t + 1, 75) für −0, 55 ≤ t ≤ 2, 45
µG(δ̂(B)) (t) =
µB (t − 1, 75) für 5, 95 ≤ t ≤ 6, 95
Der Graph dieser Zugehörigkeitsfunktion ist in der folgenden Abbildung gegeben:
37
µ
1
✻ G(δ̂(B))
(t)
✲
-1
0
1
5
Abb.24
Hier weisen alle t aus dem C-Konfidenzintervall [2, 45; 5, 95] den Zugehörigkeitsgrad 1 auf, werden also voll als mögliche Kandidaten für das unbekannte,
wahre µ akzeptiert, aber eine Reihe von Werten außerhalb dieses Intervalls
wird nicht strikt verworfen, sondern mit nach außen “abnehmender Akzep”
tanz noch in Erwägung gezogen.
Im nächsten Abschnitt wird auf Seite 42 erläutert, wie mit Hilfe der Gleichung 3.3.4 eine zusätzliche Abbildung G(δ̂)(.) mit
δ̂
G
[F P(R)]n −→ F P(P(Θ)) −→ F P(Θ)
eingeführt wird, um die Struktur der vorangegangenen Überlegungen deutlich
werden zu lassen.
38
t
4
Die formale Struktur statistischer Entscheidungsmodelle mit unscharfen Stichproben
Den zuvor behandelten statistischen Entscheidungsverfahren - Punktschätzungen, Alternativtests, Bereichsschätzungen - liegen die im folgenden dargestellten Bausteine zugrunde:
Eine Zufallsvariable Y : Ω̃ → R mit ganz oder teilweise unbekannter Wahrscheinlichkeitsverteilung QY,ϑ beschreibt den interessierenden Umweltausschnitt; dabei ist ϑ ein unbekannter Parameter aus dem zugehörigen Parameterraum Θ; Ω̃ und R sind Ergebnisräume von Wahrscheinlichkeitrsräumen
(Ω̃, F̃, P̃ ) bzw. (R, B1 , QY,ϑ ).
Eine weitere Zufallsvariable X = (X1 , ..., Xn ) : Ω → Rn mit der Wahrscheinlichkeitsverteilung QX,ϑ modelliert die Stichprobenziehung vom Umfang n zu Y, die entsprechenden Wahrscheinlichkeitsräume sind (Ω, F, P ) und
(Rn , Bn , QX,ϑ ). Liegt für jede Stichprobenrealisation x = (x1 , ..., xn ) ∈ Rn
die statistische Entscheidung δ(x) (Punktschätzung, Testentscheidung bzw.
Schätzbereich) fest, hat man eine Abbildung δ : Rn → D vorliegen, für deren
sog. Entscheidungsraum D gilt
4.1 D = Θ
Parameterpunktschätzung17
4.2 D = {d0 , d1 } Alternativtest18
4.3 D = P(Θ)
Bereichsschätzung17
Der in dieser Arbeit gewählte Zugang zum Gebiet der Statistik mit unscharfen Stichproben geht davon aus, daß nicht die exakte Stichprobenrealisation x = (x1 , ..., xn ) ∈ Rn beobachtet wird, sondern nur ein unscharfes Bild
L(x) ∈ [F P(R)]n . Die somit vorliegende Abbildung
L : Rn → [F P(R)]n
soll hier als Fuzziness-erzeugende-Funktion (FE-Funktion) bezeichnet werden.
Natürlich wird man bei einem unscharfen Stichprobenbefund zunächst nur
mit einer unscharfen statistischen Entscheidung rechnen können, die ursprüngliche statistische Entscheidungsfunktion δ : Rn → D wird mit Hilfe
des Erweiterungsprinzips von Zadeh zu einer Entscheidungsfunktion
17
In zahlreichen Anwendungsfällen interessiert man sich nicht für ϑ ∈ Θ selbst, sondern
für eine transformierte Größe γ(ϑ).
Man hat dann in 4.1 D = γ(Θ) und in 4.3 D = P(γ(Θ)).
18
Zu d0 , d1 siehe Abschnitt 3.2.
39
δ̂ : [F P(R)]n → F P(D) verallgemeinert. Im folgenden Diagramm sind die
Zusammenhänge noch einmal übersichtlich dargestellt:
(Ω̃, F̃, P̃ )
(R, B1 , QY,ϑ )
Y
Ω̃ −−−→
R
(Rn , Bn , QX,ϑ )
(Ω, F, P )
Ω
X
L
Rn


δ
−−−→
−−−→ [F P(R)]n


δ̂ F P(D)
D
C-Welt
(stochastische Imperfektion,
Unsicherheit)
F-Welt
(nichtstochastische Imperfektion,
Fuzziness, Unschärfe)
Durch die Verknüpfung L o X überlagern sich beide Arten der Imperfektion
Abb.25
Liegt eine Punktschätzung mit D = Θ vor, so wird man, wie in Abschnitt
3.1 geschildert, das unscharfe Schätzergebnis δ̂(B1 , ..., Bn ) ∈ F P(Θ) ggf. noch
defuzzifizieren zu einem scharfen Schätzwert M (δ̂(B1 , ..., Bn )), das obige Diagramm ist in diesem Fall um eine Abbildung M : F P(Θ) → Θ, welche die
gewählte Defuzzifizierungsmethode beschreibt, zu erweitern:
L
−→ Rn −→ [F P(R)]n




δ
δ̂ F P(Θ)


M
Θ
Θ
Abb.26
Ist man im Fall des Alternativtests gezwungen, eine scharfe Entscheidung
zu treffen, wird man die Entscheidung δ(x) wählen und δ̂(B) unberücksichtigt lassen, die Defuzzifizierung durch eine Abbildung M erübrigt sich. Bei
Alternativtests wird aber ein anderes Problem deutlich: Wie in Abschnitt
3.2 geschildert, konstruiert man i.a. in der C-Welt nicht direkt die gesuchte
40
Entscheidungsfunktion δ : Rn → D = {d0 , d1 }, sondern transformiert den
Ergebnisraum Rn mit einer Abbildung ( Statistik “) T : Rn → R in einen
”
niedrigdimensionalen Raum, hier die Menge R. Erst in einem zweiten Schritt
wird durch die Abbildung δ ∗ : R → D auf der Basis des transformierten
Stichprobenbefundes T (x) die Entscheidung δ ∗ (T (x)) = (δ ∗ ◦ T )(x) =: δ(x)
festgelegt, der Zusammenhang ist durch die folgende Abbildung veranschaulicht:
δ
✲ D = {d0 , d1 }
Rn
✼
T
❘
δ∗
R
Abb.27
Folglich treten auch beim Übergang in die F-Welt drei entsprechende Funktionen T̂ , δ̂ ∗ und δ̂ auf. In der C-Welt wird definiert δ := δ ∗ ◦ T. Wendet man
das Erweiterungsprinzip auf die Abbildungen T, δ ∗ und δ an, erhebt sich die
Frage, ob der obige Zusammenhang gültig bleibt, d.h. ob δ̂ = δ̂ ∗ ◦ T̂ gilt, wie
in der folgenden Abbildung dargestellt:
δ̂
[FP(R)]n
T̂
✲ FP(D)
✼
δ̂ ∗
❘
FP(R)
Abb.28
Der anschließende Satz hält die positive Antwort in etwas allgemeinerer Form
fest, sein Beweis ist im Anhang auf den Seiten 45 f. gegeben.
4.1
Satz (Anhang Satz 6.1):
Es seien Ω = ∅, M = ∅, Λ = ∅ C-Mengen und
f :Ω→Γ
g:Γ→Λ
g◦f :Ω→Λ
41
Abbildungen. Dann gilt für die nach dem Erweiterungsprinzip von Zadeh
ermittelten Abbildungen
fˆ : F P(Ω) → F P(Γ)
ĝ : F P(Γ) → F P(Λ)
(g ◦ f ) : F P(Ω) → f P(Λ)
der Zusammenhang
(g
◦ f ) = ĝ ◦ fˆ,
d.h. es ist gleichgültig, ob man Abbildungen zunächst in der C-Welt verknüpft
und dann das Ergebnis in die F-Welt erweitert oder erst in die F-Welt übergeht und dort die entsprechenden Erweiterungen verknüpft.
Es sei daran erinnert, daß auf der Anwendung dieses Satzes auch das in
Abschnitt 3.1 Parameterpuntschätzungen “geschilderte Verfahren beruht,
”
n
xi zu
durch Austausch der xi gegen die Bi von der C-Welt-Formel x = n1
i=1
der entsprechenden F-Welt-Schätzung zu gelangen.
Zum Schluß dieses Abschnitts soll auf die Modellstruktur bei Bereichsschätzungen eingegangen werden:
In 3.3 wurde dargestellt, daß die C-Welt Bereichsschätzung δ : Rn → P(Θ) in
der F-Welt in die Abbildung δ̂ : [F P(R)]n → F P(P(Θ)) mit einem sehr unhandlichen Wertevorrat übergeht. Deshalb wurde in 3.3 dem F-Konfidenzbereich
δ̂(B) ∈ F P(P(Θ)) in Gleichung 3.3.4 ein induzierter F-Konfidenzbereich
G(δ̂(B)) ∈ F P(Ω) zugeordnet. Diese Zuordnung kann man für jede F-Menge
δ̂(B) vornehmen. Setzt man für alle F-Mengen aus F P(P(Θ)) − δ̂([F P(R)]n )
als Bildpunkt z.B. die leere Menge fest, hat man eine Abbildung
G : F P(P(Θ)) → F P(Θ) definiert, das folgende Diagramm veranschaulicht
den Zusammenhang:
−→
L
Rn −→


δ
P(Θ)
[F P(R)]n


δ̂ F P(P(Θ))


G
F P(Θ)
Abb.29
Es ist zu beachten, daß die Abbildung G nicht mit Hilfe des Zadehschen
Erweiterungsprinzips hergeleitet wird, also keine Entsprechung in der C-Welt
hat.
42
5
Zusammenfassung und Ergänzungen
Wir beschreiben und analysieren die Realität mit Hilfe von Modellen und
Theorien. Die Informationen über die Realität sind mehr oder weniger unscharf. Oft wird man diese Unschärfe wegen des ohnehin nur approximativen Charakters unserer Überlegungen vernachlässigen können. Je genauer
wir aber den uns interessierenden Umweltausschnitt darstellen, desto größere
Bedeutung kommt der Unschärfe der Daten zu, desto wichtiger kann es sein,
diese Unschärfe explizit in Rechnung zu stellen.
In den vorausgehenden Abschnitten wurde zunächst ein interessierender Umweltausschnitt durch ein klassisches wahrscheinlichkeitstheoretisch- statistisches Modell dargestellt und dann in einem zweiten Schritt die Auswirkung einer zusätzlichen nichtstochastischen Imperfektion der Zufallsstichprobe analysiert. Durch die Hintereinanderschaltung von C-Welt und F-Welt ist
es möglich, die Güte der angewendeten statistischen Entscheidungsverfahren
im Rahmen der klassischen Theorie zu beurteilen. Dieses Vorgehen ist relativ einfach nachzuvollziehen, kann aber nur vorläufigen Charakter haben: Es
liegt auf der Hand, in einem nächsten Schritt direkt die zusammengesetzte
Funktion L ◦ X aus der nachfolgenden Abbildung
X
L
Ω −→ Rn −→ [F P(R)]n
L◦X
Abb.30
zu betrachten und sie durch eine geeignete Erweiterung des Modells als FZufallsvariable über dem Wahrscheinlichkeitsraum (Ω, F, P ) aufzufassen. Ein
grundlegender Ansatz, den Begriff der Zufallsvariablen von der C-Welt in die
F-Welt zu verallgemeinern, geht auf Kwakernaak (1978) zurück (vgl. auch
Kruse, H., Meyer, K.D. (1987)). Allerdings würde die Verfolgung dieses Weges
den Rahmen der vorliegenden einführenden Abhandlung sprengen. Eine interessante Anwendung könnte z.B. bei der F-Punktschätzung darin bestehen,
die bisher sehr unbefriedigend begründete Auswahl einer Defuzzifizierungsmethode im Rahmen einer F-statistischen Entscheidungstheorie mit Hilfe
geeigneter Optimalitätskriterien zu objektivieren.
Ebenfalls zu aufwendig für dieses Einstiegspaper wäre ein Abriß der FuzzyLogik. Deshalb soll nur ein für den Anwender besonders interessanter Gegenstand erwähnt werden. In der klassischen Logik ist der Modus ponens
eine häufig verwendete Schlußregel: Es seien A und B Aussagen und es gelte
43
A impliziert B “. Beobachtet man A, so folgt zwingend die Gültigkeit von
”
B. In der Praxis stellt man oft fest, daß die Aussagen oder auch die Implikation nur angenähert gelten. Während in der klassischen Logik allein die
Wahrheitswerte 1 (wahr) und 0 (falsch) zugelassen sind, eröffnet die FuzzyLogik, die als Wertebereich der Wahrheitswerte das ganze Kontinuum [0, 1]
zur Verfügung hat, die Möglichkeit, den Umgang mit nur näherungsweise
geltenden Aussagen und Relationen exakt darzustellen (vgl. z.B. Biewer, S.
274 ff und Kahlert, J., Frank, S. 41 ff).
In der Einleitung wurde darauf hingewiesen, daß Fuzzy-Methoden eine neue
Möglichkeit bieten, in Modellen und Theorien die Datenqualität besser als
bisher explizit zu berücksichtigen und somit ggf. die Realitätsnähe der Überlegungen zu verbessern. Bereits die einfachen vorangehenden Beispiele zeigten andererseits, daß man diesen Vorteil mit erhöhtem formalen Aufwand
bezahlen muß, es gilt stets abzuwägen, ob die Berücksichtigung nichtstochastischer Imperfektion dem jeweiligen Problem angemessen ist. Dazu ist eine
sorgfältige Problem- und Datenanalyse nicht zu umgehen, Fuzzy-Methoden
machen sie nicht überflüssig, sondern erfordern zusätzliche präzise Überlegungen. Sehr einprägsam wurde von P.T. Johnston 1988 formuliert: Fuzzy
”
mathematics is not an excuse for fuzzy thinking “.
44
6
6.1
Anhang
Satz:
Es seien
Ω = ∅, Γ = ∅, Λ = ∅ C-Mengen und
f :Ω→Γ g:Γ:Λ
g◦f :Ω→Λ
Abbildungen. Dann gilt für die nach dem Erweiterungsprinzip von Zadeh
ermittelten Abbildungen
fˆ : F P(Ω) → F P(Γ) ĝ : F P(Γ) → F P(Λ)
(g ◦ f ) : F P(Ω) → F P(Ω)
der Zusammenhang
(g
◦ f ) = ĝ ◦ fˆ.
6.1.1
Beweis:
Es seien A ∈ F P(Ω) eine F-Menge mit der Zugehörigkeitsfunktion
µA : Ω → [0, 1] und λ ∈ Λ. Dann gilt für die Zugehörigkeitsfunktion der
F-Menge (g
◦ f )(A) nach Satz und Definition 2.9
µ(
(λ) =
g◦f )(A)
sup
ω∈(g◦f )−1 ({λ})
=
µA (ω)
sup
ω∈f −1 (g −1 ({λ}))
µA (ω) =: r,
für die Zugehörigkeitsfunktion der F-Menge (ĝ ◦ fˆ)(A) erhält man
µ(ĝ◦fˆ)(A) (λ) = µĝ(fˆ(A)) (λ)
=
sup
γ∈g −1 ({λ})
=
µfˆ(A) (γ)
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({λ})
µA (ω) =: s
In der folgenden Abbildung ist der Zusammenhang zwischen den auftretenden C-Mengen dargestellt:
45
✲
f
Ω
✬
g
Γ
✲
Λ
✩
✬
✩
✬✩
{λ}
{γ}
✫✪
✫
✫
✪
✪
f −1 ({γ}) f −1 (g −1 ({λ}))
g −1 ({λ})
Abb.31
a) Gilt f −1 (g −1 ({λ})) = ∅, so folgt
(∀γ ∈ g −1 ({λ}))(f −1 ({γ}) = ∅)
und mit 2.8
r=
sup
ω∈f −1 (g −1 ({λ}))
µA (ω) = 0 =
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({γ})
µA (ω) = s,
also die Behauptung 6.1.1 des Satzes.
b) Es gelte nun f −1 (g −1 ({λ})) = ∅ und folglich auch g −1 ({λ}) = ∅. Für
alle γ ∈ g −1 ({λ}) folgt
f −1 ({γ}) ⊆ f −1 (g −1 ({λ}))
und somit
sup
ω∈f −1 ({γ})
µA (ω) ≤
sup
ω∈f −1 (g −1 ({λ}))
µA (ω),
weiter erhält man
6.1.2
Es seien
s=
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({γ})
µA (ω) ≤
sup
ω∈f −1 (g −1 ({λ}))
µA (ω) = r.
ω1 , ω2 , ... ∈ f −1 (g −1 ({λ})) mit sup µA (ωi ) = r
i∈N
und
γ1 , γ2 , ... ∈ g −1 ({λ}) mit ωi ∈ f −1 ({γi })
gewählt. Dann gilt
46
6.1.3
sup
sup
γ∈g −1 ({λ})
ω∈f −1 ({γ})
s=
≥ sup
i∈N
≥ sup
i∈N
µA (ω)
sup
ω∈f −1 ({γi })
µA (ω)
sup
ωi ∈f −1 ({γi })
µA (ω1 ) = sup µA (ωi ) = r.
i∈N
Aus 6.1.2 und 6.1.3 folgt r = s und damit auch für den Fall b) die Behauptung
6.1.1 des Satzes.
6.2
Bemerkung:
Man überlegt sich leicht, daß die Aussage des Satzes entsprechend auch bei
Anwendung des Erweiterungsprinzips aus Satz und Definition 2.11 gilt.
6.3
Satz:
Es sei (M, l, r) mit l = 0 = r eine F-Dreieckszahl mit der Zugehörigkeitsfunktion µ.
Dann gilt für den Abszissenwert xs ihres Flächenschwerpunktes s
xs = M +
r−1
.
3
Beweis:
µ(x)
1
✻
Schwerpunkt
✉
✲
M −l
M
xS
M +r
x
Abb.32
Für die Zugehörigkeitsfunktion µ gilt

0
:
x ≤ M −l


 1
1
x+1− lM
: M −l ≤ x ≤ M
l
µ(x) =
1
1
x
+
1
+
M
:
M
≤ x ≤ M +r
−

r

 r
0
: M + r ≤ x.
47
Damit folgt
∞
xs =
xµ(x)dx
−∞
∞
µ(x)dx
−∞
M
−l
=
M
0dx +
−∞
M −1
M
−l
= M+
M
0dx +
−∞
6.4
x(1 +
(1 +
M −1
x
l
−
M
)dx
l
+
x
l
−
M
)dx
l
+
M+r
M
M+r
M
x(1 −
(1 −
x
r
x
r
+
+
M
)dx
r
M
)dx
r
+
+
∞
0dx
M +r
∞
0dx
M +r
r−l
.
3
Beispiel:
In Abschnitt 3.2 wird auf S. 33 die Funktion δ ∗ : R → D = {d0 , d1 } mit
d0 : t ∈ A∗ = [−1, 96; 1, 96]
∗
δ (t) =
d1 : t ∈ K ∗ =] − ∞; −1, 96[∪]1, 96; ∞[
zu δ̂ ∗ : F P(R) → F P(D) erweitert.
Die Zugehörigkeitsfunktion µT̂ (B1 ,...,B5 ) =: µ
der Dreieckszahl T̂ (B) := T̂ (B1 , ..., B5 ) = (2, 46; 3, 36; 1, 12) ∈ F P(R) ist in
der folgenden Abbildung dargestellt
µ(t)
1 ✻
0,86
✲
-2
−λ0,975
-1
0
1
5
λ0,975 = 1, 96
Abb.33
48
t
Es gilt nach dem Beweis zu Satz 6.3

0



0, 3t + 0, 27
µ(t) =
−0, 89t + 3, 2



0
:
t ≤ −0, 9
: −0, 9 ≤ t ≤ 2, 46
: 2, 46 ≤ t ≤ 3, 58
: 3, 58 ≤ t
(Die Zahlen sind auf zwei Nachkommastellen gerundet).
Mit dem Erweiterungsprinzip von Zadeh erhält man
µδ̂∗ (T̂ (B)) (d0 ) = sup µT̂ (B) (t)
t∈A∗
= 0, 3 · 1, 96 + 0, 27
= 0, 86
µδ̂∗ (T̂ (B)) (d1 ) = sup µT̂ (B) (t)
t∈K ∗
= 0, 3 · 2, 46 + 0, 27
= 1
Damit gilt
δ̂ ∗ (T̂ (B)) = {(d0 ; 0, 86), (d1 ; 1)} ∈ F P(D).
49
7
Literaturverzeichnis
Altrock, C.v.:
Fuzzy-Logic, Bd. 1 Technologie,
München, Wien, 1995
Biewer, B.:
Fuzzy-Methoden,
Berlin et al. 1997
Bothe, H.H.:
Fuzzy-Logic, Einführung in Theorie und Anwendungen,
Berlin et al. 1995
Frühwirth-Schnatter, S.:
On Statistical Inference for Fuzzy Data with Applications
to Descriptive Statistics,
Fuzzy Sets and Systems 50, 1992, 143-165
Kahlert, J., Frank, H.:
Fuzzy-Logik und Fuzzy-Control,
Braunschweig, Wiesbaden 1994
Kruse, R., Meyer, K.D.:
Statistics with Vague Data,
Dordrecht et al. 1987
Kwakernaak, H.:
Fuzzy Random Variables - I. Definitions and Theorems,
Information Sciences 15, 1978, 1-29
Rommelfanger, H.:
Fuzzy-Decision Support-Systeme; Entscheiden bei Unschärfe,
Berlin et al. 1994
Viertl,R.:
Statistical Methods for Non-Precise Data,
N.Y. et al. 1996
Viertl,R.:
On Statistical Inference Based on Non-precise Data,
Bandemer, H.(Hrsg.): Modelling Uncertain Data, Berlin 1992
Zadeh, L.A.:
Fuzzy Sets
Information and Control 8, 1965, 338-353
50
Herunterladen