Schließende Statistik mit unscharfen Stichproben von Volker Steinmetz Dezember 1998 LATEX-Version der Nr. A9802, Diskussionsbeiträge Fachbereich Wirtschaftswissenschaft, Universität des Saarlandes Inhaltsverzeichnis 1 Einleitung 3 2 Fuzzy-Mengen reeller Zahlen 6 3 Schätzen und Testen mit unscharfen Stichproben 25 3.1 Parameterpunktschätzungen 26 3.2 Alternativtests 30 3.3 Konf idenzbereichsschätzungen 34 4 Die formale Struktur statistischer Entscheidungsmodelle mit unscharfen Stichproben 39 5 Zusammenfassung und Ergänzungen 43 6 Anhang 45 7 Literaturverzeichnis 50 2 1 Einleitung Sowohl im alltägliche Leben als auch bei der wissenschaftlichen Arbeit werden wir mit unvollkommenen oder imperfekten 1 Informationen konfrontiert: Unsere Sinnesorgane erzeugen nur grobe Abbilder der Realität, Meßgeräte und statistische Erhebungen liefern Angaben von begrenzter Genauigkeit, sprachliche Begriffe und Formulierungen sind - von der standardisierten, präzisen Sprache der Mathematik einmal abgesehen - von kaum zu vermeidender Vieldeutigkeit, komplexe Systeme sind notgedrungen oft nur approximativ darzustellen und folglich auch nur ungenau zu analysieren. Schließlich ist das Eintreten zukünftiger Ereignisse für uns häufig mit Unsicherheit behaftet. Zur Modellierung und Untersuchung des zuletzt genannten Typs von Imperfektion stellen Wahrscheinlichkeitstheorie und schließende Statistik seit langem bewährte Hilfsmittel bereit, man spricht in diesem Fall von stochastischer Imperfektion oder Unsicherheit. Auch einen Teil der Meß- und Erhebungsfehler kann man dieser Kategorie der Unvollkommenheit zurechnen. Es ist charakteristisch, daß die interessierenden Phänomene im Idealfall präzise definiert sind, über ihr Auftreten jedoch Unsicherheit besteht. Um einen anderen Typ von Imperfektion handelt es sich, wenn beispielsweise eine Wirtschaftszeitung die Nettoumsatzrendite eines deutschen Industrieunternehmens als durchschnittlich bezeichnet. Auch wenn man weiß, daß die Umsatzrendite aller deutschen Industrieunternehmen zu Beginn der neunziger Jahre im Durchschnitt etwas über 2 % lag, hat man durch die in der Zeitschrift gegebene Information nur eine vage Vorstellung von der Umsatzrentabilität des angegebenen Unternehmens, man bezeichnet diese nichtstochastische Imperfektion als Unschärfe. Die Bedeutung des oben verwendeten Begriffs ‘durchschnittlich‘ ist kontextabhängig; wenn z.B. in demselben Artikel auch die Eigenkapitalrendite als durchschnittlich bezeichnet wird, ist damit ein ganz anderer Zahlenbereich angedeutet. Zusätzlich variiert die Interpretation dieses vagen Begriffs auch noch von Leser zu Leser, sie ist subjektiv. Aber trotz der offensichtlich fehlenden Eindeutigkeit kann beispielsweise auch der Anlageberater einer Bank mit einer derartigen Bewertung arbeiten, um die Informationsflut, die bei der Beurteilung eines Unternehmens anfällt, überschaubar zu gestalten. Die menschliche Sprache, und folglich auch das menschliche Denken, arbeiten 1 Zum Terminus ‘imperfekt‘ als Oberbegriff für ‘unsicher‘ und ‘unscharf‘ vgl. Biewer 1997, S. 24, insbesondere seinen Hinweis auf Kruse, Gebhard, Klawonn. 3 überwiegend mit unscharfen Begriffen. Trotzdem haben diese sich nicht nur im alltäglichen Leben, sondern auch in der Wissenschaft zur Beschreibung und Analyse von Ausschnitten aus der Erscheinungswelt bewährt. Folgerichtig bemüht man sich in wachsendem Maße auch bei der Erarbeitung und Anwendung formaler Modelle, die geschilderte Unschärfe nicht durch evtl. nur scheinbar präzise Angaben zu verdecken, sondern sie adäquat darzustellen und zu verarbeiten, mit dem Ziel, die Realitätsnähe der theoretischen Überlegungen zu vergrößern. Der Zusammenhang zwischen Imperfektion, Unsicherheit und Unschärfe wird durch die folgende Graphik nochmals verdeutlicht: Imperfektion Unsicherheit (stochastisch) Unschärfe (nichtstochastisch) Abb. 1 Wie erwähnt ist die geschilderte Vagheit unserer Sprache nicht die alleinige Ursache für die Imperfektion unserer Informationen und unseres Wissens2 . Zusätzlich liefern Meßinstrumente, statistische Erhebungen, Sinnesorgane o.ä. i.a. Daten, deren Unschärfe aus prinzipiellen oder Kostengründen bis auf triviale Ausnahmen nicht zum Verschwinden gebracht werden kann. Hochkomplexe, vor allem nichtlineare, Zusammenhänge können wir nur in vereinfachter Form verarbeiten. Auch kann das interessierende Objekt - etwa ein Tintenklecks auf Löschpapier - selbst unscharf sein. Man gliedert deshalb den Begriff der Unschärfe, wie in Abbildung 2 gezeigt, noch weiter auf: Unschärfe linguistische informationale Unschärfe oder lexikalische Unschärfe Abb. 2 2 Im folgenden wird zwischen Information und Wissen als gespeicherter Information nicht streng unterschieden. 4 Schließlich sind in der Praxis Unsicherheit und Unschärfe oft gleichzeitig zu beobachten.3 Zur formalen Darstellung von Unschärfe wurde zu Beginn der sechziger Jahre in den USA von Lotfi A. Zadeh das Konzept der fuzzy4 sets - unscharfe Mengen, Fuzzy-Mengen - entwickelt und 1965 publiziert (Zadeh 1965). Es stieß, ebenso wie das logische Pendant, die Fuzzy-Logik - fuzzy logic -, nur auf geringe Resonanz, teilweise sogar auf entschiedene Ablehnung. Erst nachdem Zadehs Ansatz 1974 in Europa bei der Prozeßregelung eines Kraftwerkes (vgl. v.Altrock 1995, S. 7) eine praktische Verwendung gefunden und sich bewährt hatte, bahnte sich eine Änderung an. Vor allem in Japan schnellte die Zahl der technischen Anwendungen und auch der theoretischen Arbeiten in die Höhe. ’Heute ist die Behandlung des Fuzzy-Themas in der Forschung und in der industriellen Anwendung ein Muß’ stellt H.-H. Bothe kurz und bündig fest (Bothe 1995, S. VIII). Wie bei einem relativ jungen Gebiet - hier der Fuzzy-Theorie - nicht anders zu erwarten, ist die Terminologie noch sehr uneinheitlich. Es soll nur erwähnt werden, daß man statt von Imperfektion oft auch von Unschärfe spricht und dann Unsicherheit als stochastische Unschärfe von linguistischer und informationaler Unschärfe, beides auch als Vagheit bezeichnet, abgrenzt. In den folgenden Abschnitten werden zunächst als Sonderfälle der allgemeinen Fuzzy-Mengen die Fuzzy-Zahlen und Fuzzy-Intervalle behandelt und das wichtige Erweiterungsprinzip von Zadeh erläutert. Nachdem dann mit diesem Hilfsmittel die skalare Multiplikation und die Addition eingeführt wurden, werden an Hand eines immer wieder fortgeführten Grundbeispiels die drei klassischen statistischen Entscheidungsverfahren - (Parameter)punktschätzung, (nichtrandomisierter) Alternativtest, (Konfidenz)bereichsschätzung - rekapituliert und die Auswirkung nichtstochastischer Imperfektion der Zufallsstichprobe dargestellt. Die allgemeine Struktur der hier gewählten Verknüpfung von stochastischer und nichtstochastischer Imperfektion wird in einem weiteren Abschnitt vorgestellt. Schließlich werden hier nicht näher behandelte Gebiete der Fuzzy-Theorie kurz gestreift. Im Anhang werden einige formale Hilfsmittel bereitgestellt. 3 Auch wurde der Begriff des Wahrscheinlichkeitsmaßes zum Begriff des Fuzzy-Maßes verallgemeinert, der es ermöglicht, daß in der Unschärfetheorie auch Unsicherheitsaspekte eingebracht werden können. Dieser Ansatz wird hier nicht weiter verfolgt. 4 Nach Webster’s New Encyclopedic Dictionary zurückgehend auf niederdeutsch ’fussig’ für locker, schwammig. 5 2 Fuzzy-Mengen reeller Zahlen Zunächst soll der allgemeine Begriff der Fuzzy-Menge am Sonderfall unscharfer Zahlenmengen erläutert werden: Es sei R die Menge der reellen Zahlen. Oft verwendete klassische Teilmengen sind die Intervalle, z.B. ist A := [2, 6] = {x ∈ R | 2 ≤ x ≤ 6} das (abgeschlossene) Intervall aller reellen Zahlen x, die mindestens 2 und höchstens 6 sind. Man kann eine derartige Teilmenge der Menge der reellen Zahlen auf der Zahlengeraden etwa in der folgenden Art veranschaulichen: A [ -1 0 ] 1 ✲ x 5 Abb. 3 Eine für die anschließenden Überlegungen nützliche Darstellung von Teilmengen A der reellen Zahlen R benutzt die sog. Indikatorfunktion von A, eine Abbildung µA von R in die Menge {0, 1}, die jedem x ∈ R, das auch zu A gehört, den Wert 1 zuordnet und sonst konstant 0 ist: 2.1 Def inition: Es sei A eine Teilmenge von R. Man bezeichnet die Abbildung µA : R → {0, 1} mit 1 : x∈A µA (x) = 0 : x ∈ A als Indikatorfunktion oder charakteristische Funktion von A bzgl. R. Für A = [2, 6] gilt µA (x) = 1 : 2≤x≤6 0 : x < 2 oder 6 < x. Der Graph dieser Funktion ist in der folgenden Abbildung dargestellt: 6 µ (x) 1 ✻A 0 ✉ ✉ ❡ ❡ 1 ✲ x 5 Abb.4 Für jedes x ∈ R ist abzulesen, ob es zu A gehört oder nicht, d.h. die Indikatorfunktion beschreibt die Menge in eineindeutiger Weise. Man kann diese Funktion auch verwenden, um jede Teilmenge A der Menge R der reellen Zahlen in einer für die klassische Mengelehre ungewöhnlichen, aber für die Fuzzy-Mengenlehre nützlichen Form darzustellen: Jedes x ∈ R wird mit dem zugehörigen Funktionswert µA (x) ∈ {0, 1} zu einem geordneten Paar (x, µA (x)) zusammengefaßt, aus diesen Paaren wird eine neue (klassische) Menge 2.2 {(x, µA (x)) | x ∈ R} gebildet. Diese Menge charakterisiert ebenfalls in eineindeutiger Weise die Ausgangsmenge A ⊆ R. Die Indikatorfunktion läßt für jedes x ∈ R nur jeweils eine der beiden folgenden Möglichkeiten zu: Entweder gilt µA (x) = 1, d.h. x ∈ A, oder man hat µA (x) = 0 und folglich x ∈ A. Genau an diesem Punkt setzen die Überlegungen Zadehs an. In vielen Situationen empfindet man die Abgrenzung von Teilmengen, wie sie in der klassischen Mengenlehre praktiziert wird, als übertrieben scharf und für die Anwendungen unzweckmäßig. Ein fließender Übergang von einer Menge A zu ihrem Komplement kann praktikabler sein. Beispielsweise könnte ein Anlageberater in o.g. Beispiel Umsatzrenditen zwischen 2 % und 2,5 % ohne Einschränkung als durchschnittlich bezeichnen, seine Vorstellung von durchschnittlichen Renditen würde aber vermutlich durch die folgende Graphik nicht zufriedenstellend wiedergegeben: 7 µ(x) 1 ✻ 0 1 ✉ ✉ ❡ ❡ 2 ✲ x 3 Umsatzrendite in % Abb.5 Er wäre möglicherweise damit einverstanden, Renditen x ≤ 1% als mit Sicherheit zu niedrig und x ≥ 3% als mit Sicherheit zu hoch für durchschnittliche Werte zu bezeichnen, aber Probleme bereiten die Zwischenwerte. Wenn 2 % noch als durchschnittlicher Wert angesehen werden kann, ist dann 1,9 % ganz dezidiert genauso als nichtdurchschnittlich zu bewerten wie beispielsweise 0,5 %, oder sollte man nicht besser in der formalen Darstellung andeuten, daß 1,9 % noch als ziemlich durchschnittlich anzusehen sei, aber zum Beispiel 1,5 % doch schon deutlich weniger? Zadeh löste dieses Problem, indem er zur Beschreibung der Zugehörigkeit eines Objektes x zu einer Menge A nicht nur den Wert 1 (und 0 bei Nichtzugehörigkeit) zuließ, sondern Werte zwischen 0 und 1 zur Beschreibung einer abgeschwächten Zugehörigkeit einführte. Der im Beispiel erwähnte Anlageberater könnte die Gesamtheit der durchschnittlichen Renditen beispielsweise durch folgende Funktion µ : R → [0, 1] charakterisieren: µ(x) ✻ ✉ 1 ✉ 0 ✉ ✉ 1 2 Abb.6 8 3 ✲ x Man bezeichnet µ als Zugehörigkeitsfunktion der Fuzzy-Menge der durchschnittlichen Umsatzrenditen und µ(x) als Zugehörigkeitsgrad von x ∈ R zu dieser Fuzzy-Menge. Man sieht an der Abbildung, daß für den Anlageberater z.B. 1,9 % mit wesentlich größerem Zugehörigkeitsgrad zur Fuzzy-Menge der durchschnittlichen Werte gehört als z.B. 1,5 %, aber daß er 1,9 % gleichzeitig nicht so dezidiert als durchschnittlich bezeichnet wie z.B. 2 %. Offensichtlich kann man die Indikatorfunktion der klassischen Mengenlehre als Sonderfall derartiger Zugehörigkeitsfunktionen auffassen, bei ihr kommen eben als Funktionswerte nicht alle Elemente des Einheitsintervalls [0,1] in Frage, sondern nur dessen Endpunkte 0 und 1. In mehr mathematisch orientierten Abhandlungen ist es üblich, die FuzzyMengen direkt mit ihren Zugehörigkeitsfunktionen zu identifizieren. Die stärker auf den Einsteiger und mathematisch weniger trainierten Anwender ausgerichtete Literatur bevorzugt vielfach eine an 2.2 angelehnte Definition: 2.3 Def inition: Es sei µ : R → [0, 1] eine Abbildung. Man bezeichnet A := {(x, µ(x)) | x ∈ R} als unscharfe Menge, Fuzzy-Menge (F-Menge)5 in R mit der Zugehörigkeitsfunktion µA := µ. Für jedes x ∈ R heißt µA (x) der Zugehörigkeitsgrad von x zur F-Menge A.6 Die Menge aller F-Mengen in R heißt die Fuzzy-Potenzmenge von R und wird mit FP(R) bezeichnet. In den folgenden Abbildungen sind die Zugehörigkeitsfunktionen einiger FMengen in R jeweils mit in einem bestimmten Kontext denkbaren verbalen Interpretationen angegeben. 5 Statt von einer F-Menge in R spricht man auch von einer F-Teilmenge von R. Natürlich kann man ganz analog auch F-Mengen in beliebigen Mengen Ω = ∅ (Grundmengen, Universalmengen) definieren. Im Unterschied zu den F-Mengen werden in dieser Arbeit die klassischen Mengen als C-Mengen (Englisch crisp=scharf) bezeichnet. Sie sind ein Sonderfall der F-Mengen. 6 9 µ (x) ✻ A1 1 ✲ x 0 1 2 Abb.7 A1 könnte man als F-Menge aller reellen Zahlen interpretieren, die erheblich größer als 1 sind. µ (x) µ (x) ✻ A2 ✻ A3 1 1 ✲ -1 0 1 ✲ x -1 0 Abb. 8 1 Abb. 9 A2 und A3 könnten F-Mengen sein, welche durch die definierende unscharfe Eigenschaft ungefähr 0 sein “ gegeben sind. ” µ (x) ✻ A4 1 ✲ x 0 1 2 3 Abb.10 10 4 x A4 ist eine mögliche F-Menge zur Darstellung der Zahlen, die in der Nähe von 2 oder 4 liegen. Die Beispiele verdeutlichen, daß der Übersetzung unscharfer, verbaler Zahlenangaben in F-Mengen eine gewisse Willkür anhaftet. In der Technik haben sich einfache, aus Geradenstücken zusammengesetzte Kurven wie in Abb. 8 und Abb. 10 bewährt (vgl. v. Altrock 1995, S. 154). Bei technischen Anwendungen handelt es sich oft um mit Fuzzy-Methoden arbeitende Regelkreise, die in schneller Folge immer wieder durchlaufen werden. Unterschiedliche Zugehörigkeitsfunktionen führen zwar möglicherweise bei dem einzelnen Regelvorgang zu unterschiedlichen Abweichungen des Ist-Wertes vom Soll-Wert, aber da es in der Logik des Regelkreises liegt, durch aufeinander folgende Regelvorgänge Abweichungen zwischen Ist- und Soll-Werten verschwinden zu lassen, werden auch die Einflüsse unterschiedlicher Zugehörigkeitsfunktionen im Zeitablauf kompensiert. In anderen Situationen verwendet man auch kompliziertere Kurven, etwa wie in Abb. 7 und Abb. 9 dargestellt. Dort werden waagerechte Kurventeile nicht abrupt in einem Knick verlassen, sondern in differenzierbarer Form. Auf jeden Fall sollte man einen Modellansatz überdenken, wenn das Ergebnis von Proberechnungen sehr sensitiv auf kleine Variationen der Zugehörigkeitsfunktionen reagiert; letzteres würde einem Grundanliegen der Fuzzy-Theorie, ohne vorgetäuschte Präzision zu arbeiten, diametral widersprechen. Um die Unbestimmtheit bei der Festlegung von Zugehörigkeitsfunktionen in die Überlegungen explizit mit aufzunehmen hat man versucht, die Zugehörigkeitsfunktionen selbst wieder unscharf darzustellen, also zu F-Mengen 2. Stufe überzugehen. Da die Handhabung derartiger Gebilde mühselig wird, hat man bisher auf die Anwendung dieses Ansatzes weitgehend verzichtet. Ein Sonderfall der F-Mengen in R sind die Fuzzy-Zahlen und Fuzzy-Intervalle. Hier sollen die besonders einfach zu handhabenden und für den Anwender wichtigen F-Zahlen mit Dreiecksgestalt und F-Intervalle mit Trapezgestalt vorgestellt werden, Beispiele ihrer Zugehörigkeitsfunktionen sind in den folgenden beiden Abbildungen gegeben: 11 µ (x) 1 ✻A ✲ x 0 1 2 3 F1 M 4 F2 Abb.11 Die F-Menge A könnte man als F-Zahl mit Dreiecksgestalt ungefähr 3“interpretieren. ” Offensichtlich ist die F-Zahl A durch Angabe der beiden Dreiecksfußpunkte F1 und F2 sowie des sog. Gipfelpunktes M vollständig festgelegt. Statt F1 , F2 und M anzugeben, genügen auch die drei Werte M, l := M − F1 , r := F2 − M. µ (x) 1 ✻A ✲ x 0 1 2 F1 M1 3 4 M2 5 6 F2 Abb.12 In diesem Fall könnte man die F-Menge A als F-Intervall mit Trapezgestalt bezeichnen und beispielsweise deuten als ungefähr zwischen 2 und 3,5 “. ” Hier genügen zur Festlegung der Zugehörigkeitsfunktion die Werte F1 , F2 und M1 , M2 bzw. M1 , M2 , l := M1 − F1 , r := F2 − M2 . In der folgenden Definition werden diese Überlegungen in allgemeiner Form festgehalten. 12 2.4 Def inition: Gegeben seien M1 , M2 , l, r, ∈ R mit M1 ≤ M2 , l > 0 und r > 0. Man bezeichnet die F-Menge A in R als Fuzzy- Intervall mit Trapezgestalt, wenn für ihre Zugehörigkeitsfunktion µA gilt 2.4.1 µA (x) = x−M1 l M2 −x r +1 1 +1 0 : : : : M1 − l ≤ x ≤ M1 M1 ≤ x ≤ M2 M2 ≤ x ≤ M2 + r sonst gilt M1 = M2 =: M , so bezeichnet man A als Fuzzy-Zahl mit Dreiecksgestalt oder kurz F-Dreieckszahl mit dem Gipfelpunkt M , der linken Dehnung (Spreizung) l und der rechten Dehnung (Spreizung) r. Im folgenden werden auch die Kurzschreibweisen A = (M1 , M2 , l, r) bzw. A = (M, l, r) verwendet. Man sieht sofort, daß man für die formale Darstellung die Zugehörigkeitsfunktion einer F-Zahl mit Dreiecksgestalt in 2.4.1 die zweite Zeile hinter der Klammer streichen kann. In der Praxis ist man daran interessiert, neben F-Mengen reeller Zahlen auch präzise Werte wie bisher verwenden zu können. Die folgende Definition schafft die Möglichkeit, das Rechnen mit (scharfen) reellen Zahlen in die Fuzzy-Welt (F-Welt)7 mit einzubeziehen: 2.5 Def inition: Es sei a ∈ R eine reelle Zahl. Die F-Menge A in R mit der Zugehörigkeitsfunktion µA , für die gilt µA (x) = 1 : x=a 0 : x = a für alle x ∈ R, bezeichnet man als Singleton mit dem Trägerpunkt a und schreibt µA =: µa . 7 Die Welt der scharfen (crisp) Mengen, Zahlen etc. werde als C-Welt bezeichnet. 13 2.6 Vereinbarung: Da in dieser Arbeit nur F-Intervalle mit Trapezgestalt und F-Zahlen mit Dreiecksgestalt vorkommen, soll im folgenden kurz von F-Intervallen und FZahlen gesprochen werden. Die vorangehende Definition legt es nahe, auch die Singletons als Spezialfall unter dem Begriff F-Zahlen zu subsumieren und sie als Grenzfall der F-Dreieckszahlen mit gegen 0 gehender linker und rechter Spreizung sogar zur Menge der F-Dreieckszahlen hinzuzunehmen. Für das Singleton mit dem Trägerpunkt a ∈ R soll konsequenterweise auch die Darstellung (a, 0, 0) eingeführt werden. Ganz entsprechend wird man auch die klassichen Intervalle als Spezialfall unter den Begriff der F-Intervalle subsumieren. Abgeschlossene Intervalle [M1 , M2 ] sollen hier durch (M1 , M2 , 0, 0) dargestellt werden. Ehe im nächsten Abschnitt die Anwendung klassischer statistischer Verfahren auf unscharfe Stichprobenergebnisse untersucht werden kann, muß noch ein wichtiges mathematisches Hilfsmittel bereitgestellt werden: Man benötigt ein Verfahren, mit dem Funktionen aus der C-Welt in die F-Welt fortgesetzt werden können. Dadurch wird es insbesondere möglich, die gängigen Rechenoperationen wie Addition, Multiplikation usw. von den reellen Zahlen auf Fuzzy-Zahlen zu übertragen. Ein solches Verfahren ist in dem Zadehschen Erweiterungsprinzip gegeben, das anschließend zunächst motiviert und dann präzise definiert werden soll. Der Graph einer Funktion f :R→R sei durch die folgende Abbildung gegeben: 14 y ✻ f (x) ✲ x x Abb.13 Jedem (scharfen) Urbildpunkt x ∈ R wird durch f genau ein (scharfer) Bildpunkt y := f (x) ∈ R zugeordnet. Liegt nun nur ein unscharfer Urbildpunkt ungefähr x “vor, so ist zu erwar” ten, daß auch der zugehörige Funktionswert nur unscharf angegeben werden kann, etwa ungefähr f (x) “. Genauer geht es darum, aus der Zugehörig” keitsfunktion einer unscharfen Teilmenge des Definitionsbereichs mit Hilfe der Zuordnungsvorschrift f die Zugehörigkeitsfunktion einer passenden unscharfen Teilmenge des Wertevorrates zu ermitteln. Zunächst soll mit Hilfe der folgenden Abbildung an ein bekanntes Vorgehen aus der klassischen Mengenlehre erinnert werden: y ✻ fˆ(A) ✉ ✉ ✉ A Abb. 14 15 ✲ x Gegeben sei die auf der Abszisse eingezeichnete Teilmenge A des Definitionsbereichs R. Gesucht ist diejenige Teilmenge des Wertevorrates R, deren Elemente (mindestens) einen Urbildpunkt in A haben. Als Lösung erhält man die auf der Ordinale eingezeichnete Menge fˆ(A), formal wird definiert 2.7 fˆ(A) := {y ∈ R | (∃x ∈ A)(y = f (x))}.8 Es sei P(R) := {A | A ⊆ R} die Menge aller Teilmengen von R, die Potenzmenge von R. Da man die obige Konstruktion für alle A ⊆ R durchführen kann, ist durch 2.7 eine Abbildung fˆ : P(R) → P(R) definiert worden, die sog. durch f induzierte Abbildung fˆ. Gesucht ist eine Möglichkeit, dieses Konstruktionsverfahren aus der C-Welt in die F-Welt zu verallgemeinern. Da F-Mengen durch ihre Zugehörigkeitsfunktion festgelegt werden, bietet es sich an, zunächst die C-Mengen A und fˆ(A) durch ihre Indikatorfunktionen µA : R → {0, 1} und µfˆ(A) : R → {0, 1} darzustellen, das in 2.7 angegebene Konstruktionsverfahren auf die Verwendung dieser Funktionen umzuschreiben und dann für den Übergang in die F-Welt in dem erhaltenen Rezept die Indikatorfunktionen durch die allgemeineren Zugehörigkeitsfunktionen zu ersetzen. Zunächst werde die Abb. 14 um die entsprechenden Indikatorfunktionen ergänzt: 8 ∃ ist das Kürzel für es gibt (mindestens) ein “. ” 16 y y ✻ ✉ y3 ❡ ✻ fˆ(A) y1 ✉ ❡ y2 µfˆ(A) (y) ✛ x11 1 A x12 x13 x14 ✲ x µA (x) 1 ✻ 0 x21 ✉ ✉ ❡ ❡ x22 ✲ x Abb.15 Zu y1 gehören die Urbildpunkte x11 , x12 , x13 und x14 . Davon liegen x12 und x13 in A, so daß y1 nach Konstruktion (2.7) zu fˆ(A) gehört. Es gilt 1 = µfˆ(A) (y1 ) = = sup{µA (x11 ), µA (x12 ), µA (x13 ), µA (x14 )} sup µA (x) x∈R f (x)=y1 Der Punkt y2 hat die Urbildpunkte x21 und x22 . Beide gehören nicht zu A, deshalb gilt y2 ∈ fˆ(A). Es folgt 0 = µfˆ(A) (y2 ) = = sup{µA (x21 ), µA (x22 )} sup µA (x) x∈R f (x)=y2 17 Schließlich hat y3 überhaupt keinen Urbildpunkt und gehört deshalb nach 2.7 auch nicht zu fˆ(A). Da die Indikatorfunktionen durch 0 nach unten beschränkt sind, vereinbart man 2.8 sup µA (x) := 0 x∈∅ und erhält somit in Übereinstimmung mit den vorangehenden Fällen 0 = µfˆ(A) (y3 ) = sup µA (x) x∈R f (x)=y3 Man kann beweisen, daß generell für jedes A ⊆ R gilt µfˆ(A) (y) = sup µA (x) für alle y ∈ R x∈R f (x)=y und überträgt nun dieses Rezept in die F-Welt, indem man von den Indikatorfunktionen scharfer Mengen in R zu den Zugehörigkeitsfunktionen von F-Mengen in R übergeht: 2.9 Satz und Def inition: Es sei f :R→R eine Abbildung. Dann ist zu jeder F-Menge A ∈ F P(R) mit der Zugehörigkeitsfunktion µA : R → [0, 1] durch die Festsetzung 2.9.1 µfˆ(A) (y) := = sup µA (x) für alle y ∈ R x∈R f (x)=y sup x∈f −1 ({y}) µA (x) 9 die Zugehörigkeitsfunktion einer F-Menge fˆ(A) ∈ F P(R) und somit eine Abbildung 9 Man definiert in der klassischen Mengenlehre für beliebiges B ⊆ R f −1 (B) := {x ∈ R | f (x) ∈ B}, hat also f −1 ({y}) = {x ∈ R | f (x) = y}. 18 fˆ : F P(R) → F P(R) gegeben. Man sagt, die Abbildung f sei nach dem Erweiterungsprinzip von Zadeh zur Abbildung fˆ erweitert worden. 10 2.10 Beispiel: Gegeben seien die Funktion f : R → R mit f (x) = (x − 3)2 für alle x ∈ R und die F-Menge A ∈ F P(R) mit 0, 2 : x = 2 0, 8 : x = 4 yA (x) = 0, 6 : x = 5 0 : sonst. Es sei fˆ : F P(R) → F P(R) die nach dem Erweiterungsprinzip von Zadeh aus f hervorgegangene Abbildung. Für das Bild fˆ(A) erhält man nach 2.9.1 µfˆ(A) (1) = sup µA (x) x∈R 1=(x−3)2 = sup{µA (2), µA (4)} = sup{0, 2; 0, 8} = 0, 8 µfˆ(A) (4) = sup µA (x) x∈R 4=(x−3)2 = = = µfˆ(A) (y) = sup{µA (1), µA (5)} sup{0; 0, 6} 0, 6 0 für alle y ∈ {1, 4}. Die Graphen der Funktion f und der Zugehörigkeitsfunktionen µA und µfˆ(A) sind in der folgenden Abbildung dargestellt: 10 Diese Überlegungen lassen sich ohne Probleme auf den allgemeineren Fall übertragen, daß man von Abbildungen f : Ω → Γ mit beliebigen Mengen Ω = ∅ und Γ = ∅ ausgeht. 19 y y ✻ ✻ 10 ✉ µfˆ(A) (y) ✉ ✛ 1 ❡ ❡1 5 1 ✲ 0 0 x 1 5 µ (x) 1 ✻A ✉ ✉ ✉ ❡ 0 1 ❡ 3 ❡ 5 Abb.16 In der schließenden Statistik arbeitet man i.a. nicht mit Stichproben vom Umfang n = 1, sondern zieht umfangreicheres Datenmaterial heran. Dementsprechend sind die Stichprobenrealisationen vielfach nicht Elemente x ∈ R, sondern (x1 , . . . , xn ) ∈ Rn := R × · · · × R mit n > 1. Folglich reicht beim Übergang von der C-Welt in die F-Welt das Erweiterungsprinzip in der zuvor erarbeiteten Form, als Abbildungen f : R → R zu Abbildungen fˆ : F P(R) − F P(R) erweitert werden, nicht aus. Es liegt nahe, jetzt von Abbildungen f : Rn → R auszugehen. Der Übergang zu Abbildungen fˆ : F P(Rn ) − F P(R) ist durch direkte Übertragung der Formel 2.9.1 unproblematisch, wie auch in Fußnote 10 angedeutet wurde. Dieses Vorgehen paßt aber nicht zu den im folgenden zu behandelnden Anwendungen der klassischen statistischen Entscheidungsverfahren auf Stichprobenrealisationen, die aus unscharfen Einzelbeobachtungen zusammengesetzt sind: 20 ✲ x Die Elemente der Menge F P(Rn ) sind unscharfe Teilungen des Rn , unscharfe Stichprobenrealisationen sind aber i.a. aus unscharfen Einzelergebnissen A1 ∈ F P(R), . . . , An ∈ F P(R) zusammengesetzte n-Tupel, das heißt man hat unscharfe Stichprobenrealisationen der Form (A1 , . . . , An ) ∈ F P(R) × · · · × F P(R) = [F P(R)]n vorliegen. Wegen F P(R) × · · · × F P(R) = F P(R)n für n > 1 ist das ‘Rezept‘ 2.9.1 nicht direkt übertragbar. Die Motivation einer geeigneten Modifikation von 2.9.1 ist ohne Schwierigkeit möglich und sollte z.B. in einer einschlägigen Vorlesung auch nicht fehlen; da sie aber für die hier verfolgten Ziele zu aufwendig ist, soll gleich Zadehs Ergebnis angegeben werden: 2.11 Satz und Def inition: Es seien f : Rn → R eine Abbildung und n ∈ N. Dann ist zu jedem n-Tupel (A1 , . . . , An ) ∈ F P(R) × · · · × F P(R) = [F P(R)]n durch die Festsetzung µfˆ(A1 , . . . , An )(y) := sup (x1 ,... ,xn )∈Rn f (x1 ,... ,xn )=y min{µA1 (x1 ), . . . , µAn (xn )} die Zugehörigkeitsfunktion einer F-Menge fˆ : (A1 , ..., An ) ∈ F P(R) gegeben. Man sagt, f sei nach dem Erweiterungsprinzip von Zadeh zur Abbildung fˆ : [F P(R)]n → F P(R) erweitert worden.11 Man sieht sofort, daß man für n = 1 wieder die Formeln aus 2.9 erhält, 11 Diese Überlegungen lassen sich ohne Probleme auf den allgemeineren Fall übertragen, daß man von Abbildungen f : Ω1 × · · · × Ωn → Γ mit beliebigen Mengen Ωi = ∅(i = 1, ..., n) und Γ = ∅ ausgeht. 21 so daß man in 2.9 und 2.11 ohne weitere Unterscheidung von dem Erweiterungsprinzip von Zadeh sprechen kann. Mit Hilfe des Erweiterungsprinzips lassen sich insbesondere die Rechenoperationen der klassischen Mathematik in die F-Welt übertragen. Erweitert man z.B. die Abbildung f :R×R→R mit z := f (x, y) := x + y für alle (x, y) ∈ R × R zu der entsprechenden Abbildung fˆ : F P(R) × F P(R) → F P(R), so kann man für zwei F-Zahlen A, B ∈ F P(R) ihre Summe A ❢B := fˆ(A, B) einführen. Die Erweiterung einer Abbildung ga : R → R a ∈ R fest mit y := ga (x) = ax für alle x ∈ R zu der entsprechenden Abbildung ĝa : F P(R) → F P(R) führt zu der skalaren Multiplikation einer F-Zahl A ∈ F P(R) mit einer reellen Zahl a ∈ R durch die Definition p A := ĝ (A). a ❢ a Entsprechend überträgt man auch andere Rechenoperationen. Die Anwendung des Erweiterungsprinzips kann im konkreten Fall sehr mühselig sein. Ein sehr einfaches Ergebnis für F-Dreieckszahlen ist ohne Beweis 12 im folgenden Satz angegeben: 12 Einen Beweis findet man z.B. bei Rommelfanger 1994, S. 41. 22 2.12 Satz: Es seien A1 = (M1 , l1 , r1 ) und A2 = (M2 , l2 , r2 ) F-Dreieckszahlen aus F P(R) und a ∈ R eine reelle Zahl. Durch Anwendung des Erweiterungsprinzips erhält man als Summe A1 ❢A2 die F-Dreieckszahl 2.12.1 A1 ❢A2 := (M1 + M2 , l1 + l2 , r1 + r2 ), p A die F-Dreieckszahl und als skalares Produkt a ❢ 1 2.12.2 a p❢A1 := (aM1 , al1 , ar1 ) : a ≥ 0 (aM1 , −ar1 , −al1 ) : a ≤ 0. In Vereinbarung 2.6 werden die reellen Zahlen als Spezialfälle unter den Begriff der F-Dreickszahlen subsumiert. Man prüft leicht nach, daß 2.12.1 und 2.12.2 im Fall reeller Zahlen zu den in der klassischen Mathematik gewohnten Ergebnissen führt. Multiplikation und Division von F-Dreieckszahlen werden hier nicht behandelt, da sie in den folgenden Abschnitten nicht benötigt werden. Die Operationen aus Satz 2.12 werden in dem folgenden Beispiel angewendet: 2.13 Beispiel: Gegeben seien die F-Dreieckszahlen A1 = (1, 2, 4), A2 = (6, 4, 3) und die reellen Zahlen a = 2, b = −2. Dann gilt A1 ❢A2 = (7, 6, 7) p A = (2, 4, 8) a ❢ 1 p A = (−2, 8, 4) b ❢ 1 23 ✻ µ(x) 1 A2 A1 ❢A2 A1 ✲ -10 x 0 -5 5 10 15 ✻ µ(x) p A −2 ❢ 1 p A 2 ❢ 1 1 ✲ -10 -5 x 0 5 10 15 Abb.17 In der Zeichnung werden die waagerechten Teile der Funktionsgraphen, die mit der Abszisse zusammenfallen, fortgelassen, um die Übersichtlichkeit zu verbessern. Es ist deutlich zu sehen, wie sich die Unschärfe bei der Addition unscharfer Zahlen und bei der skalaren Multiplikation mit Werten, die betragsmäßig größer als 1 sind, vergrößert. 24 3 Schätzen und Testen mit unscharfen Stichproben In diesem Abschnitt werden die drei grundlegenden Entscheidungsverfahren der Statistik - Parameterpunktschätzungen, (nichtrandomisierte) Alternativtests, (Konfidenz)bereichsschätzungen - jeweils an einem einfachen Beispiel rekapituliert und die Konsequenzen unscharfer Stichprobenrealisationen demonstriert: Von einer Zufallsvariablen Y, die einen interessierenden Umweltausschnitt beschreibt, werde vorausgesetzt, daß sie einer Normalverteilung mit bekannter Varianz Var Y = σ02 aber unbekanntem Erwartungswert EY = µ genügt, also N (µ, σ02 )-verteilt ist. Weiterhin sei X = (X1 , ..., Xn ) eine einfache Stichprobe vom Umfang n ∈ N zu Y , d.h. die Xi sollen identisch wie Y verteilt sein und stochastisch unabhängig ( Stichprobe mit Zurücklegen “). ” In der klassischen Statistik geht man davon aus, daß die Realisierungen xi der Stichprobenvariablen Xi präzise beobachtet werden können. Diese Voraussetzung soll im folgenden in der Weise abgeschwächt werden, daß man statt der reellen Zahlen xi nur Fuzzy-Zahlen Bi (i = 1, ..., n) wahrnimmt. Mit Hilfe des Zadehschen Erweiterungsprinzips werden anschließend die aus den unscharfen Daten resultierenden unschafen Ergebnisse der statistischen Entscheidungsfunktionen ermittelt. 13 In den folgenden drei Abschnitten werde von folgender Situation ausgegangen: Gegeben seien die o.g. Voraussetzungen mit σ02 = 4 und n = 5, weiterhin werde zunächst als Beobachtungsergebnis protokolliert x = (x1 , ..., x5 ) = (6, 1, 5, 7, 2), eine Überprüfung des Beobachtungsvorgangs gebe dann jedoch Anlaß zu der Vermutung, daß die Beobachtungsergebnisse etwas nach unten verzerrt seien, aber auch eine geringe Überschätzung nicht ganz ausgeschlossen werden könne: Die näheren Umstände sollen eine Darstellung der einzelnen Ergebnisse als F-Dreieckszahlen mit einer linken Spreizung l = 3 und einer rechten Spreizung r = 1 als angemessen erscheinen lassen: B = (B1 , ..., B5 ) mit Bi = (xi , 3, 1) für i = 1, ..., 5. 13 vgl. dazu Viertl 1992, S. 124 f. und 1996, S. 101 f., Frühwirth-Schnatter 1992. 25 µ (u) ✻ Bi B2 1 B5 B3 B1 B4 ✲ -1 0 1 5 Abb.18 3.1 14 Parameterpunktschätzungen Unter den getroffenen klassischen Annahmen ist der Stichprobenmittelwert 1 Xi =: X δ(X) := n i=1 n eine sehr gute Punktschätzfunktion für das unbekannte µ, eine Stichprobenrealisation x = (x1 , ..., xn ) liefert den Schätzwert 1 δ(x) = xi =: x, n i=1 n und man erhält folglich mit den beispielhaft angenommenen Zahlenwerten 1 (6 + 1 + 5 + 7 + 2) 5 = 4, 2 = x. δ(x1 , ..., x5 ) = Dabei ist zu beachten: Auch wenn von scharfen Beobachtungswerten xi ausgegangen wird, kann man nicht schließen, daß δ(x1 , ..., x5 ) = 4, 2 der wahre Erwartungswert von Y ist; man muß im Gegenteil unter den gegebenen Voraussetzungen davon ausgehen, daß der wahre Wert bei jeder Punktschätzung mit Wahrscheinlichkeit 1 verfehlt wird. Dies ist eine Konsequenz der speziellen hier gegebenen (stochastischen) Unsicherheit. 14 Da x als übliches Kürzel für die Stichprobenrealisation schon vergeben ist, sei für die unabhängige Variable hier der Buchstabe u gewählt. 26 10 u Wird nun zusätzlich die durch die Unschärfe der Beobachtungen gegebene (nichtstochastische) Unschärfe berücksichtigt, erhält man mit den in Abschnitt 2 hergeleiteten Rechenregeln für F-Dreieckszahlen 1 δ̂(B1 , ..., B5 ) = (B1 ❢· · · ❢B5 ). 5 Die Summe B1 ❢· · · ❢B5 =: B0 = (MB0 , lB0 , rB0 ) ist wieder eine F-Dreieckszahl, nach 2.12.1 berechnet man (MB0 , lB0 , rB0 = (M1 + · · · + M5 , l1 + · · · + l5 , r1 + · · · + r5 ) = (21, 15, 5). Wegen 1 5 > 0 folgt nach 2.12.2 schließlich 1 B0 5 = (4, 2; 3; 1) =: (MB , lB , rB ). B := δ̂(B1 , ..., B5 ) = In der folgenden Abbildung ist das unscharfe Ergebnis der Punktschätzung dargestellt: µ (u) ✻B 1 ✲ -1 0 1 5 u Abb.19 Oft stellt die Punktschätzung nur einen Zwischenschritt bei der Lösung eines umfangreicheren Anwendungsproblems dar, man kann gezwungen sein, die FSchätzung durch einen Zahlenwert zu ersetzen, man spricht von Defuzzifizierung. Ein zunächst naheliegendes Verfahren ist es, den Gipfelpunkt 1 MB = (M1 + · · · + M5 ) = 4, 2 5 27 des unscharfen Schätzergebnisses als Approximation für das unbekannte µ zu wählen, also in unserer Beispielsituation die in der Stichprobe gegebene Unschärfe einfach zu vergessen. Aber gerade hier scheint dieser Weg wenig plausibel: Die Schätzung B hat eine stark asymmetrische Zugehörigkeitsfunktion, die Wahl von MB berücksichtigt nicht die durch lB rB angedeutete Tendenz, daß die zur (stochastischen) Unsicherheit hinzukommende (nichtstochastische) Unschärfe Werte kleiner als MB eher möglich erscheinen läßt als größere Werte. Dieser Mangel wird beispielsweise durch die sog. Schwerpunktmethode vermieden, bei der man den Abszissenwert us des Schwerpunktes der Fläche zwischen Abszisse und Zugehörigkeitsfunktion als scharfen Ersatzwert für B nimmt: µ (u) ✻B 1 ✲ -1 0 uS 1 MB 5 u Abb.20 Zur Schreibvereinfachung sei µ(.) := µB (.) gesetzt. Man erhält als u-Koordinate des Flächenschwerpunktes ∞ us = uµ(u)du −∞ ∞ 15 µ(u)du −∞ Die Auswertung (siehe Anhang Satz 6.3) ergibt im vorliegenden Beispiel us = 4, 2 + 1−3 = 4, 2 − 0, 6 ≈ 3, 53 3 d.h. hier bewirken die Berücksichtigung der nichtstochastischen Unschärfe und die Defuzzifizierung mit Hilfe der Schwerpunktmethode eine gegenüber 15 Der Nenner des Quotienten sei positiv. 28 der klassischen Schätzung x = 4, 2 deutliche Korrektur. Dieses einfache Beispiel stützt folgende allgemeine Empfehlung: a) Man versuche die Zuverlässigkeit der gegebenen Daten zu beurteilen, b) ggf. beschreibe man die nichtstochastische Unschärfe der Daten durch geeignete (subjektiv festzulegende) Zugehörigkeitsfunktionen, c) man berechne die unscharfe Schätzung und defuzzifiziere ggf., d) man kontrolliere evtl. die Sensitivität des Ergebnisses gegenüber Variationen der Zugehörigkeitsfunktion. Zu Beginn dieses Abschnittes wurde der F-Schätzwert B = 15 (B1 ❢· · · ❢B5 ) für µ aus der C-Welt-Schätzung x = 15 (x1 + · · · + x5 ) = δ(x1 , ..., x5 ) hergeleitet, indem einfach in dieser Formel die scharfen Beobachtungswerte xi durch die F-Beobachtungen Bi (i = 1, ..., 5) ersetzt wurden; die Zugehörigkeitsfunktion µB war wegen der hier verwendeten F-Dreieckszahlen leicht zu bestimmen. Natürlich kann man die C-Schätzfunktion δ : R5 → R auch mit Hilfe des Erweiterungsprinzips übertragen, man erhält die F-Schätzfunktion δ̂ : [F P(R)]5 → F P(R), die Stichprobe B = (B1 , ..., B5 ) liefert die FSchätzung δ̂(B) mit 3.1.1 µδ̂(B) (u) = sup (x1 ,...,x5 )∈R5 x=u min{µB1 (u), ..., µB5 (u)} für alle u ∈ R. Man könnte direkt nachrechnen, daß beide Wege dasselbe Ergebnis haben. Weiterführender ist aber, sich allgemein klar zu machen, daß die Übereinstimmung auf mehrfacher Anwendung des Satzes 6.1 (und Bemerkung 6.2) aus dem Anhang beruht. 29 3.2 Alternativtests Gegeben seien die auf Seite 25 geschilderten Voraussetzungen. Mit einem Signifikanzniveau α = 0, 05 soll für µ0 = 2 die Nullhypothese H0 : µ = µ0 gegen die Gegenhypothese H1 : µ = µ0 getestet werden. Auf der Basis einer einfachen Stichprobe X = (X1 , ..., Xn ) mit der Realisation x = (x1 , ..., xn ) ∈ Rn wird für die Teststatistik T (X) = X − µ0 √ n σ0 ihre Realisation x − µ0 √ n σ0 berechnet. Für die N(0,1)-Verteilung (Gaußverteilung) ist das 0,975-Quantil λ0,975 = 1, 96. Ein gleichmäßig bester unverzerrter Test für die o.g. Hypothesen zum Niveau α ist dann durch die folgende Entscheidungsvorschrift gegeben: H0 annehmen, falls − λ0,975 ≤ T (x) ≤ λ0,975 , T (x) = H1 annehmen in den übrigen Fällen. Mit dem beispielhaft gewählten Stichprobenbefund x = (x1 , ...x5 ) = (6, 1, 5, 7, 2) folgt 4, 2 − 2 2, 24 = 2, 46 > 1, 96 = λ0,975 , T (x) = 2 H0 wird abgelehnt, der wahre Erwartungwert µ ist signifikant von dem hypothetischen Wert µ0 = 2 verschieden. Ehe die Auswertung von zusätzlicher nichtstochastischer Imperfektion des empirischen Befundes analysiert wird, soll zunächst die formale Struktur des geschilderten Alternativtests genauer dargestellt werden: Durch die Teststatistik ist eine Abbildung T : Rn → R des Stichprobenraumes X = Rn in die Menge der reellen Zahlen R gegeben, in der zwei Mengen A∗ = [−λ0,975 , λ0,975 ] und K ∗ =] − ∞, −λ0,975 [∪]λ0,975 , ∞[ 30 ausgezeichnet sind; T (x) ∈ A∗ führt zur Annahme von H0 und T (x) ∈ K ∗ zur Annahme von H1 . Kürzt man die Entscheidung Annahme von H0 “ mit d0 und Annahme ” ” von H1 “mit d1 ab, kann man eine weitere Abbildung δ ∗ : R → D := {d0 , d1 } definieren mit ∗ δ (t) = Die Verknüpfung : t ∈ A∗ : t ∈ K∗ d0 d1 δ := δ ∗ ◦ T wird als Alternativtest für H0 gegen H1 bezeichnet, D als sein Entscheidungsraum, A := {(x1 , ..., xn ) ∈ Rn | δ(x1 , ..., xn ) = d0 } als sein Annahmebereich und K := {(x1 , ..., xn ) ∈ Rn | δ(x1 , ..., xn ) = d1 } als sein kritischer Bereich oder Verwerfungsbereich. Es gilt d0 : x ∈ A δ(x) = d1 : x ∈ K Der Zusammenhang zwischen T, δ ∗ und δ ist in der folgenden Abbildung veranschaulicht. δ Rn T ✇ R Abb.21 31 ✲ {d0 , d1 } = D ✼ Nun werde von der F-Stichprobenrealisation B = (B1 , ..., B5 ) ausgegangen. Erweitert man die Abbildung T : R5 → R mit x − µ0 √ 5 für alle (x1 , ..., x5 ) ∈ R5 σ0 nach dem Erweiterungsprinzip zu der Abbildung T (x1 , ..., x5 ) = T̂ : [F P(R)]5 → F P(R), erhält man für B = (B1 , ..., B5 ) mit Bi = (xi ; 3, 1) und i=1,...,5 B − µ0 √ 5 σ0 (4, 2; 3; 1) − (2; 0, 0) ≈ 2, 24 2 = (2, 46; 3, 36; 1, 12) ∈ F P(R), T̂ (B1 , ..., B5 ) = diese F-Zahl ist mit den Schwellenwerten −λ0,975 und λ0,975 in der folgenden Graphik dargestellt. µ ✻ T̂ (B) (u) 1 0,86 ✲ 2 -1 0 MT̂ (B) 1 us −λ0,975 u 5 λ0,975 Abb.22 Defuzzifizierung mit Hilfe des Gipfelpunktes führt wie in der C-Welt zur Ablehnung von H0 wegen MT̂ (B) = 2, 46 > 1, 96 = λ0,975 . Allerdings weist die stark asymmetrische Zugehörigkeitsfunktion auf erhebliches Gewicht “links ” von λ0,975 hin, Zweifel an der gewonnenen Entscheidung scheinen nicht unberechtigt. Eine Defuzzifizierung mit Hilfe der Schwerpunktmethode (siehe Anhang Satz 6.3) liefert us = 2, 46 + 1, 12 − 3, 36 = 1, 71 3 32 d.h. −λ0,975 = −1, 96 ≤ us = 1, 71 ≤ 1, 96 = λ0,975 . Damit wird jetzt die Nullhypothese H0 akzeptiert. Man sieht, daß die Berücksichtigung der nichtstochastischen Imperfektion zumindest Zweifel an der Stringenz der in der C-Welt getroffenen Entscheidung weckt. Deutlicher wird die Problematik noch, wenn auch die Abbildung δ ∗ : R → D = {d0 , d1 } mit Hilfe des Erweiterungsprinzips zu einer Abbildung δ̂ ∗ : F P(R) → F P(D) erweitert wird. Für jedes H ∈ F P(R) erhält man als Bild δ̂ ∗ (H) ∈ F P(D) mit der Zugehörigkeitsfunktion µδ̂∗ (H) (d0 ) = (u) sup µH u∈R δ ∗ (u)=d0 (u) = sup µH u∈A∗ µδ̂∗ (H) (d1 ) = (u) sup µH . u∈K ∗ Man erhält (vgl. Anhang Beispiel 6.4) µδ̂∗ (T̂ (B)) (d0 ) = 0, 86 µδ̂∗ (T̂ (B)) (d1 ) = 1. Hier wird d1 zwar mit dem Akzeptanzgrad 1 bewertet, aber d0 wird der Akzeptanzgrad 0,86 zugebilligt, man wird in der Praxis die Ablehnung von H0 nicht mehr als so klar wie durch das Niveau α = 0, 05 suggeriert ansehen, ggf. weitere Stichproben ziehen und dabei die Unschärfe der Messungen zu verringern versuchen. Es überlagern sich zwei Fehlermöglichkeiten: Einmal durch die Stochastik bedingt, dann auch durch die Ungenauigkeit der Daten. Die Fuzzy- Entscheidung ist gegeben durch die F-Menge {(d0 ; 0, 86), (d1 ; 1)} ∈ F P(D) in D = {d0 , d1 }. 33 3.3 Konf idenzbereichsschätzungen Es werde wieder von den auf Seite 25 gegebenen Voraussetzungen ausgegangen. Der in 3.1 verwendete Schätzer δ(X) = n1 ΣXi = X liefert zwar bei gegebener Stichprobenrealisation x = (x1 , ..., xn ) einen präzisen Schätzwert x = n1 Σxi für das unbekannte µ und hat unter den getroffenen Annahmen auch sehr nützliche statistische Eigenschaften (Erwartungstreue, Effizienz etc.), trifft aber mit Wahrscheinlichkeit 1 daneben “. Man ergänzt ” Punktschätzungen deshalb durch Schätzverfahren, die mit vorzugebender Sicherheitswahrscheinlichkeit den unbekannten wahren Parameterwert überdecken, muß dafür aber einen Verlust an Präzision in Kauf nehmen; diese Konfidenzbereichsschätzfunktionen liefern i.a. ein Kontinuum von Parameterwerten als Näherungswerte. Es sei α ∈]0, 1[ eine kleine Zahl. In unserem Beispiel ist eine Konfidenzbereichsschätzung für µ ∈ Θ = R durch die Abbildung δ : Rn → P(Θ) gegeben mit 3.3.1 σ0 σ0 δ(x1 , ..., xn ) = x − √ λ1− α2 , x + √ λ1− α2 , n n man bezeichnet diesen Schätzbereich speziell als ein (1−α)- Konfidenzintervall. Für die Beispielsdaten erhält man mit n = 5, x = (x1 , ..., x5 ) = (6, 1, 5, 7, 2), α = 0, 05 und λ1− α2 = λ0,975 = 1, 96 das Konfidenzintervall δ(x) = [4, 2 − 1, 75; 4, 2 + 1, 75] = [2, 45; 5, 95]. Man beachte, daß die gewählte Bereichsschätzfunktion mit 95 % Sicherheitswahrscheinlichkeit ein Konfidenzintervall liefert, das den wahren unbekannten Wert µ überdeckt, aber natürlich für den konkreten Schätzbereich mit Sicherheit entweder nur µ ∈ δ(x) oder µ ∈ / δ(R) gilt. Nun soll zusätzlich die nichtstochastische Imperfektion durch die F-Stichprobenrealisation B = (B1 , ..., B5 ) mit Bi = (xi , 3, 1) berücksichtigt werden. Bereichsschätzfunktionen gelten bereits in der C-Welt als die unhandlichsten der drei klassichen Entscheidungsverfahren, da ihr Entscheidungsraum16 D 16 vgl. S. 38 34 die Potenzmenge einer i.a. selbst schon überabzählbaren Menge ist - in unserem Fall hat man D = P(Θ) mit Θ = R -, während für die zuvor behandelte Punktschätzung D = Θ = R und für den Alternativtest sogar D = {d0 , d1 } gilt. Vor diesem Hintergrund ist es nicht überraschend, daß bei Bereichsschätzungen der Übergang in die F-Welt mühselig sein wird. Durch das Erweiterungsprinzip wird die Konfidenzbereichsschätzung δ : Rn → P(Θ) überführt in die Abbildung δ̂ : [F P(R)]n → F P(P(Θ)), d.h. einer F-Stichprobe B = (B1 , ..., Bn ) ∈ [F P(R)]n wird eine F-Menge δ̂(B) ∈ F P(P(Θ)) zugeordnet, deren Zugehörigkeitsfunktion µδ̂(B) für jede Menge H ∈ P(Θ) einen Zugehörigkeitswert µδ̂(B) (H) festlegt. Dieser Zugehörigkeitswert gibt für jedes H ∈ P(Θ) den Grad an, mit dem es aufgrund des unscharfen Stichprobenbefundes als (1 − α)-Konfidenzschätzbereich in Frage kommt. Nach Satz und Definition 2.11 erhält man 3.3.2 µδ̂(B) (H) = sup (x1 ,...,xn )∈Rn δ(x1 ,...,xn )=H min{µB1 (x1 ), ..., µBn (xn )} für alle H ∈ P(Θ). Diese Zugehörigkeitsfunktion soll nun für die Beispielsdaten mit n = 5 und σ0 √ λ α = 1, 75 numerisch bestimmt werden. Für alle (x1 , ..., x5 ) ∈ R5 gilt n 1− 2 δ(x1 , ..., x5 ) = [x − 1, 75; x + 1, 75], die Menge aller derartigen Konfidenzintervalle ist gegeben durch J := {[h − 1, 75; h + 1, 75] | h ∈ R}. Da als Bildpunkte der Bereichsschätzung δ nur die Elemente von J auftreten, folgt für alle H ∈ [P(Θ) − J] µδ̂(B) (H) = sup (x1 ,...,x5 )∈R5 δ(x1 ,...,x5 )=H min{µB1 (x1 ), ..., µB5 (x5 )} = sup min{µB1 (x1 ), ..., µB5 (x5 )} ∅ = 0 35 und für alle H ∈ J mit H = [h − 1, 75; h + 1, 75] erhält man µδ̂(B) (H) = sup (x1 ,...,x5 )∈R5 x=h min{µB1 (x1 ), ..., µB5 (x5 )}, nach 3.1.1 von Seite 29 gilt in diesem Fall weiter µδ̂(B) (H) = µB (h). 3.3.3 In der folgenden Grafik sind die Zugehörigkeitsfunktion µB (.) und drei Intervalle H = [h−1, 75; h+1, 75] so dargestellt, daß auch ihre Zugehörigkeitswerte µδ̂(B) (H) = µB (h) abgelesen werden können: µB (h) ✻ ✒ h ✲ h=6 5 ✲ 1 h = 4, 2 ✲ t h=3 1 ✲ 0 1 5 10 t Abb.23 Die zu der Abbildung gehörenden Zahlenwerte sind in der folgenden Tabelle zusammengestellt h h-1,75 3 1,25 4,2 2,45 6 4,25 h+1,75 µB (h) 4,75 0,6 5,95 1 7,75 0 36 t t Wäre nur stochastische Imperfektion mit dem Stichprobenbefund x = (6,1,5,7,2) gegeben, so hätte man mit x = h = 4, 2 das einzige Konfidenzintervall [2, 45; 5, 95] erhalten. Da aber zusätzlich nichtstochastische Imperfektion aufgetreten ist, besteht das Ergebnis aus einer F-Menge in P(Θ), positive Zugehörigkeitswerte weisen nun gewisse Intervalle auf, von denen zwei in der Zeichnung dargestellt sind. Das Resultat ist nicht unplausibel, aber selbst in dem einfachen Beispielsfall kompliziert und wenig anschaulich. Die nachfolgend geschilderte Vorgehensweise ermöglicht - unter Inkaufnahme eines Informationsverlustes - den Übergang von dem schwer zugänglichen Wertevorrat F P(P(Θ)) der F-Bereichsschätzung δ̂ zu der leichter vorstellbaren Menge F P(Θ). Für jedes t ∈ Θ wird die maximale Akzeptanz bestimmt, das wahre, unbekannte µ zu sein, indem der maximale Zugehörigkeitswert berechnet wird, den ein H ∈ P(Θ) mit t ∈ H bzgl. µδ̂(B) aufweist. Durch diese Konstruktionsvorschrift wird eine F-Menge in P(Θ) festgelegt, sie werde als durch δ̂ in P(Θ) induzierte F-Konfidenzbereichsschätzung bezeichnet, das Symbol sei G(δ̂(B)). Man hat also 3.3.4 sup µδ̂(B) (H) für alle t ∈ Θ. µG(δ̂(B)) (t) = H∈P(Θ) t∈H Da im vorliegenden Beispiel alle H ∈ [P(Θ) − J] den Zugehörigkeitswert µδ̂(B) (H) = 0 haben, folgt weiter mit 3.3.3 µG(δ̂(B)) (t) = sup µδ̂(B) (H) für alle t ∈ Θ H∈J t∈H = sup t∈[h−1,75;h+1,75] = sup t−1,75≤h≤t+1,75 µB (h) µB (h). Wegen µB (h) = 0 für h ≤ 1, 2 oder h ≥ 5, 2 und µB (h) = 1 für h=4,2 folgt 0 für t ≤ −0, 55 oder t ≥ 6, 95 µG(δ̂(B)) (t) = 1 für 2, 45 ≤ t ≤ 5, 95 Da B eine F-Dreieckszahl ist, erhält man weiter µB (t + 1, 75) für −0, 55 ≤ t ≤ 2, 45 µG(δ̂(B)) (t) = µB (t − 1, 75) für 5, 95 ≤ t ≤ 6, 95 Der Graph dieser Zugehörigkeitsfunktion ist in der folgenden Abbildung gegeben: 37 µ 1 ✻ G(δ̂(B)) (t) ✲ -1 0 1 5 Abb.24 Hier weisen alle t aus dem C-Konfidenzintervall [2, 45; 5, 95] den Zugehörigkeitsgrad 1 auf, werden also voll als mögliche Kandidaten für das unbekannte, wahre µ akzeptiert, aber eine Reihe von Werten außerhalb dieses Intervalls wird nicht strikt verworfen, sondern mit nach außen “abnehmender Akzep” tanz noch in Erwägung gezogen. Im nächsten Abschnitt wird auf Seite 42 erläutert, wie mit Hilfe der Gleichung 3.3.4 eine zusätzliche Abbildung G(δ̂)(.) mit δ̂ G [F P(R)]n −→ F P(P(Θ)) −→ F P(Θ) eingeführt wird, um die Struktur der vorangegangenen Überlegungen deutlich werden zu lassen. 38 t 4 Die formale Struktur statistischer Entscheidungsmodelle mit unscharfen Stichproben Den zuvor behandelten statistischen Entscheidungsverfahren - Punktschätzungen, Alternativtests, Bereichsschätzungen - liegen die im folgenden dargestellten Bausteine zugrunde: Eine Zufallsvariable Y : Ω̃ → R mit ganz oder teilweise unbekannter Wahrscheinlichkeitsverteilung QY,ϑ beschreibt den interessierenden Umweltausschnitt; dabei ist ϑ ein unbekannter Parameter aus dem zugehörigen Parameterraum Θ; Ω̃ und R sind Ergebnisräume von Wahrscheinlichkeitrsräumen (Ω̃, F̃, P̃ ) bzw. (R, B1 , QY,ϑ ). Eine weitere Zufallsvariable X = (X1 , ..., Xn ) : Ω → Rn mit der Wahrscheinlichkeitsverteilung QX,ϑ modelliert die Stichprobenziehung vom Umfang n zu Y, die entsprechenden Wahrscheinlichkeitsräume sind (Ω, F, P ) und (Rn , Bn , QX,ϑ ). Liegt für jede Stichprobenrealisation x = (x1 , ..., xn ) ∈ Rn die statistische Entscheidung δ(x) (Punktschätzung, Testentscheidung bzw. Schätzbereich) fest, hat man eine Abbildung δ : Rn → D vorliegen, für deren sog. Entscheidungsraum D gilt 4.1 D = Θ Parameterpunktschätzung17 4.2 D = {d0 , d1 } Alternativtest18 4.3 D = P(Θ) Bereichsschätzung17 Der in dieser Arbeit gewählte Zugang zum Gebiet der Statistik mit unscharfen Stichproben geht davon aus, daß nicht die exakte Stichprobenrealisation x = (x1 , ..., xn ) ∈ Rn beobachtet wird, sondern nur ein unscharfes Bild L(x) ∈ [F P(R)]n . Die somit vorliegende Abbildung L : Rn → [F P(R)]n soll hier als Fuzziness-erzeugende-Funktion (FE-Funktion) bezeichnet werden. Natürlich wird man bei einem unscharfen Stichprobenbefund zunächst nur mit einer unscharfen statistischen Entscheidung rechnen können, die ursprüngliche statistische Entscheidungsfunktion δ : Rn → D wird mit Hilfe des Erweiterungsprinzips von Zadeh zu einer Entscheidungsfunktion 17 In zahlreichen Anwendungsfällen interessiert man sich nicht für ϑ ∈ Θ selbst, sondern für eine transformierte Größe γ(ϑ). Man hat dann in 4.1 D = γ(Θ) und in 4.3 D = P(γ(Θ)). 18 Zu d0 , d1 siehe Abschnitt 3.2. 39 δ̂ : [F P(R)]n → F P(D) verallgemeinert. Im folgenden Diagramm sind die Zusammenhänge noch einmal übersichtlich dargestellt: (Ω̃, F̃, P̃ ) (R, B1 , QY,ϑ ) Y Ω̃ −−−→ R (Rn , Bn , QX,ϑ ) (Ω, F, P ) Ω X L Rn δ −−−→ −−−→ [F P(R)]n δ̂ F P(D) D C-Welt (stochastische Imperfektion, Unsicherheit) F-Welt (nichtstochastische Imperfektion, Fuzziness, Unschärfe) Durch die Verknüpfung L o X überlagern sich beide Arten der Imperfektion Abb.25 Liegt eine Punktschätzung mit D = Θ vor, so wird man, wie in Abschnitt 3.1 geschildert, das unscharfe Schätzergebnis δ̂(B1 , ..., Bn ) ∈ F P(Θ) ggf. noch defuzzifizieren zu einem scharfen Schätzwert M (δ̂(B1 , ..., Bn )), das obige Diagramm ist in diesem Fall um eine Abbildung M : F P(Θ) → Θ, welche die gewählte Defuzzifizierungsmethode beschreibt, zu erweitern: L −→ Rn −→ [F P(R)]n δ δ̂ F P(Θ) M Θ Θ Abb.26 Ist man im Fall des Alternativtests gezwungen, eine scharfe Entscheidung zu treffen, wird man die Entscheidung δ(x) wählen und δ̂(B) unberücksichtigt lassen, die Defuzzifizierung durch eine Abbildung M erübrigt sich. Bei Alternativtests wird aber ein anderes Problem deutlich: Wie in Abschnitt 3.2 geschildert, konstruiert man i.a. in der C-Welt nicht direkt die gesuchte 40 Entscheidungsfunktion δ : Rn → D = {d0 , d1 }, sondern transformiert den Ergebnisraum Rn mit einer Abbildung ( Statistik “) T : Rn → R in einen ” niedrigdimensionalen Raum, hier die Menge R. Erst in einem zweiten Schritt wird durch die Abbildung δ ∗ : R → D auf der Basis des transformierten Stichprobenbefundes T (x) die Entscheidung δ ∗ (T (x)) = (δ ∗ ◦ T )(x) =: δ(x) festgelegt, der Zusammenhang ist durch die folgende Abbildung veranschaulicht: δ ✲ D = {d0 , d1 } Rn ✼ T ❘ δ∗ R Abb.27 Folglich treten auch beim Übergang in die F-Welt drei entsprechende Funktionen T̂ , δ̂ ∗ und δ̂ auf. In der C-Welt wird definiert δ := δ ∗ ◦ T. Wendet man das Erweiterungsprinzip auf die Abbildungen T, δ ∗ und δ an, erhebt sich die Frage, ob der obige Zusammenhang gültig bleibt, d.h. ob δ̂ = δ̂ ∗ ◦ T̂ gilt, wie in der folgenden Abbildung dargestellt: δ̂ [FP(R)]n T̂ ✲ FP(D) ✼ δ̂ ∗ ❘ FP(R) Abb.28 Der anschließende Satz hält die positive Antwort in etwas allgemeinerer Form fest, sein Beweis ist im Anhang auf den Seiten 45 f. gegeben. 4.1 Satz (Anhang Satz 6.1): Es seien Ω = ∅, M = ∅, Λ = ∅ C-Mengen und f :Ω→Γ g:Γ→Λ g◦f :Ω→Λ 41 Abbildungen. Dann gilt für die nach dem Erweiterungsprinzip von Zadeh ermittelten Abbildungen fˆ : F P(Ω) → F P(Γ) ĝ : F P(Γ) → F P(Λ) (g ◦ f ) : F P(Ω) → f P(Λ) der Zusammenhang (g ◦ f ) = ĝ ◦ fˆ, d.h. es ist gleichgültig, ob man Abbildungen zunächst in der C-Welt verknüpft und dann das Ergebnis in die F-Welt erweitert oder erst in die F-Welt übergeht und dort die entsprechenden Erweiterungen verknüpft. Es sei daran erinnert, daß auf der Anwendung dieses Satzes auch das in Abschnitt 3.1 Parameterpuntschätzungen “geschilderte Verfahren beruht, ” n xi zu durch Austausch der xi gegen die Bi von der C-Welt-Formel x = n1 i=1 der entsprechenden F-Welt-Schätzung zu gelangen. Zum Schluß dieses Abschnitts soll auf die Modellstruktur bei Bereichsschätzungen eingegangen werden: In 3.3 wurde dargestellt, daß die C-Welt Bereichsschätzung δ : Rn → P(Θ) in der F-Welt in die Abbildung δ̂ : [F P(R)]n → F P(P(Θ)) mit einem sehr unhandlichen Wertevorrat übergeht. Deshalb wurde in 3.3 dem F-Konfidenzbereich δ̂(B) ∈ F P(P(Θ)) in Gleichung 3.3.4 ein induzierter F-Konfidenzbereich G(δ̂(B)) ∈ F P(Ω) zugeordnet. Diese Zuordnung kann man für jede F-Menge δ̂(B) vornehmen. Setzt man für alle F-Mengen aus F P(P(Θ)) − δ̂([F P(R)]n ) als Bildpunkt z.B. die leere Menge fest, hat man eine Abbildung G : F P(P(Θ)) → F P(Θ) definiert, das folgende Diagramm veranschaulicht den Zusammenhang: −→ L Rn −→ δ P(Θ) [F P(R)]n δ̂ F P(P(Θ)) G F P(Θ) Abb.29 Es ist zu beachten, daß die Abbildung G nicht mit Hilfe des Zadehschen Erweiterungsprinzips hergeleitet wird, also keine Entsprechung in der C-Welt hat. 42 5 Zusammenfassung und Ergänzungen Wir beschreiben und analysieren die Realität mit Hilfe von Modellen und Theorien. Die Informationen über die Realität sind mehr oder weniger unscharf. Oft wird man diese Unschärfe wegen des ohnehin nur approximativen Charakters unserer Überlegungen vernachlässigen können. Je genauer wir aber den uns interessierenden Umweltausschnitt darstellen, desto größere Bedeutung kommt der Unschärfe der Daten zu, desto wichtiger kann es sein, diese Unschärfe explizit in Rechnung zu stellen. In den vorausgehenden Abschnitten wurde zunächst ein interessierender Umweltausschnitt durch ein klassisches wahrscheinlichkeitstheoretisch- statistisches Modell dargestellt und dann in einem zweiten Schritt die Auswirkung einer zusätzlichen nichtstochastischen Imperfektion der Zufallsstichprobe analysiert. Durch die Hintereinanderschaltung von C-Welt und F-Welt ist es möglich, die Güte der angewendeten statistischen Entscheidungsverfahren im Rahmen der klassischen Theorie zu beurteilen. Dieses Vorgehen ist relativ einfach nachzuvollziehen, kann aber nur vorläufigen Charakter haben: Es liegt auf der Hand, in einem nächsten Schritt direkt die zusammengesetzte Funktion L ◦ X aus der nachfolgenden Abbildung X L Ω −→ Rn −→ [F P(R)]n L◦X Abb.30 zu betrachten und sie durch eine geeignete Erweiterung des Modells als FZufallsvariable über dem Wahrscheinlichkeitsraum (Ω, F, P ) aufzufassen. Ein grundlegender Ansatz, den Begriff der Zufallsvariablen von der C-Welt in die F-Welt zu verallgemeinern, geht auf Kwakernaak (1978) zurück (vgl. auch Kruse, H., Meyer, K.D. (1987)). Allerdings würde die Verfolgung dieses Weges den Rahmen der vorliegenden einführenden Abhandlung sprengen. Eine interessante Anwendung könnte z.B. bei der F-Punktschätzung darin bestehen, die bisher sehr unbefriedigend begründete Auswahl einer Defuzzifizierungsmethode im Rahmen einer F-statistischen Entscheidungstheorie mit Hilfe geeigneter Optimalitätskriterien zu objektivieren. Ebenfalls zu aufwendig für dieses Einstiegspaper wäre ein Abriß der FuzzyLogik. Deshalb soll nur ein für den Anwender besonders interessanter Gegenstand erwähnt werden. In der klassischen Logik ist der Modus ponens eine häufig verwendete Schlußregel: Es seien A und B Aussagen und es gelte 43 A impliziert B “. Beobachtet man A, so folgt zwingend die Gültigkeit von ” B. In der Praxis stellt man oft fest, daß die Aussagen oder auch die Implikation nur angenähert gelten. Während in der klassischen Logik allein die Wahrheitswerte 1 (wahr) und 0 (falsch) zugelassen sind, eröffnet die FuzzyLogik, die als Wertebereich der Wahrheitswerte das ganze Kontinuum [0, 1] zur Verfügung hat, die Möglichkeit, den Umgang mit nur näherungsweise geltenden Aussagen und Relationen exakt darzustellen (vgl. z.B. Biewer, S. 274 ff und Kahlert, J., Frank, S. 41 ff). In der Einleitung wurde darauf hingewiesen, daß Fuzzy-Methoden eine neue Möglichkeit bieten, in Modellen und Theorien die Datenqualität besser als bisher explizit zu berücksichtigen und somit ggf. die Realitätsnähe der Überlegungen zu verbessern. Bereits die einfachen vorangehenden Beispiele zeigten andererseits, daß man diesen Vorteil mit erhöhtem formalen Aufwand bezahlen muß, es gilt stets abzuwägen, ob die Berücksichtigung nichtstochastischer Imperfektion dem jeweiligen Problem angemessen ist. Dazu ist eine sorgfältige Problem- und Datenanalyse nicht zu umgehen, Fuzzy-Methoden machen sie nicht überflüssig, sondern erfordern zusätzliche präzise Überlegungen. Sehr einprägsam wurde von P.T. Johnston 1988 formuliert: Fuzzy ” mathematics is not an excuse for fuzzy thinking “. 44 6 6.1 Anhang Satz: Es seien Ω = ∅, Γ = ∅, Λ = ∅ C-Mengen und f :Ω→Γ g:Γ:Λ g◦f :Ω→Λ Abbildungen. Dann gilt für die nach dem Erweiterungsprinzip von Zadeh ermittelten Abbildungen fˆ : F P(Ω) → F P(Γ) ĝ : F P(Γ) → F P(Λ) (g ◦ f ) : F P(Ω) → F P(Ω) der Zusammenhang (g ◦ f ) = ĝ ◦ fˆ. 6.1.1 Beweis: Es seien A ∈ F P(Ω) eine F-Menge mit der Zugehörigkeitsfunktion µA : Ω → [0, 1] und λ ∈ Λ. Dann gilt für die Zugehörigkeitsfunktion der F-Menge (g ◦ f )(A) nach Satz und Definition 2.9 µ( (λ) = g◦f )(A) sup ω∈(g◦f )−1 ({λ}) = µA (ω) sup ω∈f −1 (g −1 ({λ})) µA (ω) =: r, für die Zugehörigkeitsfunktion der F-Menge (ĝ ◦ fˆ)(A) erhält man µ(ĝ◦fˆ)(A) (λ) = µĝ(fˆ(A)) (λ) = sup γ∈g −1 ({λ}) = µfˆ(A) (γ) sup sup γ∈g −1 ({λ}) ω∈f −1 ({λ}) µA (ω) =: s In der folgenden Abbildung ist der Zusammenhang zwischen den auftretenden C-Mengen dargestellt: 45 ✲ f Ω ✬ g Γ ✲ Λ ✩ ✬ ✩ ✬✩ {λ} {γ} ✫✪ ✫ ✫ ✪ ✪ f −1 ({γ}) f −1 (g −1 ({λ})) g −1 ({λ}) Abb.31 a) Gilt f −1 (g −1 ({λ})) = ∅, so folgt (∀γ ∈ g −1 ({λ}))(f −1 ({γ}) = ∅) und mit 2.8 r= sup ω∈f −1 (g −1 ({λ})) µA (ω) = 0 = sup sup γ∈g −1 ({λ}) ω∈f −1 ({γ}) µA (ω) = s, also die Behauptung 6.1.1 des Satzes. b) Es gelte nun f −1 (g −1 ({λ})) = ∅ und folglich auch g −1 ({λ}) = ∅. Für alle γ ∈ g −1 ({λ}) folgt f −1 ({γ}) ⊆ f −1 (g −1 ({λ})) und somit sup ω∈f −1 ({γ}) µA (ω) ≤ sup ω∈f −1 (g −1 ({λ})) µA (ω), weiter erhält man 6.1.2 Es seien s= sup sup γ∈g −1 ({λ}) ω∈f −1 ({γ}) µA (ω) ≤ sup ω∈f −1 (g −1 ({λ})) µA (ω) = r. ω1 , ω2 , ... ∈ f −1 (g −1 ({λ})) mit sup µA (ωi ) = r i∈N und γ1 , γ2 , ... ∈ g −1 ({λ}) mit ωi ∈ f −1 ({γi }) gewählt. Dann gilt 46 6.1.3 sup sup γ∈g −1 ({λ}) ω∈f −1 ({γ}) s= ≥ sup i∈N ≥ sup i∈N µA (ω) sup ω∈f −1 ({γi }) µA (ω) sup ωi ∈f −1 ({γi }) µA (ω1 ) = sup µA (ωi ) = r. i∈N Aus 6.1.2 und 6.1.3 folgt r = s und damit auch für den Fall b) die Behauptung 6.1.1 des Satzes. 6.2 Bemerkung: Man überlegt sich leicht, daß die Aussage des Satzes entsprechend auch bei Anwendung des Erweiterungsprinzips aus Satz und Definition 2.11 gilt. 6.3 Satz: Es sei (M, l, r) mit l = 0 = r eine F-Dreieckszahl mit der Zugehörigkeitsfunktion µ. Dann gilt für den Abszissenwert xs ihres Flächenschwerpunktes s xs = M + r−1 . 3 Beweis: µ(x) 1 ✻ Schwerpunkt ✉ ✲ M −l M xS M +r x Abb.32 Für die Zugehörigkeitsfunktion µ gilt 0 : x ≤ M −l 1 1 x+1− lM : M −l ≤ x ≤ M l µ(x) = 1 1 x + 1 + M : M ≤ x ≤ M +r − r r 0 : M + r ≤ x. 47 Damit folgt ∞ xs = xµ(x)dx −∞ ∞ µ(x)dx −∞ M −l = M 0dx + −∞ M −1 M −l = M+ M 0dx + −∞ 6.4 x(1 + (1 + M −1 x l − M )dx l + x l − M )dx l + M+r M M+r M x(1 − (1 − x r x r + + M )dx r M )dx r + + ∞ 0dx M +r ∞ 0dx M +r r−l . 3 Beispiel: In Abschnitt 3.2 wird auf S. 33 die Funktion δ ∗ : R → D = {d0 , d1 } mit d0 : t ∈ A∗ = [−1, 96; 1, 96] ∗ δ (t) = d1 : t ∈ K ∗ =] − ∞; −1, 96[∪]1, 96; ∞[ zu δ̂ ∗ : F P(R) → F P(D) erweitert. Die Zugehörigkeitsfunktion µT̂ (B1 ,...,B5 ) =: µ der Dreieckszahl T̂ (B) := T̂ (B1 , ..., B5 ) = (2, 46; 3, 36; 1, 12) ∈ F P(R) ist in der folgenden Abbildung dargestellt µ(t) 1 ✻ 0,86 ✲ -2 −λ0,975 -1 0 1 5 λ0,975 = 1, 96 Abb.33 48 t Es gilt nach dem Beweis zu Satz 6.3 0 0, 3t + 0, 27 µ(t) = −0, 89t + 3, 2 0 : t ≤ −0, 9 : −0, 9 ≤ t ≤ 2, 46 : 2, 46 ≤ t ≤ 3, 58 : 3, 58 ≤ t (Die Zahlen sind auf zwei Nachkommastellen gerundet). Mit dem Erweiterungsprinzip von Zadeh erhält man µδ̂∗ (T̂ (B)) (d0 ) = sup µT̂ (B) (t) t∈A∗ = 0, 3 · 1, 96 + 0, 27 = 0, 86 µδ̂∗ (T̂ (B)) (d1 ) = sup µT̂ (B) (t) t∈K ∗ = 0, 3 · 2, 46 + 0, 27 = 1 Damit gilt δ̂ ∗ (T̂ (B)) = {(d0 ; 0, 86), (d1 ; 1)} ∈ F P(D). 49 7 Literaturverzeichnis Altrock, C.v.: Fuzzy-Logic, Bd. 1 Technologie, München, Wien, 1995 Biewer, B.: Fuzzy-Methoden, Berlin et al. 1997 Bothe, H.H.: Fuzzy-Logic, Einführung in Theorie und Anwendungen, Berlin et al. 1995 Frühwirth-Schnatter, S.: On Statistical Inference for Fuzzy Data with Applications to Descriptive Statistics, Fuzzy Sets and Systems 50, 1992, 143-165 Kahlert, J., Frank, H.: Fuzzy-Logik und Fuzzy-Control, Braunschweig, Wiesbaden 1994 Kruse, R., Meyer, K.D.: Statistics with Vague Data, Dordrecht et al. 1987 Kwakernaak, H.: Fuzzy Random Variables - I. Definitions and Theorems, Information Sciences 15, 1978, 1-29 Rommelfanger, H.: Fuzzy-Decision Support-Systeme; Entscheiden bei Unschärfe, Berlin et al. 1994 Viertl,R.: Statistical Methods for Non-Precise Data, N.Y. et al. 1996 Viertl,R.: On Statistical Inference Based on Non-precise Data, Bandemer, H.(Hrsg.): Modelling Uncertain Data, Berlin 1992 Zadeh, L.A.: Fuzzy Sets Information and Control 8, 1965, 338-353 50