Research Collection Doctoral Thesis Informationsverknüpfung im Bauwesen eine Anwendung der Bayes'schen Methode auf die Ingenieurproblematik Author(s): Scheiwiller, Alex Peter Publication Date: 1999 Permanent Link: https://doi.org/10.3929/ethz-a-002063319 Rights / License: In Copyright - Non-Commercial Use Permitted This page was generated automatically upon download from the ETH Zurich Research Collection. For more information please consult the Terms of use. ETH Library Diss. ETH Nr. 13039 Informationsverknüpfung Eine Anwendung der im Bauwesen Bayes'schen Methode auf die Ingenieurproblematik ABHANDLUNG zur Erlangung des Titels DOKTOR DER TECHNISCHEN WISSENSCHAFTEN der EIDGENÖSSISCHEN TECHNISCHEN HOCHSCHULE ZÜRICH vorgelegt von Alex Peter Scheiwiller Dipl. Bau-Ing. geboren von am 10.8.1966 Waldkirch SG Angenommen Prof. Dr. h.c. ETH Zürich auf Antrag Jörg Schneider, von: Referent Prof. Dr. Hans Rudolf Künsch, Korreferent 1999 Vorwort Probabilistische genieurpraxis. Grössen Berechnungsmethoden finden in zunehmendem Mass welche jeweils Parameter definiert sind. Das durch eine Ergebnis seiner Entscheidungen Im Bauwesen ist da lediglich kleine deterministisch oder mationen die um Ermittlung sind. Der Festlegung - auf den zu delt und nach angemessener knüpft. den Ein Zugang von zum Experten der von - ob er nun weiterer Infor¬ können. Solche Informa¬ Verknüpfung Computerprogramm von Informationen und Stichproben, aus namens Stützwertkom¬ Mittelwert und einem miteinander Comblnfo Verfahren für die Praxis. Comblnfo ist mit einer Dateneingabe ver¬ gewährleistet grafischen Oberfläche und bei der Verknüp¬ Informationen. Während der Promotionsarbeit haben mich eine Vielzahl privaten Einbezug Informationsquellen versehen und erlaubt interaktives Arbeiten bei der fung ist somit werden in stochastische Grössen umgewan¬ Gewichtung mir entwickeltes Be¬ stammen. binationen, wie beispielsweise eine Kombination bestehend von zur in Normen oder in der Fachliteratur. Sie können aber der Variablen wesentlich vereinfacht. Fraktilwert, und Schätzungen mehr Information Ingenieur machen In dieser Arbeit stelle ich ein Verfahren vor, das die somit die ist somit auch eine der Parameter der Variablen oft schwie¬ denkt und arbeitet sachkundigen Schätzungen aus zugehörigen Verfügung. zuverlässige Aussagen beispielsweise Berechnung Ingenieur ungleich Stichproben verfügbar probabilistisch angewiesen, tionen finden sich auch allerdings nun zur und die Verteilungsfunktion einer solchen stochastische Grösse. Damit steht für einen rig, in die In¬ Hierbei werden die Variablen des betrachteten Problems als stochastische eingeführt, gründung Eingang wie auch aus von Personen sowohl aus dem dem beruflichen Umfeld unterstützt. Bei ihnen allen möchte ich mich herzlich bedanken. Mein Dank geht in besonderem Masse an Herrn Professor Schneider für das brachte Vertrauen und für die Freiheit bei der so Durchführung danke ich Herrn Professor Künsch für die aktive entgegenge¬ der Promotionsarbeit. Eben¬ Begleitung und für die Übernahme des Korreferats. Zürich, im April 1999 Alex Scheiwiller Zusammenfassung Bauingenieure sind bei ihrer Arbeit und insbesondere bei der angewiesen. verschiedenste Informationen ten von Dies können Informationen über das Verhal¬ Bauwerksteilen, über Baustoffeigenschaften oder über Einwirkungen sein. Die Informationen weise auf Entscheidungsfindung im Normalfall in verschiedenen Formen liegen Stichproben, weiterverarbeitete Resultate aus anderen sich in Normen oder in der Fachliteratur finden lassen, oder vor. Dies sind beispiels¬ welche Untersuchungen, Ne¬ Expertenschätzungen. ben der unterschiedlichen Form weisen die Informationen auch Unterschiede in ihrer Unscharfe und ihrer Güte auf. Bauingenieure stehen somit verschiedenen Informationen im Hinblick auf die zuwerten und miteinander In dieser Arbeit wird ein zu häufig vor der Aufgabe, jeweilige Fragestellung geeignet die aus¬ kombinieren. neues Verfahren vorgestellt, tionen wesentlich vereinfacht. Die betrachtete das die Eigenschaft Verknüpfung von Informa¬ wird dabei als Variable be¬ schrieben, welche durch eine Verteilungsfunktion und die zugehörigen Parameter defi¬ gilt niert ist. Es nun, diese Grössen aus den einzelnen Informationen Unscharfe der einzelnen Informationen können schaft eingebracht typ und pro Für die Regressionsmethode, die Informationsauswertung nun miteinander Methode. werden drei Methoden empirische Pseudostichproben-Methode. Bayes'sche der Beschreibung ist der Eigen¬ Verteilungs¬ verknüpft. Das Resultat die¬ ist die sogenannte Metainformation. eigentliche Verknüpfung Bayes'schen werden Verteilungsfunktionen Verknüpfung direkt in die Die Information ein Parameterset. Die daraus resultierenden unter¬ vorliegender schiedlichen ser werden. Das Resultat der so festzulegen. Als lineare vorgeschlagen, die Bayes'sche Bayes'sche Regressionsmethode und die Die beiden erstgenannten Methoden basieren auf der Hauptunterschied zum klassischen Gebrauch wird die Methode nicht auf die Parameter der untersuchten Zufallsvariablen ange¬ wendet, sondern auf die Koeffizienten der zugehörigen Geraden im Wahrscheinlichkeits¬ papier. Die Verknüpfung thode der kleinsten knüpfung stützt sich auf das Modell des Parameterschätzverfahrens "Me¬ Quadrate". Durch diese Transformation vereinfacht sich die Ver¬ wesentlich. Es können alle keitspapier existiert, gleich behandelt Ausserdem kann die Verknüpfung gierten Verteilungen durchgeführt sungen von zur Bestimmung der Posteriorverteilung. bezüglich ihrer Güte Vertrauen werden. Benutzung werden. Für diesen Fall existieren Integralen. gebrachten für welche ein Wahrscheinlich¬ der Informationen auch unter mehrdimensionalen Informationen Verteilungstypen, festgelegt wird. die konju¬ geschlossene Lö¬ Dadurch entfällt das numerische Lösen Weiter ist eine möglich, von explizite Gewichtung der einzelnen gemäss dem der Information entgegen¬ Summary iv Beschränkt man auch die oft sich auf die schwierige Bestimmung Verknüpfung sind dann der Unterstützung Zur knüpfung von Verteilungsfunktion für die die Parameter der Variablen des in dieser Arbeit Anwendung aus so entfällt Parameter. Für die den einzelnen Informationen vorgestellten Verfahrens Computerprogramm erstellt. Informationen wurde ein weniger geschulten Ingenieur theoretisch nem einer Erwartungswerte der Parameter, Gewichtung festzulegen. bestimmen und die zu nur der Betrachtung die Benutzung zur Ver¬ Dieses soll auch ei¬ des Verfahrens ermögli¬ chen. Summary Civil engineers usually varying quality. data on base their decisions This may be, e.g., data properties of materials urements or may be results from expert or specialist in sources the characteristics of structural One of the judgements. information from different actions. The information may be or on found in codes on on and of components, gathered by meas¬ literature. Information also includes engineer's analyse, tasks is to process and combine the different types of information. A new procedure combining was developed to facilitate information processing and, process. The property under consideration is described ble, i.e. by have to be assessed with the different information. Thus the tion can be easily tion type and a tion functions included in the set of a corresponding parameters. distribution function and its a by above all, the stochastic varia¬ These uncertainty quantities of the informa¬ The result of the assessment is the distribu¬ procedure. parameters for each information. The resulting different distribu¬ are now combined. The result of the combining process is the so-called metainformation. Three methods the empirical are linear first two methods the Bayesian proposed for timation model are based on the In corresponding straight "Least-Squares be treated in the addition, posterior no a same way, Method" a Bayesian regression method, pseudo sample can applications, parameters of the stochastic variable but to the line in the now respective probability a paper. The es¬ forms the basis of the inferential process. probability All distribution types paper is defined. be used for the inferential process. In this case, the known distribution function. As numerically solving method. The method. In contrast to classical combining process substantially. provided conjugate analysis distribution follows need for to the the method and the Bayesian applied This transformation facilitates the can combining process, Bayesian regression method is not coefficients of the the multivariate integrals. Further, a consequence, there is the weighting of the dif- RÉSUMÉ V ferent information to the according assigned degrees of confidence is explicitly pos¬ now sible. The often difficult determination of pensed with if only combining the the process, distribution function for the parameters a values of the expected an this program also apply the considered. Therefore, for appropriate weighting application of the proposed procedure Using are be dis¬ the parameters of the stochastic variables need to be deter¬ only mined from the different information and To further the parameters can engineers of narrower a has to be assessed. computer program theoretical was developed. should be able to background proposed method. Résumé Les de ingénieurs les qualité variée. Ce sont, par propriétés par des civils basent leurs décisions des matériaux mesures ou cluent aussi des Une nouvelle liaison a été bien être extraites des normes ou de la littérature spécialisée. ingénieurs développée. La traitement des informations et propriété densité de paramètres correspondant ment inclues dans la tantes. Il en résulte considérée est décrite par probabilité et une gression Bayesienne, chaque au ses paramètres. variable aléatoire, une Cette variable aléatoire doit proposées La liaison se nomme régression empirique Les deux premières aux En plus, qu'un papier il est Bayesienne. possible Dans ce probabilité probabilité d'utiliser ne coefficients de la droite base maintenant sur une se Bayesienne basent résul¬ s'applique pas mé¬ la méthode aux paramètres correspondante simplifie et la sur dans le la méthode d'estimation des papier paramètres fortement la liaison des peuvent être traitées de la même manière existe. analyse conjuguée cas, la fonction de linéaire méthodes l'application classique, informations. Toutes les lois de de répartition métainformation. "méthode des moindres carrés". Cette transformation pour autant et pour relier les informations. Ce sont la méthode de ré¬ la méthode de contraire de probabilité information. Les incertitudes sont donc facile¬ information que l'on de la variable aléatoire, mais probabilité. de principalement leur Il reste ensuite à relier les fonctions de pseudo-échantillonnage. Bayesienne, qui de à procédure. Trois méthodes sont thode de Elles in¬ d'analyser, est être déterminée par les différentes informations. Le résultat fournit la loi de les sur différentes informations. ces une différentes et les éléments de construction, Une des tâches des procédure simplifiant le c'est-à-dire, par sur sources les actions. Ces informations peuvent être obtenues jugements d'expert. traiter et de relier des informations de des données exemple, ou sur sur répartition a pour l'application posteriori suit une de la méthode loi de probabilité RÉSUMÉ VI connue. Par multiples poids à conséquent, par des méthodes chaque information Si l'on tient compte se il n'est dispenser de plus nécessaire de résoudre les numériques. en fonction du uniquement des En outre, degré on peut attribuer explicitement de confiance paramètres un assignée. espérances mathématiques la laborieuse détermination des fonctions de suffit donc de déterminer les intégrales à variables des paramètres, répartition des variables aléatoires et le des poids on peut paramètres. de chaque Il in¬ formation. Un programme d'ordinateur proposée. a été développé Ce programme permet aussi ques moins étendues d'appliquer cette aux pour favoriser ingénieurs procédure. l'application de la procédure ayant des connaissances théori¬ Inhaltsverzeichnis i Vorwort Zusammenfassung iii Summary iv Résumé v 1 Verständigung 1 1.1 Begriffe 1 1.2 Bezeichnungen 3 1.3 Indizes 4 2 Problemstellung und Zielsetzung 5 2.1 Problemstellung 5 2.1.1 Informationen 5 2.1.3 Entscheidungsfindung Grundlage Informationsverknüpfung Problematik Informationsverknüpfung Lösungsansatz 2.2 Zielsetzung 3 Grundlagen 3.1 3.1.3 Rangstatistik Rang eines Stichprobenwertes Extremwertverteilungen Empirische Verteilungsfunktion 3.2 Schliessende Statistik 17 Plausibilitätsprüfung 18 2.1.2 3.1.1 3.1.2 3.2.1 der - - - 7 9 10 aus der Statistik 13 13 13 13 17 3.2.2 Parameterschätzung 19 3.2.3 Modellprüfung 22 3.3 25 3.3.3 Wahrscheinlichkeitspapier Anwendung Stichprobenumfang Geradenanpassung in eine Punktreihe 4 Bayes'sche 4.1 Wahrscheinlichkeitsdefinitionen 4.2 Bayes'sches 4.3 Prinzip 4.4 Bestimmung 4.5 4.5.1 Berechnungs verfahren Asymptotische Verfahren 4.5.2 Numerische 4.5.3 Simulationen 3.3.1 3.3.2 der Methode Theorem Bayes'schen Methode von Priorverteilungen Integrationsverfahren 25 26 27 33 33 34 37 40 43 43 45 48 Inhaltsverzeichnis viii 4.6 Erweiterung auf zwei und mehr Stichproben 49 5 Informationsverknüpfung 51 5.1 Grundidee und 5.2 Allgemeines Vorgehen 5.2.1 Stochastisches Modell 52 5.2.2 53 5.2.4 Informationsanalyse Festlegung der Gewichtung Verknüpfung 6 Verknüpfungsmethoden 57 6.1 Die Das 57 6.1.3 Bayes'sche Regressionsmethode Bayes'sehe lineare Modell Übertragung auf das lineare Regressionsmodell Anwendung 57 6.1.1 6.2 Alternativmethoden 65 6.2.1 Die 6.2.2 Die 7 Vergleich 7.1 Vergleichsrechnung 75 7.2 Schlussfolgerungen 77 8 Beispiele 79 8.1 Qualitätsprüfung Festbeton 79 8.1.1 Vorschriften der Qualitätsprüfung 79 8.1.2 Situation 5.2.3 6.1.2 51 Verknüpfungsbasis 52 54 56 59 63 65 Bayes'sche Regressionsmethode empirische Pseudostichproben-Methode lineare und 73 75 Schlussfolgerungen mit der 80 Bayes'schen Regressionsmethode empirischen linearen B ayes' sehen Regressionsmethode 80 8.1.4 Verknüpfung Verknüpfung 8.2 Bestimmung 8.2.1 Situation 83 8.2.2 84 8.2.3 Verknüpfung mit der Bayes'schen Regressionsmethode Verknüpfung mit der empirischen linearen Bayes'schen Regressionsmethode 8.3 Einbezug historischer 8.3.1 Situation 8.1.3 mit der eines charakteristischen Wertes einer Daten in eine Stahlfliessspannung ... Erdbebenstärkenschätzung 82 83 86 87 87 mit der B ayes sehen 87 mit der 89 Regressionsmethode empirischen linearen Bayes'schen Regressionsmethode ' 8.3.3 Verknüpfung Verknüpfung 9 Computerunterstützung 91 9.1 Die Benutzerschnittstelle 91 9.2 Der 8.3.2 Programmkern 93 95 Anhang A A1 Standardnormalverteilung 95 A 2 Normalverteilung 95 A 3 Lognormalverteilung 97 A 4 Gumbelverteilung für Maxima 99 A 5 Weibullverteilung für Minima 101 A 6 Fréchetverteilung für Maxima 104 r ix Inhaltsverzeichnis A 7 Exponentialverteilung 106 A 8 Weitere Verteilungen 107 Anhang 109 B notwendiger Stichprobenumfang B 1 Minimal B 2 Bestimmung B 3 Erzeugung Anhang eines von PseudoStichprobenumfanges 109 109 112 PseudoStichproben 115 C C 1 Bestimmung der C 2 Bestimmung der Kovarianzmatrix L der Verteilungsfunktion der Koeffizienten Koeffizientenschätzungen 115 119 Literaturverzeichnis 123 Curriculum Vitae 127 1 Verständigung Um das Verständnis sten Begriffe 1.1 zu erleichtern, werden nachfolgend die Definitionen der wesentlich¬ und die verwendeten Bezeichnungen zusammengestellt. Begriffe Ausreiss er Unbegründeter Extremwert einer Stichprobe. Daten Durch Beobachtungen resp. Messungen gewonnene Werte einer Eigenschaft. Datensatz Wertereihe einer Eigenschaft. Dichtefunktion Die Dichtefunktion fx(x) zeigt, wie die Wahrscheinlichkeit 1 über P(a<x<b) entspricht der = den Definitionsbereich [a, b] der Zufallsvariablen X verteilt ist. Sie Ableitung der Verteilungsfunktion Fx(x) tion ist gleich 1. nach x. Die Fläche unter der Dichtefunk¬ Eigenschaft Messbares Wesensmerkmal. Darunter fallen unter anderem Festigkeiten, Steifig¬ keiten, Dichten, Reibungswinkel, Windgeschwindigkeiten, Schneehöhen, Abflussmengen, etc. Extremwert Grösster bzw. kleinster Wert einer Stichprobe (innerhalb eines Zeitraums t). Fraktilwert, q% Fraktile Realisation einer Zufallsvariable, welche mit der zugehörigen Wahrscheinlichkeit q nicht unter- bzw. überschritten wird. Grundgesamtheit Gesamtheit aller möglichen Realisationen einer bestimmten Eigenschaft. Information Qualifikation einer Information bezüglich der Qualität der Beschreibung einer Eigen¬ schaft. Die Güte ist gross, wenn beispielsweise eine Verteilungsfunktion die Eigen¬ schaft präzise beschreibt. Güte einer Information Auskunft über eine Eigenschaft. Verständigung 2 Information, objektive Eindeutig feststellbare Information. Darunter fallen insbesondere alle messbaren bzw. erhebbaren Daten (siehe auch Kapitel 2.1, Seite 5). Objektive Information ist mit dem betrachteten Objekt verbunden und ist frei von Interpretation. Information, subjektive Verarbeitete objektive Information oder Schätzung eines oder mehrerer Experten, basierend auf ihren persönlichen Erfahrungen und Vorstellungen. Subjektive Informa¬ tion, die allgemein als zutreffend anerkannt wird, findet sich beispielsweise in Nor¬ men oder in der Fachliteratur (siehe auch Kapitel 2.1, Seite 5). Metainformation Ergebnis einer Informationsverknüpfung. Modell Beschreibung einer Eigenschaft mehreren Eigenschaften. Mathematische schen oder eines Zusammenhanges zwi¬ Modell, stochastisches Beschreibung einer einer Zufallsvariablen. Eigenschaft mittels Parameter Kenngrössen einer Verteilungsfunktion. Parameterschätzung Schätzung der Parameter Funktion der Daten im Stichprobe. Die Parameterschätzung kann als Definitionsbereich des geschätzten Parameters dargestellt wer¬ einer aus den. Posterior information Information, welche sich probe Verknüpfung der Priorinformation Bayes'schen Methode ergibt. aus mittels der klassischen der und der Stich¬ Priorinformation Information, welche schen der Erhebung Methode). Bayes'schen vor einer Stichprobe vorliegt (im Schätzung Beurteilung eines Zustandes oder einer Eigenschaft durch einen ten. Die Schätzung von Parametern im statistischen Sinne wird Verwechslungen als Parameterschätzung bezeichnet. Sinne der klassi¬ oder mehrere zur Exper¬ Vermeidung von Stichprobe Aus einer Entnahme Grundgesamtheit zufällig ist. entnommener Datensatz. Es wird vorausgesetzt, dass die Stichprobenumfang Anzahl Werte einer Stichprobe. Unscharfe Die Unscharfe ist ein Mass für die Variabilität einer schaft als Zufallsvariable beschrieben, bung so der Unscharfe. Die Ursachen der Unscharfe handelt. Eigenschaft. Wird die Eigen¬ Standardabweichung als Beschrei¬ sind in Kapitel 2.1.2 (Seite 7) abge¬ dient die 3 Verständigung Verte ilungsfunktion Die Verteilungsfunktion Fx(x) gibt die Wahrscheinlichkeit gleich x annimmt. an, mit der die Zufallsva¬ riable X einen Wert kleiner oder Vertrauen in eine Information Beurteilungsmass der Güte einer Information. Wahrscheinlichkeit Grad des Vertrauens, dass ein eintreffen wird mögliches Ereignis (siehe auch Kapitel 4.1, Seite 33). Wirklichkeit Tatsächlicher Zustand bzw. Eigenschaft. Zufallsvariable Abbildung oder Funktion, die jeder Realisation im Definitionsbereich einer Eigen¬ schaft eine reelle Zahl zuordnet. Zustand Gesamtheit aller Zeitpunkte Eigenschaften unterschiedlich sein Objektes. Der Zustand kann (Zeit- bzw. Altersabhängigkeit). eines Bezeichnungen 1.2 Allgemein werden für Zufallsvariablen Grossbuchstaben und für reelle Werte Klein¬ buchstaben benutzt. Einzelne Realisationen ner für verschiedene Stichprobe von Zufallsvariablen oder einzelne Werte ei¬ werden mit Kleinbuchstaben und dem Index i (oder 1, 2, 3, ...) versehen. Grossbuchstaben mit untergesetztem Strich kennzeichnen Matrizen ben mit untergesetztem Strich Vektoren oder wendeten Verteilungsfunktionen Stichproben (x). finden sich im B(r;t) Betafunktion BE(r;t;a;b) Betaverteilung cv[x, y], cv[X, Y] Kovarianz Anhang mit Parametern (covariance) zweier r A (X), Kleinbuchsta¬ Die Definitionen der ver¬ (Seite 95). und t, Definitionsbereich Stichproben [a, b] resp. zweier Zufallsva¬ riablen einer Zufallsvariablen E[X] Erwartungswert e[x], e[X] Exzess einer EX(À,;e) Exponentialverteilung mit fx(x) Dichtefunktion Fx(x) Verteilungsfunktion Fx(x) empirische Verteilungsfunktion FL(8;y;e) Fréchetverteilung für Maxima mit Parametern 5 und y, bereich [e, »] GA(b;p;e) Gammaverteilung [e,°o] Stichprobe resp. einer Zufallsvariablen Parameter X, Definitionsbereich [e, °°] Definitions¬ mit Parametern b und p im Definitionsbereich Verständigung 4 GL(?i;8) Gumbelverteilung für onsbereich [-00, 00] L(9), Likelihoodfunktion fx(x|6) LN(À.;Ç;e) Lognormalverteilung Maxima mit Parametern 5 und mit Parametern À, und Ç, À,, Definiti¬ Definitionsbereich [£,-] m[x] mo [ x ], mo [X] Mittelwert (mean) einer Stichprobe Modal wert (mode) einer Stichprobe resp. n Stichprobenumfang N(Li;a) Normal Verteilung mit Parametern einer Zufallsvariablen \i und o, Definitionsbereich [_oo, 00] Q, Fraktilwert Qq mit 0 Fx (q) < q < 1 Rechteckverteilung [a, b] Gleich- oder R(a;b) onsbereich sd[x], sd[X] mit Parametern Standardabweichung (standard deviation) einer a und b, Definiti¬ Stichprobe resp. einer Zufallsvariablen sk[x], sk[X] Schiefekoeffizient (Newness) Stichprobe einer resp. einer Zufalls¬ variablen var[x], var[X] Varianz WS(8;y;e) Weibullverteilung bereich Stichprobe Lageparameter ß, Steigung für Minima mit Parameter 5 und y, Definitions¬ der der Regressionsgeraden Regressionsgeraden in T(x) Gammafunktion 6 Parameter einer (p ( x ) Standardnormaldichtefunktion <E> ( x ) Standardnormal Verteilungsfunktion 1.3 prior; Verteilungsfunktion Indizes Schätzwert des Parameters 0 8 0 post; 1 resp. einer Zufallsvariablen [e, 00] a, r| T einer (variance) a priori a posteriori u- in u- bzw. bzw. v-Richtung v-Richtung 2 Problemstellung 2.1 Problemstellung 2.1.1 Informationen Die Aufgaben eines Arbeit besteht in der ven Grundlage - Bauingenieurs Solche der sind - vielfältig. Entscheidungen, Er Ein wesentlicher Bestandteil seiner muss Entscheidungen Gebrauchstauglichkeit vor Zielsetzung Entscheidungsfindung Entscheidungsfindung. Ingenieurbau tätiger Ingenieur cherheit oder die und eines - als zum treffen im Hinblick auf die geplanten Tragsi¬ oder bestehenden Bauwerks. Fehlentscheidungen, allem aber im konstrukti¬ Beispiel können grosse Auswirkun¬ gen haben. Neben finanziellen Schäden kann auch die Sicherheit von Personen betroffen sein. Um Entscheidungen sen. Je nach fällen zu Aufgabenstellung können, ist man auf verlässliche Informationen werden Informationen über das Verhalten von teilen, über geometrische Grössen, Baustoffeigenschaften, Einwirkungen, Als Quellen der Informationsbeschaffung stehen dem Ingenieur zum angewie¬ Bauwerks¬ etc. benötigt. Beispiel Normen¬ werke, Fachliteratur, Versuchsresultate, aber auch die eigenen Erfahrungen sowie dieje¬ nigen Die anderer Aufgabe blick auf den Fachkundiger zur Verfügung. besteht nun jeweiligen darin, die vorhandenen Informationen zu sichten und im Hin¬ Zweck aufzubereiten. Je nach Zweck wird dabei eine andere Aufbereitungsmethode benötigt. Für Tragwerke aus Stahl muss (insbesondere bei Brücken und Türmen) die Tragsicherheit und die Ermü¬ dungssicherheit nachgewiesen werden. Für den Nachweis der Tragsicherheit ist die Kenntnis der maxima¬ len Belastung notwendig. Zur Überprüfung der Ermüdungssicherheit ist hingegen die Differenz zwischen minimaler und maximaler Belastung sowie die Anzahl Lastwechsel von Interesse. Für beide Zwecke kön¬ nen die notwendigen Angaben beispielsweise aus einer Stichprobe von Windgeschwindigkeiten oder Strassenfahrzeuglasten bestimmt werden. In den Fällen stehen mehrere Informationen häufigsten dann, geeignet miteinander Resultat dieser zu verknüpfen. Verknüpfung, in Die laufende Kontrolle von Eine zur Entscheidung dieser Arbeit Metainformation Betonprüfungen eines Betonwerkes ergibt, Verfügung. Diese gilt es wird schliesslich auf dem genannt, basieren. dass die Druckfestigkeit der Beton¬ weitgehend Normalverteilung N(33.5;3) folgt. Ein Ingenieur entnimmt auf einer Bau¬ stelle eine Stichprobe von fünf Betonproben. Die Auswertung ergibt einen Mittelwert von 28.5 N/mm und eine Standardabweichung von 1.5 N/mm Aus diesen beiden Informationen soll er nun die Qualität des verwendeten Betons bestimmen. Der Ingenieur traut beispielsweise der laufenden Kontrolle mehr als der Stichprobe, welche nur aus fünf Werten besteht. Die Stichprobe lässt jedoch vermuten, dass der sorte B30/20 einer . Problemstellung und Zielsetzung 6 benutzte Beton eine schlechtere Kontrolle Die re ergibt, nach unten Erfahrungen zu der aus Qualität aufweist. Qualität, Demnach ist die Anwendung Entscheidungsfindungen. dienen schliesslich wieder als Dieser Informationskreislauf ist in stellt. Darin sind die unterschiedlichen Informationen in zwei • Begriff fällt Unter diesen Ergebnisse von all das, der laufenden Grundlage Abbildung für weite¬ 2.1 darge¬ Typen zusammengefasst: einer Schneehöhenmessungen. Objektive verbunden und ist frei Stichprobe ist. Insbesondere sind dies Mit Messinstrumenten gleichen er¬ Umständen und im wieder etwa gleich ergeben. Ty¬ Strassenfahrzeuglasten, Ganglinien, Windgeschwindigkeits¬ sind pische Beispiele da sie sich unter objektiv, Zufälligkeitscharakters Rahmen des eindeutig feststellbar was Messungen oder sonstigen Beobachtungen. hobene Daten sind insofern • aus Information objektive und welche sich korrigieren. von Information ist mit dem betrachteten Objekt Interpretation. subjektive Information Objektive Information wird unter Zugrundelegung eines stochastischen Modells aus¬ gewertet. Das verwendete Modell soll die Daten möglichst genau beschreiben. Die Wahl des Modells ist jedoch objektive frei. Somit werden Informationen durch eine Auswertung subjektiv. Für die Beschreibung von Windgeschwindigkeiten werden in der Praxis unterschiedliche stochastische Modelle benutzt. Als Modell wird unter anderem die lung verwendet. Schlussfolgerungen Lognormal-, die basieren auf dem Fréchet- und die Gumbelvertei- zugrundegelegtem Modell und können folglich unterschiedlich ausfallen. Viele Modelle haben sich in der Praxis gut bewährt. Sie beschreiben die Wirklichkeit genügend als genau oder Abweichungen allgemeingültig angesehen. jektive Information sind nicht Belang. von Solche Modelle werden Solcherart ausgewertete Daten werden oft auch als ob¬ angesehen. Derartige beispielsweise Informationen findet sich in Normen oder in der Fachliteratur. Unter subjektiver gen stark Man vom spricht Information sind auch Schätzungen von Expertenschätzung. Unter Experte tik vertrauter Fachmann verstanden. Diesem sollte gesuchte Typische Schätzungen 33 N/mm verstehen. schätzenden Individuum ab und insbesondere auch lich sein, die zu Information zu es von Schätzungen hän¬ seiner Sachkenntnis. wird hier ein mit der Thema¬ aufgrund seiner Erfahrung mög¬ schätzen. Betondruckfestigkeit liegt etwa bei im Monat August im Mittel um etwa sind etwa: "Der wahrscheinlichste Wert der ." oder "Die Niederschlagsmenge von 200 mm wird 10% überschritten.". Man wird meist danach zen. Für eine Werten ben ist Es ist zuverlässige Aussage notwendig (siehe Anhang infolge - trachten, Entscheidungen auf objektive Informationen von B ist jedoch ein Stichprobenumfang von Entscheidungsfindung - stüt¬ mehr als 20 1, Seite 109). Die Erhebung solch grosser Stichpro¬ zeitlichen, technischen oder wirtschaftlichen Gründen selten zumindest im Bauwesen zu somit unabdingbar, einzubeziehen. Dies macht eine möglich. weitere Informationen mit in die Informationsverknüpfung nötig. Problemstellung und Zielsetzung 7 objektive Information Informations¬ - Anwendung aufbereitung und -Verknüpfung subjektive der Metainformation Information Erfahrungen -^ (Feedback) Abb. 2.1: Schema Informationskreislauf 2.1.2 Informationsverknüpfung Die verknüpfenden zu Problematik - Informationen unterscheiden sich im Form, ihrer Unscharfe und ihrer Güte. Typische Formen proben, Ganglinien, Fraktilwerte, scharfe einer Information kann werden. Dabei zu Momente oder beispielsweise berücksichtigen ist auch die allgemeinen bezüglich von Informationen sind Stich¬ Schätzungen über den Sorgfalt bei solcher Werte. Die Un¬ Stichprobenumfang der ihrer Gewinnung beurteilt und Aufberei¬ tung der Information, aber auch beispielsweise die Sorgfalt der Arbeit bei der Herstel¬ lung des werden • betrachteten Objektes. Die Ursachen der Unscharfe können wie folgt eingeteilt (CCPS, 1989; Kroon, 1994): Inhärente oder physikalische Variabilität Die Ursache dieser Unscharfe liegt in der Natur selbst. So unterliegen werte, Baustoffkennwerte, Wind- und Schneelasten, etc. immer kungen. Auch bei Baustoffen der gleichen Festigkeitsklasse gleichmässigen physikalischen Zusammensetzung Bodenkenn¬ zufälligen treten Schwan¬ infolge immer unterschiedliche der un- Festig¬ keitswerte auf. • Statistische Unscharfe Eine Stichprobe eine Konsequenz der Eigenschaft chen liegen schiedlichen beschreibt eine der physikalischen wird eine vor Stichprobe Erhebungsorten bzw. Dies ist unter anderem Variabilität. Aber auch bei bekannter Verteilung diese allem in der Grösse des Beobachtungsinstrumente, • Eigenschaft nur unvollständig. nur unvollständig beschreiben. Stichprobenumfangs, Erhebungsumständen, in der Die Ursa¬ sowie in den unter¬ Messgenauigkeit der etc. Modellunschärfe Analysen von Daten basieren auf Modellen, welche die Wirklichkeit beschreiben sollen. Dies ist jedoch nur näherungsweise möglich, was möglichst genau zwangsläufig zu Unscharfen führt. Zudem wird meist eine Idealisierung angestrebt, damit die Modelle einfach bleiben und damit allenfalls eine Erfassung überhaupt möglich weiterer Grund für eine Idealisierung liegt erst wird. Ein in der Unkenntnis der Wirklichkeit. 8 Problemstellung Schliesslich ist auch die Güte einer Information Baustoffe aus unterschiedlichen Werken von verschiedenen Regionen schiede wie sie etwa bei der und beurteilen. So können zu hergestellt worden sein, oder Zielsetzung beispielsweise Windmessungen stammen. Zu beachten sind dabei auch Verfahrensunter¬ Herstellung von Ortbeton im Vergleich zum Werkbeton auf¬ treten. Für eine Verknüpfung zunächst eine genschaft derart unterschiedlicher Informationen über eine gemeinsame Ausgangsbasis zu Darstellung von lässigkeitstheorie von Eigenschaften benutzt. Das schaffen. Zu diesem Zweck wird die Ei¬ ministischen nur die Verteilungsfunktion werden ebenfalls meist jedoch Überlegungen festgelegt. Bestimmung der der verwendet anstelle entsprechenden Zu¬ die ersten zwei Momente. Die Rechenwerte der deter¬ Verteilungsfunktion der Zufalls variablen. mit auf die mit ein. probabilistische Berechnungskonzept Betrachtungsweise lichkeitstheoretischer Modellierung als Zufallsvariable wird insbesondere in der Zuver¬ Eigenschaften Rechenwerten der fallsvariablen oder allenfalls der ist als unscharfe Grösse betrachtet, d.h. als Zufallsvariable modelliert. Die Un¬ scharfe der Information fliesst direkt in diese Die Eigenschaft Oft entsprechen Bei beiden Verteilungsfunktion aufgrund wahrschein¬ sie einem Fraktilwert Betrachtungsweisen für die betrachtete ist man so¬ Eigenschaft ange¬ wiesen. Die Informationsaufbereitung- kann durch die de • Modellierung unterteilt werden: Schaffung der Für die beschreibende Eigenschaft Eigenschaft wird vorliegenden ein folgen¬ Dabei wird al¬ zurückgegriffen. Informationsauswertung Parameterschätzung notwendig mation ergibt Gewichtung Unter sich ein sind. Die sich daraus und typ Ergebnis die über die Bei diesen ergebende Verteilungsfunktion jede Infor¬ Verknüpfung der Güte der Informationen sind diese wichten. Anschliessend sind die - welche für eine zugehöriges Parameterset. Berücksichtigung fen. Das Angaben herausfiltriert, die Information und insbesondere auch ihre Unscharfe. Für repräsentiert • als Zufallsvariable in Verteilungstyp gewählt. Informationen Aus den einzelnen Informationen werden die • der unterschiedlichen Informationen Ausgangsbasis lenfalls bereits auf eine der • Verknüpfung der betrachteten Aufgaben zu und sind die Eigenschaft gewichteten Parametersets miteinander Metaparameter, welche beschreibt. Diese entsprechend - zusammen Beschreibung mit dem zu zu ge¬ verknüp¬ Verteilungs¬ beinhaltet das gesamte Wissen Eigenschaft. Teilaufgaben Wie kann eine Auswertung der Formen methodisch gaben stehen, stellen sich somit die Probleme: verschiedenen Informationen in den unterschiedlichen durchgeführt welche die folgenden werden? Als Resultat dieser Schätzung der Parameter erlauben. Auswertung sollen An¬ Problemstellung und Zielsetzung • Wie ist eine 9 Gewichtung aufgrund der unterschiedlichen Güte der Informationen ein¬ zubringen? • Wie ist die Verknüpfung der einzelnen Parametersets durchzuführen? Informationsverknüpfung 2.1.3 Für die Verknüpfung von Lösungsansatz - Informationen über beschrieben werden, bzw. für die Eigenschaften, welche Aktualisierung von als Zufallsvariablen Informationen wird vielfach die so¬ genannte Bayes'sche Methode benutzt. Der Aufbau dieser Methode ist in der Abbildung 2.2 dargestellt (in Anlehnung an Wickmann, 1990). Stufe 1 Einsicht gewinnen Stufe 2 / Aktualisierun g von Information objektive Schaden-/ Information Gewinnfunktion 1 1 Vorinformation Bayes'sches aktualisierte (subjektive Information) Theorem Information Abb. 2.2: Die Schema der Bayes'sche Einsicht man Beispiel in eine bestimmte die Vorinformation sowie die verknüpft zum Eigenschaft gewinnen. sie miteinander. Als Beispiel aus Man sammelt die Eingabegrössen dienen einem Versuch gewonnenen Daten (ob¬ Die Vorinformation beinhaltet dabei das vorhandene Wissen über jektive Information). Eigenschaft. formationen miteinander Mittels des verknüpft. Bayes'schen Theorems werden diese beiden In¬ Die Vorinformation wird aufgrund der Information dem Versuch aktualisiert. Aus der aktualisierten Information können verschiedene Folgerungen thesentests gezogen werden. Es können durchgeführt beispielsweise Punktschätzungen werden oder Vertrauensintervalle und stimmt werden. Im Rahmen einer zweckfreien Sind jedoch Entscheidungen Eingabegrösse kann für muss zu treffen, so Beurteilung jede Handlung der Erwartungswert Bayes'schen Prinzip problematik der Bayes'schen wird Voraussagebereiche endet hier die be¬ Untersuchung. werden. Mit dieser aufgestellt diejenige Handlung ausgewählt, zugesprochen Methode und deren finden sich unter anderem in Hypo¬ des Schadens bzw. des Gewinnes berechnet den maximalem Gewinn bzw. den minimalem Schaden Beschreibung und wird die zweite Stufe benutzt. Als weitere eine Schaden- bzw. Gewinnfunktion werden. Gemäss dem Die Entscheid Prinzip Bayes 'sehen Methode vorhandenen Informationen und aus Bayes'sches -U* Methode lässt sich in zwei Stufen unterteilen. In einer ersten Stufe will zum die betrachtete Entscheiden i Benjamin Anwendung und Cornell welcher wird. auf die (1970), Ingenieur¬ Martz und 10 Problemstellung und Zielsetzung Waller (1982), (1993) der Ang und Tang (1984), Barends (1992), Vrouwenvelder (1992), Plate und Kroon Bayes'schen (1994). Barends, Vrouwenvelder und Plate behandeln die erste Stufe Methode ausführlich. Die anderen Referenzen schliesslich mit der zweiten Stufe, d.h. der beschäftigen zu aus¬ Es bestehen ferner Entscheidungsfindung. Tendenzen, die Bayes'sche Methode auch in die Normen sich integrieren (ECCS/JCSS, 1996; Baker, 1996 a). Wegen des mathematischen Aufwands werden meist lungen als stochastische Modelle re im konstruktiven Gumbel- oder die Beschreibung zur Ingenieurbereich Weibullverteilung, thode wird in diesen Fällen der Normal- und Eigenschaft werden aber auch andere verwendet. Die aufwendiger, sung existiert. Ein einfaches nur Vorgehen da nur für die in Verteilungstypen, Spezialfällen von wie die der Bayes'schen Me¬ eine geschlossene Lö¬ Anwendung Verknüpfung Lognormalvertei¬ benutzt. Insbesonde¬ Informationen existiert bis jetzt nicht. 2.2 Zielsetzung Das Ziel dieser Arbeit ist, ein Verfahren bereitzustellen, welches die Verknüpfung Informationen erlaubt. Die betrachtete schrieben. Das Resultat der rer Verteilungsfunktion und nisse im Bauwesen sollen • Kleine Eigenschaft Verknüpfung ist der wird dabei als Zufallsvariable be¬ die sogenannte Metainformation in Form ih¬ zugehörigen Parameter. berücksichtigt von Die Besonderheiten der Verhält¬ werden. Dies sind insbesondere: Stichprobenumfänge Der erhobene Stichprobenumfang ist in den meisten Fällen klein. Häufig ist er kleiner als 10. • Einbezug von zusätzlichen Informationen Mangels genügend zuverlässiger objektiver Informationen mationen • berücksichtigt. anderen Dies sind, neben Bauwerken, gen an gen, Normen, Fachliteratur, etc.). Tiefe der Ein allem Informationen aus Beobachtun¬ subjektive Informationen (Expertenschätzun¬ Beurteilung Ingenieur ist in der mente der untersuchten etwa vor objektiver werden zusätzliche Infor¬ Schätzungen klassischen Regel in der Eigenschaft Lage, zu untere und obere Grenzen bzw. die Mo¬ schätzen. Tiefergehende Informationen wie über die Momente der Parameter der Zufallsvariablen, die bei der Bayes'schen Methode notwendig sind, sind hingegen schwierig abzuge¬ ben. Als Basis der hier verwendeten Die vorliegende Verknüpfungsmethoden Arbeit beschränkt sich Bayes'schen Methode, der Verknüpfungsmethoden jedoch Aktualisierung benutzen von auf die dient die Behandlung Information Vereinfachungen Bayes'sche im Methode. der ersten Stufe der (siehe Abbildung 2.2). Die Vergleich zur klassischen Problemstellung und Zielsetzung Bayes'schen 11 Methode. Insbesondere wird die betrachtete Zufallsvariable effizienten der respektive zugehörigen Geraden im • Methode nicht direkt auf die angewendet, sondern deren Parameter Wahrscheinlichkeitspapier, terschätzverfahren "Methode der kleinsten Das Verfahren deckt insbesondere Bayes'sche auf die Ko¬ also auf das Parame¬ Quadrate". folgende Bereiche ab: Informationsanalyse ist oft durch Verteilungstyp Der sich kaum auf, da die drängt Vergleichbarkeit der Resultate unter leiden würde. Insbesondere soll der mit kleinem Information subjektive Umfang abgeleitet Verteilungstyp werden, da er aus gegeben. mit anderen nicht dieser nicht aus Änderung Eine Analysen einer dar¬ Stichprobe zuverlässig bestimmt werden kann. Die Analyse objektiver Informationen ter bei von vorgewähltem Verteilungstyp subjektiven Festlegung Bestimmung Analoges gilt (Expertenschätzung, auch für die Norm oder Festlegung von der Parame¬ Analyse Fachliteratur). Die Stützwerten der Vertei¬ vorgenommen. Informationsverknüpfung Eine Gewichtung der verschiedenen Informationen brachten Vertrauen wird in die • beschränkt. der Parameter wird hier über die lungsfunktion • Informationen wird deshalb auf die gemäss dem ihnen entgegenge¬ Verknüpfungsmethode integriert. Stark unterschiedliche Informationen Widersprechen weit sich die vorhandenen Informationen auseinander, meisten Vertrauen so wird die Möglichkeit gegeben, entgegenbringt, über die Bayes'schen Information, welcher hinaus stärker zu man am berücksich¬ basiert im diesem Fall auf der empiri¬ Methode. Die verwendeten Methoden werden in ein gramm soll interaktives Arbeiten bei der lauben. die Gewichtung tigen. Die verwendete Verknüpfungsmethode schen stark, d.h. liegen die Mittelwerte Computerprogramm integriert. Benutzung des vorgeschlagenen Dieses Pro¬ Verfahrens er¬ 12 Grundlagen 3 vorliegende Die rechnung. Die aus der Statistik Grundlagen Arbeit stützt sich auf wichtigsten verwendeten Theorien werden hier dargestellt. Rangstatistik 3.1 Rang Statistik bildet die Die Basis für Bildung Der eines ist. Für die Bestimmung der Grösse nach des Zufallsvariablen Ranges aufsteigend geordnet. ein Index k Ranges (k = werden die In der 1, 2, ..., gibt an, mit stieren dem für Stichprobenumfang Umfang n wird Betrag folglich nach als im Index X(1:n) Zur n) zugeordnet. so = 1, 2, angegeben. Unterscheidung Rang eines ..., n) ge¬ werden Stichprobenwer¬ Der Minimalwert einer und der Maximalwert als gleiche Werte, Xj (i geordneten Stichprobe wird den Weiten Stichprobe X(n:n\ geschrieben. Exi¬ wird diesen Werten der Durchschnitt der hier¬ vorgesehenen Ränge zugordnet. Den Werten einer Stichprobe {2.4, 3.5, 4.2, 4.2, 4.2, 5.7, 6.6, 8.0} (3 4, 4, 4,6,7, 8} zugeordnet. + 4 3.1.2 + 5)/3 = zum Beispiel werden die Ränge {1, 2, Extremwertverteilungen Betrachtet X die der wievielt-kleinste Wert Stichprobenwerte die Indizes mit Klammern versehen. Meist wird neben dem tes auch der Stichproben und Stichprobenwertes Rang eines Wertes einer stetigen mäss ihres Streubereichen für von empirischen Verteilungsfunktionen. von Rang 3.1.1 statistische Methoden. Dies sind einige wichtige beispielsweise Ausreissertests, Schätzungen er der Statistik und Wahrscheinlichkeits¬ Stichproben man m beschreiben, können als so gleichem Umfang besitzen diese unterschiedliche eigene Grundgesamtheit betrachtet genen Zufallsvariablen k-1 = Fx ergibt sich wie k-grösste Die Werte. Die k-grössten dementsprechend in Werte einer ei¬ dazugehörige Verteilungsfunktion folgt (Castillo, 1988): n-V (x).[l-Fx(x)f n, welche dieselbe Zufallsvariablen werden und zusammengefasst werden. sowie die Dichtefunktion fxM(x) mit Iy(X) '^ (3.1) Grundlagen aus der Statistik 14 F(x) 1 (X) v(kn) k-l /1 Nn-k •(1-u) = B(k;n-k+l) Gleichung (3.2) entspricht einer Betaverteilung (3.2) j -du für die Zufallsvariable Fx(x). Beispiel einer lognormalverteilten Zufallsvariablen mit LN(3.68;0.10;0) dienen. Verteilungsfunktionen der k-grossten Werte einer Stichprobe mit Umfang 3.1 dargestellt. Abbildung Zur Illustration soll das Die Dichtefunktionen und die n 5 sind in = Dichtefunktionen und Verteilungsfunktionen der k-grössten n= 5 undder Ursprungsverteilung LN(3.68;010;0) Abb. 3.1: Meist sind wert mit ben sich fx v(ln) jedoch r = n, Werte einer die Extremwerte, d.h. der Minimalwert mit von Interesse. Deren Dichtefunktionen und r = Stichprobe Umfang mit 1 oder der Maximal¬ Verteilungsfunktionen erge¬ zu: n-l (x) = n-[l-Fx(x)]" (3.3) -fx(x) Fx(In)(x)= 1-[1-Fx(x)]n fX(nn)W = Fx(nn)« = (3.4) n-Fx_1(x)-fx(x) (3.5) Fx(x) (3.6) Die Gleichungen (3.3) bis (3.6) können nur benutzt werden, wenn der Verteilungstyp und der Stichprobenumfang den Fall, wo n gegen unendlich strebt (n Extremwertverteilungen unterteilen • bekannt ist. Ist dies nicht der Fall oder interessiert Fx (Spaethe, 1992; Gumbelverteilung = GS(8;^) = sich für °°), können die sogenannten asymptotischen benutzt werden. Diese lassen sich nach Gumbel in drei Johnson et al., 1994 a; Plate, Extremwertverteilung Typ Die —» man 1 1993): (GumbelVerteilung): ist in beiden 1-exp Typen Richtungen unbegrenzt. -exp[- X — x -co < X < oo (3.7) Grundlagen FXn GL(ô;A.) = Statistik aus der expf-expf-^-^Y) = der Verteilungsfunktion Die 15 (3.8) -oo<x<oo Ausgangsverteilung klingt exponentiell gegen die Ex¬ tremwerte ab. Extremwertverteilung Typ • Die Fréchetverteilung 2 (Fréchetverteilung): ist in der Richtung des interessierenden Extremwertes unbe¬ grenzt, in der anderen Richtung hingegen im Punkt FX(i) FX(n) Die FS(8;Y;e) = 1 = FL(5;y;e) = exp^^fj) - der Verteilungsfunktion Polynom nem ab. Solche Weibullverteilung Die Punkt FX(i) FX(n) Die ste Die begrenzt, e l-expj^r^j = WL(ô;y;e) = expj^pj) Anhang A teilungsfunktion, (Seite 95). Es in (3.11) -oo<x<e besitzt werden auch andere und die and (3.12) so Extremwertverteilungen Verteilungstypen passt Einfluss. Sucht man an aus Vergleich zur Beschreibung asymptotischen sind finden zum Extrem¬ Beispiel Gammaverteilung. sind nicht abhängig Sie beschreiben von nur der Form der ihnen man nun die Extremwerten bestehende an Der mittlere Teil Extremwertverteilung das interessierende Ende der zu¬ den Endbereich dieser Ver¬ gesuchten Extremwertes liegt. asymptotische Verteilungsfunktion keine Extremwert hin eine fe¬ zum Tang, 1984; Plate, 1993). Dies der auf der Seite des wenig nur riablen X, n e<x<oo der Dichtefunktionen der einzelnen grundeliegenden Verteilungsfunktionen. Ein des interessierenden Extremwertes im Ausgangsverteilung Asymptotische Verteilungsfunktionen man sogenannten Cauchy-Typ. Extremwerten benutzt, welche nicht der Klassifikation der hat somit Extremwert hin nach ei¬ 8. Lognormalverteilung eine zum zum Richtung unbegrenzt. = wertverteilungen angehören (Ang die Richtung WS(ô;Y;e) Gleichungen von (3.10) (WeibullVerteilung): in der anderen der (3.9) e<x<oo = Grenze sich im 3 < x < £ Ausgangsverteilung klingt ist in der Verteilungsfunktion — Verteilungen gehören Extremwertverteilung Typ • exp^-^^ = begrenzt. e einer Zufallsva¬ gegebenen Verteilungsfunktion (Castillo, 1988). Auf diese Weise benötigt Stichprobe. zwischen der Verteilung der Maximalwerte einer Lognormalverteilung LN(3.68;0.10;0) mit entsprechenden asymptotischen Verteilungsfunktion (Gumbelverteilung für Maxima) ist Abbildung 3.2 dargestellt. Die Parameter der Gumbelverteilung wurden aus einer Stichprobe von 20 = 50 und der Maximalwerten bestimmt. Die Maximalwerte stammen malverteilung mit je 50 Werten. aus Stichproben der zugrundeliegenden Lognor¬ 16 Grundlagen aus fx« 0 06 Statistik der Fx« 1 0 r 0.05 / / 0.04 /' \ Il Il I \ \ \. II 40 50 / °-2 j" y/ f) 00 1 0.4 i II II 0.01 / 0.6 V II 0.02 /* 0.8 V 1, 0.03 V r u.u 60 70 80 90 100 110 x 40 50 60 70 Verteilung der Maximalwerte aus 20 Stichproben einer Lognormalverteilung LN(3.68;0.10;0) 80 mit 90 Umfang 100 n = 110x 50 Gumbelverteilung (zugehörige asymptotische Verteilung) Abb. 3.2: Verteilungsfunktion der Maximalwerte aus 20 Stichproben mit je 50 Werten zugrundliegender Lognormalverteilung LN(3.68;0.10;0) und diejenigen der zugehörigen asymptotischen Verteilung einer Gumbelverteilung Dichtefunktion und und In Tabelle 3.1 sind für die verschiedenen schen Verteilungsfunktionen Minima- und chen Verteilungstypen für Minima und Maxima Maximabetrachtungen zugehörigen asymptoti¬ Zu beachten angegeben. einer Zufallsvariablen X nicht asymptotischen Verteilungsfunktion Verteilungstyp die unbedingt führen. Minima- Maxima- betrachtung betrachtung Normal Gumbel Gumbel Exponential Weibull Gumbel Rechteck Weibull Weibull Lognormal Gumbel Gumbel GumbelMax Gumbel Gumbel GumbelMin Gumbel Gumbel FréchetMax Gumbel Fréchet FréchetMin Fréchet Gumbel WeibullMax Gumbel Weibull WeibullMin Weibull Gumbel vonX Tab. 3.1: Asymptotische Verteilungsfunktionen für einige lungstypen (Castillo, 1988) Vertei¬ ist, dass zur glei¬ r Grundlagen 3.1.3 Statistik aus der 17 Empirische Verteilungsfunktion Die empirische Verteilungsfunktion Fx(x) einer Zufallsvariablen X ordnet jeder reellen Zahl x die Wahrscheinlichkeit P(X < x) des Ereignisses (X < x) zu. Sie entspricht einer Schätzung Ihre der grafische Darstellung ergibt 2/n, ..., 1. Für die ungeeignet, und Verteilungsfunktion Fx(x) +°o da die Randpunkte ^x(x) = ansteigende "Treppe" aus ten Wertes Fx = entspricht Wahrscheinlichkeitspapieren ist diese Form bei der Transformation der Achsen in der *x« Für = Form dem Erwartungswert auch der Median der der Verteilungsfunktion Verteilungsfunktion des - Vertei¬ k-gröss¬ verwendet. Die¬ Hintergrundinformationen finden sich in Kimbal Diese sind meist (1960), empirisch Bildung zur von empirischen Castillo (1988), Modarres durch umfangreiche (1993) Simulationen be¬ Lognormalverteilun¬ vorgeschlagen: vMï k -°° (3-14) (1993). Extrapolationen w zu (3-13) stimmt worden. Insbesondere wird für die Arbeit mit Normal- und folgende empirischen ^M Verteilungsfunktionen gen Regel jedoch zu: Andere Ansätze und weitere und in Plate Stichprobe. mit den Schritten 0, 1/n, (x(k)^x<x(k+i)) (x). Oft wird schreibt sich einer die sogenannte Weibullformel: n~7I Die Weibullformel FxW von Grundgesamtheit werden. Man verwendet darum für die Konstruktion der lungsfunktion meist ser Benützung eine der (3-15) nach der Extremwertverteilung Typ I wird 0 44 (316) dni benutzt, da die Weibullformel für grosse Wiederkehrperioden stark verfälschte Extrem¬ werte 3.2 liefert. Schliessende Statistik Die Schliessende Statistik beruht auf den Resultaten der Beschreibenden Statistik und der Wahrscheinlichkeitsrechnung. Die Beschreibende Statistik hat die Aufgabe, Stich¬ proben in geeigneter Form darzustellen oder sie durch wenige Zahlen zu beschreiben. Die Die Wahrscheinlichkeitsrechnung Aufgabe verwendeten Grössen dergrund. liefert die Modelle zur der Schliessenden Statistik besteht darin, Für diese zu aus bestimmen. Als Modelle stehen gilt es nun, die Beschreibung der einer Stichprobe Stichprobe. die im Modell Verteilungsfunktionen entsprechenden Parameter aus den im Vor¬ Stichproben zu be- 18 Grundlagen stimmen. Diese die Aufgabe wird meist in drei Teile Plausibilitätsprüfung, die gegliedert (Baker, Parameterschätzung und die aus der Statistik 1996 b). Sie umfasst Modellprüfung. Plausibilitätsprüfung 3.2.1 Überprüfung der einzelnen Stichprobenwerte auf ihre Plausibilität. Ziel dieser Überprüfung ist es, mögliche Ausreis¬ Ein Bestandteil einer wichtiger Datenanalyse identifizieren. Die gemessenen bzw. ser zu Bereiches erwartet, der grosse Werte in der vom besteht in der messenden Daten werden innerhalb eines zu angenommenen Modell Stichprobe, abhängt. Extrem kleine bzw. extrem welche mit dem Modell nicht Ausreisser genannt. Es stellt sich sofort die ob Frage, es verträglich sind, sich bei diesen Werten nicht fehlerhafte Daten handelt. Die Ursachen für fehlerhafte Daten sind beispielsweise sich um entfernt werden, da sie auch auf eine probe ne) hinweisen können. Gründe Als Der Ausschluss für eine nicht unbedacht Modellabweichung (z.B. sollte, wenn Darstellungen. Beurteilung möglicher Es kann Beurteilungs¬ aus einer Stich¬ eine Schwächezo¬ möglich, aufgrund immer rationaler Stichprobe vor allem grafi¬ Zeitreihendarstellungen, Histogramme Wahrscheinlichkeitspapiere. Verfahren. Diese beruhen meist auf dem analytische Aus der sowie eignen sich Ausreisser Dies sind unter anderem (oder Stamm-und-Blatt-Diagramme) auch jedoch um Es existieren Prinzip der Hypothesentests. werden hierbei der Mittelwert und die Standardabweichung stimmt. Mit diesen Werten wird die Fraktile des vermuteten Ausreissers berechnet. die Fraktile ausserhalb einer vorher definierten Grenze Vertrauenswahrscheinlichkeit (z.B. 90%), ausgewiesen. so Die Werte der Grenzen sind für verschiedene Stichprobenumfänge und für 1992). Meist wird in die¬ jedoch auch verteilungsun¬ Verfahren. Als Ausreisser • Liegt wird der betrachtete Wert als Ausreisser Verfahren Normal Verteilung vorausgesetzt. Es existieren abhängige be¬ (z.B. 5%) mit einer vorgegebenen verschiedene Vertrauenswahrscheinlichkeiten tabelliert (Sachs, sen um erfolgen. Hilfestellung sche vielfältig. Mess-, Rechen- oder Schreibfehler, aber auch fehler handeln. Mutmassliche Ausreisser dürfen werden ausgewiesene Extremwerte können wie folgt behandelt werden: Wertzensur Die Stichprobe wird der Grösse nach geordnet. Dann ersetzt man den Ausreisser durch seinen benachbarten Wert. Bei diesem Verfahren wird der Ausreisser als lässig betrachtet. Der Abwandlung Richtung wird jedoch dieses Verfahrens kann bei der pieren durchgeführt werden. Die Ausreisser die der gewisses Benützung Stichprobe Wahrscheinlichkeitspapier eingetragen. wird der ein Gewicht von unzu¬ beigemessen. Eine Wahrscheinlichkeitspa¬ wird mitsamt dem Ausreisser in das Für die Anpassung einer Geraden wird dem Gewichtung Null zugeordnet (siehe Kapitel 3.3.3, Seite 27). Wiederum Richtung eine Bedeutung beigemessen, indem man den Ausreisser nur bei Rangbestimmung berücksichtigt. Grundlagen aus der Parameterschätzungen fälscht. Befindet sich Statistik 19 und insbesondere Beispiel werden durch Ausreisser meist stark Extrapolationen ver¬ unter einer Stichprobe von 20 Jahresmaximalwerten das hundert¬ berechnet sich der Wert der so jährliche Ereignis, empirischen Verteilungsfunktion nach der Weibull¬ formel (siehe Kapitel 3.1.3, Seite 17) zu 0.952. Dies entspricht etwa einem 20-jährlichem Ereignis. Dem hundertjährlichen Ereignis wird somit ein zu kleiner Rang zugewiesen. Im Wahrscheinlichkeits¬ papier wird dieses Ereignis somit in einer falschen, nämlich zu tiefen Position eingetragen. Eine Extra¬ polation würde in diesem Fall zu hohe Werte liefern. • zum Rangzensur Die wird der Grösse nach Stichprobe wenn geordnet. sie grösser oder kleiner als ein vorher Extremwerte werden festgelegter vernachlässigt, Schwellenwert sind. Die An¬ zahl der auf diese Art zensierten Werte ist somit eine Zufallszahl. Anstatt einen Schwellenwert festgelegt festzulegen, kann auch die Anzahl der werden. Im Unterschied zu vorher ist nun zu zensierenden Werte vorher der Schwellenwert eine Zufalls¬ zahl. Beide Verfahren können Werteskala nur an durchgeführt vernachlässigt gleichzeitig an werden. Falls nicht entschieden werden werden sollen oder nicht, kann eine einmal ohne die Extremwerte so einem Ende oder auch durchgeführt beiden Enden einer kann, ob Extremwerte Parameterschätzung einmal mit und werden. Der Einfluss der Extremwerte wird aufgedeckt. Parameterschätzung 3.2.2 Ausgangspunkt ist eine Stichprobe, gewonnen wurde. Aus dieser teilungsfunktion optimal haben fixe, Stichprobe Ô = jedoch zu welche durch voneinander Stichprobe gilt es nun, die Parameter der zugehörigen dargestellt werden (Plate, Parameterschätzung g(...) Ver¬ einer aus 1993): g(x1,x2, ...,xn) Die Schätzfunktion Versuche schätzen. Die Parameter im Sinne der klassischen Statistik unbekannte Werte. Formal kann die als Funktion unabhängige (3.17) muss so gestaltet werden, dass der Schätzwert folgende Krite¬ rien erfüllt: • Der Erwartungswert des Schätzwertes soll im Mittel über viele Stichproben dem theo¬ retischen Parameter der Gesamtheit G ses • Kriterium nennt Die Summe der zum man auch entsprechen (E[g(xl5 x2, ...,xn)] Erwartungstreue. quadratischen Abweichungen Schätzwert soll minimal sein (E = der Schätzwerte einzelner ^(g(xl5 x2, ..., xn) - 6G)2 -^ 0G). Die¬ Stichproben Minimum). Dies ist das Effizienzkriterium. • Die Schätzung soll konsistent sein, d.h. der Schätzwert nimmt mit wachsendem exakten Wert des Parameters der Gesamtheit an ( lim g(x,, x2, n —> • Der Schätzwert soll die vorhandene Information zen. Man nennt eine solche Schätzung so ..., xn) = n den 0G). oo vollständig wie ausreichend oder suffizient. möglich ausnüt¬ Grundlagen 20 • Der Schätzwert soll robust sein. Wenn Schätzwert sich nur wenig neue das eine oder andere Kriterium dargestellt. Statistik soll der hinzugefügt werden, ändern. Alle Kriterien vermag eine Schätzfunktion nicht funktionen kurz Elemente aus der wegfallen. Ein Im Vergleich erfüllen. Je nach zu folgenden werden die Fragestellung wichtigsten kann Schätz¬ der verschiedenen Verfahren findet sich in Königer (1980). a) Momentenmethode Die Momentenmethode benutzt die Momente der zweiparametrige Verteilungsfunktionen zung. Für respektive Varianz var[x] die Bestimmung wird Die Umrechnung spielsweise der höheren Momente aus kleinen der Momente in die Parameter einer werden. Im für die in dieser Arbeit verwendeten Umrechnungen Für drei- oder mehr- müssen auch die höheren Momente Spaethe (1992) nachgeschlagen in der Mittelwert m[x] und die nur Schätzfehlern führen. Dies wirkt sich insbesondere auf die aus. für die Parameterschät¬ Standardabweichung sd[x] benötigt. parametrige Verteilungsfunktionen den. Die Stichprobe Stichproben Schätzung beigezogen kann von zu grossen Extremwerten Verteilungsfunktion Anhang wer¬ kann bei¬ (Seite 95) sind die A Verteilungstypen angegeben. Das erste Moment ist der Mittelwert: m[x] = ^Sxi i Eine (3-18) l = Verallgemeinerung sprunges führt zu dieser Definition und eine Verschiebung den Definitionen der höheren Zentralmomente des Koordinatenur¬ (oft kurz Momente ge¬ nannt): mcqW j!;i>i-m[x])q = i Über = <3-19) 1 das zweite Zentralmoment wird die Varianz var[x] und daraus die Standardabwei¬ chung sd[x], über das dritte der Schiefekoeffizient vierte Zentralmoment der Exzesskoeffizient e[x] net. Die Schätzungen Mittel über viele mit der Momentenmethode Stichproben (kurz: Schiefe) sk[x] und über das (kurz: Exzess oder Kurtosis) berech¬ gemäss der Formel (3.19) stimmen im nicht mit den Momenten der Verteilungsfunktion überein. Sie sind etwas kleiner als die Momente. Diese Schätzwerte sind somit nicht erwartungs¬ treu. Unter muss der Voraussetzung, dass angebracht eine Korrektur nur erwartungstreue Schätzwerte Freiheitsgrades, bedingt Schätzwerte in die var[x] = Interesse sind, werden. An der Stelle des Faktors 1/n wird ein ent¬ sprechender kleinerer Faktor eingesetzt (Plate, 1993). des sogenannten von Dieser resultiert aus der Reduktion durch das Einsetzen der bereits bestimmten Bestimmungsformeln. ^-- 2(xj-m[x])2 i = 1 -> sd[x] = J^[x\ (3.20) Grundlagen aus der Statistik 21 n £(Xj-m[x]) ^ n sk[x] = (n-l)-(n-2) 3 (3.21) 57r- (var[x])3/2 n 2(Xi-m[x]) 2 e[x] L-J n = — ; „ , n, — • , Zum Teil werden auch nicht besondere im findet die erwartungstreue Schätzwerte verwendet (Sachs, 1992). Ins¬ mit der Zusammenhang Benutzung von (3.22) — (var[x])2 (n-l)-(n-2)-(n-3) Bayes'schen (siehe Kapitel 4, Methode Seite 33) erwartungstreuen Schätzwerten keine Anwendung, da keine erwartungstreuen Schätzungen im Sinne der Statistik mehr existieren. b) Maximum Likelihood Methode Die Maximum Likelihood Methode setzt voraus, dass der Zufallsvariablen bekannt ist bzw. ten davon aus, dass variablen Xj fallsvariablen jedes Element man zung der L(0) Xj gleich. Die Unabhängigkeit f (x|6) eine gleichen Realisierung einer separaten Zufalls¬ Gesamtheit entstammen, sind alle Zu¬ werden. Die Realisierungen entsprechenden Randverteilungen er¬ in die Dichtefunktion. Unter der Vorausset¬ der Zufallsvariablen Xi ergibt sich: fxC^ieî-fxCxaiej-.-.-fxC^ie) = geht weiter Dichtefunktion kann somit als mehrdimen¬ ursprüngliche geschrieben durch Einsetzen der = Stichprobe der betrachte¬ angenommen worden ist. Sie vorgängig ist. Da alle Elemente der sionale Dichtefunktion hält der Verteilungstyp nfx(Xi|0) = (3.23) i= l Diese Dichtefunktion wird Likelihoodfunktion genannt. Sie ist meter 0 bzw. von den von Parametern 0i5 obachteten Werte am positiv ist, Am mit wenn die Matrix der zweiten werden Ergebnis vereinfacht, an wenn wird dadurch nichts andererseits die Funktion lich das Maximum 04 abhängig. Gesucht ist nun grössten ist. Die Likelihoodfunktion wird also Ableitungen garithmiert wird. Parametern gesuchten Para¬ derjenige Satz bei dem die Wahrscheinlichkeit des Auftretens genau dieser be¬ Dies ist dann der Fall, nit ist. Die gesuchten nur vom ln(fx(x)) Maximum. partiellen Ableitungen negativ die Likelihoodfunktion défi¬ vorgängig gesuchten fx(x) anwächst und Parameter ergeben folg¬ sich aus: d dQl ln(L) v ' = 0, -^-ln(L) dQ2 v ' = 0, ... , -^-ln(L) dQn lo- verändert, da einerseits fx(x) immer monoton mit derselben Stelle auftritt. Die zum = 0 (3.24) so¬ 22 Grundlagen c) Gumbel scheinlichkeitspapieren. Da die Zusammenhang wird deren (siehe Kapitel 3.3, Seite Es existieren unterschiedliche Methoden, eine Handhabung von Wahr¬ wichtige Grundlage in einem für eigenen Kapitel 25). Eine visuelle funktionen (Histogramm (empirische metrischen kumulative System bildung 3.3). bei den Überprüfung Die kann durch die und überprüfen, um zu Verteilungstyp (dem sogenannten bestimmten gleichzeitige Darstellung Dichtefunktion) sowie Verteilungsfunktion und solche Entscheide nachvollziehbar und zum Beispiel quasi objektiv einem bestimmten Anpassungstests Mises und Verteilungstyp folgt, sind die Testverfahren nach Anderson-Darling. Verteilungstyp unabhängig. der grössten Differenz der Diese Das Prüfgrösse, tigung Das Modell bleibt eine man es haben den geringe Wahrscheinlichkeit, Gemäss Stahel betrachtet wird, ist mit Wahr¬ Umgang man sind Um das Kon¬ Anpassungstests. Kolmogoroff-Smirnoff, Prüfgrösse. die werden (siehe Ab¬ ob eine Oft be¬ Cramér-von nichtparametrisch Vergleich und vom zwischen und der theoretischen bzw. Ist die Differenz Gültigkeit gilt grösser als es, dass die Bestä¬ des Modells nicht beweist. lediglich plausibel (Wickmann, 1990). Anpassungstests pothese nennt man im Modells) Kececioglu (1991). wird das benutzte Modell verworfen. Zu beachten Anpassungstest des machen, benutzt empirischen Verteilungsfunktion des Modells durch den nur Verteilungsfunktionen dieser Tests beruht auf dem zwischen der Summe der Differenzen und einer oder nicht. Nullhypothese überprüfen, Anpassungstests Prinzip zu in folgt einem der beiden Dichte¬ Verteilungsfunktion zept des statistischen Tests. Verfahren, welche die nutzte der beiden Methoden dem Benutzer überlassen. Für den finden sich Hinweise Stichprobe stochastischen Modell) Wahrscheinlichkeitspapier durchgeführt Entscheidung, wann eine Abweichung als zu gross grafischen Stichprobe ob eine oder im scheinlichkeitspapieren dass Anwendung Modellprüfung 3.2.3 Viele mit der Wahrscheinlichkeitspapiere Informationsverknüpfung liefern, ausführlich behandelt die Statistik Methode Die Gumbel Methode steht im engen die aus der die (1995, Nachteil, dass sie für Abweichungen Macht aufweisen (Stahel, Nullhypothese abzulehnen, Seite nicht mit einer 1995). wenn von genügend grossen Nullhy¬ Mit anderen Worten, die sie falsch ist, ist relativ klein. 238) wird andererseits kaum je ein Modell Problematik wird auch in Ditlevsen der Datenmenge widerlegen so genau sein, könnte. Diese (1994) ausführlich diskutiert und mit Beispielen hin¬ terlegt. Beispielsweise könnte man die in der Abbildung 3.3 dargestellte Stichprobe, welche aus einer Gumbelver¬ teilung generiert wurde, auch mit einer Lognormalverteilung modellieren. Ein Anpassungstest würde die Nullhypothese, dass die Stichprobe einer Lognormalverteilung folgt, nicht verwerfen. Der gewählte Verteilungstyp hat insbesondere im Bauingenieurwesen fluss auf das Resultat, da meist Fraktilwerte bzw. die Enden der von Bedeutung sind. Jede Schlussfolgerang ist somit einen grossen Ein- Verteilungsfunktionen konditional, nämlich abhängig vom 23 Grundlagen aus der Statistik betrachteten lungstyp Verteilungstyp. Aus diesem Grund ist vielfach sinnvoller, den Vertei¬ es festzulegen, wie für eine bestimmte Zufallsvariable quasi normativ Stahlzugfestigkeit. So ist gewährleistet, für die normalverteilung keitsanalysen stammende Resultate, untereinander vergleichbar wie dass z.B. Log¬ Zuverlässig¬ aus beispielsweise Versagenswahrscheinlichkeiten, sind. fx« Fx(x) 0.06 1.0 0.8 0.04 0.6 0.4 0.02 0.2 ii 0.0 0.00 0 20 10 30 40 60 50 70 10 0 x i 30 20 i i i 50 40 i i_ 60 70 x b) Verteilungsfunktion a) Dichtefunktion FxOO 995 990 1 1 1 I 1 ! 1 1 . yfi 900 - - 700 500 300 100 10 - - - - - 1 1 0 '/l 1 10 20 i 30 40 50 70 60 x c) Wahrscheinlichkeitspapier Abb. 3.3: Grafische Darstellung einer Stichprobe aus 100 Zufallszahlen einer Gumbelverteilung mit Mit¬ telwert 40 und Standardabweichung 10 und einer Gumbelverteilung, deren Parameter aus der Stichprobe mit der Momentenmethode geschätzt wurden nach a) Anpassungstest Als Vergleichsgrösse Kolmogoroff-Smirnoff dient beim Kolmogoroff-Smirnoff empirischen Verteilungsfunktion zwischen der Test die maximale Differenz und der theoretischen Verteilungsfunkti¬ on: D Die = MaxF„-FJ I (3.25) A| empirische Verteilungsfunktion Fx(x(i)) = berechnet. Die Die X a. (3.26) ; n Vergleichsgrösse D Prüfgrösse kanzniveau wird dabei meist mit der Formel ist Das abhängig vom muss kleiner oder gleich Stichprobenumfang Signifikanzniveau gibt n sein als die und vom Prüfgrösse Dn(a\. sogenannten Signifi¬ die Wahrscheinlichkeit a an, mit der eine Grundlagen aus 24 Fehlentscheidung getroffen nannt. Die Dn(a\ Verteilung Fx(x)", für verschiedene lautet dabei: Verwirf die wenn D > Stichprobenumfänge finden sich in Tabellenwerken Dn/a) "die Stichprobe ist. Zahlenwerte für die Prüfgrösse Hypothese und für verschiedene (Siegel, 1976; Siegel Signifikanzniveaus und Castellan, 1988; Sachs, Für die zweiseitige Fragestellung und für gleichgrosse Stichprobenumfänge mit der folgenden Dn/a) (3.27) n(a) kanzniveau Konstante ist abhängige a aufgerundet wird und 0.10 0.05 0.01 Ka 1.22 1.36 1.63 Konstante nach Cramér-von Mises und nach Die nach Cramér-von Mises und nach die Signifi¬ a b) Anpassungstest Vergleichsgrösse vom Kafür verschiedene Sig¬ nifikanzniveaus Anpassungstests K^ eine (siehe Tabelle 3.2). a Tab. 3.2: quadratischen Abweichungen der Anderson-Darling Anderson-Darling benutzen als empirischen Verteilungsfunktion der theoretischen: Q J (Fx-Fx)2 n = Die beiden von kann 2n wobei der Zähler auf die nächste ganze Zahl von n 1992). Formel berechnet werden: Kr D Statistik wird. Sie wird deshalb auch Irrtumswahrscheinlichkeit ge¬ Entscheidungsvorschrift stammt aus der der V|/(x)dF(x) (3.28) Anpassungstests unterscheiden Mises Test ist Formeln für die \|/(x) = W nur in der Funktion \|/(x). 1, beim Anderson-Darling ist \|/(x) Computeranwendung Vergleichsgrösse sich sind in Siegel und Castellan = (Fx (1 -Fx))~ • (1988) für den Cramér-von Mises Test berechnet sich Beim Cramér- zu . finden. Die zu (3.29) i=i und die A' Vergleichsgrösse = A für den Anderson-Darling Test zu -n-^ Ë((2i-D-log(x(i)) (2-n+l-2-i)-log(l-z(i))) + (3.30) i= 1 Dabei ist sen Xq ein nach der Grösse für verschiedene den sich in geordneter Stichprobenwert. Stichprobenumfänge Tabellen und für verschiedene D'Agostino und Stephens (1986). zu den Testgrös- Signifikanzniveaus fin¬ Grundlagen aus der Statistik 25 3.3 Wahrscheinlichkeitspapier 3.3.1 Anwendung Bestimmung Für die re. zur Parametern oder Fraktilwerten steht neben analytischen Methoden (siehe Kapitel 3.2, den rein de Verteilungstypen, von Seite 17) auch eine grafische Metho¬ Basis dieser Methode sind die sogenannten Verfügung. Sie lassen sich praktisch für jeden Verteilungstyp konstruieren. Ein Wahrscheinlich¬ Die Abszisse keitspapier hat ein zweidimensionales Koordinatensystem. weise durch die Zufallsvariable X Fx(x). belegt, Die beiden Achsen werden so papier gehörige Verteilungsfunktion reicht man durch u = g(x) y = Fx(x) Mit der cc + = g(x) durch man In Anhang als Gerade erscheint zum Verteilungsfunktion Wahrscheinlichkeits¬ (siehe Abbildung 3.4). Dies V(3 ß-g(x)) die Funktion F0 invertierbar ist im A er¬ ' 31); (Castillo, 1988), ergibt sich: (3.32) u und FjJ (y) durch v, so erhält typische die man Form einer Wahrscheinlichkeitspapier (uv-Koordinatensystem): ß-u oc + = transformiert, dass eine wird üblicher¬ ß-g(x) Geradengleichung v + Voraussetzung, dass F^Cy) Ersetzt F0(a die Ordinate y durch die x Transformationen: folgende = Wahrscheinlichkeitspapie¬ (3.33) sind die (Seite 95) Transformationsregeln für die verschiedenen Wahr¬ scheinlichkeitspapiere zusammengestellt. Bei der • Benutzung Jedem Wert der geln der von Wahrscheinlichkeitspapieren wird Stichprobe zugehörige wird gemäss der in Wert der Kapitel wie folgt vorgegangen: 3.1.3 (Seite 17) erwähnten Re¬ empirischen Verteilungsfunktion zugewiesen. hält somit die Koordinaten der einzelnen Werte Man (x(k);Fx(x(k))). • Die Werte werden ins • Der entstandenen Punktreihe wird eine Gerade angepasst. Diese charakterisiert sammen Die Frage, mit dem ob ein Wahrscheinlichkeitspapier eingetragen. Papiertyp rein die Form der Punktreihe. Geraden, so ist der konvexe Formen, falls der die Verteilungstyp scheinlichkeitspapier optisch zu¬ gesuchte Verteilungsfunktion. eine Stichprobe gut beschreibt, kann mit dem Wahr¬ beantwortet werden. Das entscheidende Kriterium ist Entspricht das Bild der Punktreihe mehr oder entsprechende Verteilungstyp gefunden. Ergeben so er¬ ist ein anderes Wahrscheinlichkeitspapier Positionsparameter beispielsweise einer Weibull- oder zu weniger einer sich konkave oder benützen oder allen¬ Lognormalverteilung zu ändern. Eine grafische Beurteilung der Zugehörigkeit zu als Kontrolle der getroffenen einem Verteilungstyp soll auch hier Annahmen benützt werden. Wie bereits im Kapitel nur 3.2.3 26 Grundlagen (Seite 22) dargelegt wurde, sollte die terien Die Wahl des Verteilungstyps aufgrund Schätzung durchgeführt. der Parameter oder Fraktilwerte einer bestimmten Verteilung (bzw. rationaler Kri¬ Werte mit einer bestimmten Wie¬ wird mit Hilfe der Die Fraktilwerte können entweder direkt oder anhand der Geradengleichung Stützpunkte Parameter- und für verschiedene Anhang A aus dem festgelegten Fraktilwertbestimmung Geraden Papier herausgelesen bestimmt werden. Die Parameter der funktion lassen sich mittels bestimmter = Statistik durchgeführt werden. derkehrperiode) y aus der berechnen. Die Verteilungs¬ Vörgehensweise Verteilungstypen der findet sich im (Seite 95). Fx(x) y 1.0 = Fx(x) v 0-!(Fx) = 0.99 2 0.8 0.9 0.8 0.6 1 . 0.6 0 0.4 0.4 0.2 -1 0.1 0.2 00 -2 a m 35 30 40 45 55 50 x a) xy-Koordinatensystem Abb. 3.4: Verteilungsfunktion 3.40 3.56 3.69 3.81 3.91 4.01 u 30 35 40 45 50 55 x = ln(x) b) uv-Koordinatensystem einer Lognormalverteilung LN(3.68;0.10) im xy- und im uv-Koordinaten¬ system 3.3.2 Stichprobenumfang Wahrscheinlichkeitspapiere eignen fanges. Für senweise sich für die grössere Stichprobenumfänge (n zusammengefasst (Sachs, 1992; > Analyse von 30) werden Wilrich und Wartmann, 1958). Für die oberen Klassengrenzen x'j Stichproben beliebigen Um- die Einzelwerte klas¬ häufig Henning, 1987; Henning werden die zugehörigen und relativen Klassenhäufigkeiten Fj berechnet. Die Punktepaare (x'^Fj) werden nun ins Wahr¬ scheinlichkeitspapier eingetragen. An die so entstandene Punktreihe wird wiederum eine Gerade angepasst. Die Wahl der nen Vergleich Klassengrenzen beeinflusst verschiedener wählt werden. Da die deutig Klassengrenzen die Zufalls variable. Eine Quadrate sollte den Stichproben aus natürlich auch die Parameterschätzung. müssen deshalb die Klassengrenzen gleich fixiert worden sind, ist die Geradenanpassung Für ei¬ Klassenhäufigkeit ge¬ ein¬ mittels der Methode der kleinsten diesem Grund mit den vertikalen Abweichungen durchgeführt wer¬ (siehe Kapitel 3.3.3, Seite 27). Der für eine zuverlässige Extrapolation notwendige Stichprobenumfang wird ratur sehr unterschiedlich angegeben. In Martinec in der Lite¬ (1975) wird eine Extrapolation auf die Grundlagen aus dreifache stätigt Länge Grössenordnung wird und im Wasserbau ist Diese es jedoch jedoch in Del Corso et al. Angabe eine Grösse Die Unscharfe einer 3.3.3 Die ins te für Extrapolation Anpassungstests Stichprobe 20 Jahren von Zeitperioden Hydrologie hinaus dienen verdeutlicht ext¬ zu lediglich man am die Güte einer hängt massgebenden als besten Extrapolation Bereich durch die verwendete in eine Punktreihe Abweichung Punktreihe der Punktreihe "richtige" Wahrscheinlichkeitspapier zu Beobachtungsreihe Stichprobenumfänge Wahrscheinhchkeitspapier eingetragene Gerade. Theoretisch ist die trag (1995). Be¬ Hier wird für eine Wieder¬ wird. Geradenanpassung in das gerechtfertigt angesehen. 40 bis 50 Jahren. In der Vertrauensbereichen. Zudem von auch davon ab, wie gut die Punktreihe im Verteilung genähert von als durchaus üblich, auf grössere über erforderliche Angaben grobe Anhaltspunkte. durch die Beobachtungsreihe 50 Jahren eine minimale Grösse der von gefordert. Empfohlen rapolieren. 27 der sie stützenden wird diese kehrperiode Statistik der verwendet Stichprobe, von natürlich keine wenn ergeben. sie der Dies perfek¬ einer Geraden beim Ein¬ kleinsten. Diese Tatsache wird auch am (siehe Kapitel 3.2.3, Seite 22). Auch werden selbst unterschiedliche Punktreihen ergibt sich von gleichen Grundgesamtheit entstammen, ergibt sich aus dem Zufallscharakter der Stichproben. Es existieren verschiedene Methoden, einer Punktreihe eine Gerade anzupassen. Diese setzen unterschiedliche Schwerpunkte. Punktreihe oder eher deren Enden cher Methode Zweck der an die man Analyse wendungsbereichen So können durchgeführt gestellte Aufgabe ab. Im folgenden kurz Nelson (1982), D'Agostino Zu beachten ist jedoch immer, und Für werden. Die im Mittelbereich der Entscheidung, mit wel¬ zweckmässigsten durchführt, hängt am werden die beschrieben. Anpassungen wichtigsten Methoden samt ihren An¬ weitergehende Betrachtungen Stephens (1986) vom wird auf sowie auf Castillo (1988) verwiesen. dass das Resultat stark der von gewählten Methode ab¬ hängt. a) Visuelle Anpassung Wahrscheinlichkeitspapiere Punktreihe wird zwanglos wisse Bereiche stärker sind eigentlich eine Gerade gewichtet für die visuelle gelegt. Anpassung gedacht. Je nach Zweck der werden als andere. Es gibt keine Analyse Ergebnisse dieser Methode stark Diese Arbeitsweise ist somit recht subjektiv vom und die jeweiligen Ergebnisse können ge¬ allgemeingültigen terien, nach welchen eine visuelle Anpassung durchgeführt werden chend sind die In die muss. Dementspre¬ Anwender sind kaum Kri¬ abhängig. reproduzier¬ bar. Mit einer visuellen Anpassung wird wohl die Summe der angepassten Geraden, welche senkrecht zur Abweichungen Geraden stehen minimiert der Punkte zur (siehe Abbildung 28 Grundlagen aus a). Verschiedene 3.5 geben jedoch Autoren Auslegungen andere nicht weiter erläutert werden (Castillo, 1988; Baker, 1996 Die visuelle der Methode ist Anwendung Resultat einer Parameter- oder können, b) ist die Methode so das Resultat man an, welche hier jedoch Computerunterstützung angebracht, nur Fraktilwertschätzung interessiert scharfe des Modells bestimmen oder möchte ren jedoch Statistik b). ist eine einfache Methode, welche ohne Anpassung auskommt. Die der wenn man nur am ist. Möchte die Un¬ man später wieder reproduzie¬ wenig geeignet. Methode der kleinsten Quadrate Eine der Punktreihe angepasste Gerade weist zu jedem Punkt eine Abweichung £j (siehe Abbildung 3.5). Die Gerade ist dann gut einer Punktreihe angepasst, klein sind. Die Methode der kleinsten weichungen 2 Abweichungsquadrate e{ riablen und u chungen abhängig v Da nicht . bzw. in die u-, teils in eindeutig ist, unabhängig ist, Quadrate die Ab¬ wenn minimiert die Summe der welche der beiden transformierten Va¬ wird die Minimierang v-Richtung durchgeführt (D'Agostino teils mit Abwei¬ und Stephens, 1986; Castillo, 1988; Baker, 1996 b). Die Benutzung der Abweichungen in u-Richtung spricht der Betrachtungsweise geht davon aus, dass die keit oder eben des Wertes der tungsweise sind. Eine de jedoch sind vorgeschlagen (Plate, 1993). den Lageparametern und chende Modell für die a + ß Er vertretbar. Eine weitere Variante wird empfiehlt, aus den beiden Quadrate Abweichungen die Regressionskoeffizienten Steigungen zu geometrische Gumbel von mit beiden Be¬ Mittel aus den bei¬ Das entspre¬ bilden. basiert auf der linearen in Bei¬ Regression. v-Richtung (siehe Abbildung 3.5 b) lautet: (3.34) uj + evi Die Koeffizienten a und = zufällig problemlos durchgeführt werden. berechnen und anschliessend das Die Methode der kleinsten vj einem bestimmten Wert Xj betrachten sind. Die letztere Betrach¬ zu der einzelnen Punkte kann Betrachtungsweisen zu v-Richtung in zu der Auftretenswahrscheinlich¬ Vorteil, dass die Abweichungen in der v-Richtung dimensionslos Gewichtung trachtungsweisen Zuordnung Verteilungsfunktion Abweichungen hat den ent¬ dass X als gemessene Grösse die Zufallsvariable ist. Die andere Vorstellung, ist und somit die auf ß werden nun so bestimmt, dass die Summe der Quadrate der Abweichungen E ^(^-(a = i = + ß-u;))2 minimal wird. Man setzt also die Das Minimum ist dann gibt sich folgendes Die Gerade Die geht Steigung var[u]. (3.35) 1 partiellen Ableitungen von gefunden, wenn die zweite E nach a Ableitung grösser und ß gleich Null. als Null ist. Es er¬ Resultat: durch den Punkt (m[u], m[v]) gebildet der Geraden ist der aus den beiden Mittelwerten. Quotient der Kovarianz cv[uv] mit der Die Schätzwerte schreiben sich somit zu: Varianz Grundlagen à ß m[y]-ß = 29 m[u] (3.36) cv[uv] (3.37) var[u] in Abweichungen den rj Statistik = Für die aus aus der 3.5 c) finden sich die Resultate analogen Überlegungen: m[u] = u-Richtung (siehe Abbildung m[v] -T (3.38) cv[uv] (3.39) var[v] (a, ß) Die Umwandlung mit folgenden Gleichungen durchgeführt der Koeffizienten T = entsprechenden Pendants (T), t) kann werden: 1 a Tl in die (3.40) = ß bzw. a = T| -t ß 1 = (3.41) x Zu beachten ist, dass die Formeln verschiedenen Schreibweisen sung einer Geraden von der (3.40) aufzeigen u-Richtung -l. v = 0"'(FX) v u a) Abweichung senkrecht = und (3.41) und keine in die nur die Umrechnungsformeln v-Richtung und -l, = v <Sf\Fx) g(x) u = = zwischen den für die umgekehrt Anpas¬ sind. ^_1(FX) g(x) b) vertikale Abweichung zur Beziehungen Uj u = g(x> c) horizontale Abweichung Geraden Abb. 3.5: Definition der Abweichung eines Punktes Als Mass für die Güte der respektive die Anpassung Standardabweichung von einer Geraden und der einer Gerade der an Regressionskoeffizienten die Punktreihe kann die Varianz Abweichungen evi dienen. Zur Varianz mit den üblichen Formeln wird vereinfacht angenommen, dass • die Uj fest und somit nicht zufällig sind, Bestimmung der Grundlagen 30 • die Abweichungen £vi unabhängig • der Erwartungswert • die Varianz voneinander sind, E[ev] gleich Null ist und 2 var[ev] o~ = konstant ist. Unabhängigkeit Die Annahme einer konstanten Varianz sowie die evi sind bei der Benutzung von Abweichungen der Wahrscheinlichkeitspapieren verletzt. Als Näherung ergibt sich somit als Schätzung können die Formeln aber durchaus verwendet werden. Es 2 der Varianz a : 1 var[ev] = — £ • i Durch den Statistik aus der (3.42) (vj-(a + ß Ui)) • l = var[ev] wird die Varianz Quotient l/(n-2) erklärt sich dadurch, dass die beiden Freiheitsgrades erwartungstreu. Die Reduktion des Regressionskoeffizienten durch ihre Schätzwerte ersetzt worden sind. Regressionskoeffizienten beiden Die Die (Stahel, 1995). ebenfalls sind folgt + - Qua¬ berechnet werden: (m[u]y 1 var[ev] = normalverteilt ihrer Mittelwerte nach der Methode der kleinsten Schätzungen drate sind erwartungstreu. Ihre Varianzen können wie var[cc] näherungsweise (3.43) — n n ^Oii-mfu])' i var[ß] 1 var[ev] = 1 = (3.44) — • ^(Ui-mtu]) i = l wobei m[u] der Mittelwert aller u-Werte ist. Die Fraktilwerts UT kann mit Hilfe der beiden Dieser ist wiederum mit guter Näherung Verteilungsfunktion Regressionskoeffizienten normalverteilt und weist eines beliebigen bestimmt werden. folgende Parameter auf: m[UT] = var[UT] â = + ß • (3.45) uT var[ev] (uT-m[u]) 1 • - (3.46) = + n n ^Oii-mtu])' i Die Methode der kleinsten Abweichungen Sinne wird von von der = l Quadrate weist allen Punkten das gleiche Gewicht Regressionsgeraden Distanzen minimiert werden. Eine gleich gewichtet wie eine gleich im metrischen Abweichung grosse an Abweichung zu, da die uv-Koordinatensystem im einem Ende der Punktreihe in der Mitte oder am andern Grundlagen Ende. Im gleich aus der Statistik 31 xy-Koordinatensystem betrachtet sind diese Abweichungen jedoch gross. Es findet durch die Koordinatentransformation eine wichtung nicht mehr Verzerrung oder Ge¬ statt. Je nach Funktion papier ergibt sich eine andere F0 und somit nach verwendetem Wahrscheinlichkeits¬ Gewichtung. Diese ist jedoch nicht physikalisch begrün¬ det. Eine Abweichung von beispielsweise e 0.5 in positiver vertikaler Richtung in einem Lognormalpapier uv-Koordinatensystem an jedem Ort gleich behandelt. Wandelt man diese Abweichung in Funkti¬ onswertdifferenzen um, so entspricht sie bei y 0.9 einer Differenz von Ay AF 0.5 0.06, bei y AF von Ay 0.19 (siehe Abbildung 3.6). = wird im = = Analoges gilt bei u gleich gen Die grosse am (x 0.1 Abweichungen bei logarithmierten Achsen. Eine Abweichung von e 50) entspricht einer Differenz von Ax~5 im nichtlogarithmierten Massstab. Die = = Abweichung ergibt bei u = 6.91 (x = 1000) eine Differenz linken Ende, d.h. kleinere Werte, werden also effektiv stärker Gewichtung eigentlich ohne Vergleichsbasis y = = für horizontale 3.91 = = = = im xy-Koordinatensystem Bedeutung. Sie ist hier für die Methode der Fx(x) v 1y , Ay «0.06'_ 0.9 Ay 0.5 0.3 = 0.19' s . Abweichun¬ gewichtet. vollständigkeitshalber nur Quadrate erwähnt und soll als gewichteten kleinsten Quadrate = Ax= 105 ist für die Methode der kleinsten dienen. *_1(FX) 2 S / FxvonLN(3.68;0.10;0) Abweichungen im Abstand ! 0.7 von y e = 0.5 0 S -1 0.1 -2 3.40 3.56 3.69 3.81 3.91 4.01 u 30 35 40 45 50 55 x Abb. 3.6: Gewichtung der LN(3.68;0.10;0) vertikalen Die Methode der kleinsten einer Verteilungsfunktion Quadrate durchzuführen, wird von der nur Punktreihe für eine solche den. Das bis kann auch am entsprechende bzw. von Beispiel Anpassung Teil der Punktreihe werden muss, kann 1 bis k der Formel (3.35) durchgeführt. werden. Eine nachgelesen werden. Anwendung dieses Vorgehens wenn nur an ein Ende einem der Enden berücksichtigt. Wo die visuell beurteilt wer¬ wird die Summation vom nur In der gleichen auch Extremwerte, welche als Ausreisser identifiziert worden sind, geschlossen Lognormalverteilung einer angewendet werden, Interesse ist. Um eine Analyse geteilt n ln(x) Abweichungen Vorgehen bleibt analog. Einzig in Trennpunkt (Index k) = aus Weise können der Analyse kann in Del Corso et al. aus¬ (1995) Grundlagen aus 32 c) Methode der Die gewichteten wird nimierung Abweichungen jedoch in Abweichungen sionen vermeiden, werden mel zu (3.35) wird i Betrachtet y Abweichungen y-Richtung in + ß-ui)r (3.47) man der Wiederkehr¬ der Enden fest. Gewichtung eine starke diejenigen beispielsweise e 0.01 in positiver y-Richtung im Lognormalpapier entspricht bei der Wiederkehrperiode von 2 auf 2.04 Jahre. Die gleiche Abweichung ergibt hin¬ von = - 0.98 eine Änderung von 50 auf 100 kann man Jahre. diesem Effekt mit einer geeigneten Gewichtung entgegen¬ wirken. Um mehr Gewicht auf eines der beiden Enden einer gen, wird die Formel (3.47) mit £wi-(Fi-F0(a i betrachtet. Die For¬ Änderung gewünscht, E= phy¬ Um Konflikte mit Dimen¬ möglich. anstelle der Differenzen der Funktionswerte stellt Abweichung 0.5 einer Falls Funktionswerten. Eine .-l man so gegen bei y nun von F0 (y) ist dabei Ordinatentransformationsfunktion gemäss (3.32). Die Funktion = xy-Koordinatensystem durchgeführt. i = perioden, die nur ist Quadrate. Die Mi¬ folgt geändert: £(Fi-F0(a E= Eine wie der im Differenzen y-Richtung entsprechen Interpretation Methode der kleinsten zur Abweichungen mit den sikalische Statistik kleinsten Quadrate Prinzip analog ist im Vorgehensweise der + einem Verteilungsfunktion zu le¬ Wichtungsfaktor Wj ergänzt: ß-ui)r (3.48) i = Der Term Wj wird für Minimabetrachtungen 1/Fj gesetzt. zu wird mehr Gewicht auf das linke bzw. untere Ende einer Maximabetrachtungen entsprechend wird wj 1 zu /( 1 - Mit anderen Worten, Verteilungsfunktion gelegt. Fj) 2 es Für gesetzt. Gewichtung entspricht im Lognormalpapier bei einer Maximabetrachtung eine Differenz von 0.25 bei y 0.98 sowie eine Differenz von e 0.5 einer positiver y-Richtung bei y 0.98 ändert sich die Wiederkehrpe¬ Verdoppelung der Wiederkehrperiode (siehe Abbildung 3.7). Bei y 0.5 von 2 auf 4 Jahre. Abweichungen an einem Ende werden nun ein¬ riode von 50 auf 100 Jahre, bei y Mit dieser e = 0.01 in = - = , = = deutig Zweck gewichtet als diejenigen einer Extrapolation. stärker y = in der Mitte oder FX(x) v 0.99 r-Ay " = 0.01 f = am entgegengesetzten Ende. Dies entspricht dem <Fl(Fx) /y 2 0.9 r 0.7 "Ay 0.5 FxvonLN(3.68;0.10;0) j jfif = 0.25 " 0 0.3 - -1 0.1 -2 0.01 Abb. 3.7: 3.'10 3.56 3.69 3.81 3.91 4.()1 u 3() 35 40 45 50 55 x Abweichung von einer Gewichtete = ln(x) Lognormalverteilung LN(3.68; 0.10) Methode 4 Bayes'sche 4.1 Wahrscheinlichkeitsdefinitionen gesehen Die klassische Wahrscheinlichkeitsdefinition ist historisch Wahrscheinlichkeiten zu Sie ist im quantifizieren. wickelt worden. Die Wahrscheinlichkeit wird Anzahl günstiger Ereignisse das Resultat eines Versuches, wobei ist. Als günstig Wahrscheinlichkeit eignisse mit man das Würfeln etc. Diese bestimmen möchte. Dabei Voraussetzung Glückspielen Quotient möglichen Ereignisse. bezeichnet, welche gleicher Wahrscheinlichkeit mit mit dem eine bestimmte Anzahl nur jene Ereignisse werden gleichgesetzt Gesamtheit aller zur Zusammenhang der älteste Versuch, die gilt auftreten müssen zur von Ein - aus deren dass alle Er¬ Glückspiele für ist möglich Aussage gehören, typisch der Ereignis Resultaten Voraussetzung, ent¬ wie schränkt die Anwendbarkeit der klassischen Defi¬ nition stark ein. Die frequentistische Wahrscheinlichkeitsdefinition lässt auch Ereignisse zu, welche un¬ terschiedliche Wahrscheinlichkeiten besitzen. Die Wahrscheinlichkeit wird als Auftre¬ tenshäufigkeit Häufigkeit eines Ereignisses des Auftretens eines der Ereignisses Die relative gleichen Bedingungen. aus definiert. Sie dem Grenzwert der relativen entspricht unabhängigen Wiederholungen A bei Häufigkeit ist dabei definiert als Anzahl, mit der das bestimmte Ereignis A aufgetreten ist, geführten Versuche. Die Wahrscheinlichkeit unbekannter Wert. Es ist jedoch ist ein bestimmter Wert P(A) = P(A) unmöglich, P(A) zur Quotient, gebildet Anzahl der durch¬ ist per Definition ein exakt 0.35 nicht als absolut zu zu bestimmen. fixer, wird die d.h. auf frequentistische Wahrscheinlichkeit oft als objektiv Die Anwendung tigt für der auf frequentistischen Zufallsprozesse, die - wenn sind. Es kann somit eine grosse stützen kann. Neben dieser d.h. diejenige der nur hypothetisch unabhängigen Wiederholungen nicht erfüllt werden. Zudem ist es nicht Wissen stützt, - beliebig nur geklärt, was gerechtfer¬ oft wiederholbar auf die sich eine können die beiden weiteren unter Da bezeichnet. Stichprobe produziert werden, Einschränkung äquivalent. empirisches Wahrscheinlichkeitsdefinition ist auch auch betrachten. Werte, welche sich in Beobachtungen, Betrachtungsweise wenn Dementsprechend einem nahen Bereich befinden wie etwa 0.32 oder 0.37, sind durchaus sich diese unter Analyse Bedingungen, gleichen Bedingungen, oft alles unter diesen beiden auch Begriffen verstanden werden darf. Eine ganz andere scheinlichkeit Betrachtungsweise aufgezeigt. Auftreten eines wird unter dem Die Wahrscheinlichkeit ist Ereignisses definiert. Ist man Begriff der subjektiven nun Wahr¬ als Grad des Vertrauens in das überzeugt, dass ein Ereignis A auftritt, 34 Bayes'sche Methode wird ihm die Wahrscheinlichkeit Eins zugeordnet (P(A) 1 = ). Ist hingegen man über¬ zeugt, dass A nicht auftritt, ist P(A) gleich Null. Der Grad des Vertrauens ist proportional Grösse zur Es kann ob es von P(A). jedem Ereignis eine Wahrscheinlichkeit wiederholt werden kann oder nicht. Zudem kann der beliebiges Ereignis auftritt, die zugeordnet werden, ungeachtet dessen, nicht mehr Wahrscheinlichkeitszuordnung wird nur eine von einzige Person zu persönliche Stand des Wissens die schiedliche Wahrscheinlichkeitszuordnungen möglich, quellen stehen. Verfügung zur Grundlage Subjektive Axiomen der Wahrscheinlichkeitstheorie der Wahrscheinlichkeit, dass ein zugeordnet Zahl werden. Denn Person variieren, da der aktuelle, bildet. So sind auch unter¬ Zuordnung die wenn gleichen Informations¬ Wahrscheinlichkeiten müssen jedoch den gehorchen. beispielsweise einem Ereignis A die Auftretenswahrscheinlichkeit P(A) p zugeordnet, so ent¬ 1 spricht die Komplementärwahrscheinlichkeit P(AC) p der Wahrscheinlichkeit, dass das Ereig¬ q nis A nicht eintritt. Eine andere Zuordnung würde den Axiomen der Wahrscheinlichkeitstheorie widerspre¬ chen und wäre nicht zulässig. Sie entspräche auch nicht einer sorgfältigen Beurteilung des Ereignisses A. Wird = = Subjektive Wahrscheinlichkeiten sind konsequenterweise müssten eine = - Wahrscheinlichkeiten und grundsätzlich bedingte entsprechende Notation aufweisen. Schreibweise des Grades des Vertrauens in das Auftreten eines P(A|H). H entspricht Die logische Wahrscheinlichkeitsdefinition schliesslich jektiven Wahrscheinlichkeit. in das Auftreten eines davon aus, dass es von Ist die Information werden, ner so gibt Ereignisses. einen bestimmte Anzahl Die Wahrscheinlichkeit logischen Der Ereignis A. Man selten markiert. entspricht weitgehend entspricht dem Grad des Grad des Vertrauens Richtigkeit gibt. In der der sub¬ Vertrauens Logik bestätigt oder Falschheit einer d.h. kann mit ihr keine eine Hypothese. eindeutige Aussage gemacht die Wahrscheinlichkeit an, inwieweit die Information die Aussage bestätigt. lautet logische Wahrscheinlichkeitsbegriff geht jedoch Informationen die ungenügend, jedoch korrekte Ereignisses dabei der Gesamtheit der Informationen über das nennt H auch Vorinformation. Einfachheitshalber wird H Die Richtigkeit Diese Wahrscheinlichkeit ist für eine bestimmte Anzahl von ei¬ Infor¬ mationen konstant. Die Bayes'sche Methode übernimmt die keitsdefinition. Im Gegensatz zur weniger restriktive subjektive riable Verteilung) als Zufallsva¬ aufgefasst. Bayes'sches 4.2 Die werden unbekannte frequentistischen Interpretation Wahrscheinlichkeiten (oder auch unbekannte Parameter einer Wahrscheinlich¬ Bayes'sche Theorem Methode basiert auf dem Geistlichen und Mathematiker Thomas Leben (1991). von Thomas Bayes Bayes'schen Theorem, das Bayes (1702-1761) aufgestellt ist nicht viel bekannt. Eine Biographie vom englischen wurde. Über das findet sich in Dale Das Theorem sowie seine darauf aufbauende Theorie "The Scholium" sind je- 35 Bayes'sche Methode doch erst nach seinem Tode 1763 solving kel "An essay toward fügte den. Price selber zu. a seinem Freund Richard Price von in the doctrine of chances" veröffentlicht problem der Arbeit Bayes von Gemäss Gillies (1987) darf angenommen derjenigen Bayes deckt. Das mit von nur eine Einleitung Bayes'sche Denkweise wird jedoch Anhang und einen wor¬ hin¬ werden, dass sich die heutige Interpretation Theorem ist in seiner Form mathema¬ tisch korrekt und in der Fachwelt unbestritten. Die daraus entsprechende (1723-1791) im Arti¬ nur von abgeleitete einem engen Theorie und die Kreis, den Bayesianern, an¬ erkannt. Bayes'sche Das Theorem lässt sich ten herleiten. Betrachtet P(B |A) P(A) = man zwei P(A;B) = Das nen, muss B zu Ereignis Vorgehen bei Aufgrund der Identität (4.1) Theorems: der um berechnen unter der aus die Wahrscheinlichkeit für das Eintreten Voraussetzung, dem Eintreten des A natürlich mit dem Ereignis allgemeiner der Vorinformation. Treten Schätzung neue Quotient P(AIB)/P(A) zeigt auf, P(BIA) stehende Information über das Eintreten zu Zusammenhang folgt interpretiert Erkenntnisse der Eintretenswahrscheinlichkeit Die aktualisierte Wahrscheinlichkeit A bereits P(B) eine kön¬ stehen. werden: erste Schätzung der sogenannten Priorwahrscheinlichkeit oder Schätzung entspricht Diese Ereignis Ereignisses A nutzen B in einem der Formel kann wie Benutzung dass ein der bereits vorhandenen Kenntnis über B wird für tualisiert. Der aus (4.2) abgegeben. sich die folgt • ist. Um die Information das so Wahrscheinlichkei¬ P(B) P(A]B) Theorem wird verwendet, Ereignisses eingetroffen und B, bedingten P-<^ Bayes'sche eines Das = Ereignisse A Bayes'schen direkt die einfachste Form des P(B|A) der Definition der aus von von wie die (Ereignis A) auf, so verändert B. Die Vorinformation wird ak¬ Aktualisierung durchzuführen ist. beinhaltet somit die ganze zur Verfügung B. Sie wird Posteriorwahrscheinlichkeit ge¬ nannt. Die Verallgemeinerung des len Wahrscheinlichkeiten in seiner Bayes'schen hergeleitet werden (O'Hagan, 1994). allgemeineren Form Das Bayes'sche Theorem lautet: P(Bi)-P(A|Bi) P(Bi|A) Theorems kann mit Hilfe des Gesetzes der tota¬ P(Bi)-P(A|Bi) l l (4.3) = = p(A) n jrP(Bi)-P(A|Bi) i= 1 Es sen gelten dabei die Voraussetzungen, dass sich die Ereignisse Bj gegenseitig und die Summe ihrer Wahrscheinlichkeiten Eins bei als verschiedene thesen wahr. Die Hypothesen Hypothesen Bj gen ist bekannt, dass ein mit der ist. Mit Hilfe des Ereignisses ergibt. Die ausschlies- Ereignisse B^ können da¬ betrachtet werden. Dabei ist genau eine dieser können jedoch nicht direkt beobachtet werden. Hypothese zusammenhängendes Ereignis A werden die Priorwahrscheinlichkeiten A P(Bj) Hypo¬ Hinge¬ eingetreten zu P(BjlA) 36 Bayes'sche Methode aktualisiert. Wiederum addieren sich die Posteriorwahrscheinlichkeiten nur eine wahr sein kann. Der Nenner Hypothese Wahrscheinlichkeiten keiten P(AIBj). Das Eintreten des P(Bj). vergrössern, Weitaus Die P(AIBj) grösser ist wenn häufiger ist die Beobachtung von werden werden zur nur derum einem vollständig Verteilungstyp über deren Parameter Unterscheidung vernachlässigbar einzigen als so würde die klein sein. Die Parameter subjektiven nur der Zu¬ Ungewissheit. Diese zugeordneten Hyperparameter bezeichnet. entsprächen Ver¬ Wäre ge¬ Ungewissheit Wert und nicht einer Zufallsvariable. Diese konsistent mit der P(Bj) welche mit Zufallsvariab¬ davon aus, dass der Information über die Parameter vorhanden, nicht existieren bzw. Mittel aller gewichtete Mittel. selbst als Zufallsvariablen betrachtet. Die Parameter der nun teilungsfunktionen nügend gewichtete Eins, da ja bilden die Priorwahrscheinlich¬ quantitativen Daten, man besteht so zu A wird die Priorwahrscheinlichkeit als das len beschrieben werden können. Geht fallsvariablen X bekannt ist, P(A) Wichtungsfaktoren Ereignisses ist das über sie dann wie¬ Betrachtungsweise ist Wahrscheinlichkeitsdefinition. Die Formel (4.3) lässt sich für den Gebrauch mit Dichtefunktionen wie folgt umschreiben: f0(9)-fx(x|0) f0(e|x) j-^r = fe(9)-fx(x|9) (4.4) = xi j jf0(e)-fx(x|9)de Die Vorinformation über den gesuchten Parameter 0 wird durch die Priordichtefunktion f0(9) repräsentiert. Aus der Stichprobe wird fx(x|9) bestimmt (siehe Kapitel 3.2.2, Seite 19). wie die Posteriordichtefunktion f0(9|x) die sogenannte Likelihoodfunktion Das Bayes'sche Theorem zeigt nun, als Kombination der Likelihoodfunktion und der Priordichtefunktion berechnet wird. Möchte man Formel (4.4) die sogenannte prediktive Dichtefunktion bestimmt werden, Parameter zukünftige Beobachtungen yA Aussagen machen, so kann mit Hilfe der wenn über die integriert wird: fY(y|x) Das über = Integral Jf0(9|x)-fY(y|e)de auf der rechten Seite steriorverteilung (4.5) von Formel (4.5) besteht aus dem Produkt der Po- des Parameters 0 und der Likelihoodfunktion der zukünftigen Beob¬ achtungen. Meist besitzen die Zufallsvariablen und ihre Parameter Für diskrete Zufallsvariablen fx(x|9) und fx(x). ergeben sich stetige Verteilungsfunktionen. entsprechend diskrete Dichtefunktionen Sollte der Parameter 0 diskret verteilt sein, so sind die Prior- und Posteriordichtefunktionen ebenfalls diskret verteilt. In diesem Fall ist in der Formel (4.4) das Integral gewöhnlich Das im Nenner durch die entsprechende ist, wird hier nicht näher darauf Bayes'sche Theorem Summe zu ersetzen. von ausser- eingegangen. ist nicht auf eindimensionale schränkt. X oder 0 können Vektoren Da dies eher Verteilungsfunktionen Zufallsvariablen sein. Entsprechend be¬ besitzen sie mehrdimensionale Dichtefunktionen. Die Zufallsvariable X tritt dann als Vektor auf, Bayes'sche Methode wenn mehrere 37 Beobachtungen vorliegen. mehrere unbekannte Parameter, so ist Besitzt die untersuchte entsprechend die Theorem sind für die Dichtefunktionen Bayes'schen mensionale Form einzusetzen. Es riordichtefunktion Verteilungsfunktion Zufallsvariable 0 ein Vektor. Im fx(x|9) und f0(0) die mehrdi¬ sich somit auch eine mehrdimensionale Poste¬ ergibt f0(0|x). f(e1,...,ek|x1>...,xm) (4.6) = f(x1,...,xm|e1,...,9k)-f(0lJ...,9k) Jf(x!, In der Formel sen (4.6) sind einfachheitshalber die Indizes der Dichtefunktionen worden. Sind die einzelnen Zufallsvariablen stochastisch werden die so .,xm|91,...,9k)-f(01,...,9k)d91...d9k mung der eines bedingten bedingten einzigen f?(x|e) Dichtefunktionen ergibt sich unabhängig voneinander, Randdichtefunktionen. Für die Bestim¬ zu Dichtefunktion können diese einfach Parameters 0 weggelas¬ multipliziert werden. Im Falle beispielsweise für die Likelihoodfunktion: fx1(x1|8)-...-f^(xm|9) = (4.7) Vielfach wird eine vereinfachte Schreibweise für die Formel (4.6) benutzt (Plate, 1993; Benjamin und Cornell, tefunktion das Produkt fpost(9) 1970). Gemäss aus von 4.3 ior(9) (4.6) jeweils mierungsfaktor t(0) k auf Eins fpost(9) durch Prinzip fpost(9) ergibt für Abbildung 2.2, des Das vorherigen primär aus L(0). dem Produkt Da das gegebene Beobachtungen konstant ist, normieren. Integration der sich und der Likelihoodfunktion zusammengefasst. zu (4.8) Dessen Häufig Aufgabe aus Integral wird es der Prior¬ im Nenner in einen Nor¬ ist es, die Posteriordichtefunktion wird k erst nach erfolgter Bestimmung der Form ermittelt. Bayes'schen Methode In diesem Abschnitt wird auf die erste Stufe der he Theorem ist die Posteriordich¬ k-L(0)-fpnor(9) = dichtefunktion f f Bayes'schen drei Faktoren: Die Posteriordichtefunktion der Formel dem Bayes'schen Seite 9). Weiter beschränken sich die Abschnitts allgemeine Vorgehen dargestellt (in Anlehnung besprochenen Fall der der ersten Stufe der an Methode Ausführungen auf den am Ende quantitativen Daten. Bayes'schen Methode Broemeling, 1985). eingegangen (sie¬ ist in Abbildung 4.1 Bayes'sche Methode 38 Stochastisches Modell Verteilungsfunktion Fx(x 16) 1 Prior analyse Festlegung Priorverteilung der f ior(8) 1 Datenanalyse Likelihoodfunktion L(9) 1 Bayes'sches Updating der Festlegung fpost(e) = Posteriorverteilung k-L(e)fprior(9) 1 Posterioranalyse Schlussfolgerungen 1 Punkt- oder Intervallschätzungen Abb. 4.1: Voraussage von zukünftigen Ereignissen (Punkte, Intervalle) Hypothesentests Allgemeines Vorgehen bei der Benutzung der Die einzelnen Teilschritte des ersten Stufe der Bayes 'sehen Methode beinhalten die allgemeinen Vorgehens Erarbeitung folgen¬ der Punkte: • Stochastisches Modell Als erstes wird das stochastische Modell gewählt, genschaften beschreiben handelt teilungstyps • zu Prinzip es untersuchenden Ei¬ um die Wahl des Ver¬ Verteilungstyp kann auch durch Vorinformation bereits bekannt oder normativ überprüfen, zu sich hierbei der betrachteten Zufallsvariablen. Der entsprechende dann soll. Im welches die festgelegt sein. Es gilt ob dieser der Datencharakteristik angepasst ist. Prioranalyse Historisch te gesehen Hindernisgrund ist die Schwierigkeit für die Verbreitung 1996). Die Priorverteilung wird der der Festlegung Bayes'schen typischerweise durch der Priorverteilung Methode Auswertung (Carlin der gröss- und Louis, vorhandener Infor¬ mation, eben der Vorinformation, festgelegt. Als Vorinformation steht meist subjekti¬ ve Information im sen Vordergrund. Aber auch objektive kann benutzt werden. Zu beachten ist, dass das meter der Zufallsvariablen Parameter Q{. angewendet Information Bayes'sche man für die anderen Analy¬ Theorem auf die Para¬ wird. Gesucht ist also die Wesentlich ist dabei, dass aus Bestimmung Priorverteilung der der Priorverteilung Bayes'sche Methode 39 Stichprobe die erhobene berücksichtigt. nicht Bestimmung sen Probleme. Bei Priorverteilungen von Betrachtung augenfälligste Unterschied fallsvariablen ist wohl auch der Die Die Bestimmung jedoch tisch angegangen werden. Am einfachsten wäre es, die rameter zu beschreiben. Da dies insbesondere bei schwierig ist, rametern beschrieben wird die (O'Hagan, 1994). Verteilung Verteilungstypen Beschreibungen pragma¬ Wesensmerkmale des Modal¬ Schiefe und/oder des Definiti¬ kann eine Verteilungsfunktion angepasst werden. In der Regel existieren mehrere Verteilungstypen, welche schreibung passen. Diese sind teilung styps in den meisten Fällen Änderungen zur • Folge wenig Auswirkungen auf Posteriorverteilung die Sensitivitätsanalyse überprüft werden, nicht grosse Änderungen der Posteriorverteilung haben. 19). besteht in der Datenanalyse Auswertung ist die Likelihoodfunktion Beobachtungen einer zu Stichprobe. berechnen Aus den vorhandenen (siehe Kapitel 3.2.2, Seite Sie enthält die Information, welche lokal gewonnen werden kann. Bayes'sches Updating Mit Hilfe des Bayes'schen schieht durch die Theorems wird die Posteriorverteilung muss auf Eins normiert werden. Im keiner bekannten Dichtefunktion Posteriorverteilung bestimmt. Dies ge¬ der Likelihoodfunktion mit der Priordichtefunktion. Multiplikation Die Fläche unter der Kurve • Be¬ Datenanalyse Die • Priorverteilung der zur sich jedoch sehr ähnlich. Damit wird die Wahl des Ver¬ haben. Es sollte trotzdem immer mittels einer ob gros¬ mit mehreren Pa¬ beispielsweise Schätzungen Standardabweichung, onsbereiches sein. Mit Hilfe solcher einige nur durch ihre Pa¬ Priorverteilung besten durch am Dies können werts, Medians, Mittelwerts, der klassischen Statistik. zur objektiver Information bietet keine aus Information kann die subjektiver der Parameter als Zu¬ allgemeinen wird die folgen. Posterioranalyse Die Posteriorverteilung repräsentiert letzte Aufgabe der Bayes'schen Sehr informativ ist die diese Art kann kann dabei auch die funktion sein. Als mungen von Methode besteht in der Darstellung sich man am das gesamte Wissen über die Parameter. Die der Dichtefunktion der besten ein Bild gleichzeitige Darstellung analytische Auswertungen Vertrauensintervallen oder im von Hypothesentests Die Posteriorverteilung von der dieses Wissens. Posteriorverteilung. Auf ihrer Form verschaffen. Hilfreich Priorverteilung stehen und der Likelihood¬ Parameterschätzungen, Vbraussagebereiche oder die Bestim¬ Durchführung Vordergrund. für die Parameter führt Zufallsvariable X. Aus dieser Schlussfolgerungen Auswertung zu Posteriorverteilung einer Posteriorverteilung können wieder alle gezogen werden. In diesem Fall erhält man für die obengenannten direkt Angaben über die Zufallsvariable X. Die Standardabweichung der Posteriorverteilung dient als Indikator für die kraft der gewonnenen Information. Ist sie relativ gross, so Aussage¬ wird die Posteriorinforma- 40 Bayes'sche Methode tion als schwach bezeichnet. Eine kleine grosse Aussagekraft hin. Allgemein Standardabweichung hingegen weist kann man Likelihoodfunktion nach der Grösse ihrer Mittelwert näher bei Bayes'sche der sagen, dass die Priorverteilung Mittelwert und die werden. So wird Aussagekraft gewichtet demjenigen auf eine liegen, der aus der Infor¬ grösseren Aussagekraft bzw. Standardabweichung kommt (Kroon, mation mit der 1994; Rüttener, 1995). Entsprechend wird eine Priorverteilung mit kleiner Standard¬ abweichung praktisch ändert. Umgekehrt bestimmt, wird die der Likelihoodfunktion ver¬ allein durch die Likelihoodfunktion Posteriorverteilung Priorverteilung die wenn Multiplikation mit nicht durch die eine sehr grosse Standardabweichung aufweist, d.h. die Vorinformation sehr vage ist. Bestimmung 4.4 Priorverteilungen von In diesem Abschnitt wird auf die formation eingegangen. Literatur verwiesen Für die Bestimmung Priorbestimmung (Berger, 1980). (1986). Weitergehende Hinweise Alle Verfahren gehörende zur Bestimmung Bestimmung Priorverteilungen von beispielsweise subjektiver In¬ Information sei auf die Priorverteilungen von (1967), Berger (1980) und Wahrscheinlichkeit direkt. Es wird kein genommen, welches objektiver aus aus Hilfreich für das Verständnis ist auch Silverman zur Information finden sich in Winkler Priorverteilungen von mit Hilfe in Kleiter erheben die Umweg zu subjektiver aus (1980). einer Realisation über ein Präferenzurteil hypothetischer vor¬ Lotterien oder Wetten zu¬ stande kommt. Die Verfahren werden deshalb als direkte oder ad hoc Verfahren bezeich¬ net (Schaefer, 1976). Anlehnung an können Berger (1980) Priorverteilungen Histogrammansatz Der Wertebereich bzw. der gleichmässige lichkeit on Intervalle zugesprochen. angenähert. Hauptteil (Klassen) des Wertebereichs des Parameters 9 wird in unterteilt. Jedem Intervall wird eine Wahrschein¬ Das erhaltene Histogramm wird Anstatt direkt die Wahrscheinlichkeiten lative oder absolute Häufigkeiten benutzt werden. nun zu Es gibt keine Regeln, wieviele Intervalle aufweisen sollen. Auch bei der Wahl des nicht einmal auf die Wahl eines man freier man durch eine Dichtefunkti¬ schätzen, können auch Diese müssen natürlich passung durch eine Dichtefunktion in Wahrscheinlichkeiten • nach fol¬ Ansätzen bestimmt werden: genden • In umgewandelt vor re¬ der An¬ werden. benutzen soll und welche Breite diese Verteilungstyps ist man frei. Im Prinzip ist Verteilungstyps angewiesen (siehe verteilungs¬ Ansatz). Verteilungsgebundener Ansatz Zunächst wird ein bzw. Die Verteilungsfunktion Festlegung zung Verteilungstyp von zu angenommen. Es nun, diejenige finden, welche die Vorinformation kann entweder über die Fraktilwerten gilt erfolgen. Schätzung Meist sind nur am Dichtefunktion besten beschreibt. der Momente oder über die Schät¬ zwei oder drei Fraktilwerte notwen- Bayes'sche Methode dig, 41 eine Dichtefunktion um wendig verwenden, funktion Fraktilwerte den bestimmen. Möchte ist zunächst mit der minimal so festzulegen. zu Es muss notwendigen überprüft werden, nun Erwartungen entsprechen. Anzahl die Dichte¬ ob die daraus resultierenden Tun sie dies nicht, so ist mit einer anderen Fraktilwerfkombination die Dichtefunktion zu Verteilungstyp der Dichtefunktion bei einer ändern. Die zu Bestimmung bestimmen. Allenfalls ist mung durch Fraktilwerte ist recht mühsam. Es ist somit Überbestimmung Ein ten Spezialfall des hat die verteilungsgebundenen Ansatzes Eigenschaft, Eine dass die zur somit auch deren den selben Analyse (Wickmann, 1990): "Die verteilungen konjugiert, F sind.". Es existieren Multiplikation nur Smith Verteilungsfreier die Priori- und die für die Familie der von sogenann¬ konjugierte Priorver¬ ergibt. Die Posteriorverteilung und konjugierte Verteilung gehört kann wie F heisst zur folgt definiert wer¬ Familie P der Versuchs¬ Posteriori-Verteilung Mitglieder von Exponentialverteilungen konjugierte finden sich in Plate (1993), Bernardo und (1995). Ansatz Experten Verteilungsfunktion gewonnen. Stützwerten. Die daraus resultierende henden Benutzung 1994; Bernardo und Smith, 1994; Carlin und Louis, 1996). Bei diesem Ansatz wird die von einer von der Likelihoodfunktion mit der Begriff "konjugiert" konjugierten Verteilungen (1994) und RCP Befragung Der Verteilungsfamilie wenn Verteilungen (O'Hagan, ist die wird stark vereinfacht. Eine Verteilungsfamilie. Tabellen mit empfehlenswert, Likelihoodfunktion Priordichtefunktion eine bekannte Dichtefunktion zur nötig, den Überbestim¬ es abzusehen. konjugierten Priorverteilungen. teilung • mehr Fraktilwerte als not¬ man Verteilungstyp folgen. oder die Dichtefunktion durch die Gefragt wird nach Fraktilwerten oder anderen Verteilungsfunktion muss jedoch keinem beste¬ Die Fraktilwerte können mit numerischen Urteilen oder mit Relationsurteilen bestimmt werden (Kleiter, 1980). Bei den Verfahren mit numerischen Urteilen wird direkt nach dem Median und weiteren Fraktilwerten ge¬ Möchte eine man beispielsweise Dichtefunktion bestimmen, so erfragt man bei¬ fragt. spielsweise liegen den Modalwert und die und halb x-Werte, welche links und rechts grosse Ordinaten so aufweisen, wie folgt: nung nach wahrscheinlichsten Wert. Nennen Sie nun vom Modalwert Nennen Sie den ihrer Mei¬ zwei Werte, welche etwa halb wahrscheinlich sind und jeweils darüber bzw. darunter so liegen. Bei Verfahren mit Relationsurteilen wird die Ordinate der Verteilungsfunktion oder Dichtefunktion bzw. als Alternative die Fläche der Dichtefunktion sukzessive unter¬ teilt. Meist erhebt 50%-, und man Tertile (33%- und 75%-Fraktilwert). Die Nennen Sie den Wert, der ihrer 67%-Fraktilwert) oder Quartile können beispielsweise Meinung nach mit bzw. unterschritten werden kann. Nennen Sie nun so Quartire (25%-, erfragt werden: 50%-iger Wahrscheinlichkeit den über- Wert, der mit 25%-iger Wahr¬ scheinlichkeit unter- bzw. überschritten wird. Durch die mittels Diese soll den Befragung Prinzipien erhaltenen Fraktilwerte wird eine einer stetige Verteilungsfunktion folgen. Prinzipiell Kurve kann gelegt. irgendei- 42 Bayes'sche Methode ne beliebige Verteilung gewählt werden, kümmern. Dies ist möglich, da die ohne sich fizierte einbezogen völlig unregelmässigen • oder gar entarteten jedoch irgendeinen als zifizierte oder wird das ohne der Annahme aus, dass keine Informa¬ entspricht muss Fall keine zu d.h. die Likelihoodfunktion und somit die Da¬ Priorverteilung hängt von der funktionalen Form g(9) von beziehen. Eine Gleichverteilung nicht informativen für g(9). nicht informativen beispielsweise der für den Parameter 9 ist in diesem Eine ausführliche Priorverteilungen findet (1996). Vereinfacht kann Carlin und Louis ab, in welcher in der Likelihoodfunktion auf, dann ist die Priorvertei¬ geeignete Priorverteilung Festlegung also f(9), Posteriorverteilung. Parameter 9 in der Form g(9) interpre¬ Daraus entsteht natürlich eine unspe- der betrachtete Parameter in der Likelihoodfunktion erscheint. Tritt auf so Dichtefunktion. Da keine Präferenzen vorhanden sind, Bayes'sche Updating objektiv, Die nicht informative lung dabei eine konstante Dichtefunktion Definitionsgrenzen. uneigentliche ten bestimmen die verzichtet. keinen Wert oder Wertebereich als wahrscheinlicher einstuft anderen. Dem Gleichverteilung eine von Priorverteilungen Priorverteilung geht von man Unspezi- auf den Gebrauch Verteilungsfunktionen tion über den Parameter 9 vorhanden ist. Keine Information tiert werden, dass zu grösser als Eins können in die werden. Sinnvollerweise wird Nicht informative oder diffuse Die nicht informative die Fläche Eins aufweisen. muss mit Flächen kleiner oder Verteilungsdichten Konstante k deren mathematische Form Methode auf einer rein numerischen Bayes'sche Basis arbeitet. Die Posteriordichtefunktion um Priorverteilungen man Erläuterung sich in folgende Regeln für die Berger (1980) und für die Wahl von (Plate, 1993): aufstellen Erscheint der Parameter 9 in linearer Kombination mit den Daten in der Likelihood¬ funktion, so ist die Priordichtefunktion konstant. Erscheint der Parameter der Form 1/9 zu 2 in der Likelihoodfunktion, so ist die Priordichtefunktion hingegen in proportional 1/92. Die Benutzung von matisch werden, ausführlichere nicht informativen wenn sie zu Beschreibung nicht Priorverteilungen kann mathematisch spezifizierten Posteriorverteilungen der Problematik bei der Benutzung von proble¬ führt. Eine nicht informati¬ ven Priorverteilungen und der philosophische Hintergedanke gan (1994), Bernardo und Smith (1994) sowie Carlin und Louis (1996) kann den Werken O'Ha¬ entnommen werden. Hat der so ist Verteilungstyp entsprechend der betrachteten Zufallsvariablen mehrere unbekannte Parameter, eine multivariate Priordichtefunktion zu bestimmen. Die Bestim¬ mung der Priordichtefunktion ist bereits bei zwei unbekannten Parametern komplex. den. Sie Die bivariate Priordichtefunktion muss tefunktion dass die spricht beispielsweise f0(92) über die ^(9^ 92) bedingte Dichtefunktion bestimmt werden. Als Vereinfachung kann Randpriordichtefunktionen unabhängig die Priordichtefunktion der (0ls 92) kann nicht direkt bestimmt f0(91|92) man wer¬ und die Dich¬ auch davon ausgehen, voneinander sind. In diesem Fall ent¬ Multiplikation aller Randpriordichtefunktionen. Die Bayes'sche Methode 43 Randpriordichtefunktionen den. Mehr über die können somit auch Bestimmung unabhängig voneinander bestimmt wer¬ multivariaten Dichtefunktionen findet sich in von O'Hagan (1994). Berechnungsverfahren 4.5 Die der Bestimmung besondere auch die Posteriorverteilung nach sem von Integralen. Einzig verteilungen Fall (4.4), (4.6) bzw. (4.8) und ins¬ Posterioranalyse (Momentenbestimmung, Fraktilwertberechnung) basiert auf dem Lösen nalen der Formel vermeidet komplexen und, die Benutzung im Fall mehrerer Parameter, mehrdimensio¬ Likelihoodfunktion von zur aufwendige Berechnungen. ja einer bekannten Verteilungsfunktion, Die von Posteriorverteilung folgt der man einfach die rameter oder Momente bestimmen kann. In allen anderen Fällen ist Berechnungsverfahren angewiesen. oder numerische Verfahren, numerische den werden die Integrationsverfahren wichtigsten Verfahren kurz den sich in Bernardo und Smith Einige Berechnungs verfahren g(9) = L(9) Die Funktion 4.5.1 g(9) Diese ist für die durch eine der Wenn der Stichprobenumfang Bayes'schen von Darstellungen fin¬ Carlin und Louis (1996). auf der Form der Posteriorverteilung nur Posterioranalyse Verfahren gross ist, zur so haben kleine nicht explizit zu durch die Normie¬ bestimmen. Bestimmung der Posteriorverteilung ist die Man könnte das Verfahren als eine An¬ ist die Likelihoodfunktion in einem engen Be¬ Abweichungen der Priordichtefunktion nur ge¬ auf die Posteriordichtefunktion. Für diesen Fall ist die Posteriorver¬ einem Theorem g(9)«g(mo)- folgen¬ Version des Zentralen Grenzwertsatzes bezeichnen. Folglich ringe Auswirkungen teilung gemäss lediglich Normalverteilung. wendung reich konzentriert. asymptotische Verfahren asymptotisches Approximation Ausführlichere Pa¬ analytische und Simulationen unterteilen. Im dargestellt. in die¬ (4.9) unterscheidet sich Asymptotische Ein einfaches auf fprior(9) • rungskonstante k. man Prior¬ benötigten Diese lassen sich in (1994), O'Hagan (1994) und basieren konjugierten (Carlin und Louis, 1996) näherungsweise normalverteilt: ( (9-mo)T-V 1-(9-moV (4.10) exp V Es wird dabei vorausgesetzt, dass für die Likelihoodfunktion und die Priordichtefunktion die ersten beiden Erwartungswert teilung Ableitungen der um den Modalwert der Normalverteilung entspricht und die Varianzmatrix V der negativen Posteriorverteilung existieren. Der dann dem Modalwert der Posteriorver¬ zweiten Ableitungsmatrix der logarith- 44 Bayes'sche Methode mierten Posteriordichtefunktion ausgewertet für den Modalwert. Der berechnet sich aus A(log(g(9))> Die Varianzmatrix ( v-! Die A(log(fprior(9) = ergibt sich L(9))> ' der korrekten von von Approximation v mit der nun L(5c) = X angenäherten Normalverteilung durchgeführt. Posteriorverteilung Beispiel einer von X schreibt sich • exp(-X, n J£_.,p-, ^ F7^ Verfahren erhalten (1994) wer¬ sowie in X mit EX(X;0) dienen. Die zu: (4.13) m[x]) • ' eXP (~b • • wird die zur Likelihoodfunktion *) konjugierte zwei- (4-14) r(p) Em Jpost, b + n p _ Vergleich sich für den Erwartungswert und für die Varianz der n-i + p = Normal r., varLAJpost, Als Laplace exp(-A, x) Eingesetzt in Gleichung (4.11) und (4.12) ergeben angenäherten Normalverteilung: L sie stark abweicht. Insbesondere in exponentialverteilten Zufallsvariablen Stichprobenumfang ist. Als Priorverteilung parametrige Gammaverteilung GA(b;p;0) gewählt. = wenn Die gross sein. kann mit dem sogenannten der fpriorM sind dann gross, Normalverteilung Abweichungen Dichtefunktion und die Likelihoodfunktion % moy (1996). Zur Illustration soll das = = diesem Verfahren findet sich in Bernardo und Smith zu Carlin und Louis fx(x) (4.12) ///le der Form einer den Endbereichen können die den. Näheres (4.11) aus: &vPrV schief ist, d.h. sehr stark Eine bessere 0 V1 ^9jJ9j Abweichungen n = .<log(frior(9)-L(9)))| Posterioranalyse wird wobei • ,2 d = v Erwartungswert folgender Gleichung: . + m[x] (4.15) n-1 ~ Normal (b + n m[x]) • 2 wird die "genaue" Posteriorverteilung bestimmt. Da für die Priorverteilung eine zur Likeli¬ konjugierte Verteilung gewählt wurde, entspricht die Posteriorverteilung wiederum einer Gammaverteilung. Ihre Dichtefunktion schreibt sich zu: hoodfunktion W*> Der (b n-m[x])p + r(p Erwartungswert post, Gamma var[A,] post, Gamma + n _.._, + ^P ~} = + n"-exp(-À-(b und die Varianz dieser b + n • + n-m[x])) Gammaverteilung berechnen sich (4.16) zu: m[x] (4.17) p + n (b + n m[xj) Die Unterschiede sind in diesem 2 Beispiel bereits bei kleinen Stichprobenumfängen klein. Die Form der Bayes'sche Methode Verteilungsfunktion funktion etwas 45 jedoch unterschiedlich. So treten insbesondere grössere Abweichungen auf (siehe Abbildung 4.2). ist an den beiden Enden der Dichte¬ 2.0 Priorverteilung: GA(5;3;0) Stichprobe: m[x] 1, = n 10 = Approximation durch Normalverteilung Posteriorverteilung 2.0 Abb. 4.2: der konjugierten Posteriordichtefunktion mit der angenäherten Normalverteilung Numerische 4.5.2 Das Vergleich X Integrationsverfahren allgemeine Prinzip der numerischen formeln genannt, kann wie folgt Es sei I das eindimensionale Integrationsverfahren, häufig auch Quadratur¬ beschrieben werden: Integral b I Die Jk(x)dx = (4.18) Quadraturformeln nähert k(Xj) I ausgewählten an I durch die Summe Stützwerten Xj i = Funktionswerten aus [a, b] mit Wichtungsfaktoren Wj: (4.19) l Die verschiedenen Quadraturformeln Stützwerte und/oder anderer Die einfachste Quadraturformel unterteilt Wichtungsfaktoren nommen. Es n £k|a Die Funktion i = an der Stelle der Unterteilung den entsprechen werden + Integrationsbereich [a, b] es wird somit durch Mittelpunkte gleich n Gewichtung vorge¬ (4.20) n Rechtecke mit Basis (O'Hagan, 1994). Computerunterstützung k(x) nicht stimmen. Wenn das zu (b - und Höhe a)/n der Basen ersetzt. Für eindimensionale in 100 Intervalle dass die Funktion wird keine 2-n Falls eine höhere derlich ist, kann die Anzahl Intervalle erhöht werden. Die formel ist mit anderer den Mittelwerten der einzelnen Intervalle eins gesetzt, d.h. zu in (2-i-l)-(b-a) l k(x) die Verwendung sich somit ergibt = unterscheiden sich in der Wichtungsfaktoren. grosse Intervalle. Die Stützwerte I Produkten £wrk(Xi) = und die e von zu ohne Probleme komplex ist, bestimmende Integral um Integrale genügt Genauigkeit Anwendung möglich k(xt) dieser unter der erfor¬ Quadratur¬ Voraussetzung, die einzelnen Funktionswerte nicht über einen endlichen Bereich zu zu be¬ inte- Bayes'sche Methode 46 sondern über [-°o5 oo], grieren ist, so Integrationsbereich [a, b] ist der dass die Funktionswerte ausserhalb dieses Bereiches Wendet man teilung an, so Quadraturformel diese so weit vernachlässigbar klein Erwartungswertbildung für die auf die zu setzen, sind. Posteriorver¬ sich: ergibt £ h(9j) g(9j) • E[h(9)]~i:^ (4.21) Sg(6i) i Für die i = Bestimmung des Erwartungs wertes E[ 9] beispielsweise ist h( 9) Eine Vereinfachung ergibt sich, lung durch sem Fall kann die sogenannte Gauss-Hermite allenfalls eine, wiederum 9 zusetzen. annimmt, dass die Posteriorvertei¬ multivariate, Normalverteilung genähert werden kann. In die¬ (Naylor und Smith, 1982). I wenn man = Quadraturformel angewendet werden Intégral Das j exp(-t2)-k(t)dt = (4.22) —oo wird durch diese genähert. faktoren finden sich nom vom Grade zum (2n 1 - Tabellen für die Beispiel ), so entsprechenden in Salzer et al. ist die Approximation 2 Posteriorverteilung proportional zu exp(-t ), führt die Gauss-Hermite nimmt man folglich (1952). Quadraturformel zu Stützwerte und Ist die Funktion Wichtungs¬ ein k(t) Poly¬ exakt. Mit anderen Worten, ist die d.h. ist der Parameter 9 normalverteilt, so exakten Resultaten. In den meisten Fällen Normalverteilung N(ix0;a0) folgt. Es muss Standardisierung durchgeführt werden. Die Gauss-Hermite Quadra¬ an, dass der Parameter 9 einer zuerst eine turformel schreibt sich oo zu: n Jg(e)d9=2wVg(Zi) i -oo 1 = (4.23) w'j zj = wr = n.0 J2-GQ exp(tj)- J2 + G0 • t4 Wichtungsfaktoren, tj wobei wj die Gauss-Hermite die Stützwerte und Quadraturformel sind. • \Iq + berechnen • -^ i = Posteriorverteilung Vorinfor¬ h(9;) g(9i) IK Öi aus folgt: £ w'j E[h(6)] die Anzahl Stützwerte der Die Parameter \i0 und o0 müssen mationen gewonnen werden. Die Erwartungswerte der sich somit wie n J2 = l rj0 t4 g(9i) <4-24) Bayes'sche Methode Eine gute 47 wird in den Näherung häufigsten Fällen bereits mit acht Stützwerten erreicht (O'Hagan, 1994). Im multivariaten Fall wird die Gauss-Hermite Quadraturformel sukzessiv auf die ent¬ sprechenden Randverteilungen angewendet (kartesische Produktregel): j...Jg(91,...,9k)dt1...dtk £wf .g(z«,...,z^) = Für mehr als sechs Parameter wird die Gauss-Hermite habbar. Für diese Fälle müssen effizientere (4.25) Quadraturformel nicht mehr Quadraturformeln oder andere Berechnungs¬ verfahren benutzt werden. Hinweise dazu finden sich in Bernardo und Smith in hand¬ (1994) und O'Hagan (1994). Für beliebige den. Dies ist Parameterdefinitionen beispielsweise notwendig, finiert ist. Parameter, welche vorgängig muss eine Substitution durchgeführt falls der Parameter nicht im Bereich im Bereich beispielsweise sind, können mittels der Transformation <|) bzw. log(9) = wer¬ [-<», oo] de¬ [0, °o] oder [a, b] definiert <|) = log(9-a)-log(b-9) in die normalverteilte Form überführt werden. Im multivariaten Fall können die Trans¬ formationen für jeden Parameter einzeln durchgeführt durch die Parametertransformation auch eine Posteriorfunktion entsteht. Die Vertei¬ wird durch eine Parametertransformation lungsfunktion g(9) von 9 zu § = t(9) in die Verteilungsfunktion neue g*(4>) IU(<t>)II = umgewandelt. Ableitungen g(t_1(cp)) • Dabei ist t~ (())) von t Transformation soll eine neue werden. Zu beachten ist, dass (<))) nach jedoch (4.26) <|> und ||J((j))|| auch dann Normalverteilung genähert Die Gauss-Hermite die Umkehrfunktion chen, wenn neue sich die g(9) die Jacobimatrix der der Determinanten. Eine wenn gJ§) besser durch . bezüglich angewendet. der Startwerte \iQ und G0 Man benutzt die berechneten Er¬ Startwerte für eine weitere Iteration. Die Iteration wird Erwartungswerte Zur Illustration wird das Absolutbetrag kann sensitiv sein. Aus diesem Grund wird sie iterativ wartungswerte als t(9), J(<))) durchgeführt werden, wird als Quadraturformel der zu abgebro¬ stabil verhalten. Beispiel des vorhergehenden Kapitels herangezogen. Für eine exponentialverEX(^;0) wurde eine Stichprobe mit zehn Werten erhoben. Der Mittelwert Die Priorverteilung ist eine Gammaverteilung GA(5;3;0). Die Funktion g(0) teilte Zufallsvariable X mit ergab sich zum[x] schreibt sich somit g(X) =^T-Ä,n p_1-exp(-Ä.-(b + = r(p) Da der Parameter geführt 1. = zu: X nur im Bereich = g(<l>) = n-m[x])) [0, °°] gültig ist, werden. Die daraus resultierende 4> + (4.27) muss zunächst eine Parametertransformation durch¬ Verteilungsfunktion ergibt sich zu: iog(a.) bP pTTT (exp(<)>)) pexp(-exp((())-(b (4.28) + nm[x])) 48 Bayes'sche Methode Die Momente g((j>) h((|>) lassen sich mit der von des Mittelwertes = Gleichung (4.24) und der Varianz (j> h(<|>) ändern sich die Momente nicht mehr. Die Resultate sind stimmung mit sind in diesem Falle Lösung in Tabelle 4.1 konjugierter Verteilung bestimmen. Dabei wird für die zusammen dargestellt. mit denjenigen Die Abweichungen aus der Momentenbe¬ von der exakten gering. konjugierte Verteilung Gauss-Hermite mtHost 0.8676 0.8667 var[À,]post 0.06265 0.05778 Momente der Tab. 4.1: Berechnung gesetzt. Bereits nach drei Iterationen (<j)-m[<t>]) = Posteriorverteilung Quadraturformel Gauss-Hermite aus Berechnung der und mittels der mittels der konjugierten Vertei¬ lung Simulationen 4.5.3 Simulationen, auch Monte Carlo Integrationen genannt, generieren eine Stichprobe der Die Momente dieser Posteriorverteilung. der Mit zunehmendem Posteriorverteilung. setzt ren g(9) = dass voraus, L(9) riorverteilung f • eine Dichtefunktion nun wie folgt s(9) annähert. Die in den generiert "Importance Sampling" rior(9) ungefähr kann Stichprobenumfang für die Zufallszahlen direkt Fällen kommt das sogenannte sind Schätzwerte für die Momente Posteriorverteilung folgt werte den exakten Werten. Die Verteilungsfunktion, Stichprobe zur nähern sich die Schätz¬ wenigsten Fällen einer werden können. In solchen Dieses Verfah¬ Anwendung. existiert, welche Erwartungswertbildung die Funktion für die Poste¬ vorgenommen werden: il E[h(9)] ZW w<öi> Jh(9)-w(9).s(9)d9 = jw(9)-s(9)d0 2>(9i) i mit w(9) = g(9)/s(9) Die Güte der Schätzwerte ist s(9). Eine gute niger konstant abhängig Schätzung ergibt sich, ist. Die Wahl von s(9) der Güte der falls die führt dies jedoch zu Rücksicht auf das Verhalten Sampling" g(9) durch mehr oder von g(9) we¬ in den kann die an verwendet werden. Für schiefe Approximation. Integrationen. Dies sind unter anderem das und die "Markov Kette Monte Carlo" Methode. Näheres Methoden finden sich in Bernardo und Smith und Louis von weniger symmetrischen Verteilungen keiner guten Es existieren weitere Monte Carlo Approximation Wichtungsfunktion w(0) Posteriorverteilung angenäherte Normalverteilung Verteilungen ren von muss Endbereichen nehmen. Bei mehr oder die (4.29) 1 = zu "Rejection diesen und weite¬ (1994), O'Hagan (1994) und Carlin (1996). Zur Illustration wird wiederum das tialverteilte Zufallsvariable X mit Beispiel EX(X;0) der vorhergehenden Kapitel herangezogen. Für eine exponenStichprobe mit zehn Werten erhoben. Der Mittel- wurde eine Bayes'sche Methode 49 1. Die Priorverteilung ist eine Gammaverteilung GA(5;3;0). Als Funktion ergab sich zu m[x] s(9) wird die angenäherte Normalverteilung benutzt. Die Wichtungsfunktion w(0) ergibt sich somit zu: wert = IM w(X) + •À,n P exp(-A, (b+ n m[x])) (4.30) 2\ A-^n "2 A aN i exp fïîz wobei (4.15)). (|lN;0"N) das Resultat Die Resultate von aus der Berechnung mation durch eine Abweichungen an den Normalverteilung ist besser, durchgeführt wird. Dies führt auch Der Einfluss der grossen zu jeweils vorgängig die Streuung. = Simulation ohne Parameter¬ Simulation mit Parametertrans¬ formation M post var[A,]poSt m M post var[X]p0St 0.8677 0.0620 0.8682 0.06666 2. Lauf 0.8597 0.05438 0.8677 0.06239 3. Lauf 0.8467 0.06791 0.8968 0.06599 4. Lauf 0.8655 0.05663 0.8699 0.06123 5. Lauf 0.8641 0.05761 0.8659 0.06183 6. Lauf 0.8106 0.11448 0.8673 0.06222 7. Lauf 0.8755 0.07227 0.8636 0.06161 8. Lauf 0.7393 0.17239 0.8669 0.06421 9. Lauf 0.8650 0.06358 0.8647 0.06698 10. Lauf 0.8217 0.10062 0.8694 0.06279 Momente der Posteriorverteilung und ohne vorgängiger aus einem "Importance Sampling" Parametertransformation auf zwei und mehr Erweiterung Stehen zwei oder mehr Stichproben zur Unabhängigkeit und X2 zur W(elXl'X2) = = der einzelnen Verfügung, so mit Stichproben Verfügung, quentiell angewendet werden (Kleiter, 1980; dafür ist die Die stabileren Resultaten. l.Lauf Tab. 4.2: proben X1 (siehe Gleichungen dargestellt. Approxi¬ Parametertransformation (j) t(X,) Enden resultiert in einer grossen wenn ist lO'OOO Werten sind in Tabelle 4.2 transformation m 4.6 Normalapproximation mit der zehn Simulationen mit so kann das Carlin und Stichproben. schreibt sich die Bayes'sche Theorem se¬ Louis, 1996). Die Voraussetzung Stehen zwei unabhängige Posteriorverteilung Stich¬ zu: k-L(Xl'X2|6)-fprior(0) (k-L(Xl|9)-L(x2|9)-fprior(9)) (4.31) ocL(x2|9)-fpost(9|Xl) Die Posteriorverteilung riorverteilung als der Priorverteilung zweiten nen aus Stichprobe, kann sequentiell Priorverteilung für das nächste so erhält man und einer Updating die (Priorverteilung, Stichprobe Xj bestimmt werden, indem zunächst die Poste¬ Stichprobe betrachtet. Verbindet Posteriorverteilung, und X2) bestimmt wird. Diese wird man diese mit der welche alle drei Informatio¬ beinhaltet. Die Reihenfolge der Verknüp- 50 Bayes'sche Methode fung spielt dabei keine Rolle. Man kann zuerst die verknüpfen und dann die Stichprobe X2 einbinden, Priorverteilung verknüpfen ren zur und dann erst die gleichen Posteriorverteilung. Stichprobe Xj mit der oder zuerst die Stichprobe X± Priorverteilung Stichprobe X2 mit der einbinden. Beide Wege füh¬ Informationsverknüpfung 5 Das hier vorgestellte welche mit gewendet werden, Für diese nen. keitspapier Verfahren zur kann auf Eigenschaften stetigen Verteilungsfunktionen Verteilungsfunktionen muss zugehöriges zusätzlich ein an¬ beschrieben werden kön¬ Wahrscheinlich- existieren. Das Verfahren ist somit anwendbar auf Zufallsvariablen, welche insbesondere mit Normal- und und Informationsverknüpfung Weibullverteilungen sowie mit Gumbel-, Fréchet- Lognormalverteilungen, für Minima und Maxima und mit schrieben werden können. Dies sind Verteilungstypen, Exponentialverteilungen welche im Bauwesen häufig be¬ ver¬ wendet werden. Grundidee und Verknüpfungsbasis 5.1 Die Methode wird auf die Parameter der untersuchten Zufallsvariablen ange¬ Bayes'sche wendet. Dazu sind Kenntnisse über die jedoch bereits bei sollte folglich ist festzulegen. Hingegen Grenzen oder die Momente der knüpfung schwierig, einem unbekannten Parameter weise über die Momente nur es untersuchenden zu der Parameter Priorverteilung auf der Basis als Priorverteilung eine Eine Ver¬ Angaben durchgeführt werden derartige Verknüpfung möglich, Likelihoodfunktion zur Priorverteilung beispiels¬ Eigenschaft anzugeben. können. Für normalverteilte Zufallsvariablen ist eine wenn Es ist relativ einfach, untere und obere solchen von die notwendig. konjugierte Verteilung benutzt wird. Die Beschränkung zeptabel. Damit die Vorteile der dem andere die Verteilungstypen Normalverteilung ausgenutzt nicht Grundlage sche Das lineare sen. um Das lineare ^ a + = und ß Verteilungstypen das hierfür ist das lineare Regressionsmodell wird benutzt, vorgenommen. zugehörigen Wahrscheinlichkeitspapier erlaubt es, für alle gleiche Verteilungsfunktionen als Geraden. Diese Kapitel für 3.3.3 (Seite 27) eingeführt. Es Wahrscheinlichkeitspapier Abweichungen in v-Richtung ß-Ui + 8vi lungsfunktion im Eigenschaft Regressionsmodell. eine Gerade einer Punktreihe im sind die Koeffizienten der Transformation in Verfahren anzuwenden. Die mathemati¬ wurde bereits in Regressionsmodell werden können und trotz¬ ausgeschlossen bleiben, wird eine entsprechenden Wahrscheinlichkeitspapiere erscheinen im a auf normal verteilte Zufallsvariablen ist jedoch im Bauwesen nicht ak¬ anzupas¬ lautet: (5.1) Regressionsgeraden. Diese beschreiben die Vertei¬ Wahrscheinlichkeitspapier (siehe Abbildung 5.1). Die Parameter der 52 Informationsverknüpfung Verteilungsfunktion können Stützpunkten aus enten bestimmt werden. Dies gilt der Geraden und somit auch für den umgekehrten Weg. meln für die verschiedenen Verteilungstypen können dem Anhang den Koeffizi¬ Somit ist die Vertei¬ durch die beiden Koeffizienten bestimmt. Die lungsfunktion eindeutig aus A Umrechnungsfor¬ (Seite 95) entnom¬ werden. men Unter der Voraussetzung, lungsfunktion fv(v|b, wird 2 G dass die Verteilungstypen normalverteilt sind, ist die Vertei- ) eine multivariate Normalverteilung. Die Bayes'sche Methode auf dieses Modell nun Abweichungen angewendet. auf den einfach führt. Zu beachten ist, dass die zu Damit ist die Betrachtung behandelnden Fall der Bayes'sche der verschiedenen Normalverteilung zurückge¬ Methode nicht direkt auf die Parameter der Zufallsvariablen, sondern auf die Koeffizienten der Geraden im Wahrscheinlichkeitspa¬ pier angewendet wird. Die Verknüpfung schätzverfahrens "Methode der kleinsten y = basiert somit auf dem Modell des Parameter¬ Quadrate". FxW v ß 0.700 0.500 0_1(FX) = i J 0 > 0.300 -1 0.010 a -2 0.001 0.0001 -3 f >\ Abb. 5.1: 1.61 2.30 u 1 5 10 x und a ß in einem == ln(x) Lognormalpapier Allgemeines Vorgehen 5.2 Das Definition der Koeffizienten 0 allgemeine Vorgehen bei einer Informationsverknüpfung ist in Abbildung stellt. Die einzelnen Schritte umfassen die Informationsanalyse, die Gewichtung Festlegung 5.2 darge¬ des stochastischen Modells, die der Informationen und die Verknüpfung, deren Re¬ sultat die Metainformation ist. 5.2.1 Stochastisches Modell Das stochastische Modell, d.h. der als erstes Änderung festgelegt des werden. Es gleichen Verteilungstyp. gesehen. Bei der Festlegung Informationen des der betrachteten Zufallsvariablen wird vorausgesetzt, Verteilungstyps ergibt. auf dem genden Verteilungstyp Die Auswertung dass zurückgegriffen. Die Verknüpfung keine der Informationen basieren alle Es ist kein Vermischen Verteilungstyps die muss von verschiedenen Typen vor¬ wird auf eine oder mehrere der vorlie¬ Festlegung ist wesentlich, da die Resultate 53 Informationsverknüpfung einer Informationsanalyse oft stark Verteilungstyp abhängig sind. Insbesondere vom weichen Fraktilwerte, welche mit verschiedenen Verteilungstypen formation bestimmt wurden, stark voneinander ab, selbst (Ditlevsen, 1994). Berechnung Ergebnis oder über eine Vergleichbarkeit für die Umrechnung von der einem Anpassung an des Verteilungstyp (Ditlevsen aus und physikalischen gleich In¬ sind probabilistische eine der wichtigsten Madsen, 1989). Verteilungsenden geschehen. Allenfalls den gleichen in einen andern kann über die Momente lich eine untere bzw. obere Grenze für alle Informationen Diese kann meist in eine Verteilungstyps der Resultate der die Momente Informationsanalyse Festlegung ein, ist die normative Voraussetzungen Eine Geht das wenn aus zusätz¬ muss vorgängig festgelegt werden. geometrischen Randbedingungen festgesetzt oder werden. Stochastisches Modell Verteilungsfunktion Fx(x|0) 1 Informationsanalyse Parameterbestimmung - aus objektiven Informationen via Parameterschätzverfahren - subjektiven Informationen via Stützwerte 1 Gewichtung Wahl der Referenzinformation und der Vertrauenskennzahlen 1 Verknüpfung Bestimmung der Parameter der Metaverteilung 1 Metainformation - - Abb. 5.2: 5.2.2 Allgemeines Vorgehen Momente, Fraktilwerte Grafische Darstellung bei einer Informationsverknüpfung Informationsanalyse Bei der Informationsanalyse geht funktion der Zufallsvariablen. Aus bestimmt. Für objektive es um die Festlegung jeder vorhegenden der Parameter der Verteilungs¬ Information wird ein Parameterset Informationen können die üblichen statistischen Methoden Bestimmung der Parameter benutzt werden (siehe Kapitel 3.2.2, Seite zur 19). Sind die Para- Informationsverknüpfung 54 meter einer festgelegt worden, einmal Stichprobe nicht mehr auf die Werte der Stichprobe zurückgegriffen Verteilungsfunktion ben die resultierende soll für die weiteren so Berechnungen werden. Denn diese beschrei¬ insbesondere bei kleinen Stichprobenumfän¬ gen unzureichend. Um die Parameter aus subjektiven literatur, etc.) bestimmen zwei Stützwerte nen können, genügt (Expertenschätzungen, Normen, es, die Parameter erfragen und festzulegen. zu direkt, die werden. Als Stützwerte Benutzung von sich zwei Fraktilwerten als Stützwerte kommt insbesondere für zeitab¬ in Frage. Typische Beispiele zeitabhängige für ablen sind Wind- und Schneelasten. Diese werden durch die Extremwertverteilung kann zum werden in der Beispiel währsleute quasi zeitinvariante Grössen einjährige geschätzt und aus der SIA Norm 160 Erwartungswert und Die Festlegung welche häufig Meinung ortskundiger Ge¬ herausgelesen (1989) beispielsweise entspricht der Wiederkehrperiode zwischen 30 und 50 Jahren. ein Fraktilwert Erwartungswert und Fraktilwert ist nützlich für Festigkeiten beschreiben. Angaben finden sich für via mit einer Bei Schneelasten einem Normenwerk der zweite Stützwert (Schneider, 1996). In Zufallsvari¬ Beschreibung umgewandelt. Wert auf der Basis der Kennwert der Schneelast etwa einer über Erwartungswerte in Normen. Der in den Normen Festigkeiten entspricht dabei Zufallsvariablen, und Fraktilwerte charakteristische Wert angegeben meist einer 5% Fraktile. Modal wert und 5% bzw. 95% Fraktile Hat so man nur werden grösste zu wenig Kenntnis über die Bedeutung am besten der wahrscheinlichste erwartende Wert definitionsgemäss zu Einführung Bayes'sche von geschätzt. der Modalwert einer zu von Momenten und Fraktilwerten, erwartende Wert und der kleinste bzw. Der wahrscheinlichste Verteilungsfunktion. von nicht informativen erwartende Wert ist Der kleinste bzw. Priorverteilungen, Methode kennt, wird verzichtet. Die nicht informative der Annahme aus, dass neben der objektiven Bereiche der Parameter Festlegung Für die der Verknüpfung sprochen. Die gibt. grösste interpretiert. wie sie die klassische Priorverteilung geht ja Information keine weitere Information über die Parameter einer Zufallsvariablen vorliegt und dass 5.2.3 zu erwartende Wert wird in dieser Arbeit als 5% bzw. 95% Fraktile Auf die ne eignen Kombinationen: hängige Zufallsvariablen • Momente oder zwei Fraktilwerte Die • Fach¬ Aus den Momenten oder Stützwerten kön¬ Verteilungsfunktion berechnet die Parameter der folgende • zu Informationen Diese Situation ist dem es keine Präferenz für einzel¬ Ingenieurwesen jedoch fremd. Gewichtung wird den einzelnen Informationen verschiedenes Gewicht zuge¬ Gewichtung wird über das Vertrauen in die Information bezüglich einer Referenzinformation bestimmt. Das Vertrauen wird mit einer Vertrauenskennzahl VKZ r Informationsverknüpfung ausgedrückt. 55 Die Vertrauenskennzahl benumfänge VKZ| nj/nref. = nicht einer Anzahl effektiver Tatsache zu Vertrauen in eine um Prinzip dem sondern sind Verwechslungen Hat man, Information, im Verhältnis der Stichprobenumfänge entsprechen Beobachtungen, betonen und auch PseudoStichprobenumfänge. Die entspricht verglichen zu mit der in vielen Fällen hypothetischer Art. vermeiden, Um diese nennt man sie auch Referenzinformation, geringes ist die Vertrauenskennzahl klein. Hat so Stichpro¬ man hingegen grösseres Vertrauen in die Information, ist die Vertrauenskennzahl gross. Die Referenz¬ information selber erhält die Vertrauenskennzahl Die Zuweisung ches Vorgehen nannte 1993). VKZref = einer Zahl als Vertrauenskennzahl ist recht zu verhindern, wird in Anlehnung linguistische Variable Festlegung zur Den einzelnen Termen werden stischen Variablen und die jedoch zugehörigen die an 1 zugesprochen. schwierig. Um ein zu kleinli¬ Set Theorie eine soge¬ Fuzzy der Vertrauenskennzahl benutzt (Bothe, numerische Werte zugeordnet. Die lingui¬ numerischen Werte sind in Tabelle 5.1 ersicht¬ lich. Für die beiden Grenzwerte "sehr viel grösseres Vertrauen" bzw. "sehr viel kleineres Vertrauen in die Information jeweils bezüglich der Referenzinformation" kann als Alternative direkt die Referenzinformation bzw. die zugehörige Information alleine ausge¬ wertet werden. linguistische Terme: "... in die Informa¬ bezüglich der Referenzinformation" VKZ tion sehr viel kleineres Vertrauen 0.01 viel kleineres Vertrauen 0.1 kleineres Vertrauen 0.2 wenig kleineres 0.5 gleich grosses Vertrauen 2 grösseres Vertrauen 5 grösseres Vertrauen sehr viel Tab. 5.1: 10 grösseres Vertrauen 100 Linguistische Terme in eine Frage 1 wenig grösseres Vertrauen viel Die Vertrauen zur Beschreibung des Vertrauens Information bezüglich der Referenzinformation nach dem Vertrauen in eine Information ist tigste Fragestellung bei der Vertrauenskennzahl ist wichtig, Informationsverknüpfung überhaupt. subjektiv. Es gung der Vertrauenskennzahl kann gibt keine jedoch allgemeingültigen werden. Ein solcher folgenden Typus gebildet werden: nicht gar die wich¬ Die Festlegung Kriterienkatalog kann vor der Kriterien. Die Festle¬ durch einen auf die betrachtete angepassten Kriterienkatalog unterstützt werden. Dieser sollte sammengestellt wenn einer Eigenschaft Beurteilung beispielsweise mit zu¬ Fragen 56 • Informationsverknüpfung Modell Sind die stochastischen Modelle tisch? Wenn zur Bestimmung der jeweiligen Information iden¬ nein, welche Unterschiede bestehen und wie wirken sich diese auf die Unscharfen aus? • Vergleichbarkeit Wird die zu gleiche Eigenschaft behandelt? berücksichtigen? Wurde die Sind Unterschiede Methode gleiche zum Beispiel im Baustoff der Eigenschaft Bestimmung zur verwendet? • Herkunft Sind die tät der Informationsquellen direkt Informationsgewinnung? Stichprobe oder aus vergleichbar? mehreren mit unterschiedlichen die einzelnen Informationen Pseudostichprobenumfangs eines 5.2.4 Unterschiede in der linguistischen einer Information zum Terme Anhang Beispiel aus festzulegen, B 2 einer können für werden. Der Quotient des PseudoStichprobenumfang dann der Vertrauenskennzahl. sind im zum Quali¬ Bedingungen? PseudoStichproben generiert Pseudostichprobenumfangs Hilfestellungen zur der Refe¬ Schätzung (Seite 109) gegeben. Verknüpfung Für die Seite entspricht es Stammt die Information Anstatt die Vertrauenskennzahl über die renzinformation Gibt eigentliche Verknüpfung 57). werden drei Methoden vorgeschlagen (siehe Kapitel 6, Dies sind die im Zentrum dieser Arbeit stehende thode sowie als Alternativmethoden die thode und die empirische Pseudostichproben-Methode. werden die Parameter der als Ergebnis der lineare Bayes'sche Regressionsme¬ Bayes'sche Regressionsme¬ Gemäss den Vorschriften dieser Methoden Verknüpfung stehenden Metainformation be¬ stimmt. Aus diesen können dann die Momente oder die Fraktilwerte berechnet werden. Die die grafische Darstellung Darstellung führten der der Verteilungsfunktion Verteilungsdichte Verknüpfung. im Wahrscheinlichkeitspapier bieten eine gute visuelle Kontrolle der Zu diesem Zweck werden die Verteilungsfunktionen Dichtefunktionen aller Informationen und der Metainformation sowie durchge¬ bzw. die gleichzeitig dargestellt. 6 Verknüpfungsmethoden 6.1 Die 6.1.1 Das Bayes'sche Regressionsmethode Bayes'sche lineare Modell Die im Zentrum dieser Arbeit stehende und schliesslich Bayes'sche Regressionsmethode dell stützt sich auf das (Broemeling, 1985; O'Hagan, 1994; Modell y = sogenannte Bayes'sche lineare Mo¬ Marinell et al., 1995). Das allgemeine lineare (6.1) + e Dabei ist y ein (n,l)-Vektor der Beobachtungen, zienten, b ein (p,l)-Vektor der Parameter und wird vorausgesetzt, dass die Elemente lung Anwendung vorgeschlagene hat die Form (O'Hagan, 1994) X-b zur N(0;g2) folgen. ein (n,p)-Matrix (n,l)-Vektor fY(y|b, von bekannter Koeffi¬ Zufallsfehlern. Es unkorreliert sind und einer Normalvertei¬ von e Der Parametervektor b und die Varianz Verteilungsfunktion Grössen. Die e X eine a sind die unbekannten ) ist entsprechend eine multivariate a malverteilung N(X b;a -I) mit I als (n,n)-Einheitsmatrix. Zwecks einfacherer Herleitung des linearen Modells wird die Schreibweise • O'Hagan von Sieentspricht Sieentspricht (1994)mitN(0;a2) der (1994)mitN(0;a2) Darstellung Nor¬ übernom. ni<nicht der im Die Likelihoodfunktion berechnet sich L(y|M2) Als (2 7C zur angegeben (N(0;a)). -(y-X-b)^ (y-X-b) - -" - (6.2) 2-G2 ) o wird die Priorverteilung wählt. Dies ist eine • 1.2 zu: l^72-«p = Kapitel Likelihoodfunktion Normal-Inversgammaverteilung. konjugierte Verteilungsfunktion Verteilungsdichte Die ge¬ folgen¬ weist de Form auf: W' °2) ~ 2 (O ) Die (JP Hyperparameter sind nun so zu man jeweils 2 f0(o" ) ' + eXP sind a0, d0, b0 wählen, dass die f0(b). Aus V0. Die Hyperparameter der Priorverteilung Nonnal-Inversgammaverteilung definiert ist. Integriert (6.3) folgt, Normalverteilung N(b0;c zu: (6.3) 2-a2 v und über die Parameter b bzw. bzw. sich damit 2)/2 2 a , so dass die V0) folgt. Die erhält man bedingte zugehörigen die Randpriordichtefunktionen Dichtefunktion f0(b|ö Randdichtefunktionen 2 ) einer ergeben 58 Verknüpfungsmethoden (a0/2) 2 f0(° ) 1 = • r(d0/2) ^0 ao°/2-r((d0 f0(b) = + 2)72 + (6.4) exp -u< p)/2) |v0|a5-7rp/2-r(d0/2)' (a0 (6.5) -(d0 _l T p)/2 + (b-b0)T-V0 -(b-b0)) + f0(a ) ist eine Inversgammaverteilung und f0(b) eine t-Verteilung. Die Momente f0(b) lassen sich über die Momente der bedingten Verteilung f0(bIg ) bestimmen: E[b|a2] var Die [b\c] = bQ -V, = a E[b] = E[E[b|a2]] var[b] = E[var[b|a o Sind diese = (6.6) bQ 2-, ]]+var[E[b|a -I Hyperparameter muss. von -l slq und d0 ]] dn-2 bestimmen die festgelegt worden, so muss —-*- = Vn -u Verteilung f0(G ), für die wobei Verteilung f0(b) noch d0 > 2 sein b0 und V0 bestimmt werden. Die als Multiplikation der Likelihoodfunktion Posteriorverteilung wiederum eine (6.2) mit der Priordichtefunktion (6.3) ergibt Normal-Inversgammaverteilung: 1 fi(b,G2|y) 2 (O" ) (d, + p + 2)/2 (6.7) exp 2-a mit Q Yi h ai d1 Die bzw. (b-bjf-V^^b-b^ = + (YÔ1 = = = + XT • X)"1 (Vö1 b0 + XT y) (6.8) • bo-Yô^^o ^-y-brYÎ1-^ ao + d0 + n + Randposteriorverteilungen CT aj (Yö1 xT-x)_1 = 2 + lassen sich mit einer Integration über die Parameter b - bestimmen. Die Form ist wobei die analog zu den Verteilungsfunktionen (6.4) Hyperparameter a1? d1; bt und Vx einzusetzen sind. Falls die Matrix X X regulär ist, so kann bj wie folgt geschrieben werden: und (6.6), Verknüpfungsmethoden h (Yo1+XT-X) 1-(V01-b0 XT-X-b) + = A Yö1 = ( = (X A + ?)-1 xT -1 T b 59 • X X) xT = (I-A)-b0 gewichtetes (6,9) T v Mittel dem aus und A. Wenn die Priorinformation stark teilung wird dann stark vom ist, d.h. und A klein. Der V0 entsprechend gross ist ist somit Stichprobe, bj Erwartungswertvektor der Priorverteilung b0 dem klassischen Maximum Likelihood Schätzwertvektor. Die so A-b * • b ist der klassische Maximum Likelihood Schätzwertvektor der ein Matrix + wenn Gewichtung die Elemente von ist (I VQ Erwartungswertvektor der und A) klein sind, Posteriorver¬ demjenigen der Priorverteilung bestimmt. Umgekehrt, die Priorinformation schwach - wenn ist, wird der Erwartungswertvektor der Posteriorverteilung durch den Maximum Likelihood Schätzwertvektor bestimmt. Übertragung 6.1.2 Wendet das man auf das lineare Bayes'sche Wahrscheinlichkeitspapier Vektor Regressionsmodell lineare Modell auf das lineare an, ist p = 2, b (a, ß) = beinhaltet die allenfalls transformierten u y , = v und X Stichprobenwerte u5, v = a empirischen Funktionswerte Vj und b die Koeffizienten und ß. Gleichung (6.1) schreibt sich somit zu: 1 v1 v = X•b + e o = 1 der Effektiv ist Der zugehöri¬ der Regres¬ ei -, r a vn a) Tiefe u1 (l,u). die gen transformierten sionsgeraden im Regressionsmodell (6.10) + Un en Beurteilung nur der Erwartungswertvektor b^ der Randverteilung fj(b) von Interesse. Erwartungswertvektor bj beinhaltet die Koeffizienten der Geraden im Wahrschein¬ lichkeitspapier. Die Abweichungen von der Regressionsgeraden sind ein Mass für die Der Güte der Anpassung doch nicht in Frage. und der Varianz Streuung Diese an die gewählte Verteilungsfunktion. Somit ist auch eine nicht f0(b) Hyperparameter Natürlich sind keine von f0(a ) über die der Koeffizienten und schliesslich der Parameter der Zufallsvariablen möglich. von würde schwierigen Schätzung man der sich der Eigenschaft jedoch ohnehin Hyperparameter brauch ist dies jedoch auch nicht zwar notwendig. der Aussagen Aussagen trachtung Bestimmung Die Güte des Modells steht je- notwendig. nur mit der zusätzlich 2 von Man f0(CT ) begnügt erkaufen. Im voraus. wartungswertvektor bj eingegangen. notwendigen, praktischen Ge¬ sich im Bauwesen mit der Be¬ als Zufallsvariable und setzt die unbekannte aber fixe Werte so zugehörigen Im weiteren wird deshalb Parameter als speziell auf den Er¬ 60 Verknüpfungsmethoden b) Das mathematische Modell Die Formel teilung rem Bestimmung übernommen werden. Bei einer des Erwartungswertvektors diagonalen Wichtungsmatrix artungs wert a1 ein gewichtetes Mittel und dem ßj. kann für die (6.9) aus A ist der Posterio¬ dem Maximum Likelihood Schätzwert a Priorerwartungswert cc0. Dasselbe gilt auch für den Posteriorerwartungswert tritt nur ein, wenn die Erwartungswerte der Priorverteilung und der Likelihood¬ Dies funktion übereinstimmen. Im Normalfall sind die hängig der Posteriorver¬ von beiden Elementen des ab¬ Posteriorerwartungswerte jeweils Priorerwartungswertvektors und des Maximum Likeli¬ hood Schätzwertvektors. Der Maximum Likelihood Schätzwertvektor b des linearen dem Schätzwertvektor aus der Methode der kleinsten Regressionsmodells ist mit Quadrate identisch. 1 b = n"Sui2~Œui) n'X(VVi)-ZUi'XVi (6.11) cv[uv] p=-m[u] m[v]- var[u] a cv[uv] var[u] Die übrigen das lineare X wesentlichen Terme der Formel Regressionsmodell X zu: 5>i n T (6.9) ergeben sich bei der Anwendung auf = (6.12) X T -y = 5>i-Vi) Als Priordichtefunktion ergibt sich be mit der aus Umfang anzmatrix Sie kann V0 nun durch die f0(b|CT 2 Verknüpfung nn unter der hat somit die wird die einer Normalverteilung N(b0;VQ) gewählt. Diese diffusen Priorverteilung mit einer Pseudostichpro- Voraussetzung, gleiche ohne weiteres mit Lage ) der Geraden im dass 2 CT bekannt ist (Plate, 1992). Die Vari- Form wie die Varianzmatrix der Schätzungen versehen Stichprobe X T • werden, beziehungsweise, sie ist Wahrscheinlichkeitspapier definiert. -| Yö' no n0-m0 = n0-m0 n0 (var0 + m2,) X. (6.13) 61 Verknüpfungsmethoden Die Wichtungsmatrix ergibt sich A Berücksichtigung von (6.11), (6.12) und (6.13) unter zu: A 5 = K — all a12 a21 a22 (6.14) mit K = n au = n0 a12 = n0 a21 = a22 = • (m[u] n0 • m0 • (m0 - - m0) m[u]) (m[u] (m0 • (n + n0 var0) + + • n0) (n var[u] • m0 - ((m[u]) • n0 • var0) var[u] + n var0 + • (6.15) var[u])) + n0-(m[u]-m0) no ' mtu] (m[u] ' Daraus berechnet sich der meinen Fall -1 + m0) - + (n + n0) var[u] Erwartungswertvektor der Posteriorverteilung für den allge¬ zu: K a12-(ß-ß0) air(a-a0) + a0 a21-(a-a0) + a22-(ß-ß0) + + ßo (6.16) 1 K mit p = n • n0 m0) (a0 m[u] ß-m[u] -m0))) ((m[u] • -(a-m0 + q = + (n var[u] + (ßo n + Der ten • • n0 (n - • + ß) ' + n • ((m[u] • - n0 var0) (a0 • (mo var[u] no - m0) (â • • • ~ mtu] • n0 - m0 m[u] • (6.17) n) + a ß m[u] + • • var0) (a0 + ß0 m0))) (6.18) • ß0 var0) • Stichprobe abhängig. c) Vereinfachungen gegenüber Bayes'sche der klassischen det. Die Verknüpfung de der kleinsten Bayes'schen Methode Methode wird hier nicht auf die Parameter der auf die Koeffizienten der Geraden im in n0 ß0 Erwartungswertvektor der Posteriorverteilung b1 ist nur von den beiden Koeffizien¬ der Regressionsgeraden, dem Stichprobenumfang, dem Mittelwert und der Varianz der Priorinformation und der Die + n0) (n ß var[u] • + • Zufallsvariablen, sondern zugehörigen Wahrscheinlichkeitspapier angewen¬ stützt sich auf das Modell des Parameterschätzverfahrens "Metho¬ Quadrate". Da nicht v-Richtung die abhängige ist eindeutig entschieden ist, ob die Variable in (siehe auch Kapitel 3.3.3, Seite 27), wird das u- oder Bayes'sche Verknüpfungsmethoden 62 einmal mit den Updating gen in Abszissenrichtung durchgeführt. beiden Resultaten samtheit einerseits mit der und einmal mit Vörgehensweise Stichproben nach klassischer Statistik wichen nur in aus den ist auch durch Simu¬ gleichen Grundge¬ der andererseits zu¬ Die Resultate der analysiert. wenigen demjeni¬ Mittel geometrische Bayes'schen Regressionsmethode verknüpft, Verknüpfungsmethoden unterschiedlichen dieser worden. Dabei wurden gemeinsam und Ordinatenrichtung Danach wird das Richtigkeit Die gebildet. lationsrechnungen bestätigt sammengelegt in Abweichungen Prozenten voneinan¬ der ab. Kapitel Wie in • (Seite 27) 3.3.3 bereits erwähnt, sind die Voraussetzungen die Abszissenwerte u4 sind fest, Abweichungen • die • die Varianz der für das lineare te im der angepassten Geraden sind von Regressionsmodell schlagene Für die bei der ist in diesem Sinne als lineare Modell auf den Modell auch eine Quadrate im betrachten. Da das zu gleichen Voraussetzungen beruht, Bayes'schen Theorie muss Wahrscheinlichkeitspapier von dieser ist das hier vorge¬ man die Likelihoodfunktion der Zufalls¬ Regel abgewichen, da die Arbeit mit dem auf dem linearen Modell basiert, und da sich somit Formeln herleiten lassen. So ist auch die schen Näherung Quadra¬ Näherung. variablen X verwenden. Hier wird sene der Methode der kleinsten wird die Likelihoodfunktion des linearen Modells verwendet. Ge¬ Verknüpfung mäss der klassischen nur Benutzung nicht erfüllt. Die Methode der kleinsten Wahrscheinlichkeitspapier Bayes'sche voneinander und ist konstant, Abweichungen Wahrscheinlichkeitspapier unabhängig Verknüpfung nur eine Näherung geschlos¬ zur klassi¬ Bayes'schen Methode. Der Unterschied der Likelihoodfunktion des linearen Modells zur klassischen Likeli¬ hoodfunktion der Zufallsvariablen X wird für den Fall einer normalverteilten Zufallsva¬ riablen kurz diskutiert. Unter der = G "ß; entspricht Umformungen (6.19) = ß die Likelihoodfunktion L(a, ß) der 1 a * Berücksichtigung L(a, ß) der Zufalls variablen X(*i-*o 1 = (2 n/2 2N •k- a ßn n/2 ) exp 2-fJ (6.20) exp -;-2>+ß-*i)2 exp n-log(ß)-^--^x12-^-a2-a-ß-^xi 1 n/9 2^ V (2 K) (2-7C) X i J Verknüpfungsmethoden 63 Die Likelihoodfunktion des linearen Modells schreibt sich unter der die Varianz der Abweichungen bekannt ist, ^LinMod(a' ß) • n/2 dass zu: SMnTÏ Htt - Voraussetzung, + ß-W exp (2-TT) _1 exp n/2 (2-TT) • -I^-'UïM % y xï.n,+a- y o exp -\ • i exp V lf a (6.21) i —^—- i ß-S^fnTTj-^n)-«^-!^) i Dabei ist 0 = Vn+1 *-* i und = (6.22) 1 x(1.n), X/2.n), ••-, unterscheidet sich x(nn) nur in der Reihenfolge von xv x2, Der Unterschied zwischen den beiden Likelihoodfunktionen lässt sich somit als ..., xn. Quotient darstellen: / L(ct, ß) ^LinMod 6.1.3 (a,ß) man die Kapitel 5.2, nen i -M exp V (6.23) i Anwendung Benutzt he = Bayes'sche Regressionsmethode Seite 52), Informationen die stimmt (siehe so werden nach zugehörigen Anhang A, Seite für die Informationsverknüpfung (sie¬ erfolgter Parameterbestimmung Koeffizienten im 95). Zusätzlich müssen aus den einzel¬ Wahrscheinlichkeitspapier be¬ für jede Information die ersten beiden Momente der Abszissen- und der Ordinatenwerte berechnet werden. Die Momente der Ordinatenwerte können aus theoretischen diejenigen der Abszissenwerte in den meisten Fällen den Tabelle (siehe mente 6.1). mit einer Simulation bestimmt werden, da die arithmisch ist, die Werte hen. Zur Bestimmung aus Nur bei der Weibull- und der jedoch Fréchetverteilung müssen Skalierung ohne Transformation in die der Momente sollte eine Überlegungen hergeleitet, den Parametern bestimmt Stichprobe wer¬ die Mo¬ der Abszissenachse log¬ Verteilungsfunktion einge¬ von 1000 Werten generiert werden, damit eine gewisse Stabilität der Resultate erzielt werden kann. Die generierten Werte werden gemäss der Transformationsregel der Abszissenachse umgewandelt, d.h. 64 Verknüpfungsmethoden logarithmiert. Aus den logarithmierten Werten werden der Mittelwert und die Varianz berechnet. Verteilungstyp Abszisse Ordinate mAbs varAbs mOrd vaTOrd m[u] var[u] 0 1 X ? 0 1 m[u] var[u] C k Weibull für Minima * * -C k Fréchet für Maxima * * C k m[u] var[u] 1 1 Normal Lognormal Gumbel für Maxima Exponential C k 0.57721665 = (Eulersche Konstante) (n/Jôf = Die mit * bezeichneten Werte müssen mittels Simulation bestimmt wer¬ den. Momente der Abszissen- und Ordinatenwerte Tab. 6.1: für die verschiedenen Vertei¬ lungstypen Mit den Formeln die (6.16), (6.17) Abweichungen in beiden und (6.18) Richtungen renzpseudostichprobe beispielsweise zu wird nun der berechnet. Dabei wird der 100 gesetzt. Der geometrische Mittel der beiden der Refe¬ Umfang PseudoStichprobenumfang weiteren Informationen wird über die Vertrauenskennzahl bestimmt Anschliessend wird das für Erwartungswertvektor bMeta (n^ = 100 • der VKZj ). Ergebnisse gebildet. Aus diesem werden schliesslich die Parameter der Metainformation bestimmt. Sind mehr als zwei Informationen vorhanden, wird die Methode Man bestimmt man aus zwei Informationen die zugehörige Metainformation. Dann diese mit der dritten Information. Die sich daraus knüpft man mit der vierten Information usw. Die sequentiell angewendet. verknüpft ergebende Metainformation Verknüpfungsreihenfolge spielt keine Rolle. Die Vertrauenskennzahl der Metainformation der Zwischenstufen sich aus der Addition der Vertrauenskennzahlen der ihr zugrundeliegenden ver¬ dabei ergibt Informatio¬ nen. VKZStufel = VKZ, VKZStufe2 = VKZStufel etc. + VKZ2 + VKZ3 (6.24) Verknüpfungsmethoden 65 6.2 Alternativmethoden 6.2.1 Die empirische empirische Die Bayes'sche Regressionsmethode Bayes'sche Regressionsmethode lineare stützt sich einerseits auf das li¬ Schätzverfahren. Der Posteriormittelwert wird bei dieser Methode Bayes'sche neare lineare durch eine lineare Funktion der Likelihoodschätzer approximiert. empirische Bayes'sche Schätzung Methode herangezogen. Die der Momente der wird hier mit den klassischen Methoden der Statistik parameter Andererseits wird die durchgeführt. Hyper¬ Man be¬ nutzt dazu die vorhandenen Daten. Die des Posteriormittelwerts durch eine lineare Funktion hat den Vorteil, Approximation dass nur die Momente der vollständige Spezifikation Diese notwendig. den der Ausführungen Verteilungsfunktion Die nachstehende von Künsch a) Das mathematische Modell Im allgemeinen Fall liegt folgende mit den Werten Stichproben • J • Mit der Methode der kleinsten den im mit • (Tij, Xj, uVy Ujj, ..., un ..., unjj) sind für j teilungsfunktion • folgende sind einer Hyperparameter Approximation werden. Die ist somit nicht der klassischen des mathematischen Modells nj vor: als Stichprobenumfang und 1 < i < m Quadrate geschätzte Koeffizienten (r\., x.) der Gera¬ Wahrscheinlichkeitspapier. Es werden zusätzlich der Beschreibung Situation Ujj Verknüpfung benötigt (1997). Es werden hier die horizontalen benutzt, damit sich einfachere Formeln • für die Vorgehens weise entspricht Bayes'schen Methode. folgt Hyperparameter Annahmen unabhängig Abweichungen ergeben. getroffen: für alle j = 1,..., J gegebene (rj., x.) unabhängig voneinander und folgen der Ver- F0((u-t\j)/Tj) (T|j, Tj) folgt der Verteilungsfunktion G0 Unter diesen u(i)j = ^j Voraussetzungen gilt: + V Po^ Vu(i)P> = 'Hj + XJ • Fo1(FU(u(i)j)) = "Hj + (6-25) Tj v(i)j • wobei U(j)j der Grösse nach geordnete Werte u^ sind und Fu(u/i)j) die empirische Vertei¬ lungsfunktion darstellt. Die empirische Verteilungsfunktion kann gemäss den Angaben in Kapitel 3.1.3 (Seite 17) bestimmt werden. F0 onsfunktion und ist bekannt. Bei einem Schätzungen von entspricht der Ordinatentransformati- Normalpapier beispielsweise (TL, Tj) nach der Methode der kleinsten ist Fq = O Quadrate ergeben sich . zu: Die Verknüpfungsmethoden 66 2(u(i)j-m[u.])-(v(i)j-m[v.]) i XJ = i = X^Wj-mtVj]) i fjj Es = = m[u.]-Tj l -m[v.] gilt nun, (Th, T:) sollen. Die (6.26) 2 schätzen, wobei alle anderen Stichproben miteinbezogen werden zu empirische lineare Bayes'sche Regressionsmethode geht Posteriormittelwert der Koeffizienten (Th werte (ti., t.) nach t, der Methode der kleinste t) Tj davon aus, dass der eine lineare Funktion der Schätz¬ Quadrate ist: ~ - *. 'Hj, post xi, post _ = A- A lXi\ _ Aj mit = . h +h aj,ll aj,12 aJ. aj, 21 (6.27) 22_ V = A 2. A- und b: werden (^j, post *lj • —j 'Hj) nun so + E bestimmt, dass A2 T, J, post _ minimal wird. Um einfachere Terme zungen angegeben werden können, (6.28) | zu erhalten, für die auch später zuverlässige Schät¬ wird der zweite Teil in der Formel (6.28) vereinfacht: (Tlj,PoSt-rlj)2] E[(Tjjpost-Tjy (6.29) + Die Minimierung den beiden _ des Ausdruckes (6.29) Gleichungssysteme ergibt unter Verwendung von (6.27) für die Koeffizienten E[r,;] E[TijTj] E[r,j] aj, E[T]jTj] ~2, E[Tj ] E[Tj] aj,12 E[T^j] E[Tj] 1 .V. Ehf] E[T^jTj] E[rlj] aj,21 E^jTj] E[Tp E[Tj] aj,22 EtTÎj] E[Tj] 1 bi A- und folgen¬ bj". EhjTij] 11 7 von die = E[TjTlj] . E[V E^jTj] zr E[TjTj] E[Tj] (6.30) Verknüpfungsmethoden Aufgelöst h nach den Koeffizienten "E[T,j]~ = 67 _E[Tj]_ _E[Tj]_ (6.31) = CV[TljTlj] CVtTjTJj] CVtTJjTj] CV[TjTj] Basierend auf den Formeln über die kombinationen asymptotische Stigler (Serfling, 1980) von rungsweise angegeben werden (Herleitung 2 (r^Tpl^Tj) N = entspricht gn = §12 = var g22 = Verteilung siehe C 1, Seite Rangstatistik¬ der Koeffizienten nähe¬ 115): (6.32) J G der Kovarianzmatrix mit den var[Vj] §21 (rij,Tj),^-G J kann die Normalität linearer A^ T; V Dabei sich: E[t1j] ~V var[fij] CV[TijTj] cvrtjXj] var[Tj] àr ergibt folgenden (E[Vj])2 varRVj -E[Vj])2l E[Vj] Elementen: • eRVj -E[Vj])3' + 4-(var[Vj])2 vartVj] (Vj-E[Vj])3] E[Vj]-var[(Vj-E[Vj])2] 2 var[Vj] 4 (6.33) (var[Vjj)^ (Vj-E[Vj]r = 4-(var[Vj]r wobei (6.34) ist. Somit F0 ab, var hängen die Elemente der Kovarianzmatrix noch die jedoch bekannt ist. Mit der (Vj-E[Vj])2] = E ergeben sich die einzelnen wie folgt: von der Verteilungsfunktion Umwandlung '(Vj-E[Vj])4l-(var[Vj])2 Terme der Elemente für die verschiedenen (6.35) Verteilungstypen 68 Verknüpfungsmethoden i a "S o Ö ÖJQ O o a i-H 13 >-< *ë3 'S ci • "öS r—< a H-l Ü ig a +-» (U .d o Ö d o x W E[Vj] 0 0 c -c c 1 var[Vj] 1 1 k k k 1 E "(Vj-E[Vj])3~ 0 0 r -r r 2 E (Vj-E[Vj])4 3 3 s s s 9 2 2 t t t 8 var "(Vj-E[Vj])2" C = k = 0.5772665 r = :L4042 (k/S)2 s = 1L4.611 t = ]LI.905 2 Tai. 6.2: Terme der Kovarianzmatrixelemente für die verschiedenen Verte ilungstypen Die Kovarianzmatrizen G der verschiedenen ÇN Çgl = = Çln <fFL 1 0 0 0.5 Verteilungstypen berechnen sich somit zu: = 1.168 0.0959 0.0959 1.100 = (6.36) Çfws GEx 1.168 -0.0989 -0.0959 1.100 1 -1 -1 2 = Unter der Annahme, dass die Koeffizientenschätzungen der Normalverteilung (6.32) fol¬ gen, können die Momente und die bedingte Momente umgewandelt Erwartungswerte werden. der Mischprodukte von (6.31) in un¬ Verknüpfungsmethoden E[Tlj] E[T]j] = E[Tj] 69 E[Tj] = E[T2] var[rij] —£- = var[T\j] + gn E[t2] var[T:] *- = J + var[T1] J g22 ni (6.37) E[T2] CV[TljTj] —J- = cvtTljTij] var[rij] = cv[TjTj] var[T:] = CV[TljTj] Cv[TjT|j] = Die Elemente V gu + Etr2] gl2 Wenn die + cv[TijTj] cvCtijTj] var[Tj] Verteilungsfunktion Gq L = werden VOn so L = g12 den Momenten der Koeffizienten + cvhjTj] (6.38) -^-•g22 + var[Tj] der Vorinformation und somit die Momente der Koef¬ könnte der lineare Bayes'sche Schätzer berechnet werden. unbekannt ist, müssen die Momente der Koeffizienten mit den (fL Tj) geschätzt werden. empiri¬ Die Elemente der Kovari¬ (T)j, Tj) var[T]j] cvtrijTj] *11 ^12 cvtrijTj] var[Tj] ^21 *22 geschätzt A von zu: E[xf] CV[T|jTj] schen Momenten der Koeffizienten anzmatrix (6.31) E[t2] —^- var[rij] var[Tij] G0 jedoch mehr nun nur E[Tj]J fizienten bekannt wären, Da sind E[Tlj] V E[Tj] n bj Somit schreibt sich Etîlj] E[t|] CV[TljTj] = A, und von (T|:, Tj) abhängig. h Cv[TljTj] + g12 j (6.39) durch A hi li2 A A 121 122 (6.40) 70 Verknüpfungsmethoden wobei var[T]-m[T ] g22 • - V • a -i = l î I22 : ^ j = A vâr[T|] - I21 gir aO cv[tit] = J (m[T2] + î22) AAA = l i = A I12 J j = I In - H: j ~ ini = 1 ä (m[T ] +122) - Y t J gi2 • T 7 J .^. j m[T|] mit = = 2^(Tij-m[Ti]) —• XTJ jj vâr[T] l = J 1 = ^(Tj-m[T]) — j cv[t|t] — Herleitung werte = kann dem E[Tj] Für die = m[Ti] = m[T] . i A A JïïrrivXv^ (J-l) der Koeffizienten E[tl] = 1 -i2, Die i ^(^j-mtriD^Tj-mtT]) • j m[T] = J 1 = l = J 1 = J i j m[T] n; ^fjj jj var[r|] 1 J 1 = = 1 ~ Anhang ergeben C 2 (Seite sich 119) entnommen werden. Die Erwartungs¬ zu: (6.42) . Bestimmung von bj in (6.31) wird anstelle des tes Mittel der einzelnen Koeffizienten verwendet. Die Verhältnis der Varianzen. Erwartungswertes ein Gewichtung entspricht gewichte¬ dabei dem Verknüpfungsmethoden ?(*" m[r|] + Cm[T2] +122)J " Tlj = X(în m[T] + + ~ (* (Ätf2] • 1 2^22 + l22)J % g22 • • A (mtT ] *22> définit sein. Bei nicht positiv muss + A A > 0 und > u aDer > E nicht "~* positiv définit A Fall 2: în < man 0 und/oder die Kovarianzen = zu Null A (112 I21 = = 0). î22 < 0 Hier wird angenommen, dass alle Tj definiter Kovarianz¬ A I22 In diesem Fall setzt • positiv folgt vorzugehen: matrix ist wie lu + -"•9 ~ Die Kovarianzmatrix L Fall 1: g22 • J J = --gii-(tti[T2] î22) + (6.43) jfl22 • gl1 ' ÎT 71 Th und/oder Tj gleich sind. Somit ist r\- = T)0 bzw. T0. Mit der Kovarianz L können nun via (6.38) die Elemente den. Daraus lässt sich der Posteriormittelwert mittels von A. und Gleichung (6.27) bj bestimmt wer¬ bestimmen. b) Anwendung Wendet man die onsverknüpfung stimmung empirische lineare Bayes'sche Regressionsmethode (siehe Kapitel 5.2, Seite 52), an den einzelnen Informationen die aus für horizontale werden nach so zugehörigen auf die Informati¬ erfolgter Parameterbe¬ Koeffizienten der Geraden im Wahrscheinlichkeitspapier bestimmt (siehe Anhang A, Für die einzelnen Informationen werden, falls notwendig, PseudoStichprobenumfänge Seite Abweichungen 95). bestimmt (siehe B 2, Seite 109). Als nächstes ist die den Formeln (6.41) zu können die Elemente Wenn der stische Kovarianzmatrix L mit berechnen. Mit der Kovarianzmatrix L und den Formeln von A. und bj bestimmt werden. Mit wird der Posteriormittelwert der Koeffizienten und lungsfunktion empirische aus Gleichung (6.27) (6.38) schliesslich diesen die Parameter der Vertei¬ bestimmt. PseudoStichprobenumfang Analyse genügend der Referenzinformation für eine zuverlässige gross ist, haben die weiteren Informationen Einfluss mehr auf die Metainformation. Die Grösse der weiteren Informationen haben hierbei nur praktisch stati¬ keinen PseudoStichprobenumfänge der einen kleinen Einfluss auf die resultierenden Parameter. Der Einfluss der weiteren Informationen ist am grössten, wenn die Kovari- A anzmatrix L nicht entspricht positiv définit ist und somit gleich Null gesetzt wird. In diesem Fall der Mittelwert der Koeffizienten der Metainformation tischen Mittel aus ungefähr dem arithme¬ den Koeffizienten aller Informationen. Dieser Fall tritt auf, wenn die 72 Verknüpfungsmethoden Referenzinformation und die weiteren Informationen sehr ähnlich sind, d.h. wenig von¬ einander abweichen. Eine könnte theoretisch auch über die Vertrauenskennzahlen Gewichtung werden. Davon ist fung stark der von jedoch aus zwei Gründen abzusehen: Einerseits zugeordneten Grösse des formation ab. Andererseits kann es ein viel wurde. Dies tritt dann ein, gelegt Referenzinformation nur geringeres Verknüp¬ der Referenzin¬ vorkommen, dass die Metainformation der Referenzinformation abweicht, obwohl von hängt Pseudostichprobenumfangs eingebracht die wenig nur Vertrauen in die die Referenzinformation wenn und die anderen Informationen stark voneinander abweichen. Bei der empirischen nicht Verknüpfung linearen Bayes'schen Regressionsmethode hauptsächlich Vertrauensfrage abhängig. von der Zuweisung Gründen sollte für die Referenzinformation man Es das und somit von der Verknüpfung massgeblich. Aus diesen diejenige Information gewählt werden, in die Vertrauen hat. zwei Informationen über eine liegen und eine grösste Gewichtung Auch die Wahl der Referenzinformation und ihr PseudoStich¬ beeinflussen das Resultat der probenumfang der ist somit das Resultat der Standardabweichung 3. Als von Eigenschaft vor. Die Information 1 weist einen Mittelwert 5 auf, die Information 2 einen Mittelwert von 30 34 und eine Standardab¬ wird die LognormalVerteilung gewählt. Die beiden PseudoStichpro¬ Verknüpfung unter Verwendung der Information 1 als Referenzin¬ benumfänge formation ergibt für die Metainformation einen Mittelwert von 30.6 und eine Standardabweichung von 4.48. Wenn die Information 2 als Referenzinformation gesetzt wird, so ergibt sich für die Metainformation einen Mittelwert von 33.3 und eine Standardabweichung von 3.60. weichung von werden Für die Verteilungstyp von zu 5 gesetzt. Eine Interpretation Situation zu der Resultate ist orientieren, Stichprobe entspricht stammt, wird ihr a wo eine es hilfreich, sich Stichprobe dabei der Referenzinformation. Da sie priori mehr vertraut und erhält gross ist. Weichen die Vorinformation und die men der sie nicht von Stichprobe wird die umso Anwendung nicht wenn zu der empfehlen, keine der stärker gewichtet. geringer je der ist. Die gegeben betrachteten Objekt mehr Gewicht bei einer Stichprobenumfang stark voneinander Unter der Bayes'schen Voraussetzung, diejenige ab, relativ so stam¬ dass die Güte der Vorinformation, Der Einfluss der Vorinformation auf die Metain¬ linearen Abweichungen sind. Bayes'schen Regressionsmethode erhebliche Zweifel vorliegenden wenn bewerten ist als stärker die empirischen wenn zu vom entsprechend Stichprobe gleichen Grundgesamtheit. in diesem Fall höher Stichprobe formation wird Die der der klassischen und eine Vorinformation Dies trifft insbesondere dann zu, Verknüpfung. an an der Güte der Informationen direkt vom ist dann Stichprobe bestehen, betrachteten Objekt oder stammen. Verknüpfungsmethoden Die 6.2.2 73 Pseudostichproben-Methode a) Grundgedanke Pseudostichproben-Methode Die Alle verfügbaren Informationen werden in Stammen die Informationen proben zusammenlegen. kann analysiert nun samtheiten, so aus der folgenden Grundgedanken: Stichproben mit Die daraus entstandene Metastichprobe werden. Stammen die Informationen nun trotzdem Umfang nj umgewandelt. gleichen Grundgesamtheit, müssen sie nach der klassischen Statistik werden Stichproben basiert auf dem aus so kann mit Umfang getrennt analysiert nun die Stich¬ n verschiedenen Sie werden aber zusammengelegt. man = Yiij Grundge¬ werden. Die Beach¬ unter tung der anstehenden Fragestellung mit einer Gewichtung versehen. Die Gewichtung dem der einzelnen Information entspricht entgegengebrachten Vertrauen. b) Anwendung Wendet alle festlegung Vorgehen Der zu genügend ser vorliegenden der einzelnen einer Stichprobe entspricht werden nach dem Produkt erfolgter Parameter¬ PseudoStichproben umgewandelt. Anhang B 3 Das (Seite 112) dargestellt. wird durch die Vertrauenskennzahl festge¬ der Information mit der kleinsten Vertrauenskenn¬ Grössenordnung genügt in wiederzugeben. nun so wird im PseudoStichproben 100 gesetzt. Diese genau an, Informationen in PseudoStichprobenumfang Der zahl wird tion Pseudostichproben-Methode Generierung zur Umfang legt. die man der Regel, Der PseudoStichprobenumfang aus 100 und dem um eine Verteilung einer weiteren Informa¬ Quotient der Vertrauenskennzahl die¬ Information mit der kleinsten Vertrauenskennzahl. Um keine zusätzlichen Werte ge¬ nerieren zu müssen, werden die Werte der vorhandenen PseudoStichprobe entsprechend k-mal benützt. Drei Informationen mit den Vertrauenskennzahlen VKZj - 0.2, VKZ2 = 5 und VKZref miteinander verknüpft. Die Information 1 wird in eine PseudoStichprobe mit Umfang Der PseudoStichprobenumfang der Information 2 ergibt sich nach obiger Regel zu n2 = Derjenige 100 • VKZ2/VKZj = Stichproben = 1 werden umgewandelt. 2500 der Referenzinformation berechnet sich Die einzelnen 100 werden nun zu 500. zusammengelegt und bilden die Metastichprobe. Aus dieser werden die Parameter bestimmt. Für diesen Zweck stehen dabei die üblichen Methoden der Parameterschätzung zur Verfügung. 74 7 Vergleich 7.1 Vergleichsrechnung Zur Illustration der und Schlussfolgerungen Anwendung der drei Verknüpfungsmethoden dient folgendes Bei¬ wird Null spiel: Die Lognormalverteilung wird als Verteilungstyp gewählt. gesetzt. Es liegen zwei Informationen und eine Standardabweichung und eine Standardabweichung 1 von von vor. Der Parameter e Die Information 1 hat einen Mittelwert 5. Die Information 2 weist einen Mittelwert zu von 30 von 34 3 auf. Als Referenzinformation wird die Information gewählt. In Abbildung methode 7.1 sind die Resultate der dargestellt, in Abhängigkeit kennzahl. Der Einfluss der wie die formation, welcher man mit der der der Information 2 Gewichtung Standardabweichung Verknüpfung wird anschaulich Bayes'schen Regressions¬ zugewiesenen Der Mittelwert aufgezeigt. der Metainformation nähern sich den Werten das grössere Vertrauen so¬ derjenigen In¬ entgegenbringt. m sd Jo 0 34 Vertrauens¬ 5 . i > ^- > - 32 4 < - > < 30 3 on 9 10"3 10"2 10"1 10° 101 102 103 10"3 10"2 VKZ Information 1 Abb. 7.1: — 10"1 10° 101 102 103 VKZ Information 2 — Grafische Darstellung der Resultate der Informationsverknüpfung unter Benutzung der Bayes 'sehen Regressionsmethode Die Resultate der mit der Verknüpfung mit der Pseudostichproben-Methode derum ist die enskennzahl Verknüpfung dargestellt. in Bayes'schen Regressionsmethode und diejenige können der Tabelle 7.1 entnommen werden. Wie¬ Abhängigkeit der der Information 2 Die Resultate unterscheiden sich Weiter finden sich in der Tabelle 7.1 die Resultate der Bayes'schen Fall der Methode unter Lognormal- bzw. Berücksichtigung Normalverteilung von sind nur in zugewiesenen wenigen Verknüpfung Vertrau¬ Prozenten. mit der klassischen konjugierten Verteilungen. geschlossene Lösungen Für den vorhanden Vergleich und Schlussfolgerungen 76 (Plate, 1993; Bernardo und Smith, 1994). Die Abweichungen der Resultate im Vergleich mit den anderen beiden Methoden sind VKZ gering. Pseudostichproben- Bayes'sche Regressionsmethode Methode sd m Klassische Bayes'sche sd m Methode sd m 0.01 30.0 5.01 30.1 5.02 30.0 5.00 0.1 30.4 5.03 30.3 5.04 30.4 5.08 0.2 30.7 5.04 30.6 5.06 30.7 5.08 0.5 31.3 4.98 31.3 5.03 31.3 5.00 1 32.0 4.79 32.0 4.86 32.0 4.81 2 32.7 4.45 32.7 4.45 32.7 4.46 5 33.3 3.90 33.3 3.80 33.3 3.90 10 33.6 3.55 33.6 3.39 33.6 3.54 100 34.0 3.07 33.9 3.12 34.0 3.05 Tab. 7.1: Resultate der Vergleichsrechnung In Tabelle 7.2 sind die Resultate der es'schen Regressionsmethode fängen dargestellt. Verknüpfung mit der für verschiedene Verhältnisse empirischen von linearen Bay¬ Pseudostichprobenum- Da die beiden Informationen sehr unterschiedlich sind, ist der Ein¬ fluss der Information 2 klein. Insbesondere hat die Information 1 bei einem grossen PseudoStichprobenumfang der Referenzinformation praktisch keinen Einfluss auf das Resultat. n2 »1 sd m 500 5 30.0 4.99 50 5 30.1 4.92 25 5 30.1 4.84 10 5 30.3 4.66 5 5 30.6 4.48 5 10 30.5 4.61 5 25 30.4 4.68 5 50 30.4 4.70 5 500 30.4 4.72 Tab. 7.2: Resultate der schen linearen thode Verknüpfung mit der empiri¬ Bayes'schen Regressionsme¬ 77 Vergleich und Schlussfolgerungen Schlussfolgerungen 7.2 In dieser Arbeit werden ein methodisches Vorgehen und drei wird ein Grundwissen in Statistik oder tionsverknüpfung vorgestellt. Vorausgesetzt Wahrscheinlichkeitsrechnung. fallsvariable ist und wie man Der Benutzer Methoden für eine Informa¬ muss zum der Unscharfe der Information wird Einbezug zwungen, sich über die Grenzen und die Die zu von der Informationen ist ein weitergeben. dige ermöglicht, indem die betrachtete Realisationen der möglichen Eigenschaft Teils wird die Momente schwieriger Ge¬ Teilschritt. Insbesondere die Aus¬ Information kann Mühe bereiten. Dies ist dadurch subjektiver die Fachliteratur oder Normenwerke zwar einbezo¬ machen. Auswertung wertung Verknüpfung als Zufallsvariable beschrieben wird. Der Benutzer wird somit dazu ge¬ Eigenschaft danken eine Zu¬ diese beschreibt. Die Unscharfe und die Güte einer Information werden mit in die gen. Der was Beispiel verstehen, nur unvollständige Angaben aber der verwendete festgelegten Werte Verteilungstyp wäre für eine umfassende Beurteilung einer Beschreibung der Gewichtszuteilung, Wichtungsfaktor. vorgeschlagene Benutzung Gewichtung verhindert einerseits ein andererseits erübrigt teils werden nicht. Eine vollstän¬ sich die Falls erwünscht, kann die aufzeigt. Eigenschaft Die Güte der einzelnen Informationen kann mittels einer werden. Die in dieser Arbeit Eigenschaften (charakteristische Werte, Rechenwerte, etc.) ist anzustreben, die eben auch die vorhandenen Unscharfen Grundlage über angegeben, ein Fraktilwert oder der Mittelwert angegeben, Dokumentation der nur bedingt, dass Vorteil. von Gewichtung berücksichtigt von zu Eine solche solide linguistischen kleinliches Vorgehen schwierige Zuteilung Gewichtung Tennen auch über die zur bei der einer Zahl als Zuweisung von Beurteilung der PseudoStichprobenumfängen eingebracht werden. Die Gewichtung Herkunft und Resultat der einzelnen Informationen soll auf einer seriösen Qualität abhängig gemacht angebracht sein, aus der Informationen beruhen. Sie darf nicht werden. Für eine die Resultate der von Sensitivitätsanalyse Berechnungen einem kann es gewünschten jedoch durch¬ mit allen Vertrauenskennzahlen zu vergleichen. Die drei Verknüpfungsmethoden Regressionsmethode und die Bayes'sche Regressionsmethode ist gemeinsam, dass die bei der wendige Bestimmung dieser Alternativmethoden und die Pseudostichproben-Methode. nur Allen Methoden der Parameter entfällt. Die schwierig Erleichterung Bayes'sche Regressionsmethode Anwendung empfohlen. lineare Benutzung der klassischen Bayes'schen Methode ist oft ist eine bedeutende die Bayes'sche empirische beiden Verteilungsfunktionen Verteilungsfunktionen Festlegung Die der sind die im Zentrum dieser Arbeit stehende durchzuführen. Die not¬ Festlegung Umgehung dieser für den Anwender. wird für die Durchführung Zum einen enthält sie effiziente einer Algorithmen, die Resultate auch ohne vertieftes Verständnis nachvollziehbar. Verknüpfung zum zur anderen sind Vergleich und Schlussfolgerungen 78 Die der Anwendung Bayes'sche Wahrscheinlichkeitspapier das und die "Methode der kleinsten rens Methode auf die Parameter der Geraden im Quadrate" gleiche Berechnungsverfahren zung von Benutzung Wahrscheinlichkeitspapieren des Modells des Parameterschätzverfah¬ für die auf alle hat Verteilungstypen werden können, für die ein Für die im Bauwesen am meter. Als Eingabegrössen verwendeten sind somit Verteilungstypen Betrachtung Da nicht die ganze Information über die Parameter einbezogen Die der der (d.h. der klassischen empirische lineare typen wie bei der nur teilungsfunktion unter Einbezug der empirische die Momente der lineare aller Informationen gegenüber Die Resultate müssen auf dem vorliegender Stichprobe der durchgeführt. Im auf verschiedene Vergleich zur Hintergrund der muss von Vergleich Bay¬ eine benützt werden. Die Form der Ver¬ Für die der Momente werden Verknüpfung wird die Refe¬ Gewichtung der Benutzung der klassischen interpretiert der Bayes'schen Situation mit werden. Falls diese empirischen linearen Interpreta¬ Bayes'schen Re¬ werden. zu das Vorgehen den beiden anderen notwendigen Generierung Pseudostichproben-Methode Verteilungs¬ klassischen den anderen Informationen. Pseudostichproben-Methode zeigt bleme. eine Nä¬ Quadrate". Es gelten somit notwendigen Schätzungen und Vorinformation gressionsmethode abgesehen anschaulich. Im derjenigen nur Bayes'sche Regressionsmethode Hyperparameter ist unbedeutend. Die tion nicht zutrifft, der Para¬ basiert ebenfalls auf dem Mo¬ Anwendung Bayes'schen Regressionsmethode. Referenzinformation der Verteilungsfunktion) mit¬ renzinformation somit zweimal benützt. Daraus resultiert eine stärkere Die jedoch Erwartungswerte notwendig. Bayes'sche Regressionsmethode Bayes'sche Regressionsmethode es'schen Methode ist auch die da existiert. Bayes'schen Methode. gleichen Einschränkungen bezüglich Näherung, ist dies Erwartungswerte ihre dell des Parameterschätzverfahrens "Methode der kleinsten die solche Vertei¬ wird und da die Likelihoodfunktion des linearen Modells anstelle der Zufallsvariablen benutzt wird, ist die herung nur Wahrscheinlichkeitspapier Schätzungen nur anwenden lässt. Die Benüt¬ den Nachteil, dass jedoch Fall. Das Verfahren beschränkt sich auf die hat den Vorteil, dass sich Verknüpfung lungstypen verknüpft häufigsten zugehörigen von bietet der Informationsverknüpfung Verknüpfungsmethoden PseudoStichproben aufwendig. jedoch für die Die sehr ist sie wegen Anwendung heutigen Computersysteme der keine Pro¬ 8 Beispiele 8.1 Qualitätsprüfung 8.1.1 Vorschriften der Gemäss Norm SIA 162 Festbeton Qualitätsprüfung (1993) Abschnitt 5 13 wird die Kontrolle, ob ein Beton die ge¬ sogenannten laufenden Kontrolle durch¬ mittels einer forderte Druckfestigkeit erreicht, geführt. Für die Kontrolle müssen im Verlaufe der Bauarbeiten mindestens 30 entnommen werden. Die Probenentnahme kann Baustelle erfolgen. Prüfkörpern Der Nachweis der ermittelten Werte die Prüfkörper entweder im Betonwerk oder auf der ist erbracht, Druckfestigkeit folgende Bedingung wenn die aus den erfüllt: fcw»-Mn)-s(n)>f (8.1) cw.min mit Würfeldruckfestigkeit fcwm(n) mittlere Mn) Beiwert gemäss Tabelle 8.1 s(n) Standardabweichung f vorgeschriebener cw.min Anzahl Beiwerte Würfeldruckfestigkeit 50 2.4 X(n) Kontrolle der werden. Eine solche Nachweis der 40 2.5 Tab. 8.1- nommen Prüfkörper Prüfkörper Mindestwert der 30 X(n) unabhängige n n Prüfkörper n Für eine der der 2.3 gemäss SIA 162 Festigkeit Stichprobe 75 2.1 2.0 (1993) können Prüfkörper soll mindestens drei Festigkeitsanforderungen gilt >100 als erbracht, auf der Baustelle ent¬ Prüfkörper wenn die umfassen. Der folgenden Bedingun¬ gen erfüllt sind: f (n)-10N/rnmz>f (8.2) und Max[fcwl] - Min[fcwl] < Afcw(n) mit fcwm(n) : mittlere Würfeldruckfestigkeit der n Prüfkörper (8.3) 80 Beispiele Max[fcwi] : grösster Prüfwert der Würfeldruckfestigkeit in der Stichprobe Min[fcwi] : kleinster Prüfwert der Afcw(n) : zulässige Differenz gemäss 6 9 12 15 Afcw(n) 9 11 13 15 16 Zulässige Differenz Afcw(n) in N/mm malverteilt ist und eine bis (8.3) gehen davon Standardabweichung Würfeldruckfestigkeit entspricht Stichprobe Tabelle 8.2 3 Bedingungen (8.1) nimale der n Tab. 8.2: Die Würfeldruckfestigkeit in dass die aus, von 5N/mm 2 Würfeldruckfestigkeit aufweist. Die dann einer 2.2%-Fraktilen nor- mi¬ geforderte (Q2.2)- 8.1.2 Situation Für ein Bauwerk wird ein Beton der Festigkeitsklasse Kontrolle der im Betonwerk entnommenen 30 33.5N/mm 2 unabhängige Kontrolle der 30.2; 26.6; 29.9N/mm2. werden die ergibt destwertes der Dies von der aus 18.2N/mm und 2 falt durchgeführt teilung der 8.1.3 Verknüpfung Benutzung der wird übernommen wie die unterhalb des von der SIA auf Grund seiner unabhängige mit der eine der Bedingung (8.2) 20N/mm von zu . Die Min- Quali¬ diejenige sind die Stan- 2 , Erfahrung mit dem Betonwerk, dass Kontrolle nicht mit der Vergleich einbezogen 2 sein als geforderte. Hingegen zum diesen Wer¬ vorgeschriebenen Kontrolle scheint schlechter Vorschlag, gleichen Sorg¬ dass die Resultate der werden. Gesucht ist somit die Ver¬ Betondruckfestigkeit unter Berücksichtigung a) Stochastisches Die liegt verlangt Resultate: 28.5; 26.0; (8.3) erfüllt. Die linke Seite wurde. Diese Annahme führt laufenden Kontrolle mit in den Der Bauherr 28.2N/mm2. Mit von der Betonsorte B 30/20 diejenige die auf der Baustelle vorgenommene . von Zu diesem Zweck wurden fünf Prüf¬ beider Kontrollen kleiner als 5 N/mm zuständige Ingenieur glaubt 2 Prüfung ergab folgende Dieser . unabhängigen der laufenden Kontrolle und dardabweichungen 3.35N/mm einen Mittelwert Würfeldruckfestigkeit tät des Betons Der ergibt Bedingungen (8.1) einen Wert von einen Mittelwert Prüfkörper ergab Betondruckfestigkeit. auf der Baustelle entnommen. Die körper ten Standardabweichung und eine B 30/20 verwendet. Die laufende der beiden Kontrollstichproben. Bayes'schen Regressionsmethode Modell Normalverteilung als Verteilungstyp (Spaethe, 1992). Prinzipiell Weibullverteilung für Minima als der Betonwürfeldruckfestigkeit kämen auch die Verteilungstyp in Lognormalverteilung Frage. so¬ Beispiele 81 b) Informationsanalyse Die Resultate der trollstichprobe) gigen Analyse der beiden Informationen sind in Tabelle 8.3 dargestellt. Die (laufende und unabhängige Analyse Kontrolle wurde mit der Methode der kleinsten der Quadrate Stichprobe Kon¬ der unabhän¬ im Wahrscheinlichkeits- papier durchgeführt. Laufende Kontrolle Koeffizienten a = -10.0 a = -11.15 b = 0.30 b = 0.39 Verteilung N(33.5; 3.4) Stichprobenumfang n Tab. 8.3: Resultate der c) Gewichtung und = n 5 = Verknüpfung zugesprochen. keit von unabhängige der Metaverteilung bewegt ist am Kontrolle verwendet. Sie erhält die Ver¬ Die Resultate der der der laufenden Kontrolle zugesprochen N(28.2; 2.5) 30 2.2% Fraktilen sind in der Tabelle 8.4 und in der Standardabweichung Kontrolle Informationsanalyse Als Referenzinformation wird die trauenskennzahl 1 Unabhängige Abbildung zugewiesenen sich zwischen grössten, Verknüpfung sowie wenn 8.1 die dargestellt, zugehörigen in Abhängig¬ Vertrauenskennzahl. Der Mittelwert denjenigen der beiden Informationen. Die beiden Informationen das gleiche Vertrauen wird. VKZ unabhängige Kontrolle Metainformation Resultate der laufenden Q2.2 [N/mm2] [N/mm2] [N/mm2] 2.5 23.0 0.01 28.3 2.6 23.0 0.1 28.7 3.0 22.5 0.2 29.1 3.3 22.3 0.5 30.0 3.8 22.3 1 30.9 4.0 22.7 2 31.7 4.0 23.6 5 32.6 3.8 24.9 10 33.0 3.6 25.6 100 33.4 3.4 26.5 33.5 3.4 26.8 Verknüpfung Kontrolle sd 28.2 laufende Kontrolle Tab. 8.4: m in Abhängigkeit von der Vertrauenskennzahl der 82 Beispiele mMeta [N/mm ] sdMeta 34 [N/mm ] 4.5 ,r 4.0 32 _ 3.5 it . *-- 30 JL. » 3.0 o u 28 2.5 10"3 10"2 10"1 10° 101 102 103 10"3 10'2 VKZ 10"1 10° 101 102 103 VKZ [N/mm2] 2.2%-FraktileMeta 28 • " — 26 < laufende Kontrolle > unabhängige - - Kontrolle Metainformation 24 < 22 10'3 10'2 u » 101 10° 101 102 103 VKZ Grafische Darstellung der Resultate Abb. 8.1: der Verknüpfung d) Schlussfolgerungen Wie der aus Fraktile von gewichtet. Abbildung 20N/mm Die 2 nicht unterschritten, wie auch immer Bedingung (8.2) Betondrackfestigkeit ist Für das 8.1 und der Tabelle 8.4 ersichtlich ist, wird die gegebene information eine 2.2%- die laufende Kontrolle ist somit erfüllt und der Nachweis einer genügend hohen erbracht. Verhältnis der Stichprobenumfänge Normalverteilung N(32.7; 3.7). grafisch dargestellt. man geforderte von In der Die effektive 2.2%-Fraktile der 30/5 ergibt Abbildung sich für die Meta¬ 8.2 ist dieses Resultat Posteriorverteilung liegt in diesem Fall bei 25.1 N/mm2. 8.1.4 Die Verknüpfung mit der empirischen Regressionsmethode Normalverteilung analysen nommen. werden von Auch die probenumfänge Bayes'schen als stochastisches Modell sowie die Resultate der Informations¬ der Verknüpfung mit Benutzung wird beibehalten. Die linearen der der Bayes'schen Regressionsmethode unabhängigen Verknüpfung ergibt unter der über¬ Kontrolle als Referenzinformation Benutzung eine Metainformation mit einem Mittelwert von der tatsächlichen Stich- 28.5 N/mm und einer Beispiele 83 Standardabweichung 24.2 N/mm 2 Die . von 2.6 N/mm Bedingung (8.2) resultiert Daraus . ist somit 2.2%-Fraktile eine von eingehalten. b) Wahrscheinlichkeitspapier a) Verteilungsdichten F(fcw) 0.90 / - 070 - // - 0.50 //' / - 0.30 /' - f 0.10 '/ - // . 0.05 - // / / 0.01 25 20 30 unabhängige Abb. 8.2: Kontrolle Grafische Darstellung Bestimmung 8.2 40 35 20 45 f., 25 30 der Resultate der 40L Metainformation laufende Kontrolle — 35 Verknüpfung eines charakteristischen Wertes einer Stahlfliessspannung 8.2.1 Situation Angesichts zunehmender Verkehrslasten wird eine Stahlbrücke, welche um 1900 erstellt wurde, auf ihre Gebrauchstauglichkeit und Tragfähigkeit hin untersucht. Unter anderem wurden acht Prüfkörper wurde mit Hilfe des Fliessspannung f entnommen und ihre Eigenschaften bestimmt. Diese Wahrscheinlichkeitspapiers ausgewertet. einen Mittelwert von 225N/mm 2 Die und eine Stichprobe Analyse ergibt für die Standardabweichung von 17.1 N/mm2. Die Fachliteratur chungen von für die Fliessspannung Bahngesellschaften Mittelwert nen gibt von 261 N/mm 2 an 667 leicht unterschiedliche Werte Prüfkörper ergaben und eine für an. entsprechende Standardabweichung von Untersu¬ Stähle ei- 26N/mm 2 (SBB, 271N/mmundeineStandardabweichungvon 2 von 2271N/mmundeineStandardabweichungvon 1992). Eine spanische Untersuchung ergab für dieselbe Stahlsorte einen Mittelwert 34.9N/34.9N/mm 1994). Die Der Stichprobenumfang Aufgabe des Ingenieurs nung für die Kontrolle der wurde nicht besteht nun 2 (Tanner und Rui-Wamba, angegeben. darin, einen Rechenwert der Stahlfliessspan¬ Tragsicherheit dieser Brücke (1992) entspricht der Rechenwert der 5%-Fraktile (Q5) der zu bestimmen. Gemäss SBB Fliessspannung. Beispiele 84 8.2.2 Verknüpfung Bayes'schen Regressionsmethode mit der a) Stochastisches Modell In der Fachliteratur wird die und Siemes, 1987; (Vrouwenvelder Minimalwert der als Lognormalverteilung Verteilungstyp vorgeschlagen Spaethe, 1992; Tanner und Rui-Wamba, 1994). Der Lognormalverteilung wird zu Null gesetzt. b) Informationsanalyse Die Untersuchungen der Bahngesellschaften ben ähnliche Werte für die einander verknüpft. Da es Fliessspannung keinen Grund der Stähle gibt, gen, werden sie gleich gewichtet (VKZ =1). das Resultat der Verknüpfung und in Abbildung 8.3 aus Brücke von Bahngesellschaften a = b = a = b = -71.3 13.2 -55.9 10.1 Spanische a = -43.6 Untersuchungen b = 7.8 Metainformation aus Fachliteratur Tab. 8.5: Resultate der an. Die Sie werden deshalb zuerst mit¬ Auswertung aus ge¬ zu bevorzu¬ aller Informationen sowie der Fachliteratur sind in Tabelle 8.5 dargestellt. der Untersuchungen spanischen Untersuchungen eine der beiden Informationen der Informationen Koeffizienten Stichprobe sowie die a = -48.1 b = 8.6 Informationsanalyse Verteilung LN(5.41; 0.08; 0) LN(5.56;0.10;0) LN(5.59;0.13;0) LN(5.58;0.12;0) Momente N/mm2 m = 225 sd = 17.1 Q5 = 198 N/mm2 m = 261 N/mm2 sd = 26.0 Q5 = 220 N/mm2 m = 271 N/mm2 sd = 34.9 Q5 = 217 m = 266 N/mm sd = 31.0 Q5 = 218 N/mm2 N/mm2 N/mm2 N/mm2 2 N/mm2 N/mm2 Beispiele 85 f(fy) 0.016 Untersuchungen von Bahngesellschaften /%--''"" ' 0.012 /~\ •//' 0.008 0.004 \ If . spanische \ / Untersuchungen resultierende Y\_ - \\v--^^ yt Metainformation u.uuu 150 250 300 c) Gewichtung und 400 fy der untersuchten Brücke welche die Fachliteratur für solche Stähle entscheiden, welcher Information Wahl zwischen einer und einer der Fachliteratur Verknüpfung Stahlfliessspannung men 350 Grafische Darstellung der Verknüpfung der Informationen aus Abb. 8.3: Die 200 Stichprobe Stichprobe er angibt. liegt Der mehr Vertrauen um einiges Ingenieur tiefer als muss entgegenbringen mit acht Werten, die mit mehr als 700 Werten vom aus möchte. Er hat die betrachteten Bauwerk stam¬ verschiedenen Bauwerken und verschiedenen Ländern. Natürlicherweise wird wohl den Daten mehr Gewicht sen, da der Hinweis auf eine tiefere Als Referenzinformation wird die Stichprobe auszudrücken, mation nutzt bezüglich (VKZ 231.8N/mm = 2 Stichprobe gewählt. wird der linguistische Um das grössere und eine 2 Vertrauen in die Term "kleineres Vertrauen in die Infor¬ aus Standardabweichung von und ist somit etwas kleiner als diejenige 24.1 N/mm diejenige 2 der Fachliteratur be¬ der 0.020 0.016 r 0.012 - 0.008 - 0.004 0.000 Stichprobe - Metainformation - Fachliteratur - - 150 200 250 Stichprobe. Die Dichte¬ der Metainformation sind in f(fy) 0.024 300 350 Grafische Darstellung der Informationsverknüpfung 400 von auf. Die 5%-Fraktile be- dargestellt. Abb. 8.4: beigemes¬ werden darf. Die resultierende Metainformation weist einen Mittelwert funktionen der Informationen sowie 8.4 vernachlässigt der Referenzinformation" für die Information 0.2). trägt 194.4N/mm Fliessspannung nicht diejenige, sich in diesem Fall fv Abbildung 86 Beispiele 8.2.3 Die Verknüpfung mit der empirischen Regressionsmethode Lognormalverteilung linearen Bayes'schen als stochastisches Modell sowie die enten der Informationen werden von der Verknüpfung Bestimmung mit der Bayes'schen Regressions¬ methode übernommen. Als Referenzinformation wird wiederum die In diesem Beispiel nutzt. Da der de, wird er werden die effektiven Stichprobenumfang gleich demjenigen der der gegenüber der Informationen ist in Tabelle 8.6 der Stichprobenumfang Tab. 8.6: Das aus der der angegeben der andern bevorzugt. = 5.59 ri = 5.41 X = 0.10 x = 0.13 x = 0.08 n = 667 n = 667 n = 8 261 sd = 26.0 Q5 = 220 der LN(5.59;0.13;0) N/mm2 N/mm2 N/mm2 m = 271 sd = 34.9 Q5 = 217 N/mm2 N/mm2 N/mm2 LN(5.41;0.08;0) 225 m = sd = 17.1 Q5 = 198 N/mm2 N/mm2 N/mm2 Informationen Verknüpfung ist in Tabelle 8.7 Bayes'schen Regressionsmethode information angegeben. Es stimmt mit überein. Koeffizienten der Meta¬ Tl = 5.43 x = 0.10 LN(5.43;0.10;0) Verteilung der Metainformation Tab. 8.7: So Stichprobe Tl = wur¬ gegeben. 5.56 m be¬ Eine Zusam¬ = Zusammenstellung Ergebnis nicht Tl LN(5.56;0.10;0) zugehörige Verteilung Verknüpfung Bahngesellschaften gesetzt. Untersuchungen von Spanische B ahnge Seilschaften Untersuchungen Koeffizienten und Stichprobe gewählt. für die spanischen Untersuchungen wird keine der beiden Vorinformationen menstellung Stichprobenumfänge Untersuchungen der Koeffizi¬ Resultat des 228 m = sd = 19.6 Q5 = 197 Verknüpfung N/mm2 N/mm2 N/mm2 demjenigen 87 Beispiele 8.3 Einbezug historischer Daten in eine Erdbebenstärkenschätzung 8.3.1 Situation Dieses Beispiel wurde deten Daten wurden Gelder und von van aus den Lungu (1997) Diagrammen stimmen somit nicht exakt mit den des genannten Artikels Orginaldaten Aufzeichnungen worden. Die berg-Richter Magnitudenskala. ode 1901 -1994 die te. die dieser ser von "Instrumentendaten" enthält für die Peri¬ 6.42 und eine die vorhandenen Daten Standardabweichung von - 1900 Standardabweichung Gumbelpapier dargestellt. jährliche Stichprobe enthält von 14 Wer¬ 0.54 auf. Für Die sich analysiert. "Historische Daten" umfasst die als 4.1. Der Mittelwert ist 5.76 und die Planung Vrancea mit Instrumenten auf¬ wurden die Erdbeben der Periode 984 sind die Daten in einem herausgelesen und umfassen die Erdbebenstärken nach der Guten¬ Stichprobe Analyse ergebende Stichprobe Für die Region die grösser als 5.7 sind. Die Magnituden, Sie weist einen Mittelwert gleiche Region Die verwen¬ überein. Seit 1901 sind die Erdbeben in der rumänischen gezeichnet übernommen. Die hier aus Magnituden grös¬ 0.63. In Abbildung 8.5 Es wurde dabei vorausgesetzt, dass Maxima darstellen. Neubauten, aber auch für die Beurteilung von bestehenden Trag¬ werken, sollen die Verteilung der Magnituden und daraus die Stärke eines 400-j ährlichen Erdbebens bestimmt werden. Es ist bemerken, dass die angegebenen Grössenordnungen der Erdbebenstärken der zu beiden Stichproben Auf eine Abklärung knüpfung 8.3.2 a) im Vergleich zu anderen Daten sehr hoch sind dieses Umstandes wird in diesem der beiden Informationen im Verknüpfung mit der Vordergrund (Bachmann, 1995). Beispiel verzichtet, da nur die Ver¬ steht. Bayes'schen Regressionsmethode Stochastisches Modell Als stochastisches Modell für die tere mögliche Modelle werden in Magnituden van wird die Gelder und Gumbelverteilung gewählt. Wei¬ Lungu (1997) kurz dargestellt. b) Informationsanalyse Die beiden Stichproben werden mit der Methode der kleinsten lichkeitspapier ausgewertet. Quadrate im Wahrschein- Dabei werden bei den Instrumentendaten die fünf kleinsten Werte und bei den Historischen Daten die 16 kleinsten Werte bei der Auswertung ausge¬ schlossen, da die empirische Verteilungsfunktion einen ausgeprägten Knick aufweist (siehe Abbildung 8.5). Die Resultate der Auswertung sind in Tabelle 8.8 dargestellt. Beispiele 88 Verteilung Koeffizienten a = -11.1 b = 2.13 = -8.5 b = 1.90 Resultate der = 5.51 sd = 0.60 Q400 = 8-1 m = 4.78 sd = 0.67 Q400 = 7-6 GL(4.48;0.53) Historische Daten Tab. 8.8: m GL(5.23;0.47) Instrumentendaten a Momente Informationsanalyse FM(m) 0.999 / y > P Instrumentendaten n Historische Daten / jp 0.990 x / / / / M À J*' 0.900 - 0.800 0.700 / 5 1\ Abb. 8.5: "; * * r , - !/ / 1 6 , , 8 7 Ç) Magnitude m Grafische Darstellung der Informationsanalyse c) Gewichtung und Die Unterschiede der ben scheinen nur Verknüpfung Magnituden gering gross, da bereits eine Energie À m I - um zu der sein. Die 400-j ährlichen Auswirkungen Magnitudendifferenz den Faktor 1.4 bedeutet von auf eine 0.1 eine aus den beiden Bemessung Erhöhung (siehe auch Tabelle 8.9). Magnitudendifferenz Tab. 8.9: Erdbeben Energiefaktor 0.1 1.4 0.2 2.0 0.3 2.8 0.4 4.0 0.5 5.6 0.6 8.0 0.7 11.2 0.8 15.9 Zusammenhang zwischen der Magnituden¬ differenz und der zusätzlich freigesetzten Energie (Brauner und Stanley, 1995) der Stichpro¬ sind jedoch freigesetzten Beispiele 89 Die Historischen Daten basieren auf einer grossen gegen ist die Es ergibt der Erdbebenstärke Festlegung sich ein grosser Zeitspanne historischen aus Interpretationsspielraum. von rund 900 Jahren. Hin¬ Unterlagen sehr schwierig. Die Daten weisen somit eine grössere Unscharfe als die Instrumentendaten auf. Die Instrumentendaten wurden über eine rela¬ tiv kurze Periode auf der 90 Jahren von Messungenauigkeit, gesammelt. Die Unscharfe dieser Daten beruht einerseits andererseits auf der Sorgfalt der staunlich ist die Tatsache, dass die Instrumentendaten höhere Datenerhebung. Magnituden Etwas er¬ aufweisen als die Historischen Daten. Dies obschon die Historischen Daten eine weitaus grössere Peri¬ ode umfassen. Aus diesem Grund und weil die Magnituden scheinen wird den Historischen Daten mehr Vertrauen auch generell zu 5 gesetzt. Die sich ergebende Metainformation weist einen Mittelwert chung 0.72 auf. Der Fraktilwert mit einer von 7.92. Die sind in Verteilungsfunktionen 8.4 Abbildung hoch er¬ geschenkt. Als Referenzinformation werden die Instrumentendaten verwendet. Die trauenskennzahl der Historischen Daten wird etwas aus zugehörige der Ver¬ Verknüpfung 4.90 und eine Standardabwei¬ von Wiederkehrperiode von der Informationen sowie diejenige 400 Jahren beträgt der Metainformation dargestellt. FM(m) 0.999 1 i 1 A / // ft • Instrumentendaten / 0.990 f t / — / — — Historische Daten / Metainformation 4 // 0.900 0.800 0.700 , 8.3.3 Die - i , 7 8 9 Verknüpfung mit der empirischen Regressionsmethode Gumbelverteilung nommen. Magnitude m Grafische Darstellung der Verknüpfung analyse werden Die t 6 15 L Abb. 8.6: t // £iJ- - von linearen Bayes'schen als stochastisches Modell sowie die Resultate der Informations¬ der Verknüpfung mit der Bayes'schen Regressionsmethode über¬ Als Referenzinformation werden wiederum die Instrumentendaten Verknüpfung Magnitude unter Benutzung einen Mittelwert sultiert eine Magnitude von von der effektiven 5.47 und eine 8.03 für das gewählt. Stichprobenumfänge ergibt Standardabweichung von 0.61. 400-j ährliche Erdbeben. für die Daraus re¬ 90 Computerunterstützung 9 Verfahren (Seite 57) dargestellte Das im Kapitel in das Computerprogramm es'sche Regressionsmethode 6 thode wurden als Informationsverknüpfung zur sowie die empirische lineare Verknüpfungsmethoden implementiert. ist, einem Anwender aus mationsverknüpfung zu der Praxis den ermöglichen. Die (Combining Tn/brmation) integriert. Comblnfo Zugang zum Bay¬ Bayes'sche Regressionsme¬ Das Ziel dieses vorgestellten Vom Anwender wird bei der grammes ein Grundwissen in der Statistik oder der wurde Programmes Verfahren der Infor¬ Benutzung des Pro¬ Wahrscheinlichkeitsrechnung voraus¬ gesetzt. Das Computerprogramm Comblnfo kann über das Institut für Baustatik und Konstruktion der ETH Zürich Das Programmkern. Anwender und übernimmt die mes. die Der zwei Teilen, der Benutzerschnitt¬ Die Benutzerschnittstelle umfasst die Interaktion mit dem Steuerung des Programmkerns und für die und die Verknüpfung notwendig und somit des Algorithmen, Program¬ welche für sind. Die Benutzerschnittstelle Das Programm wurde 1996). in der Computersprache anskyj, 1997). C/C++ geschrieben (Bramer und Bramer, der Benutzerschnittstelle wurde Entwicklung Für die "Microsoft Foundation Class Library" die Klassenbibliothek verwendet (Blaszczak, 1997; Heimann und Turi- Dabei wurde die übliche Dokument-Ansicht-Struktur benutzt. Die Daten werden bei dieser Struktur speicherung und von den Ansichten getrennt. Das Dokument dient der Daten¬ als Schnittstelle Funktion der internen Steuerung die eigentliche Im Programm Comblnfo gibt • aus Programmkern beinhaltet die Datenstrukturen Informationsanalyse 9.1 werden. Comblnfo besteht im wesentlichen Programm stelle und dem bezogen zum des Programmkern. Programmes. Es übernimmt somit auch die Die verschiedenen Ansichten stellen Benutzerschnittstelle dar. es im wesentlichen vier Ansichten: Informationsansicht Die Informationsansicht ist die zeit des Programmes sichtbar. Hauptansicht. Sie bleibt während der gesamten Lauf¬ In dieser Ansicht wird die Charakteristik der einzelnen Informationen in Form der ersten beiden Momente und der Parameter Gleichzeitig wird auch die Dichtefunktion der Information angezeigt. grafisch dargestellt. 92 Computerunterstützung Die Wahl des Verteilungstyps des Die Festlegung nen und kann nicht mehr wird auch in der Informationsansicht vorgenommen. Verteilungstyps erfolgt geändert der vor Eingabe der einzelnen Informatio¬ werden. Von der Informationsansicht werden die anderen Ansichten angesteuert. Für den An¬ wender stellt somit die Informationsansicht die Steuerungsplattform des Programmes dar. • Änderungsansicht In dieser Ansicht können mationen geändert neue Informationen werden. Als beschriebenen Kombinationen eingegeben oder Eingabegrössen zur stehen die in die vorhandenen Infor¬ Kapitel 5.2 (Seite Zur Auswahl stehen somit die Verfügung. 52) Eingabe über - - - - - die ersten zwei Momente, die Parameter, den Erwartungswert und einen Fraktilwert, den Modalwert und einen Fraktilwert sowie über eine Je nach Stichprobe. Verteilungstyp tion anzugeben. Die Analyse der ist allenfalls noch eine untere bzw. obere Grenze der Informa¬ Stichprobe kann mit der Momentenmethode, der Maximum Likeli¬ hood Methode und mit der Methode der führt werden • (siehe Kapitel (gewichteten) 3.2.2, Seite 19 und Kapitel kleinsten Quadrate durchge¬ 3.3.3, Seite 27). Verknüpfungsansicht In der Verknüpfungsansicht knüpfung getätigt. thode und die Als werden die Verknüpfungsmethoden empirische lineare ter ist die Referenzinformation hörige notwendigen Eingaben stehen die zur Bayes'sche Regressionsme¬ Bayes'sche Regressionsmethode zu wählen und für Vertrauenskennzahl resp. den Informationsver¬ zur Auswahl. Wei¬ jede weitere Information die zuge¬ zugehörigen PseudoStichprobenumfang festzule¬ gen. Maximal können fünf Informationen miteinander kung die ist nicht programmtechnisch bedingt, Zuweisung von verknüpft werden. sondern berücksichtigt Diese Beschrän¬ die Tatsache, dass Vertrauenskennzahlen bei allzu vielen Informationen schwierig wird. • Darstellungsansicht Die Darstellungsansicht zeigt die ausgewählten Informationen in grafischer Form. Als Darstellungsformen stehen die Dichtefunktion und die Verteilungsfunktion zur Verfü¬ gung. Die letztere kann auch im Wahrscheinlichkeitspapier betrachtet werden. Computerunterstützung 93 « Informatonsansicht Änderungsansicht f * 1 Darstellungsansicht Verknùpfungsansicht t Dokument / V | Typ Ansicht Steuerung !- * Bayes Stichprobengenerator Emp. Lin. Bayes'sche Regressionsmethode Normal - Lognormal Bayes'sche Regressionsmethode Programmkern Beziehungen Abb. 9.1: Der 9.2 der enthält den mathematischen Teil des Programmes. der Datenstruktur einer Information sowie die die Speicherung die Informationsanalyse gliedert untereinander und zur Benutzerschnittstelle Programmkern Programmkern Der Hauptkomponenten sich in die und für die Verknüpfung notwendig folgenden Hauptkomponenten, Dieser umfasst Algorithmen, sind. Der welche als Klassen welche für Programmkern ausgebildet wur¬ den: • Typ In der Klasse Typ wird die Datenstruktur einer Information tet im wesentlichen die im die Speicherung Wahrscheinlichkeitspapier und Bearbeitung dieser Daten gespeichert. Dies beinhal¬ der Momente, der Parameter, der Koeffizienten die Elemente einer allfälligen Stichprobe. notwendigen Algorithmen Alle für werden durch Funktionen dieser Klasse übernommen. Für jeden implementierten Verteilungstyp te Klasse. Diese enthält alle für den existiert eine von der Klasse Typ abgeleite¬ jeweiligen Verteilungstyp spezifischen Algorith¬ men. • Bayes Die Klasse Die zwei Bayes stellt die für eine Verknüpfung notwendige implementierten Verknüpfungsmethoden sind als Datenstruktur bereit. abgeleitete Klassen der 94 Computerunterstützung Klasse gen • Bayes ausgebildet worden. Sie beinhalten die jeweiligen Methode gehöri¬ Fähigkeit, für jeden implementierten Vertei¬ zur Verknüpfungsmechanismen. Stichprobengenerator Die Klasse Stichprobengenerator lungstyp PseudoStichproben te zu hat die generieren. Sie wird für die der Ordinaten- resp. Abszissenwerte der Weibull- und Abbildung 9.1 komponenten zeigt in vereinfachter untereinander und Die Struktur des Darstellung diejenige zur die Bestimmung Fréchetverteilung benötigt. Beziehung dass Erweiterungen bindung von bindung zusätzlicher Rechenmethoden ist ohne grossen Aufwand Verteilungstypen der einzelnen Haupt¬ Benutzerschnittstelle. Programmkerns gewährleistet, weiteren der Momen¬ einfach zu bewerkstelligen im Sinne der Ein¬ sind. Auch die Ein¬ möglich. Anhang In diesem A Kapitel Definitionen der sind nur die Verteilungstypen, welche griert wurden, ausführlich dokumentiert. sind nur A1 Verteilungstypen angegeben. Standardnormalverteilung (p(x) Definitionsbereich -oo Verteilungsfunktion *<x> J2n < x < inverse Verteilungsfunk¬ tion / Fraktilwert Q Q 1 = ~2 J v pri-f u exP l —oo ~2J du <*>-1(q) E[X] Standardabweichung sd[X] Verteilungsfunktion A oo ~ Erwartungswert nicht X exp - A/^TC LL = a = 0 = 1 = sowie die inverse Verteilungsfunktion der Standardnormalverteilung sind finden sich zum Beispiel in Spaethe (1992). Einzelne (Sachs, 1992). geschlossen lösbar. Näherungsformeln Werte können Tabellen entnommen werden A 2 Computerprogramm inte¬ Für alle anderen erwähnten ( Die in das die Dichtefunktionen sowie deren Definitionsbereiche Dichtefunktion 1 Verteilungstypen Normalverteilung N(u.;a) 1 Dichtefunktion txvX') ' - >— a- Definitionsbereich -oo Verteilungsfunktion Fx« inverse Verteilungsfunk¬ tion / Fraktilwert Q Q < X < = Standardabweichung sd[X] Modalwert mo[X] ii = U J *{*?) Fx(q) E[X] 2 -oo<^<oo °o - Erwartungswert CXP a/2tc = = a \i = lt + cr-0_1(q) a>0 96 Anhang A Wahrscheinlichkeitspapier (Abbildung A.1) Abszisse u = X Ordinate v = 0-!(Fx(x)) Stützpunkte Parameterbestimmung u0 bei v = 0 bzw. y = 0.5 Uj bei v = 1 bzw. y = 0.841 (I = u0 Stützpunkten a = Uj-Uq Parameterbestimmung * aus den a aus ~ den a bzw. den Parametern y = bzw. M- = Tl a = x Tj = n G=ß Koeffizienten¬ aus . 1 Koeffizienten bestimmung "ß ß = i f'x(x) v 0'1(FX( x)) = 0.99 0.98 2 0.95 - u-u. v S c = a 0.90 • j^ 0.80 ^ 1 - • 0.70 jS+ jS+ 0.60 • 0.50 , .X*» 0.40 " ^ L 0 1 * | 0.30 0.20 • -1 j*r 0.10 0.05 0.02 i 1 t T -2 1 0.01 4D Abb. A.1: Normalpapier 50 60 U° 70 80 Ul 90 100 11 0 x Anhang A 97 Parameterbestimmung Erwartungswert und Standardabweichung aus Stützwerten E[X] \i = a = sd[X] ti = Qj-o-O'Vqi) zwei Fraktilwerte Qj und Q2 G Q1-Q2 ~ <s> Erwartungswert [i = a = -1 (q2) -^ * [1 (qi)-* E[X] und Fraktilwert -1 (q) mo[X] = Modalwert und Fraktilwert * A3 (q) Lognormalverteilung LN(A,;Ç;e) 1 Dichtefunktion fx00 Definitionsbereich £<X<oo Verteilungsfunktion Fx(x) inverse Verteilungsfunk¬ Q = Ç-(x-e)- Ä ln(x-e)-A, c O = Q Erwartungswert E[X] = = e + = exp(?i + 8 + ( sd[X] Modalwert mo[X] exp = = c;-0-1(q)) exp V Standardabweichung e + J 9-2\ 4\^¥) explX-C, Wahrscheinlichkeitspapier (Abbildung A.2) Abszisse u = ln(x-e) Ordinate v = <&_1(Fx(x)) Stützpunkte fln(x-e)-^2^ C>o £<X< F^(q) tion / Fraktilwert exp u0 bei v = 0 bzw. y = 0.5 Uj bei v = 1 bzw. y = 0.841 98 Anhang A Parameterbestimmung aus den Stützpunkten X = u0 Ç = Uj-Uq a \ Parameterbestimmung aus bzw. den Koeffizienten i r _ ^ Koeffizienten¬ y = = "H = t ß a = -= Ç bestimmung aus den Parametern (e bekannt) C bzw- r 1 P A. c i 5x(x) v = *-'(Fx(x)) 0.99 0.98 0.95 0.90 r u-A, 0.80 v= 0.70 * ^1^- * ---^ 1 - Ç 0.60 ^^y 0.50 •^r ' - - - I "^( 0.40 *• 0.30 0.20 - ^r + 0.10 i 0.05 i T 1 0.02 -1 1 0.01 U0 3j 69 0 Abb. A.2: U! 3.91 4.09 4.24 4.38 4.50 4.61 4.70 50 60 70 80 90 100 110 Lognormalpapier Parameterbestimmung aus Stützwerten Die nachstehenden Formeln setzen voraus, dass X = ç = Erwartungswert und Standardabweichung 8 bekannt ist. log(E[X]-e)-|-log fi+rsd[X1 Tl f [fi+f sd[X1TlJ s vE[X]-eJ ln(x) x 99 Anhang A .-l. ln(Q1-e)-C-^ zwei Fraktilwerte Ql und (qi) ln(Q1-e)-ln(Q2-e) Q2 <5"1(q1)-0_1(q2) X L2 ln(E[X]-8)- = 0<q<0.5: Erwartungswert und Ç Fraktilwert U-1(q))2 *-\q)+ = + 2.1n^l=e' 0.5<q<l: ;-•->(,)-Vc,))1^^^"X ln(mo[X]-e) = + Ç 0<q<0.5: ®\q) - - U'W + 4 • Inf—0—^~ mo[X] Modalwert und - 8. Fraktilwert 0.5<q<l: -8 -*-'(q)+J^w7^g[X] A 4 Gumbelverteilung für Dichtefunktion Maxima fx(x) = Definitionsbereich -oo Verteilungsfunktion Fx(x) inverse Verteilungsfunk¬ Q tion / Fraktilwert Erwartungswert Q = = X + sd[X] Modalwert mo[X] = = 2= 76 X -exp(X < g g 5 oo )) > 0 JJ Ä,-8-ln(-ln(q)) = Cb 0.57721665 Standardabweichung < exp(-expf- = = g -oo oo Fx1(q) E[X] C exp(- - < X < GL(À;ô) . ô (Eulersche Konstante) = 1.282550 8 - 8 100 Anhang A Wahrscheinlichkeitspapier (Abbildung A.3) Abszisse u = X Ordinate v = -ln(-ln(Fx(x))) Stützpunkte u0 bei v = 0 bzw. y = 0.368 Uj bei v = 3 bzw. y = 0.951 X Parameterbestimmung aus den Stützpunkten u0 = U3"U0 s Ô= 3 a i ß Parameterbestimmung aus den Koeffizienten 5 0 aus 1 Tl 0 = X Tl = X T = 8 ß Ô den bzw. 1 pß= = = X Parametern y Ä, bzw. = Koeffizienten¬ bestimmung . 8 Fx(x) v = -ln(-ln(Fx(x))) 0.98 u 0.95 v- — X 5 S » ^~ \ 0.90 0.80 0.70 0.60 0.50 • * %/ 0.40 0.30 • 0.20 0.10 T T 1 0.05 . j 0.02 50 Abb. A. 3: ,t~ 7T~ 60 Gumbelpapier für Maxima 70 ~u 80 90 100 "3 110 120 x Anhang A Parameterbestimmung aus X Stützwerten E[X]-C-^-sd[X] = Erwartungswert und Standardabweichung 7t 8 ^ = sd[X] 7t X und • sd[X] Q1+8-ln(-ln(qi)) = zwei Fraktilwerte Ql 0.779697 = Q1-Q2 Q2 " ln(-ln(q2))-ln(-ln(qi)) X E[X]-C-S = Erwartungswert und Fraktilwert E[X]-Q 5 C X mo[X] = Modalwert und Fraktil¬ Q-X wert A 5 ln(-ln(q)) + v Weibullverteilung Dichtefunktion -ln(-ln(q)) für Minima fx(x)-cH Definitionsbereich 8<x<co Verteilungsfunktion Fx(x) inverse Verteilungsfunk¬ Q WS(8;y;e) 1 ~ Fx1(q) Q Erwartungswert E[X] Standardabweichung stl[x] Modalwert mo[X] = e + = 'exp = = exp = K"/J 8-(-ln(l-q))1/Y e + 8-rfl + -N) 5.]r(1 2)-(r(, I))2 + 8 + 8- f1^") Wahrscheinlichkeitspapier (Abbildung A.4) Abszisse u Ordinate v= = («1 8,7>0 = tion / Fraktilwert ) 8 ln(x-e) ln(-ln(l-Fx(x))) + Y>1 102 Anhang A Stützpunkte u0 bei v = 0 bzw. y Uj bei v = -3 bzw. y 8 Parameterbestimmung aus den Stützpunkten Parameterbestimmung aus = bestimmung Parametern y = aus den (e bekannt) = 0.049 exp(u0) 3 ' 8 uo = den Koeffizienten Koeffizienten¬ 0.632 = - u-3 expf-f) FV ßJ ô bzw. ß a = -y-log(S) ß = y ,Sv , eXP(Tl) i y Y= = = - T m = X = log(8) bzw. 1 - Y ]Fx(x) ln(-ln(l-Fx(.0)) v= 0.98 0.95 ' 1 0.90 0.80 0.70 • 0.60 0.50 V y • y\x 0.40 lUg^OJJ ^ -„ \y 0.30 0 - -1 • 0.20 • j/ -2 0.10 *S 0.05 1 -3 _ 0.02 u-3 Abb. A.4: «O 3. 69 3.91 4.09 4.24 4.38 4.50 4. 61 40 50 60 70 80 90 1(30 Weibulipapier für Minima ln(x) x 103 Anhang A Parameterbestimmung aus Stützwerten Die nachstehenden Formeln setzen voraus, dass f(y) e bekannt ist. rii = + iJf-sd[X] = 0 Erwartungswert und Standardabweichung 8 = E[X]-e m + - Y 8 ln(Q2-e)-v1-ln(Q1-e)-v2 = exp vi-v2 zwei Fraktilwerte und Qi Q2 Y V; ln(Q1-e)-ln(8) ln(-ln(l-qi)) = f(y) = (E[X]-e)-(-ln(l-q)) _(Q-e)-r(l i) Erwartungswert und + Fraktilwert2 8 0 Q-e = (-ln(l-q)) f(8) = l/Y = l/Y -(mo[X]-e) ln((Q-e)/S) Modalwert und + Fraktilwert2 y bzw. 5 wird bestimmt vn+l Zur = aus (Bronstein Xn et Bestimmung bzw. f (5) nach der Iterationsvorschrift Regula falsi (A.1) f(xn) des ersten Startwertes xm wird der Mittelwert bzw. der Modalwert zunächst als Me¬ zugehörigen Parameter entspricht dem können analog den Formeln für zwei Fraktilwerte ersten Startwert f(xm) f(xn) Standardabweichung wert wie folgt empirisch festgesetzt: Q005 (E[X]-eVexp -3 sd[X] E[X] wird der für die + £ geschlos¬ xm. Der zweite Startwert xn wird verschiedene Vorzeichen aufweisen. Bei der und Mittelwert und = 0 al., 1995). bestimmt werden. Dies setzt, dass = ln((Q-e)/8) Nullstellengleichung f (y) f(xn)-f(xm) dian angesetzt. Die sen der ln((Q-e)/8) ln(-ln(l-q)) 1 ln(-ln(l-q)) Y 2 5- Mn(-ln(l-q)) Bestimmung so ange¬ Parameterbestimmung des Startwertes benötigte aus Fraktil¬ (A.2) Anhang A 104 A 6 Fréchetverteilung für Maxima FL(8;y;e) fx(x) Definitionsbereich e<x<oo Verteilungsfunktion Fx(x) Verteilungsfunk¬ / Fraktilwert Q inverse tion Q V+1 'eXP 8U-eJ = = E[X] 8 Standardabweichung sd[X, Modalwert moIXI^ = (-ln(q))1/Y 8 + = ter] exp Erwartungswert = (-(AT) 8, y>0 Fx\q) = 8 ( y Dichtefunktion 8-rfl--") y>l 6.Jr(i-?)-(r(i-i))2 + Y>2 5^) Wahrscheinlichkeitspapier (Abbildung A.5) Abszisse u = Ordinate v = Stützpunkte v = 0 bzw. y = 0.368 Uj bei v = 3 bzw. y = 0.951 8 den Stützpunkten Parameterbestimmung aus -ln(-ln(Fx(x))) u0 bei = Parameterbestimmung aus ln(x-e) exp(u0) 3 ' 8 u3~u0 = v den Koeffizienten Koeffizienten¬ bestimmung aus den Parametern (e bekannt) Ô expf-H ß; bzw. ß a = -y-log(8) ß = y , ,t, 6XP(11) i y Y= = = - ^ r| = x = bzw. log(8) i - y Anhang A y 105 Fx(x) = v = -ln(-ln(Fx( *))) 0.98 v 0.95 y-(u-log(ô)) = 3 \, 0.90 ^^ 0.80 • 0.70 ^r 0.60 2 i t /^ 1 • • 0.50 0.40 0 *T"- 0.30 ^S 0.20 1 f 0.10 0.05 S^ I * -1 1 0.02 u0 Abb. A. 5: u3 3. 31 4.09 4.24 4.38 4.50 4.61 4.70 4.79 4.87 50 60 70 80 90 100 110 120 130 s bekannt ist. ln(x) x Fréchetpapier fur Maxima Parameterbestimmung aus Stützwerten Die nachstehenden Formeln setzen voraus, dass f(y) = E[X]-8 sd[X] = 0 rii-- Erwartungswert und Y Standardabweichung 8 = E[X]-e r[i-Y 8 ln(Q2-s)-v1-ln(Q1-s)-v2 = exp V1~V2 zwei Fraktilwerte Ql und Q2 Y vj Erwartungswert und = ln(8)-ln(Q1-e) = f(Y) Fraktilwert 8 = ln(-ln(qi)) = (E[X]-e)-(Q-e)-(-ln(q))1/Y-r(l-^ (Q-e)-(-ln(q)) l/Y = 0 106 Anhang A f(8) -(mo[X]-e) = + 8ln((Q-£)-ln(8)) Modalwert und ln(-ln(q)) Fraktilwert3 Die Bestimmung ln(-ln(q)) = ln(8)-ln(Q-8) Y 3 \ von + ln(-ln(q)) ln(-ln(q)) = ln(Ö)-ln(Q-e) y bzw. 8 werden analog zur Parameterbestimmung für die Weibull Verteilung für Minima für die durchgeführt. Bei der Parameterbestimmung aus Mittelwert und Standardabweichung wird Bestimmung des Startwertes benötigte Fraktilwert wie folgt empirisch festgesetzt: ( Q005 A 7 = (E[X]-e)exp sd[xf (A.3) + e E[X] Exponentialverteilung EX(?i;e) fx(x) Definitionsbereich e< x<oo Verteilungsfunktion Fx(x) Verteilungsfunk¬ tion / Fraktilwert Q Q exp(-A-- (x-e)) X Dichtefunktion inverse = X>0 1 = E[X] Standardabweichung sd[X] Modalwert mo[X] = e + = exp(-À-(x-e)) - Fx(q) = Erwartungswert e-i.ln(l-q) ^ i = = e Wahrscheinlichkeitspapier (Abbildung A.6) Abszisse u = x-e Ordinate v = -ln(l-Fx(x)) Stützpunkte Parameterbestimmung aus den Stützpunkten Parameterbestimmung aus den Koeffizienten Uj bei v = 1 bzw. y = 0.632 u2 bei v = 2 bzw. y = 0.865 7 A l — u2-Ul X = ß X x , = V = - X Koeffizienten¬ bestimmung aus den Parametern (e bekannt) 0 = I der Anhang A y 107 = Fx(x) v = -ln(l-Fx(x)) 0.98 • 0.95 0.90 i^* • -— 0.80 • 0.70 ^X» ^ 0.60 | 0.50 T 0.30 "*• 0.10 1 0.02 «1 2 0 Abb. A.6: 4 u2 6 8 10 14 16 18 Exponentialpapier Parameterbestimmung aus Stützwerten Die nachstehenden Formeln setzen voraus, dass Fraktilwerte y X-~ Q n Standardabweichung Weitere 8 bekannt ist. ln(l-q) Q-e 1 X Erwartungswert A 8 12 E[X]-e l X sd[X] Verteilungen (x-a)r ^(b-x)1 1 Betaverteilung BE(r;t;a;b) tx(X)"B(r;t) (b-a)1^-1 a<x<b r, t > 1 Betafunktion: B(r;t) = Fff 1 Gammaverteilung fx00 GA(b;p;e) e < x bp = r( ' F(t) (ITlJ sexp(-b-(x-e))-(x-e)p b, p > 0 i x Anhang A 108 Rechteckverteilung R(a;b) a<x<b a+ 2 t-Verteilung fx(X) " - , , s St(|i;a;a) -°o<x<oo I a, g > 0 l a ^ a >) 1 Anhang B 1 notwendiger Stichprobenumfang Minimal Der minimal spielsweise PseudoStichproben B notwendige Stichprobenumfang aus Toleranzgrenzen bestimmt werden. welcher Grenzen ein bestimmter Anteil y der scheinlichkeit P = 1 a - P beispielsweise = in Sachs 0.95 und verschiedene Es handelt sich hierbei spielsweise etwa dem ist ein Wert, wo um aus Grundgesamtheit mit kann bei¬ an, innerhalb Toleranzgrenzen geben Toleranzgrenzen (1992). Die Abbildung vorgegebener Wahr¬ für gegebene yzeigt B.l und a-Werte finden für die Wahrscheinlichkeit y-Werte den minimal notwendigen Stichprobenumfang auf. verteilungsunabhängige Toleranzgrenzen. Stichprobenumfang eine zuverlässige Aussage mindestens erwartet werden kann. Tabellen für minimal not¬ wendige Stichprobenumfänge sich für eine von n = 46 Für y Dies notwendig. Vergrösserung des Stichprobenumfangs keine nahme der Wahrscheinlichkeit P mehr zur Folge = 0.90 bei¬ entspricht auch nennenswerte Zu¬ hat. Y 1.0 0.8 0.6 0.4 0.2 0.0 ) Abb. B. 1: B 2 Eine meln 40 60 100 80 n 0.05, damit der Anteil y der Elemente einer notwendiger Stichprobenumfang für a beliebigen Grundgesamtheit zwischen dem kleinsten und dem grössten Stichprobenwert liegt (Sachs, 1992) Minimal = Bestimmung Schätzung zur 20 eines eines PseudoStichprobenumfanges Pseudostichprobenumfangs Bestimmung eines minimal einer Information kann über die For¬ notwendigen Stichprobenumfangs für Toleranz¬ grenzen oder für Vertrauensbereiche vorgenommen werden. Dazu ist eine zusätzliche Schätzung über die Güte der Vorinformation notwendig. Formeln für die Normal Verteilung benutzt werden. Die Als Näherung können dabei die Toleranzgrenzen sind dann sym- \ Anhang B 110 metrisch Mittelwert und die Vertrauensbereiche zum symmetrisch zum ersten oder zwei¬ ten Moment. Die Anwendung allen 1 - als Schätzung der Güte einer Information ist bei Minimal- bzw. Maximalwerte wo beispielsweise geometrische Abmessungen. schreiben sich für eine Normalverteilungen grenzen für = Toleranzgrenzen Eigenschaften sinnvoll, Darunter fallen P von Die von Bedeutung sind. zweiseitigen vorgegebene Wahrscheinlichkeit a zu: P(m[x] kT sd[x] - < x < m[x] + (B.l) kT sd[x]) >y • Die Toleranzfaktoren kT können Tabellen entnommen werden (Sachs, 1992). B.l sowie die daraus generierte Funktion bildung für P = Toleranz¬ zeigen B.2 die Toleranzfaktoren 0.95 und y kT Stichprobenumfänge n in Ab¬ zugehörigen Stichprobenumfänge und die n 0.90. = kT 8.38 3.71 n 3 6 Tab. B.l: für verschiedene Die Tabelle 2.66 12 Toleranzfaktoren Grundgesamtheitfür P 2.00 = 1.77 1.87 50 30 100 Toleranzbereich zweiseitigen 0.95 und y = 2.14 24 den für 2.23 einer 300 normalverteilten 0.90 10 8 6 4 2 0 20 0 Abb. B.2: Grafische Darstellung den zweiseitigen der 40 aus 60 der Tabelle B.l 80 100 n generierten Funktion der Toleranzfaktoren für Toleranzbereich einer normalverteilten Grundgesamtheit für P = 0.95 und Y =0.90 Für die Schätzung eines Pseudostichprobenumfangs aus Toleranzgrenzen ist somit wie folgt vorzugehen: • Schätzung des kleinsten bzw. grössten Wertes, der mit grosser Wahrscheinlichkeit nicht unter- bzw. überschritten wird. Dieser Wert wird der unteren bzw. oberen Tole¬ ranzgrenze für • beispielsweise Die Differenz zwischen dem Standardabweichung P = 0.95 und y geschätzten 0.90 gleichgesetzt. Wert und dem Mittelwert wird durch die dividiert. Man erhält den Hilfe der Tabelle B.l oder der = Abbildung zugehörigen B.2 kann nun Toleranzfaktor der zugehörige kT. Mit minimale Anhang B 111 Stichprobenumfang herausgelesen werden. Dieser entspricht einem zweckmässigen PseudoStichprobenumfang. Die Benutzung von Vertrauensbereichen wird vorteilhafterweise dann fangs keine grosse zur Bestimmung angewendet, Bedeutung beigemessen wenn 1 = a - nauigkeiten n* überdeckt. Der a 1+0.5-1 dSd mit n> Stichprobenumfang vorgegebenen Wahrscheinlichkeit kann wie folgt den ersten beiden Momenten bestimmt werden zu Pseudostichprobenum¬ Minimal- bzw. Maximalwerten wird. Ein Vertrauensbereich ist ein Intervall, das den wahren, aber unbekannten Parameter mit einer P eines aus den geschätzten (Sachs, 1992): s2 t^ dsd (B.2) sd[x]-G = -(sd[x]r -r (B.3) m mit dm m[x]-n = za ist die Schranke der keit der Formeln Die Standardnormalverteilung, dsd entspricht Standardabweichung der absoluten und von der Verteilungstypen Benutzung Abbildung B.3 der Formel zeigt (B.2) den minimal 5 für verschiedene Genauig¬ des Mittelwertes. Die benutzt werden. Bei stark schiefen als Näherungen Verteilungen ist je¬ abzuraten. notwendigen Stichprobenumfang dem Vertrauensbereich für den Mittelwert für von der relativen Genauigkeit dm (B.2) und (B.3) sind für Normalverteilungen gültig. Sie können auch für andere doch Ge¬ a = 0.05 und eine bestimmt aus Standardabweichung Genauigkeiten. dm 10 8 6 4 2 1 () Abb. B.3: Minimal tesfür a 20 40 60 80 1()0 n notwendiger Stichprobenumfang basierend auf dem Vertrauensbereich des Mittelwer¬ 0.05 und für eine Standardabweichung von 5 = 112 In Anhang B Abbildung tive B.4 ist der minimal Genauigkeiten der notwendige Stichprobenumfang Standardabweichung für a = 0.05 für verschiedene rela¬ dargestellt. dsd 1.0 0.8 0.6 0.4 0.2 0.1 0 Abb. B.4: 40 20 60 notwendiger Stichprobenumfang 0.05 abweichungfur a Minimal 80 basierend 100 auf dem n Vertrauensbereich der Standard¬ = Die Bestimmung eines Pseudostichprobenumfangs kann ensbereichen • Schätzung der • durchgeführt von Vertrau¬ des Intervalls, in dem das betrachtete Moment liegen soll und Berechnung zugehörigen Genauigkeit. ensbereich umfang B 3 entspricht, beispielsweise das kann mit den Formeln geschätzte Intervall einem 95% Vertrau¬ (B.2) oder (B.3) der Pseudostichproben- bestimmt werden. Erzeugung von PseudoStichprobe, PseudoStichproben welche stammt, kann über deren inverse von einer bestimmten Verteilungsfunktion Fx(x) Verteilungsfunktion Fx (x) erzeugt ist eine Zufallszahl, d.h. eine Realisation Uj einer men. folgt mit Hilfe werden: Unter der Annahme, dass Eine wie Rechteckverteilung R(0;1) Per Definition befindet sich diese Zahl im Intervall [0, FTJ(u1) dieser Realisation ist für die werden. Zunächst Rechteckverteilung R(0;1) zu bestim¬ 1]. Der Funktionswert identisch mit der Reali¬ sation: FIJ(ui) = (B.4) u; Der Funktionswert FTJ(ui) wird nun dem Funktionswert Fx(Xj) gleichgesetzt. Über inverse Verteilungsfunktion Fx (x) lässt sich eine Realisation xi PseudoStichprobe berechnen (siehe auch Abbildung B.5): Xi = Dieses Fx1(FTJ(ui)) Vorgehen wird = Fx1^) entsprechend die bzw. ein Wert der (B.5) dem gewünschten PseudoStichprobenumfang wiederholt. Dabei ist jedesmal eine andere Zufallszahl zu benutzen. n-mal Anhang B 113 Zufallszahlen können Tabellenwerken entnommen fallsgenerator erzeugt formel xi + folgender Art: a-xj + c- = 1 werden. m ra Xj • k; = mod c und m (B.6) + c ganze Zahlen sind und man x4 durch m, +1 Beispiel in Rubinstein Johnson et al. (1994 a + b) und Startwert Xj. Benutzt so man die Barry (1996) man Verteilungsfunktion Normalverteilung, den Zufallszahlen der handlung eine Zufallszahl im Intervall Generierung Generierung von von Zufallszah¬ PseudoStichproben kön¬ Law und Kelton von den Konstanten a, für die Generierung c und m und mehrerer Pseudostich- spricht man nicht auch von Pseudozufallszahlen. analytisch bestimmbar ist wie etwa im Fall Rechteckverteilung R(0;1) Ang und Tang (1984) und in Law und Kelton 1" ui / 1 , Abb. B. 5: Ui Beziehung zwischen einer 0 Zufallszahl aus bestimmen. Eine ausführliche Be¬ Fu(u) Fx(x) 1 vom werden Formeln benützt, welche die Realisationen direkt so dieser Fälle findet sich in u (1991), Zufallsgeneratoren produzieren tatsächlich keine wirkli¬ chen Zufallszahlen. Aus diesem Grund Falls die inverse zur des Klammern¬ entnommen werden. abhängig gleichen Werte sind diese identisch. ganzzahlige Rest (1981), Farebrother (1988), Die erwähnte Rekursionsformel ist der der Es existieren noch andere Rekursionsformeln zum proben, kj erhält so len. Diese und weitere Informationen über die nen auf einer Rekursions¬ k; • positive ausdrucks. Dividiert [0, 1]. Zufallsgeneratoren basieren meist einen Zu¬ m V wobei a, (Sachs, 1992) oder durch t X xi und einer Realisation einer Verteilungsfunktion (1991). 114 C Anhang In diesem Herleitung sind die Anhang Herleitung von Formeln der wesentlichsten Formeln der nearen Bayes'schen Regressionsmethode dargestellt. C 1 Bestimmung Die Bestimmung der der Verteilungsfunktion Verteilungsfunktion asymptotische Formeln über die empirischen li¬ der Koeffizienten (t|., x.) der Koeffizienten (fj., x.) erfolgt mit Hilfe der Rangstatistikkombinationen Normalität linearer von Stigler (Serfling, 1980). sei eine Gegeben bezeichnet. Die Xj's f(x)dx. funktion Stichprobe sind Nach mit den Werten Xj. Die unabhängig Stigler folgt geordneten voneinander und gleich Werte werden mit verteilt mit der eine lineare Kombination einer X(i:n) Verteilungs¬ Rangstatistik in der Form ;È<ï7ï)-xm (C1) i= 1 asymptotisch f N V CT der Normalverteilung 2\ nJ mit ix = jj(t) - F *(t)dt o oo G2 = f J oo = IC2(x;F) f(x)dx (C.2) oo J Jj(F(x))-J(F(y))-(F(min(x,y))-F(x)-F(x))dxdy —oo—oo CO wobei IC(x;F) = J (F(y) - l[x<y]) J(F(y))dy 116 Anhang C IC(x;F) renz ist die sogenannte "influence curve". Sie zwischen der linearen Kombination der Gegenstück \i gibt eine Approximation Rangstatistik (C.l) für die Diffe¬ und dem theoretischen (C.2). aus iij(^)-x<)-Jj(t)'irl(t)dt8,n- iTC(x*;F) Aus i=i o Gleichung (C.3) folgt die Betrachtet steht die man nun verteilt mit der genäherte das lineare Stichprobe Varianz aus Regressionsmodell den Werten Uj. Diese sind aus (C.2). im Wahrscheinlichkeitspapier, Quadrate für die voneinander und unabhängig Verteilungsfunktion F0((u-T|)/t). Die Methode der kleinsten (C3) i=l Abweichungen lineare in Regression so be¬ gleich mittels der u-Richtung ergibt folgende Schätzwerte: ^ S((U(i:n)-^]){Fö1(nTT)-m[F^] i X = l = i r\ m[u] spiel gilt F0 = (C4) n 1 = F0 entspricht der F0 i mlul-T-mITÖ1] = mit tion = ~ i = 1 i = i n 1 J u(i:n) • = - • X ui i= 1 Ordinatentransformationsfunktion. Bei einem <D ein und setzt . Führt man V als Zufallsvariable mit Normalpapier zum Bei¬ zugehöriger Verteilungsfunk¬ man l m[F£]«Jltf(t)dt = 0 i = Jx-f0(x)dx -oo 1 i 1 = jfF^O-ErV]) 0 so lässt sich E[V] = 2 = 1 °° dt = J(x-E[V])2-f0(x)dx —oo x in die Form (C.l) umschreiben: = var[V] 117 Anhang C i 1 1 var[V] V mit Unter A l J n+U 1 = 1 ^-K var[V] IC(u;;F) = F(y) = von i (C.3) ergibt sich somit: = Umformungen <^) =ri + (C.8) T-Fö1(t) werden: jfFÖ^O-EtV^dt x-jfFÖ^O-EtV^-FÖ^Odt + Tl 0 0 = O + x-jfe^tJ-EtVlV^COdt V = = \2 T-J^to-ErVlJ T-]fa\t)-E[V]\ V + T-E[V]^Fö\t)-E[V]Jdt dt + 0 oo x- J(u-E[V])2-f0(u)du —oo = x var[V] A dt o = (C.7) 1 können mit den folgt umgewandelt = E[V] F~1(t)-E[V] J(t) F_1(t) 1 F°Vn+l ^VÏIC(ui;F) 1 \i und (C6) Z[U(i:n)-\n+1 Berücksichtigung %~ wie i = (C.9) 118 Anhang C CO IC(Ui;F) j(Fo(^-l[x<y] ]-f^-E[V]]dy = f x- = Fn(z)-1 (z-E[V])dz (CIO) 1 _ ffX-M . U 2 Die (CIO) ^ rrui nl x i x~x + - i E[V] x sowie "n (C.4) E[V] 1 = -var[V] nach der Methode der kleinsten Schätzungen mit (C.7), (C.9), UzfYE-WI.r^-Brvi J ffo(z) x = Quadrate ergeben sich schlussendlich zu: -var[V] L ) •- y —= 2-var[V] (C.ll) i Mit den = 1 i = 1 Umformungen E[U] = r|+xE[V] var[U] = x lässt sich (C.12) 2 nun var[V] • (C.ll) umschreiben zu: ^T+^X((ui-E[U])2-var[u])i = 2 var[U] l (C.13) ^r1 + x-E[V] 1 i.X(ui-E[U])-^^.^[K-E[U]r-var[U] i Damit sind die = 1 i= 1 Schätzungen (TT.,X)|(T1,X) ( = der Koeffizienten näherungs weise normalverteilt: 2 Nf(Tl,X),^-G (C.14) 119 Anhang C Die Kovarianzmatrix G schreibt sich (E[V])2 var[(U-E[U])2] var[U] Sil 24' _ E[(U-E[U])3] 1 g2i - §22 E[(U-E[U])3] var[U] var[(U-E[U])2] E[V] (C.15) - 2 • var[U] x 1 var[(U-E[U]) ] 4 (var[U])2 = E[V] (var[U])' ^ x §12 zu: (var[U])' Mit der Transformation V U-T1 _ (C.16) = können die Momente E[U] = ri + von U wie folgt ersetzt werden: xE[V] E[(U-E[U])k] (C.17) xk-E[(V-E[V])k] = Somit schreiben sich die Elemente der Kovarianzmatrix G (E[V]) gu = var[V] -var • §22 = §21 var C 2 2 • 3' E[V] var[V] • var (V-E[V])2] (C.18) 4-(var[V])' (v-E[vir 4-(var[V])' Bestimmung der Kovarianzmatrix L der Die Kovarianzmatrix Lvon L var[V] (var[V]) (V-E[V]) §12 E[V]E (V-E[V])- + 4 = (V-E[V]r zu: var[T|j] = cvtrijXj] (r|j, X:) schreibt sich cvfTijXj] *11 ^12 var[Xj] hi hi den Momenten der (C19) geschätzten Koeffizienten (îï.,x.)bestimmt.DieErwartungswerte aus zu: (rj.,x.)bestimmt.DieErwartungswerte Die einzelnen Elemente werden Koeffizientenschätzungen diedieser Momente können unter von (C. 14) wie folgt umgewandelt werden: Berücksichtigung Anhang C 120 E[tÎj] E^EtTij^Xj]] E[Tij] E^EtXjl^Xj]] E[Xj] £^[^1^, tj)]] = = E[Xj] = = ^[rij] = = ^-•§irE['cj2] = + E[x] EtT^O^, Xj)] + var = E[ti] 1ii j ^-g11{(E[x])2 l22) + = (C.20) l11 analog und var[Xj] cv[l¥j] Die + = - |^(E[x]) g22 • ~-§i2-f(EN)2 = + 122J +122 + 122 empirischen Momente der Koeffizienten schreiben i[îll m = sich zu: Jîlj jj i = J 1 m j var[T|] = i = 2^(Tij-m[ri]) —-• j var[x] = j—- = nur zwei = i ^(Tjj-mtTÎ])-^-!!!^]) —-• j Sind (C.21) i £ (Xj -m[x]) • j CV[t\t] = = i Stichproben vorhanden, so können die Varianzen auch wie folgt bestimmt werden: A var[f|] A Üli-Tte) 2 = (C.22) var[x] (X!-X2)' = 121 Anhang C cv[t]x] wird Die Kovarianz in diesem Fall (siehe Kapitel 6.2.1, nicht positiv definit ist Seite gesetzt, da die Kovarianzmatrix Null gleich 65). Es ergibt sich somit eine Diagonal¬ matrix für die Kovarianzmatrix. Erwartungswerte der empirischen Als nächstes sind die A wird die Formel für var[ri] = — wie var[r|] zu bestimmen. Dazu folgt umgeformt: ]T (Tij-mtT]]) • j = i J 1 = Momente A jTT' j \7 f Z[(nj-E[Ti])-(n\[Ti]-E[Ti])J = l J = É(VEfr])2-r7-(m[îi]-E[ii])2 rr J_i j j = = l -J-(JTT) Der Erwartungswert E[var[TÎ]] Analog ergeben E[var[x]] E[x] = (%-Eh]) • + ((E[x])2 122) + gu • y nun zu: ± £ • j = (C.24) j l = 122 + g22 112 + g12 ((E[x])2 +122) j • • • I £ • j = i j (C.25) [(E[x])2 122]|X^ + j = i der Koeffizienten können direkt j aus (C.20) gefolgert werden: E["mtf]] 1 = S((^-E[T1]) dieser Varianz berechnet sich Erwartungswerte E[T|] ' sich für die anderen Momente: = e[cv[t^x]] Die ln = (C.23) i J E^m[x]J (C.26) Anhang C 122 L noch ein Schliesslich wird für erwartungstreue Schätzungen der Kovarianzmatrix Schätzer von (E[x]) benötigt. Dieser schreibt sich zu: er¬ wartungstreuer - V"1 (C.27) xt* £f (J-l) Die A "A 1 r'2-, Schätzung der Kovarianzmatrix L = A A 111 ll2 ergibt L sich somit zu: (C.28) A l22_ mit - ~ var[x] - J-t \ 1 r*2, m[x ] • g22 • - • j I22 = lu = var[T|] --2-, - (m[x ] +122) 1 - -*—' J = n; J i ^ 1 gn • j I12 = l2i = cv[rix] = (m[x ] +122) - J 1 xL. 1 "2, - (C.29) 1 Y - • g12 1 Y 7 j = 1 - J Literaturverzeichnis Ang, A.H-S. und and Design. W.H. Tang, (1984) : "Probability Concepts in Engineering Planning Reliability", John Wiley & Sons Volume II: Decisions, Risk, and Bachmann, H. (1995) : "Erdbebensicherung Bauwerken", Birkhäuser Verlag (1996 a) : "Structural Reliability and its Application in Structural Codes. Applications: Use of Test Data in Design and Assessment", IABSE Collo¬ M.J. Baker, Further quium on Basis and Actions Baker, M.J. (1996 b) Background Actions on Notes : on Structures, Associated Short Course, Delft "Structural on Reliability and its Application in Structural Codes. Probability and Statistics", IABSE Colloquium on Basis and Structures, Associated Short Course, Delft Barends, F.B.J. (1992) : of Stress-Wave "Application the Fourth International Conference les, S. 657 - on "Recommendations : Testing and Use of Pseudo-Random Analysis for Risk Assessment", Risk Anal¬ on Number Generators Used in Monte Carlo ysis, Theory to Piles", Proceedings of Application of Stress-Wave Theory to Pi¬ the 663, A. A. Balkema (1996) T.M. Barry, the Vol. 16, No. l.S.93-105 Benjamin, J.R. und Cornell, C.A. (1970) vil Engineers", McGraw-Hill J.O. (1980) : "Statistical thods", Springer Verlag Berger, Bernardo, J.M. und Blaszczak, M. Bothe, von H. Bramer, B. und "Probability, Statistics, Decision Smith, A.F.M. (1994) (1997) (1993) : Theory : - Foundations, Concepts and Me¬ "Bayesian Theory", "Professional MFC with Visual : Bramer, S. (1996) L.D. B.P. und (1985) "C++ for : : "Bayesian Analysis Louis, T.L. (1996) Analysis", Chapman Castillo, E. (1988) CCPS (1989) : : Engineers", & Sons Arnold von Kobe: Versuch, Irrtum, Er¬ of Linear Models", Marcel Dekker : and "Bayes H. (1995) Empirical Bayes "Extreme Value Safety of the Theory in Engineering", R.B. und "Taschenbuch Methods for Data Quantitative Academic Press Risk American Institute of Chemical Analysis", Engineers Crowder, M.J.; Kimber, A.C.; Smith, R.L.; Sweeting, T.J. (1991) lysis of Reliability Data", Chapman & Hall stics: textbooks and : & Hall "Guidlines for Chemical Process Chemical Process D'Agostino, Wiley C++5", Wrox Press Bronstein, I.N.; Semendjajew, K.A.; Musiol, G.; Mühlig, der Mathematik", 2. Auflage, Verlag Harri Deutsch Carlin, John "Fuzzy Logic", Springer Verlag : Brauner, Ch. und Stanley, C. (1995) : "Das Erdbeben folg", Schweizer Rück, AP/PM 3000d 5/95 Broemeling, and Decision for Ci¬ Stephens, M.A. monographs, (1986) : "Goodness-Of-Fit Vol. 68, Marcel Dekker : Center for "Statistical Ana¬ Techniques", Stati¬ Literaturverzeichnis 124 Dale, A.I. (1991) : "A History of Pearson", Springer Verlag Probability. Inverse From Thomas Bayes to Karl Corso, R.; Gränzel, M.; Gulvanessian, H.; Raoul, J.; Sandvik, R.; Sanpaolesi, L.; Stiefel, U. (1995) : "New European Code for Snow Loads", Background Docu¬ Del ment, Proceedings Ditlevsen, O. und Ditlevsen, O. (1994) Safety of Pisa, No. 264 Madsen, H.O. (1989) : "Proposal for a code for the direct use of reli¬ in structural design", Working Document, Joint Committee on Struc¬ ability methods tural Safety, IABSE, & Department Structrual Engineering, University of Zürich "Distribution Arbitrariness in Structural : of ICOSSAR Reliability, Proceedings Structural Reliability", '93, Vol. 2, S. 1241 - 1247, A. A. Balkema ECCS tee (European on Convention for Constructural Steelwork) / JCSS (Joint Commit¬ Safety) Project Team Eurocode 1.1 (1996) : "Background Docu¬ 1991), Part 1: Basis of Design", Working Document No. Structural mentation Eurocode 1 (ENV 94, First Edition Farebrother, R.W. (1988) and : "Linear least squares Vol. 91, Marcel Dekker monographs, Gillies, D.A. (1987) "Was : Bayes a Bayesian?", Heimann, F. und Turianskyj, N. (1997) dows-Programmierung Henning, H.-J. Statistics: textbooks computations", und mit der "Visual C++ 5.0: : MFC", Addison Wartmann, R. (1958) Stichprobenumfang lichkeitsnetz: Kleiner Historia Mathematica 14, S. 325 346 in die Win¬ Wesley "Statistische : Einführung - Auswertung im Wahrschein¬ und Zufallsstreubereich", Zeitschrift für die gesamte Textilindustrie Nr. 60, Januar 1958, S. 19 - 24 Johnson, N.L.; Kotz, S.; Balakrishnan, N. (1994 a) : "Continuous Univariate Distribu¬ tions", Vol. 1, Second Edition, John Wiley & Sons Johnson, N.L.; Kotz, S.; Balakrishnan, N. (1994 b) : tions", Vol. 2, Second Edition, John Wiley & Sons Kececioglu, Kimball, (1991) D. B.F. (1960) "Reliability Engineering Handbook", : "On the Choice of Plotting Positions : nal of the American Statistical Kinnison, R.R. (1985) Kleiter, G.D. (1980) Association, Statistik - Vol. Value "Applied Extreme : "Bayes : "Continuous Univariate Distribu¬ 55, Vol. 1, Prentice Hall on S. 546 - Probability Paper", Statistics", Battelle Press Grundlagen und Anwendungen", de Gruyter Königer, (1980) Anpassung Wahrscheinlichkeitsverteilungen spiel der Extremal-I-Verteilung", Wasserwirtschaft 70, S. 10 13 W. "Die : Jour¬ 560 von am Bei¬ - Kroon, LB. (1994) "Decision Theory applied to Structural Engineering Problems", InBygningsteknik, Dept. of Building Technology and Structural Enginee¬ ring, Aalborg Universitet Danmark, Structural Reliability Theory Paper No. 132 : stituttet for Künsch, H.R. (1997) Arbeitsdokumente, unveröffentlicht : Lind, N.C. und Chen, X. (1987) Reliability Analysis", Sturctural : "Consistent Distribution Parameter Estimation for Safety Law, A.M. und Kelton, W.D. (1991) tion, McGraw-Hill Madansky, A. (1988) : "Prescriptions : 4 , "Simulation for Modeling & Analysis", Second Edi¬ Working Statisticians", Springer Verlag Marinell, G. und Steckel-Berger, G. (1995) denbourg Verlag S. 141 -149 : "Einführung in die Bayes-Statistik", Ol¬ Literaturverzeichnis Martinec, J. (1975) 125 "Periodizität der Schneelasten in der Schweiz", : Institut für Schnee- und Martz, H.F. und Waller, R.A. (1982) : Eidgenössisches Interner Bericht Nr. 545 Lawinenforschung, "Bayesian Reliability Analysis", John Wiley & Sons Miller, L; Freund, J.E.; Johnson, R.A. (1990) neers", Fourth Edition, Prentice Hall : "Probability (1993) : "What Every Engineer Should Analysis", Marcel Dekker M. Modarres, Risk and Statistics for Know About Engi¬ Reliability And Naylor, J.C. und Smith, A.F.M. (1982) : "Applications of a Method for the Efficient Computation of Posterior Distributions", Journal of Applied Statistics, Vol. 31, No. 3, S. 214 - 225 Nelson, W. (1982) O'Hagan, A. : "Applied (1994) : Life Data Analysis", "Bayesian Inference", John Wiley & Sons Kendall's Advanced Theory of Statistics, Vol. 2B, Halsted Press Plate, E.J. (1993) : "Statistik nieure", Ernst & Sohn RCP und angewandte Wahrscheinlichkeitslehre (1995) : "STATREL Statistical Analysis of Programm STATREL, RCP GmbH, Deutschland - Rubinstein, R.Y. (1981) Data for "Simulation and the Monte Carlo : Reliability", für Bauinge¬ Manual zum Method", John Wiley & Sons Rüttener, E. (1995) : "Earthquake Hazard Evaluation for Switzerland", Dissertation 11048, ETH Zürich Sachs, L. (1992) : "Angewandte Statistik"; 7. No. Auflage, Springer Verlag Salzer, H.E.; Zucker, R.; Capuano, (1952) : "Table of the Zeros and Weight Factors of the First Twenty Hermite Polynomials", Journal of Research of the National Bu¬ R. reau SBB of Standards, Vol. 48, No. 2 (1992) "Richtlinie für die : Beurteilung von genieteten Eisenbahnbrücken", Wei¬ sungen der Schweizerischen Bundesbahnen Schaefer, R.E. (1976) : "Probabilistische Informationsverarbeitung", Verlag Hans Hu¬ ber Schneider, J. (1996) : "Sicherheit und : "Approximation Zuverlässigkeit im Bauwesen", 2. Auflage, vdf - B.B. Teubner Serfling, R.J. (1980) ley & Sons SIA 160 (1989) : "Einwirkungen chitekten-Verein, auf Theorems of Mathematical Tragwerke", S. und Schweizerischer Ingenieur- und Ar¬ Zürich Siegel, S. (1976) : "Nichtparametrische Psychologie Verlagsabteilung Siegel, Statistics", John Wi¬ Castellan, N.J. (1988) : Statistische Methoden", Fachbuchhandlung für "Nonparametric Statistics for the Behavioral Sci¬ ences", 2. Auflage, McGraw-Hill Silverman, man B.W. (1986) Spaethe, G. (1992) ger-Verlag Stahel, : "Density Estimation for Statistics and Data Analysis", Chap¬ & Hall W. (1995) : : "Die Sicherheit "Statistische tragender Baukonstruktionen", Datenanalyse", Verlag Vieweg 2. & Sohn Auflage, Sprin¬ Literaturverzeichnis 126 Tanner, P. und Rui-Wamba, J. (1994) : Functionality A Case Study", Design, Proceedings of the Centenary Year "Strength and - Bridge Assessment Management and Bridge Conference, Cardiff UK, S. 429- 434, Elsevier van Gelder, P.H.A.J.M. und Lungu, D. (1997) : "A New Statistical Model for Vrancea Earthquakes using Prior Information from Earthquakes before 1990", Advances in Safety and Reliability, Proceedings of the ESREL '97, Lisbon 1997, S. 1535 1542, - Pergamon - Elsevier Vrouwenvelder, A. und Siemes, A. (1987) : "Probabilistic calibration procedure for the partial safety factors for the Netherlands building codes", HERON, Stevin-Laboratory of the faculty of Civil Engineering, Delft Universi¬ ty of Technology, Delft NL Vrouwenvelder, A. (1992) : "Effects of Inspection on the Reliability of Foundation Pi¬ derivation of Vol. 32, No. 4, les", Proceeding of the Fourth International Conference on the Application of StressWave Theory to Piles, The Hague 1992, S. 657 663, A.A. Balkema - Wickmann, D. (1990) : "Bayes-Statistik. Einsicht gewinnen und entscheiden bei Unsi¬ cherheit", B.L Wissenschaftsverlag Wilrich, P.-Th. und Henning, H.-J. (1987) : "Formeln und Tabellen der angewandten mathematischen Statistik", Springer Verlag Winkler, R.L. (1967) : "The Assessment of Prior Distributions in Bayesian Analysis", Journal of the American Statistical Association, Vol. 62, No. 319, S. 776 - 800 Curriculum Vitae zur Person Alex Peter Scheiwiller geboren von 1979 1982 - - - von - Max und Klara 79 Primarschule Gossau SG 82 Sekundärschule Gossau SG 86 Kantonsschule St. Gallen Maturität 1987 10.8.1966 in St. Gallen Waldkirch SG als Sohn 1973 am 92 Studium Typus an der Scheiwiller, geborene Haering C Abteilung für Bauingenieurwesen der Eidgenössischen Technischen Hochschule Zürich Dipl. Bau-Ing. 1992 - 99 ETH Assistent, Doktorand am Lehrstuhl von Prof. Dr. h.c. Jörg Schneider des Instituts für Baustatik und Konstruktion der ETH Zürich Zusatzausbildung 1994 Nachdiplomkurs in "Sécurité et Fiabilité des der ETH Lausanne Systèmes Techniques" an