Grundbegriffe der Wahrscheinlichkeitstheorie Prof. Sabine Attinger Jun. Prof. Anke Hildebrandt 03.05.2011 Geostatistik Beschreibende Statistik Lagemaße: 1. MMMMMMMMMM: 2. MMMMMM=M.M MMMMMMMMM 03.05.2011 1 n µ = x = ∑ xi n i =1 Geostatistik Beschreibende Statistik Streumaße: MMMMMMMMMM: V = ( xmax − xmin ) 2. MMMMMMM: 1 n 2 σ = ∑ ( xi − x ) n i =1 3. MMMMMMMMMMMMMMMMMM σ = σ2 4. MMMMMMMMMMMMMMMMMMMMM: 1. 2 03.05.2011 CV = Geostatistik σ µ s = s2 CV = s x Beschreibende Statistik Schiefe: g= 03.05.2011 3 1 n ∑ ( x − xi ) n −1i =1 s3 Geostatistik Statistik • Beschreibende Statistik – Stichproben/Ereignisse – Grundgesamtheit – Grafische Darstellung, Maße, Perzentile • Schließende Statistik: – Wahrscheinlichkeit – Zufallsvariable – Spezielle Verteilungen 03.05.2011 Geostatistik Grundbegriffe der Wahrscheinlichkeitstheorie 2. Terminologie Def. 2.1: Elementarereignis/Ergebnis =das Result eines Experiments. Wenn zum Beispiel das Experiment das Werfen eines Würfels darstellt, das ist das Ergebnis die Augenzahl, F1,........,F6 Def. 2.2: Zufallsexperiment =ein Experiment, dessen Ausgang vorher nicht bekannt ist. Def. 2.3: Zufallsereignis ist das Ergebnis eines Zufallsexperiments oder mehrerer Experimente, die eine gleiche Eigenschaft haben, z.B. die Augenzahl ' F1 ' or 'gerade Augenzahl (F2,F4,F6). ' Die Ereignisse werden mit A, B or A1, A2⋅ ⋅ ⋅ ⋅bezeichnet. 03.05.2011 Geostatistik Wahrscheinlichkeitsraum Def. 2.4: Ereignisraum Ist eine mathematische Abstraktion und repräsentiert alle möglichen Ereignisse eines Experiments. Wir bezeichnen diese Menge mit S ={…}. Def. 2.5: Disjunkte Ereignisse Zwei Ereignisse sind disjunkt, wenn sie keine gemeinsamen Elementarereignisse haben. 03.05.2011 Geostatistik Beispiel 03.05.2011 Geostatistik Zufallsvariable Def. 2.13: Zufallsvariable Wir führen dafür eine Funktion X ein, dessen Definitionsbereich der Ereignisraum eines Zufallsexperiments ist und dessen Wertebereich die reellen Zahlen sind; das heißt wirsiordnen jedem Ereignis ∈S eine reelle ). si ∈ SZahl zu, X( Beispiel: Werfen zweier Würfel und Summe der gesamten Augenzahlen. 03.05.2011 Geostatistik Grundbegriffe Beispiele: Eigenschaften von P für unsere Würfelexperimente Was ist die Wahrscheinlichkeit, daß die Gesamtaugenzahl beim Werfen zweier Würfel kleiner als 4 ist? Was ist die Wahrscheinlichkeit, daß die Gesamtaugenzahl beim Werfen zweier Würfel größer gleich 4 ist? Was ist die Wahrscheinlichkeit, daß die Gesamtaugenzahl beim Werfen zweier Würfel kleiner als 5 ist? Ist es wahrscheinlicher mit zwei Würfeln die Kombination 3,4 oder ein 4-er Pasch zu würfeln? 03.05.2011 Geostatistik Grundbegriffe Lösungsvorbereitung – „Ereignisraum“: Menge aller Elementarereignisse Ω = {(1,1), (1, 2), … (6, 5), (6, 6)} – „Zufallsvariable“: Ergebnis eines Zufallsexperiments (z.B. „Summe Augenzahl zweier Würfel“) – „Ereignis“: beliebige Teilmengen des Ereignisraums (z.B. „Augenzahl < 4“: A = {(1,1), (1,2), (2,1)} ) – „Wahrscheinlichkeit“: W ( X = a) = Anzahl der günstigen Fälle Anzahl der möglichen Fälle W: P(Ω) -> [0, 1], 03.05.2011 Geostatistik Wahrscheinlichkeit Wahrscheinlichkeit eines Ereignisses Die Wahrscheinlichkeit kann auf verschiedene Arten definiert werden. Def. 4.11: Die Definition über die Relative Häufigkeit: Wir wiederholen ein Zufallsexperiment n mal. Falls das Ereignis A nA mal vorkommt, dann ist die Wahrscheinlichkeit von A, definiert als P(A), gegeben durch nA P( A) n → →∞ n Für kleine Wiederholungszahlen n , ist es wahrscheinlich, daß nA stark fluktuiert. Wenn n größer und größer wird, dann tendiert nA gegen einen Grenzwert. 03.05.2011 Geostatistik Wahrscheinlichkeit Def. 4.12: Die klassische Definition: In der klassische Definition wird die Wahrscheinlichkeit nicht durch Experimente festgelegt, sondern durch Auszählen aller prinzipiell möglichen Ereignisse eines Experiments. Jedes Ereignis besitzt die gleiche Wahrscheinlichkeit. 03.05.2011 Geostatistik Wahrscheinlichkeit Ein Wahrscheinlichkeitsmaß muß bestimmte Eigenschaften besitzen: P1) P(A) ≥ 0 P2) P (S ) = 1 P3) A geschnitten B = 0 , then P(A +B) = P(A) +P(B) 03.05.2011 Geostatistik Wahrscheinlichkeit • Relative Häufigkeit gegen die Gesamtaugenzahl M(M) fX 6 5 4 3 2 1 36 36 36 36 36 36 M 03.05.2011 M M M M M M M Geostatistik MM MM MM MMMMMMMMMMMMMMM Wahrscheinlichkeit Verteilungsfunktion F(x): = die Wahrscheinlichkeit einer Zufallsvariable kleiner oder gleich als x zu sein Wahrscheinlichkeitsdichte f(x) für diskrete Zufallsvariablen =Wahrscheinlichkeit, exakt x_i anzunehmen 03.05.2011 Geostatistik Wahrscheinlichkeit Wahrscheinlichkeitsdichte f(x) (kontinuierliche Variablen): ∞ ∫ f ( x) = 1 −∞ 03.05.2011 Geostatistik Wahrscheinlichkeit • Wahrscheinlichkeitsdichte f(x) (kontinuierlich): ∞ ∫ f ( x) = 1 −∞ • Verteilungsfunktion F(x): x F ( x) = ∫ f ( x) −∞ 03.05.2011 Geostatistik Maße • Mittelwert N E( X ) = µ = E ( X ) = µ = ∑ xi ⋅ f ( xi ) i =1 ∫ x ⋅ f ( x) dx −∞ MMMMMMMM 03.05.2011 +∞ MMMMMMMMMM Geostatistik Maße • Mittelwert N E( X ) = µ = E ( X ) = µ = ∑ xi ⋅ f ( xi ) i =1 +∞ ∫ x ⋅ f ( x) dx −∞ • Varianz N Var ( X ) = σ = ∑ ( xi − µ ) ⋅ f ( xi ) 2 2 i =1 +∞ 2 ( ) x − µ ⋅ f ( x) ∫ −∞ MMMMMMM 03.05.2011 Var ( X ) = σ = 2 MMMMMMMMMMMMMM Geostatistik Perzentil Definition: Das α -Quantil Qα ist definiert als der Wert, bei dem der α te-Teil der Daten kleiner ist and 1- α . Qα te-Teil größer ist als P( X < Qα ) = α Die Definition für das Perzentil ist ähnlich, nur ein Prozenten ausgedrückt. Qα = P100α % 03.05.2011 Geostatistik Perzentil p – Perzentil (- Quantil) M.MM – MMMMMMMMM M.MM – MMMMMMMMM (MMMMM MMMMMMMM) M.MM – MMMMMMMMM (MMMMMM) M.MM – MMMMMMMMM (MMMMM MMMMMMMM) M.MM – MMMMMMMMM 03.05.2011 Geostatistik Box-Whisker-Plot 03.05.2011 Geostatistik Spezielle Verteilungen/ Wahrscheinlichkeitsdichten • • • • Bernoulli Poisson Verteilung Normal Verteilung Log-Normal Verteilung 03.05.2011 Geostatistik Bernoulli Distribution Wenn die Ergebnisse eines Zufallsexperiments in zwei Ereignisse A und B zusammengefasst werden können, gilt für die Wahrscheinlichkeit der Ereignisse P(A=1)=p P(B=0)=q=1-p diese Verteilung heißt Bernoulli Verteilung, nach dem Schweizer Jacob Bernoulli. Es ist eine diskrete Verteilung, die den Wert 1 mit der Wahrscheinlichkeit p und den Wert 0 mit der Wahrscheinlichkeit q = 1 − p annimmt. 03.05.2011 Geostatistik Poisson Distribution • Die Poisson Verteilung ist eine diskrete Verteilung die die Wahrscheinlichkeit seltener Ereignisse beschreibt. Die Verteilung wurde von Siméon Denis Poisson (1781–1840) eingeführt. • Wenn die erwartete Anzahl von Ereignissen in einem Intervall gleich λ ist, dann ist die Wahrscheinlichkeit, daß es genau k Ereignisse gibt P( X = k ) = λk e − λ k! λk e −λ E( X ) = ∑ k =λ k! Var ( X ) = ∑ (k − E ( X ) ) 2 03.05.2011 Geostatistik λk e −λ k! =λ Normal Verteilung Die Normal- oder Gauß-Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ stetiger Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß-Funktion, Gauß-Kurve, Gauß-Glocke, Gaußsche Glockenkurve oder schlicht Glockenkurve genannt. f ( x) = 03.05.2011 Geostatistik 1 ⋅e σ 2π 1 x−µ − 2 σ 2 Normalverteilung Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz, der besagt, dass eine Summe von n unabhängigen, identisch verteilten Zufallsvariablen im Grenzwert normalverteilt ist. Das bedeutet, dass man Zufallsvariablen dann als normalverteilt ansehen kann, wenn sie durch Überlagerung einer großen Zahl von unabhängigen Einflüssen entstehen, wobei jede einzelne Einflussgröße einen im Verhältnis zur Gesamtsumme unbedeutenden Beitrag liefert. Zufallsgrößen mit Normalverteilung benutzt man zur Beschreibung zufälliger Vorgänge wie: • zufällige Messfehler, • zufällige Abweichungen vom Nennmaß bei der Fertigung von Werkstücken, • Beschreibung der brownschen Molekularbewegung. 03.05.2011 Geostatistik Normal Verteilung Wahrscheinlichkeitsdichte Verteilungsfunktion 03.05.2011 Geostatistik Normal Verteilung 03.05.2011 Geostatistik Lognormal Verteilung Die Lognormalverteilung ist eine Verteilung, die sich ergibt, wenn man normalverteilte logarithmierte Werte zugrunde legt. 03.05.2011 Geostatistik Lognormal Verteilung 03.05.2011 Geostatistik 03.05.2011 Geostatistik Übung 1 Zeichnen Sie einen Box-Whisker-Plot! 03.05.2011 Geostatistik Übung 2 • Bitte berechnen Sie den Mittelwert und die Varianz der Bernoulli-Verteilung! 03.05.2011 Geostatistik Bernoulli Verteilung 03.05.2011 Geostatistik Übung 3 In Japan, gibt es im Jahresmittel 50 Erdbeben. Wie hoch ist die Wahrscheinlichkeit, daß sich im nächsten Monat 3 Erdbeben ereignen, wenn man annimmt, daß die Erbeben einer Poisson Verteilung folgen? 03.05.2011 Geostatistik Poisson Verteilung 03.05.2011 Geostatistik Poisson Verteilung 03.05.2011 Geostatistik