Wahrscheinlichkeitsverteilungen • Statistische Modellierung des Messvorganges • Wahrscheinlichkeitstheorie • Verteilungen von Zufallsgrößen • Wichtige Wahrscheinlichkeitsverteilungen • Zentraler Grenzwertsatz • Unscharfe Zahlen Ausgleichungsrechnung I Gerhard Navratil Messung zufällig beeinflusst Messung ist nicht genau vorhersagbar (deterministisch) sondern zufällig Einflüsse: Aufstellung, Atmosphäre, Auflösung im Gerät etc. Abweichungen folgen stochastischen Gesetzen Modellierung über zufällige Versuche Ausgleichungsrechnung I Gerhard Navratil Zufälliger Versuch • Beliebig oft wiederholbar • Ausgang innerhalb einer Menge an möglichen Ausgängen ungewiss • Beispiele: Werfen einer Münze, Würfeln, Ziehen aus einer Urne • Ergebnis eines zufälligen Versuches: Zufallsereignis E • Zufallsereignis liefert Stichprobe aus Grundgesamtheit (alle möglichen Ergebnisse) Ausgleichungsrechnung I Gerhard Navratil Zufallsgrößen und ihre Realisierung • Zufallsgröße: (veränderliche) Größe, die man beim zufälligen Versuch untersucht – z.B. Augenzahl beim Würfeln • Realisierung: Wert, den die Zufallsgröße nach einem einzelnen Experiment annimmt • Messgröße: Zufallsgröße, die über eine Messung ermittelt wird • Messwert: Realisierung einer Messgröße Ausgleichungsrechnung I Gerhard Navratil Diskret vs. stetig • diskrete Zufallsgröße: Kann endlich viele oder abzählbar-unendlich viele Werte annehmen • stetige (kontinuierliche) Zufallsgröße: Physikalische Messgrößen (obwohl Messgeräte diskrete Ergebnisse liefern) Ausgleichungsrechnung I Gerhard Navratil Wahrscheinlichkeit (1) Relative Häufigkeit bei unendlicher Anzahl von Versuchen k P( E ) lim n n P(E): Wahrscheinlichkeit dafür, dass E eintritt Dem Gesetz der großen Zahlen folgend konvergiert die relative Häufigkeit gegen die Wahrscheinlichkeit (Richard von Mises) Wir können die Wahrscheinlichkeit umso besser schätzen, je mehr unabhängige Experimente wir durchführen. Ausgleichungsrechnung I Gerhard Navratil Wahrscheinlichkeit (2) Für die Häufigkeit k gilt 0 k n, daher 0 k/n 1 Somit für n : 0 P(E) 1 Wahrscheinlichkeit 0: unmögliches Ereignis Wahrscheinlichkeit 1: sicheres Ereignis P(E) oft in Prozent angegeben Ausgleichungsrechnung I Gerhard Navratil Wahrscheinlichkeit (3) Weitere Definition (Laplace): Verhältnis zwischen den günstigen und den möglichen Fällen des Eintretens eines bestimmten Ereignisses Vorteil: Beschreibt a priori-Wahrscheinlichkeit – kann ohne Experiment angegeben werden Nachteil: Was sind beim Messen günstige Ereignisse? Ausgleichungsrechnung I Gerhard Navratil Bestimmung der Wahrscheinlichkeit? Unendlich viele Versuche ausführen Praktische Durchführung schwierig Empirische Schätzung aus n Versuchen z.B. Mittelwert unserer Beobachtungen Anwendung eines theoretischen Modells z.B. Fehlergesetz unseres Distanzers Ausgleichungsrechnung I Gerhard Navratil Wahrscheinlichkeitsverteilungen Angaben über die Wahrscheinlichkeit, mit der eine Zufallsgröße bestimmte Werte annimmt Wichtige Frage: Wie groß ist die Wahrscheinlichkeit dafür, dass die Zufallsgröße kleiner oder gleich einem vorgegebenen Wert ist? Antwort: Verteilungsfunktion F(x) Ausgleichungsrechnung I Gerhard Navratil Verteilungsfunktion • Diskreter Fall: F ( x) P( X x) i: xi x mit • Stetiger Fall: P( X xi ) f ( xi ) pi für x xi f ( x) 0 sonst x F ( x) P( X x) f (t )dt mit Dichtefunktion f(x) Ausgleichungsrechnung I Gerhard Navratil i: xi x Dichtefunktion Wahrscheinlichkeit Ausgleichungsrechnung I Gerhard Navratil Weitere Wahrscheinlichkeiten a P( X a) F (a) f ( x)dx P( X b) 1 F (b) f ( x)dx b b P(a X b) F (b) F (a ) a Ausgleichungsrechnung I Gerhard Navratil f ( x)dx Parameter der Verteilung • Lageparameter n xi f ( xi ) bzw. x f ( x)dx – Erwartungswert E ( x) i 1 F ( xa ) P( X xa ) a – a-Quantil – 0,5-Quantil: Median • Streuungsparameter n 2 x f ( xi ) i bzw. x 2 f ( x)dx – Varianz i 1 – Standardabweichung: positive Quadratwurzel der Varianz Var( x) Ausgleichungsrechnung I Gerhard Navratil Momente der Verteilung Ist X eine Zufallsgröße, so ist auch Xk eine Zufallsgröße mk=E(Xk) … k-tes Moment von X (Erwartungswert: erstes Moment) Zentriert auf Erwartungswert: zentrales Moment k (Varianz: 2. zentrales Moment) k E (( X E ( X )) ) k Ausgleichungsrechnung I Gerhard Navratil Schiefe, Wölbung und Exzess 1 3 • Schiefe 32 positive Schiefe: rechter Teil länger als linker Teil: rechtsschief 4 • Wölbung (Kurtosis) 2 22 Wölbung kleiner 3 breitgipflig, sonst schmalgipflig, Normalverteilung: genau 3 • Exzess: Wölbung verringert um Wölbung der Normalverteilung 2 42 3 2 3 2 Ausgleichungsrechnung I Gerhard Navratil QQ-Plot 2 Datenmengen – gleiche Verteilung? Auftragen der Quantile • Gerade durch Ursprung gleicher Erwartungswert • Gerade mit gleicher Steigung gleiche Standardabweichung Ausgleichungsrechnung I Gerhard Navratil Gute Näherung Ausgleichungsrechnung I Gerhard Navratil Schlechte Näherung Ausgleichungsrechnung I Gerhard Navratil Wichtige Verteilungen • • • • • Gleichverteilung Normalverteilung Chi-Quadrat Verteilung Student-Verteilung Fisher-Verteilung Ausgleichungsrechnung I Gerhard Navratil Gleichverteilung (1) Jeder mögliche Wert hat dieselbe Wahrscheinlichkeit, z.B. Würfeln 1 Stetiger Fall: für a x b f ( x) b a 0 sonst Dichtefunktion: Rechteck ab E( X ) Erwartungswert 2 Ausgleichungsrechnung I Gerhard Navratil Gleichverteilung (2) 1 b a k k E (( X E ( X )) ) k 1 2 0 Zentrale Momente und somit b a 2 Var(X ) 2 3 0 12 1 4 4 b a 80 Ausgleichungsrechnung I Gerhard Navratil für gerade k für ungerade k Normalverteilung (1) auch: Gauß‘sche Verteilung x 2 1 2 2 s Dichtefunktion: f ( x) e s 2 für x Definiert über Erwartungswert und Standardabweichung s Form einer Glocke: Glockenkurve Ausgleichungsrechnung I Gerhard Navratil Abweichungen Erwartungswert Erwartungswert Symmetrisch, Wendepunkte Varianz bestimmt umso bestimmt daher gleich imunwahrscheinlicher Abstand die Mittelwert Modalwert: das Breite Zentrum von der = ±sUnimodal Median Kurve von der je größer Kurve Ausgleichungsrechnung I Gerhard Navratil Normalverteilung (2) Verteilungsfunktion durch Integration der Dichtefunktion: 2 t 1 F ( x) s 2 e 2s 2 dt Komplexe Berechnung Standardisierung Ausgleichungsrechnung I Gerhard Navratil Standardisierte Zufallsgröße Entsteht durch lineare Transformation Z X s Ergebnis: Erwartungswert Standardabweichung dimensionslos 0 1 Ausgleichungsrechnung I Gerhard Navratil Standard-Normalverteilung Normalverteilte Zufallsgröße mit =0 und s=1 1 ( z) 2 Dichtefunktion Verteilungsfunktion 1 ( z ) 2 Ausgleichungsrechnung I Gerhard Navratil z2 e 2 t2 e 2 dt Standard-Normalverteilung Ausgleichungsrechnung I Gerhard Navratil Wichtige Beziehungen (1) ( x) 1 ( x) a P( X a) s b a P ( a X b) s s b P ( X b) 1 s Ausgleichungsrechnung I Gerhard Navratil Wichtige Beziehungen (2) • ~68% aller Realisierungen in ±1s • ~95% aller Realisierungen in ±2s • ~99% aller Realisierungen in ±3s bzw. P( 1 s X 1 s ) 68% P( 2 s X 2 s ) 95% P( 3 s X 3 s ) 99% Ausgleichungsrechnung I Gerhard Navratil Chi-Quadrat-Verteilung (1) Entsteht aus einer normalverteilten m 2 Y X Zufallsgröße über i i 1 1876 Helmert, Pearson Parameter m: Freiheitsgrad der Verteilung Auch: Helmert-Pearson-Verteilung Definiert auf [0,+] Im Allgemeinen nicht symmetrisch Abkürzung: C 2 Ausgleichungsrechnung I Gerhard Navratil Chi-Quadrat-Verteilung (2) • • • • Erwartungswert Varianz Schiefe Exzess E(Y)=m Var(Y)=2m 1 2 2 m 12 2 m Ausgleichungsrechnung I Gerhard Navratil Ausgleichungsrechnung I Gerhard Navratil Student-Verteilung (1) Zufallsgröße T aus Z mit Z: standard normalverteilt T Y Y: C 2-verteilt m Y und Z unabhängig Student- oder t-Verteilung (1809 Gosset) Definiert auf [-,+], unimodal, symmetrisch, glockenförmig Ausgleichungsrechnung I Gerhard Navratil Student-Verteilung (2) Ähnlich Normalverteilung aber größere Streuung Je größer die Anzahl der Freiheitsgrade desto größer die Ähnlichkeit zur Normalverteilung Kann ab m30 durch Normalverteilung ersetzt werden Ausgleichungsrechnung I Gerhard Navratil Student-Verteilung (3) • • • • Erwartungswert Varianz Schiefe Exzess E(T)=0 für m2 Var(T)=m/(m-2) für m3 1=0 für m3 2=6/(m-4) für m2 Ausgleichungsrechnung I Gerhard Navratil Ausgleichungsrechnung I Gerhard Navratil Fisher-Verteilung (1) Y1 Zufallsgröße X aus X Y2 m1 m2 mit den C 2-verteilten Zufallsgrößen Y1 und Y2 mit m1 bzw. m2 Freiheitsgraden Fisher-verteilt, F-verteilt (Snedecor) Varianzquotientenverteilung F(m1,m2) Ausgleichungsrechnung I Gerhard Navratil Fisher-Verteilung (2) Definiert auf [0,+], nicht symmetrisch, linksschief, eingipflig Symmetrie wächst mit zunehmender Anzahl von Freiheitsgraden Erwartungswert und m Varianz (m25): E( X ) 2 m2 2 Var( X ) 2m22 m1 m2 2 m1 m2 2 m2 4 2 Ausgleichungsrechnung I Gerhard Navratil Ausgleichungsrechnung I Gerhard Navratil Prüfverteilungen Chi-Quadrat-, Student- und Fisher-Verteilung heißen Prüf- oder Testverteilungen In Schätz- und Testtheorie (Kap. 8) zum Überprüfen von Hypothesen verwendet Treten nicht als eigenständige Verteilungen in mathematischen Modellen mathematischer Versuche auf Ausgleichungsrechnung I Gerhard Navratil Zentraler Grenzwertsatz Eine Zufallsgröße als Summe einer großen Anzahl unabhängiger, beliebig verteilter Zufallsgrößen ist annähernd normalverteilt. Voraussetzung: Einzelanteile klein Wichtig für Modellierung von Beobachtungen! Tatsächlich: Nur näherungsweise normalverteilt! Ausgleichungsrechnung I Gerhard Navratil Unschärfe Bisherige Konzepte beschreiben Variabilität Aber: Messergebnisse sind unscharf (z.B. Oberflächenrauhigkeit) Ursache: Güte der Definition z.B. Anzahl von Autos, die vor einer roten Ampel warten Ausgleichungsrechnung I Gerhard Navratil Punktmengen Zugehörigkeit eines Punktes zu einer Teilmenge über Indikatorfunktion 1 für x A I A x x M 0 für x A Scharfe Abgrenzung Wenn nicht möglich Zugehörigkeitsfunktion (memberhip function) A : M 0,1 Fuzzy Sets Ausgleichungsrechnung I Gerhard Navratil Zugehörigkeitsfunktion Beispiel vor roter Ampel wartendes Auto Ausgleichungsrechnung I Gerhard Navratil Beschreibung unscharfer Zahlen Charakterisierende Funktion Bedingung: Jeder horizontale Schnitt durch die Funktion ergibt ein endliches, nicht leeres und abgeschlossenes Intervall: d-Schnitt Meist Trapezform Ausgleichungsrechnung I Gerhard Navratil Zusammenfassung (1) • Zufallsereignisse haben für das Eintreten jedes möglichen Ergebnisses eine bestimmte Wahrscheinlichkeit • Die Summe dieser Wahrscheinlichkeiten ist die Wahrscheinlichkeitsverteilung • Oft wird die Normalverteilung angenommen • Andere Verteilungen werden wir in der Prüfstatistik noch benötigen Ausgleichungsrechnung I Gerhard Navratil Zusammenfassung (2) • Zentraler Grenzwertsatz liefert die Begründung, warum wir oft Normalverteilung annehmen • Unschärfe der Definition kann über das Konzept der unscharfen Zahlen abgebildet werden Ausgleichungsrechnung I Gerhard Navratil