Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 1 Deskriptive und Analytische Statistik Statistik Deskriptive Statistik Analytische Statistik Beschreibung von Massenerscheinungen Schließen von Stichproben auf Gesamtmasse (vorerst) Statistik I für Geographen 2 Kleiner „Rückblick“ auf die Deskriptive Statistik • Grundbegriffe: Variable, Untersuchungseinheit, Grundgesamtheit... • Skalenniveaus: Nominal-, Ordinal-, Rational- und Intervallskala • Statistische Untersuchungen: Stichprobenauswahl, Datenerhebung, Dateneingabe, Datenaufbereitung ... • Häufigkeitsverteilungen und deren Darstellung: Balkendiagramme, Kreisdiagramme, Polygone... • Maßzahlen zur Charakterisierung von Verteilungen: Lagemaße, Streuungsmaße, Konzentrationsmaße • Es fehlt noch: Regression, Korrelation -> nach Weihnachten Statistik I für Geographen 3 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 4 Grundbegriffe der Wahrscheinlichkeitsrechnung • Zufallsexperiment: Versuch mit vorher ungewissem Ausgang Beispiel: Münzwurf • Elementarereignis: Ergebnis eines Zufallsexperiments Beispiel: Kopf wurde geworfen • Ereignisraum R: Menge möglicher Elementarereignisse Beispiel: {Kopf, Zahl} • Zufallsvariable X: Vorschrift, die jedem Elementarereignis eines Zufallsexperiments eindeutig eine Zahl zuordnet Beispiel: Kopf -> 1 Zahl -> 2 Statistik I für Geographen 5 Grundbegriffe der Wahrscheinlichkeitsrechnung – Die Zufallsvariable X ist diskret, wenn • der Ereignisraum aus endlich vielen Elementen besteht Beispiel: Würfelwurf • oder in jedem Intervall nur endlich viele Elemente liegen Beispiel: zufällige ganze Zahl – X ist stetig, wenn • die Elementarereignisse alle Werte eines Intervalls annehmen können Beispiel: (Genaue) Weite, die mit einem Steinwurf erzielt wurde Statistik I für Geographen 6 Beispiele ZufallsElementarexperiment ereignis Zufallsvariable Stetig oder diskret? Münzwurf „Kopf“ X: (Kopf, Zahl) -> {1,2} diskret Würfelwurf „3 Augen“ X: (Augenzahl) -> {1..6} diskret Steinwurf 3,245.... Meter (nicht gerundet!) X: Entfernung -> Statistik I für Geographen ℜ stetig 7 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 8 Laplacesche Wahrscheinlichkeit und relative Häufigkeit • Laplace-Experiment: Zufallsexperiment mit endlichem Ereignisraum, bei dem alle Elementarereignisse gleichwahrscheinlich sind Beispiele: Würfelwurf, Münzwurf... mit einem Laplace-Würfel / einer Laplace-Münze • Laplace-Würfel, Laplace-Münze... Würfel / Münze, bei dem / der alle Ergebnisse gleichwahrscheinlich sind (im Realen nicht möglich) • Laplace-Wahrscheinlichkeit: Die Wahrscheinlichkeit für das Eintreten eines Elementarereignisses a bei einem Laplace-Experiment berechnet sich durch den Quotient Anzahl der günstigen Fälle (X = a) Anzahl der möglichen Fälle (X beliebig) Dieser Quotient wird als Laplace-Wahrscheinlichkeit bezeichnet Statistik I für Geographen 9 Laplacesche Wahrscheinlichkeit und relative Häufigkeit • Ist ein Experiment ein Laplace-Experiment, so gilt für Zufallsvariablen X also: Wahrscheinlichkeit W(X = a) = Anzahl der günstigen Fälle (X = a) Anzahl der möglichen Fälle (X beliebig) Beispiel: Zufallsexperiment Würfelwurf: W(X=6) = 1 6 Die Wahrscheinlichkeit kann also theoretisch bestimmt werden, und zwar schon vor der Durchführung eines Experiments, wenn Informationen über die Zufallsvariable vorliegen (etwa: der Würfel ist ein Laplace-Würfel) Statistik I für Geographen 10 Laplacesche Wahrscheinlichkeit und relative Häufigkeit • Die relative Häufigkeit wird dagegen nach Zufallsexperimenten aus den empirischen Ergebnissen ermittelt: Anzahl der Ereignisse mit (X = a) relative Häufigkeit h(X=a) = Anzahl der Zufallsexperimente Beispiel: • Bei 10 Würfen wurden zwei 6-er geworfen h(X=6) = 2/10 = 1/5 Je mehr Zufallsexperimente gemacht werden, desto mehr nähert sich die relative Häufigkeit an die Wahrscheinlichkeit an (Gesetz der großen Zahlen) Statistik I für Geographen 11 Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wird wann bestimmt Laplacesche Vor Wahrschein- Durchführung lichkeit der Experimente Relative Häufigkeit Nach Durchführung der Experimente Statistik I für Geographen Wird wie bestimmt Wird durch welche „Formel“ bestimmt Wird theoretisch berechnet Anzahl der günstigen Fälle (X = a) Anzahl der möglichen Fälle (X beliebig) Wird praktisch gemessen Anzahl der Ereignisse mit (X = a) Anzahl der Zufallsexperimente 12 Ereignisse • Wir kennen schon: Elementarereignis (Ergebnis eines Zufallsexperiments) • Ereignis: Menge von Elementarereignissen • Beispiele: – Ereignis Ag, beim Würfeln ein gerade Zahl zu erhalten ist die Elementarereignis-Menge {2,4,6} – Ereignis A6, eine 6 zu erhalten, ist die ElementarereignisMenge {6} – Ereignis AZ, überhaupt eine Zahl zu erhalten, ist die Elementarereignis-Menge {1,2,3,4,5,6} Statistik I für Geographen 13 Mengentheoretische Definitionen A und B seien zwei Mengen A B • A ∩ B heißt Durchschnitt der Mengen A und B A B • A A B B heißt Vereinigung der Mengen A und B A sei Teilmenge von R • R A Ā heißt Komplementärmenge von A R A W(A) ist die Wahrscheinlichkeit, dass eine Elementarereignis aus der Menge A eintritt W(A|B) ist die Wahrscheinlichkeit, dass A eintritt, wenn zuvor B eingetreten ist W(A|B) heißt auch bedingte Wahrscheinlichkeit von A unter der Bedingung B Statistik I für Geographen 14 Mengentheoretische Definitionen • Beispiel Würfelwurf: R = {1,2,3,4,5,6} – Menge A: Gerade Augenzahlen A= {2,4,6} – Menge B: Augenzahlen >= 3 1 – B= {3,4,5,6} – A ∩ B = {4,6} – A B = {2,3,4,5,6} – Ā = {1,3,5} R 6 2 3 5 4 B A Statistik I für Geographen 15 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 16 Wahrscheinlichkeitsgesetze (1) Für ein beliebiges Ereignis A gilt: 0 ≤ W(A) ≤ 1 – W(A) = 0 bedeutet, dass A nicht eintreten kann – W(A) = 1 bedeutet, dass A immer eintritt (2) Sei R die Gesamtmenge aller möglichen Ereignisse, dann gilt W(R) = 1 (3) Seien A und B Ereignismengen mit A ∩ B = Ø, dann gilt W(A B) = W(A) + W(B) (4) Sei Ā Komplementmenge von A, dann gilt W(Ā) = 1-W(A) (5) Seien A und B Ereignismengen, dann gilt: W(A∩B) = W(A|B)* W(B) = W(B|A) * W(A) (6) Seien A und B stochastisch unabhängige Ereignismengen, dann gilt: W(A∩B) = W(A) * W(B) denn nun gilt W(B|A) = W(B) und W(A|B) = W(A) Statistik I für Geographen 17 Beispiel Roulette • • • Beim Roulette gibt es 37 Zahlen von 0 bis 36 Die 0 ist grün, die Hälfte der anderen Zahlen ist rot, der Rest schwarz. Wir setzen Gleichwahrscheinlichkeit der Elementarereignisse voraus • Wie groß ist die Wahrscheinlichkeit, dass eine rote Zahl kommt? Anzahl der günstigen Fälle 18 = ≈ 0,4865 = 48,65% Anzahl der möglichen Fälle 37 • Wie groß ist die Wahrscheinlichkeit, dass 10 rote Zahl hintereinander kommen? W(1. Spiel rot ∩ 2. Spiel rot ∩ ... ∩ 10. Spiel rot ) = da die einzelnen Spiele voneinander stochastisch unabhängig sind = W(1. Spiel rot) * W(2. Spiel rot) * ... W(10. Spiel rot ) = = 0,4865*0,4865*...*0,4865 = 0,486510 = 0,0007425 = 0,07% Statistik I für Geographen 18 Beispiel Roulette Wie groß ist die Wahrscheinlichkeit, dass eine rote Zahl kommt, wenn vorher schon 100 rote Zahlen hintereinander kamen? • Das Ereignis „Hundert rote Zahlen kommen hintereinander“ ist zwar sehr unwahrscheinlich, aber trotzdem unabhängig vom Ereignis „Als nächstes kommt eine rote Zahl“ • W(„Jetzt kommt eine rote Zahl“| “Es kamen hundert rote Zahlen“) = W(„Als nächstes kommt eine rote Zahl“) = 48, 65% Statistik I für Geographen 19 Bertrands Schachtelparadoxon (Joseph Bertrand, 1889) ? ? ? In einer dieser 3 Kisten liegt der Hauptgewinn, der Kandidat einer Spielshow soll sich eine aussuchen ? ? ? Der Kandidat wählt die mittlere Kiste. Nun öffnet der Quizmaster von den anderen beiden eine, die leer ist. leer ? ? Ist es für den Kandidaten günstiger, bei seiner Wahl zu bleiben, oder sich für die verbleibende, dritte Kiste zu entscheiden? Statistik I für Geographen 20 Bertrands Schachtelparadoxon leer ? ? Intuitiv würde man wohl vermuten, das beide Kisten die gleiche Gewinnchance haben Wahl Aktion 1 Bleibt x - - 1/3 2 Bleibt - x - 1/3 3 Bleibt - - x 1/3 1 Wechel - x x 2/3 2 Wechel x - x 2/3 3 Wechel x x - 2/3 Statistik I für Geographen 1 gewinnt 2 gewinnt 3 gewinnt Chance 21 Beispiel Wie groß ist die Wahrscheinlichkeit, dass hier im Raum 2 mindestens zwei am gleichen Tag Geburtstage haben? • Gesucht: W(„Von 25 Menschen haben zwei am gleichen Tag Geburtstag“) • Diese Frage lässt sich leicht beantworten, wenn wir die Wahrscheinlichkeit für das Komplementärereignis ausrechnen • Komplementärereignis: W(„Alle 25 haben verschiedene Geburtstage“) Anzahl der günstigen Fälle 365 * 364 * 363 * ... * 340 = ≈ 0,4018 Anzahl der möglichen Fälle 365 * 365 * 365 * ... * 365 • W(„Von 25 Menschen haben zwei am gleichen Tag Geburtstag“)= = 1- W(„Alle 25 haben verschiedene Geburtstage) ≈ ≈ 1-0,4018 = 0,5982 = 59, 83% (!!!) Statistik I für Geographen 22 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 23 Die Wahrscheinlichkeitsfunktion Die Wahrscheinlichkeitsfunktion f(x) einer diskreten Zufallsvariablen • ordnet jedem Ereignis xi seine Wahrscheinlichkeit W(X=xi) zu • hat an allen anderen Stellen den Wert 0 f(x) = Wahrscheinlichkeit für X = x Beispiel Würfelwurf 1/6 1 Statistik I für Geographen 2 3 4 5 6 X: Zahl beim Würfelwurf 24 Die Verteilungsfunktion Die Verteilungsfunktion F(x) einer diskreten Zufallsvariablen ordnet jedem Ereignis xi die Wahrscheinlichkeit W(X ≤ xi) zu F(x) = Wahrscheinlichkeit für X ≤ x Beispiel Würfelwurf 1 5/6 2/3 1/2 1/3 1/6 1 Statistik I für Geographen 2 3 4 5 6 X: Zahl beim Würfelwurf 25 Die Binomialverteilung • • • Bei einem Zufallsexperiment sei die Wahrscheinlichkeit, dass ein bestimmtes Ereignis E eintritt, W(E) = p Beispiel: – Experiment Münzwurf – Ereignis E: Kopf wird geworfen – W(E) = p = 1/2 • Frage: Wie groß ist die Wahrscheinlichkeit, dass E genau k mal eintritt, wenn man das Experiment n mal durchführt? Beispiel – Wie groß ist die WS, dass beim 3-maligen Münzwurf genau 2 mal „Kopf“ geworfen wird? • Antwort wird durch die Wahrscheinlichkeitsfunktion „Binomialverteilung gegeben Statistik I für Geographen 26 Die Binomialverteilung n k f (k ) = • p • (1 − p ) n − k k n n! (sprich : n über k) mit = k k!(n − k )! n = 1 0 n! = 1 • 2 • ... • n (sprich n Fakultät) 0! = 1 Statistik I für Geographen 27 Die Binomialverteilung n k n−k f (k ) = • p • (1 − p) k • Beispiel – Wie groß ist die WS, dass beim 3-maligen Münzwurf genau 2 mal „Kopf“ geworfen wird? • n=3 • k=2 2 1 3 1 1 3! 1 1 6 3 f (k ) = • • = • • = = 2 2 2 2!•1! 4 2 16 8 Statistik I für Geographen 28 Die Binomialverteilung: Wahrscheinlichkeitsund Verteilungsfunktion • Bespiel: X: Anzahl der Ergebnisse „Kopf“ beim dreimaligen Münzwurf 1 0 3 1 2 3 1 1 3! 1 1 f (0) = • • = •1• = 8 8 0 2 2 3!•0! 3 1 1 3! 1 1 6 3 f (1) = • • = • • = = 1 2 2 1!•2! 2 4 16 8 2 3/8 1 3 1 1 3! 1 1 6 3 f (2) = • • = • • = = 2 2 2 2!•1! 4 2 16 8 3 0 3 1 1 3! 1 1 f (3) = • • = • •1 = 8 3 2 2 3!•0! 8 Verteilungsfunktion Wahrscheinlichkeit für X ≤ x Wahrscheinlichkeit für X = x Wahrscheinlichkeitsfunktion 1 7/8 1/2 1/8 1/8 0 1 2 3 Anzahl der Ergebnisse „Kopf“ Statistik I für Geographen 0 1 2 3 Anzahl der Ergebnisse „Kopf“ 29 Wahrscheinlichkeits- und Verteilungsfunktion für stetige Zufallsvariablen • Für stetige Zufallsvariablen ist die Wahrscheinlichkeitsfunktion nicht definiert, da W(X = x) nicht definiert ist. Beispiel: Wir untersuchen die Entfernung der Wohnungen von Studenten zur Uni. Wie groß ist die Wahrscheinlichkeit, dass eine Wohnung genau 500m entfernt ist? Die Antwort lautet 0, denn bei beliebig hoher Messgenauigkeit werden wir immer von genau 500m abweichen • Die Verteilungsfunktion F(x) = W(X≤x) ist aber definiert Beispiel: Wie groß ist die Wahrscheinlichkeit, dass ein Student näher als 500m an der Uni wohnt. • Bei einer stetigen Zufallsvariablen X können wir also keine Wahrscheinlichkeit dafür angeben, dass X genau einen bestimmten Wert annimmt, wohl aber dafür, dass X in einem bestimmten Intervall liegt. Statistik I für Geographen 30 Verteilungsfunktion für stetige Zufallsvariablen • Beispiel: X= „Entfernungen der Wohnorte von Studenten zur Universität“ F(x) = W(X≤x) 1 Für eine Verteilungsfunktion F gilt immer: F(∞) = 1 1/2 5 10 15 Die Hälfte aller Studenten wohnt nicht weiter als 8 km von der Universität entfernt Statistik I für Geographen 20 km 31 Wahrscheinlichkeitsdichtefunktion für stetige Zufallsvariablen • Mathematisch lässt sich nachweisen: Es gibt eine Funktion f, so dass man die Verteilungsfunktion F darstellen kann als x Das Integral gibt dabei die Fläche unter F ( x) = f (t )dt der Kurve f(t) von -∞ bis t=x an ∫ −∞ • f(x) wird Wahrscheinlichkeitsdichte der Zufallsvariablen X genannt und es gilt f(x) = F´(x) F(x) 1 f(x) 1 20 km 5 km 10 km 15 km Statistik I für Geographen 20 km 5 km 10 km 15 km 32 Wahrscheinlichkeitsdichtefunktion und Verteilungsfunktion x F ( x) = ∫ f (t )dt −∞ Das Integral gibt die Fläche unter der Kurve f(t) von -∞ bis t=x an ∞ F (∞ ) = ∫ f (t )dt = W ( X ≤ ∞) = 1 −∞ F(x) 1 f(x) 1 20 km 5 km 10 km 15 km 20 km 5 km 10 km 15 km “∞” Statistik I für Geographen 33 Wahrscheinlichkeitsdichtefunktion und Verteilungsfunktion • Beispiel: Wahrscheinlichkeit dafür, dass die Entfernung der Wohnung eines Studenten zur Uni unter 5 Km liegt F(x) 1 f(x) 1 W(X ≤ 5km) = F(5km) = 1/2 1/2 20 km 5 km 10 km 15 km • 20 km 5 km 10 km 15 km Beispiel: Wahrscheinlichkeit dafür, dass die Entfernung der Wohnung eines Studenten zur Uni zwischen 5 und 10 Km liegt F(x) 1 f(x) 1 3/4 1/2 20 km 5 km 10 km 15 km Statistik I für Geographen W(5 ≤ X ≤ 10km) = F(10km)–F(5km) = 3/4 -1/2 = 1/4 20 km 5 km 10 km 15 km 34 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 35 Parameter diskreter und stetiger Zufallsvariablen • Für Häufigkeitsverteilungen hatten wir zwei wichtige Parameter kennengelernt – Das arithmetische Mittel µ bzw. x – Die Varianz σ2 bzw s2 • Für Zufallsvariablen existieren ähnliche Parameter – Das arithmetische Mittel bezeichnet den Schwerpunkt einer Häufigkeitsverteilung. – Der Schwerpunkt der Verteilung einer Zufallsvariablen heißt Erwartungswert (Mittelwert) und wird auch mit E(X) oder µ bezeichnet – Die Streuung der Verteilung einer Zufallsvariablen wird – wie bei Häufigkeitsverteilungen –Varianz genannt und mit Var(X) oder σ2 bezeichnet Statistik I für Geographen 36 Parameter diskreter und stetiger Zufallsvariablen Der Erwartungswert für diskrete Zufallsvariablen n • • Formel: E(X) = ∑ xi f ( xi ) i =1 f(x) Beispiel X = Ergebnis beim einmaligen Würfelwurf 6 1 1 1 6 6 6 i =1 1 + 2 + 3 + 4 + 5 + 6 21 = = 3,5 6 6 1 6 1 6 1 6 E(X) = ∑ xi f ( xi ) = 1 • + 2 • + 3 • + 4 • + 5 • + 6 • = 1/6 1 2 3 4 5 6 • Beispiel X = Anzahl der Ergebnisse „Kopf“ beim dreimaligen Münzwurf 3 1 3 3 1 E(X) =∑ xi f ( xi ) = 0 • + 1 • + 2 • + 3 • = 8 8 8 8 i =1 0 + 3 + 6 + 3 12 = = 1,5 8 6 Statistik I für Geographen f(x) 3/8 1/8 0 1 2 3 37 Parameter diskreter und stetiger Zufallsvariablen Die Varianz für diskrete Zufallsvariablen • Formel: Var(X) = n ∑ (x − µ ) i =1 • i 2 f ( xi ) f(x) Beispiel: X = Ergebnis beim einmaligen Würfelwurf n 2 Var(X) = ∑ ( xi − µ ) f ( xi ) = 1/6 i =1 1 1 1 1 1 1 − 2,52 • − 1,52 • − 0,52 • + 0,52 • + 1,52 • + 1,52 • = 6 6 6 6 6 6 5,25 + 2,25 + 0,25 + 0,25 + 2,25 + 5,25 = 2,58 6 • 1 2 3 4 5 6 Beispiel: X = Anzahl der Ergebnisse „Kopf“ beim dreimaligen Münzwurf n Var(X) =∑ ( xi − µ ) f ( xi ) = 2 i =1 1 3 3 1 − 1,52 • − 0,52 • + 0,52 • + 1,52 • 8 8 8 8 2,25 + 0,25 + 0,25 + 2,25 = 0,625 8 Statistik I für Geographen f(x) 3/8 1/8 0 1 2 3 38 Parameter diskreter und stetiger Zufallsvariablen • Für diskrete Zufallsvariablen gilt: N – Erwartungswert E(X) = ∑ xi f ( xi ) i =1 N 2 – Varianz Var(X) = ∑ ( xi − µ ) f ( xi ) i =1 • Für stetige Zufallsvariablen gilt: ∞ – Mittelwert E(X) = ∫ xf ( x)dx −∞ ∞ 2 – Varianz Var(X) = ∫ ( x − µ ) f ( x)dx −∞ Statistik I für Geographen 39 Parameter stetiger Zufallsvariablen Beispiel Wartezeit (in Minuten) eines uninformierten Fahrgasts auf die S-Bahn (20-min-Takt) f(x) WahrscheinlichkeitsdichteFunktion 1/20 F(x) 1 Fläche = 1! 5 10 15 20 ∞ 10 5 0 20 15 20 ∞ 1 Mittelwert E(X) = ∫ xf ( x)dx = ∫ x • 0dx + ∫ x dx + ∫ x • 0dx = 20 −∞ −∞ 0 20 20 1 1 2 1 1 2 2 x = 20 − 0 = 400 = 10 40 40 40 40 0 Varianz Var(X) = ∞ ∞ −∞ −∞ 2 ( x − µ ) f ( x)dx = ∫ ( ∫ Statistik I für Geographen 1 1 − ) 2 f ( x)dx = 0 (Gleichverteilung!) 20 20 40 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 41 Theoretische Verteilungen • Oft lassen sich empirische Verteilungen auf eine der Folgenden Standardverteilungen zurückführen – Gleichverteilung • Beispiel: Uninformierter Fahrgast • Bereits vorgestellt – Exponentialverteilung • Beispiel: Kapitalzuwachs bei Verzinsung • Machen wir nicht – Normalverteilung • Beispiel: Zufällige Abweichungen von Messergebnissen • Machen wir jetzt Statistik I für Geographen 42 Theoretische Verteilungen Die Normalverteilung Die Normalverteilung Johann Carl Friedrich Gauß Statistik I für Geographen 43 Theoretische Verteilungen Die Normalverteilung Johann Carl Friedrich Gauß – Leben • Geboren 30.4.1777 in Braunschweig • Gestorben 23.02.1855 in Göttingen – Interessen • • • • Mathematik Physik Astronomie Geodäsie – Leistungen • • • • • Beweis des Fundamentalsatzes in der Algebra Entdeckung des Prinzips des kleinsten Zwanges in der Mechanik Erfindung des Heliotropen, des Magnetometers und des Telegraphen Gaußscher Algorithmus .... Statistik I für Geographen 44 Theoretische Verteilungen Die Normalverteilung • Wahrscheinlichkeitsdichtefunktion 1 f ( x) = •e σ 2π 1 x−µ 2 − 2 σ σ: Standardabweichung µ: Erwartungswert П: 3,1416.... e: 2,7183... f(x) 1 σ 2∏ σ µ-2σ σ µ µ-σ Statistik I für Geographen µ+2σ µ+σ 45 Normalverteilung • Bedeutung der Normalverteilung (NVT) – Die Normalverteilung ist eine theoretische Verteilung, für die bekannt ist • mit welcher Häufigkeit / Wahrscheinlichkeit bestimmte Variablenwerte über- oder unterschritten werden • In welchem Intervall die Variablenwerte mit welcher Wahrscheinlichkeit liegen – Viele reale Variablen sind annähernd normalverteilt • Phänomene aus der Natur: Temperaturen, Niederschläge, Körpergrößen • Einige soziale Variablen: • Meßfehler sind oft annähernd normalverteilt – Viele statistische Verfahren besieren auf der Annahme, dass die untersuchten Größen normalverteilt sind Statistik I für Geographen 46 Normalverteilung • Gestalt der Normalverteilung – Die Normalverteilung hat eine Glockenform. f(x) 1 σ 2∏ • symmetrisch • unimodal • σ – Höhe und Breite differieren je nach Mittelwert und Standardabweichung Man sagt: Eine Variable ist (µ,σ)-normalverteilt µ-σ µ+σ Februar -1,83 80 70 60 50 40 30 20 10 0 Februar August August Temperatur in °C Statistik I für Geographen 20 17 14 11 8 5 2 -1 -4 1,33 -7 -1 0 µ+2σ µ 2,9 Monatsmitteltemperatur in München Vorkommen 1781-1992 µ-2σ σ 16,92 47 Die Standardnormalverteilung • Je nach Ausprägung von σ hat die NVT eine schmalere oder breitere Form • Der Gipfel der Verteilung befindet sich bei x=µ φ(x) Die Normalverteilung mit µ = 0 und σ = 1 heißt Standardnormalverteilung (SVT) σ 1 2∏ ≈ 0,4 σ=1 µ-2σ = -2 µ+2σ = 2 µ=0 µ-σ = -1 Statistik I für Geographen σ=1 µ+σ = 1 48 Eigenschaften der Standardnormalverteilung • Die Verteilungsfunktion einer standardnormalverteilten Zufallsvariablen Z nennt man Φ(z) φ(x) σ 1 2∏ ≈ 0,4 σ=1 µ-2σ = -2 σ=1 µ+2σ = 2 µ=0 µ-σ = -1 µ+σ = 1 Ф(x) ≈ 0,5 σ=1 -2 2 0 -1 Statistik I für Geographen σ=1 1 49 Standardnormalverteilung • Standardisierung: Ist die Variable X normalverteilt, so ist Z= X −µ µ = Erwartungswert von X σ σ = Standardabweichung von X standardnormalverteilt Beispiel: 80 70 60 50 40 30 20 10 0 Februar X1 = MMTFEB ist (-1,8; 2,9)-normalverteilt Z = (X1-(-1,8))/2,9 ist standardnormalverteilt Temperatur in °C Statistik I für Geographen 20 14 17 11 5 8 2 -1 -4 August -7 -1 0 Vorkom m en 1781-1992 Monatsmitteltemperatur in München X2 = MMTAUG ist (16,9; 1,9)-normalverteilt Z = (X2-16,9))/1,9 ist standardnormalverteilt 50 Standardnormalverteilung • Was bringt die Standardisierung? Ф(z) ≈ 0,5 σ=1 -2 2 0 -1 Statistik I für Geographen σ=1 1 51 Standardnormalverteilung Ф(x) ≈ 0,5 σ=1 -2 σ=1 2 0 φ(x) σ 1 2∏ Der Wert der Verteilungsfunktion Φ entspricht der Fläche unter der SNVT-Kurve ≈ 0,4 σ=1 µ-2σ = -2 µ+2σ = 2 µ=0 µ-σ = -1 Statistik I für Geographen σ=1 µ+σ = 1 52 Die Standardnormalverteilung 80 70 60 50 40 30 20 10 0 (Tabelle:) 17 20 14 8 11 2 5 -1 -7 August Temperatur in °C • • X1 = MMTFEB ist (-1,8; 2,9)-normalverteilt Z = (X1-(-1,8))/2,9 ist standardnormalverteilt Februar -4 -1 0 Vorkom m en 1781-1992 Monatsmitteltemperatur in München X2 = MMTAUG ist (16,9; 1,9)-normalverteilt Z = (X2-16,9))/1,9 ist standardnormalverteilt Φ(0,70) = 0,7580 Bedeutung: Ist Z standardnormalverteilt, so liegen 75,8 % der z-Werte unter z0= 0,7 Unter welchem x0 liegen dann 75,8% der Werte von X1 = MMTFEB und X2 = MMTAUG ? – Z1=(X1+1,8)/2,9 => X1 = Z1*2,9-1,8 => x0 = 0,7*2,9-1,8 = 0,23 Die Wahrscheinlichkeit für eine MMT unter 0,23°C im Februar beträgt etwa 75,8% – Z2=(X2-16,9)/1,9 => X2 = Z2*1,9-16,9 => x0 = 0,7*1,9+16,9 ≈ 0,2 Die Wahrscheinlichkeit für eine MMT unter 18,23°C im August beträgt etwa 75,8% Statistik I für Geographen 53 Standardnormalverteilung Zusammenfassung • Warscheinlichkeiten können als Flächen unter der Normalverteilungskurve aufgefasst werden φ(x) Z= X −µ σ 0 • • Durch die z-Transformation ist jede Normalverteilung in eine Standardnormalverteilung überführbar -1 Z= 1 X −µ σ Für die Standardnormalverteilung liegen Flächenanteile tabelliert vor Statistik I für Geographen 54 Kapitel 10 Wahrscheinlichkeitsrechnung • • • • • • • Grundbegriffe der Wahrscheinlichkeitsrechnung Laplacesche Wahrscheinlichkeit und relative Häufigkeit Wahrscheinlichkeitsgesetze Wahrscheinlichkeitsfunktion und Verteilungsfunktion Parameter von Zufallsvariablen Theoretische Verteilungen Über- und Unterschreitungswahrscheinlichkeiten Statistik I für Geographen 55 Über- und Unterschreitungswahrscheinlichkeiten Klimastation: - Jahrelange Erhebung der jährlichen Niederschlagsmengen - Empirische Verteilung entspreche einer Normalverteilung - Mittelwert µ = 400 mm, Standardabweichung σ = 100 mm Frage: In wieviel % der Jahre fällt weniger als 500 mm Niederschlag f(x) 1 100mm 2 ∏ ? 500 mm Statistik I für Geographen 400 mm 56 Unterschreitungswahrscheinlichkeit • Standardisierung: z0 = (x0-µ)/σ = (500mm-400mm)/100mm = 1 φ(z) f(x) ? 500 mm 400 mm • • ? 0 1 Tabelle: Φ(1) = 0,8413 Fertig: In etwa 84% der Jahre fällt weniger als 500mm Niederschlag Statistik I für Geographen 57 Unterschreitungswahrscheinlichkeit Frage: In wieviel % der Jahre fällt weniger als 300 mm Niederschlag? • Standardisierung: z0 = (x0-µ)/σ = (300mm-400mm)/100mm = -1 φ(z) f(x) ? 300 mm 400 mm • • • ? -1 0 Tabelle: Φ(-1) ist nicht aufgeführt, aber: Φ(-1) = 1- Φ(1) =1-0,8413 Fertig: In etwa 16% der Jahre fällt weniger als 500mm Niederschlag Statistik I für Geographen 58 Überschreitungswahrscheinlichkeit Frage: In wieviel % der Jahre fällt mehr als 250 mm Niederschlag? • Standardisierung: z0 = (x0-µ)/σ = (250mm-400mm)/100mm = -1,5 φ(z) f(x) ? ? 250 mm • • • 400 mm -1,5 0 Tabelle: Vorsicht! Φ ist eine Verteilungsfunktion, daher sind nur Unterschreitungswahrscheinlichkeiten aufgeführt!! Aber: Die Standardnormalverteilung ist symmetrisch zur Y-Achse, daher gilt: W(Z > z0) = 1-W (Z < -z0) Tabelle: Φ(1,5) = 0,9332 Fertig: In etwa 93% der Jahre fällt mehr als 250mm Niederschlag Statistik I für Geographen 59 Über- und Unterschreitungswahrscheinlichkeiten Frage: In wieviel % der Jahre fällt zwischen 200 mm und 500mm Niederschlag • Standardisierung: z0 = (x0-µ)/σ = (200mm-400mm)/100mm = -2 z1 = (x1-µ)/σ = (500mm-400mm)/100mm = 1 φ(z) f(x) ? 200 mm 500 mm 400 mm • • • ? -2 0 1 Tabelle: Φ(-2) = 1- Φ(2) =1-0,9772 = 0,0228; Φ(1) = 0,8413 Der Flächeninhalt unter der Kurve ergibt sich aus Φ(1) - Φ(-2) = 0,8185 Fertig: In etwa 82% der Jahre fällt 200-500mm Niederschlag Statistik I für Geographen 60 Über- und Unterschreitungswahrscheinlichkeiten Frage: Welche Niederschlagsmenge wird in 90% der Jahre nicht übertroffen? φ(z) f(x) 0,9 ? 400 mm • • • • 0,9 0 ? Tabelle: Φ(z0) = 0,9 => z0 ≈ 1,28; Fertig? Nein! z0 = (x0 – 400mm)/100mm = 1,28 => x0 = z0*100mm + 400mm = 528mm Fertig: In etwa 90% der Jahre werden 528mm Niederschlag nicht übertroffen Statistik I für Geographen 61 Zusammenfassung (Prüfungsfragen) Fragetyp 1: Es wird nach einer Wahrscheinlichkeit gefragt 1. Unterschreitungs-WS („Mit welcher WS wird x0 unterschritten“) – Transformiere x0 in z0 – Schaue in Tabelle [falls z nicht aufgeführt: Ф(-z0)=1-Ф(-z)] 2. Überschreitungs-WS („Mit welcher WS wird x0 übertroffen“) – Transformiere x0 in z0 – Beachte: Ф ist Verteilungsfunktion => nur Unterschreitungswahrscheinlichkeiten => nutze Symmetrie [Ф(-z0)=1-Ф(-z)] – Schaue in Tabelle [falls z nicht aufgeführt: Ф(-z0)=1-Ф(-z)] 3. Werteintervall (Mit welcher WS liegt X zwischen x0 und x1) – Male auf jeden Fall Skizze – Wende 1. und 2. an Statistik I für Geographen 62 Zusammenfassung (Prüfungsfragen) Fragetyp 2: Es wird nach Wert gefragt, die Wahrscheinlichkeit ist angegeben 1. Unterschreitungs-WS („Welcher x0 – Wert wird in p% der Fälle unterschritten) Schlage den entsprechenden z0 – Wert nach „Retransformiere“: x0 = (z0*σ)+µ 2. Überschreitungs-WS („Welcher x0 – Wert wird in p% der Fälle überschritten) Beachte: Ф ist Verteilungsfunktion => nur Unterschreitungswahrscheinlichkeiten => nutze Intelligenz: Wenn x0 in p% der Fälle überschritten wird, wird x0 in (100-p)% der Fälle unterschritten Schlage den entsprechenden z0 – Wert nach „Retransformiere“: x0 = (z0*σ)+µ Statistik I für Geographen 63 Kleiner Tipp zum Schluß Eine Skizze ist oft Gold wert f(x) 0,9 ? 400 mm Statistik I für Geographen 64