htw saar 1 Sprechstunde zur Klausurvorbereitung Mittwoch, 15.02., 10 – 12 + 13.30 – 16.30 Uhr, Raum 2413 Bei Interesse in Liste eintragen: • Max. 20 Minuten • Einzeln oder Kleingruppen (z. B. bei gemeinsamer Klausurvorbereitung) Zusätzlich: • Beantwortung einzelner Fragen per E-Mail [email protected] Ab 01.03.: [email protected] WS 2016/2017 Hans-Peter Hafner htw saar 2 Wiederholung: Ziegenproblem Bi Auto hinter Tür i, i = 1, 2, 3 mit P(Bi ) = 1/3 für alle i. Da wir keine weiteren Informationen haben, sind alle drei Türen gleich wahrscheinlich. Der Spieler wähle Tür 1. Der Quizmaster zeigt die Ziege hinter Tür 3 (Ereignis A). Ist das Auto wahrscheinlicher hinter Tür 1 (nicht wechseln) oder hinter Tür 2 (wechseln)? Wir müssen P(A | B1), P(A | B2) und P(A | B3) berechnen: P(A | B1) = 1/2 Wenn das Auto hinter Tür 1, macht es keinen Unterschied, ob Moderator Tür 2 oder 3 öffnet. P(A | B2) = 1 Auto hinter Tür 2: Moderator kann dann nur Tür 3 öffnen. P(A | B3) = 0 Auto hinter Tür 3: Moderator kann diese Tür nicht öffnen. WS 2016/2017 Hans-Peter Hafner htw saar 3 Ziegenproblem Fortsetzung Wir haben alle benötigten Wahrscheinlichkeiten und können mit dem Satz von Bayes die Wahrscheinlichkeiten für Wechseln P(B2 | A) und Nicht-Wechseln P(B1 | A) berechnen: P(B1 | A) = P(A | B1) ∗ P(B1) P(A | B1) ∗ P(B1) + P (A | B2) ∗ P(B2) + P(A | B3) ∗ P(B3) ∗ = P(B2 | A) = ∗ ∗ ∗ = (1/6) / (3/6) = 1/3 P(A | B2) ∗ P(B2) P(A | B1) ∗ P(B1) + P (A | B2) ∗ P(B2) + P(A | B3) ∗ P(B3) ∗ = ∗ ∗ ∗ = (1/3) / (3/6) = 2/3 Da die 2. Wahrscheinlichkeit größer ist, empfiehlt es sich zu wechseln! WS 2016/2017 Hans-Peter Hafner htw saar 4 Simpson Paradoxon 1 Sind Frauen diskriminiert? WS 2016/2017 Hans-Peter Hafner htw saar 5 Simpson Paradoxon 2 Oder sind doch die Männer diskriminiert? Die Zulassungsquoten in den einzelnen Studiengängen unterscheiden sich! Studiengang 1: 72% Studiengang 2: 36% Mehr weibliche Bewerber in Studiengang mit niedrigerer Zulassungsquote. Darum Gewichtung: Frauen 0.2 * 0.8 + 0.8 * 0.4 = 0.16 + 0.32 = 0.48 Männer 0.8 * 0.7 + 0.2 * 0.2 = 0.56 + 0.04 = 0.60 WS 2016/2017 Hans-Peter Hafner htw saar 6 Simpson Paradoxon 3 – Bezug zu bedingten Wahrscheinlichkeiten Sei (Ω, P) ein Wahrscheinlichkeitsraum, und E1, …, En seien paarweise disjunkte Ereignisse mit ⋃ Ei = Ω. Ferner seien A und B Ereignisse mit P(A ∩ Ei) > 0 und P(A ∩ Ei) > 0 für jedes i = 1, …, n. Das Simpson-Paradox liegt vor, wenn neben den Ungleichungen P(B | A ∩ Ei) > P(B | A ∩ Ei) für jedes i = 1, …, n (oder für eine deutliche Mehrheit der i) auch die folgende Ungleichung gilt: P(B | A) < P(B | A) Es ist P(B | A) = ∑ und P(B | A) = ∑ P( Ei | A) * P(B | A ∩ Ei) P( Ei | A) * P(B | A ∩ Ei) In Beispiel: n = 2; Ei Bewerbung für Fach i; B Zulassung; A weiblich S. ausführlicher bei Henze, Kapitel 15.12. WS 2016/2017 Hans-Peter Hafner htw saar 7 Unabhängigkeit bei mehr als 2 Ereignissen Erinnerung: Zwei Ereignisse A und B heißen unabhängig, wenn die Information, dass das eine Ereignis eingetreten ist, die Wahrscheinlichkeit für das andere nicht verändert. P(A ∩ B) = P(A) * P(B) Seien nun A, B und C Ereignisse, so dass (i) A und B unabhängig (ii) A und C unabhängig Ist dann z. B. auch B ∩ C von A unabhängig? WS 2016/2017 Hans-Peter Hafner htw saar 8 Beispiel: Der Junge auf dem Reiterhof Zwei Mädchen, 13 und 14 Jahre alt, sind auf dem Reiterhof angekommen. Dort gibt es auch einen Jungen, dessen Alter a schwer zu schätzen ist. Wie könnte man herausbekommen, ob er schon über 14 ist, wenn man – das wäre ja peinlich – eine direkte Frage vermeiden möchte? Irgendwann stellen sie ihm die wirklich harmlos wirkende Frage ”Wie lange reitest Du eigentlich schon?“ (Antwort: 4 Jahre), und ein paar Tage später wollen sie wissen ”Wie alt warst Du denn, als Du angefangen hast zu reiten?“ (Antwort: 12). Bezeichnet man mit A die Information ”Alter > 14?“, so ist es dafür völlig belanglos zu wissen, dass er seit 4 Jahren reitet (B). Für sich genommen würde es auch nichts nutzen zu erfahren, dass er mit 12 angefangen hat (C). Aber mit B und C zusammen ist alles klar! => Die Kombination von für sich belanglosen Informationen führt zu neuen Erkenntnissen! WS 2016/2017 Hans-Peter Hafner htw saar 9 Beispiel: Münzwurf A Das Ergebnis zweier Würfe ist (Kopf, Zahl) oder umgekehrt. B Die erste Münze zeigt Kopf. C Die zweite Münze zeigt Zahl. (1) A und B sowie A und C sind unabhängig. P(A ∩ B) = P(A ∩ C) = 1/4 P(A) = 1/2 P(B) = P(C) = 1/2 ⇒ P(A ∩ B) = P(A) * P(B) und P(A ∩ C) = P(A) * P(C) (2) A und B ∩ C sind nicht unabhängig. P(B ∩ C) = 1/4 P(A ∩ (B ∩ C)) = 1/4, aber P(A) * P(B ∩ C) = 1/8 (oder P(A | B ∩ C) = 1 ≠ 1/2 = P(A)) WS 2016/2017 Hans-Peter Hafner htw saar 10 Unabhängigkeit für n Ereignisse Sei (Ω, P) ein Wahrscheinlichkeitsraum. Die Ereignisse A1, …, An heißen unabhängig, wenn gilt: P(Ai1 ∩ ··· ∩ Aik) = P(Ai1) * … * P (Aik) für alle k = 2, …, n und 1 ≤ i1 < … < ik ≤ n. WS 2016/2017 Hans-Peter Hafner htw saar 11 Bemerkungen 1 1) Jede Teilmenge einer Menge von unabhängigen Ereignissen ist unabhängig. 2) In einer unabhängigen Menge von Ereignissen sind insbesondere je zwei Ereignisse unabhängig (paarweise Unabhängigkeit). 3) P(A1 ∩ ··· ∩ An) = P(A1) * … * P (An) reicht nicht für Unabhängigkeit. Sonst wäre jede Menge von Ereignissen unabhängig, bei der ein Ereignis die Wahrscheinlichkeit 0 hat. WS 2016/2017 Hans-Peter Hafner htw saar 12 Unabhängigkeit für Zufallsvariable Zwei Zufallsvariable X und Y auf einem Wahrscheinlichkeitsraum (Ω, P) heißen (stochastisch) unabhängig, wenn gilt: P(X = xi, Y = yj) = P(X = xi) * P(Y = yj). Für unabhängige Zufallsvariable X und Y auf einem Wahrscheinlichkeitsraum (Ω, P) gilt die Multiplikationsregel für Erwartungswerte E(X * Y) = EX * EY. WS 2016/2017 Hans-Peter Hafner htw saar 13 Literatur Behrens 4.2 + 4.3 Henze 15/16 + 17.7/17.9 WS 2016/2017 Hans-Peter Hafner htw saar 14 KAPITEL 5 STETIGE ZUFALLSVARIABLEN WS 2016/2017 Hans-Peter Hafner htw saar 15 Motivation 1 Glücksrad Wir drehen ein Rad, dessen Umfang die Länge l hat und notieren die Position, an der es stoppt. Diskreter Fall Das Rad ist in m Sektoren unterteilt. ⇒ Jeder Sektor hat Wahrscheinlichkeit 1/m Stetiger Fall Das Rad kann an jeder Stelle des Intervalls [0, l] stoppen. Dieses Intervall – als Teilmenge der reellen Zahlen betrachtet – hat unendlich viele Punkte. => Problem: Definition der Wahrscheinlichkeit für einen Punkt? WS 2016/2017 Hans-Peter Hafner htw saar 16 Motivation 2 Lösung: Wahrscheinlichkeiten für Intervalle Sei [a, b] ⊂[0, l]. Definiere P([a, b] ) = (b – a) / l. => P([0, l]) = 1 Im stetigen Fall hat jedes einzelne ω ∈ Ω die Wahrscheinlichkeit 0. Positive Wahrscheinlichkeiten können nur für Intervalle definiert werden. WS 2016/2017 Hans-Peter Hafner htw saar 17 Formale Definition von Wahrscheinlichkeiten im stetigen Fall 1 Im Glücksrad-Beispiel war die Definition der Wahrscheinlichkeiten einfach, da eine Gleichverteilung über den ganzen Kreisumfang angenommen wurde. Meist gibt es aber unterschiedliche Wahrscheinlichkeiten und man möchte die Wahrscheinlichkeiten für beliebig kleine Intervalle berechnen. => Definition über Integrale Definition Dichtefunktion: Eine reellwertige Funktion f wird Dichtefunktion genannt, wenn (i) f(x) ≥ 0 für alle x. (ii) f( ) = 1. WS 2016/2017 Hans-Peter Hafner htw saar 18 Formale Definition von Wahrscheinlichkeiten im stetigen Fall 2 Definition Wahrscheinlichkeit: Sei f eine Dichtefunktion und sei Ω ein Wahrscheinlichkeitsraum. Dann ist für jedes in Ω enthaltene Intervall [c, d] die Wahrscheinlichkeit definiert als P([c, d]) = Für eine stetige Zufallsvariable X auf Ω ist die Verteilungsfunktion definiert als F(x) = P(X ≤ x) = Der Erwartungswert einer stetigen Zufallsvariablen mit zugehöriger Dichte f ist definiert als E(X) = WS 2016/2017 ∗ Hans-Peter Hafner htw saar 19 Normalverteilung 1 Satz von de Moivre – Laplace: Die Wahrscheinlichkeit, dass die Erfolgsanzahl bei n unabhängigen Bernoulli-Experimenten zwischen α und β (0 < α < β ≤ n) kann durch die Normalverteilung approximiert werden. de Moivre WS 2016/2017 Laplace Hans-Peter Hafner htw saar 20 Normalverteilung 2 Adolphe Quetelet Um 1835: Untersuchungen zu Körpermaßen von belgischen Soldaten ⇒ Körpergröße, Brustumfang und andere Maße entsprechen einer Normalverteilung WS 2016/2017 Hans-Peter Hafner htw saar 21 Normalverteilung 3 Carl Friedrich Gauß Theorie der Beobachtungsfehler bei Experimenten => Fehler sind normalverteilt Gauß hat die Normalverteilung nicht entdeckt, aber wichtige Anwendungen entwickelt. Daher wird sie oft auch Gauß-Verteilung genannt und die Kurve der Dichte wird Gauß-Kurve oder – wegen ihrer Form – Glockenkurve genannt. WS 2016/2017 Hans-Peter Hafner htw saar 22 Normalverteilung 4 Eine stetige Zufallsvariable X heißt normalverteilt, wenn sie eine Dichte f der folgenden Form besitzt: f(x) = * exp(-1/2 * ( !" # 2 )) Man schreibt: X ~ N($, %2). Man kann zeigen: $ ist der Erwartungswert und %2 ist die Varianz. N(0, 1) wird als Standard – Normalverteilung bezeichnet. WS 2016/2017 Hans-Peter Hafner htw saar 23 Normalverteilung 5 Je größer %2, desto flacher ist die Kurve. WS 2016/2017 Hans-Peter Hafner htw saar 24 Normalverteilung 6 Eine N($, %2) verteilte Zufallsvariable X kann in eine standard-normalverteilte transformiert werden durch Z= X # 2 X # E(Z) = E( 2 ) = 2 E(X − $) = 2 (E(X) - $) = 0 X # X V(Z) = V( 2 ) = V( 2) = 2 V(X) = 1 WS 2016/2017 Hans-Peter Hafner htw saar 25 Normalverteilung 7 Die Normalverteilung hat u. a. die folgenden Eigenschaften: • symmetrisch um den Erwartungswert $ • 68% der Werte liegen im Bereich einer Standardabweichung % um $,95% im Bereich von 2 Standardabweichungen und 99,7% im Bereich von 3 Standardabweichungen um $ WS 2016/2017 Hans-Peter Hafner htw saar 26 Normalverteilung 8 Wie berechnet man die Wahrscheinlichkeiten? Berechnung des Integrals kompliziert! => Es gibt Tabellen! Vorgehensweise: Die Tabelle enthält für die Standard-Normalverteilung die kumulierten Wahrscheinlichkeiten, dass ein Wert kleiner als $ + x * % ist. Um die Tabelle für eine beliebige Normalverteilung anwenden zu können, müssen die Werte transformiert werden. Die transformierten Werte nennt man z-Werte. WS 2016/2017 Hans-Peter Hafner htw saar 27 Normalverteilung 9 Intelligenzquotienten und Mitgliedschaft bei MENSA (Gemeinschaft Hochbegabter) Als Aufnahmeprüfung wird der Intelligenztest nach Stanford-Binet verwendet, der annähernd normalverteilt ist mit Mittelwert 100 und einer Standardabweichung von 16. Aufnahmekriterium ist, dass man zu den intelligentesten 2% der Bevölkerung gehört. Der z-Wert, der zu 0.98 gehört, ist 2.05. Somit muss man einen IQ von mindestens 100 + 2.05 * 16 = 132.8, also etwa 133 haben. WS 2016/2017 Hans-Peter Hafner