Wahrscheinlichkeitsrechnung [probability] Hinweis: Die Wahrscheinlichkeitsrechnung ist nicht Gegenstand dieser Vorlesung. Es werden lediglich einige Begriffsbildungen bereitgestellt und an Beispielen erläutert, die die Verwendung und Interpretation von Wahrscheinlichkeiten ermöglichen sollen, die (z.B.) SPSS in Form von p-Werten bei der Anwendung von Verfahren der schließenden Statistik exakt oder näherungsweise ermittelt. 1 Zufällige Ereignisse [random event] Zufälliger Versuch: Vorgang, der (zumindest gedanklich) beliebig oft wiederholbar ist und dessen Ausgang innerhalb einer Menge möglicher Ausgänge ungewiss (zufällig) ist. Ω ... Menge der möglichen (elementaren, einander ausschließenden) Versuchsausgänge ω ∈ Ω A ... Ereignisfeld, enthält Teilmengen von Ω, die Ereignisse A ∈ A Ein Ereignis A tritt ein, wenn der Versuchsausgang ω, den der Versuch liefert, ein Element der Menge A ist, d.h. wenn ω ∈ A gilt. 2 Beispiele: (1) Würfeln mit idealem Würfel: Ω = {1, 2, 3, 4, 5, 6} A = {2, 4, 6} Ereignis, dass eine gerade Zahl gewürfelt wird B = {3, 4, 5, 6} Ereignis, dass eine Zahl > 2 gewürfelt wird C = {6} Ereignis, dass eine 6 gewürfelt wird (2) Würfeln mit 2 unterscheidbaren Würfeln Ω = { (1, 1), (1, 2), . . . , (1, 6), (2, 1), . . . , (6, 6) } ω = ( Ergebnis Würfel 1, Ergebnis Würfel 2 ) ∈ Ω 3 (3) Zufällige Auswahl einer Versuchsperson (a) Fragebogen mit 1 Frage und 4 Antwortmöglichkeiten Ω = {a, b, c, d} (b) Fragebogen mit 2 Fragen und je 4 Antwortmöglichkeiten Ω = {(a, a), (a, b), (a, c), (a, d), (b, a), . . . , (d, d)} ω = (Antwort 1. Frage, Antwort 2. Frage) ∈ Ω Es sind 4 · 4 = 16 verschiedene elementare Versuchsausgänge (ausgefüllte Bögen) möglich. Ereignis A = {(a, a), (a, b), (a, c), (a, d)}: 1. Frage mit a beantwortet. 4 (4) Zufällige Auswahl einer Versuchsperson, die die Antwort auf eine Frage auf einer Ratingskala (10 cm lang) markiert: +————————×——————————————–+ 0 10 sehr unsympathisch ———————— sehr sympathisch Ω = [ 0, 10 ] Es gibt überabzählbar viele mögliche Antworten. 5 (5) Zahlenlotto 6 aus 49: Ω = Menge der möglichen Ziehungsergebnisse Auswahl von 6 aus 49 Zahlen möglich, es gibt also ! 49 6 = 13 983 816 verschiedene Ziehungsergebnisse. 6 Rechnen mit Ereignissen Beispiel (3b): Ω = {(a, a), (a, b), (a, c), (a, d), (b, a), . . . , (d, d)} A = {(a, a), (a, b), (a, c), (a, d)} (Erste Frage mit a“ beantwortet) ” B = {(a, b), (b, b), (c, b), (d, b), (a, c), (b, c), (c, c), (d, c)} (Zweite Frage mit b“ oder mit c“ beantwortet) ” ” Können A und B gleichzeitig eintreten? Ja, wenn (a, b) oder (a, c) geantwortet wird. 7 Verknüpfungen von Ereignissen A ∩ B ist das Ereignis, das eintritt, wenn A und B gleichzeitig eintreten. A ∩ B = {(a, b), (a, c)} A ∪ B ist das Ereignis, das eintritt, wenn A oder B eintritt. A ∪ B = {(a, a), (a, b), (a, c), (a, d), (b, b), (b, c), (c, b), (c, c), (d, b), (d, c)} 8 A \ B ist das Ereignis, das eintritt, wenn A eintritt, aber B nicht. A \ B = {(a, a), (a, d)} Ā ist das Ereignis, das eintritt, wenn A nicht eintritt, Ā heißt das komplementäre Ereignis zu A. Ā = {(b, a), (b, b), (b, c), (b, d), (c, a), . . . , (d, d)} = Ω\A 9 Spezielle Ereignisse ∅ ... unmögliches Ereignis (leere Menge, ∅ ⊆ Ω) Ω ... sicheres Ereignis (Ω ⊆ Ω) 10 Beziehungen zwischen Ereignissen A ⊆ B . . . A zieht B nach sich: Wenn A eintritt (ω ∈ A), dann tritt auch B ein (ω ∈ B). Sei beispielsweise C := {(a, b), (b, b), (c, b), (d, b)} (Zweite Frage mit b beantwortet), dann gilt C ⊆ B. Gilt A ∩ B = ∅, so heißen A und B unvereinbar. Sei beispielsweise D := {(b, a), (b, b), (b, c), (b, d)} (Erste Frage mit b beantwortet), dann gilt A ∩ D = ∅. 11 Das Ereignisfeld A wird nun aus genügend vielen Ereignissen gebildet, so dass alle obigen Operationen zwischen diesen Ereignissen ausführbar sind und außerdem Ω ∈ A (und damit auch ∅ ∈ A) gilt. Enthält Ω unendlich viele Elemente, so müssen die Forderungen noch ausgedehnt werden. 12 Wahrscheinlichkeiten Vorbetrachtung n–malige Durchführung eines zufälligen Versuches und Zählen, wie häufig ein uns interessierendes Ereignis A eingetreten ist: – absolute Häufigkeit: hn (A) 1 hn (A) n Erfahrung: Für große n stabilisieren sich die relativen Häufigkeiten. – relative Häufigkeit: fn (A) = 13 Beispiel: Spiel: Gegen einen Einsatz von x EURO darf ein Spieler 6 mal eine Münze werfen und erhält so viele EURO, wie oft Wappen“ gefallen ist. ” Ω = {0, 1, 2, 3, 4, 5, 6} Spiel n mal wiederholen und die Häufigkeiten hn ({ω}) der einzelnen Auszahlungen beobachten. Welcher Preis x wäre fair? 14 Absolute Häufigkeiten 0 1 2 3 4 5 6 Auszahlung 10 0 1 2 4 3 0 0 29 100 0 10 26 33 21 8 1 291 1000 15 87 226 310 258 89 15 3036 10 000 171 954 2299 3099 2377 942 166 30039 100 000 1555 9436 23524 30919 23599 9379 1588 300060 15 Relative Häufigkeiten 0 1 2 3 4 5 6 10 0.000 0.100 0.200 0.400 0.300 0.000 0.000 2.900 102 0.000 0.100 0.260 0.330 0.210 0.080 0.010 2.910 103 0.015 0.087 0.226 0.310 0.258 0.089 0.015 3.036 104 0.017 0.095 0.230 0.310 0.238 0.094 0.017 3.004 105 0.015 0.094 0.235 0.310 0.236 0.094 0.016 3.001 ∞ 0.016 0.094 0.234 0.312 0.234 0.094 0.016 3 16 Eigenschaften der relativen Häufigkeit (1) 0 ≤ fn (A) ≤ 1 (2) fn (Ω) = 1 (Ω tritt immer ein) fn (∅) = 0 (∅ tritt nie ein) (3) Gilt A ∩ B = ∅ (d.h. A und B sind unvereinbar), dann gilt fn (A ∪ B) = fn (A) + fn (B) (4) fn (A ∪ B) = fn (A) + fn (B) − fn (A ∩ B) (5) fn (Ā) = 1 − fn (A) 17 Wahrscheinlichkeit Axiomsystem (Kolmogorov, 1933) Eine Abbildung P : A → R heißt Wahrscheinlichkeit, wenn gilt: (1) 0 ≤ P (A) ≤ 1 für alle A ∈ A (2) P (Ω) = 1 (3) Wenn A ∩ B = ∅, dann gilt P (A ∪ B) = P (A) + P (B) (Additivität) (Genauer muss das Axiom (3) auf eine beliebige Folge von unvereinbaren Ereignissen erweitert werden.) Wahrscheinlichkeiten können als Modell für die Chance des Eintretens von Ereignissen verstanden werden. 18 Aus den Axiomen folgen weitere wichtige Formeln: – P (∅) = 0 – P (A ∪ B) = P (A) + P (B) − P (A ∩ B) – P (Ā) = 1 − P (A) – P (A \ B) = P (A) − P (A ∩ B) 19 Beispiel: Gegeben: Dann gilt: P (A) = 0.7 P (B) = 0.4 P (A ∩ B) = 0.15 P (A \ B) = 0.7 − 0.15 = 0.55 P (B \ A) = 0.4 − 0.15 = 0.25 P (A ∪ B) = 0.7 + 0.4 − 0.15 = 0.95 20 Darstellung in Vierfeldertafel: B B̄ A 0.15 0.55 0.7 Ā 0.25 0.05 0.3 0.4 0.6 1 21 Symmetrische Wahrscheinlichkeitsräume Modell z.B. für das Würfeln, den Münzwurf, die Roulette, die Ziehung von Lottozahlen Ausgangspunkt: Es gibt keinen erkennbaren Grund, einem der möglichen Versuchsausgänge eine größere Wahrscheinlichkeit zuzuordnen als einem anderen. Sei Ω = {ω1 , ω2 , . . . , ωn }. Dann gibt es n mögliche Versuchsausgänge. Nehmen wir an, dass jeder Versuchsausgang ωi gleich wahrscheinlich ist, so folgt: 1 P ({ωi }) = n P (Ω) = P ({ω1 }) + P ({ω2 }) + . . . + P ({ωn }) = n · 22 1 n =1 Für jedes Ereignis A ∈ A erhalten wir P (A) = X P ({ωi }) = i: ωi ∈A X i: ωi ∈A 1 n Also P (A) = = Anzahl der ωi in A n Anzahl der für A günstigen Fälle Anzahl aller möglichen Fälle Zur Bestimmung dieser Anzahlen sind häufig die Formeln der Kombinatorik hilfreich. 23 Unabhängigkeit [independence] Die Ereignisse A und B heißen unabhängig, wenn gilt: P (A ∩ B) = P (A) · P (B) Beispiele: Vierfeldertafel (Vergleiche Kreuztabelle) B B̄ A 0.2 0.3 0.5 Ā 0.2 0.3 0.5 0.4 0.6 1 24 Exkurs: Bedingte Wahrscheinlichkeit [conditional probability] Seien A und B Ereignisse mit P (B) > 0. Dann heißt P (A ∩ B) P (A|B) := P (B) die bedingte Wahrscheinlichkeit von A unter B. Sind A und B unabhängig, dann gilt P (A ∩ B) P (A) · P (B) P (A|B) = = = P (A) P (B) P (B) sowie P (B ∩ A) P (B) · P (A) P (B|A) = = = P (B) P (A) P (A) 25 Zweimaliges Würfeln: Ω = {(1, 1), (1, 2), . . . , (6, 6)} Wahrscheinlichkeit für zweimaliges Würfel einer 6: 1 P ({(6, 6)}) = 36 Wahrscheinlichkeit, das erster Wurf eine 6 ist: 6 1 P ({(6, 1), . . . , (6, 6)}) = = 36 6 Wahrscheinlichkeit, das zweiter Wurf eine 6 ist: P ({(1, 6), . . . , (6, 6)}) = 6 1 = 36 6 Daraus folgt P ({(6, 1), . . . , (6, 6)} ∩ {(1, 6), . . . , (6, 6)}) = P ({(6, 1), . . . , (6, 6)}) · P ({(1, 6), . . . , (6, 6)}) 26 Vergleich mit empirischer Unabhängigkeit in Kontingenztafeln: Interpretieren wir die beobachteten relativen Häufigkeiten als Schätzungen für die entsprechenden Wahrscheinlichkeiten (z.B. Wahrscheinlichkeit, zufällig einen Bewerber auszuwählen, der abgelehnt worden ist ≈ 1/3, einen vom naturwiss. Gym. ≈ 2/7), dann sollten sich bei Unabhängigkeit die relativen Häufigkeiten in der Nähe der Produkte dieser Wahrscheinlichkeiten ergeben und damit die zu erwartenden absoluten Häufigkeiten in der Nähe der Werte der Indifferenztabelle. 27 Die Definition der Unabhängigkeit harmoniert in vielen Fällen mit der üblichen Vorstellung; eine Gefahr für Fehlinterpretationen besteht z.B. bei einer Kopplung über eine dritte Einflussgröße. Zum Beispiel ist die – Zahl der beobachteten Störche im Monat x mit der – Anzahl der Geburten im Monat x über saisonale Schwankungen gekoppelt. Beobachtete Abhängigkeiten dürfen also nicht mit Kausalität verwechselt werden. 28 Bei mehr als zwei Ereignissen muss zwischen der – (oben definierten) paarweisen Unabhängigkeit von jeweils zwei Ereignissen und – der (vollständigen) Unabhängigkeit von mehr als zwei Ereignissen unterschieden werden. 29 Beispiel: Würfeln mit zwei Würfeln A . . . erster Würfel: gerade Zahl B . . . zweiter Würfel: gerade Zahl C . . . Summe der Augenzahlen ungerade P (A) = P (B) = P (C) = 1/2 P (A ∩ B) = P (A ∩ C) = P (B ∩ C) = 1/4 Daher liegt paarweise Unabhängig vor, aber es gilt P (A ∩ B ∩ C) = 0 6= 1/2 · 1/2 · 1/2 = P (A)P (B)P (C) 30