Wahrscheinlichkeitstheorie Was will die Sozialwissenschaft damit? Regelmäßigkeit (Erkennen von Mustern und Zusammenhängen) versus Zufall Auch im Alltagsleben arbeiten wir mit Wahrscheinlichkeiten, besteigen ein Flugzeug, studieren ein bestimmtes Fach, essen Rindfleisch etc. Subjektive Wahrscheinlichkeiten subjektive Mutmaßung über das Eintreten eines Ereignisses und objektive Wahrscheinlichkeiten studieren von Zufallsgesetzen. Der statistische Wahrscheinlichkeitsbegriff bezieht sich auf - im Prinzip beliebig oft wiederholbare Vorgänge, deren Ausgang nicht vorhersehbar ist. Beispiel: Münze werfen, würfeln, Lotto und Roulette spielen Zufallsexperiment ⇒⇒ ein solcher wiederholbarer Vorgang, also der Münzwurf Elementarereignis ⇒⇒ ein Ergebnis eines solchen Zufallsexperimentes (z.B. Kopf oder Zahl) Ereignisraum ⇒⇒ die Menge der mit einem Zufallsexperiment verbundenen Elementarereignisse (die Augenzahlen 1, 2, 3 bis 6 beim Würfeln) ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 1======================== Beispiel: Münzwurf - bei 10 Würfen haben wir 4 mal Kopf erhalten Zählen, wie häufig ein Elementarereignis auftritt: Die relative Häufigkeit des Elementarereignisses: H(A)= nA/n nA= Häufigkeit des Elementarereignisses n= die Anzahl der Würfe insgesamt also hier: H(A)= 4 /10 = 0.40 Die relative Häufigkeit für das Ereignis Kopf beträgt 0,40 oder 40%. Mit wachsendem n, das heißt mit wachsender Anzahl von Würfen konvergiert H(A) auf einen konstanten Wert, den man als Wahrscheinlichkeit von A oder p(A) bezeichnet. (P = probability, probabilité) H(A) ist eine Schätzung von p(A), die um so genauer ist, je größer n ist. Gleichwahrscheinliche Ereignisse Beim Würfeln, Roulette-Spiel, Lotto-Spiel etc. sind die wahren Wahrscheinlichkeiten für die Elementareignisse bekannt. Für einander ausschließende Ereignisse Ei (i=1,....k) gleicher Wahrscheinlichkeit beträgt diese: ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 2======================== p(Ei)=1/k Die Wahrscheinlichkeit, eine bestimmte Zahl zu würfeln, beträgt also: p=1/6= .166 p(A)=1 ⇒ ⇒ sicheres Ereignis p(A)=0 ⇒⇒ unmögliches Ereignis Alle Ereignisse, die nicht zum Ereignis A gehören, bezeichnet man als das entgegengesetzte oder komplementäre Ereignis A (non A) zu A. Die Vereinigung von A mit allen komplementären Ereignissen stellt ein sicheres Ereignis dar. p(non A)= 1 - p(A) ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 3======================== Variationen, Permutationen, Kombinationen 1. Variationsregel Wenn jedes von k sich gegenseitig ausschließenden Ereignissen bei jedem Versuch auftreten kann, ergeben sich bei n Versuchen kn verschiedene Ereignisabfolgen. Wie wahrscheinlich ist es 2-mal hintereinander Zahl zu werfen? 22 = 4 d.h. 1 günstiges von 4 möglichen Ereignissen ⇒ p=1/4=.25 Wie wahrscheinlich ist es 6-mal hintereinander Zahl zu werfen? 26 = 64 d.h. 1 günstiges von 64 möglichen Ereignissen ⇒ p=1/64=.015 2. Variationsregel Werden n voneinander unabhängige Zufallsexperimente durchgeführt und besteht der Ereignisraum des 1. Zufallsexperimentes aus k1, der Ereignisraum des 2. Zufallsexperimentes aus k2, ... und der Ereignisraum des n-ten Zufallsexperimentes aus kn verschiedenen Elemtarereignissen, sind k1 * k2 * ....kn verschiedene Ereignisabfolgen möglich. Beispiel: Labyrinth mit zuerst 2, dann wiederum 2 , dann 3 Wegalternativen. richtige Wege=1 ; mögliche Wege=2 mal 2 mal 3=12 p=1/12=0,083 ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 4======================== Die Binomialverteilung Wahrscheinlichkeitsverteilung für zwei alternative Ereignisse mit gleicher oder ungleicher Wahrscheinlichkeit. Beispiel: Kopf vs. Zahl/ 6 würfeln versus nicht 6 etc.) Frage: Wie wahrscheinlich ist es, bei 10 Würfen 7-mal Zahl zu werfen, allgemein: wie wahrscheinlich ist es, daß von n Ereignissen k-mal A auftritt. Ein Wurf (n=1) p+q=1 p=0,50 q=0,50 Zwei Würfe (n=2) ZZ ZK KZ KK f(X=0)= 1/4= 0,25 wenn KK f(X=1)= 1/2= 0,50 wenn ZK oder KZ f(X=2)= 1/4= 0,25 wenn ZZ Drei Würfe ZZZ ZZK ZKZ ZKK KZZ KKZ KZK KKK f(X=0)= 1/8= 0,125 wenn KKK f(X=1)= 3/8= 0,375 wenn ZKK oder KKZ oder KZK f(X=2)= 3/8= 0,375 wenn ZZK oder ZKZ oder KZZ f(X=3)= 1/8= 0,125 wenn ZZZ Hier war jeweils p=q=0,50 - beim Würfeln wäre die Wahrscheinlichkeit für eine bestimmte Zahl p=0,166 und q=0,833. Die Wahrscheinlichkeit, k-mal A in n-Versuchen zu erhalten, beträgt: ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 5======================== p ⇒⇒ Wahrscheinlichkeit des Eintretens von A q ⇒⇒ 1-p Wahrscheinlichkeitsfunktionen von Binomialfunktionen (Folie) Die Wahrscheinlichkeiten für alle xi addieren sich zu 1. Durch einfache Addition der Wahrscheinlichkeiten lassen sich Fragen beantworten wie: "Wie wahrscheinlich ist es, daß das Ereignis mindestens (höchstens) x-mal auftritt." Wie liest man die Tabelle der Binomialverteilung? ⇒ Folie Tabelle Beispiel: Die Merkmalsalternative A mit p(A)=0,25 tritt in 6 Versuchen 4-mal auf ⇒ 0,033 ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 6======================== Binomialverteilung n=7 p=0,30 0,35 f(x) 0,3 0,25 0,2 0,15 0,1 0,05 0 X 0 1 2 3 4 5 6 0,08 0,24 0,31 0,22 0,09 0,02 0,003 7 0,0002 Binomialverteilung n=10 p=0,50 0,3 0,25 0,2 0,15 0,1 0,05 0 X 0 1 2 3 4 5 6 7 8 9 0,001 0,009 0,043 0,117 0,205 0,246 0,205 0,117 0,043 0,009 Eigenschaften der Binomialverteilung •• eingipflig (unimodal) •• symmetrisch für p=0,50, für p<0,50 linkssteil ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 7======================== 10 0,001 Normalverteilung Bei der Binomialverteilung werden die Ergebnisse von Zufallsexperimenten gezählt ⇒ diskrete Zufallsvariable Normalverteilung ⇒ stetige Zufallsvariable ⇒ das Ergebnis des Zufallsexperiment ist eine kontinuierliche Größe. Metrische Merkmale wie die Körpergröße lassen sich theoretisch beliebig genau erfassen, praktisch allerdings nur diskret messen. Dichtefunktion der Normalverteilung (Folie) Gefragt wird nicht nach der Wahrscheinlichkeit bestimmter Ereignisse (geht gegen Null), sondern nach der Wahrscheinlichkeit von Ereignissen, die sich in einem bestimmten Intervall befinden. Der f(x)-Wert bezeichnet hier nicht die Wahrscheinlichkeit eines bestimmten x-Wertes, sondern wird als (Wahrscheinlichkeits-)Dichte bezeichnet. Die Gesamtfläche unter der Kurve der Dichte wird gleich 1 gesetzt. Die Wahrscheinlichkeit eines Intervalls ∆X entspricht dann dem Flächenanteil. Eigenschaften der Normalverteilung •• glockenförmiger Verlauf •• symmetrisch •• Modus, Median und arithmetisches Mittel fallen zusammen •• nähert sich asymptotisch der X-Achse •• an den Stellen µ + σ (Mittelwert + Standardabweichungen) und µ - σ befinden sich die Wendepunkte •• zwischen den zu den Wendepunkten gehörenden xWerten liegen ca. zwei Drittel der Gesamtfläche ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 8======================== Die Normalverteilung wird durch die Parameter µµ und σσ eindeutig festgelegt. Beispiele: Verschiedene Normalverteilungen (Bortz S.73) Standardnormalverteilung ist eine Normalverteilung mit µ = Erwartungswert (Mittelwert) = 0 σ = Standardabweichung = 1 Bedeutsamkeit der Normalverteilung: • als empirische Verteilung (sozialwissenschaftlich relevante Merkmale erweisen sich als normalverteilt) • als Verteilungsmodell für statistische Kennwerte (Beispiel Kugeln mit unterschiedlichem Gewicht werden aus einer Urne gezogen und der Mittelwert berechnet, dieser ist normalverteilt) • als mathematisches Basismodell, aus der sich weitere Verteilungen ableiten lassen • als Modell der statistischen Fehlerverteilung (Messungen sind fehlerbehaftet, die Fehlerkomponente ist normalverteilt, der Erwartungswert gleich Null) ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 9======================== Die z-Transformation: Jede Normalverteilung kann in eine Standardnormalverteilung mit folgenden Parametern transformiert werden: µ = Mittelwert = 0 σ = Standardabweichung = 1 Berechnung von z-Werten zi=(xi - x) / s 1. Beispiel: Der Mittelwert eines Testes betrage 50, die Standardabweichung sei 9 und eine Person habe den Test mit dem Wert 54 abgeschlossen: zi=(xi - x) / s = (54-50)/9= 4/9= 0,44 2. Beispiel: Der Mittelwert eines Testes betrage 50, die Standardabweichung sei 9 und eine Person habe den Test mit dem Wert 59 abgeschlossen: zi=(xi - x) / s = (59-50)/9= 9/9= 1,00 Die Normalverteilungstabelle benutzen: Was gibt die Tabelle wieder: die Fläche, die durch die Begrenzungen von -∞und z gekennzeichnet ist, also : die Wahrscheinlichkeit, daß die Zufallsvariable z einen Wert annimmt, der nicht größer als z ist. ===============Wahrscheinlichkeitstheorie, Verteilungen === Folie 10========================