Statistik II f ur Studierende der Soziologie und

Werbung
Statistik II fu
r Studierende der Soziologie und
Nebenfachstudierende
Thomas Augustin
SoSe 2010
Besonderer Dank gilt den Kolleg(innen) Prof. Dr. Thomas Kneib und Dr. Carolin Strobl, die im Rahmen ihrer Vorlesungen im SoSe 08 bzw. SoSe 09
das ursprungliche Material weiterentwickelt haben.
Einleitung
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Deskriptive vs. induktive Statistik
Deskriptive vs. induktive Statistik
Deskriptive Statistik (Statistik I):
Statistische Beschreibung einer Gesamtheit (Grundgesamtheit oder Stichprobe).
Keine Verallgemeinerung von einer Stichprobe auf die zugehorige Grundgesamtheit
angestrebt.
Induktive Statistik (Statistik II):
Induktion: Schluss vom Teil auf das Ganze, von vielen Einzelbeobachtungen auf
allgemeine Gesetze
Speziell: Schluss von einer Stichprobe auf Eigenschaften der Grundgesamtheit ( In"
ferenz\ )
Stichprobe nur Mittel zum Zweck, um Informationen uber die Eigenschaften der
Grundgesamtheit zu gewinnen.
Einleitung
3
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Deskriptive vs. induktive Statistik
Typisches Beispiel: Wahlumfrage
Grundgesamtheit: Alle Wahlberechtigten bei der nachsten Bundestagswahl.
Stichprobe: 1000 reprasentativ ausgewahlte\ Wahlberechtigte
"
Gesucht: Information uber alle Wahlberechtigten, also die Grundgesamtheit
Einleitung
4
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Fragestellungen der induktiven Statistik
Fragestellungen der induktiven Statistik
1. Punktschatzung:
Zum Beispiel: Wie gro ist der Anteil der schwarz-gelb-Wahler unter allen Wahlberechtigten?
Wie erhalt man aus der Stichprobe gute Schatzwerte fur Charakteristika ( Para"
meter\) der Grundgesamtheit?
Wann ist ein Schatzverfahren gut/besser als ein anderes?
2. Bereichsschatzung:
Typischerweise stimmt der Punktschatzer nicht mit dem wahren Wert uberein.
Ungenauere Aussagen, dafur aber zuverlassiger.
Realistischer: Gib einen Bereich an, der den wahren Anteil der schwarz-gelb"
Wahler mit hoher Wahrscheinlichkeit enthalt\.
Einleitung
5
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Fragestellungen der induktiven Statistik
3. Hypothesentests:
 berprufe aus substanzwissenschaftlicher Theorie abgeleitete Hypothesen uber die
U
Grundgesamtheit anhand der Daten.
Zum Beispiel: Verdienen Manner wirklich mehr als Frauen?
Ist der Unterschied signikant\?
"
4. Regressionsmodelle incl. Varianzanalyse:
Modelle zur Beschreibung des Einusses von Variablen
Zum Beispiel: Welche personlichen Merkmale beeinussen die Wahlentscheidung
besonders stark?
Einleitung
6
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Inferenzfehler
Inferenzfehler
Zentrales Problem der induktiven Statistik:
Jeder Induktionsschluss ist potentiell fehlerbehaftet
Beispielsweise ist der wahre Anteil der Wahler einer Partei in der Grundgesamtheit
nicht exakt mithilfe der Stichprobe vorhersagbar.
Entscheidende Idee: Kontrolle des Fehlers mit Hilfe der Wahrscheinlichkeitsrechnung.
Vorgehen:
{ Stichprobenziehung zufallig
{ Verwende Methoden der
rung/Kontrolle des Fehlers
Wahrscheinlichkeitsrechnung
zur
Quantizie-
! Kap. 1: Wahrscheinlichkeitsrechnung
! Kap. 2: Wie nutzt man Wahrscheinlichkeitsuberlegungen fur die Statistik?
Induktive Statistik
Einleitung
7
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeitsrechnung
Ziel ist die Vermittlung eines Gefuhls\ fur Wahrscheinlichkeiten.
"
Gerade fur Sozialwissenschaftler ist probabilistisches Denken (d.h. das Denken in
Wahrscheinlichkeiten) unerlasslich!
Zunachst grundlegende Rechenregeln fur Wahrscheinlichkeiten, und wichtige Modelle,
dann auch spezielle Regeln fur groe Stichproben (Befragungen!) Oft einfacher, da
sich gewisse Regelmaigkeiten einstellen: Insbesondere nahert sich die relative Haugkeit eines Ereignisses unter gewissen Voraussetzungen seiner Wahrscheinlichkeit an
! auch wichtig fur Interpretation.
Dem so genannter Hauptsatz der Statistik folgend wachst mit dem Stichprobenum"
fang in gewisser Weise die Reprasentativitat der Stichprobe\
Bei naiver Herangehensweise (ohne Wahrscheinlichkeitsrechnung) kann man sich
leicht tauschen. Z.B. bewerten sowohl medizinische Experten als auch Laien Risiken
oft falsch.
Einleitung
8
1 Wahrscheinlichkeitsrechnung
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
1.1 Mengen und elementare Mengenoperationen
Denition 1.1.
Eine Menge ist eine Zusammenfassung verschiedener Objekte zu einem Ganzen. Die
einzelnen Objekte einer Menge werden Elemente genannt.
Mengen werden ublicherweise mit Grobuchstaben bezeichnet, z.B. A, B , C , , . . .
Mengen werden spater benutzt, um den Ausgang von Zufallsexperimenten zu beschreiben.
Bsp. 1.2.
A = fHorer einer Vorlesungg.
A = f1; 2; 3; 4; 5; 6g (Menge der Ergebnisse eines Wurfelwurfs).
Die Reihenfolge der Aufzahlung spielt (im Gegensatz zu Tupeln) keine Rolle:
f1; 2; 3; 4; 5; 6g = f1; 3; 5; 2; 4; 6g
1 Wahrscheinlichkeitsrechnung
10
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Jedes Element wird nur einmal genannt.
B = fK; Z g (Menge der Ergebnisse eines Munzwurfs, K =Kopf, Z =Zahl).
Charakterisierung von Mengen mit einer gewissen Eigenschaft:
f1; 2; 3; : : : ; 10g = fx j x ist eine naturliche Zahl 10g
Die Menge aller x mit der Eigenschaft x ist eine naturliche Zahl 10\.
"
Standardmengen:
N = f1; 2; 3; : : :g
N0 = f0; 1; 2; 3; : : :g
Z = f0; 1; 2; : : :g
R = ( 1; 1)
;
1 Wahrscheinlichkeitsrechnung
: Menge der naturlichen Zahlen,
: Menge der naturlichen Zahlen inklusive 0,
: Menge der ganzen Zahlen,
: Menge der reellen Zahlen,
: leere Menge.
11
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Grundlegende Begrie der Mengenlehre: Illustration anhand der Mengen
=
A =
B =
C =
fCDU/CSU, SPD, FDP, Grune, Linke, Sonstigeg
fCDU/CSU, SPD, FDP, Gruneg
fCDU/CSU, SPD, FDPg
fSPD, FDP, Gruneg
Elementeigenschaft:
x ist Element der Menge A:
x2A
x ist nicht Element der Menge A: x 2= A
Teilmengen: A ist Teilmenge von B , in Zeichen A B , wenn jedes Element von A
auch in B ist.
1 Wahrscheinlichkeitsrechnung
12
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Veranschaulichung von Mengen im Venn-Diagramm:
Fur jede Menge A gilt:
;A
Die leere Menge ist Teilmenge jeder Menge, denn jedes
Element in ; ist in A
(Aussagen uber den leeren Quantor sind wahr)
AA
1 Wahrscheinlichkeitsrechnung
\ enthalt implizit " = \,
"
deshalb in Literatur manchmal auch
d.h.
statt
13
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Schnittmenge: Die Schnittmenge A \ B ist die Menge aller Elemente, die sowohl in
A als auch in B enthalten sind:
A \ B = fxjx 2 A und x 2 B g
1 Wahrscheinlichkeitsrechnung
14
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Weitere Eigenschaften:
* Gilt A B , so ist A \ B
= A.
* Fur jede Menge A gilt: A \ A = A und A \ ; = ;.
* Zwei Mengen A und B mit A \ B = ;, d.h. zwei Mengen, die kein gemeinsames
Element haben, heien disjunkt.
* Die Schnittmenge aus n Mengen A1; : : : ; An enthalt alle Elemente, die in jeder
der Mengen A1; : : : ; An enthalten sind und wird bezeichnet mit
n
\
i=1
Ai := A1 \ A2 \ : : : \ An:
Vereinigungsmenge: Die Vereinigungsmenge A [ B ist die Menge aller Elemente,
die in A oder B enthalten sind:
A [ B = fxjx 2 A oder x 2 B g
1 Wahrscheinlichkeitsrechnung
15
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Bem. 1.3.
* Vorsicht: Das oder\ ist nicht exklusiv gemeint, also nicht entweder oder\,
"
"
sondern als in A oder in B oder in beiden\.
"
* Die Vereinigungsmenge aus n Mengen A1; : : : ; An enthalt alle Elemente, die in
mindestens einer der Mengen A1; : : : ; An enthalten sind und wird bezeichnet mit
n
[
i=1
1 Wahrscheinlichkeitsrechnung
Mi := M1 [ M2 [ : : : [ Mn
16
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Dierenzmenge: Die Dierenzmenge A n B ist die Menge aller Elemente, die in A,
aber nicht in B enthalten sind:
A n B = fxjx 2 A aber x 2= B g
Im Beispiel:
1 Wahrscheinlichkeitsrechnung
17
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Komplementarmenge: Die Komplementarmenge A bezuglich einer Grundmenge ist die Menge aller Elemente von , die nicht in A sind:
Im Beispiel:
1 Wahrscheinlichkeitsrechnung
A = fx 2 jx 2= Ag = fx : x 2= Ag
18
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Bem. 1.4.
* Die Komplementarmenge ist nur unter Bezugnahme auf eine Grundmenge
denierbar.
* Es gilt A = n A.
* Es existieren noch weitere Schreibweisen fur die Komplementarmenge,
z.B. AC , C A.
* Tertium non datur\ (Grundlegendes Prinzip der Mengenlehre (und der Logik):
"
Fur jedes Element x 2 gilt entweder x 2 A oder x 2 A
Potenzmenge: Die Potenzmenge P (A) ist die Menge aller Teilmengen von A:
P (A) = fM jM Ag:
Im Beispiel:
P (B ) =
1 Wahrscheinlichkeitsrechnung
19
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Machtigkeit: Die Machtigkeit jAj einer Menge A ist die Anzahl der Elemente von A
Im Beispiel:
Fur jede Menge B gilt jP (B )j = 2jBj
1 Wahrscheinlichkeitsrechnung
20
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Rechenregeln fur Mengen
1. Kommutativgesetze (Vertauschung):
A \ B = B \ A; A [ B = B [ A:
2. Assoziativgesetze (Zusammenfassen):
(A \ B ) \ C = A \ ( B \ C ) :
(A [ B ) [ C = A [ ( B [ C ) :
1 Wahrscheinlichkeitsrechnung
21
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
3. Distributivgesetze (Ausklammern/Ausmultiplizieren):
(A [ B ) \ C = (A \ C ) [ (B \ C ):
(A \ B ) [ C = (A [ C ) \ (B [ C ):
4. De Morgansche Regeln:
(A [ B ) = A \ B
(A \ B ) = A [ B
5. Aus A B folgt B A.
6. Fur die Dierenzmenge gilt A n B = A \ B .
7. Fur die Potenzmenge gilt jP (A)j = 2jAj.
1 Wahrscheinlichkeitsrechnung
22
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Das kartesische Produkt
Das kartesische Produkt zweier Mengen
A = fa1; a2; a3; : : : ; ak g
B = fb1; b2; b3; : : : ; bmg
ist die Menge
A B :=
n
(ai; bj ) i = 1; : : : ; k; j = 1; : : : ; m
o
Sie besteht also aus allen moglichen Kombinationen, so dass
AB =
(a1; b1); (a1; b2); (a1; b3); : : : ; (a1; bm);
(a2; b1); (a2; b2); (a2; b3); : : : ; (a2; bm);
..
(ak; b1); (ak; b2); (ak; b3); : : : ; (ak; bm)
1 Wahrscheinlichkeitsrechnung
23
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Bsp. 1.5.
A =
B =
AB =
f1; 2; 3g
f1; 2; 3; 4g
Achtung: Bei den Elementen von A B handelt es sich um Tupel, das heit die
Reihenfolge ist wichtig! (z.B. (1; 2) ist etwas anderes als (2; 1), vgl. Statistik I Kapitel
5)
1 Wahrscheinlichkeitsrechnung
24
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.1 Mengen und elementare Mengenoperationen
Verallgemeinerungen:
Das kartesische Produkt der Mengen 1; 2; : : : ; n wird mit
n
i=1
i = 1 2 : : : n
bezeichnet und besteht aus allen moglichen n-Tupeln, die sich (unter Beachtung der
Reihenfolge) aus Elementen aus 1; 2; : : : ; n bilden lassen.
Die Mengen 1; 2; : : : ; n mussen nicht endlich sein; fur endliche Mengen gilt
n i=1
= j
1j j
2j : : : j
nj
Kartesische Produkte werden verwendet, um Ergebnisse komplexer Experimente aus
Einzelexperimenten zusammenzusetzen.
1 Wahrscheinlichkeitsrechnung
25
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine
Formalisierung
1.2.1 Zufallsvorgange
Ein Zufallsvorgang fuhrt zu einem von mehreren, sich gegenseitig ausschlieenden
Ergebnissen. Es ist vor der Durchfuhrung ungewiss, welches Ergebnis eintreten wird.
Was benotigen wir zur Beschreibung eines Zufallsvorganges?
Zwei wesentliche Aspekte:
a) Welche Ergebnisse eines Zufallsvorgangs sind moglich? (Was kann alles passieren?)
b) Mit welcher Wahrscheinlichkeit treten die einzelnen Ergebnisse ein?
1 Wahrscheinlichkeitsrechnung
26
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Zur Beantwortung geht man folgendermaen vor:
zu a) Festlegen eines Ergebnisraums (Grundraum, Stichprobenraum) , der alle moglichen Ergebnisse ! enthalt.
Beispiele:
Teilmengen A von bezeichnet man als Ereignisse, Ereignisse sind also bestimmte
Mengen von Ergebnissen.
Beispiele:
Die einelementigen Teilmengen (also die Ereignisse, die ein Ergebniss ! enthalten)
werden als Elementarereignisse bezeichnet.
zu b) Eine Wahrscheinlichkeitsbewertung ordnet jedem Ereignis seine Wahrscheinlichkeit
zu. Eine Wahrscheinlichkeit ist also eine Abbildung von Ereignissen (Elementen
1 Wahrscheinlichkeitsrechnung
27
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
der Potenzmenge von auf reelle Zahlen:
P : P (
)
A
! R
7 P (A)
!
Dabei sollen gewisse fundamentale Rechenregeln gelten, z.B.
Bsp. 1.6.
Es wird sich { fur die Standardtheorie { zeigen: Ein Zufallsvorgang ist ausreichend genau beschrieben, wenn jedem Elementarereignis eine Wahrscheinlichkeit
zugeordnet ist, die Wahrscheinlichkeiten komplexerer Ereignisse konnen dann
berechnet werden.
1 Wahrscheinlichkeitsrechnung
28
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Beachte: Der Begri der Wahrscheinlichkeit ist an sich sehr komplex und hat eine
aufregende Geschichte. Es gab { und gibt immer noch { eine intensive Grundsatzdebatte, was Wahrscheinlichkeiten sind, wie sie zu verstehen und zu formalisieren sind.
Es hat sich aber eingeburgert, diese { meines Erachtens sehr spannende und wichtige
Grundlagendiskussion { zugunsten einer mathematischen pragmatischen Sicht auszublenden und basierend auf einem intuitiven Verstandnis sowie nahe liegenden (und
mathematischen axiomatisierten) Rechenregeln einfach zu rechnen\ und die Ergebnisse
"
fur eine leistungsfahige statistische Analyse zu nutzen. Diese Vorgehensweise ist auch
deshalb pragmatisch erfolgreich, da sich damit eine Reihe von Eigenschaften von Wahrscheinlichkeiten mathematisch folgern lassen, die wiederum zum Verstandnis und zur
Interpretierbarkeit des formalen Konstrukts Wahrscheinlichkeit\ beitragen. Wir folgen
"
dieser Vorgehensweise insofern, als auch hier zunachst etwa mit Wahrscheinlichkeiten
gerechnet wird. Einige Anmerkungen zur Geschichte und Interpretation folgen dann am
Schluss des Kapitel 1.2
1 Wahrscheinlichkeitsrechnung
29
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
1.2.2 Laplace-Wahrscheinlichkeiten und Urnenmodelle
a) Laplace-Wahrscheinlichkeiten (kombinatorische Wahrscheinlichkeiten)
Haug: Alle moglichen Elementarereignisse sind gleich wahrscheinlich, d.h. P (fwj g) =
1
j
j . In diesem Fall sprechen wir von einem Laplace-Experiment.
Abzahlregel:
Anzahl der fur A gunstigen Ergebnisse
P (A) =
Anzahl aller moglichen Ergebnisse
Laplace-Wahrscheinlichkeit: In einem Laplace-Experiment gilt fur P (A) mit jAj = M
und j
j = N :
jAj = M :
P (A) =
j
j N
1 Wahrscheinlichkeitsrechnung
30
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bsp. 1.7. [Dreimaliger Munzwurf]
Wir werfen dreimal unabhangig voneinander eine faire Munze und notieren jeweils, ob die
Munze Wappen oder Zahl anzeigt. Man beschreibt den Ergebnisraum und berechne die
Wahrscheinlichkeit, mindestens einmal Wappen zu erhalten und genau zweimal Wappen
zu erhalten.
1 Wahrscheinlichkeitsrechnung
31
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
b) Urnenmodelle
Es hat sich eingeburgert, gewisse Grundsituationen, die in der praktischen Stichprobenziehung immer wieder vorkommen, als Urnenmodelle\ zu prototypiesieren und damit
"
vom konkreten Kontext zu abstrahieren. Man stellt sich eine Urne mit Kugeln vor und
zieht daraus dann in einer bestimmten Art und Weise eine bestimmte Anzahl von Kugeln
(Stichprobe ). In der Sozialwissenschaft entspricht jede Kugel\ einer interessierenden
"
Einheit (Person, Haushalt) und die Urne\ einer gedachten Gesamtliste dieser Einheiten.
"
Eine typische Unterscheidung der verschiedenen Ziehungsvorgange besteht darin, ob
eine Einheit mehrfach in eine Stichprobe gelangen kann ( Ziehen mit Zurucklegen\ ,
"
die gezogene Kugel wird also wieder in die Urne zuruckgelegt) oder Ziehen ohne
"
Zurucklegen\ (die gezogenen Kugeln bleiben also auerhalb der Urne). Dabei ist zu
berucksichtigen
1. das Ziehen von n Kugeln ohne Zurucklegen entspricht einem n-fachen einmaligen
Zug aus der Urne.
2. Typischerweise sind Stichproben ohne Zurucklegen praktisch einfacher zu realisieren.
1 Wahrscheinlichkeitsrechnung
32
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
3. Fur sehr groe Grundgesamtheiten sind typischerweise bei realistischen Stichprobengroen die Unterschiede zwischen mit und ohne Zurucklegen verschwindend gering.
Die Unterscheidung zwischen mit und ohne Zurucklegen wird hier { aus Rucksicht
auf die Gepogenheiten der ublichen Literatur { zunachst aufrechterhalten. Bei der
konkreten Berechnung wird aber auch die Situation ohne Zurucklegen durch die viel
einfacher behandelbare Situation mit Zurucklegen angenahert.
Urnenmodell: Ziehen mit Zurucklegen
Grundgesamtheit mit N Zahlen G = f1; : : : ; N g.
Ziehe Stichprobe vom Umfang n mit Zurucklegen.
Zur Beschreibung des Zufallsvorgangs mussen wir die Anzahl der potentiell moglichen
Stichprobenergebnisse bestimmen (jede Stichprobe ist gleichwahrscheinlich).
= f(!1; : : : ; !n)j!j 2 f1; : : : ; N gg, das selbe Element kann mehrfach vorkommen.
j
j = |N N {z : : : N} = N n, d.h. N n potentiell mogliche Stichproben vom Umfang
n.
n-mal
1 Wahrscheinlichkeitsrechnung
33
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Urnenmodell: Ziehen ohne Zurucklegen
Grundgesamtheit mit N Einheiten(mit Nummern identiziert) G = f1; : : : ; N g.
Ziehe Stichprobe vom Umfang n ohne Zurucklegen.
= f(!1; : : : ; !n) : !j 2 f1; : : : ; N g; !j 6= !i fur i 6= j g, jedes Element kann nur
einmal vorkommen.
Anzahl moglicher Stichproben:
j
j = N (N 1) : : : N n + 1 =
"
"
"
1. Ziehung 2. Ziehung n-te Ziehung
=
N (N
1 Wahrscheinlichkeitsrechnung
1) : : : (N n + 1)(N n) : : : 2 1 = N !
(N n)(N n 1) : : : 2 1
(N n)!
34
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Wiederholung: Fakultat
Die Fakultat einer naturlichen Zahl k ist deniert als
k ! = k (k
wobei
1) (k 2) : : : 2 1
1! = 1; 0! = 1:
Bsp. 1.8. [Glucksspirale]
Gewinnzahl bei Glucksspirale hat 7 Stellen.
Ziehungsstrategie des ZDF in der ersten Ziehung (1970): Urne mit jeweils 7 Kugeln der
Ziern 0; 1; 2; : : : ; 9: Insgesamt sind also 70 Kugeln in der Urne. Ziehe nacheinander
ohne Zurucklegen 7 Kugeln.
Frage: Sind alle moglichen Gewinnzahlen gleichwahrscheinlich?
1 Wahrscheinlichkeitsrechnung
35
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Hier Illustration bei einer Gewinnzahl mit 3 Stellen:
Bei der originalen Glucksspirale mit 7 Ziern waren mit der Ziehungsstrategie des
ZDF manche Gewinnzahlen mehr als 100 mal wahrscheinlicher als andere Zahlen!
Spezialfall: Permutationen
Ziehe aus der Urne alle Kugeln und notiere diese in der gezogenen Reihenfolge.
Gleichbedeutend mit der zufalligen Anordnung der N verschiedenen Zahlen. Bezeichnungsweise: Permutation der N Zahlen.
Anzahl der Stichproben bzw. Permutationen: N !
1 Wahrscheinlichkeitsrechnung
36
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bsp. 1.9. [Problem des Handlungsreisenden]
Handlungsreisender soll 5 Stadte besuchen.
Frage: Wie viele Moglichkeiten hat er?
Antwort: 5! = 120
Bei 10 Stadten sind es bereits 10! = 3628800 Moglichkeiten.
Problem: In welcher Reihenfolge sollen die Stadte besucht werden, um den Fahrtweg
zu minimieren? Das Problem ist sehr schwer zu losen wegen der groen Anzahl an
Moglichkeiten.
1 Wahrscheinlichkeitsrechnung
37
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Urnenmodell: Ziehen ohne Zurucklegen ohne Berucksichtigung der Reihenfolge
Ziehe n Kugeln aus einer Urne mit N nummerierten Kugeln. Die Reihenfolge der
Ziehungen spielt keine Rolle, d.h. die Stichprobe 4,1,7\ wird nicht unterschieden
"
von 7,1,4\.
"
= ff!1; : : : ; !ng : !j 2 f1; : : : ; N g; !j 6= !i fur j 6= ig
Anzahl der Stichproben:
j
j = (N Nn! )!n! = Nn
Wiederholung: Binomialkoezient Der Binomialkoezient
N ist deniert als
n
N
N!
=
:
n
(N n)! n!
Es gilt:
N
N
0 = 1; 1 = N; N = 1 ;
1 Wahrscheinlichkeitsrechnung
N
N
= 0; falls N < n :
n
38
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bsp. 1.10. [Lottozahlen]
Frage: Wie viele verschiedene mogliche Ziehungen gibt es?
Antwort: Entspricht der Ziehung ohne Zurucklegen von 6 Zahlen aus 49, d.h.
j
j = 496 = 43!49! 6! = 13983816:
Dann gilt
P ("6 Richtige\ ) =
1 = 0:000000072 = 0:000072h
13983816
Frage: Wie gro ist die Wahrscheinlichkeit, 5 Richtige zu bekommen?
1 Wahrscheinlichkeitsrechnung
39
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
1.2.3 Die "induktive Brucke\ I
Trivial oder genial, jedenfalls fundamental:\
"
Wir werden, mit wachsender Komplexitat und Praxisbezogenheit immer wieder inne
halten und uns mit der Grundfrage der induktiven Statistik\ auseinander setzen:
"
Warum (wie) ist es eigentlich moglich, aus einer Stichprobe etwas Nichttriviales uber
die Grundgesamtheit zu lernen? Letztendlich ist dies nur dann der Fall wenn, sich
entscheidende Eigenschaften der Grundgesamtheit in jeder konkreten Stichprobe wiedernden. (Wie ist dies aber moglich: Es gibt ja ganz viele verschiedene Moglichkeiten
wie die konkrete gezogene Stichprobe aussehen kann. Wurde man die Ziehungsvorgange
wiederholen, hatte man (praktisch sicher) eine andere Stichprobe)
Man betrachte (und illustriere) dazu folgendes Beispiel:
1 Wahrscheinlichkeitsrechnung
40
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bsp. 1.11. ["Wahlbeispiel\]
Betrachtet werde ein Land, in dem die Wahlberechtigten die Wahl zwischen den Parteien
Nr 1, Nr 2, : : :, Nr 5 und Nr 6 (Nichtwahler) haben. Dabei entfallen auf die Parteien
2; 4; 6 jeweils 25% der Stimmen; die restlichen Stimmen verteilen sich gleichmaig auf
die Parteien 1; 3; 5. Seien f1; : : : ; f6 die entsprechenden relativen Haugkeiten
1 3 41 1
1
f2 = f4 = f6 =
4 ; f1 = f3 = f5 = 3 = 12
Es wird zufallig (im Sinne einer reinen Zufallsauswahl) eine Person ausgewahlt und ihre
Parteipraferenz ermittelt.
Geben Sie die sich ergebende Wahrscheinlichkeitsbewertung an.
1 Wahrscheinlichkeitsrechnung
41
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bem. 1.12. [Fortpanzung relativer Haugkeiten als Wahrscheinlichkeiten in
der Stichprobe]
Gegeben sei eine Gesamtheit G und ein Merkmal X mit den Auspragungen a1; : : : ; ak
und der relativen Haugkeitsverteilung f1; : : : ; fk .
Zieht man eine reine Zufallsauswahl\ vom Umfang 1 aus G , hat also jedes Element aus
"
G die gleiche Wahrscheinlichkeit gezogen zu werden, so gilt mit = f1; : : : ; kg
P (fj g) = fj :
Die relativen Haugkeiten/Anteile aus der Grundgesamtheit panzen sich also in der
entsprechenden Wahrscheinlichkeitsverteilung in der Stichprobe fort. Dies ist ganz entscheidend, denn dadurch kann man also durch Beobachten der Stichprobe etwas uber
die Haugkeitsverhaltnisse in der Grundgesamtheit lernen.
1 Wahrscheinlichkeitsrechnung
42
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
1.2.4 Das Axiomensystem von Kolmogoro und wichtige Rechenregeln
Warum reichen Laplace-Wahrscheinlichkeiten nicht?
Essentielle Voraussetzung:
Denition 1.13. [Axiome von Kolmogorov (1933)]
Eine Funktion P (P steht fur Probability), die Ereignissen aus reelle Zahlen zuordnet,
heit Wahrscheinlichkeit, wenn gilt
(K1) P (A)
0
fur alle Ereignisse A :
(K2) P (
)
= 1.
(K3) Falls A \ B = ;; dann gilt P (A [ B ) = P (A) + P (B )
1 Wahrscheinlichkeitsrechnung
43
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bem. 1.14.
Die Axiome von Kolmogorov stellen zunachst eine reine Denition dar, die festlegt,
was eine Wahrscheinlichkeit sein soll.
Es gibt verschiedene Versuche Wahrscheinlichkeiten operational zu denieren (also
durch eine Messvorschrift) und verschiedene Interpretationen, die die Axiomatik mit
Leben fullen sollen.
Aus hier nicht zu erorternden mathematischen Grunden
* darf man bei uberabzahlbar unendlichen Ergebnisraumen, z.B. also im Fall = R,
nicht alle Teilmengen von als Ereignisse zulassen. Alle Mengen, an die man
"
normalerweise denkt\ sind aber zugelassen.
* muss man bei unendlichen Ergebnisraumen in (K 3) eigentlich unendliche Summen
zulassen.
* Wir werden uns darum aber nicht kummern. (Nur daran denken, wenn man in
etwas formalere Bucher schaut.)
1 Wahrscheinlichkeitsrechnung
44
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Rechenregeln fur Wahrscheinlichkeiten
P (A) =
Spezialfall: P (;)
Fur nicht notwendigerweise disjunkte Mengen A; B gilt
Falls A1; A2; : : : ; An paarweise disjunkt sind, also Ai \ Aj = ; fur i 6= j , dann gilt:
P (A [ B ) = P (A) + P (B ) P (A \ B )
P
n
[
i=1
!
Ai = P (A1 [ A2 [ : : : [ An) = P (A1) + P (A2) + : : : + P (An)
1 Wahrscheinlichkeitsrechnung
45
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Beweisidee:
Als Spezialfall folgt, dass, sofern endlich ist, die Wahrscheinlichkeitsbewertung
durch die Bewertung auf den Elementarereignissen vollstandig bestimmt ist:
P (A) =
1 Wahrscheinlichkeitsrechnung
X
! 2A
p(f!g)
46
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Bsp. 1.15. [Wurfelwurf mit fairem Wurfel]
Ergebnisraum: = f1; 2; 3; 4; 5; 6g
Alle Elementarereignisse sind gleich wahrscheinlich, d.h.
p(f1g) = p(f2g) = : : : p(f6g)
wegen p(f1g) + p(f2g) + : : : + p(f6g)
,6a
,a
:=
=
=
=
a;
1
1
1
6
Sei A = fgerade Augenzahlg = f2; 4; 6g:
P (A) = P (f2; 4; 6g) =
=
1 Wahrscheinlichkeitsrechnung
47
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Alternativ: Berechnung uber Laplace-Wahrscheinlichkeiten
P (A) =
Die Axiomatik ist insbesondere notig, um mit Situationen mit nicht gleichwahrscheinlichen Elementarereignissen rechnen zu konnen.
Bsp. 1.16. ["Wahlbeispiel\]
Betrachtet werde ein verfalschter Wurfel (bzw. die Situation des Wahlbeispiels aus
Abschnitt 1.2.3 mit
1
P (f1g) = P (f3g) = P (f5g) =
12
1
P (f2g) = P (f4g) = P (f6g) =
4
Gegeben seien ferner die Ereignisse
1 Wahrscheinlichkeitsrechnung
48
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
A die Person wahlt Partei 1 oder 3
B
"
4 oder 6
C
"
3 oder 4
und berechnen Sie P (A), P (B ), P (B \ C ) und P (A [ C ).
Berechne die gesuchten Wahrscheinlichkeiten:
Prinzipiell kann man in diesem Beispiel zwar immer noch mit LaplaceWahrscheinlichkeiten rechnen, indem man die Betrachtung auf gleich wahrscheinliche
Falle (hier Wahler) zuruckfuhrt. Dies erweist sich aber spater als immer umstandlicher
beim Rechnen. Fur das Verstandnis ist diese Vorstellungsweise aber oft hilfreich, zumal
man oft die Stichprobe so zieht, dass alle Einheiten gleich wahrscheinlich sind.
1 Wahrscheinlichkeitsrechnung
49
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Vollstandige Zerlegung: Ist A1; A2; : : : ; An eine vollstandige Zerlegung von , d.h.
gilt
n
[
i=1
Ai = und Ai \ Aj = ; fur i 6= j;
so gilt fur jedes Ereignis B :
P (B ) =
1 Wahrscheinlichkeitsrechnung
n
X
i=1
P (B
\ Ai):
50
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Diese Regel ist fur spater sehr wichtig. Als veranschaulichendes Beispiel denke man
etwa an die zufallige Auswahl einer Person ! aus der Menge aller wahlberechtigten
Bundesburger.
Sei B das Ereignis ! ist fur Studiengebuhren
A1
"
"
! ist SPD-Wahler
A2
"
"
! ist CDU-Wahler
..
An
"
"
! ist Nichtwahler
Sn
A1; : : : ; An zerlegt vollstandig (paarweise disjunkt; i=1 Ai = ).
B \ Ai ist dann das Ereignis "! ist fur Studiengebuhren und wahlt Partei i\.
1 Wahrscheinlichkeitsrechnung
51
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
1.2.5 Grundlegendes zum Begri "Wahrscheinlichkeit\
Was ist eigentlich Wahrscheinlichkeit?
Was bedeutet: Mit Wahrscheinlichkeit 23 wird es morgen regnen?\
"
Ausfuhrlichere und weiterfuhrende Literatur:
Rohwer, G., Potter, U. (2002): Wahrscheinlichkeit, Begri und Rhetorik in der
Sozialforschung. Juventa, Weinhein und Munchen.
Schneider, I. (Hg.) (1988): Die Entwicklung der Wahrscheinlichkeit von den
Anfangen bis 1933. Einfuhrungen und Texte. Wissenschaftliche Buchgesellschaft,
Darmstadt.
Weichselberger, K. (2001): Elementare Grundbegrie einer allgemeineren Wahr-
scheinlichkeitsrechnung I. Intervallwahrscheinlichkeit als umfassendes Konzept.
Physika, Heidelberg S. 30-63.
1 Wahrscheinlichkeitsrechnung
52
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
a)
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Wahrscheinlichkeit in der Alltagssprache
Stark gebrauchlich in der Umgangssprache als graduelle Abschwachung von Sicherheit
( wahrscheinlich kommt Max\). Weg vom simplen Ja/Nein.
"
Teilweise sogar quantiziert:
Die Niederschlagswahrscheinlichkeit fur morgen betragt 30%\
"
Medizinische Beipackzettel: seltene Nebenwirkungen\
"
b)
Klassische Aspekte und Meilensteine
Wahrscheinlichkeit im Glucksspiel, v.a. Wurfelspiel: Profanisierung erst im Mittelalter,
dort erst als Zufall gedeutet, vorher oft als Gottesurteil etc.
Wahr-schein-lichkeit (Prove-ability ! probability)
1 Wahrscheinlichkeitsrechnung
53
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
b) Zwei Historische Wurzeln
Mathematisierung von Glucksspiel
als philosophischer/theologischer Begri
Wahr-schein-lichkeit (Prove-ability ! probability)
c) Laplace'scher Wahrscheinlichkeitsbegri (kombinatorischer Wahrscheinlichkeitsbegri)
* Laplace (1749 - 1827)
* Aufbauend auf Symmetrieuberlegungen
1 Wahrscheinlichkeitsrechnung
54
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
Erfolgreiche Anwendung v.a. auf Glucksspiele, in der Physik (stochastische Mechanik)
und in der Stichprobentheorie bei einer reinen Zufallsauswahl:
Intuitiv einleuchtend, aber beschrankte Anwendbarkeit:
Von Laplace generell angewendet auf beliebige Unsicherheitssituationen (Sonnenaufgang, Jurisprudenz)
Laplace strenger Determinist (Laplace'scher Damon!): Unsicherheit entsteht allein
durch unvollstandiges und ungenaues Wissen uber die Anfangsbedingungen!! !
Subjektivismus
1 Wahrscheinlichkeitsrechnung
55
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
d) Aktuelle interpretatorische Hauptrichtungen // typische Wahrscheinlichkeitsbegrie
1. Objektivistisch // frequentistische Richtungen //
aleatorische Wahrscheinlichkeiten
Anschluss an die gottliche Ordnung
Wahrscheinlichkeiten beschreiben tatsachlich vorhandene, zufallige Gesetzmaigkeiten
Objektbezogen: Wahrscheinlichkeit ist eine Eigenschaft des untersuchten Objekts
(z.B. Wurfel), objektiv ! objektbezogen (wie z.B. spezisches Gewicht, Lange)
Haugkeitsinterpretation bzw. sogar -Denition (von Mises, 1883 - 1953): Wahrscheinlichkeit als relative Haugkeiten in unendlich langen\ reproduzierbaren
"
Experimenten
Exkurs: naturliche Haugkeiten (nach Gigerenzer, MPI fur Bildungsforschung)
1 Wahrscheinlichkeitsrechnung
56
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
* T.A.: Superreprasentative Stichprobe vorstellen\, in der sich genau die Haug"
keitsverhaltnisse in der Grundgesamtheit wiedernden, z.B. 10 000 Personen
* Dann P (A) = 0:1756 vorstellen als: 1756 Personen haben die Eigenschaft A.
(Aber man wei naturlich nicht, welche 1756 Personen.)
+ einfachere Kommunikation von Wahrscheinlichkeiten und Risiken, reduziert Fehler beim Rechnen mit Wahrscheinlichkeiten
 rzten
mathematisch triviale Umformung\, aber erfolgreich: Experimente mit A
"
zeigen, dass die Darstellungsform Wahrscheinlichkeiten vs. naturliche Haugkeiten) einen starken Einuss auf die Korrektheit von Berechnungen hat.
{ T.A.: Gefahr der Verschleierung von Unsicherheit: die naturlichen Haugkeiten\
"
sind zu erwartende Durchschnittswerte, wenn man sehr viele Stichproben hatte.
Individuelle Aussagen sind naturlich zufallig. Einer von zehn leiden an Krankheit
A bedeutet naturlich nicht, dass nach 9 nicht an A leidenden Patienten zwingend
der nachste krank ist. Auf Beipackzettel wird typischerweise das Risiko von
Nebenwirkungen so kommuniziert:
1 Wahrscheinlichkeitsrechnung
57
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
sehr haug:
haug:
mehr als 1 von 10 Behandelten
weniger als 1 von 10, aber mehr als 1 von 100 Behandelten
gelegentlich: weniger als 1 von 100, aber mehr als 1 von 1000
Behandelten
selten
weniger als 1 von 1000, aber mehr als 1 von 10000
Behandelten
sehr selten: 1 Fall oder weniger von 10000 Behandelten, einschlielich Einzelfalle
Welche Nebenwirkungen konnen bei der Anwendung von *** Auftreten?
Gelegentlich wurde uber das Auftreten von Mundschleimhautentzundungen,
Kopfschmerzen, Ohrengerauschen berichtet.
Selten konnen auftrete: Beschwerden im Magen-Darm-Bereich (z.B. Sodbrennen,
 belkeit, Erbrechen oder Durchfall).
U
superreprasentative Stichproben gibt es praktisch nicht.
1 Wahrscheinlichkeitsrechnung
58
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
2. subjektivistische Richtungen
Wahrscheinlichkeit hat ausschlielich mit Unsicherheit, nicht mit Zufalligkeit zu
tun (vgl. Laplace) (Man kann auch uber vollig deterministische Aspekte unsicher
sein!)
Wahrscheinlichkeitsbewertung ist Eigenschaft des untersuchenden Subjekts
=) verschiedene Subjekte konnen durchaus zu unterschiedlichen Bewertungen
kommen.
Anwendung auch auf Aussagen. Bsp: Die Wahrscheinlichkeit, dass die Regierungskoalition die gesamte Legislaturperiode halt, ist. . .
behaviouristischer Standpunkt: Wahrscheinlichkeiten auern sich im Verhalten und
konnen so gemessen werden
z.B. bei Wetten =) Wettdenition / -Interpretation
Wahrscheinlichkeit von A
= p(A) = 0:3 bedeutet gedanklich:
Wichtig: subjektiv sind die Bewertungen, nicht die Rechenregeln.
Koharenzkriterien!
1 Wahrscheinlichkeitsrechnung
59
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
e) ("kalter\) mathematisch-formaler Wahrscheinlichkeitsbegri: Axiomatik von
Kolmogorov
Die Kolmogorsche Axiomatik ist eine reine Denition, die sich zunachst im luftlee"
ren\ Raum bewegt. Es wird rein formal festgelegt, was eine Wahrscheinlichkeit sein
soll.
Es gab/gibt (wie in Kap. 1.1 ausgefuhrt) verschiedene Versuche, Wahrscheinlichkeiten operational zu denieren (also durch eine Messvorschrift) und verschiedene
Interpretationen, die die Axiomatik mit Leben fullen (sollen).
Die Axiomatik ist vertraglich sowohl mit der Haugkeits- als auch mit der Wettinterpretation.
Die Axiome von Kolmogoro geben an, wie man mit Wahrscheinlichkeiten rechnet.
Welche Phanomene man durch Wahrscheinlichkeiten beschreiben darf und wie die
Ergebnisse zu interpretieren sind, ist eine Frage des Wahrscheinlichkeitsbegris.
1 Wahrscheinlichkeitsrechnung
60
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.2 Wahrscheinlichkeit { Ein komplexer Begri und seine Formalisierung
In der Tat gibt es auch Kritik an dieser Axiomatik: zu streng und uberprazise\ !
"
aktueller Forschungsgegenstand (Imprecise Probabilities, Intervallwahrscheinlichkeit );
hier nicht naher thematisiert: Kolmogoro als absolute Wahrheit\. Kritik:
"
* Modellierung unsicheren (partiell widerspruchlichen, unvollstandigen) Expertenwissens

* Okonomie:
Entscheidungen unter komplexer Unsicherheit widersprechen Prognosen
aus der ublichen Wahrscheinlichkeitsrechnung
logischer Wahrscheinlichkeitsbegri
Wahrscheinlichkeit kommt Schlussen zu: Wahrscheinlichkeit als logischer Grad mit
dem aus einer Pramisse auf die Konklusion geschlossen werden darf (fruhere Formalisierungsversuche gelten heute als gescheitert; aber Renaissance der Thematik)
1 Wahrscheinlichkeitsrechnung
61
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
1.3 Stochastische Unabhangigkeit und bedingte
Wahrscheinlichkeiten
(Fahrmeir et al. (2003), Kap 4.4 bis 4.7)
1.3.1 Stochastische Unabhangigkeit
Stochastische Unabhangigkeit: Zwei Ereignisse A und B heien (stochastisch) unabhangig wenn gilt
P (A \ B ) = P (A) P (B )
andernfalls heien sie stochastisch abhangig.
Bem. 1.17.
Stochastische Abhangigkeit\ bedeutet nicht kausale Abhangigkeit\ (wie in den
"
"
Uberlegungen zu Korrelation und Kausalitat in Statistik I diskutiert).
Die (stochastische) Unabhangigkeit ist eine symmetrische Beziehung in dem Sinne,
dass A und B genau dann unabhangig sind, wenn B und A unabhangig sind.
1 Wahrscheinlichkeitsrechnung
62
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
 quivalenz folgender Aussagen:
Genauer gilt die A
A und B
A und B
A und B
A und B
sind stochastisch unabhangig.
"
.
"
.
"
.
1 Wahrscheinlichkeitsrechnung
63
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Die Verwandtschaft zur empirischen Unabhangigkeit aus Statistik I.
fij = fifj fur alle i; j
ergibt sich, wenn man sich durch A und B eine (2 2) Tafel erzeugt denkt, in der
anstatt der Haugkeiten die Wahrscheinlichkeiten stehen:
A
A
B
B
P (A \ B ) P (A \ B ) P (A)
P (A \ B ) P (A \ B ) P (A)
P (B )
P (B )
Unabhangigkeit:
gemeinsame Verteilung
= Produkt der Randverteilungen
P (A \ B ) = P (A) P (B )
 quivalenz)
analog fur A; B , (vgl. obige A
1 Wahrscheinlichkeitsrechnung
64
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Bsp. 1.18. [Wahlbeispiel (Fortsetzung)]
Sind die Ereignisse A = f1; 3g und C = f3; 4g stochastisch unabhangig?
Unabhangigkeit ist eine Eigenschaft, die vom Wahrscheinlichkeitsma abhangt. Betrachtet man wieder = f1; 2; 3; 4; 5; 6g, jetzt aber mit P (f1g) = 91 , P (f2g) = 19 ,
P (f3g) = 181 , P (f4g) = 185 , P (f5g) = 92 , P (f6g) = 92 ,
also sind hier A und C stochastisch unabhangig (selbes , andeses Wahrscheinlichkeitsma!).
1 Wahrscheinlichkeitsrechnung
65
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Stochastische Unabhangigkeit mehrerer Ereignisse: Ereignisse A1; A2; : : : ; An heien (vollstandig) stochastisch unabhangig, wenn gilt
P (A1 \ A2 \ : : : \ An) = P (A1) P (A2) : : : P (An):
Achtung: Aus der paarweisen Unabhangigkeit
P (Ai \ Aj ) = P (Ai)P (Aj ) fur alle i; j
folgt nicht die vollstandige Unabhangigkeit.
1 Wahrscheinlichkeitsrechnung
66
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
1.3.2 Bedingte Wahrscheinlichkeiten:
A Ereignis, das mit Wahrscheinlichkeit P (A) eintritt.
Zusatzinformation: Ereignis B ist eingetreten.
Frage: Wie ist nun die Wahrscheinlichkeit fur das Eintreten von A neu zu bewerten?
Welche Wahrscheinlichkeit hat A gegeben\ B ?
"
Notation: P (A j B ).
Einmaliges Wurfeln
Ereignis A=
^ Augenzahl 6, d.h. A = f6g. Es gilt P (A) = 16 .
Zusatzinformation: Augenzahl gerade
Wie andert sich die Wahrscheinlichkeit fur A, wenn B = f2; 4; 6g eingetreten ist?
1 Wahrscheinlichkeitsrechnung
67
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Intuitiv:
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
P (A \ B ) 1 3 1
P (AjB ) =
= 6=6 = 3
P (B )
Formalisierung: Gegeben seien zwei Ereignisse A und B mit P (B ) > 0. Dann heit:
P (A \ B )
P (AjB ) :=
P (B )
bedingte Wahrscheinlichkeit von A gegeben B oder bedingte Wahrscheinlichkeit von
A unter der Bedingung B.
Interpretation analog zu bedingten Haugkeiten in Statistik I: P (AjB ) ist die Wahrscheinlichkeit von A wenn man bereits wei, dass B gilt.
Bsp. 1.19.
1 Wahrscheinlichkeitsrechnung
68
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Bem. 1.20.
Die Beziehung zu Statistik I und den bedingten relativen Haugkeiten ergibt sich,
wenn man wieder die durch A und B erzeugte (2 2) Tafel betrachtet.
An Stichprobenmodell denken: Grundgesamtheit P (B )^
=f1; P (A \ B )^=f11
1
1
2
1 Wahrscheinlichkeitsrechnung
2
f11 f12 f1
f21 f22 f2
f1 f2
69
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Es ergibt sich auch eine analoge Charakterisierung der stochastischen Unabhangigkeit
uber bedingte Wahrscheinlichkeiten:
Sind P (A) und P (B ) > 0, so sind aquivalent:
i) A und B sind stochastisch unabhangig
Dies fuhrt zu folgender inhaltlicher Interpretation:
Ist P (AjB ) = P (A), so andert das Wissen um B meine Bewertung von A nicht, also
sind A und B unabhangig.
Nachweis zu ii)
Die ursprungliche Denition der Unabhangigkeit besitzt den Vorteil, dass man nicht
P (A) = 0, P (B ) = 0 ausschlieen muss; fur die Interpretation ist aber die Bezugnahme auf bedingte Wahrscheinlichkeiten viel anschaulicher.
1 Wahrscheinlichkeitsrechnung
70
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Interpretation von unter der Bedingung B\:
"
Anstatt aller Ergebnisse in sind nur noch die Ergebnisse in B moglich. Das Betrach nderung des Grundraumes
ten bedingter Wahrscheinlichkeiten entspricht also einer A
von zu B .
In der Tat ist PB (A) := P (AjB ) = P (A \ B jB ) als Funktion in A bei festem B wieder
eine Wahrscheinlichkeitsbewertung, erfullt also wieder die Axiome von Kolmogorov.
1 Wahrscheinlichkeitsrechnung
71
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
1.3.3 Koppelung von unabhangigen Experimenten, unabhangige Wiederholungen:
Mit dem Begri der Unabhangigkeit (und bedingten Wahrscheinlichkeiten) kann man
komplexere Situationen aus Einzelbausteinen\ zusammensetzen:
"
Bisher: Unabhangigkeit als zu uberprufende Eigenschaft
P (A1 \ A2) = P (A1) P (A2)
1 Wahrscheinlichkeitsrechnung
=) unabhangig:
72
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
Beispiel: Werfen eines Wurfels (
1
f1; : : : ; 8g) unabhangig voneinander.
A1 1 :
A1 \ A2 :
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
= f1; : : : ; 6g) und eines Oktaeders (
2 =
A1 = f5; 6g ; A2 2 : A2 = f7; 8g
eine 5 oder 6 mit dem Wurfel und eine 7 oder 8 mit dem Oktaeder\
"
Dann deniert man
P (A1 \ A2) [:= P (A1 A2) =] = P1(A1) P2(A2);
also erhalt man bei einem fairem Wurfel und einem fairem Oktaeder mit
1
1
P1(fj g) = ; i = 1; : : : ; 6;
und
P2(fj g) = ; i = 1; : : : ; 8;
6
8
1
1
1
P (A1 \ A2) =
3 4 = 12 :
Diese Konstruktion fuhrt man fur alle moglichen A1 1; A2 2 durch.
1 Wahrscheinlichkeitsrechnung
73
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Unabhangige Koppelung mehrerer Experimente: Gegeben sei eine Menge von Zufallsexperimenten, beschrieben durch die Ergebnisraume i; i = 1; : : : ; n und die Wahrscheinlichkeitsbewertungen Pi; i = 1; : : : ; n. Fasst man die Experimente zusammen, so
ergibt sich der Ergebnisraum
:= 1 2 : : : n
mit den Elementen
! := (!1; !2; : : : ; !n) :
Sind die Experimente unabhangig (Dies ist inhaltlich zu entscheiden!), so setzt man fur
beliebige Ai i; i = 1; : : : ; n;
P (A1 \ A2 \ : : : \ An) = P1(A1) P2(A2) : : : Pn(An):
Dies beschreibt ein Wahrscheinlichkeitsma auf , bei dem { per Konstruktion {
beliebige Ereignisse aus den einzelnen i voneinander unabhangig sind.
1 Wahrscheinlichkeitsrechnung
74
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Von besonderer Bedeutung ist der Fall unabhangiger und identischer Wiederholungen,
bei dem dasselbe Experiment wiederholt durchgefuhrt wird.
Zufallsstichprobe vom Umfang n: Graphische Veranschaulichung "Wahlbeispiel\
Das Experiment Ziehen einer Person und Ermittlung ihrer Parteipraferenz\ wird n-mal
"
unabhangig (Befragte durfen sich nicht gegenseitig beeinussen!) durchgefuhrt.
~ sowie ein Merkmal X~ mit
Allgemeiner: Betrachte eine endliche Grundgesamtheit Auspragungen a1; : : : ; ak und relativen Haugkeiten f1; : : : ; fk . Es werde eine reine
Zufallsstichprobe vom Umfang n bezuglich des Merkmals X~ entnommen, d.h. eine
(geordnete) Zufallsauswahl (mit Zurucklegen) von n Elementen
!1; : : : ; !n mit !i 2 ~ ; i = 1 : : : n;
und die diesbezuglichen Auspragungen X~ (!i) von X erhoben.
1 Wahrscheinlichkeitsrechnung
75
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Sei fur j = 1; : : : k; i = 1; : : : ; n mit Aij das Ereignis X~ (!i) = aj\ bezeichnet ( Die
"
"
i-te gezogene Person hat Auspragung aj ), so gilt fur beliebige j1; j2; : : : ; jn
P (A1j1 \ A2j2 \ : : : Anj ) = P (A1j1 ) P (A2j2 ) : : : P (Anj )
= fj1 fj2 : : : fj
n
n
n
1 Wahrscheinlichkeitsrechnung
76
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Bsp. 1.21.
Unmittelbar nach Schlieung der Wahllokale 2002 habe man eine reine Zufallsauswahl
vom Umfang 10 unter den Wahlern vorgenommen. Wie gro ist die Wahrscheinlichkeit,
mindestens 9 PDS-Anhanger in der Stichprobe zu haben?
Amtliches Endergebnis:
SPD:
CDU/CSU:
Grune:
FDP:
PDS:
Sonstige:
1 Wahrscheinlichkeitsrechnung
38; 5%
38; 5%
8:6%
7; 4%
4; 0%
3; 0%
77
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
1.3.4 Koppelung abhangiger Experimente:
Als nachster Schritt werden komplexere Experimente aus viel einfacheren, voneinander
abhangigen Einzelexperimenten gebaut. Gerade bei komplexeren Anwendungen ist es
meist bedeutend einfacher, (und auch sicherer, da sich die Chance erhoht, korrektes
Expertenwissen zu erhalten) bedingte statt unbedingte Wahrscheinlichkeiten anzugeben.
Beispielsweise kann man versuchen, die Wahrscheinlichkeit eines Ereignisses dadurch zu
bestimmen, dass man als Zwischenschritt auf alle Eventualitaten bedingt\ und zunachst
"
die entsprechenden bedingten Wahrscheinlichkeiten bestimmt. (! Baumstruktur)
Bsp. 1.22.
(nach Fahrmeir et al)
Eine Mannschaft gewinnt das Viertelnalspiel. Wie gro ist die Chance, das Halbnale
zu gewinnen und ins Finale einzuziehen?
Gesucht: P (B ) mit B = Sieg im Halbnale\
"
1 Wahrscheinlichkeitsrechnung
78
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Technisch entscheidend:
A1; A2; A3 bilden eine vollstandige Zerlegung.
(A1 \ B ), (A2 \ B ) und (A3 \ B ) sind disjunkt und ergeben in der Vereinigung B
Damit ergibt sich
P (B ) = P (A1 \ B ) [ (A2 \ B ) [ (A3 \ B )
= P (A1 \ B ) + P (A2 \ B ) + P (A3 \ B )
= P (B jA1) P (A1) + P (B jA2) P (A2) + P (B jA3) P (A3) = 0:52
Das Ergebnis lasst sich verallgemeinern auf
Beliebige Ereignisse B
und vollstandige Zerlegungen (Ai)i=1;:::k .
1 Wahrscheinlichkeitsrechnung
79
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Satz 1.23. [Satz von der totalen Wahrscheinlichkeit]
Gegeben sei eine vollstandige Zerlegung A1; A2; : : : ; Ak . Dann gilt fur jedes Ereignis B
P (B ) =
k
X
j =1
P (B jAj ) P (Aj ) =
k
X
j =1
P (B \ Aj ):
Allgemeiner erlauben bedingte Wahrscheinlichkeiten die Modellierung komplexer Ex"
perimente\, welche aus sukzessiven Einzelexperimenten\ bestehen, bei denen die Er"
gebnisse jeweils von den vorherigen Experimenten abhangen durfen (insb. dynamische
stochastische Modelle).
1 Wahrscheinlichkeitsrechnung
80
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Koppelung abhangiger Experimente: Gegeben seien n Experimente, beschrieben
durch die Grundraume i = fai1; : : : ; aik g und die Wahrscheinlichkeitsbewertungen
Pi; i = 1; : : : ; n. Bezeichnet man fur beliebiges i = 1; : : : ; n und j = 1; : : : ; ki, mit Aij
jeweils das zu aij gehorige Elementarereignis (also das Ereignis aij tritt ein\), so gilt:
"
i
P (A1j1 \ A2j2 \ : : : \ Anj ) = P1(A1j1 ) P2 (A2j2 jA1j1 ) P3 (A3j3 jA1j1 \ A2j2 )
: : : Pn Anj jA1j1 \ A2j2 \ : : : \ An 1j 1
n
n
n
Haug werden die Indizes bei P weggelassen.
(i als Zeit vorstellen.)
Arbeitet man mit mehreren abhangigen Experimenten, so ist folgende Folgerung aus
dem Satz der totalen Wahrscheinlichkeit oft hilfreich:
1 Wahrscheinlichkeitsrechnung
81
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Korollar 1.24.
Sei A1; A2; : : : ; Ak eine vollstandige Zerlegung. Dann gilt fur beliebige Ereignisse B und
C mit P (C ) > 0
P ( B jC ) =
k
X
j =1
P (B j(Aj \ C )) P (Aj jC )
Beweisidee: P (B jC ) ist fur festes C als Funktion in B eine Wahrscheinlichkeit (vgl.
Bemerkung zu bedingten Wahrscheinlichkeiten). Wende den Satz der totalen Wahrscheinlichkeit auf diese Wahrscheinlichkeit an.
Anwendungsbeispiele:
Komplexere Urnenmodelle ohne Zurucklegen, Wahrscheinlichkeit im n-ten Zug ist
davon abhangig, welche Kugeln vorher gezogen wurden.
Sicherheitsstudie zu Kernkraftwerken: Wahrscheinlichkeit fur komplexe Pfade praktisch nicht angebbar, aber eben bedingte Einzelwahrscheinlichkeiten.
Markovmodelle (dynamische Modelle mit einfacher Bedingung\)
"
1 Wahrscheinlichkeitsrechnung
82
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Markovmodelle: Hier interpretiert man den Laundex als Zeit. Gilt in der Koppelung
abhangiger Experiment 1 = 2 = : : : = n = fa1; : : : ; ak g und sind alle bedingten
Wahrscheinlichkeiten nur vom jeweils unmittelbar vorhergehenden Zeitpunkt abhangig,
d.h. gilt
(1.1)
P (Ai+1;ji+1 jA1j1 \ A2j2 \ : : : \ Aiji ) = P (Ai+1;ji+1 jAiji );
so spricht man von einem Markovmodell mit den Zustanden a1; : : : ; ak .
 bergangswahrscheinlichkeiten in (1.1) unabhangig von der
Sind die sogenannten U
Zeit, gilt also P (Ai+1;j jAil) pjl fur alle i; j; l, so heit das Markovmodell homogen.
1 Wahrscheinlichkeitsrechnung
83
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Typische Anwendungen:
Glucksspiel: Die Wahrscheinlichkeit P (Ai+1;j ) mit Ai+1;j = Spieler hat zum Zeit"
punkt i + 1 Kapitalbestand aj\ hangt nur vom Kapitalbestand zum Zeitpunkt i ab,
also nur von Ai1; : : : ; Aik , nicht aber von fruheren Ereignissen.
BWL: Konsumentscheidungen / Produktwahl
Demographie: Geburts- und Todesprozesse
Epidemiologie
Bildet das Wetter mit = fSonniger Tag, bewolkter Tag, regnerischer Tag, verschneiter T
eine Markovkette?
Soziologie: z.B. Modelle sozialer Mobilitat, Mobilitat in Betrieben
{ Rapoport (1980): Mathematische Methoden in der Sozialwissenschaft, Physika
{ Bartholomew (1982): Stochastic Models for Social Processes, Wiley
1 Wahrscheinlichkeitsrechnung
84
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Bsp. 1.25. [Soziale Mobilitat (nach Bartholomew (1982), S. 18f.)]
Wie entwickelt sich der soziale Status durch die Generationen?
Markoveigenschaft bedeutet hier:
Homogenitat bedeutet hier:
Datengrundlage: mannliche Generationenfolge in Marion County, Indiana (1905 { 1912)
1 Wahrscheinlichkeitsrechnung
85
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Sohne
Vater
nicht handwerkliche
Tatigkeit
Dienstleistung
handwerkliche
Tatigkeit
verarb. Gewerbe
landwirtschaftliche
Tatigkeit
Land- u. Forstwirtschaft
a1
a2
a3
a1
0:594
0:396
0:009
a2
0:211
0:782
0:007
a3
0:252
0:641
0:108
 bergangswahrscheinlichkeiten
Die obige Matrix enthalt die (geschatzten) U
i-te Zeile, j -te Spalte:
P (A2jjA1i)
Wahrscheinlichkeit, dass die zweite Generation in Zustand j ist unter der Bedingung,
dass die erste Generation im Zustand i ist.
1 Wahrscheinlichkeitsrechnung
86
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Beispiel: Sohn nicht handwerklich\ unter der Bedingung Vater landwirtschaftlich\
"
"
P (A21jA13) = 0:252
Man sieht: fur feste A1l ist P (A2j jA1l) als Funktion in A2j eine Wahrscheinlichkeitsverteilung, d.h. die jeweiligen Zeileneintrage summieren sich (bis auf Rundungsfehler)
zu 1.
Inhaltliche Interpretation:
Unter der Annahme, dass eine homogene Markov-Kette vorliegt, kann man mit den
Daten weitere Entwicklungen prognostizieren.
 bergangsmatrix allein kann man Fragen der Art beantworten: Wie
Mit Hilfe der U
gro ist die Wahrscheinlichkeit, dass der Enkel eines in der Landwirtschaft Tatigen
eine Tatigkeit im nicht handwerklichen Sektor ausuben wird?
Beachte bisher ist nichts uber die (unbedingte) Verteilung auf die einzelnen Sektoren
ausgesagt. Kennt man zusatzlich die Startverteilung P (A11); P (A12); P (A13), so
kann man die weitere Verteilung auf die Sektoren berechnen.
1 Wahrscheinlichkeitsrechnung
87
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Man kann auch (mit weiterfuhrenden Methoden) eine Gleichgewichtsverteilung bestimmen.
Kritische Aspekte:
1 Wahrscheinlichkeitsrechnung
88
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
1.3.5 Das Theorem von Bayes
Bei der Anwendung bedingter Wahrscheinlichkeiten ist es haug von Interesse, Bedin"
gung und Ereignis\ zu vertauschen.
Also: gegeben P (B jA), gesucht P (AjB )
Bsp. 1.26. [Diagnoseproblem]
Bei der Durchfuhrung eines Tests auf eine bestimmte Krankheit ist zu unterscheiden:
{ Patient ist krank
! Ereignis A
{ Testergebnis ist positiv, d.h. der Test sagt, die Person sei krank
! Ereignis B
In der Praxis sind A und B nie identisch!
Ziel bei der Konstruktion eines Tests: moglichst geringe Fehlerwahrscheinlichkeiten
1 Wahrscheinlichkeitsrechnung
89
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
P (B jA) = 0:98 Sensitivitat: Kranker wird als krank eingestuft
P (B jA) = 0:97 Spezitat:
Gesunder wird als gesund erkannt
Hauges Problem in der Praxis: Steigerung der Sensitivitat geht auf Kosten der
Spezitat und umgekehrt.
Jetzt konkrete Beobachtung bei einem Patienten: Testergebnis 'krank'. Mit welcher
Wahrscheinlichkeit ist die Person tatsachlich krank?
Allgemeiner nicht nur bei Dichotomie A und A, sondern bei beliebiger vollstandiger
Zerlegung A1; : : : ; Ak anwendbar:
1 Wahrscheinlichkeitsrechnung
90
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Theorem 1.27. [Theorem von Bayes]
Sei A1; : : : Ak eine vollstandige Zerlegung von (wobei P (Ai) > 0, P (B jAi) > 0,
i = 1; : : : k und P (B ) > 0 erfullt seien.) Dann gilt
P (B jAj ) P (Aj )
P (Aj jB ) = k
X
i=1
P (B jAi) P (Ai)
:
Fortsetzung von Bsp. 1.26
Gegeben seien
P (B jA) = 0:98 (Sensitivitat)
P (B jA) = 0:97 (Spezitat)
P (A) = 0:001 (Pravalenz)
1 Wahrscheinlichkeitsrechnung
91
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Bem. 1.28. [Inhaltliche Bemerkungen zu Bsp. 1.26]
Problematik: Flachendeckendes Screening nicht unumstritten, da viele falsch-positive
Ergebnisse. Gegenposition: Anwendung nur auf Risikopatienten.
Bei Mammographie oder PSA-Test auf Prostatakrebs teilweise sogar noch viel geringere Spezitat.
Wert der mathematischen Theorie: Wenn es etwas komplexer wird, verlasst einen
sofort der gesunde Menschenverstand\. Untersuchungen (u.a. von Gigerenzer) haben
"
 rzte sich dieser Problematik nicht bewusst sind.
gezeigt, dass viele A
Bem. 1.29. [Bemerkungen zu Theorem 1.27 (Theorem von Bayes)]
 bliche Bezeichnungen:
U
P (Ai): "a priori Wahrscheinlichkeiten\ (Wahrscheinlichkeit vor der Beobachtung
des Testergebnisses)
P (AijB ): "a posteriori Wahrscheinlichkeiten\ (Wahrscheinlichkeit nach der Beobachtung des Testergebnisses)
1 Wahrscheinlichkeitsrechnung
92
Statistik II fur Studierende der Soziologie und Nebenfachstudierende
1.3 Stochastische Unabhangigkeit und bedingte Wahrscheinlichkeiten
Im Prinzip liefert das Theorem von Bayes ein Schema fur das probabilistische Lernen
aus Beobachtungen ( Aufdatieren von Wahrscheinlichkeiten\).
"
priori
+ Daten
! posteriori
Es dient als Grundlage der sog. Bayesianischen Inferenz, einer bestimmten Schule
der statistischen Methodologie, die hier nicht behandelt wird. Dabei geht es darum,
aus Daten zu lernen, indem man die subjektiven Wahrscheinlichkeiten P (Ai) fur
bestimmte Modellparameter mit Hilfe der Daten (B ) aufdatiert, und somit zur
besseren Wahrscheinlichkeitsaussagen fur die Modellparameter kommt.
Hier Formulierung im medizinischen Kontext. Anwendung auch zur Beurteilung der
Ruckfallgefahr, Kreditwurdigkeitsprufung, etc.
1 Wahrscheinlichkeitsrechnung
93
Herunterladen