Mathematische und statistische Methoden II

Werbung
Methodenlehre
& Statistik
Sprechstunde
jederzeit nach
Vereinbarung und
nach der Vorlesung
Mathematische und
statistische Methoden II
Wallstr. 3, 6. Stock,
Raum 06-206
Dr. Malte Persike
[email protected]
lordsofthebortz.de
lordsofthebortz.de/g+
facebook.com/methodenlehre
twitter.com/methodenlehre
youtube.com/methodenlehre
SoSe 2012
Folie 1
Psychologisches Institut
Johannes Gutenberg Universität Mainz
Methodenlehre
& Statistik
Inhalte
dieser Sitzung
 Theoretische Wahrscheinlichkeiten und empirische
Häufigkeiten
 Bernoulli Experimente
 Binomial- und Poisson-Verteilung
Folie 2
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Notation
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
 Eine Zufallsvariable, die abzählbar viele Werte
annehmen kann (in endlich oder unendlich vielen
Ausprägungen), wird als diskrete
Zufallsvariable bezeichnet
 Das Ereignis, dass die diskrete Zufallsvariable X
eine bestimmte (die i-te) Ausprägung annimmt,
wird bezeichnet als X = xi
 Die Wk für X = xi wird als p(X = xi) oder kürzer
p(xi) oder ganz kurz pi bezeichnet
 p(X = xi) ist eine Punktwahrscheinlichkeit
Folie 3
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Wahrscheinlichkeitsverteilung
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Die Verteilung der p(X = xi) auf alle möglichen
Ausprägungen von X wird als diskrete
Wahrscheinlichkeitsverteilung bezeichnet.
Sie beschreibt theoretische Punktwahrscheinlichkeiten und wird definiert als
 p ( X  xi ) :  falls x i   x1  xk 
p ( x)  
0 sonst

Wert von X
p(X = xi)
Folie 4
x1
x2
p(x1) p(x2)
…
xi
p(xi)
…
xk
p(xk)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Verteilungsfunktion
Bernoulli
Experimente
Binomialvert.
Die Verteilung der p(X ≤ xm) wird als Verteilungsfunktion
der Zufallsvariablen X oder kumulierte Wahrscheinlichkeitsverteilung bezeichnet.
Sie beschreibt theoretische Intervallwahrscheinlichkeiten und wird definiert als
m
Poisson Vert.
P( x)  p ( X  xm )  p1  p2    pm   pi
i 1
Wert von X
p(X ≤ xi)
Folie 5
x1
x2
p(x1)
p(x1) + p(x2)
…
xm
… p(x1) + p(x2) + … + p(xm)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Folie 6
Methodenlehre
& Statistik
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Absolute Häufigkeit eines Wertes x:
Relative Häufigkeit eines Wertes x:
(n = Anzahl aller Werte)
Empirisch
Theoretisch
h  x

h x
f  x 
n
p  x
(Häufigkeitsverteilung)
Kumulierte absolute Häufigkeit
bis zu einer Schranke u:
Relative kumulierte Häufigkeit
bis zu einer Schranke u:
H  x    h  xi  xi  u





P  x    p  xi 
i
F  x    f  xi  xi  u
i
(Emp. Verteilungsfunktion)
Folie 7
(Wk.-Verteilung)
i
(Verteilungsfunktion)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Bernoulli
Experimente
 Die empirische Häufigkeitsverteilung f(x) und die
Wahrscheinlichkeitsverteilung p(x) einer Zufallsvariablen sind konzeptuell strikt zu trennen
Binomialvert.
 Die empirische und theoretische Verteilungsfunktion sind ebenfalls strikt zu trennen
Poisson Vert.
 Die theoretischen Verteilungen bedürfen keiner
Daten, denn sie sind gegeben
 Die theoretische Verteilung bestimmt, was für die
empirische Verteilung zu erwarten ist
 Aber: In der Notation wird oft einfach f(x) bzw.
F(x) geschrieben, gleichgültig, ob es um
Häufigkeiten oder Wahrscheinlichkeiten geht.
Folie 8
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
 Kann ein Zufallsexperiment mehrfach unter
demselben Komplex Ξ durchgeführt werden und
sind die einzelnen Versuche stochastisch
unabhängig, so spricht man von einem Bernoulli
Experiment.
 Das Bernoulli Experiment ist ein Art MetaExperiment, dessen Trials aus der mehrfachen
Durchführung des zugrunde liegenden
Experimentes bestehen.
 Der typische Stichprobenraum eines Bernoulli
Experimentes ergibt sich erst nach der sinnvollen
Definition einer Zufallsvariablen.
Folie 9
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Beispiel: Das Experiment Ξ sei der einmalige
Wurf einer fairen Münze, wobei die Münze nicht
auf der Kante liegen bleiben kann.
Binomialvert.
 Der Stichprobenraum ist
   Kopf , Zahl
Poisson Vert.
 Als Zufallsvariable könnte man definieren
 y1: 0, wenn Kopf
Y 
mit
 y2 : 1, wenn Zahl
Folie 10
 p Y  y1  : 0.5
p  y  
 p Y  y2  : 0.5
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Beispiel: Das Bernoulli Experiment bestehe nun
in der 20maligen Durchführung des Zufallsexperimentes Ξ
Binomialvert.
 Sein Stichprobenraum umfasst alle möglichen
20elementigen Folgen von Kopf und Zahl, also
Poisson Vert.
 K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K  , 


,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
Z
 



 '   ,



K
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,






Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z  
Folie 11
Ein Elementarereignis
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Auf dem Stichprobenraum eines solchen Bernoulli
Experimentes können viele verschiedene
Zufallsvariablen definiert werden.
Binomialvert.
 Beispiel: Jedem möglichen der insgesamt k
Elemente des Stichprobenraumes wird eine
eindeutige Zahl zugewiesen:
Poisson Vert.
 X  x1 : 1, wenn K , K , , K
 X  x : 2, wenn K , K , , Z

2
X 

 X  xk : 1048576, wenn Z , Z , , Z
Folie 12
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Auf dem Stichprobenraum eines solchen Bernoulli
Experimentes können viele verschiedene
Zufallsvariablen definiert werden.
Binomialvert.
 Beispiel: Jedem möglichen der insgesamt k
Elemente des Stichprobenraumes wird eine
eindeutige Zahl zugewiesen:
Poisson Vert.
 X  x1 : 1, wenn y1 , y1 , , y1
 X  x : 2, wenn y , y , , y

2
1
1
2
X 

 X  xk : 1048576, wenn y 2 , y2 , , y2
Folie 13
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Folie 14
 Zur Definition der Wahrscheinlichkeitsverteilung dieser Zufallsvariablen kann der
Multiplikationssatz für stochastisch
unabhängige Ereignisse herangezogen werden
 p  X  x1  : p  y1   p  y1   p  y1 

 p  X  x2  : p  y1   p  y1   p  y2 
p  x  

 p  X  x  : p  y   p  y   p  y 
k
2
2
2

Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Aber: Zu Zeiten Bernoullis wurde Wahrscheinlichkeitsrechnung vor allem zum besseren Verständnis
des Glücksspieles betrieben
Binomialvert.
 Deshalb spielte die Ordnung der Ergebnisse aus den
Trials eines Bernoulli Experimentes eher keine Rolle
Poisson Vert.
 Die Zufallsvariable eines Bernoulli Experimentes ist
per definitionem einfach die Summe der Realisationen aus den n durchgeführten Trials, also
n
X  y1  y2    yn   yi
i 1
mit n=20 in unserem Beispiel
Folie 15
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
 Im Beispiel mit n=20 ist dies aber gleichbedeutend
mit der Definition
 X  x1 : 0, wenn 0  Zahl
 X  x : 1, wenn 1 Zahl

2
X 

 X  x21 : 1, wenn 20  Zahl
 Wenn in der zugrunde liegenden Zufallsvariable Y
ein „Treffer“ (hier: Zahl) die 1 erhalten hat, liefert X
also einfach die Anzahl der Treffer in den n Trials
 Achtung: Diese Übertragung ist nicht mehr gültig,
sobald die Zufallsvariable Y anders definiert wird
Folie 16
(z.B. mit umgekehrter Zuweisung von 0/1 zu Kopf/Zahl)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Frage: Angenommen, die Wahrscheinlichkeitsfunktion der Zufallsvariablen X aus dem zugrunde
liegenden Experiment ist bekannt – kann dann die
Wahrscheinlichkeitsfunktion von Y ermittelt werden?
Binomialvert.
 Am Beispiel: Gibt es die mathematische Beziehung
Poisson Vert.
 p Y  y1  : 0.5
p  y  
 p Y  y2  : 0.5
Folie 17
?
 p  X  x1 

 p  X  x2 
p  x  

p X  x 
20

Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Der einfachste Fall eines Bernoulli Experimentes
beruht auf einem Experiment mit nur zwei
möglichen disjunkten Ergebnissen
Binomialvert.
 Man definiere für dieses Experiment die folgende
Zufallsvariable und Wahrscheinlichkeitsfunktion:
Poisson Vert.
Y  y1 : 0
Y 
Y  y2 : 1
 p Y  y1  : q
p  y  
 p Y  y2  : p
mit q = 1–p
 Beispiel: Beim Münzwurf wäre z.B. p = q = 0.5
Folie 18
(p ist die so genannte „Treffer- oder Erfolgswahrscheinlichkeit“)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
Man hat
Y  y1 : 0
Y 
Y  y2 :1
und kennt
 p Y  y1  : 1  p
p( y)  
 p Y  y2  : p
Binomialvert.
Poisson Vert.
ist gesucht
 p  X  x1  : ?

 p  X  x2  : ?
p ( x)  

pX  x : ?
n 1

Folie 19
Bei n Trials
 X  x1 : 0
 X  x :1

2
X 

 X  xn 1 : n
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Wird ein dichotomes Experiment n mal durchgeführt,
kann die Wahrscheinlichkeitsfunktion der möglichen
Realisationen für das resultierende Bernoulli
Experiment mathematisch hergeleitet werden:
Binomialvert.
Poisson Vert.
 n  x n x
f ( x , n, p )    p q
 x
mit n = Anzahl aller Trials
Dies ist die
Binomialverteilung
x = Anzahl günstiger Ergebnisse in den n Trials
p = Wk für jedes x
q = Wk der übrigen n-x Ergebnisse, also, q = 1–p
Folie 20
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
und kennt
Man hat
Y  y1 : 0
Y 
Y  y2 :1
 p Y  y1  : 1  p
p( y)  
 p Y  y2  : p
Binomialvert.
Poisson Vert.
ist gesucht
n
f ( x , n, p )    p x q n  x
 x
Bei n Trials
 p  X  x1  : ?

 p  X  x2  : ?
p ( x)  

pX  x : ?
n 1

Folie 21
 X  x1 : 0
 X  x :1

2
X 

 X  xn 1 : n
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Exkurs: Fakultät und der Binomialkoeffizient
Bernoulli
Experimente
 Der Binomialkoeffizient ist definiert als
n
n!
 
 x  x ! (n  x)!
Binomialvert.
Poisson Vert.
 Dabei ist
n !  1  2  3   n
per definitionem mit 0! = 1
Folie 22
lies: „n über x“
lies: „n Fakultät“
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Die Binomialverteilung ist eine diskrete
Wahrscheinlichkeitsverteilung, da sie nur endlich
viele verschiedene Werte annehmen kann
Binomialvert.
 Die mathematische Funktion kann nur dann
angewandt werden, wenn die Zufallsvariable des
zugrunde liegenden Experimentes 0/1-kodiert ist
Poisson Vert.
 Die Funktion f(x,n,p) gibt dann die Wahrscheinlichkeit
für jede mögliche Häufigkeit von 1en in den n
Versuchen an  Anzahl der „Treffer“
 Die Binomialverteilung ist die „Mutter aller
Verteilungen“, da aus ihr praktisch alle wichtigen
weiteren Verteilungen abgeleitet werden können
Folie 23
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Die Wahrscheinlichkeitsfunktion f(x,n,p) liefert
die Punktwahrscheinlichkeiten für ein genau xmaliges Auftreten der Realisation 1 einer 0/1
kodierten Zufallsvariablen.
Binomialvert.
 Zusätzlich existiert auch die Verteilungsfunktion
der Intervallwahrscheinlichkeiten für ein
maximal x-maliges Auftreten der Realisation 1
Poisson Vert.
 Diese ist einfach die Summe aller Punktwahrscheinlichkeiten bis zur Realisation xi
k
F  x, n, p    f  xi , n, p 
i 1
Folie 24
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Am Beispiel mit p=0.5 und n=20 ergäbe sich
x
Binomialvert.
Poisson Vert.
Folie 25
f(x)
F(x)
0
0.000
0.000
1
0.000
0.000
2
0.000
0.000
3
0.001
0.001
4
0.005
0.006
5
0.015
0.021
…
…
…
20
0.000
1.000
x
x
Methodenlehre
& Statistik
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Absolute Häufigkeit eines Wertes x:
Relative Häufigkeit eines Wertes x:
(n = Anzahl aller Werte)
Empirisch
Theoretisch
h  x

h x
f  x 
n
p  x
(Häufigkeitsverteilung)
Kumulierte absolute Häufigkeit
bis zu einer Schranke u:
Relative kumulierte Häufigkeit
bis zu einer Schranke u:
H  x    h  xi  xi  u





P  x    p  xi 
i
F  x    f  xi  xi  u
i
(Emp. Verteilungsfunktion)
Folie 26
(Wk.-Verteilung)
i
(Verteilungsfunktion)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte
 die Häufigkeit, mit dem ein Ereignis in einem bestimmten
Zeitintervall typischerweise auftritt, sei .
 die Wahrscheinlichkeit des Eintretens von m Ereignissen
in einem Zeitintervall ist nur von der Länge des Intervalls
abhängig, nicht von seiner Lage auf der Zeitachse
 die Ereignisse sind stochastisch unabhängig
Die Wahrscheinlichkeit für das Eintreten von m Ereignissen in
einem Zeitintervall ist dann
e   x
f ( x,  ) 
x!
Folie 27
Poisson Verteilung
(e = Eulersche Zahl; 2.718)
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung
Bernoulli
Experimente
e  x
f ( x,  ) 
x!
Binomialvert.
Poisson Vert.
  wird auch als Intensitätsparameter der PoissonVerteilung bezeichnet
 Anders als die Binomialverteilung ist die PoissonVerteilung unendlich abzählbar.
Folie 28
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung als Approximation der Binomialvert.
Bernoulli
Experimente
 Wenn n groß ist und p klein, ist die Bestimmung von
Wahrscheinlichkeiten aus der Binomialverteilung
mathematisch aufwändig
Binomialvert.
 Die Poisson-Verteilung approximiert die Binomialverteilung für seltene Ereignisse sehr gut, wenn n ≥ 100
und np ≤ 10
Poisson Vert.
 Dabei wird angenommen, dass λ = np
e  n p ( n  p ) x  n  x
f ( x, n  p ) 
   p (1  p ) n  x  f ( x, n, p )
x!
 x
Poisson
Folie 29
Binomial
Methodenlehre
& Statistik
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung als Approximation der Binomialvert.
Bernoulli
Experimente
 Die Poisson Verteilung geht mathematisch unmittelbar
aus der Binomialverteilung hervor
Binomialvert.
 Die Poisson Verteilung wird häufig als Verteilung für
seltene Ereignisse bezeichnet.
Poisson Vert.
 Hier ist streng zu unterscheiden zwischen einer kleinen
Wahrscheinlichkeit p und einer theoretisch recht großen
Anzahl n·p der unwahrscheinlichen Ereignisse.
 Die Güte der Approximation bezieht sich auf den
relativen Approximationsfehler, d.h. den Quotienten
aus der Binomial-Wk und der Poisson-Wk
Folie 30
Methodenlehre
& Statistik
Relevante Excel Funktionen
 Diskrete Wahrscheinlichkeitsverteilungen
• BINOM.VERT()
• POISSON.VERT()
oder EXP() und POTENZ() bzw. ^ („hoch“)
• FAKULTÄT(), KOMBINATIONEN()
Folie 31
Herunterladen