X - Methodenlehre - Johannes Gutenberg

Werbung
Statistik &
Methodenlehre
Prof. Dr. G.
Meinhardt
6. Stock, Wallstr. 3
(Raum 06-206)
Sprechstunde
jederzeit nach
Vereinbarung und
nach der
Vorlesung.
Mathematische und
statistische Methoden II
Dr. Malte Persike
 [email protected]
 http://psymet03.sowi.uni-mainz.de/
SoSe 2011
Fachbereich Sozialwissenschaften
Psychologisches Institut
Johannes Gutenberg Universität Mainz
Folie 1
Statistik &
Methodenlehre
Inhalte
dieser Sitzung
 Theoretische Wahrscheinlichkeiten und empirische
Häufigkeiten
 Bernoulli Experimente
 Binomial- und Poisson-Verteilung
 Ausblick: Statistisches Testen
Folie 2
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Notation
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
 Eine Zufallsvariable, die abzählbar viele Werte
annehmen kann (in endlich oder unendlich vielen
Ausprägungen), wird als diskrete
Zufallsvariable bezeichnet
 Das Ereignis, dass die diskrete Zufallsvariable X
eine bestimmte (die i-te) Ausprägung annimmt,
wird bezeichnet als X = xi
 Die Wk für X = xi wird als p(X = xi) oder kürzer
p(xi) oder ganz kurz pi bezeichnet
 p(X = xi) ist eine Punktwahrscheinlichkeit
Folie 3
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Wahrscheinlichkeitsverteilung
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Die Verteilung der p(X = xi) auf alle möglichen
Ausprägungen von X wird als diskrete
Wahrscheinlichkeitsverteilung bezeichnet.
Sie beschreibt theoretische Punktwahrscheinlichkeiten und wird definiert als
 p ( X  xi ) :  falls x i   x1  xk 
p ( x)  
0 sonst

Wert von X
p(X = xi)
Folie 4
x1
x2
p(x1) p(x2)
…
xi
p(xi)
…
xk
p(xk)
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Verteilungsfunktion
Bernoulli
Experimente
Binomialvert.
Die Verteilung der p(X ≤ xm) wird als Verteilungsfunktion
der Zufallsvariablen X oder kumulierte Wahrscheinlichkeitsverteilung bezeichnet.
Sie beschreibt theoretische Intervallwahrscheinlichkeiten und wird definiert als
m
Poisson Vert.
P( x)  p ( X  xm )  p1  p2    pm   pi
i 1
Wert von X
p(X ≤ xi)
Folie 5
x1
x2
p(x1)
p(x1) + p(x2)
…
xm
… p(x1) + p(x2) + … + p(xm)
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Folie 6
Statistik &
Methodenlehre
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Absolute Häufigkeit eines Wertes x:
Relative Häufigkeit eines Wertes x:
(n = Anzahl aller Werte)
Empirisch
Theoretisch
h  x

h x
f  x 
n
p  x
(Häufigkeitsverteilung)
Kumulierte absolute Häufigkeit
bis zu einer Schranke u:
Relative kumulierte Häufigkeit
bis zu einer Schranke u:
H  x    h  xi  xi  u





P  x    p  xi 
i
F  x    f  xi  xi  u
i
(Emp. Verteilungsfunktion)
Folie 7
(Wk.-Verteilung)
i
(Verteilungsfunktion)
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Recap – Häufigkeit und Wahrscheinlichkeit
Bernoulli
Experimente
 Die empirische Häufigkeitsverteilung f(x) und die
Wahrscheinlichkeitsverteilung p(x) einer Zufallsvariablen sind konzeptuell strikt zu trennen
Binomialvert.
 Die empirische und theoretische Verteilungsfunktion sind ebenfalls strikt zu trennen
Poisson Vert.
 Die theoretischen Verteilungen bedürfen keiner
Daten, denn sie sind gegeben
 Die theoretische Verteilung bestimmt, was für die
empirische Verteilung zu erwarten ist
 Aber: In der Notation wird oft einfach f(x) bzw.
F(x) geschrieben, gleichgültig, ob es um
Häufigkeiten oder Wahrscheinlichkeiten geht.
Folie 8
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
 Kann ein Zufallsexperiment mehrfach unter
demselben Komplex Ξ durchgeführt werden und
sind die einzelnen Versuche stochastisch
unabhängig, so spricht man von einem Bernoulli
Experiment.
 Das Bernoulli Experiment ist ein Art MetaExperiment, dessen Trials aus der mehrfachen
Durchführung des zugrunde liegenden
Experimentes bestehen.
 Der typische Stichprobenraum eines Bernoulli
Experimentes ergibt sich erst nach der sinnvollen
Definition einer Zufallsvariablen.
Folie 9
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Beispiel: Das Experiment Ξ sei der einmalige
Wurf einer fairen Münze, wobei die Münze nicht
auf der Kante liegen bleiben kann.
Binomialvert.
 Der Stichprobenraum ist
   Kopf , Zahl
Poisson Vert.
 Als Zufallsvariable könnte man definieren
 y1: 0, wenn Kopf
Y 
mit
 y2 : 1, wenn Zahl
Folie 10
 p Y  y1  : 0.5
p  y  
 p Y  y2  : 0.5
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Beispiel: Das Bernoulli Experiment bestehe nun
in der 20maligen Durchführung des Zufallsexperimentes Ξ
Binomialvert.
 Sein Stichprobenraum umfasst alle möglichen
20elementigen Folgen von Kopf und Zahl, also
Poisson Vert.
 K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K  , 


,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
,
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
K
Z
 



 '   ,



K
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,
Z
,






Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z  
Folie 11
Ein Elementarereignis
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Auf dem Stichprobenraum eines solchen Bernoulli
Experimentes können viele verschiedene
Zufallsvariablen definiert werden.
Binomialvert.
 Beispiel: Jedem möglichen der insgesamt k
Elemente des Stichprobenraumes wird eine
eindeutige Zahl zugewiesen:
Poisson Vert.
 X  x1 : 1, wenn K , K , , K
 X  x : 2, wenn K , K , , Z

2
X 

 X  xk : 1048576, wenn K , Z , , Z
Folie 12
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Auf dem Stichprobenraum eines solchen Bernoulli
Experimentes können viele verschiedene
Zufallsvariablen definiert werden.
Binomialvert.
 Beispiel: Jedem möglichen der insgesamt k
Elemente des Stichprobenraumes wird eine
eindeutige Zahl zugewiesen:
Poisson Vert.
 X  x1 : 1, wenn y1 , y1 , , y1
 X  x : 2, wenn y , y , , y

2
1
1
2
X 

 X  xk : 1048576, wenn y1 , y2 , , y2
Folie 13
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Folie 14
 Zur Definition der Wahrscheinlichkeitsverteilung dieser Zufallsvariablen kann der
Multiplikationssatz für stochastisch
unabhängige Ereignisse herangezogen werden
 p  X  x1  : p  y1   p  y1   p  y1 

 p  X  x2  : p  y1   p  y1   p  y2 
p  x  

 p  X  x  : p  y   p  y   p  y 
k
1
2
2

Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Aber: Zu Zeiten Bernoullis wurde Wahrscheinlichkeitsrechnung vor allem zum besseren Verständnis
des Glücksspieles betrieben
Binomialvert.
 Deshalb spielte die Ordnung der Ergebnisse aus den
Trials eines Bernoulli Experimentes eher keine Rolle
Poisson Vert.
 Die Zufallsvariable eines Bernoulli Experimentes ist
per definitionem einfach die Summe der Realisationen aus den n durchgeführten Trials, also
n
X  y1  y2    yn   yi
i 1
mit n=20 in unserem Beispiel
Folie 15
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
 Im Beispiel mit n=20 ist dies aber gleichbedeutend
mit der Definition
 X  x1 : 0, wenn 0  Zahl
 X  x : 1, wenn 1 Zahl

2
X 

 X  x21 : 1, wenn 20  Zahl
 Wenn in der zugrunde liegenden Zufallsvariable Y
ein „Treffer“ (hier: Zahl) die 1 erhalten hat, liefert X
also einfach die Anzahl der Treffer in den n Trials
 Achtung: Diese Übertragung ist nicht mehr gültig,
sobald die Zufallsvariable Y anders definiert wird
Folie 16
(z.B. mit umgekehrter Zuweisung von 0/1 zu Kopf/Zahl)
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen unabhängiger Ereignisse
Bernoulli Experimente
Bernoulli
Experimente
 Frage: Angenommen, die Wahrscheinlichkeitsfunktion der Zufallsvariablen X aus dem zugrunde
liegenden Experiment ist bekannt – kann dann die
Wahrscheinlichkeitsfunktion von Y ermittelt werden?
Binomialvert.
 Am Beispiel: Gibt es die mathematische Beziehung
Poisson Vert.
 p Y  y1  : 0.5
p  y  
 p Y  y2  : 0.5
Folie 17
?
 p  X  x1 

 p  X  x2 
p  x  

p X  x 
20

Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Der einfachste Fall eines Bernoulli Experimentes
beruht auf einem Experiment mit nur zwei
möglichen disjunkten Ergebnissen
Binomialvert.
 Man definiere für dieses Experiment die folgende
Zufallsvariable und Wahrscheinlichkeitsfunktion:
Poisson Vert.
Y  y1 : 0
Y 
Y  y2 : 1
 p Y  y1  : q
p  y  
 p Y  y2  : p
mit q = 1–p
 Beispiel: Beim Münzwurf wäre z.B. p = q = 0.5
Folie 18
(p ist die so genannte „Treffer- oder Erfolgswahrscheinlichkeit“)
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
Man hat
Y  y1 : 0
Y 
Y  y2 :1
und kennt
 p Y  y1  : 1  p
p( y)  
 p Y  y2  : p
Binomialvert.
Poisson Vert.
ist gesucht
 p  X  x1  : ?

 p  X  x2  : ?
p ( x)  

pX  x : ?
n 1

Folie 19
Bei n Trials
 X  x1 : 0
 X  x :1

2
X 

 X  xn 1 : n
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Wird ein dichotomes Experiment n mal durchgeführt,
kann die Wahrscheinlichkeitsfunktion der möglichen
Realisationen für das resultierende Bernoulli
Experiment mathematisch hergeleitet werden:
Binomialvert.
Poisson Vert.
 n  x n x
f ( x , n, p )    p q
 x
mit n = Anzahl aller Trials
Dies ist die
Binomialverteilung
x = Anzahl günstiger Ergebnisse in den n Trials
p = Wk für jedes x
q = Wk der übrigen n-x Ergebnisse, also, q = 1–p
Folie 20
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
und kennt
Man hat
Y  y1 : 0
Y 
Y  y2 :1
 p Y  y1  : 1  p
p( y)  
 p Y  y2  : p
Binomialvert.
Poisson Vert.
ist gesucht
n
f ( x , n, p )    p x q n  x
 x
Bei n Trials
 p  X  x1  : ?

 p  X  x2  : ?
p ( x)  

pX  x : ?
n 1

Folie 21
 X  x1 : 0
 X  x :1

2
X 

 X  xn 1 : n
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Exkurs: Fakultät und der Binomialkoeffizient
Bernoulli
Experimente
 Der Binomialkoeffizient ist definiert als
n
n!
 
 x  x ! (n  x)!
Binomialvert.
Poisson Vert.
 Dabei ist
n !  1  2  3   n
per definitionem mit 0! = 1
Folie 22
lies: „n über x“
lies: „n Fakultät“
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Die Binomialverteilung ist eine diskrete
Wahrscheinlichkeitsverteilung, da sie nur endlich
viele verschiedene Werte annehmen kann
Binomialvert.
 Die mathematische Funktion kann nur dann
angewandt werden, wenn die Zufallsvariable des
zugrunde liegenden Experimentes 0/1-kodiert ist
Poisson Vert.
 Die Funktion f(x,n,p) gibt dann die Wahrscheinlichkeit
für jede mögliche Häufigkeit von 1en in den n
Versuchen an  Anzahl der „Treffer“
 Die Binomialverteilung ist die „Mutter aller
Verteilungen“, da aus ihr praktisch alle wichtigen
weiteren Verteilungen abgeleitet werden können
Folie 23
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Die Wahrscheinlichkeitsfunktion f(x,n,p) liefert
die Punktwahrscheinlichkeiten für ein genau xmaliges Auftreten der Realisation 1 einer 0/1
kodierten Zufallsvariablen.
Binomialvert.
 Zusätzlich existiert auch die Verteilungsfunktion
der Intervallwahrscheinlichkeiten für ein
maximal x-maliges Auftreten der Realisation 1
Poisson Vert.
 Diese ist einfach die Summe aller Punktwahrscheinlichkeiten bis zur Realisation xi
k
F  x, n, p    f  xi , n, p 
i 1
Folie 24
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Binomialverteilung
Bernoulli
Experimente
 Am Beispiel mit p=0.5 und n=20 ergäbe sich
x
Binomialvert.
Poisson Vert.
Folie 25
f(x)
F(x)
0
0.000
0.000
1
0.000
0.000
2
0.000
0.000
3
0.001
0.001
4
0.005
0.006
5
0.015
0.021
…
…
…
20
0.000
1.000
x
x
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte
 die Häufigkeit, mit dem ein Ereignis in einem bestimmten
Zeitintervall typischerweise auftritt, sei .
 die Wahrscheinlichkeit des Eintretens von m Ereignissen
in einem Zeitintervall ist nur von der Länge des Intervalls
abhängig, nicht von seiner Lage auf der Zeitachse
 die Ereignisse sind stochastisch unabhängig
Die Wahrscheinlichkeit für das Eintreten von m Ereignissen in
einem Zeitintervall ist dann
e   x
f ( x,  ) 
x!
Folie 26
Poisson Verteilung
(e = Eulersche Zahl; 2.718)
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung
Bernoulli
Experimente
e  x
f ( x,  ) 
x!
Binomialvert.
Poisson Vert.
  wird auch als Intensitätsparameter der PoissonVerteilung bezeichnet
 Anders als die Binomialverteilung ist die PoissonVerteilung unendlich abzählbar.
Folie 27
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung als Approximation der Binomialvert.
Bernoulli
Experimente
 Wenn n groß ist und p klein, ist die Bestimmung von
Wahrscheinlichkeiten aus der Binomialverteilung
mathematisch aufwändig
Binomialvert.
 Die Poisson-Verteilung approximiert die Binomialverteilung für seltene Ereignisse sehr gut, wenn n ≥ 100
und np ≤ 10
Poisson Vert.
 Dabei wird angenommen, dass λ = np
e  n p ( n  p ) x  n  x
f ( x, n  p ) 
   p (1  p ) n  x  f ( x, n, p )
x!
 x
Poisson
Folie 28
Binomial
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
Poisson Verteilung als Approximation der Binomialvert.
Bernoulli
Experimente
 Die Poisson Verteilung geht mathematisch unmittelbar
aus der Binomialverteilung hervor
Binomialvert.
 Die Poisson Verteilung wird häufig als Verteilung für
seltene Ereignisse bezeichnet.
Poisson Vert.
 Hier ist streng zu unterscheiden zwischen einer kleinen
Wahrscheinlichkeit p und einer theoretisch recht großen
Anzahl n·p der unwahrscheinlichen Ereignisse.
 Die Güte der Approximation bezieht sich auf den
relativen Approximationsfehler, d.h. den Quotienten
aus der Binomial-Wk und der Poisson-Wk
Folie 29
Statistik &
Methodenlehre
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Gustav Fechner, Urvater der Experimentellen Psychologie,
entwickelte zentrale Methoden der modernen Psychophysik
mit genau einem Ziel: den Beweis zu führen, dass Pflanzen
eine Seele haben.
Er perfektionierte eine Methode der Mikrostimulation, auf die
hin er eine biologische Reaktion und bei Pflanzen nachweisen
wollte. Eine solche Reaktion wäre der Beleg, dass Pflanzen
fühlen können. Damit wäre es zum Denken und schließlich
zur Seele nicht mehr weit.
Fechner führte insgesamt n=24576 Messungen von ReizReaktionsmusters bei Pflanzen durch.
Folie 30
Angenommen, Pflanzen zeigen die gewünschte Reaktion
auch ohne Stimulation (d.h. zufällig) mit einer
Wahrscheinlichkeit von p=.25. Fechner möge eine Reaktion in
m=6306 Fällen finden. Haben Pflanzen eine Seele?
Statistik &
Methodenlehre
Relevante Excel Funktionen
 Diskrete Wahrscheinlichkeitsverteilungen
• BINOM.VERT()
• POISSON.VERT()
oder EXP() und POTENZ() bzw. ^ („hoch“)
• SUMME(), PRODUKT(), FAKULTÄT()
Folie 31
Herunterladen