Mathematische und statistische Methoden II statistische Methoden II

Werbung
Statistik &
Methodenlehre
e ode e e
Prof. Dr. G. Meinhardt
6. Stock, Wallstr. 3
((Raum 06-206))
Sprechstunde jederzeit
nach Vereinbarung und
nach der Vorlesung.
g
Mathematische und
statistische Methoden II
Dr. Malte Persike
} [email protected]
http://psymet03.sowi.uni-mainz.de/methods/
SS 2010
Fachbereich Sozialwissenschaften
Psychologisches Institut
Johannes Gutenberg Universität Mainz
Statistik &
Methodenlehre
e ode e e
Multiplikations
satz
Mengenlehre
Wk-Theorie
Stochastische Unabhängigkeit
Wenn gilt:
p(B) = p(B | A)
Wechselseitigkeit
Gegenereignisse
werden die Ereignisse A und B stochastisch unabhängig
genannt, weil die Wahrscheinlichkeit des Auftretens des
Ereignisses B nicht vom Auftreten von A abhängt.
Setzen wir die rechte Seite der Gleichung in das
Multiplikationstheorem ein, erhalten wir:
p(A
(A ∩ B) = p(B
(B | A) p(A)
(A) = p(A)
(A) p(B)
(B)
Kurz:
p(A ∩ B) = p(A) P(B)
Multiplikationssatz für stoch. unabh. Ereignisse
Statistik &
Methodenlehre
e ode e e
Multiplikations
satz
Wechselseitigkeit
Gegenereignisse
Mengenlehre
Wk-Theorie
Stochastische Unabhängigkeit
Verallgemeinerung des Multiplikationssatzes
Wenn die Ereignisse A1, A2, … Ak insgesamt unabhängig
sind, so gilt
p(A1∩A2∩…
∩ ∩Ak) = p(A1))·p(A
p(A2))·… ·p(A
p(Ak)
Achtung:
g Die Disjunktheit
j
von Ereignissen
g
hat mit der
stochastischen Unabhängigkeit nichts zu tun.
A und B sind disjunkt (A ∩ B = {∅}).
Wenn aber A eingetreten ist,
verändert sich
p(B) zu p(B) / p(Ω \ A),
wird also größer, solange A ≠ {∅}.
A
B
Ω
Statistik &
Methodenlehre
e ode e e
Multiplikations
satz
Mengenlehre
Wk-Theorie
Stochastische Unabhängigkeit
Wechselseitigkeit
Wir haben beim Multiplikationstheorem gesehen,
gesehen dass
Wechselseitigkeit
Gegenereignisse
p(A ∩ B) = p(B | A) p(A) = p(A | B) p(B)
Und beim Multiplikationssatz, dass für ein von A stochastisch unabhängiges Ereignis B [also p(B) = p(B | A)] gilt:
p(A ∩ B) = p(A) p(B)
Ei
Einsetzen
t
der
d zweiten
it Gleichung
Gl i h
in
i die
di erste
t führt
füh t zu
p(A | B) p(B) = p(A) p(B)
also
p(A | B) = p(A)
Also: Ist B von A unabhängig, so ist es auch A von B.
Statistik &
Methodenlehre
e ode e e
Multiplikations
satz
Mengenlehre
Wk-Theorie
Stochastische Unabhängigkeit
Gegenereignisse
Nach de Morgans Gesetzen gilt:
Wechselseitigkeit
Gegenereignisse
A∪ B = A∩ B
A∩ B = A∪ B
Damit lässt sich zeigen, dass
p ( A ∩ B ) = p ( A) ⋅ p ( B )
p ( A ∩ B ) = p ( A) ⋅ p ( B )
p ( A ∩ B ) = p ( A) ⋅ p( B )
A
B
Wenn also die Ereignisse A und B stochastisch unabhängig
sind, so sind es auch ihre Gegenereignisse und alle Paarungen
daraus.
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Definition
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Eine Zufallsvariable,
Ei
Z f ll
i bl die
di abzählbar
b ählb viele
i l Werte
W t
annehmen kann (in endlich oder unendlich vielen
Ausprägungen), wird als diskrete
Zufallsvariable bezeichnet
Das Ereignis, dass die diskrete Zufallsvariable X
eine bestimmte (die i-te) Ausprägung annimmt,
wird bezeichnet als X = xi
Die Wk für X = xi wird als p(X = xi) oder kurz pi
bezeichnet
pi ist eine Punktwahrscheinlichkeit
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Diskrete Zufallsvariablen
Übersicht
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Stetige Verteilungen
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Wahrscheinlichkeitsverteilung
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Die Verteilung der p(X = xi) wird als diskrete
Wahrscheinlichkeitsverteilung bezeichnet.
Sie beschreibt theoretische Punktwahrscheinlichkeiten und wird definiert als
⎧ p( X = xi ) = pi falls x i ∈ { x1 … xk }
f ( x) = ⎨
0 sonst
⎩
Wert von X
p(X = xi)
x1
x2
p(x1) p(x2)
…
xi
p(xi)
…
xk
p(xk)
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Verteilungsfunktion
Bernoulli
Experimente
Binomialvert.
Die Verteilung der P(X ≤ xm) wird als Verteilungsfunktion
der Zufallsvariablen X oder kumulierte Wahrscheinlichkeitsverteilung bezeichnet.
Sie beschreibt theoretische Intervallwahrscheinlichkeiten und wird definiert als
m
Poisson Vert.
F ( x) = p( X ≤ xm ) = p1 + p2 + … + pm = ∑ pi
i =1
Wert von X
p(X ≤ xi)
x1
x2
p(x1)
p(x1) + p(x2)
…
xm
… p(x1) + p(x2) + … + p(xm)
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Häufigkeit und Wahrscheinlichkeit
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Die empirische beobachtete Häufigkeit des
Auftretens einer Realisation X = xi in einem
Z fallse pe iment wird
Zufallsexperiment
i d als h(X = xi) geschrieben.
gesch ieben
h(X = xi) wird auch als absolute Häufigkeit
bezeichnet.
g
f(X = xi) ist dann
f(
Die relative Häufigkeit
definiert als der Quotient aus absoluter Häufigkeit
und der Anzahl n aller Versuche, also
f(X = xi) = h(X = xi) / n
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Zusammenfassung Notation
Bernoulli
Experimente
Relative Häufigkeit eines Wertes x:
Binomialvert.
h ( x)
Absolute Häufigkeit eines Wertes x:
(n = Anzahl aller Werte)
h( x)
f ( x) =
n
((Empirische
p
Häufigkeitsverteilung)
g
g)
Poisson Vert.
Kumulierte absolute Häufigkeit
bis zu einer Schranke u:
Relative kumulierte Häufigkeit
bis zu einer Schranke u:
H ( u ) = ∑ h ( xi ) xi ≤ u
(
)
(
)
i
F ( u ) = ∑ f ( xi ) xi ≤ u
i
(Empirische Verteilungsfunktion)
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Zufallsvariablen
Theoretische und empirische Wk-Verteilung
Bernoulli
Experimente
Die empirische
Di
i i h Häufigkeitsverteilung
Hä fi k it
t il
f( ) und
f(x)
d die
di
Wahrscheinlichkeitsverteilung p(x) sind konzeptuell
strikt zu trennen
Binomialvert.
Die empirische Verteilungsfunktion und die
Verteilungsfunktion
g
einer Zufallsvariablen sind
ebenfalls konzeptuell strikt zu trennen
Poisson Vert.
Die theoretischen Verteilungen bedürfen keiner
Daten, denn sie sind gegeben
Die theoretischen Verteilungen bestimmen
bestimmen, was
für die empirischen Verteilungen zu erwarten ist
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen
g
unabhängiger
g g Ereignisse
g
Bernoulli Experimente
Bernoulli
Experimente
Kann ein Zufallsexperiment mehrfach unter demselben
Komplex Ξ durchgeführt werden und sind die einzelnen
Versuche stochastisch unabhängig, so spricht man von einem
Bernoulli Versuch.
Binomialvert.
Poisson Vert.
Wenn eine einzelne Durchführung die Ergebnisse x1, x2 … xk
ergeben kann und diesen Realisierungen die
Wahrscheinlichkeiten p(x1), p(x2), …, p(xk) zugeordnet sind, so
ist die Wahrscheinlichkeit einer bestimmten Folge von n
Zi h
Ziehungen
n
px1 , x2 ... xn = p ( x1 ) ⋅ p ( x2 ) ⋅… ⋅ p ( xn ) = ∏ p ( xi )
i =1
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Folgen
g
unabhängiger
g g Ereignisse
g
Bernoulli Experimente
Bernoulli
Experimente
Der Stichprobenraum Ω eines Bernoulli Experimentes
umfasst alle möglichen Folgen der Ergebnisse der einzelnen
Ziehungen.
Binomialvert.
Beispiel: Eine Münze wird 20 Mal geworfen
Wurf Nr.
Poisson Vert.
Ergebnis
x
1
Kopf
0
2
Kopf
0
3
Zahl
1
4
Kopf
0
5
Z hl
Zahl
1
…
…
…
Ein Elementarereignis
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
g
Binomialverteilung
Bernoulli
Experimente
Der Stichprobenraum Ω eines Bernoulli Experimentes
umfasst alle möglichen Folgen der Ergebnisse der einzelnen
Ziehungen.
Binomialvert.
Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte
Poisson Vert.
n
m
p
q
sei
sei
sei
sei
die
die
die
die
Anzahl aller Versuche mit Zurücklegen
g
Anzahl günstiger Ergebnisse in den n Ziehungen
Wk für jedes m
Wk der übrigen
g n-m Ergebnisse,
g
also, q = 1 - p
⎛ n ⎞ m n−m
f (m, n, p ) = ⎜ ⎟ p q
⎝m⎠
Dies ist die
Binomialverteilung
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Gustav Fechner, Urvater der Experimentellen Psychologie,
entwickelte
t i k lt zentrale
t l Methoden
M th d der
d modernen
d
Psychophysik
P h h ik
mit genau einem Ziel: den Beweis zu führen, dass Pflanzen
eine Seele haben.
Er perfektionierte eine Methode der Mikrostimulation, auf die
hin er eine biologische Reaktion und bei Pflanzen nachweisen
wollte. Eine solche Reaktion wäre der Beleg, dass Pflanzen
fühlen können. Damit wäre es zum Denken und schließlich
zur Seele nicht mehr weit.
Fechner führte insgesamt nn=24576
24576 Messungen von ReizReaktionsmusters bei Pflanzen durch.
Angenommen, Pflanzen zeigen die gewünschte Reaktion
auch
h ohne
h Stimulation
Sti l ti (d.h.
(d h zufällig)
fälli ) mit
it einer
i
Wahrscheinlichkeit von p=.25. Fechner möge eine Reaktion in
m=6306 Fällen finden. Haben Pflanzen eine Seele?
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Wenn die Wahrscheinlichkeitsfunktion eines
Zufallsexperimentes theoretisch bekannt ist, können die
bei einer Durchführung erwarteten empirischen
Häufigkeiten bestimmt werden.
werden
Beobachtete absolute oder relative Häufigkeiten können
dann mit den erwarteten Häufigkeiten verglichen werden.
Wenn eine beobachtete Häufigkeit „zu unwahrscheinlich“
ist,, um unter der gegebenen
g g
Wahrscheinlichkeitsfunktion
zu entstehen, kann die Wahrscheinlichkeitsfunktion als
nicht zutreffend betrachtet werden.
Entweder sind dann ihre Parameter falsch definiert oder
die Funktion selbst ist nicht zutreffend.
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens – Binomialtest
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Grundgedanke: Eine beobachtete Häufigkeit m in
einem Bernoulli Experiment sollte im Bereich „typischer“
erwarteter Häufigkeiten liegen.
Diese erwarteten
Di
t t Häufigkeiten
Hä fi k it hä
hängen b
beii
binomialverteilten Zufallsvariablen von der Anzahl der
Versuche n und den Auftretenswahrscheinlichkeiten p
und q ab.
ab
Problem: Allein aufgrund der zufälligen Ziehung wird
die beobachtete Häufigkeit schwanken
(Stichprobenfehler).
Frage: Wie extrem muss eine beobachtete Häufigkeit
sein, damit wir begründet annehmen können, dass diese
Beobachtung „nicht passt“?
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens – Binomialtest
Bernoulli
Experimente
Binomialvert.
Die Häufigkeitsverteilung einer binomialverteilten
V i bl ist
Variablen
i t bekannt,
b k
t sie
i lässt
lä t sich
i h durch
d h eine
i
mathematische Formel beschreiben
⎛ n ⎞ m n−m
f ( m, n , p ) = ⎜ ⎟ p q
⎝m⎠
Daraus sind die erwarteten Häufigkeiten zu berechnen
berechnen.
Poisson Vert.
Beim statistischen Testen fragen wir niemals nach der
Punktwahrscheinlichkeit sondern immer nach
Punktwahrscheinlichkeit,
Intervallwahrscheinlichkeiten, z.B.
f ( X ≤ xi )
→ Ein so kleiner oder noch kleinerer Wert
f ( X ≥ xi )
→ Ein so großer oder noch größerer Wert
1 − f ( xi < X < x j ) → Ein so extremer oder noch extremerer Wert
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens – Binomialtest
Bernoulli
Experimente
Ist die berechnete Wahrscheinlichkeit zu klein, ist die
Beobachtung einer so extremen Häufigkeit vermutlich
nicht zufällig, sondern systematisch.
Die Beobachtung ist dann statistisch signifikant.
signifikant
Binomialvert.
Problem: Wie klein ist „zu unwahrscheinlich“?
Poisson Vert.
Hier haben sich in der Praxis zwei Cut-Off Werte
eingebürgert, die als α–Niveaus oder
Signifikanzniveaus bezeichnet werden.
Es gilt:
α ≥ 0.05
α < 00.05
05
α < 0.01
→ statistisch nicht signifikant
→ statistisch signifikant
→ statistisch hochsignifikant
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens – Binomialtest
Bernoulli
Experimente
In einem Experiment
p
mit einer angenommenen
g
Binomialverteilung f(m, n=24576, p=0.25) erhalte man
ein m=6306.
Binomialvert.
Man berechnet
M
b
h t nun die
di Auftretenswahrscheinlichkeit
A ft t
h h i li hk it
p(X ≥ m) unter der Annahme, dass die angenommene
Häufigkeitsverteilung gilt.
Poisson Vert.
Es sei p=0.008.
Nach unseren Konventionen würden wir auf jedem αNi
Niveau
sagen, dass
d
m signifikant
i ifik t ist.
i t
Aber Achtung: Das m=6306 hat eine
Auftretenswahrscheinlichkeit von p(m)
p(m)=00.008.
008.
Mit diesem p kann es also auch dann vorkommen, wenn
die angenommene Binomialverteilung zutrifft.
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens – Binomialtest
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Die Aussage,
g , ein m sei statistisch signifikant,
g
, ist eine
Wahrscheinlichkeitsaussage bei der immer ein
Restirrtum verbleibt, die Irrtumswahrscheinlichkeit.
Diese Irrtumswahrscheinlichkeit hängt nicht von der
konkret erhaltenen Wahrscheinlichkeit p ab, sondern vom
gewählten Signifikanzniveau α.
Bei α=0.05 beträgt die Irrtumswahrscheinlichkeit also
5%, bei α=0.01 ist sie 1%.
Praxis: In der Praxis wird α demzufolge entweder als
α–Niveau, Signifikanzniveau oder auch
Irrtumswahrscheinlichkeit bezeichnet.
bezeichnet
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Inferenzstatistik – Primer
Das Prinzip des statistischen Testens – Binomialtest
Bernoulli
Experimente
Beobachtung im Experiment: X=m
Frage: Kann m aus einer bestimmten Verteilung stammen?
Geht die Höhe der Häufigkeit auf einen Stichprobenfehler zurück?
Binomialvert.
(1) Bestimmung der Verteilung der Zufallsvariablen X
((2)) Festlegung
g g eines Signifikanzniveaus
g
α
Poisson Vert.
(3) Berechnung der Wahrscheinlichkeit für dieses oder ein
extremeres m: z. B. p(X≥m)
(4) Vergleich von p mit α und
Treffen der Signifikanzaussage
Aber: Bei dieser
Aussage irrt man
sich mit einer
Wahrscheinlichkeit
von α·100%
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
g
Poisson Verteilung
Bernoulli
Experimente
Binomialvert.
Poisson Vert.
Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte
Die Wahrscheinlichkeit, dass ein Ereignis in einem
bestimmten Zeitintervall auftritt, sei λ.
Die Wahrscheinlichkeit
Di
W h h i li hk i des
d Eintretens
Ei
von m Ereignissen
E i i
in einem Zeitintervall ist nur von der Länge des Intervalls
abhängig, nicht von seiner Lage auf der Zeitachse
Ereignisse sind stochastisch unabhängig
Die Wahrscheinlichkeit für das Eintreten von m Ereignissen in
einem Zeitintervall ist dann
e−λ λ m
f (m, λ ) =
m!
Poisson Verteilung
g
(e = Eulersche Zahl; 2.718)
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
g
Poisson Verteilung
Bernoulli
Experimente
e−λ λ m
f (m, λ ) =
m!
Binomialvert.
λ wird
i d auch
h als
l Intensitätsparameter
I t
ität
t der
d PoissonP i
Poisson Vert.
Verteilung bezeichnet
Anders als die Binomialverteilung ist die PoissonPoisson
Verteilung unendlich abzählbar.
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
g
Poisson Verteilung als Approximation der Binomialvert.
Bernoulli
Experimente
Wenn n groß ist und p klein,
klein ist die Bestimmung von
Wahrscheinlichkeiten aus der Binomialverteilung
mathematisch aufwändig.
Binomialvert.
Die Poisson-Verteilung approximiert die
Binomialverteilung für seltene Ereignisse sehr gut
Poisson Vert.
Dabei wird angenommen, dass λ = n·p
e − n⋅ p ( n ⋅ p ) m ⎛ n ⎞ m
f (m, n ⋅ p ) =
≈ ⎜ ⎟ p (1 − p ) n − m = f (m, n, p )
m!
⎝m⎠
Poisson
Binomial
Statistik &
Methodenlehre
e ode e e
Definition
Diskrete Verteilungen
Stetige Verteilungen
Diskrete Wk-Verteilungen
g
Poisson Verteilung als Approximation der Binomialvert.
Bernoulli
Experimente
Die Poisson Verteilung wird wegen ihrer Nähe zur
Binomialverteilung mit kleinem p auch häufig als
Verteilung für seltene Ereignisse bezeichnet.
bezeichnet
Binomialvert.
Poisson Vert.
Hier ist streng zu unterscheiden zwischen einer kleinen
Wahrscheinlichkeit p und einer theoretisch beliebig
großen Anzahl der seltenen Ereignisse n·p.
Die Güte der Approximation bezieht sich auf den
relativen Approximationsfehler, d.h. den Quotienten
aus der Binomial-Wk und der Poisson-Wk
Statistik &
Methodenlehre
e ode e e
Relevante Excel Funktionen
Diskrete Wahrscheinlichkeitsverteilungen
• BINOMVERT()
• POISSON()
oder EXP() und POTENZ() bzw.
bzw ^ ((„hoch
hoch“))
• SUMME()
Herunterladen