Fortsetzung der Einführung in die Statistik

Werbung
Ergänzungskurs für Physiker
zum Grundkurs Physik I
Dr. Michael O. Distler
[email protected]
http://wwwa1.kph.uni-mainz.de/users/distler/ex1kurs/
Handout 2
1.A
Statistik
1.A.4
Spezielle diskrete Verteilungen (Fortsetzung)
Binomialverteilung: Sei p die Wahrscheinlichkeit für das Eintreten des Ereignisses
bei einem Versuch - wie groÿ ist die Wahrscheinlichkeit, dass das Ereignis bei n
Versuchen r-mal eintritt?
n r
P (r) =
p · (1 − p)n−r
r
P (r)
ist korrekt auf 1 normiert. Der Mittelwert von
hri = E[r] =
n
X
r
ist:
rP (r) = np
r=0
Die Varianz
σ2
ist
2
V [r] = E[(r − hri) ] =
n
X
(r − hri)2 P (r) = np(1 − p)
r=0
Die Poisson-Verteilung gibt die Wahrscheinlichkeit an, genau
r
Ereignisse zu er-
n der Versuche sehr groÿ und die Wahrscheinlichkeit für das
p in einem einzigen Versuch sehr klein ist, mit einem
endlichen Mittelwert hri = µ = np. Die Poisson-Verteilung kann als Grenzwert der
halten, wenn die Zahl
Auftreten eines Ereignisses
Binomialverteilung abgeleitet werden und hat nur einen Parameter, nämlich den
Mittelwert
µ.
Die Poisson-Verteilung ist gegeben durch:
P (r) =
1
µr e−µ
r!
0.6
0.6
0.5
0.5
0.4
µ = 0.5
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
µ=1
0
0
2
4
6
8
10
0
0.35
2
4
6
8
0.35
0.3
0.3
0.25
0.25
0.2
µ=2
0.2
0.15
0.15
0.1
0.1
0.05
0.05
0
µ=4
0
0
2
4
6
8
10
0
2
4
6
8
Abbildung 1: Poisson-Verteilung für verschiedene Mittelwerte
Ausgehend von
10
P (0) = e−µ
10
µ = 0.5, 1, 2
und
4.
können weitere Werte mit der Rekursionsformel
P (r + 1) = P (r) · µ/(r + 1)
berechnet werden.
Die Poisson-Verteilung ist korrekt auf 1 normiert.
hri = µ.
Die Varianz ergibt sich aus V [r] = np(1 − p) für die Binomialverteilung. Mit p → 0
2
wird daraus V [r] = σ = np = µ.
Der Mittelwert der Poisson-Verteilung ist
Die Poisson-Verteilung tritt in vielen Fällen auf, in denen man Dinge oder Ereignisse zählt, wie zum Beispiel die Zahl von Kernreaktionen oder von Teilchenzerfällen
oder die Zahl der gefangenen Fische in einem Angelwettbewerb.
2
0.3
0.18
0.16
0.25
0.14
0.2
0.12
0.1
0.15
0.08
0.1
0.06
0.04
0.05
0.02
0
0
0
2
4
6
8
10
12
14
0
2
4
6
8
10
12
14
n = 10 p
und p = 0.6 im Vergleich
µ = np =
6
und σ =
np(1 − p). Rechts ist die
√
µ = 6 und σ = 6 im Vergleich mit der Gauÿ-Verteilung
Abbildung 2: Binomialverteilung (links) mit
mit der Gauÿ-Verteilung mit
Poisson-Verteilung mit
zu sehen.
1.A.5
Spezielle Wahrscheinlichkeitsdichten
Gleichverteilung: Diese Wahrscheinlichkeitsdichte ist konstant zwischen den Grenzen
x=a
und
x = b:
f (x) =
1
b−a
a≤x<b
0
auÿerhalb
Mittelwert und Varianz sind:
hxi = E[x] =
Die Gleichverteilung wird oft
ist die Verteilung
U (0, 1)
a+b
2
U (a, b)
V [x] = σ 2 =
(b − a)2
12
(uniform) geschrieben. Besonders wichtig
mit den Grenzen 0 und 1, die eine Varianz
1/12
hat.
Normalverteilung (Gauÿ-Verteilung): Die wichtigste Wahrscheinlichkeitsdichte wegen ihrer groÿen Bedeutung in der Praxis.
f (x) = √
(x−µ)2
1
e− 2σ2
2πσ
µ und
der Standardabweichung σ . Die Wahrscheinlichkeitsdichte mit dem Mittelwert µ =
0 und der Varianz σ 2 = 1 heiÿt standardisierte Gauÿ-Verteilung, abgekürzt N (0, 1).
Die Normalverteilung wird von zwei Parametern bestimmt, dem Mittelwert
Die Gauÿ-Verteilung kann hergeleitet werden als Grenzfall der Binomialverteilung
für groÿe Werte von
n und r, und auf ähnliche Weise auch als Grenzfall der Poissonµ.
Verteilung für groÿe Werte von
3
Z
1
dx N (0, 1) = 0.6827 = (1 − 0.3173)
−1
Z 2
dx N (0, 1) = 0.9545 = (1 − 0.0455)
−2
Z 3
dx N (0, 1) = 0.9973 = (1 − 0.0027)
−3
Es wird oft vergessen, dass im Mittel fast 32% der Ereignisse auÿerhalb von einer
Standardabweichung liegen müssen.
FWHM: Dieser Begri ist oft nützlich, um auf einfache Weise die Standardabweichung einer Gauÿkurve zu schätzen.
FWHM
1.A.6
√
= 2σ 2ln2 = 2.355σ
Das Gesetz der groÿen Zahl
Angenommen, dass in
insgesamt
nj
statistisch unabhängigen Experimenten das Ereignis
mal aufgetreten ist. Die Zahlen
und das Verhältnis
tungswert
n
E[hj ]
hj = nj /n
nj
j
folgen einer Binomialverteilung,
ist die entsprechende Zufallsvariable. Der Erwar-
ist die Wahrscheinlichkeit
pj
für das Ereignis
j:
pj = E[hj ] = E[nj /n]
Für die Varianz gilt dann (Binomialverteilung!):
V [hj ] = σ 2 (hj ) = σ 2 (nj /n) =
Da das Produkt
pj (1 − pj )
immer
≤
1
1
· σ 2 (nj ) = 2 · npj (1 − pj )
2
n
n
1
ist, gilt die Ungleichung
4
σ 2 (hj ) < 1/n
bekannt als das
1.A.7
Gesetz der groÿen Zahl.
Der Zentrale Grenzwertsatz
Der zentrale Grenzwertsatz (ZGS) ist der wichtigste Satz in der Statistik. Unter
anderem erklärt er die zentrale Bedeutung der Gauÿ-Verteilung.
Pn
Die Wahrscheinlichkeitsdichte der Summe w =
i=1 xi einer Stichprobe aus n
unabhängigen Zufallsvariablen xi mit einer beliebigen Wahrscheinlichkeitsdichte
2
mit Mittelwert hxi und Varianz σ geht in der Grenze n → ∞ gegen eine Gauÿ2
Wahrscheinlichkeitsdichte mit Mittelwert hwi = nhxi und Varianz V [w] = nσ .
4
1.A.8
Numerische Berechnung von Stichprobenmittel und -varianz
Bekannt sind die Formeln:
n
n
1 X
s =
(xi − x̄)2 .
n − 1 i=1
1X
xi
x̄ =
n i=1
2
Die Berechnung erfordert zwei Schleifen über die Datenmenge. Sind groÿe Datenmengen zu behandeln, kann dies auch in einer Schleife erledigt werden:
s2 =
1
n−1
n
X

n
X
1
1 
x2i −
n − 1 i=1
n
(xi − x̄)2 =
i=1
n
X
!2 
xi
.
i=1
Man bildet also die Summen:
Sx =
n
X
xi
n
X
Sxx =
i=1
x2i
i=1
und berechnet Mittelwert und Varianz gemäÿ:
1
s =
n−1
1
x̄ = Sx
n
2
1 2
Sxx − Sx .
n
Hierbei können Dierenzen von groÿen Zahlen vorkommen. Dies kann wegen der
endlichen Auösung der Rechner zu numerischen Problemen führen. In diesem
Fall ist es besser, eine erste grobe Näherung
benutzen:
Tx =
n
X
(xi − xe )
xe
Txx =
i=1
und erhält
1.A.9
(etwa den ersten Messwert) zu
n
X
(xi − xe )2
i=1
1
x̄ = xe + Tx
n
1
s =
n−1
2
1 2
Txx − Tx .
n
Transformation von Wahrscheinlichkeitsdichten
Die Wahrscheinlichkeitsdichte
andere Variable
y
fx (x)
der Variablen
x
soll vermöge
y = y(x)
in eine
transformiert werden:
fx (x)
Betrachte: Intervall
y = y(x)
fy (y)
−→
(x, x + dx) → (y, y + dx)
Bedenke: die Flächen unter den Wahrscheinlichkeitsdichten in den jeweiligen Intervallen müssen gleich sein.
fx (x)dx = fy (y)dy
,→
5
dx fy (y) = fx (x(y)) dy
1.A.10
Transformation von Mittelwert und Varianz, Fehlerfortplanzung
Entwicklung um Mittelwert:
2 1
dy 2 d y
+ (x − hxi)
+ ...
y(x) = y(hxi) + (x − hxi)
dx x=hxi 2
dx2 x=hxi
Bis 2. Ordnung:
2 dy 1
2 d y
E[y] ' y(hxi) + E[x − hxi]
+ E[(x − hxi) ] 2 dx x=hxi 2
dx x=hxi
|
{z
}
=0
1 2 d2 y σ
2 x dx2 x=hxi
|
{z
}
hyi ' y(hxi) +
wird oft weggelassen
Für die Varianz nehmen wir an
wert
hxi
hyi ' y(hxi)
und entwickeln
y(x)
um den Mittel-
bis zur 1. Ordnung:
!2 
dy 
V [y] = E (y − hyi)2 = E  (x − hxi)
dx x=hxi
!2
!2
dy dy 2
· E (x − hxi) =
· σx2
=
dx x=hxi
dx x=hxi

Gesetz der Fehlerfortpanzung für eine Zufallsvariable.
6
Herunterladen