Statistik und Datenanalyse

Werbung
Emmerich Kneringer
Für
Fürden
denBeweis
Beweisdes
des
zentralen
Grenzwertsatzes!
zentralen Grenzwertsatzes!
Die charakteristische Funktion
∞
ϕ (k ) = ∫ exp(ikx) f ( x) dx
−∞
SS 2004 - 704031
home page:
physik.uibk.ac.at/statistik
"Fouriertransformierte der p.d.f."
10. Vorlesung
24. Mai 2004
Die
DieSumme
Summeeiner
einergrossen
grossenZahl
Zahlvon
von
unabhängigen,
unabhängigen,beliebig
beliebigverteilten
verteilten
Zufallsvariablen
ist
Gauss-verteilt.
Zufallsvariablen ist Gauss-verteilt.
Bemerkungen zur letzten Stunde
z
Zentraler Grenzwertsatz
¾
Anwendung
ƒ
Mittelwert m (Gauss-verteilt!) und sein Fehler σm
–
–
¾
Der
DerMittelwert
Mittelwertististeine
einewichtiges
wichtigesBeispiel
Beispielfür
für
die
Anwendung
des
zentralen
Grenzwertsatzes.
die Anwendung des zentralen Grenzwertsatzes.
ist Spezialfall: alle Zufallsvariablen gleich
Wiederholung: Interpretation des Fehlers
9 1σ(m), 2σ, 3σ (s. nächste Folie)
Bsp. 1:
ƒ
m
Software, die von einem Histogramm
Anzahl der Einträge
– Mittelwert und
– Streuung σ (Root Mean Square) ausgibt
→ Fehler des Mittelwertes leicht angebbar
9 im Beispiel: 41.35/√2000 ≈ 1
–
¾
Bsp. 2:
ƒ
2
σm =
σ
N
Origin: Test des Mittelwertes einer Gleichverteilung
–
interaktiv vorgeführt (N=10000 → Fehler = 1/√12 · 1/100 ≈ 0.003)
Energie
Die
DieInterpretation
Interpretationvon
vonσσim
imSinne
Sinneder
derunten
untenangegebenen
angegebenen
Wahrscheinlichkeiten
setzt
eine
Gauss-Verteilung
Wahrscheinlichkeiten setzt eine Gauss-Verteilungvoraus.
voraus.
Interpretation von 1 σ, 2 σ, 3 σ
σ=1
68%
m
Zum
ZumVergleich:
Vergleich:
Die
Standardabweichung
Die Standardabweichungσσeiner
einerGleichverteilung
Gleichverteilunginin[–½,
[–½,½]
½]ist
ist1/√12
1/√12≈≈0.289.
0.289.
3
Daher
Daherist
istdie
dieWahrscheinlichkeit
WahrscheinlichkeitP[–σ,
P[–σ,σσ] ]==0.577,
0.577, und
und P[–2σ,
P[–2σ,2σ
2σ] ]==1.1.
∞
ϕ (k ) = ∫ exp(ikx) f ( x) dx
−∞
Die charakteristische Funktion ϕ(t)
z
ist definiert als Erwartungswert E[exp(itX)]
¾
mit X = reale Zufallsvariable
ƒ
¾
vergleiche: komplexe Zufallsvariable: Z = X + iY
ϕ(k) = ∫ exp(ikx)f(x) dx
ƒ
{bzw. Σi exp(ikxi)P(xi)}
die Fouriertransformierte der Dichtefunktion
mit all ihren Eigenschaften:
Bestimmte
BestimmteRechnungen
Rechnungensind
sind
im
Fourierraum
einfacher.
im Fourierraum einfacher.
umkehrbar: f(x) = 1/2π ⋅ ∫ exp(-ikx) ϕ(k) dt
– Ableitungen: ϕ(n)(0) = inλn , mit λn := E[Xn] = n-tes Moment
– Summe: W = X + Y (X,Y unabhängig)
–
4
Wie ist die Summe von zwei unabh. Zufallsvariablen verteilt?
ϕW(t) = E[exp(ikX+ikY)] = E[exp(ikX)·exp(ikY)]
= E[exp(ikX)] · E[exp(ikY)] = ϕX(k)ϕY(k)
ϕX+Y(k) = ϕX(k)ϕY(k)
Tabelle Charakteristischer Funktionen
Verteilung
p.d.f.
ϕ(k)
α = –½
β=½
sin k2
k
2
5
Anwendungen der
charakteristischen Funktion
z
Berechnung höherer Momente von p.d.f.'s
¾
Beispiel aus der VO über die χ2 -Verteilung:
ƒ
Y Gauss-verteilt mit Mittelwert 0:
wir hatten λ4 := E[Y4] = 3σ4
–
z
Grenzübergänge von Verteilungen, z.B.
¾
¾
z
6
bitte Nachrechnen mit ϕ(k) = exp(–½σ2k2) und λ4 = ϕ(4)(0)
Binomial → Poisson (siehe nächste Folie)
Poisson → Gauss
Summe von Zufallsvariablen
¾
von zweien oder bliebig vielen (Thema der Vorlesung)
Binomial → Poisson
7
Dies
Diesist
istder
dereigentliche
eigentlicheGrund,
Grund,weshalb
weshalb
inindieser
dieserVorlesung
Vorlesungdie
diecharakteristische
charakteristische
Funktion
Funktionvorgestellt
vorgestelltwird.
wird.
Beweisskizze des
zentralen Grenzwertsatzes
Variable: k → t
Sind die Xi unabhängige Zufallsvariable mit Mittelwert a und Varianz b2,
so ist die Variable
normalverteilt mit
8
Umschreiben
Umschreibenauf
aufspeziell
speziell
normierte
Zufallsvariablen
normierte Zufallsvariablen
Beweisskizze des
zentralen Grenzwertsatzes (2)
9
verwende eine Def.
der Exponentialfuktion:
(
lim 1 + x n + O(n − 2 )
n →∞
Beweisskizze des
zentralen Grenzwertsatzes (3)
10
σ2(cX) = c2 σ2(X)
)
n
= ex
Wie
Wieist
istdie
dieSumme
Summevon
vonzwei
zwei
unabhängigen
unabhängigenZufallsvariablen
Zufallsvariablen
(aus
der
gleichen
(aus der gleichenp.d.f.)
p.d.f.) verteilt?
verteilt?
Übungsaufgabe (Lösung auf den nächsten Seiten)
bekannte Verteilungen: 1. Poisson
2. Gauss
3. Gleichverteilung
4. Exponential
neu in dieser VO: 5. Chi-Quadrat
Frage: Verteilung der Summe von 2 Zufallsvariablen?
'+'
11
=?
1 (diskrete
Zufallsvariablen)
2
1. Poisson-Verteilung
z
k!
e −λ
Antwort
Antwortzu
zu1:1:jaja
Addition zweier Poisson-verteilter Variablen unter
Benutzung der charakteristischen Funktion
1
12
f (k ) =
λk
2
ϕ (k ) = exp(iµk − 12 σ 2 k 2 )
2. Gauss-Verteilung
Antwort
Antwortzu
zu2:2:jaja
page 4
13
2
k
ϕ (k ) = sin( )
k
2
3. Summe von 2 (bzw. 3)
gleichverteilten Zufallszahlen
z
Erzeugung von 'normal Gauss-verteilten Zufallszahlen'
¾
mittels Summation über 12 unabhängige Zufallszahlen X einer
Gleichverteilung in (0,1)
X
b) X + X
c) X + X + X
…
a)
14
Antwort
Antwortzu
zu3:3:nein
nein
ϕ2 =
4
2 k
sin
( )
2
2
k
Fourierspektrum
eines Dreieckspulses
ϕ (k ) = (1 − ikτ )−1
4. Exponential-Verteilung
ϕτ (k ) ⋅ ϕτ (k ) =
1
z
15
2
Antwort
Antwortzu
zu4:4:nein
nein
1
1
1
⋅
≠
1 − ikτ 1 1 − ikτ 2 1 − ik f (τ 1 ,τ 2 )
Die Summe von zwei exponentialverteilten
Zufallsvariablen ist NICHT wieder exponentialverteilt.
ϕ (k ) = (1 − 2ik )− n / 2
5. χ2-Verteilung
ϕχ
Antwort
Antwortzu
zu5:5:jaja
(k ) = ϕ χ 2 (k )ϕ χ 2 (k ) = (1 − 2ik )
2
+χ 2
−n / 2
n
m
n
m
(1 − 2ik )− m / 2
= (1 − 2ik )
−( n+m) / 2
= ϕ χ 2 (k )
n+m
z
Die Summe von zwei χ2-verteilten
Zufallsvariablen ist wieder χ2-verteilt.
¾
Dies ist klar, da χ2 eine Summe von Zufallsvariablen
(aus derselben Verteilung) ist:
ƒ
16
χ2n + χ2m = χ2n+m
Herunterladen