Zentraler Grenzwertsatz

Werbung
Emmerich Kneringer
"The central limit theorem"
Der Zentrale Grenzwertsatz
Bsp: Vielfachstreuung
SS 2005 - 704031
Einzelstreuverteilung
home page:
physik.uibk.ac.at/statistik
Gesamtstreuwinkelverteilung
11. Vorlesung
31. Mai 2004
Interessantes zu Origin
z
Fit einer Fläche an 2-d Daten
¾
z.B. 2-d Gaussverteilung
ƒ
geht mit χ2 Methode, aber nicht in Origin!
G ( x, y ) =
z
2πσ
2
e
x2 + y2
2σ 2
Abhängigkeit von Fit-Parametern (in Origin)?
¾
2
1
−
siehe die nächsten 2 Folien
Definition
Definitionder
derAbhängigkeit
Abhängigkeit
eines
Parameters
eines Parametersvon
vonallen
allen
anderen
(in
Origin):
anderen (in Origin):
1−
1
Cii (C −1 ) ii
Abhängigkeit der Fit-Parameter
z
Für Fits mit 2 Parametern gilt:
¾
Abhängigkeit = (Korrelationskoeffizient)2
 cov( x, y ) 
1
2

= 1−
=r =
−1
 σσ 
Cii (C ) ii
x y


2
r ... Korrelationskoeffizient (der Parameter, nicht der Daten)
C ... Kovarianzmatrix
z
Es gilt: (X,Y) unabhängig → cov(X,Y) = 0
¾
aber nicht umgekehrt!
ƒ
3
Bsp. Daten symmetrisch um y-Achse (nächste Folie)
cov( X , Y ) = ( X − ⟨ X ⟩ )(Y − ⟨Y ⟩ )
cov(x,y) = 0 →
/ x,y unabhängig
2-d plot der beiden
Zufallsvariablen x und y:
Die Kovarianz cov(x,y)
ist aufgrund der
speziellen Symmetrie
der Punkte gleich 0,
trotzdem kann man
leicht eine Abhängigkeit
erkennen (Parabel).
4
Beachte: die Beiträge der jeweils zwei
gleichfarbigen Punkte heben sich auf!
1
0 ≤ Abhängigkeit = 1 −
−1
Cii (C ) ii
Speziell
Speziellfür
füreine
eineFit
Fitmit
mit22Parametern:
Parametern:
5
≤1
Beispiel
BeispielMyonlebensdauer
Myonlebensdauer
Überparametrisierung
¾
Als Modellfunktion (wieviele freie Parameter?)
eignet sich bei der Lebensdauermessung:
f ( x ) = y0 + Ae
¾
¾
,
x > x0
Der konstante Untergrund y0 berücksichtigt die
Myonen, die im Detektor nicht zerfallen. Durch die
Totzeit der Detektorelektronik wird das Histogramm
bei kleinen Zeiten verfälscht und für die Auswertung
muß dieser Teil (bis x0) weggelassen werden.
Abhängigkeit eines Parameters:
ƒ
6
− ( x − x0 ) / τ
Ein Wert nahe an 1 bedeutet eine starke Abhängigkeit und
deswegen eine Überparametrisierung.
Origin
7
Durch
DurchKoordinatentrafos
Koordinatentrafoskann
kann
man
man'unabhängige
'unabhängigeParameter'
Parameter'
finden,
finden,deren
derenInterpretation
Interpretationist
ist
meist
aber
nicht
so
intuitiv!
meist aber nicht so intuitiv!
x → x‘ = x – C
A → A‘ = A+BC
A ... Wert von y bei x = 0
A‘ = ? [Wert von y bei x = C]
Abhängig oder nicht ???
z
y = A + B·x
¾
8
y = A + B(x‘ + C) = A+BC + B·x‘
= A‘ + B·x‘
Kovarianz
Kovarianzvon
vonAAund
undBB
aufgrund
aufgrundder
derSymmetrie
Symmetrie
gleich
0!
gleich 0!
Achtung: x und y sind sehr wohl korreliert, nicht jedoch A und B in der rechten Grafik!
Die
DieSumme
Summeeiner
einergrossen
grossenZahl
Zahlvon
von
unabhängigen,
unabhängigen,beliebig
beliebigverteilten
verteilten
Zufallsvariablen
ist
Gauss-verteilt.
Zufallsvariablen ist Gauss-verteilt.
Der Zentrale Grenzwertsatz
z
9
http://physik.uibk.ac.at/statistik/Grenzwertsatz/
aus einer engl.
Vorlesung:
10
http://physik.uibk.ac.at/streuung/vielfach/
Anwendungsbsp. Mehrfachstreuung
11
Zentraler
ZentralerGrenzwertsatz
Grenzwertsatzanwendbar
anwendbarfalls
fallsdie
die
Einzelverteilungen
keine
grossen
Ausläufer
Einzelverteilungen keine grossen Ausläuferhaben,
haben,
wie
hier
der
Fall.
Gegenbeispiel:
Laudau-Verteilung.
wie hier der Fall. Gegenbeispiel: Laudau-Verteilung.
Anwendungsbsp. Mehrfachstreuung
12
NN==10000
10000Streuvorgänge
Streuvorgänge
Demonstration des Zusammenhangs
σMehrfachstreuung = √N ⋅ σEinzelstreuung
Modell
Gleich-Verteilung
Gauss-Verteilung
Dreieck /\
Dreieck \/
1/x (Pol bei 0)
1/x (Pol bei max)
Einzelstreuung
Mehrfachstreuung Quotient
θ-max
RMSE
Θ-MAX
RMSM
σM/σE
0.025
0.030
0.025
-“-“-“-
0.01443
0.00827
0.01021
0.01768
0.01118
0.01826
5
3
4
7
4
7
1.461
0.818
1.044
1.751
1.096
1.853
101.25
98.91
102.25
99.04
98.03
101.48
alle Winkel in Grad
13
≈ 100
für alle Verteilungen!
Übungsaufgabe:
Übungsaufgabe:
Bsp.
Bsp.22mit
mitOrigin:
Origin:
Qualität
eines
Qualität einesGauss-Fit?
Gauss-Fit?
2 spezielle Beispiele
z
Verteilung ±1: 1-dimensionaler 'Random Walk'
¾
Streuung der Verteilung des Abstandes vom Ursprung nach N
Schritten:
ƒ
z
σ = √N
(Beweis: nächste Folie)
Erzeugung von 'normal Gauss-verteilten Zufallszahlen'
¾
mittels Summation über 12 unabhängige Zufallszahlen X einer
Gleichverteilung in (0,1)
a)
b)
c)
X
X+X
X+X+X
…
¾
Warum 12?
Varianz[X] = 1/12
→ Varianz[Σ12 X] = 1
ƒ
14
1
σ = ∫ (x − 0.5) = ( x − 0.5)
2
0
2
1
3
31
0
= 13 ( 18 + 18 ) = 121
Random Walk in 1-er Dimension
10 Schritte
z
Schritt vorwärts: P(+1) = 0.5
oder rückwärts: P (–1) = 0.5
¾
¾
15
Mittlere
Mittlerequadratische
quadratischeAbweichung
Abweichung
trivialerweise
gleich
1.
trivialerweise gleich 1.
Einzelschritt: σ2 = Σi (xi – 0)2 P(xi) = 0.5 + 0.5 =1
N Schritte: σ2 = N, da Schritte unabhängig
→ Gaussverteilung
Random Walk in 2 Dimensionen
z
Abstand von 0 in x und y Gauss-verteilt
¾
¾
z
16
Gesamtabstand = Wurzel(x2 + y2) ≠ Summe
entspricht Maxwell'scher Geschwindigkeitsverteilung (2-d)
Simulation der Brown'schen Bewegung
nach 10 Kollisionen
nach 100 Kollisionen
nach 1000 Kollisionen
Die
DieSumme
Summeeiner
einergrossen
grossenZahl
Zahlvon
von
unabhängigen,
unabhängigen,beliebig
beliebigverteilten
verteilten
Zufallsvariablen
ist
Gauss-verteilt.
Zufallsvariablen ist Gauss-verteilt.
Abschliessende Bemerkungen
z
Zentraler Grenzwertsatz
¾
Anwendung
ƒ
Mittelwert m (Gauss-verteilt!) und sein Fehler σm
–
–
¾
Der
DerMittelwert
Mittelwertististeine
einewichtiges
wichtigesBeispiel
Beispielfür
für
die
Anwendung
des
zentralen
Grenzwertsatzes.
die Anwendung des zentralen Grenzwertsatzes.
ist Spezialfall: alle Zufallsvariablen gleich
Wiederholung: Interpretation des Fehlers
9
1σ(m), 2σ, 3σ (s. nächste Folie)
Bspiele:
1.
m
Software, die von einem Histogramm
Anzahl der Einträge
–
Mittelwert und
–
Streuung σ (Root Mean Square) ausgibt
→ Fehler des Mittelwertes leicht angebbar
9
im Beispiel: 41.35/√2000 ≈ 1
–
2.
17
σ
N
Origin: Test des Mittelwertes einer Gleichverteilung
–
3.
σm =
interaktiv vorgeführt (N=10000 → Fehler = 1/√12 · 1/100 ≈ 0.003)
Myonlebensdauer: Poissonverteilung mit Mittelwert ≈ 10
–
Fehler des Mittelwertes = √ 10/√2500 ≈ 3/50 = 0.06
Energie
Die
DieInterpretation
Interpretationvon
vonσσim
imSinne
Sinneder
derunten
untenangegebenen
angegebenen
Wahrscheinlichkeiten
setzt
eine
Gauss-Verteilung
Wahrscheinlichkeiten setzt eine Gauss-Verteilungvoraus.
voraus.
Interpretation von 1 σ, 2 σ, 3 σ
σ=1
68%
m
Zum
ZumVergleich:
Vergleich:
Die
Standardabweichung
Die Standardabweichungσσeiner
einerGleichverteilung
Gleichverteilunginin[–½,
[–½,½]
½]ist
ist1/√12
1/√12≈≈0.289.
0.289.
Daher
Daherist
istdie
dieWahrscheinlichkeit
WahrscheinlichkeitP[–σ,
P[–σ,σσ] ]==0.577,
0.577, und
und P[–2σ,
P[–2σ,2σ
2σ] ]==1.1.
18
Beachte: bei komplizierteren Grenzen
muss man folgendermassen vorgehen:
Herunterladen