Emmerich Kneringer "The central limit theorem" Der Zentrale Grenzwertsatz Bsp: Vielfachstreuung SS 2005 - 704031 Einzelstreuverteilung home page: physik.uibk.ac.at/statistik Gesamtstreuwinkelverteilung 11. Vorlesung 31. Mai 2004 Interessantes zu Origin z Fit einer Fläche an 2-d Daten ¾ z.B. 2-d Gaussverteilung geht mit χ2 Methode, aber nicht in Origin! G ( x, y ) = z 2πσ 2 e x2 + y2 2σ 2 Abhängigkeit von Fit-Parametern (in Origin)? ¾ 2 1 − siehe die nächsten 2 Folien Definition Definitionder derAbhängigkeit Abhängigkeit eines Parameters eines Parametersvon vonallen allen anderen (in Origin): anderen (in Origin): 1− 1 Cii (C −1 ) ii Abhängigkeit der Fit-Parameter z Für Fits mit 2 Parametern gilt: ¾ Abhängigkeit = (Korrelationskoeffizient)2 cov( x, y ) 1 2 = 1− =r = −1 σσ Cii (C ) ii x y 2 r ... Korrelationskoeffizient (der Parameter, nicht der Daten) C ... Kovarianzmatrix z Es gilt: (X,Y) unabhängig → cov(X,Y) = 0 ¾ aber nicht umgekehrt! 3 Bsp. Daten symmetrisch um y-Achse (nächste Folie) cov( X , Y ) = ( X − 〈 X 〉 )(Y − 〈Y 〉 ) cov(x,y) = 0 → / x,y unabhängig 2-d plot der beiden Zufallsvariablen x und y: Die Kovarianz cov(x,y) ist aufgrund der speziellen Symmetrie der Punkte gleich 0, trotzdem kann man leicht eine Abhängigkeit erkennen (Parabel). 4 Beachte: die Beiträge der jeweils zwei gleichfarbigen Punkte heben sich auf! 1 0 ≤ Abhängigkeit = 1 − −1 Cii (C ) ii Speziell Speziellfür füreine eineFit Fitmit mit22Parametern: Parametern: 5 ≤1 Beispiel BeispielMyonlebensdauer Myonlebensdauer Überparametrisierung ¾ Als Modellfunktion (wieviele freie Parameter?) eignet sich bei der Lebensdauermessung: f ( x ) = y0 + Ae ¾ ¾ , x > x0 Der konstante Untergrund y0 berücksichtigt die Myonen, die im Detektor nicht zerfallen. Durch die Totzeit der Detektorelektronik wird das Histogramm bei kleinen Zeiten verfälscht und für die Auswertung muß dieser Teil (bis x0) weggelassen werden. Abhängigkeit eines Parameters: 6 − ( x − x0 ) / τ Ein Wert nahe an 1 bedeutet eine starke Abhängigkeit und deswegen eine Überparametrisierung. Origin 7 Durch DurchKoordinatentrafos Koordinatentrafoskann kann man man'unabhängige 'unabhängigeParameter' Parameter' finden, finden,deren derenInterpretation Interpretationist ist meist aber nicht so intuitiv! meist aber nicht so intuitiv! x → x‘ = x – C A → A‘ = A+BC A ... Wert von y bei x = 0 A‘ = ? [Wert von y bei x = C] Abhängig oder nicht ??? z y = A + B·x ¾ 8 y = A + B(x‘ + C) = A+BC + B·x‘ = A‘ + B·x‘ Kovarianz Kovarianzvon vonAAund undBB aufgrund aufgrundder derSymmetrie Symmetrie gleich 0! gleich 0! Achtung: x und y sind sehr wohl korreliert, nicht jedoch A und B in der rechten Grafik! Die DieSumme Summeeiner einergrossen grossenZahl Zahlvon von unabhängigen, unabhängigen,beliebig beliebigverteilten verteilten Zufallsvariablen ist Gauss-verteilt. Zufallsvariablen ist Gauss-verteilt. Der Zentrale Grenzwertsatz z 9 http://physik.uibk.ac.at/statistik/Grenzwertsatz/ aus einer engl. Vorlesung: 10 http://physik.uibk.ac.at/streuung/vielfach/ Anwendungsbsp. Mehrfachstreuung 11 Zentraler ZentralerGrenzwertsatz Grenzwertsatzanwendbar anwendbarfalls fallsdie die Einzelverteilungen keine grossen Ausläufer Einzelverteilungen keine grossen Ausläuferhaben, haben, wie hier der Fall. Gegenbeispiel: Laudau-Verteilung. wie hier der Fall. Gegenbeispiel: Laudau-Verteilung. Anwendungsbsp. Mehrfachstreuung 12 NN==10000 10000Streuvorgänge Streuvorgänge Demonstration des Zusammenhangs σMehrfachstreuung = √N ⋅ σEinzelstreuung Modell Gleich-Verteilung Gauss-Verteilung Dreieck /\ Dreieck \/ 1/x (Pol bei 0) 1/x (Pol bei max) Einzelstreuung Mehrfachstreuung Quotient θ-max RMSE Θ-MAX RMSM σM/σE 0.025 0.030 0.025 -“-“-“- 0.01443 0.00827 0.01021 0.01768 0.01118 0.01826 5 3 4 7 4 7 1.461 0.818 1.044 1.751 1.096 1.853 101.25 98.91 102.25 99.04 98.03 101.48 alle Winkel in Grad 13 ≈ 100 für alle Verteilungen! Übungsaufgabe: Übungsaufgabe: Bsp. Bsp.22mit mitOrigin: Origin: Qualität eines Qualität einesGauss-Fit? Gauss-Fit? 2 spezielle Beispiele z Verteilung ±1: 1-dimensionaler 'Random Walk' ¾ Streuung der Verteilung des Abstandes vom Ursprung nach N Schritten: z σ = √N (Beweis: nächste Folie) Erzeugung von 'normal Gauss-verteilten Zufallszahlen' ¾ mittels Summation über 12 unabhängige Zufallszahlen X einer Gleichverteilung in (0,1) a) b) c) X X+X X+X+X … ¾ Warum 12? Varianz[X] = 1/12 → Varianz[Σ12 X] = 1 14 1 σ = ∫ (x − 0.5) = ( x − 0.5) 2 0 2 1 3 31 0 = 13 ( 18 + 18 ) = 121 Random Walk in 1-er Dimension 10 Schritte z Schritt vorwärts: P(+1) = 0.5 oder rückwärts: P (–1) = 0.5 ¾ ¾ 15 Mittlere Mittlerequadratische quadratischeAbweichung Abweichung trivialerweise gleich 1. trivialerweise gleich 1. Einzelschritt: σ2 = Σi (xi – 0)2 P(xi) = 0.5 + 0.5 =1 N Schritte: σ2 = N, da Schritte unabhängig → Gaussverteilung Random Walk in 2 Dimensionen z Abstand von 0 in x und y Gauss-verteilt ¾ ¾ z 16 Gesamtabstand = Wurzel(x2 + y2) ≠ Summe entspricht Maxwell'scher Geschwindigkeitsverteilung (2-d) Simulation der Brown'schen Bewegung nach 10 Kollisionen nach 100 Kollisionen nach 1000 Kollisionen Die DieSumme Summeeiner einergrossen grossenZahl Zahlvon von unabhängigen, unabhängigen,beliebig beliebigverteilten verteilten Zufallsvariablen ist Gauss-verteilt. Zufallsvariablen ist Gauss-verteilt. Abschliessende Bemerkungen z Zentraler Grenzwertsatz ¾ Anwendung Mittelwert m (Gauss-verteilt!) und sein Fehler σm – – ¾ Der DerMittelwert Mittelwertististeine einewichtiges wichtigesBeispiel Beispielfür für die Anwendung des zentralen Grenzwertsatzes. die Anwendung des zentralen Grenzwertsatzes. ist Spezialfall: alle Zufallsvariablen gleich Wiederholung: Interpretation des Fehlers 9 1σ(m), 2σ, 3σ (s. nächste Folie) Bspiele: 1. m Software, die von einem Histogramm Anzahl der Einträge – Mittelwert und – Streuung σ (Root Mean Square) ausgibt → Fehler des Mittelwertes leicht angebbar 9 im Beispiel: 41.35/√2000 ≈ 1 – 2. 17 σ N Origin: Test des Mittelwertes einer Gleichverteilung – 3. σm = interaktiv vorgeführt (N=10000 → Fehler = 1/√12 · 1/100 ≈ 0.003) Myonlebensdauer: Poissonverteilung mit Mittelwert ≈ 10 – Fehler des Mittelwertes = √ 10/√2500 ≈ 3/50 = 0.06 Energie Die DieInterpretation Interpretationvon vonσσim imSinne Sinneder derunten untenangegebenen angegebenen Wahrscheinlichkeiten setzt eine Gauss-Verteilung Wahrscheinlichkeiten setzt eine Gauss-Verteilungvoraus. voraus. Interpretation von 1 σ, 2 σ, 3 σ σ=1 68% m Zum ZumVergleich: Vergleich: Die Standardabweichung Die Standardabweichungσσeiner einerGleichverteilung Gleichverteilunginin[–½, [–½,½] ½]ist ist1/√12 1/√12≈≈0.289. 0.289. Daher Daherist istdie dieWahrscheinlichkeit WahrscheinlichkeitP[–σ, P[–σ,σσ] ]==0.577, 0.577, und und P[–2σ, P[–2σ,2σ 2σ] ]==1.1. 18 Beachte: bei komplizierteren Grenzen muss man folgendermassen vorgehen: