Statistics, Data Analysis, and Simulation SS 2013 08.128.730 Statistik, Datenanalyse und Simulation Dr. Michael O. Distler <[email protected]> Mainz, 16. Juli 2013 Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013 Ziel der Vorlesung Vermittlung von Grundkenntnissen der Statistik, Simulationstechnik und numerischen Methoden (Algorithmen) Aufgabe: Bestimmung sinnvoller und signifikanter Informationen aus/über experimentellen Daten sowie effiziente Datenanalyse Anwendung dieser Kenntnisse in der Datenauswertung Wahrscheinlichkeit von Ereignissen Unsicherheiten einer Meßgröße Signifikanz einer Messung (Entdeckung) Entscheidung über (Testen von) Modellhypothesen Bestimmung (Schätzung) bester Werte von Parametern Simulation komplizierter Prozesse Entfaltung, Faktorenanalyse, Mustererkennung, . . . Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013 Inhaltübersicht Einleitende Bemerkungen Statistik: Wahrscheinlichkeit, Verteilungen, spezielle diskrete Verteilungen, spezielle Wahrscheinlichkeitsdichten, Theoreme, Stichproben, Mehrdimensionale Verteilungen Monte Carlo-Methoden: Zufallszahlengeneratoren, Monte Carlo-Integration Schätzung von Parametern: Maximum-Likelihood-Methode, Fehler der Parameter Methode der kleinsten Quadrate: Lineare kleinste Quadrate, Lösungseigenschaften, der Fall unterschiedlicher Fehler Prüfung von Hypothesen Weiterführende Themen: Entfaltung, Faktorenanalyse, Mustererkennung, . . . Einführung in die Bayes-Statistik Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013 Literatur V. Blobel, E. Lohrmann: Statistische und numerische Methoden der Datenanalyse, Teubner Verlag (1998) S. Brandt: Datenanalyse, BI Wissenschaftsverlag (1999) Philip R. Bevington: Data Reduction and Error Analysis for the Physical Sciences, McGraw-Hill (1969) R.J. Barlow: Statistics, John Wiley & Sons (1993) G. Cowan: Statistical Data Analysis, Oxford University Press (1998) W.T. Eadie et al.: Statistical Methods in Experimental Physics, North Holland Publishing Company Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013 1. Statistik Wahrscheinlichkeit, Wahrscheinlichkeitsdichte, -verteilung Erwartungswerte und Momente Verteilungen spezielle diskrete Verteilungen: Binomialverteilung, Poisson-Verteilung spezielle Wahrscheinlichkeitsdichten: Gleichverteilung, Normalverteilung, Cauchy-Verteilung Theoreme Stichproben Mehrdimensionale Verteilungen Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013 Das Gesetz der großen Zahl Angenommen, dass in n statistisch unabhängigen Experimenten das Ereignis j insgesamt nj mal aufgetreten ist. Die Zahlen nj folgen einer Binomialverteilung, und das Verhältnis hj = nj /n ist die entsprechende Zufallsvariable. Der Erwartungswert E[hj ] ist die Wahrscheinlichkeit pj für das Ereignis j: pj = E[hj ] = E[nj /n] Für die Varianz gilt dann (Binomialverteilung!): V [hj ] = σ 2 (hj ) = σ 2 (nj /n) = 1 1 · σ 2 (nj ) = 2 · npj (1 − pj ) 2 n n Da das Produkt pj (1 − pj ) immer ≤ 1 4 ist, gilt die Ungleichung σ 2 (hj ) < 1/n bekannt als das Gesetz der großen Zahl: Der Fehler der Schätzung hj für pj kann beliebig klein gemacht werden, indem man n groß genug wählt. Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013 Der Zentrale Grenzwertsatz Der zentrale Grenzwertsatz (ZGS) ist der wichtigste Satz in der Statistik. Unter anderem erklärt er die zentrale Bedeutung der Gauß-Verteilung. P Die Wahrscheinlichkeitsdichte der Summe w = ni=1 xi einer Stichprobe aus n unabhängigen Zufallsvariablen xi mit einer beliebigen Wahrscheinlichkeitsdichte mit Mittelwert hxi und Varianz σ 2 geht in der Grenze n → ∞ gegen eine Gauß-Wahrscheinlichkeitsdichte mit Mittelwert hwi = nhxi und Varianz V [w] = nσ 2 . Dr. Michael O. Distler <[email protected]> Statistics, Data Analysis, and Simulation SS 2013