Statistics, Data Analysis, and Simulation SS 2013

Werbung
Statistics, Data Analysis, and Simulation
SS 2013
08.128.730 Statistik, Datenanalyse und Simulation
Dr. Michael O. Distler
<[email protected]>
Mainz, 16. Juli 2013
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
Ziel der Vorlesung
Vermittlung von Grundkenntnissen
der Statistik, Simulationstechnik und numerischen
Methoden (Algorithmen)
Aufgabe: Bestimmung sinnvoller und signifikanter
Informationen aus/über experimentellen Daten
sowie effiziente Datenanalyse
Anwendung dieser Kenntnisse in der Datenauswertung
Wahrscheinlichkeit von Ereignissen
Unsicherheiten einer Meßgröße
Signifikanz einer Messung (Entdeckung)
Entscheidung über (Testen von) Modellhypothesen
Bestimmung (Schätzung) bester Werte von Parametern
Simulation komplizierter Prozesse
Entfaltung, Faktorenanalyse, Mustererkennung, . . .
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
Inhaltübersicht
Einleitende Bemerkungen
Statistik:
Wahrscheinlichkeit, Verteilungen, spezielle diskrete
Verteilungen, spezielle Wahrscheinlichkeitsdichten, Theoreme,
Stichproben, Mehrdimensionale Verteilungen
Monte Carlo-Methoden:
Zufallszahlengeneratoren, Monte Carlo-Integration
Schätzung von Parametern:
Maximum-Likelihood-Methode, Fehler der Parameter
Methode der kleinsten Quadrate:
Lineare kleinste Quadrate, Lösungseigenschaften, der Fall
unterschiedlicher Fehler
Prüfung von Hypothesen
Weiterführende Themen:
Entfaltung, Faktorenanalyse, Mustererkennung, . . .
Einführung in die Bayes-Statistik
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
Literatur
V. Blobel, E. Lohrmann: Statistische und numerische
Methoden der Datenanalyse, Teubner Verlag (1998)
S. Brandt: Datenanalyse, BI Wissenschaftsverlag (1999)
Philip R. Bevington: Data Reduction and Error Analysis for
the Physical Sciences, McGraw-Hill (1969)
R.J. Barlow: Statistics, John Wiley & Sons (1993)
G. Cowan: Statistical Data Analysis, Oxford University
Press (1998)
W.T. Eadie et al.: Statistical Methods in Experimental
Physics, North Holland Publishing Company
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
1. Statistik
Wahrscheinlichkeit, Wahrscheinlichkeitsdichte, -verteilung
Erwartungswerte und Momente
Verteilungen
spezielle diskrete Verteilungen:
Binomialverteilung, Poisson-Verteilung
spezielle Wahrscheinlichkeitsdichten:
Gleichverteilung, Normalverteilung, Cauchy-Verteilung
Theoreme
Stichproben
Mehrdimensionale Verteilungen
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
Das Gesetz der großen Zahl
Angenommen, dass in n statistisch unabhängigen
Experimenten das Ereignis j insgesamt nj mal aufgetreten ist.
Die Zahlen nj folgen einer Binomialverteilung, und das
Verhältnis hj = nj /n ist die entsprechende Zufallsvariable. Der
Erwartungswert E[hj ] ist die Wahrscheinlichkeit pj für das
Ereignis j:
pj = E[hj ] = E[nj /n]
Für die Varianz gilt dann (Binomialverteilung!):
V [hj ] = σ 2 (hj ) = σ 2 (nj /n) =
1
1
· σ 2 (nj ) = 2 · npj (1 − pj )
2
n
n
Da das Produkt pj (1 − pj ) immer ≤
1
4
ist, gilt die Ungleichung
σ 2 (hj ) < 1/n
bekannt als das Gesetz der großen Zahl:
Der Fehler der Schätzung hj für pj kann beliebig klein gemacht
werden, indem man n groß genug wählt.
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
Der Zentrale Grenzwertsatz
Der zentrale Grenzwertsatz (ZGS) ist der wichtigste Satz in der
Statistik. Unter anderem erklärt er die zentrale Bedeutung der
Gauß-Verteilung.
P
Die Wahrscheinlichkeitsdichte der Summe w = ni=1 xi einer
Stichprobe aus n unabhängigen Zufallsvariablen xi mit einer
beliebigen Wahrscheinlichkeitsdichte mit Mittelwert hxi und
Varianz σ 2 geht in der Grenze n → ∞ gegen eine
Gauß-Wahrscheinlichkeitsdichte mit Mittelwert hwi = nhxi und
Varianz V [w] = nσ 2 .
Dr. Michael O. Distler <[email protected]>
Statistics, Data Analysis, and Simulation SS 2013
Herunterladen