Wahrscheinlichkeitsrechnung und Statistik

Werbung
Wahrscheinlichkeitsrechnung und Statistik
9. Vorlesung
Wahrscheinlichkeitsrechnung und Statistik
Monte Carlo Methode für numerische Integration
Z
Sei g : [0, 1] → R stetige Funktion; man möchte
1
g (t)dt
0
numerisch approximieren mit Hilfe von Zufallszahlen:
Sei (Un )n eine Folge von unabhängigen ZG mit Un ∼ U[0, 1]. Sei
Xn = g (Un ).
(Xn )n erfüllt das SGGZ! (siehe Satz 19), d.h.
n
1 X
f .s.
Xk − E (Xk ) −→ 0.
n
k=1
Z 1
Es gilt E (Xk ) =
g (t)dt ∀k ∈ N
0
Z 1
1
f .s.
g (t)dt
⇒ (X1 + · · · + Xn ) −→
n
0
in der Praxis:
Z 1
1
g (t)dt ≈ (g (U1 ) + · · · + g (Un )) für n hinreichend groß
n
0
Wahrscheinlichkeitsrechnung und Statistik
Monte Carlo Methode für numerische Integration
Sei g : [a, b] → R integrierbare Funktion mit 0 ≤ g (t) ≤ M für alle
Z b
t ∈ [a, b]; man möchte
g (t)dt numerisch approximieren mit Hilfe von
a
Zufallszahlen:
Seien Xk , Yk unabhängige ZG mit Xk ∼ U[a, b], Yk ∼ U[0, M] ∀k = 1, n.
Sei Nn = #{k ∈ {1, ..., n} : Yk ≤ g (Xk )}
Z b
g (t)dt = Flächeninhalt unter der Funktion g
a
P( zufälliger Punkt unter der Funktion g ) ≈
Nn
n
Z b
Fl. unter der Funktion g
1
=
g (t)dt
Fl. vom Rechteck [a, b] × [0, M]
(b − a)M a
Z b
#{k ∈ {1, ..., n} : Yk ≤ g (Xk )}
⇒
g (t)dt ≈
· (b − a)M
n
a
für n hinreichend groß
Wahrscheinlichkeitsrechnung und Statistik
Statistik
Statistik = wissenschaftliche Disziplin, deren Gegenstand die
Entwicklung und Anwendung formaler Methoden zur Gewinnung,
Beschreibung und Analyse und Beurteilung von Daten
(Beobachtungen) ist.
Aufgaben und Ziele der Statistik
Design von Experimenten:
Wie sollen die Daten gewonnen werden?
Beschreibende (deskriptive) Statistik:
Wie sollen große Datensätze beschrieben werden, um die
Gesetzmäßigkeiten und Strukturen in ihnen entdecken zu können?
Schließende Statistik:
Welche Schlußfolgerungen kann man aus den Daten ziehen?
Wahrscheinlichkeitsrechnung und Statistik
Arbeitsweise in der Statistik
Datenerhebung (Beobachtung, Befragung, Experiment)
Visualisierung und beschreibende Datenanalyse: graphische
Präsentation, Zusammenfassung (Darstellung der Daten in einer
Tabelle oder Darstellung mit Hilfe von Grafiken)
Explorative Datenanalyse (man sucht nach Gesetzmäßigkeiten in
den Daten)
Modellierung der Daten
Modellanpassung (Schätzung von Modellparametern)
Modellvalidierung (Wie gut war die Modellanpassung?)
Wahrscheinlichkeitsrechnung und Statistik
Anwendung der Statistik:
in politischen Umfragen: z.B. Befragung zur Beliebtheit von
Politikern oder einer Partei
in der Analyse von Finanzmarktdaten: z.B. Analyse von Aktien-,
Zinskursen
in klinischen und epidemiologischen Studien (Medizin und
Pharmazie)
in der Technik: z.B. die Lebensdaueranalyse oder die
Zuverlässigkeit von elektronischen Systemen
in der Wirtschaft: z.B. Data Mining und Data Warehousing sind
zwei Bereiche, in denen man versucht mit Hilfe von statistischen
Methoden aus einer Vielzahl von Kundendaten jene herauszufiltern
und aufzubereiten, die für den Erfolg des Betriebs von Interesse
sind
Wahrscheinlichkeitsrechnung und Statistik
Grundbegriffe der Statistik
statistische Einheiten = Objekte an denen interessierende
Größen erfaßt werden
z.B. Bevölkerung einer Stadt; Schüler einer bestimmten Schule;
Patienten einer Klinik
Grundgesamtheit (Population) = Menge aller statistischen
Einheiten über die man Aussagen erhalten will
z.B. wahlberechtigte Bevölkerung einer Stadt; Schüler der 10.
Klasser einer bestimmten Schule; Patienten einer bestimmten
Station einer Klinik
statistisches Merkmal = Eigenschaft einer statistischen Einheit
für die man sich bei einer statistischen Untersuchung interessiert
z.B. Alter; Geschlecht; Wert BMW Aktie 24.11.2016, 17 Uhr;
Merkmalsausprägung = konkreter Wert des Merkmals
z.B. 25 Jahre; weiblich; 82.5 Euro
Stichprobe = tatsächlich untersuchte Teilmenge der
Grundgesamtheit
Wahrscheinlichkeitsrechnung und Statistik
Grundbegriffe der Statistik
Ein Merkmal einer Grundgesamtheit ist eine Zufallsgröße X . Ziel
der Statistik ist das Gesetz (die Verteilung) von X zu finden (zu
schätzen), anhand der statistischen Daten.
Die Verteilung von X kann
1) vollständig spezifiziert sein
z.B. X ∼ Exp(3), X ∼ Bin(10, 0.3), X ∼ N(0, 1)
2) spezifiziert sein, aber von einem oder mehreren unbekannten
Parametern abhängen
z.B. X ∼ Exp(λ), X ∼ Bin(10, p), X ∼ N(0, σ 2 )
3) unbekannt sein, X ∼???
in den Fällen 2) und 3) werden der unbekannte Parameter oder
die unbekannte Verteilung
,→ geschätzt → Schätztheorie
,→ getestet → Testen von statistischen Hypothesen
Wahrscheinlichkeitsrechnung und Statistik
Schätztheorie
Sei X die zufällige Variable, welche das untersuchte statistische
Merkmal darstellt. Seien x1 , . . . , xn statistische Daten
(Beobachtungen, Stichprobenwerte) für das Merkmal X , die
anhand einer Stichprobe erhalten wurden.
Die Daten x1 , . . . , xn können als Werte (Realisierungen) von n
zufälligen Variablen X1 , . . . , Xn betrachtet werden; X1 , . . . , Xn
heißen Stichprobenvariablen und sind unabhängige zufällige
Variablen mit derselben Verteilung wie X .
Seien X1 , . . . , Xn Stichprobenvariablen und g : Rn → R, so dass
g (X1 , . . . , Xn ) eine ZG ist.
g (X1 , . . . , Xn ) heißt Schätzfunktion (ist eine ZG)
g (x1 , . . . , xn ) heißt Schätzwert (ist ein Wert)
Wahrscheinlichkeitsrechnung und Statistik
Beispiele von Schätzfunktionen
I Stichprobenmittel (empirischer Mittelwert)
1
(X1 + · · · + Xn )
n
X̄n = g (X1 , . . . , Xn ) =
I Wert des Stichprobenmittels
1
(x1 + · · · + xn )
n
x̄n = g (x1 , . . . , xn ) =
I Stichprobenvarianz (empirische Varianz)
n
S̃n2
1 X
=
(Xk − X̄n )2
n−1
k=1
I Wert der Stichprobenvarianz
n
s̃n2 =
1 X
(xk − x̄n )2
n−1
k=1
Wahrscheinlichkeitsrechnung und Statistik
Beispiele von Schätzfunktionen
I empirische Standardabweichung
n
S̃n =
1 X
(Xk − X̄n )2
n−1
!1
2
k=1
I Wert der empirischen Standardabweichung
n
s̃n =
1 X
(xk − x̄n )2
n−1
!1
2
k=1
I empirische Verteilungsfunktion F̂n : R × Ω → R
#{i ∈ {1, ..., n} : Xi ≤ x}
,x ∈ R
n
I Wert der empirischen Verteilungsfunktion
F̂n (x) =
F̂n (x) =
#{i ∈ {1, ..., n} : xi ≤ x}
,x ∈ R
n
Wahrscheinlichkeitsrechnung und Statistik
Herunterladen