Woche 6: Zentraler Grenzwertsatz und Vertrauensintervalle

Werbung
Teil VIII
Woche 6: Zentraler Grenzwertsatz und
Vertrauensintervalle
Zentraler Grenzwertsatz und
Vertrauensintervalle
Patric Müller <[email protected]>
ETHZ
WBL 17/19, 29.05.2017
Wahrscheinlichkeit und Statistik
Patric Müller
WBL 2017
Lernziele
2 / 23
WBL 2017
Typische Situation
Man möchte den (unbekannten) Erwartungswert µ einer messbaren
Grösse anhand von Messungen bestimmen / schätzen.
Sie können. . .
. . . den zentralen Grenzwertsatz erläutern
. . . den Standardfehler des arithmetischen Mittels berechnen
. . . den Unterschied zwischen Standardfehler und Standardabweichung
erläutern
. . . ein approximatives Vertrauensintervall für einen Erwartungswert
berechnen
. . . eine Binomialverteilung durch eine Normalverteilung approximieren
Vorlesung basiert auf Kapitel 4.6 im Skript
Wahrscheinlichkeit und Statistik
Wahrscheinlichkeit und Statistik
3 / 23
Womöglich möchte man auch noch die Qualität der Schätzung
bewerten können.
Beispiele:
I
I
I
I
WBL 2017
Geschwindigkeit einer Internetverbindung bestimmen
Merkmal einer Bevölkerung bestimmen (Lebenserwartung,
Lohnerwartung)
Resistenzrate eines Bakteriums eines bestimmten Antibiotikums
bestimmen
...
Wahrscheinlichkeit und Statistik
4 / 23
WBL 2017
Mathematisches Modell
Das arithmetische Mittel
Wiederholte Messungen einer Zufallsgrösse könne wie folgt
mathematisch modelliert werden:
I
I
I
Das arithmetische Mittel (Stichprobenmittel) ist definiert als:
X1 , X2 , . . . , Xn sind unabhängige und identisch verteilte
Zufallsvariablen ( i.i.d.“)
”
Alternative Interpretation: X1 , X2 , . . . , Xn sind unabhängige Kopien
einer Zuvfallsvariable X .
x1 , x2 , . . . , xn sind die Realisierungen der Zufallsvariablen X1 , . . . , Xn
X =
Bemerke, dass X auch eine Zufallsvariable ist.
Aus den Rechenregeln für Erwartungswert und Varianz wissen wir
bereits:
σ2
σ
, σX = √
E(X ) = µ, Var (X ) =
n
n
Folgende theoretische Aussagen treffen zu:
I
1
(X1 + X2 + . . . Xn )
n
Alle Messungen haben denselben Erwartungswert:
E(X1 ) = . . . = E(Xn ) = µ
(Vgl. Woche 5, Slide 9 und Woche 4, Slide 21)
I
Alle Messungen haben dieselbe Varianz:
Das arithmetische Mittel aus wiederholten Messungen X ist ein
Schätzer für den Erwartungswert µ einer Zufallsvariablen!
Var (X1 ) = . . . = Var (Xn ) = σ 2
Zentrale Frage: X ist zufällig. Wie “gut” ist dann die Schätzung für µ?
WBL 2017
Mit wachsender Stichprobengrösse n wird die Varianz von X kleiner.
Definition (Standardfehler des arithmetischen Mittels)
Die Grösse sex = √sxn heisst Standardfehler des arithmetischen Mittels
(sx bezeichnet die empirische Standardabweichung der Stichprobe).
sex ist ein Schätzer für die Standardabweichung des arithmetischen
Mittels X .
Abkürzung für den Standardfehler des arithmetischen Mittels: SEM
(“standard error of the mean”)
7 / 23
WBL 2017
Beispiel: Standardfehler eines durchschnittlichen
Geburtsgewichts
Je kleiner die Varianz von X ist, desto präziser wird die Schätzung.
Wahrscheinlichkeit und Statistik
6 / 23
WBL 2017
Datensatz mit Geburtsgewichten
von 44 Neugeborenen (in g):
Mittelwert x = [3276]g
0.0015
Standardfehler des arithmetischen Mittels
Wahrscheinlichkeit und Statistik
emp. St.abw. sx = [528]g
x
Dichte
0.0005 0.0010
5 / 23
SEM sex = [80]g
sex
sx
Wenn die Stichprobengrösse n
wächst, konvergiert . . .
. . . x → E(X ),
0.0000
Wahrscheinlichkeit und Statistik
. . . sx → σ(X ),
. . . sex → 0.
2000 2500 3000 3500 4000
Gewicht [g]
Wahrscheinlichkeit und Statistik
8 / 23
WBL 2017
Der zentrale Grenzwertsatz
Der zentale Grenzwertsatz
Bis jetzt haben wir Erwartungswert und Varianz des
Stichprobenmittels X bestimmt. Wir können aber viel mehr tun und
sogar die ganze kumulative Verteilungsfunktion von X bestimmen.
Definition (standardisierte Stichprobenmittel)
Zn bezeichnet das standardisierte Stichprobenmittel
Zn =
Theorem (Zentraler Grenzwertsatz)
X sei eine Zufallsvariable mit Erwartungswert µ und Varianz σ 2 , und
X1 , . . . , Xn sind i.i.d. Kopien davon. Dann ist
Der zentrale Grenzwertsatz sagt, dass für alle reellen Zahlen z gilt
lim P(Zn ≤ z) = lim FZn (z) = Φ(z) ;
σ2
) für grosse n .
n
n→∞
Φ(z): kumulative Verteilungsfunktion von N (0, 1)
In Worten: die kumulative Verteilungsfunktion des standardisierten
Stichprobenmittels nähert sich mit wachsender Stichprobengrösse
mehr und mehr der kumulativen Verteilungsfunktion der
Standard-Normalverteilung an.
Für die mathematisch Interessierten: man nennt das schwache
”
Konvergenz“
Gleichwertige Aussage:
X −µ
√ ≈ N (0, 1) für grosse n .
σ/ n
9 / 23
WBL 2017
Simulation zum zentralen Grenzwertsatz
6
8 10
x
6
8
10
2
3
4
x
5
n = 500
n = 1000
6
3.3
3.5
3.7
3.9
abs. Häufigkeit
50 100
0
3.0
4.0
3.0
3.4
x
3.6
x
3.8
3.5
4.0
x
x
n = 5000
n = 10000
abs. Häufigkeit
100 200
4
x
0
2
4
0
0
2
abs. Häufigkeit
50
150
0
n = 100
4.5
abs. Häufigkeit
50 100
0
0.00
E[X]
n = 50
0
0.30
p(x)
0.15
Dichte
E[X]
abs. Häufigkeit
0 50
150
250
n = 10
Dichte
0
Diese Simulation wird jeweils R = 2000
mal wiederholt. Die R = 2000
berechneten Mittelwerte
(Stichprobenmittel) werden in ein
Histogramm gezeichnet.
WBL 2017
Die Verteilung des Stichprobenmittels gleicht mehr und mehr einer
Normalverteilung:
p(x)
0.15 0.30
Mittelwert X der n Messwerte
berechnen.
10 / 23
Zentraler Grenzwertsatz: Illustration
0.00
n unabhängige Messungen simulieren;
Verteilung einer Einzelmessung durch
Dichte rechts gegeben (klar nicht
normalverteilt!).
Wahrscheinlichkeit und Statistik
abs. Häufigkeit
50 100
Wahrscheinlichkeit und Statistik
n→∞
abs. Häufigkeit
50
150
X ≈ N (µ,
X −µ
√
σ/ n
3.50
3.60
x
3.70
3.55
3.60
x
3.65
Histogramme: empirische Verteilung der Stichprobenmittel für
unterschiedliches n
Wahrscheinlichkeit und Statistik
11 / 23
WBL 2017
Wahrscheinlichkeit und Statistik
12 / 23
WBL 2017
Zentraler Grenzwertsatz: Illustration
Bemerkungen zum ZGS
Die Verteilung des Stichprobenmittels gleicht mehr und mehr einer
Normalverteilung:
0
8
10
2
3
4
x
n = 1000
5
6
3
4
x
5
6
abs. Häufigkeit
50 100
3
4
x
5
6
3
4
x
5
6
3
4
x
5
Aber: Konvergenz ist nur für kumulative Verteilungsfunktion wahr,
nicht für die Dichte: unter Umständen ist X diskret und hat keine
Dichte!
6
n = 10000
0
2
2
n = 5000
0
0
2
2
abs. Häufigkeit
50 100
6
abs. Häufigkeit
100 200
4
abs. Häufigkeit
50
150
x
n = 500
Die kumulative Verteilungsfunktion des standardisierten
Stichprobenmittels nähert sich mit wachsender Stichprobengrösse
mehr und mehr der kumulativen Verteilungsfunktion der
Standard-Normalverteilung an.
n = 100
0
abs. Häufigkeit
50
150
p(x)
0.15
0.00
2
abs. Häufigkeit
50 100
0
n = 50
Der ZGS ist tatsächlich auch für wiederholte Messungen diskreter
Zufallsvariablen richtig! (Anwendung: Normalapproximation einer
Binomialverteilung)
0
0.30
E[X]
abs. Häufigkeit
0 50
150
250
n = 10
Dichte
2
3
4
x
5
6
2
3
4
x
5
6
Histogramme: empirische Verteilung der Stichprobenmittel für
unterschiedliches n
Wahrscheinlichkeit und Statistik
13 / 23
WBL 2017
Anwendungen des zentralen Grenzwertsatzes
Wahrscheinlichkeit und Statistik
14 / 23
WBL 2017
Normalapproximation einer Binomialverteilung
X ∼ Bin(n, π) sei eine binomialverteilte Zufallsvariable.
Dann ist X = Y1 + . . . + Yn , wobei Y1 , . . . Yn sind i.i.d. Kopien von
Y ∼ Bernoulli(π)
X
1
(Y1 + . . . Yn ) =
n
n
Falls n gross genug ist,
können wir den
Zentralen Grenzwertsatz auf
Y anwenden. Y ≈ N π, π(1 − π)/n .
Y =
Normalapproximation einer Binomialverteilung
(Approximative) Vertrauensintervalle für den Erwartungswert
Das heisst für X :
X ≈ N nπ, nπ(1 − π)
In Worten: Die Verteilungsfunktion einer Binomialverteilung mit
Parametern n und π nähert sich (wenn n gross genug ist) der
Normalverteilung mit Parametern µ = nπ und σ 2 = nπ(1 − π) an
Wahrscheinlichkeit und Statistik
15 / 23
WBL 2017
Wahrscheinlichkeit und Statistik
16 / 23
WBL 2017
Normalapproximation einer Binomialverteilung
Vertrauensintervalle
Faustregel: Approximation darf verwendet werden, falls nπ > 5 und
n(1 − π) > 5
Beachte: Approximation macht nur Sinn, wenn wir uns für die
kumulative Verteilungsfunktion interessieren. Die
Wahrscheinlichkeitsverteilung von X kann natürlich nicht durch eine
Dichte approximiert werden!
Modell für Messungen: X1 , X2 , . . . , Xn : i.i.d. Messungen mit
E (Xi ) = µ und Var (Xi ) = σ 2 .
Zentraler Grenzwertsatz besagt, dass
X −µ
√ ≈ N 0, 1
Z :=
σ/ n
Das heisst: Z liegt mit 95% Wahrscheinlichkeit zwischen dem 2.5%und dem 97.5%-Quantil der Standard-Normalverteilung (also
zwischen Φ−1 (0.025) = −1.96 und Φ−1 (0.975) = 1.96)
P Z ∈ [q2.5% ; q97.5% ] = P Z ∈ [−1.96; 1.96] = 0.95
Konsequenz 1:
P
Wahrscheinlichkeit und Statistik
17 / 23
WBL 2017
Vertrauensintervall für den Erwartungswert
18 / 23
WBL 2017
I heisst Vertrauensintervall für µ zum Konfidenzniveau 95%.
Definition (Vertrauensintervall für den Erwartungswert)
X ist ein Schätzer für µ (Punktschätzung).
Dank Konsequenz 2 kann man auch ein sogenanntes
“Vertrauensintervall” angeben: ein “range” in dem der wahre
(unbekannte) Parameter µ mit Wahrscheinlichkeit 0.95 liegt.
Ein Vertrauensintervall zu einem Konfidenzniveau 1 − α ist ein Intervall
I ⊂ R mit der Eigenschaft, dass P(µ ∈ I ) = 1 − α.
Problem: wahre Standardabweichung σ ist nicht bekannt.
Wir können aber Unter- und Obergrenze dieses Bereichs (des
Vertrauensintervalls!) abschätzen, indem wir σ durch die empirische
Standardabweichung sx der Stichprobe ersetzen.
Wahrscheinlichkeit und Statistik
= 0.95
Der Erwartungswert
µ liegt mit (ungefähr)
h
i 95% Wahrscheinlichkeit im
s
s
Intervall I = X − 1.96 √xn , X + 1.96 √xn .
Idee–Vertrauensintervall:
I
Wahrscheinlichkeit und Statistik
!
Vertrauensintervall für den Erwartungswert
Konsequenz 2: µ liegt mit 95% Wahrscheinlichkeit in
σ
σ
X − 1.96 √ ; X + 1.96 √
n
n
I
σ
σ
X ∈ µ − 1.96 √ ; µ − 1.96 √
n
n
19 / 23
WBL 2017
Ein Vertrauensintervall für µ zu einem beliebigen Konfidenzniveau 1 − α
ist gegeben durch
α sx
α sx
x − Φ−1 (1 − ) √ , x + Φ−1 (1 − ) √
2
2
n
n
Wahrscheinlichkeit und Statistik
20 / 23
WBL 2017
Beispiel 2 – Simulation
Simulation: R =50 mal wird eine Poisson-verteilte Stichprobe (mit
Parameter λ = 2) der Grösse n = 40 gezogen und jedesmal ein
95%-Vertrauensintervall für den Erwartungswert berechnet.
2.5
Schüler Buck hat folgende 5 Prüfungsnoten bekommen:
Pr. Nr. 1 2
3 4 5
Note
5 4.5 5.5 6 5.5
Mathematische Annahmen: Die Prüfungsnoten sind “i.i.d.” verteilt mit
unbekanntem Erwartungswert µ (“richtige Note für den Schüler”).
3.0
Beispiel 1 – Prüfungsnoten
λ
Problem: Korrekte Semesternote dem Schüler geben.
1.0
Zudem: n = 5, s = 0.57. Ein 95% Vertrauensintervall für µ ist
sx
sx
I = X − 1.96 √ , X + 1.96 √ = [4.8; 5.8]
n
n
1.5
2.0
x = 5.3 (Punktschätzer von µ).
Berechnete Vertrauensintervalle für die 50 Stichproben
Wahrscheinlichkeit und Statistik
21 / 23
WBL 2017
Bemerkungen zum Vertrauensintervall
Vertrauensintervalle hängen von den Daten ab. Sie sind deswegen
zufällig!
Wahl des Konfidenzniveaus hängt vom Kontext ab. Für
nicht-sicherheitsrelevante Anwendungen verwendet man häufig
1 − α = 0.95.
Häufiges Missverständnis: die Aussage P(µ ∈ I ) = 1 − α bedeutet
nicht, dass der Erwartungswert µ eine Zufallsvariable ist!! Zufällig
sind die Grenzen des Vertrauensintervalls, da sie mit Hilfe von
zufälligen Messwerten berechnet werden.
Beim Vergrössern der Stichprobe: wird das Vertrauensintervall grösser
oder kleiner? Und beim Erhöhen des Konfidenzniveaus?
Wahrscheinlichkeit und Statistik
23 / 23
WBL 2017
Wahrscheinlichkeit und Statistik
22 / 23
WBL 2017
Herunterladen