Vorlesung 2

Werbung
Schliessende (Induktive) Statistik
Statistik 2
2. Vorlesung, Oktober 10, 2012
Vergleich
Deskriptive Statistik
(beschreibende Statistik)
Beschreibung und
Zusammenfassung
Darstellung von Daten
(Tabellen u. Grafiken)
Kennzahlen (z.B.
Mittelwerte, Streuungsmaße)
Einführung
Induktive Statistik
(schließende Statistik)
Von Stichproben auf
Grundgesamtheiten
Schätzer
Tests
Entscheidungstheorie
Statistisches Schätzen
Bestimmung (Näherungsweise) der Parameter θ der
Verteilung der Grundgesamtheit aus der Stichprobe
X1,...,Xn . (Man kann es als eine Reihe von
Zufallsvariablen betrachten)
Beispiele für Parameter:
Die wahren Parameter der Grundgesamtheit sind unbekannt (vielleicht weisst man auch die Verteilung nicht)
Fragen:
Was sind die Werte dieser Parameter?
Antwort: aufgrund der Stichprobe (Schätzen), aber es
gibt nur einen Näherungswert. Wichtig: der Fehler zu
quantifizieren. Methoden: Punktschätzen,
Konfidenzintervalle (Intervallschätzen).
Sind unsere Hypothese wahr? (z.B läuft das Produktion
plangemäss, also haben unsere Waren die gewünschte
Eigenschaften?) Antwort: durch Hypothesen-Tests.
Erwartungswert,
Standardabweichung,
Quantile usw.
Schätzfunktion: auch eine Zufallsvariable
Schätzwert: Näherungswert, bestimmt aus der
Stichprobenwerten.
Grundgesamtheit: davon möchten wir möglichst
genaue Ergebnisse bekommen durch eine
repräsentative Stichprobe.
Auswahl der Stichprobe: Zufallsexperiment, also die
beobachtete Merkmalausprägung ist ein Wert von
eine Zufallsvariable X.
Parameter der Grundgesamtheit sind also die
Parameter der Verteilung von X (z.B. Erwartungswert, Varianz oder die Wahrscheinlichkeit P(X<x)).
Falls n Einheiten zufällig ausgewählt sind: X1,...,Xn
sind unabhängig und identisch verteilt (Realisationen:
x1,...,xn sind die Werte der konkreten Stichprobe).
Beispiel
Die mittlere Grösse unseren Schrauben ist zu
bestimmen.
Dazu nehmen wir eine einfache Stichprobe
(Umfang: n).
Die Verteilung der Anzahl der Schrauben in
die Stichprobe mit eine bestimmte
Eigenschaft: Hypergeometrisch (für grosse
Grundgesamtheiten man kann es mit der
Binomialverteilung nähern).
1
Beispiel/2
Wir können davon ausgehen, dass die
Grundgesamtheit normalverteilt ist (oder
wenigstens das Grenzwertssatz sichert eine
Näherung mit der Normalverteilung).
0.4
0.3
Eigenschaften des
arithmetischen Mittels
Standardabweichung (Standardfehler):
D( X ) = σ / n
n
σˆ =
∑(X
2
i
n( N − 1)
σˆ 2 =
n
∑(X
i
− X)
n −1
Beide sind aber konsistent, und das Differenz
zwischen den beiden Schätzer nähert sich der 0 als n
immer grösser wird.
52
53
1
n
n
wo Xi ist 1, falls wir bei der Stichprobenelement Nummer
i das Ereignis A beobachteten (ansonsten ist Xi=0).
Beispiel: aus 100 Kunden in unserem Geschäft haben 15
wirklich was gekauft. Davon bekommen wir
2
i =1
51
Schätzer für die Wahrscheinlichkeit von einem Ereignis
A:
X + ... + X
pˆ = X =
− X )2
n
50
mm
Schätzer für die
Wahrscheinlichkeit
i =1
ist nicht erwartungstreu, also man soll die korrigierte
Version anwenden (es ist erwartungstreu):
49
ist erwartungstreu und konsistent für den
Erwartungswert. In die meissten Fällen (d.H. für die
Verteilung der Grundgesamtheit) es ist auch effizient.
σ 2 ( N − n)
Die bis jetzt benutzter Schätzer:
48
θˆ = X
Schätzer für die Varianz
47
Erwartungstreuheit: für alle möglichen
Parameterwerte bekommen wir den schätzenden
Parameter im Durchschnitt.
Konsistenz: mit zunehmender Stichprobenumfang wird
der Parameter immer genauer appriximiert.
Effizienz: die kleinste Varianz zwischen alle
Erwartungstreuen Schätzer.
Korrektur für Stichproben aus endliche
Grundgesamtheit (mit Umfang N):
E ( X ) = m, Var ( X ) =
46
Gütekriterien
für alle Fälle wo die n Stichprobenelemente
die selbe Verteilung haben und unabhängig
sind:
E ( X ) = m,Var ( X ) = σ 2 / n
His togr am m v on S c hra ube nlae nge
0.2
D ichte
X 1 + ... + X n
n
θˆ = X =
Die Normalität kann durch z.B.
ein Histogram untersucht werden
Wir haben auch die
Dichtefunktion von der am besten
passenden Normalverteilung
dargestellt
Dazu soll man der
Erwartungswert und auch den
Varianz schätzen
0.1
In unserem Fall (Schrauben) die
Grundgesamtheit ist ziemlich gross, also man
kann es voraussetzen, dass die
Stichprobenelemente unabhängig sind.
Schätzfunktion:
0.0
Beispiel/3
pˆ = X = 15%
Deren Varianz ist
p (1 − p ) / n
und der Grenzwertsatz sichert wieder, dass der Schätzer
wenigstens nahe zur Normalverteilung ist.
2
Allgemeine Methode:
Likelihood Funktion
Maximum Likelihood Schätzer
lik e lih o o d f ü g g v é n y , n = 1 0 0
0.012
0.008
0.006
Daraus können wir die
Verteilungen bestimmen.
Rot: Normal
Blau: Gamma
P(X>300)=1.5%
P(X>300)=4%
Aus diesen Modellen bekommen 0
wir einen realistischeren Antwort.
0.000
0.002
0.004
100
y
0.1
0.0
0 .4
0 .6
0 .8
1 .0
0 .0
0 .2
0 .4
x
0 .6
0 .8
1 .0
x
200
300
was ist das Anteil diejenige Arbeitnehmer, die mehr
als 300 TFt pro Monat verdienen? Falls wir eine
Stichprobe haben: 50, 60, 80, 100, 130, 280 (TFt) davon sehen wir, das
falls wir die relative Häufigkeit als Schätzer
anwenden.
Aber man kann die Daten mit verschiedene
Verteilungen nähern, und davon können wir es
versuchen, z.B. eine Normalverteilung mit diesen
Parametern anzuwenden. Auch andere Verteilungen
sind möglich, z.B. die Gamma Verteilung.
Eigenschaften der Varianz
0.010
36133
= 85
5
0 .2
pˆ = 0
Monatsgehalt-verteilung
Dichte
x = 116,7;σˆ =
0 .0
Beispiel
Falls wir eine Idee haben, welche
Verteilung (z.B. Normal, Gamma,...)
unsere Grundgesamtheit beschreibt, wir
können deren Parametern schätzen,
und so die Verteilung bestimmen.
Daraus können wir die für uns
interessante Wahrscheinlichkeiten
nähern.
Beispiel/2
k = 1 , m a x = 0 .0 5
k = 5 ,m a x = 0 .2 5
k = 1 0 ,m a x = 0 .5
0.3
0.15
die Verteilung der
Grundgesamtheit
X 1 + ... + X n
n
0.05
y
pˆ = X =
0.00
Man kann es
mathematisch
beweisen, dass
die Lösung lautet
Wir betrachten es jetzt als eine Funktion von p
(Likelihood Funktion).
k = 5 , m a x = 0 .0 5
k = 2 5 ,m a x = 0 .2 5
k = 5 0 ,m a x = 0 .5
0.10
 n
  n
P ∑ X i = k  =   p k (1 − p) n − k
 i =1
 k 
lik e lih o o d f ü g g v é n y , n = 2 0
0.2
Wir suchen
diejeniges p,
für welchen die
Likelihood-Funktion
maximal ist.
Wie kommt man zu einem Schätzer?
Beispiel: die Wahrscheinlichkeit von einem Ereignis A.
Falls P(A)=p, man hat als Verteilung der Erfolge
400
500
Damit können wir Schätzer für die Wahrscheinlichkeit
grossen Differenzen von dem Erwartungswert
bekommen:
P(|X-EX| ≥ ε)≤Var(X) /ε2 (Tschebischev’sche
Ungleichung)
Beispiele: Falls E=100, Standardabweichung=20,
dann P(|X-100| ≥ 40)≤400 /1600=1/4.
P(|X-100| ≥ 60)≤400 /3600=1/9.
Für unsere Schätzer: man kann die nötige
Stichprobenumfang bestimmen um eine gegebene
Genauigkeit zu erreichen.
TFt
3
Beispiel
pˆ = X = 15%
Bootstrap
Var ( pˆ ) = p (1 − p ) / n
ˆ=p
Also für n=100 wir haben Var=0,001275. Ep
Daraus
P (| pˆ − p |> 0,1) ≤ 0,001275 / 0,01 = 12,75%
Nicht sehr genau (aber sicher). Wir bekommen
Pünktlichere Ergebnisse, wenn wir die Verteilung unser
Schätzer auch betrachten. Für die selbe Differenz,
aufgrund der Normalverteilung:
P(| pˆ − p |> 0,1) ≈ P (| Z |> 0,1 / 0,035) = 0,5%
Bootstrap-Beispiel
Intervallschätzung
Schaetzungen aufgrund der bootstrap Stichproben
100
Die beobachtete
Wahrscheinlichkeit für
Frequency
60
40
20
Insgesamt: 1%, also ein
wenig grösser als das
Ergebnis durch die
Normalverteilung.
Die wahren Parameter der
Grundgesamtheit sind unbekannt
Antwort: aufgrund der Stichprobe
geben wir ein Schätzwert, aber es ist
nur ein Näherungswert. Wichtig: den
Fehler zu quantifizieren.
Dazu braucht man die Eigenschaften
(die Verteilung) der Schätzungen.
0
P( pˆ > 25%) = 0.8%
80
P( pˆ < 5%) = 0.2%
Falls wir können die Verteilung unser
Schätzer nicht bestimmen, können wir eine
Simulationstechnik anwenden:
Nehmen wir mehrere Stichproben aus unser
Stichprobe (mit Zurücklegen, und mit dem
selben Umfang als die originale). Wenn wir
die Schätzung für diese „Bootstrap”
Stichproben ausrechnen, bekommen wir eine
Näherung zu der Verteilung unser Schätzer .
0.05
0.10
0.15
0.20
0.25
0.30
p
Verteilung der Schätzer für die
Mittelwert der Normalverteilung
Vertrauensintervall
1. σ ist bekannt
Falls σ sei bekannt, wir können die Verteilung
unseren Schätzfunktion X genau bestimmen: es hat
Normalverteilung mit Parametern
(m, σ / n ). Daraus folgt, dass wir können den
Unterschied zwischen unsere Schätzung und den
wahren Parameter schätzen. Aber dessen
Eigenschaften hängen von n und σ ab, also es ist
einfacher die standardisierte Version:
n ( X − m)
σ
zu benutzen.
Es ist nämlich standard Normalverteilt, also z.B. man
weisst, dass

P


n ( X − m)
σ

> 2  ≈ 0,05


Daraus kann man ein Vertrauensintervall
(Konfidenzintervall) für m konstruieren:

2σ
2σ  

,X +
P m ∈  X −
  ≈ 0,95
n
n  


natürlich geht es ebenso, generell für Sicherheit 1-α:

z
z
σ
σ

P m ∈  X − 1−α / 2 , X + 1−α / 2
n
n



  = 1 − α

4
Falls σ ist nicht bekannt
Interpretation
wenn man mit vielen Stichproben die
selben m Schätzt, wird m in 100(1-α)
Prozent aller Fälle in diesen Intervall
liegen.
Korrektur für Stichproben aus endlichen
Grundgesamtheit (mit Umfang N):


σ
z
P m ∈  X − 1−α / 2

n


σ
z
N −n
, X + 1−α / 2
N −1
n
N − n  
 = 1−α
N − 1  
Vertrauensintervall mit
Deckungswahrscheinlichkeit 1-α
σˆ
σˆ  

t
t

P m ∈  X − 1−α / 2,n−1 , X + 1−α / 2,n −1   = 1 − α
n
n



Für n>50 die t-Quantil geht in die standard
Normalquantil über. Ebenso wenn die Verteilung der
Merkmal ist unbekannt, für n>50 kann man die
Konfidenzbereich für die Mittelwert von Punkt 1 (σ
bekannt) benutzen.
Oft wählt man der Stichprobenumfang so, dass für
gegebene Sicherheit 1-α die Intervallbreite eine
gegebene Zahl d nicht überschreitet. Dazu:
4( z1−α / 2 ) 2 σ 2
n≥
(Fall 1: σ soll bekannt sein)
2
n
σˆ =
2
∑(X
i =1
Wenn aus 100 Studenten 25 die erste Prüfung
nicht bestanden haben, was kann man als
Vertrauensintervall mit α=0,05 (α=0,01) für den
Durchfallwahrscheinlichkeit geben?
Für α=0,05: 0,25-1,96*(0,25*0,75)1/2/10=0,165;
0,25+1,96*(0,25*0,75)1/2/10=0,335; Also das
Intervall lautet: (0,165;0,335)
Für α=0,01: 0,25-2,58*(0,25*0,75)1/2/10=0,138;
0,25+2,58*(0,25*0,75)1/2/10=0,362; Also das
Intervall lautet: (0,138;0,362)
n
− X )2
σˆ =
∑(X
i
− X )2
i =1
n −1
n −1
Die Standardisierung:
n ( X − m)
σˆ
Es ist nicht mehr standard Normalverteilt, sondern
Student (t)-verteilt.
In diesem Fall für die Einzelbeobachtung
(Indikatorfunktion) σ2=p(1-p), also wir
bekommen für p die folgenden Intervall (mit
Sicherheit 1-α)

z
pˆ (1 − pˆ ) 
z
pˆ (1 − pˆ )

 X − 1−α / 2
, X + 1−α / 2


n
n


k
wobei pˆ = n (die relative Häufigkeit). Um diese
Approximation gültig zu sein, brauchen wir
dass n ist gross genug (n>50).
d
i
Vertrauensintervall für die
Wahrscheinlichkeit
Beispiel
In diesem Fall können wir die Verteilung unseren
Schätzfunktion nicht genau bestimmen, wir müssen
dazu auch noch die Varianz (und daraus die
Standardabweichung) schätzen:
Stichprobenumfang
Wieder können wir die Stichprobenumfang so
wählen, dass für gegebene Sicherheit 1-α die
Intervallbreite eine gegebene Zahl d nicht
überschreitet. Dazu:
4( z1−α / 2 ) 2 pˆ (1 − pˆ )
n≥
d2
Aber p und sein Schätzer sind unbekannt bei
der Planung der Untersuchung, so man kann
eine obere Schranke wählen:
2
z
n ≥ 1−α2/ 2
d
5
Vertrauensintervall für die
Standardabweichung
Beispiel
Wieviel Studenten sollen wir fragen, um das
95%-Vertrauensintervall für den
Durchfallwahrscheinlichkeit kürzer als 0,1 zu
haben? 1,962/0,01=384 Studenten sind nötig.
Um die Länge zu halbieren braucht man 4
Mal so viel Beobachtungen.
Für die 99%-Vertrauensintervall:
2,582/0,01=666 Studenten sollen gefragt
werden.
Voraussetzung: die Beobachtungen sind Normalverteilt.
n
Man kann es bewiesen, dass
( X − X )2
∑
i
i =1
σ2
hat ein Chi-Quadrat Verteilung mit Freiheitsgrad n-1, und
davon der Konfidenzbereich:
n


 n

 ∑ ( X i − X ) 2 ∑ ( X i − X )2  

2
i =1
i =1
 = 1−α

,
P σ ∈

 h1−α / 2, n−1
hα / 2,n −1






wobei hα/2,n-1 und h1-α/2,n-1 sind die α/2 und 1- α/2 Quantile
der Chi-Quadrat Verteilung mit FG=n-1.
6
Herunterladen