Schätzungen - Fachrichtung Mathematik

Werbung
Schließende Statistik
[statistical inference]
Sollen auf der Basis von empirischen Untersuchungen (Daten)
Erkenntnisse gewonnen und Entscheidungen gefällt werden,
sind die Methoden der Statistik einzusetzen.
Statistik
Beschreibende Statistik
Beschreibung von Daten (Deskription)
Generierung von Hypothesen (Exploration)
Schließende Statistik: Schluss von den Daten einer
Stichprobe auf die Grundgesamtheit
1
Grundlage der schließenden Statistik ist ein stochastisches
Modell für die Verhältnisse in der Grundgesamtheit.
Aufgaben der schließenden Statistik:
– möglichst gute Anpassung eines Modells an die
beobachteten Daten (die Realität); Schätzung des Modells.
– Überprüfung von Modellannahmen (Hypothesen) über die
Grundgesamtheit; z.B. über die Verteilungen der
Merkmalsausprägungen interessierender Merkmale in der
Grundgesamtheit. Zur Anwendung kommen
Entscheidungsregeln (z.B. Signifikanztests), die auf der
Basis der vorliegenden Stichprobendaten zu
Entscheidungen über diese Annahmen führen.
2
Schließende Statistik (Inferenzstatistik,
konfirmatorische Verfahren)
Hauptrichtungen:
– Schätzen [estimation of parameters] unbekannter
Parameter im Modell, z.B. Wahrscheinlichkeiten (Anteile
in der Grundgesamtheit), Erwartungswerte
(Durchschnittswerte in der Grundgesamtheit) oder
allgemein von Verteilungen interessierender Merkmale in
der Grundgesamtheit.
– Testen [testing of hypotheses] von Hypothesen über
diese Parameter bzw. Verteilungen, d.h. über die
Angepasstheit eines Modells und damit schließlich über die
interessierenden Verhältnisse in der Grundgesamtheit.
3
Jeder Schluss von einer Teilerhebung (Stichprobe) auf die
Grundgesamtheit ist mit Unsicherheiten verbunden. Die
wahrscheinlichkeitstheoretischen Modelle ermöglichen es,
diese Unsicherheiten zu quantifizieren.
Siehe herzu den Umdruck ”Induktive Statistik”!
4
Statistische Grundbegriffe
Die Grundgesamtheit (Population) ist die Gesamtmenge
von Merkmalsträgern (Objekten) über die Aussagen
gemacht werden sollen.
Beispiele: Gesamtbevölkerung in Deutschland,
Wahlberechtigte in Deutschland, WählerInnen einer Partei,
StudentInnen einer Fachrichtung
Es interessieren gewisse Merkmale, die die Merkmalsträger
aufweisen.
Beispiele: Geschlecht, Höhe des Einkommens, Zufriedenheit
mit der Statistikausbildung
5
Kann die Grundgesamtheit nicht vollständig – durch
Einbeziehung aller Merkmalsträger (Totalerhebung) –
hinsichtlich der interessierenden Merkmale untersucht
werden, so versucht man eine möglichst repräsentative
Teilerhebung zu verwenden.
Liegen keine gesicherten Kenntnisse über die Struktur der
Grundgesamtheit hinsichtlich der interessierenden Merkmale
vor, so sichert nur das Zufallsprinzip repräsentative
Teilerhebungen. Die einbezogenen n Merkmalsträger werden
rein zufällig und unabhängig voneinander ausgewählt
(gezogen). Dabei hat jeder Merkmalsträger bei jeder Ziehung
die gleiche Chance ausgewählt zu werden (”rein zufälliges”
Ziehen mit Zurücklegen). Die Ziehungsergebnisse beinflussen
sich dabei auch nicht gegenseitig (Unabhängigkeit).
6
Der Abstand zwischen Theorie und Praxis ist
in der Theorie deutlich kleiner als in der Praxis.
Betrachtet man für ein interessierendes Merkmal die
Zufallsvariable X, die die Merkmalsausprägungen – kodiert
durch Zahlen – bei einer rein zufälligen Auswahl eines
Merkmalsträgers aus der Grundgesamtheit beschreibt, so
besitzt sie die im allg. unbekannte Verteilungsfunktion FX
der Merkmalsausprägungen dieses Merkmals in der
Grundgesamtheit (entsprechende Verteilung der
Merkmalsausprägungen eines zufälligen Bürgers“).
”
7
Das stochastische Modell für das Ziehen einer reinen
Zufallsstichprobe ist die mathematische Stichpobe
[random sample]
(X1 , X2 , ..., Xn )
vom Stichprobenumfang n.
Xi beschreibt dabei die zufällige Merkmalsausprägung des
i–ten ausgewählten Merkmalträgers. Der Zufall steckt dabei
in der Auswahl des Merkmalsträgers! Nach der
Ziehungsvorschrift besitzen alle Xi die gleiche Verteilung FX
des interessierenden Merkmals X in der Grundgesamtheit.
Diese Modellvorstellung wird dann zur Berechnung
der Unsicherheiten beim Schluss von der Stichprobe
auf die Grundgesamtheit verwendet.
8
Das Resultat einer Datenerhebung ist die konkrete
Stichprobe (x1 , x2 , ..., xn ). xi steht dabei für die registrierte
Merkmalsausprägung des i–ten ausgewählten
Merkmalträgers. Gemäß der Modellvorstellung sind die Daten
eine Realisierung einer mathematischen Stichprobe.
Beschreibt man also den Ziehungs-Prozess einer
mathematischen Stichprobe, so verwendet man
Zufallsvariablen (z.B. Xi ), und beschreibt man die
Realisierung (das Resultat) einer konkreten Ziehung, so
verwendet man reelle Zahlen (z.B. xi ).
Übliche Sprechweise für diese Modellannahmen: Die
”
Stichprobe (x1 , . . . , xn ) entstamme einer nach FX verteilten
Grundgesamtheit.“
9
Praktisch hat man es stets mit der konkreten Stichprobe
(x1 , . . . , xn ) zu tun, mit deren Hilfe man Informationen über
die Population gewinnen will. Die mathematische Stichprobe
dient zur wahrscheinlichkeitstheoretischen Begründung der
Schlussweisen und zur Quantifizierung von Unsicherheiten.
Werden mehrere Merkmale registriert oder besteht das
Anliegen im Vergleich verschiedener Merkmale oder
verschiedener Populationen, werden bei der Modellbildung
verschiedene Zufallsvariablen (z.B. X, Y, . . .) eingeführt und
multivariat (z.B. bivariat (X, Y )) gemeinsam betrachtet.
10
Stichprobenfunktion
Sei g : Rn → R eine Funktion.
(X1 , X2 , . . . , Xn ) 7→ T = g(X1 , X2 , . . . , Xn )
math. Stichprobe
Stichprobenfunktion
Zufallsvariablen
Zufallsvariable
(x1 , x2 , . . . , xn ) 7→ t = g(x1 , x2 , . . . , xn )
konkrete Stichprobe
Stichprobenfunktion
reelle Zahlen (n-Tupel)
reelle Zahl
Stichprobenfunktionen werden für den Schluss von der
Stichprobe auf die Grundgesamtheit verwendet.
11
Bemerkungen:
– T und t sind allgemein übliche Bezeichnungen, für
spezielle Stichprobenfunktionen sind aber auch andere
Bezeichnungen üblich; zum Beispiel
n
1 X
Xi
X̄ =
n i=1
und
n
1 X
x̄ =
xi
n i=1
– Stichprobenfunktionen begegnen uns also als Formeln:
Setzen wir die Werte der konkreten Stichprobe ein, kommt
eine Zahl t heraus. Setzen wir die Zufallsvariablen der
mathematischen Stichprobe ein, kommt eine
Zufallsvariable T heraus.
– t kann als Realisierung der Zufallsvariablen T verstanden
werden.
12
Schätzungen
Wir betrachten dazu zwei Beispiele.
Beispiel (Körpergrößen): Schätzen der
Durchschnittsgröße µ der Kinder in der Grundgesamtheit.
– Gegeben: Konkrete Stichprobe (x1 , . . . , xn )
– Plausibel (Warum eigentlich?):
n
1X
x̄ =
xi
n i=1
als Schätzung für den Durchschnitt µ in der
Grundgesamtheit
– Frage: Wie gut ist diese Schätzung? –
Antwort mit Hilfe eines stochastischen Modells.
13
– Die Zufallsvariable X beschreibe die Körpergröße eines
rein zufällig aus der Grundgesamtheit ausgewählten
Kindes. Sie besitzt die unbekannte Verteilung FX mit
Erwartungswert µ (unbekannter Durchschnittswert).
– Sei (X1 , . . . , Xn ) eine mathematische Stichprobe vom
Umfang n. Dabei seien alle Xi wie X verteilt.
– Dann ist
n
1X
X̄ =
Xi
n i=1
eine Punktschätzung [point estimation] für µ, ihre
Realisierung
n
1X
x̄ =
xi
n i=1
ist eine konkrete Punktschätzung.
14
– Nach dem Zentrale Grenzwertsatz ist X̄ für große n
näherungsweise normalverteilt. Damit ist eine weiter
gehende Untersuchung der Genauigkeit der Schätzung
möglich. Beispielsweise kann die Wahrscheinlichkeit von
Abweichungen der Schätzung vom zu schätzenden
Durchschnittswert berechnet werden.
– Es gilt
E(X̄) = E
1
n
n
X
i=1
!
Xi
n
n
1X
1X
=
E(Xi ) =
µ=µ
n i=1
n i=1
Daher wird der Schätzer X̄ für den (unbekannten)
Erwartungswert µ erwartungstreu genannt.
15
Allgemein gilt: Sei γ der interessierende - zu schätzende Parameter. Für eine Stichprobenfunktion g : Rn → R heißt
die reelle Zahl
t = g(x1 , . . . , xn )
konkrete Punktschätzung und die Zufallsvariable
T = g(X1 , . . . , Xn )
Punktschätzung für den Parameter γ.
Sowohl T als auch t werden oftmals mit γ̂ bezeichnet.
Die Punktschätzung heißt erwartungstreu, wenn E(T ) = γ
gilt.
Weitere Punktschätzungen, ihre Eigenschaften und Methoden
zu ihrer Konstruktion −→ Literatur.
16
Ein aus einer konkreten Stichprobe berechneter Mittelwert x̄
trifft den zu schätzenden Durchschnittswert µ in der
Grundgesamtheit nur sehr selten oder fast nie genau (im allg.
ist also x̄ 6= µ).
Ausweg: Man betrachtet neben Punktschätzungen auch
Intervallschätzungen (Konfidenzschätzungen,
Konfidenzintervalle [confidence interval]).
Dabei verwendet man das folgende Konstruktionsprinzip:
Auf der Basis einer mathematischen Stichprobe ist ein
zufälliges Intervall anzugeben, dass den zu schätzenden
Parameter – hier den Durchschnittswert µ – mit einer
vorgegeben Wahrscheinlichkeit, dem Konfidenzniveau
[level of confidence] (1 − α), enthält (überdeckt).
17
Ist die Verteilung der verwendeten Stichprobenfunktion – hier
des arithmetischen Mittels – bekannt, so lassen sich aus dieser
Forderung die Grenzen eines Konfidenzintervalles berechnen.
Aus der t–Verteilung der (standardisierten) Zufallsvariable
X̄ − µ √
n
S
erhalten wir in unserem Beispiel zum Konfidenzniveau 1 − α
(α ist also die Wahrscheinlichkeit für die Nichtüberdeckung)
folgende Vorschrift zur Berechnung eines konkreten
Konfidenzintervalles für den unbekannten Durchschnittswert
µ der Körpergröße in der Grundgesamtheit:
x̄ − tn−1,1− α2
s
s
· √ , x̄ + tn−1,1− α2 · √
n
n
18
In der Darstellung
x̄ − tn−1,1− α2
s
s
α
· √ , x̄ + tn−1,1− 2 · √
n
n
bezeichnet tn−1,1− α2 das Quantil der t–Verteilung mit n − 1
Freiheitsgraden und Quantilsanteil (1 − α/2). Für ein
Konfidenzniveau von 95% und einen Stichprobenumfang
n = 200 ergibt sich t199,0.975 = 1.96. Mit x̄ = 143.7 und
s = 7.223 erhalten wir als konkretes Konfidenzintervall
7.223
7.223
143.7 − 1.96 · √
, 143.7 + 1.96 · √
200
200
19
= [142.7, 144.7]
Für die Interpretation von Konfidenzintervallen gilt:
Ein konkretes Konfidenzintervall enthält den zu schätzenden
Parameter, oder es enthält ihn nicht. Die Konstruktion des
Konfidenzintervalles sichert aber, dass bei häufiger
Wiederholung des Ziehungsvorganges für die Stichprobe die
berechneten Konfidenzintervalle den zu schätzenden
Parameter in ca. (1 − α)% der Fälle enthalten.
20
Beispiel (Verkehrsmittel):
Schätzen des Anteils ϑ der PKW–BenutzerInnen in der
Grundgesamtheit.
– Gegeben: Konkrete Stichprobe (x1 , . . . , xn )
– Plausibel (Warum eigentlich?): Die relative Häufigkeit für
das interessierende Ereignis (hier PKW-Nutzung)
h
f=
n
als Schätzung für den Anteil (die Wahrscheinlichkeit) ϑ in
der Grundgesamtheit
– Frage: Wie gut ist diese Schätzung? –
Antwort mit Hilfe eines stochastischen Modells.
21
– Die Zufallsvariable X habe den Wert 1, falls von einer
zufällig ausgewählten Person aus der Grundgesamtheit
PKW genutzt wird und ist sonst 0. Ihre Verteilung ist
P (X = 1) = ϑ
und
P (X = 0) = 1 − ϑ
mit der unbekannten Wahrscheinlichkeit (Parameter) ϑ.
– Sei (X1 , . . . , Xn ) eine mathematische Stichprobe vom
Umfang n. Dabei seien also alle Xi wie X verteilt.
– Dann ist
n
1 X
Xi
n i=1
Pn
eine Punktschätzung für ϑ und h/n = (
konkrete Punktschätzung.
22
i=1 xi )/n
eine
– Für eine mathematische Stichprobe ist die Zufallsvariable
Pn
H = i=1 Xi binomialverteilt und nach dem Zentralen
Grenzwertsatz für große n näherungsweise normalverteilt.
Damit ist eine weiter gehende Untersuchung der
Genauigkeit der Schätzung möglich. Beispielsweise kann
die Wahrscheinlichkeit von Abweichungen der Schätzung
vom zu schätzenden Anteilswertwert berechnet werden.
– Ein aus einer konkreten Stichprobe berechneter
Anteilswert h/n trifft den zu schätzenden Anteilswert ϑ in
der Grundgesamtheit nur sehr selten oder fast nie genau
(im allg. ist also h/n 6= ϑ).
– Ausweg: Intervallschätzungen
23
– Auf der Basis einer mathematischen Stichprobe ist ein
zufälliges Intervall anzugeben, dass den zu schätzenden
Parameter – hier den Anteilswert ϑ – mit einer vorgegeben
Wahrscheinlichkeit, dem Konfidenzniveau (1 − α),
enthält (überdeckt).
Ist die Verteilung der verwendeten Stichprobenfunktion –
hier der absoluten Häufigkeit – bekannt, so lassen sich die
Grenzen von Konfidenzintervallen berechnen.
24
Für größere Stichproben (n > 30) erhält man für ein
Konfidenzniveau 1 − α unter Verwendung der
Normalverteilung folgende Vorschrift zur Berechnung eines
konkreten Konfidenzintervalles für den unbekannten
Anteilswert ϑ der PKW–Benutzer in der Grundgesamtheit:

h
 − z1− α ·
2
n
s
h
n (1
− nh ) h
,
+ z1− α2 ·
n
n
s
h
n (1

− nh )

n
Dabei bezeichnet z1− α2 das Quantil der standardisierten
Normalverteilung mit Quantilsanteil 1 − α/2.
25
Für ein Konfidenzniveau von 95% ergibt sich z0.975 = 1.96.
Für den Stichprobenumfang n = 100 und
h/n = 53/100 = 0.53 erhalten wir das konkrete
Konfidenzintervall

0.53 − 1.96 ·
s
0.53(1 − 0.53)
, 0.53 + 1.96 ·
100
= [43.2%, 62.8%]
26
s

0.53(1 − 0.53) 
100
Herunterladen