Schließende Statistik [statistical inference] Sollen auf der Basis von empirischen Untersuchungen (Daten) Erkenntnisse gewonnen und Entscheidungen gefällt werden, sind die Methoden der Statistik einzusetzen. Statistik Beschreibende Statistik Beschreibung von Daten (Deskription) Generierung von Hypothesen (Exploration) Schließende Statistik: Schluss von den Daten einer Stichprobe auf die Grundgesamtheit 1 Grundlage der schließenden Statistik ist ein stochastisches Modell für die Verhältnisse in der Grundgesamtheit. Aufgaben der schließenden Statistik: – möglichst gute Anpassung eines Modells an die beobachteten Daten (die Realität); Schätzung des Modells. – Überprüfung von Modellannahmen (Hypothesen) über die Grundgesamtheit; z.B. über die Verteilungen der Merkmalsausprägungen interessierender Merkmale in der Grundgesamtheit. Zur Anwendung kommen Entscheidungsregeln (z.B. Signifikanztests), die auf der Basis der vorliegenden Stichprobendaten zu Entscheidungen über diese Annahmen führen. 2 Schließende Statistik (Inferenzstatistik, konfirmatorische Verfahren) Hauptrichtungen: – Schätzen [estimation of parameters] unbekannter Parameter im Modell, z.B. Wahrscheinlichkeiten (Anteile in der Grundgesamtheit), Erwartungswerte (Durchschnittswerte in der Grundgesamtheit) oder allgemein von Verteilungen interessierender Merkmale in der Grundgesamtheit. – Testen [testing of hypotheses] von Hypothesen über diese Parameter bzw. Verteilungen, d.h. über die Angepasstheit eines Modells und damit schließlich über die interessierenden Verhältnisse in der Grundgesamtheit. 3 Jeder Schluss von einer Teilerhebung (Stichprobe) auf die Grundgesamtheit ist mit Unsicherheiten verbunden. Die wahrscheinlichkeitstheoretischen Modelle ermöglichen es, diese Unsicherheiten zu quantifizieren. Siehe herzu den Umdruck ”Induktive Statistik”! 4 Statistische Grundbegriffe Die Grundgesamtheit (Population) ist die Gesamtmenge von Merkmalsträgern (Objekten) über die Aussagen gemacht werden sollen. Beispiele: Gesamtbevölkerung in Deutschland, Wahlberechtigte in Deutschland, WählerInnen einer Partei, StudentInnen einer Fachrichtung Es interessieren gewisse Merkmale, die die Merkmalsträger aufweisen. Beispiele: Geschlecht, Höhe des Einkommens, Zufriedenheit mit der Statistikausbildung 5 Kann die Grundgesamtheit nicht vollständig – durch Einbeziehung aller Merkmalsträger (Totalerhebung) – hinsichtlich der interessierenden Merkmale untersucht werden, so versucht man eine möglichst repräsentative Teilerhebung zu verwenden. Liegen keine gesicherten Kenntnisse über die Struktur der Grundgesamtheit hinsichtlich der interessierenden Merkmale vor, so sichert nur das Zufallsprinzip repräsentative Teilerhebungen. Die einbezogenen n Merkmalsträger werden rein zufällig und unabhängig voneinander ausgewählt (gezogen). Dabei hat jeder Merkmalsträger bei jeder Ziehung die gleiche Chance ausgewählt zu werden (”rein zufälliges” Ziehen mit Zurücklegen). Die Ziehungsergebnisse beinflussen sich dabei auch nicht gegenseitig (Unabhängigkeit). 6 Der Abstand zwischen Theorie und Praxis ist in der Theorie deutlich kleiner als in der Praxis. Betrachtet man für ein interessierendes Merkmal die Zufallsvariable X, die die Merkmalsausprägungen – kodiert durch Zahlen – bei einer rein zufälligen Auswahl eines Merkmalsträgers aus der Grundgesamtheit beschreibt, so besitzt sie die im allg. unbekannte Verteilungsfunktion FX der Merkmalsausprägungen dieses Merkmals in der Grundgesamtheit (entsprechende Verteilung der Merkmalsausprägungen eines zufälligen Bürgers“). ” 7 Das stochastische Modell für das Ziehen einer reinen Zufallsstichprobe ist die mathematische Stichpobe [random sample] (X1 , X2 , ..., Xn ) vom Stichprobenumfang n. Xi beschreibt dabei die zufällige Merkmalsausprägung des i–ten ausgewählten Merkmalträgers. Der Zufall steckt dabei in der Auswahl des Merkmalsträgers! Nach der Ziehungsvorschrift besitzen alle Xi die gleiche Verteilung FX des interessierenden Merkmals X in der Grundgesamtheit. Diese Modellvorstellung wird dann zur Berechnung der Unsicherheiten beim Schluss von der Stichprobe auf die Grundgesamtheit verwendet. 8 Das Resultat einer Datenerhebung ist die konkrete Stichprobe (x1 , x2 , ..., xn ). xi steht dabei für die registrierte Merkmalsausprägung des i–ten ausgewählten Merkmalträgers. Gemäß der Modellvorstellung sind die Daten eine Realisierung einer mathematischen Stichprobe. Beschreibt man also den Ziehungs-Prozess einer mathematischen Stichprobe, so verwendet man Zufallsvariablen (z.B. Xi ), und beschreibt man die Realisierung (das Resultat) einer konkreten Ziehung, so verwendet man reelle Zahlen (z.B. xi ). Übliche Sprechweise für diese Modellannahmen: Die ” Stichprobe (x1 , . . . , xn ) entstamme einer nach FX verteilten Grundgesamtheit.“ 9 Praktisch hat man es stets mit der konkreten Stichprobe (x1 , . . . , xn ) zu tun, mit deren Hilfe man Informationen über die Population gewinnen will. Die mathematische Stichprobe dient zur wahrscheinlichkeitstheoretischen Begründung der Schlussweisen und zur Quantifizierung von Unsicherheiten. Werden mehrere Merkmale registriert oder besteht das Anliegen im Vergleich verschiedener Merkmale oder verschiedener Populationen, werden bei der Modellbildung verschiedene Zufallsvariablen (z.B. X, Y, . . .) eingeführt und multivariat (z.B. bivariat (X, Y )) gemeinsam betrachtet. 10 Stichprobenfunktion Sei g : Rn → R eine Funktion. (X1 , X2 , . . . , Xn ) 7→ T = g(X1 , X2 , . . . , Xn ) math. Stichprobe Stichprobenfunktion Zufallsvariablen Zufallsvariable (x1 , x2 , . . . , xn ) 7→ t = g(x1 , x2 , . . . , xn ) konkrete Stichprobe Stichprobenfunktion reelle Zahlen (n-Tupel) reelle Zahl Stichprobenfunktionen werden für den Schluss von der Stichprobe auf die Grundgesamtheit verwendet. 11 Bemerkungen: – T und t sind allgemein übliche Bezeichnungen, für spezielle Stichprobenfunktionen sind aber auch andere Bezeichnungen üblich; zum Beispiel n 1 X Xi X̄ = n i=1 und n 1 X x̄ = xi n i=1 – Stichprobenfunktionen begegnen uns also als Formeln: Setzen wir die Werte der konkreten Stichprobe ein, kommt eine Zahl t heraus. Setzen wir die Zufallsvariablen der mathematischen Stichprobe ein, kommt eine Zufallsvariable T heraus. – t kann als Realisierung der Zufallsvariablen T verstanden werden. 12 Schätzungen Wir betrachten dazu zwei Beispiele. Beispiel (Körpergrößen): Schätzen der Durchschnittsgröße µ der Kinder in der Grundgesamtheit. – Gegeben: Konkrete Stichprobe (x1 , . . . , xn ) – Plausibel (Warum eigentlich?): n 1X x̄ = xi n i=1 als Schätzung für den Durchschnitt µ in der Grundgesamtheit – Frage: Wie gut ist diese Schätzung? – Antwort mit Hilfe eines stochastischen Modells. 13 – Die Zufallsvariable X beschreibe die Körpergröße eines rein zufällig aus der Grundgesamtheit ausgewählten Kindes. Sie besitzt die unbekannte Verteilung FX mit Erwartungswert µ (unbekannter Durchschnittswert). – Sei (X1 , . . . , Xn ) eine mathematische Stichprobe vom Umfang n. Dabei seien alle Xi wie X verteilt. – Dann ist n 1X X̄ = Xi n i=1 eine Punktschätzung [point estimation] für µ, ihre Realisierung n 1X x̄ = xi n i=1 ist eine konkrete Punktschätzung. 14 – Nach dem Zentrale Grenzwertsatz ist X̄ für große n näherungsweise normalverteilt. Damit ist eine weiter gehende Untersuchung der Genauigkeit der Schätzung möglich. Beispielsweise kann die Wahrscheinlichkeit von Abweichungen der Schätzung vom zu schätzenden Durchschnittswert berechnet werden. – Es gilt E(X̄) = E 1 n n X i=1 ! Xi n n 1X 1X = E(Xi ) = µ=µ n i=1 n i=1 Daher wird der Schätzer X̄ für den (unbekannten) Erwartungswert µ erwartungstreu genannt. 15 Allgemein gilt: Sei γ der interessierende - zu schätzende Parameter. Für eine Stichprobenfunktion g : Rn → R heißt die reelle Zahl t = g(x1 , . . . , xn ) konkrete Punktschätzung und die Zufallsvariable T = g(X1 , . . . , Xn ) Punktschätzung für den Parameter γ. Sowohl T als auch t werden oftmals mit γ̂ bezeichnet. Die Punktschätzung heißt erwartungstreu, wenn E(T ) = γ gilt. Weitere Punktschätzungen, ihre Eigenschaften und Methoden zu ihrer Konstruktion −→ Literatur. 16 Ein aus einer konkreten Stichprobe berechneter Mittelwert x̄ trifft den zu schätzenden Durchschnittswert µ in der Grundgesamtheit nur sehr selten oder fast nie genau (im allg. ist also x̄ 6= µ). Ausweg: Man betrachtet neben Punktschätzungen auch Intervallschätzungen (Konfidenzschätzungen, Konfidenzintervalle [confidence interval]). Dabei verwendet man das folgende Konstruktionsprinzip: Auf der Basis einer mathematischen Stichprobe ist ein zufälliges Intervall anzugeben, dass den zu schätzenden Parameter – hier den Durchschnittswert µ – mit einer vorgegeben Wahrscheinlichkeit, dem Konfidenzniveau [level of confidence] (1 − α), enthält (überdeckt). 17 Ist die Verteilung der verwendeten Stichprobenfunktion – hier des arithmetischen Mittels – bekannt, so lassen sich aus dieser Forderung die Grenzen eines Konfidenzintervalles berechnen. Aus der t–Verteilung der (standardisierten) Zufallsvariable X̄ − µ √ n S erhalten wir in unserem Beispiel zum Konfidenzniveau 1 − α (α ist also die Wahrscheinlichkeit für die Nichtüberdeckung) folgende Vorschrift zur Berechnung eines konkreten Konfidenzintervalles für den unbekannten Durchschnittswert µ der Körpergröße in der Grundgesamtheit: x̄ − tn−1,1− α2 s s · √ , x̄ + tn−1,1− α2 · √ n n 18 In der Darstellung x̄ − tn−1,1− α2 s s α · √ , x̄ + tn−1,1− 2 · √ n n bezeichnet tn−1,1− α2 das Quantil der t–Verteilung mit n − 1 Freiheitsgraden und Quantilsanteil (1 − α/2). Für ein Konfidenzniveau von 95% und einen Stichprobenumfang n = 200 ergibt sich t199,0.975 = 1.96. Mit x̄ = 143.7 und s = 7.223 erhalten wir als konkretes Konfidenzintervall 7.223 7.223 143.7 − 1.96 · √ , 143.7 + 1.96 · √ 200 200 19 = [142.7, 144.7] Für die Interpretation von Konfidenzintervallen gilt: Ein konkretes Konfidenzintervall enthält den zu schätzenden Parameter, oder es enthält ihn nicht. Die Konstruktion des Konfidenzintervalles sichert aber, dass bei häufiger Wiederholung des Ziehungsvorganges für die Stichprobe die berechneten Konfidenzintervalle den zu schätzenden Parameter in ca. (1 − α)% der Fälle enthalten. 20 Beispiel (Verkehrsmittel): Schätzen des Anteils ϑ der PKW–BenutzerInnen in der Grundgesamtheit. – Gegeben: Konkrete Stichprobe (x1 , . . . , xn ) – Plausibel (Warum eigentlich?): Die relative Häufigkeit für das interessierende Ereignis (hier PKW-Nutzung) h f= n als Schätzung für den Anteil (die Wahrscheinlichkeit) ϑ in der Grundgesamtheit – Frage: Wie gut ist diese Schätzung? – Antwort mit Hilfe eines stochastischen Modells. 21 – Die Zufallsvariable X habe den Wert 1, falls von einer zufällig ausgewählten Person aus der Grundgesamtheit PKW genutzt wird und ist sonst 0. Ihre Verteilung ist P (X = 1) = ϑ und P (X = 0) = 1 − ϑ mit der unbekannten Wahrscheinlichkeit (Parameter) ϑ. – Sei (X1 , . . . , Xn ) eine mathematische Stichprobe vom Umfang n. Dabei seien also alle Xi wie X verteilt. – Dann ist n 1 X Xi n i=1 Pn eine Punktschätzung für ϑ und h/n = ( konkrete Punktschätzung. 22 i=1 xi )/n eine – Für eine mathematische Stichprobe ist die Zufallsvariable Pn H = i=1 Xi binomialverteilt und nach dem Zentralen Grenzwertsatz für große n näherungsweise normalverteilt. Damit ist eine weiter gehende Untersuchung der Genauigkeit der Schätzung möglich. Beispielsweise kann die Wahrscheinlichkeit von Abweichungen der Schätzung vom zu schätzenden Anteilswertwert berechnet werden. – Ein aus einer konkreten Stichprobe berechneter Anteilswert h/n trifft den zu schätzenden Anteilswert ϑ in der Grundgesamtheit nur sehr selten oder fast nie genau (im allg. ist also h/n 6= ϑ). – Ausweg: Intervallschätzungen 23 – Auf der Basis einer mathematischen Stichprobe ist ein zufälliges Intervall anzugeben, dass den zu schätzenden Parameter – hier den Anteilswert ϑ – mit einer vorgegeben Wahrscheinlichkeit, dem Konfidenzniveau (1 − α), enthält (überdeckt). Ist die Verteilung der verwendeten Stichprobenfunktion – hier der absoluten Häufigkeit – bekannt, so lassen sich die Grenzen von Konfidenzintervallen berechnen. 24 Für größere Stichproben (n > 30) erhält man für ein Konfidenzniveau 1 − α unter Verwendung der Normalverteilung folgende Vorschrift zur Berechnung eines konkreten Konfidenzintervalles für den unbekannten Anteilswert ϑ der PKW–Benutzer in der Grundgesamtheit: h − z1− α · 2 n s h n (1 − nh ) h , + z1− α2 · n n s h n (1 − nh ) n Dabei bezeichnet z1− α2 das Quantil der standardisierten Normalverteilung mit Quantilsanteil 1 − α/2. 25 Für ein Konfidenzniveau von 95% ergibt sich z0.975 = 1.96. Für den Stichprobenumfang n = 100 und h/n = 53/100 = 0.53 erhalten wir das konkrete Konfidenzintervall 0.53 − 1.96 · s 0.53(1 − 0.53) , 0.53 + 1.96 · 100 = [43.2%, 62.8%] 26 s 0.53(1 − 0.53) 100