Schätzen und Testen

htw saar
1
EINFÜHRUNG IN DIE STATISTIK:
SCHÄTZEN UND TESTEN
htw saar
Schätzen: Einführung
Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse
über die Verteilung dieses Merkmals in der Grundgesamtheit zu ziehen.
Diese Verallgemeinerungen sind natürlich nicht absolut sicher. Sie hängen stark von der Qualität
und der Größe der Stichprobe ab.
Man unterscheidet im wesentlichen Schätz- und Testverfahren.
Beispiel für Schätzung:
Zufällig ausgewählte wahlberechtigte Bürger werden befragt, welche Partei sie bei der nächsten
Bundestagswahl wählen.
Die Stimmanteile der Umfrage dienen als Schätzer für die Anteile bei der Bundestagswahl.
2
htw saar
Punktschätzung
Das engere Ziel der Schätzung ist es meist, einen Näherungswert für einen Punkt (Parameter) der
Verteilung der Grundgesamtheit anzugeben.
Im wesentlichen lassen sich zwei Situationen unterscheiden:
(1) Der Typ der Verteilung des Merkmals in der Grundgesamtheit ist nicht bekannt und es liegt keine
plausible Annahme für eine bestimmte Verteilung vor. Man möchte dann etwa Erwartungswert und
Varianz dieser unbekannten Verteilung schätzen.
(2) Aufgrund des Sachverhalts lässt sich eine Annahme für den Typ der Verteilung treffen.
Beispiele für (2):
• Intelligenzquotienten sind nach Konstruktion meist normalverteilt.
• Unfälle lassen sich oft mit einer Poissonverteilung modellieren (seltene Ereignisse).
3
htw saar
Schätzstatistiken
Ausgangspunkt sind n voneinander unabhängige identische Durchführungen eines Zufallsexperimentes
(Stichprobenziehung).
Die Zufallsvariablen, welche die Durchführung der Zufallsexperimente repräsentieren, werden mit
X1, …, Xn bezeichnet, die Realisierungen (beobachtete Werte) mit x1, …, xn.
Aus den Realisierungen soll auf einen Parameter θ der Verteilung der Grundgesamtheit geschlossen
werden.
Eine Punktschätzung für θ ist eine Funktion t = g(x1, …, xn).
Die Schätzfunktion (Schätzstatistik) für θ wird dargestellt durch T = g(X1, …, Xn).
T ist eine Zufallsvariable, da sich bei jeder Durchführung der Zufallsexperimente andere Realisierungen
ergeben und damit auch ein anderer Schätzwert.
Beispiel: Das arithmetische Mittel einer Stichprobe ist ein (Punkt-) Schätzer für den Erwartungswert.
4
htw saar
5
Erwartungstreue Schätzer
Eine Schätzstatistik sollte im Mittel (wenn man wiederholt Realisierungen aus verschiedenen
Stichproben betrachtet) den wahren Wert des Parameters in der Population liefern.
Diese Eigenschaft nennt man Erwartungstreue des Schätzers.
Eine Schätzstatistik T = g(X1, …, Xn) heißt für den Parameter θ erwartungstreu oder unverzerrt, wenn gilt:
Eθ (T) = θ.
D. h.: Unter der Voraussetzung, dass θ der Parameter der Grundgesamtheit ist, ergibt sich dieser
Parameter als Erwartungswert der Schätzstatistik.
Ist die Schätzstatistik T für θ nicht erwartungstreu, so nennt man sie verzerrt und berechnet die
Verzerrung (Bias) als
Biasθ(T) = Eθ (T) - θ
htw saar
Beispiele für erwartungstreue Schätzer
1) Das arithmetische Mittel einer Stichprobe ist ein erwartungstreuer Schätzer für den Erwartungswert der
Population.
2) Die Stichprobenvarianz (Division durch n – 1) ist ein erwartungstreuer Schätzer für die Varianz.
3) Die durch n dividierte Summe der quadrierten Abweichungen vom arithmetischen Mittel ist kein
erwartungstreuer Schätzer für die Varianz.
4) Für eine dichotome Variable X mit Werten 0 und 1 ist das arithmetische Mittel ein erwartungstreuer
Schätzer für den Anteilswert des Wertes 1 in der Grundgesamtheit.
6
htw saar
Konfidenzintervalle: Idee
Bis jetzt haben wir als Schätzer für einen Parameter einen einzelnen Wert berechnet.
Ein anderer Ansatz besteht darin ein Intervall zu schätzen und die Wahrscheinlichkeit dafür, dass der
gesuchte Parameter nicht in diesem Intervall enthalten ist, möglichst klein zu halten.
Die Wahrscheinlichkeit, dass der Parameter θ nicht im Intervall enthalten ist, wird
Irrtumswahrscheinlichkeit genannt und mit α bezeichnet.
Die Gegenwahrscheinlichkeit 1 – α, dass der Parameter im Intervall enthalten ist, wird
Überdeckungswahrscheinlichkeit (Konfidenzniveau) genannt.
Das Schätzintervall für den Parameter wird Konfidenzintervall (Vertrauensbereich) genannt.
7
htw saar
8
Konfidenzintervalle: Formale Definition
Seien Gu = gu(X1, …, Xn) und Go = go(X1, …, Xn) Schätzfunktionen für die untere und obere
Intervallgrenze. Für vorgegebenes α liefern diese Statistiken ein (1 – α) – Konfidenzintervall, wenn gilt:
P(Gu ≤ Go) = 1
P(Gu ≤ θ ≤ Go) = 1 – α
Seien gu = gu(x1, …, xn) und go = go(x1, …, xn) die aus den Realisationen berechneten Intervallgrenzen.
Dann hat das Konfidenzintervall die Form [gu, go].
Wichtig: Nach Definition enthält das Intervall [Gu, Go] mit der Wahrscheinlichkeit 1 – α den Parameter θ. Das
bedeutet nicht, dass für jedes aus Realisierungen berechnete Konfidenzintervall θ mit der Wahrscheinlichkeit
1 – α im Intervall liegt. Sondern: Da die Aussagen für die Schätzfunktionen gelten, gilt für (1 – α) * 100% der
realisierten Intervalle, dass θ in ihnen enthalten ist.
htw saar
Testen: Einführung
Neben dem möglichst genauen Schätzen eines Parameters möchte man oft prüfen, ob bestimmte
Vermutungen über einen Parameter oder die Verteilung einer Grundgesamtheit zutreffen.
Die Prüfung kann meist nicht an der Grundgesamtheit durchgeführt werden, sondern nur an einer
Stichprobe.
Die dabei verwendeten Verfahren werden als statistische Tests bezeichnet.
Die wesentlichen Schritte bei einem statistischen Test werden im folgenden anhand eines Beispiels
erläutert.
9
htw saar
Statistische Tests 1
Schritt 1: Formulierung eines inhaltlichen Problems in quantitativer Form.
Beispiel: Mädchen- und Jungengeburten
Vermutung: Es werden mehr Jungen als Mädchen geboren, d. h. der Anteil der Jungengeburten liegt über
50%. Andere Theorien gehen davon aus, dass gleich viele Jungen und Mädchen geboren werden.
10
htw saar
Statistische Tests 2
Schritt 2: Formulierung der Modellannahmen.
Beispiel: Mädchen- und Jungengeburten
Die Verteilung von Jungen und Mädchen kann mit einer Binomialverteilung modelliert werden. Dabei soll p
die Wahrscheinlichkeit für eine Jungengeburt sein.
11
htw saar
Statistische Tests 3
Schritt 3: Formulierung des Testproblems mittels des Modellparameters. Es wird eine Nullhypothese und
eine Alternativhypothese aufgestellt.
Beispiel: Mädchen- und Jungengeburten
Nullhypothese H0: p = 0,5
Alternativhypothese: p > 0,5
12
htw saar
Statistische Tests 4
Schritt 4: Festlegung des Signifikanzniveaus.
Das Signifikanzniveau α ist die Wahrscheinlichkeit, dass die Alternativhypothese akzeptiert wird, obwohl
die Nullhypothese gilt. (Wahrscheinlichkeit, dass die Nullhypothese irrtümlich verworfen wird.)
Diese Wahrscheinlichkeit möchte man möglichst klein halten. Übliche Werte sind daher α = 0,05 oder
α = 0,01.
Beispiel: Mädchen- und Jungengeburten
Wir wählen α = 0,05.
13
htw saar
14
Statistische Tests 5
Schritt 5: Bestimmung des Ablehnungsbereichs.
Aus den beobachteten Werten wird eine Prüfgröße (Teststatistik) berechnet. Der Ablehnungsbereich C
besteht aus den Werten der Teststatistik, die für die Alternativhypothese sprechen.
Beispiel: Mädchen- und Jungengeburten
Unsere Prüfgröße ist die Anzahl der Jungengeburten.
Der Einfachheit halber möge unsere Stichprobe den Umfang 10 haben.
Wenn die Nullhypothese p = 0,5 gilt, ergeben sich bei 10 Geburten folgende Wahrscheinlichkeiten:
Anzahl Jungen
10
0,001
9
0,01
8
0,044
P(9 Jungen und mehr) = 0,001 + 0,01 = 0,011 < 0,05
P(8 Jungen und mehr) = 0,001 + 0,01 + 0,044 = 0,055 > 0,05
=> Ablehnungsbereich C = {9, 10}
htw saar
Statistische Tests 6
Schritt 6: Berechnung der Prüfgröße für die konkrete Stichprobe.
Wenn Wert in Ablehnungsbereich liegt, wird Nullhypothese verworfen; ansonsten beibehalten.
15
htw saar
16
Bemerkungen
Statistikprogramme geben bei Ergebnissen von statistischen Tests immer den p-Wert an. Wenn der p-Wert
kleiner oder gleich dem Signifikanzniveau ist, wird die Nullhypothese abgelehnt.
Statistische Tests kontrollieren nicht den Fehler 2. Art (H0 beibehalten, obwohl H1 zutrifft). Aus diesem Grund
wird die eigentlich interessierende Fragestellung immer als Alternative formuliert. Für die Annahme der
Alternative kennt man den Fehler (α).