htw saar 1 EINFÜHRUNG IN DIE STATISTIK: SCHÄTZEN UND TESTEN htw saar Schätzen: Einführung Ziel der Statistik ist es, aus den Beobachtungen eines Merkmales in einer Stichprobe Rückschlüsse über die Verteilung dieses Merkmals in der Grundgesamtheit zu ziehen. Diese Verallgemeinerungen sind natürlich nicht absolut sicher. Sie hängen stark von der Qualität und der Größe der Stichprobe ab. Man unterscheidet im wesentlichen Schätz- und Testverfahren. Beispiel für Schätzung: Zufällig ausgewählte wahlberechtigte Bürger werden befragt, welche Partei sie bei der nächsten Bundestagswahl wählen. Die Stimmanteile der Umfrage dienen als Schätzer für die Anteile bei der Bundestagswahl. 2 htw saar Punktschätzung Das engere Ziel der Schätzung ist es meist, einen Näherungswert für einen Punkt (Parameter) der Verteilung der Grundgesamtheit anzugeben. Im wesentlichen lassen sich zwei Situationen unterscheiden: (1) Der Typ der Verteilung des Merkmals in der Grundgesamtheit ist nicht bekannt und es liegt keine plausible Annahme für eine bestimmte Verteilung vor. Man möchte dann etwa Erwartungswert und Varianz dieser unbekannten Verteilung schätzen. (2) Aufgrund des Sachverhalts lässt sich eine Annahme für den Typ der Verteilung treffen. Beispiele für (2): • Intelligenzquotienten sind nach Konstruktion meist normalverteilt. • Unfälle lassen sich oft mit einer Poissonverteilung modellieren (seltene Ereignisse). 3 htw saar Schätzstatistiken Ausgangspunkt sind n voneinander unabhängige identische Durchführungen eines Zufallsexperimentes (Stichprobenziehung). Die Zufallsvariablen, welche die Durchführung der Zufallsexperimente repräsentieren, werden mit X1, …, Xn bezeichnet, die Realisierungen (beobachtete Werte) mit x1, …, xn. Aus den Realisierungen soll auf einen Parameter θ der Verteilung der Grundgesamtheit geschlossen werden. Eine Punktschätzung für θ ist eine Funktion t = g(x1, …, xn). Die Schätzfunktion (Schätzstatistik) für θ wird dargestellt durch T = g(X1, …, Xn). T ist eine Zufallsvariable, da sich bei jeder Durchführung der Zufallsexperimente andere Realisierungen ergeben und damit auch ein anderer Schätzwert. Beispiel: Das arithmetische Mittel einer Stichprobe ist ein (Punkt-) Schätzer für den Erwartungswert. 4 htw saar 5 Erwartungstreue Schätzer Eine Schätzstatistik sollte im Mittel (wenn man wiederholt Realisierungen aus verschiedenen Stichproben betrachtet) den wahren Wert des Parameters in der Population liefern. Diese Eigenschaft nennt man Erwartungstreue des Schätzers. Eine Schätzstatistik T = g(X1, …, Xn) heißt für den Parameter θ erwartungstreu oder unverzerrt, wenn gilt: Eθ (T) = θ. D. h.: Unter der Voraussetzung, dass θ der Parameter der Grundgesamtheit ist, ergibt sich dieser Parameter als Erwartungswert der Schätzstatistik. Ist die Schätzstatistik T für θ nicht erwartungstreu, so nennt man sie verzerrt und berechnet die Verzerrung (Bias) als Biasθ(T) = Eθ (T) - θ htw saar Beispiele für erwartungstreue Schätzer 1) Das arithmetische Mittel einer Stichprobe ist ein erwartungstreuer Schätzer für den Erwartungswert der Population. 2) Die Stichprobenvarianz (Division durch n – 1) ist ein erwartungstreuer Schätzer für die Varianz. 3) Die durch n dividierte Summe der quadrierten Abweichungen vom arithmetischen Mittel ist kein erwartungstreuer Schätzer für die Varianz. 4) Für eine dichotome Variable X mit Werten 0 und 1 ist das arithmetische Mittel ein erwartungstreuer Schätzer für den Anteilswert des Wertes 1 in der Grundgesamtheit. 6 htw saar Konfidenzintervalle: Idee Bis jetzt haben wir als Schätzer für einen Parameter einen einzelnen Wert berechnet. Ein anderer Ansatz besteht darin ein Intervall zu schätzen und die Wahrscheinlichkeit dafür, dass der gesuchte Parameter nicht in diesem Intervall enthalten ist, möglichst klein zu halten. Die Wahrscheinlichkeit, dass der Parameter θ nicht im Intervall enthalten ist, wird Irrtumswahrscheinlichkeit genannt und mit α bezeichnet. Die Gegenwahrscheinlichkeit 1 – α, dass der Parameter im Intervall enthalten ist, wird Überdeckungswahrscheinlichkeit (Konfidenzniveau) genannt. Das Schätzintervall für den Parameter wird Konfidenzintervall (Vertrauensbereich) genannt. 7 htw saar 8 Konfidenzintervalle: Formale Definition Seien Gu = gu(X1, …, Xn) und Go = go(X1, …, Xn) Schätzfunktionen für die untere und obere Intervallgrenze. Für vorgegebenes α liefern diese Statistiken ein (1 – α) – Konfidenzintervall, wenn gilt: P(Gu ≤ Go) = 1 P(Gu ≤ θ ≤ Go) = 1 – α Seien gu = gu(x1, …, xn) und go = go(x1, …, xn) die aus den Realisationen berechneten Intervallgrenzen. Dann hat das Konfidenzintervall die Form [gu, go]. Wichtig: Nach Definition enthält das Intervall [Gu, Go] mit der Wahrscheinlichkeit 1 – α den Parameter θ. Das bedeutet nicht, dass für jedes aus Realisierungen berechnete Konfidenzintervall θ mit der Wahrscheinlichkeit 1 – α im Intervall liegt. Sondern: Da die Aussagen für die Schätzfunktionen gelten, gilt für (1 – α) * 100% der realisierten Intervalle, dass θ in ihnen enthalten ist. htw saar Testen: Einführung Neben dem möglichst genauen Schätzen eines Parameters möchte man oft prüfen, ob bestimmte Vermutungen über einen Parameter oder die Verteilung einer Grundgesamtheit zutreffen. Die Prüfung kann meist nicht an der Grundgesamtheit durchgeführt werden, sondern nur an einer Stichprobe. Die dabei verwendeten Verfahren werden als statistische Tests bezeichnet. Die wesentlichen Schritte bei einem statistischen Test werden im folgenden anhand eines Beispiels erläutert. 9 htw saar Statistische Tests 1 Schritt 1: Formulierung eines inhaltlichen Problems in quantitativer Form. Beispiel: Mädchen- und Jungengeburten Vermutung: Es werden mehr Jungen als Mädchen geboren, d. h. der Anteil der Jungengeburten liegt über 50%. Andere Theorien gehen davon aus, dass gleich viele Jungen und Mädchen geboren werden. 10 htw saar Statistische Tests 2 Schritt 2: Formulierung der Modellannahmen. Beispiel: Mädchen- und Jungengeburten Die Verteilung von Jungen und Mädchen kann mit einer Binomialverteilung modelliert werden. Dabei soll p die Wahrscheinlichkeit für eine Jungengeburt sein. 11 htw saar Statistische Tests 3 Schritt 3: Formulierung des Testproblems mittels des Modellparameters. Es wird eine Nullhypothese und eine Alternativhypothese aufgestellt. Beispiel: Mädchen- und Jungengeburten Nullhypothese H0: p = 0,5 Alternativhypothese: p > 0,5 12 htw saar Statistische Tests 4 Schritt 4: Festlegung des Signifikanzniveaus. Das Signifikanzniveau α ist die Wahrscheinlichkeit, dass die Alternativhypothese akzeptiert wird, obwohl die Nullhypothese gilt. (Wahrscheinlichkeit, dass die Nullhypothese irrtümlich verworfen wird.) Diese Wahrscheinlichkeit möchte man möglichst klein halten. Übliche Werte sind daher α = 0,05 oder α = 0,01. Beispiel: Mädchen- und Jungengeburten Wir wählen α = 0,05. 13 htw saar 14 Statistische Tests 5 Schritt 5: Bestimmung des Ablehnungsbereichs. Aus den beobachteten Werten wird eine Prüfgröße (Teststatistik) berechnet. Der Ablehnungsbereich C besteht aus den Werten der Teststatistik, die für die Alternativhypothese sprechen. Beispiel: Mädchen- und Jungengeburten Unsere Prüfgröße ist die Anzahl der Jungengeburten. Der Einfachheit halber möge unsere Stichprobe den Umfang 10 haben. Wenn die Nullhypothese p = 0,5 gilt, ergeben sich bei 10 Geburten folgende Wahrscheinlichkeiten: Anzahl Jungen 10 0,001 9 0,01 8 0,044 P(9 Jungen und mehr) = 0,001 + 0,01 = 0,011 < 0,05 P(8 Jungen und mehr) = 0,001 + 0,01 + 0,044 = 0,055 > 0,05 => Ablehnungsbereich C = {9, 10} htw saar Statistische Tests 6 Schritt 6: Berechnung der Prüfgröße für die konkrete Stichprobe. Wenn Wert in Ablehnungsbereich liegt, wird Nullhypothese verworfen; ansonsten beibehalten. 15 htw saar 16 Bemerkungen Statistikprogramme geben bei Ergebnissen von statistischen Tests immer den p-Wert an. Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, wird die Nullhypothese abgelehnt. Statistische Tests kontrollieren nicht den Fehler 2. Art (H0 beibehalten, obwohl H1 zutrifft). Aus diesem Grund wird die eigentlich interessierende Fragestellung immer als Alternative formuliert. Für die Annahme der Alternative kennt man den Fehler (α).