Konfidenzintervall für My

Werbung
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
Konfidenzintervall für My - Sigma bekannt
Worum geht es in diesem Modul?
Von der Punktschätzung zur Intervallschätzung
Konstruktion eines Intervalls um einen Punktschätzwert
Verbesserter Ansatz
Theoretische Herleitung eines Intervalls für My
1. Schritt: Schwankungsintervall für den Mittelwert
2. Schritt: Konfidenzintervall für My
3. Schritt: Herleitung der Formel für das Konfidenzintervall für My
Interpretation des Konfidenzintervalls
Zwischenbilanz
Simulation Konfidenzniveau
Allgemeine Formel für die Breite des Konfidenzintervalls
Zusammenhang zwischen Standardabweichung und Präzision
Zusammenhang zwischen Konfidenzniveau und Präzision
Zusammenhang zwischen Stichprobenumfang und Präzision
Bestimmung des Stichprobenumfangs bei vorgegebener Präzision
Worum geht es in diesem Modul?
Wie schon kurz im angesprochen, gibt es neben den Punktschätzern eine weitere Form
von Schätzern: die Intervallschätzer. Wir werden in diesem Modul die Idee der
Intervallschätzung erläutern. Im zweiten Schritt wird dann ein Intervallschätzer für
bei Normalverteilung und bekanntem
zunächst graphisch und anschließend
theoretisch hergeleitet. Abschließend werden die Eigenschaften dieses Schätzintervalls
untersucht.
Von der Punktschätzung zur Intervallschätzung
Bisher haben wir ausschließlich Punktschätzer betrachtet. Ein erwartungstreuer
Punktschätzer trifft den tatsächlichen Parameterwert im Durchschnitt - keinesfalls
jedoch in jedem Einzelfall; das zeigen auch die bisher angestellten Simulationen. Die
Standardabweichung des Schätzers ist zwar ein generelles Maß für die Abweichung von
Schätzer und tatsächlichem Parameterwert, aber auch sie gibt im konkreten Einzelfall
keine Auskunft über die Abweichung.
Letztendlich gaukelt die Punktschätzung eine "Pseudogenauigkeit" vor: Wir geben den
geschätzten Parameterwert punktgenau an und das, obwohl wir - insbesondere im
stetigen Fall - den wahren Parameterwert sehr selten exakt treffen werden. Allerdings
Page 1
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
werden "gute Schätzer" Schätzwerte liefern, die sich im Rahmen akzeptabler
Genauigkeit nah um den wahren Parameterwert scharen.
Man kann eine Punktschätzung mit dem Versuch vergleichen, eine winzige Fliege (den
wahren Parameterwert) mit einer Stecknadel (dem Punktschätzer) zu treffen. Der
erfahrene Fliegenjäger würde der Stecknadel eine Fliegenklatsche vorziehen... in der
Statistik wäre ein Intervall die Entsprechung.
Beispiel: Simulations-Beispiel
Die Exponentialverteilung (vgl. )gilt als geeignetes Modell, um die Dauer von
Telefongesprächen zu modellieren. Wir betrachten
Stichproben, in denen
jeweils die Dauer von
Telefongesprächen genau erfasst wurde. In der
Grafik sind jeweils die Schätzwerte (
) angegeben. Das wahre
sei exakt 0.5,
d.h. wir erwarten, dass ein Telefongespräch im Mittel 2 Minuten dauert (
).
Visualisierung der sich aus k=25 Stichproben ergebenden Schätzwerte für den Parameter "Lambda" der Exponentialverteilung; es
sind drei Mal dieselben Schätzwerte in unterschiedlicher Skalierung dargestellt
Hat es auf den oberen beiden Abbildungen noch den Anschein, als würde der wahre
Parameterwert
zumindest von einem Schätzwert exakt getroffen, so wird
unten (bei weiterer Ausschnittsvergrößerung) deutlich, dass kein Schätzwert das wahre
exakt trifft. Das ist bei kontinuierlichem Parameterraum auch fast unmöglich.
Stattdessen liegen die Schätzwerte in einem Intervall um das wahre
Beispiel ungefähr in dem Intervall
Page 2
herum; im
. Dieses Intervall korrespondiert mit
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
einer Schätzung der durchschnittlichen Gesprächsdauer von
(in
Minuten). Sie können diese Simulation zu Telefonatdauer ( a57.spf ) im Statistiklabor
nachvollziehen und modifizieren.
Fassen wir zusammen: Während keiner der 25 Punktschätzwerte
der tatsächliche Wert von
exakt trifft, liegt
in dem konstruierten Intervall. Die Intervall-Schätzung ist
in gewisser Hinsicht "ungenauer", weil wir statt eines Punktes ein Intervall als Ergebnis
der Schätzung erhalten; dafür überdeckt das Intervall den wahren Parameterwert
tatsächlich. Vorteilhaft am Intervall ist außerdem, dass seine Breite unmittelbar
Informationen über die Präzision der Schätzung gibt - bei einem Punktschätzer müssen
solche Informationen (z.B. Standardfehler) ggf. separat angegeben werden.
Konstruktion eines Intervalls um einen Punktschätzwert
Wenden wir uns dem Schätzproblem für den Parameter
zu. Verschiedene Punktschätzer für
der Normalverteilung (vgl. )
kennen wir bereits aus dem . Im Folgenden
orientieren wir uns an dem besten Schätzer für
, den wir kennen, nämlich
Wir wollen versuchen, ein sinnvolles Intervall für die Schätzung von
.
zu
konstruieren. Um die Idee hinter der Intervallschätzung zu verdeutlichen, wollen wir
dazu zunächst eine Simulation anstellen:
Es werden
Stichproben vom Umfang
Standardnormalverteilung
Parameterwert ist also
aus der
gezogen. Der tatsächliche
; in der Simulation schwanken die Schätzungen
allerdings zwischen -0.24 und 0.20. Die Abweichung vom wahren Wert
ist also im Simulationsexperiment betragsmäßig nie größer als 0.24. Sollte das
immer gelten, so könnte man um jeden Schätzwert ein Intervall der Breite
legen und behaupten, der - im praktischen Fall unbekannte - Parameterwert läge in
diesem Intervall. Für die 50 Werte aus unserer Simulation stimmt das natürlich:
Intervalle um k=50 Schätzerwerte für den Parameter My der Normalverteilung aus Stichproben vom Umfang n=100; die größte
Abweichung vom wahren Wert My=0 (mit einem Pfeil gekennzeichnet) bestimmt die Breite der Intervalle
Einführung des Konfidenz-Niveaus
Leider ist es keinesfalls sicher, dass dieses Vorgehen auch für alle Folgeschätzungen
zum Erfolg führt. Es ist durchaus möglich, dass - wenn wir unser
Simulationsexperiment weiter führen - eine der nächsten Stichproben zu einem
Schätzwert führt, der noch extremer von dem zu schätzenden Parameterwert abweicht
als jeder unserer ersten 50 Schätzwerte, so dass das um ihn gebildete Intervall der Breite
den zu schätzenden Parameterwert nicht enthält.
Im haben wir die Dichtefunktion von
hergeleitet. Wir können also die
Wahrscheinlichkeit dafür ausrechnen, dass ein Schätzwert auftritt, der betragsmäßig
Page 3
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
größer als 0.24 ist. Die Wahrscheinlichkeit für das Ereignis ist zwar gering (), aber
größer als 0. Würde das Ereignis auftreten, so überdeckte unser Intervall den wahren
Parameterwert nicht. Würden wir stattdessen den Versuch unternehmen, ein Intervall zu
konstruieren, welches für alle denkbaren Schätzwerte
das wahre
überdeckt, so würde dieses Intervall zwangsläufig den gesamten Parameterraum
überdecken ( bis ). Schließlich ist
für jedes noch so große
immer positiv - die Schätzung wäre sinnlos (denn es ist trivial, dass das wahre
immer in
liegt). Der Versuch, ein Intervall zu konstruieren, das den wahren Wert
von
immer einschließt, ist also eine Sackgasse.
Wir müssen daher das "immer" relativieren, etwa zu "fast immer", oder noch besser: wir
könnten uns vornehmen, die Intervallbreite so festzulegen, dass auf lange Sicht ein
festgelegter Anteil der Intervalle, wir bezeichnen ihn als Konfidenzniveau , den zu
schätzenden Parameterwert überdeckt, während der Anteil der Intervalle das nicht tut.
Natürlich würden wir in der Nähe von 1 wählen, vielleicht 0.95 oder 0.99.
Verbesserter Ansatz
Wir führen das begonnene Simulationsexperiment weiter, beispielsweise, bis wir
Schätzwerte haben (um der Aussage auf lange Sicht gerecht zu werden). Dann
sortieren wir die Beträge der 10000 Abweichungen zwischen Schätzer und zu
schätzendem Parameterwert nach aufsteigender Größe und suchen uns, um zu
realisieren, den Wert heraus, der von 95% der Beträge unterschritten bzw. von 5%
überschritten wird. Wenn wir nun für jeden einzelnen der 10000 Fälle das vom bis zum
reichende Intervall bilden, dann werden ca. 95% der Intervalle den zu schätzenden
Parameterwert überdecken, ca. 5% nicht. Die Abbildung veranschaulicht diese
Methode.
Schätz-Intervall, welches auf Basis von k=10000 Stichproben vom Umfang n=100 aus N(0,1) so abgegrenzt wurde, dass 95% der
Schätzwerte umschlossen werden und 5% nicht.
Zwar können wir nicht mit Sicherheit behaupten, dass ein beliebig aus den 10000
Intervallen herausgegriffenes Intervall den zu schätzenden Parameterwert überdeckt und
damit eine richtige Aussage macht (im Gegenteil: gerade dieses Intervall könnte den
Parameterwert nicht überdecken und damit eine Fehlaussage liefern). Aber wir könnten
behaupten, dass jedes der 10000 Intervalle aus einer langen Serie möglicher Intervalle
stammt, von denen 95% den zu schätzenden Parameterwert überdecken und damit eine
richtige Aussage liefern, während nur 5% den zu schätzenden Parameterwert nicht
überdecken und damit eine Fehlaussage liefern.
Basierend auf unserem Simulationsexperiment ergeben sich folgende Intervallgrenzen
in Abhängigkeit von :
Konfidenzniveau
Schätzintervall
0.165
0.196
0.257
Page 4
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
Theoretische Herleitung eines Intervalls für My
Das erste Problem des "immer" haben wir durch die Vorgabe des Konfidenzniveaus
gelöst. Ein zweites Problem scheint aber zunächst größer zu sein: Die Breite des zum
Konfidenzniveau gehörenden Intervalls haben wir durch ein umfangreiches
Simulationsexperiment gefunden. Tatsächlich ist das unnötig: Wir brauchen weder mit
bekanntem Parameterwert noch überhaupt zu simulieren, weil sich ein Intervall zu
einem vorgegebenen Konfidenzniveau aufgrund statistischer Überlegungen aus jeder
einzelnen Stichprobe errechnen lässt.
Dazu machen wir die Voraussetzung, dass die beobachteten Merkmalswerte in unserer
Stichprobe, , unabhängige Realisierungen einer normalverteilten Zufallsvariablen mit
dem Erwartungswert und der Varianz sind. Außerdem setzen wir im ersten Schritt
voraus, dass die Varianz
bekannt ist; im zweiten Schritt lassen wir
diese - unrealistische - Voraussetzung fallen. Kurz gesagt stellen wir unter den
Voraussetzungen der Unabhängigkeit, der Normalverteilung und bekannter Varianz die
Frage nach dem Schätz-Intervall für den Erwartungswert . Analog zum
"Konfidenzniveau" nennen wir dieses Schätz-Intervall "Konfidenzintervall". Die
Herleitung erfolgt in drei Schritten.
1. Schritt: Schwankungsintervall für den Mittelwert
Wir finden das Konfidenzintervall für den Parameter der Normalverteilung, indem wir
zunächst die umgekehrte Frage beantworten, nämlich die nach einem Intervall für
aus einer
Stichprobe aus einer Normalverteilung mit gegebenem und gegebenem . Wir wissen
bereits: Wenn normalverteilt ist wie , dann ist
ebenfalls normalverteilt, und
zwar wie
- vgl. . Daraus folgt, dass die standardisierte Zufallsvariable
standardnormalverteilt ist: .
Veranschaulichung des (1-Alpha)-Niveaus an der Dichtefunktion der Standardnormalverteilung
Das zentrale Schwankungsintervall für zur vorgegebenen Wahrscheinlichkeit ist
definiert durch
.
Durch Zerlegung der Doppelungleichung finden wir die Intervallgrenzen:
Für die p-Quantile der standardisierten Normalverteilung gilt , so dass für auch
geschrieben werden kann. Wir erhalten das zentrale ()-Schwankungsintervall für ,
,
für das die Wahrscheinlichkeitsaussage
Page 5
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
gilt (vgl. ).
Aus dem zentralen Schwankungsintervall für können wir leicht ein zentrales
Schwankungsintervall für
gewinnen, indem wir für den
Ausdruck
in unsere letzte Gleichung einsetzen. Es ergibt sich
.
Durch Auflösen nach
erhalten wir
.
Das Intervall
ist das zentrale ()-Schwankungsintervall für .
2. Schritt: Konfidenzintervall für My
Mithilfe der Gleichung
können wir jetzt also ein Intervall für zum Niveau konstruieren, so dass auf lange Sicht
(
) Prozent unserer Schätzungen in diesem
Intervall liegen werden und
Prozent nicht. Das löst
die Frage nach dem Intervall für bei gegebenem
, aber nicht unsere
- umgekehrte - Frage nach dem Intervall für bei gegebenem .
Erinnern wir uns: Beim Schätzen ist der tatsächliche Parameterwert unbekannt - wir
wollen also versuchen, um unseren Schätzer ein Intervall zu konstruieren, in dem mit
einer bestimmten Wahrscheinlichkeit liegt. Wie kommen wir von dem
Schwankungsintervall für zum Schwankungs- bzw. Konfidenzintervall für ?
Die folgende Überlegung bringt uns ans Ziel: Wir wollen das zentrale
()-Schwankungsintervall für nicht für ein bestimmtes
, sondern für verschiedene
grafisch angeben. Dazu tragen wir an der Abszisse eines
Koordinatensystems und an der Ordinate die untere und obere Grenze des
Schwankungsintervalls ab. Wenn wir die Maßeinheiten der beiden Koordinaten gleich
wählen, dann bilden die beiden Grenzlinien der Schwankungsintervalle gemäß unserer
Gleichung
Page 6
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
parallele Geraden, die gegenüber der Diagonalen um den Betrag nach unten bzw. nach
oben verschoben sind.
Grafische Bestimmung der Grenzen des Schwankungsintervalls für den Mittelwert
Für jedes gewählte können wir nun das zentrale Schwankungsintervall für ablesen; die
Abbildung verdeutlicht dies exemplarisch für (rot eingezeichnet).
Um zum Schwankungsintervall für
zu kommen, benutzen wir die Abbildung nun
umgekehrt: wir kennen
nicht, haben aber aus der Stichprobe das arithmetische
Mittel
bestimmt und tragen ihn auf der Ordinate unserer Abbildung ab. Wir fragen
uns nun, bei welchen Werten von der von uns gefundene Wert im zentralen
Schwankungsintervall gelegen hätte.
Grafische Bestimmung der Grenzen des Schwankungsintervalls für den Parameter My
Die Antwort ist einfach: Ziehen wir eine Waagerechte durch
, dann ergibt der
Schnittpunkt mit
offenbar das kleinste (wir nennen es ), für das gerade noch in dem
- fett eingerahmten - Schwankungsintervall liegt. Umgekehrt ergibt der Schnittpunkt mit
das größte
(wir nennen es
), für das
gerade noch - in dem fett
eingezeichneten - Schwankungsintervall liegt. Anders gesagt: Das Intervall
enthält alle Werte
, für die das gegebene
)-Schwankungsintervall gelegen hätte. Wir nennen
im zentralen (
ein zweiseitiges
symmetrisches ()-Konfidenzintervall für .
3. Schritt: Herleitung der Formel für das Konfidenzintervall für My
Wie können wir nun die Formel finden, die unserer Grafik zugrunde liegt? Ganz
einfach, indem wir die bereits bekannte Gleichung
nach auflösen: Aus folgt
und aus folgt
.
Also ergibt sich
.
Damit sind wir schon am Ziel! Die folgende Animation gibt noch einmal einen
Überblick über die Überlegungen, die uns zu dieser Gleichung geführt haben.
: Flashanimation ' Animation Konfidenz-Schätzung ' siehe Online-Version
öffnen
Interpretation des Konfidenzintervalls
Page 7
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
Solange die Zufallsvariable noch nicht den sich aus der Stichprobe ergebenden Wert
angenommen hat, sind die Grenzen des untersuchten Konfidenzintervalls,
und ,
Zufallsvariablen; das zufällige Intervall zwischen ihnen überdeckt mit der
Wahrscheinlichkeit den Erwartungswert .
Setzt man in der Gleichung des Konfidenzintervalls für die Zufallsvariable
Stichprobenwert
den
ein, dann ergeben sich die Grenzen
des konkreten Konfidenzintervalls für .
Die Wahrscheinlichkeitsaussage gilt natürlich in dem Moment nicht mehr, in dem wir
die Zufallsvariable
durch ihren konkreten Wert
ersetzt. Denn dann stehen in
der Bestimmungsgleichung des Konfidenzintervalls zwei Zahlenwerte als Grenzen, so
dass das Intervall zwischen ihnen den unbekannten, aber festen Wert entweder
überdeckt oder nicht.
Obwohl das konkrete Konfidenzintervall aus einer Wahrscheinlichkeitsaussage zur
Wahrscheinlichkeit
hervorgegangen ist, werden wir im Einzelfall
nur sagen können, dass es den Erwartungswert überdeckt oder auch nicht. Wir werden
aber erwarten, dass der Anteil von ()-Konfidenzintervallen, die auf der Basis
verschiedener Stichproben abgegrenzt wurden, den unbekannten Erwartungswert
überdecken, der Anteil dagegen nicht.
Satz - Konfidenzintervall für
bei Normalverteilung und bekannter Varianz
:
Ist eine konkrete Stichprobe vom Umfang aus einer Normalverteilung (d.h. sind
Realisierungen der Zufallsvariablen , die unabhängig identisch normalverteilt sind) mit
bekannter Varianz und unbekanntem Erwartungswert und ist der arithmetische
Mittelwert der Stichprobe, dann ist mit
ein zweiseitiges symmetrisches Konfidenzintervall für zum Konfidenzniveau
Page 8
; dabei
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
ist
das (
)-Quantil der standardisierten Normalverteilung.
Beispiel: Preisvergleich
Ein namhafter Hersteller von Spiegelreflex- und Kleinbildkameras hat beschlossen,
auch das Marktsegment "höherwertige Digitalkameras" zu besetzen. Man hofft auf eine
erfolgreiche Verwertung der Kernkompetenz "Know-how rund um hochwertige
Optiken" und das Image als Markenhersteller. Die Vertriebsstrukturen weichen
allerdings erheblich ab: Die Käufer digitaler Photoapparate sind internet- und
technikaffinitiv. Es herrscht eine hohe Preiselastizität, viele Geräte werden über schwer
kontrollierbare Versandhändler abgesetzt. Für die Hersteller ist es dadurch schwierig,
die gewünschten Endverbraucherpreise durchzusetzen.
Preisdifferenzen bei digitalen Photoapparaten (Quellen: www.canon.de, www.guenstiger.de)
Um sich mit dem Markt vertraut zu machen, sollen die Endverbraucherpreise eines
etablierten Konkurrenzproduktes analysiert werden. Dazu wird eine Stichprobe vom
Umfang
aus einer sehr umfangreichen Liste (
) entsprechender Händler
gezogen - bei den Händlern in der Stichprobe ( dfb.txt ) werden Angebote für das
Konkurrenzprodukt eingeholt. Es ergibt sich .
Das Konfidenzintervall für den durchschnittlichen Endverbraucherpreis soll berechnet
werden (Konfidenzniveau ; es wird angenommen, dass die Endverbraucherpreise
normalverteilt sind; die Standardabweichung betrage ).
mit:
,,,.
Es ergibt sich:
Zum Konfidenzniveau 95% erhalten wir für den "Straßenpreis" das Konfidenzintervall .
In Zusammenhang mit Konfidenzintervallen trifft man oft auf falsche Interpretationen
der Aussage, die ein solches Intervall macht. Während solche Fehler in der Praxis
gelegentlich unbemerkt bleiben, gilt das für Klausuren nur in den wenigsten Fällen!
Daher soll an dieser Stelle noch einmal auf ein häufiges Missverständnis eingegangen
werden: In Bezug auf das Beispiel Preisvergleich würden sich einige Personen zu der
folgenden (falschen) Aussage hinreißen lassen:
"Das wahre liegt mit der Wahrscheinlichkeit 95% in dem Intervall
."
Wir unterscheiden die allgemeine Konstruktionsgleichung (1) für ein
Konfidenzintervall, in der die Intervallgrenzen Zufallsvariablen sind und das sog.
"realisierte" oder "konkrete" Konfidenzintervall (2), welches wir erhalten, wenn Daten
einer konkreten Stichprobe in die Konstruktionsgleichung eingesetzt wurden.
(1) Vor der Beobachtung :
es gilt:
Page 9
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
(2) Realisiertes Konfidenzintervall :
es gilt nicht:
Wo ist der Unterschied? Die roten
(groß geschrieben) sind Zufallsvariablen, die
blauen (klein geschrieben) sind Realisierungen dieser Zufallsvariablen. Das realisierte
Intervall hat zwei konkrete Zahlenwerte als Grenzen, z.B. . Warum gilt die
Wahrscheinlichkeitsaussage nun nicht mehr? Die Tatsache, dass wir nicht kennen, führt
gelegentlich zu dem Fehlschluss, sei eine Zufallsvariable. ist aber eine, wenn auch
unbekannte, Konstante. Eine Wahrscheinlichkeit dafür angeben zu wollen, dass die
unbekannte Konstante von
überdeckt wird, ist unsinnig. Das realisierte Intervall
überdeckt entweder oder es tut es nicht! Eine Aussage zur Überdeckung in Bezug auf
realisierte Intervalle macht erst auf lange Sicht Sinn: Wir erwarten, dass bei
wiederholter Stichprobenziehung auf lange Sicht ungefähr 95% der realisierten
Intervalle den wahren Parameterwert überdecken. Ein Beispiel soll den Denkfehler
verdeutlichen:
Sie möchten Lotto spielen, um Ihre Haushaltskasse aufzubessern (tatsächlich hat dies
meist den gegenteiligen Effekt). Um am "Samstags-Lotto" teilzunehmen, füllen Sie
schon am Freitag Ihren Lottoschein aus und geben ihn ab. Die Aussage, dass sie mit der
Wahrscheinlichkeit 6 richtige getippt haben ist jetzt korrekt. Nehmen wir weiter an, Sie
sind am Samstagabend unterwegs und verpassen die Ziehung der Lottozahlen. Auch
wenn Sie die gezogenen Lottozahlen nicht kennen, können Sie nach der Ziehung keine
Wahrscheinlichkeit für einen möglichen Gewinn mehr angeben, denn sobald die
Lottozahlen feststehen, haben Sie entweder 6 richtige oder Sie haben sie nicht. Ob Sie
die Gewinnzahlen kennen, spielt dabei keine Rolle. Würden Sie regelmäßig Lotto
spielen, könnte man allerdings davon ausgehen, dass Sie auf lange Sicht (allerdings nur,
wenn Sie einige Milliarden Jahre alt werden würden) im Durchschnitt ca. jedes
13983816te Spiel gewinnen würden.
Zwischenbilanz
Wir haben die theoretische Herleitung des Konfidenzintervalls für unter
Normalverteilung bewältigt. Es ist nicht unbedingt erforderlich, jeden einzelnen Schritt
auf Anhieb zu verstehen, schließlich werden wir die Herleitung im anhand eines
weiteren Schätzproblems wiederholen.
Entscheidend ist, dass die Idee, die hinter dem Konfidenzintervall steht, verinnerlicht
wurde. Um dies zu erleichtern, werden wir im Folgenden noch einige Eigenschaften des
Konfidenzintervalls für
untersuchen.
Simulation Konfidenzniveau
Wir wollen eine Simulation anstellen: Es werden Stichproben vom Umfang aus der
Normalverteilung erzeugt und jeweils und das zugehörige Konfidenzintervall für zum
Konfidenzniveau und bestimmt.
Vergleich von je k=100 Konfidenzintervallen zum Konfidenzniveau 95% bzw. 99%; n=10, Stichproben aus N(50, 10^2)
5%
Page 10
Konfidenzniveau
(
)
tatsächlicheÜberdeckung
95%
95%
Breite
12.40
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
1%
99%
98%
16.29
Das Konfidenzniveau wird bereits bei Wiederholungen recht stabil eingehalten. Die
Intervalle werden offensichtlich breiter, wenn ein höheres Konfidenzniveau (also mehr
Sicherheit) gewählt wird.
Die Simulation ( f0e.spf ) können Sie im Statistiklabor nachvollziehen und
modifizieren.
Allgemeine Formel für die Breite des Konfidenzintervalls
Die Breite des Konfidenzintervalls erhält man, indem man die Differenz aus oberer
Grenze () und unterer Grenze () bildet:
Die Breite des Konfidenzintervalls ist ein Maß dafür, mit welcher Präzision erfasst
wird. Je breiter das Konfidenzintervall ist, desto unpräziser ist die Schätzung. Man
erkennt sofort, dass die Breite von drei Größen abhängt:
- von der Standardabweichung ,
- von bzw. dem Konfidenzniveau
- vom Stichprobenumfang
,
.
Den Einfluss dieser Größen auf die Breite des Konfidenzintervalls (bzw. die Präzision
der Schätzung) werden wir im Folgenden genauer untersuchen.
Zusammenhang zwischen Standardabweichung und Präzision
Aus der Formel für die Breite ist der Zusammenhang leicht ersichtlich: Je größer , d.h.
je mehr die Werte streuen, desto breiter ist das Konfidenzintervall, um so geringer also
die Präzision, mit der erfasst wird. Der Zusammenhang ist linear.
Zusammenhang zwischen Standardabweichung und Breite des Konfidenzintervalls (n=10, Konfidenzniveau 95%)
Der Grund dafür ist, dass die Schätzung in einer eher homogenen Grundgesamtheit
(geringe Standardabweichung ) genauer erfolgen kann als in einer Grundgesamtheit, in
der die Ausprägungen des untersuchten Merkmals stark variieren. So ließe sich z.B. die
tägliche Ausbringungsmenge einer Maschine mit hoher Präzision schätzen, wenn sie
nur minimalen Schwankungen unterliegt. Variiert die Ausbringungsmenge dagegen
stark, so wird das Konfidenzintervall breiter (die Schätzung wird unpräziser).
Zusammenhang zwischen Konfidenzniveau und Präzision
In der Formel für die Breite,
,
spiegelt sich das gewählte Konfidenzniveau im Quantil der Standardnormalverteilung
Page 11
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
wieder. Den Zusammenhang verdeutlicht die Tabelle.
0.9
0.95
1.64
0.95
0.975
1.96
0.99
0.995
2.58
Je höher das Konfidenzniveau (Sicherheit der Schätzaussage) gewählt wird, desto
größer ist das entsprechende Quantil der Standardnormalverteilung. Die Abbildung
zeigt den Zusammenhang zwischen Konfidenzniveau und Breite des
Konfidenzintervalls.
Zusammenhang zwischen Konfidenzniveau und Breite des Konfidenzintervalls (n=10, Sigma=1)
Mit wachsendem wächst , so dass sich das Konfidenzintervall mit wachsendem
Konfidenzniveau verbreitert: Wer eine sicherere Aussage machen will, muss sich mit
einer unpräziseren Aussage zufrieden geben, und umgekehrt. Die Sicherheit der
Aussage und die Präzision der Aussage stehen also im Widerspruch zueinander!
Diesmal ist der Zusammenhang aber nicht linear: Während die Präzision der Schätzung
mit wachsendem Konfidenzniveau anfangs nur leicht abnimmt, muss man für das letzte
"Quäntchen" Sicherheit einen überproportionalen Verlust an Präzision hinnehmen. Zur
Erinnerung : Das Konfidenzniveau muss immer kleiner als 100% gewählt werden,
sonst überdeckt das Konfidenzintervall den gesamten Parameterraum und verliert damit
jegliche Aussagekraft. In der Praxis ist ein Konfidenzniveau von 95% oder 99% üblich.
Zusammenhang zwischen Stichprobenumfang und Präzision
Aus der Formel für die Breite des Konfidenzintervalls,
,
ist der Zusammenhang leicht ersichtlich: Je größer der Stichprobenumfang
, desto schmaler das Konfidenzintervall und
umgekehrt; allerdings steht im Nenner unter einer Wurzel, d.h. erst eine Vervierfachung
des Stichprobenumfangs führt zu einer Halbierung der Breite des Konfidenzintervalls
(vgl. Abbildung).
Zusammenhang zwischen Stichprobenumfang und Breite des Konfidenzintervalls (Sigma=1, Konfidenzniveau 95%)
Mit wachsendem Stichprobenumfang wird die Präzision der Konfidenzschätzung des
unbekannten Parameterwertes immer größer. Im Grenzfall tendiert die Breite des
Konfidenzintervalls gegen 0; der aus der immer größer werdenden Stichprobe
gewonnene Schätzwert wird dann dem unbekannten Parameterwert
der
Page 12
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
Grundgesamtheit gleich. Diesem Zusammenhang kommt in der Praxis eine zentrale
Bedeutung zu:
Die Standardabweichung ist eine Eigenschaft der Untersuchungseinheiten bzw. des
Zufallsvorgangs insgesamt und lässt sich vom Forscher nicht beeinflussen. Die
Sicherheit der Schätzung (also das Konfidenzniveau) ist ebenfalls meist vorgegeben
(z.B. durch den Auftraggeber einer Untersuchung); genauso verhält es sich häufig mit
der Präzision der Schätzung. Schließlich wäre z.B. eine Wahlhochrechung mit einer
Präzision von für eine Partei schlichtweg wertlos. Eine adäquate Wahl des
Stichprobenumfangs ist i.d.R. die einzige Möglichkeit, die Anforderungen an Sicherheit
der Schätzaussage und deren Präzision in Einklang zu bringen.
Die Wahl des Stichprobenumfangs unterliegt in der Praxis jedoch diversen
Restriktionen: Je größer der Stichprobenumfang, desto kosten- und aufwandsintensiver
wird die Erhebung; ggf. können auch zeitliche Restriktionen eine Rolle spielen.
Das Applet
Breite des Konfidenzintervalls für MY (I1002.jar)
ermöglicht einen Überblick über die hier untersuchten Zusammenhänge:
Es wird davon ausgegangen, dass die in einem Intelligenztest erreichten Punkte
normalverteilt sind. Für den Parameter
der Normalverteilung soll in der
Aufgabe Intelligenztest ( I1014.zmpf ) im Statistiklabor ein Konfidenzintervall
bestimmt werden.
Bestimmung des Stichprobenumfangs bei vorgegebener Präzision
Gibt es eine Möglichkeit, sowohl eine hohe Sicherheit (hohes Konfidenzniveau) als
auch eine gute Präzision (schmales Konfidenzintervall) zu bekommen? Oder anders
gefragt, kann man bei vorgegebenem Konfidenzniveau
ein
Konfidenzintervall mit vorgegebener Breite
bekommen?
Wir setzen
.
Da vorgegeben ist und
als Maß für die Streuung von von uns nicht beeinflusst
werden kann, bleibt eine Festlegung des Stichprobenumfangs
so, dass ist. Durch
einige Umformungen ergibt sich
.
Beispiel: Körpergröße
Aus Erfahrung ist bekannt, dass die Körpergröße (in cm) von männlichen Studierenden
normalverteilt ist mit cm. Der Erwartungswert der Körpergröße soll mit einem
Konfidenzintervall (Konfidenzniveau ) der Breite erfasst werden. Welcher
Stichprobenumfang ist erforderlich?
Mit ergibt sich
Page 13
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
.
Da nur ganzzahlig sein kann, ist der kleinste Stichprobenumfang, der den
Anforderungen an Konfidenzniveau und Präzision gerecht wird.
In einem Abfüllwerk werden täglich viele hundert Flaschen Bier abgefüllt. Die
Werksleitung will überprüfen, ob die tatsächliche Abfüllmenge den geforderten 0,33
Litern entspricht. Für die Konfidenzschätzung ist die Präzision von der Geschäftsleitung
vorgegeben worden. Bestimmen Sie in der Aufgabe Abfüllmenge ( I107b.zmpf ) im
Statistiklabor den zur Einhaltung dieser Forderung mindestens benötigten
Stichprobenumfang.
Punktschätzer treffen den wahren Parameterwert in den seltensten Fällen exakt - bei
konsistenten Schätzern erwarten wir allerdings, dass sich die Schätzwerte bei
wiederholter Schätzung nah um das wahre scharen.
Bei der Intervallschätzung wird ein Unsicherheitsintervall um den Punktschätzwert
gelegt, das als Schätzung angegeben wird. Dieses Intervall heißt Konfidenzintervall und
wird so konstruiert, dass es mit der Wahrscheinlichkeit von überdeckt. wird
Konfidenzniveau genannt und ist ein Maß dafür, wie sicher die gemachten
Schätzaussagen sind. Wir haben ein solches Konfidenzintervall in diesem Modul für
den Parameter der Normalverteilung hergeleitet und die Eigenschaften des
Konfidenzintervalls eingehend untersucht. Wir halten fest, dass...
- das Konfidenzintervall umso breiter ist, je größer die Standardabweichung ist,
- das Konfidenzintervall breiter wird, wenn das Konfidenzniveau (Sicherheit der
Schätzung) erhöht wird,
- das Konfidenzintervall schmaler wird, wenn der Stichprobenumfang vergrößert wird.
Die Breite des Konfidenzintervalls beschreibt die Präzision der Schätzung; ein schmales
Intervall bedeutet eine präzise Schätzung. Leider stehen Präzision der Schätzung und
Sicherheit der Aussage (also Konfidenzniveau) in einem Konflikt zueinander. Höhere
Sicherheit geht (bei gleichem Stichprobenumfang) immer zu Lasten der Präzision und
umgekehrt.
Die Präzision der Schätzung lässt sich aber durch eine Erhöhung des
Stichprobenumfangs steigern, so dass bei vorgegebenem Konfidenzniveau nahezu jede
gewünschte Präzision durch Wahl eines entsprechend großen Stichprobenumfangs
realisiert werden kann.
Die Interpretation des Konfidenzintervalls wurde ebenfalls thematisiert: Solange keine
konkreten Stichprobenwerte eingesetzt werden, gilt die Wahrscheinlichkeitsaussage .
Sobald für aber konkrete Werte eingesetzt werden, gilt diese
Wahrscheinlichkeitsaussage nicht mehr. Wir erhalten dann ein sog. realisiertes
Konfidenzintervall mit festen Grenzen - dieses überdeckt das unbekannte (aber feste)
oder es überdeckt es nicht.
Als wesentliche Einschränkung ist zu vermerken, dass wir als bekannt voraussetzen,
was in der Praxis jedoch unrealistisch ist. Dieses Voraussetzung wird im aufgehoben.
KonfidenzintervallErklärungKonfidenzintervall für
MyErklärungKonfidenzniveauErklärungSchwankungsintervall
ErklärungPräzision einer SchätzungErklärung
(c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme
Page 14
(c) Projekt Neue Statistik 2003 - Lernmodul: Konfidenzintervall für My - Sigma bekannt
Kontakt: http://www.neuestatistik.de
Page 15
Herunterladen