35010 - Mathe-CD

Werbung
STOCHASTIK
Testen von Hypothesen
e
Teil 1
d.d
Grundlagen der Signifikanztests
ath
e-c
Hier: Berechnungen mit Binomialverteilung
ww
w.m
Datei Nr. 35010
MO
für
Stand: 9. November 2013
DE
FRIEDRICH W. BUCKEL
INTERNETBIBLIOTHEK FÜR SCHULMATHEMATIK
www.mathe-cd.de
35010
Testverfahren 1
2
Vorwort
Testen von Hypothesen gehört zur Beurteilenden Statistik. Ich zeige hier, wie man die vier
wichtigen Fälle behandelt, und welche grundlegenden Fragestellungen es dazu gibt.
Es wurde auch noch ein Abschnitt angefügt, in dem   Intervalle des Erwartungswertes
als Annahmebereich einer Hypothese verwendet werden. Dazu benötigt man aber oft Tabellen.
Ein Problem für diesen Text sind die unterschiedlichen Fähigkeiten der benötigten Rechner.
Ich biete daher oftmals mehrere Erklärungen dazu an.
d.d
e
Grundkenntnisse über die Binomialverteilung werden vorausgesetzt. (Texte 34010 ff.)
Einführung
§2
Der Alternativtest
Einführungsbeispiel
2.2
Beispiel eines medizinischen Tests (Kurzlösung)
2.3
Konstruktion einer Entscheidungsregel durch Minimierung der
3
5
5
14
Summe der Irrtumswahrscheinlichkeiten
15
Veranschaulichung der Entscheidungsregel
18
19
2.1
Linksseitige Signifikanztests
19
2.2
Rechtsseitige Signifikanztests
26
MO
für
Einseitige Signifikanztests
Teetassentest
30
§3
Zweiseitige Signifikanztests
32
Signifikanztest mit zu E symmetrischem Annahmebereich
42
§4
DE
2.3
Friedrich Buckel
ww
2.1
2.4
§2
w.m
§1
ath
Inhalt
e-c
Dieser Text wurde im November 2013 völlig überarbeitet!
Signifikanztests mit Konfidenzintervallen
43
www.mathe-cd.de
35010
Testverfahren 1
3
§ 1 Einführung
Bei dieser Thematik geht es darum, Annahmen oder Behauptungen durch einen Test zu bestätigen
oder zu widerlegen.
Beispiele:
a)
Ein Medikament gegen Bluthochdruckt wirkt bei mindestens 60% der an Bluthochdruck
erkrankten Personen.
b)
In einer Koste mit Glaskugeln beträgt der Anteil der roten Kugeln entweder 25% oder
40%.
Der Anteil der defekten Schrauben in einer Kiste beträgt höchstens 5%.
d)
Der Spielautomat liefert mit genau 50% Wahrscheinlichkeit Gewinnspiele.
d.d
e
c)
Da eine totale Kontrolle aller Patienten / Glaskugeln / Schrauben / Gewinnspiele nicht realisierbar bzw.
e-c
zu kostenintensiv ist, führt man immer einen Test durch. Dazu wählt man eine Stichprobe aus und
zählt dabei die „Objekte“, welche die Behauptung bestätigen (bzw. widerlegen).
ath
Das Testergebnis wird immer vom Zufall gesteuert. Das sei am Beispiel b) kurz gezeigt:
Wenn in einer Kiste mit Glaskugeln 40% rote sind, und wir greifen rein zufällig (also blind) 200
w.m
Kugeln heraus (das nennt man den Umfang n = 200 der Stichprobe), dann kann man erwarten, dass
40% davon rot sind, also 80. Diese Zahl nennt man den Erwartungswert.
Man berechnet ihn durch die Formel: E  n  p  200  0,4  80 .
ww
80 rote Kugeln unter 200 zu finden, ist natürlich reine Spekulation, denn wir können zufälligerweise
auch 95 rote finden, oder aber auch nur 70, je nachdem, wie wir die 200 Kugeln auswählen.
Dies kann man mathematisch untersuchen, denn bei diesem Ziehen aus der Kiste treten rote Kugeln
für
mit der konstante Wahrscheinlichkeit p  0,4 auf. Daher stellt das Ziehen von 200 Kugeln eine
Bernoulli-Kette dar. Die Wahrscheinlichkeit der einzelnen Ergebnisse wird daher mit der Binomial-
MO
verteilung berechnet.
Rechnen wir also nach. Es sei X die Anzahl der roten Kugeln unter 200 gezogenen mit prot = 0,4.
Mit welcher Wahrscheinlichkeit findet man
genau 80 rote Kugeln?
P  X  80   0,0575  6%
b)
genau 95 rote Kugeln?
P  X  95   0,0056  0,6%
c)
genau 70 rote Kugeln?
P  X  70   0,0205  2%
DE
a)
Daraus erkennt man, dass man rein zufällig mehr als 80 rote Kugeln finden kann, aber auch weniger.
Annahme oder Ablehnung?
Weicht die Anzahl der gesuchten Objekte deutlich (die Mathematiker sagen „signifikant“) vom
Erwartungswert ab, dann wird man die Annahme (die Nullhypothese) ablehnen bzw. verwerfen, d.h.
man wird der Behauptung nicht glauben, dass 40% der Kugeln rot sind.
Friedrich Buckel
www.mathe-cd.de
35010
Testverfahren 1
4
Diese zufälligen Schwankungen bringen es nun aber mit sich, dass dabei Fehler passieren können
Dazu vergleichen wir die Realität mit dem Testergebnis:
(In der Abbildung bedeuten G = gute Lieferung, G  schlechte Lieferung)
(1)
Realität
Wenn Realität und Testergebnis übereinstimmen,
G
G
ist alles in Ordnung.
Die Hypothese trifft nicht zu, und wir finden das
Liefert der Test jedoch zufällig ein falsches Ergebnis
Fehler 1. Art
Übereinstimmung
Versehentliche
Ablehnung
e-c
dann passiert ein Fehler. Davon gibt es zweierlei Arten:
Versehentliche
Annahme
d.d
G
durch das Testergebnis heraus.
Fehler 2. Art
e
Test 
ergebnis
Die Hypothese trifft zu, der Test bestätigt es.
(2)
Übereinstimmung
G
Das kann in zwei Fällen passieren:
Beim Fehler 1. Art lehnt man die Nullhypothese versehentlich ab.
ath
(Z. B. wenn man in einer guten Lieferung Schrauben zufällig zu viele defekte
findet usw.)
w.m
Beim Fehler 2. Art nimmt man die Nullhypothese als glaubhaft an, obwohl sie in Wirklichkeit
nicht zutrifft.
(Z. B. wenn das Medikament gegen Bluthochdruck doch nicht so wirksam ist wie
ww
behauptet, aber das Testergebnis uns zufällig viele positive Wirkungen präsentiert.)
In den Aufgabe soll man entweder die Güte eines Tests danach zu beurteilen, wie hoch diese beiden
für
Fehler sind, oder man soll ein Entscheidungskriterium für einen Test so festlegen dass der Fehler 1.
Art nicht zu groß wird.
MO
Dabei kommt es zu interessanten Überlegungen, denn der Verkäufer hat andere Erwartungen an ein
DE
Testergebnis als der Kunde.
Im Folgenden werden die vier möglichen Testverfahren besprochen.
Dabei gehe ich besonders ausführlich auf den Einsatz der beiden CAS-Rechner CASIO ClassPad
und TI Nspire ein.
Friedrich Buckel
www.mathe-cd.de
35010
Testverfahren 1
5
§ 2 Der Alternativtest
2.1 Einführungsbeispiel
Ein Händler hat zwei Sorten mit Schrauben vorliegen. Eine Sorte ist von der Qualitätsstufe 1, was
bedeutet, dass nur 10% der enthaltenen Schrauben die vorgeschriebene Messgenauigkeit nicht
einhalten. Die Sorte enthält jedoch 40% Ausschuss, ist also von 2. Wahl und daher billiger. Da die
Aufkleber für die Kisten fehlen, weiß der Händler nicht, welche Kiste welche Sorte enthält.
e
Die sicherste Methode wäre natürlich die, alle Schrauben zu untersuchen. Dies ist aber zu aufwändig
d.d
und verursacht viele Kosten. Um Zeit und Geld zu sparen beschließt er daher, einen Test
durchzuführen. Dazu entnimmt er von einer Kiste eine Stichprobe von (nur) 10 Schrauben und prüft
e-c
sie. Auf Grund des Ergebnisses will er dann entscheiden.
Man erkennt sofort die Problematik: Hier ist der Zufall im Spiel. Daher können vier Fälle eintreten:
Die untersuchte Kiste enthält Schrauben der Qualität 1.
ath
1. Fall:
Dies kann der Test bestätigen und der Händler weiß Bescheid.
Die Kiste enthält Schrauben der Qualität 1. Aber zufällig ist der Anteil der defekten
w.m
2. Fall:
Schrauben in der Stichprobe auffällig hoch, so dass der Händler eine Fehlentscheidung
3. Fall:
ww
trifft und die Kiste als 2. Wahl einstuft. Das ist der Fehler 1. Art.
Die Kiste enthält Schrauben der Qualität 2.
Dies kann der Test bestätigen, und der Händler weiß Bescheid.
Die Kiste enthält Schrauben der Qualität 2. Der Test liefert aber zufällig einen auffällig
für
4. Fall:
geringen Anteil an defekten Schrauben, so dass der Händler sie für Qualität 1 hält.
MO
Er wird daraufhin eine Fehlentscheidung treffen, das ist der Fehler 2. Art.
DE
In diesem Beispiel soll der Test eine Entscheidung zwischen genau 2 Möglichkeiten liefern.
Daher nennt man den Test einen Alternativtest.
Friedrich Buckel
www.mathe-cd.de
35010
Testverfahren 1
6
Mathematisches Vorgehen bei der Testbeurteilung
1.
Testumfang:
Das ist die Anzahl der getesteten Objekte, hier n = 10.
2.
Zufallsvariable:
X sei die Anzahl der im Test gefundenen defekten Schrauben.
3.
Berechnungsmethode
Im Experiment wird zwar ohne Zurücklegen gezogen, dennoch gilt (aus Produktionsgründen) für
jede Schraube dieselbe Wahrscheinlichkeit, defekt zu sein. Daher berechnet man der
Wahrscheinlichkeiten für die Werte von X mit der Binomialverteilung.
4.
d.d
e
Man schreibt dies so auf: X ist binomial verteilt.
Zu jeder Zufallsvariablen gehört ein Definitionsbereich.
Die beiden Hypothesen unseres Alternativtests lauten:
ath
5.
e-c
,…..
ww
Entscheidungskriterium für den Test
DE
MO
für
6.
w.m
……..
Friedrich Buckel
www.mathe-cd.de
35010
Aufgabe 1:
Testverfahren 1
7
Überprüfe ob die Annahmebereiche günstig gesetzt worden sind.
DE
MO
für
ww
w.m
ath
e-c
d.d
e
Fortsetzung auf der Mathe-CD
Friedrich Buckel
www.mathe-cd.de
Herunterladen