STOCHASTIK Testen von Hypothesen e Teil 1 d.d Grundlagen der Signifikanztests ath e-c Hier: Berechnungen mit Binomialverteilung ww w.m Datei Nr. 35010 MO für Stand: 9. November 2013 DE FRIEDRICH W. BUCKEL INTERNETBIBLIOTHEK FÜR SCHULMATHEMATIK www.mathe-cd.de 35010 Testverfahren 1 2 Vorwort Testen von Hypothesen gehört zur Beurteilenden Statistik. Ich zeige hier, wie man die vier wichtigen Fälle behandelt, und welche grundlegenden Fragestellungen es dazu gibt. Es wurde auch noch ein Abschnitt angefügt, in dem Intervalle des Erwartungswertes als Annahmebereich einer Hypothese verwendet werden. Dazu benötigt man aber oft Tabellen. Ein Problem für diesen Text sind die unterschiedlichen Fähigkeiten der benötigten Rechner. Ich biete daher oftmals mehrere Erklärungen dazu an. d.d e Grundkenntnisse über die Binomialverteilung werden vorausgesetzt. (Texte 34010 ff.) Einführung §2 Der Alternativtest Einführungsbeispiel 2.2 Beispiel eines medizinischen Tests (Kurzlösung) 2.3 Konstruktion einer Entscheidungsregel durch Minimierung der 3 5 5 14 Summe der Irrtumswahrscheinlichkeiten 15 Veranschaulichung der Entscheidungsregel 18 19 2.1 Linksseitige Signifikanztests 19 2.2 Rechtsseitige Signifikanztests 26 MO für Einseitige Signifikanztests Teetassentest 30 §3 Zweiseitige Signifikanztests 32 Signifikanztest mit zu E symmetrischem Annahmebereich 42 §4 DE 2.3 Friedrich Buckel ww 2.1 2.4 §2 w.m §1 ath Inhalt e-c Dieser Text wurde im November 2013 völlig überarbeitet! Signifikanztests mit Konfidenzintervallen 43 www.mathe-cd.de 35010 Testverfahren 1 3 § 1 Einführung Bei dieser Thematik geht es darum, Annahmen oder Behauptungen durch einen Test zu bestätigen oder zu widerlegen. Beispiele: a) Ein Medikament gegen Bluthochdruckt wirkt bei mindestens 60% der an Bluthochdruck erkrankten Personen. b) In einer Koste mit Glaskugeln beträgt der Anteil der roten Kugeln entweder 25% oder 40%. Der Anteil der defekten Schrauben in einer Kiste beträgt höchstens 5%. d) Der Spielautomat liefert mit genau 50% Wahrscheinlichkeit Gewinnspiele. d.d e c) Da eine totale Kontrolle aller Patienten / Glaskugeln / Schrauben / Gewinnspiele nicht realisierbar bzw. e-c zu kostenintensiv ist, führt man immer einen Test durch. Dazu wählt man eine Stichprobe aus und zählt dabei die „Objekte“, welche die Behauptung bestätigen (bzw. widerlegen). ath Das Testergebnis wird immer vom Zufall gesteuert. Das sei am Beispiel b) kurz gezeigt: Wenn in einer Kiste mit Glaskugeln 40% rote sind, und wir greifen rein zufällig (also blind) 200 w.m Kugeln heraus (das nennt man den Umfang n = 200 der Stichprobe), dann kann man erwarten, dass 40% davon rot sind, also 80. Diese Zahl nennt man den Erwartungswert. Man berechnet ihn durch die Formel: E n p 200 0,4 80 . ww 80 rote Kugeln unter 200 zu finden, ist natürlich reine Spekulation, denn wir können zufälligerweise auch 95 rote finden, oder aber auch nur 70, je nachdem, wie wir die 200 Kugeln auswählen. Dies kann man mathematisch untersuchen, denn bei diesem Ziehen aus der Kiste treten rote Kugeln für mit der konstante Wahrscheinlichkeit p 0,4 auf. Daher stellt das Ziehen von 200 Kugeln eine Bernoulli-Kette dar. Die Wahrscheinlichkeit der einzelnen Ergebnisse wird daher mit der Binomial- MO verteilung berechnet. Rechnen wir also nach. Es sei X die Anzahl der roten Kugeln unter 200 gezogenen mit prot = 0,4. Mit welcher Wahrscheinlichkeit findet man genau 80 rote Kugeln? P X 80 0,0575 6% b) genau 95 rote Kugeln? P X 95 0,0056 0,6% c) genau 70 rote Kugeln? P X 70 0,0205 2% DE a) Daraus erkennt man, dass man rein zufällig mehr als 80 rote Kugeln finden kann, aber auch weniger. Annahme oder Ablehnung? Weicht die Anzahl der gesuchten Objekte deutlich (die Mathematiker sagen „signifikant“) vom Erwartungswert ab, dann wird man die Annahme (die Nullhypothese) ablehnen bzw. verwerfen, d.h. man wird der Behauptung nicht glauben, dass 40% der Kugeln rot sind. Friedrich Buckel www.mathe-cd.de 35010 Testverfahren 1 4 Diese zufälligen Schwankungen bringen es nun aber mit sich, dass dabei Fehler passieren können Dazu vergleichen wir die Realität mit dem Testergebnis: (In der Abbildung bedeuten G = gute Lieferung, G schlechte Lieferung) (1) Realität Wenn Realität und Testergebnis übereinstimmen, G G ist alles in Ordnung. Die Hypothese trifft nicht zu, und wir finden das Liefert der Test jedoch zufällig ein falsches Ergebnis Fehler 1. Art Übereinstimmung Versehentliche Ablehnung e-c dann passiert ein Fehler. Davon gibt es zweierlei Arten: Versehentliche Annahme d.d G durch das Testergebnis heraus. Fehler 2. Art e Test ergebnis Die Hypothese trifft zu, der Test bestätigt es. (2) Übereinstimmung G Das kann in zwei Fällen passieren: Beim Fehler 1. Art lehnt man die Nullhypothese versehentlich ab. ath (Z. B. wenn man in einer guten Lieferung Schrauben zufällig zu viele defekte findet usw.) w.m Beim Fehler 2. Art nimmt man die Nullhypothese als glaubhaft an, obwohl sie in Wirklichkeit nicht zutrifft. (Z. B. wenn das Medikament gegen Bluthochdruck doch nicht so wirksam ist wie ww behauptet, aber das Testergebnis uns zufällig viele positive Wirkungen präsentiert.) In den Aufgabe soll man entweder die Güte eines Tests danach zu beurteilen, wie hoch diese beiden für Fehler sind, oder man soll ein Entscheidungskriterium für einen Test so festlegen dass der Fehler 1. Art nicht zu groß wird. MO Dabei kommt es zu interessanten Überlegungen, denn der Verkäufer hat andere Erwartungen an ein DE Testergebnis als der Kunde. Im Folgenden werden die vier möglichen Testverfahren besprochen. Dabei gehe ich besonders ausführlich auf den Einsatz der beiden CAS-Rechner CASIO ClassPad und TI Nspire ein. Friedrich Buckel www.mathe-cd.de 35010 Testverfahren 1 5 § 2 Der Alternativtest 2.1 Einführungsbeispiel Ein Händler hat zwei Sorten mit Schrauben vorliegen. Eine Sorte ist von der Qualitätsstufe 1, was bedeutet, dass nur 10% der enthaltenen Schrauben die vorgeschriebene Messgenauigkeit nicht einhalten. Die Sorte enthält jedoch 40% Ausschuss, ist also von 2. Wahl und daher billiger. Da die Aufkleber für die Kisten fehlen, weiß der Händler nicht, welche Kiste welche Sorte enthält. e Die sicherste Methode wäre natürlich die, alle Schrauben zu untersuchen. Dies ist aber zu aufwändig d.d und verursacht viele Kosten. Um Zeit und Geld zu sparen beschließt er daher, einen Test durchzuführen. Dazu entnimmt er von einer Kiste eine Stichprobe von (nur) 10 Schrauben und prüft e-c sie. Auf Grund des Ergebnisses will er dann entscheiden. Man erkennt sofort die Problematik: Hier ist der Zufall im Spiel. Daher können vier Fälle eintreten: Die untersuchte Kiste enthält Schrauben der Qualität 1. ath 1. Fall: Dies kann der Test bestätigen und der Händler weiß Bescheid. Die Kiste enthält Schrauben der Qualität 1. Aber zufällig ist der Anteil der defekten w.m 2. Fall: Schrauben in der Stichprobe auffällig hoch, so dass der Händler eine Fehlentscheidung 3. Fall: ww trifft und die Kiste als 2. Wahl einstuft. Das ist der Fehler 1. Art. Die Kiste enthält Schrauben der Qualität 2. Dies kann der Test bestätigen, und der Händler weiß Bescheid. Die Kiste enthält Schrauben der Qualität 2. Der Test liefert aber zufällig einen auffällig für 4. Fall: geringen Anteil an defekten Schrauben, so dass der Händler sie für Qualität 1 hält. MO Er wird daraufhin eine Fehlentscheidung treffen, das ist der Fehler 2. Art. DE In diesem Beispiel soll der Test eine Entscheidung zwischen genau 2 Möglichkeiten liefern. Daher nennt man den Test einen Alternativtest. Friedrich Buckel www.mathe-cd.de 35010 Testverfahren 1 6 Mathematisches Vorgehen bei der Testbeurteilung 1. Testumfang: Das ist die Anzahl der getesteten Objekte, hier n = 10. 2. Zufallsvariable: X sei die Anzahl der im Test gefundenen defekten Schrauben. 3. Berechnungsmethode Im Experiment wird zwar ohne Zurücklegen gezogen, dennoch gilt (aus Produktionsgründen) für jede Schraube dieselbe Wahrscheinlichkeit, defekt zu sein. Daher berechnet man der Wahrscheinlichkeiten für die Werte von X mit der Binomialverteilung. 4. d.d e Man schreibt dies so auf: X ist binomial verteilt. Zu jeder Zufallsvariablen gehört ein Definitionsbereich. Die beiden Hypothesen unseres Alternativtests lauten: ath 5. e-c ,….. ww Entscheidungskriterium für den Test DE MO für 6. w.m …….. Friedrich Buckel www.mathe-cd.de 35010 Aufgabe 1: Testverfahren 1 7 Überprüfe ob die Annahmebereiche günstig gesetzt worden sind. DE MO für ww w.m ath e-c d.d e Fortsetzung auf der Mathe-CD Friedrich Buckel www.mathe-cd.de