Regionaler Arbeitskreis Mathematik Kursstufe Testen von Hypothesen Äpfel kommen vom Großmarkt in Kisten zu 20 Stück, wobei versichert wird, dass ≤ 5% der Äpfel faulig sind. Der Händler greift zufällig eine Kiste heraus und zählt die angefaulten Äpfel darin. - Denke die Fälle durch. X: Anzahl der fauligen Äpfel unter 20, (p = 0,05) Berechne P(X ≥ 3) = 1 – P(X ≤ 2) = 0,075 = 7,5% Das bedeutet: mehr als 2 faulige Äpfel können auch unter der Voraussetzung „ < 5% “ vorkommen, aber eben so, dass dieses bei häufiger Durchführung diese Vorgangs nur in 7,5 von 100 Fällen passiert. Wenn der Händler ab 3 fauligen die Sendung ablehnt, dann irrt er sich in 7,5% aller Fälle. SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Dasselbe in formaler Darstellung: das obige Beispiel ist ein rechtsseitiger Signifikanztest. Es muss entschieden werden, ob die Großhändler-Behauptung p ≤ 0,05 (»höchstens 5% sind faulig«) akzeptiert werden kann. Wenn ein begründeter Verdacht dagegen spricht, wird man sagen: p > 0,05. Nullhypothese Ho: p ≤ 0,05 Gegenhypothese H1 : p > 0,05 Wählt man (s.o.) den Ablehnungsbereich {3,4,....,20}, dann besteht allerdings die Möglichkeit, dass bei einer Faule-ÄpfelAnzahl von 3 oder mehr Ho abgelehnt wird, obwohl Ho richtig ist – das nennt man α-Fehler (oder Fehler 1.Art). Die Wahrscheinlichkeit gegen Ho zu entscheiden, obwohl Ho zutrifft, nennt man α-Risiko oder Irrtumswahrscheinlichkeit. SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Ein weiteres Beispiel: Glühbirnenhersteller sagt: höchstens 4% einer Glühbirnensorte brennen weniger als 1500 Stunden lang. Man entnimmt 100 Glühbirnen. Neun davon brannten weniger als 1500 Stunden. Kann man daraus bei einer Irrtumswahrscheinlichkeit von 5% (gegeben!) schließen, dass die Herstellerangaben nicht zutreffen? Ho : p ≤ 0,04; H1 : p > 0,04; X zählt ..... N = 100, p =0,04 Gesucht ist derjenige X-Wert k, für den zum ersten Mal gilt: P(X ≥ k) ≤ 0,051 – P(X ≤ k-1) ≤ 0,05 P(X ≤ k-1) ≥ 0,95 k-1 ist 7 und k ist 8. Bei 8 beginnt der Ablehnungsbereich! SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Tier-Medikament – es wird gesagt, dass mindestens 70% geheilt werden. Die Stichprobe mit 20 behandelten Tieren ergibt 12 Heilungen. (5% Irrtumswahrscheinlichkeit) Wo liegt der Ablehnungsbereich? linkssseitiger Test Ho : p ≥ 0,7; H1 : p < 0,7; X zählt ..... N = 20, p =0,7 Bis zu welchem k gilt P(X ≤ k) ≤ 0,05 ? Der Ablehnungsbereich ist {0,1,.....,10}. SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Es wird behauptet, dass in einer Bevölkerung 10% Blutgruppe B haben. Teste, ob das zutrifft! – Diesmal besteht kein Verdacht in eine bestimmte Richtung! Teile die Irrtumswahrscheinlichkeit so auf, dass zwei Bereiche mit zusammen 5% Wahrscheinlichkeit entstehen. zweiseitiger Test Ho : p = 0,1; H1 : p ≠ 0,1; X zählt ..... , N = 100, p =0,1 Bis zu welchem k gilt P(X ≤ k) ≤ 0,025, und ab welchem gilt P(X ≥ k) ≤ 0,025 ? Linke Hälfte des Ablehnungsbereichs {0,...,4} Fortsetzung SD A.Kolb Ho Regionaler Arbeitskreis Mathematik Kursstufe P(X ≥ k) ≤ 0,0251 – P(X ≤ k-1) ≤ 0,025 P(X ≤ k-1) ≥ 0,975 das gilt für k-1= 16, also ist k = 17 Rechte Hälfte des Ablehnungsbereichs {17,...,100} Ablehnungsbereich {0,...,4}{17,...100} SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Fehler 2.Art (β-Fehler): Ho wird angenommen, obwohl H1 richtig ist – d.h. aber, dass nun die Wahrscheinlichkeit p, mit der man rechnet nicht mehr diejenige von Ho sein kann – es muss eine neue Wahrscheinlichkeit p gegeben sein. Beispiel: Höchstens 2% aller abgefüllten Mehltüten enthalten weniger als 1 kg Mehl – Test: n=150, p = 0,02, rechtsstg., 5% Es ergibt sich der Ablehnungsbereich {7;8;....;150} Mit welcher W. ist man weiter der Meinung, dass höchstens 2% ....< 1 kg, obwohl sich dieser Anteil auf 6% erhöht hat? Das ist die Wahrscheinlichkeit für den Annahmebereich unter der neuen Voraussetzung 0,06 – also: P(X ≤ 6) für n = 150, p = 0,06 – Ergebnis: 0,1984 SD A.Kolb Regionaler Arbeitskreis Mathematik Varianz Kursstufe Häufigkeitsverteilung von 2 Maschinen (= Zufallsvariable X ) bei gemeinsamem Mittelwert (=Erwartungswert E(X) ) 10. Maß für die Streuung:Die Summe der quadratischen Differenzen zwischen xi und E(X), die mit ihrer relativen Häufigkeit (= Wahrscheinlichkeit) gewichtet sind – genannt: VARIANZ V(X) = (k1 – E(X))2P(X = k1) + (k2 – E(X))2P(X = k2) + .... SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Eine Zufallsvariable X, die zu einer Bernoullikette gehört, hat den Erwartungswert np und die VARIANZ Denn: zur Kettenlänge 1 gehört X1 mit x1 = 1, x2 = 0, E(X) = p P(X1 = 1) = p, P(X = 0) = 1- p V(X1) = (1 - p)2 p + (0-p) 2 (1- p) = p – 2p2 + p3 + p2 - p3 = p - p2 = p(1- p) = pq Wenn die Kettenlänge n ist, dann wird daraus V(X) = npq ( mit q = 1 – p ) STANDARDABWEICHUNG: SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Um das Verhalten von Binomialverteilungen für n ∞ zu untersuchen (hier für p = 1/2 dargestellt), werden die xiWerte in ihrer relativen Lage zum Erwartungswert E(X) betrachtet. Erinnerung: k entspricht xi - Glockenform, - wird flacher und breiter, - wandert nach rechts SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Nur relativ wenige Werte nahe beim Erwartungswert np = 32 sind überhaupt »sichtbar«. Sie bestimmen die Breite der Glockenform - hier ist σ = 4 (und σ wächst auch mit n) 0,4 0,3 0,2 Histogramm Binomialv erteilung 64; 0,5 0,1 0 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 Nun erfolgt eine Transformation dieser Darstellung, um diese Formveränderungen aufzuheben. Es erfolgt eine Standardisierung. SD A.Kolb 9 Regionaler Arbeitskreis Mathematik 0,5 standardisierte 64;0,5-Verteilung 0,4 0,4 0,3 0,3 0,2 0,2 Kursstufe Die standardisierte Verteilung soll ihr Maximum bei x = 0 haben und sie soll in x-Richtung um den Faktor σ gestaucht werden, d.h. die Rechtecksbreite wird durch σ dividiert. Als Ausgleich dafür werden die Funktionswerte ver-σ-facht. Dann ergeben alle Rechtecke zusammen wieder Fläche 1. Histogramm Binomialv erteilung 64; 0,5 0,1 0,1 0 0 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 -3 -2 -1 0 1 2 3 SD A.Kolb Zur Erklärung nochmal: Ein Histogramm-Rechteck hat die Höhe P(X = k), also hat auch seine Fläche diesen Wert, denn die Breite ist 1. Die Summe aller P(X = k) ist 1 , also ist die Gesamtfläche 1 – diese Eigenschaft bleibt also erhalten. Regionaler Arbeitskreis Mathematik Die Transformationsgleichungen: Es gibt eine von Carl Friedrich Gauss (1777-1855) gefundene Funktion, die die oberen Rechteckmitten verbindet. SD A.Kolb Kursstufe Regionaler Arbeitskreis Mathematik Kursstufe Die Näherung gilt als brauchbar, wenn σ > 3 oder wenn σ > 2 und gleichzeitig np > 4. Andere Regel: npq > 9 Aus der Summe einzelner Wahrscheinlichkeiten wurde nun eine FLÄCHE. Für eine Intervallwahrscheinlichkeit gilt nun: SD A.Kolb Noch genauer wäre es, k1 durch k1 – 0,5 und k2 durch k2 + 0,5 zu ersetzen – siehe Bedeutung von x1/2. Regionaler Arbeitskreis Mathematik Kursstufe Umgang mit diesem Integral: Diejenige Integralfunktion Φ der DICHTEFUNKTION φ, die die untere Grenze -∞ hat, heißt VERTEILUNGSFUNKTION. SD A.Kolb Regionaler Arbeitskreis Mathematik Beispiele: SD A.Kolb Kursstufe im GTR bei 2nd DISTR - 2 Regionaler Arbeitskreis Mathematik Intervallwahrscheinlichkeit: SD A.Kolb Kursstufe Regionaler Arbeitskreis Mathematik SD A.Kolb Kursstufe Regionaler Arbeitskreis Mathematik Kursstufe Fragestellung: Finde ein möglichst kleines Intervall um E(X) herum, in dem die X-Werte mit 95% Wahrscheinlichkeit zu finden sind. X sei binomialverteilt mit n = 300, p = 0,5 SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Φ(x) erlaubt also ein näherungsweises Vorgehen bei der diskreten Binomialverteilung. Es gibt andere Zufallsvariable, die sich auch mit Φ(x) beschrieben lassen – z.B. n Würfel werfen, s.u. n = 1 – 2 – 3 Der »zentrale Grenzwertsatz« sagt über solch eine Summe: SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Die »normalverteilte« Zufallsvariable X – eine stetige Verteilung. N(E(X), σ)-verteilt - schreibe auch μ für E(X), also N(μ,σ) – verteilt Beispiel: Frau Schnell fährt mit dem Auto zur Arbeit. Die Zeit X ist normalverteilt mit N(20min, 4min). Die Wahrscheinlichkeit dafür, exakt z.B. 25 Minuten Zeit zu benötigen ist 0. Deshalb sind die Ordinaten von φ keine Wahrscheinlichkeiten, sondern Wahrscheinlichkeitsdichten. ist die Dichtefunktion. Φ ist die Verteilungsfunktion. SD A.Kolb φ Regionaler Arbeitskreis Mathematik Kursstufe blau: standardisierte Dichtefunktion; rot:Dichtefunktion der Zeitverteilung X SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe Weiter: Wie groß ist die Wahrscheinlichkeit, dass Frau Schnell höchstens 25 Minuten braucht? Weiter: Wie groß ist die Wahrscheinlichkeit, dass Frau Schnell um höchstens 2 Minuten vom Durchschnittswert abweicht? SD A.Kolb Regionaler Arbeitskreis Mathematik Kursstufe An eine explizite Normalverteilungs-Aufgabenstellung in der Abiturprüfung ist nicht gedacht, aber an Eigenschaften einer stetigen Verteilung: Eine Funktion f heißt Dichtefunktion, wenn gilt Man spricht von einer stetigen Zufallsvariablen X, wenn es eine Funktion f gibt, so dass die Verteilungsfunktion F von x die Form hat: SD A.Kolb Regionaler Arbeitskreis Mathematik Danke für Ihr Interesse! SD A.Kolb