PowerPoint-Präsentation

advertisement
Regionaler Arbeitskreis Mathematik
Kursstufe
Testen von Hypothesen
Äpfel kommen vom Großmarkt in Kisten zu 20 Stück, wobei
versichert wird, dass ≤ 5% der Äpfel faulig sind.
Der Händler greift zufällig eine Kiste heraus und zählt die
angefaulten Äpfel darin. - Denke die Fälle durch.
X: Anzahl der fauligen Äpfel unter 20, (p = 0,05)
Berechne P(X ≥ 3) = 1 – P(X ≤ 2) = 0,075 = 7,5%
Das bedeutet: mehr als 2 faulige Äpfel können auch unter der
Voraussetzung „ < 5% “ vorkommen, aber eben so, dass dieses
bei häufiger Durchführung diese Vorgangs nur in 7,5 von 100
Fällen passiert. Wenn der Händler ab 3 fauligen die Sendung
ablehnt, dann irrt er sich in 7,5% aller Fälle.
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Dasselbe in formaler Darstellung:
das obige Beispiel ist ein rechtsseitiger Signifikanztest.
Es muss entschieden werden, ob die Großhändler-Behauptung
p ≤ 0,05 (»höchstens 5% sind faulig«) akzeptiert werden kann.
Wenn ein begründeter Verdacht dagegen spricht, wird man
sagen: p > 0,05.
Nullhypothese Ho: p ≤ 0,05
Gegenhypothese H1 : p > 0,05
Wählt man (s.o.) den Ablehnungsbereich {3,4,....,20}, dann
besteht allerdings die Möglichkeit, dass bei einer Faule-ÄpfelAnzahl von 3 oder mehr Ho abgelehnt wird, obwohl Ho richtig
ist – das nennt man α-Fehler (oder Fehler 1.Art).
Die Wahrscheinlichkeit gegen Ho zu entscheiden, obwohl Ho
zutrifft, nennt man α-Risiko oder Irrtumswahrscheinlichkeit.
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Ein weiteres Beispiel: Glühbirnenhersteller sagt:
höchstens 4% einer Glühbirnensorte brennen weniger als
1500 Stunden lang. Man entnimmt 100 Glühbirnen. Neun
davon brannten weniger als 1500 Stunden. Kann man
daraus bei einer Irrtumswahrscheinlichkeit von 5%
(gegeben!) schließen, dass die Herstellerangaben nicht
zutreffen?
Ho : p ≤ 0,04; H1 : p > 0,04; X zählt ..... N = 100, p =0,04
Gesucht ist derjenige X-Wert k, für den zum ersten Mal gilt:
P(X ≥ k) ≤ 0,051 – P(X ≤ k-1) ≤ 0,05 P(X ≤ k-1) ≥ 0,95
k-1 ist 7 und k ist 8. Bei 8 beginnt der Ablehnungsbereich!
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Tier-Medikament – es wird gesagt, dass mindestens 70% geheilt
werden. Die Stichprobe mit 20 behandelten Tieren ergibt 12
Heilungen. (5% Irrtumswahrscheinlichkeit)
Wo liegt der Ablehnungsbereich?
linkssseitiger Test
Ho : p ≥ 0,7; H1 : p < 0,7; X zählt ..... N = 20, p =0,7
Bis zu welchem k gilt P(X ≤ k) ≤ 0,05 ?
Der Ablehnungsbereich ist
{0,1,.....,10}.
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Es wird behauptet, dass in einer Bevölkerung 10% Blutgruppe B
haben. Teste, ob das zutrifft! – Diesmal besteht kein Verdacht in
eine bestimmte Richtung! Teile die Irrtumswahrscheinlichkeit so
auf, dass zwei Bereiche mit zusammen 5% Wahrscheinlichkeit
entstehen.
zweiseitiger Test
Ho : p = 0,1; H1 : p ≠ 0,1; X zählt ..... , N = 100, p =0,1
Bis zu welchem k gilt P(X ≤ k) ≤ 0,025,
und ab welchem gilt P(X ≥ k) ≤ 0,025 ?
Linke Hälfte des
Ablehnungsbereichs
{0,...,4}
Fortsetzung 
SD A.Kolb
Ho
Regionaler Arbeitskreis Mathematik
Kursstufe
P(X ≥ k) ≤ 0,0251 – P(X ≤ k-1) ≤ 0,025
P(X ≤ k-1) ≥ 0,975
das gilt für k-1= 16, also ist k = 17
Rechte Hälfte des Ablehnungsbereichs {17,...,100}
Ablehnungsbereich {0,...,4}{17,...100}
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Fehler 2.Art (β-Fehler): Ho wird angenommen, obwohl H1
richtig ist – d.h. aber, dass nun die Wahrscheinlichkeit p, mit
der man rechnet nicht mehr diejenige von Ho sein kann – es
muss eine neue Wahrscheinlichkeit p gegeben sein.
Beispiel: Höchstens 2% aller abgefüllten Mehltüten enthalten
weniger als 1 kg Mehl – Test: n=150, p = 0,02, rechtsstg., 5%
Es ergibt sich der Ablehnungsbereich {7;8;....;150}
Mit welcher W. ist man weiter der Meinung, dass höchstens
2% ....< 1 kg, obwohl sich dieser Anteil auf 6% erhöht hat?
Das ist die Wahrscheinlichkeit für den Annahmebereich unter
der neuen Voraussetzung 0,06 – also:
P(X ≤ 6) für n = 150, p = 0,06 – Ergebnis: 0,1984
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Varianz
Kursstufe
Häufigkeitsverteilung von 2
Maschinen (= Zufallsvariable X ) bei gemeinsamem Mittelwert
(=Erwartungswert E(X) ) 10.
Maß für die Streuung:Die
Summe der quadratischen
Differenzen zwischen xi und
E(X), die mit ihrer relativen
Häufigkeit (= Wahrscheinlichkeit) gewichtet sind –
genannt: VARIANZ
V(X) = (k1 – E(X))2P(X = k1) + (k2 – E(X))2P(X = k2) + ....
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Eine Zufallsvariable X, die zu einer Bernoullikette gehört, hat
den Erwartungswert np und die VARIANZ
Denn: zur Kettenlänge 1 gehört X1 mit x1 = 1, x2 = 0, E(X) = p
P(X1 = 1) = p, P(X = 0) = 1- p
V(X1) = (1 - p)2 p + (0-p) 2 (1- p) = p – 2p2 + p3 + p2 - p3
= p - p2 = p(1- p) = pq
Wenn die Kettenlänge n ist, dann wird daraus
V(X) = npq
( mit q = 1 – p )
STANDARDABWEICHUNG:
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Um das Verhalten von Binomialverteilungen für n  ∞ zu
untersuchen (hier für p = 1/2 dargestellt), werden die xiWerte in ihrer relativen Lage zum Erwartungswert E(X)
betrachtet.
Erinnerung:
k entspricht xi
- Glockenform, - wird flacher und breiter, - wandert nach
rechts
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Nur relativ wenige Werte nahe beim Erwartungswert np = 32
sind überhaupt »sichtbar«. Sie bestimmen die Breite der
Glockenform - hier ist σ = 4 (und σ wächst auch mit n)
0,4
0,3
0,2
Histogramm Binomialv erteilung 64; 0,5
0,1
0
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
Nun erfolgt eine Transformation dieser Darstellung, um
diese Formveränderungen aufzuheben.
Es erfolgt eine Standardisierung.
SD A.Kolb
9
Regionaler Arbeitskreis Mathematik
0,5
standardisierte 64;0,5-Verteilung
0,4
0,4
0,3
0,3
0,2
0,2
Kursstufe
Die standardisierte Verteilung soll ihr
Maximum bei x = 0 haben und sie soll in
x-Richtung um den Faktor σ gestaucht werden,
d.h. die Rechtecksbreite wird durch σ dividiert.
Als Ausgleich dafür werden die
Funktionswerte ver-σ-facht. Dann ergeben alle
Rechtecke zusammen wieder Fläche 1.
Histogramm Binomialv erteilung 64; 0,5
0,1
0,1
0
0
10
11
12
13
14
15
16
17
18
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
-3
-2
-1
0
1
2
3
SD A.Kolb
Zur Erklärung nochmal:
Ein Histogramm-Rechteck hat die Höhe P(X = k), also hat auch seine Fläche
diesen Wert, denn die Breite ist 1. Die Summe aller P(X = k) ist 1 , also ist die
Gesamtfläche 1 – diese Eigenschaft bleibt also erhalten.
Regionaler Arbeitskreis Mathematik
Die Transformationsgleichungen:
Es gibt eine von
Carl Friedrich Gauss
(1777-1855)
gefundene Funktion,
die die oberen
Rechteckmitten
verbindet.
SD A.Kolb
Kursstufe
Regionaler Arbeitskreis Mathematik
Kursstufe
Die Näherung gilt als brauchbar, wenn σ > 3 oder wenn
σ > 2 und gleichzeitig np > 4. Andere Regel: npq > 9
Aus der Summe einzelner Wahrscheinlichkeiten wurde
nun eine FLÄCHE.
Für eine Intervallwahrscheinlichkeit gilt nun:
SD A.Kolb
Noch genauer wäre es, k1 durch k1 – 0,5 und k2 durch
k2 + 0,5 zu ersetzen – siehe Bedeutung von x1/2.
Regionaler Arbeitskreis Mathematik
Kursstufe
Umgang mit diesem Integral:
Diejenige Integralfunktion Φ der DICHTEFUNKTION φ,
die die untere Grenze -∞ hat, heißt
VERTEILUNGSFUNKTION.
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Beispiele:
SD A.Kolb
Kursstufe
im GTR bei 2nd DISTR - 2
Regionaler Arbeitskreis Mathematik
Intervallwahrscheinlichkeit:
SD A.Kolb
Kursstufe
Regionaler Arbeitskreis Mathematik
SD A.Kolb
Kursstufe
Regionaler Arbeitskreis Mathematik
Kursstufe
Fragestellung:
Finde ein möglichst kleines Intervall um E(X) herum, in
dem die X-Werte mit 95% Wahrscheinlichkeit zu finden
sind. X sei binomialverteilt mit n = 300, p = 0,5
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Φ(x) erlaubt also ein näherungsweises Vorgehen bei der
diskreten Binomialverteilung. 
Es gibt andere Zufallsvariable, die sich auch mit Φ(x)
beschrieben lassen – z.B. n Würfel werfen, s.u. n = 1 – 2 – 3
Der »zentrale Grenzwertsatz« sagt über solch eine Summe:
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Die »normalverteilte« Zufallsvariable X – eine stetige Verteilung.
N(E(X), σ)-verteilt - schreibe auch μ für E(X),
also N(μ,σ) – verteilt
Beispiel: Frau Schnell fährt mit dem Auto zur Arbeit.
Die Zeit X ist normalverteilt mit N(20min, 4min).
Die Wahrscheinlichkeit dafür, exakt z.B. 25 Minuten Zeit zu
benötigen ist 0. Deshalb sind die Ordinaten von φ keine
Wahrscheinlichkeiten, sondern Wahrscheinlichkeitsdichten.
ist die Dichtefunktion. Φ ist die Verteilungsfunktion. 
SD A.Kolb
φ
Regionaler Arbeitskreis Mathematik
Kursstufe
blau: standardisierte Dichtefunktion;
rot:Dichtefunktion der Zeitverteilung X
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
Weiter: Wie groß ist die Wahrscheinlichkeit, dass Frau
Schnell höchstens 25 Minuten braucht?
Weiter: Wie groß ist die Wahrscheinlichkeit, dass Frau
Schnell um höchstens 2 Minuten vom Durchschnittswert
abweicht?
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Kursstufe
An eine explizite Normalverteilungs-Aufgabenstellung in der
Abiturprüfung ist nicht gedacht, aber an Eigenschaften einer
stetigen Verteilung:
Eine Funktion f heißt Dichtefunktion, wenn gilt
Man spricht von einer stetigen Zufallsvariablen X,
wenn es eine Funktion f gibt, so dass die
Verteilungsfunktion F von x die Form hat:
SD A.Kolb
Regionaler Arbeitskreis Mathematik
Danke für Ihr Interesse!
SD A.Kolb
Herunterladen