Beurteilende Statistik

Werbung
Beurteilende Statistik
Alternativtest
Hypothesentests
Bei vielen Anwendungen ist die wirkliche Wahrscheinlichkeit für ein
Ereignis nicht bekannt.
In diesen Fällen kann man
Hypothesen aufstellen und durch
Stichproben beurteilen, mit welcher
Wahrscheinlichkeit diese zutreffen.
Einfachster Test ist der Alternativtest
für binomial verteilte Zufallsgrößen.
Beispiel 1
Ein Gartenfachmarkt verkauft Tulpenzwiebeln
in Packungen mit jeweils 20 Stück. Er gibt eine
90%ige „Blühgarantie“.
Ein Käufer beschwert sich und behauptet, dass
in seinem Blumenbeet nur 75% Prozent der
Tulpen blühen würden.
Wurde beim Hersteller die Packung eventuell
nicht richtig beschriftet und handelt es sich in
Wirklichkeit um Ware „zweiter Wahl“?
(nach: Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 237)
Beispiel 1 - Bedingungen
Wir gehen beim Alternativtest davon
aus, dass eine der beiden
Möglichkeiten wirklich zutrifft.
Anzahl der Zwiebeln (Pckg.) n = 20
Es sei p1 = 0,9 und p2 = 0,75.
H(p1)  Es blühen 90% der Zwiebeln.
H(p2)  Es blühen 75% der Zwiebeln.
Beispiel 1 - Erwartungswerte
n = 20
E1 = 0,9 · 20 = 18
Bei einer Blühgarantie von 90% wären
18 blühende Tulpen zu erwarten.
E2 = 0,75 · 20 = 15
Bei einer Blühgarantie von 75% wären
15 blühende Tulpen zu erwarten.
P(X=k) bei n = 20 und p = 0,9
0,30
0,25
0,20
0,15
0,10
0,05
In dieser Darstellung ist zu
sehen, dass auch wenn es
sich um eine Packung mit
Blumenzwiebeln handelt,
die zu 90% blühen,
Packungen existieren, in
denen 15 und weniger
Tulpen blühen werden.
0,00
1 2
3 4 5 6
7 8 9 10 11 12 13 14 15 16 17 18 19 20
P(X=k) bei n = 20 und p = 0,75
0,30
0,25
0,20
0,15
0,10
0,05
In dieser Darstellung ist zu
sehen, dass auch wenn es
sich um eine Packung mit
Blumenzwiebeln handelt,
die zu 75% blühen,
Packungen existieren, in
denen 18 und mehr Tulpen
blühen werden.
0,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Beispiel 1 - Entscheidungsregel
Es soll geprüft werden, ob p1=0,9 zutrifft.
Durch einen Test wird ein Ergebnis für das
Blühen der Tulpen ermittelt.
Entscheidungsregel:
Die Variante 1 wird als richtig angenommen,
wenn mehr als 16 Tulpen blühen.
P(X=k) bei n = 20 und p = 0,9
0,30
0,25
0,20
Die Entscheidungsregel teilt
die Verteilung in zwei
Bereiche:
k > 16 Annahmebereich
(blau)
0,15
0,10
0,05
k ≤ 16 Verwerfungsbereich
(rot)
0,00
1 2
3 4 5 6
7 8 9 10 11 12 13 14 15 16 17 18 19 20
Achtung – häufiger Irrtum
„Liegt ein Versuchsergebnis im Annahmebereich einer Hypothese, dann bedeutet dies
nicht, dass die Hypothese damit bestätigt
ist. Vielmehr haben wir uns aufgrund der
Entscheidungsregel dazu entschlossen, die
betreffende Hypothese weiter als richtig
anzusehen. Wir können nur sagen, dass das
Versuchsergebnis keinen Anlass gibt, die
Hypothese abzulehnen.“
Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 235
Fehler beim Testen von Hypothesen
Das Stichprobenergebnis liegt im
Annahmebereich.
(mind. 17 blühende Zwiebeln)
Die Hypothese
p1=0,9 ist
richtig.
Die Hypothese
p1=0,9 ist
falsch.
Das Stichprobenergebnis liegt im
Verwerfungsbereich.
(weniger als 17 blühende
Zwiebeln)
Fehler beim Testen von Hypothesen
Das Stichprobenergebnis liegt im
Annahmebereich.
(mind. 17 blühende Zwiebeln)
Die Hypothese
Die Entscheidung
p1=0,9 ist
ist richtig.
richtig.
Die Hypothese
p1=0,9 ist
falsch.
Das Stichprobenergebnis liegt im
Verwerfungsbereich.
(weniger als 17 blühende
Zwiebeln)
Fehler beim Testen von Hypothesen
Das Stichprobenergebnis liegt im
Annahmebereich.
(mind. 17 blühende Zwiebeln)
Das Stichprobenergebnis liegt im
Verwerfungsbereich.
(weniger als 17 blühende
Zwiebeln)
Die Hypothese
Die Entscheidung
p1=0,9 ist
ist richtig.
richtig.
Die Hypothese
p1=0,9 ist
falsch.
Die Entscheidung
ist richtig.
Fehler beim Testen von Hypothesen
Das Stichprobenergebnis liegt im
Annahmebereich.
(mind. 17 blühende Zwiebeln)
Das Stichprobenergebnis liegt im
Verwerfungsbereich.
(weniger als 17 blühende
Zwiebeln)
Die Hypothese
Die Entscheidung
Die Entscheidung ist falsch.
p1=0,9 ist
ist richtig.
richtig.
Fehler 1. Art
Die Hypothese
p1=0,9 ist
falsch.
Die Entscheidung
ist richtig.
Fehler beim Testen von Hypothesen
Das Stichprobenergebnis liegt im
Annahmebereich.
(mind. 17 blühende Zwiebeln)
Das Stichprobenergebnis liegt im
Verwerfungsbereich.
(weniger als 17 blühende
Zwiebeln)
Die Hypothese
Die Entscheidung
Die Entscheidung ist falsch.
p1=0,9 ist
ist richtig.
richtig.
Fehler 1. Art
Die Hypothese Die Entscheidung
Die Entscheidung
p1=0,9 ist
ist falsch.
ist richtig.
falsch.
Fehler 2. Art
Fehler 1. Art
Ein Fehler 1. Art liegt vor, wenn eine wahre
Hypothese verworfen wird.
Die Wahrscheinlichkeit für den Fehler 1. Art
wird mit  bezeichnet.
Für Beispiel 1 ist dies bezüglich p1=0,9 :
 = P 0,9 (X≤16)=0,133
Fehler 1. Art
Für unser Beispiel würde ein Fehler
1. Art bedeuten, dass es sich tatsächlich um
Blumenzwiebeln handelt, die mit einer
Wahrscheinlichkeit von 90% blühen. Bei
unserem Test haben wir jedoch eine Packung
ausgewählt, in der zu wenige Blumen blühen.
Deshalb beginnen wir zu zweifeln.
(Die wahre Hypothese wird verworfen.)
Fehler 2. Art
Ein Fehler 2. Art liegt vor, wenn eine falsche
Hypothese nicht verworfen wird.
Die Wahrscheinlichkeit für den Fehler 2. Art
wird mit  bezeichnet.

Für Beispiel 1 ist dies:
= P0,75 (X≥17)=1-P0,75 (X≤16)
=1-0,7748=0,2252
Fehler 2. Art
Für unser Beispiel würde ein Fehler
2. Art bedeuten, dass es sich doch um
Blumenzwiebeln handelt, die nur mit einer
Wahrscheinlichkeit von 75% blühen. Bei
unserem Test haben wir jedoch eine Packung
ausgewählt, in der mehr Blumen als erwartet
blühen. Deshalb zweifeln wir nicht daran, dass
es sich um die bessere Sorte handelt.
(Die falsche Hypothese wird nicht verworfen.)
Der Fehler 1. Art bei der
Hypothese für p1=0,9
ist bei der Hypothese für p2=0,75
der Fehler 2. Art und umgekehrt.
Zusammenfassung
Beim Testen von Hypothesen unterscheidet man
Annahmebereich und Verwerfungsbereich einer
Hypothese.
Liegt das Ergebnis eines Zufallsexperiments im
Verwerfungsbereich, dann hält man die Annahme
für falsch; liegt es im Annahmebereich, dann hat
man dazu keinen Anlass.
Bei Hypothesentests können zweierlei Fehler
unterlaufen, deren Wahrscheinlichkeit sich
bestimmen lässt.  Fehler 1. bzw. 2. Art
Beispiel 2
(Aufgabe)
An einem Spielautomaten dreht sich ein
Glücksrad mit 20 Sektoren, von denen nur
einer sichtbar ist, wenn die Scheibe stehen
bleibt. Man gewinnt, wenn ein rotes Feld
erscheint.
Der Betreiber behauptet, dass 6 Felder rot
gefärbt sind. Wir argwöhnen, dass nur 4
Felder Gewinnfelder sind und können wegen
Geldmangels nur 20 Spiele durchführen.
(Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 237)
Beispiel 2
(Aufträge)
Formuliere eine Entscheidungsregel
zur Hypothese p=0,2.
Welche Bedeutung haben die Fehler 1.
und 2. Art?
Bestimme die
Fehlerwahrscheinlichkeiten.
P(X=k) bei n = 20 und p = 0,2
0,25
0,20
0,15
0,10
In dieser Darstellung ist zu
sehen, dass auch wenn es
sich um ein Glücksrad mit
p=0,2 handelt, Versuche
auftreten, bei denen mehr
als 4 mal ein rotes Feld
erdreht wird.
0,05
0,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
P(X=k) bei n = 20 und p = 0,3
0,25
0,20
0,15
0,10
In dieser Darstellung ist zu
sehen, dass auch wenn es
sich um ein Glücksrad mit
p=0,3 handelt, Versuche
auftreten, bei denen
weniger als 6 mal ein rotes
Feld erdreht wird.
0,05
0,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Beispiel 2 (Vorüberlegung I)
Wir wollen dem Betreiber glauben, wenn bei
unserem Versuch 5 und mehr Gewinnfelder
auftreten.
Die Verteilung zu unserer Hypothese mit
p = 0,2 wird
• in einen Annahmebereich
für k < 5 Gewinnfelder und
• in einen Verwerfungsbereich
bei k ≥ 5 Gewinnfelder geteilt.
Beispiel 2 (Vorüberlegung II)
Wenn wir unsere Hypothese mit p = 0,2 testen
können zweierlei Fehler auftreten.
Fehler 1. Art:
Es handelt sich wirklich um ein Glücksrad mit nur 4
Gewinnfeldern, aber wir haben Glück und erdrehen
mehr als 4 mal ein Gewinnfeld.
Fehler 2. Art:
Das Rad hat – wie der Betreiber behauptet –
wirklich 6 Gewinnfelder, aber wir haben Pech und
erhalten trotzdem weniger als 5 Gewinnfelder.
Beispiel 2 (Berechnung)
Fehlerwahrscheinlichkeit für einen
Fehler 1. Art:
P0,2(k>4) = 1- P0,2(k≤4) = 1-0,6296
= 0,3704 = 37,04%
Fehlerwahrscheinlichkeit für einen
Fehler 2. Art:
P0,3(k≤4) = 0,2375 = 23,75%
Beispiel 2 (Ergebnis)
Die Fehlerwahrscheinlichkeiten sind für
dieses Beispiel sehr groß, weil die beiden
Annahmen sich nicht erheblich voneinander
unterscheiden und nur sehr wenig Versuche
zum Testen der Hypothesen durchgeführt
wurden.
Die Fehlerwahrscheinlichkeiten werden
kleiner, wenn mehr Versuche durchgeführt
werden.
Beispiel 2 (mit 40 Versuchen)
Wie verändert sich die
Fehlerwahrscheinlichkeit wenn die
Anzahl der Versuche verdoppelt wird?
Neue Entscheidungsregel:
Dem Betreiber soll geglaubt werden,
wenn bei 40 Versuchen 10 und mehr
Gewinnfelder erdreht werden.
0,16
Verteilung für n = 40 Versuche
0,14
0,12
Fehler
1. Art
0,10
0,08
0,06
0,04
0,02
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0,00
Verteilung für n = 40 Versuche
0,16
0,14
0,12
Fehler
2. Art
0,10
0,08
0,06
0,04
0,02
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0,00
Beispiel 2 (Berechnung für n=40)
Fehlerwahrscheinlichkeit für einen Fehler 1. Art bei
40 Versuchen:
P0,2(k≥10) = 1- P0,2(k≤9) = 1-0,7318
= 0,2682 = 26,82%
Fehlerwahrscheinlichkeit für einen Fehler 2. Art:
P0,3(k≤9) = 0,1959 = 19,59%
Die Fehlerwahrscheinlichkeiten sind gesunken.
Je mehr Versuche möglich sind, umso sicherer ist
es, dass eine richtige Entscheidung getroffen wird.
Beispiel 3
(Aufgabe)
Angeblich kennen 70% aller Jugendlichen
die Schokoriegel-Marke „Schoko-Choc“.
Skeptische Marktbeobachter schätzen den
Anteil auf 50%. Durch eine Befragung von
100 zufällig ausgewählten Jugendlichen soll
zwischen beiden Standpunkten entschieden
werden.
Beschreibe mögliche Fehlentscheidungen.
Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 235
Verteilungen für 100 befragte Personen
p1 = 0,5
p2 = 0,7
In dieser Darstellung ist deutlich zu sehen, welcher Wert
für die Festlegung der Entscheidungsregel sinnvoll ist,
um die Fehler zu minimieren.
k = 60
Verteilungen für 100 befragte Personen
In dieser Darstellung ist zu
sehen, dass auch wenn
70% der Jugendlichen
„Schoko-Choc“ kennen,
Befragungen zustande
kommen können, bei denen
70 und weniger Jugendliche
Die Marke kennen.
p1 = 0,5
k = 60
p2 = 0,7
Fehler 1. Art
P0,7(X≤60)=0,021
Verteilungen für 100 befragte Personen
In dieser Darstellung ist zu
sehen, dass auch wenn
70% der Jugendlichen
„Schoko-Choc“ kennen,
Befragungen zustande
Fehler
2. Art bei denen
kommen
können,
P0,5(X>60)=0,018
70 und
weniger Jugendliche
Die Marke kennen.
p1 = 0,5
k = 60
p2 = 0,7
Weiter üben?
In einer Veröffentlichung war zu lesen, dass
50% aller Haushalte eine Tageszeitung
abonniert haben oder täglich kaufen. In
einer anderen Publikation wurde dieser
Anteil mit 30% beziffert.
Es soll angenommen werden, dass genau
eine der Aussagen zutrifft.
Es sollen 100 Haushalte befragt werden.
Schroedel – Elemente der Mathematik – Niedersachsen Kl. 10, Seite 240
• Stellen Sie eine sinnvolle
Entscheidungsregel auf, damit man sich
zwischen den beiden Aussagen
entscheiden kann.
• Welche Fehler treten auf, wenn man sich
an diese Entscheidungsregel hält?
• Bestimmen Sie die
Fehlerwahrscheinlichkeiten.
Herunterladen