Wahrscheinlichkeitsrechnung

Wahrscheinlichkeitsrechnung
Das Phänomen Zufall
1.Pseudozufallszahlen
2.Würfeln
3.Münzwurf
4.Ziehen von Kugeln aus einer sog. Urne
Wahrscheinlichkeitsrechnung
Zufallsexperimente
Zufallsexperiment
Definition: Unter einem Zufallsexperiment versteht man einen in der
realen Welt ablaufenden Vorgang, bei
dem ein nicht vollständig vorhersehbarer
Ausgang (Realisierung) aus einer Menge
von möglichen Ausgängen realisiert wird.
Wahrscheinlichkeitsrechnung
Zufallsexperimente
Der Ereignisraum.
Beispiel: Das Zufallsexperiment besteht im 3-maligen
Würfeln mit einem Würfel
Ereignisraum ist:
={ {x1,x2,x3} | x1,x2,x3 {1,2,3,4,5,6}}.
Die Liste {x1,x2,x3}   entspricht dabei dem Ausgang
beim ersten Wurf wird die Augenzahl x1 gewürfelt, beim
zweiten Wurf wird die Augenzahl x2 gewürfelt, beim
dritten Wurf wird die Augenzahl x3 gewürfelt.
Die Teilmenge
S = {{x1,x2,x3}   | mit x1+x2+x3 = 5} von 
entspricht dann dem Ereignis es wird die Augensumme 5
gewürfelt.
Wahrscheinlichkeitsrechnung
Der Begriff der Wahrscheinlichkeit
Definition:
Jedem Ereignis A   wird eine Zahl P[A]  
zugeordnet mit den folgenden Eigenschaften:
1.P[] = 1
2.Für alle Ereignisse A   gilt P[A]  0
3. Für endlich viele disjunkte Ereignisse A1, A2, …
  gilt: P[A1  A2  … ] = P[A1] + P[A2] + …
P heißt Wahrscheinlichkeit bzw.
Wahrscheinlichkeitsmaß
Wahrscheinlichkeitsrechnung
Laplace Experimente
Laplace
1749 - 1827
Definition:
Unter einem Laplace-Experiment versteht
man ein Zufallsexperiment mit endlich
vielen möglichen Ausgängen 1, , .. n, bei
dem auf Grund von geometrischen oder
physikalischen Symmetrieüberlegungen alle
Elementarereignisse {1} gleich
wahrscheinlich sind.
Wahrscheinlichkeitsrechnung
Laplace Experimente
Beispiele für Laplace-Experimente:
1. das mehrfache Werfen einer (homogenen) Münze
bzw. eines (homogenen) Würfels.
2. das Ziehen von (bis auf ihre Farbe gleichartigen)
Kugeln aus einer Urne
3. das Ziehen von (gleichartigen) Losen aus einer
Urne
4. das zufällige Verteilen von Spielkarten auf mehrere
Spieler
Wahrscheinlichkeitsrechnung
Zufallsexperimente
mit Mathematica
Random[ ] liefert eine auf dem Intervall [0,1]
gleichmäßig verteilte Pseudozufallszahl
Random[Integer,{1,6} ] liefert eine IntegerZufallszahl im Intervall von [1,6]
Random[Real,{1,6} ] liefert eine Real-Zufallszahl im
Intervall von [1,6]
Wahrscheinlichkeitsrechnung
Beispiele
1. Das Zufallsexperiment
besteht im Würfeln mit
einem Würfel.
2. Das Zufallsexperiment
besteht im einmaligen
Würfeln mit k Würfeln.
Zufallsexperimente
mit Mathematica
Random[Integer,{1,6}]
2a. Das Zufallsexperiment
besteht im k-maligen
Würfeln mit einem Würfel.
k=5;
Table[Random[Integer,{1,6}],{k}]
Wahrscheinlichkeitsrechnung
Beispiele
Zufallsexperimente
mit Mathematica
3. Das Zufallsexperiment
besteht im n-maligen
Würfeln mit k Würfeln.
k=5; n=10;
Table[Table[Random[Integer,{1,6}],{k}],{n}]
4. Das Zufallsexperiment besteht im n-maligen Würfeln
mit k Würfeln und der anschließenden Beobachtung der
dabei jeweils gewürfelten Augensumme.
k=3; n=20;
Table[Apply[Plus,Table[Random[Integer,{1,6}],{k}]],{n}]
Wahrscheinlichkeitsrechnung
Grafische Darstellung
der Ergebnisse
Zufallsexperimente
mit Mathematica
Das Zufallsexperiment besteht im nmaligen Würfeln mit einem Würfel
k = 1000;
Wuerfel = Table[Random[Integer, {1, 6}], {k}]
Eins = Count[Wuerfel, 1]
Zwei = Count[Wuerfel, 2]
Drei = Count[Wuerfel, 3]
Vier = Count[Wuerfel, 4]
Fuenf = Count[Wuerfel, 5]
Sechs = Count[Wuerfel, 6]
Wahrscheinlichkeitsrechnung
Grafische Darstellung
der Ergebnisse
Zufallsexperimente
mit Mathematica
Das Zufallsexperiment besteht im nmaligen Würfeln mit einem Würfel
<< Graphics`Graphics`
BarChart[{Eins, Zwei, Drei, Vier, Fuenf, Sechs}/k, BarSpacing -> 1.2,
BarStyle -> {GrayLevel[0.3], GrayLevel[0.4], GrayLevel[0.5],
GrayLevel[0.6], GrayLevel[0.7], GrayLevel[0.8]}]
Wahrscheinlichkeitsrechnung
Grafische Darstellung
der Ergebnisse
Zufallsexperimente
mit Mathematica
Das Zufallsexperiment besteht im nmaligen Würfeln mit einem Würfel
0.15
0.1
0.05
1
2
3
4
5
6
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Die Kombinatorik liefert wichtige Modelle
zum Berechnen von Laplace-Elementen
Aus einer Urne mit n unterscheidbaren
Kugeln werden k Kugeln gezogen. Dabei
kann das Ziehen mit oder ohne Zurücklegen erfolgen, und die Reihenfolge eine
oder keine Rolle spielen.
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Einer Urne mit n verschiedenen Kugeln
werden nacheinander k Kugeln
entnommen. Dabei ist prinzipiell zwischen
zwei Arten der Ziehung zu unterscheiden:
Ziehung ohne Zurücklegen,
d.h. jede Kugel kann höchstens
einmal gezogen werden, da sie
nach der Ziehung ausscheidet
Ziehung mit Zurücklegen,
d.h. jede Kugel ist bei der
nächsten Ziehung wieder dabei.
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Zusätzliche Unterscheidung:
Soll die Reihenfolge der gezogenen Kugeln
berücksichtigt werden oder nicht?
Geordnete Stichprobe, die
Reihenfolge der gezogenen
Elemente wird berücksichtigt
Ungeordnete Stichprobe, die
Reihenfolge der gezogenen
Elemente spielt keine Rolle
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Beispiele
Wie viele 4-stellige Zahlen lassen
sich mit den Ziffern 1, 3, 5, 7
darstellen, wenn jede Ziffer
genau einmal auftreten muss?
Fünf Personen möchten sich im
Kino auf fünf (nebeneinander
liegende) Plätze setzen. Auf wie
viele Arten geht das?
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Eine Anordnung von n verschiedenen
Elementen in einer bestimmten Reihenfolge
heißt Permutation der n Elemente
Satz: Die Anzahl P der Permutationen
von n Elementen ist:
P(n) = n  (n-1)  (n-2) ….  1 = n!
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Problem: Was passiert, wenn sich
unter den Kugeln n1 gleiche befinden?
Beispiel: Wie viele 5-stellige Zahlen kann
man aus den Ziffern 2, 2, 2, 3, 5?
Alle Anordnungen, die durch Vertauschen
der gleichen Kugeln untereinander
entstehen, fallen zusammen. Bei n1 gleichen
Kugeln gibt es P(n1) = n1! Möglichkeiten,
die gleichen Kugeln untereinander zu
vertauschen.
P(n;n1) =
P(n)  n!
P(n1) n1!
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Unter den n Kugeln befinden sich jeweils n1,
n2,…nk gleiche Kugeln. Dann gibt es
n!
P(n;n1;n2;…nk) = n ! n !...n !
1
2
k
verschiedene Anordnungsmöglichkeiten
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Beispiel 1: Wie viele Worte der Länge 2 lassen
sich mit dem Alphabet {x,y,z} bilden, wenn 2
mal derselbe Buchstabe verboten ist?
Beispiel 2: Bei wie vielen Zahlen zwischen 0
und 9999 kommen in der Dezimalschreibweise
mit lauter verschiedene Ziffern vor?
Wahrscheinlichkeitsrechnung
Kombinatorik
Das Urnenmodell
Anzahl der Möglichkeiten beim Ziehen von k
Kugeln aus einer Urne mit n Kugeln
Ziehen mit
Zürücklegen
mit Beachtung
der Reihenfolge
ohne Beachtung
der Reihenfolge
nk
nk 1

k 





Ziehen ohne
Zurücklegen
n!
(nk)!
n
k 




Wahrscheinlichkeitsrechnung
Kombinatorik
Die Binomoninalkoeffizienten
Das Pascalsche Dreieck
0-te Zeile
1
1-te Zeile
1
2-te Zeile
1
2
3-te Zeile
1
3
4-te Zeile 1
4
6
5-te Zeile 1
5
10
1
1
3
1
4
10
1
5
1
Man denke sich hier die Zeilen von n = 0
bis 5 durchnummeriert und die Spalten
ergeben den jeweiligen k-Wert, wobei die
linke 1 jeder Zeile jeweils für k = 0 steht.
Wahrscheinlichkeitsrechnung
Kombinatorik
Die Binomoninalkoeffizienten
Für die Berechnung der einzelnen
Koeffizienten führt man die abkürzende
Schreibweise ein:
n 
n!

k  k!(nk)!





Wahrscheinlichkeitsrechnung
Definition: Zufallsvariable (Zufallsgröße)
Definition: Es sei  die (diskrete)
Ergebnismenge eines Zufallsexperiments.
Dann heißt jede Funktion (Abbildung)
X:R
Eine Zufallsvariable oder Zufallsgröße auf 
Anmerkung:
Die Begriffe Zufallsvariable oder Zufallsgröße sind irreführend, da es sich
weder um eine Variable noch um eine Größe, sondern um eine Funktion
handelt.
Zufallsvariable werden mit großen Buchstaben, wie X, Y, Z bezeichnet.
Wahrscheinlichkeitsrechnung
Definition: Wahrscheinlichkeitsverteilung
Definition: Es sei (,P) ein diskreter
Wahrscheinlichkeitsraum und X :   R sei
eine Zufallsvariable auf .
Die Wahrscheinlichkeitsverteilung der
Zufallsvariablen X ordnet den möglichen
Werten xi von X mit i = 0 1, 2,..,n die
Wahrscheinlichkeiten P(X=xi) zu.
1
(1,2)
Ergebnisse eines
Zufallsexperiments
X1
3
Werte der
Zufallsvariablen
P(X = x1)
P(X=3)
Wahrscheinlichkeiten
Wahrscheinlichkeitsrechnung
Definition: Der Erwartungswert einer
Zufallsgröße
Definition: Eine Zufallsgröße X nehme die Werte
a1, a2, .., am mit den Wahrscheinlichkeiten
P(X=a1), P(X=a2),…,P(X=am) an. Dann wird der
zu erwartende Mittelwert E(X) der Verteilung als
Erwartungswert der Zufallsgröße X
bezeichnet. Es gilt:
E(X) = a1P(X=a1) + a2P(X=a2)+..
+amP(X=am)=
 ai  P(X = ai)
Der Erwartungswert wird auch mit  bezeichnet.
Wahrscheinlichkeitsrechnung
Vorbetrachtungen zum Bernoulli-Experiment
In einer Urne befinden sich 10 Kugeln, davon
3 rote. Wie ziehen 5 mal mit Zurücklegen und
notieren das Ergebnis mit Beachtung der
Reihenfolge.
A. Genau die ersten
beiden Kugeln sind rot.
Berechnen Sie die
Wahrscheinlichkeit
B. Genau die 1.und die
4. gezogene Kugel sind
rot. Berechnen Sie die
Wahrscheinlichkeit
C. Genau 2 der 5
gezogenen Kugeln sind
rot. Berechnen Sie die
Wahrscheinlichkeit
Wahrscheinlichkeitsrechnung
Das Bernoulli-Experiment
Definition: Ein Zufallsexperiment mit nur 2
möglichen Ergebnissen (welche oftmals z.B. als
Treffer und Niete bezeichnet werden) heißt
Bernoulli-Experiment.
Wenn das Ereignis A eintritt, spricht man von
Erfolg mit der Erfolgswahrscheinlichkeit P(A) = p
Wenn das Ereignis A nicht eintritt, spricht man
von
 Misserfolg mit der Erfolgswahrscheinlichkeit
P(A) = 1-p.
Einmaliges Ziehen aus der vorherigen Urne und überprüfen, ob man rot
gezogen hat, ist ein Bernoulli-Experiment.
Die Wahrscheinlichkeit für Erfolg (rot) ist p = 0,3.
Die Wahrscheinlichkeit für Misserfolg ist (nicht rot) ist q = 1 – p = 0,3.
Wahrscheinlichkeitsrechnung
Das Bernoulli-Experiment – weitere Beispiele
Einfache Beispiele sind:
a)Das wiederholte Werfen einer Münze oder eines
Würfels.
b)Das wiederholte Ziehen mit Zurücklegen von
Kugeln aus einer Urne.
c) Das laufende Befragen von zufällig
ausgewählten Personen (Meinungsumfrage).
d)Das laufende Überprüfen der Qualität eines
Produktionsprozesses (Qualitätskontrolle).
Kein Bernoulli-Experiment ist
Mehrmaliges Ziehen aus einer Urne ohne
Zurücklegen
Wahrscheinlichkeitsrechnung
Das Bernoulli-Kette
Definition: Ein n-stufiges Bernoulli-Experiment
heißt Bernoulli-Kette der Länge n
Beispiel
Fünfmaliges Ziehen aus einer Urne mit 10 Kugeln,
davon 3 rote, und überprüfen, ob man rot
gezogen hat. Dies ist eine Bernoulli-Kette der
Länge 5.
Wahrscheinlichkeitsrechnung
Das Bernoulli-Formel
Definition: Bei einer Bernoulli-Kette der Länge n
mit der Trefferwahrscheinlichkeit p kann man die
Wahrscheinlichkeit für die Anzahl k der Treffer
nach der Bernoulli-Formel berechnen
P(X  k) 
 n
 
 
k 
 
pk
qnk

 n
 
 
k 
 
p k (1p)nk
Beispiel
Fünfmaliges Ziehen aus einer Urne mit 10 Kugeln, davon 3 rote.
Wie groß ist die Wahrscheinlichkeit, dass 2 der gezogenen
Kugeln rot sind?
 5
 
P(X  2)    0,3 2 0,7 3 30,9 %
 2
 
Wahrscheinlichkeitsrechnung
Die Binomialverteilung
Definition: Die nach der Bernoulli-Formel
berechnete
Wahrscheinlichkeitsverteilung P (X = k)
heißt Binomialverteilung Bn;p (k).
Beispiel
Fünfmaliges Ziehen aus einer Urne mit 10 Kugeln, davon 3 rote.
Berechnet wird die Wahrscheinlichkeit, dass genau 0,1,2,3,4 oder 5 der
gezogenen Kugeln rot sind. Man erhält folgende
Wahrscheinlichkeitsverteilung
k
P(X=k)
0
1
2
3
4
5
16,8% 36,0% 30,9% 13,2% 2,8% 0,2%
Wahrscheinlichkeitsrechnung
Die Binomialverteilung
k
P(X=k)
0
1
2
3
4
16,8%
36,0%
30,9%
13,2%
2,8%
5
0,2%
Wahrscheinlichkeitsrechnung
Der Erwartungswert einer Binomialverteilung
Wahrscheinlichkeitsrechnung
Der Erwartungswert einer Binomialverteilung
k
P (X = k) k*P(X=k)
0
q
1
p
0
p
E(X) = p
k P (X = k) k*P(X=k)
0 q2
0
1 2pq
2pq
2 p2
2p2
E(X) = 2pq +2p2
=2p (q+p) = 2p
Wahrscheinlichkeitsrechnung
Der Erwartungswert einer Binomialverteilung
k
P (X = k)
k*P(X=k)
0
q3
0
1
3pq2
3pq2
E(X) = 3p(q2 + 2pq +p)
2
3p2 q
6p2
=3p (q+p)2 = 3p2
3
p3
3p3
q
Gegeben Sei ein n-stufiger Bernoulli-Versuch mit der
Erfolgswahrscheinlichkeit p. Für den Erwartungswert
 der Zufallsgröße X: Anzahl der Erfolge gilt:
 = E(X) = n p
Wahrscheinlichkeitsrechnung
Varianz und Standardabweichung als Maße für die
Streuung einer Wahrscheinlichkeitsverteilung
Varianz und Standardabweichung einer Zufallsgröße
Eine Zufallsgröße X mit dem Erwartungswert  nehme die Werte a1, a2,..,
am mit den Wahrscheinlichkeiten P(X=a1), P(X=a2),…,P(X=am) an.
Als Varianz V(X) der Zufallsgröße X bezeichnet man die zu erwartende
mittlere quadratische Abweichung vom Erwartungswert  der Zufallsgröße
X, also:
V(X) =(a1 -  )2 P(X=a1) + (a- )2 P(X=a2) + …+(am - )2 P(X=am)
Die Quadratwurzel aus der Varianz einer
Zufallsgröße heißt Standardabweichung :
=
V(X)
Wahrscheinlichkeitsrechnung
Varianz und Standardabweichung als Maße für die
Streuung einer Wahrscheinlichkeitsverteilung
Varianz und Standardabweichung einer Zufallsgröße
Man kann die Formel
V(X) =(a1 -  )2 P(X=a1) + (a2- )2 P(X=a2) + …+(am - )2 P(X=am)
für die Berechnung der Varianz vereinfachen
V(X) = [(a1)2 P(X=a1) + (a2)2  P(X=a2) + …+(am )2  P(X=am)] - 2
Wahrscheinlichkeitsrechnung
Bei zunehmendem Stichprobenumfang werden die Histogramme
von Binomialverteilungen immer breiter und flacher und sie
nehmen immer stärker eine symmetrische Gestalt an.
Wahrscheinlichkeitsrechnung
Varianz und Standardabweidung bei Binomialverteilungen
Streuen die Ergebnisse der beiden
Zufallsversuche im gleichen Maße
um den Erwartungswert?
Wahrscheinlichkeitsrechnung
Varianz und Standardabweidung bei Binomialverteilungen
Wir betrachten das Ereignis X: Anzahl der Würfe mit der
Augenzahl 6 beim 3fachen Würfeln
k
P(X = k)
k2 P(X=k)
0
1  (1/6)0  (5/6)3
0  125/216 = 0
1
3  (1/6)1  (5/6)2
1  75/216 = 75/216
2
3  (1/6)2  (5/6)1
4  15/216 =60/216
3
1  (1/6)3  (5/6)0
9  1/216 = 9/126
Damit ergibt sich für
V(X) = 144/216 – (3  1/6)2 = 90/216 =
5/12
Wahrscheinlichkeitsrechnung
Varianz und Standardabweidung bei Binomialverteilungen
1-stufiges Bernoulli-Versuch:  = 1  p
2-stufiges Bernoulli-Versuch:  = 2  p
k
P(X = k) k2 P(X=k)
0 q
0
q2
0  q2
1 p
1
2pq
1  2pq
2
p2
4  p2
k
P(X = k) k2 P(X=k)
0
q
1
p
3-stufiges Bernoulli-Versuch:  = 3  p
k
P(X = k)
k2 P(X=k)
0
q3
0  q3
1
3pq2
1  3pq2
2
3p2q
4  3p2q
3
p3
9 p3
Wahrscheinlichkeitsrechnung
Varianz und Standardabweidung bei Binomialverteilungen
Gegeben ist ein n-stufiger Bernoulli-Versuch mit der
Erfolgswahrscheinlichkeit p und der
Misserfolgswahrscheinlichkeit q = 1 – p.
Die Zufallsgröße X : Anzahl der Erfolge hat die Varianz
V(X) = n  p  q und die Standardabweichung
=
npq
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeiten von -Umgebungen
Die Histogramme von Binomialverteilungen werden immer flacher und
breiter, wenn der Stichprobenumfang n zunimmt. Dem Maximum einer
solchen Verteilung kommt keine allzu große Wahrscheinlichkeit zu;
vielmehr treten die Nachbarwerte des Maximums mit vergleichbaren
Wahrscheinlichkeiten auf.
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeiten von -Umgebungen
Unter einer Umgebung des Erwartungswertes  versteht man die
Intervalle, die in der Form  - r  X   + r notiert werden können
Die halbe Breite dieser
Treppenfiguren bezeichnet man als Radius
der Umgebung des
Erwartungswertes 
bezeichnet.
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeiten von -Umgebungen
Dieser Radius einer Umgebung
wird mit der berechneten
Standardabweichung verglichen.  wird als Maßeinheit
genommen. Es wird angegeben, wie oft diese Maßeinheit in
den Radius passt.
Beispiele:
(1) r = 0,5; also r/  = 0,5 / 4,58  0,11; d.h. r  0,11 
(2) r = 1,5; also r/  = 1,5 / 4,58  0,33; d.h. r  0,33 
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeiten von -Umgebungen
Regeln über  -Umgebungen von 
Jedem Radius einer Umgebung des
Erwartungswertes  lässt sich eine
bestimmte Wahrscheinlichkeit für
diese Umgebung zuordnen. Umgekehrt gehören zu bestimmten Wahrscheinlichkeiten für Umgebungen
um den Erwartungswert bestimmte
Radien.
Dies gilt nahezu unabhängig von der Erfolgswahrscheinlichkeit p, die
dem n-stufigen Bernoulli-Versuch zugrunde liegt, und dem
Stichprobenumfang n.
Diese Regel gilt umso genauer, je größer n ist, insbesondere falls
 = npq > 3 (so genannte Laplace-Bedingung)
Wahrscheinlichkeitsrechnung
Wahrscheinlichkeiten von -Umgebungen
Wahrscheinlichkeiten von Umgebungen um den
Erwartungswert bei Binomialverteilungen (-Regeln)
Radius der Wahrscheinlichkeit
Umgebung der Umgebung
Wahrscheinlichkeit Radius der
der Umgebung
Umgebung
1
0,68
0,90
1,64 
2
0,955
0,95
1,96 
3
0,997
0,99
1,58 
Wahrscheinlichkeitsrechnung
Hypothesentest bei großem Stichprobenumfang
Testen einer zweiseitigen Hypothese
Mit einem medizinischen Test soll festgestellt werden, ob eine Person
eine bestimmte Krankheit hat oder gesund ist. Im Falle eines
statistischen Tests ist die Nullhypothese also "Die Person ist krank".
Aus dem tatsächlichen Gesundheitszustand des Patienten
(gesund/krank) und dem Testergebnis (positiv/negativ) sind folgende
Kombinationen möglich (dargestellt als sogenannte Confusion Matrix):
Person ist krank(a+c) Person ist gesund(b+d)
Test positiv (a+b)
richtig positiv(a)
falsch positiv(b)
Test negativ(c+d)
falsch negativ(c)
richtig negativ (d)
Wahrscheinlichkeitsrechnung
Hypothesentest bei großem Stichprobenumfang
Die Nullhypothese
In der Statistik ist die Nullhypothese eine Annahme über die
Wahrscheinlichkeitsverteilung einer Zufallsvariablen, die als wahr
betrachtet wird, bis sie durch einen statistischen Test widerlegt werden
kann. Die Alternativhypothese steht dabei für eine Menge von
Ergebnissen, die der Nullhypothese nicht entsprechen. Die Aufgabe,
zwischen Null- und Alternativhypothese zu entscheiden, wird als
Testproblem bezeichnet. Spricht das Stichprobenergebnis gegen die
Annahme, so wird die Hypothese abgelehnt; andernfalls wird sie
beibehalten.
Wahrscheinlichkeitsrechnung
Hypothesentest bei großem Stichprobenumfang
Testen einer zweiseitigen Hypothese
Person ist krank(a+c) Person ist gesund(b+d)
Test positiv (a+b)
richtig positiv(a)
falsch positiv(b)
Test negativ(c+d)
falsch negativ(c)
richtig negativ (d)
In den Fällen a (Person ist krank und die Krankheit wird erkannt) und d (Person
ist gesund und der Test meldet keine Krankheit) ist die Einteilung richtig. In den
Fällen b (Falsche Diagnose auf Krankheit) und c (Krankheit wird nicht erkannt)
liegt ein Fehler vor. Den Fehler durch das in Fall b erhaltene falsch positiv
Ergebnis bezeichnet man auch als Fehler 2. Art und den Fehler durch das in
Fall c erhaltene falsch negativ Ergebnis als Fehler 1. Art.
Wahrscheinlichkeitsrechnung
Hypothesentest
Der Hypothesentest beinhaltet:
1.die Formulierung einer Hypothese aufgrund theoretischer Vermutungen oder anderem Wissen
2.die Umsetzung der Sachhypothesen in statistische Hypothesen
3.Wahl einer Entscheidungsregel, ab wann eine Hypothese angenommen bzw. verworfen wird
4.Wahl und Rekrutierung (ggf. durch bestimmte Verfahren) einer Stichprobe von Versuchspers.
5.Berechnen der Stichprobenkennzahl (Versuchsergebnis)
6.Anwenden der Entscheidungsregel auf die Stichprobenkennzahl
7.Entscheidung (Ablehnen oder Annahme der Hypothese).
Wir haben in einem ersten Schritt bereits eine Sachhypothese aufgestellt, diese ist nun in eine statistische
Hypothese zu überführen. Die Verwendung statistischer Grundlagen für das Testen von Hypothesen macht
diesen Schritt notwendig. Statistische Methoden bieten viele unterschiedliche Möglichkeiten, objektive
Kennwerte auf ihre Auftretenswahrscheinlichkeit hin zu überprüfen oder mehrere Kennwerte miteinander zu
vergleichen. Daher bietet sich in statistischer Hypothesentest als Mittel der Wahl an.
Bei der Überprüfung von Hypothesen können wir zwei Fehler begehen:
Die Nullhypothese wird verworfen, obwohl sie in der Wirklichkeit zutrifft
Die Alternativhypothese wird verworfen, obwohl sie in der Wirklichkeit zutrifft
Wahrscheinlichkeitsrechnung
Hypothesentest bei großem Stichprobenumfang
Testen einer zweiseitigen Hypothese
Wahrer Sachverhalt H0
Wahrer Sachverhalt H1
durch einen stat. Test fällt
eine Entscheidung für die
Nullhypothese H0
1-alpha
beta (Fehler 2. Art
falsch negativ)
durch einen stat.Test fällt
eine Entscheidung für die
alternative Hypothese H1
alpha (Fehler 1. Art,
falsch positiv)
1-beta
Ein alpha-Fehler ist schwerwiegend: Die Hypothese H1 mit ihren
Konsequenzen wird fälschlicherweise als richtig angesehen. Ein beta-Fehler
(H0 wird fälschlicherweise nicht abgelehnt) hat keine Auswirkungen, da man
keine Entscheidung trifft, also nicht etwa H1 favorisiert.
Wahrscheinlichkeitsrechnung
Hypothesentest
Fehler 1. Art
Vom Fehler 1. Art (alpha) spricht man, wenn man einen Effekt annimmt, der in
Wirklichkeit gar nicht vorhanden ist. Mathematisch formuliert:
die so genannte Ausgangshypothese "H0" abgelehnt wird, obwohl sie richtig ist.
Die Ausgangshypothese (H0, "null" für keinen Unterschied) ist hierbei die
Annahme, die Testsituation befinde sich im "Normalzustand", d.h. in den oben
genannten Beispielen "es brennt nicht", "der Angeklagte ist unschuldig", "der
Patient ist gesund" oder "die Person hat Zugangsberechtigung". Wird also
dieser "Normalzustand" nicht erkannt, obwohl er tatsächlich vorliegt, handelt es
sich um einen Fehler 1. Art.
Beispielsweise wird eine Person zu Unrecht als krank bezeichnet, obwohl sie
tatsächlich gesund ist. Falsch Positive (englisch: false positives) sind zu
Unrecht als krank bezeichnete Gesunde.
Wahrscheinlichkeitsrechnung
Hypothesentest
Fehler 2. Art
Ein Fehler 2. Art (beta) liegt im umgekehrten Fall vor, wenn man es versäumt,
einen Effekt als signifikant zu erklären, obwohl es ihn tatsächlich gibt, bzw.:
wenn die Ausgangshypothese nicht abgelehnt wurde, obwohl sie falsch ist.
Hier wird also nicht erkannt, dass nicht der "Normalzustand" vorliegt. Die
solcherart falsch klassifizierten Zustände werden falsch negativ genannt.
Beispielsweise wird eine Person zu Unrecht als gesund bezeichnet, obwohl sie
tatsächlich krank ist. Falsch Negative (englisch: false negatives) sind nicht
entdeckte Kranke.
Wahrscheinlichkeitsrechnung
Hypothesentest
Beispiele für Fehler
Aids
Welche Konsequenzen ein falsch positiver Test haben kann, zeigt das Beispiel eines
Menschen der sich auf HIV testen ließ. Der Test war positiv. Daraufhin beendete der
Mensch sein Leben durch Selbsttötung. Hinterher stellte sich heraus, dass er gar
nicht von HI-Viren befallen war. Der Test war falsch positiv ausgefallen.
Bei einer angenommenen Genauigkeit von 99,9 % des kombinierten AIDS-Tests
sowohl für positive als auch negative Ergebnisse und der aktuellen Verbreitung von
AIDS (Stand 2003) in der Deutschen Bevölkerung (80.000.000 Einwohner, davon
40.000 HIV-positiv) wäre ein allgemeiner AIDS-Test verheerend. Von 40.000 tatsächlich Erkrankten würden bei lediglich 40 HIV-Infizierten Menschen die Krankheit
fälschlicherweise nicht erkannt. Etwa 80.000 Personen würden jedoch fälschlicherweise als HIV-Positiv diagnostiziert. Von 120.000 positiven Ergebnissen wären
etwa 66 % falsch positiv. Somit liegt die Wahrscheinlichkeit dass jemand der positiv
getestet wurde auch wirklich HIV-positiv ist bei nur 33%. Ein zweiter Test kann die
Unsicherheit hingegen drastisch reduzieren. Die Wahrscheinlichkeit dass jemand
HIV-positiv ist wenn er zwei mal positiv getestet wurde liegt schon bei 99.8%.
Wahrscheinlichkeitsrechnung
Hypothesentest bei großem Stichprobenumfang
Testen einer zweiseitigen Hypothese
Wahrscheinlichkeitsrechnung
Hypothesentest
Testen einer zweiseitigen Hypothese
Ein Würfel soll daraufhin überprüft werden, ob
die 6 mit einer Wahrscheinlichkeit von p = 1/6
angezeigt wird. Dazu wird 100mal gewürfelt.
Es wird ein Fehler von 5 % zugelassen. Bei
dem Test wurde 20mal die 6 gezählt
Wahrscheinlichkeitsrechnung
Hypothesentest
Testen einer zweiseitigen Hypothese
Nullhypothese
Wahrscheinlichkeit, mit der X eintritt: H0:p=1/6
Gegenhypothese
Wahrscheinlichkeit, mit der X nicht eintritt: H1:p1/6
Prüfvariable
Stichprobenumfang: X = 100 Wiederholungen
Ablehnungsbereich
Werte für Anzahl der 6 außerhalb des 5% Bereichs
Annahmebereich
Werte für Anzahl der 6 innerhalb des 5% Bereichs
Irrtumswahrscheinlichkeit Wahrscheinlichkeit, die Nullhypothese zu verwerfen,
obwohl sie zutrifft (Fehler 1. Art)
Wahrscheinlichkeit
Dass die Nullhypothese angenommen wird, obwohl
sie nicht zutrifft (Fehler 2. Art)
Statistische Sicherheit
1-
Wahrscheinlichkeitsrechnung
Hypothesentest
Testen einer zweiseitigen Hypothese
Berechnung:
Nullhypothese und Gegenhypothese: H0 = 1/6 H1  1/6
Stichprobenumfang: n = 100
Irrtumswahrscheinlichkeit:  = 0,05
Maximale Anzahl der 6 nach kumulierter Binomialverteilung für
n = 100; p = 1/6 P(X kmin)  0,05, ergibt: k = 10
minimale Anzahl der 6 nach kumulierter Binomialverteilung für
n = 100; p = 1/6 P(X  kmax)  0,05, bzw. P(X  kmax-1)  0,95
ergibt: kmax - 1 = 23 bzw. kmax = 24
Wahrscheinlichkeitsrechnung
Hypothesentest
Testen einer zweiseitigen Hypothese
Ergebnis:
Liegt das Ergebnis der 6 bei 100
Wiederholungen zwischen 11 und 23, so
ist der Würfel bei einer Irrtumswahrschienlichkeit von 10% in Ordnung.
Da die Anzahl beim Test 20 war, wird der
Würfel zugelassen.
Wahrscheinlichkeitsrechnung
Hypothesentest
Testen einer zweiseitigen Hypothese
Wahrscheinlichkeit des Fehlers 2.Art:
Die Wahrscheinlichkeit des Fehlers 2. Art kann
nur dann berechnet werden, wenn die
tatsächliche Wahrscheinlichkeit bekannt ist,
mit der eine 6 angezeigt wird. Diese
Wahrscheinlichkeit sei p = 0,2, dann gilt für
die kumulierte Binomialverteilung
n = 100, p = 0,2, k = 10,ergibt: P(X 10) = 0,0057
n = 100, p = 0,2, k = 24,ergibt: P(X 24) d.h. n = 100, p = 0,2, k-1= 23, ergibt.
1-P(X 23) = 1 – 0,8109 = 0,1891
P(X 10)+ P(X 24) = 0,0057 + 0,1891 = 0,1948, d.h. = 19,48%
Wahrscheinlichkeitsrechnung
Übungen für die Klausur
3.Aufgabe: In einer Urne sind 6 rote und 4 weiße Kugeln.
Es werden nacheinander 5 Kugeln ohne Zurücklegen
gezogen. Wie groß ist die Wahrscheinlichkeit der
folgenden Ereignisse?
a) Man zieht nur rote Kugeln
b) Man zieht zuerst alle weißen, dann eine rote Kugel.
c) Die erste Kugel ist weiß.
d) Man zieht abwechselnd weiße und rote Kugeln.
Es handelt sich hier um den Fall geordnete Stichprobe ohne Zurücklegen
Anzahl aller möglichen Ausfälle: 109876
P(A) = 65432/(109876) = 1/42
P(B) = 43216/(109876) = 1/210
P(C) = 49876/(109876) = 2/5
P(D) = P(rwrwr)+P(wrwrw) = 64534/(109876)+ 46352/(109876)=
1/21+1/42 = 1/14
Wahrscheinlichkeitsrechnung
Übungen für die Klausur
4.Aufgabe: Die Buchstaben des Wortes ANANAS werden
geschüttelt und neu angeordnet. Wie groß ist die
Wahrscheinlichkeit der folgenden Ereignisse?
a) Es entsteht wieder das Wort ANANAS.
b) Die Buchstabenkombination beginnt 3-mal A.
c) Es entsteht ein Wort mit dreifachem A direkt nacheinander.
Es handelt sich hier um den Fall geordnete Stichprobe ohne Zurücklegen
Anzahl aller möglichen Ausfälle: 654321
P(A) = 322111 /(654321) = 1/60
P(B) = 321321 /(654321) = 1/20
P(C) = 4P(B) = 1/5, da es für das dreifache A insgesamt 4-mal so viele
Möglichkeiten wie bei Ereignis B gibt.
Wahrscheinlichkeitsrechnung
Übungen für die Klausur
8.Aufgabe: Nach Untersuchung des Stat. Bundesamtes haben 56% der Männer
Übergewicht. Eine Stichprobe von 12 Männern wird zufällig genommen.
Betrachten Sie die Verteilung der Zufallsgröße X:Anzahl der übergewichtigen
Männer in der Stichprobe.
a) Bestimmen Sie das Maximum der Verteilung.
b) Bestimmen Sie die Wahrscheinlichkeitsverteilung.
c) Mit welcher Wahrscheinlichkeit sind in der Stichprobe mehr übergewichtige
Männer als Männer mit Normal- und Untergewicht?
a) Dieses ist der Erwartungswert E(X) = np mit n=12 und p =0,56 ergibt sich np
= 6,72, damit ist E(X) = 7.
b)
k
c) P(X>6) = 0,555
0
1
2
3
4
5
6
P(X=k) 0,0 0,001 0,006 0,024 0,068 0,139 0,207
7
8
9
10
11
12
0,226 0,179 0,102 0,39 0,009 0.001