Wahrscheinlichkeitsrechnung Das Phänomen Zufall 1.Pseudozufallszahlen 2.Würfeln 3.Münzwurf 4.Ziehen von Kugeln aus einer sog. Urne Wahrscheinlichkeitsrechnung Zufallsexperimente Zufallsexperiment Definition: Unter einem Zufallsexperiment versteht man einen in der realen Welt ablaufenden Vorgang, bei dem ein nicht vollständig vorhersehbarer Ausgang (Realisierung) aus einer Menge von möglichen Ausgängen realisiert wird. Wahrscheinlichkeitsrechnung Zufallsexperimente Der Ereignisraum. Beispiel: Das Zufallsexperiment besteht im 3-maligen Würfeln mit einem Würfel Ereignisraum ist: ={ {x1,x2,x3} | x1,x2,x3 {1,2,3,4,5,6}}. Die Liste {x1,x2,x3} entspricht dabei dem Ausgang beim ersten Wurf wird die Augenzahl x1 gewürfelt, beim zweiten Wurf wird die Augenzahl x2 gewürfelt, beim dritten Wurf wird die Augenzahl x3 gewürfelt. Die Teilmenge S = {{x1,x2,x3} | mit x1+x2+x3 = 5} von entspricht dann dem Ereignis es wird die Augensumme 5 gewürfelt. Wahrscheinlichkeitsrechnung Der Begriff der Wahrscheinlichkeit Definition: Jedem Ereignis A wird eine Zahl P[A] zugeordnet mit den folgenden Eigenschaften: 1.P[] = 1 2.Für alle Ereignisse A gilt P[A] 0 3. Für endlich viele disjunkte Ereignisse A1, A2, … gilt: P[A1 A2 … ] = P[A1] + P[A2] + … P heißt Wahrscheinlichkeit bzw. Wahrscheinlichkeitsmaß Wahrscheinlichkeitsrechnung Laplace Experimente Laplace 1749 - 1827 Definition: Unter einem Laplace-Experiment versteht man ein Zufallsexperiment mit endlich vielen möglichen Ausgängen 1, , .. n, bei dem auf Grund von geometrischen oder physikalischen Symmetrieüberlegungen alle Elementarereignisse {1} gleich wahrscheinlich sind. Wahrscheinlichkeitsrechnung Laplace Experimente Beispiele für Laplace-Experimente: 1. das mehrfache Werfen einer (homogenen) Münze bzw. eines (homogenen) Würfels. 2. das Ziehen von (bis auf ihre Farbe gleichartigen) Kugeln aus einer Urne 3. das Ziehen von (gleichartigen) Losen aus einer Urne 4. das zufällige Verteilen von Spielkarten auf mehrere Spieler Wahrscheinlichkeitsrechnung Zufallsexperimente mit Mathematica Random[ ] liefert eine auf dem Intervall [0,1] gleichmäßig verteilte Pseudozufallszahl Random[Integer,{1,6} ] liefert eine IntegerZufallszahl im Intervall von [1,6] Random[Real,{1,6} ] liefert eine Real-Zufallszahl im Intervall von [1,6] Wahrscheinlichkeitsrechnung Beispiele 1. Das Zufallsexperiment besteht im Würfeln mit einem Würfel. 2. Das Zufallsexperiment besteht im einmaligen Würfeln mit k Würfeln. Zufallsexperimente mit Mathematica Random[Integer,{1,6}] 2a. Das Zufallsexperiment besteht im k-maligen Würfeln mit einem Würfel. k=5; Table[Random[Integer,{1,6}],{k}] Wahrscheinlichkeitsrechnung Beispiele Zufallsexperimente mit Mathematica 3. Das Zufallsexperiment besteht im n-maligen Würfeln mit k Würfeln. k=5; n=10; Table[Table[Random[Integer,{1,6}],{k}],{n}] 4. Das Zufallsexperiment besteht im n-maligen Würfeln mit k Würfeln und der anschließenden Beobachtung der dabei jeweils gewürfelten Augensumme. k=3; n=20; Table[Apply[Plus,Table[Random[Integer,{1,6}],{k}]],{n}] Wahrscheinlichkeitsrechnung Grafische Darstellung der Ergebnisse Zufallsexperimente mit Mathematica Das Zufallsexperiment besteht im nmaligen Würfeln mit einem Würfel k = 1000; Wuerfel = Table[Random[Integer, {1, 6}], {k}] Eins = Count[Wuerfel, 1] Zwei = Count[Wuerfel, 2] Drei = Count[Wuerfel, 3] Vier = Count[Wuerfel, 4] Fuenf = Count[Wuerfel, 5] Sechs = Count[Wuerfel, 6] Wahrscheinlichkeitsrechnung Grafische Darstellung der Ergebnisse Zufallsexperimente mit Mathematica Das Zufallsexperiment besteht im nmaligen Würfeln mit einem Würfel << Graphics`Graphics` BarChart[{Eins, Zwei, Drei, Vier, Fuenf, Sechs}/k, BarSpacing -> 1.2, BarStyle -> {GrayLevel[0.3], GrayLevel[0.4], GrayLevel[0.5], GrayLevel[0.6], GrayLevel[0.7], GrayLevel[0.8]}] Wahrscheinlichkeitsrechnung Grafische Darstellung der Ergebnisse Zufallsexperimente mit Mathematica Das Zufallsexperiment besteht im nmaligen Würfeln mit einem Würfel 0.15 0.1 0.05 1 2 3 4 5 6 Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Die Kombinatorik liefert wichtige Modelle zum Berechnen von Laplace-Elementen Aus einer Urne mit n unterscheidbaren Kugeln werden k Kugeln gezogen. Dabei kann das Ziehen mit oder ohne Zurücklegen erfolgen, und die Reihenfolge eine oder keine Rolle spielen. Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Einer Urne mit n verschiedenen Kugeln werden nacheinander k Kugeln entnommen. Dabei ist prinzipiell zwischen zwei Arten der Ziehung zu unterscheiden: Ziehung ohne Zurücklegen, d.h. jede Kugel kann höchstens einmal gezogen werden, da sie nach der Ziehung ausscheidet Ziehung mit Zurücklegen, d.h. jede Kugel ist bei der nächsten Ziehung wieder dabei. Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Zusätzliche Unterscheidung: Soll die Reihenfolge der gezogenen Kugeln berücksichtigt werden oder nicht? Geordnete Stichprobe, die Reihenfolge der gezogenen Elemente wird berücksichtigt Ungeordnete Stichprobe, die Reihenfolge der gezogenen Elemente spielt keine Rolle Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Beispiele Wie viele 4-stellige Zahlen lassen sich mit den Ziffern 1, 3, 5, 7 darstellen, wenn jede Ziffer genau einmal auftreten muss? Fünf Personen möchten sich im Kino auf fünf (nebeneinander liegende) Plätze setzen. Auf wie viele Arten geht das? Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Eine Anordnung von n verschiedenen Elementen in einer bestimmten Reihenfolge heißt Permutation der n Elemente Satz: Die Anzahl P der Permutationen von n Elementen ist: P(n) = n (n-1) (n-2) …. 1 = n! Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Problem: Was passiert, wenn sich unter den Kugeln n1 gleiche befinden? Beispiel: Wie viele 5-stellige Zahlen kann man aus den Ziffern 2, 2, 2, 3, 5? Alle Anordnungen, die durch Vertauschen der gleichen Kugeln untereinander entstehen, fallen zusammen. Bei n1 gleichen Kugeln gibt es P(n1) = n1! Möglichkeiten, die gleichen Kugeln untereinander zu vertauschen. P(n;n1) = P(n) n! P(n1) n1! Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Unter den n Kugeln befinden sich jeweils n1, n2,…nk gleiche Kugeln. Dann gibt es n! P(n;n1;n2;…nk) = n ! n !...n ! 1 2 k verschiedene Anordnungsmöglichkeiten Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Beispiel 1: Wie viele Worte der Länge 2 lassen sich mit dem Alphabet {x,y,z} bilden, wenn 2 mal derselbe Buchstabe verboten ist? Beispiel 2: Bei wie vielen Zahlen zwischen 0 und 9999 kommen in der Dezimalschreibweise mit lauter verschiedene Ziffern vor? Wahrscheinlichkeitsrechnung Kombinatorik Das Urnenmodell Anzahl der Möglichkeiten beim Ziehen von k Kugeln aus einer Urne mit n Kugeln Ziehen mit Zürücklegen mit Beachtung der Reihenfolge ohne Beachtung der Reihenfolge nk nk 1 k Ziehen ohne Zurücklegen n! (nk)! n k Wahrscheinlichkeitsrechnung Kombinatorik Die Binomoninalkoeffizienten Das Pascalsche Dreieck 0-te Zeile 1 1-te Zeile 1 2-te Zeile 1 2 3-te Zeile 1 3 4-te Zeile 1 4 6 5-te Zeile 1 5 10 1 1 3 1 4 10 1 5 1 Man denke sich hier die Zeilen von n = 0 bis 5 durchnummeriert und die Spalten ergeben den jeweiligen k-Wert, wobei die linke 1 jeder Zeile jeweils für k = 0 steht. Wahrscheinlichkeitsrechnung Kombinatorik Die Binomoninalkoeffizienten Für die Berechnung der einzelnen Koeffizienten führt man die abkürzende Schreibweise ein: n n! k k!(nk)! Wahrscheinlichkeitsrechnung Definition: Zufallsvariable (Zufallsgröße) Definition: Es sei die (diskrete) Ergebnismenge eines Zufallsexperiments. Dann heißt jede Funktion (Abbildung) X:R Eine Zufallsvariable oder Zufallsgröße auf Anmerkung: Die Begriffe Zufallsvariable oder Zufallsgröße sind irreführend, da es sich weder um eine Variable noch um eine Größe, sondern um eine Funktion handelt. Zufallsvariable werden mit großen Buchstaben, wie X, Y, Z bezeichnet. Wahrscheinlichkeitsrechnung Definition: Wahrscheinlichkeitsverteilung Definition: Es sei (,P) ein diskreter Wahrscheinlichkeitsraum und X : R sei eine Zufallsvariable auf . Die Wahrscheinlichkeitsverteilung der Zufallsvariablen X ordnet den möglichen Werten xi von X mit i = 0 1, 2,..,n die Wahrscheinlichkeiten P(X=xi) zu. 1 (1,2) Ergebnisse eines Zufallsexperiments X1 3 Werte der Zufallsvariablen P(X = x1) P(X=3) Wahrscheinlichkeiten Wahrscheinlichkeitsrechnung Definition: Der Erwartungswert einer Zufallsgröße Definition: Eine Zufallsgröße X nehme die Werte a1, a2, .., am mit den Wahrscheinlichkeiten P(X=a1), P(X=a2),…,P(X=am) an. Dann wird der zu erwartende Mittelwert E(X) der Verteilung als Erwartungswert der Zufallsgröße X bezeichnet. Es gilt: E(X) = a1P(X=a1) + a2P(X=a2)+.. +amP(X=am)= ai P(X = ai) Der Erwartungswert wird auch mit bezeichnet. Wahrscheinlichkeitsrechnung Vorbetrachtungen zum Bernoulli-Experiment In einer Urne befinden sich 10 Kugeln, davon 3 rote. Wie ziehen 5 mal mit Zurücklegen und notieren das Ergebnis mit Beachtung der Reihenfolge. A. Genau die ersten beiden Kugeln sind rot. Berechnen Sie die Wahrscheinlichkeit B. Genau die 1.und die 4. gezogene Kugel sind rot. Berechnen Sie die Wahrscheinlichkeit C. Genau 2 der 5 gezogenen Kugeln sind rot. Berechnen Sie die Wahrscheinlichkeit Wahrscheinlichkeitsrechnung Das Bernoulli-Experiment Definition: Ein Zufallsexperiment mit nur 2 möglichen Ergebnissen (welche oftmals z.B. als Treffer und Niete bezeichnet werden) heißt Bernoulli-Experiment. Wenn das Ereignis A eintritt, spricht man von Erfolg mit der Erfolgswahrscheinlichkeit P(A) = p Wenn das Ereignis A nicht eintritt, spricht man von Misserfolg mit der Erfolgswahrscheinlichkeit P(A) = 1-p. Einmaliges Ziehen aus der vorherigen Urne und überprüfen, ob man rot gezogen hat, ist ein Bernoulli-Experiment. Die Wahrscheinlichkeit für Erfolg (rot) ist p = 0,3. Die Wahrscheinlichkeit für Misserfolg ist (nicht rot) ist q = 1 – p = 0,3. Wahrscheinlichkeitsrechnung Das Bernoulli-Experiment – weitere Beispiele Einfache Beispiele sind: a)Das wiederholte Werfen einer Münze oder eines Würfels. b)Das wiederholte Ziehen mit Zurücklegen von Kugeln aus einer Urne. c) Das laufende Befragen von zufällig ausgewählten Personen (Meinungsumfrage). d)Das laufende Überprüfen der Qualität eines Produktionsprozesses (Qualitätskontrolle). Kein Bernoulli-Experiment ist Mehrmaliges Ziehen aus einer Urne ohne Zurücklegen Wahrscheinlichkeitsrechnung Das Bernoulli-Kette Definition: Ein n-stufiges Bernoulli-Experiment heißt Bernoulli-Kette der Länge n Beispiel Fünfmaliges Ziehen aus einer Urne mit 10 Kugeln, davon 3 rote, und überprüfen, ob man rot gezogen hat. Dies ist eine Bernoulli-Kette der Länge 5. Wahrscheinlichkeitsrechnung Das Bernoulli-Formel Definition: Bei einer Bernoulli-Kette der Länge n mit der Trefferwahrscheinlichkeit p kann man die Wahrscheinlichkeit für die Anzahl k der Treffer nach der Bernoulli-Formel berechnen P(X k) n k pk qnk n k p k (1p)nk Beispiel Fünfmaliges Ziehen aus einer Urne mit 10 Kugeln, davon 3 rote. Wie groß ist die Wahrscheinlichkeit, dass 2 der gezogenen Kugeln rot sind? 5 P(X 2) 0,3 2 0,7 3 30,9 % 2 Wahrscheinlichkeitsrechnung Die Binomialverteilung Definition: Die nach der Bernoulli-Formel berechnete Wahrscheinlichkeitsverteilung P (X = k) heißt Binomialverteilung Bn;p (k). Beispiel Fünfmaliges Ziehen aus einer Urne mit 10 Kugeln, davon 3 rote. Berechnet wird die Wahrscheinlichkeit, dass genau 0,1,2,3,4 oder 5 der gezogenen Kugeln rot sind. Man erhält folgende Wahrscheinlichkeitsverteilung k P(X=k) 0 1 2 3 4 5 16,8% 36,0% 30,9% 13,2% 2,8% 0,2% Wahrscheinlichkeitsrechnung Die Binomialverteilung k P(X=k) 0 1 2 3 4 16,8% 36,0% 30,9% 13,2% 2,8% 5 0,2% Wahrscheinlichkeitsrechnung Der Erwartungswert einer Binomialverteilung Wahrscheinlichkeitsrechnung Der Erwartungswert einer Binomialverteilung k P (X = k) k*P(X=k) 0 q 1 p 0 p E(X) = p k P (X = k) k*P(X=k) 0 q2 0 1 2pq 2pq 2 p2 2p2 E(X) = 2pq +2p2 =2p (q+p) = 2p Wahrscheinlichkeitsrechnung Der Erwartungswert einer Binomialverteilung k P (X = k) k*P(X=k) 0 q3 0 1 3pq2 3pq2 E(X) = 3p(q2 + 2pq +p) 2 3p2 q 6p2 =3p (q+p)2 = 3p2 3 p3 3p3 q Gegeben Sei ein n-stufiger Bernoulli-Versuch mit der Erfolgswahrscheinlichkeit p. Für den Erwartungswert der Zufallsgröße X: Anzahl der Erfolge gilt: = E(X) = n p Wahrscheinlichkeitsrechnung Varianz und Standardabweichung als Maße für die Streuung einer Wahrscheinlichkeitsverteilung Varianz und Standardabweichung einer Zufallsgröße Eine Zufallsgröße X mit dem Erwartungswert nehme die Werte a1, a2,.., am mit den Wahrscheinlichkeiten P(X=a1), P(X=a2),…,P(X=am) an. Als Varianz V(X) der Zufallsgröße X bezeichnet man die zu erwartende mittlere quadratische Abweichung vom Erwartungswert der Zufallsgröße X, also: V(X) =(a1 - )2 P(X=a1) + (a- )2 P(X=a2) + …+(am - )2 P(X=am) Die Quadratwurzel aus der Varianz einer Zufallsgröße heißt Standardabweichung : = V(X) Wahrscheinlichkeitsrechnung Varianz und Standardabweichung als Maße für die Streuung einer Wahrscheinlichkeitsverteilung Varianz und Standardabweichung einer Zufallsgröße Man kann die Formel V(X) =(a1 - )2 P(X=a1) + (a2- )2 P(X=a2) + …+(am - )2 P(X=am) für die Berechnung der Varianz vereinfachen V(X) = [(a1)2 P(X=a1) + (a2)2 P(X=a2) + …+(am )2 P(X=am)] - 2 Wahrscheinlichkeitsrechnung Bei zunehmendem Stichprobenumfang werden die Histogramme von Binomialverteilungen immer breiter und flacher und sie nehmen immer stärker eine symmetrische Gestalt an. Wahrscheinlichkeitsrechnung Varianz und Standardabweidung bei Binomialverteilungen Streuen die Ergebnisse der beiden Zufallsversuche im gleichen Maße um den Erwartungswert? Wahrscheinlichkeitsrechnung Varianz und Standardabweidung bei Binomialverteilungen Wir betrachten das Ereignis X: Anzahl der Würfe mit der Augenzahl 6 beim 3fachen Würfeln k P(X = k) k2 P(X=k) 0 1 (1/6)0 (5/6)3 0 125/216 = 0 1 3 (1/6)1 (5/6)2 1 75/216 = 75/216 2 3 (1/6)2 (5/6)1 4 15/216 =60/216 3 1 (1/6)3 (5/6)0 9 1/216 = 9/126 Damit ergibt sich für V(X) = 144/216 – (3 1/6)2 = 90/216 = 5/12 Wahrscheinlichkeitsrechnung Varianz und Standardabweidung bei Binomialverteilungen 1-stufiges Bernoulli-Versuch: = 1 p 2-stufiges Bernoulli-Versuch: = 2 p k P(X = k) k2 P(X=k) 0 q 0 q2 0 q2 1 p 1 2pq 1 2pq 2 p2 4 p2 k P(X = k) k2 P(X=k) 0 q 1 p 3-stufiges Bernoulli-Versuch: = 3 p k P(X = k) k2 P(X=k) 0 q3 0 q3 1 3pq2 1 3pq2 2 3p2q 4 3p2q 3 p3 9 p3 Wahrscheinlichkeitsrechnung Varianz und Standardabweidung bei Binomialverteilungen Gegeben ist ein n-stufiger Bernoulli-Versuch mit der Erfolgswahrscheinlichkeit p und der Misserfolgswahrscheinlichkeit q = 1 – p. Die Zufallsgröße X : Anzahl der Erfolge hat die Varianz V(X) = n p q und die Standardabweichung = npq Wahrscheinlichkeitsrechnung Wahrscheinlichkeiten von -Umgebungen Die Histogramme von Binomialverteilungen werden immer flacher und breiter, wenn der Stichprobenumfang n zunimmt. Dem Maximum einer solchen Verteilung kommt keine allzu große Wahrscheinlichkeit zu; vielmehr treten die Nachbarwerte des Maximums mit vergleichbaren Wahrscheinlichkeiten auf. Wahrscheinlichkeitsrechnung Wahrscheinlichkeiten von -Umgebungen Unter einer Umgebung des Erwartungswertes versteht man die Intervalle, die in der Form - r X + r notiert werden können Die halbe Breite dieser Treppenfiguren bezeichnet man als Radius der Umgebung des Erwartungswertes bezeichnet. Wahrscheinlichkeitsrechnung Wahrscheinlichkeiten von -Umgebungen Dieser Radius einer Umgebung wird mit der berechneten Standardabweichung verglichen. wird als Maßeinheit genommen. Es wird angegeben, wie oft diese Maßeinheit in den Radius passt. Beispiele: (1) r = 0,5; also r/ = 0,5 / 4,58 0,11; d.h. r 0,11 (2) r = 1,5; also r/ = 1,5 / 4,58 0,33; d.h. r 0,33 Wahrscheinlichkeitsrechnung Wahrscheinlichkeiten von -Umgebungen Regeln über -Umgebungen von Jedem Radius einer Umgebung des Erwartungswertes lässt sich eine bestimmte Wahrscheinlichkeit für diese Umgebung zuordnen. Umgekehrt gehören zu bestimmten Wahrscheinlichkeiten für Umgebungen um den Erwartungswert bestimmte Radien. Dies gilt nahezu unabhängig von der Erfolgswahrscheinlichkeit p, die dem n-stufigen Bernoulli-Versuch zugrunde liegt, und dem Stichprobenumfang n. Diese Regel gilt umso genauer, je größer n ist, insbesondere falls = npq > 3 (so genannte Laplace-Bedingung) Wahrscheinlichkeitsrechnung Wahrscheinlichkeiten von -Umgebungen Wahrscheinlichkeiten von Umgebungen um den Erwartungswert bei Binomialverteilungen (-Regeln) Radius der Wahrscheinlichkeit Umgebung der Umgebung Wahrscheinlichkeit Radius der der Umgebung Umgebung 1 0,68 0,90 1,64 2 0,955 0,95 1,96 3 0,997 0,99 1,58 Wahrscheinlichkeitsrechnung Hypothesentest bei großem Stichprobenumfang Testen einer zweiseitigen Hypothese Mit einem medizinischen Test soll festgestellt werden, ob eine Person eine bestimmte Krankheit hat oder gesund ist. Im Falle eines statistischen Tests ist die Nullhypothese also "Die Person ist krank". Aus dem tatsächlichen Gesundheitszustand des Patienten (gesund/krank) und dem Testergebnis (positiv/negativ) sind folgende Kombinationen möglich (dargestellt als sogenannte Confusion Matrix): Person ist krank(a+c) Person ist gesund(b+d) Test positiv (a+b) richtig positiv(a) falsch positiv(b) Test negativ(c+d) falsch negativ(c) richtig negativ (d) Wahrscheinlichkeitsrechnung Hypothesentest bei großem Stichprobenumfang Die Nullhypothese In der Statistik ist die Nullhypothese eine Annahme über die Wahrscheinlichkeitsverteilung einer Zufallsvariablen, die als wahr betrachtet wird, bis sie durch einen statistischen Test widerlegt werden kann. Die Alternativhypothese steht dabei für eine Menge von Ergebnissen, die der Nullhypothese nicht entsprechen. Die Aufgabe, zwischen Null- und Alternativhypothese zu entscheiden, wird als Testproblem bezeichnet. Spricht das Stichprobenergebnis gegen die Annahme, so wird die Hypothese abgelehnt; andernfalls wird sie beibehalten. Wahrscheinlichkeitsrechnung Hypothesentest bei großem Stichprobenumfang Testen einer zweiseitigen Hypothese Person ist krank(a+c) Person ist gesund(b+d) Test positiv (a+b) richtig positiv(a) falsch positiv(b) Test negativ(c+d) falsch negativ(c) richtig negativ (d) In den Fällen a (Person ist krank und die Krankheit wird erkannt) und d (Person ist gesund und der Test meldet keine Krankheit) ist die Einteilung richtig. In den Fällen b (Falsche Diagnose auf Krankheit) und c (Krankheit wird nicht erkannt) liegt ein Fehler vor. Den Fehler durch das in Fall b erhaltene falsch positiv Ergebnis bezeichnet man auch als Fehler 2. Art und den Fehler durch das in Fall c erhaltene falsch negativ Ergebnis als Fehler 1. Art. Wahrscheinlichkeitsrechnung Hypothesentest Der Hypothesentest beinhaltet: 1.die Formulierung einer Hypothese aufgrund theoretischer Vermutungen oder anderem Wissen 2.die Umsetzung der Sachhypothesen in statistische Hypothesen 3.Wahl einer Entscheidungsregel, ab wann eine Hypothese angenommen bzw. verworfen wird 4.Wahl und Rekrutierung (ggf. durch bestimmte Verfahren) einer Stichprobe von Versuchspers. 5.Berechnen der Stichprobenkennzahl (Versuchsergebnis) 6.Anwenden der Entscheidungsregel auf die Stichprobenkennzahl 7.Entscheidung (Ablehnen oder Annahme der Hypothese). Wir haben in einem ersten Schritt bereits eine Sachhypothese aufgestellt, diese ist nun in eine statistische Hypothese zu überführen. Die Verwendung statistischer Grundlagen für das Testen von Hypothesen macht diesen Schritt notwendig. Statistische Methoden bieten viele unterschiedliche Möglichkeiten, objektive Kennwerte auf ihre Auftretenswahrscheinlichkeit hin zu überprüfen oder mehrere Kennwerte miteinander zu vergleichen. Daher bietet sich in statistischer Hypothesentest als Mittel der Wahl an. Bei der Überprüfung von Hypothesen können wir zwei Fehler begehen: Die Nullhypothese wird verworfen, obwohl sie in der Wirklichkeit zutrifft Die Alternativhypothese wird verworfen, obwohl sie in der Wirklichkeit zutrifft Wahrscheinlichkeitsrechnung Hypothesentest bei großem Stichprobenumfang Testen einer zweiseitigen Hypothese Wahrer Sachverhalt H0 Wahrer Sachverhalt H1 durch einen stat. Test fällt eine Entscheidung für die Nullhypothese H0 1-alpha beta (Fehler 2. Art falsch negativ) durch einen stat.Test fällt eine Entscheidung für die alternative Hypothese H1 alpha (Fehler 1. Art, falsch positiv) 1-beta Ein alpha-Fehler ist schwerwiegend: Die Hypothese H1 mit ihren Konsequenzen wird fälschlicherweise als richtig angesehen. Ein beta-Fehler (H0 wird fälschlicherweise nicht abgelehnt) hat keine Auswirkungen, da man keine Entscheidung trifft, also nicht etwa H1 favorisiert. Wahrscheinlichkeitsrechnung Hypothesentest Fehler 1. Art Vom Fehler 1. Art (alpha) spricht man, wenn man einen Effekt annimmt, der in Wirklichkeit gar nicht vorhanden ist. Mathematisch formuliert: die so genannte Ausgangshypothese "H0" abgelehnt wird, obwohl sie richtig ist. Die Ausgangshypothese (H0, "null" für keinen Unterschied) ist hierbei die Annahme, die Testsituation befinde sich im "Normalzustand", d.h. in den oben genannten Beispielen "es brennt nicht", "der Angeklagte ist unschuldig", "der Patient ist gesund" oder "die Person hat Zugangsberechtigung". Wird also dieser "Normalzustand" nicht erkannt, obwohl er tatsächlich vorliegt, handelt es sich um einen Fehler 1. Art. Beispielsweise wird eine Person zu Unrecht als krank bezeichnet, obwohl sie tatsächlich gesund ist. Falsch Positive (englisch: false positives) sind zu Unrecht als krank bezeichnete Gesunde. Wahrscheinlichkeitsrechnung Hypothesentest Fehler 2. Art Ein Fehler 2. Art (beta) liegt im umgekehrten Fall vor, wenn man es versäumt, einen Effekt als signifikant zu erklären, obwohl es ihn tatsächlich gibt, bzw.: wenn die Ausgangshypothese nicht abgelehnt wurde, obwohl sie falsch ist. Hier wird also nicht erkannt, dass nicht der "Normalzustand" vorliegt. Die solcherart falsch klassifizierten Zustände werden falsch negativ genannt. Beispielsweise wird eine Person zu Unrecht als gesund bezeichnet, obwohl sie tatsächlich krank ist. Falsch Negative (englisch: false negatives) sind nicht entdeckte Kranke. Wahrscheinlichkeitsrechnung Hypothesentest Beispiele für Fehler Aids Welche Konsequenzen ein falsch positiver Test haben kann, zeigt das Beispiel eines Menschen der sich auf HIV testen ließ. Der Test war positiv. Daraufhin beendete der Mensch sein Leben durch Selbsttötung. Hinterher stellte sich heraus, dass er gar nicht von HI-Viren befallen war. Der Test war falsch positiv ausgefallen. Bei einer angenommenen Genauigkeit von 99,9 % des kombinierten AIDS-Tests sowohl für positive als auch negative Ergebnisse und der aktuellen Verbreitung von AIDS (Stand 2003) in der Deutschen Bevölkerung (80.000.000 Einwohner, davon 40.000 HIV-positiv) wäre ein allgemeiner AIDS-Test verheerend. Von 40.000 tatsächlich Erkrankten würden bei lediglich 40 HIV-Infizierten Menschen die Krankheit fälschlicherweise nicht erkannt. Etwa 80.000 Personen würden jedoch fälschlicherweise als HIV-Positiv diagnostiziert. Von 120.000 positiven Ergebnissen wären etwa 66 % falsch positiv. Somit liegt die Wahrscheinlichkeit dass jemand der positiv getestet wurde auch wirklich HIV-positiv ist bei nur 33%. Ein zweiter Test kann die Unsicherheit hingegen drastisch reduzieren. Die Wahrscheinlichkeit dass jemand HIV-positiv ist wenn er zwei mal positiv getestet wurde liegt schon bei 99.8%. Wahrscheinlichkeitsrechnung Hypothesentest bei großem Stichprobenumfang Testen einer zweiseitigen Hypothese Wahrscheinlichkeitsrechnung Hypothesentest Testen einer zweiseitigen Hypothese Ein Würfel soll daraufhin überprüft werden, ob die 6 mit einer Wahrscheinlichkeit von p = 1/6 angezeigt wird. Dazu wird 100mal gewürfelt. Es wird ein Fehler von 5 % zugelassen. Bei dem Test wurde 20mal die 6 gezählt Wahrscheinlichkeitsrechnung Hypothesentest Testen einer zweiseitigen Hypothese Nullhypothese Wahrscheinlichkeit, mit der X eintritt: H0:p=1/6 Gegenhypothese Wahrscheinlichkeit, mit der X nicht eintritt: H1:p1/6 Prüfvariable Stichprobenumfang: X = 100 Wiederholungen Ablehnungsbereich Werte für Anzahl der 6 außerhalb des 5% Bereichs Annahmebereich Werte für Anzahl der 6 innerhalb des 5% Bereichs Irrtumswahrscheinlichkeit Wahrscheinlichkeit, die Nullhypothese zu verwerfen, obwohl sie zutrifft (Fehler 1. Art) Wahrscheinlichkeit Dass die Nullhypothese angenommen wird, obwohl sie nicht zutrifft (Fehler 2. Art) Statistische Sicherheit 1- Wahrscheinlichkeitsrechnung Hypothesentest Testen einer zweiseitigen Hypothese Berechnung: Nullhypothese und Gegenhypothese: H0 = 1/6 H1 1/6 Stichprobenumfang: n = 100 Irrtumswahrscheinlichkeit: = 0,05 Maximale Anzahl der 6 nach kumulierter Binomialverteilung für n = 100; p = 1/6 P(X kmin) 0,05, ergibt: k = 10 minimale Anzahl der 6 nach kumulierter Binomialverteilung für n = 100; p = 1/6 P(X kmax) 0,05, bzw. P(X kmax-1) 0,95 ergibt: kmax - 1 = 23 bzw. kmax = 24 Wahrscheinlichkeitsrechnung Hypothesentest Testen einer zweiseitigen Hypothese Ergebnis: Liegt das Ergebnis der 6 bei 100 Wiederholungen zwischen 11 und 23, so ist der Würfel bei einer Irrtumswahrschienlichkeit von 10% in Ordnung. Da die Anzahl beim Test 20 war, wird der Würfel zugelassen. Wahrscheinlichkeitsrechnung Hypothesentest Testen einer zweiseitigen Hypothese Wahrscheinlichkeit des Fehlers 2.Art: Die Wahrscheinlichkeit des Fehlers 2. Art kann nur dann berechnet werden, wenn die tatsächliche Wahrscheinlichkeit bekannt ist, mit der eine 6 angezeigt wird. Diese Wahrscheinlichkeit sei p = 0,2, dann gilt für die kumulierte Binomialverteilung n = 100, p = 0,2, k = 10,ergibt: P(X 10) = 0,0057 n = 100, p = 0,2, k = 24,ergibt: P(X 24) d.h. n = 100, p = 0,2, k-1= 23, ergibt. 1-P(X 23) = 1 – 0,8109 = 0,1891 P(X 10)+ P(X 24) = 0,0057 + 0,1891 = 0,1948, d.h. = 19,48% Wahrscheinlichkeitsrechnung Übungen für die Klausur 3.Aufgabe: In einer Urne sind 6 rote und 4 weiße Kugeln. Es werden nacheinander 5 Kugeln ohne Zurücklegen gezogen. Wie groß ist die Wahrscheinlichkeit der folgenden Ereignisse? a) Man zieht nur rote Kugeln b) Man zieht zuerst alle weißen, dann eine rote Kugel. c) Die erste Kugel ist weiß. d) Man zieht abwechselnd weiße und rote Kugeln. Es handelt sich hier um den Fall geordnete Stichprobe ohne Zurücklegen Anzahl aller möglichen Ausfälle: 109876 P(A) = 65432/(109876) = 1/42 P(B) = 43216/(109876) = 1/210 P(C) = 49876/(109876) = 2/5 P(D) = P(rwrwr)+P(wrwrw) = 64534/(109876)+ 46352/(109876)= 1/21+1/42 = 1/14 Wahrscheinlichkeitsrechnung Übungen für die Klausur 4.Aufgabe: Die Buchstaben des Wortes ANANAS werden geschüttelt und neu angeordnet. Wie groß ist die Wahrscheinlichkeit der folgenden Ereignisse? a) Es entsteht wieder das Wort ANANAS. b) Die Buchstabenkombination beginnt 3-mal A. c) Es entsteht ein Wort mit dreifachem A direkt nacheinander. Es handelt sich hier um den Fall geordnete Stichprobe ohne Zurücklegen Anzahl aller möglichen Ausfälle: 654321 P(A) = 322111 /(654321) = 1/60 P(B) = 321321 /(654321) = 1/20 P(C) = 4P(B) = 1/5, da es für das dreifache A insgesamt 4-mal so viele Möglichkeiten wie bei Ereignis B gibt. Wahrscheinlichkeitsrechnung Übungen für die Klausur 8.Aufgabe: Nach Untersuchung des Stat. Bundesamtes haben 56% der Männer Übergewicht. Eine Stichprobe von 12 Männern wird zufällig genommen. Betrachten Sie die Verteilung der Zufallsgröße X:Anzahl der übergewichtigen Männer in der Stichprobe. a) Bestimmen Sie das Maximum der Verteilung. b) Bestimmen Sie die Wahrscheinlichkeitsverteilung. c) Mit welcher Wahrscheinlichkeit sind in der Stichprobe mehr übergewichtige Männer als Männer mit Normal- und Untergewicht? a) Dieses ist der Erwartungswert E(X) = np mit n=12 und p =0,56 ergibt sich np = 6,72, damit ist E(X) = 7. b) k c) P(X>6) = 0,555 0 1 2 3 4 5 6 P(X=k) 0,0 0,001 0,006 0,024 0,068 0,139 0,207 7 8 9 10 11 12 0,226 0,179 0,102 0,39 0,009 0.001