Stetige Zufallsgrößen 191 6.1 Stetige Zufallsgrößen 6.1.1 Stetige Merkmale – Dichtefunktion einer stetigen Zufallsgröße Aufgabe 1 Bei einem Glücksrad dreht sich ein Zeiger, der gegenüber einer festen Richtung (z. B. horizontal nach rechts) beliebige Winkel 0 X < 2p annehmen kann. Wir betrachten verschiedene Fälle der Zufallsgröße X: Stellung des Zeigers (beschrieben durch einen Winkel von einer festgelegten Richtung aus) (1) Das Glücksrad hat gleich große Sektoren Mit welcher Wahrscheinlichkeit bleibt der Zeiger auf den Sektoren 1, 2, 3, 4, 5 stehen? Stelle die Verteilung der Zufallsgröße X mithilfe eines Histogramms dar. Beachte: Bei Histogrammen werden Werte von Größen durch Flächeninhalte dargestellt. (2) Das Glücksrad hat verschieden große Sektoren Mit welcher Wahrscheinlichkeit bleibt der Zeiger auf den Sektoren 1, 2, 3 stehen? Stelle die Verteilung der Zufallsgröße X mithilfe eines Histogramms dar; dabei sollen die Rechtecke gleiche Höhe haben, sich jedoch in der Breite unterscheiden. Welche Höhe müssen die Rechtecke haben? (3) Das Glücksrad hat keine Sektoren Ein Bereich zwischen den Winkeln a und b werde markiert. Mit welcher Wahrscheinlichkeit tritt das Ereignis X mit a X b und 0 a < b 2p ein? Stelle die Verteilung der Zufallsgröße X: Stellung des Zeigers mithilfe eines Histogramms dar. Hinweis: Man lege die feste Ursprungsrichtung so, dass sie nicht durch den betrachteten Sektor verläuft. Lösung (1) Die Wahrscheinlichkeit ist für alle 5 Werte gleich groß: P(X ¼ 1) ¼ P(X ¼ 2) 1 ¼ P(X ¼ 3) ¼ P(X ¼ 4) ¼ P(X ¼ 5) ¼ 5 . Das Histogramm besteht aus 5 Rechtecken, 1 2p die alle jeweils die Höhe 2p und die Breite 5 haben. 192 S T E T I G E Z U F A L L S G R S S E N – N O R M A LV E R T E I L U N G (2) Die Wahrscheinlichkeiten entsprechen der Größe der Winkel. Es gilt also: P(X ¼ 1) ¼ 16 ; P(X ¼ 2) ¼ 13 ; P(X ¼ 3) ¼ 12 (wie man sich auch durch Einzeichnen von 6 gleich großen Sektoren überlegen kann). 1 , jedoch die Breiten p3 , Die Rechtecke des Histogramms haben wie in (1) die Höhe 2p 2p und p, sodass die Gesamtfläche wieder gleich 1 ist. 3 (3) Analog zu (1), (2) besteht das Histogramm aus 3 Rechtecken, die jeweils die Höhe 1 haben. 2p Die Wahrscheinlichkeit für das Ereignis P(a X b) ist daher: a P(a X b) ¼ b2p Information (1) Stetige Verteilungen als Idealisierungen von diskreten Verteilungen Mithilfe der Sterbetafeln von Seite 18 ist das folgende Histogramm erstellt worden. Aus dem Diagramm ist ablesbar, mit welcher Wahrscheinlichkeit ein männlicher Neugeborener im Lebensalter zwischen a Jahren und a þ 5 Jahren stirbt. Analog kann man auch ein verfeinertes Histogramm zum gleichen Sachverhalt zeichnen, wenn man eine Sterbetafel vorliegen hat, die in Abständen von 1 Jahr angibt, wie viele von 100 000 Neugeborenen nach a Jahren noch leben. Stetige Zufallsgrößen 193 Beachte: Der Flächeninhalt aller Rechtecke zusammen muss 1 sein. Es liegt nahe sich vorzustellen, dass man noch beliebig weiter verfeinern kann. Dies stellt eine Idealisierung des Sachverhalts dar. Statt der treppenartigen Histogramme erhält man dann den Graphen einer stetigen Funktion, die so genannte Dichtefunktion der Zufallsgröße X. (2) Dichtefunktion einer stetigen Zufallsgröße Zufallsgrößen, die beliebige Werte in einem Intervall annehmen können, bezeichnet man als stetige Zufallsgrößen. Die Wahrscheinlichkeitsverteilung einer stetigen Zufallsgröße wird durch eine so genannte Dichtefunktion beschrieben. Dichtefunktion einer stetigen Zufallsgröße Eine Funktion f heißt Dichtefunktion einer stetigen Zufallsgröße X, wenn folgende Eigenschaften erfüllt sind: (1) Für alle x 2 R gilt: f(x) 0 Ðb (2) P(a X b) ¼ f(x) dx þ1 a Ð f(x) dx ¼ 1 (3) 1 Eine Zufallsgröße und deren Verteilung heißen stetig, falls es eine geeignete Dichtefunktion mit den Eigenschaften (1) bis (3) gibt. 194 S T E T I G E Z U F A L L S G R S S E N – N O R M A LV E R T E I L U N G Die Eigenschaft (1) der Nicht-Negativität ist plausibel, da dann für die Wahrscheinlichkeit von beliebigen Ereignissen E folgt: P(E) ¼ P(a X b) 0. Ebenso leuchtet die „Summeneigenschaft“ (3) ein, da auch bei den bisher behandelten Verteilungen die Summe der Wahrscheinlichkeiten aller Ergebnisse gleich eins ist. Ðb f(x) dx. Statt Eigenschaft (2) betrachtet man oft auch die Beziehung P(X b) ¼ 1 Die zugehörige Funktion b 7! F(b) ¼ P(X b) wird als Verteilungsfunktion der Zufallsgröße X bezeichnet. Sie entspricht den kumulierten Verteilungen bei den bisher betrachteten Zufallsgrößen. Hinweis: Man beachte, dass der Wert f(a) der Dichtefunktion an der Stelle a nicht mit der Wahrscheinlichkeit für a verwechselt werden darf. (3) Unmögliche Ereignisse bei diskreten Verteilungen – Ereignisse mit Wahrscheinlichkeit null bei stetigen Verteilungen Die in den Kapiteln 1 bis 5 behandelten Zufallsgrößen waren so genannte diskrete Zufallsgrößen: Sie konnten nur endlich viele Werte oder höchstens abzählbar unendlich viele Werte annehmen. Wenn ein bestimmter Wert bei einem Zufallsversuch nicht angenommen werden konnte, dann hatte er die Wahrscheinlichkeit null (unmögliches Ereignis). Bei stetigen Größen ist dies anders: Die Zufallsgröße kann kontinuierlich alle Werte aus einem Intervall annehmen. Die Wahrscheinlichkeit, dass genau der Wert a angenomÐa men wird, berechnet sich gemäß Definition (2) als P(X ¼ a) ¼ P(a X a) ¼ f(x) dx. a Aus der Integralrechnung wissen wir, dass dies gleich null ist, d. h. für alle a 2 R gilt: P(X ¼ a) ¼ 0. Dies bedeutet allerdings nicht, dass das Ereignis X ¼ a ein unmögliches Ereignis ist! (So würde man bei diskreten Zufallsgrößen schließen!) (4) Rechteckverteilung als Beispiel einer stetigen Verteilung In der Einführung haben wir als Beispiel eine so genannte Rechteckverteilung kennen gelernt. Die Bezeichnung rührt von der Form des Graphen her: Für die Dichtefunktion f gilt offensichtlich: für x < 0 1 2p für 0 x 2p 0 für x > 2p |fflfflfflfflfflffl{zfflfflfflfflfflffl} f(x) ¼ 0 a , sofern 0 a, b 2p Damit gilt: P(a x b) ¼ b2p Allgemein bezeichnet man jede Verteilung mit |fflfflfflffl{zfflfflfflffl} f(x) ¼ 1 für sr 0 r<x<s ðÞ ðÞ für alle sonstigen x2R als Rechteckverteilung. (5) Gausssche Dichtefunktion In Abschnitt 4.2.3 (Seite 154) haben wir die Gausssche Dichtefunktion kennen gelernt, mit deren Hilfe näherungsweise Wahrscheinlichkeiten bei Binomialverteilungen berechnet werden konnten (Näherungsformeln von Moivre und Laplace). Mit dieser Funktion und der zugehörigen Verteilung werden wir uns in Kapitel 6.2 besonders befassen. Stetige Zufallsgrößen 195 bungsaufgaben 2. Skizziere den Graphen der Dichtefunktion, die zur Sterbetafel für weibliche Neugeborene gehört. Entnimm dazu zunächst der Tabelle die Wahrscheinlichkeit, mit der eine Neugeborene im Alter zwischen a und a þ 1 Jahren stirbt, skizziere dazu einen Polygonzug. a 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Wahrsch. 0,00414 0,00040 0,00024 0,00017 0,00015 0,00010 0,00011 0,00012 0,00009 0,00010 0,00009 0,00010 0,00011 0,00012 0,00014 a Wahrsch. a Wahrsch. a Wahrsch. a Wahrsch. a Wahrsch. 15 0,00020 30 0,00038 45 0,00174 60 0,00551 75 0,02222 16 0,00024 31 0,00041 46 0,00189 61 0,00588 76 0,02446 17 0,00028 32 0,00045 47 0,00205 62 0,00653 77 0,02735 18 0,00037 33 0,00050 48 0,00224 63 0,00721 78 0,02912 19 0,00036 34 0,00055 49 0,00240 64 0,00794 79 0,03109 20 0,00033 35 0,00062 50 0,00264 65 0,00869 80 0,03208 21 0,00031 36 0,00069 51 0,00281 66 0,00951 81 0,03567 22 0,00029 37 0,00078 52 0,00304 67 0,01049 82 0,03887 23 0,00027 38 0,00085 53 0,00331 68 0,01163 83 0,04046 24 0,00030 39 0,00095 54 0,00349 69 0,01264 84 0,04202 25 0,00032 40 0,00105 55 0,00378 70 0,01388 85 0,04257 26 0,00031 41 0,00119 56 0,00396 71 0,01531 86 0,04282 27 0,00033 42 0,00128 57 0,00432 72 0,01698 87 0,04319 28 0,00036 43 0,00150 58 0,00451 73 0,01826 88 0,04242 29 0,00036 44 0,00157 59 0,00495 74 0,02014 89 0,04071 3. Ein Zufallszahlengenerator liefere Zufallszahlen aus dem Intervall [0; 1[. In der Abbildung ist das Histogramm einer Häufigkeitsverteilung für die Intervalle [0; 0,01[, [0,01; 0,02[, [0,02; 0,03[, . . . dargestellt. Gib die Dichtefunktion der zugehörigen Zufallsgröße an und zeichne deren Graphen. 4. Welchen Wert muss der Faktor k haben, sodass die Funktion f eine Dichtefunktion ist? |fflffl{zfflffl} f(x) ¼ kx für 0 x < 1 0 für alle sonstigen x2R 5. Man zeige, dass die Funktion f mit f(x) ¼ 1 , x 2 R eine Dichtefunktion ist (die so pð1þx2 Þ genannte Cauchy-Verteilung). Vergleiche den Graphen mit der Gaussschen Dichtefunktion (siehe Seite 154). 196 S T E T I G E Z U F A L L S G R S S E N – N O R M A LV E R T E I L U N G 6.1.2 Erwartungswert und Varianz bei stetigen Zufallsgrößen Information Bei diskreten Zufallsgrößen hatten wir definiert . als Erwartungswert der Zufallsgröße X: m P ai PðX ¼ ai Þ (siehe Seite 97) m ¼ EðXÞ ¼ i¼1 . Varianz der Zufallsgröße X: m P ðai mÞ2 PðX ¼ ai Þ s2 ¼ VðXÞ ¼ (siehe Seite 109) i¼1 Analog führen wir diese Begriffe für stetige Zufallsgrößen ein: Der Erwartungswert ist der gewichtete Mittelwert der möglichen Werte der Zufallsgröße; daher ergibt sich der Erwartungswert als Summe von Produkten der Form ai PðX ¼ ai Þ Gewicht, mit dem dieser Wert auftritt Wert der Zufallsgröße Bei stetigen Zufallsgrößen tritt x an die Stelle der diskreten Werte ai, an die Stelle der Wahrscheinlichkeiten P(X ¼ ai) tritt die Dichtefunktion f und das uneigentliche Integral ersetzt die Summenbildung. m ¼ EðXÞ ¼ þ1 Ð x fðxÞ dx 1 Erwartungswert einer stetigen Zufallsgröße X mit Dichtefunktion f Rechtfertigung der Festsetzung: Betrachtet man statt der Dichtefunktion f einer stetigen Zufallsgröße näherungsweise die Häufigkeitsverteilung einer zugehörigen empirischen Verteilung mit m Werten, dann liest man aus der Zeichnung ab: Die Flächeninhalte der Rechtecke ergeben sich als Produkt aus dem Funktionswert f(xi) in der Intervallmitte und der Breite Dxi der Intervalle. Flächeninhalte entsprechen den relativen Häufigkeiten Also gilt für den Mittelwert: x m P i¼1 xi h(xi) ¼ m P xi f(xi) Dxi . i¼1 Beim bergang von der Häufigkeitsverteilung zur Wahrscheinlichkeitsverteilung geht þ1 Ð x f(x) dx. der Mittelwert x über in den Erwartungswert 1 Da die Varianz als mittlere quadratische Abweichung vom Erwartungswert definiert ist (also V(X) ¼ E((X E(X))2), siehe Seite 109), wird hier festgelegt: þ1 Ð V(X) ¼ (x m)2 f(x) dx. 1 Bei diskreten Zufallsgrößen wurde gezeigt: V(X) ¼ E(X2) m2 (siehe Seite 109). Wenn þ1 þ1 Ð 2 Ð 2 x f(x) dx existiert, gilt auch V(X) ¼ x f(x) dx m2 , siehe das Integral 1 bungsaufgabe 3. 1 Stetige Zufallsgrößen 197 Erwartungswert und Varianz bei stetigen Zufallsgrößen Sei f die Dichtefunktion einer stetigen Zufallsgröße X. Dann heißt þ1 Ð x fðxÞ dx Erwartungswert von X EðXÞ ¼ m ¼ 1 þ1 Ð VðXÞ ¼ s2 ¼ ðx mÞ2 fðxÞ dx Varianz von X 1 bungsaufgaben 1. Bestimme E(X) und V(X) zur Dichtefunktion f einer Rechteckverteilung (siehe Information (4), Seite 194): |fflfflfflffl{zfflfflfflffl} f(x) ¼ 1 ba für a x < b 0 sonst 2. Vergleiche V(X) für die Rechteckverteilungen: |fflfflfflffl{zfflfflfflffl} |ffl{zffl} 1 für 0 x < 1 0 sonst f1 (x) ¼ f2 (x) ¼ 1 2 für 1 x þ1 0 sonst 3. Sei X eine stetige Zufallsgröße mit E(X) ¼ m. þ1 þ1 Ð 2 Ð 2 x f(x) dx, dann ist V(X) ¼ x f(x) dx m2 . Zeige: Existiert das Integral 1 1 4. 1 beBegründe: Für die Cauchy-Verteilung, deren Dichtefunktion durch f(x) ¼ pð1 þ x2 Þ stimmt ist, lässt sich der Erwartungswert nicht berechnen. 5. Bestimme E(X) und V(X) für die Dichtefunktion f mit kx 0 |{z} f(x) ¼ für 0 x < 1 sonst wobei für k ein geeigneter Wert zu finden ist. 6. a) Zeige, dass gilt: 1 Ð 0 1 2 x x e ¼1 2 b) Gib eine Dichtefunktion an, deren Graph abschnittsweise mit dem rechts oben abgebildeten Graphen übereinstimmt. Bestimme für diese Funktion auch E(X) und V(X). c) Verfahre wie in Teilaufgabe a) mit dem rechts unten abgebildeten Graphen.