Ich habe eine Frage zur Tschebyschew Ungleichung. In der Aufgabe 4 des Übungsblattes 3 benötigt man ja die Ungleichung. In diesem Falle war der Bereich (10, 20) symmetrisch um den Erwartungswert µ = 15. Wie berechnet man die Wahrscheinlichkeit nun, wenn die Wahrscheinlichkeit für das beobachtete Intervall asymmetrisch um den Erwartungswert ist? Also in diesem speziellen Fall der Erwartungswert z.B. 16 wäre? Antwort: Die Ungleichung von Tschebyschew wird dafür verwendet, eine Wahrscheinlichkeit abzuschätzen, nämlich die Wahrscheinlichkeit, dass die Realisation einer Zufallsvariablen X ausserhalb eines symmetrischen Intervalls um den Erwartungswert: [µ − c; µ + c] liegt. Die Ungleichung lautet: P(|X − µ| ≥ c) ≤ Var(X) c2 mit |X − µ| ≥ c ⇔ (X ≤ µ − c) ∨ (X ≥ µ + c) In der Übung wurde eine alternative, äquivalente Formulierung verwendet: P(|X − µ| < c) ≥ 1 − Var(X) c2 Beim gegebenen Intervall [10; 20] und µ = 16 wäre die Ungleichung also nicht anwendbar. Man kann aber mit c = 4 die Wahrscheinlickeit für das Intervall [12; 20] abschätzen: P(12 ≤ X ≤ 20) = P(|X − 16| ≤ 4) ≥ 1 − 4 3 Var(X) =1− = = 0,75 2 c 16 4 Nachtrag: Die obige Gleichung stellt eigentlich bereits eine Abschätzung für P(10 ≤ X ≤ 20), denn es gilt ja , dass P(10 ≤ X ≤ 20) ≥ P(12 ≤ X ≤ 20). Man kann also folgende Abschätzung anstellen: P(10 ≤ X ≤ 20) ≥ P(12 ≤ X ≤ 20) = P(|X − 16| ≤ 4) ≥ . . . = 0,75 1 Ich habe eine Frage zum Übungsblatt 2, Aufgabe 3: Warum kann ich hier nicht einfach die Wahrscheinlichkeiten multiplizieren, mit denen das Brot nicht okay ist, also 0,1 mal 0,05 mal 0,2 mal 0,15, also die Schnittmenge der Wahrscheinlichkeiten, dass das Mehl Mängel hat? Antwort: P(E 1 ∩ E 2 ∩ E 3 ∩ E 4 ) ist die Wahrscheinlichkeit dafür, dass keine Mehlsorte einwandfrei ist. Das Brot kann jedoch nicht verkauft werden, wenn mindestens eine Mehlsorte nicht einwandfrei ist. Gesucht ist also die Wahrscheinlichkeit, dass Mehlsorte 1 oder Mehlsorte 2 oder Mehlsorte 3 oder Mehlsorte 4 Mängel hat. Das interessierende Ereignis ist somit die Vereinigungsmenge der Ereignisse E i und nicht deren Schnittmenge. P(B) = DeMorgan = Folgerung1 = = P(E 1 ∪ E 2 ∪ E 3 ∪ E 4 ) P E1 ∩ E2 ∩ E3 ∩ E4 1 − P(E1 ∩ E2 ∩ E3 ∩ E4 ) 1 − P(B) 1 Uns hat sich eine Frage zum Übungsblatt 3, Aufgabe 2a) ergeben. Könnten Sie uns sagen, welche der Lösungen richtig ist? Dichtefunktion: oder: 0 für x ≤ 2 1 f (x) = − x + 2 für 2 ≤ x ≤ 4 02 für x > 4 0 für x < 2 1 f (x) = − x + 2 für 2 ≤ x ≤ 4 02 für x > 4 weil die 2 kann ja nur bei einem von beiden eingeschlossen sein? Antwort: Die zweite Dichtefunktion ist richtig. Sie ergibt sich als erste Ableitung der Verteilungsfunktion von X: 0 für x < 2 1 2 F(x) = − x + 2x − 3 für 2 ≤ x ≤ 4 14 für x > 4 Der Definition einer Abbildung nach wird jedem Element im Definitionsbereich genau ein Element im Wertebereich zugeordnet. Die 2 kann also nur in einem der angegebenen Intervallen enthalten sein. 1 Bei Aufgabe 3a Blatt 1 ist mir die Lösung klar! Jedoch wollte ich fragen, wie man folgenden Fall berechnet: „mindestens (statt genau) 3 Ober und genau 2 Unter“? Wäre die Lösung dann : 4 aus 4 = alle Ober x 2 aus 4 Unter x 2 aus 24 Restkarten? Antwort: Die vorgeschlagene Lösung: ! ! ! 4 4 24 = 1 · 6 · 276 = 1656 4 2 2 entspricht der Anzahl der Hände, in denen der Spieler unter seinen 8 Karten genau 4 Ober und genau 2 Unter besitzt. Die Frage lautet aber „mindestens (statt genau) 3 Ober und genau 2 Unter“, d.h. entweder „genau 3 Ober und genau 2 Unter“ oder „genau 4 Ober und genau 2 Unter“. Diese Anzahl beträgt: ! ! ! ! ! ! 4 4 24 4 4 24 + = 48576 + 1656 = 50232. 3 2 3 4 2 2 1 Ich hätte eine allgemeine Verständnisfrage zum Blatt 5. Und zwar steht in der Aufgabe 3: Varianz σ2 = 7,42 . Ist die Varianz nun 7,4 oder 54,76? In Aufgabe 4 kommt dann auch nochmal "Varianz unabhängig davon immer 4". Schreibt man dann auch Varianz=22 oder 42 ? Antwort: 2 2 Bei Aufgabe√3 ist die p Varianz σ = 7,4 = 54,76 und somit die Standardabweichung σ = σ2 = 7,42 = 7,4. Bei Aufgabe 4 ist die Varianz σ2 = 4 = 22 und die Standardabweichung σ = 2. 1 Ich versuche gerade die Lösung von Übungsblatt 5 Aufgabe 1, wie wir sie in der Übung aufgeschrieben haben, nach zu vollziehen. Dabei stellt sich mir folgende Frage: Wieso arbeiten wir plötzlich mit f(t) und nicht mit f(x), wurde hier etwas substituiert? Außerdem ist mir nicht klar, wieso beim Integeral für x > 0 man nochmal komplett von −∞ bis x integriert anstatt von 0 bis x, wurde das nicht oben bereits bei x < 0 abgehandelt? Antwort: Die Verteilungsfunktion einer Zufallsvariablen X ist definiert durch F(x) = P(X ≤ x) = P(−∞ < X ≤ x) Die Verteilungsfunktion einer stetigen Zufallsvariablen ermittelt sich über das Integral der Dichtefunktion im Intervall ] − ∞; x ] (Vgl. Folie 12.16). Z x F(x) = f (u)du −∞ Die Verteilungsfunktion F ist eine Funktion der Variablen x. Für die Dichtefunktion f im Integrand muss eine neue Variable z.B u oder t eingeführt werden, da x als obere Integrationsgrenze vorkommt. Die Dichtefunktion der Exponentialverteilung lautet: ( λ exp(−λx), für x ≥ 0 f (x) = 0 für x < 0 Um die Verteilungsfuntion der Exponentialverteilung zu bestimmen, muss man, der Definition der Dichtefunktion entsprechend, zwei Fälle unterscheiden: • x < 0: F(x) = = Zx −∞ Zx −∞ 1 f (u)du 0 du = 0 • x ≥ 0: F(x) = = = Zx −∞ Z0 −∞ Zx f (u)du f (u)du + Zx f (u)du 0 λ exp(−λu)du + Zx λ exp(−λu)du 0 −∞ In beiden Fällen wird die Verteilungsfuktion über das Integral der Dichtefunktion im Intervall ] − ∞; x ] ermittelt. Man könnte hier natürlich das Integral von −∞ bis 0 weglassen, da man ja gezeigt hat, dass dies immer 0 ist. Hier ist die Notation aber bewusst etwas allgemeiner gehalten. Es könnte ja auch Dichten geben, die ebenfalls auf Teilbereichen von x unterschiedlich definiert sind, bei denen aber in mehreren Teilbereichen von x die Dichte größer als Null ist. Und in so einem Fall wäre das natürlich zu berücksichtigen. Bemerkung: Das Beispiel zur Verteilungsfunktion der Gleichverteilung in der Vorlesung vom 29.04. (Video: 53:50 - 55:60) kann in diesem Zusammenhang auch hilfreich sein. 2 Ich habe eine Frage zum Übungsblatt 4, Aufgabe 2: Dort hatten wir die Formel für den sog. „Spezialfall“ benutzt. Ich gehe davon aus, dass dieser „Spezialfall“ deswegen hergenommen wurde, da nur ganze Zahlen von 1-12 (12 = k) bei dem Würfel vorhanden sind. Wäre jetzt auf dem Würfel eine „0“ oder zwei mal eine „5“ z.B. (natürlich sehr theoretisch), dürfte man die Formel für den Erwartungswert und die Varianz nicht hernehmen, wie sie auch im Skript steht?! Welche Formel würde dann zum Tragen kommen? Antwort: Die Wahrscheinlichkeitsfunktion der diskreten Gleichverteilung lautet: 1 für i = 1, . . . ,k . k Im Spezialfall xi = i sind die k Ausprägungen der Zufallsvariable die ersten k natürlichen Zahlen. Bei der Aufgabe hat die Zufallsvariable X, welche die „Augenzahl beim einmaligen Würfeln mit einem Dodekaeder“ beschreibt, zwölf Ausprägungen, nämlich: x1 = 1 , x2 = 2, x3 = 3, . . . , x11 = 11, x12 = 12. 1 . Jede Ausprägung xi = i hat die gleiche Wahrscheinlichkeit: 12 P(X = xi ) = Würde die „5“ zweimal vorkommen, dann würde keine diskrete Gleichverteilung 2 mehr vorliegen, denn es würde gelten: P(X = 5) = 12 . Für beliebige, unterschiedliche k Ausprägungen verwendet man die allgemeinen Formeln für den Erwartungswert und die Varianz, also: E(X) = k X i=1 k X x i · pi = Var(X) = = i=1 1 1X = xi . k k i=1 k X (xi − E(X))2 · pi i=1 k X i=1 = k xi · (xi − E(X))2 · k 1 k 1X (xi − E(X))2 k i=1 1 Ich habe eine Frage zur Aufgabe 3a in Blatt 4. Leider wurde es in der Vorlesung nur sehr kurz besprochen und auch im Skript verwirrt mich die Zusammenstellung etwas. Inwiefern stehen „Bernoulli-Experiment“ und „Binomialverteilung“ zueinander? So wie ich das verstanden habe, bedeutet Bernoulli-Experiment, dass es nur max. 2 mögliche Ausprägungen „Überraschung“ und „Nicht Überraschung“ gibt. Binomialverteilung heißt dann, dass bei jedem Bernoulli-Experiment (also bei jedem Kauf einer Keksschachtel) die gleiche Wahrscheinlichkeit für eine Überraschung (also 1/6 - da in jeder 6. Schachtel eine Überraschung sein soll) besteht und dass das Ergebnis der Wahrscheinlichkeit die Überraschungen sind?! Anschlussfrage: Was bedeutet die Formel für Bernoulli : X ∼ B(1,p) und im Gegenzug X ∼ B(n,p)? Vor allem auch das B lässt mich bisher etwas rätseln. Antwort: Jeder Kauf einer Schachtel ist ein Bernoulli-Experiment (Vgl. Folie 13.9 und Vorlesung vom 13.05. Video: 3:18 - 7:00). Mit Wahrscheinlichkeit p = 1/6 findet man in der Schachtel eine Überraschung (Erfolg) und mit Wahrscheinlichkeit (1 − p) = 5/6 findet man keine Überraschung (Misserfolg). Nun wird dieses Bernoulli-Experiment n = 20 Mal wiederholt, wobei die Wiederholungen unabhängig voneinander sind. Das bedeutet, dass die Erfolgswahrscheinlichkeit (p = 1/6) bei jeder Wiederholung konstant gleich bleibt. ( 1 falls „Überraschung“ Zi = i = 1, . . . , 20. 0 falls „keine Überraschung“ Zi ∼ B(n = 1, p = 1/6) Man interessiert sich nun für die Anzahl der Erfolge, also für die Anzahl der Schachteln, bei denen man eine „Überraschung“ findet. Diese Anzahl ist binomialverteilt (Vgl. Folie 13.14 und Videoaufzeichung: 11:00 - 13:06). X: „Anzahl der Keksschachteln mit Überraschung“ X ∼ B(n = 20, p = 1/6) Die Binomialverteilung ergibt sich, wenn aus n unabhängigen Wiederholungen eines Bernoulli-Experiments mit konstanter Wahrscheinlichkeit p die Summe der Erfolge gebildet wird. Zi ∼ B(1, p) X= n X i=1 Zi ∼ B(n,p) Die Bernoulli-Verteilung ist ein Spezialfall der Binomialverteilung. Das B steht für „Binomial“. Bei der Bernoulli-Verteilung ist n = 1. 1 Ich hätte eine Frage, die sich auf das Übungsblatt 6 bezieht. Dort haben wir ja in Aufgabe 3 und 4 allgemein hergeleitet, dass der ML-Schätzung für die jeweiligen Parameter λ und p der Poisson- und der Binomialverteilung dem arithmetischen Mittel entspricht. Da das aber ja nicht allgemein der Fall ist, würde mich einfach interessieren, bei welchen der (von uns behandelten) Verteilungen das denn noch so ist. Antwort: Die Bernoulli-Verteilung ist ein Spezialfall der Binomialverteilung (n = 1). Bei dieser Verteilung ist x̄ ebenfalls der ML-Schätzer für den Parameter p. Bei der Normalverteilung ist das arithmetische Mittel der ML-Schätzer für den Erwartungswert µ. Dies wurde auch in der Vorlesung hergeleitet (Vgl. Videoaufzeichnung zu Kapitel 14: 57:8-66:26). 1 Bei Blatt 5 ist in Aufgabe 1 die Rede von der Exponentialverteilung. Bei der Verteilungsfunktion ist mir folgendes aufgefallen. Wie kann ich ein Integral von „ - unendlich“ bis „x“ spannen, wenn ich hierbei die „x“ alle in "t“ umwandle? Wozu das alles und warum heißt es dann nicht „ - unendlich bis t“? Antwort: Die Verteilungsfunktion einer Zufallsvariablen X ist definiert durch F(x) = P(X ≤ x) = P(−∞ < X ≤ x) Die Verteilungsfunktion einer stetigen Zufallsvariablen ermittelt sich über das Integral der Dichtefunktion im Intervall ] − ∞; x ] (Vgl. Folie 12.16). Z x F(x) = f (u)du −∞ Die Verteilungsfunktion F ist eine Funktion der Variablen x. Für die Dichtefunktion f im Integrand muss eine neue Variable z.B u oder t eingeführt werden, da x als obere Integrationsgrenze vorkommt. Es wird also nichts umgewandelt. In der Vorlesung vom 29.04. (Video: 53:50 - 55:60) wurde ein Beispiel zur Verteilungsfunktion der Gleichverteilung vorgerechnet. Man kann an diesem Beispiel die Herangehensweise bei der Ermittlung der Verteilungsfuktion einer stetigen Zufallsvariablen gut nachvollziehen. Die Antworten auf Frage 14 und Frage 19 sind ebenfalls eine gute Ergänzung. 1 Mir ist die komplette Aufgabe 1 auf Blatt 5 recht unklar. Es ergeben sich bei mir mehrere Fragen. a) Warum wird die Dichtefunktion f(x) auf einmal in f(t) umgewandelt? b) Warum ist bei der Integralrechnung die obere Grenze noch „x“ und nicht „t“, wenn es umgewandelt wird? c) Bei der Fallunterscheidung wurden dann 2 Integralrechnungen gemacht. Beim Fall für x (warum nicht t?) >= 0 wurde dann eine Addition zweier Grenzen gemacht. Die erste Grenze geht dabei von minus unendlich bis 0. Hier schon die Frage, warum bis 0? Es muss eigentlich bis −1 gehen, da die 0 ja gar nicht in der Grenze des Falles für x < 0 ist! Dies addiert mit der Grenze 0 bis x (warum nicht t?), was mir wiederum klar ist. Da ja sowohl die 0 als auch das Ergebnis x (was ja nun t ist?!) im einen Fall sind. Antwort: Zu a) und b) siehe Antworten auf Frage 14 und Frage 18. Zu c): Hier wird folgende Eigenschaft des bestimmten Integrals verwendet: Rb Rc Rc f (t)dt + f (t)dt = f (t)dt, wenn a < b < c. a b a Mit a = −∞, b = 0 und c = x ergibt sich für den Fall: x ≥ 0: F(x) = = = Zx −∞ Z0 −∞ Zx f (t)dt f (t)dt + Zx f (t)dt 0 λ exp(−λt)dt + Zx 0 −∞ 1 λ exp(−λt)dt Ich habe eine Frage zum ersten Übungsblatt, 1. Aufgabe. „Bei einer Party mit 10 Gästen umarmt zur Begrüßung jeder jeden. Wie viele Umarmungen gibt es dann?“ Als Lösung haben wir aufgeschrieben, dass es eine Kombination ist und somit 102 Ich hätte eigentlich gedacht, dass es sich hier um eine Permutation handelt, da ja nach der Anzahl der Umarmungen gefragt wird. Und man ja nicht „2 aus 10“ auswählt und wissen will wie viele Kombinationen dafür möglich sind? Meine Lösung wäre dann wohl 9! gewesen. (Der erste umarmt 9, der nächste nur noch 8, der nächste nur noch 7. . . .) Wie so wird hier eine Kombination statt einer Permutation genommen? Antwort: Es wird nach der Anzahl an überhaupt stattfindenden Umarmungen gefragt. Eine Umarmung wird repräsentiert durch 2 Menschen die man aus den 10 auswählt, deswegen "2 aus 10". Ein einfacheres Beispiel zur Verdeutlichung: Wenn wir uns nur 3 Personen (A,B und C) anschauen und nach der Anzahl der Umarmungen fragen, dann gibt es folgende Möglichkeiten: A+B B+C A+C Damit sind dann alle möglichen abgedeckt. Das ist genau "2 aus 3". Wenn jetzt noch die Reihenfolge eine Rolle spielen würde, was es aber nicht tut, dann gäbe es folgende Möglichkeiten: A+B B+A B+C C+B A+C C+A was dann mit Formel mn ∗ m! = 32 ∗ 2! = 3 ∗ 2! = 6 Mit 10 Leuten kann man sich das auch nochmal aufschreiben, auch wenn es dann etwas „aufwendiger“ wird. 1 Ich habe eine Frage bezüglich der Dichtefunktion und Verteilungsfunktion von stetigen Zusfallsvariablen. Im Übungsblatt 3 , Aufgabe 2, haben wir eine Verteilungsfunktion gegeben und mussten diese „nur“ ableiten um von gegeben F(x) auf f(x) die Dichtefunktion zu kommen. Wäre die Aufgabe andersrum gestellt, müsste man also von der Dichtefunktion f(x) auf die Verteilungsfunktion F(x) kommen, würde man doch einfach integrieren. Man würde die Stammfunktion bilden, richtig ? FRAGE: Hier setzte ich aber noch keine Intervallsgrenzen ein, weil dann habe ich ja keine Verteilungsfunktion mehr in Abhängigkeit von x sondern schon konkrete Wahrscheinlichkeiten ausgerechnet wenn ich die Grenzen (2 und 4) einsetzte beim Integrieren. Ich muss also die Stammfunktion von f(x) bilden um auf F(x) zu kommen, aber ohne die Intervallsgrenzen (hier 2 und 4 ) einzusetzen ? FRAGE: Warum setzten wir dann bei Aufgabenblatt 5, Aufgabe 1 schon die Intervallsgrenzen ein wenn wir versuchen von f(x) auf F(x) zu kommen ? (wenn nämlich die Intervallsgrenzen nicht eingesetzt und Ober - Untergrenze abgezogen werden, dann kommt man zum falschen Ergebnis, nur die Stammfunktion bilden wie bei Blatt 3, Aufgabe 2 funktioniert hier nicht und ich frage mich warum ? Zudem haben wir in den Übungen nie Wahrscheinlichkeiten von den Intervallen ausgerechnet, wie relevant ist es dann? Antwort: Nach 12.16 ist die Verteilungsfunktion folgendermaßen definiert: Z x F(x) = f (t)dt −∞ Für die Dichtefunktion von Augabe 3.2 gilt also: ! 1 F(x) = − t + 2 dt 2 −∞ ! Z x 1 = − t + 2 dt 2 2 " #x 12 = − t + 2t 4 2 ! ! 1 2 1 2 = − x + 2x − − 2 + 2 · 2 4 4 1 = − x2 + 2x − (−1 + 4) 4 1 2 = − x + 2x − 3 für 2 ≤ x ≤ 4 4 Z x 1 Die erste Umformung kann man hier machen, da die Dichte zwischen −∞ und 2 ja immer 0 ist, also gilt: ! Z 2 Z 2 1 F(2) = − t + 2 dt = 0dt = 0 2 −∞ −∞ . Für die Dichtefunktion von Aufgabe 5.1 ergibt sich: Z x F(x) = λe−λt dt Z−∞ x = λe−λt dt 0 = 1 − e−λx für x≥0 Wahrscheinlichkeiten für Intervalle auszurechnen, ist relevant. Vergleiche hierzu das ergänzende Beispiel zur Exponentialverteilung. 2 Übungsblatt 3 Aufgabe 1f) • Wäre es möglich die Formel der empirischen Varianz mit in die Fomelsammlung aufzunehmen? • Was mache ich beim Umformen/Formel aufstellen falsch: 1 · (0 − 1,12 + 48 − 1,12 + 124 − 1,12 ) 99 Antwort: Die Formel der empirischen Varianz findet man in der Formelsammlung zur Vorlesung Statistik I, auf Seite 3. Diese lautet: n s2 = n 1X 1X 2 (xi − x̄)2 = x − x̄2 n i=1 n i=1 i In der Übung wurde die empirische Varianz wie folgt berechnet: n s2 = 1X 2 x − x̄2 n i=1 i 1 2 (0 + . . . + 02 + 12 + . . . + 12 + 22 + . . . + 22 ) − 1,12 100 1 (21 · 02 + 48 · 12 + 31 · 22 ) − 1,12 = 1,72 − 1,21 = 0,51 = 100 = Eine andere Möglichkeit wäre: n 1X (xi − x̄)2 n i=1 i 1 h = (0 − 1,1)2 + . . . + (1 − 1,1)2 + . . . + . . . + (2 − 1,1)2 100 i 1 h = 21 · (0 − 1,1)2 + 48 · (1 − 1,1)2 + 31 · (2 − 1,1)2 = 0,51 100 s2 = 1 Ich hätte eine Frage zu. Blatt 5 2c). Wieso fällt hier plötzlich das Lamda der Exponentialfunktion weg im Vergleich zu den vorherigen Teilaufgaben? Noch eine allgemeine Frage: Sollte man an einer Verteilungsfunktion erkennen können um welche Verteilung es sich handelt? Antwort: Die Verteilungsfunktion der Exponentialverteilung lautet: ( 1 − exp(−λx) x ≥ 0 F(x) = 0 x<0 In Teilaufgabe c) fällt λ nicht weg. Mit λ = 6 und x = 0,5 ergibt sich: P(X > 0,5) = 1−P(X ≤ 0,5) = 1−F(0,5) = 1−[1−exp((−6)·0,5)] = exp(−3) = 0,0498 Eine Zufallsvariable wird durch deren Verteilungsfunktion eindeutig und vollständig beschrieben (Vgl. Folie 12.12). Man kann also an der Verteilungsfuntion einer Zufallsvariablen erkennen, um welchen Verteilungstyp es sich handelt. 1 Ich komme mit dem Lösungsweg bei der Aufgabe 4 des Übungsblattes 3 einfach nicht zurecht. Warum ist das Intervall 10 ≤ x ≤ 20 äquivalent zu |x − 15| ≤ 5? Kann man immer davon ausgehen, dass es ein symmetrisches Intervall ist und E(x) immer in der Mitte liegt? Antwort: 10 ≤ x ≤ 20 ⇔ − 5 ≤ x − 15 ≤ 5 ⇔ x − 15 ≥ −5 und x − 15 ≤ 5 ⇔|x − 15| ≤ 5 (Definition Betrag) Die Ungleichung von Tschebyschew gibt eine Untergrenze an, für die Wahrscheinlichkeit, dass die Realisierung einer Zufallsvariable in ein Intervall fällt, welches symmetrisch um den Erwartungswert liegt. Die Ungleichung von Tschebyschew ist damit auch anwendbar, wenn das gegebene Intervall zwar selbst nicht symmetrisch um den Erwartungswert liegt, aber ein Intervall enthält, das symmetrisch um den Erwartungswert liegt. Hat man beispielsweise eine Zufallsvariable mit Varianz 4 und Erwartungswert 16 gegeben und sucht hier nach der Untergrenze für die Wahrscheinlichkeit, dass eine Realisierung der Zufallsvariable im Intervall [10;20] liegt, so kann man zur Abschätzung das Intervall [12;20] heranziehen, welches im Intervall [10;20] enthalten ist und symmetrisch um den Erwartungswert 16 liegt. Damit folgt folgende Abschätzung mithilfe von Tschebyschews-Ungleichung: P (10 ≤ X ≤ 20) ≥ P (12 ≤ X ≤ 20) = P (|X − 16| ≤ 4) Tschebyschew ≥ =1− 1− Var (X) c2 4 3 = = 0,75 16 4 Ich habe eine Frage zu Blatt 5, Aufgabe 4a). Und zwar ist dort die Wahrscheinlichkeit gesucht, dass der Erwartungswert von 50 mm um mehr als 3 mm unterschritten wird. Gesucht ist also P (X < 47mm). Ich habe P (X ≤ 46mm) berechnet. Warum wird er in der Lösung P (X ≤ 47mm) berechnet, obwohl es heißt ”kleiner 47 mm”? Antwort: Beachte, dass es sich in der Aufgabe um eine stetige Zufallsvariable handelt (Normalverteilung). Die Wahrscheinlichkeit, dass es eine stetige Zufallsvariable einen konkreten Wert annimmt ist immer 0: Z 47 P (X = 47) = P (47 ≤ X ≤ 47) = f (x)dx = 0 47 Daraus folgt direkt, dass P (X < 47) = P (X ≤ 47). Im Fall einer stetigen Zufallsvariablen gilt auf jeden Fall, dass P (X < 47) 6= P (X ≤ 46). Denn und P (X < 47) = P (46 < X < 47) + P (X ≤ 46) s.o. P (46 < X < 47) = P (46 ≤ X ≤ 47) = Z 47 f (x)dx > 0. 46 Anders ist das bei einer diskreten Zufallsvariable. Z.B. gibt eine Poisson-verteilte Zufallsvariable Y an, wie oft ein Ereignis in einer gewissen Zeitspanne passiert. Sie zählt also (in diskreten Werten) die Anzahl der Vorkommnisse. Hier gilt dann beispielsweise: X X P (Y < 4) = f (Y ) = f (Y ) = P (Y ≤ 3) Y <4 Y ≤3