Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Zu Aufgabe 0) Folgende Messdaten wurden von einer stetigen Gleichverteilung R([a,b]) erhoben: 3,5,4, 5, 4, 3, 3, 5 Geben Sie eine Schätzung für die Grenzen a und b nach der Momentenmethode an! siehe Vorlesung. Zu Aufgabe 1) Es wurde über eine Verkehrsmessung die Dauer von 30 Telefonaten (in Minuten) gemessen. Passen Sie eine geeignete Verteilung an die Daten an! 4,43 4,64 4,70 5,43 6,52 7,06 7,27 7,36 7,38 8,66 8,92 8,98 9,04 9,05 9,05 9,17 9,20 9,36 9,44 9,89 9,96 10,04 11,75 12,09 12,21 13,04 14,09 14,28 14,55 14,90 Siehe Vorlesung Zu Aufgabe 2) Sei X ~ N(0,1). Skizzieren und berechnen Sie folgende Wahrscheinlichkeiten unter Verwendung der Tabelle der Standardnormalverteilung:: a) P(X > -4), b) P(-2<X<1), c) P(|X-1|<1) e) Bei welchem Wert x gilt: P(X< x) = 0,9 ? d) P(X > 2 / X > 0) Lösung: a) P(X > -4) = 1 - Φ(-4) = 1 - 0 = 1 b) P(-2<X<1) = Φ(1)-Φ(-2) = 0,8413 – (1-0,9772) = 0,8185 c) P(|X-1|<1) = P(-1 < X-1 < 1) = P(0 < X < 2) = Φ(2)-Φ(0) = 0,9772 – 0,5 = 0,4772 P(0 < X < 2) 0,4772 0,4772 d) P(X > 2 / X > 0) = = = = 0,9544 P( X > 0) 1 − Φ (0) 0,5 e) Bei welchem Wert x gilt: P(X< x) = Φ(x) = 0,9 ? Antwort: Wir lesen die Tabelle von innen nach außen: x =1,282 1 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Zu Aufgabe 3) Sei X ~ N(10,9). x−µ Skizzieren und berechnen Sie unter Verwendung der Transformation F(x) = Φ σ folgende Wahrscheinlichkeiten: a) P(8<X<10), b) P(|X-10|<3) c) die bedingte Wahrscheinlichkeit: P(X > 13 / X >10) (Skizze von Wahrscheinlichkeiten: Als Fläche unter der entsprechenden Dichtefunktion) Lösung: a) P(8<X<10) 10 − 10 8 − 10 = Φ − Φ = Φ(0 ) − Φ (− 0,67 ) , 3 3 = 0,5 − (1 − Φ(0,67 )) = 0,5 + Φ (0,67) − 1 = 0,7486 − 0,5 = 0,2486 b) P(|X-10|<3) P(10 − 3 < 10 + 3) = 13 − 10 7 − 10 = Φ − Φ = Φ(1) − Φ(− 1) 3 3 = 2Φ (1) − 1 = 2 * 0,8413 − 1 = 0,6826 c) P(X > 13 / X > 10) P( X > 13 ∧ X > 10) P( X > 13) 1 − F (13) 1 − Φ (1) 1 − 0,8413 = = = = = = 0,3174 P( X > 10) P( X > 10) 1 − F (10) 1 − Φ(0) 0,5 Skizzen: Siehe Vorlesung. Zu Aufgabe 4) Sei X~ N(µ,σ2) eine beliebige normalverteilte Zufallsgröße mit den Parametern µ und σ2 Berechnen Sie die Wahrscheinlichkeit der 1-, 2- und 3- σ - Bereiche, d.h.: P ( µ − σ < X < µ + σ ) , P ( µ − 2σ < X < µ + 2σ ) und P ( µ − 3σ < X < µ + 3σ ) und weisen Sie nach, dass diese Wahrscheinlichkeiten nicht von µ und σ abhängen, d.h. für alle µ und σ identisch sind! Lösung: 2 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski ( X ~ N µ, σ 2 µ – 3σ µ – 2σ µ–σ µ µ+σ µ + 2σ ) µ + 3σ 1-σ-Bereich 2-σ-Bereich 3-σ-Bereich Satz: ( ) Sei X ~ N µ , σ 2 . Dann gilt: 1.) P(µ − σ ≤ X ≤ µ + σ) = 0,68 2.) P(µ − 2σ ≤ X ≤ µ + 2σ) = 0,955 3.) P(µ − 3σ ≤ X ≤ µ + 3σ) = 0,998 Beweis des Satzes: P(µ − iσ ≤ X ≤ µ + iσ) = F(µ + iσ) − F(µ − iσ) µ + iσ/ − µ/ µ/ − iσ/ − µ/ = Φ / − Φ σ/ σ/ = Φ( i ) − Φ ( − i ) = 2 ⋅ Φ(i) − 1 Nun gilt: 1.) Φ(1) = 0,8413 ,i = 1, 2, 3 ⇒ P(µ − σ ≤ X ≤ µ + σ ) = 2 ⋅ 0,8413 − 1 = 0,68 2.) Φ(2) = 0,9772 ⇒ P(µ − 2σ ≤ X ≤ µ + 2σ ) = 2 ⋅ 0,9772 − 1 = 0,955 3.) Φ(3) = 0,9987 ⇒ P(µ − 3σ ≤ X ≤ µ + 3σ ) = 2 ⋅ 0,9987 − 1 = 0,998 q.e.d 2 aller beobachtbaren Werte einer normalverteilten Zufallsgröße X liegen im 13 σ-Bereich und fast alle beobachteten Werte von X liegen im 3-σ-Bereich. Bedeutung: Ca. 3 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Zu Aufgabe 5) Die zufällige Übertragungszeit T von Bildsignalen durch einen Kanal K sei normalverteilt mit dem Erwartungswert µ=50 ms und der σ2= 4ms2 , d.h. es gelte T~N(50, 4). a) In welchem Bereich liegen nahezu alle Zeiten? D.h. berechnen Sie den 3-σ-Bereich! b) Mit welcher Wahrscheinlichkeit liegt die Übertragungszeit zwischen 42 und 53 ms? c) Geben Sie einen symmetrischen Bereich [50-c,50+c] ms um die mittlere Übertragungszeit an, in dem 90 % aller Zeiten liegen! d) Wie groß ist die Wahrscheinlichkeit dafür, dass bei 5 (stochastisch unabhängigen) Übertragungen bei mindestens einer die Übertragungszeit mehr als 50 ms beträgt? Lösung: Zu a) σ = Zu b) 4 = 2 , Fast alle Daten liegen im 3-σ-Bereich [50 –6, 50 + 6]=[44ms, 56mms]. 53 − 50 42 − 50 P (42 < T < 53) = F (53) − F (42) = Φ − Φ = Φ(1,5) − Φ (− 4 ) 2 2 = 0,93319 - 0 = 0,93319 Zu c) Gesucht ist c so dass gilt: P (50 − c < T < 50 + c) = 0,9 Wir lösen diese Gleichung einfach nach c auf: P (50 − c < T < 50 + c) = 0,9 ⇔ F (50 + c) − F (50 − c) = 0.9 50 + c − 50 50 − c − 50 ⇔ Φ − Φ = 0.9 2 2 c −c ⇔ Φ − Φ = 0.9 2 2 c c c ⇔ Φ − 1 − φ = 2Φ − 1 = 0.9 Symmetrie 2 2 2 der Normalverteilung c ⇔ Φ = 1,9 / 2 = 0,95 2 c ⇔ = 1,645 Tabelle 2 ⇔ c = 3,29ms Antwort: 90% aller Zeiten liegen im Intervall [46.71 ms, 53.29ms] 4 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Zu d) Sei X die zufällige Anzahl von 5 unabhängigen Übertragungen, bei denen die Übertragungszeit T mehr als 50ms beträgt. Gesucht ist P(X ≥ 1). Wir betrachten folgende Ereignisse: Ai = „Die Übertragungszeit T der i.ten Übertragung ist ≤ 50 ms“ Damit ist P( X ≥ 1) = 1 − P( X < 1) = 1 − P ( X = 0) = 1 − P( A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5) = Unabhängig keit 1 − P( A1) P( A2) P( A3) P( A4) P( A5) Weiterhin gilt: P(Ai) = P(T≤50) = F(50) = Φ(0) = 0,5 für alle i=1,2,3,4,5 und folglich erhalten wir: P( X ≥ 1) = 1 − P( A1) P( A2) P( A3) P( A4) P( A5) 31 = 1 − 0,5 5 = = 0,96875 32 Zu Aufgabe 6) Die zufällige Zeit T (Stunden), die bis zum Abbau einer bestimmten Droge (z.B. ein Glas Wein, 0.1 cl) im menschlichen Blut vergeht, sei durch folgende Dichtefunktion charakterisiert: 0, falls x ≤ 0, x f(x) = 1 −2 e , falls x > 0 2 a) Skizzieren Sie die Dichtefunktion! b) Berechnen Sie die Verteilungsfunktion F(x) und skizzieren Sie diese! c) Berechnen Sie die erwartete Abbauzeit EX und die Varianz Var(X). d) In wieviel Prozent aller Fälle dauert der Abbau länger als 2 Stunden? Skizzieren Sie diese Prozentzahl als Fläche unter der Dichte! e) Welche Abbauzeit überschreiten 10 % der Personen? Skizzieren Sie diesen Wert in der Grafik der Dichtefunktion! f) In wieviel % aller Fälle, in denen die Abbauzeit bereits 1 Stunde überschreitet, überschreitet sie auch 2 Stunden? { 5 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Lösung: Zu a) Siehe Vorlesung Zu b) u 1 1 − x −1 x 1 − x F ( x) = ∫ f (u )du = ∫ e 2 dx = − e 2 = 1 − e 2 für x ≥ 0 und 2 −∞ 0 0 x x F(x) = 0 für x < 0. Zu c) X ist exponentialverteilt mit dem Parameter λ = ½ pro h. Aus Aufgabe 4 ergibt sich dann EX = 2 h und Var(X) = 4 h. Zu c) In wieviel Prozent aller Fälle dauert der Abbau länger als 2 Stunden? Ges. P(X > 2) Lösung: P(X>2) = 1-P(X ≤ 2) = 1-F(2) = 1- (1 − e 1 − ⋅2 2 ) = e −1 ≈ 0,37 = 37 % Zu d) Welche Abbauzeit überschreiten 10 % der Personen? Gesucht ist die Zeit t für die gilt: P(X ≤ t) = 0,9 Lösung: P ( X ≤ t ) = F (t ) = 1 − e 1 − t 2 = 0,9 ⇔ e 1 − t 2 = 0,1 ⇔ −1 t = ln(0,1) ⇔ t = −2 ln(0,1) = 4,6 2 D..h. Nur 10 % aller Personen überschreiten die Abbauzeit von 4,6 Stunden, 90% nicht. Zu f) In wieviel % aller Fälle, in denen die Abbauzeit bereits 1 Stunde überschreitet, überschreitet sie auch 2 Stunden? Ges.: Bedingte Wahrscheinlichkeit P(X > 2 / X>1) P( X > 2 ∩ X > 1) P( X > 2) 1 − F (2) e −1 1 Lösung: P( X > 2 / X > 1) = = = = 1 = ≈ 0,61 − P( X > 1) P( X > 1) 1 − F (1) e 2 e Antwort: In 61% aller Fälle, in denen die Abbauzeit bereits 1 Stunde überschreitet, überschreitet sie auch 2 Stunden. 6 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Zu Aufgabe 7) Sei X eine exponentialverteilte Zufallsgröße mit dem Intensitätsparameter λ. X beschreibe eine zufällige Lebensdauer bzw. Dauer eines Vorganges. Zu a) Zeigen Sie die sogenannte Vergessens- bzw. Nichtalterungseigenschaft der Exponentialverteilung: P(X>s+t/ X>s) = P(X>t) die besagt, das die Wahrscheinlichkeit, ein Zeitintervall der Länge t zu überleben unabhängig davon ist, ob die Zufallsgröße X bereits die Zeit s überlebt hat oder ob die Lebensdauer soeben beginnt. Lösung: P(X>s+t/ X>s) P(s < X ∧ X > s + t ) P( X > s + t ) 1 − F (s + t ) e − λ ( s +t ) = = = −λs = e −λt = 1 − F (t ) = P( X > t ) = P( X > s) P( X > s) 1 − F (s) e q.e.d Zu b) Wie groß ist die Wahrscheinlichkeit dafür, dass X > EX ist? 1 −λ 1 Lösung: P(X>EX) = 1-F(EX) = 1-F(1/λ) = 1-( 1 − e λ ) = e −1 = = 0,37 e Zu c) Angenommen, die Patienten treffen bei einem Arzt im Schnitt alle 4 Minuten aber mit exponentialverteilter Zwischenzeit TZ~E(1/4 pro Minute) ein und die Dauer der Untersuchungszeit TU beim Arzt beträgt im Schnitt auch 4 Minuten, ist aber normalverteilt: TU~N(4, 1). Warum wird die Warteschlange mit der Zeit immer länger, obwohl durchschnittliche Zwischenankunftszeit der Patienten und Untersuchungszeit des Arztes identisch 4 Minuten sind? Lösung: Weil in 63% aller Fälle (wegen der Exponentialverteilung) die Zwischenankunftszeit TZ kleiner ist als 4 Minuten, während der Artzt (wegen der Normalverteilung) nur in 50 % aller Fälle schneller ist als 4 Minuten. D.h., der Arzt kommt nicht hinterher. 7 Lösungen zu Blatt 8 Spezielle stetige und diskrete Verteilungen Biostatistik BMT Prof. Dr.B.Grabowski Zu Aufgabe 8) Sei X1 die zufällige Anzahl von Sechsen beim 4 maligen Würfeln. a) Welche Verteilung besitzt X1? b) Mit wieviel Sechsen kann man im Schnitt bei einem Wurf mit 4 Würfeln rechnen? c) Wie groß ist die Wahrscheinlichkeit dafür, beim Würfeln mit 4 Würfeln c1) genau eine Sechs c2) höchstens eine Sechs zu würfeln? Lösung: a) X1 ~ B(n=4, p=1/6) (X1 ist Binomialverteilt) b) EX1 = np = 2/3 = 0,67 5 5 6 1 5 5 c1) P(X1 = 1) = = 6 1 6 6 0 6 5 6 5 6 1 5 6 1 5 5 5 c2) P(X1 ≤ 1) = P(X1=0 ) + P(X1=1) = + = + 6 6 0 6 6 1 6 6 Zu Aufgabe 9) Sei X2 die zufällige Anzahl von Würfelversuchen mit einem Würfel, bis zum ersten mal eine 6 gewürfelt wird. a) Welche Verteilung besitzt X2? b) Wie oft muss man mit einem Würfel im Schnitt würfeln, bis zum ersten mal eine 6 gewürfelt wird? c) Wie groß ist die Wahrscheinlichkeit dafür, dass erst im 3. Wurf eine Sechs gewürfelt wird? Lösung: a) X2 ist geometrisch verteilt mit dem Parameter p = 1/6 b) EX2 = 1/p = 6 2 25 5 1 c) P(X2 = 3) = = 6 6 216 8