Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson Stetig Normal Lognormal Exponential Verteilung der Stichprobenkennzahlen Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik: Beschreibt Häufigkeit der Ausprägungen eines speziellen Experiments Weitergehende Annahme: Ausprägungen werden mit einer gewissen Wahrscheinlichkeit angenommen (Modell!) Wahrscheinlichkeitsraum Zufalls Beobachtete Daten: variable Spezielle Realisierung Diskrete Zufallsvariable Zum Modellieren von diskreten Merkmalen Ereignisraum Ω mit abzählbar vielen Ereignissen ω Zufallsvariable: ω → X (ω ) Bei diskreter ZV kann man Ω mit der Menge aller Ausprägungen xi der Zufallsvariable identifizieren. Beispiel: Augenzahl eines Würfels Ω = {1,2,3,4,5,6}, X ( xi ) = xi Also zum Beispiel X(3) = 3 Wahrscheinlichkeitsfunktion: xi → P( X = xi ) Jedem Wert der Zufallsvariable (entspricht der Merkmalsausprägung) wird seine Wahrscheinlichkeit zugeordnet. Damit ist im diskreten Fall die Zufallsvariable vollständig charakterisiert. Beispiel Würfel: pi = P( X = xi ) = 1 / 6 Die ZV ist gleichverteilt! Verteilungsfunktion: F ( x) := P( X ≤ x) Es gilt: lim F ( x) = 0 x → −∞ lim F ( x) = 1 x →∞ F monoton steigend Im diskreten Fall ist F eine Treppenfunktion F ( x) := ∑p i: x i ≤ x i Vergleiche mit der kumulativen relativen Häufigkeit! Verteilungsfunktion des Würfelbeispiels: Beispiel Würfel: F ( x ) = x 0 < x < 7 1 0.8 0.6 F 0.4 0.2 0 0 1 2 3 4 x 5 6 7 Erwartungswert einer ZV: Zufallsvariable X mit Werten x1,x2,…,xr E ( X ) := x1 p1 + x2 p2 + + xr pr Beispiel Würfel: 1+ 2 + 3 + 4 + 5 + 6 µ := E ( X ) = = 3.5 6 Beachte, dass auch gilt: P ( X ≤ 3.5) = P ( X ≥ 3.5) = 0.5 Der Mittelwert ist hier gleich dem MEDIAN der ZV Varianz einer ZV: Zufallsvariable X mit Werten x1,x2,…,xr und E(X) = µ Var( X ) := ( x1 − µ ) 2 p1 + + ( xr − µ ) 2 pr Beispiel Würfel: 2 2 2 2 2 2 + + + + + 2 . 5 1 . 5 0 . 5 0 . 5 1 . 5 2 . 5 = 2.916 σ 2 := Var ( X ) = 6 Alternative Berechnungsformel für Varianz: r Var( X ) = ∑ xi p i − [E( X ) ] i =1 2 2 Eigenschaften von Erwartungswert und Varianz einer ZV: Seien X und Y eine ZV und α eine reelle Zahl Dann gilt: E(αX ) = α E( X ) E( X + Y ) = E( X ) + E(Y ) Var(αX ) = α 2 Var( X ) Var( X + α ) = Var( X ) Unabhängige ZV: Zwei Zufallsvariablen X und Y heißen unabhängig, falls für beliebige Mengen A und B ihres Wertebereiches: P( X ∈ A und Y ∈ B ) = P( X ∈ A) P(Y ∈ B) Für unabhängige ZV gilt (und zwar NUR für unabhängige): Var( X + Y ) = Var( X ) + Var(Y ) Bsp 4-8 an der Tafel Bernoulli Experiment: Beispiele: Bsp 4-8 Prozent Experiment mit nur zwei möglichen Ergebnissen 100 80 60 •Münzwurf (Kopf oder Zahl) •Medizin (krank oder gesund) Codiere Ergebnisse mit X=0 und X=1 40 20 0 X=0 Ergebnis 0 hat Wahrscheinlichkeit p Ergebnis 1 hat Wahrscheinlichkeit q = 1-p X=1 Binomialverteilung: Führe n unabhängige Bernoulli Experimente durch Bezeichne mit X die Anzahl wie oft Ereignis 0 eintritt, dann ist X binomialverteilt: Man schreibt: X~B(n;p) gibt die Anzahl der Kombinationen mit k Ergebnissen 0 Beachte: Für Bsp. 4-8,c gilt Z~B(2;0.2) Bsp. 15: Schadhafte Disketten Disketten funktionstüchtig mit p = 0.8 Packungen der Größe 10 X … Anzahl der guten Disketten pro Packung Wahrscheinlichkeitsfunktion: Etwa für k=2: Binomialverteilung: Beispiel 15 (S. 95) Internet Tip: Statistics Tools for Internet and Classroom Instruction – Tools – Binomial Histogram Eigenschaften der Binomialverteilung Sei X~B(n;p), dann gilt: Mittelwert: µ = n p Varianz: σ2 = n p q Anwendung: Ziehen mit zurücklegen M von N Objekten erfüllen eine gewisse Eigenschaft E Ziehe n mal mit zurücklegen, wir groß ist die Wahrscheinlichkeit k Objekte mit Eigenschaft E zu ziehen? Antwort: X~B(n;M/N) (Bsp. 4-10 an der Tafel) Hypergeometrische Verteilung: Bsp 4-13 an der Tafel – Ziehen ohne Zurücklegen Hypergeometrische Verteilung mit Parametern N,M und n Mittelwert: Varianz: Bsp. 4-15: Qualitätskontrolle 30 Disketten, davon 10 schadhaft Wähle Stichprobe der Größe 6 a) Mit welcher Wahrscheinlichkeit sind weniger als 2 Disketten der Stichprobe schadhaft? P(X < 2) = P(X = 0) + P(X = 1) Hypergeom. Verteilung mit N=30, M=10, n=6 Bsp. 4-15: Qualitätskontrolle b) Wie groß sind Erwartungswert und Varianz der entnommenen defekten Disketten? Mittelwert: Varianz: Poissonverteilung: Diskrete Zufallsvariable mit unendlich vielen Werten: Mittelwert: µ = λ Varianz: σ2 = λ Typische Anwendung: Verteilung seltener Ereignisse • Kunden an einem Schalter pro Zeiteinheit • Schadensfälle pro Zeiteinheit (Versicherung) • Pro Zeiteinheit zerfallende Atome (Radioaktivität) Beispiel 4-16: Bankschalter Im Mittel 3 Kunden pro Minute und Zahl der eintreffenden Kunden X sei Poisson-verteilt, d.h. und µ = λ = 3. Gegenwahrscheinlichkeit: Poissonverteilung als Approximation für die Binomialverteilung: Eine binomialverteilte Zufallsvariable X~B(n;p) ist für großes n und kleines k näherungsweise Poissonverteilt mit Parameter λ = n k Wahrscheinlichkeiten der Poissonverteilung sind für große n leichter (schneller) zu berechnen als für die Binomialverteilung Faustregel: n>10 und p<0.05 Approximation OK Bsp 4-17 Buch S. 102 X~B(250;0.04) n p = 10 Verwende Poisson-Approximation mit λ = 10 Wahrscheinlichkeits funktion 14 Verteilungsfunktion 120 12 100 10 80 8 60 6 40 4 20 2 POISSON BINOM 0 ,0 K 2 4 6 8 10 12 14 16 18 20 22 24 POICUM BINCUM 0 ,0 K 2 4 6 8 10 12 14 16 18 20 22 24 Zusammenfassung: Wahrscheinlichkeitsfunktionen von diskreten Verteilungen Gleichverteilung: Binomialverteilung: Hypergeometrische Verteilung: Poisson Verteilung: Problem der Wartezeit: Bei dem Problem von Beispiel 4-16 kann man die Frage stellen, wie lange es dauert, bis jeweils der nächste Kunde zum Bankschalter kommt (typische Fragestellung bei Warteschlangenmodellen, Lebensdauer von Verschleißteilen, etc. Die Wartezeit zwischen zwei poissonverteilten Ereignissen ist Exponentialverteilt! Dies ist eine stetige Zufallsvariable für die metrische Variable Zeit. Stetige Verteilungen Verteilungsfunktion der Exponentialverteilung Exponentialverteilung (lambda = 1) 1.5 F(x) 1 0.5 0 -0.5 -2 -1 0 1 2 x 3 4 5 6 Stetige Verteilungen Beachte dass bei stetigen Zufallsvariablen nun die reelle Variable x die Rolle übernimmt, die bisher k hatte. Rechenbeispiele (Parameter λ = 1): Stetige Verteilungen: Dichte Für stetige Verteilungen gilt immer Das Konzept der Wahrscheinlichkeitsfunktion (wie im diskreten Fall) ist hier daher nicht zielführend! Anstelle dessen verwendet man die Dichtefunktion der Zufallsvariable, die als Ableitung der Verteilungsfunktion definiert ist: Stetige Verteilungen: Dichte Mit Hilfe der Dichtefunktion werden für stetige Zufallsvariablen Wahrscheinlichkeiten, Erwartungswert und Varianz mittels Integration berechnet. (Mehr darüber nächstes mal) Für die Exponentialverteilung ergibt sich besonders einfach: Mittelwert: µ = 1/λ Varianz: σ2 = 1/ λ2 Warteschlangenproblem Für jedes Zeitintervall [s, s+t] seien eintretende Ereignisse poissonverteilt mit Parameter λt. Dann ist die Zeit T die zwischen zwei Ereignissen vergeht exponentialverteilt mit Parameter λ. Buch S.116, Bsp 4-26: Im Mittel fallen 3 Maschinen pro Stunde aus es fallen 0.05 Maschinen pro Minute aus λ = 0.05 Τ exponentialverteilt mit λ = 0.05, E(T) = 1/0.05=20, Var(T) = 202 = 400