Statistik I für Betriebswirte Vorlesung 4 Dr. Andreas Wünsche TU Bergakademie Freiberg Institut für Stochastik 27. April 2017 Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 1 Quantile einer stetigen Zufallsgröße I Die reelle Zahl xq mit 0 < q < 1 heißt q−Quantil der stetigen Zufallsgröße X , wenn die Werte von X mit einer Wahrscheinlichkeit q links von xq liegen, d.h. xq ist eine Lösung der Gleichung P(X < xq ) = FX (xq ) = q =⇒ xq = Fx−1 (q) . I q−Quantile können auch für diskrete und andere Zufallsgrößen betrachtet werden. I Wichtige Quantile sind: I I I das 0.5–Quantil, es heißt Median von X ; das 0.25– bzw. 0.75–Quantil, dies sind die sogenannten Viertelquantile (Quartile) von X ; α die α−, (1 − α)−, 1 − − Quantile für kleine Werte α , 2 sie spielen bei statistischen Fragen eine große Rolle. Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 2 Exponentialverteilung Eine Zufallsgröße X heißt exponentialverteilt mit Parameter λ > 0, falls für die Verteilungsfunktion FX bzw. die Verteilungsdichte fX gilt: 0, x ≤ 0, 0, x ≤ 0, FX (x) = fX (x) = 1 − exp(−λx) , x > 0 , λ exp(−λx) , x > 0 . Verteilungsfunktion (λ = 1) Dr. Andreas Wünsche Dichtefunktion (λ = 1) Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 3 Quantile für Exponentialverteilung I Es sei X exponentialverteilt mit Parameter λ = 1, d.h. 0, x ≤ 0, FX (x) = P(X < x) = 1 − exp(−x), x > 0. I Dann gilt für das q−Quantil xq (mit 0 < q < 1) : FX (xq ) = 1 − exp(−xq ) = q, also xq = − ln (1 − q) . Verteilungsfunktion I q 0.25 0.5 0.75 0.95 Dr. Andreas Wünsche Dichtefunktion xq 0.288 0.693 1.386 2.996 Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 4 Varianz einer Zufallsgröße I Die wichtigste Kenngröße für die Variabilität von Zufallsgrößen ist die Varianz der Zufallsgröße, auch Streuung oder Dispersion genannt. Sie gibt die erwartete quadratische Abweichung der Zufallsgröße von ihrem Erwartungswert an. I Definition: Die Varianz VarX der Zufallsgröße X ist die nichtnegative reelle Zahl (falls sie existiert) P (x − EX )2 pi , diskrete ZG; i i VarX = E (X − EX )2 = R∞ (x − EX )2 fX (x) dx , stetige ZG. −∞ I Die Varianz lässt sich meistens bequemer mit Hilfe der Formel VarX = E X 2 − (EX )2 berechnen. Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 5 Standardabweichung einer Zufallsgröße und Eigenschaften I Definition: Die Standardabweichung σX der Zufallsgröße X ist die positive Quadratwurzel aus der Varianz der Zufallsgröße: √ σX = VarX . I Ist a eine reelle Zahl und X eine Zufallsgröße, dann gelten I I I I I Var(aX ) = a2 VarX , Var(a + X ) = VarX , σ(aX ) = |a|σX , σ(a+X ) = σX . Es gilt genau dann VarX = σX = 0, wenn es eine reelle Zahl x0 gibt, so dass P(X = x0 ) = 1 gilt. Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 6 Beispielberechnung Varianzen I X Augenzahl beim Würfeln mit einem gerechten Würfel. I X gleichmäßig verteilt auf dem Intervall [0, 1]. Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 7 Standardisierung und Variationskoeffizient I Definition: Für eine Zufallsgröße X mit endlicher Varianz wird die Standardisierung definiert durch Z= X − EX . σX Dies ist eine mit X zusammenhängende Zufallsgröße, die den Erwartungswert 0 und eine Varianz von 1 besitzt. I Definition: Für eine Zufallsgröße X mit endlicher Varianz und EX 6= 0 wird der Variationskoeffizient VX definiert durch VX = σX . EX Mit ihm wird die Streuung der möglichen Werte zum mittleren Wert (Erwartungswert) in Beziehung gesetzt, dadurch hilft er beim Vergleich der möglichen zufälligen Schwankungen der Werte von Zufallsvariablen. Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 8 Kovarianz und Unkorreliertheit zweier Zufallsgrößen I Für zwei Zufallsgrößen X und Y mit endlicher Varianz heißt die reelle Zahl Cov (X , Y ) = E ((X − EX )(Y − EY )) = E(XY ) − EX · EY die Kovarianz der beiden Zufallsgrößen. Sie ist ein Maß für die Stärke eines linearen Zusammenhangs zwischen X und Y . I Der Korrelationskoeffizient der Zufallsgrößen X und Y ist dann %X ,Y = Corr (X , Y ) = Cov (X , Y ) . σX σY Dieser Wert liegt immer zwischen -1 und 1 . Im Fall |%X ,Y | = 1 besteht ein vollständiger linearer Zusammenhang zwischen beiden Größen. I Zwei Zufallsgrößen X und Y heißen unkorreliert, falls Cov (X , Y ) = 0 gilt. Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 9 Unabhängigkeit von Zufallsgrößen und Varianz einer Summe von unabhängigen Zufallsgrößen I Definition: Zwei Zufallsgrößen X und Y heißen stochastisch unabhängig, falls für beliebige reelle Zahlen x, y gilt: P ({X < x} ∩ {Y < y }) = P(X < x) · P(Y < y ) . I Sind zwei Zufallsgrößen X und Y mit endlichen Erwartungswerten stochastisch unabhängig, dann gilt E(X · Y ) = EX · EY . Damit sind X und Y auch unkorreliert. I Satz: Sind zwei Zufallsgrößen X und Y stochastisch unabhängig (oder unkorreliert), dann gilt für deren Summe: Var(X + Y ) = VarX + VarY . Diese Eigenschaft gilt aber nicht im Allgemeinen ! Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 10 Tschebyschew-Ungleichung I Man kann mit Hilfe von Erwartungswerten und Varianzen auch Wahrscheinlichkeiten abschätzen. Dabei finden die folgenden Ungleichungen öfters Verwendung. I Satz: Für eine Zufallsgröße X mit E|X | < ∞ gilt für beliebige c > 0 P(|X | ≥ c) ≤ E|X | . c Ist die Varianz der Zufallsgröße X endlich, d.h. VarX = E(X − EX )2 < ∞ , dann gilt auch P(|X − EX | ≥ c) ≤ Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 VarX . c2 Version: 25. April 2017 11 Illustration Tschebyschew-Ungleichung für eine Exponentialverteilung mit Parameter λ = 1 Vergleich exakte Wahrscheinlichkeiten (blau) und Abschätzungen aus Tschebyschew-Ungleichung (rot) : für c > 1 : E|X | 1 links: P(X ≥ c) = 1 − FX (c) = e−c ≤ = ; c c VarX 1 −c−1 rechts: P(|X − EX | ≥ c) = P(X − 1 ≥ c) = e ≤ = 2. c2 c Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 12 1.6 Wichtige diskrete Wahrscheinlichkeitsverteilungen 1.6.1 Binomialverteilung n ∈ N, 0 ≤ p ≤ 1. I Parameter: I Zufallsgröße X mit möglichen Werten x0 = 0, x1 = 1, . . . , xn = n . I Wahrscheinlichkeitsfunktion: n k pk = P(X = k) = p (1 − p)n−k , k I k = 0, 1, . . . , n . Anwendung in folgender Situation: I I I I zufälliges Experiment mit 2 Versuchsausgängen (A, und A) wird n mal wiederholt ; Eintreten der Ereignisse A in den einzelnen Versuchen sei unabhängig ; in jedem Versuch sei die Erfolgswahrscheinlichkeit gleich p , d.h. p = P(A) ; Zufallsgröße X ist gleich die Anzahl des Eintrettens des Ereignisses A . Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 3. Mai 2017 13 Binomialverteilung II I Typische Anwendungen: I I Stichprobennahme mit Zurücklegen z.B. bei Qualitätskontrolle; Schadenzahlverteilung in der Versicherungsmathematik. I Bezeichnung: X ∼ Bin(n, p) . I Kenngrößen: EX = np I Spezialfall: Bernoulli-Verteilung: n = 1 X ∼ B(p) = Bin(1, p) =⇒ EX = p und I Eigenschaft: ⇒ Dr. Andreas Wünsche und VarX = np(1 − p) . VarX = p(1 − p) . X1 ∼ Bin(n1 , p) , X2 ∼ Bin(n2 , p) unabhängig X1 + X2 ∼ Bin(n1 + n2 , p) . Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 14 Binomialverteilung III Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 15 Beispielaufgabe Binomialverteilung I Ein idealer Würfel wird 20 mal geworfen. Wie groß ist die Wahrscheinlichkeit dafür, dass mindestens zwei mal eine Sechs geworfen wird ? I Zufallsgröße X . . . Anzahl der geworfenen Sechsen bei 20 Würfen ” dieses Würfels“ ⇒ X ist binomialverteilt. I 20-malige Wiederholung des Einzelversuchs Werfen eines Würfels“ ” ⇒ n = 20 . I Erfolg E . . . Im Einzelwurf fällt eine Sechs“. ” Wahrscheinlichkeit für das Werfen einer Sechs bei einem Würfelwurf beträgt 1/6 ⇒ p = P(E ) = 1/6 . I I Gesucht ist P(X ≥ 2) . Dr. Andreas Wünsche Statistik I für Betriebswirte Vorlesung 4 Version: 25. April 2017 16