Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 1 1.6.2 Charakteristische Größen von Verteilungen I Die Gesamtinformation, die mit einer Wahrscheinlichkeitsverteilung gegeben wird (oder gegeben werden muss) ist häufig zu umfangreich, dehalb nutzt man abgeleitete Kenngrößen, die in praktischen Situationen gut zu nutzen sind. Dabei kann man bei den Kenngrößen im Allgemeinen Lageparameter und Streuungsparameter unterscheiden. I Die am häufigsten genutzte Kenngröße ist der Erwartungswert EX einer Zufallsgröße X (auch Mittelwert der Zufallsgröße genannt). Er ist ein Lageparameter, eine (nichtzufällige) reelle Zahl und beschreibt den Schwerpunkt der Wahrscheinlichkeitsmasse. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 2 Erwartungswert einer Zufallsgröße I I Definition: Für eine diskrete Zufallsgröße X mit möglichen Werten x1 , x2 , . . . und zugehörigen Wahrscheinlichkeiten p1 = P(X = x1 ), p2 = P(X = x2 ), . . . wird der Erwartungswert definiert durch X EX = xi pi . i Für eine stetige Zufallsgröße X mit Dichtefunktion fX wird der Erwartungswert definiert durch Z ∞ EX = x · fX (x) dx . −∞ I Beispiele: I I X Augenzahl beim Würfeln mit einem gerechten Würfel. X gleichmäßig verteilt auf dem Intervall [0, 1] . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 3 Erwartungswert einer Zufallsgröße II Beispiele: X Augenzahl beim Würfeln Einzelwahrscheinlichkeiten und Erwartungswert Prof. Dr. Hans-Jörg Starkloff X gleichverteilt auf [0, 1] Dichtefunktion und Erwartungswert Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 4 Erwartungswert einer Zufallsgröße III I Es gelten folgende Rechenregeln für Erwartungswerte: sind X und Y Zufallsgrößen und a und b reelle Zahlen, dann gelten E(a + b · X ) = a + b · EX ; E(X + Y ) = EX + EY . Dies sind die Linearitätseigenschaften der Erwartungswertbildung. I Nicht jede Zufallsgröße besitzt einen Erwartungswert. I Ist g : R → R eine (z.B. stetige) Funktion und X eine Zufallsgröße, dann kann man den Erwartungswert der Zufallsgröße Y = g (X ) wie folgt berechnen: X EY = Eg (X ) = g (xi )pi für eine diskrete ZG X ; Zi ∞ EY = Eg (X ) = g (x)fX (x) dx für eine stetige ZG X . −∞ Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 5 Quantile einer stetigen Zufallsgröße I Die reelle Zahl xq mit 0 < q < 1 heißt q−Quantil der stetigen Zufallsgröße X , wenn die Werte von X mit einer Wahrscheinlichkeit q links von xq liegen, d.h. xq ist eine Lösung der Gleichung Z xq fX (x) dx = q bzw. FX (xq ) = q . −∞ I q−Quantile können auch für diskrete und andere Zufallsgrößen betrachtet werden. I Wichtige Quantile sind: I I I das 0.5–Quantil, es heißt Median von X ; das 0.25– bzw. 0.75–Quantil, dies sind die sogenannten Viertelquantile (Quartile) von X ; α die α−, (1 − α)−, 1 − − Quantile für kleine Werte α , 2 sie spielen bei statistischen Fragen eine große Rolle. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 6 Exponentialverteilung Eine Zufallsgröße X heißt exponentialverteilt mit Parameter λ > 0, falls für die Verteilungsfunktion FX bzw. die Verteilungsdichte fX gilt: 0, x ≤ 0, 0, x ≤ 0, FX (x) = fX (x) = 1 − exp(−λx) , x > 0 , λ exp(−λx) , x > 0 . Verteilungsfunktion (λ = 1) Prof. Dr. Hans-Jörg Starkloff Dichtefunktion (λ = 1) Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 7 Quantile für Exponentialverteilung I Es sei X exponentialverteilt mit Parameter λ = 1, d.h. 0, x ≤ 0, FX (x) = P(X < x) = 1 − exp(−x), x > 0. I Dann gilt für das q−Quantil xq (mit 0 < q < 1) : FX (xq ) = 1 − exp(−xq ) = q, also xq = − ln (1 − q) . Verteilungsfunktion I q 0.25 0.5 0.75 0.95 Dichtefunktion xq 0.288 0.693 1.386 2.996 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 8 Varianz und Standardabweichung einer Zufallsgröße I Die wichtigste Kenngröße für die Variabilität von Zufallsgrößen ist die Varianz der Zufallsgröße, auch Streuung oder Dispersion genannt. Sie gibt die erwartete quadratische Abweichung der Zufallsgröße von ihrem Erwartungswert an. I Definition: Die Varianz VarX der Zufallsgröße X ist die nichtnegative reelle Zahl (falls sie existiert) P (x − EX )2 pi , diskrete ZG; i i 2 VarX = E (X − EX ) = R∞ (x − EX )2 fX (x) dx , stetige ZG. −∞ I Definition: Die Standardabweichung σX der Zufallsgröße X ist die positive Quadratwurzel aus der Varianz der Zufallsgröße: √ σX = VarX . Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 9 Eigenschaften von Varianzen und Standardabweichungen I Die Varianz lässt sich meistens bequemer mit Hilfe der Formel VarX = E X 2 − (EX )2 berechnen. I Ist a eine reelle Zahl und X eine Zufallsgröße, dann gelten I I I I I Var(aX ) = a2 VarX , Var(a + X ) = VarX , σ(aX ) = |a|σX , σ(a+X ) = σX . Es gilt genau dann VarX = σX = 0, wenn es eine reelle Zahl x0 gibt, so dass P(X = x0 ) = 1 gilt. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 10 Beispielberechnung Varianzen I X Augenzahl beim Würfeln mit einem gerechten Würfel. I X gleichmäßig verteilt auf dem Intervall [0, 1]. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 11 Standardisierung und Variationskoeffizient I Definition: Für eine Zufallsgröße X mit endlicher Varianz wird die Standardisierung definiert durch Z= X − EX . σX Dies ist eine mit X zusammenhängende Zufallsgröße, die den Erwartungswert 0 und eine Varianz von 1 besitzt. I Definition: Für eine Zufallsgröße X mit endlicher Varianz und EX 6= 0 wird der Variationskoeffizient VX definiert durch VX = σX . EX Mit ihm wird die Streuung der möglichen Werte zum mittleren Wert (Erwartungswert) in Beziehung gesetzt, dadurch hilft er beim Vergleich der möglichen zufälligen Schwankungen der Werte von Zufallsvariablen. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 12 Kovarianz und Unkorreliertheit zweier Zufallsgrößen I Für zwei Zufallsgrößen X und Y mit endlicher Varianz heißt die reelle Zahl Cov (X , Y ) = E ((X − EX )(Y − EY )) = E(XY ) − EX · EY die Kovarianz der beiden Zufallsgrößen. Sie ist ein Maß für die Stärke eines linearen Zusammenhangs zwischen X und Y . I Der Korrelationskoeffizient der Zufallsgrößen X und Y ist dann %X ,Y = Corr (X , Y ) = Cov (X , Y ) . σX σY Dieser Wert liegt immer zwischen -1 und 1 . Im Fall |%X ,Y | = 1 besteht ein vollständiger linearer Zusammenhang zwischen beiden Größen. I Zwei Zufallsgrößen X und Y heißen unkorreliert, falls Cov (X , Y ) = 0 gilt. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 13 Unabhängigkeit von Zufallsgrößen und Varianz einer Summe von unabhängigen Zufallsgrößen I Definition: Zwei Zufallsgrößen X und Y heißen stochastisch unabhängig, falls für beliebige reelle Zahlen x, y gilt: P ({X < x} ∩ {Y < y }) = P(X < x) · P(Y < y ) . I Sind zwei Zufallsgrößen X und Y mit endlichen Erwartungswerten stochastisch unabhängig, dann gilt E(X · Y ) = EX · EY . Damit sind X und Y auch unkorreliert. I Satz: Sind zwei Zufallsgrößen X und Y stochastisch unabhängig (oder unkorreliert), dann gilt für deren Summe: Var(X + Y ) = VarX + VarY . Diese Eigenschaft gilt aber nicht im Allgemeinen ! Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 14 Eigenschaften des arithmetischen Mittelwertes I I Eine statistische Grundsituation besteht in einer mehrfachen Beobachtung einer ZG X mit unbekanntem Erwartungswert µ = EX und unbekannter Varianz σ 2 = VarX . I Die mathematische Modellierung erfolgt durch eine mathematische Stichprobe: n unabhängige Zufallsgrößen mit ein und derselben Verteilung ( identisch verteilte ZG“) X1 , X2 , . . . , Xn . ” n 1X Xi wieder eine ZG Dann ist der arithmetische Mittelwert X = n i=1 und zwar mit den Charakteristiken I n EX = VarX = Prof. Dr. Hans-Jörg Starkloff 1X EXi = µ n und 1 n2 σ2 . n i=1 n X VarXi = i=1 Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 15 Eigenschaften des arithmetischen Mittelwertes II I Damit liefert der arithmetische Mittelwert X eine gute Schätzvorschrift für µ, da I I I der Erwartungswert von X gleich µ ist (sogenannte Erwartungstreue des Schätzers X“) und ” die Varianz von X mit wachsendem Stichprobenunfang n immer kleiner wird und für n → ∞ gegen Null konvergiert. Man kann sogar zeigen, dass unter obigen Bedingungen ! n 1X P lim Xi = µ = 1 n→∞ n i=1 gilt ( Gesetz der großen Zahlen“, Konsistenz des Schätzers X“). ” ” Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 16 Beispiel Monte-Carlo-Simulation Exponentialverteilung Für X exponentialverteilt mit Parameter λ gilt EX = VarX = 1 . λ Erzeugung mit Statgraphics von 10 000 exponentialverteilten Zufallszahlen (Parameter λ = 1) . Summenstatistiken für RealisierungenExp Anzahl 10000 Arithm. Mittelwert 1,00038 Standardabweichungen 0,998958 Variationskoeffizient 99,8581% Minimum 0,0000471897 Maximum 9,234 Spannweite 9,23395 Stand. Schiefe 80,4934 Stand. Wölbung 116,042 Der StatAdvisor Diese Tabelle zeigt Summenstatistiken für RealisierungenExp. Sie enthält Maßzahlen für die zentrale Lage, die Variabilität und die Gestalt der Verteilung. Von speziellem Interesse sind hier die standardisierte Schiefe und die standardisierte Wölbung, die man verwenden kann, um herauszufinden, ob die Daten normalverteilt sind. Falls die Werte dieser Statistiken außerhalb des Bereiches von –2 bis +2 liegen, bedeutet das eine signifikante Abweichung von der Normalverteilung, wodurch ein statistischer Test (bei dem Normalverteilung unterstellt wird) (z.B.) mit Bezug zur Standardabweichung problematisch ist. In diesem Fall liegt der Wert für die standardisierte Schiefe nicht innerhalb des Bereiches, den man für normalverteilte Daten erwarten würde. Der Wert für die standardisierte Wölbung liegt nicht innerhalb des Bereiches, den man für normalverteilte Daten erwarten würde. Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 17 Fortsetzung Beispiel: Histogramm und Streudiagramm Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 18 Tschebyschew-Ungleichung I Man kann mit Hilfe von Erwartungswerten und Varianzen auch Wahrscheinlichkeiten abschätzen. Dabei finden die folgenden Ungleichungen öfters Verwendung. I Satz: Für eine Zufallsgröße X mit E|X | < ∞ gilt für beliebige c > 0 P(|X | ≥ c) ≤ E|X | . c Ist die Varianz der Zufallsgröße X endlich, d.h. VarX = E(X − EX )2 < ∞ , dann gilt auch P(|X − EX | ≥ c) ≤ Prof. Dr. Hans-Jörg Starkloff VarX . c2 Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 19 Illustration Tschebyschew-Ungleichung für eine Exponentialverteilung mit Parameter λ = 1 Vergleich exakte Wahrscheinlichkeiten (blau) und Abschätzungen aus Tschebyschew-Ungleichung (rot) : für c > 1 : E|X | 1 links: P(X ≥ c) = 1 − FX (c) = e−c ≤ = ; c c VarX 1 −c−1 rechts: P(|X − EX | ≥ c) = P(X − 1 ≥ c) = e ≤ = 2. c2 c Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung 4 Version: 23. Mai 2016 20