Statistik I für Betriebswirte Vorlesung 4

Werbung
Statistik I für Betriebswirte
Vorlesung 4
Prof. Dr. Hans-Jörg Starkloff
TU Bergakademie Freiberg
Institut für Stochastik
25. April 2016
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
1
1.6.2 Charakteristische Größen von Verteilungen
I
Die Gesamtinformation, die mit einer Wahrscheinlichkeitsverteilung
gegeben wird (oder gegeben werden muss) ist häufig zu
umfangreich, dehalb nutzt man abgeleitete Kenngrößen, die in
praktischen Situationen gut zu nutzen sind. Dabei kann man bei den
Kenngrößen im Allgemeinen Lageparameter und Streuungsparameter
unterscheiden.
I
Die am häufigsten genutzte Kenngröße ist der Erwartungswert EX
einer Zufallsgröße X (auch Mittelwert der Zufallsgröße genannt). Er
ist ein Lageparameter, eine (nichtzufällige) reelle Zahl und
beschreibt den Schwerpunkt der Wahrscheinlichkeitsmasse.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
2
Erwartungswert einer Zufallsgröße I
I
Definition: Für eine diskrete Zufallsgröße X mit möglichen
Werten x1 , x2 , . . . und zugehörigen Wahrscheinlichkeiten
p1 = P(X = x1 ), p2 = P(X = x2 ), . . . wird der Erwartungswert
definiert durch
X
EX =
xi pi .
i
Für eine stetige Zufallsgröße X mit Dichtefunktion fX wird der
Erwartungswert definiert durch
Z ∞
EX =
x · fX (x) dx .
−∞
I
Beispiele:
I
I
X Augenzahl beim Würfeln mit einem gerechten Würfel.
X gleichmäßig verteilt auf dem Intervall [0, 1] .
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
3
Erwartungswert einer Zufallsgröße II
Beispiele:
X Augenzahl beim Würfeln
Einzelwahrscheinlichkeiten
und Erwartungswert
Prof. Dr. Hans-Jörg Starkloff
X gleichverteilt auf [0, 1]
Dichtefunktion
und Erwartungswert
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
4
Erwartungswert einer Zufallsgröße III
I
Es gelten folgende Rechenregeln für Erwartungswerte:
sind X und Y Zufallsgrößen und a und b reelle Zahlen, dann gelten
E(a + b · X ) = a + b · EX ;
E(X + Y ) = EX + EY .
Dies sind die Linearitätseigenschaften der Erwartungswertbildung.
I
Nicht jede Zufallsgröße besitzt einen Erwartungswert.
I
Ist g : R → R eine (z.B. stetige) Funktion und X eine Zufallsgröße,
dann kann man den Erwartungswert der Zufallsgröße Y = g (X ) wie
folgt berechnen:
X
EY = Eg (X ) =
g (xi )pi
für eine diskrete ZG X ;
Zi ∞
EY = Eg (X ) =
g (x)fX (x) dx
für eine stetige ZG X .
−∞
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
5
Quantile einer stetigen Zufallsgröße
I
Die reelle Zahl xq mit 0 < q < 1 heißt q−Quantil der stetigen
Zufallsgröße X , wenn die Werte von X mit einer Wahrscheinlichkeit
q links von xq liegen, d.h. xq ist eine Lösung der Gleichung
Z xq
fX (x) dx = q
bzw.
FX (xq ) = q .
−∞
I
q−Quantile können auch für diskrete und andere Zufallsgrößen
betrachtet werden.
I
Wichtige Quantile sind:
I
I
I
das 0.5–Quantil, es heißt Median von X ;
das 0.25– bzw. 0.75–Quantil, dies sind die sogenannten
Viertelquantile (Quartile)
von X ;
α
die α−, (1 − α)−, 1 −
− Quantile für kleine Werte α ,
2
sie spielen bei statistischen Fragen eine große Rolle.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
6
Exponentialverteilung
Eine Zufallsgröße X heißt exponentialverteilt mit Parameter λ > 0, falls
für die Verteilungsfunktion FX bzw. die Verteilungsdichte fX gilt:
0,
x ≤ 0,
0,
x ≤ 0,
FX (x) =
fX (x) =
1 − exp(−λx) , x > 0 ,
λ exp(−λx) , x > 0 .
Verteilungsfunktion (λ = 1)
Prof. Dr. Hans-Jörg Starkloff
Dichtefunktion (λ = 1)
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
7
Quantile für Exponentialverteilung
I
Es sei X exponentialverteilt mit Parameter λ = 1, d.h.
0,
x ≤ 0,
FX (x) = P(X < x) =
1 − exp(−x), x > 0.
I
Dann gilt für das q−Quantil xq (mit 0 < q < 1) :
FX (xq ) = 1 − exp(−xq ) = q,
also xq = − ln (1 − q) .
Verteilungsfunktion
I
q
0.25
0.5
0.75
0.95
Dichtefunktion
xq
0.288
0.693
1.386
2.996
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
8
Varianz und Standardabweichung einer Zufallsgröße
I
Die wichtigste Kenngröße für die Variabilität von Zufallsgrößen ist
die Varianz der Zufallsgröße, auch Streuung oder Dispersion
genannt. Sie gibt die erwartete quadratische Abweichung der
Zufallsgröße von ihrem Erwartungswert an.
I
Definition: Die Varianz VarX der Zufallsgröße X ist die
nichtnegative reelle Zahl (falls sie existiert)
 P

(x − EX )2 pi ,
diskrete ZG;

 i i
2
VarX = E (X − EX ) =
R∞


(x − EX )2 fX (x) dx , stetige ZG.

−∞
I
Definition: Die Standardabweichung σX der Zufallsgröße X ist
die positive Quadratwurzel aus der Varianz der Zufallsgröße:
√
σX = VarX .
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
9
Eigenschaften von Varianzen und Standardabweichungen
I
Die Varianz lässt sich meistens bequemer mit Hilfe der Formel
VarX = E X 2 − (EX )2
berechnen.
I
Ist a eine reelle Zahl und X eine Zufallsgröße, dann gelten
I
I
I
I
I
Var(aX ) = a2 VarX ,
Var(a + X ) = VarX ,
σ(aX ) = |a|σX ,
σ(a+X ) = σX .
Es gilt genau dann VarX = σX = 0, wenn es eine reelle Zahl x0
gibt, so dass P(X = x0 ) = 1 gilt.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
10
Beispielberechnung Varianzen
I
X Augenzahl beim Würfeln mit einem gerechten Würfel.
I
X gleichmäßig verteilt auf dem Intervall [0, 1].
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
11
Standardisierung und Variationskoeffizient
I
Definition: Für eine Zufallsgröße X mit endlicher Varianz wird
die Standardisierung definiert durch
Z=
X − EX
.
σX
Dies ist eine mit X zusammenhängende Zufallsgröße, die den
Erwartungswert 0 und eine Varianz von 1 besitzt.
I
Definition: Für eine Zufallsgröße X mit endlicher Varianz und
EX 6= 0 wird der Variationskoeffizient VX definiert durch
VX =
σX
.
EX
Mit ihm wird die Streuung der möglichen Werte zum mittleren Wert
(Erwartungswert) in Beziehung gesetzt, dadurch hilft er beim
Vergleich der möglichen zufälligen Schwankungen der Werte von
Zufallsvariablen.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
12
Kovarianz und Unkorreliertheit zweier Zufallsgrößen
I
Für zwei Zufallsgrößen X und Y mit endlicher Varianz heißt die
reelle Zahl
Cov (X , Y ) = E ((X − EX )(Y − EY )) = E(XY ) − EX · EY
die Kovarianz der beiden Zufallsgrößen. Sie ist ein Maß für die
Stärke eines linearen Zusammenhangs zwischen X und Y .
I
Der Korrelationskoeffizient der Zufallsgrößen X und Y ist dann
%X ,Y = Corr (X , Y ) =
Cov (X , Y )
.
σX σY
Dieser Wert liegt immer zwischen -1 und 1 . Im Fall |%X ,Y | = 1
besteht ein vollständiger linearer Zusammenhang zwischen beiden
Größen.
I
Zwei Zufallsgrößen X und Y heißen unkorreliert, falls
Cov (X , Y ) = 0 gilt.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
13
Unabhängigkeit von Zufallsgrößen und Varianz einer
Summe von unabhängigen Zufallsgrößen
I
Definition: Zwei Zufallsgrößen X und Y heißen stochastisch
unabhängig, falls für beliebige reelle Zahlen x, y gilt:
P ({X < x} ∩ {Y < y }) = P(X < x) · P(Y < y ) .
I
Sind zwei Zufallsgrößen X und Y mit endlichen Erwartungswerten
stochastisch unabhängig, dann gilt E(X · Y ) = EX · EY . Damit
sind X und Y auch unkorreliert.
I
Satz: Sind zwei Zufallsgrößen X und Y stochastisch unabhängig
(oder unkorreliert), dann gilt für deren Summe:
Var(X + Y ) = VarX + VarY .
Diese Eigenschaft gilt aber nicht im Allgemeinen !
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
14
Eigenschaften des arithmetischen Mittelwertes I
I
Eine statistische Grundsituation besteht in einer mehrfachen
Beobachtung einer ZG X mit unbekanntem Erwartungswert
µ = EX und unbekannter Varianz σ 2 = VarX .
I
Die mathematische Modellierung erfolgt durch eine mathematische
Stichprobe: n unabhängige Zufallsgrößen mit ein und derselben
Verteilung ( identisch verteilte ZG“) X1 , X2 , . . . , Xn .
”
n
1X
Xi wieder eine ZG
Dann ist der arithmetische Mittelwert X =
n
i=1
und zwar mit den Charakteristiken
I
n
EX =
VarX =
Prof. Dr. Hans-Jörg Starkloff
1X
EXi = µ
n
und
1
n2
σ2
.
n
i=1
n
X
VarXi =
i=1
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
15
Eigenschaften des arithmetischen Mittelwertes II
I
Damit liefert der arithmetische Mittelwert X eine gute
Schätzvorschrift für µ, da
I
I
I
der Erwartungswert von X gleich µ ist
(sogenannte Erwartungstreue des Schätzers X“) und
”
die Varianz von X mit wachsendem Stichprobenunfang n immer
kleiner wird und für n → ∞ gegen Null konvergiert.
Man kann sogar zeigen, dass unter obigen Bedingungen
!
n
1X
P lim
Xi = µ = 1
n→∞ n
i=1
gilt ( Gesetz der großen Zahlen“, Konsistenz des Schätzers X“).
”
”
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
16
Beispiel Monte-Carlo-Simulation Exponentialverteilung
Für X exponentialverteilt mit Parameter λ gilt EX = VarX =
1
.
λ
Erzeugung mit Statgraphics von 10 000 exponentialverteilten
Zufallszahlen (Parameter λ = 1) .
Summenstatistiken für RealisierungenExp
Anzahl
10000
Arithm. Mittelwert
1,00038
Standardabweichungen
0,998958
Variationskoeffizient
99,8581%
Minimum
0,0000471897
Maximum
9,234
Spannweite
9,23395
Stand. Schiefe
80,4934
Stand. Wölbung
116,042
Der StatAdvisor
Diese Tabelle zeigt Summenstatistiken für RealisierungenExp. Sie enthält Maßzahlen für die zentrale Lage, die Variabilität und die Gestalt
der Verteilung. Von speziellem Interesse sind hier die standardisierte Schiefe und die standardisierte Wölbung, die man verwenden kann, um
herauszufinden, ob die Daten normalverteilt sind. Falls die Werte dieser Statistiken außerhalb des Bereiches von –2 bis +2 liegen, bedeutet
das eine signifikante Abweichung von der Normalverteilung, wodurch ein statistischer Test (bei dem Normalverteilung unterstellt wird)
(z.B.) mit Bezug zur Standardabweichung problematisch ist. In diesem Fall liegt der Wert für die standardisierte Schiefe nicht innerhalb des
Bereiches, den man für normalverteilte Daten erwarten würde. Der Wert für die standardisierte Wölbung liegt nicht innerhalb des Bereiches,
den man für normalverteilte Daten erwarten würde.
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
17
Fortsetzung Beispiel: Histogramm und Streudiagramm
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
18
Tschebyschew-Ungleichung
I
Man kann mit Hilfe von Erwartungswerten und Varianzen auch
Wahrscheinlichkeiten abschätzen. Dabei finden die folgenden
Ungleichungen öfters Verwendung.
I
Satz:
Für eine Zufallsgröße X mit E|X | < ∞ gilt für beliebige c > 0
P(|X | ≥ c) ≤
E|X |
.
c
Ist die Varianz der Zufallsgröße X endlich, d.h.
VarX = E(X − EX )2 < ∞ ,
dann gilt auch
P(|X − EX | ≥ c) ≤
Prof. Dr. Hans-Jörg Starkloff
VarX
.
c2
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
19
Illustration Tschebyschew-Ungleichung für eine
Exponentialverteilung mit Parameter λ = 1
Vergleich exakte Wahrscheinlichkeiten (blau) und Abschätzungen aus
Tschebyschew-Ungleichung (rot) : für c > 1 :
E|X |
1
links: P(X ≥ c) = 1 − FX (c) = e−c ≤
= ;
c
c
VarX
1
−c−1
rechts: P(|X − EX | ≥ c) = P(X − 1 ≥ c) = e
≤
= 2.
c2
c
Prof. Dr. Hans-Jörg Starkloff
Statistik I für Betriebswirte Vorlesung 4
Version: 23. Mai 2016
20
Herunterladen