Statistik I für Betriebswirte Vorlesung 4

Werbung
Statistik I für Betriebswirte
Vorlesung 4
Dr. Andreas Wünsche
TU Bergakademie Freiberg
Institut für Stochastik
27. April 2017
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
1
Quantile einer stetigen Zufallsgröße
I
Die reelle Zahl xq mit 0 < q < 1 heißt q−Quantil der stetigen
Zufallsgröße X , wenn die Werte von X mit einer Wahrscheinlichkeit
q links von xq liegen, d.h. xq ist eine Lösung der Gleichung
P(X < xq ) = FX (xq ) = q
=⇒
xq = Fx−1 (q) .
I
q−Quantile können auch für diskrete und andere Zufallsgrößen
betrachtet werden.
I
Wichtige Quantile sind:
I
I
I
das 0.5–Quantil, es heißt Median von X ;
das 0.25– bzw. 0.75–Quantil, dies sind die sogenannten
Viertelquantile (Quartile)
von X ;
α
die α−, (1 − α)−, 1 −
− Quantile für kleine Werte α ,
2
sie spielen bei statistischen Fragen eine große Rolle.
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
2
Exponentialverteilung
Eine Zufallsgröße X heißt exponentialverteilt mit Parameter λ > 0, falls
für die Verteilungsfunktion FX bzw. die Verteilungsdichte fX gilt:
0,
x ≤ 0,
0,
x ≤ 0,
FX (x) =
fX (x) =
1 − exp(−λx) , x > 0 ,
λ exp(−λx) , x > 0 .
Verteilungsfunktion (λ = 1)
Dr. Andreas Wünsche
Dichtefunktion (λ = 1)
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
3
Quantile für Exponentialverteilung
I
Es sei X exponentialverteilt mit Parameter λ = 1, d.h.
0,
x ≤ 0,
FX (x) = P(X < x) =
1 − exp(−x), x > 0.
I
Dann gilt für das q−Quantil xq (mit 0 < q < 1) :
FX (xq ) = 1 − exp(−xq ) = q,
also xq = − ln (1 − q) .
Verteilungsfunktion
I
q
0.25
0.5
0.75
0.95
Dr. Andreas Wünsche
Dichtefunktion
xq
0.288
0.693
1.386
2.996
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
4
Varianz einer Zufallsgröße
I
Die wichtigste Kenngröße für die Variabilität von Zufallsgrößen ist
die Varianz der Zufallsgröße, auch Streuung oder Dispersion
genannt. Sie gibt die erwartete quadratische Abweichung der
Zufallsgröße von ihrem Erwartungswert an.
I
Definition: Die Varianz VarX der Zufallsgröße X ist die
nichtnegative reelle Zahl (falls sie existiert)
 P

(x − EX )2 pi ,
diskrete ZG;

 i i
VarX = E (X − EX )2 =
R∞


(x − EX )2 fX (x) dx , stetige ZG.

−∞
I
Die Varianz lässt sich meistens bequemer mit Hilfe der Formel
VarX = E X 2 − (EX )2
berechnen.
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
5
Standardabweichung einer Zufallsgröße und Eigenschaften
I
Definition: Die Standardabweichung σX der Zufallsgröße X ist
die positive Quadratwurzel aus der Varianz der Zufallsgröße:
√
σX = VarX .
I
Ist a eine reelle Zahl und X eine Zufallsgröße, dann gelten
I
I
I
I
I
Var(aX ) = a2 VarX ,
Var(a + X ) = VarX ,
σ(aX ) = |a|σX ,
σ(a+X ) = σX .
Es gilt genau dann VarX = σX = 0, wenn es eine reelle Zahl x0 gibt,
so dass P(X = x0 ) = 1 gilt.
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
6
Beispielberechnung Varianzen
I
X Augenzahl beim Würfeln mit einem gerechten Würfel.
I
X gleichmäßig verteilt auf dem Intervall [0, 1].
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
7
Standardisierung und Variationskoeffizient
I
Definition: Für eine Zufallsgröße X mit endlicher Varianz wird
die Standardisierung definiert durch
Z=
X − EX
.
σX
Dies ist eine mit X zusammenhängende Zufallsgröße, die den
Erwartungswert 0 und eine Varianz von 1 besitzt.
I
Definition: Für eine Zufallsgröße X mit endlicher Varianz und
EX 6= 0 wird der Variationskoeffizient VX definiert durch
VX =
σX
.
EX
Mit ihm wird die Streuung der möglichen Werte zum mittleren Wert
(Erwartungswert) in Beziehung gesetzt, dadurch hilft er beim
Vergleich der möglichen zufälligen Schwankungen der Werte von
Zufallsvariablen.
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
8
Kovarianz und Unkorreliertheit zweier Zufallsgrößen
I
Für zwei Zufallsgrößen X und Y mit endlicher Varianz heißt die
reelle Zahl
Cov (X , Y ) = E ((X − EX )(Y − EY )) = E(XY ) − EX · EY
die Kovarianz der beiden Zufallsgrößen. Sie ist ein Maß für die
Stärke eines linearen Zusammenhangs zwischen X und Y .
I
Der Korrelationskoeffizient der Zufallsgrößen X und Y ist dann
%X ,Y = Corr (X , Y ) =
Cov (X , Y )
.
σX σY
Dieser Wert liegt immer zwischen -1 und 1 . Im Fall |%X ,Y | = 1
besteht ein vollständiger linearer Zusammenhang zwischen beiden
Größen.
I
Zwei Zufallsgrößen X und Y heißen unkorreliert, falls
Cov (X , Y ) = 0 gilt.
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
9
Unabhängigkeit von Zufallsgrößen und Varianz einer
Summe von unabhängigen Zufallsgrößen
I
Definition: Zwei Zufallsgrößen X und Y heißen stochastisch
unabhängig, falls für beliebige reelle Zahlen x, y gilt:
P ({X < x} ∩ {Y < y }) = P(X < x) · P(Y < y ) .
I
Sind zwei Zufallsgrößen X und Y mit endlichen Erwartungswerten
stochastisch unabhängig, dann gilt E(X · Y ) = EX · EY . Damit
sind X und Y auch unkorreliert.
I
Satz: Sind zwei Zufallsgrößen X und Y stochastisch unabhängig
(oder unkorreliert), dann gilt für deren Summe:
Var(X + Y ) = VarX + VarY .
Diese Eigenschaft gilt aber nicht im Allgemeinen !
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
10
Tschebyschew-Ungleichung
I
Man kann mit Hilfe von Erwartungswerten und Varianzen auch
Wahrscheinlichkeiten abschätzen. Dabei finden die folgenden
Ungleichungen öfters Verwendung.
I
Satz:
Für eine Zufallsgröße X mit E|X | < ∞ gilt für beliebige c > 0
P(|X | ≥ c) ≤
E|X |
.
c
Ist die Varianz der Zufallsgröße X endlich, d.h.
VarX = E(X − EX )2 < ∞ ,
dann gilt auch
P(|X − EX | ≥ c) ≤
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
VarX
.
c2
Version: 25. April 2017
11
Illustration Tschebyschew-Ungleichung für eine
Exponentialverteilung mit Parameter λ = 1
Vergleich exakte Wahrscheinlichkeiten (blau) und Abschätzungen aus
Tschebyschew-Ungleichung (rot) : für c > 1 :
E|X |
1
links: P(X ≥ c) = 1 − FX (c) = e−c ≤
= ;
c
c
VarX
1
−c−1
rechts: P(|X − EX | ≥ c) = P(X − 1 ≥ c) = e
≤
= 2.
c2
c
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
12
1.6 Wichtige diskrete Wahrscheinlichkeitsverteilungen
1.6.1 Binomialverteilung
n ∈ N, 0 ≤ p ≤ 1.
I
Parameter:
I
Zufallsgröße X mit möglichen Werten x0 = 0, x1 = 1, . . . , xn = n .
I
Wahrscheinlichkeitsfunktion:
n k
pk = P(X = k) =
p (1 − p)n−k ,
k
I
k = 0, 1, . . . , n .
Anwendung in folgender Situation:
I
I
I
I
zufälliges Experiment mit 2 Versuchsausgängen (A, und A) wird n
mal wiederholt ;
Eintreten der Ereignisse A in den einzelnen Versuchen sei unabhängig ;
in jedem Versuch sei die Erfolgswahrscheinlichkeit gleich p , d.h.
p = P(A) ;
Zufallsgröße X ist gleich die Anzahl des Eintrettens des Ereignisses A .
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 3. Mai 2017
13
Binomialverteilung II
I
Typische Anwendungen:
I
I
Stichprobennahme mit Zurücklegen z.B. bei Qualitätskontrolle;
Schadenzahlverteilung in der Versicherungsmathematik.
I
Bezeichnung:
X ∼ Bin(n, p) .
I
Kenngrößen:
EX = np
I
Spezialfall: Bernoulli-Verteilung: n = 1
X ∼ B(p) = Bin(1, p) =⇒ EX = p und
I
Eigenschaft:
⇒
Dr. Andreas Wünsche
und
VarX = np(1 − p) .
VarX = p(1 − p) .
X1 ∼ Bin(n1 , p) , X2 ∼ Bin(n2 , p) unabhängig
X1 + X2 ∼ Bin(n1 + n2 , p) .
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
14
Binomialverteilung III
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
15
Beispielaufgabe Binomialverteilung
I
Ein idealer Würfel wird 20 mal geworfen. Wie groß ist die
Wahrscheinlichkeit dafür, dass mindestens zwei mal eine Sechs
geworfen wird ?
I
Zufallsgröße X . . . Anzahl der geworfenen Sechsen bei 20 Würfen
”
dieses Würfels“ ⇒ X ist binomialverteilt.
I
20-malige Wiederholung des Einzelversuchs Werfen eines Würfels“
”
⇒ n = 20 .
I
Erfolg E . . . Im Einzelwurf fällt eine Sechs“.
”
Wahrscheinlichkeit für das Werfen einer Sechs bei einem Würfelwurf
beträgt 1/6 ⇒ p = P(E ) = 1/6 .
I
I
Gesucht ist P(X ≥ 2) .
Dr. Andreas Wünsche
Statistik I für Betriebswirte Vorlesung 4
Version: 25. April 2017
16
Herunterladen