Folien 2

Werbung
Statistik II für Wirtschaftswissenschaftler
2. Wahrscheinlichkeitstheoretische Grundlagen
Stochastisches Modell = mathematisches Modell für ein reales
Phänomen unter Verwendung des fiktiven Begriffs Zufall
Wann?
a) bei der Datenerhebung wird explizit ein zufälliger Aspekt
eingebaut (Meinungsumfragen)
b) System an sich deterministisch, aber zu komplex für deterministische Modellierung
Beispiel:
Würfelwurf als mechanisches Experiment zu kompliziert
Stochastisches Modell: Würfelwurf liefert Zufallsgröße X mit
Werten in {1, 2, 3, 4, 5, 6}, wobei jede Zahl 1, . . . , 6 dieselbe Wahr1 hat, als Wert von X aufzutreten.
scheinlichkeit 6
Folie 2.1
Statistik II für Wirtschaftswissenschaftler
Folie 2.2
2.1 Zufallsgrößen, Ereignisse, Wahrscheinlichkeiten
”Messung” eines numerischen oder qualitativen Merkmals
Ergebnisse liegen in Werteraum X
Wiederholte ”Messungen”
unterschiedliche Ergebnisse
Modellierung:
c Zufallsmechanismus
Messvorgang =
Einmalige Betätigung liefert Zufallsgröße X mit Werten in X
Wiederholte Betätigung liefert verschiedene Realisationen der
Zufallsgröße X
X1, X2, . . . , XN
Statistik II für Wirtschaftswissenschaftler
Beispiele:
i) Gewicht eines zufällig ausgewählten Passanten in kg
Werteraum: X = (0, ∞) ⊆ R
ii) Anzahl der defekten RAM-Bausteine in einer Lieferung von
1000 Stück
Werteraum: X = {0, . . . , 1000} ⊆ R
iii) Windgeschwindigkeit in allen 3 Richtungen des Raums
Werteraum: X = R3
iv) Alter und Blutdruck eines Menschen
Werteraum: X = {0, 1, 2, . . .} × (0, ∞)
Messung liefert quantitative Daten, X ⊆ R oder Rd
quantitative Zufallsgröße
Folie 2.3
Statistik II für Wirtschaftswissenschaftler
v) Familienstand
X = {ledig, verheiratet, verwitwet, geschieden, keine Angabe}
vi) Meinungsäußerung auf Frage nach Semesterticket
X = {dafür, dagegen, egal, keine Angabe}
vii) Bewertung eines Rasenmähers nach Preis und Handhabung
X = { billig, mittel, teuer} × {leicht, schwer}
viii) Zeugnisnote im Schulfach
X = {1, 2, 3, 4, 5, 6}
ix) Ergebnis eines Würfelwurfs
X = {1, 2, 3, 4, 5, 6}
Messung nicht oder nur willkürlich als Zahl beschreibbar
qualitative Zufallsgröße
Folie 2.4
Statistik II für Wirtschaftswissenschaftler
Beobachtung
mögliche Werte
N Beobachtungen
Zufallsgröße X
Werteraum X
Stichprobe X1, . . . , XN vom Umfang N
Speziell: A endliche Menge, z.B. {1, 2, 3, 4, 5, 6}
Stichproben von Umfang 5: (1,4,1,3,2), (2,2,4,3,6), . . .
Insgesamt 65 Möglichkeiten.
Laplace-Mechanismus = datengenerierender Mechanismus, bei
dem jede Stichprobe dieselbe Chance hat, realisiert (beobachtet) zu werden.
Folie 2.4a
Statistik II für Wirtschaftswissenschaftler
Folie 2.4b
Laplace Mechanismus
A = {a1, . . . , ak }
k Elemente,
z.B. Umfrage mit k möglichen Antworten
kN mögliche Stichproben vom Umfang N
N =1:
Ws(X1 = aj ) = 1
k
für alle j = 1, . . . , k
N beliebig: Ws(X1 = aj1 , . . . , XN = ajN ) = 1N für alle j1, . . . , jN
k
Beispiel: N = 5 Würfelwürfe
Ws(X1 = 2, X2 = 2, X3 = 4, X4 = 3, X5 = 6) = 615
Statistik II für Wirtschaftswissenschaftler
Folie 2.4c
X Zufallsgröße mit Werten in X
•
Lebensdauer einer LED-Leuchte, X = [0, ∞)
1. Beobachtbare Ereignisse X ∈ B,
•
B⊂X
{X ≤ 5 Tage} = {X ∈ [0, 5]},
{7 Tage < X ≤ 52 Tage} = {X ∈ (7, 52]}
2. Wahrscheinlichkeit 0 ≤ Ws(X ∈ B) ≤ 1 für jedes Ereignis
unmögliches Ereignis: Ws(X ∈ B) = 0
sicheres Ereignis: Ws(X ∈ B) = 1
•
Für ein λ > 0 :
Ws(X ≤ 5) = 1 − e−λ·5
Ws(7 < X ≤ 52) = e−λ·7 − e−λ·52
Statistik II für Wirtschaftswissenschaftler
3. Verteilung der Zufallsgröße X:
Abbildung, die jedem“ B ⊂ X die Wahrscheinlichkeit des
”
Ereignisses {X ∈ B} zuordnet (Rechenvorschrift für Ws)
P(B) = Ws(X ∈ B) ∈ [0, 1]
•
Exponentialverteilung mit Parameter λ > 0
P( [a, b] ) = Ws(a ≤ X ≤ b) = e−λ·a − e−λ·b
P( (b, ∞) ) = Ws(X > b) = e−λ·b
P( [0, a) ) = Ws(X < a) = 1 − e−λ·a
für alle 0 ≤ a ≤ b < ∞
Folie 2.4d
Statistik II für Wirtschaftswissenschaftler
Ereignisse und Teilmengen des Werteraums X
Vereinigung A ∪ B, Durchschnitt A ∩ B, Komplement Ac
A, B disjunkt, wenn A ∩ B = ∅ (leere Menge)
{X ∈ A ∪ B}:
wenigstens eines der Ereignisse {X ∈ A}, {X ∈ B} tritt ein
{X ∈ A ∩ B}:
beide Ereignisse {X ∈ A}, {X ∈ B} treten ein
A, B disjunkt:
die Ereignisse {X ∈ A}, {X ∈ B} schließen einander aus;
höchstens eines kann eintreten
{X ∈ Ac} = {X ∈
/ A} :
das Ereignis {X ∈ A} tritt nicht ein
Folie 2.4e
Statistik II für Wirtschaftswissenschaftler
Rechenregeln für Wahrscheinlichkeiten
Kolmogorow-Axiome:
W1) 0 ≤ Ws(X ∈ B) ≤ 1
W2) Ws(X ∈ X ) = 1
W3) B1, B2, . . . paarweise disjunkt, d.h. Bi ∩Bj = ∅ für alle i 6= j :
Ws(X ∈ Bj für ein j = 1, 2, . . .) ≡ Ws(X ∈ B1 ∪ B2 ∪ . . .)
=
∞
X
Ws(X ∈ Bj )
j=1
abzählbare Additivität bei einander ausschließenden
Ereignissen
Folie 2.5
Statistik II für Wirtschaftswissenschaftler
Folie 2.5a
Elementare Rechenregeln für Wahrscheinlichkeiten
W1) 0 ≤ Ws(X ∈ B) ≤ 1
W2) Ws(X ∈ X ) = 1
W3a) A, B disjunkt:
Ws(X ∈ A oder X ∈ B) = Ws(X ∈ A ∪ B)
= Ws(X ∈ A) + Ws(X ∈ B)
W3b) Ws(X ∈
/ B) = 1 − Ws(X ∈ B)
W3c) Wenn B ⊂ C, d.h. aus X ∈ B folgt X ∈ C:
Ws(X ∈ B) ≤ Ws(X ∈ C)
Statistik II für Wirtschaftswissenschaftler
Häufigkeitsinterpretation der Wahrscheinlichkeit
Zufallsexperiment
Zufallsgröße X
Wiederholte Zufallsexperimente derselben Art, die unabhängig
voneinander sind
Zufallsgrößen X1, X2, . . .
mit Ws(Xj ∈ B) = Ws(X ∈ B) für j = 1, 2, . . .
n Experimente
Stichprobe X1, . . . , Xn vom Umfang n
Anzahl der j mit {Xj ∈B}
Ws(X ∈ B)
n
n−→
→∞
Folie 2.6
Statistik II für Wirtschaftswissenschaftler
Folie 2.7
Statistik II für Wirtschaftswissenschaftler
Folie 2.8
2.5 Verteilungen mit Dichten
X Zufallsgröße mit Werten in X = R
zur Berechnung von Ws(X ∈ B) : Wahrscheinlichkeitsdichte
p(x) ≥ 0, −∞ < x < ∞ mit
Z ∞
−∞
p(x) dx = 1
Setze:
Ws(X ∈ (a, b)) ≡ Ws(a < X < b)
=
Z b
a
p(x) dx
Allgemein: B ⊆ R, Ws(X ∈ B) =
Z
B
p(x) dx
Statistik II für Wirtschaftswissenschaftler
R y+∆
Ws(y − ∆ ≤ X ≤ y + ∆) = y−∆ p(x) dx
≈ p(y) · 2∆ falls p(x) ≈ const. für y − ∆ < x < y + ∆
p(y) proportional zu Wahrscheinlichkeit, dass X Werte in der
Nähe von y annimmt.
Folie 2.9
Statistik II für Wirtschaftswissenschaftler
(
Beispiel:
p(x) =
Folie 2.10
0
für x < α und x > β
1
β−α für α ≤ x ≤ β
Eine Zufallsgröße X mit dieser Wsdichte nimmt nur Werte in
[α, β] an, und:
Ws(a < X < b) =
Z b
a
p(x) dx =
Z b
1
dx
a β−α
b−a
=
β−α
für α ≤ a ≤ b ≤ β
X heißt uniform verteilt im Intervall [α, β] oder kurz: U (α, β)verteilt
Statistik II für Wirtschaftswissenschaftler
Anwendungen
a) Rad einer Lokomotive mit Radius r
Bremsen
Rad schleift an zufälligem Punkt X auf dem Rand
(Abnutzung).
Modell: X ist U (0, 2πr)-verteilt
b) Polymerstrang der Länge ` wird chemisch gespalten
X = Länge des Teilstanges (vom linken Rand aus) ist U (0, `)verteilt.
Folie 2.11
Statistik II für Wirtschaftswissenschaftler
Folie 2.12
Die Normalverteilung (Skript 2.6)
X Werte in (−∞, ∞), Parameter µ ∈ R, σ 2 > 0
Wsdichte: p(x) = ϕµ,σ2 (x) = √
1
2πσ 2
− (x−µ)
2
e
2σ
2
.
Eine Zufallsgröße X mit dieser Dichte heißt normalverteilt mit
Mittelwert µ und Varianz σ 2, kurz: N (µ, σ 2)-verteilt
Spezialfall: Standardnormalverteilung N (0, 1)
1 − x2
ϕ(x) = ϕ0,1(x) = √
e 2
2π
Statistik II für Wirtschaftswissenschaftler
Dichte der Normalverteilung:
2
1
− (x−µ)
p(x) = ϕµ,σ2 (x) = √
e 2σ2 .
2πσ 2
Folie 2.13
Statistik II für Wirtschaftswissenschaftler
Folie 2.14
Modellbildung: Addition vieler kleiner Effekte
Messung X mit Werten in (−∞, ∞)
Ihr Wert hängt ab von Vielzahl von Einflüssen, von denen keiner
dominiert:
X≈
N
X
εj
j=1
N groß, ε1, . . . , εN gleichmäßig klein und unabhängig (oder
schwach abhängig)
X kann als N (µ, σ 2)-verteilte Zufallsgröße modelliert werden.
µ : Zentrum des Bereichs, wo X am ehesten beobachtet wird
σ : Maß für die Streuung der Werte von X um µ .
Statistik II für Wirtschaftswissenschaftler
Folie 2.14a
Berechnung von Wahrscheinlichkeiten (Normalverteilung)
Stammfunktion der Dichte der Standardnormalverteilung N (0, 1):
1 − x2
√
Φ(t) =
e 2 dx
ϕ(x)dx =
−∞
−∞ 2π
Z t
Z t
Stammfunktion der Dichte ϕµ,σ2 (x):
Φµ,σ2 (t) =
Z t
−∞
ϕµ,σ2 (x)dx =
Z t
−∞
√
1
2πσ 2
Tabelle von Φ(x), x ≥ 0
Φ(−x) = 1 − Φ(x)
Φ(∞) = Ws(Z ≤ ∞) = 1
Φ(−∞) = Ws(Z ≤ −∞) = 0
− (x−µ)
2
e
2σ
2
t−µ
dx = Φ(
)
σ
Statistik II für Wirtschaftswissenschaftler
Folie 2.15
Z N (0, 1)-verteilt
Ws(X ≤ t) = Φ(t)
Ws(a < Z < b) = Ws(Z < b) − Ws(Z ≤ a) = Φ(b) − Φ(a)
X N (µ, σ 2)-verteilt
Ws(X ≤ t) = Φµ,σ2 (t)
a−µ
X −µ
b−µ
Ws(a < X < b) = Ws
<
<
σ
σ
σ
b−µ
a−µ
= Φ
−Φ
σ
σ
X N (µ, σ 2)-verteilt
X −µ
Z=
σ
Z standardnormalverteilt
standardnormalverteilt
X = σZ + µ
N (µ, σ 2)-verteilt
Statistik II für Wirtschaftswissenschaftler
Normalverteilte Zufallsgrößen eignen sich als Modell für viele
reellwertige Messungen.
Bedingungen (an Histogramm grob nachprüfbar)
1) Wsdichte hat ein eindeutiges und deutliches Maximum bei
µ
2) Die Zufallsgröße streut symmetrisch um µ
Beispiele:
i) Körpergröße eines 20jährigen Mannes hängt ab von: genetischen Faktoren, Ernährung in verschiedenen Lebensaltern, Umwelteinflüssen, Krankheiten, ...
Deren Beiträge εj addieren sich zur Endgröße.
Folie 2.16
Statistik II für Wirtschaftswissenschaftler
ii) Störungen (Rauschen) bei Übertragung eines Signals in einem
Leiter durch die thermische Bewegung der freien Elektronen
Allgemein: Messfehler
iii) EEG-Messung zu festem Zeitpunkt
iv) Messungen von Länge, Volumen, Gewicht (Techno- oder
Biometrie) oft näherungsweise normal verteilt. Voraussetzung:
Die Objekte oder Individuen stammen aus homogener Grundgesamtheit.
Auch per se positive Messungen können als normalverteilte Zufallsgrößen modelliert werden, wenn für ein c > 0
Ws(X ≤ c) ≈ 0
Folie 2.17
Statistik II für Wirtschaftswissenschaftler
Folie 2.18
Statistik II für Wirtschaftswissenschaftler
Folie 2.19
Statistik II für Wirtschaftswissenschaftler
Folie 2.20
Statistik II für Wirtschaftswissenschaftler
Folie 2.21
Statistik II für Wirtschaftswissenschaftler
Folie 2.22
2.7 Verteilungsfunktion und Quantile
X reellwertige Zufallsgröße mit Wsdichte p
F (t) =
Z t
−∞
p(x)dx = Ws(X ≤ t)
(Stammfunktion von p) heißt Verteilungsfunktion
Ws(a < X < b) =
(−)
(−)
Z b
a
p(x)dx = F (b) − F (a)
Ws(X > a) = 1 − F (a)
(−)
Allgemeine Definition, auch für diskrete Verteilungen:
F (t) = Ws(X ≤ t)
Statistik II für Wirtschaftswissenschaftler
Folie 2.23
Statistik II für Wirtschaftswissenschaftler
Folie 2.23a
X mit Werten in X = [0, ∞) heißt exponentiell verteilt mit
Parameter λ > 0 oder Exp(λ)-verteilt, falls
Dichte p(x) = λe−λx, x ≥ 0 und p(x) = 0, x < 0.
Verteilungsfunktion:
F λ(t) = Ws(X ≤ t) =
Z t
0
λe−λxdx = 1 − e−λt
Ws(X > t) = 1 − Ws(X ≤ t) = e−λt
Ws(a ≤ X ≤ b) = e−λa − e−λb
Anwendungen:
•
Lebensdauer von elektronischem Bauteil
•
Wartezeit auf Ereignis (Schaden bei Sachversicherung,
Ankunft von Kunden in Bedienungssystem, ...)
Statistik II für Wirtschaftswissenschaftler
1) Gegeben t. Mit welcher Wahrscheinlichkeit α überschreitet
X den Wert t nicht?
Antwort: F (t) = Ws(X ≤ t) = α
2) Gegeben α. Welche Schranke t wird von X mit Wskeit α nicht
überschritten?
Antwort: t = qα = α-Quantil von X bzw. von F
Zu 0 < α < 1 heißt q α ein α-Quantil der Zufallsgröße X
oder der Verteilungsfunktion F , wenn
Ws(X ≤ qα) = F (qα) = α
Folie 2.24
Statistik II für Wirtschaftswissenschaftler
Spezialfälle:
a) 1
2 -Quantil q0,5 = Median
1 - bzw. 3 -Quantil q
b) 4
0,25 bzw. q0,75 = unteres bzw. oberes
4
Viertelquantil (oder Quartil)
Wenn X eine Wsdichte besitzt, so gibt es zu jedem 0 < α <
1 ein α-Quantil. Gibt es mehrere x mit F (x) = α, wähle (als
Konvention) das kleinste:
qα = min{x; F (x) = α}
Folie 2.25
Statistik II für Wirtschaftswissenschaftler
Folie 2.26
Quantile der Standard-Normalverteilung N (0, 1) (Tabelle 3a)
Niveau α
0,5000
0,7500
0,8000
0,8500
0,9000
0,9500
0,9750
0,9900
0,9950
0,9990
0,9995
Quantil qα
0,000
0,675
0,842
1,036
1,282
1,645
1,960
2,326
2,576
3,090
3,291
Für Niveaus α < 0, 5:
Quantile von N (µ, σ 2) :
qα = −q1−α
qα(µ, σ 2) = σ · qα + µ
Statistik II für Wirtschaftswissenschaftler
Anwendung: Risikomessung für Finanzanlagen (Basel I)
Vt Wert eines Aktienportfolios am Tag t
Rt = ln VVt ≈
t−1
Vt −Vt−1
Vt−1
Rendite von Tag t − 1 auf t
Modell: R1, R2, . . . , unabhängige N (µ, σ 2)-verteilte Zufallsgrößen
(auch Grundlage des Black-Scholes-Ansatzes zur Bewertung von
Optionen und anderen Derivaten)
Value-at-risk (VaR) = Schranke für den Verlust aus dem
Portfolio von einem Tag zum anderen (oder innerhalb von 5
Tagen), die nur mit geringer Wahrscheinlichkeit überschritten
wird (0,05 oder 0,01).
Folie 2.27
Statistik II für Wirtschaftswissenschaftler
t = heute
Vt bekannt
Risikoabschätzung für Wertentwicklung bis t + 1 = morgen (prozentual bezogen auf Kapital von heute)
0, 05 = Ws(Rt+1 ≤ VaR )
⇒ VaR = q0,05 = 0, 05-Quantil von N (µ, σ 2)
Vt+1 − Vt
≈ Rt+1 =⇒ Vt+1 ≤ Vt(1 + VaR )
Vt
passiert nur mit geringer Wskeit 0,05
µ =?, σ 2 =?
Folie 2.28
Statistik II für Wirtschaftswissenschaftler
Folie 2.29
Beispiel: Körpergröße von Männern ist N (µ, σ 2)-verteilt mit µ =
175 cm, σ = 10 cm.
Welche Körpergrößen müssen bei neuer Hosenkollektion berücksichtigt
werden, wenn nur die jeweils 5% kleinsten bzw. größten Männer
nichts Passendes finden sollen?
Gesucht: k, g mit Ws(X < k) = 0, 05 und Ws(X > g) = 0, 05
Ws(X < k) = Ws(X ≤ k) = F (k)
k = q0,05
Ws(X > g) = 1 − Ws(X ≤ g) = 1 − F (g) = 0, 05
F (g) = 0, 95
g = q0,95
Statistik II für Wirtschaftswissenschaftler
Folie 2.30
Ws(X < k) = 0, 05 und Ws(X > g) = 0, 95
N (0,1)
g = q0,95 = µ + σ q0,95
= [175 + 10 · 1, 645] cm
= 191, 45 cm
N (0,1)
k = q0,05 = µ + σq0,05
N (0,1)
= µ − σq0,95
= [175 − 10 · 1, 645] cm
= 158, 55 cm
Hosengröße: Beinlänge und Bauchumfang
abhängige Beobachtungen. Was ist das im stochastischen
Modell?
Statistik II für Wirtschaftswissenschaftler
Folie 2.31
2.10 Unabhängigkeit (und Korrelation)
Unabhängigkeit von Zufallsgrößen ≡ Multiplikationsregel für
Wahrscheinlichkeiten
Zufallsgrößen X, Y mit Werten in X sind unabhängig, wenn für
alle A, B ⊆ X
Ws X ∈ A und Y ∈ B = Ws X ∈ A · Ws Y ∈ B
X1, . . . , XN unabhängig, wenn für alle A1, . . . , AN ⊆ X
Ws X1 ∈ A1, . . . , XN ∈ AN = Ws X1 ∈ A1 · . . . · Ws XN ∈ AN
Statistik II für Wirtschaftswissenschaftler
Folie 2.32
Bei Abhängigkeit gilt das nicht, zum Beispiel:
X standardnormalverteilt, Y = X 2
0≤Y ≤1
⇐⇒
−1 ≤ X ≤ 1
w = Ws(0 ≤ Y ≤ 1) = Ws(−1 ≤ X ≤ 1) = Φ(1) − Φ(−1)
= Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 · 0, 8413 − 1 = 0, 6826 < 1
und damit
w = Ws(0 ≤ Y ≤ 1) = Ws 0 ≤ Y ≤ 1 und − 1 ≤ X ≤ 1
> w2 = Ws(0 ≤ Y ≤ 1) · Ws(−1 ≤ X ≤ 1)
Statistik II für Wirtschaftswissenschaftler
Zufallsgrößen X1, . . . , XN mit Werten in X heißen unabhängig,
identisch verteilt (u.i.v.), wenn sie unabhängig sind und wenn
sie alle dieselbe Verteilung haben, d. h. für alle j = 1, . . . , N
Ws(Xj ∈ A) = Ws(X1 ∈ A) für alle A ⊆ X
Modellbildung: u.i.v. Zufallsgrößen eignen sich als Modell für
Messwerte, die auf (im intuitiven Sinn) unabhängige Weise
durch Wiederholung des jeweils selben Experiments gewonnen
worden sind.
Folie 2.33
Herunterladen