Folien:2

Werbung
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.1
2. Wahrscheinlichkeitstheoretische Grundlagen
Stochastisches Modell = mathematisches Modell für ein reales
Phänomen unter Verwendung des fiktiven Begriffs Zufall
Wann?
a) bei der Datenerhebung wird explizit ein zufälliger Aspekt
eingebaut (Meinungsumfragen)
b) System an sich deterministisch, aber zu komplex für deterministische Modellierung
Beispiel:
Würfelwurf als mechanisches Experiment zu kompliziert
Stochastisches Modell: Würfelwurf liefert Zufallsgröße X mit
Werten in {1, 2, 3, 4, 5, 6}, wobei jede Zahl 1, . . . , 6 dieselbe Wahr1 hat, als Wert von X aufzutreten.
scheinlichkeit 6
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.2
2.1 Zufallsgrößen, Ereignisse, Wahrscheinlichkeiten
”Messung” eines numerischen oder qualitativen Merkmals
Ergebnisse liegen in Werteraum X
Wiederholte ”Messungen”
unterschiedliche Ergebnisse
Modellierung:
c Zufallsmechanismus
Messvorgang =
Einmalige Betätigung liefert Zufallsgröße X mit Werten in X
Wiederholte Betätigung liefert verschiedene Realisationen der
Zufallsgröße X
X1, X2, . . . , XN
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.3
Beispiele:
i) Gewicht eines zufällig ausgewählten Passanten in kg
Werteraum: X = (0, ∞) ⊆ R
ii) Anzahl der defekten RAM-Bausteine in einer Lieferung von
1000 Stück
Werteraum: X = {0, . . . , 1000} ⊆ R
iii) Windgeschwindigkeit in allen 3 Richtungen des Raums
Werteraum: X = R3
iv) Alter und Blutdruck eines Menschen
Werteraum: X = {0, 1, 2, . . .} × (0, ∞)
Messung liefert quantitative Daten, X ⊆ R oder Rd
quantitative Zufallsgröße
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.4
v) Familienstand
X = {ledig, verheiratet, verwitwet, geschieden, keine Angabe}
vi) Meinungsäußerung auf Frage nach Semesterticket
X = {dafür, dagegen, egal, keine Angabe}
vii) Bewertung eines Rasenmähers nach Preis und Handhabung
X = { billig, mittel, teuer} × {leicht, schwer}
viii) Zeugnisnote im Schulfach
X = {1, 2, 3, 4, 5, 6}
ix) Ergebnis eines Würfelwurfs
X = {1, 2, 3, 4, 5, 6}
Messung nicht oder nur willkürlich als Zahl beschreibbar
qualitative Zufallsgröße
Prof. Dr. J. Franke
Beobachtung
mögliche Werte
N Beobachtungen
Statistik II für Wirtschaftswissenschaftler 2.4a
Zufallsgröße X
Werteraum X
Stichprobe X1, . . . , XN vom Umfang N
Speziell: A endliche Menge, z.B. {1, 2, 3, 4, 5, 6}
Stichproben von Umfang 5: (1,4,1,3,2), (2,2,4,3,6), . . .
Insgesamt 65 Möglichkeiten.
Laplace-Mechanismus = datengenerierender Mechanismus, bei
dem jede Stichprobe dieselbe Chance hat, realisiert (beobachtet) zu werden.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.4b
Laplace Mechanismus
A = {a1, . . . , ak }
k Elemente,
z.B. Umfrage mit k möglichen Antworten
kN mögliche Stichproben vom Umfang N
N =1:
Ws(X1 = aj ) = 1
k
für alle j = 1, . . . , k
N beliebig: Ws(X1 = aj1 , . . . , XN = ajN ) = 1N für alle j1, . . . , jN
k
Beispiel: N = 5 Würfelwürfe
Ws(X1 = 2, X2 = 2, X3 = 4, X4 = 3, X5 = 6) = 615
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.4c
X Zufallsgröße mit Werten in X
•
Lebensdauer einer LED-Leuchte, X = [0, ∞)
1. Beobachtbare Ereignisse X ∈ B,
•
B⊂X
{X ≤ 5 Tage} = {X ∈ [0, 5]},
{7 Tage < X ≤ 52 Tage} = {X ∈ (7, 52]}
2. Wahrscheinlichkeit 0 ≤ Ws(X ∈ B) ≤ 1 für jedes Ereignis
unmögliches Ereignis: Ws(X ∈ B) = 0
sicheres Ereignis: Ws(X ∈ B) = 1
•
Für ein λ > 0 :
Ws(X ≤ 5) = 1 − e−λ·5
Ws(7 < X ≤ 52) = e−λ·7 − e−λ·52
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.4d
3. Verteilung der Zufallsgröße X:
Abbildung, die jedem“ B ⊂ X die Wahrscheinlichkeit des
”
Ereignisses {X ∈ B} zuordnet (Rechenvorschrift für Ws)
P(B) = Ws(X ∈ B) ∈ [0, 1]
•
Exponentialverteilung mit Parameter λ > 0
P( [a, b] ) = Ws(a ≤ X ≤ b) = e−λ·a − e−λ·b
P( (b, ∞) ) = Ws(X > b) = e−λ·b
P( [0, a) ) = Ws(X < a) = 1 − e−λ·a
für alle 0 ≤ a ≤ b < ∞
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.4e
Ereignisse und Teilmengen des Werteraums X
Vereinigung A ∪ B, Durchschnitt A ∩ B, Komplement Ac
A, B disjunkt, wenn A ∩ B = ∅ (leere Menge)
{X ∈ A ∪ B}:
wenigstens eines der Ereignisse {X ∈ A}, {X ∈ B} tritt ein
{X ∈ A ∩ B}:
beide Ereignisse {X ∈ A}, {X ∈ B} treten ein
A, B disjunkt:
die Ereignisse {X ∈ A}, {X ∈ B} schließen einander aus;
höchstens eines kann eintreten
{X ∈ Ac} = {X ∈
/ A} :
das Ereignis {X ∈ A} tritt nicht ein
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.5
Rechenregeln für Wahrscheinlichkeiten
Kolmogorow-Axiome:
W1) 0 ≤ Ws(X ∈ B) ≤ 1
W2) Ws(X ∈ X ) = 1
W3) B1, B2, . . . paarweise disjunkt, d.h. Bi ∩Bj = ∅ für alle i 6= j :
Ws(X ∈ Bj für ein j = 1, 2, . . .) ≡ Ws(X ∈ B1 ∪ B2 ∪ . . .)
=
∞
X
Ws(X ∈ Bj )
j=1
abzählbare Additivität bei einander ausschließenden
Ereignissen
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.5a
Elementare Rechenregeln für Wahrscheinlichkeiten
W1) 0 ≤ Ws(X ∈ B) ≤ 1
W2) Ws(X ∈ X ) = 1
W3a) A, B disjunkt:
Ws(X ∈ A oder X ∈ B) = Ws(X ∈ A ∪ B)
= Ws(X ∈ A) + Ws(X ∈ B)
W3b) Ws(X ∈
/ B) = 1 − Ws(X ∈ B)
W3c) Wenn B ⊂ C, d.h. aus X ∈ B folgt X ∈ C:
Ws(X ∈ B) ≤ Ws(X ∈ C)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.6
Häufigkeitsinterpretation der Wahrscheinlichkeit
Zufallsexperiment
Zufallsgröße X
Wiederholte Zufallsexperimente derselben Art, die unabhängig
voneinander sind
Zufallsgrößen X1, X2, . . .
mit Ws(Xj ∈ B) = Ws(X ∈ B) für j = 1, 2, . . .
n Experimente
Stichprobe X1, . . . , Xn vom Umfang n
Anzahl der j mit {Xj ∈B}
Ws(X ∈ B)
n
n−→
→∞
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.7
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.8
2.5 Verteilungen mit Dichten
X Zufallsgröße mit Werten in X = R
zur Berechnung von Ws(X ∈ B) : Wahrscheinlichkeitsdichte
p(x) ≥ 0, −∞ < x < ∞ mit
Z ∞
−∞
p(x) dx = 1
Setze:
Ws(X ∈ (a, b)) ≡ Ws(a < X < b)
=
Z b
a
p(x) dx
Allgemein: B ⊆ R, Ws(X ∈ B) =
Z
B
p(x) dx
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.9
R y+∆
Ws(y − ∆ ≤ X ≤ y + ∆) = y−∆ p(x) dx
≈ p(y) · 2∆ falls p(x) ≈ const. für y − ∆ < x < y + ∆
p(y) proportional zu Wahrscheinlichkeit, dass X Werte in der
Nähe von y annimmt.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.10
(
Beispiel:
p(x) =
0
für x < α und x > β
1
β−α für α ≤ x ≤ β
Eine Zufallsgröße X mit dieser Wsdichte nimmt nur Werte in
[α, β] an, und:
Ws(a < X < b) =
Z b
a
p(x) dx =
Z b
1
dx
a β−α
b−a
=
β−α
für α ≤ a ≤ b ≤ β
X heißt uniform verteilt im Intervall [α, β] oder kurz: U (α, β)verteilt
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.11
Anwendungen
a) Rad einer Lokomotive mit Radius r
Bremsen
Rad schleift an zufälligem Punkt X auf dem Rand
(Abnutzung).
Modell: X ist U (0, 2πr)-verteilt
b) Polymerstrang der Länge ` wird chemisch gespalten
X = Länge des Teilstanges (vom linken Rand aus) ist U (0, `)verteilt.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.12
Die Normalverteilung (Skript 2.6)
X Werte in (−∞, ∞), Parameter µ ∈ R, σ 2 > 0
Wsdichte: p(x) = ϕµ,σ2 (x) = √
1
2πσ 2
− (x−µ)
2
e
2σ
2
.
Eine Zufallsgröße X mit dieser Dichte heißt normalverteilt mit
Mittelwert µ und Varianz σ 2, kurz: N (µ, σ 2)-verteilt
Spezialfall: Standardnormalverteilung N (0, 1)
1 − x2
ϕ(x) = ϕ0,1(x) = √
e 2
2π
Prof. Dr. J. Franke
Dichte der Normalverteilung:
2
1
− (x−µ)
p(x) = ϕµ,σ2 (x) = √
e 2σ2 .
2πσ 2
Statistik II für Wirtschaftswissenschaftler 2.13
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.14
Modellbildung: Addition vieler kleiner Effekte
Messung X mit Werten in (−∞, ∞)
Ihr Wert hängt ab von Vielzahl von Einflüssen, von denen keiner
dominiert:
X≈
N
X
εj
j=1
N groß, ε1, . . . , εN gleichmäßig klein und unabhängig (oder
schwach abhängig)
X kann als N (µ, σ 2)-verteilte Zufallsgröße modelliert werden.
µ : Zentrum des Bereichs, wo X am ehesten beobachtet wird
σ : Maß für die Streuung der Werte von X um µ .
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.14a
Berechnung von Wahrscheinlichkeiten (Normalverteilung)
Stammfunktion der Dichte der Standardnormalverteilung N (0, 1):
1 − x2
√
Φ(t) =
e 2 dx
ϕ(x)dx =
−∞
−∞ 2π
Z t
Z t
Stammfunktion der Dichte ϕµ,σ2 (x):
Φµ,σ2 (t) =
Z t
−∞
ϕµ,σ2 (x)dx =
Z t
−∞
√
1
2πσ 2
Tabelle von Φ(x), x ≥ 0
Φ(−x) = 1 − Φ(x)
Φ(∞) = Ws(Z ≤ ∞) = 1
Φ(−∞) = Ws(Z ≤ −∞) = 0
− (x−µ)
2
e
2σ
2
t−µ
dx = Φ(
)
σ
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.15
Z N (0, 1)-verteilt
Ws(X ≤ t) = Φ(t)
Ws(a < Z < b) = Ws(Z < b) − Ws(Z ≤ a) = Φ(b) − Φ(a)
X N (µ, σ 2)-verteilt
Ws(X ≤ t) = Φµ,σ2 (t)
a−µ
X −µ
b−µ
Ws(a < X < b) = Ws
<
<
σ
σ
σ
b−µ
a−µ
= Φ
−Φ
σ
σ
X N (µ, σ 2)-verteilt
X −µ
Z=
σ
Z standardnormalverteilt
standardnormalverteilt
X = σZ + µ
N (µ, σ 2)-verteilt
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.16
Normalverteilte Zufallsgrößen eignen sich als Modell für viele
reellwertige Messungen.
Bedingungen (an Histogramm grob nachprüfbar)
1) Wsdichte hat ein eindeutiges und deutliches Maximum bei
µ
2) Die Zufallsgröße streut symmetrisch um µ
Beispiele:
i) Körpergröße eines 20jährigen Mannes hängt ab von: genetischen Faktoren, Ernährung in verschiedenen Lebensaltern, Umwelteinflüssen, Krankheiten, ...
Deren Beiträge εj addieren sich zur Endgröße.
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.17
ii) Störungen (Rauschen) bei Übertragung eines Signals in einem
Leiter durch die thermische Bewegung der freien Elektronen
Allgemein: Messfehler
iii) EEG-Messung zu festem Zeitpunkt
iv) Messungen von Länge, Volumen, Gewicht (Techno- oder
Biometrie) oft näherungsweise normal verteilt. Voraussetzung:
Die Objekte oder Individuen stammen aus homogener Grundgesamtheit.
Auch per se positive Messungen können als normalverteilte Zufallsgrößen modelliert werden, wenn für ein c > 0
Ws(X ≤ c) ≈ 0
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.18
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.19
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.20
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.21
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.22
2.7 Verteilungsfunktion und Quantile
X reellwertige Zufallsgröße mit Wsdichte p
F (t) =
Z t
−∞
p(x)dx = Ws(X ≤ t)
(Stammfunktion von p) heißt Verteilungsfunktion
Ws(a < X < b) =
(−)
(−)
Z b
a
p(x)dx = F (b) − F (a)
Ws(X > a) = 1 − F (a)
(−)
Allgemeine Definition, auch für diskrete Verteilungen:
F (t) = Ws(X ≤ t)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.23
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.23a
X mit Werten in X = [0, ∞) heißt exponentiell verteilt mit
Parameter λ > 0 oder Exp(λ)-verteilt, falls
Dichte p(x) = λe−λx, x ≥ 0 und p(x) = 0, x < 0.
Verteilungsfunktion:
F λ(t) = Ws(X ≤ t) =
Z t
0
λe−λxdx = 1 − e−λt
Ws(X > t) = 1 − Ws(X ≤ t) = e−λt
Ws(a ≤ X ≤ b) = e−λa − e−λb
Anwendungen:
•
Lebensdauer von elektronischem Bauteil
•
Wartezeit auf Ereignis (Schaden bei Sachversicherung,
Ankunft von Kunden in Bedienungssystem, ...)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.24
1) Gegeben t. Mit welcher Wahrscheinlichkeit α überschreitet
X den Wert t nicht?
Antwort: F (t) = Ws(X ≤ t) = α
2) Gegeben α. Welche Schranke t wird von X mit Wskeit α nicht
überschritten?
Antwort: t = qα = α-Quantil von X bzw. von F
Zu 0 < α < 1 heißt q α ein α-Quantil der Zufallsgröße X
oder der Verteilungsfunktion F , wenn
Ws(X ≤ qα) = F (qα) = α
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.25
Spezialfälle:
a) 1
2 -Quantil q0,5 = Median
1 - bzw. 3 -Quantil q
b) 4
0,25 bzw. q0,75 = unteres bzw. oberes
4
Viertelquantil (oder Quartil)
Wenn X eine Wsdichte besitzt, so gibt es zu jedem 0 < α <
1 ein α-Quantil. Gibt es mehrere x mit F (x) = α, wähle (als
Konvention) das kleinste:
qα = min{x; F (x) = α}
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.26
Quantile der Standard-Normalverteilung N (0, 1) (Tabelle 3a)
Niveau α
0,5000
0,7500
0,8000
0,8500
0,9000
0,9500
0,9750
0,9900
0,9950
0,9990
0,9995
Quantil qα
0,000
0,675
0,842
1,036
1,282
1,645
1,960
2,326
2,576
3,090
3,291
Für Niveaus α < 0, 5:
Quantile von N (µ, σ 2) :
qα = −q1−α
qα(µ, σ 2) = σ · qα + µ
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.27
Anwendung: Risikomessung für Finanzanlagen (Basel I)
Vt Wert eines Aktienportfolios am Tag t
Rt = ln VVt ≈
t−1
Vt −Vt−1
Vt−1
Rendite von Tag t − 1 auf t
Modell: R1, R2, . . . , unabhängige N (µ, σ 2)-verteilte Zufallsgrößen
(auch Grundlage des Black-Scholes-Ansatzes zur Bewertung von
Optionen und anderen Derivaten)
Value-at-risk (VaR) = Schranke für den Verlust aus dem
Portfolio von einem Tag zum anderen (oder innerhalb von 5
Tagen), die nur mit geringer Wahrscheinlichkeit überschritten
wird (0,05 oder 0,01).
Prof. Dr. J. Franke
t = heute
Statistik II für Wirtschaftswissenschaftler 2.28
Vt bekannt
Risikoabschätzung für Wertentwicklung bis t + 1 = morgen (prozentual bezogen auf Kapital von heute)
0, 05 = Ws(Rt+1 ≤ VaR )
⇒ VaR = q0,05 = 0, 05-Quantil von N (µ, σ 2)
Vt+1 − Vt
≈ Rt+1 =⇒ Vt+1 ≤ Vt(1 + VaR )
Vt
passiert nur mit geringer Wskeit 0,05
µ =?, σ 2 =?
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.29
Beispiel: Körpergröße von Männern ist N (µ, σ 2)-verteilt mit µ =
175 cm, σ = 10 cm.
Welche Körpergrößen müssen bei neuer Hosenkollektion berücksichtigt
werden, wenn nur die jeweils 5% kleinsten bzw. größten Männer
nichts Passendes finden sollen?
Gesucht: k, g mit Ws(X < k) = 0, 05 und Ws(X > g) = 0, 05
Ws(X < k) = Ws(X ≤ k) = F (k)
k = q0,05
Ws(X > g) = 1 − Ws(X ≤ g) = 1 − F (g) = 0, 05
F (g) = 0, 95
g = q0,95
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.30
Ws(X < k) = 0, 05 und Ws(X > g) = 0, 95
N (0,1)
g = q0,95 = µ + σ q0,95
= [175 + 10 · 1, 645] cm
= 191, 45 cm
N (0,1)
k = q0,05 = µ + σq0,05
N (0,1)
= µ − σq0,95
= [175 − 10 · 1, 645] cm
= 158, 55 cm
Hosengröße: Beinlänge und Bauchumfang
abhängige Beobachtungen. Was ist das im stochastischen
Modell?
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.31
2.10 Unabhängigkeit (und Korrelation)
Unabhängigkeit von Zufallsgrößen ≡ Multiplikationsregel für
Wahrscheinlichkeiten
Zufallsgrößen X, Y mit Werten in X sind unabhängig, wenn für
alle A, B ⊆ X
Ws X ∈ A und Y ∈ B = Ws X ∈ A · Ws Y ∈ B
X1, . . . , XN unabhängig, wenn für alle A1, . . . , AN ⊆ X
Ws X1 ∈ A1, . . . , XN ∈ AN = Ws X1 ∈ A1 · . . . · Ws XN ∈ AN
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.32
Bei Abhängigkeit gilt das nicht, zum Beispiel:
X standardnormalverteilt, Y = X 2
0≤Y ≤1
⇐⇒
−1 ≤ X ≤ 1
w = Ws(0 ≤ Y ≤ 1) = Ws(−1 ≤ X ≤ 1) = Φ(1) − Φ(−1)
= Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 · 0, 8413 − 1 = 0, 6826 < 1
und damit
w = Ws(0 ≤ Y ≤ 1) = Ws 0 ≤ Y ≤ 1 und − 1 ≤ X ≤ 1
> w2 = Ws(0 ≤ Y ≤ 1) · Ws(−1 ≤ X ≤ 1)
Prof. Dr. J. Franke
Statistik II für Wirtschaftswissenschaftler 2.33
Zufallsgrößen X1, . . . , XN mit Werten in X heißen unabhängig,
identisch verteilt (u.i.v.), wenn sie unabhängig sind und wenn
sie alle dieselbe Verteilung haben, d. h. für alle j = 1, . . . , N
Ws(Xj ∈ A) = Ws(X1 ∈ A) für alle A ⊆ X
Modellbildung: u.i.v. Zufallsgrößen eignen sich als Modell für
Messwerte, die auf (im intuitiven Sinn) unabhängige Weise
durch Wiederholung des jeweils selben Experiments gewonnen
worden sind.
Herunterladen