Folien 2

Statistik II für Wirtschaftswissenschaftler
2. Wahrscheinlichkeitstheoretische Grundlagen
Stochastisches Modell = mathematisches Modell für ein reales
Phänomen unter Verwendung des fiktiven Begriffs Zufall
Wann?
a) bei der Datenerhebung wird explizit ein zufälliger Aspekt
eingebaut (Meinungsumfragen)
b) System an sich deterministisch, aber zu komplex für deterministische Modellierung
Beispiel:
Würfelwurf als mechanisches Experiment zu kompliziert
Stochastisches Modell: Würfelwurf liefert Zufallsgröße X mit
Werten in {1, 2, 3, 4, 5, 6}, wobei jede Zahl 1, . . . , 6 dieselbe Wahr1 hat, als Wert von X aufzutreten.
scheinlichkeit 6
Folie 2.1
Statistik II für Wirtschaftswissenschaftler
Folie 2.2
2.1 Zufallsgrößen, Ereignisse, Wahrscheinlichkeiten
”Messung” eines numerischen oder qualitativen Merkmals
Ergebnisse liegen in Werteraum X
Wiederholte ”Messungen”
unterschiedliche Ergebnisse
Modellierung:
c Zufallsmechanismus
Messvorgang =
Einmalige Betätigung liefert Zufallsgröße X mit Werten in X
Wiederholte Betätigung liefert verschiedene Realisationen der
Zufallsgröße X
X1, X2, . . . , XN
Statistik II für Wirtschaftswissenschaftler
Beispiele:
i) Gewicht eines zufällig ausgewählten Passanten in kg
Werteraum: X = (0, ∞) ⊆ R
ii) Anzahl der defekten RAM-Bausteine in einer Lieferung von
1000 Stück
Werteraum: X = {0, . . . , 1000} ⊆ R
iii) Windgeschwindigkeit in allen 3 Richtungen des Raums
Werteraum: X = R3
iv) Alter und Blutdruck eines Menschen
Werteraum: X = {0, 1, 2, . . .} × (0, ∞)
Messung liefert quantitative Daten, X ⊆ R oder Rd
quantitative Zufallsgröße
Folie 2.3
Statistik II für Wirtschaftswissenschaftler
v) Familienstand
X = {ledig, verheiratet, verwitwet, geschieden, keine Angabe}
vi) Meinungsäußerung auf Frage nach Semesterticket
X = {dafür, dagegen, egal, keine Angabe}
vii) Bewertung eines Rasenmähers nach Preis und Handhabung
X = { billig, mittel, teuer} × {leicht, schwer}
viii) Zeugnisnote im Schulfach
X = {1, 2, 3, 4, 5, 6}
ix) Ergebnis eines Würfelwurfs
X = {1, 2, 3, 4, 5, 6}
Messung nicht oder nur willkürlich als Zahl beschreibbar
qualitative Zufallsgröße
Folie 2.4
Statistik II für Wirtschaftswissenschaftler
Beobachtung
mögliche Werte
N Beobachtungen
Zufallsgröße X
Werteraum X
Stichprobe X1, . . . , XN vom Umfang N
Speziell: A endliche Menge, z.B. {1, 2, 3, 4, 5, 6}
Stichproben von Umfang 5: (1,4,1,3,2), (2,2,4,3,6), . . .
Insgesamt 65 Möglichkeiten.
Laplace-Mechanismus = datengenerierender Mechanismus, bei
dem jede Stichprobe dieselbe Chance hat, realisiert (beobachtet) zu werden.
Folie 2.4a
Statistik II für Wirtschaftswissenschaftler
Folie 2.4b
Laplace Mechanismus
A = {a1, . . . , ak }
k Elemente,
z.B. Umfrage mit k möglichen Antworten
kN mögliche Stichproben vom Umfang N
N =1:
Ws(X1 = aj ) = 1
k
für alle j = 1, . . . , k
N beliebig: Ws(X1 = aj1 , . . . , XN = ajN ) = 1N für alle j1, . . . , jN
k
Beispiel: N = 5 Würfelwürfe
Ws(X1 = 2, X2 = 2, X3 = 4, X4 = 3, X5 = 6) = 615
Statistik II für Wirtschaftswissenschaftler
Folie 2.4c
X Zufallsgröße mit Werten in X
•
Lebensdauer einer LED-Leuchte, X = [0, ∞)
1. Beobachtbare Ereignisse X ∈ B,
•
B⊂X
{X ≤ 5 Tage} = {X ∈ [0, 5]},
{7 Tage < X ≤ 52 Tage} = {X ∈ (7, 52]}
2. Wahrscheinlichkeit 0 ≤ Ws(X ∈ B) ≤ 1 für jedes Ereignis
unmögliches Ereignis: Ws(X ∈ B) = 0
sicheres Ereignis: Ws(X ∈ B) = 1
•
Für ein λ > 0 :
Ws(X ≤ 5) = 1 − e−λ·5
Ws(7 < X ≤ 52) = e−λ·7 − e−λ·52
Statistik II für Wirtschaftswissenschaftler
3. Verteilung der Zufallsgröße X:
Abbildung, die jedem“ B ⊂ X die Wahrscheinlichkeit des
”
Ereignisses {X ∈ B} zuordnet (Rechenvorschrift für Ws)
P(B) = Ws(X ∈ B) ∈ [0, 1]
•
Exponentialverteilung mit Parameter λ > 0
P( [a, b] ) = Ws(a ≤ X ≤ b) = e−λ·a − e−λ·b
P( (b, ∞) ) = Ws(X > b) = e−λ·b
P( [0, a) ) = Ws(X < a) = 1 − e−λ·a
für alle 0 ≤ a ≤ b < ∞
Folie 2.4d
Statistik II für Wirtschaftswissenschaftler
Ereignisse und Teilmengen des Werteraums X
Vereinigung A ∪ B, Durchschnitt A ∩ B, Komplement Ac
A, B disjunkt, wenn A ∩ B = ∅ (leere Menge)
{X ∈ A ∪ B}:
wenigstens eines der Ereignisse {X ∈ A}, {X ∈ B} tritt ein
{X ∈ A ∩ B}:
beide Ereignisse {X ∈ A}, {X ∈ B} treten ein
A, B disjunkt:
die Ereignisse {X ∈ A}, {X ∈ B} schließen einander aus;
höchstens eines kann eintreten
{X ∈ Ac} = {X ∈
/ A} :
das Ereignis {X ∈ A} tritt nicht ein
Folie 2.4e
Statistik II für Wirtschaftswissenschaftler
Rechenregeln für Wahrscheinlichkeiten
Kolmogorow-Axiome:
W1) 0 ≤ Ws(X ∈ B) ≤ 1
W2) Ws(X ∈ X ) = 1
W3) B1, B2, . . . paarweise disjunkt, d.h. Bi ∩Bj = ∅ für alle i 6= j :
Ws(X ∈ Bj für ein j = 1, 2, . . .) ≡ Ws(X ∈ B1 ∪ B2 ∪ . . .)
=
∞
X
Ws(X ∈ Bj )
j=1
abzählbare Additivität bei einander ausschließenden
Ereignissen
Folie 2.5
Statistik II für Wirtschaftswissenschaftler
Folie 2.5a
Elementare Rechenregeln für Wahrscheinlichkeiten
W1) 0 ≤ Ws(X ∈ B) ≤ 1
W2) Ws(X ∈ X ) = 1
W3a) A, B disjunkt:
Ws(X ∈ A oder X ∈ B) = Ws(X ∈ A ∪ B)
= Ws(X ∈ A) + Ws(X ∈ B)
W3b) Ws(X ∈
/ B) = 1 − Ws(X ∈ B)
W3c) Wenn B ⊂ C, d.h. aus X ∈ B folgt X ∈ C:
Ws(X ∈ B) ≤ Ws(X ∈ C)
Statistik II für Wirtschaftswissenschaftler
Häufigkeitsinterpretation der Wahrscheinlichkeit
Zufallsexperiment
Zufallsgröße X
Wiederholte Zufallsexperimente derselben Art, die unabhängig
voneinander sind
Zufallsgrößen X1, X2, . . .
mit Ws(Xj ∈ B) = Ws(X ∈ B) für j = 1, 2, . . .
n Experimente
Stichprobe X1, . . . , Xn vom Umfang n
Anzahl der j mit {Xj ∈B}
Ws(X ∈ B)
n
n−→
→∞
Folie 2.6
Statistik II für Wirtschaftswissenschaftler
Folie 2.7
Statistik II für Wirtschaftswissenschaftler
Folie 2.8
2.5 Verteilungen mit Dichten
X Zufallsgröße mit Werten in X = R
zur Berechnung von Ws(X ∈ B) : Wahrscheinlichkeitsdichte
p(x) ≥ 0, −∞ < x < ∞ mit
Z ∞
−∞
p(x) dx = 1
Setze:
Ws(X ∈ (a, b)) ≡ Ws(a < X < b)
=
Z b
a
p(x) dx
Allgemein: B ⊆ R, Ws(X ∈ B) =
Z
B
p(x) dx
Statistik II für Wirtschaftswissenschaftler
R y+∆
Ws(y − ∆ ≤ X ≤ y + ∆) = y−∆ p(x) dx
≈ p(y) · 2∆ falls p(x) ≈ const. für y − ∆ < x < y + ∆
p(y) proportional zu Wahrscheinlichkeit, dass X Werte in der
Nähe von y annimmt.
Folie 2.9
Statistik II für Wirtschaftswissenschaftler
(
Beispiel:
p(x) =
Folie 2.10
0
für x < α und x > β
1
β−α für α ≤ x ≤ β
Eine Zufallsgröße X mit dieser Wsdichte nimmt nur Werte in
[α, β] an, und:
Ws(a < X < b) =
Z b
a
p(x) dx =
Z b
1
dx
a β−α
b−a
=
β−α
für α ≤ a ≤ b ≤ β
X heißt uniform verteilt im Intervall [α, β] oder kurz: U (α, β)verteilt
Statistik II für Wirtschaftswissenschaftler
Anwendungen
a) Rad einer Lokomotive mit Radius r
Bremsen
Rad schleift an zufälligem Punkt X auf dem Rand
(Abnutzung).
Modell: X ist U (0, 2πr)-verteilt
b) Polymerstrang der Länge ` wird chemisch gespalten
X = Länge des Teilstanges (vom linken Rand aus) ist U (0, `)verteilt.
Folie 2.11
Statistik II für Wirtschaftswissenschaftler
Folie 2.12
Die Normalverteilung (Skript 2.6)
X Werte in (−∞, ∞), Parameter µ ∈ R, σ 2 > 0
Wsdichte: p(x) = ϕµ,σ2 (x) = √
1
2πσ 2
− (x−µ)
2
e
2σ
2
.
Eine Zufallsgröße X mit dieser Dichte heißt normalverteilt mit
Mittelwert µ und Varianz σ 2, kurz: N (µ, σ 2)-verteilt
Spezialfall: Standardnormalverteilung N (0, 1)
1 − x2
ϕ(x) = ϕ0,1(x) = √
e 2
2π
Statistik II für Wirtschaftswissenschaftler
Dichte der Normalverteilung:
2
1
− (x−µ)
p(x) = ϕµ,σ2 (x) = √
e 2σ2 .
2πσ 2
Folie 2.13
Statistik II für Wirtschaftswissenschaftler
Folie 2.14
Modellbildung: Addition vieler kleiner Effekte
Messung X mit Werten in (−∞, ∞)
Ihr Wert hängt ab von Vielzahl von Einflüssen, von denen keiner
dominiert:
X≈
N
X
εj
j=1
N groß, ε1, . . . , εN gleichmäßig klein und unabhängig (oder
schwach abhängig)
X kann als N (µ, σ 2)-verteilte Zufallsgröße modelliert werden.
µ : Zentrum des Bereichs, wo X am ehesten beobachtet wird
σ : Maß für die Streuung der Werte von X um µ .
Statistik II für Wirtschaftswissenschaftler
Folie 2.14a
Berechnung von Wahrscheinlichkeiten (Normalverteilung)
Stammfunktion der Dichte der Standardnormalverteilung N (0, 1):
1 − x2
√
Φ(t) =
e 2 dx
ϕ(x)dx =
−∞
−∞ 2π
Z t
Z t
Stammfunktion der Dichte ϕµ,σ2 (x):
Φµ,σ2 (t) =
Z t
−∞
ϕµ,σ2 (x)dx =
Z t
−∞
√
1
2πσ 2
Tabelle von Φ(x), x ≥ 0
Φ(−x) = 1 − Φ(x)
Φ(∞) = Ws(Z ≤ ∞) = 1
Φ(−∞) = Ws(Z ≤ −∞) = 0
− (x−µ)
2
e
2σ
2
t−µ
dx = Φ(
)
σ
Statistik II für Wirtschaftswissenschaftler
Folie 2.15
Z N (0, 1)-verteilt
Ws(X ≤ t) = Φ(t)
Ws(a < Z < b) = Ws(Z < b) − Ws(Z ≤ a) = Φ(b) − Φ(a)
X N (µ, σ 2)-verteilt
Ws(X ≤ t) = Φµ,σ2 (t)
a−µ
X −µ
b−µ
Ws(a < X < b) = Ws
<
<
σ
σ
σ
b−µ
a−µ
= Φ
−Φ
σ
σ
X N (µ, σ 2)-verteilt
X −µ
Z=
σ
Z standardnormalverteilt
standardnormalverteilt
X = σZ + µ
N (µ, σ 2)-verteilt
Statistik II für Wirtschaftswissenschaftler
Normalverteilte Zufallsgrößen eignen sich als Modell für viele
reellwertige Messungen.
Bedingungen (an Histogramm grob nachprüfbar)
1) Wsdichte hat ein eindeutiges und deutliches Maximum bei
µ
2) Die Zufallsgröße streut symmetrisch um µ
Beispiele:
i) Körpergröße eines 20jährigen Mannes hängt ab von: genetischen Faktoren, Ernährung in verschiedenen Lebensaltern, Umwelteinflüssen, Krankheiten, ...
Deren Beiträge εj addieren sich zur Endgröße.
Folie 2.16
Statistik II für Wirtschaftswissenschaftler
ii) Störungen (Rauschen) bei Übertragung eines Signals in einem
Leiter durch die thermische Bewegung der freien Elektronen
Allgemein: Messfehler
iii) EEG-Messung zu festem Zeitpunkt
iv) Messungen von Länge, Volumen, Gewicht (Techno- oder
Biometrie) oft näherungsweise normal verteilt. Voraussetzung:
Die Objekte oder Individuen stammen aus homogener Grundgesamtheit.
Auch per se positive Messungen können als normalverteilte Zufallsgrößen modelliert werden, wenn für ein c > 0
Ws(X ≤ c) ≈ 0
Folie 2.17
Statistik II für Wirtschaftswissenschaftler
Folie 2.18
Statistik II für Wirtschaftswissenschaftler
Folie 2.19
Statistik II für Wirtschaftswissenschaftler
Folie 2.20
Statistik II für Wirtschaftswissenschaftler
Folie 2.21
Statistik II für Wirtschaftswissenschaftler
Folie 2.22
2.7 Verteilungsfunktion und Quantile
X reellwertige Zufallsgröße mit Wsdichte p
F (t) =
Z t
−∞
p(x)dx = Ws(X ≤ t)
(Stammfunktion von p) heißt Verteilungsfunktion
Ws(a < X < b) =
(−)
(−)
Z b
a
p(x)dx = F (b) − F (a)
Ws(X > a) = 1 − F (a)
(−)
Allgemeine Definition, auch für diskrete Verteilungen:
F (t) = Ws(X ≤ t)
Statistik II für Wirtschaftswissenschaftler
Folie 2.23
Statistik II für Wirtschaftswissenschaftler
Folie 2.23a
X mit Werten in X = [0, ∞) heißt exponentiell verteilt mit
Parameter λ > 0 oder Exp(λ)-verteilt, falls
Dichte p(x) = λe−λx, x ≥ 0 und p(x) = 0, x < 0.
Verteilungsfunktion:
F λ(t) = Ws(X ≤ t) =
Z t
0
λe−λxdx = 1 − e−λt
Ws(X > t) = 1 − Ws(X ≤ t) = e−λt
Ws(a ≤ X ≤ b) = e−λa − e−λb
Anwendungen:
•
Lebensdauer von elektronischem Bauteil
•
Wartezeit auf Ereignis (Schaden bei Sachversicherung,
Ankunft von Kunden in Bedienungssystem, ...)
Statistik II für Wirtschaftswissenschaftler
1) Gegeben t. Mit welcher Wahrscheinlichkeit α überschreitet
X den Wert t nicht?
Antwort: F (t) = Ws(X ≤ t) = α
2) Gegeben α. Welche Schranke t wird von X mit Wskeit α nicht
überschritten?
Antwort: t = qα = α-Quantil von X bzw. von F
Zu 0 < α < 1 heißt q α ein α-Quantil der Zufallsgröße X
oder der Verteilungsfunktion F , wenn
Ws(X ≤ qα) = F (qα) = α
Folie 2.24
Statistik II für Wirtschaftswissenschaftler
Spezialfälle:
a) 1
2 -Quantil q0,5 = Median
1 - bzw. 3 -Quantil q
b) 4
0,25 bzw. q0,75 = unteres bzw. oberes
4
Viertelquantil (oder Quartil)
Wenn X eine Wsdichte besitzt, so gibt es zu jedem 0 < α <
1 ein α-Quantil. Gibt es mehrere x mit F (x) = α, wähle (als
Konvention) das kleinste:
qα = min{x; F (x) = α}
Folie 2.25
Statistik II für Wirtschaftswissenschaftler
Folie 2.26
Quantile der Standard-Normalverteilung N (0, 1) (Tabelle 3a)
Niveau α
0,5000
0,7500
0,8000
0,8500
0,9000
0,9500
0,9750
0,9900
0,9950
0,9990
0,9995
Quantil qα
0,000
0,675
0,842
1,036
1,282
1,645
1,960
2,326
2,576
3,090
3,291
Für Niveaus α < 0, 5:
Quantile von N (µ, σ 2) :
qα = −q1−α
qα(µ, σ 2) = σ · qα + µ
Statistik II für Wirtschaftswissenschaftler
Anwendung: Risikomessung für Finanzanlagen (Basel I)
Vt Wert eines Aktienportfolios am Tag t
Rt = ln VVt ≈
t−1
Vt −Vt−1
Vt−1
Rendite von Tag t − 1 auf t
Modell: R1, R2, . . . , unabhängige N (µ, σ 2)-verteilte Zufallsgrößen
(auch Grundlage des Black-Scholes-Ansatzes zur Bewertung von
Optionen und anderen Derivaten)
Value-at-risk (VaR) = Schranke für den Verlust aus dem
Portfolio von einem Tag zum anderen (oder innerhalb von 5
Tagen), die nur mit geringer Wahrscheinlichkeit überschritten
wird (0,05 oder 0,01).
Folie 2.27
Statistik II für Wirtschaftswissenschaftler
t = heute
Vt bekannt
Risikoabschätzung für Wertentwicklung bis t + 1 = morgen (prozentual bezogen auf Kapital von heute)
0, 05 = Ws(Rt+1 ≤ VaR )
⇒ VaR = q0,05 = 0, 05-Quantil von N (µ, σ 2)
Vt+1 − Vt
≈ Rt+1 =⇒ Vt+1 ≤ Vt(1 + VaR )
Vt
passiert nur mit geringer Wskeit 0,05
µ =?, σ 2 =?
Folie 2.28
Statistik II für Wirtschaftswissenschaftler
Folie 2.29
Beispiel: Körpergröße von Männern ist N (µ, σ 2)-verteilt mit µ =
175 cm, σ = 10 cm.
Welche Körpergrößen müssen bei neuer Hosenkollektion berücksichtigt
werden, wenn nur die jeweils 5% kleinsten bzw. größten Männer
nichts Passendes finden sollen?
Gesucht: k, g mit Ws(X < k) = 0, 05 und Ws(X > g) = 0, 05
Ws(X < k) = Ws(X ≤ k) = F (k)
k = q0,05
Ws(X > g) = 1 − Ws(X ≤ g) = 1 − F (g) = 0, 05
F (g) = 0, 95
g = q0,95
Statistik II für Wirtschaftswissenschaftler
Folie 2.30
Ws(X < k) = 0, 05 und Ws(X > g) = 0, 95
N (0,1)
g = q0,95 = µ + σ q0,95
= [175 + 10 · 1, 645] cm
= 191, 45 cm
N (0,1)
k = q0,05 = µ + σq0,05
N (0,1)
= µ − σq0,95
= [175 − 10 · 1, 645] cm
= 158, 55 cm
Hosengröße: Beinlänge und Bauchumfang
abhängige Beobachtungen. Was ist das im stochastischen
Modell?
Statistik II für Wirtschaftswissenschaftler
Folie 2.31
2.10 Unabhängigkeit (und Korrelation)
Unabhängigkeit von Zufallsgrößen ≡ Multiplikationsregel für
Wahrscheinlichkeiten
Zufallsgrößen X, Y mit Werten in X sind unabhängig, wenn für
alle A, B ⊆ X
Ws X ∈ A und Y ∈ B = Ws X ∈ A · Ws Y ∈ B
X1, . . . , XN unabhängig, wenn für alle A1, . . . , AN ⊆ X
Ws X1 ∈ A1, . . . , XN ∈ AN = Ws X1 ∈ A1 · . . . · Ws XN ∈ AN
Statistik II für Wirtschaftswissenschaftler
Folie 2.32
Bei Abhängigkeit gilt das nicht, zum Beispiel:
X standardnormalverteilt, Y = X 2
0≤Y ≤1
⇐⇒
−1 ≤ X ≤ 1
w = Ws(0 ≤ Y ≤ 1) = Ws(−1 ≤ X ≤ 1) = Φ(1) − Φ(−1)
= Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 · 0, 8413 − 1 = 0, 6826 < 1
und damit
w = Ws(0 ≤ Y ≤ 1) = Ws 0 ≤ Y ≤ 1 und − 1 ≤ X ≤ 1
> w2 = Ws(0 ≤ Y ≤ 1) · Ws(−1 ≤ X ≤ 1)
Statistik II für Wirtschaftswissenschaftler
Zufallsgrößen X1, . . . , XN mit Werten in X heißen unabhängig,
identisch verteilt (u.i.v.), wenn sie unabhängig sind und wenn
sie alle dieselbe Verteilung haben, d. h. für alle j = 1, . . . , N
Ws(Xj ∈ A) = Ws(X1 ∈ A) für alle A ⊆ X
Modellbildung: u.i.v. Zufallsgrößen eignen sich als Modell für
Messwerte, die auf (im intuitiven Sinn) unabhängige Weise
durch Wiederholung des jeweils selben Experiments gewonnen
worden sind.
Folie 2.33

Zugehörige Unterlagen

inhaltsverzeichnis

Experte für Data-driven Marketing

Folien 2

Zugehörige Unterlagen

Produkte

Unterstützung

Folien 2

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können