)) (ln(X Em = Var(ln(X)) s )( e XE = )1 ( )( − = e e XVar )( ) ( )(

Werbung
Momente der Logarithmischen Normalverteilung
Die Paramter
Di
P
t m und
d s sind
i d di
die M
Momente
t d
der
Logarithmierten Verteilung, also
m = E (ln(X ))
und
s 2 = Var(ln(X))
Es gilt jedoch:
E( X ) = e
s2
m+
2
und Var ( X ) = e
2 m+ s 2
(e − 1)
s2
16
Beispiel zur Logarithmischen Normalverteilung
X sei logarithmisch normalverteilt mit
m = E (ln( X )) = 2,3
Dann ergibt sich:
Geometrisches Mittel von
und s 2 = Var(ln(X)) = 0,8
X
= e 2,3 = exp(
p( 2,3) = 9,974 = Median ( X )
[Warum?]
0,8 ⎞
⎛
E ( X ) = exp⎜ 2,3 +
⎟ = exp(2,7) = 14,880
2 ⎠
⎝
17
Beispiel zur Logarithmischen Normalverteilung
P( X > 11) = P(ln( X ) > ln(11))
⎛ ln( X ) − m ln(11) − 2,3 ⎞
⎟
>
= P⎜⎜
⎟
s
0
,
8
⎠
⎝
⎛ ln(11) − 2,3 ⎞
⎟ = 1 − Φ(0,109)
= 1 − Φ⎜⎜
⎟
0
,
8
⎝
⎠
= 1 − 0,5438 = 0,4562
Unteres Quartil von X:
(
)
Q1 = exp 2,3 − 0,8 ⋅ 0,675 = exp (1,696 ) = 5,454
– 0,675 ist das untere Quartil der Standardnormalverteilung
18
Beispiel zur Logarithmischen Normalverteilung
Oberes Quartil von X:
(
)
Q3 = exp 2,3 + 0,8 ⋅ 0,675 = exp (2,904 ) = 18,242
Interquartilsabstand:
Q3 − Q1 = 12,788
Q3 − Median = 18,242 − 9,974 = 8,268
Median− Q1 = 9,974 − 5,454 = 4,520
Hieraus ist erkennbar, dass X eine rechtsschiefe Verteilung
aufweist.
19
Zusatzfolie zur Lognormalverteilung
Q1 = exp[Q1 (ln(X)]
ln(x) = Y ∼ N (m, s2 )
Q1 (Y ) = y[0,25]
y[0,25] −m
S
= z[0,25] = Q1 (Z)→N (0, 1)
y[0,25] = m + s z[0,25] = 2, 3 −
| {z }
√
0, 8 ∗ 0, 675
−0,675
Aufgrund der Symmetrie der Normalverteilung gilt z[0, 25] = −z[0, 75]
FSt (0, 67) = 0, 7486 &
FSt (z[0,75] ) = 0, 75
FSt (0, 68) = 0, 7514 %
z[0,75] = 0, 67 ·
0,0017
0,0031
+ 0, 68 ·
0,0014
0,0031
≈ 0, 675
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2013/14
Prof. Fitzenberger, Ph.D.
Lineare Interpolation einer Funktion
- Kenne f (a) = c und f (b) = d
- Gesucht ist Funktionswert f (e) an der Stelle e, für die a < e < b gilt.
Approximiere f (e) durch Wert z auf der Gerade, die die Punkte (a,c) und (b,d) verbindet.
Dreisatz (Strahlensatz):
d−c
z−c
=
=
b Steigung des Steigungsdreiecks
e−a
b−a
Daraus ergibt sich für z:
(1)
z =c+
d−c
(e − a)
b−a
oder
(2)
z=
b−e
e−a
c+
d
b−a
b−a
Zwei Interpretationen
(1) : z entspricht c plus Steigung der Gerade mal Länge der Strecke (e-a)
(2) : z entspricht gewichtetes arithmetisches Mittel zwischen c und d. Die Gewichte sind die Streckenanteile (b-e) bzw. (e-a) an der Gesamtstrecke (b-a).
1
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2012/13
Prof. Fitzenberger, Ph.D.
Stetigkeitskorrektur
Stetige Normalverteilungen schneidet Treppenstufen von FBi ungefähr in der Mitte.
Stetigkeitskorrektur immer angebracht, wenn eine im Prinzip diskrete Variable durch eine
stetige approximiert wird.
Schrittweite
2
”Hälfte der Schrittweite der diskreten Variablen.”
Sk =
Addition vor Standardisierung:
sn + Sk − nµ
√
P (Sn ≤ sn ) ≈ FSt
σ n
n
X
Sn =
Xi
i=1
P (X̄n ≤ x̄n ) ≈ FSt
x̄n +
Sk
n
√σ
n
−µ
!
→ Korrektur gegenüber Lehrbuch!
Größe von n: n ≥ 30 als Faustregel.
T^{t
/
1,
ru
oLctzo4
?ux;
lL
trst
y60
wro(*//O,!7f
/ = 7,?2
\
z
=
(O,g7r)
416v
T1?
' 60
4,€?7
4-&.^
Tg:
fur?V)-/_4/6!
I
! fa
(qrv,/
%o
\'8c
:i*?O
'qY
a€
cQ
0 ;* s2a4iob(
.4
G
=
+
t
(O
t-o
76ot
\
c- 41 63
.//
-Q6tt
+ c,rFf: -r;!t
6,o \'rTFoi
?'6# i =.-.
t2or- i7
\ €o
I
4,Vtt o.f ,(:,op +)
+qf '(-opfj
:.ir6ly
ffit'h{-,^Ir Lr;L WtnO
sin,l et.(e
pb*) C(e 1"(*70("d)or.q ,}{
?*{oil,, 4n'^ ,l"a Qb;rL
drd,4
rd,trahoo-*
3 Die Chi-Quadrat-Verteilung
3.
Chi Quadrat Verteilung – Forts.
Forts
Eigenschaften:
( ) = E (Z ) = ... = E (Z ) = Var (Z ) + [E (Z )]
EZ
2
1
2
2
2
2
n
1
1
= 1+ 0 = 1
K
Kurtosis
i der
d Standardnormalverteilung
S d d
l
il
( )
Var (Z ) = E (Z ) − [E (Z )] = 3 − 1 = 2
E (χ ) = n ⋅ E (Z ) = n
Var (χ ) = n ⋅ Var (Z ) = 2n
E Z14 = 3
2
1
2
n
4
1
2
1
2
2
2
1
2
n
2
1
© Schira: Statistische Methoden der VWL und BWL (Pearson Studium 2009)
26
Motivation für Chi-Quadrat-Verteilung und t-Verteilung
Die standardisierte Stichprobenvarianz ist χ -verteilt.
2
nS
2
σ2
(
n
Xi − X
= ∑
σ2
n i =1
n
)
2
⎛ Xi − X
= ∑ ⎜⎜
σ
i =1 ⎝
n
2
⎞
⎟ ≅ χ n2−1verteilt
⎟
⎠
Der standardisierte Mittelwert ist t-verteilt, wenn die geschätzte
Standardabweichung für die Standardisierung verwendet wird.
wird
Tn−1 =
(X − μ )
σ2
2
n S
n −1 σ 2
n =
X −μ
n 2
S
n −1
wobei
^2
σ
n 2
=
S
n −1
Hinweis: Diese Verteilungsergebnisse sind nur dann exakt, wenn X i normalverteilt ist
ist.
© Schira: Statistische Methoden der VWL und BWL (Pearson Studium 2009)
30
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2013/14
Prof. Fitzenberger, Ph.D.
Praxisbeispiel
Aktuelles Fallbeispiel: Leukämie-Neuerkrankungen in der Nähe des Atommüllagers Asse
Im November 2010 teilte das Niedersächsische Ministerium für Soziales, Frauen, Familie,
Gesundheit und Integration mit: ”Im Untersuchungszeitraum 2002 bis 2009 wurden in der
Samtgemeinde Asse mehr als doppelt so viele Leukämie-Neuerkrankungen festgestellt wie
erwartet. Betrachtet man gemessen an der Bevölkerung die Leukämieneuerkrankungen
in der Samtgemeinde Asse würde man einen Fall im Jahr erwarten. Betrachtet man den
Zeitraum 2002 - 2009 (8 Jahre, 8 erwartete Leukämieneuerkrankungen), sind tatsächlich
18 Menschen erkrankt... .”
Wir führen einen statistischen Hypothesentest durch, um zu überprüfen, ob eine signifikante Erhöhung der Leukämie-Neuerkrankungen vorliegt. Wir operationalisieren dies wie
folgt.
X: Anzahl Leukämie-Neuerkrankungen in Asse
Wenn p die Wahrscheinlichkeit einer Leukämie-Neuerkrankung für eine Person ist und n
die Größe der Bevölkerung von Asse ist (wir unterstellen, dass die Bevölkerung zeitkonstant ist), dann folgt X einer Binomialverteilung:
X ∼ Bi(n, p)
Da n groß und p klein ist, lässt sich die Verteilung sehr gut durch eine Poisson-Verteilung
mit Parameter λ = np approximieren, d.h. X ∼ P oisson(λ) und E(X) = λ.
Unter der Nullhypothese entspricht der Erwartungswert von X dem Wert 8.
H0 : E(X) = λ = 8
H1 : E(X) = λ > 8
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2013/14
Prof. Fitzenberger, Ph.D.
Das zugehörige TSP-Programm berechnet die Verteilungsfunktion einer Poisson(8)-verteilten
Zufallsvariable, da diese nicht im Lehrbuch von Schira tabelliert ist.
Das Stichprobenergebnis ist X = 18. Der Wert der Verteilungsfunktion beträgt an dieser
Stelle F (18) = 99, 935%. Der Wert der Überschreitungswahrscheinlichkeit (p-Wert) beträgt jedoch 1 − F (17) = 1 − 0, 9984 = 0, 16%, da 18 schon im Ablehnungsbereich bei
xoben = 17 liegt.
Der kritische Wert xoben , oberhalb dessen H0 verworfen wird, bei einem Signifikanzniveau
von α = 5% beträgt xoben = 13, da Pr(X > xoben ) = 1 − F (13) = 1 − 0, 9658 = 0, 0342 ≤
5% (siehe Schira, Binomialtest, Abschnitt 15.3).
Da 18 Fälle mehr als 14 Fälle sind (und der p-Wert kleiner als α ist) kann die Nullhypothese auf einem Signifikanzniveau von α = 5% verworfen werden. Dies gilt bis zu einem
Signifikanzniveau von 0, 16%. Wenn man bspw. ein niedrigeres Signifikanzniveau in Höhe
von 1 Promille zu Grunde legt, dann würde die Nullhypothese nicht abgelehnt.
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2013/14
Prof. Fitzenberger, Ph.D.
TSP-Programm und Output:
PROGRAM
COMMAND ***************************************************************
1 ?-----------------------------------------1 ? Programm zur Berechnung der Verteilungsfunktion
1 ? einer Poisson-Verteilung
1 ?-----------------------------------------1
1 options crt, double;
2
2 supres smpl;
3
3 set lam = 8; ? Parameter lambda der Poisson-Verteilung, Erw.wert
und Varianz
4
4 freq n;
5
5 set nmax = 20; ? maximale Anzahl x für die f(x), F(x) berechnet
werden
6
6 set np1 = nmax+1;
7 smpl 1 np1;
8
8 trend x; x = x-1;
10
10 ?print x;
10
10 fx = lam**x * exp(-lam) / fact(x);
11
11 cdf = fx;
12
12 smpl 2 np1;
13
13 cdf = cdf(-1) + fx;
14
14 smpl 1 np1;
15
15 title ’Poisson Distribution for ’;
16 print lam;
17
17 print x fx cdf;
18
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2013/14
Prof. Fitzenberger, Ph.D.
EXECUTION
*******************************************************************************
Poisson Distribution for
========================
LAM =
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
8.00000
X
0.00000
1.00000
2.00000
3.00000
4.00000
5.00000
6.00000
7.00000
8.00000
9.00000
10.00000
11.00000
12.00000
13.00000
14.00000
15.00000
16.00000
17.00000
18.00000
19.00000
20.00000
FX
0.00033546
0.0026837
0.010735
0.028626
0.057252
0.091604
0.12214
0.13959
0.13959
0.12408
0.099262
0.072190
0.048127
0.029616
0.016924
0.0090260
0.0045130
0.0021238
0.00094389
0.00039743
0.00015897
CDF
0.00033546
0.0030192
0.013754
0.042380
0.099632
0.19124
0.31337
0.45296
0.59255
0.71662
0.81589
0.88808
0.93620
0.96582
0.98274
0.99177
0.99628
0.99841
0.99935
0.99975
0.99991
*******************************************************************************
Abteilung Empirische
Wirtschaftsforschung
Ökonometrie WS 2013/14
Prof. Fitzenberger, Ph.D.
Berechnung zum Praxisbeispiel Schira Kapitel 12:
Berechnung der ”Wahrscheinlichkeit, obwohl p = 0, 5” in der vierten Spalte
von Tabelle 12.3 in Schira.
Dies ist die Wahrscheinlichkeit P (|Z| ≥ z800 ) für standardnormalverteiltes
Z, d.h. dass h800 mindestens z800 Standardabweichungen von p = 0, 5 entfernt liegt.
P (|Z| ≥ |z800 |) = P (Z ≤ −|z800 |) + P (Z ≥ |z800 |)
= 2 · P (Z ≥ |z800 |)
= 2 · (1 − FSt (|z800 |)
Im Beispiel: z800 = 0, 4243
P (|Z| ≥ |z800 |) = 2 · (1 − FSt (0, 4243)
= 2 · (1 − 0, 43 · 0, 6664 − 0, 57 · 0, 6628)
= 0, 6713
Berechnung durch Interpolation der Tabellenwerte. Schira weist im Lehrbuch
den exakten (gerundeten) Wert 0,6714 aus.
Herunterladen