Momente der Logarithmischen Normalverteilung Die Paramter Di P t m und d s sind i d di die M Momente t d der Logarithmierten Verteilung, also m = E (ln(X )) und s 2 = Var(ln(X)) Es gilt jedoch: E( X ) = e s2 m+ 2 und Var ( X ) = e 2 m+ s 2 (e − 1) s2 16 Beispiel zur Logarithmischen Normalverteilung X sei logarithmisch normalverteilt mit m = E (ln( X )) = 2,3 Dann ergibt sich: Geometrisches Mittel von und s 2 = Var(ln(X)) = 0,8 X = e 2,3 = exp( p( 2,3) = 9,974 = Median ( X ) [Warum?] 0,8 ⎞ ⎛ E ( X ) = exp⎜ 2,3 + ⎟ = exp(2,7) = 14,880 2 ⎠ ⎝ 17 Beispiel zur Logarithmischen Normalverteilung P( X > 11) = P(ln( X ) > ln(11)) ⎛ ln( X ) − m ln(11) − 2,3 ⎞ ⎟ > = P⎜⎜ ⎟ s 0 , 8 ⎠ ⎝ ⎛ ln(11) − 2,3 ⎞ ⎟ = 1 − Φ(0,109) = 1 − Φ⎜⎜ ⎟ 0 , 8 ⎝ ⎠ = 1 − 0,5438 = 0,4562 Unteres Quartil von X: ( ) Q1 = exp 2,3 − 0,8 ⋅ 0,675 = exp (1,696 ) = 5,454 – 0,675 ist das untere Quartil der Standardnormalverteilung 18 Beispiel zur Logarithmischen Normalverteilung Oberes Quartil von X: ( ) Q3 = exp 2,3 + 0,8 ⋅ 0,675 = exp (2,904 ) = 18,242 Interquartilsabstand: Q3 − Q1 = 12,788 Q3 − Median = 18,242 − 9,974 = 8,268 Median− Q1 = 9,974 − 5,454 = 4,520 Hieraus ist erkennbar, dass X eine rechtsschiefe Verteilung aufweist. 19 Zusatzfolie zur Lognormalverteilung Q1 = exp[Q1 (ln(X)] ln(x) = Y ∼ N (m, s2 ) Q1 (Y ) = y[0,25] y[0,25] −m S = z[0,25] = Q1 (Z)→N (0, 1) y[0,25] = m + s z[0,25] = 2, 3 − | {z } √ 0, 8 ∗ 0, 675 −0,675 Aufgrund der Symmetrie der Normalverteilung gilt z[0, 25] = −z[0, 75] FSt (0, 67) = 0, 7486 & FSt (z[0,75] ) = 0, 75 FSt (0, 68) = 0, 7514 % z[0,75] = 0, 67 · 0,0017 0,0031 + 0, 68 · 0,0014 0,0031 ≈ 0, 675 Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2013/14 Prof. Fitzenberger, Ph.D. Lineare Interpolation einer Funktion - Kenne f (a) = c und f (b) = d - Gesucht ist Funktionswert f (e) an der Stelle e, für die a < e < b gilt. Approximiere f (e) durch Wert z auf der Gerade, die die Punkte (a,c) und (b,d) verbindet. Dreisatz (Strahlensatz): d−c z−c = = b Steigung des Steigungsdreiecks e−a b−a Daraus ergibt sich für z: (1) z =c+ d−c (e − a) b−a oder (2) z= b−e e−a c+ d b−a b−a Zwei Interpretationen (1) : z entspricht c plus Steigung der Gerade mal Länge der Strecke (e-a) (2) : z entspricht gewichtetes arithmetisches Mittel zwischen c und d. Die Gewichte sind die Streckenanteile (b-e) bzw. (e-a) an der Gesamtstrecke (b-a). 1 Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2012/13 Prof. Fitzenberger, Ph.D. Stetigkeitskorrektur Stetige Normalverteilungen schneidet Treppenstufen von FBi ungefähr in der Mitte. Stetigkeitskorrektur immer angebracht, wenn eine im Prinzip diskrete Variable durch eine stetige approximiert wird. Schrittweite 2 ”Hälfte der Schrittweite der diskreten Variablen.” Sk = Addition vor Standardisierung: sn + Sk − nµ √ P (Sn ≤ sn ) ≈ FSt σ n n X Sn = Xi i=1 P (X̄n ≤ x̄n ) ≈ FSt x̄n + Sk n √σ n −µ ! → Korrektur gegenüber Lehrbuch! Größe von n: n ≥ 30 als Faustregel. T^{t / 1, ru oLctzo4 ?ux; lL trst y60 wro(*//O,!7f / = 7,?2 \ z = (O,g7r) 416v T1? ' 60 4,€?7 4-&.^ Tg: fur?V)-/_4/6! I ! fa (qrv,/ %o \'8c :i*?O 'qY a€ cQ 0 ;* s2a4iob( .4 G = + t (O t-o 76ot \ c- 41 63 .// -Q6tt + c,rFf: -r;!t 6,o \'rTFoi ?'6# i =.-. t2or- i7 \ €o I 4,Vtt o.f ,(:,op +) +qf '(-opfj :.ir6ly ffit'h{-,^Ir Lr;L WtnO sin,l et.(e pb*) C(e 1"(*70("d)or.q ,}{ ?*{oil,, 4n'^ ,l"a Qb;rL drd,4 rd,trahoo-* 3 Die Chi-Quadrat-Verteilung 3. Chi Quadrat Verteilung – Forts. Forts Eigenschaften: ( ) = E (Z ) = ... = E (Z ) = Var (Z ) + [E (Z )] EZ 2 1 2 2 2 2 n 1 1 = 1+ 0 = 1 K Kurtosis i der d Standardnormalverteilung S d d l il ( ) Var (Z ) = E (Z ) − [E (Z )] = 3 − 1 = 2 E (χ ) = n ⋅ E (Z ) = n Var (χ ) = n ⋅ Var (Z ) = 2n E Z14 = 3 2 1 2 n 4 1 2 1 2 2 2 1 2 n 2 1 © Schira: Statistische Methoden der VWL und BWL (Pearson Studium 2009) 26 Motivation für Chi-Quadrat-Verteilung und t-Verteilung Die standardisierte Stichprobenvarianz ist χ -verteilt. 2 nS 2 σ2 ( n Xi − X = ∑ σ2 n i =1 n ) 2 ⎛ Xi − X = ∑ ⎜⎜ σ i =1 ⎝ n 2 ⎞ ⎟ ≅ χ n2−1verteilt ⎟ ⎠ Der standardisierte Mittelwert ist t-verteilt, wenn die geschätzte Standardabweichung für die Standardisierung verwendet wird. wird Tn−1 = (X − μ ) σ2 2 n S n −1 σ 2 n = X −μ n 2 S n −1 wobei ^2 σ n 2 = S n −1 Hinweis: Diese Verteilungsergebnisse sind nur dann exakt, wenn X i normalverteilt ist ist. © Schira: Statistische Methoden der VWL und BWL (Pearson Studium 2009) 30 Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2013/14 Prof. Fitzenberger, Ph.D. Praxisbeispiel Aktuelles Fallbeispiel: Leukämie-Neuerkrankungen in der Nähe des Atommüllagers Asse Im November 2010 teilte das Niedersächsische Ministerium für Soziales, Frauen, Familie, Gesundheit und Integration mit: ”Im Untersuchungszeitraum 2002 bis 2009 wurden in der Samtgemeinde Asse mehr als doppelt so viele Leukämie-Neuerkrankungen festgestellt wie erwartet. Betrachtet man gemessen an der Bevölkerung die Leukämieneuerkrankungen in der Samtgemeinde Asse würde man einen Fall im Jahr erwarten. Betrachtet man den Zeitraum 2002 - 2009 (8 Jahre, 8 erwartete Leukämieneuerkrankungen), sind tatsächlich 18 Menschen erkrankt... .” Wir führen einen statistischen Hypothesentest durch, um zu überprüfen, ob eine signifikante Erhöhung der Leukämie-Neuerkrankungen vorliegt. Wir operationalisieren dies wie folgt. X: Anzahl Leukämie-Neuerkrankungen in Asse Wenn p die Wahrscheinlichkeit einer Leukämie-Neuerkrankung für eine Person ist und n die Größe der Bevölkerung von Asse ist (wir unterstellen, dass die Bevölkerung zeitkonstant ist), dann folgt X einer Binomialverteilung: X ∼ Bi(n, p) Da n groß und p klein ist, lässt sich die Verteilung sehr gut durch eine Poisson-Verteilung mit Parameter λ = np approximieren, d.h. X ∼ P oisson(λ) und E(X) = λ. Unter der Nullhypothese entspricht der Erwartungswert von X dem Wert 8. H0 : E(X) = λ = 8 H1 : E(X) = λ > 8 Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2013/14 Prof. Fitzenberger, Ph.D. Das zugehörige TSP-Programm berechnet die Verteilungsfunktion einer Poisson(8)-verteilten Zufallsvariable, da diese nicht im Lehrbuch von Schira tabelliert ist. Das Stichprobenergebnis ist X = 18. Der Wert der Verteilungsfunktion beträgt an dieser Stelle F (18) = 99, 935%. Der Wert der Überschreitungswahrscheinlichkeit (p-Wert) beträgt jedoch 1 − F (17) = 1 − 0, 9984 = 0, 16%, da 18 schon im Ablehnungsbereich bei xoben = 17 liegt. Der kritische Wert xoben , oberhalb dessen H0 verworfen wird, bei einem Signifikanzniveau von α = 5% beträgt xoben = 13, da Pr(X > xoben ) = 1 − F (13) = 1 − 0, 9658 = 0, 0342 ≤ 5% (siehe Schira, Binomialtest, Abschnitt 15.3). Da 18 Fälle mehr als 14 Fälle sind (und der p-Wert kleiner als α ist) kann die Nullhypothese auf einem Signifikanzniveau von α = 5% verworfen werden. Dies gilt bis zu einem Signifikanzniveau von 0, 16%. Wenn man bspw. ein niedrigeres Signifikanzniveau in Höhe von 1 Promille zu Grunde legt, dann würde die Nullhypothese nicht abgelehnt. Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2013/14 Prof. Fitzenberger, Ph.D. TSP-Programm und Output: PROGRAM COMMAND *************************************************************** 1 ?-----------------------------------------1 ? Programm zur Berechnung der Verteilungsfunktion 1 ? einer Poisson-Verteilung 1 ?-----------------------------------------1 1 options crt, double; 2 2 supres smpl; 3 3 set lam = 8; ? Parameter lambda der Poisson-Verteilung, Erw.wert und Varianz 4 4 freq n; 5 5 set nmax = 20; ? maximale Anzahl x für die f(x), F(x) berechnet werden 6 6 set np1 = nmax+1; 7 smpl 1 np1; 8 8 trend x; x = x-1; 10 10 ?print x; 10 10 fx = lam**x * exp(-lam) / fact(x); 11 11 cdf = fx; 12 12 smpl 2 np1; 13 13 cdf = cdf(-1) + fx; 14 14 smpl 1 np1; 15 15 title ’Poisson Distribution for ’; 16 print lam; 17 17 print x fx cdf; 18 Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2013/14 Prof. Fitzenberger, Ph.D. EXECUTION ******************************************************************************* Poisson Distribution for ======================== LAM = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 8.00000 X 0.00000 1.00000 2.00000 3.00000 4.00000 5.00000 6.00000 7.00000 8.00000 9.00000 10.00000 11.00000 12.00000 13.00000 14.00000 15.00000 16.00000 17.00000 18.00000 19.00000 20.00000 FX 0.00033546 0.0026837 0.010735 0.028626 0.057252 0.091604 0.12214 0.13959 0.13959 0.12408 0.099262 0.072190 0.048127 0.029616 0.016924 0.0090260 0.0045130 0.0021238 0.00094389 0.00039743 0.00015897 CDF 0.00033546 0.0030192 0.013754 0.042380 0.099632 0.19124 0.31337 0.45296 0.59255 0.71662 0.81589 0.88808 0.93620 0.96582 0.98274 0.99177 0.99628 0.99841 0.99935 0.99975 0.99991 ******************************************************************************* Abteilung Empirische Wirtschaftsforschung Ökonometrie WS 2013/14 Prof. Fitzenberger, Ph.D. Berechnung zum Praxisbeispiel Schira Kapitel 12: Berechnung der ”Wahrscheinlichkeit, obwohl p = 0, 5” in der vierten Spalte von Tabelle 12.3 in Schira. Dies ist die Wahrscheinlichkeit P (|Z| ≥ z800 ) für standardnormalverteiltes Z, d.h. dass h800 mindestens z800 Standardabweichungen von p = 0, 5 entfernt liegt. P (|Z| ≥ |z800 |) = P (Z ≤ −|z800 |) + P (Z ≥ |z800 |) = 2 · P (Z ≥ |z800 |) = 2 · (1 − FSt (|z800 |) Im Beispiel: z800 = 0, 4243 P (|Z| ≥ |z800 |) = 2 · (1 − FSt (0, 4243) = 2 · (1 − 0, 43 · 0, 6664 − 0, 57 · 0, 6628) = 0, 6713 Berechnung durch Interpolation der Tabellenwerte. Schira weist im Lehrbuch den exakten (gerundeten) Wert 0,6714 aus.