Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.1 2. Wahrscheinlichkeitstheoretische Grundlagen Stochastisches Modell = mathematisches Modell für ein reales Phänomen unter Verwendung des fiktiven Begriffs Zufall Wann? a) bei der Datenerhebung wird explizit ein zufälliger Aspekt eingebaut (Meinungsumfragen) b) System an sich deterministisch, aber zu komplex für deterministische Modellierung Beispiel: Würfelwurf als mechanisches Experiment zu kompliziert Stochastisches Modell: Würfelwurf liefert Zufallsgröße X mit Werten in {1, 2, 3, 4, 5, 6}, wobei jede Zahl 1, . . . , 6 dieselbe Wahr1 hat, als Wert von X aufzutreten. scheinlichkeit 6 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.2 2.1 Zufallsgrößen, Ereignisse, Wahrscheinlichkeiten ”Messung” eines numerischen oder qualitativen Merkmals Ergebnisse liegen in Werteraum X Wiederholte ”Messungen” unterschiedliche Ergebnisse Modellierung: c Zufallsmechanismus Messvorgang = Einmalige Betätigung liefert Zufallsgröße X mit Werten in X Wiederholte Betätigung liefert verschiedene Realisationen der Zufallsgröße X X1, X2, . . . , XN Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.3 Beispiele: i) Gewicht eines zufällig ausgewählten Passanten in kg Werteraum: X = (0, ∞) ⊆ R ii) Anzahl der defekten RAM-Bausteine in einer Lieferung von 1000 Stück Werteraum: X = {0, . . . , 1000} ⊆ R iii) Windgeschwindigkeit in allen 3 Richtungen des Raums Werteraum: X = R3 iv) Alter und Blutdruck eines Menschen Werteraum: X = {0, 1, 2, . . .} × (0, ∞) Messung liefert quantitative Daten, X ⊆ R oder Rd quantitative Zufallsgröße Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.4 v) Familienstand X = {ledig, verheiratet, verwitwet, geschieden, keine Angabe} vi) Meinungsäußerung auf Frage nach Semesterticket X = {dafür, dagegen, egal, keine Angabe} vii) Bewertung eines Rasenmähers nach Preis und Handhabung X = { billig, mittel, teuer} × {leicht, schwer} viii) Zeugnisnote im Schulfach X = {1, 2, 3, 4, 5, 6} ix) Ergebnis eines Würfelwurfs X = {1, 2, 3, 4, 5, 6} Messung nicht oder nur willkürlich als Zahl beschreibbar qualitative Zufallsgröße Prof. Dr. J. Franke Beobachtung mögliche Werte N Beobachtungen Statistik II für Wirtschaftswissenschaftler 2.4a Zufallsgröße X Werteraum X Stichprobe X1, . . . , XN vom Umfang N Speziell: A endliche Menge, z.B. {1, 2, 3, 4, 5, 6} Stichproben von Umfang 5: (1,4,1,3,2), (2,2,4,3,6), . . . Insgesamt 65 Möglichkeiten. Laplace-Mechanismus = datengenerierender Mechanismus, bei dem jede Stichprobe dieselbe Chance hat, realisiert (beobachtet) zu werden. Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.4b Laplace Mechanismus A = {a1, . . . , ak } k Elemente, z.B. Umfrage mit k möglichen Antworten kN mögliche Stichproben vom Umfang N N =1: Ws(X1 = aj ) = 1 k für alle j = 1, . . . , k N beliebig: Ws(X1 = aj1 , . . . , XN = ajN ) = 1N für alle j1, . . . , jN k Beispiel: N = 5 Würfelwürfe Ws(X1 = 2, X2 = 2, X3 = 4, X4 = 3, X5 = 6) = 615 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.4c X Zufallsgröße mit Werten in X • Lebensdauer einer LED-Leuchte, X = [0, ∞) 1. Beobachtbare Ereignisse X ∈ B, • B⊂X {X ≤ 5 Tage} = {X ∈ [0, 5]}, {7 Tage < X ≤ 52 Tage} = {X ∈ (7, 52]} 2. Wahrscheinlichkeit 0 ≤ Ws(X ∈ B) ≤ 1 für jedes Ereignis unmögliches Ereignis: Ws(X ∈ B) = 0 sicheres Ereignis: Ws(X ∈ B) = 1 • Für ein λ > 0 : Ws(X ≤ 5) = 1 − e−λ·5 Ws(7 < X ≤ 52) = e−λ·7 − e−λ·52 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.4d 3. Verteilung der Zufallsgröße X: Abbildung, die jedem“ B ⊂ X die Wahrscheinlichkeit des ” Ereignisses {X ∈ B} zuordnet (Rechenvorschrift für Ws) P(B) = Ws(X ∈ B) ∈ [0, 1] • Exponentialverteilung mit Parameter λ > 0 P( [a, b] ) = Ws(a ≤ X ≤ b) = e−λ·a − e−λ·b P( (b, ∞) ) = Ws(X > b) = e−λ·b P( [0, a) ) = Ws(X < a) = 1 − e−λ·a für alle 0 ≤ a ≤ b < ∞ Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.4e Ereignisse und Teilmengen des Werteraums X Vereinigung A ∪ B, Durchschnitt A ∩ B, Komplement Ac A, B disjunkt, wenn A ∩ B = ∅ (leere Menge) {X ∈ A ∪ B}: wenigstens eines der Ereignisse {X ∈ A}, {X ∈ B} tritt ein {X ∈ A ∩ B}: beide Ereignisse {X ∈ A}, {X ∈ B} treten ein A, B disjunkt: die Ereignisse {X ∈ A}, {X ∈ B} schließen einander aus; höchstens eines kann eintreten {X ∈ Ac} = {X ∈ / A} : das Ereignis {X ∈ A} tritt nicht ein Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.5 Rechenregeln für Wahrscheinlichkeiten Kolmogorow-Axiome: W1) 0 ≤ Ws(X ∈ B) ≤ 1 W2) Ws(X ∈ X ) = 1 W3) B1, B2, . . . paarweise disjunkt, d.h. Bi ∩Bj = ∅ für alle i 6= j : Ws(X ∈ Bj für ein j = 1, 2, . . .) ≡ Ws(X ∈ B1 ∪ B2 ∪ . . .) = ∞ X Ws(X ∈ Bj ) j=1 abzählbare Additivität bei einander ausschließenden Ereignissen Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.5a Elementare Rechenregeln für Wahrscheinlichkeiten W1) 0 ≤ Ws(X ∈ B) ≤ 1 W2) Ws(X ∈ X ) = 1 W3a) A, B disjunkt: Ws(X ∈ A oder X ∈ B) = Ws(X ∈ A ∪ B) = Ws(X ∈ A) + Ws(X ∈ B) W3b) Ws(X ∈ / B) = 1 − Ws(X ∈ B) W3c) Wenn B ⊂ C, d.h. aus X ∈ B folgt X ∈ C: Ws(X ∈ B) ≤ Ws(X ∈ C) Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.6 Häufigkeitsinterpretation der Wahrscheinlichkeit Zufallsexperiment Zufallsgröße X Wiederholte Zufallsexperimente derselben Art, die unabhängig voneinander sind Zufallsgrößen X1, X2, . . . mit Ws(Xj ∈ B) = Ws(X ∈ B) für j = 1, 2, . . . n Experimente Stichprobe X1, . . . , Xn vom Umfang n Anzahl der j mit {Xj ∈B} Ws(X ∈ B) n n−→ →∞ Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.7 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.8 2.5 Verteilungen mit Dichten X Zufallsgröße mit Werten in X = R zur Berechnung von Ws(X ∈ B) : Wahrscheinlichkeitsdichte p(x) ≥ 0, −∞ < x < ∞ mit Z ∞ −∞ p(x) dx = 1 Setze: Ws(X ∈ (a, b)) ≡ Ws(a < X < b) = Z b a p(x) dx Allgemein: B ⊆ R, Ws(X ∈ B) = Z B p(x) dx Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.9 R y+∆ Ws(y − ∆ ≤ X ≤ y + ∆) = y−∆ p(x) dx ≈ p(y) · 2∆ falls p(x) ≈ const. für y − ∆ < x < y + ∆ p(y) proportional zu Wahrscheinlichkeit, dass X Werte in der Nähe von y annimmt. Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.10 ( Beispiel: p(x) = 0 für x < α und x > β 1 β−α für α ≤ x ≤ β Eine Zufallsgröße X mit dieser Wsdichte nimmt nur Werte in [α, β] an, und: Ws(a < X < b) = Z b a p(x) dx = Z b 1 dx a β−α b−a = β−α für α ≤ a ≤ b ≤ β X heißt uniform verteilt im Intervall [α, β] oder kurz: U (α, β)verteilt Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.11 Anwendungen a) Rad einer Lokomotive mit Radius r Bremsen Rad schleift an zufälligem Punkt X auf dem Rand (Abnutzung). Modell: X ist U (0, 2πr)-verteilt b) Polymerstrang der Länge ` wird chemisch gespalten X = Länge des Teilstanges (vom linken Rand aus) ist U (0, `)verteilt. Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.12 Die Normalverteilung (Skript 2.6) X Werte in (−∞, ∞), Parameter µ ∈ R, σ 2 > 0 Wsdichte: p(x) = ϕµ,σ2 (x) = √ 1 2πσ 2 − (x−µ) 2 e 2σ 2 . Eine Zufallsgröße X mit dieser Dichte heißt normalverteilt mit Mittelwert µ und Varianz σ 2, kurz: N (µ, σ 2)-verteilt Spezialfall: Standardnormalverteilung N (0, 1) 1 − x2 ϕ(x) = ϕ0,1(x) = √ e 2 2π Prof. Dr. J. Franke Dichte der Normalverteilung: 2 1 − (x−µ) p(x) = ϕµ,σ2 (x) = √ e 2σ2 . 2πσ 2 Statistik II für Wirtschaftswissenschaftler 2.13 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.14 Modellbildung: Addition vieler kleiner Effekte Messung X mit Werten in (−∞, ∞) Ihr Wert hängt ab von Vielzahl von Einflüssen, von denen keiner dominiert: X≈ N X εj j=1 N groß, ε1, . . . , εN gleichmäßig klein und unabhängig (oder schwach abhängig) X kann als N (µ, σ 2)-verteilte Zufallsgröße modelliert werden. µ : Zentrum des Bereichs, wo X am ehesten beobachtet wird σ : Maß für die Streuung der Werte von X um µ . Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.14a Berechnung von Wahrscheinlichkeiten (Normalverteilung) Stammfunktion der Dichte der Standardnormalverteilung N (0, 1): 1 − x2 √ Φ(t) = e 2 dx ϕ(x)dx = −∞ −∞ 2π Z t Z t Stammfunktion der Dichte ϕµ,σ2 (x): Φµ,σ2 (t) = Z t −∞ ϕµ,σ2 (x)dx = Z t −∞ √ 1 2πσ 2 Tabelle von Φ(x), x ≥ 0 Φ(−x) = 1 − Φ(x) Φ(∞) = Ws(Z ≤ ∞) = 1 Φ(−∞) = Ws(Z ≤ −∞) = 0 − (x−µ) 2 e 2σ 2 t−µ dx = Φ( ) σ Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.15 Z N (0, 1)-verteilt Ws(X ≤ t) = Φ(t) Ws(a < Z < b) = Ws(Z < b) − Ws(Z ≤ a) = Φ(b) − Φ(a) X N (µ, σ 2)-verteilt Ws(X ≤ t) = Φµ,σ2 (t) a−µ X −µ b−µ Ws(a < X < b) = Ws < < σ σ σ b−µ a−µ = Φ −Φ σ σ X N (µ, σ 2)-verteilt X −µ Z= σ Z standardnormalverteilt standardnormalverteilt X = σZ + µ N (µ, σ 2)-verteilt Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.16 Normalverteilte Zufallsgrößen eignen sich als Modell für viele reellwertige Messungen. Bedingungen (an Histogramm grob nachprüfbar) 1) Wsdichte hat ein eindeutiges und deutliches Maximum bei µ 2) Die Zufallsgröße streut symmetrisch um µ Beispiele: i) Körpergröße eines 20jährigen Mannes hängt ab von: genetischen Faktoren, Ernährung in verschiedenen Lebensaltern, Umwelteinflüssen, Krankheiten, ... Deren Beiträge εj addieren sich zur Endgröße. Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.17 ii) Störungen (Rauschen) bei Übertragung eines Signals in einem Leiter durch die thermische Bewegung der freien Elektronen Allgemein: Messfehler iii) EEG-Messung zu festem Zeitpunkt iv) Messungen von Länge, Volumen, Gewicht (Techno- oder Biometrie) oft näherungsweise normal verteilt. Voraussetzung: Die Objekte oder Individuen stammen aus homogener Grundgesamtheit. Auch per se positive Messungen können als normalverteilte Zufallsgrößen modelliert werden, wenn für ein c > 0 Ws(X ≤ c) ≈ 0 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.18 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.19 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.20 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.21 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.22 2.7 Verteilungsfunktion und Quantile X reellwertige Zufallsgröße mit Wsdichte p F (t) = Z t −∞ p(x)dx = Ws(X ≤ t) (Stammfunktion von p) heißt Verteilungsfunktion Ws(a < X < b) = (−) (−) Z b a p(x)dx = F (b) − F (a) Ws(X > a) = 1 − F (a) (−) Allgemeine Definition, auch für diskrete Verteilungen: F (t) = Ws(X ≤ t) Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.23 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.23a X mit Werten in X = [0, ∞) heißt exponentiell verteilt mit Parameter λ > 0 oder Exp(λ)-verteilt, falls Dichte p(x) = λe−λx, x ≥ 0 und p(x) = 0, x < 0. Verteilungsfunktion: F λ(t) = Ws(X ≤ t) = Z t 0 λe−λxdx = 1 − e−λt Ws(X > t) = 1 − Ws(X ≤ t) = e−λt Ws(a ≤ X ≤ b) = e−λa − e−λb Anwendungen: • Lebensdauer von elektronischem Bauteil • Wartezeit auf Ereignis (Schaden bei Sachversicherung, Ankunft von Kunden in Bedienungssystem, ...) Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.24 1) Gegeben t. Mit welcher Wahrscheinlichkeit α überschreitet X den Wert t nicht? Antwort: F (t) = Ws(X ≤ t) = α 2) Gegeben α. Welche Schranke t wird von X mit Wskeit α nicht überschritten? Antwort: t = qα = α-Quantil von X bzw. von F Zu 0 < α < 1 heißt q α ein α-Quantil der Zufallsgröße X oder der Verteilungsfunktion F , wenn Ws(X ≤ qα) = F (qα) = α Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.25 Spezialfälle: a) 1 2 -Quantil q0,5 = Median 1 - bzw. 3 -Quantil q b) 4 0,25 bzw. q0,75 = unteres bzw. oberes 4 Viertelquantil (oder Quartil) Wenn X eine Wsdichte besitzt, so gibt es zu jedem 0 < α < 1 ein α-Quantil. Gibt es mehrere x mit F (x) = α, wähle (als Konvention) das kleinste: qα = min{x; F (x) = α} Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.26 Quantile der Standard-Normalverteilung N (0, 1) (Tabelle 3a) Niveau α 0,5000 0,7500 0,8000 0,8500 0,9000 0,9500 0,9750 0,9900 0,9950 0,9990 0,9995 Quantil qα 0,000 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,090 3,291 Für Niveaus α < 0, 5: Quantile von N (µ, σ 2) : qα = −q1−α qα(µ, σ 2) = σ · qα + µ Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.27 Anwendung: Risikomessung für Finanzanlagen (Basel I) Vt Wert eines Aktienportfolios am Tag t Rt = ln VVt ≈ t−1 Vt −Vt−1 Vt−1 Rendite von Tag t − 1 auf t Modell: R1, R2, . . . , unabhängige N (µ, σ 2)-verteilte Zufallsgrößen (auch Grundlage des Black-Scholes-Ansatzes zur Bewertung von Optionen und anderen Derivaten) Value-at-risk (VaR) = Schranke für den Verlust aus dem Portfolio von einem Tag zum anderen (oder innerhalb von 5 Tagen), die nur mit geringer Wahrscheinlichkeit überschritten wird (0,05 oder 0,01). Prof. Dr. J. Franke t = heute Statistik II für Wirtschaftswissenschaftler 2.28 Vt bekannt Risikoabschätzung für Wertentwicklung bis t + 1 = morgen (prozentual bezogen auf Kapital von heute) 0, 05 = Ws(Rt+1 ≤ VaR ) ⇒ VaR = q0,05 = 0, 05-Quantil von N (µ, σ 2) Vt+1 − Vt ≈ Rt+1 =⇒ Vt+1 ≤ Vt(1 + VaR ) Vt passiert nur mit geringer Wskeit 0,05 µ =?, σ 2 =? Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.29 Beispiel: Körpergröße von Männern ist N (µ, σ 2)-verteilt mit µ = 175 cm, σ = 10 cm. Welche Körpergrößen müssen bei neuer Hosenkollektion berücksichtigt werden, wenn nur die jeweils 5% kleinsten bzw. größten Männer nichts Passendes finden sollen? Gesucht: k, g mit Ws(X < k) = 0, 05 und Ws(X > g) = 0, 05 Ws(X < k) = Ws(X ≤ k) = F (k) k = q0,05 Ws(X > g) = 1 − Ws(X ≤ g) = 1 − F (g) = 0, 05 F (g) = 0, 95 g = q0,95 Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.30 Ws(X < k) = 0, 05 und Ws(X > g) = 0, 95 N (0,1) g = q0,95 = µ + σ q0,95 = [175 + 10 · 1, 645] cm = 191, 45 cm N (0,1) k = q0,05 = µ + σq0,05 N (0,1) = µ − σq0,95 = [175 − 10 · 1, 645] cm = 158, 55 cm Hosengröße: Beinlänge und Bauchumfang abhängige Beobachtungen. Was ist das im stochastischen Modell? Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.31 2.10 Unabhängigkeit (und Korrelation) Unabhängigkeit von Zufallsgrößen ≡ Multiplikationsregel für Wahrscheinlichkeiten Zufallsgrößen X, Y mit Werten in X sind unabhängig, wenn für alle A, B ⊆ X Ws X ∈ A und Y ∈ B = Ws X ∈ A · Ws Y ∈ B X1, . . . , XN unabhängig, wenn für alle A1, . . . , AN ⊆ X Ws X1 ∈ A1, . . . , XN ∈ AN = Ws X1 ∈ A1 · . . . · Ws XN ∈ AN Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.32 Bei Abhängigkeit gilt das nicht, zum Beispiel: X standardnormalverteilt, Y = X 2 0≤Y ≤1 ⇐⇒ −1 ≤ X ≤ 1 w = Ws(0 ≤ Y ≤ 1) = Ws(−1 ≤ X ≤ 1) = Φ(1) − Φ(−1) = Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 · 0, 8413 − 1 = 0, 6826 < 1 und damit w = Ws(0 ≤ Y ≤ 1) = Ws 0 ≤ Y ≤ 1 und − 1 ≤ X ≤ 1 > w2 = Ws(0 ≤ Y ≤ 1) · Ws(−1 ≤ X ≤ 1) Prof. Dr. J. Franke Statistik II für Wirtschaftswissenschaftler 2.33 Zufallsgrößen X1, . . . , XN mit Werten in X heißen unabhängig, identisch verteilt (u.i.v.), wenn sie unabhängig sind und wenn sie alle dieselbe Verteilung haben, d. h. für alle j = 1, . . . , N Ws(Xj ∈ A) = Ws(X1 ∈ A) für alle A ⊆ X Modellbildung: u.i.v. Zufallsgrößen eignen sich als Modell für Messwerte, die auf (im intuitiven Sinn) unabhängige Weise durch Wiederholung des jeweils selben Experiments gewonnen worden sind.