Statistik II für Wirtschaftswissenschaftler 2. Wahrscheinlichkeitstheoretische Grundlagen Stochastisches Modell = mathematisches Modell für ein reales Phänomen unter Verwendung des fiktiven Begriffs Zufall Wann? a) bei der Datenerhebung wird explizit ein zufälliger Aspekt eingebaut (Meinungsumfragen) b) System an sich deterministisch, aber zu komplex für deterministische Modellierung Beispiel: Würfelwurf als mechanisches Experiment zu kompliziert Stochastisches Modell: Würfelwurf liefert Zufallsgröße X mit Werten in {1, 2, 3, 4, 5, 6}, wobei jede Zahl 1, . . . , 6 dieselbe Wahr1 hat, als Wert von X aufzutreten. scheinlichkeit 6 Folie 2.1 Statistik II für Wirtschaftswissenschaftler Folie 2.2 2.1 Zufallsgrößen, Ereignisse, Wahrscheinlichkeiten ”Messung” eines numerischen oder qualitativen Merkmals Ergebnisse liegen in Werteraum X Wiederholte ”Messungen” unterschiedliche Ergebnisse Modellierung: c Zufallsmechanismus Messvorgang = Einmalige Betätigung liefert Zufallsgröße X mit Werten in X Wiederholte Betätigung liefert verschiedene Realisationen der Zufallsgröße X X1, X2, . . . , XN Statistik II für Wirtschaftswissenschaftler Beispiele: i) Gewicht eines zufällig ausgewählten Passanten in kg Werteraum: X = (0, ∞) ⊆ R ii) Anzahl der defekten RAM-Bausteine in einer Lieferung von 1000 Stück Werteraum: X = {0, . . . , 1000} ⊆ R iii) Windgeschwindigkeit in allen 3 Richtungen des Raums Werteraum: X = R3 iv) Alter und Blutdruck eines Menschen Werteraum: X = {0, 1, 2, . . .} × (0, ∞) Messung liefert quantitative Daten, X ⊆ R oder Rd quantitative Zufallsgröße Folie 2.3 Statistik II für Wirtschaftswissenschaftler v) Familienstand X = {ledig, verheiratet, verwitwet, geschieden, keine Angabe} vi) Meinungsäußerung auf Frage nach Semesterticket X = {dafür, dagegen, egal, keine Angabe} vii) Bewertung eines Rasenmähers nach Preis und Handhabung X = { billig, mittel, teuer} × {leicht, schwer} viii) Zeugnisnote im Schulfach X = {1, 2, 3, 4, 5, 6} ix) Ergebnis eines Würfelwurfs X = {1, 2, 3, 4, 5, 6} Messung nicht oder nur willkürlich als Zahl beschreibbar qualitative Zufallsgröße Folie 2.4 Statistik II für Wirtschaftswissenschaftler Beobachtung mögliche Werte N Beobachtungen Zufallsgröße X Werteraum X Stichprobe X1, . . . , XN vom Umfang N Speziell: A endliche Menge, z.B. {1, 2, 3, 4, 5, 6} Stichproben von Umfang 5: (1,4,1,3,2), (2,2,4,3,6), . . . Insgesamt 65 Möglichkeiten. Laplace-Mechanismus = datengenerierender Mechanismus, bei dem jede Stichprobe dieselbe Chance hat, realisiert (beobachtet) zu werden. Folie 2.4a Statistik II für Wirtschaftswissenschaftler Folie 2.4b Laplace Mechanismus A = {a1, . . . , ak } k Elemente, z.B. Umfrage mit k möglichen Antworten kN mögliche Stichproben vom Umfang N N =1: Ws(X1 = aj ) = 1 k für alle j = 1, . . . , k N beliebig: Ws(X1 = aj1 , . . . , XN = ajN ) = 1N für alle j1, . . . , jN k Beispiel: N = 5 Würfelwürfe Ws(X1 = 2, X2 = 2, X3 = 4, X4 = 3, X5 = 6) = 615 Statistik II für Wirtschaftswissenschaftler Folie 2.4c X Zufallsgröße mit Werten in X • Lebensdauer einer LED-Leuchte, X = [0, ∞) 1. Beobachtbare Ereignisse X ∈ B, • B⊂X {X ≤ 5 Tage} = {X ∈ [0, 5]}, {7 Tage < X ≤ 52 Tage} = {X ∈ (7, 52]} 2. Wahrscheinlichkeit 0 ≤ Ws(X ∈ B) ≤ 1 für jedes Ereignis unmögliches Ereignis: Ws(X ∈ B) = 0 sicheres Ereignis: Ws(X ∈ B) = 1 • Für ein λ > 0 : Ws(X ≤ 5) = 1 − e−λ·5 Ws(7 < X ≤ 52) = e−λ·7 − e−λ·52 Statistik II für Wirtschaftswissenschaftler 3. Verteilung der Zufallsgröße X: Abbildung, die jedem“ B ⊂ X die Wahrscheinlichkeit des ” Ereignisses {X ∈ B} zuordnet (Rechenvorschrift für Ws) P(B) = Ws(X ∈ B) ∈ [0, 1] • Exponentialverteilung mit Parameter λ > 0 P( [a, b] ) = Ws(a ≤ X ≤ b) = e−λ·a − e−λ·b P( (b, ∞) ) = Ws(X > b) = e−λ·b P( [0, a) ) = Ws(X < a) = 1 − e−λ·a für alle 0 ≤ a ≤ b < ∞ Folie 2.4d Statistik II für Wirtschaftswissenschaftler Ereignisse und Teilmengen des Werteraums X Vereinigung A ∪ B, Durchschnitt A ∩ B, Komplement Ac A, B disjunkt, wenn A ∩ B = ∅ (leere Menge) {X ∈ A ∪ B}: wenigstens eines der Ereignisse {X ∈ A}, {X ∈ B} tritt ein {X ∈ A ∩ B}: beide Ereignisse {X ∈ A}, {X ∈ B} treten ein A, B disjunkt: die Ereignisse {X ∈ A}, {X ∈ B} schließen einander aus; höchstens eines kann eintreten {X ∈ Ac} = {X ∈ / A} : das Ereignis {X ∈ A} tritt nicht ein Folie 2.4e Statistik II für Wirtschaftswissenschaftler Rechenregeln für Wahrscheinlichkeiten Kolmogorow-Axiome: W1) 0 ≤ Ws(X ∈ B) ≤ 1 W2) Ws(X ∈ X ) = 1 W3) B1, B2, . . . paarweise disjunkt, d.h. Bi ∩Bj = ∅ für alle i 6= j : Ws(X ∈ Bj für ein j = 1, 2, . . .) ≡ Ws(X ∈ B1 ∪ B2 ∪ . . .) = ∞ X Ws(X ∈ Bj ) j=1 abzählbare Additivität bei einander ausschließenden Ereignissen Folie 2.5 Statistik II für Wirtschaftswissenschaftler Folie 2.5a Elementare Rechenregeln für Wahrscheinlichkeiten W1) 0 ≤ Ws(X ∈ B) ≤ 1 W2) Ws(X ∈ X ) = 1 W3a) A, B disjunkt: Ws(X ∈ A oder X ∈ B) = Ws(X ∈ A ∪ B) = Ws(X ∈ A) + Ws(X ∈ B) W3b) Ws(X ∈ / B) = 1 − Ws(X ∈ B) W3c) Wenn B ⊂ C, d.h. aus X ∈ B folgt X ∈ C: Ws(X ∈ B) ≤ Ws(X ∈ C) Statistik II für Wirtschaftswissenschaftler Häufigkeitsinterpretation der Wahrscheinlichkeit Zufallsexperiment Zufallsgröße X Wiederholte Zufallsexperimente derselben Art, die unabhängig voneinander sind Zufallsgrößen X1, X2, . . . mit Ws(Xj ∈ B) = Ws(X ∈ B) für j = 1, 2, . . . n Experimente Stichprobe X1, . . . , Xn vom Umfang n Anzahl der j mit {Xj ∈B} Ws(X ∈ B) n n−→ →∞ Folie 2.6 Statistik II für Wirtschaftswissenschaftler Folie 2.7 Statistik II für Wirtschaftswissenschaftler Folie 2.8 2.5 Verteilungen mit Dichten X Zufallsgröße mit Werten in X = R zur Berechnung von Ws(X ∈ B) : Wahrscheinlichkeitsdichte p(x) ≥ 0, −∞ < x < ∞ mit Z ∞ −∞ p(x) dx = 1 Setze: Ws(X ∈ (a, b)) ≡ Ws(a < X < b) = Z b a p(x) dx Allgemein: B ⊆ R, Ws(X ∈ B) = Z B p(x) dx Statistik II für Wirtschaftswissenschaftler R y+∆ Ws(y − ∆ ≤ X ≤ y + ∆) = y−∆ p(x) dx ≈ p(y) · 2∆ falls p(x) ≈ const. für y − ∆ < x < y + ∆ p(y) proportional zu Wahrscheinlichkeit, dass X Werte in der Nähe von y annimmt. Folie 2.9 Statistik II für Wirtschaftswissenschaftler ( Beispiel: p(x) = Folie 2.10 0 für x < α und x > β 1 β−α für α ≤ x ≤ β Eine Zufallsgröße X mit dieser Wsdichte nimmt nur Werte in [α, β] an, und: Ws(a < X < b) = Z b a p(x) dx = Z b 1 dx a β−α b−a = β−α für α ≤ a ≤ b ≤ β X heißt uniform verteilt im Intervall [α, β] oder kurz: U (α, β)verteilt Statistik II für Wirtschaftswissenschaftler Anwendungen a) Rad einer Lokomotive mit Radius r Bremsen Rad schleift an zufälligem Punkt X auf dem Rand (Abnutzung). Modell: X ist U (0, 2πr)-verteilt b) Polymerstrang der Länge ` wird chemisch gespalten X = Länge des Teilstanges (vom linken Rand aus) ist U (0, `)verteilt. Folie 2.11 Statistik II für Wirtschaftswissenschaftler Folie 2.12 Die Normalverteilung (Skript 2.6) X Werte in (−∞, ∞), Parameter µ ∈ R, σ 2 > 0 Wsdichte: p(x) = ϕµ,σ2 (x) = √ 1 2πσ 2 − (x−µ) 2 e 2σ 2 . Eine Zufallsgröße X mit dieser Dichte heißt normalverteilt mit Mittelwert µ und Varianz σ 2, kurz: N (µ, σ 2)-verteilt Spezialfall: Standardnormalverteilung N (0, 1) 1 − x2 ϕ(x) = ϕ0,1(x) = √ e 2 2π Statistik II für Wirtschaftswissenschaftler Dichte der Normalverteilung: 2 1 − (x−µ) p(x) = ϕµ,σ2 (x) = √ e 2σ2 . 2πσ 2 Folie 2.13 Statistik II für Wirtschaftswissenschaftler Folie 2.14 Modellbildung: Addition vieler kleiner Effekte Messung X mit Werten in (−∞, ∞) Ihr Wert hängt ab von Vielzahl von Einflüssen, von denen keiner dominiert: X≈ N X εj j=1 N groß, ε1, . . . , εN gleichmäßig klein und unabhängig (oder schwach abhängig) X kann als N (µ, σ 2)-verteilte Zufallsgröße modelliert werden. µ : Zentrum des Bereichs, wo X am ehesten beobachtet wird σ : Maß für die Streuung der Werte von X um µ . Statistik II für Wirtschaftswissenschaftler Folie 2.14a Berechnung von Wahrscheinlichkeiten (Normalverteilung) Stammfunktion der Dichte der Standardnormalverteilung N (0, 1): 1 − x2 √ Φ(t) = e 2 dx ϕ(x)dx = −∞ −∞ 2π Z t Z t Stammfunktion der Dichte ϕµ,σ2 (x): Φµ,σ2 (t) = Z t −∞ ϕµ,σ2 (x)dx = Z t −∞ √ 1 2πσ 2 Tabelle von Φ(x), x ≥ 0 Φ(−x) = 1 − Φ(x) Φ(∞) = Ws(Z ≤ ∞) = 1 Φ(−∞) = Ws(Z ≤ −∞) = 0 − (x−µ) 2 e 2σ 2 t−µ dx = Φ( ) σ Statistik II für Wirtschaftswissenschaftler Folie 2.15 Z N (0, 1)-verteilt Ws(X ≤ t) = Φ(t) Ws(a < Z < b) = Ws(Z < b) − Ws(Z ≤ a) = Φ(b) − Φ(a) X N (µ, σ 2)-verteilt Ws(X ≤ t) = Φµ,σ2 (t) a−µ X −µ b−µ Ws(a < X < b) = Ws < < σ σ σ b−µ a−µ = Φ −Φ σ σ X N (µ, σ 2)-verteilt X −µ Z= σ Z standardnormalverteilt standardnormalverteilt X = σZ + µ N (µ, σ 2)-verteilt Statistik II für Wirtschaftswissenschaftler Normalverteilte Zufallsgrößen eignen sich als Modell für viele reellwertige Messungen. Bedingungen (an Histogramm grob nachprüfbar) 1) Wsdichte hat ein eindeutiges und deutliches Maximum bei µ 2) Die Zufallsgröße streut symmetrisch um µ Beispiele: i) Körpergröße eines 20jährigen Mannes hängt ab von: genetischen Faktoren, Ernährung in verschiedenen Lebensaltern, Umwelteinflüssen, Krankheiten, ... Deren Beiträge εj addieren sich zur Endgröße. Folie 2.16 Statistik II für Wirtschaftswissenschaftler ii) Störungen (Rauschen) bei Übertragung eines Signals in einem Leiter durch die thermische Bewegung der freien Elektronen Allgemein: Messfehler iii) EEG-Messung zu festem Zeitpunkt iv) Messungen von Länge, Volumen, Gewicht (Techno- oder Biometrie) oft näherungsweise normal verteilt. Voraussetzung: Die Objekte oder Individuen stammen aus homogener Grundgesamtheit. Auch per se positive Messungen können als normalverteilte Zufallsgrößen modelliert werden, wenn für ein c > 0 Ws(X ≤ c) ≈ 0 Folie 2.17 Statistik II für Wirtschaftswissenschaftler Folie 2.18 Statistik II für Wirtschaftswissenschaftler Folie 2.19 Statistik II für Wirtschaftswissenschaftler Folie 2.20 Statistik II für Wirtschaftswissenschaftler Folie 2.21 Statistik II für Wirtschaftswissenschaftler Folie 2.22 2.7 Verteilungsfunktion und Quantile X reellwertige Zufallsgröße mit Wsdichte p F (t) = Z t −∞ p(x)dx = Ws(X ≤ t) (Stammfunktion von p) heißt Verteilungsfunktion Ws(a < X < b) = (−) (−) Z b a p(x)dx = F (b) − F (a) Ws(X > a) = 1 − F (a) (−) Allgemeine Definition, auch für diskrete Verteilungen: F (t) = Ws(X ≤ t) Statistik II für Wirtschaftswissenschaftler Folie 2.23 Statistik II für Wirtschaftswissenschaftler Folie 2.23a X mit Werten in X = [0, ∞) heißt exponentiell verteilt mit Parameter λ > 0 oder Exp(λ)-verteilt, falls Dichte p(x) = λe−λx, x ≥ 0 und p(x) = 0, x < 0. Verteilungsfunktion: F λ(t) = Ws(X ≤ t) = Z t 0 λe−λxdx = 1 − e−λt Ws(X > t) = 1 − Ws(X ≤ t) = e−λt Ws(a ≤ X ≤ b) = e−λa − e−λb Anwendungen: • Lebensdauer von elektronischem Bauteil • Wartezeit auf Ereignis (Schaden bei Sachversicherung, Ankunft von Kunden in Bedienungssystem, ...) Statistik II für Wirtschaftswissenschaftler 1) Gegeben t. Mit welcher Wahrscheinlichkeit α überschreitet X den Wert t nicht? Antwort: F (t) = Ws(X ≤ t) = α 2) Gegeben α. Welche Schranke t wird von X mit Wskeit α nicht überschritten? Antwort: t = qα = α-Quantil von X bzw. von F Zu 0 < α < 1 heißt q α ein α-Quantil der Zufallsgröße X oder der Verteilungsfunktion F , wenn Ws(X ≤ qα) = F (qα) = α Folie 2.24 Statistik II für Wirtschaftswissenschaftler Spezialfälle: a) 1 2 -Quantil q0,5 = Median 1 - bzw. 3 -Quantil q b) 4 0,25 bzw. q0,75 = unteres bzw. oberes 4 Viertelquantil (oder Quartil) Wenn X eine Wsdichte besitzt, so gibt es zu jedem 0 < α < 1 ein α-Quantil. Gibt es mehrere x mit F (x) = α, wähle (als Konvention) das kleinste: qα = min{x; F (x) = α} Folie 2.25 Statistik II für Wirtschaftswissenschaftler Folie 2.26 Quantile der Standard-Normalverteilung N (0, 1) (Tabelle 3a) Niveau α 0,5000 0,7500 0,8000 0,8500 0,9000 0,9500 0,9750 0,9900 0,9950 0,9990 0,9995 Quantil qα 0,000 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,090 3,291 Für Niveaus α < 0, 5: Quantile von N (µ, σ 2) : qα = −q1−α qα(µ, σ 2) = σ · qα + µ Statistik II für Wirtschaftswissenschaftler Anwendung: Risikomessung für Finanzanlagen (Basel I) Vt Wert eines Aktienportfolios am Tag t Rt = ln VVt ≈ t−1 Vt −Vt−1 Vt−1 Rendite von Tag t − 1 auf t Modell: R1, R2, . . . , unabhängige N (µ, σ 2)-verteilte Zufallsgrößen (auch Grundlage des Black-Scholes-Ansatzes zur Bewertung von Optionen und anderen Derivaten) Value-at-risk (VaR) = Schranke für den Verlust aus dem Portfolio von einem Tag zum anderen (oder innerhalb von 5 Tagen), die nur mit geringer Wahrscheinlichkeit überschritten wird (0,05 oder 0,01). Folie 2.27 Statistik II für Wirtschaftswissenschaftler t = heute Vt bekannt Risikoabschätzung für Wertentwicklung bis t + 1 = morgen (prozentual bezogen auf Kapital von heute) 0, 05 = Ws(Rt+1 ≤ VaR ) ⇒ VaR = q0,05 = 0, 05-Quantil von N (µ, σ 2) Vt+1 − Vt ≈ Rt+1 =⇒ Vt+1 ≤ Vt(1 + VaR ) Vt passiert nur mit geringer Wskeit 0,05 µ =?, σ 2 =? Folie 2.28 Statistik II für Wirtschaftswissenschaftler Folie 2.29 Beispiel: Körpergröße von Männern ist N (µ, σ 2)-verteilt mit µ = 175 cm, σ = 10 cm. Welche Körpergrößen müssen bei neuer Hosenkollektion berücksichtigt werden, wenn nur die jeweils 5% kleinsten bzw. größten Männer nichts Passendes finden sollen? Gesucht: k, g mit Ws(X < k) = 0, 05 und Ws(X > g) = 0, 05 Ws(X < k) = Ws(X ≤ k) = F (k) k = q0,05 Ws(X > g) = 1 − Ws(X ≤ g) = 1 − F (g) = 0, 05 F (g) = 0, 95 g = q0,95 Statistik II für Wirtschaftswissenschaftler Folie 2.30 Ws(X < k) = 0, 05 und Ws(X > g) = 0, 95 N (0,1) g = q0,95 = µ + σ q0,95 = [175 + 10 · 1, 645] cm = 191, 45 cm N (0,1) k = q0,05 = µ + σq0,05 N (0,1) = µ − σq0,95 = [175 − 10 · 1, 645] cm = 158, 55 cm Hosengröße: Beinlänge und Bauchumfang abhängige Beobachtungen. Was ist das im stochastischen Modell? Statistik II für Wirtschaftswissenschaftler Folie 2.31 2.10 Unabhängigkeit (und Korrelation) Unabhängigkeit von Zufallsgrößen ≡ Multiplikationsregel für Wahrscheinlichkeiten Zufallsgrößen X, Y mit Werten in X sind unabhängig, wenn für alle A, B ⊆ X Ws X ∈ A und Y ∈ B = Ws X ∈ A · Ws Y ∈ B X1, . . . , XN unabhängig, wenn für alle A1, . . . , AN ⊆ X Ws X1 ∈ A1, . . . , XN ∈ AN = Ws X1 ∈ A1 · . . . · Ws XN ∈ AN Statistik II für Wirtschaftswissenschaftler Folie 2.32 Bei Abhängigkeit gilt das nicht, zum Beispiel: X standardnormalverteilt, Y = X 2 0≤Y ≤1 ⇐⇒ −1 ≤ X ≤ 1 w = Ws(0 ≤ Y ≤ 1) = Ws(−1 ≤ X ≤ 1) = Φ(1) − Φ(−1) = Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 · 0, 8413 − 1 = 0, 6826 < 1 und damit w = Ws(0 ≤ Y ≤ 1) = Ws 0 ≤ Y ≤ 1 und − 1 ≤ X ≤ 1 > w2 = Ws(0 ≤ Y ≤ 1) · Ws(−1 ≤ X ≤ 1) Statistik II für Wirtschaftswissenschaftler Zufallsgrößen X1, . . . , XN mit Werten in X heißen unabhängig, identisch verteilt (u.i.v.), wenn sie unabhängig sind und wenn sie alle dieselbe Verteilung haben, d. h. für alle j = 1, . . . , N Ws(Xj ∈ A) = Ws(X1 ∈ A) für alle A ⊆ X Modellbildung: u.i.v. Zufallsgrößen eignen sich als Modell für Messwerte, die auf (im intuitiven Sinn) unabhängige Weise durch Wiederholung des jeweils selben Experiments gewonnen worden sind. Folie 2.33