Die Varianz (Streuung) Definition Werkzeuge der empirischen Forschung W. Kössler Ang., die betrachteten Erwartungswerte existieren. var(X) = E(X − EX)2 Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen heißt Varianz der Zufallsvariable X. p σ = Var(X) heißt Standardabweichung der Zufallsvariablen X. Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Bez.: var(X), Var(X), varX, σ 2 , σX2 , σ, σX . Sei µ = EX. Erwartungswert Varianz Normalverteilung (2) 116 / 169 Die Varianz Stetige und diskrete Zufallsvariablen Werkzeuge der empirischen Forschung Wenn X diskret, so gilt: W. Kössler Einleitung var(X) = Datenbehandlung ∞ X i=0 Syntax Tastatur (xi − µ)2 pi Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wenn X stetig, so gilt: Z var(X) = ∞ −∞ Wkt.rechnung Population Wahrscheinlichkeit (x − µ)2 f (x) dx, wobei f die Dichte von X ist. Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert var(X): mittlere quadratische Abweichung von X und EX. Varianz Normalverteilung (2) 117 / 169 Die Varianz Eigenschaften der Varianz Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung var(X) = E(X − EX)2 = E(X − µ)2 = = E(X 2 − 2µX + µ2 ) = = EX 2 − µ2 . SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 118 / 169 Die Varianz Eigenschaften der Varianz Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung var(X) = E(X − EX)2 = E(X − µ)2 = = E(X 2 − 2µX + µ2 ) = = EX 2 − µ2 . SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung var(aX + b) = a2 var(X), a, b ∈ R. Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 118 / 169 Die Varianz Eigenschaften der Varianz Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung var(X) = E(X − EX)2 = E(X − µ)2 = = E(X 2 − 2µX + µ2 ) = = EX 2 − µ2 . SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen var(aX + b) = a2 var(X), Wkt.rechnung a, b ∈ R. Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen var(X) = 0 ⇐⇒ ∃c : P(X = c) = 1. Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 118 / 169 Die Varianz Unabhängigkeit von Zufallsvariablen Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Zwei Zufallsvariablen X und Y heißen unabhängig, falls P(X ≤ x, Y ≤ y) = P(X ≤ x) · P(Y ≤ y) für alle x, y ∈ R. Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 119 / 169 Die Varianz Unabhängigkeit von Zufallsvariablen Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung Zwei Zufallsvariablen X und Y heißen unabhängig, falls P(X ≤ x, Y ≤ y) = P(X ≤ x) · P(Y ≤ y) für alle x, y ∈ R. Zwei Ereignisse A und B heißen unabhängig, falls SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen P(A, B) = P(A) · P(B) X und Y sind also unabhängig gdw. die Ereignisse X ≤ x und Y ≤ y unabhängig sind für alle x, y ∈ R. Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 119 / 169 Die Varianz Unabhängigkeit von Zufallsvariablen Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung Zwei Zufallsvariablen X und Y heißen unabhängig, falls P(X ≤ x, Y ≤ y) = P(X ≤ x) · P(Y ≤ y) für alle x, y ∈ R. Zwei Ereignisse A und B heißen unabhängig, falls SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) P(A, B) = P(A) · P(B) X und Y sind also unabhängig gdw. die Ereignisse X ≤ x und Y ≤ y unabhängig sind für alle x, y ∈ R. Seien X und Y unabhängig. Dann gilt Erwartungswert Varianz Normalverteilung (2) var(X + Y) = var(X) + var(Y). 119 / 169 Die Varianz Poisson-Verteilung Werkzeuge der empirischen Forschung W. Kössler P(X = i) = λi −λ e , i! i = 0, 1, 2, . . . Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) ∞ X var(X) = E(X − EX) = (i − λ)2 pi 2 i=0 = ∞ X i · (i − 1)pi + 2λ ipi + λ2 i=2 ∞ X i=0 ∞ X i=0 ∞ X ipi − pi i=0 ∞ X λi−2 −λ 2 + λ − 2λ2 + λ2 = λ. = e λ (i − 2)! 120 / 169 i=2 Die Varianz Binomialverteilung, X ∼ B(n, p) Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen n k p · (1 − p)n−k P(X = k) = k Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung var(X) = np(1 − p). (ohne Beweis, ÜA) Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 121 / 169 Die Varianz Gleichverteilung auf (a, b) Werkzeuge der empirischen Forschung W. Kössler Einleitung f (x) = ( 1 b−a 0 x ∈ (a, b) sonst. EX = a+b . 2 Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 122 / 169 Die Varianz Gleichverteilung auf (a, b) Werkzeuge der empirischen Forschung W. Kössler Einleitung f (x) = ( 1 b−a x ∈ (a, b) sonst. 0 EX = a+b . 2 Datenbehandlung Syntax Tastatur Transformationen EX 2 = Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) = Z b 1 b 1 1 dx = x3 a · b − a 3 b − a a 3 3 2 2 b −a a + ab + b = . 3(b − a) 3 x2 var(X) = EX 2 − (EX)2 1 (4a2 + 4ab + 4b2 − 3a2 = 12 −6ab − 3b2 ) 1 2 (b − a)2 = (a − 2ab + b2 ) = . 122 / 169 Die Varianz Exponentialverteilung Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung f (x) = ( 1 − λx e λ 0 falls x ≥ 0, sonst. Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen EX = Z λ. ∞ 1 x x2 e− λ dx = 2 · λ2 EX 2 = λ 0 2 var(X) = λ . (ÜA). Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 123 / 169 Die Varianz Normalverteilung var(X) = σ 2 Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 1 x−µ 2 1 e− 2 ( σ ) dx f (x) = √ Z 2πσ ∞ 1 1 x−µ 2 e− 2 ( σ ) dx (x − µ)2 √ E(X − µ)2 = 2πσ −∞ Z ∞ 1 t2 t2 √ e− 2 dt = σ2 2π Z−∞ ∞ 1 t2 = σ2 (−t)(−t √ e− 2 ) dt 2π −∞ Z ∞ 2 σ2 −t2 /2 ∞ − t2 = √ − (−1)e dt −te −∞ 2π −∞ Z ∞ 2 2 t σ = √ e− 2 dt = σ 2 . 2π −∞ 124 / 169 Normalverteilung Besondere Eigenschaften Werkzeuge der empirischen Forschung W. Kössler (schwaches) Gesetz der Großen Zahlen Seien Xi unabhängig, identisch verteilt, EXi = µ n Einleitung 1X Xn = Xi →p EX n i=1 Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Zentraler Grenzwertsatz Seien Xi unabhängig, identisch verteilt, EXi = µ, varXi = σ 2 . Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Normalverteilung (1) Zn := √ Xn − µ n → Z, σ Z ∼ N(0, 1). Erwartungswert Varianz Normalverteilung (2) Descr_Binomial_2.sas Descr_Exp.sas 126 / 169 Normalverteilung Fehlertheorie Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung Fehler sind unter folgenden Annahmen (asymptotisch) normalverteilt: • Jeder Fehler ist Summe einer sehr großen Anzahl sehr kleiner, gleich großer Fehler, die verschiedene Ursachen haben. SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen • Die verschiedenen Fehlerkomponenten sind unabhängig. • Jede Fehlerkomponente ist mit Wkt. 0.5 positiv und mit Wkt. 0.5 negativ. Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 127 / 169 Normalverteilung Maximale Entropie Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen bei gegebenen Mittelwert µ und Varianz σ 2 . Rf : Wkt.dichte auf R(−∞, ∞). xf (x) dx = µ, (x − µ)2 f (x) dx = σ 2 Entropie: Z H(f ) := − f (x) log f (x) dx ist zu maximieren unter den obigen Bedingungen. =⇒ f =Normaldichte. Stetige Zufallsvariablen Normalverteilung (1) Erwartungswert Literatur: Rao: Lineare Statistische Methoden, 3.a.1. Varianz Normalverteilung (2) 128 / 169 Normalverteilung Die Summe normalverteilter Zufallsvariablen Werkzeuge der empirischen Forschung W. Kössler Einleitung Datenbehandlung Syntax Tastatur Transformationen Externes File Input-Anweisung SAS-Files Zusamenfügen Output-Anweisung Die Summe normalverteilter Zufallsvariablen ist normalverteilt. Seien X1 ∼ N(µ1 , σ12 ) X2 ∼ N(µ2 , σ22 ). Dann X1 + X2 ∼ N(µ1 + µ2 , σ12 + σ22 + 2ρ). (ρ: Korrelationskoeffizient zwischen X1 und X2 , s.u.) DO-Schleifen Wkt.rechnung Population Wahrscheinlichkeit Zufallsvariablen Diskrete Zufallsvariablen Stetige Zufallsvariablen Beweis: über charakteristische Funktionen (Fouriertransformationen der Dichte) oder über die Faltungsformel (Stochastik-Vorlesung). Normalverteilung (1) Erwartungswert Varianz Normalverteilung (2) 129 / 169