Die Varianz (Streuung)

Werbung
Die Varianz (Streuung)
Definition
Werkzeuge der
empirischen
Forschung
W. Kössler
Ang., die betrachteten Erwartungswerte existieren.
var(X) = E(X − EX)2
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
heißt Varianz der Zufallsvariable X.
p
σ = Var(X)
heißt Standardabweichung der Zufallsvariablen X.
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Bez.: var(X), Var(X), varX, σ 2 , σX2 , σ, σX .
Sei µ = EX.
Erwartungswert
Varianz
Normalverteilung (2)
116 / 169
Die Varianz
Stetige und diskrete Zufallsvariablen
Werkzeuge der
empirischen
Forschung
Wenn X diskret, so gilt:
W. Kössler
Einleitung
var(X) =
Datenbehandlung
∞
X
i=0
Syntax
Tastatur
(xi − µ)2 pi
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wenn X stetig, so gilt:
Z
var(X) =
∞
−∞
Wkt.rechnung
Population
Wahrscheinlichkeit
(x − µ)2 f (x) dx,
wobei f die Dichte von X ist.
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
var(X): mittlere quadratische Abweichung von X und
EX.
Varianz
Normalverteilung (2)
117 / 169
Die Varianz
Eigenschaften der Varianz
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
var(X) = E(X − EX)2 = E(X − µ)2 =
= E(X 2 − 2µX + µ2 ) =
= EX 2 − µ2 .
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
118 / 169
Die Varianz
Eigenschaften der Varianz
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
var(X) = E(X − EX)2 = E(X − µ)2 =
= E(X 2 − 2µX + µ2 ) =
= EX 2 − µ2 .
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
var(aX + b) = a2 var(X),
a, b ∈ R.
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
118 / 169
Die Varianz
Eigenschaften der Varianz
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
var(X) = E(X − EX)2 = E(X − µ)2 =
= E(X 2 − 2µX + µ2 ) =
= EX 2 − µ2 .
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
var(aX + b) = a2 var(X),
Wkt.rechnung
a, b ∈ R.
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
var(X) = 0 ⇐⇒ ∃c :
P(X = c) = 1.
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
118 / 169
Die Varianz
Unabhängigkeit von Zufallsvariablen
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Zwei Zufallsvariablen X und Y heißen unabhängig,
falls
P(X ≤ x, Y ≤ y) = P(X ≤ x) · P(Y ≤ y)
für alle x, y ∈ R.
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
119 / 169
Die Varianz
Unabhängigkeit von Zufallsvariablen
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
Zwei Zufallsvariablen X und Y heißen unabhängig,
falls
P(X ≤ x, Y ≤ y) = P(X ≤ x) · P(Y ≤ y)
für alle x, y ∈ R.
Zwei Ereignisse A und B heißen unabhängig, falls
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
P(A, B) = P(A) · P(B)
X und Y sind also unabhängig gdw. die Ereignisse
X ≤ x und Y ≤ y unabhängig sind für alle x, y ∈ R.
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
119 / 169
Die Varianz
Unabhängigkeit von Zufallsvariablen
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
Zwei Zufallsvariablen X und Y heißen unabhängig,
falls
P(X ≤ x, Y ≤ y) = P(X ≤ x) · P(Y ≤ y)
für alle x, y ∈ R.
Zwei Ereignisse A und B heißen unabhängig, falls
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
P(A, B) = P(A) · P(B)
X und Y sind also unabhängig gdw. die Ereignisse
X ≤ x und Y ≤ y unabhängig sind für alle x, y ∈ R.
Seien X und Y unabhängig. Dann gilt
Erwartungswert
Varianz
Normalverteilung (2)
var(X + Y) = var(X) + var(Y).
119 / 169
Die Varianz
Poisson-Verteilung
Werkzeuge der
empirischen
Forschung
W. Kössler
P(X = i) =
λi −λ
e ,
i!
i = 0, 1, 2, . . .
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
∞
X
var(X) = E(X − EX) =
(i − λ)2 pi
2
i=0
=
∞
X
i · (i − 1)pi +
2λ
ipi + λ2
i=2
∞
X
i=0
∞
X
i=0
∞
X
ipi −
pi
i=0
∞
X
λi−2
−λ 2
+ λ − 2λ2 + λ2 = λ.
= e λ
(i
−
2)!
120 / 169
i=2
Die Varianz
Binomialverteilung, X ∼ B(n, p)
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
n k
p · (1 − p)n−k
P(X = k) =
k
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
var(X) = np(1 − p).
(ohne Beweis, ÜA)
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
121 / 169
Die Varianz
Gleichverteilung auf (a, b)
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
f (x) =
(
1
b−a
0
x ∈ (a, b)
sonst.
EX =
a+b
.
2
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
122 / 169
Die Varianz
Gleichverteilung auf (a, b)
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
f (x) =
(
1
b−a
x ∈ (a, b)
sonst.
0
EX =
a+b
.
2
Datenbehandlung
Syntax
Tastatur
Transformationen
EX 2 =
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
=
Z
b
1 b
1
1
dx = x3 a ·
b
−
a
3
b
−
a
a
3
3
2
2
b −a
a + ab + b
=
.
3(b − a)
3
x2
var(X) = EX 2 − (EX)2
1
(4a2 + 4ab + 4b2 − 3a2
=
12
−6ab − 3b2 )
1 2
(b − a)2
=
(a − 2ab + b2 ) =
.
122 / 169
Die Varianz
Exponentialverteilung
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
f (x) =
(
1 − λx
e
λ
0
falls x ≥ 0,
sonst.
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
EX = Z
λ.
∞
1 x
x2 e− λ dx = 2 · λ2
EX 2 =
λ
0
2
var(X) = λ .
(ÜA).
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
123 / 169
Die Varianz
Normalverteilung var(X) = σ 2
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
1 x−µ 2
1
e− 2 ( σ ) dx
f (x) = √
Z 2πσ
∞
1
1 x−µ 2
e− 2 ( σ ) dx
(x − µ)2 √
E(X − µ)2 =
2πσ
−∞
Z ∞
1
t2
t2 √ e− 2 dt
= σ2
2π
Z−∞
∞
1
t2
= σ2
(−t)(−t √ e− 2 ) dt
2π
−∞
Z ∞
2
σ2
−t2 /2 ∞
− t2
= √
−
(−1)e
dt
−te
−∞
2π
−∞
Z
∞
2
2
t
σ
= √
e− 2 dt = σ 2 .
2π −∞
124 / 169
Normalverteilung
Besondere Eigenschaften
Werkzeuge der
empirischen
Forschung
W. Kössler
(schwaches) Gesetz der Großen Zahlen
Seien Xi unabhängig, identisch verteilt, EXi = µ
n
Einleitung
1X
Xn =
Xi →p EX
n i=1
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Zentraler Grenzwertsatz
Seien Xi unabhängig, identisch verteilt,
EXi = µ, varXi = σ 2 .
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Normalverteilung (1)
Zn :=
√ Xn − µ
n
→ Z,
σ
Z ∼ N(0, 1).
Erwartungswert
Varianz
Normalverteilung (2)
Descr_Binomial_2.sas
Descr_Exp.sas
126 / 169
Normalverteilung
Fehlertheorie
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
Fehler sind unter folgenden Annahmen
(asymptotisch) normalverteilt:
• Jeder Fehler ist Summe einer sehr großen Anzahl
sehr kleiner, gleich großer Fehler, die verschiedene
Ursachen haben.
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
• Die verschiedenen Fehlerkomponenten sind
unabhängig.
• Jede Fehlerkomponente ist mit Wkt. 0.5 positiv und
mit Wkt. 0.5 negativ.
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
127 / 169
Normalverteilung
Maximale Entropie
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
bei gegebenen
Mittelwert µ und Varianz σ 2 .
Rf : Wkt.dichte auf R(−∞, ∞).
xf (x) dx = µ,
(x − µ)2 f (x) dx = σ 2
Entropie:
Z
H(f ) := − f (x) log f (x) dx
ist zu maximieren unter den obigen Bedingungen.
=⇒ f =Normaldichte.
Stetige Zufallsvariablen
Normalverteilung (1)
Erwartungswert
Literatur: Rao: Lineare Statistische Methoden, 3.a.1.
Varianz
Normalverteilung (2)
128 / 169
Normalverteilung
Die Summe normalverteilter Zufallsvariablen
Werkzeuge der
empirischen
Forschung
W. Kössler
Einleitung
Datenbehandlung
Syntax
Tastatur
Transformationen
Externes File
Input-Anweisung
SAS-Files
Zusamenfügen
Output-Anweisung
Die Summe normalverteilter Zufallsvariablen ist
normalverteilt.
Seien X1 ∼ N(µ1 , σ12 )
X2 ∼ N(µ2 , σ22 ).
Dann
X1 + X2 ∼ N(µ1 + µ2 , σ12 + σ22 + 2ρ).
(ρ: Korrelationskoeffizient zwischen X1 und X2 , s.u.)
DO-Schleifen
Wkt.rechnung
Population
Wahrscheinlichkeit
Zufallsvariablen
Diskrete Zufallsvariablen
Stetige Zufallsvariablen
Beweis: über charakteristische Funktionen
(Fouriertransformationen der Dichte) oder über die
Faltungsformel (Stochastik-Vorlesung).
Normalverteilung (1)
Erwartungswert
Varianz
Normalverteilung (2)
129 / 169
Herunterladen