521.202 / SES.125
Parameterschätzung
Hypothesentests
Torsten Mayer-Gürr
Torsten Mayer-Gürr
Verteilungen
Torsten Mayer-Gürr
Normalverteilung
Definition: Die Zufallsvariable X bezeichnet man als normalverteilt mit den
Parametern 𝜇 und 𝜎 2 , abgekürzt geschrieben 𝑋~𝑁(𝜇, 𝜎 2 ), wenn ihre Dichte 𝑓(𝑥)
gegeben ist durch
2
2
1
f ( x, , )
e ( x ) / 2 für x
2
Verteilungsfunktion:
1
F ( x)
2
x
( t )
e
2
/ 2 2
dt
Erwartungswert:
E{ X } x f ( x) dx
Varianz:
E{( X ) } ( x ) 2 f ( x) dx 2
2
Torsten Mayer-Gürr
13.01.2016
3
Normalverteilung
Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 :
X ~ N ( , )
(Wahrscheinlichkeits-) Dichte, probability density function (pdf)
f N ( x, , )
Torsten Mayer-Gürr
13.01.2016
in MATLAB:
normpdf(x, mu, sigma)
4
Normalverteilung
Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 :
X ~ N ( , )
(Wahrscheinlichkeits-) Dichte, probability density function (pdf)
f N ( x, , )
Verteilungsfunktion, cummulative density function (cdf)
FN ( x, , )
x
f
N
in MATLAB:
normpdf(x, mu, sigma)
in MATLAB:
normcdf(x, mu, sigma)
(t , , ) dt
Wahrscheinlichkeit
x
P( X x) F ( x)
f (t ) dt
b
P(a X b) F (b) F (a ) f (t ) dt
a
Torsten Mayer-Gürr
13.01.2016
5
Normalverteilung
Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 :
X ~ N ( , )
(Wahrscheinlichkeits-) Dichte, probability density function (pdf)
f N ( x, , )
Verteilungsfunktion, cummulative density function (cdf)
FN ( x, , )
x
f
N
(t , , ) dt
in MATLAB:
normpdf(x, mu, sigma)
in MATLAB:
normcdf(x, mu, sigma)
Inverse Verteilungsfunktion
Gegeben Wahrscheinlichkeit P(X < x) = α, gesucht Grenze x
in MATLAB:
norminv(alpha, mu, sigma)
FN1 ( , , ) x
Torsten Mayer-Gürr
13.01.2016
6
Konfindenzintervalle
Torsten Mayer-Gürr
13.01.2016
7
Normalverteilung
Die Größe T ist standardisiert normalverteilt:
TN
xˆ x
xˆ
~ N (0,1)
Konfidenzintervall für die Größe T:
: geschätzter/gemessener Wert
x̂
x E (xˆ ) : Erwartungswert
: bekannte Standardabw.
x̂
α=5%
Pklow TN kup 1
klow FN1 ( 2 ,0,1)
kup FN1 (1 2 ,0,1)
2,5%
Konfidenzintervall für den Erwartungswert
95%
2,5%
Pklow x kup 1
klow
klow xˆ xˆ FN1 ( 2 ,0,1)
TN
kup
kup xˆ xˆ FN1 (1 2 ,0,1)
Torsten Mayer-Gürr
13.01.2016
8
Transformation von
Verteilungen
Torsten Mayer-Gürr
Transformation von Verteilungen
Zufallsvariable
x
mit der Dichte
f (x)
Verteilungsfunktion
Substitution
x
P( X x) F ( x)
f (t ) dt
t h( y )
h( y )
f (h( y ))
y
P(Y y ) F ( y )
f (h(t ))
dt dh( y )
dy
dy
dh( y )
dy
dy
dh(t )
dt
dt
Zufallsvariable
y
mit der Dichte
Torsten Mayer-Gürr
f ' ( y ) f (h( y ))
dh
dy
mit
13.01.2016
x h( y )
10
Chi-Quadrat Verteilung
Torsten Mayer-Gürr
13.01.2016
11
Chi-Quadrat Verteilung
Gegeben sind n normalverteilte Zufallsvariablen:
X i ~ N (0,1)
Die Quadratsumme ist Chi-Quadrat verteilt
n2 X 12 X 22 X n2
Dichte
x n / 21e x / 2
2
f ( ) ( x, n) 2 n / 2 (n / 2)
0
x0
x0
Gamma-Funktion
( s ) t s 1e t dt
0
in MATLAB:
chi2pdf(x, n)
chi2cdf(x, n)
chi2inv(alpha, n)
Torsten Mayer-Gürr
Wikipedia
13.01.2016
12
Chi-Quadrat Verteilung
Die Größe T ist Chi-Quadrat verteilt:
Geschätzter Varianzfaktor:
ˆ 2
T 2 (n m) 2 ~ 2 (n m)
eˆ T P eˆ
ˆ
nm
2
Erwartungswert:
E (ˆ 2 ) 2
Konfidenzintervall für die Größe T:
P klow T 2 kup 1
klow F21 ( 2 , n m)
kup F21 (1 2 , n m)
Konfidenzintervall für den Varianzfaktor
P klow 2 kup 1
klow
(n m)ˆ 2
1
F 2 (1 2 , n m)
(n m)ˆ 2
kup 1
F 2 ( 2 , n m)
Torsten Mayer-Gürr
13.01.2016
13
Einseitig / Zweiseitig
f (x)
klow
T 2
x
up
95%
2,5%
f (x)
k 2
2,5%
klow
T 2
kup
x
klow
T 2
k2up
x
95%
5%
T 2
Torsten Mayer-Gürr
k
x
13.01.2016
14
Chi-Quadrat Verteilung
Die Größe T ist Chi-Quadrat verteilt:
ˆ 2
T 2 (n m) 2 ~ 2 (n m)
Konfidenzintervall für die Größe T:
(zweiseitig)
Konfidenzintervall für die Größe T:
(einseitig)
P klow T 2 kup 1
P T 2 k 1
klow F21 ( 2 , n m)
k F21 (1 , n m)
kup F21 (1 2 , n m)
f (x)
klow
T 2
k 2
up
95%
2,5
%
klow
T 2
Torsten Mayer-Gürr
x
f (x)
95%
2,5
%
kup
k2up
T 2
klow
5%
T 2
x
13.01.2016
x
k
x
15
Student- oder t-Verteilung
Torsten Mayer-Gürr
13.01.2016
16
Student- oder t-Verteilung
Gegeben sind die Zufallsvariablen:
X 2 ~ 2 ( n)
Y ~ N (0,1) und
Der Quotient ist t-verteilt
Y
Tn
X 2 /n
Dichte
f (t ) ( x, n)
( ) x
1
n
n ( n2 )
n1
2
2
n1
2
Gamma-Funktion
( s ) t s 1e t dt
0
in MATLAB:
tpdf(x, n)
tcdf(x, n)
tinv(alpha, n)
Torsten Mayer-Gürr
Pail
13.01.2016
17
Student- oder t-verteilung
Die Größe T ist t verteilt:
Tt
xˆ x
~ t ( n m)
ˆ xˆ
Konfidenzintervall für die Größe T:
Pklow Tt kup 1
klow Ft 1 ( 2 , n m)
kup Ft 1 (1 2 , n m)
Konfidenzintervall für den Erwartungswert
Pklow x kup 1
klow xˆ ˆ xˆ Ft 1 ( 2 , n m)
kup xˆ ˆ xˆ Ft 1 (1 2 , n m)
Torsten Mayer-Gürr
13.01.2016
18
Fisher- oder F-Verteilung
Torsten Mayer-Gürr
13.01.2016
19
Fisher- oder F-Verteilung
Gegeben sind die Zufallsvariablen:
n
U X i ~ ( n)
2
n
2
2
X 1 ~ N (0,1)
i 1
und
Dichte
m 2 n 2 ( m2 n2 )
x m 21
m n
mn
f ( F ) ( x, m, n)
( m2 )( n2 ) (mx n) 2
0
x0
x0
m
V Yk2 ~ 2 (m)
2
m
k 1
Yi ~ N (0,1)
Der Quotient ist F-verteilt
Fn ,m
Vm2 / m
2
Un / n
in MATLAB:
fpdf(x, m, n)
fcdf(x, m, n)
finv(alpha, m, n)
Torsten Mayer-Gürr
Wikipedia
13.01.2016
20
Fisher- oder F-Verteilung
Die Größe T ist F verteilt:
Geschätzte Parameter:
1
ˆ 1{xˆ } (xˆ x) ~ F (mx , n m)
TF
(xˆ x)T Σ
mx
xˆ A T PA A T Pl
1
Geschätzte Residuen:
eˆ l Axˆ
Konfidenzellipse/Ellipsoid/Hyperellipse für die Größe T:
PTF k 1
Geschätzter Varianzfaktor:
eˆ T P eˆ
ˆ
nm
2
k FF1 (1 , mx , n m)
Geschätzte Kovarianzmatrix:
ˆ {xˆ } ˆ 2 A T PA 1
Σ
Anzahl der verwendeten
Parameter: mx
Torsten Mayer-Gürr
13.01.2016
21
Hypothesentests
Torsten Mayer-Gürr
Änderung des mittleren Meeresspiegels
Torsten Mayer-Gürr
13.01.2016
23
Hypothesentest
Allgemeines Schema:
1.) Aufstellen der Hypothese
a) Hypothese H0: x x0
gegen H1: x x0
b) Hypothese H0: x x0
gegen H1: x x0
c) Hypothese H0: x x0
gegen H1: x x0
(zweiseitig)
(einseitig)
(einseitig)
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%,
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
T
4.) Konfidenzintervall, falls H0 wahr:
1
1
a) PF ( 2 ) T F (1 2 ) 1
=> Die Hypothese wird abgelehnt,
falls T außerhalb des Intervalls liegt.
b) PT F (1 ) 1
1
1
c) PF ( ) T 1
Torsten Mayer-Gürr
13.01.2016
24
Hypothesentest
Allgemeines Schema:
1.) Aufstellen der Hypothese
a) Hypothese H0: x x0
gegen H1: x x0
b) Hypothese H0: x x0
gegen H1: x x0
c) Hypothese H0: x x0
gegen H1: x x0
(zweiseitig)
(einseitig)
(einseitig)
5%, oder 10%,
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, α=5%
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
T
2,5%
95%
2,5%
4.) Konfidenzintervall, falls H0 wahr:
1
1
a) PF ( 2 ) T F (1 2 ) 1
=> Die Hypothese wird abgelehnt,
kup liegt.
falls Tklow
außerhalb
T des Intervalls
b) PT F (1 ) 1
1
c) PF ( ) T 1
N
1
Torsten Mayer-Gürr
13.01.2016
25
Hypothesentest (Normalverteilung)
Entspricht ein gemessener/geschätzter Wert x̂ einem vorgegebenen Wert x0 ,
bei bekannter Standardabweichung x̂ ?
1.) Aufstellen der Hypothese
a) Hypothese H0: x x0
gegen H1: x x0
b) Hypothese H0: x x0
gegen H1: x x0
c) Hypothese H0: x x0
gegen H1: x x0
(zweiseitig)
(einseitig)
(einseitig)
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%,
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
xˆ x0
TN
~ N (0, 1)
xˆ
4.) Konfidenzintervall, falls H0 wahr:
a) P FN1 ( 2 , 0, 1) TN FN1 (1 2 , 0, 1) 1
=> Die Hypothese wird abgelehnt,
falls T außerhalb des Intervalls liegt.
b) P TN F (1 , 0, 1) 1
1
N
1
c) P FN ( , 0, 1) TN 1
Torsten Mayer-Gürr
13.01.2016
26
Hypothesentest (t-Test)
Entspricht ein gemessener/geschätzter Wert x̂ einem vorgegebenen Wert x0 ,
bei geschätzter Standardabweichung ˆ x̂?
1.) Aufstellen der Hypothese
a) Hypothese H0: x x0
gegen H1: x x0
b) Hypothese H0: x x0
gegen H1: x x0
c) Hypothese H0: x x0
gegen H1: x x0
(zweiseitig)
(einseitig)
(einseitig)
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%,
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
xˆ x
Tt
~ t (n m)
ˆ xˆ
4.) Konfidenzintervall, falls H0 wahr:
a) P Ft 1 ( 2 , n m) Tt Ft 1 (1 2 , n m) 1
b) P Tt Ft (1 , n m) 1
1
=> Die Hypothese wird abgelehnt,
falls T außerhalb des Intervalls liegt.
1
c) P Ft ( , n m) Tt 1
Torsten Mayer-Gürr
13.01.2016
27
Hypothesentest (F-Test)
Entspricht ein geschätzter Vektor x̂ der Größe (mx 1) einem vorgegebenen Vektor x 0 ,
ˆ (xˆ ) (aus Gauß-Markoff Modell mit der Redundanz n-m)?
bei geschätzter Kovarianzmatrix Σ
1.) Aufstellen der Hypothese
Hypothese H0: x x 0 0 gegen H1: x x 0 0
(einseitig)
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%,
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
1
ˆ 1 (xˆ ) (xˆ x 0 ) ~ F (mx , n m)
TF
(xˆ x 0 )T Σ
mx
4.) Konfidenzintervall, falls H0 wahr:
P TF FF1 (1 , mx , n m) 1
Torsten Mayer-Gürr
=> Die Hypothese wird abgelehnt,
falls T außerhalb des Intervalls liegt.
13.01.2016
28
Hypothesentest (Chi-Qudrat-Test)
Entspricht eine geschätzte Standardabweichungˆ einer vorgegebenen Standardabweichung 0 ?
1.) Aufstellen der Hypothese
a) Hypothese H0: 0
gegen H1: 0 (zweiseitig)
b) Hypothese H0: 0
gegen H1: 0 (einseitig)
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%,
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
ˆ 2
T 2 (n m) 2 ~ 2 (n m)
0
4.) Konfidenzintervall, falls H0 wahr:
b) P T
1
1
a) P F 2 ( 2 , n m) T 2 F 2 (1 2 , n m) 1
2
F 2 (1 , n m) 1
1
Torsten Mayer-Gürr
13.01.2016
=> Die Hypothese wird abgelehnt,
falls T außerhalb des Intervalls liegt.
29
Hypothesentest (F-Test)
Entspricht eine geschätzte Standardabweichung ˆ1
einer anderen geschätzten Standardabweichung ˆ 2?
1.) Aufstellen der Hypothese
a) Hypothese H0: 1 2
gegen H1: 1 2 (zweiseitig)
b) Hypothese H0: 1 2
gegen H1: 1 2 (einseitig)
c) Hypothese H0: 1 2
gegen H1: 1 2 (einseitig)
2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%,
(Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt)
3.) Testgröße T berechnen
ˆ12
TF 2 ~ F (n1 m1 , n2 m2 )
ˆ 2
4.) Konfidenzintervall, falls H0 wahr:
1
1
a) P FF ( 2 , n1 m1 , n2 m2 ) TF FF (1 2 , n1 m1 , n2 m2 ) 1
1
b) P TF FF (1 , n1 m1 , n2 m2 ) 1
=> Die Hypothese wird abgelehnt,
falls T außerhalb des Intervalls liegt.
c) P F ( , n1 m1 , n2 m2 ) TF 1
1
F
Torsten Mayer-Gürr
13.01.2016
30