521.202 / SES.125 Parameterschätzung Hypothesentests Torsten Mayer-Gürr Torsten Mayer-Gürr Verteilungen Torsten Mayer-Gürr Normalverteilung Definition: Die Zufallsvariable X bezeichnet man als normalverteilt mit den Parametern 𝜇 und 𝜎 2 , abgekürzt geschrieben 𝑋~𝑁(𝜇, 𝜎 2 ), wenn ihre Dichte 𝑓(𝑥) gegeben ist durch 2 2 1 f ( x, , ) e ( x ) / 2 für x 2 Verteilungsfunktion: 1 F ( x) 2 x ( t ) e 2 / 2 2 dt Erwartungswert: E{ X } x f ( x) dx Varianz: E{( X ) } ( x ) 2 f ( x) dx 2 2 Torsten Mayer-Gürr 13.01.2016 3 Normalverteilung Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 : X ~ N ( , ) (Wahrscheinlichkeits-) Dichte, probability density function (pdf) f N ( x, , ) Torsten Mayer-Gürr 13.01.2016 in MATLAB: normpdf(x, mu, sigma) 4 Normalverteilung Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 : X ~ N ( , ) (Wahrscheinlichkeits-) Dichte, probability density function (pdf) f N ( x, , ) Verteilungsfunktion, cummulative density function (cdf) FN ( x, , ) x f N in MATLAB: normpdf(x, mu, sigma) in MATLAB: normcdf(x, mu, sigma) (t , , ) dt Wahrscheinlichkeit x P( X x) F ( x) f (t ) dt b P(a X b) F (b) F (a ) f (t ) dt a Torsten Mayer-Gürr 13.01.2016 5 Normalverteilung Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 : X ~ N ( , ) (Wahrscheinlichkeits-) Dichte, probability density function (pdf) f N ( x, , ) Verteilungsfunktion, cummulative density function (cdf) FN ( x, , ) x f N (t , , ) dt in MATLAB: normpdf(x, mu, sigma) in MATLAB: normcdf(x, mu, sigma) Inverse Verteilungsfunktion Gegeben Wahrscheinlichkeit P(X < x) = α, gesucht Grenze x in MATLAB: norminv(alpha, mu, sigma) FN1 ( , , ) x Torsten Mayer-Gürr 13.01.2016 6 Konfindenzintervalle Torsten Mayer-Gürr 13.01.2016 7 Normalverteilung Die Größe T ist standardisiert normalverteilt: TN xˆ x xˆ ~ N (0,1) Konfidenzintervall für die Größe T: : geschätzter/gemessener Wert x̂ x E (xˆ ) : Erwartungswert : bekannte Standardabw. x̂ α=5% Pklow TN kup 1 klow FN1 ( 2 ,0,1) kup FN1 (1 2 ,0,1) 2,5% Konfidenzintervall für den Erwartungswert 95% 2,5% Pklow x kup 1 klow klow xˆ xˆ FN1 ( 2 ,0,1) TN kup kup xˆ xˆ FN1 (1 2 ,0,1) Torsten Mayer-Gürr 13.01.2016 8 Transformation von Verteilungen Torsten Mayer-Gürr Transformation von Verteilungen Zufallsvariable x mit der Dichte f (x) Verteilungsfunktion Substitution x P( X x) F ( x) f (t ) dt t h( y ) h( y ) f (h( y )) y P(Y y ) F ( y ) f (h(t )) dt dh( y ) dy dy dh( y ) dy dy dh(t ) dt dt Zufallsvariable y mit der Dichte Torsten Mayer-Gürr f ' ( y ) f (h( y )) dh dy mit 13.01.2016 x h( y ) 10 Chi-Quadrat Verteilung Torsten Mayer-Gürr 13.01.2016 11 Chi-Quadrat Verteilung Gegeben sind n normalverteilte Zufallsvariablen: X i ~ N (0,1) Die Quadratsumme ist Chi-Quadrat verteilt n2 X 12 X 22 X n2 Dichte x n / 21e x / 2 2 f ( ) ( x, n) 2 n / 2 (n / 2) 0 x0 x0 Gamma-Funktion ( s ) t s 1e t dt 0 in MATLAB: chi2pdf(x, n) chi2cdf(x, n) chi2inv(alpha, n) Torsten Mayer-Gürr Wikipedia 13.01.2016 12 Chi-Quadrat Verteilung Die Größe T ist Chi-Quadrat verteilt: Geschätzter Varianzfaktor: ˆ 2 T 2 (n m) 2 ~ 2 (n m) eˆ T P eˆ ˆ nm 2 Erwartungswert: E (ˆ 2 ) 2 Konfidenzintervall für die Größe T: P klow T 2 kup 1 klow F21 ( 2 , n m) kup F21 (1 2 , n m) Konfidenzintervall für den Varianzfaktor P klow 2 kup 1 klow (n m)ˆ 2 1 F 2 (1 2 , n m) (n m)ˆ 2 kup 1 F 2 ( 2 , n m) Torsten Mayer-Gürr 13.01.2016 13 Einseitig / Zweiseitig f (x) klow T 2 x up 95% 2,5% f (x) k 2 2,5% klow T 2 kup x klow T 2 k2up x 95% 5% T 2 Torsten Mayer-Gürr k x 13.01.2016 14 Chi-Quadrat Verteilung Die Größe T ist Chi-Quadrat verteilt: ˆ 2 T 2 (n m) 2 ~ 2 (n m) Konfidenzintervall für die Größe T: (zweiseitig) Konfidenzintervall für die Größe T: (einseitig) P klow T 2 kup 1 P T 2 k 1 klow F21 ( 2 , n m) k F21 (1 , n m) kup F21 (1 2 , n m) f (x) klow T 2 k 2 up 95% 2,5 % klow T 2 Torsten Mayer-Gürr x f (x) 95% 2,5 % kup k2up T 2 klow 5% T 2 x 13.01.2016 x k x 15 Student- oder t-Verteilung Torsten Mayer-Gürr 13.01.2016 16 Student- oder t-Verteilung Gegeben sind die Zufallsvariablen: X 2 ~ 2 ( n) Y ~ N (0,1) und Der Quotient ist t-verteilt Y Tn X 2 /n Dichte f (t ) ( x, n) ( ) x 1 n n ( n2 ) n1 2 2 n1 2 Gamma-Funktion ( s ) t s 1e t dt 0 in MATLAB: tpdf(x, n) tcdf(x, n) tinv(alpha, n) Torsten Mayer-Gürr Pail 13.01.2016 17 Student- oder t-verteilung Die Größe T ist t verteilt: Tt xˆ x ~ t ( n m) ˆ xˆ Konfidenzintervall für die Größe T: Pklow Tt kup 1 klow Ft 1 ( 2 , n m) kup Ft 1 (1 2 , n m) Konfidenzintervall für den Erwartungswert Pklow x kup 1 klow xˆ ˆ xˆ Ft 1 ( 2 , n m) kup xˆ ˆ xˆ Ft 1 (1 2 , n m) Torsten Mayer-Gürr 13.01.2016 18 Fisher- oder F-Verteilung Torsten Mayer-Gürr 13.01.2016 19 Fisher- oder F-Verteilung Gegeben sind die Zufallsvariablen: n U X i ~ ( n) 2 n 2 2 X 1 ~ N (0,1) i 1 und Dichte m 2 n 2 ( m2 n2 ) x m 21 m n mn f ( F ) ( x, m, n) ( m2 )( n2 ) (mx n) 2 0 x0 x0 m V Yk2 ~ 2 (m) 2 m k 1 Yi ~ N (0,1) Der Quotient ist F-verteilt Fn ,m Vm2 / m 2 Un / n in MATLAB: fpdf(x, m, n) fcdf(x, m, n) finv(alpha, m, n) Torsten Mayer-Gürr Wikipedia 13.01.2016 20 Fisher- oder F-Verteilung Die Größe T ist F verteilt: Geschätzte Parameter: 1 ˆ 1{xˆ } (xˆ x) ~ F (mx , n m) TF (xˆ x)T Σ mx xˆ A T PA A T Pl 1 Geschätzte Residuen: eˆ l Axˆ Konfidenzellipse/Ellipsoid/Hyperellipse für die Größe T: PTF k 1 Geschätzter Varianzfaktor: eˆ T P eˆ ˆ nm 2 k FF1 (1 , mx , n m) Geschätzte Kovarianzmatrix: ˆ {xˆ } ˆ 2 A T PA 1 Σ Anzahl der verwendeten Parameter: mx Torsten Mayer-Gürr 13.01.2016 21 Hypothesentests Torsten Mayer-Gürr Änderung des mittleren Meeresspiegels Torsten Mayer-Gürr 13.01.2016 23 Hypothesentest Allgemeines Schema: 1.) Aufstellen der Hypothese a) Hypothese H0: x x0 gegen H1: x x0 b) Hypothese H0: x x0 gegen H1: x x0 c) Hypothese H0: x x0 gegen H1: x x0 (zweiseitig) (einseitig) (einseitig) 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%, (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen T 4.) Konfidenzintervall, falls H0 wahr: 1 1 a) PF ( 2 ) T F (1 2 ) 1 => Die Hypothese wird abgelehnt, falls T außerhalb des Intervalls liegt. b) PT F (1 ) 1 1 1 c) PF ( ) T 1 Torsten Mayer-Gürr 13.01.2016 24 Hypothesentest Allgemeines Schema: 1.) Aufstellen der Hypothese a) Hypothese H0: x x0 gegen H1: x x0 b) Hypothese H0: x x0 gegen H1: x x0 c) Hypothese H0: x x0 gegen H1: x x0 (zweiseitig) (einseitig) (einseitig) 5%, oder 10%, 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, α=5% (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen T 2,5% 95% 2,5% 4.) Konfidenzintervall, falls H0 wahr: 1 1 a) PF ( 2 ) T F (1 2 ) 1 => Die Hypothese wird abgelehnt, kup liegt. falls Tklow außerhalb T des Intervalls b) PT F (1 ) 1 1 c) PF ( ) T 1 N 1 Torsten Mayer-Gürr 13.01.2016 25 Hypothesentest (Normalverteilung) Entspricht ein gemessener/geschätzter Wert x̂ einem vorgegebenen Wert x0 , bei bekannter Standardabweichung x̂ ? 1.) Aufstellen der Hypothese a) Hypothese H0: x x0 gegen H1: x x0 b) Hypothese H0: x x0 gegen H1: x x0 c) Hypothese H0: x x0 gegen H1: x x0 (zweiseitig) (einseitig) (einseitig) 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%, (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen xˆ x0 TN ~ N (0, 1) xˆ 4.) Konfidenzintervall, falls H0 wahr: a) P FN1 ( 2 , 0, 1) TN FN1 (1 2 , 0, 1) 1 => Die Hypothese wird abgelehnt, falls T außerhalb des Intervalls liegt. b) P TN F (1 , 0, 1) 1 1 N 1 c) P FN ( , 0, 1) TN 1 Torsten Mayer-Gürr 13.01.2016 26 Hypothesentest (t-Test) Entspricht ein gemessener/geschätzter Wert x̂ einem vorgegebenen Wert x0 , bei geschätzter Standardabweichung ˆ x̂? 1.) Aufstellen der Hypothese a) Hypothese H0: x x0 gegen H1: x x0 b) Hypothese H0: x x0 gegen H1: x x0 c) Hypothese H0: x x0 gegen H1: x x0 (zweiseitig) (einseitig) (einseitig) 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%, (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen xˆ x Tt ~ t (n m) ˆ xˆ 4.) Konfidenzintervall, falls H0 wahr: a) P Ft 1 ( 2 , n m) Tt Ft 1 (1 2 , n m) 1 b) P Tt Ft (1 , n m) 1 1 => Die Hypothese wird abgelehnt, falls T außerhalb des Intervalls liegt. 1 c) P Ft ( , n m) Tt 1 Torsten Mayer-Gürr 13.01.2016 27 Hypothesentest (F-Test) Entspricht ein geschätzter Vektor x̂ der Größe (mx 1) einem vorgegebenen Vektor x 0 , ˆ (xˆ ) (aus Gauß-Markoff Modell mit der Redundanz n-m)? bei geschätzter Kovarianzmatrix Σ 1.) Aufstellen der Hypothese Hypothese H0: x x 0 0 gegen H1: x x 0 0 (einseitig) 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%, (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen 1 ˆ 1 (xˆ ) (xˆ x 0 ) ~ F (mx , n m) TF (xˆ x 0 )T Σ mx 4.) Konfidenzintervall, falls H0 wahr: P TF FF1 (1 , mx , n m) 1 Torsten Mayer-Gürr => Die Hypothese wird abgelehnt, falls T außerhalb des Intervalls liegt. 13.01.2016 28 Hypothesentest (Chi-Qudrat-Test) Entspricht eine geschätzte Standardabweichungˆ einer vorgegebenen Standardabweichung 0 ? 1.) Aufstellen der Hypothese a) Hypothese H0: 0 gegen H1: 0 (zweiseitig) b) Hypothese H0: 0 gegen H1: 0 (einseitig) 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%, (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen ˆ 2 T 2 (n m) 2 ~ 2 (n m) 0 4.) Konfidenzintervall, falls H0 wahr: b) P T 1 1 a) P F 2 ( 2 , n m) T 2 F 2 (1 2 , n m) 1 2 F 2 (1 , n m) 1 1 Torsten Mayer-Gürr 13.01.2016 => Die Hypothese wird abgelehnt, falls T außerhalb des Intervalls liegt. 29 Hypothesentest (F-Test) Entspricht eine geschätzte Standardabweichung ˆ1 einer anderen geschätzten Standardabweichung ˆ 2? 1.) Aufstellen der Hypothese a) Hypothese H0: 1 2 gegen H1: 1 2 (zweiseitig) b) Hypothese H0: 1 2 gegen H1: 1 2 (einseitig) c) Hypothese H0: 1 2 gegen H1: 1 2 (einseitig) 2.) Festlegung der Irrtumswahrscheinlichkeit: 1%, 5%, oder 10%, (Wahrscheinlichkeit für einen Fehler 1. Art: H0 ist wahr, wird aber abgelehnt) 3.) Testgröße T berechnen ˆ12 TF 2 ~ F (n1 m1 , n2 m2 ) ˆ 2 4.) Konfidenzintervall, falls H0 wahr: 1 1 a) P FF ( 2 , n1 m1 , n2 m2 ) TF FF (1 2 , n1 m1 , n2 m2 ) 1 1 b) P TF FF (1 , n1 m1 , n2 m2 ) 1 => Die Hypothese wird abgelehnt, falls T außerhalb des Intervalls liegt. c) P F ( , n1 m1 , n2 m2 ) TF 1 1 F Torsten Mayer-Gürr 13.01.2016 30