521.202 / SES.125 Parameterschätzung Verteilungen Torsten Mayer-Gürr Torsten Mayer-Gürr Varianz / Kovarianz Lineare Transformation y Bx c nx1 Zufallsvektor mx1 Zufallsvektor nx1 konstanter Vektor n x m konstante Koeffizientenmatrix Erwartungswert E{y} E{Bx c} BE{x} c Kovarianzmatrix Σ{y} Σ{Bx c} BΣ{x}BT Torsten Mayer-Gürr 12.01.2016 2 Normalverteilung Definition: Die Zufallsvariable X bezeichnet man als normalverteilt mit den Parametern 𝜇 und 𝜎 2 , abgekürzt geschrieben 𝑋~𝑁(𝜇, 𝜎 2 ), wenn ihre Dichte 𝑓(𝑥) gegeben ist durch 2 2 1 f ( x, , ) e ( x ) / 2 für x 2 Verteilungsfunktion: 1 F ( x) 2 x ( t ) e 2 / 2 2 dt Erwartungswert: E{ X } x f ( x) dx Varianz: E{( X ) } ( x ) 2 f ( x) dx 2 2 Torsten Mayer-Gürr 12.01.2016 3 Multivariate Normalverteilung Torsten Mayer-Gürr Zweidimensionale Zufallsverteilung Zweidimensionale stetige Zufallsvariable x y F ( x, y ) f ( x' , y' ) dx' dy' Wahrscheinlichkeit (Verteilungsfunktion) P ( X x, Y y ) F ( x, y ) Dichtefunktion f ( x, y ) 0 Pail f ( x, y) dy dx 1 Satz: Zwei Zufallsvariablen sind genau dann voneinander unabhängig, falls gilt f ( x, y ) f x ( x ) f y ( y ) Torsten Mayer-Gürr 12.01.2016 5 Zweidimensionale Normalverteilung Definition: Die Zufallsvariable X bezeichnet man als normalverteilt mit den Parametern 𝜇 und 𝜎 2 , abgekürzt geschrieben 𝑋~𝑁(𝜇, 𝜎 2 ), wenn ihre Dichte 𝑓(𝑥) 1 f ( x, , ) e ( x ) 2 2 / 2 2 für x Zweidimensionale Zufallsvariable mit unabhängigen Elementen x x y x μ y x2 0 Σ 2 0 y f ( x, μ , Σ ) f ( x , x , x ) f ( y , y , y ) Torsten Mayer-Gürr 12.01.2016 6 Zweidimensionale Normalverteilung Multivariate Normalverteilung, wenn x und y unabhängig sind: f ( x, μ , Σ ) f ( x , x , x ) f ( y , y , y ) ( y y )2 ( x x )2 1 exp exp 2 2 x 2 2 x y 2 2 y ( x x )2 ( y y )2 1 exp 2 2 2 2 x 2 y 2 x y 1 ( x )2 ( y y )2 1 x exp 2 2 2 2 x 2 x y y 1 T 2 x 1 / 0 x x 1 1 x x exp 2 2 2 y y 0 1 / y y y 2 x y 1 T 1 exp ( x μ ) Σ ( x μ ) 2 2 2 x y 1 Torsten Mayer-Gürr 12.01.2016 7 Zweidimensionale Normalverteilung Multivariate Normalverteilung, wenn x und y unabhängig sind: f ( x, μ , Σ ) f ( x , x , x ) f ( y , y , y ) 1 T 1 exp ( x μ ) Σ ( x μ ) 2 2 2 x y 1 x y x2 y2 Durch Drehung des Koordinatensystems lässt sich jede symmetrische Matrix auf Diagonalgestalt bringen (Eigenwertzerlegung) Produkt der Eigenwerte x2 y2 det Σ Torsten Mayer-Gürr 12.01.2016 8 Multidimensionale Normalverteilung Definition: Den n x 1 Zufallsvektor x bezeichnet man als normalverteilt mit den Parametern 𝝁 und 𝚺, abgekürzt geschrieben 𝒙~𝑁(𝝁, 𝚺), wenn seine Dichte 𝑓 𝒙 gegeben ist durch f ( x, μ , Σ ) 1 2 n 1 exp (x μ)T Σ 1 (x μ) 2 det Σ Pail Torsten Mayer-Gürr 10.12.2014 9 Maximum Likelihood Schätzung (Tafel) Torsten Mayer-Gürr Verteilungen Torsten Mayer-Gürr Normalverteilung Definition: Die Zufallsvariable X bezeichnet man als normalverteilt mit den Parametern 𝜇 und 𝜎 2 , abgekürzt geschrieben 𝑋~𝑁(𝜇, 𝜎 2 ), wenn ihre Dichte 𝑓(𝑥) gegeben ist durch 2 2 1 f ( x, , ) e ( x ) / 2 für x 2 Verteilungsfunktion: 1 F ( x) 2 x ( t ) e 2 / 2 2 dt Erwartungswert: E{ X } x f ( x) dx Varianz: E{( X ) } ( x ) 2 f ( x) dx 2 2 Torsten Mayer-Gürr 12.01.2016 12 Normalverteilung Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 : X ~ N ( , ) (Wahrscheinlichkeits-) Dichte, probability density function (pdf) f N ( x, , ) Torsten Mayer-Gürr 12.01.2016 in MATLAB: normpdf(x, mu, sigma) 13 Normalverteilung Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 : X ~ N ( , ) (Wahrscheinlichkeits-) Dichte, probability density function (pdf) f N ( x, , ) Verteilungsfunktion, cummulative density function (cdf) FN ( x, , ) x f N in MATLAB: normpdf(x, mu, sigma) in MATLAB: normcdf(x, mu, sigma) (t , , ) dt Wahrscheinlichkeit x P( X x) F ( x) f (t ) dt b P(a X b) F (b) F (a ) f (t ) dt a Torsten Mayer-Gürr 12.01.2016 14 Normalverteilung Eine Zufallsvariable X sei normalverteilt mit den Parametern 𝜇 und 𝜎 2 : X ~ N ( , ) (Wahrscheinlichkeits-) Dichte, probability density function (pdf) f N ( x, , ) Verteilungsfunktion, cummulative density function (cdf) FN ( x, , ) x f N (t , , ) dt in MATLAB: normpdf(x, mu, sigma) in MATLAB: normcdf(x, mu, sigma) Inverse Verteilungsfunktion Gegeben Wahrscheinlichkeit P(X < x) = α, gesucht Grenze x in MATLAB: norminv(alpha, mu, sigma) FN1 ( , , ) x Torsten Mayer-Gürr 12.01.2016 15 Konfindenzintervalle Torsten Mayer-Gürr 12.01.2016 16 Normalverteilung Die Größe T ist standardisiert normalverteilt: TN xˆ x xˆ ~ N (0,1) Konfidenzintervall für die Größe T: : geschätzter/gemessener Wert x̂ x E (xˆ ) : Erwartungswert : bekannte Standardabw. x̂ α=5% Pklow TN kup 1 klow FN1 ( 2 ,0,1) kup FN1 (1 2 ,0,1) 2,5% Konfidenzintervall für den Erwartungswert 95% 2,5% Pklow x kup 1 klow klow xˆ xˆ FN1 ( 2 ,0,1) TN kup kup xˆ xˆ FN1 (1 2 ,0,1) Torsten Mayer-Gürr 12.01.2016 17 Transformation von Verteilungen Torsten Mayer-Gürr Transformation von Verteilungen Zufallsvariable x mit der Dichte f (x) Verteilungsfunktion Substitution x P( X x) F ( x) f (t ) dt t h( y ) h( y ) f (h( y )) y P(Y y ) F ( y ) f (h(t )) dt dh( y ) dy dy dh( y ) dy dy dh(t ) dt dt Zufallsvariable y mit der Dichte Torsten Mayer-Gürr f ' ( y ) f (h( y )) dh dy mit 12.01.2016 x h( y ) 19 Chi-Quadrat Verteilung Torsten Mayer-Gürr 12.01.2016 20 Chi-Quadrat Verteilung Gegeben sind n normalverteilte Zufallsvariablen: X i ~ N (0,1) Die Quadratsumme ist Chi-Quadrat verteilt n2 X 12 X 22 X n2 Dichte x n / 21e x / 2 2 f ( ) ( x, n) 2 n / 2 (n / 2) 0 x0 x0 Gamma-Funktion ( s ) t s 1e t dt 0 in MATLAB: chi2pdf(x, n) chi2cdf(x, n) chi2inv(alpha, n) Torsten Mayer-Gürr Wikipedia 12.01.2016 21 Chi-Quadrat Verteilung Die Größe T ist Chi-Quadrat verteilt: Geschätzter Varianzfaktor: ˆ 2 T 2 (n m) 2 ~ 2 (n m) eˆ T P eˆ ˆ nm 2 Erwartungswert: E (ˆ 2 ) 2 Konfidenzintervall für die Größe T: P klow T 2 kup 1 klow F21 ( 2 , n m) kup F21 (1 2 , n m) Konfidenzintervall für den Varianzfaktor P klow 2 kup 1 klow (n m)ˆ 2 1 F 2 (1 2 , n m) (n m)ˆ 2 kup 1 F 2 ( 2 , n m) Torsten Mayer-Gürr 12.01.2016 22 Einseitig / Zweiseitig f (x) klow T 2 x up 95% 2,5% f (x) k 2 2,5% klow T 2 kup x klow T 2 k2up x 95% 5% T 2 Torsten Mayer-Gürr k x 12.01.2016 23 Chi-Quadrat Verteilung Die Größe T ist Chi-Quadrat verteilt: ˆ 2 T 2 (n m) 2 ~ 2 (n m) Konfidenzintervall für die Größe T: (zweiseitig) Konfidenzintervall für die Größe T: (einseitig) P klow T 2 kup 1 P T 2 k 1 klow F21 ( 2 , n m) k F21 (1 , n m) kup F21 (1 2 , n m) f (x) klow T 2 k 2 up 95% 2,5 % klow T 2 Torsten Mayer-Gürr x f (x) 95% 2,5 % kup k2up T 2 klow 5% T 2 x 12.01.2016 x k x 24 Student- oder t-Verteilung Torsten Mayer-Gürr 12.01.2016 25 Student- oder t-Verteilung Gegeben sind die Zufallsvariablen: X 2 ~ 2 ( n) Y ~ N (0,1) und Der Quotient ist t-verteilt Y Tn X 2 /n Dichte f ( t ) ( x, n ) ( ) x 1 n n ( n2 ) n 1 2 2 n 1 2 Gamma-Funktion ( s ) t s 1e t dt 0 in MATLAB: tpdf(x, n) tcdf(x, n) tinv(alpha, n) Torsten Mayer-Gürr Pail 12.01.2016 26 Student- oder t-verteilung Die Größe T ist t verteilt: Tt xˆ x ~ t ( n m) ˆ xˆ Konfidenzintervall für die Größe T: Pklow Tt kup 1 klow Ft 1 ( 2 , n m) kup Ft 1 (1 2 , n m) Konfidenzintervall für den Erwartungswert Pklow x kup 1 klow xˆ ˆ xˆ Ft 1 ( 2 , n m) kup xˆ ˆ xˆ Ft 1 (1 2 , n m) Torsten Mayer-Gürr 12.01.2016 27 Fisher- oder F-Verteilung Torsten Mayer-Gürr 12.01.2016 28 Fisher- oder F-Verteilung Gegeben sind die Zufallsvariablen: n U X i2 ~ 2 (n) 2 n X 1 ~ N (0,1) i 1 und Dichte m 2 n 2 ( m2 n2 ) x m 21 m n mn f ( F ) ( x, m, n) ( m2 )( n2 ) (mx n) 2 0 x0 x0 m V Yk2 ~ 2 (m) 2 m k 1 Yi ~ N (0,1) Der Quotient ist F-verteilt Fn ,m Vm2 / m 2 Un / n in MATLAB: fpdf(x, m, n) fcdf(x, m, n) finv(alpha, m, n) Torsten Mayer-Gürr Wikipedia 12.01.2016 29 Fisher- oder F-Verteilung Die Größe T ist F verteilt: Geschätzte Parameter: 1 ˆ 1{xˆ } (xˆ x) ~ F (mx , n m) TF (xˆ x)T Σ mx xˆ AT PA AT Pl 1 Geschätzte Residuen: eˆ l Axˆ Konfidenzellipse/Ellipsoid/Hyperellipse für die Größe T: PTF k 1 Geschätzter Varianzfaktor: eˆ T P eˆ ˆ nm 2 k FF1 (1 , mx , n m) Geschätzte Kovarianzmatrix: ˆ {xˆ } ˆ 2 AT PA 1 Σ Anzahl der verwendeten Parameter: mx Torsten Mayer-Gürr 12.01.2016 30