Statistik II für Betriebswirte Privat-Doz. Dr. H. Haase Inst. f. Math. u. Inf. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 28.04.2017 Vorlesung 3 28.04.2017 1 / 61 Übersicht 1 Erwartungstreue, Wirksamkeit und Konsistenz 2 Das Maximum-Likelihood-Prinzip 3 Bayessche Schätztheorie 4 Intervallschätzungen Kondenzintervalle für den Parameter p einer Binomialverteilung Kondenzintervalle für die Parameter einer Normalverteilung 5 Wiederholung zu Statistik I Lage- und Streumaÿe Boxplots Konzentrationsmaÿe Korrelation und lineare Regression Zeitreihenmodellierung Auswertung einer xls-Datei Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 2 / 61 Erwartungstreue Punktschätzungen Eine Schätzung Parameter Sγ = ϕ (X1 , . . . , Xn ; γ) heiÿt erwartungstreu für den γ ∈ Γ, wenn E Sγ = γ ist. ( X1 , . . . , Xn ) Umfang n. ist dabei eine feste mathematische Stichprobe vom Eine Folge von Schätzungen Sγ,n n∈N wird erwartungstreu für γ ∈ Γ genannt, wenn lim n→∞ asymptotisch E Sγ,n = γ gilt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 3 / 61 Beispiel für eine erwartungstreue Punktschätzung Beispiel: Stichprobenmittel Es ist 1 n X = ∑ Xk . n k= 1 Dann ergibt sich wegen der Linearität des Erwartungswertes E X = 1 n E (Xk ) , n k∑ = 1 wobei E (X ) = µ der Erwartungswert der Grundgesamtheit X ist. Da die X , . . . , Xn über die gleiche Verteilung wie X verfügen, muÿ im besonderen auch E (Xk ) = µ gelten, 1 somit ist Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) E X = 1 n Vorlesung 3 · n · µ = µ. 28.04.2017 4 / 61 Beispiel für eine nicht erwartungstreue Punktschätzung I Beispiel: mittlere quadratische Abweichung als kein erwartungstreuer Schätzer für die Varianz. Diese Abweichung ist S 2 = 1 n Xk − X n k∑ = 2 . 1 Vereinfachung der Summe: n ∑ Xk − X k= 2 = = n ∑ Xk − 2X ∑ Xk + nX 2 k= n 1 ∑ Xk − 2nX k= n 2 k= 1 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) n 2 2 + nX 2 1 = ∑ Xk − nX k= 2 2 . 1 Vorlesung 3 28.04.2017 5 / 61 Beispiel für eine nicht erwartungstreue Punktschätzung II Für X 2 erhalten wir 2 X = n 1 Xk n2 k∑ =1 n 1 = 2 n !2 2 ∑ Xk2 + n2 ∑ Xi Xj . i <j k =1 Nunmehr ist E (S2 ) = 1 n 1 n 2 E Xk2 − E X n k∑ =1 1 n 2 E Xk2 − 2 ∑ E Xk2 − 2 ∑ E (Xi Xj ) n k∑ n k =1 n i <j =1 2 n−1 n = 2 ∑ E Xk2 − 2 ∑ E (Xi Xj ) n k =1 n i <j = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 6 / 61 Beispiel für eine nicht erwartungstreue Punktschätzung III E (Xi Xj ) = E (Xi )E (Xj ) = (E (X ))2 für i , j = 1, . . . , j i 6= j sowie E Xk2 = E (X 2 ) für alle k = 1, . . . , n erhalten wir und wegen und n−1 2 n (n − 1 ) (E (X ))2 · n · E (X 2 ) − 2 · 2 n n 2 i n−1 n−1 h 2 2 = · V (X ). E (X ) − (E (X )) = n n E (S2 ) = Folglich ist S2 σ 2 = V (X ). nicht erwartungstreu hinsichtlich des Parameters Aber lim n→∞ S2,n n−1 · V (X ) n→∞ n n−1 = σ 2. = V (X ) · lim n→∞ n E (S2,n ) = lim ist somit zumindestens asymptotisch erwartungstreu. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 7 / 61 Ergänzungen IV Anstelle der Bezeichnung von erwartungstreu sagt man auch: unverzerrt, unverfälscht oder unbiased. Insbesondere bezeichnet man die Funktion b (γ) = Eγ (ϕ (X1 , . . . , Xn )) − γ als Bias des Schätzers ϕ (X1 , . . . , Xn ) für γ . Erwartungstreue Schätzungen sind durch b (ϕ (X1 , . . . , Xn ; γ)) = 0 für alle γ charakterisiert. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 8 / 61 Güte eines Schätzers Kriterium zur Beurteilung der Güte eines Schätzers oder Vergleich zweier Schätzer ist der mittlere quadratische Fehler: Ist S = ϕ (X 1 , . . . , Xn ) ein Schätzer für einen Parameter γ ∈ Γ, so ist der mittlere quadratische Fehler MSEγ (S ) = Eγ [S − γ] 2 Eγ [S − γ] = Eγ [S − E (S )] − 2 (S − E (S )) (E (S ) − γ) + [E (S ) − γ] Wegen 2 2 2 = Eγ [S − E (S )]2 + Eγ [E (S ) − γ]2 und da E [(S − E (S )) (E (S ) − γ)] = (E (S ) − γ) (E (S ) − E (S )) = 0 ist, MSEγ (S ) = Vγ (S ) + [b (γ)] Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 3 . 28.04.2017 9 / 61 Wirksamkeit einer Schätzung S1 wirksamer als S2 wird als genannt, wenn MSEγ (S1 ) ≤ MSEγ (S2 ) gilt. Für erwartungstreue Schätzer S 1 MSEγ (S 1 ) und und S2 für γ: S , wenn Vγ (S ) ≤ Vγ (S MSEγ (S ) entfällt. ist wirksamer als von S1 2 1 2 ) gilt, denn der Biasanteil 2 Die Bezeichnung wirksam ist damit plausibel, denn S 1 streut dann weniger stark. Eine erwartungstreue Schätzung S heiÿt wirksamste Schätzung für γ , MSEγ (S ) = Vγ (S ) minimal ist. Frage: Wie klein kann im Fall erwartungstreuer Schätzungen Vγ (S ) wenn werden ? (Antwort Kehrwert der Fischer-Information) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 10 / 61 Die Fischer-Information 1. Fall: X eine diskrete Grundgesamtheit (Wahrscheinlichkeitsgewichte pk ): I (γ) = n · ∑ 2. Fall: Grundgesamtheit I (γ) = n · X d ln pk dγ 2 pk stetig verteilt: Z∞ −∞ In beiden Fällen: ∂ ln f (t , γ) 2 · f (t , γ) dt ∂γ Informationsungleichung von Rao-Cramer: Vγ (S ) ≥ 1 I (γ) Also, kleiner als der Kehrwert der Fisher-Information kann die Varianz nicht werden!!!! Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 11 / 61 Beispiel für eine wirksamste Schätzung Stichprobenmittel, γ =p einer dichotomen Grundgesamtheit X= Es ist 1 n X Xk n k∑ =1 p0 (γ) = 1 − γ und p1 (γ) = γ . Dann folgt für die Ableitungen 1 d ln p1 (γ) 1 d ln p0 (γ) = und = dγ γ −1 dγ γ Fischer-Information # γ n .I (γ) = n 2 + γ 2 = γ (1 − γ) (1 − γ) " 1−γ Andererseits ist V X = V X = 1/I (γ), also ist X Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 n V (Xk ) = n2 k∑ =1 γ (1 − γ) n eine wirksamste Schätzung. Vorlesung 3 28.04.2017 12 / 61 Konsistente Punktschätzungen Denition: Sn ) eine Folge von Schätzungen für den Parameter γ . Sei( Wenn für jede Toleranzgrenze lim n→∞ so heiÿt die Schätzerfolge Beispiel: Folge Erwartungswert ε >0 und alle γ gilt: Pγ (|Sn − γ| ≥ ε) = 0, konsistent. X n n∈N µ von X . Folge konsistenter Schätzer für den Begründung: E X n = n ∑nk= E (Xk ) = µ . V X n = σn2 mit V (X ) = σ σ2 Tschebysche -Ungleichung: Pγ X n − µ ≥ ε ≤ nε 2 1 1 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 Vorlesung 3 →0 für n→∞ 28.04.2017 13 / 61 Das Maximum-Likelihood-Prinzip I Minimalforderungen an Parameterschätzer: Asymptotische Erwartungstreue Konsistenz Gibt es ein systematisches Verfahren zur Gewinnung eines solchen Schätzers? Sei X. (X1 , . . . , Xn ) eine mathematische Stichprobe der Grundgesamtheit X Zunächst folgende Annahme: Für (x1 , . . . , xn ) habe eine diskrete Verteilung eine konkrete Stichprobe (Verteilung von einem Parameter γ ∈Γ X hänge von ab) bilde: n L (γ) = ∏ Pγ (Xk = xk ) k= 1 Deutung von L (γ): Wahrscheinlichkeit, daÿ die mathematische Stichprobe konkrete Stichprobe (x1 , . . . , xn ) realisiert, wenn γ (X1 , . . . , Xn ) die der richtige Parameter ist. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 14 / 61 Das Maximum-Likelihood-Prinzip II Maximum-Likelihood-Prinzip: Wähle γML in Abhängigkeit von (x1 , . . . , xn ) so, daÿ L an der Stelle γML ein Maximum annimmt. Dann ist, wenn man (x1 , . . . , xn ) durch (X1 , . . . , Xn ) ersetzt, γML = γML ((X1 , . . . , Xn )) ML-Schätzung oder der ML-Schätzer für γ . Ist die Grundgesamtheit X stetig mit der Dichtefunktion f (x , γ) die verteilt, so taucht γ als Parameter in der Dichtefunktion auf. Man deniert die L-Funktion dann durch n L (γ) = ∏ f (xk , γ). k= 1 unmittelbare Deutung als Wahrscheinlichkeit jetzt nicht möglich. in beiden Fälle L-Funktionen von mehreren Parametern γ1 , γ2 , . . . , γm möglich Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 15 / 61 Das Maximum-Likelihood-Prinzip III Eigenschaften von ML-Schätzer: γ ((X , . . . , Xn )) ist asymptotisch erwartungstreu, (γ ((X , . . . , Xn )))n∈N ist konsistent, ML ML 1 1 Zusätzlich: γML ((X1 , . . . , Xn )) γML ((X1 , . . . , Xn )) MSEγ (γ ML für ist asymptotisch normalverteilt und ist asymptotisch am wirksamsten, d.h. ((X1 , . . . , Xn ))) − inf MSEγ (S (X1 , . . . , Xn )) → 0 S n → ∞. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 16 / 61 Das Maximum-Likelihood-Prinzip IV Beispiel: ML-Schätzer für den Erwartungswert µ und die Streuung einer mit diesen Parametern normalverteilten Grundgesamtheit Dann ist für konkrete Stichprobe f (x , µ, σ ) = ( x1 , · · · , xn ) 1 √ σ 2π ·e − vom Umfang n: X. σ (x −µ)2 2σ 2 . Dann lautet die L-Funktion L (µ, σ ) = n σ 1 √ n e −[∑ n k 2π Zur Bestimmung der Extremwertstellen =1 ( x k −µ )2 ]/2σ 2 . (µML , σML ) gehen wir zur logarithmischen L-Funktion über, d.h. L (µ, σ ) = −n ln σ − n ln √ 2π − 1 2 " n ∑ (xk − µ) k= # 2 · σ −2 . 1 beide Funktionen mit gleichen Extremwertstellen (Monotonie!!!) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 17 / 61 Das Maximum-Likelihood-Prinzip V Um diese zu bestimmen, bilden wir die partiellen Ableitungen nach und σ. Für µ µ erhalten wir aus n ∂L = ∑ (xk − µ) = 0 ∂µ k =1 zunächst µML = 1 n xk . n k∑ =1 Analog erhält man aus " # n ∂L n 2 = − + ∑ (xk − µ) · σ −3 = 0 ∂σ σ k =1 den ML-Wert s σML = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 2 ∑nk =1 (xk − µ) . n Vorlesung 3 28.04.2017 18 / 61 Das Maximum-Likelihood-Prinzip und das Taxiproblem I Stadt mit N Taxis, die mit 1 beginnend fortlaufend durchnummeriert sind. Mit Hilfe der beobachteten Nummern Stichprobe zusammengefaÿt sind, soll Annahme: x 1 x , . . . , xn , die zu einer konkreten N geschätzt werden. 1 ≤ x2 ≤ . . . ≤ xn Wahrscheinlichkeit für eine solche Stichprobe 1 N , n Begründung: alle Stichproben sind gleichberechtigt. Wert wird wegen xn ≤ N Also ist für S ML der ML-Schätzer für xn = N am gröÿten. = max {X1 , . . . , Xn } N. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 19 / 61 Das Maximum-Likelihood-Prinzip und das Taxiproblem II Schätzer mit systematischem Fehler: Die Lücke nach oben bleibt unberücksichtigt. Schätzung aus bekannten Lücken (wie?) SML die untere Lückenlänge hinzu, d.h. S2 = SML + min {X1 , . . . , Xn } − 1 Besser: Man fügt zu SML das Mittel aller Lücken hinzu, d.h. Man fügt zu X1 − 1 + X2 − X1 − 1 + . . . + Xn − Xn−1 − 1 n Xn − n = SML + n S3 = SML + und wegen der angenommenen Ordnung der S3 = X1 , . . . , Xn n+1 · max {X1 , . . . , Xn } − 1. n Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 20 / 61 Bayessche Schätztheorie I Diese Schätztheorie geht davon aus, daÿ die zu schätzenden Parameter zufällig sind. Dazu ist eine Anfangsverteilung für jeden zu schätzenden Parameter gegeben. Wie muÿ diese Anfangsverteilung geändert werden, wenn eine konkrete Stichprobe (x1 , . . . , xn ) vorliegt, so daÿ die Endverteilung für den Parameter γ am besten mit der Stichprobe übereinstimmt. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 21 / 61 Bayessche Schätztheorie II Angenommen γ ist diskret und P (γ = γm ) = qm beschreibt die Anfangsverteilung von γ. Wir bilden die aus dem letzten Abschnitt bekannte L-Funktion L (γm ) = Pγ (X1 = x1 , . . . , Xn = xn ). m L (γm ) ist die Wahrscheinlichkeit, dass nach Ziehen des Wertes γm für den Parameter γ die Stichprobe (x1 , . . . , xn ) realisiert wird. Die gesuchte Endverteilung des Parameters γ ist dann nach dem Bayesschen Satz: P (γ = γm |X1 = x1 , . . . , Xn = xn ) = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 qm L (γm ) ∑k qk L (γk ) 28.04.2017 22 / 61 Bayessche Schätztheorie III Hier gibt es zwei Möglichkeiten jetzt zu einem Bayes-Schätzer zu kommen: Man bestimmt γBayes als ein γm mit γBayes · L (γBayes ) = max qm L (γm ) . m Mit anderen Worten der Bayes-Schätzer ist der γ -Wert, wahrscheinlichste Ursache für das Ziehen der Stichprobe der die (x1 , . . . , xn ) ist. Diese Vorgehensweise ist nur im Fall einer diskreten Verteilung für γ möglich. oder man bestimmt γBayes als Erwartungswert bezüglich der Endverteilung, d.h. im diskreten Fall: γBayes = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) ∑m γm qm L (γm ) . ∑k qk L (γk ) Vorlesung 3 28.04.2017 23 / 61 Bayessche Schätztheorie IV Wir berechnen aus der Dichte h der Anfangsverteilung in Analogie zum Bayesschen Satz mit Hilfe der L-Funktion L (γ) = Pγ (X1 = x1 , . . . , Xn = xn ) die Dichte der Endverteilung, die von der Stichprobe abhängt, zu h (γ) L (γ) . f (γ|X1 , . . . , Xn ) = R +∞ −∞ h(t )L(t )dt Dann ist der zugehörige Bayes-Schätzer der Erwartungswert von γ bezüglich der Endverteilung bei stetiger Verteilung sh(s )L(s )ds . −∞ h(t )L(t )dt R +∞ γBayes = R−∞ +∞ Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 24 / 61 Bayessche Schätztheorie V Beispiel: Ist γ die unbekannte Fehlerquote einer Warengruppe: diese ist anfänglich als zwischen 0 und 1 gleichmäÿig verteilt angenommen. In einer Stichprobe vom Umfang n werden nun m < n Teile beanstandet. Es ist h(γ) = 1 für 0 ≤ γ ≤ 1 und sonst h(γ) = 0. Für die L-Funktion bekommen wir n m L (γ) = γ (1 − γ)n−m m Dann ist R 1 n m +1 s (1 − s )n−m ds γBayes = 0R 1 mn n−m m = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) dt 0 m t (1 − t ) R 1 m+1 n −m (1 − s ) ds 0s R1 n −m m dt 0 t (1 − t ) Vorlesung 3 28.04.2017 25 / 61 Bayessche Schätztheorie V Fortsetzung des Beispiels: Unter Benutzung der Hilfsformel Z 1 0 u a (1 − u )b du = a !b ! (a + b + 1)! folgt (nach einigen Kürzungen): γBayes = Wegen m = x1 + . . . + xn m+1 . n+2 erhalten wir die Darstellung SBayes (X1 , . . . , Xn ) = als Schätzer für (∑nk =1 Xk ) + 1 n+2 γ. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 26 / 61 Intervallschätzungen I γ sei ein unbekannter Parameter einer Grundgesamtheit Weiterhin sei ( X1 , . . . , Xn ) X. eine mathematische Stichprobe vom n und Su (X1 , . . . , Xn ), So (X1 , . . . , Xn ) zwei Statistiken. Umfang Das zufällige abgeschlossene Intervall [Su (X1 , . . . , Xn ) , So (X1 , . . . , Xn )] heiÿt ein Kondenzintervall zum Sicherheitsniveau β ∈ [0, 1], wenn P (γ ∈ [Su (X1 , . . . , Xn ) , So (X1 , . . . , Xn )]) ≥ β gilt. Im Gegensatz zu den Punktschätzungen ergibt sich jetzt ein Bereich , wo der Parameter mit einer bestimmten Sicherheit liegen könnte. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 27 / 61 Intervallschätzungen II Ein Ansatz zur Bestimmung eines Kondenzintervalls: Sn = X 1 + . . . + Xn ist Sp n − E (Sn ) V (Sn ) näherungsweise standardisiert normalverteilt. E (X ) = µ und V (X ) = σ folglich E (Sn ) = n µ und V (Sn ) = nσ 2 2 Sp n − E (Sn ) = X n − µ · √n. σ V (Sn ) Mit Φ für die Verteilungsfunktion der standardisierten Normalverteilung und reellem c >0 P −c ≤ Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Xn −µ σ · √ Vorlesung 3 n≤c ≈ 2Φ (c ) − 1. 28.04.2017 28 / 61 Intervallschätzungen III Bezeichnen wir mit Φ die Verteilungsfunktion der standardisierten c >0 Xn −µ √ P −c ≤ · n ≤ c ≈ 2Φ (c ) − 1. σ Normalverteilung, so gilt für alle reellen Hängt die Verteilung von X µ = µ (γ) Funktionen von und σ = σ (γ) nur von einem Parameter γ ab, so sind γ. Man muÿ dann also nur die Ungleichungskette −c ≤ nach γ X n − µ (γ) √ · n≤c σ (γ) aufzulösen. Die Lösungsmenge ist das gesuchte Kondenzintervall. Es ist natürlich auch möglich, daÿ einer der beiden Parameter σ µ oder entweder gegeben oder anderweitig geschätzt werden muÿ, um ein Kondenzintervall bestimmen zu können. Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 29 / 61 Kondenzintervall für eine unbekannte Wahrscheinlichkeit p I unbekannte Wahrscheinlichkeit Die Grundgesamtheit (X1 , . . . , Xn ) Dann ist µ = p Man bestimmt X σ 2 = p (1 − p ). jetzt c > 0 aus und 2Φ ( bzw. mit 0 p. ist dichotom (ja/nein), math. Stichprobe c) − 1 = 1 − α Φ (c ) = < α < 1, z.B. α 2 . α = 0.05 Einsetzen in die Ungleichungskette für p Xn −p √ · n≤c −c ≤ p p (1 − p ) gilt mit einer Mindestwahrscheinlichkeit von 1 − α Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 30 / 61 Kondenzintervall für eine unbekannte Wahrscheinlichkeit p II Lösungsmenge - Intervall Grenzen hängen von n, c und quadratische Gleichung in p Xn ab lösen X −p √ p n · n=c p (1 − p ) Lösungen - Grenzen des Kondenzintervalls. Wir erhalten aus 2 n X n − p = c 2 p (1 − p ) durch Ausmultiplizieren 2 nX n − 2npX n + np 2 = c 2 p − c 2 p 2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 31 / 61 Kondenzintervall für eine unbekannte Wahrscheinlichkeit p III Ordnen nach den Potenzen der Unbekannten n + c 2 p2 − 2 p 2 2 nX n + c p + nX n = 0. Dann ist Su,o (X1 , . . . , Xn ) = n im Vergleich zu c 1 n + c2 " nX n + c2 2 ±c r nX n 1− Xn + c2 4 # . eine sehr groÿe Zahl, also c2 c2 ≈ 0, n + c 2 ≈ n und ≈0 2 2 (n + c ) n vereinfachte Statistiken für die Grenzen s Su,o = X n ± c Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 Xn 1− n Xn . 28.04.2017 32 / 61 Kondenzintervall für eine unbekannte Wahrscheinlichkeit p IV Länge des Kondenzintervalls s lKondenz = 2c · Frage: Xn 1− n Xn . Wieviele Wahlberechtigte müssen von INFAS mindestens befragt werden, damit mit 95%-tiger Sicherheit die Vorhersage in einem 2%-tigen Kondenzintervall liegt ? Der Lösungsansatz lautet oenbar s c· 2 Wegen Φ (1, 96) ≈ 0, 975 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) ist Xn 1− n Xn ≤ 0, 02. c = 1, 96. Vorlesung 3 28.04.2017 33 / 61 Kondenzintervall für eine unbekannte Wahrscheinlichkeit p V Xn 0 unbekannt: Zwischenabschätzung notwendig ≤ Xn ≤ 1 (Ungleichung vom geometrischen und arithmetischen Mittel): Xn Wahl von n c n Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Xn ≤ √ ≤ 0, 02 Also 1− bzw. 1 4 . 1, 96 0, 02 2 ≤n n ≥ 9608 Vorlesung 3 28.04.2017 34 / 61 Kondenzschätzung für den Mittelwert bei Streung bekannt I X normalverteilte Grundgesamtheit, Grundgesamtheit, σ0 ( X1 , . . . , Xn ) Punktschätzung X= ist math. gegeben X n∑ i N (µ, σ02 /n)-verteilt folglich ist n 1 i =1 X −µ√ n σ0 standardisiert normalverteilt. Ist z1−α/2 das 1 − α/2-Quantil der Standarnormalverteilung, so gilt X − µ √ P n ≤ z1−α/2 = 1 − α σ0 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 35 / 61 Kondenzschätzung für den Mittelwert bei Streung bekannt II Auösen der Ungleichung nach µ X − µ √ n ≤ z1−α/2 σ0 ergibt als Kondenzintervall σ σ X − z1−α/2 · √0 , X + z1−α/2 · √0 n Bei Anwendung X durch x n ersetzen !!! Länge des Kondenzintervalls L = 2z1−α/2 · √0 n Vorgabe der Genauigkeit durch L, dann: 2 2z1−α/2 σ0 n≥ L Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) σ Vorlesung 3 28.04.2017 36 / 61 Beispiel Eine Eierstiege mit 64 Eiern hat ein Durchschnittsgewicht pro Ei von 62g mit einer Streuung von 2g. Dann ist das 95%-Kondenzintervall 62 − 1.96 · 2 8 , 62 + 1.96 · 2 8 = [61. 51, 62. 49] . Die Intervalllänge beträgt L = 62. 49 − 61. 51 = 0.98. Für die Genauigkeit 2 L = 0.5 wären bereits z1−α/2 σ0 L 2 = 2 · 1.96 · 2 0.5 2 = 245. 86 246 Eier erforderlich Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 37 / 61 Kondenzschätzung für den Mittelwert bei unbekannter Streuung I σ muÿ geschätzt werden Stichprobenvarianz als geeigneter Schätzer SX2 = X und SX2 1 n X −X n−1 ∑ i 2 i =1 unabhängig Ansatz für Kondenzschätzung X −µ√ n SX ist t -verteilt mit n − 1- Freiheitsgraden, also X − µ √ P n ≤ tn−1,1−α/2 = 1 − α SX Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 38 / 61 Kondenzschätzung für den Mittelwert bei unbekannter Streuung II bzw. S S P X − tn−1,1−α/2 · √X , X + tn−1,1−α/2 · √X = 1 − α n n d.h. S S X − tn−1,1−α/2 · √X , X + tn−1,1−α/2 · √X n n ist das gesuchte Kondenzintervall Anwendung: für X und SX Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) konkrete Vorlesung 3 x und sx einsetzen 28.04.2017 39 / 61 Beispielrechnung mit R Verwendung der lm-Funktion: x <- c(1, 2, 3) m <- lm(x ~ 1) confint(m) ## 2.5 % 97.5 % ## (Intercept) -0.4841 4.484 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 40 / 61 Kondenzschätzung für die Varianz bei unbekanntem Mittelwert I Punktschätzung SX2 = für 1 χ 2 -verteilt n σ 2 i∑ =1 n X −X n−1 ∑ i 2 i =1 σ2 Ansatzpunkt: ist 1 Xi − X 2 = (n − 1) SX2 σ2 n − 1 Freiheitsgraden. c1 und c2 mit (n − 1) SX2 α P < c 1 = 2 mit Bestimmung von 2 σ und P Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) (n − 1) SX2 > c2 σ2 Vorlesung 3 = α 2 , 28.04.2017 41 / 61 Kondenzschätzung für die Varianz bei unbekanntem Mittelwert II also Auösen nach (n − 1) SX2 P c1 ≤ ≤ c2 σ2 σ2 mit " c1 = cn−1,α/2 und = 1 − α. c2 = cn−1,1−α/2 2 2 ∑ni=1 (xi − x ) ∑ni=1 (xi − x ) , cn−1,1−α/2 cn−1,α/2 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 # 28.04.2017 42 / 61 Berechnung mit R Nachbauen mit R-Funktionen: z <- sd(x) * sd(x) * (length(x) - 1) left <- z/qchisq(0.975, length(x) - 1) right <- z/qchisq(0.025, length(x) - 1) c(left, right) ## [1] 0.2711 39.4979 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 43 / 61 Lage- und Streumaÿe Modalwert (häugster Wert) Quantile e xα = xi +1 x +x +1 i 2 Mittelwert xn = Quartilsabstand i < nα < i + 1 i = nα i x1 + . . . + xn n IQR = ex0.75 − ex0.25 empirische Streuung s s= n 1 (x − x )2 n∑ i n i =1 Standardabweichung s sd = Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 1 n (xi − x n )2 n − 1 i∑ =1 Vorlesung 3 28.04.2017 44 / 61 Momentenformeln x1 , . . . , xn gegeben MW oder 1. Moment xn = 2. Moment x1 + . . . + xn n 2 2 x + . . . + xn x 2n = 1 n empirische Streuung Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) s 2 = x 2n − (x n )2 Vorlesung 3 28.04.2017 45 / 61 Charakterisierung von Mittelwert und Median x1 , . . . , xn gegeben Mittelwert als Minimumsstelle von n f (x ) = ∑ (xi − x ) 2 i= 1 Median als Minimumsstelle von n g (x ) = ∑ |xi − x | i= 1 Problem der Eindeutigkeit beim Median Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 46 / 61 Boxplots Zuerst: x ,x x ∗ ∈ A mit x ∗ > ex / Bestimmung von Median und Quartile von Bestimmung der Ausreiÿer x x ∗ <e x1/4 − 2 IQR = min ({x1 , x2 , . . . , xn } \ A) 3 min 1 3 bzw. x max , . . . , xn 3 IQR + 4 2 2 oder und = max ({x1 , x2 , . . . , xn } \ A) Zeichne: den Kasten zwischen fette Linie bei e x1/2 Antennen bei x e x1/4 und e x3/4 beliebiger Breite parallel zu den beiden Breitseiten min und x max Ausreiÿer mittels kleiner Kreise markieren Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 47 / 61 Konzentrationsmaÿe x1 ≤ x2 ≤ . . . ≤ xn (!!!) (uk , vk ) k = 0, 1, . . . , n, un = vn = 1 Berechnung von Punkten u0 = 0 ,v0 = 0 sowie wobei und k ∑ x vk = in=1 i ∑i =1 xi k uk = n für k = 1, . . . , n. Auswertung mittels Lorenz-Kurve Gini-Koezient 1 G = 1 − (v0 + 2v1 + . . . + 2vn−1 + vn ) n Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 48 / 61 Korrelation und lineare Regression X mit den Ausprägungen x1 , . . . , xn y1 , . . . , yn bzw. Y mit den Ausprägungen Korrelation nach Pearson: xy − x · y q rPearson = q x 2 − (x )2 · y 2 − (y )2 Rangkorrelationskoezient nach Spearman Datenreihen ihre Rangzahlen zuordnen Paar (xi , yi ) habe das Rangpaar (Ri , Si ), Berechnung rSpearman = 1 − Rangdierenz di = Ri − Si n d2 i n (n2 − 1) 6 · ∑i =1 Gleichung der linearen Regression yb = y + Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) xy − x · y (x − x ) x 2 − (x )2 Vorlesung 3 28.04.2017 49 / 61 Zeitreihenmodelierung Komponentenmodell Bearbeitung mit Filtern: gleitende Durchschnitte Saisonkomponente Verfahren der Saisonbereinigung Entfernen des Saisoneinusses mit Filtern von Vielfachem der Saisonlänge (konstante Saisongur angenommen) Dierenz zur ursprünglichen Reihe: verrauschte Saisonreihe Schätzung der Saisonwerte (Mittlung über gleiche Zeitpunkte) Zentrieren (Erhalt der Saisongur) Subtraktion von Ausgangsreihe Ergebnis saisonbereinigte Zeitreihe Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 50 / 61 Datenanalyse mit R Zur Verfügung stehende Merkmale in auto.xls: 1 Haushaltsgrösse 2 Kinder 3 Jahreseinkommen 4 Preis 5 Gebraucht 6 PS 7 Grösse 8 Typ 9 Verbrauch Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 51 / 61 Analyse mit R I library(xlsReadWrite) ## ## ## ## ## ## ## ## ## xlsReadWrite version 1.5.4 (826aa0) Copyright (C) 2010 Hans-Peter Suter, Treetron, Switzerland. This package can be freely distributed and used for any purpose. It comes with ABSOLUTELY NO GUARANTEE at all. xlsReadWrite has been written in Pascal and contains binary code from a proprietary library. Our own code is free (GPL-2). Updates, issue tracker and more info at http://www.swissr.org. ad <- read.xls("Autos.xls", sheet = "Daten") names(ad) ## [1] "Haushaltsgrösse" "Kinder" ## [5] "Gebraucht" "PS" ## [9] "Verbrauch" Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 "Jahreseinkommen" "Preis" "Grösse" "Typ" 28.04.2017 52 / 61 Analyse mit R II Kinder ## Error: Objekt 'Kinder' nicht gefunden geht nur so (die ersten 10 Werte): ad$Kinder[1:10] ## [1] 1 0 6 0 0 0 0 2 1 0 oder man setzt gleich attach ein: attach(ad) PS[1:10] ## [1] 180 79 103 32 31 100 101 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) 66 230 277 Vorlesung 3 28.04.2017 53 / 61 Analyse mit R III Nur die ersten 5 Variablen mit head anzeigen: head(ad[, 1:5]) ## ## ## ## ## ## ## 1 2 3 4 5 6 Haushaltsgrösse Kinder Jahreseinkommen Preis Gebraucht 3 1 58680 25038 neu 3 0 41552 5274 gebraucht 8 6 66832 5269 gebraucht 1 0 24186 706 gebraucht 1 0 26630 7942 neu 1 0 29501 17782 neu summary(Typ) ## ## ## ## Campingmobil Kleintransporter 4 6 Sportwagen 10 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 Kombi 18 Limousine 34 28.04.2017 54 / 61 Analyse mit R IV bei nominalen Variablen wie Typ wird nur die Verteilungstabelle angezeigt. Ansonsten summary(Jahreseinkommen) ## ## Min. 1st Qu. 19400 33900 Median 46700 Mean 3rd Qu. Max. 46300 54100 101000 Man könnte aber auch gleich ad auf einen Schlag mit summary auswerten. Wenn man weiÿ, daÿ man nur die Verteilungstabelle haben will, so erreicht man dies mit: table(Typ) ## Typ ## Campingmobil Kleintransporter ## 4 6 ## Sportwagen ## 10 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 Kombi 18 Limousine 34 28.04.2017 55 / 61 Analyse mit R IV Einzelne Statistiken wie Mittelwert, Standardabweichung oder Korrelation: mean(Jahreseinkommen) ## [1] 46295 sd(Jahreseinkommen) ## [1] 16716 cor(PS, Jahreseinkommen) ## [1] 0.313 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 56 / 61 Analyse mit R V Einen Boxplot zeichnet man mit: 100 boxplot(Jahreseinkommen/1000, ylab = "in Tsd Euro") ● 60 40 20 in Tsd Euro 80 ● Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 57 / 61 Analyse mit R VI und nur die Daten, die zum Zeichnen benutzt werden: b <- boxplot(Jahreseinkommen/1000, plot = FALSE) names(b) ## [1] "stats" "n" "conf" "out" "group" "names" also b$stats ## ## ## ## ## ## [1,] [2,] [3,] [4,] [5,] [,1] 19.40 33.85 46.66 54.09 80.11 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 58 / 61 Analyse mit R VII und die Ausreiÿer: b$out ## [1] 92.65 101.07 ● ● 2e+04 4e+04 6e+04 8e+04 1e+05 boxplot(Jahreseinkommen ~ Gebraucht) Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) gebraucht Vorlesung 3 neu 28.04.2017 59 / 61 Analyse mit R VIII model <- lm(PS ~ Jahreseinkommen) names(model) ## ## ## [1] "coefficients" "residuals" [5] "fitted.values" "assign" [9] "xlevels" "call" "effects" "qr" "terms" "rank" "df.residual" "model" model$coefficients ## ## (Intercept) Jahreseinkommen 4.431e+01 9.807e-04 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) Vorlesung 3 28.04.2017 60 / 61 Analyse mit R IX plot(Jahreseinkommen, PS) abline(coef(model), col = "blue") ● 250 ● ● 150 100 50 PS 200 ● ● ● ● ● 2e+04 Privat-Doz. Dr. H. Haase (Inst. f. Math. u. Inf.) ● ● ●● ● ● ● ● ●● ● ● ●● ●● ●● ● ●●● ● ● ● ●● ●● ● ● ● ● ● ● ●●● ● ● ●● ● ● ● ● ● ● ● ●● ●● ● ● ●● ● 4e+04 6e+04 ●● ● ● 8e+04 1e+05 Jahreseinkommen Vorlesung 3 28.04.2017 61 / 61