Wahrscheinlichkeitsrechnung und Statistik 10. Vorlesung Wahrscheinlichkeitsrechnung und Statistik Statistik - Schätzfunktionen X ist eine ZG ,→ das untersuchte statistische Merkmal, welches von einem unbekannten Parameter θ abhängt x1 , . . . , xn ,→ statistische Daten (Beobachtungen, Stichprobenwerte) für das Merkmal X , die anhand einer Stichprobe erhalten wurden X1 , . . . , Xn sind Stichprobenvariablen ,→ sind unabhängige ZG mit derselben Verteilung wie X . g (X1 , . . . , Xn ) ,→ Schätzfunktion (ist eine ZG; ist eine Funktion die von den Stichprobenvariablen abhängt) Die Schätzfunktion g (X1 , . . . , Xn ) ist erwartungstreu für den unbekannten Parameter θ, wenn E (g (X1 , . . . , Xn )) = θ. Ein Schätzer ist dann erwartungstreu, wenn sein Erwartungswert gleich dem zu schätzenden Parameter ist. Wahrscheinlichkeitsrechnung und Statistik Die Schätzfunktion g (X1 , . . . , Xn ) ist asymptotisch erwartungstreu für den unbekannten Parameter θ, wenn lim E (g (X1 , . . . , Xn )) = θ. n→∞ Die Schätzfunktion g (X1 , . . . , Xn ) ist konsistent für den unbekannten Parameter θ, wenn f .s. g (X1 , . . . , Xn ) → θ. Wahrscheinlichkeitsrechnung und Statistik Beispiele I Stichprobenmittel (empirischer Mittelwert) X̄n = 1 (X1 + · · · + Xn ) n ist ein erwartungstreuer und konsistenter Schätzer für den Erwartungswert E (X ) des Merkmals X I Stichprobenvarianz (empirische Varianz) n S̃n2 1 X (Xk − X̄n )2 = n−1 k=1 ist ein erwartungstreuer und konsistenter Schätzer für die Varianz V (X ) des Merkmals X Wahrscheinlichkeitsrechnung und Statistik Übung: Ist n g (X1 , . . . , Xn ) = 1X (Xk − X̄n )2 n k=1 ein asymptotisch erwartungstreuer und konsistenter Schätzer für die Varianz V (X ) des Merkmals X ? Wahrscheinlichkeitsrechnung und Statistik I empirische Verteilungsfunktion F̂n : R × Ω → R F̂n (x) = #{i ∈ {1, ..., n} : Xi ≤ x} ,x ∈ R n ist eine ZG welche die Verteilungsfunktion F von X approximiert. Eigenschaften der empirischen Verteilungsfunktion Für alle x ∈ R gilt E (F̂n (x)) = F (x), V (F̂n (x)) = 1 F (x)(1 − F (x)), n f .s. F̂n (x) → F (x). ⇒ F̂n (x) ist ein erwartungstreuer und konsistenter Schätzer für F (x)! Wahrscheinlichkeitsrechnung und Statistik Seien g1 (X1 , . . . , Xn ) und g2 (X1 , . . . , Xn ) erwartungstreue Schätzfunktionen. g1 (X1 , . . . , Xn ) ist effizienter (wirksamer) als g2 (X1 , . . . , Xn ), wenn V (g1 ) < V (g2 ). Übung 1: X̄n oder X̄2n ist effizienter? Übung 2: Ist 1 g (X1 , . . . , Xn ) = (X1 + Xn ) erwartungstreu für θ = E (X )? 2 Ist dieser Schätzer effizienter als X̄n ? Wahrscheinlichkeitsrechnung und Statistik Verteilung von Stichprobenmittel und Stichprobenvarianz Welches ist die Verteilung des Stichprobenmittels X̄n und der Stichprobenvarianz S̃n2 bei normalverteilten Stichprobenvariablen X1 , . . . , Xn ∼ N (m, σ 2 )? Satz 21 Sind X1 , . . . , Xn ∼ N (m, σ 2 ) unabhängige ZG σ2 . ⇒ X̄n ∼ N m, n Satz 22 Sind X1 , . . . , Xn ∼ N (m, σ 2 ) unabhängige ZG ⇒ n−1 2 S̃ ∼ χ2 (n − 1). σ2 n Wahrscheinlichkeitsrechnung und Statistik Anwendung des Satzes 21: Sei n = 30; X1 , . . . , Xn ∼ N (6, 1) die Noten der Schüler einer Klasse in einem bestimmten Fach. Man simuliere in Matlab Werte von X̄n = die Mittelnote der Klasse in diesem Fach, bzw. von S̃n2 = die Stichprobenvarianz. Man approximiere in Matlab P(5 ≤ X̄n ≤ 6). Satz 21 ⇒ X̄n ∼ N 1 6, 30 ⇒ P(5 ≤ X̄n ≤ 6) ≈ FN(6, 1 ) (6)−FN(6, 1 ) (5). 30 30 in Matlab: n=30; x=normrnd(6,1,1,n); % Daten = Noten N (6, 1) m=mean(x); % Mittelwert;Stichprobenmittel sigma=var(x); % Stichprobenvarianz p=normcdf(6,6,sqrt(1/30))-normcdf(5,6,sqrt(1/30)) % p=P(5 ≤ X̄n ≤ 6) ⇒ p=0.5 ⇒ in 50% der Fälle ist die Mittelnote zwischen 5 und 6! Wahrscheinlichkeitsrechnung und Statistik Satz 23 Sind X1 , . . . , Xn ∼ N (m, σ 2 ) unabhängige ZG ⇒ X̄n und S̃n2 sind unabhängige ZG und X̄n − m S̃n √ n ∼ Student(n − 1). Student Verteilung : X ∼Student(n) hat die Dichtefunktion − n+1 2 Γ n+1 x2 2 1+ f (x) = √ ,x ∈ R n n nπΓ 2 in Matlab tpdf (x, n) berechnet den Wert der Dichtefunktion f (x) der Student(n) Verteilung Wahrscheinlichkeitsrechnung und Statistik