Kontinuierliche Gleichverteilung Kontinuierliche Verteilungen f(x) Verteilungskurve (Verteilungsdichtefunktion): für a ≤ x ≤ b ⎧ 1 f ( x) = ⎨ b − a ⎩ 0 sonst f(x) statt P(x) ! Wahrscheinlichkeitsverteilung Verteilungsdichtefunktion a 1 b−a a f(x) α β b x Erwartungswert und Varianz der kontinuierlichen Verteilungen Ähnliche Definitionen als bei diskrete Verteilungen, aber statt Summierung muss man integrieren: μ = ∫ x f ( x)dx −∞ ∞ σ = ∫ ( x − μ ) 2 f ( x)dx 2 Kummulative Verteilungsfunktion x p(α≤x≤β) ∞ Kummulative Wahrscheinlichkeitsvert. b f(x) Wahrscheinlichkeit entspricht die Fläche! Die Gesamtfläche unter der Kurve = 1 Vergleich der diskreten und kontinuierlichen Verteilungen mit dem Beispiel der Gleichverteilung 1 b−a −∞ Erwartungswert und Streuung der kont. Gleichverteilung Erwartungswert: Streuung: μ= a+b 2 σ= b−a 12 Kontinuierliche Verteilungen: Normalverteilung (Gauss-Verteilung) Erwartungswert der Gleichverteilung: ∞ b b 1 1 1 ⎡ x2 ⎤ dx = xdx μ = ∫ x f ( x)dx = ∫ x = ⎢2⎥ = ∫ b a b a b a − − − ⎣ ⎦a −∞ a a b 1 b2 − a2 1 (b − a )(b + a ) b + a = = = b−a 2 b−a 2 2 Kontinuierliche Verteilungen: Normalverteilung Verteilungsfunktion: − 1 f ( x) = e σ 2π ( x−μ )2 2σ 2 Normalverteilung e− x σ x − 1 e σ 2π x μ 0 ( x−μ )2 2σ 2 − e ( x−μ )2 2σ 2 σ σ μ ≈1 ≈1 0 f(x) σ 2 ≈1 ≈1 Parameter der Normalverteilung: Erwartungswert: μ Streuung: σ Wendepunkte e−( x−μ ) 2 σ σ x μ x x μ Normalverteilung Normalverteilung f(x) f(x) P(α ≤ x ≤ β) P(μ−2σ ≤ x ≤μ+2σ)=95% f(x) x α β μ−2σ P(μ−σ ≤ x ≤μ+σ)=68% μ x μ+2σ f(x) P(μ−3σ ≤ x ≤μ+3σ)=99,7% μ−σ μ x μ+σ μ−3σ μ μ+3σ x Überblickstabelle Standard - Normalverteilung Diskrete Verteilungen 2 1 − x2 e 2π μ=0 1 1 σ=1 0 Transformation der Normalverteilungen zur Normalverteilung diskrete Gleich- Binomial- pk 1 n ⎛n⎞ k ⎜⎜ ⎟⎟ p ( 1 − p )n −k ⎝k ⎠ μ n +1 2 np λ 1 p σ2 n2 − 1 12 np(1 − p ) λ 1− p p2 Poisson- λk k! e −λ Geometrische P( k ) = q k −1 p Überblickstabelle Verteilung von Summe der Zufallsgrößen: Beispiel Kontinuierliche Verteilungen kontinuir. Gleich- f (x ) 1 , b−a a≤x≤b μ a+b 2 σ2 ( b − a )2 12 Standardnormal- Normal- 1 e σ 2π Wir werfen mit zwei Würfeln. Die Augenzahl von einem Würfel hat eine Gleichverteilung. Welche Verteilung hat die Summe der Augezahlen? Keine Gleichverteilung! − ( x − μ )2 1 e 2π 2σ 2 μ 1/ 6 1/ 6 1 2 3 4 5 6 Augenzahl P(Augenzahl) 0 1/ 6 σ2 P(Augenzahl) P(Augenzahl) −x2 2 1 1/ 36 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 Augenzahl Σ Augenzahl Hausaufgabe: Berechnen Sie die (theoretische) Streuung der obigen Verteilungen! (Siehe die Vorlesung der letzte Woche für die Definition!) Verteilung von Summe der Zufallsgrössen Verteilung von Summe der Zufallsgrössen x1 und x2 sind unabhängige Zufallsgrößen. Beide folgen eine Verteilung mit Erwartungswerte μ1 bzw. μ2 und Streuungen σ1 bzw. σ2. Welche Verteilung folgt die Summe: x = x1 + x2 ? f(x2) f( x1) μ1 x1 Die Normalverteilung, die Bionomialverteilung, und die PoissonVerteilung sind stabile Verteilungen. f( x ) μ2 Die Gleichverteilungen sind nicht stabil! σ σ2 σ1 Der Verteilungstyp ist stabil wenn die Summe von zwei unabhängigen Zufallsgrößen wieder eine Verteilung desselben Typs gibt. x2 μ x hat eine Verteilung mit Erwartungswert μ=μ1+μ2 und Varianz σ 2 = σ 12 + σ 22 Die Varianzen sind Additive, nicht die Streuungen!!! x Beispiel Verteilung der linearen Funktion einer Zufallsvariable x ist eine Zufallsvariable mit einem Erwartungswert von μ und theoretischen Streuung von σ. Sei y=2·x Welche Erwartungswert und theor. Streuung hat y? μy=2·μ σy=2·σ (Allgemein: wenn y=a·x, μy=a·μ, σy=a·σ) Sei z= x+3 Welche Erwartungswert und theor. Streuung hat z? σz=σ μz=μ+3 Hans spielt ein Brettspiel, wo er mit einem Würfel wirft. Nach dem Wurf bekommt er Spielgeld: 50-mal die Augenzahl. Wie viel Geld kann er durchschnittlich erwarten nach einem Wurf? (Wie viel ist der Erwartungswert des Geldes, was er nach einem Wurf bekommt?) Wie viel ist der Erwartungswert des Gewinnes, wenn Hans muss 200 Spielgeld für jede Würfe bezahlen? (Allgemein: wenn z=x+a, μz=μ+α, σz=σ) Sei: t=a·x+b dann μt=a·μ+b σt=a·σ Verteilung von Durchschnitt der Zufallsgrößen Verteilung des Durchschnittes x1 und x2 sind unabhängige Zufallsgrößen. Beide folgen eine Normalverteilung mit Erwartungswerte μ1 bzw. μ2 und Streuungen σ1 bzw. σ2. Welche Verteilung folgt der Durchschnitt x = (x1 + x2)/2 ? x hat eine Normalverteilung mit Erwartungswert μ=(μ1+μ2)/2 und Varianz σ 2 = (σ 12 + σ 22 ) / 4 (σ = σ 12 + σ 22 / 2) x1 und x2 sind unabhängige Zufallsgrößen. Beide folgen eine Normalverteilung mit derselben Erwartungswerte μ und Streuungen σ . Welche Verteilung folgt der Durchschnitt x = (x1 + x2)/2 ? Normalverteilung, mit den folgenden Parametern: Messwerte x1 , x2 Summe Durchschnitt Allgemein für n Messwerte x1+x2 x = (x1 + x2)/2 x = (x1 + …+xn)/n μ μ +μ=2μ μ μ σ2 σ2 +σ2 =2σ2 σ 2σ σ/ 2 σ/ n Zentraler Grenzwertsatz Die x1, x2,….xn unabhängige Zufallsgrößen alle derselben n Verteilung haben. Die Verteilung der Summe S n = ∑ xi eine i =1 Normalverteilung annähert wenn n→∞ . Statistische Schätzungen, In Worten: Die Verteilungsfunktionen der Summe konvergieren gegen eine Normalverteilung auch wenn die einzelne Zufallsgrößen keine Normalverteilung haben. Biologische Bedeutung: Wenn ein Parameter (zB Körperhöhe, Blutzuckerkonzentration, …) durch vielen (n →∞) anderen Faktoren (Zufallsgrößen) beeinflusst wird, dieser Parameter folgt eine Normalverteilung. Analytische Statistik Aufgabe der Schätztheorie Aus einer Stichprobe Schätzwerte für Population N = „unendlich” Theoretische Verteilung Erwartungswert Theoretische Streuung ¾ Wahrscheinlichkeiten ¾ Erwartungswert ¾ Streuung Stichprobe ¾ oder andere Parametern n = endlich einer Verteilung zu ermitteln. Typen der Schätzungen: Häufigkeitsverteilung Durchschnitt Standardabweichung • Punktschätzung • Intervallschätzung Punktschätzungen Punktschätzungen Wir wollen jetzt die Parameter einer Verteilung (μ,σ) aus den konkreten Werten x1,...xn einer Stichprobe „möglichst gut“ bestimmen, d.h. einen „Näherungswert“ errechnen. Der Parameter wird mit einem Wert geschätzt. Relative Häufigkeit ist ein Schätzwert für die Wahrscheinlichkeit Kriterien: Erwartungstreue (unverzerrt) Konsistenz Effizienz (wirksam) Exhaustivität (erschöpfend) Durchschnitt ist ein Schätzwert für den Erwartungswert Erwartungswert der Schätzwerte = zu schätzender Parameter n ↑ bessere Schätzung kleine Streuung berücksichtigt alle Informationen Standardabweichung ist ein Schätzwert für die Streuung Punktschätzungen sagen nichts über die Genauigkeit bzw. Sicherheit der Schätzung! Intervallschätzungen Intervallschätzungen Intervallschätzung oder Konfidenzschätzung gibt zu einer vorgewählten Sicherheitswahrscheinlichkeit γ, (Konfidenzniveau) ein Intervall (c1,c2) an, in dem der unbekannte Parameter (zB. μ oder σ) mit einer Wahrscheinlichkeit von mindestens γ liegt. Wie große γ soll gewählt werden? Wie große sind die Schaden bei einer falschen Schätzung? Sozialwissenschaft γ=0,9 Medizin γ=0,95 c1 c2 Zb.: Erwartungswert der Pulszahl ist bei 95% Konfidenzniveau: 74±6 1/Min Technik γ=0,99 x Einfluss der Streuung und des Stichprobenumfanges 27 α=1-γ Irrtumswahrscheinlichkeit 28 Verteilung von Durchschnitt der Zufallsgrössen Konfidenzintervall für den Erwartungswert x1 und x2 sind unabhängige Zufallsgrößen. Beide folgen eine Normalverteilung mit derselben Erwartungswerte μ und Streuungen σ . Welche Verteilung folgt der Durchschnitt x = (x1 + x2)/2 ? Normalverteilung, mit den folgenden Parametern: Messwerte Summe x1 , x2 x1+x2 μ +μ=2μ μ Zu Durchschnitt σ2 σ2 +σ2 σ 2σ rE rin ne r un g Allgemein für n Messwerte x = (x1 + x2)/2 x = (x1 + …+xn)/n μ μ f(x) μ−σ μ μ+σ f(x ) σ σ/ n μx = μ 29 Standardfehler σx = ≈=s x? Streuung n =2σ2 σ/ 2 x zB:Körperhöhe ≤σ x zB: durchschnittliche Körperhöhe in einem Studentengruppe von n Studenten 30