Wahrscheinlichkeitsrechnung und Statistik 9. Vorlesung Wahrscheinlichkeitsrechnung und Statistik Monte Carlo Methode für numerische Integration Z Sei g : [0, 1] → R stetige Funktion; man möchte 1 g (t)dt 0 numerisch approximieren mit Hilfe von Zufallszahlen: Sei (Un )n eine Folge von unabhängigen ZG mit Un ∼ U[0, 1]. Sei Xn = g (Un ). (Xn )n erfüllt das SGGZ! (siehe Satz 19), d.h. n 1 X f .s. Xk − E (Xk ) −→ 0. n k=1 Z 1 Es gilt E (Xk ) = g (t)dt ∀k ∈ N 0 Z 1 1 f .s. g (t)dt ⇒ (X1 + · · · + Xn ) −→ n 0 in der Praxis: Z 1 1 g (t)dt ≈ (g (U1 ) + · · · + g (Un )) für n hinreichend groß n 0 Wahrscheinlichkeitsrechnung und Statistik Monte Carlo Methode für numerische Integration Sei g : [a, b] → R integrierbare Funktion mit 0 ≤ g (t) ≤ M für alle Z b t ∈ [a, b]; man möchte g (t)dt numerisch approximieren mit Hilfe von a Zufallszahlen: Seien Xk , Yk unabhängige ZG mit Xk ∼ U[a, b], Yk ∼ U[0, M] ∀k = 1, n. Sei Nn = #{k ∈ {1, ..., n} : Yk ≤ g (Xk )} Z b g (t)dt = Flächeninhalt unter der Funktion g a P( zufälliger Punkt unter der Funktion g ) ≈ Nn n Z b Fl. unter der Funktion g 1 = g (t)dt Fl. vom Rechteck [a, b] × [0, M] (b − a)M a Z b #{k ∈ {1, ..., n} : Yk ≤ g (Xk )} ⇒ g (t)dt ≈ · (b − a)M n a für n hinreichend groß Wahrscheinlichkeitsrechnung und Statistik Statistik Statistik = wissenschaftliche Disziplin, deren Gegenstand die Entwicklung und Anwendung formaler Methoden zur Gewinnung, Beschreibung und Analyse und Beurteilung von Daten (Beobachtungen) ist. Aufgaben und Ziele der Statistik Design von Experimenten: Wie sollen die Daten gewonnen werden? Beschreibende (deskriptive) Statistik: Wie sollen große Datensätze beschrieben werden, um die Gesetzmäßigkeiten und Strukturen in ihnen entdecken zu können? Schließende Statistik: Welche Schlußfolgerungen kann man aus den Daten ziehen? Wahrscheinlichkeitsrechnung und Statistik Arbeitsweise in der Statistik Datenerhebung (Beobachtung, Befragung, Experiment) Visualisierung und beschreibende Datenanalyse: graphische Präsentation, Zusammenfassung (Darstellung der Daten in einer Tabelle oder Darstellung mit Hilfe von Grafiken) Explorative Datenanalyse (man sucht nach Gesetzmäßigkeiten in den Daten) Modellierung der Daten Modellanpassung (Schätzung von Modellparametern) Modellvalidierung (Wie gut war die Modellanpassung?) Wahrscheinlichkeitsrechnung und Statistik Anwendung der Statistik: in politischen Umfragen: z.B. Befragung zur Beliebtheit von Politikern oder einer Partei in der Analyse von Finanzmarktdaten: z.B. Analyse von Aktien-, Zinskursen in klinischen und epidemiologischen Studien (Medizin und Pharmazie) in der Technik: z.B. die Lebensdaueranalyse oder die Zuverlässigkeit von elektronischen Systemen in der Wirtschaft: z.B. Data Mining und Data Warehousing sind zwei Bereiche, in denen man versucht mit Hilfe von statistischen Methoden aus einer Vielzahl von Kundendaten jene herauszufiltern und aufzubereiten, die für den Erfolg des Betriebs von Interesse sind Wahrscheinlichkeitsrechnung und Statistik Grundbegriffe der Statistik statistische Einheiten = Objekte an denen interessierende Größen erfaßt werden z.B. Bevölkerung einer Stadt; Schüler einer bestimmten Schule; Patienten einer Klinik Grundgesamtheit (Population) = Menge aller statistischen Einheiten über die man Aussagen erhalten will z.B. wahlberechtigte Bevölkerung einer Stadt; Schüler der 10. Klasser einer bestimmten Schule; Patienten einer bestimmten Station einer Klinik statistisches Merkmal = Eigenschaft einer statistischen Einheit für die man sich bei einer statistischen Untersuchung interessiert z.B. Alter; Geschlecht; Wert BMW Aktie 24.11.2016, 17 Uhr; Merkmalsausprägung = konkreter Wert des Merkmals z.B. 25 Jahre; weiblich; 82.5 Euro Stichprobe = tatsächlich untersuchte Teilmenge der Grundgesamtheit Wahrscheinlichkeitsrechnung und Statistik Grundbegriffe der Statistik Ein Merkmal einer Grundgesamtheit ist eine Zufallsgröße X . Ziel der Statistik ist das Gesetz (die Verteilung) von X zu finden (zu schätzen), anhand der statistischen Daten. Die Verteilung von X kann 1) vollständig spezifiziert sein z.B. X ∼ Exp(3), X ∼ Bin(10, 0.3), X ∼ N(0, 1) 2) spezifiziert sein, aber von einem oder mehreren unbekannten Parametern abhängen z.B. X ∼ Exp(λ), X ∼ Bin(10, p), X ∼ N(0, σ 2 ) 3) unbekannt sein, X ∼??? in den Fällen 2) und 3) werden der unbekannte Parameter oder die unbekannte Verteilung ,→ geschätzt → Schätztheorie ,→ getestet → Testen von statistischen Hypothesen Wahrscheinlichkeitsrechnung und Statistik Schätztheorie Sei X die zufällige Variable, welche das untersuchte statistische Merkmal darstellt. Seien x1 , . . . , xn statistische Daten (Beobachtungen, Stichprobenwerte) für das Merkmal X , die anhand einer Stichprobe erhalten wurden. Die Daten x1 , . . . , xn können als Werte (Realisierungen) von n zufälligen Variablen X1 , . . . , Xn betrachtet werden; X1 , . . . , Xn heißen Stichprobenvariablen und sind unabhängige zufällige Variablen mit derselben Verteilung wie X . Seien X1 , . . . , Xn Stichprobenvariablen und g : Rn → R, so dass g (X1 , . . . , Xn ) eine ZG ist. g (X1 , . . . , Xn ) heißt Schätzfunktion (ist eine ZG) g (x1 , . . . , xn ) heißt Schätzwert (ist ein Wert) Wahrscheinlichkeitsrechnung und Statistik Beispiele von Schätzfunktionen I Stichprobenmittel (empirischer Mittelwert) 1 (X1 + · · · + Xn ) n X̄n = g (X1 , . . . , Xn ) = I Wert des Stichprobenmittels 1 (x1 + · · · + xn ) n x̄n = g (x1 , . . . , xn ) = I Stichprobenvarianz (empirische Varianz) n S̃n2 1 X = (Xk − X̄n )2 n−1 k=1 I Wert der Stichprobenvarianz n s̃n2 = 1 X (xk − x̄n )2 n−1 k=1 Wahrscheinlichkeitsrechnung und Statistik Beispiele von Schätzfunktionen I empirische Standardabweichung n S̃n = 1 X (Xk − X̄n )2 n−1 !1 2 k=1 I Wert der empirischen Standardabweichung n s̃n = 1 X (xk − x̄n )2 n−1 !1 2 k=1 I empirische Verteilungsfunktion F̂n : R × Ω → R #{i ∈ {1, ..., n} : Xi ≤ x} ,x ∈ R n I Wert der empirischen Verteilungsfunktion F̂n (x) = F̂n (x) = #{i ∈ {1, ..., n} : xi ≤ x} ,x ∈ R n Wahrscheinlichkeitsrechnung und Statistik