Dieses Update enthält nur die neuen/geänderten Seiten gegenüber der Auflage vom März 2016 Skript zur Veranstaltung Stochastik von Gerhard Osius p= p (x) l 0,4 0,6 0,8 1,0 0,4 1,0 0 ,6 u.,a 0,4 0,6 0,8 1,0 10 15 20 25 -t . ' ' ''' ' :; : : ' _rl 10 15 i 20 1- : { .. / p ' <a _rl 10 15 ' ' : 20 ' 1 25 i t X X August 2016 Fachbereich Mathematik/Informatik Universität Bremen Stochastik 16.8.16 Vorwort- 1 Vorwort Das vorliegende Manuskript bildet die Grundlage der gleichnamigen Lehrveranstaltung für Studierende der Mathematik in den Studiengängen Diplom und Lehramt (Bachelor und Sekundarstufe 2). Um eine gewisse Vollständigkeit zu erreichen, ist es im Laufe der Zeit etwas umfangreicher geworden, und deshalb werden in der Veranstaltung einige Abschnitte (die mit einem * markiert sind) nicht oder nur teilweise behandelt. Die Beweise (der nicht unmittelbar nachvollziehbaren Behauptungen) sind hier bewußt fortgelassen, um die Darstellung der Methoden nicht zu unterbrechen (sie sind in einem separat erhältlichen Beweis-Band zusammengestellt). Obwohl dieses Material primär als Ergänzung und spätere Referenz für die an der Vorlesung Teilnehmenden gedacht ist, eignet es sich auch bedingt zum Selbststudium, wofür es allerdings nicht primär konzipiert ist. Die Veranstaltung Stochastik umfaßt vier Stunden Vorlesung sowie zwei Stunden Übungen pro Woche. Sie gehört zum Grundstudium (Bachelor) der Mathematik und soll eine erste und relativ elementare Einführung in dieses Gebiet geben, wobei sie nur auf Vorkenntnisse aus der Analysis und Linearen Algebra zurückgreifen kann. Eine Vertiefung und Ausweitung des Stoffs im Rahmen von Veranstaltungen zur Maß- und Wahrscheinlichkeitstheorie sowie zur Statistik sind erst im Hauptstudium (Master) vorgesehen. Im Lehramts-Studiengang dagegen ist die Stochastik typischerweise die einzige Veranstaltung zu diesem Thema, und dies hat auch die vorliegende Stoffauswahl mitgeprägt, insbesondere die ausführliche Behandlung von statistischen Verfahren im Zusammenhang mit der Binomial- und der Poisson-Verteilung. Um trotz der elementaren Vorkenntnisse auch ausgewählte (und wichtige) fortgeschrittene Methoden behandeln zu können (z.B. stetige Verteilungen, oder asymptotische Konfidenzbereiche und Tests) wurden einige in der Vorlesung nicht beweisbare Resultate ohne Beweis zitiert (z.B. die Existenz eines Wahrscheinlichkeitsmaßes zu vorgegebener Dichte oder der Zentrale Grenzwertsatz). Der Stoff ist selbstverständlich aus vielen Quellen zusammengestellt, obwohl diese im laufenden Text nicht explizit erwähnt werden (wie dies auch bei Lehrbüchern gängige Praxis ist). - Zunächst werden einleitend (Kapitel 0) einige Anwendungsbeispiele vorgestellt, die der Motivation der später zu behandelnden statistischen Methoden dienen. Die dort auftretenden Fragen werden zum Teil erst gegen Ende des Kurses beantwortet. Danach werden (Kapitel 1) Wahrscheinlichkeitsräume axiomatisch eingeführt und einige konkrtete Verteilungen behandelt. Hierzu werden zwar a-Algebren allgemein definiert aber als konkrete a-Algebren auf überabzählbaren Räumen werden nur die Bore1-Mengen auf der reellen Achse lR (und später im lR n) betrachtet. Als Wahrscheinlichkeitsmaße auf überabzählbaren Räumen werden auf lR (und lR n) auch nur solche betrachtet, die durch eine Dichte gegeben sind (wobei die Charakterisierung einer Verteilung durch ihre Dichte nicht bewiesen wird). Da das Lebesgue-Integral hier noch nicht vorausgesetzt werden kann, beschränken wir uns zuerst auf das Riemann-Integral für stetige Dichten und erweitern dies dann auf Dichten mit höchstens endlich vielen Unstetigkeitsstellen, was für die Betrachtungen hier ausreicht. Stochastik Vorwort- 2 16.8.16 Im Anschluß daran werden Zufallsvariablen (Kapitel 2), bedingte Wahrscheinlichkeiten und stochastische Unabhängigkeit (Kapitel 3 und 5), sowie Verteilungsfunktionen (Kapitel 4) behandelt. Unter Verwendung von Faltungen werden (Kapitel 6) neue Verteilungen eingeführt, und das Auftreten von Poisson-Verteilungen wird aus einem Poisson-Prozess hergeleitet. Der Erwartungswert wird hier (Kapitel 7) nicht für beliebige reelle Zufallsvariablen, sondern getrennt definiert für Zufallsvariablen die entweder diskret sind oder eine Dichte haben. Die grundlegenden Eigenschaften des Erwartungswerts werden zwar allgemein formuliert, aber teilweise nur für diskrete bzw. stetige Zufallsvariablen separat bewiesen. Neben der Varianz wird auch die Schiefe einer Verteilung sowie die Covarianz und Korrelation zweier Zufallsvariablen behandelt. Als Einführung in statistische Grundtechniken wird (Kapitel 8) das Schätzen von Erwartungswert und Varianz behandelt. Die Frage nach den asymptotischen Eigenschaften der Schätzer dient als Motivation für stochastische Konvergenzbegriffe. Neben dem (schwachen) Gesetz der großen Zahlen wird der hier nicht bewiesenene Zentralen Grenzwertsatz für unabhängige und identisch verteilte Zufallsvariablen (Kapitel 9) behandelt. Hierbei wird auch die später noch verwendete Abschätzung von Berry-Esseen ohne Beweis angegeben. In diesem Zusammenhang werden auch noch weitere Grenzwertsätze für spezielle Verteilungen erwähnt. Als zweites statisches Verfahren werden (Kapitel 10-12) Konfidenzgrenzen für den Erwartungswert betrachtet. Ausgehend von den exakten Grenzen bei Normalverteilung werden asymptotische Grenzen bei beliebiger Verteilung eingeführt. Im Anschluß daran werden Konfidenzgrenzen für die Wahrscheinlichkeit einer Binamialverteilung (Kapitel 11) und für den Erwartungswert einer Poisson-Verteilung (Kapitel 12) behandelt. Hierbei werden sowohl die exakten (und konservativen) als auch die asymptotischen Grenzen ausführlich hergeleitet und angewandt. Schließlich wird (Kapitel 13) der statistische Test am Beispiel des Tests von (einund zweiseitigen) Hypothesen über eine Wahrscheinlichkeit relativ ausführlich eingeführt, wobei sowohl auf den exakten als auch auf den asymptotischen Test eingegangen wird. Die entsprechenden Tests über den Erwartungswert der Poisson-Verteilung werden dann etwas knapper behandelt (Kapitel 14). Eine nahtlose Weiterführung und Vertiefung der hier behandelten statistischen Verfahren findet sich meinem Skript zur Einführung in die Statistik und zur anwendungsorientierten Veranstaltung Statistik in den Naturwissenschaften (vgl. Literaruturhinweise). Die vorliegende Fassung enthält gegenüber der letzten Version (Februar 2016) nur wenige Ergänzungen oder Korrekturen in den Abschnitten 6.1.4, 9.2, 10.2 und 11.7. Erfahrungsgemäß enthält das Skript - trotz Korrekturlesen - noch Druckfehler. Bevor man daher am eigenen Verständnis zweifelt, sollte man auch einen Fehler im Skript in Erwägung ziehen. Für Hinweise auf Druckfehler oder andere Kommentare pere-Mail ([email protected]) bin ich dankbar. Bremen, am 16. August 2016 Gerhard Osius Stochastik Inhalt Die mit * markierten Inhalt- 1 16.3.16 (Seiten pro Kapitel) Kapitel - Seite Abschnitte behandeln speziellere Themen und können übersprungen werden. 0. Einleitung und Anwendungsbeispiele 0.1 Leukämiefälle im Umkreis des Kernkraftwerks Krümmel 0.2 Asbestmessungen in Schulgebäuden 0.3 Wahlumfragen 0.4 Klinische Studie 1. Wahrscheinlichkeitsräume 1.0 Mengensysteme 1.1 Wahrscheinlichkeitsmaße 1.2 Endliche Wahrscheinlichkeitsräume 1.2.1 Diskrete Gleichverteilung 1.2.2 Bernoulli-Verteilung 1.2.3 Binomial-Verteilung 1.2.4* Relative Häufigkeiten 1.3 Abzählbare Wahrscheinlichkeitsräume 1.3.1 Poisson-Verteilung 1.4 Reelle Wahrscheinlichkeitsmaße mit Dichten 1.4.1 Normal-Verteilung 1.4.2 Exponential-Verteilung 1.4.3 Stetige Gleichverteilung (21) 1-3 1-7 1-9 1 - 10 1 - 10 1- 11 1- 11 1 - 12 1 - 13 1 - 14 1 - 18 1- 20 1- 20 2. Zufallsvariablen und ihre Verteilungen 2.1 Indikatorfunktion 2.2 Definition einer Zufallsvariable und ihrer Verteilung 2.3 Reelle Zufallsvariablen 2.3.1 Augensumme zweier Würfel Bedingte Wahrscheinlichkeit und stochastische Unabhängigkeit 3.1 Bedingte Wahrscheinlichkeit 3.1.1 Wartezeiten und Exponential-Verteilung 3.2 Stochastische Unabhängigkeit von Ereignissen 3.3 Produkte diskreter Wahrscheinlichkeitsräume 3.3.1 Bernoulli-Wiederholungen und Binomialverteilung 3.3.2 Produktmaß von Gleichverteilungen (6) 2- 1 2- 1 2-3 2-6 (10) 3- 1 3-4 3-5 3-7 3-9 3- 10 3. 4. Verteilungsfunktionen und Dichten 4.1 Verteilungsfunktionen reeller Zufallsvariablen 4.1.1 * Quasi-Inverse einer Verteilungsfunktion 4.2 Verteilungsfunktionen diskreter Zufallsvariablen 4.2.1 Einpunkt-Verteilung, Dirac-Verteilung 4.2.2 Binomial-Verteilung 4.2.3 Poisson-Verteilung (9) 0- 2 0-4 0-6 0-8 (38) 4-1 4-2 4-3 4-4 4-4 4-4 Stochastik 16.3.16 Stetige Zufallsvariablen mit Dichten 4.3.1 Stetige Gleichverteilung 4.3.2 Exponential-Verteilung 4.3.3 Normal-Verteilung 4.4 Dichten transformierter Zufallsvariablen 4.4.1 Lineare Transformationen stetiger Zufallsvariablen 4.4.2 Absolutbetrag und Potenzen stetiger Zufallsvariablen 4.4.3 Log-Normalverteilung 4.4.4 Weibull-Verteilung 4.4.5* Erzeugung von Zufallszahlen 4.5 Zufallsvektoren 4.5.1 Mehrdimensionale Borel-Mengen 4.5.2 Die Verteilung von Zufallsvektoren 4.6 Diskrete Zufallsvektoren 4.6.1 Multinomial-Verteilung 4.7 Stetige Dichten für zweidimensionalen Verteilungen 4.7.1 Zweidimensionale Normal-Verteilung 4.8* Dichten mehrdimensionaler Verteilungen 4.8.1 Multivariate Normal-Verteilung 4.9 Endliche Produkte von Wahrscheinlichkeitsräumen 4.9.1 Spezialfall: reelle Wahrscheinlichkeitsräume 4.9.2 Allgemeiner Fall: beliebige Wahrscheinlichkeitsräume 4.10 Abzählbare Produkte von Wahrscheinlichkeitsräumen 4.3 5. Stochastische Unabhängigkeit von Zufallsvariablen Stochastische Unabhängigkeit diskreter Zufallsvariablen 5.1.1 Randomisierte klinische Vergleichsstudie 5.1.2 Geometrische Verteilung 5.2 Unabhängigkeit bei stetigen Zufallsvariablen mit Dichten 5.2.1 Normalverteilte Zufallsvariablen 5.3 Unabhängigkeit bei Zufallsvektoren 5.1 6. Faltungen von Verteilungen 6.1 Faltung diskreter Verteilungen 6.1.1 Binomial-Verteilung 6.1.2 Multinomial-Verteilung 6.1.3 Faltung von Poisson-Verteilungen 6.1.4 Negative Binomial-Verteilung 6.2 Faltung stetiger Verteilungen mit Dichten 6.2.1 Faltung von Normal-Verteilungen 6.2.2 Faltung von Exponential- und Gamma-Verteilungen 6.2.3 Poisson-Verteilung und Poisson-Prozeß 6.2.4 Elementare Eigenschaften der Gamma-Funktion 6.3 Arithmetische Operationen von Zufallsvariablen 7. Parameter von Verteilungen: Erwartungswert, Varianz, Schiefe, Covarianz und Korrelation Inhalt- 2 4-6 4-9 4-9 4-9 4- 11 4- 12 4- 13 4- 16 4- 18 4- 19 4- 19 4- 20 4- 21 4- 22 4- 22 4- 23 4- 27 4-30 4-32 4-33 4-33 4-34 4-36 (10) 5-3 5-4 5-5 5-8 5-8 5-9 (12) 6-1 6- 2 6- 2 6- 3 6-4 6-6 6-6 6-7 6-9 6- 10 6- 11 (32) Stochastik 16.3.16 7.1 7.2 7.3 Definition des Erwartungswerts Grundlegende Eigenschaften des Erwartungswerts Erwartungswerte spezieller Verteilungen 7.3.1 Erwartungswerte spezieller diskreter Verteilungen 7.3.2 Erwartungswerte spezieller stetiger Verteilungen 7.3.3 Cauchy-Verteilung 7.3.4 Anwendung: Das Sammlerproblem 7.4 Varianz und Standardabweichung 7.5 Varianzen spezieller Verteilungen 7.5.1 Varianzen spezieller diskreter Verteilungen 7.5.2 Varianzen spezieller stetiger Verteilungen 7.6* Symmetrie und Schiefe 7.7 Die Ungleichungen von Chebyshev und Markov 7.7.1 Normalverteilung 7.7.2* Empirische Verteilung 7.8* Covarianz, Korrelation und linearer Zusammenhang 7.8.1 Die Covarianz 7.8.2 Der Korrelationskoeffizient 7.8.3 Die zwei-dimensionale Normal-Verteilung 7.8.4 Linearer Zusammenhang und Regressionsgerade Inhalt- 3 7- 1 7-7 7-9 7-9 7- 10 7- 11 7- 12 7- 15 7- 17 7- 17 7- 17 7- 18 7- 23 7- 24 7- 25 7- 26 7- 26 7- 28 7 - 29 7 - 29 8. Schätzung von Erwartungswert und Varianz (13) 8.1 Schätzung des Erwartungswerts 8-2 8.2 Spezielle Verteilungsmodelle 8 -4 8.2.1 Das Binomial-Verteilungsmodell 8 -4 8.2.2 Das Poisson-Verteilungsmodell 8 -5 8 -5 8.2.3 Das Normal-Verteilungsmodell 8.2.4 * Das Gamma-Verteilungsmodell 8 -5 8.2.5* Das Cauchy-Verteilungsmodell 8-6 8.3* Schätzung der Varianz 8 -6 8.3.1 Schätzung der Varianz bei bekanntem Erwartungswert 8 -6 8.3.2 Schätzung der Varianz bei unbekanntem Erwartungswert 8- 7 8.3.3 Verteilung der Varianz-Schätzer im Normal-VerteilungsmodellS - 8 8 - 10 8.4* Schätzung der Schiefe 8.5* Schätzung der Korrelation und Regressionsgeraden 8 - 10 9. Schwaches Gesetz der großen Zahlen und Zentraler Grenzwertsatz 9.1 Konvergenz nach Wahrscheinlichkeit und Schwaches Gesetz der großen Zahlen 9.1.1 Eigenschaften der Konvergenz nach Wahrscheinlichkeit 9.1.2 Stochastische Konvergenz und Konsistenz von Schätzern 9.2 Verteilungskonvergenz und Zentraler Grenzwertsatz 9.3 Grenzwertsätze für Binomial-Verteilungen 9.3.1 Die Normal-Approximation der Binomial-Verteilung 9.3.2 Anwendung: Wahlumfragen 9.3.3 Die Poisson-Approximation der Binomial-Verteilung (36) 9 -3 9 -5 9 -6 9 -7 9 - 12 9 - 12 9 - 16 9 - 18 Stochastik 9.4* 9.5* 9.6* 9.7* 9.8 16.3.16 Inhalt- 4 9- 20 Grenzwertsatz für Poisson-Verteilungen 9- 21 Grenzwertsatz für negative Binomial-Verteilungen 9- 22 Grenzwertsatz für Gamma-Verteilungen 9- 23 Eigenschaften der Konvergenz nach Verteilung 9- 25 Hypergeometrische Verteilungen 9- 25 9.8.1 Wahlumfragen 9- 26 9.8.2 Zufälliges Ziehen mit und ohne Zurücklegen 9.8.3 Definition und Eigenschaften der hypergeometrischenVerteilung 9 - 28 9.8.4 Anwendungen und Schätzungen 9 - 29 9.8.5 Binamial-Approximation der hypergeometrischen Verteilung 9 - 30 9.8.6 Die multivariate hypergeometrische Verteilung 9 - 31 10. Konfidenzgrenzen für den Erwartungswert 10.1 Exakte Konfidenzgrenzen für den Erwartungswert einer Normal-Verteilung mit bekannter Varianz 10.2* Asymptotische Konfidenzgrenzen für den Erwartungswert einer beliebigen Verteilung 10.3* Exakte Konfidenzgrenzen für den Erwartungswert einer Normal-Verteilung mit unbekannter Varianz (13) 10-3 10- 7 10- 10 11 Konfidenzgrenzen für eine Wahrscheinlichkeit 11.1 Die exakte obere Konfidenzgrenze nach Clopper-Pearson 11.2 Die exakte untere Konfidenzgrenze nach Clopper-Pearson 11.3 Das exakte zweiseitige Konfidenzintervall 11.4 Berechnung der exakten Grenzen 11.5 Die F-Verteilung 11.6 Asymptotische (approximative) Konfidenzgrenzen 11.7 Grobe asymptotische (approximative) Konfidenzgrenzen (19) 11 - 2 11-4 11 - 5 11 -6 11 -8 11-11 11- 16 12 Konfidenzgrenzen für den Erwartungswert einer Poisson-Verteilung 12.1 Konstruktion der exakten oberen Konfidenzgrenze 12.2 Konstruktion der exakten unteren Konfidenzgrenze 12.3 Konstruktion des exakten zweiseitigen Konfidenzintervalls 12.4 Berechnung der exakten Grenzen 12.5* Asymptotische (approximative) Konfidenzgrenzen 12.6 Anwendung: Asbestmessungen in Schulgebäuden 12.7 Konfidenzgrenzen bei unabhängigen Wiederholungen (12) 12 - 1 12-3 12-4 12 - 5 12-6 12- 10 12- 12 13. Testen von Hypothesen über Wahrscheinlichkeiten 13.1 Der exakte einseitige Binomial-Test mit oberer Alternative 13.1.1 Statistische Tests 13.1.2 Fehlerrisiken und Testschärfe 13.1.3 Der optimale Test zum vorgegebenen Niveau 13.1.4 Analyse des Fehlerrisikos 2. Art 13.2 Der exakte einseitige Binomial-Test mit unterer Alternative 13.3 Der exakte zweiseitige Binomial-Test (32) 13-3 13-4 13- 5 13-8 13- 12 13- 14 13- 16 Stochastik 16.3.16 13.4 Asymptotische Tests 13.4.1 Der asymptotische einseitige obere Binomial-Test 13.4.2 Der asymptotische einseitige untere Binomial-Test 13.4.3 Der asymptotische zweiseitige Binomial-Test 13.5 Planung des erforderlicher Stichproben-Mindestumfangs 13.5.1 Der einseitige obere Test 13.5.2 Der einseitige untere Test 13.5.3 Der zweiseitige Test 14.* Tests für den Erwartungswert der Poisson-Verteilung 14.1 Der einseitige Poisson-Test mit oberer Alternative 14.1.1 Der exakte einseitige obere Poisson-Test 14.1.2 Der asymptotische einseitige obere Poisson-Test 14.2 Der einseitige Poisson-Test mit unterer Alternative 14.2.1 Der exakte einseitige untere Poisson-Test 14.2.2 Der asymptotische einseitige untere Poisson-Test 14.3 Anwendung: Asbestmessungen in Schulgebäuden 14.4 Der zweiseitige Poison-Test 14.4.1 Der exakte zweiseitige Poisson-Test 14.4.2 Der asymptotische zweiseitige Poisson-Test 14.5 Poisson-Tests bei unabhängigen Wiederholungen Inhalt- 5 1313131313131313- 19 19 24 26 28 29 30 31 (14) 14- 1 14- 2 14-3 14-4 14- 5 14-6 14- 7 14- 12 14- 12 14- 13 14- 14 Literaturhinweise (1) AnhangS: Statistik-Funktionen in Tabellenkalkulationen (2) Anhang T: Statistische Tabellen Verteilungsfunktion der Normalverteilung N(0,1) Quantile der N( 0,1) und t- Verteilung Quantile der Chiquadrat-Verteilung Quantile der F- Verteilung Index (12) T -1 T- 3 T- 5 T- 8 (6) Faltungen von Verteilungen 6-4 4.8.16 6.1.4 Negative Binomial-Verteilung Wir betrachten (wie in 5.1.2) eine Folge (X ) stochastisch unabhängiger B(1,p)-vern teilt er Zufallsvariablen, die wir als Indiaktorvariablen für ein Ziel-Ereignis ("Treffer") interpretieren, mit 0 < p < 1 als Treffer-Wahrscheinlichkeit ist. Für festes n E W ist die Anzahl Y der Nicht-Treffer bis zum n-ten Treffer definiert durch (1) Y=k :{} xk +n = 1 und X 1 + ... +Xk+n-1 = n-1 xk +n = 1 und X1 + ... +Xk+n = n . Die Verteilung von Y hat dann die Zähldichte (2) Diese Verteilung auf W heißt auch die negative Binomial-Verteilung mit den Para0 metern n E W, p E (0, 1) und wird hier mit NB(n,p) bezeichnet. Man beachte, daß es prinzipiell möglich ist, daß niemals n Treffer eintreten (was Y = oo entspräche), aber die Wahrscheinlichkeit hierfür ist Null 00 (3) P{l:X.<n} = 0. z= 1 0 z Weiter gilt für k E W 0 (4) Y<k Aus L(X1 + ... +Xk+n) = B(k+n,p) ergibt sich ein Zusammenhang zwischen Binomial- und Negativ-Binomial-Wahrscheinlickeiten (in suggestiver Schreibweise) (5) P{NB(n,p) < k} = P{B(k+n,p) > n} Speziell für n = 1 ergibt sich die geometrische Verteilung (6) Geo(p) = NB(1,p), und die negative Binomial-Verteilung NB(n,p) ist die n-fache Faltung der geometrischen Verteilung Geo(p) * .... * (7) NB(n,p) =Geo(p) (7)' Für stochastisch unabhängige Y , ... , Yn mit Geo(p)-Verteilung gilt: 1 n cL( 2:: Y.) = NB(n,p). Geo(p) t ... n-mal ... t 0 z=1 z bzw. Faltungen von Verteilungen 6-5 4.8.16 Der Beweis verwendet die folgende Beziehung für Binomial-Koeffizienten ~ (i+n ~-1 1) (8) . t= 0 = (k+n) n fü r n E 1N 1 kE W . 0 Die Faltung von negativen Binamial-Verteilungen mit gleichem Parameter p ist wieder eine solche ist (9) Dichte von NB(n,p) mit p = OA Dichte von NB(n,p) mit p= 0.4 0,4 0,4 n= 1 0 5 10 15 n= 2 20 25 30 0 Dichte von NB(n,p) mit p==0,4 5 10 15 20 25 30 25 30 Dichte von NB(n,p) mit p= 0,4 0.4 0.4 n= 4 0 Abb. 1: 5 10 15 n= 8 20 25 30 0 5 10 15 20 Dichten (als Histogramme) der negativen Binamial-Verteilung NB(n,p) mit p = 0,4 und verschiedenen Werten für n. Schwaches Gesetz der großen Zahlen und Zentraler Grenzwertsatz 12.8.16 9- 9 Da FX nur im Punkt a = 0 unstetig ist, ist daher (VK) erfüllt: für a :;= 0. n---+ oo Für den Punkt a = 0 gilt die Konvergenz allerdings nicht, weil für alle n E W. D Spezialfall: Stetige Limes-Verteilung Wenn X eine stetige Verteilung hat, d.h. wenn FX auf IR stetig ist, dann reduziert sich die Bedingung (VK) zu (VK)* n---+ oo für alle a E IR. Fja) = P{X<a} Für jedes Intervall I C IR enthält der Rand 8(!) = { inf(f), sup(f)} n IR höchstens zwei Elemente und somit gilt P {XE 8(!)} = 0. Aus der Bedingung (VK) 1 folgt daher als Verschärfung von (VK)* (VK)** P{XnEI} n---+oo P{XEI} für jedes Intervall I C IR. D Wir formulieren jetzt den nach Jarl Waldemar Lindeberg (1876-1932) und Paul Pierre Levy (1886-1971) genannten Zentralen Grenzwertsatz für unabhängige und identisch verteilte Zufallsvariablen. Zentraler Grenzwertsatz von Lindeberg und Levy: Sei (Xn ) nEm li.T eine Folge stochastisch unabhängiger und identisch wie X verteilter Zufallsvariablen deren Erwartungswert p, = E(X) und Varianz a = Var(X) > 0 existieren. Die Standardisierung der Summe X~) =X 2 bzw. des Mittelwerts x(n) = ~X~) der ersten n Zufallsvariablen 1 + ... +Xn (4) ist dann verteilungskonvergent gegen die Standard-Normalverteilung (5) (6) u(n) n---+ oo n---+ oo mit <I> als Verteilungsfunktion von N(0,1). N(0,1) bzw. <I>(u) für alle u E IR Schwaches Gesetz der großen Zahlen und Zentraler Grenzwertsatz 9 - 10 12.8.16 Zusatz 1: Weiter gilt- wobei"()" für"<" oder "<"steht: (7) P{ u () u(n)} (8) P{ u 1 () u(n) () u 2 } n---+ oo n---+ oo für alle u E IR, 1- <P(u) <P( u~ - <P( u1) Zusatz 2: Die Konvergenzen in (6), (7) bzw. (8) sind sogar gleichmäßig in u bzw. in u und u . 1 2 Einen Beweis findet bei Georgii (2004) und Krengel (2005) sowie (in allgemeinerer Form) in Lehrbüchern der Wahrscheinlichkeitstheorie, z. B. Bauer (2002) sowieGänssler und Stute (1977). Man beachte, daß (6) für alle u E IR gilt, weil <P auf ganz IR stetig ist. Die Konvergenzaussagen (6) - (8) kann man zur approximativen Berechnung von Intervall-Wahrscheinlichkeiten für den Mittelwert x(n) verwenden, z.B. P{ a1 () x(n) () a 2 } = P{ u1 () u(n) () u2 } ~ <P(u 2) - <P(u1) (9) mit u.= Jn[a.-t-L] z a z für i = 1,2. Diese Approximation kann man wegen <P(-oo) = 0 bzw. <P( +oo) = 1 auch im Grenzfall a =- oo bzw. a = 1 2 + oo verwenden, weil dann auch u =- oo bzw. u = 1 2 + oo gilt. Man kann (9) auch suggestiv schreiben als (10) P{ a 1 () x(n) () a 2 } ~ P{ a 1 < N(f-L, ~ a 2 ) < a 2 } wobei N(f-L, l. a 2) für eine Zufallsvariable mit dieser Normal-Verteilung steht. Da (10) n für alle -oo < a < a < +oo gilt, sagt man auch, daß der Mittelwert x(n) approxima1 2 tiv normalverteilt ist und schreibt kurz: (12) Entsprechend ist die Summe X~) =X + ... +Xn approximativ normalverteilt 1 (13) Zur Genauigkeit der Approximationen -wie z.B. (9) -gibt es Abschätzungen, die auf A. C. Berry (1941) und C. G. Esseen (1945) zurückgehen und hier nicht bewiesen werden. Schwaches Gesetz der großen Zahlen und Zentraler Grenzwertsatz 9 - 11 12.8.16 Theorem von Berry und Esseen: Unter den Voraussetzungen des Zentralen Grenzwertsatzes gilt mit dem 3. absoluten zentralen Moment v : = E( I X 3 -j-L 3 1 ) von X und der Konstanten c = 0.7995 sup IP { u(n) < u} - <P( u) I (14) uE 1R sup IP{ u< u(n)}- [1-<P(u)]l (15) (16) uE 1R u < < c -3 - · a . v3' Vn c -3 - · a . v3' Vn ~~JR IP{u()u(n)()v}-[<P(v)-<P(u)]l < -2c· a-3 . v3. Vn ' Hierbei soll v natürlich endlich sein (d.h. es soll existieren), weil sonst die Abschät3 zungen trivial sind. Eine unmittelbare Folgerungen aus diesen Abschätzungen ist, daß die Konvergenzen (6) - (8) gleichmäßig sind (in u, v) und die Ordnung )n haben. Im ursprünglichen Result (14) von Esseen ist die Schranke c = 7.59 angegeben (vgl. 1971, S. 542). Die oben angegebene Schranke c = 0.7995 stammt von van Beek (1972), vgl. Gänssler-Stute (1977), S. 167, wo auch gezeigt wird, daß die Konstante c FeZZer nicht kleiner als (21rr1/ 2 ~ 0.4 sein kann. Die Abschätzungen (15) und (16) sind Folgerungen aus (14). Für das 3. absolute zentrale Moment v von X gibt es typischerweise keine einfache explizite Darstellung. Wegen lxl 3 < 1+ 3 4 x ist aber (17) mit Wenn das (meist leichter zu bestimmende) 4. zentrale Moment 1-L von X endlich ist1 4 so kann man v zumindest in (14) - (16) durch 1 + f-L ersetzen, was die Abschätzung 4 3 allerdings vergröbert. Nach (13) läßt sich die n-fache Faltung cL(X~)) der Verteilung L(X) stets durch eine Normalverteilung approximieren. Für einige der bisher behandelten Verteilungen L(X) geben wir in den folgenden Abschnitten weitere Details dieser Approximation. Konfidenzgrenzen für den Erwartungswert (4) (t(X)- (tu a(X) ' (5) (t(X) (t o a(X) ' dCt X-d 10-8 12.8.16 Ct + dCt (untere Grenze) (obere Grenze) Diese Grenzen halten die vorgegebene Sicherheit 1- a zwar nicht exakt, aber - wie wir im folgenden zeigen werden - zumindest approximativ ein, wobei die Approximation für wachsenden Stichprobenumfang n beliebig gerrau wird. Der Grund hierfür ist einerseits, daß der standardisierte Mittelwert (6) u := X-p, -----,=-- a(X) a nach dem Zentralen Grenzwertsatz approximativ standard-normalverteilt ist (7) L(U) ~ N(O, 1). Gerrauer gilt, wobei wir den Umfang n- wie in Kapitel 8 -als Index "(n)" mitführen N(0,1). (8) Andererseits kann die geschätze Standardabweichung als Approximation der unbekannten Standardabweichung verwendet werden (9) a(X) ~ a weil die Schätzung nach 9.1.2 konsistent ist (10) p n---+ oo a. Für die Sicherheit der unteren Grenze (11) P { (t u, Ct (X) < p, } = P { X- dCt < p, } ergibt sich (12) und für die obere Grenze erhält man (13) Man interpretiert (12) bzw. (13) dahingehend, daß die untere bzw. obere Grenze die asymptotische Sicherheit 1- a oder die asymptotische Irrtumswahrscheinlichkeit a hat. Konfidenzgrenzen für den Erwartungswert 10-9 12.8.16 Für die praktische Anwendung bedeutet dies, daß die Grenzen (4) und (5) die approximative Sicherheit (14) P{X-d Ct <~t} ~ 1-a besitzen, wobei die Approximation für wachsendes n beliebig gerrau wird. Bei den obigen Ausführungen haben wir von der speziellen Gestalt (1) der Varianzschätzung keinen Gebrauch gemacht, sondern nur ihre Konsistenz (10) ausgenutzt. Folglich gelten alle obigen Ausführungen sogar für jede konsistente Schätzung a2(X) der Varianz, weil diese ebenfalls (10) erfüllt. Wenn die Varianz sogar eine stetige Funktion des Erwartungswerts fL ist (was z.B. bei der Bernouilli- oder Poisson-Verteilung der Fall ist), so gilt a 2 = a 2 (~t) und jede konsistente Schätzung Jl(X(n)) für fL liefert auch eine konsistente Schätzung a(X(n)) = a(Jl(X(n))) von a. Die zugehörigen asymptotischen Konfidenzgrenzen werden für Bernouilli-verteiltes X in 11.7 behan- delt. Beispiel: Haltbarkeitsdauer eines Medikaments Die Haltbarkeitsdauer X (in Tagen) eines spezifischen Medikamentes kann als Zufallsvariable mit einer zunächst nicht bekannten Verteilung betrachtet werden. Eine Verbraucherorganisation will eine untere 95%-Grenze 4u für die erwartete Haltbarkeitsdauer fL = E(X) ermitteln. Bei n = 25 unabhängigen Messungen ergab sich der Mittelwert x = 107,5 mit einer Streuung von a(x) = 12,7 und die Schätzung auf a war a( x) = 63,5. Aus dem 5%-Quantil z 5 % = 1,645 ergibt sich die Bandbreite d5% = 20,9 und somit eine untere Grenze von flu,S% = 86,6 Tagen. Man beachte, daß die Sicherheit dieser Grenze nur approximativ 95% beträgt. Konfidenzgrenzen für eine Wahrscheinlichkeit 11-16 15.8.16 Die asymptotische obere und untere Grenze liegen symmetrisch um den Wert p (x), aber nicht um die Schätzung p(x). Für wachsendes n weicht p (x) allerdings m m immer weniger von p(x) ab. Gerrauer gilt (wobei wir X wieder mit n indizieren) p (25) n---+ oo o, und die Konvergenzgeschwindigkeit ist sogar von der Ordnung 1.. , weil n p (26) n---+ oo Die Abweichung der oberen bzw. unteren Grenze vom Symmetriepunkt p (x) wird m für wachsendes n immer kleiner, und gerrauer gilt p (27) n---+ oo 0, wobei die Konvergenzgeschwindigkeit von der Ordnung ist, weil p (28) 11.7 fo n---+ oo Grobe asymptotische (approximative) Konfidenzgrenzen Für eine B(n,p)-verteilte Zufallsvariable X wollen wir zusätzlich zu den bisherigen asymptotischen Konfidenzgrenzen für p jetzt noch grobe asymptotische Grenzen konstruieren, die einfacher zu bestimmen und für sehr hohes n (etwa ab n = 1000) oder als grobe Abschätzungen geeignet sind. Obwohl es sich hierbei um einen Spezialfall der asymptotischen Grenzen aus 10.2 handelt (was sich weiter unten ergeben wird), wollen wir die groben Grenzen hier ohne Rückgriff auf die Resultate in 10.2 herleiten. - Der Schätzer für p ist die relative Häufigkeit (1) 1 - p(X) =-X= :X n Da Varianz und Standardabweichung von B(1,p) stetige Funktionen von p sind a(p) = (2) J p[1- p] 1 ist es naheliegend a2(p) und a(p) wie folgt zu schätzen (3) a 2 (ß(X)) = p(X) [ 1- p(X)] , a(ß(X)) = J p(X) [1- p(X)] . Diese Schätzungen sind konsistent, weil p(X) eine konsistente Schätzung auf p ist, d.h. es gilt (wobei wir X jetzt wieder mit n indizieren) Konfidenzgrenzen für eine Wahrscheinlichkeit p (4) n---+ oo 11-17 15.8.16 a(p). Unter Verwendung des Binomial-Grenzwertsatzes u(n) : = vn[ß(X(n))- P] a(p) (5) L n---+ oo N(0,1). haben wir in 11.6 (8) bzw. (6) die untere bzw, obere asymptotische Grenze konstruiert als Lösung der Gleichung (hier mit p(X) statt X) Jn(p- p(X)) =- a(p) za Jn(p- p(X)) = a(p) za bzw. Ersetzt man die Standardabweichung a(p) durch ihre konsistente Schätzung a(ß(X) ), so läßt sich die resultierende Gleichung Vn (p- p(X)) = - (6) a(ß(X)) za bzw. Jn(p-p(X)) = a(ß(X))za nach p auflösen. Und die Lösungen sind die groben asymptotischen Grenzen für p po, (X) : = p(X) + d (X) (7) (X d (X) (8) = (X z · yn _l_ a(ß(X)) = z · _l_ J p(X) [1- p(X)] yn (X mit (X (Bandbreite). (X Die Sicherheit dieser Grenzen konvergiert für n---+ oo gegen 1- a (wobei X wieder mit n indiziert ist) (9) lim n---+oo P{p u, a (x(n)) < p} = 1- a = lim P{p < p n---+oo o, a (x(n))}. da der Grenzen von der Schätzung p = p(X) variiert mit der Schätist d ist maximal und für p---+ 0 bzw. p---+ 1 ergibt sich d ---+ 0. Die Abweichung zung: für p = 1 2 (X (X Wahlumfrage: Bei der "Sonntagsfrage" in 0.3 Abb.4 ist n = 1300 und die Bandbreite d0 der zweiseitigen 95%-Grenzen (d.h. a = 5%) wird dort als "Fehlertoleranz" 2 bezeichnet. Bei einem Stimmanteil p von 50% bzw. 5% ergibt sich mit z2,5% = 1,960 (aus Tabelle T 3 im Anhang) die Bandbreite d2,5% zu 2,72% bzw. 1,18%, was den ge- rundeten Werten in 0.3 Abb.4 entspricht. D Die groben Grenzen haben gegenüber den sogenannten normalen asymptotischen Grenzen aus 11.6 mehrere Nachteile, die daraus resultieren, daß sie über die Schät- zung der Standardabweichung a(p) eine zusätzliche Unsicherheit mit sich bringen. Typischerweise weicht die Sicherheit der groben Grenzen stärker von 1- a ab als die der normalen Grenzen. Außerdem können die groben Grenzen auch außerhalb Konfidenzgrenzen für eine Wahrscheinlichkeit 11-18 15.8.16 des Intervalls [ 0, 1] liegen (vgl. Abb. 5), und ergeben im Fall p(X) E {0,1} wegen da(X)= 0 keine sinnvollen Werte. Lediglich für Überschlagsrechnungen oder bei sehr großem Umfang n und nicht zu extremen Werten von p(X) (d.h. nicht zu dicht bei 0 oder 1) sind die groben Grenzen akzeptabel. relative Häutlgkell ln Prozent relative Hauligkelt in Prozent 100 95 90 85 80 75 70 65 60 55 50 iOO 95 90 85 80 75 70 65 60 55 SO 60 grobe Grenzen 55 .... ,. einseitig: a ::S% 50 ~ 45 N 0 0:: 40 c .. ;' ·; 35 n= 25 N a13o .... c: ~20 c 15 ~ 10 5 0 . , •• .. •"'" .,•' .1' . 55 ssg ~ ein•eitig: a~s% , - ~45 0 0:40 651)1 ·; 35 70~ N G> 75! ::1 80\) 0 85~ :?. 90 95 c c: ~ 10 5 100 .5 10 15 20 25 30 35 40 45 50 relative Häufigkeit in Prozent n = 100 ~25 0 ,.. . :t-·' ~· .. I ('-' 45 50 "/ A ./J • /~ ~· ; . n~2s a130 .... ~20 c 15 n 1 / n~2s ./o/ / N eofi :;I n= 25 40 grobe Gren1.en v Jt 1 ,, ,- , 50 A n = 100 ~25 60 45 50 . ." 40 : / ~ • ~ . 5 10 15 20 25 30 35 40 45 50 relative Häufigkeit in Prozent s5° ~ eofi :J 65"~' G> .., 70~ N 75 :;I ~ 80\) a es[ 90 95 100 Abb 5: Grobe und asymptotische untere und obere Grenzen für p zur (einseitigen) Sicherheit von 95% als Funktion der beobachteten relativen Häufigkeit x = ~ x für n = 25 und n = 100. Für x <50% gilt die untere und linke Skala, und für x >50% gilt die obere und rechte Skala. links: Die grobe untere (bzw. obere) Grenze ist für kleines (bzw. großes) x sogar negativ (bzw. größer als 100%). rechts: Die Abweichung der groben (dünn) von den normalen (fett) Grenzen wird kleiner, je dichter p bei 50% liegt, und verringert sich bei wachsendem n. Wir wollen jetzt präzisieren, in welchen Sinn die normalen mit den groben Grenzen für wachsendes n übereinstimmen.. In 11.6 haben wir bereits gezeigt, daß der Abweichung der beiden Symmetriepunkte pm(X) bzw. p(X) nach Wahrscheinlichkeit gegen 0 konvergiert. Die Abstände Jl5CX5 bzw. da(X) der Grenzen vom jeweiligen Symmetriepunkt konvergieren gegen 0 nach 11.6 (27) und (10) p n----too wobei ihr Quotient sogar gegen 1 konvergiert (11) p n----too Konfidenzgrenzen für eine Wahrscheinlichkeit 15.8.16 11-19 Wie bereits angekündigt, ergeben sich die groben Grenzen als Spezialfall der asymptotischen Grenzen aus 10.2 wenn man X als eine Summe stochastisch unabhängiger B(1,p)-verteilter Zufallsvariablen X , ... , Xn mit Erwartungswert p, = p auffasst, 1 d.h. X =X+ Der Schätzer von p (wir schreiben jetzt p statt p,) ist der Mittelwert der Stichprobe X= (X , ... ,Xn) 1 (12) Die asymptotischen Grenzen aus 10.2 (4) (5) entsprechen den obigen groben Grenzen, wenn in 10.2 statt der dortigen erwartungstreuen Varianzschätzung (14) a2(X) = n~1 ~ (Xi-X)2 z 2 2 die konsistente Schätzung a (ß(X)) verwendet. Die Schätzung a (ß(X)) unterscheidet sich von a2 (X) um den Faktor l.(n-1) n (15) n---+oo 1 a2(ß(X)) = ~ ~ (Xi-X)2 = n~1 a2(X). z 2 Folglich ist a (ß(X)) nicht erwartunstreu, aber zumindest asymptotisch erwartungstreu, d.h. (16) 2 a. Stochastik 16.8.16 Index- 1 Index Der Index enthält vorwiegend Begriffe aus dem methodischen Textteil (also nicht aus allen Beispielen und Anwendungen), wobei für jedes Stichwort nur die wichtigsten (nicht alle) Textstellen aufgeführt sind, an denen es erwähnt wird. A Absolutbetrag 4-13 absolute Konvergenz eines Integrals 7-3 absolutes Moment 7-20 9-11 absolutes zentrales Moment 9-28 absteigendes Produkt abzählbare Produkte von Wahrscheinlichkeitsräumen 4-35 1-8 Additionsformel 13-3 Alternative 3-4 Alterungs pro zeß 6-11 9-5 arithmetische Operation 7-4 8-2 arithmetisches Mittel Asbestmessung 0-4 12-10 14-7 asym ptotische - Irrtumswahrscheinlichkeit 10-9 - Konfidenzgrenze 10-7 11-11 Poisson 12-6 grobe asymptotische 11-16 - obere Grenze Binomial 11-13 12-8 14-6 Poisson - Schärfe 13-22 13-25 13-27 14-4 14-7 - Sicherheit 10-9 - Signifikanz der Beobachtung 13-2113-24 - untere Grenze 11-13 Binomial 12-8 Poisson - untere Konfidenzgrenze 13-20 Binomial. 14-3 Poisson asymptotischer einseitiger oberer Test - Binomial 13-20 14-3 Poisson asymptotischer einseitiger unterer Test - Binomial 13-24 14-6 - Poisson asymptotischer P-Wert 13-2113-24 asym ptotischer Test 13-19 asymptotischer zweiseitiger Test - Binomial 13-26 14-13 - Poisson asym ptotisches Konfidenzintervall - Binomial. 13-26 asymptotisches Niveau 13-22 13-25 14-4 14-6 14-14 2-6 Augensummezweier Würfel B B(1,p), Bernoulli-Verteilung 1-10 B(n,p), Binomial-Verteilung 1-11 Bayes, Formel 3-4 bedingte Wahrscheinlichkeit 3-1 Bernoulli-Verteilung 1-10 2-1 3-9 6-2 11-1 S-1 9-11 Berry-Esseen, Theorem 7-31 Bestimmthei tsmaß 2-2 4-35 4-38 Bildmaß Binamial-Approximation der hypergeometrischen Vertwilung 9-30 Binomial-Grenzwertsatz 9-12 Binomial-Test 13-1 13-19 13-24 13-26 - asymptotischer - exakter 13-9 13-14 13-17 Binomial-Verteilung 1-11 3-9 4-4 6-2 7-9 7-17 7-21 9-18 S-1 6-4 7-9 - negative 8-4 Binomial-Verteilungsmodell S-1 Binomialkoeffizient 1-5 Bore1-Menge - mehrdimensionale 4-20 c C(-,-), Cauchy-Verteilung Cauchy-Verteilung Cauchy-Verteilungsmodell Che bychev-Ungleichung Chiquadrat-Verteilung Clopper-Pearson - Konfidenzgrenze Corr(-,-), Korrelation Cov(-,-), Covarianz Covarianz Covarianz-Matrix 7-11 7-11 7-18 10-12 8-6 7-23 8-8 S-2 T -5 11-2 11-4 7-28 7-16 7-16 7-26 7-29 D de Moivre - Laplace, Grenzwertsatz DG(-), diskrete Gleichverteilung diag(-), Diagonalmatrix Diagonalmatrix 9-12 7-9 5-8 5-8 Stochastik 1-14 4-6 4-8 Dichte 4-24 - eines Zufallsvektors 1-18 4-7 - kanonische 4-30 - mehrdimensionale - zweidimensionale 4-23 Differenz von Mengen 1-4 Differenz von Zufallsvariablen 6-11 Dirac(-), Dirac-Verteilung 4-4 Dirac-Verteilung 4-4 7-7 7-17 7-24 diskret - Wahrscheinlichkeitmaß, Verteilung 2-5 diskrete Gleichverteilung 1-10 7-9 7-17 diskrete Zufallsvariable 4-3 5-3 diskreter W-Raum 1-13 4-22 diskreter Zufallsvektor E 7-2 7-3 E(-), Erwartungswert effektives Testniveau 13-10 14-2 14-5 14-13 Einpunkt-Verteilung 4-4 7-17 7-24 Einschränkung 2-4 einseitig oberer Test, Binomial 13-29 einseitig oberer Test, Poisson 14-1 einseitig unterer Test, Binomial 13-30 einseitig unterer Test, Poisson 14-4 einseitiger Test 13-18 Elementar-Ereignis 1-1 Elementar-Wahrscheinlichkeit 1-9 empirische Verteilung 1-12 7-25 8-7 8-10 empirisches Gesetz der großen Zahlen 1-1 endlich-additiv 1-7 endliche Produkte von Wahrscheinlichkeitsräumen 4-33 endlicher Wahrscheinlichkeitsraum 1-9 Entscheidungsfunktion 13-4 Ereignis 1-1 1-3 Erfolg 1-10 Ergebnis 1-1 Ergebnisraum 1-1 8-2 8-6 8-7 erwartungstreu 7-114-1 Erwartungswert 7-9 - spezieller Verteilungen 7-7 - Eigenschaften 8-8 - quadratische Form - Schätzen 8-2 1-5 erzeugte Sigma-Algebra 4-19 Erzeugung von Zufallszahlen 6-7 Eulersche Gammafunktion exakte obere Konfidenzgrenze - Binomial 11-2 13-14 - Poisson 12-114-5 exakte untere Konfidenzgrenze 16.8.16 Index- 2 - Binomial 11-4 13-9 - Poisson 12-3 14-2 exakter einseitiger oberer Test - Binomial 13-9 - Poisson 14-2 exakter einseitiger unterer Test - Binomial 13-14 - Poisson 14-5 exakter zweiseitiger Test - Binomial 13-17 - Poisson 14-12 exaktes Konfidenzintervall - Binomial 13-17 - Poisson 12-4 exaktes zweiseitiges Konfidenzintervall 11-5 S-1 Excel Expo(-), Exponentialverteilung 1-20 Exponential-Verteilung 1-20 3-4 4-9 4-13 4-18 5-7 7-10 7-18 S-2 - Faltung 6-7 F F-Verteilung 11-7 11-8 S-2 T-8 Fakultät 6-10 S-1 falsch-negativ 13-5 falsch-positiv 13-5 Faltung 6-1 9-11 - diskreter Verteilungen 6-1 - stetiger Verteilungen 6-6 Fehlentscheidung 13-5 Fehler 1. Art 13-5 13-5 Fehler 2. Art 13-5 Fehlerrisiko - 1. Art 13-6 14-2 14-5 14-13 - 2. Art 13-6 13-12 14-2 14-5 2-4 Fortsetzung 4-25 4-26 4-31 Fubini, Satz von G Garn(-,-), Gamma-Verteilung 6-7 Gamma-Funktion 6-7 6-10 S-2 Gamma-Grenzwertsatz 9-22 Gamma-Verteilung 6-7 7-10 7-18 7-21 9-22 S-2 8-5 Gamma-Verteilungsmodell 1-19 Gaußsehe Glockenkurve Gedächtnislosigkeit 3-4 5-7 gemeinsame Verteilung 4-21 5-4 gemeinsame Verteilungsfunktion 5-10 Geo(-), geometrische Verteilung 5-6 geometrische Verteilung 5-5 5-6 6-4 7-9 7-17 S-1 Stochastik 8-2 9-1 Gesetz der großen Zahlen 1-1 - empirisches - schwaches 9-3 - starkes 9-4 7-2 gewichtetes Mittel Gleichverteilung - diskrete 1-10 7-9 7-17 - stetige 1-20 4-13 4-19 7-10 Grenzwertsatz, zentraler 9-1 grobe asymptotische Konfidenzgrenzen 11-6 H hypergeometrischer Grenzwertsatz 9-31 - multivariat 9-36 hypergeometrische Verteilung 9-25 9-28 S-1 - multivariat 9-31 9-34 9-35 I 8-1 8-10 iid Indikatorfunktion 2-1 Integral 1-14 1-16 4-23 4-30 7-5 Intervall, mehrdimensionales 4-20 Intervall-Schätzer 10-1 Intervall-Wahrscheinlichkeit 4-1 10-1 Irrtumswahrscheinlichkeit - asym ptotische 10-9 K 1-18 4-7 kanonische Dichte 2-5 kanonischer Träger 0-8 5-4 klinische Vergleichsstudie 1-3 1-7 Kolmogorov 1-3 Korn plementär- Ereignis 10-1 Konfidenzgrenze 10-1 - für Erwartungswert 10-7 - asym ptotische 10-10 - Normalverteilung - Binomial-Verteilung 11-1 - Poisson-Verteilung 12-112-12 10-1 Konfidenzintervall 13-26 - asym ptotisches 10-5 - Normalverteilung 11-3 12-2 13-22 konservativ - Test 13-10 14-2 14-13 9-6 konsistent 9-6 Konsistenz 9-8 konvergent nach Verteilung Konvergenz 9-23 - nach Verteilung - nach Wahrscheinlichkeit 9-3 9-5 2-5 konzentriert 7-28 8-10 Korrelation 16.8.16 Index- 3 Korrelationskoeffizient 4-28 5-8 7-28 7-29 kritischer Wert 13-9 13-14 13-20 13-24 13-26 14-2 14-6 4-23 Kronecker-Symbol L Lebensdauer 3-4 4-18 Lebesgue-Dichte 4-6 Lebesgue - Doppel-Integral 4-25 - Integral 1-14 1-16 4-23 4-25 4-30 4-31 Leukämiefälle 0-2 LibreOffice S-1 Lindeberg-Levy 9-9 zentraler Grenzwertsatz 4-12 lineare Transformation linearer Zusammenhang 7-29 links-stetig 4-1 linksseitiger Grenzwert 4-1 Log-Normalverteilung 4-16 7-10 7-18 7-21 M M(-,-), Multinomial-Verteilung 4-23 7-27 Markov-Ungleichung 7-23 Maßzahl 7-1 4-30 mehrdimensionale Dichte 4-30 mehrdimensionale Verteilung 1-3 Mengensystem 2-2 meßbar 2-2 meßbare Menge S-1 Microsoft Excel 13-29 13-30 13-31 Mindestumfang 2-5 minimaler Träger 7-25 8-2 9-1 9-9 Mittelwert - standardisierter 9-2 - Verteilung 8-3 7-20 Moment - absolutes 7-20 9-11 zentrales - zentrales 7-20 8-6 1-8 monoton monotone Transformation 4-12 Multinomial-Verteilung 4-22 6-2 7-27 multivariate hypergeometrische Verteilung 9-31 9-34 9-35 multivariate Normal-Verteilung 4-32 multivariater hypergeometrischer Grenzwertsatz 9-36 N 1-18 N(-,-), Normalverteilung N(0,1), Standard-Normalverteilung 1-19 n-dimensionales Intervall 4-31 n-faches Lebesgue-Integral 4-31 Stochastik NB(n,p), negative Binomial-Verteilung 6-4 negative Binomial-Verteilung 6-4 7-9 7-17 7-21 9-21 S-1 13-22 13-25 Niveau, asymptotisches 14-6 14-13 nominales Niveau nominales Testniveau 13-8 14-2 14-5 Normal-Approximation 9-13 - Gamma-Verteilung 9-22 - Binomial-Verteilung 9-12 - Poisson-Verteilung 9-20 Normal-Verteilung 1-18 4-9 4-13 5-8 7-10 7-17 7-24 10-10 S-2 T-1 T-3 - Faltung 6-6 - Konfidenzgrenzen 10-3 - multivariate 4-32 4-27 7-29 - zweidimensionale 8-5 8-8 Normal-Verteilungsmodell normale asymptotische Grenzen 11-17 Nullhypothese S 13-3 0 obere Konfidenzgrenze für Erwartungswert 10-8 obere Konfidenzgrenze Normalverteilung 10-5 10-12 oberer kritischer Wert 13-9 13-20 14-2 14-3 OpenOffice S-1 p P-Wert 13-10 - asymptotischer 13-2113-24 Parameter 7-1 8-1 Phi, N(0,1)- Verteilungsfunktion 4-9 phi, N(0,1)-Dichte 1-19 Planung 13-28 Pois(-), Poison-Verteilung 1-13 Poisson-Approximation 9-18 Poisson-Grenzwertsatz 9-20 12-6 Poisson-Grenzwertsatz - für Binomial- Verteilung 9-18 Poisson-Prozeß 6-9 Poisson-Test 14-2 14-3 14-5 14-6 14-12 14-13 14-14 Poisson-Verteilung 1-13 4-4 6-9 7-9 7-17 7-21 9-20 12-114-1 S-1 6-3 - Faltung 8-5 Poisson-Verteilungsmodell 4-13 Potenz 13-6 Power 16.8.16 Index- 4 Produkt - diskrete Wahrscheinlichkeitsräume 3-7 - endliches 4-33 4-35 - abzählbares 6-11 - Zufallsvariablen 3-8 4-35 4-38 5-4 Produktmaß - ab zählbar-vieler Wahrscheinlichkeitsmaße 4-37 - endlich vieler Wahrscheinlichkeitsmaße 4-34 Produktraum 3-8 4-35 4-38 5-2 7-30 Prognose 3-8 4-35 4-36 5-2 Projektion Punkt-Schätzer 10-1 Q quadratische Form 8-8 Qualitätskontrolle 9-29 Quantil - Chiquadrat-Verteilung 12-5 T-5 - F-Verteilung 11-7 T-8 - Normalverteilung 10-4 T -3 - t- Verteilung 10-12 T-3 Quasi-Inverse 4-2 4-19 Quotient von Zufallsvariablen 6-12 R Rand- Verteilungsfunktion 5-10 randomisierte klinische Studie 5-4 Randverteilung 4-21 5-4 rechts-stetig 4-1 reelle Zufallsvariable 2-3 Regressionsfunktion 7-30 Regressionsgerade 7-30 8-10 relative Häufigkeit 1-1 1-8 1-11 7-25 8-4 8-10 7-30 Residuum 1-16 Riemann-Integral s Sammlerproblem 7-12 Satz von Fubini 4-25 4-26 4-31 Schärfe 13-6 13-15 13-18 13-26 14-2 14-3 14-4 14-5 14-6 14-7 14-13 14-14 - asymptotische 13-22 13-25 13-6 Schärfefunktion 8-2 Schätzer 8-2 Schätzfunktion 8-2 Schätzgröße 8-1 8-2 8-6 Schätzung 7-18 7-20 7-25 Schiefe 8-10 - Schätzung schwaches Gesetz der großen Zahlen 9-1 9-3 Stochastik 7-26 Schwartzsche Ungleichung 7-15 SD(-), Standardabweichung 1-20 SG(-,-) stetige Gleichverteilung 10-111-1 Sicherheit - asym ptotische 10-9 1-7 sigma-additiv 1-4 sigma-Algebra - erzeugte 1-5 13-10 Signifikanz der Beobachtung - asym ptotische 13-2113-24 9-23 Slutzky, Theorem Standard-Cauchy- Verteilung 7-11 6-8 Standard-Gamma-Verteilung 1-19 S-2 Standard-Normalverteilung 7-15 Standardabweichung - Schätzung 8-7 9-1 9-2 standardisierter Mittelwert Standardisierung 4-10 7-16 9-9 starkes Gesetz der großen Zahlen 9-4 Statistik 0-1 statistischer Test 13-4 stetig (verteilt) 4-6 stetige Gleichverteilung 1-20 4-9 4-13 4-19 7-10 7-17 4-24 stetiger Zufallsvektor 9-13 Stetigkeitskorrektur 13-28 Stich proben-Mindestumfang 8-1 Stich proben-Modell 1-1 Stich probenraum 0-1 Stochastik 9-3 9-5 stochastisch konvergent 3-5 5-1 stochastische Unabhängigkeit 0-1 1-1 stochastischer Vorgang 10-10 Studentsehe t- Verteilung 6-11 Summe von Zufallsvariablen 7-18 symmetrische Verteilung T 10-10 S-2 T-3 t- Verteilung S-1 Tabellenkalkulation 13-4 14-1 Test Testniveau 13-8 13-10 13-15 13-18 14-2 Testwert 13-20 13-26 totale Zerlegung, Satz 3-3 Träger 2-5 Trägerintervall 4-7 4-7 - kanonisches - minimales 2-6 4-7 Transformation - einer Zufallsvariablen 4-11 - lineare 4-12 - monotone 4-12 1-10 3-9 5-5 6-4 Treffer 16.8.16 Index- 5 u 3-5 Unabhängigkeit - diskreter Zufallsvariabl. 5-3 5-8 - stetiger Zufallsvariablen - von Zufallsvariablen 5-1 - von Zufallsvektoren 5-9 7-23 Ungleichung von Chebychev 7-23 Ungleichung von Markov 7-26 Ungleichung von Schwartz untere Konfidenzgrenze 10-8 - für Erwartungswert 10-5 10-12 - Normalverteilung unterer kritischer Wert 13-14 13-24 14-5 14-6 8-2 unverfälscht 2-1 Urbild V 7-15 Var(-) Varianz 7-15 7-25 7-26 Varianz 8-8 - quadratische Form 8-6 - Schätzung - spezieller Verteilungen 7-17 2-2 verteilt 1-7 2-2 Verteilung 7-25 - empirische 4-21 - gememsame - Zufallsvektoren 4-21 - zweidimensionale 4-23 4-1 4-5 4-8 7-5 9-8 Verteilungsfunktion T-1 - Normalverteilung - Standard-Normalverteilung 4-9 - Zufallsvektors 4-21 9-7 Verteilungskonvergenz 10-1 Vertrauensgrenze w Wahrscheinlichkeitsmaß 1-7 Wahrscheinlichkeitsraum 1-7 - endlicher 1-9 Wahlumfrage 0-6 9-16 9-25 9-29 13-113-5 13-2113-30 1-1 1-7 Wahrscheinlichkeit 3-1 - bedingte 1-14 1-17 Wahrscheinlichkeitsdichte Wahrscheinlichkeitsdichte - mehrdimensionale 4-30 4-23 - zweidimensionale 1-10 1-13 Wahrscheinlichkeitsfunktion 0-1 Wahrscheinlichkeitstheorie 4-23 Wahrscheinlichkeitsvektor 3-4 5-7 6-9 Wartezeit 4-18 Weibull-Verteilung Stochastik Wiederholungen Würfel z 16.8.16 8-1 9-1 3-10 1-10 1-13 4-3 Zähldichte 9-1 9-7 zentraler Grenzwertsatz zentrales Moment 7-20 3-3 Zerlegung, totale Ziehen (mit und ohne Zurücklegen) 9-26 1-10 Ziel-Ereignis Zufallselement 2-2 Zufallsvariable 2-2 Zufallsvariable - diskrete 4-3 5-3 - reelle 2-3 4-6 - stetige 4-19 4-21 Zufallsvektor 4-22 - diskreter 4-24 - stetiger 4-19 Zufallszahlen 7-29 Zusammenhang, linearer zweidimensionale 4-23 - Dichte 4-27 7-29 - Normal-Verteilung 4-23 zweidimensionale Verteilung 4-24 zweidimensionales Intervall 13-16 zweiseitige Alternative 13-18 zweiseitiger Test - Binomial 13-31 14-12 14-13 Poisson 4-37 Zylindermenge Index- 6