Otto-von-Guericke-Universitat Magdeburg Fakultat fur Mathematik Institut fur Mathematische Stochastik Statistik II fur wirtschaftswissenschaftliche Studiengange (Vorlesungsmanuskript und U bungsaufgaben) von apl.Prof. Dr. Waltraud Kahle c Alle Rechte bei der Autorin W. Kahle Vorwort Mathematische Methoden und Verfahren der Statistik gewinnen in der Wirtschaftswissenschaft zunehmend an Bedeutung. Aus diesem Grunde ist das Fach "Induktive Statistik\ ein wichtiger Bestandteil des Grundstudiums fur wirtschaftswissenschaftliche Studiengange. Erfahrungsgema fallt vielen Studierenden das Verstandnis des mathematischen Hintergrundes der statistischen Verfahren nicht leicht. Als kleine Hilfestellung fur die Horer meiner Vorlesung gebe ich das Vorlesungsskript in der vorliegenden Form heraus. Es enthalt alle wichtigen Begrie, Aussagen und Verfahren. Damit soll die Vorlesung vom mechanischen Mitschreiben entlastet werden und es sollen Freiraume zum Mitdenken und Verstehen geschaen werden. Naturlich kann dieses Vorlesungsskript den Besuch der Vorlesung nicht ersetzen. In der Vorlesung werden die Begrie und Aussagen erklart und es wird erlautert, wie die statistischen Verfahren bei der Losung von Aufgaben angewendet werden konnen. Das Manuskript enthalt am Ende jedes Abschnittes eine Anzahl von U bungsaufgaben. Hieraus ausgewahlte Aufgaben werden in den U bungen besprochen. Ich empfehle allen Studierenden, auch die restlichen Aufgaben selbstandig zu losen. Das ist einerseits eine gute Vorbereitung auf die Klausuren und hilft andererseits, den eigenen Kenntnisstand real einzuschatzen und eventuelle Fragen in den U bungen zu klaren. Die mit einem * gekennzeichten Aufgaben sind von einem hoheren Schwierigkeitsgrad und dienen einem vertiefenden Verstandnis. Fur ein erganzendes Literaturstudium ist am Ende des Skriptes aus der Fulle der Literatur zur induktiven Statistik eine kleine Auswahl der gebrauchlichsten Lehrbucher angegeben, die meines Erachtens nach den Sto sowohl verstandlich als auch mathematisch korrekt beschreiben. Ebenfalls am Ende des Skriptes nden sich die fur das Losen der U bungsaufgaben notwendigen Tabellen. Magdeburg, August 1999 W. Kahle 1 Inhaltsverzeichnis 1 Zufallsvorgange, Ereignisse und Wahrscheinlichkeiten 1.1 1.2 1.3 1.4 1.5 Zufallige Versuche (Zufallsvorgange) und Ereignisse . . . . Die Wahrscheinlichkeit von Ereignissen . . . . . . . . . . . Rechenregeln fur Wahrscheinlichkeiten . . . . . . . . . . . Bedingte Wahrscheinlichkeiten und unabhangige Ereignisse U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Zufallsgroen (Zufallsvariablen) und Wahrscheinlichkeitsverteilungen 2.1 2.2 2.3 2.4 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . Wahrscheinlichkeitsverteilungen diskreter Zufallsvariablen . Wahrscheinlichkeitsverteilungen stetiger Zufallsgroen . . Parameter von Wahrscheinlichkeitsverteilungen . . . . . . 2.4.1 Der Erwartungswert . . . . . . . . . . . . . . . . . 2.4.2 Standardabweichung und Varianz . . . . . . . . . . 2.5 Die Ungleichung von Tschebyschev . . . . . . . . . . . . . 2.6 U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . 3 Spezielle Wahrscheinlichkeitsverteilungen 3.1 Diskrete Verteilungen . . . . . . . . . . . . 3.1.1 Die Null-Eins-Verteilung . . . . . . 3.1.2 Die Binomialverteilung . . . . . . . 3.1.3 Die geometrische Verteilung . . . . 3.1.4 Die Poissonverteilung . . . . . . . . 3.1.5 Die hypergeometrische Verteilung . 3.2 Stetige Wahrscheinlichkeitsverteilungen . . 3.2.1 Die Normalverteilung . . . . . . . . 3.2.2 Die Exponentialverteilung . . . . . 3.2.3 Die gleichmaig stetige Verteilung . 3.2.4 Die logistische Verteilung . . . . . . 3.2.5 Die Paretoverteilung . . . . . . . . 3.3 U bungsaufgaben . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 7 7 8 15 15 15 16 17 17 17 18 18 23 23 23 24 24 25 26 26 26 27 27 28 28 29 4 Approximationsmoglichkeiten, das Gesetz der groen Zahlen und der zentrale Grenzwertsatz 37 4.1 4.2 4.3 4.4 Approximationsmoglichkeiten innerhalb der diskreten Verteilungen . Gesetz der groen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . Der zentrale Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Mehrdimensionale Zufallsgroen 5.1 5.2 5.3 5.4 5.5 Diskrete zweidimensionale Zufallsgroen Stetige zweidimensionale Zufallsgroen . Die Kovarianz . . . . . . . . . . . . . . . Der Korrelationskoezient . . . . . . . . U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 38 38 39 42 42 43 44 45 47 6 Funktionen von Zufallsgroen und Grundverteilungen der mathematischen Statistik 49 6.1 Funktionen von Zufallsgroen . . . . . . . . . 6.2 Funktionen zufalliger Vektoren . . . . . . . . . 6.3 Verteilungen der mathematischen Statistik . . 6.3.1 Die 2{Verteilung . . . . . . . . . . . 6.3.2 Die Student{Verteilung (t{Verteilung) 6.3.3 Die F {Verteilung . . . . . . . . . . . . 6.4 U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Einige Auswahltechniken . . . . . . . . . . . . . 7.2 Geschichtete Stichproben . . . . . . . . . . . . . 7.2.1 Die proportional geschichtete Stichprobe 7.2.2 Die optimal geschichtete Stichprobe . . . 7.2.3 Bemerkungen zum Schichtungseekt . . 7.3 Klumpenstichproben . . . . . . . . . . . . . . . 7.4 U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Stichproben 8 Punktschatzungen 8.1 8.2 8.3 8.4 Maximum{Likelihood{Methode . . . . . . . . . . . . . . . . . . . Momentenmethode . . . . . . . . . . . . . . . . . . . . . . . . . . Methode der kleinsten Quadrate . . . . . . . . . . . . . . . . . . . Bayessche Schatzungen . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Die a-posteriori-Verteilung bei diskreter a-priori Verteilung 8.4.2 Die a-posteriori-Verteilung bei stetiger a-priori Verteilung . 8.4.3 Der Schatzwert eines Subjektivisten . . . . . . . . . . . . . 8.5 Eigenschaften von Schatzungen . . . . . . . . . . . . . . . . . . . 8.6 U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 50 51 51 52 52 53 56 56 57 58 59 60 60 62 65 65 66 66 68 69 70 71 71 73 3 9 Kondenzschatzungen 9.1 Kondenzschatzungen fur den Parameter der Normalverteilung bei bekanntem 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Kondenzschatzungen fur den Parameter der Normalverteilung bei unbekanntem 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Kondenzintervalle fur den Parameter 2 der Normalverteilung bei bekanntem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Kondenzintervalle fur den Parameter 2 der Normalverteilung bei unbekanntem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5 Kondenzschatzungen fur eine unbekannte Wahrscheinlichkeit p . . . . . 9.6 U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Testtheorie 10.1 Aufgabenstellung und Begrie . . . . . . . . . . . . . . . . . . . . 10.2 Parametertests fur die Parameter der Normalverteilung . . . . . . 10.2.1 Der Gau{Test . . . . . . . . . . . . . . . . . . . . . . . . 10.2.2 Der t{Test . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.3 Der 2-Test fur die Varianz bei bekanntem . . . . . . . . 10.2.4 Der 2-Test fur die Varianz bei unbekanntem . . . . . . 10.3 Tests zum Vergleich zweier Mittelwerte . . . . . . . . . . . . . . . 10.3.1 Der doppelte Gautest . . . . . . . . . . . . . . . . . . . . 10.3.2 Der doppelte t{Test . . . . . . . . . . . . . . . . . . . . . . 10.3.3 Der Test von Welch . . . . . . . . . . . . . . . . . . . . . . 10.3.4 Der t{Dierenzentest . . . . . . . . . . . . . . . . . . . . . 10.4 Der einfache Gau{Test fur eine unbekannte Wahrscheinlichkeit p 10.5 Der 2-Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Der 2-Unabhangigkeitstest . . . . . . . . . . . . . . . . . . . . . 10.7 U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Losungen zu den U bungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 76 77 78 79 80 81 83 83 84 84 84 85 85 86 86 86 87 88 88 89 90 92 98 Tabellen 114 Literatur 118 4 1 Zufallsvorgange, Ereignisse und Wahrscheinlichkeiten 1.1 Zufallige Versuche (Zufallsvorgange) und Ereignisse Denition 1.1 Ein zufalliger Versuch ist ein beliebig oft und gleichartig wiederhol- barer Vorgang mit mindestens zwei verschiedenen Ergebnissen, bei dem der Ausgang ungewi ist. Die moglichen, nicht mehr zerlegbaren, sich gegenseitig ausschlieenden Ergebnisse heien Elementarereignisse !1 ; :::; !n: Denition 1.2 Die Menge aller Elementarereignisse eines zufalligen Versuches heit Ereignisraum = (!1; :::; !n). Wir betrachten im weiteren Ereignisse, die aus Elementarereignissen zusammengesetzt sind und sich nicht gegenseitig ausschlieen mussen. Fur die Ereignisse A1; A2 ; :::; B; C; ::: sowie fur die Beziehungen zwischen ihnen gibt es Sprech- und Schreibweisen, die in der Tabelle 1.1 zusammengestellt sind. 1.2 Die Wahrscheinlichkeit von Ereignissen Der klassische Wahrscheinlichkeitsbegri (Laplace'sche Denition der Wahrscheinlichkeit): der fur A gunstigen Ausgange P (A) = Anzahl Anzahl der moglichen Ausgange Dabei wird die "Gleichwahrscheinlichkeit\ der Versuchsausgange vorausgesetzt! Die von Mises'sche Denition der Wahrscheinlichkeit (Haugkeitsinterpretation): Bezeichnen wir mit hn(A) die absolute Haugkeit des Eintretens des Ereignisses A in n Versuchen. fur groe n. P (A) hnn(A) 5 Beschreibung des zugrundeliegen- Bezeichnung (Sprech- Darstellung in den Sachverhalts weise) (Schreibweise als Teilmenge) 1. A tritt sicher ein A ist sicheres Ereignis A = 2. A tritt sicher nicht ein A ist unmogliches A = ; Ereignis 3. wenn A eintritt, tritt B ein A ist Teilereignis von A B B 4. genau dann, wenn A eintritt, tritt A und B sind aquiva- A = B B ein lente Ereignisse 5. wenn A eintritt, tritt B nicht ein A und B sind disjunk- A \ B = ; te Ereignisse 6. genau dann, wenn A eintritt, tritt A und B sind komple- B = A B nicht ein mentare Ereignisse S 7. genau dann, wenn mindestens A ist Vereinigung der A = Aj j ein Aj eintritt (auch: genau dann, Aj wenn A1 oder A2 oder ... eintritt), tritt A ein T 8. genau dann, wenn alle Aj eintre- A ist Durchschnitt A = Aj j ten (auch: genau dann, wenn A1 der Aj und A2 und ... eintreten), tritt A ein Tabelle 1.1: Zusammenstellung wichtiger Sprech- und Schreibweisen bei der Bildung von Ereignissen Die geometrische Wahrscheinlichkeit: che der fur A gunstigen Ausgange P (A) = FlaFl ache der moglichen Ausgange Axiome der Wahrscheinlichkeiten Die Ereignisse aus (nicht notwendig Elementarereignisse) bilden einen Boolschen Mengenring. Jedem Ereignis A dieser Menge wird eine Mazahl P (A) zugeordnet, so da P (A) 0; P ( ) = 1; P (A1 [ A2 [ ::: [ An ) = P (A1) + P (A2) + + P (An) fur Ai \ Aj = ;; i 6= j: Im weiteren sehen wir vorerst die Wahrscheinlichkeiten als gegeben an und lernen Gesetzmaigkeiten der Wahrscheinlichkeitsrechnung kennen. Spater werden Methoden zur Ermittlung des Wahrscheinlichkeitsmaes behandelt (Statistik). 6 A1 A4 ' & $ % A2 A3 ::: An B Abbildung 1.1: Eine Zerlegung 1.3 Rechenregeln fur Wahrscheinlichkeiten 1. P (A) 1 2. P (;) = 0 (jedoch nicht umgekehrt!) 3. A B ! P (A) P (B ) 4. P (A) = 1 ; P (A) 5. Additionssatz: P (A1 [ A2 [ ::: [ An) = P (A1) + P (A1 \ A2 ) + ::: + P (A1 \ ::: \ An;1 \ An) P (A1 [ A2) = P (A1) + P (A2) ; P (A1 \ A2) P (A1 [ A2) = P (A1) + P (A2) bei disjunkten Ereignissen 6. Zerlegung: A1 ; A2; :::An bilden eine Zerlegung von , wenn sie paarweise disjunkt sind (Ai \ Aj = ;; i 6= j ) und wenn A1 [ A2 ::: [ An = (siehe Abbildung 1.1). Dann gelten B = (B \ A1) [ (B \ A2) [ ::: [ (B \ An) P (B ) = n X i=1 und P (B \ Ai) 1.4 Bedingte Wahrscheinlichkeiten und unabhangige Ereignisse Oft ist die Wahrscheinlichkeit eines Ereignisses von Interesse, wenn man wei, da ein anderes Ereignis bereits eingetreten ist. Diese Wahrscheinlichkeit wird als bedingte Wahrscheinlichkeit von A unter der Bedingung B bezeichnet. Schreibweise: P (AjB ) 7 Fur die Wahrscheinlichkeit eines bedingten Ereignisses gilt \ B ) fur P (B ) > 0 : P (AjB ) = P (PA(B ) Hieraus erhalt man fur den Durchschnitt von Ereignissen den Multiplikationssatz: P (A \ B ) = P (B ) P (AjB ) = P (A) P (B jA) Formel uber die totale Wahrscheinlichkeit: A1; A2 ; :::An bilden eine Zerlegung von . Dann gilt P (B ) = = n X i=1 n X i=1 P (B \ Ai) P (B jAi) P (Ai) Der Satz von Bayes: A1; A2 ; :::An bilden eine Zerlegung von . Dann gilt P (AijB ) = P (PA(i B\)B ) P (B jAi) P (Ai) = P n P (B jAi) P (Ai) i=1 P (Ai) heit a-priori{Wissen und P (AijB ) heit a-posteriori{Wissen. Unabhangigkeit von Ereignissen: Denition 1.3 Die Ereignisse A und B heien unabhangig, wenn P (AjB ) = P (A) oder P (AjB ) = P (AjB ): Multiplikationssatz fur unabhangige Ereignisse: P (A \ B ) = P (A) P (B ) : 1.5 U bungsaufgaben Aufgabe 1.1 Beweisen Sie, da die Summe der Binomialkoezienten betragt! 8 ;n fur i = 0; : : : ; n genau 2n i Aufgabe 1.2 Wieviele Diagonalen besitzt ein n-Eck? Aufgabe 1.3 Eine Munze wird funfmal geworfen. Es wird notiert, ob Zahl oder Wappen erscheint. Wieviele verschiedene Versuchsprotokolle sind moglich? Aufgabe 1.4 Wieviele Moglichkeiten gibt es, bei "6 aus 49\ 4 richtige Zahlen getippt zu haben? Aufgabe 1.5 Auf wieviele Arten kann man aus zehn Personen ein Vierer-Gremium bilden? Aufgabe 1.6 Bei einer Feier sind 13 Gaste versammelt. Jeder prostet jedem zu und stot mit dem Weinglas an. Wie oft klingt es im Raum? Aufgabe 1.7 Der Verursacher eines Verkehrsunfalls hat Fahrerucht begangen. U ber sein Kfz{ Kennzeichen kann ein Unfallzeuge folgende Angaben machen: Es bestand aus dem Ortskennzeichen MD, der Buchstabengruppe EU, EV oder EY sowie drei Ziern, von denen die erste die 3 und unter denen noch mindestens eine 4 war. Welche und wieviele Kfz{Kennzeichen sind moglich, wenn man dem Unfallzeugen Glauben schenkt? Aufgabe 1.8 Zwei Gluhlampen, eine rote und eine weie, konnen eingeschaltet werden. Denieren Sie sich geeignete Ereignisse und stellen Sie mit diesen die folgenden Ereignisse dar: a) Alle Lampen brennen. b) Keine Lampe brennt. c) Nur die rote Lampe brennt. d) Nur die weie Lampe brennt. e) Genau eine Lampe brennt. f) Mindestens eine Lampe brennt. g) Hochstens eine Lampe brennt. 9 Aufgabe 1.9 A sei das Ereignis, da von 5 Werkstucken genau 3 normgerecht sind. B bedeute, da wenigstens 3 normgerecht sind. Was bedeuten dann die Ereignisse A; B ; A\B ; A[B ? Aufgabe 1.10 Der Unfallzeuge aus Aufgabe 1.7 sieht alle aufgrund seiner Wahrnehmung (MD; EU, EV oder EY; drei Ziern, beginnend mit 3, unter ihnen mindestens eine 4) noch moglichen Kfz-Kennzeichen als gleichwahrscheinlich an. Wie gro ist die Wahrscheinlichkeit, da a) die Buchstabengruppe EY vorliegt? b) die ersten beiden Ziern 34 lauten? c) die letzten beiden Ziern 47 lauten? d) die letzte Zier 4 ist? e) unter den drei Ziern die 0 vorkommt? f) die letzte Zier groer ist als die beiden anderen? Aufgabe 1.11 Zur Ausarbeitung eines Vortrages schreibt Herr H. an 3 aufeinanderfolgenden Tagen auf Klarsichtfolien. Dazu nimmt er jeden Morgen aus einer Schublade, in der 5 auf den ersten Blick gleich aussehende schwarze Folienschreiber liegen, zufallig einen heraus, den er den ganzen Tag benutzt und a) am Abend wieder zu den anderen zurucklegt, b) am Abend nicht wieder zurucklegt. Am 4. Tag entdeckt Herr H. bei der Durchsicht des Geschriebenen einige Fehler, die er ausbessern mochte, indem er die entsprechenden Stellen abwascht und neu schreibt. Nun waren von den 5 Stiften nur 2 abwaschbar. Wie gro ist die Wahrscheinlichkeit der Ereignisse A : am ersten Tag wurde abwaschbar geschrieben B : an keinem der drei Tage wurde ein abwaschbarer Stift verwendet, und zwar sowohl im Fall a) als auch im Fall b)? Aufgabe 1.12 Von 10 Pumpen seien 4 defekt. Zwei Pumpen werden zufallig ausgewahlt; fur folgende Ereignisse seien sowohl im Falle mit Zurucklegen als auch im Falle ohne Zurucklegen die Wahrscheinlichkeiten zu bestimmen: 10 Ai : die i{te ausgewahlte Pumpe ist defekt, B : mindestens eine der beiden ausgewahlten Pumpen ist defekt. Aufgabe 1.13 In einer Serie von 12 Produkten sind 4 defekte. Wie gro ist die Wahrscheinlichkeit dafur, da man bei zwei aufeinanderfolgenden Zugen 2 brauchbare Produkte erhalt, wenn man a) das zuerst gezogene Produkt beiseite legt, b) das zuerst gezogene Produkt zurucklegt? Aufgabe 1.14 Man zeige, da beim Wurfelspiel mit 3 Wurfeln die Wahrscheinlichkeit fur die Augensumme 11 groer als die Wahrscheinlichkeit der Augensumme 12 ist! Aufgabe 1.15 Ein inhomogener Wurfel ist so belegt, da die Wahrscheinlichkeit dafur, da eine der Zahlen erscheint, proportional zu dieser ist. Man berechne die Wahrscheinlichkeit dafur, da a) eine gerade Zahl, b) eine Primzahl geworfen wird. Aufgabe 1.16 Drei voneinander unabhangige Relais arbeiten mit den Wahrscheinlichkeiten 0.9; 0.8 und 0.95 im Zeitintervall (0; t) ohne Ausfall. Berechnen Sie die Wahrscheinlichkeiten dafur, da in (0; t) a) kein Relais ausfallt, b) genau ein Relais ausfallt, c) wenigstens ein Relais nicht ausfallt! Aufgabe 1.17 Ein Versuch gelingt mit einer Wahrscheinlichkeit von 0.2. Wieviele solcher Versuche mu man durchfuhren, damit mit einer Wahrscheinlichkeit von 0.9 wenigstens einer gelingt? Aufgabe 1.18 Man zeige: Sind die Ereignisse A und B unabhangig, so auch 1. A und B 2. A und B 11 3. A und B: Aufgabe 1.19 Ist es wahrscheinlicher, bei vier Wurfen mit einem Wurfel mindestens eine Sechs zu werfen oder bei 24 Wurfen mit je zwei Wurfeln mindestens eine Doppel{Sechs? Aufgabe 1.20 Zwei Personen A und B gehen das folgende Spiel ein: Eine Munze wird wiederholt geworfen; wenn bei einem Wurf "Wappen\ erscheint, erhalt A einen Punkt, sonst B . Wer zuerst funf Punkte erzielt, hat gewonnen und erhalt den Einsatz (den A und B je zur Halfte eingesetzt haben). Nach sieben Wurfen hat A vier Punkte und B drei. Das Spiel mu abgebrochen werden. Wie lautet die gerechte Aufteilung des Einsatzes, wenn man unter "gerecht\ eine Aufteilung im Verhaltnis der Gewinnchancen versteht? Aufgabe 1.21 Wieviele Wurfe mit je zwei Wurfel braucht man mindestens, um mit einer Wahrscheinlichkeit von mehr als 50% mindestens eine Doppel-Sechs zu erzielen? Aufgabe 1.22 Einem Urlauber ist von seinem Ferienort bekannt, da auf einen Tag ohne Regen mit Wahrscheinlichkeit 0.8 wieder ein niederschlagsfreier Tag und auf einen Tag mit Regen mit Wahrscheinlichkeit 0.6 wieder ein Tag mit Niederschlag folgt. Er ist an einem Tag ohne Regen angekommen und mochte drei Tage spater eine Tour unternehmen. Wie gro ist die Wahrscheinlichkeit, da er dazu einen Tag ohne Niederschlag erwischt? Aufgabe 1.23 Von drei Urnen U1; U2 und U3 wird eine zufallig ausgewahlt; jede Urne hat die gleiche Wahrscheinlichkeit, gewahlt zu werden. Die Urnen enthalten nur schwarze und weie Kugeln, U1 : 7 schwarze und 3 weie, U2: 5 schwarze und 5 weie, U3 : 2 schwarze und 8 weie. Aus der gewahlten Urne wird anschlieend eine Kugel zufallig gezogen. 1. Wie gro ist die Wahrscheinlichkeit, dabei eine schwarze Kugel zu ziehen? 2. Es wurde eine schwarze Kugel gezogen: Wie gro ist die Wahrscheinlichkeit, da sie aus Urne U1 (bzw. U2 bzw. U3) stammt? Aufgabe 1.24 Ein Labortest zur Erkennung einer Krankheit K, an der 5% einer bestimmten Bevolkerung leiden, besitze die folgende Wirkungsweise: Hat eine Person die Krankheit K, so zeigt der Test diese mit Wahrscheinlichkeit 0.96 auch an; hat eine Person die Krankheit K nicht, so zeigt der Test K immerhin noch mit Wahrscheinlichkeit 0.16 an. Man berechne die Wahrscheinlichkeit dafur, da eine zufallig aus der Bevolkerung gewahlte Person 12 1. an der Krankheit K leidet, obwohl der Test "nicht K\ indizierte 2. an der Krankheit K nicht leidet, obwohl der Test K indizierte. Aufgabe 1.25 Die Wahrscheinlichkeit dafur, da in einem gewissen Werk ein Erzeugnis der Norm genugt, sei gleich 0.90. Ein Prufverfahren ist so angelegt, da es fur ein der Norm genugendes Stuck das Resultat "normgerecht\ mit einer Wahrscheinlichkeit von 0.95 anzeigt. Fur ein Stuck, das der Norm nicht genugt, zeigt das Prufverfahren das Resultat "normgerecht\ immerhin noch mit einer Wahrscheinlichkeit von 0.10 an. 1. Wie gro ist die Wahrscheinlichkeit dafur, da ein unter diesem Prufverfahren fur normgerecht befundenes Stuck auch tatsachlich die Norm erfullt? 2. Wie gro ist diese Wahrscheinlichkeit, wenn das Prufverfahren fur dasselbe Stuck zweimal unabhangig voneinander das Ergebnis "normgerecht\ angezeigt hat? Aufgabe 1.26 Bei einem Wurfelspiel mit zwei Wurfeln betrachten wir die Ereignisse A : erster Wurfel zeigt eine gerade Zahl B : zweiter Wurfel zeigt eine ungerade Zahl C : die Summe der beiden Augenzahlen ist gerade. Man zeige, da je zwei der drei Ereignisse voneinander unabhangig, alle drei Ereignisse aber voneinander abhangig sind. Aufgabe 1.27 Eine Firma stellt einen Konsumartikel auf drei Maschinen unterschiedlicher Kapazitat her. Maschine M1 M2 M3 gelieferter Anteil der Gesamtproduktion 60% 25% 15% Ausschuwahrscheinlichkeit 0.09 0.12 0.04 Aus der Gesamtproduktion wird ein Stuck zufallig entnommen. a) Mit welcher Wahrscheinlichkeit ist dieses Stuck Ausschu? b) Das entnommene Stuck ist Ausschu. Mit welcher Wahrscheinlichkeit stammt es von Mi i = 1; 2; 3? 13 Aufgabe 1.28 In einer Firma vollzieht sich die Herstellung eines bestimmten Produkts in zwei nacheinander und unabhangig voneinander ablaufenden Arbeitsgangen. Nach seiner Fertigstellung wird jedes Stuck kontrolliert und gilt als Ausschu, wenn bei seiner Fertigung in (mindestens) einem der beiden Arbeitsgange ein Fehler passiert ist. Die Wahrscheinlichkeit fur das Entstehen eines Ausschustucks betragt 8%; dabei geschieht im ersten Arbeitsgang mit Wahrscheinlichkeit 1=24 ein Fehler. Wie gro ist die Wahrscheinlichkeit fur einen Fehler im zweiten Arbeitsgang? 14 2 Zufallsgroen (Zufallsvariablen) und Wahrscheinlichkeitsverteilungen 2.1 Zufallsvariablen Denition 2.1 Eine Funktion X , die jedem Elementarereignis ! 2 eine reelle Zahl X (!) zuordnet, heit Zufallsvariable oder Zufallsgroe X : ! ! X (!) 2 R : Damit werden die Ergebnisse von Zufallsexperimenten durch reelle Zahlen ausgedruckt. Bezeichnung der Zufallsgroen: X; Y; Z; Bezeichnung der moglichen Realisierungen: x; y; z: Denition 2.2 Eine Zufallsvariable, die 1. abzahlbar viele Werte annehmen kann, heit diskret. 2. uberabzahlbar viele Werte annehmen kann, heit stetig. Damit gilt bei Zufallsvariablen: Ereignisse werden durch reelle Zahlen beschrieben Wahrscheinlichkeiten dieser Ereignisse werden den reellen Zahlen zugeordnet. Die geordneten Werte zur Zufallsvariablen und die dazugehorigen Wahrscheinlichkeiten ergeben die Wahrscheinlichkeitsverteilung der Zufallsgroe. 2.2 Wahrscheinlichkeitsverteilungen diskreter Zufallsvariablen Betrachten wir eine diskrete Zufallsgroe X , die die Werte x1; x2 ; : : : mit den Wahrscheinlichkeiten P (X = xi ) = pi = fX (xi) annehmen kann. Die Werte fX (xi ) = pi = P (X = xi ) heien Einzelwahrscheinlichkeiten. fX (xi ) wird auch Wahrscheinlichkeitsfunktion genannt. 15 Denition 2.3 Gegeben sei eine diskrete Zufallsgroe X mit den Einzelwahrscheinlichkeiten fX (xi ) = pi = P (X = xi ). Die Funktion FX (x) := P (X x) = X fX (xi ) = i: xi x X i: xi x pi heit Verteilungsfunktion. 2.3 Wahrscheinlichkeitsverteilungen stetiger Zufallsgroen An die Stelle der Einzelwahrscheinlichkeiten (Wahrscheinlichkeitsfunktion) tritt die Dichtefunktion. Denition 2.4 Die Dichtefunktion fX (x) einer stetigen Zufallsvariablen X ist eine intervallweise stetige Funktion, fur die gilt Z1 ;1 fX (x) dx = 1 fX (x) 0: und Sei fX (x) die Dichtefunktion einer stetigen Zufallsgroe. Dann lassen sich die Wahrscheinlichkeiten folgendermaen berechnen: P (a < X b) = wichtige Eigenschaft: Zb fX (x) dx a P (X = x0 ) = 0 Denition 2.5 Gegeben sei eine stetige Zufallsgroe X mit fX (x). Die Funktion FX (x) = P (X x) = Zx ;1 fX (t) dt heit Verteilungsfunktion der Zufallsgroe X . Mittels der Verteilungsfunktion lassen sich die Wahrscheinlichkeiten folgendermaen berechnen: P (a x b) = FX (b) ; FX (a): 16 2.4 Parameter von Wahrscheinlichkeitsverteilungen 2.4.1 Der Erwartungswert Denition 2.6 Der Erwartungswert E(X) einer Zufallsvariablen X ist deniert als E (X ) = E (X ) = X i Z1 ;1 xifX (xi) = X i xi pi fur diskrete Zufallsgroen X , xfX (x) dx fur stetige Zufallsgroen X . Bemerkung 2.1 Der Erwartungswert einer Funktion g(X ) wird folgendermaen berechnet: E (g(X )) = E (g(X )) = (vgl. auch Abschnitt 6.1) X i Z1 ;1 g(xi)pi fur diskrete Zufallsgroen X , g(x)f (x) dx fur stetige Zufallsgroen X . 2.4.2 Standardabweichung und Varianz Denition 2.7 Die Varianz einer Zufallsgroe X ist deniert als X V ar(X ) = D2(X ) = E [(X ; E (X ))2] = (xi ; E (X ))2fX (xi ) = E (X 2) ; (E (X ))2 i fur diskrete und V ar(X ) = D2(X ) = E [(X ; E (X ))2] = Z1 ;1 (x ; E (X ))2fX (x) dx = E (X 2) ; (E (X ))2 fur stetige Zufallsgroen. Haug werden der Erwartungswert mit dem Symbol und die Varianz mit dem Symbol 2 bezeichnet. Denition 2.8 Die Quadratwurzel aus der Varianz heit Standardabweichung p x = V ar(X ): Denition 2.9 Ist X eine beliebige Zufallsgroe, so bezeichnen wir mk = E (X k ) bzw. k = E ((X ; )k ) als das gewohnliche bzw. zentrale Moment k{ter Ordnung. 17 Als ein Ma fur die Unsymmetrie einer Verteilung dient das sogenannte Schiefema = E [(X;3 ) ] ; 3 dabei ist X eine Zufallsvariable mit E (X ) = und V ar(X ) = 2. Denition 2.10 Ist X eine beliebige Zufallsgroe und p eine beliebige reelle Zahl (0 < p < 1), so heit eine Zahl qp mit den Eigenschaften P (X < qp) p und P (X > qp) 1 ; p Quantil der Ordnung p. Das Quantil der Ordnung 0:5 wird als Median bezeichnet. 2.5 Die Ungleichung von Tschebyschev Diese Ungleichung dient dazu, die Abweichungen einer Zufallsgroe von ihrem Erwartungswert abzuschatzen: 2 P (jx ; j c) c12 bzw. P (jx ; j c) c2 : 2.6 U bungsaufgaben Aufgabe 2.1 Fur einen Betrieb werden 3 Bohrmaschinen gekauft. Diese haben unterschiedliche Qualitatseigenschaften. Die Wahrscheinlichkeiten dafur, da diese langer als 5 000 Stunden ausfallfrei arbeiten, betragen jeweils 0.8; 0.7; 0.6 . Es ist die Zufallsgroe X : "Anzahl der Maschinen, die langer als 5 000 h arbeiten\ zu untersuchen. a) Welche Werte kann die Zufallsgroe X annehmen? b) Bestimmen Sie ihre Verteilungstabelle und deren graphische Darstellung! Aufgabe 2.2 Die Korrektur einer Klausur haben sich zwei Lehrpersonen so aufgeteilt, da L1 bei jedem abgegebenen Exemplar die beiden ersten und L2 die restlichen Aufgaben korrigiert. Die in Minuten gemessenen Korrekturdauern X von L1 und Y von L2 bei einem zufallig herausgegrienen Klausurexemplar seinen Zufallsvariablen, fur die folgende Wahrscheinlichkeiten bekannt seien: Bereich B [0; 10] (10; 20] (20; 1) P (X 2 B ) 1/3 1/3 1/3 P (Y 2 B ) 1/4 1/2 1/4 18 a) X und Y werden als unabhangig angesehen. Wie gro ist dann die Wahrscheinlichkeit, da fur ein zufallig ausgewahltes Exemplar { jeder der beiden hochstens 10 min bzw. hochstens 20 min braucht? { L1 hochstens 10 min und L2 uber 20 min benotigt? b) Sind X und Y unabhangig, wenn die Wahrscheinlichkeit, da L2 mit der Korrektur eines Exemplars langer als 20 min beschaftigt ist, falls fur dieses Exemplar bereits L1 uber 20 min gebraucht hat, 1/2 betragt? Aufgabe 2.3 Vier in Reihe geschaltete gleichartige elektrische Gerate liegen still, weil durch einen Defekt bei (genau) einem von ihnen die Stromzufuhr unterbrochen wurde. Durch eine Einzeluberprufung eines Gerates kann eindeutig festgestellt werden, ob es defekt ist oder nicht. Sei X die Anzahl der Gerate, die einer derartigen Einzeluberprufung unterzogen werden mussen (ohne Zurucklegen), bis feststeht, bei welchem der vier der Defekt vorliegt. Berechnen und skizzieren Sie die Verteilungsfunktion von X unter der Voraussetzung, da jedes der Gerate mit gleicher Wahrscheinlichkeit fur den Defekt in Frage kommt. Aufgabe 2.4 Gegeben ist eine diskrete Zufallsgroe X mit folgender Verteilungstabelle: xi 1 2 4 5 7 . pi 0,2 0,1 0,3 0,3 0,1 Stellen Sie die Einzelwahrscheinlichkeiten und die zugehorige Verteilungsfunktion graphisch dar. Ermitteln Sie ferner den Erwartungswert und die Varianz von X und berechnen Sie die Wahrscheinlichkeiten dafur, da X einen Wert aus den Intervallen a) (-1, 4) b) [ 2, 6] annimmt. Aufgabe 2.5 Bei der Abnahmekontrolle wird aus einer Serie zufallig eine Stichprobe entnommen und gepruft. Die Serie besteht aus 10 Teilen und enthalte 2 Ausschuteile. Berechnen und skizzieren Sie die Einzelwahrscheinlichkeiten und die Verteilungsfunktion der Zufallsgroe X : "Anzahl der defekten Teile in der Stichprobe\, wenn aus der Serie 2 Teile a) ohne Zurucklegen b) mit Zurucklegen 19 entnommen werden. Aufgabe 2.6 Die Dichtefunktion fX (x) der stetigen Zufallsgroe X lautet: 8 0 fur x 0 > < 0:25 fur 0 < x 2 fX (x) = > 0:5 fur 2 < x 3 : 0 fur 3 < x Berechnen Sie die Verteilungsfunktion FX (t). Aufgabe 2.7 Die Verteilung der stetigen Zufallsgroe X sei durch die Verteilungsfunktion 80 fur t2 < FX (t) = : a t ; 1 fur 2 < t 4 1 fur 4 < t gegeben. Bestimmen Sie a) die Dichtefunktion der Zufallsgroe X , b) die Konstante a, c) die Wahrscheinlichkeit dafur, da X Werte kleiner als 0.2 annimmt, d) die Wahrscheinlichkeit dafur, da X Werte groer als 3 annimmt, e) die Wahrscheinlichkeit dafur, da X Werte zwischen 2.5 und 3 annimmt. Aufgabe 2.8 Gegeben sei die Dichtefunktion ( 0 fur x 1 34 fur x > 1 : x Berechnen Sie FX (t); E (X ); D2(X ) und P (X 2)! Skizzieren Sie fX (x) und FX (t). fX (x) = Aufgabe 2.9 Eine Zufallsgroe X besitze folgende Verteilungsfunktion 8 > > < 03 t + 3 ffuurr ;1 < tt ;11 FX (t) = > 4 4 3 1 > :1 fur 3 < t Bestimmen Sie fX (x) und E (X )! 20 Aufgabe 2.10 X sei eine diskrete Zufallsgroe mit dem Wertebereich fx1 ; x2 g; (x1 < x2 ). Bestimmen Sie fur den Fall x1 = 1; P (X = 1) = 0:6 und D2(X ) = 0:24 a) die Verteilungstabelle von X , b) P (2 X 10). c) Skizzieren Sie die Verteilungsfunktion FX (t)! Aufgabe 2.11 In einem Behalter liegen 4 Kondensatoren. Jeder einzelne ist mit einer Wahrscheinlichkeit von 0.2 fehlerhaft. Diese Kondensatoren werden der Reihe nach gepruft. Die Prufung wird abgebrochen, wenn der erste fehlerfreie Kondensator gefunden wird. X sei die zufallige Anzahl der gepruften Kondensatoren. a) Ermitteln Sie die Verteilungstabelle von X ! b) Berechnen Sie Erwartungswert und Varianz! c) Wie gro ist die Wahrscheinlichkeit dafur, da hochstens 2 Kondensatoren gepruft werden? Aufgabe 2.12 Zwei Personen spielen folgendes Glucksspiel: Der Spieler s1 leistet einen bestimmten Einsatz, wurfelt und erhalt vom Spieler s2 : 10 Pf beim Wurfeln einer 1 oder 2 20 Pf beim Wurfeln einer 3 oder 4 40 Pf beim Wurfeln einer 5 80 Pf beim Wurfeln einer 6 : Welche durchschnittliche Einnahme pro Spiel kann der Spieler s1 erwarten? Aufgabe 2.13 Es sei FX die Verteilungsfunktion einer stetigen Zufallsgroe X mit FX (t) = a + b arctan(t) (;1 < t < 1) a) Man bestimme die Konstanten a und b. b) Wie lautet die Dichtefunktion von X ? Aufgabe 2.14 Ein Lebensmittelhandler bezieht wochentlich von einer Molkerei Sahnejoghurt in Paletten zu einem Preis von DM 2:50 . Er verkauft diesen Joghurt, dessen Haltbarkeit bei einer Woche liegt, palettenweise zu 10 DM. Bestimmen Sie die auf Dauer gewinnoptimale Einkaufspolitik des Handlers, wenn die Anzahl der pro Woche verkauften Paletten X die folgende Wahrscheinlichkeitstabelle hat: 21 X =j 0 1 2 3 4 5 6 P (X = j ) 0,02 0,08 0,10 0,18 0,34 0,18 0,10 Aufgabe 2.15 Eine (diskrete) Zufallsvariable X besitzt eine diskrete Gleichverteilung mit dem Trager D = fx1; : : : ; xng, wenn fur alle j = 1; : : : ; n gilt: P (X = xj ) = n1 : Beispiel: X : Augenzahl beim Werfen eines symmetrischen Wurfels, D = f1; ; 6g. Man bestimme fur dieses Beispiel E (X ) und V ar(X ). Aufgabe 2.16 Gegeben sei eine stetige Zufallsvariable X mit der Dichte fX (x) = 2(1 ; x) 0 fur 0 x 1 sonst a) Zeichnen Sie fX (x) und zeigen Sie, da die Flache unter der Dichte den Wert 1 hat. b) Berechnen und zeichnen Sie die Verteilungsfunktion FX (t). c) Bestimmen Sie den Median, das 0.25{ und das 0.75{Quantil. d) Berechnen Sie E (X ) und V ar(X ). Aufgabe 2.17 Man zeige: Der Erwartungswert einer um den Punkt c symmetrischen Verteilung ist gleich c. Aufgabe 2.18 Von einer Zufallsvariablen X sind nur bekannt: E (X ) = 10 und V ar(X ) = 1. Sie sollen eine Prognose aufstellen in der Form "X wird einen Wert zwischen a und b annehmen\, die mit einer Wahrscheinlichkeit von mindestens 0.95 zutrit. Geben Sie ein dazugehoriges Prognoseintervall (a; b) mit dem Mittelpunkt 10 an. Aufgabe 2.19 Geben Sie ein Beispiel an, fur das in der Tschebyschevschen Ungleichung das Gleichheitszeichen steht. Dies bedeutet, da die Ungleichung im allgemeinen nicht verscharft werden kann. 22 3 Spezielle Wahrscheinlichkeitsverteilungen 3.1 Diskrete Verteilungen 3.1.1 Die Null-Eins-Verteilung Zufallsgroen mit einer Null{Eins{Verteilung benutzen wir zur Beschreibung zufalliger Versuche, bei denen uns nur zwei Versuchsausgange { das Eintreten eines zufalligen Ereignisses A oder des komplementaren Ereignisses A { interessieren. Zur zahlenmaigen Beschreibung eines derartigen Versuchsschemas benutzen wir die diskrete Zufallsgroe 1; falls A eintritt X := 0; falls A eintritt mit den Werten 0 und 1. Denition 3.1 Eine Zufallsgroe X unterliegt einer Null{Eins{Verteilung mit dem Parameter p, wenn sie die Einzelwahrscheinlichkeiten P (X = 1) = p und P (X = 0) = 1 ; p: besitzt. Anstelle der beiden Werte 0 und 1, die in der Regel aus Zweckmaigkeitsgrunden bevorzugt werden, konnten zwei beliebige reelle Zahlen gewahlt werden. In diesem Sinne ist die Null-Eins-Verteilung Spezialfall der sogenannten Zweipunktverteilung. Als wichtigste Kennwerte berechnen wir Erwartungswert und Varianz: E (X ) = 0 (1 ; p) + 1 p = p; (3.1) V ar(X ) = E (X 2) ; [E (X )]2 = p ; p2 = p(1 ; p): (3.2) 23 3.1.2 Die Binomialverteilung Ausgangspunkt: Bernoullisches Versuchsschema: Wir fuhren n (n = 1; 2; : : : ) voneinander unabhangige Versuche durch. In jedem dieser Versuche interessieren uns nur zwei Versuchsausgange (das Eintreten eines zufalligen Ereignisses A bzw. des komplementaren Ereignisses A). Wir setzen voraus, da die Wahrscheinlichkeit von A in jedem Versuch die gleiche ist: P (A) = p (0 < p < 1). Ausgehend von diesem Versuchsschema untersuchen wir die Zufallsgroe X : zufallige Anzahl der Versuche (von insgesamt n Versuchen), in denen A eintritt, d.h. die absolute Haugkeit des Ereignisses A in n unabhangigen Wiederholungen eines zufalligen Versuchs. X besitzt die Werte 0; 1; : : : ; n. Fur n = 1 unterliegt X einer Null{Eins{Verteilung. Fur beliebige n (n = 1; 2; : : : ) und p (0 < p < 1) erhalten wir die Einzelwahrscheinlichkeiten n P (X = k) = k pk (1 ; p)n;k (k = 0; 1; : : : ; n): Denition 3.2 Eine diskrete Zufallsgroe X unterliegt einer Binomialverteilung mit den Parametern n und p, falls sie die Einzelwahrscheinlichkeiten n P (X = k) = k pk (1 ; p)n;k (k = 0; 1; ; n) besitzt. Schreibweise: X Bi(n; p): Fur Erwartungswert und Varianz erhalten wir n X E (X ) = k nk pk (1 ; p)n;k k=0 = np V ar(X ) = E (X 2 ) ; [E (X )]2 n n X 2 = k k pk (1 ; p)n;k ; n2p2 k=0 = np(1 ; p) : 3.1.3 Die geometrische Verteilung Verteilung der Anzahl der Versuche bis zum ersten Mierfolg im unendlichen Bernoulli{ Versuchsschema. Denition 3.3 Eine Zufallsgroe X unterliegt einer geometrischen Verteilung mit dem Parameter 0 < p < 1, wenn sie die Einzelwahrscheinlichkeiten P (X = k) = (1 ; p) pk;1 (k = 1; 2; : : : ) besitzt. Schreibweise: X Geo(p): 24 Erwartungswert und Varianz: E (X ) = 1 ;1 p ; V ar(X ) = p (1 ; p)2 : 3.1.4 Die Poissonverteilung Manchmal wird die Bestimmung der Einzelwahrscheinlichkeiten der Binomialverteilung durch folgende Besonderheiten des der Binomialverteilung zugrunde liegenden Bernoullischen Versuchsschemas erschwert: Die Anzahl n der unabhangigen Versuche ist sehr gro Die Wahrscheinlichkeit pn = P (A) des interessierenden Ereignisses A in jedem einzelnen Versuch (bei einer Serie von n Versuchen) ist sehr klein Es sei X : zufallige Anzahl der Versuche, in denen das Ereignis A eintritt. Unter den Voraussetzungen n ! 1; pn ! 0; npn ! > 0 lassen sich fur X die Einzelwahrscheinlichkeiten k P (X = k) = k! e; (k = 0; 1; 2; : : : ) als Grenzwerte der Einzelwahrscheinlichkeiten der Binomialverteilung herleiten. Denition 3.4 Eine diskrete Zufallsgroe X unterliegt einer Poissonverteilung mit dem Parameter > 0, wenn sie die Einzelwahrscheinlichkeiten P (X = k) = k! e; (k = 0; 1; 2; : : : ) k besitzt. Schreibweise: X Po(): Fur Erwartungswert und Varianz erhalt man: E (X ) = 1 k X k k! e; k=0 = V ar(X ) = E (X 2) ; (E (X ))2 1 2 X = k2 k! e; ; 2 k=0 = 25 3.1.5 Die hypergeometrische Verteilung In einer Urne benden sich M schwarze und N ; M weie Kugeln. Ohne Zurucklegen werden n Kugeln auf gut Gluck der Urne entnommen (Stichprobe). Zu untersuchen ist die Zufallsgroe X : zufallige Anzahl der dabei gezogenen schwarzen Kugeln. Die Wahrscheinlichkeit des zufalligen Ereignisses fX = kg : "Genau k schwarze (und n ; k weie) Kugeln in der Stichprobe\ konnen wir nach der klassischen Denition der Wahrscheinlichkeit unter Benutzung von Ergebnissen der Kombinatorik bestimmen: ;M ;N ;M P (X = k) = k ;Nn;k ; n k durchlauft dabei alle ganzen Zahlen, die die folgenden Ungleichungen erfullen: 0 k n; k M; n ; k N ; M: Anmerkung: Wenden wir das gleiche Versuchsschema mit Zurucklegen an, so erhalten wir eine binomialverteilte Zufallsgroe mit den Parametern n und p = M=N . Denition 3.5 Eine diskrete Zufallsgroe X unterliegt einer hypergeometrischen Verteilung, wenn ihre Einzelwahrscheinlichkeiten durch ;M ;N ;M P (X = k) = k ;Nn;k n gegeben sind. Schreibweise: X H (n; M; N ). Erwartungswert und Varianz dieser Verteilung sind: M N ;n M M E (X ) = n N ; V ar(X ) = n N 1 ; N N ; 1 : 3.2 Stetige Wahrscheinlichkeitsverteilungen 3.2.1 Die Normalverteilung Denition 3.6 Eine stetige Zufallsgroe X mit der Dichtefunktion (x ; )2 1 f (x) = p exp ; X 22 22 heit normalverteilt mit den Parametern (Erwartungswert) und 2 (Varianz). Schreibweise: X N (; 2 ) : Denition 3.7 Die Normalverteilung mit dem Erwartungswert 0 und der Varianz 1 heit Standardnormalverteilung. 26 Ist die Zufallsvariable X normalverteilt, so ist auch jede lineare Transformation Y = aX + b ; a; b 2 R ; normalverteilt. Es gilt: Wenn X N (; 2 ), so Y N (a + b; a2 2 ). Unterliegt die Zufallsgroe X einer N (; 2){Verteilung, so ist Z = 1 X ; = X ; N (0; 1){verteilt (standardnormalverteilt). Fur eine N (; 2 )-verteilte Zufallsvariable X und standardnormalverteiltes Z gilt: P (x1 X x2 ) = P ( x1 ; Z x2 ; ): 3.2.2 Die Exponentialverteilung Fur manche Anwendungen, insbesondere in der Warteschlangentheorie, spielt die Exponentialverteilung eine wichtige Rolle. Denition 3.8 Eine stetige Zufallsvariable X mit der Dichtefunktion: e;x fur x 0; > 0 fX (x) = 0 sonst und der Verteilungsfunktion: 1 ; e;t fur t 0; > 0 FX (t) = 0 sonst heit exponentialverteilt mit dem Parameter . Schreibweise: X Ex(). Erwartungswert und Varianz der Exponentialverteilung: E (X ) = 1 und V ar(X ) = 12 : 3.2.3 Die gleichmaig stetige Verteilung Denition 3.9 Eine stetige Zufallsgroe X mit der Dichtefunktion ( 1 fX (x) = b ; a fur a x b; 0 sonst bezeichnen wir als gleichmaig stetig auf [a; b] verteilt oder rechteckverteilt. Schreibweise: X Gl(a; b). 27 Erwartungswert und Varianz der Rechteckverteilung: E (X ) = Z+1 ;1 xfX (x) dx Zb = x b ;1 a dx a = a+b 2 V ar(X ) = E (X 2) ; (E (X ))2 = Zb a 2 x2 b ;1 a dx ; (a +4 b) 2 = (b ; a) 12 3.2.4 Die logistische Verteilung Denition 3.10 Eine Zufallsgroe X mit der Verteilungsdichte e;gy fX (y) = p (1 + e;gy )2 3 mit y = x; ; g = p3 1:8138 bzw. ;=p3(x;)= e p fX (x) = p 3 (1 + e;= 3(x;)= )2 und der Verteilungsfunktion 1 FX (t) = 1 + e;g t; heit logistisch verteilt. Erwartungswert und Varianz der logistischen Verteilung: E (X ) = V ar(X ) = 2 3.2.5 Die Paretoverteilung Denition 3.11 Eine Zufallsgroe X mit der Verteilungsdichte +1 ; x > x0 ; ; x0 > 0 fX (x) = x xx0 0 und der Verteilungsfunktion heit pareto{verteilt. 28 FX (t) = 1 ; xt0 ; t > x0 ; ; x0 > 0 Erwartungswert und Varianz der Paretoverteilung: E (X ) = ;x01 ; > 1 2 2 V ar(X ) = ;x02 ; ((;x01)) 2 2 x 0 ; = ( ; 2)( ; 1)2 >2 3.3 U bungsaufgaben Aufgabe 3.1 Durch Versuche ist in einem Betrieb festgestellt worden, da 5% der Relais einer groen Serie nicht funktionstuchtig sind. Die Relais werden in Zehnerpackungen geliefert. Es soll die Zufallsgroe X : "Anzahl der nicht funktionstuchtigen Relais in einer Packung\ untersucht werden. Bestimmen Sie: a) die Wahrscheinlichkeit dafur, da die Zahl der unbrauchbaren Relais genau 2 betragt! b) die Wahrscheinlichkeit dafur, da ein Garantieversprechen des Betriebes nicht eingehalten wird, wenn er garantiert, da die Anzahl der unbrauchbaren Relais maximal 1 betragt! c) den Erwartungswert und die Varianz der Zufallsgroe X . d) Die Wahrscheinlichkeit, da X einen Wert aus dem Intervall (1.5, 4.2) annimmt! Aufgabe 3.2 Wie gro ist die Wahrscheinlichkeit, mit 6 Wurfen eines Wurfels mindestens 3 Sechsen zu erzielen? Aufgabe 3.3 Man zeige: Besitzt X die Bi(n; p){ und Y die Bi(n; 1 ; p){Verteilung, so gilt P (Y = y) = P (X = n ; y): Aufgrund dieser Beziehung genugt es, die Binomialverteilung nur fur Parameterwerte p 0:5 zu vertafeln. Aufgabe 3.4 Jedes Mitglied eines Ausschusses von 12 Personen geht mit Wahrscheinlichkeit 0.8 zur nachsten Sitzung. Wie gro ist die Wahrscheinlichkeit, da der Ausschu beschlufahig ist, wenn dazu mindestens die Halfte der Mitglieder anwesend sein mussen? 29 Aufgabe 3.5 Berechnen und skizzieren Sie die Einzelwahrscheinlichkeiten (Wahrscheinlichkeitsfunktion) der Bi(5; p){Verteilung fur p = 1 ; p = 1 und p = 2 . Skizzieren Sie fur p = 1 auch 3 2 3 2 die Verteilungsfunktion. Aufgabe 3.6 Die monatliche Durchschnittstemperatur gelte als normal, wenn sie um hochstens ein Grad vom langjahrigen Mittelwert abweicht. In einer bestimmten Stadt sei die Wahrscheinlichkeit, da die monatliche Durchschnittstemperatur normal ist, in jedem Monat gleich 0.9, und diesbezuglich sei Unabhangigkeit zwischen verschiedenen Monaten vorausgesetzt. Wie gro ist die Wahrscheinlichkeit, da in den kommenden zwei Jahren in weniger als 20 Monaten die Durchschnittstemperatur normal sei? Aufgabe 3.7 Ein Versuch im Physikunterricht gelingt mit einer Wahrscheinlichkeit von 0.8. Wieviele Versuche mu die Physiklehrerin durchschnittlich durchfuhren, um den Schulern einen erfolgreichen Versuch zu prasentieren? Dabei wird vorausgesetzt, da die einzelnen Versuche voneinander unabhangig sind. Aufgabe 3.8 Ein Mensch{A rger{Dich{Nicht{Spieler kann sein Spiel nur starten, wenn er eine Sechs wurfelt. Dazu darf er in jeder Runde dreimal (mit einem Wurfel) wurfeln. Wieviel Runden braucht er durchschnittlich zu einem Start? Aufgabe 3.9 Die Zahl der Schaden an einer Turbine innerhalb eines Monats unterliege einer Poissonverteilung mit dem Parameter = 3. Auf Grund von Rekonstruktionsmanahmen ist es gelungen, diesen Parameter auf 2 zu senken. Um wieviel verandern sich die Wahrscheinlichkeiten dafur, da innerhalb eines Monats a) kein Schaden b) hochstens 2 Schaden c) mindestens 3 Schaden auftreten? Die Kosten, die ein Schaden durchschnittlich verursacht, betragen 3 000 DM. Nach wievielen Monaten hat sich ein Rekonstruktionsaufwand von 45 000 DM wieder amortisiert? Aufgabe 3.10 Eine Firma produziert Teile mit einem Ausschuanteil p = 0:001 . Wie gro ist die Wahrscheinlichkeit dafur, da eine Lieferung von 500 Teilen nicht mehr als 2 defekte Teile enthalt? 30 Aufgabe 3.11 An einer Tankstelle kommen zwischen 16.00 und 18.00 Uhr durchschnittlich 2.5 Fahrzeuge pro Minute an. Man bestimme die Wahrscheinlichkeit, da in einer Minute wahrend dieser Zeit a) kein Fahrzeug, b) genau zwei Fahrzeuge, c) mehr als drei Fahrzeuge, d) weniger als 6 Fahrzeuge eintreen. (Die Anzahl der ankommenden Fahrzeuge sei poissonverteilt.) Aufgabe 3.12 Von den gleichartigen und unabhangig voneinander laufenden Webstuhlen einer Textilfabrik weisen "im Mittel\ vier pro Tag einen Defekt auf. Das Auftreten zweier Defekte pro Tag und Webstuhl sei vernachlassigbar. Wie gro ist die Wahrscheinlichkeit, da pro Tag a) mehr als 10 Defekte auftreten, b) genau 4 Defekte auftreten? Wie gro ist die Standardabweichung der Anzahl der Defekte pro Tag? Aufgabe 3.13 Eine Feuerwehrstation in einer Grostadt hat durchschnittlich pro Tag einen Einsatz. Durch welches Verteilungsmodell lat sich die Verteilung von X :"Anzahl der Einsatze an einem Tag\ darstellen? Bestimmen Sie damit P (X = 0); P (X 1) und P (X 3). Aufgabe 3.14 Eine Maschine produziert Werkstucke, es sind erfahrungsgema 4% ihrer Produktion Ausschu. Die Produktion verschiedener Stucke sei bezuglich der Frage "Ausschu oder nicht\ als unabhangig anzusehen. Wie gro ist die Wahrscheinlichkeit, da von 100 in einer Stunde produzierten Stucken a) genau 4, b) mindestens 7, c) hochstens 8 Ausschu sind? 31 Aufgabe 3.15 Eine Sekretarin macht durchschnittlich pro Seite zwei Tippfehler. Wie gro ist die Wahrscheinlichkeit dafur, da sich auf einer Seite a) kein Tippfehler bendet, b) genau zwei Tippfehler benden, c) hochstens zwei Tippfehler benden? Aufgabe 3.16 Eine Glasfabrik stellt Fensterglas her, in dem sich durchschnittlich ein Luftblaschen pro m2 bendet. In einer Groserie von je 1 m2 groen Fensterscheiben gelten als 1. Wahl: Scheiben ohne Luftblaschen, 2. Wahl: Scheiben mit einem Luftblaschen, 3. Wahl: Scheiben mit zwei oder drei Luftblaschen, Ausschu: Scheiben mit mehr als drei Luftblaschen. Wie gro sind die Wahrscheinlichkeiten (Anteile in der Groserie) fur diese vier Qualitatsstufen? Aufgabe 3.17 Aufgabe 3.18 Berechnen Sie die Varianz einer Po()-verteilten Zufallsvariablen X . (Hinweis: Bestimmen Sie zunachst E (X (X ; 1)).) An einer einsamen Stelle einer Landstrae kommen im Durchschnitt pro Stunde 6 Autos vorbei. Mit Y bezeichnen wir die Anzahl der Autos, die wahrend irgendeiner Stunde vorbeifahren, mit X den zeitlichen Abstand zweier Autos in Minuten. Welche Verteilungen kann man X und Y zuordnen? Wie gro ist E (X )? Man bestimme P (Y 3) und P (X 30). Aufgabe 3.19 Aus zehn Personen, darunter funf Manner und funf Frauen, wird ein Vierer-Gremium ausgelost. Wie gro ist die Wahrscheinlichkeit dafur, da a) hochstens zwei Frauen, b) genauso viele Frauen wie Manner in das Gremium gelangen? Aufgabe 3.20 Fur eine Prufung werden Leistungen in 10 Gebieten verlangt. Ein Kandidat bereitet sich nur auf 5 Gebiete vor. Der Professor pruft nur in 3 willkurlich herausgegrienen Gebieten. Wie gro ist die Wahrscheinlichkeit dafur, da der Kandidat in mindestens zwei seiner vorbereiteten Gebiete befragt wird? 32 Aufgabe 3.21 Beim "Samstag-Lotto\ werde bei einem Spiel sechs Zahlen in einem Feld von 49 Zahlen angekreuzt und sieben Kugeln (sechs "normale\, die siebente als "Zusatzzahl\) aus einer Urne mit 49 durchnumerierten Kugeln zufallig und ohne Zurucklegen gezogen. Man berechne die Gewinnchancen fur a) sechs "Richtige\, b) funf "Richtige\ und Zusatzzahl richtig, c) funf "Richtige\ und Zusatzzahl falsch, d) vier "Richtige\, e) hochstens zwei "Richtige\. Aufgabe 3.22 Berechnen und skizzieren Sie fur N = 8; M = 5 und n = 4 die Einzelwahrscheinlichkeiten (Wahrscheinlichkeitsfunktion) der hypergeometrischen Verteilung. Aufgabe 3.23 Ein Handler will zu Silvester 25 Feuerwerkskorper, die ihm aus fruheren Jahren ubriggeblieben sind, loswerden. Er verspricht einem daran Interessierten, da mindestens 60% davon noch funktionsfahig sind. Dieser verlangt, 5 der 25 Feuerwerkskorper sofort ausprobieren zu durfen, und er ist bereit, die restlichen 20 dann zu kaufen, wenn mindestens 3 der 5 gepruften funktionieren. Der Handler ist damit einverstanden. Wie gro ist die Wahrscheinlichkeit, da das Geschaft zustande kommt, wenn tatsachlich a) 60%, b) 80%, c) 20% der 25 Feuerwerkskorper noch funktionsfahig sind? Aufgabe 3.24 In der Situation von Aufgabe 3.23 haben die ersten beiden gepruften Feuerwerkskorper nicht funktioniert. Berechnen Sie die durch dieses Ergebnis bedingte Wahrscheinlichkeit, da a) der dritte, der ausprobiert wird, funktioniert b) das Geschaft doch noch zustande kommt, wenn tatsachlich 60% der angebotenen 25 Feuerwerkskorper funktionsfahig waren? 33 Aufgabe 3.25 Man zeige: Eine H (n; M ; N ){verteilte Zufallsvariable X ist darstellbar als X = X1 + : : : + Xn, wobei jedes Xi die Null-Eins-Verteilung mit dem Parameter p = M=N besitzt, die X1; : : : ; Xn aber nicht unabhangig sind. Aufgabe 3.26 Die Zufallsgroe Y sei normalverteilt mit E (Y ) = 0 und V ar(Y ) = 1. Berechnen Sie a) P (Y 2:5) b) P (Y < ;1:5) c) P (1:2 Y < 2:3) d) P (;1:1 Y < 3)! Aufgabe 3.27 Der elektrische Widerstand eines Stromkreises (in k ) wird durch eine normalverteilte Zufallsgroe X mit = 150 und 2 = 4 beschrieben. a) Wie gro ist die Wahrscheinlichkeit dafur, da der Widerstandswert zwischen 146 und 155 liegt? b) Kann der Widerstandswert groer als 160 sein? c) Wie gro darf sein, wenn mit einer Wahrscheinlichkeit von 0.99 der Widerstandswert zwischen 147 und 153 liegen soll? Aufgabe 3.28 Auf einer Maschine werden Einzelteile hergestellt, deren Lange eine normalverteilte Zufallsgroe mit = 25 cm und = 0.05 cm ist. a) Wie gro ist die Wahrscheinlichkeit dafur, da die Lange eines Einzelteils zwischen 24.86 cm und 25.14 cm liegt? b) Wieviel Prozent der gefertigten Teile sind langer als 25.1 cm? c) Bestimmen Sie c derart, da P (jX ; j < c) = 0:92 gilt! Aufgabe 3.29 Ein Drehautomat ist so eingestellt, da der mittlere Durchmesser des hergestellten Werkstucks bei 25.00 mm liegt. Aus langer Erfahrung ist die Standardabweichung = 0:02 mm bekannt. Die Werkstucke sind bei einer Abweichung von 0.06 mm vom Sollwert gerade noch brauchbar. a) Mit welcher Mindestwahrscheinlichkeit ist ein Werkstuck noch brauchbar, wenn die Art der Verteilung der Zufallsgroe X : "Durchmesser\ unbekannt ist? 34 b) Mit welcher Wahrscheinlichkeit ist ein Werkstuck brauchbar, wenn der Durchmesser als normalverteilt angesehen werden kann? Aufgabe 3.30 X sei eine N (10; 25){verteilte Zufallsvariable. Man bestimme die Wahrscheinlichkeiten P (0 X 11), P (8 X 12) und P (X 15). Aufgabe 3.31 Eine Maschine fullt Zucker in Tuten ab, die ein Gewicht von 1 000 g haben sollen. Das tatsachliche Gewicht X (in g) lat sich auassen als eine N (; 2){verteilte Zufallsvariable. a) Wie gro ist die Wahrscheinlichkeit dafur, da das Sollgewicht um mehr als 15 g unterschritten wird, wenn (i) = 1 000 und 2 = 100 (ii) = 1 050 und 2 = 121 ist? b) Wie gro darf bei = 1 000 die Standardabweichung hochstens sein, damit P (950 X 1 050) 0:98 gilt? c) Gegeben sei 2 = 100 (unabhangig von ). Auf welchen {Wert darf die Maschine hochstens eingestellt werden, damit P (X 1 020) 0:05 gilt? Aufgabe 3.32 Eine Maschine produziert Stahlstifte mit einer Soll-Lange von 35 mm. Da zufallsabhangige Ungenauigkeiten in der Herstellung nicht ausgeschlossen werden konnen, lat sich die Lange X eines produzierten Stahlstifts als Zufallsvariable ansehen, und zwar sei X gema N (35; 0:25) verteilt. Berechnen Sie die Wahrscheinlichkeit, da ein zufallig aus der laufenden Produktion entnommener Stift a) hochstens 35.4 mm lang ist? b) mindestens 34.6 mm lang ist? c) zwischen 34.5 mm und 35.2 mm mit? d) um maximal 0.7 mm von der Sollange abweicht? Aufgabe 3.33 Ein Unternehmer, der bisher Kuchenherde eines Typs A hergestellt hat, steht vor dem Problem, ob er die Produktion auf einen verbesserten Typ B umstellen soll (dazu ware aus Kapazitatsgrunden die Einstellung der Produktion vom Typ A notig). Der Absatz X von Typ A innerhalb der nachsten 3 Jahre kann nach Ansicht der Marketingabteilung als (naherungsweise) normalverteilt mit = 15 000 angesehen werden; bei Typ B dagegen wird fur denselben Zeitraum jede verkaufte Stuckzahl zwischen 12 000 und 24 000 fur gleichwahrscheinlich gehalten, was (hinreichend genau) durch eine in diesem Intervall gleichverteilte Zufallsvariable Y beschrieben werden kann. 35 a) Fur welchen der beiden Typen ist im fraglichen Zeitraum ein hoherer Absatz zu erwarten? b) Mit folgenden Kosten und Verkaufspreisen werde kalkuliert: Herstellungskosten pro Stuck Stuckpreis Typ A DM 250 DM 350 Typ B DM 290 fur die ersten 20 000 Stuck DM 380 DM 260 fur jedes weitere Stuck Die Umstellung von Typ A auf Typ B hatte Fixkosten von DM 100 000 zur Folge. Skizzieren Sie den Gewinn bei Typ B in Abhangigkeit von der Stuckzahl. Welcher der beiden Typen lat fur die kommenden 3 Jahre den groeren Gewinn erwarten? Aufgabe 3.34 In manchen Fallen kann man annehmen, da die Suchdauer X nach einem verlorenen Gegenstand exponentialverteilt ist (mit einem Parameter ). Wie lautet die Voraussetzung fur diese Annahme? Wie gro ist bei einer durchschnittlichen Suchdauer von 5 Minuten die Wahrscheinlichkeit, langer als 10 Minuten suchen zu mussen? Aufgabe 3.35 Die Lebensdauer X in Zeiteinheiten eines Geratetyps kann durch die Dichtefunktion fX (x) = ( 0:06x2 e;0:02x 0 3 fur x 0 fur x < 0 beschrieben werden. a) Wie gro ist die Wahrscheinlichkeit dafur, da ein solches Gerat mindestens 2 Zeiteinheiten ausfallfrei arbeitet? b) Welche Zeit uberleben 90% der Erzeugnisse? c) Nach welcher Zeit sind 90% der Erzeugnisse ausgefallen? 36 4 Approximationsmoglichkeiten, das Gesetz der groen Zahlen und der zentrale Grenzwertsatz 4.1 Approximationsmoglichkeiten innerhalb der diskreten Verteilungen 1. Hypergeometrische Verteilung: ;M ;N ;m P (X = m) = m ;Nn;m n (a) fur 0:1 < MN < 0:9 ; n > 10 ; n N < 0:05 ! Binomialverteilung mit n; p = MN (b) MN 0:1 oder 0:9 ; n > 30 ; Nn < 0:05 ! Poissonverteilung mit = n MN fur MN 0:1 (c) 0:1 < MN < 0:9 ; n > 30 q ; ! Normalverteilung mit = n MN ; = n MN 1 ; MN NN;;n1 (siehe Zentraler Grenzwertsatz) 2. Binomialverteilung (a) np 10 und n 1 500 p ! Poissonverteilung = np (b) np(1 ; p) > 9 p ! Normalverteilung mit = np; = np(1 ; p) (siehe Zentraler Grenzwertsatz) 3. geometrische Verteilung p 0:9 : ! Exponentialverteilung mit = p 37 4.2 Gesetz der groen Zahlen Satz 4.1 (Gesetz der groen Zahlen von Bernoulli) Ist fXigi=1;2;::: eine Folge unabhangiger identisch verteilter Zufallsgroen mit P (Xi = 1) = p und P (Xi = 0) = 1 ; p (0 < p < 1); so gilt X ! n 1 lim P n Xi ; p " = 0 n!1 i=1 (" > 0 bel.): (4.1) Dieser Satz sagt aus, da die Wahrscheinlichkeit dafur, da die relative Haugkeit und die Wahrscheinlichkeit eines zufalligen Ereignisses A dem Betrage nach um mehr als " voneinander abweichen, mit n ! 1 gegen Null strebt. Satz 4.1 lat sich in folgender Weise verallgemeinern: Satz 4.2 (Gesetz der groen Zahlen von Chintschin) Ist fXigi=1;2;::: eine Folge von unabhangigen und identisch verteilten Zufallsgroen mit E (Xi) = mi < 1, so gilt: X ! n 1 lim P (Xi ; mi ) " = 0 (" > 0 bel.): n!1 n i=1 (4.2) 4.3 Der zentrale Grenzwertsatz Wir untersuchen die Konvergenz der Folgen von Verteilungen bei Summen von Zufallsgroen gegen eine Grenzverteilung. Hierbei zeigt sich, da bei geeigneter Transformation von Summen von Zufallsgroen die Folge ihrer Verteilungen in bestimmten Fallen gegen die Normalverteilung konvergiert. Eine Aussage hieruber liefert folgender Satz: Satz 4.3 (Zentraler Grenzwertsatz) Ist fXigi=1;2;::: eine Folge von unabhangigen und identisch verteilten Zufallsgr oen mit E (Xi) = m < 1 und V ar(Xi) = d2 < 1, so P n gilt fur jedes t 2 R mit Sn = i=1 Xi S ; n m t = (t; 0; 1) = lim P np n!1 nd 1 2 Zt ;1 2 e; x2 dx: (4.3) Mit anderen Worten heit dies, da die Folge der Verteilungen der standardisierten Zufallsgroen Snp; n m (4.4) nd gegen die Normalverteilung mit den Parametern = 0 und = 1 konvergiert. Wir nennen Sn (n = 1; 2; : : : ) in diesem Fall auch asymptotisch normalverteilt mit dem 38 p Erwartungswert n m und der Standardabweichung nd (asymptotisch N (n m; nd2 ){ verteilt). Wir wollen nun als Spezialfall des Satzes 4.3 den Satz von Moivre{Laplace kennenlernen. Ausgangspunkt ist das Bernoullische Versuchsschema, bei dem jeder einzelne Versuch durch die Null{Eins{verteilten Zufallsgroen Xi (i = 1; 2; : : : ) beschrieben wird und Sn = n X i=1 Xi einer Binomialverteilung mit den Parametern n und p unterliegt. Wir wenden den zentralen Grenzwertsatz an und erhalten den folgenden Satz: Satz 4.4 (Satz von Moivre-Laplace) Ist Sn eine binomialverteilte Zufallsgroe mit den Parametern n und p, so gilt fur beliebige t ! Sn ; np t = (t; 0; 1): p lim P n!1 np(1 ; p) (4.5) Das heit, wenn bei dem der Binomialverteilung zugrunde liegenden Bernoullischen Versuchsschema die Anzahl der unabhangigen Versuche gegen unendlich strebt, dann konvergiert die Verteilungsfunktion der standardisierten binomialverteilten Zufallsgroe gegen die Verteilungsfunktion einer normalverteilten Zufallsgroe mit den Parametern 0 und 1. Wird eine diskrete Verteilung durch eine Normalverteilung approximiert, so verwendet man fur relativ kleine n eine Stetigkeitskorrektur. Seien a und b ganzzahlige Realisierungen der diskreten Zufallsgroe X ; dann lautet die Stetigkeitskorrektur: P (a X b) FX (b + 0:5) ; FX (a ; 0:5) : Fur groe n ist diese Korrektur vernachlassigbar. 4.4 U bungsaufgaben Aufgabe 4.1 Eine Munze wird 100 mal geworfen. Es sei X : "Anzahl der Wappenwurfe\. Berechnen Sie P (47 X 52) ; P (X = 50). Aufgabe 4.2 Ein Vertreter wei erfahrungsgema, da er bei jedem seiner Erstbesuche mit Wahrscheinlichkeit p = 0:05 einen Verkauf tatigen kann. Wie gro ist die Wahrscheinlichkeit, da er bei 300 Erstbesuchen wenigstens 10 Verkaufe tatigt? 39 Aufgabe 4.3 Ein Zufallsexperiment, bei dem ein Ereignis A mit der Wahrscheinlichkeit p eintritt, wird n{mal unabhangig wiederholt. Man wei, da 0:1 p 0:9 ist. Hn sei die relative Haugkeit, mit der dabei A beobachtet wird. Man bestimme mit Hilfe der Normalverteilungsapproximation eine untere Grenze fur die Wahrscheinlichkeit, da Hn um hochstens 0.05 von p abweicht, fur n = 200; 500; 1000: Aufgabe 4.4 Man bestimme mit Hilfe der Normalverteilungsapproximation (mit und ohne Stetigkeitskorrektur) die Wahrscheinlichkeiten P (X = 32) und P (26 X 34) a) im Fall, da X eine Bi(64; 0:5){Verteilung besitzt b) falls X nach Po(30) verteilt ist. Aufgabe 4.5 X sei eine Po(49){verteilte Zufallsvariable. Bestimmen Sie mit Hilfe einer geeigneten Approximation die Wahrscheinlichkeiten P (X 49) ; P (42 X 56) ; P (X 60). Aufgabe 4.6 Wie gro ist die Wahrscheinlichkeit, da unter 400 Munzwurfen die Anzahl X der Ergebnisse "Kopf\ von ihrem Erwartungswert 200 um hochstens 15 abweicht? Aufgabe 4.7 Ein Kunde erhalt eine sehr groe Lieferung von Transistoren. Ihm wird vom Hersteller garantiert, da darunter hochstens 3% unbrauchbare Stucke sind. Zur U berprufung der Lieferung werden zufallig (und ohne Zurucklegen) n Stucke ausgewahlt und gepruft. Sind alle n funktionstuchtig, wird die ganze Lieferung angenommen, andernfalls nicht. a) Wie gro ist bei n = 10 die Wahrscheinlichkeit fur die Annahme der Lieferung, wenn sie in Wirklichkeit 5% unbrauchbare Stucke enthalt? b) Wie gro mu n mindestens sein, damit eine Lieferung mit mehr als 3% unbrauchbaren Stucken mit einer Wahrscheinlichkeit von mindestens 0.99 zuruckgewiesen wird? Aufgabe 4.8 In Simulationsstudien werden haug standardnormalverteilte Zufallszahlen benotigt. Primar stehen jedoch nur gleichverteilte Zufallszahlen, d.h. Realisierungen unabhangiger, uber dem Intervall [0; 1] gleichverteilter Zufallsvariablen zur Verfugung. Aus je 12 dieser gleichverteilten Zufallszahlen x1 ; x2; : : : erzeugt man eine standardnormalverteilte Zufallszahl y folgendermaen: y= Begrunden Sie diese Vorgehensweise. 40 12 X i=1 xi ; 6: Aufgabe 4.9 Eine Vertriebsgesellschaft besitzt in einer Grostadt 200 Zigarettenautomaten. Jeder Automat hat (unabhangig von den anderen) mit der Wahrscheinlichkeit 201 eine Storung. Fur die Entscheidung uber die Groe eines standigen Reparaturtrupps sei die Wahrscheinlichkeit von Interesse, da in einer Woche die Anzahl X der defekten Automaten zwischen 5 und 15 liegt. Diese Wahrscheinlichkeit (der exakte Wert betragt ubrigens 0:9292 ) soll a) mittels der Poisson{Verteilung approximiert werden, b) mittels der Tschebyschev{Ungleichung nach unten abgeschatzt werden, c) aufgrund des zentralen Grenzwertsatzes approximativ berechnet werden. 41 5 Mehrdimensionale Zufallsgroen Die Betrachtung mehrdimensionaler Zufallsgroen bzw. zufalliger Vektoren ist sehr aufwendig, daher betrachten wir nur einige Grundzuge. In der Regel werden k Zufallsgroen dann gemeinsam untersucht, wenn der Zusammenhang dieser Groen von Interesse ist. Denition 5.1 Man nennt (X1; : : : ; Xk ) k{dimensionale Zufallsgroe oder Zufallsvektor der Lange k. Realisierungen: (x1 ; : : : ; xk ) 5.1 Diskrete zweidimensionale Zufallsgroen Wir betrachten die Zufallsgroen X und Y mit den Realisierungen X : x1; : : : ; xm ; : : : Y : y1; : : : ; yn; : : : und den dazugehorigen Wahrscheinlichkeiten pij = P (X = xi ; Y = yj ) Durch die beiden einzelnen Verteilungen von X bzw. Y (Randverteilungen) wird im allgemeinen noch nicht die gemeinsame Verteilung von X und Y festgelegt. Dazu mu man zusatzlich wissen, ob und gegebenenfalls wie X und Y voneinander abhangen. Wenn X und Y jeweils nur endlich viele verschiedene Werte annehmen { nennen wir sie x1 ; : : : ; xm und y1; : : : ; yn { so werden gemeinsame Verteilung und Randverteilungen oft in Form des folgenden Schemas dargestellt: X n Y y1 yj yn x1 p11 p1j p1n p1 ... ... ... ... ... xi pi1 pij pin pi ... ... ... ... ... xm pm1 pmj pmn pm p1 pj pn 1 42 Darin bedeuten: pij = P (X = xi; Y = yj ) = f (xi; yj ) pi = pj = n X j =1 m X i=1 pij = P (X = xi) = f1(xi ) pij = P (Y = yj ) = f2 (yj ) Die gemeinsame Verteilung steht in Form einer Matrix im Inneren des Schemas. Die Randverteilung von X , gegeben durch die pi, steht am rechten Rand des Schemas; dabei ist pi gerade die Summe der in der i{ten Zeile stehenden Wahrscheinlichkeiten. Entsprechendes gilt fur die Randverteilung von Y . In dieser Darstellung gilt: X und Y sind genau dann unabhangig, wenn fur alle i und j gilt: pij = pipj 5.2 Stetige zweidimensionale Zufallsgroen Der Stetigkeitsbegri fur eindimensionale Zufallsgroen wird wie folgt auf den zweidimensionalen Fall ubertragen: Denition 5.2 (X; Y ) heit stetig, wenn es eine (reellwertige, nichtnegative, integrierbare) Funktion f (x; y ) gibt mit der Eigenschaft: P (x1 < X x2 ; y1 < Y y2) = Zy2 Zx2 y1 x1 f (x; y) dx dy fur je zwei Intervalle (x1 ; x2 ] und (y1 ; y2 ]. Die Funktion f (x; y) heit die Dichte von (X; Y ) oder die gemeinsame Dichte von X und Y . Sie bestimmt die Verteilung von (X; Y ) bzw. die gemeinsame Verteilung von X und Y . Dabei ist P (x1 < X x2 ; y1 < Y y2) = P (x1 < X x2 und y1 < Y y2) die Wahrscheinlichkeit, da (X,Y) Werte in dem Rechteck mit den Eckpunkten (x1 ; y1); (x2; y1); (x2; y2) und (x1 ; y2) annimmt. Wir gehen nun von einer stetigen Zufallsgroe (X; Y ) mit der Dichte f (x; y) aus. Dann sind auch die beiden eindimensionalen Zufallsgroen X und Y stetig. Wir bezeichnen mit f1 (x) die Dichte von X und mit f2(y) diejenige von Y . Auf die Frage nach dem Zusammenhang zwischen der gemeinsamen Verteilung und den beiden einzelnen Verteilungen lauten die Antworten wie im diskreten Fall: 43 Aus der gemeinsamen Dichte f (x; y) lassen sich die beiden einzelnen Dichten f1 (x) und f2(y) bestimmen; zum Beispiel gilt fur f1(x) die Beziehung f1(x) = Z1 ;1 f (x; y) dy: Die beiden einzelnen Dichten legen jedoch im allgemeinen noch nicht die gemeinsame Dichte fest. Man kann zeigen, da X und Y genau dann unabhangig sind, wenn ihre gemeinsame Dichte mit dem Produkt der einzelnen Dichten ubereinstimmt, d.h., wenn gilt: f (x; y) = f1(x)f2 (y): (5.1) Im Fall der Unabhangigkeit von X und Y lat sich auf diese Weise die gemeinsame Dichte aus den beiden einzelnen Dichten bestimmen. 5.3 Die Kovarianz Wir betrachten eine diskrete oder stetige zweidimensionale Zufallsgroe (X; Y ) mit der Wahrscheinlichkeitsfunktion bzw. Dichte f (x; y). Die bereits bekannten Parameter der eindimensionalen Zufallsgroen X und Y bezeichnen wir mit 1 = E (X ) und 12 = V ar(X ) (5.2) 2 = E (Y ) und 22 = V ar(Y ) (5.3) E (X ) und V ar(X ) hangen allein von der Verteilung von X ab, E (Y ) und V ar(Y ) nur von der Verteilung von Y . Der erste Parameter von (X; Y ), der von der gemeinsamen Verteilung von X und Y abhangt, ist die Kovarianz. Denition 5.3 : Unter der Kovarianz von X und Y , die mit Cov(X; Y ) bezeichnet wird, versteht man die reelle Zahl Cov(X; Y ) = E ((X ; 1)(Y ; 2)) (5.4) Im Fall X = Y ist Cov(X; X ) = V ar(X ). Die rechte Seite lat sich wegen der Linearitat des Erwartungswertes umformen in Cov(X; Y ) = E (XY ) ; E (X )E (Y ) (5.5) Der Erwartungswert E(XY) wird folgendermaen bestimmt: 8 R1 R1 > < xyf (x; y) dxdy ;1 E (XY ) = > ;1 : Pi Pj xiyj f (xi; yj ) 44 im stetigen Fall im diskreten Fall (5.6) Eigenschaften der Kovarianz: Cov(X; Y ) Cov(X + a; Y + b) Cov(aX; bY ) Cov(X; Y + Z ) Additionssatz fur die Varianz: Cov(Y; X ) Cov(X; Y ) abCov(X; Y ) Cov(X; Y ) + Cov(X; Z ) (5.7) V ar(X Y ) = V ar(X ) + V ar(Y ) 2Cov(X; Y ) Aus (5.6) folgt: Sind X und Y unabhangig, so gilt (5.10) E (XY ) = E (X )E (Y ) : Damit erhalt man fur unabhangige X und Y : (5.11) = = = = (5.8) (5.9) V ar(X + Y ) = V ar(X ) + V ar(Y ) bzw. Cov(X; Y ) = 0 : Additionssatz fur die Varianz einer Summe von n (beliebigen) Zufallsvariablen X1; :::; Xn: V ar( X i Xi) = = X X i i V ar(Xi) + 2 V ar(Xi) + X X i6=j i<j Cov(Xi; Xj ) Cov(Xi; Xj ) (5.12) 5.4 Der Korrelationskoezient Man kann versuchen, eine bestehende Abhangigkeit zwischen zwei Zufallsvariablen X und Y durch eine Funktion wiederzugeben. Lat sich die Abhangigkeit wenigstens zu einem gewissen Teil durch eine lineare Funktion beschreiben, so nennt man X und Y korreliert. In diesem Fall gilt mit mehr oder weniger groen Abweichungen Y b X + a oder X b0 Y + a0 (5.13) Wie gut man die Abhangigkeit zwischen X und Y durch eine lineare Funktion (durch eine Gerade) erfassen kann, sagt uns der Korrelationskoezient % von X und Y . Er ist deniert als % = %(X; Y ) = p Cov(X; Y ) (5.14) V ar(X ) V ar(Y ) Wir setzen voraus, da V ar(X ) und V ar(Y ) ungleich Null sind; die Falle V ar(X ) = 0 oder V ar(Y ) = 0 sind hier bedeutungslos. An den folgenden drei Eigenschaften erkennt man, da der Korrelationskoezient ein Ma fur den linearen Zusammenhang zwischen X und Y ist: 45 1. ; 1 % +1 (5.15) 2. Zwischen X und Y besteht genau dann eine lineare Beziehung Y = b X + a (und X = b0 Y + a0), wenn % den Wert +1 oder ;1 hat. Die Vorzeichen von % und b stimmen dabei uberein. 3. Je naher %2 bei 1 liegt, desto besser lat sich die Abhangigkeit zwischen X und Y durch eine Gerade beschreiben; je naher %2 bei 0 liegt, um so schlechter ist dies der Fall. Dabei wird die folgende Erklarung fur "besser beschreiben\ unterstellt: Betrachtet man Y in Abhangigkeit von X , so lat sich der Einu auf Y um so besser durch eine lineare Funktion (Gerade) der Form b X + a erfassen, desto genauer die Beziehung Y b X + a erfullt ist, das heit: desto geringer die Abweichungen zwischen Y und b X + a sind; dafur dient als Ma die sogenannte mittlere quadratische Abweichung E ([Y ; (b X + a)]2 ) = E ([Y ; b X ; a]2) (5.16) Entsprechend dient im umgekehrten Fall, in dem X in Abhangigkeit von Y betrachtet wird, die mittlere quadratische Abweichung E ([X ; b0 Y ; a0]2 ) als ein Ma dafur, wie genau die Beziehung X b0 Y + a0 gilt. Auf diesen Fall lassen sich alle Aussagen wortlich ubertragen, wenn man darin nur die Rollen von X und Y vertauscht. Der Korrelationskoezient %(X; Y ) gibt uber beide Formen linearer Abhangigkeiten zwischen X und Y stets dieselbe Auskunft. Er ist symmetrisch in X und Y . Wir gehen nun von (5.16) aus. In Abschnitt 8.3 (Methode der kleinsten Quadrate oder lineare Regression) werden wir zeigen, da diejenige Gerade y = x + , fur die (5.16) minimal wird, die Koezienten (X; Y ) und = E (Y ; X ) = Cov (5.17) V ar(X ) besitzt. Da sich die mittlere quadratische Abweichung mit Hilfe von (5.17) folgendermaen umformen lat: E ([Y ; X ; ]2 ) = (1 ; %2 )V ar(Y ) ; (5.18) erhalt man die Interpretation des Korrelationskoezienten als Ma des linearen Zusammenhanges: Je naher %2 bei 1 liegt, desto kleiner ist nach (5.18) die mittlere quadratische Abweichung E ([Y ; X ; ]2 ), umso besser lat sich nach der oben gegebenen Erklarung die Abhangigkeit zwischen X und Y durch eine Gerade (namlich die Gerade y = x + ) beschreiben. Je naher %2 bei 0 liegt, desto groer ist nach (5.18) E ([Y ; X ; ]2) und umso schlechter lat sich daher eine bestehende Abhangigkeit zwischen X und Y durch eine Gerade beschreiben. Ist %(X; Y ) = 0, so nennt man X und Y unkorreliert. 46 5.5 U bungsaufgaben Aufgabe 5.1 Erganzen Sie fur den Zufallsvektor (X; Y ) die folgende Verteilungstabelle X nY 2 4 5 P (X = xi ) -1 0.1 0.3 0.6 1 P (Y = yk ) 0.1 0.4 a) Berechnen Sie Erwartungswert und Varianz fur X und Y ! b) Sind X und Y stochastisch unabhangig? (Begrundung) c) Berechnen Sie die Kovarianz und den Korrelationskoezienten! d) Erganzen Sie die folgende Verteilungstabelle, wenn X und Y stochastisch unabhangig sein sollen. X nY y1 y2 P (X = xi) x1 0.06 0.1 0.9 x2 P (Y = yk ) e) Untersuchen Sie die Zufallsgroen der folgenden Verteilungstabelle auf Korreliertheit und Unabhangigkeit! X nY 0 1 2 P (Y = yk ) 1 2 5 P (X = xi ) 0.1 0.1 0 0.2 0.3 0.1 0.1 0.1 0 Aufgabe 5.2 Die zweidimensionale Zufallsgroe (X; Y ) besitze eine diskrete Verteilung, bei der die Werte (1,3), (2,4), (3,7), (5,6), (7,5), (8,1) und (9,2) jeweils mit der Wahrscheinlichkeit 1/7 angenommen werden. Man bestimme den Korrelationskoezienten und die beiden Regressionsgeraden. Aufgabe 5.3 Die Zufallsvariable X nehme die drei Werte ;1; 0; 1 jeweils mit Wahrscheinlichkeit 1/3 an; die Zufallsvariable Y sei gleich X 2. Wegen Y = X 2 sind X und Y voneinander abhangig. Man bestimme die gemeinsame Verteilung von X und Y und zeige: X und Y sind unkorreliert. 47 Aufgabe 5.4 Aufgabe 5.5 Man zeige, da zwei Null-Eins-verteilte Zufallsvariablen X und Y genau dann unabhangig sind, wenn sie unkorreliert sind. In der Praxis geht man zur Beschreibung eines Zusammenhanges zwischen X und Y oft von dem folgenden Modell aus: Zwischen X und Y herrscht eine lineare Beziehung, die durch eine Storgroe (Fehlervariable) Z uberlagert wird: Y = c X + d + Z . Dabei unterstellt man, da X und Z voneinander unabhangig sind und Z eine N (0; Z2 )-Verteilung besitzt. Wir betrachten = E (X ), 2 = V ar(X ), Z2 = V ar(Z ) sowie c und d als gegeben. In Abhangigkeit davon bestimme man % = %(X; Y ) und interpretiere seinen Wert fur Z2 ! 0 bzw. Z2 ! 1. Man zeige weiterhin, da y = c x + d die Regressionsgerade von Y bzgl. X ist. Aufgabe 5.6 Fur die in Aufgabe 3.25 gegebenen Zufallsvariablen X1; ; Xn bestimme man % = %(Xi; Xj ). Man interpretiere das Ergebnis { auch mit Hilfe von Aufgabe 5.4 { und zeige damit, wie man fur groe N die hypergeometrische durch die Binomialverteilung ersetzen kann. (Jedes Xi besitzt eine Null-Eins-Verteilung mit dem Parameter p = M=N , die X1; ; Xn sind nicht unabhangig.) 48 6 Funktionen von Zufallsgroen und Grundverteilungen der mathematischen Statistik 6.1 Funktionen von Zufallsgroen In vielen Anwendungsfallen sind Zufallsvariable Argumente von Funktionen; z.B. kann man den Absatz eines Produktes als Zufallsgroe und den erzielten Gewinn als Funktion dieser Zufallsgroe auassen. Wir betrachten eine Funktion Y = f (X ) ; wobei X und Y Zufallsgroen sind. Die Wahrscheinlichkeitsverteilung von X wird als bekannt angesehen. Dann lat sich die Wahrscheinlichkeitsverteilung von Y uber die Beziehung P (Y t) = P (f (X ) t) durch Berechnung der Umkehrfunktion bestimmen, falls diese existiert. Ein wichtiger Spezialfall ist die lineare Transformation: t ; b P (aX + b t) = P X a t ; b FY (t) = FX a Ist X eine stetige Zufallsgroe, so erhalt man fur die Dichte t ; b 1 fY (t) = fX a a : Dieser Zusammenhang wurde mit a = ; b = schon bei der Standardisierung der Normalverteilung benutzt. Bei diskreten Zufallsgroen werden mittels der Funktion f die moglichen Realisierungen von Y berechnet und die zugehorigen Wahrscheinlichkeiten werden auf die neuen Werte ubertragen. Dann sortiert man die Realisierungen von Y der Groe nach und fat gegebenenfalls Wahrscheinlichkeiten zusammen. 49 Erwartungswert und Varianz der Funktion einer Zufallsgroe: E (g(X )) = = V ar(g(X )) = = Z1 g(x)fX (x) dx fur stetige Zufallsgroen X ;1 g(xi) pi fur diskrete Zufallsgroen i Z1 (g(x) ; E (g(X )))2fX (x) dx fur stetige Zufallsgroen X ;1 i (g(xi) ; E (g(X )))2 pi fur diskrete Zufallsgroen Im Spezialfall der linearen Transformation Y = aX + b erhalt man: E (Y ) = aE (X ) + b V ar(Y ) = a2 V ar(X ) 6.2 Funktionen zufalliger Vektoren Wir betrachten hier nur den Spezialfall einer Summe von unabhangigen Zufallsgroen. Seien X; Y unabhangig. Dann ist die Verteilung der Summe gegeben durch P (X + Y = k) = fur diskrete X; Y bzw. fX +Y (t) = X l Z1 ;1 P (X = l)P (Y = k ; l) (Faltungssumme) fX (u)fY (t ; u) du (Faltungsintegral) fur stetige X; Y . Die Berechnung der Faltungen ist sehr schwierig und lat sich nur fur wenige Verteilungen ausfuhren. Im allgemeinen unterliegt die Verteilung einer Summe einem anderen Verteilungsgesetz als das der Summanden. Allerdings gibt es zwei wichtige Ausnahmen: Die Summe zweier unabhangiger poissonverteilter Zufallsgroen mit den Parametern 1 und 2 ist poissonverteilt mit dem Parameter 1 + 2. Die Summe zweier unabhangiger normalverteilter Zufallsgroen mit den Parametern (1; 12) und (2; 22) ist normalverteilt mit den Parametern (1 + 2 ; 12 + 22 ). 50 Momente einer Summe: ! n X E Xi i=1 ! n X V ar i=1 Xi n X = i=1 n X = i=1 E (Xi) V ar(Xi) bei Unabhangigkeit (vgl. auch Abschnitt 5.3) 6.3 Verteilungen der mathematischen Statistik Die folgenden Verteilungen spielen eine wesentliche Rolle fur die spater behandelten Schatz- und Testverfahren. 6.3.1 Die {Verteilung 2 Denition 6.1 Eine Zufallsvariable Y mit der Dichtefunktion fY (y) = 1 ( ;2)=2 2=2 ;(=2) y 0 e;y=2 fur y > 0 sonst heit 2 {verteilt (Chi-Quadrat-verteilt) mit Freiheitsgraden. Hierbei ist ;(x) die sogenannte Gammafunktion, fur die gilt: ;(x) = Z1 tx;1 e;tdt; x > 0: 0 Es gilt: Satz 6.1 Sind X1 ; X2; :::; X standardnormalverteilte unabhangige Zufallsvariablen, dann ist Y= X i=1 Xi2 mit Freiheitsgraden. Eine 2{verteilte Zufallsvariable ergibt sich also als Summe von Quadraten unabhangiger standardnormalverteilter Zufallsgroen. Erwartungswert und Varianz der 2 {Verteilung: 2 {verteilt E (Y ) = und V ar(Y ) = 2: 51 Approximationsmoglichkeiten fur die 2 -Verteilung: Fur 100 ist eine 2( ){verteilte Zufallsvariable naherungsweise N (; 2 ){ verteilt. p p Fur 30 ist Z = 2Y ; 2 ; 1 naherungsweise standardnormalverteilt. Am Ende des Skriptes bendet sich eine Tabelle der 2-Verteilung. Tabelliert sind zu den angegebenen Freiheitsgraden die y{Werte, bei denen FY (y) die im Kopf angegebenen p{Werte erreicht. Sie werden spater mit 2;p bezeichnet: P (Y 2;p) = p und heien Quantile der Ordnung p der 2-Verteilung mit Freiheitsgraden. 6.3.2 Die Student{Verteilung (t{Verteilung) Denition 6.2 Eine Zufallsvariable T mit der Dichtefunktion ;(( + 1)=2) fT (t) = p ;(= 2)(1 + t2 = )(+1)=2 heit student{verteilt mit Freiheitsgraden. Satz 6.2 Seien Z eine N (0; 1){verteilte und Y eine 2 ( ){verteilte Zufallsvariable. Z und Y seien unabhangig. Dann ist T = pZ student{verteilt mit Freiheitsgraden Y= bzw. t( )-verteilt. Erwartungswert und Varianz der Student{Verteilung: E (T ) = 0 fur 2 und V ar(T ) = ; 2 fur 3 : Approximationsmoglichkeiten fur die Student-Verteilung: Fur > 30 ist eine student{verteilte Zufallsvariable naherungsweise standardnormalverteilt. t;p : P (T t;p) = p heit Quantil der Ordnung p der Student{Verteilung mit Freiheitsgraden. Fur verschiedene Freiheitsgrade sind am Ende des Skriptes die Quantile der Student{ Verteilung tabelliert. Bei Benutzung der Tabelle ist zu beachten, da die Student{ Verteilung symmetrisch um ihren Erwartungswert ist. 6.3.3 Die F {Verteilung Denition 6.3 Eine stetige Zufallsvariable X mit der Dichtefunktion ; r ;; r21 + ;r22 x( 21 ;1) ; r21 ; r22 (r1x + r2) r1+2 r2 heit F{verteilt mit r1 und r2 Freiheitsgraden bzw. F (r1; r2 ){verteilt. fX (x; r1; r2) = (r1)r1=2 (r2)r2 =2 52 Satz 6.3 Sind Y1 und Y2 zwei 2{verteilte unabhangige Zufallsvariablen mit r1 und r2 Freiheitsgraden, so ist 1 X = YY1=r =r 2 F{verteilt mit r1 und r2 Freiheitsgraden. 2 Die F{Verteilung entsteht also als Quotient zweier 2 {verteilter Zufallsvariablen. Erwartungswert und Varianz der F-Verteilung: 2 r + r ; 2) 1 2 E (X ) = r r;2 2 ; r2 > 2 und V ar(X ) = r 2(rr2 (; 2 2) (r ; 4) ; r2 > 4 : 2 1 2 2 Approximationsmoglichkeiten fur die F-Verteilung: Fur r1 = 1 und r2 30 ist X naherungsweise standardnormalverteilt. Fur r1 = und r2 200 ist X naherungsweise 2 ( ){verteilt. Fur r1 = 1 und r2 = ist X student{verteilt mit Freiheitsgraden. (Diese Beziehung gilt exakt!) Satz 6.4 Ist X F (r1; r2){verteilt, so unterliegt X1 einer F (r2; r1){Verteilung. 6.4 U bungsaufgaben Aufgabe 6.1 Die Hohe der Nachfrage nach einem bestimmten Artikel eines Versandhauses ist eine Zufallsgroe X , deren Dichtefunktion gegeben ist durch 1=12 0 < x < 12 fX (x) = 0 sonst Die Kosten K sind gegeben durch K = 2X + 10. Berechnen Sie Erwartungswert und Varianz von K ! Aufgabe 6.2 Die Summe Z = X + Y von zwei unabhangigen, stetigen Zufallsgroen X und Y ist eine stetige Zufallsgroe, deren Dichtefunktion durch das Integral fZ (z) = Zz fX (x) fY (z ; x) dx 0 berechnet werden kann. 53 a) Bei einer Ampelanlage sind fur das Rotlichtsignal zwei Lampen eingebaut. Fallt die erste Lampe wegen Defekts aus, wird automatisch auf die zweite Lampe umgeschaltet. Die Lebensdauern X und Y (in Tagen) der beiden Lampen seien unabhangig und exponentialverteilt mit E (X ) = E (Y ) = 50. Wie gro sind Erwartungswert und Varianz der Gesamtlebensdauer? Berechnen Sie P (X + Y > 100). b) Die Reparaturzeit Z fur ein elektronisches Gerat setzt sich aus der Zeit X fur die Fehlersuche und der Zeit Y fur die Behebung des Defektes zusammen. X und Y sind exponentialverteilte Zufallsgroen. Die mittlere Suchzeit betragt 2 Stunden, die mittlere eigentliche Reparaturzeit 8 Stunden. 1. Wie lange dauert im Mittel eine Reparatur eines solchen Gerates? 2. Mit welcher Wahrscheinlichkeit dauert eine Reparatur nur hochstens 8 Stunden? Aufgabe 6.3 Aufgrund der technischen Gegebenheiten und der einschlagigen Vorschriften errechnete man fur eine projektierte Skiseilbahn eine zulassige Zuladung von 2 700 kg pro Gondel. Fur die Umsetzung in eine zulassige Personenanzahl gehe man davon aus, da fur das Personengewicht X und das Gewicht Y der Skiausrustung gelte E (X ) = 75; V ar(X ) = 80; E (Y ) = 15; V ar(Y ) = 4 : Die zulassige Personenanzahl n mu die Eigenschaft haben, da die Wahrscheinlichkeit fur eine U berschreitung der zulassigen Zuladung hochstens 1% betragt. Bestimmen Sie n unter den Pramissen, da X und Y unabhangig und normalverteilt sind. Aufgabe 6.4 Sei X eine stetige Zufallsvariable mit der Dichte fX (x) = 2(1 ; x) 0 fur 0 x 1 sonst und Y = 1 ; X . Man zeichne die Dichte von Y und bestimme E (Y ) und V ar(Y ). Aufgabe 6.5 X und Y seien zwei unabhangige, im Intervall [0,2] gleichverteilte Zufallsvariablen. Man bestimme: E (X + Y ); E (X ; Y ); V ar(X + Y ); V ar(X ; Y ); V ar(2X ; 3Y ): Aufgabe 6.6 Berechnen Sie die Varianz der Zufallsvariablen 54 X : "Summe der erzielten Augen beim Werfen zweier Wurfel\! Aufgabe 6.7 Man zeige: Ist X eine Zufallsvariable mit E (X ) = und V ar(X ) = 2 , so gilt fur die standardisierte Zufallsvariable Z (d.h. Z = X; ): E (Z ) = 0; V ar(Z ) = 1 : Aufgabe 6.8 Als Ma fur die Unsymmetrie einer Verteilung dient das Schiefema ) ) : = E ((X; 3 3 Dabei ist X eine Zufallsvariable mit E (X ) = und V ar(X ) = 2. Man zeige: 1. X und seine Standardisierung X; besitzen das selbe Schiefema, d.h., ist unabhangig von und 2 . 2. Eine symmetrische Verteilung besitzt das Schiefema 0. Aufgabe 6.9 Man berechne das Schiefema der Null{Eins{Verteilung mit dem Parameter p (vgl. Aufgabe 6.8) und diskutiere den Wert von in den Fallen p = 12 ; p ! 0 und p ! 1: Aufgabe 6.10 Wie gro ist die durchschnittliche Anzahl der Wurfe, die man braucht, um mit einem Wurfel jede der sechs Augenzahlen mindestens einmal geworfen zu haben? (Durchschnittliche Wartezeit bis zu einem vollstandigen Satz.) Aufgabe 6.11 Der Anhalteweg X eines mit 60 km/h fahrenden Autos setzt sich additiv zusammen aus dem Reaktionsweg X1 und dem Bremsweg X2, wobei X1 und X2 (stochastisch) unabhangige naherungsweise N (14; 9) bzw. N (36; 25) verteilte Zufallsvariable sind. a) Wie ist die Zufallsvariable X1 + X2 naherungsweise verteilt? b) Mit welcher Wahrscheinlichkeit liegt der Anhalteweg eines mit 60 km/h fahrenden Autos uber 55 m? 55 7 Stichproben Inhalt der induktiven Statistik ist es, Methoden zu erarbeiten, mittels derer Schlusse von einer Stichprobe auf die Grundgesamtheit bzw. Schlusse von einzelnen Beobachtungen auf dahinterstehende Gesetzmaigkeiten moglich sind. Die zu untersuchenden Merkmale werden als Zufallsgroen aufgefat. Man nimmt an, da sie nicht oder nicht vollstandig bekannt sind. Von einer Stichprobe (X1; : : : ; Xn) nimmt man im allgemeinen an, da die Xi; i = 1; : : : ; n unabhangige und identisch wie die Grundgesamtheit verteilte Zufallsgroen sind. Stichproben dieser Art heien Zufallsstichproben. Bei zufalligen Stichproben ist die Wahrscheinlichkeit, mit der jedes Element der Grundgesamtheit in die Stichprobe gelangt, gleich gro. Diese Annahme ist haug nur annaherungsweise erfullt, fuhrt jedoch zu "relativ einfachen\ statistischen Verfahren. Wir betrachten im folgenden Methoden der Stichprobenerhebung, wie sie in der Praxis angewandt werden. 7.1 Einige Auswahltechniken Die hier aufgefuhrten Auswahltechniken fuhren zu Stichproben, die i.allg. keine Zufallsstichproben sind, jedoch annaherungsweise so behandelt werden konnen. Wir denken uns die Elemente der Grundgesamtheit durchnumeriert. 1. Auswahl mit Zufallszahlen, die man einer Tabelle entnimmt oder mittels Rechner simuliert (aufwendig!) 2. Systematische (periodische) Auswahl: Die Grundgesamtheit enthalte N Elemente, von denen als Stichprobe n Elemente ausgewahlt werden sollen. Jedes k{te Element wird gezogen, wobei das erste gelost wird. Dabei erfolgt die Auswahl so, da k=N=n bzw. k < N=n und k soll grotmoglich sein. (keine reine Zufallsauswahl, da z.B. benachbarte Elemente nicht in die Stichprobe gelangen konnen) 3. Das Schluziernverfahren Man wahlt Anzahl und Stellen der Schluziern der durchnumerierten Grundgesamtheit so, da n moglichst genau realisiert wird. Das Verhaltnis n=N heit Auswahlsatz. 56 Im folgenden betrachten wir Stichproben, bei denen die bekannte Struktur einer Grundgesamtheit ausgenutzt wird. 7.2 Geschichtete Stichproben Die Grundgesamtheit wird in Teilmengen zerlegt, die in sich homogen, untereinander heterogen sind. Dann wird aus jeder Schicht eine Zufallsauswahl getroen, dabei sind die Schichten voneinander unabhangig. Diese Stichprobenerhebung ist teurer als eine reine Zufallsauswahl, liefert jedoch "genauere\ Stichproben, da die Kenntnisse uber die Struktur der Grundgesamtheit genutzt werden. Die Fragen a) wie man die Grundgesamtheit in Schichten zerlegen soll und b) wie sich die Stichprobe auf die Schichten aufteilt, damit der Genauigkeitsgewinn gegenuber der ungeschichteten reinen Zufallsauswahl moglichst gro wird, sind das eigentliche Problem bei der Planung einer geschichteten Stichprobe. Die Beantwortung von a) besteht in der Festlegung der Schichtungsvariablen, der Anzahl der zu bildenden Schichten und der Abgrenzung der Schichten untereinander. Als Schichtungsvariable werden qualitative Merkmale (Geschlecht, Familienstand, Konfession, Beruf usw.) bevorzugt, weil bei ihnen die Anzahl und Abgrenzung der Schichten oft auf naturliche Weise gegeben ist. Dann bleibt die Festlegung der Umfange der Teilstichproben in den Schichten. Wir wollen diese Vorgehensweise am Beispiel der Ermittlung des Mittelwertes verdeutlichen. Dabei gehen wir im folgenden davon aus, da die Grundgesamtheit auf geeignete Weise in k Schichten zerlegt wurde, und fuhren fur jede Schicht j = 1; : : : ; k die folgenden Groen ein: Nj : Anzahl der Elemente der j {ten Schicht in der Grundgesamtheit (Umfang der Schicht j ) ij : Wert von X , den das i{te Element in der j {ten Schicht besitzt Nj X 1 j = N ij j i=1 Mittelwert der j {ten Schicht Nj X 1 j = N (ij ; j )2 Varianz der j {ten Schicht j i=1 2 nj : Umfang der aus der j {ten Schicht gezogenen reinen Zufallsstichprobe 57 Unmittelbar klar sind die Beziehungen N = N1 + +Nk und n = n1 + +nk . Weiterhin gilt fur den Mittelwert der Grundgesamtheit (das sogenannte Gesamtmittel): Nj k X k X X 1 = N ij = N1 Nj j j =1 i=1 j =1 (7.1) Innerhalb der Gesamtstichprobe bezeichnen wir mit Xj1; : : : ; Xjnj die aus der j {ten Schicht gezogene Teilstichprobe. Das dazu gehorige ungewogene Stichprobenmittel nj X 1 Xj = n Xji j i=1 (7.2) dient als Schatzung fur j . Wegen (7.1) benutzt man als Schatzung fur das gewogene Stichprobenmittel k X 1 X = N Nj X j j =1 (7.3) Liegt die Schichtung der Grundgesamtheit fest, so bleibt noch die Frage oen, wie man die Gesamtstichprobe auf die Schichten aufteilen soll, mit anderen Worten: wie die n1; : : : ; nk unter der Nebenbedingung n1 + + nk = n festgelegt werden sollen (n betrachten wir als vorgegeben). Dafur haben sich im wesentlichen zwei Arten durchgesetzt: die proportionale Aufteilung und die optimale Aufteilung; entsprechend spricht man von einer proportional und einer optimal geschichteten Stichprobe. Man beachte dabei, da sich diese Attribute nicht auf die Schichtung, sondern auf die Aufteilung der Stichprobe auf bereits vorhandene Schichten beziehen. 7.2.1 Die proportional geschichtete Stichprobe Eine proportional geschichtete Stichprobe liegt vor, wenn fur jede Schicht j der Auswahlsatz nj =Nj gleich gro ist: n1 = n2 = = nk (7.4) N1 N2 Nk Man kann leicht zeigen, da sich daraus fur j = 1; : : : ; k die beiden folgenden Beziehungen ergeben: (7.5) nj = Nn Nj nj = Nj (7.6) n N Nach (7.5) ist der Umfang nj der aus der j {ten Schicht gezogenen Teilstichprobe proportional zum Schichtumfang Nj . (7.6) besagt, da der Anteil der j {ten Schicht in der Stichprobe genauso gro ist wie der Anteil der j {ten Schicht in der Grundgesamtheit. 58 In einer proportional geschichteten Stichprobe bezeichnen wir die Schatzung X fur den Mittelwert mit X prop. Aus (7.2), (7.3) und (7.5) folgt: X prop = N1 k X Nj X j = N1 j =1 k X Nj n1 j j =1 nj X Xji = n1 i=1 nj k X X j =1 i=1 Xji Das bedeutet: X prop ist ein ungewogenes Stichprobenmittel. 7.2.2 Die optimal geschichtete Stichprobe Eine optimal geschichtete Stichprobe liegt vor, wenn zu vorgegebenem n die n1 ; : : : ; nk so gewahlt werden, da V ar(X ) minimal wird. Die in diesem Sinne gunstigsten n1 ; : : : ; nk bezeichnen wir mit n1 ; : : : ; nk : Dafur gilt in sehr guter Naherung: n Nj j n (j = 1; : : : ; k) (7.7) j Pk N i=1 i i (Da in dieser Formel die rechte Seite im allgemeinen nicht ganzzahlig ist, mu man zur nachstgelegenen ganzen Zahl auf- oder abrunden, um nj zu erhalten; dabei ist die Nebenbedingung n1 + + nk = n zu berucksichtigen. Weiterhin mu beachtet werden, da keines der nj gleich Null oder groer als Nj wird. In einer optimal geschichteten Stichprobe bezeichnen wir die Schatzung fur den Mittelwert der Grundgesamtheit mit X opt . Diese Groe ergibt sich, wenn man (7.7) in (7.2) und (7.3) einsetzt. In einer optimal geschichteten Stichprobe sind die Stichprobenumfange nj proportional zu Nj j ; die Auswahlsatze nj =Nj sind proportional zu j und damit fur in sich homogene Schichten kleiner als fur heterogene. Im Gegensatz dazu sind in einer proportional geschichteten Stichprobe die geschichteten Stichprobenumfange proportional zu Nj und die Auswahlsatze fur jede Schicht gleich gro; die Varianzen j2 innerhalb der einzelnen Schichten bleiben unberucksichtigt. Bei der Durchfuhrung einer optimal geschichteten Stichprobe treten in der Praxis die beiden folgenden Probleme auf: 1. Die Varianzen 12; : : : ; k2 sind in der Regel unbekannt. Sie mussen aus fruheren Erhebungen oder aus einer eigens dafur durchzufuhrenden Vorstichprobe geschatzt werden. Dabei konnen Ungenauigkeiten auftreten, welche die Vorzuge der optimal geschichteten Stichprobe wieder aufheben. Sogar eine Verschlechterung gegenuber der proportionalen Aufteilung ist moglich. 2. Die optimale Aufteilung der Stichprobe hangt von den Varianzen j2 der Zufallsvariablen X in den einzelnen Schichten ab und ist damit auf ein bestimmtes Untersuchungsmerkmal X zugeschnitten. Oft sollen aber durch eine Stichprobe mehrere Merkmale X , Y usw. untersucht werden. Eine Stichprobe, die bezuglich X optimal geschichtet ist, kann bezuglich Y eine sehr ungunstige Aufteilung darstellen. 59 Diese Probleme treten bei einer proportional geschichteten Stichprobe nicht auf; sie wird deswegen der optimalen Aufteilung haug vorgezogen. 7.2.3 Bemerkungen zum Schichtungseekt Wir bezeichnen mit X reiZ das ungewogene Stichprobenmittel in einer reinen Zufallsauswahl. Fur die Varianz von X reiZ und die Varianzen von X prop und X opt sind im allgemeinen die folgenden Ungleichungen erfullt: V ar(X opt) V ar(X prop) V ar(X reiZ ) (7.8) Nahere Untersuchungen zeigen: 1. Der Schichtungsgewinn der proportional geschichteten Stichprobe gegenuber der reinen Zufallsauswahl ist um so groer, je starker die Mittelwerte 1; : : : ; k der einzelnen Schichten voneinander abweichen. Bei der Planung einer proportional geschichteten Stichprobe sollte man deswegen die Schichtung der Grundgesamtheit so vornehmen, da sich die Schichten bezuglich ihrer Mittelwerte moglichst stark voneinander unterscheiden und in diesem Sinne untereinander moglichst heterogen sind. 2. Der Schichtungsgewinn der optimal geschichteten Stichprobe gegenuber der proportional geschichteten ist um so groer, je starker die Standardabweichungen 1 ; : : : ; k der einzelnen Schichten voneinander abweichen. Bei der Planung einer optimal geschichteten Stichprobe sollte man daher dafur sorgen, da sich die Schichten sowohl in ihren Mittelwerten als auch in ihren Streuungen moglichst stark unterscheiden und in dieser zweifachen Hinsicht untereinander moglichst heterogen sind. Zusammenfassend konnen wir feststellen: Der U bergang von der reinen Zufallsauswahl zur proportional geschichteten Stichprobe tragt dem Unterschied zwischen den Mittelwerten der Schichten Rechnung; der U bergang von der proportional zur optimal geschichteten Stichprobe berucksichtigt daruber hinaus den Unterschied zwischen den Streuungen innerhalb der einzelnen Schichten. 7.3 Klumpenstichproben Die Klumpenstichprobe bildet in gewissem Sinne das Gegenstuck zur geschichteten Stichprobe: Zugunsten eines einfacheren und billigeren Erhebungsverfahrens nimmt man bei der Klumpenauswahl haug eine groere Ungenauigkeit gegenuber der reinen Zufallsauswahl in Kauf. Zur Durchfuhrung einer Klumpenstichprobe wird die Grundgesamtheit in Teilgesamtheiten, sogenannte Klumpen, zerlegt; im Gegensatz zu den Schichten bei einer geschichteten Auswahl sollen die Klumpen in sich moglichst heterogen und untereinander moglichst homogen sein, jeder Klumpen soll moglichst reprasentativ fur die Grundgesamtheit sein. 60 Aus diesen Klumpen, ihre Anzahl sei M , werden dann m Stuck durch eine reine Zufallsauswahl ausgewahlt. Die Stichprobe besteht aus allen Elementen der m gewahlten Klumpen. In der Praxis fuhrt man eine Klumpenstichprobe meistens dann durch, wenn die Elemente der Grundgesamtheit von vornherein in Gruppen zusammengefat vorliegen, die vorhandenen Gruppen werden als Klumpen benutzt. In diesen Fallen ist die Klumpenstichprobe gegenuber der reinen Zufallsauswahl (und erst recht gegenuber der geschichteten Stichprobe) ein besonders einfaches und kostengunstiges Erhebungsverfahren. Dabei hat man allerdings keinen Einu darauf, wie reprasentativ jeder Klumpen fur die Grundgesamtheit ist. Wir betrachten wieder die Schatzung eines unbekannten Mittelwertes der Grundgesamtheit mittels einer Klumpenstichprobe. Dazu betrachten wir fur jeden Klumpen i = 1; : : : ; m der Stichprobe die Zufallsvariable Yi : Summe der X {Werte aller Elemente des i{ten Klumpens. (Mit X bezeichnen wir wie stets die Untersuchungvariable.) Dann ist m 1X m i=1 Yi der Durchschnittswert der Summe der X {Werte pro Klumpen in der Stichprobe. Wir erhalten daraus: X Yb = M Yi m m (7.9) i=1 ist eine Schatzung fur die Gesamtsumme der X {Werte in der Grundgesamtheit. Daher benutzt man in einer Klumpenstichprobe m X X klu = N1 Yb = N1 M m Yi i=1 (7.10) als Schatzung fur . Entsprechend dient V ar(X klu) als Ma fur die Genauigkeit der Klumpenstichprobe. Um diese mit V ar(X reiZ ), dem Ma fur die Genauigkeit einer reinen Zufallsstichprobe, vergleichen zu konnen, hat man zu beachten, da der Umfang einer Klumpenstichprobe zufallig ist: In der Regel sind namlich die M Klumpen der Grundgesamtheit nicht gleich gro; wahlt man m von ihnen zufallig aus, so hangt auch die Anzahl der damit erfaten Elemente vom Zufall ab. Im Durchschnitt besitzt jeder der M Klumpen N=M Elemente. Daher gilt fur den durchschnittlichen Umfang n der Klumpenstichprobe: N (7.11) n=m M 61 Beim Vergleich von V ar(X klu) und V ar(X reiZ ) legt man daher der reinen Zufallsauswahl den Stichprobenumfang (7.11) zugrunde. Davon ausgehend versteht man unter dem Klumpungseekt den Unterschied zwischen V ar(X klu) und V ar(X reiZ ). Ist V ar(X klu) groer als V ar(X reiZ ), so spricht man von einem Klumpungsverlust, im umgekehrten Fall von einem Klumpungsgewinn. Die Berechnung von V ar(X reiZ ), V ar(X klu) und der Vergleich dieser beiden Groen liefert folgende Ergebnisse: 1. Je homogener die Klumpen untereinander (je heterogener sie in sich) sind, desto kleiner ist V ar(X klu). Mit anderen Worten: Die Klumpenstichprobe ist um so genauer, desto besser jeder Klumpen die Grundgesamtheit reprasentiert. 2. Sind alle Klumpen gleich gro (in diesem Fall besitzt die Klumpenstichprobe denselben festen Stichprobenumfang n wie die zum Vergleich herangezogene reine Zufallsauswahl), so lassen sich die folgenden, auch heuristisch naheliegenden Aussagen nachweisen: (a) Erfolgt die Klumpenbildung in der Grundgesamtheit selbst rein zufallig, so ist die Klumpenstichprobe der reinen Zufallsauswahl in punkto Genauigkeit ebenburtig; der mittlere (zu erwartende) Klumpungseekt ist in diesem Fall gleich Null. (b) Sind die Klumpen untereinander heterogener und in sich homogener, als man bei rein zufalliger Klumpung erwarten wurde, so entsteht ein Klumpungsverlust, anderenfalls ein Klumpungsgewinn. 3. Fur verschieden groe Klumpen ist die Aussage (2b) tendenziell ebenfalls gultig. Die Aussage (2a) lat sich in ihrer exakten Form nicht mehr aufrechterhalten; sie ist naherungsweise erfullt, wenn die Klumpenumfange nicht zu stark variieren. Eine systematische Klumpenbildung kann also zu einem positiven oder negativen Klumpungseekt fuhren. 7.4 U bungsaufgaben Aufgabe 7.1 Aus einer durchnummerierten Grundgesamtheit G = f1; : : : ; N g mit N = 10 000 Elementen soll eine gleichgewichtete Zufallsauswahl vom Umfang n = 120 gezogen werden. a) Es wird eine periodische Auswahl vorgenommen (jedes k{te Element wird gezogen). Man bestimme k derart, da das vorgeschriebene n moglichst gut eingehalten, aber nicht unterschritten wird. Wie gro ist der durchschnittliche Stichprobenumfang dieser Auswahl? b) Die Stichprobe wird mit Hilfe des Schluziernverfahrens gezogen. Man gebe eine Schluziernkombination an, die den vorgegebenen Auswahlsatz einhalt. 62 Aufgabe 7.2 Die Grundgesamtheit G besteht aus N = 4 Elementen mit den X {Werten 1; 2; 3; 4: Es wird eine reine Zufallsstichprobe vom Umfang n = 2 gezogen. Man gebe alle moglichen Stichproben mit den dazugehorigen X {Werten an und bestimme daraus V ar(X ). Aufgabe 7.3 Eine Grundgesamtheit G, die aus N = 4 Elementen mit den X {Werten 1; 2; 3; 4 besteht, wird rein zufallig in M = 2 Klumpen mit N1 bzw. N2 Elementen zerlegt; dabei sind N1 und N2 fest vorgegeben. Anschlieend werden m = 1 Klumpen zufallig ausgewahlt. Man zeige mit Hilfe des Ergebnisses von Aufgabe 7.2: a) Fur N1 = N2 = 2 ist der mittlere Klumpungseekt gleich Null. b) Fur N1 = 1 und N2 = 3 entsteht im Mittel ein Klumpungsverlust. Hinweis: Man berechne in beiden Fallen zu jeder moglichen (gleichwahrscheinlichen) Klumpung V ar(X klu) und daraus die mittlere Varianz von X klu. Aufgabe 7.4 Aus einer Urne U mit N Kugeln, darunter M weie, werden n Kugeln vermoge einer reinen Zufallsauswahl a) mit Zurucklegen, b) ohne Zurucklegen gezogen. Als Stichprobenvariable betrachten wir die Null{Eins{verteilte Zufallsvariable Xi , die den Wert 0 oder 1 annimmt, je nachdem, ob die gezogene Kugel wei ist oder nicht (i = 1; : : : ; n). Welche Verteilung besitzt X1 + : : : + Xn unter a), welche unter b)? Man bestimme in beiden Fallen die Varianz von X (= X reiZ ). Aufgabe 7.5 Fur die Urne U aus Aufgabe 7.4 (Urne U mit N Kugeln, darunter M weie) legen wir die Parameter N = 12 und M = 6 fest und teilen sie in zwei Urnen U1 und U2 auf: U1 enthalte 6 Kugeln, darunter 3 weie, U2 ebenfalls. U1 und U2 sind in sich auerst heterogen und untereinander vollig homogen. Diese Zerlegung von U stellt eine extrem ungunstige Schichtung, aber eine extrem gunstige Klumpung dar. Es wird a) eine geschichtete Stichprobe vom Umfang n = 6 gezogen, indem aus U1 und U2 jeweils 3 Kugeln ohne Zurucklegen gezogen werden, b) eine Klumpenstichprobe gleichen Umfanges gezogen, indem eine der beiden Urnen, U1 oder U2 , zufallig gewahlt wird. Man bestimme die Varianzen von X prop, X opt und X klu und zeige mit Hilfe des Ergebnisses von Aufgabe 7.4, da hier gilt: 0 = V ar(X klu) < V ar(X reiz ) < V ar(X prop) = V ar(X opt ) 63 Aufgabe 7.6 Die Urne U aus Aufgabe 7.5 (Urne U mit N Kugeln, darunter M weie; N = 12; M = 6) wird in die beiden folgenden Urnen aufgeteilt: Urne U1 enthalte die sechs weien und Urne U2 die ubrigen sechs Kugeln (extrem gunstige Schichtung, extrem ungunstige Klumpung). Es werden die gleichen Stichproben a) und b) wie in Aufgabe 7.5 gezogen. Es wird a) eine geschichtete Stichprobe vom Umfang n = 6 gezogen, indem aus U1 und U2 jeweils 3 Kugeln ohne Zurucklegen gezogen werden, b) eine Klumpenstichprobe gleichen Umfanges gezogen, indem eine der beiden Urnen, U1 oder U2 , zufallig gewahlt wird. Man bestimme die Varianzen von X prop und X klu (wegen 1 = 2 = 0 kommt eine optimal geschichtete Stichprobe nicht in Betracht) und zeige, da hier gilt: 0 = V ar(X prop) < V ar(X reiz ) < V ar(X klu): 64 8 Punktschatzungen Wir nehmen an, da von der Grundgesamtheit X der Verteilungstyp als bekannt vorausgesetzt wird, wenigstens ein Parameter dieser Verteilung unbekannt ist. Wir charakterisieren den Verteilungstyp einer stetigen bzw. diskreten Zufallsgroe X durch ihre Dichtefunktion f (t; #) (1 < t < +1), bzw. ihre Einzelwahrscheinlichkeiten P (X = xi ; #) = p(xi ; #) (i = 1; 2; : : : ) mit dem ein- oder mehrdimensionalen Parameter #. Die statistischen Schatzverfahren dienen dazu, den Parameter #, von dem wir annehmen, da er unbekannt ist, auf der Basis einer aus der Grundgesamtheit gezogenen Stichprobe zu schatzen. Diese Schatzungen, die Stichprobenfunktionen und dementsprechend Zufallsgroen sind, werden Schatzfunktionen genannt. Diese bezeichnen wir fur eine mathematische Stichprobe (X1; X2; : : : ; Xn) vom Umfang n mit #b = g(X1; X2; : : : ; Xn). Ihre Realisierung, wird mittels einer konkreten Stichprobe x1 ; x2 ; : : : ; xn { einer Realisierung von (X1 ; X2; : : : ; Xn) { gewonnen und heit Schatzwert. 8.1 Maximum{Likelihood{Methode Denition 8.1 Ist x1; x2 ; : : : ; xn eine aus einer Grundgesamtheit X gezogene konkrete Stichprobe vom Umfang n und ist X eine diskrete bzw. stetige Zufallsgroe mit den Einzelwahrscheinlichkeiten P (X = xi ; #); (i = 1; 2; : : : ) bzw. der Dichte fX (t; #), wobei der Parameter # unbekannt ist, dann wird die Funktion L(x1 ; x2 ; : : : xn; #) = L(x1 ; x2; : : : ; xn; #) = Yn i=1 Yn i=1 P (X = xi ; #) bzw. fX (xi ; #) als Likelihood-Funktion bezeichnet. Ein Schatzwert #b des Parameters #, fur den die Likelihood-Funktion an der Stelle # = #b ein eindeutig bestimmtes Maximum besitzt, wird Maximum-Likelihood-Schatzung (MLS) fur # genannt. Ist #b die Maximum{Likelihood{Schatzung des Parameters # und soll eine Funktion g(#) geschatzt werden, so ist die Maximum{Likelihood{Schatzung gd (#) dieser Funktion gleich b der Funktion g(#) der Schatzung von #. 65 8.2 Momentenmethode Bei der Momentenmethode wird von einer mathematischen Stichprobe (X1; : : : ; Xn) ausgegangen, die aus einer Grundgesamtheit X gezogen wurde. Die Wahrscheinlichkeitsverteilung von X soll von dem Parameter # abhangen. Der Parameter # sei eine k{dimensionale Groe, d.h., # besteht aus k Komponenten, fur die Punktschatzfunktionen gesucht sind. Weiterhin sollen die im allgemeinen vom Parameter # abhangenden Momente mr von X mindestens bis zur k{ten Ordnung existieren: mr = E (X r ) = gr (#) (r = 1; 2; : : : ; k): Zur Schatzung der unbekannten Komponenten des Parameters # wird das Moment mr durch die Stichprobenfunktion n X mb r = n1 Xjr j =1 (r = 1; 2; : : : ; k) ersetzt. Damit ist ein Gleichungssystem gegeben, in dem die Komponenten des Parameters die Unbekannten sind. Die Losungen dieses Gleichungssystems werden als Momentenschatzungen bezeichnet. 8.3 Methode der kleinsten Quadrate Wir betrachten das folgende Modell: Y (x) = h(x) + Z (x) (8.1) mit E (Z (x)) = 0 und V ar(Z (x)) = 2 fur alle x. Die Funktion h(x) ist unbekannt. Um h(x) zu schatzen, gibt man sich n Werte x1 ; : : : ; xn vor und beobachtet zu jedem xi{Wert eine Realisierung y(xi) von Y (xi). Wir setzen yi = y(xi); i = 1; : : : ; n: Die Schatzung bh(x) fur h(x) stutzt sich auf die beobachteten Wertepaare (xi ; yi); i = 1; ; n: Als Ma fur die Anpassung von bh(x) an die Beobachtungspunkte (xi ; yi) dient die Summe der quadratischen Abweichung X b 2 Q(bh) = yi ; h(xi) n i=1 (8.2) Die Anpassung ist um so besser, desto kleiner Q(bh) ausfallt. Die Methode der kleinsten Quadrate besteht darin, innerhalb einer vorgegebenen Klasse von Funktionen bh(x) so zu 66 bestimmen, da Q(bh) minimal wird. Um diese Vorgehensweise mit einer Schatzung unbekannter Parameter identizieren zu konnen, mu man unterstellen, da der gleiche Funktionstyp, den man fur bh(x) festgelegt hat, auch fur die unbekannte Funktion h(x) zutrit. Damit kommt man zu der folgenden Spezizierung des Modells (8.1): Y (x) = h(x; 0; : : : ; r ) + Z (x) ; (8.3) wobei der Funktionstyp h als bekannt gilt, die Parameter 0; ; r von h unbekannt sind, z.B. h(x) = 0 + 1x + + r xr . Die gewonnenen Schatzungen fur 0; ; r werden Kleinste{Quadrate{Schatzungen (KQ{Schatzungen) genannt. Als Beispiel nehmen wir an, da sich der Einu der x{Werte auf den Erwartungswert von Y durch eine lineare Funktion h(x) = + x darstellen lat; und sind unbekannt. In diesem Fall geht 8.2 uber in n X Q = Q(; ) = (yi ; ; xi)2 i=1 Q besitzt als Funktion von und ein eindeutig bestimmtes Minimum. Die partiellen Ableitungen von Q nach und lauten: n @Q = ;2 X (yi ; ; xi) @ i=1 n @Q = ;2 X xi (yi ; ; xi ) @ i=1 Setzt man diese gleich Null, so erhalt man fur die KQ{Schatzungen von b und b die Bestimmungsgleichungen n X i=1 n X i=1 Ihre Losungen lauten: yi = xi yi = X b n + b xi i=1 n n X bX b xi + x2i n i=1 i=1 b = y ; b x Pn x y ; nx y i i b = i=1P n x2i ; nx2 (8.4) (8.5) i=1 mit n n X X 1 1 x = n xi und y = n yi: i=1 i=1 67 Wir fuhren die Groen 1 n X sx = n ; 1 (xi ; x)2 i=1 n X sxy = n ;1 1 (xi ; x)(yi ; y) i=1 2 ein. Rein formal lassen sich s2x als Stichprobenvarianz der Werte x1 ; : : : ; xn und sxy als die Stichprobenkovarianz der Wertepaare (x1; y1); : : : ; (xn; yn) auassen. Man rechnet leicht nach, da die Beziehungen n X i=1 n X i=1 (xi ; x )2 = (xi ; x)(yi ; y) = n X i=1 n X i=1 x2i ; n x2 und xi yi ; nx y gelten. Damit geht die Schatzformel fur b uber in b = ssxy2 (8.6) x Vergleicht man diese Ergebnisse mit Abschnitt 5.4, so fallt die formale Analogie zwischen den Schatzformeln fur b und b und den Formeln fur die Koezienten und der Regressionsgeraden von Y bzgl. X auf. Diese Analogie hat ihren Grund: Fat man namlich die x{Werte als Realisationen einer Zufallsvariablen X auf, so ist h(X ) = + X die Regressionsgerade von Y bzgl. X und b und b sind Schatzungen der Regressionskoezienten und . Man nennt h(X ) die Regressionsgerade der Grundgesamtheit X (die theoretische Regressionsgerade) und bh(x) = b +b x die Regressionsgerade der Stichprobe (die beobachtete Regressionsgerade). 8.4 Bayessche Schatzungen Ein "Bayessianer\(Subjektivist) geht davon aus, da Wahrscheinlichkeiten vom Kenntnisstand des jeweiligen Betrachters abhangen. Fur ihn gibt es keine strikte Trennung zwischen zufalligen Groen (Zufallsvariablen) und nichtzufalligen Groen (Parametern). So kann auch ein unbekannter Paramter als Zufallsvariable aufgefat und ihm eine (subjektive) Wahrscheinlichkeitsverteilung zugeordnet werden. Das bedeutet, da wir zwischen dem Parameter als Zufallsvariable und dem Parameterwert z als Realisierung dieser Zufallsvariablen unterscheiden mussen. Die Zufallsvariable "Parameter\ bezeichnen wir mit Z . Sie beschreibt die moglichen Zustande der Grundgesamtheit. Die Realisationen von Z sind die moglichen Parameterwerte z. Wie jeder Zufallsvariablen wird auch Z eine Wahrscheinlichkeitsverteilung zugeordnet. Damit wird auch eine Aussage z.B. der Form P (Z = z) = p sinnvoll; sie besagt: Die Wahrscheinlichkeit, da der unbekannte 68 Parameter den Wert z besitzt, ist gleich p. Vor der Beobachtung der Stichprobe entspricht die Verteilung von Z den Vorkenntnissen des Betrachters uber den Parameter. Diese von der Person des Betrachters abhangige Verteilung heit die a-priori-Verteilung des Parameters. Sie ist vom Betrachter anzugeben. Verschiedene Personen konnen dem Paramter verschiedene a-priori-Verteilungen zuordnen. In der a-priori Verteilung steckt das eigentliche subjektive Element bei der Auswertung einer Stichprobe. Nach der Beobachtung der Stichprobe stellt die Verteilung von Z den neuen, durch die Vorkenntnisse und Beobachtungen bestimmten Kenntnisstand des Betrachters uber den Parameter dar. Diese Verteilung heit die a posteriori-Verteilung des Parameters. Diese Art der Auswertung entspricht einem Lernen aus Beobachtungen: Man lernt durch die Beobachtungen hinzu (vermehrt sein Wissen durch die Beobachtung), indem man von der a-priori-Verteilung zur a-posteriori Verteilung ubergeht. Auch fur Subjektivisten ist die Stichprobe und deren Beobachtung objektiv gegeben. Der U bergang von der a-priori zur a-posteriori-Verteilung darf deswegen keine subjektiven Elemente enthalten. Anders ausgedruckt: Liegen zum einen das Auswahlverfahren und damit die Verteilung der Stichprobe und zum anderen die beobachteten Stichprobenwerte fest, so mussen gleiche a-priori-Verteilungen auch zu gleichen a-posteriori-Verteilungen fuhren. Wir veranschaulichen Bayessche Verfahren am Beispiel der Ermittlung einer unbekannten Wahrscheinlichkeit. 8.4.1 Die a-posteriori-Verteilung bei diskreter a-priori Verteilung Es sei die a-priori-Verteilung durch f (zi) = P (Z = zi) = pi fur alle i (8.7) gegeben. Als Auswahlverfahren legen wir eine reine Zufallsauswahl mit Zurucklegen zugrunde. Die Stichprobenvariablen X1; : : : ; Xn sind dann voneinander unabhangig. Jedes Xi besitzt dieselbe Null{Eins{Verteilung mit dem Paramter z, falls Z den Wert z hat. Mit anderen Worten: Die bedingten Wahrscheinlichkeiten der Xi unter der Bedingung Z = z lauten P (Xi = 1jZ = z) = z und P (Xi = 0 j Z = z) = 1 ; z : Sie lassen sich zusammenfassen zu P (Xi = xi jZ = z) = zxi (1 ; z)1;xi fur xi = 1 oder 0 Wegen der Unabhangigkeit der X1 ; : : : ; Xn erhalten wir daraus: P (X1 = x1 ; : : : ; Xn = xn jZ = z) = PP(X1 = x1 jZ =P z) P (Xn = xn jZ = z) = z xi (1 ; z)n; xi (8.8) Die a-priori-Verteilung (8.7) und die bedingte Stichprobenverteilung (8.8) beschreiben die Situation vor der Ziehung der Stichprobe. Nach der Durchfuhrung der Stichprobe 69 mogen die Stichprobenwerte x1 ; : : : ; xn beobachtet worden sein, ein Ereignis, das wir mit B bezeichnen: B : "X1 = x1 und X2 = x2 und : : : und Xn = xn\ Wir erhalten nun nach dem Satz von Bayes (vgl. Abschnitt 1.4): P (Z = zj jB ) = PP P(B(BjZjZ==zjz) P) P(Z(Z==zjz) ) = PP P(B(BjZjZ==zjz) f) (fz(jz) ) i i i i i i (8.9) fur alle zj . Diese bedingten Wahrscheinlichkeiten legen nach der Beobachtung B die Verteilung von Z fest. Man nennt diese Verteilung die bedingte Verteilung von Z unter der Bedingung B (bzw. nach der Beobachtung x1 ; : : : ; xn ). Sie wird als die a-posterioriVerteilung des Parameters nach der Beobachtung x1; ; xn erklart; ihre Wahrscheinlichkeitsfunktion, die wir mit fpost(zjx1 ; : : : ; xn) = P (Z = zjB ) (8.10) bezeichnen, ist durch (8.9) gegeben. Setzen wir darin (8.8) und (8.7) ein, so erhalten wir: zjy (1 ; zj )n;y f (zj ) fpost(zj j B ) = P zy (1 ; z )n;y f (z ) i i i i mit y = n X k=1 xk fur alle zj (8.11) Die a-posteriori-Verteilung des Parameters stellt den Informationsstand uber den Parameter nach der Beobachtung der Stichprobe dar. Die Formel (8.11) gibt an, wie die a-posteriori-Verteilung aus der a-priori Verteilung und den bedingten Stichprobenverteilungen bestimmt wird. Wir bemerken, da die Reihenfolge der Beobachtungen keine Rolle spielt, sondern nur die Summe der Beobachtungswerte. 8.4.2 Die a-posteriori-Verteilung bei stetiger a-priori Verteilung In den meisten Fallen ist der Umfang N der Grundgesamtheit sehr gro oder unbekannt. Man geht dann davon aus, da fur den unbekannten Parameter p jede reelle Zahl zwischen 0 und 1 moglich ist. Die Vorkenntnisse des Betrachters werden in diesem Fall durch eine stetige a-priori-Verteilung von Z beschrieben und als Dichte angegeben: f (z) = Dichte der a-priori-Verteilung (8.12) Als Auswahlverfahren legen wir wieder eine reine Zufallsauswahl mit Zurucklegen zugrunde. Die bedingte gemeinsame Verteilung der Stichprobenvariablen X1; : : : ; Xn unter der Bedingung Z = z ist dann dieselbe diskrete Verteilung wie unter 8.4.1; ihre Wahrscheinlichkeitsfunktion f (x1; : : : ; xn j z) ist durch (8.8) gegeben. Nach Durchfuhrung der Stichprobe mogen die Stichprobenwerte x1 ; : : : ; xn beobachtet 70 worden sein. Eine Verallgemeinerung des Satzes von Bayes besagt, da die bedingte Verteilung von Z unter der Bedingung X1 = x1 ; : : : ; Xn = xn eine stetige Verteilung mit der Dichte fpost(z j x1 ; : : : ; xn) = R1 f (x1 ; : : : ; xn j z) f (z) f (x1 ; : : : ; xn j t) f (t) dt (8.13) 0 ist. Nach dem verallgemeinerten Satz von Bayes ist die bedingte Verteilung von Z nach der Beobachtung (x1 ; : : : ; xn) eine stetige Verteilung mit der Dichte fpost(z j x1; : : : ; xn) = P zy (1 ; z)n;y f (z) R1 ty (1 ; t)n;y f (t) dt (8.14) 0 mit y = xi. Die durch fpost(z j x1; : : : ; xn ) festgelegte bedingte Verteilung von Z stellt die a-posteriori-Verteilung des Parameters nach der Beobachtung dar. 8.4.3 Der Schatzwert eines Subjektivisten Der Subjektivist wertet die Stichprobe aus, indem er aus der Beobachtung dazulernt. Dieser Lernvorgang ist mit dem U bergang von der a-priori auf die a-posteriori-Verteilung abgeschlossen. Einen aus der Stichprobe gewonnenen Schatzwert zb fur den Parameter z anzugeben, pat nicht so ohne weiteres zu dieser Vorgehensweise. Oft ist aber auch fur einen Subjektivisten die Situation gegeben, in der er mit einem bestimmten Schatzwert zb an Stelle des unbekannten z weiterarbeiten mu. Bester Schatzwert zb ist derjenige z{Wert, fur den die Wahrscheinlichkeitsfunktion bzw. Dichte fpost(z j y) der a-posteriori Verteilung am groten ist, d.h.: zb ist der Modalwert der a posteriori-Verteilung. 8.5 Eigenschaften von Schatzungen In den vorhergehenden Abschnitten haben wir gesehen, da zur Schatzung von Parametern einer Grundgesamtheit verschiedene Methoden verwendet werden konnen. Dies kann zu verschiedenen Punktschatzfunktionen fuhren. Es erhebt sich die Frage, welche dieser Schatzfunktionen uns die beste Information uber den unbekannten Parameter liefert, mit anderen Worten, welche dieser Schatzfunktionen wir wahlen. Es ist zu klaren, nach welchen Kriterien die entsprechenden Schatzfunktionen ausgewahlt werden konnen. Als Ma fur den Schatzfehler verwenden wir die mittlere quadratische Abweichung (Mean square error, MSE): MSE(#; #b) = E (#b ; #)2 71 Der MSE einer Schatzung setzt sich aus einem systematischen Fehler und einem zufalligen Fehler zusammen: E ((#b ; #)2 ) = E ((#b ; E (#b) + E (#b) ; #)2 ) = E (#b ; E (#b))2 + 2E (#b ; E (#b))(E (#b) ; #) + E (E (#b) ; #)2 = V ar(#b) + (E (#b) ; #)2 E (#b) ; # : Bias, Verzerrung, systematischer Fehler V ar(#b) : zufalliger Fehler. Damit fordern wir folgende Eigenschaften: 1. Erwartungstreue Schatzungen: Denition 8.2 Eine Punktschatzfunktion #b(X1 ; : : : ; Xn) eines Parameters # nennen wir erwartungstreu (unverzerrt), wenn der Erwartungswert von #b gleich dem Parameter # ist, d.h., wenn gilt: E (#b) = #. Eine Punktschatzfunktion #b eines Paramerters # bezeichnen wir als asymptotisch erwartungstreu, falls fur wachsenden Stichprobenumfang der Grenzwert des Erwartungswertes von #b gleich dem Parameter # ist, d.h., wenn gilt: lim E (#b(X1; : : : ; Xn)) = # : n!1 2. Eziente Schatzungen Denition 8.3 Die erwartungstreue Punktschatzfunktion #b1 des Parameters # der Grundgesamtheit nennen wir ezienter (wirksamer) als eine erwartungs- treue Punktschatzfunktion #b2 desselben Parameters, wenn fur ihre Varianzen V ar(#b1 ) = E ((#b1 ; #)2 ) und V ar(#b2) = E ((#b2 ; #)2 ) gilt: V ar(#b1 ) < V ar(#b2 ) : 3. Konsistenz Denition 8.4 Eine Punktschatzfunktion #b(X1; : : : ; Xn) eines Parameters # bezeichnen wir als (schwach) konsistent, wenn #b mit wachsendem n in Wahrscheinlichkeit gegen # konvergiert, d.h. , wenn fur jedes beliebige > 0 gilt: lim P (j #b(X1; : : : ; Xn) ; # j < ) = 1 : n!1 Anmerkung: Zum Nachweis der (schwachen) Konsistenz einer Punktschatzfunktion kann man die Aussage benutzen, da bei einer asymptotisch erwartungstreuen Punktschatzfunktion #b = #b(X1; X2; : : : ; Xn) eines Parameters #, d.h. nlim E (#b) = !1 #, die Beziehung nlim V ar(#b) = 0 eine hinreichende Bedingung fur ihre Konsistenz !1 ist. 72 Eigenschaften der einzelnen Schatzmethoden: Maximum{Likelihood{Schatzungen sind i.allg. asymptotisch erwartungstreu, konsistent, asymptotisch normalverteilt und besitzen asymptotisch minimale Varianz. Momentenschatzungen: konsistente Schatzungen der Momente, unabhangig vom Verteilungstyp 8.6 U bungsaufgaben Aufgabe 8.1 a) Die Zufallsvariable X beschreibe die Anzahl der bis zum erstmaligen Eintreten des Ereignisses A mit p = P (A) > 0 notwendigen Versuche in einem Bernoulli{ Experiment. Eine einfache Zufallsstichprobe vom Umfang n=6 ergab die Werte 8, 4, 0, 10, 6, 2. Berechnen Sie den Maximum{Likelihood{Schatzwert fur p. b) In einer Urne benden sich grune, weie und rote Kugeln, und zwar viermal so viele weie wie rote. Zur Schatzung des Anteils p der roten Kugeln werden 6 Kugeln mit Zurucklegen gezogen. Ergebnis: 3 grune, 2 weie, 1 rote. Berechnen Sie den Schatzwert p nach der Maximum{Likelihood{Methode und dann die Wahrscheinlichkeit fur das erzielte Ergebnis. Aufgabe 8.2 Aus einer exponentialverteilten Grundgesamtheit (Parameter unbekannt) wurde eine Stichprobe vom Umfang n entnommen. Man gebe die Likelihood{Funktion dieser Stichprobe an und bestimme die Maximum{Likelihood-Schatzung fur . Beispiel: Stichprobe vom Umfang n = 10: 1.1, 4.7, 1.2, 5.2, 3.5, 2.9, 8.2, 1.5, 4.4, 7.3 Aufgabe 8.3 Von einer Poisson{verteilten Zufallsvariablen X wird eine unabhangige, identisch verteilte Stichprobe X1; : : : ; Xn gezogen. Man zeige, da X die Maximum{Likelihood{ Schatzung fur den Parameter der Poisson{Verteilung ist. Aufgabe 8.4 X1 ; : : : ; Xn sei eine Zufallsstichprobe einer auf dem Intervall [0; #] gleichverteilten Zufallsvariablen X . Man bestimme die Maximum{Likelihood{Schatzung fur = E (X ) = #=2. Aufgabe 8.5 Die Verteilung der Zufallsgroe X sei durch die Dichtefunktion 80 fur x 0 > < 4x=a2 ur 0 < x a=2 fX (x) = > 4(a ; x)=a2 f fur a=2 < x a :0 fur x > a 73 gegeben. Berechnen Sie die Momentenschatzung fur den Parameter a! Aufgabe 8.6 Ein Filialunternehmen will den Zusammenhang zwischen Jahresumsatz und Ladenverkaufsache uberprufen. In einem bestimmten Jahr lieferten die n = 5 Filialen folgende Daten: Filiale Flache in 103 m2 Jahresumsatz in 106 DM i xi yi 1 0.3 3 2 0.7 4 3 1.0 5 1.2 7 4 5 1.8 11 Berechnen Sie mittels der Methode der kleinsten Quadrate die Regressionsgerade. Aufgabe 8.7 Bei der Messung des reinen Bremsweges s [in m] (ohne Reaktionsweg) eines bestimmten PKW{Typs in Abhangigkeit von der Geschwindigkeit v [km/h] erhielt man folgende Mewerte: vi 10 20 40 50 60 70 80 100 120 si 1 3 8 13 18 23 31 47 63 a) Berechnen Sie den Koezienten c der empirischen Regressionsparabel s = c v2 . b) Geben Sie einen Schatzwert fur den Bremsweg bei einer Geschwindigkeit von 75 km/h an. Aufgabe 8.8 Die Selbstkosten y (in DM) eines Buchexemplares in Abhangigkeit von der Auflage x (in 103) Exemplaren werden durch Daten charakterisiert, die von einem Verlag im Verlaufe von einigen Jahren gesammelt worden sind. Bestimmen Sie die Koezienten fur eine hyperbolische Abhangigkeit der Gestalt y = a + b=x fur folgende Daten: Auflage x 1 2 5 10 20 Kosten y 10.15 5.52 2.85 2.11 1.62 Aufgabe 8.9 Aus einer Grundgesamtheit mit N Elementen wird eine reine Zufallsstichprobe vom Umfang n ohne Zurucklegen gezogen. Mittelwert und Varianz 2 der Grundgesamtheit sind unbekannt. Man zeige, da fur die Stichprobenvarianz s2, mit der 2 geschatzt werden soll, E (s2) = NN;1 2 gilt. 74 Aufgabe 8.10 X1 ; : : : ; Xn sei eine unabhangige, identisch verteilte Stichprobe einer Zufallsvariablen X mit = E (X ) und 2 = V ar(X ). a) Man zeige mit Hilfe der Tschebyschevschen Ungleichung, da X eine konsistente Schatzung fur ist. b) Man zeige direkt mit Hilfe des Gesetzes der groen Zahlen, da X S2 = n1 (Xi ; )2 eine konsistente Schatzung fur 2 ist. 75 9 Kondenzschatzungen Punktschatzungen liefern (fast) immer einen Wert, der vom wahren Wert des Parameters abweicht. Daher ist es fur viele Aufgabenstellungen wichtig, vom Schatzwert ausgehend ein Intervall #|b ;{zd}1 # #|b +{zd}2 c1 c2 zu ermitteln, in dem der wahre Parameter mit groer Wahrscheinlichkeit 1 ; liegt. d1 und d2 bzw. c1 und c2 sind Zufallsgroen! Zur Bestimmung von Kondenzschatzungen geht man von einer Pivotgroe aus. Diese Pivotgroe mu folgende Eigenschaften besitzen: 1. Sie hangt vom unbekannten Parameter der Verteilung ab. 2. Sie hangt von der Stichprobe ab. 3. Ihre Verteilung ist vollstandig bekannt. Mittels der bekannten Verteilung der Pivotgroe kann dann ein Kondenzintervall fur den unbekannten Parameter der Verteilung ermittelt werden. Wir behandeln diese Vorgehensweise ausfuhrlich am Beispiel des Parameters der Normalverteilung bei bekanntem 2. Kondenzintervalle fur andere Aufgabenstellungen werden analog nach den hier angegebenen Punkten ermittelt. 9.1 Kondenzschatzungen fur den Parameter der Normalverteilung bei bekanntem 2 1. Die Irrtumswahrscheinlichkeit wird festgelegt, z.B. = 0:1; 0:05; 0:01 . 2. Es wird eine Verteilungsannahme getroen: Die Grundgesamtheit X unterliegt einer N (; 2){Verteilung mit bekanntem 2 . 3. Es wird eine Pivotgroe mit den oben genannten Eigenschaften bestimmt: p T2 = X ; n N (0; 1) : 76 4. Aus der bekannten Verteilung der Pivotgroe werden Quantile so bestimmt, da die Irrtumswahrscheinlichkeit eingehalten wird: P (;z1;=2 < T2 < z1;=2 ) = 1 ; : zp ist dabei das Quantil der Ordnung p der Standardnormalverteilung. 5. Die Ungleichung wird so umgestellt, da untere und obere Grenzen fur den unbekannten Parameter festgelegt werden: z1p;=2 z1p;=2 P b ; n < < b + n = 1 ; : 6. Zum Abschlu wird aus der konkreten Stichprobe ein konkretes Kondenzintervall berechnet. Bemerkung 9.1 Manchmal erfordert die Aufgabenstellung die Berechnung eines einseitigen Kondenzintervalls. Analog zur obigen Vorgehensweise erhalt man P ;1 < < b + zp1;n = 1 ; bzw. z 1; P b ; pn < < 1 = 1 ; : 9.2 Kondenzschatzungen fur den Parameter der Normalverteilung bei unbekanntem 2 1. Die Irrtumswahrscheinlichkeit wird festgelegt. 2. Verteilungsannahme: Die Grundgesamtheit X unterliegt einer N (; 2){ Verteilung. 3. Pivotgroe: p T = X s; n t(n ; 1) : 4. Bestimmung der Quantile: ; P ;tn;1; 1;=2 < T < tn;1; 1;=2 = 1 ; 5. Umstellen der Ungleichung: tn;1p; 1;=2 tn;1p; 1;=2 P b ; n s < < b + n s = 1; : 77 6. Zum Abschlu wird aus der konkreten Stichprobe ein konkretes Kondenzintervall berechnet. Einseitige Kondenzintervalle: P ;1 < < b + tn;p1;n1; s = 1 ; bzw. t n;p1; 1; P b ; n s < < 1 = 1; : Bemerkung 9.2 Die Groen X ; pn fur n 30 und X ; pn fur n 40 s sind wegen des zentralen Grenzwertsatzes annahernd normalverteilt. Damit hat man die Moglichkeit, verteilungsunabhangige Kondenzschatzungen fur den Mittelwert anzugeben. 9.3 Kondenzintervalle fur den Parameter 2 der Normalverteilung bei bekanntem 1. Die Irrtumswahrscheinlichkeit wird festgelegt. 2. Verteilungsannahme: Die Grundgesamtheit X unterliegt einer N (; 2 ){Verteilung mit bekanntem . 3. Pivotgroe: n X n Xi ; 2 V = 2 s = i=1 n X s2 = n1 (Xi ; )2 : i=1 2 2 (n) mit 4. Bestimmung der Quantile: P (2n; =2 < V < 2n; 1;=2 ) = 1 ; : 5. Umstellen der Ungleichung: n s2 P 2 n;1;=2 78 ! n s2 < 2 < 2 = 1 ; : n;=2 6. Zum Abschlu wird aus der konkreten Stichprobe ein konkretes Kondenzintervall berechnet. Einseitige Kondenzintervalle: n s2 P 0 < < 2 = 1 ; bzw. n; n s2 2 P 2 < < 1 = 1 ; : n;1; 2 9.4 Kondenzintervalle fur den Parameter 2 der Normalverteilung bei unbekanntem 1. Die Irrtumswahrscheinlichkeit wird festgelegt. 2. Verteilungsannahme: Die Grundgesamtheit X unterliegt einer N (; 2){ Verteilung. 3. Pivotgroe: n X n ; 1 Xi ; X 2 V = 2 s = i=1 n ; X 1 2 s = n;1 Xi ; X 2 : i=1 2 2 (n ; 1) mit 4. Bestimmung der Quantile: ; P 2n;1; =2 < V < 2n;1; 1;=2 = 1 ; : 5. Umstellen der Ungleichung: P (n2 ; 1) s < 2 < (n2; 1) s n;1;1;=2 n;1;=2 2 2 ! = 1;: 6. Zum Abschlu wird aus der konkreten Stichprobe ein konkretes Kondenzintervall berechnet. Einseitige Kondenzintervalle: 2 P 0 < < (n;2 1) s = 1 ; bzw. (n ; 1) s2 n;1; P 2 < 2 < 1 = 1 ; : n;1;1; 2 79 Bemerkung 9.3 Wie im Abschnitt 6.3.1 bemerkt, lat sich fur n 30 die 2{ Verteilung durch eine Normalverteilung approximieren. Es gilt p p 2V ; 2n ; 1 N (0; 1); wobei V = n ;2 1 s2 oder V = n2 s2 eingesetzt werden kann. Im Falle von V erhalt man p p ;z1;=2 2V ; 2n ; 1 z1;=2 und damit das Kondenzintervall 2 2 1 ;p2n ; 1 ; z 1 ;p2n ; 1 + z 1;=2 V 1;=2 : 2 2 Verwendet man dagegen die Pivotgroe V , so mu in der Approximation n durch n ; 1 ersetzt werden und man erhalt 2 2 1 ;p2n ; 3 ; z 1 ;p2n ; 3 + z 1;=2 V 1;=2 : 2 2 9.5 Kondenzschatzungen fur eine unbekannte Wahrscheinlichkeit p Wir gehen vom Bernoullischen Versuchsschema aus und denieren eine Zufallsgroe X : X= 0 : bei Nichteintreten des Ereignisses 1 : bei Eintreten des Ereignisses Fur Erwartungswert und Varianz dieser Zufallsgroe gilt = E (X ) = p 2 = V ar(X ) = p (1 ; p) Wenn die Anzahl der Versuche hinreichend gro ist, so kann man nach der obigen Bep merkung die asymptotische Normalverteilung von Xs; n zur Bestimmung eines Kondenzintervalles benutzen. Die Varianz wird dabei folgendermaen approximiert: 1 s2 = X (1 ; X ) ; da X 2 = X : s2 n ; i i n Nun werden die Quantile aus 0 1 p (X ; p) n z P @;z1;=2 q 1;=2 A = 1 ; X (1 ; X ) 80 bestimmt und man erhalt das Kondenzintervall 0 1 s s P @X ; z1;=2 X (1 ; X ) < p < X + z1;=2 X (1 ; X ) A = 1 ; n n Eine zweite Moglichkeit besteht in der Approximation der Binomialverteilung durch die Normalverteilung. Aufgrund des zentralen Grenzwertsatzes von Bernoulli ist dann die bestimmende Ungleichung fur ein Kondenzintervall pn ( X ; p ) ;z1;=2 p z : p (1 ; p) 1;=2 Stellt man diese Ungleichung nach p um, so erhalt man das Kondenzintervall q 0 2n X + z12;=2 ; z1;=2 4n X (1 ; X ) + z12;=2 P@ <p< 2(n + z12;=2 ) 2n X + z 2 1;=2 q 1 + z1;=2 4n X (1 ; X ) + z12;=2 A = 1; 2(n + z12;=2 ) 9.6 U bungsaufgaben Aufgabe 9.1 Die Lebensdauer von Schlauchen einer Hydraulikanlage ist annahernd normalverteilt mit einer Standardabweichung von = 600 h. Eine Zufallsstichprobe vom Umfang n = 36 ergibt eine durchschnittliche Lebensdauer von 3 000 h. Bestimmen Sie ein 95%{ Kondenzintervall fur den unbekannten Parameter der Normalverteilung. Aufgabe 9.2 Aus n = 20 Messungen der Dichte von Aluminium ergab sich ein Mittelwert x = 2:705 g/cm3 bei einer Standardabweichung s = 0:03 g/cm3 . Man bestimme ein Intervall, welches mit einem Vertrauen 1 ; = 0:99 den wahren Wert der Dichte von Aluminium enthalt. Aufgabe 9.3 Aus der Produktion von Zylinderschrauben wird eine Stichprobe vom Umfang n = 25 entnommen und an jeder Schraube die Schaftlange gemessen. Die Stichprobe ergibt x = 16 mm und s2 = 484 m2. Bestimmen Sie ein Kondenzintervall fur 2 unter der Voraussetzung, da das Kondenzniveau 0.99 betragt. Aufgabe 9.4 Eine Stichprobe vom Umfang n = 200 aus der Lieferung eines Massenartikels lieferte 10 Ausschuteile. Gesucht ist ein Kondenzintervall fur den Ausschuprozentsatz p der zugehorigen Grundgesamtheit ( = 0:05). 81 Aufgabe 9.5 Geben Sie ein Kondenzintervall zum Kondenzniveau 1 ; fur den Parameter einer exponentialverteilten Grundgesamtheit X an. (Hinweis: Die Zufallsgroe L = 2nX unterliegt einer 2{Verteilung mit k = 2n Freiheitsgraden.) Als Beispiel wahlen Sie die Zahlenwerte aus Aufgabe 8.2, = 0:05. Aufgabe 9.6 Bei der Stichprobeninventur eines Lagers mit N = 22974 Lagerpositionen werden n = 164 Positionen in Form einer reinen Zufallsauswahl mit Zurucklegen entnommen. Zu jeder Position i der Stichprobe wird ihr Wert x [in DM] festgestellt. Aus den Stichprobenwerten x1 ; : : : ; xn ergibt sich x = 1411 und s = 2812. Man bestimme daraus ein Kondenzintervall fur den Lagergesamtwert (Kondenzniveau 1 ; = 0:95). Aufgabe 9.7 X1; : : : ; Xn sei eine unabhangige, identisch verteilte Stichprobe einer normalverteilten Zufallsvariablen X , von der und 2 unbekannt sind. Man bestimme ein Kondenzintervall fur zum Vertrauensgrad 1 ; = 0:95 aus den Stichprobenwerten 104, 115, 112, 89, 94, 106, 119, 99, 102 und 90. Aufgabe 9.8 Der Kopfumfang X neugeborener Knaben sei normalverteilt mit unbekannten und 2. Eine unabhangige, identisch verteilte Stichprobe X mit dem Umfang n = 12 ergab die Werte [in cm]: 37, 39, 40, 41, 38, 39, 40, 39, 38, 36, 40, 41. Man bestimme daraus ein Kondenzintervall fur 2 zu 1 ; = 0:90 : Aufgabe 9.9 Unter 3000 Lebendgeburten wurden 1578 Knaben gezahlt. Bestimmen Sie daraus ein Kondenzintervall fur die Wahrscheinlichkeit p einer Knabengeburt zu 1 ; = 0:99 : Aufgabe 9.10 Acht Messungen des Durchmessers einer Linse ergaben die Werte (in cm): 3.54, 3.48, 3.51, 3.53, 3.50, 3.49, 3.46 und 3.49. Man wei, da das verwendete Megerat normalverteilte Messungen liefert. Bestimmen Sie ein Kondenzintervall fur den Durchmesser der Linse zum Vertrauensgrad 1 ; = 0:95 : 82 10 Testtheorie 10.1 Aufgabenstellung und Begrie Grundanliegen der Testtheorie ist es, eine Hypothese, die sogenannte Nullhypothese H0, anhand einer Stichprobe zu prufen und im Ergebnis der Prufung entweder abzulehnen (man trit eine statistisch gesicherte Entscheidung) oder nicht abzulehnen. Die Nichtablehnung einer Hypothese bedeutet keinesfalls, da die Hypothese "wahr\ ist, sondern lediglich, da die Daten der Stichprobe der Hypothese nicht signikant widersprechen. Bei einem statistischen Test konnen zwei Arten von Fehlern begangen werden: 1. Fehler erster Art : Die Nullhypothese wird abgelehnt, obwohl sie richtig ist. 2. Fehler zweiter Art : Die Nullhypothese wird nicht abgelehnt, obwohl eine Alternativhypothese H1 richtig ist. Wir werden im weiteren sehen, da ein Test aus der Wahl einer Testgroe und der Festlegung eines kritischen Bereiches besteht. Liegt die aus der Stichprobe berechnete Realisierung der Testgroe im kritischen Bereich, so wird die Nullhypothese abgelehnt. Dabei wird der kritische Bereich so gewahlt, da ein vorgegebener Fehler erster Art eingehalten wird. Auf den Fehler zweiter Art hat man keinen Einu. Es gilt im allgemeinen, da der Fehler zweiter Art umso groer ist, je kleiner gewahlt wurde. Ebenso spielt die Alternativhypothese nur fur die Entscheidung zwischen ein- und zweiseitiger Fragestellung eine Rolle. Ein Test besteht im allgemeinen aus folgenden Schritten: 1. Verteilungsannahme 2. Hypothesen H0 und H1 werden festgelegt 3. Festlegung des Signikanzniveaus , = 0:1; 0:05 ; 0:01 4. Wahl einer Prufgroe T , deren Verteilung unter der Nullhypothese vollstandig bekannt ist 5. Bestimmung des Ablehungsbereiches K 6. Berechnung einer Realisierung der Testgroe und Entscheidung Im folgenden werden die gebrauchlichsten Tests nach diesen Punkten aufgelistet. 83 10.2 Parametertests fur die Parameter der Normalverteilung 10.2.1 Der Gau{Test 1. Verteilungsannahme: X N (; 2); 2 bekannt 2. H0 : = 0, 8 6= 9 < = H1 : : < ; 0 > 3. Festlegung des Signikanzniveaus p 4. Prufgroe: T = X ; 0 n N (0; 1) 5. Kritischer Bereich: K = x : jx ; 0j > z1;=2 p n K = x : x ; 0 < ;z1; pn K = x : x ; 0 > z1; pn H1 : 6= 0 H1 : < 0 H1 : > 0 10.2.2 Der t{Test 1. Verteilungsannahme: X N (; 2) 2. H0 : = 0, 8 6= 9 < = H1 : : < ; 0 > 3. Festlegung des Signikanzniveaus p 4. Prufgroe: T = X ; 0 n t(n ; 1) s 5. Kritischer Bereich: K = x : jx ; 0j > tn;1;1;=2 ps n K = x : x ; 0 < ;tn;1;1; psn s K = x : x ; 0 > tn;1;1; pn 84 H1 : 6= 0 H1 : < 0 H1 : > 0 10.2.3 Der -Test fur die Varianz bei bekanntem 2 1. Verteilungsannahme:X N (; 2); bekannt 2. H0 : 2 = 02 , 8 6= 9 < = H1 : 2 : < ; 02 > 3. Festlegung des Signikanzniveaus n s2 4. Prufgroe: T = 2 2 (n) 0 5. Kritischer Bereich: 2 2 0 0 2 2 2 2 2 K = s : s < n n;=2 [ s > n n;1;=2 H1 : 2 6= 02 2 0 2 H1 : 2 < 02 K = s2 : s2 < n n; 2 0 2 H1 : 2 > 02 K = s2 : s2 > n n;1; 10.2.4 Der -Test fur die Varianz bei unbekanntem 2 1. Verteilungsannahme: X N (; 2); unbekannt 2. H0 : 2 = 02 , 8 6= 9 < = H1 : 2 : < ; 02 > 3. Festlegung des Signikanzniveaus 2 4. Prufgroe: T = (n ;21) s 2(n ; 1) 0 5. Kritischer Bereich: 2 2 0 0 2 2 2 2 2 K = s : s < n ; 1 n;1;=2 [ s > n ; 1 n;1;1;=2 H1 : 2 6= 02 2 0 2 2 2 K = s : s < n ; 1 n;1; H1 : 2 < 02 2 0 2 2 2 K = s : s > n ; 1 n;1;1; H1 : 2 > 02 85 10.3 Tests zum Vergleich zweier Mittelwerte 10.3.1 Der doppelte Gautest 1. Verteilungsannahme: X N (1 ; 12); Y N (2 ; 22) 12 ; 22 bekannt 2. H0 : 1 ; 2 = 0 (= 0), 8 6= 9 < = H1 : 1 ; 2 : < ; 0 > 3. Festlegung des Signikanzniveaus 4. Prufgroe: Wir setzen voraus, da (X1; : : : ; Xn1 ) und (Y1; : : : ; Yn2 ) iid und unabhangig voneinander sind (unverbundene Stichproben) 2 2 T = X ; Y N (1 ; 2; n1 + n2 ) |21 {z 2} (n1; n2 ) 5. Kritischer Bereich: K = fx; y : jx ; y ; 0j > z1;=2 (n1 ; n2)g H1 : 1 ; 2 6= 0 Die Kritischen Bereiche fur die einseitigen Fragestellungen ergeben sich nach dem Gautest analog. 10.3.2 Der doppelte t{Test 1. Verteilungsannahme: X N (1 ; 2); Y N (2 ; 2) 2 unbekannt, jedoch gleich 2. H0 : 1 ; 2 = 0 (= 0), 8 6= 9 < = H1 : 1 ; 2 : < ; 0 > 3. Festlegung des Signikanzniveaus 4. Prufgroe: Wir setzen voraus, da (X1 ; : : : ; Xn1 ) und (Y1; : : : ; Yn2 ) iid und unabhangig voneinander sind (unverbundene Stichproben) 2 n2 ; 1)s22 T = pX2 ; Y ; 20 t(n1 + n2 ; 2); s2 = (n1 ; n1)s+1 +n (; s =n1 + s =n2 1 2 2 86 5. Kritischer Bereich: K= rn + n x; y : jx ; y ; 0j > tn1 +n2;2;1;=2 s 1n n 2 H1 : 1 ; 2 6= 0 1 2 Die Kritischen Bereiche fur die einseitigen Fragestellungen ergeben sich nach dem t{Test analog. 10.3.3 Der Test von Welch 1. Verteilungsannahme: X N (1 ; 12); Y N (2 ; 22) 12 ; 22 unbekannt 2. H0 : 1 ; 2 = 0 (= 0), 8 6= 9 < = H1 : 1 ; 2 : < ; 0 > 3. Festlegung des Signikanzniveaus 4. Prufgroe: Wir setzen voraus, da (X1; : : : ; Xn1 ) und (Y1; : : : ; Yn2 ) iid und unabhangig voneinander sind (unverbundene Stichproben) Die Frage, ob es uberhaupt einen Test zum Signikanzniveau gibt, ist unter dem Namen "Behrens{Fisher{Problem\ bekannt. Der Test von Welch halt das vorgegebene nur naherungsweise ein. T = pX2 ; Y ; 20 t( ); s1=n1 + s2=n2 wobei u2 = 2 ;1 (1 ; u ) s21=n1 : + ; u = n1 ; 1 n2 ; 1 s21=n1 + s22=n2 In der Regel ist keine ganze Zahl, als Freiheitsgrad wird dann die grote ganze Zahl, die kleiner als ist, gewahlt. 5. Kritischer Bereich: 8 s 2 29 < = s s 1 2 K = : x; y : jx ; y ; 0 j > t;1;=2 n + n ; H1 : 1 ; 2 6= 0 : 1 2 Die Kritischen Bereiche fur die einseitigen Fragestellungen ergeben sich nach dem t{Test analog. 87 10.3.4 Der t{Dierenzentest 1. Verteilungsannahme: Im Unterschied zum doppelten t{Test und zum Test von Welch baut der t{Dierenzentest auf verbundene Stichproben auf. Ausgangspunkt sind zwei Zufallsvariablen X und Y mit 1 = E (X ) und 2 = E (Y ) sowie 12 = V ar(X ), 22 = V ar(Y ). Man beobachtet nun die Realisierungen von X und Y nicht unabhangig voneinander, sondern stellt jeweils an einem Merkmalstrager die Auspragungen von X und Y fest. Wegen der dabei auftretenden Abhangigkeit betrachten wir die zweidimensionale Zufallsgroe (X; Y ) mit 122 = Cov(X; Y ). Z = X ; Y N (; Z2 ) mit = 1 ; 2; Z2 = 12 + 22 ; 2122 : Die beobachteten Wertepaare bezeichnen wir mit (x1 ; y1); : : : ; (xn; yn). 2. H0 : = 0 , 8 6= 9 < = H1 : : < ; 0 > 3. Festlegung des Signikanzniveaus 4. Prufgroe: p 0 n t(n ; 1) mit T = Z; s z n X X 1 1 2 sz = n ; 1 (Zi ; Z ) = n ; 1 (Xi ; X ; (Yi ; Y ))2 i=1 i=1 n 2 5. Kritischer Bereich: K = z : jz ; 0j > tn;1;1;=2 psZn s Z K = z : z ; 0 < ;tn;1;1; pn s Z K = z : z ; 0 > tn;1;1; pn H1 : 6= 0 H1 : < 0 H1 : > 0 10.4 Der einfache Gau{Test fur eine unbekannte Wahrscheinlichkeit p 1. Verteilungsannahme: Wir gehen vom Bernoullischen Versuchsschema aus und denieren eine Zufallsgroe X : X= 88 0 : bei Nichteintreten des Ereignisses 1 : bei Eintreten des Ereignisses Fur Erwartungswert und Varianz dieser Zufallsgroe gilt = E (X ) = p 2 = V ar(X ) = p(1 ; p) 2. H0 : p = p0 ; 8 6= 9 < = H1 : p : < ; p0 > 3. Festlegung des Signikanzniveaus 4. Prufgroe: p (x ; p0) n N (0; 1) fur n p (1 ; p ) > 9 T=p 0 0 p0 (1 ; p0) 5. Kritischer Bereich: ( r ) K = x : jx ; p0j > z1;=2 p0 (1n; p0) ( ) r p (1 ; p ) K = x : x ; p0 < ;z1; 0 n 0 ( ) r p 0 (1 ; p0 ) K = x : x ; p0 > z1; n H1 : p 6= p0 H1 : p < p0 H1 : p > p0 Bemerkung 10.1 Hypothesen uber die Dierenz zweier Wahrscheinlichkeiten (Anteilwerte) konnen analog zu dieser Vorgehensweise nach dem doppelten Gau{Test bzw. dem doppelten t{Test gepruft werden. 10.5 Der 2-Anpassungstest 1. Verteilungsannahme: Bisher wurden Hypothesen uber unbekannte Verteilungsparameter betrachtet; nun sollen Hypothesen uber die unbekannte Verteilung selbst gepruft werden. U ber die Verteilung von X werden keine Annahmen zugrunde gelegt. Mit F = F (x) bezeichnen wir die unbekannte Verteilungsfunktion der Grundgesamtheit. 2. H0 : F = F0 , H1 : F = 6 F0 3. Festlegung des Signikanzniveaus 89 4. Prufgroe: Zur Konstruktion einer Prufgroe wird die reelle Zahlengerade in k Intervalle (Klassen) Gj = (aj;1; aj ]: (;1; a1 ]; (a1 ; a2]; ; (ak;1; 1) zerlegt. Die Realisierungen von X unterscheidet man nur danach, in welches der Intervalle sie fallen; man spricht von einer Gruppierung (Klasseneinteilung) der Werte von X . Wenn H0 zutrit, ist pj = P (X 2 Gj j F0) = F0(aj ) ; F0(aj;1) die Wahrscheinlichkeit, da X einen Wert in Gj (j = 1; : : : ) annimmt. Mit Nj bezeichnen wir die Besetzungszahl der Klasse Gj und mit nj die aus der konkreten Stichprobe gewonnene Realisierung der Besetzungszahl der Klasse Gj . Wenn H0 zutrit, gilt E (Nj ) = n pj . Als Prufgroe verwenden wir den 2 {Abstand T= k X (Nj ; n pj )2 j =1 n pj 2 (k ; 1) fur groe n: Die die aus der konkreten Stichprobe gewonnene Realisierung von T bezeichnen wir mit t. 5. Kritischer Bereich: K = ft : t > 2k;1;1;g: Bemerkungen: 1. Besteht die Hypothese H0 nur im Typ der Verteilungsfunktion, so mussen die Parameter der Verteilung aus der Stichprobe geschatzt werden (mit MaximumLikelihood- oder Minimum-2-Methode). Der Test wird dann analog durchgefuhrt, jedoch verwendet man zum Berechnen der Groen pj die Verteilung der Nullhypothese mit den geschatzten Parametern. Bei der Bestimmung des kritischen Bereiches verringert sich die Anzahl der Freiheitsgrade der 2{Verteilung zusatzlich um die Anzahl der geschatzten Parameter (2 (k ; 1 ; Anz. gesch. Par.)). 2. Der 2{Anpassungstest darf verwendet werden, wenn n pj 5 fur alle j gilt. Anderenfalls mussen Klassen zusammengefat werden. 10.6 Der 2-Unabhangigkeitstest 1. Verteilungsannahme: Wir wollen uberprufen, ob X und Y unabhangige Zufallsgroen sind. Ausgangspunkt ist eine verbundene Stichprobe (X1; Y1); : : : ; (Xn; Yn), bei der wir Unabhangigkeit zwischen den Paaren voraussetzen. Es wird weiter vorausgesetzt, da nur endlich viele Auspragungen fur X und Y unterschieden werden. 2. H0 : X und Y sind unabhangige Zufallsgroen. 90 3. Festlegung des Signikanzniveaus 4. Prufgroe: Die gemeinsame (unbekannte) Verteilung lat sich in folgender Tabelle darstellen: X nY 1 2 m 1 p11 p12 p1m p1 2 p21 p22 p2m p2 ... ... ... ... ... l pl1 pl2 plm pl p1 p2 pm n Bei Unabhangigkeit von X und Y gilt pij = pj pi : Zur Durchfuhrung des Testes stellt man die in der Stichprobe beobachteten Haugkeiten (Besetzungszahlen) in einer sogenannten Kontingenztafel oder l m{ Feldertafel zusammen: xny 1 2 m 1 n11 n12 n1m n1 2 n21 n22 n2m n2 ... ... ... ... ... l nl1 nl2 nlm nl n1 n2 nm n Der dazugehorige 2-Abstand lautet: X n pi pj )2 2((l ; 1) (m ; 1)) T = (nij ; n pi pj i;j Die unbekannten Parameter pi und pj werden durch pbi = nni bzw. pbj = nnj geschatzt. Damit erhalt man die Realisierung der Prufgroe 2 X t = (nij u; uij ) ij i;j mit den Unabhangigkeitszahlen uij = n pbi pbj = ninnj : 5. Kritischer Bereich: K = ft : t > 2(l;1) (m;1);1; g Bemerkung: Eine besondere Rolle unter den Kontingenztafeln spielt die Vierfeldertafel mit m = l = 2. In diesem Fall vereinfacht sich die realisierte Testgroe zu 2 t = n (n11n nn22 ;n n12n n21 ) 1 2 1 2 und der kritische Bereich ist K = ft : t > 21;1;g: 91 10.7 U bungsaufgaben Aufgabe 10.1 Der durchschnittliche Preis eines bestimmten Produktes lag im letzten Jahr bei 120.00 DM (2 = 100). a) Lat sich diese Angabe auch fur dieses Jahr aufrechterhalten, wenn Normalverteilung der Preise unterstellt wird und eine Testkaufserie von 100 Stuck dieser Ware in diesem Jahr einen Durchschnittspreis von 121.50 DM ergab ( = 0:05)? b) Wurde sich die Testentscheidung in a) andern, wenn der Stichprobenumfang 400 bei gleichem Stichprobenergebnis gewesen ware? c) Welchen Einu hat eine Veranderung von auf die Testentscheidung? Aufgabe 10.2 Eine Fabrik stellt ein Garn mit einer mittleren Reifestigkeit 0 = 300N bei einer Standardabweichung = 24N her. Man vermutet, durch einen neuen Herstellungsproze die Reifestigkeit erhohen zu konnen. Es sei = 0:01 . a) Geplant ist eine Stichprobe vom Umfang n = 100 aus der Produktion des neuen Garns. Fur welche Stichprobenmittel x wird die Nullhypothese H0 : = 300N gegen die Alternative H1 : > 300N beibehalten? b) Wie gro ist die Wahrscheinlichkeit, einen Fehler 2. Art zu begehen, wenn der Mittelwert der neuen Garnsorte bei 310N liegt und = 24N weiterhin gilt? Aufgabe 10.3 Fur eine Stahllieferung garantiert der Hersteller einen mittleren Kohlenstogehalt von 0; 5%. Eine Untersuchung von 25 Proben ergab x = 0:45% und s = 0:06%. Prufen Sie mit = 0:05, ob die Angabe des Herstellers glaubhaft ist. Aufgabe 10.4 In der Vergangenheit betrug die Varianz der normalverteilten Lebensdauer einer bestimmten Batteriesorte 2 = 1:1 Jahre2 . Es soll nun auf Stichprobenbasis gepruft werden, ob sich durch Einfuhrung eines kostengunstigeren Produktionsverfahrens die Varianz der Lebensdauer erhoht. Eine Stichprobe von n = 25 nach dem neuen Verfahren gefertigter Batterien liefert eine Varianz von s2 = 1:6 Jahre2 (Signikanzniveau = 0:01) . Aufgabe 10.5 Bei einer Qualitatskontrolle wurden 21 fehlerhafte Teile in einer Stichprobe vom Umfang n = 500 festgestellt. Prufen Sie bei einem Signikanzniveau = 0:05 die Angabe des Herstellers, in seiner Gesamtproduktion sei der Ausschuanteil nicht groer als 3%. 92 Aufgabe 10.6 Die Maschinen 1 und 2 verrichten die gleiche Arbeit. Eine Untersuchung des Merkmals X : "Energieverbrauch pro Arbeitsstunde\ lieferte folgende Ergebnisse: Maschine 1: n1 = 10; x1 = 15:3 kWh, s1 = 0:92 kWh Maschine 2: n2 = 15; x2 = 13:9 kWh, s2 = 1:04 kWh. Kann mit einem Signikanzniveau = 0:05 behauptet werden, da die Maschine 2 zur Verrichtung der gleichen Arbeit weniger Energie verbraucht? (Normalverteilung des Merkmals X und Varianzhomogenitat in den Grundgesamtheiten kann vorausgesetzt werden.) Aufgabe 10.7 Es wird vermutet, da Bauteile der Sorte A eine groere Lebensdauer haben, als entsprechende Bauteile der Sorte B . Zufallige Stichproben von nA = 100 und nB = 120 Bauteilen der Sorten A und B ergaben fur das Merkmal "X : Lebensdauer in Betriebsstunden\: xA = 1310 Stunden, sA = 142 Stunden, xB = 1240 Stunden, sB = 127 Stunden Kann die Vermutung bei einem Signikanzniveau = 0:05 durch die Stichprobenergebnisse bestatigt werden? Aufgabe 10.8 Von 100 gekauften Losen sind 40 Gewinne. Bestatigt dies die Behauptung der Lotteriewerbung, da jedes zweite Los gewinnt? ( = 0:05) Aufgabe 10.9 Ein Spieler vermutet, da von den 4 Munzen, mit denen er spielt, mindestens eine gefalscht ist. Um das zu prufen, wirft er 160 mal seine 4 Munzen und erhalt folgende Verteilung fur "Zahl\: Anzahl "Zahl\ 0 1 2 3 4 Beobachtete Anzahl 15 54 55 30 6 a) Welche Verteilung mu sich fur die Zufallsvariable Anzahl "Zahl\ bei einem Wurf mit 4 Munzen ergeben, wenn es sich um ideale Munzen handelt? b) Prufen Sie mit Hilfe des 2{Testes, ob die Munzen des Spielers ideal sind und interpretieren Sie das Ergebnis. (Signikanzniveau 5 %) Aufgabe 10.10 Unter Nichtberucksichtigung mut- und boswilliger Feuermeldungen werden in einer Stadt wahrend der 52 Wochen eines Jahres gezahlt: in 19 20 8 4 1 Wochen gab es 0 1 2 3 4 Feuermeldungen. 93 a) Bestimmen Sie das arithmetische Mittel und die Varianz fur die Feuermeldungen pro Woche. b) U berprufen Sie mittels des 2 {Anpassungstestes, ob die Annahme der Poissonverteilung mit dem geschatzten Parameter bei einer Sicherheitswahrscheinlichkeit 1 ; = 0:95 gerechtfertigt ist. c) Berechnen Sie die Wahrscheinlichkeit fur 5 und mehr Feuermeldungen in einer Woche. Alle wieviel Jahre ist dieser Fall zu erwarten? Aufgabe 10.11 350 Studenten nahmen an der Statistik- und an der Mathematikklausur teil. Dabei kam folgendes Ergebnis heraus: Mathematik Mathematik nicht bestanden bestanden Statistik 191 78 bestanden Statistik 41 40 nicht bestanden Testen Sie mit = 0:01, ob zwischen dem Bestehen der beiden Klausuren ein Zusammenhang existiert. Aufgabe 10.12 Fur die Studenten einer Fakultat, unterteilt hinsichtlich des Merkmals X : Geschlecht, sind die nichtbesuchten Lehrveranstaltungen in einer Stundenplanwoche (= Merkmal Y ) in der folgenden U bersicht zusammengestellt. X Y 0 1 2 >2 mannl. 63 24 8 5 100 weibl. 82 35 21 12 150 145 59 29 17 250 Kann auf einem Signikanzniveau = 0:05 behauptet werden , da die Merkmale X und Y unabhangig sind? Aufgabe 10.13 Um zu uberprufen, ob die Wagungen mit einer Federwaage einen systematischen Fehler aufweisen, wird ein 10{Gramm{Gewicht n = 9 mal nachgewogen. Es ergaben sich die folgenden Werte [in g]: 9:7; 10:2; 10:0; 9:9; 9:5; 9:6; 9:4; 10:1; 9:8 Testen Sie bei einem = 0:05 die Hypothese, da kein systematischer Fehler vorliegt, unter der Voraussetzung, da die Meergebnisse der Waage normalverteilt sind 94 a) mit einer Standardabweichung von =0.3 g b) mit einer unbekannten Standardabweichung. Aufgabe 10.14 Die Zugfestigkeit [in kg] einer bestimmten Drahtsorte sei N (; 2){ verteilt. Bei einer Prufung von n = 12 Proben ergaben sich die folgenden Werte: 84; 83; 79; 83; 79; 80; 85; 78; 83; 82; 76; 86: Ist aufgrund dieser Stichprobe die Aussage " > 80\ signikant (=0.05)? Aufgabe 10.15 Die Motoren eines Typs A laufen durchschnittlich um 5 000 km langer als die eines Typs B . Nach Verwendung eines anderen Kolbenfabrikates sollen die durchschnittlichen Laufzeiten A und B der beiden Motorentypen erneut verglichen werden. Von Typ A werden 74, von Typ B 67 Motoren ausgewahlt und auf ihre Laufdauer hin untersucht. Dabei ergaben sich folgende Werte fur Stichprobenmittel und -standardabweichung [in km]: Typ A : x = 76487 und s1 = 421 Typ B : y = 71329 und s2 = 332 Ist aufgrund dieser Beobachtung die Aussage signikant, da A immer noch um mindestens 5 000 km groer ist als B ? (=0.01) Aufgabe 10.16 Ein Futtermittel A wird an 15, ein Futtermittel B an 17 Ferkel verfuttert; Stichprobenmittel und -varianz der wahrend einer bestimmten Mastzeit erzielten Gewichtszunahmen [in kg] lauten: bei den "A{Ferkeln\: x = 45 und s21 = 41 bei den "B {Ferkeln\: y = 54 und s22 = 39 Kann man aus dieser Beobachtung mit einer Irrtumswahrscheinlichkeit von hochstens 0.05 schlieen, da Futtermittel B im Durchschnitt zu einer um mehr als 5 kg hoheren Gewichtszunahme fuhrt als Futtermittel A? Gehen Sie davon aus, da die Gewichtszunahmen unter A bzw. B normalverteilte Zufallsvariablen a) mit ubereinstimmenden Varianzen b) mit verschiedenen Varianzen sind. Aufgabe 10.17 Man kann annehmen, da die Korperlange X bzw. Y neugeborener Knaben bzw. Madchen normalverteilte Zufallsvariablen sind. Auch X ; Y , beobachtet an Zwillingsparchen, kann als normalverteilt angesehen werden. Fur n = 17 Zwillingsparchen ergaben sich die folgenden Werte: 95 Geburt i 1 2 3 4 5 6 7 8 9 10 11 xi 50 55 51 49 54 52 47 47 50 51 52 yi 49 53 51 47 54 51 47 45 51 49 51 Geburt i 12 13 14 15 16 17 xi 49 55 52 49 50 54 yi 50 53 51 48 46 54 Ist aufgrund dieser Beobachtung signikant, da Knaben bei ihrer Geburt im Mittel groer sind als Madchen? (=0.01) Aufgabe 10.18 Man uberprufe die Fragestellung von Aufgabe 10.17 ohne zu berucksichtigen, da die Erhebung aus Zwillingsgeburten resultiert, indem man die dort gegebenen Beobachtungswerte wie zwei unverbundene Stichproben behandelt. Aufgabe 10.19 Unter 3000 Lebendgeburten wurden 1578 Knaben gezahlt. U berprufen Sie damit die Hypothese, da die Wahrscheinlichkeit fur eine Knabengeburt gleich 0.5 ist. ( = 0:01) Aufgabe 10.20 Die Fullmenge X [in cm3] maschinell abgefullter Bieraschen sei normalverteilt mit dem bekannten Mittelwert = E (X ) = 500. Bei n = 25 Nachprufungen ergab sich 25 X i=1 (xi ; 500)2 = 44: Prufen Sie damit die Hypothese H0 : = 1 gegen die Alternative H1 : > 1 zum Niveau = 0:01. Aufgabe 10.21 Die Reifestigkeit X [in g] einer bestimmten Garnsorte sei N (; 2 ){verteilt. Bei einer Prufung von n = 26 Garnproben ergaben sich fur Stichprobenmittel und -standardabweichung die Werte x = 2120 und s = 160. Man teste mit = 0:05 die Hypothese = 250 gegen die Alternative 6= 250. Aufgabe 10.22 Bei der letzten Wahl in einem Bundesland erhielt Partei A 45%, Partei B 40%, Partei C 10% und Partei D 5%. Bei einer spateren Befragung von 2500 zufallig ausgewahlten Wahlern bevorzugten 1050 die Partei A, 1000 die Partei B , 350 die Partei C und 100 die Partei D. Prufen Sie, ob sich die Stimmenverteilung seit der Wahl signikant geandert hat. ( = 0:01) 96 Aufgabe 10.23 Bei einer Erhebung des Untersuchungsmerkmals X : "Anzahl der Kinder pro Familie\ ergab sich fur n = 120 zufallig ausgewahlte Familien die folgende Haugkeitstabelle: Anzahl der Kinder 0 1 2 3 4 5 Anzahl der Familien 41 50 19 8 2 0 U berprufen Sie zu = 0:05 die Hypothese, da X poissonverteilt ist. Aufgabe 10.24 Eine Untersuchung der Lebensdauer [in Jahren] von n = 200 Transistoren ergab die folgende Haugkeitstabelle: Lebensdauer [0; 1] (1; 2] (2; 3] (3; 4] (4; 6] > 6 in Jahren Anzahl der 20 20 20 10 Transistoren 70 60 U berprufen Sie, ob die Lebensdauer eine Ex(0:5){Verteilung sein kann ( = 0:05). Aufgabe 10.25 Man will prufen, ob eine signikante Abhangigkeit zwischen Geschlecht und Freizeitinteresse unter den Jugendlichen besteht. Dazu hat man n = 200 zufallig ausgewahlten Jugendlichen die Frage gestellt: "Womit verbringst Du Deine Freizeit am liebsten, mit Tanz, Sport oder Literatur?\ Es ergab sich: Jungen Madchen Tanz 32 46 Sport 73 22 Literatur 15 12 Fuhren Sie den entsprechenden Test zum Niveau =0.01 durch. Aufgabe 10.26 Eine Befragung von n = 1500 zufallig ausgewahlten Wahlberechtigten nach religiosem Bekenntnis und Wahlabsicht ergab die folgende Kontingenztafel: katholisch evangelisch sonstige Partei A 222 141 94 Partei B 208 221 98 Partei C 96 95 77 Sonstige 64 73 111 Besteht eine signikante Abhangigkeit zwischen Bekenntnis und Wahlabsicht? ( = 0:05) 97 11 Losungen zu den U bungsaufgaben Pn ;n Aufgabe 1.2 n(n ; 3) (1 + 1)n = 2n = k 2 k=0 32 Protokolle Aufgabe 1.4 13545 210 Aufgabe 1.6 78 Als dreistellige Zahlen kommen in Frage: 304, 314, 324, 334; 340, 341,..., 349; 354, 364,..., 394, also 4+10+5=19 Moglichkeiten. Vor jeder von ihnen kann EU, EV oder EY stehen, so da insgesamt 3 19 = 57 "Zustande\ moglich sind. Aufgabe 1.8 A: rote Lampe brennt, B : weie Lampe brennt a) Ea = A \ B b) Eb = A \ B c) Ec = A \ B d) Ed = A \ B e) Ee = Ec [ Ed f) Ef = A [ B g) Eg = Eb [ Ec [ Ed = A [ B = A \ B Aufgabe 1.1 Aufgabe 1.3 Aufgabe 1.5 Aufgabe 1.7 Aufgabe 1.9 A : von 5 Werkstucken sind nicht genau 3, d.h. 0, 1, 2, 4 oder 5, normgerecht. B : von 5 Werkstucken sind weniger als 3, d.h. 0, 1, 2, normgerecht. A \ B = A A [ B = B: 10 , c) 1 , d) 10 , e) 2 , f) 9 Aufgabe 1.10 a) 31 , b) 19 19 19 19 19 Aufgabe 1.11 a) mit Zurucklegen: P (A) = 25 = 0:4; b) ohne Zurucklegen: P (A) = 25 = 0:4; Aufgabe 1.12 27 = 0:216 P (B ) = 53 53 53 = 125 1 = 0:1 P (B ) = 53 42 31 = 10 16 4; P (B ) = 25 P (A1) = P (A2) = 10 Ohne Zurucklegen: P (A1) = 4 ; P (A2) = 4 ; P (B ) = 2 10 10 3 Aufgabe 1.13 a) 0.424 b) 0:4 Aufgabe 1.14 A : Es wird eine 11 gewurfelt B : Es wird eine 12 gewurfelt Mit Zurucklegen: 98 Anzahl der mogl. Wurfe mit 3 Wurfeln ist 63 = 216. Wurfeln einer 11: Wurfeln einer 12: 6 4 1 = 3! = 6 Mogl. 6 5 1 = 3! 6 3 2 3! = 6 M o gl. 6 4 2 = = 3! 5 5 1 = 3!/2! = 3 Mogl. 6 3 3 = 3!/2! 5 4 2 = 3! = 6 Mogl. 5 5 2 = 3!/2! 5 3 3 = 3!/2! = 3 Mogl. 5 4 3 = 3! 4 4 3 = 3!/2! = 3 Mogl. 4 4 4 = 3!/3! ;! 27 gunstig ;! 25 gunstig P (A) = 27=216 = 0:125 P (B ) = 25=216 = 0:115 Also P (A) > P (B ). Aufgabe 1.15 a) 4/7 b) 10/21 Aufgabe 1.16 a) 0.684 b) 0.283 c) 0.999 Aufgabe 1.17 n 11 = 6 Mogl. = 6 Mogl. = 3 Mogl. = 3 Mogl. = 6 Mogl. = 1 Mogl. Aufgabe 1.18 1. P (B jA) = 1 ; P (B jA) = 1 ; P (B ) = P (B) 2. P (AjB ) = 1 ; P (AjB ) = 1 ; P (A) = P (A) 3. P (B jA) = 1 ; P (B jA) = 1 ; P (B ) = P (B) Aufgabe 1.19 A : Mindestens eine Sechs bei vier Wurfen mit einem Wurfel B : Mindestens eine Doppel-Sechs bei 24 Wurfen mit zwei Wurfeln P (A) = 0:5177; P (B ) = 0:4914 Aufgabe 1.20 Wi = Wappen im i{ten Wurf Gewinnchance fur A: P (W8) + P (W 8 \ W9) = 12 + 41 = 34 Gewinnchance fur B : P (W 8 \ W 9 ) = 14 Der Einsatz ist im Verhaltnis 3:1 aufzuteilen. Aufgabe 1.21 n 25 Aufgabe 1.22 0.688 Aufgabe 1.23 1. 157 2. 147 ; 145 ; 142 Aufgabe 1.24 K : Krankheit liegt vor B : Test erkennt auf Krankheit 1. P (K jB) = 0:0025 2. P (K jB ) = 0:76 99 Aufgabe 1.25 1. N : Erzeugnis ist normgerecht G : Prufverfahren zeigt "normgerecht\ an P (N jG) = 0:9884 2. GG : Prufverfahren zeigt zweimal unabhangig voneinander "normgerecht\ an P (N jGG) = 0:9988 Aufgabe 1.27 A : entnommenes Stuck ist Ausschu B : entnommenes Stuck stammt von Mi a) P (A) = 0:09 8 0:60 fur i = 1 > > < b) P (MijA) = > 0:33 fur i = 2 > : 0:07 fur i = 3 Aufgabe 1.28 0.04 Aufgabe 2.1 P (X = 0) = 0:024 P (X = 1) = 0:188 P (X = 2) = 0:452 P (X = 3) = 0:336 Aufgabe 2.2 1 a) P (X 10; Y 10) = 12 ; P (X 20; Y 20) = 12 ; 1. P (X 10; Y > 20) = 12 b) Nein. Aufgabe 2.3 F (x) = P (X x) = 80 > < 0:25 > : 01:5 = 0:25 + 0:25 Aufgabe 2.4 E (X ) = 3:8 ; D2(X ) = 3:36 a) P (;1 < X < 4) = 0:3 b) P (2 X 6) = 0:7 100 falls x<1 falls 1 x < 2 falls 2 x < 3 falls 3 x Aufgabe 2.5 k 0 1 2 a) P(X=k) 0.62222 0.35555 0.022222 k 0 1 2 b) P(X=k) 0.64 0.32 0.04 Aufgabe 8 2.6 > < 0(1=4) t FX (t) > 1=2 t ; 1=2 : 1 Aufgabe 2.7 fur t0 fur 0 < t 2 fur 2 < t 3 fur 3 < t a fur 2 x 4; 0 sonst. c) P (X < 0:2) = 0 e) P (2:5 X < 3) = 1=4 a) fX (x) = Aufgabe 2.8 FX (t) = D2 (X ) = 43 0 fur t 1; ; 3 1 ; t fur t > 1: b) a = 1=2 d) P (X > 3) = 1=2 E (X ) = 1:5 P (X 2) = 81 3 fur ; 1 < x 1 3 E (X ) = ; 13 Aufgabe 2.9 fX (x) = 04 sonst b) P (2 X 10) = 0:4 Aufgabe 2.10 a) xpii 10.6 20.4 Aufgabe 2.11 a) xpii 10.8 20.16 30.032 40.008 b) E (X ) = 1:248; D2 (X ) = 0:298 c) P (X 2) = 0:96 Aufgabe 2.12 E (X ) = 30 Pf. Aufgabe 2.13 a) a = 12 b = 1 b) fX (t) = 1 1 +1 t2 Aufgabe 2.14 5 Paletten sind optimal. Aufgabe 2.15 E (X ) = 3:5 V ar(X ) = 2:92 Aufgabe 2.16 b) FX (x) = x (2 ; x) fur 0 x 1, FX (x) = 0 fur x < 0, FX (x) = 1 fur x > 1 c) m : Median m = 0:293 q0:25 = 0:134 q0:75 = 0:5 101 d) E (X ) = 1 V ar(X ) = 1 3 18 Aufgabe 2.18 (a; b) = (10 ; 4:47; 10 + 4:47) = (5:53; 14:47) Aufgabe 3.1 X : Anzahl der nicht funktionsfahigen Relais in einer 10er-Packung X Bi(10; 0:05) a) P (X = 2) = 0:07463 b) P (X > 1) = 0:08614 c) E (X ) = 0:5 V ar(X ) = 0:475 d) P (1:5 < X < 4:2) = 0:08608 Aufgabe 3.2 X : Anzahl der Sechsen unter n = 6 Wurfen X Bi(6; 16 ) P (X 3) = 0:0623 ; ; Aufgabe 3.3 P (X = n ; y) = n;n y pn;y (1 ; p)n;(n;y) = ny (1 ; p)y pn;y = P (Y = y) Aufgabe 3.4 X : Anzahl der Sitzungsteilnehmer, X Bi(12; 0:8) P (X 6) = 0:9961 Aufgabe 3.5 Vert. i = B (5; 31 ) pi = B (5; 21 ) pi = B (5; 32 ) pi = 0 32 243 = 0:132 1 32 = 0:031 1 243 = 0:004 1 80 243 = 0:329 5 32 = 0:156 10 243 = 0:041 2 80 243 = 0:329 10 = 0:313 32 40 243 = 0:165 Vert. i = B (5; 31 ) pi = B (5; 21 ) pi = B (5; 32 ) pi = 3 40 243 = 0:165 10 = 0:313 32 80 243 = 0:329 4 10 243 = 0:041 5 32 = 0:156 80 243 = 0:329 5 1 243 = 0:004 1 32 = 0:031 32 243 = 0:132 Aufgabe 3.6 X : Anzahl der Monate, in denen die Durchschnittstemperatur normal sein wird, X Bi(24; 0:9); P (X < 20) = 0:0851 Aufgabe 3.7 X : Anzahl der Versuche bis zum ersten Erfolg; X Geo(0:8) E (X ) = p1 = 1:25 Aufgabe 3.8 X : Anzahl der Runden bis zum ersten Start, X Geo(p) mit p = 91 . 1 ; ( 65 )3 = 216 E (X ) = 1p = 216 = 2:37 91 Aufgabe 3.9 X : Anzahl der Schaden, X Po() a) P (X = 0) = 102 0:049787 fur = 3 0:1353352 fur = 2 0:42319 fur = 3 0:6766764 fur = 2 0:5768099 fur = 3 c) P (X 3) = 0:3233235 fur = 2 ) Amortisierung nach 15 Monaten. Aufgabe 3.10 X Po( = 0:5) P (X 2) = 0:9856 Aufgabe 3.11 X : Anzahl der ankommenden Autos X Po(); = 2:5 a) P (X = 0) = 0:0821 b) P (X = 2) = 0:2565 c) P (X > 3) = 0:2424 d) P (X < 6) = 0:958 b) P (X 2) = Aufgabe 3.12 X : Anzahl der Defekte pro Tag, X Po(4) a) P (X > 10) = 0:0028; b) P (X = 4) = 0:1953 p p V ar(X ) = = 2 Aufgabe 3.13 X : Anzahl der Einsatze pro Tag, X Po() mit = 1. P (X = 0) = e;1 = 0:3679 P (X 1) = 1 ; P (X = 0) = 0:6321 P (X 3) = (1 + 1 + 12 + 16 )e;1 = 0:9810 Aufgabe 3.14 X : Anzahl der Ausschustucke pro Stunde. X ist approximativ Po(4){verteilt. a) P (X = 4) = 0:1953 b) P (X 7) = 0:1107 c) P (X 8) = 0:9786 Aufgabe 3.15 X : Anzahl der Tippfehler pro Seite, X Po() mit = 2 a) P (X = 0) = 0:1353 b) P (X = 2) = 0:2707 c) P (X 2) = 0:6767 Aufgabe 3.16 X : Anzahl der Luftblaschen pro m2, X Po() mit = 1 P ("1.Wahl\)=0.3679, P ("2.Wahl\)=0.3679 P ("3.Wahl\)=0.2453, P ("Ausschu\)=0.0189 Aufgabe 3.17 1 x X x;2 e; ; 2 E (X (X ; 1)) = x(x ; 1) x! e = x=2 (x ; 2)! x=0 1 x X = 2 x! e; x=0 = 2 d.h.: E (X 2) ; E (X ) = 2 . Daraus folgt wegen E (X ) = : V ar(X ) = E (X 2) ; (EX )2 = 2 + ; 2 = : ; Aufgabe 3.18 Y Po(6) und X Ex 101 1 X 103 E (X ) = 10 [Min]; P (Y 3) = 0:1512; P (X 30) = 1 ; e;3 = 0:9502 Aufgabe 3.19 X : Anzahl der Frauen im Vierer-Gremium, X H (n; M ; N ; ) = H (4; 5; 10) a) P (X 2) = 0:738 b) P (X = 2) = 0:476 Aufgabe 3.20 X : Anzahl der vorbereiteten unter den drei herausgegrienen Gebieten, X H (n; M ; N ) = H (3; 5; 10) P (X 2) = 21 Aufgabe 3.21 a) 0:000000072 b) 0:00000043 c) 0:000018 d) 0:00097 e) 0:9814 Aufgabe 3.22 maxf0; n ; (N ; M )g = maxf0; 4 ; (8 ; 5)g = 1; minfn; M g = minf4; 5g = 4 xi 1 2 3 4 5 3 5 3 5 3 5 3 pi = f (xi) (1()8()3) = 141 (2()8()2) = 37 (4()8()1) = 73 (4()8()0) = 141 4 4 4 4 Aufgabe 3.23 X : Anzahl der funktionierenden Feuerwerkskorper in der Stichprobe a) P (X 3) = 0:6988 b) P (X 3) = 0:9623 c) P (X 3) = 0:0377 Aufgabe 3.24 a) 0:6522 b) 0:2569 Aufgabe 3.26 a) P (X 2:5) = 0:0062 b) P (X < ;1:5) = 0:0668 c) P (1:2 X 2:3) = 0:1044 d) P (;1:1 X < 3) = 0:8635 Aufgabe 3.27 a) P (146 X < 155) = 0:97104 b) Ja, aber P (X 160) 0 c) = 1:163 Aufgabe 3.28 a) P (24:86 X 25:14) = 0:9948 c) c = 0:0875 b) P (X 25:1) = 0:0228 Aufgabe 3.29 a) P (jX ; j 3) 0:8889 b) P (jX ; j 3) = 0:9973 Aufgabe 3.30 P (0 X 11) = 0:5565 ; P (8 X 12) = 0:3108 ; P (X 15) = 0:8413 ; 104 Aufgabe 3.31 a) (i) P (X 985) = 0:0668 (ii) P (X 985) = 0:0000 b) 21:46 c) 1003:55 Aufgabe 3.32 a) P (X 35:4) = 0:7881 b) P (X 34:6) = 0:7881 c) P (34:5 X 35:2) = 0:4967 d) P (34:3 X 35:7) = 0:8384 Aufgabe 3.33 a) E (X ) = 15 000; E (Y ) = 18 000 > E (X ) b) E (g1(X )) = 1 500 000 E (g2(Y )) = 1 520 000 > E (g1(X )) Aufgabe 3.34 P (X > 10) = 0:1353 Aufgabe 3.35 a) P (X 2) = 0:8521437 b) 90% der Erzeugnisse uberleben 1.74 Zeiteinheiten. c) Nach 4.86 Zeiteinheiten sind 90% der Erzeugnisse ausgefallen. Aufgabe 4.1 P (47 X 52) 0:4495 P (X = 50) 0:0796 Aufgabe 4.2 P (X 10) 0:9279 8 < 0:8414 : fur n = 200 Aufgabe 4.3 P (jHn ; pj 0:05) : 0:9750 : fur n = 500 0:9984 : fur n = 1000 Aufgabe 4.4 a) b) Normalappr. Normalappr. Exakter Wert o. Stet.-Korr. m. Stet.-Korr. P (X = 32) 0.0993 0 0.100 P (26 X 34) 0.6821 0.625 0.682 Normalappr. Normalappr. Exakter Wert o. Stet.-Korr. m. Stet.-Korr. P (X = 32) 0.0659 0 0.071 P (26 X 34) 0.5889 0.535 0.588 Aufgabe 4.5 ohne Stet.-Korr. mit Stet.-Korr. exakter Wert P (X 49) 0.500 0.528 0.5379 P (42 X 56) 0.683 0.715 0.7166 P (X 60) 0.058 0.067 0.0703 105 Aufgabe 4.6 P (185 X 215) 0:866 (ohne Stet.-Korr.) P (185 X 215) 0:879 (mit Stet.-Korr.) Aufgabe 4.7 a) P (X = 0) = 0:9510 = 0:5987 b) P (X 1) = 1 ; (0:97)n 0:99 gilt ab n = 152 Aufgabe 4.9 a) 0:9220 b) 0:74 c) 0:922: Aufgabe 5.1 X nY 2 4 5 P (X = xi) -1 0.1 0.2 0.3 0.6 1 0 0.2 0.2 0.4 P (Y = yk ) 0.1 0.4 0.5 1 a) E (X ) = ;0:2 ; E (Y ) = 4:3 ; V ar(X ) = 0:96 ; V ar(Y ) = 0:81 b) X und Y sind nicht stochastisch unabhangig. c) Cov(X; Y ) = 0:16 ; %(X; Y ) 0:18 d) X nY y1 y2 P (X = xi ) x1 0.06 0.04 0.1 0.54 0.36 0.9 x2 P (Y = yk ) 0.60 0.40 1.0 e) X und Y sind nicht stochastisch unabhangig, jedoch %(X; Y ) = 0 Aufgabe 5.2 %(X; Y ) = ;0:422 Regressionsgerade von Y bzgl. X : y = ;0:29x + 5:47 Regressionsgerade von X bzgl. Y : x = ;0:61y + 7:43 Aufgabe 5.3 X nY 0 1 ;1 0 1=3 1=3 0 1=3 0 1=3 1 0 1=3 1=3 1=3 2=3 Cov(X; Y ) = E (XY ) ; (EX )(EY ) = 0 ; 0 23 = 0 Aufgabe 6.1 E (K ) = 22 ; V ar(K ) = 48 Aufgabe 6.2 fX (x) = exp(;x) ; fY (y) = exp(;y) Sei Z = X + Y : 1. Fall = fZ (z)=2 z exp(;z) FZ (z) = 1 ; exp(;z) (1 + z) V ar(Z ) = 22 E (Z )= 2 106 2. Fall 6= . fz (z) = ; (exp(;z) ; exp(;z)) Fz (z) = 1 ; ;1 ( exp(;z) ; exp(;z)) E (Z ) = 1 + 1 V ar(Z ) = 12 + 12 a) E (Z ) = 100 ; V ar(Z ) = 5000 ; P (Z > 100) = 0:406 b) E (Z ) = 10 ; P (Z 8) = 0:5156 Aufgabe 6.3 Die zulassige Personenanzahl n ist 28. Aufgabe 6.4 E (Y ) = 23 ; V ar(Y ) = 181 Aufgabe 6.5 E (X + Y ) = 2; E (X ; Y ) = 0; 2 V ar(X + Y ) = V ar(X ; Y ) = 3 ; V ar(2X ; 3Y ) = 13 3 Aufgabe 6.6 V ar(X ) 5:83 Aufgabe 6.7 E (Z ) = 1 (E (X ) ; ) = 0 Aufgabe 6.9 = p1 ; 2p p(1 ; p) V ar(Z ) = 12 V ar(X ) = 1 Fur p = 21 liegt eine symmetrische Verteilung vor; = 0 Fur p ! 0 geht ! +1 extrem schiefe Verteilung Fur p ! 1 geht ! ;1 Aufgabe 6.10 X : Anzahl der Wurfe, bis jede Augenzahl einmal gewurfelt ist Xk : Anzahl der Wurfe, bis zum Erscheinen der k{ten neuen Augenzahl, nachdem k ; 1 verschiedene Augenzahlen bereits gewurfelt worden sind; k = 1; 2; ; 6. Es gilt: X = X1 + X2 + + X6 Xk ist geometrisch verteilt mit dem Parameter pk = 6;(k6;1) . E (X ) = E (X1) + E (X2) + E (X3) + E (X4) + E (X5 ) + E (X6) = 14:7 Aufgabe 6.11 a) Sei X = X1 + X2 p X ist dann naherungsweise N (14 + 36; 9 + 25) = N (50; ( 34)2 ) verteilt. b) P (X 55) = 0:1969 107 Aufgabe 7.1 a) k = 83; n = 120:48 b) Auswahlsatz Nn = 0:012: Eine zweistellige und zwei dreistellige Schluziern mussen (ohne U berschneidungen) zufallig gewahlt werden, z.B. 73; 255 und 623: Aufgabe 7.2 Stichprobe Wert von X Wert von (X ; EX )2 f1,2g 1.5 1.00 f1,3g 2.0 0.25 f1,4g 2.5 0.00 f2,3g 2.5 0.00 f2,4g 3.0 0.25 f3,4g 3.5 1.00 Summe 15.0 2.50 Jede Stichprobe tritt mit der Wahrscheinlichkeit 61 auf. Also sind 5: E (X ) = 61 15 = 2:5 und V ar(X ) = 16 2:5 = 12 m X 1 M Aufgabe 7.3 X klu = N m Yi = 12 i=1 a) Klumpung Klumpung Wert von Wert von X klu bei X klu bei Wahl von Wahl von Klumpen 1 Klumpen 2 Klumpen 1 Klumpen 2 V ar(X klu) f1; 2g f3; 4g 1.5 3.5 1.00 f1; 3g f2; 4g 2.0 3.0 0.25 f1; 4g f2; 3g 2.5 2.5 0.00 Mittlere Varianz von X klu = 31 1:25 = Klumpungseekt gleich Null. b) 108 Klumpung Klumpung 5 12 = V ar(X reiZ ); also ist der mittlere Wert von Wert von X klu bei X klu bei Wahl von Wahl von Klumpen 1 Klumpen 2 Klumpen 1 Klumpen 2 V ar(X klu) f1g f2; 3; 4g 0.5 4.5 4.00 f2g f1; 3; 4g 1.0 4.0 2.25 f3g f1; 2; 4g 1.5 3.5 1.00 f4g f1; 2; 3g 2.0 3.0 0.25 Mittlere Varianz von X klu = 14 7:5 = ein negativer Klumpungseekt. 22:5 12 > V ar(X reiZ ); also entsteht im Mittel Aufgabe 7.4 a) b) PX i ist Bi(n; p){verteilt mit p = M=N . Daraus folgt: PX V ar(X ) = n12 np (1 ; p) = M (nNN;2 M ) i ist H (n; M; N ){verteilt. Daraus folgt: M N ; n = M (N ; M ) (N ; n) V ar(X ) = n12 n M 1 ; N N N ;1 n N 2 (N ; 1) Aufgabe 7.5 a) Es liegen k = 2 Schichten vor mit N1 = N2 = 6 und n1 = n2 = 3. Die Stichprobe ist proportional und, da die Varianzen innerhalb der beiden Schichten gleich gro sind, auch optimal geschichtet. Fur die Stichprobenmittel X 1 und X 2 der beiden Teilstichproben erhalten wir aus Aufgabe 7.4b: ; 3) = 1 V ar(X 1 ) = V ar(X 2) = 3 3(6 6;2(63)(6 ; 1) 20 Wegen der Unabhangigkeit von X 1 und X 2 folgt daraus fur 2 X 1 X = X prop = X opt = N Nj X j = 12 (X 1 + X 2) : j =1 1 + 1 = 1 V ar(X prop) = V ar(X opt) = 41 20 20 40 b) Es liegen zwei Klumpen vor, von denen einer zufallig gewahlt wird. Es gilt: X klu = 16 [Summe der Stichprobenwerte] (vgl. (7.10)) Bei Wahl von Klumpen U1 ist X klu = 21 , bei Wahl von Klumpen U2 ebenfalls. Daraus folgt: V ar(X klu) = 0 Nach Aufgabe 7.4 ist ; 6)(12 ; 6) = 1 V ar(X reiz ) = 6 6 (12 122 (12 ; 1) 44 109 Also gilt in diesem Fall: 0 = V ar(X klu) < V ar(X reiz ) < V ar(X prop) = V ar(X opt) Aufgabe 7.6 Auf gleiche Weise wie in der Losung von Aufgabe 7.5 erhalt man hier: V ar(X 1) = V ar(X 2) = 0; also auch V ar(X prop) = 0 und V ar(X klu) = 41 Wie oben ist V ar(X reiZ ) = 441 . Zusammen folgt daraus die Behauptung. Aufgabe 8.1 a) pb = x1 Aus x = 5 folgt pb = 51 : Man beachte hier die andere Bezeichnung in der geometrischen Verteilung. In der Bezeichnung von Abschnitt 3.1.3. wurde hier (1 ; p) geschatzt! b) pb = 101 ; P (X = 3; Y = 2; Z = 1) = 0:12 Aufgabe 8.2 b = Pnnx : Fur das angegebene Beispiel mit n = 10 ist P xi = 40 und i i=1 somit b = 0:25 : Aufgabe 8.4 Die Stichprobenwerte x1 ; : : : ; xn sind samtlich nichtnegativ; maxfx1 ; : : : ; xn g bezeichne den groten Wert unter ihnen. Aus f (x1 ; : : : ; xn; #) = ; 1 n # 0 : falls alle xi #; d.h. maxfx1 ; ; xng # : falls mindestens ein xi > # erhalt man die Likelihood{Funktion L(#; x1 ; : : : ; xn) = ; 1 n # 0 : fur alle # maxfx1 ; : : : ; xng : fur alle # < maxfx1; : : : ; xng Sie nimmt ihr Maximum an der Stelle #b = maxfx1 ; : : : ; xng an. Fur = 21 # ergibt sich damit die Maximum{Likelihood{Schatzung b = 12 maxfx1 ; : : : ; xng. n X b a 2 Aufgabe 8.5 mb 1 = 2 ; ba = n xi i=1 Aufgabe 8.6 y = 0:52 + 5:48 x Aufgabe 8.7 a) s = 0:00456 v2 b) Ein Schatzwert fur den Bremsweg bei einer Geschwindigkeit von 75 km/h ist: s(75) = 25:7 m. 110 Aufgabe 8.8 Aufgabe 9.1 Aufgabe 9.2 Aufgabe 9.3 Aufgabe 9.4 Aufgabe 9.5 Aufgabe 9.6 y = 1:13 + 8:x96 P ( 2 [2804; 3196]) = 0:95 P ( 2 [2:686; 2:724]) = 0:99 P (2 2 [254:7; 1174:5]) = 0:99 P (p 2 [0:02; 0:08]) = 0:95 2 22n;1;=2 2nX = 1 ; ) P ( 2 [0:12; 0:43]) = 0:95 X 0.95{Kondenzintervall fur eine Lagerposition: [980:62; 1841:38]. Fur den Lagergesamtwert N erhalt man daraus das 0.95{Kondenzintervall [N 980:62; N 1841:38] = [22528763; 42303804] : Aufgabe 9.7 0.95{Kondenzintervall [95:64; 110:36]. Aufgabe 9.8 0.9{Kondenzintervall: [1:32; 5:69] Aufgabe 9.9 0.99{Kondenzintervall [0:5025; 0:5495] Aufgabe 9.10 0.95{Kondenzintervall [3:478; 3:522] P 2n;=2 2n Aufgabe 10.1 a) 121:5 2 (118:04; 121:96) ) H0 beibehalten. b) 121:5 62 (119:02; 120:98) ) H0 ablehnen. c) ": z1;=2 # ) Fur wachsende wird der kritische Bereich groer, d.h. der Nichtablehnungsbereich kleiner. Aufgabe 10.2 a) x 305:6 b) = 0:0329 Aufgabe 10.3 Kritischer Bereich: K = fx : jx ; 0:5j > 0:02472g jx ; 0j = j0:45 ; 0:5j = 0:05, d.h. x 2 K , d.h. H0 ablehnen. Aufgabe 10.4 Kritischer Bereich: K = [1:97 s2 < 1] s2 = 1:6 ) H0 nicht ablehnen. Aufgabe 10.5 einfacher Gautest; Kritischer Bereich fur T : K = [1:645; 1] ; t = 1:573 ; t 62 K ) H0 nicht ablehnen. Aufgabe 10.6 doppelter t{Test; t = 3:447 > t23;0:95 = 1:714 ) H0 verwerfen. Aufgabe 10.7 Test von Welch; t = 3:819 > 1:645 ) Die Vermutung kann bei einem Signikanzniveau = 0:05 durch die Stichprobenergebnisse bestatigt werden. Aufgabe 10.8 einfacher Gautest fur eine unbekannte Wahrscheinlichkeit; K = fx : jx ; 0:5j > 0:0825g ; 0:1 > 0:0825 ) H0 verwerfen Aufgabe 10.9 a) Es handelt sich um eine Bi(4; 21 ){Verteilung. 111 b) 2 = 11:92 > 24;0:95 = 9:49 ) H0 ablehnen. Aufgabe 10.10 52 = 1 ; a) x = 52 52 s2 = 51 b) 2 = 0:0723 < 21;0:95 = 3:84 ) H0 nicht ablehnen. c) P (X 5) = 0:0037 : Alle 5:2 Jahre ist der Fall, da 5 und mehr Feuermelder in einer Woche ausfallen, zu erwarten. Aufgabe 10.11 H0 : Unabhangigkeit, 2 = 11:6 > 21;0:99 = 6:63 ) H0 wird abgelehnt. Aufgabe 10.12 H0 : Unabhangigkeit, 2 = 3:39 < 23;0:95 = 7:81 ) H0 nicht ablehnen. Aufgabe 10.13 a) Einfacher Gau{Test fur H0 : = 0 = 10 gegen H1 : 6= 0. 0:2 > 0:196 ) H0 wird abgelehnt. b) Einfacher t{Test fur H0 : = 0 = 10 gegen H1 : 6= 0 (bei unbekanntem 2). 0:2 < 0:211 ) H0 nicht abgelehnt. Aufgabe 10.14 Einfacher t{Test fur H0 : = 80 gegen H1 : > 80. H0 wird abgelehnt, wenn x > 81:59 : Wegen x = 81:5 ist H1 nicht signikant. Aufgabe 10.15 Test von H0 : A = B + 5000 gegen H1 : A > B + 5000 : H0 wird genau dann abgelehnt, wenn x ; y > 5148:1 : Die beobachtete Dierenz x ; y = 5158 fuhrt daher zur Signikanz von H1. Aufgabe 10.16 a) Doppelter t{Test fur H0 : B = A + 5 gegen H1 : B > A + 5. H0 wird genau dann abgelehnt, wenn y ; x ; 5 > 3:81 : Die beobachtete Dierenz y ; x ; 5 = 4 fuhrt daher zur Ablehnung von H0. b) Test von Welch fur H0 und H1 wie unter a). H0 wird genau dann abgelehnt, wenn gilt: s2 2 y ; x ; 5 > t;1; s ns1 + ns2 1 2 = 29:3 ; t29;0:95 = 1:70 : H0 wird ebenfalls abgelehnt. (Da sich weder n1 und n2 noch s21 und s22 stark unterscheiden, besitzt der Test von Welch fast den gleichen Ablehnbereich wie der doppelte t{Test.) Aufgabe 10.17 t{Dierenzentest fur H0 : 1 = 2 gegen H1 : 1 > 2. H0 wird genau dann abgelehnt, wenn z = x ; y > 0:798 : Das beobachtete z = 1 fuhrt zur Ablehnung von H0. Aufgabe 10.18 Aus den beiden Stichproben (mit n1 = n2 = 17) erhalt man x = 51, 112 s2x = 6:25, y = 50 und s2y = 7:50. Da sich s2x und s2y nicht stark unterscheiden und n1 = n2 gilt, besitzt der Test von Welch ungefahr den gleichen Ablehnbereich wie der doppelte t-Test; wir wenden letzteren an. (H0 und H1 wie in Aufgabe 10.17.) H0 wird genau dann abgelehnt, wenn r1 x ; y > t32;1; s n + n1 = 2:45 2:62 0:34 = 2:18 1 2 Das beobachtete x ; y = 1 fuhrt nicht zur Ablehnung von H0. (Durch den Test von Welch wurde H0 genau dann abgelehnt, wenn x ; y > 2:20. Er liefert hier dasselbe Ergebnis.) Aufgabe 10.19 Hypothesen: H0 : p = p0 = 0:5 gegen H1 : p 6= p0. Da n hinreichend gro ist (n p0 (1 ; p0 ) > 9), darf der einfache Gau{Test fur p benutzt werden. Kritischer Bereich: jx ; p0j > 0:0236 : x = 0:526, also wird H0 abgelehnt. Aufgabe 10.20 2 {Test fur die Varianz bei bekanntem . H0 : 2 = 02 = 1 gegen H1 : 2 > 02 . H0 wird genau dann abgelehnt, wenn s2 > 1:77 Aus der beobachteten Stichprobe ergab sich s2 = 1:76 : ) H0 wird nicht abgelehnt. Aufgabe 10.21 2 {Test fur die Varianz bei unbekanntem . H0 : = 0 = 250 gegen H1 : 6= 250. Der kritische Bereich K des Tests besteht aus allen s2{Werten, die kleiner als 32750 und groer als 101500 sind. Das beobachtete s2 = 1602 = 25600 fuhrt daher zur Ablehnung von H0. Aufgabe 10.22 2{Anpassungstest fur eine einfache Nullhypothese. H0 : Die aktuelle Verteilung ist die gleiche wie bei der letzten Wahl. H1 : Die aktuelle Verteilung ist ungleich der Verteilung der letzten Wahl. 2 {Abstand t = 50. Dieser Wert ist groer als das Quantil 23;0:99 = 11:3. H0 wird abgelehnt. Aufgabe 10.23 2 {Anpassungstest mit geschatztem Parameter b = 1: H0: X ist Po(b){verteilt. 2 {Abstand t = 1:44. Dieser Wert ist kleiner als das Quantil 22;0:95 = 5:99 : ) H0 wird nicht abgelehnt. Aufgabe 10.24 2{Anpassungstest. H0: Die Lebensdauer ist Ex(){verteilt mit = 0:5 : 2{Abstand t = 7:70 : Dieser Wert ist kleiner als das Quantil 25;0:95 = 11:1. H0 wird nicht abgelehnt. Aufgabe 10.25 2 {Unabhangigkeittest. 2{Abstand: 23:15 : Dieser Wert ist groer als das Quantil 22;0:99 = 9:21 : H0 wird abgelehnt. Die Abhangigkeit der Freizeitinteressen vom Geschlecht ist signikant. Aufgabe 10.26 2 {Unabhangigkeitstest. 2{Abstand: 85:6 : Er ist groer als das Quantil 26;0:95 = 12:6. Damit wird H0 verworfen: Eine Abhangigkeit zwischen Wahlabsicht und Bekenntnis ist signikant. 113 Tabelle 1: Poisson{Verteilungen Wahrscheinlichkeitsfunktion Verteilungsfunktion P f (xi ) = P (X = xi ) = pi F (x) = P (X x) = i: xi xi = 0:1 f (xi ) F (x) = 0 :2 f (xi ) F (x) x f (xi ) = = 0:3 f (xi ) F (x) P i: xi x pi = 0:4 f (xi ) F (x) 0 0.9048 0.9048 0.8187 0.8187 0.7408 0.7408 0.6703 0.6703 0.6065 0.6065 1 0.0905 0.9953 0.1637 0.9825 0.2222 0.9631 0.2681 0.9384 0.3033 0.9098 2 0.0045 0.9998 0.0164 0.9989 0.0333 0.9964 0.0536 0.9921 0.0758 0.9856 3 0.0002 1.0000 0.0011 0.9999 0.0033 0.9997 0.0072 0.9992 0.0126 0.9982 4 0.0000 1.0000 0.0001 1.0000 0.0003 1.0000 0.0007 0.9999 0.0016 0.9998 0.0001 1.0000 0.0002 1.0000 xi = 0:6 f (xi ) F (x) = 0 :7 f (xi ) F (x) = 0:8 f (xi ) F (x) = 0:9 f (xi ) F (x) =1 f (xi ) F (x) 0 0.5488 0.5488 0.4966 0.4966 0.4493 0.4493 0.4066 0.4066 0.3679 0.3679 1 0.3293 0.8781 0.3476 0.8442 0.3595 0.8088 0.3659 0.7725 0.3679 0.7358 2 0.0988 0.9769 0.1217 0.9659 0.1438 0.9526 0.1647 0.9371 0.1839 0.9197 3 0.0198 0.9966 0.0284 0.9942 0.0383 0.9909 0.0494 0.9865 0.0613 0.9810 4 0.0030 0.9996 0.0050 0.9992 0.0077 0.9986 0.0111 0.9977 0.0153 0.9963 5 0.0004 1.0000 0.0007 0.9999 0.0012 0.9998 0.0020 0.9997 0.0031 0.9994 0.0001 1.0000 0.0002 1.0000 0.0003 1.0000 0.0005 0.9999 0.0001 1.0000 6 7 xi = 1:5 f (xi ) F (x) =2 f (xi ) F (x) =3 f (xi ) F (x) =4 f (xi ) F (x) =5 f (xi ) F (x) 0 0.2231 0.2231 0.1353 0.1353 0.0498 0.0498 0.0183 0.0183 0.0067 0.0067 1 0.3347 0.5578 0.2707 0.4060 0.1494 0.1991 0.0733 0.0916 0.0337 0.0404 2 0.2510 0.8088 0.2707 0.6767 0.2240 0.4232 0.1465 0.2381 0.0842 0.1247 3 0.1255 0.9344 0.1804 0.8571 0.2240 0.6472 0.1954 0.4335 0.1404 0.2650 4 0.0471 0.9814 0.0902 0.9473 0.1680 0.8153 0.1954 0.6288 0.1755 0.4405 5 0.0141 0.9955 0.0361 0.9834 0.1008 0.9161 0.1563 0.7851 0.1755 0.6160 6 0.0035 0.9991 0.0120 0.9955 0.0504 0.9665 0.1042 0.8893 0.1462 0.7622 7 0.0008 0.9998 0.0034 0.9989 0.0216 0.9881 0.0595 0.9489 0.1044 0.8666 8 0.0002 1.0000 0.0009 0.9998 0.0081 0.9962 0.0298 0.9786 0.0653 0.9319 0.0002 1.0000 0.0027 0.9989 0.0132 0.9919 0.0363 0.9682 10 0.0008 0.9997 0.0053 0.9972 0.0181 0.9863 11 0.0002 0.9999 0.0019 0.9991 0.0082 0.9945 12 0.0001 1.0000 0.0006 0.9997 0.0034 0.9980 13 0.0002 0.9999 0.0013 0.9993 14 0.0001 1.0000 0.0005 0.9998 15 0.0002 0.9999 16 0.0001 1.0000 9 114 = 0:5 f (xi ) F (x) Tabelle 2: Wahrscheinlichkeiten der Standardnormalverteilung z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9661 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9979 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 115 Tabelle 3: Quantile der t{Verteilung mit Freiheitsgraden 116 np 0.995 0.99 0.975 0.95 0.90 np 0.995 0.99 0.975 0.95 0.90 1 63.66 31.82 12.71 6.31 3.08 20 2.84 2.53 2.09 1.72 1.32 2 9.92 6.96 4.30 2.92 1.89 21 2.83 2.52 2.08 1.72 1.32 3 5.84 4.54 3.18 2.35 1.64 22 2.82 2.51 2.07 1.72 1.32 4 4.60 3.75 2.78 2.13 1.53 23 2.81 2.50 2.07 1.71 1.32 24 2.80 2.49 2.06 1.71 1.32 5 4.03 3.36 2.57 2.02 1.48 6 3.71 3.14 2.45 1.94 1.44 25 2.79 2.48 2.06 1.71 1.32 7 3.50 3.00 2.36 1.90 1.42 26 2.78 2.48 2.06 1.71 1.32 8 3.36 2.90 2.31 1.86 1.40 27 2.77 2.47 2.05 1.70 1.31 9 3.25 2.82 2.26 1.83 1.38 28 2.76 2.47 2.05 1.70 1.31 29 2.76 2.46 2.04 1.70 1.31 10 3.17 2.76 2.23 1.81 1.37 11 3.11 2.72 2.20 1.80 1.36 30 2.75 2.46 2.04 1.70 1.31 12 3.06 2.68 2.18 1.78 1.36 40 2.70 2.42 2.02 1.68 1.30 13 3.01 2.65 2.16 1.77 1.35 60 2.66 2.39 2.00 1.67 1.30 14 2.98 2.62 2.14 1.76 1.34 120 2.62 2.36 1.98 1.66 1.29 2.58 2.33 1.96 1.645 1.28 15 2.95 2.60 2.13 1.75 1.34 16 2.92 2.58 2.12 1.75 1.34 17 2.90 2.57 2.11 1.74 1.33 18 2.88 2.55 2.10 1.73 1.33 19 2.86 2.54 2.09 1.73 1.33 1 Tabelle 4: Quantile der 2 {Verteilung mit Freiheitsgraden np 0.005 0.01 0.025 0.05 0.95 0.975 0.99 0.995 1 0.0000 0.0002 0.0010 0.0039 3.84 5.02 6.63 7.88 2 0.0100 0.0201 0.0506 0.103 5.99 7.38 9.21 10.6 3 0.072 0.115 0.216 0.352 7.81 9.35 11.3 12.8 4 0.207 0.297 0.484 0.711 9.49 11.1 13.3 14.9 5 0.412 0.554 0.831 1.15 11.1 12.8 15.1 16.7 6 0.676 0.872 1.24 1.64 12.6 14.4 16.8 18.5 7 0.989 1.24 1.69 2.17 14.1 16.0 18.5 20.3 8 1.34 1.65 2.18 2.73 15.5 17.5 20.1 22.0 9 1.73 2.09 2.70 3.33 16.9 19.0 21.7 23.6 10 2.16 2.56 3.25 3.94 18.3 20.5 23.2 25.2 11 2.60 3.05 3.82 4.57 19.7 21.9 24.7 26.8 12 3.07 3.57 4.40 5.23 21.0 23.3 26.2 28.3 13 3.57 4.11 5.01 5.89 22.4 24.7 27.7 29.8 14 4.07 4.66 5.63 6.57 23.7 26.1 29.1 31.3 15 4.60 5.23 6.26 7.26 25.0 27.5 30.6 32.8 16 5.14 5.81 6.91 7.96 26.3 28.8 32.0 34.3 17 5.70 6.41 7.56 8.67 27.6 30.2 33.4 35.7 18 6.26 7.01 8.23 9.39 28.9 31.5 34.8 37.2 19 6.84 7.63 8.91 10.1 30.1 32.9 36.2 38.6 20 7.43 8.26 9.59 10.9 31.4 34.2 37.6 40.0 21 8.03 8.90 10.3 11.6 32.7 35.5 38.9 41.4 22 8.64 9.54 11.0 12.3 33.9 36.8 40.3 42.8 23 9.26 10.2 11.7 13.1 35.2 38.1 41.6 44.2 24 9.89 10.9 12.4 13.8 36.4 39.4 43.0 45.6 25 10.5 11.5 13.1 14.6 37.7 40.6 44.3 46.9 26 11.2 12.2 13.8 15.4 38.9 41.9 45.6 48.3 27 11.8 12.9 14.6 16.2 40.1 43.2 47.0 49.6 28 12.5 13.6 15.3 16.9 41.3 44.5 48.3 51.0 29 13.1 14.3 16.0 17.7 42.6 45.7 49.6 52.3 30 13.8 15.0 16.8 18.5 43.8 47.0 50.9 53.7 40 20.7 22.2 24.4 26.5 55.8 59.3 63.7 66.8 50 28.0 29.7 32.4 34.8 67.5 71.4 76.2 79.5 60 35.5 37.5 40.5 43.2 79.1 83.3 88.4 92.0 70 43.3 45.4 48.8 51.7 90.5 95.0 100.4 104.2 80 51.2 53.5 57.2 60.4 101.9 106.6 112.3 116.3 90 59.2 61.8 65.6 69.1 113.1 118.1 124.1 128.3 100 67.3 70.1 74.2 77.9 124.3 129.6 135.8 140.2 117 Literaturverzeichnis [1] Bamberg/Bauer: Statistik, Oldenbourg-Verlag [2] Beyer/Hackel/Pieper/Tiedge: Wahrscheinlichkeitsrechnung und mathematische Statistik (Reihe: Mathematik fur Ingenieure und Naturwissenschaftler), TeubnerVerlag [3] Hochstadter: Statistische Methodenlehre, Verlag H. Deutsch [4] Ruger: Induktive Statistik, Oldenbourg-Verlag [5] Schwarze: Grundlagen der Statistik | Teil 2, NWB Studienbucher 118