Kapitel 3: Schätz- und Testverfahren. § 3.1.1 Einführung. Häufig stellt sich dem Statistiker die Aufgabe, Informationen über bestimmte charakteristische Eigenschaften statistischer Gesamtheiten zu beschaffen. Bsw. kann der Anteil π der berufstätigen Frauen in einer Gemeinde oder das monatliche Durchschnittseinkommen µ er deutschen Studenten von Interesse sein. Zwei Wege zur Bestimmung derartiger Maßzahlen (Parameter) von Grundgesamtheiten bieten sich an: Zum ersten können im Rahmen der sogenannten Vollerhebung sämtliche Elemente der Grundgesamtheit in der Erhebung einbezogen werden, zum zweiten kann im Wege der sogenannten Teilerhebung nur ein Teil der Elemente der Grundgesamtheit erhoben werden. Die wichtigsten Gründe für die Anwendung von Teilerhebungen sind: Kostenersparnis, Zeitgewinn und praktische Unmöglichkeit von Vollerhebungen. Liegt eine Teilerhebung vor, so hat man aus den Eigenschaften einer Teilgesamtheit Schlußfolgerungen auf die Eigenschaften der Grundgesamtheit zu ziehen (indirekter Schluß). Ein derartiges Vorgehen wird aber nur dann zweckmäßig sein, wenn erwartet werden darf, daß die Eigenschaften der Teilgesamtheit mit denen der Grundgesamtheit übereinstimmen, d.h. wenn die Teilgesamtheit als repräsentativ für die Grundgesamtheit angesehen werden kann. Bei den Teilerhebungen kann man nun zwei Arten von Auswahlverfahren unterscheiden: Zum ersten gibt es Verfahren, die auf dem Zufallsprinzip beruhen, die Zufallsauswahlver-fahren (Zufallsstichproben); zum zweiten gibt es die nicht auf dem Zufallsprinzip beruhen-den Verfahren der bewußten Auswahl. Wir werden nur das Zufallsauswahlverfahren weiter besprechen, denn beim Verfahren der bewußten Auswahl lassen sich über die Zuverlässigkeit der gewonnenen Ergebnisse keine fundierten Aussagen machen. Bei den Zufallsauswahlverfahren besitzen sämtliche Elemente der Grundgesamtheit bestimmte, von null verschiedene Wahrscheinlichkeiten, um in die Stichprobe zu gelangen. Das einfachste Verfahren aus dieser Gruppe ist die uneingeschränkte Zufallsauswahl, bei der jedes Element der Grundgesamtheit die gleiche Wahrscheinlichkeit besitzt, gezogen zu werden. Liegen die Elemente der Grundgesamtheit durchnumeriert vor, dann könnte man für jedes Element einen Zettel mit der entsprechenden Nummer in eine Urne geben und die Elemente der Stichprobe durch Auslosung bestimmen. Betrachtet man eine konkrete Stichprobe des Umfangs n und bezeichnet man x i den Merkmalswert, der auf das- i -ten ausgewählten Stichprobenelement zutrifft, dann liefert die Stichprobe eine Folge von n Merkmalswerten x i ( i = 1; 2; 3; ...; n ) . Für das arithmetische Mittel x der Stichprobe ergibt sich: x = 1 n Für die Stichprobenvarianz s 2 der Stichprobe ergibt sich: s 2 = Für den Anteilswert p der Stichprobe ergibt sich: p = k . n n ∑x i . i =1 1 n -1 n ∑( x i= 1 i - x )2 . § 3.1.2 2 Konfidenzintervall für µ bei bekannter Varianz σ . Wenn die Varianz σ 2 einer normalverteilten Zufallsvariablen bekannt ist, dann ist das errechnen des Konfidenzintervalls für µ recht einfach. Die Varianz σ 2 der Grundgesamtheit ist bekannt und µ ist unbekannt. Wir nehmen eine Stichprobe x 1; x 2 ; x 3; ....; x n . Diese Stichprobe führt zu dem Konfidenzintervall: x - z ⋅ σ ≤ µ ≤ x + z⋅ σ . n n Zieht man nicht nur eine einzige Stichprobe, sondern eine zweite, eine dritte usw. (Umfang jeweils n), dann wird sich der Stichprobenmittelwert x von Stichprobe zu Stichprobe zufallsbedingt unterscheiden. Damit wird sich aber auch von Stichprobe zu Stichprobe ein anderes Kondifenzintervall für µ ergeben. Die Wahrscheinlichkeit 1 − α (oft auch als Sicherheitsgrad oder Konfindenzniveau bezeichnet) kann also als Wahrscheinlichkeit dafür interpretiert werden, daß ein Konfidenzintervall um den Mittelwert x einer Stichprobe den gesuchten Mittelwert µ der Grundgesamtheit überdeckt. Betrachten wir eine konkrete Stichprobe, so wird das durch sie bestimmte Konfidenzintervall das arithmetische Mittel µ der Grundgesamtheit entweder einschließen oder auch nicht. Würde man aber eine große Zahl von Stichproben ziehen, so würde das Konfidenzintervall in ( 1 − α )*100% aller Fälle den unbekannten Parameter µ einschließen. Beispiel 1: Aus der Grundgesamtheit der Studenten zur Schätzung des Durchschnittsalters entnommene Stichprobe im Umfang n = 49 (Stichprobenumfang) ergebe einem Stichprobenmittelwert von x = 24 Jahren. Die Standardabweichung der Grundgesamtheit betrage σ = 2,8 Jahre. Man bestimme ein 99%-Konfidenzintervall für das Durchschnittsalter µ in der Grundgesamtheit. Also α = 0,01 . Aus der Tabelle der Standardnormalverteilung (zweiseitig begrenzt) findet man für den Sicherheitsgrad 1 − α = 0,99 den Wert z = 2,58 . Damit ergibt sich das gesuchte Konfidenzintervall zu: x - z⋅ 24 - 2,58 ⋅ σ n 2,8 49 ≤ µ ≤ x + z⋅ σ n ≤ µ ≤ 24 + 2,58 ⋅ 2,8 49 22,97 ≤ µ ≤ 25,03 Errechnen z-Wert mit Hilfe Excel. Wähle die Funktionstaste fx , wähle Statistik und wähle STAND.NORM.INV. Mit Hilfe dieser Funktion können den z-Wert errechnen. Diese Funktion errechnen aber den z-Wert, wenn das Konfindenzintervall einseitig begrenzt ist. Wir sollen also erst einiges umrechnen. Ein 99%-zweiseitiges begrenztes Konfidenz-intervall gibt den gleichen z-Wert wie ein 99,5%-einseitiges begrenztes Konfidenzintervall. 0,5%+[ 99% ]+0,5%=100% ↑ z-Wert ( 99,5% ] + 0,5%=100% ↑ z-Wert 0,995 einsetzen gibt den z-Wert 2,575834; also auf zwei Nachkommastellen genau 2,58. Beispiel 2: Aus der Grundgesamtheit der Studenten zur Schätzung des Durchschnittseinkommen pro Jahr entnommene Stichprobe im Umfang n = 64 (Stichprobenumfang) ergebe einem Stichprobenmittelwert von x = 12 .000 DM. Die Standardabweichung der Grundgesamtheit betrage σ = 2.000 DM. Man bestimme ein einseitiges 90%-Konfidenzintervall [ a ; ∞ ) für das Durchschnittseinkommen µ in der Grundgesamtheit. Also α = 0,10 . Aus der Tabelle der Standardnormalverteilung (zweiseitig begrenzt) findet man für den Sicherheitsgrad 1 − (α + α ) = 0,80 den Wert z = 1,28 . Damit ergibt sich das gesuchte Konfidenzintervall zu: x - z⋅ σ 12 .000 - 1,28 ⋅ n ≤ µ 2 .000 64 ≤ µ 11 .679,61 ≤ µ Errechnen z-Wert mit Hilfe Excel. Wähle die Funktionstaste fx , wähle Statistik und wähle STAND.NORM.INV. Mit Hilfe dieser Funktion können den z-Wert errechnen. Diese Funktion errechnet den z-Wert, wenn das Konfindenzintervall einseitig begrenzt ist. Wir können also gleich den z-Wert errechnen durch 0,90 einzusetzen. 10% +[ 99% ) =100% ↑ z-Wert Einsetzen 0,90 gibt den z-Wert 1,2815…., also auf zwei Nachkommastellen genau 1,28. § 3.1.3 Konfidenzintervall für µ bei unbekannter Varianz σ 2 . Zur Bestimmung des Konfidenzintervalls soll von einer wenigstens annähernd normalverteilten Grundgesamtheit ausgegangen werden. Da die Varianz unbekannt ist, muß σ 2 geschätzt werden. Naheliegender Weise verwendet man als Schätzfunktion für σ 2 die n 1 2 2 Stichprobenvarianz s : ( x i - x )2 s = n - 1 i= 1 ∑ Eine konkrete Stichprobe liefert den Stichprobenmittelwert x und die Stichprobenstandardabweichung s und damit das Konfidenzintervall: x - t⋅ s n ≤ µ ≤ x + t⋅ s n Wobei t einer Studentenverteilung mit F = n - 1 Freiheitsgraden gehorcht. Beispiel 3 : Von einer Maschine werden automatisch Tuben mit Alleskleber abgefüllt. Das Füllgewicht sei normalverteilt. Eine Stichprobe aus der laufenden Produktion im Umfang n = 17 (Stichprobenumfang) liefere ein durchschnittliches Füllgewicht von x = 34 g (Stichprobenmittelwert) bei einer Standardabweichung von s = 4 g (Stichprobenstandardabweichung). Gesucht wird ein 95%-Konfidenzintervall für das durchschnittliche Füllgewicht in der Grundgesamtheit. Für den Sicherheitsgrad 1 − α = 0,95 und F = n - 1 = 16 Freiheitsgrade liefert die Tabelle der Studentenverteilung den Wert t = 2,12 . Nach dem Einsetzen dieser Werte in das Konfidenzintervall x - t⋅ s n ≤ µ ≤ x + t⋅ s n erhält man 34 - 2,12 ⋅ oder 4 17 ≤ µ ≤ 34 + 2,12 ⋅ 4 17 31,94 ≤ µ ≤ 36,06 Für Freiheitsgrade von F ≥ 51 kann die Normalverteilung verwendet werden. Für Stichprobenumfänge von n ≥ 52 kann die Normalverteilung auch bei beliebiger Verteilung der Grundgesamtheit angewandt werden. Errechnen t-Wert mit Hilfe Excel. Wähle die Funktionstaste fx , wähle Statistik und wähle T.INV. Mit Hilfe dieser Funktion können den t-Wert errechnen. Diese Funktion errechnet den tWert, wenn das Konfindenzintervall zweiseitig begrenzt ist. Wir können also gleich den tWert errechnen durch α = 0,05 und Anzahl Freiheitsgraden 16 einzusetzen. 2,5% +[ 95% ] + 2,5% =100% ↑ t-Wert Daß ergibt den t-Wert 2,11990..., also auf zwei Nachkommastellen genau 2,12. § 3.1.4 Konfidenzintervall für λ bei der Poissonverteilung. Die Schätzung des Poissonparameters λ ist abhängig von der Anzahl verfügbaren Wahrnehmungen. Bei einer geringen Anzahl Wahrnehmungen ist eine Schätzung unbrauchbar, da sie viel zu ungenau ist. Es sollen mindestens 50 Wahrnehmungen stattgefunden haben um ein brauchbares Konfidenzintervall erstellen zu können. Die Formel des Konfidenzintervalls ist, W ist die Anzahl Wahrnehmungen: W −z⋅ W ≤ λ ≤ W + z⋅ W Beispiel 3a : Die Leitung eines Krankenhauses ist davon überzügt, daß die Anzahl Patienten pro Woche, bei denen eine bestimmte Geisteskrankheit festgestellt wird, sich einer Poissonverteilung nähert mit einem unbekannten Parameter λ . Innerhalb einer Periode von16 Wochen haben folgende Wahrnehmungen stattgefunden: 3, 5, 8, 6, 5, 6, 2, 7, 4, 4, 10, 6, 8, 3, 5 und 7. Insgesamt betrifft es also 89 Wahrnehmungen innerhalb von 16 Wochen. Wir möchten ein 95%-Konfidenzintervall erstellen für λ , den Mittelwert pro Woche. Wir setzen w = 89 und z = 1,96 in der Formel ein: 89 − 1,96 ⋅ 89 ≤ λ ≤ 89 + 1,96 ⋅ 89 pro 16 Wochen 70,51 ≤ λ ≤ 107,49 pro 16 Wochen 4,41 ≤ λ ≤ 6,72 pro Woche Es gibt noch eine genauere Methode um ein Konfidenzintervall für den Parameter λ zu errechnen. Man soll dann folgende Gleichungen lösen: Untergrenze λ U : und Obergrenze λ O : λ U + 1,96 ⋅ λ U = 89 λ O − 1,96 ⋅ λ O = 89 Mit Hilfe der pq-Formel kann man beide Gleichungen lösen. Ziemlich viel Rechenarbeit. Als Lösung bekommt man dann: 72,3 ≤ λ ≤ 109,53 pro 16 Wochen 4,52 ≤ λ ≤ 6,84 pro Woche Das Intervall ist nicht schmaler, sondern die Untergrenze und die Obergrenze sind um etwa 0,11 nach oben verschoben. Wir werden, wegen der vielen Rechenarbeit und des kleinen Unterschiedes nur die erste Methode anwenden. Konfidenzintervall für den Anteilswert π . § 3.1.5 Die Errechnung des Konfidenzintervalls des Anteilswertes p einer Stichprobe aus einer dichotomen Grundgesamtheit hängt ab von der Stichprobengröße n . Es gibt da drei Möglichkeiten: 1. 2. 3. n ist sehr klein ( n < 20 ) n ist Mittelgroß ( 20 ≤ n ≤ 200 ) n ist groß ( n > 200 ) Bei der 1. Möglichkeit gibt es zu viele Ungenauigkeiten, so daß wir diese Möglichkeit nicht besprechen werden. Bei der 2. Möglichkeit ist die Stichprobengröße genügend groß um die normale Verteilung anzuwenden. Das ergibt eine sehr große Formel um das Konfidenzintervall zu errechnen: π1,2 = das ergibt p+ z2 2n p ( 1− p ) n ± z⋅ 1+ + z2 4n 2 z2 n π1 ≤ π ≤ π2 Beispiel 4: In einem Vorort mit N=10.000 Familien soll der Anteil π der Familien mit mehr als einem Pkw geschätzt werden. In einer Stichprobe im Umfang n = 100 (Stichprobenumfang) Familien befinden sich k = 30 Familien mit mehr als einem Pkw. Man bestimme ein 95%-Konfidenzintervall für den Anteil π der Familien mit mehr als einem Pkw in diesem Vorort. k 30 = = 0,3 n 100 Die Tabelle der Standardnormalverteilung liefert für 1 − α = 0,95 den Wert z = 1,96 . Stichprobenumfang ist 100. Der Stichprobenanteilswert p beträgt: p = 2 π 1,2 = 0,3 + 12,⋅96 ± 1,96 ⋅ 100 0 ,3( 1−0, 3 ) 100 + 1, 96 2 4⋅100 2 2 ,96 1 + 1100 0,219 ≤ π ≤ 0,396 Also mit einer Wahrscheinlichkeit von 95% liegt den wirklichen Anteilswert zwischen 21,9% und 39,6%. Bei der 3. Möglichkeit wird die Formel etwas einfacher um das Konfidenzintervall zu errechnen: p - z⋅ p ( 1- p ) p ( 1- p ) ≤ π ≤ p + z⋅ n n Beispiel 5: In einem Vorort mit N=10.000 Familien soll der Anteil π der Familien mit mehr als einem Pkw geschätzt werden. In einer Stichprobe im Umfang n = 1000 Familien befinden sich k = 200 Familien mit mehr als einem Pkw. Man bestimme ein 99%-Konfidenzintervall für den Anteil π der Familien mit mehr als einem Pkw in diesem Vorort. k 200 = = 0,2 n 1000 Die Tabelle der Standardnormalverteilung liefert für 1 − α = 0,99 den Wert z = 2,58 . Stichprobenumfang ist 1000. Der Stichprobenanteilswert p beträgt: p = 0,2 - 2,58 * 0,2 ( 1 - 0,2 ) ≤ π ≤ 0,2 + 2,58 * 1000 0,2 ( 1 - 0,2 ) 1000 0,167 ≤ π ≤ 0,233 Also mit einer Wahrscheinlichkeit von 99% liegt der wirkliche Anteilswert zwischen 16,7% und 23,3%. §3.1.6 Bestimmung des notwendigen Stichprobenumfangs. Bisher stellte sich die Aufgabe, aus einer Stichprobe von gegebenem Umfang n bei gegebenem Sicherheitsgrad 1 − α ein Konfidenzintervall für den zu schätzenden Parameter zu bestimmen. Wir gehen davon aus, daß es sich um eine normalverteilte Zufallsvariable handelt mit bekannter Varianz. So ergab sich für das arithmetische Mittel µ das Konfidenzintervall: x- z⋅ das auch in der Form µ = x ± z ⋅ Setzen wir nun a = z ⋅ σ σ n ≤µ ≤ x+z⋅ σ n geschrieben werden kann. n σ so ergibt sich µ = x ± a , wobei der sogenannte absolute Fehler n a ein Maß für die Genauigkeit der Schätzung darstellt. Die Differenz zwischen Ober- und Untergrenze des Konfidenzintervalls wird als Breite des Konfidenzintervalls bezeichnet und σ beträgt 2 a = 2 z ⋅ . n Häufig stellt sich in der Praxis die Aufgabe, einen Parameter mit vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen und dafür den notwendigen Stichprobenumfang n zu bestimmen. 2 σ z2 ⋅ σ Aus a = z ⋅ ergibt sich n = ; um das gewünschte Konfidenzintervall zu erhalten, a2 n muß n also mindestens die angegebene Größe aufweisen. Beispiel 6: Die Zufallsvariable x ist normalverteilt mit Standardabweichung σ = 2 . Wir möchten ein 95%Konfidenzintervall für µ bestimmen mit einer Breite von höchstens 0,50. Gegeben ist: a = 0,50 = 0,25 ; z = 1,96 und σ = 2 . 2 Einsetzen gibt: n = 1,96 2 ⋅ 2 2 = 245,86 , also n ist mindestens 246. 0,25 2 Wenn der Stichprobenumfang n größer ist als 10% des Umfangs der Grundgesamtheit N , dann darf man eine andere Formel anwenden. Wenn n ≥ 10% von N , dann n ≥ σ2 a2 σ 2 + N z2 . Beispiel 7: Siehe Beispiel 6. Es ist aber bekannt, daß die Grundgesamtheit 1000 Elemente enthält. n ≥ 10% von N , 246 ≥ 10% von 1000 , also die Formel anwenden. 22 n≥ = 197,34 , also n ≥ 198 . 0,25 2 22 + 1,96 2 1000 Errechnung des Stichprobenumfangs bei einer dichotomen Grundgesamtheit. Für n > 200 gilt: p - z ⋅ p ( 1- p ) p ( 1- p ) ≤ π ≤ p+z⋅ n n Wenn wir jetzt für a = z ⋅ p ( 1- p ) z2 ⋅ p ( 1 - p ) einsetzen, ergibt daß: n = . n a2 Diese Formel dürfen wir anwenden, wenn "einiges über p bekannt ist". 2 Wenn p völlig unbekannt ist, dann soll man folgende Formel nehmen. n = z 2 . 4⋅ a Beispiel 8: Ein Marktartikelhersteller will den Bekanntheitsgrad seines Produkts in der Bundesrepublik bestimmen. Der absolute Fehler soll a = 0,02 und der Sicherheitsgrad 1 − α = 0,95 betragen. Wie groß ist der notwendige Stichprobenumfang zu wählen, wenn aus einer früheren Untersuchung mit einem Bekanntheitsgrad von 0,42 gerechnet werden kann? n = 1,96 2 ⋅ 0,42 ⋅ 0,58 = 2339,53 , also n = 2340 0,02 2 Wenn der Stichprobenumfang n größer ist als 10% des Umfangs der Grundgesamtheit N , dann darf man eine andere Formel anwenden. π(1 − π) , wenn einiges von π bekannt ist. a π(1 − π ) + N z2 1 z2 ⋅ N Wenn π unbekannt, dann n ≥ = . 4a 2 1 4a 2 N + z 2 + N z2 Wenn n ≥ 10% von N , dann n ≥ 2 §3.2.1. Einführung in das Testverfahren. Ebenso wie die in den vorangegangenen Paragraphen besprochenen Schätzverfahren basieren auch die Testverfahren (Prüfungsverfahren) auf der Stichprobentheorie. Im Rahmen der Schätzverfahren haben wir uns mit der Frage beschäftigt, wie man mit Hilfe von Zufallsstichproben unbekannte Parameter von Grundgesamtheiten schätzen kann. Im Rahmen der Testverfahren soll nun die Frage behandelt werden, wie man mit Hilfe von Zufallsstichproben testen kann, ob bestimmte Hypothesen (Behauptungen) über unbekannte Grundgesamtheiten richtig oder falsch sind. Ein statischer Test ist also ein Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen. Hypothesen über unbekannte Parameter einer Grundgesamtheit werden Parametertest genannt. §3.2.2 Konzeption von Parametertests An folgendem Beispiel soll zunächst erläutert werden, welche verschiedenen Formulierungen für Parameterhypothesen möglich sind. Beispiel 1: Der Fabrikant eines Massenartikels behauptet gegenüber einem Abnehmer, der Ausschlußanteil π in einer von ihm angebotenen Lieferung betrage genau 0,10 bzw. 10%. In der Terminologie der Testtheorie stellt er mit dieser Behauptung die sogenannte Nullhypothese H 0 : π = 0,10 auf. Da sich H 0 hier nur auf einen einzigen Wert, nämlich π 0 = 0,10 , bezieht, ist sie eine sogenannte einfache Hypothese (Punkthypothese). Würde der Fabrikant bsw. behaupten, der Ausschlußanteil betrage höchstens 0,10, dann gälte π 0 ≤ 0,10 und es läge eine zusammengesetzte Hypothese (Bereichshypothese) vor. Die Beantwortung der Frage, ob die Nullhypothese richtig oder falsch ist, erfolgt mit Hilfe eines statistischen Tests. Bevor der Aufbau solcher Tests behandelt wird, wollen wir uns aber zunächst überlegen, welche Möglichkeiten zur Formulierung einer Alternativhypothese (Gegenhypothese H A , H1 ) zur Nullhypothese H 0 : π = 0,10 vorhanden sind. Die vielen denkbaren Alternativhypothesen sollen wie folgt klassifiziert werden: 1. Einfache Alternativhypothesen: Beispielsweise H1 : π = 0,20 (Gegenannahmen: Ausschlußanteil beträgt 0,20). 2. Zusammengesetzte Alternativhypothesen: a. Einseitige Fragestellung H1 : π < 0,10 (Gegenannahme: Ausschlußanteil ist kleiner als 0,10) oder H1 : π > 0,10 (Gegenannahme: Ausschlußanteil ist größer als 0,10) b. Zweiseitige Fragestellung H1 : π ≠ 0,10 (Gegenannahme: Ausschluß ist ungleich 0,10) Bsw. könnte also der in die Form der Nullhypothese gekleideten Behauptungen des Fabrikanten H 0 : π = 0,10 vom Abnehmer die in der Form der Alternativhypothese gekleidete Gegenbehauptung H1 : π = 0,20 entgegengesetzt werden. Zur Überprüfung dieser Hypothese wird nun eine Stichprobe gezogen, deren Ergebnis eine Wahrscheinlichkeitsaussage darüber ermöglichen soll, ob H 0 zutrifft oder nicht zutrifft. Je nachdem, welches konkrete Ergebnis die Stichprobe liefert, wird man H 0 entweder ablehnen (verwerfen) oder nicht ablehnen (annehmen). Die Ablehnung von H 0 ist nun entweder die richtige oder die falsche Entscheidung: Wenn der wahre Zustand " H 0 trifft nicht zu" ist, so trifft man die richtige Entscheidung. Wenn hingegen der wahre Zustand " H 0 trifft zu" ist, trifft man die falsche Entscheidung. Man begeht dann einen sogenannten α -Fehler (Fehler 1.Art), dem die Wahrscheinlichkeit α (Signifikanzniveau, Irrtumswahrscheinlichkeit) zugeordnet ist. Auch die Nichtablehnung (Annahme) von H 0 ist entweder die richtige oder die falsche Entscheidung: Wenn der wahre Zustand " H0 trifft zu" ist, so trifft man die richtige Entscheidung. Wenn hingegen der wahre Zustand " H 0 trifft nicht zu" ist, trifft man die falsche Entscheidung. Man begeht dann einen sogenannten β -Fehler (Fehler 2.Art). Ziel des Statistikers ist es, das Testverfahren so zu konzipieren, daß die Wahrscheinlichkeit für den α -Fehler und auch die für den β -Fehler in vertretbaren Grenzen gehalten werden. In unserem Beispiel war die Behauptung π = 0,10 als Nullhypothese H 0 und die Behauptung π = 0,20 als Alternativhypothese H1 formuliert worden; man hätte natürlich auch umgekehrt H 0 : π = 0,20 und H1 : π = 0,10 formulieren können. Zu dem Problem, welche Hypothese als H 0 formuliert werden soll, findet man in der Literatur manchmal den Hinweis, daß als Nullhypothese diejenige Annahme festgelegt werden soll, der die größere Bedeutung zukommt. Entscheidung Wahrer Zustand H 0 trifft zu Wahrer Zustand H 0 trifft nicht zu H 0 wird nicht abgelehnt Richtige Entscheidung β -Fehler (Fehler 2.Art) H 0 wird abgelehnt α -Fehler (Fehler 1.Art) Richtige Entscheidung §3.2.3 Probentests für den Anteilswert. Beispiel 2: Siehe Beispiel 1. Der Fabrikant behauptet gegenüber einem Abnehmer, der Ausschlußanteil π in einer von ihm angebotenen Lieferung betrage genau 0,10. Der Abnehmer behauptet es sei mehr als 0,10. Es werden beliebig 100 Artikel kontrolliert. Es ergibt sich, daß16 Artikel fehlerhaft sind. Welche Entscheidung soll man treffen. Nehmen Sie für α = 0,05 . Bestimmen Sie den sogenannten Annahme-Bereich und auch den sogenannten Kritische-Bereich. H0 : π = 0,10 H1 : π > 0,10 k ~ Bin(100;0,1) α = 0,05 Es wird einseitig getestet. Der Annahme-Bereich ist: A={0; 1; …… ; k} Der Kritische-Bereich ist: K={k+1; …… ; 100} k ist den kleinsten Wert wofür gilt: P[k ≤ k ] ≥ 0,95 . Mit Hilfe von Excel oder der Tabelle können wir errechnen P[k ≤ 14 ] ≥ 0,9274 und P[k ≤ 15] ≥ 0,9601 . Also k=15. Also: Der Annahme-Bereich ist: der Kritische-Bereich ist: A={0; 1; …… ; 15} und K={16; …… ; 100} Unsere Stichprobe enthält 16 fehlerhafte Artikel. 16 ∈ K , also H0 ablehnen. Der Anteilswert ist größer als 0,10. Die Wahrscheinlichkeit, daß eine Fehlentscheidung getroffen wird ist 0,05. Beispiel 3: Siehe Beispiel 2. Der Fabrikant behauptet gegenüber einem Abnehmer, der Ausschlußanteil π in einer von ihm angebotenen Lieferung betrage genau 0,10. Der Abnehmer der Kontrollabteilung behauptet es sei nicht 0,10. Es werden beliebig 100 Artikel kontrolliert. Es ergibt sich, daß14 Artikel fehlerhaft sind. Welche Entscheidung soll man treffen. Nehmen Sie für α = 0,05 . Bestimmen Sie den sogenannten Annahme-Bereich und auch den sogenannten Kritischen-Bereich. H0 : π = 0,10 H1 : π ≠ 0,10 k ~ Bin(100 ; 0,1) α = 0,05 Es wird zweiseitig getestet. α wird jetzt über zwei Seiten aufgeteilt. Jede Seite α = 0,025 ! Der Annahme-Bereich ist: A={k; k+1; …… ; m} Der Kritische-Bereich ist: K={0; 1; k-1} ∪ {m+1; m+2;…… ; 100} m ist der kleinste Wert wofür gilt: P[k ≤ m] ≥ 0,975 . Mit Hilfe von Excel oder der Tabelle können wir errechnen P[k ≤ 15] ≥ 0,9601 und P[k ≤ 16] ≥ 0,9794 . Also m=16. k ist der kleinste Wert wofür gilt: P[k ≤ k ] ≥ 0,025 . Mit Hilfe von Excel können wir errechnen P[k ≤ 4] ≥ 0,0237 und P[k ≤ 5] ≥ 0,0575 . Also k=5. Der Annahme-Bereich ist: Der Kritische-Bereich ist: A={5; 6; …… ; 16} K={0; 1; … ; 4} ∪ {17; 18; …… ; 100} Unsere Stichprobe enthält 14 fehlerhafte Artikel. 14 ∈ A , also H0 nicht ablehnen. Der Anteilswert ist gleich 0,10. Die Wahrscheinlichkeit, daß eine Fehlentscheidung getroffen wird, ist 0,05. §3.2.4 Probentests für das arithmetische Mittel bei bekannter Varianz der Grundgesamtheit Beispiel 4: In einer Fabrik wird am laufenden Band gearbeitet. Für die Produktion eines bestimmten Teils benötigt man 5 Minuten. Von vorigem Jahr ist bekannt, daß sich die Produktionszeit einer Normalverteilung annähert mit µ = 300 Sekunden und σ = 15 Sekunden. Anhand einer Stichprobe möchte man kontrollieren ob sich die Produktionszeit dieses Jahr geändert hat. Eine Stichprobe im Umfang von n = 25 (Stichprobenumfang) liefert eine durchschnittliche Produktionszeit von 292 (Stichprobenmittelwert) Sekunden. Wir gehen davon aus, daß die Standardabweichung sich nicht geändert hat. Als Nullhypothese formulieren wir: Als Alternativhypothese formulieren wir: H 0 : µ = 300 H1 : µ ≠ 300 Wir testen hier zweiseitig, denn wir möchten untersuchen, ob sich die durchschnittliche Produktionszeit geändert hat. x ~ N ( 300 ; 15 ) α = 0,05 , da wir zweiseitig testen nehmen wir auf jeder Seite α = 0,025 . Aufsuchen in der Tabelle bei 0,9500, ergibt z = 1,96 . Als kritische Grenzen finden wir dann: gl = µ - z ⋅ σ n = 300 - 1,96 ⋅ 15 25 = 294,12 und gr = µ + z ⋅ σ n = 300 + 1,96 ⋅ 15 = 305,88 25 Das gibt folgenden Annahme-Bereich: A = [ 294,12 ; 305,88 ] und also folgenden kritischen Bereich: K = (0 ; 294,12 ) ∪ (305,88 ; ∞ ) Die Stichprobe ergab x = 292 (Stichprobenmittelwert). 292 ∉ A , also wird H 0 abgelehnt. Die durchschnittliche Produktionszeit hat sich geändert. Die Wahrscheinlichkeit, daß eine Fehlentscheidung getroffen wird, ist 0,05. Beispiel 5: Siehe Beispiel 4. In einer Fabrik wird am laufenden Band gearbeitet. Für die Produktion eines bestimmten Teils benötigt man 5 Minuten. Von vorigem Jahr ist bekannt, daß sich die Produktionszeit einer Normalverteilung annähert mit µ = 300 Sekunden und σ = 15 Sekunden. Anhand einer Stichprobe möchte man kontrollieren, ob sich die Produktionszeit dieses Jahr verringert hat. Eine Stichprobe im Umfang von n = 25 (Stichprobenumfang) liefert eine durchschnittliche Produktionszeit von 294 (Stichprobenmittelwert) Sekunden. Wir gehen davon aus, daß die Standardabweichung sich nicht geändert hat. Wenn wir testen möchten ob die Produktionszeit sich verringert hat, dann gibt es eine andere Lösung. Als Nullhypothese formulieren wir: Als Alternativhypothese formulieren wir: H 0 : µ = 300 H1 : µ < 300 Wir testen hier einseitig, denn wir möchten untersuchen ob sich die durchschnittliche Produktionszeit verringert hat. x ~ N ( 300 ; 15 ) α = 0,05 , da wir jetzt einseitig testen. Aufsuchen in der z-Tabelle bei 0,90. (0,05+0,90)+0,05 ergibt z = 1,64 . Als kritische Grenzen finden wir dann: σ gl = µ - z * Das gibt folgenden Annahme-Bereich: A = [295,08 ; ∞ und also folgenden Kritischen Bereich: K = (0 ; 295,08 n = 300 - 1,64 * 15 = 295,08 25 ) ) Die Stichprobe ergab x = 294 (Stichprobenmittelwert). x = 294 ∉ A , also wird H 0 abgelehnt. Die durchschnittliche Produktionszeit hat sich verringert. §3.2.5 Probentests für das arithmetische Mittel bei unbekannter Varianz der Grundgesamtheit Wir wollen jetzt den in der Praxis häufiger anfzutreffenden Fall untersuchen, daß bei dem Test des arithmetische Mittels die Varianz σ 2 der Grundgesamtheit unbekannt ist. Als Schätzwert für die Varianz der Grundgesamtheit verwendet man die Stichprobenvarianz 2 1 n s 2 . Die Formel lautet: s 2 = xi − x . n − 1 i =1 ∑( ) Bei der Ableitung des Konfidenzintervalls für das arithmetische Mittel bei unbekannter Varianz der Grundgesamtheit war gezeigt worden, daß bei Vorliegen einer normalverteilten Grundgex - µ samtheit die Zufallsvariable t = s einer Studentverteilung mit F = n - 1 Freiheitsgraden n gehorcht, wobei n wieder den Stichprobenumfang bezeichnet. Beispiel 6 : Eine Maschine stellt Platten her, deren Dicke normalverteilt ist, mit dem Mittelwert µ = 0,25 cm. Eine Stichprobe von n = 10 (Stichprobenumfang) Platten liefert ein arithmetisches Mittel von x = 0,253 (Stichprobenmittelwert) cm bei einer Standardabweichung von s = 0,003 (Stichprobenstandardabweichung) cm. Die Hypothese, daß die Maschine noch exakt arbeitet, ist auf einem Signifikanzniveau von α = 0,05 zu überprüfen. Als Nullhypothese formulieren wir: Als Alternativhypothese formulieren wir: H 0 : µ = 0,25 H1 : µ ≠ 0,25 Wir testen hier zweiseitig, denn wir möchten untersuchen ob die Maschine noch exakt arbeitet. α = 0,05 , da wir zweiseitig testen, nehmen wir an jeder Seite 0,025. Aufsuchen in der t-Tabelle mit F = n - 1 = 9 Freiheitsgraden ergibt z = 2,26 . Als kritische Grenzen finden wir dann: gl = µ - t * s n = 0,25 - 2,26 * 0,003 10 = 0,247 9 und gr = µ + t * s = 0,25 + 2,26 * n Das gibt folgenden Annahme-Bereich: A = [ 0,2479 ; 0,2521 ] und also folgenden Kritischen Bereich: K = (0 ; 0,2479 ) ∪ (0,2521; ∞ ) Die Stichprobe ergab x = 0,253 ∉ A , also wird H 0 abgelehnt. Die durchschnittliche Produktionszeit hat sich geändert. 0,003 10 = 0,2521 Beispiel 7: Wenn wir testen möchten ob die durchschnittliche Dicke der Platten gewachsen ist, gibt es eine andere Lösung. Als Nullhypothese formulieren wir: Als Alternativhypothese formulieren wir: H 0 : µ = 0,25 H1 : µ > 0,25 Wir testen hier einseitig, denn wir möchten untersuchen ob die durchschnittliche Dicke der Platten gewachsen ist. α = 0,05 , da wir jetzt einseitig testen. Aufsuchen in der t-Tabelle bei α = 0,10 mit F = n - 1 = 9 Freiheitsgraden ergibt t = 1,83 . Als kritische Grenze finden wir dann: gr = µ + t * s n = 0,25 + 1,83 ⋅ 0,003 = 0,2517 10 Das gibt folgenden Annahme-Bereich: A = ( 0 ; 0,2517 ] und also folgenden Kritischen-Bereich: K = (0,2517 ; ∞ ) Die Stichprobe ergab x = 0,253 ∉ A , also wird H 0 abgelehnt. Die durchschnittliche Dicke der Platten hat sich vergrößert. §3.3 Aufgaben Aufgabe 1 Eine Kontrollinstitution nimmt regelmäßig Trinkwasserproben. Es wird dann mehrere Male ein Becher mit einem Liter Inhalt gefüllt, wovon dann der Chlorgehalt bestimmt wird. Pro Messung werden 25 Proben von einer bestimmten Sorte Trinkwasser genommen. Die Standardabweichung ist bekannt und beträgt 0,5 mg pro Probe. Der durchschnittliche Chlorgehalt von den 25 Proben betrug1,8 mg. Gib ein 95%-Konfidenzintervall für µ : Der Chlorgehalt des untersuchten Wassers. Aufgabe 2 Eine Umfrage bei 400 Familien zeigt ein durchschnittliches Jahreseinkommen der Familien in Höhe von DM 25.000,- auf (Standardabweichung des Einkommens ist DM 1.600,-). Gib eine Intervallschätzung für das durchschnittliche Einkommen der Bevölkerung (wähle als Wahrscheinlichkeit 99,73%). Aufgabe 3 Eine Stichprobe, die 400 wahlberechtigte Deutschen umfaßt, ergibt, daß 160 der Personen Anhänger einer bestimmten politischen Partei sind. Gib ein 99%-Konfidenzintervall für π : Der Anteil Anhänger in der totalen Bevölkerung. Aufgabe 4 Aus der Grundgesamtheit der Studenten in Deutschland wird eine Stichprobe von 80 Personen vorgenommen. Hierbei stellte sich heraus, daß darunter 16 Mädchen waren. a. Gib ein 95,4%-Konfidenzintervall für den Anteil Mädchen in der Grundgesamtheit der Studenten. b. Beantworte dieselbe Frage für eine Stichprobe von 800 Studenten mit 160 Mädchen. Aufgabe 5 Die Varianz einer Normalverteilten Variable x beträgt 9. Um µ zu schätzen, werden wir eine Stichprobe nehmen. Wie groß muß der Umfang der Stichprobe n sein, um mit 95%iger Wahrscheinlichkeit für x eine Abweichung in Bezug auf µ von höchstens 0,5 zu finden? Errechnen Sie auch wie groß der Umfang der Stichprobe sein soll, wenn die Grundgesamtheit 1.000 Elementen enthält. Aufgabe 6 Zur Bestimmung des Kohlenmonoxydgehaltes eines Gasgemischs steht eine ziemlich ungenaue Bestimmungsmethode zur Verfügung. Pro Probe kann das Ergebnis betrachtet werden als Wahrscheinlichkeit x mit dem Erwartungswert µ % (Der Kohlenmonoxydgehalt des Gasgemisches woraus die Proben entnommen werden) und einer Standardabweichung von 4%. Gefragt ist ein 95%-Konfidenzintervall für den Kohlenmonoxydgehalt des Gasgemisches, wobei der erlaubte Grenzwert 1% nach oben und nach unten ist. Berechne dazu die Anzahl der benötigten Proben, um aufgrund des durchschnittlichen Kohlenmonoxydgehaltes dieser Proben ein Konfidenzintervall von der geforderten Präzision berechnen zu können. Errechnen Sie auch wie groß der Umfang der Stichprobe sein soll, wenn die Grundgesamtheit 500 Elemente enthält. Aufgabe 7 Eine Maschine füllt Päckchen mit Zucker. Die folgenden Gewichtseinheiten x werden von uns festgestellt: 503, 496, 510, 504, 492, 495, 506, 495, 496, 503. a. Schätz die Varianz der Gewichtseinheiten. b. Berechne ein 90%-Konfidenzintervall für µ aufgrund der oben genannten Stichprobe, falls wir annehmen, daß die Gewichtseinheiten x normalverteilt sind. Aufgabe 8 Bei einem Versandhaus will man eine Schätzung machen von der durchschnittlichen Zeitdauer von Telefongesprächen mit Kunden. Wir gehen davon aus, daß die Gesprächsdauer t eine Zufallsvariable ist mit einer Normalverteilung. Für 9 Gespräche wird als Zeitdauer gefunden (in Sekunden): 218, 225, 230, 240, 214, 202, 204, 195, 180. Berechne ein 99%-Konfidenzintervall für µ : durchschnittliche Zeitdauer. Aufgabe 9 Eine Variable x ist normalverteilt mit der Standardabweichung 10. Wir prüfen H 0 : µ = 50 gegen H1 : µ > 50 . a. Berechne den kritischen Bereich, falls eine Feststellung gemacht wird bei der Wahrscheinlichkeit auf einen 1.Fehler von α = 0,05 und auch bei α = 0,01 b. Wir machen 100 Feststellungen von der diesbezüglichen Variable. Berechne den kritischen Bereich bei α = 0,1 und α = 0,001 . Aufgabe 10 In einem Laboratorium wird die Reinheit von einer bestimmten Lösung bestimmt. Das Gehalt an Verunreinigungen darf höchstens 5% betragen. Die verwendete Bestimmungsmethode hat, in Bezug auf den gemessenen Verunreinigungsgehalt x , pro Bestimmung eine Ungenauigkeit die wiedergegeben werden kann durch eine Standardabweichung von 0,5%. Es werden 10 Proben genommen, wobei die folgenden Anteile an Verunreinigungen gefunden wurden: 5,2%, 6,3%, 4,8%, 5,0%, 4,6%, 5,8%, 5,3%, 6,0%, 4,5% und 5,3%. Prüfe ob das Experiment überzeugend darstellt, daß der Gehalt an Verunreinigungen in der Lösung mehr als 5% ist. Wähle α = 0,1, prüfe einseitig. Aufgabe 11 Kapseln, die gefüllt sind mit einer bestimmten Medizin, müssen 5 mg wirksame Bestandteile enthalten. Es ist bekannt, daß durch Ungenauigkeiten der Maschine, mit der die Kapseln gefüllt werden, die Menge wirksamer Bestandteile als eine normalverteilte Zufallsvariable x mit einem Erwartungswert von 5,0 mg und einer Standardabweichung von 0,15 mg zu betrachten ist. Die Einstellung der Maschine kann sich während dem Gebrauch verändern. Darum werden regelmäßig einige Kapseln in einem Laboratorium überprüft. Eine Stichprobe unter 25 Kapseln ergibt ein durchschnittliches Gehalt an wirksamen Bestandteilen von 4,70 mg. Prüfe ob hieraus entnommen werden kann, daß die Einstellung der Maschine verändert ist. Prüfe hierbei zweiseitig, wähle α = 0,01 und geh davon aus, daß die Standardabweichung unverändert ist. Aufgabe 12 Ein Institut für Wirtschaftsuntersuchungen will untersuchen, wieviel Prozent eines Familienein-kommens in Freizeitaktivitäten investiert wird. Für 8 willkürlich gewählte Familien aus einer bestimmten Einkommensgruppe (unserer Bevölkerung) werden die folgenden Prozentzahlen gefunden: Familie % Freizeitaktivitäten a. b. 17 1 12 2 13 3 14 4 10 5 18 6 16 7 20 8 Gib ein 95%-Konfidenzintervall für µ : der durchschnittliche Anteil an Freizeitausgaben für die untersuchte Bevölkerung. Geh davon aus, daß die Prozentzahlen durch eine (unbekannte) Normalverteilung beschrieben können werden. Vorhergehende Untersuchungen zeigten, daß der Anteil an Freizeitausgaben µ mindestens 21% ist. Prüfe, ob diese Aussage für die durch uns untersuchte Einkommensgruppe haltbar ist. Prüfe einseitig, wähle α = 0,05 . Aufgabe 13 Nach den Richtlinien eines Ministeriums darf die durchschnittliche Anzahl eines bestimmten Bakterientyps pro Probe eines französischen Käses höchstens 900 sein. Von einer großen Lieferung werden 10 Proben genommen. Das Resultat der Untersuchung lautet wie folgt: 920, 960, 915, 910, 935, 965, 930, 970, 945 und 950. Untersuche, ob diese Resultate anzeigen, daß der Qualitätsanforderung entsprochen ist. Wähle α = 0,01 . Aufgabe 14 Die Menge radioaktiver Spuren in einer Kiste Spinat ist als eine normalverteilte Zufallsvariable x zu betrachten, mit einem Durchschnittswert von 50 RE (Radioaktive Einheiten). Die Standardabweichung ist nicht bekannt. Nach einer Explosion in einem fernen Land werden von 7 Kisten Spinat genau bestimmt wieviel RE’s gefunden wurden. Es ergaben sich folgende Resultate (in RE): 80, 90, 86, 70, 92, 74 und 68. Prüfe, ob die neuen Ergebnisse auf eine signifikante Erhöhung in Bezug auf das alte Niveau hindeuten. Prüfe einseitig, wähle α = 0,05 . Aufgabe 15 Bei einem Kenntnistest werden einem Kandidaten 10 (20; 50; 100) Fragen vorgelegt, die er mit ja oder nein beantworten muß. Wieviele Fragen muß der Kandidat mindestens richtig beantworten, damit man bei einem Signifikanzniveau von α = 0,05 davon ausgehen kann, daß das richtige Beantworten auf Kenntnis und nicht auf Raten beruht? Aufgabe 16 Bei einem Kenntnistest werden einem Kandidaten 10 (20; 50; 100) Fragen vorgelegt, wobei es vier Antwortmöglichkeiten gibt. Eine Antwort ist nur richtig. Wieviele Fragen muß der Kandidat mindestens richtig beantworten, damit man bei einem Signifikanzniveau von α = 0,10 davon ausgehen kann, daß das richtige Beantworten auf Kenntnis und nicht auf Raten beruht? Aufgabe 17 Der Hersteller des Haarwuchsmittels "Glatzkopf" versichert, daß sein Produkt in mehr als 60% aller Fälle wirksam ist. Zur Überprüfung dieser Behauptung wird das Haarwuchsmittel von einem Forschungsinstitut durch eine Zufallsstichprobe an 100 glatzköpfigen Personen getestet. a. Entwickle für das Forschungsinstitut ein Entscheidungsverfahren, so daß lediglich mit einer Wahrscheinlichkeit von 5% dem Haarwuchsmit- telhersteller zu Unrecht irreführende Werbung vorgeworfen wird. b. Wie wird entschieden, wenn das Mittel bei 50 von den 100 Personen wirksam ist? Aufgabe 18 a. b. c. Die Zeit, die Herr Slaats benötigt, um mit dem Rad zur Fachhochschule zu fahren, nähert sich einer Normalverteilung. Die letzten zwei Wochen benötigte er folgende Zeiten: 12, 15, 14, 17, 16, 14, 15, 17, 15 und 15 Minuten. Errechnen Sie ein 99%-Konfidenzintervall für die Reisezeit. Geben Sie die Lösung bis auf 2 Nachkommastellen an. Nach einem Jahr hat sich ergeben, daß die benötigte Zeit sich einer Normalverteilung nähert mit µ = 15 Minuten und σ = 1,5 Minuten. Herr Slaats hat sich ein neues Rad gekauft und möchte untersuchen, ob sich die Reisezeit verringert hat. Die Ergebnisse waren 13, 14, 15, 11, 16, 13, 12, 16 und 14 Minuten. Kontrollieren Sie, ob sich die Reisezeit verringert hat. Nehmen Sie für α = 0,025 . In dem vergangenen Jahr bestanden 68% die MS2B_D-Klausur. Herr Slaats möchte aufgrund einer Stichprobe ein 99%-Konfidenzintervall erstellen mit einer Breite von 10% von dem Anteil der Studenten, die diese MS2B_D nicht bestehen. Errechnen Sie, wie groß die Stichprobe mindestens sein soll. Aufgabe 19 a. b. c. Herr Slaats fährt noch immer mit seinem Rad zur Fachhochschule. Er nimmt jetzt aber einen schöneren, aber auch längeren Weg. Die Zeit, die Herr Slaats benötigt, um mit dem Rad zur Fachhochschule zu fahren, nähert sich einer Normalverteilung. Herr Slaats geht davon aus, daß die Standardabweichung sich nicht verändert hat und noch immer 1,5 Minuten ist. Die letzten drei Wochen benötigte er folgende Zeiten: 14, 17, 16, 17, 19, 17, 19, 16, 18, 17, 14, 19, 18, 16, 18 und 17 Minuten. Errechnen Sie ein 95%-Konfidenzintervall für die Reisezeit. Geben Sie die Lösung bis auf 3 Nachkommastellen an. Nach einem Jahr hat sich ergeben, daß die benötigte Zeit sich einer Normalverteilung nähert mit xµ = 17 Minuten und σ = 1,5 Minuten. Auf der Strecke, die Herr Slaats immer fährt, hat man aber eine zusätzliche Ampel hingestellt. Herr Slaats möchte untersuchen, ob die Reisezeit sich erhöht hat. Er geht davon aus, daß die Standardabweichung sich ganz bestimmt geändert hat. Die Ergebnisse waren 20, 16, 18, 20, 19, 15, 17, 18 und 19 Minuten. Kontrollieren Sie, ob sich die Reisezeit erhöht hat. Nehmen Sie für α = 0,05 . In dem vergangenen Jahr bestanden 25% die MS2B_D-Wiederholungsklausur nicht. Herr Slaats möchte aufgrund einer Stichprobe ein 95%-Konfidenzintervall erstellen mit einer Abweichung von 10% von dem Anteil der Studenten, die diese MS2B_DWiederholungsklausur nicht bestehen. Errechnen Sie, wie groß die Stichprobe mindestens sein soll. Aufgabe 20 a. b. Die Zeit, die Herr Slaats benötigt, um eine beliebig gewählte Klausur zu korrigieren, nähert sich einer Normalverteilung. Herr Slaats hat einige Klausuren korrigiert. Das ergab folgende Korrekturzeiten: 5, 12, 14, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 17, 17, 18 und 22 Minuten. Errechnen Sie ein 95%-Konfidenzintervall für die Korrekturzeit. Geben Sie die Lösung bis auf 2 Nachkommastellen an. Nach der Korrektur von 100 Klausuren ergab sich, daß sich die benötigte Korrekturzeit einer Normalverteilung nähert mit einem Mittelwert von 15 Minuten und einer c. Standardabweichung von 3,2 Minuten. Nach der Korrektur von 100 Klausuren hat sich Herr Slaats einerseits in die Materie eingearbeitet und korrigiert schneller, andererseits wird er müde und fängt an, Fehler zu machen, die dann wieder verbessert werden müssen. Für die letzten Klausuren benötigt er folgende Korrekturzeiten: 6, 10, 10, 12, 12, 12, 13, 13, 13, 14, 14, 14, 15, 18, 18 und 20. Errechnen Sie, ob sich die Korrekturzeit geändert hat. Nehmen Sie für α = 0,05 . Herr Slaats möchte aufgrund einer Stichprobe ein 75%-Konfidenzintervall mit einer Breite von 30% erstellen, von jenem Anteil Studenten, die die Klausur bestanden haben. Errechnen Sie, wie groß die Stichprobe mindestens sein muß. Aufgabe 21 a. b. c. Die Zeit, die Herr Slaats benötigt, um eine beliebig gewählte Wiederholungsklausur zu korrigieren, nähert sich einer Normalverteilung. Herr Slaats geht davon aus daß die Standardabweichung sich nicht geändert hat und also die gleiche ist wie bei der Klausur, nämlich, 3,2 Minuten. Herr Slaats hat einige Wiederholungsklausuren korrigiert, und das ergab folgende Korrekturzeiten: 12, 14, 14, 15, 15, 15, 16, 16, 18, 18, 18, 18, 19, 19 und 29 Minuten. Errechnen Sie einen 99%-Konfidenzintervall für die Korrekturzeit. Geben Sie die Lösung bis auf 2 Nachkommastellen. Nach der Korrektur von vielen Wiederholungsklausuren hat sich ergeben, daß sich die benötigte Zeit einer Normalverteilung nähert mit µ = 17 und σ = 3,2 . Die letzten Wiederholungsklausuren sind zufällig Wiederholungsklausuren von Studenten aus dem dritten Jahr. Herr Slaats möchte untersuchen, ob die Korrekturzeit für diese Klausuren geringer ist. Er geht davon aus, daß die Standardabweichung sich ganz bestimmt geändert hat. Die Korrekturzeiten waren: 13, 14, 15, 16, 16, 17, 17, 18 und 18 Minuten. Kontrollieren Sie, ob sich die Korrekturzeit verringert hat. Nehmen Sie für α = 0,10 . In vergangenen Jahr bestanden 70% der Studierenden die Wiederholungsklausur. Herr Slaats möchte aufgrund einer Stichprobe ein 90%-Konfidenzintervall erstellen mit einer Abweichung von 5% von dem Anteil der Studenten, die diese Wiederholungsklausur bestehen. Errechnen Sie, wie groß die Stichprobe mindestens sein muß. Aufgabe 22 a. b. Der Manager eines wirschaftlichen Beratungsbüros möchte, daß seine Angestellten während der Arbeitszeit einen Computerkurs belegen, um die neuesten Computerprogramme beherrschen zu lernen. In der nachstehenden Tabelle stehen die von einigen Angestellten benötigten Stunden, die sie gebraucht haben, um sich das Computerprogramm anzueignen. Benötigte Stunden: 36, 56, 52, 50, 48, 50, 46, 44, 50, 52, 50, 36, 50, 52, 48, 50 und 46. Errechnen Sie 95% Konfindenzintervall für die benötigte Anzahl Stunden. Geben Sie die Lösung bis auf 2 Nachkommastellen. Das Büro, daß den Computerkurs anbietet, behauptet, daß die benötigte Zeit, die ein Angestellter mit einer BW-Ausbilding benötigt, sich einer Normalverteilung nähert mit einem Mittelwert von 50 Stunden und einer Standardabweichung von 6 Stunden. Von einigen Angestellten mit einer AW-Ausbildung sind folgende benötigte Zeiten bekannt: 48, 57, 58, 56, 59, 53, 56, 55 und 44. Der Manager des Beratungsbüros behauptet, daß die benötigte Zeit, die diese Angestellten benötigen mehr ist als die der Angestellten mit einer BWAusbildung. Die Standardabweichung ist in beiden Fällen gleich groß. c. Errechnen Sie, ob diese Behauptung stimmt. Nehmen Sie für α = 0,05 . Der Manager möchte mit einer Wahrscheinlichkeit von 95% errechnen, wie groß der Umfang der Stichprobe sein muß, so daß die Abweichung zum Mittelwert höchstens 2 Stunden beträgt. Siehe auch Aufgabe a. Nehmen Sie für σ = 28 . Aufgabe 23 a. b. c. Die Zeit, die ein Angestellter mit einer AW-Ausbildung benötigt, um sich ein Computer-programm anzueignen, nähert sich einer Normalverteilung mit einer Standardabweichung von 6 Stunden. Die von einigen Angestellten mit einer AW-Ausbildung benötigte Zeit ist bekannt: 47, 56, 57, 55, 43, 54, 55, 52 und 58 Stunden. Errechnen Sie ein 99% Konfidenzintervall für die benötigte Zeit. Geben Sie die Lösung bis auf 2 Nachkommastellen. Der Manager möchte mit einer Wahrscheinlichkeit von 99% errechnen, wie groß der Umfang der Stichprobe sein soll, so daß die Breite des Konfidenzintervalls höchstens 5 Stunden beträgt. Siehe auch Aufgabe a. Nach einiger Zeit ergibt sich, daß sich die benötigte Zeit einer Normalverteilung mit einem Mittelwert von 52 Stunden und einer Standardabweichung von 6 Stunden nähert. Der Manager findet beide Werte zu hoch und mietet zur Unterstützung der Angestellten einen Dozenten der FHV ein. Der Manager geht davon aus, daß beide Werte sich jetzt verringern. Von einigen Angestellten, die von dem Dozenten unterstützt wurden, sind folgende Zeiten bekannt: 42, 57, 48, 45, 42, 54, 51, 45 und 48 Stunden. Errechnen Sie, ob sich die benötigte Zeit tatsächlich verringert hat. Nehmen Sie für α = 0,05 . Aufgabe 24 Auf der Autobahnstrecke Venlo - Köln hat man registriert wieviele Unfälle stattgefunden haben. Innerhalb einer Periode von 50 Wochen fanden 832 Unfälle statt. Gehen Sie davon aus, daß die Anzahl Unfälle pro Woche annäherungsweise durch eine Poissonverteilung mit unbekannten λ dargestellt werden kann (und daß dieses λ für alle Wochen des Jahres gleich groß ist). Errechnen Sie ein 95%-Konfidenzintervall für λ .