∑ ∑ - Xs4all

Werbung
Kapitel 3: Schätz- und Testverfahren.
§ 3.1.1
Einführung.
Häufig stellt sich dem Statistiker die Aufgabe, Informationen über bestimmte charakteristische Eigenschaften statistischer Gesamtheiten zu beschaffen. Bsw. kann der Anteil π der
berufstätigen Frauen in einer Gemeinde oder das monatliche Durchschnittseinkommen µ er
deutschen Studenten von Interesse sein.
Zwei Wege zur Bestimmung derartiger Maßzahlen (Parameter) von Grundgesamtheiten
bieten sich an: Zum ersten können im Rahmen der sogenannten Vollerhebung sämtliche
Elemente der Grundgesamtheit in der Erhebung einbezogen werden, zum zweiten kann im
Wege der sogenannten Teilerhebung nur ein Teil der Elemente der Grundgesamtheit
erhoben werden.
Die wichtigsten Gründe für die Anwendung von Teilerhebungen sind: Kostenersparnis,
Zeitgewinn und praktische Unmöglichkeit von Vollerhebungen.
Liegt eine Teilerhebung vor, so hat man aus den Eigenschaften einer Teilgesamtheit
Schlußfolgerungen auf die Eigenschaften der Grundgesamtheit zu ziehen (indirekter Schluß).
Ein derartiges Vorgehen wird aber nur dann zweckmäßig sein, wenn erwartet werden darf,
daß die Eigenschaften der Teilgesamtheit mit denen der Grundgesamtheit übereinstimmen,
d.h. wenn die Teilgesamtheit als repräsentativ für die Grundgesamtheit angesehen werden
kann.
Bei den Teilerhebungen kann man nun zwei Arten von Auswahlverfahren unterscheiden: Zum
ersten gibt es Verfahren, die auf dem Zufallsprinzip beruhen, die Zufallsauswahlver-fahren
(Zufallsstichproben); zum zweiten gibt es die nicht auf dem Zufallsprinzip beruhen-den
Verfahren der bewußten Auswahl.
Wir werden nur das Zufallsauswahlverfahren weiter besprechen, denn beim Verfahren der
bewußten Auswahl lassen sich über die Zuverlässigkeit der gewonnenen Ergebnisse keine
fundierten Aussagen machen.
Bei den Zufallsauswahlverfahren besitzen sämtliche Elemente der Grundgesamtheit
bestimmte, von null verschiedene Wahrscheinlichkeiten, um in die Stichprobe zu gelangen.
Das einfachste Verfahren aus dieser Gruppe ist die uneingeschränkte Zufallsauswahl, bei der
jedes Element der Grundgesamtheit die gleiche Wahrscheinlichkeit besitzt, gezogen zu
werden.
Liegen die Elemente der Grundgesamtheit durchnumeriert vor, dann könnte man für jedes
Element einen Zettel mit der entsprechenden Nummer in eine Urne geben und die Elemente
der Stichprobe durch Auslosung bestimmen.
Betrachtet man eine konkrete Stichprobe des Umfangs n und bezeichnet man x i den
Merkmalswert, der auf das- i -ten ausgewählten Stichprobenelement zutrifft, dann liefert die
Stichprobe eine Folge von n Merkmalswerten x i ( i = 1; 2; 3; ...; n ) .
Für das arithmetische Mittel x der Stichprobe ergibt sich: x =
1
n
Für die Stichprobenvarianz s 2 der Stichprobe ergibt sich: s 2 =
Für den Anteilswert p der Stichprobe ergibt sich: p =
k
.
n
n
∑x
i
.
i =1
1
n -1
n
∑( x
i= 1
i
- x )2 .
§ 3.1.2
2
Konfidenzintervall für µ bei bekannter Varianz σ .
Wenn die Varianz σ 2 einer normalverteilten Zufallsvariablen bekannt ist, dann ist das
errechnen des Konfidenzintervalls für µ recht einfach.
Die Varianz σ 2 der Grundgesamtheit ist bekannt und µ ist unbekannt.
Wir nehmen eine Stichprobe x 1; x 2 ; x 3; ....; x n .
Diese Stichprobe führt zu dem Konfidenzintervall: x - z ⋅
σ
≤ µ ≤ x + z⋅
σ
.
n
n
Zieht man nicht nur eine einzige Stichprobe, sondern eine zweite, eine dritte usw. (Umfang
jeweils n), dann wird sich der Stichprobenmittelwert x von Stichprobe zu Stichprobe
zufallsbedingt unterscheiden. Damit wird sich aber auch von Stichprobe zu Stichprobe ein
anderes Kondifenzintervall für µ ergeben.
Die Wahrscheinlichkeit 1 − α (oft auch als Sicherheitsgrad oder Konfindenzniveau bezeichnet) kann also als Wahrscheinlichkeit dafür interpretiert werden, daß ein Konfidenzintervall
um den Mittelwert x einer Stichprobe den gesuchten Mittelwert µ der Grundgesamtheit
überdeckt. Betrachten wir eine konkrete Stichprobe, so wird das durch sie bestimmte
Konfidenzintervall das arithmetische Mittel µ der Grundgesamtheit entweder einschließen
oder auch nicht. Würde man aber eine große Zahl von Stichproben ziehen, so würde das
Konfidenzintervall in ( 1 − α )*100% aller Fälle den unbekannten Parameter µ einschließen.
Beispiel 1:
Aus der Grundgesamtheit der Studenten zur Schätzung des Durchschnittsalters entnommene Stichprobe im Umfang n = 49 (Stichprobenumfang) ergebe einem Stichprobenmittelwert
von x = 24 Jahren. Die Standardabweichung der Grundgesamtheit betrage σ = 2,8 Jahre.
Man bestimme ein 99%-Konfidenzintervall für das Durchschnittsalter µ in der Grundgesamtheit. Also α = 0,01 . Aus der Tabelle der Standardnormalverteilung (zweiseitig begrenzt)
findet man für den Sicherheitsgrad 1 − α = 0,99 den Wert z = 2,58 . Damit ergibt sich das
gesuchte Konfidenzintervall zu:
x - z⋅
24 - 2,58 ⋅
σ
n
2,8
49
≤ µ ≤ x + z⋅
σ
n
≤ µ ≤ 24 + 2,58 ⋅
2,8
49
22,97 ≤ µ ≤ 25,03
Errechnen z-Wert mit Hilfe Excel. Wähle die Funktionstaste fx , wähle Statistik und wähle
STAND.NORM.INV. Mit Hilfe dieser Funktion können den z-Wert errechnen. Diese Funktion
errechnen aber den z-Wert, wenn das Konfindenzintervall einseitig begrenzt ist. Wir sollen
also erst einiges umrechnen. Ein 99%-zweiseitiges begrenztes Konfidenz-intervall gibt den
gleichen z-Wert wie ein 99,5%-einseitiges begrenztes Konfidenzintervall.
0,5%+[ 99% ]+0,5%=100%
↑
z-Wert
( 99,5% ] + 0,5%=100%
↑
z-Wert
0,995 einsetzen gibt den z-Wert 2,575834; also auf zwei Nachkommastellen genau 2,58.
Beispiel 2:
Aus der Grundgesamtheit der Studenten zur Schätzung des Durchschnittseinkommen pro
Jahr entnommene Stichprobe im Umfang n = 64 (Stichprobenumfang) ergebe einem
Stichprobenmittelwert von x = 12 .000 DM. Die Standardabweichung der Grundgesamtheit
betrage σ = 2.000 DM. Man bestimme ein einseitiges 90%-Konfidenzintervall [ a ; ∞ ) für das
Durchschnittseinkommen µ in der Grundgesamtheit. Also α = 0,10 .
Aus der Tabelle der Standardnormalverteilung (zweiseitig begrenzt) findet man für den
Sicherheitsgrad 1 − (α + α ) = 0,80 den Wert z = 1,28 .
Damit ergibt sich das gesuchte Konfidenzintervall zu:
x - z⋅
σ
12 .000 - 1,28 ⋅
n
≤ µ
2 .000
64
≤ µ
11 .679,61 ≤ µ
Errechnen z-Wert mit Hilfe Excel. Wähle die Funktionstaste fx , wähle Statistik und wähle
STAND.NORM.INV. Mit Hilfe dieser Funktion können den z-Wert errechnen. Diese Funktion
errechnet den z-Wert, wenn das Konfindenzintervall einseitig begrenzt ist. Wir können also
gleich den z-Wert errechnen durch 0,90 einzusetzen.
10% +[ 99% ) =100%
↑
z-Wert
Einsetzen 0,90 gibt den z-Wert 1,2815…., also auf zwei Nachkommastellen genau 1,28.
§ 3.1.3
Konfidenzintervall für µ bei unbekannter Varianz σ 2 .
Zur Bestimmung des Konfidenzintervalls soll von einer wenigstens annähernd normalverteilten Grundgesamtheit ausgegangen werden. Da die Varianz unbekannt ist, muß σ 2 geschätzt werden. Naheliegender Weise verwendet man als Schätzfunktion für σ 2 die
n
1
2
2
Stichprobenvarianz s :
( x i - x )2
s =
n - 1 i= 1
∑
Eine konkrete Stichprobe liefert den Stichprobenmittelwert x und die Stichprobenstandardabweichung s und damit das Konfidenzintervall:
x - t⋅
s
n
≤ µ ≤ x + t⋅
s
n
Wobei t einer Studentenverteilung mit F = n - 1 Freiheitsgraden gehorcht.
Beispiel 3 :
Von einer Maschine werden automatisch Tuben mit Alleskleber abgefüllt. Das Füllgewicht sei
normalverteilt.
Eine Stichprobe aus der laufenden Produktion im Umfang n = 17 (Stichprobenumfang) liefere
ein durchschnittliches Füllgewicht von x = 34 g (Stichprobenmittelwert) bei einer Standardabweichung von s = 4 g (Stichprobenstandardabweichung).
Gesucht wird ein 95%-Konfidenzintervall für das durchschnittliche Füllgewicht in der Grundgesamtheit.
Für den Sicherheitsgrad 1 − α = 0,95 und F = n - 1 = 16 Freiheitsgrade liefert die Tabelle der
Studentenverteilung den Wert t = 2,12 .
Nach dem Einsetzen dieser Werte in das Konfidenzintervall
x - t⋅
s
n
≤ µ ≤ x + t⋅
s
n
erhält man
34 - 2,12 ⋅
oder
4
17
≤ µ ≤ 34 + 2,12 ⋅
4
17
31,94 ≤ µ ≤ 36,06
Für Freiheitsgrade von F ≥ 51 kann die Normalverteilung verwendet werden.
Für Stichprobenumfänge von n ≥ 52 kann die Normalverteilung auch bei beliebiger Verteilung der Grundgesamtheit angewandt werden.
Errechnen t-Wert mit Hilfe Excel. Wähle die Funktionstaste fx , wähle Statistik und wähle
T.INV. Mit Hilfe dieser Funktion können den t-Wert errechnen. Diese Funktion errechnet den tWert, wenn das Konfindenzintervall zweiseitig begrenzt ist. Wir können also gleich den tWert errechnen durch α = 0,05 und Anzahl Freiheitsgraden 16 einzusetzen.
2,5% +[ 95% ] + 2,5% =100%
↑
t-Wert
Daß ergibt den t-Wert 2,11990..., also auf zwei Nachkommastellen genau 2,12.
§ 3.1.4
Konfidenzintervall für λ bei der Poissonverteilung.
Die Schätzung des Poissonparameters λ ist abhängig von der Anzahl verfügbaren Wahrnehmungen. Bei einer geringen Anzahl Wahrnehmungen ist eine Schätzung unbrauchbar, da
sie viel zu ungenau ist. Es sollen mindestens 50 Wahrnehmungen stattgefunden haben um
ein brauchbares Konfidenzintervall erstellen zu können.
Die Formel des Konfidenzintervalls ist, W ist die Anzahl Wahrnehmungen:
W −z⋅ W ≤ λ ≤ W + z⋅ W
Beispiel 3a :
Die Leitung eines Krankenhauses ist davon überzügt, daß die Anzahl Patienten pro Woche,
bei denen eine bestimmte Geisteskrankheit festgestellt wird, sich einer Poissonverteilung
nähert mit einem unbekannten Parameter λ . Innerhalb einer Periode von16 Wochen haben
folgende Wahrnehmungen stattgefunden: 3, 5, 8, 6, 5, 6, 2, 7, 4, 4, 10, 6, 8, 3, 5 und 7.
Insgesamt betrifft es also 89 Wahrnehmungen innerhalb von 16 Wochen. Wir möchten ein
95%-Konfidenzintervall erstellen für λ , den Mittelwert pro Woche.
Wir setzen w = 89 und z = 1,96 in der Formel ein:
89 − 1,96 ⋅ 89 ≤ λ ≤ 89 + 1,96 ⋅ 89 pro 16 Wochen
70,51 ≤ λ ≤ 107,49 pro 16 Wochen
4,41 ≤ λ ≤ 6,72 pro Woche
Es gibt noch eine genauere Methode um ein Konfidenzintervall für den Parameter λ zu
errechnen. Man soll dann folgende Gleichungen lösen:
Untergrenze λ U :
und
Obergrenze λ O :
λ U + 1,96 ⋅ λ U = 89
λ O − 1,96 ⋅ λ O = 89
Mit Hilfe der pq-Formel kann man beide Gleichungen lösen. Ziemlich viel Rechenarbeit.
Als Lösung bekommt man dann:
72,3 ≤ λ ≤ 109,53 pro 16 Wochen
4,52 ≤ λ ≤ 6,84 pro Woche
Das Intervall ist nicht schmaler, sondern die Untergrenze und die Obergrenze sind um etwa
0,11 nach oben verschoben.
Wir werden, wegen der vielen Rechenarbeit und des kleinen Unterschiedes nur die erste
Methode anwenden.
Konfidenzintervall für den Anteilswert π .
§ 3.1.5
Die Errechnung des Konfidenzintervalls des Anteilswertes p einer Stichprobe aus einer
dichotomen Grundgesamtheit hängt ab von der Stichprobengröße n .
Es gibt da drei Möglichkeiten:
1.
2.
3.
n ist sehr klein ( n < 20 )
n ist Mittelgroß ( 20 ≤ n ≤ 200 )
n ist groß ( n > 200 )
Bei der 1. Möglichkeit gibt es zu viele Ungenauigkeiten, so daß wir diese Möglichkeit nicht
besprechen werden.
Bei der 2. Möglichkeit ist die Stichprobengröße genügend groß um die normale Verteilung
anzuwenden. Das ergibt eine sehr große Formel um das Konfidenzintervall zu errechnen:
π1,2 =
das ergibt
p+
z2
2n
p ( 1− p )
n
± z⋅
1+
+
z2
4n 2
z2
n
π1 ≤ π ≤ π2
Beispiel 4:
In einem Vorort mit N=10.000 Familien soll der Anteil π der Familien mit mehr als einem Pkw
geschätzt werden. In einer Stichprobe im Umfang n = 100 (Stichprobenumfang) Familien
befinden sich k = 30 Familien mit mehr als einem Pkw. Man bestimme ein 95%-Konfidenzintervall für den Anteil π der Familien mit mehr als einem Pkw in diesem Vorort.
k
30
=
= 0,3
n
100
Die Tabelle der Standardnormalverteilung liefert für 1 − α = 0,95 den Wert z = 1,96 . Stichprobenumfang ist 100.
Der Stichprobenanteilswert p beträgt: p =
2
π 1,2 =
0,3 + 12,⋅96
± 1,96 ⋅
100
0 ,3( 1−0, 3 )
100
+
1, 96 2
4⋅100 2
2
,96
1 + 1100
0,219 ≤ π ≤ 0,396
Also mit einer Wahrscheinlichkeit von 95% liegt den wirklichen Anteilswert zwischen 21,9%
und 39,6%.
Bei der 3. Möglichkeit wird die Formel etwas einfacher um das Konfidenzintervall zu errechnen:
p - z⋅
p ( 1- p )
p ( 1- p )
≤ π ≤ p + z⋅
n
n
Beispiel 5:
In einem Vorort mit N=10.000 Familien soll der Anteil π der Familien mit mehr als einem Pkw
geschätzt werden. In einer Stichprobe im Umfang n = 1000 Familien befinden sich k = 200
Familien mit mehr als einem Pkw. Man bestimme ein 99%-Konfidenzintervall für den Anteil π
der Familien mit mehr als einem Pkw in diesem Vorort.
k
200
=
= 0,2
n
1000
Die Tabelle der Standardnormalverteilung liefert für 1 − α = 0,99 den Wert z = 2,58 .
Stichprobenumfang ist 1000.
Der Stichprobenanteilswert p beträgt: p =
0,2 - 2,58 *
0,2 ( 1 - 0,2 )
≤ π ≤ 0,2 + 2,58 *
1000
0,2 ( 1 - 0,2 )
1000
0,167 ≤ π ≤ 0,233
Also mit einer Wahrscheinlichkeit von 99% liegt der wirkliche Anteilswert zwischen 16,7%
und 23,3%.
§3.1.6
Bestimmung des notwendigen Stichprobenumfangs.
Bisher stellte sich die Aufgabe, aus einer Stichprobe von gegebenem Umfang n bei gegebenem Sicherheitsgrad 1 − α ein Konfidenzintervall für den zu schätzenden Parameter zu
bestimmen.
Wir gehen davon aus, daß es sich um eine normalverteilte Zufallsvariable handelt mit
bekannter Varianz. So ergab sich für das arithmetische Mittel µ das Konfidenzintervall:
x- z⋅
das auch in der Form µ = x ± z ⋅
Setzen wir nun a = z ⋅
σ
σ
n
≤µ ≤ x+z⋅
σ
n
geschrieben werden kann.
n
σ
so ergibt sich µ = x ± a , wobei der sogenannte absolute Fehler
n
a ein Maß für die Genauigkeit der Schätzung darstellt. Die Differenz zwischen Ober- und
Untergrenze des Konfidenzintervalls wird als Breite des Konfidenzintervalls bezeichnet und
σ
beträgt 2 a = 2 z ⋅
.
n
Häufig stellt sich in der Praxis die Aufgabe, einen Parameter mit vorgegebener Genauigkeit
und vorgegebenem Sicherheitsgrad zu schätzen und dafür den notwendigen Stichprobenumfang n zu bestimmen.
2
σ
z2 ⋅ σ
Aus a = z ⋅
ergibt sich n =
; um das gewünschte Konfidenzintervall zu erhalten,
a2
n
muß n also mindestens die angegebene Größe aufweisen.
Beispiel 6:
Die Zufallsvariable x ist normalverteilt mit Standardabweichung σ = 2 . Wir möchten ein 95%Konfidenzintervall für µ bestimmen mit einer Breite von höchstens 0,50.
Gegeben ist: a =
0,50
= 0,25 ; z = 1,96 und σ = 2 .
2
Einsetzen gibt: n =
1,96 2 ⋅ 2 2
= 245,86 , also n ist mindestens 246.
0,25 2
Wenn der Stichprobenumfang n größer ist als 10% des Umfangs der Grundgesamtheit N ,
dann darf man eine andere Formel anwenden.
Wenn n ≥ 10% von N , dann n ≥
σ2
a2 σ 2
+
N
z2
.
Beispiel 7:
Siehe Beispiel 6. Es ist aber bekannt, daß die Grundgesamtheit 1000 Elemente enthält.
n ≥ 10% von N , 246 ≥ 10% von 1000 , also die Formel anwenden.
22
n≥
= 197,34 , also n ≥ 198 .
0,25 2
22
+
1,96 2 1000
Errechnung des Stichprobenumfangs bei einer dichotomen Grundgesamtheit.
Für n > 200 gilt: p - z ⋅
p ( 1- p )
p ( 1- p )
≤ π ≤ p+z⋅
n
n
Wenn wir jetzt für a = z ⋅
p ( 1- p )
z2 ⋅ p ( 1 - p )
einsetzen, ergibt daß: n =
.
n
a2
Diese Formel dürfen wir anwenden, wenn "einiges über p bekannt ist".
2
Wenn p völlig unbekannt ist, dann soll man folgende Formel nehmen. n = z 2 .
4⋅ a
Beispiel 8:
Ein Marktartikelhersteller will den Bekanntheitsgrad seines Produkts in der Bundesrepublik
bestimmen. Der absolute Fehler soll a = 0,02 und der Sicherheitsgrad 1 − α = 0,95 betragen.
Wie groß ist der notwendige Stichprobenumfang zu wählen, wenn aus einer früheren
Untersuchung mit einem Bekanntheitsgrad von 0,42 gerechnet werden kann?
n =
1,96 2 ⋅ 0,42 ⋅ 0,58
= 2339,53 , also n = 2340
0,02 2
Wenn der Stichprobenumfang n größer ist als 10% des Umfangs der Grundgesamtheit N ,
dann darf man eine andere Formel anwenden.
π(1 − π)
, wenn einiges von π bekannt ist.
a
π(1 − π )
+
N
z2
1
z2 ⋅ N
Wenn π unbekannt, dann n ≥
=
.
4a 2 1 4a 2 N + z 2
+
N
z2
Wenn n ≥ 10% von N , dann n ≥
2
§3.2.1.
Einführung in das Testverfahren.
Ebenso wie die in den vorangegangenen Paragraphen besprochenen Schätzverfahren
basieren auch die Testverfahren (Prüfungsverfahren) auf der Stichprobentheorie. Im Rahmen
der Schätzverfahren haben wir uns mit der Frage beschäftigt, wie man mit Hilfe von Zufallsstichproben unbekannte Parameter von Grundgesamtheiten schätzen kann. Im Rahmen der
Testverfahren soll nun die Frage behandelt werden, wie man mit Hilfe von Zufallsstichproben
testen kann, ob bestimmte Hypothesen (Behauptungen) über unbekannte Grundgesamtheiten richtig oder falsch sind. Ein statischer Test ist also ein Verfahren, mit dessen Hilfe sich
bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen. Hypothesen über unbekannte Parameter einer Grundgesamtheit werden Parametertest genannt.
§3.2.2
Konzeption von Parametertests
An folgendem Beispiel soll zunächst erläutert werden, welche verschiedenen Formulierungen
für Parameterhypothesen möglich sind.
Beispiel 1:
Der Fabrikant eines Massenartikels behauptet gegenüber einem Abnehmer, der Ausschlußanteil π in einer von ihm angebotenen Lieferung betrage genau 0,10 bzw. 10%. In der
Terminologie der Testtheorie stellt er mit dieser Behauptung die sogenannte Nullhypothese
H 0 : π = 0,10 auf. Da sich H 0 hier nur auf einen einzigen Wert, nämlich π 0 = 0,10 , bezieht,
ist sie eine sogenannte einfache Hypothese (Punkthypothese). Würde der Fabrikant bsw.
behaupten, der Ausschlußanteil betrage höchstens 0,10, dann gälte π 0 ≤ 0,10 und es läge
eine zusammengesetzte Hypothese (Bereichshypothese) vor.
Die Beantwortung der Frage, ob die Nullhypothese richtig oder falsch ist, erfolgt mit Hilfe
eines statistischen Tests. Bevor der Aufbau solcher Tests behandelt wird, wollen wir uns
aber zunächst überlegen, welche Möglichkeiten zur Formulierung einer Alternativhypothese
(Gegenhypothese H A , H1 ) zur Nullhypothese H 0 : π = 0,10 vorhanden sind. Die vielen
denkbaren Alternativhypothesen sollen wie folgt klassifiziert werden:
1.
Einfache Alternativhypothesen:
Beispielsweise H1 : π = 0,20 (Gegenannahmen: Ausschlußanteil beträgt 0,20).
2.
Zusammengesetzte Alternativhypothesen:
a.
Einseitige Fragestellung
H1 : π < 0,10 (Gegenannahme: Ausschlußanteil ist kleiner als 0,10)
oder
H1 : π > 0,10 (Gegenannahme: Ausschlußanteil ist größer als 0,10)
b.
Zweiseitige Fragestellung
H1 : π ≠ 0,10 (Gegenannahme: Ausschluß ist ungleich 0,10)
Bsw. könnte also der in die Form der Nullhypothese gekleideten Behauptungen des Fabrikanten H 0 : π = 0,10 vom Abnehmer die in der Form der Alternativhypothese gekleidete
Gegenbehauptung H1 : π = 0,20 entgegengesetzt werden. Zur Überprüfung dieser Hypothese wird nun eine Stichprobe gezogen, deren Ergebnis eine Wahrscheinlichkeitsaussage
darüber ermöglichen soll, ob H 0 zutrifft oder nicht zutrifft. Je nachdem, welches konkrete
Ergebnis die Stichprobe liefert, wird man H 0 entweder ablehnen (verwerfen) oder nicht
ablehnen (annehmen).
Die Ablehnung von H 0 ist nun entweder die richtige oder die falsche Entscheidung:
Wenn der wahre Zustand " H 0 trifft nicht zu" ist, so trifft man die richtige Entscheidung. Wenn
hingegen der wahre Zustand " H 0 trifft zu" ist, trifft man die falsche Entscheidung.
Man begeht dann einen sogenannten α -Fehler (Fehler 1.Art), dem die Wahrscheinlichkeit α
(Signifikanzniveau, Irrtumswahrscheinlichkeit) zugeordnet ist.
Auch die Nichtablehnung (Annahme) von H 0 ist entweder die richtige oder die
falsche Entscheidung:
Wenn der wahre Zustand " H0 trifft zu" ist, so trifft man die richtige Entscheidung.
Wenn hingegen der wahre Zustand " H 0 trifft nicht zu" ist, trifft man die falsche Entscheidung.
Man begeht dann einen sogenannten β -Fehler (Fehler 2.Art).
Ziel des Statistikers ist es, das Testverfahren so zu konzipieren, daß die Wahrscheinlichkeit
für den α -Fehler und auch die für den β -Fehler in vertretbaren Grenzen gehalten werden.
In unserem Beispiel war die Behauptung π = 0,10 als Nullhypothese H 0 und die Behauptung
π = 0,20 als Alternativhypothese H1 formuliert worden; man hätte natürlich auch umgekehrt
H 0 : π = 0,20 und H1 : π = 0,10 formulieren können. Zu dem Problem, welche Hypothese als
H 0 formuliert werden soll, findet man in der Literatur manchmal den Hinweis, daß als
Nullhypothese diejenige Annahme festgelegt werden soll, der die größere Bedeutung
zukommt.
Entscheidung
Wahrer Zustand H 0 trifft zu
Wahrer Zustand H 0 trifft nicht zu
H 0 wird nicht abgelehnt
Richtige Entscheidung
β -Fehler (Fehler 2.Art)
H 0 wird abgelehnt
α -Fehler (Fehler 1.Art)
Richtige Entscheidung
§3.2.3
Probentests für den Anteilswert.
Beispiel 2:
Siehe Beispiel 1. Der Fabrikant behauptet gegenüber einem Abnehmer, der Ausschlußanteil
π in einer von ihm angebotenen Lieferung betrage genau 0,10. Der Abnehmer behauptet es
sei mehr als 0,10. Es werden beliebig 100 Artikel kontrolliert. Es ergibt sich, daß16 Artikel
fehlerhaft sind. Welche Entscheidung soll man treffen. Nehmen Sie für α = 0,05 . Bestimmen
Sie den sogenannten Annahme-Bereich und auch den sogenannten Kritische-Bereich.
H0 : π = 0,10
H1 : π > 0,10
k ~ Bin(100;0,1)
α = 0,05
Es wird einseitig getestet.
Der Annahme-Bereich ist:
A={0; 1; …… ; k}
Der Kritische-Bereich ist:
K={k+1; …… ; 100}
k ist den kleinsten Wert wofür gilt: P[k ≤ k ] ≥ 0,95 . Mit Hilfe von Excel oder der Tabelle können
wir errechnen P[k ≤ 14 ] ≥ 0,9274 und P[k ≤ 15] ≥ 0,9601 . Also k=15.
Also:
Der Annahme-Bereich ist:
der Kritische-Bereich ist:
A={0; 1; …… ; 15} und
K={16; …… ; 100}
Unsere Stichprobe enthält 16 fehlerhafte Artikel. 16 ∈ K , also H0 ablehnen. Der Anteilswert ist
größer als 0,10. Die Wahrscheinlichkeit, daß eine Fehlentscheidung getroffen wird ist 0,05.
Beispiel 3:
Siehe Beispiel 2. Der Fabrikant behauptet gegenüber einem Abnehmer, der Ausschlußanteil
π in einer von ihm angebotenen Lieferung betrage genau 0,10. Der Abnehmer der Kontrollabteilung behauptet es sei nicht 0,10. Es werden beliebig 100 Artikel kontrolliert. Es ergibt
sich, daß14 Artikel fehlerhaft sind. Welche Entscheidung soll man treffen. Nehmen Sie für
α = 0,05 . Bestimmen Sie den sogenannten Annahme-Bereich und auch den sogenannten
Kritischen-Bereich.
H0 : π = 0,10
H1 : π ≠ 0,10
k ~ Bin(100 ; 0,1)
α = 0,05
Es wird zweiseitig getestet. α wird jetzt über zwei Seiten aufgeteilt. Jede Seite α = 0,025 !
Der Annahme-Bereich ist:
A={k; k+1; …… ; m}
Der Kritische-Bereich ist:
K={0; 1; k-1} ∪ {m+1; m+2;…… ; 100}
m ist der kleinste Wert wofür gilt: P[k ≤ m] ≥ 0,975 . Mit Hilfe von Excel oder der Tabelle
können wir errechnen P[k ≤ 15] ≥ 0,9601 und P[k ≤ 16] ≥ 0,9794 . Also m=16.
k ist der kleinste Wert wofür gilt: P[k ≤ k ] ≥ 0,025 . Mit Hilfe von Excel können wir errechnen
P[k ≤ 4] ≥ 0,0237 und P[k ≤ 5] ≥ 0,0575 . Also k=5.
Der Annahme-Bereich ist:
Der Kritische-Bereich ist:
A={5; 6; …… ; 16}
K={0; 1; … ; 4} ∪ {17; 18; …… ; 100}
Unsere Stichprobe enthält 14 fehlerhafte Artikel. 14 ∈ A , also H0 nicht ablehnen. Der
Anteilswert ist gleich 0,10. Die Wahrscheinlichkeit, daß eine Fehlentscheidung getroffen wird,
ist 0,05.
§3.2.4
Probentests für das arithmetische Mittel bei bekannter Varianz
der Grundgesamtheit
Beispiel 4:
In einer Fabrik wird am laufenden Band gearbeitet. Für die Produktion eines bestimmten Teils
benötigt man 5 Minuten. Von vorigem Jahr ist bekannt, daß sich die Produktionszeit einer
Normalverteilung annähert mit µ = 300 Sekunden und σ = 15 Sekunden.
Anhand einer Stichprobe möchte man kontrollieren ob sich die Produktionszeit dieses Jahr
geändert hat. Eine Stichprobe im Umfang von n = 25 (Stichprobenumfang) liefert eine
durchschnittliche Produktionszeit von 292 (Stichprobenmittelwert) Sekunden.
Wir gehen davon aus, daß die Standardabweichung sich nicht geändert hat.
Als Nullhypothese formulieren wir:
Als Alternativhypothese formulieren wir:
H 0 : µ = 300
H1 : µ ≠ 300
Wir testen hier zweiseitig, denn wir möchten untersuchen, ob sich die durchschnittliche
Produktionszeit geändert hat.
x ~ N ( 300 ; 15 )
α = 0,05 , da wir zweiseitig testen nehmen wir auf jeder Seite α = 0,025 . Aufsuchen in der
Tabelle bei 0,9500, ergibt z = 1,96 .
Als kritische Grenzen finden wir dann:
gl = µ - z ⋅
σ
n
= 300 - 1,96 ⋅
15
25
= 294,12 und gr = µ + z ⋅
σ
n
= 300 + 1,96 ⋅
15
= 305,88
25
Das gibt folgenden Annahme-Bereich: A = [ 294,12 ; 305,88 ]
und also folgenden kritischen Bereich: K = (0 ; 294,12 ) ∪ (305,88 ; ∞ )
Die Stichprobe ergab x = 292 (Stichprobenmittelwert). 292 ∉ A , also wird H 0 abgelehnt.
Die durchschnittliche Produktionszeit hat sich geändert. Die Wahrscheinlichkeit, daß eine
Fehlentscheidung getroffen wird, ist 0,05.
Beispiel 5:
Siehe Beispiel 4. In einer Fabrik wird am laufenden Band gearbeitet. Für die Produktion eines
bestimmten Teils benötigt man 5 Minuten. Von vorigem Jahr ist bekannt, daß sich die
Produktionszeit einer Normalverteilung annähert mit µ = 300 Sekunden und σ = 15 Sekunden. Anhand einer Stichprobe möchte man kontrollieren, ob sich die Produktionszeit dieses
Jahr verringert hat. Eine Stichprobe im Umfang von n = 25 (Stichprobenumfang) liefert eine
durchschnittliche Produktionszeit von 294 (Stichprobenmittelwert) Sekunden.
Wir gehen davon aus, daß die Standardabweichung sich nicht geändert hat.
Wenn wir testen möchten ob die Produktionszeit sich verringert hat, dann gibt es eine
andere Lösung.
Als Nullhypothese formulieren wir:
Als Alternativhypothese formulieren wir:
H 0 : µ = 300
H1 : µ < 300
Wir testen hier einseitig, denn wir möchten untersuchen ob sich die durchschnittliche
Produktionszeit verringert hat.
x ~ N ( 300 ; 15 )
α = 0,05 , da wir jetzt einseitig testen. Aufsuchen in der z-Tabelle bei 0,90. (0,05+0,90)+0,05
ergibt z = 1,64 .
Als kritische Grenzen finden wir dann:
σ
gl = µ - z *
Das gibt folgenden Annahme-Bereich: A = [295,08 ; ∞
und also folgenden Kritischen Bereich: K = (0 ; 295,08
n
= 300 - 1,64 *
15
= 295,08
25
)
)
Die Stichprobe ergab x = 294 (Stichprobenmittelwert). x = 294 ∉ A , also wird H 0
abgelehnt. Die durchschnittliche Produktionszeit hat sich verringert.
§3.2.5
Probentests für das arithmetische Mittel bei unbekannter Varianz
der Grundgesamtheit
Wir wollen jetzt den in der Praxis häufiger anfzutreffenden Fall untersuchen, daß bei dem
Test des arithmetische Mittels die Varianz σ 2 der Grundgesamtheit unbekannt ist.
Als Schätzwert für die Varianz der Grundgesamtheit verwendet man die Stichprobenvarianz
2
1 n
s 2 . Die Formel lautet: s 2 =
xi − x .
n − 1 i =1
∑(
)
Bei der Ableitung des Konfidenzintervalls für das arithmetische Mittel bei unbekannter Varianz
der Grundgesamtheit war gezeigt worden, daß bei Vorliegen einer normalverteilten Grundgex - µ
samtheit die Zufallsvariable t = s
einer Studentverteilung mit F = n - 1 Freiheitsgraden
n
gehorcht, wobei n wieder den Stichprobenumfang bezeichnet.
Beispiel 6 :
Eine Maschine stellt Platten her, deren Dicke normalverteilt ist, mit dem Mittelwert µ = 0,25
cm. Eine Stichprobe von n = 10 (Stichprobenumfang) Platten liefert ein arithmetisches Mittel
von x = 0,253 (Stichprobenmittelwert) cm bei einer Standardabweichung von s = 0,003
(Stichprobenstandardabweichung) cm.
Die Hypothese, daß die Maschine noch exakt arbeitet, ist auf einem Signifikanzniveau von
α = 0,05 zu überprüfen.
Als Nullhypothese formulieren wir:
Als Alternativhypothese formulieren wir:
H 0 : µ = 0,25
H1 : µ ≠ 0,25
Wir testen hier zweiseitig, denn wir möchten untersuchen ob die Maschine noch exakt
arbeitet.
α = 0,05 , da wir zweiseitig testen, nehmen wir an jeder Seite 0,025.
Aufsuchen in der t-Tabelle mit F = n - 1 = 9 Freiheitsgraden ergibt z = 2,26 .
Als kritische Grenzen finden wir dann:
gl = µ - t *
s
n
= 0,25 - 2,26 *
0,003
10
= 0,247 9 und gr = µ + t *
s
= 0,25 + 2,26 *
n
Das gibt folgenden Annahme-Bereich: A = [ 0,2479 ; 0,2521 ]
und also folgenden Kritischen Bereich: K = (0 ; 0,2479 ) ∪ (0,2521; ∞ )
Die Stichprobe ergab x = 0,253 ∉ A , also wird H 0 abgelehnt.
Die durchschnittliche Produktionszeit hat sich geändert.
0,003
10
= 0,2521
Beispiel 7:
Wenn wir testen möchten ob die durchschnittliche Dicke der Platten gewachsen ist, gibt es
eine andere Lösung.
Als Nullhypothese formulieren wir:
Als Alternativhypothese formulieren wir:
H 0 : µ = 0,25
H1 : µ > 0,25
Wir testen hier einseitig, denn wir möchten untersuchen ob die durchschnittliche Dicke der
Platten gewachsen ist.
α = 0,05 , da wir jetzt einseitig testen. Aufsuchen in der t-Tabelle bei α = 0,10 mit F = n - 1 = 9
Freiheitsgraden ergibt t = 1,83 .
Als kritische Grenze finden wir dann:
gr = µ + t *
s
n
= 0,25 + 1,83 ⋅
0,003
= 0,2517
10
Das gibt folgenden Annahme-Bereich: A = ( 0 ; 0,2517 ]
und also folgenden Kritischen-Bereich: K = (0,2517 ; ∞ )
Die Stichprobe ergab x = 0,253 ∉ A , also wird H 0 abgelehnt.
Die durchschnittliche Dicke der Platten hat sich vergrößert.
§3.3
Aufgaben
Aufgabe 1
Eine Kontrollinstitution nimmt regelmäßig Trinkwasserproben. Es wird dann mehrere Male
ein Becher mit einem Liter Inhalt gefüllt, wovon dann der Chlorgehalt bestimmt wird.
Pro Messung werden 25 Proben von einer bestimmten Sorte Trinkwasser genommen. Die
Standardabweichung ist bekannt und beträgt 0,5 mg pro Probe. Der durchschnittliche
Chlorgehalt von den 25 Proben betrug1,8 mg.
Gib ein 95%-Konfidenzintervall für µ : Der Chlorgehalt des untersuchten Wassers.
Aufgabe 2
Eine Umfrage bei 400 Familien zeigt ein durchschnittliches Jahreseinkommen der Familien in
Höhe von DM 25.000,- auf (Standardabweichung des Einkommens ist DM 1.600,-).
Gib eine Intervallschätzung für das durchschnittliche Einkommen der Bevölkerung (wähle als
Wahrscheinlichkeit 99,73%).
Aufgabe 3
Eine Stichprobe, die 400 wahlberechtigte Deutschen umfaßt, ergibt, daß 160 der Personen
Anhänger einer bestimmten politischen Partei sind.
Gib ein 99%-Konfidenzintervall für π : Der Anteil Anhänger in der totalen Bevölkerung.
Aufgabe 4
Aus der Grundgesamtheit der Studenten in Deutschland wird eine Stichprobe von 80
Personen vorgenommen. Hierbei stellte sich heraus, daß darunter 16 Mädchen waren.
a.
Gib ein 95,4%-Konfidenzintervall für den Anteil Mädchen in der Grundgesamtheit der
Studenten.
b.
Beantworte dieselbe Frage für eine Stichprobe von 800 Studenten mit 160 Mädchen.
Aufgabe 5
Die Varianz einer Normalverteilten Variable x beträgt 9. Um µ zu schätzen, werden wir eine
Stichprobe nehmen.
Wie groß muß der Umfang der Stichprobe n sein, um mit 95%iger Wahrscheinlichkeit für x
eine Abweichung in Bezug auf µ von höchstens 0,5 zu finden?
Errechnen Sie auch wie groß der Umfang der Stichprobe sein soll, wenn die
Grundgesamtheit 1.000 Elementen enthält.
Aufgabe 6
Zur Bestimmung des Kohlenmonoxydgehaltes eines Gasgemischs steht eine ziemlich
ungenaue Bestimmungsmethode zur Verfügung. Pro Probe kann das Ergebnis betrachtet
werden als Wahrscheinlichkeit x mit dem Erwartungswert µ % (Der Kohlenmonoxydgehalt
des Gasgemisches woraus die Proben entnommen werden) und einer Standardabweichung
von 4%. Gefragt ist ein 95%-Konfidenzintervall für den Kohlenmonoxydgehalt des
Gasgemisches, wobei der erlaubte Grenzwert 1% nach oben und nach unten ist.
Berechne dazu die Anzahl der benötigten Proben, um aufgrund des durchschnittlichen
Kohlenmonoxydgehaltes dieser Proben ein Konfidenzintervall von der geforderten Präzision
berechnen zu können. Errechnen Sie auch wie groß der Umfang der Stichprobe sein soll,
wenn die Grundgesamtheit 500 Elemente enthält.
Aufgabe 7
Eine Maschine füllt Päckchen mit Zucker. Die folgenden Gewichtseinheiten x werden von uns
festgestellt: 503, 496, 510, 504, 492, 495, 506, 495, 496, 503.
a.
Schätz die Varianz der Gewichtseinheiten.
b.
Berechne ein 90%-Konfidenzintervall für µ aufgrund der oben genannten Stichprobe,
falls wir annehmen, daß die Gewichtseinheiten x normalverteilt sind.
Aufgabe 8
Bei einem Versandhaus will man eine Schätzung machen von der durchschnittlichen
Zeitdauer von Telefongesprächen mit Kunden. Wir gehen davon aus, daß die
Gesprächsdauer t eine Zufallsvariable ist mit einer Normalverteilung. Für 9 Gespräche wird
als Zeitdauer gefunden (in Sekunden): 218, 225, 230, 240, 214, 202, 204, 195, 180.
Berechne ein 99%-Konfidenzintervall für µ : durchschnittliche Zeitdauer.
Aufgabe 9
Eine Variable x ist normalverteilt mit der Standardabweichung 10.
Wir prüfen H 0 : µ = 50 gegen H1 : µ > 50 .
a.
Berechne den kritischen Bereich, falls eine Feststellung gemacht wird bei der
Wahrscheinlichkeit auf einen 1.Fehler von α = 0,05 und auch bei α = 0,01
b.
Wir machen 100 Feststellungen von der diesbezüglichen Variable.
Berechne den kritischen Bereich bei α = 0,1 und α = 0,001 .
Aufgabe 10
In einem Laboratorium wird die Reinheit von einer bestimmten Lösung bestimmt. Das Gehalt
an Verunreinigungen darf höchstens 5% betragen. Die verwendete Bestimmungsmethode
hat, in Bezug auf den gemessenen Verunreinigungsgehalt x , pro Bestimmung eine
Ungenauigkeit die wiedergegeben werden kann durch eine Standardabweichung von 0,5%.
Es werden 10 Proben genommen, wobei die folgenden Anteile an Verunreinigungen
gefunden wurden: 5,2%, 6,3%, 4,8%, 5,0%, 4,6%, 5,8%, 5,3%, 6,0%, 4,5% und 5,3%.
Prüfe ob das Experiment überzeugend darstellt, daß der Gehalt an Verunreinigungen in der
Lösung mehr als 5% ist. Wähle α = 0,1, prüfe einseitig.
Aufgabe 11
Kapseln, die gefüllt sind mit einer bestimmten Medizin, müssen 5 mg wirksame Bestandteile
enthalten.
Es ist bekannt, daß durch Ungenauigkeiten der Maschine, mit der die Kapseln gefüllt werden,
die Menge wirksamer Bestandteile als eine normalverteilte Zufallsvariable x mit einem
Erwartungswert von 5,0 mg und einer Standardabweichung von 0,15 mg zu betrachten ist.
Die Einstellung der Maschine kann sich während dem Gebrauch verändern. Darum werden
regelmäßig einige Kapseln in einem Laboratorium überprüft. Eine Stichprobe unter 25
Kapseln ergibt ein durchschnittliches Gehalt an wirksamen Bestandteilen von 4,70 mg. Prüfe
ob hieraus entnommen werden kann, daß die Einstellung der Maschine verändert ist.
Prüfe hierbei zweiseitig, wähle α = 0,01 und geh davon aus, daß die Standardabweichung
unverändert ist.
Aufgabe 12
Ein Institut für Wirtschaftsuntersuchungen will untersuchen, wieviel Prozent eines
Familienein-kommens in Freizeitaktivitäten investiert wird. Für 8 willkürlich gewählte Familien
aus einer bestimmten Einkommensgruppe (unserer Bevölkerung) werden die folgenden
Prozentzahlen gefunden:
Familie
% Freizeitaktivitäten
a.
b.
17
1
12
2
13
3
14
4
10
5
18
6
16
7
20
8
Gib ein 95%-Konfidenzintervall für µ : der durchschnittliche Anteil an Freizeitausgaben
für die untersuchte Bevölkerung. Geh davon aus, daß die Prozentzahlen durch eine
(unbekannte) Normalverteilung beschrieben können werden.
Vorhergehende Untersuchungen zeigten, daß der Anteil an Freizeitausgaben µ
mindestens 21% ist. Prüfe, ob diese Aussage für die durch uns untersuchte Einkommensgruppe haltbar ist. Prüfe einseitig, wähle α = 0,05 .
Aufgabe 13
Nach den Richtlinien eines Ministeriums darf die durchschnittliche Anzahl eines bestimmten
Bakterientyps pro Probe eines französischen Käses höchstens 900 sein. Von einer großen
Lieferung werden 10 Proben genommen. Das Resultat der Untersuchung lautet wie folgt:
920, 960, 915, 910, 935, 965, 930, 970, 945 und 950.
Untersuche, ob diese Resultate anzeigen, daß der Qualitätsanforderung entsprochen ist.
Wähle α = 0,01 .
Aufgabe 14
Die Menge radioaktiver Spuren in einer Kiste Spinat ist als eine normalverteilte Zufallsvariable
x zu betrachten, mit einem Durchschnittswert von 50 RE (Radioaktive Einheiten). Die
Standardabweichung ist nicht bekannt. Nach einer Explosion in einem fernen Land werden
von 7 Kisten Spinat genau bestimmt wieviel RE’s gefunden wurden.
Es ergaben sich folgende Resultate (in RE): 80, 90, 86, 70, 92, 74 und 68.
Prüfe, ob die neuen Ergebnisse auf eine signifikante Erhöhung in Bezug auf das alte Niveau
hindeuten. Prüfe einseitig, wähle α = 0,05 .
Aufgabe 15
Bei einem Kenntnistest werden einem Kandidaten 10 (20; 50; 100) Fragen vorgelegt, die er
mit ja oder nein beantworten muß. Wieviele Fragen muß der Kandidat mindestens richtig
beantworten, damit man bei einem Signifikanzniveau von α = 0,05 davon ausgehen kann,
daß das richtige Beantworten auf Kenntnis und nicht auf Raten beruht?
Aufgabe 16
Bei einem Kenntnistest werden einem Kandidaten 10 (20; 50; 100) Fragen vorgelegt, wobei
es vier Antwortmöglichkeiten gibt. Eine Antwort ist nur richtig. Wieviele Fragen muß der
Kandidat mindestens richtig beantworten, damit man bei einem Signifikanzniveau von
α = 0,10 davon ausgehen kann, daß das richtige Beantworten auf Kenntnis und nicht auf
Raten beruht?
Aufgabe 17
Der Hersteller des Haarwuchsmittels "Glatzkopf" versichert, daß sein Produkt in mehr als
60% aller Fälle wirksam ist. Zur Überprüfung dieser Behauptung wird das Haarwuchsmittel
von einem Forschungsinstitut durch eine Zufallsstichprobe an 100 glatzköpfigen Personen
getestet.
a.
Entwickle für das Forschungsinstitut ein Entscheidungsverfahren, so
daß lediglich mit einer Wahrscheinlichkeit von 5% dem Haarwuchsmit-
telhersteller zu Unrecht irreführende Werbung vorgeworfen wird.
b.
Wie wird entschieden, wenn das Mittel bei 50 von den 100 Personen wirksam ist?
Aufgabe 18
a.
b.
c.
Die Zeit, die Herr Slaats benötigt, um mit dem Rad zur Fachhochschule zu fahren,
nähert sich einer Normalverteilung.
Die letzten zwei Wochen benötigte er folgende Zeiten:
12, 15, 14, 17, 16, 14, 15, 17, 15 und 15 Minuten.
Errechnen Sie ein 99%-Konfidenzintervall für die Reisezeit.
Geben Sie die Lösung bis auf 2 Nachkommastellen an.
Nach einem Jahr hat sich ergeben, daß die benötigte Zeit sich einer Normalverteilung
nähert mit µ = 15 Minuten und σ = 1,5 Minuten.
Herr Slaats hat sich ein neues Rad gekauft und möchte untersuchen, ob sich die
Reisezeit verringert hat. Die Ergebnisse waren 13, 14, 15, 11, 16, 13, 12, 16 und 14
Minuten.
Kontrollieren Sie, ob sich die Reisezeit verringert hat. Nehmen Sie für α = 0,025 .
In dem vergangenen Jahr bestanden 68% die MS2B_D-Klausur. Herr Slaats möchte
aufgrund einer Stichprobe ein 99%-Konfidenzintervall erstellen mit einer Breite von
10% von dem Anteil der Studenten, die diese MS2B_D nicht bestehen.
Errechnen Sie, wie groß die Stichprobe mindestens sein soll.
Aufgabe 19
a.
b.
c.
Herr Slaats fährt noch immer mit seinem Rad zur Fachhochschule. Er nimmt jetzt
aber einen schöneren, aber auch längeren Weg. Die Zeit, die Herr Slaats benötigt, um
mit dem Rad zur Fachhochschule zu fahren, nähert sich einer Normalverteilung. Herr
Slaats geht davon aus, daß die Standardabweichung sich nicht verändert hat und
noch immer 1,5 Minuten ist.
Die letzten drei Wochen benötigte er folgende Zeiten:
14, 17, 16, 17, 19, 17, 19, 16, 18, 17, 14, 19, 18, 16, 18 und 17 Minuten.
Errechnen Sie ein 95%-Konfidenzintervall für die Reisezeit.
Geben Sie die Lösung bis auf 3 Nachkommastellen an.
Nach einem Jahr hat sich ergeben, daß die benötigte Zeit sich einer Normalverteilung
nähert mit xµ = 17 Minuten und σ = 1,5 Minuten. Auf der Strecke, die Herr Slaats
immer fährt, hat man aber eine zusätzliche Ampel hingestellt. Herr Slaats möchte
untersuchen, ob die Reisezeit sich erhöht hat. Er geht davon aus, daß die
Standardabweichung sich ganz bestimmt geändert hat.
Die Ergebnisse waren 20, 16, 18, 20, 19, 15, 17, 18 und 19 Minuten.
Kontrollieren Sie, ob sich die Reisezeit erhöht hat. Nehmen Sie für α = 0,05 .
In dem vergangenen Jahr bestanden 25% die MS2B_D-Wiederholungsklausur nicht.
Herr Slaats möchte aufgrund einer Stichprobe ein 95%-Konfidenzintervall erstellen
mit einer Abweichung von 10% von dem Anteil der Studenten, die diese MS2B_DWiederholungsklausur nicht bestehen.
Errechnen Sie, wie groß die Stichprobe mindestens sein soll.
Aufgabe 20
a.
b.
Die Zeit, die Herr Slaats benötigt, um eine beliebig gewählte Klausur zu korrigieren,
nähert sich einer Normalverteilung. Herr Slaats hat einige Klausuren korrigiert. Das
ergab folgende Korrekturzeiten: 5, 12, 14, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 17,
17, 18 und 22 Minuten.
Errechnen Sie ein 95%-Konfidenzintervall für die Korrekturzeit.
Geben Sie die Lösung bis auf 2 Nachkommastellen an.
Nach der Korrektur von 100 Klausuren ergab sich, daß sich die benötigte Korrekturzeit einer Normalverteilung nähert mit einem Mittelwert von 15 Minuten und einer
c.
Standardabweichung von 3,2 Minuten.
Nach der Korrektur von 100 Klausuren hat sich Herr Slaats einerseits in die Materie
eingearbeitet und korrigiert schneller, andererseits wird er müde und fängt an, Fehler
zu machen, die dann wieder verbessert werden müssen.
Für die letzten Klausuren benötigt er folgende Korrekturzeiten: 6, 10, 10, 12, 12, 12,
13, 13, 13, 14, 14, 14, 15, 18, 18 und 20.
Errechnen Sie, ob sich die Korrekturzeit geändert hat. Nehmen Sie für α = 0,05 .
Herr Slaats möchte aufgrund einer Stichprobe ein 75%-Konfidenzintervall mit einer
Breite von 30% erstellen, von jenem Anteil Studenten, die die Klausur bestanden
haben.
Errechnen Sie, wie groß die Stichprobe mindestens sein muß.
Aufgabe 21
a.
b.
c.
Die Zeit, die Herr Slaats benötigt, um eine beliebig gewählte Wiederholungsklausur zu
korrigieren, nähert sich einer Normalverteilung. Herr Slaats geht davon aus daß die
Standardabweichung sich nicht geändert hat und also die gleiche ist wie bei der
Klausur, nämlich, 3,2 Minuten.
Herr Slaats hat einige Wiederholungsklausuren korrigiert, und das ergab folgende
Korrekturzeiten: 12, 14, 14, 15, 15, 15, 16, 16, 18, 18, 18, 18, 19, 19 und 29 Minuten.
Errechnen Sie einen 99%-Konfidenzintervall für die Korrekturzeit.
Geben Sie die Lösung bis auf 2 Nachkommastellen.
Nach der Korrektur von vielen Wiederholungsklausuren hat sich ergeben, daß sich
die benötigte Zeit einer Normalverteilung nähert mit µ = 17 und σ = 3,2 . Die letzten
Wiederholungsklausuren sind zufällig Wiederholungsklausuren von Studenten aus
dem dritten Jahr. Herr Slaats möchte untersuchen, ob die Korrekturzeit für diese
Klausuren geringer ist.
Er geht davon aus, daß die Standardabweichung sich ganz bestimmt geändert hat.
Die Korrekturzeiten waren: 13, 14, 15, 16, 16, 17, 17, 18 und 18 Minuten.
Kontrollieren Sie, ob sich die Korrekturzeit verringert hat. Nehmen Sie für α = 0,10 .
In vergangenen Jahr bestanden 70% der Studierenden die Wiederholungsklausur.
Herr Slaats möchte aufgrund einer Stichprobe ein 90%-Konfidenzintervall erstellen
mit einer Abweichung von 5% von dem Anteil der Studenten, die diese
Wiederholungsklausur bestehen.
Errechnen Sie, wie groß die Stichprobe mindestens sein muß.
Aufgabe 22
a.
b.
Der Manager eines wirschaftlichen Beratungsbüros möchte, daß seine Angestellten während der Arbeitszeit einen Computerkurs belegen, um die neuesten
Computerprogramme beherrschen zu lernen. In der nachstehenden Tabelle stehen die von einigen Angestellten benötigten Stunden, die sie gebraucht haben,
um sich das Computerprogramm anzueignen.
Benötigte Stunden: 36, 56, 52, 50, 48, 50, 46, 44, 50, 52, 50, 36, 50, 52, 48, 50
und 46.
Errechnen Sie 95% Konfindenzintervall für die benötigte Anzahl Stunden.
Geben Sie die Lösung bis auf 2 Nachkommastellen.
Das Büro, daß den Computerkurs anbietet, behauptet, daß die benötigte Zeit, die ein
Angestellter mit einer BW-Ausbilding benötigt, sich einer Normalverteilung nähert mit
einem Mittelwert von 50 Stunden und einer Standardabweichung von 6 Stunden.
Von einigen Angestellten mit einer AW-Ausbildung sind folgende benötigte
Zeiten bekannt: 48, 57, 58, 56, 59, 53, 56, 55 und 44.
Der Manager des Beratungsbüros behauptet, daß die benötigte Zeit, die diese
Angestellten benötigen mehr ist als die der Angestellten mit einer BWAusbildung. Die Standardabweichung ist in beiden Fällen gleich groß.
c.
Errechnen Sie, ob diese Behauptung stimmt. Nehmen Sie für α = 0,05 .
Der Manager möchte mit einer Wahrscheinlichkeit von 95% errechnen, wie groß der
Umfang der Stichprobe sein muß, so daß die Abweichung zum Mittelwert höchstens
2 Stunden beträgt. Siehe auch Aufgabe a. Nehmen Sie für σ = 28 .
Aufgabe 23
a.
b.
c.
Die Zeit, die ein Angestellter mit einer AW-Ausbildung benötigt, um sich ein Computer-programm anzueignen, nähert sich einer Normalverteilung mit einer Standardabweichung von 6 Stunden. Die von einigen Angestellten mit einer AW-Ausbildung benötigte Zeit ist bekannt: 47, 56, 57, 55, 43, 54, 55, 52 und 58 Stunden.
Errechnen Sie ein 99% Konfidenzintervall für die benötigte Zeit.
Geben Sie die Lösung bis auf 2 Nachkommastellen.
Der Manager möchte mit einer Wahrscheinlichkeit von 99% errechnen, wie groß der
Umfang der Stichprobe sein soll, so daß die Breite des Konfidenzintervalls höchstens
5 Stunden beträgt. Siehe auch Aufgabe a.
Nach einiger Zeit ergibt sich, daß sich die benötigte Zeit einer Normalverteilung mit
einem Mittelwert von 52 Stunden und einer Standardabweichung von 6 Stunden nähert. Der Manager findet beide Werte zu hoch und mietet zur Unterstützung der Angestellten einen Dozenten der FHV ein. Der Manager geht davon aus, daß beide
Werte sich jetzt verringern.
Von einigen Angestellten, die von dem Dozenten unterstützt wurden, sind folgende
Zeiten bekannt: 42, 57, 48, 45, 42, 54, 51, 45 und 48 Stunden.
Errechnen Sie, ob sich die benötigte Zeit tatsächlich verringert hat. Nehmen Sie für
α = 0,05 .
Aufgabe 24
Auf der Autobahnstrecke Venlo - Köln hat man registriert wieviele Unfälle stattgefunden
haben. Innerhalb einer Periode von 50 Wochen fanden 832 Unfälle statt. Gehen Sie davon
aus, daß die Anzahl Unfälle pro Woche annäherungsweise durch eine Poissonverteilung mit
unbekannten λ dargestellt werden kann (und daß dieses λ für alle Wochen des Jahres gleich
groß ist).
Errechnen Sie ein 95%-Konfidenzintervall für λ .
Herunterladen