Beispiel 5 - Hochschule Esslingen

Werbung
Statistik
5. Beurteilende Statistik
5. Beurteilende Statistik
5.1. Einführung - Grundprobleme
Anhand der Beispiele 1 und 2 werden zwei typische Fragestellungen der beurteilenden
Statistik deutlich.
Beispiel 1 führt auf das Problem der Parameterschätzung (Punktschätzung) und der
Konfidenzintervalle (Vertrauensintervalle).
Beispiel 1
Aus 50 Messwerten ergaben sich für die Reißfestigkeit einer Garnsorte der arithmetische
Mittelwert x  21,45 N und die empirische Standardabweichung s  0,47 N.
Jede andere Stichprobe vom gleichen Umfang würde sicher etwas andere Werte liefern.
x und s sind also nur Näherungswerte für Erwartungswert  und Standardabweichung  der
entsprechenden Grundgesamtheit.
Wie erhält man Aussagen über die Güte dieser Näherungen?
Beispiel 2 ist typisch für das Testen von Hypothesen.
Beispiel 2
Zur Überprüfung der Symmetrie eines Würfels wurde er 6000-mal geworfen; das Ergebnis
dieses Würfeltests ist in einer Häufigkeitstabelle zusammengefasst
xi
1
2
3
4
5
6
n ( xi )
1076
1008
992
1059
923
942
Man sieht sofort, dass die hohen Augenzahlen 5 und 6 seltener auftreten als die niedrigen
Zahlen 1 und 2. Berechnet man den Mittelwert, so ergibt sich aus diesen Daten x  3,4285 .
Wie sind diese Unsymmetrie und die Abweichung des Mittelwerts vom Erwartungswert
  3,5 zu erklären? Handelt es sich um eine zufällige Abweichung bei einem idealen Würfel
oder besteht auf Grund der beobachteten Häufigkeiten Anlass zu einem Zweifel an der
Symmetrie des Würfels?
In beiden Fällen erkennt man das Grundproblem der beurteilenden Statistik:
Welche Schlüsse kann man von einer Stichprobe auf die zugehörige Grundgesamtheit
ziehen, und wie zuverlässig sind derartige Schlüsse?
109
Statistik
5. Beurteilende Statistik
5.2. Bemerkungen zur Stichprobenauswahl
Um subjektive Einflussmöglichkeiten auszuschließen, müssen Stichproben repräsentativ
sein. Die Stichprobe in Beispiel 1 muss eine Zufallsauswahl darstellen, alle Elemente der
Grundgesamtheit müssen
unabhängig voneinander
mit der gleichen Wahrscheinlichkeit
in die Stichprobe kommen.
Beim zufälligen Ziehen mit Zurücklegen sind diese Voraussetzungen erfüllt. Soll etwa die
Lebensdauer von Glühbirnen einer bestimmten Serie untersucht werden, so ist dabei ein
Entnehmen mit Zurücklegen prinzipiell nicht möglich. Bei sehr umfangreichen Grundmengen
wirkt sich der Unterschied bei den Ziehungen mit bzw. ohne Zurücklegen praktisch nicht aus,
so dass obige Voraussetzungen auch bei derartigen Problemen getroffen werden können.
Will man etwa n aus N Gegenständen zufällig auswählen, so könnte man die N Elemente der
Grundgesamtheit nummerieren und aus einer Urne mit den Zahlen 1 bis N n Zahlen zufällig
ziehen. Statt der Urne benutzt man einfacher eine Tabelle von (gleichmäßig verteilten)
Zufallszahlen.
Auszug aus einer Tabelle mit vierstelligen Zufallszahlen
3393
6270
4228
6069
9407
1865
8549
3217
2351
8410
9108
2330
2157
7416
0398
6173
1703
8132
9065
6717
7891
3590
2502
5945
3402
0491
4328
2365
6175
7695
9085
6307
6910
9174
1753
1797
9229
3422
9861
8357
2638
2908
6368
0398
5495
3283
0031
5955
6544
3883
1313
8338
0623
8600
4950
5414
7131
0134
7241
0651
3897
4202
3814
3505
1599
1649
2784
1994
5775
1406
4380
9543
1646
2850
8415
9120
8062
2421
6161
4634
1618
6309
7909
0874
0401
4301
4517
9197
3350
0434
4858
4676
7363
9141
6133
0549
1972
3461
7116
1496
110
Statistik
5. Beurteilende Statistik
Regeln:
1. Wahl eines beliebigen Startpunkts in der Tabelle
2. entweder horizontal oder vertikal aufeinanderfolgende Zufallszahlen aufschreiben
Je nach Umfang n der Grundgesamtheit k-stellige Zahlen entnehmen mit N  10
k
(von der letzten Stelle der gegebenen Zahl ausgehend)
3. Zahlen > N und doppelt auftretende Zahlen weglassen.
Beispiel 3
Aus 80 Elementen soll eine Stichprobe vom Umfang 8 gezogen werden (mit Hilfe der
Zufallszahlen-Tabelle)
Lösung:
Wahl von Startpunkt und Richtung: z.B. Zeile 3, Spalte 4; horizontal
→
→
5945 3402 0491 4328 2365 6175 7695 9085 6307 6910 9174 1753 . . .
45
2
91
28
65
75
95
85
7
10
74
53
Ergebnis: Zufallsstichprobe vom Umfang 8 aus 80 Elementen
45, 2, 28, 65, 75, 7, 10, 74, 53
Bemerkungen:
1. Neben reinen Zufallszahlen spielen in der praktischen Anwendung Pseudozufallszahlen
eine immer größere Rolle. Diese Zahlen sind keine „echten“ Zufallszahlen; sie werden
durch Rechenprogramme erzeugt und weisen damit eine Periodizität auf. Sie haben jedoch
den großen Vorteil, dass sie beim Einsatz von Rechnern unmittelbar vom Computer
„geliefert“ werden können.
2. Zufallszahlen und Pseudozufallszahlen kommen auch bei der näherungsweisen Lösung
komplizierter deterministischer Probleme zur Anwendung. (Monte-Carlo-Methoden →
Literatur)
3. Neben uneingeschränkter Zufallsauswahl sei auf weiter Auswahlverfahren wie
Schichten- Quoten- und Klumpen-Auswahl (→ Kapitel 1) verwiesen.
111
Statistik
5.3.
5. Beurteilende Statistik
Statistische Schätzverfahren
Die Aufgabenstellung von Schätzverfahren ist die Schätzung unbekannter Parameter oder der
unbekannten Verteilung einer Grundgesamtheit aus den Werten einer Stichprobe. Im
Folgenden wird nur auf die Parameterschätzung eingegangen. Man unterscheidet zwischen
Punktschätzungen: Hierbei wird für den zu schätzenden Parameter ein einzelner Wert
bestimmt
und
Intervallschätzungen: Dabei wird ein Intervall bestimmt, das den wahren, unbekannten Wert
des Parameters mit einer vorgegebenen Wahrscheinlichkeit überdeckt
5.3.1. Punktschätzung und Schätzfunktionen
Häufig ist der Verteilungstyp der Zufallsvariablen im voraus bekannt; aus der Stichprobe
müssen dann nur noch die charakteristischen Parameter geschätzt werden.
Zufallsvariable
Verteilung
zu schätzende Parameter u
Messfehler
Produktionsfehler
...
Normalverteilung
,

Bernoulli-Schema
(Erfolg – Misserfolg)
Binomialverteilung
p
( bzw.   n  p )
seltene Ereignisse
Poissonverteilung

Die Schätzung dieser Parameter erfolgt stets mit Hilfe einer Stichprobe: aus n beobachteten
Werten x , x , . . . x
1
2
n
wird ein Schätzwert û für den zu schätzenden Parameter u der
zugrundeliegenden Zufallsvariablen X ermittelt. Die einzelnen Stichprobenwerte hängen
vom Zufall ab, sie sind Werte der Zufallsvariablen X 1 , X 2 , . . . X n , die alle identisch
verteilt sind wie X ; damit ist natürlich auch der aus einer bestimmten Stichprobe ermittelte
Wert û ein Wert einer Zufallsvariablen Û
(1)
Uˆ  g ( X 1 , X 2 , . . . X n )
Die Funktion g heißt Schätzfunktion für den Parameter u .
112
Statistik
5. Beurteilende Statistik
Geeignete Schätzwerte für den Erwartungswert  und die Varianz  sind der arithmetische
2
Mittelwert x und die empirische Varianz s (s. Kapitel 2):
  x 
(2)
 2  s2 
(3)
Beispiel 4
1
n
n

i 1
1
n 1
xi
n
 ( xi  x )2
i 1
Simulation eines Würfels - Schätzung des Erwartungswertes
Entnehmen Sie der Zufallszahlen-Tafel auf Seite 110 geeignete Stichproben vom
Umfang 10 und bestimmen Sie Näherungen für den Erwartungswert 
Lösung:
a)
1. Zeile, 3. Spalte, hor.:
5, 1, 6, 3, 3, 2, 5, 1, 2, 5
x  3,3
b)
1. Zeile, 3. Spalte, vert.:
2, 3, 4, 6, 3, 6, 5, 4, 5, 4
x  4,2
c)
4. Zeile, 2. Spalte, hor.:
4, 3, 2, 1, 5, 3, 1, 5, 4, 3
x3  3,1
d)
6. Zeile, 1. Spalte, vert.:
3, 2, 3, 6, 2, 3, 4, 6, 3, 6
x  3,8
1
2
4
Die Ergebnisse streuen alle um den Erwartungswert   3,5 . Die Streuung dieser
arithmetischen Mittelwerte ist aber geringer als die Streuung der Werte der Zufallsvariablen
„Augenzahlen eines idealen Würfels“; man wird erwarten, dass diese Streuung mit
wachsendem Stichprobenumfang immer kleiner wird.
Vergleiche hierzu auch Beispiel 20 auf Seite 92
113
Statistik
5. Beurteilende Statistik
Eine Schätzfunktion g für den Parameter u ist sicher nur dann sinnvoll, wenn die Werte der
Zufallsvariablen Û um den zu schätzenden Parameter u der Grundgesamtheit streuen; man
wird verlangen, dass der Erwartungswert von Û mit u übereinstimmt.
Definition Erwartungstreue Schätzfunktion
Eine Schätzfunktion g ( x , x , . . . x ) für den Parameter u heißt erwartungstreu, wenn
1
2
n
für die zugehörige Zufallsvariable gilt
(4)
E [ g( X 1, X 2 , . . . X n ) ]  u
Erwartungstreue einer Schätzfunktion allein ist aber sicher zu wenig. Man fordert zusätzlich:
Û streut möglichst wenig um u
(5)
(Streuung von Û ) → 0
. . . Wirksamkeit
für n → 
. . . Konsistenz
Auf diese beiden Eigenschaften soll hier aber nicht weiter eingegangen werden.
Von Bedeutung für die Parameterschätzung sind die folgenden Sätze:
Satz 1 Das arithmetische Mittel aus n Beobachtungen der Zufallsvariablen X
(6)
x 
1
1 n
( x1  x2  . . .  xn )   xi
n
n i 1
ist eine erwartungstreue Schätzfunktion für den Erwartungswert   E ( X ) .
2
Satz 2 Hat eine Zufallsvariable X die Varianz  , so hat der Stichprobenmittelwert
1
X   X i die Varianz
n
(7)
Satz 3
(8)
E [( X   ) ] 
2
2
n
Die empirische Varianz aus n Beobachtungen der Zufallsvariablen X
1
s 
n 1
2
n
 ( xi  x ) 2
i 1
ist eine erwartungstreue Schätzfunktion für die Varianz 
114
2
 Var ( X ) .
Statistik
5. Beurteilende Statistik
Beweis von Satz 1
Man betrachtet die zugehörige Zufallsvariable, das Stichproben-Mittel
X 
1
( X1  X 2  . . .  X n )
n
Für den Erwartungswert von X erhält man wegen der Linearität des ErwartungswertOperators (s. Abschnitt 4.2.4) und mit E ( X )  
i
E( X )  E [
1
n
 Xi ]

1
1
E[  Xi ] 
n
n
 [ E ( X i )]

1
n  
n
Bemerkung zu Satz 2
Der Beweis von (7) erfolgt unmittelbar mit den Eigenschaften (46) aus Kapitel 4.5.
1
1
1
2
2
Var( X )  Var(  X i )  2 Var( X i )  2 n   
n
n
n
n
Satz 2 bestätigt die anschaulich einleuchtende Tatsache, dass das Stichprobenmittel weniger
streut als die zugehörige Zufallsvariable (vgl. auch Beispiel 4 und Beispiel 20 aus Kap. 4).
Aus (7) folgt auch sofort die Konsistenz der Schätzfunktion (6).
Bemerkung zu Satz 3
Würde man in (8) den Faktor
1
1
durch den Faktor
ersetzen, so ergäbe sich für diese
n 1
n
1
2
Schätzfunktion der Erwartungswert (1  )   ; diese Schätzfunktion wäre nicht
n
erwartungstreu, sondern negativ verzerrt. Vor allem bei kleinen Stichproben würde die
Varianz damit systematisch unterschätzt. Dies ist auch der Grund für die zunächst etwas
merkwürdig erscheinende Definition der empirischen Varianz in Kapitel 2 .
Methoden zur Konstruktion von Schätzfunktionen sind:

Maximum-Likelihood-Schätzung ( Methode der maximalen Mutmaßlichkeit)

Kleinste-Quadrate-Schätzung
(→ Literatur)
115
Statistik
5. Beurteilende Statistik
5.3.2. Konfidenzintervalle
5.3.2.1. Problemstellung und Bezeichnungen
Die Parameterschätzungen aus 5.3. sind Punktschätzungen mit begrenztem Aussagewert; sie
sagen nichts darüber aus, wie groß die Wahrscheinlichkeit ist, dass der zu schätzende wahre
Grundgesamtheitsparameter in der Nähe der Punktschätzung liegt. Um eine Vorstellung über
die Genauigkeit einer Schätzung zu bekommen, kann man zu Intervallschätzungen übergehen.
Bei der näherungsweisen Bestimmung von Nullstellen wird die Genauigkeit häufig
angegeben durch Fehlerschranken; so bedeutet die Angabe x  1,76  0,03 dass die
0
Nullstelle x mit Sicherheit im Intervall 1,73  x  1,79 liegt.
0
In der Statistik gibt es solche sicheren Schlüsse aus einer Stichprobe auf die Grundgesamtheit nicht: man kann zu einem Schätzwert û kein (kleines) Intervall [ Uˆ 1 , Uˆ 2 ] angeben,
das den unbekannten Parameter u der Zufallsvariablen mit Sicherheit überdeckt; man kann
nur, abhängig von der Wahrscheinlichkeitsverteilung von X , gewisse Wahrscheinlichkeitsaussagen machen.
Man kann etwa nach einem Intervall [ Uˆ 1 , Uˆ 2 ] fragen, das den gesuchten Parameter u mit
einer vorgegebenen Wahrscheinlichkeit  enthält:
(9)
P ( Uˆ 1  u  Uˆ 2 )  
Die Schranken Uˆ 1 , Uˆ 2 hängen dabei sicher ab von der verwendeten Stichprobe, sind also
selbst Zufallsvariablen.
Kennt man Formeln zur Berechnung von Uˆ 1 , Uˆ 2 aus einer gegebenen Stichprobe, so nennt
man das Intervall [ Uˆ 1 , Uˆ 2 ] ein Konfidenzintervall oder Vertrauensintervall für den
unbekannten Parameter u zur Konfidenzzahl ( Konfidenzniveau, Vertrauenswahrscheinlichkeit, statistische Sicherheit )  ; die Wahrscheinlichkeit   1   heißt
Irrtumswahrscheinlichkeit.
Die Konfidenzzahl   1   ist die Wahrscheinlichkeit dafür, dass das Zufallsintervall
[ Uˆ 1 , Uˆ 2 ] den unbekannten Parameter u überdeckt. Anders ausgedrückt: in 100   % aller
prinzipiell möglichen Stichproben gleichen Umfangs ergeben sich Konfidenzintervalle, die
den Parameter u enthalten, in 100   % aller Stichproben ergeben sich Konfidenzintervalle,
116
Statistik
5. Beurteilende Statistik
die u nicht enthalten. Vertrauenswahrscheinlichkeit  bzw. Irrtumswahrscheinlichkeit  sind
vor Beginn der Schätzung entsprechend der Problemstellung festzulegen; häufig verwendete
Werte sind
  0,9 ; 0,95 ; 0,99 ; 0,999
bzw.
  0,1; 0,05 ; 0,01; 0,001
Dass ein Konfidenzintervall ein Zufallsintervall (Intervall, dessen Grenzen Zufallsvariable
sind) ist, veranschaulicht die folgende Abbildung:
117
Statistik
5. Beurteilende Statistik
5.3.2.2. Konfidenzintervalle für den Erwartungswert einer Normalverteilung bei bekannter
Varianz
2
Satz 4 Sei X eine N (  ;  )  verteilte Zufallsvariable. Dann ist das Stichprobenmittel
n
1
X
n
 Xi
eine N (  ;
i 1
2
n
)  verteilte Zufallsvariable.
Anschaulich bedeutet das, dass alle aus Stichproben vom Umfang n ermittelten
2

arithmetischen Mittelwerte normalverteilt sind mit Erwartungswert  und Varianz
.
n
Man sucht nun ausgehend von einer Stichprobe vom Umfang n ein symmetrisch zu x
gelegenes Intervall, das mit vorgegebener Wahrscheinlichkeit  den tatsächlichen
(unbekannten) Erwartungswert  der Grundgesamtheit enthält. Durch Standardisierung der
Variablen lässt es sich dabei wieder erreichen, dass alle erforderlichen Berechnungen an einer
N ( 0 ; 1)  verteilten Zufallsvariablen durchgeführt werden können.
Nach Satz 4 ist X N (  ;

2
n
)  verteilt;
dann ist die standardisierte Variable Z 
X 

 n
N ( 0 ; 1)  verteilt.
Zur Konfidenzzahl  bestimmt man für die Variable Z Intervallgrenzen  c aus der
Bedingung
(10)
  P( c  Z  c)  (c)  ( c)  2(c)  1
mit Hilfe der (z )  Tabelle. Für praktisch wichtige Fälle von  erhält man folgende cWerte

0,90
0,95
0,99
0,999
c
1,645
1,960
2,576
3,291
(11)
Die Ungleichung für Z in Gleichung (10) wird in eine Ungleichung für  umgeformt:
c  Z c

 a  X   a
c 

X 

 n  c
|
a    X  a
118

n
mit
a  c

n
Statistik
5. Beurteilende Statistik
Daraus folgt schließlich die Ungleichung
X a    X a
(12)
Die Bedingung (10) für das Konfidenzintervall ist also äquivalent zur Gleichung
P( X  a    X  a )  
(13)
a  c
mit

n
;
das heißt: mit der Wahrscheinlichkeit  nehmen die Zufallsvariablen Uˆ 1  X  a und
Uˆ 2  X  a Werte an, die den unbekannten Erwartungswert  einschließen. Der aus der
Stichprobe ermittelte Wert x ist eine Realisierung der Zufallsvariablen X ; setzt man diesen
Wert x in (12) ein, so erhält man ein konkretes Konfidenzintervall
(14)
x a
   x  a
mit a  c 

n
( c abhängig von  gemäß (10) )
Zusammenfassung: Konfidenzintervall für  bei gegebener Varianz 
2
(Normalverteilung)
1. Stichprobe liefert n; x
2. Zur gegebenen Konfidenzzahl

bestimmt man c gemäß Gleichung (10)
3. Die halbe Länge des Konfidenzintervalls ist a  c 
4. Damit ist das gesuchte Konfidenzintervall
x a

n
   x  a
Beispiel 5
Bei einer Abfüllmaschine für 0,5-Liter-Flaschen ist die Abfüllmenge normalverteilt mit einem
unbekannten, von der Maschineneinstellung abhängigen Mittelwert  und der praktisch
3
konstanten Standardabweichung   10 cm . Bei n  75 zufällig ausgewählten Flaschen
3
wird der arithmetische Mittelwert x  495 cm bestimmt. Gesucht ist ein 95%Konfidenzintervall für den Erwartungswert  .
119
Statistik
5. Beurteilende Statistik
Lösung:
3
1.
n  75 ; x  495 cm
2.
  0,95  c  1,960
3.
a  c
4.
Konfidenzintervall

n

1,96  10
75
 2,26 cm3
 492,74 cm
3
   497,26 cm
3

 0,95
5.3.2.3. Konfidenzintervalle für eine Wahrscheinlichkeit p (Binomialverteilung)
Bei n-maliger Durchführung eines Bernoulli-Experiments ist die Variable X = Anzahl der
Erfolge bei n Versuchen binomialverteilt mit
E ( X )   B  n  p und Var ( X )   B2  n  p  (1  p )
(15)
Die zugehörige standardisierte Zufallsvariable
Z 
(16)
X  B
B

X n p
n  p  (1  p )
ist nach dem deMoivre-Lapace-Grenzwertsatz für große n näherungsweise N ( 0 ; 1)  verteilt.
Zur Konfidenzzahl  bestimmt man wie in 5.4.2 für die Variable Z Intervallgrenzen  c aus
der Bedingung
  P( c  Z  c)  (c)  ( c)  2(c)  1
(17)
mit Hilfe der (z )  Tabelle; die Werte aus (11) können also direkt übernommen werden.
Die Ungleichung für Z wird umgeformt in eine Ungleichung für p:
(18)
c 
X n p
 c
n  p  (1  p )

X  n  p  c  n  p  (1  p )
Quadrieren und umformen führt auf die quadratische Ungleichung für p
(n  c 2 )  p 2  (2 X  c 2 )  p 
X2
 0
n
120
Statistik
5. Beurteilende Statistik
Aus der zugehörigen quadratischen Gleichung ergeben sich die Werte
(19)
p1,2 
1
n  c2
 
c2 
X (n  X ) c 2
   X    c 

2
n
4
 




Für alle Werte von p zwischen diesen beiden Werten gilt die Ungleichung (18) und damit
auch die Bedingung (17).
Die in einer Stichprobe vom Umfang n beobachtete Zahl k der Erfolge ist eine Realisierung
der Zufallsvariablen X . Aus (19) erhält man für X  k eine Realisierung der Grenzen des
gesuchten Intervalls
(20)
p1,2 
1
n  c2

c2 
k (n  k ) c 2

   k    c 

2
n
4








Sind n, k, n – k groß, dann kann man in (20) folgende Näherungen einführen
n  c ;
2
k  c ;
2
k (n  k )
c2
 h  (1  h )  n 
n
4
und erhält so als Näherung für das gesuchte Konfidenzintervall
(21)
k
k

 a  p  a 
n
n

Dabei ist die relative Häufigkeit h 
mit a 
c k (n  k )
h(1  h)

 c
n
n
n
k
ein Schätzwert für die unbekannte
n
Wahrscheinlichkeit p.
121
Statistik
5. Beurteilende Statistik
Zusammenfassung:
Konfidenzintervall für p
1. Stichprobe liefert n und k , bzw. h 
k
n
2. Zur gegebenen Konfidenzzahl  bestimmt man c gemäß Gleichung (17)
3. Die halbe Länge des Konfidenzintervalls ist
a 
c k (n  k )
h(1  h)

 c
n
n
n
4. Damit ist das gesuchte Konfidenzintervall
h a
 p  h  a
h
mit
(bzw. genauer: Intervall mit den Grenzen p , p
1
2
k
n
gemäß (20) )
Beispiel 6 zeigt eine wichtige Anwendung dieses Verfahrens zur Schätzung des Anteilswerts
einer Grundgesamtheit.
Beispiel 6
Eine Zufallsstichprobe an einer Hochschule vom Umfang n = 400 enthält 120 Studentinnen.
In welchen Grenzen liegt der unbekannte Anteilswert weiblicher Studierender in der
Grundgesamtheit aller Studierenden bei einem Konfidenzniveau von 90 %.
Lösung:
1.
n = 400 ;
k =120 ;
h = 0,3
2.
  0,90  c  1,645
3.
a  1,645 
4.
Konfidenzintervall
0,3  0,7
400
 0,038 (gerundet)
 0,262
 p  0,338
 0,90
mit einer Wahrscheinlichkeit von 90% (schlampig: mit 90% Sicherheit) liegt der Anteil
weiblicher Studierender zwischen 26,2 und 33,8 %.
122
Statistik
5. Beurteilende Statistik
5.3.2.4. Länge des Konfidenzintervalls
Die Länge L des Konfidenzintervalls ist ein Maß für die Genauigkeit der Schätzung; sie
hängt sowohl vom Stichprobenumfang n wie auch von der gewählten Vertrauenszahl 
bzw. von c ab.
Im Falle der Schätzung des Erwartungswertes  einer normalverteilten Zufallsvariablen
erhält man aus (14)
(22)
2c 
,
n
L  2a 
im Falle der Schätzung der Wahrscheinlichkeit p (Schätzung des Anteilswerts) folgt aus (21)
(23)
2 c h (1  h )
n
L  2a 
In beiden Fällen ist also
(24)
L ~
c
n
;
c wächst monoton mit 
Um L zu halbieren, d.h. die Genauigkeit zu verdoppeln, muss man (bei gleicher
Vertrauenszahl  ) den Stichprobenumfang vervierfachen.
Wegen L  0 für n   werden die Aussagen (14) und (21) mit wachsendem n zwar
genauer, aber nicht sicherer. Damit die Aussagen sicherer werden, muss man 
vergrößern; mit  wird c größer, damit wächst aber auch die Länge L .
Will man die Sicherheit der Schätzung vergrößern, so nimmt bei gleichem
Stichprobenumfang die Genauigkeit ab, die Länge des Vertrauensintervalls nimmt zu.
123
Statistik
5. Beurteilende Statistik
Beispiel 7
Im Rahmen einer Marktanalyse interessiert sich ein Unternehmen für den Bekanntheitsgrad
eines seiner Produkte. Eine Umfrage unter 400 zufällig ausgewählten Hausfrauen ergab, dass
132 von ihnen das Produkt kannten.
a) Gesucht ist ein Konfidenzintervall, das den wahren Bekanntheitsgrad des Produkts
unter allen Hausfrauen mit einer Vertrauenswahrscheinlichkeit von 95% überdeckt.
b) Wie viele Hausfrauen müssen mindestens befragt werden, um für den unbekannten
Bekanntheitsgrad ein 99%-Konfidenzintervall zu erhalten, dessen Länge höchstens 0,05
ist?
Lösung:
a)
1. n  400 ; k  132 ;
h
k 132

 0,33
n 400
2.   0,95  c  1,960
3. a  c 
h(1  h)
 0,046
n
4. Konfidenzintervall:
 0,330  0,046  p  0,330  0,046 
b)

 0,284  p  0,376 0,95
  0,99  c  2,576
L  2c
Bedingung
 4c
2
h(1  h)
 0,05 ;
n
quadrieren, auflösen nach n
2
4 c h(1  h)
h(1  h)
 0,0025  n 
n
0,0025
(*)
Falls h unbekannt ist – etwa vor der Durchführung einer Stichprobe – weiß man nur,
dass die Funktion f (h)  h(1  h) bei h  0,5 ihr Maximum f
max
 0,25 annimmt.
Mit der Abschätzung h(1  h)  0,25 folgt aus (*) weiter
2
n 
c
 2654
0,0025
Unter Verwendung des Ergebnisses aus der Stichprobe in a) erhält man einen kleineren
Wert für den erforderlichen Stichprobenumfang
n  4  2,576
2
0,33  0,67
 2347
0,0025
124
Statistik
5. Beurteilende Statistik
5.3.2.5. Quantile der Normalverteilung
Die Werte der Umkehrfunktion der N ( 0 ; 1)  Verteilungsfunktion z ( ) werden als
Quantile der Standardnormalverteilung bezeichnet: das Quantil z erhält man aus der
Forderung
P( Z  z )   ( z )  


Anschaulich bedeutet das, dass links vom z  Quantil 100   % , rechts von z
100  (1   ) % aller Werte liegen.
Die Zahl z zum Beispiel mit P( Z  z)  0.95 heißt 95% - Quantil der Standardnormalverteilung. Der Zahlenwert dieses Quantils ist 1,645; man schreibt hierfür
z0,95  1,645
Für die wichtigsten Quantile stehen Tabellen zur Verfügung (s. Anhang)
Mit dieser Schreibweise lauten die c - Werte zur Berechnung der Grenzen der Konfidenzintervalle in den vorangehenden Abschnitten (s. Graphik)
c  z1 / 2
(  1   )
 (z )


2
2

-c
c
z
Während in den vorigen Abschnitten die zur Berechnung der Intervallgrenzen zu Grunde
gelegten Zufallsvariablen N (0 ; 1) - verteilt sind, entstammen im folgenden Abschnitt die zur
Konstruktion der Intervallgrenzen entstehenden Zufallsvariablen anderen theoretischen
Verteilungen.
125
Statistik
5. Beurteilende Statistik
5.3.2.6. Weitere Konfidenzintervalle
a. Konfidenzintervall für den Erwartungswert einer Normalverteilung bei unbekannter
Varianz
In 5.3.2.2. erfolgte die Ermittlung des Konfidenzintervalls für  bei bekannter Varianz  2
aus einer Stichprobe vom Umfang n im Wesentlichen mit Hilfe der N (0 ; 1) - verteilten
Zufallsvariablen Z 
X 

 n . Ersetzt man den unbekannten Parameter  2 durch die
2
empirische Varianz S , so erhält man die neue Zufallsvariable
(25)
T
X 
 n
S
Die Verteilung der Zufallsvariable T heißt t-Verteilung mit   n-1 Freiheitsgraden; n ist
der Stichprobenumfang.
Die t – Verteilung ist wie die Normalverteilung symmetrisch; mit wachsendem n strebt sie
gegen die N (0 ; 1) - Verteilung.
Dichte der t – Verteilung (   n  1 Freiheitsgrade)
Die Herleitung des Verfahrens zur Ermittlung des Konfidenzintervalls in 5.3.2.2. lässt sich
sinngemäß übertragen; gegenüber der Prozedur auf Seite 118 ändert sich nur die Bestimmung
von c.
Zur Konfidenzzahl  bestimmt man den Wert ct so, dass
(26)
P( ct  T  ct )  
gilt. Die Werte ct sind die Quantile der t –Verteilung. Diese werden mit tn 1;  bezeichnet;
links vom tn 1;  - Quantil liegen 100   % aller Werte der t –Verteilung. Wegen der
Symmetrie der Verteilung ist (s. auch Graphik auf Seite 125):
126
Statistik
5. Beurteilende Statistik
ct  tn 1,1
(27)
2
Für die Quantile der t – Verteilung stehen Tabellen zur Verfügung (s. Anhang).
Die Ungleichung
 ct  T  ct
  ct 
X 
n  ct
S
wird umgeformt in eine Ungleichung für  . Man erhält analog zu (14) mit x und s 2 als
Realisierungen der Zufallsvariablen X und S 2
ct  s
c s

x t 
x 
n
n 

(28)
Zusammenfassung: Konfidenzintervall für  bei unbekannter Varianz 
(Normalverteilung)
2
1. Stichprobe liefert n; x und s
2. Zur gegebenen Konfidenzzahl

bestimmt man ct gemäß Gleichung (26) bzw.
mit (27)
3. Die halbe Länge des Konfidenzintervalls ist at  ct 
4. Damit ist das gesuchte Konfidenzintervall
127
 x  at
s
n
   x  at 
Statistik
5. Beurteilende Statistik
b. Konfidenzintervall für die Varianz einer Normalverteilung
Die Zufallsvariable
(29)
Y  (n  1)
S2
2
ist  2 - verteilt mit   n  1 Freiheitsgraden.
Dichte der  2 - Verteilung (   n  1 Freiheitsgrade)
Die  2 - Verteilung ist keine symmetrische Verteilung; zur Konfidenzzahl  werden deshalb
zwei Werte c1 und c2 so ermittelt, dass
P( c1  Y  c2 )  
(30)
bzw.
P(Y  c1 )  P(Y  c2 )  
gilt. (s. Graphik)


2
c1
2

c2
Die Zahlenwerte c1 und c2 können als Quantile der  2 - Verteilung aus entsprechenden
Tabellen (s. Anhang) entnommen werden. Es ist
(31)
c1   2n 1,  2
c2   2n 1,1  2
,
Die Ungleichung
c1  Y  c2

c1  (n  1)
Wird umgeformt in eine Ungleichung für
2:
n 1 2
n 1 2
S 2 
S
c2
c1
128
S2
2
 c2
Statistik
5. Beurteilende Statistik
2
2
Setzt man die empirische Varianz s als Realisierung der Zufallsvariable S ein, so erhält
man das Konfidenzintervall
(32)
a2  
2
 a1

mit
( n  1) s 2
a1 
c1
Zusammenfassung: Konfidenzintervall für die Varianz 
2
( n  1) s 2
, a2 
c2
einer Normalverteilung
1. Aus der Stichprobe vom Umfang n berechnet man
s2 
1
( xi  x )2

n 1
2. Zur gegebenen Konfidenzzahl
Hilfe der Quantile (31)
3. Man berechnet
a1 

( n  1) s 2
c1
,
x
1
 xi
n
bestimmt man die Zahlenwerte c1 und c2 mit
, a2 
4. Damit ist das gesuchte Konfidenzintervall
( n  1) s 2
c2
a2   2  a1
Konfidenzintervalle bei beliebigen Verteilungen
Ist eine Zufallsvariable X nicht normalverteil, so ist nach dem Zentralen Grenzwertsatz das
1
Stichprobenmittel X   X i trotzdem näherungsweise normalverteilt. Bei großem
n
Stichprobenumfang kann man deshalb die vorangehenden Prozeduren verwenden.
129
Statistik
5. Beurteilende Statistik
5.4. Signifikanztests (Hypothesentests)
5.4.1. Schema eines Signifikanztests
In der Praxis müssen auf der Grundlage des Stichprobenmaterials Entscheidungen gefällt
werden, die einen unbekannten Parameter der Grundgesamtheit betreffen.
Die Grundidee eines Hypothesentests wird an Hand des Beispiels 8 erläutert. Die einzelnen
Schritte beinhalten das Schema des Einstichproben-Gaußtests:
2
2
Betrachtet wird eine N (  ;  )  verteilte Grundgesamtheit G mit bekannter Varianz  .
Über den unbekannten Erwartungswert  bestehe die Hypothese (Vermutung)
(33)
H 0 :   0
Diese Hypothese wird anhand der Ergebnisse aus einer Stichprobe überprüft. Dabei wird H
0
als statistisch widerlegt angesehen und abgelehnt oder verworfen, wenn das Stichprobenergebnis in signifikantem Gegensatz zu ihr steht.
Beispiel 8
( aus: Bamberg/Bauer: Statistik; R. Oldenbourg Verlag)
Eine Abfüllanlage füllt Bier in Flaschen, wobei die Füllmenge X als normalverteilte
Zufallsvariable mit bekannter Standardabweichung  angesehen werden kann. Die
Hypothese H 0 , dass der Erwartungswert  dieser Normalverteilung gleich dem Sollwert
 0  500 cm3 ist, soll mit Hilfe einer Stichprobe vom Umfang n überprüft werden
Aufgrund der Interessenlage der Personen, die die Untersuchung vornehmen, kann man drei
Fälle unterscheiden: Die Prüfung erfolgt durch
a) eine Eichkommission, die an einer Abweichung vom Sollwert  0  500 cm3 sowohl nach
unten wie auch nach oben interessiert ist,
b) eine Verbraucherorganisation, deren Interesse nur der Frage gilt, ob der wahre Wert 
kleiner ist als der Sollwert,
c) den Brauereibesitzer, der lediglich wissen will, ob im Mittel zu viel abgefüllt wird.
Beispiel 8 zeigt, dass es zur Null-Hypothese H 0 :
  0 verschiedene
Gegenhypothesen (Alternativhypothesen) geben kann, je nach Interessenlage der
untersuchenden Person. Hier sind drei Fälle möglich:
130
Statistik
(34)
5. Beurteilende Statistik
a)
H1(1) :   0
( Eichkommission )
b)
H1( 2) :   0
( Verbraucherschutz )
c)
H1(3) :   0
( Brauereibesitzer )
Das Stichprobenmittel X ist eine erwartungstreue Schätzfunktion für den unbekannten
Erwartungswert  , der arithmetische Mittelwert x als Realisierung von X wird also in der
Regel nicht allzu sehr von  abweichen. Man wird deshalb die Nullhypothese als statistisch
widerlegt ansehen und verwerfen oder ablehnen, wenn sich x stark von  unterscheidet:
0
H 0 :   0 wird abgelehnt gegenüber
(35)
a)
H1(1) :   0 , wenn
b)
H1( 2) :   0 , wenn x „viel kleiner“ als 0 ist
c)
H1(3) :   0 , wenn x „viel größer“ als 0 ist
x  0
„sehr groß“ ist
Diese vage Entscheidungsvorschrift muss selbstverständlich präzisiert werden:
Große Abweichungen zwischen x und 0 sind auch dann nicht völlig ausgeschlossen,
wenn   0 zutrifft; die Vorschrift (35) kann also auch zur Ablehnung der Nullhypothese
führen, obwohl diese richtig ist. Man fordert nun, dass die Fehlentscheidung
„Ablehnung von H 0 , wenn H 0 richtig ist“
(Fehler 1. Art)
lediglich mit einer als zulässig vorgegebenen kleinen Irrtumswahrscheinlichkeit , dem so
genannten Signifikanzniveau  , vorkommen darf.
Dazu benutzt man wieder das N ( 0 ; 1)  verteilte standardisierte Stichprobenmittel als
Testfunktion (Testvariable)
(36)
Z
X  0

Mit Hilfe ihrer Realisierung z 
n
x  0

n
(arithmetischen Mittelwert x einsetzen in (36))
erhält man dann folgende Entscheidungsregel:
131
Statistik
5. Beurteilende Statistik
H 0 :   0
ist zu verwerfen (ist abzulehnen)
(1)
:   0 , falls | z |  c1
( 2)
:   0 , falls z   c2
(3)
:   0 , falls z  c2
a)
gegen H1
b)
gegen H1
c)
gegen H1
(37)
Die Grenzen des Verwerfungsbereichs (Ablehnungsbereichs) c1 , c2 erhält man mit
Hilfe der Standardnormalverteilung entsprechend den drei skizzierten Fällen:
 (z )
 (z )
 (z )
c1 ist dabei das (1   2 ) -Quantil, c2 das (1   ) -Quantil der Normalverteilung:
(38)
c1  z1  2
,
c2  z1
132
Statistik
5. Beurteilende Statistik
Als Verwerfungsbereich erhält man (vgl. Diagramme auf Seite 132)
a)
B(1)  (   ;  c1 )  ( c1 ;  ) bei
H1(1) :   0
b)
B( 2)  (   ;  c2 )
bei
H1( 2) :   0
c)
B(3)  ( c2 ;  )
bei
H1(3) :   0
Beispiel 8 - Fortsetzung
Aus einer Stichprobe mit n  25 Flaschen ergab sich der Mittelwert x  499,28 [cm3].
Testen Sie mit Irrtumswahrscheinlichkeit   0,01 die Hypothese H :   500 [cm3]
0
bei bekannter Standardabweichung   1,5 [cm3] vom Standpunkt
a) der Eichkommission,
b) der Verbraucherorganisation,
c) des Brauereibesitzers
Lösung:
1. Irrtumswahrscheinlichkeit   0,01
2. Wert der Testfunktion
z 
499,28  500
 25   2,4
1,5
3. Mit den Grenzen (Quantile der N ( 0 ; 1)  Verteilung)
  0,01  c1  z10,005  z 0,995  2,576 ;
c 2  z10,01  z 0,99  2,326
ergeben sich die Ablehnungsbereiche (Verwerfungsbereiche)
(1)
 (   ;  2,576)  ( 2,576 ;  )
a)
B
b)
B ( 2)  (   ;  2,326 )
c)
B
(3)
 ( 2,326 ;  )
(1)
4. a) z  2,4  B : die Eichkommission kommt zu keiner Ablehnung der Hypothese H 0
b) z  2,4  B
( 2)
: die Verbraucherorganisation verwirft die Hypothese H 0
(3)
c) z  2,4  B : der Brauereibesitzer verwirft H 0 nicht ( auch ohne die Schritte 2
und 3 klar, wegen x   0 )
133
Statistik
5. Beurteilende Statistik
5.4.2. Überblick und Bezeichnungen, Fehler bei Signifikanztests
In 5.4.1. wurde das Schema eines Signifikanztests für den Mittelwert einer Normalverteilung
ausführlich dargestellt. Allgemein lässt sich für einen Signifikanztest für einen beliebigen,
unbekannten Parameter z einer beliebig verteilten Grundgesamtheit zusammenfassen:


Wahl eines Signifikanzniveaus

Ermitteln einer geeigneten Testvariablen Z

Aufstellen der Nullhypothese:

führt zu drei Typen von Alternativhypothesen:
Z  Z0
(1)
I) H1 :
a1
z
a2
P( Z  a1 oder Z  a2 / H 0 )  

II)
H 0 : Z  Z0
H1( 2) : Z  Z 0
a
( z0 ... „Sollwert“)
H1(3) : Z  Z0
III)
z
P( Z  a / H 0 )  
z
a
P( Z  a / H 0 )  
Testentscheidung: Die Nullhypothese H 0 ist auf dem Signifikanzniveau  zu
Gunsten der Alternativhypothese H 1 abzulehnen, wenn der Wert der Testvariablen Z
in den Ablehnungsbereich („kritischer Bereich“) fällt. Die Grenzen a zu diesen
Bereichen heißen Annahmegrenzen oder Annahmekennzahlen.
In den obigen Fällen sind die Ablehnungsbereiche:
I)
(  , a1 )  ( a2 , )
(  , a )
II)
III)
( a , )
Man unterscheidet also zwei Typen von Hypothesentests:
Fall I) Zweiseitiger Hypothesentest und
Fälle II) und III) Einseitige Hypothesentests
Ein zweiseitiger Test wird immer dann benutzt, wenn vermutet wird, dass ein Parameter u
einer Verteilung einen ganz bestimmten Wert u0 hat (Punkthypothese), bzw. wenn das
134
Statistik
5. Beurteilende Statistik
Gegenteil, die Alternativhypothese „u weicht signifikant von u0 ab“ vermutet wird.
Ein einseitiger Test wird immer dann benutzt, wenn vermutet wird, dass ein Parameter u einer
Verteilung einen ganz bestimmten Wert u0 nicht unter- bzw. überschreitet, bzw. wenn das
Gegenteil „u ist signifikant kleiner als u0 “ oder „u ist signifikant größer als u0 “ vermutet
wird.
Warnung: Aus der Nichtablehnung einer Nullhypothese kann nicht auf ihre Richtigkeit
geschlossen werden!
Fehler 1. Art: Ablehnung einer wahren Nullhypothese, weil der Wert der Testvariablen in
den Ablehnungsbereich fällt; die Wahrscheinlichkeit dafür ist  (Signifikanzniveau oder „Irrtumswahrscheinlichkeit“)
Fehler 2. Art: Falsche Nullhypothese wird nicht abgelehnt, weil der Wert der Testvariablen
in den nichtkritischen Bereich fällt; die Wahrscheinlichkeit dafür wird 1  
bezeichnet.
Graphik für einen einseitigen Test:
1 

Z0
a
Z1
kritischer Bereich

Dichte von Z , wenn H 0 : Z  Z 0 wahr ist

Dichte von Z , wenn die Alternative
Z  Z1  Z 0 wahr ist
Je nach Lage von z1 ergibt ergibt sich ein mehr oder weniger große Wahrscheinlichkeit 1   .
1   bzw.  sind Funktionen von z1 .
135
Statistik
5. Beurteilende Statistik
1   ( z1 ) heißt Operationscharakteristik
 ( z1 ) heißt Gütefunktion
OC - Kurven
1
oder Macht des Tests.
1
1   ( z1 )
1   ( z1 )  P( Z  a / Z  Z1 )
n größer
z0
z1
Eine Erhöhung des Stichprobenumfangs n führt zu einer Verkleinerung von 1   und zu
einer Verkleinerung von
 . Dies führt zu einer größeren Trennschärfe, d.h. ein Unter-
schied wird häufiger als signifikant erkannt. Unter einem trennschärfsten Test versteht man
einen Test, der garantiert, dass falsche Nullhypothesen mit größtmöglicher Wahrscheinlichkeit abgelehnt werden.
Alternativtests spielen eine Rolle unter anderem in der statistischen Qualitätskontrolle, wenn
es um die Annahme oder Ablehnung einer Lieferung geht. Als „Produzentenrisiko“ bezeichnet man dort den Fehler 1. Art; als „Konsumentenrisiko“ den Fehler 2. Art.
Bemerkungen:
1. Neben dem Verteilungstyp der Grundgesamtheit benötigt man bei einem Signifikanztest
die Verteilung der Testvariablen. Ohne bekannte Verteilung der Testgrößen ist es nicht
möglich die Grenzen des Annahme- bzw. Ablehnungsbereichs zu bestimmen.
2. Das Signifikanzniveau  heißt auch Irrtumswahrscheinlichkeit. Mit der VertrauensWahrscheinlichkeit (Konfidenzzahl)  aus 5.3.2. gilt   1   . Während für  eine große
Wahrscheinlichkeit gewählt wird, ist  immer eine klein Wahrscheinlichkeit.
3. Unterschied zwischen Intervallschätzung (Konfidenzintervall) und Testverfahren:
Die Beispiele 5 und 8 verdeutlichen den Unterschied: Das Konfidenzintervall im Beispiel 5 ist
symmetrisch zum Stichprobenmittelwert x , dagegen ist der Annahmebereich unter der ersten
Gegenhypothese H
(1)
1
(zweiseitige Abgrenzung) symmetrisch zum Sollwert  0 . Im ersten
Fall spricht man von einem Vertrauensbereich für  , im zweiten Fall von einem Zufallsstreubereich für x . Die Länge der beiden Intervalle sind gleich; im ersten Fall wird jedoch
136
Statistik
5. Beurteilende Statistik
von x auf  geschlossen, im zweiten Fall von  auf x ! Bei Parametertests könnte man auf
die Testvariable verzichten. Bei einer Testentscheidung bräuchte man nur zu überprüfen, ob
der Stichprobenwert für den entsprechenden Parameter in den Zufallsstreubereich fällt.
Arten von Hypothesentests
Parametertests: Hypothese über den numerischen Wert eines unbekannten Parameters, z. B.
eines Lage- oder Streuungsparameters.
Anpassungstests: Dabei werde Hypothesen über den Typ der Verteilung eines Merkmals
geprüft, z.B. ob eine Normalverteilung vorliegt.
Unabhängigkeitstests: Hypothesen über die Abhängigkeit bzw. Unabhängigkeit verschiedener Merkmale.
Bei allen drei Arten von Tests wird geprüft, ob eine Zufallsstichprobe eine signifikante Abweichung von der Nullhypothese liefert.
137
Statistik
5.4.3.
5. Beurteilende Statistik
Parametertests
5.4.3.1. Test über den Erwartungswert  einer Normalverteilung
a. bei bekannter Varianz (vergl. Beispiel 8)
Es liegt eine Stichprobe x1 , x2 , ... , xn vor. Die Werte sind Realisierungen von n unabhängigen N (  ,  2 ) - verteilten Zufallsvariablen mit unbekanntem Erwartungswert  aber
bekannter Varianz  2 .
1. Festlegung des Signifikanzniveaus  .
2. Testvariable
Z
(39)
X  0

H 0 :   0
Nullhypothese
( N ( 0 ; 1)  verteilt)
n
( 0 ... „Sollwert“)
3. mit Hilfe der Stichprobenwerte ergibt sich z als Realisierung von Z ; die
Nullhypothese ist zugunsten der Alternativhypothese H 1 abzulehnen, wenn die Werte
von z in die folgenden Ablehnungsbereiche fallen:
Ablehnungsbereich
H1
I)
H1(1) :   0
z  z1 2
II)
H1( 2) :   0
z   z1
III)
H1(3) : 
z  z1
 0
(40)
Zweiseitiger Test
Einseitige Tests
z1 2 , z1 Quantile der N ( 0 ; 1)  Verteilung
b. bei unbekannter Varianz
Wieder liegt eine Stichprobe x1 , x2 , ... , xn vor, deren Werte sind Realisierungen von n
unabhängigen N (  ,  2 ) - verteilten Zufallsvariablen mit unbekanntem Erwartungswert 
und unbekannter Varianz  2 sind. Die unbekannte Standardabweichung  wird durch die
empirische Standardabweichung s aus der Stichprobe geschätzt. Die sich ergebende Testvariable T ist t-verteilt mit   n  1 Freiheitsgraden.
138
Statistik
5. Beurteilende Statistik
1. Festlegung des Signifikanzniveaus  .
2. Testvariable
(41) T 
3. Nullhypothese
X  0
s
(t-verteilt mit   n  1 Freiheitsgraden)
n
H 0 :   0
( 0 ... „Sollwert“)
4. Die Vorgehensweise ist die gleiche wie in a. Für die Grenzen der Ablehnungsbereiche
werden nur die entsprechenden Quantile der t-Verteilung verwendet.
Ablehnungsbereich
H1
I)
H1(1) :   0
t  tn 1;1  2
II)
H1( 2) :   0
t  tn 1;1
III)
H1(3) : 
t  tn 1;1
 0
Zweiseitiger Test
Einseitige Tests
(42)
Beispiel 9
Eine Maschine soll Stücke mit einem Sollmaß von 120 mm produzieren. Es wird vermutet,
dass dies nicht genau der Fall ist. Eine Stichprobe im Umfang n = 5 ergibt: x = 121 mm
und s = 0,5 mm.
a) Zu testen ist die Nullhypothese H 0 :   120 gegen die zweiseitige Hypothese   120
a1) auf dem Signifikanzniveau   5%
a2) auf dem Signifikanzniveau   1%
b) Zu testen ist die Nullhypothese H 0 :   120 auf dem Signifikanzniveau   5% gegen
die einseitige Hypothese   120 .
Lösung:
121  120
5  4,47
0.5
  n  1  4  tn 1;1 2  t4 ; 0,975  2,776
Wert der Testvariablen:
a1)
  5%
t
Wegen t  2,775 ist H 0 auf dem Signifikanzniveau
  5% abzulehnen; mit
95 % - iger Wahrscheinlichkeit stimmt der Mittelwert der Maschine nicht.
a2)
b)
  1%
t4 ; 0,995  4,604
Niveau von
  1% nicht abgelehnt werden.
 t  t4 ; 0,995 die Nullhypothese kann auf dem
t4 ;0,95  2,132 d.h. t  t4 ; 0,95 Maschine produziert mit 95 % - iger Wahrscheinlichkeit zu große Stücke.
139
Statistik
5. Beurteilende Statistik
5.4.3.2. Test über die Varianz  2 einer Normalverteilung
2
Eine Stichprobe vom Umfang n liefert die empirische Varianz s . Zu testen ist die Nullhypothese
H 0 :  2   02
(1)
gegen gegen die zweiseitige Alternative H1 :
( 2)
bzw. gegen die einseitigen Alternativen H1
 2   02
:  2   02 oder häufiger H1(3) :  2   02 .
1. Festlegung des Signifikanzniveaus  .
2. Testvariable
(43) Y 
3. Nullhypothese
S2
(n  1)

H 0 :  2   02
2
(  2 -verteilt mit   n  1 Freiheitsgraden)
(„Sollwert“)
4. Die Nullhypothese ist zugunsten der Alternativhypothese H 1 abzulehnen, wenn die
Werte von y in die folgenden Ablehnungsbereiche fallen; die Grenzen für die
Ablehnungsbereiche ergeben sich aus der Tabelle der Quantile der  2 - Verteilung.
Dabei ist zu beachten, dass die  2 - Verteilung nicht symmetrisch ist!
Ablehnungsbereich
H1
I)
H1(1) :  2   02
y   n21;  2 oder y   n 1;1
II)
H1( 2) :  2   02
y   n21;
III)
H1(3) :  2
y   n 1;1
  02
Zweiseitiger Test
2
Einseitige Tests
(44)
140
Statistik
5. Beurteilende Statistik
5.4.3.3. Vergleich der Parameter 1 und 2 zweier Normalverteilungen
(„Zwei-Stichproben-t-Test“)
Es liegen zwei Stichproben vor. Die m Werte x1 , x2 , ... , xm sind Realisierungen von
N ( 1 ,  12 ) - verteilten Zufallsvariablen; die n Werte y1 , y 2 , ... , y n Realisierungen von
N ( 2 ,  22 ) - verteilten Zufallsvariablen. Alle Zufallsvariablen sind voneinander unabhängig.
Frage: Stimmen die beiden Mittelwerte 1 und 2 überein oder weichen sie signifikant
voneinander ab? Getestet werden auf dem Signifikanzniveau  Nullhypothesen über den
Unterschied der beiden unbekannten Erwartungswerte gegen entsprechende Alternativhypothesen.
a.  1 und  2 bekannt:
Die Zufallsvariable
D  X Y
N ( 1  2 ;
ist
12
m

 22
n
) - verteilt.
Die Nullhypothesen
H 0(1) : 1  2
(45)
1  2  0
d.h.
H 0( 2) : 1  2
H 0(3) : 1  2
sind zu testen gegen die zweiseitige Hypothese
H1(1) : 1  2
bzw. die einseitigen Hypothesen
H1( 2) : 1  2
,
H1(3) : 1  2 .
Mit
 D2

12
m

 22
n
ist die Testvariable
(46)
Z
X Y
D
N (0 ;1) - verteilt.
Mit den Stichprobenrealisierungen x und y können für die Testentscheidung deshalb die
Ablehnungsbereiche in der Tabelle (40) verwendet werden.
141
Statistik
5. Beurteilende Statistik
b.  1 und  2 unbekannt:
Vorausgesetzt wird jedoch  1 =  2 .
1. Festlegung des Signifikanzniveaus  .
2. Die Testvariable
Txy 
(47)
m  n  ( m  n  2)
X Y

mn
(m  1) S x2  (n  1) S 2y
Ist t-verteilt mit   m  n  2 Freiheitsgraden.
3. Nullhypothesen
H 0(1) : 1  2
,
H 0( 2) : 1  2 ,
H 0(3) : 1  2
4. Mit den empirischen Mittelwerte x , y und den empirischen Varianzen s x2 , s 2y der
Stichproben ist die Nullhypothese ist zugunsten der Alternativhypothesen H 1
abzulehnen, wenn die sich damit ergebenden Werte von t xy in die folgenden
Ablehnungsbereiche fallen; die Grenzen für die Ablehnungsbereiche ergeben sich aus
der Tabelle der Quantile der t- Verteilung.
H0
H1
Ablehnungsbereich
I)
H 0(1) : 1  2
H1(1) : 1  2
t  tm n  2 ;1 2
II)
H 0( 2) : 1  2
H1( 2) : 1  2
t  tm  n  2 ;1
: 1  2
H1(3) : 1  2
t  tm  n  2 ;1
( 3)
III) H 0
(48)
142
Statistik
5.4.4.
5. Beurteilende Statistik
Anpassungstests
5.4.4.1. Testen hypothetischer Wahrscheinlichkeiten
Einteilung eines Zufallsexperiments in m disjunkte Klassen:
  A1  A2  ...  Am
mit
Ai  A j  
für i  j
Die Wahrscheinlichkeiten für die Ereignisse Ai : P( Ai ) sind nicht bekannt. Es wird vermutet
H 0 : P( Ai )  pi
Nullhypothese
, i  1, ... , m
Eine Stichprobe im Umfang n  n1  n2  ...  nm liefert die Häufigkeiten ni der Ereignisse Ai in der Stichprobe.
Mit
n  pi
bezeichnet man die unter der Hypothese H 0 zu erwartende Besetzungszahl
ni
die tatsächliche Besetzungszahl in der Stichprobe.
mit
m
(
m
 n  pi   ni  n
i 1
)
i 1
Die Testvariable
(n  pi  ni ) 2
Z
n  pi
i 1
m
(49)
ist
 2 - verteilt mit   m  1 Freiheitsgraden
Gilt für den mit den Stichprobenwerten ermittelten Wert z
2
z  m
1;1
(50)
 2 - Verteilung)
(Tabelle der Quantile der
So ist die Nullhypothese H 0 auf dem Signifikanzniveau
 abzulehnen.
Faustregeln: 1. Bei nur zwei Klassen A1 , A2 sollte n > 30 gelten
2. n  pi  5 ,
andernfalls neue Klasseneinteilung.
Beispiel 10
In einem Werk liegen Angaben über die Anzahl der Maschinenstillstände in den einzelnen
Stunden einer Acht-Stunden-Schicht vor:
Schichtstunden
1
2
3
4
5
6
7
8
Anzahl der Maschinenstillstände
16
17
18
25
28
20
19
17
143
Statistik
5. Beurteilende Statistik
Vermutet wird, dass die Wahrscheinlichkeit eines Maschinenstillstands für gewisse Stunden
der Schicht besonders groß ist.
Zu testen ist daher die Nullhypothese, dass sich die einzelnen Schichtstunden hinsichtlich
dieser Wahrscheinlichkeit nicht unterscheiden, vielmehr diese Wahrscheinlichkeit immer 1
ist. Signifikanzniveau sei
Lösung:
8
  0,05 .
H 0 : P(Maschinenstillstand in der i-ten Stunde) = 18
(20  ni )2
 5,6
20
i 1
8
8
n   ni  160  n  pi  20 : z  
i 1
  0,05

,
  7   72;0.95  14,4
z   72;095
d.h. keine Ablehnung von H 0 , die Schwankungen
sind zufällig.
5.4.4.2. Der
 2 - Anpassungstest
Testen einer Hypothese über die Art der Verteilung, z.B. Hypothese, dass eine N (  ;  ) 2
Verteilung vorliegt. Im Wesentlichen kann auf das Verfahren in 5.4.4.1. zurückgegriffen
werden. Es wird mit derselben Testvariablen (49) gearbeitet.
Beispiel 11
Eine Stichprobe im Umfang n = 100 ergab für die Bruchfestigkeit eines mechanischen
Bauteils (in N) die in nachfolgender Tabelle aufgeführten Werte xi . Die Werte wurden in
m = 9 Klassen eingeteilt; ni bezeichnet die absolute Klassenhäufigkeit:
xi
ni
pi
n  pi
< 255
255 - 265
265 - 275
275 - 285
285 - 295
295 - 305
305 - 315
315 - 325
> 325
8
7
11
15
17
14
12
8
8
100
0,0808
0,0779
0,1156
0,1464
0,1586
0,1464
0,1156
0,0779
0,0808
1,0000
8,08
7,79
11,56
14,64
15,86
14,64
11,56
7,79
8,08
100

144
Statistik
5. Beurteilende Statistik
Die Werte pi und n  pi werden auf der Basis der Vermutung (Nullhypothese)
H 0 : die Werte entstammen einer N (290 ; 252 ) - Verteilung
Berechnet, z.B.
p1  P( X  255)  (
255  290
)  1  (1,4)  0,0808
25
265  290
255  290
)  (
)
25
25
 1   (1)  (1   (1,4))  0,9192  0,8413  0,0779
p2  P( 255  X  265)   (
….
Mit (49) ergibt sich für
z  0,25
Wird der Test auf dem Signifikanzniveau von
  0,05 durchgeführt, so ergibt sich mit
  9 1  8:
z  82; 0,95  15,507
d.h. die Nullhypothese kann nicht abgelehnt werden; die Werte entstammen einer Normalverteilung.
Wenn man die Werte für

und
2
nicht (wie oben
 = 290
und
 2 = 625)
2
in die
Hypothese mit einbezieht, sondern durch die Stichprobenwerte x und s schätzt, so muss
man die Freiheitsgrade um die Anzahl der geschätzten Parameter vermindern.
Im Beispiel ergibt sich
x = 290,5 und s = 22,7 *)
Damit ist
  9 1 2  6
und
62; 0,95  12,592
d.h. ebenfalls keine Ablehnung von H 0 .
*) Die Werte wurden mit den Näherungsformeln
x
1 m
ni ai'

n i 1
, s2 
1 m
ni ( ai'  x ) 2

n  1 i 1
'
( ai … Klassenmitten, vergl. (15) , (16) Kap. 2.1.3.)
145
Statistik
5.4.5.
Der
5. Beurteilende Statistik
Der
 2 - Unabhängigkeitstest
 2 - Unabhängigkeitstest wird zur Überprüfung einer Hypothese über die gemeinsame
Verteilung zweier Merkmale verwendet. Das Verfahren ist prinzipiell das gleiche wie in
5.4.4. beschriebene. Al s Nullhypothese formuliert man dabei immer die Unabhängigkeit
der Merkmale.
Eine Kontingenz-Tafel enthält Stichprobenergebnisse mit zwei Merkmalen, die in k bzw. m
Ausprägungen vorliegen. (Vergl. Kapitel 2.2.2.)
Beispiel 12
In einer Menge von n = 2400 Wahlberechtigten sind
1. Merkmal: Lebensalter (Einteilung in drei Altersklassen)
2. Merkmal: Gewählte Partei (Partei A, B, C)
2. Merkmal
1. Merkmal
k = m =3
Randsumme
1. Merkmal
A
B
18 … 25
n11  155
n12  111
n13  25
n1  291
25 … 40
n21  248
n22  304
n23  55
n2  607
> 40
n31  592
n32  778
n33  132
n3  1502
n1  995
n 2  1193
n3  212
n  2400
Randsumme 2. Merk.
Randsummen:
m
C
k
 nij
; n j   nij
i  1, .....,k
j  1,.....,m
ni  
j 1
k
;
i 1
 ni  
i 1
m
 n j  n
j 1
Nullhypothese:
H 0 : P(1. Merkmal i-te Ausprägung)  P(2. Merkmal j-te Ausprägung) =
P(1. Merkmal i-te Ausprägung und 2. Merkmal j-te Ausprägung)
(Definition der Unabhängigkeit, vergl. (18) Kapitel 3.4.2.)
Schätzwerte für
P(1. Merkmal i-te Ausprägung) :
P(2. Merkmal j-te Ausprägung) :
146
ni
n
n j
n
Statistik

5. Beurteilende Statistik
die zu erwartende Besetzungszahl in der Kontingenztafel wäre unter der Annahme H 0 :
ni   n j
ni  n j

n 
n n
n
(51)
Die Testgöße (vergl. (49))
k m
z
(52)
(
i 1 j 1
ni   n j
 nij ) 2
n
ni   n j
n
ist
 2 - verteilt mit   (k  1)  (m  1) Freiheitsgraden.
Gilt
z  (2k 1)(m 1) ;1
(53)
so ist H 0 auf dem Niveau
,
 abzulehnen.
Fortsetzung Beispiel 12
Mit (51) ergibt sich sie Kontingenztafel mit den zu erwartenden Besetzungszahlen:

Für
120,6
144,7
25,7
251,7
301,7
53,6
622,7
746,6
132,7
z = 20,6
  0,01 ,   (m  1)( k  1)  4  42; 0,99  13,277  z , d.h. die Null-
hypothese ist abzulehnen, das „Wahlverhalten ist Lebensalterspezifisch“ .
147
Statistik
5. Beurteilende Statistik
148
Statistik
5. Beurteilende Statistik
149
Statistik
5. Beurteilende Statistik
5.5. Aufgaben
1. Die Länge X einer Strecke wurde 25-mal mit einem Gerät ohne systematische Fehler
gemessen, dessen zufällige Messfehler normalverteilt sind mit der Standardabweichung
  10 m. Bestimmen Sie ein Konfidenzintervall für den Erwartungswert  bei einer
Sicherheit von 99%, wenn der Mittelwert der 25 Messungen 100 m beträgt.
2. Vor einer Wahl möchte ein Meinungsforschungsinstitut eine Prognose über den prozentualen Stimmenanteil abgeben, den eine bestimmte Partei in dieser Wahl erreichen wird.
a) Wie viele zufällig ausgewählte Wahlberechtigte müssen mindestens befragt werden,
um für den prozentualen Stimmenanteil ein 95% - Konfidenzintervall zu erhalten,
dessen Länge höchstens 2% ist ?
b) Was ändert sich, wenn die Länge des Konfidenzintervalls L höchstens 1% sein soll bei
gleich bleibender Sicherheit von 95% ?
c) ... Länge 2% bei Sicherheit von 99% ?
2
3. Die Lebensdauer X in km einer Autoreifensorte sei N (  ; 5000 ) - verteilt. Durch
Änderung der Rohstoffzusammensetzung ist die mittlere Lebensdauer  der Reifen einer
Produktionsserie veränderbar, während sich die Standardabweichung nicht ändert.
a) Die Rohstoffzusammensetzung sei so gewählt, dass die mittlere Lebensdauer dieser
Serie   50 000 km beträgt.
a1) Bei wie viel Prozent der Reifen übersteigt die Lebensdauer 60 000 km ?
a2) Bei wie viel Prozent weicht die Lebensdauer um mehr als 8 000 km von  ab?
b) Wie groß muss die mittlere Lebensdauer mindestens sein, damit höchstens 2% der
Reifen eine Lebensdauer von weniger als 40 000 km haben?
c) Aus einer Stichprobe vom Umfang n = 100 wird eine mittlere Lebensdauer
x  49700 km ermittelt. Geben Sie ein 95% - Konfidenzintervall für die mittlere
Lebensdauer dieser Serie an.
d) Wie groß müsste der Stichprobenumfang mindestens sein, damit mit 95% Sicherheit
die Länge des Konfidenzintervalls höchstens 2 000 km beträgt?
4. Die Füllmenge einer 1-Liter-Flaschenabfüllmaschine sei normalverteilt. Aus einer
Stichprobe von 100 Flaschen ergibt sich ein arithmetischer Mittelwert x  990 cm 3 und
die empirische Standardabweichung s  38 cm 3 .
Ermitteln Sie ein 95 % - Konfidenzintervall für den Erwartungswert  der Füllmenge.
5. Eine Maschine produziert Bolzen mit Soll-Durchmesser 40 mm. 100 Bolzen wurden
nachgemessen. Dabei erhielt man das arithmetische Mittel x  38,96 mm und die
150
Statistik
5. Beurteilende Statistik
empirische Varianz s 2  1,1808 mm2 . Die Bolzendicke ist näherungsweise
normalverteilt.
a) Bestimmen Sie ein 99 % - Konfidenzintervall für den Mittelwert  . Kann man auf
Grund dieses Ergebnisses mit 99 % Sicherheit behaupten, dass  kleiner ist als der
Sollwert?
b) Bestimmen Sie ein 95 % – Konfidenzintervall für die Varianz  2 und für die
Standartabweichung  .
6. Eine Abfüllmaschine, die die Pakete mit einer Nettomasse von 250 g herstellen soll, arbeitet erfahrungsgemäß nach einer Normalverteilung. Es besteht aber der Verdacht, dass der
Mittelwert vom Sollmaß 250 g abweicht.
a) Eine geeignete Nullhypothese soll auf dem Signifikanzniveau von 5 % sowie 1 % zweiseitig sowie einseitig auf Grund des gleichen Stichprobenmaterials getestet werden: n = 10
x  253,4 g , s = 5,2 g .
Inwiefern ist bei einer vorschnellen Interpretation des „Nicht-Ablehnen-Könnens“ als
„Annahme“ eine offensichtliche Möglichkeit der Manipulation gegeben?
b) Nach Festlegung des Signifikanzniveaus 1 % und des Stichprobenumfangs n = 40 soll
auf Grund eines einseitigen Tests eine Entscheidung zwischen „Ablehnung“ und „Annahme“ der Hypothese herbeigeführt werden. Die Stichprobe habe x  252,6 g , s = 5,8 g
ergeben.
7. Auf dem Signifikanzniveau 5 % soll geprüft werden, ob die Streuung des (normalverteilten) Durchmessers X von Wellen, die auf einer Maschine produziert werden, den Sollwert 0,5 mm einhält. Eine Stichprobe vom Umfang n = 10 hat hierzu x  26,2 mm und
s = 0,7 mm ergeben.
Was würde der Test auf dem Niveau 1 % ergeben?
8. Eine Münze wurde n = 2500 Mal geworfen. Es ergab sich 1184 Mal „Wappen“ und
1316 Mal „Zahl“. Kann man die Münze auf dem Signifikanzniveau 1 % als regelmäßig
ansehen?
Hinweis: Approximation durch die Normalverteilung.
9. Bei Geschwindigkeitsmessungen auf einem Autobahnteilstück ergaben sich bei 200
gemessenen PKW folgende Werte:
Geschwindigkeit in km/h
Anzahl der PKW
< 80
20
80…100
35
100…120 120…140
70
60
> 140
15
a) Ist auf dem Signifikanzniveau   5 % die Stichprobe mit der Hypothese einer
Normalverteilung mit   110 km/h und   25 km/h verträglich?
151
Statistik
5. Beurteilende Statistik
b) Was ergibt sich bei gleichem Signifikanzniveau   5 % , wenn  und  durch die
Stichprobenwerte x und s geschätzt werden? x und s sind dabei näherungsweise mit
Hilfe der Klassenmitten zu ermitteln.
10. In der Elektrizitätsversorgung einer Region wurden über einen längeren Zeitraum Tage
mit und ohne Netzausfall registriert, um einen vermuteten Zusammenhang mit
Temperaturextremen aufzudecken:
Tage
bei
mit Netzausfall
ohne Netzausfall
Σ
TemperaturMaxima
2
12
14
TemperaturMinima
5
11
16
kein Temp.Extremum
34
296
330

41
319
360
Prüfen Sie auf dem Signifikanzniveau   1 % , ob ein Zusammenhang zwischen Netzausfällen und Temperaturextremen besteht.
152
Herunterladen