Kap. 11 weiter (Teil II): Intervall

Werbung
Hier werden Intervallschätzungen für die Differenz von Mittelwerten zweier
Gesamtheiten sowie die Intervallschätzung für das Verhältnis von Varianzen zweier
Gesamtheiten vorgestellt.
!"
#
$
%
& "'
Wir betrachten zwei Gesamtheiten mit den unbekannten Mittelwerten µ 1 bzw. µ 2
aber bekannten Varianzen σ 12 bzw. σ 22 . Falls die Verteilung der StichprobenMittelwerte X bzw. Y aus den beiden Gesamtheiten normalverteilt ist und die
Stichproben unabhängig voneinander sind, so ist die Differenz der beiden StichprobenMittelwerte D = X – Y auch normalverteilt (s. voriges Kapitel).
Bei der Intervallschätzung für die Differenz der Mittelwerte δ = µ 1 – µ 2 können wir
erwarten, dass diese Differenz in einem Intervall um die Schätzfunktion D der Differenz
der Mittelwerte von zwei Stichproben der Größen N 1 bzw. N 2 aus den beiden
Gesamtheiten liegt.
D − ∆d ≤ δ ≤ D + ∆d
Wenn die Stichprobenverteilungen annähernd einer Normalverteilungen
entsprechen, können wir erwarten, dass δ mit einer gewissen Wahrscheinlichkeit
γ=1–
in einem Intervall um D liegt. Folglich liegt nach dem Theorem (aus Kap. 10
Abschnitt 10.6) die standardisierte Zufallsvariable
D
Z =
(X
δ
− Y
)−
σ 12
N1
(µ1
+
− µ2
)
σ 22
N2
mit der Wahrscheinlichkeit γ = 1 –
zwischen zwei Werten – z 0 und z 0, welche wir für
eine vorgegebene Wahrscheinlichkeit bestimmen können. Somit gilt:
18
P ( − z0 ≤ Z ≤ z0
)=
(
P D − ∆d ≤ δ ≤ D + ∆d
1− α
)=
1− α
wobei ∆ d = z 0 ⋅
σ 12
N1
σ 22
+
N2
(z)
= 1– α
– z0
Fehler
0
z0
z
δ
d − ∆d
d
d + ∆d
Konfidenzintervall für die Differenz zweier unbekannten Mittelwerte µ 1 – µ 2
bekannten Varianzen σ 12 bzw. σ 22 bei Verwendung zweier unabhängiger
Stichproben
mit
Seien x bzw. y die Mittelwerte von zwei unabhängigen Stichproben der Größen N 1
bzw. N 2 aus Grundgesamtheiten mit dem unbekannten Mittelwerten µ 1 bzw. µ 2 und
bekannten Varianzen σ 12 bzw. σ 22. Sei ferner die Stichprobenverteilung der Differenz
der Mittelwerte annähernd normalverteilt, so ist das Konfidenzintervall
(Vertrauensintervall) für die Differenz der Mittelwerte δ = µ 1 – µ 2 mit dem
Vertrauensniveau γ = 1 –
gegeben durch:
d
(x
−y
–
)
− z0 ⋅
∆d
σ 12
N1
≤
+
σ 22
N2
≤
δ
(µ1 −
d
≤
µ2
)
≤
(x
−y
+
)
+ z0 ⋅
∆d
σ 12
N1
+
σ 22
N2
Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall die
wahre Differenz der Mittelwerte δ = µ 1 – µ 2 überdeckt. Der Wert für z 0 wird in
Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 – aus der Standard-NormalVerteilung bestimmt.
19
Konstruktion eines Konfidenzintervalls für die unbekannte Differenz µ 1 – µ 2 mit
bekannten Standardabweichungen σ 1 bzw. σ 2 bei zwei unabhängigen
Stichproben
Wählen eines Vertrauensniveau γ = 1 – ( z.B. 90% ; 95% ; 99%)
Entnahme zweier Stichproben vom Umfang N 1 bzw. N 2 und Berechnung von x
bzw. y und anschließend d = x – y
Bestimmung von z 0 mit Φ ( z 0 ) = 1 –
2,
(wobei Φ ( z ) die Verteilungsfunktion der Standard-Normal-Verteilung ist.)
Berechnung von ∆ d = z 0 ⋅
σ 12
N1
+
σ 22
N2
.
Angabe des Konfidenzintervalls für δ = µ 1 – µ 2 .
( &
)
Für die Produktion von Fernsehern hat eine Firma Flüssigkristallanzeigen (LCD) bei zwei
verschiedenen Herstellern A bzw. B bestellt. Die Lebensdauer der LCD’s sei eine
normalverteilte Zufallsvariable. Die Standardabweichungen sind bekannt und betragen
0,2 Jahre bzw. 0,1 Jahre. Die Firma hat eine zufällige Stichprobe von 5 LCD’s aus
Hersteller A und eine zufällige Stichprobe von 8 LCD’s aus Hersteller B entnommen.
Dabei erhielt sie die Mittelwerte 5,8 Jahre bzw. 5,5 Jahre. Bestimmen Sie das
Vertrauensintervall für die wahre Differenz der mittleren Lebensdauer der LCD’s aus
beiden Herstellern zu einem Vertrauensniveau von 99%.
*+
,
Gesamtheit A : µ A : unbekannt ; σ A = 0,2
Stichprobenumfang aus A: NA = 5
Gesamtheit B : µ B : unbekannt ; σ B = 0,1
Stichprobenumfang aus B: NB = 8
Da die beiden Gesamtheiten normalverteilt sind, sind die Verteilung der StichprobenMittelwerte aus den beiden Gesamtheiten auch normalverteilt, obwohl beide
Stichprobengrößen < 30 sind.
(z)
0,99
0,005
0,005
–z
0
+z
0
z
0
Vertrauensniveau: 1 – α = 0,99
Umfänge der Stichproben: NA = 5 ; NB = 8
Mittelwerte der Stichproben: x = 5,8 ; y = 5,5
d = 0,3 [Jahre]
Bestimmung von z 0 : Φ ( z 0 ) = 1 – 0,01 2 = 0,995
z0
Berechnung von
d : ∆ d = 2 , 575 ⋅
0,2
2
5
Angabe des Konfidenzintervalls für δ = µ 1 – µ 2:
+
0 ,1
2,575
2
8
= 0,25 [Jahre]
d – ∆d ≤ δ ≤ d + ∆d
0,05 ≤
δ
≤
0,55
[Jahre]
20
-
!"
#
$
'
%
& "'
Wenn die Varianzen σ 12 bzw. σ 22 der beiden Grundgesamtheiten unbekannt aber
gleich sind σ 12 = σ 22 , ersetzten wir in der standardisierte Zufallsvariable
(X
Z =
− Y
)−
σ 12
N1
(µ1
+
− µ2
)
σ 22
N2
diese durch die Schätzfunktionen der Varianzen S12 bzw. S22 der beiden unabhängigen
Stichproben. Wenn die beiden Gesamtheiten normalverteilt sind, dann gehorcht die
Zufallsvariable
(X
T =
− Y
) − (µ1
S p2
N1
+
− µ2
)
S p2
N2
nicht mehr der Standard-Normal-Verteilung sondern der Studentschen-t-Verteilung mit
ν = N 1 + N 2 – 2 Freiheitsgeraden, wobei
S p2
=
(N1
− 1 ) S 12 +
(N 2
− 1 ) S 22
N1 + N 2 − 2
der Schätzer für die Varianz σ 12 = σ 22 ist. Dieser ist das gewogene arithmetische
Mittel aus den beiden Stichproben-Varianzen:
S 12
=
1
N1 − 1
N1
⋅
i = 1
(X i
−X
)
2
und
S 22
=
1
N2 − 1
N2
⋅
(Y i
−Y
)2
i = 1
Bei der Intervallschätzung für die Differenz der Mittelwerte δ = µ 1 – µ 2 können wir
mit einer gewissen Wahrscheinlichkeit γ = 1 – α erwarten, dass diese Differenz in
einem Intervall um die Schätzfunktion D der Differenz der Mittelwerte von zwei
Stichproben der Größen N 1 bzw. N 2 aus den beiden Gesamtheiten liegt.
D − ∆D ≤ δ ≤ D + ∆D
Somit gilt:
21
P ( − t0 ≤ T ≤ t0
)
= 1− α
(
)=
P D − ∆D ≤ δ ≤ D + ∆D
1− α
S p2
wobei ∆D = t 0 ⋅
N1
S p2
+
N2
ist
fν (t)
Fehler
= 1– α
d − ∆d
0
– t0
d
δ
d + ∆d
t
t0
Konfidenzintervall für die Differenz zweier unbekannten Mittelwerte µ 1 – µ 2
unbekannten aber gleichen Varianzen σ 12 = σ 22 bei Verwendung zweier
unabhängiger Stichproben
mit
Seien x bzw. y die Mittelwerte und seien s12 bzw. s22 die Varianzen von zwei
unabhängigen Stichproben der Größen N 1 bzw. N 2 aus zwei normalverteilten
Grundgesamtheiten mit dem unbekannten Mittelwerten µ 1 bzw. µ 2 und unbekannten
aber gleichen Varianzen σ 12 = σ 22. Dann ist das Konfidenzintervall
(Vertrauensintervall) für die Differenz der Mittelwerte δ = µ 1 – µ 2 mit dem
Vertrauensniveau γ = 1 –
gegeben durch:
d
(x
−y
∆d
–
)
− t0 ⋅
s p2
N1
+
≤
s p2
N2
≤
δ
(µ1 −
d
≤
µ2
)
≤
(x
−y
∆d
+
)
+ t0 ⋅
s p2
N1
+
s p2
N2
wobei
s
2
p
=
(N1
− 1 ) s 12 +
(N 2
− 1 ) s 22
N1 + N 2 − 2
der Schätzwert für die Punktschätzung der Varianz σ 12 = σ 22 ist.
Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall die
wahre Differenz der Mittelwerte δ = µ 1 – µ 2 überdeckt. Der Wert für t 0 wird in
Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 – aus der Studentschen-tVerteilung mit ν = N 1 + N 2 – 2 Freiheitsgeraden bestimmt.
22
Konstruktion eines Konfidenzintervalls für die unbekannte Differenz µ 1 – µ 2 mit
unbekannten aber gleichen Standardabweichungen σ 1 = σ 2 bei zwei
unabhängigen Stichproben
Wählen eines Vertrauensniveau γ = 1 – α ( z.B. 90% ; 95% ; 99%)
Entnahme zweier Stichproben vom Umfang N 1 bzw. N 2 und Berechnung von x
bzw. y und anschließend d = x – y sowie Berechnung von s12 bzw. s22.
Bestimmung von t 0 mit F v ( t 0 ) = 1 – α 2
( wobei F v ( t ) die Verteilungsfunktion der Student-t-Verteilung mit der
Freiheitsgerade ν = N 1 + N 2 – 2 ist.
Berechnung von ∆d = t 0 ⋅
(wobei s
2
p
=
(N1
s p2
N1
− 1 ) s 12 +
+
s p2
N2
(N 2
.
− 1 ) s 22
N1 + N 2 − 2
ist)
Angabe des Konfidenzintervalls für δ = µ 1 – µ 2 .
.
' In einem Experiment von der Zeitschrift „Popular Science“ aus dem Jahre 1981 wurden
die Spritverbrauchswerte von 2 Auto-Marken der Mittelklasse von VW und Toyota
untersucht, die ähnliche Diesel-Motoren besaßen. Dabei wurden 12 VW-Wagen und 10
Toyota-Wagen bei der Geschwindigkeit 90 km/h untersucht. Dabei erhielt man für die
VW-Wagen einen durchschnittlichen Verbrauch von 16 Km pro Liter und eine
Standardabweichung von 1 Km pro Liter. Und für die Toyota-Wagen einen
durchschnittlichen Verbrauch von 11 Km pro Liter und eine Standardabweichung von 0,8
Km pro Liter. Es wird angenommen, dass die Verbrauchswerte für beide Marken
normalverteilt und deren Standardabweichungen identisch sind. Bestimmen Sie ein
Vertrauensintervall für die wahre Differenz des durchschnittlichen Verbrauchs der beiden
Auto-Marken zu einem Vertrauensniveau von 90%.
*+
,
23
!"
#
$
%
& "'
Wenn die Varianzen σ 12 bzw. σ 22 der beiden Grundgesamtheiten unbekannt und
verschieden sind σ 12
σ 22 , ersetzten wir in der standardisierte Zufallsvariable
(X
Z =
− Y
) − (µ1
σ 12
N1
+
− µ2
)
σ 22
N2
diese durch die Schätzfunktionen der Varianzen S12 bzw. S22 der beiden unabhängigen
Stichproben. Wenn die beiden Gesamtheiten normalverteilt sind, dann gehorcht die
Zufallsvariable
(X
T =
− Y
) − (µ1
S 12
N1
+
− µ2
)
S 22
N2
der Studentschen-t-Verteilung mit der Freiheitsgerade
S 12
ν =
S 12
(N1
+
N1
2
N1
− 1)
S 22
S 22
+
(N 2
2
N2
2
N2
− 1)
Da ν eine natürliche Zahl sein muss, runden wir diese berechnete Freiheitsgerade.
Bei der Intervallschätzung für die Differenz der Mittelwerte δ = µ 1 – µ 2 können wir
mit einer gewissen Wahrscheinlichkeit γ = 1 – α erwarten, dass diese Differenz in
einem Intervall um die Schätzfunktion D der Differenz der Mittelwerte von zwei
Stichproben der Größen N 1 bzw. N 2 aus den beiden Gesamtheiten liegt.
D − ∆D ≤ δ ≤ D + ∆D
Somit gilt:
24
P ( − t0 ≤ T ≤ t0
)
= 1− α
(
P D − ∆D ≤ δ ≤ D + ∆D
)=
1− α
S 12
wobei ∆ D = t 0 ⋅
N1
S 22
+
ist
N2
fν (t)
Fehler
= 1– α
d − ∆d
0
– t0
δ
d
d + ∆d
t
t0
Konfidenzintervall für die Differenz zweier unbekannten Mittelwerte µ 1 – µ 2 mit
unbekannten aber unterschiedlichen Varianzen σ 12 σ 22 bei Verwendung zweier
unabhängiger Stichproben
Seien x bzw. y die Mittelwerte und seien s12 bzw. s22 die Varianzen von zwei
unabhängigen Stichproben der Größen N 1 bzw. N 2 aus zwei normalverteilten
Grundgesamtheiten mit dem unbekannten Mittelwerten µ 1 bzw. µ 2 und unbekannten
und unterschiedlichen Varianzen σ 12
σ 22. Dann ist das Konfidenzintervall
(Vertrauensintervall) für die Differenz der Mittelwerte δ = µ 1 – µ 2 mit dem
Vertrauensniveau γ = 1 –
gegeben durch:
d
(x
−y
–
)
− t0 ⋅
∆d
s 12
N1
+
≤
s 22
N2
≤
δ
(µ1 −
d
≤
µ2
)
≤
(x
−y
∆d
+
)
+ t0 ⋅
s 12
N1
s 22
+
N2
Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall die
wahre Differenz der Mittelwerte δ = µ 1 – µ 2 überdeckt. Der Wert für t 0 wird in
Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 – aus der Studentschen-tVerteilung mit der Freiheitsgerade
s 12
ν =
s 12
(N1
+
N1
2
N1
− 1)
s 22
s 22
+
(N 2
2
N2
2
N2
− 1)
bestimmt. Falls ν keine natürliche Zahl ist, runden wir diesen Wert.
25
Konstruktion eines Konfidenzintervalls für die unbekannte Differenz µ 1 – µ 2 mit
unbekannten und unterschiedlichen Standardabweichungen σ 1 σ 2 bei zwei
unabhängigen Stichproben
Wählen eines Vertrauensniveau γ = 1 – α ( z.B. 90% ; 95% ; 99%)
Entnahme zweier Stichproben vom Umfang N 1 bzw. N 2 und Berechnung von x
bzw. y und anschließend d = x – y sowie Berechnung von s12 bzw. s22.
Bestimmung von t 0 mit F v ( t 0 ) = 1 – α 2
( wobei F v ( t ) die Verteilungsfunktion der Student-t-Verteilung mit der
s 12
Freiheitsgerade ν =
s 12
(N1
+
N1
2
s 22
s 22
N1
+
− 1)
(N 2
2
N2
2
ist.
N2
− 1)
Falls ν keine natürliche Zahl ist, runden wir diesen Wert.
Berechnung von ∆ d = t 0 ⋅
s 12
N1
+
s 22
N2
.
Angabe des Konfidenzintervalls für δ = µ 1 – µ 2 .
.
'
Für die Produktion von Fernsehern hat eine Firma Flüssigkristallanzeigen (LCDs) bei
zwei verschiedenen Herstellern A bzw. B bestellt. Die Lebensdauer der LCDs sei eine
normalverteilte Zufallsvariable. Die Standardabweichungen sind unterschiedlich. Die
Firma hat eine zufällige Stichprobe von 5 LCDs aus Hersteller A und eine zufällige
Stichprobe von 7 LCDs aus Hersteller B entnommen. Dabei erhielt sie die Mittelwerte 5,8
Jahre bzw. 5,5 Jahre sowie die Standardabweichung 0,18 bzw. 0,15. Bestimmen Sie
das Vertrauensintervall für die wahre Differenz der mittleren Lebensdauer der LCDs aus
beiden Herstellern zu einem Vertrauensniveau von 95%.
*+
,
26
Herunterladen