Hier werden Intervallschätzungen für die Differenz von Mittelwerten zweier Gesamtheiten sowie die Intervallschätzung für das Verhältnis von Varianzen zweier Gesamtheiten vorgestellt. !" # $ % & "' Wir betrachten zwei Gesamtheiten mit den unbekannten Mittelwerten µ 1 bzw. µ 2 aber bekannten Varianzen σ 12 bzw. σ 22 . Falls die Verteilung der StichprobenMittelwerte X bzw. Y aus den beiden Gesamtheiten normalverteilt ist und die Stichproben unabhängig voneinander sind, so ist die Differenz der beiden StichprobenMittelwerte D = X – Y auch normalverteilt (s. voriges Kapitel). Bei der Intervallschätzung für die Differenz der Mittelwerte δ = µ 1 – µ 2 können wir erwarten, dass diese Differenz in einem Intervall um die Schätzfunktion D der Differenz der Mittelwerte von zwei Stichproben der Größen N 1 bzw. N 2 aus den beiden Gesamtheiten liegt. D − ∆d ≤ δ ≤ D + ∆d Wenn die Stichprobenverteilungen annähernd einer Normalverteilungen entsprechen, können wir erwarten, dass δ mit einer gewissen Wahrscheinlichkeit γ=1– in einem Intervall um D liegt. Folglich liegt nach dem Theorem (aus Kap. 10 Abschnitt 10.6) die standardisierte Zufallsvariable D Z = (X δ − Y )− σ 12 N1 (µ1 + − µ2 ) σ 22 N2 mit der Wahrscheinlichkeit γ = 1 – zwischen zwei Werten – z 0 und z 0, welche wir für eine vorgegebene Wahrscheinlichkeit bestimmen können. Somit gilt: 18 P ( − z0 ≤ Z ≤ z0 )= ( P D − ∆d ≤ δ ≤ D + ∆d 1− α )= 1− α wobei ∆ d = z 0 ⋅ σ 12 N1 σ 22 + N2 (z) = 1– α – z0 Fehler 0 z0 z δ d − ∆d d d + ∆d Konfidenzintervall für die Differenz zweier unbekannten Mittelwerte µ 1 – µ 2 bekannten Varianzen σ 12 bzw. σ 22 bei Verwendung zweier unabhängiger Stichproben mit Seien x bzw. y die Mittelwerte von zwei unabhängigen Stichproben der Größen N 1 bzw. N 2 aus Grundgesamtheiten mit dem unbekannten Mittelwerten µ 1 bzw. µ 2 und bekannten Varianzen σ 12 bzw. σ 22. Sei ferner die Stichprobenverteilung der Differenz der Mittelwerte annähernd normalverteilt, so ist das Konfidenzintervall (Vertrauensintervall) für die Differenz der Mittelwerte δ = µ 1 – µ 2 mit dem Vertrauensniveau γ = 1 – gegeben durch: d (x −y – ) − z0 ⋅ ∆d σ 12 N1 ≤ + σ 22 N2 ≤ δ (µ1 − d ≤ µ2 ) ≤ (x −y + ) + z0 ⋅ ∆d σ 12 N1 + σ 22 N2 Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall die wahre Differenz der Mittelwerte δ = µ 1 – µ 2 überdeckt. Der Wert für z 0 wird in Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 – aus der Standard-NormalVerteilung bestimmt. 19 Konstruktion eines Konfidenzintervalls für die unbekannte Differenz µ 1 – µ 2 mit bekannten Standardabweichungen σ 1 bzw. σ 2 bei zwei unabhängigen Stichproben Wählen eines Vertrauensniveau γ = 1 – ( z.B. 90% ; 95% ; 99%) Entnahme zweier Stichproben vom Umfang N 1 bzw. N 2 und Berechnung von x bzw. y und anschließend d = x – y Bestimmung von z 0 mit Φ ( z 0 ) = 1 – 2, (wobei Φ ( z ) die Verteilungsfunktion der Standard-Normal-Verteilung ist.) Berechnung von ∆ d = z 0 ⋅ σ 12 N1 + σ 22 N2 . Angabe des Konfidenzintervalls für δ = µ 1 – µ 2 . ( & ) Für die Produktion von Fernsehern hat eine Firma Flüssigkristallanzeigen (LCD) bei zwei verschiedenen Herstellern A bzw. B bestellt. Die Lebensdauer der LCD’s sei eine normalverteilte Zufallsvariable. Die Standardabweichungen sind bekannt und betragen 0,2 Jahre bzw. 0,1 Jahre. Die Firma hat eine zufällige Stichprobe von 5 LCD’s aus Hersteller A und eine zufällige Stichprobe von 8 LCD’s aus Hersteller B entnommen. Dabei erhielt sie die Mittelwerte 5,8 Jahre bzw. 5,5 Jahre. Bestimmen Sie das Vertrauensintervall für die wahre Differenz der mittleren Lebensdauer der LCD’s aus beiden Herstellern zu einem Vertrauensniveau von 99%. *+ , Gesamtheit A : µ A : unbekannt ; σ A = 0,2 Stichprobenumfang aus A: NA = 5 Gesamtheit B : µ B : unbekannt ; σ B = 0,1 Stichprobenumfang aus B: NB = 8 Da die beiden Gesamtheiten normalverteilt sind, sind die Verteilung der StichprobenMittelwerte aus den beiden Gesamtheiten auch normalverteilt, obwohl beide Stichprobengrößen < 30 sind. (z) 0,99 0,005 0,005 –z 0 +z 0 z 0 Vertrauensniveau: 1 – α = 0,99 Umfänge der Stichproben: NA = 5 ; NB = 8 Mittelwerte der Stichproben: x = 5,8 ; y = 5,5 d = 0,3 [Jahre] Bestimmung von z 0 : Φ ( z 0 ) = 1 – 0,01 2 = 0,995 z0 Berechnung von d : ∆ d = 2 , 575 ⋅ 0,2 2 5 Angabe des Konfidenzintervalls für δ = µ 1 – µ 2: + 0 ,1 2,575 2 8 = 0,25 [Jahre] d – ∆d ≤ δ ≤ d + ∆d 0,05 ≤ δ ≤ 0,55 [Jahre] 20 - !" # $ ' % & "' Wenn die Varianzen σ 12 bzw. σ 22 der beiden Grundgesamtheiten unbekannt aber gleich sind σ 12 = σ 22 , ersetzten wir in der standardisierte Zufallsvariable (X Z = − Y )− σ 12 N1 (µ1 + − µ2 ) σ 22 N2 diese durch die Schätzfunktionen der Varianzen S12 bzw. S22 der beiden unabhängigen Stichproben. Wenn die beiden Gesamtheiten normalverteilt sind, dann gehorcht die Zufallsvariable (X T = − Y ) − (µ1 S p2 N1 + − µ2 ) S p2 N2 nicht mehr der Standard-Normal-Verteilung sondern der Studentschen-t-Verteilung mit ν = N 1 + N 2 – 2 Freiheitsgeraden, wobei S p2 = (N1 − 1 ) S 12 + (N 2 − 1 ) S 22 N1 + N 2 − 2 der Schätzer für die Varianz σ 12 = σ 22 ist. Dieser ist das gewogene arithmetische Mittel aus den beiden Stichproben-Varianzen: S 12 = 1 N1 − 1 N1 ⋅ i = 1 (X i −X ) 2 und S 22 = 1 N2 − 1 N2 ⋅ (Y i −Y )2 i = 1 Bei der Intervallschätzung für die Differenz der Mittelwerte δ = µ 1 – µ 2 können wir mit einer gewissen Wahrscheinlichkeit γ = 1 – α erwarten, dass diese Differenz in einem Intervall um die Schätzfunktion D der Differenz der Mittelwerte von zwei Stichproben der Größen N 1 bzw. N 2 aus den beiden Gesamtheiten liegt. D − ∆D ≤ δ ≤ D + ∆D Somit gilt: 21 P ( − t0 ≤ T ≤ t0 ) = 1− α ( )= P D − ∆D ≤ δ ≤ D + ∆D 1− α S p2 wobei ∆D = t 0 ⋅ N1 S p2 + N2 ist fν (t) Fehler = 1– α d − ∆d 0 – t0 d δ d + ∆d t t0 Konfidenzintervall für die Differenz zweier unbekannten Mittelwerte µ 1 – µ 2 unbekannten aber gleichen Varianzen σ 12 = σ 22 bei Verwendung zweier unabhängiger Stichproben mit Seien x bzw. y die Mittelwerte und seien s12 bzw. s22 die Varianzen von zwei unabhängigen Stichproben der Größen N 1 bzw. N 2 aus zwei normalverteilten Grundgesamtheiten mit dem unbekannten Mittelwerten µ 1 bzw. µ 2 und unbekannten aber gleichen Varianzen σ 12 = σ 22. Dann ist das Konfidenzintervall (Vertrauensintervall) für die Differenz der Mittelwerte δ = µ 1 – µ 2 mit dem Vertrauensniveau γ = 1 – gegeben durch: d (x −y ∆d – ) − t0 ⋅ s p2 N1 + ≤ s p2 N2 ≤ δ (µ1 − d ≤ µ2 ) ≤ (x −y ∆d + ) + t0 ⋅ s p2 N1 + s p2 N2 wobei s 2 p = (N1 − 1 ) s 12 + (N 2 − 1 ) s 22 N1 + N 2 − 2 der Schätzwert für die Punktschätzung der Varianz σ 12 = σ 22 ist. Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall die wahre Differenz der Mittelwerte δ = µ 1 – µ 2 überdeckt. Der Wert für t 0 wird in Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 – aus der Studentschen-tVerteilung mit ν = N 1 + N 2 – 2 Freiheitsgeraden bestimmt. 22 Konstruktion eines Konfidenzintervalls für die unbekannte Differenz µ 1 – µ 2 mit unbekannten aber gleichen Standardabweichungen σ 1 = σ 2 bei zwei unabhängigen Stichproben Wählen eines Vertrauensniveau γ = 1 – α ( z.B. 90% ; 95% ; 99%) Entnahme zweier Stichproben vom Umfang N 1 bzw. N 2 und Berechnung von x bzw. y und anschließend d = x – y sowie Berechnung von s12 bzw. s22. Bestimmung von t 0 mit F v ( t 0 ) = 1 – α 2 ( wobei F v ( t ) die Verteilungsfunktion der Student-t-Verteilung mit der Freiheitsgerade ν = N 1 + N 2 – 2 ist. Berechnung von ∆d = t 0 ⋅ (wobei s 2 p = (N1 s p2 N1 − 1 ) s 12 + + s p2 N2 (N 2 . − 1 ) s 22 N1 + N 2 − 2 ist) Angabe des Konfidenzintervalls für δ = µ 1 – µ 2 . . ' In einem Experiment von der Zeitschrift „Popular Science“ aus dem Jahre 1981 wurden die Spritverbrauchswerte von 2 Auto-Marken der Mittelklasse von VW und Toyota untersucht, die ähnliche Diesel-Motoren besaßen. Dabei wurden 12 VW-Wagen und 10 Toyota-Wagen bei der Geschwindigkeit 90 km/h untersucht. Dabei erhielt man für die VW-Wagen einen durchschnittlichen Verbrauch von 16 Km pro Liter und eine Standardabweichung von 1 Km pro Liter. Und für die Toyota-Wagen einen durchschnittlichen Verbrauch von 11 Km pro Liter und eine Standardabweichung von 0,8 Km pro Liter. Es wird angenommen, dass die Verbrauchswerte für beide Marken normalverteilt und deren Standardabweichungen identisch sind. Bestimmen Sie ein Vertrauensintervall für die wahre Differenz des durchschnittlichen Verbrauchs der beiden Auto-Marken zu einem Vertrauensniveau von 90%. *+ , 23 !" # $ % & "' Wenn die Varianzen σ 12 bzw. σ 22 der beiden Grundgesamtheiten unbekannt und verschieden sind σ 12 σ 22 , ersetzten wir in der standardisierte Zufallsvariable (X Z = − Y ) − (µ1 σ 12 N1 + − µ2 ) σ 22 N2 diese durch die Schätzfunktionen der Varianzen S12 bzw. S22 der beiden unabhängigen Stichproben. Wenn die beiden Gesamtheiten normalverteilt sind, dann gehorcht die Zufallsvariable (X T = − Y ) − (µ1 S 12 N1 + − µ2 ) S 22 N2 der Studentschen-t-Verteilung mit der Freiheitsgerade S 12 ν = S 12 (N1 + N1 2 N1 − 1) S 22 S 22 + (N 2 2 N2 2 N2 − 1) Da ν eine natürliche Zahl sein muss, runden wir diese berechnete Freiheitsgerade. Bei der Intervallschätzung für die Differenz der Mittelwerte δ = µ 1 – µ 2 können wir mit einer gewissen Wahrscheinlichkeit γ = 1 – α erwarten, dass diese Differenz in einem Intervall um die Schätzfunktion D der Differenz der Mittelwerte von zwei Stichproben der Größen N 1 bzw. N 2 aus den beiden Gesamtheiten liegt. D − ∆D ≤ δ ≤ D + ∆D Somit gilt: 24 P ( − t0 ≤ T ≤ t0 ) = 1− α ( P D − ∆D ≤ δ ≤ D + ∆D )= 1− α S 12 wobei ∆ D = t 0 ⋅ N1 S 22 + ist N2 fν (t) Fehler = 1– α d − ∆d 0 – t0 δ d d + ∆d t t0 Konfidenzintervall für die Differenz zweier unbekannten Mittelwerte µ 1 – µ 2 mit unbekannten aber unterschiedlichen Varianzen σ 12 σ 22 bei Verwendung zweier unabhängiger Stichproben Seien x bzw. y die Mittelwerte und seien s12 bzw. s22 die Varianzen von zwei unabhängigen Stichproben der Größen N 1 bzw. N 2 aus zwei normalverteilten Grundgesamtheiten mit dem unbekannten Mittelwerten µ 1 bzw. µ 2 und unbekannten und unterschiedlichen Varianzen σ 12 σ 22. Dann ist das Konfidenzintervall (Vertrauensintervall) für die Differenz der Mittelwerte δ = µ 1 – µ 2 mit dem Vertrauensniveau γ = 1 – gegeben durch: d (x −y – ) − t0 ⋅ ∆d s 12 N1 + ≤ s 22 N2 ≤ δ (µ1 − d ≤ µ2 ) ≤ (x −y ∆d + ) + t0 ⋅ s 12 N1 s 22 + N2 Das Vertrauensniveau gibt an mit welcher Wahrscheinlichkeit das Vertrauensintervall die wahre Differenz der Mittelwerte δ = µ 1 – µ 2 überdeckt. Der Wert für t 0 wird in Abhängigkeit vom Wert der Wahrscheinlichkeit γ = 1 – aus der Studentschen-tVerteilung mit der Freiheitsgerade s 12 ν = s 12 (N1 + N1 2 N1 − 1) s 22 s 22 + (N 2 2 N2 2 N2 − 1) bestimmt. Falls ν keine natürliche Zahl ist, runden wir diesen Wert. 25 Konstruktion eines Konfidenzintervalls für die unbekannte Differenz µ 1 – µ 2 mit unbekannten und unterschiedlichen Standardabweichungen σ 1 σ 2 bei zwei unabhängigen Stichproben Wählen eines Vertrauensniveau γ = 1 – α ( z.B. 90% ; 95% ; 99%) Entnahme zweier Stichproben vom Umfang N 1 bzw. N 2 und Berechnung von x bzw. y und anschließend d = x – y sowie Berechnung von s12 bzw. s22. Bestimmung von t 0 mit F v ( t 0 ) = 1 – α 2 ( wobei F v ( t ) die Verteilungsfunktion der Student-t-Verteilung mit der s 12 Freiheitsgerade ν = s 12 (N1 + N1 2 s 22 s 22 N1 + − 1) (N 2 2 N2 2 ist. N2 − 1) Falls ν keine natürliche Zahl ist, runden wir diesen Wert. Berechnung von ∆ d = t 0 ⋅ s 12 N1 + s 22 N2 . Angabe des Konfidenzintervalls für δ = µ 1 – µ 2 . . ' Für die Produktion von Fernsehern hat eine Firma Flüssigkristallanzeigen (LCDs) bei zwei verschiedenen Herstellern A bzw. B bestellt. Die Lebensdauer der LCDs sei eine normalverteilte Zufallsvariable. Die Standardabweichungen sind unterschiedlich. Die Firma hat eine zufällige Stichprobe von 5 LCDs aus Hersteller A und eine zufällige Stichprobe von 7 LCDs aus Hersteller B entnommen. Dabei erhielt sie die Mittelwerte 5,8 Jahre bzw. 5,5 Jahre sowie die Standardabweichung 0,18 bzw. 0,15. Bestimmen Sie das Vertrauensintervall für die wahre Differenz der mittleren Lebensdauer der LCDs aus beiden Herstellern zu einem Vertrauensniveau von 95%. *+ , 26