Mathematik IV für Maschinenbau und Informatik (Stochastik) Universität Rostock, Institut für Mathematik Sommersemester 2007 Prof. Dr. F. Liese Dipl.-Math. M. Helwich Serie 12 Termin: 29. Juni 2007 Aufgabe 1 (3 Punkte) Zwei Ohmsche Widerstände sind hintereinander geschaltet. Die Werte R1 und R2 für diese Widerstände sind unabhängig voneinander und normalverteilt mit µ1 = 500 Ω und σ1 = 10 Ω bzw. µ2 = 200 Ω und σ2 = 2 Ω. In welchen Grenzen 700 − c und 700 + c liegt mit der Wahrscheinlichkeit 0.99 der Gesamtwiderstand? Lösung: Den Gesamtwiderstand einer Reihenschaltung von Widerständen erhält man, indem man die Einzelwiderstände addiert. Wir betrachten somit hier den Gesamtwiderstand G = R1 + R2 , welcher ebenfalls eine normalverteilte Zufallsgröße mit µ = µ1 +µ2 = 700 Ω und Varianz σ 2 = σ12 +σ22 = 104 Ω2 ist. Weiter wissen wir, dass die zentrierte Zufallsgröße Z := G−µ standardnormalverteilt ist und somit σ gilt 1 − α = P z α2 ≤ Z ≤ z1− α2 G−µ α α = P z2 ≤ ≤ z1− 2 σ = P µ + z α2 σ ≤ G ≤ µ + z1− α2 σ = P µ − z1− α2 σ ≤ G ≤ µ + z1− α2 σ . √ Wegen µ = 700 ergibt sich für das gesuchte c der Wert z1− α2 σ , welcher mit α = 0.01 und σ = 104 √ √ gleich c = z0.995 104 = 2.57583 · 104 ≈ 26.26 entspricht. Damit liegt der Gesamtwiderstand mit der vorgegebenen Wahrscheinlichkiet im Intervall [673.74; 726.26]. Aufgabe 2 (6 Punkte) Die Kapazität K von Kondensatoren einer größeren Lieferung sei eine normalverteilte Zufallsvariable mit dem Erwartungswert µ = 200 µF und der Varianz σ 2 = 25 (µF )2 . Wie groß ist die Wahrscheinlichkeit p (oder p · 100% = Ausschussanteil) dafür, dass ein zufällig herausgegriffener Kondensator fehlerbehaftet ist, wenn die Kapazität K qualitätsgerechter Kondensatoren a) mindestens 198 µF betragen muss, b) höchstens 202 µF betragen darf, c) maximal 5 µF vom Sollwert 200 µF abweichen darf? d) Bei welchen Toleranzgrenzen 200 − c; 200 + c ist die Wahrscheinlichkeit für das Auftreten eines fehlerbehafteten Kondensators kleiner als 0.01? Lösung: Gegeben ist eine normalverteilte Zufallsgröße K mit Erwartungswert µ = 200 und Varianz σ 2 = 25 . Die Standardabweichung ist dann σ = 5 . Betrachten wir wieder die entsprechende zentrierte K−200 Größe Z := K−µ so erhalten wir eine standardnormalverteilte Zufallsgröße. σ = 5 a) Die Ausschusswahrscheinlichkeit p berechnet sich wie folgt: K − 200 198 − 200 198 − 200 p = P (K < 198) = P < =Φ 5 5 5 = Φ(−0.4) = 1 − Φ(0.4) = 1 − 0.655422 ≈ 0.34. 1 b) Die Ausschusswahrscheinlichkeit p berechnet sich wie folgt: K − 200 202 − 200 202 − 200 p = P (K > 202) = 1 − P (K ≤ 202) = 1 − P < =1−Φ 5 5 5 = 1 − Φ(0.4) = 1 − 0.655422 ≈ 0.34. c) Die Ausschusswahrscheinlichkeit p berechnet sich wie folgt: p = P (K < 200 − 5 oder K > 200 + 5) K − 200 205 − 200 195 − 200 ≤ < = 1 − P (195 ≤ K < 205) = 1 − P 5 5 5 205 − 200 195 − 200 = 1−Φ +Φ 5 5 = 1 − Φ(1) + Φ(−1) = 1 − Φ(1) + 1 − Φ(1) = 2 − 2 Φ(1) = 2 − 2 · 0.841345 ≈ 0.317. d) Hier verfahren wir wie in Aufgabe 1. Es gilt 1 − α = P µ − z1− α2 σ ≤ K ≤ µ + z1− α2 σ = P 200 − z1− α2 5 ≤ K ≤ 200 + z1− α2 5 . Für das gesuchte c erhalten wir den Wert z1− α2 σ , welcher mit α = 0.01 und σ = 5 gleich c = z0.995 5 = 2.57583 · 5 ≈ 12.879. entspricht. Mit dem Intervall [187.121; 212.879] für die Kapazitäten beläuft sich demnach die Wahrscheinlichkeit eines Fehlerhaften Kondensators auf den vorgegebenen Wert 1%. Aufgabe 3 (3 Punkte) 20 Schrauben aus einem Sortiment haben die Längen (in mm): 10; 11; 13; 11; 12; 13; 14; 10; 9; 10; 10; 11; 12; 14; 14; 10; 11; 10; 16; 9 Unter der Voraussetzung, dass diese Stichprobe aus einer normalverteilten Grundgesamtheit mit σ = 1 stammt, konstruiere man ein Konfidenzintervall für µ zur Sicherheit von 1 − α = 0.99. Welches Intervall hätte sich ergeben, wenn σ nicht bekannt gewesen wäre? Lösung: Wir erhalten für das arithmetische Mittel der Beobachtungen den Wert x̄ = 11.5. Damit ergibt sich das folgende Konfidenzintervall für den unbekannten Parameter µ bei bekannter Varianz σ = 1: σ σ x̄ − z1− α2 √ ; x̄ + z1− α2 √ n n " r r # 1 1 = 11.5 − z1− α2 ; 11.5 + z1− α2 . 20 20 Mit dem Quantil der Standardnormalverteilung z1− α2 = z0.995 = 2.57583 ergibt sich mit der Sicherheitswahrscheinlichkeit 1 − α = 0.99 das Intervall " r r # 1 1 11.5 − 2.57583 ; 11.5 + 2.57583 ≈ [10.924; 12.076] . 10 10 2 1 Pn 2 Bei unbekannter Varianz berechnen wir die Stichprobenvarianz als s2n = n−1 i=1 (xi − x̄) = 3.7368 √ und erhalten damit die Stichprobenstandardabweichung sn = 3.7368 = 1.93308 , welche in folgendes Konfidenzintervall eingesetzt wird: sn sn xn − √ t1− α2 ,n−1 ; xn + √ t1− α2 ,n−1 n n 1.93308 1.93308 = 11.5 − √ t1− α2 ,n−1 ; 11.5 + √ t1− α2 ,n−1 . 20 20 Mit den Quantilen der t -Verteilung mit n − 1 = 19 Freiheitsgraden, t1− α2 ,n−1 = t0.995,19 = 2.86, ergibt sich mit der Sicherheitswahrscheinlichkeit 1 − α = 0.99 das Intervall 1.93308 1.93308 11.5 − √ 2.86 ; 11.5 + √ 2.86 ≈ [10.2638; 12.7362]. 20 20 Das dieses Intervall so deutlich größer ausfällt liegt wohl auch an der Vorgabe, dass die wahre Varianz gleich 1 sein soll, aber die Stichprobenvarianz fast 4 ergibt. Aufgabe 4 (4 Punkte) Bei einer Abfüllmaschine für Haferflocken wurden die Abweichungen vom Normwert 500 g bei 50 Packungen registriert. Dabei ergaben sich folgende Werte. Zerlegen Sie das Intervall von 9 bis 13 in 8 gleichlange Intervalle und tragen Sie die relativen Häufigkeiten über diesen Intervallen in Form eines Säulendiagramms ab. Welche Dichtefunktion ließe sich hier gut anpassen? 10.4 10.87 8.45 10.43 9.87 11.07 10.86 8.32 10.53 10.44 8.95 10.62 11.14 10.71 11.59 11.45 11.12 11.09 10.64 8.53 11 8.32 10.11 13.3 11.65 9.62 8.99 8.62 9.21 11.6 9.78 10.9 9.94 11.02 9.72 12.62 12.49 9.68 9.67 9.19 11.36 10.67 9.57 12.01 9.77 9.26 12.26 12.09 10.03 9.97 Lösung: Mit einer anderen Klasseneinteilung als vorgegeben erhält man ein Histogramm, welches von normalverteilten Daten stammen könnte. Der Mittelwert der Abweichungen ist im Übrigen 10.43 und die Stichprobenvarianz 1.4 . 3 Aufgabe 5 (4 Punkte) Die Brenndauer in 100 h von Glühlampen einer bestimmten Sorte wurde mit Hilfe einer Stichprobe vom Umfang 40 ermittelt. Dabei ergaben sich folgende Werte. 21.43 7.18 12.67 15.1 0.38 6.03 8.44 15.01 0.82 5.19 4.91 5.21 13.57 8.3 4.13 39.88 5.61 9.43 9.44 4.57 10.29 7.62 1.04 19.84 24.39 14.08 9.91 8.73 25.77 5.35 8.3 10.76 0.38 7.53 10.83 6.91 0.09 7.98 3.29 7.94 Zerlegen Sie den Bereich 0 bis 40 in 5 gleichlange Intervalle und stellen Sie die relativen Häufigkeiten als Säulendiagramme über diesen Intervallen dar. Welcher Dichte könnte dieses Diagramm entsprechen? Lösung: Mit der vorgegebenen Klasseneinteilung erhält man ein Histogramm, welches von exponentialverteilten Daten stammen könnte. Die mittlere Brenndauer ist 9.7 und die Stichprobenvarianz 61.41 . Und hier nochmal alles zum χ2 -Unabängigkeitstest zum Mitlesen. Stören Sie sich bitte nicht daran, dass die Prüfgröße hier mit QK bezeichnet ist anstatt mit χ2 . DAs ist auch manchmal üblich und kommt von quadratischer Kontingenz. Ich hoffe, es ist hier wenigstens konsistent durchgezogen. Ganz allgemein dienen Kontingenztafeln dazu, die Verteilungen von zweidimensionalen diskreten Zufallsgrößen zu beschreiben. Sind also X und Y zwei diskrete Zufallsgrößen mit den möglichen Werten x1 , x2 , ... und y1 , y2 , ... , dann sind sowohl die Verteilung von X als auch die Verteilung von Y durch die Einzelwahrscheinlichkeiten pi = P (X = xi ), i = 1, 2, ... und qj = P (Y = yj ), j = 1, 2, ... eindeutig festgelegt. Diese beiden Verteilungen entsprechen den so genannten Randverteilungen für die zweidimensionale Verteilung von (X, Y ). Die zweidimensionale Zufallsgröße (X, Y ) nimmt die Werte (xi , yj ), i, j = 1, 2.. mit den Wahrscheinlichkeiten pij = P (X = xi , Y = yi ), i, j = 1, 2... an. Dabei ist natürlich auch die zweidimensionale Verteilung von (X, Y ) selbst eine diskrete Verteilung und die Werte pij sind die zugehörigen Einzelwahrscheinlichkeiten. Angenommen, dass die Zufallsgröße X r Werte annimmt, also x1 , x2 , ..., xr , und die Zufallsgröße Y habe den Wertebereich y1 , y2 , ..., yc , kann also c Werte annehmen. Dann gibt es insgesamt r · c Werte, die die zweidimensionale Zufallsgröße (X, Y ) annehmen kann und die entsprechenden Einzelwahrscheinlichkeiten pij finden sich in nachfolgender Kontingenztabelle wieder. 4 x1 x2 .. . y1 p11 p21 .. . y2 p12 p22 .. . ... ... ... ... ... ... ... ... ... yc p1c p2c .. . Σ p1 p2 .. . xr Σ pr1 q1 pr2 q2 ... ... ... prc qc pr 1 In der letzten Zeile und der letzten Spalte stehen sie summierten Werte, welche den Einzelwahrscheinlichkeiten der Randverteilungen entsprechen. Es gilt grundsätzlich die folgende Beziehung zwischen einer zweidimensionalen Verteilung und ihren beiden Randverteilungen: pi = P (X = xi ) = X P (X = xi , Y = yj ) = j X pij , i = 1, ..., r j und qj = P (Y = yj ) = X P (X = xi , Y = yj ) = i X pij , j = 1, ..., c i Einfach gesagt, wird immer nur der Wert einer Komponente berücksichtigt und die Ausprägung der anderen vernachlässigt. Zwei Zufallsgrößen X und Y sind nach Definition unabhängig voneinander, wenn die gemeinsame Verteilung dem Produkt der Randverteilungen entspricht, wenn also gilt: pij = P (X = xi , Y = yi ) = P (X = xi ) P (Y = yi ) = pi pj , i, j = 1, 2... Wir betrachten nun eine Stichprobe der Größe n aus einer zweidimensionalen Grundgesamtheit und beobachten damit die Werte zweier Merkmale mit r bzw. c möglichen verschiedenen Ausprägungen. Die Kontingenztabelle enthält dann die beobachteten Häufigkeiten hij , i = 1, ..., r; j = 1, ..., c aller möglichen c · r Merkmalskombinationen. x1 x2 .. . y1 h11 h21 .. . y2 h12 h22 .. . ... ... ... ... ... ... ... ... ... yc h1c h2c .. . Σ h1· h2· .. . xr Σ hr1 h·1 hr2 h·2 ... ... ... hrc h·c hr· ΣΣ h·· = n Die Zahlen in der letzten Zeile und der letzten Spalte sind dann wieder die Summenwerte, die den Häufigkeiten des Auftretens beider Einzelmerkmale entsprechen. Man beachte, dass die eingetragenen Häufigkeiten absolute Häufigkeiten sind. Die entsprechenden relativen Häufigkeiten würden sich aus der Division mit der Anzahl der Beobachtungen n ergeben. Im Fall der Unabhängigkeit beider Merkmale sollten die Beobachtungswerte hij den so genannten theoretischen Werten ungefähr entsprechen. Die theoretischen Werte berechnen sich, wie oben die Wahrscheinlichkeiten, als Produkt der beobachteten relativen Häufigkeiten der beiden einzelnen Merkmale hi· · h·j hth . ij = n Die Prüfgröße wird dann wie folgt berechnet: QK = r X c 2 X (hij − hth ij ) i=1 j=1 5 hth ij . Unter der Nullhypothese, dass X und Y unabhängig sind, ist die Prüfgröße QK χ2 -verteilt mit m = (r−1) (c−1) Freiheitsgraden. Damit sollte diese Nullhypothese mit einer Fehlerwahrscheinlichkeit α verworfen werden, falls QK > χ2m;(1−α) , wobei natürlich χ2m;(1−α) das (1 − α) -Quantil einer χ2 -Verteilung mit m Freiheitsgraden ist. Beispiel: Wir betrachten die beiden Merkmale Geschlecht und Raucherstatus und untersuchen anhand von 11 Personen, ob es einen Zusammenhang zwischen diesen beiden Merkmalen gibt. Die Kontingenztabelle ist wie folgt gegeben: smoker non-smoker sum male 3 6 9 female 2 0 2 sum 5 6 11 Aus dieser Tabelle berechnen wir zunächst die theoretischen Werte hth 11 = 2·5 9·6 2·6 9·5 = 4.0909, hth = 0.909, hth = 4.909, hth = 1.0909, 12 = 21 = 22 = 11 11 11 11 und erhalten anschließend für die Prüfgröße QK = (3 − 4.0909)2 (2 − 0.909)2 (6 − 4.909)2 (0 − 1.0909)2 + + + = 2.934. 4.0909 0.909 4.909 1.0909 Bei einem Signifikanzniveau von 5% müssen wir diesen Wert mit dem entsprechenden Quantil einer χ2 -Verteilung mit (2 − 1) · (2 − 1) = 1 Freiheitsgraden vergleichen. Das ist der Wert 3.8 . Somit haben wir wegen QK = 2.934 < 3.8 keinen Grund, die Hypothese H0 abzulehnen und es scheint hier keinen Zusammenhang zwischen dem Geschlecht und der Schwäche für Zigaretten zu geben. Übungsaufgaben sind verfügbar unter: http://www.math.uni-rostock.de/ ∼ helwich/Uebungen.html 6