Mathematik IV für Maschinenbau und Informatik (Stochastik

Werbung
Mathematik IV für Maschinenbau und Informatik (Stochastik)
Universität Rostock, Institut für Mathematik
Sommersemester 2007
Prof. Dr. F. Liese
Dipl.-Math. M. Helwich
Serie 12
Termin: 29. Juni 2007
Aufgabe 1 (3 Punkte)
Zwei Ohmsche Widerstände sind hintereinander geschaltet. Die Werte R1 und R2 für diese Widerstände sind unabhängig voneinander und normalverteilt mit
µ1 = 500 Ω
und
σ1 = 10 Ω
bzw. µ2 = 200 Ω
und σ2 = 2 Ω.
In welchen Grenzen 700 − c und 700 + c liegt mit der Wahrscheinlichkeit 0.99 der Gesamtwiderstand?
Lösung: Den Gesamtwiderstand einer Reihenschaltung von Widerständen erhält man, indem man die
Einzelwiderstände addiert. Wir betrachten somit hier den Gesamtwiderstand G = R1 + R2 , welcher
ebenfalls eine normalverteilte Zufallsgröße mit µ = µ1 +µ2 = 700 Ω und Varianz σ 2 = σ12 +σ22 = 104 Ω2
ist.
Weiter wissen wir, dass die zentrierte Zufallsgröße Z := G−µ
standardnormalverteilt ist und somit
σ
gilt
1 − α = P z α2 ≤ Z ≤ z1− α2
G−µ
α
α
= P z2 ≤
≤ z1− 2
σ
= P µ + z α2 σ ≤ G ≤ µ + z1− α2 σ
= P µ − z1− α2 σ ≤ G ≤ µ + z1− α2 σ .
√
Wegen µ = 700 ergibt sich für das gesuchte c der Wert z1− α2 σ , welcher mit α = 0.01 und σ = 104
√
√
gleich c = z0.995 104 = 2.57583 · 104 ≈ 26.26 entspricht.
Damit liegt der Gesamtwiderstand mit der vorgegebenen Wahrscheinlichkiet im Intervall [673.74; 726.26].
Aufgabe 2 (6 Punkte)
Die Kapazität K von Kondensatoren einer größeren Lieferung sei eine normalverteilte Zufallsvariable
mit dem Erwartungswert µ = 200 µF und der Varianz σ 2 = 25 (µF )2 . Wie groß ist die Wahrscheinlichkeit p (oder p · 100% = Ausschussanteil) dafür, dass ein zufällig herausgegriffener Kondensator
fehlerbehaftet ist, wenn die Kapazität K qualitätsgerechter Kondensatoren
a) mindestens 198 µF betragen muss,
b) höchstens 202 µF betragen darf,
c) maximal 5 µF vom Sollwert 200 µF abweichen darf?
d) Bei welchen Toleranzgrenzen 200 − c; 200 + c ist die Wahrscheinlichkeit für das Auftreten eines
fehlerbehafteten Kondensators kleiner als 0.01?
Lösung: Gegeben ist eine normalverteilte Zufallsgröße K mit Erwartungswert µ = 200 und Varianz
σ 2 = 25 . Die Standardabweichung ist dann σ = 5 . Betrachten wir wieder die entsprechende zentrierte
K−200
Größe Z := K−µ
so erhalten wir eine standardnormalverteilte Zufallsgröße.
σ =
5
a) Die Ausschusswahrscheinlichkeit p berechnet sich wie folgt:
K − 200
198 − 200
198 − 200
p = P (K < 198) = P
<
=Φ
5
5
5
= Φ(−0.4) = 1 − Φ(0.4) = 1 − 0.655422 ≈ 0.34.
1
b) Die Ausschusswahrscheinlichkeit p berechnet sich wie folgt:
K − 200
202 − 200
202 − 200
p = P (K > 202) = 1 − P (K ≤ 202) = 1 − P
<
=1−Φ
5
5
5
= 1 − Φ(0.4) = 1 − 0.655422 ≈ 0.34.
c) Die Ausschusswahrscheinlichkeit p berechnet sich wie folgt:
p = P (K < 200 − 5
oder K > 200 + 5)
K − 200
205 − 200
195 − 200
≤
<
= 1 − P (195 ≤ K < 205) = 1 − P
5
5
5
205 − 200
195 − 200
= 1−Φ
+Φ
5
5
= 1 − Φ(1) + Φ(−1)
= 1 − Φ(1) + 1 − Φ(1) = 2 − 2 Φ(1)
= 2 − 2 · 0.841345 ≈ 0.317.
d) Hier verfahren wir wie in Aufgabe 1. Es gilt
1 − α = P µ − z1− α2 σ ≤ K ≤ µ + z1− α2 σ
= P 200 − z1− α2 5 ≤ K ≤ 200 + z1− α2 5 .
Für das gesuchte c erhalten wir den Wert z1− α2 σ , welcher mit α = 0.01 und σ = 5 gleich
c = z0.995 5 = 2.57583 · 5 ≈ 12.879.
entspricht.
Mit dem Intervall [187.121; 212.879] für die Kapazitäten beläuft sich demnach die Wahrscheinlichkeit
eines Fehlerhaften Kondensators auf den vorgegebenen Wert 1%.
Aufgabe 3 (3 Punkte)
20 Schrauben aus einem Sortiment haben die Längen (in mm):
10; 11; 13; 11; 12; 13; 14; 10; 9; 10; 10; 11; 12; 14; 14; 10; 11; 10; 16; 9
Unter der Voraussetzung, dass diese Stichprobe aus einer normalverteilten Grundgesamtheit mit σ = 1
stammt, konstruiere man ein Konfidenzintervall für µ zur Sicherheit von 1 − α = 0.99. Welches
Intervall hätte sich ergeben, wenn σ nicht bekannt gewesen wäre?
Lösung: Wir erhalten für das arithmetische Mittel der Beobachtungen den Wert x̄ = 11.5. Damit
ergibt sich das folgende Konfidenzintervall für den unbekannten Parameter µ bei bekannter Varianz
σ = 1:
σ
σ
x̄ − z1− α2 √ ; x̄ + z1− α2 √
n
n
"
r
r #
1
1
= 11.5 − z1− α2
; 11.5 + z1− α2
.
20
20
Mit dem Quantil der Standardnormalverteilung z1− α2 = z0.995 = 2.57583 ergibt sich mit der Sicherheitswahrscheinlichkeit 1 − α = 0.99 das Intervall
"
r
r #
1
1
11.5 − 2.57583
; 11.5 + 2.57583
≈ [10.924; 12.076] .
10
10
2
1 Pn
2
Bei unbekannter Varianz berechnen wir die Stichprobenvarianz als s2n = n−1
i=1 (xi − x̄) = 3.7368
√
und erhalten damit die Stichprobenstandardabweichung sn = 3.7368 = 1.93308 , welche in folgendes
Konfidenzintervall eingesetzt wird:
sn
sn
xn − √ t1− α2 ,n−1 ; xn + √ t1− α2 ,n−1
n
n
1.93308
1.93308
= 11.5 − √
t1− α2 ,n−1 ; 11.5 + √
t1− α2 ,n−1 .
20
20
Mit den Quantilen der t -Verteilung mit n − 1 = 19 Freiheitsgraden, t1− α2 ,n−1 = t0.995,19 = 2.86,
ergibt sich mit der Sicherheitswahrscheinlichkeit 1 − α = 0.99 das Intervall
1.93308
1.93308
11.5 − √
2.86 ; 11.5 + √
2.86 ≈ [10.2638; 12.7362].
20
20
Das dieses Intervall so deutlich größer ausfällt liegt wohl auch an der Vorgabe, dass die wahre Varianz
gleich 1 sein soll, aber die Stichprobenvarianz fast 4 ergibt.
Aufgabe 4 (4 Punkte)
Bei einer Abfüllmaschine für Haferflocken wurden die Abweichungen vom Normwert 500 g bei 50
Packungen registriert. Dabei ergaben sich folgende Werte.
Zerlegen Sie das Intervall von 9 bis 13 in 8 gleichlange Intervalle und tragen Sie die relativen
Häufigkeiten über diesen Intervallen in Form eines Säulendiagramms ab. Welche Dichtefunktion ließe
sich hier gut anpassen?
10.4
10.87
8.45
10.43
9.87
11.07
10.86
8.32
10.53
10.44
8.95
10.62
11.14
10.71
11.59
11.45
11.12
11.09
10.64
8.53
11
8.32 10.11 13.3 11.65 9.62
8.99 8.62 9.21 11.6 9.78 10.9
9.94 11.02 9.72 12.62 12.49 9.68
9.67 9.19 11.36 10.67 9.57 12.01
9.77 9.26 12.26 12.09 10.03 9.97
Lösung: Mit einer anderen Klasseneinteilung als vorgegeben erhält man ein Histogramm, welches von
normalverteilten Daten stammen könnte. Der Mittelwert der Abweichungen ist im Übrigen 10.43 und
die Stichprobenvarianz 1.4 .
3
Aufgabe 5 (4 Punkte)
Die Brenndauer in 100 h von Glühlampen einer bestimmten Sorte wurde mit Hilfe einer Stichprobe
vom Umfang 40 ermittelt. Dabei ergaben sich folgende Werte.
21.43 7.18 12.67 15.1 0.38 6.03 8.44 15.01 0.82
5.19 4.91 5.21 13.57 8.3
4.13 39.88 5.61 9.43
9.44 4.57 10.29 7.62 1.04 19.84 24.39 14.08 9.91
8.73 25.77 5.35
8.3 10.76 0.38 7.53 10.83 6.91
0.09
7.98
3.29
7.94
Zerlegen Sie den Bereich 0 bis 40 in 5 gleichlange Intervalle und stellen Sie die relativen Häufigkeiten als
Säulendiagramme über diesen Intervallen dar. Welcher Dichte könnte dieses Diagramm entsprechen?
Lösung: Mit der vorgegebenen Klasseneinteilung erhält man ein Histogramm, welches von exponentialverteilten Daten stammen könnte. Die mittlere Brenndauer ist 9.7 und die Stichprobenvarianz
61.41 .
Und hier nochmal alles zum χ2 -Unabängigkeitstest zum Mitlesen. Stören Sie sich bitte nicht daran,
dass die Prüfgröße hier mit QK bezeichnet ist anstatt mit χ2 . DAs ist auch manchmal üblich und
kommt von quadratischer Kontingenz. Ich hoffe, es ist hier wenigstens konsistent durchgezogen.
Ganz allgemein dienen Kontingenztafeln dazu, die Verteilungen von zweidimensionalen diskreten Zufallsgrößen zu beschreiben. Sind also X und Y zwei diskrete Zufallsgrößen mit den möglichen Werten
x1 , x2 , ... und y1 , y2 , ... , dann sind sowohl die Verteilung von X als auch die Verteilung von Y durch
die Einzelwahrscheinlichkeiten pi = P (X = xi ), i = 1, 2, ... und qj = P (Y = yj ), j = 1, 2, ... eindeutig festgelegt. Diese beiden Verteilungen entsprechen den so genannten Randverteilungen für die
zweidimensionale Verteilung von (X, Y ).
Die zweidimensionale Zufallsgröße (X, Y ) nimmt die Werte (xi , yj ), i, j = 1, 2.. mit den Wahrscheinlichkeiten pij = P (X = xi , Y = yi ), i, j = 1, 2... an. Dabei ist natürlich auch die zweidimensionale
Verteilung von (X, Y ) selbst eine diskrete Verteilung und die Werte pij sind die zugehörigen Einzelwahrscheinlichkeiten.
Angenommen, dass die Zufallsgröße X r Werte annimmt, also x1 , x2 , ..., xr , und die Zufallsgröße
Y habe den Wertebereich y1 , y2 , ..., yc , kann also c Werte annehmen. Dann gibt es insgesamt r · c
Werte, die die zweidimensionale Zufallsgröße (X, Y ) annehmen kann und die entsprechenden Einzelwahrscheinlichkeiten pij finden sich in nachfolgender Kontingenztabelle wieder.
4
x1
x2
..
.
y1
p11
p21
..
.
y2
p12
p22
..
.
...
...
...
...
...
...
...
...
...
yc
p1c
p2c
..
.
Σ
p1
p2
..
.
xr
Σ
pr1
q1
pr2
q2
...
...
...
prc
qc
pr
1
In der letzten Zeile und der letzten Spalte stehen sie summierten Werte, welche den Einzelwahrscheinlichkeiten der Randverteilungen entsprechen. Es gilt grundsätzlich die folgende Beziehung zwischen
einer zweidimensionalen Verteilung und ihren beiden Randverteilungen:
pi
=
P (X = xi ) =
X
P (X = xi , Y = yj ) =
j
X
pij , i = 1, ..., r
j
und
qj
=
P (Y = yj ) =
X
P (X = xi , Y = yj ) =
i
X
pij , j = 1, ..., c
i
Einfach gesagt, wird immer nur der Wert einer Komponente berücksichtigt und die Ausprägung der
anderen vernachlässigt.
Zwei Zufallsgrößen X und Y sind nach Definition unabhängig voneinander, wenn die gemeinsame
Verteilung dem Produkt der Randverteilungen entspricht, wenn also gilt:
pij = P (X = xi , Y = yi ) = P (X = xi ) P (Y = yi ) = pi pj , i, j = 1, 2...
Wir betrachten nun eine Stichprobe der Größe n aus einer zweidimensionalen Grundgesamtheit und
beobachten damit die Werte zweier Merkmale mit r bzw. c möglichen verschiedenen Ausprägungen.
Die Kontingenztabelle enthält dann die beobachteten Häufigkeiten hij , i = 1, ..., r; j = 1, ..., c aller
möglichen c · r Merkmalskombinationen.
x1
x2
..
.
y1
h11
h21
..
.
y2
h12
h22
..
.
...
...
...
...
...
...
...
...
...
yc
h1c
h2c
..
.
Σ
h1·
h2·
..
.
xr
Σ
hr1
h·1
hr2
h·2
...
...
...
hrc
h·c
hr·
ΣΣ h·· = n
Die Zahlen in der letzten Zeile und der letzten Spalte sind dann wieder die Summenwerte, die den
Häufigkeiten des Auftretens beider Einzelmerkmale entsprechen. Man beachte, dass die eingetragenen
Häufigkeiten absolute Häufigkeiten sind. Die entsprechenden relativen Häufigkeiten würden sich aus
der Division mit der Anzahl der Beobachtungen n ergeben.
Im Fall der Unabhängigkeit beider Merkmale sollten die Beobachtungswerte hij den so genannten
theoretischen Werten ungefähr entsprechen. Die theoretischen Werte berechnen sich, wie oben die
Wahrscheinlichkeiten, als Produkt der beobachteten relativen Häufigkeiten der beiden einzelnen Merkmale
hi· · h·j
hth
.
ij =
n
Die Prüfgröße wird dann wie folgt berechnet:
QK =
r X
c
2
X
(hij − hth
ij )
i=1 j=1
5
hth
ij
.
Unter der Nullhypothese, dass X und Y unabhängig sind, ist die Prüfgröße QK χ2 -verteilt mit
m = (r−1) (c−1) Freiheitsgraden. Damit sollte diese Nullhypothese mit einer Fehlerwahrscheinlichkeit
α verworfen werden, falls
QK > χ2m;(1−α) ,
wobei natürlich χ2m;(1−α) das (1 − α) -Quantil einer χ2 -Verteilung mit m Freiheitsgraden ist.
Beispiel: Wir betrachten die beiden Merkmale Geschlecht und Raucherstatus und untersuchen anhand von 11 Personen, ob es einen Zusammenhang zwischen diesen beiden Merkmalen gibt. Die
Kontingenztabelle ist wie folgt gegeben:
smoker
non-smoker
sum
male
3
6
9
female
2
0
2
sum
5
6
11
Aus dieser Tabelle berechnen wir zunächst die theoretischen Werte
hth
11 =
2·5
9·6
2·6
9·5
= 4.0909, hth
= 0.909, hth
= 4.909, hth
= 1.0909,
12 =
21 =
22 =
11
11
11
11
und erhalten anschließend für die Prüfgröße
QK =
(3 − 4.0909)2 (2 − 0.909)2 (6 − 4.909)2 (0 − 1.0909)2
+
+
+
= 2.934.
4.0909
0.909
4.909
1.0909
Bei einem Signifikanzniveau von 5% müssen wir diesen Wert mit dem entsprechenden Quantil einer
χ2 -Verteilung mit (2 − 1) · (2 − 1) = 1 Freiheitsgraden vergleichen. Das ist der Wert 3.8 .
Somit haben wir wegen QK = 2.934 < 3.8 keinen Grund, die Hypothese H0 abzulehnen und es
scheint hier keinen Zusammenhang zwischen dem Geschlecht und der Schwäche für Zigaretten zu
geben.
Übungsaufgaben sind verfügbar unter:
http://www.math.uni-rostock.de/ ∼ helwich/Uebungen.html
6
Herunterladen