1 Dichte- und Verteilungsfunktion

Werbung
Tutorium
Klausurvorbereitungsaufgaben Statistik – Lösungen
09.02.2016
1
Yannick Schrör
[email protected]
ID 03/455
Dichte- und Verteilungsfunktion
Ein tüchtiger Professor lässt jährlich 20000 Bücher drucken. Die Anzahl der verkauften
Bücher pro Jahr (in tsd.) kann als stetige Zufallsvariable X mit folgender Dichtefunktion
angesehen werden:
f (x) =

a · x 2
,
0 ≤ x ≤ 20
0
,
sonst
a) Bestimme a!
Lösung: Damit f (x) eine gültige Dichtefunktion ist, muss ihr Integral 1 ergeben!
Z ∞
!
f (x) dx = 1
−∞
Da f (x) außerhalb vom Interval [0, 20] den Wert 0 hat, folgt:
Z
20
⇔
f (x) dx = 1
0
Z
20
a · x2 dx = 1
0
20
1
⇔a · · x3 = 1
3
0
1
⇔a · · 203 = 1
3
8000
⇔a ·
=1
3
3
⇔a =
8000
⇔
Somit ergibt sich f (x) zu:

 3 · x2
f (x) = 8000
0
,
0 ≤ x ≤ 20
,
sonst
b) Über den jährlichen Verkauf wie vieler Bücher kann sich der Professor im Durchschnitt freuen?
1
Lösung: Um die Anzahl der durchschnittlich pro Jahr verkauften Bücher zu ermitteln, müssen wir den Erwartungswert der Zufallsvariablen X berechnen!
Z ∞
E (X) =
x · f (x) dx
−∞
Z 20
x · f (x) dx
=
0
Z 20
3
x·
=
· x2 dx
8000
Z0 20
3
· x3 dx
=
8000
0
Z 20
3
=
x3 dx
·
8000 0
3
1 4 20
=
·
x
8000
4 0
3
1 4
1
4
=
·
· 20 −
·0
8000
4
4
3
1
4
=
·
· 20 − 0
8000
4
3
=
· 40000
8000
= 15
c) Berechnen Sie die Standardabweichung der Verteilung der Zufallsvariablen X!
Lösung: Die Varianz einer Zufallsvariablen wird mit der folgenden Formel berechnet:
Z ∞
V(A) :=
(a − E (A)) · f (a) da
−∞
Somit erhalten wir:
Z 20
(x − E(X))2 · f (x) dx
V(X) =
Z0 20
3
=
(x − 15)2 ·
· x2 dx
8000
0
Z 20
3
=
·
(x − 15)2 · x2 dx
8000 0
Z 20
3
=
·
x2 − 30x + 225 · x2 dx
8000 0
Z 20
Z 20
Z 20
3
2
2
2
2
=
·
x · x dx −
30x · x dx +
225 · x dx
8000
0
0
0
Z 20
Z 20
Z 20
3
4
3
2
=
·
x dx − 30 ·
x dx + 225 ·
x dx
8000
0
0
0
2
1 4 20
1 3 20
1 5 20
3
+ 225 ·
·
x − 30 ·
x
x
=
8000
5 0
4 0
3 0
3
1
1
1
5
4
3
=
·
· 20 − 0 − 30 ·
· 20 − 0 + 225 ·
· 20 − 0
8000
5
4
3
= 15
Um die Standardabweichung zu erhalten, müssen wir die Wurzel der Varianz berechnen:
σ=
√
15
≈ 3, 8730
d) Mit welcher Wahrscheinlichkeit verkauft der tüchtige Professor mehr als 18000 Bücher
in einem Jahr?
Lösung: Zur Lösung dieser Frage, müssen wir zunächst ausrechnen, wie groß die
Wahrscheinlichkeit ist, dass der Professor weniger als 18000 Bücher in einem Jahr
verkauft. Anschließend berechnen wir die Gegenwahrscheinlichkeit, um auf den gesuchten Wert zu kommen.
W (X ≤ 18) = F (18)
F(x) ist die Verteilungsfunktion der Zufallsvariablen X. Diese wird wie folgt berechnet:
Z
F (x) = f (x) dx
Z
3
· x2 dx
=
8000
Z
3
=
· x2 dx
8000
3
1
=
· · x3
8000 3
1
· x3
=
8000
Nun können wir W (X ≤ 18) berechnen:
W (X ≤ 18) = F (18)
1
=
· 183
8000
= 0.7290
3
Die Wahrscheinlichkeit W (X > 18) berechnet sich nun aus der Gegenwahrscheinlichkeit von W (X ≤ 18):
W (X > 18) = 1 − W (X ≤ 18)
= 1 − 0.7290
= 0.2710
e) Wie viele Bücher müsste der Professor pro Jahr drucken lassen, um mit 80%iger
Wahrscheinlichkeit ausreichend Bücher für alle Kunden auf Vorrat zu haben?
Lösung: Zur Beantwortung dieser Frage müssen wir das 0,8-Faktil berechnen. Dieses
erhalten wir durch Gleichsetzung der Verteilungsfunktion mit dem Wert 0.8:
1
· x3
8000
6400 = x3
√
3
x = 6400
!
0.8 =
x = 18, 5664
In 80% der Fälle ist die Produktion von 18.567 Büchern (aufrunden!) also ausreichend.
4
2
Anwendung von Verteilungen
Anne Imberg hat vor Kurzem angefangen, [AI] an der RUB zu studieren. Von Kommilitonen in höheren Semestern hat sie gehört, dass die Wahrscheinlichkeit, auf dem Weg
von Hattingen zur Uni in einen Stau zu geraten 25% beträgt. Sie interessiert sich für die
Frage, wie groß die Wahrscheinlichkeit ist, in ihren 6 Semestern mehr als 300 mal im Stau
zu stehen, wenn sie jeden Tag zur Uni fährt (jedes Jahr hat 365 Tage).
a) Gib eine Verteilung samt Parametern an, die dem Problem entspricht. Es kann angenommen werden, dass Staus statistisch unabhängig sind.
Lösung: B(1095; 0.25)
Mit einer gewissen Wahrscheinlichkeit p in einen Stau zu geraten kann als BernoulliExperiment gesehen werden (YES-NO trial). Eine Verkettung mehrerer solcher Experimente beschreibt die Binomialverteilung. Diese ist parametrisiert über die Anzahl der Experimente n und die Erfolgswahrscheinlichkeit p (ob in den Stau kommen
ein Erfolg ist, darüber kann gestritten werden). Das Problem lässt sich also beschreiben mittels einer Binomialverteilung mit 6 Semester = 1095 Tage Experimenten und
einer Erfolgswahrscheinlichkeit von 0.25.
b) Berechne die Wahrscheinlichkeit, öfter als 300 mal im Stau zu stehen.
Lösung: Wir wollen W (X > 300) berechnen. In der Formelsammlung ist allerdings
keine Tabelle für Binomialverteilung mit p = 0.25 gegeben (und schon gar nicht mit
n = 1095). Wir nähern die Verteilung also zunächst über eine Normalverteilung an:
Verteilung
B(n; p)
kann approximiert
werden durch
p
N np; np(1 − p)
unter den Voraussetzungen
np ≥ 5,
n(1 − p) ≥ 5
n · p = 1095 · 0.25 = 273.75
n · (1 − p) = 1095 · (1 − 0.25) = 821.25
Die Voraussetzungen sind erfüllt. Die Approximation ergibt:
p
X ∼ B(1095; 0.25) ≈ N 273.75; 273.75 · (1 − 0.25)
= N (273.75; 14.3287)
Aber auch für diese Verteilung findet sich keine Tabelle in der Formelsammlung.
Wir nähern diese Verteilung wiederum durch eine Standardnormalverteilung (Erwartungswert 0, Standardabweichung 1) an.
X −µ
∼ N (0; 1)
σ
X − 273.75
Y =
∼ N (0; 1)
14.3287
Y =
5
Nun können wir die Wahrscheinlichkeit berechnen
W (X > 300) = 1 − W (X ≤ 300)
= 1 − W (Y ≤ 1.8320)
(in Tabelle nachschlagen)
= 1 − 0.9664
= 0.0336
Die Wahrscheinlichkeit beträgt also etwas über 3%.
c) Berechne die Wahrscheinlichkeit, öfter als 256 mal im Stau zu stehen.
W (X > 256) = 1 − W (X ≤ 256)
= 1 − W (Y ≤ −1.2387)
(Nutze Symmetrie der Normalverteilung)
= 1 − (1 − W (Y ≤ 1.2387))
(in Tabelle nachschlagen)
= 1 − (1 − 0.8925)
= 0.8925
d) Welche Anzahl an Staus wird Anne mit 90% Wahrscheinlichkeit nicht überschreiten?
Lösung: Gefragt ist hier nach dem 0.9-Fraktil. Wir haben die Verteilung auf eine
N (0; 1)-Verteilung reduziert, und von der sind die Fraktile bekannt.
Φ−1 (0.9) = 1.2816
Dies ist aber eben nur das 0.9-Fraktil der N (0; 1)-Verteilung. Daher müssen wir
diesen Wert nun auf die nicht-standardisierte Normalverteilung N (273.75; 14.3287)
zurück transformieren.
X − 273.75
14.3287
292.1137 = X
1.2816 =
Das 0.9-Fraktil ist also 292.1137. Anne Imberg wird mit 90%iger Wahrscheinlichkeit
nicht mehr als 292.1137 Staus durchfahren müssen.
6
3
Stichproben
Im Folgenden nehmen wir an, dass die Anzahl der Personen in einem öffentlichen Nahverkehrsfahrzeug normalverteilt ist. Die U-Bahnen der Bogestra vom Typ Tango fassen
nominell 175 Personen. Da die Vermutung besteht, dass die Bahnen teilweise überladen
fahren, soll in den Stoßzeiten eine Stichprobe durchgeführt werden, die die Nullhypothese
testen soll, ob die Bahnen im Durchschnitt tatsächlich überfüllt sind. Die Varianz ist aus
vorherigen Messungen bekannt und beträgt 225.
a) Es soll ein Intervall für den Erwartungswert µ geschätzt werden, wobei wir uns zu
92% sicher sein wollen, dass der Erwartungswert dieses Intervall nicht verlässt. Das
Intervall soll nicht länger als 10 sein. Wie groß müssen wir den Stichprobenumfang
n wählen?
Lösung: Wir möchten
Stichprobenumfang n berechnen und σ = 15 ist bekannt.
den 2
2c · σ
groß sein, wobei L die Länge des Intervalls bezeichnet
n muss mindestens
L
α
und c das (1 − )-Fraktil der N (0, 1)-Verteilung ist. α wiederum berechnet sich aus
2
der Gleichung Konfidenzniveau = 1 − α.
Konfidenzniveau = 1 − α
α = 1 − Konfidenzniveau
α = 1 − 0.92
α = 0.08
c ergibt sich zu
α
c= 1−
-Fraktil
2
c = 0.96-Fraktil
c = 1.7507
Nun können wir den Stichprobenumfang n anhand folgender Ungleichung bestimmen
2c · σ
L
2 · 1.7507 · 15
10
n≥
≥
2
2
≥ 27.5846
Unsere Stichprobe muss also mindestens den Umfang 28 (aufrunden!) haben.
b) Wie lautet der Name des Tests, der hier durchgeführt werden muss?
Lösung: Einstichproben-GAUSS-Test, da Standardabweichung σ bekannt ist.
7
c) Mit einer Stichprobe von n = 30 wurde ein Mittelwert x = 172 errechnet. Als
Signifikanzniveau wählen wir α = 0.04. Berechne den Testfunktionswert. Wie lautet
die Testentscheidung?
Lösung: Wir betrachten die Nullhypothese b): H0 : µ = µ0 gegen H1 : µ < µ0 .
(>)
Zunächst berechnen wir den Testfunktionswert z:
x − µ0 √
· n
σ
172 − 175 √
· 30
=
15
≈ −1.0954
z=
Als nächstes ist der Verwerfungsbereich B zu bestimmen mit x1−α als (1 − α)-Fraktil
der N (0, 1)-Verteilung:
b)
B = (−∞, −x1−α )
= (−∞, −x1−0.04 )
= (−∞, −x0.96 )
= (−∞, −1.7507)
Wir stellen fest, dass der Testfunktionswert z ≈ −1.0954 nicht im Intervall B ist.
Somit verwerfen wir unsere Nullhypothese nicht. Die Bahnen sind tatsächlich im
Durchschnitt überfüllt.
d) Wie wäre unsere Entscheidung in Aufgabenteil c) ausgefallen, wenn die Stichprobe
einen Mittelwert x = 170 ergeben hätte?
Lösung: Wir müssen nur den Testfunktionswert z neu berrechnen:
170 − 175 √
· 30
15
= −1.8257
z=
Wir stellen fest, dass dieser im Verwerfungsintervall B liegt. Somit hätten wir bei
diesem Mittelwert die Nullhypothese verworfen.
8
Herunterladen