Uebung 5

Werbung
MAT183: Stochastik für die Naturwissenschaften, FS2017
Dr. Christoph Luchsinger
Übungsblatt 5
Diskrete Zufallsgrössen und Binomialverteilung
Abgabe: Mittwoch, 05.04.2017, vor der Vorlesung.
Die Abgabe von R-Übungen hat als Ausdruck zu geschehen. Üben Sie das wie das Schreiben einer wissenschaftlichen Arbeit. Damit nicht einfach am Mittwoch morgen rasch die Lösung von Mitstudierenden
kopiert werden kann, muss man auf dem Ausdruck Name und Matrikelnummer elektronisch aufschreiben
- sonst gibt es keine Punkte.
Bitte beachten Sie ausserdem, dass sie den Output ihres Codes dokumentieren müssen. Insbesondere
müssen alle Plots zusammen mit dem Code abgegeben werden!
Tipps
In R können Wahrscheinlichkeitsfunktion (bzw. Dichte im stetigen Fall), Verteilungsfunktion und Quantilfunktion der meisten bekannten Verteilungen berechnet und geplottet werden. Ebenso können Zufallsstichproben erzeugt werden. Eine vollständige Liste der Verteilungen erhalten Sie mit dem Befehl
’?Distributions’.
Die Namen der entsprechenden Funktionen werden immer gleich gebildet:
- ’d...()’ : Wahrscheinlichkeitsfunktion P[X = x] bzw. Dichtefunktion f (x), das ’d’ steht für
density ;
- ’p...()’ : Verteilungsfunktion FX (a) = P[X ≤ a], das ’p’ steht für probability ;
- ’q...()’ : Quantilfunktion FX−1 (p), das ’q’ steht für quantile;
- ’r...()’ : Zufallsgenerator für Stichproben, das ’r’ steht für random.
Dbei wird ’...’ durch ein Kürzel ersetzt, welches die Verteilung angibt.
Am häufigten werden Sie die folgenden Verteilungen brauchen (wobei der Punkt durch das entsrechende
Kürzel ersetzt wird):
- ’.pois()’ für die Poissonverteilung
- ’.geom()’ für die geometrische Verteilung
- ’.norm()’ für die Normalverteilung
- ’.unif()’ für die uniforme Verteilung.
Zum Beispiel ist ’dpois()’ die Wahrscheinlichkeitsfunktion der Poissonverteilung, ’pgeom()’ die Verteilungsfunktion der geometrischen Verteilung, ’qnorm()’ die Quantilfunktion der Normalverteilung und
’runif()’ erzeugt Zufallsstichproben einer uniformen Verteilung.
1
Aufgabe 1 (Must):
Welche der folgenden Zufallsgrössen sind diskret?
(a) Die Anzahl Bücher, die sie im letzten Monat gelesen haben.
(b) Die Wartezeit bis zum nächsten 10er Tram.
(c) Das Ergebnis eines Münzwurfs.
(d) Die Auswahl einer ganzen Zahl zwischen 0 und 10.
(e) Die Auswahl einer reellen Zahl aus dem Intervall [0, 10].
(f) Der Note, die Sie bei ihrer letzten Prüfung erzielt haben.
Aufgabe 2 (Standard, 3 Punkte):
Die Wahrscheinlichkeit dafür, dass ein Schweizer die Blutgruppe A hat, beträgt 21%. Mit welcher Wahrscheinlichkeit haben von 70 zufällig ausgewählten Schweizern strikt weniger als ein Achtel die Blutgruppe
A?
Aufgabe 3 (Standard, 5 Punkte):
Rote und schwarze Lindorkugeln werden zufällig in Schachteln mit je 25 Stück abgefüllt. Die Sorte
bzw. Farbe der einzelnen Kugeln wird mit einem Zufallsmechanismus bestimmt, der bewirkt, dass im
Schnitt 60% der Kugeln schwarz sind.
(a) Die Zufallsgrösse R bezeichne die Anzahl der roten Lindorkugeln in einer Schachtel. Wie ist R
verteilt? (1 Punkt)
(b) Mit welcher Wahrscheinlichkeit haben die Kugeln in einer Schachtel alle dieselbe Farbe? (1 Punkt)
(c) Wie viele Schachteln muss man mindestens auswählen, damit unter diesen mit einer Wahrscheinlichkeit > 90% mindestens eine Schachtel mit mindestens 20 roten Kugeln ist? (3 Punkte)
Aufgabe 4 (Standard, 8 Punkte):
In dieser Aufgabe bezeichnet PN Ihre personal number, welche sich aus den letzten beiden Ziffern
Ihrer Matrikelnummer zusammensetzt. Sollte Ihre PN 00 sein, nehmen Sie eine beliebige andere Zahl
(geben Sie diese zu Beginn Ihrer Lösung an!).
1. (2 Punkte) Zeichnen Sie die Dichtefunktion fX (x), sowie die Verteilungsfunktion FX (x) für eine
Zufallsvariable X ∼ N (PN, 1) in zwei separate Plots ein. Beschriften Sie die Plots (mindestens
beide Achsen und ein Titel). Wo ist fX (x) maximal? Kennzeichnen Sie diese Stelle durch eine
vertikale Gerade.
2
Tipps
Der R -Code könnte folgende Struktur haben:
x <- seq(PN-4, PN+4, 0.1) # gute Spannweite für eine SD=1
plot(x, dnorm(...), type=..., ...)
abline(v=...) # um die wahrscheinlichste Stelle zu markieren
2. (1 Punkt) Zeichnen Sie in den Plot der Verteilungsfunktion FX (x) die Quantile ein, bei denen
95%, 97.5% und 99% der Wahrscheinlichkeit erreicht sind.
Tipps
Verwenden Sie die Funktion ’abline(v=...)’ um eine vertikale Linie in einen bestehenden Plot
einzuzeichnen. Der R -Code könnte etwa so aussehen:
q95 <- qnorm(p = ..., mean = ..., sd = ...)
abline(v=q95, lty=..., col=...)
3. (2 Punkte) Erzeugen Sie Zufallsstichproben der Grösse n = {10, 1000, 1000 000} von X ∼ N (PN, 1)
und plotten Sie diese jeweils in ein Histogramm. Was fällt Ihnen auf?
Tipps
Verwenden Sie mehrere Plots in einem Fenster mit ’op <- par(mfrow=c(3, 1))’. Nachdem Sie
die Plots erzeugt haben, setzen Sie Einstellungen zurück, indem Sie ’par(op)’ aufrufen. Sollten
Sie die Fehlermeldung ’Error in plot.new() : figure margins too large’ bekommen, so
ist das Plots Frame in RStudio (unten rechts) nicht genügend gross. Das Fenster kann vergrössert
werden, indem man oben rechts auf das Maximieren-Symbol klickt.
Alternativ können Sie den Plot direkt in ein PDF schreiben lassen, womit Sie dieses Problem
umgehen können. Dazu sind die Funktionen ’pdf()’ und ’dev.off()’ hilfreich. Ein möglicher
Code könnte dann so aussehen:
pdf(’Dateiname.pdf’)
plot(...) # eigentlicher Plot (mehrere möglich)
dev.off()
Für jeden Plot wird dann eine neue Seite im PDF produziert oder Sie verwenden ’par(mfrow=c(?,
?))’. Mit den Argumenten ’width=...’ und ’height=...’ der Funktion ’pdf()’ können Sie die
Grösse des PDFs steuern, z.B. für A4 sind diese ’width=8.27’ und ’height=11.69’, also etwa so:
pdf(’meinA4plot.pdf’, width=8.27, height=11.69)
op <- par(mfrow=c(2,1)) # zwei Zeilen, eine Spalte
plot(...)
plot(...)
par(op)
dev.off()
3
4. (1 Punkt) Nehmen Sie die Stichprobe mit n = 1000 000 aus 3. und konstruieren Sie daraus 3 neue
Stichproben:
(a) addieren Sie zu allen Werten 5
(b) subtrahieren Sie von allen Werten 10
(c) multiplizieren Sie alle Werten mit 2
Schauen Sie sich die drei resultierenden Histogramme der transformierten Stichproben an und
kommentieren Sie die Resultate.
Nachfolgend werden wir eine Familie von Verteilungen verwenden, die Sie noch nicht kennengelernt haben. Diese Familie heisst Student t Verteilung. Diese Verteilung kann verschiedene sogenannte
Freiheitsgrade haben, welche wir mit einem Subskript angeben, z.B. t1 , t2 , t50 , . . . , t∞ , wobei t∞ der Normalverteilung entspricht. Die Verteilung t1 wird auch Cauchy-Verteilung genannt. Alle diese Verteilungen
sind natürlich in R verfügbar - siehe ’?dt’ oder ’?dcauchy’.
5. (2 Punkte) Plotten Sie die Dichtefunktion einer Standardnormalverteilten und fügen Sie die Dichten
folgender Verteilungen in den gleichen Plot ein: t1 , t10 und t1000 , was beobachten Sie dabei?
Tipps
Nehmen Sie einen Bereich von -5 bis 5 für die x-Achse (’xlim=c(-5, 5)’) und einen Bereich von
0 bis 0.4 für die y-Achse (’ylim=c(0, 0.4)’). Linien können Sie komfortabel mit ’lines()’ zu
einem bestehenden Plot hinzufügen. Das könnte das so aussehen:
x <- seq(..., ..., 0.1)
plot(..., dnorm(...), type="l", lwd=..., col=..., ylab="...")
lines(..., dcauchy(...), col=...) # oder dt(...)
Aufgabe 5 (Honours, 5 Punkte):
Zwei Würfel werden gleichzeitig geworfen. Berechnen Sie die folgenden Wahrscheinlichkeiten mit Hilfe
einer geeigneten Binomial-verteilten Zufallsgrösse. (Geben Sie wie üblich die Parameter der zugehörigen
Verteilung an!)
(a) Wie wahrscheinlich ist es bei 4 Versuchen genau einmal die Augensumme 10 zu beobachten? (2
Punkte)
(b) Wie wahrscheinlich ist es mindestens einmal die Augensumme 8 zu beobachten? (2 Punkt)
(c) Prüfen Sie beide Ergebnisse mit R nach. (1 Punkt)
4
Herunterladen