Mehrdimensionale Zufallsvariablen Bibliografie

Werbung
Mehrdimensionale Zufallsvariablen
” Verteilung
einer mehrdimensionalen
Zufallsvariablen
” Stochastische Unabhängigkeit von
Variablen
” Erwartungswerte zweidimensionaler
Zufallsvariablen
” Einführung in die Statistik mit R
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
1
Bibliografie
” Bleymüller / Gehlert / Gülicher
Verlag Vahlen
Statistik für Wirtschaftswissenschaftler
” Bleymüller / Gehlert
Verlag Vahlen
Statistische Formeln, Tabellen und Programme
” PowerPointPräsentationen (Prof. Mohr/ Dr. Ricabal)
” Vorlesungsskript für Statistik I (Dr. Pu Chen)
” Vorlesungsskript für Statistik II (Prof. Mohr, Private
Hanseuniversität Rostock)
” http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
2
Mehrdimensionale Zufallsvariablen
Für viele Fragestellungen ist es notwendig, mehrere
Zufallsvariablen gemeinsam zu betrachten
(Siehe. Beschreibende Statistik).
Beispiel:
¾ Umfrage bei Haushalten: Verschiedene Merkmale wie
Alter, Geschlecht, Einkommen, etc
¾ Versuchwiederholungen bei Würfelexperimenten.
Es soll hier nur der Spezialfall für 2 Variablen besprochen
werden (zweidimensionaler Fall).
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
3
Zweidimensionale diskrete
Zufallsvariable
”
Gemeinsame Wahrscheinlichkeitsfunktion:
⎧ W ( X = x , Y = y ) ( x , y ) ∈ D( X, Y )
f X , Y ( x , y) = ⎨
sonst
⎩0
Träger: D(X,Y) = { (x, y) | W(X = x, Y = y) > 0 }
Es gilt: (i) 0 ≤ f X , Y ( x , y) ≤ 1
”
(ii)
∑ ∑f
X ,Y
( x , y )∈D ( X , Y )
( x , y) = 1
Gemeinsame Verteilungsfunktion:
FX ,Y ( x, y) =
Prof. Mohr / Dr. Ricabal
∑ ∑f
xi ≤x y j ≤y
X ,Y
(x i , y j ) = 1
Mehrdimensionale Zufallsvariablen
4
Eindimensionale Randverteilungen
Aus der gemeinsamen Wahrscheinlichkeitsfunktion
ergeben sich:
”
die eindimensionale Randwahrscheinlichkeitsfunktionen
f X (x) =
”
∑f
X ,Y
y∈D ( X , Y )
( x , y)
und
f Y ( y) =
∑f
X ,Y
x∈D ( X , Y )
( x , y)
die eindimensionale Randverteilungsfunktionen
FX ( x ) =
∑f
(x i )
und
FX ( x ) = FX ,Y ( x, ∞)
und
xi ≤x
X
FY ( y) =
∑f
yi ≤ y
Y
( yi )
FY ( y) = FX ,Y (∞, y)
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
5
Bedingte Verteilungen
”
”
die bedingten Wahrscheinlichkeitsfunktionen
f X / Y ( x / y) =
f X , Y ( x , y)
f Y / X (y / x) =
f X , Y ( x , y)
f Y ( y)
f X (x)
falls f Y ( y) > 0
falls f X ( x ) > 0
die bedingten Verteilungsfunktionen
FX / Y ( x / y) =
FY / X ( y / x ) =
Prof. Mohr / Dr. Ricabal
∑f
xi ≤x
∑f
yi ≤ y
X/Y
Y/X
( x i / y)
und
( yi / x )
Mehrdimensionale Zufallsvariablen
6
Beispiel: Zweidimensionale diskrete
Zufallsvariablen
In einer Urne sind 6 Kugeln aus 3 verschiedenen Sorten: 3 sind rot, 2
sind grün und 1 ist gelb. Man zieht ohne Zurücklegen zwei Kugeln.
Dann ist die gemeinsame Wahrscheinlichkeitsfunktion für die ZV
X: Farbe der ersten Kugel
Y: Farbe der zweiten Kugel
Codierung: rot (1), grün (2) und gelb (3)
Y
1
X
2
3
1
6/30
6/30 3/30
f X ,Y (i, j) = W (X = i, Y = j)
2
6/30
2/30 2/30
= W ( X = i) ⋅ W ( Y = j / X = i)
3
3/30
2/30
0
3 2 6
f X ,Y (1, 1) = W (X = 1 ∧ Y = 1) = W (X = 1) ⋅ W (Y = 1 / X = 1) = ⋅ =
6 5 30
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
7
Beispiel: Rand- und bedingte Verteilungen
Gemeinsame
Wahrscheinlichkeitsfunktion
Y
X
1
2
3
fX(x)
1
6/30
6/30
3/30 15/30
2
6/30
2/30
2/30 10/30
3
3/30
2/30
0
fY(y) 15/30 10/30 5/30
5/30
1
Denken Sie nach, wie würden die
bedingten Verteilungen fY/X(y/x)
bzw. FY/X(y/x) aussehen!
Lösen Sie den Aufgabenteil b)
für Ziehen mit Zurücklegen!
Prof. Mohr / Dr. Ricabal
x
f(x/y=1)
F(x/y=1)
1
(6/30)/(15/30) = 6/15
6/15
2
(6/30)/(15/30) = 6/15
12/15
3
(3/30)/(15/30) = 3/15
1
x
f(x/y=2)
F(x/y=2)
1
(6/30)/(10/30) = 6/10
6/10
2
(2/30)/(10/30) = 2/10
8/10
3
(2/30)/(10/30) = 3/10
1
x
f(x/y=3)
F(x/y=3)
1
(3/30)/(5/30) = 3/5
3/5
2
(2/30)/(5/30) = 2/5
1
3
(0)/(5/30) = 0
1
Mehrdimensionale Zufallsvariablen
8
Beispiel: Gemeinsame Verteilungsfunktion
Gemeinsame
Wahrscheinlichkeitsfunktion
fX,Y(x,y) = W(X = xi; Y = yj)
Y
X
1
2
3
Gemeinsame Verteilungstsfunktion
FX,Y(x,y) = W(X ≤ xi; Y ≤ yj)
Y
X
y<1 1≤y<2 2≤y<3
3≤y
1
6/30
6/30
3/30
x<1
0
0
0
0
2
6/30
2/30
2/30
1≤x<2
0
6/30
12/30
13/30
3
3/30
2/30
0
2≤x<3
0
12/30
20/30
25/30
3≤x
0
15/30
25/30
1
Zweidimensionale stetige Verteilungen
Anstelle der Summationen werden völlig analog Integrationen
durchgeführt.
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
9
Stochastische Unabhängigkeit von
Zufallsvariablen
Analog zur statistischen Unabhängigkeit für zwei Ereignisse A und
B, für die es gilt: W(A ∩ B) = W(A) ⋅ W(B)
lässt sich die Stochastische Unabhängigkeit zweier Zufallsvariablen
X und Y formulieren:
FX,Y (x, y) = FX (x) ⋅ FY ( y) für alle (x, y).
Gleichwertige Darstellungen:
f X,Y (x, y) = f X (x) ⋅ f Y ( y) für alle (x, y)
FX|Y (x | y) = FX (x) oder FY|X ( y | x) = FY ( y) für alle (x, y)
f X|Y (x | y) = f X (x) oder f Y|X ( y | x) = f Y ( y) für alle (x, y)
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
10
Beispiel: Stochastische Unabhängigkeit
von Zufallsvariablen
In einer Urne sind 6 Kugeln aus 3 verschiedenen Sorten: 3 sind rot, 2 sind
grün und 1 ist gelb. Man zieht mit Zurücklegen zwei Kugeln. Wie bei der
Ziehung ohne Zurücklegen definieren wir die Zuffalsvariablen
X: Farbe der ersten Kugel
Y: Farbe der zweiten Kugel
Codierung: rot (1), grün (2) und gelb (3)
In diesem Fall gilt:
Y
f Y|X ( y | x) = f Y ( y) für alle (x, y)
X
Denn der erste Zug hat bei einer
Ziehung mit Zurücklegen keinen
Einfluss auf den zweiten Zug. Somit
gilt auch:
1
2
3
fX(x)
1
1/4
1/6
1/12
1/2
2
1/6
1/9
1/18
1/3
3
1/12
1/18
1/36
1/6
fY(y)
1/2
1/3
1/6
1
f X,Y (x, y) = f X (x) ⋅ f Y ( y) für alle (x, y)
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
11
Erwartungswerte zweidimensionaler
Zufallsvariablen
⎧ ∑∑ g( x, y)f ( x, y) im diskreten Fall
⎪⎪( x , y )∈D ( X;Y )
E[g (X, Y)] = ⎨ ∞ ∞
⎪ ∫ ∫ g ( x , y)f ( x, y)dx dy im stetigen Fall
⎪⎩ -∞ -∞
Die wichtigsten Spezialfälle für g(X, Y):
g(X, Y) = X
g(X, Y) = Y
g(X, Y) = (X - µX)²
g(X, Y) = (Y - µY)²
g(X, Y) = (X - µX) (Y - µY)
Prof. Mohr / Dr. Ricabal
:
:
:
:
:
Erwartungswert µX ≡ E(X)
Erwartungswert µY ≡ E(Y)
Varianz σ²X ≡ Var (X)
Varianz σ²Y ≡ Var (Y)
Kovarianz σXY ≡ Cov (X, Y)
Mehrdimensionale Zufallsvariablen
12
Rechenregel für allgemeine
Erwartungswerte
Cov (X, Y) = E(XY) – E(X) E(Y)
E (X ± Y) = E(X) ± E(Y)
linearer Operator
Var (X ± Y) = Var (X) + Var (Y) ± 2 Cov (X, Y) kein linearer Operator
E (a X ± b Y) = a E(X) ± b E(Y)
„konstanter Faktor kann vor dem E-Operator gezogen werden“
Var (a X ± b Y) = a² Var (X) + b² Var (Y) ± 2 a b Cov (X, Y)
„konstanter Faktor wird quadratisch vor dem Var-Operator gezogen“
⎛ n
⎞ n
E⎜ ∑ a i X i ⎟ = ∑ a i E ( X i ) ;
⎝ i =1
⎠ i =1
gilt immer
⎛ n
⎞ n
Var⎜ ∑ a i X i ⎟ = ∑ a i2 Var(X i ) ;
⎝ i =1
⎠ i =1
Prof. Mohr / Dr. Ricabal
falls X i stochastisch unabhängig
Mehrdimensionale Zufallsvariablen
13
Korrelationskoeffizient
Wie in der Deskriptiven Statistik erhält man den
Korrelationskoeffizienten durch Normierung der Kovarianz
ρ XY =
Cov(X, Y)
Var(X) Var (Y )
Es gilt: -1 ≤ ρXY ≤ 1
Die Extremfälle ρXY = ± 1 bedeuten, dass zwischen Y und X
eine positive lineare Beziehung besteht.
Im Fall ρXY = 0 sagt man, dass die beiden Zufallsvariablen X
und Y unkorreliert sind.
Aus der stochastischen Unabhängigkeit zweier ZV X und Y folgt
ihre Unkorreliertheit. Die Umkehrung gilt jedoch nicht!
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
14
Beispiel: Erwartungswerte
zweidimensionaler Zufallsvariablen
In einer Urne sind 6 Kugeln aus 3 verschiedenen Sorten: 3 sind rot, 2 sind
grün und 1 ist gelb. Man zieht mit Zurücklegen zwei Kugeln. Hier sind:
X: Farbe der ersten Kugel
Y
Y: Farbe der zweiten Kugel
1
2
3
fX(x)
X
Codierung: rot (1), grün (2) und gelb (3)
1
6/30 6/30 3/30 15/30
E(X) = ∑ x ⋅ f X ( x ) = 1⋅
x
15
10
5 50 5
+ 2 ⋅ + 3⋅ =
=
30
30
30 30 3
15
10
5 50 5
E ( Y ) = ∑ y ⋅ f Y ( y) = 1 ⋅ + 2 ⋅ + 3 ⋅ =
=
30
30
30 30 3
y
2
6/30 2/30 2/30 10/30
3
3/30 2/30
0
fY(y) 15/30 10/30 5/30
5/30
1
Var (X) = E (X 2 ) − (E (X)) 2 = 12 ⋅
15
10
5 ⎛ 5 ⎞ 100 25 30 − 25 5
+ 2 2 ⋅ + 32 ⋅ − ⎜ ⎟ =
−
=
=
30
30
30 ⎝ 3 ⎠
30 9
9
9
Var (Y) = E (Y 2 ) − (E (Y)) 2 = 12 ⋅
15
10
5 ⎛ 5 ⎞ 100 25 30 − 25 5
+ 2 2 ⋅ + 32 ⋅ − ⎜ ⎟ =
−
=
=
30
30
30 ⎝ 3 ⎠
30 9
9
9
2
2
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
15
Beispiel:
Kovarianz und Korrelationskoeffizient
Y
X
1
2
3
1
6/30 6/30 3/30 15/30
2
6/30 2/30 2/30 10/30
3
3/30 2/30
0
fY(y) 15/30 10/30 5/30
Cov(X, Y)
Var (X ) Var (Y)
ρ XY =
=
1
1
= 9 =−
5
5
5 5
9
9 9
−
fX(x)
1
9
−
Prof. Mohr / Dr. Ricabal
5/30
1
Cov(X, Y) = E (X ⋅ Y) − E(X) ⋅ E(Y)
3
6
6
= 1 ⋅1 ⋅ + 1 ⋅ 2 ⋅ + 1 ⋅ 3 ⋅
30
30
30
6
2
2
+ 2 ⋅1 ⋅ + 2 ⋅ 2 ⋅ + 2 ⋅ 3 ⋅
30
30
30
3
2
5 5
+ 3 ⋅1 ⋅ + 3 ⋅ 2 ⋅ + 3 ⋅ 3 ⋅ 0 − ⋅
30
3 3
30
80 25 24 − 25
1
=
−
=
=−
30 9
9
9
„Je kleiner die Zahl in ersten Zug ist, umso größer die
Zahl im zweiten Zug und umgekehrt.“ Somit sind die
Zufallsvariablen in diesem Fall (ohne Zurücklegen)
negativ korreliert.
Bei der Ziehung mit Zurücklegen sind X und Y
unkorreliert, weil sie stochastisch unabhängig sind.
Mehrdimensionale Zufallsvariablen
16
Erwartungswert und Varianz einer linearen
Kombination von Zufallsvariablen
Für unabhängige bzw. unkorrelierte Zufallsvariablen Xi
(i=1, . . ., n) gelten:
⎛ n
⎞ n
E⎜ ∑ a i X i ⎟ = ∑ a i E ( X i )
⎝ i =1
⎠ i =1
und
⎛ n
⎞ n
Var⎜ ∑ a i X i ⎟ = ∑ a i2 Var(X i )
⎝ i =1
⎠ i =1
Wichtiger Spezialfall:
arithmetisches Mittel von identisch
unabhängige Zufallsvariablen Xi (i=1, 2, …, n):
E( X ) = E(
X=
1 n
∑ Xi
n i =1
n
1 n
1
1 n
1 n
nµ
X i ) = E (∑ X i ) = ∑ E (X i ) = ∑ µ =
=µ
∑
n i =1
n i =1
n i =1
n i =1
n
Var ( X ) = Var (
1
1 n
Xi ) = 2
∑
n
n i =1
Prof. Mohr / Dr. Ricabal
n
1
n
∑ Var(X ) = n ∑ σ
i =1
i
2
i =1
2
=
nσ 2 σ 2
=
n2
n
Mehrdimensionale Zufallsvariablen
17
Einführung in die Statistik mit R
Unter den bekanntesten professionellen Computerprogramme für statistische Datenanalyse befinden sich
SAS und SPSS. Beide Programme sind aber sehr teuer
und unflexibel.
In Statistikprogramm R sind viele Verfahren vorhanden,
es ist sehr flexibel und außerdem kostenlos. Deswegen
wird es mehr und mehr weltweit von Studenten und
Wissenschaftler genutzt.
Wo findet man R? http://www.r-project.org/
Wie kann man es runterladen und installieren?
CRAN (The Comprehensive R Archive Network)
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
18
Wo findet man Information über R
¾ In Internet gibt es eine große Menge von Information und Tipps
über R.
¾ The R Project for Statistical Computing
http://www.r-project.org/
¾ Auf der Webseite des Lehrstuhls Statistik
Downloadbereich
¾ Statistik I (Sommer_2008)
” Statskript (Dr. A. Handl)
” Aufgaben für das Selbststudium Statistik I für die BAStudiengänge
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
19
Erste Schritte mit R
¾
Starten und Beenden des Programms
ƒ
ƒ
¾
Neues Skript erstellen
ƒ
ƒ
¾
Datei → Neues Skript
Windows → Pflastern
R als mächtiger Taschenrechner
ƒ
ƒ
¾
Start → Programme → R → R 2.9.0
Datei → Beenden
Grundrechenarten: Addition (a+b), Subtraktion (a-b),
Multiplikation (a*b), Division (a/b), Potenz (a^b),
Quadratwurzel sqrt(a)
Dezimalpunkt für Dezimalzahlen
Ausführung von Befehlen
ƒ
ƒ
ƒ
mit der Taste carrriage return auf der Console
Alt+R auf dem Skrip
R gibt das Ergebnis in der nächsten Zeile aus.
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
20
Beispiel: Mathematische Operationen mit R
a)
b)
c)
d)
e)
f)
g)
2,1 + 2
2,1 - 2
2,1 · 2
2,1 / 2
2,12
(2,1)0,5
sqrt (2,1)
Prof. Mohr / Dr. Ricabal
a)
b)
c)
d)
e)
>2.1 + 2
[1] 4.1
>2.1 – 2
[1] 0.1
>2.1 * 2
[1] 4.2
>2.1 / 2
[1] 1.05
>2.1^2
[1] 4.41
f)
g)
Mehrdimensionale Zufallsvariablen
>(2.1)^0.5
[1] 1.449138
>sqrt (2.1)
[1] 1.449138
21
Funktionen in R
Die Namen von Funktionen werden in R nach mnemothechnischen
Gesichtspunkte gewählt, z. B. sqrt für square root, Quadratwurzel.
Die Funktionen in R besitzen in der Regel Argumente. So muss man der
Funktion sqrt mitteilen, von welcher Zahl sie die Quadratwurzel
bestimmen soll. Die Argumente einer Funktion stehen in runden
Klammern hinter dem Funktionsnamen und sind durch Kommata
voneinander getrennt. Wir rufen die Funktion sqrt mit dem Argument 2.
R gibt die Ergebnisse mit 6 Dezimalstellen aus. Weniger Stellen bekommt
man mit der Funktion round (runden). Diese Funktion hat das Argument
digits (Dezimalstellenzahl).
Beispiel:
a) round(sqrt(2), digits = 2)
b) round(sqrt(2), d = 2)
c) round(sqrt(2))
d) round(sqrt(2), d = 0)
Prof. Mohr / Dr. Ricabal
R - Ergebnisse:
a) [1] 1,41
b) [1] 1,41
c) [1] 1
d) [1] 1
Mehrdimensionale Zufallsvariablen
22
Spezielle Verteilungen in R
In R gibt es Funktionen, mit denen man die Dichte- bzw.
Wahrscheinlichkeitsfunktion, die Verteilungsfunktion und die
Quantile von Verteilungen bestimmen kann. Jeder Verteilung hat einen
eigenen Namen. Die Normalverteilung wird mit dem Kürzel norm
bezeichnet. Durch einen Buchstaben vor dem Namen erhält man nun
die oben angesprochenen Funktionen:
d: für die Dichte-, bzw. die Wahrscheinlichkeitsfunktion
p: für die Verteilungsfunktion
q: für die Quantile
Die Funktionen, die die Dichte- bzw. Wahrscheinlichkeitsfunktion oder die
Verteilungsfunktion bestimmen, werden mit der oder an der Stelle
aufgerufen, an denen die jeweiligen Funktionen berechnet werden sollen.
Die Funktion, die die Quantile bestimmen, wird mit dem oder den Werten
von p (Wahrscheinlichkeit) aufgerufen, für die die Quantile berechnet
werden sollen. Außerdem besitzen die Funktionen Argumente für die
Parameter.
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
23
Beispiel: Spezielle Verteilungen in R
Sei X ~ N(0,1), d. h. E(X) = 0 und Var (X) = 1
” Bestimmen Sie den Wert der Verteilungsfunktion an der Stelle
x = 2.
” Geben Sie den Wert der Dichtefunktion an der Stelle x =2 an.
” Bestimmen Sie das Quantil x0,95, d. h. die Stelle x, an der die
Verteilungsfunktion den Wert 0,95 erreicht.
a) >pnorm(2,mean=0,sd=1)
[1] 0.9772499
>pnorm(2)
[1] 0.9772499
b) >dnorm(2,mean=0, sd=1)
[1] 0.05399097
>dnorm(2)
[1] 0.05399097
c) > qnorm(0.95,mean=0, sd=1) qnorm(0.95)
1.644854
Prof. Mohr / Dr. Ricabal
1.644854
Mehrdimensionale Zufallsvariablen
24
Funktionen für Verteilungen in R
Verteilung
Name in R
Parameter in R Parameter
Binomial
binom
size
prob
n
θ
Hypergeometrisch
hyper
m
n
k
M
N-M
n
Poisson
pois
lambda
µ
Normal
norm
mean
sd
µ
σ
Gleich
unif
min
max
a
b
Exponential
exp
rate
λ
t
t
df
ν
Chiquadrat
chisq
df
ν
F
f
df1, df2
ν1, ν2
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
25
Daten eingeben und abspeichern
Daten können in R in verschiedenen Formen eingegeben und unter
einem Namen (Variablen) abgespeichert werden. Man kann dann
auf sie später im Laufe der Sitzung zurückgreifen.
Beispiel 1:
n = 2, m = 3; s = n + m
>n<-2
>m<-3
>s<-n+m
>s
[1] 5
Prof. Mohr / Dr. Ricabal
Beispiel 2:
X~B(5; 0,5);
W(X = 0) und W(X ≤ 3)
>n<-5
>p<-0.5
>x1<-0
>x2<-2
>dbinom(x1,n,p)
[1] 0.03125
>pbinom(x2,n,p)
[1] 0.8125
Mehrdimensionale Zufallsvariablen
26
Datenvektoren eingeben und abspeichern
Ein Vektor ist eine Zusammenfassung von Objekten zu einer
endlichen Folge und besteht aus Komponenten. Ein Vektor erzeugt
man in R mit der Funktion c. Diese macht aus eine Folge von
Zahlen, die durch Kommata getrennt sind, einen Vektor, dessen
Komponenten die einzelnen Zahlen sind. Die Zahlen sind die
Argumenten der Funktion c.
Beispiel: Wir geben die Daten
c(0, 1 ,2, 3, 4, 5)
Am Bildschirm erhalten wir
[1] 0 1 2 3 4 5
Die Elemente des Vektors werden ausgegeben. Am Anfang steht [1].
Damit wird gezeigt, dass die erste Zahl die erste Komponente des
Vektors ist. Um mit den Werten weiterhin arbeiten zu können,
müssen wir den Vektor in einer Variable speichern.
Beispiel:
x = c(0, 1 ,2, 3, 4, 5) bzw. x<- c(0, 1 ,2, 3, 4, 5) .
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
27
Beispiel: Vektoren in R
Sei X eine binomialverteilte Zufallsvariable mit den Parametern
n = 5 und θ = 0,5. Geben Sie für den Träger D(X) = {0, 1, 2, 3, 4, 5}
a) die Werte der Wahrscheinlichkeitsfunktion
b) die Werte der Verteilungsfunktion.
Die Werte von n und θ sind schon in dieser Sitzung eingegeben und
abgespeichert worden.
>x<-c(0:n)
>[1] 0 1 2 3 4 5
>round(wf,4)
[1] 0.0312 0.1562 0.3125 0.3125 0.1562 0.0312
>wf<-dbinom(x,n,p)
>round(vf,4)
[1] 0.0313 0.1875 0.5000 0.8125 0.9688 1.0000
>vf<-pbinom(x,n,p)
Eine Variable bleibt während der gesamten Sitzung in Workspace erhalten,
wenn sie nicht mit dem Befehl rm gelöscht wird.
Beim Verlassen von R durch q() wird man gefragt, ob man den Workspace
sichern will. Antwortet man q mit ja, so sind auch für die nächste Sitzung
alle Variablen vorhanden.
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
28
Grafiken spezieller Verteilungen in R
R bietet eine Reihe von Möglichkeiten eine Grafik zu
erstellen, von denen man im Skript von Dr. Andreas
Handls eine Vielzahl finden kann. In dieser Vorlesung
werden nur zwei Möglichkeiten als Anregung gezeigt.
”
Die grafische Darstellung der Wahrscheinlichkeitsbzw. Verteilungsfunktion von speziellen diskreten
Verteilungen.
”
Die grafische Darstellung der Dichte- bzw.
Verteilungsfunktion von speziellen stetigen
Verteilungen.
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
29
Grafik spezieller Verteilungen in R
(Beispiel: Binomialverteilung)
Sei X~B(5; 0,5)
>x<-c(0:5)
>plot(0:5, dbinom(x, 5, 0.5), type =‘‘h“
0.6
0.2
0.4
pbinom(x, 5, 0.5)
0.20
0.15
0.10
0.0
0.05
dbinom(x, 5, 0.5)
0.25
0.8
0.30
1.0
>x<-c(-1,x,6)
>plot(-1:6,dbinom(x,5,0.5),type=‘‘s“
0
1
2
3
4
5
-1
0
1
Prof. Mohr / Dr. Ricabal
2
3
4
5
-1:6
0:5
Mehrdimensionale Zufallsvariablen
30
6
Grafik spezieller Verteilungen in R
(Beispiel: Hypergeometrische Verteilung)
Beispiel: Vorlesung V12
> x<-c(-1:16)
> plot(-1:4, dhyper(x, 2, 3, 3), type = ‘‘s“)
0.6
0.0
0.0
0.1
0.2
0.4
phyper(x, 3, 2, 3)
0.3
0.2
dhyper(x, 3, 2, 3)
0.4
0.8
0.5
1.0
0.6
Sei X~H(5, 3, 3), d. h. N=5, n=3, M=3
> x<-c(0:3)
> plot(0:3, dhyper(x, 2, 3, 3), type =‘‘h“)
0.0
0.5
1.0
1.5
2.0
2.5
3.0
-1
0
1
0:3
2
3
4
-1:4
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
31
Grafik spezieller Verteilungen in R
(Beispiel: Poisonverteilung)
Beispiel: Vorlesung 12
> x<-c(-1:16)
> plot(-1:16, ppois(x, 4), type = ‘‘s“)
0.6
ppois(x, 4)
0.2
0.4
0.10
0.05
0.0
0.00
dpois(x, 4)
0.15
0.8
1.0
0.20
Sei X~P(4), d. h. E(X) = 4 und Var (X) = 4
> x<-c(0:15)
> plot(0:15, dpois(x, 4), type =‘‘h“)
0
5
10
15
0
0:15
Prof. Mohr / Dr. Ricabal
5
10
15
-1:16
Mehrdimensionale Zufallsvariablen
32
Grafik spezieller Verteilungen in R
(Beispiel: Gleichverteilung)
Beispiel: Vorlesung V13
> curve(dexp(x, 0.25), from=-5, to=15)
0.8
0.6
punif(x, 0, 10)
0.0
0.00
0.2
0.4
0.06
0.04
0.02
dunif(x, 0, 10)
0.08
1.0
0.10
Sei X~G(a = 0; b = 10)
> curve(dunif(x, 0, 10), from=-5, to=15)
-5
0
5
10
15
-5
0
5
x
10
15
x
Mehrdimensionale Zufallsvariablen
Prof. Mohr / Dr. Ricabal
33
Grafik spezieller Verteilungen in R
(Beispiel: Exponentialverteilung)
Beispiel: Vorlesung V13
> curve(dexp(x, 0.25), from=0, to=25)
0.8
0.6
pexp(x, 1/4)
0.2
0.4
0.15
0.10
0.05
0.0
0.00
dexp(x, 1/4)
0.20
1.0
0.25
Sei X~E(λ = 0,25), d. h. E(X)=1/λ=4
> curve(dexp(x, 0.25), from=0, to=25)
0
5
10
15
20
25
0
5
x
Prof. Mohr / Dr. Ricabal
10
15
20
x
Mehrdimensionale Zufallsvariablen
34
25
Grafik spezieller Verteilungen in R
(Beispiel: Standardnormalverteilung)
> curve (dnorm (x, mean=0,
sd=1), from=-3, to = 3)
0.6
0.0
0.2
0.4
pnorm(x, mean = 0, sd = 1)
0.2
0.1
0.0
dnorm(x, mean = 0, sd = 1)
0.3
0.8
1.0
0.4
Sie Z~N(0,1), d. h. E(Z) = 0 und Var (Z) = 1
> curve (dnorm (x, mean=0, sd=1),
from=-3, to = 3)
-3
-2
-1
0
1
2
3
-3
-2
x
Prof. Mohr / Dr. Ricabal
-1
0
1
2
3
x
Mehrdimensionale Zufallsvariablen
35
Beispiel: Berechnung von Quantilen
Man kann mit R die 3 Quartile einer Verteilung, d. h.
Q1 = x0,25, Q2 = Me = x0,5, Q3 = x0,75, mit R wie folgt bestimmen.
> p=c(0.25, 0.50, 0.75)
a)
Sei X~B(n = 5; θ = 0,5)
> qbinom(p, 5, 0.5)
[1] 2 2 3
b)
Sei X~H(N = 5; M = 3, n = 3)
> qhyper(p, 3, 2, 3)
[1] 1 2 2
c)
Sei X~P(θ = 4)
> qpois(p, 4)
[1] 3 4 5
d)
Sei X~G(a = 0; b = 10)
> qunif(p, 0, 10)
[1] 2.5 5.0 7.5
e)
Sei X~E(λ = 0,25)
> round(qexp(p, 0, 25), 2)
[1] 1.15 2.77 5.55
e)
Sei Z~N(0, 1)
> round(qnorm(p,mean = 0, sd = 1), 4)
[1] -0.67 0.00 0.67
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
36
Beispiel: Wahrscheinlichkeitsrechnung für
Extremfälle ohne Approximation
Lösen Sie die Beispiele aus den Vorlesungen V12 und V13 mit R ohne
Approximationen und vergleichen Sie die Ergebnisse.
Aus der Vorlesung 13:
Von 2000 Studierenden eines Fachbereiches bestreiten 600 ihr Studium vollständig
aus eigenen Mitteln. Wie groß ist die Wahrscheinlichkeit, dass unter 30 zufällig und
ohne Zurücklegen ausgewählten Studenten 9 bis 12 zu dieser Gruppe gehören?
(1) Exakter Ansatz: Hypergeometrische Verteilung mit den Parametern
N = 2000, M = 600 und n = 30 (Anwendung der Verteilungsfunktion)
W (9 ≤ X ≤ 12) = FH (12 / N; n; M ) − F(8 / N; n; M )
> N = 2000
> M = 600
> n = 30
> x1 = 9
> x2 = 12
> phyper(x2, m = 600, n = N-M, k = n) - phyper(x1 - 1, m = 600, n = N-M, k = n)
[1] 0.486442
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
37
Beispiel: Wahrscheinlichkeitsrechnung für
Extremfälle ohne Approximation.
(2) Exakter Ansatz: Hypergeometrische Verteilung mit den Parameter
N = 2000, M = 600 und n = 30 (Anwendung der
Wahrscheinlichkeitsfunktion)
W (9 ≤ X ≤ 12)
= f H (9 / N; n; M ) + f H (10 / N; n; M ) + f H (11 / N; n; M ) + F(12 / N; n; M)
> N<-2000
> M<-600
> n<-30
> x<-c(9:12)
>w<-dhyper(x, m = M, n = N - M, k = n)
>round(w, 4)
[1] 0.1585 0.1425 0.1107 0.0747
> round(sum(w), 4)
[1] 0.4864
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
38
Beispiel: Tests-Verteilungen
Geben Sie die Quantile x0,025, x0,25, x0,50, x0,75, x0,995 mit 3
Deimalstellen für folgende Verteilungen an.
a) eine Chi-Quadratverteilte Zufallsvariable mit 10 Freiheitsgraden,
b) eine studentverteilte Zufallsvariable mit 10 Freiheitsgraden,
c) eine F-verteilte Zufallsvariable mit 9 und 6 Freiheitsgraden.
> p<-c(0.025, 0.25, 0.50, 0.75, 0.995)
a) > round(qchisq(p, 10), d = 3)
[1] 3.247 6.737 9.342 12.549 25.188
b) > round(qt(p, 10), d = 3)
[1] -2.228 -0.700 0.000 0.700 3.169
c) > round(qf(p, 9, 6), d = 2)
[1] 0.23 0.62 1.04 1.77 10.39
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
39
Beispiel: Tests-Verteilungen
a) Sei X eine Chi-Quadratverteilte
b) Sei T eine studentverteilte
Zufallsvariable mit 10 Freiheitsgraden.
Zufallsvariable mit 10
Geben Sie die Quantile
Freiheitsgraden. Geben Sie die
x0,025, x0,25, x0,50, x0,75, x0,995 mit 3
Quantile
Kommastellen an.
x0,025, x0,25, x0,50, x0,75, x0,995 mit 3
Kommastellen an.
> p<-c(0.025, 0.25, 0.50, 0.75, 0.995)
> round(qchisq(p, 10), d = 3)
> p<-c(0.025, 0.25, 0.50, 0.75, 0.995)
[1] 3.247 6.737 9.342 12.549 25.188
> round(qt(p, 10), d = 3)
[1] -2.228 -0.700 0.000 0.700 3.169
c) Sei F eine F-verteilte Zufallsvariable mit 9 und 6 Freiheitsgraden. Geben Sie die
Quantile x0,01, x0,05, x0,50, x0,95, x0,99 mit 2 Kommastellen an.
> p<-c(0.01, 0.05, 0.50, 0.95, 0.99)
> round(qchisq(p, 9, 6), d = 2)
[1] 0.17 0.30 1.04 4.10 7.98
Prof. Mohr / Dr. Ricabal
Mehrdimensionale Zufallsvariablen
40
Herunterladen