Mehrdimensionale Zufallsvariablen Verteilung einer mehrdimensionalen Zufallsvariablen Stochastische Unabhängigkeit von Variablen Erwartungswerte zweidimensionaler Zufallsvariablen Einführung in die Statistik mit R Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler Bleymüller / Gehlert Verlag Vahlen Statistische Formeln, Tabellen und Programme PowerPointPräsentationen (Prof. Mohr/ Dr. Ricabal) Vorlesungsskript für Statistik I (Dr. Pu Chen) Vorlesungsskript für Statistik II (Prof. Mohr, Private Hanseuniversität Rostock) http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/ Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 2 Mehrdimensionale Zufallsvariablen Für viele Fragestellungen ist es notwendig, mehrere Zufallsvariablen gemeinsam zu betrachten (Siehe. Beschreibende Statistik). Beispiel: ¾ Umfrage bei Haushalten: Verschiedene Merkmale wie Alter, Geschlecht, Einkommen, etc ¾ Versuchwiederholungen bei Würfelexperimenten. Es soll hier nur der Spezialfall für 2 Variablen besprochen werden (zweidimensionaler Fall). Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 3 Zweidimensionale diskrete Zufallsvariable Gemeinsame Wahrscheinlichkeitsfunktion: ⎧ W ( X = x , Y = y ) ( x , y ) ∈ D( X, Y ) f X , Y ( x , y) = ⎨ sonst ⎩0 Träger: D(X,Y) = { (x, y) | W(X = x, Y = y) > 0 } Es gilt: (i) 0 ≤ f X , Y ( x , y) ≤ 1 (ii) ∑ ∑f X ,Y ( x , y )∈D ( X , Y ) ( x , y) = 1 Gemeinsame Verteilungsfunktion: FX ,Y ( x, y) = Prof. Mohr / Dr. Ricabal ∑ ∑f xi ≤x y j ≤y X ,Y (x i , y j ) = 1 Mehrdimensionale Zufallsvariablen 4 Eindimensionale Randverteilungen Aus der gemeinsamen Wahrscheinlichkeitsfunktion ergeben sich: die eindimensionale Randwahrscheinlichkeitsfunktionen f X (x) = ∑f X ,Y y∈D ( X , Y ) ( x , y) und f Y ( y) = ∑f X ,Y x∈D ( X , Y ) ( x , y) die eindimensionale Randverteilungsfunktionen FX ( x ) = ∑f (x i ) und FX ( x ) = FX ,Y ( x, ∞) und xi ≤x X FY ( y) = ∑f yi ≤ y Y ( yi ) FY ( y) = FX ,Y (∞, y) Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 5 Bedingte Verteilungen die bedingten Wahrscheinlichkeitsfunktionen f X / Y ( x / y) = f X , Y ( x , y) f Y / X (y / x) = f X , Y ( x , y) f Y ( y) f X (x) falls f Y ( y) > 0 falls f X ( x ) > 0 die bedingten Verteilungsfunktionen FX / Y ( x / y) = FY / X ( y / x ) = Prof. Mohr / Dr. Ricabal ∑f xi ≤x ∑f yi ≤ y X/Y Y/X ( x i / y) und ( yi / x ) Mehrdimensionale Zufallsvariablen 6 Beispiel: Zweidimensionale diskrete Zufallsvariablen In einer Urne sind 6 Kugeln aus 3 verschiedenen Sorten: 3 sind rot, 2 sind grün und 1 ist gelb. Man zieht ohne Zurücklegen zwei Kugeln. Dann ist die gemeinsame Wahrscheinlichkeitsfunktion für die ZV X: Farbe der ersten Kugel Y: Farbe der zweiten Kugel Codierung: rot (1), grün (2) und gelb (3) Y 1 X 2 3 1 6/30 6/30 3/30 f X ,Y (i, j) = W (X = i, Y = j) 2 6/30 2/30 2/30 = W ( X = i) ⋅ W ( Y = j / X = i) 3 3/30 2/30 0 3 2 6 f X ,Y (1, 1) = W (X = 1 ∧ Y = 1) = W (X = 1) ⋅ W (Y = 1 / X = 1) = ⋅ = 6 5 30 Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 7 Beispiel: Rand- und bedingte Verteilungen Gemeinsame Wahrscheinlichkeitsfunktion Y X 1 2 3 fX(x) 1 6/30 6/30 3/30 15/30 2 6/30 2/30 2/30 10/30 3 3/30 2/30 0 fY(y) 15/30 10/30 5/30 5/30 1 Denken Sie nach, wie würden die bedingten Verteilungen fY/X(y/x) bzw. FY/X(y/x) aussehen! Lösen Sie den Aufgabenteil b) für Ziehen mit Zurücklegen! Prof. Mohr / Dr. Ricabal x f(x/y=1) F(x/y=1) 1 (6/30)/(15/30) = 6/15 6/15 2 (6/30)/(15/30) = 6/15 12/15 3 (3/30)/(15/30) = 3/15 1 x f(x/y=2) F(x/y=2) 1 (6/30)/(10/30) = 6/10 6/10 2 (2/30)/(10/30) = 2/10 8/10 3 (2/30)/(10/30) = 3/10 1 x f(x/y=3) F(x/y=3) 1 (3/30)/(5/30) = 3/5 3/5 2 (2/30)/(5/30) = 2/5 1 3 (0)/(5/30) = 0 1 Mehrdimensionale Zufallsvariablen 8 Beispiel: Gemeinsame Verteilungsfunktion Gemeinsame Wahrscheinlichkeitsfunktion fX,Y(x,y) = W(X = xi; Y = yj) Y X 1 2 3 Gemeinsame Verteilungstsfunktion FX,Y(x,y) = W(X ≤ xi; Y ≤ yj) Y X y<1 1≤y<2 2≤y<3 3≤y 1 6/30 6/30 3/30 x<1 0 0 0 0 2 6/30 2/30 2/30 1≤x<2 0 6/30 12/30 13/30 3 3/30 2/30 0 2≤x<3 0 12/30 20/30 25/30 3≤x 0 15/30 25/30 1 Zweidimensionale stetige Verteilungen Anstelle der Summationen werden völlig analog Integrationen durchgeführt. Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 9 Stochastische Unabhängigkeit von Zufallsvariablen Analog zur statistischen Unabhängigkeit für zwei Ereignisse A und B, für die es gilt: W(A ∩ B) = W(A) ⋅ W(B) lässt sich die Stochastische Unabhängigkeit zweier Zufallsvariablen X und Y formulieren: FX,Y (x, y) = FX (x) ⋅ FY ( y) für alle (x, y). Gleichwertige Darstellungen: f X,Y (x, y) = f X (x) ⋅ f Y ( y) für alle (x, y) FX|Y (x | y) = FX (x) oder FY|X ( y | x) = FY ( y) für alle (x, y) f X|Y (x | y) = f X (x) oder f Y|X ( y | x) = f Y ( y) für alle (x, y) Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 10 Beispiel: Stochastische Unabhängigkeit von Zufallsvariablen In einer Urne sind 6 Kugeln aus 3 verschiedenen Sorten: 3 sind rot, 2 sind grün und 1 ist gelb. Man zieht mit Zurücklegen zwei Kugeln. Wie bei der Ziehung ohne Zurücklegen definieren wir die Zuffalsvariablen X: Farbe der ersten Kugel Y: Farbe der zweiten Kugel Codierung: rot (1), grün (2) und gelb (3) In diesem Fall gilt: Y f Y|X ( y | x) = f Y ( y) für alle (x, y) X Denn der erste Zug hat bei einer Ziehung mit Zurücklegen keinen Einfluss auf den zweiten Zug. Somit gilt auch: 1 2 3 fX(x) 1 1/4 1/6 1/12 1/2 2 1/6 1/9 1/18 1/3 3 1/12 1/18 1/36 1/6 fY(y) 1/2 1/3 1/6 1 f X,Y (x, y) = f X (x) ⋅ f Y ( y) für alle (x, y) Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 11 Erwartungswerte zweidimensionaler Zufallsvariablen ⎧ ∑∑ g( x, y)f ( x, y) im diskreten Fall ⎪⎪( x , y )∈D ( X;Y ) E[g (X, Y)] = ⎨ ∞ ∞ ⎪ ∫ ∫ g ( x , y)f ( x, y)dx dy im stetigen Fall ⎪⎩ -∞ -∞ Die wichtigsten Spezialfälle für g(X, Y): g(X, Y) = X g(X, Y) = Y g(X, Y) = (X - µX)² g(X, Y) = (Y - µY)² g(X, Y) = (X - µX) (Y - µY) Prof. Mohr / Dr. Ricabal : : : : : Erwartungswert µX ≡ E(X) Erwartungswert µY ≡ E(Y) Varianz σ²X ≡ Var (X) Varianz σ²Y ≡ Var (Y) Kovarianz σXY ≡ Cov (X, Y) Mehrdimensionale Zufallsvariablen 12 Rechenregel für allgemeine Erwartungswerte Cov (X, Y) = E(XY) – E(X) E(Y) E (X ± Y) = E(X) ± E(Y) linearer Operator Var (X ± Y) = Var (X) + Var (Y) ± 2 Cov (X, Y) kein linearer Operator E (a X ± b Y) = a E(X) ± b E(Y) „konstanter Faktor kann vor dem E-Operator gezogen werden“ Var (a X ± b Y) = a² Var (X) + b² Var (Y) ± 2 a b Cov (X, Y) „konstanter Faktor wird quadratisch vor dem Var-Operator gezogen“ ⎛ n ⎞ n E⎜ ∑ a i X i ⎟ = ∑ a i E ( X i ) ; ⎝ i =1 ⎠ i =1 gilt immer ⎛ n ⎞ n Var⎜ ∑ a i X i ⎟ = ∑ a i2 Var(X i ) ; ⎝ i =1 ⎠ i =1 Prof. Mohr / Dr. Ricabal falls X i stochastisch unabhängig Mehrdimensionale Zufallsvariablen 13 Korrelationskoeffizient Wie in der Deskriptiven Statistik erhält man den Korrelationskoeffizienten durch Normierung der Kovarianz ρ XY = Cov(X, Y) Var(X) Var (Y ) Es gilt: -1 ≤ ρXY ≤ 1 Die Extremfälle ρXY = ± 1 bedeuten, dass zwischen Y und X eine positive lineare Beziehung besteht. Im Fall ρXY = 0 sagt man, dass die beiden Zufallsvariablen X und Y unkorreliert sind. Aus der stochastischen Unabhängigkeit zweier ZV X und Y folgt ihre Unkorreliertheit. Die Umkehrung gilt jedoch nicht! Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 14 Beispiel: Erwartungswerte zweidimensionaler Zufallsvariablen In einer Urne sind 6 Kugeln aus 3 verschiedenen Sorten: 3 sind rot, 2 sind grün und 1 ist gelb. Man zieht mit Zurücklegen zwei Kugeln. Hier sind: X: Farbe der ersten Kugel Y Y: Farbe der zweiten Kugel 1 2 3 fX(x) X Codierung: rot (1), grün (2) und gelb (3) 1 6/30 6/30 3/30 15/30 E(X) = ∑ x ⋅ f X ( x ) = 1⋅ x 15 10 5 50 5 + 2 ⋅ + 3⋅ = = 30 30 30 30 3 15 10 5 50 5 E ( Y ) = ∑ y ⋅ f Y ( y) = 1 ⋅ + 2 ⋅ + 3 ⋅ = = 30 30 30 30 3 y 2 6/30 2/30 2/30 10/30 3 3/30 2/30 0 fY(y) 15/30 10/30 5/30 5/30 1 Var (X) = E (X 2 ) − (E (X)) 2 = 12 ⋅ 15 10 5 ⎛ 5 ⎞ 100 25 30 − 25 5 + 2 2 ⋅ + 32 ⋅ − ⎜ ⎟ = − = = 30 30 30 ⎝ 3 ⎠ 30 9 9 9 Var (Y) = E (Y 2 ) − (E (Y)) 2 = 12 ⋅ 15 10 5 ⎛ 5 ⎞ 100 25 30 − 25 5 + 2 2 ⋅ + 32 ⋅ − ⎜ ⎟ = − = = 30 30 30 ⎝ 3 ⎠ 30 9 9 9 2 2 Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 15 Beispiel: Kovarianz und Korrelationskoeffizient Y X 1 2 3 1 6/30 6/30 3/30 15/30 2 6/30 2/30 2/30 10/30 3 3/30 2/30 0 fY(y) 15/30 10/30 5/30 Cov(X, Y) Var (X ) Var (Y) ρ XY = = 1 1 = 9 =− 5 5 5 5 9 9 9 − fX(x) 1 9 − Prof. Mohr / Dr. Ricabal 5/30 1 Cov(X, Y) = E (X ⋅ Y) − E(X) ⋅ E(Y) 3 6 6 = 1 ⋅1 ⋅ + 1 ⋅ 2 ⋅ + 1 ⋅ 3 ⋅ 30 30 30 6 2 2 + 2 ⋅1 ⋅ + 2 ⋅ 2 ⋅ + 2 ⋅ 3 ⋅ 30 30 30 3 2 5 5 + 3 ⋅1 ⋅ + 3 ⋅ 2 ⋅ + 3 ⋅ 3 ⋅ 0 − ⋅ 30 3 3 30 80 25 24 − 25 1 = − = =− 30 9 9 9 „Je kleiner die Zahl in ersten Zug ist, umso größer die Zahl im zweiten Zug und umgekehrt.“ Somit sind die Zufallsvariablen in diesem Fall (ohne Zurücklegen) negativ korreliert. Bei der Ziehung mit Zurücklegen sind X und Y unkorreliert, weil sie stochastisch unabhängig sind. Mehrdimensionale Zufallsvariablen 16 Erwartungswert und Varianz einer linearen Kombination von Zufallsvariablen Für unabhängige bzw. unkorrelierte Zufallsvariablen Xi (i=1, . . ., n) gelten: ⎛ n ⎞ n E⎜ ∑ a i X i ⎟ = ∑ a i E ( X i ) ⎝ i =1 ⎠ i =1 und ⎛ n ⎞ n Var⎜ ∑ a i X i ⎟ = ∑ a i2 Var(X i ) ⎝ i =1 ⎠ i =1 Wichtiger Spezialfall: arithmetisches Mittel von identisch unabhängige Zufallsvariablen Xi (i=1, 2, …, n): E( X ) = E( X= 1 n ∑ Xi n i =1 n 1 n 1 1 n 1 n nµ X i ) = E (∑ X i ) = ∑ E (X i ) = ∑ µ = =µ ∑ n i =1 n i =1 n i =1 n i =1 n Var ( X ) = Var ( 1 1 n Xi ) = 2 ∑ n n i =1 Prof. Mohr / Dr. Ricabal n 1 n ∑ Var(X ) = n ∑ σ i =1 i 2 i =1 2 = nσ 2 σ 2 = n2 n Mehrdimensionale Zufallsvariablen 17 Einführung in die Statistik mit R Unter den bekanntesten professionellen Computerprogramme für statistische Datenanalyse befinden sich SAS und SPSS. Beide Programme sind aber sehr teuer und unflexibel. In Statistikprogramm R sind viele Verfahren vorhanden, es ist sehr flexibel und außerdem kostenlos. Deswegen wird es mehr und mehr weltweit von Studenten und Wissenschaftler genutzt. Wo findet man R? http://www.r-project.org/ Wie kann man es runterladen und installieren? CRAN (The Comprehensive R Archive Network) Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 18 Wo findet man Information über R ¾ In Internet gibt es eine große Menge von Information und Tipps über R. ¾ The R Project for Statistical Computing http://www.r-project.org/ ¾ Auf der Webseite des Lehrstuhls Statistik Downloadbereich ¾ Statistik I (Sommer_2008) Statskript (Dr. A. Handl) Aufgaben für das Selbststudium Statistik I für die BAStudiengänge Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 19 Erste Schritte mit R ¾ Starten und Beenden des Programms ¾ Neues Skript erstellen ¾ Datei → Neues Skript Windows → Pflastern R als mächtiger Taschenrechner ¾ Start → Programme → R → R 2.9.0 Datei → Beenden Grundrechenarten: Addition (a+b), Subtraktion (a-b), Multiplikation (a*b), Division (a/b), Potenz (a^b), Quadratwurzel sqrt(a) Dezimalpunkt für Dezimalzahlen Ausführung von Befehlen mit der Taste carrriage return auf der Console Alt+R auf dem Skrip R gibt das Ergebnis in der nächsten Zeile aus. Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 20 Beispiel: Mathematische Operationen mit R a) b) c) d) e) f) g) 2,1 + 2 2,1 - 2 2,1 · 2 2,1 / 2 2,12 (2,1)0,5 sqrt (2,1) Prof. Mohr / Dr. Ricabal a) b) c) d) e) >2.1 + 2 [1] 4.1 >2.1 – 2 [1] 0.1 >2.1 * 2 [1] 4.2 >2.1 / 2 [1] 1.05 >2.1^2 [1] 4.41 f) g) Mehrdimensionale Zufallsvariablen >(2.1)^0.5 [1] 1.449138 >sqrt (2.1) [1] 1.449138 21 Funktionen in R Die Namen von Funktionen werden in R nach mnemothechnischen Gesichtspunkte gewählt, z. B. sqrt für square root, Quadratwurzel. Die Funktionen in R besitzen in der Regel Argumente. So muss man der Funktion sqrt mitteilen, von welcher Zahl sie die Quadratwurzel bestimmen soll. Die Argumente einer Funktion stehen in runden Klammern hinter dem Funktionsnamen und sind durch Kommata voneinander getrennt. Wir rufen die Funktion sqrt mit dem Argument 2. R gibt die Ergebnisse mit 6 Dezimalstellen aus. Weniger Stellen bekommt man mit der Funktion round (runden). Diese Funktion hat das Argument digits (Dezimalstellenzahl). Beispiel: a) round(sqrt(2), digits = 2) b) round(sqrt(2), d = 2) c) round(sqrt(2)) d) round(sqrt(2), d = 0) Prof. Mohr / Dr. Ricabal R - Ergebnisse: a) [1] 1,41 b) [1] 1,41 c) [1] 1 d) [1] 1 Mehrdimensionale Zufallsvariablen 22 Spezielle Verteilungen in R In R gibt es Funktionen, mit denen man die Dichte- bzw. Wahrscheinlichkeitsfunktion, die Verteilungsfunktion und die Quantile von Verteilungen bestimmen kann. Jeder Verteilung hat einen eigenen Namen. Die Normalverteilung wird mit dem Kürzel norm bezeichnet. Durch einen Buchstaben vor dem Namen erhält man nun die oben angesprochenen Funktionen: d: für die Dichte-, bzw. die Wahrscheinlichkeitsfunktion p: für die Verteilungsfunktion q: für die Quantile Die Funktionen, die die Dichte- bzw. Wahrscheinlichkeitsfunktion oder die Verteilungsfunktion bestimmen, werden mit der oder an der Stelle aufgerufen, an denen die jeweiligen Funktionen berechnet werden sollen. Die Funktion, die die Quantile bestimmen, wird mit dem oder den Werten von p (Wahrscheinlichkeit) aufgerufen, für die die Quantile berechnet werden sollen. Außerdem besitzen die Funktionen Argumente für die Parameter. Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 23 Beispiel: Spezielle Verteilungen in R Sei X ~ N(0,1), d. h. E(X) = 0 und Var (X) = 1 Bestimmen Sie den Wert der Verteilungsfunktion an der Stelle x = 2. Geben Sie den Wert der Dichtefunktion an der Stelle x =2 an. Bestimmen Sie das Quantil x0,95, d. h. die Stelle x, an der die Verteilungsfunktion den Wert 0,95 erreicht. a) >pnorm(2,mean=0,sd=1) [1] 0.9772499 >pnorm(2) [1] 0.9772499 b) >dnorm(2,mean=0, sd=1) [1] 0.05399097 >dnorm(2) [1] 0.05399097 c) > qnorm(0.95,mean=0, sd=1) qnorm(0.95) 1.644854 Prof. Mohr / Dr. Ricabal 1.644854 Mehrdimensionale Zufallsvariablen 24 Funktionen für Verteilungen in R Verteilung Name in R Parameter in R Parameter Binomial binom size prob n θ Hypergeometrisch hyper m n k M N-M n Poisson pois lambda µ Normal norm mean sd µ σ Gleich unif min max a b Exponential exp rate λ t t df ν Chiquadrat chisq df ν F f df1, df2 ν1, ν2 Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 25 Daten eingeben und abspeichern Daten können in R in verschiedenen Formen eingegeben und unter einem Namen (Variablen) abgespeichert werden. Man kann dann auf sie später im Laufe der Sitzung zurückgreifen. Beispiel 1: n = 2, m = 3; s = n + m >n<-2 >m<-3 >s<-n+m >s [1] 5 Prof. Mohr / Dr. Ricabal Beispiel 2: X~B(5; 0,5); W(X = 0) und W(X ≤ 3) >n<-5 >p<-0.5 >x1<-0 >x2<-2 >dbinom(x1,n,p) [1] 0.03125 >pbinom(x2,n,p) [1] 0.8125 Mehrdimensionale Zufallsvariablen 26 Datenvektoren eingeben und abspeichern Ein Vektor ist eine Zusammenfassung von Objekten zu einer endlichen Folge und besteht aus Komponenten. Ein Vektor erzeugt man in R mit der Funktion c. Diese macht aus eine Folge von Zahlen, die durch Kommata getrennt sind, einen Vektor, dessen Komponenten die einzelnen Zahlen sind. Die Zahlen sind die Argumenten der Funktion c. Beispiel: Wir geben die Daten c(0, 1 ,2, 3, 4, 5) Am Bildschirm erhalten wir [1] 0 1 2 3 4 5 Die Elemente des Vektors werden ausgegeben. Am Anfang steht [1]. Damit wird gezeigt, dass die erste Zahl die erste Komponente des Vektors ist. Um mit den Werten weiterhin arbeiten zu können, müssen wir den Vektor in einer Variable speichern. Beispiel: x = c(0, 1 ,2, 3, 4, 5) bzw. x<- c(0, 1 ,2, 3, 4, 5) . Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 27 Beispiel: Vektoren in R Sei X eine binomialverteilte Zufallsvariable mit den Parametern n = 5 und θ = 0,5. Geben Sie für den Träger D(X) = {0, 1, 2, 3, 4, 5} a) die Werte der Wahrscheinlichkeitsfunktion b) die Werte der Verteilungsfunktion. Die Werte von n und θ sind schon in dieser Sitzung eingegeben und abgespeichert worden. >x<-c(0:n) >[1] 0 1 2 3 4 5 >round(wf,4) [1] 0.0312 0.1562 0.3125 0.3125 0.1562 0.0312 >wf<-dbinom(x,n,p) >round(vf,4) [1] 0.0313 0.1875 0.5000 0.8125 0.9688 1.0000 >vf<-pbinom(x,n,p) Eine Variable bleibt während der gesamten Sitzung in Workspace erhalten, wenn sie nicht mit dem Befehl rm gelöscht wird. Beim Verlassen von R durch q() wird man gefragt, ob man den Workspace sichern will. Antwortet man q mit ja, so sind auch für die nächste Sitzung alle Variablen vorhanden. Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 28 Grafiken spezieller Verteilungen in R R bietet eine Reihe von Möglichkeiten eine Grafik zu erstellen, von denen man im Skript von Dr. Andreas Handls eine Vielzahl finden kann. In dieser Vorlesung werden nur zwei Möglichkeiten als Anregung gezeigt. Die grafische Darstellung der Wahrscheinlichkeitsbzw. Verteilungsfunktion von speziellen diskreten Verteilungen. Die grafische Darstellung der Dichte- bzw. Verteilungsfunktion von speziellen stetigen Verteilungen. Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 29 Grafik spezieller Verteilungen in R (Beispiel: Binomialverteilung) Sei X~B(5; 0,5) >x<-c(0:5) >plot(0:5, dbinom(x, 5, 0.5), type =‘‘h“ 0.6 0.2 0.4 pbinom(x, 5, 0.5) 0.20 0.15 0.10 0.0 0.05 dbinom(x, 5, 0.5) 0.25 0.8 0.30 1.0 >x<-c(-1,x,6) >plot(-1:6,dbinom(x,5,0.5),type=‘‘s“ 0 1 2 3 4 5 -1 0 1 Prof. Mohr / Dr. Ricabal 2 3 4 5 -1:6 0:5 Mehrdimensionale Zufallsvariablen 30 6 Grafik spezieller Verteilungen in R (Beispiel: Hypergeometrische Verteilung) Beispiel: Vorlesung V12 > x<-c(-1:16) > plot(-1:4, dhyper(x, 2, 3, 3), type = ‘‘s“) 0.6 0.0 0.0 0.1 0.2 0.4 phyper(x, 3, 2, 3) 0.3 0.2 dhyper(x, 3, 2, 3) 0.4 0.8 0.5 1.0 0.6 Sei X~H(5, 3, 3), d. h. N=5, n=3, M=3 > x<-c(0:3) > plot(0:3, dhyper(x, 2, 3, 3), type =‘‘h“) 0.0 0.5 1.0 1.5 2.0 2.5 3.0 -1 0 1 0:3 2 3 4 -1:4 Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 31 Grafik spezieller Verteilungen in R (Beispiel: Poisonverteilung) Beispiel: Vorlesung 12 > x<-c(-1:16) > plot(-1:16, ppois(x, 4), type = ‘‘s“) 0.6 ppois(x, 4) 0.2 0.4 0.10 0.05 0.0 0.00 dpois(x, 4) 0.15 0.8 1.0 0.20 Sei X~P(4), d. h. E(X) = 4 und Var (X) = 4 > x<-c(0:15) > plot(0:15, dpois(x, 4), type =‘‘h“) 0 5 10 15 0 0:15 Prof. Mohr / Dr. Ricabal 5 10 15 -1:16 Mehrdimensionale Zufallsvariablen 32 Grafik spezieller Verteilungen in R (Beispiel: Gleichverteilung) Beispiel: Vorlesung V13 > curve(dexp(x, 0.25), from=-5, to=15) 0.8 0.6 punif(x, 0, 10) 0.0 0.00 0.2 0.4 0.06 0.04 0.02 dunif(x, 0, 10) 0.08 1.0 0.10 Sei X~G(a = 0; b = 10) > curve(dunif(x, 0, 10), from=-5, to=15) -5 0 5 10 15 -5 0 5 x 10 15 x Mehrdimensionale Zufallsvariablen Prof. Mohr / Dr. Ricabal 33 Grafik spezieller Verteilungen in R (Beispiel: Exponentialverteilung) Beispiel: Vorlesung V13 > curve(dexp(x, 0.25), from=0, to=25) 0.8 0.6 pexp(x, 1/4) 0.2 0.4 0.15 0.10 0.05 0.0 0.00 dexp(x, 1/4) 0.20 1.0 0.25 Sei X~E(λ = 0,25), d. h. E(X)=1/λ=4 > curve(dexp(x, 0.25), from=0, to=25) 0 5 10 15 20 25 0 5 x Prof. Mohr / Dr. Ricabal 10 15 20 x Mehrdimensionale Zufallsvariablen 34 25 Grafik spezieller Verteilungen in R (Beispiel: Standardnormalverteilung) > curve (dnorm (x, mean=0, sd=1), from=-3, to = 3) 0.6 0.0 0.2 0.4 pnorm(x, mean = 0, sd = 1) 0.2 0.1 0.0 dnorm(x, mean = 0, sd = 1) 0.3 0.8 1.0 0.4 Sie Z~N(0,1), d. h. E(Z) = 0 und Var (Z) = 1 > curve (dnorm (x, mean=0, sd=1), from=-3, to = 3) -3 -2 -1 0 1 2 3 -3 -2 x Prof. Mohr / Dr. Ricabal -1 0 1 2 3 x Mehrdimensionale Zufallsvariablen 35 Beispiel: Berechnung von Quantilen Man kann mit R die 3 Quartile einer Verteilung, d. h. Q1 = x0,25, Q2 = Me = x0,5, Q3 = x0,75, mit R wie folgt bestimmen. > p=c(0.25, 0.50, 0.75) a) Sei X~B(n = 5; θ = 0,5) > qbinom(p, 5, 0.5) [1] 2 2 3 b) Sei X~H(N = 5; M = 3, n = 3) > qhyper(p, 3, 2, 3) [1] 1 2 2 c) Sei X~P(θ = 4) > qpois(p, 4) [1] 3 4 5 d) Sei X~G(a = 0; b = 10) > qunif(p, 0, 10) [1] 2.5 5.0 7.5 e) Sei X~E(λ = 0,25) > round(qexp(p, 0, 25), 2) [1] 1.15 2.77 5.55 e) Sei Z~N(0, 1) > round(qnorm(p,mean = 0, sd = 1), 4) [1] -0.67 0.00 0.67 Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 36 Beispiel: Wahrscheinlichkeitsrechnung für Extremfälle ohne Approximation Lösen Sie die Beispiele aus den Vorlesungen V12 und V13 mit R ohne Approximationen und vergleichen Sie die Ergebnisse. Aus der Vorlesung 13: Von 2000 Studierenden eines Fachbereiches bestreiten 600 ihr Studium vollständig aus eigenen Mitteln. Wie groß ist die Wahrscheinlichkeit, dass unter 30 zufällig und ohne Zurücklegen ausgewählten Studenten 9 bis 12 zu dieser Gruppe gehören? (1) Exakter Ansatz: Hypergeometrische Verteilung mit den Parametern N = 2000, M = 600 und n = 30 (Anwendung der Verteilungsfunktion) W (9 ≤ X ≤ 12) = FH (12 / N; n; M ) − F(8 / N; n; M ) > N = 2000 > M = 600 > n = 30 > x1 = 9 > x2 = 12 > phyper(x2, m = 600, n = N-M, k = n) - phyper(x1 - 1, m = 600, n = N-M, k = n) [1] 0.486442 Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 37 Beispiel: Wahrscheinlichkeitsrechnung für Extremfälle ohne Approximation. (2) Exakter Ansatz: Hypergeometrische Verteilung mit den Parameter N = 2000, M = 600 und n = 30 (Anwendung der Wahrscheinlichkeitsfunktion) W (9 ≤ X ≤ 12) = f H (9 / N; n; M ) + f H (10 / N; n; M ) + f H (11 / N; n; M ) + F(12 / N; n; M) > N<-2000 > M<-600 > n<-30 > x<-c(9:12) >w<-dhyper(x, m = M, n = N - M, k = n) >round(w, 4) [1] 0.1585 0.1425 0.1107 0.0747 > round(sum(w), 4) [1] 0.4864 Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 38 Beispiel: Tests-Verteilungen Geben Sie die Quantile x0,025, x0,25, x0,50, x0,75, x0,995 mit 3 Deimalstellen für folgende Verteilungen an. a) eine Chi-Quadratverteilte Zufallsvariable mit 10 Freiheitsgraden, b) eine studentverteilte Zufallsvariable mit 10 Freiheitsgraden, c) eine F-verteilte Zufallsvariable mit 9 und 6 Freiheitsgraden. > p<-c(0.025, 0.25, 0.50, 0.75, 0.995) a) > round(qchisq(p, 10), d = 3) [1] 3.247 6.737 9.342 12.549 25.188 b) > round(qt(p, 10), d = 3) [1] -2.228 -0.700 0.000 0.700 3.169 c) > round(qf(p, 9, 6), d = 2) [1] 0.23 0.62 1.04 1.77 10.39 Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 39 Beispiel: Tests-Verteilungen a) Sei X eine Chi-Quadratverteilte b) Sei T eine studentverteilte Zufallsvariable mit 10 Freiheitsgraden. Zufallsvariable mit 10 Geben Sie die Quantile Freiheitsgraden. Geben Sie die x0,025, x0,25, x0,50, x0,75, x0,995 mit 3 Quantile Kommastellen an. x0,025, x0,25, x0,50, x0,75, x0,995 mit 3 Kommastellen an. > p<-c(0.025, 0.25, 0.50, 0.75, 0.995) > round(qchisq(p, 10), d = 3) > p<-c(0.025, 0.25, 0.50, 0.75, 0.995) [1] 3.247 6.737 9.342 12.549 25.188 > round(qt(p, 10), d = 3) [1] -2.228 -0.700 0.000 0.700 3.169 c) Sei F eine F-verteilte Zufallsvariable mit 9 und 6 Freiheitsgraden. Geben Sie die Quantile x0,01, x0,05, x0,50, x0,95, x0,99 mit 2 Kommastellen an. > p<-c(0.01, 0.05, 0.50, 0.95, 0.99) > round(qchisq(p, 9, 6), d = 2) [1] 0.17 0.30 1.04 4.10 7.98 Prof. Mohr / Dr. Ricabal Mehrdimensionale Zufallsvariablen 40