Beispiele zur UE Statistik 1 bei Nagel 1 Ereignisse und Wahrscheinlichkeiten 1. Ein Würfel wird zweimal geworfen, der Stichprobenraum Ω ist Ihnen nicht neu. Versuchen Sie, den Stichprobenraum in einem 6x6 - Punkteraster darzustellen. Was sind die folgenden Ereignisse? (a) A: Die Augenzahl der beiden Würfel ist ident. (b) B: Die Augenzahl der beiden Würfel unterscheidet sich um 1. (c) C: Die Augenzahl der beiden Würfel unterscheidet sich um 2. (d) Was sind die Wahrscheinlichkeiten dafür? 2. In einer Urne sind 6 Kugeln, die mit den Zahlen 1 bis 6 beschriftet sind. Zwei Kugeln werden ohne Zurücklegen gezogen. Versuchen Sie, den Stichprobenraum Ω in einem 6x6 - Punkteraster darzustellen. Was sind die folgenden Ereignisse? (a) A: Die Augenzahl der beiden Würfel ist ident. (b) B: Die Augenzahl der beiden Würfel unterscheidet sich um 1. (c) C: Die Augenzahl der beiden Würfel unterscheidet sich um 2. (d) Was sind die Wahrscheinlichkeiten dafür? (e) Was hätte sich geändert, wenn die Ziehung mit Zurücklegen der Kugeln durchgeführt worden wäre. 3. 12% aller Männer verfolgen regelmäßig die Formel 1 im Fernsehen, bei der Fußball-Champions-League sind es 30%. 6% verfolgen beide Sportereignisse. (a) Wieviel Prozent der Männer verfolgen zumindest eine der beiden Sportveranstaltungen? (b) Wieviel Prozent der Männer verfolgen keine der beiden Sportveranstaltungen? 4. In einer Ortschaft wurden alle arbeitenden und arbeitsuchenden Personen erhoben und eine Aufteilung bezüglich Geschlecht ergab folgende Tabelle: Beschäftigt Arbeitslos Weiblich 553 45 Männlich 857 36 Die Ereignisse A, B, W, M seien für zufällig ausgewählte Personen wie folgt definiert: A B W M ... ... ... ... die die die die Person Person Person Person ist ist ist ist arbeitslos beschäftigt weiblich männlich (a) Berechnen Sie die Wahrscheinlichkeiten für das Eintreten der jeweiligen Ereignisse. (b) Berechnen Sie p(A|W ) und p(W |A) . Sind A und W unabhängig? (c) Geben Sie die Frauenarbeitslosigkeit als bedingte Wahrscheinlichkeit an. (d) In Ö1 wurde in einem Journal-Panorama über die Region Braunau der folgende Satz geäußert: Die Arbeitslosenrate liegt bei 8% und ist bei Frauen und Männern in etwa gleich, nämlich ca. 4%. Was ist an dieser Aussage vom statistischen Standpunkt aus ein Schwachsinn? 1 5. In einem Unternehmen wird ein Produkt an drei unterschiedlich alten Maschinen gefertigt; die alte Maschine I wird nur mehr bei Produktionsengpässen eingesetzt, die zweitälteste Maschine (II) wird noch regelmäßig eingesetzt, die neueste Maschine (III) ist aber schneller und verlässlicher. Dies kommt in der folgenden Übersicht zum Vorschein. Maschine Produktionsanteil (in %) Ausschussrate (in %) I 10 5 II 40 2 III 50 1 (a) Man bestimme die Ausschussrate der Produktion. (b) Mit welcher Wahrscheinlichkeit wurde ein defektes Stück an der alten Maschine produziert? 6. In einer Bevölkerung beträgt die Wahrscheinlichkeit, älter als 70 Jahre zu werden, 0.9 und die Wahrscheinlichkeit, älter als 80 zu werden, 0.4. Wie groß ist die Wahrscheinlichkeit, dass eine Person, die soeben 70 Jahre alt wurde, ihren 80. Geburtstag noch erlebt? 7. Eine Zeitschrift hat in Altersgruppen unterschiedliche Leseranteile, die in folgender Tabelle enthalten sind. Altersgruppe Bevölkerungsanteil (in %) Leseranteil (in %) 15 - 29 25 8 30 - 49 35 7 50 + 40 4 (a) Wie hoch ist der Leseranteil in der Gesamtbevölkerung? (b) Mit welcher Wahrscheinlichkeit stammt ein Leser der Zeitschrift aus der jüngsten Altersgruppe? 8. In einer Stadt werden Diebstähle von Fahrzeugen untersucht. In Abhängigkeit vom Fahrzeugtyp sind Daten zu Diebstahl und Aufklärungsrate in folgender Tabelle enthalten. Fahrzeug Auto (incl. LKW) Motorrad, Mofa Fahrrad Anteil an Diebstählen (in %) 25 10 65 Aufklärungsrate (in %) 18 27 9 (a) Wie hoch ist die Aufklärungsrate insgesamt bei Fahrzeugdiebstählen? (b) Eine Polizeistreife ertappt einen Dieb direkt beim Diebstahl eines Fahrzeugs. Mit welcher Wahrscheinlichkeit wollte der Dieb ein Auto stehlen? 9. In einem Zeitungsartikel lautete ein Zwischentitel: Jede vierte Frau ist Führungskraft. Welche zwei bedingten Wahrscheinlichkeiten wurden dabei wohl verwechselt? 10. Ein Würfel wird zweimal geworfen, die geworfenen Augenzahlen sind von Interesse. Der Stichprobenraum Ω kann in einem 6x6 - Punkteraster dargestellt werden. Was sind die folgenden Ereignisse? (a) A: Mindestens ein Würfel zeigt die Augenzahl 3. (b) B: Die Summe der beiden Augenzahlen ist 6. 6 5 4 3 2 1 p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p 1 2 3 4 5 6 p p p p p p 6 5 4 3 2 1 p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p 1 2 3 4 5 6 2 11. Mit den Angaben für A und B aus dem vorigen Beispiel berechnen Sie: (a) p(A) (b) p(B) (c) p(A ∩ B) (d) Sind A und B unabhängig (kurze Begründung)? 12. In einem Wellness-Hotel erfolgen 70% der Buchungen von Frauen. Während bei der Buchung von Frauen schon in 80% der Fälle auch Wellness-Anwendungen vorbestellt werden, ist diese Vorbestellung bei Buchung durch Männer nur in 20% der Fälle üblich. (a) In wieviel Prozent der Fälle werden Wellness-Angebote schon bei der Buchung vorbestellt? (b) Eine Buchung mit Vorbestellung von Wellness-Angeboten ist gerade erfolgt. Mit welcher Wahrscheinlichkeit ist die Buchung von einer Frau erfolgt? 13. Von zwei Ereignissen A und B wissen wir: p(A) = 0.5 p(A ∪ B) = 0.7. (a) Wenn A und B disjunkt sind: p(B) = ? (b) Wenn A und B unabhängig sind: p(B) = ? (c) Berechnen Sie für beide Fälle: p(A|B) 14. Ein neues Rauchentwöhnungsprogramm wird getestet. Bei leichten Rauchern ist die Erfolgsrate 24%, bei schweren Rauchern 16%. 70% der Raucher sind leichte Raucher. (a) Wie hoch ist die Erfolgsrate dieses neuen Rauchentwöhnungsprogramms? (b) Jemand hat das Programm erfolgreich absolviert. Mit welcher Wahrscheinlichkeit war er schwerer Raucher? 15. Was wird in R nach dem letzten Befehl der jeweiligen Befehlssequenz angezeigt? (a) a <- c(2, 4, -6) b <- a**2 b (b) a <- -10:10 sum(a) (c) a <- 0:5 aa <- a*a aa[5] 3 2 Diskrete Zufallsvariablen und ihre Momente 1. Gegeben Sei eine diskrete Verteilung auf den Punkten 1,2,3 und 4. Die Wahrscheinlichkeiten der einzelnen Punkte sind p1 = 0.1, p2 = 0.5, p3 = 0.15 und p4 =?. (a) Berechnen und skizzieren Sie die (kumulative) Verteilungsfunktion! (b) Berechnen Sie Erwartungswert und Varianz! 2. Zwei Zufallsvariablen X1 und X2 folgen derselben Wahrscheinlichkeitsverteilung: 1 2 3 x F (x) 0.3 0.8 1 Es seien X1 und X2 unabhängig und X = X1 + X2 . (a) Berechnen und skizzieren Sie die (kumulative) Verteilungsfunktion von X! (b) Berechnen Sie Erwartungswert und Varianz von X! 3. Ein Würfel wird zweimal geworfen, die Augenzahlen der beiden Würfe sind X1 und X2 . Man bildet M = max(X1 , X2 ). (a) Welche Werte kann M annehmen? Berechnen Sie die Wahrscheinlichkeiten dafür, dass diese Werte angenommen werden und bestimmen Sie die Verteilungsfunktion von M ! (b) Berechnen Sie den Erwartungswert von M ! 4. In England und Amerika wurde auf Jahrmärkten das folgende Glücksspiel (Chuck a luck) gerne gespielt: Ein Spieler wählt eine Zahl zwischen 1 und 6 und wirft dann drei Würfel. Zeigen alle drei Würfel die angesagte Zahl, erhält er drei Pfund (bzw. Dollar); zeigen zwei Würfel diese Zahl, erhält er zwei Pfund (Dollar); zeigt ein Würfel diese Zahl, erhält er ein Pfund (Dollar). Nur wenn kein Würfel diese Zahl anzeigt, muss der Spieler ein Pfund zahlen. (a) Der Gewinn des Spielers ist eine Zufallsvariable G. Welche Werte kann G annehmen? Berechnen Sie die Wahrscheinlichkeiten dafür, dass diese Werte angenommen werden und bestimmen Sie die Verteilungsfunktion von G! (b) Berechnen Sie den erwarteten Gewinn des Spielers! 5. Eine Münze wird dreimal geworfen. X ist die Zufallsvariable dafür, wie oft Kopf gefallen ist. Beschreiben Sie X durch die Verteilungsfunktion und passende Kennzahlen! 6. In einem neu eröffneten Einkaufszentrum wird als Attraktion folgendes Glücksspiel veranstaltet: Zu jeder vollen Stunde (täglich von 11 bis 18 Uhr, also 8-mal) wird am zentralen Platz des Einkaufszentrums eine Person zufällig ausgewählt, die ein Glücksrad (mit den Zahlen 1 bis 10) drehen kann. Jede Zahl gewinnt einen Sachpreis, die 10 gewinnt zusätzlich 500 Euro. (a) Sei X die Anzahl Spieler, die an einem Tag den Geldpreis gewinnen. Berechnen Sie Erwartungswert und Varianz von X! (b) Wie groß ist die Wahrscheinlichkeit, dass an einem Tag mindestens 2 Spieler einen Geldpreis gewinnen? (c) Sei Y die Summe Geldes, die an einem Tag von den Teilnehmern an diesem Spiel gewonnen wird. Berechnen Sie Erwartungswert und Varianz von Y ! 7. Eine Würfel wird solange geworfen, bis eine Augenzahl kleiner 3 erscheint. Es sei X die Anzahl der Fehlversuche, die bis zum Wurf einer Augenzahl kleiner 3 notwendig waren. (a) Welche Werte kann X annehmen? Berechnen Sie die Wahrscheinlichkeit dafür, dass mindestens 2 Fehlversuche auftreten! (b) Berechnen Sie E(X)! 4 8. Eine Münze wird solange geworfen, bis die Seite Kopf erscheint. Es sei X die Anzahl der Versuche, die notwendig sind, bis Kopf erscheint. (a) Welche Werte kann X annehmen? Berechnen Sie die Wahrscheinlichkeiten dafür, dass diese Werte angenommen werden! (b) Berechnen Sie E(X)! 9. Für eine binomialverteilte Zufallsvariable X gilt: E(X) = 5 V ar(X) = 4. Welche Werte haben die Parameter n und p der Binomialverteilung? 10. Für eine Zufallsvariable X gelte: E(X) = 10 V ar(X) = 9. (a) Für welchen Wert von a in Y1 = X − a gilt: E(Y1 ) = 0? (b) Für welchen Wert von b in Y2 = X/b gilt: V ar(Y2 ) = 1? (c) Für welche Werte von a und b in Y = E(Y ) = 0 und V ar(Y ) = 1? X−a b gilt: 11. In einer Bevölkerungsgruppe sind 15% der Frauen Raucherinnen; aus dieser Bevölkerungsgruppe wird eine Zufallsstichprobe von 240 Frauen gezogen. X bezeichne die Anzahl von Raucherinnen in der Stichprobe. (a) Wie ist X verteilt (Name der Verteilung, Werte für die Parameter)? (b) Erwartungswert und Varianz von X. (c) Pro Raucherin wird eine Zusatzinterview im Zeitausmaß von 20 Minuten geführt. Das gesamte Zeitausmaß (in Minuten) für Zusatzinterviews ist eine Zufallsvariable T . Berechnen Sie E(T ) und V ar(T ). 12. Ein Würfel wird solange geworfen, bis eine Augenzahl >4 aufscheint. X bezeichne die Anzahl von Versuchen bis (einschließlich) zu einer Augenzahl >4. (a) Wie groß ist die Wahrscheinlichkeit, dass genau 7 Versuche notwendig sind? (b) Wie groß ist die Wahrscheinlichkeit, dass mindestens 2 Versuche notwendig sind? (c) Erwartungswert von X? 13. Eine Zufallsvariable X nimmt drei Werte mit folgenden Wahrscheinlichkeiten an: x 0 1 4 p(X = x) 0.2 0.6 0.2 (a) Bestimmen Sie Erwartungswert und Varianz von X! (b) Welcher der drei Plots in der Abbildung 1 entspricht der Verteilungsfunktion von X? 14. In Österreich sind 7% der Bevölkerung in der Altersgruppe zwischen 30 und 65 Jahren tatsächlich arm (d.h. nicht nur gefährdet). X ist die Anzahl der Armen in einer Stichprobe von 22 Personen aus dieser Altersgruppe. (a) Wie ist X verteilt (Name der Verteilung, Werte für die Parameter)? (b) Erwartungswert und Varianz von X. (c) Wie hoch ist die Wahrscheinlichkeit, dass in der Stichprobe mindestens 2 Arme sind? 15. Was bewirken jeweils die folgenden R - Befehlssequenzen? 5 ● 0.8 0.8 ● 0.6 ● 0.6 0.6 0.8 ● 1.0 Plot 3 1.0 Plot 2 1.0 Plot 1 ● ● 0.4 0.2 0.4 0.2 0.2 0.4 ● ● −1 0 1 2 3 4 5 0.0 0.0 0.0 ● −1 0 1 2 3 4 5 Abbildung 1: Verteilungsfunktionen (a) x <- 0:3 fx <- c( 1, 3, 3, 1)/8 Fx <- cumsum(fx) cbind( x, fx, Fx) EX <- sum(x*fx) EX (b) x <- seq(10, 40, 10) fx <- c( 0.4, 0.3, 0.2, 0.1) Fx <- cumsum(fx) cbind( x, fx, Fx) EX <- sum(x*fx) VarX <- sum(x**2*fx) - EX**2 (c) # 10 x wuerfeln n <- 10 p <- 1/6 k <- 0:n # anzahl 6er pk <- choose(n, k) * (p**k) * ((1-p)**(n-k)) (d) # 30 x muenzwurf n <- 30 p <- 1/2 k <- 0:n # anzahl kopf pk <- dbinom( k, n, p) barplot(pk) 6 −1 0 1 2 3 4 5 8 4 6 8 2 4 6 8 ● 0 2 4 6 8 ● 0.6 0.0 0.2 0.4 0.6 0.8 ● 0.4 ● 0 0.4 0.3 0.1 0.0 2 0.2 0.0 0.2 0.4 0.6 0.8 ● ● 0 1.0 6 0.8 4 1.0 2 ● 0.2 0.3 0.2 0.1 0.0 ● 0 0.0 ● 1.0 0.0 0.1 0.2 0.3 ● 0.4 Asymptotik und stetige Zufallsvariablen 0.4 3 ● 0 2 4 6 8 ● 0 2 4 6 8 Abbildung 2: Dichten und Verteilungen 1. X sei gleichverteilt auf dem Intervall [0, 7]. Berechnen Sie: (a) p(X < −1) (b) p(X > 6) (c) p(X ≥ 5) (d) p(X ≤ 3) 2. Eine Münze wird 100-mal geworfen. X ist die Zufallsvariable dafür, wie oft Kopf gefallen ist. (a) Welcher Verteilung folgt X? Berechnen Sie E(X) und V ar(X). (b) Was kann nach der Tschebyscheff – Ungleichung für den folgenden Ausdruck abgeleitet werden? p(|X − 50| > 10) (c) Welcher Wert gilt exakt für den obigen Ausdruck? (d) Was kann nach der Tschebyscheff – Ungleichung zu folgender Frage gesagt werden? Mit welcher Wahrscheinlichkeit werden mindestens 35 aber höchstens 65 Köpfe geworfen? 3. In Abbildung 2 sind oben Dichtefunktionen und unten Verteilungsfunktionen abgebildet, nicht notwendig direkt untereinander. Ordnen Sie Dichte- und Verteilungsfunktionen richtig zu. 4. In Abbildung 3 sind die Dichtefunktionen von Normalverteilungen abgebildet. Ihre Varianzen sind entweder 1 oder 4. Geben Sie jeweils die Parameter µ und σ für die drei Plots an! 5. In Abbildung 4 sind die Dichtefunktionen von Exponentialverteilungen abgebildet. Ihre Parameter sind 1, 1/2 und 1/3. Geben Sie jeweils die Parameter für die drei Plots an! 7 −4 −2 0 2 0.3 0.0 0.1 0.2 0.3 0.2 0.1 0.0 0.0 0.1 0.2 0.3 0.4 Dichte 3 0.4 Dichte 2 0.4 Dichte 1 4 −4 −2 0 2 4 −4 −2 0 2 4 Abbildung 3: Normalverteilungen 0 1 2 3 4 5 2.5 0.0 0.5 1.0 1.5 2.0 2.5 2.0 1.5 1.0 0.5 0.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Dichte 3 3.0 Dichte 2 3.0 Dichte 1 0 1 2 3 4 5 0 Abbildung 4: Exponentialverteilungen 8 1 2 3 4 5 6. Die Dichtefunktion f 0 ax f (x) = 0 einer Zufallsvariablen X ist durch : x<0 : 0≤x≤4 : x>4 gegeben. (a) Bestimmen Sie a so, dass f tatsächlich eine Dichtefunktion ist! (b) p(X ≥ 3) (c) p(X > 6) (d) p(1 ≤ X < 3) (e) Berechnen Sie den E(X)! 0 5 10 15 0.20 0.00 0.05 0.10 0.15 0.20 0.15 0.10 0.05 0.00 0.00 0.05 0.10 0.15 0.20 0.25 Plot 3 0.25 Plot 2 0.25 Plot 1 0 5 10 15 0 5 10 15 Abbildung 5: Chi-Quadrat-Verteilungen 7. Abbildung 5 zeigt die Dichtefunktionen für χ2 -Verteilungen mit 3, 5 und 7 Freiheitsgraden. (a) Welcher Plot gehört zu welcher χ2 -Verteilung? (b) Wie groß sind die jeweiligen Erwartungswerte und Varianzen? (c) Bei wieviel Freiheitsgraden ist die Varianz kleiner als der Erwartungswert? 8. Von einer Chi-Quadrat-verteilten Zufallsvariablen X ist bekannt, dass E(X 2 ) = 80. Bestimmen Sie die Freiheitsgrade von X! 9. Abbildung 6 zeigt die Dichtefunktionen für t-Verteilungen mit 3, 5 und 10 Freiheitsgraden. (a) Welcher Plot gehört zu welcher t-Verteilung? (b) Wie groß sind die jeweiligen Erwartungswerte und Varianzen? (c) Bei wieviel Freiheitsgraden ist die Varianz <1? 10. Der Intelligenzquotient IQ in der Bevölkerung ist normalverteilt mit µ = 100 und σ = 10, also IQ ∼ N (100, 100). (a) Mit welcher Wahrscheinlichkeit liegt der IQ einer zufällig ausgewählten Person über 110? (b) Wie ist IQs = (IQ − 100)/10 verteilt? (c) Wie ist die Summe von zwei zufällig ausgewählten Personen verteilt? (d) Wie ist der mittlere IQ von 4 zufällig ausgewählten Personen verteilt? Mit welcher Wahrscheinlichkeit liegt dieser mittlere IQ über 110? 9 −3 −2 −1 0 1 2 3 0.3 0.0 0.1 0.2 0.3 0.2 0.1 0.0 0.0 0.1 0.2 0.3 0.4 Plot 3 0.4 Plot 2 0.4 Plot 1 −3 −2 −1 0 1 2 3 −3 −2 −1 0 1 2 3 Abbildung 6: t-Verteilungen (e) Wie ist der mittlere IQ von 25 zufällig ausgewählten Personen verteilt? Mit welcher Wahrscheinlichkeit liegt dieser mittlere IQ über 110? 11. (4 Punkte) Die Verteilungsfunktion einer stetigen Zuvallsvariablen X ist gegeben: 0 für x < 1 a(x − 1) für 1 ≤ x ≤ 4 F (x) = 1 für x > 4 (a) Bestimmen Sie a (also so, dass F tatsächlich eine Verteilungsfunktion ist)! (b) Welchem Plot in der Grafik 7entspricht die gegebene Verteilungsfunktion? (c) p(X ≤ 3) = ? (d) Wie lautet die Dichtefunktion f von X? 1 2 3 4 5 6 5 6 0.6 0.2 ● ● 0 1 0.0 0 ● 0.4 0.6 0.2 ● 0.0 ● ● 0.8 ● 0.4 0.6 0.4 0.2 0.0 ● 0.8 ● 0.8 ● Plot 3 1.0 Plot 2 1.0 1.0 Plot 1 2 3 4 5 6 ● 0 ● 1 2 3 4 Abbildung 7: Verteilungsfunktionen 12. Die Zufallsvariable X folgt einer t-Verteilung, ihre Varianz ist mit V ar(X) = 1.4 gegeben. Die Zufallsvariable Y steht mit X in Verbindung: Y = 2 − 3 · X (a) Wieviel Freiheitsgrade hat X? 10 (b) Berechnen Sie Erwartungswert und Varianz von Y ? 13. Die Verteilungsfunktion einer stetigen Zuvallsvariablen X ist gegeben: 0 für x < 2 a(x − 2)2 für 2 ≤ x ≤ 5 F (x) = 1 für x > 5 (a) Bestimmen Sie a (also so, dass F tatsächlich eine Verteilungsfunktion ist)! (b) p(X ≤ 3) = ? (c) Wie lautet die Dichtefunktion f von X? (d) Berechnen Sie E(X). 14. Was bewirken jeweils die folgenden R - Befehlssequenzen? (a) Standardnormalverteilung N(0,1) x <- seq(0, 3, 0.1) Fx <- pnorm(x) cbind( x, Fx) (b) Normalverteilung N(mu, sigma**2) mu <- 10 sigma <- 3 x <- seq(0, 3, 0.1) Fx <- pnorm(x, mean=mu, sd=sigma) cbind( x, Fx) (c) Normalverteilung N(mu, sigma**2) mu <- 100 sigma <- 10 x <- seq(0, 1, 0.1) Qx <- qnorm(x, mean=mu, sd=sigma) cbind( x, Qx) (d) Exponentialverteilungen x <Ex1 <Ex2 <cbind( seq(0, 3, 0.2) pexp(x, rate=2) pexp(x, rate=1/2) x, Ex1, Ex2) (e) IQ - Beispiel iq <- 110 piq110 <- 1 - pnorm(iq, mean = 100, sd = 10) 11 4 Schätzen 1. Gegeben ist die gemeinsame Wahrscheinlichkeitsfunktion (Dichtefunktion) von zwei diskreten Zufallsvariablen X und Y : Y X 1 2 3 1 2 3 1/24 2/24 1/24 2/24 4/24 2/24 3/24 6/24 3/24 (a) Bestimmen Sie die gemeinsame Verteilungsfunktion! (b) Bestimmen Sie die eindimensionalen Randverteilungen, also auch die Wahrscheinlichkeitsfunktionen von X und Y ! (c) Sind X und Y unabhängig? (d) Bestimmen Sie die Kovarianz von X und Y ! 2. Gegeben ist die gemeinsame Wahrscheinlichkeitsfunktion (Dichtefunktion) von zwei diskreten Zufallsvariablen X und Y : 1 2 3 0.2 0.1 0 0 0.1 0.2 0.1 0.1 0.2 Y X 1 2 3 (a) Bestimmen Sie die gemeinsame Verteilungsfunktion! (b) Bestimmen Sie die eindimensionalen Randverteilungen, also auch die Wahrscheinlichkeitsfunktionen von X und Y ! (c) Sind X und Y unabhängig? 3. Von zwei Zufallsvariablen X und Y sind die Varianzen mit V ar(X) = 4 und V ar(Y ) = 6 gegeben. Weiters ist V ar(X + Y ) = 14 bekannt. Wie groß ist die Kovarianz σXY ? 4. Für die Renditen X1 und X2 von zwei Wertpapieren gelte: V ar(X1 ) = 4 V ar(X2 ) = 6 σX1 X2 = −2 (a) Die einseitigen Veranlagungen (zu 100% auf eines der beiden Wertpapiere) P = 1X1 + 0X2 bzw. P = 0X1 + 1X2 führen zu Portfolios, deren Varianz V ar(P ) leicht zu bestimmen sind. (b) Wie groß ist die Varianz von: P = 0.3X1 + 0.7X2 ? (c) Spezialaufgabe: Wie wäre die Aufteilung zwischen X1 und X2 in einem Portfolio mit minimaler Varianz? Also α so, dass P = αX1 + (1 − α)X2 mit V ar(P ) → min. 5. Von einer Zufallsvariablen X wissen wir: X ∼ Exp(τ ) E(X) = 2 (a) Welchen Wert nimmt τ an? (b) Wie groß ist V ar(X)? 12 (c) Die Verteilungsfunktion einer exponentialverteilten Zufallsvariablen kann mit F (x) = 1 − e−x/τ angegeben werden. Wie groß ist der Median von X? 6. In Abbildung 8 sind Verteilungsfunktionen abgebildet. Bestimmen Sie jeweils grafisch den Median! 0.8 0.8 ● 0.6 ● 0.6 0.6 0.8 ● Verteilung 3 1.0 Verteilung 2 1.0 1.0 Verteilung 1 ● −1 0 1 2 3 4 5 0.0 0.0 0.0 ● 0.2 0.4 0.4 0.2 0.2 0.4 ● −1 0 1 2 3 4 5 Abbildung 8: Verteilungsfunktionen 13 70 80 90 100 110 120 130 5 Testen 1. Die Morde in New Jersey im Jahr 2003 nach Wochentagen aufgegeliedert, gibt die folgende Tabelle wieder: So Mo Di Mi Do Fr Sa 53 42 51 45 36 37 65 Man führe einen Test durch, ob für Morde jeder Wochentag gleich wahrscheinlich ist. 2. An einem Department werden Prüfungsmodalitäten geändert. Die Vertretung der Studierenden erhebt bei einigen Prüfungen die erreichten Noten und kommt zu folgender Verteilung: Noten frühere Anteile (in %) Stichprobe (absolut) 1 15 4 2-4 60 31 5 25 5 Hat sich durch die neuen Prüfungsmodalitäten eine Veränderung in der Notenverteilung ergeben? 3. In regelmäßigen Abständen tauchen Ergebnisse von Meinungsumfragen zur sog. Sonntagsfrage auf. Im hypothetischen Land Demokrastan hat eine Meinungsumfrage (n = 500) vier Wochen vor der Wahl folgendes Ergebnis gebracht: Partei AP BP CP DP absolut 220 140 95 45 letzte Wahl (%) 40 30 20 10 (a) Kann man auf eine Veränderung in der Parteipräferenz schließen? (b) Wird man auf eine Veränderung bei der Partei CP schließen? 4. Eine Sportwissenschaftlerin untersucht die Laufwege von Fußballspielern. Bei sechs Außenverteidigern beobachtete sie in sechs Spielen der nationalen Meisterschft folgende Laufstrecken (in km): 13 12 14 10 11 12 (a) Bestimmen Sie Mittelwert und Standardabweichung in der Stichprobe! (b) Kann man aufgrund der Stichprobe schließen, dass die durchschnittliche Laufleistung von Außenverteidigern über 11km liegt? 5. Was kann man aus dem folgenden R-Output ablesen? One Sample t-test data: laufl t = 1.7321, df = 5, p-value = 0.07191 alternative hypothesis: true mean is greater than 11 95 percent confidence interval: 10.83661 Inf sample estimates: mean of x 12 6. Die Log-Returns einer Aktie sind über einen längeren Zeitraum betrachtet durchschnittlich x̄ = 0.022, die Standardabweichung ist s = 0.019 (n = 77). (a) Kann man aufgrund der Stichprobe schließen, dass die Log-Returns positiv sind? (b) Kann man aufgrund der Stichprobe schließen, dass im Durchschnitt die Log-Returns über 2% sind? 14 7. Für eine Schuldnerberatung galt bis zum Jahr 2008 für die Hauptursache bei Verschuldung die Verteilung wie sie in unten stehender Tabelle angegeben ist. In einer Stichprobe bei 400 zufällig ausgewählten Fällen wurde ebenfalls der Hauptgrund für die Verschuldung erhoben. Verschuldungsurasache Anteil (in %) bis 2008 Sichprobe 2014 Hohe Kreditaufnahme 40 200 Arbeitslosigkeit 40 120 Sonstiges 20 80 Führen Sie einen geeigneten χ2 -Test durch! Geben Sie den Wert der Teststatistik, den Verwerfungsbereich und die Entscheidung aufgrund des Tests an! 8. Die Attentate von Paris führen zu Rufen nach Vergeltung. In einer Befragung waren 170 Befragte für Militärschläge gegen den IS in Syrien, 80 Befragte waren dagegen. Ist das mit der Behauptung vereinbar, dass 80 Prozent der Bevölkerung für Militärschläge sind? (a) Wie hoch ist der Wert der Teststatistik? (b) Wie lautet die Entscheidung nach dem Test? (c) Interpretieren Sie in einem Satz das Ergebnis (ohne technische Fachausdrücke)! 9. Anträge für einen Kuraufenthalten verursachen einigen Verwaltungsaufwand. Mit einer Neuorganisation der Antragsbearbeitung soll die Bearbeitungszeit für solche Anträge vermindert werden. Nach einem Monat wurde für einige Anträge die Bearbeitungszeit (in Minuten) erhoben und mit einem t-Test mit der durchschnittlichen Bearbeitungszeit nach dem alten Ablauf verglichen: One Sample t-test data: bearbeitung t = -1.840, df = 75, p-value = 0.0349 alternative hypothesis: true mean is less than 540 (a) (b) (c) (d) (e) (f) Was waren Null- und Alternativhypothese bei diesem Test? Was ist der Vergleichswert nach dem alten Verwaltungsablauf? Wieviele Anträge wurden untersucht? Was ist der Wert der Teststatistik? Wie lautet die Entscheidung nach dem Test (5% Signifikanzniveau)? Interpretieren Sie kurz das Ergebnis (ohne technische Fachausdrücke)! 10. Was bewirken jeweils die folgenden R - Befehlssequenzen? (a) Morde in New Jersey morde <- c(53, 42, 51, 45, 36, 37, 65) chisq.test(morde) (b) Sonntagsfrage umfrage <- c(240, 120, 95, 45) zuletzt <- c(0.4, 0.3, 0.2, 0.1) chisq.test(umfrage, p = zuletzt) (c) Laufleistungen laufl <- c(13, 12, 14, 10, 11, 12) lauflmw <- mean(laufl) lauflsd <- sd(laufl) testst <- sqrt(6)*(lauflmw - 11) / lauflsd pwert <- 1 - pt(testst, df=5) 15 (d) Laufleistungen Kurzversion laufl <- c(13, 12, 14, 10, 11, 12) t.test(laufl, mu=11, alternative="greater") 16 6 Regression In den folgenden Beispielen wird angenommen, dass die Fehler U1 , . . . , Un i.i.d. mit Erwartungswert 0 und Varianz σ 2 > 0 sind. Weiters nehmen wir an, dass Xt nicht zufällig sind, dass Xt 6= 0 für ein t = 1, . . . , n und dass Xt 6= Xs für mindestens ein Paar t 6= s gilt. 1. Betrachten Sie das lineare Regressionsmodell Yt = a + Ut , t = 1, . . . , n. (a) Bestimmen Sie den Kleinst-Quadrate Schätzer für a. (b) Ist der Kleinst-Quadrate Schätzer unverzerrt? 2. Betrachten Sie das homogene lineare Regressionsmodell Yt = bXt + Ut , t = 1, . . . , n. (a) Bestimmen Sie den Kleinst-Quadrate Schätzer für b. (b) Ist der Kleinst-Quadrate Schätzer unverzerrt? 3. Von einem einfachen Regressionsmodell kennen wir: 2 ? -1 erklärende Var x abhängige Var y Residuen e -3 ? v 0 ? 1 w ? 1 Man bestimme v und w! 4. In einem Regressionsmodell Yt = a + b · t + c · t3 + ut für t = 1, 2, . . . , 16 seien Ui iid mit Ui ∼ N (0, 9). Unter H0 : b = c = 0 ist die Teststatistik des F-Tests ∼ F (r, s). Man bestimme r und s! 5. Betrachten Sie das lineare Regressionsmodell Yt = a + bXt + Ut Gegeben seien die folgenden Daten: x: y: 1 2 2 1 3 4 4 3 5 6 t = 1, . . . , 6. 6 5 (a) Erstellen Sie ein Streudiagramm (x-y-Diagramm)! (b) Berechnen Sie die Kleinst-Quadrate-Schätzer â und b̂! (c) Veranschaulichen Sie die Einpassung der Regressionsgeraden im Streudiagramm! (d) Ermitteln und interpretieren Sie die Stichprobenkorrelation rx,y . 6. Wir nehmen das Beispiel von vorhin und verändern Xt und Yt leicht. (a) Welchen Effekt für â und b̂ hätte eine Addition von 10 bei Yt ? (b) Welchen Effekt hätte diese Addition für rx,y ? (c) Welchen Effekt für â und b̂ hätte eine Multiplikation mit 5 bei Yt ? (d) Welchen Effekt hätte diese Multiplikation für rx,y ? (e) Welchen Effekt für â und b̂ hätte eine Addition von 2 bei Xt . (f) Welchen Effekt hätte diese Addition für rx,y ? (g) Welchen Effekt für â und b̂ hätte eine Multiplikation mit 4 bei Xt ? (h) Welchen Effekt hätte diese Multiplikation für rx,y ? 17 7. Was bewirken jeweils die folgenden R - Befehlssequenzen? (a) Ausgangsbeispiel x y <- 1:6 <- c(2, 1, 4, 3, 6, 5) yx <- lm(y~x) summary(yx) plot(x,y) abline(yx) (b) Transformationen y + 10 y10 <- y + 10 y10x <- lm(y10~x) summary(y10x) (c) Transformationen y * 5 y5 <- y * 5 y5x <- lm(y5~x) summary(y5x) (d) Transformationen x + 2 x2 <- x + 2 yx2 <- lm(y~x2) summary(yx2) (e) Transformationen x * 4 x4 <- x * 4 yx4 <- lm(y~x4) summary(yx4) 18