Statistik II für Studierende der Soziologie und Nebenfachstudierende Prof. Dr. Thomas Augustin, Gero Walter Übungsblatt 6 SoSe 2010 Aufgabe 19 Betrachte folgende Rechenregeln‘ für den Erwartungswert und die Varianz mit ’ den Zufallsvariablen X und Y . Gib jeweils an, ob die Regeln richtig sind, bzw. unter welchen Bedingungen sie korrekt sind! ? a) E(X + a) = E(X) ? b) E(Y + X) = E(X) + E(Y ) ? c) E(X − Y ) = 0 ? d) Var(X + Y ) = Var(X) + Var(Y ) ? e) Var(X − Y ) = Var(X) − Var(Y ) ? f) E(X 2 ) = Var(X) ? g) Var(aX) = aVar(X) Aufgabe 20 Eine Zufallsvariable X nimmt die Werte 1 und −1 jeweils mit Wahrscheinlichkeit 0.5 an. Nun wird die Zufallsvariable Y definiert mit Y := 3 + 2 · X. a) Wie sieht die Verteilung von Y aus? b) Bestimme Erwartungswert und Varianz von X und Y . Aufgabe 21 In einer Gemeinde wird eine Untersuchung über Rechtsextremismus durchgeführt, bei der auch das Wahlverhalten erhoben werden soll. Es sollen dazu 50 wahlberechtigte Bürger über eine reine Zufallsauswahl ausgewählt werden. Wie groß ist die Wahrscheinlichkeit, dass mehr als drei der befragten 50 Bürger angeben, bei der letzten Bundestagswahl eine rechtsextreme Partei gewählt zu haben, wenn im zugehörigen Wahlkreis der Zweitstimmenanteil für rechtsextreme Parteien bei 0.9% lag? Vergleichen Sie Ihr Ergebnis mit dem Ergbenis aus einer geeigneten Approximation. 1 Aufgabe 22 a) Interpretiere folgende Formeln zur Analyse von Lebensdauern: P (t ≤ T ≤ t + h | T ≥ t) P (t ≤ T ≤ t + h | T ≥ t) λ(t) := lim h→0 h b) Eine Zufallsvariable T mit Parameter λ > 0 und Dichte f (t) = λ exp(−λt) heißt exponentialverteilt für t ≥ 0, Kurzform T ∼ Exp(λ). • Zeige, dass es sich bei f (t) um eine Dichte handelt. • Berechne und interpretiere die Hazardrate. c) Eine Zufallsvariable T heißt weibullverteilt mit Parametern λ > 0, α > 0, falls ihre Dichte für t ≥ 0 folgende Gestalt hat: f (t) = λα(λt)α−1 exp(−(λt)α ) Die Survivorfunktion von T lautet S(t) = exp(−(λt)α ) , t ≥ 0. • Bestimme daraus die Hazardrate von T . Welcher Spezialfall ergibt sich für α = 1? • Betrachte die Hazardraten für α < 1, α = 1 und α > 1 (siehe Graphik auf der nächsten Seite). Zur Modellierung welcher Situationen sind die verschiedenen Verläufe der Hazardrate λ(t) geeignet? Erfinde je ein Beispiel. d) Angenommen, wir haben Daten über die Dauer von Arbeitslosigkeit bis zum Berufs-Wiedereinstieg. • Was bedeueten die in a) aufgeführten Größen in diesem Beispiel? • Lässt sich dieses Beispiel auch mit einem Markovmodell modellieren? Was wären hier die relevanten Größen? 2 Hazardraten einer Weibullverteilung (λ = 0.5) 1.6 1.4 α=3 α = 1/3 1.2 1 0.8 0.6 α=1 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 x 3 1.2 1.4 1.6 1.8 2