Übungsblatt 10 (zum Programm „R“) Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 Lade die Daniel-Daten. a) Führe einen Levene-Test durch (für 'Gruppe' und 'schön') b) Wie kann man sich in R Informationen über den Levene-Test anzeigen lassen? c) Ist das Ergebnis signifikant? Welche Prüfstatistik wurde verwendet? d) Was bedeutet das Ergebnis? e) Berechne die Varianzen für die Merkmale 'schön' und 'voll' Aufgabe 2 Lade die Datei 'Adler'. a) Führe eine mehrfaktorielle Varianzanalyse durch. b) Interpretiere die ANOVA-Tabelle. c) Wie könntest du denselben Test mit Hilfe eines linearen Modells durchführen? d) Erstelle eine Grafik, die eine eventuell vorliegende Interaktion veranschaulicht. Aufgabe 3 Lade die Datei 'Cowles'. Führe einen Parallelitätstest durch! (Nullhypothese: Geraden von sind parallel) Die Faktoren seien „Volunteer“ und Geschlecht; Die abhängige Variable sei Extraversion. Aufgabe 4 a) Welche Regressionsmodelle kennt ihr und was sind die jeweiligen Voraussetzungen? b) Man hat eine Varianzanalyse durchgeführt. R liefert einen F-Wert und einen Wert für 'Pr(>F)' Interpretiere diese beiden Werte. Lösungen zu Übungsblatt 10 Aufgabe 1 a) Statistik Varianzen b) Levene Test Hilfe Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Levene-Test: macht Aussagen über Gleichheit der Varianzen c) p = 1; F-Statistik e) Var(schön) = 1.522 Var(voll) = 1.372 Aufgabe 2 b) die beiden Haupteffekte sind nicht signifikant; Interaktion ist signifikant c) Statistik Regressionsmodelle lineares Modell… rating ~ expectation * instruction d) Plot für arithmetische Mittel Aufgabe 3 mehrfaktorielle Varianzanalyse oder lineares Modell verwenden p-Wert (Interaktion)= 0,7988 => H0 wird beibehalten, Geraden sind parallel Aufgabe 4 im Tutorium Übungsblatt 9 (zum Programm „R“) Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 Lade die Datei „Womenlf“ aus dem Paket „car“. a) Welche Variablen wurden gemessen? b) Erstelle ein Kreisdiagramm für „region“. c) Erstelle ein „Boxplot“ für die Variable „income“. Warum kann nur für diese Variable ein Boxplot erstellt werden? Aufgabe 2 Erstelle eine Graphik einer chi^2-Verteilung mit 99 Freiheitsgraden. Aufgabe 3 Es soll untersucht werden, wie groß der Zusammenhang zwischen dem Bruttoinlandsprodukt (gdp) und der Säuglingssterblichkeit ist. Benutze hierfür die Datei „UN“. Aufgabe 4 Definiere den Begriff Datenmatrix. Was versteht man unter dem Begriff „workspace“? Welche Arten von Variablen unterscheidet man? Was bedeutet „Kopieren als Bitmap“? Aufgabe 5 Lade die Daniel-Daten. a) Führe einen zwei-seitigen t-Test durch (Merkmal 'schön', H0: µ0=2, alpha=0,05 ) . Ist das Ergebnis signifikant? Warum? Wie lautet das 95% Konfidenzintervall? b) Teste die Hypothese H0: µ0=2 (Ha: µa>2) für das Merkmal 'schön' mit alpha=0,05. Ist das Ergebnis signifikant? Warum? c) Teste die Hypothese H0: µ0=2 (Ha: µa<2) für das Merkmal 'schön' mit alpha=0,05. Ist das Ergebnis signifikant? Warum? Aufgabe 6 a) Teste anhand der Daten 'Leinhardt' die Hypothese: Durchschnittlich kommen weltweit 50 Säuglingssterbefälle auf 1000 Geburten (Die Alternativhypothese besagt, dass dem nicht so ist). b) Was wurde bei der Studie untersucht und welche Variablen wurden betrachtet? Erstelle ein Streudiagramm. Exportiere die Grafik nach Word. Aufgabe 7 Lade die Datei wohnenb.TXT . a) Welche Merkmale wurden in dem Datensatz erfasst? Schaffe dir einen Überblick über die wichtigsten Kenngrößen wie Mittelwert und Varianz. b) Teste, ob das Merkmal 'Einkommen' in den Daten normalverteilt ist. Zu welchem Ergebnis kommst du? Wie heißt der Test, den du hierfür durchführen musst? Aufgabe 8 a) Für welche Art von Variablen kann man eine Häufigkeitsverteilung erstellen? Was testet man hier mit dem Chi2- Anpassungstest? b) Definiere den Begriff p-Wert? Inwiefern hängt der p-Wert von der Alternativhypothese ab? Was bedeutet der p-Wert für uns beim Hypothesentesten? c) Zwischen zwei Merkmalen X und Y besteht eine Korrelation von r=0,7. Was bedeutet diese Korrelation? Welche Korrelation ist hier gemeint? Welchen Determinationskoeffizienten kann man aus der Korrelation berechnen und wie lässt sich dieser interpretieren? d) Man teste die Mittelwerte zweier unabhängiger Stichproben. Welche Möglichkeiten gibt es hierfür? In welchem Fall stimmen die Ergebnisse der Tests überein? Warum ist das so? Darf man überhaupt in allen Fällen beide Möglichkeiten anwenden? Aufgabe 9 Lade die Daten „baumann“. a) Sind die Mittelwerte im pretest.1 in allen Gruppen gleich? Führe einen Test durch. b) Formuliere die Nullhypothese und die Alternativhypothese. Fragen und Anmerkungen bitte an: [email protected] [email protected] Übungsblatt 8 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 Ein Zufallsvorgang bestehe in dem viermaligen Werfen einer gefälschten Münze. Die Wahrscheinlichkeit, Wappen zu werfen betrage 0.7. Geben Sie mit Hilfe der Ungleichung von Tschebyscheff die Wahrscheinlichkeit an, dass die Realisation der Zufallsvariable um mehr als a) 4 Standardabweichungen b) 2 Standardabweichungen vom Mittelwert abweicht. Aufgabe 2 Gegeben seien der Erwartungswert und die Varianz einer Zufallsvariable: E(X) = 70, Var(X ) = 9 Wie groß ist die Wahrscheinlichkeit höchstens, dass die Realisation der Zufallsvariable um mehr als a) 1 b) 2 c) 4 d) 6 e) 9 vom Mittelwert (=) abweicht. Zusätzlich werden wir am Freitag (13. Juni 2008) im Tutorium Übungsaufgaben zu den wichtigsten Themen, die wir bisher besprochen haben, rechnen. Schaut euch bis dahin noch einmal alles an und schreibt uns (bitte bis Donnerstag Nachmittag) bei welchen Themen noch Fragen und Unklarheiten bestehen, damit wir darauf gezielt eingehen können! Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 8 Aufgabe 1 a) 1 16 b) 1 4 Aufgabe 2 a) b) c) d) e) 9 = 1 (weil Wahrscheinlichkeit 1) 2.25 = 1 0.5625 0.25 0.11111111 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 8 Aufgabe 1 a) 1 16 b) 1 4 Aufgabe 2 a) b) c) d) e) 9 = 1 (weil Wahrscheinlichkeit 1) 2.25 = 1 0.5625 0.25 0.11111111 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Fragen und Anmerkungen bitte an: [email protected] [email protected] Übungsblatt 7 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 a) Die Werte seien standardisiert. Welche Bedeutung hat das für die Varianz, Korrelation und Kovarianz. b) Wie berechnet man die Korrelation, wenn die Werte nicht standardisiert sind? c) Wann handelt es sich bei einer Faktorenanalyse um eine orthogonale Faktorenanalyse? d) Wie bezeichnet man eine Faktorenanalyse, die nicht orthogonal ist? e) Weshalb werden in einem Pfaddiagramm, das eine Faktorenanalyse veranschaulicht, die Faktoren und Störgrößen in Kreisen und die Variablen in Kästchen gezeichnet? Aufgabe 2 a = 0,4 b = 0,38 c = 0,7 X, Y und Z seien standardisiert Ux X c Z a Uy a) Y Uz b Stelle die Gleichungen für X und Y auf. Berechne: b) Cov( X , Y ) c) Cov( X , Z ) d) Cov(Y , Z ) Aufgabe 3 Gegeben seien folgende Gleichungen: T1 3 5 X 1 10 X 2 2 X 3 T2 Y1 20Y2 3Y3 Berechne: a) Var(T1 ) b) Var(T2 ) c) Cov(T1 , T2 ) d) Cov(T1 , T1 ) e) Cov(T2 , T1 ) Aufgabe 4 Skizziere Korrelationsdiagramme: a) negative Korrelation b) Es gibt 4 Teilgruppen. Innerhalb dieser Teilgruppen gibt es keine Korrelation zwischen X und Y. Betrachtet man jedoch das Gesamtbild (über alle Teilgruppen hinweg), so lässt sich eine positive Korrelation feststellen. c) Es gibt 4 Teilgruppen. Innerhalb der einzelnen Teilgruppen besteht jeweils eine negative Korrelation zwischen X und Y. Über alle Gruppen hinweg zeigt sich jedoch eine positive Korrelation. d) Es gibt 2 Teilgruppen. Über alle Gruppen hinweg scheint keine Korrelation vorhanden zu sein. Betrachtet man die Gruppen getrennt, dann zeigt sich in einer der Gruppen eine positive und in der anderen Gruppe eine negative Korrelation zwischen X und Y. Aufgabe 5 Es wurde das Merkmal Extraversion gemessen. Nach der Normierung an einer ausreichend großen Stichprobe betrage der Mittelwert 120, die Varianz 16. Der Zufallsvorgang sei das zufällige Ziehen einer Person aus der Population. Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable „Punktwert eines Probanden“ um mehr als a) eine Standardabweichung b) 8 c) 12 vom Mittelwert abweicht, höchstens? d) Was möchte man mit der Tschebyscheff'schen Ungleichung erreichen? Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 7 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 a) Var ( X ) 1 Corr Cov b) Corr ( X , Y ) c) Faktoren korrelieren nicht miteinander Cov( X , Y ) Std ( X ) * Std (Y ) d) schiefwinklige Faktorenanalyse e) Kreise: latente Variablen Kästchen: manifeste Variablen Aufgabe 2 a) X = aY + cZ + Ux Y = bY + Uy b) Cov(X,Y) = 0,666 c) Cov(X,Z) = 0,852 d) Cov(Y,Z) = 0,38 Aufgabe 3 a) Var(T1) = 25Var(X1) + 100Var(X2) + 4Var(X3) - 100Cov(X1,X2) - 20Cov(X1,X3) + 40Cov(X2,X3) b) Var(T2) = Var(Y1) + 400Var(Y2) + 9Var(Y3) - 40Cov(Y1,Y2) - 6Cov(Y1,Y3) + 120Cov(Y2,Y3) c) Cov(T1,T2) = -5Cov(X1,Y1) + 100Cov(X1,Y2) + 15Cov(X1,Y3) + 10Cov(X2,Y1) 200Cov(X2,Y2) - 30Cov(X2,Y3) + 2Cov(X3,Y1) - 40Cov(X3,Y2) - 6Cov(X3,Y3) d) Cov(T1,T1) = Var(T1) e) Cov(T2,T1) = Cov(T1,T2) Aufgabe 4 Wird im Tutorium besprochen. Aufgabe 5 a) 1 b) 1 4 c) 1 9 d) Wahrscheinlichkeit berechnen, dass eine standardisierte Zufallsvariable einen extremeren Wert als einen bestimmten Wert (k) annimmt. (bei beliebiger Verteilung). Übungsblatt 6 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 T1 a bX T2 c dY Cov( X , Y ) g a) Welches sind ‚abhängige’, welches ‚unabhängige’ Variablen? b) Zeichne ein Pfaddiagramm. c) Berechne: Cov(T1 , T2 ) Aufgabe 2 a) Was ist eine Scheinkorrelation? Gib ein Beispiel. b) X, Y und Z seien Zufallsvariablen mit einer Standardabweichung von je 1. X = 10 + 0,3*Z Y = 5 + 0,041*Z Veranschauliche die Beziehungen zwischen den Variablen anhand eines Bildes und berechne Cov( X , Y ) . Aufgabe 3 Die Beziehungen zwischen den Zufallsvariablen X, Y und Z sind durch folgende Gleichungen beschreibbar: (i) (ii) (iii) (iv) (v) a) Y= aX + Ux Z = bY + Uy Var ( X ) = 7.68 a = 1.34 b = 4.6 Veranschauliche die Beziehungen anhand eines Pfaddiagramms. Berechne: b) Cov ( X,Y ) c) Cov ( Z,X ) d) Cov ( Z,Y ) Aufgabe 4 In einer motivationspsychologischen Studie soll untersucht werden, wie die Zufallsvariablen Schulnote (S), Intelligenz (I), Leistungsmotivation (L) und Erziehung (E) miteinander zusammenhängen. Man geht von folgenden Annahmen aus: (i) S = a*I + b*E+ Us (ii) L = c*E + UL (iii) Cov( E,I ) a) Veranschauliche die Beziehungen anhand eines Pfaddiagramms. Folgende Daten wurden zur Analyse übermittelt: Var( E ) = 7.6 Cov ( E,I ) = 2 a = .81 b = .21 c = .46 b) Berechne: Cov ( S,L ) Aufgabe 5 Wir betrachten die ersten 10 Personen der Studentenerhebung (siehe Nagl – Skript im Anhang). Sie sind in unserem Beispiel die Population. Aus dieser Population wird nun gezogen. Dabei ist X die Zufallsvariable „Alter der Person“ und Y „Ausbildung des Vaters“. Beim einmaligen ziehen können nun das Alter der Person oder die Ausbildung des Vaters betrachtet werden. a) Berechne: E(X) b) Berechne: E(Y) Nun wird 2mal gezogen (mit Zurücklegen). Dabei ergeben sich die neuen Zufallsvariablen X und Y . c) Berechne: Cov( X , Y ) Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 6 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 a) Abhängig: T1; T2 Unabhängig: X; Y b) X b T1 a T2 c g Y c) d Cov(T1 , T2 ) b * d * Cov( X , Y ) b * d * g Aufgabe 2 a) Eine Scheinkorrelation ist dann vorhanden, wenn zwei Variablen (X und Y) kovariieren, diese Kovarianz allerdings nur dadurch zustande kommt, dass X und Y von einer dritten Variable (Z) abhängig sind. So kann der Eindruck einer Beziehung zwischen X und Y entstehen, der nicht real existiert. „Je mehr Feuerwehrmänner bei einem Einsatz zugegen sind (X), desto größer ist der Schaden (Y). Beide Variablen hängen von der Größe des Brandes (Z) ab. b) 0.3 X 0.041 Y 10 Z 5 Cov( X,Y ) = 0.3*0.041*Var(Z) = 0.0123 Aufgabe 3 a) a b X Y Z Ux Uy b) Cov( X,Y ) = a*Var( X ) = 1.34*7.68 = 10.2912 c) Cov( Z,X ) = b*a*Var(X) = 4.6*1.34*7.68 = 47.33952 d) Cov( Z,Y ) = b*Var(Y) = b*a²*Var(X) = 63.4349 Aufgabe 4 a) a I S US L UL b c E b) Cov( S,L ) = b*c*Var(E) +a*c*Cov(I,E) = 1.47936 Aufgabe 5 a) E( X ) 22 24 21 22 24 21 21 22 22 24 22.3 10 b) E (Y ) 2 7 3 2 1 2 2 111 2.2 10 c) Cov( X , Y ) 1 * (Cov( X 1 , Y1 ) Cov( X 2 , Y2 ) Cov( X 1 , Y2 ) Cov( X 2 , Y1 )) 4 Fragen und Anmerkungen bitte an: [email protected] [email protected] Übungsblatt 5 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 a)Berechne folgende Varianz: Var(5X – 2Y) b) Wie verändert sich die Varianz, wenn X und Y unabhängige Variablen sind c) Berechne: Cov(X+Y, X+Z) Aufgabe 2 Angenommen X, Y, und Z sind unabhängige Zufallssvariablen mit einer Standardabweichung von je 1. Berechne: a.) Var(2*X + 3*Y – Z) b.) Cov(X – 2*Y, 3*X + Y + 2*Z) Aufgabe 3 Zeige, dass gilt: a.) Cov( X - Y , X ) = Var(X) - Cov(X,Y) b.) Cov( a +bX + cY, X) = b*Var(X) + c*Cov(X,Y) Aufgabe 4 Es gilt: X1 = T + U1 und X2 = T + U2 wobei U1 und U2 zufällige Störgrößen sind die mit keinem der anderen Werte kovariieren. Berechne: a.) Cov(X1 + X2 , T) b.) Cov(X1,X2) Aufgabe 5 Ein Intelligenztest für Kinder besteht aus 5 Untertests. Eine Faktorenanalyse ergab zwei Faktoren. Folgende Tabelle zeigt die Faktorenladungen; die Faktoren und die X-Variablen seien standardisiert: Faktor 1 Faktor 2 Wortverständnis 0,05 0,8 Nachsprechen 0,02 0,75 Merken 0,4 0,3 Rechnen 0,9 0,03 Zählen 0,7 0,1 Stelle die Faktorladungen der beiden Faktoren auf die einzelnen Tests in einem Dir bekannten Diagramm dar (beide Faktoren seien orthogonal). Berechne unter der Annahme dass alle Variablen eine Standardabweichung von 1 haben: a.) Cov(F1,X3) b.) Cov (F2, X5) c.) Cov(X3, X5) Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 5 Aufgabe 1 a) Var(5X – 2Y) = 25*Var(X) + 4*Var(Y) – 20*Cov(X,Y) b) Var(5X – 2Y) = 25*Var(X) + 4*Var(Y) c) Cov(X+Y, X+Z) = Var(X) + Cov(X,Z) + Cov(X,Y) + Cov(Y,Z) Aufgabe 2 a) Var(2*X + 3*Y – Z) = 4*Var(X) + 9*Var(Y) + Var(Z) = 4 + 9 + 1 = 14 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl b) Cov(X – 2*Y, 3*X + Y + 2*Z) = 3*Var(X) + Cov(X,Y) + 2*Cov(X,Z) – 6*Cov(X,Y) – 2*Var(Y) – 4*Cov(Y,Z) = 3-2=1 Aufgabe 3 a) Cov( X - Y , X ) = Cov(X,X) - Cov(Y,X)= Var (X) - Cov(Y,X) b) Cov( a +bX + cY, X) = b*Var(X) + c*Cov(X,Y) Aufgabe 4 a) Cov(X1 + X2 , T) = 2*Var(T) b) Cov(X1,X2) = Var(T) Aufgabe 5 a) Cov(F1,X3) = 0,4 b) Cov(F2, X5) = 0,1 c) Cov( X3, X5) = 0,31 Übungsblatt 4 (Zusatzblatt - wird nicht besprochen. Bei Fragen E-Mail schreiben!) Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 Ein medizinisches Symptom S kann von zwei bekannten Krankheiten A und B hervorgerufen werden (A ist selten und gefährlich, B ist häufig und harmlos), aber S kann auch bei Menschen auftreten, die an keiner der beiden Krankheiten leiden (C). Man kann nicht an A und B gleichzeitig erkrankt sein. Wenn das Symptom bei jemandem auftritt, möchte man wissen, mit welcher Wahrscheinlichkeit er welche Krankheit hat bzw. mit welcher Wahrscheinlichkeit er keine der beiden Krankheiten in sich trägt. Kategorie Auftreten von S mit Wahrscheinlichkeit A 0.5 B 0.2 C 0.1 Die Erkrankungswahrscheinlichkeiten sind in folgender Tabelle dargestellt: Kategorie A B Erkrankung erfolgt mit Wahrscheinlichkeit 0.01 0.15 Wie groß ist unter Zugrundelegung dieser Daten die Wahrscheinlichkeit, dass ein Mensch, der Symptom S ausbildet, an A bzw. B erkrankt oder gar nicht erkrankt ist? Aufgabe 2 Eine Vorlesung wird von 16 männlichen und 64 weiblichen Studenten besucht. Die Häufigkeit korrekter Antworten wurde untersucht. Die Hälfte der Antworten, die von männlichen Studenten gegeben wurde, war richtig. Bei den Studentinnen waren 30 % der Antworten falsch. a) Zeichnet einen Wahrscheinlichkeitsbaum oder eine Kreuztabelle. b) Wie groß ist insgesamt die Wahrscheinlichkeit, dass eine Antwort falsch ist? Es wurde eine richtige Antwort gegeben: c) Wie groß ist die Wahrscheinlichkeit, dass diese Antwort von einem männlichen Studenten gegeben wurde? d) Wie hoch ist die Wahrscheinlichkeit, dass eine Studentin diese Antwort gab? Aufgabe 3 Gegeben seien folgende Wahrscheinlichkeiten. Entscheide, ob die unten stehenden Aussagen richtig oder falsch sind! Bedingte Wahrscheinlichkeiten 0.8 0.4 B1 A Gemeinsame Wahrscheinlichkeit 0.7 0.3 0.7 0.2 c B1 0.3 0.2 0.1 0.6 A B1 0.8 c 0.2 0.9 c B1 0.8 B2 0.224 B2 c 0.096 B2 0.056 B2 c 0.024 B2 0.012 B2 c 0.048 B2 0.108 c 0.432 B2 a) A und B1 sind voneinander unabhängige Ereignisse. b) Unter Bedingung A sind die Ereignisse B1 und B2 sind voneinander abhängig. c) Die Ereignisse B1 und B2 sind immer voneinander unabhängig. Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 4 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 Wahrscheinlichkeitsbaum: oder Kreuztabelle (zeilenbedingte Anteile): A B C S 0,5 0,2 0,1 S 0,5 0,8 0,9 0,01 0,15 0,84 1 Berechnung mit Satz von Bayes: P( A | S ) P( S | A) P( A) 0,5 * 0,01 0,042 P( S | A) * P( A) P( S | B) * P( B) P( S | C ) * P(C ) 0,5 * 0,01 0,2 * 0,15 0,1 * 0,84 P( B | S ) P( S | B) P( B) 0,2 * 0,15 0,252 P( S | A) * P( A) P( S | B) * P( B) P( S | C ) * P(C ) 0,5 * 0,01 0,2 * 0,15 0,1 * 0,84 P(C | S ) P( S | C ) P(C ) 0,1 * 0,84 0,706 P( S | A) * P( A) P( S | B) * P( B) P( S | C ) * P(C ) 0,5 * 0,01 0,2 * 0,15 0,1 * 0,84 Aufgabe 2 M = männlich W = weiblich R = richtig F = falsch a) Wahrscheinlichkeitsbaum: 0,5 R M 0,2 0,5 0,8 F 0,7 R 0,3 F W Kreuztabelle (zeilenbedingte Anteile): M W R 0,5 0,7 F 0,5 0,3 0,2 0,8 1 b) P( F ) P( FM ) P( FW ) P( F | M ) * P( M ) P( F | W ) * P(W ) 0,5 * 0,2 0,3 * 0,8 0,34 c) P( M | R) 0,5 * 0,2 0,1515 0,5 * 0,2 0,7 * 0,8 d) P(W | R) 0,7 * 0,8 0,8484 0,7 * 0,8 0,5 * 0,2 Aufgabe 3 a) falsch! b) falsch! Gegeben A, sind die Ereignisse B1 und B2 voneinander unabhängig. c) falsch! Die Ereignisse B1 und B2 sind nur lokal stochastisch unabhängig. Übungsblatt 3 [email protected]; [email protected] Statistik 1b Aufgabe 1 In einem psychologischen Forschungsprojekt sollen die Zufallsvariablen „allgemeine Intelligenz“(X), „Sozialkompetenz“ (Y) und „sprachliche Fertigkeiten“ (Z), deren Realisationen in Punkten dargestellt werden, untersucht werden. In einer Urne befinden sich fünf Kugeln. Das Elementarereignis sei, eine Kugel zu ziehen. Auf jeder der Kugeln ist die jeweilige Realisation der Zufallsvariablen X vermerkt. Aus vorherigen Untersuchungen weiß man, dass sowohl Sozialkompetenz als sprachliche Fertigkeiten linear von der allgemeinen Intelligenz abhängig sind. Y = 50 + 0.5 X Z = 59 + 0.4 X Nachfolgend sind die in dem Test zur allgemeinen Intelligenz erreichten Punkte tabellarisch dargestellt. Kugel i Erreichte IQ-Punkte 1 98 2 103 3 107 4 96 5 93 1.1 Berechnen Sie die durchschnittlichen Realisationen der Zufallsvariablen (X), (Y) und (Z). Welche zwei statistischen Möglichkeiten stehen dir für die Erwartungswerte bei der Sozialkompetenz und bei den sprachlichen Fertigkeiten zur Verfügung? Erstelle, falls nötig, eine Tabelle mit den entsprechend erreichten IQ-Punkten. 1.2 Welche Einschätzung bezüglich der Streuung von Y und Z können sie ausschließlich anhand der Linearkombinationen treffen? Welche Zufallsvariable sollte stärker streuen? Berechnen Sie die Varianz aller drei Fertigkeiten. 1.3 Sind Y und Z unabhängig? Welches statistische Maß muss hierfür herangezogen werden? Aufgabe 2 In einer Urne befinden sich sechs Kugeln, auf denen sowohl die Realisation der Zufallsvariable „Größe“ als auch die Realisation der Zufallsvariable „Alter“ vermerkt ist. Das Elementarereignis sei, eine der Kugeln zu ziehen. Teilnehmer nr.i Größe in cm (X) Alter (A) 1 2 3 4 5 6 181 182 180 179 186 184 28 30 32 37 38 39 2.1 Wie groß sind die Teilnehmer durchschnittlich? 2.2 Wie groß ist die Varianz? Durch den rapiden Muskelaufbau in der Trainingsphase haben Leistungssportler auch nach Jahren noch – unabhängig von ihrer sonstigen Konstitution – 40 Kg Körpermasse, die aus Muskeln besteht. Ihr restliches Gewicht (Y) ist linear mit dem Faktor 0.25 von ihrer entsprechenden Größe abhängig. 2.3 Wie lassen sich die Angaben aus dem Text in eine mathematische Gleichung umformulieren? 2.4 Wie schwer sind die Teilnehmer durchschnittlich? Berechne, falls nötig, die jeweiligen Gewichte der Sportler. Wie groß ist die Varianz? Die maximale Herzfrequenz ( Z ) kann mit der Formel: 210 – 0.5* Alter – 0.11* Gewicht berechnet werden. 2.5 Lege eine Tabelle mit den erforderlichen Daten an! 2.6 Berechne die durchschnittliche maximale Herzfrequenz der Sportler aus! Welche zwei statistischen Möglichkeiten stehen dir dabei zu Verfügung? 2.7 Lege eine Tabelle an und berechne die Covarianz zwischen Alter und Gewicht. 2.8 Berechne die Varianz der Linearkombination auf zwei Arten. Beachte die Formel zur Berechnung der Varianz einer Differenz! s. Skript Übungsblatt 3 Lösungen Aufgabe 1 1.1 E ( X ) = 99.4 E ( Y ) = 99.7 Herkömmlicher Weg oder E ( Y = a + b*X ) = a + b* E ( X ) E ( Y = 50 + 0.5*X ) = 50 + 0.5 * E ( X ) E ( Z ) = 98.76 Kugel i 1 Erreichte IQ-Punkte x 98 Soz.kompetenzpunkte y99 Sprachpunkte z 98.2 2 103 101.5 100.2 3 107 103.5 101.8 4 96 98 97.4 5 93 96.5 96.2 1.2 0.5² > 0.4² -> Streuung der Sozialkompetenz ist größer. Var ( X ) = 25.04 Var ( Y ) = 6.26 )] Var ( Z ) = 4.0064 [ Var ( a + b*X ) = b² * Var ( X ) ] oder [ Var ( Y ) = E ( Y² ) – E² ( Y 1.3 Nein, sie sind abhängig. Cov ( Y,Z ) = 5.008 Aufgabe 2 2.1 E( X )= 182 2.2 Var ( X ) = 5.66 [ Var ( X ) = E ( X² ) – E² ( X ) ] 2.3 y = 40 + 0.25*x 2.4 E ( Y ) = 85.5 Kugel i Gewicht in kg (y) 1 85.25 [ E ( a + bX ) = a + bE ( X ) ] 2 85.5 3 85 4 84.75 5 86.5 6 86 Var ( Y ) = 0.35 [ Var ( a + bX ) = b² Var ( X ) ] oder s. 1.2 2.6 E ( Z ) = 183.595 Möglichkeiten: Erwartungswert einer Linearkombination oder herkömmlicher Weg. 2.7 0.5 * A 0.11* Y 0.5*A 0.5² * Var ( A ) 0.5* 0.11* Cov ( A,Y ) 0.11*Y 0.11*0.5 * Cov ( A,Y ) 0.11² * Var ( Y ) Cov ( A,Y ) = 1.125 [ Cov ( A,Y ) = E ( AY ) – E ( A )* E ( Y ) ] 2.8 Var ( Z ) = E ( Z² ) – E² ( Z ) = 4.544 Var ( a - b1*X – b2 * Y ) = b1²*Var ( A ) + b2² * Var ( Y ) + 2 b1*b2*Cov ( AY ) = 0.5² 17.666 + 0.11² 0.35 +2*0.5*0.11* 1.125 = 9.960985 Übungsblatt 2 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 0,01% der 20-30-jährigen heterosexuellen deutschen Männer sind HIV-positiv. Wenn ein Mann infiziert ist, fällt ein bewährter HIV-Test zu 99,8% positiv aus. Lässt sich ein gesunder Mann testen, fällt der Test zu 0,01% positiv aus. a) Trage in folgende Tabelle die zeilenbedingten Anteile ein: A tatsächlicher Status: HIV positiv Ac = tatsächlicher Status: HIV negativ B c Testergebnis negativ B Testergebnis positiv B Bc A Ac b) Zeichne einen Wahrscheinlichkeitsbaum. Wo stehen die bedingten Wahrscheinlichkeiten, wo die gemeinsamen Wahrscheinlichkeiten. c) Sind A und B abhängig? Begründe. d) Wie groß ist die Wahrscheinlichkeit, dass ein Mann tatsächlich infiziert ist, wenn der Test ein positives Ergebnis liefert? Aufgabe 2 70% der Studenten haben sich gut auf die Prüfung vorbereitet. Von diesen Studenten haben nur 10% Angst vor Prüfungen. 30% aller Studenten haben Prüfungsangst. a) Wie viel Prozent der Studenten, die sich schlecht vorbereitet haben, haben Prüfungsangst. b) Wie hoch ist der Anteil der Studenten, die sich schlecht vorbereitet haben und keine Angst vor Prüfungen haben? c) Wie groß ist die Wahrscheinlichkeit, dass sich jemand gut vorbereitet hat, unter der Bedingung, dass er keine Prüfungsangst hat? d) Wie könnte ein Wahrscheinlichkeitsbaum aussehen, wenn die beiden Merkmale (Vorbereitung und Prüfungsangst) voneinander unabhängig wären? Fragen und Anmerkungen bitte an: [email protected] [email protected] Übungsblatt 1 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 Wie können folgende Mengenrelationen noch geschrieben werden? a) A b) A Ø c) A Ø d) Ø e) A B f) ( Ac ) g) A A Aufgabe 2 Unter welcher Bedingung ist A B B A ? Aufgabe 3 Löse die Klammern auf, indem du die entsprechenden Gesetze anwendest: a) E ( F G ) b) E F G H Aufgabe 4 Zeige anhand der dir bekannten Gesetze oder anhand von Mengenbildern, dass Folgendes gilt (für E, F, G in Ω): a) E F E F b) E F E F Aufgabe 5 Vereinfache: a) E F G E F G b) E F G E F G Aufgabe 6 Zeichne für folgende Ereignisse Mengenbilder: a) C B b) A B c) B C d) B A g) A B l) A B C h) A B i) C B m) A B C j) C B A n) A B C e) A C f) B C A k) C A B Aufgabe 7 Es soll das Verhältnis folgender Ereignisse untersucht werden: A: Geschlecht ist männlich B: Nichtraucher C: Psychologiestudent Nun werden fünf Forscherteams losgeschickt. Stelle die Beziehungen in Mengenbildern dar. Welche Schlüsse könnte man aus den jeweiligen Ergebnissen ziehen? (T1) C A (T2) A B C (T3) A B C (T4) C B A (T5) A B C Aufgabe 8 Ein fairer Würfel wird zwei Mal geworfen. Es interessiert die Summe der Augenzahlen. Beschreibe... a) den Gesamtereignisraum. b) das Ereignis A (Die Summe ist gerade). c) Das Ereignis B (Die Summe ist eine Primzahl). d) Das Ereignis C (Die Summe ist kleiner als 8). e) A C f) B C g) A B h) wie der Gesamtereignisraum aus den Ereignissen A, B und C dargestellt werden kann. Aufgabe 9 In einem Zufallsexperiment seien A und B paarweise disjunkte Ereignisse. Mit Hilfe von p P A und q PB sind die Wahrscheinlichkeiten für folgende Ereignisse zu ermitteln: a) P A B f) P A B b) P A B g) P A B c) P A B h) PB A d) P A B e) P A B Fragen und Anmerkungen bitte an: [email protected] [email protected] Lösungen zu Übungsblatt 1 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 a) A b) A c) Ø d) Ω e) A B c f) A g) Ø Aufgabe 2 Dies gilt, wenn B eine Teilmenge von A ist: B A (das schließt auch folgendes ein: A B und B ) Aufgabe 3 a) ( E F ) ( E G ) Distributivgesetz b) ( E F ) ( E G ) ( E H ) Distributivgesetz Aufgabe 4 a) 1. DeMorgan's Gesetz für Schnitte: ( E F ) c E c F c 2. Mengenbild: für beide Seiten der Gleichung ergibt sich dieses Mengenbild b) 1. DeMorgan's Gesetz für Vereinigungen: ( E F ) c E c F c 2. Mengenbild: für beide Seiten der Gleichung ergibt sich dieses Mengenbild Aufgabe 5 a) F G b) Ø Aufgabe 6 a) b) c) d) e) f) i) j) m) n) g) k) h) l) Aufgabe 7 (T1) (T2) Nur Frauen studieren Psychologie ein Teil aller Frauen studiert Psychologie wenn jmd. Psycholgie studiert, dann ist er eine Frau Keine Männer studieren Psychologie jmd. ist männlich, aber nicht zugleich Psychologiestudent UND Nichtraucher d.h.: wenn ein Mann Psychologie studiert, dann raucht er (T3) alle Untersuchngspersonen waren rauchende, männliche Psychologiestudenten (T4) alle Personen waren Männer oder Frauen, die nicht rauchen und Psychologie studieren (T5) weibliche rauchende Psychologiestudenten Aufgabe 8 a) b) c) d) e) f) g) h) Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} A = {2, 4, 6, 8, 10, 12} B = {2, 3, 5, 7, 11} C = {2, 3, 4, 5, 6, 7} A C {2, 3, 4, 5, 6, 7, 8, 10, 12} B C {2, 3, 5, 7} A B {2} A B Cc Aufgabe 9 a) p q b) 1 q c) 1 p d) 1 e) p f) 1 p g) p h) q Lösungen zu Übungsblatt 2 Statistik 1b Sommersemester 2008 Doz.: Dr. Willi Nagl Aufgabe 1 a) A Ac Bc 0,002 0,9999 B 0,998 0,0001 0,0001 0,9999 b) Bedingte W'ten Gemeinsame W'ten 0,998 B 0,0000998 0,002 Bc 0,0000002 0,0001 B 0,00009999 Bc 0,99980001 A 0,0001 0,9999 Ac 0,9999 c) Ja, A und B sind abhängig! Bei stochastischer Unabhängigkeit müsste folgendes erfüllt sein: P(A) = P(A|B) oder P(A|B) = P(A|Bc) oder P(AB) = P(A)*P(B) d) Satz von Bayes: P( Ai | B ) P( A | B ) P( B | Ai ) P( Ai ) P( B | A1 ) P( A) P( B | Am ) P( Am ) 0,998 * 0,0001 = 0,4995 0,998 * 0,0001 0,0001 * 0,9999 Wenn der Test ein positives Ergebnis liefert, dann beträgt die Wahrscheinlichkeit, dass der Mann auch tatsächlich infiziert ist etwa 50%. Aufgabe 2 a) 76,667 % b) 0,9 c) 0,07 d) Beispiel für eine mögliche Antwort: A : gut vorbereitet Ac : schlecht vorbereitet B : Angst Bc : keine Angst 0,1 B A 0,7 0,3 0,9 Bc 0,1 B 0,9 Bc Ac