Übungsblatt 3 Lösungen

Werbung
Übungsblatt 10
(zum Programm „R“)
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
Lade die Daniel-Daten.
a) Führe einen Levene-Test durch (für 'Gruppe' und 'schön')
b) Wie kann man sich in R Informationen über den Levene-Test anzeigen lassen?
c) Ist das Ergebnis signifikant? Welche Prüfstatistik wurde verwendet?
d) Was bedeutet das Ergebnis?
e) Berechne die Varianzen für die Merkmale 'schön' und 'voll'
Aufgabe 2
Lade die Datei 'Adler'.
a) Führe eine mehrfaktorielle Varianzanalyse durch.
b) Interpretiere die ANOVA-Tabelle.
c) Wie könntest du denselben Test mit Hilfe eines linearen Modells durchführen?
d) Erstelle eine Grafik, die eine eventuell vorliegende Interaktion veranschaulicht.
Aufgabe 3
Lade die Datei 'Cowles'.
Führe einen Parallelitätstest durch! (Nullhypothese: Geraden von sind parallel)
Die Faktoren seien „Volunteer“ und Geschlecht;
Die abhängige Variable sei Extraversion.
Aufgabe 4
a) Welche Regressionsmodelle kennt ihr und was sind die jeweiligen Voraussetzungen?
b) Man hat eine Varianzanalyse durchgeführt.
R liefert einen F-Wert und einen Wert für 'Pr(>F)'
Interpretiere diese beiden Werte.
Lösungen zu Übungsblatt 10
Aufgabe 1
a) Statistik  Varianzen
b) Levene Test  Hilfe
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Levene-Test: macht Aussagen über Gleichheit der Varianzen
c) p = 1; F-Statistik
e) Var(schön) = 1.522
Var(voll) = 1.372
Aufgabe 2
b) die beiden Haupteffekte sind nicht signifikant; Interaktion ist signifikant
c) Statistik  Regressionsmodelle  lineares Modell…
rating ~ expectation * instruction
d) Plot für arithmetische Mittel
Aufgabe 3
mehrfaktorielle Varianzanalyse oder lineares Modell verwenden
p-Wert (Interaktion)= 0,7988 => H0 wird beibehalten, Geraden sind parallel
Aufgabe 4
im Tutorium
Übungsblatt 9
(zum Programm „R“)
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
Lade die Datei „Womenlf“ aus dem Paket „car“.
a) Welche Variablen wurden gemessen?
b) Erstelle ein Kreisdiagramm für „region“.
c) Erstelle ein „Boxplot“ für die Variable „income“. Warum kann nur für diese Variable
ein Boxplot erstellt werden?
Aufgabe 2
Erstelle eine Graphik einer chi^2-Verteilung mit 99 Freiheitsgraden.
Aufgabe 3
Es soll untersucht werden, wie groß der Zusammenhang zwischen dem
Bruttoinlandsprodukt (gdp) und der Säuglingssterblichkeit ist. Benutze hierfür die
Datei „UN“.
Aufgabe 4
Definiere den Begriff Datenmatrix.
Was versteht man unter dem Begriff „workspace“?
Welche Arten von Variablen unterscheidet man?
Was bedeutet „Kopieren als Bitmap“?
Aufgabe 5
Lade die Daniel-Daten.
a) Führe einen zwei-seitigen t-Test durch (Merkmal 'schön', H0: µ0=2, alpha=0,05 ) . Ist
das Ergebnis signifikant? Warum? Wie lautet das 95% Konfidenzintervall?
b) Teste die Hypothese H0: µ0=2 (Ha: µa>2) für das Merkmal 'schön' mit alpha=0,05. Ist
das Ergebnis signifikant? Warum?
c) Teste die Hypothese H0: µ0=2 (Ha: µa<2) für das Merkmal 'schön' mit alpha=0,05. Ist
das Ergebnis signifikant? Warum?
Aufgabe 6
a) Teste anhand der Daten 'Leinhardt' die Hypothese: Durchschnittlich kommen weltweit
50 Säuglingssterbefälle auf 1000 Geburten (Die Alternativhypothese besagt, dass dem
nicht so ist).
b) Was wurde bei der Studie untersucht und welche Variablen wurden betrachtet?
Erstelle ein Streudiagramm. Exportiere die Grafik nach Word.
Aufgabe 7
Lade die Datei wohnenb.TXT .
a) Welche Merkmale wurden in dem Datensatz erfasst? Schaffe dir einen Überblick über
die wichtigsten Kenngrößen wie Mittelwert und Varianz.
b) Teste, ob das Merkmal 'Einkommen' in den Daten normalverteilt ist. Zu welchem
Ergebnis kommst du? Wie heißt der Test, den du hierfür durchführen musst?
Aufgabe 8
a) Für welche Art von Variablen kann man eine Häufigkeitsverteilung erstellen?
Was testet man hier mit dem Chi2- Anpassungstest?
b) Definiere den Begriff p-Wert? Inwiefern hängt der p-Wert von der
Alternativhypothese ab? Was bedeutet der p-Wert für uns beim Hypothesentesten?
c) Zwischen zwei Merkmalen X und Y besteht eine Korrelation von r=0,7.
Was bedeutet diese Korrelation? Welche Korrelation ist hier gemeint?
Welchen Determinationskoeffizienten kann man aus der Korrelation berechnen und
wie lässt sich dieser interpretieren?
d) Man teste die Mittelwerte zweier unabhängiger Stichproben. Welche Möglichkeiten
gibt es hierfür? In welchem Fall stimmen die Ergebnisse der Tests überein? Warum ist
das so? Darf man überhaupt in allen Fällen beide Möglichkeiten anwenden?
Aufgabe 9
Lade die Daten „baumann“.
a) Sind die Mittelwerte im pretest.1 in allen Gruppen gleich? Führe einen Test durch.
b) Formuliere die Nullhypothese und die Alternativhypothese.
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Übungsblatt 8
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
Ein Zufallsvorgang bestehe in dem viermaligen Werfen einer gefälschten Münze.
Die Wahrscheinlichkeit, Wappen zu werfen betrage 0.7.
Geben Sie mit Hilfe der Ungleichung von Tschebyscheff die Wahrscheinlichkeit an, dass die
Realisation der Zufallsvariable um mehr als
a) 4 Standardabweichungen
b) 2 Standardabweichungen
vom Mittelwert abweicht.
Aufgabe 2
Gegeben seien der Erwartungswert und die Varianz einer Zufallsvariable:
E(X) = 70, Var(X ) = 9
Wie groß ist die Wahrscheinlichkeit höchstens, dass die Realisation der Zufallsvariable um
mehr als
a) 1
b) 2
c) 4
d) 6
e) 9
vom Mittelwert (=) abweicht.
Zusätzlich werden wir am Freitag (13. Juni 2008) im Tutorium Übungsaufgaben zu den
wichtigsten Themen, die wir bisher besprochen haben, rechnen.
Schaut euch bis dahin noch einmal alles an und schreibt uns (bitte bis Donnerstag
Nachmittag) bei welchen Themen noch Fragen und Unklarheiten bestehen, damit wir
darauf gezielt eingehen können!
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 8
Aufgabe 1
a)
1
16
b)
1
4
Aufgabe 2
a)
b)
c)
d)
e)
9 = 1 (weil Wahrscheinlichkeit  1)
2.25 = 1
0.5625
0.25
0.11111111
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 8
Aufgabe 1
a)
1
16
b)
1
4
Aufgabe 2
a)
b)
c)
d)
e)
9 = 1 (weil Wahrscheinlichkeit  1)
2.25 = 1
0.5625
0.25
0.11111111
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Übungsblatt 7
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
a)
Die Werte seien standardisiert. Welche Bedeutung hat das für die Varianz,
Korrelation und Kovarianz.
b) Wie berechnet man die Korrelation, wenn die Werte nicht standardisiert sind?
c)
Wann handelt es sich bei einer Faktorenanalyse um eine orthogonale Faktorenanalyse?
d) Wie bezeichnet man eine Faktorenanalyse, die nicht orthogonal ist?
e)
Weshalb werden in einem Pfaddiagramm, das eine Faktorenanalyse veranschaulicht, die
Faktoren und Störgrößen in Kreisen und die Variablen in Kästchen gezeichnet?
Aufgabe 2
a = 0,4
b = 0,38
c = 0,7
X, Y und Z seien standardisiert
Ux
X
c
Z
a
Uy
a)
Y
Uz
b
Stelle die Gleichungen für X und Y auf.
Berechne:
b) Cov( X , Y )
c) Cov( X , Z )
d) Cov(Y , Z )
Aufgabe 3
Gegeben seien folgende Gleichungen:
T1  3  5 X 1  10 X 2  2 X 3
T2  Y1  20Y2  3Y3
Berechne:
a) Var(T1 )
b) Var(T2 )
c) Cov(T1 , T2 )
d) Cov(T1 , T1 )
e) Cov(T2 , T1 )
Aufgabe 4
Skizziere Korrelationsdiagramme:
a) negative Korrelation
b) Es gibt 4 Teilgruppen. Innerhalb dieser Teilgruppen gibt es keine Korrelation zwischen X
und Y. Betrachtet man jedoch das Gesamtbild (über alle Teilgruppen hinweg), so lässt
sich eine positive Korrelation feststellen.
c) Es gibt 4 Teilgruppen. Innerhalb der einzelnen Teilgruppen besteht jeweils eine negative
Korrelation zwischen X und Y. Über alle Gruppen hinweg zeigt sich jedoch eine positive
Korrelation.
d) Es gibt 2 Teilgruppen. Über alle Gruppen hinweg scheint keine Korrelation vorhanden zu
sein. Betrachtet man die Gruppen getrennt, dann zeigt sich in einer der Gruppen eine
positive und in der anderen Gruppe eine negative Korrelation zwischen X und Y.
Aufgabe 5
Es wurde das Merkmal Extraversion gemessen. Nach der Normierung an einer ausreichend
großen Stichprobe betrage der Mittelwert 120, die Varianz 16.
Der Zufallsvorgang sei das zufällige Ziehen einer Person aus der Population.
Wie groß ist die Wahrscheinlichkeit, dass die Zufallsvariable „Punktwert eines Probanden“
um mehr als
a) eine Standardabweichung
b) 8
c) 12
vom Mittelwert abweicht, höchstens?
d) Was möchte man mit der Tschebyscheff'schen Ungleichung erreichen?
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 7
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
a)
Var ( X )  1
Corr  Cov
b)
Corr ( X , Y ) 
c)
Faktoren korrelieren nicht miteinander
Cov( X , Y )
Std ( X ) * Std (Y )
d) schiefwinklige Faktorenanalyse
e)
Kreise: latente Variablen
Kästchen: manifeste Variablen
Aufgabe 2
a)
X = aY + cZ + Ux
Y = bY + Uy
b) Cov(X,Y) = 0,666
c)
Cov(X,Z) = 0,852
d) Cov(Y,Z) = 0,38
Aufgabe 3
a)
Var(T1) = 25Var(X1) + 100Var(X2) + 4Var(X3) - 100Cov(X1,X2) - 20Cov(X1,X3) +
40Cov(X2,X3)
b) Var(T2) = Var(Y1) + 400Var(Y2) + 9Var(Y3) - 40Cov(Y1,Y2) - 6Cov(Y1,Y3) +
120Cov(Y2,Y3)
c)
Cov(T1,T2) = -5Cov(X1,Y1) + 100Cov(X1,Y2) + 15Cov(X1,Y3) + 10Cov(X2,Y1) 200Cov(X2,Y2) - 30Cov(X2,Y3) + 2Cov(X3,Y1) - 40Cov(X3,Y2) - 6Cov(X3,Y3)
d) Cov(T1,T1) = Var(T1)
e)
Cov(T2,T1) = Cov(T1,T2)
Aufgabe 4
Wird im Tutorium besprochen.
Aufgabe 5
a)
1
b)
1
4
c)
1
9
d) Wahrscheinlichkeit berechnen, dass eine standardisierte Zufallsvariable einen extremeren
Wert als einen bestimmten Wert (k) annimmt. (bei beliebiger Verteilung).
Übungsblatt 6
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
T1  a  bX
T2  c  dY
Cov( X , Y )  g
a) Welches sind ‚abhängige’, welches ‚unabhängige’ Variablen?
b) Zeichne ein Pfaddiagramm.
c) Berechne: Cov(T1 , T2 )
Aufgabe 2
a)
Was ist eine Scheinkorrelation? Gib ein Beispiel.
b) X, Y und Z seien Zufallsvariablen mit einer Standardabweichung von je 1.
X = 10 + 0,3*Z
Y = 5 + 0,041*Z
Veranschauliche die Beziehungen zwischen den Variablen anhand eines Bildes und
berechne Cov( X , Y ) .
Aufgabe 3
Die Beziehungen zwischen den Zufallsvariablen X, Y und Z sind durch folgende Gleichungen
beschreibbar:
(i)
(ii)
(iii)
(iv)
(v)
a)
Y= aX + Ux
Z = bY + Uy
Var ( X ) = 7.68
a = 1.34
b = 4.6
Veranschauliche die Beziehungen anhand eines Pfaddiagramms.
Berechne:
b) Cov ( X,Y )
c) Cov ( Z,X )
d) Cov ( Z,Y )
Aufgabe 4
In einer motivationspsychologischen Studie soll untersucht werden, wie die Zufallsvariablen
Schulnote (S), Intelligenz (I), Leistungsmotivation (L) und Erziehung (E) miteinander
zusammenhängen. Man geht von folgenden Annahmen aus:
(i) S = a*I + b*E+ Us
(ii) L = c*E + UL
(iii) Cov( E,I )
a)
Veranschauliche die Beziehungen anhand eines Pfaddiagramms.
Folgende Daten wurden zur Analyse übermittelt:
Var( E ) = 7.6 Cov ( E,I ) = 2 a = .81 b = .21 c = .46
b) Berechne: Cov ( S,L )
Aufgabe 5
Wir betrachten die ersten 10 Personen der Studentenerhebung (siehe Nagl – Skript im
Anhang). Sie sind in unserem Beispiel die Population. Aus dieser Population wird nun
gezogen. Dabei ist X die Zufallsvariable „Alter der Person“ und Y „Ausbildung des Vaters“.
Beim einmaligen ziehen können nun das Alter der Person oder die Ausbildung des Vaters
betrachtet werden.
a)
Berechne: E(X)
b) Berechne: E(Y)
Nun wird 2mal gezogen (mit Zurücklegen).
Dabei ergeben sich die neuen Zufallsvariablen X und Y .
c)
Berechne: Cov( X , Y )
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 6
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
a)
Abhängig: T1; T2
Unabhängig: X; Y
b)
X
b
T1
a
T2
c
g
Y
c)
d
Cov(T1 , T2 )  b * d * Cov( X , Y )  b * d * g
Aufgabe 2
a)
Eine Scheinkorrelation ist dann vorhanden, wenn zwei Variablen (X und Y) kovariieren,
diese Kovarianz allerdings nur dadurch zustande kommt, dass X und Y von einer dritten
Variable (Z) abhängig sind.
So kann der Eindruck einer Beziehung zwischen X und Y entstehen, der nicht real
existiert. „Je mehr Feuerwehrmänner bei einem Einsatz zugegen sind (X), desto größer ist
der Schaden (Y). Beide Variablen hängen von der Größe des Brandes (Z) ab.
b)
0.3
X
0.041
Y
10
Z
5
Cov( X,Y ) = 0.3*0.041*Var(Z) = 0.0123
Aufgabe 3
a)
a
b
X
Y
Z
Ux
Uy
b) Cov( X,Y ) = a*Var( X ) = 1.34*7.68 = 10.2912
c) Cov( Z,X ) = b*a*Var(X) = 4.6*1.34*7.68 = 47.33952
d) Cov( Z,Y ) = b*Var(Y) = b*a²*Var(X) = 63.4349
Aufgabe 4
a)
a
I
S
US
L
UL
b
c
E
b) Cov( S,L ) = b*c*Var(E) +a*c*Cov(I,E) = 1.47936
Aufgabe 5
a)
E( X ) 
22  24  21  22  24  21  21  22  22  24
 22.3
10
b)
E (Y ) 
2  7  3  2 1 2  2 111
 2.2
10
c)
Cov( X , Y ) 
1
* (Cov( X 1 , Y1 )  Cov( X 2 , Y2 )  Cov( X 1 , Y2 )  Cov( X 2 , Y1 ))
4
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Übungsblatt 5
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
a)Berechne folgende Varianz: Var(5X – 2Y)
b) Wie verändert sich die Varianz, wenn X und Y unabhängige Variablen sind
c) Berechne: Cov(X+Y, X+Z)
Aufgabe 2
Angenommen X, Y, und Z sind unabhängige Zufallssvariablen mit einer Standardabweichung
von je 1. Berechne:
a.) Var(2*X + 3*Y – Z)
b.) Cov(X – 2*Y, 3*X + Y + 2*Z)
Aufgabe 3
Zeige, dass gilt:
a.) Cov( X - Y , X ) = Var(X) - Cov(X,Y)
b.) Cov( a +bX + cY, X) = b*Var(X) + c*Cov(X,Y)
Aufgabe 4
Es gilt:
X1 = T + U1 und X2 = T + U2
wobei U1 und U2 zufällige Störgrößen sind die mit keinem der anderen Werte kovariieren.
Berechne:
a.) Cov(X1 + X2 , T)
b.) Cov(X1,X2)
Aufgabe 5
Ein Intelligenztest für Kinder besteht aus 5 Untertests. Eine Faktorenanalyse ergab zwei
Faktoren. Folgende Tabelle zeigt die Faktorenladungen; die Faktoren und die X-Variablen
seien standardisiert:
Faktor 1
Faktor 2
Wortverständnis
0,05
0,8
Nachsprechen
0,02
0,75
Merken
0,4
0,3
Rechnen
0,9
0,03
Zählen
0,7
0,1
Stelle die Faktorladungen der beiden Faktoren auf die einzelnen Tests in einem Dir bekannten
Diagramm dar (beide Faktoren seien orthogonal). Berechne unter der Annahme dass alle
Variablen eine Standardabweichung von 1 haben:
a.) Cov(F1,X3)
b.) Cov (F2, X5)
c.) Cov(X3, X5)
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 5
Aufgabe 1
a) Var(5X – 2Y) = 25*Var(X) + 4*Var(Y) – 20*Cov(X,Y)
b) Var(5X – 2Y) = 25*Var(X) + 4*Var(Y)
c) Cov(X+Y, X+Z) = Var(X) + Cov(X,Z) + Cov(X,Y) + Cov(Y,Z)
Aufgabe 2
a)
Var(2*X + 3*Y – Z) = 4*Var(X) + 9*Var(Y) + Var(Z) = 4 + 9 + 1 = 14
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
b)
Cov(X – 2*Y, 3*X + Y + 2*Z) =
3*Var(X) + Cov(X,Y) + 2*Cov(X,Z) – 6*Cov(X,Y) – 2*Var(Y) – 4*Cov(Y,Z) =
3-2=1
Aufgabe 3
a)
Cov( X - Y , X ) = Cov(X,X) - Cov(Y,X)= Var (X) - Cov(Y,X)
b)
Cov( a +bX + cY, X) = b*Var(X) + c*Cov(X,Y)
Aufgabe 4
a)
Cov(X1 + X2 , T) = 2*Var(T)
b)
Cov(X1,X2) = Var(T)
Aufgabe 5
a)
Cov(F1,X3) = 0,4
b)
Cov(F2, X5) = 0,1
c)
Cov( X3, X5) = 0,31
Übungsblatt 4
(Zusatzblatt - wird nicht besprochen. Bei Fragen E-Mail schreiben!)
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
Ein medizinisches Symptom S kann von zwei bekannten Krankheiten A und B hervorgerufen
werden (A ist selten und gefährlich, B ist häufig und harmlos), aber S kann auch bei
Menschen auftreten, die an keiner der beiden Krankheiten leiden (C).
Man kann nicht an A und B gleichzeitig erkrankt sein. Wenn das Symptom bei jemandem
auftritt, möchte man wissen, mit welcher Wahrscheinlichkeit er welche Krankheit hat bzw.
mit welcher Wahrscheinlichkeit er keine der beiden Krankheiten in sich trägt.
Kategorie Auftreten von S mit Wahrscheinlichkeit
A
0.5
B
0.2
C
0.1
Die Erkrankungswahrscheinlichkeiten sind in folgender Tabelle dargestellt:
Kategorie
A
B
Erkrankung erfolgt mit
Wahrscheinlichkeit
0.01
0.15
Wie groß ist unter Zugrundelegung dieser Daten die Wahrscheinlichkeit, dass ein Mensch, der
Symptom S ausbildet, an A bzw. B erkrankt oder gar nicht erkrankt ist?
Aufgabe 2
Eine Vorlesung wird von 16 männlichen und 64 weiblichen Studenten besucht. Die
Häufigkeit korrekter Antworten wurde untersucht. Die Hälfte der Antworten, die von
männlichen Studenten gegeben wurde, war richtig. Bei den Studentinnen waren 30 % der
Antworten falsch.
a) Zeichnet einen Wahrscheinlichkeitsbaum oder eine Kreuztabelle.
b) Wie groß ist insgesamt die Wahrscheinlichkeit, dass eine Antwort falsch ist?
Es wurde eine richtige Antwort gegeben:
c) Wie groß ist die Wahrscheinlichkeit, dass diese Antwort von einem männlichen Studenten
gegeben wurde?
d) Wie hoch ist die Wahrscheinlichkeit, dass eine Studentin diese Antwort gab?
Aufgabe 3
Gegeben seien folgende Wahrscheinlichkeiten. Entscheide, ob die unten stehenden Aussagen
richtig oder falsch sind!
Bedingte
Wahrscheinlichkeiten
0.8
0.4
B1
A
Gemeinsame
Wahrscheinlichkeit
0.7
0.3
0.7
0.2
c
B1
0.3
0.2
0.1
0.6
A
B1
0.8
c
0.2
0.9
c
B1
0.8
B2
0.224
B2
c
0.096
B2
0.056
B2
c
0.024
B2
0.012
B2
c
0.048
B2
0.108
c
0.432
B2
a) A und B1 sind voneinander unabhängige Ereignisse.
b) Unter Bedingung A sind die Ereignisse B1 und B2 sind voneinander abhängig.
c) Die Ereignisse B1 und B2 sind immer voneinander unabhängig.
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 4
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
Wahrscheinlichkeitsbaum:
oder Kreuztabelle (zeilenbedingte Anteile):
A
B
C
S
0,5
0,2
0,1
S
0,5
0,8
0,9
0,01
0,15
0,84
1
Berechnung mit Satz von Bayes:
P( A | S ) 
P( S | A)  P( A)
0,5 * 0,01

 0,042
P( S | A) * P( A)  P( S | B) * P( B)  P( S | C ) * P(C ) 0,5 * 0,01  0,2 * 0,15  0,1 * 0,84
P( B | S ) 
P( S | B)  P( B)
0,2 * 0,15

 0,252
P( S | A) * P( A)  P( S | B) * P( B)  P( S | C ) * P(C ) 0,5 * 0,01  0,2 * 0,15  0,1 * 0,84
P(C | S ) 
P( S | C )  P(C )
0,1 * 0,84

 0,706
P( S | A) * P( A)  P( S | B) * P( B)  P( S | C ) * P(C ) 0,5 * 0,01  0,2 * 0,15  0,1 * 0,84
Aufgabe 2
M = männlich
W = weiblich
R = richtig
F = falsch
a) Wahrscheinlichkeitsbaum:
0,5
R
M
0,2
0,5
0,8
F
0,7
R
0,3
F
W
Kreuztabelle (zeilenbedingte Anteile):
M
W
R
0,5
0,7
F
0,5
0,3
0,2
0,8
1
b)
P( F )  P( FM )  P( FW )  P( F | M ) * P( M )  P( F | W ) * P(W )  0,5 * 0,2  0,3 * 0,8  0,34
c)
P( M | R) 
0,5 * 0,2
 0,1515
0,5 * 0,2  0,7 * 0,8
d)
P(W | R) 
0,7 * 0,8
 0,8484
0,7 * 0,8  0,5 * 0,2
Aufgabe 3
a) falsch!
b) falsch! Gegeben A, sind die Ereignisse B1 und B2 voneinander unabhängig.
c) falsch! Die Ereignisse B1 und B2 sind nur lokal stochastisch unabhängig.
Übungsblatt 3 [email protected]; [email protected]
Statistik 1b
Aufgabe 1
In einem psychologischen Forschungsprojekt sollen die Zufallsvariablen „allgemeine
Intelligenz“(X), „Sozialkompetenz“ (Y) und „sprachliche Fertigkeiten“ (Z), deren
Realisationen in Punkten dargestellt werden, untersucht werden.
In einer Urne befinden sich fünf Kugeln. Das Elementarereignis sei, eine Kugel zu ziehen.
Auf jeder der Kugeln ist die jeweilige Realisation der Zufallsvariablen X vermerkt.
Aus vorherigen Untersuchungen weiß man, dass sowohl Sozialkompetenz als sprachliche
Fertigkeiten linear von der allgemeinen Intelligenz abhängig sind.
Y = 50 + 0.5 X
Z = 59 + 0.4 X
Nachfolgend sind die in dem Test zur allgemeinen Intelligenz erreichten Punkte tabellarisch
dargestellt.
Kugel i
Erreichte IQ-Punkte
1
98
2
103
3
107
4
96
5
93
1.1 Berechnen Sie die durchschnittlichen Realisationen der Zufallsvariablen (X), (Y) und
(Z). Welche zwei statistischen Möglichkeiten stehen dir für die Erwartungswerte bei
der Sozialkompetenz und bei den sprachlichen Fertigkeiten zur Verfügung? Erstelle,
falls nötig, eine Tabelle mit den entsprechend erreichten IQ-Punkten.
1.2 Welche Einschätzung bezüglich der Streuung von Y und Z können sie ausschließlich
anhand der Linearkombinationen treffen? Welche Zufallsvariable sollte stärker
streuen? Berechnen Sie die Varianz aller drei Fertigkeiten.
1.3 Sind Y und Z unabhängig? Welches statistische Maß muss hierfür herangezogen
werden?
Aufgabe 2
In einer Urne befinden sich sechs Kugeln, auf denen sowohl die Realisation der
Zufallsvariable „Größe“ als auch die Realisation der Zufallsvariable „Alter“ vermerkt ist. Das
Elementarereignis sei, eine der Kugeln zu ziehen.
Teilnehmer
nr.i
Größe in
cm (X)
Alter (A)
1
2
3
4
5
6
181
182
180
179
186
184
28
30
32
37
38
39
2.1 Wie groß sind die Teilnehmer durchschnittlich?
2.2 Wie groß ist die Varianz?
Durch den rapiden Muskelaufbau in der Trainingsphase haben Leistungssportler auch nach
Jahren noch – unabhängig von ihrer sonstigen Konstitution – 40 Kg Körpermasse, die aus
Muskeln besteht. Ihr restliches Gewicht (Y) ist linear mit dem Faktor 0.25 von ihrer
entsprechenden Größe abhängig.
2.3 Wie lassen sich die Angaben aus dem Text in eine mathematische Gleichung
umformulieren?
2.4 Wie schwer sind die Teilnehmer durchschnittlich? Berechne, falls nötig, die
jeweiligen Gewichte der Sportler. Wie groß ist die Varianz?
Die maximale Herzfrequenz ( Z ) kann mit der Formel: 210 – 0.5* Alter – 0.11* Gewicht
berechnet werden.
2.5 Lege eine Tabelle mit den erforderlichen Daten an!
2.6 Berechne die durchschnittliche maximale Herzfrequenz der Sportler aus! Welche zwei
statistischen Möglichkeiten stehen dir dabei zu Verfügung?
2.7 Lege eine Tabelle an und berechne die Covarianz zwischen Alter und Gewicht.
2.8 Berechne die Varianz der Linearkombination auf zwei Arten.
Beachte die Formel zur Berechnung der Varianz einer Differenz! s. Skript
Übungsblatt 3 Lösungen
Aufgabe 1
1.1 E ( X ) = 99.4
E ( Y ) = 99.7 Herkömmlicher Weg oder E ( Y = a + b*X ) = a + b* E ( X ) E ( Y = 50 +
0.5*X ) = 50 + 0.5 * E ( X ) E ( Z ) = 98.76
Kugel i
1
Erreichte IQ-Punkte x 98
Soz.kompetenzpunkte y99
Sprachpunkte z
98.2
2
103
101.5
100.2
3
107
103.5
101.8
4
96
98
97.4
5
93
96.5
96.2
1.2 0.5² > 0.4² -> Streuung der Sozialkompetenz ist größer.
Var ( X ) = 25.04
Var ( Y ) = 6.26
)]
Var ( Z ) = 4.0064
[ Var ( a + b*X ) = b² * Var ( X ) ] oder [ Var ( Y ) = E ( Y² ) – E² ( Y
1.3 Nein, sie sind abhängig.
Cov ( Y,Z ) = 5.008
Aufgabe 2
2.1 E( X )= 182
2.2 Var ( X ) = 5.66 [ Var ( X ) = E ( X² ) – E² ( X ) ]
2.3 y = 40 + 0.25*x
2.4 E ( Y ) = 85.5
Kugel i
Gewicht in
kg (y)
1
85.25
[ E ( a + bX ) = a + bE ( X ) ]
2
85.5
3
85
4
84.75
5
86.5
6
86
Var ( Y ) = 0.35 [ Var ( a + bX ) = b² Var ( X ) ] oder s. 1.2
2.6 E ( Z ) = 183.595
Möglichkeiten: Erwartungswert einer Linearkombination oder herkömmlicher Weg.
2.7
0.5 * A
0.11* Y
0.5*A 0.5² * Var ( A )
0.5* 0.11* Cov ( A,Y )
0.11*Y 0.11*0.5 * Cov ( A,Y ) 0.11² * Var ( Y )
Cov ( A,Y ) = 1.125 [ Cov ( A,Y ) = E ( AY ) – E ( A )* E ( Y ) ]
2.8 Var ( Z ) = E ( Z² ) – E² ( Z ) = 4.544
Var ( a - b1*X – b2 * Y ) = b1²*Var ( A ) + b2² * Var ( Y ) + 2 b1*b2*Cov ( AY )
= 0.5² 17.666 + 0.11² 0.35 +2*0.5*0.11* 1.125
= 9.960985
Übungsblatt 2
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
0,01% der 20-30-jährigen heterosexuellen deutschen Männer sind HIV-positiv.
Wenn ein Mann infiziert ist, fällt ein bewährter HIV-Test zu 99,8% positiv aus.
Lässt sich ein gesunder Mann testen, fällt der Test zu 0,01% positiv aus.
a) Trage in folgende Tabelle die zeilenbedingten Anteile ein:
A  tatsächlicher Status: HIV positiv
Ac = tatsächlicher Status: HIV negativ
B c  Testergebnis negativ
B  Testergebnis positiv
B
Bc
A
Ac
b) Zeichne einen Wahrscheinlichkeitsbaum. Wo stehen die bedingten Wahrscheinlichkeiten,
wo die gemeinsamen Wahrscheinlichkeiten.
c) Sind A und B abhängig? Begründe.
d) Wie groß ist die Wahrscheinlichkeit, dass ein Mann tatsächlich infiziert ist, wenn der Test
ein positives Ergebnis liefert?
Aufgabe 2
70% der Studenten haben sich gut auf die Prüfung vorbereitet. Von diesen Studenten haben
nur 10% Angst vor Prüfungen. 30% aller Studenten haben Prüfungsangst.
a) Wie viel Prozent der Studenten, die sich schlecht vorbereitet haben, haben Prüfungsangst.
b) Wie hoch ist der Anteil der Studenten, die sich schlecht vorbereitet haben und keine Angst
vor Prüfungen haben?
c) Wie groß ist die Wahrscheinlichkeit, dass sich jemand gut vorbereitet hat, unter der
Bedingung, dass er keine Prüfungsangst hat?
d) Wie könnte ein Wahrscheinlichkeitsbaum aussehen, wenn die beiden Merkmale
(Vorbereitung und Prüfungsangst) voneinander unabhängig wären?
Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Übungsblatt 1
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
Wie können folgende Mengenrelationen noch geschrieben werden?
a) A  
b) A  Ø
c) A  Ø
d) Ø
e) A  B
f) ( Ac )
g) A  A
Aufgabe 2
Unter welcher Bedingung ist  A  B  B  A ?
Aufgabe 3
Löse die Klammern auf, indem du die entsprechenden Gesetze anwendest:
a) E  ( F  G )
b) E  F  G  H 
Aufgabe 4
Zeige anhand der dir bekannten Gesetze oder anhand von Mengenbildern, dass Folgendes gilt
(für E, F, G in Ω):
a) E  F  E  F
b) E  F  E  F
Aufgabe 5
Vereinfache:
a) E  F  G  E  F  G 


b) E  F  G  E  F  G 
Aufgabe 6
Zeichne für folgende Ereignisse Mengenbilder:
a) C  B
b) A  B
c) B  C
d) B  A
g) A  B


l) A  B  C
h) A  B
i) C  B
m) A  B  C
j) C  B  A
n) A  B  C
e) A C
f) B  C  A
k) C  A  B
Aufgabe 7
Es soll das Verhältnis folgender Ereignisse untersucht werden:
A: Geschlecht ist männlich
B: Nichtraucher
C: Psychologiestudent
Nun werden fünf Forscherteams losgeschickt. Stelle die Beziehungen in Mengenbildern dar.
Welche Schlüsse könnte man aus den jeweiligen Ergebnissen ziehen?
(T1) C  A
(T2) A  B  C


(T3) A  B  C
(T4) C  B  A
(T5) A  B  C
Aufgabe 8
Ein fairer Würfel wird zwei Mal geworfen. Es interessiert die Summe der Augenzahlen.
Beschreibe...
a) den Gesamtereignisraum.
b) das Ereignis A (Die Summe ist gerade).
c) Das Ereignis B (Die Summe ist eine Primzahl).
d) Das Ereignis C (Die Summe ist kleiner als 8).
e) A C
f) B  C
g) A  B
h) wie der Gesamtereignisraum aus den Ereignissen A, B und C dargestellt werden kann.
Aufgabe 9
In einem Zufallsexperiment seien A und B paarweise disjunkte Ereignisse.
Mit Hilfe von p  P A und q  PB  sind die Wahrscheinlichkeiten für folgende Ereignisse
zu ermitteln:
a) P A  B 

f) P A  B


b) P A  B

g) P A  B

c) P A  B

h) PB  A

d) P A  B


e) P A  B

Fragen und Anmerkungen bitte an:
[email protected]
[email protected]
Lösungen zu Übungsblatt 1
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
a) A
b) A
c) Ø
d) Ω
e) A B c
f) A
g) Ø
Aufgabe 2
Dies gilt, wenn B eine Teilmenge von A ist: B  A
(das schließt auch folgendes ein: A  B und B   )
Aufgabe 3
a) ( E  F )  ( E  G )  Distributivgesetz
b) ( E  F )  ( E  G )  ( E  H )  Distributivgesetz
Aufgabe 4
a) 1. DeMorgan's Gesetz für Schnitte: ( E  F ) c  E c  F c
2. Mengenbild:
für beide Seiten der Gleichung
ergibt sich dieses Mengenbild
b) 1. DeMorgan's Gesetz für Vereinigungen: ( E  F ) c  E c  F c
2. Mengenbild:
für beide Seiten der Gleichung
ergibt sich dieses Mengenbild
Aufgabe 5
a) F  G
b) Ø
Aufgabe 6
a)
b)
c)
d)
e)
f)
i)
j)
m)
n)
g)
k)
h)
l)
Aufgabe 7
(T1)
(T2)
 Nur Frauen studieren Psychologie
 ein Teil aller Frauen studiert Psychologie
 wenn jmd. Psycholgie studiert, dann ist er eine Frau
 Keine Männer studieren Psychologie
 jmd. ist männlich, aber nicht zugleich Psychologiestudent UND
Nichtraucher
 d.h.: wenn ein Mann Psychologie studiert, dann raucht er
(T3)
 alle Untersuchngspersonen waren rauchende, männliche
Psychologiestudenten
(T4)
 alle Personen waren Männer oder Frauen, die nicht rauchen und
Psychologie studieren
(T5)
 weibliche rauchende Psychologiestudenten
Aufgabe 8
a)
b)
c)
d)
e)
f)
g)
h)
Ω = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
A = {2, 4, 6, 8, 10, 12}
B = {2, 3, 5, 7, 11}
C = {2, 3, 4, 5, 6, 7}
A C  {2, 3, 4, 5, 6, 7, 8, 10, 12}
B C  {2, 3, 5, 7}
A  B  {2}
A B Cc
Aufgabe 9
a) p  q
b) 1  q
c) 1  p
d) 1
e) p
f) 1  p
g) p h) q
Lösungen zu Übungsblatt 2
Statistik 1b
Sommersemester 2008
Doz.: Dr. Willi Nagl
Aufgabe 1
a)
A
Ac
Bc
0,002
0,9999
B
0,998
0,0001
0,0001
0,9999
b)
Bedingte W'ten
Gemeinsame W'ten
0,998
B
0,0000998
0,002
Bc
0,0000002
0,0001
B
0,00009999
Bc
0,99980001
A
0,0001
0,9999
Ac
0,9999
c)
Ja, A und B sind abhängig!
Bei stochastischer Unabhängigkeit müsste folgendes erfüllt sein:
P(A) = P(A|B) oder P(A|B) = P(A|Bc) oder P(AB) = P(A)*P(B)
d)
Satz von Bayes:
P( Ai | B ) 
P( A | B ) 
P( B | Ai ) P( Ai )
P( B | A1 ) P( A)    P( B | Am ) P( Am )
0,998 * 0,0001
= 0,4995
0,998 * 0,0001  0,0001 * 0,9999
Wenn der Test ein positives Ergebnis liefert, dann beträgt die Wahrscheinlichkeit, dass der
Mann auch tatsächlich infiziert ist etwa 50%.
Aufgabe 2
a) 76,667 %
b) 0,9
c) 0,07
d) Beispiel für eine mögliche Antwort:
A : gut vorbereitet
Ac : schlecht vorbereitet
B : Angst
Bc : keine Angst
0,1
B
A
0,7
0,3
0,9
Bc
0,1
B
0,9
Bc
Ac
Herunterladen