Aufgabe 1

Werbung
Vertiefungsaufgaben
Aufgabe 1
Ihnen ist folgende Graphik/Tabelle gegeben:
B/A
Afrika
Asien
Amerika
Australien
Leicht
23
18
27
35
Mittel
19
13
18
15
Welche Art von Merkmal ist A? qualitativ/komparativ/quantitativ
Geben Sie folgende Häufigkeiten an:
f (b4 | a1 ) , n(a2 )
schwer
4
4
3
5
Vertiefungsaufgaben
Aufgabe 1
Ihnen ist folgende Graphik/Tabelle gegeben:
B/A
Afrika
Asien
Amerika
Australien
Leicht
23
18
27
35
Mittel
19
13
18
15
schwer
4
4
3
5
Welche Art von Merkmal ist A? qualitativ/komparativ/quantitativ
Geben Sie folgende Häufigkeiten an:
f (b4 | a1 ) , n(a2 )
Hier erinnere man sich an die bekannten Formeln:
f (b4 | a1 ) 
f (b4 ; a1 ) n(b4 ; a1 )
35


 0,3398
f (a1 )
n(a1 )
23  18  27  35
n(a 2 )  19  13  18  15  65
Hierfür vergleiche man auch die zugehörige ExcelTabelle.
Geben Sie folgende Häufigkeiten an und interpretieren Sie diese:
f ( a 2 | b4 )
f (b4 | a 2 )
f (b3 | a3 )
Auch hier verwende man die bekannten Formeln:
f (a 2 | b4 ) 
n(a 2 ; b4 )
15

n(b4 )
35  15  5
f (b4 | a 2 ) 
n(a 2 ; b4 )
15

n( a 2 )
19  13  18  15
f (b3 | a3 ) 
n(a3 ; b3 )
3

n( a 3 )
4 435
Hierfür vergleiche wieder die zugehörige Exceltabelle.
Wählen Sie aus: Die beiden Merkmale sind: statistisch unabhängig/nichtunabhängig/abhängig.
Die Merkmale sind statistisch nicht unabhängig. Dies überprüft man, in dem für einen Eintrag in der
Kontingenztabelle die hypothetische gemeinsame Häufigkeit berechnet und feststellt, dass er mit dem
tatsächlichen Wert nicht übereinstimmt.
Hier erinnere man sich an die bekannten Formeln:
f (b4 | a1 ) 
f (b4 ; a1 ) n(b4 ; a1 )
35


 0,3398
f (a1 )
n(a1 )
23  18  27  35
n(a 2 )  19  13  18  15  65
Hierfür vergleiche man auch die zugehörige ExcelTabelle.
Geben Sie folgende Häufigkeiten an und interpretieren Sie diese:
f (a 2 | b4 )
f (b4 | a 2 )
f (b3 | a3 )
Auch hier verwende man die bekannten Formeln:
f (a 2 | b4 ) 
n(a 2 ; b4 )
15

n(b4 )
35  15  5
f (b4 | a 2 ) 
n(a 2 ; b4 )
15

n( a 2 )
19  13  18  15
f (b3 | a3 ) 
n(a3 ; b3 )
3

n( a 3 )
4 435
Hierfür vergleiche wieder die zugehörige Exceltabelle.
Wählen Sie aus: Die beiden Merkmale sind: statistisch unabhängig/nichtunabhängig/abhängig.
Die Merkmale sind statistisch nicht unabhängig. Dies überprüft man, in dem für einen Eintrag in der
Kontingenztabelle die hypothetische gemeinsame Häufigkeit berechnet und feststellt, dass er mit dem
tatsächlichen Wert nicht übereinstimmt.
Aufgabe 2
In Anlage (siehe Exceltabelle)
f ( a1 | b2 )
Geben Sie folgende Häufigkeiten an:
f ( a1 ; b2 )
n(a3 )
f ( a1 )
Dies geschieht genauso wie in der letzten Aufgabe.
Berechnen Sie mithilfe von geeigneten Maßzahlen die Lage und die Streuung beider Merkmale und
vergleichen Sie diese.
Modus:
Merkmal A: a2/a3
Merkmal B: b1/b3
Streuung: Merkmal A: 0,9988 Merkmal B: 0,9810
Vergleich: Obwohl beide Streuungen sehr hoch sind, ist die Streuung von A noch höher als die von B.
Prinzipiell relativ gleich.
Zwischen welchen Werten liegt das Herfindahl-Streumaß? Untergrenze – Obergrenze
0-(1-1/k) (normale)k= Anzahl der Merkmalsausprägungen
0-1 (normierte)
Berechnen Sie mithilfe eines geeigneten Maßes die Assoziation der Merkmale.
Hier ist das geeignete Maß die Cramersche Kontingenz. Die zugehörigen Formeln lauten:

2
AB
* 2
1 k l (nij  nij )
 
;V AB 
n i 1 j 1
nij*
 AB
min k  1, l  1
In Excel geht dies mithilfe von der Kontingenztabelle, der Indifferenztabelle und einer weiteren
Hilfstabelle. In der zugehörigen Exceltabelle sind die einzelnen Schritte erklärt. Wichtig ist die
Normierung am Ende, sodass Maßzahlen vergleichbar werden.
Das normierte Maß liegt auch stets zwischen 0 und 1, die Quadrierung der Differenz ist wichtig, damit
sich gegengleichen Fehlern nicht gelingt sich auszugleichen. Die Lösung für die normierte Kontingenz
ist hier 0,1720
Aufgabe 3
Bei Ikea kann man für eine Schrankwand 5 verschiedene Grundelemente wählen. Sie wollen sich vier
Elemente für Ihre persönliche Schrankwand aussuchen. Dabei können Sie dasselbe Element auch
mehrmals benutzen.
Wie viele Möglichkeiten, Ihre Schrankwand zu gestalten, haben Sie?
Hier ist zu beachten, dass „mit Zurücklegen“ gezogen wird. Weiterhin ist die Reihenfolge der Element
wichtig, da die Schrankwand ja anders aussieht, wenn man die Element anders anordnet. Also ist es
„geordnet“. Also ist die Lösung 5^4. (Für jedes Element hat man 5 Möglichkeiten)
Wie hoch ist die Wahrscheinlichkeit, dass Sie viermal dasselbe Element auswählen?
Dementsprechend kann man viermal aussuchen und hat eine Wahrscheinlichkeit von 0,2=1/5, jeweils
ein Element zu wählen. Da das erste Element jedoch keiner Beschränkung unterliegt (wenn ich noch
keines ausgesucht habe, kann es auch nicht „falsch“ sein), kommt die Wahrscheinlichkeit erst beim
zweiten „Ziehen“ zur Geltung. Viermal dasselbe Element zu wählen, hat so also eine
Wahrscheinlichkeit von (1/5)^3=1/125.
Aufgabe 4
Ein Frucht- und Gemüsehändler verkauft Fruchttüten, bei denen man von außen nicht einsehen
kann, welche Variante es ist. In jede Tüte werden insgesamt fünf verschiedene Früchte gepackt. Der
Verkäufer hat 10 verschiedene Obstsorten im Angebot.
Wie viele mögliche Fruchttüten gibt es?
Ohne Zurücklegen, ungeordnet - also „=Kombinationen(10;5)“ in Excel eingeben.
Der Fruchthändler nummeriert die verschiedenen Sorten von Fruchttüten intern durch. Nehmen Sie
an, es gibt 100 verschiedene Fruchttüten. Wie viele Möglichkeiten, für den Kindergeburtstag ihres
Kindes 25 Tüten einzukaufen, haben Sie?
Mit Zurücklegen, ohne Ordnung. Also „=Kombinationen(100+25-1;25)“
Aufgabe 5
In den 5 Jahrgängen einer Hauptschule wird pro Jahrgang (100 Schüler) jeweils ein
Jahrgangssprecher gewählt. Wie viele verschiedene Delegationen könnten zur städtischen
Schülervertretung gesandt werden?
Hier geht es schneller, wenn man sich das Schritt für Schritt überlegt: Pro Jahrgang gibt es 100
Möglichkeiten einen Jahrgangssprecher zu wählen. Also: 100*100*100*100*100
Aufgabe 6
Betrachten wir ein Hotel, in dem es Einzel-und Doppelzimmern gibt, die sonst aber alle gleich sind. Es
gibt 52 Einzelzimmer und 48 Doppelzimmer. Die Zimmer werden versuchsweise per Zufallsgenerator
und immer nur für einen Tag vergeben.
Wenn ein Gast sich nun ein Zimmer wünscht, wie hoch ist die Wahrscheinlichkeit, dass er ein
Doppelzimmer bekommt? Welcher Verteilung muss hier verwendet werden?
Bernoulli Verteilung, p=48/100
Wie hoch ist die Wahrscheinlichkeit, dass am selben Tag von 10 Gästen 5 Gäste ein Doppelzimmer
erhalten? Welche Verteilung muss hier beachtet werden?
Hypergeometrische Verteilung, N=100, N1=48, n=10 – dann 5 in das mittlere Feld eintragen und in
dem darunter ablesen.
Wie hoch ist die Wahrscheinlichkeit, wenn diese 10 Gäste an 10 hintereinander folgenden Tagen im
Hotel ankommen, dass 5 davon ein Doppelzimmer bekommen. Welche Verteilung muss hier
beachtet werden?
Binomialverteilung, n=10, p=48/100, 5 in das mittlere Feld eingeben und darunter die
Wahrscheinlichkeit ablesen.
Sie stehen an einer Bushaltestelle. Alle zwei Stunden kommen hier durchschnittlich 25 Busse vorbei.
Wie hoch ist die Wahrscheinlichkeit, dass Sie in einer Stunde 5 Busse sehen? Wie hoch ist die
Wahrscheinlichkeit, dass Sie in einer halben Stunde mehr als 10 Busse sehen? Welche Verteilung
muss hier beachtet werden?
Poissonverteilung, die durchschnittliche Anzahl an Bussen auf die Zeitangabe der Frage umlegen, und
als Parameter eingeben. 5 in die Mitte, Wert darunter ablesen. 10 in die Mitte, rechten Wert ablesen.
Aufgabe 7
Ein Student hat eine Chance von 30% (Aufgrund von (nicht)Lernen und normaler Durchfallquote)
eine Klausur zu bestehen. Besteht er die Klausur, so liegt die Chance, dass er sein Studium erfolgreich
besteht, bei 70%. Besteht er die Klausur nicht, so wird er zu 30% das Studium abbrechen. Ein Jahr
später stellt man fest, dass er sein Studium abgebrochen hat. Mit welcher Wahrscheinlichkeit hat er
die Klausur nicht bestanden?
Baum aufzeichnen, P(nicht B|nicht A) berechnen. 0,7
Aufgabe 8
Der ständige Tollpatsch einer Heldentriologie ist die letzte Hoffnung des Helden, der in einem Kerker
eingesperrt ist. Der Tollpatsch steht vor drei Türen: Die erste führt zu vier Türen, von der eine fest
verschlossen ist und auch mit einem Dietrich nicht geöffnet werden kann, hinter zweien wartet das
Grauen auf ihn, hinter einer findet er den richtigen Weg zur Zelle des Helden. Die zweite Tür führt zu
drei Türen, von denen zwei zum Helden führen, eine jedoch in einem Abgrund führt. Die dritte Tür
öffnet den Weg zu zwei Türen. Eine führt in eine Zelle, die andere zur Zelle des Helden.
Wie hoch ist die Wahrscheinlichkeit, dass der Tollpatsch den Helden findet, wenn man davon
ausgeht, dass jede Tür dieselbe Wahrscheinlichkeit hat, vom Tollpatsch gewählt zu werden.
17/36 (Baum aufzeichnen, „gute“ Ergebnisse am Ende ablesen)
Aufgabe 9
Ein Blatt Papier, das fabrikgetreu hergestellt wird, soll 80g schwer sein. Die Fehler schwanken
gleichverteilt zwischen -5 g und 5g. Also stetige Gleichverteilung, Parameter 75 - 85
Wie hoch ist die Wahrscheinlichkeit, dass das Papier genau 83g schwer ist? 0; 1/11
Wie hoch ist die Wahrscheinlichkeit, dass das Papier zwischen 77g und 82g (inklusive) wiegt? 0,5;
6/11
Man nehme an, dass Messungen nur exakt auf Gramm möglich sind. Beantworten Sie beide Fragen
erneut. Diskrete Gleichverteilung, N=10+1=11
Aufgabe 10
Seien folgende Realisationen einer normalverteilten Zufallsvariable gegeben:
1
15
2
78
3
54
4
26
5
38
6
83
7
25
8
11
Schätzen Sie die Parameter der Verteilung.
Normalverteilung, also Mittelwert und Standardabweichung berechnen, das geht mit „=Mittelwert()“
und „=Varianz()“, bzw. „=Wurzel(Varianz())“
Nehmen Sie an, der Erwartungswert läge bei 50 Jahren und die Standardabweichung bei 15 Jahren.
Geben Sie ein 2sigma Schwankungsintervall und die Wahrscheinlichkeit, dass X innerhalb dieses
Intervalls liegt, an.
Ein ksigma Schwankungsintervall berechnet man mit „=Mittelwert-k*Standardabweichung“ für die
Untergrenze und „=Mittelwert+k*Standardabweichung“ für die Obergrenze. Also hier [20,80]. Für die
Wahrscheinlichkeit in pqrs Normalverteilung mit den angegebene Parametern. Dann in die Mitte 80
eingeben, den linken Wert ablesen(0,9772) , dann 20 eingeben, den linken Wert ablesen(0,0228) und
dann den ersten Wert – den zweiten Wert (=0,9544) rechnen.
Berechnen Sie den Median, sowie beide Quartile.
Zweiten Reiter in pqrs nehmen und in das linke Feld, 0,25, 0,5 und 0,75 eingeben. Die Werte auf der xAchse ablesen. Das sind die Lösungen: 39,9; 50; 60,1
Nehmen Sie Stellung zu den folgenden Aussagen:
„Ist das 25% Quartil kleiner als 25, so ist die Verteilung breiter als normal.“ Richtig/falsch
„Ist der Median größer als der Mittelwert, gibt es viele Ausreißer nach unten.“ Richtig/falsch
Aufgabe 11
In 150 Befragungen zur Frage: „Soll Gauck der neue Bundespräsident werden?“ wurde 80 mal mit ja
gestimmt.
Schätzen Sie den Parameter p der Bernoulliverteilung. p=80/150
Geben Sie ein 95% Konfidenzintervall für den Parameter p an.
Formel ist wie folgt:

P X n  1 

2

X n (1  X n )
n
 p  X n  1 
2
X n (1  X n ) 
 1

n

Normalverteilung wird benutzt, da n>100 ist. Also berechnet man getrennt in der Exceltabelle Unterund Obergrenze. Lösungen: 0,4535; 0,6132
Die Bildzeitung stellt nun die Behauptung auf, dass mehr als die Hälfte aller Bürger Gauck als
Bundespräsidenten haben wollen. Seit kurzem müssen sie ihre populistischen Thesen jedoch belegen
können. Führen Sie also für Ihren Chefredakteur einen Hypothesentest zum Fehler Niveau von 0,05
durch, der die Behauptung absichern soll.
Geben Sie kritischen Wert und die Teststatistik an. Siehe Exceltabelle
Vollenden Sie folgenden Satz: Die Nullhypothese muss abgelehnt/beibehalten werden.
Geben Sie den p-Wert an. Siehe Exceltabelle
Wie würden sich die Aussagen verändern, wenn der Stichprobenumfang größer wäre?
Kritischer Wert: bleibt gleich/wird größer/wird kleiner
Teststatistik: bleibt gleich/wird größer/wird kleiner
p-Wert: bleibt gleich/wird kleiner/wird größer
Aufgabe 12
Seien folgende Werte für zwei Wertpapiere gegeben:
E[ R1 ]  6;VAr[ R1 ]  4; E[ R2 ]  4;Var[ R2 ]  8; Cov[ R1 , R2 ]  3
Ihr Portfolio besteht in Anteilen sowohl aus Wertpapier 1, als auch aus Wertpapier 2. Da Sie sonst
keine anderen Anleihen halten, ergibt sich ihr Portfolio also zu:
R p  g  R1  (1  g )  R2
Interpretieren Sie:
Wie ist Ihr Portfolio bei g=1 anzugeben: gemischt/nur Wertpapier 1/nur Wertpapier 2
Wie ist Ihr Portfolio bei g=0 anzugeben: gemischt/nur Wertpapier 1/nur Wertpapier 2
Wie ist Ihr Portfolio bei g=0,4 anzugeben: gemischt/nur Wertpapier 1/nur Wertpapier 2
Die negative Kovarianz sagt aus, dass bei steigender Rendite von Wertpapier 1:
Wertpapier 2 steigt/Wertpapier 2 fällt/Wertpapier 2 keine Veränderung erfährt
Berechnen Sie Risiko und erwarteten Ertrag Ihres Portfolios für folgende Zusammensetzungen:
g=0,4:
g=0,6:
g=0,8
Da Sie ein risikoscheuer Investor sind, möchten Sie das Portfolio mit dem geringsten Risiko halten.
Finden Sie also die risikominimale Portfolioaufteilung g* und berechnen Sie sowohl die so
entstehende erwartete Rendite als auch das Risiko Ihres Portfolios.
g*=
;
E[Rp]=
; Var[Rp]=
;
Nehmen Sie Stellung zu folgender Aussage:
„Wertpapier 1 ist sowohl in der Rendite höher, als auch im Risiko geringer als Wertpapier 2. Also ist
es nicht sinnvoll, auch Wertpapier 2 zu halten.“ Falsch/richtig
Die Lösungen sind in der Exceltabelle zu finden.
Aufgabe 13(Schriftlich)
Seien folgende Werte für zwei Wertpapiere gegeben:
E[ R1 ]  8;VAr[ R1 ]  9; E[ R2 ]  9;Var[ R2 ]  8; Cov[ R1 , R2 ]  5
Ihr Portfolio besteht in Anteilen sowohl aus Wertpapier 1, als auch aus Wertpapier 2. Da Sie sonst
keine anderen Anleihen halten, ergibt sich ihr Portfolio also zu:
R p  g  R1  (1  g )  R2
Berechnen Sie die minimale Portfolioaufteilung g* und zeichnen sie ein μ-σ-Diagramm.
g*=0,4815
Aufgabe 14
Die Normalverteilung der Lebensdauer von Glühbirnen sei normalverteilt. Der Hersteller möchte eine
Brenndauer von mind. 1000 Stunden auf der Verpackung angeben. Eine Stichprobe von 50
Glühbirnen ergibt ein Stichprobenmittel von 995 Stunden und eine Stichprobenvarianz von 40. Muss
sich der Hersteller von seinem Wunsch verabschieden? Führen Sie hierzu einen Hypothesentest zum
Niveau α=0,10 durch.
Was ist die Einheit der Stichprobenvarianz? Keine/Stunden/Stunden²/Wurzel(Stunden)
H0: μ =/<=/>=/!= 1000
H1: μ=/<=/>=/!= 1000
Kritischer Wert: 1,299
Teststatistik: -5,5901
Die Nullhypothese muss abglehnt/beibehalten werden.
Nehmen Sie an, die Standardabweichung sei nun fest mit 7 Stunden bekannt. Muss der Hersteller
seine Entscheidung nun ändern?
Kritischer Wert: 1,282
Teststatistik: -5,0508
Die Nullhypothese muss abgelehnt/beibehalten werden.
Aufgabe 15
Gegeben seien folgende Werte einer Holzfabrik für die Länge ihrer hergestellten Bretter:
1
2,04
2
2,07
3
1,93
4
2,01
5
1,95
6
1,92
7
2,14
8
2,1
9
1,99
Die Länge der Bretter ist gleichverteilt. Schätzen Sie die Parameter a,b der Verteilung.
Seien nun folgende Werte für die Wartezeit in Minuten auf den Zug am Bahnhof gegeben:
1
5
2
10
3
1
4
15
5
7
6
8
7
2
8
9
Welche Verteilung beschreibt die Wartezeit auf einen Zug? Exponentialverteilung
Berechnen Sie Stichprobenvarianz und Stichprobenmittel. 7,2 und 18,6222
Schätzen Sie den Parameter der Verteilung:
Parameter der Verteilung ist der Kehrwert des Mittelwerts: 0,1389
9
11
10
4
Aufgabe 16
Gegeben sind folgende persönliche Messwerte eines sehr auf ihr Gewicht fokussierten Mädchens:
X=Gewicht
Y= Anzahl der Männer, die sie am Tag ansprechen.
50
10
48
12
52
8
53
9
51,5
10
47,5
5
49
9
50,5
13
51
15
55
12
Das Mädchen möchte nun wissen, wie ihr Gewicht mit der Anzahl der Männer zusammenhängt.
Welche Art von Merkmal liegt hier für X vor? Qualitativ/quantitativ/komparativ
Führen Sie eine Regressionsanalyse durch. a0= -7,7385
a1=0,3554
Geben Sie weiterhin das Bestimmtheitsmaß der Regression an: R²= 0,0826
Nehmen Sie Stellung zur folgenden Aussage:
„Wenn der Wert von a1 negativ ist, dann muss das Mädchen abnehmen, damit es mehr Männer
ansprechen“ richtig
Aufgabe 17
Der ewige Tollpatsch muss über einen Fluss gelangen. Hierbei hat er 12 Wege zur Auswahl. Ein Weg
führt ihn sicher ans andere Ufer. 6 Wege führen irgendwann auf ein als Baumstamm getarntes
Krokodil. 3 Wege führen zur Attacke durch Skorpione. Ein Angriff durch Skorpione ist zu 40% tödlich,
ein Angriff durch Krokodile zu 30%. Wie hoch ist die Wahrscheinlichkeit, dass der Tollpatsch durch
eine Tierattacke stirbt?
Mit einer Wahrscheinlichkeit von ½ trifft er auf ein Krokodil und stirbt dann mit Wahrscheinlichkeit
von 0,3 – also 0,5*0,3. Bei Skorpionen kommt man genauso auf 0,25*0,4. Die Summe von beidem ist
dann die Lösung: 0,5*0,3+0,25*0,4
Aufgabe 18
Betrachten Sie die Zufallsvariable X „Preisänderung bei Produkt P“ und Y „Änderung des Absatzes von
Produkt P“, beide gemessen in Prozent. Für X und Y wurde die Regressionsgerade Y  a0  a1 X
geschätzt. Hierbei ergaben sich folgende Werte: a0  2,12; a1  0,86; R²  0,872
Zeichnen Sie die geschätzte Regressionsgerade. Interpretieren Sie die Koeffizienten und das
Bestimmtheitsmaß.
Wie lassen sich die Vorzeichen der Kovarianz und des Korrelationskoeffizienten aus den
Koeffizienten/dem Bestimmtheitsmaß ableiten? Vorzeichen entspricht dem Vorzeichen von a1
Welche Vorzeichen haben sie dann in diesem Fall? negativ
Wie ist der genaue Zusammenhang zwischen Bestimmtheitsmaß und Korrelationskoeffizienten?
Das Bestimmtheitsmaß ist das Quadrat des Korrelationskoeffizienten.
Aufgabe 19
Der Druck, mit dem ein Fußball bei einem Bundesligaspiel aufgepumpt ist, kann als normalverteilt
angesehen werden. Eine Stichprobe im Umfang von 12 Fußballlern weist ein Stichprobenmittel von
0,84 bar mit einer Stichprobenstandardabweichung in Höhe von 0,2 bar auf . Ein
Schiedsrichterassistent behauptet, dass mit einer maximalen Wahrscheinlichkeit für den ersten
Fehler von 0,05 der Luftdruck der Bälle unter 1 bar liegt.
Wie müssen die Hypothesen gewählt werden, wenn der Schiedsrichterassistent seine Behauptung
mittels eines statistischen Hypothesentests absichern will?
H0: μ>= 1 H1: μ<1
Was bedeuten 1. Und 2. Fehler im Allgemeinen und im Kontext der Aufgabenstellung?
Der erste Fehler bedeutet die Wahrscheinlichkeit, dass die Nullhypothese abgelehnt wird, obwohl sie
zutrifft. Genauso bedeutet der 2. Fehler die Wahrscheinlichkeit, die Alternativhypothese abzulehnen,
obwohl sie zutrifft.
In diesem Kontext bedeutet der erste Fehler die Wahrscheinlichkeit, dass behauptet wird, der Druck
läge unter einem Bar, obwohl dies nicht zutrifft. Beim zweiten Fehler, ist es die Wahrscheinlichkeit,
dass man annimmt, der Druck läge über einem Bar, obwohl er tatsächlich unter einem Bar liegt.
Für die realisierte Teststatistik ergibt sich t12=-2,771. Welche Testentscheidung ergibt sich daraus?
Die Nullhypothese wird abgelehnt.
Skizzieren Sie die Verteilung der Teststatistik und kennzeichnen Sie dabei den kritischen Bereich.
Herunterladen