Vertiefungsaufgaben Aufgabe 1 Ihnen ist folgende Graphik/Tabelle gegeben: B/A Afrika Asien Amerika Australien Leicht 23 18 27 35 Mittel 19 13 18 15 Welche Art von Merkmal ist A? qualitativ/komparativ/quantitativ Geben Sie folgende Häufigkeiten an: f (b4 | a1 ) , n(a2 ) schwer 4 4 3 5 Vertiefungsaufgaben Aufgabe 1 Ihnen ist folgende Graphik/Tabelle gegeben: B/A Afrika Asien Amerika Australien Leicht 23 18 27 35 Mittel 19 13 18 15 schwer 4 4 3 5 Welche Art von Merkmal ist A? qualitativ/komparativ/quantitativ Geben Sie folgende Häufigkeiten an: f (b4 | a1 ) , n(a2 ) Hier erinnere man sich an die bekannten Formeln: f (b4 | a1 ) f (b4 ; a1 ) n(b4 ; a1 ) 35 0,3398 f (a1 ) n(a1 ) 23 18 27 35 n(a 2 ) 19 13 18 15 65 Hierfür vergleiche man auch die zugehörige ExcelTabelle. Geben Sie folgende Häufigkeiten an und interpretieren Sie diese: f ( a 2 | b4 ) f (b4 | a 2 ) f (b3 | a3 ) Auch hier verwende man die bekannten Formeln: f (a 2 | b4 ) n(a 2 ; b4 ) 15 n(b4 ) 35 15 5 f (b4 | a 2 ) n(a 2 ; b4 ) 15 n( a 2 ) 19 13 18 15 f (b3 | a3 ) n(a3 ; b3 ) 3 n( a 3 ) 4 435 Hierfür vergleiche wieder die zugehörige Exceltabelle. Wählen Sie aus: Die beiden Merkmale sind: statistisch unabhängig/nichtunabhängig/abhängig. Die Merkmale sind statistisch nicht unabhängig. Dies überprüft man, in dem für einen Eintrag in der Kontingenztabelle die hypothetische gemeinsame Häufigkeit berechnet und feststellt, dass er mit dem tatsächlichen Wert nicht übereinstimmt. Hier erinnere man sich an die bekannten Formeln: f (b4 | a1 ) f (b4 ; a1 ) n(b4 ; a1 ) 35 0,3398 f (a1 ) n(a1 ) 23 18 27 35 n(a 2 ) 19 13 18 15 65 Hierfür vergleiche man auch die zugehörige ExcelTabelle. Geben Sie folgende Häufigkeiten an und interpretieren Sie diese: f (a 2 | b4 ) f (b4 | a 2 ) f (b3 | a3 ) Auch hier verwende man die bekannten Formeln: f (a 2 | b4 ) n(a 2 ; b4 ) 15 n(b4 ) 35 15 5 f (b4 | a 2 ) n(a 2 ; b4 ) 15 n( a 2 ) 19 13 18 15 f (b3 | a3 ) n(a3 ; b3 ) 3 n( a 3 ) 4 435 Hierfür vergleiche wieder die zugehörige Exceltabelle. Wählen Sie aus: Die beiden Merkmale sind: statistisch unabhängig/nichtunabhängig/abhängig. Die Merkmale sind statistisch nicht unabhängig. Dies überprüft man, in dem für einen Eintrag in der Kontingenztabelle die hypothetische gemeinsame Häufigkeit berechnet und feststellt, dass er mit dem tatsächlichen Wert nicht übereinstimmt. Aufgabe 2 In Anlage (siehe Exceltabelle) f ( a1 | b2 ) Geben Sie folgende Häufigkeiten an: f ( a1 ; b2 ) n(a3 ) f ( a1 ) Dies geschieht genauso wie in der letzten Aufgabe. Berechnen Sie mithilfe von geeigneten Maßzahlen die Lage und die Streuung beider Merkmale und vergleichen Sie diese. Modus: Merkmal A: a2/a3 Merkmal B: b1/b3 Streuung: Merkmal A: 0,9988 Merkmal B: 0,9810 Vergleich: Obwohl beide Streuungen sehr hoch sind, ist die Streuung von A noch höher als die von B. Prinzipiell relativ gleich. Zwischen welchen Werten liegt das Herfindahl-Streumaß? Untergrenze – Obergrenze 0-(1-1/k) (normale)k= Anzahl der Merkmalsausprägungen 0-1 (normierte) Berechnen Sie mithilfe eines geeigneten Maßes die Assoziation der Merkmale. Hier ist das geeignete Maß die Cramersche Kontingenz. Die zugehörigen Formeln lauten: 2 AB * 2 1 k l (nij nij ) ;V AB n i 1 j 1 nij* AB min k 1, l 1 In Excel geht dies mithilfe von der Kontingenztabelle, der Indifferenztabelle und einer weiteren Hilfstabelle. In der zugehörigen Exceltabelle sind die einzelnen Schritte erklärt. Wichtig ist die Normierung am Ende, sodass Maßzahlen vergleichbar werden. Das normierte Maß liegt auch stets zwischen 0 und 1, die Quadrierung der Differenz ist wichtig, damit sich gegengleichen Fehlern nicht gelingt sich auszugleichen. Die Lösung für die normierte Kontingenz ist hier 0,1720 Aufgabe 3 Bei Ikea kann man für eine Schrankwand 5 verschiedene Grundelemente wählen. Sie wollen sich vier Elemente für Ihre persönliche Schrankwand aussuchen. Dabei können Sie dasselbe Element auch mehrmals benutzen. Wie viele Möglichkeiten, Ihre Schrankwand zu gestalten, haben Sie? Hier ist zu beachten, dass „mit Zurücklegen“ gezogen wird. Weiterhin ist die Reihenfolge der Element wichtig, da die Schrankwand ja anders aussieht, wenn man die Element anders anordnet. Also ist es „geordnet“. Also ist die Lösung 5^4. (Für jedes Element hat man 5 Möglichkeiten) Wie hoch ist die Wahrscheinlichkeit, dass Sie viermal dasselbe Element auswählen? Dementsprechend kann man viermal aussuchen und hat eine Wahrscheinlichkeit von 0,2=1/5, jeweils ein Element zu wählen. Da das erste Element jedoch keiner Beschränkung unterliegt (wenn ich noch keines ausgesucht habe, kann es auch nicht „falsch“ sein), kommt die Wahrscheinlichkeit erst beim zweiten „Ziehen“ zur Geltung. Viermal dasselbe Element zu wählen, hat so also eine Wahrscheinlichkeit von (1/5)^3=1/125. Aufgabe 4 Ein Frucht- und Gemüsehändler verkauft Fruchttüten, bei denen man von außen nicht einsehen kann, welche Variante es ist. In jede Tüte werden insgesamt fünf verschiedene Früchte gepackt. Der Verkäufer hat 10 verschiedene Obstsorten im Angebot. Wie viele mögliche Fruchttüten gibt es? Ohne Zurücklegen, ungeordnet - also „=Kombinationen(10;5)“ in Excel eingeben. Der Fruchthändler nummeriert die verschiedenen Sorten von Fruchttüten intern durch. Nehmen Sie an, es gibt 100 verschiedene Fruchttüten. Wie viele Möglichkeiten, für den Kindergeburtstag ihres Kindes 25 Tüten einzukaufen, haben Sie? Mit Zurücklegen, ohne Ordnung. Also „=Kombinationen(100+25-1;25)“ Aufgabe 5 In den 5 Jahrgängen einer Hauptschule wird pro Jahrgang (100 Schüler) jeweils ein Jahrgangssprecher gewählt. Wie viele verschiedene Delegationen könnten zur städtischen Schülervertretung gesandt werden? Hier geht es schneller, wenn man sich das Schritt für Schritt überlegt: Pro Jahrgang gibt es 100 Möglichkeiten einen Jahrgangssprecher zu wählen. Also: 100*100*100*100*100 Aufgabe 6 Betrachten wir ein Hotel, in dem es Einzel-und Doppelzimmern gibt, die sonst aber alle gleich sind. Es gibt 52 Einzelzimmer und 48 Doppelzimmer. Die Zimmer werden versuchsweise per Zufallsgenerator und immer nur für einen Tag vergeben. Wenn ein Gast sich nun ein Zimmer wünscht, wie hoch ist die Wahrscheinlichkeit, dass er ein Doppelzimmer bekommt? Welcher Verteilung muss hier verwendet werden? Bernoulli Verteilung, p=48/100 Wie hoch ist die Wahrscheinlichkeit, dass am selben Tag von 10 Gästen 5 Gäste ein Doppelzimmer erhalten? Welche Verteilung muss hier beachtet werden? Hypergeometrische Verteilung, N=100, N1=48, n=10 – dann 5 in das mittlere Feld eintragen und in dem darunter ablesen. Wie hoch ist die Wahrscheinlichkeit, wenn diese 10 Gäste an 10 hintereinander folgenden Tagen im Hotel ankommen, dass 5 davon ein Doppelzimmer bekommen. Welche Verteilung muss hier beachtet werden? Binomialverteilung, n=10, p=48/100, 5 in das mittlere Feld eingeben und darunter die Wahrscheinlichkeit ablesen. Sie stehen an einer Bushaltestelle. Alle zwei Stunden kommen hier durchschnittlich 25 Busse vorbei. Wie hoch ist die Wahrscheinlichkeit, dass Sie in einer Stunde 5 Busse sehen? Wie hoch ist die Wahrscheinlichkeit, dass Sie in einer halben Stunde mehr als 10 Busse sehen? Welche Verteilung muss hier beachtet werden? Poissonverteilung, die durchschnittliche Anzahl an Bussen auf die Zeitangabe der Frage umlegen, und als Parameter eingeben. 5 in die Mitte, Wert darunter ablesen. 10 in die Mitte, rechten Wert ablesen. Aufgabe 7 Ein Student hat eine Chance von 30% (Aufgrund von (nicht)Lernen und normaler Durchfallquote) eine Klausur zu bestehen. Besteht er die Klausur, so liegt die Chance, dass er sein Studium erfolgreich besteht, bei 70%. Besteht er die Klausur nicht, so wird er zu 30% das Studium abbrechen. Ein Jahr später stellt man fest, dass er sein Studium abgebrochen hat. Mit welcher Wahrscheinlichkeit hat er die Klausur nicht bestanden? Baum aufzeichnen, P(nicht B|nicht A) berechnen. 0,7 Aufgabe 8 Der ständige Tollpatsch einer Heldentriologie ist die letzte Hoffnung des Helden, der in einem Kerker eingesperrt ist. Der Tollpatsch steht vor drei Türen: Die erste führt zu vier Türen, von der eine fest verschlossen ist und auch mit einem Dietrich nicht geöffnet werden kann, hinter zweien wartet das Grauen auf ihn, hinter einer findet er den richtigen Weg zur Zelle des Helden. Die zweite Tür führt zu drei Türen, von denen zwei zum Helden führen, eine jedoch in einem Abgrund führt. Die dritte Tür öffnet den Weg zu zwei Türen. Eine führt in eine Zelle, die andere zur Zelle des Helden. Wie hoch ist die Wahrscheinlichkeit, dass der Tollpatsch den Helden findet, wenn man davon ausgeht, dass jede Tür dieselbe Wahrscheinlichkeit hat, vom Tollpatsch gewählt zu werden. 17/36 (Baum aufzeichnen, „gute“ Ergebnisse am Ende ablesen) Aufgabe 9 Ein Blatt Papier, das fabrikgetreu hergestellt wird, soll 80g schwer sein. Die Fehler schwanken gleichverteilt zwischen -5 g und 5g. Also stetige Gleichverteilung, Parameter 75 - 85 Wie hoch ist die Wahrscheinlichkeit, dass das Papier genau 83g schwer ist? 0; 1/11 Wie hoch ist die Wahrscheinlichkeit, dass das Papier zwischen 77g und 82g (inklusive) wiegt? 0,5; 6/11 Man nehme an, dass Messungen nur exakt auf Gramm möglich sind. Beantworten Sie beide Fragen erneut. Diskrete Gleichverteilung, N=10+1=11 Aufgabe 10 Seien folgende Realisationen einer normalverteilten Zufallsvariable gegeben: 1 15 2 78 3 54 4 26 5 38 6 83 7 25 8 11 Schätzen Sie die Parameter der Verteilung. Normalverteilung, also Mittelwert und Standardabweichung berechnen, das geht mit „=Mittelwert()“ und „=Varianz()“, bzw. „=Wurzel(Varianz())“ Nehmen Sie an, der Erwartungswert läge bei 50 Jahren und die Standardabweichung bei 15 Jahren. Geben Sie ein 2sigma Schwankungsintervall und die Wahrscheinlichkeit, dass X innerhalb dieses Intervalls liegt, an. Ein ksigma Schwankungsintervall berechnet man mit „=Mittelwert-k*Standardabweichung“ für die Untergrenze und „=Mittelwert+k*Standardabweichung“ für die Obergrenze. Also hier [20,80]. Für die Wahrscheinlichkeit in pqrs Normalverteilung mit den angegebene Parametern. Dann in die Mitte 80 eingeben, den linken Wert ablesen(0,9772) , dann 20 eingeben, den linken Wert ablesen(0,0228) und dann den ersten Wert – den zweiten Wert (=0,9544) rechnen. Berechnen Sie den Median, sowie beide Quartile. Zweiten Reiter in pqrs nehmen und in das linke Feld, 0,25, 0,5 und 0,75 eingeben. Die Werte auf der xAchse ablesen. Das sind die Lösungen: 39,9; 50; 60,1 Nehmen Sie Stellung zu den folgenden Aussagen: „Ist das 25% Quartil kleiner als 25, so ist die Verteilung breiter als normal.“ Richtig/falsch „Ist der Median größer als der Mittelwert, gibt es viele Ausreißer nach unten.“ Richtig/falsch Aufgabe 11 In 150 Befragungen zur Frage: „Soll Gauck der neue Bundespräsident werden?“ wurde 80 mal mit ja gestimmt. Schätzen Sie den Parameter p der Bernoulliverteilung. p=80/150 Geben Sie ein 95% Konfidenzintervall für den Parameter p an. Formel ist wie folgt: P X n 1 2 X n (1 X n ) n p X n 1 2 X n (1 X n ) 1 n Normalverteilung wird benutzt, da n>100 ist. Also berechnet man getrennt in der Exceltabelle Unterund Obergrenze. Lösungen: 0,4535; 0,6132 Die Bildzeitung stellt nun die Behauptung auf, dass mehr als die Hälfte aller Bürger Gauck als Bundespräsidenten haben wollen. Seit kurzem müssen sie ihre populistischen Thesen jedoch belegen können. Führen Sie also für Ihren Chefredakteur einen Hypothesentest zum Fehler Niveau von 0,05 durch, der die Behauptung absichern soll. Geben Sie kritischen Wert und die Teststatistik an. Siehe Exceltabelle Vollenden Sie folgenden Satz: Die Nullhypothese muss abgelehnt/beibehalten werden. Geben Sie den p-Wert an. Siehe Exceltabelle Wie würden sich die Aussagen verändern, wenn der Stichprobenumfang größer wäre? Kritischer Wert: bleibt gleich/wird größer/wird kleiner Teststatistik: bleibt gleich/wird größer/wird kleiner p-Wert: bleibt gleich/wird kleiner/wird größer Aufgabe 12 Seien folgende Werte für zwei Wertpapiere gegeben: E[ R1 ] 6;VAr[ R1 ] 4; E[ R2 ] 4;Var[ R2 ] 8; Cov[ R1 , R2 ] 3 Ihr Portfolio besteht in Anteilen sowohl aus Wertpapier 1, als auch aus Wertpapier 2. Da Sie sonst keine anderen Anleihen halten, ergibt sich ihr Portfolio also zu: R p g R1 (1 g ) R2 Interpretieren Sie: Wie ist Ihr Portfolio bei g=1 anzugeben: gemischt/nur Wertpapier 1/nur Wertpapier 2 Wie ist Ihr Portfolio bei g=0 anzugeben: gemischt/nur Wertpapier 1/nur Wertpapier 2 Wie ist Ihr Portfolio bei g=0,4 anzugeben: gemischt/nur Wertpapier 1/nur Wertpapier 2 Die negative Kovarianz sagt aus, dass bei steigender Rendite von Wertpapier 1: Wertpapier 2 steigt/Wertpapier 2 fällt/Wertpapier 2 keine Veränderung erfährt Berechnen Sie Risiko und erwarteten Ertrag Ihres Portfolios für folgende Zusammensetzungen: g=0,4: g=0,6: g=0,8 Da Sie ein risikoscheuer Investor sind, möchten Sie das Portfolio mit dem geringsten Risiko halten. Finden Sie also die risikominimale Portfolioaufteilung g* und berechnen Sie sowohl die so entstehende erwartete Rendite als auch das Risiko Ihres Portfolios. g*= ; E[Rp]= ; Var[Rp]= ; Nehmen Sie Stellung zu folgender Aussage: „Wertpapier 1 ist sowohl in der Rendite höher, als auch im Risiko geringer als Wertpapier 2. Also ist es nicht sinnvoll, auch Wertpapier 2 zu halten.“ Falsch/richtig Die Lösungen sind in der Exceltabelle zu finden. Aufgabe 13(Schriftlich) Seien folgende Werte für zwei Wertpapiere gegeben: E[ R1 ] 8;VAr[ R1 ] 9; E[ R2 ] 9;Var[ R2 ] 8; Cov[ R1 , R2 ] 5 Ihr Portfolio besteht in Anteilen sowohl aus Wertpapier 1, als auch aus Wertpapier 2. Da Sie sonst keine anderen Anleihen halten, ergibt sich ihr Portfolio also zu: R p g R1 (1 g ) R2 Berechnen Sie die minimale Portfolioaufteilung g* und zeichnen sie ein μ-σ-Diagramm. g*=0,4815 Aufgabe 14 Die Normalverteilung der Lebensdauer von Glühbirnen sei normalverteilt. Der Hersteller möchte eine Brenndauer von mind. 1000 Stunden auf der Verpackung angeben. Eine Stichprobe von 50 Glühbirnen ergibt ein Stichprobenmittel von 995 Stunden und eine Stichprobenvarianz von 40. Muss sich der Hersteller von seinem Wunsch verabschieden? Führen Sie hierzu einen Hypothesentest zum Niveau α=0,10 durch. Was ist die Einheit der Stichprobenvarianz? Keine/Stunden/Stunden²/Wurzel(Stunden) H0: μ =/<=/>=/!= 1000 H1: μ=/<=/>=/!= 1000 Kritischer Wert: 1,299 Teststatistik: -5,5901 Die Nullhypothese muss abglehnt/beibehalten werden. Nehmen Sie an, die Standardabweichung sei nun fest mit 7 Stunden bekannt. Muss der Hersteller seine Entscheidung nun ändern? Kritischer Wert: 1,282 Teststatistik: -5,0508 Die Nullhypothese muss abgelehnt/beibehalten werden. Aufgabe 15 Gegeben seien folgende Werte einer Holzfabrik für die Länge ihrer hergestellten Bretter: 1 2,04 2 2,07 3 1,93 4 2,01 5 1,95 6 1,92 7 2,14 8 2,1 9 1,99 Die Länge der Bretter ist gleichverteilt. Schätzen Sie die Parameter a,b der Verteilung. Seien nun folgende Werte für die Wartezeit in Minuten auf den Zug am Bahnhof gegeben: 1 5 2 10 3 1 4 15 5 7 6 8 7 2 8 9 Welche Verteilung beschreibt die Wartezeit auf einen Zug? Exponentialverteilung Berechnen Sie Stichprobenvarianz und Stichprobenmittel. 7,2 und 18,6222 Schätzen Sie den Parameter der Verteilung: Parameter der Verteilung ist der Kehrwert des Mittelwerts: 0,1389 9 11 10 4 Aufgabe 16 Gegeben sind folgende persönliche Messwerte eines sehr auf ihr Gewicht fokussierten Mädchens: X=Gewicht Y= Anzahl der Männer, die sie am Tag ansprechen. 50 10 48 12 52 8 53 9 51,5 10 47,5 5 49 9 50,5 13 51 15 55 12 Das Mädchen möchte nun wissen, wie ihr Gewicht mit der Anzahl der Männer zusammenhängt. Welche Art von Merkmal liegt hier für X vor? Qualitativ/quantitativ/komparativ Führen Sie eine Regressionsanalyse durch. a0= -7,7385 a1=0,3554 Geben Sie weiterhin das Bestimmtheitsmaß der Regression an: R²= 0,0826 Nehmen Sie Stellung zur folgenden Aussage: „Wenn der Wert von a1 negativ ist, dann muss das Mädchen abnehmen, damit es mehr Männer ansprechen“ richtig Aufgabe 17 Der ewige Tollpatsch muss über einen Fluss gelangen. Hierbei hat er 12 Wege zur Auswahl. Ein Weg führt ihn sicher ans andere Ufer. 6 Wege führen irgendwann auf ein als Baumstamm getarntes Krokodil. 3 Wege führen zur Attacke durch Skorpione. Ein Angriff durch Skorpione ist zu 40% tödlich, ein Angriff durch Krokodile zu 30%. Wie hoch ist die Wahrscheinlichkeit, dass der Tollpatsch durch eine Tierattacke stirbt? Mit einer Wahrscheinlichkeit von ½ trifft er auf ein Krokodil und stirbt dann mit Wahrscheinlichkeit von 0,3 – also 0,5*0,3. Bei Skorpionen kommt man genauso auf 0,25*0,4. Die Summe von beidem ist dann die Lösung: 0,5*0,3+0,25*0,4 Aufgabe 18 Betrachten Sie die Zufallsvariable X „Preisänderung bei Produkt P“ und Y „Änderung des Absatzes von Produkt P“, beide gemessen in Prozent. Für X und Y wurde die Regressionsgerade Y a0 a1 X geschätzt. Hierbei ergaben sich folgende Werte: a0 2,12; a1 0,86; R² 0,872 Zeichnen Sie die geschätzte Regressionsgerade. Interpretieren Sie die Koeffizienten und das Bestimmtheitsmaß. Wie lassen sich die Vorzeichen der Kovarianz und des Korrelationskoeffizienten aus den Koeffizienten/dem Bestimmtheitsmaß ableiten? Vorzeichen entspricht dem Vorzeichen von a1 Welche Vorzeichen haben sie dann in diesem Fall? negativ Wie ist der genaue Zusammenhang zwischen Bestimmtheitsmaß und Korrelationskoeffizienten? Das Bestimmtheitsmaß ist das Quadrat des Korrelationskoeffizienten. Aufgabe 19 Der Druck, mit dem ein Fußball bei einem Bundesligaspiel aufgepumpt ist, kann als normalverteilt angesehen werden. Eine Stichprobe im Umfang von 12 Fußballlern weist ein Stichprobenmittel von 0,84 bar mit einer Stichprobenstandardabweichung in Höhe von 0,2 bar auf . Ein Schiedsrichterassistent behauptet, dass mit einer maximalen Wahrscheinlichkeit für den ersten Fehler von 0,05 der Luftdruck der Bälle unter 1 bar liegt. Wie müssen die Hypothesen gewählt werden, wenn der Schiedsrichterassistent seine Behauptung mittels eines statistischen Hypothesentests absichern will? H0: μ>= 1 H1: μ<1 Was bedeuten 1. Und 2. Fehler im Allgemeinen und im Kontext der Aufgabenstellung? Der erste Fehler bedeutet die Wahrscheinlichkeit, dass die Nullhypothese abgelehnt wird, obwohl sie zutrifft. Genauso bedeutet der 2. Fehler die Wahrscheinlichkeit, die Alternativhypothese abzulehnen, obwohl sie zutrifft. In diesem Kontext bedeutet der erste Fehler die Wahrscheinlichkeit, dass behauptet wird, der Druck läge unter einem Bar, obwohl dies nicht zutrifft. Beim zweiten Fehler, ist es die Wahrscheinlichkeit, dass man annimmt, der Druck läge über einem Bar, obwohl er tatsächlich unter einem Bar liegt. Für die realisierte Teststatistik ergibt sich t12=-2,771. Welche Testentscheidung ergibt sich daraus? Die Nullhypothese wird abgelehnt. Skizzieren Sie die Verteilung der Teststatistik und kennzeichnen Sie dabei den kritischen Bereich.