Übungsaufgaben zur Vorlesung Beschreibende Statistik und Wirtschaftsstatistik Universität zu Köln Wintersemester 2013/2014 c 2013 Seminar für Wirtschafts- und Sozialstatistik Alle Rechte vorbehalten. Vorbemerkung Die in dieser Sammlung zusammengestellten Aufgaben sind für die Übungen und Tutorien zu Beschreibende Statistik und Wirtschaftsstatistik“ an der Universität zu ” Köln bestimmt. In Notation und Aufbau schließt sich die vorliegende Aufgabensammlung der Formelsammlung1 an. 1 E. Bomsdorf, E. Gröhn, K. Mosler, F. Schmid: Definitionen, Formeln und Tabellen zur Stati” stik“, 7. Aufl., Universität zu Köln, 2011 0 Mathematische Grundlagen Aufgabe 0.1 (T) Schreiben Sie ausführlich: a) n X ai xi , b) i=1 n X a, c) i=1 2 X 4 X d) xi yj , i=1 j=1 4 X xi yi . i=1 Aufgabe 0.2 Berechnen Sie den Wert der folgenden Summen: a) 11 X i, i=1 b) 8 X (4i + 5) , i=0 2 X 1 2 c) i , 2 i=−2 d) 5 X (i − 3)2 i=1 2 Aufgabe 0.3 Stellen Sie die folgenden Ausdrücke mit Hilfe des Summenzeichens dar: a) ”Die Summe der ersten fünfzig natürlichen Zahlen.” b) ”Die Summe der ersten zehn Quadratzahlen.” c) ”Die Summe der ersten zehn geraden Zahlen.” d) ”Die Summe der Quadrate aller geraden Zahlen von 100 bis 200.” Aufgabe 0.4 Es seien die folgenden n = 3 Messreihen der Länge m = 4 gegeben: x1j x2j x3j x4j j=1 j=2 1 3 2 4 1 2 5 4 1 j=3 5 6 1 0 . Berechnen Sie die folgenden Summen mit c = 2: a) m X n X b) c, i=1 j=1 d) m X n X m X n X c) cxij , i=1 j=1 (x1j + xi3 ) , e) i=1 j=1 m X n X m X n X (xij + c) , i=1 j=1 x1j xi2 . i=1 j=1 Aufgabe 0.5 (T) Fassen Sie mit Hilfe des Summenzeichens zusammen: a) a3 x3 + a2 x2 + a1 x + a0 , b) 1 + 4 + 9 + 16 + 25 , c) 3x1 + 6x2 + 9x3 + 2x1 y + 4x2 y 2 + 6x3 y 3 , d) x1 y1 + x1 y2 + x1 y3 + x2 y1 + x2 y2 + x2 y3 + x3 y1 + x3 y2 + x3 y3 . Aufgabe 0.6 (T) Zeigen Sie, dass für beliebige reelle Zahlen x1 , . . . ,x5 gilt a) 5 X " # 5 1X xi − xj = 0 , 5 j=1 5 X " 1X xi − xj 5 j=1 i=1 b) i=1 5 #2 = 5 X i=1 1 x2i − 5 5 X xi i=1 !2 . Gelten diese Aussagen auch noch, wenn 5 durch eine beliebige natürliche Zahl n ersetzt wird? Aufgabe 0.7 Berechen Sie den Wert der folgenden Produkte: a) 5 Y i=1 i, 5 Y b) (2i2 ) , i=1 c) 20 Y i=1 2 1 1+ i , d) 3 Y (2i − 1) . i=−2 Aufgabe 0.8 (T) Fassen Sie mit Hilfe des Produktzeichens zusammen: a) 3 · 4 · 5 · 6 · 7 · 8 , b) 1 · 4 · 9 · 16 · 25 , c) 49 · 48 · 47 · 46 · 45 · 44 , 1·2·3·4·5·6 d) 3 · 6 · 9 · 12 · 15 . Aufgabe 0.9 (T) Ein Kunde zahlt zu Jahresbeginn jeweils 1 000 Euro auf sein Sparbuch ein. Pro Jahr erhält er 5% Zinsen. a) Welcher Betrag steht dem Kunden zu Beginn des 4. Jahres zur Verfügung? b) Versuchen Sie den mathematischen Zusammenhang für einen Zeitraum von 10 Jahren in allgemeiner Schreibweise zusammenzufassen. 3 1 Grundbegriffe Aufgabe 1.1 Bezeichnen Sie für die folgenden Merkmale jeweils das Skalenniveau, auf dem das Merkmal gemessen wird, und nennen Sie mögliche Merkmalsausprägungen. Geschlecht Rendite von Wertpapieren Handelsklasse Religionszugehörigkeit Geburtsdatum Sparguthaben Kontonummer Gewicht Freizeitbeschäftigung Schulbildung Aufgabe 1.2 (T) a) Welche der folgenden Merkmale sind häufbar bzw. nichthäufbar? Geschlecht Freizeitbeschäftigung Familienstand Beruf Religionszugehörigkeit Staatsangehörigkeit Wertungsnote beim Eiskunstlauf Steuerklasse Studienfach Hotelkategorie b) Geben Sie bei den folgenden Größen an, ob es sich um eine Bestands- oder eine Bewegungsmasse handelt. Nennen Sie für jede Bestandsmasse zugehörige Bewegungsmassen. Bevölkerung Umsatz Anzahl der Arbeitslosen Autoproduktion Investitionen Vermögen Zinsen aus Vermögen Geburten und Sterbefälle Zugelassene Kraftfahrzeuge Einkommen 4 2 Auswertung eindimensionaler Daten Aufgabe 2.1 Der Verband der Tierschützer befragt 40 Haushalte einer Reihenhaussiedlung nach der Anzahl der gehaltenen Haustiere. Dabei ergibt sich folgendes Ergebnis: 7, 1, 1, 2, 0, 2, 3, 2, 1, 0, 7, 0, 4, 1, 3, 1, 1, 1, 2, 0, 5, 1, 1, 0, 2, 0, 0, 1, 2, 1, 6, 1, 1, 0, 0, 1, 1, 0, 3, 8. a) Geben Sie für die Anzahl der Haustiere die diskrete Klassierung mit absoluten und mit relativen Häufigkeiten an und stellen Sie sie graphisch dar. b) Bestimmen Sie den Modus. Aufgabe 2.2 In der Betriebskantine werden verschiedene Mittagessen angeboten. Zur Wahl stehen: ein vegetarisches Essen (VE), ”Fast Food” (FF), ein Eintopf (E) und ein Komponentenessen (KE). Im letzten Monat wurden von den Mitarbeitern insgesamt 500 Essen wie folgt bestellt: Mittagessen Anzahl der Mitarbeiter VE 85 FF E KE 135 92 188 a) Bezeichnen Sie die statistischen Begriffe, die den folgenden Angaben in der Aufgabenstellung entsprechen: (1) die Zahl 500, (2) das Essen ”Eintopf”, (3) die Zahl 85, (4) die Gesamtheit der Paare (VE , 85), (FF , 135), (E , 92), (KE , 188)? b) Berechnen Sie die relativen Häufigkeiten und stellen Sie sie graphisch dar. Aufgabe 2.3 (T) Zehn Untersuchungseinheiten wurden aus einer bestimmten Grundgesamtheit gezogen und jeweils das Merkmal X gemessen x1 = 3, x2 = 1, x3 = 4, x4 = 5, x5 = 2, x6 = 6, x7 = 3, x8 = 4, x9 = 1, x10 = 5. 5 a) Zeichnen Sie die empirische Verteilungsfunktion. b) Lassen sich aus einer empirischen Verteilungsfunktion die absoluten Häufigkeiten der Merkmalswerte ermitteln? Aufgabe 2.4 Bei einer Abschlussprüfung sind 18 Aufgaben zu bearbeiten, wobei pro Aufgabe ein Punkt erzielt werden kann. Als nicht bestanden“ gilt die Prüfung, wenn ein Kandidat ” weniger als sieben Punkte erreicht. Bei sieben bis vierzehn Punkten wird die Note bestanden“ vergeben, bei mehr als vierzehn Punkten die Note mit besonderem ” ” Erfolg bestanden“. Die Korrektur der Klausur ergab folgende Häufigkeitsverteilung der erreichten Punktzahlen ξj : ξj 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 nj 4 1 1 0 7 5 6 4 7 7 17 22 13 16 0 1 5 2 2 a) Errechnen Sie die diskrete Klassierung gemäß den vergebenen Noten und stellen Sie die absoluten Häufigkeiten sie graphisch dar. b) Inwiefern ist die diskrete Klassierung nach Noten mehr oder weniger informativ als die Klassierung nach Punktzahlen? Aufgabe 2.5 (T) In der Kölner Fußgängerzone wurden 60 zufällig ausgewählte Erwachsene nach ihrem höchsten Schul- oder Studienabschluss befragt. Dabei wurden die folgenden Antworten registriert: Abschluss Häufigkeit ohne Hauptschule Realschule Gymnasium Fachhochschule Universität 6 4 20 15 10 5 6 a) Stellen Sie die diskrete Klassierung graphisch dar. b) Geben Sie die relativen Häufigkeiten an. Aufgabe 2.6 Ein Marktforschungsinstitut befragt 40 Kunden eines Teeladens nach der Anzahl der von ihnen durchschnittlich pro Tag getrunkenen Tassen Tee. Dabei ergaben sich die folgenden Zahlen: Anzahl der Tassen 1 2 3 4 5 6 Anzahl der Kunden 4 8 15 6 5 2 a) Wie hoch ist der Anteil der Kunden, die höchstens 4 Tassen pro Tag trinken? b) Wie hoch ist der Anteil der Befragten, die mindestens 3 und höchstens 5 Tassen pro Tag trinken? c) Welche Anzahl an Tassen pro Tag wird von 95% der Kunden nicht überschritten? d) Der kleinste Wert x, für den F (x) ≥ 0.5 gilt, heißt Median. Bestimmen Sie für die angegebenen Daten den Median. Wie verändert sich der Median, wenn einer der Kunden statt 2 Tassen Tee pro Tag 7 Tassen angeben würde? Aufgabe 2.7 Für die 25 Tage eines Monats, an dem ein Einzelhändler sein Geschäft geöffnet hatte, wurden folgende Verkaufszahlen eines bestimmten Artikels registriert: an an an an an an an 3 2 4 3 8 4 1 Tagen: Tagen: Tagen: Tagen: Tagen: Tagen: Tagen: 0 1 2 3 4 6 8 Stück , Stück , Stück , Stück , Stück , Stück , Stück . a) Geben Sie die Grundgesamtheit und das Merkmal an. 7 b) Stellen Sie die Daten in einer Häufigkeitstabelle mit absoluten und relativen Häufigkeiten dar. c) Geben Sie die empirische Verteilungsfunktion explizit an und stellen Sie diese graphisch dar. d) Betrachten Sie jeweils den Anteil der Tage, an denen (1) höchstens 4, (2) weniger als 4, (3) höchstens 2.5, (4) mehr als 2.5, (5) mindestens 2, (6) mehr als 2 und höchstens 6.3 Stück verkauft wurden. Drücken Sie diese Anteile durch die empirische Verteilungsfunktion aus und berechnen Sie diese. e) Berechnen Sie den Median und interpretieren Sie ihn. f) Finden Sie das kleinste x, für das F (x) ≥ 0.3 ist. Aufgabe 2.8 (T) Die Umfrage des Tierschützerverbandes in der Reihenhaussiedlung aus Aufgabe 2.1 ergab folgendes Ergebnis: Anzahl der Haustiere Anzahl der Haushalte 0 1 2 3 4 5 6 7 8 10 15 6 3 1 1 1 2 1 a) Berechnen Sie die empirische Verteilungsfunktion und stellen Sie sie graphisch dar. 8 b) Bestimmen Sie für die Anzahl der Haustiere rechnerisch und graphisch den Median und das 0.7–Quantil und interpretieren Sie diese Werte. c) Welche Haustieranzahl wird nur von 10% der Befragten überschritten? Aufgabe 2.9 Bei einer statistischen Untersuchung wurden für ein metrisches Merkmal X die Daten x1 ,x2 , . . . ,x100 gemessen und daraus die empirische Verteilungsfunktion berechnet: 0 für x < 3 , 0.20 für 3 ≤ x < 4 , 0.45 für 4 ≤ x < 6 , F (x) = 0.50 für 6 ≤ x < 10 , 0.75 für 10 ≤ x < 12 , 1 für x ≥ 12 . Stellen Sie die empirische Verteilungsfunktion graphisch dar und bestimmen Sie anhand der Graphik das untere und obere Quartil. 9 Aufgabe 2.10 (T) Aus 20 Messwerten für ein Merkmal X wurde die folgende graphische Darstellung der empirischen Verteilungsfunktion ermittelt: ✻ 1,0 s 0,9 s 0,8 s 0,7 0,6 s 0,5 s s 0,4 s 0,3 s 0,2 s 0,1 s ✲ −5 −4 −3 −2 −1 1 2 3 4 5 6 7 a) Beschriften Sie die Achsen. b) Geben Sie die empirische Verteilungsfunktion explizit an. c) Bestimmen Sie die absoluten und relativen Häufigkeiten. Aufgabe 2.11 (T) Eine Autozeitschrift will zwei neue Kleinwagen vergleichen. Von Interesse ist unter anderem der Benzinverbrauch auf 100 km. Mit Wagen A werden 50 Fahrten gemacht. Das Ergebnis der Messungen zeigt die folgende Tabelle: 10 Benzinverbrauch (in Litern je 100 km) Anteil der Fahrten 5.0 5.5 6.0 6.4 6.9 7.5 7.8 0.02 0.06 0.16 0.30 0.34 0.08 0.04 Da der Redaktionsschluss naht, können mit Wagen B nur noch 20 Fahrten unternommen werden. Die Testergebnisse sind die folgenden: 4.2, 4.8, 4.8, 4.8, 5.4, 5.4, 5.4, 5.4, 5.4, 5.4, 5.9, 5.9, 5.9, 5.9, 5.9, 5.9, 6.0, 6.0, 6.0, 6.5. a) Berechnen Sie für Wagen B die relativen Häufigkeiten und stellen Sie sie graphisch dar. b) Bestimmen Sie für den Benzinverbrauch bei Wagen A und B jeweils den Median. c) Auf wie vielen Fahrten haben Wagen A bzw. Wagen B weniger als 6.5 Liter verbraucht? Aufgabe 2.12 Der Verband der Tierschützer, der auch die Umfrage in der Reihenhaussiedlung gemacht hat (vgl. Aufgabe 2.1 und 2.8), befragt zusätzlich die 20 Parteien eines Hochhauses nach der Anzahl der Haustiere. Dabei ergibt sich folgendes Ergebnis: 6, 1, 2, 0, 0, 0, 1, 0, 0, 0, 4, 1, 3, 0, 1, 1, 2, 0, 5, 1. a) Berechnen Sie für die Anzahl der Haustiere den Median, das 1. und 3. Quartil und das 0.33–Quantil. b) Zeichnen Sie den zugehörigen Boxplot. 11 Aufgabe 2.13 (T) In einer Automobilfabrik wurden die Höchstgeschwindigkeiten von 400 Kraftfahrzeugen eines bestimmten Typs gemessen. Dabei ergaben sich folgende Messergebnisse: Höchstgeschwindigkeit (in km/h) absolute Häufigkeit [135,140] ]140,142] ]142,144] ]144,146] ]146,148] ]148,150] ]150,155] 18 38 82 105 89 46 22 a) Bestimmen Sie die relativen Häufgkeiten der stetigen Klassierung. b) Stellen Sie die Daten anhand eines Histogramms graphisch dar. c) Zeichnen Sie die empirische Verteilungsfunktion. Aufgabe 2.14 Gegeben ist die Bevölkerung Deutschlands nach Altersklassen im Jahr 1997: Altersklasse (in Jahren) 0 - 15 15 - 21 21 - 40 40 - 60 60 - 65 65 - ... Bevölkerung in Millionen östliche Bundesländer westliche Bundesländer 2.28 1.28 4.21 4.26 0.99 2.35 10.82 4.17 19.45 17.65 3.97 10.62 a) In welchen Bundesländern ist der Anteil der Menschen bis 18 Jahre höher? In welchen Bundesländern ist der Anteil der Menschen, die über 62 Jahre alt sind, höher? b) Zeichnen Sie die empirische Verteilungsfunktion F (x) für die östlichen Bundesländer. 12 c) Zeichnen Sie für die Altersverteilung der östlichen Bundesländer ein Histogramm. Hinweis: Nehmen Sie an, dass die Obergrenze der letzten Klasse xo6 = 100 ist. 13 3 Lage- und Streuungsmaße Aufgabe 3.1 (T) In einer Gemeinde wurde die Haushaltsgröße der privaten Haushalte ermittelt. Dabei ergaben sich die folgenden Daten: Anzahl der Personen je Haushalt Anzahl der Haushalte 1 2 3 4 5 6 7 8 9 10 1 319 1 203 577 455 119 32 12 5 3 1 a) Berechnen Sie die durchschnittliche Haushaltsgröße in der Gemeinde. b) Bestimmen Sie die Quartile der Haushaltsgröße. Aufgabe 3.2 Aus einer Urliste von Daten wurde die folgende empirische Verteilungsfunktion berechnet: 0 für x < 2 , 0.15 für 2 ≤ x < 3 , 0.35 für 3 ≤ x < 5 , F (x) = 0.60 für 5 ≤ x < 8 , 0.80 für 8 ≤ x < 10 , 1 für x ≥ 10 . a) Bestimmen Sie den Median der Daten. b) Berechnen Sie das arithmetische Mittel. c) Was können Sie über die Anzahl der Daten in der Urliste sagen? 14 Aufgabe 3.3 (T) An zwei Registrierkassen eines Supermarktes wurden eine Stunde lang jeweils die Bedienungszeiten (in Sekunden) gemessen: Kasse 1 Kasse 2 35 45 15 36 68 75 12 9 35 23 45 25 28 67 46 76 21 49 63 47 48 69 62 52 41 68 79 45 32 11 12 16 45 23 7 a) Berechnen Sie die arithmetischen Mittel der Bedienungszeiten für die zwei Kassen getrennt sowie für beide Kassen insgesamt. b) Bestimmen Sie für jede Kasse den Median sowie das untere und obere Quartil der Bedienungszeiten. Zeichnen Sie für beide Kassen die Boxplots der Bedienungszeiten. Aufgabe 3.4 Ein Haus wird von zehn Personen bewohnt. Fünf dieser Personen haben ein Monatseinkommen von je 2 500 Euro, die übrigen Personen haben Monatseinkommen von 2 600, 2 700, 2 800, 2 900 und 3 000 Euro. In das Haus zieht eine weitere Person ein, deren Monatseinkommen 100 000 Euro beträgt. Welche Auswirkungen ergeben sich dadurch auf den Modus, den Median und das arithmetische Mittel der Monatseinkommen aller Einwohner des Hauses? Aufgabe 3.5 Im Rahmen einer Flurbereinigung werden die Nutzflächen (in ha) von 40 landwirtschaftlichen Betrieben ermittelt: 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 8, 9, 9, 9, 9, 10, 10, 14, 16, 16, 18, 21, 25, 28, 33, 36, 40, 40, 48, 60, 69, 77, 77, 80, 99. a) Berechnen Sie aus diesen Einzelwerten die durchschnittliche Nutzfläche und die Varianz der Nutzfläche. b) Bilden Sie eine stetige Klassierung der Daten (Klassen: 2 bis 4, über 4 bis 9, über 9 bis 20, über 20 bis 50, über 50 bis 100 ha), und berechnen Sie daraus die durchschnittliche Nutzfläche. Begründen Sie den Unterschied zu a). c) Berechnen Sie zunächst für jede Klasse aus b) den Durchschnitt und aus den Klassendurchschnitten den Gesamtdurchschnitt der Nutzfläche. 15 d) Berechnen Sie die Varianz der Nutzfläche aus der stetigen Klassierung in b). Begründen Sie den Unterschied zu a). Aufgabe 3.6 (T) Gegeben sind die drei nachstehenden stetigen Klassierungen I, II und III: j Kj I nj 1 2 3 4 5 [0,5] ]5,10] ]10,15] ]15,20] ]20,25] 5 6 4 3 2 II nj III nj 3 4 6 4 3 2 3 4 6 5 Bestimmen Sie für jede Verteilung die Lagemaße Median und arithmetisches Mittel und vergleichen Sie die Verteilungen. Aufgabe 3.7 (T) Stundenlohn im Bereich ”Bergbau und Gewinnung von Steinen und Erden” in europäischen Ländern 1992 (in DM): Stundenlohn (in DM) Land Deutschland Früheres Bundesgebiet Neue Länder und Berlin–Ost Frankreich Griechenland Großbritannien und Nordirland Italien Niederlande Spanien 55.58 28.65 49.64 18.01 38.82 35.87 55.66 39.95 a) Berechnen Sie für den Stundenlohn: (1) das arithmetische Mittel ohne Berücksichtigung einer Gewichtung und den Median, 16 (2) die Spannweite und den Quartilabstand. b) Beantworten Sie (ohne Rechnung !) folgende Fragen : (1) Welche der in a) (1) bzw. der in a) (2) berechneten Größen verändert sich stärker, falls man Griechenland nicht berücksichtigt? (2) Wie verändern sich die in a) berechneten Größen, falls der Stundenlohn in Euro gemessen wird? (1.95583 DM = 1 Euro) c) Berechnen Sie die Varianz. Wie verändert sich dieses Streuungsmaß, falls (1) Griechenland nicht berücksichtigt wird, (2) der Stundenlohn in Euro gemessen wird? Aufgabe 3.8 (T) In einer Fertigungshalle eines Betriebs seien fünf Produktionsstätten P1 , . . . ,P5 auf einer Fertigungsstraße entlang einer Geraden hintereinander in folgenden Abständen angeordnet (Start der Straße bei Meter Null): P1 P2 P3 P4 P5 Meter ✉ 0 10 22 30 36 48 Produktionsstätte P1 P2 P3 P4 P5 Anzahl der Arbeiter 8 5 2 5 18 Um die Produktionsstätten mit Material zu beliefern, soll ein Zwischenlager auf dieser Straße gebaut werden. Die Summe der von den Arbeitern zurückgelegten Wegstrecken zum Lager soll minimal werden. (Nehmen Sie dafür an, dass jeder Arbeiter einer Produktionsstätte einmal am Tag zum Lager muss.) Wo würden Sie, wenn jeder Platz an der Straße ansonsten in gleicher Weise geeignet ist, das Lager bauen? Aufgabe 3.9 (T) Es sei x1 , . . . ,xn eine Messreihe und x das zugehörige arithmetische Mittel. 17 a) Man zeige: Werden die Werte der Messreihe gemäß yi = a + b · xi , i = 1, . . . n, linear transformiert, so gilt für das arithmetische Mittel y der transformierten Werte y = a + b · x, d.h. das arithmetische Mittel der transformierten Werte ist gleich dem transformierten arithmetischen Mittel der ursprünglichen Werte. b) Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen jeweils morgens zur gleichen Zeit die folgenden Lufttemperaturen in Grad Fahrenheit (◦ F) gemessen: 76, 84, 82, 76, 77, 85, 81, 79, 80, 81, 82, 81, 79, 77 . Man berechne die Durchschnittstemperatur, d. h. das arithmetische Mittel der gemessenen Temperaturen, in Grad Fahrenheit (◦ F) und in Grad Celsius (◦ C). Hinweis: x[◦ F ] entsprechen y = 5 9 · (x − 32)[◦ C]. Aufgabe 3.10 (T) Die folgende Tabelle enthält die Anzahl (in 100 000) und das durchschnittliche Nettoeinkommen je Monat (in 1 000 Euro) privater Haushalte im früheren Bundesgebiet für das Jahr 2006: Nettoeinkommen über ... bis einschließlich ... 0 – 1.5 1.5 – 2.5 2.5 – 5 5 – 10 Summe Anzahl der Haushalte 16 50 206 18 290 Durchschnittliches Nettoeinkommen 1.12 1.98 3.13 6.75 a) Zeichnen Sie das Histogramm und die empirische Verteilungsfunktion. b) Berechnen Sie für alle privaten Haushalte (1) das durchschnittliche Nettoeinkommen, (2) die Standardabweichung des Nettoeinkommens. 18 Aufgabe 3.11 Bruttoinlandsprodukt (BIP) 1998 in den fünf neuen Bundesländern in Mrd. DM: Bundesland BIP Brandenburg Mecklenburg–Vorpommern Sachsen Sachsen–Anhalt Thüringen 77.8 48.4 125.3 71.4 66.5 a) Berechnen Sie für das Bruttoinlandsprodukt das arithmetische Mittel und den Median. b) Berechnen Sie die Spannweite, den Quartilabstand, die mittlere absolute Abweichung vom Median und die Varianz. c) Wie verändern sich die in a) und b) berechneten Größen, falls das Bruttoinlandsprodukt in Euro gemessen wird? (1.95583 DM = 1 Euro) Aufgabe 3.12 Ein junges Kraftfahrt-Versicherungsunternehmen will die Vollkasko-Schäden des vergangenen Geschäftsjahres auswerten. Folgende Daten liegen vor [Angaben in Tsd. Euro]: 5,5 5,9 6,1 6,4 6,4 6,7 6,7 7,1 7,1 7,2 7,5 7,6 7,8 8,2 8,7 9,2 9,5 10,1 24,0 27,5 71,0 a) Berechnen Sie das arithmetische Mittel x sowie das α-getrimmte Mittel xα für α = 0,1 und α = 0,2. Was fällt dabei auf? b) Berechnen Sie die Standardabweichung sowie die mittlere absolute Abweichung vom Median. c) Berechnen Sie für die erste Zeile der Daten Ginis mittlere Differenz. Aufgabe 3.13 70% der Belegschaft einer Firma sind Arbeiter, 25% Angestellte und 5% leitende Angestellte. Die folgende Tabelle enthält die arithmetischen Mittel und Standardabweichungen der Monatslöhne bzw. -gehälter (in Euro) dieser Gruppen: 19 Arbeiter Angestellte Leitende Angestellte Arithmetisches Mittel 3 000 5 000 11 000 Standardabweichung 1 000 2 000 4 000 a) Berechnen Sie das arithmetische Mittel und die Standardabweichung der Monatslöhne bzw. -gehälter aller Beschäftigten. b) Wie groß ist der Anteil der durch die Aufteilung der Belegschaft in Arbeiter, Angestellte und leitende Angestellte erklärten Varianz an der Gesamtvarianz der Löhne bzw. Gehälter? c) Tariferhöhungen ergeben: • für Arbeiter 5% lineare Erhöhung und 200 Euro Sockelbetrag, • für Angestellte 3% lineare Erhöhung und keinen Sockelbetrag, • für leitende Angestellte keine Erhöhungen. Berechnen Sie die Werte für a) und b) nach der Tariferhöhung. Aufgabe 3.14 Bruttojahreseinkommen von Erwerbstätigen in einem Kölner Stadtteil: Bruttojahreseinkommen (in Tsd. Euro über ... bis einschließlich ... 0 – 20 20 – 50 50 – 100 Anzahl der Erwerbstätigen 400 1 983 423 a) Stellen Sie die empirische Verteilungsfunktion graphisch dar. b) Wie hoch ist der Anteil der Erwerbstätigen, die im Jahr höchstens 12 000 Euro brutto verdienen? c) Wie hoch ist der Anteil der Erwerbstätigen, deren Bruttojahreseinkommen zwischen 65 000 und 85 000 Euro liegt? d) Welches Bruttojahreseinkommen überschreiten die oberen 50% der aufgeführten Personen? 20 e) Wie hoch ist im Durchschnitt das Bruttojahreseinkommen der Erwerbstätigen in dem Stadtteil? f) Berechnen Sie Quartilabstand, Varianz und Standardabweichung des Einkommens. 21 4 Konzentrations- und Disparitätsmessung Aufgabe 4.1 Der deutsche Markt für Mobiltelefone teilte sich am 1.2.2007 wie folgt auf (Schätzungen): Netz T–Mobil (D1–Netz) Vodafone (D2–Netz) E–Plus (E1–Netz) O2 (E2–Netz) Teilnehmer 30 700 000 30 400 000 12 700 000 11 000 000 Berechnen Sie für diesen Markt den Rosenbluth–Index sowie den Herfindahl–Index. Aufgabe 4.2 (T) Die folgende Tabelle enthält die Marktanteile der größten Fernsehanstalten (in Prozent), gemessen am Anteil an der täglichen durchschnittlichen Fernsehdauer, für den Juni 1998: Fernsehanstalt ARD ZDF Dritte RTL SAT.1 PRO 7 RTL 2 Kabel 1 VOX Super RTL n–tv 3sat arte DSF Eurosport Summe Marktanteil (in Prozent) 19.9 17.4 11.3 13.8 9.0 7.9 3.4 4.1 2.5 2.7 0.6 0.9 0.4 1.1 0.9 95.9 a) Berechnen Sie die Konzentrationsraten CR(3) und CR(5) für Juni 1998. 22 b) Berechnen Sie unter der Annahme, dass sich die verbleibenden Marktanteile zu gleichen Teilen auf 35 kleinere Sparten- und Regionalsender verteilen, den Rosenbluth–Index für Juni 1998. Hinweis: 50 P i = 1 155. i=16 Aufgabe 4.3 Für drei Aktiengesellschaften sind in folgender Tabelle die prozentualen Anteile der vier größten Aktionäre am Aktienkapital gegeben: AG 1 2 3 Anteil des i-t-größten Aktionärs (in Prozent) i=1 i=2 i=3 i=4 40 20 12 1 20 10 10 10 51 9 8 7 a) Berechnen Sie für die drei Aktiengesellschaften die Konzentrationsraten CR(1), CR(2), CR(3) und CR(4). b) Bei welcher AG ist das Aktienkapital am stärksten konzentriert, wenn CR(3) bzw. CR(4) als Konzentrationsmaß verwendet wird? c) Welchen Wert erhält man für den Rosenbluth–Index der AG 2, wenn man annimmt, dass sich der Streubesitz gleichmäßig auf weitere 9 996 Aktionäre aufteilt? Aufgabe 4.4 Fünf Unternehmen teilen sich einen Markt. Die Umsätze sind (in Mio. Euro): 7 , 10 , 4 , 9 , 10 . Einen anderen Markt teilen sich sieben Unternehmen. Die Umsatzanteile in Prozent sind: 30 , 15 , 15 , 15 , 10 , 10 , 5 . 23 a) Zeichnen Sie für beide Märkte die Konzentrationskurven. Können Sie auf der Grundlage der beiden Konzentrationskurven feststellen, welcher Markt die höhere Umsatzkonzentration aufweist? b) Berechnen Sie für beide Märkte den Rosenbluth–Index und den Herfindahl– Index. Aufgabe 4.5 Zehn Anbieter teilen sich einen Markt. Sie kennen lediglich die Konzentrationsraten CR(3) = 0.6 und CR(5) = 0.8. Was können Sie über den Verlauf der Konzentrationskurve sagen? Geben Sie eine Verteilung der Anteile an, die mit den beiden gegebenen Konzentrationsraten verträglich ist und den geringstmöglichen Wert des Rosenbluth– Indexes ergibt. Aufgabe 4.6 (T) Ein Markt besteht aus fünf Ein–Personen–Betrieben. Bei einer Erhebung ergaben sich folgende Umsätze der Betriebe und Monatseinkommen der Besitzer (in 1 000 Euro): Betrieb Umsatz Einkommen I II III IV V 100 250 125 200 150 10 7 12 15 9 a) Berechnen Sie eine Maßzahl für die Konzentration des Marktes. b) Berechnen Sie eine Maßzahl für die Disparität der Einkommen. c) Zeichnen Sie die Konzentrationskurve und die Lorenzkurve. d) Ein neuer Betrieb mit Umsatz null kommt hinzu. Der Besitzer verdient dementsprechend auch nichts. Berechnen Sie die Konzentration des Marktes und die Disparität der Einkommen. Erklären Sie die Unterschiede zu a) und b). Aufgabe 4.7 (T) Die folgende Tabelle enthält für die Länder der EU im Jahr 1998 jeweils die Einwohnerzahl, das Bruttoinlandsprodukt (BIP) sowie die Anzahl der Sitze im Europäischen Parlament: 24 Land A B D DK E F FIN GB GR I IRL L NL P S Einwohner (in Mio.) 8.1 10.2 82.1 5.3 39.3 58.6 5.1 59.0 10.5 57.5 3.7 0.4 15.6 9.8 8.9 BIP (in Mrd. DM) 391 494 3 758 281 1 326 2 614 225 2 517 305 2 522 168 30 729 305 380 Sitze 21 25 99 16 64 87 16 87 25 87 15 6 31 25 22 a) Bestimmen Sie die Gini–Koeffizienten zu den drei Verteilungen. b) Ändert sich die Disparität des Bruttoinlandsprodukts wesentlich, wenn man Luxemburg von der Betrachtung ausschließt? Aufgabe 4.8 Die folgende Tabelle enthält die Anzahl der Sitze der im Bundestag vertretenen Parteien ohne die Abgeordneten von Berlin–West für die Jahre 1972 und 1998: Partei CDU/CSU SPD FDP B90/Grüne PDS Summe Sitze 1972 1998 225 245 230 298 41 43 47 36 496 669 a) Berechnen Sie für die Jahre 1972 und 1998 jeweils den Rosenbluth–Index und den Gini–Koeffizienten für die Sitzverteilung der im Bundestag vertretenen Parteien. 25 b) Zeichnen Sie für das Jahr 1998 die Lorenzkurve sowie die Konzentrationskurve. Aufgabe 4.9 Fünf Unternehmen teilen sich einen Markt. Die Gewinne vor Steuern (in 1 000 Euro) sind: 10 , 120 , 10 , 40 , 20 . Bezeichne t(x) die Steuer auf den Gewinn x. Betrachten Sie die drei folgenden Steuertarife: a) proportionaler Steuertarif, t(x) = 0.3x, b) progressiver Steuertarif, 0 für 0 ≤ x ≤ 20 , x − 10 t(x) = x für 20 < x ≤ 110 , 200 0.5x für x > 110 , c) Kopfsteuer, t(x) = 5. Berechnen Sie für jeden der drei Steuertarife die Lorenzkurve und den Gini–Koeffizienten für die Gewinne vor Steuern sowie nach Steuern. Interpretieren Sie die Ergebnisse. Aufgabe 4.10 Gegeben ist die Anzahl (in 100 000) und das durchschnittliche Nettoeinkommen je Monat (in 1 000 Euro) privater Haushalte im früheren Bundesgebiet für das Jahr 2006, geschichtet nach der Höhe des Haushaltsnettoeinkommens (vgl. Aufgabe 3.10): Nettoeinkommen über ... bis einschließlich ... 0 – 1.5 1.5 – 2.5 2.5 – 5 5 – 10 Summe Anzahl der Haushalte 16 50 206 18 290 26 Durchschnittliches Nettoeinkommen 1.12 1.98 3.13 6.75 a) Berechnen Sie den Gini–Koeffizienten. b) Zeichnen Sie die Lorenzkurve. c) Wenn die Angaben über das durchschnittliche Nettoeinkommen fehlen würden, könnten Sie dann trotzdem eine Aussage über die Disparität treffen? Aufgabe 4.11 (T) Bei einer Untersuchung der monatlichen Haushaltseinkommen in Deutschland ergab sich folgende Übersicht: Monatseinkommen in Euro 0 – 750 750 – 1250 1250 – 1750 1750 – 5000 Anzahl Haushalte 347 436 216 97 Berechnen Sie für diese Einkommensverteilung den Gini-Koeffizient. Aufgabe 4.12 In einem Land besitzen die reichsten fünf Prozent der Bevölkerung 40% des gesamten Vermögens, die reichsten 20% sogar 65% des Vermögens. Dahingegen besitzen die ärmsten 50% der Bevölkerung lediglich 10% des Vermögens. Skizzieren Sie die Lorenzkurve und berechnen Sie den Gini-Koeffizient. Aufgabe 4.13 (T) In einem fiktiven Land entfällt auf die 10% der Einkommensbezieher mit dem höchsten Steueraufkommen 40% des gesamten Steueraufkommens, auf die 40% mit dem geringsten Steueraufkommen dagegen nur 20% des gesamten Steueraufkommens. Skizzieren Sie die Lorenzkurve und berechnen Sie den Gini-Koeffizient. 27 5 Verhältnis-, Mess- und Indexzahlen Aufgabe 5.1 Das Statistische Jahrbuch 1995 weist für die Bevölkerung am Jahresende in Nordrhein–Westfalen (in 1 000) folgende Daten aus: Jahr Bevölkerung 1987 1988 1989 1990 1991 1992 1993 16 744 16 874 17 104 17 350 17 510 17 679 17 759 a) Bestimmen Sie die durchschnittliche Wachstumsrate der Bevölkerung in Nordrhein–Westfalen von 1987 bis 1993. b) Berechnen Sie die Messzahlen der Bevölkerung zum Basisjahr 1990. c) Basieren Sie die in b) erhaltenen Messzahlen auf 1993 um. Aufgabe 5.2 (T) In einer Statistik über den Arbeitsmarkt 1996 finden sich die folgenden Daten (Arbeitslosenquote: Arbeitslose in Prozent der abhängigen Erwerbspersonen): Bundesland Baden–Württemberg Bayern Berlin Ost Berlin West Brandenburg Bremen Hamburg Hessen Mecklenburg–Vorpommern Niedersachsen Nordrhein–Westfalen Rheinland–Pfalz Saarland Sachsen Sachsen–Anhalt Schleswig–Holstein Thüringen Arbeitslosenquote (in Prozent) 8.0 7.9 14.4 15.7 16.2 15.6 11.7 9.3 18.0 12.1 11.4 9.4 12.4 15.9 18.8 10.0 16.7 28 abhängige Erwerbspersonen (in Mio.) 4.42 5.09 0.60 0.95 1.15 0.28 0.73 2.52 0.82 3.19 7.26 1.59 0.42 2.03 1.25 1.13 1.14 a) Wie hoch ist die Arbeitslosenquote in Berlin? b) Berechnen Sie jeweils die Arbeitslosenquote für die alten und die neuen Bundesländer. c) Berechnen Sie mit Hilfe der Ergebnisse aus b) die Arbeitslosenquote für alle Bundesländer. Aufgabe 5.3 Ein Fernfahrer legt auf einer Fahrt fünf Streckenabschnitte zurück: Streckenabschnitt 1. 2. 3. 4. 5. Hamburg – Münster Münster – Würzburg Würzburg – München München – Trier Trier – Köln Länge des Streckenabschnitts (in km) 280 345 260 480 175 Durchschnittsgeschwindigkeit (in km/h) 60 55 65 80 75 Berechnen Sie die durchschnittliche Geschwindigkeit für seine Fahrt von Hamburg nach Köln. Aufgabe 5.4 Bruttoinlandsprodukt (BIP) und Bruttoinlandsprodukt je Einwohner 2006 in den fünf neuen Bundesländern betrugen: Bundesland Brandenburg Mecklenburg–Vorpommern Sachsen Sachsen–Anhalt Thüringen BIP (in Mrd. Euro) 49.5 32.3 88.7 50.0 45.8 BIP je Einw. (in 1 000 Euro) 19.3 18.9 20.8 20.2 19.6 Berechnen Sie das Bruttoinlandsprodukt je Einwohner für die fünf neuen Bundesländer insgesamt. Aufgabe 5.5 (T) Ein Computerladen hatte in den Jahren 2001 bis 2006 folgende Umsätze (in 1 000 Euro): 29 Jahr 2001 2002 2003 2004 2005 2006 Umsatz 400 600 750 850 900 950 a) Berechnen Sie die durchschnittliche Wachstumsrate des Umsatzes von 2001 bis 2006. b) Der Computerladen wurde 1998 gegründet. Die durchschnittliche Wachstumsrate von 1998 bis 2001 war 20%. Berechnen Sie die durchschnittliche Wachstumsrate des Umsatzes von 1998 bis 2006. Wie hoch war der Umsatz von 1998? Aufgabe 5.6 (T) Der Pächter einer Tankstelle erhob im Mai 2005 und Mai 2006 Mengen und durchschnittliche Preise für Normalbenzin, Superbenzin und Diesel. Normal Super Diesel Menge (in 1 000 l) Mai 2005 Mai 2006 88 80 95 98 107 105 Preis (in Cent) Mai 2005 Mai 2006 120 131 122 133 107 114 a) Ermitteln Sie die Mengenindizes nach Laspeyres und Paasche für Mai 2006 zur Basis Mai 2005. b) Um wie viel Prozent hat sich der Gesamtumsatz der drei Kraftstoffarten von Mai 2005 bis Mai 2006 verändert? c) Ermitteln Sie die Preisindizes nach Laspeyres und Paasche für Mai 2006 zur Basis Mai 2005. Aufgabe 5.7 Der bayerische Warenkorb besteht bekanntlich aus Weißwurst, Senf, Brezeln und Bier. Folgende Daten wurden bekannt: 30 Umsatz 2006 (in Mio. Euro) Weißwurst Senf Brezen Bier 400 5 150 5 000 Mengenmesszahl q2006 q2005 1.10 0.90 1.05 1.20 a) Berechnen Sie aus diesen Angaben einen geeigneten Mengenindex für das Berichtsjahr 2006 zur Basis 2005. b) Der Gesamtumsatz für die Güter des bayerischen Warenkorbs betrug 2005 5.4 Milliarden Euro. Berechnen Sie einen geeigneten Preisindex für das Berichtsjahr 2006 zur Basis 2005. Aufgabe 5.8 (T) Ein Elektronik-Unternehmen fertigt Hardware, entwickelt Software und erbringt Dienstleistungen. Die Umsatzindizes (Basis 2002=100) seien: Hardwarefertigung Softwareentwicklung Dienstleistungen Umsatzindex 2005 2006 120 130 170 190 100 90 a) Berechnen Sie Umsatzindizes für das gesamte Unternehmen für 2005 und 2006 unter der Annahme, dass im Jahr 2002 40% des Gesamtumsatzes auf Hardwarefertigung und 30% auf Softwareentwicklung entfielen. b) Der Gesamtumsatz des Unternehmens war 2002 80 Mio. Euro. Berechnen Sie für 2002, 2005 und 2006 die Gesamtumsätze sowie die Umsätze der drei Sparten. Aufgabe 5.9 Für den bayerischen Warenkorb aus Aufgabe 5.7 ist über die Veränderungen von Preisen und Mengen von 2000 bis 2006 außerdem Folgendes bekannt geworden: 31 Preisänderung (in Prozent) Weißwurst Senf Brezen Bier + + + + 15 10 5 10 Mengenänderung (in Prozent) +5 0 −5 +5 a) Um wie viel Prozent hat sich der Umsatz des bayerischen Warenkorbes von 2000 bis 2006 (1) insgesamt, (2) durchschnittlich pro Jahr verändert? (Hinweis: Der Umsatz von 2006 ist bekannt!) b) Berechnen Sie für den bayerischen Warenkorb den Preisindex und Mengenindex nach Laspeyres für das Berichtsjahr 2006 zur Basis 2000. c) Wie groß ist der Umsatz des bayerischen Warenkorbs 2006 in Preisen von 2000? Aufgabe 5.10 Der Warenkorb für den privaten Verbrauch eines Indexhaushalts umfasse die Konsumgüter A, B und C. Die Ausgaben für diese drei Güter verhalten sich im Basisjahr 2006 wie 5:3:2. Geben Sie die gesuchten Indizes jeweils für das Berichtsjahr t zur Basis 2006=100 an. a) Bestimmen Sie den Preisindex von Laspeyres unter der Annahme, dass (1) der Preis von Gut A um 7.5% gestiegen ist, während die übrigen Preise unverändert gelten, (2) alle drei Güterpreise einheitlich um 5% gestiegen sind. Zeigen Sie, dass in diesem Fall der Preisindex nach Laspeyres gleich dem Preisindex von Paasche ist. b) Wie hoch ist der Wertindex, wenn unterstellt wird, dass alle drei Güterpreise einheitlich um 10% gestiegen und gleichzeitig alle Verbrauchsmengen um 10% gesunken sind? 32 Aufgabe 5.11 Die amtliche Statistik weist für den nach drei Gütergruppen gegliederten Preisindex nach Laspeyres für die Lebenshaltung aller privaten Haushalte (1991=100) in Ostdeutschland folgende Werte aus: Gütergruppe Gewichtung 1991 (in Prozent) Verbrauchs- und Gebrauchsgüter 76.0 Dienstleistungen und Reparaturen Wohnungs- und Garagennutzung Lebenshaltung insgesamt Preisindex (1991 = 100) 1995 1996 1997 108.5 109.1 110.5 134.4 138.4 143.0 6.5 414.1 100.0 132.9 135.9 a) Wie viel Prozent der Gesamtausgaben für die Lebenshaltung wendet der Indexhaushalt im Basisjahr für die Gütergruppe ”Dienstleistungen und Reparaturen” auf? b) Bestimmen Sie den Preisindex vom Typ Laspeyres für Wohnungs- und Garagennutzung für das Jahr 1996 (1991=100). c) Wie hoch ist die relative Veränderung der Preise für Wohnungs- und Garagennutzung 1996 gegenüber dem Vorjahr? d) Ermitteln Sie den Laspeyres-Preisindex für die Lebenshaltung insgesamt für das Jahr 1997, wenn bekannt ist, dass der entsprechende Laspeyres–Preisindex für Wohnungs- und Garagennutzung von 1996 bis 1997 um 3% gestiegen ist. Aufgabe 5.12 (T) Die italienische Firma ”Bicicletta” exportiert drei Fahrradmodelle A, B und C. Gegeben sind die Außenhandelsumsätze und die relativen Veränderungen der Ausfuhrpreise für die Jahre 2004 bis 2006 : 33 Warenart Umsatz (in 1 000 Euro) A B C Preisveränderung gegenüber dem Vorjahr (in Prozent) 2004 2005 2006 2005 2006 35 45 60 50 45 62 45 51 64 + 20 0 – 8 + 50 – 8 – 20 Berechnen Sie für die Exportware ”Fahrrad” den Preisindex vom Typ Fisher für das Jahr 2006 zur Basis 2004. Aufgabe 5.13 (T) Gegeben seien folgende Daten aus der Volkswirtschaftlichen Gesamtrechung für die Bundesrepublik Deutschland: Jahr 1995 1996 1997 1998 1999 2000 2001 2002 Bruttoinlandsprodukt in jeweiligen Preisen (in Mrd. Euro) 1 801.3 1 833.7 1 871.6 1 929.4 1 978.6 2 030.0 2 073.7 2 110.4 Paasche–Preisindex 1995 = 100 (in Prozent) 100.0 101.0 101.7 102.8 103.3 103.1 104.4 106.1 a) Berechnen Sie für die Jahre von 1995 bis 2002 das reale Bruttoinlandsprodukt in Preisen von 1995. b) Wie groß ist die durchschnittliche jährliche Zuwachsrate des realen Bruttoinlandsproduktes von 1995 bis 2002? 34 6 Auswertung mehrdimensionaler Daten Aufgabe 6.1 (T) Der Personalchef einer Bank möchte untersuchen, ob die Chance, die Aufnahmeprüfung zu bestehen, davon abhängt, ob der Bewerber ein Mann oder eine Frau ist. Unter den 35 Stellenbewerbern befanden sich 21 Männer. Es zeigte sich, dass genau 16 Bewerber, davon 5 Frauen, die Prüfung bestanden. a) Stellen Sie für die Merkmale ”Geschlecht” und ”Prüfungsergebnis” eine Kontingenztabelle auf. b) Sind die Merkmale ”Geschlecht” und ”Prüfungsergebnis” deskriptiv unabhängig? Aufgabe 6.2 Für die Kfz–Werkstätten einer Stadt wurden an einem bestimmten Tag die folgenden beiden Merkmale ermittelt: X: Anzahl der Beschäftigten, Y : Anzahl der reparierten Autos. Dabei erhielt man die folgende Kontingenztabelle: Anzahl der Beschäftigten 2 3 5 8 10 Anzahl der reparierten Autos 3 5 6 8 10 11 12 15 3 1 1 0 0 2 2 0 1 0 0 2 4 4 0 0 0 4 5 1 0 0 1 3 1 0 0 0 5 0 0 0 0 2 3 0 0 0 0 5 a) Bestimmen Sie die Randhäufigkeiten von X und von Y sowie die bedingten relativen Häufigkeiten von Y unter der Bedingung X = 8. b) Geben Sie unter den Betrieben mit acht Beschäftigten den Anteil derjenigen an, die zehn Autos repariert haben. 35 c) Geben Sie den Anteil der Betriebe an, die genau acht Beschäftigte haben und höchstens zehn Autos repariert haben. d) Geben Sie den Anteil der Betriebe an, die höchstens zehn Autos repariert haben. e) Sind X und Y deskriptiv unabhängig? Aufgabe 6.3 Bei den 500 Mitgliedern eines Sportvereins wurden das verfügbare Jahreseinkommen (in 1 000 Euro) und der Schulabschluss erhoben. Es ergab sich: Jahreseinkommen ohne 25 5 0 bis 50 50 bis 70 70 bis 130 Schulabschluss Hauptschule Realschule 10 25 30 45 10 50 Abitur 45 90 165 Wie können Sie den Zusammenhang zwischen den beiden Merkmalen messen? Berechnen Sie die entsprechende Maßzahl. Sind die Merkmale Jahreseinkommen und Schulabschluss deskriptiv unabhängig? Aufgabe 6.4 (T) Um festzustellen, ob ein Zusammenhang zwischen Werbekampagne und Absatzwachstum besteht, wurden 100 Unternehmen nach der angewendeten Werbekampagne sortiert und ihr Absatzwachstum nach der Kampagne notiert: Werbekampagne A B C Absatzwachstum sehr stark stark schwach 19 27 4 7 8 5 1 13 16 Berechnen Sie ein geeignetes Maß für den Zusammenhang zwischen diesen beiden Merkmalen. Aufgabe 6.5 100 zufällig ausgewählte Teilnehmer eines Trainee–Programms für Führungskräfte 36 wurden nach der Anzahl der von ihnen durchschnittlich pro Tag gelesenen Tageszeitungen und der von ihnen durchschnittlich pro Tag verfolgten Nachrichtensendungen im Radio bzw. Fernsehen gefragt. Es ergab sich folgende zweidimensionale Häufigkeitstabelle: Anzahl der Tageszeitungen X ξ1 = 1 ξ2 = 2 ξ3 = 3 Anzahl der Nachrichtensendungen Y η1 = 2 η2 = 3 η3 = 4 20 8 12 25 10 15 5 2 3 a) Berechnen Sie für die Randverteilungen der beiden Merkmale das arithmetische Mittel und die Varianz. b) Geben Sie die relative Häufigkeit des Merkmals X unter der Bedingung Y = ηk für k = 1,2,3 an. c) Sind die Merkmale X und Y deskriptiv unabhängig? Begründen Sie Ihre Antwort anhand der Rechenergebnisse zu Aufgabe b). d) Was können Sie in diesem Fall über die Größe der Kovarianz zwischen den beiden Merkmalen aussagen, ohne die Maßzahl selbst zu berechnen? e) Kann generell aus rXY = 0 auf die deskriptive Unabhängigkeit zwischen den beiden Merkmalen geschlossen werden? Aufgabe 6.6 (T) Im Jahr 1998 wurden 979 Personen unter anderem in bezug auf die Merkmale A: Rauchgewohnheit (Raucher/Nichtraucher), B: Geschlecht (männlich/weiblich), C: Häufigkeit von Kopfschmerz (einmal oder weniger pro Woche/ mehr als einmal pro Woche) befragt. Es ergab sich 37 A Raucher Nichtraucher B männl. weibl. männl. weibl. C einmal oder weniger 22 60 15 37 mehr als einmal 287 159 230 169 a) Geben Sie die Randverteilungen von A, B und C an. b) Geben Sie die gemeinsamen Verteilungen von A und B und von A und C an. Prüfen Sie, ob die Merkmalspaare jeweils deskriptiv unabhängig sind. c) Messen Sie den Zusammenhang von A und B (sowie von A und C) mittels einer geeigneten Maßzahl. Aufgabe 6.7 (T) Zwei Investoren haben 12 Investitionsprojekte nach deren Risiko geordnet. Berechnen Sie eine geignete Maßzahl zur Messung des Zusammenhanges zwischen den Bewertungen der beiden Investoren. Investition A B C D E F G H I J K L Risikobewertung Investor 1 7 8 2 1 9 3 12 11 4 10 6 5 Risikobewertung Investor 2 6 4 1 3 11 2 12 10 5 9 7 8 Aufgabe 6.8 Zehn zufällig befragte Passanten gaben ihre Einstellung zum lokalen Fußballverein (F) und zum dortigen Torschützenkönig der letzten Saison anhand einer Skala von -4 bis +4 an: 38 Person 1 Einstellung zu F Einstellung zu T 2 3 4 1 -1 0 2 -2 2 5 6 7 -2 2 4 3 0 3 4 2 8 9 10 1 -4 -4 -4 -3 0 Berechnen Sie eine Maßzahl für den Zusammenhang zwischen der Einstellung der Befragten zum Fußballverein und zum Torschützenkönig. Begründen Sie Ihre Wahl der Maßzahl und interpretieren Sie das Ergebnis. Aufgabe 6.9 (T) Die folgende Tabelle enthält die Schlusskurse zweier Aktien A und B an elf aufeinanderfolgenden Börsentagen: Tag A B 1 2 3 4 5 6 85 87 90 88 86 103 102 104 105 99 7 8 9 10 11 86 87 90 92 93 91 97 96 96 99 102 101 Messen Sie den Zusammenhang der Kurse der Aktien A und B mit einer geeigneten Maßzahl. Aufgabe 6.10 Bei fünf ausgewählten Diplom–Kaufleuten wurden die Anzahl der während des Studium absolvierten Praktika X und das durchschnittliche Gehalt der ersten drei Berufsjahre Y (in 1 000 Euro) erhoben. Es ergab sich: i xi yi 1 2 3 0 35 31 3 4 5 4 1 2 43 34 37 a) Errechnen Sie den Wert einer geeigneten Maßzahl zur Messung des Zusammenhanges zwischen X und Y . b) Die Diplom–Kaufleute Nr. 1, 2 und 4 haben während ihres Studiums als studentische Hilfskraft gearbeitet. Errechnen Sie den Wert einer geeigneten Maßzahl zur Messung des Zusammenhanges der Merkmale Studentische Hilfskraft“ und ” Gehalt“. Klassieren Sie dazu das Merkmal Gehalt“ (Klassen: bis 33 000 Eu” ” ” ro“, über 33 000 Euro bis 40 000 Euro“ und über 40 000 Euro“). ” ” 39 Aufgabe 6.11 Aufgrund einer Erhebung für zwei metrische Merkmale bei n = 8 Einheiten einer Grundgesamtheit sind folgende Werte bekannt: n X xi yi = 297 , i=1 n X n X xi = 36 , i=1 n X yi = 57 , i=1 xi 2 = 188 , i=1 n X yi 2 = 517 . i=1 Berechnen Sie a) eine Maßzahl für die Stärke des linearen Zusammenhangs zwischen X und Y , b) die Koeffizienten der beiden Regressionsgeraden y = a + bx und x = c + dy. Aufgabe 6.12 (T) Berechnen Sie zu der folgenden Kontingenztabelle die Regressionsgerade y = a + bx. X ξ1 ξ2 ξ3 ξ4 ξ5 =2 =4 =6 =8 = 10 Y η1 = 1 η2 = 2 2 4 3 5 8 3 3 η3 = 3 η4 = 4 2 7 2 3 5 3 Aufgabe 6.13 (T) Nach einem Trainingslager für die 200 Nachwuchsspieler eines Schachvereins stellen die Trainer folgenden Zusammenhang zwischen der Vereinszugehörigkeit in Jahren X und der Anzahl der Siege bei den Probeturnieren während des Lagers Y fest: Vereinszugehörigkeit X über ... bis einschl. ... 0–1 1–2 2–4 4–8 40 Anzahl Siege Y 0–1 2–4 5–6 40 20 10 0 10 30 25 15 0 5 15 30 a) Bestimmen Sie die Randverteilung von X und Y . b) Geben Sie die Verteilung von X für ”fünf bis sechs Siege” an, und errechnen Sie das arithmetische Mittel und die Varianz dieser Verteilung. c) Berechnen Sie die mittlere Anzahl der Siege bei den Nachwuchspielern, die länger als ein Jahr und höchstens zwei Jahre im Verein sind. d) Sind die beiden Merkmale unabhängig? Begründen Sie Ihre Aussage, indem Sie eine Maßzahl für die Abhängigkeit berechnen. Aufgabe 6.14 In einer Studie der britischen Regierung über das Konsumverhalten von Haushalten in verschiedenen Regionen des Landes wurden unter anderem die Anteile der Ausgaben für Tabak X und Alkohol Y an den Gesamtausgaben der Haushalte ermittelt. Region X Y North Yorkshire Northeast East Midlands West Midlands East Anglia Southeast Southwest Wales Scotland Northern Ireland 6.47 6.13 6.19 4.89 5.63 4.52 5.89 4.79 5.27 6.08 4.02 4.03 3.76 3.77 3.34 3.47 2.92 3.20 2.71 3.53 4.51 4.56 a) Berechnen Sie den Korrelationskoeffizienten rXY . Wie würden Sie den Zusammenhang zwischen den Ausgabenanteilen für Tabak und Alkohol charakterisieren? Es gilt 11 11 P P xi = 59.88 , x2i = 332.3292 , i=1 11 P i=1 11 P i=1 yi = 39.80 , 11 P yi2 = 147.4930 , i=1 xi yi = 217.7103 . i=1 41 b) Berechnen Sie die Koeffizienten der linearen Regression von Alkohol auf Tabak sowie den Anteil der durch die Regression erklärten Varianz. c) Führen Sie a) und b) erneut durch, jedoch diesmal ohne die Werte für Northern Ireland. Was fällt Ihnen auf? Aufgabe 6.15 Für fünf ausgewählte private Haushalte wurden jeweils Monatsdurchschnitte für die Höhe des Nettoeinkommens X und die Höhe der Telefonrechnung Y ermittelt: Haushalt Nettoeinkommen X (in 1 000 Euro) Telefonrechnung Y (in 100 Euro) 1 2 3 4 5 2.6 2.1 1.4 3.5 1.7 1.2 0.7 0.5 2.0 0.6 a) Berechnen Sie die Koeffizienten der linearen Einfachregression von Y auf X. b) Prognostizieren Sie unter Verwendung der Ergebnisse von Aufgabe a) die Höhe der Telefonrechnung für einen Haushalt mit einem durchschnittlichen Nettoeinkommen von 2 200 Euro im Monat. c) Um wie viel veränderten sich die durchschnittlichen Ausgaben für das Telefon pro Haushalt, wenn das monatliche Nettoeinkommen um 200 Euro steigt? d) Berechnen Sie das Bestimmtheitsmaß und interpretieren Sie es. Welchen Wert hat der Korrelationskoeffizient? 42 Aufgabe 6.16 Der Output Y einer Volkswirtschaft sei in Abhängigkeit der eingesetzten Produktionsfaktoren Arbeit L und Kapital K betrachtet. Im Folgenden wird unterstellt, dass diese Abhängigkeit durch eine Cobb-Douglas-Produktionsfunktion der Form Y = αK b1 Lb2 beschrieben werden kann. Für die Jahre 2005 bis 2010 liegen folgende Beobachtungen des Outputs und der Produktionsfaktoren vor: i yi (Mrd e) ki (Mrd e) li (1000 Besch.) 1 2270 16000 22000 2 2300 17000 23000 3 2400 19000 24000 4 2470 22000 24000 5 2500 22000 23500 6 2570 24000 25000 Hinweis: Die Ergebnisse sind in dieser Aufgabe sehr empfindlich gegenüber Rundungsfehlern. Auch wenn Sie korrekt gerechnet haben, können hier die Ergebnisse aufgrund der Rundungsfehler extrem von den in der Musterlösung angegebenen Werten abweichen. Sie können diese Aufgabe auch gern mit den Analysefunktionen von Excel lössen. a) Wie muss die Produktionsfunktion transformiert werden, damit die partiellen Elastizitäten b1 und b2 mittels linearer Regression geschätzt werden können? b) Schätzen und interpretieren Sie die Koeffizienten α, b1 und b2 . c) Berechnen Sie das Bestimmtheitsmaß der Regression. Aufgabe 6.17 In der folgenden Tabelle sind Typ und Baujahr der in Deutschland im März 2011 in Betrieb befindlichen Atomkraftwerke angegeben. Zusätzlich liegen Daten über die bis dahin gemeldeten Störfälle vor. (Für diese Aufgabe können Sie auch Excel benutzen.) Name AKW Neckarwest 1 Neckarwest 2 Brokdorf Brunsbüttel Emsland Grafenrheinf. Isar 1 Isar 2 Krümmel Typ DWR DWR DWR SWR DWR DWR SWR DWR SWR Baujahr 1976 1988 1986 1976 1988 1981 1977 1988 1983 Störfälle 427 80 210 462 121 222 280 72 322 43 Name AKW Philippsburg 1 Philippsburg 2 Unterweser Grundremm. A Grundremm. B Biblis A Biblis B Grohnde Typ SWR DWR DWR SWR SWR DWR DWR DWR Baujahr 1979 1984 1978 1984 1984 1974 1976 1984 Störfälle 337 182 340 105 99 419 420 222 Mittels linearer Regression soll untersucht werden, ob das Alter und der Reaktortyp einen Einfluss auf die Häufigkeit der Störfälle haben. a) Wieso ist es nicht sinnvoll, als abhängige Variable die Anzahl der Störfälle zu wählen? b) Betrachten Sie als abhängige Variable die Anzahl Störfälle pro Jahr und führen Sie eine Regression durch, in der das Alter und der Reaktortyp die erklärenden Variablen sind. Hinweis: Beachten Sie, dass die Daten aus dem Jahr 2011 stammen. Berücksichtigen Sie dies bei der Berechnung des Alters des Reaktors. c) Interpretieren Sie die Ergebnisse. Aufgabe 6.18 Betrachten Sie folgenden Excel-Output, in dem die Ergebnisse einer Regression des monatlichen Einkommens dargestellt sind: a) Durch welche Variablen wurde das Einkommen zu erklären versucht? Wie unterscheiden sich die Variablen hinsichtlich ihrer Skalierung? b) Geben Sie die geschätzten Parameter an und interpretieren Sie sie. c) Wie könnte eine Interaktion zwischen den erklärenden Variablen in das Modell aufgenommen werden? Wie lautet dann das Modell? 44 Aufgabe 6.19 (T) Betrachten Sie die Daten für das BNE (in MRD e) der Jahre 2008 bis 2010: BNE (2008-2010) Q4 Q1 Q2 Q3 Q4 2007 2008 2008 2008 2008 643,43 620,05 622,52 642,50 635,78 Q1 Q2 Q3 Q4 2009 2009 2009 2009 586,75 586,74 623,27 634,18 Q1 Q2 Q3 Q4 2010 2010 2010 2010 609,16 618,65 648,30 659,17 Hinweis: Diese Aufgabe kann auch mit Excel gelöst werden. a) Stellen Sie ein Regressionsmodell auf, das das Wachstum des BNE auf eine Quartalsstruktur untersucht. b) Berechnen Sie die Koeffizienten des entsprechenden Regressionsmodells und interpretieren Sie sie. Nutzen Sie dabei die allgemeinen Formeln in Matrixschreibweise. Aufgabe 6.20 Für n = 50 Supermärkte einer Kette wurden für einen bestimmten Monat folgende Größen erhoben: Y = Absatz von Tofu (in kg) X1 = 0 , wenn Supermarkt in einfacher Wohnlage liegt 1 , wenn Supermarkt in gehobener Wohnlage liegt X2 = Anzahl der Kunden im Supermarkt (in 1 000) X3 = Preis in EUR kg X4 = Ausgaben für lokale Marketingmaßnahmen (in EUR) Aus den Daten wurde folgende Regressionsgleichung berechnet: Y = −250 + 220 X1 + 45 X2 − 120 X3 + 0,003 X4 ; R2 = 0,8464. a) Interpretieren Sie die Werte der Regressionskoeffizienten. Welche Benennung haben die Regressionskoeffizienten? 45 b) Prognostizieren Sie den Monatsabsatz von Tofu eines Supermarkts in einfacher Wohnlage mit 1 000 EUR Marketingausgaben im Monat und durchschnittlich 33 200 Kunden bei einem Preis für Tofu von 4,95 EUR pro kg. c) Wie hoch wäre das Ergebnis von b), wenn der Supermarkt statt in einer einfachen Wohnlage in einer gehobenen Wohnlage läge? d) Wieviel Prozent der Varianz des Tofuabsatzes wird durch die Regression erklärt? e) Die Standardabweichung des Tofuabsatzes unter den Supermärkten sY beträgt 400 kg. Wie hoch ist die Standardabweichung der Residuen sU ? 46 Aufgabe 6.21 Ein Politikwissenschaftler interessiert sich für das Abschneiden der jeweils regierenden Partei bei US-Präsidentschaftswahlen und nutzt dazu folgende Daten zu den Wahlen 1948 - 2008: Jahr 1948 1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004 2008 Y 49,55 44,33 57,37 49,55 61,05 42,72 60,67 48,02 41,01 58,77 53,37 37,45 49,23 48,38 50,73 45,60 X1 0 0 1 1 0 0 1 1 0 1 1 1 0 0 1 1 X2 1 0 1 0 1 0 1 1 1 1 0 1 1 0 1 0 X3 3,7 3,0 3,9 6,1 5,1 3,4 5,6 7,7 7,5 7,4 5,4 7,3 5,2 3,9 4,4 6,6 Y Stimmenanteil des Kandidaten der Partei des amtierenden Präsidenten bei der Präsidentschaftswahl in Prozent X1 Parteizugehörigkeit des amtierenden Präsidenten (0 = Demokraten, 1 = Republikaner) Amtierender Präsident stellt sich zur Wiederwahl (0 = nein, 1 = ja) US-Arbeitslosenquote im Oktober des Wahljahrs in Prozent X2 X3 Daraus wurde ein Regressionsmodell Y = b0 + b1 · X1 + b2 · X2 + b3 · X3 + U mit folgenden Ergebnissen berechnet: Y = 53,52 + 5,57 · X1 + 5,49 · X2 − 1,898 · X3 Varianz der Ausgangswerte: s2Y = 729,14 Varianz der regressierten Werte: s2Ŷ = 186,60 Varianz der Residuen: s2U = 542,54 a) i. Interpretieren Sie den Koeffizienten der Arbeitslosenquote. Welche Einheit hat er? ii. Inwiefern kann man von einem Amtsbonus eines amtierenden Präsidenten sprechen? b) Berechnen Sie das R2 der Regression. c) Prognostizieren Sie den Stimmenanteil von Präsident Obama (Demokraten), wenn er sich 2012 zur Wiederwahl stellt und die Arbeitslosenquote im Oktober 2012 bei 9,0 % liegen sollte. 47 7 Elementare Zeitreihenanalyse Aufgabe 7.1 Die Weltbevölkerung betrug in den Jahren 1960 bis 2000: Jahr Bevölkerung (in Mrd.) 1960 1970 1980 1990 2000 3.02 3.70 4.45 5.30 6.06 a) Stellen Sie das Wachstum der Weltbevölkerung graphisch dar. b) Berechnen Sie den linearen Trend sowie den exponentiellen Trend. c) Schätzen Sie mit Hilfe der beiden Ansätze unter b) jeweils den Wert für 2006 und vergleichen ihn mit dem tatsächlichen Wert von 6.55 Milliarden. d) Interpretieren Sie jeweils den Koeffizienten b. Aufgabe 7.2 (T) Der schweizerische ”Landesindex der Konsumentenpreise” (Basis Mai 2000 = 100) betrug in den Jahren 1990 bis 2005: Jahr 1990 1991 1992 1993 1994 1995 1996 1997 Index 82.8 87.6 91.2 94.2 95.0 96.7 97.5 98.0 Jahr 1998 1999 2000 2001 2002 2003 2004 2005 Index 98.0 100.3 101.3 102.0 102.6 103.4 104.7 98.8 a) Berechnen Sie die durchschnittliche Wachstumsrate dieses Indexes für 1990 bis 2005 sowie 2000 bis 2005. b) Bestimmen Sie den linearen und den exponentiellen Trend. Vergleichen Sie das jeweilige Ergebnis mit a). 48 Aufgabe 7.3 Es sei die folgende Zeitreihe gegeben: t 1 yt 5.0 2 3 4 5 6 7 8 7.6 11.2 17.9 26.1 38.6 58.4 87.8 a) Stellen Sie die Zeitreihe graphisch dar. b) Bestimmen Sie die entsprechende Zeitreihe der Zuwachsfaktoren. c) Bestimmen Sie mit einem geeignetem Ansatz die glatte Komponente. Aufgabe 7.4 In einem Land entwickelte sich die Konjunktur, gemessen am Bruttoinlandsprodukt (BIP) in Mrd. Euro, in den Jahren 1997 bis 2006 wie folgt: Jahr 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 BIP 112 311 287 236 418 393 289 477 482 387 a) Stellen Sie den Konjunkturverlauf graphisch dar. Über wie viele Jahre erstreckt sich ein Zyklus? b) Bestimmen Sie die glatte Komponente durch einen gleitenden Durchschnitt geeigneter Ordnung. Aufgabe 7.5 (T) Der amerikanische Dow Jones Börsenindex entwickelte sich zwischen 1987 und 2000 wie folgt (gerundete Werte): ti 1987 1991 1995 1996 1997 1998 1999 yi 2 000 3 000 5 000 6 000 8 000 9 000 10 000 a) Nennen Sie die Bedingungen zur Anwendung der Ihnen bekannten Verfahren zur Bestimmung der glatten Komponente. 49 b) Wählen Sie aufgrund Ihrer Ausführungen eine geeignete Trendfunktion und berechnen Sie diese. Aufgabe 7.6 (T) Die Zahl der Arbeitslosen (in 1 000) in Deutschland betrug: 2003 2004 2005 2006 Jan. 4 624 4 597 5 039 5 010 Apr. 4 497 4 443 4 968 4 790 Juli 4 353 4 360 4 772 4 386 Okt. 4 151 4 207 4 555 4 084 Ermitteln Sie mit Hilfe der Methode der gleitenden Durchschnitte die glatte Komponente für die Zahl der Arbeitslosen. 50