Beschreibende Statistik und Wirtschaftsstatistik

Werbung
Übungsaufgaben
zur Vorlesung
Beschreibende Statistik
und Wirtschaftsstatistik
Universität zu Köln
Wintersemester 2013/2014
c 2013 Seminar für Wirtschafts- und Sozialstatistik
Alle Rechte vorbehalten.
Vorbemerkung
Die in dieser Sammlung zusammengestellten Aufgaben sind für die Übungen und
Tutorien zu Beschreibende Statistik und Wirtschaftsstatistik“ an der Universität zu
”
Köln bestimmt.
In Notation und Aufbau schließt sich die vorliegende Aufgabensammlung der Formelsammlung1 an.
1
E. Bomsdorf, E. Gröhn, K. Mosler, F. Schmid: Definitionen, Formeln und Tabellen zur Stati”
stik“, 7. Aufl., Universität zu Köln, 2011
0
Mathematische Grundlagen
Aufgabe 0.1 (T)
Schreiben Sie ausführlich:
a)
n
X
ai xi ,
b)
i=1
n
X
a,
c)
i=1
2 X
4
X
d)
xi yj ,
i=1 j=1
4
X
xi yi .
i=1
Aufgabe 0.2
Berechnen Sie den Wert der folgenden Summen:
a)
11
X
i,
i=1
b)
8
X
(4i + 5) ,
i=0
2
X
1 2
c)
i ,
2
i=−2
d)
5
X
(i − 3)2
i=1
2
Aufgabe 0.3
Stellen Sie die folgenden Ausdrücke mit Hilfe des Summenzeichens dar:
a) ”Die Summe der ersten fünfzig natürlichen Zahlen.”
b) ”Die Summe der ersten zehn Quadratzahlen.”
c) ”Die Summe der ersten zehn geraden Zahlen.”
d) ”Die Summe der Quadrate aller geraden Zahlen von 100 bis 200.”
Aufgabe 0.4
Es seien die folgenden n = 3 Messreihen der Länge m = 4 gegeben:
x1j
x2j
x3j
x4j
j=1 j=2
1
3
2
4
1
2
5
4
1
j=3
5
6
1
0
.
Berechnen Sie die folgenden Summen mit c = 2:
a)
m X
n
X
b)
c,
i=1 j=1
d)
m X
n
X
m X
n
X
c)
cxij ,
i=1 j=1
(x1j + xi3 ) ,
e)
i=1 j=1
m X
n
X
m X
n
X
(xij + c) ,
i=1 j=1
x1j xi2 .
i=1 j=1
Aufgabe 0.5 (T)
Fassen Sie mit Hilfe des Summenzeichens zusammen:
a) a3 x3 + a2 x2 + a1 x + a0 ,
b) 1 + 4 + 9 + 16 + 25 ,
c) 3x1 + 6x2 + 9x3 + 2x1 y + 4x2 y 2 + 6x3 y 3 ,
d) x1 y1 + x1 y2 + x1 y3 + x2 y1 + x2 y2 + x2 y3 + x3 y1 + x3 y2 + x3 y3 .
Aufgabe 0.6 (T)
Zeigen Sie, dass für beliebige reelle Zahlen x1 , . . . ,x5 gilt
a)
5
X
"
#
5
1X
xi −
xj = 0 ,
5 j=1
5
X
"
1X
xi −
xj
5 j=1
i=1
b)
i=1
5
#2
=
5
X
i=1
1
x2i −
5
5
X
xi
i=1
!2
.
Gelten diese Aussagen auch noch, wenn 5 durch eine beliebige natürliche Zahl n
ersetzt wird?
Aufgabe 0.7
Berechen Sie den Wert der folgenden Produkte:
a)
5
Y
i=1
i,
5
Y
b)
(2i2 ) ,
i=1
c)
20 Y
i=1
2
1
1+
i
,
d)
3
Y
(2i − 1) .
i=−2
Aufgabe 0.8 (T)
Fassen Sie mit Hilfe des Produktzeichens zusammen:
a) 3 · 4 · 5 · 6 · 7 · 8 ,
b) 1 · 4 · 9 · 16 · 25 ,
c)
49 · 48 · 47 · 46 · 45 · 44
,
1·2·3·4·5·6
d) 3 · 6 · 9 · 12 · 15 .
Aufgabe 0.9 (T)
Ein Kunde zahlt zu Jahresbeginn jeweils 1 000 Euro auf sein Sparbuch ein. Pro Jahr
erhält er 5% Zinsen.
a) Welcher Betrag steht dem Kunden zu Beginn des 4. Jahres zur Verfügung?
b) Versuchen Sie den mathematischen Zusammenhang für einen Zeitraum von 10
Jahren in allgemeiner Schreibweise zusammenzufassen.
3
1
Grundbegriffe
Aufgabe 1.1
Bezeichnen Sie für die folgenden Merkmale jeweils das Skalenniveau, auf dem das
Merkmal gemessen wird, und nennen Sie mögliche Merkmalsausprägungen.
Geschlecht
Rendite von Wertpapieren
Handelsklasse
Religionszugehörigkeit
Geburtsdatum
Sparguthaben
Kontonummer
Gewicht
Freizeitbeschäftigung
Schulbildung
Aufgabe 1.2 (T)
a) Welche der folgenden Merkmale sind häufbar bzw. nichthäufbar?
Geschlecht
Freizeitbeschäftigung
Familienstand
Beruf
Religionszugehörigkeit
Staatsangehörigkeit
Wertungsnote beim Eiskunstlauf
Steuerklasse
Studienfach
Hotelkategorie
b) Geben Sie bei den folgenden Größen an, ob es sich um eine Bestands- oder
eine Bewegungsmasse handelt. Nennen Sie für jede Bestandsmasse zugehörige
Bewegungsmassen.
Bevölkerung
Umsatz
Anzahl der Arbeitslosen
Autoproduktion
Investitionen
Vermögen
Zinsen aus Vermögen
Geburten und Sterbefälle
Zugelassene Kraftfahrzeuge
Einkommen
4
2
Auswertung eindimensionaler Daten
Aufgabe 2.1
Der Verband der Tierschützer befragt 40 Haushalte einer Reihenhaussiedlung nach
der Anzahl der gehaltenen Haustiere. Dabei ergibt sich folgendes Ergebnis:
7, 1, 1, 2, 0, 2, 3, 2, 1, 0, 7, 0, 4, 1, 3, 1, 1, 1, 2, 0,
5, 1, 1, 0, 2, 0, 0, 1, 2, 1, 6, 1, 1, 0, 0, 1, 1, 0, 3, 8.
a) Geben Sie für die Anzahl der Haustiere die diskrete Klassierung mit absoluten
und mit relativen Häufigkeiten an und stellen Sie sie graphisch dar.
b) Bestimmen Sie den Modus.
Aufgabe 2.2
In der Betriebskantine werden verschiedene Mittagessen angeboten. Zur Wahl stehen:
ein vegetarisches Essen (VE), ”Fast Food” (FF), ein Eintopf (E) und ein Komponentenessen (KE). Im letzten Monat wurden von den Mitarbeitern insgesamt 500 Essen
wie folgt bestellt:
Mittagessen
Anzahl der Mitarbeiter
VE
85
FF E KE
135 92 188
a) Bezeichnen Sie die statistischen Begriffe, die den folgenden Angaben in der
Aufgabenstellung entsprechen:
(1) die Zahl 500,
(2) das Essen ”Eintopf”,
(3) die Zahl 85,
(4) die Gesamtheit der Paare (VE , 85), (FF , 135), (E , 92), (KE , 188)?
b) Berechnen Sie die relativen Häufigkeiten und stellen Sie sie graphisch dar.
Aufgabe 2.3 (T)
Zehn Untersuchungseinheiten wurden aus einer bestimmten Grundgesamtheit gezogen und jeweils das Merkmal X gemessen
x1 = 3, x2 = 1, x3 = 4, x4 = 5, x5 = 2, x6 = 6, x7 = 3, x8 = 4, x9 = 1, x10 = 5.
5
a) Zeichnen Sie die empirische Verteilungsfunktion.
b) Lassen sich aus einer empirischen Verteilungsfunktion die absoluten Häufigkeiten der Merkmalswerte ermitteln?
Aufgabe 2.4
Bei einer Abschlussprüfung sind 18 Aufgaben zu bearbeiten, wobei pro Aufgabe ein
Punkt erzielt werden kann. Als nicht bestanden“ gilt die Prüfung, wenn ein Kandidat
”
weniger als sieben Punkte erreicht. Bei sieben bis vierzehn Punkten wird die Note
bestanden“ vergeben, bei mehr als vierzehn Punkten die Note mit besonderem
”
”
Erfolg bestanden“.
Die Korrektur der Klausur ergab folgende Häufigkeitsverteilung der erreichten Punktzahlen ξj :
ξj
0
1 2 3
4 5
6 7 8
9 10 11
12 13 14 15 16 17
18
nj
4
1 1 0
7 5
6 4 7
7 17 22
13 16
0
1
5
2
2
a) Errechnen Sie die diskrete Klassierung gemäß den vergebenen Noten und stellen
Sie die absoluten Häufigkeiten sie graphisch dar.
b) Inwiefern ist die diskrete Klassierung nach Noten mehr oder weniger informativ
als die Klassierung nach Punktzahlen?
Aufgabe 2.5 (T)
In der Kölner Fußgängerzone wurden 60 zufällig ausgewählte Erwachsene nach ihrem
höchsten Schul- oder Studienabschluss befragt. Dabei wurden die folgenden Antworten registriert:
Abschluss
Häufigkeit
ohne
Hauptschule
Realschule
Gymnasium
Fachhochschule
Universität
6
4
20
15
10
5
6
a) Stellen Sie die diskrete Klassierung graphisch dar.
b) Geben Sie die relativen Häufigkeiten an.
Aufgabe 2.6
Ein Marktforschungsinstitut befragt 40 Kunden eines Teeladens nach der Anzahl der
von ihnen durchschnittlich pro Tag getrunkenen Tassen Tee. Dabei ergaben sich die
folgenden Zahlen:
Anzahl der Tassen
1
2
3
4
5 6
Anzahl der Kunden
4
8 15 6
5 2
a) Wie hoch ist der Anteil der Kunden, die höchstens 4 Tassen pro Tag trinken?
b) Wie hoch ist der Anteil der Befragten, die mindestens 3 und höchstens 5 Tassen
pro Tag trinken?
c) Welche Anzahl an Tassen pro Tag wird von 95% der Kunden nicht überschritten?
d) Der kleinste Wert x, für den F (x) ≥ 0.5 gilt, heißt Median. Bestimmen Sie für
die angegebenen Daten den Median. Wie verändert sich der Median, wenn einer
der Kunden statt 2 Tassen Tee pro Tag 7 Tassen angeben würde?
Aufgabe 2.7
Für die 25 Tage eines Monats, an dem ein Einzelhändler sein Geschäft geöffnet hatte,
wurden folgende Verkaufszahlen eines bestimmten Artikels registriert:
an
an
an
an
an
an
an
3
2
4
3
8
4
1
Tagen:
Tagen:
Tagen:
Tagen:
Tagen:
Tagen:
Tagen:
0
1
2
3
4
6
8
Stück ,
Stück ,
Stück ,
Stück ,
Stück ,
Stück ,
Stück .
a) Geben Sie die Grundgesamtheit und das Merkmal an.
7
b) Stellen Sie die Daten in einer Häufigkeitstabelle mit absoluten und relativen
Häufigkeiten dar.
c) Geben Sie die empirische Verteilungsfunktion explizit an und stellen Sie diese
graphisch dar.
d) Betrachten Sie jeweils den Anteil der Tage, an denen
(1) höchstens 4,
(2) weniger als 4,
(3) höchstens 2.5,
(4) mehr als 2.5,
(5) mindestens 2,
(6) mehr als 2 und höchstens 6.3
Stück verkauft wurden. Drücken Sie diese Anteile durch die empirische Verteilungsfunktion aus und berechnen Sie diese.
e) Berechnen Sie den Median und interpretieren Sie ihn.
f) Finden Sie das kleinste x, für das F (x) ≥ 0.3 ist.
Aufgabe 2.8 (T)
Die Umfrage des Tierschützerverbandes in der Reihenhaussiedlung aus Aufgabe 2.1
ergab folgendes Ergebnis:
Anzahl der Haustiere
Anzahl der Haushalte
0
1
2
3
4
5
6
7
8
10
15
6
3
1
1
1
2
1
a) Berechnen Sie die empirische Verteilungsfunktion und stellen Sie sie graphisch
dar.
8
b) Bestimmen Sie für die Anzahl der Haustiere rechnerisch und graphisch den
Median und das 0.7–Quantil und interpretieren Sie diese Werte.
c) Welche Haustieranzahl wird nur von 10% der Befragten überschritten?
Aufgabe 2.9
Bei einer statistischen Untersuchung wurden für ein metrisches Merkmal X die Daten
x1 ,x2 , . . . ,x100 gemessen und daraus die empirische Verteilungsfunktion berechnet:

0
für x < 3 ,




0.20 für 3 ≤ x < 4 ,



0.45 für 4 ≤ x < 6 ,
F (x) =
0.50 für 6 ≤ x < 10 ,




0.75
für 10 ≤ x < 12 ,



1
für x ≥ 12 .
Stellen Sie die empirische Verteilungsfunktion graphisch dar und bestimmen Sie anhand der Graphik das untere und obere Quartil.
9
Aufgabe 2.10 (T)
Aus 20 Messwerten für ein Merkmal X wurde die folgende graphische Darstellung
der empirischen Verteilungsfunktion ermittelt:
✻
1,0
s
0,9
s
0,8
s
0,7
0,6
s
0,5
s
s
0,4
s 0,3
s
0,2
s
0,1
s
✲
−5 −4 −3 −2 −1
1
2
3
4
5
6
7
a) Beschriften Sie die Achsen.
b) Geben Sie die empirische Verteilungsfunktion explizit an.
c) Bestimmen Sie die absoluten und relativen Häufigkeiten.
Aufgabe 2.11 (T)
Eine Autozeitschrift will zwei neue Kleinwagen vergleichen. Von Interesse ist unter
anderem der Benzinverbrauch auf 100 km. Mit Wagen A werden 50 Fahrten gemacht.
Das Ergebnis der Messungen zeigt die folgende Tabelle:
10
Benzinverbrauch
(in Litern je 100 km)
Anteil der Fahrten
5.0
5.5
6.0
6.4
6.9
7.5
7.8
0.02
0.06
0.16
0.30
0.34
0.08
0.04
Da der Redaktionsschluss naht, können mit Wagen B nur noch 20 Fahrten unternommen werden. Die Testergebnisse sind die folgenden:
4.2, 4.8, 4.8, 4.8, 5.4, 5.4, 5.4, 5.4, 5.4, 5.4,
5.9, 5.9, 5.9, 5.9, 5.9, 5.9, 6.0, 6.0, 6.0, 6.5.
a) Berechnen Sie für Wagen B die relativen Häufigkeiten und stellen Sie sie graphisch dar.
b) Bestimmen Sie für den Benzinverbrauch bei Wagen A und B jeweils den Median.
c) Auf wie vielen Fahrten haben Wagen A bzw. Wagen B weniger als 6.5 Liter
verbraucht?
Aufgabe 2.12
Der Verband der Tierschützer, der auch die Umfrage in der Reihenhaussiedlung gemacht hat (vgl. Aufgabe 2.1 und 2.8), befragt zusätzlich die 20 Parteien eines Hochhauses nach der Anzahl der Haustiere. Dabei ergibt sich folgendes Ergebnis:
6, 1, 2, 0, 0, 0, 1, 0, 0, 0, 4, 1, 3, 0, 1, 1, 2, 0, 5, 1.
a) Berechnen Sie für die Anzahl der Haustiere den Median, das 1. und 3. Quartil
und das 0.33–Quantil.
b) Zeichnen Sie den zugehörigen Boxplot.
11
Aufgabe 2.13 (T)
In einer Automobilfabrik wurden die Höchstgeschwindigkeiten von 400 Kraftfahrzeugen eines bestimmten Typs gemessen. Dabei ergaben sich folgende Messergebnisse:
Höchstgeschwindigkeit
(in km/h)
absolute Häufigkeit
[135,140]
]140,142]
]142,144]
]144,146]
]146,148]
]148,150]
]150,155]
18
38
82
105
89
46
22
a) Bestimmen Sie die relativen Häufgkeiten der stetigen Klassierung.
b) Stellen Sie die Daten anhand eines Histogramms graphisch dar.
c) Zeichnen Sie die empirische Verteilungsfunktion.
Aufgabe 2.14
Gegeben ist die Bevölkerung Deutschlands nach Altersklassen im Jahr 1997:
Altersklasse
(in Jahren)
0 - 15
15 - 21
21 - 40
40 - 60
60 - 65
65 - ...
Bevölkerung in Millionen
östliche Bundesländer westliche Bundesländer
2.28
1.28
4.21
4.26
0.99
2.35
10.82
4.17
19.45
17.65
3.97
10.62
a) In welchen Bundesländern ist der Anteil der Menschen bis 18 Jahre höher? In
welchen Bundesländern ist der Anteil der Menschen, die über 62 Jahre alt sind,
höher?
b) Zeichnen Sie die empirische Verteilungsfunktion F (x) für die östlichen Bundesländer.
12
c) Zeichnen Sie für die Altersverteilung der östlichen Bundesländer ein Histogramm.
Hinweis: Nehmen Sie an, dass die Obergrenze der letzten Klasse xo6 = 100 ist.
13
3
Lage- und Streuungsmaße
Aufgabe 3.1 (T)
In einer Gemeinde wurde die Haushaltsgröße der privaten Haushalte ermittelt. Dabei
ergaben sich die folgenden Daten:
Anzahl der Personen
je Haushalt
Anzahl der Haushalte
1
2
3
4
5
6
7
8
9
10
1 319
1 203
577
455
119
32
12
5
3
1
a) Berechnen Sie die durchschnittliche Haushaltsgröße in der Gemeinde.
b) Bestimmen Sie die Quartile der Haushaltsgröße.
Aufgabe 3.2
Aus einer Urliste von Daten wurde die folgende empirische Verteilungsfunktion berechnet:

0
für x < 2 ,




0.15 für 2 ≤ x < 3 ,



0.35 für 3 ≤ x < 5 ,
F (x) =
0.60 für 5 ≤ x < 8 ,




0.80
für 8 ≤ x < 10 ,



1
für x ≥ 10 .
a) Bestimmen Sie den Median der Daten.
b) Berechnen Sie das arithmetische Mittel.
c) Was können Sie über die Anzahl der Daten in der Urliste sagen?
14
Aufgabe 3.3 (T)
An zwei Registrierkassen eines Supermarktes wurden eine Stunde lang jeweils die
Bedienungszeiten (in Sekunden) gemessen:
Kasse 1
Kasse 2
35 45 15 36 68 75 12 9 35 23 45 25 28 67 46
76 21 49 63 47 48 69 62 52 41 68 79 45 32 11 12 16 45 23 7
a) Berechnen Sie die arithmetischen Mittel der Bedienungszeiten für die zwei Kassen getrennt sowie für beide Kassen insgesamt.
b) Bestimmen Sie für jede Kasse den Median sowie das untere und obere Quartil
der Bedienungszeiten. Zeichnen Sie für beide Kassen die Boxplots der Bedienungszeiten.
Aufgabe 3.4
Ein Haus wird von zehn Personen bewohnt. Fünf dieser Personen haben ein Monatseinkommen von je 2 500 Euro, die übrigen Personen haben Monatseinkommen von
2 600, 2 700, 2 800, 2 900 und 3 000 Euro. In das Haus zieht eine weitere Person ein,
deren Monatseinkommen 100 000 Euro beträgt. Welche Auswirkungen ergeben sich
dadurch auf den Modus, den Median und das arithmetische Mittel der Monatseinkommen aller Einwohner des Hauses?
Aufgabe 3.5
Im Rahmen einer Flurbereinigung werden die Nutzflächen (in ha) von 40 landwirtschaftlichen Betrieben ermittelt:
3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 8, 9, 9, 9, 9, 10, 10, 14,
16, 16, 18, 21, 25, 28, 33, 36, 40, 40, 48, 60, 69, 77, 77, 80, 99.
a) Berechnen Sie aus diesen Einzelwerten die durchschnittliche Nutzfläche und die
Varianz der Nutzfläche.
b) Bilden Sie eine stetige Klassierung der Daten (Klassen: 2 bis 4, über 4 bis 9,
über 9 bis 20, über 20 bis 50, über 50 bis 100 ha), und berechnen Sie daraus
die durchschnittliche Nutzfläche. Begründen Sie den Unterschied zu a).
c) Berechnen Sie zunächst für jede Klasse aus b) den Durchschnitt und aus den
Klassendurchschnitten den Gesamtdurchschnitt der Nutzfläche.
15
d) Berechnen Sie die Varianz der Nutzfläche aus der stetigen Klassierung in b).
Begründen Sie den Unterschied zu a).
Aufgabe 3.6 (T)
Gegeben sind die drei nachstehenden stetigen Klassierungen I, II und III:
j
Kj
I
nj
1
2
3
4
5
[0,5]
]5,10]
]10,15]
]15,20]
]20,25]
5
6
4
3
2
II
nj
III
nj
3
4
6
4
3
2
3
4
6
5
Bestimmen Sie für jede Verteilung die Lagemaße Median und arithmetisches Mittel
und vergleichen Sie die Verteilungen.
Aufgabe 3.7 (T)
Stundenlohn im Bereich ”Bergbau und Gewinnung von Steinen und Erden” in europäischen Ländern 1992 (in DM):
Stundenlohn
(in DM)
Land
Deutschland
Früheres Bundesgebiet
Neue Länder und Berlin–Ost
Frankreich
Griechenland
Großbritannien und Nordirland
Italien
Niederlande
Spanien
55.58
28.65
49.64
18.01
38.82
35.87
55.66
39.95
a) Berechnen Sie für den Stundenlohn:
(1) das arithmetische Mittel ohne Berücksichtigung einer Gewichtung und den
Median,
16
(2) die Spannweite und den Quartilabstand.
b) Beantworten Sie (ohne Rechnung !) folgende Fragen :
(1) Welche der in a) (1) bzw. der in a) (2) berechneten Größen verändert sich
stärker, falls man Griechenland nicht berücksichtigt?
(2) Wie verändern sich die in a) berechneten Größen, falls der Stundenlohn in
Euro gemessen wird? (1.95583 DM = 1 Euro)
c) Berechnen Sie die Varianz. Wie verändert sich dieses Streuungsmaß, falls
(1) Griechenland nicht berücksichtigt wird,
(2) der Stundenlohn in Euro gemessen wird?
Aufgabe 3.8 (T)
In einer Fertigungshalle eines Betriebs seien fünf Produktionsstätten P1 , . . . ,P5 auf
einer Fertigungsstraße entlang einer Geraden hintereinander in folgenden Abständen
angeordnet (Start der Straße bei Meter Null):
P1
P2
P3
P4
P5
Meter
✉
0
10
22
30
36
48
Produktionsstätte
P1
P2
P3
P4
P5
Anzahl der Arbeiter
8
5
2
5
18
Um die Produktionsstätten mit Material zu beliefern, soll ein Zwischenlager auf dieser
Straße gebaut werden. Die Summe der von den Arbeitern zurückgelegten Wegstrecken
zum Lager soll minimal werden. (Nehmen Sie dafür an, dass jeder Arbeiter einer
Produktionsstätte einmal am Tag zum Lager muss.) Wo würden Sie, wenn jeder
Platz an der Straße ansonsten in gleicher Weise geeignet ist, das Lager bauen?
Aufgabe 3.9 (T)
Es sei x1 , . . . ,xn eine Messreihe und x das zugehörige arithmetische Mittel.
17
a) Man zeige: Werden die Werte der Messreihe gemäß yi = a + b · xi , i = 1, . . . n,
linear transformiert, so gilt für das arithmetische Mittel y der transformierten
Werte
y = a + b · x,
d.h. das arithmetische Mittel der transformierten Werte ist gleich dem transformierten arithmetischen Mittel der ursprünglichen Werte.
b) Auf einer Touristeninsel in der Karibik wurden in den letzten beiden Juliwochen jeweils morgens zur gleichen Zeit die folgenden Lufttemperaturen in Grad
Fahrenheit (◦ F) gemessen:
76, 84, 82, 76, 77, 85, 81,
79, 80, 81, 82, 81, 79, 77 .
Man berechne die Durchschnittstemperatur, d. h. das arithmetische Mittel der
gemessenen Temperaturen, in Grad Fahrenheit (◦ F) und in Grad Celsius (◦ C).
Hinweis: x[◦ F ] entsprechen y =
5
9
· (x − 32)[◦ C].
Aufgabe 3.10 (T)
Die folgende Tabelle enthält die Anzahl (in 100 000) und das durchschnittliche Nettoeinkommen je Monat (in 1 000 Euro) privater Haushalte im früheren Bundesgebiet
für das Jahr 2006:
Nettoeinkommen
über ... bis einschließlich ...
0 – 1.5
1.5 – 2.5
2.5 – 5
5 – 10
Summe
Anzahl der
Haushalte
16
50
206
18
290
Durchschnittliches
Nettoeinkommen
1.12
1.98
3.13
6.75
a) Zeichnen Sie das Histogramm und die empirische Verteilungsfunktion.
b) Berechnen Sie für alle privaten Haushalte
(1) das durchschnittliche Nettoeinkommen,
(2) die Standardabweichung des Nettoeinkommens.
18
Aufgabe 3.11
Bruttoinlandsprodukt (BIP) 1998 in den fünf neuen Bundesländern in Mrd. DM:
Bundesland
BIP
Brandenburg
Mecklenburg–Vorpommern
Sachsen
Sachsen–Anhalt
Thüringen
77.8
48.4
125.3
71.4
66.5
a) Berechnen Sie für das Bruttoinlandsprodukt das arithmetische Mittel und den
Median.
b) Berechnen Sie die Spannweite, den Quartilabstand, die mittlere absolute Abweichung vom Median und die Varianz.
c) Wie verändern sich die in a) und b) berechneten Größen, falls das Bruttoinlandsprodukt in Euro gemessen wird? (1.95583 DM = 1 Euro)
Aufgabe 3.12
Ein junges Kraftfahrt-Versicherungsunternehmen will die Vollkasko-Schäden des vergangenen Geschäftsjahres auswerten. Folgende Daten liegen vor [Angaben in Tsd.
Euro]:
5,5 5,9 6,1 6,4 6,4 6,7 6,7
7,1 7,1 7,2 7,5 7,6 7,8 8,2
8,7 9,2 9,5 10,1 24,0 27,5 71,0
a) Berechnen Sie das arithmetische Mittel x sowie das α-getrimmte Mittel xα für
α = 0,1 und α = 0,2. Was fällt dabei auf?
b) Berechnen Sie die Standardabweichung sowie die mittlere absolute Abweichung
vom Median.
c) Berechnen Sie für die erste Zeile der Daten Ginis mittlere Differenz.
Aufgabe 3.13
70% der Belegschaft einer Firma sind Arbeiter, 25% Angestellte und 5% leitende
Angestellte. Die folgende Tabelle enthält die arithmetischen Mittel und Standardabweichungen der Monatslöhne bzw. -gehälter (in Euro) dieser Gruppen:
19
Arbeiter
Angestellte
Leitende Angestellte
Arithmetisches Mittel
3 000
5 000
11 000
Standardabweichung
1 000
2 000
4 000
a) Berechnen Sie das arithmetische Mittel und die Standardabweichung der Monatslöhne bzw. -gehälter aller Beschäftigten.
b) Wie groß ist der Anteil der durch die Aufteilung der Belegschaft in Arbeiter,
Angestellte und leitende Angestellte erklärten Varianz an der Gesamtvarianz
der Löhne bzw. Gehälter?
c) Tariferhöhungen ergeben:
• für Arbeiter 5% lineare Erhöhung und 200 Euro Sockelbetrag,
• für Angestellte 3% lineare Erhöhung und keinen Sockelbetrag,
• für leitende Angestellte keine Erhöhungen.
Berechnen Sie die Werte für a) und b) nach der Tariferhöhung.
Aufgabe 3.14
Bruttojahreseinkommen von Erwerbstätigen in einem Kölner Stadtteil:
Bruttojahreseinkommen (in Tsd. Euro
über ... bis einschließlich ...
0 – 20
20 – 50
50 – 100
Anzahl der
Erwerbstätigen
400
1 983
423
a) Stellen Sie die empirische Verteilungsfunktion graphisch dar.
b) Wie hoch ist der Anteil der Erwerbstätigen, die im Jahr höchstens 12 000 Euro
brutto verdienen?
c) Wie hoch ist der Anteil der Erwerbstätigen, deren Bruttojahreseinkommen zwischen 65 000 und 85 000 Euro liegt?
d) Welches Bruttojahreseinkommen überschreiten die oberen 50% der aufgeführten
Personen?
20
e) Wie hoch ist im Durchschnitt das Bruttojahreseinkommen der Erwerbstätigen
in dem Stadtteil?
f) Berechnen Sie Quartilabstand, Varianz und Standardabweichung des Einkommens.
21
4
Konzentrations- und Disparitätsmessung
Aufgabe 4.1
Der deutsche Markt für Mobiltelefone teilte sich am 1.2.2007 wie folgt auf (Schätzungen):
Netz
T–Mobil (D1–Netz)
Vodafone (D2–Netz)
E–Plus (E1–Netz)
O2 (E2–Netz)
Teilnehmer
30 700 000
30 400 000
12 700 000
11 000 000
Berechnen Sie für diesen Markt den Rosenbluth–Index sowie den Herfindahl–Index.
Aufgabe 4.2 (T)
Die folgende Tabelle enthält die Marktanteile der größten Fernsehanstalten (in Prozent), gemessen am Anteil an der täglichen durchschnittlichen Fernsehdauer, für den
Juni 1998:
Fernsehanstalt
ARD
ZDF
Dritte
RTL
SAT.1
PRO 7
RTL 2
Kabel 1
VOX
Super RTL
n–tv
3sat
arte
DSF
Eurosport
Summe
Marktanteil
(in Prozent)
19.9
17.4
11.3
13.8
9.0
7.9
3.4
4.1
2.5
2.7
0.6
0.9
0.4
1.1
0.9
95.9
a) Berechnen Sie die Konzentrationsraten CR(3) und CR(5) für Juni 1998.
22
b) Berechnen Sie unter der Annahme, dass sich die verbleibenden Marktanteile
zu gleichen Teilen auf 35 kleinere Sparten- und Regionalsender verteilen, den
Rosenbluth–Index für Juni 1998.
Hinweis:
50
P
i = 1 155.
i=16
Aufgabe 4.3
Für drei Aktiengesellschaften sind in folgender Tabelle die prozentualen Anteile der
vier größten Aktionäre am Aktienkapital gegeben:
AG
1
2
3
Anteil des i-t-größten
Aktionärs (in Prozent)
i=1 i=2 i=3 i=4
40
20
12
1
20
10
10
10
51
9
8
7
a) Berechnen Sie für die drei Aktiengesellschaften die Konzentrationsraten CR(1),
CR(2), CR(3) und CR(4).
b) Bei welcher AG ist das Aktienkapital am stärksten konzentriert, wenn CR(3)
bzw. CR(4) als Konzentrationsmaß verwendet wird?
c) Welchen Wert erhält man für den Rosenbluth–Index der AG 2, wenn man annimmt, dass sich der Streubesitz gleichmäßig auf weitere 9 996 Aktionäre aufteilt?
Aufgabe 4.4
Fünf Unternehmen teilen sich einen Markt. Die Umsätze sind (in Mio. Euro):
7 , 10 , 4 , 9 , 10 .
Einen anderen Markt teilen sich sieben Unternehmen. Die Umsatzanteile in Prozent
sind:
30 , 15 , 15 , 15 , 10 , 10 , 5 .
23
a) Zeichnen Sie für beide Märkte die Konzentrationskurven. Können Sie auf der
Grundlage der beiden Konzentrationskurven feststellen, welcher Markt die höhere Umsatzkonzentration aufweist?
b) Berechnen Sie für beide Märkte den Rosenbluth–Index und den Herfindahl–
Index.
Aufgabe 4.5
Zehn Anbieter teilen sich einen Markt. Sie kennen lediglich die Konzentrationsraten
CR(3) = 0.6 und CR(5) = 0.8. Was können Sie über den Verlauf der Konzentrationskurve sagen? Geben Sie eine Verteilung der Anteile an, die mit den beiden gegebenen
Konzentrationsraten verträglich ist und den geringstmöglichen Wert des Rosenbluth–
Indexes ergibt.
Aufgabe 4.6 (T)
Ein Markt besteht aus fünf Ein–Personen–Betrieben. Bei einer Erhebung ergaben sich
folgende Umsätze der Betriebe und Monatseinkommen der Besitzer (in 1 000 Euro):
Betrieb
Umsatz
Einkommen
I
II
III IV
V
100 250 125 200 150
10
7 12 15
9
a) Berechnen Sie eine Maßzahl für die Konzentration des Marktes.
b) Berechnen Sie eine Maßzahl für die Disparität der Einkommen.
c) Zeichnen Sie die Konzentrationskurve und die Lorenzkurve.
d) Ein neuer Betrieb mit Umsatz null kommt hinzu. Der Besitzer verdient dementsprechend auch nichts. Berechnen Sie die Konzentration des Marktes und die
Disparität der Einkommen. Erklären Sie die Unterschiede zu a) und b).
Aufgabe 4.7 (T)
Die folgende Tabelle enthält für die Länder der EU im Jahr 1998 jeweils die Einwohnerzahl, das Bruttoinlandsprodukt (BIP) sowie die Anzahl der Sitze im Europäischen Parlament:
24
Land
A
B
D
DK
E
F
FIN
GB
GR
I
IRL
L
NL
P
S
Einwohner
(in Mio.)
8.1
10.2
82.1
5.3
39.3
58.6
5.1
59.0
10.5
57.5
3.7
0.4
15.6
9.8
8.9
BIP
(in Mrd. DM)
391
494
3 758
281
1 326
2 614
225
2 517
305
2 522
168
30
729
305
380
Sitze
21
25
99
16
64
87
16
87
25
87
15
6
31
25
22
a) Bestimmen Sie die Gini–Koeffizienten zu den drei Verteilungen.
b) Ändert sich die Disparität des Bruttoinlandsprodukts wesentlich, wenn man
Luxemburg von der Betrachtung ausschließt?
Aufgabe 4.8
Die folgende Tabelle enthält die Anzahl der Sitze der im Bundestag vertretenen Parteien ohne die Abgeordneten von Berlin–West für die Jahre 1972 und 1998:
Partei
CDU/CSU
SPD
FDP
B90/Grüne
PDS
Summe
Sitze
1972 1998
225
245
230
298
41
43
47
36
496
669
a) Berechnen Sie für die Jahre 1972 und 1998 jeweils den Rosenbluth–Index und
den Gini–Koeffizienten für die Sitzverteilung der im Bundestag vertretenen Parteien.
25
b) Zeichnen Sie für das Jahr 1998 die Lorenzkurve sowie die Konzentrationskurve.
Aufgabe 4.9
Fünf Unternehmen teilen sich einen Markt. Die Gewinne vor Steuern (in 1 000 Euro)
sind:
10 , 120 , 10 , 40 , 20 .
Bezeichne t(x) die Steuer auf den Gewinn x. Betrachten Sie die drei folgenden Steuertarife:
a) proportionaler Steuertarif, t(x) = 0.3x,
b) progressiver Steuertarif,

0
für 0 ≤ x ≤ 20 ,




 x − 10
t(x) =
x für 20 < x ≤ 110 ,

200




0.5x
für x > 110 ,
c) Kopfsteuer, t(x) = 5.
Berechnen Sie für jeden der drei Steuertarife die Lorenzkurve und den Gini–Koeffizienten für die Gewinne vor Steuern sowie nach Steuern. Interpretieren Sie die Ergebnisse.
Aufgabe 4.10
Gegeben ist die Anzahl (in 100 000) und das durchschnittliche Nettoeinkommen je
Monat (in 1 000 Euro) privater Haushalte im früheren Bundesgebiet für das Jahr 2006,
geschichtet nach der Höhe des Haushaltsnettoeinkommens (vgl. Aufgabe 3.10):
Nettoeinkommen
über ... bis einschließlich ...
0 – 1.5
1.5 – 2.5
2.5 – 5
5 – 10
Summe
Anzahl der
Haushalte
16
50
206
18
290
26
Durchschnittliches
Nettoeinkommen
1.12
1.98
3.13
6.75
a) Berechnen Sie den Gini–Koeffizienten.
b) Zeichnen Sie die Lorenzkurve.
c) Wenn die Angaben über das durchschnittliche Nettoeinkommen fehlen würden,
könnten Sie dann trotzdem eine Aussage über die Disparität treffen?
Aufgabe 4.11 (T)
Bei einer Untersuchung der monatlichen Haushaltseinkommen in Deutschland ergab
sich folgende Übersicht:
Monatseinkommen in Euro
0 – 750
750 – 1250
1250 – 1750
1750 – 5000
Anzahl Haushalte
347
436
216
97
Berechnen Sie für diese Einkommensverteilung den Gini-Koeffizient.
Aufgabe 4.12
In einem Land besitzen die reichsten fünf Prozent der Bevölkerung 40% des gesamten
Vermögens, die reichsten 20% sogar 65% des Vermögens. Dahingegen besitzen die
ärmsten 50% der Bevölkerung lediglich 10% des Vermögens.
Skizzieren Sie die Lorenzkurve und berechnen Sie den Gini-Koeffizient.
Aufgabe 4.13 (T)
In einem fiktiven Land entfällt auf die 10% der Einkommensbezieher mit dem höchsten
Steueraufkommen 40% des gesamten Steueraufkommens, auf die 40% mit dem geringsten Steueraufkommen dagegen nur 20% des gesamten Steueraufkommens.
Skizzieren Sie die Lorenzkurve und berechnen Sie den Gini-Koeffizient.
27
5
Verhältnis-, Mess- und Indexzahlen
Aufgabe 5.1
Das Statistische Jahrbuch 1995 weist für die Bevölkerung am Jahresende in Nordrhein–Westfalen (in 1 000) folgende Daten aus:
Jahr
Bevölkerung
1987
1988
1989
1990
1991
1992
1993
16 744 16 874 17 104 17 350 17 510 17 679 17 759
a) Bestimmen Sie die durchschnittliche Wachstumsrate der Bevölkerung in Nordrhein–Westfalen von 1987 bis 1993.
b) Berechnen Sie die Messzahlen der Bevölkerung zum Basisjahr 1990.
c) Basieren Sie die in b) erhaltenen Messzahlen auf 1993 um.
Aufgabe 5.2 (T)
In einer Statistik über den Arbeitsmarkt 1996 finden sich die folgenden Daten (Arbeitslosenquote: Arbeitslose in Prozent der abhängigen Erwerbspersonen):
Bundesland
Baden–Württemberg
Bayern
Berlin Ost
Berlin West
Brandenburg
Bremen
Hamburg
Hessen
Mecklenburg–Vorpommern
Niedersachsen
Nordrhein–Westfalen
Rheinland–Pfalz
Saarland
Sachsen
Sachsen–Anhalt
Schleswig–Holstein
Thüringen
Arbeitslosenquote
(in Prozent)
8.0
7.9
14.4
15.7
16.2
15.6
11.7
9.3
18.0
12.1
11.4
9.4
12.4
15.9
18.8
10.0
16.7
28
abhängige Erwerbspersonen (in Mio.)
4.42
5.09
0.60
0.95
1.15
0.28
0.73
2.52
0.82
3.19
7.26
1.59
0.42
2.03
1.25
1.13
1.14
a) Wie hoch ist die Arbeitslosenquote in Berlin?
b) Berechnen Sie jeweils die Arbeitslosenquote für die alten und die neuen Bundesländer.
c) Berechnen Sie mit Hilfe der Ergebnisse aus b) die Arbeitslosenquote für alle
Bundesländer.
Aufgabe 5.3
Ein Fernfahrer legt auf einer Fahrt fünf Streckenabschnitte zurück:
Streckenabschnitt
1.
2.
3.
4.
5.
Hamburg – Münster
Münster – Würzburg
Würzburg – München
München – Trier
Trier – Köln
Länge des Streckenabschnitts (in km)
280
345
260
480
175
Durchschnittsgeschwindigkeit (in km/h)
60
55
65
80
75
Berechnen Sie die durchschnittliche Geschwindigkeit für seine Fahrt von Hamburg
nach Köln.
Aufgabe 5.4
Bruttoinlandsprodukt (BIP) und Bruttoinlandsprodukt je Einwohner 2006 in den
fünf neuen Bundesländern betrugen:
Bundesland
Brandenburg
Mecklenburg–Vorpommern
Sachsen
Sachsen–Anhalt
Thüringen
BIP
(in Mrd. Euro)
49.5
32.3
88.7
50.0
45.8
BIP je Einw.
(in 1 000 Euro)
19.3
18.9
20.8
20.2
19.6
Berechnen Sie das Bruttoinlandsprodukt je Einwohner für die fünf neuen Bundesländer insgesamt.
Aufgabe 5.5 (T)
Ein Computerladen hatte in den Jahren 2001 bis 2006 folgende Umsätze (in 1 000
Euro):
29
Jahr
2001
2002
2003
2004
2005
2006
Umsatz
400
600
750
850
900
950
a) Berechnen Sie die durchschnittliche Wachstumsrate des Umsatzes von 2001 bis
2006.
b) Der Computerladen wurde 1998 gegründet. Die durchschnittliche Wachstumsrate von 1998 bis 2001 war 20%. Berechnen Sie die durchschnittliche Wachstumsrate des Umsatzes von 1998 bis 2006. Wie hoch war der Umsatz von 1998?
Aufgabe 5.6 (T)
Der Pächter einer Tankstelle erhob im Mai 2005 und Mai 2006 Mengen und durchschnittliche Preise für Normalbenzin, Superbenzin und Diesel.
Normal
Super
Diesel
Menge (in 1 000 l)
Mai 2005 Mai 2006
88
80
95
98
107
105
Preis (in Cent)
Mai 2005 Mai 2006
120
131
122
133
107
114
a) Ermitteln Sie die Mengenindizes nach Laspeyres und Paasche für Mai 2006 zur
Basis Mai 2005.
b) Um wie viel Prozent hat sich der Gesamtumsatz der drei Kraftstoffarten von
Mai 2005 bis Mai 2006 verändert?
c) Ermitteln Sie die Preisindizes nach Laspeyres und Paasche für Mai 2006 zur
Basis Mai 2005.
Aufgabe 5.7
Der bayerische Warenkorb besteht bekanntlich aus Weißwurst, Senf, Brezeln und Bier.
Folgende Daten wurden bekannt:
30
Umsatz 2006
(in Mio. Euro)
Weißwurst
Senf
Brezen
Bier
400
5
150
5 000
Mengenmesszahl
q2006
q2005
1.10
0.90
1.05
1.20
a) Berechnen Sie aus diesen Angaben einen geeigneten Mengenindex für das Berichtsjahr 2006 zur Basis 2005.
b) Der Gesamtumsatz für die Güter des bayerischen Warenkorbs betrug 2005 5.4
Milliarden Euro. Berechnen Sie einen geeigneten Preisindex für das Berichtsjahr
2006 zur Basis 2005.
Aufgabe 5.8 (T)
Ein Elektronik-Unternehmen fertigt Hardware, entwickelt Software und erbringt
Dienstleistungen. Die Umsatzindizes (Basis 2002=100) seien:
Hardwarefertigung
Softwareentwicklung
Dienstleistungen
Umsatzindex
2005
2006
120
130
170
190
100
90
a) Berechnen Sie Umsatzindizes für das gesamte Unternehmen für 2005 und 2006
unter der Annahme, dass im Jahr 2002 40% des Gesamtumsatzes auf Hardwarefertigung und 30% auf Softwareentwicklung entfielen.
b) Der Gesamtumsatz des Unternehmens war 2002 80 Mio. Euro. Berechnen Sie
für 2002, 2005 und 2006 die Gesamtumsätze sowie die Umsätze der drei Sparten.
Aufgabe 5.9
Für den bayerischen Warenkorb aus Aufgabe 5.7 ist über die Veränderungen von
Preisen und Mengen von 2000 bis 2006 außerdem Folgendes bekannt geworden:
31
Preisänderung
(in Prozent)
Weißwurst
Senf
Brezen
Bier
+
+
+
+
15
10
5
10
Mengenänderung
(in Prozent)
+5
0
−5
+5
a) Um wie viel Prozent hat sich der Umsatz des bayerischen Warenkorbes von
2000 bis 2006
(1) insgesamt,
(2) durchschnittlich pro Jahr
verändert? (Hinweis: Der Umsatz von 2006 ist bekannt!)
b) Berechnen Sie für den bayerischen Warenkorb den Preisindex und Mengenindex
nach Laspeyres für das Berichtsjahr 2006 zur Basis 2000.
c) Wie groß ist der Umsatz des bayerischen Warenkorbs 2006 in Preisen von 2000?
Aufgabe 5.10
Der Warenkorb für den privaten Verbrauch eines Indexhaushalts umfasse die Konsumgüter A, B und C. Die Ausgaben für diese drei Güter verhalten sich im Basisjahr
2006 wie 5:3:2.
Geben Sie die gesuchten Indizes jeweils für das Berichtsjahr t zur Basis 2006=100
an.
a) Bestimmen Sie den Preisindex von Laspeyres unter der Annahme, dass
(1) der Preis von Gut A um 7.5% gestiegen ist, während die übrigen Preise
unverändert gelten,
(2) alle drei Güterpreise einheitlich um 5% gestiegen sind.
Zeigen Sie, dass in diesem Fall der Preisindex nach Laspeyres
gleich dem Preisindex von Paasche ist.
b) Wie hoch ist der Wertindex, wenn unterstellt wird, dass alle drei Güterpreise
einheitlich um 10% gestiegen und gleichzeitig alle Verbrauchsmengen um 10%
gesunken sind?
32
Aufgabe 5.11
Die amtliche Statistik weist für den nach drei Gütergruppen gegliederten Preisindex nach Laspeyres für die Lebenshaltung aller privaten Haushalte (1991=100) in
Ostdeutschland folgende Werte aus:
Gütergruppe
Gewichtung 1991 (in Prozent)
Verbrauchs- und
Gebrauchsgüter
76.0
Dienstleistungen
und Reparaturen
Wohnungs- und
Garagennutzung
Lebenshaltung
insgesamt
Preisindex (1991 = 100)
1995 1996
1997
108.5
109.1
110.5
134.4
138.4
143.0
6.5
414.1
100.0
132.9
135.9
a) Wie viel Prozent der Gesamtausgaben für die Lebenshaltung wendet der Indexhaushalt im Basisjahr für die Gütergruppe ”Dienstleistungen und Reparaturen”
auf?
b) Bestimmen Sie den Preisindex vom Typ Laspeyres für Wohnungs- und Garagennutzung für das Jahr 1996 (1991=100).
c) Wie hoch ist die relative Veränderung der Preise für Wohnungs- und Garagennutzung 1996 gegenüber dem Vorjahr?
d) Ermitteln Sie den Laspeyres-Preisindex für die Lebenshaltung insgesamt für
das Jahr 1997, wenn bekannt ist, dass der entsprechende Laspeyres–Preisindex
für Wohnungs- und Garagennutzung von 1996 bis 1997 um 3% gestiegen ist.
Aufgabe 5.12 (T)
Die italienische Firma ”Bicicletta” exportiert drei Fahrradmodelle A, B und C. Gegeben sind die Außenhandelsumsätze und die relativen Veränderungen der Ausfuhrpreise für die Jahre 2004 bis 2006 :
33
Warenart
Umsatz
(in 1 000 Euro)
A
B
C
Preisveränderung
gegenüber dem Vorjahr
(in Prozent)
2004
2005
2006
2005
2006
35
45
60
50
45
62
45
51
64
+ 20
0
– 8
+ 50
– 8
– 20
Berechnen Sie für die Exportware ”Fahrrad” den Preisindex vom Typ Fisher für das
Jahr 2006 zur Basis 2004.
Aufgabe 5.13 (T)
Gegeben seien folgende Daten aus der Volkswirtschaftlichen Gesamtrechung für die
Bundesrepublik Deutschland:
Jahr
1995
1996
1997
1998
1999
2000
2001
2002
Bruttoinlandsprodukt
in jeweiligen Preisen
(in Mrd. Euro)
1 801.3
1 833.7
1 871.6
1 929.4
1 978.6
2 030.0
2 073.7
2 110.4
Paasche–Preisindex
1995 = 100
(in Prozent)
100.0
101.0
101.7
102.8
103.3
103.1
104.4
106.1
a) Berechnen Sie für die Jahre von 1995 bis 2002 das reale Bruttoinlandsprodukt
in Preisen von 1995.
b) Wie groß ist die durchschnittliche jährliche Zuwachsrate des realen Bruttoinlandsproduktes von 1995 bis 2002?
34
6
Auswertung mehrdimensionaler Daten
Aufgabe 6.1 (T)
Der Personalchef einer Bank möchte untersuchen, ob die Chance, die Aufnahmeprüfung zu bestehen, davon abhängt, ob der Bewerber ein Mann oder eine Frau ist.
Unter den 35 Stellenbewerbern befanden sich 21 Männer. Es zeigte sich, dass genau
16 Bewerber, davon 5 Frauen, die Prüfung bestanden.
a) Stellen Sie für die Merkmale ”Geschlecht” und ”Prüfungsergebnis” eine Kontingenztabelle auf.
b) Sind die Merkmale ”Geschlecht” und ”Prüfungsergebnis” deskriptiv unabhängig?
Aufgabe 6.2
Für die Kfz–Werkstätten einer Stadt wurden an einem bestimmten Tag die folgenden
beiden Merkmale ermittelt:
X: Anzahl der Beschäftigten,
Y : Anzahl der reparierten Autos.
Dabei erhielt man die folgende Kontingenztabelle:
Anzahl der
Beschäftigten
2
3
5
8
10
Anzahl der reparierten Autos
3 5 6 8 10 11 12 15
3
1
1
0
0
2
2
0
1
0
0
2
4
4
0
0
0
4
5
1
0
0
1
3
1
0
0
0
5
0
0
0
0
2
3
0
0
0
0
5
a) Bestimmen Sie die Randhäufigkeiten von X und von Y sowie die bedingten
relativen Häufigkeiten von Y unter der Bedingung X = 8.
b) Geben Sie unter den Betrieben mit acht Beschäftigten den Anteil derjenigen
an, die zehn Autos repariert haben.
35
c) Geben Sie den Anteil der Betriebe an, die genau acht Beschäftigte haben und
höchstens zehn Autos repariert haben.
d) Geben Sie den Anteil der Betriebe an, die höchstens zehn Autos repariert haben.
e) Sind X und Y deskriptiv unabhängig?
Aufgabe 6.3
Bei den 500 Mitgliedern eines Sportvereins wurden das verfügbare Jahreseinkommen
(in 1 000 Euro) und der Schulabschluss erhoben. Es ergab sich:
Jahreseinkommen
ohne
25
5
0
bis 50
50 bis 70
70 bis 130
Schulabschluss
Hauptschule Realschule
10
25
30
45
10
50
Abitur
45
90
165
Wie können Sie den Zusammenhang zwischen den beiden Merkmalen messen? Berechnen Sie die entsprechende Maßzahl. Sind die Merkmale Jahreseinkommen und
Schulabschluss deskriptiv unabhängig?
Aufgabe 6.4 (T)
Um festzustellen, ob ein Zusammenhang zwischen Werbekampagne und Absatzwachstum besteht, wurden 100 Unternehmen nach der angewendeten Werbekampagne sortiert und ihr Absatzwachstum nach der Kampagne notiert:
Werbekampagne
A
B
C
Absatzwachstum
sehr stark stark schwach
19
27
4
7
8
5
1
13
16
Berechnen Sie ein geeignetes Maß für den Zusammenhang zwischen diesen beiden
Merkmalen.
Aufgabe 6.5
100 zufällig ausgewählte Teilnehmer eines Trainee–Programms für Führungskräfte
36
wurden nach der Anzahl der von ihnen durchschnittlich pro Tag gelesenen Tageszeitungen und der von ihnen durchschnittlich pro Tag verfolgten Nachrichtensendungen im Radio bzw. Fernsehen gefragt. Es ergab sich folgende zweidimensionale
Häufigkeitstabelle:
Anzahl der
Tageszeitungen X
ξ1 = 1
ξ2 = 2
ξ3 = 3
Anzahl der
Nachrichtensendungen Y
η1 = 2 η2 = 3 η3 = 4
20
8
12
25
10
15
5
2
3
a) Berechnen Sie für die Randverteilungen der beiden Merkmale das arithmetische
Mittel und die Varianz.
b) Geben Sie die relative Häufigkeit des Merkmals X unter der Bedingung Y = ηk
für k = 1,2,3 an.
c) Sind die Merkmale X und Y deskriptiv unabhängig? Begründen Sie Ihre Antwort anhand der Rechenergebnisse zu Aufgabe b).
d) Was können Sie in diesem Fall über die Größe der Kovarianz zwischen den
beiden Merkmalen aussagen, ohne die Maßzahl selbst zu berechnen?
e) Kann generell aus rXY = 0 auf die deskriptive Unabhängigkeit zwischen den
beiden Merkmalen geschlossen werden?
Aufgabe 6.6 (T)
Im Jahr 1998 wurden 979 Personen unter anderem in bezug auf die Merkmale
A: Rauchgewohnheit (Raucher/Nichtraucher),
B: Geschlecht (männlich/weiblich),
C: Häufigkeit von Kopfschmerz (einmal oder weniger pro Woche/
mehr als einmal pro Woche)
befragt.
Es ergab sich
37
A
Raucher
Nichtraucher
B
männl.
weibl.
männl.
weibl.
C
einmal oder weniger
22
60
15
37
mehr als einmal
287
159
230
169
a) Geben Sie die Randverteilungen von A, B und C an.
b) Geben Sie die gemeinsamen Verteilungen von A und B und von A und C an.
Prüfen Sie, ob die Merkmalspaare jeweils deskriptiv unabhängig sind.
c) Messen Sie den Zusammenhang von A und B (sowie von A und C) mittels einer
geeigneten Maßzahl.
Aufgabe 6.7 (T)
Zwei Investoren haben 12 Investitionsprojekte nach deren Risiko geordnet. Berechnen
Sie eine geignete Maßzahl zur Messung des Zusammenhanges zwischen den Bewertungen der beiden Investoren.
Investition
A
B
C
D
E
F
G
H
I
J
K
L
Risikobewertung
Investor 1
7
8
2
1
9
3
12
11
4
10
6
5
Risikobewertung
Investor 2
6
4
1
3
11
2
12
10
5
9
7
8
Aufgabe 6.8
Zehn zufällig befragte Passanten gaben ihre Einstellung zum lokalen Fußballverein
(F) und zum dortigen Torschützenkönig der letzten Saison anhand einer Skala von -4
bis +4 an:
38
Person
1
Einstellung zu F
Einstellung zu T
2 3
4
1 -1 0
2 -2 2
5 6 7
-2 2 4 3
0 3 4 2
8
9
10
1 -4
-4 -4
-3
0
Berechnen Sie eine Maßzahl für den Zusammenhang zwischen der Einstellung der
Befragten zum Fußballverein und zum Torschützenkönig. Begründen Sie Ihre Wahl
der Maßzahl und interpretieren Sie das Ergebnis.
Aufgabe 6.9 (T)
Die folgende Tabelle enthält die Schlusskurse zweier Aktien A und B an elf aufeinanderfolgenden Börsentagen:
Tag
A
B
1
2
3
4
5
6
85 87 90 88 86
103 102 104 105 99
7
8
9
10
11
86 87 90 92 93 91
97 96 96 99 102 101
Messen Sie den Zusammenhang der Kurse der Aktien A und B mit einer geeigneten
Maßzahl.
Aufgabe 6.10
Bei fünf ausgewählten Diplom–Kaufleuten wurden die Anzahl der während des Studium absolvierten Praktika X und das durchschnittliche Gehalt der ersten drei Berufsjahre Y (in 1 000 Euro) erhoben. Es ergab sich:
i
xi
yi
1 2
3 0
35 31
3 4 5
4 1 2
43 34 37
a) Errechnen Sie den Wert einer geeigneten Maßzahl zur Messung des Zusammenhanges zwischen X und Y .
b) Die Diplom–Kaufleute Nr. 1, 2 und 4 haben während ihres Studiums als studentische Hilfskraft gearbeitet. Errechnen Sie den Wert einer geeigneten Maßzahl
zur Messung des Zusammenhanges der Merkmale Studentische Hilfskraft“ und
”
Gehalt“. Klassieren Sie dazu das Merkmal Gehalt“ (Klassen: bis 33 000 Eu”
”
”
ro“, über 33 000 Euro bis 40 000 Euro“ und über 40 000 Euro“).
”
”
39
Aufgabe 6.11
Aufgrund einer Erhebung für zwei metrische Merkmale bei n = 8 Einheiten einer
Grundgesamtheit sind folgende Werte bekannt:
n
X
xi yi = 297 ,
i=1
n
X
n
X
xi = 36 ,
i=1
n
X
yi = 57 ,
i=1
xi 2 = 188 ,
i=1
n
X
yi 2 = 517 .
i=1
Berechnen Sie
a) eine Maßzahl für die Stärke des linearen Zusammenhangs zwischen X und Y ,
b) die Koeffizienten der beiden Regressionsgeraden y = a + bx und x = c + dy.
Aufgabe 6.12 (T)
Berechnen Sie zu der folgenden Kontingenztabelle die Regressionsgerade
y = a + bx.
X
ξ1
ξ2
ξ3
ξ4
ξ5
=2
=4
=6
=8
= 10
Y
η1 = 1
η2 = 2
2
4
3
5
8
3
3
η3 = 3
η4 = 4
2
7
2
3
5
3
Aufgabe 6.13 (T)
Nach einem Trainingslager für die 200 Nachwuchsspieler eines Schachvereins stellen
die Trainer folgenden Zusammenhang zwischen der Vereinszugehörigkeit in Jahren X
und der Anzahl der Siege bei den Probeturnieren während des Lagers Y fest:
Vereinszugehörigkeit X
über ... bis einschl. ...
0–1
1–2
2–4
4–8
40
Anzahl Siege Y
0–1
2–4
5–6
40
20
10
0
10
30
25
15
0
5
15
30
a) Bestimmen Sie die Randverteilung von X und Y .
b) Geben Sie die Verteilung von X für ”fünf bis sechs Siege” an, und errechnen
Sie das arithmetische Mittel und die Varianz dieser Verteilung.
c) Berechnen Sie die mittlere Anzahl der Siege bei den Nachwuchspielern, die
länger als ein Jahr und höchstens zwei Jahre im Verein sind.
d) Sind die beiden Merkmale unabhängig? Begründen Sie Ihre Aussage, indem Sie
eine Maßzahl für die Abhängigkeit berechnen.
Aufgabe 6.14
In einer Studie der britischen Regierung über das Konsumverhalten von Haushalten in
verschiedenen Regionen des Landes wurden unter anderem die Anteile der Ausgaben
für Tabak X und Alkohol Y an den Gesamtausgaben der Haushalte ermittelt.
Region
X
Y
North
Yorkshire
Northeast
East Midlands
West Midlands
East Anglia
Southeast
Southwest
Wales
Scotland
Northern Ireland
6.47
6.13
6.19
4.89
5.63
4.52
5.89
4.79
5.27
6.08
4.02
4.03
3.76
3.77
3.34
3.47
2.92
3.20
2.71
3.53
4.51
4.56
a) Berechnen Sie den Korrelationskoeffizienten rXY . Wie würden Sie den Zusammenhang zwischen den Ausgabenanteilen für Tabak und Alkohol charakterisieren?
Es gilt
11
11
P
P
xi = 59.88 ,
x2i = 332.3292 ,
i=1
11
P
i=1
11
P
i=1
yi = 39.80 ,
11
P
yi2 = 147.4930 ,
i=1
xi yi = 217.7103 .
i=1
41
b) Berechnen Sie die Koeffizienten der linearen Regression von Alkohol auf Tabak
sowie den Anteil der durch die Regression erklärten Varianz.
c) Führen Sie a) und b) erneut durch, jedoch diesmal ohne die Werte für Northern
Ireland. Was fällt Ihnen auf?
Aufgabe 6.15
Für fünf ausgewählte private Haushalte wurden jeweils Monatsdurchschnitte für die
Höhe des Nettoeinkommens X und die Höhe der Telefonrechnung Y ermittelt:
Haushalt
Nettoeinkommen X
(in 1 000 Euro)
Telefonrechnung Y
(in 100 Euro)
1
2
3
4
5
2.6
2.1
1.4
3.5
1.7
1.2
0.7
0.5
2.0
0.6
a) Berechnen Sie die Koeffizienten der linearen Einfachregression von Y auf X.
b) Prognostizieren Sie unter Verwendung der Ergebnisse von Aufgabe a) die Höhe
der Telefonrechnung für einen Haushalt mit einem durchschnittlichen Nettoeinkommen von 2 200 Euro im Monat.
c) Um wie viel veränderten sich die durchschnittlichen Ausgaben für das Telefon
pro Haushalt, wenn das monatliche Nettoeinkommen um 200 Euro steigt?
d) Berechnen Sie das Bestimmtheitsmaß und interpretieren Sie es. Welchen Wert
hat der Korrelationskoeffizient?
42
Aufgabe 6.16
Der Output Y einer Volkswirtschaft sei in Abhängigkeit der eingesetzten Produktionsfaktoren Arbeit L und Kapital K betrachtet. Im Folgenden wird unterstellt, dass diese
Abhängigkeit durch eine Cobb-Douglas-Produktionsfunktion der Form Y = αK b1 Lb2
beschrieben werden kann. Für die Jahre 2005 bis 2010 liegen folgende Beobachtungen
des Outputs und der Produktionsfaktoren vor:
i
yi (Mrd e)
ki (Mrd e)
li (1000 Besch.)
1
2270
16000
22000
2
2300
17000
23000
3
2400
19000
24000
4
2470
22000
24000
5
2500
22000
23500
6
2570
24000
25000
Hinweis: Die Ergebnisse sind in dieser Aufgabe sehr empfindlich gegenüber Rundungsfehlern. Auch wenn Sie korrekt gerechnet haben, können hier die Ergebnisse aufgrund
der Rundungsfehler extrem von den in der Musterlösung angegebenen Werten abweichen.
Sie können diese Aufgabe auch gern mit den Analysefunktionen von Excel lössen.
a) Wie muss die Produktionsfunktion transformiert werden, damit die partiellen
Elastizitäten b1 und b2 mittels linearer Regression geschätzt werden können?
b) Schätzen und interpretieren Sie die Koeffizienten α, b1 und b2 .
c) Berechnen Sie das Bestimmtheitsmaß der Regression.
Aufgabe 6.17
In der folgenden Tabelle sind Typ und Baujahr der in Deutschland im März 2011 in
Betrieb befindlichen Atomkraftwerke angegeben. Zusätzlich liegen Daten über die bis
dahin gemeldeten Störfälle vor. (Für diese Aufgabe können Sie auch Excel benutzen.)
Name AKW
Neckarwest 1
Neckarwest 2
Brokdorf
Brunsbüttel
Emsland
Grafenrheinf.
Isar 1
Isar 2
Krümmel
Typ
DWR
DWR
DWR
SWR
DWR
DWR
SWR
DWR
SWR
Baujahr
1976
1988
1986
1976
1988
1981
1977
1988
1983
Störfälle
427
80
210
462
121
222
280
72
322
43
Name AKW
Philippsburg 1
Philippsburg 2
Unterweser
Grundremm. A
Grundremm. B
Biblis A
Biblis B
Grohnde
Typ
SWR
DWR
DWR
SWR
SWR
DWR
DWR
DWR
Baujahr
1979
1984
1978
1984
1984
1974
1976
1984
Störfälle
337
182
340
105
99
419
420
222
Mittels linearer Regression soll untersucht werden, ob das Alter und der Reaktortyp
einen Einfluss auf die Häufigkeit der Störfälle haben.
a) Wieso ist es nicht sinnvoll, als abhängige Variable die Anzahl der Störfälle zu
wählen?
b) Betrachten Sie als abhängige Variable die Anzahl Störfälle pro Jahr und führen
Sie eine Regression durch, in der das Alter und der Reaktortyp die erklärenden
Variablen sind.
Hinweis: Beachten Sie, dass die Daten aus dem Jahr 2011 stammen. Berücksichtigen
Sie dies bei der Berechnung des Alters des Reaktors.
c) Interpretieren Sie die Ergebnisse.
Aufgabe 6.18
Betrachten Sie folgenden Excel-Output, in dem die Ergebnisse einer Regression des
monatlichen Einkommens dargestellt sind:
a) Durch welche Variablen wurde das Einkommen zu erklären versucht? Wie unterscheiden sich die Variablen hinsichtlich ihrer Skalierung?
b) Geben Sie die geschätzten Parameter an und interpretieren Sie sie.
c) Wie könnte eine Interaktion zwischen den erklärenden Variablen in das Modell
aufgenommen werden? Wie lautet dann das Modell?
44
Aufgabe 6.19 (T)
Betrachten Sie die Daten für das BNE (in MRD e) der Jahre 2008 bis 2010:
BNE (2008-2010)
Q4
Q1
Q2
Q3
Q4
2007
2008
2008
2008
2008
643,43
620,05
622,52
642,50
635,78
Q1
Q2
Q3
Q4
2009
2009
2009
2009
586,75
586,74
623,27
634,18
Q1
Q2
Q3
Q4
2010
2010
2010
2010
609,16
618,65
648,30
659,17
Hinweis: Diese Aufgabe kann auch mit Excel gelöst werden.
a) Stellen Sie ein Regressionsmodell auf, das das Wachstum des BNE auf eine
Quartalsstruktur untersucht.
b) Berechnen Sie die Koeffizienten des entsprechenden Regressionsmodells und interpretieren Sie sie. Nutzen Sie dabei die allgemeinen Formeln in Matrixschreibweise.
Aufgabe 6.20
Für n = 50 Supermärkte einer Kette wurden für einen bestimmten Monat folgende
Größen erhoben:
Y
= Absatz von Tofu (in kg)
X1 =
0 , wenn Supermarkt in einfacher Wohnlage liegt
1 , wenn Supermarkt in gehobener Wohnlage liegt
X2 = Anzahl der Kunden im Supermarkt (in 1 000)
X3 = Preis in
EUR
kg
X4 = Ausgaben für lokale Marketingmaßnahmen (in EUR)
Aus den Daten wurde folgende Regressionsgleichung berechnet:
Y = −250 + 220 X1 + 45 X2 − 120 X3 + 0,003 X4 ;
R2 = 0,8464.
a) Interpretieren Sie die Werte der Regressionskoeffizienten. Welche Benennung
haben die Regressionskoeffizienten?
45
b) Prognostizieren Sie den Monatsabsatz von Tofu eines Supermarkts in einfacher
Wohnlage mit 1 000 EUR Marketingausgaben im Monat und durchschnittlich
33 200 Kunden bei einem Preis für Tofu von 4,95 EUR pro kg.
c) Wie hoch wäre das Ergebnis von b), wenn der Supermarkt statt in einer einfachen Wohnlage in einer gehobenen Wohnlage läge?
d) Wieviel Prozent der Varianz des Tofuabsatzes wird durch die Regression erklärt?
e) Die Standardabweichung des Tofuabsatzes unter den Supermärkten sY beträgt
400 kg. Wie hoch ist die Standardabweichung der Residuen sU ?
46
Aufgabe 6.21
Ein Politikwissenschaftler interessiert sich für das Abschneiden der jeweils regierenden
Partei bei US-Präsidentschaftswahlen und nutzt dazu folgende Daten zu den Wahlen
1948 - 2008:
Jahr
1948
1952
1956
1960
1964
1968
1972
1976
1980
1984
1988
1992
1996
2000
2004
2008
Y
49,55
44,33
57,37
49,55
61,05
42,72
60,67
48,02
41,01
58,77
53,37
37,45
49,23
48,38
50,73
45,60
X1
0
0
1
1
0
0
1
1
0
1
1
1
0
0
1
1
X2
1
0
1
0
1
0
1
1
1
1
0
1
1
0
1
0
X3
3,7
3,0
3,9
6,1
5,1
3,4
5,6
7,7
7,5
7,4
5,4
7,3
5,2
3,9
4,4
6,6
Y
Stimmenanteil des Kandidaten der Partei des amtierenden Präsidenten bei der
Präsidentschaftswahl in Prozent
X1
Parteizugehörigkeit
des amtierenden
Präsidenten (0 = Demokraten, 1 =
Republikaner)
Amtierender Präsident stellt sich zur Wiederwahl (0 = nein, 1 = ja)
US-Arbeitslosenquote im Oktober des
Wahljahrs in Prozent
X2
X3
Daraus wurde ein Regressionsmodell Y = b0 + b1 · X1 + b2 · X2 + b3 · X3 + U mit
folgenden Ergebnissen berechnet:
Y = 53,52 + 5,57 · X1 + 5,49 · X2 − 1,898 · X3
Varianz der Ausgangswerte: s2Y = 729,14
Varianz der regressierten Werte: s2Ŷ = 186,60
Varianz der Residuen: s2U = 542,54
a)
i. Interpretieren Sie den Koeffizienten der Arbeitslosenquote. Welche Einheit
hat er?
ii. Inwiefern kann man von einem Amtsbonus eines amtierenden Präsidenten
sprechen?
b) Berechnen Sie das R2 der Regression.
c) Prognostizieren Sie den Stimmenanteil von Präsident Obama (Demokraten),
wenn er sich 2012 zur Wiederwahl stellt und die Arbeitslosenquote im Oktober
2012 bei 9,0 % liegen sollte.
47
7
Elementare Zeitreihenanalyse
Aufgabe 7.1
Die Weltbevölkerung betrug in den Jahren 1960 bis 2000:
Jahr
Bevölkerung
(in Mrd.)
1960
1970
1980
1990
2000
3.02
3.70
4.45
5.30
6.06
a) Stellen Sie das Wachstum der Weltbevölkerung graphisch dar.
b) Berechnen Sie den linearen Trend sowie den exponentiellen Trend.
c) Schätzen Sie mit Hilfe der beiden Ansätze unter b) jeweils den Wert für 2006
und vergleichen ihn mit dem tatsächlichen Wert von 6.55 Milliarden.
d) Interpretieren Sie jeweils den Koeffizienten b.
Aufgabe 7.2 (T)
Der schweizerische ”Landesindex der Konsumentenpreise” (Basis Mai 2000 = 100)
betrug in den Jahren 1990 bis 2005:
Jahr
1990 1991
1992
1993
1994
1995
1996
1997
Index
82.8
87.6
91.2
94.2
95.0
96.7
97.5
98.0
Jahr
1998 1999
2000
2001
2002
2003
2004
2005
Index
98.0
100.3 101.3 102.0 102.6 103.4 104.7
98.8
a) Berechnen Sie die durchschnittliche Wachstumsrate dieses Indexes für 1990 bis
2005 sowie 2000 bis 2005.
b) Bestimmen Sie den linearen und den exponentiellen Trend. Vergleichen Sie das
jeweilige Ergebnis mit a).
48
Aufgabe 7.3
Es sei die folgende Zeitreihe gegeben:
t
1
yt
5.0
2
3
4
5
6
7
8
7.6 11.2 17.9 26.1 38.6 58.4 87.8
a) Stellen Sie die Zeitreihe graphisch dar.
b) Bestimmen Sie die entsprechende Zeitreihe der Zuwachsfaktoren.
c) Bestimmen Sie mit einem geeignetem Ansatz die glatte Komponente.
Aufgabe 7.4
In einem Land entwickelte sich die Konjunktur, gemessen am Bruttoinlandsprodukt
(BIP) in Mrd. Euro, in den Jahren 1997 bis 2006 wie folgt:
Jahr
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
BIP
112
311
287
236
418
393
289
477
482
387
a) Stellen Sie den Konjunkturverlauf graphisch dar. Über wie viele Jahre erstreckt
sich ein Zyklus?
b) Bestimmen Sie die glatte Komponente durch einen gleitenden Durchschnitt
geeigneter Ordnung.
Aufgabe 7.5 (T)
Der amerikanische Dow Jones Börsenindex entwickelte sich zwischen 1987 und 2000
wie folgt (gerundete Werte):
ti
1987
1991
1995
1996
1997
1998
1999
yi
2 000 3 000 5 000 6 000 8 000 9 000 10 000
a) Nennen Sie die Bedingungen zur Anwendung der Ihnen bekannten Verfahren
zur Bestimmung der glatten Komponente.
49
b) Wählen Sie aufgrund Ihrer Ausführungen eine geeignete Trendfunktion und
berechnen Sie diese.
Aufgabe 7.6 (T)
Die Zahl der Arbeitslosen (in 1 000) in Deutschland betrug:
2003
2004
2005
2006
Jan.
4 624
4 597
5 039
5 010
Apr.
4 497
4 443
4 968
4 790
Juli
4 353
4 360
4 772
4 386
Okt.
4 151
4 207
4 555
4 084
Ermitteln Sie mit Hilfe der Methode der gleitenden Durchschnitte die glatte Komponente für die Zahl der Arbeitslosen.
50
Herunterladen