Titelei_Alt:Layout 1.qxd

Werbung
Raimund Alt
Dieses Lehrbuch bietet eine kompakte Einführung in die Grundlagen der Statistik, das
Studienanfänger wirtschaftswissenschaftlicher Studiengänge sowohl begleitend zu Lehrveranstaltungen als auch für das Selbststudium nützen können. Das in der Lehre erprobte
didaktische Konzept, auf dem das Buch aufbaut, präsentiert auf verständliche Art und
Weise Konzepte und Methoden der Deskriptiven Statistik, der Wahrscheinlichkeitsrechnung und der Induktiven Statistik. Zahlreiche Beispiele und Abbildungen veranschaulichen die Materie und erleichtern deren Verständnis.
Statistik
Eine Einführung für Wirtschaftswissenschaftler
Alt
Mag. Dr. Raimund Alt ist Senior Researcher am ECONOMICA Institut für Wirtschaftsforschung sowie Lektor an der Fachhochschule des bfi Wien.
Statistik
Für die zweite Auflage wurde die Reihenfolge der Kapitel beibehalten, allerdings kam es
in manchen Kapiteln zu einer Neuaufteilung der Abschnitte, um die Darstellung des Stoffes übersichtlicher zu gestalten. Neben einigen neuen Exkursen wurden unter anderem
auch Internet-Suchrätsel in das Buch aufgenommen. Ein erweiterter Anhang enthält jetzt
ein Beispiel für eine Input-Output-Tabelle sowie ein Verzeichnis englischsprachiger Fachbegriffe.
ISBN 978-3-7143-0228-8
www.lindeverlag.at
3-7143-0228-8.indd 1
2. Auflage
09.01.2013 09:37:42
Inhalt
I. Deskriptive Statistik
1
1. Einführung
1.1. Die Grundgesamtheit . . . . . . . . . . . . .
1.2. Merkmale und Verteilungen . . . . . . . . .
1.3. Tabellen und Grafiken . . . . . . . . . . . .
1.4. Aktienmärkte. Eine empirische Fallstudie (1)
Anmerkungen . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Wo gibt es eigentlich statistische Daten?
2. Mittelwerte
2.1. Das arithmetische Mittel . . . . . . . . .
2.2. Das geometrische Mittel . . . . . . . . .
2.3. Modus, Median und Quantile . . . . . .
2.4. Boxplots . . . . . . . . . . . . . . . . . .
2.5. Aktienmärkte. Eine empirische Fallstudie
Anmerkungen . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Ein Besuch bei Eurostat . . . . . . .
3. Streuung und Konzentration
3.1. Varianz und Standardabweichung . . . .
3.2. Variationskoeffizient und z-Werte . . . .
3.3. Konzentrationsmaße . . . . . . . . . . .
3.4. Aktienmärkte. Eine empirische Fallstudie
Anmerkungen . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . .
. .
. .
. .
. .
(2)
. .
. .
. .
. .
. .
. .
. .
(3)
. .
. .
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
5
6
10
15
19
21
23
25
.
.
.
.
.
.
.
.
.
29
31
34
35
39
40
44
45
47
49
.
.
.
.
.
.
.
53
55
57
58
63
65
65
67
xi
Inhalt
Exkurs: Regionen, Distanzen und das Gravitationsgesetz . . . . . . .
4. Indexzahlen
4.1. Ein einfacher Preisindex . . . . . . . . . . . . . . . . . . . .
4.2. Aggregierte Preisindizes . . . . . . . . . . . . . . . . . . . .
4.3. Mengenindizes . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4. Verbraucherpreisindizes . . . . . . . . . . . . . . . . . . . . .
4.5. Aktienmärkte. Eine empirische Fallstudie (4) . . . . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Human Development Index – ein Entwicklungsindikator
5. Korrelation
5.1. Die Kovarianz . . . . . . . . . . . . . . . . . .
5.2. Der Korrelationskoeffizient . . . . . . . . . . .
5.3. Korrelation und Kausalität . . . . . . . . . . .
5.4. Autokorrelation bei Zeitreihen . . . . . . . . .
5.5. Aktienmärkte. Eine empirische Fallstudie (5) .
Anmerkungen . . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Bildung und der Geist“ des Kapitalismus
”
6. Lineare Regression
6.1. Die einfache lineare Regression . . . . . . . .
6.2. Das Bestimmtheitsmaß . . . . . . . . . . . .
6.3. Die multiple lineare Regression . . . . . . .
6.4. Aktienmärkte. Eine empirische Fallstudie (6)
Anmerkungen . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Was ist eigentlich ein Frühindikator? . .
II. Wahrscheinlichkeitsrechnung
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
69
.
.
.
.
.
.
.
.
.
73
75
77
82
83
84
86
86
88
89
.
.
.
.
.
.
.
.
.
93
95
97
101
104
106
109
110
114
115
.
.
.
.
.
.
.
.
119
121
127
131
137
139
139
142
143
147
7. Einführung
149
7.1. Ergebnisraum und Ereignisse . . . . . . . . . . . . . . . . . . . . 151
7.2. Die relative Häufigkeit eines Ereignisses . . . . . . . . . . . . . . . 154
xii
Inhalt
7.3. Der Begriff der Wahrscheinlichkeit . . . . . . . . . . .
7.4. Wahrscheinlichkeit und Kombinatorik . . . . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Was versteht man eigentlich unter einem Modell?
8. Bedingte Wahrscheinlichkeit
8.1. Definition . . . . . . . . . . . . . . . . . . . .
8.2. Satz von der vollständigen Wahrscheinlichkeit
8.3. Die Bayes-Regel . . . . . . . . . . . . . . . . .
8.4. Unabhängige Ereignisse . . . . . . . . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Markov, Ketten und Matrizen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9. Diskrete Zufallsvariablen
9.1. Zufallsvariable und Wahrscheinlichkeitsfunktion . . . . . . . .
9.2. Der Erwartungswert . . . . . . . . . . . . . . . . . . . . . . .
9.3. Die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4. Unabhängige Zufallsvariablen . . . . . . . . . . . . . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Programme, Evaluierung und kontrafaktische Situationen
10.Spezielle diskrete Verteilungen
10.1. Die hypergeometrische Verteilung .
10.2. Die Binomialverteilung . . . . . . .
10.3. Die Poisson-Verteilung . . . . . . .
Anmerkungen . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . .
Exkurs: Das Zeitungsverkäufer-Problem
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
158
162
170
173
174
175
.
.
.
.
.
.
.
.
179
181
185
188
190
196
198
200
201
.
.
.
.
.
.
.
.
205
207
209
213
216
219
220
222
223
.
.
.
.
.
.
.
227
229
233
238
245
246
248
249
11.Stetige Zufallsvariablen
253
11.1. Zufallsvariable und Dichtefunktion . . . . . . . . . . . . . . . . . 255
11.2. Der Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . 262
11.3. Die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
xiii
Inhalt
11.4. Unabhängige Zufallsvariablen . . . . . . . . . . . . .
11.5. Diskrete und stetige Zufallsvariablen – Ein Vergleich
Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Zufallszahlen und Simulationen . . . . . . . . . .
12.Die Normalverteilung
12.1. Definition . . . . . . . . . . . . . . .
12.2. Eigenschaften der Normalverteilung .
12.3. Der zentrale Grenzwertsatz . . . . . .
12.4. Verteilungen und Tabellen . . . . . .
Anmerkungen . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . .
Exkurs: Risiken, Renditen und Portfolios
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
264
265
267
268
270
271
.
.
.
.
.
.
.
.
275
277
279
283
289
291
292
294
295
III. Induktive Statistik
13.Schätzen von Parametern
13.1. Ein einfaches Umfragemodell . . . . . . . . .
13.2. Ein Konfidenzintervall für den Anteil p . .
13.3. Bestimmung des Stichprobenumfangs . . . .
13.4. Parteien, Wahlen und Prognosen . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Gallup und die US-Präsidentenwahl von
14.Testen von Hypothesen
14.1. Test einer Hypothese für den Anteil p . . .
14.2. Fehler 1. Art und Fehler 2. Art . . . . . . . .
14.3. Einseitige und zweiseitige Tests . . . . . . .
14.4. Ein Anpassungstest . . . . . . . . . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Popper und das Testen von Hypothesen
xiv
299
. . .
. . .
. . .
. . .
. . .
. . .
. . .
1936
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
301
303
307
309
313
319
322
324
325
.
.
.
.
.
.
.
.
329
331
334
337
339
348
349
352
353
Inhalt
15.Das klassische lineare Regressionsmodell
15.1. Das einfache Regressionsmodell . . . . . . .
15.2. Der t-Test . . . . . . . . . . . . . . . . . . .
15.3. Der F -Test . . . . . . . . . . . . . . . . . .
15.4. Das multiple Regressionsmodell . . . . . . .
Anmerkungen . . . . . . . . . . . . . . . . . . . .
Aufgaben . . . . . . . . . . . . . . . . . . . . . .
Fragen . . . . . . . . . . . . . . . . . . . . . . . .
Exkurs: Multiple Hypothesen und multiple Tests
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
355
357
360
364
366
371
371
373
375
16.Ausblick – Ein statistischer Wegweiser
379
16.1. Ökonometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
16.2. Zeitreihenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
16.3. Empirische Wirtschaftsforschung . . . . . . . . . . . . . . . . . . 384
Anhang
387
A. Hinweise zur Verwendung von Excel
389
B. Lösungen zu ausgewählten
Kapitel 1 . . . . . . . . . .
Kapitel 2 . . . . . . . . . .
Kapitel 3 . . . . . . . . . .
Kapitel 4 . . . . . . . . . .
Kapitel 5 . . . . . . . . . .
Kapitel 6 . . . . . . . . . .
Kapitel 7 . . . . . . . . . .
Kapitel 8 . . . . . . . . . .
Kapitel 9 . . . . . . . . . .
Kapitel 10 . . . . . . . . . .
Kapitel 11 . . . . . . . . . .
Kapitel 12 . . . . . . . . . .
Kapitel 13 . . . . . . . . . .
Kapitel 14 . . . . . . . . . .
Kapitel 15 . . . . . . . . . .
395
395
397
397
398
398
400
400
401
401
402
402
403
403
403
404
Aufgaben
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
C. Hinweise zu den Internet-Suchrätseln
407
D. Beispiel einer Input-Output-Tabelle
409
xv
Inhalt
E. Griechisches Alphabet
417
F. Englische Fachbegriffe
419
Englisch – Deutsch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
Deutsch – Englisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
Literatur
429
Index
435
xvi
Kapitel 2.
Mittelwerte
Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch
eine geeignete Größe repräsentieren“ kann. Dabei werden oft Begriffe wie Mit”
telwert oder Durchschnitt verwendet, die einem bereits aus der Umgangssprache
bekannt sind. Bei unserem Kaffeehaus-Beispiel wäre etwa die Frage nahe liegend,
wie viel eine Melange im Durchschnitt kostet. Gesucht ist hier also nichts anderes
als eine quantitative Zusammenfassung der Daten, was zu den typischen Aufgaben der Statistik gehört. Mit diesem aus praktischer Sicht sehr wichtigen Thema
werden wir uns auf den folgenden Seiten näher beschäftigen.
Wir werden dabei verschiedene Maßzahlen kennenlernen, die auf unterschiedliche Weise der Vorstellung von einem Mittelwert oder Durchschnitt entsprechen.
Etwas allgemeiner spricht man in diesem Zusammenhang auch von Lagemaßzahlen. Hierzu sei ergänzt, dass für die Beschreibung eines Datensatzes oft nicht
nur eine, sondern sogar mehrere Lagemaßzahlen verwendet werden. Diese stellen
eine Form komprimierter Information dar. Außerdem erleichtern sie die Vergleichbarkeit von Daten für den Fall, dass nicht nur ein, sondern mehrere Datensätze
vorliegen. Wenn man zum Beispiel an den Preis von Produkten wie Kaffee, Bier,
Brot, Obst oder auch Benzin denkt, dann hat man es ja nicht mit Einheitspreisen,
sondern mit einer Vielzahl von Einzelpreisen zu tun. Wenn daher in Medienberichten vom aktuellen Benzinpreis oder dem diesjährigen Bierpreis am Münchner
Oktoberfest die Rede ist, dann sind natürlich Durchschnittspreise gemeint, auch
wenn dies nicht immer eigens erwähnt wird.
Betrachten wir ein anderes Beispiel. Abbildung 2.1 zeigt die jährlichen Wachstumsraten des Bruttoinlandsprodukts (BIP) für die EU, Deutschland, Österreich
und die Schweiz. Eine nahe liegende Frage in diesem Fall wäre wohl die nach einer
geeigneten Maßzahl, um das durchschnittliche jährliche Wachstum zu beschreiben. Dies würde nicht nur die Vergleichbarkeit der einzelnen Zeitreihen erleichtern.
Es könnte nämlich auch von Interesse sein, das jeweilige Wachstum für verschiedene Abschnitte einer gegebenen Zeitreihe miteinander zu vergleichen. Wir wer29
Kapitel 2. Mittelwerte
%
4,0
Schweiz
3,0
Österreich
EU
Deutschland
2,0
1,0
0
−1,0
2000
2001
2002
2003
2004
2005
2006
2007
Abbildung 2.1. BIP-Wachstumsraten für die EU, Deutschland, Österreich
und die Schweiz, 2000–2007 (Jahresdaten, real, in %)
den sehen, dass die Beschreibung des Wachstums einer Zeitreihe ein spezielles
Mittelwertkonzept erfordert, das man auch in der Finanzmathematik verwendet.
Falls nicht anders vermerkt, setzen wir ab jetzt voraus, dass die verwendeten
Ausprägungen immer von quantitativen Merkmalen stammen und dass man uneingeschränkt mit ihnen operieren kann. Beobachtungen, das heißt beobachtete
Daten, werden dabei üblicherweise mit x1 , x2 , . . ., xn bezeichnet.
Es folgt ein kurzer Überblick über den Inhalt dieses Kapitels. Der erste Abschnitt beschäftigt sich mit dem wohl am häufigsten verwendeten Mittelwert,
dem sogenannten arithmetischen Mittel. Dabei werden wir neben der traditionellen Definition auch eine Variante präsentieren, bei der die einzelnen Werte eine
Gewichtung aufweisen können, sodass das Ergebnis ein gewichtetes arithmetisches
Mittel darstellt. Im zweiten Abschnitt wird das geometrische Mittel behandelt,
das typischerweise bei Zeitreihendaten verwendet wird, wenn es darum geht, so
etwas wie eine durchschnittliche Wachstumsrate oder die durchschnittliche Rendite einer Finanzanlage zu bestimmen. Im nächsten Abschnitt wird kurz auf einige
weitere Maßzahlen eingegangen, die ebenfalls im Zusammenhang mit Mittelwerten relevant sind, nämlich der Modus, der Median bzw. allgemeiner die Quantile.
Eine spezielle grafische Darstellungsform, die Boxplots, wird im vierten Abschnitt
vorgestellt. Im letzten Abschnitt schließlich werden die vier Aktienindizes anhand
der durchschnittlichen Wachstumsrate bzw. Rendite miteinander verglichen.
30
2.1. Das arithmetische Mittel
2.1. Das arithmetische Mittel
Wann immer die Frage nach einem Durchschnitt, einem durchschnittlichen Wert
oder Mittelwert gestellt wird, wird man häufig zunächst an das arithmetische
Mittel denken1 . Es ist die mit Abstand populärste Lagemaßzahl zur Beschreibung
eines Datensatzes und wird üblicherweise durch einen Querstrich, zum Beispiel x,
gekennzeichnet2 .
Arithmetisches Mittel
1
x1 + · · · + xn
=
x=
xi
n
n i=1
n
Das arithmetische Mittel erhält man also dadurch, indem die Summe der Daten
durch ihre Anzahl dividiert wird. Bei den gesamten Melange-Preisen ergibt sich
daher für das arithmetische Mittel der Wert
x=
3,10 + 2,40 + · · · + 4,40 + 2,60
= 3,10
70
Die Frage nach dem durchschnittlichen Preis für eine Melange wäre in diesem Fall
mit der Angabe des Wertes x = 3,10 beantwortet. Berechnet man noch separat die
arithmetischen Mittel der Datensätze für den 1. Bezirk bzw. für die übrigen Bezirke, dann erhält man die Werte x1 = 3,40 bzw. x2 = 2,85, was erwartungsgemäß
den Unterschied im Preisniveau zwischen dem Stadtzentrum und den übrigen
Bezirken widerspiegelt.
Das arithmetische Mittel kann man vergleichen mit dem Gleichgewichtspunkt
einer Waage. Betrachtet man die Abweichungen der Beobachtungen vom arithmetischen Mittel, das heißt die Differenzen xi − x, dann zeigt sich, dass sich negative
und positive Abweichungen gegenseitig aufheben. Es gilt nämlich:
n
i=1
(xi − x) =
n
xi − nx = nx − nx = 0
i=1
Durch diese Eigenschaft wird das arithmetische Mittel charakterisiert. Mit anderen Worten, bei gegebenen Beobachtungen x1 , x2 , . . ., xn ist das arithmetische
Mittel x gerade diejenige Zahl, für die die Summe der Abweichungen den Wert
Null ergibt.
Fasst man die 70 Einzelwerte in einer Häufigkeitstabelle zusammen, wie wir es
bereits in Kapitel 1 getan haben, dann wird die Darstellung der Melange-Preise
31
Kapitel 2. Mittelwerte
Tabelle 2.1. Häufigkeiten der
Melange-Preise
absolute
absolute
Preis Häufigkeit Preis Häufigkeit
2,30
2,40
2,50
2,60
2,70
2,80
2,90
3,00
3,10
3,20
3,30
2
4
2
9
3
2
8
8
6
4
4
3,40
3,50
3,60
3,70
3,80
3,90
4,00
4,10
4,20
4,30
4,40
3
3
3
3
0
0
1
0
1
0
4
nicht nur übersichtlicher, sondern erlaubt auch eine alternative und elegantere Berechnung des arithmetischen Mittels. Das arithmetische Mittel lässt sich nämlich
jetzt auch so berechnen:
x=
2,30 · 2 + 2,40 · 4 + · · · + 4,40 · 4
= 3,10
70
Dabei wird jeder Preis mit der Häufigkeit seines Auftretens multipliziert ( ge”
wichtet“). Bezeichnet man allgemein die verschiedenen Merkmalsausprägungen
mit a1 , a2 , . . ., ak , dann erhält man also das arithmetische Mittel, indem die einzelnen Merkmalsausprägungen mit den entsprechenden absoluten Häufigkeiten h1 ,
h2 , . . ., hk gewichtet werden. Auf diese Weise erhält man formal das sogenannte
gewichtete arithmetische Mittel.
Gewichtetes arithmetisches Mittel
a1 · h1 + · · · + ak · hk
1
x=
ai · hi
=
n
n i=1
k
Diese Darstellung des arithmetischen Mittels ermöglicht übrigens eine Modifikation, bei der man statt der absoluten Häufigkeiten spezielle positive Gewichte g1 ,
g2 , . . ., gk verwenden kann, wobei dann der Zähler durch die Summe der Gewichte
dividiert wird. Auf diese Weise könnte man die einzelnen Merkmalsausprägungen
32
2.1. Das arithmetische Mittel
quasi mit ihrer Bedeutung“ gewichten. Man denke etwa an die Gewichtung von
”
Punktezahlen bei Prüfungen mit unterschiedlichem Schwierigkeitsgrad. Das entscheidende Problem ist hier natürlich die adäquate Zuordnung der Gewichte zu
den Einzelwerten.
Wenn man das mit den absoluten Häufigkeiten berechnete arithmetische Mittel
etwas umformt, dann zeigt sich, dass man x darstellen kann als die Summe der
Produkte aus den verschiedenen Merkmalsausprägungen und den zugehörigen
relativen Häufigkeiten
1
hi x=
ai · hi =
ai ·
ai · fi
=
n i=1
n
i=1
i=1
k
k
k
Auf diese Darstellung werden wir in der Wahrscheinlichkeitsrechnung noch einmal
zurückkommen. Damit lässt sich nämlich der Begriff des Erwartungswerts einer
diskreten Zufallsvariablen relativ einfach motivieren.
klausurtipp
Falls man das gewichtete arithmetische Mittel verwendet, sollte man sich klar
darüber sein, über welche Werte eigentlich gemittelt“ wird. Hier kommt es
”
immer wieder zu Verwechslungen. Betrachten wir zum Beispiel die folgende
Berechnung des arithmetischen Mittels der Ausprägungen 1, 2, 3 und 4 eines
Merkmals mit den absoluten Häufigkeiten 5, 3, 4 und 8:
x=
1·5+2·3+3·4+4·8
= 3,5
10
Dieses Ergebnis ist natürlich falsch! In diesem Fall ist nämlich der Nenner nicht
gleich der Summe der Häufigkeiten, sondern gleich der Summe der vier verschiedenen Ausprägungen, die tatsächlich den Wert 10 hat. Wenn man will, könnte
man sagen, dass hier das gewichtete arithmetische Mittel von vier Zahlen berechnet wurde, wobei die Ausprägungen“ 5, 3, 4 und 8 mit den Häufigkeiten“
”
”
1, 2, 3 und 4 gewichtet wurden. Das war aber nicht gefragt!
Obwohl das arithmetische Mittel derjenige Mittelwert ist, der am häufigsten
verwendet wird, ist seine Anwendung nicht immer ganz unproblematisch. Da
nämlich bei seiner Berechnung sämtliche Beobachtungen berücksichtigt werden,
können zum Beispiel extreme Werte, sogenannte Ausreißer, den Mittelwert unter Umständen stark beeinflussen. Das ist nicht unbedingt eine wünschenswerte
Eigenschaft, wenn man an einem repräsentativen Mittelwert interessiert ist. Auf
diesen Aspekt werden wir bei der Definition des Medians noch eingehen.
33
Index
Abschlusstest-Prinzip, 377
absolute Konzentration, 58
Additivität, 170
Alternativhypothese, 331
Anpassungstest, 339
Antwort-Bias, 327
arithmetisches Mittel, 31
Auswahlsatz, 312
Autokorrelation, 104
Autokorrelationsfunktion, 383
autoregressiver Prozess, 382
Baltic Dry Index, 144
Basisperiode, 75
Bayes-Regel, 188
Beck, H., 175
bedingte Wahrscheinlichkeit, 183
bedingter Erwartungswert, 224
Behandlungsgruppe, 225
Berichtsperiode, 75
Bestellmengenproblem, 249
Bestimmtheitsmaß, 127
Beta-Verteilung, 267
Binomialkoeffizient, 165
Binomialverteilung, 233
binomische Formel, 172
Biodiversität, 297
Bonferroni-Holm-Prozedur, 377
Bonferroni-Prozedur, 377
Box, G. E. P., 176
Chi-Quadrat-Test, 342
Chi-Quadrat-Verteilung, 340
Dichtefunktion, 255
disjunkte Ereignisse, 154
diskrete Verteilung, 227
diskrete Zufallsvariable, 207
diskretes Merkmal, 7
Diversifikation, 295
Dreiecksverteilung, 259
Dummy-Variable, 103, 219
Durchschnitt, 31
Durchschnittsgeschwindigkeit, 44
dynamisches Modell, 380
effizientes Portfolio, 296
einfache lineare Regression, 121
einfaches Regressionsmodell, 357
einseitiges Konfidenzintervall, 320
empirische Wirtschaftsforschung, 384
Ereignis, 152
Ergebnisraum, 151
erklärte Streuung, 128
Erwartungstreue, 305
Erwartungswert, 211, 262
Eurostat, 49
Evaluierung, 223
Exponentialverteilung, 255
Export-Frühindikator, 144
F-Statistik, 363
F-Test, 364
435
Index
F-Verteilung, 365
Fakultät, 163
Falsifizierbarkeit, 353
Fehler 1. Art, 335
Fehler 2. Art, 335
Fehlervariable, 357
Fermat, P., 149
Frühindikator, 143
Fragebogen, 319
Freiheitsgrad, 348
günstige Fälle, 159
Gallup, G., 325
Gallup-Institut, 317, 318
Geburtstagsproblem, 168
geometrisches Mittel, 34
Gesamtstreuung, 128
gewichtetes arithmetisches Mittel, 32
GlücksSpirale, 173
gleichverteilte Zufallsvariable, 272
Gleichverteilung, 272
Gravitationsgesetz, 70
Gravitationsmodell, 70
Grundgesamtheit, 5
harmonisches Mittel, 44
Harmonisierter Verbraucherpreisindex,
83
Herfindahl-Index, 62
Histogramm, 11
homogene Markov-Kette, 202
Human Development Index, 89
Hypergeometrische Verteilung, 229
ifo-Geschäftsklimaindex, 144
Indexzahlen, 73
Inflationsrate, 83
Input-Output-Analyse, 384
Input-Output-Rechnung, 409
Input-Output-Tabelle, 384, 409
436
Inputkoeffizient, 384
Institut für Demoskopie Allensbach,
315, 318
klassisches lineares Regressionsmodell,
355
Kolmogorov, A. N., 160
Kombinatorik, 162
Konfidenzintervall, 307
Konfidenzniveau, 307
Konjunkturindikator, 143
kontrafaktische Situation, 224
Kontrollgruppe, 225
Konzentration, 58
absolute, 58
relative, 58
Konzentrationsmaß, 58
Korrelation, 93
Korrelationskoeffizient, 97
Kovarianz, 96
Lagemaßzahl, 29
Laplace-Definition, 158
Laspeyres-Preisindex, 78
Leontief-Matrix, 385
Lineare Regression, 119
einfache, 121
multiple, 131
linksseitiger Test, 337
Literary Digest, 325
Lorenz-Münzner-Koeffizient, 61
mögliche Fälle, 159
Markov, A., 202
Markov-Eigenschaft, 201
Markov-Kette, 202
Markov-Matrix, 203
Markowitz, H., 295
Median, 37
Mengenindex, 82
Index
Mengenoperationen, 170
Merkmal, 6
diskretes, 7
qualitatives, 6
quantitatives, 6
stetiges, 7
Merkmalsausprägung, 6
Methode der kleinsten Quadrate, 121
Modell, 175
Modulo-Funktion, 271
Modus, 35
multiple Hypothesenprüfung, 375
multiple lineare Regression, 131
multipler Test, 375
multiples Regressionsmodell, 366
Multiplikationssatz, 184
Multiplizitätsproblem, 375
Preisindex, 75
aggregierter, 77
einfacher, 75
Fisher-Preisindex, 82
Laspeyres-Preisindex, 78
Paasche-Preisindex, 81
ungewichteter, 77
Programm-Effekt, 224
Programmevaluierung, 223
Pseudo-Zufallszahlen, 271
Puschkin, A., 201
newsboy problem, 249
newsvendor problem, 249
Newton, I., 70
Nominalskala, 7
Normalverteilung, 275
nowcasting, 143
Nullhypothese, 331
Rangskala, 7
rechtsseitiger Test, 337
Regressionsgerade, 124
Regressionsgleichung, 124
Regressor, 119
Regressormatrix, 380
relative Häufigkeit, 9, 155
relative Konzentration, 58
repräsentative Stichprobe, 318
Residuen, 127
Residuum, 127
Reststreuung, 128
optimale Bestellmenge, 249
Ordinalskala, 7
P-Wert, 332
p %-Quantil, 38
paarweise disjunkte Ereignisse, 160
Paasche-Preisindex, 81
Panel, 117
Pascal, B., 149, 172
Poisson-Verteilung, 238
Popper, K. R., 353
Population, 4
Portfolio, 295
Portfoliotheorie, 295
qualitatives Merkmal, 6
Quantil, 38
quantitatives Merkmal, 6
Quartilsdistanz, 65
Quotenverfahren, 318
Sammelindikator, 145
Sandkastenmodell, 176, 177
Schätzer, 305
Schätzwert, 305
Schwankungsbreite, 308
Selektionseffekt, 225
sicheres Ereignis, 152
Signifikanzniveau, 332
Simulation, 271
437
Index
Skalenniveau, 7
sozioökonomisches Panel, 117
Spannweite, 65
Störvariable, 357
Standardabweichung, 55, 213, 263
Standardfehler, 363
standardisierte Zufallsvariable, 216
Standardisierung, 216
Standardnormalverteilung, 277
Statistische Tabellen, 289
stetige Zufallsvariable, 253
stetiges Merkmal, 7
Stichproben-Bias, 327
Stichprobentheorie, 319
Stichprobenumfang, 309
Stiel-und-Blatt-Diagramm, 12
Stimmungsindikator, 144
stochastisch, 206
Streuungsmaß, 53
Streuungsmaßzahl, 53
Streuungszerlegung, 128
t-Statistik, 363
t-Test, 360
t-Verteilung, 361
Test, 331
Anpassungstest, 339
Anteilstest, 333
Chi-Quadrat-Test, 342
F-Test, 364
t-Test, 360
Test zum multiplen Niveau α, 377
Teststatistik, 332
Thünen, J. H., 69
Tourenplanung, 171
Travelling Salesman Problem, 171
Umfragemodell, 303
unabhängige Ereignisse, 191
unabhängige Zufallsvariablen, 217, 264
438
unmögliches Ereignis, 152
Urnenmodell, 181
Variable, 6
Varianz, 55, 213, 263
Variationskoeffizient, 57
Venn-Diagramm, 152
Verbraucherpreisindex, 83
Verflechtungsmatrix, 409
Verhältnisskala, 7
Verifizierbarkeit, 353
versteckte Variable, 117
Verteilung, 8, 208
Binomialverteilung, 233
Chi-Quadrat-Verteilung, 340
Dreiecksverteilung, 259
Exponentialverteilung, 255
F-Verteilung, 365
Gleichverteilung, 269
hypergeometrische Verteilung, 229
Multinomialverteilung, 349
Normalverteilung, 275
Poisson-Verteilung, 238
Rechteckverteilung, 269
t-Verteilung, 361
Verteilungsfunktion, 209, 257
Volkswirtschaftliche Gesamtrechnung,
409
vollständige Wahrscheinlichkeit, 187
Vorleistungsmatrix, 385, 409
Wahlhochrechnung, 313
Wahrscheinlichkeit, 158
Wahrscheinlichkeitsaxiome, 160
Wahrscheinlichkeitsfunktion, 208
Wahrscheinlichkeitsmaß, 170
Warenkorb, 79
z-Wert, 58
Zeitreihe, 13
Index
Zeitreihenanalyse, 382
Zeitreihenmodell, 383
Zeitungsverkäufer-Problem, 249
zentraler Grenzwertsatz, 283
ZEW-Konjunkturindikator, 144
Zufallsvariable, 205
diskrete, 207
stetige, 256
Zufallszahlen, 271
Zufallszahlengenerator, 271
zweiseitiger Test, 338
439
Herunterladen