Raimund Alt Dieses Lehrbuch bietet eine kompakte Einführung in die Grundlagen der Statistik, das Studienanfänger wirtschaftswissenschaftlicher Studiengänge sowohl begleitend zu Lehrveranstaltungen als auch für das Selbststudium nützen können. Das in der Lehre erprobte didaktische Konzept, auf dem das Buch aufbaut, präsentiert auf verständliche Art und Weise Konzepte und Methoden der Deskriptiven Statistik, der Wahrscheinlichkeitsrechnung und der Induktiven Statistik. Zahlreiche Beispiele und Abbildungen veranschaulichen die Materie und erleichtern deren Verständnis. Statistik Eine Einführung für Wirtschaftswissenschaftler Alt Mag. Dr. Raimund Alt ist Senior Researcher am ECONOMICA Institut für Wirtschaftsforschung sowie Lektor an der Fachhochschule des bfi Wien. Statistik Für die zweite Auflage wurde die Reihenfolge der Kapitel beibehalten, allerdings kam es in manchen Kapiteln zu einer Neuaufteilung der Abschnitte, um die Darstellung des Stoffes übersichtlicher zu gestalten. Neben einigen neuen Exkursen wurden unter anderem auch Internet-Suchrätsel in das Buch aufgenommen. Ein erweiterter Anhang enthält jetzt ein Beispiel für eine Input-Output-Tabelle sowie ein Verzeichnis englischsprachiger Fachbegriffe. ISBN 978-3-7143-0228-8 www.lindeverlag.at 3-7143-0228-8.indd 1 2. Auflage 09.01.2013 09:37:42 Inhalt I. Deskriptive Statistik 1 1. Einführung 1.1. Die Grundgesamtheit . . . . . . . . . . . . . 1.2. Merkmale und Verteilungen . . . . . . . . . 1.3. Tabellen und Grafiken . . . . . . . . . . . . 1.4. Aktienmärkte. Eine empirische Fallstudie (1) Anmerkungen . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Wo gibt es eigentlich statistische Daten? 2. Mittelwerte 2.1. Das arithmetische Mittel . . . . . . . . . 2.2. Das geometrische Mittel . . . . . . . . . 2.3. Modus, Median und Quantile . . . . . . 2.4. Boxplots . . . . . . . . . . . . . . . . . . 2.5. Aktienmärkte. Eine empirische Fallstudie Anmerkungen . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . Exkurs: Ein Besuch bei Eurostat . . . . . . . 3. Streuung und Konzentration 3.1. Varianz und Standardabweichung . . . . 3.2. Variationskoeffizient und z-Werte . . . . 3.3. Konzentrationsmaße . . . . . . . . . . . 3.4. Aktienmärkte. Eine empirische Fallstudie Anmerkungen . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (2) . . . . . . . . . . . . . . (3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 5 6 10 15 19 21 23 25 . . . . . . . . . 29 31 34 35 39 40 44 45 47 49 . . . . . . . 53 55 57 58 63 65 65 67 xi Inhalt Exkurs: Regionen, Distanzen und das Gravitationsgesetz . . . . . . . 4. Indexzahlen 4.1. Ein einfacher Preisindex . . . . . . . . . . . . . . . . . . . . 4.2. Aggregierte Preisindizes . . . . . . . . . . . . . . . . . . . . 4.3. Mengenindizes . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. Verbraucherpreisindizes . . . . . . . . . . . . . . . . . . . . . 4.5. Aktienmärkte. Eine empirische Fallstudie (4) . . . . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Human Development Index – ein Entwicklungsindikator 5. Korrelation 5.1. Die Kovarianz . . . . . . . . . . . . . . . . . . 5.2. Der Korrelationskoeffizient . . . . . . . . . . . 5.3. Korrelation und Kausalität . . . . . . . . . . . 5.4. Autokorrelation bei Zeitreihen . . . . . . . . . 5.5. Aktienmärkte. Eine empirische Fallstudie (5) . Anmerkungen . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Bildung und der Geist“ des Kapitalismus ” 6. Lineare Regression 6.1. Die einfache lineare Regression . . . . . . . . 6.2. Das Bestimmtheitsmaß . . . . . . . . . . . . 6.3. Die multiple lineare Regression . . . . . . . 6.4. Aktienmärkte. Eine empirische Fallstudie (6) Anmerkungen . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Was ist eigentlich ein Frühindikator? . . II. Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 . . . . . . . . . 73 75 77 82 83 84 86 86 88 89 . . . . . . . . . 93 95 97 101 104 106 109 110 114 115 . . . . . . . . 119 121 127 131 137 139 139 142 143 147 7. Einführung 149 7.1. Ergebnisraum und Ereignisse . . . . . . . . . . . . . . . . . . . . 151 7.2. Die relative Häufigkeit eines Ereignisses . . . . . . . . . . . . . . . 154 xii Inhalt 7.3. Der Begriff der Wahrscheinlichkeit . . . . . . . . . . . 7.4. Wahrscheinlichkeit und Kombinatorik . . . . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Was versteht man eigentlich unter einem Modell? 8. Bedingte Wahrscheinlichkeit 8.1. Definition . . . . . . . . . . . . . . . . . . . . 8.2. Satz von der vollständigen Wahrscheinlichkeit 8.3. Die Bayes-Regel . . . . . . . . . . . . . . . . . 8.4. Unabhängige Ereignisse . . . . . . . . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Markov, Ketten und Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9. Diskrete Zufallsvariablen 9.1. Zufallsvariable und Wahrscheinlichkeitsfunktion . . . . . . . . 9.2. Der Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . 9.3. Die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4. Unabhängige Zufallsvariablen . . . . . . . . . . . . . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Programme, Evaluierung und kontrafaktische Situationen 10.Spezielle diskrete Verteilungen 10.1. Die hypergeometrische Verteilung . 10.2. Die Binomialverteilung . . . . . . . 10.3. Die Poisson-Verteilung . . . . . . . Anmerkungen . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . Exkurs: Das Zeitungsverkäufer-Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 162 170 173 174 175 . . . . . . . . 179 181 185 188 190 196 198 200 201 . . . . . . . . 205 207 209 213 216 219 220 222 223 . . . . . . . 227 229 233 238 245 246 248 249 11.Stetige Zufallsvariablen 253 11.1. Zufallsvariable und Dichtefunktion . . . . . . . . . . . . . . . . . 255 11.2. Der Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . 262 11.3. Die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 xiii Inhalt 11.4. Unabhängige Zufallsvariablen . . . . . . . . . . . . . 11.5. Diskrete und stetige Zufallsvariablen – Ein Vergleich Anmerkungen . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Zufallszahlen und Simulationen . . . . . . . . . . 12.Die Normalverteilung 12.1. Definition . . . . . . . . . . . . . . . 12.2. Eigenschaften der Normalverteilung . 12.3. Der zentrale Grenzwertsatz . . . . . . 12.4. Verteilungen und Tabellen . . . . . . Anmerkungen . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . Exkurs: Risiken, Renditen und Portfolios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 265 267 268 270 271 . . . . . . . . 275 277 279 283 289 291 292 294 295 III. Induktive Statistik 13.Schätzen von Parametern 13.1. Ein einfaches Umfragemodell . . . . . . . . . 13.2. Ein Konfidenzintervall für den Anteil p . . 13.3. Bestimmung des Stichprobenumfangs . . . . 13.4. Parteien, Wahlen und Prognosen . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Gallup und die US-Präsidentenwahl von 14.Testen von Hypothesen 14.1. Test einer Hypothese für den Anteil p . . . 14.2. Fehler 1. Art und Fehler 2. Art . . . . . . . . 14.3. Einseitige und zweiseitige Tests . . . . . . . 14.4. Ein Anpassungstest . . . . . . . . . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Popper und das Testen von Hypothesen xiv 299 . . . . . . . . . . . . . . . . . . . . . 1936 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 303 307 309 313 319 322 324 325 . . . . . . . . 329 331 334 337 339 348 349 352 353 Inhalt 15.Das klassische lineare Regressionsmodell 15.1. Das einfache Regressionsmodell . . . . . . . 15.2. Der t-Test . . . . . . . . . . . . . . . . . . . 15.3. Der F -Test . . . . . . . . . . . . . . . . . . 15.4. Das multiple Regressionsmodell . . . . . . . Anmerkungen . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . Fragen . . . . . . . . . . . . . . . . . . . . . . . . Exkurs: Multiple Hypothesen und multiple Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 357 360 364 366 371 371 373 375 16.Ausblick – Ein statistischer Wegweiser 379 16.1. Ökonometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380 16.2. Zeitreihenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 16.3. Empirische Wirtschaftsforschung . . . . . . . . . . . . . . . . . . 384 Anhang 387 A. Hinweise zur Verwendung von Excel 389 B. Lösungen zu ausgewählten Kapitel 1 . . . . . . . . . . Kapitel 2 . . . . . . . . . . Kapitel 3 . . . . . . . . . . Kapitel 4 . . . . . . . . . . Kapitel 5 . . . . . . . . . . Kapitel 6 . . . . . . . . . . Kapitel 7 . . . . . . . . . . Kapitel 8 . . . . . . . . . . Kapitel 9 . . . . . . . . . . Kapitel 10 . . . . . . . . . . Kapitel 11 . . . . . . . . . . Kapitel 12 . . . . . . . . . . Kapitel 13 . . . . . . . . . . Kapitel 14 . . . . . . . . . . Kapitel 15 . . . . . . . . . . 395 395 397 397 398 398 400 400 401 401 402 402 403 403 403 404 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . C. Hinweise zu den Internet-Suchrätseln 407 D. Beispiel einer Input-Output-Tabelle 409 xv Inhalt E. Griechisches Alphabet 417 F. Englische Fachbegriffe 419 Englisch – Deutsch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419 Deutsch – Englisch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424 Literatur 429 Index 435 xvi Kapitel 2. Mittelwerte Im Zusammenhang mit dem Begriff der Verteilung, der im ersten Kapitel eingeführt wurde, taucht häufig die Frage auf, wie man die vorliegenden Daten durch eine geeignete Größe repräsentieren“ kann. Dabei werden oft Begriffe wie Mit” telwert oder Durchschnitt verwendet, die einem bereits aus der Umgangssprache bekannt sind. Bei unserem Kaffeehaus-Beispiel wäre etwa die Frage nahe liegend, wie viel eine Melange im Durchschnitt kostet. Gesucht ist hier also nichts anderes als eine quantitative Zusammenfassung der Daten, was zu den typischen Aufgaben der Statistik gehört. Mit diesem aus praktischer Sicht sehr wichtigen Thema werden wir uns auf den folgenden Seiten näher beschäftigen. Wir werden dabei verschiedene Maßzahlen kennenlernen, die auf unterschiedliche Weise der Vorstellung von einem Mittelwert oder Durchschnitt entsprechen. Etwas allgemeiner spricht man in diesem Zusammenhang auch von Lagemaßzahlen. Hierzu sei ergänzt, dass für die Beschreibung eines Datensatzes oft nicht nur eine, sondern sogar mehrere Lagemaßzahlen verwendet werden. Diese stellen eine Form komprimierter Information dar. Außerdem erleichtern sie die Vergleichbarkeit von Daten für den Fall, dass nicht nur ein, sondern mehrere Datensätze vorliegen. Wenn man zum Beispiel an den Preis von Produkten wie Kaffee, Bier, Brot, Obst oder auch Benzin denkt, dann hat man es ja nicht mit Einheitspreisen, sondern mit einer Vielzahl von Einzelpreisen zu tun. Wenn daher in Medienberichten vom aktuellen Benzinpreis oder dem diesjährigen Bierpreis am Münchner Oktoberfest die Rede ist, dann sind natürlich Durchschnittspreise gemeint, auch wenn dies nicht immer eigens erwähnt wird. Betrachten wir ein anderes Beispiel. Abbildung 2.1 zeigt die jährlichen Wachstumsraten des Bruttoinlandsprodukts (BIP) für die EU, Deutschland, Österreich und die Schweiz. Eine nahe liegende Frage in diesem Fall wäre wohl die nach einer geeigneten Maßzahl, um das durchschnittliche jährliche Wachstum zu beschreiben. Dies würde nicht nur die Vergleichbarkeit der einzelnen Zeitreihen erleichtern. Es könnte nämlich auch von Interesse sein, das jeweilige Wachstum für verschiedene Abschnitte einer gegebenen Zeitreihe miteinander zu vergleichen. Wir wer29 Kapitel 2. Mittelwerte % 4,0 Schweiz 3,0 Österreich EU Deutschland 2,0 1,0 0 −1,0 2000 2001 2002 2003 2004 2005 2006 2007 Abbildung 2.1. BIP-Wachstumsraten für die EU, Deutschland, Österreich und die Schweiz, 2000–2007 (Jahresdaten, real, in %) den sehen, dass die Beschreibung des Wachstums einer Zeitreihe ein spezielles Mittelwertkonzept erfordert, das man auch in der Finanzmathematik verwendet. Falls nicht anders vermerkt, setzen wir ab jetzt voraus, dass die verwendeten Ausprägungen immer von quantitativen Merkmalen stammen und dass man uneingeschränkt mit ihnen operieren kann. Beobachtungen, das heißt beobachtete Daten, werden dabei üblicherweise mit x1 , x2 , . . ., xn bezeichnet. Es folgt ein kurzer Überblick über den Inhalt dieses Kapitels. Der erste Abschnitt beschäftigt sich mit dem wohl am häufigsten verwendeten Mittelwert, dem sogenannten arithmetischen Mittel. Dabei werden wir neben der traditionellen Definition auch eine Variante präsentieren, bei der die einzelnen Werte eine Gewichtung aufweisen können, sodass das Ergebnis ein gewichtetes arithmetisches Mittel darstellt. Im zweiten Abschnitt wird das geometrische Mittel behandelt, das typischerweise bei Zeitreihendaten verwendet wird, wenn es darum geht, so etwas wie eine durchschnittliche Wachstumsrate oder die durchschnittliche Rendite einer Finanzanlage zu bestimmen. Im nächsten Abschnitt wird kurz auf einige weitere Maßzahlen eingegangen, die ebenfalls im Zusammenhang mit Mittelwerten relevant sind, nämlich der Modus, der Median bzw. allgemeiner die Quantile. Eine spezielle grafische Darstellungsform, die Boxplots, wird im vierten Abschnitt vorgestellt. Im letzten Abschnitt schließlich werden die vier Aktienindizes anhand der durchschnittlichen Wachstumsrate bzw. Rendite miteinander verglichen. 30 2.1. Das arithmetische Mittel 2.1. Das arithmetische Mittel Wann immer die Frage nach einem Durchschnitt, einem durchschnittlichen Wert oder Mittelwert gestellt wird, wird man häufig zunächst an das arithmetische Mittel denken1 . Es ist die mit Abstand populärste Lagemaßzahl zur Beschreibung eines Datensatzes und wird üblicherweise durch einen Querstrich, zum Beispiel x, gekennzeichnet2 . Arithmetisches Mittel 1 x1 + · · · + xn = x= xi n n i=1 n Das arithmetische Mittel erhält man also dadurch, indem die Summe der Daten durch ihre Anzahl dividiert wird. Bei den gesamten Melange-Preisen ergibt sich daher für das arithmetische Mittel der Wert x= 3,10 + 2,40 + · · · + 4,40 + 2,60 = 3,10 70 Die Frage nach dem durchschnittlichen Preis für eine Melange wäre in diesem Fall mit der Angabe des Wertes x = 3,10 beantwortet. Berechnet man noch separat die arithmetischen Mittel der Datensätze für den 1. Bezirk bzw. für die übrigen Bezirke, dann erhält man die Werte x1 = 3,40 bzw. x2 = 2,85, was erwartungsgemäß den Unterschied im Preisniveau zwischen dem Stadtzentrum und den übrigen Bezirken widerspiegelt. Das arithmetische Mittel kann man vergleichen mit dem Gleichgewichtspunkt einer Waage. Betrachtet man die Abweichungen der Beobachtungen vom arithmetischen Mittel, das heißt die Differenzen xi − x, dann zeigt sich, dass sich negative und positive Abweichungen gegenseitig aufheben. Es gilt nämlich: n i=1 (xi − x) = n xi − nx = nx − nx = 0 i=1 Durch diese Eigenschaft wird das arithmetische Mittel charakterisiert. Mit anderen Worten, bei gegebenen Beobachtungen x1 , x2 , . . ., xn ist das arithmetische Mittel x gerade diejenige Zahl, für die die Summe der Abweichungen den Wert Null ergibt. Fasst man die 70 Einzelwerte in einer Häufigkeitstabelle zusammen, wie wir es bereits in Kapitel 1 getan haben, dann wird die Darstellung der Melange-Preise 31 Kapitel 2. Mittelwerte Tabelle 2.1. Häufigkeiten der Melange-Preise absolute absolute Preis Häufigkeit Preis Häufigkeit 2,30 2,40 2,50 2,60 2,70 2,80 2,90 3,00 3,10 3,20 3,30 2 4 2 9 3 2 8 8 6 4 4 3,40 3,50 3,60 3,70 3,80 3,90 4,00 4,10 4,20 4,30 4,40 3 3 3 3 0 0 1 0 1 0 4 nicht nur übersichtlicher, sondern erlaubt auch eine alternative und elegantere Berechnung des arithmetischen Mittels. Das arithmetische Mittel lässt sich nämlich jetzt auch so berechnen: x= 2,30 · 2 + 2,40 · 4 + · · · + 4,40 · 4 = 3,10 70 Dabei wird jeder Preis mit der Häufigkeit seines Auftretens multipliziert ( ge” wichtet“). Bezeichnet man allgemein die verschiedenen Merkmalsausprägungen mit a1 , a2 , . . ., ak , dann erhält man also das arithmetische Mittel, indem die einzelnen Merkmalsausprägungen mit den entsprechenden absoluten Häufigkeiten h1 , h2 , . . ., hk gewichtet werden. Auf diese Weise erhält man formal das sogenannte gewichtete arithmetische Mittel. Gewichtetes arithmetisches Mittel a1 · h1 + · · · + ak · hk 1 x= ai · hi = n n i=1 k Diese Darstellung des arithmetischen Mittels ermöglicht übrigens eine Modifikation, bei der man statt der absoluten Häufigkeiten spezielle positive Gewichte g1 , g2 , . . ., gk verwenden kann, wobei dann der Zähler durch die Summe der Gewichte dividiert wird. Auf diese Weise könnte man die einzelnen Merkmalsausprägungen 32 2.1. Das arithmetische Mittel quasi mit ihrer Bedeutung“ gewichten. Man denke etwa an die Gewichtung von ” Punktezahlen bei Prüfungen mit unterschiedlichem Schwierigkeitsgrad. Das entscheidende Problem ist hier natürlich die adäquate Zuordnung der Gewichte zu den Einzelwerten. Wenn man das mit den absoluten Häufigkeiten berechnete arithmetische Mittel etwas umformt, dann zeigt sich, dass man x darstellen kann als die Summe der Produkte aus den verschiedenen Merkmalsausprägungen und den zugehörigen relativen Häufigkeiten 1 hi x= ai · hi = ai · ai · fi = n i=1 n i=1 i=1 k k k Auf diese Darstellung werden wir in der Wahrscheinlichkeitsrechnung noch einmal zurückkommen. Damit lässt sich nämlich der Begriff des Erwartungswerts einer diskreten Zufallsvariablen relativ einfach motivieren. klausurtipp Falls man das gewichtete arithmetische Mittel verwendet, sollte man sich klar darüber sein, über welche Werte eigentlich gemittelt“ wird. Hier kommt es ” immer wieder zu Verwechslungen. Betrachten wir zum Beispiel die folgende Berechnung des arithmetischen Mittels der Ausprägungen 1, 2, 3 und 4 eines Merkmals mit den absoluten Häufigkeiten 5, 3, 4 und 8: x= 1·5+2·3+3·4+4·8 = 3,5 10 Dieses Ergebnis ist natürlich falsch! In diesem Fall ist nämlich der Nenner nicht gleich der Summe der Häufigkeiten, sondern gleich der Summe der vier verschiedenen Ausprägungen, die tatsächlich den Wert 10 hat. Wenn man will, könnte man sagen, dass hier das gewichtete arithmetische Mittel von vier Zahlen berechnet wurde, wobei die Ausprägungen“ 5, 3, 4 und 8 mit den Häufigkeiten“ ” ” 1, 2, 3 und 4 gewichtet wurden. Das war aber nicht gefragt! Obwohl das arithmetische Mittel derjenige Mittelwert ist, der am häufigsten verwendet wird, ist seine Anwendung nicht immer ganz unproblematisch. Da nämlich bei seiner Berechnung sämtliche Beobachtungen berücksichtigt werden, können zum Beispiel extreme Werte, sogenannte Ausreißer, den Mittelwert unter Umständen stark beeinflussen. Das ist nicht unbedingt eine wünschenswerte Eigenschaft, wenn man an einem repräsentativen Mittelwert interessiert ist. Auf diesen Aspekt werden wir bei der Definition des Medians noch eingehen. 33 Index Abschlusstest-Prinzip, 377 absolute Konzentration, 58 Additivität, 170 Alternativhypothese, 331 Anpassungstest, 339 Antwort-Bias, 327 arithmetisches Mittel, 31 Auswahlsatz, 312 Autokorrelation, 104 Autokorrelationsfunktion, 383 autoregressiver Prozess, 382 Baltic Dry Index, 144 Basisperiode, 75 Bayes-Regel, 188 Beck, H., 175 bedingte Wahrscheinlichkeit, 183 bedingter Erwartungswert, 224 Behandlungsgruppe, 225 Berichtsperiode, 75 Bestellmengenproblem, 249 Bestimmtheitsmaß, 127 Beta-Verteilung, 267 Binomialkoeffizient, 165 Binomialverteilung, 233 binomische Formel, 172 Biodiversität, 297 Bonferroni-Holm-Prozedur, 377 Bonferroni-Prozedur, 377 Box, G. E. P., 176 Chi-Quadrat-Test, 342 Chi-Quadrat-Verteilung, 340 Dichtefunktion, 255 disjunkte Ereignisse, 154 diskrete Verteilung, 227 diskrete Zufallsvariable, 207 diskretes Merkmal, 7 Diversifikation, 295 Dreiecksverteilung, 259 Dummy-Variable, 103, 219 Durchschnitt, 31 Durchschnittsgeschwindigkeit, 44 dynamisches Modell, 380 effizientes Portfolio, 296 einfache lineare Regression, 121 einfaches Regressionsmodell, 357 einseitiges Konfidenzintervall, 320 empirische Wirtschaftsforschung, 384 Ereignis, 152 Ergebnisraum, 151 erklärte Streuung, 128 Erwartungstreue, 305 Erwartungswert, 211, 262 Eurostat, 49 Evaluierung, 223 Exponentialverteilung, 255 Export-Frühindikator, 144 F-Statistik, 363 F-Test, 364 435 Index F-Verteilung, 365 Fakultät, 163 Falsifizierbarkeit, 353 Fehler 1. Art, 335 Fehler 2. Art, 335 Fehlervariable, 357 Fermat, P., 149 Frühindikator, 143 Fragebogen, 319 Freiheitsgrad, 348 günstige Fälle, 159 Gallup, G., 325 Gallup-Institut, 317, 318 Geburtstagsproblem, 168 geometrisches Mittel, 34 Gesamtstreuung, 128 gewichtetes arithmetisches Mittel, 32 GlücksSpirale, 173 gleichverteilte Zufallsvariable, 272 Gleichverteilung, 272 Gravitationsgesetz, 70 Gravitationsmodell, 70 Grundgesamtheit, 5 harmonisches Mittel, 44 Harmonisierter Verbraucherpreisindex, 83 Herfindahl-Index, 62 Histogramm, 11 homogene Markov-Kette, 202 Human Development Index, 89 Hypergeometrische Verteilung, 229 ifo-Geschäftsklimaindex, 144 Indexzahlen, 73 Inflationsrate, 83 Input-Output-Analyse, 384 Input-Output-Rechnung, 409 Input-Output-Tabelle, 384, 409 436 Inputkoeffizient, 384 Institut für Demoskopie Allensbach, 315, 318 klassisches lineares Regressionsmodell, 355 Kolmogorov, A. N., 160 Kombinatorik, 162 Konfidenzintervall, 307 Konfidenzniveau, 307 Konjunkturindikator, 143 kontrafaktische Situation, 224 Kontrollgruppe, 225 Konzentration, 58 absolute, 58 relative, 58 Konzentrationsmaß, 58 Korrelation, 93 Korrelationskoeffizient, 97 Kovarianz, 96 Lagemaßzahl, 29 Laplace-Definition, 158 Laspeyres-Preisindex, 78 Leontief-Matrix, 385 Lineare Regression, 119 einfache, 121 multiple, 131 linksseitiger Test, 337 Literary Digest, 325 Lorenz-Münzner-Koeffizient, 61 mögliche Fälle, 159 Markov, A., 202 Markov-Eigenschaft, 201 Markov-Kette, 202 Markov-Matrix, 203 Markowitz, H., 295 Median, 37 Mengenindex, 82 Index Mengenoperationen, 170 Merkmal, 6 diskretes, 7 qualitatives, 6 quantitatives, 6 stetiges, 7 Merkmalsausprägung, 6 Methode der kleinsten Quadrate, 121 Modell, 175 Modulo-Funktion, 271 Modus, 35 multiple Hypothesenprüfung, 375 multiple lineare Regression, 131 multipler Test, 375 multiples Regressionsmodell, 366 Multiplikationssatz, 184 Multiplizitätsproblem, 375 Preisindex, 75 aggregierter, 77 einfacher, 75 Fisher-Preisindex, 82 Laspeyres-Preisindex, 78 Paasche-Preisindex, 81 ungewichteter, 77 Programm-Effekt, 224 Programmevaluierung, 223 Pseudo-Zufallszahlen, 271 Puschkin, A., 201 newsboy problem, 249 newsvendor problem, 249 Newton, I., 70 Nominalskala, 7 Normalverteilung, 275 nowcasting, 143 Nullhypothese, 331 Rangskala, 7 rechtsseitiger Test, 337 Regressionsgerade, 124 Regressionsgleichung, 124 Regressor, 119 Regressormatrix, 380 relative Häufigkeit, 9, 155 relative Konzentration, 58 repräsentative Stichprobe, 318 Residuen, 127 Residuum, 127 Reststreuung, 128 optimale Bestellmenge, 249 Ordinalskala, 7 P-Wert, 332 p %-Quantil, 38 paarweise disjunkte Ereignisse, 160 Paasche-Preisindex, 81 Panel, 117 Pascal, B., 149, 172 Poisson-Verteilung, 238 Popper, K. R., 353 Population, 4 Portfolio, 295 Portfoliotheorie, 295 qualitatives Merkmal, 6 Quantil, 38 quantitatives Merkmal, 6 Quartilsdistanz, 65 Quotenverfahren, 318 Sammelindikator, 145 Sandkastenmodell, 176, 177 Schätzer, 305 Schätzwert, 305 Schwankungsbreite, 308 Selektionseffekt, 225 sicheres Ereignis, 152 Signifikanzniveau, 332 Simulation, 271 437 Index Skalenniveau, 7 sozioökonomisches Panel, 117 Spannweite, 65 Störvariable, 357 Standardabweichung, 55, 213, 263 Standardfehler, 363 standardisierte Zufallsvariable, 216 Standardisierung, 216 Standardnormalverteilung, 277 Statistische Tabellen, 289 stetige Zufallsvariable, 253 stetiges Merkmal, 7 Stichproben-Bias, 327 Stichprobentheorie, 319 Stichprobenumfang, 309 Stiel-und-Blatt-Diagramm, 12 Stimmungsindikator, 144 stochastisch, 206 Streuungsmaß, 53 Streuungsmaßzahl, 53 Streuungszerlegung, 128 t-Statistik, 363 t-Test, 360 t-Verteilung, 361 Test, 331 Anpassungstest, 339 Anteilstest, 333 Chi-Quadrat-Test, 342 F-Test, 364 t-Test, 360 Test zum multiplen Niveau α, 377 Teststatistik, 332 Thünen, J. H., 69 Tourenplanung, 171 Travelling Salesman Problem, 171 Umfragemodell, 303 unabhängige Ereignisse, 191 unabhängige Zufallsvariablen, 217, 264 438 unmögliches Ereignis, 152 Urnenmodell, 181 Variable, 6 Varianz, 55, 213, 263 Variationskoeffizient, 57 Venn-Diagramm, 152 Verbraucherpreisindex, 83 Verflechtungsmatrix, 409 Verhältnisskala, 7 Verifizierbarkeit, 353 versteckte Variable, 117 Verteilung, 8, 208 Binomialverteilung, 233 Chi-Quadrat-Verteilung, 340 Dreiecksverteilung, 259 Exponentialverteilung, 255 F-Verteilung, 365 Gleichverteilung, 269 hypergeometrische Verteilung, 229 Multinomialverteilung, 349 Normalverteilung, 275 Poisson-Verteilung, 238 Rechteckverteilung, 269 t-Verteilung, 361 Verteilungsfunktion, 209, 257 Volkswirtschaftliche Gesamtrechnung, 409 vollständige Wahrscheinlichkeit, 187 Vorleistungsmatrix, 385, 409 Wahlhochrechnung, 313 Wahrscheinlichkeit, 158 Wahrscheinlichkeitsaxiome, 160 Wahrscheinlichkeitsfunktion, 208 Wahrscheinlichkeitsmaß, 170 Warenkorb, 79 z-Wert, 58 Zeitreihe, 13 Index Zeitreihenanalyse, 382 Zeitreihenmodell, 383 Zeitungsverkäufer-Problem, 249 zentraler Grenzwertsatz, 283 ZEW-Konjunkturindikator, 144 Zufallsvariable, 205 diskrete, 207 stetige, 256 Zufallszahlen, 271 Zufallszahlengenerator, 271 zweiseitiger Test, 338 439