Stochastik - von Andreas Zeh

Werbung
Skript
Stochastik
Beschreibende Statistik,
Wahrscheinlichkeitsrechnung
und schließende Statistik
Andreas Zeh-Marschke
Version 5.1 - 013
Diplom-Mathematiker Andreas Zeh-Marschke
Tauberring 16 b, 76344 Eggenstein-Leopoldshafen
E-Mail Andreas(at)Zeh-Marschke.de
Homepage http://www.Zeh-Marschke.de
Impressum
c
Copyright:
2001
- 2016
(Version:
5.1 - 013)
Layout und Satz: Andreas Zeh-Marschke
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen und
so weiter in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu
der Annahme, dass solche Namen im Sinne der Warenzeichen- und MarkenschutzGesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürfen.
2
Version 5.1 - 013
Vorwort
Die Stochastik ist das Teilgebiet der Mathematik, das sich mit Häufigkeiten und
Wahrscheinlichkeiten befasst. Zur Stochastik gehören die Teilbereiche beschreibende Statistik, Kombinatorik, Wahrscheinlichkeitsrechnung und schließende Statistik.
Dieses Skript entstand aus Vorlesungen zum Thema Statistik, welche ich seit 2001
an der Dualen Hochschule Baden-Württemberg Karlsruhe (ehemalige Berufsakademie Karlsruhe) und an der Hochschule Karlsruhe - Technik und Wirtschaft (ehemalige Fachhochschule Karlsruhe) in verschiedenen Studiengängen halte. Der Umfang der Vorlesung (inklusive Übungen) umfasst dabei etwa 30 Stunden. Dies zeigt,
dass nur ein kleiner Umfang der Stochastik behandelt werden kann.
Mit jedem neuen Kurs zur Statistik gibt es neue Anregungen und Änderungen,
die ich in das Skript einarbeite. Ab und an steht auch größere Überarbeitung an.
In dieser Version wurden größere Veränderungen durchgeführt.
Ursprüngliche Basis der Vorlesung stellten die Bücher von Schwarze dar (siehe
Schwarze 2001, Schwarze 1997, Schwarze 1999). Inzwischen habe ich auch weitere
Bücher herangezogen, die mir interessante Anregungen gegeben haben. Dies sind
insbesondere Fahrmeir 2003b, Fahrmeir 2003a, Fischer 2005 und Henze 2003. Weitere Bücher die den Umfang sehr gut abdecken sind Wewel 2011 und Rößler und
Ungerer 2011. Neben dieses speziellen Fachbüchern sind auch umfassendere Werke
sehr anregend: Eichholz und Vilkner 2002 und insbesondere das sehr umfassende
Werk Arens u. a. 2008.
Andreas Zeh-Marschke
Eggenstein-Leopoldshafen, 23.08.2016
Version 5.1 - 013
3
Inhaltsverzeichnis
1. Grundlagen
1.1. Einführung . . . .
1.2. Datenuntersuchung
1.3. Merkmale . . . . .
1.4. Aufgaben . . . . .
.
.
.
.
.
.
.
.
2. Univariate Daten
2.1. Darstellung univariater
2.2. Mittelwerte . . . . . .
2.3. Streuungsmaße . . . .
2.4. Aufgaben . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Daten
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
3. Bivariate Daten
3.1. Darstellungen bivariater Daten
3.2. Zusammenhangsanalyse . . . .
3.3. Regressionsrechnung . . . . . .
3.4. Aufgaben . . . . . . . . . . . .
4. Zeitreihenanalysen
4.1. Zeitreihen . . .
4.2. Bestandsanalyse
4.3. Indexzahlen . .
4.4. Aufgaben . . .
.
.
.
.
.
.
.
.
.
.
.
.
5. Kombinatorik
5.1. Permutationen . . .
5.2. Kombinationen . . .
5.3. Binomialkoeffizienten
5.4. Aufgaben . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
13
17
27
.
.
.
.
29
29
37
43
48
.
.
.
.
53
53
57
62
68
.
.
.
.
71
71
73
78
84
.
.
.
.
87
88
90
92
95
6. Grundlagen der Wahrscheinlichkeitsrechnung
97
6.1. Zufallsexperiment und Ereignis . . . . . . . . . . . . . . . . . . . . 97
6.2. Zusammen gesetzte Aufgaben . . . . . . . . . . . . . . . . . . . . . 103
6.3. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Version 5.1 - 013
5
Inhaltsverzeichnis
7. Zufallsvariablen
115
7.1. Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.2. Parameter von Zufallsvariablen . . . . . . . . . . . . . . . . . . . . 117
7.3. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8. Spezielle Verteilungen
8.1. Diskrete Gleichverteilung . . .
8.2. Stetige Gleichverteilung . . .
8.3. Binomialverteilung . . . . . .
8.4. Hypergeometrische Verteilung
8.5. Geometrische Verteilung . . .
8.6. Poissonverteilung . . . . . . .
8.7. Exponentialverteilung . . . . .
8.8. Normalverteilung . . . . . . .
8.9. Aufgaben . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
. 125
. 126
. 126
. 127
. 129
. 130
. 131
. 132
. 134
9. Schließende Statistik
137
9.1. Parameterschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.2. Intervallschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
9.3. Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
A. Tabellen
143
A.1. Basisdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
A.2. Tabelle der Normalverteilung . . . . . . . . . . . . . . . . . . . . . 145
L. Lösungen der Aufgaben
L.1. Grundlagen . . . . . . . . . . . . . . . . . .
L.2. Univariate Daten . . . . . . . . . . . . . . .
L.3. Bivariate Daten . . . . . . . . . . . . . . . .
L.4. Zeitreihenanalysen . . . . . . . . . . . . . .
L.5. Kombinatorik . . . . . . . . . . . . . . . . .
L.6. Grundlagen der Wahrscheinlichkeitsrechnung
L.7. Zufallsvariablen . . . . . . . . . . . . . . . .
L.8. Spezielle Verteilungen . . . . . . . . . . . . .
Literatur
6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
147
. 148
. 149
. 154
. 159
. 163
. 166
. 169
. 172
177
Version 5.1 - 013
Abbildungsverzeichnis
1.1. Beispiel: ordinal messbares Merkmal - Noten bei einer Klausur . . . 22
2.1.
2.2.
2.3.
2.4.
Beispiel:
Beispiel:
Beispiel:
Beispiel:
nominal messbares Merkmal - Kreisdiagramm
ordinal messbares Merkmal - Alter . . . . . .
Notenverteilung - grafische Darstellung . . . .
Summenhäufigkeit - Alter . . . . . . . . . . .
6.1.
6.2.
6.3.
6.4.
6.5.
6.6.
6.7.
Zwei Komponenten hintereinander . .
Mehrere Komponenten hintereinander
Zwei Komponenten parallel . . . . .
Drei Komponenten parallel . . . . . .
Mehrere Komponenten parallel . . .
Aggregat aus drei Komponenten . . .
Bauplan Radio . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
32
32
33
36
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
104
105
106
107
108
109
7.1. Verteilung Zeitbedarf . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Version 5.1 - 013
7
Tabellenverzeichnis
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
Beispieldaten: Noten einer Klausur .
Beispiel nominal messbarer Merkamle
Beispiel: ordinal messbares Merkmal Beispiel: ordinal messbare Merkmale
Beispiel: kardinal messbare Merkmale
Klassen bei Körpergröße . . . . . . .
. . . .
. . . .
Noten
. . . .
. . . .
. . . .
. .
. .
bei
. .
. .
. .
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
2.7.
2.8.
2.9.
Eigenschaften absolute und relative Häufigkeiten . .
Beispiel: Häufigkeitsverteilung Alter . . . . . . . . .
Beispiel: Tabelle Familienstand . . . . . . . . . . .
Beispiel: Notenverteilung - tabellarische Darstellung
Häufigkeitstabelle - horizontal . . . . . . . . . . . .
Häufigkeitstabelle - vertikal . . . . . . . . . . . . .
Beispiel: Körpergröße gruppiert . . . . . . . . . . .
Beispiel: Summen- und Resthhäufigkeit Alter . . . .
Beispielsrechnung geometrisches Mittel . . . . . . .
3.1. Zwei-dimensionale Häufigkeitstabelle . . . . . .
3.2. Beispiel: Körpergröße-Gewicht-Tabelle . . . . .
3.3. Beispiel Häufigkeitsverteilung . . . . . . . . . .
3.4. Bedingte Verteilung von Y . . . . . . . . . . . .
3.5. Bedingte Verteilung von X . . . . . . . . . . . .
3.6. Beispiel Häufigkeitsverteilung . . . . . . . . . .
3.7. Bedingte Verteilung Y . . . . . . . . . . . . . .
3.8. Bedingte Verteilung X . . . . . . . . . . . . . .
3.9. Beispiel zwei-dimensionale Verteilung . . . . . .
3.10. Tabelle für Beispiel 3.8 . . . . . . . . . . . . . .
3.11. Aufgabe zwei-dimensionale Häufigkeitsverteilung
3.12. Aufgabe zwei-dimensionale Häufigkeitsverteilung
. . .
. . .
einer
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . .
. . . . .
Klausur
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
21
22
22
24
27
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
30
31
31
33
34
34
35
36
41
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
55
56
57
58
58
58
59
59
61
66
68
68
4.1. Beispiel: gleitender Durchschnitt 3. Ordnung . . . . . . . . . . . . . 72
4.2. Beispiel: Gleitender Durchschnitt 4. Ordnung . . . . . . . . . . . . . 73
4.3. Bestandsveränderungen . . . . . . . . . . . . . . . . . . . . . . . . . 75
Version 5.1 - 013
9
Tabellenverzeichnis
4.4. Bestandsverlauf Produkt A . . . . . . . . .
4.5. Bestandsverlauf Produkt B . . . . . . . . .
4.6. Energiepreisentwicklung . . . . . . . . . .
4.7. Energiemengenentwicklung . . . . . . . . .
4.8. Verfügbares Einkommen private Haushalte
4.9. Bestandsveränderung Vorrat . . . . . . . .
4.10. Umsatz- und Preisentwicklung . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
77
79
81
83
84
85
5.1. Einführungsbeispiel Kombinatorik . . . . . . . . . . . . . . . . . . . 87
5.2. Zusammenfassung Permutationen und Kombinationen . . . . . . . . 93
6.1.
6.2.
6.3.
6.4.
Beispiel 6.8 . . . . . . . . . . . . . . . . .
Wahrscheinlichkeit bei zwei Ereignissen . .
Beispiel 6.9 . . . . . . . . . . . . . . . . .
Verfügbarkeiten Komponenten vom Radio
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
101
102
102
109
7.1. diskrete, endliche Wahrscheinlichkeitsverteilung . . . . . . . . . . . 116
7.2. Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . . . 122
8.1.
8.2.
8.3.
8.4.
Beispiel B(4; 0, 5)-Verteilung . . .
Beispiel: Fahrzeugzählung . . . .
Beispiel: Poissonverteilung . . . .
Beispiel: Brenndauer Glühbirnen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
131
131
134
9.1.
9.2.
9.3.
9.4.
Untersuchungsparameter . . . . . . . . .
Parameter in Abhängigkeit von der Güte
Beispiel: Stichprobenexperiment . . . . .
Fehler 1. und 2. Art . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
138
140
141
141
A.1. Basisdatensatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
10
Version 5.1 - 013
Kapitel 1.
Grundlagen
Zuerst (Abschnitt 1.1) wird anhand einiger Beispiele Fragestellungen und Anwendungsmöglichkeiten der Stochastik erläutert. Einige Beispiele, leider nicht alle,
werden im Rahmen dieses Skripts weiter behandelt.
Danach (Abschnitt 1.2) wird der Ablauf einer statistischen Untersuchung erläutert.
Dabei werden auch verschiedene Quellen von Daten dargelegt.
Danach (Abschnitt 1.3) werden einige statistische Grundbegriffe eingeführt, die in
allen Abschnitten benötigt werden. Speziell der Begriff Merkmal wird präzisiert.
1.1. Einführung
Die Stochastik umfasst die Teilbereiche mathematische Statistik, Kombinatorik,
Wahrscheinlichkeitsrechnung und schließende Statistik. Dazu zuerst einige Beispiele, welche die verschiedenen Anwendungsmöglichkeiten verdeutlichen.
Beispiele von Anwendungsmöglichkeiten
Beispiel 1.1 (Noten einer Klausur). Die tabellarische Verteilung der Noten einer
Klausur (siehe Tabelle 1.1) beschreibt das Ergebnis in einer Klausur.
sehr gut
2
Note
Anzahl
gut befriedigend
10
11
ausreichend mangelhaft
3
3
Tabelle 1.1.: Beispieldaten: Noten einer Klausur
Version 5.1 - 013
11
1.1. Einführung
Es sind die Daten für ein Beispiel der beschreibenden Statistik. Dabei sind auch
weitere Daten, die daraus gewonnen werden von Interesse. Welchen Mittelwert
haben die Ergebnisse? Wie sind die Daten gestreut?
Beispiel 1.2 (Bevölkerungsstatistik). Die Verteilung der Bevölkerung nach Altersjahrgängen und getrennt nach Männern und Frauen ist die berühmte Bevölkerungspyramide, die schon längst, bei uns in Deutschland, ein Pilz ist. Die Frage
nach dem durchschnittlichen Alter von Männer oder Frauen gehört zur beschreibenden Statistik, die Frage der Lebenserwartung von Männern oder Frauen eines
bestimmten Jahrgangs gehört zur schließenden Statistik und ist für Lebensversicherungen von Bedeutung.
Durch Volkszählungen werden verschiedene Merkmale für die Einwohner, nicht
nur Alter und Geschlecht, gesammelt. Aus diesen Angaben können Informationen
gewonnen werden, die für Planungen und Entscheidungen als Basis dienen.
Beispiel 1.3 (Umsatz). Die Statistik für den Umsatz einer Unternehmung enthält die Umsätze einzelner Artikel oder Gruppen von Artikeln, aufgegliedert nach
Perioden. Dieser Teil der beschreibenden Statistik ist Basis für Entscheidungen in
Unternehmen.
Beispiel 1.4 (Auslastung von Mitarbeitern). Die Statistik für die Auslastung einer
Abteilung enthält die verbuchten Stunden der Mitarbeiter je Projekt. Hierzu können
dann vielfältige Auswertungen erfolgen, die dann wiederum Basis für operative
Entscheidungen sind.
Beispiel 1.5 (Zahlenkombinationen). Wie viele möglichen Zahlenkombinationen
gibt es bei der Ziehungen der Lottozahlen (6 aus 49)? Dies ist eine Frage der
Kombinatorik. Die Frage, wie wahrscheinlich ein Sechser im Lotto ist, führt direkt
zur Wahrscheinlichkeitsrechnung.
Beispiel 1.6 (Aktienkurs). Die grafische Darstellung der Aktienkurse über einen
längeren Zeitraum ist ein Beispiel für eine Zeitreihe, ein Beispiel einer bivariaten
beschreibenden Statistik. Mittels verschiedener statistischer Kennzahlen, werden
dann Prognosen für den zukünftigen Kursverlauf erstellt, was zur schließenden
Statistik gehört.
Beispiel 1.7 (Verkehrszählung). Durch eine Zählung des Verkehrs werden Aussagen zur Dichte des Verkehrs und der dadurch bedingten Belastung beispielsweise
eines Verkehrsknotenpunktes erfasst. Damit erhalten Verkehrsplaner wertvolle Informationen, um Entscheidungen zu treffen.
Beispiel 1.8 (Sonntagsfrage). Bei der Sonntagsfrage wird eine Prognose für das
Wahlverhalten und damit für das Wahlergebnis erstellt. Aus einer Stichprobe (die
12
Version 5.1 - 013
Kapitel 1. Grundlagen
befragten Wähler) wird eine Aussage über den Wahlausgang erstellt. Manchmal
stimmt die Prognose, aber nicht immer.
Es gibt dazu den passenden Spruch „Prognosen sind schwierig, besonders wenn sie
die Zukunft betreffen.“. Dieser Spruch oder Zitat wird mehreren Personen zugesprochen. Das heißt, es ist unklar, wer diese zutreffende Bemerkung erstellt hat.
Beispiel 1.9 (Versuchsauswertung). Bei einem physikalischen Experiment wird
der Zusammenhang zweier Messgrößen erfasst. Es soll der Zusammenhang zwischen den Messgrößen beschrieben werden. Dies führt zur Regressionsrechnung,
einem Teil der beschreibenden Statistik.
Diese Beispiele zeigen, dass uns die Statistik an vielen Stellen begegnet. Zum Teil
werden vorhandene Daten verdichtet, komprimiert dargestellt, damit wir den Überblick bewahren. In anderen Bereichen werden Daten als Entscheidungsgrundlage
aufbereitet oder Prognosen erstellt.
Probleme mit Statistiken
Im Volksmund gibt es drei Formen der Lüge: die Notlüge, die gemeine Lüge und
die Statistik. Manchmal sagt man auch Traue keiner Statistik, die du nicht selber
gefälscht hast. Dies zeigt deutlich, dass das Vertrauen in die Statistik nicht das
Beste ist. Es zeugt jedoch auch davon, dass beim Lesen und der Interpretation von
Statistiken viele Fehler gemacht werden können. Das Lesen und das Interpretieren
von Statistiken ist daher stets sorgsam durchzuführen. An einigen Stellen werden
solche Beispiele angeführt.
Lesenswert für die Beleuchtung der Möglichkeiten der Manipulation mit Statistiken
ist das Buch Bosbach und Korff 2011. Hier sind viele Beispiele aufgeführt, die
teilweise lustig sind, aber in der Regel nachdenklich machen.
1.2. Datenuntersuchung
1.2.1. Datenerfassungsprozess
Eine statistische Untersuchung gliedert sich idealtypisch in fünf Phasen.
Version 5.1 - 013
13
1.2. Datenuntersuchung
1. In der Phase Planung wird der Untersuchungsgegenstand klar und eindeutig
definiert. Es ist zu klären, welche Information erhoben werden sollen, um ein
Entscheidungsproblem zu lösen.
Hierzu ist festzulegen, welches die statistische Masse oder Grundgesamtheit ist. Dann ist zu klären, welche Merkmale (für eine Klärung des Begriffes Merkmal, siehe Abschnitt 1.3) erhoben werden sollen. Darüber hinaus
ist zu klären, mit welchem Erhebungsverfahren die Daten erhoben werden. Wird eine Vollerhebung gemacht oder nur eine Stichprobe. In dieser
Planungsphase werden auch die organisatorischen und technischen Fragen
geklärt.
2. In der Phase Datenerhebung werden nach einer sorgfältigen Vorbereitung
die Daten erfasst. Bei einer Primärerhebung werden die Daten unmittelbar durch Experiment, Beobachtung oder Befragung erfasst. Bei einer Sekundärerhebung greift man auf bereits vorhandene Daten zurück. Hierbei
können auf amtliche oder nicht-amtliche Daten zurückgegriffen werden.
Werden die Daten durch eine Befragung von Personen erfasst, so ist die Wahl
der Fragestellung sehr sorgfältig zu wählen, um nicht durch die Fragestellung
die Antworten zu beeinflussen und somit das Ergebnis zu beeinflussen.
3. In der Phase Datenaufbereitung werden die gewonnenen Daten aufbereitet. Hierzu gehört auch die Prüfung der Daten, das Erkennen unplausibler Daten, die gegebenenfalls aus der weiteren Untersuchung ausgeschlossen
werden. Zur Datenaufbereitung gehören auch Darstellungen von Daten, zum
Beispiel in tabellarischer Form oder als Häufigkeitsverteilungen. Auch grafische Darstellungen der Daten gehören zur Datenaufbereitung.
4. In der Phase Datenauswertung oder auch statistische Analyse werden
mittels mathematischer Verfahren Analysen der Daten durchgeführt. Hierbei
werden Kenndaten, wie beispielsweise der Mittelwert, ermittelt, welche die
Daten charakterisieren. In dieser Phase helfen oftmals Tabellenkalkulationsprogramme oder spezielle und mächtige statistische Programme.
5. In der Phase Interpretation und Dokumentation werden die gewonnenen
Daten im Kontext der Anwendung interpretiert und beurteilt. Ebenso wird
die Datenuntersuchung dokumentiert, damit die Ergebnisse nachvollziehbar
sind.
14
Version 5.1 - 013
Kapitel 1. Grundlagen
1.2.2. Datenerhebung
Bei der Datenerhebung kann es verschiedene Herausforderungen geben. Können alle Elemente der Grundgesamtheit erfasst werden, also eine Vollerhebung durchgeführt werden oder kann nur eine Stichprobe, das heißt ein Ausschnitt aus
der Grundgesamtheit erhoben werden. Wenn nur eine Stichprobe erhoben werden
kann, wie können oder müssen die Elemente der Stichprobe ausgewählt werden,
damit wirklich auch Aussagen für die Grundgesamtheit gewonnen werden können.
Wie kann aus dem Daten der Stichprobe, die mittels der beschreibenden Statistik gewonnen werden, auf Daten der Grundgesamtheit geschlossen werden. Dies
ist Aufgabe der schließenden Statistik .
Für die Datenerhebung gibt es auch noch weitere Fragestellungen. Es ist leider
nicht immer möglich, oder nicht immer sinnvoll oder wirtschaftlich, alle Daten für
die Untersuchung heranzuziehen.
Beispiel 1.10 (Lebensdauer von Glühbirnen). In einer Fabrik, in der Glühbirnen
hergestellt werden, soll statistisch untersucht werden, wie lange die Glühbirnen
halten. Dazu können beispielsweise die Glühbirnen betrieben werden, bis sie kaputt
sind. Nach dieser Untersuchung ist eine Verwendung der Glühbirnen nicht mehr
möglich. Daher soll durch Untersuchung nur eines Teils der Produktion auf die
Qualität gefolgert werden. Aus der Untersuchung eines Teiles der Produktion wird
somit auf die gesamte Produktion geschlossen.
Beispiel 1.11 (Gewicht von Mehltüten). In einer Fabrik wird Mehl in 1kg-Beutel
verpackt. Um die Genauigkeit der Füllmengen zu überprüfen, wird nur ein Teil der
verpackten Beutel gewogen. Durch die Messung wird das Produkt nicht zerstört, es
wäre jedoch nicht wirtschaftlich, alle Packungen zu wiegen. Aus den Daten der
untersuchten Packungen wird auf die Genauigkeit der Füllmengen geschlossen.
Beispiel 1.12 (Sendeplatz). Für viele Entscheidungen auch in Unternehmen werden vielfältige statistische Daten benötigt. Soll im Marketing der Sendeplatz für
einen Werbespot ermittelt werden, so ist wichtig zu wissen, welche Personen zu
welchen Zeiten welche Sendungen ansehen!
Bei diesen Beispielen wird aus der Untersuchung auf einer Stichprobe Aussagen
über die Gesamtheit gemacht. Dies ist ein Teil der schließenden Statistik, die weiter
später betrachtet wird. Für Aussagen zur schließenden Statistik wird die Wahrscheinlichkeitsrechnung benötigt, die hierzu eingeführt wird.
In vielen Fällen werden die Daten für die Statistik selber erhoben. Hierzu gibt es
viele, fast unzählige Beispiele für Sachverhalte, die von Interesse sind, über die
Aussagen getroffen werden:
Version 5.1 - 013
15
1.2. Datenuntersuchung
• Kunden einer Firma,
• Qualität der Produktion
• Qualität von Dienstleistungen (z.B. die Pünktlichkeit bei Zügen)
• Kaufverhalten der Kunden
• Durchschnitt der Noten bei einer Klausur
• Studiendauer an einer Universität
• ...
Neben diesen Statistiken, welche durch die Firmen oder Institutionen selber erstellt
werden, gibt es auch offizielle Statistiken. Bekannte Vertreter hierfür sind:
• Inflationsrate
• Arbeitslosigkeit und Beschäftigung
• Daten zu Wirtschaft und Ausbildung
• Bevölkerung
• Wahlergebnisse
• ...
1.2.3. Datenquellen
Es gibt viele amtliche und nicht-amtliche Stellen, welche Daten bereitstellen. Diese
offiziellen Statistiken werden beispielsweise vom Statistischen Amt der EU (http:
//epp.eurostat.ec.europa.eu), vom Statistischen Bundesamt in Deutschland
(http://www.destatis.de) oder auch von den Landesämtern für Statistik der
einzelnen Bundesländer (beispielsweise http://www.statiatik-bw.de) geführt.
Daneben gibt es offizielle Statistiken von Institutionen für spezielle Fragestellungen, wie beispielsweise die statistischen Daten der Deutschen Bundesbank
(http://www.bundesbank.de) oder Daten der Bundesagentur für Arbeit (http:
//www.arbeitsagentur.de).
Daneben gibt es auch nicht-amtliche Statistiken, auf deren Basis weitere Auswertungen durchgeführt werden können. So gibt es Statistiken von Wirtschaftsforschungsinstitute, wie beispielsweise vom Deutsches Institut für Wirtschaftsforschung Berlin (DIW) (http://www.diw.de) oder das Institut für Weltwirtschaft
(IfW) in Kiel (http://www.uni-kiel.de/IfW/), von Markt- und Meinungsforschungsinstituten (beispielsweise Institut für Demoskopie Allensbach (IfD) (http:
16
Version 5.1 - 013
Kapitel 1. Grundlagen
//www.ifd-allensbach.de) oder der Gesellschaft für Konsum-, Markt- und Absatzforschung (GfK) aus Nürnberg (http://www.gfk.com) oder von Wirtschaftsverbänden (Beispiel Deutsche Industrie- und Handelskammern (http://www.ihk.
de) oder der Deutsche Gewerkschaftsbund (http://www.dgb.de).
1.3. Merkmale
In diesem Abschnitt wird genauer untersucht, welche Gegenstände in der Statistik
untersucht werden. Zuerst (Abschnitt 1.3.1) wird die statische Masse betrachtet.
Dann (Abschnitt 1.3.2) werden die einzelnen Einheiten der Untersuchungen beleuchtet. Was für unterschiedliche Typen von Untersuchungsgegenständen gibt es.
Abschließend (Abschnitt 1.3.3) werden einzelne Daten zu Klassen zusammengefasst.
1.3.1. Massen und Einheiten
Bei statistischen Untersuchungen werden bestimmte Objekte betrachtet. Dies können
• Personen (Einwohner, Studierende, Beschäftigte, Kunden, . . .),
• Gegenstände (Lagerpositionen, Produkte, Konten, Wohnungen, . . .),
• Ereignisse (Unfall, Geburt, Kauf, . . .) oder
• Einheiten (Unternehmen, Haushalte, Familien, Verwaltungsbezirke. . . .
sein.
Beispiel 1.13. Bei einer Volkszählung werden alle Einwohner befragt. Jeder Einzelne ist aufgefordert, Daten über sich herauszugeben: Alter, Familienstand, höchster Abschluss in der Schule, Beruf, Entfernung zur Arbeitsstätte, Einkommen,
Anzahl der Kinder, . . . und viele weitere Daten. Die gesamte Bevölkerung wird
hierbei gefragt. Jeder einzelne Einwohner ist eine Einheit der Untersuchung. Die
Daten der einzelnen Einwohner werden aggregiert. Es werden Informationen für
die gesamte Bevölkerung gesammelt, um daraus Aussagen über die Bevölkerung als
Ganzes zu treffen.
Version 5.1 - 013
17
1.3. Merkmale
Definition 1.1 (Statistische Einheit, statistisches Merkmal, statistische Masse).
Ein einzelnes Objekt einer statistischen Untersuchung heißt eine statistische
Einheit. Sie ist Trägerin der Informationen, der Eigenschaften, der statistischen Merkmale, für die man sich bei der Untersuchung interessiert.
Die Gesamtheit der statistischen Einheiten, welche für die Untersuchung von Bedeutung sind heißt statistische Masse . Sie ist im Hinblick auf das Ziel der
Untersuchung durch sachliche, räumliche und zeitliche Kriterien identifiziert beziehungsweise abgegrenzt.
Hierzu einige weitere Beispiele für statistische Massen und statistische Einheiten
und Daten, welche erhoben werden können.
Beispiel 1.14. Bei einer Volkszählung in Deutschland ist jeder einzelner Einwohner von Deutschland zu einem bestimmten Zeitpunkt eine statistische Einheit, die
gesamte Bevölkerung von Deutschland ist die statistische Masse. Daten die dabei
erhoben werden können sein: Wohnort, Beruf, Alter, Anzahl der Kinder, Einkommen, Entfernung zur Arbeitsstätte, . . ..
Beispiel 1.15. Bei der Untersuchung der Projekte in einer Abteilung für Softwareentwicklung ist jedes einzelne Projekt eine statistische Einheit, die Gesamtzahl der
Projekte der Entwicklungsabteilung ist die statistische Masse. Daten, welche untersucht werden können sein: Anzahl Mitarbeiter, Budget, Ist-Kosten, Ist-Stunden,
Rest-Stunden, Datum Auslieferung, . . ..
Bei diesem Beispiel kann man sich bezüglich der untersuchten Projekte genauer
Fragen, welche Projekte untersucht werden. Alle derzeit aktiven Projekte, alle
Projekte, welche im aktuellen Jahr aktiv waren? Zur Identifikation der statistischen
Einheiten, zur Entscheidung, ob sie zur statistischen Masse gehören sind sachliche,
räumliche und zeitliche Kriterien entscheidend.
Beispiel 1.16. Bei der Untersuchung des Produktionsvolumen in einer Station zur
Abfüllung von Getränken in Flaschen kann jede einzelne Flasche eine statistische
Einheit sein, wenn untersucht wird, welches Getränk in welcher Füllmenge in jeder
einzelnen Flasche ist.
Beispiel 1.17. Bei der Untersuchung der Studenten einer Hochschule sind die einzelnen Studenten, welche zu einem bestimmten Zeitpunkt an der Hochschule sind
die statistischen Einheiten. Die Gesamtzahl der Studenten zum untersuchten Zeitpunkt sind die statistische Masse. Untersuchte Daten können sein: Studiengang,
Semester, Alter, Herkunftsland, . . ..
18
Version 5.1 - 013
Kapitel 1. Grundlagen
Beispiel 1.18. Bei der Produktion eines Produktes oder bei der Anlieferung eines
Produktes ist jedes einzelne Produkt eine statistische Einheit. Die Gesamtmenge
der Produktion oder Anlieferungen sind die statistische Masse. Hierbei ist eine
zeitliche Abgrenzung sicherlich wichtig: die Produktion / Anlieferung an einem
Tag, in einer Woche, . . .. Untersucht werden kann hier die Qualität des Produktes,
ist sie in Ordnung oder nicht.
Bei diesem Beispiel, welches in der Qualitätssicherung in einem Unternehmen gebraucht wird, ist es in der Regel so, dass nicht die Gesamtheit der Produktion
oder Anlieferung überprüft wird, sondern nur ein kleiner Teil. Auch bei der Volkszählung in Deutschland im Jahr 2011 wird nur ein Teil (ca. 10%) der gesamten
Bevölkerung befragt.
Definition 1.2 (Stichprobe). Wird bei einer statistischen Untersuchung nur ein
Teil der interessierenden statistischen Masse erfasst, dann heißt dieser Teil Stichprobe.
Die Aussagen in der beschreibenden Statistik beziehen sich immer nur auf den
Umfang, der untersucht wird. Es ist keine Übertragung von Ergebnissen auf die
Obermenge möglich. Das ist dann erst eine Aufgabe der schließenden Statistik.
Gerade wieder bei der Aufgabe der Qualitätssicherung ist es jedoch gewünscht
von der untersuchten Stichprobe auf die gesamte statistische Masse zu schließen.
Bei einer großen Anlieferung von Waren soll durch eine Stichprobe entschieden
werden, ob die Qualität in Ordnung ist und die gesamte Anlieferung angenommen
wird oder wieder zurück gesendet wird.
Statistische Einheiten einer statistischen Masse können für einen gewissen Zeitraum permanent zur statistischen Masse gehören (beispielsweise die Einwohner
in einem Ort), andere statistische Einheit sind Ereignisse (z.B. Geburt oder Tod,
Zuzug oder Wegzug). Für die statistische Masse kann es eine Unterscheidung in
Bestandsmasse und Ereignismasse geben.
Definition 1.3 (Bestandsmasse, Ereignismasse). Eine statistische Masse, deren
Einheiten für ein gewisses Zeitintervall zur Masse gehört, heißt Bestandsmasse.
Die Anzahl der Einheiten, die zu einer Bestandsmasse zu einem bestimmten Zeitpunkt gehören, heißt Bestand. Ein Ereignis, welche eine Veränderung zu einem
bestimmten Zeitpunkt charakterisiert, heißt Ereignis. Eine statistische Masse, deren Einheiten Ereignisse sind, die zu einem bestimmten Zeitpunkt auftreten, heißt
Ereignismasse.
Die durchfahrenden Fahrzeuge an einem Messpunkt, die Unfälle an einer Kreuzung,
die Prüfungen an einer Hochschule sind Beispiele für Ereignismassen.
Version 5.1 - 013
19
1.3. Merkmale
1.3.2. Merkmale und Skalen
Bei der Untersuchung der einzelnen Einheiten einer statistischen Untersuchung
interessiert man sich meist nur für einzelne Eigenschaften, für bestimmte Merkmale.
Definition 1.4 (Merkmal, Merkmalsträger, Merkmalsausprägung). Eine bei einer
statistischen Untersuchung interessierende Eigenschaft einer statistischen Einheit
heißt Merkmal. Die statistische Einheiten heißen auch Merkmalsträger. Die
möglichen Werte, die ein Merkmal annehmen kann, heißen Merkmalsausprägungen. Eine bei einer statistischen Untersuchung an einer bestimmten statistischen Einheit festgestellte Merkmalsausprägung heißt Merkmalswert, Beobachtung oder Beobachtungswert.
Beispiel 1.19. Bei der Statistik über die Bevölkerung, bei der die einzelnen Personen befragt werden, werden verschiedene Eigenschaften abgefragt.
• Merkmal: Geschlecht; Merkmalsausprägungen: männlich, weiblich
• Merkmal: Familienstand; Merkmalsausprägungen: ledig, verheiratet, geschieden, getrennt lebend, verwitwet.
• Merkmal: Anzahl der Kinder; Merkmalsausprägungen: eine ganze Zahl, größer oder gleich 0.
• Merkmal: Einkommen; Merkmalsausprägungen: eine reelle Zahl
Es werden jetzt die verschiedenen Merkmale genauer untersucht und betrachtet.
Dabei wird insbesondere beleuchtet, welche Merkmalsausprägungen vorkommen
können.
Nominalskala
Es gibt Merkmale, bei denen nur festgestellt werden kann, ob ein Merkmalsträger
eine bestimmte Eigenschaft hat oder nicht, beziehungsweise welche von mehreren
Eigenschaften ein Merkmalsträger hat. Ein Ordnung der Daten ging nicht angegeben werden.
Definition 1.5 (Nominalskala, dichotomes Merkmal). Eine Skala, deren Skalenwerte nur nach dem Kriterium gleich oder verschieden geordnet werden können,
heißt Nominalskala. Ein Merkmal, dessen Werte nur auf einer Nominalskala gemessen werden können, heißt nominal messbar, das Merkmal heißt auch
qualitatives Merkmal.
20
Version 5.1 - 013
Kapitel 1. Grundlagen
Besitzt ein Merkmal nur zwei verschiedene Merkmalsausprägungen, dann ist es ein
dichotomes Merkmal.
In der Tabelle 1.2 sind weitere Beispiele von derartiger Merkmalen angegeben
Merkmal
Geschlecht
Familienstand
Qualität
Merkmalsausprägungen
männlich, weiblich
ledig, verheiratet, verwitwet,
getrennt lebend, geschieden
okay, nicht okay
Tabelle 1.2.: Beispiel nominal messbarer Merkamle
Für diese Merkmalsausprägungen kann jeweils nur angegeben werden, ob eine
Eigenschaft zutrifft oder nicht. Die Merkmale Geschlecht und Qualität sind dichotome Merkmale.
Es gibt keine natürliche Ordnung bei den Ausprägungen. Weitere Beispiele hierfür
sind unter anderem: Religion, Beruf, Studiengang, Abstammung1 .
Ordinalskala
Vielfach können die Ausprägungen eines Merkmales in eine natürliche Reihenfolge
gebracht werden, in eine Ordnung. Ein Beispiel hierfür sind Klausurnoten, die
geordnet werden können. Die Note „sehr gut“ ist besser als „gut“, „gut“ ist besser
als „befriedigend“, „befriedigend“ ist besser als „ausreichend“ und „ausreichend“
ist besser als „mangelhaft“.
Definition 1.6 (Ordinalskala). Eine Skala, deren Skalenwerte in einer natürlichen Reihenfolge geordnet werden können, heißt Ordinalskala oder Rangskala.
Ein Merkmal, dessen Werte auf einer Rang- oder Ordinalskala gemessen werden
können, heißt ordinal messbar, das Merkmal heißt auch intensitätsmäßiges
Merkmal.
1
Bei der US-amerikanischen Volkszählung im Jahre 2000 wurde bei der Frage nach der
Abstammung keine Vorgaben gegeben. In das Feld konnte jeder Befragte selber eintragen, was er oder sie wollte. Es wurden somit keinerlei Vorgaben gemacht, die eventuell die Befragten manipuliert hätten. Dies ist ein Beispiel für die Möglichkeit, eine Antwort der befragten Person nicht bereits durch vorgegebene Antworten zu leiten! Quelle:
http://www.census.gov/prod/2004pubs/c2kbr-35.pdf
Version 5.1 - 013
21
1.3. Merkmale
Note 1 2 3 4
Anzahl 2 10 11 3
5
3
Tabelle 1.3.: Beispiel: ordinal messbares Merkmal - Noten bei einer Klausur
In der Tabelle 1.3 sind die Noten tabellarisch dargestellt, wobei die ausgeschriebene
Note in der Kurzform, der Zahl, die wir hinter der Note sehen, steht.
Bei einem ordinal messbaren Merkmal werden in der Regel die Elemente in der
natürlichen Ordnung angegeben. In der Grafik 1.1 über die Noten bei einer Klausur werden die Daten in der Reihenfolge von der besten zur schlechtesten Note
dargestellt.
Anzahl
12
11
10
9
8
7
6
5
4
3
2
1
1
2
3
4
5
Note
Abbildung 1.1.: Beispiel: ordinal messbares Merkmal - Noten bei einer Klausur
In der Tabelle 1.4 sind einige Beispiele für ordinal messbare Merkmale aufgeführt.
Merkmal
Zensur
Güteklasse
Merkmalsausprägungen
sehr gut, gut, befriedigend, ausreichend, mangelhaft
A, B, C, D
Tabelle 1.4.: Beispiel: ordinal messbare Merkmale
22
Version 5.1 - 013
Kapitel 1. Grundlagen
Die Reihenfolge gibt hierbei keine Auskunft über den absoluten Wert der Ausprägung. Es ist nur eine Reihenfolge ausgedrückt.
Kardinalskala
Bei den Noten kann nur gesagt werden, dass die Leistung mit „gut“ besser ist
als die Leistung mit „befriedigend“. Es kann jedoch nicht gesagt, dass die Leistung
doppelt so gut ist. In vielen Fällen sind die Merkmalsausprägungen nicht nur anordenbar, mit den Werten kann auch gerechnet werden. Den Merkmalsausprägungen
sind reelle Zahlen zugeordnet.
Definition 1.7 (Kardinalskala, Intervallskala, Verhältnisskala, Absolutskala). Eine Skala, deren Skalenwerte reelle Zahlen sind, heißt Kardinalskala oder metrische Skala . Ein Merkmal, dessen Werte auf einer Kardinalskala oder metrischen
Skala gemessen werden können, heißt kardinal messbar oder metrisch messbar, das Merkmal heißt quantitatives Merkmal.
Eine metrische Skala, die keinen natürlicher Nullpunkt und keine natürliche Einheit besitzt, heißt Intervallskala.
Eine metrische Skala, die einen natürlicher Nullpunkt, aber keine natürliche Einheit besitzt, heißt Verhältnisskala.
Eine metrische Skala mit einem natürlicher Nullpunkt und einer natürlichen Skala
heißt Absolutskala.
Bei einer Intervallskala können Abstände (Intervalle) verglichen werden.
Beispiel 1.20 (Intervallskala). Eine Temperatur von 10 Grad Celcius ist 5 Grad
höher als eine Temperatur von 5 Grad Celsius. Die Erhöhung ist genauso groß,
wie der Abstand zwischen -10 Grad Celcius und -15 Grad Celsius.
Bei einer Verhätnisskala können Verhältnisse zwischen Werten verglichen werden.
Beispiel 1.21 (Verhältnisskala). Eine Temperatur von 290 Grad Kelvin ist um
3,6 % höher als eine Temperatur von 280 Grad Kelvin.
Beispiel 1.22 (Absolutskala). Anzahl der Packstücke in einer Kiste.
Version 5.1 - 013
23
1.3. Merkmale
Merkmal
Körpergröße
Anzahl Kinder
Füllmenge der Flasche
Entfernung
Größe eines Grundstückes
Temperatur
Längengrad
Merkmalsausprägungen
x cm
0, 1, 2, 3, ...
x,xx l
x,xx km
x,xx ar
x Celcius
Skala
Verhältnisskala
Absolutskala
Verhältnisskala
Verhältnisskala
Verhältnisskala
Intervallskala
Intervallskala
Tabelle 1.5.: Beispiel: kardinal messbare Merkmale
In der Tabelle 1.5 sind einige Beispiele von kardinal messbaren Merkmalen aufgeführt.
Hier lassen sich noch viele weitere Beispiele finden. Bei diesen Beispielen kann
es noch Unterschiede geben, je nachdem ob ein natürlicher Nullpunkt und eine
natürliche Einheit existiert.
• Für den Längengrad gibt es keinen natürlichen Nullpunkt und auch keine
natürliche Einheit, aber Abstände können miteinander verglichen werden.
• Entfernungen haben einen natürlichen Nullpunkt, die Länge 0. Es existiert
jedoch keine natürliche Einheit. Es gibt viele Einheiten. Man kann die Entfernung in km, in m, in cm, in Meilen, . . . angeben. Beim Vergleich zweier
Werte bleibt stets das Verhältnis gleich, egal, in welcher Einheit gemessen
wird.
• Bei einer Stückzahl (z.B. bei einer Stückliste), existiert ein natürlicher Nullpunkt und eine natürliche Einheit.
Skalentransformation
Bei der Erfassung und Aufbereitung statistischer Daten werden die Werte einer
Skala manchmal in Werte einer anderen Skala transformiert. Ein bekanntes Beispiele hierfür ist die Transformation von Temperaturen zwischen Grad Celsius,
Grad Fahrenheit und Grad Kelvin. Mit der Transformation können Berechnungen
vereinfacht werden.
Definition 1.8 (Skalentransformation). Die Übertragung von Skalenwerte in die
Werte einer anderen Skala, wobei die Ordnungseigenschaften der Skala erhalten
bleiben heißt eine Skalentransformation
24
Version 5.1 - 013
Kapitel 1. Grundlagen
Beispiel 1.23 (Skalentransformation Nominalskala). Die Werte „männlich“ und
„weiblich“ des Merkmals Geschlecht bei einer Nominalskale, kann transformiert
werden in die Werte „0“ und „1“. Dies ist eine Verschlüsselung der Daten, die
einer Skalentransformation entspricht.
Beispiel 1.24 (Skalentransformation Ordinalskala). Die Schulnoten „sehr gut“,
„gut“, . . ., „mangelhaft“ in die Noten 1, 2, . . . , 5 ist eine Skalentransformation , da
die Ordnungseigenschaft erhalten bleibt.
Für eine Kardinalskala beziehungsweise metrische Skala ist nur eine lineare Transformation zulässig. Sind xi die Werte einer Kardinalskala, dann können diese nur
mit Hilfe einer Gleichung der Form yi = dxi + e in die Werte yi einer anderen
Skala übertragen werden, wobei d > 0 gilt. Bei einer Verhältnisskale ist dabei
e = 0, bei einer Absolutskala, ist d = 1 und e = 0.
Beispiel 1.25 (Skalentransformation Kardinalskala). Die Transformation der
Temperatur von Grad Fahrenheit in Grad Celsius erfolgt mittels der linearen Transformation C = 59 F − 160
9
Beispiel 1.26 (Skalentransformation Kardinalskala). Bei der Untersuchung des
Gewichtes von Packungen mit Mehl mit dem Soll-Gewicht von 1kg interessiert man
sich nur für die Abweichung vom diesem Soll. Statt dem Merkmal X (Gewicht
der Packung) interessiert man sich für das Merkmal Y (Abweichung vom SollGewicht). Es wird hierbei die lineare Transformation Y = X − 1kg angewendet.
Diskrete und stetige Merkmale
Die Anzahl der unterschiedlichen Merkmalsausprägungen eines quantitativen
Merkmals kann sehr hoch sein. Bei der Körpergröße kann jede positive reelle Zahl
eine Merkmalsausprägung sein. Bei der Anzahl der Packstücke in einer Kiste jedoch nur die natürlichen Zahlen, inklusive der Null. Dies führt zur nachfolgenden
Definition.
Definition 1.9 (diskrete und stetige Merkmale). Ein quantitatives Merkmal heißt
diskretes Merkmal , wenn es nur endlich viele oder abzählbar unendliche viele
Merkmalsausprägungen besitzt.
Ein quantitatives Merkmal heißt stetiges Merkmal , wenn es überabzählbar viele
Merkmalsausprägungen hat.
Da bei stetigen Merkmalen die Anzahl der Merkmalsausprägungen überabzählbar
ist, führt dies zu einen Einteilung der Merkmalsausprägungen in Klassen, einer
Klassierung, die im nachfolgenden Abschnitt 1.3.3 genauer erläutert wird.
Version 5.1 - 013
25
1.3. Merkmale
1.3.3. Klassierung
Bei Merkmalen, wie beispielsweise der Körpergröße oder dem Einkommen ist die
Darstellung jeder einzelnen Merkmalsausprägung nicht sinnvoll oder nicht machbar. Es gibt zu viele Ausprägungen oder die Darstellung ist zu unübersichtlich.
Daher werden benachbarte Merkmalsausprägungen zu Klassen zusammen gefasst.
Eine Klasse Kj wird dabei durch zwei Werte charakterisiert. Die untere Klassengrenze x∗j−1 und die obere Klassengrenze. Hierbei ist eindeutig festzulegen,
welche der Klassengrenzen zur Klasse gehört, welche nicht. Es zählt entweder die
untere Klassengrenze zur Klasse „von x∗j−1 bis unter x∗j “ oder die obere Klassengrenze „über x∗j−1 bis x∗j “ zur Klasse.
Die Klassenbreite ist einfach die Differenz der Klassengrenzen x∗j − x∗j−1 . Idealerweise ist die Klassenbreite bei allen Klassen gleich breit. Dies ist jedoch nicht
immer sinnvoll. Die Anzahl der Klassen sollte dabei nicht zu klein, aber auch nicht
zu groß sein. Dies hängt jeweils von der Thematik ab. Wenn beispielsweise das Lebensalter betrachtet wird, dann wird das Alter in Jahren betrachtet und es wird
der untere Wert betrachtet. Für statistische Untersuchungen wird in der Regel die
Klassenmitte (x∗j + x∗j−1 )/2 herangezogen, jedoch nicht immer. Dies basiert auf der
Annahme, dass die Daten in der Klasse gleichmäßig verteilt sind.
Die Randklassen, also die erste Klasse, mit den niedersten Werten, und die letzte
Klasse, mit den höchsten Werten, sind problematisch. Gibt es eine untere beziehungsweise obere Grenze oder bleiben die Grenzen offen. Bei offenen Grenzen, wie
ist dann der Repräsentant der Klasse zu bestimmen?
Beispiel 1.27 (Körpergröße). Mit den Daten aus dem Basisdatensatz (Tabelle
A.1) ergibt sich mit der Klasseneinteilung mit einer Klassenbreite von 5 cm die
Verteilung (siehe Tabelle 1.6)
Beispiel 1.28 (Haushaltseinkommen). Bei der Betrachtung des monatliches Nettoeinkommens durch das Statistische Bundesamt werden folgende Klassen gebildet:
• unter 1.300 e
• von 1.300 e bis unter 2.600 e
• von 2.600 e bis unter 3.600 e
• von 3.600 e bis unter 5.000 e
• von 5.000 e bis unter 18.000 e
26
Version 5.1 - 013
Kapitel 1. Grundlagen
von . . . bis unter . . .
150 - 155
155 - 160
160 - 165
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
190 - 195
Anzahl
1
0
2
5
6
7
3
4
1
Tabelle 1.6.: Klassen bei Körpergröße
1.4. Aufgaben
Aufgabe 1.1 (Durchschnittsalter). Führen Sie die Phasen Planung und Datenerhebung für die Bestimmung des Durchschnittsalters der in einem Raum anwesenden Personen durch?
Aufgabe 1.2 (Körpergrößen). Führen Sie die Phasen Planung und Datenerhebung für die Bestimmung der durchschnittliche Körpergröße in cm der in einem
Raum anwesenden Personen durch.
Aufgabe 1.3. Finden Sie weitere Beispiele für statistische Massen, statistische
Einheiten und Daten, die erhoben werden.
Aufgabe 1.4. Finden Sie weitere Beispiele für Bestandsmassen und Ereignismassen.
Aufgabe 1.5. Geben Sie zu den folgenden Merkmalen mögliche Merkmalsausprägungen an:
Haarfarbe,
Einkommen,
Note einer Klausur,
Gewicht,
Studiengang und Herkunftsland.
Aufgabe 1.6. Finden Sie weitere Merkmale für statistische Einheiten und dazugehörige Merkmalsausprägungen.
Aufgabe 1.7. Finden Sie weitere nominal messbare Merkmale
Version 5.1 - 013
27
1.4. Aufgaben
Aufgabe 1.8. Finden Sie weitere ordinal messbare Merkmale.
Aufgabe 1.9. Finden Sie weitere metrisch messbare Merkmale, sowohl mit Intervallskala, Verhältnisskala und Absolutskala.
28
Version 5.1 - 013
Kapitel 2.
Univariate Daten
In diesem Teil wird die beschreibende Statistik für ein Merkmal erläutert. Es
werden verschiedene Darstellungen gezeigt und wichtige Parameter der beschreibenden Statistik, Lageparameter oder Mittelwerte und Streuungsparameter eingeführt.
2.1. Darstellung univariater Daten
2.1.1. statistische Reihe
Die Daten von Beobachtungen bei einer statistischen Erhebung bilden zuerst eine
Reihe von Daten, einen Datenstrom. Dies ist der Ausgangspunkt für die Untersuchung und Auswertung. Dies kann am Basisdatensatz (siehe Tabelle A.1) gesehen
werden.
Definition 2.1. Werden die Werte der Beobachtungen, die für eine statistische
Untersuchung erhoben sind, nacheinander aufgeschrieben, so erhält man eine statistische Reihe. Werden die Daten geordnet, so heißt sie eine geordnete Reihe
, ansonsten heißt sie ungeordnete Reihe.
Eine statistische Reihe von Beobachtungen zu einem bestimmten Phänomen, die
für aufeinander folgende Zeitpunkte oder Zeitintervalle erhoben werden, heißt
Zeitreihe.
Beispiel 2.1. Aus dem Basisdatendatensatz (siehe Tabelle A.1) ergibt sich für das
Alter der Befragten Personen die ungeordnete Reihe
19, 20, 20, 20, 20, 21, 21, 23, 25, 20, 20, 22, 23, 20, 20, 20, 21, 20, 23, 21, 20,
21, 19, 19, 21, 22, 18, 25, 54 .
Daraus ergibt sich die geordnete Reihe
Version 5.1 - 013
29
2.1. Darstellung univariater Daten
18, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21,
22, 22, 23, 23, 23, 25, 25, 54
der Beobachtungen.
Es sei X ein Merkmal, das untersucht werden soll. Im obigen Beispiel ist das
Merkmal X das Alter. Wenn n Beobachtungen zu diesem Merkmal erfasst werden,
so werden die Beobachtungen mit x1 , x2 , . . . , xn bezeichnet, oder kurz mit xi , (i =
1, . . . , n).
2.1.2. Häufigkeitstabellen
Beobachtungen mit der selben Merkmalsausprägung können zusammen gefasst
werden.
Definition 2.2. Es sei X ein Merkmal mit den Merkmalsausprägungen xj (j =
1, . . . , m). Die Anzahl der Beobachtungen mit der Merkmalsausprägung xj heißt
absolute Häufigkeit der Merkmalsausprägung und wird mit h(xj ) bezeichnet.
Der relative (prozentuale) Anteil der absoluten Häufigkeit h(xj ) einer Merkmalsausprägung xj an der Gesamtanzahl n der Beobachtungen heißt relative Häufigkeit f (xj ). Es gilt f (xj ) = h(xj )/n.
Die absolute Häufigkeit h(xj ) für j = 1, . . . , m jeder Merkmalsausprägung xj kann
in Beziehung zu der Gesamtanzahl n der Beobachtungen gesetzt werden. Die GeP
samtanzahl n der Beobachtungen ergibt sich durch n = m
j=1 h(xj ).
Für die absoluten und relativen Häufigkeiten gelten (bei n Beobachtungen) die
Eigenschaften, die in der Tabelle 2.1 aufgeführt sind.
absolute Häufigkeiten
∀j = 1, . . . , m : h(xj ) ≥ 0
Pm
j=1 h(xj ) = n
relative Häufigkeiten
∀j = 1, . . . , m : f (xj ) ≥ 0
Pm
j=1 f (xj ) = 1
Tabelle 2.1.: Eigenschaften absolute und relative Häufigkeiten
Definition 2.3. Die geordnete Merkmalsausprägungen und die zugehörigen (absoluten und relativen) Häufigkeiten ergeben die Verteilung oder Häufigkeitsverteilung des betreffenden Merkmales.
Die Häufigkeitsverteilung werden oftmals in tabellarischer Form erstellt.
30
Version 5.1 - 013
Kapitel 2. Univariate Daten
Beispiel 2.2. Die obige Verteilung des Alters aus der Befragung von 29 Personen
kann auch folgendermaßen, in tabellarischer Form (siehe Tabelle 2.2) dargestellt
werden.
xj
18
19
20
21
22
23
24
25
h(xj )
1
3
11
6
2
3
0
2
f (xj ) 3,4% 10,3% 37,9% 20,7% 6,9% 10,3% 6,9% 0,0%
54
1
3,4%
Tabelle 2.2.: Beispiel: Häufigkeitsverteilung Alter
Beispiel 2.3. Für 120 Personen ergibt sich folgende Häufigkeitsverteilung für das
Merkmal Familienstand, siehe Tabelle 2.3.
Familienstand
ledig
absolute Häufigkeit 12
relative Häufigkeit 60%
verheiratet
5
25%
geschieden
3
15%
Tabelle 2.3.: Beispiel: Tabelle Familienstand
2.1.3. Grafische Darstellungen
Neben der Darstellung von Daten mit Hilfe von Tabellen gibt es auch viele Möglichkeiten, die Daten grafisch darzustellen. Hierzu gibt es verschiedene Arten von Diagrammen: Balkendiagramm, Liniendiagramm, Flächendiagramm, Kreisdiagramm
und noch weitere Varianten. Mit Hilfe eines Tabellenkalkulationsprogramms, aber
auch mit Hilfe von Präsentationsprogrammen, kann man derartige Diagramme
leicht und automatisiert erhalten.
Beispiel 2.4 (nominal messbares Merkmal - Geschlecht). Das Geschlecht der Personen aus dem Basisdatensatz (siehe A.1) ist ein nominal messbares Merkmal. Es
gibt keine Ordnung der Daten. Diese Daten werden oftmals in einem Kreisdiagramm dargestellt. In der Grafik 2.1 sind die Daten aus dem Basisdatensatz für
das Merkmal Geschlecht als Kreisdiagramm grafisch dargestellt.
Beispiel 2.5 (ordinal messbares Merkmal - Alter). Die Verteilung des Merkmals
Alter aus dem Basisdatensatz (siehe Tabelle A.1) kann mittels eines Balkendiagramms (siehe Abbildung 2.2) dargestellt werden.
Version 5.1 - 013
31
2.1. Darstellung univariater Daten
m
w
Abbildung 2.1.: Beispiel: nominal messbares Merkmal - Kreisdiagramm
Anzahl
12
11
10
9
8
7
6
5
4
3
2
1
18
19
20
21
22
23
24
25
...
54
Alter
Abbildung 2.2.: Beispiel: ordinal messbares Merkmal - Alter
32
Version 5.1 - 013
Kapitel 2. Univariate Daten
Note
absolute Häufigkeit
1 2 3
2 10 11
4 5
3 3
Tabelle 2.4.: Beispiel: Notenverteilung - tabellarische Darstellung
Beispiel 2.6. Für die Statistik über das Ergebnis einer Klausur (siehe A.1)
sind die Noten der einzelnen Klausuren das entscheidende Merkmal. Die erzielten Punkte sind ein anderes Merkmal, jedoch für diesen Fall jetzt nicht relevant.
Es haben insgesamt 28 Personen an der Klausur teilgenommen, die einzelnen Ergebnisse sind (sortiert nach der Note): 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3;
3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 5; 5 und 5. Diese können in einer Häufigkeitsverteilung
tabellarisch dargestellt werden (siehe Tabelle 2.4) oder auch grafisch dargestellt
werden (siehe Abbildung 2.3).
Anzahl
12
11
10
9
8
7
6
5
4
3
2
1
1
2
3
4
5
Note
Abbildung 2.3.: Beispiel: Notenverteilung - grafische Darstellung
Anhand der Tabelle oder auch der Grafik kann man sehen, dass 2 Personen eine 1
geschrieben haben, während leider 4 Personen die Klausur nicht bestanden haben.
Die Breite die Balken kann frei gewählt werden, es ist nur eine Frage der Anschaulichkeit.
In der Häufigkeitsverteilung sind oftmals nicht alle möglichen Merkmalsausprägungen enthalten, sondern nur die tatsächlich vorkommenden. Die tabellarische
Version 5.1 - 013
33
2.1. Darstellung univariater Daten
Darstellung einer Häufigkeitsverteilung erfolgt in einer so genannten Häufigkeitstabelle. Dies kann horizontal oder vertikal aufgebaut werden. Im nachfolgenden
ist ein vertikales und horizontales Beispiel aufgeführt.
Es sei X ein Merkmal mit den Merkmalsausprägungen xj (j = 1, . . . , m). Die
absoluten Häufigkeiten sei gegeben durch h(xj ). Die relative Häufigkeiten sind
f (xj ). Die Häufigkeitsverteilung kann horizontal (siehe Tabelle 2.5) oder vertikal
(siehe Tabelle 2.6) dargestellt werden.
x1
x2
Merkmalsausprägung
absolute Häufigkeit
h(x1 ) h(x2 )
relative Häufigkeit
f (x1 ) f (x2 )
...
...
...
xj
h(xj )
f (xj )
...
...
...
xm
h(xm )
f (xm )
Tabelle 2.5.: Häufigkeitstabelle - horizontal
Merkmalsausprägung absolute Häufigkeit relative Häufigkeit
x1
h(x1 )
f (x1 )
h(x2 )
f (x2 )
x2
..
..
..
.
.
.
xj
h(xj )
f (xj )
..
..
..
.
.
.
h(xm )
f (xm )
xm
Tabelle 2.6.: Häufigkeitstabelle - vertikal
Für die grafische Darstellung einer Häufigkeitsverteilung gibt es verschiedene Möglichkeiten. Bei einer Nominalskala gibt es keine natürliche Ordnung der Merkmalsausprägungen. Für die Darstellung wählt man meistens Kreis- oder Flächendiagramme.
Bei einer Ordinalskala kann man die Häufigkeitsverteilung grafisch als Linienoder als Balkendiagramm darstellen. Hierbei werden meistens auf der waagrechten
Achse die geordneten Merkmalsausprägungen abgetragen.
Bei einer Kardinalskala muss zwischen diskreten und stetigen Merkmalen unterschieden werden. Häufigkeitstabelle und grafische Darstellung der Häufigkeitsverteilung eines diskreten Merkmales können in gleicher Weise erfolgen wie bei einem
ordinal messbaren Merkmal.
Bei einem stetigen Merkmal werden Klassen gebildet. Absolute und relative Häufigkeiten sind dann Häufigkeiten einer Klasse. Sie werden meist als rechteckige
34
Version 5.1 - 013
Kapitel 2. Univariate Daten
150 155 160
cm
154 159 164
Anzahl 1
0
2
165 170 175
169 174 179
5
7
6
180 185 190 195
184 189 194 199
3
4
0
1
Tabelle 2.7.: Beispiel: Körpergröße gruppiert
Flächen über den Klassen der Merkmalsausprägungen grafisch dargestellt. Dabei
wird unterstellt, dass die zu einer Klasse gehörigen Beobachtungen gleichmäßig
über die Klasse verteilt sind.
Im Basisdatensatz sind auch Daten für die Körpergröße hinterlegt. Eine grafische
Darstellung der Daten mit den einzelnen Körpergröße ist nicht aussagekräftig. Die
Daten können jedoch gruppiert werden. Hier wird die Variante gewählt, dass die
breite der Gruppen jeweils gleich groß sind - jeweils 5 cm. Die erste Gruppe ist im
Größenbereich 150cm - 154cm. Die weiteren Gruppen sind 155cm - 159cm, 160cm
- 164cm, . . . , 194cm - 199cm. Die Daten werden jetzt auf diese Gruppen aufgeteilt.
Dies ist in der Tabelle 2.7 dargestellt.
Jetzt können die Daten wieder grafisch dargestellt werden, mit Balken der gleichen
Breite.
2.1.4. Summen- und Resthäufigkeit
Für viele Fragestellungen ist die Summen der Beobachtungen bis zu einem bestimmten Wert gesucht. Beispielsweise bei der Untersuchung des bereits geleisteten Aufwands für ein Projekt interessiert in erster Linie die Summe der bisher
geleisteten Stunden.
Definition 2.4. Die einer Merkmalsausprägung eines ordinal oder metrisch messbaren Merkmales zugeordnete Häufigkeit aller Beobachtungen, die diese Merkmalsausprägungen nicht überschreiten, heißt Summenhäufigkeit. Für die absolute
Summenhäufigkeit gilt:
H(xj ) =
X
h(xk )
(2.1)
f (xk )
(2.2)
xk ≤xj
Für die relative Summenhäufigkeit gilt:
F (xj ) =
X
xk ≤xj
Version 5.1 - 013
35
2.1. Darstellung univariater Daten
Sind die Merkmalsausprägungen geordnet x1 < x2 < . . . < xm , dann gilt
H(xj ) =
j
X
h(xk ) und
F (xj ) =
k=1
j
X
f (xk )
(2.3)
k=1
Beispiel 2.7. Für die Verteilung des Alters aus dem Basisdatensatz (siehe Tabelle A.1) sind die absolute und relative Häufigkeitsverteilung in der Tabelle 2.8 zu
finden. Eine entsprechende grafische Darstellung ist in 2.4 dargestellt.
xj
h(xj )
H(xj )
f (xj )
F (xj )
18
1
1
3,4%
3,4%
19
3
4
10,3%
13,8%
20
11
15
37,9%
51,7%
21
6
21
20,7%
72,4%
22
2
23
6,9%
79,3%
23
3
26
10,3%
89,7%
25
2
28
6,9%
96,6%
54
1
29
3,4%
100%
Tabelle 2.8.: Beispiel: Summen- und Resthhäufigkeit Alter
Anzahl
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
18
19
20
21
22
23
24
25
...
54
Alter
Abbildung 2.4.: Beispiel: Summenhäufigkeit - Alter
Definition 2.5. Die einer Merkmalsausprägung eines ordinal oder metrisch messbaren Merkmales zugeordnete Häufigkeit aller Beobachtungen, die diese Merkmalsausprägungen überschreiten, heißt Restsummenhäufigkeit.
36
Version 5.1 - 013
Kapitel 2. Univariate Daten
Es sei n die Gesamtzahl der Beobachtungspunkte. Für die absolute Restsummenhäufigkeit gilt:
HR(xj ) =
X
h(xk ) = n − H(xj )
(2.4)
xk >xj
Für die relative Restsummenhäufigkeit gilt:
F R(xj ) =
X
f (xk ) = 1 − F (xj )
(2.5)
xk >xj
2.2. Mittelwerte
Eine erste wichtige Kenngröße für eine statistische Masse sind Lageparameter und
Mittelwerte. Es gibt dabei verschiedenen Möglichkeiten der Definition, was unter
einem Mittelwert zu verstehen ist.
2.2.1. Modus
Die erste Art von Mittelwert ist der häufigste Wert. Dies ist für alle Merkmale
auch für nominal messbare Merkmale möglich.
Definition 2.6 (Modus). Die Merkmalsausprägung, die am häufigsten vorkommt,
wird häufigster Wert, dichtester Wert, Modalwert oder Modus genannt
und wird mit xD bezeichnet. Es gilt h(xD ) = maxj (h(xj )).
Gibt es mehrere Ausprägungen mit der größten Häufigkeit, dann gibt es entsprechend viele häufigste Werte, und es gilt:
xD ∈ {xk | h(xk ) = max(h(xj ))}
j
(2.6)
Beispiel 2.8. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist der Modalwert,
der häufigste Wert 20.
Beispiel 2.9. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist der Modalwert, der häufigste Wert die Note 3.
Beispiel 2.10. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist der Modalwert, der häufigste Wert die Gruppe mit der Größe 170cm − 174cm.
Version 5.1 - 013
37
2.2. Mittelwerte
2.2.2. Median
Für nominal messbare Merkmale ist der häufigste Wert der einzig sinnvolle Mittelwert. Für andere Merkmale können neben dem Modalwert noch weitere Mittelwerte bestimmt werden.
Definition 2.7. Jede Merkmalsausprägung eines wenigstens ordinal messbaren
Merkmales, welches die geordnete Reihe der Beobachtungen in zwei gleich große
Teile zerlegt, heißt Zentralwert oder Median und wird mit xZ bezeichnet. Es
gilt xZ = xk mit F (xk−1 ) < 0, 5 und F (xk ) ≥ 0, 5.
Gibt es n Beobachtungspunkte und ist n eine ungerade Zahl, dann gibt es genau
und es gilt xZ = x n+1 .
einen mittleren Wert. Dieser hat die Ordnungsnummer n+1
2
2
Bei einer geraden Anzahl von Beobachtungen gilt xZ = x n2
Beispiel 2.11. Beim Beispiel des Alters (siehe Tabelle 2.2) ist der Median, der
Zentralwert 20, also gleich dem Modus.
Beispiel 2.12. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist der Median
die Note 3, also ungleich dem Median.
Beispiel 2.13. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist der Median
die Gruppe mit der Größe 170cm − 174cm, auch wieder gleich dem Median.
2.2.3. p-Quantil
Neben der Zerlegung in zwei Teile, können die Beobachtungen auch in mehr Teile
zerlegt werden. Diese macht jedoch erst bei größeren Datenmengen einen Sinn.
Definition 2.8. Quantil Jeder Merkmalswert xp mit 0 < p < 1 einer Verteilung
für den mindestens ein Anteil p der Daten kleiner oder gleich xp und mindestens
ein Anteil 1 − p größer oder gleich xp ist, heißt p-Quantil .
Der Median ist das 50%-Quantil (x0,5 ). Zwei weitere wichtigen Quantilen sind
das untere Quartil x0,25 und das oberes Quartil x0,75 . Bei der Zerlegung einer
Datenmenge in Quartilen werden das untere Quartil, der Median und das obere
Quartil angegeben.
Es gibt auch die Dezile, mit den Quantilen 10%, 20%, . . . 90%. Wichtig (beispielsweise für die Behandlung von Ausreißern) sind die Quantilen bei 5% und 95%.
Beispiel 2.14. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt x0,25 = 20, x0,5 =
20 (der Zentralwert) und x0,75 = 22.
38
Version 5.1 - 013
Kapitel 2. Univariate Daten
Beispiel 2.15. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) gilt x0,25 = 2,
x0,5 = 3 (der Zentralwert) und x0,75 = 3.
Beispiel 2.16. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) gilt x0,25 =
165cm − 169cm, x0,5 = 170cm − 174cm (der Zentralwert) und x0,75 = 180cm −
184cm.
Bei einer Befragung ist es durchaus möglich, dass nicht jede Antwort korrekt ist.
Bewusst oder unwissentlich können Antworten gegeben werden, die Ausreißer sind.
Bei der Abfrage des Alters kann jemand das Alter nicht in Jahren, sondern in Tagen
angeben. Hier kann eine Bereinigung der Daten hilfreich sein. Hierzu können die
Daten bis zum 0,05-Quantil und die Daten ab dem 0,95-Quantil aus der weiteren
Berechnung eliminiert werden. Damit werden potenziellen Ausreißer entfernt.
2.2.4. arithmetisches Mittel
Das arithmetische Mittel x ist der am häufigsten verwendete Mittelwert und der
Wert, der landläufig mit dem Durchschnitt bezeichnet wird. Die Ermittlung des
arithmetischen Mittelwertes ist nur sinnvoll für Merkmale, die auf einer metrischen
Skala gemessen werden können.
Definition 2.9. arithmetisches Mittel Gegeben sei ein Merkmal X. Für die n
Beobachtungen xi mit i = 1, . . . , n, ergibt sich das (einfache) arithmetische
Mittel zu
x =
n
1X
x1 + x2 + · · · + x n
=
xi
n
n i=1
(2.7)
.
Sind für das Merkmal X die Merkmalsausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) gegeben, so errechnet
sich das (gewogene) arithmetische Mittel durch
x =
m
x1 h(x1 ) + x2 h(x2 ) + · · · + xm h(xm )
1X
xj h(xj )
=
h(x1 ) + h(x2 ) + · · · + h(xm )
n j=1
(2.8)
mit n = h(x1 ) + h(x2 ) + · · · + h(xm ), beziehungsweise
x = x1 f (x1 ) + x2 f (x2 ) + · · · + xm f (xm ) =
m
X
xj f (xj )
(2.9)
j=1
Version 5.1 - 013
39
2.2. Mittelwerte
Alle drei Mittelwerte stellen den selben Wert dar. Im ersten Fall werden die Beobachtungen einzeln herangezogen, im zweiten Fall werden gleiche Werte zusammengezogen, im dritten Fall wird bei den zusammen gesetzten Werte die relativen
Häufigkeiten genommen. Die Division durch n, die Anzahl der Beobachtungen,
wird im dritten Fall direkt bei den Beobachtungen durchgeführt, denn es gilt
f (xj ) = h(xj )/n.
Beispiel 2.17. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt
x=
1
(1 · 18 + 3 · 19 + . . . + 1 · 54) = 22
29
(2.10)
Beispiel 2.18. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) gilt
x=
1
(2 · 1 + 12 · 2 + . . . + 4 · 5) = 2, 66
29
(2.11)
Beispiel 2.19. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist zuerst zu
klären, wie eine Berechnung überhaupt durchgeführt werden kann, da das Rechnen
mit Gruppen unhandlich ist. Für jede Gruppe wird ein Repräsentant ausgewählt.
Bei den Körpergrößen kann jeweils die Gruppenmitte ausgewählt werden. Es gilt
dann
x=
1
(1 · 152cm + 2 · 162cm + . . . + 1 · 197cm) = 174, 76cm
29
(2.12)
2.2.5. getrimmter Mittelwert
Das arithmetische Mittel reagiert empfindlich auf Ausreißer und Extremwerte. Der
Median ist gegenüber Ausreißern und Extremwerte sehr robust. Daher kann man
herangehen und einen Teil der Beobachtungswerte, die extremen Werte zu eliminieren, also aus der Berechnung zu entfernen. Mt einem vorgegebenen Werte,
beispielsweise α = 0, 05 werden dann die α% Werte, die am kleinsten beziehungsweise am größten sind aus der Berechnung entfernt.
Definition 2.10 (getrimmter Mittelwert). Gegeben sei ein Merkmal X. Für die
n (sortierten) Beobachtungen xi mit i = 1, . . . , n, ergibt sich das α-getrimmte
Mittel (0 ≤ α ≤ 0, 5) mit r ≈ n · αzu
xgα =
n−r
X
xr+1 + xr+2 + · · · + xn−r
1
=
xi
n − 2r
n − 2r i=r+1
.
(2.13)
Für α = 0 entspricht dies genau dem arithmetischen Mittel (xg0,0 = x). Für
α = 0, 5 entspricht der Mittelwerte dem Median (xg0,5 = xZ ).
40
Version 5.1 - 013
Kapitel 2. Univariate Daten
Beispiel 2.20. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt mit α = 0, 05 und
dann mit der Wahl r = 1 (damit eigentlich α = 0, 035).
xg0,05 =
1
(3 · 19 + . . . + 2 · 25) = 20, 96 .
27
(2.14)
Wird r = 2 (und damit α = 0, 07) gewählt, dann werden nur 25 Werte in die
Berechnung einbezogen. Es ergibt sich dann xg0,05 = 20, 88.
2.2.6. geometrisches Mittel
Hat man es mit zeitlich aufeinander folgenden Zuwächsen, Wachstumsraten oder
ähnlichen (multiplikativen) Steigerungen zu tun, dann ist das arithmetische Mittel
nicht der sachlich richtige Durchschnittswert, sondern das geometrische Mittel.
Beispiel 2.21. Bei einer Sparkasse konnte man bei einer Geldanlage, mit einem
jährlich wachsenden Zins lesen: im 1. Jahr 3% Zins, im 2. Jahr 4% Zins, im 3.
Jahr 5% Zins und im 4. Jahr 6% Zins, durchschnittlicher Zins: 4,5%. Ist das auch
der effektive Zins, das heißt der konstante Zinssatz mit dem am Ende das selbe
finanzielle Ergebnis kommt?
In der folgenden Tabelle 2.9 sind die Wertsteigerung für 3 verschiedene Fälle aufgeführt. Im ersten Fall ist es die Zinsreihe der Sparkasse, mit jährlich steigendem
Zins. Beim Fall 2 ist der Zins jährlich 4,5%, während im Fall 3 der jährliche Zins
4,494% ist.
Jahr
0
1
2
3
4
Fall 1 1000,00 1030,00 1071,20 1124,76 1192,2456
Fall 2 1000,00 1045,00 1092,03 1141,17 1192,5186
Fall 3 1000,00 1044,94 1091,90 1140,97 1192,2447
Tabelle 2.9.: Beispielsrechnung geometrisches Mittel
Definition 2.11 (harmonisches Mittel). Gegeben sei ein Merkmal X. Für die n
Beobachtungspunkte xi (i=1,. . . ,n) ergibt sich das einfache geometrische Mittel zu
v
xG
u n
uY
√
n
n
=
x 1 · x2 · . . . · xn = t
xi
(2.15)
i=1
Version 5.1 - 013
41
2.2. Mittelwerte
Sind für das Merkmal X die Merkmalsausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) gegeben, so errechnet
sich das gewogene geometrische Mittel durch
q
n
xG =
=
h(x2 )
h(x1 )
· x2
x1
v
um
u Y h(xj )
n
t
x
=
j
i=1
h(xm )
· . . . · xm
m
Y
h(xj )/n
xj
=
i=1
(2.16)
m
Y
f (xj )
xj
i=1
mit n = h(x1 ) + h(x2 ) + · · · + h(xm ).
2.2.7. harmonisches Mittel
Beispiel 2.22. Ein PKW legt von einer Strecke 16 mit einer Geschwindigkeit von
100 km
, 31 mit einer Geschwindigkeit von 80 km
und den Rest mit einer Geschwinh
h
zurück.
Mit
welcher
(konstanten)
Geschwindigkeit würde er die
digkeit von 50 km
h
gesamte Strecke in der gleichen Zeit bewältigen? Diese Frage führt zum harmonische Mittel.
Es gilt:
v=
s
s1 + s2 + s3
=
=
t
t1 + t2 + t3
s
s1
v1
+
s2
v2
+
s3
v3
=
1
s1
sv1
+
s2
sv2
+
s3
sv3
(2.17)
Das Einsetzen der konkreten Zahlen aus dem Beispiel ergibt.
v=
1
1
6·100
+
1
3·80
+
1
2·50
=
1
1
600
+
1
240
+
1
100
=
600
= 63, 16
1 + 2, 5 + 6
(2.18)
Definition 2.12. Gegeben sei ein Merkmal X. Für die n Beobachtungspunkte xi
(i=1,. . . ,n) ergibt sich das einfache harmonische Mittel zu
xH =
1
x1
n
+ ··· +
1
xn
n
= Pn
1
i=1 xi
(2.19)
Sind für das Merkmal X die Merkmalsausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) gegeben, so errechnet
sich das gewogene harmonische Mittel durch
xH = Pm
n
h(xj )
j=1 xj
42
= Pm
1
j=1
f (xj )
xj
(2.20)
Version 5.1 - 013
Kapitel 2. Univariate Daten
Für die Durchschnitte von n Beobachtungen gilt allgemein x ≥ xG ≥ xH .
√
Beispiel 2.23. Es seien x1 = 1 und x2 = 2, dann gelten x = 1, 5, xG = 1 · 2 =
2
1, 4142 und xH = 1+1/2
= 34 = 1, 3333.
Es gilt stets x ≥ xG ≥ xH .
2.2.8. Transformationen
Es ergibt sich nun die Frage, wie sich Mittelwerte verhalten, wenn eine Transformation durchgeführt wird.
Satz 2.13. Es seien X ein metrisch messbares Merkmal mit dem arithmetischen
Mittel x. Durch eine lineare Transformation Y = bX + a wird das Merkmal Y
definiert. Dann gilt für das arithmetische Mittel y des Merkmales Y : y = bx + a.
Das bedeutet, dass das arithmetische Mittel die Transformation mitmacht.
y=
n
n
n
1X
1X
1X
yi =
(bxi + a) = b
xi + a = bx + a
n i=1
n i=1
n i=1
(2.21)
Für andere Daten lassen sich ebenso leicht Regeln für die Transformation ermitteln
und angeben.
2.3. Streuungsmaße
Wenn man die rechte Hand in eine Flüssigkeit mit 100 Grad Celsius steckt und die
linke Hand in eine Flüssigkeit mit -40 Grad Celsius, dann ist dies im Mittel sind
dies angenehme 30 Grad Celsius. Trotzdem ist dies alles andere als angenehm.
Ein Mittelwert allein ist nicht ausreichend für die Beschreibung von Daten. Denn
mit dem Mittelwert allein kann noch nicht entschieden werden, ob die Beobachtungen eng oder weit um diesen Mittelwert sind. Daher werden einige weitere
Kennzahlen ermittelt, welche die Streuung der Beobachtungen beschreibt.
Version 5.1 - 013
43
2.3. Streuungsmaße
2.3.1. Spannweite
Die Entfernung zwischen maximalem und minimalem Wert ist eine erste Orientierung.
Definition 2.14. Gegeben seien n Beobachtungen xi (i=1,. . . ,n) eines metrisch
messbaren Merkmales X. Die Differenz zwischen größtem Beobachtungswert und
kleinstem Beobachtungswert heißt Spannweite w der Verteilung des Merkmales.
Beispiel 2.24. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 5; 3, 2; 1, 6; 2, 4; 2, 8. Berechnen Sie für diese Werte die
Spannweite.
w = 3, 2 − 0, 7 = 2, 5
(2.22)
Beispiel 2.25. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist die Spannweite
36, wird der Extremwert 54 entfernt, dann ist die Spannweite nur 7.
Beispiel 2.26. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist die Spannweite 35cm.
2.3.2. Quartilsabstand
Der Abstand zwischen dem 1. Quartil (x0.25 ) und dem 3. Quartil (x0.75 ) ist der
Quartilsabstand. In diesem Bereich sind mindestens 50% der Daten, also die
Großteil der Daten.
Beispiel 2.27. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt x0,25 = 20, x0,5 =
20 (der Zentralwert) und x0,75 = 22. Der Quartilsabstand ist 2, von 20 bis 22. Von
den Daten sind 19 der 29 Daten, also etwa 66% in diesem Bereich.
2.3.3. mittlere absolute Abweichung
Bei der Spannweite werden jedoch von den Beobachtungen nur zwei Werte in die
weitere Untersuchung einbezogen, die anderen Werte bleiben unberücksichtigt. Bei
der mittleren absoluten Abweichung werden alle Beobachtungen in die Berechnung
der Streuung mit einbezogen.
44
Version 5.1 - 013
Kapitel 2. Univariate Daten
Definition 2.15. Gegeben seien n Beobachtungen xi (i=1,. . . ,n) eines metrisch
messbaren Merkmales X und der Zentralwert xZ . Das arithmetische Mittel aus den
absoluten Abweichungen der Beobachtungen xi vom Zentralwert xZ heißt mittlere
absolute Abweichung d.
d =
n
1X
|xi − xZ |
n i=1
(2.23)
Gegeben sei eine Häufigkeitsverteilung eines metrisch messbaren Merkmales X,
dessen Ausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und
den relativen Häufigkeiten f (xj ) auftreten. Das gewogene arithmetische Mittel aus
den absoluten Abweichungen der Merkmalsausprägungen xj vom Zentralwert xZ
heißt mittlere absolute Abweichung d:
d =
m
m
X
1X
|xj − xZ |h(xj ) =
|xj − xZ |f (xj )
n j=1
j=1
(2.24)
Statt die mittlere absolute Abweichung vom Zentralwert zu nehmen, kann auch die
mittlere absolute Abweichung auf andere Mittelwerte bezogen werden, beispielsweise auf das arithmetische Mittel.
Beispiel 2.28. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 5; 3, 2; 1, 6; 2, 4; 2, 7. Berechnen Sie die mittlere absolute Abweichung, sowohl vom Zentralwert, als auch vom arithmetischen Mittel. Es
gilt x = 2, 1 und xZ = 2, 4. Damit gilt in Bezug auf den Zentralwert
d=
1, 7 + 0, 8 + 0, 1 + 0, 8 + 0, 8 + 0, 0 + 0, 3
= 0, 6429
7
(2.25)
und in Bezug auf das arithmetische Mittel
d=
1, 4 + 0, 5 + 0, 4 + 1, 1 + 0, 5 + 0, 3 + 0, 6
= 0, 6857
7
(2.26)
Die auf den Zentralwert bezogene mittlere absolute Abweichung ist kleiner als jede
auf einen anderen Wert bezogene mittlere absolute Abweichung.
Beispiel 2.29. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist die mittlere
absolute Abweichung 2, 34 (mit allen 29 Werten) und 1, 21 ohne den Extremwert.
Beispiel 2.30. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist die mittlere
absolute Abweichung 0, 79.
Beispiel 2.31. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist die mittlere
absolute Abweichung 7, 24cm.
Version 5.1 - 013
45
2.3. Streuungsmaße
2.3.4. mittlere quadratische Abweichung
Bei der mittleren absoluten Abweichung ist jede Abweichung gleich gewichtet.
Kleine Abweichungen sollen weniger bedeutsam sein als große Abweichungen. Wie
kann die Abweichung gewichtet werden, um diesen Wunsch zu berücksichtigen.
Das Gewicht ist der Betrag der Abweichung selbst.
Definition 2.16. Gegeben seien n Beobachtungen xi (i=1,. . . ,n) eines metrisch
messbaren Merkmales X. Das arithmetische Mittel der quadratischen Abweichungen der Beobachtungen xi von ihrem arithmetischen Mittel xM heißt mittlere
quadratische Abweichung oder Varianz s2 des Merkmales X, manchmal auch
mit s2X geschrieben.
s2 =
n
1X
(xi − x)2
n i=1
(2.27)
Gegeben sei eine Häufigkeitsverteilung eines metrisch messbaren Merkmales X,
dessen Ausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und
den relativen Häufigkeiten f (xj ) auftreten. Das gewogene arithmetische Mittel der
quadratischen Abweichungen der Merkmalsausprägungen vom arithmetischen Mittel x heißt Varianz s2 oder s2X :
s2 =
m
m
X
1X
(xj − x)2 h(xj ) =
(xj − x)2 f (xj )
n j=1
j=1
(2.28)
Nach den obigen Formeln kann die Varianz erst berechnet werden, wenn das arithmetische Mittel berechnet ist, da die Differenz zwischen Beobachtungswert und
Mittelwert die Größe ist, die zur Berechnung herangezogen wird. Die Formeln
können jedoch leicht umgeformt werden, so dass die Berechnung einfacher wird.
Es gilt
s2 =
=
n
n
1X
1X
(xi − x)2 =
(x2 − 2xi x + x2 )
n i=1
n i=1 i
(2.29)
n
n
n
1X
1X
1X
x2i − 2x
xi + x 2 =
x 2 − x2
n i=1
n i=1
n i=1 i
Wenn die Beobachtungen sequentiell kommen (zum Beispiel Messwerte einer elektronischen Einheit oder Daten aus einer Datei), so können die Daten sequentiell
verarbeitet werden. Man summiert die Werte, um den Mittelwert zu erhalten und
46
Version 5.1 - 013
Kapitel 2. Univariate Daten
man summiert die Quadrate der Beobachtungen, um daraus dann die Standardabweichung zu ermitteln. Für Häufigkeitsverteilungen gelten analoge Umformungen:
s2 =
m
m
X
1X
x2j h(xj ) − x2 =
x2j f (xj ) − x2
n j=1
j=1
(2.30)
Definition 2.17. Die positive Quadratwurzel aus der Varianz heißt Standardabweichung.
Wenn man mit Einheiten arbeitet, dann sieht man, dass die Standardabweichung
die selbe Einheit hat wie die Merkmale selbst. Die Varianz hat das Quadrat der
Einheit der Merkmale. Für Vergleichszwecke ist die Varianz nicht aussagekräftig
genug. Bei einem Wert von 1 ist eine Varianz von 10 groß, bei einem Wert von
1000 jedoch klein.
Definition 2.18. Für ein metrisch messbares Merkmal X mit dem arithmetischen
Mittel x und der Standardabweichung s, heißt der Quotient aus s und x der Variationskoeffizient v, v = xs .
Beispiel 2.32. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 5; 3, 2; 1, 6; 2, 4; 2, 7. Berechnen Sie die mittlere quadratische Abweichung (Varianz) und die Standardabweichung.
Es ist x = 2, 1. Damit gilt
s2 =
1, 42 + 0, 52 + 0, 42 + 1, 12 + 0, 52 + 0, 32 + 0, 62
= 0, 6114
7
(2.31)
Beispiel 2.33. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist die Varianz
43, 24, die Standardabweichun ist 6, 58[Jahre]. Wird der Extremwert eliminiert,
dann sinkt die Varianz auf 3, 5, die Standardabweichung auf 1, 87[Jahre].
Beispiel 2.34. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist die Varianz
1, 14, die Standardabweichung 1, 07. er
Beispiel 2.35. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist die Varianz
93, 10, die Standardabweichung beträgt 9, 65[cm].
Mittelwert und Standardabweichung sind wichtige Parameter für Kennzeichen statistischer Größen, jedoch nicht die einzigen. Es gibt weitere Kennzeichen, zum
Beispiel die Schiefe, die weitere Aussagen über die Daten machen. Weitere Kennzeichen werden werden hier jedoch nicht weiter vertieft.
Version 5.1 - 013
47
2.4. Aufgaben
2.3.5. Transformation
Eine lineare Transformation Y = bX + a hat die nachfolgende benannten Auswirkungen auf Streuungsmaße.
Satz 2.19. Es seien X und Y metrisch messbare Merkmale, die mittels einer
linearen Transformation Y = bX + a zusammenhängen. Dann gelten:
Spannweite wY = bwX
mittlere absolute Abweichung dY = bdX
Varianz s2Y = b2 s2X
Standardabweichung sY = bsX
2.4. Aufgaben
Aufgabe 2.1. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 4; 3, 2; 1, 6; 2, 4; 2, 8. Berechnen Sie das arithmetische
Mittel, die mittlere absolute Abweichung und die Standardabweichung.
Aufgabe 2.2. Bei einer Untersuchung der Anzahl der Besucher pro Tag einer
Dienststelle ergeben sich bei 120 untersuchten Tagen die folgende absolute Häufigkeitsverteilung:
Besucher
Anzahl der Tage
0
5
1
4
2
3 4
10 12 20
5
6 7
18 18 12
8 9
15 2
10
4
Berechnen Sie das arithmetische Mittel und die Standardabweichung.
Aufgabe 2.3. Ein Auto hat für typische Verkehrssituationen folgenden Benzinverbrauch: Stadtverkehr: 10l/100km, konstant 120 km/h: 9l/100km, konstant 90
km/h: 7l/100km. Ein Fahrer weiß, der er circa 25% seiner jährlichen Gesamtstrecke in der Stadt fährt, circa 50% auf der Autobahn mit 120 km/h und circa 25% auf
der Landstraße mit 90 km/h. Berechnen Sie den voraussichtlichen Durchschnittsverbrauch.
Aufgabe 2.4. Aus der Befragung nach dem Alter der Belegschaft eines Betriebes
mit 30 Angestellten ergibt sich folgendes Ergebnis: 24, 24, 40, 22, 32, 51, 63, 22,
42, 43, 44, 51, 23, 32, 34, 64, 19, 23, 22, 50, 50, 33, 60, 18, 20, 50, 42, 30, 20
und 41. Daraus ergibt sich in nachfolgende Häufigkeitsverteilung mit der Bildung
von Klassen:
48
Version 5.1 - 013
Kapitel 2. Univariate Daten
j
1
2
3
4
5
6
Altersklasse
unter 20
20 bis unter 30
30 bis unter 40
40 bis unter 50
50 bis unter 60
60 und mehr
xj h(xj )
18
2
25
9
35
5
45
6
55
5
63
3
Berechnen Sie das arithmetische Mittel auf Basis der Beobachtungen und auf Basis
der Tabelle. Vergleichen Sie die beiden Werte.
Aufgabe 2.5. Eine festverzinsliche Kapitalanlage bringt im 1. Jahr 3% Zins, im
2. Jahr 4% Zins, im 3. Jahr 5% Zins und im 4. Jahr 6% Zins. Berechnen Sie den
durchschnittlichen (effektiven) Zinssatz, für diese Anlageform.
Aufgabe 2.6. Eine Aktie bringt innerhalb von 5 Jahren die nachfolgenden jährlichen Gewinn / Verluste: +25%, -5%, +15%, -20%, -15%. Berechnen Sie die
durchschnittlichen (effektiven) Gewinn oder Verlust für diese Aktie.
Aufgabe 2.7. Der Kurs einer Aktie hat sich die in sind den letzten Jahren folgendermaßen entwickelt: +10%, -20%, +15%, +5%, -10%. Wie hoch ist die durchschnittliche Änderungsrate?
Aufgabe 2.8. Ein PKW legt 4 Strecken unterschiedlicher Länge mit unterschiedlichen Geschwindigkeiten zurück.
Teilstrecke
Länge (in km)
Geschwindigkeit (in
1
30
km
) 40
h
2
3
4
10 40 20
50 80 100
Mit welcher durchschnittlichen Geschwindigkeit würde die Strecke in der selben
Zeit zurück gelegt werden?
Aufgabe 2.9. Ein PKW legt von einer Strecke 1/6 mit einer Geschwindigkeit von
100 km/h, 1/3 mit einer Geschwindigkeit von 80 km/h und den Rest mit einer
Geschwindigkeit von 50 km/h zurück. Mit welcher (konstanten) Geschwindigkeit
würde er die gesamte Strecke in der gleichen Zeit bewältigen?
Aufgabe 2.10. Gegeben seien drei verschiedene Verteilungen X, Y und Z, die
durch die Angabe der relativen Häufigkeit definiert sind.
Version 5.1 - 013
49
2.4. Aufgaben
X
Y
Z
4
6
0,05 0,05
0,15
0,05 0,1
8
10
0,15 0,5
0,2 0,3
0,15 0,25
12
14
0,15 0,05
0,2 0,15
0,4 0,05
16
0,05
Bestimmen Sie jeweils das arithmetische Mittel und die Standardabweichung.
Aufgabe 2.11. Für das Gewicht eines Sacks geben sich bei einer Stichprobe folgende Werte, jeweils in kg: 50,2 ; 49,9 ; 50,4 ; 49,8 ; 50,2 ; 50,3 ; 50,7 ; 49,7 ;
50,0 und 50,5. Berechnen Sie den Mittelwert, die Spannweite, die mittlere absolute
Abweichung und die Standardabweichung.
Aufgabe 2.12. Eine Zählung von Besuchern pro Tag einer Dienststelle ergab für
einen gewissen Zeitraum die nachfolgende Verteilung:
Besucher
Anzahl der Tage
0 1
3 7
2
6
3 4
14 15
5 6
12 7
7 8
9 5
9
3
Bestimmen Sie das arithmetische Mittel, die mittlere absolute Abweichung, die
Varianz und die Standardabweichung.
Aufgabe 2.13. Für einen Telefonanschluss verteilen sich die Anzahl der Einheiten
für die Telefongespräche gemäß der nachfolgenden Tabelle:
Einheiten
relative Häufigkeit
1
10%
2
3
5% 25%
4
5
10% 20%
6
7
10% 15%
8
5%
Bestimmen Sie das arithmetische Mittel, die mittlere absolute Abweichung, die
Varianz und die Standardabweichung.
Aufgabe 2.14. Für das Alter einer Gruppe von Studenten ergibt sich folgende
Verteilung:
Alter
Anzahl
18 19
4 7
20 21 22
5 12 16
23 24 25
8 9 4
26 27
5 3
Stellen Sie die Häufigkeitsverteilung und die Summenhäufigkeitsverteilung grafisch
dar. Bestimmen Sie den Zentralwert, den (arithmetischen) Mittelwert, die mittlere
absolute Abweichung und die Standardabweichung.
Aufgabe 2.15. Eine Klausur ergab bei 14 Teilnehmern die Noten 1, 4, 2, 5, 2, 2,
3, 4, 2, 1, 5, 2, 3 und 3.
(a) Bestimmen Sie den Median und die 4-Quantile.
(b) Zeichnen Sie in ein Diagramm die absoluten Häufigkeiten und die absoluten
Summenhäufigkeiten.
(c) Bestimmen sie das arithmetische Mittel.
(d) Bestimmen Sie die mittlere absolute Abweichung und den Standardabweichung.
50
Version 5.1 - 013
Kapitel 2. Univariate Daten
Aufgabe 2.16. < doppelt >
Aufgabe 2.17. Die Zählung von Gebühren für Gespräche von einem Telefonapparat ergab die nachfolgende Verteilung von Einheiten:
Anzahl der Einheiten
Anzahl der Gespräche
1
5
2
6
3 4
8 12
5 6 7
11 10 7
8
5
Bestimmen Sie das arithmetische Mittel, die Varianz und die Standardabweichung
für die Gebühren.
Aufgabe 2.18. Die Bevölkerung in einer Stadt hatte innerhalb einiger Jahre die
nachfolgenden jährlichen Veränderung in Prozent vom Vorjahreswert: +10, -20,
+5, +15, -5 und +10. Wie hoch ist das durchschnittliche jährlich Wachstum?
Aufgabe 2.19. Ein Wanderer läuft 14 einer Strecke mit 7 km/h, 52 mit 6 km/h
und den Rest mit 5 km/h. Mit welcher (konstanten) Geschwindigkeit würde er die
gesamte Strecke in der gleichen Zeit bewältigen?
Version 5.1 - 013
51
Kapitel 3.
Bivariate Daten
Im diesem Teil werden Beziehungen zwischen zwei Merkmalen beschreiben. Wie
können solche Datenmengen dargestellt werden, welche Parameter beschreiben die
Daten.
3.1. Darstellungen bivariater Daten
Auch wenn der Schwerpunkt auf bivariate Daten liegt, werden auch multivariate
Daten beispielhaft vorgestellt, denn es gibt oftmals auch mehrere Daten, die in
eine Beziehung zueinander gebracht werden.
3.1.1. Multivariate Merkmale
Bei vielen statistischen Untersuchungen werden an den statistischen Einheiten
gleichzeitig mehrere Merkmale erfasst.
Beispiel 3.1. Bei einer Volkszählung werden bei den befragten Personen verschiedene Daten erhoben: Geschlecht, Alter, Beruf, Religion, . . . .
Beispiel 3.2. Bei einer Untersuchung der Leistungen von Schülern werden die
Noten in Mathematik, Deutsch und Englisch erfasst.
Beispiel 3.3. Für die Untersuchung der Wirksamkeit eines Düngemittels werden
bei einem landwirtschaftlichen Experiment die Daten Einsatz von Dünger (je ha)
und Ertrag (je ha) erfasst.
Beispiel 3.4. Bei der Untersuchung von Personen wird jeweils die Körpergröße
und das Gewicht ermittelt.
Version 5.1 - 013
53
3.1. Darstellungen bivariater Daten
Wir beschränken uns auf die Untersuchung zwei-dimensionaler, als bivariater Daten. Für weiter gehende Betrachtungen der mehr-dimensionalen also multivariater
Daten verweise ich auf die Literatur.
Bei der Betrachtung von zwei Merkmalen gibt es verschiedene Fragen, die man
sich stellen kann:
1. Besteht ein Zusammenhang zwischen den Merkmalen?
Liegt ein Zusammenhang bei metrisch oder ordinal messbaren Merkmalen
vor, dann spricht man von Korrelation, bei nominal messbaren Merkmalen
spricht man von Kontingenz.
2. Wie ausgeprägt ist der Zusammenhang zwischen den Merkmalen?
Die Stärke des Zusammenhangs wird durch die Berechnung eines Korrelationskoeffizienten oder Kontingenzkoeffizienten ermittelt.
3. Von welchem Typ ist der Zusammenhang zwischen den Merkmalen? Durch
welche Funktion kann dieser Zusammenhang beschrieben werden?
Hierzu wird in einer Regressionsrechnung eine Regressionsfunktion ermittelt, die den Zusammenhang der Merkmale angibt. Es gibt verschiedene
Arten von Zusammenhängen: linear, quadratisch, polynomial und exponentiell, um nur die wichtigsten Zusammenhänge zu nennen.
Bevor wir an Berechnungen von statistischen Merkmalen gehen, werden wir zuerst
noch einige Begriffe und Eigenschaften zwei-dimensionaler Verteilungen betrachten.
3.1.2. Zwei-dimensionale Häufigkeitstabellen
Zuerst werden Häufigkeitstabellen, die von den univariaten Daten her bekannt sind
auf bivariate Daten übertragen.
Definition 3.1. Gegeben seien die Merkmale X mit den Ausprägungen xj (j =
1,. . . ,m) und Y mit den Ausprägungen yk (k = 1,. . . ,q), die an denselben statistischen Einheiten erhoben werden. Die Anzahl der Beobachtungen, bei denen
die Kombinationen (xj ; yk ) der Ausprägungen auftritt heißt absolute Häufigkeit
h(xj ; yk ). Der Anteil der absoluten Häufigkeit an der Gesamtzahl n der Beobachtungen heißt relative Häufigkeit f (xj ; yk ) und es gilt f (xj ; yk ) = n1 h(xj ; yk ).
Die Gesamtheit aller Kombinationen von Merkmalsausprägungen mit den dazu gehörenden absoluten oder relativen Häufigkeiten heißt zwei-dimensionale Häufigkeitsverteilung.
54
Version 5.1 - 013
Kapitel 3. Bivariate Daten
Paare von Beobachtungen werden im allgemeinen mit (xi ; yi ) (i=1,. . . ,n) bezeichnet, während (xj ; yk ) die Kombination der Merkmalsausprägungen xj und yk
angibt (j=1,. . . ,m; k=1,. . . ,q).
Die tabellarische Darstellung der Häufigkeitsverteilung heißt im zwei-dimensionale
Häufigkeitstabelle und hat die Form gemäß Tabelle 3.1.
x1
..
.
y1
h(x1 ; y1 )
..
.
xj
..
.
h(xj ; y1 )
..
.
xm
h(xm ; y1 ) . . .
h(y1 )
...
...
..
.
...
...
yk
h(x1 ; yk )
..
.
h(xj ; yk )
..
.
...
..
.
...
...
h(xm ; yk ) . . .
h(yk )
...
yq
h(x1 ; yq )
..
.
h(x1 )
..
.
h(xj ; yq )
..
.
h(xj )
..
.
h(xm ; yq )
h(yq )
h(xm )
n
Tabelle 3.1.: Zwei-dimensionale Häufigkeitstabelle
Am rechten beziehungsweise am unteren Rand sind die Randverteilungen. Es
sind die Verteilungen für die Merkmale X beziehungsweise Y , also die Verteilungen,
wenn man sich nur für eines der Merkmale interessiert, nicht jedoch für beide
zusammen. Es gelten:
h(xj ) =
q
X
k=1
h(xj ; yk )
und
h(yk ) =
q
X
h(xj ; yk )
.
(3.1)
j=1
Beispiel 3.5. (Körpergröße und Gewicht)
Eine Messung von Körpergröße und Gewicht bei 200 Personen hat das Ergebnis
gemäß Tabelle 3.2 geliefert. Als Summen der Spalten beziehungsweise der Zeilen
enthält man die Randverteilungen für Körpergröße beziehungsweise Gewicht.
Definition 3.2. Die Häufigkeitstabelle zweier metrisch oder ordinal messbarer
Merkmale heißt Korrelationstabelle. Die Häufigkeitstabelle zweier nur nominal
messbarer Merkmale heißt Kontingenztabelle.
In der Häufigkeitstabelle können viele Informationen abgelesen werden. Jede einzelne Zeile oder jede einzelne Spalte stellt eine eigene eindimensionale Verteilung
dar, die genauso betrachtet werden kann.
Version 5.1 - 013
55
3.1. Darstellungen bivariater Daten
Gewicht in kg
50 bis u. 60
60 bis u. 70
70 bis u. 80
80 bis u. 90
90 bis u. 100
Körpergröße in cm (von ... bis unter ...)
150-160 160-170 170-180 180-190 190-200
3
5
8
3
1
4
25
40
10
1
2
10
20
6
2
1
8
10
16
5
0
2
2
5
11
10
50
80
40
20
20
80
40
40
20
200
Tabelle 3.2.: Beispiel: Körpergröße-Gewicht-Tabelle
Definition 3.3. Gegeben sei die zwei-dimensionale Häufigkeitsverteilung der
Merkmale X und Y . Die Häufigkeitsverteilung des Merkmales X (beziehungsweise
Y ), die sich für eine gegebene Ausprägung yk (beziehungsweise xj ) des Merkmales Y (beziehungsweise X) ergibt, heißt bedingte Verteilung oder konditionale
Verteilung von X (beziehungsweise Y ) für ein gegebenes yk (beziehungsweise xj ).
Die Häufigkeiten der bedingten Verteilungen bezeichnet man mit h(xj |Y = yk ) oder
kurz h(xj |yk ) und entsprechend f (xj |yk ) (j=1,. . . ,m) (beziehungsweise h(yk |xj )
und f (yk |xj ) (k=1,. . . ,q)).
Die absoluten Häufigkeiten der bedingten Verteilung können unmittelbar aus der
Häufigkeitstabelle abgelesen werden. Es gelten
h(xj |yk ) = h(xj ; yk )
h(yk |xj ) = h(xj ; yk )
und
.
(3.2)
Die bedingten relativen Häufigkeiten erhält man, indem die absoluten beziehungsweise relativen Häufigkeiten der entsprechenden Zeile oder Spalte der zweidimensionalen Häufigkeitsverteilung durch den zugehörigen Wert der Randverteilung
dividiert. Es gelten also:
f (xj |yk ) =
f (xj ;yk )
f (yk )
=
h(xj ;yk )
h(yk )
(3.3)
beziehungsweise
f (yk |xj ) =
f (xj ;yk )
f (xj )
=
h(xj ;yk )
h(xj )
.
(3.4)
Beispiel 3.6. In der Tabelle 3.2 können die verschiedenen Verteilungen und bedingten Verteilungen ausgewertet werden.
56
Version 5.1 - 013
Kapitel 3. Bivariate Daten
3.2. Zusammenhangsanalyse
Bei der Betrachtung von zwei Merkmalen ist von Interesse, ob die beiden Merkmale
voneinander abhängig sind oder nicht.
Gleich hier nochmals ein Hinweis oder eine Warnung: Bei der rein zahlenmäßigen
Betrachtung kann es vorkommen, dass zwei Merkmale eine Abhängigkeit zeigen,
die es tatsächlich auf Grund von fachlich-sachlichen Gründen nicht gibt (Beispiel:
scheinbare Abhängigkeit der Population von Störchen und der Anzahl der Geburten). Daher muss man hierbei stets den Hintergrund betrachten, um zu entscheiden, ob es tatsächlich eine Abhängigkeit gibt. Wie können wir ein Abhängigkeit
feststellen.
3.2.1. Abhängigkeit
Betrachten wir hierzu zunächst die nachfolgende Häufigkeitsverteilung (siehe Tabelle 3.3) für die zwei Merkmale X und Y :
x1
x2
x3
y1 y2
2 4
2 8
6 8
10 20
y3 y4
10 4
24 16
6 10
40 30
20
50
30
100
Tabelle 3.3.: Beispiel Häufigkeitsverteilung
Wie hängen die beiden Merkmale voneinander ab? Sind die beiden Merkmale unabhängig oder abhängig? Dazu bestimmen wir die bedingte Verteilung der
relativen Häufigkeiten des Merkmales X für die verschiedenen Ausprägungen
von Y und entsprechend die für das Merkmal Y für die verschiedenen Ausprägungen von X, das heißt für jede Merkmalsausprägung xj (beziehungsweise yk )
betrachten wir die relative Verteilung von Merkmal Y (beziehungsweise X), siehe
Tabelle 3.4 beziehungsweise Tabelle 3.5.
Die bedingte Verteilung der relativen Häufigkeiten sind verschieden. Die bedingte
Verteilung von X hängt davon ab, welche Ausprägung Y annimmt und umgekehrt.
Man sagt, die beiden Merkmale hängen voneinander ab, das heißt, die relative
Häufigkeit von X beziehungsweise Y hängt davon ab, welche konkrete Ausprägung
von Y (beziehungsweise X) herangezogen wird.
Version 5.1 - 013
57
3.2. Zusammenhangsanalyse
x1
x2
x3
y1
y2
y3
y4
0,1 0,2 0,5 0,2
0,04 0,16 0,48 0,32
0,2 0,27 0,2 0,33
1,0
1,0
1,0
Tabelle 3.4.: Bedingte Verteilung von Y
y1
0,2
0,2
0,6
1,0
x1
x2
x3
y2
0,2
0,4
0,4
1,0
y3
0,25
0,6
0,15
1,0
y4
0,13
0,54
0,33
1,0
Tabelle 3.5.: Bedingte Verteilung von X
Betrachten wir nunmehr die Tabelle 3.6 zwei-dimensionale Häufigkeitsverteilung
für die zwei Merkmale X und Y .
x1
x2
x3
y1 y2
2 5
6 15
4 10
12 30
y3
3
9
6
18
10
30
20
60
Tabelle 3.6.: Beispiel Häufigkeitsverteilung
Bestimmen wir auch hier wiederum die bedingte Verteilung der relativen Häufigkeiten, siehe Tabelle 3.7.
Die bedingten Verteilungen nach Y beziehungsweise X sind in den Tabellen 3.8
und 3.7 zu sehen.
Die beiden Verteilungen für X (beziehungsweise für Y ) hängen nicht davon ab,
welche Ausprägungen das andere Merkmal Y (beziehungsweise X) annimmt, das
heißt die relative Häufigkeit einer Merkmalsausprägung von xj (beziehungsweise
yk ) hängt nicht davon ab, welche konkrete Merkmalsausprägung von Y (beziehungsweise X) gewählt wird. Die Merkmale X und Y sind voneinander unabhängig.
58
Version 5.1 - 013
Kapitel 3. Bivariate Daten
y1 y2 y3
0,2 0,5 0,3
0,2 0,5 0,3
0,2 0,5 0,3
x1
x2
x3
1,0
1,0
1,0
Tabelle 3.7.: Bedingte Verteilung Y
x1
x2
x3
y1
0,17
0,5
0,33
1,0
y2
0,17
0,5
0,33
1,0
y3
0,17
0,5
0,33
1,0
Tabelle 3.8.: Bedingte Verteilung X
Bei abhängigen Merkmalen hängen die bedingten Verteilungen der relativen Häufigkeiten eines Merkmales davon ab, welche Ausprägung das andere Merkmal annimmt. Bei unabhängigen Merkmalen stimmen alle bedingten Verteilungen der
relativen Häufigkeiten eines Merkmales überein.
Definition 3.4. Gegeben sei die zwei-dimensionale Häufigkeitsverteilung der beiden Merkmale X und Y. Stimmen alle bedingten Verteilungen der relativen Häufigkeiten überein, das heißt es gilt f (xj |yk ) = f (xj |yl ) für alle k,l=1,. . . ,q und
für alle j=1,. . . ,m oder f (yk |xj ) = f (yk |xh ) für alle j,h=1,. . . ,m und für alle k=1,. . . ,q, dann heißen X und Y unabhängig, empirisch unabhängig oder
statistisch unabhängig, andernfalls heißen sie empirisch abhängig oder statistisch abhängig.
Für unabhängige Merkmale sind nicht nur alle bedingten Verteilungen eines Merkmales gleich, sondern sie stimmen mit der entsprechenden Randverteilung überein. Es gelten somit f (xj |yk ) = f (xj ) für k=1,. . . ,q und j=1,. . . ,m , sowie
f (yk |xj ) = f (yk ) für j=1,. . . ,m und k=1,. . . ,q.
Aus der Definition der bedingten relativen Häufigkeiten
f (xj |yk ) =
f (xj ;yk )
f (yk )
(3.5)
folgt dann
f (xj ) =
Version 5.1 - 013
f (xj ;yk )
f (yk )
(3.6)
59
3.2. Zusammenhangsanalyse
und damit
f (xj )f (yk ) = f (xj ; yk )
.
(3.7)
Satz 3.5. Die relative Häufigkeit für das gemeinsame Auftreten der Ausprägungen
xj und yk der Merkmale X und Y stimmt bei unabhängigen Merkmalen mit dem
Produkt der entsprechenden relativen Häufigkeiten der Randverteilungen überein:
f (xj ; yk ) = f (xj )f (yk )
(3.8)
Für die absoluten Häufigkeiten gilt:
h(xj ; yk ) =
1
h(xj )h(yk )
n
(3.9)
Das bedeutet, dass man bei unabhängigen Merkmalen die relativen Häufigkeiten
der zwei-dimensionalen Verteilung aus den ein-dimensionalen Verteilungen berechnen kann.
3.2.2. Parameter zwei-dimensionaler Verteilungen
Bei einer zwei-dimensionalen Verteilung können für die Randverteilungen und für
die bedingten Verteilungen die Lage- und Streuungsparameter bestimmt werden.
Dies sind jeweils Berechnungen für den ein-dimensionale Fall. Diese können problemlos durchgeführt werden können. Für die zwei-dimensionale Verteilung gibt es
einen speziellen Parameter, der die beiden Merkmale miteinander verbindet - die
Kovarianz. Sie ist die Summe über die Produkte der Differenzen der Beobachtungen zu den Mittelwerten.
Definition 3.6. Gegeben seien die beiden gemeinsam auftretenden und metrisch
messbaren Merkmale X und Y mit den arithmetischen Mitteln x̄ und ȳ. Die Kovarianz der zwei-dimensionalen Häufigkeitsverteilung ist wie folgt definiert:
a) Für Paare von Beobachtungen (xi ; yi ) (i=1,. . . ,n):
sXY =
n
1X
(xi − x̄)(yi − ȳ)
n i=1
(3.10)
b) Für die zwei-dimensionale Häufigkeitsverteilung mit den absoluten Häufigkeiten
h(xj ; yk ) beziehungsweise den relativen Häufigkeiten f (xj ; yk ) j = 1, . . . , m ; k =
1, . . . , q):
sXY =
60
q
m X
1X
(xj − x̄)(yk − ȳ)h(xj ; yk )
n j=1 k=1
(3.11)
Version 5.1 - 013
Kapitel 3. Bivariate Daten
beziehungsweise
sXY =
q
m X
X
(xj − x̄)(yk − ȳ)f (xj ; yk )
.
(3.12)
j=1 k=1
Manchmal wird die Kovarianz auch mit COV (X, Y ) bezeichnet.
Beispiel 3.7. Gegeben sei die zwei-dimensionale Verteilung (siehe Tabelle 3.9).
x1 = 2
x2 = 4
x3 = 6
y1 = 1 y2 = 2 y3 = 3 y4 = 4
3
9
2
1
8
7
2
3
4
9
1
1
15
25
5
5
15
20
15
50
Tabelle 3.9.: Beispiel zwei-dimensionale Verteilung
Es ist x̄ = 4 und ȳ = 2. Für die Kovarianz ergibt sich sXY = −0, 08.
Die Berechnung der Kovarianz lässt sich vereinfachen, denn mit der obigen Formel
sind viele Differenzen zu den Mittelwerten x und y zu bestimmen:
sXY =
n
1X
(xi − x̄)(yi − ȳ)
n i=1
(3.13)
n
1X
=
(xi yi − xi ȳ − x̄yi + x̄ȳ)
n i=1
=
n
n
n
1X
1X
1X
xi yi − ȳ
xi − x̄
yi + x̄ȳ
n i=1
n i=1
n i=1
=
n
1X
xi yi − x̄ȳ − x̄ȳ + x̄ȳ
n i=1
=
n
1X
xi yi − x̄ȳ
n i=1
Satz 3.7. Für die Berechnung der Kovarianz bei zwei gemeinsam auftretenden,
metrisch messbaren Merkmalen X und Y mit den arithmetischen Mitteln x̄ und ȳ
ergeben sich folgende vereinfachte Formeln zur Berechnung:
sXY =
Version 5.1 - 013
n
1X
xi yi − x̄ȳ
n i=1
(3.14)
61
3.3. Regressionsrechnung
beziehungsweise
sXY =
q
m X
1X
xj yk h(xj ; yk ) − x̄ȳ
n j=1 k=1
(3.15)
und
sXY =
q
m X
X
xj yk f (xj ; yk ) − x̄ȳ
.
(3.16)
j=1 k=1
Die Varianz ist ein Maß für die Streuung oder Variabilität eines einzelnen, metrisch
messbaren Merkmales, die Kovarianz ist ein Maß für die gemeinsame Variabilität
zweier Merkmale. Haben zwei Merkmale keine Abhängigkeit, das heißt gibt es
keinen Zusammenhang zwischen den Merkmalen X und Y , dann ist sXY = 0.
Die Kovarianz ist jedoch nicht normiert. Durch die Berücksichtigung der Standardabweichungen der Merkmale X und Y ergibt sich eine weitere Kennzahl, die nur
Werte zwischen −1 und 1 einnimmt.
Definition 3.8. Gegeben sei die gemeinsame Verteilung zweier metrisch messbarer
Merkmale X und Y , mit der Kovarianz sXY und den Standardabweichung sX und
sY . Der Wert
sXY
(3.17)
rXY =
sX · sY
heißt Korrelationskoeffizient und ist ein Maß für die Ausgeprägtheit des Zusammenhangs von X und Y . Es gilt −1 ≤ rXY ≤ 1. Sind die Merkmale unabhängig, dann gilt rXY = 0. Liegen alle Beobachtungspunkte auf einer Geraden, das
heißt haben sie einen engen Zusammenhang, so gilt rXY = 1 oder rXY = −1.
3.3. Regressionsrechnung
Bei der Untersuchung von zwei Merkmalen X und Y , die voneinander abhängig
sind, ist der weitere Untersuchungsgegenstand die Frage, wie diese Abhängigkeit
aussieht. Dazu werden wir eine Funktion berechnen, welche die Abhängigkeit der
beiden Merkmale darstellt.
Die Existenz einer statistischen Abhängigkeit ergibt sich aus einem sachlichen Zusammenhang. Ohne eine Kenntnis beziehungsweise Analyse der sachlichinhaltlichen Hintergründe eines Problems ist es nicht möglich, die Frage des Zusammenhangs von Merkmalen zu erörtern. Sonst werden Zusammenhänge berechnet,
die sachlich nicht gerechtfertigt sind.
62
Version 5.1 - 013
Kapitel 3. Bivariate Daten
Es wird die gemeinsame Verteilung zweier metrisch messbaren Merkmale X und
Y betrachtet, die voneinander abhängig sind. Bei der Regressionsrechnung ist eine
Funktion gesucht, die möglichst genau die Beziehung zwischen X und Y beschreibt.
Dazu wird eine möglichst einfache Funktion ŷ = g(x) gesucht, die den Zusammenhang beschreibt. Durch ŷ wird dabei symbolisiert, dass die Regressionsfunktion
einem beobachteten x-Wert nicht den oder die zugehörigen beobachteten y-Werte
zuordnet, sondern einen auf der Regressionsfunktion liegenden Wert ŷ.
Definition 3.9. Gegeben sei die zwei-dimensionale Verteilung der metrisch messbaren, statistisch abhängigen Merkmale X und Y . Eine Funktion ŷ = g(x), welche
die Tendenz oder den durchschnittlichen Verlauf der Abhängigkeit des Merkmales
Y vom Merkmal X beschreibt, heißt y-x-Regressionsfunktion oder manchmal
auch nur kurz Regressionsfunktion genannt.
Der Typ der Regressionsfunktion kann verschiedene Formen annehmen. Für die
Bestimmung der Regressionsfunktion wird zuerst festgelegt, welche Art der Zusammenhang ist. Dies legt fest, ob der Zusammenhang zwischen den quantitativen
Merkmalen durch eine
• Gerade: y = a + bx
• Parabel: y = a + bx + cx2
• Potenzfunktion: y = axb
• Exponentialfunktion: y = abx
• logistische Funktion: y =
k
1+ea+bx
(b > 0)
(b < 0)
• oder eine andere Funktion
bestimmt ist. Die Bestimmung der Parameter der Regressionsfunktion geschieht in
den meisten Fällen nach dem Kriterium der kleinsten Quadrate (KQ-Kriterium).
Definition 3.10. Die Koeffizienten einer Regressionsfunktion ŷ = g(x) zur Beschreibung des Zusammenhangs zwischen den Merkmalen X und Y werden so
bestimmt, dass die Summe der quartierten Abweichungen der Beobachtungen yi
(i = 1, . . . , n) von den zugehörigen Werten auf der Regressionsfunktion ŷi = g(xi ),
P
also ni=1 (yi − ŷi )2 , zu einem Minimum wird.
n
X
(yi − ŷi )2 = min
(3.18)
i=1
Die so bestimmte Regressionsfunktion heißt Regressionsfunktion nach der
Methode der kleinsten Quadrate oder kurz KQ-Regressionsfunktion
Version 5.1 - 013
63
3.3. Regressionsrechnung
Wir werden uns hier jedoch nur mit der linearen Funktion beschäftigen!
Bei der Berechnung einer linearen y-x-Regressionsfunktion gehen wir davon aus,
dass die Regressionsfunktion die Gestalt ŷ = a + bx hat. Nach der Methode
der Kleinsten Quadrate sind die Koeffizienten a und b so zu bestimmen, dass die
Summe der Quadrate der Abweichungen der y-Koordinaten yi der beobachteten
Wertepaare (xi ; yi ) von der durch die Regressionsfunktion bestimmte Koordinaten
ŷi = a + bxi ein Minimum wird. Der Abstand der Punkte zur Geraden, d.h.
parallel zur y-Achse. Bei n Wertepaaren erhalten wir die Funktion
S(a, b) =
n
X
(yi − ŷi )2 =
i=1
n
X
(yi − a − bxi )2
(3.19)
i=1
mit den Unbekannten a und b für die Summe. Die Aufgabe ist nun a und b so
zu bestimmen, dass die Funktion S(a, b) ein Minimum annimmt. Eine notwendige
Bedingung für das Minimum ist das Verschwinden der partiellen Ableitungen erster
Ordnung von S(a, b) nach a und b. Für die partiellen Ableitungen ergeben sich:
n
X
∂S(a, b)
=
2(yi − a − bxi )(−1)
∂a
i=1
(3.20)
n
X
∂S(a, b)
2(yi − a − bxi )(−xi ) .
=
∂b
i=1
(3.21)
und
Diese Ableitungen werden Null gesetzt und man erhält die Normalgleichungen
einer linearen KQ-Regressionsfunktion ŷ = a + bx:
n
X
1. Normalgleichung:
yi = na + b
i=1
2. Normalgleichung:
n
X
i=1
xi yi = a
n
X
(3.22)
xi
i=1
n
X
i=1
xi + b
n
X
x2i
(3.23)
i=1
Dieses System der Normalgleichungen kann man nach den Regressionskoeffizienten
a und b auflösen, denn die Koordinaten (xi , yi ) sind bekannt, die einzig Unbekannten sind a und b.
64
Version 5.1 - 013
Kapitel 3. Bivariate Daten
Satz 3.11. Für die lineare KQ-Regressionsgerade ŷ = a + bx können die Regressionskoeffizienten a und b berechnet werden mittels:
x2i ni=1 yi − ni=1 xi ni=1 xi yi
P
P
n ni=1 x2i − ( ni=1 xi )2
Pn
a=
b=
n
P
P
P
i=1
xi yi − ni=1 xi ni=1 yi
P
Pn
n i=1 x2i − ( ni=1 xi )2
Pn
P
P
i=1
(3.24)
(3.25)
Aus der 1. Normalgleichung ergibt sich, dass ȳ = a + bx̄ ist, dass somit die lineare Regressionsfunktion durch den Punkt (x̄; ȳ), die Koordinaten der Mittelwerte,
verläuft.
Erweitert man die Quotienten in den Formeln zur Bestimmung der Regressionskoeffizienten mit n12 , so erhält man für die Koeffizienten a und b:
P
a=
b=
1
n
P
x2i
ȳ
n
− x̄
s2X
P
xi yi
n
(3.26)
xi yi − x̄ȳ
COV (X, Y )
=
2
sX
s2X
(3.27)
Durch Vertauschung der Rollen von x und y erhält man ebenso eine Regressionsfunktion, eine x-y-Regressionsfunktion nach dem Kriterium der Kleinsten Quadrate x̂ = a0 +b0 y. Hierzu wird eine Funktion x̂ = a0 +b0 y untersucht, mit dem Abstand
parallel zur x-Achse. Analog zu den Berechnungen für die y-x-Regressionsfunktion
erhält man dann:
Pn
0
a =
0
b =
i=1
n
yi2 ni=1 xi − ni=1 yi ni=1 xi yi
P
P
n ni=1 yi2 − ( ni=1 yi )2
P
Pn
P
P
xi yi − ni=1 xi ni=1 yi
Pn
P
n i=1 yi2 − ( ni=1 yi )2
i=1
P
(3.28)
P
(3.29)
Im Regelfall (außer wenn alle Punkte auf einer Geraden liegen), stimmen die y-xund die x-y-Regressionsgerade nicht überein. Sie schneiden sich jedoch im Punkt
(x̄ | ȳ). Es ist auch zu beachten, dass die x-y-Regressionsfunktion nicht die mathematische Umkehrfunktion der y-x-Regressionsfunktion ist!
Version 5.1 - 013
65
3.3. Regressionsrechnung
Beispiel 3.8. Gegeben sind die folgenden Beobachtungen
xi
yi
1 2
2 3
3
5
4
4
4
6
5 6
4 8
7
7
9
8
Für die Berechnung der Koeffizienten werden die benötigten Daten in Form einer
Tabelle zusammen gestellt (siehe Tabelle 3.10).
xi yi x2i xi yi
1 2
1
2
2 3
4
6
3 5
9
15
4 4 16
16
4 6 16
24
5 4 25
20
6 8 36
48
7 7 49
49
9 8 81
72
41 47 237 252
yi2
4
9
25
16
36
16
64
49
64
283
Tabelle 3.10.: Tabelle für Beispiel 3.8
Mit den Summen der Spalten ergeben sich die nachfolgenden Werte. Dabei wird
teilweise zur Vereinfachung des Schreibens die Grenzen der Summation bei den
P
P
P
Summationszeichen
weggelassen. Das heißt es steht kurz
statt ni=1 .
n=9
x̄ =
s2X =
n
1X
41
xi =
= 4, 5556
n i=1
9
(3.31)
n
1X
1
41
452
x2i − x̄2 = 237 − ( )2 =
= 5, 5802
n i=1
9
9
81
ȳ =
66
(3.30)
n
1X
47
yi =
= 5, 2222
n i=1
9
(3.32)
(3.33)
Version 5.1 - 013
Kapitel 3. Bivariate Daten
n
1X
47
338
1
= 4, 1728
yi2 − ȳ 2 = 283 − ( )2 =
n i=1
9
9
81
s2Y =
n
1X
xi yi − x̄ȳ
n i=1
41 47
341
1
·
=
= 4, 2099
= 252 −
9
9 9
81
sXY =
P 2P
xi y i
P 2
−
xi xi y i
a=
P
n xi − ( xi )2
807
237 · 47 − 41 · 252
= 1, 7854
=
=
9 · 237 − 412
452
P
P
P
(3.35)
P
xi y i −
xi yi
b=
P 2
P
n x i − ( xi ) 2
9 · 252 − 41 · 47
341
=
=
= 0, 7544
2
9 · 237 − 41
452
n
(3.34)
(3.36)
P
(3.37)
Die y-x-Regressionsgerade lautet somit ŷ = 1, 7854 + 0, 7544x.
P 2P
y i xi
P 2
− yi xi yi
a =
P
n yi − ( yi )2
283 · 41 − 47 · 252
−241
=
=
= −0, 7130
2
9 · 283 − 47
338
0
P
P
xi yi −
yi xi
b =
P 2
P
n yi − ( yi )2
9 · 252 − 41 · 47
341
=
=
= 1, 0089
2
9 · 283 − 47
338
0
n
P
P
(3.38)
P
(3.39)
Die x-y-Regressionsgerade (Vertauschung der Rollen von x und y) lautet somit x̂ =
−0, 7130 + 1, 0089y oder (umgestellt auf die übliche Form) y = 0, 7067 + 0, 9912x̂.
Für den Korrelationskoeffizienten gilt
rXY =
Version 5.1 - 013
341
sXY
= √ √
= 0, 8724
sX · sY
452 338
(3.40)
67
3.4. Aufgaben
y1 y2
4 6
5 7
11 7
x1
x2
x3
y3
10
8
2
Tabelle 3.11.: Aufgabe zwei-dimensionale Häufigkeitsverteilung
3.4. Aufgaben
Aufgabe 3.1. Gegeben sei die zwei-dimensionale Häufigkeitstabelle, siehe Tabelle
3.11. Bestimmen Sie, ob die beiden Merkmale abhängig oder unabhängig sind.
Aufgabe 3.2. Gegeben sei die zwei-dimensionale Häufigkeitstabelle, siehe Tabelle
3.12. Bestimmen Sie, ob die beiden Merkmale abhängig oder unabhängig sind.
x1
x2
x3
y1 y2 y3
20 12 8
10 6 4
5 3 2
y4
4
2
1
Tabelle 3.12.: Aufgabe zwei-dimensionale Häufigkeitsverteilung
Aufgabe 3.3. Gegeben sind die unabhängigen Merkmale X und Y mit den Verteilungen:
xj
h(xj )
yk
h(yk )
x1
8
y1
8
x2 x3
40 16
y2 y3 y4
32 16 8
Bestimmen Sie die zwei-dimensionale Verteilung der absoluten Häufigkeit.
Aufgabe 3.4. < doppelt >
Aufgabe 3.5. < doppelt >
Aufgabe 3.6. < doppelt >
68
Version 5.1 - 013
Kapitel 3. Bivariate Daten
Aufgabe 3.7. Für die Merkmale X und Y wurden die folgenden Beobachtungen
xi
yi
2
5
2
7
4 4
4 6
5
4,5
6
3
6
5
8
3
ermittelt. Berechnen Sie eine lineare KQ-Regressionsfunktion ŷ = a + bx. Zeichnen Sie die Datenpunkte und die Regressionsgerade in eine gemeinsame Zeichnung.
Bestimmen Sie den Korrelationskoeffizienten.
Aufgabe 3.8. Gegeben sind die unabhängigen Merkmale X und Y mit den Verteilungen:
xj
h(xj )
x1
24
x2 x 3 x4
40 72 16
yk
h(yk )
y1 y2 y3
19 76 57
Bestimmen Sie die zwei-dimensionale Verteilung der absoluten Häufigkeit.
Aufgabe 3.9. Gegeben sind die folgenden Beobachtungen
xi
yi
1 2
4 4
3
3
4
6
6 7
5 9
8
8
Berechnen Sie die Regressionsgerade. Zeichnen Sie die Punkte und die Gerade in
ein Diagramm. Berechnen Sie den Korrelationskoeffizienten.
Aufgabe 3.10. Gegeben sind die folgenden Beobachtungen
xi
yi
1
6
3
5
5
6
7 7
6 8
Berechnen Sie die (y-x-)Regressionsgerade. Zeichnen Sie die Punkte und die Gerade in ein Diagramm. Berechnen Sie den Korrelationskoeffizienten.
Aufgabe 3.11. < doppelt >
Aufgabe 3.12. Gegeben sind die folgenden Beobachtungen (xi ; yi ): (0;0), (1;1),
(2;4), (3;9) und (4;16). Berechnen Sie die Regressionsgerade und den Korrelationskoeffizienten. Zeichnen Sie die Punkte und die Regressionsgerade in ein Diagramm.
Version 5.1 - 013
69
3.4. Aufgaben
Aufgabe 3.13. Gegeben seien die folgenden Beobachtungswerte (xi ; yi ): (1;3),
(2;4), (3;7), (5;6), (4;6), (6;5), (7;9) und (8;8). Berechnen Sie die Regressionsgerade nach der Methode der Kleinsten-Quadrate. Zeichnen Sie die Punkte und die
Regressionsgerade in ein Diagramm ein. Bestimmen Sie die Kovarianz sXY und
den Korrelationskoeffizienten rXY .
Aufgabe 3.14. Der jährliche Umsatz einer Firma hat in den letzten Jahren folgende Entwicklung durchgeführt (Angaben jeweils in Mio. EURO):
Jahr
Umsatz
1997 1998
4,7
5,6
1999 2000
6,2
7,4
2001 2002
7,6
8,9
Die Firmenleitung geht davon aus, dass sich der Trend für den Umsatz in den
nächsten Jahren nicht verändert. Bestimmen Sie die Regressionsgeraden nach der
Methode der Kleinsten-Quadrate. Bestimmen Sie eine Prognose für den Umsatz
für die Jahre 2003, 2004 und 2008.
70
Version 5.1 - 013
Kapitel 4.
Zeitreihenanalysen
In diesem Kapitel werden spezielle bivariate Daten betrachtet. Daten bei der die
eine Variable die Zeit ist.
4.1. Zeitreihen
Die grundlegende Aufgabe der Zeitreihenanalyse ist die Beschreibung des Verlaufs
der Beobachtungen eines Merkmales für verschiedene Zeitpunkte beziehungsweise Zeitintervalle. Betrachtet man beispielsweise den monatlichen Verbrauch von
Strom in den letzten Jahren, so kann man zwei Eigenschaften erkennen. Zum einen
gibt es eine periodische Schwankung, im Winter wird mehr Strom benötigt als im
Sommer, zum anderen gibt es die langfristige Tendenz eines steigenden Bedarfs
an Strom. Es gibt somit bei diesen Untersuchungen periodische beziehungsweise
zyklische Schwankungen und eine langfristige Tendenz einer Zeitreihe, die als
Trend bezeichnet wird. Wir werden nun im weiteren untersuchen, wie periodische
Schwankungen erfassen und eliminieren können, um den Trend zu ermitteln.
Für die Ermittlung des Trends besteht zuerst die Aufgabe, die periodischen
Schwankungen auszuschließen. Das einfachste Verfahren hierzu ist die Bestimmung
der gleitenden Durchschnitte. Beim gleitenden Durchschnitt berechnet man
aus jeweils k unmittelbar aufeinander folgenden Werten der Zeitreihe das arithmetische Mittel und ordnet diesen Wert einem Zeitpunkt zu. Es werden somit stets k
Werte für den Durchschnitt benötigt. Mit jedem neuen Werte wird der älteste Wert
aus der Ermittlung des Durchschnittes entfernt. Wir betrachten hier nachlaufende gleitende Durchschnitte (für den Durchschnitt werden nur zurückliegende
Werte berücksichtigt) und nicht zentrierte gleitende Durchschnitte (für den
jeweiligen Durchschnitt werden zurückliegende und zeitlich nachfolgende Werte
berücksichtigt).
Version 5.1 - 013
71
4.1. Zeitreihen
Definition 4.1 (Gleitender Durchschnitt). Gegeben seien T Werte xt (t =
1, . . . , T ) einer Zeitreihe mit gleichen Abständen der Zeitpunkte. Der gleitenden
Durchschnitt k-ter-Ordnung ist definiert für t = k, . . . , T durch:
x̄kt
t
1 X
1
xi .
= (xt−(k−1) + xt−(k−2) + · · · + xt ) =
k
k i=t−(k−1)
(4.1)
Für t = 1, . . . , k − 1 gibt es verschiedene Möglichkeiten. Es können keine Durchschnitte definiert werden oder jeweils
x̄kt
t
1
1X
= (x1 + x2 + · · · + xt ) =
xi .
t
t i=1
(4.2)
Beispiel 4.1 (Gleitender Durchschnitt 3. Ordnung). In der Zeitreihe, die in Tabelle 4.1 gegeben ist, sind die gleitende Durchschnitte der 3. Ordnung berechnet. Für
die ersten beiden Perioden ist kein gleitender Durchschnitt 3. Ordnung berechnet
worden.
Periode Wert
1
10
2
8
3
12
4
12
5
10
6
14
7
14
8
12
9
16
gleitender Durchschnitt
10+8+12
= 30
= 10,0
3
3
8+12+12
32
= 3 = 10,7
3
12+12+10
= 34
= 11,3
3
3
12+10+14
36
= 3 = 12,0
3
10+14+14
= 38
= 12,7
3
3
14+14+12
40
=
= 13,3
3
3
42
14+12+16
= 3 = 14,0
3
Tabelle 4.1.: Beispiel: gleitender Durchschnitt 3. Ordnung
Es ist zu sehen, dass die Werte des gleitenden Durchschnittes einen linearen Verlauf haben.
Beispiel 4.2 (Gleitender Durchschnitt 4. Ordnung). In der Zeitreihe, die in Tabelle 4.2 definiert ist, sind die gleitenden Durchschnitte der 4. Ordnung berechnet.
Für die ersten drei Perioden wurden keine gleitende Durchschnitte berechnet.
Auch hier haben die gleitende Durchschnitte wieder einen linearen Verlauf.
72
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Periode Wert
1
4
2
7
3
5
4
3
5
6
6
9
7
7
8
5
gleitender Durchschnitt
4+7+5+3
4
7+5+3+6
4
5+3+6+9
4
3+6+9+7
4
6+9+7+5
4
=
=
=
=
=
19
4
21
4
23
4
25
4
27
4
=
=
=
=
=
4,75
5,25
5,75
6,25
6,75
Tabelle 4.2.: Beispiel: Gleitender Durchschnitt 4. Ordnung
Bildet man die Zeitreihe aus den Differenzen zwischen den Beobachtungswerten
und den gleitenden Durchschnitten zu den entsprechenden Zeitpunkten, dann extrahiert man damit die saisonalen Schwankungen, die dann ebenfalls analysiert
werden können.
Der gleitende Durchschnitt wird beispielsweise bei Aktienkursen eingesetzt. Dort
gibt es 20-Tagen-Linien, 30-Tages-Linien, 50-Tages-Linien, 100-Tages-Linien, 200Tages-Linien und ähnliches. Die x-Tages-Linien sind gleitende Durchschnitte der
Ordnung x.
4.2. Bestandsanalyse
Eine Bestandsmasse ist eine statistische Masse, deren Einheiten für ein gewisses
Zeitintervall zur Masse gehört. Zu jeder Bestandsmasse gehört eine dazu korrespondierende Ereignismasse, nämlich die Zugänge und die Abgänge. Wird ein
Bestand fortlaufend um Zugänge und Abgänge ergänzt, dann spricht man von
Fortschreibung.
Beispiel für Bestände sind:
• Teile in einem Lager,
• Anzahl der Lizenzen eines Programmes, die gleichzeitig im Netz aktiv sind.
(Lizenzen!)
• Entwicklung der Bevölkerung einer Gemeinde.
• Die Anzahl der Tiere auf einem Bauernhof.
Version 5.1 - 013
73
4.2. Bestandsanalyse
• Konzentration von Stickoxiden in der Atmosphäre.
• Besucher eines Tages eines Schwimmbad.
• Der Bestand auf einem Konto.
• Der Bestand auf einem Konto der Bilanz.
Die Bestandsanalyse bezieht sich immer auf einen vorgegebenen Zeitraum. Der
Anfangszeitpunkt wird mit tA und der Endzeitpunkt wird mit tE bezeichnet. Um zu
untersuchen, wie sich der Bestand im Laufe der Zeit verändert, wird der Zeitraum
von tA bis tE in m Zeitintervalle unterteilt. Als Grenzen für diese Zeitintervalle setzt
man die Zeitpunkte t0 = tA , t1 , . . . , tm−1 , tm = tE . In der weiteren Betrachtung
wird davon ausgegangen, dass die Länge der Zeitintervalle identisch sind. Somit hat
−tA
. Als Bestand bezeichnet
jedes Zeitintervall die (zeitliche) Länge von ∆t = tEm
man die Anzahl (Häufigkeit) der Einheiten zu einem bestimmten Zeitpunkt. Der
Bestand zum Zeitpunkt t beziehungsweise tj wird mit Bt beziehungsweise mit Bj
bezeichnet. B0 heißt Anfangsbestand, Bm heißt Endbestand.
Definition 4.2 (abgeschlossene und offene Bestandsmasse). Gilt für eine Bestandsmasse Bt = 0 für t ≤ t0 und für t ≥ tm , dann handelt es sich um eine
im Zeitintervall (t0 ; tm ) abgeschlossene Bestandsmasse . Gilt Bt 6= 0 für
mindestens ein t ≤ t0 oder t ≥ tm , dann liegt eine im Zeitintervall (t0 ; tm ) offene
Bestandsmasse vor.
Die Besucher eines Schwimmbades innerhalb eines Tages ist eine abgeschlossene
Bestandsmasse, denn vor der Öffnung und nach Schluss befindet sich kein Besucher im Schwimmbad. Die Einwohner einer Gemeinde dagegen ist eine offene
Bestandsmasse.
Definition 4.3 (Verweilsdauer). Wenn für eine Einheit der Bestandsmasse, der
Zeitpunkt des Zugangs tz und der Zeitpunkt des Abgangs ta bekannt sind, dann
heißt d = ta − tz die Verweildauer der Einheit.
Definition 4.4 (Zugang, Abgang). Die Anzahl der Einheiten, die zu einem Bestand im Zeitintervall von tj−1 bis tj hinzukommen, heißt Zugang zj . Die Anzahl
der Einheiten um die ein Bestand im Zeitintervall von tj−1 bis tj verringert wird,
heißt Abgang aj .
Die Summe aller Zugänge zi (i = 1, . . . , j) von t0 bis tj heißt Zugangssumme
Zj . Die Summe aller Abgänge ai (i = 1, . . . , j) von t0 bis tj heißt Abgangssumme
Aj . Es gelten
Zj =
j
X
i=1
74
zi und Aj =
j
X
ai
(4.3)
i=1
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Bei einer geschlossenen Bestandsmasse ist die Anzahl der den Bestand durchlaufenden Einheiten gleich der Zugangs- oder der Abgangssumme. Diese Gesamtanzahl
wird mit n bezeichnet und es gilt Zm = Am = n.
Den Bestand Bj lässt sich mit damit berechnen:
Bj = Bj−1 + zj − aj , Bj
= B0 + Zj − Aj .
(4.4)
Wenn man sich den Lagerbestand betrachtet und die Zeitintervalle die Tage sind,
dann ergibt sich die Frage, wann der Zugang und wann der Abgang durchgeführt
wird. Wenn am Anfang 5 Teile vorhanden sind, ein Zugang von 10 Teilen und
ein Abgang von ebenfalls 10 Teilen erfolgt, dann sind am Ende wieder 5 Teile
vorhanden. Was ist jedoch, wenn der Abgang am morgen, der Zugang erst am
Abend ist, dann hat man morgens ein Problem, denn der Bestand beträgt nur 5.
Hier wird die Variante betrachtet, dass der Ab- und Zugang erst am Ende einer
Periode wirksam ist.
Beispiel 4.3. Bei der Untersuchung der Veränderungen der Vorräte in einem
Haushalt ergeben sich die in der Tabelle 4.3 dargestellten Veränderungen (Zugang und Abgang) der Bestände an Milchflaschen. Die Tage, an denen es keine
Bestandsveränderung gibt, sind nicht aufgeführt, für die Berechnung jedoch von
Bedeutung. Der Anfangsbestand beträgt 10 Flaschen.
0 3 6 10 11 12 16 17 22 25 27 29 30
Tag
Zugang
40
20
40
20
Abgang
5 8 12 6 7 10 3 11 14 9 17 14
Bestand 10 5 37 25 19 12 2 19 8 34 25 8 14
Tabelle 4.3.: Bestandsveränderungen
Es liegt ein offener Bestand vor.
Definition 4.5 (Zugangsrate, Abgangsrate). Das arithmetische Mittel der Zugänge zj beziehungsweise der Abgänge aj über alle Perioden hinweg heißt Zugangsrate z̄ beziehungsweise Abgangsrate ā:
m
m
1 X
1 X
z̄ =
zi und ā =
ai
m i=1
m i=1
(4.5)
Es ist zu beachten, dass alle Zeitintervalle berücksichtigt werden, auch wenn in
diesem Zeitintervall keine Bestandsveränderung vorkommt.
Version 5.1 - 013
75
4.2. Bestandsanalyse
Beispiel 4.4 (Fortsetzung Beispiel 4.3). Beim obigen Beispiel der Bestandsführung der Milchflaschen, gibt es 30 Tage (Zeitintervalle). Somit ist m = 30. Es
ergibt sich eine Zugangssumme von Zm = 120. Die Abgangssumme Am = 116.
Damit sind z̄ = 120
= 4, 00 und ā = 116
= 3, 87. Das bedeutet, dass täglich durch30
30
schnittlich 4,00 Milchflaschen hinzukommen und 3,87 Flaschen wegkommen.
Definition 4.6 (Durchschnittsbestand, mittlere Verweildauer, Umschlagshäufigkeit). Werden alle Veränderungen vom Bestand zum Ende des Intervalls berücksichtigt, dann gilt für den Durchschnittsbestand
X
1 m−1
Bj .
B̄ =
m j=0
(4.6)
Achtung: in dieser Summe ist die letzte Bestandssumme nicht enthalten, da gemäß
der Festlegung die Bestandsveränderung erst zum Ende der Periode wirksam wird.
Für die mittlere Verweildauer d¯ gilt bei einer geschlossenen Bestandsmasse,
wobei n die Gesamtanzahl der Einheiten, das heißt sie Summe der Zugänge beziehungsweise die Summe der Abgänge, ist
B̄(tm − t0 )
d¯ =
n
(4.7)
und bei einer offenen Bestandsmasse
2B̄(tm − t0 )
d¯ =
Am−1 + Zm−1
(4.8)
Die Umschlagshäufigkeit U eines Bestandes in einem Zeitintervall tm − t0 entspricht der mittleren Anzahl von Erneuerungen des Bestandes und wird wie folgt
berechnet: (für eine geschlossene Bestandsmasse)
tm − t0
n
=
B̄
d¯
(4.9)
tm − t0
Am−1 + Zm−1
=
2B̄
d¯
(4.10)
U=
für eine offene Bestandsmasse
U=
Beispiel 4.5 (Fortsetzung Beispiel 4.3). Für den obigen Lagerbestand an Milchflaschen ergibt sich somit
B̄ =
76
1
532
(10 + 10 + 10 + 5 + . . . + 25 + 25 + 8) =
= 17, 73
30
30
(4.11)
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Da festgelegt wurde, dass die Veränderungen des Bestandes erst am Ende der jeweiligen Zeitintervalle aktiv werden, dann dürfen die Zu- und Abgänge der letzten
Periode nicht berücksichtigt werden. Es gilt dann:
d¯ =
30
2 532
1064
30
=
= 5, 27 ,
100 + 102
202
(4.12)
also eine mittlere Verweildauer von 5,27 Tagen. Für das obige Beispiel der Milchflaschen ergibt sich
U=
100 + 102
= 5, 70 ,
2 532
30
(4.13)
also eine Umschlagshäufigkeit von 5,7. Das bedeutet, dass der Bestand 5,7 mal
gefüllt und wieder geleert wird.
Die Parameter Zugangsrate, Abgangsrate, Durchschnittsbestand, mittlere Verweildauer und Umschlagshäufigkeit sind wichtige Kenngrößen für eine Bestandsanalyse.
Beispiel 4.6. Eine Firma verkauft zwei Produkte A und B. Für einen Zeitraum
von 10 Wochen werden die Veränderungen am Bestand untersucht (siehe Tabelle 4.4 und 4.5). Der Anfangsbestand der Produkte sind 150 (Produkt A) und 30
(Produkt B). Es wird angenommen, dass die Veränderungen jeweils zum Ende des
Intervalls wirksam werden.
0
1
Woche
Zugang
150
100
Abgang
Bestand 150 200
2
3
10
190
20
170
4
5
6
10 30
160 130
20
110
7
8
9
10
10 10 20 10
100 90 70 60
Tabelle 4.4.: Bestandsverlauf Produkt A
Woche
0
1
2 3 4
5
6 7
8
9 10
Zugang
80 200
300
100 100
Abgang
100 60 70 80 120 50 60 20 110 60
Bestand 30 10 150 80 0 180 130 70 150 140 80
Tabelle 4.5.: Bestandsverlauf Produkt B
Version 5.1 - 013
77
4.3. Indexzahlen
Für das Produkt A gilt:
1370
1
(150 + 200 + · · · + 70) =
= 137
10
10
Für die mittlere Verweildauer gilt
B̄ =
(4.14)
2B̄(tm − t0 )
2 ∗ 137 ∗ 10
d¯ =
=
= 7, 21
(4.15)
Am−1 + Zm−1
150 + 230
Das heißt, dass ein Teil des Produkts eine mittlere Verweildauer im Lager von 7,21
Wochen hat. Für die Umschlagshäufigkeit ergibt sich
150 + 230
Am−1 + Zm−1
=
U=
= 1, 39
(4.16)
2 ∗ 137
2B̄
Das heißt, dass das Lager in dem Zeitraum der 10 Wochen 1,39 mal umgeschlagen
wird.
Für das Produkt B gilt:
1
940
(30 + 10 + · · · + 140) =
= 94
10
10
Für die mittlere Verweildauer gilt
B̄ =
(4.17)
2B̄(tm − t0 )
2 ∗ 94 ∗ 10
=
= 1, 30
(4.18)
d¯ =
Am−1 + Zm−1
780 + 670
Das heißt, dass ein Teil des Produkts eine mittlere Verweildauer im Lager von 1,30
Wochen hat. Für die Umschlagshäufigkeit ergibt sich
Am−1 + Zm−1
780 + 670
= 7, 71
(4.19)
U=
=
2 ∗ 94
2B̄
Das heißt, dass das Lager in dem Zeitraum der 10 Wochen 7,71 mal umgeschlagen
wird.
Bei diesem Beispiel ist das Produkt A ein Langsamdreher, das heißt es gibt
nicht so viel Bewegung beim Ersatz des Bestandes. Das Produkt B ist dagegen ein
Schnelldreher, die Verweildauer im Lager ist nur kurz.
4.3. Indexzahlen
Indexzahlen beschreiben die Entwicklung von Werten, die in Zeitreihen dargestellt
sind. Bekannte Indizes sind der Verbraucherpreisindex (VPI), der die durchschnittliche Preisentwicklung darstellt, und der Aktienindex DAX (Deutschen Aktien Index).
Dieser Abschnitt orientiert sich an Wewel 2011.
78
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Grundbegriffe
Voraussetzung für eine Indexberechnung ist eine Zeitreihe für die Daten der Beobachtungen eines Merkmals. Zu einem Zeitreihenwert yt zur Berichtsperiode t
und einem Zeitreihenwert y0 zur Basisperiode 0 gibt es eine Messzahl
m0t =
yt
,
y0
(4.20)
welche das Verhältnis der Werte zwischen Berichtsperiode und Basisperiode beschreibt.
Beispiel 4.7 (Energiepreisentwicklung). Ein Industriebetrieb bezieht Energielieferungen in Form von Öl, Gas und Elektrizität. Die Preise der Produkte für das
Basisjahr 0 und für das Berichtsjahr t sind in der Tabelle 4.6 dargestellt.
i
Energie
1
Öl
2
Gas
3 Elektrizität
Preis
Basisjahr
pi0
0,12 [e/l]
0,28 [e/m3 ]
0,08 [e/kWh]
Preis
Berichtsjahr
pit
0,30 [e/l]
0,42 [e/m3 ]
0,06 [e/kWh]
Preismesszahl
pit /pi0
2,50
1,50
0,75
Tabelle 4.6.: Energiepreisentwicklung
Die Preismesszahlen bedeuten, dass der Ölpreis zwischen Basisjahr und Berichtsjahr um den Faktor 2,5, also um 150%, gestiegen ist, der Gaspreis um den Faktor
1,5 (plus 50%). Der Strompreis hat sich um den Faktor 0,75 verändert, ist also
um 25% gesunken.
Für die verschiedenen Produkte (i = 1, 2, 3) gibt es die verschiedenen Preismesszahlen mi0t = pit /p0t .
Definition 4.7 (Indexzahl). Eine Indexzahl (oder kurz Index) I0t ist ein gewichteter Mittelwert (mit den Gewichten gi für i = 1, . . . , n) von gleichartigen
Messzahlen mi0t , die sich auf verschiedene Güter i (i = 1, . . . , n), aber jeweils
auf dieselbe Basisperiode 0 und dieselbe Berichtsperiode t beziehen
I0t =
n
X
gi mi0t .
(4.21)
i=1
Version 5.1 - 013
79
4.3. Indexzahlen
Beispiel 4.8 (Verbraucherpreisindex). Der Verbraucherpreisindex (VPI) ist eine
Index für die Preisentwicklung in Deutschland. Hierzu werden die Preisveränderung für verschiedene Produkte und Dienstleistungen untersucht und ein Index
berechnet. Weitere Informationen dazu findet man bei Statistischen Bundesamt.
(siehe https: // www. destatis. de/ DE/ Meta/ AbisZ/ VPI. html )
Bezüglich der Art des Index gibt es eine Unterscheidung bezüglich der Veränderungen, die betrachtet werden.
Definition 4.8 (Preisindex, Mengenindex, Wertindex, Umsatzindex). Ein Preisindex beschreibt die durchschnittliche Preisentwicklung einer Gütergruppe. Ein
Mengenindex beschreibt die durchschnittliche Mengenentwicklung einer Gütergruppe. Ein Wertindex oder Umsatzindex beschreibt die durchschnittliche
Wert- beziehungsweise Umsatzentwicklung. Er beinhaltet somit Preis- und Mengenkomponenten.
Indizes
Ein Preisindex basiert in der Regel auf einen festen Warenkorb mit n Gütern,
die mit einer festen Menge im Warenkorb enthalten sind. Ein Preisindex P0t beschreibt die Veränderung des Preises des Warenkorbs zwischen Basisperiode 0 und
Berichtsperiode t.
Definition 4.9 (Preisindex). Gegeben seien n Güter mit den festen Gütermengen
qi (i = 1, . . . , n) im Warenkorb. Die Preise sind pi0 für die Basisperiode und pit für
die Berichtsperiode für (i = 1, . . . , n). Daraus ergibt sich der Preisindex mittels
der Preisindex-Formel
Pn
pit qi
.
(4.22)
P0t = Pni=1
i=1 p0t qi
In der Regel werden sich nicht nur Preise ändern, sondern auch der Warenkorb.
Diese Anpassungen können berücksichtigt werden.
Definition 4.10 (Preisindex nach Laspeyres und Preisindex nach Paasche). Gegeben seien n Güter. Die Gütermenge in der Basisperiode 0 sei qi0 (i = 1, . . . , n).
Die Preise sind pi0 für die Basisperiode und pit für die Berichtsperiode für
(i = 1, . . . , n). Daraus ergibt sich der Preisindex nach Laspeyres1 auf Basis der Gütermengen zur Basisperiode
P0tL
1
Pn
pit qi0
.
i=1 pi0 qi0
= Pni=1
(4.23)
Ernst Louis Étienne Laspeyres (1834 - 1913), deutscher Ökonom
80
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Dies kann auch als gewichteter Mittelwert dargestellt werden
P0tL
=
n
X
pit
giL
pi0
i=1
n
X
n
pit qi0
pi0 qi0 pit
.
=
= Pni=1
Pn
i=1 pi0 qi0 pi0
i=1 pi0 qi0
i=1
P
(4.24)
Der Preisindex nach Paasche2 basiert auf den Gütermengen zur Berichtsperiode
Pn
pit qit
P
P0t = Pni=1
.
(4.25)
i=1 pi0 qit
Dies kann als gewichteter harmonischer Mittelwert dargestellt werden
P0tP
n
1
pit qit
1
.
= Pn P pit = Pn P pit qit pi0 = Pni=1
p
q
n
i0
it
i=1 gi pi0
i=1
i=1
pit qit pit
P
(4.26)
i=1
Beispiel 4.9 (Energiepreisentwicklung (Fortsetzung Beispiel 4.7)). In der Tabelle
4.7 sind Mengenveränderungen aufgeführt zwischen Basisperiode und Berichtsperiode aufgeführt. Die Preisänderungen sind in der Tabelle 4.6 dargestellt worden.
i
Energie
1
2
3
Öl
Gas
Elektrizität
Menge
Basisjahr
qi0
70.000 [l]
10.000 [m3 ]
280.000 [kWh]
Menge
Mengenmesszahl
Berichtsjahr
qit
qit /qi0
84.000 [l]
1,20
3
24.000 [m ]
2,40
420.000 [kWh]
1,50
Tabelle 4.7.: Energiemengenentwicklung
Damit können die Preisindizes berechnet werden. Es gelten
0, 30 · 70.000 + 0, 42 · 10.000 + 0, 06 · 280.000
0, 12 · 70.000 + 0, 28 · 10.000 + 0, 08 · 280.000
42.000
=
= 1, 25
33.600
P0tL =
(4.27)
und
0, 30 · 84.000 + 0, 42 · 24.000 + 0, 06 · 420.000
(4.28)
0, 12 · 84.000 + 0, 28 · 24.000 + 0, 08 · 420.000
60.480
=
= 1, 20 .
50.400
Je nach verwendeter Indexvariante sind die Preise für Energie zwischen Basisperiode und Berichtsperiode um 25% oder 20% gestiegen.
P0tP =
2
Hermann Paasche (1851 - 1925), deutscher Ökonom
Version 5.1 - 013
81
4.3. Indexzahlen
Ein Wertindex sind gewichtete Mittelwerte von Mengenmesszahlen. Es wird die
mengenmäßige Veränderungen eines Warenkorbs betrachtet.
Definition 4.11 (Mengenindex). Gegeben seien n Güter mit den festen Preisen
pi (i = 1, . . . , n) im Warenkorb. Die Mengen sind qi0 für die Basisperiode und qit
für die Berichtsperiode für i = 1, . . . , n. Daraus ergibt sich der Mengenindex
mittels der Mengenindex-Formel
Pn
pi qit
.
i=1 pi qi0
Q0t = Pni=1
(4.29)
In der Regel werden sich nicht nur Preise ändern, sondern auch der Warenkorb.
Diese Anpassungen können berücksichtigt werden.
Definition 4.12 (Mengenindex nach Laspeyres und Mengenindex nach Paasche).
Gegeben seien n Güter. Die Preise in der Basisperiode 0 seien pi0 (i = 1, . . . , n).
Die Mengen sind qi0 für die Basisperiode und qit für die Berichtsperiode (i =
1, . . . , n). Daraus ergibt sich der Mengenindex nach Laspeyres auf Basis der
Preise zur Basisperiode
QL0t
Pn
pi0 qit
.
i=1 pi0 qi0
= Pni=1
(4.30)
Der Mengenindex nach Paasche basiert auf den Preisen zur Berichtsperiode
QP0t
Pn
pit qit
.
i=1 pit qi0
= Pni=1
(4.31)
Beispiel 4.10 (Energiepreisentwicklung (Fortsetzung Beispiel 4.7)). Gemäß Tabelle 4.7 und Tabelle 4.6 ergibt sich für den Mengenindex nach Laspeyres
0, 12 · 84.000 + 0, 28 · 24.000 + 0, 08 · 420.000
0, 12 · 70.000 + 0, 28 · 10.000 + 0, 08 · 280.000
50.400
= 1, 5 .
=
33.600
QL0t =
(4.32)
Für den Mengenindex nach Paasche ergibt sich
0, 30 · 84.000 + 0, 42 · 24.000 + 0, 06 · 420.000
0, 30 · 70.000 + 0, 42 · 10.000 + 0, 06 · 280.000
60.480
=
= 1, 44 .
42.000
QP0t =
(4.33)
Bei einem Wert- oder Umsatzindex werden Preis- und Mengenänderungen berücksichtigt.
82
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Definition 4.13 (Wertindex). Gegeben seien n Güter mit den Preisen pi0 in der
Basisperiode und pit in der Berichtsperiode (i = 1, . . . , n) im Warenkorb. Die Mengen sind qi0 für die Basisperiode und qit für die Berichtsperiode für i = 1, . . . , n.
Daraus ergibt sich der Wertindex mittels der Wertindex-Formel
Pn
pit qit
.
i=1 pi0 qi0
W0t = Pni=1
(4.34)
Beispiel 4.11 (Energiepreisentwicklung (Fortsetzung Beispiel 4.7)). Gemäß Tabelle 4.7 und Tabelle 4.6 ergibt sich für den Wertindex
0, 30 · 84.000 + 0, 42 · 24.000 + 0, 06 · 420.000
0, 12 · 70.000 + 0, 28 · 10.000 + 0, 08 · 280.000
60.480
= 1, 8 .
=
33.600
W0t =
(4.35)
Anwendungen
Wenn es eine ökonomische Zeitreihe (das heißt eine Zeitreihe mit ökonomischen
Werten) Ytn gibt, dann ist dies eine Zeitreihe mit nominalen Werten. Wenn
ein geeigneter Preisindex P0t vorhanden ist, dann kann durch die Division Ytr =
Ytn /P0t auf den realen Wert im Bezug zum Basisjahr 0 gerechnet werden. Dies
ist ein Deflationierung.
Beispiel 4.12 (reale Einkommensentwicklung). Das Statistische Bundesamt veröffentlicht Werte zur (nominalen) Einkommensenticklung privater Haushalte. Mit
dem Verbraucherpreisindex (VPI) können die Werte auf reale Einkommenswerte
deflationiert werden, so dass eine reale Einkommensentwicklung dargestellt wird
(siehe Tabelle 4.8).
Jahr Ytn [Mrd.e] V P I2005,t
2005
1463,7
100,0
1493,3
101,6
2006
2007
1517,1
103,9
2008
1558,1
106,6
1560,6
107,0
2009
Ytr [Mrd.e]
1463,7
1469,8
1460,2
1461,6
1458,5
Tabelle 4.8.: Verfügbares Einkommen private Haushalte
Version 5.1 - 013
83
4.4. Aufgaben
4.4. Aufgaben
Aufgabe 4.1. Berechnen Sie für die folgende Zeitreihe die gleitende Durchschnitte
3. Ordnung.
t
xt
1
5
2
7
3
3
4
8
5
10
6 7
6 11
8
13
9 10 11 12
9 14 16 12
Aufgabe 4.2. Berechnen Sie für die folgende Zeitreihe die gleitenden Durchschnitte 4. Ordnung.
t
xt
1
3
2
4
3
6
4
1
5
7
6
8
7
10
8 9
5 11
10 11
12 14
12
9
Aufgabe 4.3. < doppelt >
Aufgabe 4.4. < doppelt >
Aufgabe 4.5. Der Vorrat Bj für ein Produkt hat sich im Laufe mehrerer Tage
wie folgt durch Zu- und Abgänge entwickelt (siehe Tabelle 4.9) (jeweils am Ende
eines Tages wirksam!) Der Anfangsbestand betrug 16 Teile.
Tag
1 3 4 5
Zugang 40 - - Abgang 10 5 8 22
6 8 9 10
- 20 7 4 12 8
Tabelle 4.9.: Bestandsveränderung Vorrat
Zeichnen Sie die Entwicklung des Bestandes. Berechnen Sie den Durchschnittsbestand, die mittlere Verweildauer und die Umschlagshäufigkeit.
Aufgabe 4.6. < doppelt >
Aufgabe 4.7. Bestimmen Sie jeweils den gleitenden Durchschnitt 3. und 4. Ordnung für die nachfolgenden Umsatzangaben einer Firma:
Jahr
Umsatz
84
1997 1998
4,7
5,6
1999 2000
6,2
7,4
2001 2002
7,6
8,9
Version 5.1 - 013
Kapitel 4. Zeitreihenanalysen
Sortimentsbereich
Kleidung
Körperpflege
Sportartikel
Umsatz 2000
[Mio. e]
10,0
5,5
4,5
Steigerung
Umsatz
2000 - 2010
64%
100%
180%
Steigerung
Preis
2000 - 2010
4%
17%
41%
Tabelle 4.10.: Umsatz- und Preisentwicklung
Aufgabe 4.8. Ein Versandhandel führt die Sortimentbereiche Kleidung, Körperpflege und Sportartikel. Die Angaben sind in der Tabelle 4.10 dargestellt.
Berechnen Sie
(a) den Umsatzindex W2000,2010 ,
(b) den Preisindex P2000,2010 nach Laspeyres und Paasche sowie
(c) den Mengenindex Q2000,2010 nach Laspeyres und Paasche.
Aufgabe 4.9. Ein Unternehmen benötigt zur Herstellung seines Produkts drei
Rohstoffe, welche in den Jahren 2000, 2004 und 2008 zu Preisen (pi,t ) in e/t und
Mengen (qi,t ) in t beschafft, die in der nachfolgenden Tabelle hinterlegt sind.
Rohstoff i
1
2
3
pi,2000 pi,2004
3,20
4,00
1,60
2,00
21,00 23,00
pi,2008
4,60
2,40
24,00
qi,2000 qi,2004 qi,2008
5
4,5
5
10
12
15
2
1,8
2,2
Berechnen Sie
(a) die Preisindizes P2000,2004 und P2000,2008 nach Laspeyres und Paasche,
(b) die Mengenindizes Q2000,2004 und Q2000,2008 nach Laspeyres und Paasche,
(c) die Wertinidzes W2000,2004 und W2000,2008 .
Version 5.1 - 013
85
Kapitel 5.
Kombinatorik
Die Kombinatorik bezeichnet den Zweig der Mathematik und Stochastik, in dem
untersucht wird, auf welche und auf wie viele verschiedene Arten gewisse Mengen
von Dingen angeordnet und zu Gruppen zusammengefasst werden können.
Zuerst ein einfaches, überschaubares Beispiel.
Beispiel 5.1. Auf wie viele Weisen kann man 2 Elemente aus einer Menge mit 3
Elementen auswählen?
Es sei M = {1, 2, 3} eine Menge mit drei Elementen. In der Tabelle 5.1 sind die
verschiedenen Möglichkeiten aufgeführt.
mit Zurücklegen
ohne Zurücklegen
geordnet
ungeordnet
(1,1),(1,2),(1,3) {1,1},{1,2},{1,3}
(2,1),(2,2),(2,3) {2,2},{2,3},{3,3}
(3,1),(3,2),(3,3)
(1,2),(1,3),(2,1) {1,2},{1,3},{2,3}
(2,3),(3,1),(3,2)
Tabelle 5.1.: Einführungsbeispiel Kombinatorik
Zwei Sachverhalte sind für die Anzahl der Möglichkeiten von Bedeutung.
• Werden die Elemente nach der Auswahl wieder zur Menge zurückgelegt, und
stehen sie dadurch wieder für die Auswahl zur Verfügung?
• Ist die Reihenfolge der Elemente von Bedeutung?
Version 5.1 - 013
87
5.1. Permutationen
Ist die Reihenfolge von Bedeutung, dann spricht man von einer geordneten
Stichprobe oder Permutation, und die Ergebnisse sind Folgen von Elementen,
die in runde Klammern gesetzt werden. Spielt die Reihenfolge keine Rolle, dann
spricht man von einer ungeordneten Stichprobe oder Kombination, und die
Ergebnisse sind Mengen von Elementen, die in Mengenklammern gesetzt werden.
Die Definition von Mengen besagt, dass jedes Element in einer Menge nur einmal
vorkommt. Wie man an den Beispielen sieht, tauchen dort auch Mengen auf, bei
denen Elemente doppelt vorkommen. Derartige Gebilde heißen Multimengen.
Auf Multimengen wird hier jedoch nicht näher eingehen.
Im folgenden untersuchen wir genauer, wie viele Möglichkeiten es gibt, aus einer
Menge von n (unterscheidbaren) Elementen k Elemente auszuwählen. Dabei gelten
im folgenden stets n ∈ N und k ∈ N0 .
5.1. Permutationen
Bei Permutationen ist die Reihenfolge der Elemente von Bedeutung, wie beispielsweise bei Kennwörtern.
5.1.1. Permutationen mit Wiederholungen
Wie viele Möglichkeiten gibt es, k Elemente aus einer Menge von n Elementen
auszuwählen, wenn die Elemente nach der Auswahl wieder zurückgelegt werden
und die Reihenfolge von Bedeutung ist.
Definition 5.1 (Permutation mit Wiederholung). Es sei M eine Menge mit n
Elementen. Eine k-Permutation mit Wiederholung von M ist eine Folge
(x1 , . . . , xk ) von k Elementen mit xi ∈ M für 1 ≤ i ≤ k.
Mit P ∗ (n, k) wird die Anzahl der k-Permutationen mit Wiederholung bezeichnet,
die aus einer n-elementigen Menge gebildet werden können.
Der hochgestellte Stern (∗ ) hinter dem P drückt aus, dass Wiederholungen der
Elemente möglich sind, das somit die Elemente nach der Auswahl wieder zurück
gelegt werden.
Für das erste Element gibt es n Möglichkeiten. Für das zweite und jedes weitere Element der Reihe gibt es jeweils auch n Möglichkeiten, da das ausgewählte
Element immer wieder zurückgelegt wird. Es gibt somit nk Möglichkeiten für die
Auswahl.
88
Version 5.1 - 013
Kapitel 5. Kombinatorik
Satz 5.2. Die Anzahl P ∗ (n, k) der k-Permutationen mit Wiederholung über einer
Menge mit n Elementen ist
P ∗ (n, k) = nk
(5.1)
Für das Beispiel 5.1 am Anfang des Kapitels ergibt sich P ∗ (3, 2) = 32 = 9.
Beispiel 5.2. Das deutsche Alphabet enthält 26 Buchstaben (ohne Umlaute). Somit kann man P ∗ (26, 4) = 264 = 456.976 Worte der Länge 4 bilden, wobei Buchstaben mehrfach vorkommen können.
5.1.2. Permutationen ohne Wiederholungen
Jetzt der Fall, wenn die gewählten Elemente nicht wieder zurück gelegt werden.
Definition 5.3 (Permutation ohne Wiederholung). Es sei M eine Menge mit n
Elementen mit 0 ≤ k ≤ n). Eine k-Permutation ohne Wiederholung von M
ist eine Folge (x1 , . . . , xk ) mit xi ∈ M mit xi 6= xj für i 6= j, mit 1 ≤ i, j ≤ k.
Mit P (n, k) wird die Anzahl der k-Permutationen ohne Wiederholung bezeichnet,
die aus einer n-elementigen Menge gebildet werden können.
Manchmal wird statt P (n, k) auch Vkn geschrieben.
Wenn die ausgewählten Elemente nicht mehr zurückgelegt werden, dann gibt es
bei der ersten Auswahl n Möglichkeiten. Bei der zweiten Auswahl jedoch nur noch
(n−1) Möglichkeiten der Auswahl. Bei der k-ten Auswahl dann nur noch (n−k+1)
Möglichkeiten ein Element aus der Menge zu wählen. Somit gibt es
n · (n − 1) · . . . · (n − k + 1)
(5.2)
Möglichkeiten der Auswahl.
Satz 5.4. Die Anzahl P (n, k) der k-Permutationen ohne Wiederholung über einer
n-elementigen Menge ist
P (n, k) =
k−1
Y
(n − i) =
i=0
n!
(n − k)!
Für das Beispiel 5.1 am Anfang des Kapitels ergibt sich P (3, 2) =
(5.3)
3!
1!
=
6
1
= 6.
Ein Spezialfall sind die n-Permutationen auf einer n-elementigen Menge, das heißt
die Permutationen, bei denen jedes der Elemente der Menge in der Permutation
enthalten ist. Davon gibt es P (n, n) = n! Möglichkeiten.
Version 5.1 - 013
89
5.2. Kombinationen
Satz 5.5. Es gibt n! Möglichkeiten, eine Menge mit n Elementen anzuordnen.
Beispiel 5.3. Das deutsche Alphabet enthält 26 Buchstaben (ohne Umlaute). Somit kann man P (26, 4) = 26 ∗ 25 ∗ 24 ∗ 23 = 358.800 Worte der Länge 4 bilden,
wobei Buchstaben nicht mehrfach vorkommen können.
Beispiel 5.4. Es gibt 10! = 3.628.800 ≈ 3, 6 · 106 verschiedene Möglichkeiten, 10stellige Zahlen zu bilden, bei denen jede der 10 Ziffern genau einmal vorkommt.
Zahlen mit 10 Ziffern gibt es 1010 .
Beispiel 5.5. Wie viele verschiedene Buchstabenkombinationen der Länge 4 lassen
sich aus den Buchstaben ABCC gebildet werden. 4 Buchstaben lassen sich auf 4!
= 24 verschiedene Arten darstellen. Der Buchstabe C kommt zwei mal vor. Da die
C’s nicht unterschieden werden können, kann man diese beiden Vertauschen. Es
gibt 2! Möglichkeiten für die Vertauschung der Buchstaben C. Damit gibt es nur
4!/2! = 12 Möglichkeiten der Darstellung.
Diese Überlegungen weiter geführt, führt zum nachfolgenden Satz:
Satz 5.6. Die Anzahl P (n; n1 , n2 , . . . , nk ) von Permutationen von n Elementen
von denen jeweils n1 , n2 , . . ., nk , 1 ≤ k ≤ n, ununterscheidbar sind, so dass
Pk
i=1 ni = n ist, ist
n!
i=1 (ni !)
(5.4)
P (n; n1 , n2 , . . . , nk ) = Qk
Für unser obiges Beispiel ergibt sich P (4; 1, 1, 2) =
4!
1!1!2!
=
24
2
= 12.
5.2. Kombinationen
Bei den Permutationen spielt die Reihenfolge der Elemente eine Rolle. Wenn die
Reihenfolge keine Rolle spielt, dann spricht man von Kombinationen.
5.2.1. Kombination ohne Wiederholungen
Wie viele Möglichkeiten gibt es, aus einer Menge von n Elementen Teilmengen
von k Elementen auszuwählen. Auf die Reihenfolge der Auswahl kommt es hierbei
nicht an.
90
Version 5.1 - 013
Kapitel 5. Kombinatorik
Definition 5.7 (Kombination ohne Wiederholung). Es sei M eine Menge mit n
Elementen. Eine k-Kombination ohne Wiederholung über M ist eine Teilmenge von M mit k Elementen ohne Wiederholung.
Mit K(n, k) wird die Anzahl der k-Kombination ohne Wiederholung über M bezeichnet
Manchmal schreibt man statt K(n, k) auch Ckn .
Aus den Überlegungen der Permutationen kann die Anzahl der Kombinationen ermittelt werden. Es gibt P (n, k) geordnete k-Permutationen über einer nelementigen Menge. Es gibt P (k, k) = k! Möglichkeiten, die k gezogenen Elemente anzuordnen. Jede dieser Anordnungen ist für die Kombination gleichwertig. (Nebenbemerkung: Diese bilden eine Äquivalenzrelation!). Damit gilt
P (n, k)/P (k, k) = K(n, k)
Satz 5.8. Die Anzahl K(n, k) der Kombinationen ohne Wiederholung über einer
Menge mit n Elementen ist
!
n
n!
=
K(n, k) =
k!(n − k)!
k
Für das Beispiel am Anfang des Kapitels ergibt sich K(3, 2) =
(5.5)
3!
2!1!
=
6
2
= 3.
Das Symbol nk (ausgesprochen n über k ist eine Vereinfachung der Schreibweise
und heißt auch Binominalkoeffizient, was später noch beleuchtet wird.
Beispiel 5.6. Beim Lotto „6 aus 49“ spielt die Reihenfolge der gezogenen Kugeln
keine Rolle. Somit ist es eine Kombination. Es gibt keine Wiederholungen, da die
Kugeln nicht wieder zurückgelegt werden. Es gibt
K(49, 6) =
49!
= 13.983.816
6!43!
(5.6)
verschiedene Möglichkeiten 6 der 49 Kugeln zu ziehen.
5.2.2. Kombination mit Wiederholungen
Wenn Wiederholungen zulässig sind, dann wird es etwas komplizierter.
Version 5.1 - 013
91
5.3. Binomialkoeffizienten
Definition 5.9 (Kombination mit Wiederholung). Es sei M eine Menge mit n
Elementen und für k gilt: 0 ≤ k ≤ n. Eine k-Kombination mit Wiederholung
über M ist eine Multimenge von M mit k Elementen.
Mit K ∗ (n, k) wird die Anzahl der k-Kombination mit Wiederholung über M bezeichnet
Um die Anzahl K ∗ (n, k) der k-Kombinationen mit Wiederholung über einer nelementigen Menge zu bestimmen, werden bereits am Anfang die (k −1) Elemente,
die im Laufe des Prozesses zurück gelegt werden, zur Menge hinzugefügt. Somit
ergibt sich eine k-Kombination ohne Zurücklegen auf einer (n + k − 1)-elementigen
Menge. Diese Anzahl der Kombinationen wurde bereits berechnet.
Satz 5.10. Die Anzahl K ∗ (n, k) von k-Kombinationen mit Wiederholung über
einer n-elementigen Menge ist
!
n+k−1
(n + k − 1)!
=
K (n, k) = K(n + k − 1, k) =
k!(n − 1)!
k
∗
Für das Beispiel 5.1 am Anfang des Kapitels ergibt sich K ∗ (3, 2) =
4!
2!2!
(5.7)
=
24
4
= 6.
Beispiel 5.7. Wie viele Kombinationen kann man mit 4 Würfeln würfeln? Jeder Würfel hat die Zahlen 1 bis 6. Statt einmal mit 4 Würfeln zu Würfeln kann
man auch mit einem Würfel 4 mal hinter einander würfeln. Es ist somit eine 4Kombination mit Wiederholung über einer 6-elementigen Menge. Die Anzahl ist
9!
= 4!5!
= 126.
somit K ∗ (6, 4) = (6+4−1)!
4!(6−1)!
5.2.3. Zusammenfassung Permutationen und Kombinationen
Die Zusammenfassung für Permutationen und Kombinationen gibt die Tabelle
5.2.
5.3. Binomialkoeffizienten
In diesem Abschnitt werden einige Eigenschaften und Ergebnisse für die Binomialkoeffizienten zusammengefasst.
Die Definition des Binomialkoeffizienten oder genauer eine Definition der Binomialkoeffizienten lautet:
92
Version 5.1 - 013
Kapitel 5. Kombinatorik
mit Zurücklegen
Permutation
geordnet
Kombination
ungeordnet
P ∗ (n, k)
K ∗ (n, k)
!
n+k−1
(n+k−1)!
= k!(n−1)! =
k
= nk
ohne Zurücklegen
P (n, k)
=
n!
(n−k)!
K(n, k)
n
= k!
k
!
=
n!
k!(n−k)!
n
=
k
!
Tabelle 5.2.: Zusammenfassung Permutationen und Kombinationen
!
n
n!
=
k! · (n − k)!
k
(5.8)
Wenn dieser Ausdruck auf der rechten Seite betrachtet wird, und einige Zahlen
gekürzt werden, dann ergibt sich:
!
n · (n − 1) · . . . · (n − k + 1)
n
=
1 · 2 · ... · k
k
(5.9)
An dieser Form der Definition kann man erkennen, dass die Binomialkoeffizienten
stets ganze Zahlen sind!
Einige grundlegende Eigenschaften für die Binomialkoeffizienten. Es gelten:
!
!
n
n
=
=1
0
n
!
!
n
n
=
=n
1
n−1
!
n
n
=
n−k
k
Version 5.1 - 013
(5.10)
(5.11)
!
(5.12)
93
5.3. Binomialkoeffizienten
Ist k 6= 0 und k 6= n (n ∈ N und k ∈ N0 mit k < n), dann gilt:
!
!
!
n
n−1
n−1
=
+
k
k
k−1
(5.13)
womit man eine rekursive Formel zur Berechnung der Binomialkoeffizienten hat.
Dies führt zum so genannten Pascalschen Dreieck1 . Für die maschinelle Berechnung
ist diese Formel jedoch nicht ideal!
Hier ist nun der Beginn des Pascalschen Dreieck dargestellt:
1
1
1
1
1
1
1
2
1
3
4
5
6
1
3
6
4
10
15
1
1
10
20
5
15
1
6
1
Die Rekursionsformel kann schnell und direkt nachgewiesen werden:
Satz 5.11. Ist k 6= 0 und k 6= n (n ∈ N und k ∈ N0 mit k < n), dann gilt:
!
!
!
n
n−1
n−1
=
+
k
k
k−1
(5.14)
Beweis
!
!
(n − 1)!
(n − 1)!
n−1
n−1
+
+
=
k!(n − k − 1)! (k − 1)!(n − k)!
k
k−1
(n − 1)!
1
1
=
·( +
)
(k − 1)!(n − k − 1)! k n − k
(n − 1)!
n
=
·(
)
(k − 1)!(n − k − 1)! k · (n − k)
!
n!
n
=
=
k!(n − k)!
k
1
(5.15)
Blaise Pascal, französischer Philosoph, Mathematiker und Physiker, 1623 - 1662
94
Version 5.1 - 013
Kapitel 5. Kombinatorik
Für das Produkt (a + b)n ergibt sich
(a + b)n =
n
X
!
n n−k k
a b .
k
k=0
(5.16)
Dies ist die verallgemeinerte binomische Formel. Daher haben die Koeffizienten
auch ihren Namen. Daraus wiederum ergeben sich:
n
(1 + x) =
n
X
!
n k
x
k
k=0
(5.17)
und
2n =
n
X
!
n
k
k=0
(5.18)
und
n
X
n
(−1) ·
0=
k
k=0
!
k
(5.19)
Die beiden letzten Eigenschaften können am obigen Pascalschen Dreieck für kleine
n einfach nachgerechnet werden.
Weiter wird auf die Binomialkoeffizienten nicht eingegangen.
5.4. Aufgaben
Aufgabe 5.1. Bestimmen Sie alle Möglichkeiten die Elemente einer Menge mit
n = 1, n = 2, n = 3 und n = 4 anzuordnen.
Aufgabe 5.2. Wie viele verschiedene Buchstabenkombinationen der Länge 9 lassen sich mit den Buchstaben des Wortes STATISTIK bilden?
Aufgabe 5.3. Wie viele verschiedene Buchstabenkombinationen der Länge 11 lassen sich aus den Buchstaben des Wortes MISSISSIPPI bilden?
Aufgabe 5.4. Ein Passwort besteht aus zwei (von 26 möglichen) Buchstaben gefolgt von vier Ziffern, wobei Ziffern, aber nicht Buchstaben mehrfach auftreten
dürfen. Wie viele verschiedene Passwörter sind möglich?
Aufgabe 5.5. Bei 5 Personen, wie viele Möglichkeiten gibt es, dass sich eine
Mehrheit (aus 5, 4 oder 3 Personen) bildet?
Version 5.1 - 013
95
5.4. Aufgaben
Aufgabe 5.6. Wie viele 8-stellige Worte können mit den Elementen der Menge
A = {0, 1} gebildet werden.
Aufgabe 5.7. < doppelt >
Aufgabe 5.8. < doppelt >
Aufgabe 5.9. Wie viele Zahlenkombinationen kann man mit 1, 2, 3, 4, 5 und 6
Würfeln würfeln?
Aufgabe 5.10. Ein Passwort ist 7 Zeichen lang. Es besteht aus Buchstaben (26
mögliche Buchstaben) und Ziffern. In den ersten drei Zeichen dürfen nur Buchstaben stehen, die sich nicht wiederholen. Die restlichen 4 Stellen sind beliebige
Buchstaben oder Ziffern, wobei auch die Buchstaben aus den ersten 3 Stellen wiederholt werden dürfen. Wie viele verschiedene Passwörter sind möglich?
Aufgabe 5.11. Wie groß ist die Wahrscheinlichkeit beim Spiel "6 aus 45"5 Richtige zu haben?
Aufgabe 5.12. Bestimmen Sie die Wahrscheinlichkeiten, dass Sie n-mal hintereinander die selbe Zahl würfeln.
Aufgabe 5.13. In einer Urne befinden sich 12 blaue und 8 gelbe Kugeln. Es werden nacheinander ohne Zurückziehen zwei Kugeln gezogen. Wie groß ist die Wahrscheinlichkeit, beim dritten Zug eine gelbe Kugel zu ziehen, unter der Bedingung,
dass
(a) beim ersten Zug eine blaue Kugel gezogen wird?
(b) beim ersten Zug eine gelbe Kugel gezogen wird?
96
Version 5.1 - 013
Kapitel 6.
Grundlagen der
Wahrscheinlichkeitsrechnung
Die Wahrscheinlichkeitsrechnung bringt den Zufall und zufällige Ereignisse mit in
die Betrachtung. Die Wahrscheinlichkeitsrechnung beschäftigt sich mit zufälligen
Ereignissen. Ihre Ergebnisse werden in vielen Bereichen außerhalb der Mathematik
abgewendet. Prognose für eine Wahl, Qualitätssicherung und Bestimmung von
Schätzungen sind nur einige dieser Themen.
6.1. Zufallsexperiment und Ereignis
Definition 6.1 (Zufallsexperiment, Elementarereignis, Ergebnisraum). Ein Zufallsexperiment ist ein beliebig oft und gleichartig wiederholbarer Vorgang mit
mindestens zwei möglichen Ergebnissen, bei dem im voraus nicht eindeutig bestimmbar ist, welches Ergebnis eintreten wird. Ein mögliches Ergebnis eines Zufallsexperiments heißt Ereignis.
Die einzelnen, nicht mehr zerlegbaren und sich gegenseitig ausschließenden Ereignisse eines Zufallsexperiments heißen Elementarereignis. Sie werden mit ω1 ,
ω2 , . . . bezeichnet. Die Menge Ω aller zu einem Zufallsexperiment gehörenden Elementarereignisse heißt Ergebnisraum:
Ω = {ω1 , ω2 , . . . , ωn }
(6.1)
Beispiel 6.1. Der Wurf einer Münze, mit den Seiten Zahl und Wappen, ist ein
Zufallsexperiment. Es gibt die zwei Elementarereignisse ω1 = Zahl und ω2 = Wappen.
Beispiel 6.2. Das Würfeln ist ein Zufallsexperiment. Der Ergebnisraum sind die
6 verschiedenen Möglichkeiten für das Ergebnis: Ω = {1, 2, 3, 4, 5, 6}.
Version 5.1 - 013
97
6.1. Zufallsexperiment und Ereignis
Definition 6.2 (zusammengesetze Ereignisse, Durchschnitt). Es seien A und B
zwei Ereignisse in einem Ergebnisraum Ω.
Unter dem zusammengesetzten Ereignis A ∪ B oder A or B der Ereignisse
A und B versteht man das Ereignis, das dann eintritt, wenn wenigstens eine der
beiden Ereignisse A und B eintritt.
Unter dem Durchschnitt A ∩ B oder A and B der Ereignisse A und B versteht
man das Ergebnis, das Eintritt, wenn sowohl A als auch B eintritt, wenn also A
und B gemeinsam eintreten.
Beispiel 6.3. Beim Würfeln sei A das Ereignis, dass eine gerade Zahl gewürfelt
wird. Somit ist A = {2, 4, 6}. B sei das Ereignis, dass die gewürfelte Zahl kleiner
4 ist. Somit ist B = {1, 2, 3}. Damit ist das zusammengesetzte Ereignis A ∪ B
das Ereignis, wenn der Würfel eine gerade Zahl oder ein Zahl kleiner 4 anzeigt:
A ∪ B = {1, 2, 3, 4, 6}. Der Durchschnitt der Ereignisse ist das Ereignis, wenn die
gewürfelte Zahl gerade und kleiner 4 ist: A ∩ B = {2}.
Definition 6.3 (Komplementärereignis, sicheres Ereignis, unmögliches Ereignis,
disjunkte Ereignisse). Es sei A ein Ereignis. Das Ereignis, das genau dann eintritt,
wenn A nicht eintritt, heißt das zu A komplementäre Ereignis oder Komplementärereignis von A und wird mit Ā bezeichnet. Ein Ereignis, das immer
eintritt, heißt sicheres Ereignis und wird mit Ω bezeichnet. Ein Ereignis, das
nie eintritt, heißt unmögliches Ereignis und wird mit ∅ bezeichnet. Gilt für
zwei Ereignisse A und B, dass deren Durchschnitt das unmögliche Ereignis ist
(A ∩ B = ∅), so heißen A und B disjunkte Ereignisse
Beispiel 6.4. Beim Würfeln seien A das Ereignis, dass eine gerade Zahl gewürfelt wird und B das Ereignis, dass eine ungerade Zahl gewürfelt wird. Die beiden
Ereignisse sind komplementär zueinander. Es gilt somit Ā = B und B̄ = A. Das
zusammengesetzte Ereignis A ∪ B ist das sichere Ereignis Ω, denn die gewürfelte
Zahl ist entweder gerade oder ungerade. Der Durchschnitt A ∩ B der beiden Ereignisse A und B ist das unmögliche Ereignis, da das Ergebnis beim Würfel nicht
gleichzeitig gerade und ungerade sein kann. Somit sind A und B auch disjunkte
Ereignisse.
Nach diesen grundlegenden Definitionen wird nun der Begriff der Wahrscheinlichkeit definiert. Es gibt dabei viele verschiedenen Varianten für die Definition. Die
Definition geht auf Laplace 1 zurück.
Definition 6.4 (Wahrscheinlichkeit). Gegeben seien ein Ereignis A eines Zufallsexperiments, die Anzahl der für das Eintreffen von A günstigen Fälle (beziehungsweise der zu A gehörenden Elementarereignisse) und die Anzahl aller möglichen
1
Pierre Simon Laplace (1749-1827), französischer Naturwissenschaftler
98
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
Fälle. Für die Wahrscheinlichkeit P (A) für das Eintreten des Ereignissen A
gilt dann:
P (A) =
Anzahl der f ür das Ereignis A günstigen F älle
Anzahl aller möglichen F älle
(6.2)
Beispiel 6.5. Die Wahrscheinlichkeit, dass beim Werfen einer Münze die Seite
Zahl kommt ist 12 oder 50% oder 0, 50.
Beispiel 6.6. Beim Würfeln ergeben sich folgende Wahrscheinlichkeiten:
P(gerade) = 12 , P({1}) = 61 , P(ungerade und kleiner 4) = 13 .
Die Erkenntnisse aus den Beispielen wird nun allgemeiner formuliert und die Wahrscheinlichkeit genauer definiert. Dies wurde erstmals vom Kolmogorov 2 formuliert.
Es seien Ω ein Ereignisraum und Z(Ω) das Ereignissystem, das bedeutet, die
Menge der möglichen Ereignisse im Ereignisraum
Z(Ω) = {A | A ⊆ Ω}.
(6.3)
Ein Wahrscheinlichkeitsmaß ist eine Abbildung
P : Z(Ω) → R
(6.4)
mit den nachfolgenden Eigenschaften:
• Axiom 1 (Nicht-Negativität) Die Wahrscheinlichkeit ist nicht-negativ:
∀A ∈ Z(Ω) : P (A) ≥ 0
(6.5)
• Axiom 2 (Normierung): Die Wahrscheinlichkeit ist normiert:
P (Ω) = 1
(6.6)
• Axiom 3 (Additivität) Für zwei disjunkte Ereignisse A und B ist die
Wahrscheinlichkeit additiv:
∀A, B ∈ Z(Ω), A ∩ B = ∅ : P (A ∪ B) = P (A) + P (B)
(6.7)
Aus diesen Axiomen ergeben sich direkt einige Konsequenzen, die auf Basis der
Axiome bewiesen werden können.
2
Andrej Nikolajevich Kolmogorov (1903 - 1987), russischer Mathematiker
Version 5.1 - 013
99
6.1. Zufallsexperiment und Ereignis
• Satz zur Wahrscheinlichkeit Komplementärereignis
∀A ∈ Z(Ω) : P (A) = 1 − P (A)
(6.8)
• Folgerung Wahrscheinlichkeit der leeren Menge
P (∅) = 0
(6.9)
• Satz zur Wahrscheinlichkeit der Differenz
∀A, B ∈ Z(Ω) : P (A\B) = P (A) − P (A ∩ B)
(6.10)
• Additionssatz für zwei beliebige Ereignisse
∀A, B ∈ Z(Ω) : P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
(6.11)
• Satz über die Wahrscheinlichkeit von Teilereignissen
∀A, B ∈ Z(Ω) : A ⊆ B ⇒ P (A) ≤ P (B)
(6.12)
• Additionsgesetz für disjunkte Ereignisse :
∀Ai ∈ Z(Ω), paarweise disjunkt : P (
n
[
i=1
Ai ) =
n
X
P (Ai )
(6.13)
i=1
Definition 6.5 (Wahrscheinlichkeitsraum). Eine Menge Ω mit einer Funktion P
mit den obigen Regeln heißt ein Wahrscheinlichkeitsraum.
Bei manchen Problemen der Wahrscheinlichkeitsrechnung betrachtet man das Eintreten von Ereignissen in Abhängigkeit von anderen Ereignissen.
Beispiel 6.7. Aus einer Urne mit 5 roten und 3 grünen Kugeln werden nacheinander zwei Kugeln zufällig entnommen. R1, R2, G1 und G2 bezeichnen die
Ereignisse, dass Rot beziehungsweise Grün beim ersten beziehungsweise zweiten
Zug erscheint. Nach der Definition der Wahrscheinlichkeit ergibt sich P (R1) = 58
und P (G1) = 38 .
Nach dem ersten Zug befinden sich noch 7 Kugeln in der Urne. Die Wahrscheinlichkeit beim zweiten Zug eine grüne Kugel zu ziehen, hängt nun von der Farbe der
zuerst gezogenen Kugel ab. Die Wahrscheinlichkeit für G2 unter der Bedingung R1
ergibt sich zu P (G2|R1) = 73 . Die Wahrscheinlichkeit für G2 unter der Bedingung
G1 ergibt sich zu P (G2|G1) = 27 .
100
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
Definition 6.6 (bedingte Wahrscheinlichkeit). Die bedingte Wahrscheinlichkeit (die Wahrscheinlichkeit von B unter der Bedingung A) P (B|A) ist die Wahrscheinlichkeit für das Eintreten des Ereignisses B unter der Voraussetzung, dass
das Ereignis A bereits eingetreten ist. Es gilt:
P (B|A) =
P (A ∩ B)
für P (A) > 0
P (A)
(6.14)
Sie heißt auch konditionale Wahrscheinlichkeit
Zwei Ereignisse A und B sind voneinander unabhängig, wenn die Wahrscheinlichkeit für das Auftreten von A nicht vom Ereignis B abhängt. Entsprechend sind die
Ereignisse abhängig, wenn die Wahrscheinlichkeit für das Auftreten des Ereignisses
B davon abhängt, ob das Ereignis A eingetreten ist oder nicht.
Definition 6.7 (stochastisch unabhängig, stochastisch abhängig). Die Ereignisse
A und B sind genau dann stochastisch unabhängig , wenn gilt P (B|A) =
P (B|Ā) oder P (A|B) = P (A|B̄). Gilt jedoch P (B|A) 6= P (B|Ā) oder P (A|B) 6=
P (A|B̄), so sind die Ereignisse stochastisch abhängig .
Beispiel 6.8. In einer Urne befinden sich 20 rote und 30 grüne Kugeln. 5 rote und
10 grüne Kugel sind mit einer 1 beschriftet. Mit R, G beziehungsweise E werden
die Ereignisse rote Kugel, grüne Kugel beziehungsweise Kugel mit 1 bezeichnet.
Es ergibt sich die in der Tabelle 6.1 aufgezeigte Verteilung:
E
Ē
R
5
15 20
G
10 20 30
gesamt 15 35 50
Tabelle 6.1.: Beispiel 6.8
Nach der Definition der bedingten Wahrscheinlichkeit gilt: P (E|R) =
5/50
20/50
1
4
P (E∩R̄)
P (R̄)
10/50
30/50
P (E∩R)
P (R)
=
1
.
3
= und P (E|R̄) =
=
=
Daraus ergibt sich, dass die beiden
Ereignisse E und R stochastisch abhängig sind.
In der Tabelle 6.1 im Beispiel 6.8 sind die Absolutzahlen angegeben. Wird durch die
Gesamtanzahl dividiert, dann erhält man die Wahrscheinlichkeiten (siehe Tabelle
6.2).
Version 5.1 - 013
101
6.1. Zufallsexperiment und Ereignis
A
Ā
B
P (A ∩ B) P (A ∩ B)
P (B)
B
P (A ∩ B) P (Ā ∩ B̄)
P (B)
P (A)
P (A)
1
Tabelle 6.2.: Wahrscheinlichkeit bei zwei Ereignissen
M
M̄
S
0,6
0,1 0,7
S̄
0,2
0,1
0,8
0,2 1,0
0,3
Tabelle 6.3.: Beispiel 6.9
Beispiel 6.9. Ein Student besteht die Klausur in Statistik (Ereignis S) mit der
Wahrscheinlichkeit 0,7 und in Finanzmathematik (Ereignis M) mit der Wahrscheinlichkeit 0,8. Die Wahrscheinlichkeit für das Bestehen beiden Klausuren beträgt 0,6.
Es gelten
P (S|M ) =
0, 6
P (S ∩ M )
=
= 0, 75
P (M )
0, 8
(6.15)
P (S|M̄ ) =
P (S ∩ M )
0, 1
=
= 0, 5.
0, 2
P (M )
(6.16)
und
Da P (S|M ) 6= P (S|M ) gilt, sind S und M abhängig. Die Wahrscheinlichkeit,
wenigstens eine Klausur zu bestehen, ist
P (S ∪ M ) = P (S) + P (M ) − P (S ∩ M ) = 0, 7 + 0, 8 − 0, 6 = 0, 9
(6.17)
Aus der Definition für die bedingte Wahrscheinlichkeit ergibt sich:
Satz 6.8. Für zwei Ereignisse A und B (mit P (A) > 0 und P (B) > 0) gelten
P (A ∩ B) = P (A) · P (B|A) = P (B) · P (A|B).
(6.18)
Insbesondere gilt für zwei unabhängige Ereignisse
P (A ∩ B) = P (A) · P (B).
102
(6.19)
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
6.2. Zusammen gesetzte Aufgaben
Im folgenden werden zusammen gesetzte Aufgaben betrachtet, bei denen sowohl
Durchschnitt und Vereinigung von Ereignissen vorkommen. Für die Visualisierung
der Beispiele werden Komponenten verwendet, die eine bestimmte Verfügbarkeit
haben. Diese Komponenten werden auf verschiedene Art und Weise zu einem Aggregat zusammen gesetzt, wobei die Komponenten sowohl hintereinander oder parallel sein können.
Betrachten wir nun ein Aggregat (A), welches aus 2 Komponenten (K1 und K2 )
besteht, die hintereinander geschaltet sind (siehe Abbildung 6.1).
A
K1
K2
Abbildung 6.1.: Zwei Komponenten hintereinander
Die beiden Komponenten K1 und K2 haben die Wahrscheinlichkeiten P (Ki ) =
pi (i = 1,2), dass die Komponente funktioniert, wobei die Funktionalität einer
Komponente nicht von der Funktionalität der anderen Komponente abhängt. Das
bedeutet, dass die Wahrscheinlichkeiten unabhängig voneinander sind. Wie sieht
nun die Wahrscheinlichkeit p = P (A) aus, dass das Aggregat funktioniert. Die
Hintereinanderschaltung bedeutet, dass das Aggregat nur funktioniert, wenn beide
Komponenten funktionieren. Es gilt
p = P (A) = P (K1 and K2 ) = P (K1 ) · P (K2 ) = p1 · p2
(6.20)
Beispiel 6.10. Ein Aggregat A besteht aus zwei Komponenten K1 und K2 mit
den jeweiligen Wahrscheinlichkeiten P (Ki ) = pi = 0, 9 (i = 1,2), dass die Komponenten funktioniert. Das Aggregat funktioniert nur, wenn beide Komponenten
funktionieren (K1 and K2 ). Damit gilt
p = P (A) = P (K1 ) · P (K2 ) = p1 · p2 = 0, 9 · 0, 9 = 0, 81 .
(6.21)
Das bedeutet, dass die Wahrscheinlichkeit für das Funktionieren des Aggregates bei
0,81 ist.
Beispiel 6.11. Eine Nachricht muss von einem Ausgangspunkt A zu einem Endpunkt E transportiert werden. Die gesamte Strecke ist durch einen Zwischenpunkt
Version 5.1 - 013
103
6.2. Zusammen gesetzte Aufgaben
Z in zwei Teilstrecken AZ und ZE geteilt. Die Wahrscheinlichkeit dafür, dass eine
Nachricht, die in A aufgegeben wird in Z ankommt beträgt P (AZ) = 0, 7. Davon
unabhängig ist die Wahrscheinlichkeit, dass eine Nachricht, die in Z aufgegeben
wird in E ankommt, diese Wahrscheinlichkeit beträgt P (ZE) = 0, 6. Damit ergibt
sich für die Wahrscheinlichkeit, dass eine Nachricht E erreicht, wenn sie in A los
gesendet wird zu
P (AE) = P (AZ and ZE) = P (AZ) · P (ZE) = 0, 7 · 0, 6 = 0, 42
(6.22)
Zuerst wird ein Aggregat A betrachtet, das aus n unabhängigen Komponenten K1 ,
K2 , . . ., Kn , die hinter einander geschaltet sind (siehe Abbildung 6.2) betrachtet.
Das Aggregat funktioniert also nur, wenn alle Komponenten funktionieren.
A
K1
K2
Kn
Abbildung 6.2.: Mehrere Komponenten hintereinander
Es seien P (Ki ) = pi für (i = 1, 2, . . . , n) die Wahrscheinlichkeiten, dass die Komponente Ki funktioniert. Es gilt dann
p = P (A) = P (K1 and K2 and . . . and Kn )
= P (K1 ) · P (K2 ) · . . . · P (Kn ) = p1 · p2 · . . . · pn
(6.23)
Satz 6.9. Es seien Ki (i = 1, 2, . . . , n) unabhängige Ereignisse, die hintereinander geschaltet sind (durch and zusammengesetzt). Die Wahrscheinlichkeiten seien
P (Ki ) = pi (i = 1, 2, . . . , n) für die Ereignisse Ki , dann gilt
P (K1 and K2 and . . . and Kn ) =
n
Y
pi
(6.24)
i=1
Nun wird die Situation betrachtet, dass die Komponenten nicht hintereinander,
sondern parallel geschaltet sind. Dies bedeutet, dass das Aggregat, das aus den
Komponenten zusammen gesetzt ist, funktioniert, wenn mindestens eine Komponente funktioniert.
Zuerst wird ein Aggregat (A) betrachtet, welches aus 2 Komponenten (K1 und
K2 ) besteht, die parallel geschaltet sind (siehe Abbildung 6.3).
104
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
A
K1
K2
Abbildung 6.3.: Zwei Komponenten parallel
Die beiden Komponenten K1 und K2 haben die Wahrscheinlichkeiten P (Ki ) =
pi (i = 1,2), dass die Komponente funktioniert, wobei die Funktionalität einer
Komponente nicht von der Funktionalität der anderen Komponente abhängt. Das
bedeutet, dass die Wahrscheinlichkeiten unabhängig voneinander sind. Wie sieht
nun die Wahrscheinlichkeit p = P (A) aus, dass das Aggregat funktioniert. Die
Parallelschaltung bedeutet, dass das Aggregat funktioniert, wenn mindestens eine
Komponenten funktioniert. Es gilt, mit Hilfe des Additionsgesetzes
p = P (A) = P (K1 or K2 ) = P (K1 ) + P (K2 ) − P (K1 and K2 )
= P (K1 ) + P (K2 ) − P (K1 ) · P (K2 ) = p1 + p2 − p1 · p2
(6.25)
Nun wird ein Aggregat (A) betrachtet, welches aus 3 Komponenten (K1 , K2 und
K3 ) besteht, die parallel geschaltet sind (siehe Abbildung 6.4).
Wenn mit dem Additionsgesetz gearbeitet wird, was durchaus machbar ist, so
wachsen die Terme und die Umformungen. Auch wenn man noch mehr Komponenten berücksichtigt, wächst dieser Aufwand. Wechseln wir den Blickwinkel. Das Aggregat funktioniert, wenn eine der Komponenten funktioniert, das Aggregat funktioniert nicht, wenn alle Komponenten nicht funktionieren. Damit haben wir eine
and-Verbindung. Wichtig ist dabei, dass für ein Ereignis A gilt: P (A) = 1 − P (A).
Wenden wir diesen neuen Blickwinkel zuerst nochmal bei 2 Komponenten an, um
zu sehen, ob das Ergebnis richtig heraus kommt.
Version 5.1 - 013
105
6.2. Zusammen gesetzte Aufgaben
A
K1
K2
K3
Abbildung 6.4.: Drei Komponenten parallel
p = P (A) = P (K1 or K2 )
(6.26)
= 1 − P (K1 or K2 )
= 1 − P (K1 and K2 )
= 1 − P (K1 ) · P (K2 )
= 1 − (1 − P (K1 )) · (1 − P (K2 ))
= 1 − (1 − p1 ) · (1 − p2 )
= p1 + p2 − p1 · p 2
Jetzt für 3 Komponenten.
p = P (A) = P (K1 or K2 or K3 )
(6.27)
= 1 − P (K1 or K2 or K3 )
= 1 − P (K1 and K2 and K3 )
= 1 − P (K1 ) · P (K2 ) · P (K3 ))
= 1 − (1 − P (K1 )) · (1 − P (K2 )) · (1 − P (K3 ))
= 1 − (1 − p1 ) · (1 − p2 ) · (1 − p3 )
= p1 + p2 + p3 − p 1 · p2 − p1 · p3 − p2 · p3 + p1 · p2 · p 3
Jetzt werden gleich n Komponenten (Ki ) mit den Wahrscheinlichkeiten P (Ki ) = pi
(i = 1, 2, . . . , n) betrachtet, die parallel geschaltet sind (siehe Abbildung 6.5).
106
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
A
K1
K2
..
.
Kn
Abbildung 6.5.: Mehrere Komponenten parallel
p = P (A) = P (K1 or K2 or . . . or Kn )
(6.28)
= 1 − P (K1 or K2 or . . . or Kn )
= 1 − P (K1 and K2 and . . . and Kn )
= 1 − P (K1 ) · P (K2 ) · . . . · P (Kn )
= 1 − (1 − P (K1 )) · (1 − P (K2 )) · . . . · (1 − P (Kn ))
= 1 − (1 − p1 ) · (1 − p2 ) · . . . · (1 − pn ))
Damit wurde allgemein gezeigt:
Satz 6.10. Es seien Ki (i = 1, 2, . . . , n) unabhängige Ereignisse, die durch
or zusammengesetzt werden (parallel geschaltet). Die Wahrscheinlichkeiten seien
P (Ki ) = pi (i = 1, 2, . . . , n) für die Ereignisse Ki , dann gilt
P (K1 or K2 or . . . or Kn ) = 1 −
n
Y
(1 − pi )
(6.29)
i=1
Beispiel 6.12. Gegeben sei ein Gerät (G), das aus zwei (technischen) Komponenten A und B besteht. Jede dieser Komponenten hat jeweils die Wahrscheinlichkeit
von 0,9, dass sie nach einem Jahr Betrieb noch aktiv sind. Die beiden Ereignisse
sind voneinander unabhängig. Wie hoch ist die Wahrscheinlichkeit, dass das Gerät
nach einem Jahr noch aktiv ist, wenn die beiden Komponenten parallel geschaltet
Version 5.1 - 013
107
6.2. Zusammen gesetzte Aufgaben
sind (eines der Komponenten muss noch aktiv sein, damit das Gerät aktiv ist) oder
hintereinander geschaltet sind (beide Komponenten müssen noch aktiv sein).
(parallel): P (G) = P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = P (A) + P (B) − P (A) ·
P (B) = 0, 9 + 0, 9 − 0, 81 = 0, 99
(hintereinander): P (G) = P (A ∩ B) = P (A) · P (B) = 0, 9 · 0, 9 = 0, 81
Beispiel 6.13. Jetzt wird ein Aggregat (A) betrachtet, welches aus 2 Komponenten
(K1 und K2 ) besteht, die parallel geschaltet sind (siehe hierzu wieder Abbildung
6.3). Die Komponente K1 hat die Verfügbarkeit (Wahrscheinlichkeit) p1 = 0, 8.
Welche Verfügbarkeit p2 muss die Komponente K2 haben, damit das Aggregat die
Verfügbarkeit p = 0, 9 hat? Die Komponenten sind parallel geschaltet, also gilt
p = 1 − (1 − p1 ) · (1 − p2 )
(6.30)
mit den konkreten Zahlen ergibt sich
0, 9 = 1 − (1 − 0, 8) · (1 − p2 )
(6.31)
Aufgelöst nach der Unbekannten p2 ergibt sich p2 = 0, 5.
Beispiel 6.14. Nun wird ein Aggregat (A) betrachtet, welches aus 3 Komponenten
(K1 , K2 und K3 ) besteht, folgendermaßen geschaltet sind, siehe Abbildung 6.6.
K1
K2
K3
Abbildung 6.6.: Aggregat aus drei Komponenten
Die Komponente K1 hat die Verfügbarkeit (Wahrscheinlichkeit) p1 = 0, 8, die Komponente K2 die Verfügbarkeit p2 = 0, 7. Welche Verfügbarkeit p3 muss die Komponente K3 haben, damit das Aggregat die Verfügbarkeit p = 0, 9 hat?
Damit das Aggregat die Verfügbarkeit p = 0, 9 hat, muss - nach dem vorherigen
Beispiel - die Verfügbarkeit des unteren Teils gleich 0, 5 (P (K2 K3 ) = 0, 5) sein.
Damit gilt
0, 5 = P (K2 K3 ) = P (K2 and K3 ) = P (K2 ) · P (K3 ) = 0, 7 · p3
(6.32)
Aufgelöst nach p3 ergibt p3 = 0, 7143.
108
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
Beispiel 6.15. Es soll die Wahrscheinlichkeit berechnet werden, dass ein Radio
mit Mittelwellen-, Kurzwellen- und UKW-Empfang nach einem Jahr Dauerbetrieb
noch auf wenigstens einem Wellenbereich funktionsfähig ist. Es wird angenommen,
dass alle Bauteile unabhängig voneinander sind. Die Abbildung 6.7 zeigt den Bauplan mit den einzelnen Komponenten: TRA - Netztrafo, VOR - Vorstufe, MWE Mittelwerte Empfang, KWE - Kurzwelle Empfang, UKV - UKW Vorstufe, UKH UKW Hauptstufe, END - Endstufe, SP1 = Speaker 1, SP2 = Speaker 2.
MWE
VOR
KWE
TRA
SP2
END
UKV
UKH
SP1
Abbildung 6.7.: Bauplan Radio
Die Wahrscheinlichkeit dass die einzelne Komponente nach einem Jahr Dauerbetrieb nach aktiv sind, sind in der Tabelle 6.4 aufgeführt.
P (T RA) = 0, 8 P (V OR) = 0, 75
P (M W E) = 0, 8 P (KW E) = 0, 6
P (U KV ) = 0, 9 P (U KH) = 0, 8
P (EN D) = 0, 9
P (SP 1) = 0, 9
P (SP 2) = 0, 9
Tabelle 6.4.: Verfügbarkeiten Komponenten vom Radio
Die zusammengesetzten Komponenten sind der MW-KW-Teil (mw-kw-teil), bestehend aus dem MW- und dem KW-Empfang, dem AM-Teil (am-teil), bestehend
aus der Vorstufe und dem MW-KW-Teil, dem FM-Teil (fm-teil), bestehend aus
der UKW-Vorstufe und der UKW-Hauptstufe, dem Empfangsteil (empfangsteil),
bestehend aus dem AM-Teil und dem FM-Teil, dem Lautsprecher (lautsprecher),
bestehend aus dem Speaker 1 und dem Speaker 2. Der gesamte Radio (radio) besteht
dann aus dem Netztrafo, dem Emfangsteil, der Endstufe und dem Lautsprecher.
Wie hoch ist die Wahrscheinlichkeit, dass nach einem Jahr Dauerbetrieb der Radio
noch funktioniert (mindestens ein Wellenbereich, mindestens ein Lautsprecher).
P (mw−kw−teil) = 0, 8+0, 6−0, 8·0, 6 = 0, 92, P (am−teil) = 0, 75·0, 92 = 0, 69,
Version 5.1 - 013
109
6.2. Zusammen gesetzte Aufgaben
P (f m − teil) = 0, 9 · 0, 8 = 0, 72, P (empf angsteil) = 0, 69 + 0, 72 − 0, 69 · 0, 72 =
0, 9132, P (lautsprecher) = 0, 9 + 0, 9 − 0, 9 · 0, 9 = 0, 99, P (radio) = 0, 8 · 0, 9132 ·
0, 9 · 0, 99 = 0, 6509
Beispiel 6.16. (Duell Anton mit Bert) Es wird nun ein Duell von Anton und
Bert, zweier guter Schützen, betrachtet. Anton hat eine Trefferwahrscheinlichkeit
von 1 (das heißt von 100 %), während Bert eine Trefferwahrscheinlichkeit von 0,8
(das heißt 80 %) hat. Wenn beim Duell die Reihenfolge, in der geschossen werden
darf, per Zufall bestimmt wird, wie hoch sind die Überlebenschancen von Anton
und Bert?
Wenn Anton zuerst schießen darf, dann wird er sofort Bert treffen. Somit hat
Anton überlebt. Ist p(A|A1) die Wahrscheinlichkeit, dass Anton (A) überlebt, unter
der Bedingung, dass Anton zuerst schießen darf (A1), so gilt p(A|A1) = 1 und
entsprechend p(B|A1) = 0. Darf Bert zuerst schießen (B1), so trifft er mit einer
Wahrscheinlichkeit von 0, 8 seinen Gegner. Mit einer Wahrscheinlichkeit von 0, 2
kann sein Gegner zurück schießen. In diesem Fall trifft Anton und das Duell ist
beendet. Es gilt somit p(A|B1) = 0, 8 ∗ 0 + 0, 2 ∗ 1 = 0, 2 (wobei 1 beziehungsweise 0
der Wert ist, ob Anton überlebt oder nicht) und p(B|B1) = 0, 8 ∗ 1 + 0, 2 ∗ 0 = 0, 8
(hier repräsentiert 1 beziehungsweise 0 den Wert, ob Bert überlebt oder nicht).
Für die Überlebenschancen von Anton gilt somit
p(A) = p(A1) ∗ p(A|A1) + p(B1) ∗ p(A|B1)
= 0, 5 ∗ 1, 0 + 0, 5 ∗ 0, 2 = 0, 6 .
(6.33)
A überlebt, wenn er zuerst schießen darf (das passiert mit der Wahrscheinlichkeit
p(A1)) oder mit ein Wahrscheinlichkeit von 20% (p(A|B1)), wenn Bert zuerst
schießen darf. Die Überlebenschancen von Bert berechnen sich durch
p(B) = p(A1) ∗ p(B|A1) + p(B1) ∗ p(B|B1)
= 0, 5 ∗ 0, 0 + 0, 5 ∗ 0, 8 = 0, 4 .
(6.34)
Beispiel 6.17. (Duell Anton mit Claus) Beim Duell von Anton (Trefferwahrscheinlichkeit 100%) und Claus (Trefferwahrscheinlichkeit von 50%) ergeben sich
nach den obigen Regeln Überlebenschancen von p(A) = 0, 75 und p(C) = 0, 25
Beispiel 6.18. (Duell Bert mit Claus) Wenn sich nun Bert und Claus duellieren?
Wenn zuerst Bert schießt, dann hat er trifft er zu 80%. Zu 20% darf Claus schießen. Dabei trifft Claus nur zu 50%, zu den anderen 50% darf dann wieder Bert
110
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
schießen, die Ausgangssituation ist wieder erreicht. Die Überlebenschance von Bert
errechnet sich dadurch mit
p(B|B1) = 0, 8 ∗ 1 + 0, 2 ∗ (0, 5 ∗ 0 + 0, 5 ∗ p(B|B1))
= 0, 8 + 0, 1 ∗ p(B|B1) .
(6.35)
Damit ergibt sich 0, 9 ∗ p(B|B1) = 0, 8 und somit p(B|B1) = 98 . Analog ergibt sich
für die Überlebenschance von Claus
p(C|B1) = 0, 8 ∗ 0 + 0, 2 ∗ (0, 5 ∗ 1 + 0, 5 ∗ p(C|B1))
= 0, 1 + 0, 1 ∗ p(C|B1) .
(6.36)
Damit ergibt sich 0, 9 ∗ p(C|B1) = 0, 1 und somit p(C|B1) = 91 .
Darf Claus zuerst schießen, dann berechnen sich die Überlebenschancen von Bert
durch
p(B|C1) = 0, 5 ∗ 0 + 0, 5 ∗ (0, 8 ∗ 1 + 0, 2 ∗ p(B|C1))
= 0, 4 + 0, 1 ∗ p(B|C1)
(6.37)
und somit 0, 9 ∗ p(B|C1) = 0, 4 und damit p(B|C1) = 94 . Die Überlebenschance von
Claus sind
p(C|C1) = 0, 5 ∗ 1 + 0, 5 ∗ (0, 8 ∗ 0 + 0, 2 ∗ p(C|C1))
= 0, 5 + 0, 1 ∗ p(C|C1)
(6.38)
und somit 0, 9 ∗ p(C|C1) = 0, 5 und damit p(C|C1) = 95 .
Daraus ergibt sich insgesamt p(B) =
2
3
und p(C) = 13 .
Beispiel 6.19. (Triell) Wenn Anton, Bert und Claus ein Triell durchführen, wobei
am Anfang die Reihenfolge beim Schießen zufällig bestimmt wird, dann müssen
die Kontrahenten mit der folgenden Strategie herangehen: Anton muss zuerst Bert
treffen, entsprechend muss Bert zuerst Anton treffen, da dies jeweils die schärfsten
Kontrahenten sind. Claus muss solange in die Luft schießen, bis nur noch ein
Gegner da ist. Claus muss damit sicher stellen, dass er, wenn einer der Gegner
bereits weg ist, er den ersten Schuss auf den verbleibenden Gegner abgeben kann.
Damit sind es zwei Ereignisse. Zuerst ein Duell zwischen Anton und Bert (DAB)
und anschließend ein Duell zwischen Claus und dem Überlebenden des ersten D
rleben ergeben sich dadurch zu:
p(A) = p(A|DAB) ∗ p(A|C1 im DAC) = 0, 6 ∗ 0, 5 = 0, 3
Version 5.1 - 013
(6.39)
111
6.3. Aufgaben
p(B) = p(B|DAB) ∗ p(B|C1 im DBC) = 0, 4 ∗
4
8
=
= 0, 178
9
45
(6.40)
p(C) = p(A|DAB) ∗ p(C|C1 im DAC)
(6.41)
+ p(B|DAB) ∗ p(C|C1 im DBC)
5
47
= 0, 6 ∗ 0, 5 + 0, 4 ∗ =
= 0, 522
9
90
Hierbei bedeuten DAB = Duell zwischen Anton und Bert, DAC = Duell zwischen
Anton und Claus, DBC = Duell zwischen Bert und Claus.
Somit hat Claus ist besten Überlebenschancen, mit über 50%.
6.3. Aufgaben
Aufgabe 6.1. Verdeutlichen Sie sich die Eigenschaften der Wahrscheinlichkeit am
Beispiel des Würfels.
Aufgabe 6.2. Aus einem Spiel mit 32 Karten wird zufällig eine Karte gezogen.
Es ist P(Kreuz) = 0,25 und P(Ass) = 0,125. Bestimmen Sie P(Kreuz oder Ass)
und von P(Kreuz und Ass).
Aufgabe 6.3. In einer Urne befinden sich 200 Kugeln, von denen 70 blau sind
und die übrigen gelb. Auf 20 blauen Kugeln und 30 gelben Kugeln ist ein Stern
gemalt. Wie groß ist die Wahrscheinlichkeit, dass eine zufällig gezogene Kugel blau
ist oder mit einem Stern bemalt ist?
Aufgabe 6.4. Beim Werfen von zwei Würfeln soll die Wahrscheinlichkeit für das
Ereignis Summe der Augen höchstens 11 bestimmt werden.
Aufgabe 6.5. Gegeben sei ein Gerät (G), das aus drei (technische) Komponenten
A, B und C besteht. Jede dieser Komponenten hat jeweils die Wahrscheinlichkeit
von 0,9, dass sie nach einem Jahr Betrieb noch aktiv sind. Die drei Ereignisse
sind voneinander unabhängig. Wie hoch ist die Wahrscheinlichkeit, dass das Gerät
nach einem Jahr noch aktiv ist, wenn die drei Komponenten parallel geschaltet
sind oder hintereinander geschaltet sind?
Aufgabe 6.6. Gegeben sei ein Gerät (G), das aus n (technische) Komponenten
Ki , i = 1, . . . , n besteht. Jede dieser Komponenten hat jeweils die Wahrscheinlichkeit von 0,5 (0,7; 0,9; 0,95; 0,99; 0,995), dass sie nach einem Jahr Betrieb noch
aktiv sind. Die Komponenten (Ereignisse) sind voneinander unabhängig. Wie hoch
ist die Wahrscheinlichkeit, dass das Gerät nach einem Jahr noch aktiv ist, wenn
die Komponenten parallel geschaltet sind oder hintereinander geschaltet sind? Erstellen Sie dazu eine Tabelle.
112
Version 5.1 - 013
Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung
Aufgabe 6.7. Bestimmen Sie die Wahrscheinlichkeiten für die Summe beim Würfeln mit zwei unabhängigen Würfeln.
Aufgabe 6.8. Es wird mit drei unterscheidbaren Würfeln gewürfelt. Wie groß ist
die Wahrscheinlichkeit dafür, dass die Augensumme mindestens 7, aber weniger
als 10 beträgt?
Aufgabe 6.9. In einer Lostrommel mit 1000 gut gemischten Losen befinden sich
10 Hauptgewinne (H) und 80 einfache Gewinne (E). Bestimmen Sie die Wahrscheinlichkeit
(a) einen Hauptgewinn,
(b) einen einfachen Gewinn,
(c) einen Hauptgewinn oder einen einfachen Gewinn zu ziehen.
Aufgabe 6.10. In einer Urne befinden sich 200 Kugeln, von denen 70 blau sind
und die übrigen gelb. Auf 20 blauen Kugeln und 30 gelben Kugeln ist ein Stern
gemalt. Wie groß ist die Wahrscheinlichkeit, dass eine zufällig gezogene Kugel blau
ist oder mit einem Stern bemalt ist?
Aufgabe 6.11. In einer Urne befinden sich 7 blaue und 6 gelbe Kugeln. Es werden
nacheinander ohne Zurücklegen zwei Kugeln gezogen. Wie groß ist die Wahrscheinlichkeit, beim zweiten Zug eine gelbe Kugel zu ziehen, unter der Bedingung, dass
beim ersten Zug eine blaue Kugel gezogen wurde oder eine gelbe Kugel gezogen
wurde?
Aufgabe 6.12. Eine Maschine besteht aus den drei Aggregaten A, B und C,
die unabhängig voneinander mit den Wahrscheinlichkeiten P (A) = 0, 3, P (B) =
0, 2 und P (C) = 0, 1 ausfallen. Die Maschine kann nur genutzt werden, wenn
keines der drei Einzelaggregate ausfällt. Wie hoch ist die Wahrscheinlichkeit für
den Ausfall der Maschine?
Version 5.1 - 013
113
Kapitel 7.
Zufallsvariablen
7.1. Zufallsvariable
Zuerst wird der Begriff Zufallsexperiment genauer beleuchtet. Für ein Zufallsexperiment gilt:
• Das Experiment wird unter klar definierten Bedingungen durchgeführt.
• Die möglichen Ergebnisse (Ausgang des Experiments) sind vorher bereits
bekannt.
• Das Experiment kann (theoretisch) beliebig oft wiederholt werden.
Im folgenden werden Zufallsexperimenten betrachtet, deren Ergebnisse metrisch
messbare Größen sind.
Definition 7.1 (Zufallsvariable). Eine messbare Funktion X, die zu jedem Elementarereignis ω ∈ Ω eine reelle Zahl X(ω) zuordnet, also
X : Ω → R, ω 7→ X(ω)
(7.1)
heißt Zufallsvariable. Eine Zufallsvariable, die abzählbar viele Werte annehmen
kann, heißt diskret. Eine Zufallsvariable, die überabzählbar viele Werte annehmen
kann, heißt stetig.
Beispiel 7.1. Eine diskrete Zufallsvariable ist die Zahl beim Würfeln mit einem
Würfel. Die Zufallsvariable X kann nur die Werte 1, 2, 3, 4, 5 oder 6 annehmen.
Beispiel 7.2. Die als reelle Zahl gemessene Lebensdauer von Glühlampen ist eine
stetige Zufallsvariable. Die Lebensdauer kann in einem Intervall der reellen Zahlen
jeden beliebigen Wert annehmen.
Version 5.1 - 013
115
7.1. Zufallsvariable
Bei der Verwendung von Zufallsvariablen werden die Ergebnisse eines Zufallsexperiments durch reelle Zahlen beschrieben. Die den Ereignissen zugeordneten
Wahrscheinlichkeiten werden dann den entsprechenden Werten der Zufallsvariablen zugeordnet. Bei diskreten Zufallsvariablen bedeutet das: Für ω 7→ X(ω) gilt
P (X(ω)) = P (ω).
Definition 7.2 (Wahrscheinlichkeitsfunktion). Gegeben sei eine diskrete Zufallsvariable X, welche die Werte xi , i = 1, . . . , n mit von Null verschiedenen Wahrscheinlichkeiten P (X = xi ) = P (xi ) annehmen kann. Die Funktion fX (xi ) =
P (xi ), die jedem xi die Wahrscheinlichkeit fX (xi ) zuordnet heißt Wahrscheinlichkeitsfunktion.
Eine Wahrscheinlichkeitsfunktion fX besitzt die einfache Eigenschaften 0 ≤
P
fX (xi ) ≤ 1 und die Summe über alle Werte ist gleich 1 ( i fX (xi ) = 1). Nimmt
die Zufallsvariable nur endlich viele Werte x1 , . . . , xn mit von Null verschiedenen
Wahrscheinlichkeiten fX (xi ) = P (xi ) (i = 1, . . . , n) an, so kann die Wahrscheinlichkeitsverteilung in tabellarischer Form (siehe 7.1) angegeben werden:
xi
fX (xi )
x1
fX (x1 )
x2
fX (x2 )
...
...
xn
fX (xn )
Tabelle 7.1.: diskrete, endliche Wahrscheinlichkeitsverteilung
Dabei sollen die Werte geordnet sind (x1 < x2 < . . . < xn ).
Definition 7.3 (Verteilungsfunktion). Gegeben sei eine diskrete Zufallsvariable X
mit der Wahrscheinlichkeitsfunktion fX (x). Die Funktion
FX (x) = P (X ≤ x) =
X
fX (xi )
(7.2)
xi ≤x
heißt Verteilungsfunktion der Zufallsvariablen X.
Eine Verteilungsfunktion hat folgende Eigenschaften: FX ist monoton steigend,
rechtsseitig stetig, limx→−∞ FX (x) = 0 und limx→∞ FX (x) = 1.
Definition 7.4 (Dichtefunktion). Die Dichtefunktion fX (x) einer stetigen Zufallsvariablen X ist eine intervallweise stetige Funktion mit den Eigenschaften
Z ∞
−∞
116
fX (x)dx = 1
und
fX (x) ≥ 0
(7.3)
Version 5.1 - 013
Kapitel 7. Zufallsvariablen
Beispiel 7.3.
(
fX (x) =
0, 5 : 3 ≤ x < 5
0
: sonst
(7.4)
ist eine Dichtefunktion.
Beispiel 7.4.



0, 25x − 0, 5
fX (x) =  −0, 25x + 1, 5

0
: 2≤x<4
: 4≤x<6
: sonst
(7.5)
ist eine Dichtefunktion.
Die Dichtefunktion einer stetigen Zufallsvariablen gibt nicht die Wahrscheinlichkeit
dafür an, dass die Zufallsvariable den Wert x annimmt. Mit Hilfe der Dichtefunktion einer stetigen Funktion kann nur die Wahrscheinlichkeit bestimmt werden,
dass die Zufallsvariable X einen Wert in einem gegebenen Intervall annimmt.
Bemerkung 7.5. Gegeben sei eine stetige Zufallsvariable X mit der Dichtefunktion fX (x). Dann gilt
P (a < X ≤ b) =
Z b
a
fX (x)dx.
(7.6)
Daher gilt, dass bei einer stetigen Funktion P (X = x0 ) = 0 gilt.
Definition 7.6 (Verteilungsfunktion). Gegeben sei eine stetige Zufallsvariable X
mit der Dichtefunktion fX (x). Die Funktion
FX (x) = P (X ≤ x) =
Z x
−∞
fX (t) dt
(7.7)
heißt Verteilungsfunktion von X
Damit gilt P (a < X ≤ b) =
Rb
a
fX (x)dx = FX (b) − FX (a).
7.2. Parameter von Zufallsvariablen
Zur Charakterisierung von Häufigkeitsverteilungen werden in der beschreibenden
(deskriptiven) Statistik Lage- und Streuungsparameter bestimmt. Entsprechende
Parameter können auch für Wahrscheinlichkeitsverteilungen bestimmt werden.
Version 5.1 - 013
117
7.2. Parameter von Zufallsvariablen
Definition 7.7 (Erwartungswert). Der Erwartungswert E(X) einer Zufallsvariablen X ist definiert durch
E(X) =
n
X
xi · fX (xi )
(7.8)
i=1
für eine diskrete Zufallsvariablen mit der Wahrscheinlichkeitsfunktion fX , und
E(X) =
Z ∞
−∞
x · fX (x)dx
(7.9)
für stetige Zufallsvariablen mit der Dichtefunktion fX .
Die Formel für den Erwartungswerten einer diskreten Zufallsvariablen hat eine sehr
große Ähnlichkeit zur Formel für das arithmetische Mittel, wenn die Daten mit
relativer Häufigkeit gegeben sind. Der Erwartungswert kann grob als erwarteter
Mittelwert interpretiert werden.
Definition 7.8 (Moment). Es sei X ein Zufallsvariable. Das m-te Moment
E(X m ) ist bei einer diskreten Zufallsvariablen mit der Wahrscheinlichkeitsfunktion
fX definiert durch
E(X m ) =
n
X
xm
i · fX (xi )
(7.10)
i=1
und bei einer stetigen Zufallsvariablen mit der Dichtefunktion durch
E(X m ) =
Z ∞
−∞
xm · fX (x)dx
(7.11)
Das nullte Moment hat den Wert 1. Das erste Moment ist der Erwartungswert der
Zufallsvariablen. Wie bei der beschreibenden Statistik können weitere Parameter
definiert werden, welche eine Aussage über die Streuung geben.
Definition 7.9 (Varianz, Standardabweichung). Die Varianz einer Zufallsvariablen X ist definiert durch
V AR(X) =
=
n
X
(xi − E(X))2 · fX (xi )
i=1
n
X
(7.12)
x2i · fX (xi ) − (E(X))2
i=1
118
Version 5.1 - 013
Kapitel 7. Zufallsvariablen
für eine diskrete Zufallsvariablen mit der Wahrscheinlichkeitsfunktion fX , und
Z ∞
V AR(X) =
−∞
Z ∞
=
−∞
(x − E(X))2 · fX (x)dx
(7.13)
x2 · fX (x)dx − (E(X))2
für stetige Zufallsvariablen mit der Dichtefunktion fX .
Die Wurzel
der Varianz ist die Standardabweichung σX der Zufallsvariablen X
q
(σX = V AR(X)).
Es gilt
Bemerkung 7.10. Es sei X eine Zufallsvariable, dann gilt
V AR(X) = E(X 2 ) − E(X)2 ,
(7.14)
die Varianz ist also das zweite Moment minus dem Quadrat des ersten Moments.
Für eine Linearkombination von unabhängigen Zufallsvariablen gilt folgende Aussage:
Satz 7.11. Sind k stochastisch unabhängige Zufallsvariablen X1 , X2 , . . . , Xk mit
den Erwartungswerten E(Xi ) und den Varianzen V AR(Xi ) für i = 1, . . . , k gegeben, so gilt für den Erwartungswert E(Y ) der Zufallsvariablen Y = a1 X1 + a2 X2 +
· · · + ak X k + b :
E(Y ) = a1 E(X1 ) + a2 E(X2 ) + · · · + ak E(Xk ) + b
(7.15)
und für die Varianz
V AR(Y ) = a21 V AR(X1 ) + a22 V AR(X2 ) + · · · + a2k V AR(Xk )
(7.16)
Beispiel 7.5. Beim Würfeln ist die Wahrscheinlichkeitsfunktion fX für die Zufallsvariable X der Zahl beim Würfeln gegeben durch fX (i) = 61 für i = 1, · · · , 6.
Für den Erwartungswert E(X) gilt somit
E(X) =
6
X
i · fX (i) = 1 ·
i=1
1
1
+ · · · + 6 · = 3, 5.
6
6
(7.17)
Für die Varianz ergibt sich
6
X
1
1
= · 17, 5 = 2, 92
6
6
i=1
√
Für die Standardabweichung gilt somit σX = 2, 92 = 1, 71.
V AR(X) =
Version 5.1 - 013
(i − 3, 5)2 ·
(7.18)
119
7.2. Parameter von Zufallsvariablen
Beispiel 7.6. Gegeben sei die Dichtefunktion
(
0, 5 :
0
:
fX (x) =
3<x<5
.
sonst
(7.19)
Der Erwartungswert berechnet sich durch:
E(X) =
Z ∞
−∞
= 0, 5 ·
x · fX (x) dx =
Z 5
Z 5
x · 0, 5 dx
(7.20)
3
xdx = 0, 5 ·
3
1 2
x
2
5
= 4.
3
Die Varianz berechnet sich durch:
V AR(X) =
Z ∞
−∞
= 0, 5
x2 · fX (x)dx − (E(X))2
Z 5
3
Beispiel 7.7.
(7.21)
1
x dx − (E(X)) = 0, 5 x3
3
2
2
5
− 42 = 0, 33.
3
1
Für die Dauer einer Fahrt zwischen Autobahndreieck Karlsruhe und Autobahnkreuz
Stuttgart benötigt man normalerweise 30 Minuten, optimistisch benötigt man 20
Minuten, pessimistisch 60 Minuten. Die Abbildung 7.1 spiegelt die mögliche Verteilung wieder:
6
@
@
@
@
@
@
@
10 20 30 40 50 60
-
Abbildung 7.1.: Verteilung Zeitbedarf
Für die Vereinfachung der Rechnung setzen wir als eine Einheit 10 Minuten an,
das heißt 1 =
ˆ 10 Minuten, 2 =
ˆ 20 Minuten, und so weiter.
1
Dieses Beispiel ist inspiriert durch den Artikel Die Drei-Punkt-Schätzmethode zur Kalkulation des Projektaufwands von P. Gartner in Projektmanagement, 4/99, Seite 33 37
120
Version 5.1 - 013
Kapitel 7. Zufallsvariablen
Die Dauer sei durch die nachfolgende Dichtefunktion gegeben, die Normierung ist
dabei so gewählt, dass die Fläche unter der Kurve 1 ergibt, so dass es eben eine
Dichtefunktion ist.
fX (t) =
 t−2

 2
6−t
6


0
: 2<t<3
: 3<t<6 .
: sonst
(7.22)
Es gilt
Z 6
t−2
6−t
fX (t)dt =
dt +
dt
2
6
−∞
2
3
3
6
1
1 3
1
= (t − 2)2 − (6 − t)2 = + = 1
4
12
4 4
2
3
Z ∞
Z 3
(7.23)
so dass die angegebene Funktion tatsächlich eine Dichtefunktion ist. Die Wahrscheinlichkeit, dass die Dauer kleiner oder gleich 20 Minuten beträgt:
P (X ≤ 2) =
Z 2
−∞
fX (t)dt = 0
(7.24)
Dies bedeutet, dass die Wahrscheinlichkeit, dass der Dauer kleiner oder gleich 20
Minuten ist gleich 0 ist. Für die Wahrscheinlichkeit, dass der Aufwand kleiner oder
gleich 30 Minuten ist, ergibt sich:
P (X ≤ 3) =
Z 3
−∞
fX (t)dt =
Z 3
2
t−2
1
dt =
2
4
(7.25)
Dies bedeutet wiederum, dass die Wahrscheinlichkeit, dass die Dauer kleiner oder
gleich 30 Minuten ist nur 25% beträgt. Der Erwartungswert für die Dauer ist
E(X) =
Z ∞
−∞
tfX (t)dt =
Z 3
2
t
Z 6
t−2
6−t
11
t
dt +
dt =
= 3, 667
2
6
3
3
(7.26)
Das heißt, der Erwartungswert für die Dauer beträgt 36 23 Minuten.
Als weitere Daten ergeben sich E(X 2 ) = 85
und damit V AR(X) = E(X 2 ) −
6
E(X)2 = 13
. Als Standardabweichung ergibt sich somit σX = 0, 850
18
Für Schätzungen mit einem optimistischen (O), einem häufigsten (H) und einem pessimistischen (P) Wert kann der Erwartungswert auch mittels O+H+P
oder
3
O+3H+P
O+4H+P
oder mittels
ermittelt werden, wenn eine Dichtefunktion nicht
5
6
gegeben ist. Bei P. Gartner wird für den Erwartungswert O+H+P
und für die Va3
P −O 2
rianz ( 5 ) verwendet. Dies auf das obige Beispiel angewendet würde für den
Version 5.1 - 013
121
7.3. Aufgaben
ergeben. Für die Varianz erhält man
Erwartungswert den Wert E(X) = 11
3
somit für die Standardabweichung 45 = 0, 8.
16
25
und
Bei Softwareprojekten werden oftmals auch optimistische (O), häufigste (H) und
pessimistische (P) Schätzungen für Teilaufgaben durchgeführt. Für jede Teilaufein Erwartungswert geschätzt werden.
gabe kann dann mittels der Formel O+H+P
3
Hat man viele Teilaufgaben für eine Aufgabe, so kann der Projektaufwand als
normalverteilt um die Summe der Erwartungswerte der Teilaufgaben angesehen
werden (Gesetz der großen Zahlen). Die Varianz ist die Summe der Varianzen der
Teilaufgaben, woraus sich die Standardabweichung berechnen lässt. Die Normalverteilung wird später noch behandelt.
Beispiel 7.8. Ein Projekt besteht aus 10 Teilaufgaben. Jede Teilaufgabe hat einen
Aufwand von 10 (Erwartungswert) und einer Standardabweichung von 1 (damit ist
auch die Varianz jeder Teilaufgabe gleich 1). Das Projekt hat somit für den Aufwand einen Erwartungswert von 100 (Summe der einzelnen Erwartungswert).
Die
√
Summe der Varianzen ist 10, somit ist die Standardabweichung gleich 10 = 3, 16
und somit (deutlich) geringer als die Summe der einzelnen Standardabweichung.
Die Standardabweichung hier besagt jedoch nur, dass mit einer gewissen Wahrscheinlichkeit der Wert in dem Bereich Erwartungswert plus / minus Standardabweichung ist.
Bei Projektschätzungen wird oftmals für jede Aufgabe der optimistische Wert genommen und die Summe der optimistischen Werte als Aufwand für das Projekt
genommen. Dieses Projekt wird von vorne herein eine Überschreitung des Aufwands haben. Die Summe der Erwartungswerte ist der Aufwand, der mit einer
Wahrscheinlichkeit von 50% erreicht oder unterschritten wird.
7.3. Aufgaben
Aufgabe 7.1. Eine Zufallsvariable X hat folgende Wahrscheinlichkeitsverteilung
gemäß Tabelle 7.2
xi
2
3
5
8
9
fX (xi ) 0,1 0,4 0,2 0,1 0,2
Tabelle 7.2.: Wahrscheinlichkeitsverteilung
Berechnen Sie den Erwartungswert und die Varianz.
122
Version 5.1 - 013
Kapitel 7. Zufallsvariablen
Aufgabe 7.2. Gegeben sei eine stetige Zufallsvariable X. Die zugehörige Dichtefunktion lautet:
(
0, 5x − 1 : 2 < x < 4
.
0
: sonst
fX (x) =
(7.27)
Bestimmen Sie die Verteilungsfunktion, den Erwartungswert und die Varianz. Bestimmen Sie die Wahrscheinlichkeit P (2, 5 < X < 3, 5).
Aufgabe 7.3. Gegeben sei eine stetige Zufallsvariable X. Die zugehörige Dichtefunktion lautet:
(
fX (x) =
3x2
0
: 0<x<1
.
: sonst
(7.28)
Bestimmen Sie die Verteilungsfunktion, den Erwartungswert und die Varianz. Bestimmen Sie die Wahrscheinlichkeit P (0, 2 < X < 0, 5).
Aufgabe 7.4. Es sei die Funktion fX (x) gegeben durch
(
fX (x) =
2x − 2 : 1 ≤ x < 2
0
: sonst
(7.29)
Zeigen Sie, dass fX (x) eine Dichtefunktion ist. Zeichnen Sie die Dichtefunktion!
Bestimmen Sie die Verteilungsfunktion FX (x). Zeichnen Sie die Verteilungsfunktion. Bestimmen Sie die Wahrscheinlichkeit P (1, 2 ≤ X ≤ 1, 4).
Aufgabe 7.5. Ein Eisverkäufer erzielt bei schönem Wetter einen Tagesgewinn
von 100 Euro, bei Regen von 50 Euro und bei Schneefall macht er einen Verlust
von 70 Euro. Die Wahrscheinlichkeit für schönes Wetter beträgt p(S) = 0,5 und
für Regen p(R) = 0,3. Wie hoch ist der Erwartungswert des täglichen Gewinns für
den Eisverkäufer?
Aufgabe 7.6. < doppelt >
Version 5.1 - 013
123
Kapitel 8.
Spezielle Verteilungen
In diesem Kapitel werden einige spezielle, oft verwendete Verteilungen dargestellt.
Es sind sowohl diskrete als auch stetige Verteilungen.
8.1. Diskrete Gleichverteilung
Definition 8.1 (Diskrete Gleichverteilung). Ist X ein diskrete Zufallsvariable,
welche die Werte xi (i = 1, . . . , n) mit den positiven Wahrscheinlichkeiten n1 annimmt und sonst den Wert 0 annimmt, dann heißt X gleichverteilt. Die Wahrscheinlichkeitsfunktion lautet:
fX (xi ) =
1
n
i = 1, 2, . . . , n
f ür
(8.1)
und die Verteilungsfunktion:
FX (x) =



0


1
i
n
: x < x1
: xi ≤ x < xi+1 f ür i = 1, ·, n − 1 .
: xn ≤ x
(8.2)
Es gelten für Erwartungswert und Varianz
E(X) =
n
1X
xi
n i=1
(8.3)
und
V AR(X) =
n
1X
x2 − E(X)2
n i=1 i
(8.4)
Beispiele hierfür sind: Wurf einer Münze (n = 2), Würfeln (n = 6)
Version 5.1 - 013
125
8.3. Binomialverteilung
8.2. Stetige Gleichverteilung
Definition 8.2 (Stetige Gleichverteilung). Ist X eine stetige Zufallsvariable, deren
Dichtefunktion im Intervall (a, b) positiv und konstant und sonst 0 ist, dann heißt
X gleichverteilt hat hat die Dichtefunktion
(
fX (x) =
1
b−a
0
: a<x<b
: sonst
(8.5)
: x<a
: a≤x<b .
: b≤x
(8.6)
sowie der Verteilungsfunktion



0

1
FX (x) = 
x−a
b−a
Es gelten für den Erwartungswert und die Varianz
E(X) =
b+a
2
(8.7)
und
(b − a)2
V AR(X) =
12
(8.8)
8.3. Binomialverteilung
Definition 8.3 (Binomialverteilung). Bei einem Zufallsexperiment sind nur die
Ereignisse A und A möglich. Mit der Wahrscheinlichkeit p(A) = Θ tritt das Ereignis A ein, mit der Wahrscheinlichkeit p(A) = 1 − p(A) = 1 − Θ tritt das Ereignis
A ein. Das Zufallsexperiment wird n-mal wiederholt (Bernoulli-Experiment).
Für die Zufallsvariable X, welche die Anzahl der Ausführungen des Zufallsexperiments mit dem Ereignis A angibt, erhält man dann eine Binomialverteilung.
Diese hat die Wahrscheinlichkeitsfunktion
!
n x
Θ (1 − Θ)n−x
fX (x) =
x
(8.9)
für x = 0, 1, · · · , n. Die Binomialverteilung besitzt die Parameter n und Θ. Man
nennt X deshalb auch B(n; Θ) − verteilt und bezeichnet eine Binomialverteilung
mit den Parametern n und Θ mit B(x|n; Θ). Für eine B(n; Θ)-verteilte Zufallsvariable gelten
E(X) = nΘ
126
(8.10)
Version 5.1 - 013
Kapitel 8. Spezielle Verteilungen
und
V AR(X) = nΘ(1 − Θ)
(8.11)
Beispiel 8.1. Eine Münze, deren Vorderseite eine 1 und deren Rückseite eine 0
aufweist, wird 4 mal geworfen. Für die Wahrscheinlichkeitsverteilung der Ergebnissumme (Summe der jeweils oben liegenden Zahl) erhält man aus der Binomialverteilung die nachfolgende Wahrscheinlichkeitsfunktion (siehe Tabelle 8.1).
xi
fX (xi )
1
16
0
= 0,0625
4
16
1
= 0,25
6
16
2
= 0,375
4
16
3
= 0,25
1
16
4
= 0,0625
Tabelle 8.1.: Beispiel B(4; 0, 5)-Verteilung
Die Ergebnissumme ist B(4; 0, 5)-verteilt.
Satz 8.4. Ist X ein B(n; Θ)-verteilte Zufallsvariable und Y ein B(m; Θ)-verteilte
Zufallsvariable und sind die beiden Zufallsvariablen stochastisch unabhängig, so ist
die Zufallsvariable X + Y B(n + m; Θ)-verteilt.
Wichtig ist hierbei, dass die beiden Binomialverteilungen dieselbe Wahrscheinlichkeit Θ haben.
Approximationsmöglichkeiten für Binomialverteilungen
Ist nΘ ≤ 10 und n ≥ 1500Θ, dann ist eine B(n; Θ)-verteilte Zufallsvariable näherungsweise poissonverteilt mit dem Parameter µ = nΘ, also P s(nΘ)-verteilt.
Für nΘ(1 − Θ) > 9 ist eine B(n; Θ)-verteilte Zufallsvariable näherungsweise normalverteilt mit denqParametern µ = nΘ und σ 2 = nΘ(1 − Θ), also ist sie näherungsweise N (nΘ; nΘ(1 − Θ))-verteilt.
8.4. Hypergeometrische Verteilung
Während bei der Binomialverteilung die Wahrscheinlichkeit Θ für das Auftreten
des Ereignisses A bei jeder Durchführung des Zufallsexperiments gleich ist, ist
dies bei der Hypergeometrischen Verteilung nicht der Fall. Als Beispiel kann hier
das Urnenmodell fungieren, wobei die gezogenen Kugeln nicht wieder zurückgelegt
werden.
Version 5.1 - 013
127
8.4. Hypergeometrische Verteilung
Definition 8.5 (Hypergeometrische Verteilung). Von N Elementen, von denen
M die Eigenschaft A besitzen, werden zufällig n Elemente ohne Zurücklegen entnommen. Für die Wahrscheinlichkeit fX (x), x Elemente mit der Eigenschaft A
auszuwählen, gilt:
M
x
fX (x) =
!
N −M
n−x
!
N
n
!
(8.12)
Das ist die Wahrscheinlichkeitsfunktion der Hypergeometrischen Verteilung.
Sie enthält 3 Parameter: N (gesamte Anzahl der Elemente), M (Anzahl der Elemente mit der besonderen Eigenschaft) und n (Anzahl der Elemente, die ausgewählt werden). Man schreibt häufig kurz H(x|N ; M ; n) und spricht von einer
H(N ; M ; n)-verteilten Zufallsvariablen.
Es gelten
E(X) = n
M
N
(8.13)
und
V AR(X) =
M
n(N − n) M
(1 − ).
N −1 N
N
(8.14)
Beispiel 8.2. Beim Zahlenlotto (6 aus 49) werden Zahlen ohne Zurücklegen gezogen. Die Wahrscheinlichkeit für 3, 4, 5 oder 6 Richtige erhält man durch die
Hypergeometrische Verteilung mit den Parametern N = 49, M = 6 und n = 6.
H(3|49; 6; 6) =
6
3
49−6
6−3
49
6
=
20 ∗ 12341
= 0, 0176504038
13983816
H(4|49; 6; 6) = 0, 0009686197
H(5|49; 6; 6) = 0, 0000184499
H(6|49; 6; 6) = 0, 0000000715
Beispiel 8.3. Beim Zahlenlotto 6 aus 49 gibt es auch Tippscheine, auf denen man
bis zu 12 Zahlen ankreuzen kann. In diesem Fall ist N = 49, M = 6 und n = 12.
Die Wahrscheinlichkeit für 6 bzw. 3 Richtige sind
!
H(6|49; 6; 12) =
128
!
6
43
·
6
6
!
49
12
=
1
= 0, 0000661
15.134
(8.15)
Version 5.1 - 013
Kapitel 8. Spezielle Verteilungen
!
H(3|49; 6; 12) =
!
6
43
·
3
9
!
49
12
=
925
= 0, 122
7.567
(8.16)
Approximationsmöglichkeiten für Hypergeometrische Verteilungen: Für 0, 1 <
M
< 0, 9 und n > 10 und Nn < 0, 05 kann eine H(N ; M ; n)-verteilte ZufallsvariaN
ble durch eine B(n; M
)-verteilte Zufallsvariable approximiert werden. Für 0, 1 <
N
M
< 0, 9 und n > 30 kann eine H(N ; M ; n)-verteilte Zufallsvariable
approximiert
N
q
M
M
M N −n
werden durch eine normalverteilte Zufallsvariable N (n N ; n N (1 − N ) N −1 ).
8.5. Geometrische Verteilung
Bei der geometrischen Verteilung wird ein Bernoulli-Experiment durchgeführt, wie
bei der Binomialverteilung. Betrachtet wird die Zufallsvariable X, welche die Anzahl der unabhängigen Versuche angibt, die bis zum ersten Auftreten des Ereignisses A vergehen.
Definition 8.6 (Geometrische Verteilung). Bei einem Zufallsexperiment sind nur
die Ereignisse A und A möglich. Mit der Wahrscheinlichkeit p(A) = Θ tritt das
Ereignis A ein, mit der Wahrscheinlichkeit p(A) = 1 − p(A) = 1 − Θ tritt das
Ereignis A ein. Das Zufallsexperiment wird unabhängig wiederholt (BernoulliExperiment). Für die Zufallsvariable X, welche die Anzahl der Ausführungen
des Zufallsexperiments angibt, bis das Ereignis A eintritt, erhält man dann eine
geometrische Verteilung . Diese hat die Wahrscheinlichkeitsfunktion
fX (x) = Θ(1 − Θ)x−1
x = 1, 2, · · ·
(8.17)
und die Verteilungsfunktion
(
FX (x) =
0
1 − (1 − Θ)m
: x<1
.
: m ≤ x < m + 1, m = 1, 2, · · ·
(8.18)
Die geometrische Verteilung besitzt den Parameter Θ. Für eine geometrischverteilte Zufallsvariable gilt
E(X) =
1
Θ
(8.19)
1−Θ
.
Θ2
(8.20)
und
V AR(X) =
Version 5.1 - 013
129
8.6. Poissonverteilung
18
. Die
Beispiel 8.4. Beim Roulette ist die Wahrscheinlichkeit für rot p(R) = Θ = 37
Wahrscheinlichkeit, dass beim 10. Spiel zum ersten Mal rot eintritt ist fX (10) =
18
∗ ( 19
)9 = 0, 001208. Der Erwartungswert für die Anzahl der Spiele ist E(X) =
37
37
37
= 2, 05556.
18
Approximationsmöglichkeiten für Geometrische Verteilungen
Für Θ < 0, 1 ist die geometrisch verteilte Zufallsvariable X näherungsweise exponentialverteilt mit dem Parameter λ = Θ.
8.6. Poissonverteilung
Bei der Durchführung eines Bernoulli-Experiments und der Anwendung der Binomialverteilung liegt manchmal die Situation vor, dass die Wahrscheinlichkeit Θ
für das Eintreten des Ereignissen A sehr klein ist, die Anzahl n der Ausführungen
jedoch sehr groß. Dies tritt beispielsweise bei der Produktion von Gütern auf. Der
Ausschuss ist gering, die produzierte Masse jedoch hoch.
Ist nΘ konstant und geht Θ gegen 0, dann geht der Term
!
n x
Θ (1 − Θ)n−x
x
gegen des Term
(nΘ)x −nΘ
e
.
x!
(8.21)
Für die Konstante nΘ setzt man µ.
Definition 8.7 (Poissonverteilung). Eine diskrete Zufallsvariable X mit der
Wahrscheinlichkeitsfunktion
fX (x) =
µx −µ
e
x!
, x = 0, 1, 2, · · ·
(8.22)
heißt Poissonverteilung oder poisson-verteilt mit dem Parameter µ. Man spricht
auch von einer P s(µ)-verteilten Zufallsvariablen X und schreibt für die Wahrscheinlichkeitsfunktion P s(x|µ). Für Erwartungswert und Varianz gelten
E(X) = µ
(8.23)
V AR(X) = µ.
(8.24)
und
Anwendung findet die Poisson-Verteilung unter anderem bei der Untersuchung
über
130
Version 5.1 - 013
Kapitel 8. Spezielle Verteilungen
• Anzahl der pro Minute ankommenden Telefongespräche in einer Telefonvermittlung.
• Anzahl der Kraftfahrzeuge, die pro Minute an einem Punkt vorbeifahren.
• Anzahl der Fadenbrüche pro Zeitraum in einer Spinnerei.
• Anzahl von Druckfehlern pro Seite in Büchern.
Beispiel 8.5. Bei einer Verkehrszählung wurde die Anzahl der pro Zeitintervall
von einer Minute an einem Punkt vorbei fahrenden Fahrzeuge festgestellt. Für eine
Dauer von 200 Minuten ergab sich die Resultate gemäß Tabelle 8.2
Anzahl der Fahrzeuge pro Intervall
Häufigkeit
0
110
1 2 3 4
65 21 3 1
5
0
Tabelle 8.2.: Beispiel: Fahrzeugzählung
Für den Mittelwert und die Varianz ergeben sich jeweils 0, 6. Daher kann von einer
Poissonverteilung mit dem Parameter µ = 0, 6 ausgegangen werden. Damit kann
die theoretische Häufigkeit ermittelt werden (siehe 8.3).
xi
P s(xi |0, 6)
200 · P s(xi |0, 6)
Häufigkeit
0
1
2
3
4
5
0,5488 0,3293 0,0988 0,0198 0,0030 0,0004
110
66
20
4
1
0
110
65
21
3
1
0
Tabelle 8.3.: Beispiel: Poissonverteilung
Bemerkung 8.8. Für poissonverteilte unabhängige Zufallsvariablen X und Y mit
den Parametern µ und λ gilt, dass die Zufallsvariable Z = X + Y ebenfalls poissonverteilt ist. Der Parameter von Z ist µ + λ.
Approximationsmöglichkeiten für Poissonverteilungen
Für µ ≥ 10 ist eine P s(µ)-verteilte Zufallsvariable näherungsweise normalverteilt
√
√
mit dem Parameter µ und µ, d.h. sie ist N (µ; µ)-verteilt.
8.7. Exponentialverteilung
Für manche Anwendungen, insbesondere in der Theorie der Warteschlangen spielt
die Exponentialverteilung eine wichtige Rolle.
Version 5.1 - 013
131
8.8. Normalverteilung
Definition 8.9 (Exponentialverteilung). Eine stetige Zufallsvariable X mit der
Dichtefunktion
(
fX (x) =
λe−λx
0
: f ür x ≥ 0; λ > 0
.
: sonst
(8.25)
und der Verteilungsfunktion
(
FX (x) =
1 − e−λx
0
: f ür x ≥ 0; λ > 0
.
: sonst
(8.26)
heißt Exponentialverteilung oder exponentialverteilt mit dem Parameter λ.
Für den Erwartungswert und die Varianz einer exponentialverteilten Zufallsvariablen X gelten:
E(X) =
1
λ
(8.27)
und
V AR(X) =
1
.
λ2
(8.28)
8.8. Normalverteilung
Die Normalverteilung ist die wichtigste stetige Verteilung. Sie spielt bei nahezu
allen Anwendungen der Statistik eine wichtige Rolle.
Definition 8.10 (Normalverteilung). Eine stetige Zufallsvariable X mit der Dichtefunktion
1
(x − µ)2
fX (x) = √ exp(−
)
2σ 2
σ 2π
(8.29)
heißt Normalverteilung oder normalverteilt mit den Parametern µ und σ. Eine
Normalverteilung mit den Parametern µ und σ wird mit N (µ; σ) bezeichnet. Die
Zufallsvariable heißt dann auch N (µ; σ)-verteilt.
Für eine normalverteilte Zufallsvariable X gelten
E(X) = µ
(8.30)
V AR(X) = σ 2 .
(8.31)
und
132
Version 5.1 - 013
Kapitel 8. Spezielle Verteilungen
Die Dichtefunktion der Normalverteilung ist symmetrisch und hat ihr Maximum
bei µ. Je kleiner das σ ist, desto höher ist das Maximum und desto enger ist die
Kurve um die Spiegelachse gelegt.
Für die Wahrscheinlichkeit P (x1 ≤ X ≤ x2 ) gilt
P (x1 ≤ X ≤ x2 ) =
=
Z x2
x1
Z x2
x1
fX (x)dx
(8.32)
1
(x − µ)2
√ exp(−
)dx
2σ 2
σ 2π
Die Verteilungsfunktion der Normalverteilung, d.h. das Integral der Dichtefunktion, ist mit Hilfe elementarer Funktionen nicht explizit darstellbar. Die Werte
werden in der Regeln mittels einer Tabelle angegeben. Dabei sind in der Tabelle
nur die Werte von N (0; 1) hinterlegt.
Definition 8.11 (Standardnormalverteilung). Die Normalverteilung mit dem Erwartungswert 0 und der Standardabweichung 1, also N (0; 1), heißt Standardnormalverteilung.
Bemerkung 8.12. Ist X eine N (µ; σ)-verteilte Zufallsvariable, dann ist die lineare Transformation Y = aX + b, a, b ∈ R eine N (aµ + b; |a| · σ)-verteilte Zufallsvariable.
Mit a = σ1 und b = − σµ ist Z = aX + b oder Z = σ1 X −
standardnormalverteilt. Es gilt dann
p(x1 ≤ X ≤ x2 ) = p(
µ
σ
ein N (0; 1)-verteilt oder
x1 − µ
x2 − µ
≤Z≤
).
σ
σ
(8.33)
Auf Grund dieser Bemerkung genügt die Tabelle für die Standardnormalverteilung,
da daraus dann die Werte für die anderen Normalverteilungen durch eine lineare
Transformation gewonnen werden können.
Im Anhang (siehe A.2) ist eine detailliertere Tabelle für die Standardnormalverteilung aufgeführt.
Ist X ein standardnormalverteilte Zufallsvariable, dann gelten :
p(X ≤ 1) = 0, 84134
p(−1 ≤ X ≤ 1) = 0, 84134 − (1 − 0, 84134) = 0, 68268
p(−2 ≤ X ≤ 2) = 0, 97725 − (1 − 0, 97725) = 0, 95450
Version 5.1 - 013
133
8.9. Aufgaben
750 ≤ X ≤ 1050 −1, 5 ≤ Z ≤ 1, 5
800 ≤ X ≤ 1050 −1 ≤ Z ≤ 1, 5
X ≤ 650
Z ≤ −2, 5
X ≤ 800
Z ≤ −1
1200 ≤ X
3≤Z
X ≤ 800 or
Z ≤ −1 or
1200 ≤ X
3≤Z
0,93319 - (1 - 0,93319)
0,93319 - (1 - 0,84134)
(1 - 0,99379)
(1 - 0,84134)
1 - 0,99865
0,15866 +
0,00135
0,86638
0,77453
0,00621
0,15866
0,00135
0,16001
Tabelle 8.4.: Beispiel: Brenndauer Glühbirnen
Beispiel 8.6. Die Brenndauer von Glühlampen sei normalverteilt mit dem Mittelwert von 900 Stunden und einer Standardabweichung von 100 Stunden. Es gelten
standardnorsomit µ = 900 und σ = 100. Damit ist die Zufallsvariable Z = X−µ
σ
malverteilt. In der Tabelle 8.4 sind einige Beispiele berechnet.
Wenn man zwei normalverteilte Zufallsvariablen hat, so ist auch die Summe dieser
beiden Zufallsvariablen wieder normalverteilt.
Satz 8.13. Gegeben seien zwei N (µ1 ; σ1 )- und N (µ2 ; σ2 )-verteilte unabhängige Zufallsvariablen X1 und X2 . Die Zufallsvariable
X = X1 + X2 ist wieder q
normalverq
2
2
teilt mit den Parametern µ1 + µ2 und σ1 + σ2 , sie ist also N (µ1 + µ2 ; σ12 + σ22 )verteilt.
Die Normalverteilung ist eine der wichtigsten Verteilungen, da sich bei Experimenten und Beobachtungen die Zufallsvariable näherungsweise normalverteilt.
8.9. Aufgaben
Aufgabe 8.1. (Binomialverteilung) In einer Produktionserie ist die Wahrscheinlichkeit für ein defektes Teil Θ. Die Anzahl der defekten Teile, wenn n Elemente
aus der Produktion zufällig ausgewählt und untersucht werden ist B(n; Θ)-verteilt.
Bestimmen Sie B(x|n; Θ) für x = 0, 1, · · · , 4 für
(a) n = 4, Θ = 0, 2
(b) n = 4, Θ = 0, 1
(c) n = 10, Θ = 0, 01
(d) n = 100, Θ = 0, 01
134
Version 5.1 - 013
Kapitel 8. Spezielle Verteilungen
Aufgabe 8.2. (Geometrische Verteilung) Bestimmen Sie die Wahrscheinlichkeit,
dass sie beim Würfeln 1, 2, 3, 4, 5, 6, 7, 8, 9 oder 10 Würfe benötigen, bis Sie
eine 6 würfeln. Wie hoch ist die Wahrscheinlichkeit, dass Sie 20, 30, 40 oder 50
Würfe benötigen?
1
) Seiten sind
Aufgabe 8.3. (Poissonverteilung) In einem Skript mit 500 (Θ = 500
300 (n = 300) Druckfehler zufällig verteilt. Bestimmen Sie die Wahrscheinlichkeit,
dass
(a) genau 2 oder
(b) mindestens 2 Fehler
auf einer bestimmten, zufällig gewählten Seite enthalten sind.
Aufgabe 8.4. (Normalverteilung) Ein Unternehmen stellt Kondensatoren her,
deren Kapazität normalverteilt ist mit µ = 100 (pF) und σ = 0,2. Wie viel Prozent
Ausschuss sind zu erwarten, wenn die Kapazität der Kondensatoren
(a) mindestens 99,8 pF;
(b) höchstens 100,6 pF betragen soll;
(c) um maximal 0,3 pF vom Sollwert 100 pF
abweichen darf?
Aufgabe 8.5. < doppelt >
Aufgabe 8.6. (Hypergeometrische Verteilung) Bestimmen Sie die Wahrscheinlichkeit für 4, 5, 6 und 7 Richtige bei einem Lotto 7 aus 38.
Aufgabe 8.7. < doppelt >
Aufgabe 8.8. < doppelt >
Aufgabe 8.9. (Normalverteilung) Es sei X eine N (µ; σ)-verteilte Zufallsvariable.
Bestimmen Sie die folgenden Wahrscheinlichkeiten:
(a) P (µ − σ ≤ X ≤ µ + σ)
(b) P (µ − 2σ ≤ X ≤ µ + 2σ)
(c) P (µ − 3σ ≤ X ≤ µ + 3σ)
(d) P (X ≤ µ + 1, 5σ)
(e) P (µ − 0, 5σ ≤ X)
Aufgabe 8.10. (Normalverteilung) Von einem Betrieb werden Metallfolien hergestellt, von denen nur Folien mit einer Dicke zwischen 0,082 mm und 0,118 mm zur
Weiterverarbeitung verwendet werden können, der Rest ist Ausschuss. Zur Herstellung stehen dem Betrieb die Maschinen A und B zur Verfügung. Die Foliendicke
der mit diesen Maschinen hergestellten Folien ist um den auf den Maschinen einstellbaren Sollwert (Erwartungswert) normalverteilt, und zwar auf der Maschine
A mit einer Standardabweichung von 0,01 mm und bei B von 0,018 mm.
Version 5.1 - 013
135
8.9. Aufgaben
(a) Wie sollte der Sollwert eingestellt werden, um den Ausschussanteil zu minimieren?
(b) Die Produktionskosten je 1000 Folien betragen für Maschine A 20 Euro und für
B 16 Euro. Für welche der beiden Maschinen sollte sich der Betrieb entscheiden,
wenn einwandfreie Folien zu minimalen Kosten hergestellt werden sollen?
Aufgabe 8.11. Studenten bestehen mit einer Wahrscheinlichkeit von 0,7 die Statistikklausur. Die Erfolge beziehungsweise Misserfolge der einzelnen Studenten sind
unabhängig voneinander. Bestimmen Sie die Wahrscheinlichkeit, dass von 5 Studenten 0, 1, 2, 3, 4 oder 5 Studenten die Klausur bestehen.
Aufgabe 8.12. Beim Mensch-ärgere-Dich-nicht-Spiel darf der erste Zug erst dann
erfolgen, wenn das erste Mal eine 6 gewürfelt wird. Wie groß ist die Wahrscheinlichkeit, dass man mehr als 3 Würfe machen muss, um beginnen zu können?
Aufgabe 8.13. Die Anzahl der Fahrzeuge, die in einem Beobachtungspunkt innerhalb eines Intervalls von einer Minute passieren, ist poissonverteilt mit µ =
1,6.
(a) Wie groß ist die Wahrscheinlichkeit, dass in einer Minute mehr als 3 Fahrzeuge vorbeifahren?
(b) Wie groß ist die Wahrscheinlichkeit, dass in 5 Minuten nicht mehr als 5 Fahrzeuge vorbeifahren, wenn die Ereignisse stochastisch unabhängig sind?
Aufgabe 8.14. Bei einer Klausur mit einer maximalen Anzahl von 100 Punkten
seien die Ergebnisse näherungsweise normalverteilt mit µ = 60 und σ = 10.
(a) Bestimmen Sie den Anteil d Studierenden, die durchgefallen sind, wenn zum
Bestehen der Klausur mindestens 50 Punkte erforderlich sind.
(b) Bestimmen Sie den Anteil der Studenten, welche die Note gut erhalten haben,
wenn diese für Punktzahlen von 80 bis 95 vergeben wird.
(c) Auf welchen Wert muss die zum Bestehen nötige Mindestpunktzahl festgelegt
werden, wenn nicht mehr als 10% der Studierenden durchfallen sollen?
(Hinweis: es sollen keine Stetigkeitskorrekturen beachtet werden.)
136
Version 5.1 - 013
Kapitel 9.
Schließende Statistik
In der schließenden Statistik wird aus den Daten einer Stichprobe auf Parameter
der Grundgesamtheit geschlossen oder aus der Verteilung der Grundgesamtheit
Schlüsse zu Stichproben gezogen. Bei Hypothesentest werden Aussagen zur Annahme oder Ablehnung von Hypothesen getroffen.
9.1. Parameterschätzung
In der beschreibenden Statistik wurden Daten, wie Mittelwert und Standardabweichung, von einer gegebenen Datenmenge bestimmt, wobei die Daten vollständig
erfasst und analysiert werden. Die vollständige Erfassung aller Daten ist nicht
immer möglich oder sinnvoll.
• Die Zugfestigkeit von Kettengliedern sollen überprüft werden, indem diese
bis zum Zerreißen belastet werden. Nur ein Teil der Produktion kann diesem
Test unterzogen werden.
• Die Abfüllanlage, welche Säcke mit Zement mit jeweils 50 kg füllt soll überprüft werden. Es ist nicht wirtschaftlich sinnvoll, alle Säcke zu prüfen. Daher
soll allein durch die Prüfung einiger Säcke, z.B. jeder 20. oder 50. Sack das
durchschnittliche Gewicht bestimmt werden.
• In einer Urne befinden sich rote und grüne Kugel. Durch einen Stichprobenumfang soll der Anteil der roten Kugeln abgeschätzt werden.
Eine statistische Masse über die man eine bestimmte Aussage treffen möchte heißt
Grundgesamtheit. Ist die Grundgesamtheit endlich, wird die Anzahl der Elemente mit N bezeichnet. Ein Teil einer zu analysierenden statistischen Masse,
die zufällig ausgewählt ist und aus der Informationen für die Grundgesamtheit
Version 5.1 - 013
137
9.2. Intervallschätzung
ermittelt werden heißt Stichprobenumfang. Die Anzahl der Elemente aus dem
Stichprobenumfang wird mit n bezeichnet.
Für den Stichprobenumfang können die statistischen Parameter mit Hilfe der beschreibenden Statistik bestimmt werden, siehe Tabelle 9.1.
Grundgesamtheit Stichprobe
Anzahl der Elemente
N
n
Mittelwert bzw. Erwartungswert
µ
x
2
Varianz
σ
s2
Standardabweichung
σ
s
Anteilswert
θ
p
Tabelle 9.1.: Untersuchungsparameter
Eine Stichprobe vom Umfang n liefert die Werte X1 , X2 , · · · , Xn (die Stichproben).
(Große Buchstaben, da die Werte Zufallsvariablen sind). Damit gelten für den
Stichprobenmittelwert
X=
n
X
Xi ,
(9.1)
i=1
für die Stichprobenvarianz
S2 =
n
n
1X
1X
2
(Xi − X)2 =
XXi2 − X
n i=1
n i=1
und für die Stichprobenstandardabweichung
√
S = S2 .
(9.2)
(9.3)
Der Erwartungswert für den Mittelwert der Stichproben entspricht dem Erwartungswert der Grundgesamtheit (E(X) = µ). Die Beziehung zwischen der Varianz
der Stichproben und der Varianz der Grundgesamtheit ist etwas komplexer, ohne dass hier näher darauf eingegangen wird. (siehe dazu etwa Schwarze 1997).
Näherungsweise ist die Varianz der Stichprobe gleich der Varianz der Grundgesamtheit.
9.2. Intervallschätzung
Statt einer Punktschätzung wird bei einer Intervallschätzung ein Intervall angegeben, in dem mit einer gewissen Wahrscheinlichkeit der gesuchte Parameter θ
138
Version 5.1 - 013
Kapitel 9. Schließende Statistik
enthalten ist. Es werden somit zwei Werte U1 und U2 derart gesucht, dass die
Wahrscheinlichkeit, dass der gesuchte Wert θ zwischen U1 und U2 liegt gleich 1 − α
ist:
p(U1 ≤ θ ≤ U2 ) ≥ 1 − α
(9.4)
Der Wert α gibt dabei an, mit welcher Genauigkeit das Intervall gesucht wird.
Die Wahrscheinlichkeit 1 − α heißt Konfidenzniveau. Das Intervall [U1 , U2 ] heißt
Konfidenzintervall. In den meisten Fällen verwendet man eine Schätzvariable U
und konstruiert durch U1 = U − δ und U2 = U + δ ein symmetrisches Konfidenzintervall [U − δ, U + δ].
Betrachten wir nun eine N (µ, σ 2 )-verteilte Zufallsvariable X und n Stichprobenvariablen X1 , · · · , Xn . Der Mittelwert der Stichproben X ist ebenfalls normalverteilt,
2
genauer N (µ, σn )-normalverteilt. Das heißt, der Erwartungswert ist identisch, nur
die Varianz ist unterschiedlich. Zuerst wird mittels einer linearen Transformation
Z=
√
n·
X −µ
σ
(9.5)
eine standardnormalverteilte Zufallsvariable Z definiert. Für Z betrachten wir das
Konfidenzintervall [−c, c] für ein geeignetes c > 0 und fordern
p(−c ≤ Z ≤ c) = 1 − α
(9.6)
Durch auflösen nach µ ergibt sich damit
cσ
cσ
p(X − √ ≤ µ ≤ X + √ ) = 1 − α
n
n
(9.7)
Das gesuchte Konfidenzintervall ist damit
cσ
cσ
[X − √ , X + √ ].
n
n
(9.8)
Da wir von einer normalverteilten Funktion ausgegangen sind, und Z standardnormalverteilt ist, kann das c in Abhängigkeit von α bestimmt werden. Der Parameter
α bestimmt die Genauigkeit, mit der der gesuchte Parameter im Konfidenzintervall
liegt. Ist ϕ(x) die Dichtefunktion der Standardnormalverteilung, so ergibt sich aus
p(−c ≤ Z ≤ c) = 1 − α: 1 − α = ϕ(c) − ϕ(−c) = ϕ(c) − (1 − ϕ(c)) = 2ϕ(c) − 1. Daraus wiederum erhält man ϕ(c) = 1 − α2 . Daraus wiederum kann man c ermitteln,
siehe dazu Tabelle 9.2.
(siehe auch Tabelle der Standardnormalverteilung).
Version 5.1 - 013
139
9.3. Hypothesentests
α
Genauigkeit ϕ(c)
c
0,01
99%
0,995 2,576
0,05
95%
0,975 1,96
0,1
90%
0,95 1,645
Tabelle 9.2.: Parameter in Abhängigkeit von der Güte
Beispiel 9.1. Aus einer Grundgesamtheit mit N (µ; 12)-verteiltem X wurde eine
einfache Zufallsstichprobe vom Umfang n = 36 gezogen, die x = 26 liefert. Für
1 − α = 0, 95 erhält man aus der Standardnormalverteilung c = 1, 96. Als 95%Konfidenzintervall für µ ergibt sich:
12
12
µu = 26 − 1, 96 √ = 22, 08; µo = 26 + 1, 96 √ = 29, 92
36
36
(9.9)
Das bedeutet, dass mit einer Wahrscheinlichkeit von 95% der Erwartungswert der
Grundgesamtheit im Intervall von 22,08 bis 29,92 liegt.
Je nach dem, ob die Varianz bekannt ist oder nicht, und je nach dem wie das
Verhältnis zwischen der Anzahl des Umfangs der Stichprobe und der Anzahl der
Grundgesamtheit ist, ergeben sich Veränderungen in der Bestimmung des Konfidenzintervalls. Für genauere Untersuchungen siehe Schwarze 1997.
9.3. Hypothesentests
Oftmals hat man für den Parameter einer Verteilung eine bestimmte Vermutung
oder Hypothese. Durch eine Stichprobe möchte man die Vermutung überprüfen.
Dies geschieht mittels eines statistischen Testverfahrens.
Beispiel 9.2. Beim zufälligen Werfen einer Münze erwarten wir, dass das Ergebnis Zahl mit der Wahrscheinlichkeit p(Zahl) = 0, 5 auftritt. Die Hypothese
für unseren Test lautet Θ = 0, 5. Die zu überprüfende Hypothese bezeichnet man
auch als Nullhypothese H0 . Zum Test der Hypothese wird eine Münze mehrmals
(n-fach) geworfen und die Anzahl X des Ereignisses Zahl gezählt. Diesem Zufallsexperiment liegt eine Binomialverteilung mit dem Erwartungswert E(X) = n2 zu
Grunde. Für einen Stichprobenumfang von n = 8 erhält man folgende Verteilung
von X (X ist B(8; 0, 5)-verteilt), siehe Tabelle 9.3.
140
Version 5.1 - 013
Kapitel 9. Schließende Statistik
x
0 und 8 1 und 7 2 und 6 3 und 5
4
p(x) 0,0039
0,0312
0,1094
0,2188 0,2734
Tabelle 9.3.: Beispiel: Stichprobenexperiment
Wenn bei richtiger Nullhypothese zugelassen wird, dass X um 2 nach oben oder
unten von n2 = 4 abweichen darf, dann darf X = 2, 3, 4, 5 oder 6 sein. Die
Wahrscheinlichkeit, dass X in diesem Bereich liegt, ist bei 0,9298.
Die Menge der möglichen Ergebnisse wird in zwei Bereiche geteilt, den Ablehnungsbereich (X < 2) beziehungsweise (X > 6) und den Annahmebereich
(2 ≤ X ≤ 6). Liegt das Ergebnis im Ablehnungsbereich, so ist bei richtiger Nullhypothese die Wahrscheinlichkeit für dieses Ereignis sehr gering (0,0702), so dass
hier mit hoher Wahrscheinlichkeit davon ausgegangen werden kann, dass die Nullhypothese nicht zutrifft. Gilt 2 ≤ X ≤ 6, so kann die Nullhypothese nicht abgelehnt
werden. Es ist allerdings nicht bewiesen, dass die Nullhypothese richtig ist, sie kann
jedoch nicht abgelehnt werden.
Bei einer Ablehnung oder bei einer Annahme einer Hypothese kann es zu Fehleinschätzungen kommen. Es kann die Nullhypothese abgelehnt werden, obwohl sie
richtig ist. dies nennt man Fehler 1. Art oder α-Fehler. Die Wahrscheinlichkeit α
heißt Irrtumswahrscheinlichkeit oder Signifikanzniveau des Tests. Als weiterer Fehler kann die Annahme einer falschen Hypothese vorkommen. Dieses Fehler
nennt man Fehler 2. Art oder β-Fehler, siehe Tabelle 9.4.
Nullhypothese
nicht verworfen
Nullhypothese
verworfen
Nullhypothese Nullhypothese
richtig
falsch
richtige
β-Fehler
Entscheidung (Fehler 2. Art)
α-Fehler
richtige
(Fehler 1. Art) Entscheidung
Tabelle 9.4.: Fehler 1. und 2. Art
Für eine genauere Ausführung zu Testverfahren siehe Schwarze 1997.
Version 5.1 - 013
141
Anhang A.
Tabellen
Version 5.1 - 013
143
A.1. Basisdaten
A.1. Basisdaten
Für viele Untersuchungen werden die nachfolgenden Daten betrachtet. Es sind
Daten von Personen in einer Vorlesung (inklusive Dozent) aufgeführt. Neben der
laufenden Nummer wird das Geschlecht der Person (m für männlich, w für weiblich), das Alter in Jahren, die Körpergröße in cm und die Note in einer Klausur
dargestellt.
Nr
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Geschlecht
m
w
m
m
w
m
w
w
w
w
m
w
w
w
w
m
w
m
w
w
w
m
w
m
w
w
m
w
m
Alter
19
20
20
20
20
21
21
23
25
20
20
22
23
20
20
20
21
20
23
21
20
21
19
19
21
22
18
25
54
Größe
166
170
174
176
179
184
152
164
171
178
187
166
168
169
178
188
171
185
161
171
177
187
182
184
169
176
193
175
172
Note
3
1
4
3
3
2
1
3
3
2
3
5
2
3
3
2
2
2
5
3
5
3
2
4
4
2
2
2
3
Tabelle A.1.: Basisdatensatz
144
Version 5.1 - 013
Anhang A. Tabellen
A.2. Tabelle der Normalverteilung
z
0,0.
0,1.
0,2.
0,3.
0,4.
0,5.
0,6.
0,7.
0,8.
0,9.
1,0.
1,1.
1,2.
1,3.
1,4.
1,5.
1,6.
1,7.
1,8.
1,9.
2,0.
2,1.
2,2.
2,3.
2,4.
2,5.
2,6.
2,7.
2,8.
2,9.
3,0.
3,1.
3,2.
3,3.
3,4.
.,.0
50000
53983
57926
61791
65542
69146
72575
75804
78814
81594
84134
86433
88493
90320
91924
93319
94520
95543
96407
97128
97725
98214
98610
98928
99180
99379
99534
99653
99744
99813
99865
99903
99931
99952
99966
.,.1
50399
54380
58317
62172
65910
69497
72907
76115
79103
81859
84375
86650
88686
90490
92073
93448
94630
95637
96485
97193
97778
98257
98645
98956
99202
99396
99547
99664
99752
99819
99869
99906
99934
99953
99968
Version 5.1 - 013
.,.2
50798
54776
58706
62552
66276
69847
73237
76424
79389
82121
84614
86864
88877
90658
92220
93574
94738
95728
96562
97257
97831
98300
98679
98983
99224
99413
99560
99674
99760
99825
99874
99910
99936
99955
99969
.,.3
51197
55172
59095
62930
66640
70194
73565
76730
79673
82381
84849
87076
89065
90824
92364
93699
94845
95818
96638
97320
97882
98341
98713
99010
99245
99430
99573
99683
99767
99831
99878
99913
99938
99957
99970
.,.4
51595
55567
59483
63307
67003
70540
73891
77035
79955
82639
85083
87286
89251
90988
92507
93822
94950
95907
96712
97381
97932
98382
98745
99036
99266
99446
99585
99693
99774
99836
99882
99916
99940
99958
99971
.,.5
51994
55962
59871
63683
67364
70884
74215
77337
80234
82894
85314
87493
89435
91149
92647
93943
95053
95994
96784
97441
97982
98422
98778
99061
99286
99461
99598
99702
99781
99841
99886
99918
99942
99960
99972
.,.6
52392
56356
60257
64058
67724
71226
74537
77637
80511
83147
85543
87698
89617
91308
92785
94062
95154
96080
96856
97500
98030
98461
98809
99086
99305
99477
99609
99711
99788
99846
99889
99921
99944
99961
99973
.,.7
52790
56749
60642
64431
68082
71566
74857
77935
80785
83398
85769
87900
89796
91466
92922
94179
95254
96164
96926
97558
98077
98500
98840
99111
99324
99492
99621
99720
99795
99851
99893
99924
99946
99962
99974
.,.8
53188
57142
61026
64803
68439
71904
75175
78230
81057
83646
85993
88100
89973
91621
93056
94295
95352
96246
96995
97615
98124
98537
98870
99134
99343
99506
99632
99728
99801
99856
99896
99926
99948
99964
99975
.,.9
53586
57535
61409
65173
68793
72240
75490
78524
81327
83891
86214
88298
90147
91774
93189
94408
95449
96327
97062
97670
98169
98574
98899
99158
99361
99520
99643
99736
99807
99861
99900
99929
99950
99965
99976
145
Anhang L.
Lösungen der Aufgaben
Hier finden Sie Lösungen zu den Aufgaben im Kurstext, wobei nicht zu allen
Aufgaben Lösungen angegeben sind.
Aktuell sind leider einige Aufgaben doppelt. Dies wird in einer späteren Version
bereinigt.
Version 5.1 - 013
147
L.1. Grundlagen
L.1. Grundlagen
Lösung L.1.1. Lösung L.1.2. Lösung L.1.3. Lösung L.1.4. Lösung L.1.5. Lösung L.1.6. Lösung L.1.7. Lösung L.1.8. Lösung L.1.9. -
148
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
L.2. Univariate Daten
Lösung L.2.1.
1
(0, 7 + 1, 6 + 2, 4 + 3, 2 + 1, 6 + 2, 4 + 2, 8) = 2, 1
7
1
d = (1, 4 + 0, 5 + 0, 3 + 1, 1 + 0, 5 + 0, 3 + 0, 7) = 0, 6857
7
1 2
s2 =
0, 7 + 1, 62 + 2, 42 + 3, 22 + 1, 62 + 2, 42 + 2, 82 − 2, 12 = 0, 62
7
√
s = 0, 62 = 0, 7874
x=
Die mittlere absolute Abweichung ist auf das arithmetische Mittel bezogen.
Lösung L.2.2.
5 · 0 + 4 · 1 + 10 · 2 + 12 · 3 + · · · + 4 · 10
600
=
=5
5 + 4 + 10 + 12 + · · · + 4
120
5 · 02 + 4 · 12 + 10 ·2 +12 · 32 + · · · + 4 · 102
3680
s2 =
− 52 =
− 52 = 5, 6667
5 + 4 + 10 + 12 + · · · + 4
120
s = 2, 3805
x=
Lösung L.2.3.
x = 0, 25 · 10 + 0, 5 · 9 + 0, 25 · 7 = 8, 75
Lösung L.2.4. Bei jeder Gruppe wurde ein Repräsentant (xj ) bestimmt, der als
Wert für die Gruppe genommen wird. Damit errechnet sich
x=
2 · 18 + 9 · 25 + 5 · 35 + 6 · 45 + 5 · 55 + 3 · 63
1170
=
= 39
30
30
Unter Verwendung der exakten Daten erhält man als Mittelwert x = 36, 3.
Lösung L.2.5.
xG =
√
4
1, 03 · 1, 04 · 1, 05 · 1, 06 =
√
4
1, 1922456 = 1, 044940
Lösung L.2.6.
√
√
xG = 5 1, 25 · 0, 95 · 1, 15 · 0, 80 · 0, 85 = 5 0, 928625 = 0, 9853 .
Dies entspricht einem durchschnittlichen jährlichen Verlust von 1,47%.
Lösung L.2.7.
√
√
q = 5 1, 10 · 0, 80 · 1, 15 · 1, 05 · 0, 90 = 5 0, 95634 = 0, 99111
Version 5.1 - 013
149
L.2. Univariate Daten
Lösung L.2.8.
v=
30
40
+
10
50
100
+ 40
+
80
20
100
= 60, 61
Lösung L.2.9.
v=
1
1
6
100
+
1
3
80
+
1
2
50
km
=
h
1
1
600
+
1
240
+
1
100
km
=
h
1
2+5+12
1200
km
1200 km
km
=
= 63, 16
h
19 h
h
Lösung L.2.10. Für alle drei Verteilungen gilt für das arithmetische Mittel x = 10
und die Standardabweichung s = 2, 5298.
Lösung L.2.11. Es wird eine Transformation durchgeführt. Das Merkmal X sei
das Gewicht des Sacks, das Merkmal Y sei die Differenz des Gewichts zu 50 kg: Y
= X - 50 kg.
i
1
2
3
4
5
6
7
8
9
10
Σ
xi
yi |ȳ − yi | (ȳ − yi )2
50,2 0,2
0,03
0,0009
49,9 -0,1
0,27
0,0729
50,4 0,4
0,23
0,0529
49,8 -0,2
0,37
0,1369
50,2 0,2
0,03
0,0009
50,3 0,3
0,13
0,0169
50,7 0,7
0,53
0,2809
49,7 -0,3
0,47
0,2209
50,0 0,0
0,17
0,0289
50,5 0,5
0,33
0,1089
501,7 1,7
2,56
0,9210
yi2
0,04
0,01
0,16
0,04
0,04
0,09
0,49
0,09
0,00
0,25
1,21
Mittelwert: ȳ = 1,7
= 0,17; x̄ = ȳ + 50 = 50,17
10
Spannweite: wX = 50,7 - 49,7 = 1,0
= 0,256
mittlere absolute Abweichung: dX = 2,56
10
0,9210
1,21
2
Varianz = 10 = 0,0921
√ = 10 - 0, 17
Standardabweichung = 0, 0921 = 0,3035
Lösung L.2.12. Zur Vereinfachung: di = x̄ − xi
150
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
i
1
2
3
4
5
6
7
8
9
10
Σ
xi
0
1
2
3
4
5
6
7
8
9
h(xi )
3
7
6
14
15
12
7
9
5
3
81
xi h(xi )
0
7
12
42
60
60
42
63
40
27
353
|di | |di |h(xi )
4,36
13,07
3,36
23,51
2,36
14,15
1,36
19,01
0,36
5,37
0,64
7,70
1,64
11,49
2,64
23,78
3,64
18,21
4,64
13,93
150,22
d2i
h(xi )d2i
18,99 56,98
11,28 78,93
5,56
33,36
1,84
25,82
0,13
1,92
0,41
4,95
2,70
18,87
6,98
62,82
13,26 66,32
21,55 64,64
414,62
x2i
0
1
4
9
16
25
36
49
64
81
h(xi )x2i
0
7
24
126
240
300
252
441
320
243
1953
= 4,36
arithmetisches Mittel: x̄ = 353
81
mittlere absolute Abweichung: dX = 150,22
= 1,85
81
414,62
1953
353 2
2
Varianz: sX = 81 = 5,12√= 81 − ( 81 )
Standardabweichung sX = 5, 12 = 2,26
Lösung L.2.13. Zur Vereinfachung: di = x̄ − xi
i
1
2
3
4
5
6
7
8
Σ
xi
1
2
3
4
5
6
7
8
f (xi )
0,10
0,05
0,25
0,10
0,20
0,10
0,15
0,05
1,00
xi · f (xi )
0,10
0,10
0,75
0,40
1,00
0,60
1,05
0,40
4,40
|di | |di | · f (xi )
3,40
0,34
2,40
0,12
1,40
0,35
0,40
0,04
0,60
0,12
1,60
0,16
2,60
0,39
3,60
0,18
1,70
d2i
f (xi ) · d2i
11,56
1,16
5,76
0,29
1,96
0,49
0,16
0,02
0,36
0,07
2,56
0,26
6,76
1,01
12,96
0,65
3,94
x2i f (xi ) · x2i
1
0,10
4
0,20
9
2,25
16
1,60
25
5,00
36
3,60
49
7,35
64
3,20
23,30
Mittelwert: 4, 40
mittlere absolute Abweichung: 1, 70
Varianz = 3, 94 = 23, 30√− 4, 402
Standardabweichung = 3, 94 = 1, 98
Lösung L.2.14.
Mittelwert: 22, 7
mittlere absolute Abweichung: 1, 85
Varianz = 5, 36
Standardabweichung = 2, 32
Version 5.1 - 013
151
L.2. Univariate Daten
Grafiken: Übung!
Lösung L.2.15.
(a) Die 14 Noten werden zuerst der Größe nach geordnet: 1, 1, 2, 2, 2, 2, 2, 3, 3,
3, 4, 4, 5 und 5. Da es 14 Elemente gibt, ist der Median die Mitte des 7. und 8.
Elements, also 2-3. Die 4-Quantile teilen die beiden 7-elementigen Hälften jeweils
in zwei Teile zu jeweils 3 Teile. Die 4-Quantile sind somit das 4. Element (2), der
Median (2-3) und das 11. Element (4).
(b) Übung
(c)
x=
14
1 X
39
1+4+2+5+2+2+3+4+2+1+5+2+3+3
=
= 2, 79
xi =
14 i=1
14
14
(d)
14
1 X
131
39
s =
xi 2 − x2 =
−
14 i=1
14
14
s
√
313
s = s2 =
= 1, 26
196
2
2
=
313
= 1, 60
196
Lösung L.2.16. < doppelt >
Lösung L.2.17.
i, xi
h(xi ) xi h(xi )
1
5
5
6
12
2
3
8
24
12
48
4
5
11
55
6
10
60
7
7
49
5
40
8
Summe
64
293
x=
x2i x2i h(xi )
1
5
4
24
9
72
16
192
25
275
36
360
49
343
64
320
1591
8
293
1X
xi h(xi ) =
= 4, 58
n i=1
64
8
1X
1591
293 2 15975
xi 2 h(xi ) − x2 =
−(
) =
= 3, 90
n i=1
64
64
4096
s
√
15975
s = s2 =
= 1, 97
4096
s2 =
152
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
Lösung L.2.18.
√
√
6
q = 6 1, 1 · 0, 8 · 1, 05 · 1, 15 · 0, 95 · 1, 1 = 1.110417 = 1, 0176
Lösung L.2.19.
v = P3
1
f (vj )
j=1 vj
=
1
1/4
7
+
2/5
6
+
7/20
5
=
1
181
1050
=
1050
= 5, 80
181
Seine Durchschnittsgeschwindigkeit beträgt 5,80 km/h.
Version 5.1 - 013
153
L.3. Bivariate Daten
L.3. Bivariate Daten
Lösung L.3.1. Ermittlung der relativen Häufigkeiten des Merkmals Y bei fixiertem Merkmal X:
Die relativen Häufigkeiten sind unterschiedlich, daher sind die Merkmale X und
Y abhängig.
x1
x2
x3
y1
0,20
0,25
0,55
y2
y3
0,30 0,50
0,35 0,40
0,35 0,10
1,00
1,00
1,00
Lösung L.3.2. Ermittlung der relativen Häufigkeiten von Y beziehungsweise X
bei fixem X beziehungsweise Y :
x1
x2
x3
y1
0,45
0,45
0,45
y2
y3
0,27 0,18
0,27 0,18
0,27 0,18
y4
0,09
0,09
0,09
1,00
1,00
1,00
x1
x2
x3
y1
0,57
0,29
0,14
1,00
y2
0,57
0,29
0,14
1,00
y3
0,57
0,29
0,14
1,00
y4
0,57
0,29
0,14
1,00
Die relativen Häufigkeiten von X beziehungsweise Y sind unabhängig davon, welches Merkmal von Y oder X fixiert wird. Daher sind die Merkmale X und Y
unabhängig.
Lösung L.3.3.
y1 y2 y3 y4
x1
1 4
2 1
x2
5 20 10 5
x3
2 8
4 2
h(yk ) 8 32 16 8
h(xj )
8
40
16
64
Lösung L.3.4. < doppelt >
Lösung L.3.5. < doppelt >
Lösung L.3.6. < doppelt >
154
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
Lösung L.3.7.
i xi
yi
x2i
1
2
5
4
2
2
7
4
3
4
4
16
4
4
6
16
5
5 4,5
25
6
6
3
36
7
6
5
36
8
8
3
64
Σ 37 37,5 201
xi yi
yi2
10
25
14
49
16
16
24
36
22,5 20,25
18
9
30
25
24
9
158,5 189,25
x̄ = 37
= 4, 625
8
201
2
sX = √8 - 4, 6252 = 3, 7344
sX = 3, 7344 = 1, 9325
= 4, 6875
ȳ = 37,5
8
189,25
2
sY = √ 8 - 4, 68752 = 1, 6836
sY = 1, 6836 = 1, 2975
sXY =
rXY =
158,5
- 4, 625∗4, 6875 =
8
−1,8672
= −0.7447
1,9325·1,2975
−1, 8672
Regressionsgerade ŷ = a + bx
Pn
i=1
a=
b=
n
x2i ni=1 yi − ni=1 xi ni=1 xi yi
201 · 37, 5 − 37 · 158, 5
=
=7
Pn
Pn
2
2
n i=1 xi − ( i=1 xi )
8 · 201 − 372
P
P
P
xi yi − ni=1 xi ni=1 yi
8 · 158, 5 − 37 · 37, 5
=
= −0, 5
Pn
Pn
2
2
n i=1 xi − ( i=1 xi )
8 · 201 − 372
Pn
i=1
P
P
Regressionsgerade ŷ = 7 − 0, 5 · x
6
HH
r
H
HH
H
r
r
HH
H
HH
H
r
r
HH
r
H
HH
H
r
HH
H
HHr
H
HH
-
Lösung L.3.8.
Version 5.1 - 013
155
L.3. Bivariate Daten
yi \xj
y1
y2
y3
Summe
x1 x2
3 5
12 20
9 15
24 40
x3 x4
9
2
36 8
27 6
72 16
Summe
19
76
57
152
Lösung L.3.9.
ŷ = 2, 4623 + 0, 7021 · x
rXY = 0, 8318
Lösung L.3.10.
ŷ = 5, 1176 + 0, 2353 · x
rXY = 0, 5601
Lösung L.3.11. < doppelt >
Lösung L.3.12.
6
x2i
r
yi2
i xi yi
xi yi
1
0 0
0
0
0
2
1 1
1
1
1
3
2 4
4
8
16
4
3 9
9
27
81
5
4 16 16 64 256
Σ 10 30 30 100 354
Regressionsgerade ŷ = a + bx
r
30 · 30 − 10 · 100
= −2
5 · 30 − 102
5 · 100 − 10 · 30
b=
=4
5 · 30 − 102
a=
r
Regressionsgerade ŷ = −2 + 4 · x
r
r
-
156
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
Lösung L.3.13.
i
xi yi x2i
1
1
3
1
2
2
4
4
3
3
7
9
4
5
6 25
5
4
6 16
6
6
5 36
7
7
9 49
8
8
8 64
Summe 36 48 204
x=
xi y i
3
8
21
30
24
30
63
64
243
36
9
1X
xi =
= = 4, 5
n
8
2
yi2
9
16
49
36
36
25
81
64
316
y=
48
1X
yi =
=6
n
8
s2X =
s2Y
1X 2
204
9
21
− ( )2 =
= 5, 25
xi − x 2 =
n
8
2
4
sX
q
7
1X 2
316
2
2
yi − y =
− 6 = = 3, 5 sY =
=
n
8
2
P 2P
P P
xi yi − xi xi yi
P 2
P
2
204 · 48 − 36 · 243
n xi − ( xi )
8 · 204 − 36 · 36
P
P P
n · xi y i − xi y i
8 · 243 − 36 · 48
2
=
=
b=
P 2
P
2
n xi − ( xi )
8 · 204 − 36 · 36
3
a=
Die Regressionsgerade hat die Gleichung ŷ = 3, 11 + 0, 64 ∗ x.
1X
27
243 9
xi y i − x · y =
− ·6=
= 3, 38
n
8
2
8
sXY
3, 38
=
=
= 0, 79
sX sY
2, 29 · 1, 87
sXY =
rXY
Version 5.1 - 013
157
=
L.3. Bivariate Daten
Lösung L.3.14.
Jahr
ti
xi
1997
1 4,7
1998
2 5,6
1999
3 6,2
2000
4 7,4
2001
5 7,6
2002
6 8,9
Summe 21 40,4
t2i
ti xi
1
4,7
4 11,2
9 18,6
16 29,6
25 38,0
36 53,4
91 155,5
P 2P
P P
ti xi − ti ti xi
P 2
P 2
91 ∗ 40, 4 − 21 ∗ 155, 5
= 3, 913
n ti − ( ti )
6 ∗ 91 − 21 ∗ 21
P
P P
n ∗ ti xi − ti xi
6 ∗ 155, 5 − 21 ∗ 40, 4
=
b=
= 0, 806
P 2
P 2
n ti − ( ti )
6 ∗ 91 − 21 ∗ 21
a=
=
Die Regressionsgerade hat die Gleichung x̂ = 3, 913 + 0, 806 ∗ ti .
2003: x̂ = 3, 913 + 0, 806 ∗ 7 = 9,555.
2004: x̂ = 3, 913 + 0, 806 ∗ 8 = 10,361.
2008: x̂ = 3, 913 + 0, 806 ∗ 12 =13,585 .
158
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
L.4. Zeitreihenanalysen
Lösung L.4.1.
t
xt
x3t
1
5
-
2 3 4
7 3 8
- 5 6
5 6 7 8 9
10 6 11 13 9
7 8 9 10 11
10 11 12
14 16 12
12 13 14
Lösung L.4.2.
t
xt
x4t
1
3
-
2
4
-
3
6
-
4
1
3,5
5
7
4,5
6
8
5,5
7
10
6,5
8
5
7,5
9
11
8,5
10
12
9,5
11
14
10,5
12
9
11,5
Lösung L.4.3. < doppelt >
Lösung L.4.4. < doppelt >
Lösung L.4.5.
Tag
0
1 2 3
Zugang
40 Abgang
10 5
Bestand 16 46 46 41
4 5
8 22
33 11
Durchschnittsbestand B̄ =
1
(16
10
mittlere Verweildauer d¯ =
2·22,9·10
68+60
Umschlagshäufigkeit U =
Version 5.1 - 013
10
3,578
6 7
- 7 4 4
8 9
20 4 12
20 8
10
8
0
+ 46 + 46 + · · · + 20 + 8) =
=
458
128
60
76
229
10
= 22, 9
= 3, 578
= 2, 795
159
L.4. Zeitreihenanalysen
6
50
40
30
20
10
00
-
0
1
2
3
4
5
6
7
8
9
10
Lösung L.4.6. < doppelt >
Lösung L.4.7.
Jahr
Umsatz
U msatz 3
U msatz 4
1997 1998
4,7
5,6
-
1999 2000
6,2
7,4
5,5
6,4
6,0
2001 2002
7,6
8,9
7,1
8,0
6,7
7,5
Lösung L.4.8.
160
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
Sortiment
Umsatz
2000
[Me]
Kleidung
10,0
Körperpflege
5,5
Sportartikel
4,5
Summe
20,0
(a) Umsatzindex W2000,2010 =
Umsatz
2010
[Me]
16,4
11,0
12,6
40,0
40,0
20,0
Plus
Umsatz
2000-2010
64%
100%
180%
Plus
Preis
2000-2010
4%
17%
41%
Plus
Menge
2000-2010
57,7 %
70,9 %
98,6 %
= 2.
(b)
L
P2000,2010
P
P2000,2010
10, 0 · 1, 04 + 5, 5 · 1, 17 + 4, 5 · 1, 41
pi,2010 qi,2000
=
pi,2000 qi,2000
10, 0 · 1 + 5, 5 · 1 + 4, 5 · 1
23, 18
= 1, 159
=
20, 00
P
pi,2010 qi,2010
16, 4 + 11, 0 + 12, 6
=P
= 16,4 11,0 12,6
pi,2000 qi,2010
+ 1,17 + 1,41
1,04
40, 00
=
= 1, 173
34, 11
P
=P
(c)
QL2000,2010
16,4
11,0
+ 1,17
+ 12,6
pi,2000 qi,2010
1,04
1,41
=
P
pi,2000 qi,2000
10, 0 · 1 + 5, 5 · 1 + 4, 5 · 1
34, 11
= 1, 705
20, 00
P
pi,2010 qi,2010
16, 4 + 11, 0 + 12, 6
=
P
pi,2010 qi,2000
10, 0 · 1, 04 + 5, 5 · 1, 17 + 4, 5 · 1, 41
40, 00
= 1, 726
23, 18
P
=
=
QP2000,2010 =
=
Es gilt P L · QP = P P · QL
Version 5.1 - 013
161
L.4. Zeitreihenanalysen
Lösung L.4.9. (a)
L
P2000,2004
L
P2000,2008
P
P2000,2004
P
P2000,2008
P
pi,2004 qi,2000
pi,2000 qi,2000
P
pi,2008 qi,2000
=P
pi,2000 qi,2000
P
pi,2004 qi,2004
=P
pi,2000 qi,2004
P
pi,2008 qi,2008
=P
pi,2000 qi,2008
=P
4 · 5 + 2 · 10 + 23 · 2
86
=
= 1, 162
3, 2 · 5 + 1, 6 · 10 + 21, 0 · 2
74
4, 6 · 5 + 2, 4 · 10 + 24 · 2
95
=
=
= 1, 284
74
74
4 · 4, 5 + 2 · 12 + 23 · 1, 8
83, 4
=
=
= 1, 168
3, 2 · 4, 5 + 1, 6 · 12 + 21, 0 · 1, 8
71, 4
4, 6 · 5 + 2, 4 · 15 + 24 · 2, 2
111, 8
=
=
= 1, 297
3, 2 · 5 + 1, 6 · 15 + 21, 0 · 2, 2
86, 2
=
(b)
QL2000,2004
QL2000,2008
QP2000,2004
QP2000,2008
P
pi,2000 qi,2004
pi,2000 qi,2000
P
pi,2000 qi,2008
=P
pi,2000 qi,2000
P
pi,2004 qi,2004
=P
pi,2004 qi,2000
P
pi,2008 qi,2008
=P
pi,2008 qi,2000
=P
71, 4
= 0, 965
74
86, 2
= 1, 165
=
74
83, 4
=
= 0, 970
86
111, 8
= 1, 177
=
95
=
(c)
P
pi,2004 qi,2004
83, 4
= 1, 127
=
74
pi,2000 qi,2000
P
111, 8
pi,2080 qi,2008
=P
=
= 1, 511
pi,2000 qi,2000
74
W2000,2004 = P
W2000,2008
162
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
L.5. Kombinatorik
Lösung L.5.1.
n 1 2 3 4
n! 1 2 6 24
5
120
Lösung L.5.2.
P (9; 3, 2, 2, 1, 1) =
9!
= 15.120
3!2!2!1!1!
Lösung L.5.3.
11!
= 34.650
1! · 4! · 4! · 2!
Lösung L.5.4.
Auswahl der Buchstaben ist eine 2-Permutation ohne Wiederholung auf einer 26elementigen Menge. Die Auswahl der Ziffern ist eine 4-Permutation mit Wiederholung auf einer 10-elementigen Menge.
P (26, 2) · P ∗ (10, 4) = 26 · 25 · 104 = 6.500.000
Lösung L.5.5. Eine Mehrheit kann durch 3, 4 oder 5 Personen gebildet werden.
Es ist dann jeweils eine i-Kombination ohne Wiederholung über einer 5-stelligen
Menge. Für die Gesamtanzahl ergibt sich somit
!
!
!
5
5
5
K(5, 3) + K(5, 4) + K(5, 5) =
+
+
= 10 + 5 + 1 = 16
3
4
5
Lösung L.5.6. 8-Permutation mit Wiederholung über einer 2-elementigen Menge!
P ∗ (2, 8) = 28 = 256
Lösung L.5.7. < doppelt >
Lösung L.5.8. < doppelt >
Lösung L.5.9.
Wenn man mit i Würfeln würfelt, dann hat man eine i-Kombination mit Wiederholung über einer 6-stelligen Menge.
1 Würfel:
!
∗
Version 5.1 - 013
6
(6, 1) =
=6
1
163
L.5. Kombinatorik
2 Würfel:
!
7
K (6, 2) =
= 21
2
∗
3 Würfel:
!
8
K (6, 3) =
= 56
3
∗
4 Würfel:
!
9
K (6, 4) =
= 126
4
∗
5 Würfel:
!
10
K (6, 5) =
= 252
5
∗
6 Würfel:
!
11
= 462
K (6, 6) =
6
∗
Lösung L.5.10.
Für die ersten drei Stellen ist es eine (geordnete) Permutation von 3 aus 26 Elementen ohne Zurücklegen. Für die hinteren 4 Stellen ist es eine (geordnete) Permutation von 4 aus 36 Elementen mit Zurücklegen.
Anzahl der Möglichkeiten: P (26, 3) ∗ P ∗ (36, 4) =
26.202.009.600 ≈ 2.6 ∗ 1010
26!
364
23!
= 26 ∗ 25 ∗ 24 ∗ 364 =
Es sind 26.202.009.600 verschiedene Passwörter möglich.
Lösung L.5.11. Es ist ein hypergeometrische Verteilung, da Zahlen ohne Zurücklegen gezogen werden. Die Parameter sind N = 45, da es insgesamt 45 Kugeln gibt,
M = 6, da 6 Kugeln die Eigenschaft Gewinnzahl tragen und n = 6, da 6 Kugeln
gezogen werden. Die Wahrscheinlichkeit für 5 Richtige ist damit H(5|45; 6; 6). Es
gilt
!
H(5|45; 6; 6) =
6
5
!
45 − 6
6−5
!
45
6
=
6 · 39
= 0, 0000287
8.145.060
Lösung L.5.12.
Die Wahrscheinlichkeit 1-mal hintereinander die selbe Zahl zu würfeln ist 1. Die
Wahrscheinlichkeit, 2-mal hintereinander die selbe Zahl zu würfeln ist gleich der
164
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
Wahrscheinlichkeit, dass man im 2. Wurf die Zahl vom 1. Wurf wieder würfelt,
also 61 . Die Wahrscheinlichkeit n-mal hintereinander die selbe Zahl zu würfeln ist
die Wahrscheinlichkeit, im 2., 3., . . ., (n-1). Wurf jeweils die Zahl vom 1. Wurf zu
würfeln, also jeweils 61 . Somit beträgt die Wahrscheinlichkeit, n-mal hintereinander
die selbe Zahl zu würfeln, somit ( 16 )n−1 .
Lösung L.5.13.
p(G3|B1) = p(B2|B1) ∗ p(G3|B1B2) + p(G2|B1) ∗ p(G3|B1G2) =
8
= 144
= 19
= 0,421
342
p(G3|G1) = p(B2|G1) ∗ p(G3|G1B2) + p(G2|G1) ∗ p(G3|G1G2) =
7
= 19
= 0,368
= 126
342
11
19
8
8
7
· 18
+ 19
· 18
12
19
7
7
6
· 18
+ 19
· 18
xi sei die Eigenschaft, dass im i. Zug die Farbe x (B blau oder G gelb) gezogen
wird.
Version 5.1 - 013
165
L.6. Grundlagen der Wahrscheinlichkeitsrechnung
L.6. Grundlagen der Wahrscheinlichkeitsrechnung
Lösung L.6.1. Lösung L.6.2.
P (Kreuz und Ass) = 1/32
P (Kreuz oder Ass) = P (Kreuz) + P (Ass) − P (Kreuz und Ass) = 11/32
Lösung L.6.3.
P (blau) = 70/200, P (ST ern) = 50/200, P (blau oder Stern) = 100/200
Lösung L.6.4. Beim würfeln mir zwei Würfeln ist nur die die Augensumme größer
als zwölf, wenn zwei Sechser gewürfelt werden. Die Wahrscheinlichkeit hierfür ist
1/36. Die Wahrscheinlichkeit dafür höchstens die Augensumme elf zu haben ist
damit das Komplement davon, also 35/36.
Lösung L.6.5.
parallel: 1 − (1 − 0, 9)3 = 0, 999
hintereinander: 0, 93 = 0, 729
Lösung L.6.6.
parallel: 1 − (1 − p)n
hintereinander: pn
Lösung L.6.7.
In der nachfolgenden Tabelle sind die verschiedenen Ergebnisse beim Würfeln mit
zwei Würfeln aufgeführt.
1
2
3
4
5
6
1
2
3
4
5
6
7
2
3
4
5
6
7
8
3
4
5
6
7
8
9
4 5
5 6
6 7
7 8
8 9
9 10
10 11
6
7
8
9
10
11
12
In der nachfolgenden Tabelle sind die Wahrscheinlichkeiten für die einzelnen Summen aufgeführt.
166
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
Augen
2
3
4
5
6
7
8
9
10
11
12
Anzahl
1
2
3
4
5
6
5
4
3
2
1
36
P(Augen)
0,0278
0,0556
0,0833
0,1111
0,1389
0,1667
0,1389
0,1111
0,0833
0,0556
0,0278
1,0000
Lösung L.6.8.
Es gibt insgesamt 216 (= 63 ) verschiedene Kombinationen für die Würfel.
Augen
7
8
9
Kombinationen Anzahl
5-1-1
3
4-2-1
6
3-3-1
3
3-2-2
3
6-1-1
3
5-2-1
6
4-3-1
6
4-2-2
3
3-3-2
3
6-2-1
6
5-3-1
6
5-2-2
3
4-4-1
3
4-3-2
6
3-3-3
1
Gesamt
P (Augen)
15
0,0694
21
0,0972
25
0,1157
0,2824
7-9
Die gesuchte Wahrscheinlichkeit ist 0,2824!
Lösung L.6.9.
10
= 1000
= 0, 01
(a) P (H) = h(H)
N
h(E)
80
(b) P (E) = N = 1000 = 0, 08
(c) P (H ∪ E) = P (H) + P (E) = 0, 09
Version 5.1 - 013
167
L.6. Grundlagen der Wahrscheinlichkeitsrechnung
Lösung L.6.10.
blau gelb
Stern
20
30
ohne
50 100
70 130
50
150
200
P(blau oder Stern) = P(blau) + P(Stern) - P (blau
50
20
70
+ 200
- 200
= 0,5.
und Stern) = 200
Lösung L.6.11.
Wird im ersten Zug eine blaue Kugel gezogen, dann sind noch sechs blaue und sechs
6
= 0, 500. Wird im ersten Zug
gelbe Kugeln in der Urne. Daher gilt P (G2|B1) = 12
eine gelbe Kugel gezogen, dann sind in der Urne noch sieben blaue und fünf gelbe
5
Kugeln enthalten. Daher gilt P (G2|G1) = 12
= 0, 417.
Hierbei bedeuten: B1 = imersten. Zug wird eine blaue Kugel gezogen; G1 = im
ersten Zug wird eine gelbe Kugel gezogen; G2 = im zweiten Zug wird eine Kugel
gezogen.
Lösung L.6.12.
P(Maschine nicht okay)
= P(A nicht okay oder B nicht okay oder C nicht okay)
= P(nicht (A okay und B okay und C okay))
= 1 - P(A okay und B okay und C okay)
= 1 - P(A okay) · P(B okay) · P(C okay)
= 1 - (1 - P(A nicht okay)) · (1 - P(B nicht okay)) · (1 - P(C nicht okay))
= 1 - (1 - 0,3) · (1 - 0,2) · (1 - 0,1)
= 1 - 0,7 · 0,8 · 0,9 = 1 - 0,504 = 0,496
168
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
L.7. Zufallsvariablen
Lösung L.7.1. Es gelten
E(X) = 2 · 0, 1 + 3 · 0, 4 + 5 · 0, 2 + 8 · 0, 1 + 9 · 0, 2 = 5
E(X 2 ) = 22 · 0, 1 + 32 · 0, 4 + 52 · 0, 2 + 82 · 0, 1 + 92 · 0, 2 = 31, 6
V AR(X) = E(X 2 ) − E(X)2 = 31, 6 − 52 = 6, 6
Lösung L.7.2. Für alle x ∈ R ist f (x) ≥ 0. Darüber hinaus gilt
Z ∞
−∞
fX (x) dx =
Z 4
0, 5x − 1 dx =
2
1 1 2
· x −x
2 2
4
= 0 − (−1) = 1
2
und somit ist fX (x) ist tatsächlich eine Dichtefunktion.
Für x < 2 hat die Verteilungsfunktion FX (x) den Wert 0, für x ≥ 4 hat die
Verteilungsfunktion den Wert 1. Für 2 ≤ x < 4 gilt
FX (x) =
Z x
−∞
fX (x) dx =
Z x
2
1
1 1 2
t − 1 dt =
· t −t
2
2 2
x
2
1
= x2 − x + 1 .
4
Damit ergibt sich für die Verteilungsfunktion



0

1
FX (x) = 
1 2
x
4
x<2
−x+1 2≤x<4
x≥4
Es gelten
P (2, 5 ≤ x < 3, 5) = FX (3, 5) − FX (2, 5) = 0, 5625 − 0, 0625 = 0, 5
P (3, 5 ≤ x < 4, 5) = FX (4, 5) − FX (3, 5) = 1 − 0, 5625 = 0, 4375
Für den Erwartungswert gilt
E(X) =
Z 4
2
1 1 3 1 2
1 2
x − x dx =
· x − x
2
2 3
2
4
2
8
2
10
=
.
= − −
3
3
3
Für die Berechnung der Standardabweichung wird zuerst die Varianz mit Hilfe der
Formel V AR(X) = E(X 2 ) − E(X)2 berechnet.
1 3
1 1 4 1 3
E(X ) =
x − x2 dx =
· x − x
2 4
3
2 2
2
34
10
2
V AR(X) =
−
= und
3
3
9
s
√
2
2
σX =
=
= 0, 4714 .
9
3
2
Version 5.1 - 013
Z 4
4
2
32
2
34
=
− −
=
,
3
3
3
169
L.7. Zufallsvariablen
Lösung L.7.3.
Z ∞
−∞
fX (x)dx =
Z 0
0dx +
Z 1
−∞
3x2 dx +
0
Z ∞
1
1
0dx = 0 + x3 + 0 = 1
0
Da dieses Integral den Wert 1 hat, und die Funktionswerte stets größer oder gleich
0 sind, ist fX eine Dichtefunktion.
Es gilt
FX (x) =
Z x
−∞
fX (ξ)dξ
Damit ist für x < 0 beziehungsweise für x ≥ 1 die Verteilungsfunktion gleich 0
beziehungsweise 1. Sei 0 ≤ x < 1, dann gilt
FX (x) =
Z x
0
x
fX (ξ)dξ = ξ 3 = x3
0
Damit ergibt sich für die Verteilungsfunktion:



0
FX (x) = x3


1
: x<0
: 0≤x<1
: 1≤x
p(0, 2 ≤ X < 0, 4) = FX (0, 4) − FX (0, 2) = 0, 43 − 0, 23 = 0, 056
E(X) =
Z ∞
−∞
Z∞
V AR(X) =
−∞
xfX (x)dx =
2
Z 1
0
3 1 3
3x3 dx = x4 =
4 0 4
2
x fX (x)dx − E(X) =
Z1
0
4
3x dx −
2
3
4
3 1
9
3
9
3
= −
=
= x5 −
5 0 16
5 16
80
Lösung L.7.4. Die Funktion fX (x) ist stets größer oder gleich 0.
Z ∞
−∞
fX (x)dx =
Z 2
1
2x − 2dx = (x2 − 2x)|21 = (4 − 4) − (1 − 2) = 1
Für 1 < x < 2 gilt:
FX (x) =
170
Z x
1
2ξ − 2dξ = (ξ 2 − 2ξ)|x1 = (x2 − 2x) − (1 − 2) = (x − 1)2
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben



0
FX (x) = (x − 1)2


1
: x≤1
: 1<x≤2
: 2<x
P (1, 2 ≤ X ≤ 1, 4) = FX (1, 4) − FX (1, 2) = 0, 42 − 0, 22 = 0, 16 − 0, 04 = 0, 12
Lösung L.7.5. E(Gewinn)
= p(S) * 100 Euro + p(R) * 50 Euro + p(Schnee) * (-70 Euro)
= 0,5 * 100 Euro + 0,3 * 50 Euro - 0,2 * 70 Euro
= 51 Euro.
Der Erwartungswert für den Gewinn beträgt 51 Euro.
Lösung L.7.6. < doppelt >
Version 5.1 - 013
171
L.8. Spezielle Verteilungen
L.8. Spezielle Verteilungen
Lösung L.8.1.
!
n x
B(x|n; Θ) =
Θ (1 − Θ)n−x
x
x
a)
b)
c)
d)
0
1
2
3
0,4096
0,4096 0,1536 0,0256
0,6561
0,2916 0,0486 0,0036
0,90438 0,09135 0,00415 0,00011
0,36603 0,36973 0,18486 0,06100
4
0,0016
0,0001
0,00000
0,01494
Lösung L.8.2.
P (x) =
1 5 x−1
·( )
6 6
P(1) = 0,16667
P(2) = 0,13889
P(3) = 0,11574
P(4) = 0,09645
P(5) = 0,08038
P(6) = 0,06698
P(7) = 0,05582
P(8) = 0,04651
P(9) = 0,03876
P(10) = 0,03230
P(20) = 0,00522
P(30) = 0,00084
P(40) = 0,00014
P(50) = 0,00002
Lösung L.8.3.
µ = nΘ = 300 ·
1
= 0, 6
500
und
P s(x|0, 6) =
0, 6x −0,6
e
x!
P s(0|0, 6) = 0, 5488
P s(1|0, 6) = 0, 3293
P s(2|0, 6) = 0, 0988
(a) Die Wahrscheinlichkeit für genau 2 Fehler beträgt 0,0988.
172
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
(b) Die Wahrscheinlichkeit für mindestens 2 Fehler beträgt (1 - 0,5488 - 0,3293)
= 0,1219.
ist standardnormalverteilt. Es gelten
Lösung L.8.4. Die Zufallsvariable Z = X−µ
σ
dann:
(a) P (X ≥ 99, 8pF ) = P (Z ≥ −1) = P (Z ≤ 1) = 0, 84134
(b) P (X ≤ 100, 6pF ) = P (Z ≤ 3) = 0, 99865
(c) P (X ≥ 99, 7pF and X ≤ 100, 3pF ) = P (−1, 5 ≤ Z ≤ 1, 5) = P (Z ≤ 1, 5) −
P (Z ≤ −1, 5) = 0, 86638
Lösung L.8.5. < doppelt >
Lösung L.8.6.
H(x|N ; M ; n) =
M
x
!
N −M
n−x
!
N
n
!
N ist die Anzahl der Kugeln insgesamt; M ist die Anzahl der Kugeln mit der
Eigenschaft Gewinnkugel und n ist die Anzahl der Zahlen, die man gewählt hat,
um einen Gewinn zu erzielen.
!
H(4|38; 7; 7) =
H(5|38; 7; 7) =
H(6|38; 7; 7) =
H(7|38; 7; 7) =
Version 5.1 - 013
7
4
!
31
3
!
38
7 !
!
7 31
5 !2
38
7 !
!
7 31
6 !1
38
7 !
!
7 31
7 !0
38
7
=
35·4495
12620256
= 0, 01247
=
21·465
12620256
= 0, 00077
=
7·31
12620256
= 0, 000017195
=
1·1
12620256
= 0, 000000079238
173
L.8. Spezielle Verteilungen
Lösung L.8.7. < doppelt >
Lösung L.8.8. < doppelt >
Lösung L.8.9. Die Zufallsvariable Z = X−µ
ist standardnormalverteilt. Es gelten
σ
dann:
(a) P (µ−σ ≤ X ≤ µ+σ) = P (−1 ≤ Z ≤ 1) = 0, 84134−(1−0, 84134) = 0, 68268
(b) P (µ − 2σ ≤ X ≤ µ + 2σ) = P (−2 ≤ Z ≤ 2) = 0, 97725 − (1 − 0, 97725) =
0, 95450
(c) P (µ − 3σ ≤ X ≤ µ + 3σ) = P (−3 ≤ Z ≤ 3) = 0, 99865 − (1 − 0, 99865) =
0, 99730
(d) P (X ≤ µ + 1, 5σ) = P (Z ≤ 1, 5) = 0, 93319
(e) P (µ − 0, 5σ ≤ X) = P (−0, 5 ≤ Z) = 0, 69146
Lösung L.8.10. (a) Die die Normalverteilung symmetrisch um den Erwartungswert ist, sollte der Sollwert in der Mitte des Toleranzbereiches liegen, also bei 0,1
mm.
(b) Für die Maschine A gilt:
0, 118 − 0, 1
0, 082 − 0, 1
<Z<
)
0, 01
0, 01
= P (−1, 8 < Z < 1, 8) = 0, 96407 − (1 − 0, 96407) = 0, 92814
P (0, 082mm < X < 0, 118mm) = P (
Damit gilt für die Maschine A, dass die Wahrscheinlichkeit für eine brauchbare
Folie bei 0,92814 liegt. Das heißt bei 1000 Folien sind 928 brauchbar, die Stückkosten sind dann 20Euro
= 0,02155 Euro.
928
Für die Maschine B gilt:
0, 118 − 0, 1
0, 082 − 0, 1
<Z<
)
0, 018
0, 018
= P (−1 < Z < 1) = 0, 84134 − (1 − 0, 84134) = 0, 68268
P (0, 082mm < X < 0, 118mm) = P (
Damit gilt für die Maschine B, dass die Wahrscheinlichkeit für eine brauchbare
Folie bei 0,68268 liegt. Das heißt bei 1000 Folien sind 683 brauchbar, die Stück= 0,02343 Euro.
kosten sind dann 16Euro
683
Es ist daher günstiger, auf der Maschine A zu produzieren.
Lösung L.8.11. Die Zufallsvariable X, der Anzahl der Studenten, welche die
Klausur bestanden haben, ist binomialverteilt mit den Parametern n = 5 und θ =
0, 7. (Das Ereignis A (= Klausur wird bestanden) hat die Wahrscheinlichkeit 0,7.)
Das heißt, die Anzahl der Studenten (von den 5 ausgewählten), die die Klausur
bestehen ist eine B(n, θ)-verteilte Zufallsvariable. Die gesuchten Werte sind die
Werte B(i|5; 0, 7) für i = 0, 1, 2, 3, 4 und 5.
174
Version 5.1 - 013
Anhang L. Lösungen der Aufgaben
!
B(0|5; 0, 7) =
B(1|5; 0, 7) =
B(2|5; 0, 7) =
B(3|5; 0, 7) =
B(4|5; 0, 7) =
B(5|5; 0, 7) =
5
· 0, 70 · 0, 35
0!
5
· 0, 71 · 0, 34
1!
5
· 0, 72 · 0, 33
2!
5
· 0, 73 · 0, 32
3!
5
· 0, 74 · 0, 31
4!
5
· 0, 75 · 0, 30
5
= 0, 00243
= 0, 02835
= 0, 13230
= 0, 30870
= 0, 36015
= 0, 16807
Lösung L.8.12. Man muss dann mehr als dreimal würfeln, wenn bei den ersten
drei versuchen jeweils keine 6 gewürfelt wird. Diese Wahrscheinlichkeit ist gleich
= 0,5787.
( 65 )3 = 125
216
Lösung L.8.13. Die Wahrscheinlichkeit ist poissonverteilt mit µ = 1, 6, also ist
die Wahrscheinlichkeitsfunktion gegeben durch
fX (x) =
µx −µ
e
x!
Die Wahrscheinlichkeit, dass in einer Minute i Fahrzeuge passieren ist somit gleich
P s(i|1, 6).
P s(0|1, 6) =
P s(1|1, 6) =
P s(2|1, 6) =
P s(3|1, 6) =
P s(4|1, 6) =
P s(5|1, 6) =
1,60 −1,6
e
0!
1,61 −1,6
e
1!
1,62 −1,6
e
2!
1,63 −1,6
e
3!
1,64 −1,6
e
4!
1,65 −1,6
e
5!
= 0, 2019
= 0, 3230
= 0, 2584
= 0, 1378
= 0, 0551
= 0, 0141
(a) p(mehr als 3 Fahrzeuge) = 1 - p(0 bis 3 Fahrzeuge) = 1 - P s(0|1, 6) - P s(1|1, 6)
- P s(2|1, 6) - P s(3|1, 6) = 0,0789
Die Wahrscheinlichkeit, dass in einer Minute mehr als 3 Fahrzeuge vorbeifahren
beträgt somit 7,89%.
(b) Für poissonverteilte unabhängige Zufallsvariablen X und Y mit den Parametern µ und λ gilt, dass die Zufallsvariable Z = X + Y ebenfalls poissonverteilt
ist, der Parameter von Z ist µ + λ. Das heißt die Wahrscheinlichkeit, dass in 5
Version 5.1 - 013
175
L.8. Spezielle Verteilungen
Minuten i Fahrzeuge den Beobachtungspunkt passieren ist poissonverteilt mit dem
Parameter µ = 8.
P s(0|8) =
P s(1|8) =
P s(2|8) =
P s(3|8) =
P s(4|8) =
P s(5|8) =
80 −8
e
0!
81 −8
e
1!
82 −8
e
2!
83 −8
e
3!
84 −8
e
4!
85 −8
e
5!
= 0, 0003
= 0, 0027
= 0, 0107
= 0, 0286
= 0, 0573
= 0, 0916
p(weniger als 5 Fahrzeuge) = P s(0|8) + P s(1|8) + P s(2|8) + P s(3|8) + P s(4|8)
+ P s(5|8) = 0,1912.
Die Wahrscheinlichkeit, dass in fünf Minuten höchstens 5 Fahrzeuge vorbeifahren
beträgt 19,12%.
Lösung L.8.14. Die Zufallsvariable X der erreichten Punktzahl ist N (60; 10)ist N (0; 1)-verteilt, das heißt standardnorverteilt. Die Zufallsvariable Z = X−60
10
malverteilt.
) = P (Z < −1) = P (Z > 1) = 1 − P (Z < 1) =
(a) P (X < 50) = P (Z < 50−60
10
1 − 0, 84134 = 0, 15866, das heißt circa 16%.
(b) P (80 < X < 95) = P ( 80−60
< Z < 95−60
) = P (2 < Z < 3, 5) = P (Z < 3, 5) 10
10
P (Z < 2) = 0, 99977 - 0, 97725 = 0, 02252, das heißt circa 2,3%.
) = P (Z > 60−g
) = 0, 1 → P (Z < 60−g
) = 0, 9 →
(c) P (X < g) = P (Z < g−60
10
10
10
60−g
) = 1, 285 → g = 47, 15, das heißt, die Mindestpunktzahl muss auf 47 Punkte
10
gesetzt werden.
176
Version 5.1 - 013
Literatur
Arens, Tilo u. a. (2008). Mathematik. 1. Aufl. Heidelberg: Spektrum Akademischer
Verlag. isbn: 9783827417589.
Bosbach, Gerd und Jens Jürgen Korff (2011). Lügen mit Zahlen: Wie wir mit
Statistiken manipuliert werden. 401. München: Heyne. isbn: 9783453173910.
Eichholz, Wolfgang und Eberhard Vilkner (2002). Taschenbuch der Wirtschaftsmathematik: Mit 208 Beispielen und zahlreichen Tabellen. 3. Aufl. München [u.a.]:
Fachbuchverl. Leipzig im Hanser-Verl. isbn: 9783446220805.
Fahrmeir, Ludwig (2003a). Arbeitsbuch Statistik: Mit 101 Tabellen. 3. Aufl. Berlin
[u.a.]: Springer. isbn: 9783540440307.
– (2003b). Statistik: Der Weg zur Datenanalyse ; mit 25 Tabellen. 4. Aufl. Berlin
[u.a.]: Springer. isbn: 9783540440000.
Fischer, Gerd (2005). Stochastik einmal anders: Parallel geschrieben mit Beispielen
und Fakten, vertieft durch Erläuterungen. 1. Aufl. Wiesbaden: Vieweg. isbn:
9783528039677.
Henze, Norbert (2003). Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls. 4. Aufl. Braunschweig: Vieweg. isbn: 9783528368944.
Rößler, Irene und Albrecht Ungerer (2011). Statistik für Wirtschaftswissenschaftler: Eine anwendungsorientierte Darstellung. 2., überarb. Aufl. BA Kompakt.
Heidelberg [u.a.]: Physica-Verlag. isbn: 9783790826340.
Schwarze, Jochen (1997). Grundlagen der Statistik. 6. Aufl. Herne [u.a.]: Verl. Neue
Wirtschafts-Briefe. isbn: 3482568669.
– (1999). Aufgabensammlung zur Statistik. 3. Aufl. Herne: Verl. Neue WirtschaftsBriefe. isbn: 9783482434532.
– (2001). Beschreibende Verfahren. 9. Aufl. Herne [u.a.]: Verl. Neue WirtschaftsBriefe. isbn: 9783482564390.
Wewel, Max-Christoph (2011). Statistik im Bachelor-Studium der BWL und VWL:
Methoden, Anwendung, Interpretation ; mit herausnehmbarer Formelsammlung.
2., erw. Aufl. Wirtschaft. München und Boston [u.a.]: Pearson Studium. isbn:
9783868940541.
Version 5.1 - 013
177
Herunterladen