Skript Stochastik Beschreibende Statistik, Wahrscheinlichkeitsrechnung und schließende Statistik Andreas Zeh-Marschke Version 5.1 - 013 Diplom-Mathematiker Andreas Zeh-Marschke Tauberring 16 b, 76344 Eggenstein-Leopoldshafen E-Mail Andreas(at)Zeh-Marschke.de Homepage http://www.Zeh-Marschke.de Impressum c Copyright: 2001 - 2016 (Version: 5.1 - 013) Layout und Satz: Andreas Zeh-Marschke Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen und so weiter in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und MarkenschutzGesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürfen. 2 Version 5.1 - 013 Vorwort Die Stochastik ist das Teilgebiet der Mathematik, das sich mit Häufigkeiten und Wahrscheinlichkeiten befasst. Zur Stochastik gehören die Teilbereiche beschreibende Statistik, Kombinatorik, Wahrscheinlichkeitsrechnung und schließende Statistik. Dieses Skript entstand aus Vorlesungen zum Thema Statistik, welche ich seit 2001 an der Dualen Hochschule Baden-Württemberg Karlsruhe (ehemalige Berufsakademie Karlsruhe) und an der Hochschule Karlsruhe - Technik und Wirtschaft (ehemalige Fachhochschule Karlsruhe) in verschiedenen Studiengängen halte. Der Umfang der Vorlesung (inklusive Übungen) umfasst dabei etwa 30 Stunden. Dies zeigt, dass nur ein kleiner Umfang der Stochastik behandelt werden kann. Mit jedem neuen Kurs zur Statistik gibt es neue Anregungen und Änderungen, die ich in das Skript einarbeite. Ab und an steht auch größere Überarbeitung an. In dieser Version wurden größere Veränderungen durchgeführt. Ursprüngliche Basis der Vorlesung stellten die Bücher von Schwarze dar (siehe Schwarze 2001, Schwarze 1997, Schwarze 1999). Inzwischen habe ich auch weitere Bücher herangezogen, die mir interessante Anregungen gegeben haben. Dies sind insbesondere Fahrmeir 2003b, Fahrmeir 2003a, Fischer 2005 und Henze 2003. Weitere Bücher die den Umfang sehr gut abdecken sind Wewel 2011 und Rößler und Ungerer 2011. Neben dieses speziellen Fachbüchern sind auch umfassendere Werke sehr anregend: Eichholz und Vilkner 2002 und insbesondere das sehr umfassende Werk Arens u. a. 2008. Andreas Zeh-Marschke Eggenstein-Leopoldshafen, 23.08.2016 Version 5.1 - 013 3 Inhaltsverzeichnis 1. Grundlagen 1.1. Einführung . . . . 1.2. Datenuntersuchung 1.3. Merkmale . . . . . 1.4. Aufgaben . . . . . . . . . . . . . 2. Univariate Daten 2.1. Darstellung univariater 2.2. Mittelwerte . . . . . . 2.3. Streuungsmaße . . . . 2.4. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . Daten . . . . . . . . . . . . . . . . . . . . 3. Bivariate Daten 3.1. Darstellungen bivariater Daten 3.2. Zusammenhangsanalyse . . . . 3.3. Regressionsrechnung . . . . . . 3.4. Aufgaben . . . . . . . . . . . . 4. Zeitreihenanalysen 4.1. Zeitreihen . . . 4.2. Bestandsanalyse 4.3. Indexzahlen . . 4.4. Aufgaben . . . . . . . . . . . . . . . 5. Kombinatorik 5.1. Permutationen . . . 5.2. Kombinationen . . . 5.3. Binomialkoeffizienten 5.4. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 13 17 27 . . . . 29 29 37 43 48 . . . . 53 53 57 62 68 . . . . 71 71 73 78 84 . . . . 87 88 90 92 95 6. Grundlagen der Wahrscheinlichkeitsrechnung 97 6.1. Zufallsexperiment und Ereignis . . . . . . . . . . . . . . . . . . . . 97 6.2. Zusammen gesetzte Aufgaben . . . . . . . . . . . . . . . . . . . . . 103 6.3. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Version 5.1 - 013 5 Inhaltsverzeichnis 7. Zufallsvariablen 115 7.1. Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7.2. Parameter von Zufallsvariablen . . . . . . . . . . . . . . . . . . . . 117 7.3. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 8. Spezielle Verteilungen 8.1. Diskrete Gleichverteilung . . . 8.2. Stetige Gleichverteilung . . . 8.3. Binomialverteilung . . . . . . 8.4. Hypergeometrische Verteilung 8.5. Geometrische Verteilung . . . 8.6. Poissonverteilung . . . . . . . 8.7. Exponentialverteilung . . . . . 8.8. Normalverteilung . . . . . . . 8.9. Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 . 125 . 126 . 126 . 127 . 129 . 130 . 131 . 132 . 134 9. Schließende Statistik 137 9.1. Parameterschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . 137 9.2. Intervallschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 9.3. Hypothesentests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 A. Tabellen 143 A.1. Basisdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 A.2. Tabelle der Normalverteilung . . . . . . . . . . . . . . . . . . . . . 145 L. Lösungen der Aufgaben L.1. Grundlagen . . . . . . . . . . . . . . . . . . L.2. Univariate Daten . . . . . . . . . . . . . . . L.3. Bivariate Daten . . . . . . . . . . . . . . . . L.4. Zeitreihenanalysen . . . . . . . . . . . . . . L.5. Kombinatorik . . . . . . . . . . . . . . . . . L.6. Grundlagen der Wahrscheinlichkeitsrechnung L.7. Zufallsvariablen . . . . . . . . . . . . . . . . L.8. Spezielle Verteilungen . . . . . . . . . . . . . Literatur 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 . 148 . 149 . 154 . 159 . 163 . 166 . 169 . 172 177 Version 5.1 - 013 Abbildungsverzeichnis 1.1. Beispiel: ordinal messbares Merkmal - Noten bei einer Klausur . . . 22 2.1. 2.2. 2.3. 2.4. Beispiel: Beispiel: Beispiel: Beispiel: nominal messbares Merkmal - Kreisdiagramm ordinal messbares Merkmal - Alter . . . . . . Notenverteilung - grafische Darstellung . . . . Summenhäufigkeit - Alter . . . . . . . . . . . 6.1. 6.2. 6.3. 6.4. 6.5. 6.6. 6.7. Zwei Komponenten hintereinander . . Mehrere Komponenten hintereinander Zwei Komponenten parallel . . . . . Drei Komponenten parallel . . . . . . Mehrere Komponenten parallel . . . Aggregat aus drei Komponenten . . . Bauplan Radio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 32 33 36 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 104 105 106 107 108 109 7.1. Verteilung Zeitbedarf . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Version 5.1 - 013 7 Tabellenverzeichnis 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. Beispieldaten: Noten einer Klausur . Beispiel nominal messbarer Merkamle Beispiel: ordinal messbares Merkmal Beispiel: ordinal messbare Merkmale Beispiel: kardinal messbare Merkmale Klassen bei Körpergröße . . . . . . . . . . . . . . . Noten . . . . . . . . . . . . . . . . bei . . . . . . 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. 2.9. Eigenschaften absolute und relative Häufigkeiten . . Beispiel: Häufigkeitsverteilung Alter . . . . . . . . . Beispiel: Tabelle Familienstand . . . . . . . . . . . Beispiel: Notenverteilung - tabellarische Darstellung Häufigkeitstabelle - horizontal . . . . . . . . . . . . Häufigkeitstabelle - vertikal . . . . . . . . . . . . . Beispiel: Körpergröße gruppiert . . . . . . . . . . . Beispiel: Summen- und Resthhäufigkeit Alter . . . . Beispielsrechnung geometrisches Mittel . . . . . . . 3.1. Zwei-dimensionale Häufigkeitstabelle . . . . . . 3.2. Beispiel: Körpergröße-Gewicht-Tabelle . . . . . 3.3. Beispiel Häufigkeitsverteilung . . . . . . . . . . 3.4. Bedingte Verteilung von Y . . . . . . . . . . . . 3.5. Bedingte Verteilung von X . . . . . . . . . . . . 3.6. Beispiel Häufigkeitsverteilung . . . . . . . . . . 3.7. Bedingte Verteilung Y . . . . . . . . . . . . . . 3.8. Bedingte Verteilung X . . . . . . . . . . . . . . 3.9. Beispiel zwei-dimensionale Verteilung . . . . . . 3.10. Tabelle für Beispiel 3.8 . . . . . . . . . . . . . . 3.11. Aufgabe zwei-dimensionale Häufigkeitsverteilung 3.12. Aufgabe zwei-dimensionale Häufigkeitsverteilung . . . . . . einer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Klausur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 21 22 22 24 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 31 31 33 34 34 35 36 41 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 56 57 58 58 58 59 59 61 66 68 68 4.1. Beispiel: gleitender Durchschnitt 3. Ordnung . . . . . . . . . . . . . 72 4.2. Beispiel: Gleitender Durchschnitt 4. Ordnung . . . . . . . . . . . . . 73 4.3. Bestandsveränderungen . . . . . . . . . . . . . . . . . . . . . . . . . 75 Version 5.1 - 013 9 Tabellenverzeichnis 4.4. Bestandsverlauf Produkt A . . . . . . . . . 4.5. Bestandsverlauf Produkt B . . . . . . . . . 4.6. Energiepreisentwicklung . . . . . . . . . . 4.7. Energiemengenentwicklung . . . . . . . . . 4.8. Verfügbares Einkommen private Haushalte 4.9. Bestandsveränderung Vorrat . . . . . . . . 4.10. Umsatz- und Preisentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 79 81 83 84 85 5.1. Einführungsbeispiel Kombinatorik . . . . . . . . . . . . . . . . . . . 87 5.2. Zusammenfassung Permutationen und Kombinationen . . . . . . . . 93 6.1. 6.2. 6.3. 6.4. Beispiel 6.8 . . . . . . . . . . . . . . . . . Wahrscheinlichkeit bei zwei Ereignissen . . Beispiel 6.9 . . . . . . . . . . . . . . . . . Verfügbarkeiten Komponenten vom Radio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 102 102 109 7.1. diskrete, endliche Wahrscheinlichkeitsverteilung . . . . . . . . . . . 116 7.2. Wahrscheinlichkeitsverteilung . . . . . . . . . . . . . . . . . . . . . 122 8.1. 8.2. 8.3. 8.4. Beispiel B(4; 0, 5)-Verteilung . . . Beispiel: Fahrzeugzählung . . . . Beispiel: Poissonverteilung . . . . Beispiel: Brenndauer Glühbirnen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 131 131 134 9.1. 9.2. 9.3. 9.4. Untersuchungsparameter . . . . . . . . . Parameter in Abhängigkeit von der Güte Beispiel: Stichprobenexperiment . . . . . Fehler 1. und 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 140 141 141 A.1. Basisdatensatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 10 Version 5.1 - 013 Kapitel 1. Grundlagen Zuerst (Abschnitt 1.1) wird anhand einiger Beispiele Fragestellungen und Anwendungsmöglichkeiten der Stochastik erläutert. Einige Beispiele, leider nicht alle, werden im Rahmen dieses Skripts weiter behandelt. Danach (Abschnitt 1.2) wird der Ablauf einer statistischen Untersuchung erläutert. Dabei werden auch verschiedene Quellen von Daten dargelegt. Danach (Abschnitt 1.3) werden einige statistische Grundbegriffe eingeführt, die in allen Abschnitten benötigt werden. Speziell der Begriff Merkmal wird präzisiert. 1.1. Einführung Die Stochastik umfasst die Teilbereiche mathematische Statistik, Kombinatorik, Wahrscheinlichkeitsrechnung und schließende Statistik. Dazu zuerst einige Beispiele, welche die verschiedenen Anwendungsmöglichkeiten verdeutlichen. Beispiele von Anwendungsmöglichkeiten Beispiel 1.1 (Noten einer Klausur). Die tabellarische Verteilung der Noten einer Klausur (siehe Tabelle 1.1) beschreibt das Ergebnis in einer Klausur. sehr gut 2 Note Anzahl gut befriedigend 10 11 ausreichend mangelhaft 3 3 Tabelle 1.1.: Beispieldaten: Noten einer Klausur Version 5.1 - 013 11 1.1. Einführung Es sind die Daten für ein Beispiel der beschreibenden Statistik. Dabei sind auch weitere Daten, die daraus gewonnen werden von Interesse. Welchen Mittelwert haben die Ergebnisse? Wie sind die Daten gestreut? Beispiel 1.2 (Bevölkerungsstatistik). Die Verteilung der Bevölkerung nach Altersjahrgängen und getrennt nach Männern und Frauen ist die berühmte Bevölkerungspyramide, die schon längst, bei uns in Deutschland, ein Pilz ist. Die Frage nach dem durchschnittlichen Alter von Männer oder Frauen gehört zur beschreibenden Statistik, die Frage der Lebenserwartung von Männern oder Frauen eines bestimmten Jahrgangs gehört zur schließenden Statistik und ist für Lebensversicherungen von Bedeutung. Durch Volkszählungen werden verschiedene Merkmale für die Einwohner, nicht nur Alter und Geschlecht, gesammelt. Aus diesen Angaben können Informationen gewonnen werden, die für Planungen und Entscheidungen als Basis dienen. Beispiel 1.3 (Umsatz). Die Statistik für den Umsatz einer Unternehmung enthält die Umsätze einzelner Artikel oder Gruppen von Artikeln, aufgegliedert nach Perioden. Dieser Teil der beschreibenden Statistik ist Basis für Entscheidungen in Unternehmen. Beispiel 1.4 (Auslastung von Mitarbeitern). Die Statistik für die Auslastung einer Abteilung enthält die verbuchten Stunden der Mitarbeiter je Projekt. Hierzu können dann vielfältige Auswertungen erfolgen, die dann wiederum Basis für operative Entscheidungen sind. Beispiel 1.5 (Zahlenkombinationen). Wie viele möglichen Zahlenkombinationen gibt es bei der Ziehungen der Lottozahlen (6 aus 49)? Dies ist eine Frage der Kombinatorik. Die Frage, wie wahrscheinlich ein Sechser im Lotto ist, führt direkt zur Wahrscheinlichkeitsrechnung. Beispiel 1.6 (Aktienkurs). Die grafische Darstellung der Aktienkurse über einen längeren Zeitraum ist ein Beispiel für eine Zeitreihe, ein Beispiel einer bivariaten beschreibenden Statistik. Mittels verschiedener statistischer Kennzahlen, werden dann Prognosen für den zukünftigen Kursverlauf erstellt, was zur schließenden Statistik gehört. Beispiel 1.7 (Verkehrszählung). Durch eine Zählung des Verkehrs werden Aussagen zur Dichte des Verkehrs und der dadurch bedingten Belastung beispielsweise eines Verkehrsknotenpunktes erfasst. Damit erhalten Verkehrsplaner wertvolle Informationen, um Entscheidungen zu treffen. Beispiel 1.8 (Sonntagsfrage). Bei der Sonntagsfrage wird eine Prognose für das Wahlverhalten und damit für das Wahlergebnis erstellt. Aus einer Stichprobe (die 12 Version 5.1 - 013 Kapitel 1. Grundlagen befragten Wähler) wird eine Aussage über den Wahlausgang erstellt. Manchmal stimmt die Prognose, aber nicht immer. Es gibt dazu den passenden Spruch „Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen.“. Dieser Spruch oder Zitat wird mehreren Personen zugesprochen. Das heißt, es ist unklar, wer diese zutreffende Bemerkung erstellt hat. Beispiel 1.9 (Versuchsauswertung). Bei einem physikalischen Experiment wird der Zusammenhang zweier Messgrößen erfasst. Es soll der Zusammenhang zwischen den Messgrößen beschrieben werden. Dies führt zur Regressionsrechnung, einem Teil der beschreibenden Statistik. Diese Beispiele zeigen, dass uns die Statistik an vielen Stellen begegnet. Zum Teil werden vorhandene Daten verdichtet, komprimiert dargestellt, damit wir den Überblick bewahren. In anderen Bereichen werden Daten als Entscheidungsgrundlage aufbereitet oder Prognosen erstellt. Probleme mit Statistiken Im Volksmund gibt es drei Formen der Lüge: die Notlüge, die gemeine Lüge und die Statistik. Manchmal sagt man auch Traue keiner Statistik, die du nicht selber gefälscht hast. Dies zeigt deutlich, dass das Vertrauen in die Statistik nicht das Beste ist. Es zeugt jedoch auch davon, dass beim Lesen und der Interpretation von Statistiken viele Fehler gemacht werden können. Das Lesen und das Interpretieren von Statistiken ist daher stets sorgsam durchzuführen. An einigen Stellen werden solche Beispiele angeführt. Lesenswert für die Beleuchtung der Möglichkeiten der Manipulation mit Statistiken ist das Buch Bosbach und Korff 2011. Hier sind viele Beispiele aufgeführt, die teilweise lustig sind, aber in der Regel nachdenklich machen. 1.2. Datenuntersuchung 1.2.1. Datenerfassungsprozess Eine statistische Untersuchung gliedert sich idealtypisch in fünf Phasen. Version 5.1 - 013 13 1.2. Datenuntersuchung 1. In der Phase Planung wird der Untersuchungsgegenstand klar und eindeutig definiert. Es ist zu klären, welche Information erhoben werden sollen, um ein Entscheidungsproblem zu lösen. Hierzu ist festzulegen, welches die statistische Masse oder Grundgesamtheit ist. Dann ist zu klären, welche Merkmale (für eine Klärung des Begriffes Merkmal, siehe Abschnitt 1.3) erhoben werden sollen. Darüber hinaus ist zu klären, mit welchem Erhebungsverfahren die Daten erhoben werden. Wird eine Vollerhebung gemacht oder nur eine Stichprobe. In dieser Planungsphase werden auch die organisatorischen und technischen Fragen geklärt. 2. In der Phase Datenerhebung werden nach einer sorgfältigen Vorbereitung die Daten erfasst. Bei einer Primärerhebung werden die Daten unmittelbar durch Experiment, Beobachtung oder Befragung erfasst. Bei einer Sekundärerhebung greift man auf bereits vorhandene Daten zurück. Hierbei können auf amtliche oder nicht-amtliche Daten zurückgegriffen werden. Werden die Daten durch eine Befragung von Personen erfasst, so ist die Wahl der Fragestellung sehr sorgfältig zu wählen, um nicht durch die Fragestellung die Antworten zu beeinflussen und somit das Ergebnis zu beeinflussen. 3. In der Phase Datenaufbereitung werden die gewonnenen Daten aufbereitet. Hierzu gehört auch die Prüfung der Daten, das Erkennen unplausibler Daten, die gegebenenfalls aus der weiteren Untersuchung ausgeschlossen werden. Zur Datenaufbereitung gehören auch Darstellungen von Daten, zum Beispiel in tabellarischer Form oder als Häufigkeitsverteilungen. Auch grafische Darstellungen der Daten gehören zur Datenaufbereitung. 4. In der Phase Datenauswertung oder auch statistische Analyse werden mittels mathematischer Verfahren Analysen der Daten durchgeführt. Hierbei werden Kenndaten, wie beispielsweise der Mittelwert, ermittelt, welche die Daten charakterisieren. In dieser Phase helfen oftmals Tabellenkalkulationsprogramme oder spezielle und mächtige statistische Programme. 5. In der Phase Interpretation und Dokumentation werden die gewonnenen Daten im Kontext der Anwendung interpretiert und beurteilt. Ebenso wird die Datenuntersuchung dokumentiert, damit die Ergebnisse nachvollziehbar sind. 14 Version 5.1 - 013 Kapitel 1. Grundlagen 1.2.2. Datenerhebung Bei der Datenerhebung kann es verschiedene Herausforderungen geben. Können alle Elemente der Grundgesamtheit erfasst werden, also eine Vollerhebung durchgeführt werden oder kann nur eine Stichprobe, das heißt ein Ausschnitt aus der Grundgesamtheit erhoben werden. Wenn nur eine Stichprobe erhoben werden kann, wie können oder müssen die Elemente der Stichprobe ausgewählt werden, damit wirklich auch Aussagen für die Grundgesamtheit gewonnen werden können. Wie kann aus dem Daten der Stichprobe, die mittels der beschreibenden Statistik gewonnen werden, auf Daten der Grundgesamtheit geschlossen werden. Dies ist Aufgabe der schließenden Statistik . Für die Datenerhebung gibt es auch noch weitere Fragestellungen. Es ist leider nicht immer möglich, oder nicht immer sinnvoll oder wirtschaftlich, alle Daten für die Untersuchung heranzuziehen. Beispiel 1.10 (Lebensdauer von Glühbirnen). In einer Fabrik, in der Glühbirnen hergestellt werden, soll statistisch untersucht werden, wie lange die Glühbirnen halten. Dazu können beispielsweise die Glühbirnen betrieben werden, bis sie kaputt sind. Nach dieser Untersuchung ist eine Verwendung der Glühbirnen nicht mehr möglich. Daher soll durch Untersuchung nur eines Teils der Produktion auf die Qualität gefolgert werden. Aus der Untersuchung eines Teiles der Produktion wird somit auf die gesamte Produktion geschlossen. Beispiel 1.11 (Gewicht von Mehltüten). In einer Fabrik wird Mehl in 1kg-Beutel verpackt. Um die Genauigkeit der Füllmengen zu überprüfen, wird nur ein Teil der verpackten Beutel gewogen. Durch die Messung wird das Produkt nicht zerstört, es wäre jedoch nicht wirtschaftlich, alle Packungen zu wiegen. Aus den Daten der untersuchten Packungen wird auf die Genauigkeit der Füllmengen geschlossen. Beispiel 1.12 (Sendeplatz). Für viele Entscheidungen auch in Unternehmen werden vielfältige statistische Daten benötigt. Soll im Marketing der Sendeplatz für einen Werbespot ermittelt werden, so ist wichtig zu wissen, welche Personen zu welchen Zeiten welche Sendungen ansehen! Bei diesen Beispielen wird aus der Untersuchung auf einer Stichprobe Aussagen über die Gesamtheit gemacht. Dies ist ein Teil der schließenden Statistik, die weiter später betrachtet wird. Für Aussagen zur schließenden Statistik wird die Wahrscheinlichkeitsrechnung benötigt, die hierzu eingeführt wird. In vielen Fällen werden die Daten für die Statistik selber erhoben. Hierzu gibt es viele, fast unzählige Beispiele für Sachverhalte, die von Interesse sind, über die Aussagen getroffen werden: Version 5.1 - 013 15 1.2. Datenuntersuchung • Kunden einer Firma, • Qualität der Produktion • Qualität von Dienstleistungen (z.B. die Pünktlichkeit bei Zügen) • Kaufverhalten der Kunden • Durchschnitt der Noten bei einer Klausur • Studiendauer an einer Universität • ... Neben diesen Statistiken, welche durch die Firmen oder Institutionen selber erstellt werden, gibt es auch offizielle Statistiken. Bekannte Vertreter hierfür sind: • Inflationsrate • Arbeitslosigkeit und Beschäftigung • Daten zu Wirtschaft und Ausbildung • Bevölkerung • Wahlergebnisse • ... 1.2.3. Datenquellen Es gibt viele amtliche und nicht-amtliche Stellen, welche Daten bereitstellen. Diese offiziellen Statistiken werden beispielsweise vom Statistischen Amt der EU (http: //epp.eurostat.ec.europa.eu), vom Statistischen Bundesamt in Deutschland (http://www.destatis.de) oder auch von den Landesämtern für Statistik der einzelnen Bundesländer (beispielsweise http://www.statiatik-bw.de) geführt. Daneben gibt es offizielle Statistiken von Institutionen für spezielle Fragestellungen, wie beispielsweise die statistischen Daten der Deutschen Bundesbank (http://www.bundesbank.de) oder Daten der Bundesagentur für Arbeit (http: //www.arbeitsagentur.de). Daneben gibt es auch nicht-amtliche Statistiken, auf deren Basis weitere Auswertungen durchgeführt werden können. So gibt es Statistiken von Wirtschaftsforschungsinstitute, wie beispielsweise vom Deutsches Institut für Wirtschaftsforschung Berlin (DIW) (http://www.diw.de) oder das Institut für Weltwirtschaft (IfW) in Kiel (http://www.uni-kiel.de/IfW/), von Markt- und Meinungsforschungsinstituten (beispielsweise Institut für Demoskopie Allensbach (IfD) (http: 16 Version 5.1 - 013 Kapitel 1. Grundlagen //www.ifd-allensbach.de) oder der Gesellschaft für Konsum-, Markt- und Absatzforschung (GfK) aus Nürnberg (http://www.gfk.com) oder von Wirtschaftsverbänden (Beispiel Deutsche Industrie- und Handelskammern (http://www.ihk. de) oder der Deutsche Gewerkschaftsbund (http://www.dgb.de). 1.3. Merkmale In diesem Abschnitt wird genauer untersucht, welche Gegenstände in der Statistik untersucht werden. Zuerst (Abschnitt 1.3.1) wird die statische Masse betrachtet. Dann (Abschnitt 1.3.2) werden die einzelnen Einheiten der Untersuchungen beleuchtet. Was für unterschiedliche Typen von Untersuchungsgegenständen gibt es. Abschließend (Abschnitt 1.3.3) werden einzelne Daten zu Klassen zusammengefasst. 1.3.1. Massen und Einheiten Bei statistischen Untersuchungen werden bestimmte Objekte betrachtet. Dies können • Personen (Einwohner, Studierende, Beschäftigte, Kunden, . . .), • Gegenstände (Lagerpositionen, Produkte, Konten, Wohnungen, . . .), • Ereignisse (Unfall, Geburt, Kauf, . . .) oder • Einheiten (Unternehmen, Haushalte, Familien, Verwaltungsbezirke. . . . sein. Beispiel 1.13. Bei einer Volkszählung werden alle Einwohner befragt. Jeder Einzelne ist aufgefordert, Daten über sich herauszugeben: Alter, Familienstand, höchster Abschluss in der Schule, Beruf, Entfernung zur Arbeitsstätte, Einkommen, Anzahl der Kinder, . . . und viele weitere Daten. Die gesamte Bevölkerung wird hierbei gefragt. Jeder einzelne Einwohner ist eine Einheit der Untersuchung. Die Daten der einzelnen Einwohner werden aggregiert. Es werden Informationen für die gesamte Bevölkerung gesammelt, um daraus Aussagen über die Bevölkerung als Ganzes zu treffen. Version 5.1 - 013 17 1.3. Merkmale Definition 1.1 (Statistische Einheit, statistisches Merkmal, statistische Masse). Ein einzelnes Objekt einer statistischen Untersuchung heißt eine statistische Einheit. Sie ist Trägerin der Informationen, der Eigenschaften, der statistischen Merkmale, für die man sich bei der Untersuchung interessiert. Die Gesamtheit der statistischen Einheiten, welche für die Untersuchung von Bedeutung sind heißt statistische Masse . Sie ist im Hinblick auf das Ziel der Untersuchung durch sachliche, räumliche und zeitliche Kriterien identifiziert beziehungsweise abgegrenzt. Hierzu einige weitere Beispiele für statistische Massen und statistische Einheiten und Daten, welche erhoben werden können. Beispiel 1.14. Bei einer Volkszählung in Deutschland ist jeder einzelner Einwohner von Deutschland zu einem bestimmten Zeitpunkt eine statistische Einheit, die gesamte Bevölkerung von Deutschland ist die statistische Masse. Daten die dabei erhoben werden können sein: Wohnort, Beruf, Alter, Anzahl der Kinder, Einkommen, Entfernung zur Arbeitsstätte, . . .. Beispiel 1.15. Bei der Untersuchung der Projekte in einer Abteilung für Softwareentwicklung ist jedes einzelne Projekt eine statistische Einheit, die Gesamtzahl der Projekte der Entwicklungsabteilung ist die statistische Masse. Daten, welche untersucht werden können sein: Anzahl Mitarbeiter, Budget, Ist-Kosten, Ist-Stunden, Rest-Stunden, Datum Auslieferung, . . .. Bei diesem Beispiel kann man sich bezüglich der untersuchten Projekte genauer Fragen, welche Projekte untersucht werden. Alle derzeit aktiven Projekte, alle Projekte, welche im aktuellen Jahr aktiv waren? Zur Identifikation der statistischen Einheiten, zur Entscheidung, ob sie zur statistischen Masse gehören sind sachliche, räumliche und zeitliche Kriterien entscheidend. Beispiel 1.16. Bei der Untersuchung des Produktionsvolumen in einer Station zur Abfüllung von Getränken in Flaschen kann jede einzelne Flasche eine statistische Einheit sein, wenn untersucht wird, welches Getränk in welcher Füllmenge in jeder einzelnen Flasche ist. Beispiel 1.17. Bei der Untersuchung der Studenten einer Hochschule sind die einzelnen Studenten, welche zu einem bestimmten Zeitpunkt an der Hochschule sind die statistischen Einheiten. Die Gesamtzahl der Studenten zum untersuchten Zeitpunkt sind die statistische Masse. Untersuchte Daten können sein: Studiengang, Semester, Alter, Herkunftsland, . . .. 18 Version 5.1 - 013 Kapitel 1. Grundlagen Beispiel 1.18. Bei der Produktion eines Produktes oder bei der Anlieferung eines Produktes ist jedes einzelne Produkt eine statistische Einheit. Die Gesamtmenge der Produktion oder Anlieferungen sind die statistische Masse. Hierbei ist eine zeitliche Abgrenzung sicherlich wichtig: die Produktion / Anlieferung an einem Tag, in einer Woche, . . .. Untersucht werden kann hier die Qualität des Produktes, ist sie in Ordnung oder nicht. Bei diesem Beispiel, welches in der Qualitätssicherung in einem Unternehmen gebraucht wird, ist es in der Regel so, dass nicht die Gesamtheit der Produktion oder Anlieferung überprüft wird, sondern nur ein kleiner Teil. Auch bei der Volkszählung in Deutschland im Jahr 2011 wird nur ein Teil (ca. 10%) der gesamten Bevölkerung befragt. Definition 1.2 (Stichprobe). Wird bei einer statistischen Untersuchung nur ein Teil der interessierenden statistischen Masse erfasst, dann heißt dieser Teil Stichprobe. Die Aussagen in der beschreibenden Statistik beziehen sich immer nur auf den Umfang, der untersucht wird. Es ist keine Übertragung von Ergebnissen auf die Obermenge möglich. Das ist dann erst eine Aufgabe der schließenden Statistik. Gerade wieder bei der Aufgabe der Qualitätssicherung ist es jedoch gewünscht von der untersuchten Stichprobe auf die gesamte statistische Masse zu schließen. Bei einer großen Anlieferung von Waren soll durch eine Stichprobe entschieden werden, ob die Qualität in Ordnung ist und die gesamte Anlieferung angenommen wird oder wieder zurück gesendet wird. Statistische Einheiten einer statistischen Masse können für einen gewissen Zeitraum permanent zur statistischen Masse gehören (beispielsweise die Einwohner in einem Ort), andere statistische Einheit sind Ereignisse (z.B. Geburt oder Tod, Zuzug oder Wegzug). Für die statistische Masse kann es eine Unterscheidung in Bestandsmasse und Ereignismasse geben. Definition 1.3 (Bestandsmasse, Ereignismasse). Eine statistische Masse, deren Einheiten für ein gewisses Zeitintervall zur Masse gehört, heißt Bestandsmasse. Die Anzahl der Einheiten, die zu einer Bestandsmasse zu einem bestimmten Zeitpunkt gehören, heißt Bestand. Ein Ereignis, welche eine Veränderung zu einem bestimmten Zeitpunkt charakterisiert, heißt Ereignis. Eine statistische Masse, deren Einheiten Ereignisse sind, die zu einem bestimmten Zeitpunkt auftreten, heißt Ereignismasse. Die durchfahrenden Fahrzeuge an einem Messpunkt, die Unfälle an einer Kreuzung, die Prüfungen an einer Hochschule sind Beispiele für Ereignismassen. Version 5.1 - 013 19 1.3. Merkmale 1.3.2. Merkmale und Skalen Bei der Untersuchung der einzelnen Einheiten einer statistischen Untersuchung interessiert man sich meist nur für einzelne Eigenschaften, für bestimmte Merkmale. Definition 1.4 (Merkmal, Merkmalsträger, Merkmalsausprägung). Eine bei einer statistischen Untersuchung interessierende Eigenschaft einer statistischen Einheit heißt Merkmal. Die statistische Einheiten heißen auch Merkmalsträger. Die möglichen Werte, die ein Merkmal annehmen kann, heißen Merkmalsausprägungen. Eine bei einer statistischen Untersuchung an einer bestimmten statistischen Einheit festgestellte Merkmalsausprägung heißt Merkmalswert, Beobachtung oder Beobachtungswert. Beispiel 1.19. Bei der Statistik über die Bevölkerung, bei der die einzelnen Personen befragt werden, werden verschiedene Eigenschaften abgefragt. • Merkmal: Geschlecht; Merkmalsausprägungen: männlich, weiblich • Merkmal: Familienstand; Merkmalsausprägungen: ledig, verheiratet, geschieden, getrennt lebend, verwitwet. • Merkmal: Anzahl der Kinder; Merkmalsausprägungen: eine ganze Zahl, größer oder gleich 0. • Merkmal: Einkommen; Merkmalsausprägungen: eine reelle Zahl Es werden jetzt die verschiedenen Merkmale genauer untersucht und betrachtet. Dabei wird insbesondere beleuchtet, welche Merkmalsausprägungen vorkommen können. Nominalskala Es gibt Merkmale, bei denen nur festgestellt werden kann, ob ein Merkmalsträger eine bestimmte Eigenschaft hat oder nicht, beziehungsweise welche von mehreren Eigenschaften ein Merkmalsträger hat. Ein Ordnung der Daten ging nicht angegeben werden. Definition 1.5 (Nominalskala, dichotomes Merkmal). Eine Skala, deren Skalenwerte nur nach dem Kriterium gleich oder verschieden geordnet werden können, heißt Nominalskala. Ein Merkmal, dessen Werte nur auf einer Nominalskala gemessen werden können, heißt nominal messbar, das Merkmal heißt auch qualitatives Merkmal. 20 Version 5.1 - 013 Kapitel 1. Grundlagen Besitzt ein Merkmal nur zwei verschiedene Merkmalsausprägungen, dann ist es ein dichotomes Merkmal. In der Tabelle 1.2 sind weitere Beispiele von derartiger Merkmalen angegeben Merkmal Geschlecht Familienstand Qualität Merkmalsausprägungen männlich, weiblich ledig, verheiratet, verwitwet, getrennt lebend, geschieden okay, nicht okay Tabelle 1.2.: Beispiel nominal messbarer Merkamle Für diese Merkmalsausprägungen kann jeweils nur angegeben werden, ob eine Eigenschaft zutrifft oder nicht. Die Merkmale Geschlecht und Qualität sind dichotome Merkmale. Es gibt keine natürliche Ordnung bei den Ausprägungen. Weitere Beispiele hierfür sind unter anderem: Religion, Beruf, Studiengang, Abstammung1 . Ordinalskala Vielfach können die Ausprägungen eines Merkmales in eine natürliche Reihenfolge gebracht werden, in eine Ordnung. Ein Beispiel hierfür sind Klausurnoten, die geordnet werden können. Die Note „sehr gut“ ist besser als „gut“, „gut“ ist besser als „befriedigend“, „befriedigend“ ist besser als „ausreichend“ und „ausreichend“ ist besser als „mangelhaft“. Definition 1.6 (Ordinalskala). Eine Skala, deren Skalenwerte in einer natürlichen Reihenfolge geordnet werden können, heißt Ordinalskala oder Rangskala. Ein Merkmal, dessen Werte auf einer Rang- oder Ordinalskala gemessen werden können, heißt ordinal messbar, das Merkmal heißt auch intensitätsmäßiges Merkmal. 1 Bei der US-amerikanischen Volkszählung im Jahre 2000 wurde bei der Frage nach der Abstammung keine Vorgaben gegeben. In das Feld konnte jeder Befragte selber eintragen, was er oder sie wollte. Es wurden somit keinerlei Vorgaben gemacht, die eventuell die Befragten manipuliert hätten. Dies ist ein Beispiel für die Möglichkeit, eine Antwort der befragten Person nicht bereits durch vorgegebene Antworten zu leiten! Quelle: http://www.census.gov/prod/2004pubs/c2kbr-35.pdf Version 5.1 - 013 21 1.3. Merkmale Note 1 2 3 4 Anzahl 2 10 11 3 5 3 Tabelle 1.3.: Beispiel: ordinal messbares Merkmal - Noten bei einer Klausur In der Tabelle 1.3 sind die Noten tabellarisch dargestellt, wobei die ausgeschriebene Note in der Kurzform, der Zahl, die wir hinter der Note sehen, steht. Bei einem ordinal messbaren Merkmal werden in der Regel die Elemente in der natürlichen Ordnung angegeben. In der Grafik 1.1 über die Noten bei einer Klausur werden die Daten in der Reihenfolge von der besten zur schlechtesten Note dargestellt. Anzahl 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 Note Abbildung 1.1.: Beispiel: ordinal messbares Merkmal - Noten bei einer Klausur In der Tabelle 1.4 sind einige Beispiele für ordinal messbare Merkmale aufgeführt. Merkmal Zensur Güteklasse Merkmalsausprägungen sehr gut, gut, befriedigend, ausreichend, mangelhaft A, B, C, D Tabelle 1.4.: Beispiel: ordinal messbare Merkmale 22 Version 5.1 - 013 Kapitel 1. Grundlagen Die Reihenfolge gibt hierbei keine Auskunft über den absoluten Wert der Ausprägung. Es ist nur eine Reihenfolge ausgedrückt. Kardinalskala Bei den Noten kann nur gesagt werden, dass die Leistung mit „gut“ besser ist als die Leistung mit „befriedigend“. Es kann jedoch nicht gesagt, dass die Leistung doppelt so gut ist. In vielen Fällen sind die Merkmalsausprägungen nicht nur anordenbar, mit den Werten kann auch gerechnet werden. Den Merkmalsausprägungen sind reelle Zahlen zugeordnet. Definition 1.7 (Kardinalskala, Intervallskala, Verhältnisskala, Absolutskala). Eine Skala, deren Skalenwerte reelle Zahlen sind, heißt Kardinalskala oder metrische Skala . Ein Merkmal, dessen Werte auf einer Kardinalskala oder metrischen Skala gemessen werden können, heißt kardinal messbar oder metrisch messbar, das Merkmal heißt quantitatives Merkmal. Eine metrische Skala, die keinen natürlicher Nullpunkt und keine natürliche Einheit besitzt, heißt Intervallskala. Eine metrische Skala, die einen natürlicher Nullpunkt, aber keine natürliche Einheit besitzt, heißt Verhältnisskala. Eine metrische Skala mit einem natürlicher Nullpunkt und einer natürlichen Skala heißt Absolutskala. Bei einer Intervallskala können Abstände (Intervalle) verglichen werden. Beispiel 1.20 (Intervallskala). Eine Temperatur von 10 Grad Celcius ist 5 Grad höher als eine Temperatur von 5 Grad Celsius. Die Erhöhung ist genauso groß, wie der Abstand zwischen -10 Grad Celcius und -15 Grad Celsius. Bei einer Verhätnisskala können Verhältnisse zwischen Werten verglichen werden. Beispiel 1.21 (Verhältnisskala). Eine Temperatur von 290 Grad Kelvin ist um 3,6 % höher als eine Temperatur von 280 Grad Kelvin. Beispiel 1.22 (Absolutskala). Anzahl der Packstücke in einer Kiste. Version 5.1 - 013 23 1.3. Merkmale Merkmal Körpergröße Anzahl Kinder Füllmenge der Flasche Entfernung Größe eines Grundstückes Temperatur Längengrad Merkmalsausprägungen x cm 0, 1, 2, 3, ... x,xx l x,xx km x,xx ar x Celcius Skala Verhältnisskala Absolutskala Verhältnisskala Verhältnisskala Verhältnisskala Intervallskala Intervallskala Tabelle 1.5.: Beispiel: kardinal messbare Merkmale In der Tabelle 1.5 sind einige Beispiele von kardinal messbaren Merkmalen aufgeführt. Hier lassen sich noch viele weitere Beispiele finden. Bei diesen Beispielen kann es noch Unterschiede geben, je nachdem ob ein natürlicher Nullpunkt und eine natürliche Einheit existiert. • Für den Längengrad gibt es keinen natürlichen Nullpunkt und auch keine natürliche Einheit, aber Abstände können miteinander verglichen werden. • Entfernungen haben einen natürlichen Nullpunkt, die Länge 0. Es existiert jedoch keine natürliche Einheit. Es gibt viele Einheiten. Man kann die Entfernung in km, in m, in cm, in Meilen, . . . angeben. Beim Vergleich zweier Werte bleibt stets das Verhältnis gleich, egal, in welcher Einheit gemessen wird. • Bei einer Stückzahl (z.B. bei einer Stückliste), existiert ein natürlicher Nullpunkt und eine natürliche Einheit. Skalentransformation Bei der Erfassung und Aufbereitung statistischer Daten werden die Werte einer Skala manchmal in Werte einer anderen Skala transformiert. Ein bekanntes Beispiele hierfür ist die Transformation von Temperaturen zwischen Grad Celsius, Grad Fahrenheit und Grad Kelvin. Mit der Transformation können Berechnungen vereinfacht werden. Definition 1.8 (Skalentransformation). Die Übertragung von Skalenwerte in die Werte einer anderen Skala, wobei die Ordnungseigenschaften der Skala erhalten bleiben heißt eine Skalentransformation 24 Version 5.1 - 013 Kapitel 1. Grundlagen Beispiel 1.23 (Skalentransformation Nominalskala). Die Werte „männlich“ und „weiblich“ des Merkmals Geschlecht bei einer Nominalskale, kann transformiert werden in die Werte „0“ und „1“. Dies ist eine Verschlüsselung der Daten, die einer Skalentransformation entspricht. Beispiel 1.24 (Skalentransformation Ordinalskala). Die Schulnoten „sehr gut“, „gut“, . . ., „mangelhaft“ in die Noten 1, 2, . . . , 5 ist eine Skalentransformation , da die Ordnungseigenschaft erhalten bleibt. Für eine Kardinalskala beziehungsweise metrische Skala ist nur eine lineare Transformation zulässig. Sind xi die Werte einer Kardinalskala, dann können diese nur mit Hilfe einer Gleichung der Form yi = dxi + e in die Werte yi einer anderen Skala übertragen werden, wobei d > 0 gilt. Bei einer Verhältnisskale ist dabei e = 0, bei einer Absolutskala, ist d = 1 und e = 0. Beispiel 1.25 (Skalentransformation Kardinalskala). Die Transformation der Temperatur von Grad Fahrenheit in Grad Celsius erfolgt mittels der linearen Transformation C = 59 F − 160 9 Beispiel 1.26 (Skalentransformation Kardinalskala). Bei der Untersuchung des Gewichtes von Packungen mit Mehl mit dem Soll-Gewicht von 1kg interessiert man sich nur für die Abweichung vom diesem Soll. Statt dem Merkmal X (Gewicht der Packung) interessiert man sich für das Merkmal Y (Abweichung vom SollGewicht). Es wird hierbei die lineare Transformation Y = X − 1kg angewendet. Diskrete und stetige Merkmale Die Anzahl der unterschiedlichen Merkmalsausprägungen eines quantitativen Merkmals kann sehr hoch sein. Bei der Körpergröße kann jede positive reelle Zahl eine Merkmalsausprägung sein. Bei der Anzahl der Packstücke in einer Kiste jedoch nur die natürlichen Zahlen, inklusive der Null. Dies führt zur nachfolgenden Definition. Definition 1.9 (diskrete und stetige Merkmale). Ein quantitatives Merkmal heißt diskretes Merkmal , wenn es nur endlich viele oder abzählbar unendliche viele Merkmalsausprägungen besitzt. Ein quantitatives Merkmal heißt stetiges Merkmal , wenn es überabzählbar viele Merkmalsausprägungen hat. Da bei stetigen Merkmalen die Anzahl der Merkmalsausprägungen überabzählbar ist, führt dies zu einen Einteilung der Merkmalsausprägungen in Klassen, einer Klassierung, die im nachfolgenden Abschnitt 1.3.3 genauer erläutert wird. Version 5.1 - 013 25 1.3. Merkmale 1.3.3. Klassierung Bei Merkmalen, wie beispielsweise der Körpergröße oder dem Einkommen ist die Darstellung jeder einzelnen Merkmalsausprägung nicht sinnvoll oder nicht machbar. Es gibt zu viele Ausprägungen oder die Darstellung ist zu unübersichtlich. Daher werden benachbarte Merkmalsausprägungen zu Klassen zusammen gefasst. Eine Klasse Kj wird dabei durch zwei Werte charakterisiert. Die untere Klassengrenze x∗j−1 und die obere Klassengrenze. Hierbei ist eindeutig festzulegen, welche der Klassengrenzen zur Klasse gehört, welche nicht. Es zählt entweder die untere Klassengrenze zur Klasse „von x∗j−1 bis unter x∗j “ oder die obere Klassengrenze „über x∗j−1 bis x∗j “ zur Klasse. Die Klassenbreite ist einfach die Differenz der Klassengrenzen x∗j − x∗j−1 . Idealerweise ist die Klassenbreite bei allen Klassen gleich breit. Dies ist jedoch nicht immer sinnvoll. Die Anzahl der Klassen sollte dabei nicht zu klein, aber auch nicht zu groß sein. Dies hängt jeweils von der Thematik ab. Wenn beispielsweise das Lebensalter betrachtet wird, dann wird das Alter in Jahren betrachtet und es wird der untere Wert betrachtet. Für statistische Untersuchungen wird in der Regel die Klassenmitte (x∗j + x∗j−1 )/2 herangezogen, jedoch nicht immer. Dies basiert auf der Annahme, dass die Daten in der Klasse gleichmäßig verteilt sind. Die Randklassen, also die erste Klasse, mit den niedersten Werten, und die letzte Klasse, mit den höchsten Werten, sind problematisch. Gibt es eine untere beziehungsweise obere Grenze oder bleiben die Grenzen offen. Bei offenen Grenzen, wie ist dann der Repräsentant der Klasse zu bestimmen? Beispiel 1.27 (Körpergröße). Mit den Daten aus dem Basisdatensatz (Tabelle A.1) ergibt sich mit der Klasseneinteilung mit einer Klassenbreite von 5 cm die Verteilung (siehe Tabelle 1.6) Beispiel 1.28 (Haushaltseinkommen). Bei der Betrachtung des monatliches Nettoeinkommens durch das Statistische Bundesamt werden folgende Klassen gebildet: • unter 1.300 e • von 1.300 e bis unter 2.600 e • von 2.600 e bis unter 3.600 e • von 3.600 e bis unter 5.000 e • von 5.000 e bis unter 18.000 e 26 Version 5.1 - 013 Kapitel 1. Grundlagen von . . . bis unter . . . 150 - 155 155 - 160 160 - 165 165 - 170 170 - 175 175 - 180 180 - 185 185 - 190 190 - 195 Anzahl 1 0 2 5 6 7 3 4 1 Tabelle 1.6.: Klassen bei Körpergröße 1.4. Aufgaben Aufgabe 1.1 (Durchschnittsalter). Führen Sie die Phasen Planung und Datenerhebung für die Bestimmung des Durchschnittsalters der in einem Raum anwesenden Personen durch? Aufgabe 1.2 (Körpergrößen). Führen Sie die Phasen Planung und Datenerhebung für die Bestimmung der durchschnittliche Körpergröße in cm der in einem Raum anwesenden Personen durch. Aufgabe 1.3. Finden Sie weitere Beispiele für statistische Massen, statistische Einheiten und Daten, die erhoben werden. Aufgabe 1.4. Finden Sie weitere Beispiele für Bestandsmassen und Ereignismassen. Aufgabe 1.5. Geben Sie zu den folgenden Merkmalen mögliche Merkmalsausprägungen an: Haarfarbe, Einkommen, Note einer Klausur, Gewicht, Studiengang und Herkunftsland. Aufgabe 1.6. Finden Sie weitere Merkmale für statistische Einheiten und dazugehörige Merkmalsausprägungen. Aufgabe 1.7. Finden Sie weitere nominal messbare Merkmale Version 5.1 - 013 27 1.4. Aufgaben Aufgabe 1.8. Finden Sie weitere ordinal messbare Merkmale. Aufgabe 1.9. Finden Sie weitere metrisch messbare Merkmale, sowohl mit Intervallskala, Verhältnisskala und Absolutskala. 28 Version 5.1 - 013 Kapitel 2. Univariate Daten In diesem Teil wird die beschreibende Statistik für ein Merkmal erläutert. Es werden verschiedene Darstellungen gezeigt und wichtige Parameter der beschreibenden Statistik, Lageparameter oder Mittelwerte und Streuungsparameter eingeführt. 2.1. Darstellung univariater Daten 2.1.1. statistische Reihe Die Daten von Beobachtungen bei einer statistischen Erhebung bilden zuerst eine Reihe von Daten, einen Datenstrom. Dies ist der Ausgangspunkt für die Untersuchung und Auswertung. Dies kann am Basisdatensatz (siehe Tabelle A.1) gesehen werden. Definition 2.1. Werden die Werte der Beobachtungen, die für eine statistische Untersuchung erhoben sind, nacheinander aufgeschrieben, so erhält man eine statistische Reihe. Werden die Daten geordnet, so heißt sie eine geordnete Reihe , ansonsten heißt sie ungeordnete Reihe. Eine statistische Reihe von Beobachtungen zu einem bestimmten Phänomen, die für aufeinander folgende Zeitpunkte oder Zeitintervalle erhoben werden, heißt Zeitreihe. Beispiel 2.1. Aus dem Basisdatendatensatz (siehe Tabelle A.1) ergibt sich für das Alter der Befragten Personen die ungeordnete Reihe 19, 20, 20, 20, 20, 21, 21, 23, 25, 20, 20, 22, 23, 20, 20, 20, 21, 20, 23, 21, 20, 21, 19, 19, 21, 22, 18, 25, 54 . Daraus ergibt sich die geordnete Reihe Version 5.1 - 013 29 2.1. Darstellung univariater Daten 18, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 22, 22, 23, 23, 23, 25, 25, 54 der Beobachtungen. Es sei X ein Merkmal, das untersucht werden soll. Im obigen Beispiel ist das Merkmal X das Alter. Wenn n Beobachtungen zu diesem Merkmal erfasst werden, so werden die Beobachtungen mit x1 , x2 , . . . , xn bezeichnet, oder kurz mit xi , (i = 1, . . . , n). 2.1.2. Häufigkeitstabellen Beobachtungen mit der selben Merkmalsausprägung können zusammen gefasst werden. Definition 2.2. Es sei X ein Merkmal mit den Merkmalsausprägungen xj (j = 1, . . . , m). Die Anzahl der Beobachtungen mit der Merkmalsausprägung xj heißt absolute Häufigkeit der Merkmalsausprägung und wird mit h(xj ) bezeichnet. Der relative (prozentuale) Anteil der absoluten Häufigkeit h(xj ) einer Merkmalsausprägung xj an der Gesamtanzahl n der Beobachtungen heißt relative Häufigkeit f (xj ). Es gilt f (xj ) = h(xj )/n. Die absolute Häufigkeit h(xj ) für j = 1, . . . , m jeder Merkmalsausprägung xj kann in Beziehung zu der Gesamtanzahl n der Beobachtungen gesetzt werden. Die GeP samtanzahl n der Beobachtungen ergibt sich durch n = m j=1 h(xj ). Für die absoluten und relativen Häufigkeiten gelten (bei n Beobachtungen) die Eigenschaften, die in der Tabelle 2.1 aufgeführt sind. absolute Häufigkeiten ∀j = 1, . . . , m : h(xj ) ≥ 0 Pm j=1 h(xj ) = n relative Häufigkeiten ∀j = 1, . . . , m : f (xj ) ≥ 0 Pm j=1 f (xj ) = 1 Tabelle 2.1.: Eigenschaften absolute und relative Häufigkeiten Definition 2.3. Die geordnete Merkmalsausprägungen und die zugehörigen (absoluten und relativen) Häufigkeiten ergeben die Verteilung oder Häufigkeitsverteilung des betreffenden Merkmales. Die Häufigkeitsverteilung werden oftmals in tabellarischer Form erstellt. 30 Version 5.1 - 013 Kapitel 2. Univariate Daten Beispiel 2.2. Die obige Verteilung des Alters aus der Befragung von 29 Personen kann auch folgendermaßen, in tabellarischer Form (siehe Tabelle 2.2) dargestellt werden. xj 18 19 20 21 22 23 24 25 h(xj ) 1 3 11 6 2 3 0 2 f (xj ) 3,4% 10,3% 37,9% 20,7% 6,9% 10,3% 6,9% 0,0% 54 1 3,4% Tabelle 2.2.: Beispiel: Häufigkeitsverteilung Alter Beispiel 2.3. Für 120 Personen ergibt sich folgende Häufigkeitsverteilung für das Merkmal Familienstand, siehe Tabelle 2.3. Familienstand ledig absolute Häufigkeit 12 relative Häufigkeit 60% verheiratet 5 25% geschieden 3 15% Tabelle 2.3.: Beispiel: Tabelle Familienstand 2.1.3. Grafische Darstellungen Neben der Darstellung von Daten mit Hilfe von Tabellen gibt es auch viele Möglichkeiten, die Daten grafisch darzustellen. Hierzu gibt es verschiedene Arten von Diagrammen: Balkendiagramm, Liniendiagramm, Flächendiagramm, Kreisdiagramm und noch weitere Varianten. Mit Hilfe eines Tabellenkalkulationsprogramms, aber auch mit Hilfe von Präsentationsprogrammen, kann man derartige Diagramme leicht und automatisiert erhalten. Beispiel 2.4 (nominal messbares Merkmal - Geschlecht). Das Geschlecht der Personen aus dem Basisdatensatz (siehe A.1) ist ein nominal messbares Merkmal. Es gibt keine Ordnung der Daten. Diese Daten werden oftmals in einem Kreisdiagramm dargestellt. In der Grafik 2.1 sind die Daten aus dem Basisdatensatz für das Merkmal Geschlecht als Kreisdiagramm grafisch dargestellt. Beispiel 2.5 (ordinal messbares Merkmal - Alter). Die Verteilung des Merkmals Alter aus dem Basisdatensatz (siehe Tabelle A.1) kann mittels eines Balkendiagramms (siehe Abbildung 2.2) dargestellt werden. Version 5.1 - 013 31 2.1. Darstellung univariater Daten m w Abbildung 2.1.: Beispiel: nominal messbares Merkmal - Kreisdiagramm Anzahl 12 11 10 9 8 7 6 5 4 3 2 1 18 19 20 21 22 23 24 25 ... 54 Alter Abbildung 2.2.: Beispiel: ordinal messbares Merkmal - Alter 32 Version 5.1 - 013 Kapitel 2. Univariate Daten Note absolute Häufigkeit 1 2 3 2 10 11 4 5 3 3 Tabelle 2.4.: Beispiel: Notenverteilung - tabellarische Darstellung Beispiel 2.6. Für die Statistik über das Ergebnis einer Klausur (siehe A.1) sind die Noten der einzelnen Klausuren das entscheidende Merkmal. Die erzielten Punkte sind ein anderes Merkmal, jedoch für diesen Fall jetzt nicht relevant. Es haben insgesamt 28 Personen an der Klausur teilgenommen, die einzelnen Ergebnisse sind (sortiert nach der Note): 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 5; 5 und 5. Diese können in einer Häufigkeitsverteilung tabellarisch dargestellt werden (siehe Tabelle 2.4) oder auch grafisch dargestellt werden (siehe Abbildung 2.3). Anzahl 12 11 10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 Note Abbildung 2.3.: Beispiel: Notenverteilung - grafische Darstellung Anhand der Tabelle oder auch der Grafik kann man sehen, dass 2 Personen eine 1 geschrieben haben, während leider 4 Personen die Klausur nicht bestanden haben. Die Breite die Balken kann frei gewählt werden, es ist nur eine Frage der Anschaulichkeit. In der Häufigkeitsverteilung sind oftmals nicht alle möglichen Merkmalsausprägungen enthalten, sondern nur die tatsächlich vorkommenden. Die tabellarische Version 5.1 - 013 33 2.1. Darstellung univariater Daten Darstellung einer Häufigkeitsverteilung erfolgt in einer so genannten Häufigkeitstabelle. Dies kann horizontal oder vertikal aufgebaut werden. Im nachfolgenden ist ein vertikales und horizontales Beispiel aufgeführt. Es sei X ein Merkmal mit den Merkmalsausprägungen xj (j = 1, . . . , m). Die absoluten Häufigkeiten sei gegeben durch h(xj ). Die relative Häufigkeiten sind f (xj ). Die Häufigkeitsverteilung kann horizontal (siehe Tabelle 2.5) oder vertikal (siehe Tabelle 2.6) dargestellt werden. x1 x2 Merkmalsausprägung absolute Häufigkeit h(x1 ) h(x2 ) relative Häufigkeit f (x1 ) f (x2 ) ... ... ... xj h(xj ) f (xj ) ... ... ... xm h(xm ) f (xm ) Tabelle 2.5.: Häufigkeitstabelle - horizontal Merkmalsausprägung absolute Häufigkeit relative Häufigkeit x1 h(x1 ) f (x1 ) h(x2 ) f (x2 ) x2 .. .. .. . . . xj h(xj ) f (xj ) .. .. .. . . . h(xm ) f (xm ) xm Tabelle 2.6.: Häufigkeitstabelle - vertikal Für die grafische Darstellung einer Häufigkeitsverteilung gibt es verschiedene Möglichkeiten. Bei einer Nominalskala gibt es keine natürliche Ordnung der Merkmalsausprägungen. Für die Darstellung wählt man meistens Kreis- oder Flächendiagramme. Bei einer Ordinalskala kann man die Häufigkeitsverteilung grafisch als Linienoder als Balkendiagramm darstellen. Hierbei werden meistens auf der waagrechten Achse die geordneten Merkmalsausprägungen abgetragen. Bei einer Kardinalskala muss zwischen diskreten und stetigen Merkmalen unterschieden werden. Häufigkeitstabelle und grafische Darstellung der Häufigkeitsverteilung eines diskreten Merkmales können in gleicher Weise erfolgen wie bei einem ordinal messbaren Merkmal. Bei einem stetigen Merkmal werden Klassen gebildet. Absolute und relative Häufigkeiten sind dann Häufigkeiten einer Klasse. Sie werden meist als rechteckige 34 Version 5.1 - 013 Kapitel 2. Univariate Daten 150 155 160 cm 154 159 164 Anzahl 1 0 2 165 170 175 169 174 179 5 7 6 180 185 190 195 184 189 194 199 3 4 0 1 Tabelle 2.7.: Beispiel: Körpergröße gruppiert Flächen über den Klassen der Merkmalsausprägungen grafisch dargestellt. Dabei wird unterstellt, dass die zu einer Klasse gehörigen Beobachtungen gleichmäßig über die Klasse verteilt sind. Im Basisdatensatz sind auch Daten für die Körpergröße hinterlegt. Eine grafische Darstellung der Daten mit den einzelnen Körpergröße ist nicht aussagekräftig. Die Daten können jedoch gruppiert werden. Hier wird die Variante gewählt, dass die breite der Gruppen jeweils gleich groß sind - jeweils 5 cm. Die erste Gruppe ist im Größenbereich 150cm - 154cm. Die weiteren Gruppen sind 155cm - 159cm, 160cm - 164cm, . . . , 194cm - 199cm. Die Daten werden jetzt auf diese Gruppen aufgeteilt. Dies ist in der Tabelle 2.7 dargestellt. Jetzt können die Daten wieder grafisch dargestellt werden, mit Balken der gleichen Breite. 2.1.4. Summen- und Resthäufigkeit Für viele Fragestellungen ist die Summen der Beobachtungen bis zu einem bestimmten Wert gesucht. Beispielsweise bei der Untersuchung des bereits geleisteten Aufwands für ein Projekt interessiert in erster Linie die Summe der bisher geleisteten Stunden. Definition 2.4. Die einer Merkmalsausprägung eines ordinal oder metrisch messbaren Merkmales zugeordnete Häufigkeit aller Beobachtungen, die diese Merkmalsausprägungen nicht überschreiten, heißt Summenhäufigkeit. Für die absolute Summenhäufigkeit gilt: H(xj ) = X h(xk ) (2.1) f (xk ) (2.2) xk ≤xj Für die relative Summenhäufigkeit gilt: F (xj ) = X xk ≤xj Version 5.1 - 013 35 2.1. Darstellung univariater Daten Sind die Merkmalsausprägungen geordnet x1 < x2 < . . . < xm , dann gilt H(xj ) = j X h(xk ) und F (xj ) = k=1 j X f (xk ) (2.3) k=1 Beispiel 2.7. Für die Verteilung des Alters aus dem Basisdatensatz (siehe Tabelle A.1) sind die absolute und relative Häufigkeitsverteilung in der Tabelle 2.8 zu finden. Eine entsprechende grafische Darstellung ist in 2.4 dargestellt. xj h(xj ) H(xj ) f (xj ) F (xj ) 18 1 1 3,4% 3,4% 19 3 4 10,3% 13,8% 20 11 15 37,9% 51,7% 21 6 21 20,7% 72,4% 22 2 23 6,9% 79,3% 23 3 26 10,3% 89,7% 25 2 28 6,9% 96,6% 54 1 29 3,4% 100% Tabelle 2.8.: Beispiel: Summen- und Resthhäufigkeit Alter Anzahl 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 18 19 20 21 22 23 24 25 ... 54 Alter Abbildung 2.4.: Beispiel: Summenhäufigkeit - Alter Definition 2.5. Die einer Merkmalsausprägung eines ordinal oder metrisch messbaren Merkmales zugeordnete Häufigkeit aller Beobachtungen, die diese Merkmalsausprägungen überschreiten, heißt Restsummenhäufigkeit. 36 Version 5.1 - 013 Kapitel 2. Univariate Daten Es sei n die Gesamtzahl der Beobachtungspunkte. Für die absolute Restsummenhäufigkeit gilt: HR(xj ) = X h(xk ) = n − H(xj ) (2.4) xk >xj Für die relative Restsummenhäufigkeit gilt: F R(xj ) = X f (xk ) = 1 − F (xj ) (2.5) xk >xj 2.2. Mittelwerte Eine erste wichtige Kenngröße für eine statistische Masse sind Lageparameter und Mittelwerte. Es gibt dabei verschiedenen Möglichkeiten der Definition, was unter einem Mittelwert zu verstehen ist. 2.2.1. Modus Die erste Art von Mittelwert ist der häufigste Wert. Dies ist für alle Merkmale auch für nominal messbare Merkmale möglich. Definition 2.6 (Modus). Die Merkmalsausprägung, die am häufigsten vorkommt, wird häufigster Wert, dichtester Wert, Modalwert oder Modus genannt und wird mit xD bezeichnet. Es gilt h(xD ) = maxj (h(xj )). Gibt es mehrere Ausprägungen mit der größten Häufigkeit, dann gibt es entsprechend viele häufigste Werte, und es gilt: xD ∈ {xk | h(xk ) = max(h(xj ))} j (2.6) Beispiel 2.8. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist der Modalwert, der häufigste Wert 20. Beispiel 2.9. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist der Modalwert, der häufigste Wert die Note 3. Beispiel 2.10. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist der Modalwert, der häufigste Wert die Gruppe mit der Größe 170cm − 174cm. Version 5.1 - 013 37 2.2. Mittelwerte 2.2.2. Median Für nominal messbare Merkmale ist der häufigste Wert der einzig sinnvolle Mittelwert. Für andere Merkmale können neben dem Modalwert noch weitere Mittelwerte bestimmt werden. Definition 2.7. Jede Merkmalsausprägung eines wenigstens ordinal messbaren Merkmales, welches die geordnete Reihe der Beobachtungen in zwei gleich große Teile zerlegt, heißt Zentralwert oder Median und wird mit xZ bezeichnet. Es gilt xZ = xk mit F (xk−1 ) < 0, 5 und F (xk ) ≥ 0, 5. Gibt es n Beobachtungspunkte und ist n eine ungerade Zahl, dann gibt es genau und es gilt xZ = x n+1 . einen mittleren Wert. Dieser hat die Ordnungsnummer n+1 2 2 Bei einer geraden Anzahl von Beobachtungen gilt xZ = x n2 Beispiel 2.11. Beim Beispiel des Alters (siehe Tabelle 2.2) ist der Median, der Zentralwert 20, also gleich dem Modus. Beispiel 2.12. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist der Median die Note 3, also ungleich dem Median. Beispiel 2.13. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist der Median die Gruppe mit der Größe 170cm − 174cm, auch wieder gleich dem Median. 2.2.3. p-Quantil Neben der Zerlegung in zwei Teile, können die Beobachtungen auch in mehr Teile zerlegt werden. Diese macht jedoch erst bei größeren Datenmengen einen Sinn. Definition 2.8. Quantil Jeder Merkmalswert xp mit 0 < p < 1 einer Verteilung für den mindestens ein Anteil p der Daten kleiner oder gleich xp und mindestens ein Anteil 1 − p größer oder gleich xp ist, heißt p-Quantil . Der Median ist das 50%-Quantil (x0,5 ). Zwei weitere wichtigen Quantilen sind das untere Quartil x0,25 und das oberes Quartil x0,75 . Bei der Zerlegung einer Datenmenge in Quartilen werden das untere Quartil, der Median und das obere Quartil angegeben. Es gibt auch die Dezile, mit den Quantilen 10%, 20%, . . . 90%. Wichtig (beispielsweise für die Behandlung von Ausreißern) sind die Quantilen bei 5% und 95%. Beispiel 2.14. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt x0,25 = 20, x0,5 = 20 (der Zentralwert) und x0,75 = 22. 38 Version 5.1 - 013 Kapitel 2. Univariate Daten Beispiel 2.15. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) gilt x0,25 = 2, x0,5 = 3 (der Zentralwert) und x0,75 = 3. Beispiel 2.16. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) gilt x0,25 = 165cm − 169cm, x0,5 = 170cm − 174cm (der Zentralwert) und x0,75 = 180cm − 184cm. Bei einer Befragung ist es durchaus möglich, dass nicht jede Antwort korrekt ist. Bewusst oder unwissentlich können Antworten gegeben werden, die Ausreißer sind. Bei der Abfrage des Alters kann jemand das Alter nicht in Jahren, sondern in Tagen angeben. Hier kann eine Bereinigung der Daten hilfreich sein. Hierzu können die Daten bis zum 0,05-Quantil und die Daten ab dem 0,95-Quantil aus der weiteren Berechnung eliminiert werden. Damit werden potenziellen Ausreißer entfernt. 2.2.4. arithmetisches Mittel Das arithmetische Mittel x ist der am häufigsten verwendete Mittelwert und der Wert, der landläufig mit dem Durchschnitt bezeichnet wird. Die Ermittlung des arithmetischen Mittelwertes ist nur sinnvoll für Merkmale, die auf einer metrischen Skala gemessen werden können. Definition 2.9. arithmetisches Mittel Gegeben sei ein Merkmal X. Für die n Beobachtungen xi mit i = 1, . . . , n, ergibt sich das (einfache) arithmetische Mittel zu x = n 1X x1 + x2 + · · · + x n = xi n n i=1 (2.7) . Sind für das Merkmal X die Merkmalsausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) gegeben, so errechnet sich das (gewogene) arithmetische Mittel durch x = m x1 h(x1 ) + x2 h(x2 ) + · · · + xm h(xm ) 1X xj h(xj ) = h(x1 ) + h(x2 ) + · · · + h(xm ) n j=1 (2.8) mit n = h(x1 ) + h(x2 ) + · · · + h(xm ), beziehungsweise x = x1 f (x1 ) + x2 f (x2 ) + · · · + xm f (xm ) = m X xj f (xj ) (2.9) j=1 Version 5.1 - 013 39 2.2. Mittelwerte Alle drei Mittelwerte stellen den selben Wert dar. Im ersten Fall werden die Beobachtungen einzeln herangezogen, im zweiten Fall werden gleiche Werte zusammengezogen, im dritten Fall wird bei den zusammen gesetzten Werte die relativen Häufigkeiten genommen. Die Division durch n, die Anzahl der Beobachtungen, wird im dritten Fall direkt bei den Beobachtungen durchgeführt, denn es gilt f (xj ) = h(xj )/n. Beispiel 2.17. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt x= 1 (1 · 18 + 3 · 19 + . . . + 1 · 54) = 22 29 (2.10) Beispiel 2.18. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) gilt x= 1 (2 · 1 + 12 · 2 + . . . + 4 · 5) = 2, 66 29 (2.11) Beispiel 2.19. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist zuerst zu klären, wie eine Berechnung überhaupt durchgeführt werden kann, da das Rechnen mit Gruppen unhandlich ist. Für jede Gruppe wird ein Repräsentant ausgewählt. Bei den Körpergrößen kann jeweils die Gruppenmitte ausgewählt werden. Es gilt dann x= 1 (1 · 152cm + 2 · 162cm + . . . + 1 · 197cm) = 174, 76cm 29 (2.12) 2.2.5. getrimmter Mittelwert Das arithmetische Mittel reagiert empfindlich auf Ausreißer und Extremwerte. Der Median ist gegenüber Ausreißern und Extremwerte sehr robust. Daher kann man herangehen und einen Teil der Beobachtungswerte, die extremen Werte zu eliminieren, also aus der Berechnung zu entfernen. Mt einem vorgegebenen Werte, beispielsweise α = 0, 05 werden dann die α% Werte, die am kleinsten beziehungsweise am größten sind aus der Berechnung entfernt. Definition 2.10 (getrimmter Mittelwert). Gegeben sei ein Merkmal X. Für die n (sortierten) Beobachtungen xi mit i = 1, . . . , n, ergibt sich das α-getrimmte Mittel (0 ≤ α ≤ 0, 5) mit r ≈ n · αzu xgα = n−r X xr+1 + xr+2 + · · · + xn−r 1 = xi n − 2r n − 2r i=r+1 . (2.13) Für α = 0 entspricht dies genau dem arithmetischen Mittel (xg0,0 = x). Für α = 0, 5 entspricht der Mittelwerte dem Median (xg0,5 = xZ ). 40 Version 5.1 - 013 Kapitel 2. Univariate Daten Beispiel 2.20. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt mit α = 0, 05 und dann mit der Wahl r = 1 (damit eigentlich α = 0, 035). xg0,05 = 1 (3 · 19 + . . . + 2 · 25) = 20, 96 . 27 (2.14) Wird r = 2 (und damit α = 0, 07) gewählt, dann werden nur 25 Werte in die Berechnung einbezogen. Es ergibt sich dann xg0,05 = 20, 88. 2.2.6. geometrisches Mittel Hat man es mit zeitlich aufeinander folgenden Zuwächsen, Wachstumsraten oder ähnlichen (multiplikativen) Steigerungen zu tun, dann ist das arithmetische Mittel nicht der sachlich richtige Durchschnittswert, sondern das geometrische Mittel. Beispiel 2.21. Bei einer Sparkasse konnte man bei einer Geldanlage, mit einem jährlich wachsenden Zins lesen: im 1. Jahr 3% Zins, im 2. Jahr 4% Zins, im 3. Jahr 5% Zins und im 4. Jahr 6% Zins, durchschnittlicher Zins: 4,5%. Ist das auch der effektive Zins, das heißt der konstante Zinssatz mit dem am Ende das selbe finanzielle Ergebnis kommt? In der folgenden Tabelle 2.9 sind die Wertsteigerung für 3 verschiedene Fälle aufgeführt. Im ersten Fall ist es die Zinsreihe der Sparkasse, mit jährlich steigendem Zins. Beim Fall 2 ist der Zins jährlich 4,5%, während im Fall 3 der jährliche Zins 4,494% ist. Jahr 0 1 2 3 4 Fall 1 1000,00 1030,00 1071,20 1124,76 1192,2456 Fall 2 1000,00 1045,00 1092,03 1141,17 1192,5186 Fall 3 1000,00 1044,94 1091,90 1140,97 1192,2447 Tabelle 2.9.: Beispielsrechnung geometrisches Mittel Definition 2.11 (harmonisches Mittel). Gegeben sei ein Merkmal X. Für die n Beobachtungspunkte xi (i=1,. . . ,n) ergibt sich das einfache geometrische Mittel zu v xG u n uY √ n n = x 1 · x2 · . . . · xn = t xi (2.15) i=1 Version 5.1 - 013 41 2.2. Mittelwerte Sind für das Merkmal X die Merkmalsausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) gegeben, so errechnet sich das gewogene geometrische Mittel durch q n xG = = h(x2 ) h(x1 ) · x2 x1 v um u Y h(xj ) n t x = j i=1 h(xm ) · . . . · xm m Y h(xj )/n xj = i=1 (2.16) m Y f (xj ) xj i=1 mit n = h(x1 ) + h(x2 ) + · · · + h(xm ). 2.2.7. harmonisches Mittel Beispiel 2.22. Ein PKW legt von einer Strecke 16 mit einer Geschwindigkeit von 100 km , 31 mit einer Geschwindigkeit von 80 km und den Rest mit einer Geschwinh h zurück. Mit welcher (konstanten) Geschwindigkeit würde er die digkeit von 50 km h gesamte Strecke in der gleichen Zeit bewältigen? Diese Frage führt zum harmonische Mittel. Es gilt: v= s s1 + s2 + s3 = = t t1 + t2 + t3 s s1 v1 + s2 v2 + s3 v3 = 1 s1 sv1 + s2 sv2 + s3 sv3 (2.17) Das Einsetzen der konkreten Zahlen aus dem Beispiel ergibt. v= 1 1 6·100 + 1 3·80 + 1 2·50 = 1 1 600 + 1 240 + 1 100 = 600 = 63, 16 1 + 2, 5 + 6 (2.18) Definition 2.12. Gegeben sei ein Merkmal X. Für die n Beobachtungspunkte xi (i=1,. . . ,n) ergibt sich das einfache harmonische Mittel zu xH = 1 x1 n + ··· + 1 xn n = Pn 1 i=1 xi (2.19) Sind für das Merkmal X die Merkmalsausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) gegeben, so errechnet sich das gewogene harmonische Mittel durch xH = Pm n h(xj ) j=1 xj 42 = Pm 1 j=1 f (xj ) xj (2.20) Version 5.1 - 013 Kapitel 2. Univariate Daten Für die Durchschnitte von n Beobachtungen gilt allgemein x ≥ xG ≥ xH . √ Beispiel 2.23. Es seien x1 = 1 und x2 = 2, dann gelten x = 1, 5, xG = 1 · 2 = 2 1, 4142 und xH = 1+1/2 = 34 = 1, 3333. Es gilt stets x ≥ xG ≥ xH . 2.2.8. Transformationen Es ergibt sich nun die Frage, wie sich Mittelwerte verhalten, wenn eine Transformation durchgeführt wird. Satz 2.13. Es seien X ein metrisch messbares Merkmal mit dem arithmetischen Mittel x. Durch eine lineare Transformation Y = bX + a wird das Merkmal Y definiert. Dann gilt für das arithmetische Mittel y des Merkmales Y : y = bx + a. Das bedeutet, dass das arithmetische Mittel die Transformation mitmacht. y= n n n 1X 1X 1X yi = (bxi + a) = b xi + a = bx + a n i=1 n i=1 n i=1 (2.21) Für andere Daten lassen sich ebenso leicht Regeln für die Transformation ermitteln und angeben. 2.3. Streuungsmaße Wenn man die rechte Hand in eine Flüssigkeit mit 100 Grad Celsius steckt und die linke Hand in eine Flüssigkeit mit -40 Grad Celsius, dann ist dies im Mittel sind dies angenehme 30 Grad Celsius. Trotzdem ist dies alles andere als angenehm. Ein Mittelwert allein ist nicht ausreichend für die Beschreibung von Daten. Denn mit dem Mittelwert allein kann noch nicht entschieden werden, ob die Beobachtungen eng oder weit um diesen Mittelwert sind. Daher werden einige weitere Kennzahlen ermittelt, welche die Streuung der Beobachtungen beschreibt. Version 5.1 - 013 43 2.3. Streuungsmaße 2.3.1. Spannweite Die Entfernung zwischen maximalem und minimalem Wert ist eine erste Orientierung. Definition 2.14. Gegeben seien n Beobachtungen xi (i=1,. . . ,n) eines metrisch messbaren Merkmales X. Die Differenz zwischen größtem Beobachtungswert und kleinstem Beobachtungswert heißt Spannweite w der Verteilung des Merkmales. Beispiel 2.24. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 5; 3, 2; 1, 6; 2, 4; 2, 8. Berechnen Sie für diese Werte die Spannweite. w = 3, 2 − 0, 7 = 2, 5 (2.22) Beispiel 2.25. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist die Spannweite 36, wird der Extremwert 54 entfernt, dann ist die Spannweite nur 7. Beispiel 2.26. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist die Spannweite 35cm. 2.3.2. Quartilsabstand Der Abstand zwischen dem 1. Quartil (x0.25 ) und dem 3. Quartil (x0.75 ) ist der Quartilsabstand. In diesem Bereich sind mindestens 50% der Daten, also die Großteil der Daten. Beispiel 2.27. Beim Beispiel des Alters (siehe Tabelle 2.2) gilt x0,25 = 20, x0,5 = 20 (der Zentralwert) und x0,75 = 22. Der Quartilsabstand ist 2, von 20 bis 22. Von den Daten sind 19 der 29 Daten, also etwa 66% in diesem Bereich. 2.3.3. mittlere absolute Abweichung Bei der Spannweite werden jedoch von den Beobachtungen nur zwei Werte in die weitere Untersuchung einbezogen, die anderen Werte bleiben unberücksichtigt. Bei der mittleren absoluten Abweichung werden alle Beobachtungen in die Berechnung der Streuung mit einbezogen. 44 Version 5.1 - 013 Kapitel 2. Univariate Daten Definition 2.15. Gegeben seien n Beobachtungen xi (i=1,. . . ,n) eines metrisch messbaren Merkmales X und der Zentralwert xZ . Das arithmetische Mittel aus den absoluten Abweichungen der Beobachtungen xi vom Zentralwert xZ heißt mittlere absolute Abweichung d. d = n 1X |xi − xZ | n i=1 (2.23) Gegeben sei eine Häufigkeitsverteilung eines metrisch messbaren Merkmales X, dessen Ausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) auftreten. Das gewogene arithmetische Mittel aus den absoluten Abweichungen der Merkmalsausprägungen xj vom Zentralwert xZ heißt mittlere absolute Abweichung d: d = m m X 1X |xj − xZ |h(xj ) = |xj − xZ |f (xj ) n j=1 j=1 (2.24) Statt die mittlere absolute Abweichung vom Zentralwert zu nehmen, kann auch die mittlere absolute Abweichung auf andere Mittelwerte bezogen werden, beispielsweise auf das arithmetische Mittel. Beispiel 2.28. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 5; 3, 2; 1, 6; 2, 4; 2, 7. Berechnen Sie die mittlere absolute Abweichung, sowohl vom Zentralwert, als auch vom arithmetischen Mittel. Es gilt x = 2, 1 und xZ = 2, 4. Damit gilt in Bezug auf den Zentralwert d= 1, 7 + 0, 8 + 0, 1 + 0, 8 + 0, 8 + 0, 0 + 0, 3 = 0, 6429 7 (2.25) und in Bezug auf das arithmetische Mittel d= 1, 4 + 0, 5 + 0, 4 + 1, 1 + 0, 5 + 0, 3 + 0, 6 = 0, 6857 7 (2.26) Die auf den Zentralwert bezogene mittlere absolute Abweichung ist kleiner als jede auf einen anderen Wert bezogene mittlere absolute Abweichung. Beispiel 2.29. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist die mittlere absolute Abweichung 2, 34 (mit allen 29 Werten) und 1, 21 ohne den Extremwert. Beispiel 2.30. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist die mittlere absolute Abweichung 0, 79. Beispiel 2.31. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist die mittlere absolute Abweichung 7, 24cm. Version 5.1 - 013 45 2.3. Streuungsmaße 2.3.4. mittlere quadratische Abweichung Bei der mittleren absoluten Abweichung ist jede Abweichung gleich gewichtet. Kleine Abweichungen sollen weniger bedeutsam sein als große Abweichungen. Wie kann die Abweichung gewichtet werden, um diesen Wunsch zu berücksichtigen. Das Gewicht ist der Betrag der Abweichung selbst. Definition 2.16. Gegeben seien n Beobachtungen xi (i=1,. . . ,n) eines metrisch messbaren Merkmales X. Das arithmetische Mittel der quadratischen Abweichungen der Beobachtungen xi von ihrem arithmetischen Mittel xM heißt mittlere quadratische Abweichung oder Varianz s2 des Merkmales X, manchmal auch mit s2X geschrieben. s2 = n 1X (xi − x)2 n i=1 (2.27) Gegeben sei eine Häufigkeitsverteilung eines metrisch messbaren Merkmales X, dessen Ausprägungen xj (j=1,. . . ,m) mit den absoluten Häufigkeiten h(xj ) und den relativen Häufigkeiten f (xj ) auftreten. Das gewogene arithmetische Mittel der quadratischen Abweichungen der Merkmalsausprägungen vom arithmetischen Mittel x heißt Varianz s2 oder s2X : s2 = m m X 1X (xj − x)2 h(xj ) = (xj − x)2 f (xj ) n j=1 j=1 (2.28) Nach den obigen Formeln kann die Varianz erst berechnet werden, wenn das arithmetische Mittel berechnet ist, da die Differenz zwischen Beobachtungswert und Mittelwert die Größe ist, die zur Berechnung herangezogen wird. Die Formeln können jedoch leicht umgeformt werden, so dass die Berechnung einfacher wird. Es gilt s2 = = n n 1X 1X (xi − x)2 = (x2 − 2xi x + x2 ) n i=1 n i=1 i (2.29) n n n 1X 1X 1X x2i − 2x xi + x 2 = x 2 − x2 n i=1 n i=1 n i=1 i Wenn die Beobachtungen sequentiell kommen (zum Beispiel Messwerte einer elektronischen Einheit oder Daten aus einer Datei), so können die Daten sequentiell verarbeitet werden. Man summiert die Werte, um den Mittelwert zu erhalten und 46 Version 5.1 - 013 Kapitel 2. Univariate Daten man summiert die Quadrate der Beobachtungen, um daraus dann die Standardabweichung zu ermitteln. Für Häufigkeitsverteilungen gelten analoge Umformungen: s2 = m m X 1X x2j h(xj ) − x2 = x2j f (xj ) − x2 n j=1 j=1 (2.30) Definition 2.17. Die positive Quadratwurzel aus der Varianz heißt Standardabweichung. Wenn man mit Einheiten arbeitet, dann sieht man, dass die Standardabweichung die selbe Einheit hat wie die Merkmale selbst. Die Varianz hat das Quadrat der Einheit der Merkmale. Für Vergleichszwecke ist die Varianz nicht aussagekräftig genug. Bei einem Wert von 1 ist eine Varianz von 10 groß, bei einem Wert von 1000 jedoch klein. Definition 2.18. Für ein metrisch messbares Merkmal X mit dem arithmetischen Mittel x und der Standardabweichung s, heißt der Quotient aus s und x der Variationskoeffizient v, v = xs . Beispiel 2.32. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 5; 3, 2; 1, 6; 2, 4; 2, 7. Berechnen Sie die mittlere quadratische Abweichung (Varianz) und die Standardabweichung. Es ist x = 2, 1. Damit gilt s2 = 1, 42 + 0, 52 + 0, 42 + 1, 12 + 0, 52 + 0, 32 + 0, 62 = 0, 6114 7 (2.31) Beispiel 2.33. Bei der Beispiel des Alters (siehe Tabelle 2.2) ist die Varianz 43, 24, die Standardabweichun ist 6, 58[Jahre]. Wird der Extremwert eliminiert, dann sinkt die Varianz auf 3, 5, die Standardabweichung auf 1, 87[Jahre]. Beispiel 2.34. Beim Beispiel der Klausurnoten (siehe Tabelle 2.4) ist die Varianz 1, 14, die Standardabweichung 1, 07. er Beispiel 2.35. Beim Beispiel der Körpergröße (siehe Tabelle 2.7) ist die Varianz 93, 10, die Standardabweichung beträgt 9, 65[cm]. Mittelwert und Standardabweichung sind wichtige Parameter für Kennzeichen statistischer Größen, jedoch nicht die einzigen. Es gibt weitere Kennzeichen, zum Beispiel die Schiefe, die weitere Aussagen über die Daten machen. Weitere Kennzeichen werden werden hier jedoch nicht weiter vertieft. Version 5.1 - 013 47 2.4. Aufgaben 2.3.5. Transformation Eine lineare Transformation Y = bX + a hat die nachfolgende benannten Auswirkungen auf Streuungsmaße. Satz 2.19. Es seien X und Y metrisch messbare Merkmale, die mittels einer linearen Transformation Y = bX + a zusammenhängen. Dann gelten: Spannweite wY = bwX mittlere absolute Abweichung dY = bdX Varianz s2Y = b2 s2X Standardabweichung sY = bsX 2.4. Aufgaben Aufgabe 2.1. Es seien folgende Beobachtungen eines metrisch messbaren Merkmales X gegeben: 0, 7; 1, 6; 2, 4; 3, 2; 1, 6; 2, 4; 2, 8. Berechnen Sie das arithmetische Mittel, die mittlere absolute Abweichung und die Standardabweichung. Aufgabe 2.2. Bei einer Untersuchung der Anzahl der Besucher pro Tag einer Dienststelle ergeben sich bei 120 untersuchten Tagen die folgende absolute Häufigkeitsverteilung: Besucher Anzahl der Tage 0 5 1 4 2 3 4 10 12 20 5 6 7 18 18 12 8 9 15 2 10 4 Berechnen Sie das arithmetische Mittel und die Standardabweichung. Aufgabe 2.3. Ein Auto hat für typische Verkehrssituationen folgenden Benzinverbrauch: Stadtverkehr: 10l/100km, konstant 120 km/h: 9l/100km, konstant 90 km/h: 7l/100km. Ein Fahrer weiß, der er circa 25% seiner jährlichen Gesamtstrecke in der Stadt fährt, circa 50% auf der Autobahn mit 120 km/h und circa 25% auf der Landstraße mit 90 km/h. Berechnen Sie den voraussichtlichen Durchschnittsverbrauch. Aufgabe 2.4. Aus der Befragung nach dem Alter der Belegschaft eines Betriebes mit 30 Angestellten ergibt sich folgendes Ergebnis: 24, 24, 40, 22, 32, 51, 63, 22, 42, 43, 44, 51, 23, 32, 34, 64, 19, 23, 22, 50, 50, 33, 60, 18, 20, 50, 42, 30, 20 und 41. Daraus ergibt sich in nachfolgende Häufigkeitsverteilung mit der Bildung von Klassen: 48 Version 5.1 - 013 Kapitel 2. Univariate Daten j 1 2 3 4 5 6 Altersklasse unter 20 20 bis unter 30 30 bis unter 40 40 bis unter 50 50 bis unter 60 60 und mehr xj h(xj ) 18 2 25 9 35 5 45 6 55 5 63 3 Berechnen Sie das arithmetische Mittel auf Basis der Beobachtungen und auf Basis der Tabelle. Vergleichen Sie die beiden Werte. Aufgabe 2.5. Eine festverzinsliche Kapitalanlage bringt im 1. Jahr 3% Zins, im 2. Jahr 4% Zins, im 3. Jahr 5% Zins und im 4. Jahr 6% Zins. Berechnen Sie den durchschnittlichen (effektiven) Zinssatz, für diese Anlageform. Aufgabe 2.6. Eine Aktie bringt innerhalb von 5 Jahren die nachfolgenden jährlichen Gewinn / Verluste: +25%, -5%, +15%, -20%, -15%. Berechnen Sie die durchschnittlichen (effektiven) Gewinn oder Verlust für diese Aktie. Aufgabe 2.7. Der Kurs einer Aktie hat sich die in sind den letzten Jahren folgendermaßen entwickelt: +10%, -20%, +15%, +5%, -10%. Wie hoch ist die durchschnittliche Änderungsrate? Aufgabe 2.8. Ein PKW legt 4 Strecken unterschiedlicher Länge mit unterschiedlichen Geschwindigkeiten zurück. Teilstrecke Länge (in km) Geschwindigkeit (in 1 30 km ) 40 h 2 3 4 10 40 20 50 80 100 Mit welcher durchschnittlichen Geschwindigkeit würde die Strecke in der selben Zeit zurück gelegt werden? Aufgabe 2.9. Ein PKW legt von einer Strecke 1/6 mit einer Geschwindigkeit von 100 km/h, 1/3 mit einer Geschwindigkeit von 80 km/h und den Rest mit einer Geschwindigkeit von 50 km/h zurück. Mit welcher (konstanten) Geschwindigkeit würde er die gesamte Strecke in der gleichen Zeit bewältigen? Aufgabe 2.10. Gegeben seien drei verschiedene Verteilungen X, Y und Z, die durch die Angabe der relativen Häufigkeit definiert sind. Version 5.1 - 013 49 2.4. Aufgaben X Y Z 4 6 0,05 0,05 0,15 0,05 0,1 8 10 0,15 0,5 0,2 0,3 0,15 0,25 12 14 0,15 0,05 0,2 0,15 0,4 0,05 16 0,05 Bestimmen Sie jeweils das arithmetische Mittel und die Standardabweichung. Aufgabe 2.11. Für das Gewicht eines Sacks geben sich bei einer Stichprobe folgende Werte, jeweils in kg: 50,2 ; 49,9 ; 50,4 ; 49,8 ; 50,2 ; 50,3 ; 50,7 ; 49,7 ; 50,0 und 50,5. Berechnen Sie den Mittelwert, die Spannweite, die mittlere absolute Abweichung und die Standardabweichung. Aufgabe 2.12. Eine Zählung von Besuchern pro Tag einer Dienststelle ergab für einen gewissen Zeitraum die nachfolgende Verteilung: Besucher Anzahl der Tage 0 1 3 7 2 6 3 4 14 15 5 6 12 7 7 8 9 5 9 3 Bestimmen Sie das arithmetische Mittel, die mittlere absolute Abweichung, die Varianz und die Standardabweichung. Aufgabe 2.13. Für einen Telefonanschluss verteilen sich die Anzahl der Einheiten für die Telefongespräche gemäß der nachfolgenden Tabelle: Einheiten relative Häufigkeit 1 10% 2 3 5% 25% 4 5 10% 20% 6 7 10% 15% 8 5% Bestimmen Sie das arithmetische Mittel, die mittlere absolute Abweichung, die Varianz und die Standardabweichung. Aufgabe 2.14. Für das Alter einer Gruppe von Studenten ergibt sich folgende Verteilung: Alter Anzahl 18 19 4 7 20 21 22 5 12 16 23 24 25 8 9 4 26 27 5 3 Stellen Sie die Häufigkeitsverteilung und die Summenhäufigkeitsverteilung grafisch dar. Bestimmen Sie den Zentralwert, den (arithmetischen) Mittelwert, die mittlere absolute Abweichung und die Standardabweichung. Aufgabe 2.15. Eine Klausur ergab bei 14 Teilnehmern die Noten 1, 4, 2, 5, 2, 2, 3, 4, 2, 1, 5, 2, 3 und 3. (a) Bestimmen Sie den Median und die 4-Quantile. (b) Zeichnen Sie in ein Diagramm die absoluten Häufigkeiten und die absoluten Summenhäufigkeiten. (c) Bestimmen sie das arithmetische Mittel. (d) Bestimmen Sie die mittlere absolute Abweichung und den Standardabweichung. 50 Version 5.1 - 013 Kapitel 2. Univariate Daten Aufgabe 2.16. < doppelt > Aufgabe 2.17. Die Zählung von Gebühren für Gespräche von einem Telefonapparat ergab die nachfolgende Verteilung von Einheiten: Anzahl der Einheiten Anzahl der Gespräche 1 5 2 6 3 4 8 12 5 6 7 11 10 7 8 5 Bestimmen Sie das arithmetische Mittel, die Varianz und die Standardabweichung für die Gebühren. Aufgabe 2.18. Die Bevölkerung in einer Stadt hatte innerhalb einiger Jahre die nachfolgenden jährlichen Veränderung in Prozent vom Vorjahreswert: +10, -20, +5, +15, -5 und +10. Wie hoch ist das durchschnittliche jährlich Wachstum? Aufgabe 2.19. Ein Wanderer läuft 14 einer Strecke mit 7 km/h, 52 mit 6 km/h und den Rest mit 5 km/h. Mit welcher (konstanten) Geschwindigkeit würde er die gesamte Strecke in der gleichen Zeit bewältigen? Version 5.1 - 013 51 Kapitel 3. Bivariate Daten Im diesem Teil werden Beziehungen zwischen zwei Merkmalen beschreiben. Wie können solche Datenmengen dargestellt werden, welche Parameter beschreiben die Daten. 3.1. Darstellungen bivariater Daten Auch wenn der Schwerpunkt auf bivariate Daten liegt, werden auch multivariate Daten beispielhaft vorgestellt, denn es gibt oftmals auch mehrere Daten, die in eine Beziehung zueinander gebracht werden. 3.1.1. Multivariate Merkmale Bei vielen statistischen Untersuchungen werden an den statistischen Einheiten gleichzeitig mehrere Merkmale erfasst. Beispiel 3.1. Bei einer Volkszählung werden bei den befragten Personen verschiedene Daten erhoben: Geschlecht, Alter, Beruf, Religion, . . . . Beispiel 3.2. Bei einer Untersuchung der Leistungen von Schülern werden die Noten in Mathematik, Deutsch und Englisch erfasst. Beispiel 3.3. Für die Untersuchung der Wirksamkeit eines Düngemittels werden bei einem landwirtschaftlichen Experiment die Daten Einsatz von Dünger (je ha) und Ertrag (je ha) erfasst. Beispiel 3.4. Bei der Untersuchung von Personen wird jeweils die Körpergröße und das Gewicht ermittelt. Version 5.1 - 013 53 3.1. Darstellungen bivariater Daten Wir beschränken uns auf die Untersuchung zwei-dimensionaler, als bivariater Daten. Für weiter gehende Betrachtungen der mehr-dimensionalen also multivariater Daten verweise ich auf die Literatur. Bei der Betrachtung von zwei Merkmalen gibt es verschiedene Fragen, die man sich stellen kann: 1. Besteht ein Zusammenhang zwischen den Merkmalen? Liegt ein Zusammenhang bei metrisch oder ordinal messbaren Merkmalen vor, dann spricht man von Korrelation, bei nominal messbaren Merkmalen spricht man von Kontingenz. 2. Wie ausgeprägt ist der Zusammenhang zwischen den Merkmalen? Die Stärke des Zusammenhangs wird durch die Berechnung eines Korrelationskoeffizienten oder Kontingenzkoeffizienten ermittelt. 3. Von welchem Typ ist der Zusammenhang zwischen den Merkmalen? Durch welche Funktion kann dieser Zusammenhang beschrieben werden? Hierzu wird in einer Regressionsrechnung eine Regressionsfunktion ermittelt, die den Zusammenhang der Merkmale angibt. Es gibt verschiedene Arten von Zusammenhängen: linear, quadratisch, polynomial und exponentiell, um nur die wichtigsten Zusammenhänge zu nennen. Bevor wir an Berechnungen von statistischen Merkmalen gehen, werden wir zuerst noch einige Begriffe und Eigenschaften zwei-dimensionaler Verteilungen betrachten. 3.1.2. Zwei-dimensionale Häufigkeitstabellen Zuerst werden Häufigkeitstabellen, die von den univariaten Daten her bekannt sind auf bivariate Daten übertragen. Definition 3.1. Gegeben seien die Merkmale X mit den Ausprägungen xj (j = 1,. . . ,m) und Y mit den Ausprägungen yk (k = 1,. . . ,q), die an denselben statistischen Einheiten erhoben werden. Die Anzahl der Beobachtungen, bei denen die Kombinationen (xj ; yk ) der Ausprägungen auftritt heißt absolute Häufigkeit h(xj ; yk ). Der Anteil der absoluten Häufigkeit an der Gesamtzahl n der Beobachtungen heißt relative Häufigkeit f (xj ; yk ) und es gilt f (xj ; yk ) = n1 h(xj ; yk ). Die Gesamtheit aller Kombinationen von Merkmalsausprägungen mit den dazu gehörenden absoluten oder relativen Häufigkeiten heißt zwei-dimensionale Häufigkeitsverteilung. 54 Version 5.1 - 013 Kapitel 3. Bivariate Daten Paare von Beobachtungen werden im allgemeinen mit (xi ; yi ) (i=1,. . . ,n) bezeichnet, während (xj ; yk ) die Kombination der Merkmalsausprägungen xj und yk angibt (j=1,. . . ,m; k=1,. . . ,q). Die tabellarische Darstellung der Häufigkeitsverteilung heißt im zwei-dimensionale Häufigkeitstabelle und hat die Form gemäß Tabelle 3.1. x1 .. . y1 h(x1 ; y1 ) .. . xj .. . h(xj ; y1 ) .. . xm h(xm ; y1 ) . . . h(y1 ) ... ... .. . ... ... yk h(x1 ; yk ) .. . h(xj ; yk ) .. . ... .. . ... ... h(xm ; yk ) . . . h(yk ) ... yq h(x1 ; yq ) .. . h(x1 ) .. . h(xj ; yq ) .. . h(xj ) .. . h(xm ; yq ) h(yq ) h(xm ) n Tabelle 3.1.: Zwei-dimensionale Häufigkeitstabelle Am rechten beziehungsweise am unteren Rand sind die Randverteilungen. Es sind die Verteilungen für die Merkmale X beziehungsweise Y , also die Verteilungen, wenn man sich nur für eines der Merkmale interessiert, nicht jedoch für beide zusammen. Es gelten: h(xj ) = q X k=1 h(xj ; yk ) und h(yk ) = q X h(xj ; yk ) . (3.1) j=1 Beispiel 3.5. (Körpergröße und Gewicht) Eine Messung von Körpergröße und Gewicht bei 200 Personen hat das Ergebnis gemäß Tabelle 3.2 geliefert. Als Summen der Spalten beziehungsweise der Zeilen enthält man die Randverteilungen für Körpergröße beziehungsweise Gewicht. Definition 3.2. Die Häufigkeitstabelle zweier metrisch oder ordinal messbarer Merkmale heißt Korrelationstabelle. Die Häufigkeitstabelle zweier nur nominal messbarer Merkmale heißt Kontingenztabelle. In der Häufigkeitstabelle können viele Informationen abgelesen werden. Jede einzelne Zeile oder jede einzelne Spalte stellt eine eigene eindimensionale Verteilung dar, die genauso betrachtet werden kann. Version 5.1 - 013 55 3.1. Darstellungen bivariater Daten Gewicht in kg 50 bis u. 60 60 bis u. 70 70 bis u. 80 80 bis u. 90 90 bis u. 100 Körpergröße in cm (von ... bis unter ...) 150-160 160-170 170-180 180-190 190-200 3 5 8 3 1 4 25 40 10 1 2 10 20 6 2 1 8 10 16 5 0 2 2 5 11 10 50 80 40 20 20 80 40 40 20 200 Tabelle 3.2.: Beispiel: Körpergröße-Gewicht-Tabelle Definition 3.3. Gegeben sei die zwei-dimensionale Häufigkeitsverteilung der Merkmale X und Y . Die Häufigkeitsverteilung des Merkmales X (beziehungsweise Y ), die sich für eine gegebene Ausprägung yk (beziehungsweise xj ) des Merkmales Y (beziehungsweise X) ergibt, heißt bedingte Verteilung oder konditionale Verteilung von X (beziehungsweise Y ) für ein gegebenes yk (beziehungsweise xj ). Die Häufigkeiten der bedingten Verteilungen bezeichnet man mit h(xj |Y = yk ) oder kurz h(xj |yk ) und entsprechend f (xj |yk ) (j=1,. . . ,m) (beziehungsweise h(yk |xj ) und f (yk |xj ) (k=1,. . . ,q)). Die absoluten Häufigkeiten der bedingten Verteilung können unmittelbar aus der Häufigkeitstabelle abgelesen werden. Es gelten h(xj |yk ) = h(xj ; yk ) h(yk |xj ) = h(xj ; yk ) und . (3.2) Die bedingten relativen Häufigkeiten erhält man, indem die absoluten beziehungsweise relativen Häufigkeiten der entsprechenden Zeile oder Spalte der zweidimensionalen Häufigkeitsverteilung durch den zugehörigen Wert der Randverteilung dividiert. Es gelten also: f (xj |yk ) = f (xj ;yk ) f (yk ) = h(xj ;yk ) h(yk ) (3.3) beziehungsweise f (yk |xj ) = f (xj ;yk ) f (xj ) = h(xj ;yk ) h(xj ) . (3.4) Beispiel 3.6. In der Tabelle 3.2 können die verschiedenen Verteilungen und bedingten Verteilungen ausgewertet werden. 56 Version 5.1 - 013 Kapitel 3. Bivariate Daten 3.2. Zusammenhangsanalyse Bei der Betrachtung von zwei Merkmalen ist von Interesse, ob die beiden Merkmale voneinander abhängig sind oder nicht. Gleich hier nochmals ein Hinweis oder eine Warnung: Bei der rein zahlenmäßigen Betrachtung kann es vorkommen, dass zwei Merkmale eine Abhängigkeit zeigen, die es tatsächlich auf Grund von fachlich-sachlichen Gründen nicht gibt (Beispiel: scheinbare Abhängigkeit der Population von Störchen und der Anzahl der Geburten). Daher muss man hierbei stets den Hintergrund betrachten, um zu entscheiden, ob es tatsächlich eine Abhängigkeit gibt. Wie können wir ein Abhängigkeit feststellen. 3.2.1. Abhängigkeit Betrachten wir hierzu zunächst die nachfolgende Häufigkeitsverteilung (siehe Tabelle 3.3) für die zwei Merkmale X und Y : x1 x2 x3 y1 y2 2 4 2 8 6 8 10 20 y3 y4 10 4 24 16 6 10 40 30 20 50 30 100 Tabelle 3.3.: Beispiel Häufigkeitsverteilung Wie hängen die beiden Merkmale voneinander ab? Sind die beiden Merkmale unabhängig oder abhängig? Dazu bestimmen wir die bedingte Verteilung der relativen Häufigkeiten des Merkmales X für die verschiedenen Ausprägungen von Y und entsprechend die für das Merkmal Y für die verschiedenen Ausprägungen von X, das heißt für jede Merkmalsausprägung xj (beziehungsweise yk ) betrachten wir die relative Verteilung von Merkmal Y (beziehungsweise X), siehe Tabelle 3.4 beziehungsweise Tabelle 3.5. Die bedingte Verteilung der relativen Häufigkeiten sind verschieden. Die bedingte Verteilung von X hängt davon ab, welche Ausprägung Y annimmt und umgekehrt. Man sagt, die beiden Merkmale hängen voneinander ab, das heißt, die relative Häufigkeit von X beziehungsweise Y hängt davon ab, welche konkrete Ausprägung von Y (beziehungsweise X) herangezogen wird. Version 5.1 - 013 57 3.2. Zusammenhangsanalyse x1 x2 x3 y1 y2 y3 y4 0,1 0,2 0,5 0,2 0,04 0,16 0,48 0,32 0,2 0,27 0,2 0,33 1,0 1,0 1,0 Tabelle 3.4.: Bedingte Verteilung von Y y1 0,2 0,2 0,6 1,0 x1 x2 x3 y2 0,2 0,4 0,4 1,0 y3 0,25 0,6 0,15 1,0 y4 0,13 0,54 0,33 1,0 Tabelle 3.5.: Bedingte Verteilung von X Betrachten wir nunmehr die Tabelle 3.6 zwei-dimensionale Häufigkeitsverteilung für die zwei Merkmale X und Y . x1 x2 x3 y1 y2 2 5 6 15 4 10 12 30 y3 3 9 6 18 10 30 20 60 Tabelle 3.6.: Beispiel Häufigkeitsverteilung Bestimmen wir auch hier wiederum die bedingte Verteilung der relativen Häufigkeiten, siehe Tabelle 3.7. Die bedingten Verteilungen nach Y beziehungsweise X sind in den Tabellen 3.8 und 3.7 zu sehen. Die beiden Verteilungen für X (beziehungsweise für Y ) hängen nicht davon ab, welche Ausprägungen das andere Merkmal Y (beziehungsweise X) annimmt, das heißt die relative Häufigkeit einer Merkmalsausprägung von xj (beziehungsweise yk ) hängt nicht davon ab, welche konkrete Merkmalsausprägung von Y (beziehungsweise X) gewählt wird. Die Merkmale X und Y sind voneinander unabhängig. 58 Version 5.1 - 013 Kapitel 3. Bivariate Daten y1 y2 y3 0,2 0,5 0,3 0,2 0,5 0,3 0,2 0,5 0,3 x1 x2 x3 1,0 1,0 1,0 Tabelle 3.7.: Bedingte Verteilung Y x1 x2 x3 y1 0,17 0,5 0,33 1,0 y2 0,17 0,5 0,33 1,0 y3 0,17 0,5 0,33 1,0 Tabelle 3.8.: Bedingte Verteilung X Bei abhängigen Merkmalen hängen die bedingten Verteilungen der relativen Häufigkeiten eines Merkmales davon ab, welche Ausprägung das andere Merkmal annimmt. Bei unabhängigen Merkmalen stimmen alle bedingten Verteilungen der relativen Häufigkeiten eines Merkmales überein. Definition 3.4. Gegeben sei die zwei-dimensionale Häufigkeitsverteilung der beiden Merkmale X und Y. Stimmen alle bedingten Verteilungen der relativen Häufigkeiten überein, das heißt es gilt f (xj |yk ) = f (xj |yl ) für alle k,l=1,. . . ,q und für alle j=1,. . . ,m oder f (yk |xj ) = f (yk |xh ) für alle j,h=1,. . . ,m und für alle k=1,. . . ,q, dann heißen X und Y unabhängig, empirisch unabhängig oder statistisch unabhängig, andernfalls heißen sie empirisch abhängig oder statistisch abhängig. Für unabhängige Merkmale sind nicht nur alle bedingten Verteilungen eines Merkmales gleich, sondern sie stimmen mit der entsprechenden Randverteilung überein. Es gelten somit f (xj |yk ) = f (xj ) für k=1,. . . ,q und j=1,. . . ,m , sowie f (yk |xj ) = f (yk ) für j=1,. . . ,m und k=1,. . . ,q. Aus der Definition der bedingten relativen Häufigkeiten f (xj |yk ) = f (xj ;yk ) f (yk ) (3.5) folgt dann f (xj ) = Version 5.1 - 013 f (xj ;yk ) f (yk ) (3.6) 59 3.2. Zusammenhangsanalyse und damit f (xj )f (yk ) = f (xj ; yk ) . (3.7) Satz 3.5. Die relative Häufigkeit für das gemeinsame Auftreten der Ausprägungen xj und yk der Merkmale X und Y stimmt bei unabhängigen Merkmalen mit dem Produkt der entsprechenden relativen Häufigkeiten der Randverteilungen überein: f (xj ; yk ) = f (xj )f (yk ) (3.8) Für die absoluten Häufigkeiten gilt: h(xj ; yk ) = 1 h(xj )h(yk ) n (3.9) Das bedeutet, dass man bei unabhängigen Merkmalen die relativen Häufigkeiten der zwei-dimensionalen Verteilung aus den ein-dimensionalen Verteilungen berechnen kann. 3.2.2. Parameter zwei-dimensionaler Verteilungen Bei einer zwei-dimensionalen Verteilung können für die Randverteilungen und für die bedingten Verteilungen die Lage- und Streuungsparameter bestimmt werden. Dies sind jeweils Berechnungen für den ein-dimensionale Fall. Diese können problemlos durchgeführt werden können. Für die zwei-dimensionale Verteilung gibt es einen speziellen Parameter, der die beiden Merkmale miteinander verbindet - die Kovarianz. Sie ist die Summe über die Produkte der Differenzen der Beobachtungen zu den Mittelwerten. Definition 3.6. Gegeben seien die beiden gemeinsam auftretenden und metrisch messbaren Merkmale X und Y mit den arithmetischen Mitteln x̄ und ȳ. Die Kovarianz der zwei-dimensionalen Häufigkeitsverteilung ist wie folgt definiert: a) Für Paare von Beobachtungen (xi ; yi ) (i=1,. . . ,n): sXY = n 1X (xi − x̄)(yi − ȳ) n i=1 (3.10) b) Für die zwei-dimensionale Häufigkeitsverteilung mit den absoluten Häufigkeiten h(xj ; yk ) beziehungsweise den relativen Häufigkeiten f (xj ; yk ) j = 1, . . . , m ; k = 1, . . . , q): sXY = 60 q m X 1X (xj − x̄)(yk − ȳ)h(xj ; yk ) n j=1 k=1 (3.11) Version 5.1 - 013 Kapitel 3. Bivariate Daten beziehungsweise sXY = q m X X (xj − x̄)(yk − ȳ)f (xj ; yk ) . (3.12) j=1 k=1 Manchmal wird die Kovarianz auch mit COV (X, Y ) bezeichnet. Beispiel 3.7. Gegeben sei die zwei-dimensionale Verteilung (siehe Tabelle 3.9). x1 = 2 x2 = 4 x3 = 6 y1 = 1 y2 = 2 y3 = 3 y4 = 4 3 9 2 1 8 7 2 3 4 9 1 1 15 25 5 5 15 20 15 50 Tabelle 3.9.: Beispiel zwei-dimensionale Verteilung Es ist x̄ = 4 und ȳ = 2. Für die Kovarianz ergibt sich sXY = −0, 08. Die Berechnung der Kovarianz lässt sich vereinfachen, denn mit der obigen Formel sind viele Differenzen zu den Mittelwerten x und y zu bestimmen: sXY = n 1X (xi − x̄)(yi − ȳ) n i=1 (3.13) n 1X = (xi yi − xi ȳ − x̄yi + x̄ȳ) n i=1 = n n n 1X 1X 1X xi yi − ȳ xi − x̄ yi + x̄ȳ n i=1 n i=1 n i=1 = n 1X xi yi − x̄ȳ − x̄ȳ + x̄ȳ n i=1 = n 1X xi yi − x̄ȳ n i=1 Satz 3.7. Für die Berechnung der Kovarianz bei zwei gemeinsam auftretenden, metrisch messbaren Merkmalen X und Y mit den arithmetischen Mitteln x̄ und ȳ ergeben sich folgende vereinfachte Formeln zur Berechnung: sXY = Version 5.1 - 013 n 1X xi yi − x̄ȳ n i=1 (3.14) 61 3.3. Regressionsrechnung beziehungsweise sXY = q m X 1X xj yk h(xj ; yk ) − x̄ȳ n j=1 k=1 (3.15) und sXY = q m X X xj yk f (xj ; yk ) − x̄ȳ . (3.16) j=1 k=1 Die Varianz ist ein Maß für die Streuung oder Variabilität eines einzelnen, metrisch messbaren Merkmales, die Kovarianz ist ein Maß für die gemeinsame Variabilität zweier Merkmale. Haben zwei Merkmale keine Abhängigkeit, das heißt gibt es keinen Zusammenhang zwischen den Merkmalen X und Y , dann ist sXY = 0. Die Kovarianz ist jedoch nicht normiert. Durch die Berücksichtigung der Standardabweichungen der Merkmale X und Y ergibt sich eine weitere Kennzahl, die nur Werte zwischen −1 und 1 einnimmt. Definition 3.8. Gegeben sei die gemeinsame Verteilung zweier metrisch messbarer Merkmale X und Y , mit der Kovarianz sXY und den Standardabweichung sX und sY . Der Wert sXY (3.17) rXY = sX · sY heißt Korrelationskoeffizient und ist ein Maß für die Ausgeprägtheit des Zusammenhangs von X und Y . Es gilt −1 ≤ rXY ≤ 1. Sind die Merkmale unabhängig, dann gilt rXY = 0. Liegen alle Beobachtungspunkte auf einer Geraden, das heißt haben sie einen engen Zusammenhang, so gilt rXY = 1 oder rXY = −1. 3.3. Regressionsrechnung Bei der Untersuchung von zwei Merkmalen X und Y , die voneinander abhängig sind, ist der weitere Untersuchungsgegenstand die Frage, wie diese Abhängigkeit aussieht. Dazu werden wir eine Funktion berechnen, welche die Abhängigkeit der beiden Merkmale darstellt. Die Existenz einer statistischen Abhängigkeit ergibt sich aus einem sachlichen Zusammenhang. Ohne eine Kenntnis beziehungsweise Analyse der sachlichinhaltlichen Hintergründe eines Problems ist es nicht möglich, die Frage des Zusammenhangs von Merkmalen zu erörtern. Sonst werden Zusammenhänge berechnet, die sachlich nicht gerechtfertigt sind. 62 Version 5.1 - 013 Kapitel 3. Bivariate Daten Es wird die gemeinsame Verteilung zweier metrisch messbaren Merkmale X und Y betrachtet, die voneinander abhängig sind. Bei der Regressionsrechnung ist eine Funktion gesucht, die möglichst genau die Beziehung zwischen X und Y beschreibt. Dazu wird eine möglichst einfache Funktion ŷ = g(x) gesucht, die den Zusammenhang beschreibt. Durch ŷ wird dabei symbolisiert, dass die Regressionsfunktion einem beobachteten x-Wert nicht den oder die zugehörigen beobachteten y-Werte zuordnet, sondern einen auf der Regressionsfunktion liegenden Wert ŷ. Definition 3.9. Gegeben sei die zwei-dimensionale Verteilung der metrisch messbaren, statistisch abhängigen Merkmale X und Y . Eine Funktion ŷ = g(x), welche die Tendenz oder den durchschnittlichen Verlauf der Abhängigkeit des Merkmales Y vom Merkmal X beschreibt, heißt y-x-Regressionsfunktion oder manchmal auch nur kurz Regressionsfunktion genannt. Der Typ der Regressionsfunktion kann verschiedene Formen annehmen. Für die Bestimmung der Regressionsfunktion wird zuerst festgelegt, welche Art der Zusammenhang ist. Dies legt fest, ob der Zusammenhang zwischen den quantitativen Merkmalen durch eine • Gerade: y = a + bx • Parabel: y = a + bx + cx2 • Potenzfunktion: y = axb • Exponentialfunktion: y = abx • logistische Funktion: y = k 1+ea+bx (b > 0) (b < 0) • oder eine andere Funktion bestimmt ist. Die Bestimmung der Parameter der Regressionsfunktion geschieht in den meisten Fällen nach dem Kriterium der kleinsten Quadrate (KQ-Kriterium). Definition 3.10. Die Koeffizienten einer Regressionsfunktion ŷ = g(x) zur Beschreibung des Zusammenhangs zwischen den Merkmalen X und Y werden so bestimmt, dass die Summe der quartierten Abweichungen der Beobachtungen yi (i = 1, . . . , n) von den zugehörigen Werten auf der Regressionsfunktion ŷi = g(xi ), P also ni=1 (yi − ŷi )2 , zu einem Minimum wird. n X (yi − ŷi )2 = min (3.18) i=1 Die so bestimmte Regressionsfunktion heißt Regressionsfunktion nach der Methode der kleinsten Quadrate oder kurz KQ-Regressionsfunktion Version 5.1 - 013 63 3.3. Regressionsrechnung Wir werden uns hier jedoch nur mit der linearen Funktion beschäftigen! Bei der Berechnung einer linearen y-x-Regressionsfunktion gehen wir davon aus, dass die Regressionsfunktion die Gestalt ŷ = a + bx hat. Nach der Methode der Kleinsten Quadrate sind die Koeffizienten a und b so zu bestimmen, dass die Summe der Quadrate der Abweichungen der y-Koordinaten yi der beobachteten Wertepaare (xi ; yi ) von der durch die Regressionsfunktion bestimmte Koordinaten ŷi = a + bxi ein Minimum wird. Der Abstand der Punkte zur Geraden, d.h. parallel zur y-Achse. Bei n Wertepaaren erhalten wir die Funktion S(a, b) = n X (yi − ŷi )2 = i=1 n X (yi − a − bxi )2 (3.19) i=1 mit den Unbekannten a und b für die Summe. Die Aufgabe ist nun a und b so zu bestimmen, dass die Funktion S(a, b) ein Minimum annimmt. Eine notwendige Bedingung für das Minimum ist das Verschwinden der partiellen Ableitungen erster Ordnung von S(a, b) nach a und b. Für die partiellen Ableitungen ergeben sich: n X ∂S(a, b) = 2(yi − a − bxi )(−1) ∂a i=1 (3.20) n X ∂S(a, b) 2(yi − a − bxi )(−xi ) . = ∂b i=1 (3.21) und Diese Ableitungen werden Null gesetzt und man erhält die Normalgleichungen einer linearen KQ-Regressionsfunktion ŷ = a + bx: n X 1. Normalgleichung: yi = na + b i=1 2. Normalgleichung: n X i=1 xi yi = a n X (3.22) xi i=1 n X i=1 xi + b n X x2i (3.23) i=1 Dieses System der Normalgleichungen kann man nach den Regressionskoeffizienten a und b auflösen, denn die Koordinaten (xi , yi ) sind bekannt, die einzig Unbekannten sind a und b. 64 Version 5.1 - 013 Kapitel 3. Bivariate Daten Satz 3.11. Für die lineare KQ-Regressionsgerade ŷ = a + bx können die Regressionskoeffizienten a und b berechnet werden mittels: x2i ni=1 yi − ni=1 xi ni=1 xi yi P P n ni=1 x2i − ( ni=1 xi )2 Pn a= b= n P P P i=1 xi yi − ni=1 xi ni=1 yi P Pn n i=1 x2i − ( ni=1 xi )2 Pn P P i=1 (3.24) (3.25) Aus der 1. Normalgleichung ergibt sich, dass ȳ = a + bx̄ ist, dass somit die lineare Regressionsfunktion durch den Punkt (x̄; ȳ), die Koordinaten der Mittelwerte, verläuft. Erweitert man die Quotienten in den Formeln zur Bestimmung der Regressionskoeffizienten mit n12 , so erhält man für die Koeffizienten a und b: P a= b= 1 n P x2i ȳ n − x̄ s2X P xi yi n (3.26) xi yi − x̄ȳ COV (X, Y ) = 2 sX s2X (3.27) Durch Vertauschung der Rollen von x und y erhält man ebenso eine Regressionsfunktion, eine x-y-Regressionsfunktion nach dem Kriterium der Kleinsten Quadrate x̂ = a0 +b0 y. Hierzu wird eine Funktion x̂ = a0 +b0 y untersucht, mit dem Abstand parallel zur x-Achse. Analog zu den Berechnungen für die y-x-Regressionsfunktion erhält man dann: Pn 0 a = 0 b = i=1 n yi2 ni=1 xi − ni=1 yi ni=1 xi yi P P n ni=1 yi2 − ( ni=1 yi )2 P Pn P P xi yi − ni=1 xi ni=1 yi Pn P n i=1 yi2 − ( ni=1 yi )2 i=1 P (3.28) P (3.29) Im Regelfall (außer wenn alle Punkte auf einer Geraden liegen), stimmen die y-xund die x-y-Regressionsgerade nicht überein. Sie schneiden sich jedoch im Punkt (x̄ | ȳ). Es ist auch zu beachten, dass die x-y-Regressionsfunktion nicht die mathematische Umkehrfunktion der y-x-Regressionsfunktion ist! Version 5.1 - 013 65 3.3. Regressionsrechnung Beispiel 3.8. Gegeben sind die folgenden Beobachtungen xi yi 1 2 2 3 3 5 4 4 4 6 5 6 4 8 7 7 9 8 Für die Berechnung der Koeffizienten werden die benötigten Daten in Form einer Tabelle zusammen gestellt (siehe Tabelle 3.10). xi yi x2i xi yi 1 2 1 2 2 3 4 6 3 5 9 15 4 4 16 16 4 6 16 24 5 4 25 20 6 8 36 48 7 7 49 49 9 8 81 72 41 47 237 252 yi2 4 9 25 16 36 16 64 49 64 283 Tabelle 3.10.: Tabelle für Beispiel 3.8 Mit den Summen der Spalten ergeben sich die nachfolgenden Werte. Dabei wird teilweise zur Vereinfachung des Schreibens die Grenzen der Summation bei den P P P Summationszeichen weggelassen. Das heißt es steht kurz statt ni=1 . n=9 x̄ = s2X = n 1X 41 xi = = 4, 5556 n i=1 9 (3.31) n 1X 1 41 452 x2i − x̄2 = 237 − ( )2 = = 5, 5802 n i=1 9 9 81 ȳ = 66 (3.30) n 1X 47 yi = = 5, 2222 n i=1 9 (3.32) (3.33) Version 5.1 - 013 Kapitel 3. Bivariate Daten n 1X 47 338 1 = 4, 1728 yi2 − ȳ 2 = 283 − ( )2 = n i=1 9 9 81 s2Y = n 1X xi yi − x̄ȳ n i=1 41 47 341 1 · = = 4, 2099 = 252 − 9 9 9 81 sXY = P 2P xi y i P 2 − xi xi y i a= P n xi − ( xi )2 807 237 · 47 − 41 · 252 = 1, 7854 = = 9 · 237 − 412 452 P P P (3.35) P xi y i − xi yi b= P 2 P n x i − ( xi ) 2 9 · 252 − 41 · 47 341 = = = 0, 7544 2 9 · 237 − 41 452 n (3.34) (3.36) P (3.37) Die y-x-Regressionsgerade lautet somit ŷ = 1, 7854 + 0, 7544x. P 2P y i xi P 2 − yi xi yi a = P n yi − ( yi )2 283 · 41 − 47 · 252 −241 = = = −0, 7130 2 9 · 283 − 47 338 0 P P xi yi − yi xi b = P 2 P n yi − ( yi )2 9 · 252 − 41 · 47 341 = = = 1, 0089 2 9 · 283 − 47 338 0 n P P (3.38) P (3.39) Die x-y-Regressionsgerade (Vertauschung der Rollen von x und y) lautet somit x̂ = −0, 7130 + 1, 0089y oder (umgestellt auf die übliche Form) y = 0, 7067 + 0, 9912x̂. Für den Korrelationskoeffizienten gilt rXY = Version 5.1 - 013 341 sXY = √ √ = 0, 8724 sX · sY 452 338 (3.40) 67 3.4. Aufgaben y1 y2 4 6 5 7 11 7 x1 x2 x3 y3 10 8 2 Tabelle 3.11.: Aufgabe zwei-dimensionale Häufigkeitsverteilung 3.4. Aufgaben Aufgabe 3.1. Gegeben sei die zwei-dimensionale Häufigkeitstabelle, siehe Tabelle 3.11. Bestimmen Sie, ob die beiden Merkmale abhängig oder unabhängig sind. Aufgabe 3.2. Gegeben sei die zwei-dimensionale Häufigkeitstabelle, siehe Tabelle 3.12. Bestimmen Sie, ob die beiden Merkmale abhängig oder unabhängig sind. x1 x2 x3 y1 y2 y3 20 12 8 10 6 4 5 3 2 y4 4 2 1 Tabelle 3.12.: Aufgabe zwei-dimensionale Häufigkeitsverteilung Aufgabe 3.3. Gegeben sind die unabhängigen Merkmale X und Y mit den Verteilungen: xj h(xj ) yk h(yk ) x1 8 y1 8 x2 x3 40 16 y2 y3 y4 32 16 8 Bestimmen Sie die zwei-dimensionale Verteilung der absoluten Häufigkeit. Aufgabe 3.4. < doppelt > Aufgabe 3.5. < doppelt > Aufgabe 3.6. < doppelt > 68 Version 5.1 - 013 Kapitel 3. Bivariate Daten Aufgabe 3.7. Für die Merkmale X und Y wurden die folgenden Beobachtungen xi yi 2 5 2 7 4 4 4 6 5 4,5 6 3 6 5 8 3 ermittelt. Berechnen Sie eine lineare KQ-Regressionsfunktion ŷ = a + bx. Zeichnen Sie die Datenpunkte und die Regressionsgerade in eine gemeinsame Zeichnung. Bestimmen Sie den Korrelationskoeffizienten. Aufgabe 3.8. Gegeben sind die unabhängigen Merkmale X und Y mit den Verteilungen: xj h(xj ) x1 24 x2 x 3 x4 40 72 16 yk h(yk ) y1 y2 y3 19 76 57 Bestimmen Sie die zwei-dimensionale Verteilung der absoluten Häufigkeit. Aufgabe 3.9. Gegeben sind die folgenden Beobachtungen xi yi 1 2 4 4 3 3 4 6 6 7 5 9 8 8 Berechnen Sie die Regressionsgerade. Zeichnen Sie die Punkte und die Gerade in ein Diagramm. Berechnen Sie den Korrelationskoeffizienten. Aufgabe 3.10. Gegeben sind die folgenden Beobachtungen xi yi 1 6 3 5 5 6 7 7 6 8 Berechnen Sie die (y-x-)Regressionsgerade. Zeichnen Sie die Punkte und die Gerade in ein Diagramm. Berechnen Sie den Korrelationskoeffizienten. Aufgabe 3.11. < doppelt > Aufgabe 3.12. Gegeben sind die folgenden Beobachtungen (xi ; yi ): (0;0), (1;1), (2;4), (3;9) und (4;16). Berechnen Sie die Regressionsgerade und den Korrelationskoeffizienten. Zeichnen Sie die Punkte und die Regressionsgerade in ein Diagramm. Version 5.1 - 013 69 3.4. Aufgaben Aufgabe 3.13. Gegeben seien die folgenden Beobachtungswerte (xi ; yi ): (1;3), (2;4), (3;7), (5;6), (4;6), (6;5), (7;9) und (8;8). Berechnen Sie die Regressionsgerade nach der Methode der Kleinsten-Quadrate. Zeichnen Sie die Punkte und die Regressionsgerade in ein Diagramm ein. Bestimmen Sie die Kovarianz sXY und den Korrelationskoeffizienten rXY . Aufgabe 3.14. Der jährliche Umsatz einer Firma hat in den letzten Jahren folgende Entwicklung durchgeführt (Angaben jeweils in Mio. EURO): Jahr Umsatz 1997 1998 4,7 5,6 1999 2000 6,2 7,4 2001 2002 7,6 8,9 Die Firmenleitung geht davon aus, dass sich der Trend für den Umsatz in den nächsten Jahren nicht verändert. Bestimmen Sie die Regressionsgeraden nach der Methode der Kleinsten-Quadrate. Bestimmen Sie eine Prognose für den Umsatz für die Jahre 2003, 2004 und 2008. 70 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen In diesem Kapitel werden spezielle bivariate Daten betrachtet. Daten bei der die eine Variable die Zeit ist. 4.1. Zeitreihen Die grundlegende Aufgabe der Zeitreihenanalyse ist die Beschreibung des Verlaufs der Beobachtungen eines Merkmales für verschiedene Zeitpunkte beziehungsweise Zeitintervalle. Betrachtet man beispielsweise den monatlichen Verbrauch von Strom in den letzten Jahren, so kann man zwei Eigenschaften erkennen. Zum einen gibt es eine periodische Schwankung, im Winter wird mehr Strom benötigt als im Sommer, zum anderen gibt es die langfristige Tendenz eines steigenden Bedarfs an Strom. Es gibt somit bei diesen Untersuchungen periodische beziehungsweise zyklische Schwankungen und eine langfristige Tendenz einer Zeitreihe, die als Trend bezeichnet wird. Wir werden nun im weiteren untersuchen, wie periodische Schwankungen erfassen und eliminieren können, um den Trend zu ermitteln. Für die Ermittlung des Trends besteht zuerst die Aufgabe, die periodischen Schwankungen auszuschließen. Das einfachste Verfahren hierzu ist die Bestimmung der gleitenden Durchschnitte. Beim gleitenden Durchschnitt berechnet man aus jeweils k unmittelbar aufeinander folgenden Werten der Zeitreihe das arithmetische Mittel und ordnet diesen Wert einem Zeitpunkt zu. Es werden somit stets k Werte für den Durchschnitt benötigt. Mit jedem neuen Werte wird der älteste Wert aus der Ermittlung des Durchschnittes entfernt. Wir betrachten hier nachlaufende gleitende Durchschnitte (für den Durchschnitt werden nur zurückliegende Werte berücksichtigt) und nicht zentrierte gleitende Durchschnitte (für den jeweiligen Durchschnitt werden zurückliegende und zeitlich nachfolgende Werte berücksichtigt). Version 5.1 - 013 71 4.1. Zeitreihen Definition 4.1 (Gleitender Durchschnitt). Gegeben seien T Werte xt (t = 1, . . . , T ) einer Zeitreihe mit gleichen Abständen der Zeitpunkte. Der gleitenden Durchschnitt k-ter-Ordnung ist definiert für t = k, . . . , T durch: x̄kt t 1 X 1 xi . = (xt−(k−1) + xt−(k−2) + · · · + xt ) = k k i=t−(k−1) (4.1) Für t = 1, . . . , k − 1 gibt es verschiedene Möglichkeiten. Es können keine Durchschnitte definiert werden oder jeweils x̄kt t 1 1X = (x1 + x2 + · · · + xt ) = xi . t t i=1 (4.2) Beispiel 4.1 (Gleitender Durchschnitt 3. Ordnung). In der Zeitreihe, die in Tabelle 4.1 gegeben ist, sind die gleitende Durchschnitte der 3. Ordnung berechnet. Für die ersten beiden Perioden ist kein gleitender Durchschnitt 3. Ordnung berechnet worden. Periode Wert 1 10 2 8 3 12 4 12 5 10 6 14 7 14 8 12 9 16 gleitender Durchschnitt 10+8+12 = 30 = 10,0 3 3 8+12+12 32 = 3 = 10,7 3 12+12+10 = 34 = 11,3 3 3 12+10+14 36 = 3 = 12,0 3 10+14+14 = 38 = 12,7 3 3 14+14+12 40 = = 13,3 3 3 42 14+12+16 = 3 = 14,0 3 Tabelle 4.1.: Beispiel: gleitender Durchschnitt 3. Ordnung Es ist zu sehen, dass die Werte des gleitenden Durchschnittes einen linearen Verlauf haben. Beispiel 4.2 (Gleitender Durchschnitt 4. Ordnung). In der Zeitreihe, die in Tabelle 4.2 definiert ist, sind die gleitenden Durchschnitte der 4. Ordnung berechnet. Für die ersten drei Perioden wurden keine gleitende Durchschnitte berechnet. Auch hier haben die gleitende Durchschnitte wieder einen linearen Verlauf. 72 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Periode Wert 1 4 2 7 3 5 4 3 5 6 6 9 7 7 8 5 gleitender Durchschnitt 4+7+5+3 4 7+5+3+6 4 5+3+6+9 4 3+6+9+7 4 6+9+7+5 4 = = = = = 19 4 21 4 23 4 25 4 27 4 = = = = = 4,75 5,25 5,75 6,25 6,75 Tabelle 4.2.: Beispiel: Gleitender Durchschnitt 4. Ordnung Bildet man die Zeitreihe aus den Differenzen zwischen den Beobachtungswerten und den gleitenden Durchschnitten zu den entsprechenden Zeitpunkten, dann extrahiert man damit die saisonalen Schwankungen, die dann ebenfalls analysiert werden können. Der gleitende Durchschnitt wird beispielsweise bei Aktienkursen eingesetzt. Dort gibt es 20-Tagen-Linien, 30-Tages-Linien, 50-Tages-Linien, 100-Tages-Linien, 200Tages-Linien und ähnliches. Die x-Tages-Linien sind gleitende Durchschnitte der Ordnung x. 4.2. Bestandsanalyse Eine Bestandsmasse ist eine statistische Masse, deren Einheiten für ein gewisses Zeitintervall zur Masse gehört. Zu jeder Bestandsmasse gehört eine dazu korrespondierende Ereignismasse, nämlich die Zugänge und die Abgänge. Wird ein Bestand fortlaufend um Zugänge und Abgänge ergänzt, dann spricht man von Fortschreibung. Beispiel für Bestände sind: • Teile in einem Lager, • Anzahl der Lizenzen eines Programmes, die gleichzeitig im Netz aktiv sind. (Lizenzen!) • Entwicklung der Bevölkerung einer Gemeinde. • Die Anzahl der Tiere auf einem Bauernhof. Version 5.1 - 013 73 4.2. Bestandsanalyse • Konzentration von Stickoxiden in der Atmosphäre. • Besucher eines Tages eines Schwimmbad. • Der Bestand auf einem Konto. • Der Bestand auf einem Konto der Bilanz. Die Bestandsanalyse bezieht sich immer auf einen vorgegebenen Zeitraum. Der Anfangszeitpunkt wird mit tA und der Endzeitpunkt wird mit tE bezeichnet. Um zu untersuchen, wie sich der Bestand im Laufe der Zeit verändert, wird der Zeitraum von tA bis tE in m Zeitintervalle unterteilt. Als Grenzen für diese Zeitintervalle setzt man die Zeitpunkte t0 = tA , t1 , . . . , tm−1 , tm = tE . In der weiteren Betrachtung wird davon ausgegangen, dass die Länge der Zeitintervalle identisch sind. Somit hat −tA . Als Bestand bezeichnet jedes Zeitintervall die (zeitliche) Länge von ∆t = tEm man die Anzahl (Häufigkeit) der Einheiten zu einem bestimmten Zeitpunkt. Der Bestand zum Zeitpunkt t beziehungsweise tj wird mit Bt beziehungsweise mit Bj bezeichnet. B0 heißt Anfangsbestand, Bm heißt Endbestand. Definition 4.2 (abgeschlossene und offene Bestandsmasse). Gilt für eine Bestandsmasse Bt = 0 für t ≤ t0 und für t ≥ tm , dann handelt es sich um eine im Zeitintervall (t0 ; tm ) abgeschlossene Bestandsmasse . Gilt Bt 6= 0 für mindestens ein t ≤ t0 oder t ≥ tm , dann liegt eine im Zeitintervall (t0 ; tm ) offene Bestandsmasse vor. Die Besucher eines Schwimmbades innerhalb eines Tages ist eine abgeschlossene Bestandsmasse, denn vor der Öffnung und nach Schluss befindet sich kein Besucher im Schwimmbad. Die Einwohner einer Gemeinde dagegen ist eine offene Bestandsmasse. Definition 4.3 (Verweilsdauer). Wenn für eine Einheit der Bestandsmasse, der Zeitpunkt des Zugangs tz und der Zeitpunkt des Abgangs ta bekannt sind, dann heißt d = ta − tz die Verweildauer der Einheit. Definition 4.4 (Zugang, Abgang). Die Anzahl der Einheiten, die zu einem Bestand im Zeitintervall von tj−1 bis tj hinzukommen, heißt Zugang zj . Die Anzahl der Einheiten um die ein Bestand im Zeitintervall von tj−1 bis tj verringert wird, heißt Abgang aj . Die Summe aller Zugänge zi (i = 1, . . . , j) von t0 bis tj heißt Zugangssumme Zj . Die Summe aller Abgänge ai (i = 1, . . . , j) von t0 bis tj heißt Abgangssumme Aj . Es gelten Zj = j X i=1 74 zi und Aj = j X ai (4.3) i=1 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Bei einer geschlossenen Bestandsmasse ist die Anzahl der den Bestand durchlaufenden Einheiten gleich der Zugangs- oder der Abgangssumme. Diese Gesamtanzahl wird mit n bezeichnet und es gilt Zm = Am = n. Den Bestand Bj lässt sich mit damit berechnen: Bj = Bj−1 + zj − aj , Bj = B0 + Zj − Aj . (4.4) Wenn man sich den Lagerbestand betrachtet und die Zeitintervalle die Tage sind, dann ergibt sich die Frage, wann der Zugang und wann der Abgang durchgeführt wird. Wenn am Anfang 5 Teile vorhanden sind, ein Zugang von 10 Teilen und ein Abgang von ebenfalls 10 Teilen erfolgt, dann sind am Ende wieder 5 Teile vorhanden. Was ist jedoch, wenn der Abgang am morgen, der Zugang erst am Abend ist, dann hat man morgens ein Problem, denn der Bestand beträgt nur 5. Hier wird die Variante betrachtet, dass der Ab- und Zugang erst am Ende einer Periode wirksam ist. Beispiel 4.3. Bei der Untersuchung der Veränderungen der Vorräte in einem Haushalt ergeben sich die in der Tabelle 4.3 dargestellten Veränderungen (Zugang und Abgang) der Bestände an Milchflaschen. Die Tage, an denen es keine Bestandsveränderung gibt, sind nicht aufgeführt, für die Berechnung jedoch von Bedeutung. Der Anfangsbestand beträgt 10 Flaschen. 0 3 6 10 11 12 16 17 22 25 27 29 30 Tag Zugang 40 20 40 20 Abgang 5 8 12 6 7 10 3 11 14 9 17 14 Bestand 10 5 37 25 19 12 2 19 8 34 25 8 14 Tabelle 4.3.: Bestandsveränderungen Es liegt ein offener Bestand vor. Definition 4.5 (Zugangsrate, Abgangsrate). Das arithmetische Mittel der Zugänge zj beziehungsweise der Abgänge aj über alle Perioden hinweg heißt Zugangsrate z̄ beziehungsweise Abgangsrate ā: m m 1 X 1 X z̄ = zi und ā = ai m i=1 m i=1 (4.5) Es ist zu beachten, dass alle Zeitintervalle berücksichtigt werden, auch wenn in diesem Zeitintervall keine Bestandsveränderung vorkommt. Version 5.1 - 013 75 4.2. Bestandsanalyse Beispiel 4.4 (Fortsetzung Beispiel 4.3). Beim obigen Beispiel der Bestandsführung der Milchflaschen, gibt es 30 Tage (Zeitintervalle). Somit ist m = 30. Es ergibt sich eine Zugangssumme von Zm = 120. Die Abgangssumme Am = 116. Damit sind z̄ = 120 = 4, 00 und ā = 116 = 3, 87. Das bedeutet, dass täglich durch30 30 schnittlich 4,00 Milchflaschen hinzukommen und 3,87 Flaschen wegkommen. Definition 4.6 (Durchschnittsbestand, mittlere Verweildauer, Umschlagshäufigkeit). Werden alle Veränderungen vom Bestand zum Ende des Intervalls berücksichtigt, dann gilt für den Durchschnittsbestand X 1 m−1 Bj . B̄ = m j=0 (4.6) Achtung: in dieser Summe ist die letzte Bestandssumme nicht enthalten, da gemäß der Festlegung die Bestandsveränderung erst zum Ende der Periode wirksam wird. Für die mittlere Verweildauer d¯ gilt bei einer geschlossenen Bestandsmasse, wobei n die Gesamtanzahl der Einheiten, das heißt sie Summe der Zugänge beziehungsweise die Summe der Abgänge, ist B̄(tm − t0 ) d¯ = n (4.7) und bei einer offenen Bestandsmasse 2B̄(tm − t0 ) d¯ = Am−1 + Zm−1 (4.8) Die Umschlagshäufigkeit U eines Bestandes in einem Zeitintervall tm − t0 entspricht der mittleren Anzahl von Erneuerungen des Bestandes und wird wie folgt berechnet: (für eine geschlossene Bestandsmasse) tm − t0 n = B̄ d¯ (4.9) tm − t0 Am−1 + Zm−1 = 2B̄ d¯ (4.10) U= für eine offene Bestandsmasse U= Beispiel 4.5 (Fortsetzung Beispiel 4.3). Für den obigen Lagerbestand an Milchflaschen ergibt sich somit B̄ = 76 1 532 (10 + 10 + 10 + 5 + . . . + 25 + 25 + 8) = = 17, 73 30 30 (4.11) Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Da festgelegt wurde, dass die Veränderungen des Bestandes erst am Ende der jeweiligen Zeitintervalle aktiv werden, dann dürfen die Zu- und Abgänge der letzten Periode nicht berücksichtigt werden. Es gilt dann: d¯ = 30 2 532 1064 30 = = 5, 27 , 100 + 102 202 (4.12) also eine mittlere Verweildauer von 5,27 Tagen. Für das obige Beispiel der Milchflaschen ergibt sich U= 100 + 102 = 5, 70 , 2 532 30 (4.13) also eine Umschlagshäufigkeit von 5,7. Das bedeutet, dass der Bestand 5,7 mal gefüllt und wieder geleert wird. Die Parameter Zugangsrate, Abgangsrate, Durchschnittsbestand, mittlere Verweildauer und Umschlagshäufigkeit sind wichtige Kenngrößen für eine Bestandsanalyse. Beispiel 4.6. Eine Firma verkauft zwei Produkte A und B. Für einen Zeitraum von 10 Wochen werden die Veränderungen am Bestand untersucht (siehe Tabelle 4.4 und 4.5). Der Anfangsbestand der Produkte sind 150 (Produkt A) und 30 (Produkt B). Es wird angenommen, dass die Veränderungen jeweils zum Ende des Intervalls wirksam werden. 0 1 Woche Zugang 150 100 Abgang Bestand 150 200 2 3 10 190 20 170 4 5 6 10 30 160 130 20 110 7 8 9 10 10 10 20 10 100 90 70 60 Tabelle 4.4.: Bestandsverlauf Produkt A Woche 0 1 2 3 4 5 6 7 8 9 10 Zugang 80 200 300 100 100 Abgang 100 60 70 80 120 50 60 20 110 60 Bestand 30 10 150 80 0 180 130 70 150 140 80 Tabelle 4.5.: Bestandsverlauf Produkt B Version 5.1 - 013 77 4.3. Indexzahlen Für das Produkt A gilt: 1370 1 (150 + 200 + · · · + 70) = = 137 10 10 Für die mittlere Verweildauer gilt B̄ = (4.14) 2B̄(tm − t0 ) 2 ∗ 137 ∗ 10 d¯ = = = 7, 21 (4.15) Am−1 + Zm−1 150 + 230 Das heißt, dass ein Teil des Produkts eine mittlere Verweildauer im Lager von 7,21 Wochen hat. Für die Umschlagshäufigkeit ergibt sich 150 + 230 Am−1 + Zm−1 = U= = 1, 39 (4.16) 2 ∗ 137 2B̄ Das heißt, dass das Lager in dem Zeitraum der 10 Wochen 1,39 mal umgeschlagen wird. Für das Produkt B gilt: 1 940 (30 + 10 + · · · + 140) = = 94 10 10 Für die mittlere Verweildauer gilt B̄ = (4.17) 2B̄(tm − t0 ) 2 ∗ 94 ∗ 10 = = 1, 30 (4.18) d¯ = Am−1 + Zm−1 780 + 670 Das heißt, dass ein Teil des Produkts eine mittlere Verweildauer im Lager von 1,30 Wochen hat. Für die Umschlagshäufigkeit ergibt sich Am−1 + Zm−1 780 + 670 = 7, 71 (4.19) U= = 2 ∗ 94 2B̄ Das heißt, dass das Lager in dem Zeitraum der 10 Wochen 7,71 mal umgeschlagen wird. Bei diesem Beispiel ist das Produkt A ein Langsamdreher, das heißt es gibt nicht so viel Bewegung beim Ersatz des Bestandes. Das Produkt B ist dagegen ein Schnelldreher, die Verweildauer im Lager ist nur kurz. 4.3. Indexzahlen Indexzahlen beschreiben die Entwicklung von Werten, die in Zeitreihen dargestellt sind. Bekannte Indizes sind der Verbraucherpreisindex (VPI), der die durchschnittliche Preisentwicklung darstellt, und der Aktienindex DAX (Deutschen Aktien Index). Dieser Abschnitt orientiert sich an Wewel 2011. 78 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Grundbegriffe Voraussetzung für eine Indexberechnung ist eine Zeitreihe für die Daten der Beobachtungen eines Merkmals. Zu einem Zeitreihenwert yt zur Berichtsperiode t und einem Zeitreihenwert y0 zur Basisperiode 0 gibt es eine Messzahl m0t = yt , y0 (4.20) welche das Verhältnis der Werte zwischen Berichtsperiode und Basisperiode beschreibt. Beispiel 4.7 (Energiepreisentwicklung). Ein Industriebetrieb bezieht Energielieferungen in Form von Öl, Gas und Elektrizität. Die Preise der Produkte für das Basisjahr 0 und für das Berichtsjahr t sind in der Tabelle 4.6 dargestellt. i Energie 1 Öl 2 Gas 3 Elektrizität Preis Basisjahr pi0 0,12 [e/l] 0,28 [e/m3 ] 0,08 [e/kWh] Preis Berichtsjahr pit 0,30 [e/l] 0,42 [e/m3 ] 0,06 [e/kWh] Preismesszahl pit /pi0 2,50 1,50 0,75 Tabelle 4.6.: Energiepreisentwicklung Die Preismesszahlen bedeuten, dass der Ölpreis zwischen Basisjahr und Berichtsjahr um den Faktor 2,5, also um 150%, gestiegen ist, der Gaspreis um den Faktor 1,5 (plus 50%). Der Strompreis hat sich um den Faktor 0,75 verändert, ist also um 25% gesunken. Für die verschiedenen Produkte (i = 1, 2, 3) gibt es die verschiedenen Preismesszahlen mi0t = pit /p0t . Definition 4.7 (Indexzahl). Eine Indexzahl (oder kurz Index) I0t ist ein gewichteter Mittelwert (mit den Gewichten gi für i = 1, . . . , n) von gleichartigen Messzahlen mi0t , die sich auf verschiedene Güter i (i = 1, . . . , n), aber jeweils auf dieselbe Basisperiode 0 und dieselbe Berichtsperiode t beziehen I0t = n X gi mi0t . (4.21) i=1 Version 5.1 - 013 79 4.3. Indexzahlen Beispiel 4.8 (Verbraucherpreisindex). Der Verbraucherpreisindex (VPI) ist eine Index für die Preisentwicklung in Deutschland. Hierzu werden die Preisveränderung für verschiedene Produkte und Dienstleistungen untersucht und ein Index berechnet. Weitere Informationen dazu findet man bei Statistischen Bundesamt. (siehe https: // www. destatis. de/ DE/ Meta/ AbisZ/ VPI. html ) Bezüglich der Art des Index gibt es eine Unterscheidung bezüglich der Veränderungen, die betrachtet werden. Definition 4.8 (Preisindex, Mengenindex, Wertindex, Umsatzindex). Ein Preisindex beschreibt die durchschnittliche Preisentwicklung einer Gütergruppe. Ein Mengenindex beschreibt die durchschnittliche Mengenentwicklung einer Gütergruppe. Ein Wertindex oder Umsatzindex beschreibt die durchschnittliche Wert- beziehungsweise Umsatzentwicklung. Er beinhaltet somit Preis- und Mengenkomponenten. Indizes Ein Preisindex basiert in der Regel auf einen festen Warenkorb mit n Gütern, die mit einer festen Menge im Warenkorb enthalten sind. Ein Preisindex P0t beschreibt die Veränderung des Preises des Warenkorbs zwischen Basisperiode 0 und Berichtsperiode t. Definition 4.9 (Preisindex). Gegeben seien n Güter mit den festen Gütermengen qi (i = 1, . . . , n) im Warenkorb. Die Preise sind pi0 für die Basisperiode und pit für die Berichtsperiode für (i = 1, . . . , n). Daraus ergibt sich der Preisindex mittels der Preisindex-Formel Pn pit qi . (4.22) P0t = Pni=1 i=1 p0t qi In der Regel werden sich nicht nur Preise ändern, sondern auch der Warenkorb. Diese Anpassungen können berücksichtigt werden. Definition 4.10 (Preisindex nach Laspeyres und Preisindex nach Paasche). Gegeben seien n Güter. Die Gütermenge in der Basisperiode 0 sei qi0 (i = 1, . . . , n). Die Preise sind pi0 für die Basisperiode und pit für die Berichtsperiode für (i = 1, . . . , n). Daraus ergibt sich der Preisindex nach Laspeyres1 auf Basis der Gütermengen zur Basisperiode P0tL 1 Pn pit qi0 . i=1 pi0 qi0 = Pni=1 (4.23) Ernst Louis Étienne Laspeyres (1834 - 1913), deutscher Ökonom 80 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Dies kann auch als gewichteter Mittelwert dargestellt werden P0tL = n X pit giL pi0 i=1 n X n pit qi0 pi0 qi0 pit . = = Pni=1 Pn i=1 pi0 qi0 pi0 i=1 pi0 qi0 i=1 P (4.24) Der Preisindex nach Paasche2 basiert auf den Gütermengen zur Berichtsperiode Pn pit qit P P0t = Pni=1 . (4.25) i=1 pi0 qit Dies kann als gewichteter harmonischer Mittelwert dargestellt werden P0tP n 1 pit qit 1 . = Pn P pit = Pn P pit qit pi0 = Pni=1 p q n i0 it i=1 gi pi0 i=1 i=1 pit qit pit P (4.26) i=1 Beispiel 4.9 (Energiepreisentwicklung (Fortsetzung Beispiel 4.7)). In der Tabelle 4.7 sind Mengenveränderungen aufgeführt zwischen Basisperiode und Berichtsperiode aufgeführt. Die Preisänderungen sind in der Tabelle 4.6 dargestellt worden. i Energie 1 2 3 Öl Gas Elektrizität Menge Basisjahr qi0 70.000 [l] 10.000 [m3 ] 280.000 [kWh] Menge Mengenmesszahl Berichtsjahr qit qit /qi0 84.000 [l] 1,20 3 24.000 [m ] 2,40 420.000 [kWh] 1,50 Tabelle 4.7.: Energiemengenentwicklung Damit können die Preisindizes berechnet werden. Es gelten 0, 30 · 70.000 + 0, 42 · 10.000 + 0, 06 · 280.000 0, 12 · 70.000 + 0, 28 · 10.000 + 0, 08 · 280.000 42.000 = = 1, 25 33.600 P0tL = (4.27) und 0, 30 · 84.000 + 0, 42 · 24.000 + 0, 06 · 420.000 (4.28) 0, 12 · 84.000 + 0, 28 · 24.000 + 0, 08 · 420.000 60.480 = = 1, 20 . 50.400 Je nach verwendeter Indexvariante sind die Preise für Energie zwischen Basisperiode und Berichtsperiode um 25% oder 20% gestiegen. P0tP = 2 Hermann Paasche (1851 - 1925), deutscher Ökonom Version 5.1 - 013 81 4.3. Indexzahlen Ein Wertindex sind gewichtete Mittelwerte von Mengenmesszahlen. Es wird die mengenmäßige Veränderungen eines Warenkorbs betrachtet. Definition 4.11 (Mengenindex). Gegeben seien n Güter mit den festen Preisen pi (i = 1, . . . , n) im Warenkorb. Die Mengen sind qi0 für die Basisperiode und qit für die Berichtsperiode für i = 1, . . . , n. Daraus ergibt sich der Mengenindex mittels der Mengenindex-Formel Pn pi qit . i=1 pi qi0 Q0t = Pni=1 (4.29) In der Regel werden sich nicht nur Preise ändern, sondern auch der Warenkorb. Diese Anpassungen können berücksichtigt werden. Definition 4.12 (Mengenindex nach Laspeyres und Mengenindex nach Paasche). Gegeben seien n Güter. Die Preise in der Basisperiode 0 seien pi0 (i = 1, . . . , n). Die Mengen sind qi0 für die Basisperiode und qit für die Berichtsperiode (i = 1, . . . , n). Daraus ergibt sich der Mengenindex nach Laspeyres auf Basis der Preise zur Basisperiode QL0t Pn pi0 qit . i=1 pi0 qi0 = Pni=1 (4.30) Der Mengenindex nach Paasche basiert auf den Preisen zur Berichtsperiode QP0t Pn pit qit . i=1 pit qi0 = Pni=1 (4.31) Beispiel 4.10 (Energiepreisentwicklung (Fortsetzung Beispiel 4.7)). Gemäß Tabelle 4.7 und Tabelle 4.6 ergibt sich für den Mengenindex nach Laspeyres 0, 12 · 84.000 + 0, 28 · 24.000 + 0, 08 · 420.000 0, 12 · 70.000 + 0, 28 · 10.000 + 0, 08 · 280.000 50.400 = 1, 5 . = 33.600 QL0t = (4.32) Für den Mengenindex nach Paasche ergibt sich 0, 30 · 84.000 + 0, 42 · 24.000 + 0, 06 · 420.000 0, 30 · 70.000 + 0, 42 · 10.000 + 0, 06 · 280.000 60.480 = = 1, 44 . 42.000 QP0t = (4.33) Bei einem Wert- oder Umsatzindex werden Preis- und Mengenänderungen berücksichtigt. 82 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Definition 4.13 (Wertindex). Gegeben seien n Güter mit den Preisen pi0 in der Basisperiode und pit in der Berichtsperiode (i = 1, . . . , n) im Warenkorb. Die Mengen sind qi0 für die Basisperiode und qit für die Berichtsperiode für i = 1, . . . , n. Daraus ergibt sich der Wertindex mittels der Wertindex-Formel Pn pit qit . i=1 pi0 qi0 W0t = Pni=1 (4.34) Beispiel 4.11 (Energiepreisentwicklung (Fortsetzung Beispiel 4.7)). Gemäß Tabelle 4.7 und Tabelle 4.6 ergibt sich für den Wertindex 0, 30 · 84.000 + 0, 42 · 24.000 + 0, 06 · 420.000 0, 12 · 70.000 + 0, 28 · 10.000 + 0, 08 · 280.000 60.480 = 1, 8 . = 33.600 W0t = (4.35) Anwendungen Wenn es eine ökonomische Zeitreihe (das heißt eine Zeitreihe mit ökonomischen Werten) Ytn gibt, dann ist dies eine Zeitreihe mit nominalen Werten. Wenn ein geeigneter Preisindex P0t vorhanden ist, dann kann durch die Division Ytr = Ytn /P0t auf den realen Wert im Bezug zum Basisjahr 0 gerechnet werden. Dies ist ein Deflationierung. Beispiel 4.12 (reale Einkommensentwicklung). Das Statistische Bundesamt veröffentlicht Werte zur (nominalen) Einkommensenticklung privater Haushalte. Mit dem Verbraucherpreisindex (VPI) können die Werte auf reale Einkommenswerte deflationiert werden, so dass eine reale Einkommensentwicklung dargestellt wird (siehe Tabelle 4.8). Jahr Ytn [Mrd.e] V P I2005,t 2005 1463,7 100,0 1493,3 101,6 2006 2007 1517,1 103,9 2008 1558,1 106,6 1560,6 107,0 2009 Ytr [Mrd.e] 1463,7 1469,8 1460,2 1461,6 1458,5 Tabelle 4.8.: Verfügbares Einkommen private Haushalte Version 5.1 - 013 83 4.4. Aufgaben 4.4. Aufgaben Aufgabe 4.1. Berechnen Sie für die folgende Zeitreihe die gleitende Durchschnitte 3. Ordnung. t xt 1 5 2 7 3 3 4 8 5 10 6 7 6 11 8 13 9 10 11 12 9 14 16 12 Aufgabe 4.2. Berechnen Sie für die folgende Zeitreihe die gleitenden Durchschnitte 4. Ordnung. t xt 1 3 2 4 3 6 4 1 5 7 6 8 7 10 8 9 5 11 10 11 12 14 12 9 Aufgabe 4.3. < doppelt > Aufgabe 4.4. < doppelt > Aufgabe 4.5. Der Vorrat Bj für ein Produkt hat sich im Laufe mehrerer Tage wie folgt durch Zu- und Abgänge entwickelt (siehe Tabelle 4.9) (jeweils am Ende eines Tages wirksam!) Der Anfangsbestand betrug 16 Teile. Tag 1 3 4 5 Zugang 40 - - Abgang 10 5 8 22 6 8 9 10 - 20 7 4 12 8 Tabelle 4.9.: Bestandsveränderung Vorrat Zeichnen Sie die Entwicklung des Bestandes. Berechnen Sie den Durchschnittsbestand, die mittlere Verweildauer und die Umschlagshäufigkeit. Aufgabe 4.6. < doppelt > Aufgabe 4.7. Bestimmen Sie jeweils den gleitenden Durchschnitt 3. und 4. Ordnung für die nachfolgenden Umsatzangaben einer Firma: Jahr Umsatz 84 1997 1998 4,7 5,6 1999 2000 6,2 7,4 2001 2002 7,6 8,9 Version 5.1 - 013 Kapitel 4. Zeitreihenanalysen Sortimentsbereich Kleidung Körperpflege Sportartikel Umsatz 2000 [Mio. e] 10,0 5,5 4,5 Steigerung Umsatz 2000 - 2010 64% 100% 180% Steigerung Preis 2000 - 2010 4% 17% 41% Tabelle 4.10.: Umsatz- und Preisentwicklung Aufgabe 4.8. Ein Versandhandel führt die Sortimentbereiche Kleidung, Körperpflege und Sportartikel. Die Angaben sind in der Tabelle 4.10 dargestellt. Berechnen Sie (a) den Umsatzindex W2000,2010 , (b) den Preisindex P2000,2010 nach Laspeyres und Paasche sowie (c) den Mengenindex Q2000,2010 nach Laspeyres und Paasche. Aufgabe 4.9. Ein Unternehmen benötigt zur Herstellung seines Produkts drei Rohstoffe, welche in den Jahren 2000, 2004 und 2008 zu Preisen (pi,t ) in e/t und Mengen (qi,t ) in t beschafft, die in der nachfolgenden Tabelle hinterlegt sind. Rohstoff i 1 2 3 pi,2000 pi,2004 3,20 4,00 1,60 2,00 21,00 23,00 pi,2008 4,60 2,40 24,00 qi,2000 qi,2004 qi,2008 5 4,5 5 10 12 15 2 1,8 2,2 Berechnen Sie (a) die Preisindizes P2000,2004 und P2000,2008 nach Laspeyres und Paasche, (b) die Mengenindizes Q2000,2004 und Q2000,2008 nach Laspeyres und Paasche, (c) die Wertinidzes W2000,2004 und W2000,2008 . Version 5.1 - 013 85 Kapitel 5. Kombinatorik Die Kombinatorik bezeichnet den Zweig der Mathematik und Stochastik, in dem untersucht wird, auf welche und auf wie viele verschiedene Arten gewisse Mengen von Dingen angeordnet und zu Gruppen zusammengefasst werden können. Zuerst ein einfaches, überschaubares Beispiel. Beispiel 5.1. Auf wie viele Weisen kann man 2 Elemente aus einer Menge mit 3 Elementen auswählen? Es sei M = {1, 2, 3} eine Menge mit drei Elementen. In der Tabelle 5.1 sind die verschiedenen Möglichkeiten aufgeführt. mit Zurücklegen ohne Zurücklegen geordnet ungeordnet (1,1),(1,2),(1,3) {1,1},{1,2},{1,3} (2,1),(2,2),(2,3) {2,2},{2,3},{3,3} (3,1),(3,2),(3,3) (1,2),(1,3),(2,1) {1,2},{1,3},{2,3} (2,3),(3,1),(3,2) Tabelle 5.1.: Einführungsbeispiel Kombinatorik Zwei Sachverhalte sind für die Anzahl der Möglichkeiten von Bedeutung. • Werden die Elemente nach der Auswahl wieder zur Menge zurückgelegt, und stehen sie dadurch wieder für die Auswahl zur Verfügung? • Ist die Reihenfolge der Elemente von Bedeutung? Version 5.1 - 013 87 5.1. Permutationen Ist die Reihenfolge von Bedeutung, dann spricht man von einer geordneten Stichprobe oder Permutation, und die Ergebnisse sind Folgen von Elementen, die in runde Klammern gesetzt werden. Spielt die Reihenfolge keine Rolle, dann spricht man von einer ungeordneten Stichprobe oder Kombination, und die Ergebnisse sind Mengen von Elementen, die in Mengenklammern gesetzt werden. Die Definition von Mengen besagt, dass jedes Element in einer Menge nur einmal vorkommt. Wie man an den Beispielen sieht, tauchen dort auch Mengen auf, bei denen Elemente doppelt vorkommen. Derartige Gebilde heißen Multimengen. Auf Multimengen wird hier jedoch nicht näher eingehen. Im folgenden untersuchen wir genauer, wie viele Möglichkeiten es gibt, aus einer Menge von n (unterscheidbaren) Elementen k Elemente auszuwählen. Dabei gelten im folgenden stets n ∈ N und k ∈ N0 . 5.1. Permutationen Bei Permutationen ist die Reihenfolge der Elemente von Bedeutung, wie beispielsweise bei Kennwörtern. 5.1.1. Permutationen mit Wiederholungen Wie viele Möglichkeiten gibt es, k Elemente aus einer Menge von n Elementen auszuwählen, wenn die Elemente nach der Auswahl wieder zurückgelegt werden und die Reihenfolge von Bedeutung ist. Definition 5.1 (Permutation mit Wiederholung). Es sei M eine Menge mit n Elementen. Eine k-Permutation mit Wiederholung von M ist eine Folge (x1 , . . . , xk ) von k Elementen mit xi ∈ M für 1 ≤ i ≤ k. Mit P ∗ (n, k) wird die Anzahl der k-Permutationen mit Wiederholung bezeichnet, die aus einer n-elementigen Menge gebildet werden können. Der hochgestellte Stern (∗ ) hinter dem P drückt aus, dass Wiederholungen der Elemente möglich sind, das somit die Elemente nach der Auswahl wieder zurück gelegt werden. Für das erste Element gibt es n Möglichkeiten. Für das zweite und jedes weitere Element der Reihe gibt es jeweils auch n Möglichkeiten, da das ausgewählte Element immer wieder zurückgelegt wird. Es gibt somit nk Möglichkeiten für die Auswahl. 88 Version 5.1 - 013 Kapitel 5. Kombinatorik Satz 5.2. Die Anzahl P ∗ (n, k) der k-Permutationen mit Wiederholung über einer Menge mit n Elementen ist P ∗ (n, k) = nk (5.1) Für das Beispiel 5.1 am Anfang des Kapitels ergibt sich P ∗ (3, 2) = 32 = 9. Beispiel 5.2. Das deutsche Alphabet enthält 26 Buchstaben (ohne Umlaute). Somit kann man P ∗ (26, 4) = 264 = 456.976 Worte der Länge 4 bilden, wobei Buchstaben mehrfach vorkommen können. 5.1.2. Permutationen ohne Wiederholungen Jetzt der Fall, wenn die gewählten Elemente nicht wieder zurück gelegt werden. Definition 5.3 (Permutation ohne Wiederholung). Es sei M eine Menge mit n Elementen mit 0 ≤ k ≤ n). Eine k-Permutation ohne Wiederholung von M ist eine Folge (x1 , . . . , xk ) mit xi ∈ M mit xi 6= xj für i 6= j, mit 1 ≤ i, j ≤ k. Mit P (n, k) wird die Anzahl der k-Permutationen ohne Wiederholung bezeichnet, die aus einer n-elementigen Menge gebildet werden können. Manchmal wird statt P (n, k) auch Vkn geschrieben. Wenn die ausgewählten Elemente nicht mehr zurückgelegt werden, dann gibt es bei der ersten Auswahl n Möglichkeiten. Bei der zweiten Auswahl jedoch nur noch (n−1) Möglichkeiten der Auswahl. Bei der k-ten Auswahl dann nur noch (n−k+1) Möglichkeiten ein Element aus der Menge zu wählen. Somit gibt es n · (n − 1) · . . . · (n − k + 1) (5.2) Möglichkeiten der Auswahl. Satz 5.4. Die Anzahl P (n, k) der k-Permutationen ohne Wiederholung über einer n-elementigen Menge ist P (n, k) = k−1 Y (n − i) = i=0 n! (n − k)! Für das Beispiel 5.1 am Anfang des Kapitels ergibt sich P (3, 2) = (5.3) 3! 1! = 6 1 = 6. Ein Spezialfall sind die n-Permutationen auf einer n-elementigen Menge, das heißt die Permutationen, bei denen jedes der Elemente der Menge in der Permutation enthalten ist. Davon gibt es P (n, n) = n! Möglichkeiten. Version 5.1 - 013 89 5.2. Kombinationen Satz 5.5. Es gibt n! Möglichkeiten, eine Menge mit n Elementen anzuordnen. Beispiel 5.3. Das deutsche Alphabet enthält 26 Buchstaben (ohne Umlaute). Somit kann man P (26, 4) = 26 ∗ 25 ∗ 24 ∗ 23 = 358.800 Worte der Länge 4 bilden, wobei Buchstaben nicht mehrfach vorkommen können. Beispiel 5.4. Es gibt 10! = 3.628.800 ≈ 3, 6 · 106 verschiedene Möglichkeiten, 10stellige Zahlen zu bilden, bei denen jede der 10 Ziffern genau einmal vorkommt. Zahlen mit 10 Ziffern gibt es 1010 . Beispiel 5.5. Wie viele verschiedene Buchstabenkombinationen der Länge 4 lassen sich aus den Buchstaben ABCC gebildet werden. 4 Buchstaben lassen sich auf 4! = 24 verschiedene Arten darstellen. Der Buchstabe C kommt zwei mal vor. Da die C’s nicht unterschieden werden können, kann man diese beiden Vertauschen. Es gibt 2! Möglichkeiten für die Vertauschung der Buchstaben C. Damit gibt es nur 4!/2! = 12 Möglichkeiten der Darstellung. Diese Überlegungen weiter geführt, führt zum nachfolgenden Satz: Satz 5.6. Die Anzahl P (n; n1 , n2 , . . . , nk ) von Permutationen von n Elementen von denen jeweils n1 , n2 , . . ., nk , 1 ≤ k ≤ n, ununterscheidbar sind, so dass Pk i=1 ni = n ist, ist n! i=1 (ni !) (5.4) P (n; n1 , n2 , . . . , nk ) = Qk Für unser obiges Beispiel ergibt sich P (4; 1, 1, 2) = 4! 1!1!2! = 24 2 = 12. 5.2. Kombinationen Bei den Permutationen spielt die Reihenfolge der Elemente eine Rolle. Wenn die Reihenfolge keine Rolle spielt, dann spricht man von Kombinationen. 5.2.1. Kombination ohne Wiederholungen Wie viele Möglichkeiten gibt es, aus einer Menge von n Elementen Teilmengen von k Elementen auszuwählen. Auf die Reihenfolge der Auswahl kommt es hierbei nicht an. 90 Version 5.1 - 013 Kapitel 5. Kombinatorik Definition 5.7 (Kombination ohne Wiederholung). Es sei M eine Menge mit n Elementen. Eine k-Kombination ohne Wiederholung über M ist eine Teilmenge von M mit k Elementen ohne Wiederholung. Mit K(n, k) wird die Anzahl der k-Kombination ohne Wiederholung über M bezeichnet Manchmal schreibt man statt K(n, k) auch Ckn . Aus den Überlegungen der Permutationen kann die Anzahl der Kombinationen ermittelt werden. Es gibt P (n, k) geordnete k-Permutationen über einer nelementigen Menge. Es gibt P (k, k) = k! Möglichkeiten, die k gezogenen Elemente anzuordnen. Jede dieser Anordnungen ist für die Kombination gleichwertig. (Nebenbemerkung: Diese bilden eine Äquivalenzrelation!). Damit gilt P (n, k)/P (k, k) = K(n, k) Satz 5.8. Die Anzahl K(n, k) der Kombinationen ohne Wiederholung über einer Menge mit n Elementen ist ! n n! = K(n, k) = k!(n − k)! k Für das Beispiel am Anfang des Kapitels ergibt sich K(3, 2) = (5.5) 3! 2!1! = 6 2 = 3. Das Symbol nk (ausgesprochen n über k ist eine Vereinfachung der Schreibweise und heißt auch Binominalkoeffizient, was später noch beleuchtet wird. Beispiel 5.6. Beim Lotto „6 aus 49“ spielt die Reihenfolge der gezogenen Kugeln keine Rolle. Somit ist es eine Kombination. Es gibt keine Wiederholungen, da die Kugeln nicht wieder zurückgelegt werden. Es gibt K(49, 6) = 49! = 13.983.816 6!43! (5.6) verschiedene Möglichkeiten 6 der 49 Kugeln zu ziehen. 5.2.2. Kombination mit Wiederholungen Wenn Wiederholungen zulässig sind, dann wird es etwas komplizierter. Version 5.1 - 013 91 5.3. Binomialkoeffizienten Definition 5.9 (Kombination mit Wiederholung). Es sei M eine Menge mit n Elementen und für k gilt: 0 ≤ k ≤ n. Eine k-Kombination mit Wiederholung über M ist eine Multimenge von M mit k Elementen. Mit K ∗ (n, k) wird die Anzahl der k-Kombination mit Wiederholung über M bezeichnet Um die Anzahl K ∗ (n, k) der k-Kombinationen mit Wiederholung über einer nelementigen Menge zu bestimmen, werden bereits am Anfang die (k −1) Elemente, die im Laufe des Prozesses zurück gelegt werden, zur Menge hinzugefügt. Somit ergibt sich eine k-Kombination ohne Zurücklegen auf einer (n + k − 1)-elementigen Menge. Diese Anzahl der Kombinationen wurde bereits berechnet. Satz 5.10. Die Anzahl K ∗ (n, k) von k-Kombinationen mit Wiederholung über einer n-elementigen Menge ist ! n+k−1 (n + k − 1)! = K (n, k) = K(n + k − 1, k) = k!(n − 1)! k ∗ Für das Beispiel 5.1 am Anfang des Kapitels ergibt sich K ∗ (3, 2) = 4! 2!2! (5.7) = 24 4 = 6. Beispiel 5.7. Wie viele Kombinationen kann man mit 4 Würfeln würfeln? Jeder Würfel hat die Zahlen 1 bis 6. Statt einmal mit 4 Würfeln zu Würfeln kann man auch mit einem Würfel 4 mal hinter einander würfeln. Es ist somit eine 4Kombination mit Wiederholung über einer 6-elementigen Menge. Die Anzahl ist 9! = 4!5! = 126. somit K ∗ (6, 4) = (6+4−1)! 4!(6−1)! 5.2.3. Zusammenfassung Permutationen und Kombinationen Die Zusammenfassung für Permutationen und Kombinationen gibt die Tabelle 5.2. 5.3. Binomialkoeffizienten In diesem Abschnitt werden einige Eigenschaften und Ergebnisse für die Binomialkoeffizienten zusammengefasst. Die Definition des Binomialkoeffizienten oder genauer eine Definition der Binomialkoeffizienten lautet: 92 Version 5.1 - 013 Kapitel 5. Kombinatorik mit Zurücklegen Permutation geordnet Kombination ungeordnet P ∗ (n, k) K ∗ (n, k) ! n+k−1 (n+k−1)! = k!(n−1)! = k = nk ohne Zurücklegen P (n, k) = n! (n−k)! K(n, k) n = k! k ! = n! k!(n−k)! n = k ! Tabelle 5.2.: Zusammenfassung Permutationen und Kombinationen ! n n! = k! · (n − k)! k (5.8) Wenn dieser Ausdruck auf der rechten Seite betrachtet wird, und einige Zahlen gekürzt werden, dann ergibt sich: ! n · (n − 1) · . . . · (n − k + 1) n = 1 · 2 · ... · k k (5.9) An dieser Form der Definition kann man erkennen, dass die Binomialkoeffizienten stets ganze Zahlen sind! Einige grundlegende Eigenschaften für die Binomialkoeffizienten. Es gelten: ! ! n n = =1 0 n ! ! n n = =n 1 n−1 ! n n = n−k k Version 5.1 - 013 (5.10) (5.11) ! (5.12) 93 5.3. Binomialkoeffizienten Ist k 6= 0 und k 6= n (n ∈ N und k ∈ N0 mit k < n), dann gilt: ! ! ! n n−1 n−1 = + k k k−1 (5.13) womit man eine rekursive Formel zur Berechnung der Binomialkoeffizienten hat. Dies führt zum so genannten Pascalschen Dreieck1 . Für die maschinelle Berechnung ist diese Formel jedoch nicht ideal! Hier ist nun der Beginn des Pascalschen Dreieck dargestellt: 1 1 1 1 1 1 1 2 1 3 4 5 6 1 3 6 4 10 15 1 1 10 20 5 15 1 6 1 Die Rekursionsformel kann schnell und direkt nachgewiesen werden: Satz 5.11. Ist k 6= 0 und k 6= n (n ∈ N und k ∈ N0 mit k < n), dann gilt: ! ! ! n n−1 n−1 = + k k k−1 (5.14) Beweis ! ! (n − 1)! (n − 1)! n−1 n−1 + + = k!(n − k − 1)! (k − 1)!(n − k)! k k−1 (n − 1)! 1 1 = ·( + ) (k − 1)!(n − k − 1)! k n − k (n − 1)! n = ·( ) (k − 1)!(n − k − 1)! k · (n − k) ! n! n = = k!(n − k)! k 1 (5.15) Blaise Pascal, französischer Philosoph, Mathematiker und Physiker, 1623 - 1662 94 Version 5.1 - 013 Kapitel 5. Kombinatorik Für das Produkt (a + b)n ergibt sich (a + b)n = n X ! n n−k k a b . k k=0 (5.16) Dies ist die verallgemeinerte binomische Formel. Daher haben die Koeffizienten auch ihren Namen. Daraus wiederum ergeben sich: n (1 + x) = n X ! n k x k k=0 (5.17) und 2n = n X ! n k k=0 (5.18) und n X n (−1) · 0= k k=0 ! k (5.19) Die beiden letzten Eigenschaften können am obigen Pascalschen Dreieck für kleine n einfach nachgerechnet werden. Weiter wird auf die Binomialkoeffizienten nicht eingegangen. 5.4. Aufgaben Aufgabe 5.1. Bestimmen Sie alle Möglichkeiten die Elemente einer Menge mit n = 1, n = 2, n = 3 und n = 4 anzuordnen. Aufgabe 5.2. Wie viele verschiedene Buchstabenkombinationen der Länge 9 lassen sich mit den Buchstaben des Wortes STATISTIK bilden? Aufgabe 5.3. Wie viele verschiedene Buchstabenkombinationen der Länge 11 lassen sich aus den Buchstaben des Wortes MISSISSIPPI bilden? Aufgabe 5.4. Ein Passwort besteht aus zwei (von 26 möglichen) Buchstaben gefolgt von vier Ziffern, wobei Ziffern, aber nicht Buchstaben mehrfach auftreten dürfen. Wie viele verschiedene Passwörter sind möglich? Aufgabe 5.5. Bei 5 Personen, wie viele Möglichkeiten gibt es, dass sich eine Mehrheit (aus 5, 4 oder 3 Personen) bildet? Version 5.1 - 013 95 5.4. Aufgaben Aufgabe 5.6. Wie viele 8-stellige Worte können mit den Elementen der Menge A = {0, 1} gebildet werden. Aufgabe 5.7. < doppelt > Aufgabe 5.8. < doppelt > Aufgabe 5.9. Wie viele Zahlenkombinationen kann man mit 1, 2, 3, 4, 5 und 6 Würfeln würfeln? Aufgabe 5.10. Ein Passwort ist 7 Zeichen lang. Es besteht aus Buchstaben (26 mögliche Buchstaben) und Ziffern. In den ersten drei Zeichen dürfen nur Buchstaben stehen, die sich nicht wiederholen. Die restlichen 4 Stellen sind beliebige Buchstaben oder Ziffern, wobei auch die Buchstaben aus den ersten 3 Stellen wiederholt werden dürfen. Wie viele verschiedene Passwörter sind möglich? Aufgabe 5.11. Wie groß ist die Wahrscheinlichkeit beim Spiel "6 aus 45"5 Richtige zu haben? Aufgabe 5.12. Bestimmen Sie die Wahrscheinlichkeiten, dass Sie n-mal hintereinander die selbe Zahl würfeln. Aufgabe 5.13. In einer Urne befinden sich 12 blaue und 8 gelbe Kugeln. Es werden nacheinander ohne Zurückziehen zwei Kugeln gezogen. Wie groß ist die Wahrscheinlichkeit, beim dritten Zug eine gelbe Kugel zu ziehen, unter der Bedingung, dass (a) beim ersten Zug eine blaue Kugel gezogen wird? (b) beim ersten Zug eine gelbe Kugel gezogen wird? 96 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung Die Wahrscheinlichkeitsrechnung bringt den Zufall und zufällige Ereignisse mit in die Betrachtung. Die Wahrscheinlichkeitsrechnung beschäftigt sich mit zufälligen Ereignissen. Ihre Ergebnisse werden in vielen Bereichen außerhalb der Mathematik abgewendet. Prognose für eine Wahl, Qualitätssicherung und Bestimmung von Schätzungen sind nur einige dieser Themen. 6.1. Zufallsexperiment und Ereignis Definition 6.1 (Zufallsexperiment, Elementarereignis, Ergebnisraum). Ein Zufallsexperiment ist ein beliebig oft und gleichartig wiederholbarer Vorgang mit mindestens zwei möglichen Ergebnissen, bei dem im voraus nicht eindeutig bestimmbar ist, welches Ergebnis eintreten wird. Ein mögliches Ergebnis eines Zufallsexperiments heißt Ereignis. Die einzelnen, nicht mehr zerlegbaren und sich gegenseitig ausschließenden Ereignisse eines Zufallsexperiments heißen Elementarereignis. Sie werden mit ω1 , ω2 , . . . bezeichnet. Die Menge Ω aller zu einem Zufallsexperiment gehörenden Elementarereignisse heißt Ergebnisraum: Ω = {ω1 , ω2 , . . . , ωn } (6.1) Beispiel 6.1. Der Wurf einer Münze, mit den Seiten Zahl und Wappen, ist ein Zufallsexperiment. Es gibt die zwei Elementarereignisse ω1 = Zahl und ω2 = Wappen. Beispiel 6.2. Das Würfeln ist ein Zufallsexperiment. Der Ergebnisraum sind die 6 verschiedenen Möglichkeiten für das Ergebnis: Ω = {1, 2, 3, 4, 5, 6}. Version 5.1 - 013 97 6.1. Zufallsexperiment und Ereignis Definition 6.2 (zusammengesetze Ereignisse, Durchschnitt). Es seien A und B zwei Ereignisse in einem Ergebnisraum Ω. Unter dem zusammengesetzten Ereignis A ∪ B oder A or B der Ereignisse A und B versteht man das Ereignis, das dann eintritt, wenn wenigstens eine der beiden Ereignisse A und B eintritt. Unter dem Durchschnitt A ∩ B oder A and B der Ereignisse A und B versteht man das Ergebnis, das Eintritt, wenn sowohl A als auch B eintritt, wenn also A und B gemeinsam eintreten. Beispiel 6.3. Beim Würfeln sei A das Ereignis, dass eine gerade Zahl gewürfelt wird. Somit ist A = {2, 4, 6}. B sei das Ereignis, dass die gewürfelte Zahl kleiner 4 ist. Somit ist B = {1, 2, 3}. Damit ist das zusammengesetzte Ereignis A ∪ B das Ereignis, wenn der Würfel eine gerade Zahl oder ein Zahl kleiner 4 anzeigt: A ∪ B = {1, 2, 3, 4, 6}. Der Durchschnitt der Ereignisse ist das Ereignis, wenn die gewürfelte Zahl gerade und kleiner 4 ist: A ∩ B = {2}. Definition 6.3 (Komplementärereignis, sicheres Ereignis, unmögliches Ereignis, disjunkte Ereignisse). Es sei A ein Ereignis. Das Ereignis, das genau dann eintritt, wenn A nicht eintritt, heißt das zu A komplementäre Ereignis oder Komplementärereignis von A und wird mit Ā bezeichnet. Ein Ereignis, das immer eintritt, heißt sicheres Ereignis und wird mit Ω bezeichnet. Ein Ereignis, das nie eintritt, heißt unmögliches Ereignis und wird mit ∅ bezeichnet. Gilt für zwei Ereignisse A und B, dass deren Durchschnitt das unmögliche Ereignis ist (A ∩ B = ∅), so heißen A und B disjunkte Ereignisse Beispiel 6.4. Beim Würfeln seien A das Ereignis, dass eine gerade Zahl gewürfelt wird und B das Ereignis, dass eine ungerade Zahl gewürfelt wird. Die beiden Ereignisse sind komplementär zueinander. Es gilt somit Ā = B und B̄ = A. Das zusammengesetzte Ereignis A ∪ B ist das sichere Ereignis Ω, denn die gewürfelte Zahl ist entweder gerade oder ungerade. Der Durchschnitt A ∩ B der beiden Ereignisse A und B ist das unmögliche Ereignis, da das Ergebnis beim Würfel nicht gleichzeitig gerade und ungerade sein kann. Somit sind A und B auch disjunkte Ereignisse. Nach diesen grundlegenden Definitionen wird nun der Begriff der Wahrscheinlichkeit definiert. Es gibt dabei viele verschiedenen Varianten für die Definition. Die Definition geht auf Laplace 1 zurück. Definition 6.4 (Wahrscheinlichkeit). Gegeben seien ein Ereignis A eines Zufallsexperiments, die Anzahl der für das Eintreffen von A günstigen Fälle (beziehungsweise der zu A gehörenden Elementarereignisse) und die Anzahl aller möglichen 1 Pierre Simon Laplace (1749-1827), französischer Naturwissenschaftler 98 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung Fälle. Für die Wahrscheinlichkeit P (A) für das Eintreten des Ereignissen A gilt dann: P (A) = Anzahl der f ür das Ereignis A günstigen F älle Anzahl aller möglichen F älle (6.2) Beispiel 6.5. Die Wahrscheinlichkeit, dass beim Werfen einer Münze die Seite Zahl kommt ist 12 oder 50% oder 0, 50. Beispiel 6.6. Beim Würfeln ergeben sich folgende Wahrscheinlichkeiten: P(gerade) = 12 , P({1}) = 61 , P(ungerade und kleiner 4) = 13 . Die Erkenntnisse aus den Beispielen wird nun allgemeiner formuliert und die Wahrscheinlichkeit genauer definiert. Dies wurde erstmals vom Kolmogorov 2 formuliert. Es seien Ω ein Ereignisraum und Z(Ω) das Ereignissystem, das bedeutet, die Menge der möglichen Ereignisse im Ereignisraum Z(Ω) = {A | A ⊆ Ω}. (6.3) Ein Wahrscheinlichkeitsmaß ist eine Abbildung P : Z(Ω) → R (6.4) mit den nachfolgenden Eigenschaften: • Axiom 1 (Nicht-Negativität) Die Wahrscheinlichkeit ist nicht-negativ: ∀A ∈ Z(Ω) : P (A) ≥ 0 (6.5) • Axiom 2 (Normierung): Die Wahrscheinlichkeit ist normiert: P (Ω) = 1 (6.6) • Axiom 3 (Additivität) Für zwei disjunkte Ereignisse A und B ist die Wahrscheinlichkeit additiv: ∀A, B ∈ Z(Ω), A ∩ B = ∅ : P (A ∪ B) = P (A) + P (B) (6.7) Aus diesen Axiomen ergeben sich direkt einige Konsequenzen, die auf Basis der Axiome bewiesen werden können. 2 Andrej Nikolajevich Kolmogorov (1903 - 1987), russischer Mathematiker Version 5.1 - 013 99 6.1. Zufallsexperiment und Ereignis • Satz zur Wahrscheinlichkeit Komplementärereignis ∀A ∈ Z(Ω) : P (A) = 1 − P (A) (6.8) • Folgerung Wahrscheinlichkeit der leeren Menge P (∅) = 0 (6.9) • Satz zur Wahrscheinlichkeit der Differenz ∀A, B ∈ Z(Ω) : P (A\B) = P (A) − P (A ∩ B) (6.10) • Additionssatz für zwei beliebige Ereignisse ∀A, B ∈ Z(Ω) : P (A ∪ B) = P (A) + P (B) − P (A ∩ B) (6.11) • Satz über die Wahrscheinlichkeit von Teilereignissen ∀A, B ∈ Z(Ω) : A ⊆ B ⇒ P (A) ≤ P (B) (6.12) • Additionsgesetz für disjunkte Ereignisse : ∀Ai ∈ Z(Ω), paarweise disjunkt : P ( n [ i=1 Ai ) = n X P (Ai ) (6.13) i=1 Definition 6.5 (Wahrscheinlichkeitsraum). Eine Menge Ω mit einer Funktion P mit den obigen Regeln heißt ein Wahrscheinlichkeitsraum. Bei manchen Problemen der Wahrscheinlichkeitsrechnung betrachtet man das Eintreten von Ereignissen in Abhängigkeit von anderen Ereignissen. Beispiel 6.7. Aus einer Urne mit 5 roten und 3 grünen Kugeln werden nacheinander zwei Kugeln zufällig entnommen. R1, R2, G1 und G2 bezeichnen die Ereignisse, dass Rot beziehungsweise Grün beim ersten beziehungsweise zweiten Zug erscheint. Nach der Definition der Wahrscheinlichkeit ergibt sich P (R1) = 58 und P (G1) = 38 . Nach dem ersten Zug befinden sich noch 7 Kugeln in der Urne. Die Wahrscheinlichkeit beim zweiten Zug eine grüne Kugel zu ziehen, hängt nun von der Farbe der zuerst gezogenen Kugel ab. Die Wahrscheinlichkeit für G2 unter der Bedingung R1 ergibt sich zu P (G2|R1) = 73 . Die Wahrscheinlichkeit für G2 unter der Bedingung G1 ergibt sich zu P (G2|G1) = 27 . 100 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung Definition 6.6 (bedingte Wahrscheinlichkeit). Die bedingte Wahrscheinlichkeit (die Wahrscheinlichkeit von B unter der Bedingung A) P (B|A) ist die Wahrscheinlichkeit für das Eintreten des Ereignisses B unter der Voraussetzung, dass das Ereignis A bereits eingetreten ist. Es gilt: P (B|A) = P (A ∩ B) für P (A) > 0 P (A) (6.14) Sie heißt auch konditionale Wahrscheinlichkeit Zwei Ereignisse A und B sind voneinander unabhängig, wenn die Wahrscheinlichkeit für das Auftreten von A nicht vom Ereignis B abhängt. Entsprechend sind die Ereignisse abhängig, wenn die Wahrscheinlichkeit für das Auftreten des Ereignisses B davon abhängt, ob das Ereignis A eingetreten ist oder nicht. Definition 6.7 (stochastisch unabhängig, stochastisch abhängig). Die Ereignisse A und B sind genau dann stochastisch unabhängig , wenn gilt P (B|A) = P (B|Ā) oder P (A|B) = P (A|B̄). Gilt jedoch P (B|A) 6= P (B|Ā) oder P (A|B) 6= P (A|B̄), so sind die Ereignisse stochastisch abhängig . Beispiel 6.8. In einer Urne befinden sich 20 rote und 30 grüne Kugeln. 5 rote und 10 grüne Kugel sind mit einer 1 beschriftet. Mit R, G beziehungsweise E werden die Ereignisse rote Kugel, grüne Kugel beziehungsweise Kugel mit 1 bezeichnet. Es ergibt sich die in der Tabelle 6.1 aufgezeigte Verteilung: E Ē R 5 15 20 G 10 20 30 gesamt 15 35 50 Tabelle 6.1.: Beispiel 6.8 Nach der Definition der bedingten Wahrscheinlichkeit gilt: P (E|R) = 5/50 20/50 1 4 P (E∩R̄) P (R̄) 10/50 30/50 P (E∩R) P (R) = 1 . 3 = und P (E|R̄) = = = Daraus ergibt sich, dass die beiden Ereignisse E und R stochastisch abhängig sind. In der Tabelle 6.1 im Beispiel 6.8 sind die Absolutzahlen angegeben. Wird durch die Gesamtanzahl dividiert, dann erhält man die Wahrscheinlichkeiten (siehe Tabelle 6.2). Version 5.1 - 013 101 6.1. Zufallsexperiment und Ereignis A Ā B P (A ∩ B) P (A ∩ B) P (B) B P (A ∩ B) P (Ā ∩ B̄) P (B) P (A) P (A) 1 Tabelle 6.2.: Wahrscheinlichkeit bei zwei Ereignissen M M̄ S 0,6 0,1 0,7 S̄ 0,2 0,1 0,8 0,2 1,0 0,3 Tabelle 6.3.: Beispiel 6.9 Beispiel 6.9. Ein Student besteht die Klausur in Statistik (Ereignis S) mit der Wahrscheinlichkeit 0,7 und in Finanzmathematik (Ereignis M) mit der Wahrscheinlichkeit 0,8. Die Wahrscheinlichkeit für das Bestehen beiden Klausuren beträgt 0,6. Es gelten P (S|M ) = 0, 6 P (S ∩ M ) = = 0, 75 P (M ) 0, 8 (6.15) P (S|M̄ ) = P (S ∩ M ) 0, 1 = = 0, 5. 0, 2 P (M ) (6.16) und Da P (S|M ) 6= P (S|M ) gilt, sind S und M abhängig. Die Wahrscheinlichkeit, wenigstens eine Klausur zu bestehen, ist P (S ∪ M ) = P (S) + P (M ) − P (S ∩ M ) = 0, 7 + 0, 8 − 0, 6 = 0, 9 (6.17) Aus der Definition für die bedingte Wahrscheinlichkeit ergibt sich: Satz 6.8. Für zwei Ereignisse A und B (mit P (A) > 0 und P (B) > 0) gelten P (A ∩ B) = P (A) · P (B|A) = P (B) · P (A|B). (6.18) Insbesondere gilt für zwei unabhängige Ereignisse P (A ∩ B) = P (A) · P (B). 102 (6.19) Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung 6.2. Zusammen gesetzte Aufgaben Im folgenden werden zusammen gesetzte Aufgaben betrachtet, bei denen sowohl Durchschnitt und Vereinigung von Ereignissen vorkommen. Für die Visualisierung der Beispiele werden Komponenten verwendet, die eine bestimmte Verfügbarkeit haben. Diese Komponenten werden auf verschiedene Art und Weise zu einem Aggregat zusammen gesetzt, wobei die Komponenten sowohl hintereinander oder parallel sein können. Betrachten wir nun ein Aggregat (A), welches aus 2 Komponenten (K1 und K2 ) besteht, die hintereinander geschaltet sind (siehe Abbildung 6.1). A K1 K2 Abbildung 6.1.: Zwei Komponenten hintereinander Die beiden Komponenten K1 und K2 haben die Wahrscheinlichkeiten P (Ki ) = pi (i = 1,2), dass die Komponente funktioniert, wobei die Funktionalität einer Komponente nicht von der Funktionalität der anderen Komponente abhängt. Das bedeutet, dass die Wahrscheinlichkeiten unabhängig voneinander sind. Wie sieht nun die Wahrscheinlichkeit p = P (A) aus, dass das Aggregat funktioniert. Die Hintereinanderschaltung bedeutet, dass das Aggregat nur funktioniert, wenn beide Komponenten funktionieren. Es gilt p = P (A) = P (K1 and K2 ) = P (K1 ) · P (K2 ) = p1 · p2 (6.20) Beispiel 6.10. Ein Aggregat A besteht aus zwei Komponenten K1 und K2 mit den jeweiligen Wahrscheinlichkeiten P (Ki ) = pi = 0, 9 (i = 1,2), dass die Komponenten funktioniert. Das Aggregat funktioniert nur, wenn beide Komponenten funktionieren (K1 and K2 ). Damit gilt p = P (A) = P (K1 ) · P (K2 ) = p1 · p2 = 0, 9 · 0, 9 = 0, 81 . (6.21) Das bedeutet, dass die Wahrscheinlichkeit für das Funktionieren des Aggregates bei 0,81 ist. Beispiel 6.11. Eine Nachricht muss von einem Ausgangspunkt A zu einem Endpunkt E transportiert werden. Die gesamte Strecke ist durch einen Zwischenpunkt Version 5.1 - 013 103 6.2. Zusammen gesetzte Aufgaben Z in zwei Teilstrecken AZ und ZE geteilt. Die Wahrscheinlichkeit dafür, dass eine Nachricht, die in A aufgegeben wird in Z ankommt beträgt P (AZ) = 0, 7. Davon unabhängig ist die Wahrscheinlichkeit, dass eine Nachricht, die in Z aufgegeben wird in E ankommt, diese Wahrscheinlichkeit beträgt P (ZE) = 0, 6. Damit ergibt sich für die Wahrscheinlichkeit, dass eine Nachricht E erreicht, wenn sie in A los gesendet wird zu P (AE) = P (AZ and ZE) = P (AZ) · P (ZE) = 0, 7 · 0, 6 = 0, 42 (6.22) Zuerst wird ein Aggregat A betrachtet, das aus n unabhängigen Komponenten K1 , K2 , . . ., Kn , die hinter einander geschaltet sind (siehe Abbildung 6.2) betrachtet. Das Aggregat funktioniert also nur, wenn alle Komponenten funktionieren. A K1 K2 Kn Abbildung 6.2.: Mehrere Komponenten hintereinander Es seien P (Ki ) = pi für (i = 1, 2, . . . , n) die Wahrscheinlichkeiten, dass die Komponente Ki funktioniert. Es gilt dann p = P (A) = P (K1 and K2 and . . . and Kn ) = P (K1 ) · P (K2 ) · . . . · P (Kn ) = p1 · p2 · . . . · pn (6.23) Satz 6.9. Es seien Ki (i = 1, 2, . . . , n) unabhängige Ereignisse, die hintereinander geschaltet sind (durch and zusammengesetzt). Die Wahrscheinlichkeiten seien P (Ki ) = pi (i = 1, 2, . . . , n) für die Ereignisse Ki , dann gilt P (K1 and K2 and . . . and Kn ) = n Y pi (6.24) i=1 Nun wird die Situation betrachtet, dass die Komponenten nicht hintereinander, sondern parallel geschaltet sind. Dies bedeutet, dass das Aggregat, das aus den Komponenten zusammen gesetzt ist, funktioniert, wenn mindestens eine Komponente funktioniert. Zuerst wird ein Aggregat (A) betrachtet, welches aus 2 Komponenten (K1 und K2 ) besteht, die parallel geschaltet sind (siehe Abbildung 6.3). 104 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung A K1 K2 Abbildung 6.3.: Zwei Komponenten parallel Die beiden Komponenten K1 und K2 haben die Wahrscheinlichkeiten P (Ki ) = pi (i = 1,2), dass die Komponente funktioniert, wobei die Funktionalität einer Komponente nicht von der Funktionalität der anderen Komponente abhängt. Das bedeutet, dass die Wahrscheinlichkeiten unabhängig voneinander sind. Wie sieht nun die Wahrscheinlichkeit p = P (A) aus, dass das Aggregat funktioniert. Die Parallelschaltung bedeutet, dass das Aggregat funktioniert, wenn mindestens eine Komponenten funktioniert. Es gilt, mit Hilfe des Additionsgesetzes p = P (A) = P (K1 or K2 ) = P (K1 ) + P (K2 ) − P (K1 and K2 ) = P (K1 ) + P (K2 ) − P (K1 ) · P (K2 ) = p1 + p2 − p1 · p2 (6.25) Nun wird ein Aggregat (A) betrachtet, welches aus 3 Komponenten (K1 , K2 und K3 ) besteht, die parallel geschaltet sind (siehe Abbildung 6.4). Wenn mit dem Additionsgesetz gearbeitet wird, was durchaus machbar ist, so wachsen die Terme und die Umformungen. Auch wenn man noch mehr Komponenten berücksichtigt, wächst dieser Aufwand. Wechseln wir den Blickwinkel. Das Aggregat funktioniert, wenn eine der Komponenten funktioniert, das Aggregat funktioniert nicht, wenn alle Komponenten nicht funktionieren. Damit haben wir eine and-Verbindung. Wichtig ist dabei, dass für ein Ereignis A gilt: P (A) = 1 − P (A). Wenden wir diesen neuen Blickwinkel zuerst nochmal bei 2 Komponenten an, um zu sehen, ob das Ergebnis richtig heraus kommt. Version 5.1 - 013 105 6.2. Zusammen gesetzte Aufgaben A K1 K2 K3 Abbildung 6.4.: Drei Komponenten parallel p = P (A) = P (K1 or K2 ) (6.26) = 1 − P (K1 or K2 ) = 1 − P (K1 and K2 ) = 1 − P (K1 ) · P (K2 ) = 1 − (1 − P (K1 )) · (1 − P (K2 )) = 1 − (1 − p1 ) · (1 − p2 ) = p1 + p2 − p1 · p 2 Jetzt für 3 Komponenten. p = P (A) = P (K1 or K2 or K3 ) (6.27) = 1 − P (K1 or K2 or K3 ) = 1 − P (K1 and K2 and K3 ) = 1 − P (K1 ) · P (K2 ) · P (K3 )) = 1 − (1 − P (K1 )) · (1 − P (K2 )) · (1 − P (K3 )) = 1 − (1 − p1 ) · (1 − p2 ) · (1 − p3 ) = p1 + p2 + p3 − p 1 · p2 − p1 · p3 − p2 · p3 + p1 · p2 · p 3 Jetzt werden gleich n Komponenten (Ki ) mit den Wahrscheinlichkeiten P (Ki ) = pi (i = 1, 2, . . . , n) betrachtet, die parallel geschaltet sind (siehe Abbildung 6.5). 106 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung A K1 K2 .. . Kn Abbildung 6.5.: Mehrere Komponenten parallel p = P (A) = P (K1 or K2 or . . . or Kn ) (6.28) = 1 − P (K1 or K2 or . . . or Kn ) = 1 − P (K1 and K2 and . . . and Kn ) = 1 − P (K1 ) · P (K2 ) · . . . · P (Kn ) = 1 − (1 − P (K1 )) · (1 − P (K2 )) · . . . · (1 − P (Kn )) = 1 − (1 − p1 ) · (1 − p2 ) · . . . · (1 − pn )) Damit wurde allgemein gezeigt: Satz 6.10. Es seien Ki (i = 1, 2, . . . , n) unabhängige Ereignisse, die durch or zusammengesetzt werden (parallel geschaltet). Die Wahrscheinlichkeiten seien P (Ki ) = pi (i = 1, 2, . . . , n) für die Ereignisse Ki , dann gilt P (K1 or K2 or . . . or Kn ) = 1 − n Y (1 − pi ) (6.29) i=1 Beispiel 6.12. Gegeben sei ein Gerät (G), das aus zwei (technischen) Komponenten A und B besteht. Jede dieser Komponenten hat jeweils die Wahrscheinlichkeit von 0,9, dass sie nach einem Jahr Betrieb noch aktiv sind. Die beiden Ereignisse sind voneinander unabhängig. Wie hoch ist die Wahrscheinlichkeit, dass das Gerät nach einem Jahr noch aktiv ist, wenn die beiden Komponenten parallel geschaltet Version 5.1 - 013 107 6.2. Zusammen gesetzte Aufgaben sind (eines der Komponenten muss noch aktiv sein, damit das Gerät aktiv ist) oder hintereinander geschaltet sind (beide Komponenten müssen noch aktiv sein). (parallel): P (G) = P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = P (A) + P (B) − P (A) · P (B) = 0, 9 + 0, 9 − 0, 81 = 0, 99 (hintereinander): P (G) = P (A ∩ B) = P (A) · P (B) = 0, 9 · 0, 9 = 0, 81 Beispiel 6.13. Jetzt wird ein Aggregat (A) betrachtet, welches aus 2 Komponenten (K1 und K2 ) besteht, die parallel geschaltet sind (siehe hierzu wieder Abbildung 6.3). Die Komponente K1 hat die Verfügbarkeit (Wahrscheinlichkeit) p1 = 0, 8. Welche Verfügbarkeit p2 muss die Komponente K2 haben, damit das Aggregat die Verfügbarkeit p = 0, 9 hat? Die Komponenten sind parallel geschaltet, also gilt p = 1 − (1 − p1 ) · (1 − p2 ) (6.30) mit den konkreten Zahlen ergibt sich 0, 9 = 1 − (1 − 0, 8) · (1 − p2 ) (6.31) Aufgelöst nach der Unbekannten p2 ergibt sich p2 = 0, 5. Beispiel 6.14. Nun wird ein Aggregat (A) betrachtet, welches aus 3 Komponenten (K1 , K2 und K3 ) besteht, folgendermaßen geschaltet sind, siehe Abbildung 6.6. K1 K2 K3 Abbildung 6.6.: Aggregat aus drei Komponenten Die Komponente K1 hat die Verfügbarkeit (Wahrscheinlichkeit) p1 = 0, 8, die Komponente K2 die Verfügbarkeit p2 = 0, 7. Welche Verfügbarkeit p3 muss die Komponente K3 haben, damit das Aggregat die Verfügbarkeit p = 0, 9 hat? Damit das Aggregat die Verfügbarkeit p = 0, 9 hat, muss - nach dem vorherigen Beispiel - die Verfügbarkeit des unteren Teils gleich 0, 5 (P (K2 K3 ) = 0, 5) sein. Damit gilt 0, 5 = P (K2 K3 ) = P (K2 and K3 ) = P (K2 ) · P (K3 ) = 0, 7 · p3 (6.32) Aufgelöst nach p3 ergibt p3 = 0, 7143. 108 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung Beispiel 6.15. Es soll die Wahrscheinlichkeit berechnet werden, dass ein Radio mit Mittelwellen-, Kurzwellen- und UKW-Empfang nach einem Jahr Dauerbetrieb noch auf wenigstens einem Wellenbereich funktionsfähig ist. Es wird angenommen, dass alle Bauteile unabhängig voneinander sind. Die Abbildung 6.7 zeigt den Bauplan mit den einzelnen Komponenten: TRA - Netztrafo, VOR - Vorstufe, MWE Mittelwerte Empfang, KWE - Kurzwelle Empfang, UKV - UKW Vorstufe, UKH UKW Hauptstufe, END - Endstufe, SP1 = Speaker 1, SP2 = Speaker 2. MWE VOR KWE TRA SP2 END UKV UKH SP1 Abbildung 6.7.: Bauplan Radio Die Wahrscheinlichkeit dass die einzelne Komponente nach einem Jahr Dauerbetrieb nach aktiv sind, sind in der Tabelle 6.4 aufgeführt. P (T RA) = 0, 8 P (V OR) = 0, 75 P (M W E) = 0, 8 P (KW E) = 0, 6 P (U KV ) = 0, 9 P (U KH) = 0, 8 P (EN D) = 0, 9 P (SP 1) = 0, 9 P (SP 2) = 0, 9 Tabelle 6.4.: Verfügbarkeiten Komponenten vom Radio Die zusammengesetzten Komponenten sind der MW-KW-Teil (mw-kw-teil), bestehend aus dem MW- und dem KW-Empfang, dem AM-Teil (am-teil), bestehend aus der Vorstufe und dem MW-KW-Teil, dem FM-Teil (fm-teil), bestehend aus der UKW-Vorstufe und der UKW-Hauptstufe, dem Empfangsteil (empfangsteil), bestehend aus dem AM-Teil und dem FM-Teil, dem Lautsprecher (lautsprecher), bestehend aus dem Speaker 1 und dem Speaker 2. Der gesamte Radio (radio) besteht dann aus dem Netztrafo, dem Emfangsteil, der Endstufe und dem Lautsprecher. Wie hoch ist die Wahrscheinlichkeit, dass nach einem Jahr Dauerbetrieb der Radio noch funktioniert (mindestens ein Wellenbereich, mindestens ein Lautsprecher). P (mw−kw−teil) = 0, 8+0, 6−0, 8·0, 6 = 0, 92, P (am−teil) = 0, 75·0, 92 = 0, 69, Version 5.1 - 013 109 6.2. Zusammen gesetzte Aufgaben P (f m − teil) = 0, 9 · 0, 8 = 0, 72, P (empf angsteil) = 0, 69 + 0, 72 − 0, 69 · 0, 72 = 0, 9132, P (lautsprecher) = 0, 9 + 0, 9 − 0, 9 · 0, 9 = 0, 99, P (radio) = 0, 8 · 0, 9132 · 0, 9 · 0, 99 = 0, 6509 Beispiel 6.16. (Duell Anton mit Bert) Es wird nun ein Duell von Anton und Bert, zweier guter Schützen, betrachtet. Anton hat eine Trefferwahrscheinlichkeit von 1 (das heißt von 100 %), während Bert eine Trefferwahrscheinlichkeit von 0,8 (das heißt 80 %) hat. Wenn beim Duell die Reihenfolge, in der geschossen werden darf, per Zufall bestimmt wird, wie hoch sind die Überlebenschancen von Anton und Bert? Wenn Anton zuerst schießen darf, dann wird er sofort Bert treffen. Somit hat Anton überlebt. Ist p(A|A1) die Wahrscheinlichkeit, dass Anton (A) überlebt, unter der Bedingung, dass Anton zuerst schießen darf (A1), so gilt p(A|A1) = 1 und entsprechend p(B|A1) = 0. Darf Bert zuerst schießen (B1), so trifft er mit einer Wahrscheinlichkeit von 0, 8 seinen Gegner. Mit einer Wahrscheinlichkeit von 0, 2 kann sein Gegner zurück schießen. In diesem Fall trifft Anton und das Duell ist beendet. Es gilt somit p(A|B1) = 0, 8 ∗ 0 + 0, 2 ∗ 1 = 0, 2 (wobei 1 beziehungsweise 0 der Wert ist, ob Anton überlebt oder nicht) und p(B|B1) = 0, 8 ∗ 1 + 0, 2 ∗ 0 = 0, 8 (hier repräsentiert 1 beziehungsweise 0 den Wert, ob Bert überlebt oder nicht). Für die Überlebenschancen von Anton gilt somit p(A) = p(A1) ∗ p(A|A1) + p(B1) ∗ p(A|B1) = 0, 5 ∗ 1, 0 + 0, 5 ∗ 0, 2 = 0, 6 . (6.33) A überlebt, wenn er zuerst schießen darf (das passiert mit der Wahrscheinlichkeit p(A1)) oder mit ein Wahrscheinlichkeit von 20% (p(A|B1)), wenn Bert zuerst schießen darf. Die Überlebenschancen von Bert berechnen sich durch p(B) = p(A1) ∗ p(B|A1) + p(B1) ∗ p(B|B1) = 0, 5 ∗ 0, 0 + 0, 5 ∗ 0, 8 = 0, 4 . (6.34) Beispiel 6.17. (Duell Anton mit Claus) Beim Duell von Anton (Trefferwahrscheinlichkeit 100%) und Claus (Trefferwahrscheinlichkeit von 50%) ergeben sich nach den obigen Regeln Überlebenschancen von p(A) = 0, 75 und p(C) = 0, 25 Beispiel 6.18. (Duell Bert mit Claus) Wenn sich nun Bert und Claus duellieren? Wenn zuerst Bert schießt, dann hat er trifft er zu 80%. Zu 20% darf Claus schießen. Dabei trifft Claus nur zu 50%, zu den anderen 50% darf dann wieder Bert 110 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung schießen, die Ausgangssituation ist wieder erreicht. Die Überlebenschance von Bert errechnet sich dadurch mit p(B|B1) = 0, 8 ∗ 1 + 0, 2 ∗ (0, 5 ∗ 0 + 0, 5 ∗ p(B|B1)) = 0, 8 + 0, 1 ∗ p(B|B1) . (6.35) Damit ergibt sich 0, 9 ∗ p(B|B1) = 0, 8 und somit p(B|B1) = 98 . Analog ergibt sich für die Überlebenschance von Claus p(C|B1) = 0, 8 ∗ 0 + 0, 2 ∗ (0, 5 ∗ 1 + 0, 5 ∗ p(C|B1)) = 0, 1 + 0, 1 ∗ p(C|B1) . (6.36) Damit ergibt sich 0, 9 ∗ p(C|B1) = 0, 1 und somit p(C|B1) = 91 . Darf Claus zuerst schießen, dann berechnen sich die Überlebenschancen von Bert durch p(B|C1) = 0, 5 ∗ 0 + 0, 5 ∗ (0, 8 ∗ 1 + 0, 2 ∗ p(B|C1)) = 0, 4 + 0, 1 ∗ p(B|C1) (6.37) und somit 0, 9 ∗ p(B|C1) = 0, 4 und damit p(B|C1) = 94 . Die Überlebenschance von Claus sind p(C|C1) = 0, 5 ∗ 1 + 0, 5 ∗ (0, 8 ∗ 0 + 0, 2 ∗ p(C|C1)) = 0, 5 + 0, 1 ∗ p(C|C1) (6.38) und somit 0, 9 ∗ p(C|C1) = 0, 5 und damit p(C|C1) = 95 . Daraus ergibt sich insgesamt p(B) = 2 3 und p(C) = 13 . Beispiel 6.19. (Triell) Wenn Anton, Bert und Claus ein Triell durchführen, wobei am Anfang die Reihenfolge beim Schießen zufällig bestimmt wird, dann müssen die Kontrahenten mit der folgenden Strategie herangehen: Anton muss zuerst Bert treffen, entsprechend muss Bert zuerst Anton treffen, da dies jeweils die schärfsten Kontrahenten sind. Claus muss solange in die Luft schießen, bis nur noch ein Gegner da ist. Claus muss damit sicher stellen, dass er, wenn einer der Gegner bereits weg ist, er den ersten Schuss auf den verbleibenden Gegner abgeben kann. Damit sind es zwei Ereignisse. Zuerst ein Duell zwischen Anton und Bert (DAB) und anschließend ein Duell zwischen Claus und dem Überlebenden des ersten D rleben ergeben sich dadurch zu: p(A) = p(A|DAB) ∗ p(A|C1 im DAC) = 0, 6 ∗ 0, 5 = 0, 3 Version 5.1 - 013 (6.39) 111 6.3. Aufgaben p(B) = p(B|DAB) ∗ p(B|C1 im DBC) = 0, 4 ∗ 4 8 = = 0, 178 9 45 (6.40) p(C) = p(A|DAB) ∗ p(C|C1 im DAC) (6.41) + p(B|DAB) ∗ p(C|C1 im DBC) 5 47 = 0, 6 ∗ 0, 5 + 0, 4 ∗ = = 0, 522 9 90 Hierbei bedeuten DAB = Duell zwischen Anton und Bert, DAC = Duell zwischen Anton und Claus, DBC = Duell zwischen Bert und Claus. Somit hat Claus ist besten Überlebenschancen, mit über 50%. 6.3. Aufgaben Aufgabe 6.1. Verdeutlichen Sie sich die Eigenschaften der Wahrscheinlichkeit am Beispiel des Würfels. Aufgabe 6.2. Aus einem Spiel mit 32 Karten wird zufällig eine Karte gezogen. Es ist P(Kreuz) = 0,25 und P(Ass) = 0,125. Bestimmen Sie P(Kreuz oder Ass) und von P(Kreuz und Ass). Aufgabe 6.3. In einer Urne befinden sich 200 Kugeln, von denen 70 blau sind und die übrigen gelb. Auf 20 blauen Kugeln und 30 gelben Kugeln ist ein Stern gemalt. Wie groß ist die Wahrscheinlichkeit, dass eine zufällig gezogene Kugel blau ist oder mit einem Stern bemalt ist? Aufgabe 6.4. Beim Werfen von zwei Würfeln soll die Wahrscheinlichkeit für das Ereignis Summe der Augen höchstens 11 bestimmt werden. Aufgabe 6.5. Gegeben sei ein Gerät (G), das aus drei (technische) Komponenten A, B und C besteht. Jede dieser Komponenten hat jeweils die Wahrscheinlichkeit von 0,9, dass sie nach einem Jahr Betrieb noch aktiv sind. Die drei Ereignisse sind voneinander unabhängig. Wie hoch ist die Wahrscheinlichkeit, dass das Gerät nach einem Jahr noch aktiv ist, wenn die drei Komponenten parallel geschaltet sind oder hintereinander geschaltet sind? Aufgabe 6.6. Gegeben sei ein Gerät (G), das aus n (technische) Komponenten Ki , i = 1, . . . , n besteht. Jede dieser Komponenten hat jeweils die Wahrscheinlichkeit von 0,5 (0,7; 0,9; 0,95; 0,99; 0,995), dass sie nach einem Jahr Betrieb noch aktiv sind. Die Komponenten (Ereignisse) sind voneinander unabhängig. Wie hoch ist die Wahrscheinlichkeit, dass das Gerät nach einem Jahr noch aktiv ist, wenn die Komponenten parallel geschaltet sind oder hintereinander geschaltet sind? Erstellen Sie dazu eine Tabelle. 112 Version 5.1 - 013 Kapitel 6. Grundlagen der Wahrscheinlichkeitsrechnung Aufgabe 6.7. Bestimmen Sie die Wahrscheinlichkeiten für die Summe beim Würfeln mit zwei unabhängigen Würfeln. Aufgabe 6.8. Es wird mit drei unterscheidbaren Würfeln gewürfelt. Wie groß ist die Wahrscheinlichkeit dafür, dass die Augensumme mindestens 7, aber weniger als 10 beträgt? Aufgabe 6.9. In einer Lostrommel mit 1000 gut gemischten Losen befinden sich 10 Hauptgewinne (H) und 80 einfache Gewinne (E). Bestimmen Sie die Wahrscheinlichkeit (a) einen Hauptgewinn, (b) einen einfachen Gewinn, (c) einen Hauptgewinn oder einen einfachen Gewinn zu ziehen. Aufgabe 6.10. In einer Urne befinden sich 200 Kugeln, von denen 70 blau sind und die übrigen gelb. Auf 20 blauen Kugeln und 30 gelben Kugeln ist ein Stern gemalt. Wie groß ist die Wahrscheinlichkeit, dass eine zufällig gezogene Kugel blau ist oder mit einem Stern bemalt ist? Aufgabe 6.11. In einer Urne befinden sich 7 blaue und 6 gelbe Kugeln. Es werden nacheinander ohne Zurücklegen zwei Kugeln gezogen. Wie groß ist die Wahrscheinlichkeit, beim zweiten Zug eine gelbe Kugel zu ziehen, unter der Bedingung, dass beim ersten Zug eine blaue Kugel gezogen wurde oder eine gelbe Kugel gezogen wurde? Aufgabe 6.12. Eine Maschine besteht aus den drei Aggregaten A, B und C, die unabhängig voneinander mit den Wahrscheinlichkeiten P (A) = 0, 3, P (B) = 0, 2 und P (C) = 0, 1 ausfallen. Die Maschine kann nur genutzt werden, wenn keines der drei Einzelaggregate ausfällt. Wie hoch ist die Wahrscheinlichkeit für den Ausfall der Maschine? Version 5.1 - 013 113 Kapitel 7. Zufallsvariablen 7.1. Zufallsvariable Zuerst wird der Begriff Zufallsexperiment genauer beleuchtet. Für ein Zufallsexperiment gilt: • Das Experiment wird unter klar definierten Bedingungen durchgeführt. • Die möglichen Ergebnisse (Ausgang des Experiments) sind vorher bereits bekannt. • Das Experiment kann (theoretisch) beliebig oft wiederholt werden. Im folgenden werden Zufallsexperimenten betrachtet, deren Ergebnisse metrisch messbare Größen sind. Definition 7.1 (Zufallsvariable). Eine messbare Funktion X, die zu jedem Elementarereignis ω ∈ Ω eine reelle Zahl X(ω) zuordnet, also X : Ω → R, ω 7→ X(ω) (7.1) heißt Zufallsvariable. Eine Zufallsvariable, die abzählbar viele Werte annehmen kann, heißt diskret. Eine Zufallsvariable, die überabzählbar viele Werte annehmen kann, heißt stetig. Beispiel 7.1. Eine diskrete Zufallsvariable ist die Zahl beim Würfeln mit einem Würfel. Die Zufallsvariable X kann nur die Werte 1, 2, 3, 4, 5 oder 6 annehmen. Beispiel 7.2. Die als reelle Zahl gemessene Lebensdauer von Glühlampen ist eine stetige Zufallsvariable. Die Lebensdauer kann in einem Intervall der reellen Zahlen jeden beliebigen Wert annehmen. Version 5.1 - 013 115 7.1. Zufallsvariable Bei der Verwendung von Zufallsvariablen werden die Ergebnisse eines Zufallsexperiments durch reelle Zahlen beschrieben. Die den Ereignissen zugeordneten Wahrscheinlichkeiten werden dann den entsprechenden Werten der Zufallsvariablen zugeordnet. Bei diskreten Zufallsvariablen bedeutet das: Für ω 7→ X(ω) gilt P (X(ω)) = P (ω). Definition 7.2 (Wahrscheinlichkeitsfunktion). Gegeben sei eine diskrete Zufallsvariable X, welche die Werte xi , i = 1, . . . , n mit von Null verschiedenen Wahrscheinlichkeiten P (X = xi ) = P (xi ) annehmen kann. Die Funktion fX (xi ) = P (xi ), die jedem xi die Wahrscheinlichkeit fX (xi ) zuordnet heißt Wahrscheinlichkeitsfunktion. Eine Wahrscheinlichkeitsfunktion fX besitzt die einfache Eigenschaften 0 ≤ P fX (xi ) ≤ 1 und die Summe über alle Werte ist gleich 1 ( i fX (xi ) = 1). Nimmt die Zufallsvariable nur endlich viele Werte x1 , . . . , xn mit von Null verschiedenen Wahrscheinlichkeiten fX (xi ) = P (xi ) (i = 1, . . . , n) an, so kann die Wahrscheinlichkeitsverteilung in tabellarischer Form (siehe 7.1) angegeben werden: xi fX (xi ) x1 fX (x1 ) x2 fX (x2 ) ... ... xn fX (xn ) Tabelle 7.1.: diskrete, endliche Wahrscheinlichkeitsverteilung Dabei sollen die Werte geordnet sind (x1 < x2 < . . . < xn ). Definition 7.3 (Verteilungsfunktion). Gegeben sei eine diskrete Zufallsvariable X mit der Wahrscheinlichkeitsfunktion fX (x). Die Funktion FX (x) = P (X ≤ x) = X fX (xi ) (7.2) xi ≤x heißt Verteilungsfunktion der Zufallsvariablen X. Eine Verteilungsfunktion hat folgende Eigenschaften: FX ist monoton steigend, rechtsseitig stetig, limx→−∞ FX (x) = 0 und limx→∞ FX (x) = 1. Definition 7.4 (Dichtefunktion). Die Dichtefunktion fX (x) einer stetigen Zufallsvariablen X ist eine intervallweise stetige Funktion mit den Eigenschaften Z ∞ −∞ 116 fX (x)dx = 1 und fX (x) ≥ 0 (7.3) Version 5.1 - 013 Kapitel 7. Zufallsvariablen Beispiel 7.3. ( fX (x) = 0, 5 : 3 ≤ x < 5 0 : sonst (7.4) ist eine Dichtefunktion. Beispiel 7.4. 0, 25x − 0, 5 fX (x) = −0, 25x + 1, 5 0 : 2≤x<4 : 4≤x<6 : sonst (7.5) ist eine Dichtefunktion. Die Dichtefunktion einer stetigen Zufallsvariablen gibt nicht die Wahrscheinlichkeit dafür an, dass die Zufallsvariable den Wert x annimmt. Mit Hilfe der Dichtefunktion einer stetigen Funktion kann nur die Wahrscheinlichkeit bestimmt werden, dass die Zufallsvariable X einen Wert in einem gegebenen Intervall annimmt. Bemerkung 7.5. Gegeben sei eine stetige Zufallsvariable X mit der Dichtefunktion fX (x). Dann gilt P (a < X ≤ b) = Z b a fX (x)dx. (7.6) Daher gilt, dass bei einer stetigen Funktion P (X = x0 ) = 0 gilt. Definition 7.6 (Verteilungsfunktion). Gegeben sei eine stetige Zufallsvariable X mit der Dichtefunktion fX (x). Die Funktion FX (x) = P (X ≤ x) = Z x −∞ fX (t) dt (7.7) heißt Verteilungsfunktion von X Damit gilt P (a < X ≤ b) = Rb a fX (x)dx = FX (b) − FX (a). 7.2. Parameter von Zufallsvariablen Zur Charakterisierung von Häufigkeitsverteilungen werden in der beschreibenden (deskriptiven) Statistik Lage- und Streuungsparameter bestimmt. Entsprechende Parameter können auch für Wahrscheinlichkeitsverteilungen bestimmt werden. Version 5.1 - 013 117 7.2. Parameter von Zufallsvariablen Definition 7.7 (Erwartungswert). Der Erwartungswert E(X) einer Zufallsvariablen X ist definiert durch E(X) = n X xi · fX (xi ) (7.8) i=1 für eine diskrete Zufallsvariablen mit der Wahrscheinlichkeitsfunktion fX , und E(X) = Z ∞ −∞ x · fX (x)dx (7.9) für stetige Zufallsvariablen mit der Dichtefunktion fX . Die Formel für den Erwartungswerten einer diskreten Zufallsvariablen hat eine sehr große Ähnlichkeit zur Formel für das arithmetische Mittel, wenn die Daten mit relativer Häufigkeit gegeben sind. Der Erwartungswert kann grob als erwarteter Mittelwert interpretiert werden. Definition 7.8 (Moment). Es sei X ein Zufallsvariable. Das m-te Moment E(X m ) ist bei einer diskreten Zufallsvariablen mit der Wahrscheinlichkeitsfunktion fX definiert durch E(X m ) = n X xm i · fX (xi ) (7.10) i=1 und bei einer stetigen Zufallsvariablen mit der Dichtefunktion durch E(X m ) = Z ∞ −∞ xm · fX (x)dx (7.11) Das nullte Moment hat den Wert 1. Das erste Moment ist der Erwartungswert der Zufallsvariablen. Wie bei der beschreibenden Statistik können weitere Parameter definiert werden, welche eine Aussage über die Streuung geben. Definition 7.9 (Varianz, Standardabweichung). Die Varianz einer Zufallsvariablen X ist definiert durch V AR(X) = = n X (xi − E(X))2 · fX (xi ) i=1 n X (7.12) x2i · fX (xi ) − (E(X))2 i=1 118 Version 5.1 - 013 Kapitel 7. Zufallsvariablen für eine diskrete Zufallsvariablen mit der Wahrscheinlichkeitsfunktion fX , und Z ∞ V AR(X) = −∞ Z ∞ = −∞ (x − E(X))2 · fX (x)dx (7.13) x2 · fX (x)dx − (E(X))2 für stetige Zufallsvariablen mit der Dichtefunktion fX . Die Wurzel der Varianz ist die Standardabweichung σX der Zufallsvariablen X q (σX = V AR(X)). Es gilt Bemerkung 7.10. Es sei X eine Zufallsvariable, dann gilt V AR(X) = E(X 2 ) − E(X)2 , (7.14) die Varianz ist also das zweite Moment minus dem Quadrat des ersten Moments. Für eine Linearkombination von unabhängigen Zufallsvariablen gilt folgende Aussage: Satz 7.11. Sind k stochastisch unabhängige Zufallsvariablen X1 , X2 , . . . , Xk mit den Erwartungswerten E(Xi ) und den Varianzen V AR(Xi ) für i = 1, . . . , k gegeben, so gilt für den Erwartungswert E(Y ) der Zufallsvariablen Y = a1 X1 + a2 X2 + · · · + ak X k + b : E(Y ) = a1 E(X1 ) + a2 E(X2 ) + · · · + ak E(Xk ) + b (7.15) und für die Varianz V AR(Y ) = a21 V AR(X1 ) + a22 V AR(X2 ) + · · · + a2k V AR(Xk ) (7.16) Beispiel 7.5. Beim Würfeln ist die Wahrscheinlichkeitsfunktion fX für die Zufallsvariable X der Zahl beim Würfeln gegeben durch fX (i) = 61 für i = 1, · · · , 6. Für den Erwartungswert E(X) gilt somit E(X) = 6 X i · fX (i) = 1 · i=1 1 1 + · · · + 6 · = 3, 5. 6 6 (7.17) Für die Varianz ergibt sich 6 X 1 1 = · 17, 5 = 2, 92 6 6 i=1 √ Für die Standardabweichung gilt somit σX = 2, 92 = 1, 71. V AR(X) = Version 5.1 - 013 (i − 3, 5)2 · (7.18) 119 7.2. Parameter von Zufallsvariablen Beispiel 7.6. Gegeben sei die Dichtefunktion ( 0, 5 : 0 : fX (x) = 3<x<5 . sonst (7.19) Der Erwartungswert berechnet sich durch: E(X) = Z ∞ −∞ = 0, 5 · x · fX (x) dx = Z 5 Z 5 x · 0, 5 dx (7.20) 3 xdx = 0, 5 · 3 1 2 x 2 5 = 4. 3 Die Varianz berechnet sich durch: V AR(X) = Z ∞ −∞ = 0, 5 x2 · fX (x)dx − (E(X))2 Z 5 3 Beispiel 7.7. (7.21) 1 x dx − (E(X)) = 0, 5 x3 3 2 2 5 − 42 = 0, 33. 3 1 Für die Dauer einer Fahrt zwischen Autobahndreieck Karlsruhe und Autobahnkreuz Stuttgart benötigt man normalerweise 30 Minuten, optimistisch benötigt man 20 Minuten, pessimistisch 60 Minuten. Die Abbildung 7.1 spiegelt die mögliche Verteilung wieder: 6 @ @ @ @ @ @ @ 10 20 30 40 50 60 - Abbildung 7.1.: Verteilung Zeitbedarf Für die Vereinfachung der Rechnung setzen wir als eine Einheit 10 Minuten an, das heißt 1 = ˆ 10 Minuten, 2 = ˆ 20 Minuten, und so weiter. 1 Dieses Beispiel ist inspiriert durch den Artikel Die Drei-Punkt-Schätzmethode zur Kalkulation des Projektaufwands von P. Gartner in Projektmanagement, 4/99, Seite 33 37 120 Version 5.1 - 013 Kapitel 7. Zufallsvariablen Die Dauer sei durch die nachfolgende Dichtefunktion gegeben, die Normierung ist dabei so gewählt, dass die Fläche unter der Kurve 1 ergibt, so dass es eben eine Dichtefunktion ist. fX (t) = t−2 2 6−t 6 0 : 2<t<3 : 3<t<6 . : sonst (7.22) Es gilt Z 6 t−2 6−t fX (t)dt = dt + dt 2 6 −∞ 2 3 3 6 1 1 3 1 = (t − 2)2 − (6 − t)2 = + = 1 4 12 4 4 2 3 Z ∞ Z 3 (7.23) so dass die angegebene Funktion tatsächlich eine Dichtefunktion ist. Die Wahrscheinlichkeit, dass die Dauer kleiner oder gleich 20 Minuten beträgt: P (X ≤ 2) = Z 2 −∞ fX (t)dt = 0 (7.24) Dies bedeutet, dass die Wahrscheinlichkeit, dass der Dauer kleiner oder gleich 20 Minuten ist gleich 0 ist. Für die Wahrscheinlichkeit, dass der Aufwand kleiner oder gleich 30 Minuten ist, ergibt sich: P (X ≤ 3) = Z 3 −∞ fX (t)dt = Z 3 2 t−2 1 dt = 2 4 (7.25) Dies bedeutet wiederum, dass die Wahrscheinlichkeit, dass die Dauer kleiner oder gleich 30 Minuten ist nur 25% beträgt. Der Erwartungswert für die Dauer ist E(X) = Z ∞ −∞ tfX (t)dt = Z 3 2 t Z 6 t−2 6−t 11 t dt + dt = = 3, 667 2 6 3 3 (7.26) Das heißt, der Erwartungswert für die Dauer beträgt 36 23 Minuten. Als weitere Daten ergeben sich E(X 2 ) = 85 und damit V AR(X) = E(X 2 ) − 6 E(X)2 = 13 . Als Standardabweichung ergibt sich somit σX = 0, 850 18 Für Schätzungen mit einem optimistischen (O), einem häufigsten (H) und einem pessimistischen (P) Wert kann der Erwartungswert auch mittels O+H+P oder 3 O+3H+P O+4H+P oder mittels ermittelt werden, wenn eine Dichtefunktion nicht 5 6 gegeben ist. Bei P. Gartner wird für den Erwartungswert O+H+P und für die Va3 P −O 2 rianz ( 5 ) verwendet. Dies auf das obige Beispiel angewendet würde für den Version 5.1 - 013 121 7.3. Aufgaben ergeben. Für die Varianz erhält man Erwartungswert den Wert E(X) = 11 3 somit für die Standardabweichung 45 = 0, 8. 16 25 und Bei Softwareprojekten werden oftmals auch optimistische (O), häufigste (H) und pessimistische (P) Schätzungen für Teilaufgaben durchgeführt. Für jede Teilaufein Erwartungswert geschätzt werden. gabe kann dann mittels der Formel O+H+P 3 Hat man viele Teilaufgaben für eine Aufgabe, so kann der Projektaufwand als normalverteilt um die Summe der Erwartungswerte der Teilaufgaben angesehen werden (Gesetz der großen Zahlen). Die Varianz ist die Summe der Varianzen der Teilaufgaben, woraus sich die Standardabweichung berechnen lässt. Die Normalverteilung wird später noch behandelt. Beispiel 7.8. Ein Projekt besteht aus 10 Teilaufgaben. Jede Teilaufgabe hat einen Aufwand von 10 (Erwartungswert) und einer Standardabweichung von 1 (damit ist auch die Varianz jeder Teilaufgabe gleich 1). Das Projekt hat somit für den Aufwand einen Erwartungswert von 100 (Summe der einzelnen Erwartungswert). Die √ Summe der Varianzen ist 10, somit ist die Standardabweichung gleich 10 = 3, 16 und somit (deutlich) geringer als die Summe der einzelnen Standardabweichung. Die Standardabweichung hier besagt jedoch nur, dass mit einer gewissen Wahrscheinlichkeit der Wert in dem Bereich Erwartungswert plus / minus Standardabweichung ist. Bei Projektschätzungen wird oftmals für jede Aufgabe der optimistische Wert genommen und die Summe der optimistischen Werte als Aufwand für das Projekt genommen. Dieses Projekt wird von vorne herein eine Überschreitung des Aufwands haben. Die Summe der Erwartungswerte ist der Aufwand, der mit einer Wahrscheinlichkeit von 50% erreicht oder unterschritten wird. 7.3. Aufgaben Aufgabe 7.1. Eine Zufallsvariable X hat folgende Wahrscheinlichkeitsverteilung gemäß Tabelle 7.2 xi 2 3 5 8 9 fX (xi ) 0,1 0,4 0,2 0,1 0,2 Tabelle 7.2.: Wahrscheinlichkeitsverteilung Berechnen Sie den Erwartungswert und die Varianz. 122 Version 5.1 - 013 Kapitel 7. Zufallsvariablen Aufgabe 7.2. Gegeben sei eine stetige Zufallsvariable X. Die zugehörige Dichtefunktion lautet: ( 0, 5x − 1 : 2 < x < 4 . 0 : sonst fX (x) = (7.27) Bestimmen Sie die Verteilungsfunktion, den Erwartungswert und die Varianz. Bestimmen Sie die Wahrscheinlichkeit P (2, 5 < X < 3, 5). Aufgabe 7.3. Gegeben sei eine stetige Zufallsvariable X. Die zugehörige Dichtefunktion lautet: ( fX (x) = 3x2 0 : 0<x<1 . : sonst (7.28) Bestimmen Sie die Verteilungsfunktion, den Erwartungswert und die Varianz. Bestimmen Sie die Wahrscheinlichkeit P (0, 2 < X < 0, 5). Aufgabe 7.4. Es sei die Funktion fX (x) gegeben durch ( fX (x) = 2x − 2 : 1 ≤ x < 2 0 : sonst (7.29) Zeigen Sie, dass fX (x) eine Dichtefunktion ist. Zeichnen Sie die Dichtefunktion! Bestimmen Sie die Verteilungsfunktion FX (x). Zeichnen Sie die Verteilungsfunktion. Bestimmen Sie die Wahrscheinlichkeit P (1, 2 ≤ X ≤ 1, 4). Aufgabe 7.5. Ein Eisverkäufer erzielt bei schönem Wetter einen Tagesgewinn von 100 Euro, bei Regen von 50 Euro und bei Schneefall macht er einen Verlust von 70 Euro. Die Wahrscheinlichkeit für schönes Wetter beträgt p(S) = 0,5 und für Regen p(R) = 0,3. Wie hoch ist der Erwartungswert des täglichen Gewinns für den Eisverkäufer? Aufgabe 7.6. < doppelt > Version 5.1 - 013 123 Kapitel 8. Spezielle Verteilungen In diesem Kapitel werden einige spezielle, oft verwendete Verteilungen dargestellt. Es sind sowohl diskrete als auch stetige Verteilungen. 8.1. Diskrete Gleichverteilung Definition 8.1 (Diskrete Gleichverteilung). Ist X ein diskrete Zufallsvariable, welche die Werte xi (i = 1, . . . , n) mit den positiven Wahrscheinlichkeiten n1 annimmt und sonst den Wert 0 annimmt, dann heißt X gleichverteilt. Die Wahrscheinlichkeitsfunktion lautet: fX (xi ) = 1 n i = 1, 2, . . . , n f ür (8.1) und die Verteilungsfunktion: FX (x) = 0 1 i n : x < x1 : xi ≤ x < xi+1 f ür i = 1, ·, n − 1 . : xn ≤ x (8.2) Es gelten für Erwartungswert und Varianz E(X) = n 1X xi n i=1 (8.3) und V AR(X) = n 1X x2 − E(X)2 n i=1 i (8.4) Beispiele hierfür sind: Wurf einer Münze (n = 2), Würfeln (n = 6) Version 5.1 - 013 125 8.3. Binomialverteilung 8.2. Stetige Gleichverteilung Definition 8.2 (Stetige Gleichverteilung). Ist X eine stetige Zufallsvariable, deren Dichtefunktion im Intervall (a, b) positiv und konstant und sonst 0 ist, dann heißt X gleichverteilt hat hat die Dichtefunktion ( fX (x) = 1 b−a 0 : a<x<b : sonst (8.5) : x<a : a≤x<b . : b≤x (8.6) sowie der Verteilungsfunktion 0 1 FX (x) = x−a b−a Es gelten für den Erwartungswert und die Varianz E(X) = b+a 2 (8.7) und (b − a)2 V AR(X) = 12 (8.8) 8.3. Binomialverteilung Definition 8.3 (Binomialverteilung). Bei einem Zufallsexperiment sind nur die Ereignisse A und A möglich. Mit der Wahrscheinlichkeit p(A) = Θ tritt das Ereignis A ein, mit der Wahrscheinlichkeit p(A) = 1 − p(A) = 1 − Θ tritt das Ereignis A ein. Das Zufallsexperiment wird n-mal wiederholt (Bernoulli-Experiment). Für die Zufallsvariable X, welche die Anzahl der Ausführungen des Zufallsexperiments mit dem Ereignis A angibt, erhält man dann eine Binomialverteilung. Diese hat die Wahrscheinlichkeitsfunktion ! n x Θ (1 − Θ)n−x fX (x) = x (8.9) für x = 0, 1, · · · , n. Die Binomialverteilung besitzt die Parameter n und Θ. Man nennt X deshalb auch B(n; Θ) − verteilt und bezeichnet eine Binomialverteilung mit den Parametern n und Θ mit B(x|n; Θ). Für eine B(n; Θ)-verteilte Zufallsvariable gelten E(X) = nΘ 126 (8.10) Version 5.1 - 013 Kapitel 8. Spezielle Verteilungen und V AR(X) = nΘ(1 − Θ) (8.11) Beispiel 8.1. Eine Münze, deren Vorderseite eine 1 und deren Rückseite eine 0 aufweist, wird 4 mal geworfen. Für die Wahrscheinlichkeitsverteilung der Ergebnissumme (Summe der jeweils oben liegenden Zahl) erhält man aus der Binomialverteilung die nachfolgende Wahrscheinlichkeitsfunktion (siehe Tabelle 8.1). xi fX (xi ) 1 16 0 = 0,0625 4 16 1 = 0,25 6 16 2 = 0,375 4 16 3 = 0,25 1 16 4 = 0,0625 Tabelle 8.1.: Beispiel B(4; 0, 5)-Verteilung Die Ergebnissumme ist B(4; 0, 5)-verteilt. Satz 8.4. Ist X ein B(n; Θ)-verteilte Zufallsvariable und Y ein B(m; Θ)-verteilte Zufallsvariable und sind die beiden Zufallsvariablen stochastisch unabhängig, so ist die Zufallsvariable X + Y B(n + m; Θ)-verteilt. Wichtig ist hierbei, dass die beiden Binomialverteilungen dieselbe Wahrscheinlichkeit Θ haben. Approximationsmöglichkeiten für Binomialverteilungen Ist nΘ ≤ 10 und n ≥ 1500Θ, dann ist eine B(n; Θ)-verteilte Zufallsvariable näherungsweise poissonverteilt mit dem Parameter µ = nΘ, also P s(nΘ)-verteilt. Für nΘ(1 − Θ) > 9 ist eine B(n; Θ)-verteilte Zufallsvariable näherungsweise normalverteilt mit denqParametern µ = nΘ und σ 2 = nΘ(1 − Θ), also ist sie näherungsweise N (nΘ; nΘ(1 − Θ))-verteilt. 8.4. Hypergeometrische Verteilung Während bei der Binomialverteilung die Wahrscheinlichkeit Θ für das Auftreten des Ereignisses A bei jeder Durchführung des Zufallsexperiments gleich ist, ist dies bei der Hypergeometrischen Verteilung nicht der Fall. Als Beispiel kann hier das Urnenmodell fungieren, wobei die gezogenen Kugeln nicht wieder zurückgelegt werden. Version 5.1 - 013 127 8.4. Hypergeometrische Verteilung Definition 8.5 (Hypergeometrische Verteilung). Von N Elementen, von denen M die Eigenschaft A besitzen, werden zufällig n Elemente ohne Zurücklegen entnommen. Für die Wahrscheinlichkeit fX (x), x Elemente mit der Eigenschaft A auszuwählen, gilt: M x fX (x) = ! N −M n−x ! N n ! (8.12) Das ist die Wahrscheinlichkeitsfunktion der Hypergeometrischen Verteilung. Sie enthält 3 Parameter: N (gesamte Anzahl der Elemente), M (Anzahl der Elemente mit der besonderen Eigenschaft) und n (Anzahl der Elemente, die ausgewählt werden). Man schreibt häufig kurz H(x|N ; M ; n) und spricht von einer H(N ; M ; n)-verteilten Zufallsvariablen. Es gelten E(X) = n M N (8.13) und V AR(X) = M n(N − n) M (1 − ). N −1 N N (8.14) Beispiel 8.2. Beim Zahlenlotto (6 aus 49) werden Zahlen ohne Zurücklegen gezogen. Die Wahrscheinlichkeit für 3, 4, 5 oder 6 Richtige erhält man durch die Hypergeometrische Verteilung mit den Parametern N = 49, M = 6 und n = 6. H(3|49; 6; 6) = 6 3 49−6 6−3 49 6 = 20 ∗ 12341 = 0, 0176504038 13983816 H(4|49; 6; 6) = 0, 0009686197 H(5|49; 6; 6) = 0, 0000184499 H(6|49; 6; 6) = 0, 0000000715 Beispiel 8.3. Beim Zahlenlotto 6 aus 49 gibt es auch Tippscheine, auf denen man bis zu 12 Zahlen ankreuzen kann. In diesem Fall ist N = 49, M = 6 und n = 12. Die Wahrscheinlichkeit für 6 bzw. 3 Richtige sind ! H(6|49; 6; 12) = 128 ! 6 43 · 6 6 ! 49 12 = 1 = 0, 0000661 15.134 (8.15) Version 5.1 - 013 Kapitel 8. Spezielle Verteilungen ! H(3|49; 6; 12) = ! 6 43 · 3 9 ! 49 12 = 925 = 0, 122 7.567 (8.16) Approximationsmöglichkeiten für Hypergeometrische Verteilungen: Für 0, 1 < M < 0, 9 und n > 10 und Nn < 0, 05 kann eine H(N ; M ; n)-verteilte ZufallsvariaN ble durch eine B(n; M )-verteilte Zufallsvariable approximiert werden. Für 0, 1 < N M < 0, 9 und n > 30 kann eine H(N ; M ; n)-verteilte Zufallsvariable approximiert N q M M M N −n werden durch eine normalverteilte Zufallsvariable N (n N ; n N (1 − N ) N −1 ). 8.5. Geometrische Verteilung Bei der geometrischen Verteilung wird ein Bernoulli-Experiment durchgeführt, wie bei der Binomialverteilung. Betrachtet wird die Zufallsvariable X, welche die Anzahl der unabhängigen Versuche angibt, die bis zum ersten Auftreten des Ereignisses A vergehen. Definition 8.6 (Geometrische Verteilung). Bei einem Zufallsexperiment sind nur die Ereignisse A und A möglich. Mit der Wahrscheinlichkeit p(A) = Θ tritt das Ereignis A ein, mit der Wahrscheinlichkeit p(A) = 1 − p(A) = 1 − Θ tritt das Ereignis A ein. Das Zufallsexperiment wird unabhängig wiederholt (BernoulliExperiment). Für die Zufallsvariable X, welche die Anzahl der Ausführungen des Zufallsexperiments angibt, bis das Ereignis A eintritt, erhält man dann eine geometrische Verteilung . Diese hat die Wahrscheinlichkeitsfunktion fX (x) = Θ(1 − Θ)x−1 x = 1, 2, · · · (8.17) und die Verteilungsfunktion ( FX (x) = 0 1 − (1 − Θ)m : x<1 . : m ≤ x < m + 1, m = 1, 2, · · · (8.18) Die geometrische Verteilung besitzt den Parameter Θ. Für eine geometrischverteilte Zufallsvariable gilt E(X) = 1 Θ (8.19) 1−Θ . Θ2 (8.20) und V AR(X) = Version 5.1 - 013 129 8.6. Poissonverteilung 18 . Die Beispiel 8.4. Beim Roulette ist die Wahrscheinlichkeit für rot p(R) = Θ = 37 Wahrscheinlichkeit, dass beim 10. Spiel zum ersten Mal rot eintritt ist fX (10) = 18 ∗ ( 19 )9 = 0, 001208. Der Erwartungswert für die Anzahl der Spiele ist E(X) = 37 37 37 = 2, 05556. 18 Approximationsmöglichkeiten für Geometrische Verteilungen Für Θ < 0, 1 ist die geometrisch verteilte Zufallsvariable X näherungsweise exponentialverteilt mit dem Parameter λ = Θ. 8.6. Poissonverteilung Bei der Durchführung eines Bernoulli-Experiments und der Anwendung der Binomialverteilung liegt manchmal die Situation vor, dass die Wahrscheinlichkeit Θ für das Eintreten des Ereignissen A sehr klein ist, die Anzahl n der Ausführungen jedoch sehr groß. Dies tritt beispielsweise bei der Produktion von Gütern auf. Der Ausschuss ist gering, die produzierte Masse jedoch hoch. Ist nΘ konstant und geht Θ gegen 0, dann geht der Term ! n x Θ (1 − Θ)n−x x gegen des Term (nΘ)x −nΘ e . x! (8.21) Für die Konstante nΘ setzt man µ. Definition 8.7 (Poissonverteilung). Eine diskrete Zufallsvariable X mit der Wahrscheinlichkeitsfunktion fX (x) = µx −µ e x! , x = 0, 1, 2, · · · (8.22) heißt Poissonverteilung oder poisson-verteilt mit dem Parameter µ. Man spricht auch von einer P s(µ)-verteilten Zufallsvariablen X und schreibt für die Wahrscheinlichkeitsfunktion P s(x|µ). Für Erwartungswert und Varianz gelten E(X) = µ (8.23) V AR(X) = µ. (8.24) und Anwendung findet die Poisson-Verteilung unter anderem bei der Untersuchung über 130 Version 5.1 - 013 Kapitel 8. Spezielle Verteilungen • Anzahl der pro Minute ankommenden Telefongespräche in einer Telefonvermittlung. • Anzahl der Kraftfahrzeuge, die pro Minute an einem Punkt vorbeifahren. • Anzahl der Fadenbrüche pro Zeitraum in einer Spinnerei. • Anzahl von Druckfehlern pro Seite in Büchern. Beispiel 8.5. Bei einer Verkehrszählung wurde die Anzahl der pro Zeitintervall von einer Minute an einem Punkt vorbei fahrenden Fahrzeuge festgestellt. Für eine Dauer von 200 Minuten ergab sich die Resultate gemäß Tabelle 8.2 Anzahl der Fahrzeuge pro Intervall Häufigkeit 0 110 1 2 3 4 65 21 3 1 5 0 Tabelle 8.2.: Beispiel: Fahrzeugzählung Für den Mittelwert und die Varianz ergeben sich jeweils 0, 6. Daher kann von einer Poissonverteilung mit dem Parameter µ = 0, 6 ausgegangen werden. Damit kann die theoretische Häufigkeit ermittelt werden (siehe 8.3). xi P s(xi |0, 6) 200 · P s(xi |0, 6) Häufigkeit 0 1 2 3 4 5 0,5488 0,3293 0,0988 0,0198 0,0030 0,0004 110 66 20 4 1 0 110 65 21 3 1 0 Tabelle 8.3.: Beispiel: Poissonverteilung Bemerkung 8.8. Für poissonverteilte unabhängige Zufallsvariablen X und Y mit den Parametern µ und λ gilt, dass die Zufallsvariable Z = X + Y ebenfalls poissonverteilt ist. Der Parameter von Z ist µ + λ. Approximationsmöglichkeiten für Poissonverteilungen Für µ ≥ 10 ist eine P s(µ)-verteilte Zufallsvariable näherungsweise normalverteilt √ √ mit dem Parameter µ und µ, d.h. sie ist N (µ; µ)-verteilt. 8.7. Exponentialverteilung Für manche Anwendungen, insbesondere in der Theorie der Warteschlangen spielt die Exponentialverteilung eine wichtige Rolle. Version 5.1 - 013 131 8.8. Normalverteilung Definition 8.9 (Exponentialverteilung). Eine stetige Zufallsvariable X mit der Dichtefunktion ( fX (x) = λe−λx 0 : f ür x ≥ 0; λ > 0 . : sonst (8.25) und der Verteilungsfunktion ( FX (x) = 1 − e−λx 0 : f ür x ≥ 0; λ > 0 . : sonst (8.26) heißt Exponentialverteilung oder exponentialverteilt mit dem Parameter λ. Für den Erwartungswert und die Varianz einer exponentialverteilten Zufallsvariablen X gelten: E(X) = 1 λ (8.27) und V AR(X) = 1 . λ2 (8.28) 8.8. Normalverteilung Die Normalverteilung ist die wichtigste stetige Verteilung. Sie spielt bei nahezu allen Anwendungen der Statistik eine wichtige Rolle. Definition 8.10 (Normalverteilung). Eine stetige Zufallsvariable X mit der Dichtefunktion 1 (x − µ)2 fX (x) = √ exp(− ) 2σ 2 σ 2π (8.29) heißt Normalverteilung oder normalverteilt mit den Parametern µ und σ. Eine Normalverteilung mit den Parametern µ und σ wird mit N (µ; σ) bezeichnet. Die Zufallsvariable heißt dann auch N (µ; σ)-verteilt. Für eine normalverteilte Zufallsvariable X gelten E(X) = µ (8.30) V AR(X) = σ 2 . (8.31) und 132 Version 5.1 - 013 Kapitel 8. Spezielle Verteilungen Die Dichtefunktion der Normalverteilung ist symmetrisch und hat ihr Maximum bei µ. Je kleiner das σ ist, desto höher ist das Maximum und desto enger ist die Kurve um die Spiegelachse gelegt. Für die Wahrscheinlichkeit P (x1 ≤ X ≤ x2 ) gilt P (x1 ≤ X ≤ x2 ) = = Z x2 x1 Z x2 x1 fX (x)dx (8.32) 1 (x − µ)2 √ exp(− )dx 2σ 2 σ 2π Die Verteilungsfunktion der Normalverteilung, d.h. das Integral der Dichtefunktion, ist mit Hilfe elementarer Funktionen nicht explizit darstellbar. Die Werte werden in der Regeln mittels einer Tabelle angegeben. Dabei sind in der Tabelle nur die Werte von N (0; 1) hinterlegt. Definition 8.11 (Standardnormalverteilung). Die Normalverteilung mit dem Erwartungswert 0 und der Standardabweichung 1, also N (0; 1), heißt Standardnormalverteilung. Bemerkung 8.12. Ist X eine N (µ; σ)-verteilte Zufallsvariable, dann ist die lineare Transformation Y = aX + b, a, b ∈ R eine N (aµ + b; |a| · σ)-verteilte Zufallsvariable. Mit a = σ1 und b = − σµ ist Z = aX + b oder Z = σ1 X − standardnormalverteilt. Es gilt dann p(x1 ≤ X ≤ x2 ) = p( µ σ ein N (0; 1)-verteilt oder x1 − µ x2 − µ ≤Z≤ ). σ σ (8.33) Auf Grund dieser Bemerkung genügt die Tabelle für die Standardnormalverteilung, da daraus dann die Werte für die anderen Normalverteilungen durch eine lineare Transformation gewonnen werden können. Im Anhang (siehe A.2) ist eine detailliertere Tabelle für die Standardnormalverteilung aufgeführt. Ist X ein standardnormalverteilte Zufallsvariable, dann gelten : p(X ≤ 1) = 0, 84134 p(−1 ≤ X ≤ 1) = 0, 84134 − (1 − 0, 84134) = 0, 68268 p(−2 ≤ X ≤ 2) = 0, 97725 − (1 − 0, 97725) = 0, 95450 Version 5.1 - 013 133 8.9. Aufgaben 750 ≤ X ≤ 1050 −1, 5 ≤ Z ≤ 1, 5 800 ≤ X ≤ 1050 −1 ≤ Z ≤ 1, 5 X ≤ 650 Z ≤ −2, 5 X ≤ 800 Z ≤ −1 1200 ≤ X 3≤Z X ≤ 800 or Z ≤ −1 or 1200 ≤ X 3≤Z 0,93319 - (1 - 0,93319) 0,93319 - (1 - 0,84134) (1 - 0,99379) (1 - 0,84134) 1 - 0,99865 0,15866 + 0,00135 0,86638 0,77453 0,00621 0,15866 0,00135 0,16001 Tabelle 8.4.: Beispiel: Brenndauer Glühbirnen Beispiel 8.6. Die Brenndauer von Glühlampen sei normalverteilt mit dem Mittelwert von 900 Stunden und einer Standardabweichung von 100 Stunden. Es gelten standardnorsomit µ = 900 und σ = 100. Damit ist die Zufallsvariable Z = X−µ σ malverteilt. In der Tabelle 8.4 sind einige Beispiele berechnet. Wenn man zwei normalverteilte Zufallsvariablen hat, so ist auch die Summe dieser beiden Zufallsvariablen wieder normalverteilt. Satz 8.13. Gegeben seien zwei N (µ1 ; σ1 )- und N (µ2 ; σ2 )-verteilte unabhängige Zufallsvariablen X1 und X2 . Die Zufallsvariable X = X1 + X2 ist wieder q normalverq 2 2 teilt mit den Parametern µ1 + µ2 und σ1 + σ2 , sie ist also N (µ1 + µ2 ; σ12 + σ22 )verteilt. Die Normalverteilung ist eine der wichtigsten Verteilungen, da sich bei Experimenten und Beobachtungen die Zufallsvariable näherungsweise normalverteilt. 8.9. Aufgaben Aufgabe 8.1. (Binomialverteilung) In einer Produktionserie ist die Wahrscheinlichkeit für ein defektes Teil Θ. Die Anzahl der defekten Teile, wenn n Elemente aus der Produktion zufällig ausgewählt und untersucht werden ist B(n; Θ)-verteilt. Bestimmen Sie B(x|n; Θ) für x = 0, 1, · · · , 4 für (a) n = 4, Θ = 0, 2 (b) n = 4, Θ = 0, 1 (c) n = 10, Θ = 0, 01 (d) n = 100, Θ = 0, 01 134 Version 5.1 - 013 Kapitel 8. Spezielle Verteilungen Aufgabe 8.2. (Geometrische Verteilung) Bestimmen Sie die Wahrscheinlichkeit, dass sie beim Würfeln 1, 2, 3, 4, 5, 6, 7, 8, 9 oder 10 Würfe benötigen, bis Sie eine 6 würfeln. Wie hoch ist die Wahrscheinlichkeit, dass Sie 20, 30, 40 oder 50 Würfe benötigen? 1 ) Seiten sind Aufgabe 8.3. (Poissonverteilung) In einem Skript mit 500 (Θ = 500 300 (n = 300) Druckfehler zufällig verteilt. Bestimmen Sie die Wahrscheinlichkeit, dass (a) genau 2 oder (b) mindestens 2 Fehler auf einer bestimmten, zufällig gewählten Seite enthalten sind. Aufgabe 8.4. (Normalverteilung) Ein Unternehmen stellt Kondensatoren her, deren Kapazität normalverteilt ist mit µ = 100 (pF) und σ = 0,2. Wie viel Prozent Ausschuss sind zu erwarten, wenn die Kapazität der Kondensatoren (a) mindestens 99,8 pF; (b) höchstens 100,6 pF betragen soll; (c) um maximal 0,3 pF vom Sollwert 100 pF abweichen darf? Aufgabe 8.5. < doppelt > Aufgabe 8.6. (Hypergeometrische Verteilung) Bestimmen Sie die Wahrscheinlichkeit für 4, 5, 6 und 7 Richtige bei einem Lotto 7 aus 38. Aufgabe 8.7. < doppelt > Aufgabe 8.8. < doppelt > Aufgabe 8.9. (Normalverteilung) Es sei X eine N (µ; σ)-verteilte Zufallsvariable. Bestimmen Sie die folgenden Wahrscheinlichkeiten: (a) P (µ − σ ≤ X ≤ µ + σ) (b) P (µ − 2σ ≤ X ≤ µ + 2σ) (c) P (µ − 3σ ≤ X ≤ µ + 3σ) (d) P (X ≤ µ + 1, 5σ) (e) P (µ − 0, 5σ ≤ X) Aufgabe 8.10. (Normalverteilung) Von einem Betrieb werden Metallfolien hergestellt, von denen nur Folien mit einer Dicke zwischen 0,082 mm und 0,118 mm zur Weiterverarbeitung verwendet werden können, der Rest ist Ausschuss. Zur Herstellung stehen dem Betrieb die Maschinen A und B zur Verfügung. Die Foliendicke der mit diesen Maschinen hergestellten Folien ist um den auf den Maschinen einstellbaren Sollwert (Erwartungswert) normalverteilt, und zwar auf der Maschine A mit einer Standardabweichung von 0,01 mm und bei B von 0,018 mm. Version 5.1 - 013 135 8.9. Aufgaben (a) Wie sollte der Sollwert eingestellt werden, um den Ausschussanteil zu minimieren? (b) Die Produktionskosten je 1000 Folien betragen für Maschine A 20 Euro und für B 16 Euro. Für welche der beiden Maschinen sollte sich der Betrieb entscheiden, wenn einwandfreie Folien zu minimalen Kosten hergestellt werden sollen? Aufgabe 8.11. Studenten bestehen mit einer Wahrscheinlichkeit von 0,7 die Statistikklausur. Die Erfolge beziehungsweise Misserfolge der einzelnen Studenten sind unabhängig voneinander. Bestimmen Sie die Wahrscheinlichkeit, dass von 5 Studenten 0, 1, 2, 3, 4 oder 5 Studenten die Klausur bestehen. Aufgabe 8.12. Beim Mensch-ärgere-Dich-nicht-Spiel darf der erste Zug erst dann erfolgen, wenn das erste Mal eine 6 gewürfelt wird. Wie groß ist die Wahrscheinlichkeit, dass man mehr als 3 Würfe machen muss, um beginnen zu können? Aufgabe 8.13. Die Anzahl der Fahrzeuge, die in einem Beobachtungspunkt innerhalb eines Intervalls von einer Minute passieren, ist poissonverteilt mit µ = 1,6. (a) Wie groß ist die Wahrscheinlichkeit, dass in einer Minute mehr als 3 Fahrzeuge vorbeifahren? (b) Wie groß ist die Wahrscheinlichkeit, dass in 5 Minuten nicht mehr als 5 Fahrzeuge vorbeifahren, wenn die Ereignisse stochastisch unabhängig sind? Aufgabe 8.14. Bei einer Klausur mit einer maximalen Anzahl von 100 Punkten seien die Ergebnisse näherungsweise normalverteilt mit µ = 60 und σ = 10. (a) Bestimmen Sie den Anteil d Studierenden, die durchgefallen sind, wenn zum Bestehen der Klausur mindestens 50 Punkte erforderlich sind. (b) Bestimmen Sie den Anteil der Studenten, welche die Note gut erhalten haben, wenn diese für Punktzahlen von 80 bis 95 vergeben wird. (c) Auf welchen Wert muss die zum Bestehen nötige Mindestpunktzahl festgelegt werden, wenn nicht mehr als 10% der Studierenden durchfallen sollen? (Hinweis: es sollen keine Stetigkeitskorrekturen beachtet werden.) 136 Version 5.1 - 013 Kapitel 9. Schließende Statistik In der schließenden Statistik wird aus den Daten einer Stichprobe auf Parameter der Grundgesamtheit geschlossen oder aus der Verteilung der Grundgesamtheit Schlüsse zu Stichproben gezogen. Bei Hypothesentest werden Aussagen zur Annahme oder Ablehnung von Hypothesen getroffen. 9.1. Parameterschätzung In der beschreibenden Statistik wurden Daten, wie Mittelwert und Standardabweichung, von einer gegebenen Datenmenge bestimmt, wobei die Daten vollständig erfasst und analysiert werden. Die vollständige Erfassung aller Daten ist nicht immer möglich oder sinnvoll. • Die Zugfestigkeit von Kettengliedern sollen überprüft werden, indem diese bis zum Zerreißen belastet werden. Nur ein Teil der Produktion kann diesem Test unterzogen werden. • Die Abfüllanlage, welche Säcke mit Zement mit jeweils 50 kg füllt soll überprüft werden. Es ist nicht wirtschaftlich sinnvoll, alle Säcke zu prüfen. Daher soll allein durch die Prüfung einiger Säcke, z.B. jeder 20. oder 50. Sack das durchschnittliche Gewicht bestimmt werden. • In einer Urne befinden sich rote und grüne Kugel. Durch einen Stichprobenumfang soll der Anteil der roten Kugeln abgeschätzt werden. Eine statistische Masse über die man eine bestimmte Aussage treffen möchte heißt Grundgesamtheit. Ist die Grundgesamtheit endlich, wird die Anzahl der Elemente mit N bezeichnet. Ein Teil einer zu analysierenden statistischen Masse, die zufällig ausgewählt ist und aus der Informationen für die Grundgesamtheit Version 5.1 - 013 137 9.2. Intervallschätzung ermittelt werden heißt Stichprobenumfang. Die Anzahl der Elemente aus dem Stichprobenumfang wird mit n bezeichnet. Für den Stichprobenumfang können die statistischen Parameter mit Hilfe der beschreibenden Statistik bestimmt werden, siehe Tabelle 9.1. Grundgesamtheit Stichprobe Anzahl der Elemente N n Mittelwert bzw. Erwartungswert µ x 2 Varianz σ s2 Standardabweichung σ s Anteilswert θ p Tabelle 9.1.: Untersuchungsparameter Eine Stichprobe vom Umfang n liefert die Werte X1 , X2 , · · · , Xn (die Stichproben). (Große Buchstaben, da die Werte Zufallsvariablen sind). Damit gelten für den Stichprobenmittelwert X= n X Xi , (9.1) i=1 für die Stichprobenvarianz S2 = n n 1X 1X 2 (Xi − X)2 = XXi2 − X n i=1 n i=1 und für die Stichprobenstandardabweichung √ S = S2 . (9.2) (9.3) Der Erwartungswert für den Mittelwert der Stichproben entspricht dem Erwartungswert der Grundgesamtheit (E(X) = µ). Die Beziehung zwischen der Varianz der Stichproben und der Varianz der Grundgesamtheit ist etwas komplexer, ohne dass hier näher darauf eingegangen wird. (siehe dazu etwa Schwarze 1997). Näherungsweise ist die Varianz der Stichprobe gleich der Varianz der Grundgesamtheit. 9.2. Intervallschätzung Statt einer Punktschätzung wird bei einer Intervallschätzung ein Intervall angegeben, in dem mit einer gewissen Wahrscheinlichkeit der gesuchte Parameter θ 138 Version 5.1 - 013 Kapitel 9. Schließende Statistik enthalten ist. Es werden somit zwei Werte U1 und U2 derart gesucht, dass die Wahrscheinlichkeit, dass der gesuchte Wert θ zwischen U1 und U2 liegt gleich 1 − α ist: p(U1 ≤ θ ≤ U2 ) ≥ 1 − α (9.4) Der Wert α gibt dabei an, mit welcher Genauigkeit das Intervall gesucht wird. Die Wahrscheinlichkeit 1 − α heißt Konfidenzniveau. Das Intervall [U1 , U2 ] heißt Konfidenzintervall. In den meisten Fällen verwendet man eine Schätzvariable U und konstruiert durch U1 = U − δ und U2 = U + δ ein symmetrisches Konfidenzintervall [U − δ, U + δ]. Betrachten wir nun eine N (µ, σ 2 )-verteilte Zufallsvariable X und n Stichprobenvariablen X1 , · · · , Xn . Der Mittelwert der Stichproben X ist ebenfalls normalverteilt, 2 genauer N (µ, σn )-normalverteilt. Das heißt, der Erwartungswert ist identisch, nur die Varianz ist unterschiedlich. Zuerst wird mittels einer linearen Transformation Z= √ n· X −µ σ (9.5) eine standardnormalverteilte Zufallsvariable Z definiert. Für Z betrachten wir das Konfidenzintervall [−c, c] für ein geeignetes c > 0 und fordern p(−c ≤ Z ≤ c) = 1 − α (9.6) Durch auflösen nach µ ergibt sich damit cσ cσ p(X − √ ≤ µ ≤ X + √ ) = 1 − α n n (9.7) Das gesuchte Konfidenzintervall ist damit cσ cσ [X − √ , X + √ ]. n n (9.8) Da wir von einer normalverteilten Funktion ausgegangen sind, und Z standardnormalverteilt ist, kann das c in Abhängigkeit von α bestimmt werden. Der Parameter α bestimmt die Genauigkeit, mit der der gesuchte Parameter im Konfidenzintervall liegt. Ist ϕ(x) die Dichtefunktion der Standardnormalverteilung, so ergibt sich aus p(−c ≤ Z ≤ c) = 1 − α: 1 − α = ϕ(c) − ϕ(−c) = ϕ(c) − (1 − ϕ(c)) = 2ϕ(c) − 1. Daraus wiederum erhält man ϕ(c) = 1 − α2 . Daraus wiederum kann man c ermitteln, siehe dazu Tabelle 9.2. (siehe auch Tabelle der Standardnormalverteilung). Version 5.1 - 013 139 9.3. Hypothesentests α Genauigkeit ϕ(c) c 0,01 99% 0,995 2,576 0,05 95% 0,975 1,96 0,1 90% 0,95 1,645 Tabelle 9.2.: Parameter in Abhängigkeit von der Güte Beispiel 9.1. Aus einer Grundgesamtheit mit N (µ; 12)-verteiltem X wurde eine einfache Zufallsstichprobe vom Umfang n = 36 gezogen, die x = 26 liefert. Für 1 − α = 0, 95 erhält man aus der Standardnormalverteilung c = 1, 96. Als 95%Konfidenzintervall für µ ergibt sich: 12 12 µu = 26 − 1, 96 √ = 22, 08; µo = 26 + 1, 96 √ = 29, 92 36 36 (9.9) Das bedeutet, dass mit einer Wahrscheinlichkeit von 95% der Erwartungswert der Grundgesamtheit im Intervall von 22,08 bis 29,92 liegt. Je nach dem, ob die Varianz bekannt ist oder nicht, und je nach dem wie das Verhältnis zwischen der Anzahl des Umfangs der Stichprobe und der Anzahl der Grundgesamtheit ist, ergeben sich Veränderungen in der Bestimmung des Konfidenzintervalls. Für genauere Untersuchungen siehe Schwarze 1997. 9.3. Hypothesentests Oftmals hat man für den Parameter einer Verteilung eine bestimmte Vermutung oder Hypothese. Durch eine Stichprobe möchte man die Vermutung überprüfen. Dies geschieht mittels eines statistischen Testverfahrens. Beispiel 9.2. Beim zufälligen Werfen einer Münze erwarten wir, dass das Ergebnis Zahl mit der Wahrscheinlichkeit p(Zahl) = 0, 5 auftritt. Die Hypothese für unseren Test lautet Θ = 0, 5. Die zu überprüfende Hypothese bezeichnet man auch als Nullhypothese H0 . Zum Test der Hypothese wird eine Münze mehrmals (n-fach) geworfen und die Anzahl X des Ereignisses Zahl gezählt. Diesem Zufallsexperiment liegt eine Binomialverteilung mit dem Erwartungswert E(X) = n2 zu Grunde. Für einen Stichprobenumfang von n = 8 erhält man folgende Verteilung von X (X ist B(8; 0, 5)-verteilt), siehe Tabelle 9.3. 140 Version 5.1 - 013 Kapitel 9. Schließende Statistik x 0 und 8 1 und 7 2 und 6 3 und 5 4 p(x) 0,0039 0,0312 0,1094 0,2188 0,2734 Tabelle 9.3.: Beispiel: Stichprobenexperiment Wenn bei richtiger Nullhypothese zugelassen wird, dass X um 2 nach oben oder unten von n2 = 4 abweichen darf, dann darf X = 2, 3, 4, 5 oder 6 sein. Die Wahrscheinlichkeit, dass X in diesem Bereich liegt, ist bei 0,9298. Die Menge der möglichen Ergebnisse wird in zwei Bereiche geteilt, den Ablehnungsbereich (X < 2) beziehungsweise (X > 6) und den Annahmebereich (2 ≤ X ≤ 6). Liegt das Ergebnis im Ablehnungsbereich, so ist bei richtiger Nullhypothese die Wahrscheinlichkeit für dieses Ereignis sehr gering (0,0702), so dass hier mit hoher Wahrscheinlichkeit davon ausgegangen werden kann, dass die Nullhypothese nicht zutrifft. Gilt 2 ≤ X ≤ 6, so kann die Nullhypothese nicht abgelehnt werden. Es ist allerdings nicht bewiesen, dass die Nullhypothese richtig ist, sie kann jedoch nicht abgelehnt werden. Bei einer Ablehnung oder bei einer Annahme einer Hypothese kann es zu Fehleinschätzungen kommen. Es kann die Nullhypothese abgelehnt werden, obwohl sie richtig ist. dies nennt man Fehler 1. Art oder α-Fehler. Die Wahrscheinlichkeit α heißt Irrtumswahrscheinlichkeit oder Signifikanzniveau des Tests. Als weiterer Fehler kann die Annahme einer falschen Hypothese vorkommen. Dieses Fehler nennt man Fehler 2. Art oder β-Fehler, siehe Tabelle 9.4. Nullhypothese nicht verworfen Nullhypothese verworfen Nullhypothese Nullhypothese richtig falsch richtige β-Fehler Entscheidung (Fehler 2. Art) α-Fehler richtige (Fehler 1. Art) Entscheidung Tabelle 9.4.: Fehler 1. und 2. Art Für eine genauere Ausführung zu Testverfahren siehe Schwarze 1997. Version 5.1 - 013 141 Anhang A. Tabellen Version 5.1 - 013 143 A.1. Basisdaten A.1. Basisdaten Für viele Untersuchungen werden die nachfolgenden Daten betrachtet. Es sind Daten von Personen in einer Vorlesung (inklusive Dozent) aufgeführt. Neben der laufenden Nummer wird das Geschlecht der Person (m für männlich, w für weiblich), das Alter in Jahren, die Körpergröße in cm und die Note in einer Klausur dargestellt. Nr 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Geschlecht m w m m w m w w w w m w w w w m w m w w w m w m w w m w m Alter 19 20 20 20 20 21 21 23 25 20 20 22 23 20 20 20 21 20 23 21 20 21 19 19 21 22 18 25 54 Größe 166 170 174 176 179 184 152 164 171 178 187 166 168 169 178 188 171 185 161 171 177 187 182 184 169 176 193 175 172 Note 3 1 4 3 3 2 1 3 3 2 3 5 2 3 3 2 2 2 5 3 5 3 2 4 4 2 2 2 3 Tabelle A.1.: Basisdatensatz 144 Version 5.1 - 013 Anhang A. Tabellen A.2. Tabelle der Normalverteilung z 0,0. 0,1. 0,2. 0,3. 0,4. 0,5. 0,6. 0,7. 0,8. 0,9. 1,0. 1,1. 1,2. 1,3. 1,4. 1,5. 1,6. 1,7. 1,8. 1,9. 2,0. 2,1. 2,2. 2,3. 2,4. 2,5. 2,6. 2,7. 2,8. 2,9. 3,0. 3,1. 3,2. 3,3. 3,4. .,.0 50000 53983 57926 61791 65542 69146 72575 75804 78814 81594 84134 86433 88493 90320 91924 93319 94520 95543 96407 97128 97725 98214 98610 98928 99180 99379 99534 99653 99744 99813 99865 99903 99931 99952 99966 .,.1 50399 54380 58317 62172 65910 69497 72907 76115 79103 81859 84375 86650 88686 90490 92073 93448 94630 95637 96485 97193 97778 98257 98645 98956 99202 99396 99547 99664 99752 99819 99869 99906 99934 99953 99968 Version 5.1 - 013 .,.2 50798 54776 58706 62552 66276 69847 73237 76424 79389 82121 84614 86864 88877 90658 92220 93574 94738 95728 96562 97257 97831 98300 98679 98983 99224 99413 99560 99674 99760 99825 99874 99910 99936 99955 99969 .,.3 51197 55172 59095 62930 66640 70194 73565 76730 79673 82381 84849 87076 89065 90824 92364 93699 94845 95818 96638 97320 97882 98341 98713 99010 99245 99430 99573 99683 99767 99831 99878 99913 99938 99957 99970 .,.4 51595 55567 59483 63307 67003 70540 73891 77035 79955 82639 85083 87286 89251 90988 92507 93822 94950 95907 96712 97381 97932 98382 98745 99036 99266 99446 99585 99693 99774 99836 99882 99916 99940 99958 99971 .,.5 51994 55962 59871 63683 67364 70884 74215 77337 80234 82894 85314 87493 89435 91149 92647 93943 95053 95994 96784 97441 97982 98422 98778 99061 99286 99461 99598 99702 99781 99841 99886 99918 99942 99960 99972 .,.6 52392 56356 60257 64058 67724 71226 74537 77637 80511 83147 85543 87698 89617 91308 92785 94062 95154 96080 96856 97500 98030 98461 98809 99086 99305 99477 99609 99711 99788 99846 99889 99921 99944 99961 99973 .,.7 52790 56749 60642 64431 68082 71566 74857 77935 80785 83398 85769 87900 89796 91466 92922 94179 95254 96164 96926 97558 98077 98500 98840 99111 99324 99492 99621 99720 99795 99851 99893 99924 99946 99962 99974 .,.8 53188 57142 61026 64803 68439 71904 75175 78230 81057 83646 85993 88100 89973 91621 93056 94295 95352 96246 96995 97615 98124 98537 98870 99134 99343 99506 99632 99728 99801 99856 99896 99926 99948 99964 99975 .,.9 53586 57535 61409 65173 68793 72240 75490 78524 81327 83891 86214 88298 90147 91774 93189 94408 95449 96327 97062 97670 98169 98574 98899 99158 99361 99520 99643 99736 99807 99861 99900 99929 99950 99965 99976 145 Anhang L. Lösungen der Aufgaben Hier finden Sie Lösungen zu den Aufgaben im Kurstext, wobei nicht zu allen Aufgaben Lösungen angegeben sind. Aktuell sind leider einige Aufgaben doppelt. Dies wird in einer späteren Version bereinigt. Version 5.1 - 013 147 L.1. Grundlagen L.1. Grundlagen Lösung L.1.1. Lösung L.1.2. Lösung L.1.3. Lösung L.1.4. Lösung L.1.5. Lösung L.1.6. Lösung L.1.7. Lösung L.1.8. Lösung L.1.9. - 148 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben L.2. Univariate Daten Lösung L.2.1. 1 (0, 7 + 1, 6 + 2, 4 + 3, 2 + 1, 6 + 2, 4 + 2, 8) = 2, 1 7 1 d = (1, 4 + 0, 5 + 0, 3 + 1, 1 + 0, 5 + 0, 3 + 0, 7) = 0, 6857 7 1 2 s2 = 0, 7 + 1, 62 + 2, 42 + 3, 22 + 1, 62 + 2, 42 + 2, 82 − 2, 12 = 0, 62 7 √ s = 0, 62 = 0, 7874 x= Die mittlere absolute Abweichung ist auf das arithmetische Mittel bezogen. Lösung L.2.2. 5 · 0 + 4 · 1 + 10 · 2 + 12 · 3 + · · · + 4 · 10 600 = =5 5 + 4 + 10 + 12 + · · · + 4 120 5 · 02 + 4 · 12 + 10 ·2 +12 · 32 + · · · + 4 · 102 3680 s2 = − 52 = − 52 = 5, 6667 5 + 4 + 10 + 12 + · · · + 4 120 s = 2, 3805 x= Lösung L.2.3. x = 0, 25 · 10 + 0, 5 · 9 + 0, 25 · 7 = 8, 75 Lösung L.2.4. Bei jeder Gruppe wurde ein Repräsentant (xj ) bestimmt, der als Wert für die Gruppe genommen wird. Damit errechnet sich x= 2 · 18 + 9 · 25 + 5 · 35 + 6 · 45 + 5 · 55 + 3 · 63 1170 = = 39 30 30 Unter Verwendung der exakten Daten erhält man als Mittelwert x = 36, 3. Lösung L.2.5. xG = √ 4 1, 03 · 1, 04 · 1, 05 · 1, 06 = √ 4 1, 1922456 = 1, 044940 Lösung L.2.6. √ √ xG = 5 1, 25 · 0, 95 · 1, 15 · 0, 80 · 0, 85 = 5 0, 928625 = 0, 9853 . Dies entspricht einem durchschnittlichen jährlichen Verlust von 1,47%. Lösung L.2.7. √ √ q = 5 1, 10 · 0, 80 · 1, 15 · 1, 05 · 0, 90 = 5 0, 95634 = 0, 99111 Version 5.1 - 013 149 L.2. Univariate Daten Lösung L.2.8. v= 30 40 + 10 50 100 + 40 + 80 20 100 = 60, 61 Lösung L.2.9. v= 1 1 6 100 + 1 3 80 + 1 2 50 km = h 1 1 600 + 1 240 + 1 100 km = h 1 2+5+12 1200 km 1200 km km = = 63, 16 h 19 h h Lösung L.2.10. Für alle drei Verteilungen gilt für das arithmetische Mittel x = 10 und die Standardabweichung s = 2, 5298. Lösung L.2.11. Es wird eine Transformation durchgeführt. Das Merkmal X sei das Gewicht des Sacks, das Merkmal Y sei die Differenz des Gewichts zu 50 kg: Y = X - 50 kg. i 1 2 3 4 5 6 7 8 9 10 Σ xi yi |ȳ − yi | (ȳ − yi )2 50,2 0,2 0,03 0,0009 49,9 -0,1 0,27 0,0729 50,4 0,4 0,23 0,0529 49,8 -0,2 0,37 0,1369 50,2 0,2 0,03 0,0009 50,3 0,3 0,13 0,0169 50,7 0,7 0,53 0,2809 49,7 -0,3 0,47 0,2209 50,0 0,0 0,17 0,0289 50,5 0,5 0,33 0,1089 501,7 1,7 2,56 0,9210 yi2 0,04 0,01 0,16 0,04 0,04 0,09 0,49 0,09 0,00 0,25 1,21 Mittelwert: ȳ = 1,7 = 0,17; x̄ = ȳ + 50 = 50,17 10 Spannweite: wX = 50,7 - 49,7 = 1,0 = 0,256 mittlere absolute Abweichung: dX = 2,56 10 0,9210 1,21 2 Varianz = 10 = 0,0921 √ = 10 - 0, 17 Standardabweichung = 0, 0921 = 0,3035 Lösung L.2.12. Zur Vereinfachung: di = x̄ − xi 150 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben i 1 2 3 4 5 6 7 8 9 10 Σ xi 0 1 2 3 4 5 6 7 8 9 h(xi ) 3 7 6 14 15 12 7 9 5 3 81 xi h(xi ) 0 7 12 42 60 60 42 63 40 27 353 |di | |di |h(xi ) 4,36 13,07 3,36 23,51 2,36 14,15 1,36 19,01 0,36 5,37 0,64 7,70 1,64 11,49 2,64 23,78 3,64 18,21 4,64 13,93 150,22 d2i h(xi )d2i 18,99 56,98 11,28 78,93 5,56 33,36 1,84 25,82 0,13 1,92 0,41 4,95 2,70 18,87 6,98 62,82 13,26 66,32 21,55 64,64 414,62 x2i 0 1 4 9 16 25 36 49 64 81 h(xi )x2i 0 7 24 126 240 300 252 441 320 243 1953 = 4,36 arithmetisches Mittel: x̄ = 353 81 mittlere absolute Abweichung: dX = 150,22 = 1,85 81 414,62 1953 353 2 2 Varianz: sX = 81 = 5,12√= 81 − ( 81 ) Standardabweichung sX = 5, 12 = 2,26 Lösung L.2.13. Zur Vereinfachung: di = x̄ − xi i 1 2 3 4 5 6 7 8 Σ xi 1 2 3 4 5 6 7 8 f (xi ) 0,10 0,05 0,25 0,10 0,20 0,10 0,15 0,05 1,00 xi · f (xi ) 0,10 0,10 0,75 0,40 1,00 0,60 1,05 0,40 4,40 |di | |di | · f (xi ) 3,40 0,34 2,40 0,12 1,40 0,35 0,40 0,04 0,60 0,12 1,60 0,16 2,60 0,39 3,60 0,18 1,70 d2i f (xi ) · d2i 11,56 1,16 5,76 0,29 1,96 0,49 0,16 0,02 0,36 0,07 2,56 0,26 6,76 1,01 12,96 0,65 3,94 x2i f (xi ) · x2i 1 0,10 4 0,20 9 2,25 16 1,60 25 5,00 36 3,60 49 7,35 64 3,20 23,30 Mittelwert: 4, 40 mittlere absolute Abweichung: 1, 70 Varianz = 3, 94 = 23, 30√− 4, 402 Standardabweichung = 3, 94 = 1, 98 Lösung L.2.14. Mittelwert: 22, 7 mittlere absolute Abweichung: 1, 85 Varianz = 5, 36 Standardabweichung = 2, 32 Version 5.1 - 013 151 L.2. Univariate Daten Grafiken: Übung! Lösung L.2.15. (a) Die 14 Noten werden zuerst der Größe nach geordnet: 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5 und 5. Da es 14 Elemente gibt, ist der Median die Mitte des 7. und 8. Elements, also 2-3. Die 4-Quantile teilen die beiden 7-elementigen Hälften jeweils in zwei Teile zu jeweils 3 Teile. Die 4-Quantile sind somit das 4. Element (2), der Median (2-3) und das 11. Element (4). (b) Übung (c) x= 14 1 X 39 1+4+2+5+2+2+3+4+2+1+5+2+3+3 = = 2, 79 xi = 14 i=1 14 14 (d) 14 1 X 131 39 s = xi 2 − x2 = − 14 i=1 14 14 s √ 313 s = s2 = = 1, 26 196 2 2 = 313 = 1, 60 196 Lösung L.2.16. < doppelt > Lösung L.2.17. i, xi h(xi ) xi h(xi ) 1 5 5 6 12 2 3 8 24 12 48 4 5 11 55 6 10 60 7 7 49 5 40 8 Summe 64 293 x= x2i x2i h(xi ) 1 5 4 24 9 72 16 192 25 275 36 360 49 343 64 320 1591 8 293 1X xi h(xi ) = = 4, 58 n i=1 64 8 1X 1591 293 2 15975 xi 2 h(xi ) − x2 = −( ) = = 3, 90 n i=1 64 64 4096 s √ 15975 s = s2 = = 1, 97 4096 s2 = 152 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben Lösung L.2.18. √ √ 6 q = 6 1, 1 · 0, 8 · 1, 05 · 1, 15 · 0, 95 · 1, 1 = 1.110417 = 1, 0176 Lösung L.2.19. v = P3 1 f (vj ) j=1 vj = 1 1/4 7 + 2/5 6 + 7/20 5 = 1 181 1050 = 1050 = 5, 80 181 Seine Durchschnittsgeschwindigkeit beträgt 5,80 km/h. Version 5.1 - 013 153 L.3. Bivariate Daten L.3. Bivariate Daten Lösung L.3.1. Ermittlung der relativen Häufigkeiten des Merkmals Y bei fixiertem Merkmal X: Die relativen Häufigkeiten sind unterschiedlich, daher sind die Merkmale X und Y abhängig. x1 x2 x3 y1 0,20 0,25 0,55 y2 y3 0,30 0,50 0,35 0,40 0,35 0,10 1,00 1,00 1,00 Lösung L.3.2. Ermittlung der relativen Häufigkeiten von Y beziehungsweise X bei fixem X beziehungsweise Y : x1 x2 x3 y1 0,45 0,45 0,45 y2 y3 0,27 0,18 0,27 0,18 0,27 0,18 y4 0,09 0,09 0,09 1,00 1,00 1,00 x1 x2 x3 y1 0,57 0,29 0,14 1,00 y2 0,57 0,29 0,14 1,00 y3 0,57 0,29 0,14 1,00 y4 0,57 0,29 0,14 1,00 Die relativen Häufigkeiten von X beziehungsweise Y sind unabhängig davon, welches Merkmal von Y oder X fixiert wird. Daher sind die Merkmale X und Y unabhängig. Lösung L.3.3. y1 y2 y3 y4 x1 1 4 2 1 x2 5 20 10 5 x3 2 8 4 2 h(yk ) 8 32 16 8 h(xj ) 8 40 16 64 Lösung L.3.4. < doppelt > Lösung L.3.5. < doppelt > Lösung L.3.6. < doppelt > 154 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben Lösung L.3.7. i xi yi x2i 1 2 5 4 2 2 7 4 3 4 4 16 4 4 6 16 5 5 4,5 25 6 6 3 36 7 6 5 36 8 8 3 64 Σ 37 37,5 201 xi yi yi2 10 25 14 49 16 16 24 36 22,5 20,25 18 9 30 25 24 9 158,5 189,25 x̄ = 37 = 4, 625 8 201 2 sX = √8 - 4, 6252 = 3, 7344 sX = 3, 7344 = 1, 9325 = 4, 6875 ȳ = 37,5 8 189,25 2 sY = √ 8 - 4, 68752 = 1, 6836 sY = 1, 6836 = 1, 2975 sXY = rXY = 158,5 - 4, 625∗4, 6875 = 8 −1,8672 = −0.7447 1,9325·1,2975 −1, 8672 Regressionsgerade ŷ = a + bx Pn i=1 a= b= n x2i ni=1 yi − ni=1 xi ni=1 xi yi 201 · 37, 5 − 37 · 158, 5 = =7 Pn Pn 2 2 n i=1 xi − ( i=1 xi ) 8 · 201 − 372 P P P xi yi − ni=1 xi ni=1 yi 8 · 158, 5 − 37 · 37, 5 = = −0, 5 Pn Pn 2 2 n i=1 xi − ( i=1 xi ) 8 · 201 − 372 Pn i=1 P P Regressionsgerade ŷ = 7 − 0, 5 · x 6 HH r H HH H r r HH H HH H r r HH r H HH H r HH H HHr H HH - Lösung L.3.8. Version 5.1 - 013 155 L.3. Bivariate Daten yi \xj y1 y2 y3 Summe x1 x2 3 5 12 20 9 15 24 40 x3 x4 9 2 36 8 27 6 72 16 Summe 19 76 57 152 Lösung L.3.9. ŷ = 2, 4623 + 0, 7021 · x rXY = 0, 8318 Lösung L.3.10. ŷ = 5, 1176 + 0, 2353 · x rXY = 0, 5601 Lösung L.3.11. < doppelt > Lösung L.3.12. 6 x2i r yi2 i xi yi xi yi 1 0 0 0 0 0 2 1 1 1 1 1 3 2 4 4 8 16 4 3 9 9 27 81 5 4 16 16 64 256 Σ 10 30 30 100 354 Regressionsgerade ŷ = a + bx r 30 · 30 − 10 · 100 = −2 5 · 30 − 102 5 · 100 − 10 · 30 b= =4 5 · 30 − 102 a= r Regressionsgerade ŷ = −2 + 4 · x r r - 156 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben Lösung L.3.13. i xi yi x2i 1 1 3 1 2 2 4 4 3 3 7 9 4 5 6 25 5 4 6 16 6 6 5 36 7 7 9 49 8 8 8 64 Summe 36 48 204 x= xi y i 3 8 21 30 24 30 63 64 243 36 9 1X xi = = = 4, 5 n 8 2 yi2 9 16 49 36 36 25 81 64 316 y= 48 1X yi = =6 n 8 s2X = s2Y 1X 2 204 9 21 − ( )2 = = 5, 25 xi − x 2 = n 8 2 4 sX q 7 1X 2 316 2 2 yi − y = − 6 = = 3, 5 sY = = n 8 2 P 2P P P xi yi − xi xi yi P 2 P 2 204 · 48 − 36 · 243 n xi − ( xi ) 8 · 204 − 36 · 36 P P P n · xi y i − xi y i 8 · 243 − 36 · 48 2 = = b= P 2 P 2 n xi − ( xi ) 8 · 204 − 36 · 36 3 a= Die Regressionsgerade hat die Gleichung ŷ = 3, 11 + 0, 64 ∗ x. 1X 27 243 9 xi y i − x · y = − ·6= = 3, 38 n 8 2 8 sXY 3, 38 = = = 0, 79 sX sY 2, 29 · 1, 87 sXY = rXY Version 5.1 - 013 157 = L.3. Bivariate Daten Lösung L.3.14. Jahr ti xi 1997 1 4,7 1998 2 5,6 1999 3 6,2 2000 4 7,4 2001 5 7,6 2002 6 8,9 Summe 21 40,4 t2i ti xi 1 4,7 4 11,2 9 18,6 16 29,6 25 38,0 36 53,4 91 155,5 P 2P P P ti xi − ti ti xi P 2 P 2 91 ∗ 40, 4 − 21 ∗ 155, 5 = 3, 913 n ti − ( ti ) 6 ∗ 91 − 21 ∗ 21 P P P n ∗ ti xi − ti xi 6 ∗ 155, 5 − 21 ∗ 40, 4 = b= = 0, 806 P 2 P 2 n ti − ( ti ) 6 ∗ 91 − 21 ∗ 21 a= = Die Regressionsgerade hat die Gleichung x̂ = 3, 913 + 0, 806 ∗ ti . 2003: x̂ = 3, 913 + 0, 806 ∗ 7 = 9,555. 2004: x̂ = 3, 913 + 0, 806 ∗ 8 = 10,361. 2008: x̂ = 3, 913 + 0, 806 ∗ 12 =13,585 . 158 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben L.4. Zeitreihenanalysen Lösung L.4.1. t xt x3t 1 5 - 2 3 4 7 3 8 - 5 6 5 6 7 8 9 10 6 11 13 9 7 8 9 10 11 10 11 12 14 16 12 12 13 14 Lösung L.4.2. t xt x4t 1 3 - 2 4 - 3 6 - 4 1 3,5 5 7 4,5 6 8 5,5 7 10 6,5 8 5 7,5 9 11 8,5 10 12 9,5 11 14 10,5 12 9 11,5 Lösung L.4.3. < doppelt > Lösung L.4.4. < doppelt > Lösung L.4.5. Tag 0 1 2 3 Zugang 40 Abgang 10 5 Bestand 16 46 46 41 4 5 8 22 33 11 Durchschnittsbestand B̄ = 1 (16 10 mittlere Verweildauer d¯ = 2·22,9·10 68+60 Umschlagshäufigkeit U = Version 5.1 - 013 10 3,578 6 7 - 7 4 4 8 9 20 4 12 20 8 10 8 0 + 46 + 46 + · · · + 20 + 8) = = 458 128 60 76 229 10 = 22, 9 = 3, 578 = 2, 795 159 L.4. Zeitreihenanalysen 6 50 40 30 20 10 00 - 0 1 2 3 4 5 6 7 8 9 10 Lösung L.4.6. < doppelt > Lösung L.4.7. Jahr Umsatz U msatz 3 U msatz 4 1997 1998 4,7 5,6 - 1999 2000 6,2 7,4 5,5 6,4 6,0 2001 2002 7,6 8,9 7,1 8,0 6,7 7,5 Lösung L.4.8. 160 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben Sortiment Umsatz 2000 [Me] Kleidung 10,0 Körperpflege 5,5 Sportartikel 4,5 Summe 20,0 (a) Umsatzindex W2000,2010 = Umsatz 2010 [Me] 16,4 11,0 12,6 40,0 40,0 20,0 Plus Umsatz 2000-2010 64% 100% 180% Plus Preis 2000-2010 4% 17% 41% Plus Menge 2000-2010 57,7 % 70,9 % 98,6 % = 2. (b) L P2000,2010 P P2000,2010 10, 0 · 1, 04 + 5, 5 · 1, 17 + 4, 5 · 1, 41 pi,2010 qi,2000 = pi,2000 qi,2000 10, 0 · 1 + 5, 5 · 1 + 4, 5 · 1 23, 18 = 1, 159 = 20, 00 P pi,2010 qi,2010 16, 4 + 11, 0 + 12, 6 =P = 16,4 11,0 12,6 pi,2000 qi,2010 + 1,17 + 1,41 1,04 40, 00 = = 1, 173 34, 11 P =P (c) QL2000,2010 16,4 11,0 + 1,17 + 12,6 pi,2000 qi,2010 1,04 1,41 = P pi,2000 qi,2000 10, 0 · 1 + 5, 5 · 1 + 4, 5 · 1 34, 11 = 1, 705 20, 00 P pi,2010 qi,2010 16, 4 + 11, 0 + 12, 6 = P pi,2010 qi,2000 10, 0 · 1, 04 + 5, 5 · 1, 17 + 4, 5 · 1, 41 40, 00 = 1, 726 23, 18 P = = QP2000,2010 = = Es gilt P L · QP = P P · QL Version 5.1 - 013 161 L.4. Zeitreihenanalysen Lösung L.4.9. (a) L P2000,2004 L P2000,2008 P P2000,2004 P P2000,2008 P pi,2004 qi,2000 pi,2000 qi,2000 P pi,2008 qi,2000 =P pi,2000 qi,2000 P pi,2004 qi,2004 =P pi,2000 qi,2004 P pi,2008 qi,2008 =P pi,2000 qi,2008 =P 4 · 5 + 2 · 10 + 23 · 2 86 = = 1, 162 3, 2 · 5 + 1, 6 · 10 + 21, 0 · 2 74 4, 6 · 5 + 2, 4 · 10 + 24 · 2 95 = = = 1, 284 74 74 4 · 4, 5 + 2 · 12 + 23 · 1, 8 83, 4 = = = 1, 168 3, 2 · 4, 5 + 1, 6 · 12 + 21, 0 · 1, 8 71, 4 4, 6 · 5 + 2, 4 · 15 + 24 · 2, 2 111, 8 = = = 1, 297 3, 2 · 5 + 1, 6 · 15 + 21, 0 · 2, 2 86, 2 = (b) QL2000,2004 QL2000,2008 QP2000,2004 QP2000,2008 P pi,2000 qi,2004 pi,2000 qi,2000 P pi,2000 qi,2008 =P pi,2000 qi,2000 P pi,2004 qi,2004 =P pi,2004 qi,2000 P pi,2008 qi,2008 =P pi,2008 qi,2000 =P 71, 4 = 0, 965 74 86, 2 = 1, 165 = 74 83, 4 = = 0, 970 86 111, 8 = 1, 177 = 95 = (c) P pi,2004 qi,2004 83, 4 = 1, 127 = 74 pi,2000 qi,2000 P 111, 8 pi,2080 qi,2008 =P = = 1, 511 pi,2000 qi,2000 74 W2000,2004 = P W2000,2008 162 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben L.5. Kombinatorik Lösung L.5.1. n 1 2 3 4 n! 1 2 6 24 5 120 Lösung L.5.2. P (9; 3, 2, 2, 1, 1) = 9! = 15.120 3!2!2!1!1! Lösung L.5.3. 11! = 34.650 1! · 4! · 4! · 2! Lösung L.5.4. Auswahl der Buchstaben ist eine 2-Permutation ohne Wiederholung auf einer 26elementigen Menge. Die Auswahl der Ziffern ist eine 4-Permutation mit Wiederholung auf einer 10-elementigen Menge. P (26, 2) · P ∗ (10, 4) = 26 · 25 · 104 = 6.500.000 Lösung L.5.5. Eine Mehrheit kann durch 3, 4 oder 5 Personen gebildet werden. Es ist dann jeweils eine i-Kombination ohne Wiederholung über einer 5-stelligen Menge. Für die Gesamtanzahl ergibt sich somit ! ! ! 5 5 5 K(5, 3) + K(5, 4) + K(5, 5) = + + = 10 + 5 + 1 = 16 3 4 5 Lösung L.5.6. 8-Permutation mit Wiederholung über einer 2-elementigen Menge! P ∗ (2, 8) = 28 = 256 Lösung L.5.7. < doppelt > Lösung L.5.8. < doppelt > Lösung L.5.9. Wenn man mit i Würfeln würfelt, dann hat man eine i-Kombination mit Wiederholung über einer 6-stelligen Menge. 1 Würfel: ! ∗ Version 5.1 - 013 6 (6, 1) = =6 1 163 L.5. Kombinatorik 2 Würfel: ! 7 K (6, 2) = = 21 2 ∗ 3 Würfel: ! 8 K (6, 3) = = 56 3 ∗ 4 Würfel: ! 9 K (6, 4) = = 126 4 ∗ 5 Würfel: ! 10 K (6, 5) = = 252 5 ∗ 6 Würfel: ! 11 = 462 K (6, 6) = 6 ∗ Lösung L.5.10. Für die ersten drei Stellen ist es eine (geordnete) Permutation von 3 aus 26 Elementen ohne Zurücklegen. Für die hinteren 4 Stellen ist es eine (geordnete) Permutation von 4 aus 36 Elementen mit Zurücklegen. Anzahl der Möglichkeiten: P (26, 3) ∗ P ∗ (36, 4) = 26.202.009.600 ≈ 2.6 ∗ 1010 26! 364 23! = 26 ∗ 25 ∗ 24 ∗ 364 = Es sind 26.202.009.600 verschiedene Passwörter möglich. Lösung L.5.11. Es ist ein hypergeometrische Verteilung, da Zahlen ohne Zurücklegen gezogen werden. Die Parameter sind N = 45, da es insgesamt 45 Kugeln gibt, M = 6, da 6 Kugeln die Eigenschaft Gewinnzahl tragen und n = 6, da 6 Kugeln gezogen werden. Die Wahrscheinlichkeit für 5 Richtige ist damit H(5|45; 6; 6). Es gilt ! H(5|45; 6; 6) = 6 5 ! 45 − 6 6−5 ! 45 6 = 6 · 39 = 0, 0000287 8.145.060 Lösung L.5.12. Die Wahrscheinlichkeit 1-mal hintereinander die selbe Zahl zu würfeln ist 1. Die Wahrscheinlichkeit, 2-mal hintereinander die selbe Zahl zu würfeln ist gleich der 164 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben Wahrscheinlichkeit, dass man im 2. Wurf die Zahl vom 1. Wurf wieder würfelt, also 61 . Die Wahrscheinlichkeit n-mal hintereinander die selbe Zahl zu würfeln ist die Wahrscheinlichkeit, im 2., 3., . . ., (n-1). Wurf jeweils die Zahl vom 1. Wurf zu würfeln, also jeweils 61 . Somit beträgt die Wahrscheinlichkeit, n-mal hintereinander die selbe Zahl zu würfeln, somit ( 16 )n−1 . Lösung L.5.13. p(G3|B1) = p(B2|B1) ∗ p(G3|B1B2) + p(G2|B1) ∗ p(G3|B1G2) = 8 = 144 = 19 = 0,421 342 p(G3|G1) = p(B2|G1) ∗ p(G3|G1B2) + p(G2|G1) ∗ p(G3|G1G2) = 7 = 19 = 0,368 = 126 342 11 19 8 8 7 · 18 + 19 · 18 12 19 7 7 6 · 18 + 19 · 18 xi sei die Eigenschaft, dass im i. Zug die Farbe x (B blau oder G gelb) gezogen wird. Version 5.1 - 013 165 L.6. Grundlagen der Wahrscheinlichkeitsrechnung L.6. Grundlagen der Wahrscheinlichkeitsrechnung Lösung L.6.1. Lösung L.6.2. P (Kreuz und Ass) = 1/32 P (Kreuz oder Ass) = P (Kreuz) + P (Ass) − P (Kreuz und Ass) = 11/32 Lösung L.6.3. P (blau) = 70/200, P (ST ern) = 50/200, P (blau oder Stern) = 100/200 Lösung L.6.4. Beim würfeln mir zwei Würfeln ist nur die die Augensumme größer als zwölf, wenn zwei Sechser gewürfelt werden. Die Wahrscheinlichkeit hierfür ist 1/36. Die Wahrscheinlichkeit dafür höchstens die Augensumme elf zu haben ist damit das Komplement davon, also 35/36. Lösung L.6.5. parallel: 1 − (1 − 0, 9)3 = 0, 999 hintereinander: 0, 93 = 0, 729 Lösung L.6.6. parallel: 1 − (1 − p)n hintereinander: pn Lösung L.6.7. In der nachfolgenden Tabelle sind die verschiedenen Ergebnisse beim Würfeln mit zwei Würfeln aufgeführt. 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 5 6 6 7 7 8 8 9 9 10 10 11 6 7 8 9 10 11 12 In der nachfolgenden Tabelle sind die Wahrscheinlichkeiten für die einzelnen Summen aufgeführt. 166 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben Augen 2 3 4 5 6 7 8 9 10 11 12 Anzahl 1 2 3 4 5 6 5 4 3 2 1 36 P(Augen) 0,0278 0,0556 0,0833 0,1111 0,1389 0,1667 0,1389 0,1111 0,0833 0,0556 0,0278 1,0000 Lösung L.6.8. Es gibt insgesamt 216 (= 63 ) verschiedene Kombinationen für die Würfel. Augen 7 8 9 Kombinationen Anzahl 5-1-1 3 4-2-1 6 3-3-1 3 3-2-2 3 6-1-1 3 5-2-1 6 4-3-1 6 4-2-2 3 3-3-2 3 6-2-1 6 5-3-1 6 5-2-2 3 4-4-1 3 4-3-2 6 3-3-3 1 Gesamt P (Augen) 15 0,0694 21 0,0972 25 0,1157 0,2824 7-9 Die gesuchte Wahrscheinlichkeit ist 0,2824! Lösung L.6.9. 10 = 1000 = 0, 01 (a) P (H) = h(H) N h(E) 80 (b) P (E) = N = 1000 = 0, 08 (c) P (H ∪ E) = P (H) + P (E) = 0, 09 Version 5.1 - 013 167 L.6. Grundlagen der Wahrscheinlichkeitsrechnung Lösung L.6.10. blau gelb Stern 20 30 ohne 50 100 70 130 50 150 200 P(blau oder Stern) = P(blau) + P(Stern) - P (blau 50 20 70 + 200 - 200 = 0,5. und Stern) = 200 Lösung L.6.11. Wird im ersten Zug eine blaue Kugel gezogen, dann sind noch sechs blaue und sechs 6 = 0, 500. Wird im ersten Zug gelbe Kugeln in der Urne. Daher gilt P (G2|B1) = 12 eine gelbe Kugel gezogen, dann sind in der Urne noch sieben blaue und fünf gelbe 5 Kugeln enthalten. Daher gilt P (G2|G1) = 12 = 0, 417. Hierbei bedeuten: B1 = imersten. Zug wird eine blaue Kugel gezogen; G1 = im ersten Zug wird eine gelbe Kugel gezogen; G2 = im zweiten Zug wird eine Kugel gezogen. Lösung L.6.12. P(Maschine nicht okay) = P(A nicht okay oder B nicht okay oder C nicht okay) = P(nicht (A okay und B okay und C okay)) = 1 - P(A okay und B okay und C okay) = 1 - P(A okay) · P(B okay) · P(C okay) = 1 - (1 - P(A nicht okay)) · (1 - P(B nicht okay)) · (1 - P(C nicht okay)) = 1 - (1 - 0,3) · (1 - 0,2) · (1 - 0,1) = 1 - 0,7 · 0,8 · 0,9 = 1 - 0,504 = 0,496 168 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben L.7. Zufallsvariablen Lösung L.7.1. Es gelten E(X) = 2 · 0, 1 + 3 · 0, 4 + 5 · 0, 2 + 8 · 0, 1 + 9 · 0, 2 = 5 E(X 2 ) = 22 · 0, 1 + 32 · 0, 4 + 52 · 0, 2 + 82 · 0, 1 + 92 · 0, 2 = 31, 6 V AR(X) = E(X 2 ) − E(X)2 = 31, 6 − 52 = 6, 6 Lösung L.7.2. Für alle x ∈ R ist f (x) ≥ 0. Darüber hinaus gilt Z ∞ −∞ fX (x) dx = Z 4 0, 5x − 1 dx = 2 1 1 2 · x −x 2 2 4 = 0 − (−1) = 1 2 und somit ist fX (x) ist tatsächlich eine Dichtefunktion. Für x < 2 hat die Verteilungsfunktion FX (x) den Wert 0, für x ≥ 4 hat die Verteilungsfunktion den Wert 1. Für 2 ≤ x < 4 gilt FX (x) = Z x −∞ fX (x) dx = Z x 2 1 1 1 2 t − 1 dt = · t −t 2 2 2 x 2 1 = x2 − x + 1 . 4 Damit ergibt sich für die Verteilungsfunktion 0 1 FX (x) = 1 2 x 4 x<2 −x+1 2≤x<4 x≥4 Es gelten P (2, 5 ≤ x < 3, 5) = FX (3, 5) − FX (2, 5) = 0, 5625 − 0, 0625 = 0, 5 P (3, 5 ≤ x < 4, 5) = FX (4, 5) − FX (3, 5) = 1 − 0, 5625 = 0, 4375 Für den Erwartungswert gilt E(X) = Z 4 2 1 1 3 1 2 1 2 x − x dx = · x − x 2 2 3 2 4 2 8 2 10 = . = − − 3 3 3 Für die Berechnung der Standardabweichung wird zuerst die Varianz mit Hilfe der Formel V AR(X) = E(X 2 ) − E(X)2 berechnet. 1 3 1 1 4 1 3 E(X ) = x − x2 dx = · x − x 2 4 3 2 2 2 34 10 2 V AR(X) = − = und 3 3 9 s √ 2 2 σX = = = 0, 4714 . 9 3 2 Version 5.1 - 013 Z 4 4 2 32 2 34 = − − = , 3 3 3 169 L.7. Zufallsvariablen Lösung L.7.3. Z ∞ −∞ fX (x)dx = Z 0 0dx + Z 1 −∞ 3x2 dx + 0 Z ∞ 1 1 0dx = 0 + x3 + 0 = 1 0 Da dieses Integral den Wert 1 hat, und die Funktionswerte stets größer oder gleich 0 sind, ist fX eine Dichtefunktion. Es gilt FX (x) = Z x −∞ fX (ξ)dξ Damit ist für x < 0 beziehungsweise für x ≥ 1 die Verteilungsfunktion gleich 0 beziehungsweise 1. Sei 0 ≤ x < 1, dann gilt FX (x) = Z x 0 x fX (ξ)dξ = ξ 3 = x3 0 Damit ergibt sich für die Verteilungsfunktion: 0 FX (x) = x3 1 : x<0 : 0≤x<1 : 1≤x p(0, 2 ≤ X < 0, 4) = FX (0, 4) − FX (0, 2) = 0, 43 − 0, 23 = 0, 056 E(X) = Z ∞ −∞ Z∞ V AR(X) = −∞ xfX (x)dx = 2 Z 1 0 3 1 3 3x3 dx = x4 = 4 0 4 2 x fX (x)dx − E(X) = Z1 0 4 3x dx − 2 3 4 3 1 9 3 9 3 = − = = x5 − 5 0 16 5 16 80 Lösung L.7.4. Die Funktion fX (x) ist stets größer oder gleich 0. Z ∞ −∞ fX (x)dx = Z 2 1 2x − 2dx = (x2 − 2x)|21 = (4 − 4) − (1 − 2) = 1 Für 1 < x < 2 gilt: FX (x) = 170 Z x 1 2ξ − 2dξ = (ξ 2 − 2ξ)|x1 = (x2 − 2x) − (1 − 2) = (x − 1)2 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben 0 FX (x) = (x − 1)2 1 : x≤1 : 1<x≤2 : 2<x P (1, 2 ≤ X ≤ 1, 4) = FX (1, 4) − FX (1, 2) = 0, 42 − 0, 22 = 0, 16 − 0, 04 = 0, 12 Lösung L.7.5. E(Gewinn) = p(S) * 100 Euro + p(R) * 50 Euro + p(Schnee) * (-70 Euro) = 0,5 * 100 Euro + 0,3 * 50 Euro - 0,2 * 70 Euro = 51 Euro. Der Erwartungswert für den Gewinn beträgt 51 Euro. Lösung L.7.6. < doppelt > Version 5.1 - 013 171 L.8. Spezielle Verteilungen L.8. Spezielle Verteilungen Lösung L.8.1. ! n x B(x|n; Θ) = Θ (1 − Θ)n−x x x a) b) c) d) 0 1 2 3 0,4096 0,4096 0,1536 0,0256 0,6561 0,2916 0,0486 0,0036 0,90438 0,09135 0,00415 0,00011 0,36603 0,36973 0,18486 0,06100 4 0,0016 0,0001 0,00000 0,01494 Lösung L.8.2. P (x) = 1 5 x−1 ·( ) 6 6 P(1) = 0,16667 P(2) = 0,13889 P(3) = 0,11574 P(4) = 0,09645 P(5) = 0,08038 P(6) = 0,06698 P(7) = 0,05582 P(8) = 0,04651 P(9) = 0,03876 P(10) = 0,03230 P(20) = 0,00522 P(30) = 0,00084 P(40) = 0,00014 P(50) = 0,00002 Lösung L.8.3. µ = nΘ = 300 · 1 = 0, 6 500 und P s(x|0, 6) = 0, 6x −0,6 e x! P s(0|0, 6) = 0, 5488 P s(1|0, 6) = 0, 3293 P s(2|0, 6) = 0, 0988 (a) Die Wahrscheinlichkeit für genau 2 Fehler beträgt 0,0988. 172 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben (b) Die Wahrscheinlichkeit für mindestens 2 Fehler beträgt (1 - 0,5488 - 0,3293) = 0,1219. ist standardnormalverteilt. Es gelten Lösung L.8.4. Die Zufallsvariable Z = X−µ σ dann: (a) P (X ≥ 99, 8pF ) = P (Z ≥ −1) = P (Z ≤ 1) = 0, 84134 (b) P (X ≤ 100, 6pF ) = P (Z ≤ 3) = 0, 99865 (c) P (X ≥ 99, 7pF and X ≤ 100, 3pF ) = P (−1, 5 ≤ Z ≤ 1, 5) = P (Z ≤ 1, 5) − P (Z ≤ −1, 5) = 0, 86638 Lösung L.8.5. < doppelt > Lösung L.8.6. H(x|N ; M ; n) = M x ! N −M n−x ! N n ! N ist die Anzahl der Kugeln insgesamt; M ist die Anzahl der Kugeln mit der Eigenschaft Gewinnkugel und n ist die Anzahl der Zahlen, die man gewählt hat, um einen Gewinn zu erzielen. ! H(4|38; 7; 7) = H(5|38; 7; 7) = H(6|38; 7; 7) = H(7|38; 7; 7) = Version 5.1 - 013 7 4 ! 31 3 ! 38 7 ! ! 7 31 5 !2 38 7 ! ! 7 31 6 !1 38 7 ! ! 7 31 7 !0 38 7 = 35·4495 12620256 = 0, 01247 = 21·465 12620256 = 0, 00077 = 7·31 12620256 = 0, 000017195 = 1·1 12620256 = 0, 000000079238 173 L.8. Spezielle Verteilungen Lösung L.8.7. < doppelt > Lösung L.8.8. < doppelt > Lösung L.8.9. Die Zufallsvariable Z = X−µ ist standardnormalverteilt. Es gelten σ dann: (a) P (µ−σ ≤ X ≤ µ+σ) = P (−1 ≤ Z ≤ 1) = 0, 84134−(1−0, 84134) = 0, 68268 (b) P (µ − 2σ ≤ X ≤ µ + 2σ) = P (−2 ≤ Z ≤ 2) = 0, 97725 − (1 − 0, 97725) = 0, 95450 (c) P (µ − 3σ ≤ X ≤ µ + 3σ) = P (−3 ≤ Z ≤ 3) = 0, 99865 − (1 − 0, 99865) = 0, 99730 (d) P (X ≤ µ + 1, 5σ) = P (Z ≤ 1, 5) = 0, 93319 (e) P (µ − 0, 5σ ≤ X) = P (−0, 5 ≤ Z) = 0, 69146 Lösung L.8.10. (a) Die die Normalverteilung symmetrisch um den Erwartungswert ist, sollte der Sollwert in der Mitte des Toleranzbereiches liegen, also bei 0,1 mm. (b) Für die Maschine A gilt: 0, 118 − 0, 1 0, 082 − 0, 1 <Z< ) 0, 01 0, 01 = P (−1, 8 < Z < 1, 8) = 0, 96407 − (1 − 0, 96407) = 0, 92814 P (0, 082mm < X < 0, 118mm) = P ( Damit gilt für die Maschine A, dass die Wahrscheinlichkeit für eine brauchbare Folie bei 0,92814 liegt. Das heißt bei 1000 Folien sind 928 brauchbar, die Stückkosten sind dann 20Euro = 0,02155 Euro. 928 Für die Maschine B gilt: 0, 118 − 0, 1 0, 082 − 0, 1 <Z< ) 0, 018 0, 018 = P (−1 < Z < 1) = 0, 84134 − (1 − 0, 84134) = 0, 68268 P (0, 082mm < X < 0, 118mm) = P ( Damit gilt für die Maschine B, dass die Wahrscheinlichkeit für eine brauchbare Folie bei 0,68268 liegt. Das heißt bei 1000 Folien sind 683 brauchbar, die Stück= 0,02343 Euro. kosten sind dann 16Euro 683 Es ist daher günstiger, auf der Maschine A zu produzieren. Lösung L.8.11. Die Zufallsvariable X, der Anzahl der Studenten, welche die Klausur bestanden haben, ist binomialverteilt mit den Parametern n = 5 und θ = 0, 7. (Das Ereignis A (= Klausur wird bestanden) hat die Wahrscheinlichkeit 0,7.) Das heißt, die Anzahl der Studenten (von den 5 ausgewählten), die die Klausur bestehen ist eine B(n, θ)-verteilte Zufallsvariable. Die gesuchten Werte sind die Werte B(i|5; 0, 7) für i = 0, 1, 2, 3, 4 und 5. 174 Version 5.1 - 013 Anhang L. Lösungen der Aufgaben ! B(0|5; 0, 7) = B(1|5; 0, 7) = B(2|5; 0, 7) = B(3|5; 0, 7) = B(4|5; 0, 7) = B(5|5; 0, 7) = 5 · 0, 70 · 0, 35 0! 5 · 0, 71 · 0, 34 1! 5 · 0, 72 · 0, 33 2! 5 · 0, 73 · 0, 32 3! 5 · 0, 74 · 0, 31 4! 5 · 0, 75 · 0, 30 5 = 0, 00243 = 0, 02835 = 0, 13230 = 0, 30870 = 0, 36015 = 0, 16807 Lösung L.8.12. Man muss dann mehr als dreimal würfeln, wenn bei den ersten drei versuchen jeweils keine 6 gewürfelt wird. Diese Wahrscheinlichkeit ist gleich = 0,5787. ( 65 )3 = 125 216 Lösung L.8.13. Die Wahrscheinlichkeit ist poissonverteilt mit µ = 1, 6, also ist die Wahrscheinlichkeitsfunktion gegeben durch fX (x) = µx −µ e x! Die Wahrscheinlichkeit, dass in einer Minute i Fahrzeuge passieren ist somit gleich P s(i|1, 6). P s(0|1, 6) = P s(1|1, 6) = P s(2|1, 6) = P s(3|1, 6) = P s(4|1, 6) = P s(5|1, 6) = 1,60 −1,6 e 0! 1,61 −1,6 e 1! 1,62 −1,6 e 2! 1,63 −1,6 e 3! 1,64 −1,6 e 4! 1,65 −1,6 e 5! = 0, 2019 = 0, 3230 = 0, 2584 = 0, 1378 = 0, 0551 = 0, 0141 (a) p(mehr als 3 Fahrzeuge) = 1 - p(0 bis 3 Fahrzeuge) = 1 - P s(0|1, 6) - P s(1|1, 6) - P s(2|1, 6) - P s(3|1, 6) = 0,0789 Die Wahrscheinlichkeit, dass in einer Minute mehr als 3 Fahrzeuge vorbeifahren beträgt somit 7,89%. (b) Für poissonverteilte unabhängige Zufallsvariablen X und Y mit den Parametern µ und λ gilt, dass die Zufallsvariable Z = X + Y ebenfalls poissonverteilt ist, der Parameter von Z ist µ + λ. Das heißt die Wahrscheinlichkeit, dass in 5 Version 5.1 - 013 175 L.8. Spezielle Verteilungen Minuten i Fahrzeuge den Beobachtungspunkt passieren ist poissonverteilt mit dem Parameter µ = 8. P s(0|8) = P s(1|8) = P s(2|8) = P s(3|8) = P s(4|8) = P s(5|8) = 80 −8 e 0! 81 −8 e 1! 82 −8 e 2! 83 −8 e 3! 84 −8 e 4! 85 −8 e 5! = 0, 0003 = 0, 0027 = 0, 0107 = 0, 0286 = 0, 0573 = 0, 0916 p(weniger als 5 Fahrzeuge) = P s(0|8) + P s(1|8) + P s(2|8) + P s(3|8) + P s(4|8) + P s(5|8) = 0,1912. Die Wahrscheinlichkeit, dass in fünf Minuten höchstens 5 Fahrzeuge vorbeifahren beträgt 19,12%. Lösung L.8.14. Die Zufallsvariable X der erreichten Punktzahl ist N (60; 10)ist N (0; 1)-verteilt, das heißt standardnorverteilt. Die Zufallsvariable Z = X−60 10 malverteilt. ) = P (Z < −1) = P (Z > 1) = 1 − P (Z < 1) = (a) P (X < 50) = P (Z < 50−60 10 1 − 0, 84134 = 0, 15866, das heißt circa 16%. (b) P (80 < X < 95) = P ( 80−60 < Z < 95−60 ) = P (2 < Z < 3, 5) = P (Z < 3, 5) 10 10 P (Z < 2) = 0, 99977 - 0, 97725 = 0, 02252, das heißt circa 2,3%. ) = P (Z > 60−g ) = 0, 1 → P (Z < 60−g ) = 0, 9 → (c) P (X < g) = P (Z < g−60 10 10 10 60−g ) = 1, 285 → g = 47, 15, das heißt, die Mindestpunktzahl muss auf 47 Punkte 10 gesetzt werden. 176 Version 5.1 - 013 Literatur Arens, Tilo u. a. (2008). Mathematik. 1. Aufl. Heidelberg: Spektrum Akademischer Verlag. isbn: 9783827417589. Bosbach, Gerd und Jens Jürgen Korff (2011). Lügen mit Zahlen: Wie wir mit Statistiken manipuliert werden. 401. München: Heyne. isbn: 9783453173910. Eichholz, Wolfgang und Eberhard Vilkner (2002). Taschenbuch der Wirtschaftsmathematik: Mit 208 Beispielen und zahlreichen Tabellen. 3. Aufl. München [u.a.]: Fachbuchverl. Leipzig im Hanser-Verl. isbn: 9783446220805. Fahrmeir, Ludwig (2003a). Arbeitsbuch Statistik: Mit 101 Tabellen. 3. Aufl. Berlin [u.a.]: Springer. isbn: 9783540440307. – (2003b). Statistik: Der Weg zur Datenanalyse ; mit 25 Tabellen. 4. Aufl. Berlin [u.a.]: Springer. isbn: 9783540440000. Fischer, Gerd (2005). Stochastik einmal anders: Parallel geschrieben mit Beispielen und Fakten, vertieft durch Erläuterungen. 1. Aufl. Wiesbaden: Vieweg. isbn: 9783528039677. Henze, Norbert (2003). Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls. 4. Aufl. Braunschweig: Vieweg. isbn: 9783528368944. Rößler, Irene und Albrecht Ungerer (2011). Statistik für Wirtschaftswissenschaftler: Eine anwendungsorientierte Darstellung. 2., überarb. Aufl. BA Kompakt. Heidelberg [u.a.]: Physica-Verlag. isbn: 9783790826340. Schwarze, Jochen (1997). Grundlagen der Statistik. 6. Aufl. Herne [u.a.]: Verl. Neue Wirtschafts-Briefe. isbn: 3482568669. – (1999). Aufgabensammlung zur Statistik. 3. Aufl. Herne: Verl. Neue WirtschaftsBriefe. isbn: 9783482434532. – (2001). Beschreibende Verfahren. 9. Aufl. Herne [u.a.]: Verl. Neue WirtschaftsBriefe. isbn: 9783482564390. Wewel, Max-Christoph (2011). Statistik im Bachelor-Studium der BWL und VWL: Methoden, Anwendung, Interpretation ; mit herausnehmbarer Formelsammlung. 2., erw. Aufl. Wirtschaft. München und Boston [u.a.]: Pearson Studium. isbn: 9783868940541. Version 5.1 - 013 177