Reihenbezeichnung Franz W. Peren Formelsammlung Wirtschaftsstatistik Formelsammlung Wirtschaftsstatistik Franz W. Peren Formelsammlung Wirtschaftsstatistik Franz W. Peren Hochschule Bonn-Rhein-Sieg Sankt Augustin, Deutschland ISBN 978-3-642-41932-4 DOI 10.1007/978-3-642-41933-1 ISBN 978-3-642-41933-1 (eBook) Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Gabler © Springer-Verlag Berlin Heidelberg 2013 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Lektorat: Michael Bursik, Assistenz: Janina Sobolewski Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Springer Gabler ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer Science+Business Media www.springer-gabler.de Gewidmet Reinger Classen †. Ein unvergessener Freund. Vorwort Diese Formelsammlung dient vornehmlich allen Studierenden und wirtschaftswissenschaftlich Wertschöpfenden, gleichwohl denen der Betriebswirtschaftslehre oder der Volkswirtschaftslehre, den Wirtschaftsingenieuren oder den Wirtschaftspädagogen. Es gestaltet sich nach den Erfahrungen des Verfassers, der seine wirtschaftswissenschaftlichen Studien in 1981 an der Westfälischen Wilhelms-Universität zu Münster in Deutschland begann und als Professor der Betriebswirtschaftslehre die quantitativen Methoden bis dato lehrt und diese forschend in vielfältiger Art und Weise weiterentwickeln durfte vorwiegend in Deutschland an der Fachhochschule Bielefeld und der Hochschule Bonn-Rhein-Sieg, aber auch an der University of Victoria in Victoria, BC, Kanada, der Universitas Udayana in Denpasar, Bali, Indonesien, der Technická Univerzita v Košiciach in Košice, Slowakische Republik und der Columbia University in New York City, New York, USA. Es soll nach bestem Wissen und Gewissen des Verfassers die mathematischen Inhalte formelhaft wiedergeben, wie sie in den Wirtschaftswissenschaften global sowohl an den Universitäten und Hochschulen als auch in der wirtschaftswissenschaftlichen Praxis sinnvoll und notwendig sind. Dank schuldet der Verfasser vielen seiner wissenschaftlichen Mitarbeiter(innen), die an dieser Arbeit und an vielen anderen Projekten mit Kreativität, Wissen und Fleiß für ihn in den vergangenen mehr als 20 Jahren tätig waren. Allen voran danke ich Herrn Christian Stollfuß, der federführend diese Formelsammlung mit gestaltet hat. Besonderer Dank gebührt auch Shanti Alena Dewi, Verena Leisen, Markus Shakoor und Christina Pakusch. Für die vielen wertvollen Anregungen im Bereich der Wirtschaftsmathematik und Wirtschaftsstatistik danke ich besonders meinen geschätzten Kolleg(inn)en Friedrich Aumann und Dr. Andreas Grisar † von der Westfälischen WilhelmsUniversität Münster, Prof. Dr. Rüdiger Bücker † von der Fachhochschule Bielefeld, Prof. Dr. Félix Sekula † von der Technická Univerzita v Košiciach sowie Prof. Dr. Reiner Clement, Prof. Dr. Johannes Natrop, Prof. Dr. Oded Löwenbein † und Prof. Dr. Wiltrud Terlau von der Hochschule Bonn-Rhein-Sieg. Bonn, Oktober 2013 Franz W. Peren VII Inhaltsverzeichnis 1 Statistische Zeichen und Symbole ........................................ 1 2 Deskriptive Statistik................................................................ 2.1 Empirische Verteilungen .................................................. 2.1.1 Häufigkeiten.......................................................... 2.1.2 Summenhäufigkeiten ............................................ 2.2 Mittelwerte und Streuungsmaße ...................................... 2.2.1 Mittelwerte ............................................................ 2.2.2 Streuungsmaße .................................................... 2.3 Verhältnis- und Indexzahlen ............................................ 2.3.1 Verhältniszahlen ................................................... 2.3.2 Indexzahlen .......................................................... 2.4 Korrelationsanalyse ......................................................... 2.5 Regressionsanalyse ........................................................ 2.5.1 Lineare Einfachregression .................................... 2.5.2 Lineare Mehrfachregression ................................. 2.5.3 Lineare Zweifachregression.................................. 3 3 3 4 5 5 9 12 12 14 17 18 18 21 25 3 Induktive Statistik ................................................................... 3.1 Wahrscheinlichkeitsrechnung .......................................... 3.1.1 Grundbegriffe/Definitionen .................................... 3.1.2 Sätze der Wahrscheinlichkeitsrechnung ............... 3.2 Wahrscheinlichkeitsverteilungen ..................................... 3.2.1 Begriff der Zufallsvariablen ................................... 3.2.2 Wahrscheinlichkeits-, Verteilungs- und Dichtefunktion ....................................................... 3.2.3 Parameter für Wahrscheinlichkeitsverteilungen .... 3.3 Theoretische Verteilungen ............................................... 3.3.1 Diskrete Verteilungen ........................................... 3.3.2 Stetige Verteilungen ............................................. 3.4 Statistische Schätzverfahren (Konfidenzintervalle) .......... 3.5 Bestimmung des notwendigen Stichprobenumfangs ....... 3.6 Statistische Testverfahren ............................................... 3.6.1 Parametertests ..................................................... 3.6.2 Verteilungstests (Chi-Quadrat-Tests) ................... 27 27 27 28 30 30 30 32 33 33 35 39 42 42 42 45 Wahrscheinlichkeitsrechnung ............................................... 4.1 Begriffe und Definitionen ................................................. 4.2 Wahrscheinlichkeitsbegriffe ............................................. 4.2.1 Der klassische Wahrscheinlichkeitsbegriff ............ 4.2.2 Der statistische Wahrscheinlichkeitsbegriff........... 49 49 50 50 51 4 IX X Inhaltsverzeichnis 4.3 4.4 4.2.3 Der subjektive Wahrscheinlichkeitsbegriff............. 4.2.4 Axiome der Wahrscheinlichkeitsrechnung ............ Sätze der Wahrscheinlichkeitsrechnung .......................... 4.3.1 Der Satz der komplementären Ereignisse ............ 4.3.2 Der Multiplikationssatz bei Unabhängigkeit der Ereignisse ....................................................... 4.3.3 Der Additionssatz .................................................. 4.3.4 Die bedingte Wahrscheinlichkeit ........................... 4.3.5 Die stochastische Unabhängigkeit ........................ 4.3.6 Der Multiplikationssatz in allgemeiner Form ......... 4.3.7 Das Theorem der totalen Wahrscheinlichkeit ....... 4.3.8 Das Theorem von Bayes (Bayessche Regel) ....... 4.3.9 Übersicht der Wahrscheinlichkeitsberechnung von sich auschließenden und sich nicht ausschließenden Ereignissen ............................... Zufallsvariable.................................................................. 4.4.1 Der Begriff der Zufallsvariablen ............................ 4.4.2 Die Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen..................................................... 4.4.3 Die Verteilungsfunktion diskreter Zufallsvariablen 4.4.4 Wahrscheinlichkeitsdichte und Verteilungsfunktion stetiger Zufallsvariablen ........ 4.4.5 Erwartungswert und Varianz von Zufallsvariablen 51 51 52 52 53 54 56 56 57 57 58 61 62 62 62 63 63 68 Anhang .............................................................................................. Binomialverteilung – Wahrscheinlichkeitsfunktion ..................... Binomialverteilung – Verteilungsfunktion .................................. Hypergeometrische Verteilung – Wahrscheinlichkeitsfunktion .. Hypergeometrische Verteilung – Verteilungsfunktion ............... Poissonverteilung – Wahrscheinlichkeitsfunktion ...................... Poissonverteilung – Verteilungsfunktion ................................... Standardnormalverteilung – Wahrscheinlichkeitsdichte ............ Standardnormalverteilung – Verteilungsfunktion....................... Standardnormalverteilung – einseitige Flächenanteile .............. Standardnormalverteilung – zweiseitige, symmetrische Flächenanteile ................................................................. Chi-Quadrat-Verteilung ............................................................. Studentverteilung – zweiseitige, symmetrische Flächenanteile F-Verteilung mit α = 0,05........................................................... F-Verteilung mit α = 0,01........................................................... 73 74 86 98 105 112 115 118 124 130 Literaturverzeichnis ......................................................................... 141 131 132 134 137 139 1 Statistische Zeichen und Symbole Allgemein Zeichen/Symbole Bedeutung N Menge der ganzen Zahlen Q Menge der rationalen Zahlen R Menge der reellen Zahlen C Menge der komplexen Zahlen a≥b a ist größer oder gleich b a≈b a ist ungefähr gleich b n a i=1 i n ∏a i i=1 dy = f ′(x ) dx a1 + a 2 + . . . + a n a1 ⋅ a 2 ⋅ . . . ⋅ a n 1. Ableitung ∂y ∂x 1. partielle Ableitung Integral a Absolutbetrag von a lim f (x ) Grenzwert von f (x ) x→ a A′ sgn (x ) Transponierte der Matrix A Vorzeichen von x F.W. Peren, Formelsammlung Wirtschaftsstatistik, DOI 10.1007/978-3-642-41933-1_1, © Springer-Verlag Berlin Heidelberg 2013 1 2 1 Statistische Zeichen und Symbole Mengenlehre Symbole Bedeutung {a1 , a 2 , . . . , a n } {x B(x ) } Menge der Elemente a1, a 2 , ..., a n Menge aller x, für die B(x ) gilt ∅, auch { } leere Menge (enthält kein Element) a∈A a ist Element von A a∉A a ist nicht Element von A A =B A gleich B A ⊆ B , auch A ⊂ B A ist Teilmenge von B ⊂ A B ≠ A ist echte Teilmenge von B A ⊇ B , auch A ⊃ B A ist Obermenge von B A ∩B Schnittmenge von A und B A ∪B Vereinigungsmenge von A und B A \ B Differenzmenge von A und B A Komplementmenge von A A ×B Produktmenge von A und B Φ (A ) ² Potenzmenge von A {0, 1, 2, . . . } (früher ²0) 2 Deskriptive Statistik 2.1 Empirische Verteilungen 2.1.1 Häufigkeiten Die Häufigkeitsverteilung ist eine übersichtliche und sinnvolle Zusammenfassung, geordnet nach Häufigkeiten von Ergebnissen in Form von Tabellen, Grafiken und statistischen Messzahlen (z.B. Mittelwerte, Streuungsmaße). Existiert ein statistisches Merkmal in k verschiedenen Merkmalsausprägungen x 1 , x 2 ,..., x k , für die bei einer Grundgesamtheit von N Beobachtungen die absoluten Häufigkeiten, h i und 0 ≤ hi ≤ N mit h1 , h 2 , ..., h k k h i=1 =N i gegeben sind, so ergeben sich hieraus die entsprechenden relativen Häufigkeiten, fi f1 , f 2 ,..., fk mit 0 ≤ fi ≤ 1 k f und i =1 fi = Beispiel: hi N bzw. fi = i =1 hi . n Körpergröße von 100 Studenten i K-Gr. [cm] hi fi 1 2 3 4 5 unter 160 [160-170[ [170-180[ [180-190[ 190 ≤ - 9 28 35 24 4 100 0,09 0,28 0,35 0,24 0,04 1,0 F.W. Peren, Formelsammlung Wirtschaftsstatistik, DOI 10.1007/978-3-642-41933-1_2, © Springer-Verlag Berlin Heidelberg 2013 9 100 3 4 2 Deskriptive Statistik 2.1.2 Summenhäufigkeiten Durch fortlaufende Summierung (Kumulierung) der absoluten Häufigkeiten, h j , erhält man die absoluten Summenhäufigkeiten Hj . H j = h1 + h 2 + . . . + h j + . . . hi j = 1, ..., i i = h j j=1 Durch fortlaufende Summierung der relativen Häufigkeiten,f j , erhält man die relativen Summenhäufigkeiten Fi . Fj = f1 + f 2 + . . . + f j = j f i =1 = = j Hj j = 1, ..., j für Grundgesam theit N Hj für Stichprobe n Summenhäufigkeitsfunktion bei nicht-klassifizierten Daten 0 F(x ) = Fj 1 für x < x1 für x j ≤ x < x j +1 für x ≥ xk ( j = 1, . . ., k − 1) Beispiel: Anzahl der regelmäßig von Studenten gelesenen Zeitungen j xj hj fj Hj Fj 1 2 3 4 5 0 1 2 3 4 - 200 510 253 163 127 1253 0,160 0,407 0,202 0,130 0,101 1,0 200 710 963 1126 1253 - 0,160 0,567 0,769 0,899 1,0 - 2.2 Mittelwerte und Streuungsmaße 5 Summenhäufigkeitsfunktion bei klassifizierten Daten Die kumulierten (absoluten und/ oder relativen) Summenhäufigkeiten werden jeweils den Klassenenden zugeordnet. Beispiel: Körpergröße von 100 Studenten i Größe [cm] 1 2 3 4 5 unter 160 [160 – 170[ [170 – 180[ [180 – 190[ 190 ≤ - hj fj Hj Fj 9 28 35 24 4 100 0,09 0,28 0,35 0,24 0,04 1,0 9 37 72 96 100 - 0,09 0,37 0,72 0,96 1,0 - 2.2 Mittelwerte und Streuungsmaße 2.2.1 Mittelwerte Arithmetisches Mittel ( μ bzw. x ) Definition für die Grundgesamtheit, N, x 1 , x 2 , . . ., x N μ = 1 (x1 + . . . + x N ) = 1 N N N x i=1 i Definition für eine Stichprobe im Umfang von n x 1 , x 2 , . . ., x n x = 1 (x1 + . . . + x n ) = 1 N N n x . i=1 i 6 2 Deskriptive Statistik Häufigkeitsverteilungen • absolute Häufigkeitsverteilung μ = x = • k 1 N xh 1 n hx i=1 i k i i =1 i = 1 (h1x 1 + h 2 x 2 + . . . + hk x k ) N = 1 (h1x 1 + h 2 x 2 + . . . + hk x k ) n relative Häufigkeitsverteilung μ = k xf i i i =1 x = mit fi = hi N k fx i=1 • i i i bei Häufigkeitsverteilung klassifizierter Daten μ = 1 k x′i hi N i=1 = x ′i fi (in der Regel wählt man die Klassenmitten) Median (Me) Die Einzelwerte x 1 , x 2 , . . . , x N werden so geordnet, dass gilt: x [1] ≤ x [2] ≤ ... ≤ x [N] . x [ j] = das Element x an der j-ten Stelle Median bei ungeradem N: Me = x Median bei geradem N: Me = 1 2 N +1 2 x + x N N 2 +1 2 2.2 Mittelwerte und Streuungsmaße 7 Häufigkeitsverteilungen Bei nicht-klassifizierten Daten ist der Median gleich der Merkmalsausprägung x i , bei der die Summenhäufigkeitsfunktion, F(x ) , den Wert 0,5 überschreitet. Bei klassifizierten Daten berechnet sich der Median aus der Klassenuntergrenze x ui und der Klassenobergrenze x io derjenigen Klasse, in der die Summenhäufigkeitsfunktion, F(x), den Wert 0,5 überschreitet. ME = x ui + α α 0,5 − F x ui α = ( ) ME = x ui + = x io − x ui F x io − F x ui ( ) ( ) x io − x ui ⋅ 0,5 − F x ui o u F xi − F xi ( ) ( )( ( )) x io − x ui ⋅ 0,5 − F x ui o u F xi − F xi ( ) ( ) ( ( )) Modus (Mo) Der Modus ist als die häufigste Merkmalsausprägung definiert. Beispiel: regelmäßig gelesene Zeitung 0 Zeitungen 1 Zeitung 2 Zeitungen 3 Zeitungen 19 Personen 45 Personen 24 Personen 8 Personen Mo = 1 Zeitung, da 45 Personen die größte Häufigkeit bilden Bei klassifizierten Daten wird zunächst die Merkmalsklasse mit der größten Häufigkeitsdichte als Modalklasse ausgewählt. Als Modus wird dann die Mitte dieser Klasse festgelegt. 8 2 Deskriptive Statistik Geometrisches Mittel (G) Geometrische Mittel bei Einzelwerten: G = N x1 ⋅ x 2 ⋅ . . . ⋅ xN Geometrisches Mittel bei Häufigkeitsverteilung: G = N x 1h1 ⋅ x h22 ⋅ ... ⋅ x hkk Die nachfolgende Tabelle beschreibt, bei welchem Skalenniveau die Anwendung der entsprechenden Mittelwerte möglich ist. Mittelwert Modus Median Arithmetisches Mittel Geometrisches Mittel Harmonisches Mittel Nominalskala × Ordinalskala × × Skala Intervallskala × × × Verhältnisskala × × × × × Quelle: In Anlehnung an Bleymüller J. (2007), S.13 Harmonisches Mittel (H) • Die Dimension des betrachteten Merkmales entspricht einem Quotienten, • ggf. existieren starke Unterschiede in den Merkmalsausprägungen. H = Beispiel: n n 1 i =1 x i = n 1 1 1 + + ... + x1 x 2 xn Ein Auto fährt 12 km, davon a) 6km mit 6km/h und b) 6km mit 60 km/h Wie hoch ist die Durchschnittsgeschwindigkeit? 2.2 Mittelwerte und Streuungsmaße H = 2 1 6 km h 2 2 2 ⋅ 60 = = = 10,91km / h 10 1 11 11 + 60 60 60 = 1 + 60 km h 9 Anmerkung: Die Dimension des hier betrachteten Merkmals entspricht dem Quotienten km/h. 2.2.2 Streuungsmaße 2 Varianz σ / Standardabweichung σ Definition für die Grundgesamtheit N σ2 = σ= N 1 N (x i=1 − μ) = 2 i 1 N ( x i ²) − μ² N i=1 σ2 Definition für eine Stichprobe im Umfang von (n) x 1 , x 2 , . . ., x n s2 = s= 1 n n (x i=1 − x) = 2 i 1 n ( x i ²) − x ² n i=1 s2 bei Häufigkeitsverteilungen • bei absoluten Häufigkeitsverteilungen ( ) σ2 = 1 k 1 k 2 ( ) x − μ h = i xi2 hi − μ2 i N i =1 N i =1 s2 = k 1 k (xi − x )2 hi = 1 xi2 hi − x 2 n i =1 n i =1 ( ) 10 • 2 Deskriptive Statistik bei relativen Häufigkeitsverteilungen σ2 = k (x i=1 s2 = k (x i=1 − μ ) fi = − x ) fi = 2 i 2 i i=1 2 i (x f ) − μ k (x f ) − x k 2 i i=1 2 i 2 i Bei einer Häufigkeitsverteilung klassifizierter Daten ergeben sich Varianz/ Standardabweichung näherungsweise über die Klassenmitten x ′i . • bei absoluten Häufigkeitsverteilungen σ2 = s2 = • k 1 N (x' −μ ) h 1 n (x' −x ) h 2 i i=1 k 2 i i=1 i i = = 1 N 1 n k i=1 k i=1 (x' h ) − μ 2 i 2 i (x' h ) − x 2 i 2 i bei relativen Häufigkeitsverteilungen σ2 = k (x' f ) − μ fi = (x' f ) − x 2 i i=1 s2 = fi = (x' −μ ) k (x' −x ) 2 i i=1 k i=1 k i=1 2 i i 2 i i 2 2 Ist die Verteilung der Merkmalsausprägungen eingipflig (unimodal) und die Klassenbreiten Δx konstant, so führt die Sheppard-Korrektur zu einem besseren Näherungswert. σ 2 korr . =σ 2 2 ( Δx ) − 12 . Varianzkoeffizient (VC) VC = σ (⋅ 100%) μ bzw. VC = s x ( ⋅ 100 %) 2.2 Mittelwerte und Streuungsmaße 11 Spannweite (R) Werden die Einzelwerte x 1, x 2 , ..., x N der Größe nach angeordnet, sodass gilt: x [1] ≤ x [2] ≤ ... ≤ x [N] , dann ist: R = x [N] − x [1] bzw. R = x max . − x min . • bei klassifizierten Daten R = Klassenobergrenze der größten Klasse minus Klassenuntergrenze der kleinsten Klasse. Die folgende Tabelle gibt an, bei welchem Skalenniveau die Berechnung des entsprechenden Streuungsmaßes möglich ist. Skala Streuungsmaße Ordinalskala Intervallskala Verhältnisskala × × × Mittlere absolute Abweichung × × Varianz, Standardabweichung × × Spannweite Nominalskala Variationskoeffizient Quelle: In Anlehnung an Bleymüller J. (2007), S.17. × 12 2 Deskriptive Statistik 2.3 Verhältnis- und Indexzahlen 2.3.1 Verhältniszahlen Verhältniszahlen sind Kennzahlen, die als Quotient gebildet werden. Verhältniszahlen Vergleiche von Massen und Strukturen bei gleichem Zeitbezug (Querschnittsdaten) Gliederungszahlen Beschreibung eines zeitlichen Ablaufes (Zeitreihen) Beziehungszahlen Messzahlen und Indexzahlen Wachstumsraten und -faktoren (feste Basis) (variable Basis) Entsprechungszahlen Verursachungszahlen Quelle: Voß (2000), S. 209. Beispiel: Gliederungszahlen (z.B.: Quoten): Konsumquote = Konsum verfüg. Einkommen Beziehungszahlen: Output Input 1) Verursachungszahl: Produktivi tät = 2) Entsprechungszahl: Schuldenstandsquote = Schuldenstand Sozialprodukt