Franz W. Peren - Access IT Systems Ltd

Werbung
Reihenbezeichnung
Franz W. Peren
Formelsammlung
Wirtschaftsstatistik
Formelsammlung Wirtschaftsstatistik
Franz W. Peren
Formelsammlung
Wirtschaftsstatistik
Franz W. Peren
Hochschule Bonn-Rhein-Sieg
Sankt Augustin, Deutschland
ISBN 978-3-642-41932-4
DOI 10.1007/978-3-642-41933-1
ISBN 978-3-642-41933-1 (eBook)
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer Gabler
© Springer-Verlag Berlin Heidelberg 2013
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt
insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der
Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann
benutzt werden dürften.
Lektorat: Michael Bursik, Assistenz: Janina Sobolewski
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier.
Springer Gabler ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe Springer
Science+Business Media
www.springer-gabler.de
Gewidmet Reinger Classen †.
Ein unvergessener Freund.
Vorwort
Diese Formelsammlung dient vornehmlich allen Studierenden und wirtschaftswissenschaftlich Wertschöpfenden, gleichwohl denen der Betriebswirtschaftslehre oder der Volkswirtschaftslehre, den Wirtschaftsingenieuren oder den Wirtschaftspädagogen.
Es gestaltet sich nach den Erfahrungen des Verfassers, der seine wirtschaftswissenschaftlichen Studien in 1981 an der Westfälischen Wilhelms-Universität zu
Münster in Deutschland begann und als Professor der Betriebswirtschaftslehre
die quantitativen Methoden bis dato lehrt und diese forschend in vielfältiger Art
und Weise weiterentwickeln durfte vorwiegend in Deutschland an der Fachhochschule Bielefeld und der Hochschule Bonn-Rhein-Sieg, aber auch an der
University of Victoria in Victoria, BC, Kanada, der Universitas Udayana in
Denpasar, Bali, Indonesien, der Technická Univerzita v Košiciach in Košice,
Slowakische Republik und der Columbia University in New York City, New York,
USA. Es soll nach bestem Wissen und Gewissen des Verfassers die mathematischen Inhalte formelhaft wiedergeben, wie sie in den Wirtschaftswissenschaften global sowohl an den Universitäten und Hochschulen als auch in der
wirtschaftswissenschaftlichen Praxis sinnvoll und notwendig sind.
Dank schuldet der Verfasser vielen seiner wissenschaftlichen Mitarbeiter(innen),
die an dieser Arbeit und an vielen anderen Projekten mit Kreativität, Wissen und
Fleiß für ihn in den vergangenen mehr als 20 Jahren tätig waren. Allen voran
danke ich Herrn Christian Stollfuß, der federführend diese Formelsammlung mit
gestaltet hat. Besonderer Dank gebührt auch Shanti Alena Dewi, Verena Leisen,
Markus Shakoor und Christina Pakusch.
Für die vielen wertvollen Anregungen im Bereich der Wirtschaftsmathematik und
Wirtschaftsstatistik danke ich besonders meinen geschätzten Kolleg(inn)en
Friedrich Aumann und Dr. Andreas Grisar † von der Westfälischen WilhelmsUniversität Münster, Prof. Dr. Rüdiger Bücker † von der Fachhochschule Bielefeld, Prof. Dr. Félix Sekula † von der Technická Univerzita v Košiciach sowie
Prof. Dr. Reiner Clement, Prof. Dr. Johannes Natrop, Prof. Dr. Oded Löwenbein †
und Prof. Dr. Wiltrud Terlau von der Hochschule Bonn-Rhein-Sieg.
Bonn, Oktober 2013
Franz W. Peren
VII
Inhaltsverzeichnis
1
Statistische Zeichen und Symbole ........................................
1
2
Deskriptive Statistik................................................................
2.1 Empirische Verteilungen ..................................................
2.1.1 Häufigkeiten..........................................................
2.1.2 Summenhäufigkeiten ............................................
2.2 Mittelwerte und Streuungsmaße ......................................
2.2.1 Mittelwerte ............................................................
2.2.2 Streuungsmaße ....................................................
2.3 Verhältnis- und Indexzahlen ............................................
2.3.1 Verhältniszahlen ...................................................
2.3.2 Indexzahlen ..........................................................
2.4 Korrelationsanalyse .........................................................
2.5 Regressionsanalyse ........................................................
2.5.1 Lineare Einfachregression ....................................
2.5.2 Lineare Mehrfachregression .................................
2.5.3 Lineare Zweifachregression..................................
3
3
3
4
5
5
9
12
12
14
17
18
18
21
25
3
Induktive Statistik ...................................................................
3.1 Wahrscheinlichkeitsrechnung ..........................................
3.1.1 Grundbegriffe/Definitionen ....................................
3.1.2 Sätze der Wahrscheinlichkeitsrechnung ...............
3.2 Wahrscheinlichkeitsverteilungen .....................................
3.2.1 Begriff der Zufallsvariablen ...................................
3.2.2 Wahrscheinlichkeits-, Verteilungs- und
Dichtefunktion .......................................................
3.2.3 Parameter für Wahrscheinlichkeitsverteilungen ....
3.3 Theoretische Verteilungen ...............................................
3.3.1 Diskrete Verteilungen ...........................................
3.3.2 Stetige Verteilungen .............................................
3.4 Statistische Schätzverfahren (Konfidenzintervalle) ..........
3.5 Bestimmung des notwendigen Stichprobenumfangs .......
3.6 Statistische Testverfahren ...............................................
3.6.1 Parametertests .....................................................
3.6.2 Verteilungstests (Chi-Quadrat-Tests) ...................
27
27
27
28
30
30
30
32
33
33
35
39
42
42
42
45
Wahrscheinlichkeitsrechnung ...............................................
4.1 Begriffe und Definitionen .................................................
4.2 Wahrscheinlichkeitsbegriffe .............................................
4.2.1 Der klassische Wahrscheinlichkeitsbegriff ............
4.2.2 Der statistische Wahrscheinlichkeitsbegriff...........
49
49
50
50
51
4
IX
X
Inhaltsverzeichnis
4.3
4.4
4.2.3 Der subjektive Wahrscheinlichkeitsbegriff.............
4.2.4 Axiome der Wahrscheinlichkeitsrechnung ............
Sätze der Wahrscheinlichkeitsrechnung ..........................
4.3.1 Der Satz der komplementären Ereignisse ............
4.3.2 Der Multiplikationssatz bei Unabhängigkeit
der Ereignisse .......................................................
4.3.3 Der Additionssatz ..................................................
4.3.4 Die bedingte Wahrscheinlichkeit ...........................
4.3.5 Die stochastische Unabhängigkeit ........................
4.3.6 Der Multiplikationssatz in allgemeiner Form .........
4.3.7 Das Theorem der totalen Wahrscheinlichkeit .......
4.3.8 Das Theorem von Bayes (Bayessche Regel) .......
4.3.9 Übersicht der Wahrscheinlichkeitsberechnung
von sich auschließenden und sich nicht
ausschließenden Ereignissen ...............................
Zufallsvariable..................................................................
4.4.1 Der Begriff der Zufallsvariablen ............................
4.4.2 Die Wahrscheinlichkeitsfunktion diskreter
Zufallsvariablen.....................................................
4.4.3 Die Verteilungsfunktion diskreter Zufallsvariablen
4.4.4 Wahrscheinlichkeitsdichte und
Verteilungsfunktion stetiger Zufallsvariablen ........
4.4.5 Erwartungswert und Varianz von Zufallsvariablen
51
51
52
52
53
54
56
56
57
57
58
61
62
62
62
63
63
68
Anhang ..............................................................................................
Binomialverteilung – Wahrscheinlichkeitsfunktion .....................
Binomialverteilung – Verteilungsfunktion ..................................
Hypergeometrische Verteilung – Wahrscheinlichkeitsfunktion ..
Hypergeometrische Verteilung – Verteilungsfunktion ...............
Poissonverteilung – Wahrscheinlichkeitsfunktion ......................
Poissonverteilung – Verteilungsfunktion ...................................
Standardnormalverteilung – Wahrscheinlichkeitsdichte ............
Standardnormalverteilung – Verteilungsfunktion.......................
Standardnormalverteilung – einseitige Flächenanteile ..............
Standardnormalverteilung – zweiseitige, symmetrische
Flächenanteile .................................................................
Chi-Quadrat-Verteilung .............................................................
Studentverteilung – zweiseitige, symmetrische Flächenanteile
F-Verteilung mit α = 0,05...........................................................
F-Verteilung mit α = 0,01...........................................................
73
74
86
98
105
112
115
118
124
130
Literaturverzeichnis .........................................................................
141
131
132
134
137
139
1 Statistische Zeichen und Symbole
Allgemein
Zeichen/Symbole
Bedeutung
N
Menge der ganzen Zahlen
Q
Menge der rationalen Zahlen
R
Menge der reellen Zahlen
C
Menge der komplexen Zahlen
a≥b
a ist größer oder gleich b
a≈b
a ist ungefähr gleich b
n
a
i=1
i
n
∏a
i
i=1
dy
= f ′(x )
dx
a1 + a 2 + . . . + a n
a1 ⋅ a 2 ⋅ . . . ⋅ a n
1. Ableitung
∂y
∂x
1. partielle Ableitung

Integral
a
Absolutbetrag von a
lim f (x )
Grenzwert von f (x )
x→ a
A′
sgn (x )
Transponierte der Matrix A
Vorzeichen von x
F.W. Peren, Formelsammlung Wirtschaftsstatistik,
DOI 10.1007/978-3-642-41933-1_1, © Springer-Verlag Berlin Heidelberg 2013
1
2
1 Statistische Zeichen und Symbole
Mengenlehre
Symbole
Bedeutung
{a1 , a 2 , . . . , a n }
{x B(x ) }
Menge der Elemente a1, a 2 , ..., a n
Menge aller x, für die B(x ) gilt
∅, auch { }
leere Menge (enthält kein Element)
a∈A
a ist Element von A
a∉A
a ist nicht Element von A
A =B
A gleich B
A ⊆ B , auch A ⊂ B
A ist Teilmenge von B
⊂
A B
≠
A ist echte Teilmenge von B
A ⊇ B , auch A ⊃ B
A ist Obermenge von B
A ∩B
Schnittmenge von A und B
A ∪B
Vereinigungsmenge von A und B
A \ B
Differenzmenge von A und B
A
Komplementmenge von A
A ×B
Produktmenge von A und B
Φ (A )
²
Potenzmenge von A
{0, 1, 2, . . . }
(früher ²0)
2 Deskriptive Statistik
2.1 Empirische Verteilungen
2.1.1 Häufigkeiten
Die Häufigkeitsverteilung ist eine übersichtliche und sinnvolle Zusammenfassung, geordnet nach Häufigkeiten von Ergebnissen in Form von Tabellen, Grafiken und statistischen Messzahlen (z.B. Mittelwerte, Streuungsmaße).
Existiert ein statistisches Merkmal in k verschiedenen Merkmalsausprägungen x 1 , x 2 ,..., x k , für die bei einer Grundgesamtheit von N Beobachtungen die
absoluten Häufigkeiten, h i
und
0 ≤ hi ≤ N
mit
h1 , h 2 , ..., h k
k
h
i=1
=N
i
gegeben sind, so ergeben sich hieraus die entsprechenden
relativen Häufigkeiten, fi f1 , f 2 ,..., fk
mit
0 ≤ fi ≤ 1
k
f
und
i =1
fi =
Beispiel:
hi
N
bzw.
fi =
i
=1
hi
.
n
Körpergröße von 100 Studenten
i
K-Gr. [cm]
hi
fi
1
2
3
4
5

unter 160
[160-170[
[170-180[
[180-190[
190 ≤
-
9
28
35
24
4
100
0,09
0,28
0,35
0,24
0,04
1,0
F.W. Peren, Formelsammlung Wirtschaftsstatistik,
DOI 10.1007/978-3-642-41933-1_2, © Springer-Verlag Berlin Heidelberg 2013
9
100
3
4
2 Deskriptive Statistik
2.1.2 Summenhäufigkeiten
Durch fortlaufende Summierung (Kumulierung) der absoluten Häufigkeiten, h j , erhält man die absoluten Summenhäufigkeiten Hj .
H j = h1 + h 2 + . . . + h j + . . . hi
j = 1, ..., i
i
= h j
j=1
Durch fortlaufende Summierung der relativen Häufigkeiten,f j , erhält man
die relativen Summenhäufigkeiten Fi .
Fj = f1 + f 2 + . . . + f j
=
j
f
i =1
=
=
j
Hj
j = 1, ..., j
 für Grundgesam theit
N
Hj
 für Stichprobe
n
Summenhäufigkeitsfunktion bei nicht-klassifizierten Daten
0

F(x ) = Fj

1
für
x < x1
für
x j ≤ x < x j +1
für
x ≥ xk
( j = 1, . . ., k − 1)
Beispiel: Anzahl der regelmäßig von Studenten gelesenen Zeitungen
j
xj
hj
fj
Hj
Fj
1
2
3
4
5

0
1
2
3
4
-
200
510
253
163
127
1253
0,160
0,407
0,202
0,130
0,101
1,0
200
710
963
1126
1253
-
0,160
0,567
0,769
0,899
1,0
-
2.2 Mittelwerte und Streuungsmaße
5
Summenhäufigkeitsfunktion bei klassifizierten Daten
Die kumulierten (absoluten und/ oder relativen) Summenhäufigkeiten werden jeweils den Klassenenden zugeordnet.
Beispiel: Körpergröße von 100 Studenten
i
Größe [cm]
1
2
3
4
5

unter 160
[160 – 170[
[170 – 180[
[180 – 190[
190 ≤
-
hj
fj
Hj
Fj
9
28
35
24
4
100
0,09
0,28
0,35
0,24
0,04
1,0
9
37
72
96
100
-
0,09
0,37
0,72
0,96
1,0
-
2.2 Mittelwerte und Streuungsmaße
2.2.1 Mittelwerte
Arithmetisches Mittel ( μ bzw. x )
Definition für die Grundgesamtheit, N, x 1 , x 2 , . . ., x N
μ =
1
(x1 + . . . + x N ) = 1
N
N
N
x
i=1
i
Definition für eine Stichprobe im Umfang von n x 1 , x 2 , . . ., x n
x =
1
(x1 + . . . + x n ) = 1
N
N
n
x .
i=1
i
6
2 Deskriptive Statistik
Häufigkeitsverteilungen
•
absolute Häufigkeitsverteilung
μ =
x =
•
k
1
N
xh
1
n
hx
i=1
i
k
i
i =1
i
=
1
(h1x 1 + h 2 x 2 + . . . + hk x k )
N
=
1
(h1x 1 + h 2 x 2 + . . . + hk x k )
n
relative Häufigkeitsverteilung
μ =
k
xf
i i
i =1
x =
mit
fi =
hi
N
k
 fx
i=1
•
i
i
i
bei Häufigkeitsverteilung klassifizierter Daten
μ =
1 k
 x′i hi
N i=1
=  x ′i fi
(in der Regel wählt man die Klassenmitten)
Median (Me)
Die Einzelwerte x 1 , x 2 , . . . , x N werden so geordnet, dass gilt:
x [1] ≤ x [2] ≤ ... ≤ x [N] .
x [ j] = das Element x
an der j-ten Stelle
Median bei ungeradem N:
Me = x
Median bei geradem N:
Me =
1
2
 N +1 


 2 


x
+ x N  
N
  
 2 +1 

 
 2
2.2 Mittelwerte und Streuungsmaße
7
Häufigkeitsverteilungen
Bei nicht-klassifizierten Daten ist der Median gleich der Merkmalsausprägung x i , bei der die Summenhäufigkeitsfunktion, F(x ) , den Wert 0,5 überschreitet.
Bei klassifizierten Daten berechnet sich der Median aus der Klassenuntergrenze x ui und der Klassenobergrenze x io derjenigen Klasse, in der die
Summenhäufigkeitsfunktion, F(x), den Wert 0,5 überschreitet.
ME = x ui + α

α
0,5 − F x ui

α =
( )
ME = x ui +
=
x io − x ui
F x io − F x ui
( ) ( )
x io − x ui
⋅ 0,5 − F x ui
o
u
F xi − F xi
( ) ( )(
( ))
x io − x ui
⋅ 0,5 − F x ui
o
u
F xi − F xi
( ) ( ) (
( ))
Modus (Mo)
Der Modus ist als die häufigste Merkmalsausprägung definiert.
Beispiel:
regelmäßig gelesene Zeitung
0 Zeitungen
1 Zeitung
2 Zeitungen
3 Zeitungen




19 Personen
45 Personen
24 Personen
8 Personen
 Mo = 1 Zeitung, da 45 Personen die größte Häufigkeit
bilden
Bei klassifizierten Daten wird zunächst die Merkmalsklasse mit der größten Häufigkeitsdichte als Modalklasse ausgewählt. Als Modus wird dann
die Mitte dieser Klasse festgelegt.
8
2 Deskriptive Statistik
Geometrisches Mittel (G)
Geometrische Mittel bei Einzelwerten:
G = N x1 ⋅ x 2 ⋅ . . . ⋅ xN
Geometrisches Mittel bei Häufigkeitsverteilung:
G = N x 1h1 ⋅ x h22 ⋅ ... ⋅ x hkk
Die nachfolgende Tabelle beschreibt, bei welchem Skalenniveau die Anwendung der entsprechenden Mittelwerte möglich ist.
Mittelwert
Modus
Median
Arithmetisches Mittel
Geometrisches Mittel
Harmonisches Mittel
Nominalskala
×
Ordinalskala
×
×
Skala
Intervallskala
×
×
×
Verhältnisskala
×
×
×
×
×
Quelle: In Anlehnung an Bleymüller J. (2007), S.13
Harmonisches Mittel (H)
• Die Dimension des betrachteten Merkmales entspricht einem Quotienten,
• ggf. existieren starke Unterschiede in den Merkmalsausprägungen.
H =
Beispiel:
n
n
1

i =1 x i
=
n
1
1
1
+
+ ... +
x1 x 2
xn
Ein Auto fährt 12 km, davon a) 6km mit 6km/h und
b) 6km mit 60 km/h
Wie hoch ist die Durchschnittsgeschwindigkeit?
2.2 Mittelwerte und Streuungsmaße
H =
2
1
6 km
h
2
2
2 ⋅ 60
=
=
= 10,91km / h
10
1
11
11
+
60
60
60
=
1
+
60 km
h
9
Anmerkung: Die Dimension des hier betrachteten Merkmals entspricht dem Quotienten km/h.
2.2.2 Streuungsmaße
2
Varianz σ / Standardabweichung σ
Definition für die Grundgesamtheit N
σ2 =
σ=
N
1
N
 (x
i=1
− μ) =
2
i
1 N
 ( x i ²) − μ²
N i=1
σ2
Definition für eine Stichprobe im Umfang von (n) x 1 , x 2 , . . ., x n
s2 =
s=
1
n
n
 (x
i=1
− x) =
2
i
1 n
 ( x i ²) − x ²
n i=1
s2
bei Häufigkeitsverteilungen
• bei absoluten Häufigkeitsverteilungen
(
)
σ2 =
1 k
1 k
2
(
)
x
−
μ
h
=
 i
 xi2 hi − μ2
i
N i =1
N i =1
s2 =
k
1 k
(xi − x )2 hi = 1  xi2 hi − x 2

n i =1
n i =1
(
)
10
•
2 Deskriptive Statistik
bei relativen Häufigkeitsverteilungen
σ2 =
k
 (x
i=1
s2 =
k
 (x
i=1
− μ ) fi
=
− x ) fi
=
2
i
2
i
i=1
2
i
(x f ) − μ
k

(x f ) − x
k

2
i
i=1
2
i
2
i
Bei einer Häufigkeitsverteilung klassifizierter Daten ergeben sich Varianz/
Standardabweichung näherungsweise über die Klassenmitten x ′i .
• bei absoluten Häufigkeitsverteilungen
σ2 =
s2 =
•
k
1
N
 (x' −μ ) h
1
n
 (x' −x ) h
2
i
i=1
k
2
i
i=1
i
i
=
=
1
N
1
n
k

i=1
k

i=1
(x' h ) − μ
2
i
2
i
(x' h ) − x
2
i
2
i
bei relativen Häufigkeitsverteilungen
σ2 =
k
 (x' f ) − μ
fi =
 (x' f ) − x
2
i
i=1
s2 =
fi =
 (x' −μ )
k
 (x' −x )
2
i
i=1
k
i=1
k
i=1
2
i i
2
i i
2
2
Ist die Verteilung der Merkmalsausprägungen eingipflig (unimodal) und die
Klassenbreiten Δx konstant, so führt die Sheppard-Korrektur zu einem
besseren Näherungswert.
σ
2
korr .
=σ
2
2
(
Δx )
−
12
.
Varianzkoeffizient (VC)
VC =
σ
(⋅ 100%)
μ
bzw.
VC =
s
x
( ⋅ 100 %)
2.2 Mittelwerte und Streuungsmaße
11
Spannweite (R)
Werden die Einzelwerte x 1, x 2 , ..., x N der Größe nach angeordnet, sodass
gilt:
x [1] ≤ x [2] ≤ ... ≤ x [N] ,
dann ist:
R = x [N] − x [1]
bzw.
R = x max . − x min .
•
bei klassifizierten Daten
R = Klassenobergrenze der größten Klasse minus Klassenuntergrenze
der kleinsten Klasse.
Die folgende Tabelle gibt an, bei welchem Skalenniveau die Berechnung
des entsprechenden Streuungsmaßes möglich ist.
Skala
Streuungsmaße
Ordinalskala
Intervallskala
Verhältnisskala
×
×
×
Mittlere absolute
Abweichung
×
×
Varianz, Standardabweichung
×
×
Spannweite
Nominalskala
Variationskoeffizient
Quelle: In Anlehnung an Bleymüller J. (2007), S.17.
×
12
2 Deskriptive Statistik
2.3 Verhältnis- und Indexzahlen
2.3.1 Verhältniszahlen
Verhältniszahlen sind Kennzahlen, die als Quotient gebildet werden.
Verhältniszahlen
Vergleiche von Massen und
Strukturen bei gleichem
Zeitbezug
(Querschnittsdaten)
Gliederungszahlen
Beschreibung eines
zeitlichen Ablaufes
(Zeitreihen)
Beziehungszahlen
Messzahlen
und Indexzahlen
Wachstumsraten und
-faktoren
(feste Basis)
(variable
Basis)
Entsprechungszahlen
Verursachungszahlen
Quelle: Voß (2000), S. 209.
Beispiel:
Gliederungszahlen (z.B.: Quoten): Konsumquote =
Konsum
verfüg. Einkommen
Beziehungszahlen:
Output
Input
1) Verursachungszahl:
Produktivi tät =
2) Entsprechungszahl:
Schuldenstandsquote =
Schuldenstand
Sozialprodukt
Zugehörige Unterlagen
Herunterladen