Formeln Deskriptive

Werbung
Prof. Dr. Waike Moos
FB Wirtschaft
Deskriptive Statistik
Die Formelsammlung darf bei der Klausur verwendet werden, sofern sie keine eigenen Anmerkungen enthält. Bunte Markierungen sind zulässig.
Symbolverzeichnis und Formelsammlung
X
xi
n
m
xj
fj
hj
Variable, Merkmal
Merkmalsausprägung, Beobachtungswert des i-ten Merkmalsträgers oder statistischen Elements, i=1,...,n
Stichprobenumfang
Anzahl der verschiedenen Merkmalsausprägungen
Jeder Merkmalsträger kann m verschiedene Merkmalsausprägungen haben,
j=1,...m. xj ist die j-te Merkmalsausprägung, Abzissenwert einer Häufigkeitsverteilung
absolute Häufigkeit der Merkmalsausprägung xj, auch absolute Klassenhäufigkeit,
Ordinatenwert einer Häufigkeitsverteilung,
relative Häufigkeit der Merkmalsausprägungen=
fj
n
, auch relative Klassenhäufig-
keit
fj
hj %
relative prozentuale Häufigkeit der Merkmalsausprägungen=
Fj
kumulierte absolute Häufigkeit der Merkmalsausprägungen= f 1 + f 2 + ... + f j
n
⋅ 100
j
Fj=f1+f2+...+fj , j=1,…,m, ... =
∑f
k
k =1
F j − F j −1 = f j
Hj
kumulierte relative Häufigkeit der Merkmalsausprägungen= h1 + h2 + ... + h j
j
Hj=h1+h2+...+hj , j=1,…,m, ... =
∑h
k
oder
k =1
Hj =
Fj
n
H j − H j −1 = h j
Hj %
kumulierte relative prozentuale Häufigkeit = ( h1 + h2 + ... + h j ) ⋅ 100
B
konstante Klassenbreite B =
Max − Min
m
Die m Klassen sind m Intervalle [mj-1/2⋅B;mj+1/2⋅B) (hier: links geschlossen,
rechts offen), mit mj die jeweilige Klassenmitte.
Verwendet man unterschiedliche Klassenbreiten Bj, dann dürfen im Histogramm
nicht mehr die Balkenhöhen den Klassenhäufigkeiten proportional sein, sondern
die Flächen. Dazu muss man die Klassenhäufigkeiten in „neue Balkenhöhen“ umrechnen.
Deskriptive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
x Mo
x ME
Modus, häufigster Wert
Median, Merkmalsausprägung des mittleren Merkmalsträgers
Fall: n ungerade: Bestimmung des Merkmals xi, das an der mittleren Position
n +1
steht.
2
Fall: n gerade: Die mittlere Positionsziffer ist keine ganze Zahl
1
xME= ( x n  + x n  )
2  2 
 2 +1


Berechnung des Medians bei klassierten Daten
Die Einfall- oder Medianklasse m ist die Klasse, in der der Merkmalsträger mit
der Positionsziffer
n
liegt1.
2
Zur Untergrenze der Medianklasse am ist eine Strecke d zu addieren, die sich aus
dem Strahlensatz bzw. einer linearen Interpolation ergibt:
n
− Fm−1
0,5n − Fm−1
2
d=
(bm − a m ) und xME=am+
(bm − am )
Fm − Fm−1
fm
Q1 und Q3: 1. und 3. Quartil
Q1 = am +
x
0,25 ⋅ n − Fm−1
0,75 ⋅ n − Fm−1
(bm − am ) bzw. Q3 = am +
(bm − am )
Fm − Fm−1
Fm − Fm−1
arithmetisches Mittel (AM) in einer Stichprobe, x =
Es gilt:
1 m
∑ xj f j
n j =1
x MO < x ME < x bei rechtsschiefen bzw. linkssteilen unimodalen Vertei-
lungen (rechtsschief heißt: rechts zu flach).
x < x ME < x MO bei linksschiefen bzw. rechtssteilen unimodalen Vertei-
lungen (linksschief heißt: links zu flach).
f 1 + f 2 + ... f m
f
f1 f 2
+
+ ... + m
x1 x 2
xm
HM
harmonisches Mittel, HM =
GM
geometrisches Mittel, GM = n x1 ⋅ x 2 ⋅ ... x n
Spannweite= Max-Min
1
Es wird hier nicht mehr nach geradem oder ungeradem Stichprobenumfang unterschieden.
Deskriptive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
ZQA
zentraler Quartilsabstand ZQA = Q3 − Q1
halber Quartilsabstand
Q3 − Q1
2
σ2
σ
Varianz in der Grundgesamtheit
Standardabweichung in der Grundgesamtheit
s2
Varianz in einer Stichprobe s 2 =
s
Standardabweichung in einer Stichprobe, s = s 2
s.e. =
s
n
s
sM =
VK
n
Standarderror, Standardfehler
Standardfehler des Mittelwertes
Variationskoeffizient =
Skewness:
1 m
1 m 2
2
2
oder
(
x
−
x
)
f
s
=
xi f i − x 2
∑
∑
i
i
n − 1 i =1
n − 1 i =1
s
100
|x|
Schiefe >0: linkssteil bzw. rechtsschief!
Schiefe = 0: symmetrische Verteilung
Schiefe <0 rechtssteil bzw. linksschief
Kurtosis:
Wölbung < 0: flacher gewölbt (als eine Normalverteilung mit denselben
Parametern)2
Wölbung = 0 identische Wölbung (wie eine Normalverteilung mit denselben Parametern)
Wölbung > 0: steiler gewölbt (als eine Normalverteilung mit denselben Parametern)
Absolute Konzentration der erste k Merkmalsträger
k
∑x
Ck =
i
i =1
n
∑x
k
= ∑ ai mit 0≤Ck≤1 mit xi=Merkmalsausprägung (hier: Umsatz)
i =1
i
i =1
des Merkmalsträgers i (hier: Unternehmen) und
ai=Anteil der Merkmalsausprägung des i-ten Merkmalsträgers an der Summe aller Merkmalsausprägungen,
Ck=Anteil der Summe der Merkmalsausprägungen der ersten k Merkmalsträger an der Summe aller Merkmalsausprägungen
2
Die Normalverteilung wird erst in der induktiven Statistik eingeführt. Die Gestalt der Normalverteilung mit den
Parametern Erwartungswert 0 und Streuung 1 (auch als Gauß-Kurve bezeichnet) war auf dem alten 10 DM-Schein
abgebildet.
Deskriptive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
Konzentrationsindex von Herfindahl
n
∑x
C Herfindahl =
2
i
i =1
 n 
 ∑ xi 
 i =1 
2
mit
1
≤ C Herfindahl ≤ 1
n
m
GK
Gini-Koeffizient, GK = 1 − ∑ h j ⋅ (Y j −1 + Y j ) mit Y j =kumulierter Anteil der Merkj =1
malsausprägungen und h j der relative Anteil der j-ten Merkmalsträger
n
n −1
LM
Lorenz-Münzner-Koeffizient: LM = GK
s xy
Kovarianz zweier Merkmale in einer Stichprobe, s xy =
sx
Wurzel aus der Varianz des Merkmals X einer Stichprobe, s x =
1 n
( xi − x ) 2
∑
n − 1 i =1
sy
Wurzel aus der Varianz des Merkmals Y einer Stichprobe, s y =
1 n
∑ ( yi − y ) 2
n − 1 i =1
1 n
∑ ( xi − x ) ⋅ ( y i − y )
n − 1 i =1
n
∑(x
r
Korrelationskoeffizient von Bravais-Pearson,
i
− x )( y i − y )
i =1
r=
n
∑(x
i
− x)
2
∑( y
i =1
r=
b
i =1
s xy
sx sy
Regressionskoeffizient (Steigung) bei der linearen Regression
n
∑(x
b=
i
− x )( y i − y )
oder
i =1
n
∑(x
i
b=
− x)2
s xy
s xx
i =1
n
n
i =1
i =1
∑ y i − b∑ xi
a
Ordinatenabschnitt bei der linearen Regression a =
R-squared
ŷ
ŷ i
 s



2
Bestimmtheitsmaß, r 2 =  xy 
sx s y
= a + bx geschätzte Regressionsgerade (Kurzform)
= a + bxi geschätzte Regressionsgerade
n
oder
n
i
− y)
2
Deskriptive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
Chi-Quadrat-Wert
χ2 = ∑
(beobachtete − erwartete) 2
erwartete
Kontingenzkoeffizient von Pearson
χ2
mit 0 ≤ P < 1
P=
χ2 + n
Zusammenhangmaß Cramers V:
V=
χ2
n ⋅ ( k − 1)
Messzahl
mit 0 ≤ V ≤ 1 mit k die kleinere Zahl von Zeilen und Spalten.
Messzahl =
Wert Berichtszeit
⋅ 100
Wert Basiszeit
Veränderung in Prozent zum Vorjahr:
Messzahl Jahr − MesszahlVorjahr
MesszahlVorjahr

 MesszahlJahr
=
− 1100 = Veränderung in Prozent
 Messzahl

Vorjahr


Differenz der Messzahlen: gibt die Änderung in Prozentpunkten an.
Umrechnung Prozentpunkt in Prozent:
Messzahl Jahr − MesszahlVorjahr
MesszahlVorjahr
100 =
Prozent − Punkt
100
MesszahlVorjahr
Wachstumsfaktor zum Vorjahr:
Wachstumsfaktor =
Wert Jahr
Messzahl Jahr
=
WertVorjahr MesszahlVorjahr
Mittelwert von Messzahlen:
Geometrisches Mittel der Wachstumsfaktoren-1
GM = n x1 ⋅ x2 ⋅ ...xn − 1 . Jährliches Durchschnittswachstum in Prozent
oder
n
Endwert
− 1.
Startwert
Teilmasse
⋅ 100
Gesamtmasse
Gliederungszahl
Gliederungszahl =
Beziehungszahl
ist ein Quotient von zwei verschiedenartigen Größen, die in einem
sachlogischen Zusammenhang stehen.
Verschuldungsgrad =
Fremdkapital
⋅ 100
Eigenkapital
Deskriptive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
Eigenkapitalrendite =
Einwohnerdichte =
Gewinn
⋅ 100
Eigenkapital
Zahl der Einwohner
⋅ 100
Fläche in km 2
Preisindex für Berichtsjahr i gegenüber Basisjahr 0.
p = Preis des Gutes j in der Basiszeit 0.
p1j = Preis des Gutes j in der Berichtszeit 1.
P0i
j
0
q0j = Menge des Gutes j in der Basiszeit 0.
q1j = Menge des Gutes j in der Berichtszeit 1.
j=Laufindex der Güter, i Jahreszahl des Berichtsjahres, 0=Basisjahr
Preismesszahl des Gutes j
p ij
w j mit wj das Gewicht des Gutes j.
p 0j
n
∑
Allgemein: Preisindex P0i =
j =1
pi j
wj
p0j
n
∑w
100
j
j =1
Laspeyres gewichtet die Preise mit dem Warenkorb des Basisjahres w j = p0j q0j in den verschiedenen Berichtsjahren.
n
∑pq
i
P0iLaspeyres =
0
j =1
100 =
n
∑p q
0
Summe aktueller Preis ⋅ alte Menge
100 , Preisindex von Laspeyres
Summe alter Preis ⋅ alte Menge
0
j =1
Differenz der Indexzahlen: Prozent-Punkte
Quotient der Indexzahlen-1: gibt relative Preisänderung direkt als Prozentzahl an
Paasche gewichtet die Preise mit dem Warenkorb des Berichtsjahres w j = p0j qij in den
verschiedenen Berichtsjahren.
Deskriptive Statistik
Prof. Dr. Waike Moos
FB Wirtschaft
n
∑pq
i
P0iPaasche =
i
j =1
100 =
n
∑p q
0
Summe aktueller Preis ⋅ aktuelle Menge
100 , Preisindex von Paasche
Summe alter Preis ⋅ aktuelle Menge
i
j =1
n
∑q p
i
U 0i =
i
j =1
100 =
n
∑q
0
p0
Summe aktuelle Umsätze
100 , Umsatzindex
Summe alte Umsätze
j =1
Umbasierung: Umrechnung einer Indexzahlenreihe von einem alten Basisjahr zu einem
neuen Basisjahr.
IndexNeueBasis;i =
IndexAlteBasis;i
IndexAlteBasis;NeueBasis
100
Preisbereinigung
Nominelle Wertgrößezum Zeitpunkt t = Mengezum Zeitpunkt t ⋅ Preiszum Zeitpunkt t
Reale Wertgrößezum Zeitpunkt t =⋅ Mengezum Zeitpunkt t ⋅ Preiszu einem anderen Zeitpunkt
Realer Wert =
nomineller Wert
100
Preisindex
Umsatzindex
100 = Mengenindex
Preisindex
Herunterladen