Prof. Dr. Waike Moos FB Wirtschaft Deskriptive Statistik Die Formelsammlung darf bei der Klausur verwendet werden, sofern sie keine eigenen Anmerkungen enthält. Bunte Markierungen sind zulässig. Symbolverzeichnis und Formelsammlung X xi n m xj fj hj Variable, Merkmal Merkmalsausprägung, Beobachtungswert des i-ten Merkmalsträgers oder statistischen Elements, i=1,...,n Stichprobenumfang Anzahl der verschiedenen Merkmalsausprägungen Jeder Merkmalsträger kann m verschiedene Merkmalsausprägungen haben, j=1,...m. xj ist die j-te Merkmalsausprägung, Abzissenwert einer Häufigkeitsverteilung absolute Häufigkeit der Merkmalsausprägung xj, auch absolute Klassenhäufigkeit, Ordinatenwert einer Häufigkeitsverteilung, relative Häufigkeit der Merkmalsausprägungen= fj n , auch relative Klassenhäufig- keit fj hj % relative prozentuale Häufigkeit der Merkmalsausprägungen= Fj kumulierte absolute Häufigkeit der Merkmalsausprägungen= f 1 + f 2 + ... + f j n ⋅ 100 j Fj=f1+f2+...+fj , j=1,…,m, ... = ∑f k k =1 F j − F j −1 = f j Hj kumulierte relative Häufigkeit der Merkmalsausprägungen= h1 + h2 + ... + h j j Hj=h1+h2+...+hj , j=1,…,m, ... = ∑h k oder k =1 Hj = Fj n H j − H j −1 = h j Hj % kumulierte relative prozentuale Häufigkeit = ( h1 + h2 + ... + h j ) ⋅ 100 B konstante Klassenbreite B = Max − Min m Die m Klassen sind m Intervalle [mj-1/2⋅B;mj+1/2⋅B) (hier: links geschlossen, rechts offen), mit mj die jeweilige Klassenmitte. Verwendet man unterschiedliche Klassenbreiten Bj, dann dürfen im Histogramm nicht mehr die Balkenhöhen den Klassenhäufigkeiten proportional sein, sondern die Flächen. Dazu muss man die Klassenhäufigkeiten in „neue Balkenhöhen“ umrechnen. Deskriptive Statistik Prof. Dr. Waike Moos FB Wirtschaft x Mo x ME Modus, häufigster Wert Median, Merkmalsausprägung des mittleren Merkmalsträgers Fall: n ungerade: Bestimmung des Merkmals xi, das an der mittleren Position n +1 steht. 2 Fall: n gerade: Die mittlere Positionsziffer ist keine ganze Zahl 1 xME= ( x n + x n ) 2 2 2 +1 Berechnung des Medians bei klassierten Daten Die Einfall- oder Medianklasse m ist die Klasse, in der der Merkmalsträger mit der Positionsziffer n liegt1. 2 Zur Untergrenze der Medianklasse am ist eine Strecke d zu addieren, die sich aus dem Strahlensatz bzw. einer linearen Interpolation ergibt: n − Fm−1 0,5n − Fm−1 2 d= (bm − a m ) und xME=am+ (bm − am ) Fm − Fm−1 fm Q1 und Q3: 1. und 3. Quartil Q1 = am + x 0,25 ⋅ n − Fm−1 0,75 ⋅ n − Fm−1 (bm − am ) bzw. Q3 = am + (bm − am ) Fm − Fm−1 Fm − Fm−1 arithmetisches Mittel (AM) in einer Stichprobe, x = Es gilt: 1 m ∑ xj f j n j =1 x MO < x ME < x bei rechtsschiefen bzw. linkssteilen unimodalen Vertei- lungen (rechtsschief heißt: rechts zu flach). x < x ME < x MO bei linksschiefen bzw. rechtssteilen unimodalen Vertei- lungen (linksschief heißt: links zu flach). f 1 + f 2 + ... f m f f1 f 2 + + ... + m x1 x 2 xm HM harmonisches Mittel, HM = GM geometrisches Mittel, GM = n x1 ⋅ x 2 ⋅ ... x n Spannweite= Max-Min 1 Es wird hier nicht mehr nach geradem oder ungeradem Stichprobenumfang unterschieden. Deskriptive Statistik Prof. Dr. Waike Moos FB Wirtschaft ZQA zentraler Quartilsabstand ZQA = Q3 − Q1 halber Quartilsabstand Q3 − Q1 2 σ2 σ Varianz in der Grundgesamtheit Standardabweichung in der Grundgesamtheit s2 Varianz in einer Stichprobe s 2 = s Standardabweichung in einer Stichprobe, s = s 2 s.e. = s n s sM = VK n Standarderror, Standardfehler Standardfehler des Mittelwertes Variationskoeffizient = Skewness: 1 m 1 m 2 2 2 oder ( x − x ) f s = xi f i − x 2 ∑ ∑ i i n − 1 i =1 n − 1 i =1 s 100 |x| Schiefe >0: linkssteil bzw. rechtsschief! Schiefe = 0: symmetrische Verteilung Schiefe <0 rechtssteil bzw. linksschief Kurtosis: Wölbung < 0: flacher gewölbt (als eine Normalverteilung mit denselben Parametern)2 Wölbung = 0 identische Wölbung (wie eine Normalverteilung mit denselben Parametern) Wölbung > 0: steiler gewölbt (als eine Normalverteilung mit denselben Parametern) Absolute Konzentration der erste k Merkmalsträger k ∑x Ck = i i =1 n ∑x k = ∑ ai mit 0≤Ck≤1 mit xi=Merkmalsausprägung (hier: Umsatz) i =1 i i =1 des Merkmalsträgers i (hier: Unternehmen) und ai=Anteil der Merkmalsausprägung des i-ten Merkmalsträgers an der Summe aller Merkmalsausprägungen, Ck=Anteil der Summe der Merkmalsausprägungen der ersten k Merkmalsträger an der Summe aller Merkmalsausprägungen 2 Die Normalverteilung wird erst in der induktiven Statistik eingeführt. Die Gestalt der Normalverteilung mit den Parametern Erwartungswert 0 und Streuung 1 (auch als Gauß-Kurve bezeichnet) war auf dem alten 10 DM-Schein abgebildet. Deskriptive Statistik Prof. Dr. Waike Moos FB Wirtschaft Konzentrationsindex von Herfindahl n ∑x C Herfindahl = 2 i i =1 n ∑ xi i =1 2 mit 1 ≤ C Herfindahl ≤ 1 n m GK Gini-Koeffizient, GK = 1 − ∑ h j ⋅ (Y j −1 + Y j ) mit Y j =kumulierter Anteil der Merkj =1 malsausprägungen und h j der relative Anteil der j-ten Merkmalsträger n n −1 LM Lorenz-Münzner-Koeffizient: LM = GK s xy Kovarianz zweier Merkmale in einer Stichprobe, s xy = sx Wurzel aus der Varianz des Merkmals X einer Stichprobe, s x = 1 n ( xi − x ) 2 ∑ n − 1 i =1 sy Wurzel aus der Varianz des Merkmals Y einer Stichprobe, s y = 1 n ∑ ( yi − y ) 2 n − 1 i =1 1 n ∑ ( xi − x ) ⋅ ( y i − y ) n − 1 i =1 n ∑(x r Korrelationskoeffizient von Bravais-Pearson, i − x )( y i − y ) i =1 r= n ∑(x i − x) 2 ∑( y i =1 r= b i =1 s xy sx sy Regressionskoeffizient (Steigung) bei der linearen Regression n ∑(x b= i − x )( y i − y ) oder i =1 n ∑(x i b= − x)2 s xy s xx i =1 n n i =1 i =1 ∑ y i − b∑ xi a Ordinatenabschnitt bei der linearen Regression a = R-squared ŷ ŷ i s 2 Bestimmtheitsmaß, r 2 = xy sx s y = a + bx geschätzte Regressionsgerade (Kurzform) = a + bxi geschätzte Regressionsgerade n oder n i − y) 2 Deskriptive Statistik Prof. Dr. Waike Moos FB Wirtschaft Chi-Quadrat-Wert χ2 = ∑ (beobachtete − erwartete) 2 erwartete Kontingenzkoeffizient von Pearson χ2 mit 0 ≤ P < 1 P= χ2 + n Zusammenhangmaß Cramers V: V= χ2 n ⋅ ( k − 1) Messzahl mit 0 ≤ V ≤ 1 mit k die kleinere Zahl von Zeilen und Spalten. Messzahl = Wert Berichtszeit ⋅ 100 Wert Basiszeit Veränderung in Prozent zum Vorjahr: Messzahl Jahr − MesszahlVorjahr MesszahlVorjahr MesszahlJahr = − 1100 = Veränderung in Prozent Messzahl Vorjahr Differenz der Messzahlen: gibt die Änderung in Prozentpunkten an. Umrechnung Prozentpunkt in Prozent: Messzahl Jahr − MesszahlVorjahr MesszahlVorjahr 100 = Prozent − Punkt 100 MesszahlVorjahr Wachstumsfaktor zum Vorjahr: Wachstumsfaktor = Wert Jahr Messzahl Jahr = WertVorjahr MesszahlVorjahr Mittelwert von Messzahlen: Geometrisches Mittel der Wachstumsfaktoren-1 GM = n x1 ⋅ x2 ⋅ ...xn − 1 . Jährliches Durchschnittswachstum in Prozent oder n Endwert − 1. Startwert Teilmasse ⋅ 100 Gesamtmasse Gliederungszahl Gliederungszahl = Beziehungszahl ist ein Quotient von zwei verschiedenartigen Größen, die in einem sachlogischen Zusammenhang stehen. Verschuldungsgrad = Fremdkapital ⋅ 100 Eigenkapital Deskriptive Statistik Prof. Dr. Waike Moos FB Wirtschaft Eigenkapitalrendite = Einwohnerdichte = Gewinn ⋅ 100 Eigenkapital Zahl der Einwohner ⋅ 100 Fläche in km 2 Preisindex für Berichtsjahr i gegenüber Basisjahr 0. p = Preis des Gutes j in der Basiszeit 0. p1j = Preis des Gutes j in der Berichtszeit 1. P0i j 0 q0j = Menge des Gutes j in der Basiszeit 0. q1j = Menge des Gutes j in der Berichtszeit 1. j=Laufindex der Güter, i Jahreszahl des Berichtsjahres, 0=Basisjahr Preismesszahl des Gutes j p ij w j mit wj das Gewicht des Gutes j. p 0j n ∑ Allgemein: Preisindex P0i = j =1 pi j wj p0j n ∑w 100 j j =1 Laspeyres gewichtet die Preise mit dem Warenkorb des Basisjahres w j = p0j q0j in den verschiedenen Berichtsjahren. n ∑pq i P0iLaspeyres = 0 j =1 100 = n ∑p q 0 Summe aktueller Preis ⋅ alte Menge 100 , Preisindex von Laspeyres Summe alter Preis ⋅ alte Menge 0 j =1 Differenz der Indexzahlen: Prozent-Punkte Quotient der Indexzahlen-1: gibt relative Preisänderung direkt als Prozentzahl an Paasche gewichtet die Preise mit dem Warenkorb des Berichtsjahres w j = p0j qij in den verschiedenen Berichtsjahren. Deskriptive Statistik Prof. Dr. Waike Moos FB Wirtschaft n ∑pq i P0iPaasche = i j =1 100 = n ∑p q 0 Summe aktueller Preis ⋅ aktuelle Menge 100 , Preisindex von Paasche Summe alter Preis ⋅ aktuelle Menge i j =1 n ∑q p i U 0i = i j =1 100 = n ∑q 0 p0 Summe aktuelle Umsätze 100 , Umsatzindex Summe alte Umsätze j =1 Umbasierung: Umrechnung einer Indexzahlenreihe von einem alten Basisjahr zu einem neuen Basisjahr. IndexNeueBasis;i = IndexAlteBasis;i IndexAlteBasis;NeueBasis 100 Preisbereinigung Nominelle Wertgrößezum Zeitpunkt t = Mengezum Zeitpunkt t ⋅ Preiszum Zeitpunkt t Reale Wertgrößezum Zeitpunkt t =⋅ Mengezum Zeitpunkt t ⋅ Preiszu einem anderen Zeitpunkt Realer Wert = nomineller Wert 100 Preisindex Umsatzindex 100 = Mengenindex Preisindex