Kennwerte Univariater Verteilungen SS 2001 3.Sitzung vom 8.5.2001 3.Sitzung Kennwerte Peter Schmidt 2001 1 Kennwerte • Beschreibung von Verteilungen durch einen (oder wenige) Werte • Werden auch als Parameter oder Maße von Verteilungen bezeichnet • Man unterscheidet: – „Lagemaße“ oder auch „Maße der zentralen Tendenz, welche für die Verteilung typisch sein sollen – „Streuungsmaße“, welche die Unterschiedlichkeit der Realisationen einer Verteilung erfassen (Weiterhin können auch „Schiefe“ und „Steilheit“ einer Verteilung bestimmt werden“) 3.Sitzung Kennwerte Peter Schmidt 2001 2 Typische Werte oder Lagemaße • Modus – Die am häufigsten auftretende Ausprägung einer Verteilung • Median – Die Ausprägung, welche die Verteilung in zwei gleich große Hälften teilt • arithmetisches Mittel – Der Wert, der als Durchschnittswert den Scherpunkt einer Verteilung darstellt 3.Sitzung Kennwerte Peter Schmidt 2001 3 Modus • Bei gruppierten Daten ist der Modus gleich dem Wert der Klassenmitte (Berechnung nur sinnvoll, wenn Klassenbreite theoretisch fundiert) 3.Sitzung Kennwerte Peter Schmidt 2001 4 Median • Kennzeichnet die exakte Mitte einer empirischen Verteilung: – der (Meß-) Wert, der die Verteilung in zwei gleich große Hälften teilt 3.Sitzung Kennwerte Peter Schmidt 2001 5 Berechnungsformeln des Medians • Für eine Verteilung mit ungerader Fallzahl berechnet sich der Median wie folgt: • Und so für eine Verteilung mit gerader Fallzahl: 3.Sitzung Kennwerte Peter Schmidt 2001 6 Berechnungsformeln des Medians II • Berechnung des Medians bei gruppierten Daten (Interpolationsformel): 3.Sitzung Kennwerte Peter Schmidt 2001 7 Arithmetisches Mittel • Auch „Mittelwert“ oder „Durchschnitt“ genannt • Setzt mindestens Intervallniveau voraus • Wird Berechnet als Summe aller Realisationen einer Verteilung geteilt durch deren Anzahl (Fallzahl): 3.Sitzung Kennwerte Peter Schmidt 2001 8 Arithmetisches Mittel bei ungruppierten Daten • Anstatt alle Werte der Tabelle zu summieren, werden hier zunächst Produkte gebildet, die die Summe aller Werte mit gleicher Ausprägung beschreiben. Diese Produkte werden dann aufsummiert: K K nk 1 K x = ∑ n k ⋅ x k = ∑ ⋅ x k = ∑ pk ⋅ x k n k =1 k =1 n k =1 3.Sitzung Kennwerte Peter Schmidt 2001 9 Arithmetisches Mittel bei gruppierten Daten • Die Berechnung des Arithmetischen Mittels wird hier wie bei ungruppierten Daten durchgeführt, nur daß hier anstatt der einzelnen Werte die Werte der Klassenmitten verrechnet werden. K K nk 1 K x = ∑ n k ⋅ mk = ∑ ⋅ mk = ∑ pk ⋅ mk n k =1 k =1 n k =1 3.Sitzung Kennwerte Peter Schmidt 2001 10 Getrimmtes arithmetische Mittel • Ein vom Forscher festgelegter Anteil der erhobenen Werte wird ausgelassen (z.B. oberere und untere 5%) • Beispiel: x11.1%getr = 32+38+41+42+42+55+59 = 44.1 7 3.Sitzung Kennwerte Peter Schmidt 2001 11 Geometrisches Mittel • Geeignet für die Mittelung von Veränderungen die anteilsmäßig dargestellt werden (z.B. Bierpreis * Inflationsrate) wobei x indiziert n den einzelnen Veränderungsraten entspricht 3.Sitzung Kennwerte Peter Schmidt 2001 12 Streuungsmaße • Informieren über die Heterogenität der Daten, bzw. das Ausmaß ihrer Unterschiedlichkeit 3.Sitzung Kennwerte Peter Schmidt 2001 13 Verschiedene Streuungsmaße • Spannweite – Abstand zwischen Niedrigsten und höchsten Wert • Quartilsabstand – Abstand zwischen 25% - und 75% - Quantil • Varianz – Durchschnittliche Quadrierte Abweichung vom Mittelwert • Standardabweichung – Durchschnittliche Abweichung vom Mittelwert 3.Sitzung Kennwerte Peter Schmidt 2001 14 Quartilsabstand und Mittlerer Quartilsabstand • IQR=Q1−Q3 wobei IQR = Quartilabstand Q1,Q3=Quartilwerte des 1. und 3. Quartils einer Verteilung • Mittlerer Quartilsabstand: mIQR = Q3 − Q1 2 3.Sitzung Kennwerte Peter Schmidt 2001 15 Variation • Summe der quadrierten Abweichungen vom Mittelwert – Quadrieren verhindert, daß negative und positive Abweichungen einander Aufheben • Auch „Quadratsumme“ bzw. „Sum of Squares“ genannt n SSX = ( x1 − x ) + ( x 2 − x ) + ... + ( x n − x ) = ∑ ( x i − x ) 2 2 2 2 i =1 3.Sitzung Kennwerte Peter Schmidt 2001 16 Varianz • Mittlere Quadrierte Abweichung vom Mittelwert – Abweichungsmaß unabhängig von der Fallzahl • Mittlere „Quadratsumme“ SSX 1 n 1 n 2 2 2 s = = ∑ (xi − x ) = ∑ xi − x n n i=1 n i=1 2 X 3.Sitzung Kennwerte Peter Schmidt 2001 17 Standardabweichung • Wurzel der Varianz – Quadrierung wird „aufgehoben“ – Abweichung kann wieder in Skaleneinheiten dargestellt werden n sX = ∑ (xi − x ) 2 i =1 n = s 2X 3.Sitzung Kennwerte Peter Schmidt 2001 18 Variationskoeffizient • Variablen nit großen Mittelwerten weisen oft auch große Standardabweichungen auf • Division durch der Stabdardabweichung durch den Mittelwert berücksichtigt dies sX VX = x 3.Sitzung Kennwerte Peter Schmidt 2001 19