Rudolf Brinkmann http://brinkmann-du.de Seite 1 06.10.2008 Zusammenfassung Beschreibende Statistik. Stichprobe: Wird der Teil einer Gesamtheit befragt, dann spricht man bei der Datenerhebung von einer Stichprobe. Urliste: Das Ergebnis der Stichprobe wird in einer Urliste festgehalten. Rohdaten: Sind alle in der Urliste enthaltenen Daten. Erhebungsumfang: Ist die Anzahl der untersuchten Objekte (hier Schüler) Werden z.B. 27 Schüler befragt, so sagt man, “Die Anzahl der Merkmalsträger ( n = 27 ) bildet den Erhebungsumfang“. Merkmale: Sind die Eigenschaften der Objekte. (z.B. Geschlecht, Körpergröße, Gewicht, Raucher, Sportart, ...) Merkmalsausprägung xi: Ein Merkmal kann in verschiedenen Ausprägungen vorkommen. (z.B. Geschlecht m oder w) Klasseneinteilung Werden verschiedene Merkmalsausprägungen zu einer neuen Ausprägung zusammengefasst, so spricht man von einer Klasseneinteilung der Stichprobenwerte. Die Darstellung erfolgt in einem Säulendiagramm ohne Lücken. Häufigkeiten. Für die Merkmalsausprägung xi gilt: Relative Häufigkeit von xi = absolute Häufigkeit von xi Anzahl der Merkmalsträger Häufigkeitsdichte im Histogramm. Fläche relative Klassenhäufigkeit hi Rechteckhöhe = Breite Klassenbreite bi hi = ni n 0 ≤ ni ≤ n 0 ≤ hi ≤ 1 (Häufigkeitsdichte) Vergleich von Säulendiagramm und Histogramm Säulendiagramm Histogramm Wenn man die relativen Häufigkeiten Wenn man die relativen Häufigkeiten als Längen von Säulen veranschaulicht, als Flächen von Rechtecken entsteht ein Säulendiagramm. veranschaulicht, entsteht ein Die Summe der Längen aller Säulen Histogramm. hat den Wert 1 (100%) Die Summe der Flächeninhalte hat den Wert 1 (100%) Erstellt von Rudolf Brinkmann p8_beschr_stat_zuf.doc 06.10.08 14:39 Seite: 1 von 3 Rudolf Brinkmann http://brinkmann-du.de Seite 2 06.10.2008 Arithmetisches Mittel einer Datenreihe 1 n 1 x = ∑ xi = ( x1 + x 2 + ... + xn ) n i =1 n n : Anzahl der Beobachtungswerte xi xi : i - ter Beobachtungswert i ∈ ` Der Median (Zentralwert einer Datenreihe) Der Median xMed ist derjenige Wert (Merkmalsausprägung), der in der Mitte steht, wenn alle Beobachtungswerte xi der Größe nach geordnet sind. höchstens 50% aller B - Werte ≤ Median ≤ höchstens 50% aller B - Werte ≤ Median ≤ links vom Median rechts vom Median Allgemeine Rechenvorschrift zur Berechnung des Medians Ist n ist die Anzahl der Beobachtungswerte xi , dann gilt: n ungerade ⇒ xMed = x n +1 n gerade ⇒ xMed = 2 ⎞ 1⎛ ⎜⎜ x n + x n ⎟⎟ +1 2⎝ 2 2 ⎠ Modalwert. Der Modalwert xMod ist der Merkmalswert, der am häufigsten vorkommt. Die Spannweite. Spannweite = größter Beobachtungswert - kleinster Beobachtungswert R = xmax − xmin Quartiele und Quartilsabstand. xi x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x 11 x12 x13 KG 1,60 1,67 1,67 1,68 1,68 1,70 1,70 1,72 1,73 1,75 1, 76 1,78 1,84 25% 25% 1. Quartil Q1=1,675 25% 2. Quartil Q2 = 1,70 50% 25% 3. Quartil Q3 = 1,755 Quartilsabstand Quartilsabstand Der mittlere 50% - Bereich aller Beobachtungswerte heißt Quartilsabstand. Berechnung: QA = Q3 − Q1 Erstellt von Rudolf Brinkmann p8_beschr_stat_zuf.doc 06.10.08 14:39 Seite: 2 von 3 Rudolf Brinkmann http://brinkmann-du.de Seite 3 Varianz einer Datenreihe und Standardabweichung s2 = n ( 1 ∑ xi − x n i =1 ) 2 (x = 1−x ) + (x 2 2 −x ) 2 ( + ... + xn − x 06.10.2008 ) 2 n n: Anzahl der Beobachtungswerte, xi : i - ter Beobachtungswert, x : Mittelwert Standardabweichung: s = s2 = Varianz Erstellt von Rudolf Brinkmann p8_beschr_stat_zuf.doc 06.10.08 14:39 Seite: 3 von 3