Zusammenfassung Beschreibende Statistik. - klaus

Werbung
Rudolf Brinkmann http://brinkmann-du.de
Seite 1
07.04.2017
Zusammenfassung Beschreibende Statistik.
Stichprobe:
Wird der Teil einer Gesamtheit befragt, dann spricht man bei der Datenerhebung von
einer Stichprobe.
Urliste:
Das Ergebnis der Stichprobe wird in einer Urliste festgehalten.
Rohdaten:
Sind alle in der Urliste enthaltenen Daten.
Erhebungsumfang:
Ist die Anzahl der untersuchten Objekte (hier Schüler) Werden z.B. 27 Schüler
befragt, so sagt man, “Die Anzahl der Merkmalsträger ( n = 27 ) bildet den
Erhebungsumfang“.
Merkmale:
Sind die Eigenschaften der Objekte. (z.B. Geschlecht, Körpergröße, Gewicht,
Raucher, Sportart, ...)
Merkmalsausprägung xi:
Ein Merkmal kann in verschiedenen Ausprägungen vorkommen. (z.B. Geschlecht m
oder w)
Klasseneinteilung
Werden verschiedene Merkmalsausprägungen zu einer neuen
Ausprägung zusammengefasst, so spricht man von einer Klasseneinteilung der
Stichprobenwerte. Die Darstellung erfolgt in einem Säulendiagramm ohne Lücken.
Häufigkeiten.
Für die Merkmalsausprägung x i gilt:
Relative Häufigkeit von x i 
absolute Häufigkeit von x i
Anzahl der Merkmalsträger
Häufigkeitsdichte im Histogramm.
Fläche relative Klassenhäufigkeit hi
Rechteckhöhe 
Breite
Klassenbreite bi
hi 
ni
n
0  ni  n
0  hi  1
(Häufigkeitsdichte)
Vergleich von Säulendiagramm und Histogramm
Säulendiagramm
Histogramm
Wenn man die relativen Häufigkeiten
Wenn man die relativen Häufigkeiten
als Längen von Säulen veranschaulicht,
als Flächen von Rechtecken
entsteht ein Säulendiagramm.
veranschaulicht, entsteht ein
Die Summe der Längen aller Säulen
Histogramm.
hat den Wert 1 (100%)
Die Summe der Flächeninhalte hat den
Wert 1 (100%)
Erstellt von Rudolf Brinkmann 257780206
07.04.17 05:11
Seite: 1 von 3
Rudolf Brinkmann http://brinkmann-du.de
Seite 2
07.04.2017
Arithmetisches Mittel einer Datenreihe
1 n
1
x   xi   x1  x 2  ...  xn 
n i1
n
n : Anzahl der Beobachtungswerte xi
xi : i - ter Beobachtungswert i 
Der Median (Zentralwert einer Datenreihe)
Der Median xMed ist derjenige Wert (Merkmalsausprägung), der in der Mitte steht,
wenn alle Beobachtungswerte xi der Größe nach geordnet sind.
höchstens 50% aller B - Werte  Median  höchstens 50% aller B - Werte
links vom Median
 Median 
rechts vom Median
Allgemeine Rechenvorschrift zur Berechnung des Medians
Ist n ist die Anzahl der Beobachtungswerte xi , dann gilt:
n ungerade  xMed  x n 1
n gerade
 xMed 
2

1
 x n  x n 
1
2 2
2 
Modalwert.
Der Modalwert xMod ist der Merkmalswert, der am häufigsten vorkommt.
Die Spannweite.
Spannweite = größter Beobachtungswert - kleinster Beobachtungswert
R  xmax  xmin
Quartiele und Quartilsabstand.
xi
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11 x12 x13
KG 1,60 1,67 1,67 1,68 1,68 1,70 1,70 1,72 1,73 1,75 1, 76 1,78 1,84
25%
25%
1. Quartil
Q1=1,675
25%
2. Quartil
Q2 = 1,70
50%
25%
3. Quartil
Q3 = 1,755
Quartilsabstand
Quartilsabstand
Der mittlere 50% - Bereich aller Beobachtungswerte heißt Quartilsabstand.
Berechnung:
QA  Q3  Q1
Erstellt von Rudolf Brinkmann 257780206
07.04.17 05:11
Seite: 2 von 3
Rudolf Brinkmann http://brinkmann-du.de
Seite 3
07.04.2017
Varianz einer Datenreihe und Standardabweichung
s2 
n

1
 xi  x
n i 1

2
x

1x
  x
2
2 x

2

 ...  xn  x

2
n
n: Anzahl der Beobachtungswerte, xi : i - ter Beobachtungswert, x : Mittelwert
Standardabweichung:
Erstellt von Rudolf Brinkmann 257780206
s  s2  Varianz
07.04.17 05:11
Seite: 3 von 3
Herunterladen