Wiederholung Statistik I

Werbung
Wiederholung Statistik I
Statistik für SozialwissenschaftlerInnen II – p.8
Konstanten und Variablen
•
Konstante: Merkmal hat nur eine Ausprägung
• Variable: Merkmal kann mehrere Ausprägungen
annehmen
Statistik für SozialwissenschaftlerInnen II – p.9
Skalenniveaus
•
Nominalskala: Nur Informationen über
Gleichheit/Ungleichkeit der Variablen
• Ordinalskala: Zusätzlich Informationen über Relationen,
also größer/kleiner als andere Ausprägung
• Intervallskala: Zusätzlich Informationen über die
Abstände der Messwerte
• Verhältnisskala: Besitzt einen unveränderlichen,
interpretierbaren Nullpunkt. Aussagen über Verhältnisse
möglich.
Statistik für SozialwissenschaftlerInnen II – p.10
Skalenniveaus: Zusammenfassung
Skala
Nominal
Ordinal
Intervall
Verhältnis
Identität Ränge Abstände Nullpunkt
ja
ja
ja
ja
nein
ja
ja
ja
nein
nein
ja
ja
nein
nein
nein
ja
Statistik für SozialwissenschaftlerInnen II – p.11
Das Summenzeichen
n
X
xi
i=1
ist lediglich die verkürzte Schreibweise für eine Addition
x1 + x2 + · · · + xn−1 + xn
•
1 und n als untere und obere Summationsgrenzen
• i als Summationsindex
Statistik für SozialwissenschaftlerInnen II – p.12
Rechenregeln für die einfache Summe
n
X
i=1
n
X
i=1
n
X
i=1
a=n∗a
a ∗ xi = a ∗
(xi ± yi ) =
n
X
i=1
(xi ∗ yi ) 6=
n
X
i=1
n
X
i=1
n
X
xi
i=1
xi ±
xi ∗
n
X
yi
i=1
n
X
yi
i=1
Statistik für SozialwissenschaftlerInnen II – p.13
Die Doppelsumme
Wird benutzt, um Tabellen/Matritzen zu beschreiben
1
2
i
c
P
1
2
j
r
x11
x21
xi1
xc1
x12
x22
xi2
xc2
x1j
x2j
xij
xcj
x1r
x2r
xir
xcr
x.1
x.2
x.j
x.c
P
x1.
x2.
xi.
xc.
x..
Entspricht der Doppelsumme
r X
c
X
i=1 j=1
xij = x.. = x11 + x12 + · · · + xij + · · · + xrc
Statistik für SozialwissenschaftlerInnen II – p.14
Lage- und Streuungsmaße
•
Dienen dazu, Verteilungen kompakt zu beschreiben
• Abhängig vom Skalenniveau des Merkmals
• Lagemaße: Zentrale Tendenz der Verteilung
• Streuungsmaße: Breite“ der Verteilung
”
Statistik für SozialwissenschaftlerInnen II – p.15
Lagemaße: Modalwert/Modus
•
Voraussetzung: Nominalskalenniveau
• Gibt an, welche Ausprägung am häufigsten vorkommt
• Beispiel: Modalwert der Religionszugehörigkeit
Statistik für SozialwissenschaftlerInnen II – p.16
Beispiel: Modalwert
Religion
1
2
3
4
5
6
Katholisch
Evangelisch, nicht Freikirchlich
Evangelisch, Freikirchlich
Andere christl. Religion
Andere nicht-christl. Religion
Religionslos
Gesamt
Häufigkeit Prozent
1083
1070
56
57
99
745
34,8
34,4
1,8
1,8
3,2
24,0
3110
100,0
Quelle: Allbus 2000.
Modalwert=1
Statistik für SozialwissenschaftlerInnen II – p.17
Lagemaße: Median
•
Voraussetzung: Ordinalskalenniveau
• Teilt die Verteilung in der Hälfte
• 50% der Fälle liegen unter, 50% über dem Median
• Beispiel: Median der Schulbildung
Statistik für SozialwissenschaftlerInnen II – p.18
Beispiel: Median
Schulabschluss
1
2
3
4
5
6
ohne Abschluss
Hauptschulabschluss
Realschulabschluss
Fachhochschulreife
Abitur
Anderer Abschluss
Gesamt
Häufigkeit Prozent kum. Prozente
95
1414
866
199
543
8
3,0
45,3
27,7
6,4
17,4
0,3
3138
100
3,0
48,3
76,0
82,4
99,7
100
Quelle: Allbus 2000.
Medianklasse=3
Statistik für SozialwissenschaftlerInnen II – p.19
Lagemaße: Artihmetrisches Mittel
•
•
•
•
•
Voraussetzung: Metrisches Skalenniveau
Der Wert, den alle Befragten im Durchschnitt aufweisen
Nachteil: Kann durch Ausreißerwerte“ verzerrt werden
”
Beispiel: Mittelwert der Haushaltsgröße
Berechnung des arithmetischen Mittels nach
n
X
1
x̄ =
f (xi ) ∗ xi
n
i=1
Statistik für SozialwissenschaftlerInnen II – p.20
Beispiel: Arithmetrisches Mittel
Häufigkeit
Prozente
Kum. Prozente
575
18,49
18,49
2 Personen
1113
35,78
54,27
3 Personen
602
19,35
73,62
4 Personen
564
18,14
91,76
5 Personen
168
5,41
97,17
6 Personen
55
1,76
98,92
7 Personen
22
0,71
99,64
8 Personen
8
0,24
99,88
9 Personen
0
0,00
99,88
10 Personen
3
0,08
99,96
11 Personen
1
0,04
100,00
3110
100,00
1 Person
Gesamt
Quelle: Allbus 2000.
n
1X
x̄ =
f (xi ) ∗ xi
n i=1
Statistik für SozialwissenschaftlerInnen II – p.21
Streuungsmaße
•
Geben Auskunft über die Breite der Verteilung
• Ist die Maßzahl klein, liegen die Werte nahe um den
Mittelpunkt
• Ist die Maßzahl groß, sind die Meßwerte über ein breites
Spektrum verteilt
• Abhängig vom Skalenniveau Berechnung von
unterschiedlichen Streuungsmaßen
Statistik für SozialwissenschaftlerInnen II – p.22
Streuungsmaße: Index der Diversität D
•
Voraussetzung: Nominalskalenniveau
• Wahrscheinlichkeit, daß zwei zufällig gezogene
Analyseeinheiten unterschiedliche Ausprägungen
aufweisen
• Berechung des Indexes der Diversität“ nach
”
D =1−
k
X
p(xi )2
i=1
•
Variiert zwischen 0 und
•
Standardisierung für Vergleichszwecke: IQV =
k−1/k
D
k−1/k
Statistik für SozialwissenschaftlerInnen II – p.23
Streuungsmaße: Quartilsabstand QA
•
Voraussetzung: Ordinalskalenniveau
• Differenz zwischen dem 1. Quartil (25%) und dem 3.
Quartil (75%)
• Berechnung der Quartile analog zum Median:
25 − Pu
Q1 = U +
∗b
PQ1
•
75 − Pu
Q3 = U +
∗b
PQ3
Berechnung des Quartilsabstandes nach
QA = Q1 − Q3
Statistik für SozialwissenschaftlerInnen II – p.24
Streuungsmaße: Standardabweichung s
•
Voraussetzung: Metrisches Skalenniveau
• Standardabweichung ist die Quadratwurzel der Varianz
• Berechnung der Varianz nach
Pn
2
(x
−
x̄)
SAQ
1
2
i=1
=
s =
n
n
• SAQ
ist die Summe der quadrierten Abweichungen von
”
Mittelwert“
• Berechnung der Standardabweichung nach
r
√
SAQ
2
s= s =
n
Statistik für SozialwissenschaftlerInnen II – p.25
Herunterladen