Tabellen und Häufigkeitsverteilungen

Werbung
Betrachtung der Realität aus
der Sicht der Statistik
TABELLEN UND
HÄUFIGKEITSVERTEILUNGEN
Übersetzung: / Tradotto da:
Scuola Secondaria 1°grado; Argomento: Leggiamo - Tabelle (30.09.13); Pacchetto: S1.A.3
INHALT
1)
2)
3)
4)
5)
6)
Häufigkeitstabellen mit Prozentwerten
Absolute Häufigkeitstabelle: Erstellung
Vergleichbarkeit von Verteilungen
Konzeptualisierung einfache Verteilung
Kreuztabellen
Konzeptualisierung doppelte Verteilung
Häufigkeitstabellen mit Prozentwerten
Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit
der Internetnutzung
Jahr 2012 (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der Internetnutzung
Jeden Tag
Einmal oder mehrmals in der Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
nie
Keine Angabe
Insgesamt
Personen mit 6
Jahren und mehr
29,5
18,7
3,3
1,0
45,6
1,9
100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Die Tabelle mit prozentuellen Häufigkeiten ist am weitesten
verbreitet, da sie leicht verständlich ist: Die Werte werden mit
dem Gesamten in Beziehung gesetzt (das gleich 100 ist).
Wie liest man die Tabelle?
Häufigkeitstabellen mit Prozentwerten: lesen
Tab. 1 – Personen im Alter von 6 Jahren und mehr nach Häufigkeit
der Internetnutzung
Jahr 2012 (je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der Internetnutzung
Jeden Tag
Einmal oder mehrmals in der Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
nie
Keine Angabe
Insgesamt
Personen mit 6
Jahren und mehr
29,5
18,7
3,3
1,0
45,6
1,9
100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
… fast 30%
der Bevölkerung das
Internet
jeden Tag
verwenden
… 45,6%
das Internet
nicht
nutzen
Berücksichtigt man die gesamte italienische Bevölkerung im
Alter von 6 Jahren und mehr, sagt uns die Tabelle zum Beispiel
das…
Wie erstellt man die
Tabelle?
Häufigkeitstabellen mit Prozentwerten: erstellen
Die relative Häufigkeit
ist das Verhältnis
zwischen absoluter
a) Man berücksichtigt absolute Häufigkeitstabelle
Häufigkeit und
b) Man berechnet die relativen Häufigkeiten
Summe
Die absolute Häufigkeit gibt Die prozentuelle
Häufigkeit ist die
c) Man berechnet die prozentuellen
an, wie oft sich die
relative
Häufigkeit
Ausprägung eines Merkmals
Häufigkeiten
multipliziert mit
in der Grundgesamtheit
100
Tab. 2 - Personen im Alter von 6 Jahren und mehr nach Häufigkeitwiederholt
der Internetnutzung - Jahr 2012
Personen mit 6 Jahren Personen mit 6 Jahren Personen mit 6 Jahren
und mehr
und mehr
und mehr
Häufigkeit der
Internetnutzung
(Werte in 1.000)
(je 1 Person mit 6 (je 100 Personen mit 6
Jahren und mehr)
Jahren und mehr)
Jeden Tag
16.819
16.819 / 57.019 16.819 / 57.019 x 100
Einmal oder mehrmals in der
Woche
10.640
10.640 / 57.019 10.640 / 57.019 x 100
Ein paar Mal im Monat
1.871
1.871 / 57.019
1.871 / 57.019 x 100
Ein paar Mal im Jahr
nie
Keine Angabe
Insgesamt
597
597 / 57.019
597 / 57.019 x 100
26.008
26.008 / 57.019
26.008 / 57.019 x 100
1.084
1.084 / 57.019
1.084 / 57.019 x 100
57.019
57.019 / 57.019
57.019 / 57.019 x 100
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Die Tabelle mit den relativen und prozentuellen Häufigkeiten erhält man
ausgehend von der absoluten Häufigkeitstabelle.
Wie erhält man aber die absolute Häufigkeitstabelle?
Absolute Häufigkeitstabelle: erstellen (1/4)
Die absolute Häufigkeitstabelle erhält man ausgehend von der
Verteilung nach Einheit: für jede Einheit wird die Ausprägung
des Merkmals angegeben.
Absolute Häufigkeitstabelle: erstellen (2/4)
In Excel mit der Schaltfläche fx (Funktion einfügen) die Funktion
„Zählenwenn“ auswählen und mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (3/4)
Den Zellbereich eingeben, der gezählt werden soll, und die
Suchkriterien, also die Bedingung, mit der die Zellen definiert
werden, die gezählt werden sollen. Dann mit Ok bestätigen.
Absolute Häufigkeitstabelle: erstellen (4/4)
So erhält man die absoluten Häufigkeiten
In Excel lassen sich die
relativen Häufigkeiten
berechnen:
und die prozentuellen
Häufigkeiten:
(dieselben wie in Tabelle 2).
So erhält man alle
Berechnungen, die in
Tabelle 2 gemacht wurden:
Vergleichbarkeit von Verteilungen (1/2)
Frage:
wie stark ist die tägliche Internetnutzung
zwischen 2009 und 2012 gestiegen?
Tab. 3 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung (Werte in
1.000)
Personen mit 6 Jahren und mehr
Häufigkeit der Internetnutzung
Jahr 2009
Jahr 2012
12.251
16.819
9.632
2.233
864
29.540
1.712
56.232
10.640
1.871
597
26.008
1.084
57.019
Jeden Tag
Einmal oder mehrmals in der
Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
Nie
Keine Angabe
Insgesamt
Quelle: Istat, I.Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Der Vergleich der Verteilungen der absoluten Häufigkeiten ergibt, dass die
Zahl der Personen im Alter von 6 Jahren und mehr von 12.251 Tausend im
Jahr 2009 auf 16.819 Tausend im Jahr 2012 gestiegen ist…
… aber der Vergleich ist ungültig, da die beiden Grundgesamtheiten
unterschiedlich groß sind.
Vergleichbarkeit von Verteilungen (2/2)
Um Vergleiche zu ziehen, müssen die Verteilungen der relativen
oder prozentuellen Häufigkeiten verwendet werden, wo jede
Grundgesamtheit gleich groß ist.
Tab. 4 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung
(je 100 Personen mit 6 Jahren und mehr)
Häufigkeit der Internetnutzung
Personen mit 6 Jahren und mehr
Jahr 2009
Jahr 2012
21,8
29,5
17,1
4,0
1,5
52,5
3,0
100,0
18,7
3,3
1,0
45,6
1,9
100,0
Jeden Tag
Einmal oder mehrmals in der
Woche
Ein paar Mal im Monat
Ein paar Mal im Jahr
Nie
Keine Angabe
Insgesamt
Quelle: Istat, I.Stat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Der Vergleich der Verteilungen der prozentuellen Häufigkeiten erlaubt die
Aussage, dass im Jahr 2009 21,8 von 100 Personen im Alter von 6 Jahren
und mehr täglich das Internet genutzt haben (also 21,8 Prozent). 2012
haben 29,5 von 100 Personen im Alter von 6 Jahren und mehr täglich das
Internet genutzt (also 29,5 Prozent).
Konzeptualisierung der einfachen Verteilung
in der Sprache der Statistiker…
Die Sprache der Statistiker verwendet bestimmte Symbole…
K modalità del carattere
Tab. 5 – Einfache Häufigkeitsverteilung
Carattere X
Frequenze
assolute
Modalità x1
n1
f1
p1
Modalità x2
n2
f2
p2
.
Frequenze
relative
.
Modalità xi
ni
.
.
fi
.
Modalità xk
nk
Totale
n
Spalte mit
Ausprägungen
Schauen wir uns
die Summen an…
Die Summe der
absoluten Häufigkeiten entspricht der
Grundgesamtheit
Frequenze
percentuali
.
pi
.
fk
pk
1
Die Summe
der relativen
Häufigkeiten
ist 1
.
100
Die Summe der
prozentuellen
Häufigkeiten ist
100
Tabellenkopf
Kreuztabelle
Tab. 6 – Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung
und Region
Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region)
REGIONEN
Piemont
Aosta
Ligurien
Lombardei
Trentino-Südtirol
Südtirol
Trentino
Venetien
Friaul-Julisch
Venetien
Emilia-Romagna
Toskana
Umbrien
Marken
Latium
Abruzzen
Molise
Kampanien
Apulien
Basilikata
Kalabrien
Sizilien
Sardinien
Italien
Jeden Tag
Häufigkeit der Internetnutzung
Einmal
oder
Ein paar
Ein paar
Keine
mehrmals
Mal im
Mal im Jahr
Angabe
in der
Monat
Woche
Nie
Insgesamt
30,6
30,8
31,2
33,2
30,3
29,7
31,1
32,8
17,9
23,3
19,3
21,0
23,2
24,9
21,6
20,3
3,9
3,3
2,9
3,5
4,9
5,3
4,6
4,3
1,3
0,8
1,4
1,2
1,6
2,1
1,2
0,9
1,6
2,5
2,0
0,9
3,1
2,3
3,4
1,4
44,7
39,2
43,1
40,2
36,8
35,7
38,0
40,3
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
31,1
34,0
30,8
28,8
31,8
33,0
28,1
27,1
23,0
22,0
22,5
23,9
24,5
29,5
29,5
17,9
18,4
19,4
19,9
18,6
18,5
16,0
14,2
15,9
17,4
16,7
17,3
17,6
18,4
18,7
3,6
3,3
3,6
2,3
2,4
3,4
4,2
3,0
2,5
2,4
2,3
2,2
3,0
2,8
3,3
1,6
1,5
0,9
1,3
1,4
0,8
0,6
1,3
0,4
1,1
1,1
0,7
0,9
1,6
1,0
2,0
2,4
2,5
0,8
2,4
3,2
3,5
1,3
1,3
1,6
4,0
2,1
2,6
1,6
1,9
43,7
40,4
42,7
46,8
43,4
41,0
47,6
53,1
56,8
55,5
53,4
53,9
51,5
46,2
45,6
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Es gibt 2
Merkmale
Schauen
wir uns
an einem
Beispiel
an, wie
man die
Tabelle
liest
Kreuztabelle: lesen
Tab. 6 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung
und Region
Jahr 2012 (je 100 Personen mit 6 Jahren und mehr in derselben Region)
REGIONEN
Piemont
Aosta
Ligurien
Lombardei
Trentino-Südtirol
Südtirol
Trentino
Venetien
Friaul-Julisch
Venetien
Emilia-Romagna
Toskana
Umbrien
Marken
Latium
Abruzzen
Molise
Kampanien
Apulien
Basilikata
Kalabrien
Sizilien
Sardinien
Italien
Jeden Tag
Häufigkeit der Internetnutzung
Einmal
oder
Ein paar
Ein paar
Keine
mehrmals
Mal im
Mal im Jahr
Angabe
in der
Monat
Woche
Nie
Insgesamt
30,6
30,8
31,2
33,2
30,3
29,7
31,1
32,8
17,9
23,3
19,3
21,0
23,2
24,9
21,6
20,3
3,9
3,3
2,9
3,5
4,9
5,3
4,6
4,3
1,3
0,8
1,4
1,2
1,6
2,1
1,2
0,9
1,6
2,5
2,0
0,9
3,1
2,3
3,4
1,4
44,7
39,2
43,1
40,2
36,8
35,7
38,0
40,3
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
31,1
34,0
30,8
28,8
31,8
33,0
28,1
27,1
23,0
22,0
22,5
23,9
24,5
29,5
29,5
17,9
18,4
19,4
19,9
18,6
18,5
16,0
14,2
15,9
17,4
16,7
17,3
17,6
18,4
18,7
3,6
3,3
3,6
2,3
2,4
3,4
4,2
3,0
2,5
2,4
2,3
2,2
3,0
2,8
3,3
1,6
1,5
0,9
1,3
1,4
0,8
0,6
1,3
0,4
1,1
1,1
0,7
0,9
1,6
1,0
2,0
2,4
2,5
0,8
2,4
3,2
3,5
1,3
1,3
1,6
4,0
2,1
2,6
1,6
1,9
43,7
40,4
42,7
46,8
43,4
41,0
47,6
53,1
56,8
55,5
53,4
53,9
51,5
46,2
45,6
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
100,0
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
Fast 30% der
Bevölkerung
Italiens
nutzen jeden
Tag das
Internet…
…aber es gibt
große
räumliche
Unterschiede
45,6% der
Bevölkerung
Italiens mit 6
Jahren und
mehr nutzt
nicht das
Internet…
… aber es
gibt große
räumliche
Unterschiede
Kreuztabelle: erstellen (1/5)
Tab. 7 - Personen mit 6 Jahren und mehr nach Häufigkeit der Internetnutzung
und Region
Jahr 2012 (Werte in 1.000)
REGIONEN
Piemont
Aosta
Ligurien
Lombardei
Trentino-Südtirol
Südtirol
Trentino
Venetien
Friaul-Julisch
Venetien
Emilia-Romagna
Toskana
Umbrien
Marken
Latium
Abruzzen
Molise
Kampanien
Apulien
Basilikata
Kalabrien
Sizilien
Sardinien
Italien
Jeden Tag
1.281
37
477
3.101
294
141
154
1.517
361
1.418
1.091
246
469
1.780
357
82
1.256
846
125
452
1.158
468
16.819
Häufigkeit der Internetnutzung
Einmal
oder
Ein paar
Ein paar
Keine
mehrmals
Mal im
Mal im Jahr
Angabe
in der
Monat
Woche
749
165
54
67
28
4
1
3
295
44
22
31
1.965
330
109
80
225
48
16
30
118
25
10
11
107
23
6
17
940
200
41
63
207
769
687
170
275
1.001
203
43
870
668
93
327
832
292
10.640
42
138
127
20
36
185
53
9
138
92
13
41
141
44
1.871
Quelle: Istat, Cittadini e nuove tecnologie; Statistiche report, 20. Dezember 2012
19
62
32
11
20
45
7
4
24
43
6
13
43
25
597
23
101
90
7
35
174
45
4
69
63
22
39
121
25
1.084
Nie
Insgesamt
1.873
47
659
3.751
357
169
188
1.865
4.189
120
1.528
9.336
970
474
495
4.626
507
1.688
1.512
400
640
2.215
604
161
3.102
2.138
297
1.021
2.439
732
26.008
1.159
4.176
3.539
854
1.475
5.400
1.269
303
5.459
3.850
556
1.893
4.734
1.586
57.019
Wie
erstellt
man in
Excel eine
Kreuztabelle?
Wie bei der
einfachen
Tabelle wird
die Tabelle
mit den
absolu-ten
Häufigkeiten, also
die Tabelle
nach
Einheiten,
verwendet
Kreuztabelle: erstellen (2/5)
Doppelte Verteilung je Einheit: für jede Einheit die Ausprägungen von zwei
Merkmalen:
In Excel: im Menü Einfügen Pivottabelle auswählen. Es öffnet sich das Fenster
«Pivottabelle erstellen», in dem Folgendes spezifiziert werden muss: a) die Daten,
die analysiert werden (gesamte Datenmatrix auswählen), b) wo der PivotChartBericht positioniert wird. Dann auf ok klicken.
Kreuztabelle: erstellen (3/5)
Aus PivotTable-Feldliste die Felder in die untenstehenden Bereiche
ziehen: Spaltenbeschriftung – Zeilenbeschriftung - Werte.
Kreuztabelle: erstellen (4/5)
Um die Tabelle 7 zu nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen
ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte
(Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung)
Kreuztabelle: erstellen (5/5)
Um die Tabelle 6 nachzubauen: ‘Internetnutzung’ in die Spaltenbeschriftungen
ziehen, ‘Region’ in die Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte
(Einstellungen Feld Werte – Zusammenfassung Werte nach - Zählung; zeige Werte
als % der Zeilensumme)
Konzeptualisierung doppelte Verteilung in der
Sprache der Statistiker… (1/4)
z Ausprägung des Merkmals y
Tab. 8 – Doppelte Verteilung der absoluten Häufigkeiten
Carattere y
k modalità del carattere X
Carattere X
Totale
Modalità y1
Modalità y2
.
Modalità yj
.
Modalità yz
Modalità x1
n11
n12
.
n1j
.
n1z
n10
Modalità x2
n21
n22
.
n2j
.
n2z
n20
.
.
.
ni1
ni2
.
niz
ni0
.
.
.
Modalità xk
nk1
nk2
.
nkj
.
nkz
nk0
Totale
n01
n02
.
n0j
.
n0z
n
.
Modalità xi
.
Spalte
mit
Ausprägungen
nij ist die Häufigkeit der
Einheiten, bei denen das
Merkmal X in der Ausprägung xi
und das Merkmal Y in der
Ausprägung yj vorhanden ist.
.
nij
.
Tabellenkopf
ni0 ist die
Häufigkeit der
Einheiten, bei
denen das
Merkmal X in
der Ausprägung xi
vorhanden ist
.
n0j ist die Häufigkeit der Einheiten, bei denen das Merkmal Y in
der Ausprägung yj vorhanden ist
n ist die
Anzahl der
Grundgesamtheit
Konzeptualisierung doppelte Verteilung in der
Sprache der Statistiker … (2/4)
In einer Kreuztabelle können drei verschiedene Arten von relativen
(oder prozentuellen) Häufigkeiten berechnet werden:
1. Doppelte Verteilung von gesamten relativen Häufigkeiten. Diese erhält man, indem
man jede absolute Häufigkeit durch die Gesamtanzahl n dividiert (multipliziert mit
100 ergibt das die gesamten prozentuellen Häufigkeiten).
Tab. 9 – Doppelte Verteilung der gesamten prozentuellen Häufigkeiten
Carattere X
Carattere y
Modalità y1
Modalità y2
.
Modalità yj
.
Modalità yz
Totale
Modalità x1
p11
p12
.
p1j
.
p1z
p10
Modalità x2
p21
p22
.
p2j
.
p2z
p20
.
.
.
pi1
pi2
.
piz
pi0
.
.
.
Modalità xk
pk1
pk2
.
pkj
.
pkz
pk0
Totale
p01
p02
.
p0j
.
p0z
100
.
Modalità xi
.
wobei:
.
pij
.
.
Konzeptualisierung doppelte Verteilung in der
Sprache der Statistiker … (3/4)
2. Verteilung der relativen Häufigkeiten der Spalte.
Diese erhält man, indem man jede absolute Häufigkeit durch die Summe
der jeweiligen Spalte dividiert (multipliziert mit 100 ergeben sich die prozentuellen
Häufigkeiten der Spalte).
So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals X, die
unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des
Merkmals Y verglichen werden.
Tab. 10 – Doppelte Verteilung der prozentuellen Häufigkeiten der Spalte
Carattere X
Carattere y
Modalità y1
Modalità y2
.
Modalità yj
.
Modalità yz
Totale
Modalità x1
p11
p12
.
p1j
.
p1z
100
Modalità x2
p21
p22
.
p2j
.
p2z
100
.
.
.
.
.
.
.
pi1
pi2
.
.
.
.
.
.
.
.
Modalità xk
pk1
pk2
.
pkj
.
pkz
100
Totale
p01
p02
.
p0j
.
p0z
100
.
Modalità xi
.
wobei:
pij
.
piz
100
Konzeptualisierung doppelte Verteilung in der
Sprache der Statistiker … (4/4)
3. Verteilung von relativen Häufigkeiten der Zeile.
Diese erhält man, indem man jede absolute Häufigkeit durch die Summe
der jeweiligen Zeile dividiert (multipliziert mit 100 ergeben sich die prozentuellen
Häufigkeiten der Zeile).
So kann, bei gleicher Anzahl der einzelnen Ausprägungen des Merkmals Y, die
unterschiedliche Zusammensetzung der Einheiten nach den Ausprägungen des
Merkmals X verglichen werden.
Tab. 11 – Doppelte Verteilung der prozentuellen Häufigkeiten der Zeile
Carattere X
Carattere y
Modalità y1
Modalità y2
.
Modalità yj
.
Modalità yz
Totale
Modalità x1
p11
p12
.
p1j
.
p1z
p10
Modalità x2
p21
p22
.
p2j
.
p2z
p20
.
.
.
.
.
.
.
pi1
pi2
.
.
.
.
.
.
.
.
pk1
pk2
.
pkj
.
pkz
pk0
.
Modalità xi
.
Modalità xk
Totale
wobei:
100
100
.
pij
100
.
.
piz
100
pi0
100
Einfache Tabelle: Erstellung mit Pivot-Tabelle
Da wir jetzt das Instrument Pivot-Tabelle kennen, können wir es auch
verwenden, um einfache Tabellen (mit nur einem Merkmal) zu erstellen.
Um die absoluten Häufigkeiten der Tabelle 2 zu
erstellen:
‘Internetnutzung’
in
die
Zeilenbeschriftungen und ‘Einheit’ in das Feld Werte
ziehen
(Einstellungen
Feld
Werte
–
Zusammenfassung Werte nach - Zählung)
Um die prozentuellen Häufigkeiten der Tabelle
2 zu erstellen: ‘Internetnutzung’ in die
Zeilenbeschriftungen und ‘Einheit’ in das Feld
Werte ziehen (Einstellungen Feld Werte –
Zusammenfassung Werte nach - Zählung; zeige
Werte als % der Spaltensumme)
…und jetzt…
Gute Arbeit!
Übersetzung: / Tradotto da:
Rete per la promozione
della cultura statistica
Herunterladen