Die Daten lesen können

Werbung
Einführung in die amtliche Statistik
DIE DATEN LESEN KÖNNEN
Scuola Secondaria di secondo grado; Argomento: Introduzione – Leggere i dati (31.10.2014);
Pacchetto: S2.A.5
INHALT
1) Statistik im Alltag
2) Metadaten: alle Informationen zum Verständnis
der Daten
3) Beispiele für die „unsachgemäße“ Verwendung
der Statistik
4) „Irreführende“ Grafiken
Statistik im Alltag
Die Statistik ist
… die Gesamtheit von Regeln, mit denen es möglich ist, beobachtbare
Phänomene/Merkmale wahrzunehmen – oder genauer wahrzunehmen -,
die aufgrund ihrer Natur in einer bestimmten Variabilität auftreten.
Dort, wo sich die Realität auf sehr komplexe Weise zeigt, wo das Auge
nur schwer die vielen Aspekte und Beziehungen sehen kann, bietet die
Statistik die Instrumente, um die passende „Brille“ bereitzustellen: ein
nützliches Instrument, das – wie normalerweise üblich – in jedem Fall
erst nach dem Lesen und Verstehen der entsprechenden
Gebrauchsanleitung benutzt werden soll…
Blangiardo G.C. (2001), „Statistica, sondaggi e buon senso“
Statistik und Alltag
Die Statistiken sind ein Teil unseres Alltagslebens:
Tabellen, Grafiken, Indikatoren, Mittelwerte, … helfen uns
dabei, die Welt, in der wir leben, übersichtlich abzubilden
und bei Unsicherheiten Entscheidungen zu treffen.
Sie tragen dazu bei, unsere Sicht der Welt zu bestimmen
und den gesunden Menschenverstand zu formen.
Gesunder Menschenverstand: normale und
einfache Art und Weise der meisten Menschen,
etwas zu verstehen und zu bewerten (Il nuovo
Zingarelli)
Statistik und Alltag
Die Statistik gehört zu unserem
Leben, angefangen beim
Weckerklingeln am Morgen.
Jeder stellt den Wecker aufgrund
seiner Erfahrungen, um pünktlich zu
sein, ohne sich beeilen zu müssen
und ohne gleichzeitig auf mehr Schlaf
als notwendig zu verzichten.
Jeder von uns hat „eine Statistik
gemacht“, um den Wecker zu stellen
… auch ohne es zu merken…
Statistik und Alltag
Die Kekse, die wir zum Frühstück
essen, sind das Ergebnis von
statistischen Untersuchungen der
Vorlieben der Konsumenten.
Auch ihre Anordnung in den
Supermarktregalen erfolgt aufgrund von
statistischen Analysen über das
Einkaufsverhalten.
Die Statistik macht das
Fernsehprogramm: Die Sendezeiten der
Sendungen und ihre eventuellen
Wiederholungen werden von den Daten
über die Zuschauerzahlen bestimmt.
Wie wird die Statistik wahrgenommen?
Die Statistik wird häufig aus zwei entgegengesetzten
Blickwinkeln gesehen:
• als Instrument zur Manipulation der Wirklichkeit, deren
vielfältige Ausprägungen sich nicht in den „Käfig“ von
zusammenfassenden und vereinfachenden Darstellungen sperren
lassen
“siconno le statistiche d’adesso
risulta che te tocca un pollo all’anno
e, se nun entra nelle spese tue
t’entra nelle statistiche lo stesso
perché c’è un antro che se magna due”
(Trilussa)
• als absolute und unwiderlegbare Wahrheit
Die Daten sind für sich aussagekräftig; die Daten sind die objektive
Wirklichkeit.
Dies deshalb, weil die Zusammenfassung:
nicht nur einen GEWINN,
Die Kennzahlen (z.B.
Mittelwerte) ermöglichen es,
Zusammenfassungen über
große Grundgesamtheiten zu
erhalten.
… sondern auch einen
VERLUST bringt
Durch die Kennzahlen
gehen Informationen über
die einzelnen
Erhebungseinheiten
verloren.
Durchschnittliche Anzahl der in einem Jahr
gelesenen Bücher = 4
Schüler
Jährlich
gelesene
Bücher
Giacomo
6
Mirella
6
Luca
0
Andrea
5
Valerio
3
Martina
6
Anna
2
Metadaten:
die Informationen zum Verständnis der
Daten
Die Metadaten
•
Um die statistischen Daten richtig zu interpretieren,
benötigt man Metainformationen. Das sind Informationen
über die Verfahren bei der Erhebung und Bearbeitung der
Daten, über die angewandten Definitionen und
Klassifikationen, über die Art der Erhebung (Voll- oder
Stichprobenerhebung) usw.
•
Abgesehen von den Zahlen und Zusammenfassungen,
welche die Statistik generiert, sind die „Zusatzinformationen“ von grundlegender Bedeutung, die angeben, „wie“ die
Schlussfolgerungen gezogen wurden, z.B.:
Wie viele Fälle wurden beobachtet? Die ganze
Grundgesamtheit oder nur ein Teil davon?
Welche Bearbeitungen? Welche Berechnungen wurden
durchgeführt?
-
Eines der Grundprinzipien der amtlichen
Statistik
Die Statistikämter müssen das Recht haben,
fehlerhafte Interpretationen und die falsche
Verwendung der Daten zu beurteilen.
Dies ist das 4. Grundprinzip der amtlichen Statistik laut
UNO und impliziert sowohl ein Recht als auch eine Pflicht:
1) die amtliche Statistik muss sich jeder falschen
Interpretation widersetzen
2) die Einrichtungen der amtlichen Statistik haben das
Recht, irreführende Interpretationen und Missbrauch der
statistischen Ergebnisse zu beurteilen
Beispiele für „unsachgemäße“
Verwendung der Statistik
Dennoch werden die statistischen Daten
manchmal unsachgemäß verwendet
•
um eine bestimmte Wirklichkeit zu zeigen bzw. zu
beweisen, die eventuell von keinen Daten belegt ist
und dementiert scheint
Z.B.: ein Pharmazieunternehmen will ein neues Mundwasser
gegen Halsschmerzen verkaufen und gibt an, dass die
Laboruntersuchungen ergaben, dass 10 mg des Mittels
30.000 Mikroben abtöten.
Stimmt das? Vielleicht ja, aber man fragt sich spontan:
a) Das geschieht in einem Labor, aber im Hals eines Menschen?
Ist es dort gleich wirksam?
b) Wenn ich das Mittel verdünne, damit es nicht im Hals brennt,
ist es dann noch wirksam?
c) Sind eigentlich genau diese Mikroben für die Halsschmerzen
verantwortlich?
Dennoch werden die statistischen Daten
manchmal unsachgemäß verwendet
•
um Aufsehen zu erregen
Z.B.:
Als vor vielen Jahren Frauen an der John Hopkins University
(USA) als Studentinnen zugelassen wurden, verbreitete
jemand die Information, dass 33,3% der Studentinnen
einen Dozenten geheiratet haben.
… Damals waren aber nur drei Frauen an der Universität
eingeschrieben und eine hatte einen Professor geheiratet.
Dennoch werden die statistischen Daten
manchmal unsachgemäß verwendet
• aufgrund von banalen Fehlern
Z.B.:
Eines Tages wurde anlässlich einer Sonnenfinsternis in den
nationalen italienischen Nachrichten auf einem Sender
erklärt, dass dieses Phänomen auftritt, wenn sich die Sonne
zwischen die Erde und den Mond schiebt. Diese Hypothese
einer kosmischen Katastrophe wurde zweimal wiederholt –
und niemand kam auf die Idee, sie zu korrigieren. […] ist ein
Beispiel dafür, wie ein eklatanter Fehler unbeobachtet bleiben
kann.
Giancarlo Livraghi – Capire con le statistiche
Die „fehlenden“ Zahlen
Wenn die Statistiken die Informationen „verdichten“ und
zusammenfassen, ist es wichtig, Folgendes zu kennen:
• sowohl die absoluten Werte (das Ausmaß) des Phänomens;
• als auch die Prozentwerte, d.h. den „Anteil“, den jeder Teil an
der ganzen Grundgesamtheit hält
Beispiel:
Studentinnen
Absolute
Werte
Haben einen
Dozenten geheiratet
1
Haben NICHT einen
Dozenten geheiratet
2
INSGESAMT
3
1
100  33,3%
3
In einem bestimmten
Jahr gab es 3 Studentinnen und eine davon
hat einen Dozenten
geheiratet.
ABSOLUTE und PROZENTWERTE: Die Information ist
korrekt, wenn beide angegeben werden.
Wenn das Merkmal zu „konzentriert“
auftritt
Über 16 erfolgreiche Amerikanerinnen, die von der Handelskammer
von Boston Mitte des 20. Jahrhunderts ausgewählt wurden, wurde
gesagt, dass sie 60 Doktortitel und 18 Kinder haben.
… In dieser Gruppe gab es jedoch zwei „besondere“ Frauen:
Virginia Gildersleeve, Präsidentin des Barnard College, und Lillian M.
Gilbreth, die zusammen mit ihrem Mann für die Entwicklungen der
Industrietechnologien bekannt wurde.
Diese beiden besaßen zusammen ein Drittel aller Doktortitel
und 12 der „18 Kinder“ waren von Frau Gilbreth.
Durchschnittliche Kinderzahl je Frau?
Nehmen wir das Beispiel der 16 Karrierefrauen und
ihrer 18 Kinder:
•
Wenn alle Frauen mit ihren Kindern in der
Grundgesamtheit bleiben:
18
 1,12 Kinder pro Frau
16
• Wenn wir Frau Gilbreth mit ihren 12 Kindern
ausschließen:
6
 0,4
15
Kinder pro Frau
Nicht einmal ein
„halbes“ Kind pro
Frau!!!
Was denkt ihr, wenn ich euch sage, dass
…
Tabelle 1.1.1 – Tätigkeiten an einem durchschnittlichen Wochentag, welche die
Bevölkerung im Alter von 15 Jahren und älter ausübt nach Art der Tätigkeit und einigen
Merkmalen
Jahre 2002-2003 - (allgemeine durchschnittliche Dauer in Stunden und Minuten und
Prozentanteil der Zeit an den 24 Stunden)
MERKMALE
Schlafen, essen
und sonstige
Körperpflege
Allg.
% an 24
MittelStunden
wert
INSGESAMT
12:01
50,0
Bezahlte Arbeit
Allg.
% an 24
MittelStunden
wert
2:36
10,8
Aus- und
Weiterbildung
Allg.
% an 24
MittelStunden
wert
0:25
1,8
… die Bevölkerung Italiens im Alter von 15 Jahren und älter
2002-2003 durchschnittlich 2 Stunden und 36 Minuten am Tag
– gegen Bezahlung – gearbeitet hat?
Fonte: Istat, 2007, L'uso del tempo. Indagine multiscopo sulle famiglie "Uso del tempo“ - Anni 2002-2003, Istat,
Roma (Informazioni, n.2).
Die Ergebnisse genauer betrachten
Tabelle 1.1.10 – Tätigkeiten an Werktagen (Mo-Fr), welche die Bevölkerung im Alter von
15 Jahren und älter ausübt nach Art der Tätigkeit und einigen Merkmalen
Jahre 2002-2003 (spezifische durchschnittliche Dauer in Stunden und Minuten und Häufigkeit
der Beteiligung in Prozenten)
MERKMALE
Schlafen,
Aus- und
essen und
Bezahlte
Weiterbilsonstige
Arbeit
dung
Körperpflege
Spez.
Spez.
Spez.
Mittel% Mittel% Mittel%
wert
wert
wert
INSGESAMT
11:43 100,0
7:41
41,5
6:04
8,2
DEMOGRAFISCHE MERKMALE
ALTERSKLASSEN (Jahre)
15-24
25-44
45-64
65 und mehr
11:31
10:58
11:23
13:30
7:28
7:48
7:38
6:31
26,4
66,6
45,5
3,6
6:33
4:49
2:35
1:48
50,3
4,3
0,9
0,2
100,0
100,0
100,0
100,0
Fonte: ISTITUTO NAZIONALE DI STATISTICA, 2007a. L’uso del tempo. Indagine multiscopo sulle famiglie "Uso del
tempo“ - Anni 2002-2003. Roma: Istat. (Informazioni, n.2). Disponibile su <http://www.istat.it/dati/catalogo/20070301_00/>
[25 ottobre 2010]
Wie lassen sich diese Unterschiede
erklären?
Die scheinbar gegensätzlichen Daten in den beiden
Tabellen erklären sich durch die Berücksichtigung der
folgenden Faktoren:
• Wöchentlicher Bezugstag
 Alle Tage der Woche
 Montag bis Freitag
• „Art“ des verwendeten Mittelwerts:
 allgemeiner Mittelwert
 spezifischer Mittelwert
Durchschnittlicher Wochentag und
allgemeiner Mittelwert
Tabelle 1.1.1 – Tätigkeiten an
einem durchschnittlichen Wochentag, welche die Bevölkerung im Alter von 15 Jahren
und älter ausübt nach Art der
Tätigkeit und einigen
Merkmalen
Durchschnittliche
tägliche Dauer der
bezahlten Arbeit =
2h 36 min
• Bezieht sich auf den durchschnittlichen Wochentag, „zu
dem alle Tage der Woche gehören“ einschließlich Samstag
und Sonntag
• Es ist ein allgemeiner Mittelwert.
Werktag und spezifischer Mittelwert
Tabelle 1.1.10 – Tätigkeiten an
Werktagen (Mo-Fr), welche die
Bevölkerung im Alter von 15
Jahren und älter ausübt nach
Art der Tätigkeit und einigen
Merkmalen
Durchschnittliche
tägliche Dauer der
bezahlten Arbeit =
7h 41 min
• Bezieht sich ausschließlich auf die Werktage, d.h. es
werden nur die Tage von Montag bis Freitag berücksichtigt
• Es ist ein spezifischer Mittelwert.
Allgemeiner und spezifischer Mittelwert

Allgemeiner Mittelwert
„Bei der Berechnung der allgemeinen Mittelwerte beziehen sich
die Zeitabschnitte auf die gesamte Grundgesamtheit (…). Die
allgemeine durchschnittliche Dauer einer Tätigkeit gibt
beispielsweise an, wie viel Zeit im Durchschnitt von der
gesamten Grundgesamtheit, einschließlich derjenigen, die
sie nicht ausgeübt haben, dafür aufgewendet wurde.“

Spezifischer Mittelwert
„Dieser Indikator wird nur für den Teil der Grundgesamtheit
berechnet, der die Tätigkeit tatsächlich ausgeübt hat.“
„Irreführende“ Grafiken
Die Grafiken
Das sind statistische Instrumente, die Folgendes
ermöglichen:
• die erhobenen Informationen zu einem beobachteten
Phänomen schneller interpretieren,
• sofort einige Merkmale erfassen.
Das bedeutet nicht, dass die Grafiken die Zahlen in den
Tabellen ersetzen können: Sie sollen nur ein weiteres,
nützliches Hilfsmittel für die statistische Analyse sein.
Grafische oder tabellarische Darstellung?
Einige Vorteile der Grafiken gegenüber den Tabellen, die sie
ergänzen, sind:
- unmittelbare Abbildung der Entwicklung des Phänomens
(z.B.: gibt es einen Anstieg oder einen Rückgang?) und der
Struktur der Verteilung (z.B.: mehr Frauen oder mehr Männer?),
was eine globale Beschreibung der Daten ermöglicht
- Zusammenfassung und somit die Möglichkeit, auf einem
kleinen Raum mehrere Verteilungen zu vergleichen (Kurven,
gebrochene Linien usw.)
-
leserfreundlichere Form für statistische Daten als Tabellen
In jedem Fall muss daran gedacht werden, dass …
… eine Grafik alle notwendigen Informationen zum
Verständnis der dargestellten Daten enthalten muss, damit sie
nützlich und aussagekräftig ist. D.h.:
- der Titel muss den Gegenstand, den Ort und die Zeit
enthalten, auf die sich die Daten beziehen
- die Merkmale mit den jeweiligen Ausprägungen (z.B.:
„Männer“ und „Frauen“ für die Variable „Geschlecht“), nach
denen die Erhebungseinheiten klassifiziert sind
- die Maßeinheit der Achsen
- die Datenquelle
Aber auch eine „gut gemachte“ Grafik…
… kann zu einer verzerrten Wahrnehmung des
Phänomens führen, wenn man sie nicht aufmerksam
betrachtet!
Das Phänomen nimmt zu: wie viel?
Die zwei Grafiken
zeigen beide den
Anstieg der
Arbeitslosenquote
zwischen Oktober
2011 und Oktober
2012.
Der einzige Unterschied
besteht im Ausgangspunkt der Ordinatenachse: bei der oberen
Grafik (jener in der
Publikation) fehlt der Teil
zwischen dem Ursprung
(null) und dem Wert 8,7.
Die „untenstehende“ Tabelle
Jahr
2011
2012
Arbeitslosenquote
(%)
Oktober
8,8
November
9,4
Dezember
9,5
Jänner
9,7
Februar
10,0
März
10,3
April
10,5
Mai
10,5
Juni
10,6
Juli
10,5
August
10,5
September
10,8
Oktober
11,1
Monat
Kreisdiagramme sind nützlich bei der
Darstellung der Anteile der einzelnen
Merkmale am Gesamten
Zu viele Kategorien!
Die explodierten Kreise können die
Wahrnehmung des Phänomens verzerren!
Schlussfolgerungen…
Schüler
Pro Jahr
gelesene
Bücher
Giacomo
6
Mirella
6
Luca
0
Andrea
5
Valerio
3
Martina
6
Anna
2
… damit die Statistik und ihre
Instrumente nützlich und sinnvoll
eingesetzt werden können, sollte
man lernen, einen zweiten Blick
auf die Zahlen zu werfen!
Durchschnittliche
Anzahl der in einem
Jahr gelesenen
Bücher = 4
…und jetzt…
Gute Arbeit!
Rete per la promozione
della cultura statistica
Per ulteriori moduli didattici relativi alle scuole secondarie di secondo grado si prega di consultare anche la
piattaforma Scuola di statistica – Lab (accessibile dal link http://scuoladistatistica-lab.istat.it/)
Herunterladen