Einführung in die amtliche Statistik DIE DATEN LESEN KÖNNEN Scuola Secondaria di secondo grado; Argomento: Introduzione – Leggere i dati (31.10.2014); Pacchetto: S2.A.5 INHALT 1) Statistik im Alltag 2) Metadaten: alle Informationen zum Verständnis der Daten 3) Beispiele für die „unsachgemäße“ Verwendung der Statistik 4) „Irreführende“ Grafiken Statistik im Alltag Die Statistik ist … die Gesamtheit von Regeln, mit denen es möglich ist, beobachtbare Phänomene/Merkmale wahrzunehmen – oder genauer wahrzunehmen -, die aufgrund ihrer Natur in einer bestimmten Variabilität auftreten. Dort, wo sich die Realität auf sehr komplexe Weise zeigt, wo das Auge nur schwer die vielen Aspekte und Beziehungen sehen kann, bietet die Statistik die Instrumente, um die passende „Brille“ bereitzustellen: ein nützliches Instrument, das – wie normalerweise üblich – in jedem Fall erst nach dem Lesen und Verstehen der entsprechenden Gebrauchsanleitung benutzt werden soll… Blangiardo G.C. (2001), „Statistica, sondaggi e buon senso“ Statistik und Alltag Die Statistiken sind ein Teil unseres Alltagslebens: Tabellen, Grafiken, Indikatoren, Mittelwerte, … helfen uns dabei, die Welt, in der wir leben, übersichtlich abzubilden und bei Unsicherheiten Entscheidungen zu treffen. Sie tragen dazu bei, unsere Sicht der Welt zu bestimmen und den gesunden Menschenverstand zu formen. Gesunder Menschenverstand: normale und einfache Art und Weise der meisten Menschen, etwas zu verstehen und zu bewerten (Il nuovo Zingarelli) Statistik und Alltag Die Statistik gehört zu unserem Leben, angefangen beim Weckerklingeln am Morgen. Jeder stellt den Wecker aufgrund seiner Erfahrungen, um pünktlich zu sein, ohne sich beeilen zu müssen und ohne gleichzeitig auf mehr Schlaf als notwendig zu verzichten. Jeder von uns hat „eine Statistik gemacht“, um den Wecker zu stellen … auch ohne es zu merken… Statistik und Alltag Die Kekse, die wir zum Frühstück essen, sind das Ergebnis von statistischen Untersuchungen der Vorlieben der Konsumenten. Auch ihre Anordnung in den Supermarktregalen erfolgt aufgrund von statistischen Analysen über das Einkaufsverhalten. Die Statistik macht das Fernsehprogramm: Die Sendezeiten der Sendungen und ihre eventuellen Wiederholungen werden von den Daten über die Zuschauerzahlen bestimmt. Wie wird die Statistik wahrgenommen? Die Statistik wird häufig aus zwei entgegengesetzten Blickwinkeln gesehen: • als Instrument zur Manipulation der Wirklichkeit, deren vielfältige Ausprägungen sich nicht in den „Käfig“ von zusammenfassenden und vereinfachenden Darstellungen sperren lassen “siconno le statistiche d’adesso risulta che te tocca un pollo all’anno e, se nun entra nelle spese tue t’entra nelle statistiche lo stesso perché c’è un antro che se magna due” (Trilussa) • als absolute und unwiderlegbare Wahrheit Die Daten sind für sich aussagekräftig; die Daten sind die objektive Wirklichkeit. Dies deshalb, weil die Zusammenfassung: nicht nur einen GEWINN, Die Kennzahlen (z.B. Mittelwerte) ermöglichen es, Zusammenfassungen über große Grundgesamtheiten zu erhalten. … sondern auch einen VERLUST bringt Durch die Kennzahlen gehen Informationen über die einzelnen Erhebungseinheiten verloren. Durchschnittliche Anzahl der in einem Jahr gelesenen Bücher = 4 Schüler Jährlich gelesene Bücher Giacomo 6 Mirella 6 Luca 0 Andrea 5 Valerio 3 Martina 6 Anna 2 Metadaten: die Informationen zum Verständnis der Daten Die Metadaten • Um die statistischen Daten richtig zu interpretieren, benötigt man Metainformationen. Das sind Informationen über die Verfahren bei der Erhebung und Bearbeitung der Daten, über die angewandten Definitionen und Klassifikationen, über die Art der Erhebung (Voll- oder Stichprobenerhebung) usw. • Abgesehen von den Zahlen und Zusammenfassungen, welche die Statistik generiert, sind die „Zusatzinformationen“ von grundlegender Bedeutung, die angeben, „wie“ die Schlussfolgerungen gezogen wurden, z.B.: Wie viele Fälle wurden beobachtet? Die ganze Grundgesamtheit oder nur ein Teil davon? Welche Bearbeitungen? Welche Berechnungen wurden durchgeführt? - Eines der Grundprinzipien der amtlichen Statistik Die Statistikämter müssen das Recht haben, fehlerhafte Interpretationen und die falsche Verwendung der Daten zu beurteilen. Dies ist das 4. Grundprinzip der amtlichen Statistik laut UNO und impliziert sowohl ein Recht als auch eine Pflicht: 1) die amtliche Statistik muss sich jeder falschen Interpretation widersetzen 2) die Einrichtungen der amtlichen Statistik haben das Recht, irreführende Interpretationen und Missbrauch der statistischen Ergebnisse zu beurteilen Beispiele für „unsachgemäße“ Verwendung der Statistik Dennoch werden die statistischen Daten manchmal unsachgemäß verwendet • um eine bestimmte Wirklichkeit zu zeigen bzw. zu beweisen, die eventuell von keinen Daten belegt ist und dementiert scheint Z.B.: ein Pharmazieunternehmen will ein neues Mundwasser gegen Halsschmerzen verkaufen und gibt an, dass die Laboruntersuchungen ergaben, dass 10 mg des Mittels 30.000 Mikroben abtöten. Stimmt das? Vielleicht ja, aber man fragt sich spontan: a) Das geschieht in einem Labor, aber im Hals eines Menschen? Ist es dort gleich wirksam? b) Wenn ich das Mittel verdünne, damit es nicht im Hals brennt, ist es dann noch wirksam? c) Sind eigentlich genau diese Mikroben für die Halsschmerzen verantwortlich? Dennoch werden die statistischen Daten manchmal unsachgemäß verwendet • um Aufsehen zu erregen Z.B.: Als vor vielen Jahren Frauen an der John Hopkins University (USA) als Studentinnen zugelassen wurden, verbreitete jemand die Information, dass 33,3% der Studentinnen einen Dozenten geheiratet haben. … Damals waren aber nur drei Frauen an der Universität eingeschrieben und eine hatte einen Professor geheiratet. Dennoch werden die statistischen Daten manchmal unsachgemäß verwendet • aufgrund von banalen Fehlern Z.B.: Eines Tages wurde anlässlich einer Sonnenfinsternis in den nationalen italienischen Nachrichten auf einem Sender erklärt, dass dieses Phänomen auftritt, wenn sich die Sonne zwischen die Erde und den Mond schiebt. Diese Hypothese einer kosmischen Katastrophe wurde zweimal wiederholt – und niemand kam auf die Idee, sie zu korrigieren. […] ist ein Beispiel dafür, wie ein eklatanter Fehler unbeobachtet bleiben kann. Giancarlo Livraghi – Capire con le statistiche Die „fehlenden“ Zahlen Wenn die Statistiken die Informationen „verdichten“ und zusammenfassen, ist es wichtig, Folgendes zu kennen: • sowohl die absoluten Werte (das Ausmaß) des Phänomens; • als auch die Prozentwerte, d.h. den „Anteil“, den jeder Teil an der ganzen Grundgesamtheit hält Beispiel: Studentinnen Absolute Werte Haben einen Dozenten geheiratet 1 Haben NICHT einen Dozenten geheiratet 2 INSGESAMT 3 1 100 33,3% 3 In einem bestimmten Jahr gab es 3 Studentinnen und eine davon hat einen Dozenten geheiratet. ABSOLUTE und PROZENTWERTE: Die Information ist korrekt, wenn beide angegeben werden. Wenn das Merkmal zu „konzentriert“ auftritt Über 16 erfolgreiche Amerikanerinnen, die von der Handelskammer von Boston Mitte des 20. Jahrhunderts ausgewählt wurden, wurde gesagt, dass sie 60 Doktortitel und 18 Kinder haben. … In dieser Gruppe gab es jedoch zwei „besondere“ Frauen: Virginia Gildersleeve, Präsidentin des Barnard College, und Lillian M. Gilbreth, die zusammen mit ihrem Mann für die Entwicklungen der Industrietechnologien bekannt wurde. Diese beiden besaßen zusammen ein Drittel aller Doktortitel und 12 der „18 Kinder“ waren von Frau Gilbreth. Durchschnittliche Kinderzahl je Frau? Nehmen wir das Beispiel der 16 Karrierefrauen und ihrer 18 Kinder: • Wenn alle Frauen mit ihren Kindern in der Grundgesamtheit bleiben: 18 1,12 Kinder pro Frau 16 • Wenn wir Frau Gilbreth mit ihren 12 Kindern ausschließen: 6 0,4 15 Kinder pro Frau Nicht einmal ein „halbes“ Kind pro Frau!!! Was denkt ihr, wenn ich euch sage, dass … Tabelle 1.1.1 – Tätigkeiten an einem durchschnittlichen Wochentag, welche die Bevölkerung im Alter von 15 Jahren und älter ausübt nach Art der Tätigkeit und einigen Merkmalen Jahre 2002-2003 - (allgemeine durchschnittliche Dauer in Stunden und Minuten und Prozentanteil der Zeit an den 24 Stunden) MERKMALE Schlafen, essen und sonstige Körperpflege Allg. % an 24 MittelStunden wert INSGESAMT 12:01 50,0 Bezahlte Arbeit Allg. % an 24 MittelStunden wert 2:36 10,8 Aus- und Weiterbildung Allg. % an 24 MittelStunden wert 0:25 1,8 … die Bevölkerung Italiens im Alter von 15 Jahren und älter 2002-2003 durchschnittlich 2 Stunden und 36 Minuten am Tag – gegen Bezahlung – gearbeitet hat? Fonte: Istat, 2007, L'uso del tempo. Indagine multiscopo sulle famiglie "Uso del tempo“ - Anni 2002-2003, Istat, Roma (Informazioni, n.2). Die Ergebnisse genauer betrachten Tabelle 1.1.10 – Tätigkeiten an Werktagen (Mo-Fr), welche die Bevölkerung im Alter von 15 Jahren und älter ausübt nach Art der Tätigkeit und einigen Merkmalen Jahre 2002-2003 (spezifische durchschnittliche Dauer in Stunden und Minuten und Häufigkeit der Beteiligung in Prozenten) MERKMALE Schlafen, Aus- und essen und Bezahlte Weiterbilsonstige Arbeit dung Körperpflege Spez. Spez. Spez. Mittel% Mittel% Mittel% wert wert wert INSGESAMT 11:43 100,0 7:41 41,5 6:04 8,2 DEMOGRAFISCHE MERKMALE ALTERSKLASSEN (Jahre) 15-24 25-44 45-64 65 und mehr 11:31 10:58 11:23 13:30 7:28 7:48 7:38 6:31 26,4 66,6 45,5 3,6 6:33 4:49 2:35 1:48 50,3 4,3 0,9 0,2 100,0 100,0 100,0 100,0 Fonte: ISTITUTO NAZIONALE DI STATISTICA, 2007a. L’uso del tempo. Indagine multiscopo sulle famiglie "Uso del tempo“ - Anni 2002-2003. Roma: Istat. (Informazioni, n.2). Disponibile su <http://www.istat.it/dati/catalogo/20070301_00/> [25 ottobre 2010] Wie lassen sich diese Unterschiede erklären? Die scheinbar gegensätzlichen Daten in den beiden Tabellen erklären sich durch die Berücksichtigung der folgenden Faktoren: • Wöchentlicher Bezugstag Alle Tage der Woche Montag bis Freitag • „Art“ des verwendeten Mittelwerts: allgemeiner Mittelwert spezifischer Mittelwert Durchschnittlicher Wochentag und allgemeiner Mittelwert Tabelle 1.1.1 – Tätigkeiten an einem durchschnittlichen Wochentag, welche die Bevölkerung im Alter von 15 Jahren und älter ausübt nach Art der Tätigkeit und einigen Merkmalen Durchschnittliche tägliche Dauer der bezahlten Arbeit = 2h 36 min • Bezieht sich auf den durchschnittlichen Wochentag, „zu dem alle Tage der Woche gehören“ einschließlich Samstag und Sonntag • Es ist ein allgemeiner Mittelwert. Werktag und spezifischer Mittelwert Tabelle 1.1.10 – Tätigkeiten an Werktagen (Mo-Fr), welche die Bevölkerung im Alter von 15 Jahren und älter ausübt nach Art der Tätigkeit und einigen Merkmalen Durchschnittliche tägliche Dauer der bezahlten Arbeit = 7h 41 min • Bezieht sich ausschließlich auf die Werktage, d.h. es werden nur die Tage von Montag bis Freitag berücksichtigt • Es ist ein spezifischer Mittelwert. Allgemeiner und spezifischer Mittelwert Allgemeiner Mittelwert „Bei der Berechnung der allgemeinen Mittelwerte beziehen sich die Zeitabschnitte auf die gesamte Grundgesamtheit (…). Die allgemeine durchschnittliche Dauer einer Tätigkeit gibt beispielsweise an, wie viel Zeit im Durchschnitt von der gesamten Grundgesamtheit, einschließlich derjenigen, die sie nicht ausgeübt haben, dafür aufgewendet wurde.“ Spezifischer Mittelwert „Dieser Indikator wird nur für den Teil der Grundgesamtheit berechnet, der die Tätigkeit tatsächlich ausgeübt hat.“ „Irreführende“ Grafiken Die Grafiken Das sind statistische Instrumente, die Folgendes ermöglichen: • die erhobenen Informationen zu einem beobachteten Phänomen schneller interpretieren, • sofort einige Merkmale erfassen. Das bedeutet nicht, dass die Grafiken die Zahlen in den Tabellen ersetzen können: Sie sollen nur ein weiteres, nützliches Hilfsmittel für die statistische Analyse sein. Grafische oder tabellarische Darstellung? Einige Vorteile der Grafiken gegenüber den Tabellen, die sie ergänzen, sind: - unmittelbare Abbildung der Entwicklung des Phänomens (z.B.: gibt es einen Anstieg oder einen Rückgang?) und der Struktur der Verteilung (z.B.: mehr Frauen oder mehr Männer?), was eine globale Beschreibung der Daten ermöglicht - Zusammenfassung und somit die Möglichkeit, auf einem kleinen Raum mehrere Verteilungen zu vergleichen (Kurven, gebrochene Linien usw.) - leserfreundlichere Form für statistische Daten als Tabellen In jedem Fall muss daran gedacht werden, dass … … eine Grafik alle notwendigen Informationen zum Verständnis der dargestellten Daten enthalten muss, damit sie nützlich und aussagekräftig ist. D.h.: - der Titel muss den Gegenstand, den Ort und die Zeit enthalten, auf die sich die Daten beziehen - die Merkmale mit den jeweiligen Ausprägungen (z.B.: „Männer“ und „Frauen“ für die Variable „Geschlecht“), nach denen die Erhebungseinheiten klassifiziert sind - die Maßeinheit der Achsen - die Datenquelle Aber auch eine „gut gemachte“ Grafik… … kann zu einer verzerrten Wahrnehmung des Phänomens führen, wenn man sie nicht aufmerksam betrachtet! Das Phänomen nimmt zu: wie viel? Die zwei Grafiken zeigen beide den Anstieg der Arbeitslosenquote zwischen Oktober 2011 und Oktober 2012. Der einzige Unterschied besteht im Ausgangspunkt der Ordinatenachse: bei der oberen Grafik (jener in der Publikation) fehlt der Teil zwischen dem Ursprung (null) und dem Wert 8,7. Die „untenstehende“ Tabelle Jahr 2011 2012 Arbeitslosenquote (%) Oktober 8,8 November 9,4 Dezember 9,5 Jänner 9,7 Februar 10,0 März 10,3 April 10,5 Mai 10,5 Juni 10,6 Juli 10,5 August 10,5 September 10,8 Oktober 11,1 Monat Kreisdiagramme sind nützlich bei der Darstellung der Anteile der einzelnen Merkmale am Gesamten Zu viele Kategorien! Die explodierten Kreise können die Wahrnehmung des Phänomens verzerren! Schlussfolgerungen… Schüler Pro Jahr gelesene Bücher Giacomo 6 Mirella 6 Luca 0 Andrea 5 Valerio 3 Martina 6 Anna 2 … damit die Statistik und ihre Instrumente nützlich und sinnvoll eingesetzt werden können, sollte man lernen, einen zweiten Blick auf die Zahlen zu werfen! Durchschnittliche Anzahl der in einem Jahr gelesenen Bücher = 4 …und jetzt… Gute Arbeit! Rete per la promozione della cultura statistica Per ulteriori moduli didattici relativi alle scuole secondarie di secondo grado si prega di consultare anche la piattaforma Scuola di statistica – Lab (accessibile dal link http://scuoladistatistica-lab.istat.it/)