Datenanalyse (dan) Prof. Dr. Marcel Steiner-Curtis 10. November 2015 Prof. Dr. Marcel Steiner-Curtis FHNW Fachhochschule Nordwestschweiz Hochschule für Technik Bahnhofstrasse 6 CH-5210 Windisch [email protected] www.fhnw.ch/personenseiten/marcel.steiner/ Liebe Studierende Was, schon wieder Mathematik! So, oder ähnlich könnte es zu Beginn der statistischen Datenanalyse tönen. Jein, die statistische Datenanalyse basiert zwar auf der Mathematik, ist aber in den letzten Jahren zunehmend zu einem eigenständigen, voll akzeptierten und nicht mehr weg zu denkenden Teil der modernen Natur- und Ingenieurwissenschaften geworden. Im Gegensatz zur klassischen Mathematik, in der die meisten Ideen seit mehr als 200 Jahren bekannt sind, ist Statistik eine moderne Wissenschaft. Sie hat mit dem Aufkommen leistungsfähiger Computer immense Fortschritte gemacht. Plötzlich ist es möglich, riesige Datenmengen zu verarbeiten und z.B. auf interessante und verborgene Muster systematisch zu durchkämmen. (Stichwort: Data-Mining.) Dies ist mitunter ein Grund, wenn nicht der Grund, dass wir bei den Übungen voll auf den Computer setzen. Die Aufgaben in diesem Skriptum bearbeiten wir (fast) alle mit Excel. Dazu verwenden wir die zahlreichen eingebauten Statistikfunktionen, z.B. NORMINV, TTEST, FTEST, CHIVERT, um nur einige zu nennen. Tafeln lesen ist nun endgültig passé – halt, nicht ganz. Die Tafeln im Anhang dienen Ihnen zur “Kalibrierung” der Computerbefehle. Häufig stehen wir nämlich vor dem Problem Wie ist das Quantil mit diesem oder dem anderen ” Computerprogramm definiert?” Um dies zu beantworten, können Sie nun solange mit dem jeweiligen Computerbefehl herum hantieren, bis Sie den Zahlenwert in der Tafel – die Sie ja verstehen – erhalten. Und dann steht Ihnen nichts mehr im Weg, statistische Tests en Masse durchzuführen. Aber Achtung! Zuerst denken – dann Computereinsatz. Zum Vorlesungs- und Übungsbetrieb ist nicht viel zu schreiben: Ich erkläre, motiviere, führe vor; Sie üben, lernen, üben, versuchen zu begreifen, und üben. Die Aufgaben und Lösungen können Sie vom Active Directory der Hochschule für Technik, FHNW herunterladen. Ich bin mir sicher, Statistik ist eines der wenigen Fachgebiete, das Sie bis in alle Ewigkeit verfolgen wird, sei es beim Zeitunglesen, bei der TV- und Radio-Berieselung oder im Beruf. Eine Bitte noch habe ich an Sie: Seien Sie auf der Hut! Wie Sie wissen, wird mit Statistik jede Menge Unfug betrieben. Es ist mir ein besonderes Anliegen, dass Sie kritisch und wachsam betreffend allen Zahlenangaben und Statistiken sind, die Sie selber anfertigen und antreffen (speziell meinen gegenüber). Sie kennen sicher einige der häufig gehörten Bonmots: Ich glaube keiner Statistik, die ich nicht selbst gefälscht habe.“ ” Sir Winston Churchill, 1874-1965 (ungesichert) Alles, was lediglich wahrscheinlich ist, ist wahrscheinlich falsch.“ ” René Descartes, 1596-1650 Die Statistik ist die erste der ungenauen Wissenschaften.“ ” Edmond de Goncourt, 1822-1896 i ii Es gibt drei Arten der Lüge, die gewöhnliche Lüge, die Notlüge und die Statistik.“ ” Mark Twain, 1835-1910 To call in the statistician after the experiment is done may be no more than ” asking him to perform a postmortem examination: he may be able to say what the experiment died of.“ Sir R. A. Fisher, Indian Statistical Congress, Sankhya, um 1938 Je planmässiger ein Mensch vorgeht, desto wirksamer vermag ihn der Zufall zu ” treffen.“ Friedrich Dürrenmatt, 1921-1990. Man sollte alles so einfach wie möglich sehen, aber nicht einfacher.“ ” Albert Einstein, 1879-1955 Prediction is very difficult, especially about the future.“ ” Niels Bohr, 1885-1962 Sie sind die n plus ersten Studierenden, die mit diesem Skriptum arbeiten. Urteilen Sie nicht zu hart über den Autor (und die k-ten Studierenden, wobei k ∈ {1, . . . , n}), wenn Sie Fehler und Ungereimtheiten finden, sondern teilen Sie mir diese bitte mit. 10. November 2015, Marcel Steiner-Curtis Inhaltsverzeichnis Liebe Studierende i Inhaltsverzeichnis iii 1 Einführung 1.1 Was ist Statistik, statistische Datenanalyse? . . . . . . 1.2 Aktienkurse – Der Traum, die Zukunft vorauszusagen 1.3 Prognosen zu Weltrekorden im Sport . . . . . . . . . . 1.4 Was die Werbung verspricht . . . . . . . . . . . . . . . . . . . 1 1 3 3 5 2 Grundlagen 2.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 11 3 Fehlerrechnung 3.1 Der wahre Wert einer zu messenden Grösse . . . . . . 3.2 Wahrscheinlichster Wert einer Messgrösse . . . . . . . 3.3 Fehlerfortpflanzung . . . . . . . . . . . . . . . . . . . . 3.4 Berechnung des Fehlers bei speziellen Funktionstypen . 3.5 Erforderliche Messgenauigkeit . . . . . . . . . . . . . . . . . . . 17 18 18 19 22 24 4 Statistische Tests 4.1 Das Prinzip des statistischen Tests . . . . . . . . . . . . . . . . . . . . . . . 4.2 Einseitiger und zweiseitiger Test . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Mögliche Fehler bei statistischen Tests . . . . . . . . . . . . . . . . . . . . . 27 27 29 31 5 Prüfen von Erwartungswerten (Parametertests) 5.1 Problemstellung der technischen Statistik . . . . . . . . . . . . . . . . . 5.2 Einstichproben-t-Test, Student-t-Test . . . . . . . . . . . . . . . . . . . . 5.2.1 Vertrauensintervall für den Erwartungswert . . . . . . . . . . . . 5.2.2 Ungefähr erforderlicher Stichprobenumfang . . . . . . . . . . . . 5.3 Vergleich zweier Mittelwerte unverbundener Stichproben . . . . . . . . . 5.3.1 Zweistichproben-t-Test bei unbekannten aber gleichen Varianzen 5.3.2 Zweistichproben-t-Test bei unbekannten Varianzen . . . . . . . . 5.4 Paarweiser Vergleich bei verbundenen Stichproben . . . . . . . . . . . . 35 35 36 40 42 42 43 45 46 iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv Inhaltsverzeichnis 6 Prüfen von Varianzen (Parametertests) 6.1 Abweichung einer Varianz vom theoretischen Wert, χ2 -Varianztest 6.1.1 Vertrauensintervall für die Varianz . . . . . . . . . . . . . . 6.2 Vergleich zweier Varianzen, F -Test . . . . . . . . . . . . . . . . . . 6.3 Vergleich von mehreren Varianzen, Cochran-Test . . . . . . . . . . . . . . 49 49 52 54 58 7 Verteilungsfreie (parameterfreie) Tests 7.1 Vorzeichentest nach Dixon und Mood . . . . . . . . . . . . . . . . . . . . . . 7.2 Test auf Zufälligkeit – Runtest . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 64 8 Prüfen der Verteilung der Grundgesamtheit 8.1 Wahrscheinlichkeitspapier für die Normalverteilung 8.2 Test auf Schiefe und Exzess – Momentenmethode . 8.3 χ2 -Anpassungstest . . . . . . . . . . . . . . . . . . 8.4 Lilliefors-Test auf Normalverteilung . . . . . . . . . . . . . 69 69 74 76 80 9 Das Ausreisserproblem 9.1 Ausreissertest nach Grubbs für Stichprobenwerte . . . . . . . . . . . . . . . 9.2 Ausreissertest nach Grubbs für Mittelwerte . . . . . . . . . . . . . . . . . . 9.3 Ausreissertest nach Cochran für Varianzen . . . . . . . . . . . . . . . . . . . 83 84 85 85 10 Varianzanalyse – ANOVA 10.1 Einfaktorielle Varianzanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . 87 87 11 Regressionsrechnung 11.1 Regressionsgerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Allgemeine Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 93 96 12 Regressionsanalyse 12.1 Allgemeines . . . . . . . . . . . . . 12.2 Regressionsgerade . . . . . . . . . . 12.3 Regressionsanalyse einer Geraden . 12.4 Regressionsanalyse zweier Geraden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 103 105 106 109 13 Zeitreihen 13.1 Universelles Beispiel . . . . . . . . . . . . . . . . . 13.2 Zerlegung einer Zeitreihe in Komponenten . . . . . 13.3 Schätzung und Elimination des Trends . . . . . . . 13.4 Schätzung und Elimination der Saisonkomponente 13.5 Prognose . . . . . . . . . . . . . . . . . . . . . . . . 13.6 Ein-Schritt-Prognose bei bereinigten Zeitreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 114 114 115 118 120 122 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Fehlerquellen bei statistischen Untersuchungen 125 Tafeln 129 Literaturverzeichnis 148 Index 151 Kapitel 1 Einführung 1.1 Was ist Statistik, statistische Datenanalyse? Statistik1 ist eine Sammlung von Methoden, welche uns erlauben, vernünftige Entscheidungen ” im Fall von Unsicherheit zu treffen.“ (vgl. [24]). Die statistische Datenanalyse hat die Aufgabe, Erscheinungen in der Natur, Wirtschaft und Technik mit den Mitteln der Stochastik anhand von konkreten Daten zu untersuchen und wissenschaftlich zu beurteilen. Ihr Anwendungsgebiet reicht heutzutage von der Medizin über die Biologie, Physik, Wirtschaftswissenschaften und Technik bis zur Industrie. Die Methoden der mathematischen Statistik sind überall dort zu einem unentbehrlichen Hilfsmittel geworden, wo Versuchsergebnisse auszuwerten sind. Der Ursprung der mathematischen Statistik liegt im Sammeln und Zusammenstellen von Daten und in der grafischen Darstellung dieser Messergebnisse. In der Bevölkerungsstatistik entstanden auf diese Weise die ersten Geburts-, Heirats- und Sterberegister. Seit jeher war es ein grundlegendes Ziel, das umfangreiche und oft unübersichtliche Datenmaterial zu ordnen und auf einzelne charakteristische Werte zu reduzieren. Dies führte zu Tabellen, grafischen Darstellungen und zur Bildung von Mittelwerten und Varianzen. Später wurden diese Methoden der beschreibenden (deskriptiven) Statistik auch auf die naturwissenschaftlichen und technischen Gebiete angewandt. Mit Hilfe der beschreibenden Statistik erhalten wir aber immer nur Aussagen über die vorliegende Stichprobe2 . Wir möchten aber auch ausgehend von der konkret vorhandenen Stichprobe allgemeingültige Aussagen über die Grundgesamtheit machen können. Dabei handelt es sich um die schliessende (induktive) Statistik, welche vor allem durch die bahnbrechenden Arbeiten von K. Pearson (1857-1936), seinem Sohn E. S. Pearson (1895-1980), R. A. Fisher (1890-1962), A. N. Kolmogoroff (1903-1987), und N. W. Smirnov (1900-1966) vorangetrieben wurden. Heute sind wir bestrebt, die schliessende Statistik auf allen Gebieten der Ingenieur- und Naturwissenschaften einzusetzen, in denen Daten auszuwerten und zu analysieren sind. Da ohne sie eine fundierte wissenschaftliche Beurteilung der zu untersuchenden Messergebnisse nur unvollständig möglich ist. Wegen den grossen anfallenden Datenmengen ist der Einsatz modernster Computerhilfsmittel 1 status lat. Beschreibung des Zustandes eines Gemeinwesens wie der Bevölkerungsgrösse. Das Wort stammt aus der Verhüttung von Eisenerz des ausgehenden Mittelalters. Die Hüttenleute haben aus dem Schmelzofen eine zufällige Probe genommen, indem Sie mit einem Probelöffel in das flüssige Eisenerz hineinstachen und so einen Stich herausnahmen, um dessen Reinheit und Schmelzzustand zu überprüfen. 2 1 2 Kapitel 1. Einführung Abbildung 1.1.i: Karl Pearson, 1857-1936 Abbildung 1.1.ii: Egon Sharpe Pearson, 1895-1980 Abbildung 1.1.iii: Sir Ronald Aylmer Fisher, 1890-1962 Abbildung 1.1.iv: Andrey Nikolaevich Kolmogoroff, 1903-1987 (Excel, S-Plus, R, SAP) zur statistischen Datenanalyse unumgänglich. Gerade deswegen muss der Anwender wissen, was die verwendeten Programme berechnen, und wie die Ergebnisse zu interpretieren sind. Heutzutage wird leider jede Menge Unfug mit Statistik betrieben. Mit zu präzisen Zahlen und statistischen Auswertungen werden dem interessierten Leser oft Seriosität vorgegaukelt, die nicht sein kann. Die Verwendung von statistischen Tests, deren Voraussetzungen nicht erfüllt sind, führt oft zu falschen Rückschlüssen. Aus kleinen Stichproben dürfen Aussagen mit Statistik gemacht werden aber mit einer entsprechenden grossen Unsicherheit3 . Bei einer gegebenen Fragestellung gibt es oft mehrere richtige Ansätze zur Datenanalyse. Wichtig dabei ist, Statistik korrekt einzusetzen, Resultate nicht über zu interpretieren und vor allem nicht voreingenommen Datenmaterial zu untersuchen. Oft wird aus Unwissenheit oder manipulativ so lange statistische Datenanalyse betrieben, bis das gewünschte Resultat vorliegt. Dies hat 3 Ideal ist natürlich immer, die Stichprobe grösser zu machen. Dass dies aber nicht immer möglich ist, zeigt das Beispiel eines Biologen, der Aussagen über eine bestimmte Fischspezie machen will (muss) und der in seinem Aquarium nur fünf Fische hat. Er muss einfach damit leben können, dass die Unsicherheiten seiner Aussagen sehr gross sind. 1.2. Aktienkurse – Der Traum, die Zukunft vorauszusagen 3 aber nichts mit wissenschaftlichem Arbeiten zu tun (vgl. [10]). Deshalb müssen wir lernen, was mit statistischen Methoden alles ausgesagt werden darf und kann. 1.2 Aktienkurse – Der Traum, die Zukunft vorauszusagen Ein wichtiges und sicher einträgliches Anwendungsgebiet der statistischen Datenanalyse ist die Analyse von Finanzmarktdaten, z.B. von Aktien-, Wechsel- und Zinskursen. Ziele sind etwa das Aufspüren von systematischen Strukturen, der Einfluss bestimmter politischer oder wirtschaftlicher Ereignisse, schnelles Erkennen von Veränderungen und Entscheidungsunterstützung für An- und Verkauf sowie Portfoliogestaltung. Neben Kursen einzelner Aktien bilden dazu auch die Werte eines Aktienindex eine wichtige Datengrundlage. Bekannte Aktienindizes sind etwa der Dow-Jones-Index, NASDAQ, Nikkei-Index (Japan), der Deutsche Aktienindex oder der Swiss Market Index. Haben wir zum Beispiel eine Aktie über die letzten paar Jahre oder Monate beobachtet und jeweils ihren Kurswert xt in einem Diagramm in Funktion der diskreten Zeit t (z.B. jeden Handelstag) aufgezeichnet, so erhalten wir eine so genannte Zeitreihe (vgl. Kapitel 13). Indem wir nun versuchen einen Trend, saisonale oder andere, eventuell periodische Einflüsse mit einem geeigneten Model zu erkennen, könnten wir zukunftsgerichtete Aussagen über die Rendite einer Aktie unter Berücksichtigung ihres Risikos machen. Diese Überlegungen, die jeden Tag zig-tausendfach gemacht werden, basieren natürlich auf der Idee, dass sich hinter der Kursentwicklung einer Aktie eine mathematische Gesetzmässigkeit verbirgt. Abbildung 1.2.i: Aktienkurs der Vodafone Group, einem Telekommunikationsunternehmen, über die letzten fünf Jahre betrachtet. Der Kurseinbruch im Frühjahr 2000 liess sich in keiner Weise aus dem vorhandenen Datenmaterial schliessen. Hingegen können wir lokale Trends ausmachen. Aber wir sehen deutlich, dass je länger der Prognosehorizont wird, desto unzuverlässiger wird der vergangene Trend. 1.3 Prognosen zu Weltrekorden im Sport Der Spiegel hat 1992 gemeldet, dass die schnellste Frau im Jahr 1998 den Marathon in derselben Zeit läuft wie der schnellste Mann. Es stellt sich natürlich die Frage, wie diese Hypothese 4 Kapitel 1. Einführung entstanden ist und wieso die Folgerungen der Autoren falsch waren, denn bis zum heutigen Zeitpunkt, also nach 1998, sind die Männer im Marathon immer noch deutlich schneller als die Frauen. Zeigt dies, dass in der Statistik jede beliebige Aussage bekommen werden kann, wenn die Daten nur ins entsprechende Licht gerückt werden? Rekorde auf der Aschenbahn: Frauen holen auf4 Keine der derzeitigen Weltrekordhalterinnen in den Laufdisziplinen könnte bei den Olym” pischen Spielen im Sommer bei der männlichen Konkurrenz mitmachen: Die Frauen würden die Qualifikationsnormen nicht erreichen. Das wird sich, so jedenfalls spekulieren die amerikanischen Physiologen Brian J. Whipp und seine Kollegin Susan A. Ward von der University of California, im Laufe der kommenden Jahrzehnte ändern. Schon 1998 wird nach Ansicht der Wissenschaftler eine Frau in der Lage sein, die Marathonstrecke von 42.195 Kilometer ebenso schnell zu laufen wie der dann schnellste Mann ... in zwei Stunden und zwei Minuten. Die Gleichheit der Geschlechter auf der 200-Meter-Strecke soll, bei einer Zeit von 18.6 Sekunden, spätestens im Jahre 2050 erreicht sein. Zu dieser kühnen Hochrechnung gelangten die Physiologen bei einem Vergleich der Durchschnittsgeschwindigkeiten, die auf den verschiedenen Laufstrecken gemessen wurden. Dabei ergab sich über die Jahrzehnte ein gleichmässiger Tempozuwachs – mit nur einem Unterschied: Bei den Frauen stieg die Beschleunigungskurve doppelt so schnell. So steigerten die männlichen Weltrekordler ihre Durchschnittsleistung seit 1908 von 241 Meter je Minute auf 332 Meter. Die Frauen hingegen schafften allein seit 1963 etwa 105 Meter mehr – ihre Minutenleistung stieg von 194 auf 299 Meter.“ Abbildung 1.3.i: Entwicklung der Weltrekorde im Marathon bei den Männern und Frauen. Die Laufgeschwindigkeit wurde jeweils in Metern pro Minute aufgetragen. Die Frauen konnten die Durchschnittsgeschwindigkeit in den letzten 30 Jahren erheblich verbessern, die Steigerung bei den Männern verlief viel langsamer. Dies veranlasste die Autoren des Artikels zur offensichtlich falschen Schlussfolgerung, dass die Marathonlaufzeiten von Frauen und Männern spätestens im Jahre 1998 gleich sein werden. Zum Glück haben die Autoren keine Prognose für das Jahr in dem wir leben gewagt. Es ginge gar nicht so lang, bis die Marathonstrecke mit Lichtgeschwindigkeit durchlaufen würde. Aufgabe Aufgabe 1.3.1. Finden Sie anhand der beiden Tabellen der Entwicklung der Weltrekorde im Marathon heraus, wie die amerikanischen Physiologen zu obiger Behauptung kamen. Wieso ist die Studie falsch? Wo liegen die Fehlüberlegungen? 4 vgl. Der Spiegel 3/1992 1.4. Was die Werbung verspricht Jahr 1908 1909 1913 1920 1925 1935 1947 1952 1953 1954 1958 1960 1963 1964 1965 1967 1969 1984 1985 1988 (1998) (1999) (2002) (2003) (2007) (2008) Männer [in min] 175.31 160.57 156.11 152.60 149.03 146.70 145.65 140.70 138.58 137.66 135.28 135.27 134.47 132.19 132.00 129.61 128.56 128.08 127.20 126.93 (126.05) (125.42) (125.38) (124.55) (124.26) (123.59) 5 Jahr 1963 1964 1967 1970 1974 1975 1977 1978 1979 1980 1981 1983 1985 (1998) (1999) (2001) (2002) (2003) Frauen [in min] 217.12 199.55 195.37 182.88 163.90 158.32 154.80 152.50 147.55 145.68 145.48 142.72 141.10 (140.47) (139.46) (138.47) (137.18) (135.25) In Klammern sind die Weltrekorde aufgetragen, die nach 1998 gelaufen wurden. Die Zeiten sind erst ab 1908 aufgeführt, da vorher die Marathonstrecke etwas kürzer war. Wenn in einem Jahr die Zeit mehrmals verbessert wurde, ist nur die Jahresweltbestzeit in der Tabelle aufgenommen. Quelle: http://de.wikipedia.org/wiki/Marathonlauf 1.4 Was die Werbung verspricht Wie zufrieden sind Firmenkunden mit ihren Telekommunikationsanbietern? Das Beratungsunternehmen ocha GmbH untersuchte im Auftrag der Zeitschrift BILANZ die Zufriedenheit der Schweizer Wirtschaft mit den Telecom-Providern in der Schweiz. Dabei ging es um die Aspekte Qualität, Innovation, Preis, Flexibilität und Support – das alles in den Bereichen Festnetz, Mobile, Corporate Networks und Internet-Service-Provider. Angefragt wurden 15000 Informatik- und Telecom-Leiter aus verschiedenen Unternehmen. Die Studie wurde in der Septemberausgabe 2003 der Zeitschrift BILANZ publiziert. Die Quintessenz der Studie ist gemäss BILANZ : Besser werden dürften alle. Am besten schlägt ” sich [der Anbieter] Colt – als Sieger in zwei Disziplinen.“ In der Studie steht weiter: Deutlich ” nach unten ging es mit Sunrise dafür im Bereich Internet-Service-Provider“ und . . .im Mo” bilfunk, sind die drei Anbieter Swisscom, Orange und Sunrise nahe zusammengerückt. Nach stetigem Aufwärtstrend hat heuer zum ersten Mal Orange die Führung übernommen“. Generell lässt sich aus der Studie herauslesen, dass sich die beiden Anbieter Swisscom und Sunrise im breiten Mittelfeld mit einer durchschnittlichen Leistung befinden. Nun hat auf Grund dieser Studie die Firma Sunrise ein ganzseitiges Inserat in der Basler 6 Kapitel 1. Einführung Zeitung vom 4. Oktober 2003 geschaltet, in dem sich Sunrise nur mit Swisscom vergleicht. Dies mit der Begründung, dass die beiden die einzigen Full-Service-Provider sind. Im Inserat befand sich die in Abbildung 1.4.i abgebildete Säulengrafik. Aus diesen Zahlen kommt nun Sunrise zum Schluss: Möchten Sie von Ihrem Provider einen Full-Service, gibt es in der Schweiz nur ” zwei Varianten. Welche die bessere ist, können Sie sich jetzt noch leichter ausrechnen. . .“ Abbildung 1.4.i: Säulengrafik der Sunrise-Werbung in der BaZ vom Freitag, 4. Oktober 2003. Es steht da . . .können Sie sich jetzt noch leichter ausrechnen. . .“, nichts leichteres als das. ” Leider kommen beim Betrachten der Säulengrafik starke Zweifel auf. Die vertikale Achse ist genau so angeschrieben, dass ein maximaler Werbeeffekt erzielt werden konnte. Informieren wir uns aber in der BILANZ -Studie, so vernehmen wir, dass sich die vertikale Achse in Wirklichkeit von 5(!) bis 30 erstreckt5 . Sind Unterschiede von 0.1, 0.4 und 1.5 Punkten auf total 25 wirklich signifikant? Wohl kaum. In Kapitel 5.4 werden wir einen statistischen Test kennen lernen, der uns besagt, dass aus diesem Zahlenmaterial unter keinen Umständen der Schluss gezogen werden kann, dass Sunrise besser ist als Swisscom. Die Frage, ob es sich bei der BILANZ -Studie um eine seriöse handelt, ist eine andere. Tatsache ist, dass 19.5 beim Sunrise-Festnetz falsch ist. In der Studie wird 4.6 + 4.1 + 3.3 + 4.4 + 3.2 gleich 19.5 gesetzt. Hätten die Leute bei Sunrise die BILANZ -Studie wirklich angeschaut, so hätten sie sich vielleicht zu folgender Inserate-Headline hinreissen lassen: Ein Kantersieg auf ” der ganzen Linie!“ Aufgabe Aufgabe 1.4.1 (lebenslang zu lösen). Seien Sie wachsam, ob in den Medien, in der Werbung, in der Politik, am Arbeitsplatz oder unter Freunden statistische Daten seriös verarbeitet und kommuniziert werden. Identifizieren Sie unseriöse Ergebnisse und seien Sie in der Lage, bessere Analysen durchzuführen. Im Extremfall sollten Sie bei jeder Prozent- und Zahlenangabe, die Ihnen an den Kopf geworfen wird, nachfragen, wie diese zu Stande gekommen sei. 5 Die einzelnen Punkte setzen sich aus fünf Teilnoten von 1 bis 6 zusammen. Kapitel 2 Grundlagen Die mathematische Statistik und im Speziellen die Statistische Datenanalyse, für die wir uns hier interessieren, basieren wesentlich auf der Stochastik. Die Vorlesung über Stochastik aus dem dritten Semester (vgl. [7], [9] oder [22]) wird hiermit als bekannt vorausgesetzt. Im Folgenden wollen wir kurz die wichtigsten Begriffe und Ideen repetieren. Betrachten wir einen Versuch mit dem Stichprobenraum S. Jedem Ausfall s von S sei eine reelle Zahl zugeordnet X : S −→ R s 7−→ X(s) = x Eine solche Zuordnung heisst eine Wahrscheinlichkeitsfunktion und X eine Zufallsgrösse oder Zufallsvariable.1 Nimmt die Wahrscheinlichkeitsverteilung nur diskrete Werte an, dann handelt es sich um eine diskrete Verteilung sonst um eine stetige Verteilung. An Hand eines einprägsamen Beispiels betrachten wir den Unterschied zwischen einer diskreten und einer stetigen Verteilung: Beispiel 2.0.1. Der Stichprobenraum S sei die Menge aller Studierenden einer Klasse. Die Zufallsgrösse X ordne nun jedem Studierenden s die Länge in Zentimeter seines rechten Fusses zu. In diesem Fall können alle Fusslängen im Intervall [5cm, 40cm] angenommen werden. Die Fusslängen einer Klasse sind also stetig verteilt. Fragen wir nun aber nach der jeweiligen Schuhnummer der Studierenden, so erhalten wir nur Werte in der Menge {34, 34 12 , 36, . . . , 46, 46 12 }. Die Schuhnummern einer Klasse sind somit diskret verteilt. Je nach dem welches Merkmal betrachtet wird, kann also eine Stichprobe zu einer diskreten oder stetigen Verteilung führen. 2.1 Diskrete Verteilungen Die Verteilung einer diskreten Zufallsgrösse X, die die Werte x1 , . . . , xn annehmen kann, wird durch die Angabe ihrer Wahrscheinlichkeiten charakterisiert. Jedem Ausfall si aus dem Stichprobenraum S, respektive X(si ) = xi , entspricht eine Wahrscheinlichkeit pi = P (X = xi ) ∈ [0, 1] 1 Zufallsgrössen werden im Allgemeinen mit grossen lateinischen Buchstaben X, Y, Z, . . . und die Werte, die sie annehmen, mit kleinen lateinischen Buchstaben x, y, z, . . . bezeichnet. 7 8 Kapitel 2. Grundlagen als Funktion von xi aufgefasst. Im diskreten Fall gilt n X pi = 1. i=1 Die pi können in Form einer Tabelle angegeben werden. Die Verteilungsfunktion F einer diskreten Zufallsgrösse ist durch X F (x) = P (X ≤ x) = pi alle i mit xi ≤x gegeben. Die Summation erfolgt über alle pi , für die xi höchstens gleich x ist. Die Verteilungsfunktion F ist eine monoton wachsende Treppenfunktion mit Sprüngen der Höhe pi an den Stellen xi . Der Erwartungswert der diskreten Zufallsgrösse X beträgt µ = E(X) = n X xi p i , i=1 die Varianz oder Streuung ist n n X X σ 2 = Var(X) = E (X − µ)2 = (xi − µ)2 pi = x2i pi − µ2 . i=1 i=1 Die (positive) Quadratwurzel σ heisst Standardabweichung. Wir repetieren kurz einige wichtige diskrete Verteilungen. Die Binomialverteilung Die Binomialverteilung beschäftigt sich mit Ereignissen, bei denen zwei alternative Ausgänge auftreten können, wie zum Beispiel Münzwurf (Kopf oder Zahl, gleich wahrscheinlich) oder beim Werfen eines Würfels (6 oder keine 6 geworfen, ungleich wahrscheinlich). Wir betrachten also einen Versuch mit zwei möglichen Ausfällen: • Erfolg mit Wahrscheinlichkeit p ∈ [0, 1]. • Misserfolg mit Wahrscheinlichkeit q = 1 − p ∈ [0, 1]. Dieser Versuch werde n mal durchgeführt. Es sei X die Zufallsgrösse, deren Werte x die Anzahl Erfolge bei n Versuchen bedeute. Wir bestimmen nun die Wahrscheinlichkeitsverteilung von X. Bei n Versuchen gibt es genau nx Anordnungen mit x Erfolgen und n−x Misserfolgen. Damit erhalten wir die Binomialverteilung n x n−x n x = p (1 − p)n−x . P (X = x) = p q x x Der Erwartungswert einer binomialverteilten Zufallsgrösse beträgt µ = E(X) = np, die Varianz oder Streuung einer binomialverteilten Zufallsgrösse ist σ 2 = Var(X) = npq. Die Standardabweichung der binomialverteilten Zufallsgrösse beträgt σ = √ npq. 2.1. Diskrete Verteilungen 9 p p pn q pn−1 q p pn−2 q 2 q pn−3 q 3 p q q p p px q n−x q px−1 q n−x+1 p q q p p q q 1 2 ··· n−1 p p3 q n−3 q p2 q n−2 p pq n−1 q qn n Abbildung 2.1.i: Wahrscheinlichkeitsbaum der Binomialverteilung mit Erfolgs- p und Misserfolgswahrscheinlichkeit q = 1 − p. Aufgaben Aufgabe 2.1.1. Es werden drei ideale Würfel gleichzeitig geworfen. Die Zufallsgrösse X sei die Anzahl Sechsen. Bestimmen Sie die Wahrscheinlichkeitsverteilung, den Erwartungswert und die Varianz von X. Aufgabe 2.1.2. Einer Lieferung wird mit Zurücklegen eine Stichprobe vom Umfang n = 40 entnommen. Falls die Stichprobe mehr als zwei unbrauchbare Teile enthält, dann wird die Lieferung zurückgewiesen. Gesucht ist die Annahmewahrscheinlichkeit P der Lieferung, wenn sie p = 1% unbrauchbare Teile enthält. Lösungen Lösung 2.1.1. Wahrscheinlichkeitsverteilung xi pi 0 0.5787 Erwartungswert µ = 0.5, Varianz σ 2 = Lösung 2.1.2. P = 0.9925 1 0.3472 5 12 . 2 0.0694 3 0.0046 10 Kapitel 2. Grundlagen Die Poissonverteilung Bei vielen Anwendungen, die eigentlich mit der Binomialverteilung zusammenhängen, ist die Erfolgswahrscheinlichkeit p beim einzelnen Experiment klein, das heisst, der Erfolg ist ein seltenes Ereignis. Gleichzeitig ist die Anzahl n der Ausführungen sehr gross. In einem solchen Fall approximieren wir die Binomialverteilung durch die Poissonverteilung. Diese ergibt sich, wenn n so gegen unendlich strebt, dass der Erwartungswert µ = np gegen einen endlichen Wert strebt. Die Poissonverteilung besitzt die folgende Wahrscheinlichkeitsverteilung µx −µ P (X = x) = e x! mit dem positiven Parameter µ und x ∈ N0 . Der Erwartungswert und die Varianz oder Streuung der Poissonverteilung sind µ = E(X) = µ und σ 2 = Var(X) = µ, d.h., bei der Poissonverteilung sind Erwartungswert und Varianz gleich dem Parameter µ. In der praktischen Anwendung finden sich zahlreiche Beispiele für das Auftreten poissonverteilter Zufallsgrössen. So kann die Anzahl der auf einer Kreuzung innerhalb einer festen Zeitspanne (eine Minute) vorbeifahrender Fahrradfahrer als poissonverteilt angesehen werden. Die Wahrscheinlichkeit dafür, dass in einer Minute genau x Fahrradfahrer vorbeifahren, wenn die Anzahl der vorbeifahrenden Fahrradfahrer je Minute im Durchschnitt µ beträgt, ist x dann durch µx! e−µ gegeben. Weitere Beispiele für poissonverteilte Zufallsgrössen sind: • Die Anzahl der innerhalb einer kurzen Zeitspanne zerfallenden Atome eines radioaktiven Präparats. • In einer Spinnerei die Anzahl der Fadenbrüche innerhalb einer vorgegebenen Zeitspanne bei einer bestimmten Garnsorte. • Die Anzahl der während einer festen Zeit beobachteten Sternschnuppen. • Die Anzahl Kinder, die an einem Tag in einer Stadt zur Welt kommen. Da die Poissonverteilung ein Grenzfall der Binomialverteilung ist, kann je nach Genauigkeitsansprüchen für etwa p ≤ 0.1 und n ≥ 100 statt der Binomialverteilung auch die Poissonverteilung verwendet werden. Aufgaben Aufgabe 2.1.3. Eine Fabrik produziert Präzisonswerkstücke, die mit einer Wahrscheinlichkeit p = 0.001 defekt sind. Wie gross ist die Wahrscheinlichkeit, dass eine Lieferung von n = 500 Werkstücken mindestens 2 unbrauchbare Werkstücke enthält. Aufgabe 2.1.4. Die Schwiegermutter kommt im Jahr etwa zehnmal zu Besuch. Wie gross ist die Wahrscheinlichkeit, dass sie in den nächsten drei Wochen mindestens einmal vorbeischaut? 2.2. Stetige Verteilungen 11 Lösungen Lösung 2.1.3. P = 0.0902 Lösung 2.1.4. P = 44% 2.2 Stetige Verteilungen Viele physikalische Messungen sind Beispiele von stetigen Zufallsgrössen. Für die Verteilungsfunktion F einer stetigen Zufallsgrösse X, die jeden Wert in einem bestimmten Intervall annehmen kann, gilt Z x Z x F (x) = P (X ≤ x) = f (x) dx = f (t) dt. −∞ −∞ Die nichtnegative Funktion f heisst Wahrscheinlichkeitsdichte von X. Wir stellen die wichtigsten Eigenschaften der Funktionen F und f zusammen. 1. Die Funktion F ist stetig, monoton wachsend mit F (−∞) = 0 und F (+∞) = 1. 2. Der Gesamtflächeninhalt unter der Wahrscheinlichkeitsdichtekurve ist gleich 1, d.h. Z ∞ f (x) dx = 1. −∞ 3. Es gilt d dx F (x) = F ′ (x) = f (x) für alle x ∈ R. 4. Die Wahrscheinlichkeit ein Ereignis zwischen x1 und x2 zu erhalten, beträgt Z x2 P (x1 ≤ X ≤ x2 ) = f (x) dx = F (x2 ) − F (x1 ). x1 y 1 F (x) f (x) x x Abbildung 2.2.i: Verteilungsfunktion F und Wahrscheinlichkeitsdichte F ′ = f . Der Erwartungswert der stetigen Zufallsgrösse X beträgt Z ∞ µ = E(X) = xf (x) dx, die Varianz oder Streuung ist Z σ 2 = Var(X) = E (X − µ)2 = −∞ ∞ −∞ (x − µ)2 f (x) dx = Z ∞ −∞ x2 f (x) dx − µ2 . 12 Kapitel 2. Grundlagen Aufgaben Aufgabe 2.2.1. Bestimmen Sie den Parameter a in ax2 wenn 0 ≤ x ≤ 1 f (x) = 0 sonst. so, dass f eine Wahrscheinlichkeitsdichte ist. Bestimmen Sie dann den Erwartungswert und die Varianz dieser Verteilung. Berechnen Sie P (0.5 ≤ X ≤ 1). Aufgabe 2.2.2. Die Dichtefunktion einer stetigen Verteilung laute ax(2 − x) wenn 0 ≤ x ≤ 2 f (x) = 0 sonst. a. Bestimmen Sie den Parameter a, so dass es sich bei f in der Tat um eine Dichtefunktion handelt. b. Wie lautet die dazugehörige Verteilungsfunktion? c. Berechnen Sie die Wahrscheinlichkeit, dass die Zufallsgrösse X einen Wert kleiner oder gleich 1 annimmt. Aufgabe 2.2.3. Pumpen eines bestimmten Typs laufen im Mittel etwa 100 Stunden bis zum Ausfall. Eine bestimmte Pumpe sei ununterbrochen in Betrieb, bis sie ausfalle. Die Zufallsgrösse X, die die zufällige Dauer der Funktionsfähigkeit der Pumpe beschreibt, sei stetig verteilt mit der Dichte der Form 0 wenn x < 0 f (x) = 2 −λx λ xe wenn x ≥ 0. Bestimmen Sie den Parameter λ so, dass der Erwartungswert der Verteilung der Erfahrung mit dem Pumpentyp entspricht. Wie gross ist die Wahrscheinlichkeit, dass eine Pumpe dieses Typs weniger als 100 Stunden läuft? Lösungen Lösung 2.2.1. a = 3, µ = 34 , σ 2 = 3 80 , P (0.5 ≤ X ≤ 1) = Lösung 2.2.2. a. a = 3 4 b. F (x) = 0 1 2 4 (3x 1 wenn x < 0 − x3 ) wenn 0 ≤ x ≤ 2 wenn x > 2 c. P (X ≤ 1) = 0.5 Lösung 2.2.3. λ = 1 50 , P (X ≤ 100) = 0.5941 7 8 2.2. Stetige Verteilungen 13 Die Normalverteilung Die bekannteste und bei allen Problemen der Statistik und der statistischen Datenanalyse am häufigsten verwendete Verteilung einer stetigen Zufallsgrösse ist die Gausssche Normalverteilung. Die stetige Zufallsgrösse X, die alle reellen Werte zwischen −∞ und +∞ annehmen kann, besitzt eine Normalverteilung mit den Parametern µ und σ 2 , wenn ihre Dichte durch (x−µ)2 1 f (x) = ϕ(x, µ, σ 2 ) = √ e− 2σ2 für − ∞ < x < ∞ 2πσ 2 gegeben ist. Symbolisch schreiben wir X ∼ N (µ, σ 2 ). Bei bekannten Werten µ und σ ist die Gestalt der Dichtefunktion völlig bestimmt. Die Verteilungsfunktion erhalten wir durch Integration der Dichte Z x (x−µ)2 1 2 e− 2σ2 dx. F (x) = Φ(x, µ, σ ) = √ 2πσ 2 −∞ Für obiges Integral gibt es keine elementare Stammfunktion, dies ist aber kein Problem, da für die Anwendungen stets Tafeln oder Computerprogramme (z.B. Excel) verwendet werden können. Tragen wir die Dichte ϕ in Abhängigkeit von x in ein kartesisches Koordinatensystem ein, so ergibt sich die bekannte Gestalt der Gaussschen Glockenkurve. Das Maximum von ϕ liegt bei x = µ und beträgt √ 1 2 . Die Dichte ist symmetrisch bezüglich x = µ und nähert 2πσ sich für x → ±∞ asymptotisch der x-Achse. Die Wendepunkte liegen bei x = µ ± σ. Damit ist die Glockenkurve um so höher und steiler, je kleiner σ ist. Der Erwartungswert und die Varianz oder Streuung der normalverteilten Zufallsgrösse X beträgt E(X) = µ und Var(X) = σ 2 . Die Parameter der Normalverteilung lassen sich damit leicht deuten: µ ist der Erwartungswert der Zufallsgrösse X und σ 2 die Varianz. Durch eine Massstabsänderung auf der Koordinatenachse und einer Nullpunktverschiebung auf der x-Achse x−µ z= σ kann von der Normalverteilung mit den Parametern µ und σ 2 zur standardisierte Normalverteilung mit den Parametern µ = 0 und σ 2 = 1 übergegangen werden, symbolisch Z ∼ N (0, 1). Die Dichte ist dann z2 1 f (z) = ϕ(z, 0, 1) = √ e− 2 2π und die Verteilungsfunktion 1 F (z) = Φ(z, 0, 1) = √ 2π Z z e− z2 2 dz. −∞ Diese Transformation gestattet die Benutzung der Tabelle T.1 zur Berechnung der Verteilungsfunktion einer N (µ, σ 2 ) normalverteilten Zufallsgrösse aus der standardisierten Normalverteilung. Die Anwendung dieser Transformation, die im wesentlichen einer Integralsubstitution entspricht, führt uns auf folgende Berechnungsformeln für Wahrscheinlichkeiten von 14 Kapitel 2. Grundlagen normalverteilten Zufallsgrössen X ∼ N (µ, σ 2 ). Es gilt Z x2 (x−µ)2 1 P (x1 ≤ X ≤ x2 ) = √ e− 2σ2 dx = Φ(x2 , µ, σ 2 ) − Φ(x1 , µ, σ 2 ) 2πσ 2 x1 Z x2 −µ σ z2 1 =√ e− 2 dz = Φ x2σ−µ , 0, 1 − Φ x1σ−µ , 0, 1 x1 −µ 2π σ und im Falle von unbeschränkten Intervallen P (X ≤ x2 ) = Φ(x2 , µ, σ 2 ) = Φ x2 −µ σ , 0, 1 , P (x1 ≤ X) = 1 − P (X < x1 ) = 1 − Φ(x1 , µ, σ 2 ) = 1 − Φ x1 −µ σ , 0, 1 . Die letzte Beziehung folgt direkt aus der Symmetrie der Normalverteilung bezüglich x = µ und der Normierung des gesamten Flächeninhalts unter der Glockenkurve auf Eins. Die Bedeutung der Normalverteilung in der Statistik Die Normalverteilung wurde von C. F. Gauss (1809) im Zusammenhang mit seiner Theorie der Beobachtungsfehler entdeckt. Sie wird daher auch Fehlerkurve genannt. Führen wir in der Praxis wiederholt Messungen an ein und demselben Gegenstand, etwa der Länge eines Stabes oder Durchmessers einer Welle durch, so ergibt bekanntlich nicht jede Messung den gleichen Wert. Die erhaltenen Werte weisen kleinere oder grössere Abweichungen voneinander und von einem bestimmten “wahren” Wert, dem Mittelwert, auf. Diese Abweichungen oder Beobachtungsfehler haben verschiedene Ursachen, wie zum Beispiel Schwankungen der Raumtemperatur, Einflüsse der Umgebung auf das Messgerät, Ungenauigkeiten der Messskala, Wechsel im Prüfpersonal usw. Nach ihrer Herkunft unterscheiden wir zwischen systematischen und zufälligen Fehlern. Die groben Fehler (z.B. Ablesefehler oder defekte Instrumente) schliessen wir von vornherein aus, da sie im Prinzip vermeidbar sind. 1. Systematische Fehler: Systematische Fehler sind oft nicht vermeidbar. Zu ihnen gehören Nullpunktsverschiebungen oder Skalenfehler. Die Ursache kann bei Mängeln an den Instrumenten liegen. Systematische Fehler können meistens beseitigt werden. 2. Zufällige Fehler: Sie ergeben sich aus dem Zusammenwirken zahlreicher Fehlerursachen, die vom Beobachter nicht erfasst oder beseitigt werden können. Zufällige Fehler sind unvermeidbar. Sie entstehen zum Beispiel aus Mängeln des Beobachters, Witterungseinflüssen, Erschütterungen, Ablagerung von Staub usw. Solche Einflüsse ergeben Zufälligkeiten. Solche zufällige Fehler, Zufallsgrössen, verursachen bei Messungen Abweichungen nach beiden Seiten vom wahren Wert. Sprechweise: Die Messwerte streuen. Mit Hilfe der Theorie der Grenzwertsätze können Verteilungen für diese zufälligen Fehler gefunden werden. In den meisten Fällen, wo durch additive Überlagerung einer grossen Anzahl voneinander unabhängiger, zufälliger Effekte entstehen, wobei jeder dieser Effekte nur einen unbedeutenden Einfluss auf den zufälligen Gesamtfehler hat, ergibt sich als Grenzverteilung die Normalverteilung. Diesem Sachverhalt liegt der Zentrale Grenzwertsatz zu Grunde, der aussagt, dass unter bestimmten Bedingungen jede Summe (unabhängiger) Zufallsgrössen näherungsweise normalverteilt ist. Aus diesem Grund können in den meisten praktischen Anwendungsfälle die Beobachtungsfehler bei Messvorgängen wenigstens näherungsweise als normalverteilt angesehen werden. 2.2. Stetige Verteilungen 15 Ein wichtiger Spezialfall des Zentralen Grenzwertsatzes, der Grenzwertsatz von de Moivre und Laplace, spielt eine wichtige Rolle in der mathematischen Statistik. Dieser besagt, dass eine binomialverteilte Zufallsgrösse X mit Erwartungswert E(X) = np und Varianz Var(X) = np(1 − p), näherungsweise normalverteilt mit den Parametern µ = np und σ 2 = np(1 − p) ist. Danach können wir für eine binomialverteilte Zufallsgrösse X für grosses n die Näherungsformel ! ! x2 − np x1 − np P (x1 ≤ X ≤ x2 ) ≈ Φ p , 0, 1 − Φ p , 0, 1 (2.2.a) np(1 − p) np(1 − p) verwenden. In der Literatur wird diese Näherung als Faustregel für n > 9 p(1−p) empfohlen. Aufgaben Aufgabe 2.2.4. Bestimmen Sie die folgenden Wahrscheinlichkeiten einer standardisierten Normalverteilung. a. Ein-σ-Bereich: P (−1 ≤ X ≤ 1) b. Zwei-σ-Bereich: P (−2 ≤ X ≤ 2) c. Drei-σ-Bereich: P (−3 ≤ X ≤ 3) d. P (X ≤ 1) e. P (|X| ≥ 12 ) f. P (−3 ≤ X ≤ 1) Aufgabe 2.2.5. Berechnen Sie a. die Wahrscheinlichkeit P (−4 ≤ X ≤ 8) wenn X ∼ N (2, 4); b. die Wahrscheinlichkeit P (2 ≤ X) wenn X ∼ N (1, 9); c. die Wahrscheinlichkeit P (|X| ≤ 1) wenn X ∼ N (−1, 16). Aufgabe 2.2.6. Bei einer Herstellung von Kugellagerkugeln ist der Durchmesser einer Kugel eine normalverteilte Zufallsgrösse mit µ = 5.00 mm und σ = 0.04 mm. Alle Kugeln, deren Durchmesser um mehr als 0.05 mm vom Sollwert abweichen, werden als Ausschuss aussortiert. Wie gross ist der Ausschussprozentsatz? Aufgabe 2.2.7. Der Intelligenzquotient (IQ) ist eine in guter Näherung normalverteilte Zufallsgrösse X und habe in einer bestimmten Population die Parameterwerte µ = 100 und σ = 15. a. Mit welcher Wahrscheinlichkeit hat eine zufällig ausgewählte Person einen IQ zwischen 100 und 130? b. Mit welcher Wahrscheinlichkeit nimmt die Zufallsgrösse IQ einen Wert an, der grösser ist, als 130? 16 Kapitel 2. Grundlagen c. Welchen Mindestintelligenzquotienten haben die 10% der Intelligentesten dieser Population? Aufgabe 2.2.8. Eine Abfüllmaschine füllt ein Erzeugnis in Dosen. Das Nettogewicht einer Dose ist eine normalverteilte Zufallsgrösse. Die Standardabweichung, als Mass für die Präzision mit der die Maschine arbeitet, sei 8 g. Auf welchen Mittelwert ist die Maschine einzustellen, wenn höchstens 5% aller Dosen weniger als 250 g enthalten sollen? Lösungen Lösung 2.2.4. a. P (−1 ≤ X ≤ 1) = 0.6827 b. P (−2 ≤ X ≤ 2) = 0.9545 c. P (−3 ≤ X ≤ 3) = 0.9973 d. P (X ≤ 1) = 0.8413 e. P (|X| ≥ 12 ) = 0.6171 f. P (−3 ≤ X ≤ 1) = 0.8400 Lösung 2.2.5. a. P (−4 ≤ X ≤ 8) = 0.9973 b. P (2 ≤ X) = 0.3694 c. P (|X| ≤ 1) = 0.1915 Lösung 2.2.6. 21.13% Lösung 2.2.7. a. P (100 ≤ X ≤ 130) = 0.4772 b. P (130 ≤ X) = 0.0228 c. IQ ≥ 119.23 Lösung 2.2.8. µ = 263.2 g Kapitel 3 Fehlerrechnung Jede physikalische Messung ist mit Fehlern behaftet. Die so genannten groben, systematischen und die zufälligen Fehler können unterschieden werden: 1. Grobe Fehler: Sie entstehen etwa bei falscher Beobachtung oder schadhaften Instrumenten. Sie sind im Prinzip vermeidbar. 2. Systematische Fehler: Zu ihnen gehören Nullpunktsverschiebungen oder Skalenfehler. Die Ursache kann bei Mängeln an den Instrumenten liegen. Systematische Fehler sind entweder systematisch grösser oder systematisch kleiner als der wahre Wert einer Grösse. Sie können meistens beseitigt werden. 3. Zufällige Fehler: Sie ergeben sich aus dem Zusammenwirken zahlreicher Fehlerursachen, die vom Beobachter nicht erfasst oder beseitigt werden können. Sie entstehen zum Beispiel aus Mängeln des Beobachters, Witterungseinflüssen usw. Solche Einflüsse ergeben Zufälligkeiten. Da positive und negative Vorzeichen gleich wahrscheinlich sind, kompensieren sich gewisse Teilfehler. Zufällige Fehler gehorchen den Gesetzen der Statistik. Sie sind unvermeidbar, und wir müssen mit ihnen leben und umgehen können. Zu den zwei wichtigsten Aufgaben der Fehlerrechnung gehören die Fehlerfortpflanzung und erforderliche Messgenauigkeit einer Messung. Die beiden Aufgaben sind als zueinander invers zu betrachten. 1. Fehlerfortpflanzung: Sind die Fehler gemessener Grössen ungefähr bekannt, und werden aus den gemessenen Grössen andere Grössen berechnet, so ist anzugeben, wie sich die Messfehler auf die zu berechnenden Grössen auswirken. So wird nicht durch Rechnung eine nicht vorhandene Genauigkeit vorgetäuscht. 2. Erforderliche Messgenauigkeit: Wird vorgeschrieben, mit welcher Genauigkeit eine Grösse aus einer Messung zu bestimmen ist, so lassen sich mit Hilfe der Fehlerrechnung die einzuhaltenden Messfehler abschätzen und Entscheidungen über die zu verwendenden Instrumente und Messmethoden treffen. 17 18 3.1 Kapitel 3. Fehlerrechnung Der wahre Wert einer zu messenden Grösse Ist X der wahre Wert einer zu messenden Grösse und x ein entsprechender Messwert1 , so heisst ǫ=X −x der Messfehler des Messwertes. Als zufälliger Fehler muss ǫ klein und in gewissen Grenzen bleiben. Werden mehrere Messungen durchgeführt, so ergeben sich Werte x1 , . . . , xN , die um den wahren Wert X streuen. Die Fehler ǫi = X − xi für alle i ∈ {1, . . . , N } werden gleich wahrscheinlich negativ und positiv sein und normalverteilt um ǫ = 0 liegen. Dies folgt aus dem zentralen Grenzwertsatz (vgl. Kap. 2.2). Hingegen sind die Fehler ǫ1 , . . . , ǫN selbst meist unbekannt. Ist ∆x eine Schätzung für den Messfehler ǫ und x eine für die zu messende Grösse X, so wird x − |∆x| ≤ X ≤ x + |∆x| geschrieben. Es heisst ∆x der absolute Fehler und in Prozenten angegeben. ∆x x der relative Fehler. Dieser wird oft Beispiel 3.1.1. An einem Voltmeter wurde eine Spannung von U = 42.9 V abgelesen und der Messfehler mit ∆U = 0.3 V geschätzt. Dann gilt U = (42.9 ± 0.3) V, d.h., der wahre Wert von U liegt zwischen 42.6 V und 43.2 V. Der relative Fehler beträgt ∆U ±0.3 V = = ±0.007 = 0.7%. U 42.9 V 3.2 Wahrscheinlichster Wert einer Messgrösse Soll eine Grösse X, deren Wert unbekannt ist, durch eine N -fache Messung bestimmt werden, so lässt sich ein wahrscheinlichster Wert angeben. Wir ermitteln N Messwerte x1 , . . . , xN und berechnen nach den Gesetzen der Statistik das arithmetische Mittel N 1 X x̄ = xi , N i=1 i.e. der wahrscheinlichste Wert der Grösse X. In der Praxis wird deshalb mit diesem Wert statt dem wahren Wert X gerechnet. Nach der Methode der kleinsten Quadrate2 ist der mittlere Fehler durch s ∆x = ± √ N gegeben, wobei N 1 X s = (xi − x̄)2 N −1 2 i=1 1 Wie in der Statistik üblich werden Messwerte mit einem kleinen Buchstaben x und die wahren, aber unbekannten (Zufalls-)grössen mit einem grossen Buchstaben X bezeichnet. P 2 2 Der Mittelwert x̄ wird so bestimmt, dass die Fehlerquadratsumme N i=1 (xi − x̄) minimal wird. 3.3. Fehlerfortpflanzung 19 die aus den Messdaten geschätzte Varianz ist. Demzufolge gilt v u N u X 1 ǫ ≈ ∆x = ±t (xi − x̄)2 . N (N − 1) i=1 Das heisst, ∆x wird als absoluter wahrscheinlichster Fehler des Mittelwertes x̄ verwendet. Die Grösse ∆x x̄ heisst relativer Fehler des Mittelwertes x̄. 3.3 Fehlerfortpflanzung Oft lässt sich eine Grösse Y nicht unmittelbar messen, sondern sie muss aus anderen Grössen X1 , . . . , Xn rechnerisch ermittelt werden. Es sei Y = f (X1 , . . . , Xn ). Die Messung der Grössen X1 , . . . , Xn ergeben die Messgrössen x1 , . . . , xn und die dazu gehörigen Messfehler ǫ1 , . . . , ǫn , d.h. ǫi = Xi − xi . Mit den Messgrössen kann y = f (x1 , . . . , xn ). berechnet werden. Wie wirken sich nun die Fehler ǫ1 , . . . , ǫn der n Messgrössen x1 , . . . , xn auf das Ergebnis der Rechnung aus? Der wahre Wert Y wird durch die Messfehler ǫ1 , . . . , ǫn der Messgrössen x1 , . . . , xn um ǫ=Y −y = f (X1 , . . . , Xn ) − f (x1 , . . . , xn ) = f (x1 + ǫ1 , . . . , xn + ǫn ) − f (x1 , . . . , xn ) verfälscht. Da die Messfehler erstens klein und zweitens unbekannt sind, also auch ǫ nicht exakt berechenbar ist, wird das vollständige Differenzial dy anstatt ǫ berechnet, d.h., dy = ∂f ∂f dx1 + · · · + dxn . ∂x1 ∂xn Wir setzen dxi = ǫi für alle i ∈ {1, . . . , n}. Näherungsweise gilt dann das Fehlerfortpflanzungsgesetz ∂f ∂f ǫ≈ ǫ1 + · · · + ǫn ∂x1 ∂xn für den Fehler von Y . In der Praxis setzen wir für die unbekannten Messfehler ǫ1 , . . . , ǫn geschätzte oder nach der Methode der kleinsten Quadrate berechnete Werte ∆x1 , . . . , ∆xn ein. Das heisst die n Messwerte sind durch x1 ± ∆x1 , . . . , xn ± ∆xn 20 Kapitel 3. Fehlerrechnung gegeben. Da die Vorzeichen der ∆xi nicht bekannt sind, gehen wir auf Nummer sicher und betrachten den absoluten Maximalfehler3 ∂f ∂f ∆ymax = ± ∆x1 + · · · + ∆xn ∂x1 ∂xn oder den relativen Maximalfehler ∆yrel = ∆ymax . y Eine andere Fehlerversion, die wir hier nur aus Gründen der Vollständigkeit angeben, ist der wahrscheinlichste Fehler s 2 2 ∂f ∂f ∆yw = ± ∆x1 + · · · + ∆xn . ∂x1 ∂xn Da die Ungleichung |∆yw | ≤ |∆ymax | gilt, ist diese Fehlerart weniger pessimistisch als der absolute Maximalfehler. Beispiel 3.3.1. Zur Bestimmung eines elektrischen Widerstandes R wurden die Stromstärke I = (15 ± 0.3) A und die Spannung U = (110 ± 2) V gemessen. Wie gross ist der absolute und der relative Maximalfehler? Der Widerstand in Funktion von U und I ist durch R(U, I) = U 110 V = ≈ 7.3 Ω I 15 A gegeben. Der absolute Maximalfehler ist ∂R ∂R 1 U ∆Rmax = ± ∆U + ∆I = ± ∆U + 2 ∆I , ∂U ∂I I I und der relative Maximalfehler ∆Rrel 1 U ∆U ∆I ∆Rmax = =± ∆U + 2 ∆I = ± + R RI RI U I = ± (|∆Urel | + |∆Irel |) . Einsetzen der gemessenen Grössen ergibt für den absoluten und den relativen Maximalfehler 1 110 V ∆Rmax = ± 2V + 0.3 A ≈ ±0.28 Ω, 15 A (15 A)2 2V 0.3 A ∆Rrel = ± + ≈ ±0.04 110 V 15 A für unsere Messung. 3 Für den Spezialfall n = 1 haben wir für den absoluten Maximalfehler df ∆ymax = ± ∆x = ± f ′ ∆x . dx 3.3. Fehlerfortpflanzung 21 Aufgaben Aufgabe 3.3.1. Der Durchmesser eines Drahtes wurde unter Verwendung eines Mikrometers mit d = (0.361 ± 0.005) mm gemessen. Mit welchem relativen Maximalfehler kann daraus die Querschnittsfläche berechnet werden? Aufgabe 3.3.2. Von einem Quader wurden die Kanten mit a = (32.2 ± 0.1) cm, b = (12.0 ± 0.1) cm und c = (6.7 ± 0.1) cm bestimmt. Wie gross ist der absolute Maximalfehler des Quadervolumens? Aufgabe 3.3.3. Zur Bestimmung der Brennweite einer einfachen bikonvexen Linse wurden die Gegenstandsweite a = 42.4 cm und die Bildweite b = 26.6 cm mit den Messfehlern ∆a = ∆b = ±0.1 cm ermittelt. Wie gross ist die Brennweite f und ihr absoluter Maximalfehler? Aufgabe 3.3.4. Im rechtwinkligen Dreieck wurden die Hypothenuse c = (130 ± 0.06) m und die Kathete a = (50 ± 0.02) m gemessen. Welcher absoluter Maximalfehler ergibt sich hieraus für den Winkel α? Aufgabe 3.3.5. Zur genauen Messung unbekannter Widerstände wird eine so genannte Wheatstonesche Brückenschaltung verwendet. Der zu bestimmende Widerstand ergibt sich aus x Rx = R , 1000 mm − x wobei R = (1000 ± 1) Ω der bekannte Widerstand und x = (765.8 ± 0.3) mm die Masszahl der am Massstab abgelesenen Länge sind. Mit welchem absoluten Maximalfehler ergibt sich der gesuchte Widerstand Rx ? Aufgabe 3.3.6. Die drei Widerstände R1 = (100±1) Ω, R2 = (50±1) Ω und R3 = (250±2) Ω sind hintereinander geschaltet. Wie gross ist für die Spannung U = (220±2) V die Stromstärke des durchfliessenden Stromes und ihr relativer Maximalfehler? Aufgabe 3.3.7. Die Widerstände R1 = (350 ± 2) Ω und R2 = (100 ± 1) Ω sind parallel geschaltet. Berechnen Sie den Ersatzwiderstand R und sein relativer Maximalfehler. Aufgabe 3.3.8. Mit welcher Genauigkeit ergibt sich L = log10 (sin(α)), wenn α = 24◦ 10′ mit dem Fehler von ∆α = ±2′ versehen ist? Aufgabe 3.3.9. Zur Bestimmung des Elastizitätsmoduls eines Stahldrahtes wurden dessen Länge l = (2473 ± 3) mm und der Durchmesser d = (0.292 ± 0.001) cm gemessen. Durch eine am Draht angreifende Kraft F = (1 ± 0.005) kN ergab sich eine Längenänderung δ = (1.750 ± 0.005) mm. Den Elastizitätsmodul ist durch E= π Fl d 2 2 δ gegeben. Bestimmen Sie E sowie seinen absoluten und relativen Maximalfehler. 22 Kapitel 3. Fehlerrechnung Lösungen Lösung 3.3.1. Relativer Maximalfehler der Querschnittsfläche ist ∆Frel = ±2.8%. Lösung 3.3.2. Absoluter Maximalfehler des Quadervolumens ist ∆Vmax = ±68 cm3 . Lösung 3.3.3. Brennweite der Linse ist f = ist ∆fmax = ±0.05 cm. 1 1 + 1b a = 16.3 cm und ihr absoluter Maximalfehler Lösung 3.3.4. Absoluter Maximalfehler des Winkels α ist ∆αmax = ±0.000358. Lösung 3.3.5. Der maximale Fehler beträgt ±8.7 Ω. Lösung 3.3.6. Die Stromstärke beträgt I = 0.55 A und der relative Maximalfehler ±2%. Lösung 3.3.7. Der Ersatzwiderstand beträgt R = 77.78 Ω und der relative Fehler ±0.9%. Lösung 3.3.8. ∆L = ±6 · 10−4 Lösung 3.3.9. Den Elastizitätsmodul beträgt E = 211 kN mm−2 , sein absoluter Fehler ∆E = 3.4 kN mm−2 und sein relativer Fehler ungefähr ±1.6%. 3.4 Berechnung des Fehlers bei speziellen Funktionstypen Wir unterscheiden zwei Funktionstypen: 1. Die Funktion ist eine Summe von Funktionen einer Variablen, d.h., f (x1 , . . . , xn ) = f1 (x1 ) + · · · + fn (xn ) = n X fi (xi ). i=1 Dann wird das vollständige Differenzial zu df = d(f1 + · · · + fn ) = df1 + · · · + dfn = f1′ dx1 + · · · + fn′ dxn und somit erhalten wir den absoluten Maximalfehler ∆fmax = ±(|f1′ ∆x1 | + · · · + |fn′ ∆xn |) = ±(|∆f1 max | + · · · + |∆fn max |). Bei Summen addieren sich die absoluten Maximalfehler der Summanden.4 2. Die Funktion ist ein Produkt von Funktionen einer Variablen, d.h., g(x1 , . . . , xn ) = g1 (x1 ) · · · gn (xn ) = 4 n Y gi (xi ). i=1 Für die relativen Fehler gilt dann aber nicht das Selbe. Wir erhalten ∆frel = ∆fmax |∆f1 max | + · · · + |∆fn max | |∆f1 max | + · · · + |∆fn max | =± =± . f f f1 + · · · + fn 3.5. Erforderliche Messgenauigkeit 23 Hier wenden wir die logarithmische Differenziation an. Wir logarithmieren ln(g) = ln(g1 ) + · · · + ln(gn ), dann folgt für das vollständige Differenzial d ln(g) = d(ln(g1 ) + · · · + ln(gn )) = d ln(g1 ) + · · · + d ln(gn )), also dg dgn dg1 + ··· + . = g g1 gn Hieraus folgt ∆grel ∆g1 ∆gn dg = ± (|∆g1 rel | + · · · + |∆gn rel |) . = =± + ··· + g g1 gn Bei Produkten (und Quotienten) addieren sich die relativen Maximalfehler der Faktoren. Beispiel 3.4.1. Von einem Zylinder wurde der Durchmesser D = (4.84 ± 0.01) cm, die Länge l = (6.74± 0.01) cm und durch Wägung die Masse m = (968.5± 0.1) g bestimmt. Mit welchem relativen Fehler lässt sich daraus die Dichte ρ berechnen? Die Masse dividiert durch das Volumen ergibt die Dichte, also folgt ρ(D, m, l) = Durch logarithmieren erhalten wir m 4 m . = D 2 π D2 l π 2 l ln(ρ) = ln(m) − 2 ln(D) − ln(l) + ln( π4 ), davon das vollständige Differenzial ergibt d ln(ρ) = dρ dm dD dl = −2 − . ρ m D l Somit erhalten wir für den relativen Fehler der Dichte ∆m ∆D ∆l ∆ρ + 2 = ± ∆ρrel = D + l . ρ m Nun können wir die gemessenen Werte einsetzen und erhalten ∆ρrel ±0.1 g ±0.01 cm ±0.01 cm = ±0.0057. =± + 2 + 968.5 g 4.84 cm 6.74 cm Dies entspricht ungefähr einem relativen Fehler von ±0.6%. 24 Kapitel 3. Fehlerrechnung b α l m b s −mg sin(α) mg Abbildung 3.5.i: Mathematisches Pendel 3.5 Erforderliche Messgenauigkeit Beispiel 3.5.1. Aus der Länge l = 12 m und der Schwingungsdauer T = 6.95 s eines mathematischen Pendels (Fadenpendels) soll die Erdbeschleunigung g berechnet werden. Wie genau müssen l und T bestimmt werden, damit der absolute Maximalfehler von g nicht mehr als ±1 cm s−2 beträgt? Zuerst wollen wir die Differenzialgleichung des mathematischen Pendels aufstellen. Die Rücktreibende Kraft beträgt F = −mg sin(α) und der zurückgelegte Weg s = lα, also erhalten wir die Differenzialgleichung des mathematischen Pendels s ms̈ = −mg sin(α) = −mg sin . l Diese Differenzialgleichung ist nicht linear und mit unseren Methoden nicht lösbar. Deshalb betrachten wir das Problem nur für kleine Auslenkungen α. In diesem Fall linearisieren wir sin und erhalten sin(α) ≈ α = sl für kleine Winkel5 α. Damit folgt ms̈ = − mg s. l Dabei handelt es sich nun um die lineare Differenzialgleichung zweiter Ordnung s̈ + gl s = 0 mit der allgemeinen Lösung q q g g s(t) = c1 sin t + c cos 2 l l t , wobei c1 und c2 noch aus den Anfangsbedingungen zu bestimmende Konstanten sind. Dadurch ergibt sich die Schwingungsdauer T des mathematischen Pendels6 aus der Bedingung r r g g (t + T ) = t + 2π, l l 5 Winkel, die kleiner sind als ungefähr 5◦ , diese entsprechen 0.08727 im Bogenmass, also ist sin(0.08727) = 0.08716. Der Linearisierungsfehler liegt also unterhalb dem Promillebereich. Die Approximation sin(α) ≈ α für kleine Winkel α kann mit Hilfe von Taylorreihen begründet werden. 6 Die exakte Formel für die Periodendauer eines mathematischen Pendels hängt zusätzlich von der maxi- 3.5. Erforderliche Messgenauigkeit 25 also T = 2π s l . g Nun folgt g(l, T ) = 4π 2 l T2 und damit für den absoluten Maximalfehler ∆gmax 2 ∂g ∂g 4π −8π 2 l ∆T = ± 2 ∆l + = ± ∆l + ∆T = ±1 cm s−2 . 3 ∂l ∂T T T Da dies nur eine Gleichung mit zwei Unbekannten ∆l und ∆T ist, muss eine Annahme getroffen werden, dass der Fehler je zur Hälfte aus den Fehlern der Messung von l und von T stammt. Damit ergibt sich T2 · 0.5 cm s−2 = ±0.612 cm, 4π 2 T3 ∆T = ± 2 · 0.5 cm s−2 = ±0.0018 s. 8π l ∆l = ± Aufgaben Aufgabe 3.5.1. Ein Hohlzylinder hat den äusseren Radius r1 ≈ 10 cm, den inneren Radius r2 ≈ 8 cm und die Höhe h ≈ 12 cm. Mit welchen absoluten Fehlern dürfen diese drei Grössen gemessen werden, damit der relative Maximalfehler des Volumens höchstens ±0.2% beträgt? Aufgabe 3.5.2. Im Dreieck sollen die Seite b und die Winkel α und β gemessen und daraus die Seite a berechnet werden. a. Stellen Sie mit Hilfe der logarithmischen Differenziation die Fehlerformel für den relativen Maximalfehler von a auf. b. Wie genau müssen b ≈ 220 m, α ≈ 63◦ und β ≈ 42◦ gemessen werden, damit ein relativer Maximalfehler ∆amax = ±0.0003 a nicht überschritten wird? malen Auslenkung αmax ab und lässt sich nur als elliptisches Integral angeben Tgenau (αmax ) = 2π s l · g Z αmax 0 dα q . 2 αmax π sin ( 2 ) − sin2 ( α2 ) 26 Kapitel 3. Fehlerrechnung Lösungen Lösung 3.5.1. Absolute Fehler der Radien ∆r1 = ±0.0012 cm, ∆r2 = ±0.0015 cm und der Höhe ∆h = ±0.008 cm. Lösung 3.5.2. a. Formel für den relativen Maximalfehler ∆amax a = ± ∆b b + |cot(α)∆α| + |cot(β)∆β| . b. Maximale Fehler der Einzelmessungen ∆b = ±0.02 m und ∆α = ±0.000196 = ±0.7′ , ∆β = ±0.000090 = ±0.3′ . Kapitel 4 Statistische Tests Statistische Tests dienen dazu, an Hand von Stichproben Annahmen (sog. Hypothesen1 ) über das Verteilungsgesetz in der Grundgesamtheit zu überprüfen. Oft existiert über die unbekannte Verteilungsfunktion F oder ihre unbekannten Parameter, wie zum Beispiel µ und σ 2 bei der Normalverteilung oder p bei der Binomialverteilung, eine bestimmte Vorstellung. Diese wird in Gestalt einer Nullhypothese, die mit H0 bezeichnet wird, ausgedrückt. Wird auch eine die Nullhypothese ausschliessende Alternative betrachtet, so bezeichnen wir diese Alternativhypothese mit H1 . Das Anliegen eines statistischen Tests zur Prüfung von H0 gegen H1 ist es, eine Entscheidung darüber zu treffen, ob die aus einer konkreten Stichprobe entnommenen Angaben zur aufgestellten Hypothese H0 im Widerspruch stehen oder nicht, d.h., ob H0 abzulehnen ist oder nicht. 4.1 Das Prinzip des statistischen Tests Wir beginnen mit einem ausführlichen Einführungsbeispiel, bei dem wir den Parameter p der Binomialverteilung einem statistischen Test unterziehen. Beispiel 4.1.1. Bei 12000 Würfen eines Würfels wurden x = 2107 Sechsen gezählt. Ist dieser Würfel unsymmetrisch, d.h. werden Sechsen bevorzugt gewürfelt? Uns scheint die Anzahl Sechsen ein bisschen zu gross. Da es aber in den modernen Natur- und Ingenieurwissenschaften nicht erlaubt ist, aus dem Bauch Gefühle zu äussern, benötigen wir einen rigorosen statistischen Test, um unseren Eindruck wissenschaftlich zu belegen. Dazu bezeichnen wir mit X die Zufallsgrösse der Anzahl “Sechsen” unter n = 12000 Würfen, und mit p die Wahrscheinlichkeit mit dem betrachteten Würfel eine “Sechs” zu würfeln. Anschliessend formulieren wir zwei sich ausschliessende Hypothesen: Nullhypothese H0 : p = 16 , d.h., der Würfel ist symmetrisch. Alternativhypothese H1 : p > 16 , d.h., es werden Sechsen bevorzugt gewürfelt. Beachten Sie, dass sich die Hypothesen gegenseitig ausschliessen und sich nur auf die Ereignisse “Sechs” oder “nicht Sechs” beziehen. Wie die anderen Augenzahlen ausfallen ist nicht von Belang. Unter der Voraussetzung der Nullhypothese H0 berechnen wir nun den Erwartungswert E(X) = np = 12000 · 1 1 6 = 2000. Hypothese enthält die Wörter hypo-thesis = das Unter-Gestellte. 27 28 Kapitel 4. Statistische Tests In unserem Experiment stellen wir eine Abweichung vom Erwartungswert x − E(X) = 2107 − 2000 = 107 fest. Nun bestimmen wir die Wahrscheinlichkeit P (2107 ≤ X) einer so grossen oder grösseren Abweichung vom Erwartungswert. Dazu benutzen wir den Grenzwertsatz von de Moivre und Laplace (vgl. Gleichung (2.2.a)), d.h., wir approximieren2 die Binomialverteilung mit einer Normalverteilung mit den Parametern µ = np = 12000 · 1 6 = 2000 und σ 2 = np(1 − p) = 12000 · 1 6 · 5 6 = 1666 23 . Wir erhalten nun mit Tafel T.1 2107 − 2000 P (2107 ≤ X) ≈ 1 − Φ q , 0, 1 = 1 − Φ (2.621, 0, 1) 2 1666 3 = 1 − 0.9956 = 0.0044. Die Wahrscheinlichkeit unter der Voraussetzung der Nullhypothese mindestens so viel Abweichung vom Erwartungswert zu erhalten, ist somit ausserordentlich klein. Dies erlaubt uns, die Nullhypothese abzulehnen. Die Irrtumswahrscheinlichkeit dieses Schlusses entspricht dem berechneten Wert P (2107 ≤ X) ≈ 0.0044. Im Allgemeinen müssen wir uns entscheiden, wann eine berechnete Abweichung zur Ablehnung der Nullhypothese führen soll. Dazu wird eine Schranke α ∈ ]0, 1[, das so genannte Signifikanzniveau, gewählt. Ist die berechnete Wahrscheinlichkeit der Abweichung kleiner als das Signifikanzniveau, so wird die Nullhypothese abgelehnt, sonst angenommen. Die zulässige Grösse des Signifikanzniveaus α hängt stark vom Fachgebiet ab und ist eine Vereinbarungssache. Häufig verwendete Niveaus sind α = 0.01, 0.05 und 0.1. Das Prinzip eines statistischen Tests oder Signifikanztest lässt sich in folgenden Schritten zusammenfassen: 1. Aufstellen der Nullhypothese H0 und der Alternativhypothese H1 und Vorgabe des Signifikanzniveaus α. 2. Bestimmen eines Ablehnungsbereichs in Abhängigkeit von α, für den die Wahrscheinlichkeit, dass die Stichprobenfunktion Werte aus dem Ablehnungsbereich annimmt, höchstens gleich α ist. 3. Berechnung der Testgrösse aus der vorliegenden konkreten Stichprobe. 4. Statistischer Schluss: Liegt die Testgrösse im Ablehnungsbereichs, so wird H0 abgelehnt, sonst wird H0 angenommen. 2 Die Approximation ist erlaubt, da die Faustregel np(1 − p) = 1666 23 > 9 erfüllt ist. 4.2. Einseitiger und zweiseitiger Test 4.2 29 Einseitiger und zweiseitiger Test In Beispiel 4.1.1 haben wir uns für die Abweichung vom Erwartungswert (nach einer Seite) interessiert. Im Gegensatz dazu können wir auch Abweichungen nach beiden Seiten Beachtung schenken. In allen Fällen gehen wir von der Nullhypothese H0 : µ = µ0 aus. Für die Alternativhypothese H1 bieten sich nun die nachfolgenden Möglichkeiten an, die je nach Aufgabenstellung angewandt werden müssen. 1. Zweiseitiger Test H1 : µ 6= µ0 . Zur Konstruktion des Ablehnungsbereiches wird der Flächeninhalt α symmetrisch auf beiden Seiten der Kurve aufgeteilt, und es ergibt sich einen zweiseitigen Ablehnungsbereich mit den beiden kritischen Grössen z α2 und z1− α2 . Die Abweichung zwischen dem Stichprobenparameter und dem hypothetischen Wert µ0 1−α α 2 α 2 µ0 z α2 Ablehnungsbereich z1− α2 Annahmebereich z Ablehnungsbereich Abbildung 4.2.i: H1 : µ 6= µ0 , zweiseitige Fragestellung mit den kritischen Grössen z α2 und z1− α2 . wird nur dem Absolutbetrag nach beurteilt. 2. Einseitiger Test H1 : µ > µ0 (resp. H1 : µ < µ0 ). Zur Konstruktion des Ablehnungsbereiches wird der Flächeninhalt α nur auf einer Seite der Kurve abgeschnitten, und es ergibt sich einen einseitigen Ablehnungsbereich mit der kritischen Grösse zα (resp. z1−α ). Die damit verbundene einseitige Fragestellung liegt dann vor, wenn nur Abwei- 1−α 1−α α α zα Ablehnungsbereich µ0 µ0 z Annahmebereich Abbildung 4.2.ii: H1 : µ < µ0 , einseitige untere Fragestellung mit der kritischen Grösse zα . Annahmebereich z1−α z Ablehnungsbereich Abbildung 4.2.iii: H1 : µ > µ0 , einseitige obere Fragestellung mit der kritischen Grösse z1−α . 30 Kapitel 4. Statistische Tests chungen nach einer Seite interessieren, d.h., wenn es zum Beispiel darauf ankommt zu beurteilen, ob ein Stichprobenparameter nicht zu gross ist, während einem zu kleinen Stichprobenparameter keine Bedeutung beigemessen wird. Hier müssen also grosse positive (resp. negative) Abweichungen zu einer Ablehnung der Nullhypothese führen. Ob eine Hypothese mit einem zweiseitigen oder einseitigen Test zu prüfen ist, hängt vom praktischen Problem ab und wird vor Testbeginn festgelegt. Sind keine Vorkenntnisse über die Richtung der möglichen Abweichungen vorhanden, so wird ein zweiseitiger Test verwendet. Ist von vornherein einer der Fälle µ > µ0 oder µ < µ0 ausgeschlossen, so wird ein einseitiger Test zur Anwendung kommen. Beispiel 4.2.1 (z-Test). Letztes Jahr waren 75% der SBB-Fahrgäste Inhaber von Halbtaxabonnementen. Bei einer kürzlich durchgeführten Fahrgastbefragung gaben 270 von 350 Befragten an, dass sie ein Halbtaxabonnement besitzen. Hat sich der Anteil der Besitzer von Halbtaxabonnementen wesentlich verändert? Das Signifikanzniveau sei α = 10%. Um diese Frage zu beantworten, führen wir einen statistischen Test nach obigem Prinzip durch: Es sei p = 0.75 der relative Anteil von Halbtaxabonnementbesitzer im letzten Jahr. Nun formulieren wir die Null- und Alternativhypothesen für einen statistischen Test: H0 : p = 0.75, d.h., die Anzahl Halbtaxabonnementbesitzer ist gleich wie letztes Jahr. H1 : p 6= 0.75, d.h., die Anzahl Halbtaxabonnementbesitzer hat sich verändert. Es handelt sich hier um einen so genannten zweiseitigen Test, da hier die Alternativhypothese nur Werte p 6= 0.75 zulässt. Weiter beschreibe die Zufallsgrösse X die Anzahl der Halbtaxabonnementbesitzer unter den n = 350 befragten Fahrgästen. Die Zufallsgrösse X ist binomialverteilt. Wir berechnen den Erwartungswert und die Varianz unter Annahme der Nullhypothese H0 E(X) = np = 262.5 und Var(X) = np(1 − p) = 65.625. Es stellt sich also die Frage, ob sich die Zahl der gezählten 270 Halbtaxabonnementbesitzer signifikant vom Erwartungswert E(X) = 262.5 unterscheidet. Weil np(1 − p) = 65.625 > 9 können wir die Binomialverteilung mit einer Normalverteilung mit den Parametern µ = 262.5 und σ 2 = 65.625 approximieren (vgl. Grenzwertsatz von de Moivre und Laplace, Gleichung (2.2.a)). Durch eine Massstabsänderung auf der Koordinatenachse und einer Nullpunktverschiebung auf der x-Achse x−µ z= σ kann von der Normalverteilung mit den Parametern µ und σ 2 zur standardisierte Normalverteilung mit den Parametern µ = 0 und σ 2 = 1 übergegangen werden. Da es sich hier um einen zweiseitigen Test handelt, verteilen wir α = 0.10 = 0.05 + 0.05 gleichmässig auf beiden Seiten der Standardnormalverteilung (vgl. Abbildung 4.2.iv). Aus der Beziehung P (Z ≤ z0.05 ) = Φ (z0.05 , 0, 1) = 0.05 bestimmen wir mit Tafel T.2 oder einem Computerprogramm (z.B. Excel) die untere kritische Grösse z0.05 = −1.645, d.h. das 0.05-Quantil z0.05 der Standardnormalverteilung; und aus der Beziehung P (z0.95 ≤ Z) = 1 − Φ (z0.95 , 0, 1) = 0.05 4.3. Mögliche Fehler bei statistischen Tests 31 0.90 0.05 z0.05 Ablehnungsbereich 0.05 0 z Annahmebereich z0.95 z Ablehnungsbereich Abbildung 4.2.iv: Bestimmung des 0.05-Quantils z0.05 = −1.645 und des 0.95-Quantils z0.95 = 1.645 bei der Standardnormalverteilung bei einer zweiseitigen Fragestellung. Die Testgrösse z = 0.926 liegt im Annahmebereich, damit wird die Nullhypothese angenommen. bestimmen wir die obere kritische Grösse z0.95 = 1.645, d.h. das 0.95-Quantil z0.95 der Standardnormalverteilung. Da die Standardnormalverteilung symmetrisch bezüglich µ = 0 ist, folgt z0.95 = −z0.05 . Die Berechnung der Testgrösse aus den vorliegenden Angaben ergibt z= 270 − µ 270 − 262.5 = √ = 0.926. σ 65.625 Es gilt nun z0.05 = −1.645 < z = 0.926 < z0.95 = 1.645, d.h., die Testgrösse z liegt im Annahmebereich und somit lautet der statistische Schluss: Wir nehmen die Nullhypothese auf dem Niveau 10% an. Der Anteil der Besitzer von Halbtaxabonnementen hat sich nicht signifikant verändert. Hierbei handelt es sich um einen so genannten z-Test. 4.3 Mögliche Fehler bei statistischen Tests Am Ende eines statistischen Tests fällen wir immer einen statistischen Schluss, der dabei zugunsten der Nullhypothese H0 oder der Alternativhypothese H1 ausfällt. In beiden Fällen werden gewisse Rückschlüsse von einer Stichprobe auf die entsprechende Grundgesamtheit gezogen. Dabei müssen wir unbedingt bedenken, dass es absolut sichere Schlüsse grundsätzlich nicht gibt. Bei einer Testentscheidung besteht immer eine bestimmte Wahrscheinlichkeit dafür, dass die getroffene Entscheidung falsch ist. Dabei werden zwei Arten von Fehlern unterschieden: Definition 4.3.1. a. Ein Fehler 1. Art liegt vor, wenn eine richtige Nullhypothese H0 abgelehnt wird. b. Ein Fehler 2. Art liegt vor, wenn eine falsche Nullhypothese H0 nicht abgelehnt wird. Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht der Irrtumswahrscheinlichkeit, für welche wir das Signifikanzniveau α vorgegeben haben. Die Wahrscheinlichkeit für einen Fehler 2. Art wird mit β bezeichnet. 32 Kapitel 4. Statistische Tests 1−α 1−α α µ0 α z1−α z µ0 z1−α z Ablehnungsbereich Annahmebereich Abbildung 4.3.ii: Es sei H0 richtig: Da z ≥ z1−α wird die Nullhypothese abgelehnt. Dies ist die falsche Entscheidung (Fehler 1. Art), welche mit einer Wahrscheinlichkeit von α getroffen wird. β α β α z1−α µ1 z µ0 µ1 z1−α z z z Annahmebereich 1−β 1−α 1−β 1−α Ablehnungsbereich Annahmebereich Abbildung 4.3.i: Es sei H0 richtig: Da z < z1−α wird die Nullhypothese angenommen. Dies ist die richtige Entscheidung, welche mit einer Wahrscheinlichkeit von 1 − α getroffen wird. µ0 z z Ablehnungsbereich Abbildung 4.3.iii: Es sei H0 falsch, H1 richtig, d.h., die gestrichelte Dichte ist die richtige: Da z < z1−α wird die Nullhypothese angenommen. Dies ist die falsche Entscheidung (Fehler 2. Art), welche mit einer Wahrscheinlichkeit von β getroffen wird. Annahmebereich Ablehnungsbereich Abbildung 4.3.iv: Es sei H0 falsch, H1 richtig, d.h., die gestrichelte Dichte ist die richtige: Da z ≥ z1−α wird die Nullhypothese abgelehnt. Dies ist die richtige Entscheidung, welche mit einer Wahrscheinlichkeit (so genannte Trennschärfe) von 1 − β getroffen wird. Wir erläutern nun die möglichen Fälle an Hand eines einseitigen Tests, bei dem die Nullhypothese H0 : µ = µ0 gegen die Alternativhypothese H1 : µ > µ0 getestet wird. Dabei bezeichnet µ den zu testenden unbekannten Parameter der Verteilung. Als Trennschärfe oder Macht eines Tests bezeichnen wir die Wahrscheinlichkeit 1−β mit der die Nullhypothese abgelehnt wird, wenn sie tatsächlich nicht stimmt (vgl. Abbildung 4.3.iv). Trennschärfe = P (Entscheidung H0 nicht anzunehmen | H1 sei richtig) = 1 − β In der Praxis sind wir bestrebt, die Fehler 1. und 2. Art (d.h. gleichzeitig α und β) möglichst klein zu halten. Dazu betrachten wir die Abbildungen 4.3.iv und 4.3.iii und stellen fest, dass eine Verkleinerung von α (Verschiebung der kritischen Grösse z1−α nach rechts) automatisch eine Vergrösserung von β nach sich zieht und umgekehrt. Entscheiden wir uns im konkreten Fall für ein kleines α und damit für ein kleines Risiko eine an sich richtige Nullhypothese 4.3. Mögliche Fehler bei statistischen Tests 33 abzulehnen, dann nehmen wir gleichzeitig ein deutlich erhöhtes Risiko für einen Fehler 2. Art in Kauf. Wir müssen also von Fall zu Fall entscheiden, welcher der beiden Fehler letztendlich die grösseren Konsequenzen hat. Soll gleichwohl das Risiko für einen Fehler 2. Art, d.h. β, verringert werden, ohne gleichzeitig die Wahrscheinlichkeit α für einen Fehler 1. Art vergrössern zu müssen, so bleibt uns nur die Vergrösserung des Stichprobenumfangs3 (Verbesserung der Trennschärfe des Tests). In Abbildung 4.3.iii sehen wir zusätzlich, dass die Wahrscheinlichkeit β einen Fehler 2. Art zu begehen, wesentlich von der Alternativhypothese H1 , d.h. Lage von µ1 , abhängt. Diesen funktionalen Zusammenhang zwischen β und µ1 wird als Operationscharakteristik bezeichnet. Aufgaben Formulieren Sie jeweils die Null- und Alternativhypothese und den problemorientierten statistischen Schluss in Worten. Aufgabe 4.3.1. Wir würfeln mit einem Würfel. Bei 20 Würfen erhalten wir 9 Sechsen. Ist der Würfel gezinkt, d.h., werden bevorzugt Sechsen gewürfelt? Das Signifikanzniveau ist 5%. Aufgabe 4.3.2. In 10000 Würfen zeigte eine Münze 5150 mal Zahl. Mit welcher Wahrscheinlichkeit können wir behaupten, dass sie unsymmetrisch ist, d.h. bevorzugt Zahl geworfen wird? Das Signifikanzniveau ist 5%. Aufgabe 4.3.3. Bei einer Umfrage vor einer Wahl sagten 285 der 2000 befragten Personen, sie würden nicht zur Wahl gehen. Nachdem in der Zwischenzeit ein medienintensiver Wahlkampf stattfand, betrug die tatsächliche Wahlbeteiligung 88.5%. Kann daraus mit 99%-iger Sicherheit geschlossen werden, dass in der Zwischenzeit Personen, die ursprünglich nicht zur Wahl gehen wollten, umgestimmt wurden? Aufgabe 4.3.4. Unter 3000 in einer Klinik neugeborenen Kindern befanden sich 1578 Knaben. Testen Sie mit einer Irrtumswahrscheinlichkeit α = 0.01 die Hypothesen H0 : P (Knabengeburt) = 0.5 H1 : P (Knabengeburt) 6= 0.5 Formulieren Sie den entsprechenden statistischen Schluss. Aufgabe 4.3.5. Eine Multiple-Choice-Prüfung bestehe aus 100 Einzelfragen, wobei bei jeder Frage in zufälliger Reihenfolge 4 Antworten angegeben sind, wovon genau eine richtig ist. Der Prüfling darf jeweils nur eine Antwort ankreuzen. Wieviel richtig angekreuzte Antworten müssen zum Bestehen der Prüfung mindestens verlangt werden, damit die Prüfung durch (zufälliges Ankreuzen) höchstens mit Wahrscheinlichkeit a. 0.05 b. 0.01 c. 0.001 d. 0.0001 bestanden werden kann? 3 Dabei werden die Verteilungen schlanker und somit α und β gleichzeitig kleiner. 34 Kapitel 4. Statistische Tests Lösungen Lösung 4.3.1. Eine Approximation mit der Normalverteilung ist wegen np(1−p) = 2.778 ≤ 9 nicht erlaubt. Wir berechnen mit der Binomialverteilung exakt die Irrtumswahrscheinlichkeit P (9 ≤ X) = 1 − P (X ≤ 8) = 0.00284. Lösung 4.3.2. Die Wahrscheinlichkeit einer so grossen oder grösseren Abweichung nach oben ist P (5150 ≤ X) = 0.0013. Also ist die Münze unsymmetrisch. Lösung 4.3.3. Es hätten höchsten x1−α = 264 Personen nicht zur Wahl gehen dürfen, damit die Hypothese angenommen werden könnte. Lösung 4.3.4. Der Annahmebereich ist ]1430, 1571[, also H0 ablehnen. Lösung 4.3.5. Die Ablehnungsgrenzen sind: a. n1−0.05 = 33 b. n1−0.01 = 36 c. n1−0.001 = 39 d. n1−0.0001 = 42 Kapitel 5 Prüfen von Erwartungswerten (Parametertests) 5.1 Problemstellung der technischen Statistik Die meisten Fragestellungen der angewandten Statistik führen auf den Vergleich von zwei oder mehreren normalverteilten Grundgesamtheiten. Da eine Normalverteilung durch die beiden Parameter µ und σ 2 vollständig definiert ist, bedeutet dies, dass wir herausfinden müssen, ob die entsprechenden Parameter bei zwei normalverteilten Grundgesamtheiten übereinstimmen oder nicht. Beispiel 5.1.1. Gegeben seien zwei Maschinen des gleichen Typs. Beide produzieren Produkte von einer bestimmten gleichen Art. Produzieren sie Produkte aus der gleichen Grundgesamtheit oder nicht? Das heisst, arbeiten sie gleich genau, ist also die Varianz identisch und sind sie auf den gleichen Sollwert eingestellt, d.h., ist der Erwartungswert der beiden Grundgesamtheiten gleich? Fragestellung der Statistik • Gegeben: Zwei normalverteilte Grundgesamtheiten mit den Parametern µ1 , σ12 und µ2 , σ22 . • Frage: Sind die beiden Grundgesamtheiten identisch, d.h., gilt µ1 = µ2 und σ12 = σ22 ? • Vorgehen der Statistik zur Beantwortung dieser Frage: Jeder Grundgesamtheit entnehmen wir je eine Stichprobe S1 und S2 , dann berechnen wir aus diesen Stichproben die geschätzten Parameter x̄1 , s22 und s21 , x̄2 , vergleichen sie in einem statistischen Test und schliessen die Grundgesamtheiten sind gleich oder nicht. In einigen Fällen kann bereits vorausgesetzt werden, dass zum Beispiel µ1 = µ2 ist, so dass ein Test auf σ12 = σ22 durchzuführen ist. Oder die Varianzen sind gleich, und die Gleichheit der Erwartungswerte wird getestet. Je nach Problemstellung ist ein bestimmter Test durchzufüren. In den bisherigen Betrachtungen in Kapitel 4 war zur Prüfung der Hypothese H0 : µ = µ0 für die Berechnung der Testgrösse die Kenntnis der Varianz σ 2 in der Grundgesamtheit erforderlich. Dazu sind umfangreiche Voruntersuchungen notwendig, oder wir ersetzen für einen grossen Stichprobenumfang σ 2 durch die geschätzte Stichprobenvarianz s2 . Welche Testgrösse 35 36 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) können wir nun bei kleinen Stichprobenumfängen zur Prüfung der Hypothese H0 : µ = µ0 heranziehen, wenn σ 2 nicht als Erfahrungswert vorliegt? Beim Prüfen von Erwartungswerten gibt es mehrere verschieden Problemstellungen. Diese wollen wir nun untersuchen. 5.2 Einstichproben-t-Test, Student-t-Test Beim Einstichproben-t-Test oder Student-t-Test ist der Erwartungswert µ der Grundgesamtheit G bekannt und es sind folgende Voraussetzungen zu beachten: 1. Die normalverteilte Grundgesamtheit G hat den bekannten Erwartungswert µ und die unbekannte Varianz σ 2 . 2. Es sind zufällig N Stichprobenwerte x1 , . . . , xN aus einer normalverteilten Grundgesamtheit gewählt. Wir wollen nun wissen, ob die gewählte Stichprobe der N Werte x1 , . . . , xN aus der Grundgesamtheit G mit dem Erwartungswert µ stammt. Dazu berechnen wir den geschätzten Mittelwert N 1 X x̄ = xi N i=1 und vergleichen ihn mit dem bekannten Erwartungswert µ der Grundgesamtheit G, indem wir folgende alternativen Hypothese aufstellen. H0 : µ = x̄, d.h., Stichprobe stammt aus der Grundgesamtheit G mit Erwartungswert µ. H1 : µ 6= x̄, d.h., Stichprobe stammt aus einer anderen Grundgesamtheit. Zur Beantwortung dieser Fragestellung machen wir nun folgende gedankliche Konstruktion, die typisch ist für die statistische Denkweise: Wir betrachten die Gesamtheit aller zufälligen Stichproben mit N Werten x1 , . . . , xN aus einer normalen Grundgesamtheit mit Erwartungswert µ und unbekannter Varianz. Zu jeder Stichprobe berechnen wir aus den Werten x1 , . . . , xN den geschätzten Mittelwert x̄ und die geschätzte Varianz N s2 = 1 X (xi − x̄)2 N −1 i=1 und daraus die Testgrösse x̄ − µ √ N. s Der Wert der Testgrösse t wird umso grösser, t= (5.2.a) • je grösser die Abweichung des geschätzten Mittelwerts x̄ vom Erwartungswert µ ist, • je grösser der Stichprobenumfang N gewählt ist und • je kleiner die geschätzte Varianz s2 ist, d.h., je weniger die Stichprobenwerte um den Mittelwert streuen. 5.2. Einstichproben-t-Test, Student-t-Test 37 Für jede Stichprobe erhalten wir nun einen anderen Wert für t und demzufolge wieder eine Wahrscheinlichkeitsverteilung. Ist die Zufallsgrösse X normalverteilt, so gehorcht die neue Zufallsgrösse X − µ√ N T = s einer sogenannten Student-t-Verteilung mit n = N − 1 Freiheitsgraden, die nicht mehr der Normalverteilung entspricht1 . Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α ist für die zweiseitige Fragestellung durch die kritischen Grössen tn,1− α2 und tn, α2 = −tn,1− α2 gegeben. Die kritischen Grössen lassen sich für die zweiseitige Fragestellung aus der Beziehung P |T | ≥ tn,1− α2 = α mit Hilfe von Tafel T.3 oder einem Computerprogramm (z.B. Excel) ermitteln. Jetzt ziehen fn (t) 1−α α 2 α 2 tn, α2 = −tn,1− α2 tn,1− α2 Annahmebereich Ablehnungsbereich t Ablehnungsbereich Abbildung 5.2.i: Kritische Grössen tn, α2 und tn,1− α2 beim Student-t-Test, mit tn, α2 = −tn,1− α2 . wir den statistischen Schluss (hier für die zweiseitige Fragestellung): • Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., Abweichungen vom idealen Wert t = 0 sind zufälliger Natur. Die Stichprobe stammt somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus der Grundgesamtheit mit dem Erwartungswert µ. • Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit. Der Student-t-Test ist gegenüber Abweichungen von der Voraussetzung (1), dass die Grundgesamtheit G normalverteilt sein muss, ziemlich unempfindlich. Der Student-t-Test ist ein so genannt robuster Test. Beispiel 5.2.1. Es sei die folgende Stichprobe mit zehn Werten gegeben: 5 1 -5 7 4 15 -7 5 10 18 16 Dass die Summe X +Y zweier gleich verteilter Zufallsvariablen X und Y nicht mehr der gleichen Verteilung wie die der Summanden gehorchen muss, sehen wir an folgendem Beispiel: Ein einzelner Würfel hat für jede Augenzahl die gleiche Wahrscheinlichkeit. Betrachten wir nun die Summe der Augenzahlen zweier Würfel, so stellen wir fest, dass die Summe 7 viel häufiger ist als 2 oder 12. Dies wird zum Beispiel beim berühmten Gesellschaftsspiel Die Siedler von Catan von Klaus Teuber ausgenutzt. 38 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) Uns interessiert nun, ob die Stichprobe aus einer Grundgesamtheit mit Erwartungswert µ = 0 und unbekannter Varianz stammt oder nicht. Es handelt sich dabei um einen zweiseitigen Student-t-Test, da wir nur wissen wollen, ob der Mittelwert x̄ gleich oder ungleich von µ = 0 ist. Dazu wollen wir für die zweiseitige Fragestellung die folgende Nullhypothese gegen die Alternative testen: H0 : µ = 0, d.h., Stichprobe stammt aus Grundgesamtheit mit Erwartungswert µ = 0. H1 : µ 6= 0, d.h., Stichprobe stammt aus anderer Grundgesamtheit. Wir identifizieren den Stichprobenumfang mit N = 10 und berechnen x̄ = 6.80 und s2 = 70.18. Die Nullhypothese besagt in diesem Fall, dass das Mittel x̄ = 6.80 rein zufällig, auswahlbedingt, vom erwarteten theoretischen Wert µ = 0 abweicht. Da hier der Erwartungswert µ = 0 der Grundgesamtheit bekannt und die Varianz unbekannt ist, benutzen wir einen Student-t-Test mit n = N − 1 = 9 Freiheitsgraden, um obige Hypothese zu untersuchen. Wir berechnen die Testgrösse 6.80 − 0 √ x̄ − µ √ N= √ 10 = 2.567. (5.2.b) t= s 70.18 Zum Signifikanzniveau α = 0.05 bestimmen wir nun die kritische Grösse t9,1−0.025 = 2.262 für die zweiseitige Fragestellung. Nun führen wir den statistischen Schluss durch: Es gilt |t| = 2.567 ≥ t9,1−0.025 = 2.262, also wird die Nullhypothese H0 abgelehnt. Das Mittel x̄ = 6.80 weicht somit wesentlich vom theoretischen Wert µ = 0 ab. Bemerkungen: • Falls das Signifikanzniveau kleiner gewählt würde, z.B. α = 0.01, dann ergäbe sich ein kritischer Wert von t9,1−0.005 = 3.250 und es ergäbe keine signifikante Abweichung mehr. Es ist deshalb wichtig, dass immer bei einem statistischen Schluss das Signifikanzniveau angegeben wird, damit alle wissen, was von der Aussage zu halten ist. • Auch wenn die Nullhypothese abgelehnt werden kann, besteht, wie wir bereits in Kapitel 4.3 gesehen haben, eine gewisse Wahrscheinlichkeit, dass wir einen falschen Schluss ziehen. Die Wahrscheinlichkeit, dass ein berechneter Wert von t unter der Voraussetzung der Nullhypothese so extrem wird, ist bekanntlich nicht null, sondern nur klein. Beim Ablehnen der Nullhypothese müssen wir also auch eine Irrtumswahrscheinlichkeit angeben. Sie entspricht der Wahrscheinlichkeit, die besteht, dass der Wert der Testgrösse t rein zufällig so extrem herauskommt. Sie ist also kleiner als das gewählte Signifikanzniveau. • Kann hingegen die Nullhypothese nicht abgelehnt werden, so besteht trotzdem eine gewisse Wahrscheinlichkeit, dass eine signifikante Abweichung vorliegt. Wir sprechen vom Risiko für einen Fehler 2. Art. Die Student-t-Verteilung Die von W. S. Gosset (1876-1937) (vgl. Abbildung 5.2.iii) gefundene Student-t-Verteilung mit n = N − 1 Freiheitsgraden hat die Wahrscheinlichkeitsdichte − n+1 2 t2 fn (t) = cn 1 + für t ∈ R, n 5.2. Einstichproben-t-Test, Student-t-Test 39 Γ( n+1 ) 2 2 wobei cn = √nπ Γ( n eine nur von der Anzahl Freiheitsgraden n abhängige Konstante ist. Der ) 2 Erwartungswert und die Varianz oder Streuung einer mit n Freiheitsgraden Student-tverteilten Zufallsgrösse T beträgt E(T ) = 0 für n > 1 Wie bei jeder Verteilung gilt auch hier und Var(T ) = R∞ −∞ fn (t) dt n n−2 für n > 2. = 1. 0.4 0.3 0.2 0.1 –6 –4 –2 0 2 4 6 x Abbildung 5.2.ii: Die Student-t-Verteilung (schwarze Kurven) für verschiedene Freiheitsgrade n. Die Kurven ähneln denen der standardisierten Normalverteilung (graue Kurven), stimmen aber erst für grosse n einigermassen überein. Die Dichte der Student-t-Verteilung ist symmetrisch bezüglich des Nullpunktes t = 0. Sie hat einen um so flacheren Verlauf, je kleiner n ist, und strebt für n → ∞ gegen die Dichte der standardisierten Normalverteilung N (0, 1). Das q-Quantil der Student-t-Verteilung mit n Freiheitsgraden wird mit tn,q bezeichnet und ist vertafelt (vgl. Tafel T.3). Das q-Quantil tn,q kann aus der Beziehung P (T ≤ tn,q ) = q bestimmt werden. Da die Dichte symmetrisch ist, gilt für das (1 − q)-Quantil tn,1−q = −tn,q . Aufgaben Aufgabe 5.2.1. Durch Messung wurden die Längen von fünf Wellen bestimmt. Es wurden 8, 9, 11, 10, 10 Einheiten gemessen. Weicht der Mittelwert signifikant von µ = 10E ab? Das Signifikanzniveau ist 1%. Aufgabe 5.2.2. Bei einem Spannvorgang wurde bisher mit einem Vorgabewert von 135s gerechnet. Eine Zeitaufnahme lieferte bei N = 32 aufgenommenen Zeiten für diesen Teilvorgang einen mittleren Zeitbedarf in der Höhe von x̄ = 128s bei einer Standardabweichung von 2 R∞ Es ist Γ(x) = 0 tx−1 e−t dt die Gammafunktion, die die Fakultät auf reelle Zahlen verallgemeinert. Es gilt Γ(1) = 1 und Γ(n) = (n − 1)! für alle n ∈ N. 40 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) Abbildung 5.2.iii: William Sealey Gosset (1876-1937), der bei Guinness als Bierbrauer beschäftigt war, veröffentlichte im Jahr 1908 die t-Verteilung zum Mittelwertsvergleich. Da er damit den Malzgehalt verschiedener Getreidesorten untersuchte, war seine Firma von einer Veröffentlichung nicht begeistert. Daher publizierte er seinen t-Test (t vom engl. test) unter dem Pseudonym “Student”, was dem Test den Namen “Student-t-Test” eingebracht hat. s = 4.7s. Kann aus dem Unterschied zwischen 135s und 128s darauf geschlossen werden, dass der wahre jedoch unbekannte mittlere Zeitbedarf für diesen Teilvorgang generell nicht bei 135s liegt? Das Signifikanzniveau ist 1%. Aufgabe 5.2.3. Auf vier Äckern von je 40 Aren konnte der Ertrag von Kartoffeln durch neuartige Behandlung um 0.55, 0.30, 1.52, 0.68 Tonnen gesteigert werden. Ist diese Behandlungsmethode wirksamer als frühere? Das Signifikanzniveau ist 1%. Aufgabe 5.2.4. Es werden die Zugriffszeiten bei einem bestimmten Produktionsprozess untersucht. Folgende Stichprobe [in Sekunden] wurde ermittelt. Sind diese Zeiten wirklich von 0.4 Sekunden verschieden? Das Signifikanzniveau ist 1%. 0.23 0.43 0.54 0.62 5.2.1 0.23 0.43 0.54 0.65 0.23 0.43 0.54 0.65 0.30 0.43 0.54 0.65 0.32 0.45 0.54 0.67 0.32 0.45 0.54 0.67 0.34 0.45 0.56 0.68 0.34 0.45 0.56 0.76 0.34 0.45 0.56 0.76 Vertrauensintervall für den Erwartungswert Aus einer gegebenen Stichprobe können wir gewisse Parameter wie Mittelwert oder Varianz schätzen (berechnen). Hierbei fehlen aber noch Genauigkeitsangaben zu den berechneten Werten, und vielleicht möchten wir auch wissen, wie die Genauigkeit vom Stichprobenumfang abhängt. Dazu dienen die Intervallschätzungen, das sind aus der Stichprobe berechnete Intervalle, in denen der wahre, aber unbekannt Wert mit grosser Wahrscheinlichkeit zu erwarten ist. Solche Intervalle heissen Vertrauens- oder Konfidenzintervalle. Haben wir eine Stichprobe x1 , . . . , xN vom Umfang N aus einer normalverteilten Grundgesamtheit genommen, so interessieren wir uns für ein Vertrauensintervall des unbekannten Erwartungswertes µ der normalverteilten Grundgesamtheit. Dazu schätzen (berechnen) wir vorerst den Mittelwert N 1 X x̄ = xi N i=1 5.2. Einstichproben-t-Test, Student-t-Test und die Varianz 41 N 1 X s = (xi − x̄)2 N −1 2 i=1 aus der Stichprobe. Nun können wir Vertrauens- oder Konfidenzgrenzen für den unbekannten Wert µ angeben, innerhalb welchen der wahre Erwartungswert mit einer gewissen vorgegebenen Wahrscheinlichkeit γ liegt. Aus der vorgegebenen Vertrauenswahrscheinlichkeit γ = 1 − α bestimmen wir die kritische Grösse tn,1− α2 der Student-t-Verteilung mit n = N − 1 Freiheitsgraden. Beachten Sie, dass wir den Flächeninhalt α auf beiden Seiten unter der Student-t-Verteilung gleichmässig verteilen, d.h. zweiseitige Fragestellung. Wir suchen also alle möglichen µ, so dass √ α P |T | < tn,1− α2 = P X̄−µ N < t =1−α n,1− s 2 √ gilt. Nun können wir die Ungleichung x̄−µ N < tn,1− α2 nach µ umformen und erhalten das s Vertrauensintervall für den unbekannten Erwartungswert µ durch tn,1− α tn,1− α x̄ − √ 2 s ≤ µ ≤ x̄ + √ 2 s. N N Je grösser der Stichprobenumfang N ist, desto kleiner wird das Vertrauensintervall. Wollen wir also genaue Aussagen über den unbekannten Mittelwert machen, so sind wir gezwungen den Stichprobenumfang N möglichst gross zu wählen. Das Vertrauensintervall kann wie folgt interpretiert werden: von 100 aus Stichproben derselben Grundgesamtheit mit dem unbekannten Erwartungswert µ berechneten Vertrauensintervallen überdecken im Mittel γ · 100 = (1 − α) · 100 den wahren Erwartungswert µ. Beispiel 5.2.2. Es sei eine Stichprobe vom Umfang N = 10 mit geschätztem Mittelwert x̄ = 5 und Standardabweichung s = 0.2 gegeben. In welchem Intervall liegt nun der wahre aber unbekannte Erwartungswert µ der normalverteilten Grundgesamtheit? Dazu berechnen wir zur Vertrauenswahrscheinlichkeit γ = 0.95 die kritische Grösse t9,1−0.025 = 2.262 der Student-t-Verteilung. Damit ergibt sich das gesuchte Vertrauensintervall 2.262 2.262 5 − √ 0.2 ≤ µ ≤ 5 + √ 0.2, 10 10 also 4.86 ≤ µ ≤ 5.14 mit 95% Wahrscheinlichkeit. Aufgaben Aufgabe 5.2.5. An Hand einer Stichprobe von 10 auf einem Drehautomaten bearbeiteten Wellen soll ein Vertrauensintervall zur Vertrauenswahrscheinlichkeit 0.99 für den Erwartungswert µ der Grundgesamtheit der Abweichungen des Wellendurchmessers von der Mitte des Toleranzfeldes bestimmt werden. Folgende Abweichungen [in Mikrometer] der ist-Masse von der Mitte des Toleranzfeldes sind festgestellt worden: 2 1 -2 3 a. Verwenden Sie die Normalverteilung! 2 4 -2 5 3 4 42 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) b. Verwenden Sie die Student-t-Verteilung! Aufgabe 5.2.6. Gegeben sei wieder die Stichprobe aus Aufgabe 5.2.4 der Zugriffszeiten. In welchem Vertrauensintervall zur Vertrauenswahrscheinlichkeit 0.99 liegt der wirkliche Wert des Mittels der Zugriffszeiten? 5.2.2 Ungefähr erforderlicher Stichprobenumfang Wirtschaftliche und rationelle Arbeitsweise erfordern die Angabe des Arbeitsaufwandes, um bestimmte Genauigkeiten bei Mess- und Analysenergebnissen zu erziehlen. So ist es etwa wichtig, abzuschätzen, wie gross der Stichprobenumfang bei einem statistischen Test ungefähr sein muss, um eine bestimmte Zuverlässigkeit der Aussage zu erhalten. Mit Hilfe der Testgrösse t (vgl. Gleichung (5.2.a)) lässt sich eine solche ungefähre Abschätzung machen. Formen wir die Gleichung (5.2.a) nach N um, so erhalten wir N= t2 s 2 . (x̄ − µ)2 (5.2.c) Wir geben uns einen bestimmten Toleranzbereich ∆µ = |x̄ − µ| vor. Ist zusätzlich die Varianz s2 aus Voruntersuchungen etwa in Form einer oberen Schranke bekannt, so können wir für den Stichprobenumfang N einen ungefähren Wert abschätzen, indem wir einen Durchschnittswert für t = tn,1− α2 ≈ 2 bei einer Vertrauenswahrscheinlichkeit γ = 1 − α einsetzen. Wir erhalten damit einen ungefähren Stichprobenumfang N ≈4 s2 . ∆µ2 Es sei hier ausdrücklich gesagt, dass diese Abschätzung nur einen ungefähren3 Wert für den Stichprobenumfang liefert. Aufgabe Aufgabe 5.2.7. Der Kupfergehalt einer Partie Schwefelkies-Abbrände (Fe3 O3 Hüttrückstände) soll auf ∆µ = ±0.05% Cu genau bestimmt werden. Zur Bestimmung von s wurden 24 Proben genommen und getrennt analysiert. Es ergaben sich x̄ = 2.034% Cu und s = 0.271% Cu. Wie viele Proben sind etwa zu nehmen? 5.3 Vergleich zweier Mittelwerte unverbundener Stichproben Im Folgenden wollen wir wir den Vergleich zweier Mittelwerte aus normalverteilten Grundgesamtheiten anstellen. Wir unterscheiden die beiden Fälle, wenn die unbekannten Varianzen der normalverteilten Grundgesamtheit gleich oder ungleich sind. 3 Die rechte Seite der Gleichung (5.2.c) hängt via der kritischen Grösse tn,1− α2 auch noch von n = N − 1 ab. Somit liesse sich der Stichprobenumfang N nur iterativ bestimmen. Wir umgehen das Problem indem wir einen Durchschnittswert für t einsetzten. 5.3. Vergleich zweier Mittelwerte unverbundener Stichproben 5.3.1 43 Zweistichproben-t-Test bei unbekannten aber gleichen Varianzen Beispiel 5.3.1 (Parallelklassen). An einer Fachhochschule werden eine Klasse A von 25 Studierenden und eine Parallelklasse B von 28 Studierenden vom gleichen Dozenten in Mathematik unterrichtet. Der Dozent gestaltet jeweils den Unterricht in beiden Klassen gleich. Demzufolge wurden die beiden Klassen gleichzeitig zur gleichen Klausur aufgeboten. Die erreichten Notendurchschnitte waren x̄A = 3.9 und x̄B = 4.2 und die Standardabweichungen betrugen je sA = sB = 1. Der Dozent stellt sich nun sofort die Frage, ob die B-Klasse signifikant besser als die A-Klasse sei. Was denken Sie? Beim Zweistichproben-t-Test sind folgende Voraussetzungen zu beachten: 1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten aber gleichen4 Varianzen σ12 = σ22 = σ 2 , so genannt homoskedastischer Fall. Der Wert von σ 2 braucht jedoch nicht bekannt zu sein. 2. Es sind zufällig zwei Stichproben x1 , . . . , xN1 und y1 , . . . , yN2 aus den normalverteilten Grundgesamtheiten G1 und G2 gewählt. Wir wollen nun wissen, ob sich die Mittelwerte x̄ und ȳ der gewählten Stichproben signifikant voneinander unterscheiden um herauszufinden, ob die Stichproben aus der gleichen Grundgesamtheit stammen. Dazu formulieren wir die beiden alternativen Hypothesen H0 : µ1 = µ2 , d.h., Stichproben stammen aus der gleichen Grundgesamtheit. H1 : µ1 6= µ2 , d.h., Stichproben stammen aus unterschiedlichen Grundgesamtheiten. Um diese Frage zu beantworten berechnen wir die geschätzten Mittelwerte N1 1 X xi x̄ = N1 und i=1 N2 1 X ȳ = yi N2 i=1 und die geschätzten Varianzen N s21 1 X 1 = (xi − x̄)2 N1 − 1 N und s22 i=1 und daraus das gewogene Mittel der Varianzen s2 = 2 X 1 = (yi − ȳ)2 N2 − 1 i=1 (N1 − 1)s21 + (N2 − 1)s22 . N1 + N2 − 2 Mit diesen Werten berechnen wir nun die Testgrösse r x̄ − ȳ N1 N2 t= , s N1 + N2 (5.3.a) welche unter den obigen Voraussetzungen und der Nullhypothese einer Student-t-Verteilung mit n = N1 + N2 − 2 Freiheitsgraden genügt. Damit können wir nun nach Vorgabe eines Signifikanzniveaus α die kritische Grösse tn,1− α2 für die zweiseitige Fragestellung bestimmen. Danach ziehen wir wieder den statistischen Schluss: 4 Die Gleichheit der Varianzen in den Grundgesamtheiten kann mit einem in Kapitel 6 angegebenen statistischen Test überprüft werden. Ist diese Gleichheit nicht erfüllt, so haben wir ein so genanntes Behrens-FisherProblem (vgl. Kapitel 5.3.2). 44 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) • Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., die Unterschiede zwischen x̄ und ȳ sind zufälliger Natur. • Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Sind im Falle unabhängiger Stichproben ihre Umfänge gleich, gilt also N1 = N2 = N , so vereinfacht sich die Testgrösse (5.3.a) zu x̄ − ȳ √ N. t= p 2 s1 + s22 Der Zweistichproben-t-Test ist auch dann anwendbar, wenn die Grundgesamtheiten nicht normalverteilt, ihre Verteilungen aber nicht allzu unsymmetrisch sind. Beispiel 5.3.2. Gegeben seien die Messreihen x = {1, 2, 3, 2, 1} und y = {2, 2, 4, 1} aus normalverteilten Grundgesamtheiten. Wir testen unter der Voraussetzung σ12 = σ22 die Gleichheit der Erwartungswerte. Dazu stellen wir die geeigneten Hypothesen auf und berechnen die geschätzten Mittelwerte x̄ = 1.8 und ȳ = 2.25 und das gewogene Mittel der Varianzen s2 = 1.079. Die Anzahl Freiheitsgrade ist n = 5 + 4 − 2 = 7. Daraus berechnen wir die Testgrösse t = 0.646. Zum Signifikanzniveau α = 0.05 bestimmen wir für die zweiseitige Fragestellung den kritischen Wert t7,1−0.025 = 2.365. Nun führen wir den statistischen Schluss durch: Es gilt |t| = 0.646 < t7,1−0.025 = 2.365, also wird die Nullhypothese H0 angenommen. Die Mittelwerte x̄ = 1.8 und ȳ = 2.25 weichen demzufolge nur unwesentlich, zufallsbedingt, voneinander ab. Dieses eventuell überraschende Resultat ist erstens auf die grossen Varianzen und zweitens auf die sehr kleinen Stichprobenumfänge zurückzuführen. Aufgaben Aufgabe 5.3.1. Stammen die drei Messreihen x, y und z unter der Voraussetzung σx2 = σy2 = σz2 aus der gleichen normalverteilten Grundgesamtheit? Das Signifikanzniveau ist α = 1%. x y z 18.0 27.0 21.5 14.5 34.0 20.5 13.5 20.5 19.0 12.5 29.5 24.5 23.0 20.0 16.0 24.0 28.0 13.0 21.0 20.0 20.0 17.0 26.5 16.5 18.5 22.0 17.5 9.5 24.5 19.0 14.0 34.0 35.5 19.0 Aufgabe 5.3.2. Der durchschnittliche Verbrauch eines bestimmten Hilfsstoffes in zwei vergleichbaren Filialen einer Unternehmung soll geprüft werden. Dazu wurde der Verbrauch während einer Anzahl Tage bei beiden Filialen ermittelt. Es ergaben sich die folgenden Stichproben. Kann statistisch erhärtet werden, dass die eine Filiale signifikant mehr von dem entsprechenden Hilfsstoff verbraucht? Das Signifikanzniveau sei α = 1%. x y 1.5 8.8 3.4 5.5 6.6 5.5 3.5 4.5 4.5 6.6 6.4 5.4 2.6 7.1 6.6 5.6 7.8 6.6 4.9 8.3 5.5 6.6 6.6 5.5 6.8 3.6 7.7 6.1 7.7 8.8 4.9 7.6 8.8 8.3 5.5 8.8 6.2 7.7 4.7 5.5 7.7 9.9 5.8 4.9 6.3 7.3 6.6 7.7 6.4 5.9 8.8 6.6 5.3. Vergleich zweier Mittelwerte unverbundener Stichproben 5.3.2 45 Zweistichproben-t-Test bei unbekannten Varianzen Im Falle ungleicher Varianzen der Grundgesamtheiten σ12 6= σ22 , oder bei Ablehnung der Hypothese über die Gleichheit der Varianzen σ12 und σ22 durch einen in Kapitel 6 angegebenen Test kann zur Prüfung der Hypothese H0 : µ1 = µ2 ein von B. L. Welch (1947) vorgeschlagener Näherungstest verwendet werden. Diese Aufgabenstellung wird als Behrens-FisherProblem bezeichnet. Beispiel 5.3.3 (Markenjeans). Wir haben zwei Lieferungen von Markenjeans vom gleichen Importeur. Dieser behauptet, beide Lieferungen seien in den USA hergestellt worden. Wir vermuten aber, dass eine Lieferung aus Fernost mit schlechter Qualität stammt. Wie können wir unsere Vermutung überprüfen? Zum Beispiel, indem wir ein Qualitätsmerkmal (z.B. Reisfestigkeit der Jeans nach 20 Mal waschen) bestimmen und von diesem Merkmal den Mittelwert für beide Lieferungen bilden und diese Mittelwerte mit einem unverbundenen Zweistichproben-t-Test untersuchen. Da wir vermuten, dass die Lieferungen aus zwei verschiedenen Fabriken stammen, müssen wir davon ausgehen, dass die Varianzen verschieden sein könnten. Beim Behrens-Fisher-Problem sind folgende Voraussetzungen zu beachten: 1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten Varianzen σ12 und σ22 , so genannt heteroskedastischer Fall. 2. Es sind zufällig zwei Stichproben x1 , . . . , xN1 und y1 , . . . , yN2 aus den normalverteilten Grundgesamtheiten G1 und G2 gewählt. Wir wollen nun wissen, ob sich die Mittelwerte x̄ und ȳ der gewählten Stichproben signifikant voneinander unterscheiden um herauszufinden, ob die Stichproben aus der gleichen Grundgesamtheit stammen. Dazu formulieren wir die beiden alternativen Hypothesen: H0 : µ1 = µ2 , d.h., Stichproben stammen aus der gleichen Grundgesamtheit. H1 : µ1 6= µ2 , d.h., Stichproben stammen aus unterschiedlichen Grundgesamtheiten. Um diese Frage zu beantworten berechnen wir die geschätzten Mittelwerte x̄ = N1 1 X xi N1 und ȳ = i=1 N2 1 X yi N2 i=1 und die geschätzten Varianzen N s21 = N 1 X 1 (xi − x̄)2 N1 − 1 und s22 = i=1 und daraus die gewogene Varianz s2 = 2 X 1 (yi − ȳ)2 N2 − 1 i=1 s21 s2 + 2. N1 N2 Wir stellen fest, dass die gewogene Varianz s2 anders berechnet wird, als im Fall gleicher Varianzen (vgl. Gleichung (5.3.a)). Mit diesen Werten berechnen wir nun die Testgrösse t= x̄ − ȳ . s (5.3.b) 46 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) Die Testgrösse t gehorcht wiederum einer Student-t-Verteilung mit n= $ 1 c2 N1 −1 + (1−c)2 N2 −1 % mit c= s21 N1 s21 N1 + s22 N2 Freiheitsgraden, wobei ⌊ . ⌋ die Abrundungsfunktion bezeichnet. Damit können wir nun nach Vorgabe eines Signifikanzniveaus α die kritische Grösse tn,1− α2 für die zweiseitige Fragestellung bestimmen und den statistischen Schluss ziehen: • Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen. • Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Aufgabe Aufgabe 5.3.3. Mit zwei verschiedenen Holzwerkstoffbindemitteln A und B werden Spanplatten hergestellt. Mit dem Bindemittel A erhalten wir 10 Prüfkörper, mit dem Mittel B deren 12. Alle Prüfkörper werden einem Querzugfestigkeitstest unterworfen. Folgende Werte wurden gemessen: A B 0.745 0.745 0.824 0.686 0.804 1.049 0.863 1.059 0.873 0.873 0.814 0.834 0.804 0.735 0.794 0.971 0.804 0.932 0.745 0.932 0.843 0.873 Sind die beiden Bindemittel gleichwertig? Das Signifikanzniveau ist α = 1%. 5.4 Paarweiser Vergleich bei verbundenen Stichproben Oft stehen wir in der Praxis vor der Aufgabe, Unterschiede zwischen zwei verschiedenen Produktionsverfahren, Behandlungsmethoden, Messgeräten, Messmethoden oder Laboranten miteinander zu vergleichen. Zu diesem Zweck werden mit beiden Verfahren an denselben Einheiten Messungen des Merkmals durchgeführt und paarweise verglichen. Folgendes Beispiel soll zur näheren Erläuterung dienen. Beispiel 5.4.1. Zwei verschiedene Messmethoden für Widerstände sollen miteinander verglichen werden. Vergleichsmessungen an fünf Widerständen ergaben das folgende Messprotokoll: i 1. Methode: xi [in Ω] 2. Methode: yi [in Ω] 1 100.5 98.2 2 102.4 99.1 3 104.3 102.4 4 101.5 101.1 5 98.4 96.2 Wir wollen wissen, ob beide Messmethoden als gleichwertig angesehen werden können oder ob die beobachteten Abweichungen signifikant sind. Um diese Aufgabe zu bewältigen, verwenden wir einen paarweisen Vergleichstest, bei dem folgende Voraussetzungen zu beachten sind: 1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten aber gleichen Varianzen σ12 = σ22 = σ 2 . Der Wert von σ 2 braucht jedoch nicht bekannt zu sein. 5.4. Paarweiser Vergleich bei verbundenen Stichproben 47 2. Es sind zufällig zwei verbundene Stichproben x1 , . . . , xN und y1 , . . . , yN aus den normalverteilten Grundgesamtheiten G1 und G2 gewählt, d.h., xi lässt sich mit yi vergleichen. Wir wollen nun wissen, ob sich sich die verbundenen Messwerte xi und yi signifikant voneinander unterscheiden. Dazu berechnen wir aus den paarweise zusammengehörigen Messwerten die Differenzen di = xi − yi für alle i ∈ {1, . . . , N } Diese Reihe der Differenzen di wird als Stichprobe vom Umfang N aus einer normalverteilten Grundgesamtheit mit dem Erwartungswert µd und der im Allgemeinen unbekannten Varianz σd2 aufgefasst. Die Untersuchung einer signifikanten Abweichung entspricht der Prüfung der alternativen Hypothesen: H0 : µd = 0, d.h. im Mittel kein Unterschied zwischen den verbundenen Messwerten. H1 : µd 6= 0, d.h. im Mittel Unterschied zwischen den verbundenen Messwerten. Damit können wir den in Kapitel 5.2 beschriebenen Einstichproben-t-Test mit der Testgrösse t= d¯ − µd √ d¯ √ N= N, sd sd (5.4.a) verwenden, wobei N 1 X d¯ = di N N und s2d = i=1 1 X ¯2 (di − d) N −1 i=1 das arithmetische Mittel und die geschätzte Varianz der Differenzenreihe bedeutet. Die Testgrösse t gehorcht einer Student-t-Verteilung mit n = N −1 Freiheitsgraden. Damit können wir nun nach Vorgabe eines Signifikanzniveaus α die kritische Grösse tn,1− α2 für die zweiseitige Fragestellung bestimmen und den statistischen Schluss ziehen: • Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., die Messwerte unterscheiden sich nur zufällig. • Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Aufgaben Aufgabe 5.4.1. Es soll untersucht werden, ob zwei Laboranten vergleichbare Ergebnisse bei der Bestimmung des Leimungsgrades von Papieren mit einem bestimmten Test liefern. Beide Laboranten haben 8 verschiedene Papiersorten gemessen. Das Signifikanzniveau ist α = 1%. Sorte Labor A Labor B 1 18.60 18.58 2 27.60 27.37 3 27.50 27.27 4 25.00 24.64 5 24.50 24.10 6 26.80 26.33 7 29.70 29.33 8 26.50 26.63 Aufgabe 5.4.2. Die folgenden Zahlenpaare sind entstanden aus Messungen von spezifischen Gewichten einer Anzahl Materialien durch zwei Experimentatoren. Vergleichen Sie sie paarweise. Sind die beiden Messreihen gleichwertig? Das Signifikanzniveau ist α = 1%. 48 Kapitel 5. Prüfen von Erwartungswerten (Parametertests) Paar x y 1 3.3 3.2 2 3.2 3.4 3 3.8 3.5 4 3.4 3.2 5 3.5 3.2 6 3.4 3.4 7 3.4 3.4 8 3.6 3.2 9 3.9 3.3 10 3.8 3.1 Paar x y 11 3.6 3.0 12 3.3 3.5 13 3.4 3.4 14 3.5 3.2 15 3.8 3.2 16 3.8 3.5 17 3.3 3.2 18 3.2 3.5 19 3.2 3.1 20 3.5 3.0 Kapitel 6 Prüfen von Varianzen (Parametertests) Ebenso wie über den Mittelwert µ der normalverteilten Grundgesamtheit können wir auch über die Varianz σ 2 eine statistische Hypothese aufstellen und diese mit geeigneten Testverfahren nachprüfen. Solche Prüfmethoden sind von besonderer Wichtigkeit, wenn die Genauigkeit und Gleichmässigkeit der Arbeitsweise technologischer Prozesse, Messgeräte oder Maschinen untersucht werden soll. Wir unterscheiden dabei zwei Fälle. 6.1 Abweichung einer Varianz vom theoretischen Wert, χ2 Varianztest Eine einzige Stichprobe von N Werten x1 , . . . , xN liegt vor. Ihre Varianz s2 ist zu vergleichen mit einem Wert σ 2 , der irgendwie, unabhängig von den Beobachtungen, gegeben ist. Wir benutzen dazu den χ2 -Varianztest1 , bei dem folgende Voraussetzungen zu beachten sind: 1. Die normalverteilte Grundgesamtheit G hat die bekannte Varianz σ 2 . 2. Es sind zufällig N Stichprobenwerte x1 , . . . , xN aus einer normalverteilten Grundgesamtheit gewählt. Beachten Sie, dass bei diesem Test der Erwartungswert µ der Grundgesamtheit ohne Einfluss bleibt. Wir wollen nun wissen, ob die gewählte Stichprobe der N Werte x1 , . . . , xN aus der Grundgesamtheit G mit der Varianz σ 2 stammt. Dazu berechnen wir die geschätzte Varianz N s2 = 1 X (xi − x̄)2 N −1 i=1 mit x̄ = N 1 X xi N i=1 und vergleichen sie mit der bekannten Varianz σ 2 der Grundgesamtheit G, indem wir folgende alternativen Hypothesen aufstellen. H0 : σ 2 = s2 , d.h., die Stichprobe stammt aus der Grundgesamtheit G mit Varianz σ 2 . H1 : σ 2 6= s2 , d.h., die Stichprobe stammt aus einer anderen Grundgesamtheit. 1 sprich Chi-Quadrat 49 50 Kapitel 6. Prüfen von Varianzen (Parametertests) Zur Beantwortung dieser Fragestellung machen wir nun folgende gedankliche Konstruktion: Wir betrachten die Gesamtheit aller zufälligen Stichproben mit N Werten x1 , . . . , xN aus einer normalen Grundgesamtheit mit Varianz σ 2 . Zu jeder Stichprobe berechnen wir aus den Werten x1 , . . . , xN die geschätzte Varianz und daraus die Testgrösse χ2 = (N − 1)s2 . σ2 (6.1.a) Für jede Stichprobe erhalten wir nun einen anderen Wert für χ2 und demzufolge wieder eine Wahrscheinlichkeitsverteilung, die so genannte χ2 -Verteilung mit n = N − 1 Freiheitsgraden. Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α ist für die zweiseitige Fragestellung durch die kritischen Grössen χn, α2 (unten) und χn,1− α2 (oben) gegeben. Die kritischen Grössen lassen sich für die zweiseitige Fragestellung aus den Beziehungen P χ2 ≤ χ2n, α = α2 und P χ2n,1− α ≤ χ2 = α2 2 2 mit Hilfe von Tafeln T.4 und T.5 oder einem Computerprogramm (z.B. Excel) ermitteln. Jetzt ziehen wir den statistischen Schluss (hier für die zweiseitige Fragestellung): fn (x) 1−α α 2 α 2 χ2n,1− α 2 χ2n, α 2 Ablehnungsbereich Annahmebereich x Ablehnungsbereich Abbildung 6.1.i: Kritische Grössen χ2n, α und χ2n,1− α beim χ2 -Varianztest. 2 2 • Ist die Testgrösse χ2n, α < χ2 < χ2n,1− α , dann wird die Nullhypothese H0 angenommen, 2 2 d.h., Abweichungen vom idealen Wert χ2 = N − 1 sind zufälliger Natur. Die Stichprobe stammt somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus der Grundgesamtheit mit der Varianz σ 2 . • Ist die Testgrösse χ2 ≤ χ2n, α oder χ2n,1− α ≤ χ2 , dann wird die Nullhypothese H0 auf 2 2 dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit. Beispiel 6.1.1. Es sei eine Stichprobe aus einer normalverteilten Grundgesamtheit von N = 10 Messungen gegeben. Wir berechnen die Varianz s2 = 16.25 und fragen uns, ob eine signifikante Abweichung der Varianz s2 vom theoretisch zu erwartenden Wert σ = 2.3 vorliegt. Das Signifikanzniveau sei α = 0.01. Dazu stellen wir die geeigneten Hypothesen für die zweiseitige Fragestellung auf und berechnen die Testgrösse des χ2 -Varianztest χ2 = (N − 1)s2 9 · 16.25 = = 63.587. σ2 2.3 6.1. Abweichung einer Varianz vom theoretischen Wert, χ2 -Varianztest 51 Die Anzahl Freiheitsgrade ist n = 10 − 1 = 9. Zum Signifikanzniveau α = 0.01 bestimmen wir für die zweiseitige Fragestellung mit Hilfe von Tafeln T.4 und T.5 oder einem Computerprogramm die kritischen Werte χ29,0.005 = 1.735 χ29,1−0.005 = 23.589. und Nun führen wir den statistischen Schluss durch: Es gilt χ2 = 63.587 6∈ ]1.735, 23.589[, also wird die Nullhypothese H0 abgelehnt. Die Stichprobe stammt demnach mit einer Irrtumswahrscheinlichkeit von 99% aus einer anderen Grundgesamtheit. Die χ2 -Verteilung Die von K. Pearson (1857-1936) (vgl. Abbildung 1.1.i) gefundene χ2 -Verteilung mit n Freiheitsgraden hat die Wahrscheinlichkeitsdichte ( 0 wenn x < 0 fn (x) = n x −1 − cn x 2 e 2 wenn x ≥ 0, wobei cn = 1 n 2 2 Γ( n ) 2 eine nur von der Anzahl Freiheitsgraden n abhängige Konstante2 ist. Der Erwartungswert und die Varianz oder Streuung einer mit n Freiheitsgraden χ2 -verteilten Zufallsgrösse χ2 beträgt E(χ2 ) = n und Var(χ2 ) = 2n. R∞ Wie bei jeder Verteilung gilt auch hier −∞ fn (x) dx = 1. 0.6 0.5 0.4 0.3 0.2 0.1 0 2 4 6 8 10 12 x Abbildung 6.1.ii: Die χ2 -Verteilung für verschiedene Freiheitsgrade n. Der Erwartungswert E(χ2 ) = n wandert mit zunehmendem n nach rechts und die Verteilungen werden flacher. Die Dichte der χ2 -Verteilung ist im Allgemeinen unsymmetrisch linkssteil. Für n → ∞ strebt die Dichte gegen eine N (n, 2n)-Verteilung (vgl. Abbildungen 6.1.iii und 6.1.iv). Das q-Quantil der χ2 -Verteilung mit n Freiheitsgraden wird mit χ2n,q bezeichnet und ist vertafelt (vgl. Tafeln T.4 und T.5). Das q-Quantil χ2n,q kann aus der Beziehung P χ2 ≤ χ2n,q = q bestimmt werden. 2 Es bezeichnet Γ die Gammafunktion. 52 Kapitel 6. Prüfen von Varianzen (Parametertests) –10 0.12 0.06 0.1 0.05 0.08 0.04 0.06 0.03 0.04 0.02 0.02 0.01 0 –5 5 10 15 20 –10 10 20 x 30 40 50 x Abbildung 6.1.iii: Die χ2 -Verteilung mit Freiheitsgrad n = 5 (schwarz) und die approximative N (n, 2n)-Verteilung (grau). Abbildung 6.1.iv: Die χ2 -Verteilung mit Freiheitsgrad n = 20 (schwarz) und die approximative N (n, 2n)-Verteilung (grau). Aufgaben Aufgabe 6.1.1. Die Zeitaufnahme für einen Spannvorgang in der Produktion lieferte eine beobachtete Messwertstandardabweichung von s = 4.7 Sekunden. Ist dieses Stichprobenergebnis vereinbar mit dem für diesen Vorgang bisher geltenden Wert für die Standardabweichung in der Höhe von σ = 3 Sekunden, wenn N = 32? Das Signifikanzniveau sei α = 1%. Aufgabe 6.1.2. Der Wirkungsgrad einer Maschine wurde viermal täglich ermittelt. ln 17 Tagen ergaben sich für die vier Messungen untenstehende Standardabweichungen. Tag s Tag s 1 5.62 11 5.23 2 4.57 12 4.69 3 7.59 13 3.7 4 5.48 14 5.6 5 7.44 15 13.7 6 4.51 16 6.86 7 1.5 17 3.37 8 10.3 9 10.4 10 5.32 Weichen die beobachteten Standardabweichungen wesentlich vom theoretisch angenommenen Wert σ = 5.24 ab? Das Signifikanzniveau sei α = 2%. 6.1.1 Vertrauensintervall für die Varianz Haben wir eine Stichprobe x1 , . . . , xN vom Umfang N aus einer normalverteilten Grundgesamtheit genommen, so interessieren wir uns für ein Vertrauensintervall der unbekannten Varianz σ 2 der normalverteilten Grundgesamtheit. Dazu schätzen wir die Varianz s2 aus der Stichprobe. Nun können wir mit Hilfe des χ2 -Varianztests ein Vertrauens- oder Konfidenzintervall für den unbekannten Wert σ 2 angeben, innerhalb welchem die wahre Varianz mit einer gewissen vorgegebenen Wahrscheinlichkeit γ liegt. Aus der vorgegebenen Vertrauenswahrscheinlichkeit γ = 1 − α bestimmen wir die beiden kritischen Grössen χ2n, α und χ2n,1− α der χ2 -Verteilung, so dass P χ2n, α ≤ χ2 ≤ χ2n,1− α = P χ2n, α ≤ 2 2 2 gilt. Nun können wir die Ungleichung χ2n, α ≤ 2 2 (N −1)s2 σ2 (N −1)s2 σ2 ≤ χ2n,1− α 2 2 =1−α ≤ χ2n,1− α nach σ 2 umformen und 2 6.1. Abweichung einer Varianz vom theoretischen Wert, χ2 -Varianztest 53 fn (x) 1−α α 2 α 2 χ2n,1− α χ2n, α 2 x 2 Abbildung 6.1.v: Die benötigten kritischen Grenzen zur Berechnung des Vertrauensintervalls. erhalten das Vertrauensintervall N −1 2 N −1 s ≤ σ 2 ≤ 2 s2 2 χn,1− α χn, α 2 2 für die unbekannte Varianz σ 2 . Das Vertrauensintervall kann wie folgt interpretiert werden: von 100 aus Stichproben derselben Grundgesamtheit mit der unbekannten Varianz σ 2 berechneten Vertrauensintervallen überdecken im Mittel γ · 100 = (1 − α) · 100 die wahre Varianz σ2 . Beispiel 6.1.2. Es sei eine Stichprobe vom Umfang N = 8 mit geschätzter Standardabweichung s = 2 gegeben. In welchem Intervall liegt nun die wahre aber unbekannte Standardabweichung σ der normalverteilten Grundgesamtheit? Dazu berechnen wir zur Vertrauenswahrscheinlichkeit γ = 0.98 die kritischen Grössen χ27,0.01 = 1.239 und χ27,0.99 = 18.475 der χ2 -Verteilung. Damit ergibt sich das gesuchte Vertrauensintervall 8−1 2 8−1 2 2 = 1.516 ≤ σ 2 ≤ 2 = 22.598, 18.475 1.239 also 1.231 ≤ σ ≤ 4.7542 mit 98% Wahrscheinlichkeit. Aufgaben Aufgabe 6.1.3. Zum Vertrauensniveau α = 0.1 sei ein Vertrauensintervall für die Standardabweichung der Breite der Rohlinge von Kugellagerinnenringen aufgrund einer Stichprobe von 20 Stück zu bestimmen. Es soll vorausgesetzt werden, dass die Breite der Rohlinge normalverteilt ist. Die Messungen ergaben x̄ = 32.2975mm, s2 = 0.13306mm2 . Aufgabe 6.1.4. Die folgenden Werte ergaben sich als Stichprobe von 19 aufgenommenen Zeiten bei einem Arbeitsvorgang. 3.12 3.00 3.15 3.22 3.12 3.11 3.20 3.81 3.10 3.30 3.13 3.24 3.16 3.16 3.18 3.51 3.21 3.21 3.01 In welchem Intervall liegt die Standardabweichung dieses Arbeitsvorgangs mit 98% Wahrscheinlichkeit? 54 Kapitel 6. Prüfen von Varianzen (Parametertests) 6.2 Vergleich zweier Varianzen, F -Test Der Unterschied zweier Varianzen ist zu prüfen, wobei zwei voneinander unabhängige Stichproben von N1 und N2 Werten bestimmt wurden. Wir benutzen dazu den F -Test3 oder Fisher-Test bei dem folgende Voraussetzungen zu beachten sind: 1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten Varianzen σ12 und σ22 . 2. Es sind zufällig zwei unabhängige Stichproben x1 , . . . , xN1 und y1 , . . . , yN2 aus den normalverteilten Grundgesamtheiten G1 und G2 gewählt. Wir wollen nun wissen, ob sich die Varianzen N s21 1 X 1 = (xi − x̄)2 N1 − 1 s22 = 1 N2 − 1 i=1 N2 X i=1 (yi − ȳ)2 mit mit N1 1 X x̄ = xi , N1 ȳ = 1 N2 i=1 N2 X yi i=1 der beiden Grundgesamtheiten signifikant voneinander unterscheiden. Indem wir gegebenenfalls die beiden Stichproben vertauschen, können wir zusätzlich annehmen, dass die zusätzliche Voraussetzung s21 ≥ s22 (6.2.a) gilt. Nun formulieren wir die beiden alternativen Hypothesen für die einseitige Fragestellung, da wir wegen der zusätzlichen Voraussetzung (6.2.a) nur an einer Abweichung nach oben interessiert sind: H0 : σ12 = σ22 , d.h., die Stichproben haben die gleichen Varianzen. H1 : σ12 > σ22 , d.h., die Varianz der ersten Stichprobe ist grösser als die der zweiten. Zur Beantwortung dieser Fragestellung machen wir nun folgende gedankliche Konstruktion: Es werden beliebig viele Paare von Stichproben vom Umfang N1 und N2 aus den jeweiligen Grundgesamtheiten entnommen. Zu jedem Stichprobenpaar berechnen wir aus den geschätzten Varianzen die Testgrösse F = s21 . s22 (6.2.b) Wegen der zusätzlichen Voraussetzung (6.2.a) gilt F ≥ 1. Für jedes Stichprobenpaar erhalten wir nun einen anderen Wert für F , und demzufolge wieder eine Wahrscheinlichkeitsverteilung, die so genannte F -Verteilung mit m = N1 − 1 und n = N2 − 1 Freiheitsgraden. Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α ist für die einseitige Fragestellung durch den kritischen Wert Fm,n,1−α gegeben. Der kritische Wert lässt sich für die einseitige Fragestellung aus der Beziehung P (Fm,n,1−α ≤ F ) = α mit Hilfe von Tafeln T.6 bis T.14 oder einem Computerprogramm (z.B. Excel) ermitteln. Jetzt ziehen wir den statistischen Schluss: 3 F von F isher 6.2. Vergleich zweier Varianzen, F -Test 55 fm,n (x) 1−α α Fm,n,1−α x Ablehnungsbereich Annahmebereich Abbildung 6.2.i: Kritische Grösse Fm,n,1−α beim F -Test. • Ist die Testgrösse F < Fm,n,1−α , dann wird die Nullhypothese H0 angenommen, d.h., Abweichungen vom idealen Wert F = 1 sind zufälliger Natur. Die beiden Stichproben stammen somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus Grundgesamtheiten mit gleichen Varianzen. • Ist die Testgrösse Fm,n,1−α ≤ F , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Beispiel 6.2.1. Es seien zwei Stichproben vom Umfang N1 = 21 mit s21 = 11.0 und N2 = 16 mit s22 = 7.6 aus normalverteilten Grundgesamtheiten gegeben. Können wie an Hand dieser Angaben mit einer Irrtumswahertscheinlichkeit von α = 1% entscheiden, ob sich die Varianzen σ12 und σ22 der beiden Grundgesamtheiten signifikant voneinander unterscheiden? Da die zusätzliche Voraussetzung (6.2.a) erfüllt ist, können wir die Testgrösse 11.0 = 1.447 7.6 F = berechnen. Die Anzahl Freiheitsgrade sind m = 21 − 1 = 20 und n = 16 − 1 = 15. Zum Signifikanzniveau α = 0.01 bestimmen wir mit Hilfe von Tafel T.10 oder einem Computerprogramm den kritischen Wert F20,15,0.99 = 3.372. Nun führen wir den statistischen Schluss durch: Es gilt F = 1.447 < F20,15,0.99 = 3.372, also wird die Nullhypothese H0 angenommen. Die Stichproben stammen demzufolge mit einer Irrtumswahrscheinlichkeit von 99% aus normalverteilten Grundgesamtheiten mit der gleichen Varianz. Die F -Verteilung Die von R. A. Fisher (1890-1962) (vgl. Abbildung 1.1.iii) gefundene F -Verteilung mit (m, n) Freiheitsgraden hat die Wahrscheinlichkeitsdichte fm,n (x) = 0 cm,n wenn x < 0 m −1 2 m+n m 2 1+ n x x ( ) wenn x ≥ 0, 56 Kapitel 6. Prüfen von Varianzen (Parametertests) wobei cm,n = stante4 Γ( m+n ) 2 n Γ( m )Γ( ) 2 2 m n m 2 eine nur von der Anzahl Freiheitsgrade (m, n) abhängige Kon- ist. Der Erwartungswert und die Varianz oder Streuung einer mit (m, n) Freiheitsgraden F -verteilten Zufallsgrösse F beträgt E(F ) = n n−2 für n > 2 und Wie bei jeder Verteilung gilt auch hier Var(F ) = R∞ −∞ fm,n (x) dx 2n2 (m + n − 2) m(n − 2)2 (n − 4) für n > 4. = 1. 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 2 4 6 8 10 x Abbildung 6.2.ii: Die F -Verteilung für verschiedene Freiheitsgrade (6, n). Der Erwartungswert n konvergiert mit zunehmendem n gegen 1 und die Verteilungen werden steiler. E(F ) = n−2 Die Dichte der F2-Verteilung ist unsymmetrisch. Für grosse m und n strebt die Dichte gegen 2n (m+n−2) n eine N n−2 , m(n−2)2 (n−4) -Verteilung (vgl. Abbildungen 6.2.iii und 6.2.iv). 1 1.6 1.4 0.8 1.2 1 0.6 0.8 0.4 0.6 0.4 0.2 0.2 –1 0 1 2 3 x Abbildung 6.2.iii: Die F -Verteilung mit Freiheitsgrad (20, 30) (schwarz) und die approximative Normalverteilung (grau). –1 0 1 2 3 x Abbildung 6.2.iv: Die F -Verteilung mit Freiheitsgrad (60, 90) (schwarz) und die approximative Normalverteilung (grau). Das q-Quantil der F -Verteilung mit (m, n) Freiheitsgraden wird mit Fm,n,q bezeichnet und 4 Es bezeichnet Γ die Gammafunktion. 6.2. Vergleich zweier Varianzen, F -Test 57 ist vertafelt (vgl. Tafeln T.6 bis T.14). Das q-Quantil Fm,n,q wird aus der Beziehung P (F ≤ Fm,n,q ) = q bestimmt. Es gilt Fn,m,1−q = 1 . Fm,n,q Aufgaben Aufgabe 6.2.1. Für eine auszuführende Arbeit stehen zwei Arbeitsverfahren zur Diskussion. Da es bei der Arbeit wesentlich auf die gleichmässige Arbeitsausführung ankommt, werden beide Verfahren getestet und hierüber Zeitaufnahmen gemacht. Das erste Verfahren wurde insgesamt N1 = 125 Mal beobachtet und dabei eine Messwertstandardabweichung von s1 = 2.2 s festgestellt. Das zweite Verfahren lieferte aufgrund von N2 = 20 Messwerten die Standardabweichung s2 = 3.0 s. Kann aus diesem Vergleich beider Versuchsergebnisse geschlossen werden, dass das erste Verfahren eine gleichmässigere Arbeitsausführung, d.h. eine geringere Zeitstreuung gewährleistet? Das Signifikanzniveau ist α = 1%. Aufgabe 6.2.2. Abhängigkeit der Varianzen der Arbeitszeiten [in Sekunden im Quadrat] von der Arbeitseile. Es wird geglaubt, dass die Varianz der Griffzeiten mit zunehmender Arbeitseile zuerst abnimmt und dann wieder zunimmt. Dies jedenfalls suggerieren die folgenden Zahlen. Aufnahme 1 2 3 4 Anzahl Messungen 30 30 30 30 Durchschnitt Arbeitszeiten 51.97 46.80 42.43 37.53 Varianz s2 Arbeitszeiten 8.847 3.614 7.236 10.516 Kann die Abnahme respektive Zunahme als gesichert betrachtet werden? Das Signifikanzniveau ist α = 1%. Aufgabe 6.2.3 (Mischwirkung pharmazeutischer verwendeter Pulvermischer). Die Vermischungsgüte von vier verschiedenen Mischertypen soll an Hand der Vermischung von 60% Sulfisomidin und 40% Weizenstärke untersucht werden. Hierbei ist die Teilchenbeschaffenheit unterschiedlich. Es werden die folgenden Mischertypen untersucht: 1. Schüttelmischer 2. Doppelzylindermischer 3. Trommelmischer 4. Rührmischer An zehn Punkten wurden in jedem Mischertyp nach bestimmten Umdrehungszahlen Proben entnommen und analysiert. Es ergaben sich als Standardabweichungen s folgende Werte: Umdrehungen 1. Schüttelmischer 2. Doppelzylindermischer 3. Trommelmischer 4. Rührmischer 10 31.00 9.26 18.65 11.80 100 11.05 10.05 4.00 8.95 500 8.76 9.50 3.92 6.58 1500 4.40 7.15 3.54 5.60 3500 2.12 5.25 3.64 3.99 8500 2.56 3.06 3.64 2.06 13500 2.18 1.93 2.49 3.54 18500 2.18 1.96 2.47 4.56 58 Kapitel 6. Prüfen von Varianzen (Parametertests) Wegen der zufälligen Natur des Mischprozesses wir eine absolute Homogenität nie erreicht. Toleranzen müssen deshalb akzeptiert werden. Für den Versuch wurde folgende Vereinbarung getroffen. Eine Mischung wird als homogen bezeichnet, wenn von 10 Stichproben einer Mischstufe deren 9 eine Abweichung bis ±5% und nur eine Stichprobe eine Abweichung bis ±10% vom Mittelwert zeigen, und wenn das Mittel einer Mischerstufe nicht mehr als ±5% vom Sollwert abweicht. Die obigen Zahlen legen nun eine spezielle Untersuchung des Rührmischers nahe. Ist die auftretende Inhomogenität nach 18500 Umdrehungen statistisch gesichert oder nicht? Vergleichen Sie die Mischgüte von folgenden Mischern und Stufen: a. Rührmischer: bei 3500 und 8500 Umdrehungen b. Rührmischer: bei 8500 und 13500 Umdrehungen c. Rührmischer: bei 8500 und 18500 Umdrehungen d. Schüttelmischer und Doppelzylindermischer: bei 3500 Umdrehungen 6.3 Vergleich von mehreren Varianzen, Cochran-Test Der Cochran-Test ist ein vereinfachtes Verfahren zur Beurteilung von mehreren Varianzen. Als Voraussetzung haben wir eine Reihe von k unabhängigen Stichproben gleichen Umfangs N aus normalverteilten Grundgesamtheiten gegeben. Das Problem stellt sich nun zu entscheiden, ob die Varianzen der Grundgesamtheiten der k unabhängigen Stichproben alle gleich sind. Die Untersuchung einer signifikanten Abweichung entspricht der Prüfung der alternativen Hypothesen: H0 : σ12 = · · · = σk2 , d.h., alle Varianzen der k Grundgesamtheiten sind gleich. H1 : σi2 6= σj2 für mindestens zwei verschiedene Indizes i, j ∈ {1, . . . , k}. Dazu berechnen wir aus den k Stichproben die Testgrösse s2i 2, 1≤i≤k s2 1 + · · · + sk g = max wobei s21 , . . . , s2k die geschätzten Varianzen der k Stichproben sind. Die Wahrscheinlichkeitsverteilung von g entspricht keiner der uns bekannten Verteilungen, sie lässt sich aber im Prinzip bestimmen. Die kritischen Werte gk,n,1−α für entsprechende Freiheitsgrade k und n = N − 1 zu gegebenem Signifikanzniveau α berechnen wir mit gk,n,1−α = Fn,n(k−1),1− αk Fn,n(k−1),1− αk + (k − 1) , wobei Fm,n,q das q-Quantil der F -Verteilung mit Freiheitsgrad (m, n) darstellt (vgl. Tafeln T.6 bis T.14) oder entnehmen sie der Tafel T.15. Danach ziehen wir wieder den statistischen Schluss: • Ist die Testgrösse g < gk,n,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die Unterschiede zwischen den k Varianzen sind zufälliger Natur. • Ist die Testgrösse gk,n,1−α ≤ g, dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. 6.3. Vergleich von mehreren Varianzen, Cochran-Test 59 Abbildung 6.3.i: William Gemmell Cochran, 1909-1980 Aufgaben Aufgabe 6.3.1. Der Produktion einer Waagerechtschmiedemaschine wurden im Verlaufe von sieben Schichten sieben Proben von je 17 Schmiedstücken entnommen. Es wurde an jedem Teil ein bestimmtes Mass gemessen. Die empirischen Varianzen der einzelnen Proben ergaben sich zu [in mm2 ]: s21 0.067 s22 0.136 s23 0.168 s24 0.068 s25 0.066 s26 0.102 s27 0.137 Prüfen Sie die Hypothese, dass die wahren Varianzen alle gleich sind. Die Irrtumswahrscheinlichkeit ist α = 0.01. Aufgabe 6.3.2. Beurteilen Sie, ob die sechs Stichproben verschiedene Varianzen haben. Das Signifikanzniveau sei α = 1%. x1 1 2 3 6 5 4 3 4 5 6 5 4 3 4 x2 4 5 4 5 4 5 4 3 4 5 4 3 4 3 x3 2 3 4 3 4 3 4 6 5 8 4 5 3 4 x4 3 4 3 4 4 3 4 3 6 5 8 6 7 2 x5 1 9 2 8 5 8 2 7 4 8 1 5 3 7 x6 5 5 5 6 5 5 5 6 5 5 5 5 5 5 60 Kapitel 6. Prüfen von Varianzen (Parametertests) Kapitel 7 Verteilungsfreie (parameterfreie) Tests Fast alle bisher betrachten statistischen Tests (Ein- und Zweistichproben-t-Test, χ2 -Varianztest, F -Test, Cochran-Test) beschäftigen sich mit der Prüfung von Parameterhypothesen, wobei die Gestalt der Verteilungsfunktion in der Grundgesamtheit bis auf einzelne Parameter als bekannt vorausgesetzt wird. Die Hypothesen beziehen sich auf diese unbekannten Parameter. Ein Vorteil der parameterfreien Verfahren liegt vor allem darin, dass für ihre Durchführung keine oder nur geringe Voraussetzungen über die Verteilungsfunktion oder ihren Typ in der Grundgesamtheit erfüllt sein müssen und sie daher zum Beispiel von der Annahme, dass die Grundgesamtheit normalverteilt ist, unabhängig sind. Allerdings wird dieser Vorteil häufig durch eine geringere Trennschärfe des nichtparametrischen Tests gegenüber dem entsprechenden Parametertest erkauft, wenn in Wirklichkeit Normalverteilung vorliegt. In der Regel ist ein vorhandener Unterschied bei Verwendung eines nichtparametrischen Tests etwas weniger oft signifikant als bei Benutzung des entsprechenden Parametertests. Wird jedoch bereits mit einem parameterfreien Test ein Unterschied als signifikant erkannt, d.h. die Nullhypothese abgelehnt, wenn sie falsch ist, so wird mit dem entsprechenden Parametertest kein anderes Ergebnis erreicht. Liegt dagegen keine Normalverteilung vor, so können parameterfreie Tests sogar erheblich wirksamer sein als Parametertests. Grundsätzlich führen diese Überlegungen zu folgenden Schlussfolgerungen: Sind die für einen Parametertest erforderlichen Voraussetzungen, wie zum Beispiel Normalverteilung der Grundgesamtheit oder Gleichheit ihrer Varianzen, erfüllt, so sollte der Parametertest als der wirksamere angewandt werden. In allen anderen Fällen ist ein entsprechendes nichtparametrisches Verfahren vorzuziehen. 7.1 Vorzeichentest nach Dixon und Mood Im folgenden Abschnitt wollen wir uns einem speziellen parameterfreien oder verteilungsfreien Test ausführlich widmen, dem Vorzeichentest oder Zeichentest. Beispiel 7.1.1. Wenn bei 10 Mitarbeitern einer Firma während einer Kündigungswelle bei allen plötzlich eine Erhöhung des Blutdruckes festgestellt wird, so sagen wir rein gefühlsmässig: Dies kann kein Zufall sein. Zur Begründung dieses sich spontan einstellenden Eindrucks 61 62 Kapitel 7. Verteilungsfreie (parameterfreie) Tests können wir folgendes anführen. Wären die beobachteten Änderungen des Blutdruckes rein zufällige Schwankungen, so müsste etwa die Hälfte der Differenzen positiv und die Hälfte negativ sein. Die Wahrscheinlichkeit wäre bei jedem einzelnen Mitarbeiter 0.5. Die Wahrscheinlichkeit, dass alle 10 Differenzen positiv ausfallen, wäre also P = ( 12 )10 ≈ 0.001. Mit so unwahrscheinlichen Ereignissen braucht aber nicht gerechnet zu werden, also ist anzunehmen, dass der gefunden Effekt (Existenzangst erhöht den Blutdruck) real ist. Der Vorzeichentest oder Zeichentest nach W. J. Dixon und A. M. Mood (1946), der auf den Vorzeichen der Differenzen von je zwei Messwerten beruht, ist eines der rechnerisch einfachsten nichtparametrischen Prüfverfahren. Er wird vor allem beim Vergleich zweier Produktionsverfahren oder Behandlungsmethoden, wo die Messwerte einander paarweise zugeordnet sind, also verbundene Stichproben vorliegen, angewendet und ist dem entsprechenden Parametertest, in diesem Falle dem paarweisen Vergleichstest bei verbundenen Stichproben (vgl. 5.4), dann vorzuziehen, wenn dessen Voraussetzungen, Normalverteilung der Grundgesamtheit nicht erfüllt ist. Da die Rechenarbeit beim Vorzeichentest gering ist, wird er auch als Schnelltest dazu verwendet, sich rasch einen Überblick über zwei Verfahren zu verschaffen. Beim Vorzeichentest sind folgende Voraussetzungen zu beachten: 1. Es sind zufällig zwei verbundene Stichproben x1 , . . . , xN und y1 , . . . , yN aus zwei Grundgesamtheiten gegeben, d.h., xi lässt sich mit yi vergleichen. 2. Die Verteilungsfunktionen der Grundgesamtheiten sind stetig. Wir wollen nun wissen, ob sich sich die verbundenen Messwerte xi und yi signifikant voneinander unterscheiden. Dazu berechnen wir aus den paarweise zusammengehörigen Messwerten die Differenzen di = xi − yi für alle i ∈ {1, . . . , N }. Wegen der Voraussetzung der Stetigkeit der Verteilungen verschwindet die Wahrscheinlichkeit für das Auftreten einer Differenz di = 0, d.h., es gilt P (di = 0) = 0. Ist gleichwohl eine Differenz gleich null, so sprechen wir von einer so genannten Bindung und das entsprechende Stichprobenpaar wird einfach weggelassen und der Stichprobenumfang entsprechend auf N ∗ reduziert. Die Hypothese, die wir prüfen wollen, besagt, dass für jedes i die beiden beobachteten xi und yi unabhängige zufällige Grössen sind. Unter dieser Hypothese ist die Wahrscheinlichkeit einer positiven Differenz di = xi − yi ebenso gross wie die für das Auftreten einer negativen, nämlich P (di > 0) = P (di < 0) = 12 . Es sei p = P (di > 0) die Wahrscheinlichkeit einer positiven Differenz. Die oben formulierte Hypothese lässt sich nun auf die alternativen Hypothesen (für die zweiseitige Fragestellung) umschreiben H0 : p = 12 , d.h., die Anzahl der negativen und positiven Differenzen ist gleich. H1 : p 6= 12 , d.h., die Anzahl der negativen und positiven Differenzen ist verschieden. Zur Prüfung der Hypothese H0 dient nun die Testgrösse k+ = Anzahl positiver Differenzen. Diese Testgrösse k+ ist die Realisierung einer Stichprobenfunktion, die unter der Nullhypothese der Binomialverteilung mit den Parametern n = N ∗ und p = 12 genügt, so dass gilt i n n i n 1 1 n−i n 1 n−i + P (k = i) = p (1 − p) = 1− = . i i 2 2 i 2 7.1. Vorzeichentest nach Dixon und Mood 63 Das q-Quantil des Vorzeichentests mit reduziertem Stichprobenumfang n wird mit kn,q bezeichnet und ist vertafelt (vgl. Tafel T.16). Es kann aus der Beziehung kn,q kn,q n X X n 1 P (k+ ≤ kn,q ) = P (k+ = i) = ≤q i 2 i=0 i=0 bestimmt werden. Es gilt kn,1−q = n − kn,q . Jetzt ziehen wir den statistischen Schluss bei einem gegebenen Signifikanzniveau α (hier für die zweiseitige Fragestellung): • Ist die Testgrösse kn, α2 < k+ < kn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., die xi -Werte unterscheiden sich nur zufällig von den yi -Werten. • Ist die Testgrösse k+ ≤ kn, α2 oder kn,1− α2 ≤ k+ , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die xi -Werte unterscheiden sich signifikant von den yi -Werten. Dieses Prüfverfahren heisst Vorzeichen- oder Zeichentest, da es lediglich mit den Vorzeichen der Differenzen arbeitet. Für grobe Überlegungen reichen bereits Stichproben mit 10 bis 15 k+ Messdaten. Liegt aber der Wert von N ∗ nahe bei 0.5, dann muss der Stichprobenumfang sehr gross gewählt werden, um eine signifikante Abweichung festzustellen. Beispiel 7.1.2. Bei einer Untersuchung wurden 51 Kartoffeln halbiert und jeweils bei beiden Hälften mit Hilfe zweier verschiedener Verfahren der Stärkegehalt gemessen. Vier Mal wurde mit beiden Verfahren der gleiche Wert gemessen. In 29 Fällen ergab das erste Verfahren gegenüber dem zweiten einen erhöhten Wert. Wir wollen nun mit dem Vorzeichentest testen, ob diese Abweichungen rein zufällig sind. Dazu wählen wir ein Signifikanzniveau von α = 0.05. Wir stellen vier Bindungen fest, also beträgt der reduzierte Stichprobenumfang N ∗ = 51 − 4 = 47. Es handelt sich um einen zweiseitigen Test. Aus Tafel T.16 lesen wir die beiden kritischen Werte k47,0.025 = 17 und k47,1−0.025 = 47 − 17 = 30 ab. Nun ziehen wir den statistischen Schluss: da k47,0.025 = 17 < 29 < k47,1−0.025 = 30 können wir die Nullhypothese nicht ablehnen. Die beiden Verfahren unterscheiden sich also nur zufällig. Aufgaben Aufgabe 7.1.1. Vergleichen Sie die drei folgenden Messreihen paarweise mit dem Vorzeichentest. Das Signifikanzniveau ist 1%. i 1 2 3 4 5 6 7 8 9 10 xi 18.0 14.5 13.5 12.5 23.0 24.0 21.0 17.0 18.5 9.5 yi 27.0 34.0 20.5 29.5 20.0 28.0 20.0 26.5 22.0 24.5 zi 21.5 20.5 19.0 24.5 16.0 13.0 20.0 16.5 17.5 19.0 64 Kapitel 7. Verteilungsfreie (parameterfreie) Tests Aufgabe 7.1.2. Vergleichen Sie die folgenden Messreihen mit dem Vorzeichentest. Das Signifikanzniveau ist 1%. i xi yi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 15 23 26 27 19 26 24 25 26 27 28 26 20 24 25 26 24 23 26 27 24 25 28 29 20 24 25 26 27 25 26 27 24 19 28 28 25 24 27 29 Aufgabe 7.1.3. Bei 200 Personen wurden die Reaktionszeiten auf zwei verschiedene Reizsignale gemessen. Dabei waren bei 120 Personen die Reaktionszeiten auf das erste Signal grösser. Testen Sie mit einem Signifikanzniveau α = 0.05 die Hypothese, dass die Reaktionszeit auf das erste Signal deutlich grösser ist. 7.2 Test auf Zufälligkeit – Runtest Wollen wir aus einer Stichprobe mit unseren bisher betrachteten Tests Rückschlüsse auf die Grundgesamtheit ziehen, so muss die Stichprobe zufällig sein, d.h., das Zahlenmaterial muss frei von einem Trend sein. Ein Trend kann zum Beispiel dann auftreten, wenn sich im Laufe der Erhebung die Voraussetzungen ändern. Andererseits könnten wir gerade am Vorhandensein eines solchen Trends interessiert sein (vgl. Beispiel 7.2.1). Zur Prüfung muss ein statistischer Test auf Zufälligkeit mit den Messdaten der Urliste vorgenommen werden. Beispiel 7.2.1 (Juni-Temperaturmonatsmittel in Basel). Wir betrachten die Monatsmittel der Temperatur im Juni seit 1864 gemessen in Basel (vgl. Abbildung 7.2.i). Das Monatsmit- Abbildung 7.2.i: Das Monatsmittel der Temperatur im Juni von 1864 bis 2003 gemessen in Basel. Quelle: Meteo Schweiz tel der Temperatur im Juni 2003 liegt weit über den bisherigen Erfahrungswerten seit dem offiziellen Messbeginn im Jahr 1864. In den Niederungen der Nordschweiz liegt es zwischen 6.5 und 7.5 Grad über dem normalen Wert. Die Juni-Wärme 2003 wird deshalb als die bisher extremste in die Annalen eingehen. Es stellt sich aber auch die Frage der so genannten Klimaerwärmung, bei welcher nicht Maximalwerte sondern der globale Trend interessiert. Ist also die Stichprobe der Junitemperaturen in Basel eine zufällige Grösse oder können wir einen Trend ausmachen? Für eine erste Einschätzung der Situation können wir einen so genannten Runtest verwenden. Um genauere Analysen zu machen, sollten wir eine Zeitreihenanalyse durchführen (vgl. Kapitel 13). Beim parameterfreien Runtest unterscheiden wir nur wie oft die gegebene Messreihe zwischen zwei Extremen hin- und herschwankt. Handelt es sich bei der Messreihe um Zahlen- 7.2. Test auf Zufälligkeit – Runtest 65 werte x1 , . . . , xN aus einer stetigen Grundgesamtheit, dann definieren wir als Mass für die Zufälligkeit so genannte Iterationen oder Runs. Ein zentrales Konzept zur Durchführung des Runtests ist der Median einer Stichprobe. Dazu ordnen wir die Stichprobenwerte der aufsteigenden Grösse nach x(1) ≤ · · · ≤ x(i) ≤ · · · ≤ x(N ) . Dann ist der Median oder Zentralwert der Stichprobe durch x N+1 wenn N ungerade ( ) x e= 12 x N +x N wenn N gerade 2 ( +1) ( ) 2 2 gegeben. Es handelt sich dabei um den “mittelsten“ Zahlenwert der geordneten Stichprobe. Beispiel 7.2.2. Es sei die folgende Stichprobe gegeben. 5.3 3.8 4.0 5.5 5.0 4.9 2.2 4.1 3.1 5.5 Wir bilden den Median indem wir die Stichprobe der Grösse nach ordnen 2.2 3.1 3.8 4.0 4.1 4.9 5.0 5.3 5.5 und x(5) = 4.1 und x(6) = 4.9 ablesen. Dann ist der Median x e= 1 2 5.5 (4.1 + 4.9) = 4.5. Nun sind wir in der Lage, Iterationen oder Runs zu definieren. Dazu zeichnen wir die Stichprobenwerte x1 , . . . , xN der Reihe nach auf und ziehen eine horizontale Gerade M auf der Höhe des Medians, die so genannte Medianlinie. Diese teilt die Stichprobenwerte in zwei Hälften1 . Unter jedem Wert schreiben wir ein Plus- bzw. Minuszeichen je nachdem, ob er oberhalb oder unterhalb der Medianlinie liegt (vgl. Abbildung 7.2.ii). xi 6 4 b b b b 5 b b M b b b 3 b 2 + − − + + + − − − + 1 2 3 4 5 6 7 8 9 10 1 i Abbildung 7.2.ii: Eine Stichprobe (vgl. Beispiel 7.2.2) mit r = 5 Iterationen und m = 5 Pluszeichen. Definition 7.2.1. Eine Iteration oder Run ist eine Folge von gleichen Vorzeichen. Die Anzahl Iterationen bezeichnen wir mit r und die Anzahl Pluszeichen mit m. 1 Falls zu viele Stichprobenwerte auf der Medianlinie liegen, ist der in diesem Kapitel beschriebenen Runtest nicht geeignet. Der “erweiterte Runtest“ in [13] hilft weiter. 66 Kapitel 7. Verteilungsfreie (parameterfreie) Tests Die Anzahl Iterationen verglichen mit dem Stichprobenumfang ist ein Kriterium für die Zufälligkeit der Messwertanordnung einer Stichprobe. Wir können drei Fälle unterscheiden: 1. Trend: Verglichen mit dem Stichprobenumfang weist die Strichprobe nur wenige Iterationen auf (vgl. Abbildung 7.2.iii). 2. Schwingung: Verglichen mit dem Stichprobenumfang weist die Strichprobe sehr viele Iterationen auf. Der schwingungsförmige Verlauf der Messwerte lässt auf systematische Schwankungen schliessen (vgl. Abbildung 7.2.iv). 3. Zufallsanordnung: Verglichen mit dem Stichprobenumfang weist die Strichprobe eine mittlere Anzahl Iterationen auf (vgl. Abbildung 7.2.v). xi xi b b b b b b b b b b b b b b b b b b b b b b b b b b M b b b M b b b i i Abbildung 7.2.iv: m = 8 Pluszeichen und r = 16 Iterationen impliziert eine Schwingung. Abbildung 7.2.iii: m = 8 Pluszeichen und r = 2 Iterationen impliziert einen Trend. xi b b b b b b b b M b b b b b b b b i Abbildung 7.2.v: m = 8 Pluszeichen und r = 9 Iterationen impliziert eine Zufallsanordnung. Zur quantitativen Beurteilung, ob die Stichprobenwerte zufällig angeordnet sind, wird nun der so genannte Runtest von W. A. Wallis und P. G. Moore durchgeführt. Dazu formulieren wir folgende alternativen Hypothesen: H0 : Die Messwerte sind zufällig verteilt. H1 : Die Messwerte sind nicht zufällig verteilt. Im Falle einer stetigen Verteilung hat die Testgrösse r = Anzahl der Iterationen (7.2.a) 7.2. Test auf Zufälligkeit – Runtest 67 bei Zutreffen der Nullhypothese H0 die folgende Verteilungsfunktion m−1 m−1 2 (r−1)/2 (r−3)/2 wenn r ungerade 2m m f (r) = m−1 2 2 (r−2)/2 wenn r gerade. 2m m Das q-Quantil des Runtests mit m Pluszeichen wird mit rm,q bezeichnet und ist vertafelt (vgl. Tafel T.17). Es kann aus der Beziehung rm,q P (r ≤ rm,q ) = X r=2 f (r) ≤ q bestimmt werden. Jetzt ziehen wir den statistischen Schluss bei einem gegebenen Signifikanzniveau α: • Ist die Testgrösse rm, α2 < r < rm,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., die Messwerte sind zufällig verteilt. • Ist die Testgrösse r ≤ rm, α2 (resp. rm,1− α2 ≤ r), dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. In diesem Fall haben wir einen signifikanten Trend (resp. eine signifikante Schwingung). Aufgabe Aufgabe 7.2.1. Bei einer Messreihe wurden die folgenden Werte ermittelt: 2 4 3 5 2 4 2 6 1 3 2 4 4 4 6 6 5 4 2 3 2 2 Testen Sie mit einem Runtest, ob es sich dabei um eine zufällige Stichprobe handelt. Das Signifikanzniveau ist 10%. 68 Kapitel 7. Verteilungsfreie (parameterfreie) Tests Kapitel 8 Prüfen der Verteilung der Grundgesamtheit Bei einem Test auf Prüfung einer speziellen Verteilung der Grundgesamtheit wollen wir herausfinden, ob die Messdaten der Urliste unseren Vorstellungen über die Verteilung der Grundgesamtheit entsprechen. Bei den meisten bisher betrachteten statistischen Tests wurde vorausgesetzt, dass das gemessene Merkmal in der Grundgesamtheit normalverteilt ist. Diese Voraussetzung erscheint gerechtfertigt, solange wir es mit der Untersuchung von Beobachtungs- und Messfehlern zu tun haben, die aus einer Anzahl sich additiv überlagernder Ursachen entstehen, wobei jede dieser Ursachen nur einen geringen Einfluss im Vergleich zur Gesamtwirkung auf das Messergebnis hat (vgl. die Ausführungen in Kapitel 2.2). In der Praxis gibt es jedoch zahlreiche Beispiele, auf die diese Bedingungen nicht zutreffen, so dass Verfahren gefordert werden, die darüber entscheiden, ob es sich bei einer vorliegenden Messreihe um eine Stichprobe aus einer normalverteilten Grundgesamtheit handelt oder nicht. Im Folgenden werden wir vier der gebräuchlichsten Verfahren zur Prüfung auf Normalverteilung vorstellen. In Kapitel 8.1 lernen wir ein rein qualitatives Verfahren kennen. Die Kapitel 8.2, 8.3 und 8.4 behandeln quantitative Verfahren, die die Abweichung von der Normalverteilung auf Signifikanz untersuchen. 8.1 Wahrscheinlichkeitspapier für die Normalverteilung Das erste Verfahren ist ein rein grafisches mit Hilfe eines speziellen Wahrscheinlichkeitspapieres (vgl. Abbildung 8.1.iv), das von A. Hazen (1914) entwickelt wurde. Es ist ein rein qualitatives Verfahren. In einem kartesischen Koordinatensystem mit jeweils gleichmässiger Skalierung auf der x- und y-Achse stellt die Verteilungsfunktion Z x (x−µ)2 1 2 e− 2σ2 dx. Φ(x, µ, σ ) = √ 2πσ 2 −∞ einer normalverteilten Zufallsvariable eine S-förmige Kurve dar (vgl. Abbildung 8.1.i. Zum besseren und einfacheren Zeichnen dieser Kurve wählen wir im so genannten Wahrscheinlichkeitspapier die Ordinateneinteilung so, dass die Kurve der standardisierten Normalverteilungsfunktion y = Φ(x, 0, 1) dort als Gerade erscheint. Dazu transformieren wir die y-Achse in der Form z = Φ−1 (y, 0, 1). Die Einteilung auf der Ordinatenachse des Wahrscheinlichkeitspapier ist dann nicht mehr äquidistant. Dort werden auch nicht die Funktionswerte selbst, 69 70 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit sondern ihre Werte in Prozenten eingetragen. Die Ordinatenabstände nehmen von der 50%Linie jeweils nach oben und unten hin zu. Die 0%- und die 100%-Linien können nicht mehr dargestellt werden, da sie wegen Φ(−∞, 0, 1) = 0 und Φ(+∞, 0, 1) = 1 die Ordinatenwerte −∞ und +∞ besitzen würden. y y = Φ(x, 0, 1) 100% 90% 70% 50% 30% 10% 0% x 1 −1 z 98% 90% 84.13% 70% 50%−4 −3 −2 −1 0 1 2 3 4 x 30% 15.87% 10% 2% Abbildung 8.1.i: Konstruktion des Wahrscheinlichkeitspapiers. Dann ergibt sich im xz-Koordinatensystem für den Grafen der Verteilungsfunktion y = Φ(x, µ, σ 2 ) der Normalverteilung mit den Parametern µ und σ 2 die Gerade x−µ , z = Φ−1 (y, 0, 1) = Φ−1 Φ(x, µ, σ 2 ), 0, 1 = σ mit der Steigung σ1 . Diese Gerade schneidet die 50%-Linie an der Stelle x = µ. Für x = µ + σ gilt Φ x−µ σ , 0, 1 = Φ(1, 0, 1) = 0.8413. 8.1. Wahrscheinlichkeitspapier für die Normalverteilung 71 Das heisst, über dem Abszissenwert x = µ + σ schneidet die Gerade die 84.13%-Linie und wegen der Symmetrie über x = µ − σ die 15.87%-Linie. Daher können wir aus der Gerade im Wahrscheinlichkeitspapier die Parameter µ und σ heraus lesen. Ist nun eine Stichprobe aus einer Grundgesamtheit gegeben, von der wir wissen wollen, ob sie normalverteilt ist, so zeichnen wir zur Prüfung auf Normalverteilung die empirische Verteilungsfunktion der Stichprobe als Punkte ins Wahrscheinlichkeitspapier. Lässt sich nun durch die Funktionswerte der empirischen Verteilungsfunktion eine Gerade legen, die sich dieser Punkte gut anpasst, so entscheiden wir uns für eine Normalverteilung. Die Beurteilung der Geradlinigkeit sollte etwa zwischen den Ordinaten 10% und 90% erfolgen, da für kleinere resp. grössere Ordinaten das Wahrscheinlichkeitspapier stark verzerrt ist, so dass geringe Abweichungen stark bemerkbar sind. Falls wir uns für eine Normalverteilung entschieden haben, lassen sich aus dieser angepassten Gerade Näherungswerte für µ und σ gewinnen. Beachten Sie, dass dieses Verfahren nur ein grobes Näherungsverfahren ist, da wir im Allgemeinen näherungsweise mehrere Geraden durch die Punkte legen können. Ferner müssen wir nach Augenmass entscheiden, ob die Approximation tatsächlich gut ist. Für präzise Aussagen sollte auf jeden Fall ein weiterer Test angewandt werden. Beispiel 8.1.1. Wir betrachten die in k = 9 Klassen eingeteilte Stichprobe vom Umfang N = 50 Anzahl pro Klasse Klassenmitten 1 2 hi xi 1 4 7 6 9 8 14 10 9 12 6 14 2 16 1 18 Eine erste einfache Einschätzung der Situation ergibt sich, wenn wir ein Histogramm der Daten anfertigen (vgl. Abbildung 8.1.ii). Wir stellen bereits am Histogramm eine zur Norhi si 50 50 40 40 30 30 20 20 82% 41 7 1 1 2 4 9 9 36% 18 10 6 2 1 16 18 0 0 6 8 10 12 14 98% 100% 50 49 64% 32 14 10 94% 47 2% 1 4% 2 2 4 18% 9 0 xi 0 Abbildung 8.1.ii: Ein Histogramm der Stichprobe 6 8 10 12 14 16 18 xi Abbildung 8.1.iii: Absolute und relative Summenhäufigkeit malverteilung ähnliche Form fest. Die Prüfung auf Normalverteilung mit Hilfe eines Wahrscheinlichkeitspapieres benötigt die absolute Summenhäufigkeit der in Klassen eingeteilten Stichprobe und relative Summenhäufigkeit in Prozent (vgl. Abbildung 8.1.iii) si = i X j=1 Wir erhalten hj und ri = si · 100%. N 72 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit relative Summenhäufigkeit absolute Summenhäufigkeit Klassenmitten ri si xi 2% 1 2 4% 2 4 18% 9 6 36% 18 8 64% 32 10 82% 41 12 96% 47 14 98% 49 16 100% 50 18 Unter Zugrundelegung obiger Häufigkeitstabelle werden nun die relativen Summenhäufigkeiten als Ordinaten zu den entsprechenden oberen Klassengrenzen 3, 5, 7, . . . in das Wahrscheinlichkeitspapier 8.1.iv eingetragen. Durch diese Punkte können wir nun näherungsweise eine Gerade legen. Weil alle Punkte zwischen den Ordinaten 10% und 90% sehr nahe der Geraden liegen, können wir davon ausgehen, dass es sich bei der Stichprobe um eine aus einer normalverteilten Grundgesamtheit handelt. Diese grafische Methode zur Beurteilung der Geradlinigkeit und damit der Normalität der Grundgesamtheit ist natürlich sehr subjektiv und lässt nur eine grobe Entscheidung zu. Sie hängt nur vom Stichprobenumfang ab und wird umso ungenauer, je weniger Klassen gebildet werden. 99 95 90 80 70 60 50 40 30 20 10 5 1 Abbildung 8.1.iv: Wahrscheinlichkeitspapier Daneben bietet sich nun die Möglichkeit, den Mittelwert µ und die Standardabweichung σ aus der Zeichnung zu schätzen. Zu diesem Zweck bringen wir die durch die Punkte gezeichnete Gerade mit der Horizontalen durch den Ordinatenpunkt 50% zum Schnitt. Die Abszisse des Schnittpunktes ist ein Näherungswert µabgelesen für den Mittelwert µ. Entsprechend ergibt sich aus den Schnittpunkten der eingezeichneten Gerade mit den Horizontalen durch die Ordinatenpunkte 15.87% und 84.13% (gestrichelte Linien im Wahrscheinlichkeitspapier 8.1.iv) ein Näherungswert σabgelesen für die Standardabweichung σ. Wir erhalten µabgelesen ≈ 10.0 und σabgelesen ≈ 3.2. 8.1. Wahrscheinlichkeitspapier für die Normalverteilung 73 Wir wollen diese geschätzten Werte mit den berechneten vergleichen. Der Mittelwert und die Varianz einer Stichprobe, die in k Klassen eingeteilt ist, berechnen sich mit den Formeln k 1 X x̄ = hi xi N k 1 X s = hi (xi − x̄)2 , N −1 2 und i=1 i=1 wobei hi die Anzahl Messwerte in der i-ten Klasse mit Klassenmitte xi bezeichnet. Es gilt P natürlich N = ki=1 hi . Wir erhalten x̄ = 10.04 und s = 3.24. Dies zeigt, dass die Genauigkeit der aus dem Wahrscheinlichkeitspapier abgelesenen Werte für praktische Zwecke ausreichend sein kann. Allerdings sei hier darauf hingewiesen, dass dieses grafische Schätzverfahren nur dann gut funktioniert, wenn sich eine Gerade einigermassen gut an die Punkte anpassen lässt. Aufgaben Aufgabe 8.1.1. Prüfen Sie mit Hilfe eines Wahrscheinlichkeitspapiers, ob die folgende Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Bestimmen Sie ferner Näherungswerte für µ und σ. xi 0 1 2 3 4 5 6 7 8 9 10 hi 2 4 14 22 18 40 36 24 20 14 6 N = 200 prozentuale Häufigkeit 1 2 7 11 9 20 18 12 10 7 3 prozentuale Summenhäufigkeit 1 3 10 21 30 50 68 80 90 97 100 Aufgabe 8.1.2. Bei der Bestimmung des Blutzuckergehalts [in mg %] an 25 Patienten ergaben sich folgende Messwerte: 79 107 88 92 110 77 122 100 84 113 94 102 116 104 95 88 109 99 108 86 98 84 82 105 101 Prüfen Sie mit Hilfe eines Wahrscheinlichkeitspapiers, ob die Grundgesamtheit normalverteilt ist. Bestimmen Sie ferner Näherungswerte für µ und σ und vergleichen Sie diese mit den berechneten Werten. Aufgabe 8.1.3. Prüfen Sie mit Hilfe eines Wahrscheinlichkeitspapiers, ob die folgende Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Bestimmen Sie ferner Näherungswerte für µ und σ und vergleichen Sie diese mit den berechneten Werten. Absolute Häufigkeiten Klassenmitten hi xi 1 26 4 29 13 32 23 35 22 38 29 41 29 44 16 47 11 50 2 53 74 8.2 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit Test auf Schiefe und Exzess – Momentenmethode Ein weiterer Test zur Prüfung einer Verteilung auf Normalität ist der Test auf Schiefe und Exzess oder die Momentenmethode. Bei diesem Test wird die Form des Histogramms mit der Form einer Normalverteilung mit den aus der Stichprobe geschätzten Parameter verglichen. Dabei interessiert uns, ob das Histogramm links- oder rechtsschief, und über- oder unterhöht ist. überhöht γ2 > 0 linksschief normal rechtsschief γ1 > 0 γ1 = 0 γ1 < 0 normal γ2 = 0 unterhöht γ2 < 0 Abbildung 8.2.i: Schiefe Abbildung 8.2.ii: Exzess Es sei eine Stichprobe x1 , . . . , xN vom Umfang N gegeben. Wir fragen uns, ob diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Dazu berechnen wir den geschätzten Mittelwert N 1 X xi x̄ = N i=1 und daraus für j ∈ N die geschätzten zentralen Momente1 mj = N 1 X (xi − x̄)j . N i=1 Das erste Moment m1 verschwindet nach Definition des Mittelwertes. Aus m2 , m3 und m4 berechnen wir nun die Schiefe2 und den Exzess3 m3 m4 g1 = p 3 und g2 = 2 − 3. m2 m2 Für grossen Stichprobenumfang N sind alle Momente mj sowie g1 und g2 asymptotisch normalverteilt. Wir können g1 und g2 als Schätzung für die Schiefe γ1 und den Exzess γ2 der wahren Verteilung verwenden. Für die Normalverteilung sind die Schiefe, welche die Symmetrie einer Verteilung misst, und der Exzess, welche die Über- resp. Unterhöhung der Verteilung misst, beide gleich null. Also formulieren wir die alternativen Hypothesen für den Test auf Schiefe HSchiefe,0 : γ1 = 0, d.h., die Verteilung ist symmetrisch. HSchiefe,1 : γ1 6= 0, d.h., die Verteilung ist schief. 1 Bei einer Klasseneinteilungen in der i-ten Klasse mit Klassenmitte Pk in k Klassen mit hi1 Messwerten PN Pk xi sind j die gewogenen Formeln x̄ = N1 i=1 hi xi und mj = N i=1 hi (xi − x̄) zu benutzen. Es gilt N = i=1 hi . 2 engl. Skewness m4 3 Die Grösse m 2 wird Kurtosis oder Wölbung genannt. 2 8.2. Test auf Schiefe und Exzess – Momentenmethode 75 und für den Test auf Exzess HExzess,0 : γ2 = 0, d.h., die Verteilung ist nicht über- oder unterhöht. HExzess,1 : γ2 6= 0, d.h., die Verteilung ist über- oder unterhöht. Zur Durchführung des Tests auf Schiefe und Exzess berechnen wir die beiden Testgrössen: p N (N − 1 g1 6N (N − 1) G1 = mit s2g1 = N − 2 sg1 (N − 2)(N + 1)(N + 3) (N − 1)(N + 1) g2 24N (N − 1)2 G2 = mit s2g2 = (N − 2)(N − 3) sg2 (N − 3)(N − 2)(N + 3)(N + 5) Die Testgrössen G1 und G2 sind asymptotisch N (0, 1)-verteilt. Das q-Quantil zq der Standardnormalverteilung lesen wir in Tafel T.2 ab. Der statistische Schluss bei einem gegebenen Signifikanzniveau α für den Test auf Schiefe lautet: • Ist die Testgrösse −z α2 < G1 < z α2 , dann wird die Nullhypothese H0 angenommen, d.h., die Verteilung ist symmetrisch. • Ist die Testgrösse G1 ≤ −z α2 (resp. z α2 ≤ G1 ), dann wird die Nullhypothese HSchiefe,0 auf dem Signifikanzniveau α abgelehnt. Die Verteilung ist linksschief (resp. rechtsschief). Der statistische Schluss bei einem gegebenen Signifikanzniveau α für den Test auf Exzess lautet: • Ist die Testgrösse −z α2 < G2 < z α2 , dann wird die Nullhypothese H0 angenommen, d.h., die Verteilung ist weder über- noch unterhöht. • Ist die Testgrösse G2 ≤ −z α2 (resp. z α2 ≤ G2 ), dann wird die Nullhypothese HExzess,0 auf dem Signifikanzniveau α abgelehnt. Die Verteilung ist unterhöht (resp. überhöht). Erst wenn wir beide Nullhypothesen HSchiefe,0 und HExzess,0 annehmen, können wir davon ausgehen, dass es sich bei der gegebenen Stichprobe aus Messwerten aus einer normalverteilten Grundgesamtheit handelt. Beispiel 8.2.1. Wir untersuchen die in k = 12 Klassen eingeteilte Stichprobe, ob sie einer normalverteilten Grundgesamtheit entstammt. Absolute Häufigkeiten Klassenmitten hi xi 1 -5 1 -4 4 -3 9 -2 14 -1 20 0 17 1 15 2 10 3 5 4 3 5 1 6 Dazu verwenden wir den Test auf Schief und Exzess. Zuerst berechnen wir den geschätzten Mittelwert und die geschätzten zentralen Momente x̄ = 0.650, m2 = 4.428, m3 = 0.442, m4 = 56.259. Daraus berechnen wir die geschätzte Schiefe g1 = 0.047 und den Exzess g2 = −0.130 der Stichprobe. Indem wir Schiefe und Exzess normieren, erhalten wir die beiden Testgrössen G1 = 0.199 und G2 = −0.286. Wir bestimmen aus Tafel T.2 oder mit Hilfe eines Computerprogrammes die kritischen Werte (zweiseitig) z1−0.025 = 1.960 und z0.025 = −1.960 zum Signifikanzniveau α = 0.05. Nun führen wir den statistischen Schluss für den Test auf Schiefe und danach für den Test auf Exzess durch: 76 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit a. Es gilt z0.025 = −1.960 < G1 = 0.199 < z1−0.025 = 1.960, also wird die Nullhypothese HSchiefe,0 angenommen, d.h., die Verteilung ist symmetrisch. b. Es gilt z0.025 = −1.960 < G2 = −0.286 < z1−0.025 = 1.960, also wird die Nullhypothese HExzess,0 angenommen, d.h., die Verteilung ist weder über- noch unterhöht. Damit haben wir beide Nullhypothesen angenommen, und wir können davon ausgehen, dass die Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Aufgaben Aufgabe 8.2.1. Prüfen Sie mit dem Test auf Schiefe und Exzess die folgende Stichprobe auf Normalverteilung und erzeugen Sie ein Histogramm. Das Signifikanzniveau sei α = 5%. Absolute Häufigkeiten Klassenmitten 1 -1 hi xi 8 0 1 1 Aufgabe 8.2.2. Prüfen Sie mit dem Test auf Schiefe und Exzess die folgende Stichprobe auf Normalverteilung und erzeugen Sie ein Histogramm. Das Signifikanzniveau sei α = 10%. Absolute Häufigkeiten Klassenmitten Absolute Häufigkeiten Klassenmitten hi xi hi xi 6 0.0 31 2.2 8 0.2 27 2.4 9 0.4 23 2.6 11 0.6 19 2.8 13 0.8 16 3.0 16 1.0 13 3.2 19 1.2 11 3.4 23 1.4 9 3.6 27 1.6 8 3.8 31 1.8 6 4.0 32 2.0 Aufgabe 8.2.3. Prüfen Sie mit dem Test auf Schiefe und Exzess die folgende Stichprobe auf Normalverteilung und erzeugen Sie ein Histogramm. Das Signifikanzniveau sei α = 5%. Absolute Häufigkeiten Klassenmitten hi xi 1 78 1 83 4 88 9 93 14 98 20 103 17 108 15 113 10 118 5 123 3 128 1 133 Aufgabe 8.2.4. Die Angaben eines Maschinenlieferanten zur Genauigkeit seiner Maschinen sollen überprüft werden. Eine Stichprobe von Werkstücken aus einer normalen Produktion, die vom Lieferanten zur Verfügung gestellt wurde, ergab die unten stehenden Abweichungen der Masse vom Sollwert. Ist dieser Lieferant ehrlich? Erzeugen Sie ein Histogramm der Stichprobe. Das Signifikanzniveau ist 5%. Absolute Häufigkeiten Klassenmitten hi xi 9 -5 9 -4 10 -3 12 -2 15 -1 18 0 20 1 16 2 14 3 13 4 12 5 11 6 Aufgabe 8.2.5. Verändern Sie Anzahlen hi der Stichprobe aus Aufgabe 8.2.4 möglichst geringfügig so, dass sowohl signifikante Asymmetrie als auch signifikante Überhöhung beim Test auf Schiefe und Exzess angezeigt werden. Das Signifikanzniveau sei konstant gleich 5% zu belassen. 8.3 χ2 -Anpassungstest Eine rechnerische Methode zur Beurteilung, ob eine vorgegebene Stichprobe mit Stichprobenumfang grösser als etwa 50 aus einer normalverteilten Grundgesamtheit stammt, ist der χ2 -Anpassungstest, der von K. Pearson (vgl. Abbildung 1.1.i) entwickelt wurde. Dieses statistische Testverfahren vergleicht das Histogramm der Stichprobe, mit der angenommenen theoretischen Normalverteilung der dazugehörigen Grundgesamtheit. 8.3. χ2 -Anpassungstest 77 Dazu stellen wir über die unbekannte Verteilungsfunktion F der Grundgesamtheit die alternativen Hypothesen auf: H0 : F (x) = Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ und σ 2 . H1 : F (x) 6= Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer anderen Grundgesamtheit. Da sich die Nullhypothese auf die gesamte Verteilungsfunktion F und nicht nur auf einzelne ihrer Parameter bezieht, liegt eine nichtparametrische Hypothese vor. Der dazugehörige Test wird als Anpassungstest4 bezeichnet. Zur Konstruktion einer passenden Testgrösse für die Prüfung von H0 teilen wir die Stichprobe x1 , . . . , xN in k sich nicht überschneidende Klassen ein. Dann zählen wir aus, wie viele Werte hi (absolute Klassenhäufigkeit) in die i-te Klasse fallen. Als Mass für die Abweichung zwischen der empirischen Verteilung der Stichprobe und der durch die Nullhypothese festgelegten theoretischen Normalverteilung dienen die Differenzen zwischen den beobachteten Häufigkeiten hi und den entsprechenden theoretischen Häufigkeiten derselben Klasse, mit h∗i bezeichnet (vgl. Abbildung 8.3.i). y = ϕ(x, µ, σ 2 ) hi h∗i xi,u xi,o x µ Abbildung 8.3.i: Beim χ2 -Anpassungstest werden die theoretischen Häufigkeiten h∗i mit den absoluten Häufigkeiten hi in der i-ten Klasse verglichen. Da im Allgemeinen weder der Erwartungswert µ noch die Varianz σ 2 der Normalverteilung zahlenmässig festgelegt sind, müssen diese im Voraus aus der Stichprobe geschätzt werden5 N 1 X µ ≈ x̄ = xi N i=1 N und 1 X σ ≈s = (xi − x̄)2 . N −1 2 2 i=1 Danach berechnen wir die theoretischen Wahrscheinlichkeiten pi = Φ(xi,o , µ, σ 2 ) − Φ(xi,u , µ, σ 2 ) ≈ Φ(xi,o , x̄, s2 ) − Φ(xi,u , x̄, s2 ), 4 Die unbekannte Verteilungsfunktion F der Grundgesamtheit wird durch eine theoretische Normalverteilung angepasst. 5 Bei einer Klasseneinteilungen hi Messwerten in der i-ten Klasse mit Klassenmitte Pk in k Klassen mit PN Pkxi sind 2 2 1 die gewogenen Formeln x̄ = N1 h x und s = h (x − x̄) zu benutzen. Es gilt N = i i i i i=1 i=1 i=1 hi . N−1 78 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit die den Flächenanteil unter der durch H0 festgelegten Gaussschen Glockenkurve zwischen der oberen xi,o und der unteren xi,u Klassengrenze der i-ten Klasse angibt. Die Berechnung der theoretischen Häufigkeiten erfolgt durch h∗i = N pi . Dann bilden wir die Testgrösse X2 = k X (hi − h∗ )2 i i=1 h∗i . (8.3.a) Diese Testgrösse ist approximativ χ2 -verteilt mit n = k − 1 − r Freiheitsgraden, wobei r gleich der Anzahl unbekannter6 Parameter der Verteilung ist, also r = 2 für µ und σ 2 . Damit die Testgrösse näherungsweise eine χ2 -Verteilung besitzt müssen die folgenden Voraussetzungen erfüllt sein: • Der Stichprobenumfang N ist grösser als etwa 50. • Für alle Klassen sollten die theoretischen Häufigkeiten h∗i ≥ 5 sein. Ist für einige Klassen diese Forderung verletzt, müssen benachbarte Klassen zusammengefasst werden. Das Testverfahren für die Nullhypothese, kann dann folgendermassen formuliert werden: Nach Wahl eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.5 oder einem Computerprogramm den kritischen Wert χ2n,1−α aus der approximativen Beziehung P X 2 ≥ χ2n,1−α ≈ α. Jetzt ziehen wir den statistischen Schluss: • Ist die Testgrösse X 2 < χ2n,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ und σ 2 . • Ist die Testgrösse χ2n,1−α ≤ X 2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit. Der χ2 -Anpassungstest findet nicht nur im Zusammenhang mit der Prüfung der Grundgesamtheit auf Normalverteilung Verwendung, sondern er kann allgemeiner dazu bunutzt werden um zu beurteilen, ob eine gegebene Stichprobe aus einer Grundgesamtheit stammt, von der wir eine bestimmte, zu testende Idee über die Verteilung haben (vgl. zum Beispiel [2]). Beispiel 8.3.1 (Prüfung auf Normalverteilung mit dem χ2 -Anpassungstest). Es soll geprüft werden, ob die folgende Stichprobe vom Umfang N = 140 aus einer normalverteilten Grundgesamtheit stammt. Die Nullhypothese lautet also H0 : F (x) = Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ und σ 2 . Das Signifikanzniveau ist α = 0.05. Um diese Frage zu beantworten, berechnen wir zuerst den geschätzten Mittelwert x̄ = 94.991 und die geschätzte Standardabweichung s = 0.213. Wir beachten, dass die Klassenbreiten konstant gleich 0.1 sind. Dann erstellen wir die folgende Tabelle: 6 Falls der eine oder andere Parameter µ und σ 2 der Normalverteilung der Grundgesamtheit bekannt sein sollte, dann ist r entsprechend anzupassen. 8.3. χ2 -Anpassungstest i 1 2 3 4 5 6 7 8 9 10 11 hi 4 5 10 15 23 27 23 19 9 3 2 xi 94.5 94.6 94.7 94.8 94.9 95.0 95.1 95.2 95.3 95.4 95.5 xi,u 94.45 94.55 94.65 94.75 94.85 94.95 95.05 95.15 95.25 95.35 95.45 79 xi,o 94.55 94.65 94.75 94.85 94.95 95.05 95.15 95.25 95.35 95.45 95.55 Φ(xi,u , x̄, s2 ) 0.006 0.019 0.055 0.129 0.254 0.424 0.610 0.773 0.888 0.954 0.985 Φ(xi,o , x̄, s2 ) 0.019 0.055 0.129 0.254 0.424 0.610 0.773 0.888 0.954 0.985 0.996 pi 0.014 0.036 0.074 0.125 0.170 0.186 0.163 0.116 0.066 0.030 0.011 h∗i 1.91 4.97 10.41 17.53 23.78 25.98 22.84 16.18 9.22 4.23 1.56 2 hi −h∗ i) h∗ i 2.276 0.000 0.016 0.366 0.026 0.040 0.001 0.493 0.005 0.359 0.121 Wir stellen fest, dass einige Randklassen weniger als 5 Elemente aufweisen und somit die Voraussetzung zur Durchführung des χ2 -Anpassungstest nicht erfüllt ist. Dies veranlasst uns, je die beiden Randklassen zusammenzufassen. Dabei reichen die Klassenbreiten der neuen Randklassen bis nach −∞ resp. +∞. Wir erhalten die nachfolgende, modifizierte Tabelle. i 1 2 3 4 5 6 7 8 9 hi 9 10 15 23 27 23 19 9 5 xi 94.55 94.7 94.8 94.9 95.0 95.1 95.2 95.3 95.45 xi,u −∞ 94.65 94.75 94.85 94.95 95.05 95.15 95.25 95.35 xi,o 94.65 94.75 94.85 94.95 95.05 95.15 95.25 95.35 +∞ Φ(xi,u , x̄, s2 ) 0 0.055 0.129 0.254 0.424 0.610 0.773 0.888 0.954 Φ(xi,o , x̄, s2 ) 0.055 0.129 0.254 0.424 0.610 0.773 0.888 0.954 1 pi 0.055 0.074 0.125 0.170 0.186 0.163 0.116 0.066 0.046 h∗i 7.66 10.41 17.53 23.78 25.98 22.84 16.18 9.22 6.40 2 hi −h∗ i) h∗ i 0.234 0.016 0.366 0.026 0.040 0.001 0.493 0.005 0.306 Nun sind wir in der Lage die Testgrösse X 2 = 1.487 zu berechnen. Den kritischen Wert χ26,0.95 = 12.592 der χ2 -Verteilung mit n = 9 − 3 = 6 Freiheitsgraden bestimmen wir mit Tafel T.5 oder einem Computerprogramm. Da X 2 = 1.487 < χ26,0.95 = 12.592 gilt, kann die Nullhypothese angenommen werden. Die Stichprobe stammt somit mit einer Irrtumswahrscheinlichkeit von 5% aus einer normalverteilten Grundgesamtheit mit den geschätzten Parametern µ ≈ x̄ = 94.991 und σ 2 ≈ s2 = 0.045. Aufgaben Aufgabe 8.3.1. Prüfen Sie mit dem χ2 -Anpassungstest die folgende Stichprobe vom Umfang N = 366 auf Normalverteilung. Das Signifikanzniveau sei α = 10%. hi xi 8 9 10 11 13 16 19 23 27 31 32 31 27 23 19 16 13 11 10 9 8 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0 Aufgabe 8.3.2. Prüfen Sie mit dem χ2 -Anpassungstest die folgende Stichprobe vom Umfang N = 150 auf Normalverteilung. Das Signifikanzniveau sei α = 5%. hi xi 1 26 4 29 13 32 23 35 22 38 29 41 29 44 16 47 11 50 2 53 80 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit 8.4 Lilliefors-Test auf Normalverteilung Eine weitere rechnerische Methode zur Beurteilung, ob eine vorgegebene Stichprobe aus einer normalverteilten Grundgesamtheit stammt, ist der Kolmogoroff-Smirnov-Test, der von A. N. Kolmogoroff (vgl. Abbildung 1.1.iv) und N. V. Smirnov (1933) entwickelt wurde. Bei diesem Test müssen allerdings alle Parameter der Verteilungsfunktion der Grundgesamtheit bekannt sein. Da dies bei praktischen Anwendungen meistens nicht der Fall ist, hat H. W. Lilliefors (1967) den Test verfeinert. Der Lilliefors-Test auf Normalverteilung vergleicht die empirische Summenfunktion der Stichprobe, mit der Verteilungsfunktion Φ(x, µ, σ 2 ) der angenommenen Normalverteilung der dazugehörigen Grundgesamtheit. Dabei sind folgende Voraussetzungen zu beachten. • Der Stichprobenumfang N ist kleiner als etwa 50. • Die Verteilungsfunktion der Grundgesamtheit ist stetig, d.h., die gemessenen Merkmale können alle Werte in einem bestimmten Intervall annehmen. Dazu stellen wir über die unbekannte Verteilungsfunktion F der Grundgesamtheit die alternativen Hypothesen auf: H0 : F (x) = Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ und σ 2 . H1 : F (x) 6= Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer anderen Grundgesamtheit. Da sich die Nullhypothese auf die gesamte Verteilungsfunktion F und nicht nur auf einzelne ihrer Parameter bezieht, liegt eine nichtparametrische Hypothese vor. Zur Konstruktion einer passenden Testgrösse für die Prüfung von H0 ordnen wir die Stichprobe x1 , . . . , xN der aufsteigenden Grösse nach x(1) ≤ · · · ≤ x(i) ≤ · · · ≤ x(N ) und bilden die empirische Summenfunktion, eine Treppenfunktion, FN (x) = 0 i N 1 für für für x < x(1) x(i) ≤ x < x(i+1) , x(N ) ≤ x d.h., i zählt die Anzahl der Stichprobenwerte, die kleiner oder gleich x sind. (vgl. Abbildung 8.4.i). Zur Prüfung der Nullhypothese berechnen wir die maximale Abweichung zwischen der empirischen Summenfunktion FN und der angenommenen Verteilungsfunktion Φ(x, µ, σ 2 ) der Normalverteilung mit den aus der Stichprobe geschätzten Parametern N 1 X µ ≈ x̄ = xi N i=1 N und 1 X σ ≈s = (xi − x̄)2 . N −1 2 2 i=1 Da die empirische Summenfunktion FN eine Treppenfunktion ist, müssen die maximalen Abweichungen jeweils an den Sprungstellen x(i) liegen (vgl. Abbildung 8.4.i). Deshalb berechnen 8.4. Lilliefors-Test auf Normalverteilung 81 y b b b b FN (x(i) ) = i N b d′′i Φ(x(i) , x̄, s2 ) FN (x(i−1) ) = i−1 N b d′i b b b x(i−1) x(i) x(i+1) x Abbildung 8.4.i: Beim Lilliefors-Test auf Normalverteilung werden die maximalen Abweichungen jeweils an den Sprungstellen der empirischen Summenfunktion FN mit der angenommenen Verteilungsfunktion Φ(x, x̄, s2 ) der Normalverteilung verglichen. wir an jeder Sprungstelle die Grössen i − 1 2 2 − Φ(x(i) , x̄, s ) , = FN (x(i−1) ) − Φ(x(i) , x̄, s ) = N i ′′ 2 2 di = FN (x(i) ) − Φ(x(i) , x̄, s ) = − Φ(x(i) , x̄, s ) . N d′i Die Testgrösse des Lilliefors-Test auf Normalverteilung ist dann der grösste auf diese Weise ermittelte Zahlenwerte dN = max {d′i , d′′i }. (8.4.a) 1≤i≤N Die Wahrscheinlichkeitsverteilung von dN entspricht keiner der uns bekannten Verteilungen, sie lässt sich aber im Prinzip bestimmen. Die kritischen Werte DN,1−α bei entsprechendem Stichprobenumfang N zu gegebenem Signifikanzniveau α lassen sich aus Tafel T.18 ablesen. Jetzt ziehen wir den statistischen Schluss: • Ist die Testgrösse dN < DN,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit. • Ist die Testgrösse DN,1−α ≤ dN , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit. Der Vorteil des Lilliefors-Test auf Normalverteilung gegenüber dem χ2 -Anpassungstest besteht darin, dass er auch bei kleinem Stichprobenumfang, wo eine Klasseneinteilung der Messwerte und damit die Verwendung des χ2 -Anpassungstest nicht sinnvoll ist, angewandt werden kann. Beispiel 8.4.1. Untersuchen Sie die Residuen7 der Scherfestigkeiten von Spanplatten mit dem Lilliefors-Test auf Normalverteilung. Das Signifikanzniveau ist 5%. Es ergeben sich die folgenden N = 28 Werte. 7 Die Abweichungen zwischen den gemessenen Werten und den entsprechenden Werten auf der zu den Messwerten gehörenden Regressionsgeraden werden als Residuen bezeichnet. 82 Kapitel 8. Prüfen der Verteilung der Grundgesamtheit i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 FN (xi−1 ) = 0.000 0.036 0.071 0.107 0.143 0.179 0.214 0.250 0.286 0.321 0.357 0.393 0.429 0.464 0.500 0.536 0.571 0.607 0.643 0.679 0.714 0.750 0.786 0.821 0.857 0.893 0.929 0.964 xi -0.14 -0.12 -0.11 -0.11 -0.11 -0.10 -0.09 -0.06 -0.06 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.01 -0.01 0.02 0.03 0.05 0.06 0.06 0.08 0.09 0.09 0.09 0.11 0.11 i−1 N FN (xi ) = 0.036 0.071 0.107 0.143 0.179 0.214 0.250 0.286 0.321 0.357 0.393 0.429 0.464 0.500 0.536 0.571 0.607 0.643 0.679 0.714 0.750 0.786 0.821 0.857 0.893 0.929 0.964 1.000 Φ(xi , x̄, s2 ) 0.052 0.085 0.106 0.106 0.106 0.132 0.161 0.271 0.271 0.271 0.315 0.361 0.410 0.460 0.511 0.511 0.511 0.659 0.704 0.786 0.821 0.821 0.880 0.903 0.903 0.903 0.940 0.940 i N d′i 0.052 0.049 0.035 0.001 0.036 0.047 0.053 0.021 0.014 0.050 0.042 0.031 0.018 0.004 0.011 0.025 0.061 0.052 0.061 0.107 0.106 0.071 0.094 0.082 0.046 0.010 0.011 0.024 d′′i 0.016 0.013 0.001 0.036 0.072 0.083 0.089 0.014 0.050 0.086 0.078 0.067 0.054 0.040 0.025 0.061 0.096 0.016 0.026 0.071 0.071 0.035 0.058 0.046 0.010 0.025 0.024 0.060 Wir bestimmen aus obiger Tabelle die Testgrösse dN = max {d′i , d′′i } = max{0.107, 0.096} = 0.107. 1≤i≤N Für den Stichprobenumfang von N = 28 und zum Signifikanzniveau α = 0.05 lesen wir den kritischen Wert D28,1−0.05 ≈ 0.16 aus Tafel T.18 ab. Da dN = 0.107 < D28,1−0.05 ≈ 0.16 gilt, kann die Nullhypothese angenommen werden. Die Stichprobe stammt somit mit einer Irrtumswahrscheinlichkeit von 5% aus einer normalverteilten Grundgesamtheit mit den geschätzten Parametern µ ≈ x̄ = −0.01 und σ 2 ≈ s2 = 0.006. Aufgabe Aufgabe 8.4.1. An 50 auf einem Automaten hergestellten Vorderachszapfen wurde der Durchmesser kontrolliert, wobei die in untenstehender Tabelle angegebenen (positiven) Abweichungen [in µm] vom Nennmass 20 mm erhalten wurden. Es ist zu prüfen, ob die vorliegende Stichprobe aus der normalverteilten Grundgesamtheit mit dem geschätzten Erwartungswert x̄ = 41.6 und der geschätzten Standardabweichung s = 2.22 stammt. Das Signifikanzniveau ist 5%. hi xi 36 1 37 1 38 3 39 3 40 6 41 9 42 10 43 5 44 8 45 3 46 1 Kapitel 9 Das Ausreisserproblem Unter den Messwerten x1 , . . . , xN einer Stichprobe treten manchmal einzelne extrem hohe oder niedrige Werte auf, die weitere Berechnungen, z.B. des arithmetischen Mittelwertes x̄, wesentlich beeinflussen können. Es stellt sich also die Frage, ob wir diese Extremwerte oder Ausreisser einfach aus der Stichprobe streichen können. Dazu muss entschieden werden, ob ein solcher Wert wirklich verfälscht ist und damit nicht als Realisierung der Zufallsgrösse X mit der Verteilungsfunktion F angesehen werden kann, also für die vorliegende nach F verteilte Grundgesamtheit nicht repräsentativ ist. Andererseits ist zu bedenken, dass zum Beispiel eine normalverteilte Zufallsgrösse alle Werte zwischen minus und plus unendlich annehmen kann und damit auch als Realisierungen in der Stichprobe sehr grosse oder sehr kleine Werte durchaus (wenn auch mit kleiner Wahrscheinlichkeit) auftreten können. Dies zeigt die Kompliziertheit dieses so genannten Ausreisserproblems. In der mathematischen Statistik sind wir bestrebt, für diese subjektiven Einschätzungen verdächtiger Werte objektive Kriterien zu finden. Wir bezeichnen einen extrem grossen oder extrem kleinen Wert x∗ der Stichprobe x1 , . . . , xN als Ausreisser, wenn durch einen Ausreissertest die Hypothese, dass x∗ ein Stichprobenwert aus der Grundgesamtheit ist, abgelehnt wird. Wird ein Wert x∗ durch einen Ausreissertest als Ausreisser erkannt, so wird er in der Regel aus der Stichprobe entfernt, die Stichprobe wird von Ausreisser bereinigt. Nach dem Entfernen eines Ausreissers sollte die bereinigte Stichprobe wiederum auf erneute Ausreisser untersucht werden, bis keine verdächtigen Werte mehr vorhanden sind. In der Praxis sollten jedoch die als Ausreisser identifizierten und aus der Stichprobe gestrichenen Werte gesondert erfasst werden. Zumindest ist ihre Anzahl fest zu halten. Auch sollte sich der Anwender beim Erkennen von Ausreissern durch einen Ausreissertest stets überlegen, ob bei der Datenerfassung verfälschte Messwerte zum Beispiel durch Ablese- oder Übertragungsfehler möglich sind oder ob nicht gerade die Extremwerte die aufschlussreichsten Werte der Stichprobe darstellen können. Im letzten Fall würde ein Entfernen dieser Werte zu falschen Schlussfolgerungen führen. Der Anwender sollte sich auch bewusst sein, dass einige Verfahren der statistischen Datenanalyse sehr stark auf Ausreisser reagieren, z.B. alle auf dem arithmetischen Mittel x̄ und der Varianz s2 beruhenden Schätz- und Prüfverfahren1 . Im Gegensatz dazu ist zum Beispiel der Median x e unempfindlich, so genannt robust, auf Ausreisser. 1 Beobachten Sie einmal, wie sich eine Regressionsgerade ändert, wenn ein einziger Wert stark geändert wird (vgl. Abbildungen 11.1.ii und 11.1.iii). 83 84 Kapitel 9. Das Ausreisserproblem 9.1 Ausreissertest nach Grubbs für Stichprobenwerte Aus der grossen Zahl von Ausreissertests wollen wir im Folgenden den Ausreissertest nach F. E. Grubbs (1969) vorstellen, der eine normalverteilte Grundgesamtheit voraussetzt. Es seien also N Messwerte x1 , . . . , xN eines zufälligen Merkmales aus einer normalverteilten Grundgesamtheit gegeben2 . Mit dem Ausreissertest nach Grubbs wollen wir die alternativen Hypothesen H0 : Alle N Messwerte stammen aus der gleichen Grundgesamtheit. H1 : Mindestens ein Stichprobenwert stammt aus einer anderen Grundgesamtheit. testen. Zur Prüfung von H0 berechnen wir den geschätzten Mittelwert und die geschätzte Varianz der Stichprobe x̄ = N 1 X xi N N und s2 = i=1 1 X (xi − x̄)2 N −1 i=1 und daraus die Testgrösse G= max |xi − x̄| 1≤i≤N . (9.1.a) s Die Wahrscheinlichkeitsverteilung von G entspricht keiner der uns bekannten Verteilungen, sie lässt sich aber im Prinzip bestimmen. Die kritischen Werte GN,1−α für entsprechenden Stichprobenumfang N zu gegebenem Signifikanzniveau α berechnen wir mit v u t2N −2, α N − 1u N t , GN,1−α = √ t2N −2, α + (N − 2) N N wobei tn,q das q-Quantil der Student-t-Verteilung mit n Freiheitsgraden darstellt (vgl. Tafel T.3) oder entnehmen sie der Tafel T.19. Jetzt ziehen wir den statistischen Schluss: • Ist die Testgrösse G < GN,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die Stichprobe enthält keine Ausreisser. • Ist die Testgrösse GN,1−α ≤ G, dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt, d.h., derjenige Wert der Stichprobe, der am weitesten vom arithmetischen Mittel x̄ entfernt liegt – das kann entweder der kleinste xmin oder der grösste xmax Wert der Stichprobe sein –, als Ausreisser erkannt ist und aus der Stichprobe entfernt wird. Nach dem Entfernen eines Ausreissers sollte die bereinigte Stichprobe wiederum auf erneute Ausreisser untersucht werden, bis keine verdächtigen Werte mehr vorhanden sind. Der Ausreissertest nach Grubbs entdeckt zu grosse Ausreisser nur dann, wenn gleichzeitig keine zu kleinen Messwerte vorhanden sind. Treten Extremwerte an beiden Rändern der geordneten Messreihe auf, so wird die geschätzte Varianz s2 grösser und demzufolge die Testgrösse G kleiner. 2 Die Parameter µ und σ 2 der Grundgesamtheit brauchen nicht bekannt zu sein. 9.2. Ausreissertest nach Grubbs für Mittelwerte 9.2 85 Ausreissertest nach Grubbs für Mittelwerte Es liegen k unabhängige Stichproben vom gleichen Umfang N mit den Mittelwerten x̄1 , . . . , x̄k aus k normalverteilten Grundgesamtheiten vor. Es wird vermutet, dass µ1 = · · · = µk , d.h., alle Mittelwerte der k normalverteilten Grundgesamtheiten seien gleich. Die Prüfung, ob der kleinste oder grösste Mittelwert x̄min = min x̄i 1≤i≤k oder x̄max = max x̄i 1≤i≤k der k Stichproben aus einer normalverteilten Grundgesamtheit mit grösserem Mittelwert stammt, also als Ausreisser anzusehen ist, prüfen wir mit dem Ausreissertest nach Grubbs (vgl. Kapitel 9.1). 9.3 Ausreissertest nach Cochran für Varianzen Es liegen k unabhängige Stichproben vom gleichen Umfang N mit den Varianzen s21 , . . . , s2k aus k normalverteilten Grundgesamtheiten vor. Es wird vermutet, dass σ12 = · · · = σk2 , d.h., alle Varianzen der k normalverteilten Grundgesamtheiten seien gleich. Die Prüfung, ob die grösste s2max = max s2i 1≤i≤k der k Varianzen aus einer normalverteilten Grundgesamtheit mit grösserer Varianz stammt, also als Ausreisser anzusehen ist, prüfen wir mit dem Cochran-Test (vgl. Kapitel 6.3). Aufgaben Aufgabe 9.3.1. Es soll die Genauigkeit einer technologischen Operation untersucht werden. Zu bestimmten Zeitpunkten wurden Proben entnommen. Folgende Masse der Teile [in mm] wurden festgestellt (geordnet): 0.07 0.09 0.10 0.12 0.13 0.15 0.16 0.17 0.31 Gibt es hier beim Niveau α = 0.01 Ausreisser? Aufgabe 9.3.2. Bei einer Untersuchung der Zeit, die ein Arbeiter für einen bestimmten Arbeitsgang benötigt, ergaben sich die folgenden 8 Zeitmessungen [in Minuten]: 84 83 86 81 92 82 85 83 Bereinigen Sie diese Stichprobe auf einem Signifikanzniveau von 10% von allen Ausreissern. Beschreiben Sie, was Sie mit allfälligen Ausreissern machen. 86 Kapitel 9. Das Ausreisserproblem Kapitel 10 Varianzanalyse – ANOVA Die Varianzanalyse oder ANOVA1 ist ein spezielles Verfahren, das ursprünglich von R. A. Fisher (vgl. Abbildung 1.1.iii) entwickelt wurde. Sie stellt inhaltlich eine Verallgemeinerung des Zweistichproben-t-Tests zum Vergleich von Mittelwerten zweier unabhängiger Stichproben aus normalverteilten Grundgesamtheiten (vgl. Kapitel 5.3) dar. Sie gestattet, mehrere Stichprobenmittelwerte gleichzeitig auf einen signifikanten Unterschied zu testen und damit den Einfluss eines so genannten Faktors auf ein messbares Merkmal zu untersuchen. Beispiel 10.0.1. Ein Arzt in einer Klinik meint bezüglich einer bestimmten Art von Schmerzen folgendes herausgefunden zu haben: Die mittlere Zeitdauer, die sich ein Patient nach Einnahme einer Tablette schmerzfrei fühlt, hängt nicht vom Wirkstoff ab, den eine Tablette enthält, sondern nur von der Tatsache, dass dem Patienten eine Tablette verabreicht wird. Um diese Behauptung zu prüfen, gibt er einer Anzahl Patienten, die an solchen Schmerzen leiden entweder ein so genanntes Placebo (Tablette ohne Wirkstoff) oder eines von zwei schmerzstillenden Mitteln A und B. Er notiert dann, für wie viele Stunden sich der Patient schmerzfrei fühlt. Geprüft werden soll, ob hinsichtlich der schmerzfreien Zeit bei den 3 Gruppen signifikante, d.h. durch das unterschiedliche Medikament A, B und Placebo hervorgerufene, oder bloss zufallsbedingte Unterschiede bestehen. In diesem Fall liefert die Varianzanalyse das geeignete statistische Analyseverfahren. 10.1 Einfaktorielle Varianzanalyse Gegeben seien r Stichproben, so genannte Gruppen, mit jeweils n1 , . . . , nr Werten aus normalverteilten Grundgesamtheiten mit den Erwartungswerten µ1 , . . . , µr und den im Allgemeinen unbekannten aber gleichen Varianzen σ12 = · · · = σr2 . Die Gesamtanzahl der Messwerte ist dann r X N= ni . i=1 Die N Messwerte, die mit xij (wobei i ∈ {1, . . . , r}, und j ∈ {1, . . . , ni }) bezeichnet werden, können wir in das folgende Versuchsschema eintragen. 1 Analysis of Variances 87 88 Kapitel 10. Varianzanalyse – ANOVA Gruppen (Faktor) 1. Stichprobe 2. Stichprobe .. . Stichprobenwerte (Merkmal) x11 x12 · · · x1j · · · x1n1 x21 x22 · · · x2j · · · x2n2 .. .. .. .. . . . . Mittelwerte x̄1 x̄2 .. . Varianzen s21 s22 .. . i. Stichprobe .. . xi1 .. . xi2 .. . ··· xij .. . ··· xini .. . x̄i .. . s2i .. . r. Stichprobe xr1 xr2 ··· xrj ··· xrnr x̄r s2r Dieses Versuchsschema haben wir durch die Mittelwerte und die Varianzen ni 1 X x̄i = xij ni n s2i und j=1 i 1 X = (xij − x̄i )2 ni − 1 j=1 der einzelnen Gruppen ergänzt. Aufgabe der Varianzanalyse ist es, die Mittelwerte x̄1 , . . . , x̄r der r Gruppen miteinander zu vergleichen und damit die Wirkung des Faktors auf das gemessene Merkmal zu untersuchen. Dazu stellen wir die alternativen Hypothesen auf. H0 : µ1 = · · · = µr , d.h., alle Stichproben stammen aus der gleichen Grundgesamtheit mit µ und σ 2 , der Faktor hat keinen Einfluss auf das Merkmal. für mindestens zwei verschiedene Indizes i, i′ ∈ {1, . . . , r}. H1 : µi 6= µi′ Die Idee der Varianzanalyse besteht darin, die Varianz zwischen den Stichproben, die durch die Stichprobenmittelwerte vertreten sind, mit den Varianzen innerhalb der Stichproben zu vergleichen. Dazu berechnen wir den Mittelwert aller Messwerte sämtlicher Stichproben x̄ = r ni r 1 XX 1 X xij = ni x̄i N N i=1 j=1 i=1 und die Varianz aller Messwerte sämtlicher Stichproben r s2 = n i 1 XX (xij − x̄)2 . N −1 (10.1.a) i=1 j=1 Die mit (N − 1) multiplizierte Varianz (10.1.a) zerlegen wir nun in zwei Teile: (N − 1)s2 = = = ni r X X (xij − x̄)2 i=1 j=1 ni r X X i=1 j=1 ni r X X i=1 j=1 = r X i=1 ((xij − x̄i ) + (x̄i − x̄))2 (xij − x̄i )2 + 2(xij − x̄i )(x̄i − x̄) + (x̄i − x̄)2 ni ni ni X X X (xij − x̄i )2 + 2(x̄i − x̄) (xij − x̄i ) + (x̄i − x̄)2 . j=1 j=1 j=1 10.1. Einfaktorielle Varianzanalyse Der mittlere Summand ni X j=1 (xij − x̄i ) = ni X j=1 89 xij − ni X j=1 x̄i = ni x̄i − ni x̄i = 0 verschwindet für alle i ∈ {1, . . . , r}. Den ersten und den letzten Summanden der übrigbleibenden zerlegten Varianz schreiben wir nun wie folgt um ni ni r X X X (xij − x̄i )2 + (x̄i − x̄)2 (N − 1)s2 = i=1 = r X i=1 j=1 j=1 (ni − 1)s2i + ni (x̄i − x̄)2 r r X X = (ni − 1)s2i + ni (x̄i − x̄)2 . i=1 i=1 Dies ist die gesuchte Zerlegung. Wir beachten, dass nicht die Varianz selbst, sondern die Summe der Abweichungsquadrate, also ihre Zähler additiv zerlegt wurden. Durch Division der Summe der Abweichungsquadrate durch N − 1, n − r resp. r − 1 (diese Zahlen ergeben sich als zugehörige Freiheitsgrade) erhalten wir die so genannte Varianzzerlegung. 1. Varianz innerhalb der Gruppen: Es handelt sich dabei um das gewogene Mittel der Stichprobenvarianzen r 1 X 2 (ni − 1)s2i sin = N −r i=1 mit N − r Freiheitsgraden. 2. Varianz zwischen den Gruppen: Es handelt sich dabei um die Abweichungsquadrate zwischen den Stichproben, die durch ihre Mittelwerte vertreten sind, r s2zw = 1 X ni (x̄i − x̄)2 r−1 i=1 mit r − 1 Freiheitsgraden. Unter der Voraussetzung, dass die r Stichproben alle aus Grundgesamtheiten mit der gleichen, aber unbekannten Varianz σ 2 stammen, besitzt die Zufallsgrösse s2in eine Verteilung mit Erwartungswert E(s2in ) = σ 2 . Im Gegensatz dazu besitzt die Zufallsgrösse s2zw eine Verteilung mit dem Erwartungswert r E(s2zw ) = σ 2 + 1 X ni (µi − µ)2 . r−1 i=1 Ist nun die Nullhypothese H0 richtig, so verschwindet wegen µi − µ = 0 für alle i ∈ {1, . . . , r} der zweite Summand, und die Zufallsgrösse s2zw hat ebenfalls einen Erwartungswert von σ 2 . Aus diesem Grund eignet sich die Testgrösse f= s2zw s2in (10.1.b) 90 Kapitel 10. Varianzanalyse – ANOVA vorzüglich zur Überprüfung der Nullhypothese, da die Bedingung µ1 = · · · = µr = µ impliziert, dass die Erwartungswerte von s2zw und s2in gleich sind und somit f gleich 1 sein sollte. Die Testgrösse (10.1.b) ist F -verteilt mit (r − 1, N − r) Freiheitsgraden. Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α ist durch den kritischen Wert Fr−1,N −r,1−α gegeben. Der kritische Wert lässt sich aus der Beziehung P (Fr−1,N −r,1−α ≤ f ) = α mit Hilfe von Tafeln T.6 bis T.14 oder einem Computerprogramm ermitteln. Jetzt ziehen wir den statistischen Schluss: • Ist die Testgrösse f < Fr−1,N −r,1−α , dann wird die Nullhypothese H0 angenommen, d.h., Abweichungen vom idealen Wert f = 1 sind zufälliger Natur. Die r Stichproben stammen somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus der gleichen Grundgesamtheit. • Ist die Testgrösse Fr−1,N −r,1−α ≤ f , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Beispiel 10.1.1. Aus r = 4 Lieferungen von Gussasphalt wurden je ni = 5 Stichprobenwerte entnommen, um zu prüfen, ob der Bindemittelgehalt gleich ist. Wir erhalten das folgende Versuchsschema: Gruppen (Faktor) 1. Stichprobe 2. Stichprobe 3. Stichprobe 4. Stichprobe 7.4820 7.5924 7.5372 7.5468 Stichprobenwerte (Merkmal) 7.5646 7.9233 7.8625 7.1769 7.5472 7.9446 7.8803 7.1517 7.5559 7.9340 7.8714 7.1643 7.2451 7.9255 7.9286 7.0809 Mittelwerte 7.6019 7.6232 7.6126 7.5454 Varianzen 0.0919 0.0996 0.0950 0.1493 Das Signifikanzniveau ist α = 0.05. Wir stellen die alternativen Hypothesen auf. H0 : µ1 = µ2 = µ3 = µ4 , d.h., der durchschnittliche Bindemittelgehalt ist gleich. H1 : µi 6= µi′ , für mindestens zwei verschiedene Indizes i, i′ ∈ {1, 2, 3, 4}, d.h., der durchschnittliche Bindemittelgehalt ist nicht gleich. Nun führen wir die Varianzanalyse oder ANOVA durch und berechnen die nötigen Zwischenwerte s2in = 0.1090 und s2zw = 0.0060 und daraus die Testgrösse f = 0.0553. Zu gegebenem Signifikanzniveau α = 0.05 und den Freiheitsgraden (r − 1, N − r) = (3, 16) bestimmen wir aus Tafel T.9 oder einem Computerprogramm den kritischen Wert F3,16,0.95 = 3.2389. Da f = 0.0553 < F3,16,0.95 = 3.2389 gilt, kann die Nullhypothese angenommen werden. Die Stichproben stammen somit mit einer Irrtumswahrscheinlichkeit von 5% aus der selben normalverteilten Grundgesamtheit. D.h., der Bindemittelgehalt ist bei allen Stichproben gleich. Aufgaben Aufgabe 10.1.1. Während der Fussballweltmeisterschaften 1982 in Spanien ermittelte der medizinische Betreuer einer Mannschaft folgende Gewichtsverluste [in kg] einiger Feldspieler bei drei Vorrundenspielen: 10.1. Einfaktorielle Varianzanalyse Gruppen (Faktor) 1. Spiel 2. Spiel 3. Spiel 91 Stichprobenwerte 1.84 1.97 1.75 1.98 1.77 1.85 1.76 1.73 1.82 1.86 1.67 1.61 (Merkmal) 1.83 1.88 2.01 1.74 1.68 1.69 Testen Sie auf dem Niveau 5% die Annahme der Gleichheit des mittleren Gewichtsverlustes in allen Vorrundenspielen. Aufgabe 10.1.2. Ein Walzwerk liefert Eisenplatten, die von 4 verschiedenen Walzen stammen. Der Verwendungszweck dieser Platten erfordert, dass sie alle die gleiche Dicke besitzen. Zur Untersuchung dieses Merkmals wurden 20 Platten nachgemessen, wobei von jeder der Walzen 5 dieser Platten stammten. Es ergaben sich die folgenden Werte [in mm]: Gruppen (Faktor) 1. Walze 2. Walze 3. Walze 4. Walze Stichprobenwerte 9.34 9.38 9.12 9.67 9.51 9.61 9.14 9.13 9.06 9.71 9.75 9.50 (Merkmal) 9.32 9.28 9.52 9.57 9.02 9.07 9.54 9.55 Prüfen Sie auf dem 1% Niveau die Annahme, dass die mittlere Plattendicke bei allen 4 Walzen gleich sei. Aufgabe 10.1.3. Von 18 untersuchten Getreidefelder wurden n1 = 5 mit Düngemittel D1 , n2 = 7 mit Düngemittel D2 und n3 = 6 mit Düngemittel D3 gedüngt. Die Ernteerträge der entsprechenden Felder [in kg] sind in folgender Tabelle angegeben: Gruppen (Faktor) Düngemittel D1 Düngemittel D2 Düngemittel D3 781 545 696 Stichprobenwerte 655 611 789 786 976 663 660 639 467 (Merkmal) 596 790 568 65 380 720 Prüfen sie auf dem 5% Niveau die Annahme, dass die drei Düngemittel im Mittel zu den gleichen Ernteerträge führen. Aufgabe 10.1.4. Um drei Trainingsmethoden A, B und C für den Speerwurf zu erproben, wurden 23 untrainierte Sportstudenten zufällig in drei Gruppen zu n1 = 6, n2 = 9 und n3 = 8 Studenten eingeteilt. Vor der Tainingsphase wurde zunächst ein Leistungstest durchgeführt und für jeden Studenten die Weite des besten von drei Würfen notiert. Nach Abschluss des Trainings, die Studenten der Gruppe 1 wurden nach System A, die Studenten der zweiten Gruppe nach B usw. trainiert, wurde ein zweiter Leistungstest durchgeführt. Es ergaben sich folgende Werte [in m] der Differenzen zwischen erstem und zweitem Test: Gruppen (Faktor) 1. Gruppe 2. Gruppe 3. Gruppe 7.06 8.73 5.00 13.50 10.24 10.88 Stichprobenwerte (Merkmal) 4.86 12.00 8.38 9.20 9.78 7.30 7.42 10.54 12.98 4.70 6.90 12.80 8.68 8.34 17.80 9.04 Sind die drei Trainingsmethoden gleichwertig? Das Signifikanzniveau ist 5%. 9.40 92 Kapitel 10. Varianzanalyse – ANOVA Kapitel 11 Regressionsrechnung Problemstellung: Gegeben sei eine empirisch vorliegende, d.h. durch eine Anzahl Messpunkte gegebene Funktion. Gesucht wird eine Funktion f , die diese Funktion nach der Gaussschen Methode der kleinsten Quadrate am besten annähert. Das Prinzip der Regressionsrechnung wird auch als Gausssche Methode der kleinsten Quadrate (MKQ) bezeichnet oder unter dem Begriff Ausgleichsrechnung zusammengefasst. Es geht auf Carl Friedrich Gauss, 1777-1855, zürück. Abbildung 11.0.i: Carl Friedrich Gauss, 1777-1855 11.1 Regressionsgerade Gegeben sei eine Punktewolke von n Punkten Pi (xi , yi ). Gesucht ist die Gerade mit der Gleichung y = ax+b, die diese Punktewolke im Sinne von Gauss möglichst gut annähert. Dies bedeutet, dass die Gerade, d.h. a und b, so gewählt wird, dass die so genannte Fehlerquadratsumme n X ∆yi2 , S(a, b) = i=1 die Summe der quadratischen Abweichungen von den gegebenen Punkten minimal ist. Für 93 94 Kapitel 11. Regressionsrechnung y b Pi (xi , yi ) b b ∆yi b b y = ax + b b x Abbildung 11.1.i: Regressionsgerade die Fehlerquadratsumme erhalten wir S(a, b) = n X i=1 (yi − axi − b)2 . Sie ist zu minimalisieren, also berechnen wir die ersten partiellen Ableitungen und setzen sie gleich null n X (yi − axi − b)xi = 0, Sa (a, b) = −2 i=1 n X Sb (a, b) = −2 (yi − axi − b) = 0. i=1 Dies ergibt das lineare Gleichungssystem in den Variablen a und b a n X x2i + b i=1 n X xi = i=1 a n X xi + bn = i=1 n X i=1 n X xi y i , (11.1.a) yi , (11.1.b) i=1 welches mit der Cramerschen Regel (vgl. [15] Seiten 86ff) die Lösung n n X X xi y i xi i=1 i=1 det X n n n n X X X y n n xy − x y i a= i=1 n X x2i i=1 det n X xi i=1 i i n X = xi i=1 n i=1 n X n i=1 x2i − i i i=1 i=1 !2 n X xi i=1 11.1. Regressionsgerade und b= n X 95 x2i i=1 det n X xi i=1 n X x2i i=1 det n X xi n X xi y i y i=1 n X i=1 n X i = n X i=1 xi n i=1 i=1 x2i n X i=1 n n X i=1 yi − n X x2i − xi n X xi y i i=1 i=1 !2 n X xi i=1 ergibt. Der Koeffizient a heisst Regressionskoeffizient und b die Regressionskonstante. Aus der Gleichung (11.1.b) entnehmen wir, dass der Schwerpunkt ! n n 1X 1X P (x̄, ȳ) = P xi , yi n n i=1 i=1 der Punktewolke auf der Geraden y = ax + b liegt. Die Frage stellt sich nun wiederum, ob es sich bei der gefundenen Lösung um ein Extremum oder einen Sattelpunkt handelt. Um dies abzuklären, berechnen wir die zweiten partiellen Ableitungen der Funktion S Saa (a, b) = 2 n X x2i i=1 Sbb (a, b) = 2n n X Sab (a, b) = Sba (a, b) = 2 xi i=1 und betrachten 2 Saa (a, b) · Sbb (a, b) − Sab (a, b) = 4n n X i=1 x2i −4 n X i=i xi !2 . Wir benutzen die Cauchy-Schwarzsche Ungleichung |h~u, ~v i| ≤ |~u| · |~v |, die in Komponenten ausgeschrieben die folgende Form hat !2 n n n X X X 2 ui vi ≤ ui vi2 . i=1 i=1 i=1 Wenn die Vektoren ~u und ~v parallel sind, dann gilt die Gleichheit in der Cauchy-Schwarzschen Ungleichung. Mit der Setzung u1 = 1, . . . , un = 1 und v1 = x1 , . . . , vn = xn folgt !2 n n X X xi >n x2i , i=i i=1 96 Kapitel 11. Regressionsrechnung da die Vektoren ~u und ~v nicht parallel sind. Damit ergibt sich die hinreichende Bedingung !2 n n X X Saa (a, b) · Sbb (a, b) − Sab (a, b)2 = 4n x2i − 4 xi >0 für einen Extrempunkt. Da Saa (a, b) = 2 Minimum. Pn 2 i=1 xi i=1 i=i > 0 gilt, handelt es sich in der Tat um ein Achtung bei Datenmaterial mit Ausreissern! Die Ausgleichsrechnung ist sehr anfällig auf Ausreisser (vgl. Abbildungen 11.1.ii und 11.1.iii). Deshalb sollten wir immer grösste Vorsicht walten lassen und die Stichprobe zuerst auf Ausreisser untersuchen. Dies kann entweder grafisch oder mit dem Ausreissertest nach Grubbs (vgl. Kapitel 9.1) geschehen. y y b c b b b b b b b b b b b b b c b x x Abbildung 11.1.ii: Eine falsche Regressionsgerade wegen einem Ausreisser 11.2 Abbildung 11.1.iii: Eine vorgetäuschte Abhängigkeit wegen einem Ausreisser Allgemeine Regression Gegeben seien n Punkte P1 (x1 , y1 ), . . . , Pn (xn , yn ). Gesucht ist eine Funktion f der Form f (x) = m X k=1 ak fk (x) = a1 f1 (x) + · · · + am fm (x), wobei m < n. Die m Funktionen f1 , . . . , fm sind vorgegebene Funktionen in analytischer Form, wie zum Beispiel x2 , sin(x) oder x1 . Die Koeffizienten a1 , . . . , am werden so bestimmt, dass die Fehlerquadratsumme n n X X S(a1 , . . . , am ) = (f (xi ) − yi )2 = ∆yi2 i=1 i=1 bezüglich der n Punkte Pi minimal wird. Dies stellt eine Verallgemeinerung der bereits besprochenen Methode der kleinsten Quadrate dar. Für a1 = a, a2 = b und f1 (x) = x, f2 (x) = 1 ergibt sich der der Spezialfall einer Ausgleichsgeraden. Wir wollen also die Fehlerquadratsumme !2 n n m X X X S(a1 , . . . , am ) = (f (xi ) − yi )2 = ak fk (xi ) − yi i=1 i=1 k=1 11.2. Allgemeine Regression 97 y b b b f (xi ) b y = f (x) b b b ∆yi b bP b i (xi , yi ) b b xi x Abbildung 11.2.i: Allgemeine Approximation mit minimalem quadratischen Fehler. minimieren, dazu berechnen wir alle ersten partiellen Ableitungen Sa1 (a1 , . . . , am ) = 2 n m X X i=1 .. . Sam (a1 , . . . , am ) = 2 k=1 n m X X i=1 k=1 ak fk (xi ) − yi ak fk (xi ) − yi ! ! f1 (xi ) = 0, .. . fm (xi ) = 0. Dies ergibt ein lineares Gleichungssystem mit m Gleichungen für die m unbekannten Koeffizienten a1 , . . . , am . n m X X i=1 k=1 n m X X i=1 k=1 ! ak fk (xi ) f1 (xi ) = ! n m X X i=1 .. . ak fk (xi ) fm (xi ) = k=1 n m X X i=1 k=1 ! ak fk (xi )f1 (xi ) ! ak fk (xi )fm (xi ) = n X yi f1 (xi ), n X yi fm (xi ). i=1 .. . = i=1 98 Kapitel 11. Regressionsrechnung Jetzt sollen die Summenbildungen vertauscht werden1 . Wir erhalten ! ! m n m n n X X X X X ak fk (xi )f1 (xi ) = ak fk (xi )f1 (xi ) = yi f1 (xi ), k=1 i=1 m n X X k=1 i=1 k=1 ! ak fk (xi )fm (xi ) i=1 i=1 .. . = m X n X ak ! fk (xi )fm (xi ) i=1 k=1 .. . n X = yi fm (xi ) i=1 und ausführlich geschrieben a1 n X ! f1 (xi )f1 (xi ) i=1 a1 n X ! f1 (xi )fm (xi ) i=1 + · · · + am + · · · + am n X i=1 n X i=1 ! fm (xi )f1 (xi ) ! fm (xi )fm (xi ) = n X yi f1 (xi ), i=1 .. . = (11.2.a) n X yi fm (xi ). i=1 Beim linearen Gleichungssystem (11.2.a) handelt es sich um das so genannte Normalgleichungssystem der Ausgleichsrechnung. Dieses lässt sich auch mit Hilfe vom Matrizen schreiben n n n X X X f1 (xi )f1 (xi ) · · · fm (xi )f1 (xi ) yi f1 (xi ) a1 i=1 i=1 i=1 .. . . . . . . . . · . = . (11.2.b) . . . . n n n X X X a m f1 (xi )fm (xi ) · · · fm (xi )fm (xi ) yi fm (xi ) i=1 i=1 i=1 In abkürzender Schreibweise können wir das obige lineare Normalgleichungssystem (11.2.b) gemäss A~a = ~b (11.2.c) schreiben, wobei die m gesuchten unbekannten Koeffizienten a1 , . . . , am zum Vektor ~a zusammengefasst wurden. Die Koeffizienten Akj = n X fk (xi )fj (xi ), i=1 k, j ∈ {1, . . . , m} 1 Wir betrachten dazu ein vereinfachtes Beispiel von Doppelsummen und der Vertauschung von Summenzeichen ! 3 2 X X aik = (a11 + a12 ) + (a21 + a22 ) + (a31 + a32 ) i=1 k=1 = (a11 + a21 + a31 ) + (a12 + a22 + a32 ) ! 2 3 X X = aik . k=1 i=1 11.2. Allgemeine Regression 99 der symmetrischen (m × m)-Matrix A und die Koeffizienten n X bk = yi fk (xi ), i=1 k ∈ {1, . . . , m}. des Störvektors ~b berechnen wir aus den Koordinaten der gegebenen Punkte. Damit lassen sich nun die gesuchten Koeffizienten a1 , . . . , am durch lösen des linearen Normalgleichungssystems (11.2.c) berechnen. Bei grossem m geschieht dies mittels Computer. Damit ist das gegebene Problem im Prinzip gelöst. Beispiel 11.2.1. Eine Punktmenge sei durch eine Funktion der Form f (x) = ax + b sin(x) [x im Bogenmass] im Gaussschen Sinne zu approximieren. Die folgenden 8 Punkte P1 , . . . , P8 seien tabellarisch gegeben 1 0 0.0 i xi yi 2 1 0.2 Wir minimieren S(a, b) = 3 2 1.1 8 X i=1 4 3 2.9 5 4 4.8 6 5 6.0 7 6 6.3 8 7 6.3 (axi + b sin(xi ) − yi )2 , dazu berechnen wir die ersten partiellen Ableitungen Sa (a, b) = 2 Sb (a, b) = 2 8 X i=1 8 X i=1 (axi + b sin(xi ) − yi ) xi = 0, (axi + b sin(xi ) − yi ) sin(xi ) = 0. Dies ergibt das lineare Gleichungssystem2 mit zwei Gleichungen für die zwei unbekannten Koeffizienten a und b. 8 X ax2i + i=1 8 X 8 X bxi sin(xi ) = i=1 8 X b sin2 (xi ) = 8 X xi sin(xi ) = axi sin(xi ) + i=1 8 X y i xi , i=1 i=1 8 X yi sin(xi ) 8 X y i xi , i=1 oder a 8 X i=1 a 8 X i=1 2 x2i + b i=1 8 X xi sin(xi ) + b i=1 sin2 (xi ) = i=1 8 X (11.2.d) yi sin(xi ). i=1 Dieses lineare Gleichungssystem hätte sich auch direkt aus dem linearen Normalgleichungssystem (11.2.a) durch Einsetzen von n = 8, m = 2 und a1 = a, a2 = b und f1 (x) = x, f2 (x) = sin(x) ergeben. 100 Kapitel 11. Regressionsrechnung Daraus lassen sich die gesuchten Koeffizienten a und b berechnen. Dieses Normalgleichungssystem lässt sich wiederum mit Hilfe einer Matrizengleichung schreiben 8 8 8 X X X x2i xi sin(xi ) y i xi i=1 i=1 i=1 · a = . 8 8 8 X X b X xi sin(xi ) sin2 (xi ) yi sin(xi ) i=1 i=1 i=1 Aus den Koordinaten der gegebenen 8 Punkte P1 (x1 , y1 ), . . . , P8 (x8 , y8 ) lassen sich die Koeffizienten dieses Normalgleichungssystems numerisch berechnen. Wir erhalten3 8 X 8 X x2i = 140, i=1 8 X sin2 (xi ) = 3.5568, i=1 8 X i=1 8 X xi yi = 142.2, i=1 i=1 xi sin(xi ) = −1.8160, yi sin(xi ) = −5.4297. Damit ergibt sich das zu lösende lineare Normalgleichungssystem 140 −1.8160 a 142.2 · = −1.8160 3.5568 b −5.4297 mit der Lösung4 a = 1.0026 und b = −1.0147. Die gesuchte Ausgleichsfunktion ist also durch f (x) = 1.0026x − 1.0147 sin(x) 3 4 x im Bogenmass Wir könnten auch mit der Cramerschen Regel (vgl. [15], Seiten 86ff) die Lösung 8 8 X X yi x i xi sin(xi ) i=1 i=1 det 8 8 8 8 8 8 X X X X X X 2 yi sin(xi ) sin (xi ) x i yi sin2 (xi ) − yi sin(xi ) xi sin(xi ) i=1 a= i=1 8 X x2i i=1 det 8 X xi sin(xi ) i=1 und 8 X b= x2i i=1 det 8 X xi sin(xi ) i=1 8 X x2i i=1 det 8 X xi sin(xi ) i=1 8 X = i=1 xi sin(xi ) 2 sin (xi ) i=1 8 X i=1 8 X i=1 i=1 8 X 2 xi i=1 8 X 2 sin (xi ) − i=1 xi sin(xi ) i=1 !2 i=1 8 X yi x i i=1 8 X i=1 8 X yi sin(xi ) = xi sin(xi ) 2 sin (xi ) i=1 8 X 8 X x2i i=1 8 X i=1 8 X yi sin(xi ) − i=1 x2i 8 X i=1 i=1 direkt aus dem Normalgleichungssystem (11.2.d) explizit berechnen. 8 X xi sin(xi ) i=1 2 sin (xi ) − 8 X i=1 8 X x i yi i=1 xi sin(xi ) !2 . 11.2. Allgemeine Regression 101 gegeben. Die berechneten Werte im Vergleich zu den gegebenen ergeben sich zu: i xi yi f (xi ) 1 0 0.0 0.0000 2 1 0.2 0.1488 3 2 1.1 1.0825 4 3 2.9 2.8646 5 4 4.8 4.7783 6 5 6.0 5.9860 7 6 6.3 6.2991 8 7 6.3 6.3526 Aufgaben Aufgabe 11.2.1. In einem Wald sind die Durchmesser x1 , . . . , xn und die dazu gehörigen Höhen y1 , . . . , yn von n Bäumen gemessen worden, so dass n empirische Zahlenpaare (x1 , y1 ), . . . , (xn , yn ) gegeben sind. Durch die Punkte kann am ehesten eine passende logarithmische Ausgleichskurve gelegt werden. Bestimmen Sie diese Funktion in der Form f (x) = a log10 (x) + b. Numerisches Beispiel: P1 (1, 1), P2 (2, 2), P3 (4, 2.5) Aufgabe 11.2.2. Bestimmen Sie die beste Funktion der Form f (x) = ax2 + be−x zu den folgenden Punkten: i xi yi 1 0 -1.0 2 1 1.6 3 2 7.9 4 3 17.9 5 4 32.0 Aufgabe 11.2.3. Bestimmen Sie die beste Funktion der Form f (x) = a + bx + c sin(x) [x im Bogenmass] zu den folgenden Punkten: i xi yi 1 0 1.0000 2 1 1.1585 3 2 2.0907 4 3 3.8589 Aufgabe 11.2.4. Bestimmen Sie die beste Funktion der Form f (x) = a + bx2 + c sin(x) + d cos(x) [x im Bogenmass] zu den folgenden Punkten: i xi yi 1 -2 -3.7416 2 -1 1.2391 3 0 4.0000 4 1 2.9221 5 2 -1.9230 6 3 -8.8389 Lösungen Lösung 11.2.1. a = 2.491 und b = 1.083 Lösung 11.2.2. a = 1.999897 und b = −1.007806 Lösung 11.2.3. a = 0.9999968, b = 1.00001021 und c = −1.0000318 Lösung 11.2.4. a = 2.0000, b = −1.0000, c = 1.0000 und d = 1.9999 102 Kapitel 11. Regressionsrechnung Kapitel 12 Regressionsanalyse Die Regressionsanalyse behandelt folgendes Problem: Aus den Realisierungen einer Zufallsgrösse X sollen wahrscheinlichkeitstheoretische Aussagen, d.h., Vorhersagen über die Werte einer zweiten Zufallsgrösse Y gemacht werden. Dabei sind natürlich nur dann sinnvolle Vorhersagen möglich, wenn die beiden Zufallsgrössen X und Y abhängig sind, wenn also eine Verbindung zwischen X und Y besteht. 12.1 Allgemeines Beispiel 12.1.1. Der Bremsweg eines bestimmten Autos hängt wesentlich von der Geschwindigkeit ab, die das Auto unmittelbar vor dem Bremsbeginn erreicht hat. Diese Geschwindigkeit bestimmt jedoch den Bremsweg nicht eindeutig, weil er durch viele weitere Grössen beeinflusst wird, z.B. durch den Zustand der Bremsen und Reifen, die Strassenbeschaffenheit, das Ladegewicht und das Verhalten des Fahrers während des Bremsvorgangs. Werden bei konstanter Geschwindigkeit x mehrere Bremsversuche unternommen, so erhalten wir im Allgemeinen verschiedene Bremswege als Realisierungen einer Zufallsvariable Y (x). Zu jedem Geschwindigkeitswert x gehört also eine Zufallsvariable Y (x). Aus Erfahrung ist bekannt, dass der erwartete Bremsweg und die Streuung der Bremswege mit wachsender Geschwindigkeit x grösser werden. Es gilt die Faustregel “grössere Geschwindigkeit gleich längerer Bremsweg”. Aus der Geschwindigkeit können also keine deterministischen, sondern nur wahrscheinlichkeitstheoretische Aussagen über den Bremsweg gemacht werden. Diesen Zusammenhang können wir mit einer Regression beschreiben. Die Regressionsanalyse gibt uns Auskunft darüber, wie gut die angepasste Kurve zur Realität passt, d.h., ob das gewählte Modell (z.B. linear, polynomial oder exponentiel) ein angepasstes ist. Beispiel 12.1.2. Im Gegensatz zu Beispiel 12.1.1 ist der Zusammenhang zwischen der Seitenlänge x eines Quadrates und dessen Flächeninhalt y ein deterministischer. Es gilt die funktionale Beziehung y = x2 . Durch die Vorgabe einer Seitenlänge x ist also der Flächeninhalt y = x2 eindeutig bestimmt. Wir unterscheiden zwei Arten von Variablen: 1. Nichtstochastische Variablen, die fest vorgegeben sind, wie Stützpunkte, Klassenmitten oder Messpunkte (z.B. Geschwindigkeit vor Bremsbeginn in Beispiel 12.1.1). Diese werden im Allgemeinen mit x bezeichnet. 103 104 Kapitel 12. Regressionsanalyse 2. Stochastische Variablen, die meistens einer Normalverteilung gehorchen (z.B. Bremsweg in Beispiel 12.1.1). Diese werden im Allgemeinen mit y bezeichnet. b y b b b ȳi b b b b b b b b b b b b b b b b b b b b xi x Abbildung 12.1.i: Nichtstochastische Variablen in x-Richtung und im Allgemeinen normalverteilte stochastische Variablen in y-Richtung Der Zusammenhang des durchschnittlichen Wertes ȳ von y je Messpunkt mit den verschiedenen Messpunkten der nichtstochastischen Variablen x heisst Regression. Im Folgenden nehmen wir an, dass die stochastischen Variablen y einer Normalverteilung mit den Parametern µ und σ 2 gehorchen. Im Wesentlichen gibt es drei typische Fälle der Regression: 1. Kein Zusammenhang zwischen x und y, d.h., die y-Werte sind unabhängig von den x-Werten (vgl. Abbildung 12.1.ii). 2. Linearer Zusammenhang zwischen x und y, d.h., die Verbindungslinie der Mittelwerte ȳ der einzelnen Verteilungen liegen alle auf einer Geraden, der so genannten Regressionsgeraden (vgl. Abbildung 12.1.iii). Die Regressionsgerade ist der geometrische Ort der wahrscheinlichsten Werte von y je Messpunkt x. 3. Nichtlinearer Zusammenhang zwischen x und y, d.h., die Verbindungslinie der Mittelwerte ȳ der einzelnen Verteilungen liegen z.B. auf einer polynomialen (Grad mindestens zwei), exponentiellen oder logarithmischen Kurve (vgl. Abbildung 12.1.iv). y y ȳ7 ȳ6 ȳ1 b ȳ2 b ȳ3 b ȳ4 b ȳ5 b ȳ6 b ȳ7 b ȳ5 y = ax + b ȳ4 ȳ3 ȳ2 y = const ȳ1 x1 x2 x3 x4 x5 x6 x7 x Abbildung 12.1.ii: Kein Zusammenhang zwischen x und y. b b b b b b b x1 x2 x3 x4 x5 x6 x7 x Abbildung 12.1.iii: Linearer Zusammenhang zwischen x und y 12.2. Regressionsgerade 105 y ȳ5 ȳ4 y = f (x) ȳ3 ȳ2 ȳ1 ȳ6 ȳ7 b b b b b b b x2 x1 x4 x3 x5 x6 x7 x Abbildung 12.1.iv: Nichtlinearer Zusammenhang zwischen x und y In der Praxis sind meistens nicht so viele Messpunkte vorhanden, dass für viele Werte von x annähernde Normalverteilungen entstehen. Es steht meistens eine mehr oder weniger beschränkte Stichprobe pro Messpunkt zur Verfügung, die von Messpunkt zu Messpunkt anders sein kann. 12.2 Regressionsgerade Gegeben sei eine Punktewolke von N Punkten P1 (x1 , y1 ), . . . , PN (xN , yN ). Gesucht ist die Gerade mit der Gleichung y = ax + b, die diese Punktewolke im Sinne von Gauss möglichst gut annähert. Dies bedeutet, dass die Konstanten a und b der Geraden so gewählt werden, dass die so genannte Fehlerquadratsumme S(a, b) = N X ∆yi2 i=1 N X = (yi − axi − b)2 , i=1 die Summe der senkrechten quadratischen Abweichungen von den gegebenen Punkten zur Geraden minimal ist. Sie ist zu minimieren, also berechnen wir die ersten partiellen Ableitungen b y b Pi (xi , yi ) b b ∆yi b b b b b b b b b b y = ax + b b b x Abbildung 12.2.i: Regressionsgerade 106 Kapitel 12. Regressionsanalyse und setzen diese gleich null N X (yi − axi − b)xi = 0 Sa (a, b) = −2 Sb (a, b) = −2 und i=1 N X i=1 (yi − axi − b) = 0. Dies ergibt das lineare Gleichungssystem in den Variablen a und b a N X x2i +b i=1 N X xi = i=1 N X xi y i und i=1 a N X xi + bN = i=1 N X (12.2.a) yi , i=1 welches die Lösung N a= N X i=1 N xi y i − N X i=1 x2i − N X xi i=1 N X i=1 N X yi i=1 xi !2 und b= N X x2i i=1 N X i=1 N n X yi − x2i i=1 − N X xi i=1 N X i=1 N X xi y i i=1 xi !2 hat. Der Koeffizient a heisst Regressionskoeffizient und b die Regressionskonstante. Aus der zweiten Gleichung (12.2.a) entnehmen wir, dass der Schwerpunkt P (x̄, ȳ) = P N N 1 X 1 X xi , yi N N i=1 i=1 ! der Punktewolke auf der Regressionsgeraden y = ax + b liegt. 12.3 Regressionsanalyse einer Geraden Wir sollten folgendes Problem bei der Regressionsrechnung nicht aus den Augen verlieren: Da die Punkte um die Regressionsgerade mehr oder weniger streuen, enthalten sowohl der Regressionskoeffizient a als auch die Regressionskonstante b eine gewisse Unsicherheit. Die Frage stellt sich nun, ab welcher Grösse des Regressionskoeffizienten a von einem wirklichen Einfluss der Grösse x auf die Grösse y gesprochen werden kann, d.h., ist die Regressionsgerade signifikant von einer zur x-Achse parallelen Geraden verschieden. Eine Berücksichtigung der Variable x ist nur dann sinnvoll, wenn die Veränderung von y nicht rein zufällig auf ein Veränderung von x erfolgt. Mit Hilfe eines statistischen Tests, der so genannten Regressionsanalyse, wollen wir nun diese Abhängigkeit quantifizieren. Es seien also N Messpunkte P1 (x1 , y1 ), . . . , PN (xN , yN ) gegeben, dabei bezeichnet x die nichtstochastische und y die stochastische Variable. Nach der Methode der kleinsten Quadrate (vgl. Kapitel 12.2) wurde eine beste Gerade Y = ax + b an diese Punktewolke angepasst. Über den Regressionskoeffizienten a stellen wir nun eine Annahme in Form einer statistischen Hypothese auf. H0 : a = 0, d.h., es besteht keine Abhängigkeit zwischen x und y. H1 : a 6= 0, d.h., es besteht eine Abhängigkeit zwischen x und y. 12.3. Regressionsanalyse einer Geraden 107 Zur Beantwortung dieser Fragestellung berechnen wir aus den Koordinaten der N Punkte P1 (x1 , y1 ), . . . , PN (xN , yN ) die (theoretischen) Werte Yi = axi + b und damit die folgenden Grössen N s2x N 1 X mit x̄ = xi , N 1 X = (xi − x̄)2 N −1 s2y = 1 N −2 i=1 N X i=1 i=1 (yi − Yi )2 = und aus diesen die Testgrösse tReg = √ 1 N −2 N −1 N X i=1 (yi − (axi + b))2 sx a. sy (12.3.a) Zur quantitativen Beurteilung der Abhängigkeit der Variablen y von der Grösse x sind folgende Gesichtspunkt massgebend: • Die absolute Grösse des Regressionskoeffizienten a, d.h. die Steilheit der Regressionsgeraden. Grosse Werte des Regressionskoeffizienten deuten auf eine starke Abhängigkeit. • Die Varianz s2x der unabhängigen x-Werte um den Mittelwert x̄. Grosse Streuung in x-Richtung gibt Sicherheit für die Aussage. Für die Praxis heisst das, es muss dafür gesorgt werden, dass die Grössen xi über ein möglichst grossen Bereich vorhanden sind. • Die Restvarianz s2y der Punkte um die Gerade, d.h. die Fehlerquadratsumme in yRichtung. Kleine Streuungen in y-Richtung ergeben eine Zuverlässigkeit der Aussage. Die Testgrösse tReg ist Student-t-verteilt mit n = N − 2 Freiheitsgraden. Das Testverfahren für die Nullhypothese kann dann folgendermassen formuliert werden: Nach Wahl eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.3 oder einem Computerprogramm den kritischen Wert tn,1− α2 bei einer zweiseitigen Fragestellung. Dann ziehen wir den statistischen Schluss: • Ist die Testgrösse |tReg | < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., es besteht keine signifikante Abhängigkeit zwischen x und y. • Ist die Testgrösse |tReg | ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt, d.h., es besteht eine signifikante Abhängigkeit. Beispiel 12.3.1. Die Abhängigkeit der stochastischen Variablen y von der Grösse x soll untersucht werden. Die folgenden Messwerte liegen vor. xi yi 0 9 1 8 3 7 4 5 5 5 6 3 7 3 8 1 Kann von einer signifikanten Abhängigkeit gesprochen werden? Wir wählen das Signifikanzniveau α = 0.001. Aus dem vorliegenden Datenmaterial berechnen wir vorerst die Regressionsgerade mit der Methode der kleinsten Quadrate y = −0.9595 x + 9.2027. 108 Kapitel 12. Regressionsanalyse Nun wollen wir mit der Regressionsanalyse überprüfen, ob a = −0.9595 eine signifikante Abhängigkeit darstellt. Dazu berechnen wir s2x = 7.9286 und s2y = 0.2973 und daraus die Testgrösse tReg = −13.1092, wobei N = 8 ist. Zum Signifikanzniveau 0.1% bestimmen wir aus Tafel T.3 oder einem Computerprogramm den kritischen Wert t6,0.9995 = 5.9587. Da |tReg | = 13.1092 ≥ t6,0.9995 = 5.9587 gilt, wird die Nullhypothese abgelehnt. D.h., x hat einen wesentlichen Einfluss auf y oder anders ausgedrückt, der Regressionskoeffizient a = −0.9595 ist signifikant von Nullverschieden. Beispiel 12.3.2 (Meeresspiegel in Venedig). Die folgende Messreihe zeigt den jährlichen maximalen Meeresspiegel1 [in cm] in Venedig für die Jahre von 1931 bis 1981. xi yi xi yi xi yi xi yi 1931 103 1944 106 1957 119 1970 123 1932 78 1945 105 1958 124 1971 122 1933 121 1946 136 1959 118 1972 120 1934 116 1947 126 1960 145 1973 114 1935 115 1948 132 1961 122 1974 96 1936 147 1949 104 1962 114 1975 125 1937 119 1950 117 1963 118 1976 124 1938 114 1951 151 1964 107 1977 120 1939 89 1952 116 1965 110 1978 132 1940 102 1953 107 1966 194 1979 166 1941 99 1954 112 1967 138 1980 134 1942 91 1955 97 1968 144 1981 138 1943 97 1956 95 1969 138 Ist die Zunahme des Meeresspiegels in Venedig über diese Periode signifikant? Das Signifikanzniveau sei 5%. Die Regressionsgerade lautet y = 0.57 x − 989.38. Mit der Regressionsanalyse überprüfen wir, ob die Steigung a = 0.57 signifikant von Nullverschieden ist. Dazu berechnen wir s2x = 221.00 und s2y = 346.70 und daraus die Testgrösse tReg = 3.20, wobei N = 51 ist. Zum Signifikanzniveau 5% bestimmen wir aus Tafel T.3 oder einem Computerprogramm den kritischen Wert t49,0.975 = 2.01. Da |tReg | = 3.20 ≥ t49,0.975 = 2.01 gilt, wird die Nullhypothese abgelehnt. Das heisst, der Anstieg des Meeresspiegels in Venedig in den Jahren 1931 bis 1981 ist real. Aufgaben Aufgabe 12.3.1. Die Abhängigkeit der stochastischen Variablen y von der Grösse x soll untersucht werden. Die folgenden Messwerte liegen vor. xi yi 1 1 2 1 5 4 8 3 10 6 Kann von einer signifikanten Abhängigkeit gesprochen werden? Das Signifikanzniveau ist 1%. Aufgabe 12.3.2. Die Abhängigkeit der stochastischen Variablen y von der Grösse x soll untersucht werden. Die folgenden Messwerte liegen vor. xi yi xi yi 1.1 2.0 4.6 0.8 1.2 1.9 5.1 0.8 1.4 1.8 6.3 0.7 1.6 1.8 7.8 0.6 1.7 1.7 8.3 0.5 1.9 1.7 9.4 0.4 2.0 1.6 10.3 0.3 2.3 1.5 10.5 0.2 2.7 1.5 10.7 0.2 2.8 1.4 11.0 0.1 2.9 1.3 11.6 0.4 3.3 1.2 11.9 0.1 3.8 1.1 12.0 0.0 4.0 0.9 12.6 -0.1 Kann von einer signifikanten Abhängigkeit gesprochen werden? Das Signifikanzniveau ist 1%. 1 Der aufmerksame Leser wird realisieren, dass der steigende Meeresspiegel nicht auf ein Ansteigen des Wassers in der Adria zurückzuführen ist, sondern auf das Sinken der Markierung an der der Meeresspiegel in Venedig abgelesen wird. 12.4. Regressionsanalyse zweier Geraden 12.4 109 Regressionsanalyse zweier Geraden In der Praxis kommt es oft vor, dass zwei Stichproben der Umfänge N1 und N2 mit den Messpunkten P11 (x11 , y11 ), . . . , P1N1 (x1N1 , y1N1 ) und P21 (x21 , y21 ), . . . , P2N2 (x2N2 , y2N2 ) gegeben sind. Daraus lassen sich mit der Methode der kleinsten Quadrate (vgl. Kapitel 12.2) zwei Regressionsgeraden y = a1 x + b1 und y = a2 x + b2 . berechnen. Es interessiert, ob die beiden Regressionsgeraden nur zufällig voneinander abweichen. y b b bc y = a2 x + b2 b b c b c b c b b b b b b bc bc bc y = a1 x + b1 bc b x Abbildung 12.4.i: Regressionsanalyse zweier Geraden. Unterscheiden sich die beiden Gereaden signifikant, d.h., sind die Steigungen oder die y-Achsenabschnitte verschieden? Prüfung der Regressionskoeffizienten Dazu stellen wir die alternativen Hypothesen auf. Ha,0 : a1 = a2 , d.h., gleiche Steigungen der beiden Regressionsgeraden. Ha,1 : a1 6= a2 , d.h., verschiedene Steigungen der beiden Regressionsgeraden. Zur Beantwortung dieser Fragestellung berechnen wir aus den zwei gegebenen Stichproben P11 (x11 , y11 ), . . ., P1N1 (x1N1 , y1N1 ) und P21 (x21 , y21 ), . . . , P2N2 (x2N2 , y2N2 ) die Grössen x̄1 = N1 1 X x1i N1 und i=1 x̄2 = N2 1 X x2i N2 i=1 und N s2x1 1 X 1 = (x1i − x̄1 )2 N1 − 1 N und s2x2 i=1 2 X 1 = (x2i − x̄2 )2 N2 − 1 (12.4.a) i=1 und N s2y1 1 X 1 = (y1i − (ax1i + b))2 N1 − 2 i=1 N und s2y2 2 X 1 = (y2i − (ax2i + b))2 (12.4.b) N2 − 2 i=1 110 Kapitel 12. Regressionsanalyse und damit s2a (N1 − 2)s2y1 + (N2 − 2)s2y2 = N1 + N2 − 4 1 1 + 2 (N1 − 1)sx1 (N2 − 1)s2x2 . Aus diesen Grössen entsteht dann schlussendlich die Testgrösse ta = a1 − a2 . sa (12.4.c) Die Testgrösse ta ist Student-t-verteilt mit n = N1 + N2 − 4 Freiheitsgraden. Nach Wahl eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.3 oder einem Computerprogramm den kritischen Wert tn,1− α2 bei einer zweiseitigen Fragestellung. Dann ziehen wir den statistischen Schluss: • Ist die Testgrösse |ta | < tn,1− α2 , dann wird die Nullhypothese Ha,0 angenommen, d.h., es besteht kein signifikanter Unterschied zwischen den Steigungen der beiden Regressionsgeraden. • Ist die Testgrösse |ta | ≥ tn,1− α2 , dann wird die Nullhypothese Ha,0 auf dem Signifikanzniveau α abgelehnt, d.h., die beiden Regressionsgeraden haben signifikant verschiedene Steigungen. Wird die Nullhypothese nicht abgelehhnt, so müssen wir zur Untersuchung der Gleichheit der beiden Regressionsgeraden auch noch die Regressionskonstanten auf einen signifikanten Unterschied hin untersuchen. Dies geschieht abermals mit einem statistischen Test und einer geeigneten Testgrösse. Prüfung der Regressionskonstanten Dazu stellen wir die alternativen Hypothesen auf. Hb,0 : b1 = b2 , d.h., gleiche y-Achsenabschnitte der beiden Regressionsgeraden. Hb,1 : b1 6= b2 , d.h., verschiedene y-Achsenabschnitte der beiden Regressionsgeraden. Zur Beantwortung dieser Fragestellung berechnen wir aus den Messpunkten die Grössen (vgl. Gleichungen (12.4.a) und (12.4.b)) s2x1 , s2x2 und s2y1 , s2y2 und s2b (N1 − 2)s2y1 + (N2 − 2)s2y2 = N1 + N2 − 4 x̄21 x̄22 1 1 + + + 2 2 (N1 − 1)sx1 (N2 − 1)sx2 N1 N2 . Aus diesen Grössen entsteht dann schlussendlich die Testgrösse tb = b1 − b2 . sb (12.4.d) Die Testgrösse tb ist Student-t-verteilt mit n = N1 + N2 − 4 Freiheitsgraden. Nach Wahl eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.3 oder einem Computerprogramm den kritischen Wert tn,1− α2 bei einer zweiseitigen Fragestellung. Dann ziehen wir den statistischen Schluss: 12.4. Regressionsanalyse zweier Geraden 111 • Ist die Testgrösse |tb | < tn,1− α2 , dann wird die Nullhypothese Hb,0 angenommen, d.h., es besteht kein signifikanter Unterschied zwischen den y-Achsenabschnitten der beiden Regressionsgeraden. • Ist die Testgrösse |tb | ≥ tn,1− α2 , dann wird die Nullhypothese Hb,0 auf dem Signifikanzniveau α abgelehnt, d.h., die beiden Regressionsgeraden haben signifikant verschiedene y-Achsenabschnitte. Haben wir beide Nullhypothesen Ha,0 und Hb,0 angenommen, so können wir davon ausgehen, dass sich die beiden Regressionsgeraden nur zufällig voneinander unterscheiden. Aufgaben Aufgabe 12.4.1. Es soll untersucht werden, ob die Steigungen und die y-Achsenabschnitte der beiden Ausgleichsgeraden, die durch das folgende Datenmaterial gegeben sind, signifikant voneinander verschieden sind. Das Signifikanzniveau ist 10%. x1i y1i 1 2 5 8 10 1 1 4 3 6 x2i y2i 3 4 5 6 7 8 1 1 1 7 6 7 Aufgabe 12.4.2. Es soll untersucht werden, ob die beiden Ausgleichsgeraden, die durch das folgende Datenmaterial gegeben sind, signifikant voneinander verschieden sind. Das Signifikanzniveau ist 5%. x1i y1i 1 2 5 8 10 12 14 18 1 1 4 3 6 9 8 13 x2i y2i 3 4 5 6 7 8 9 10 11 12 1 1 1 7 6 7 8 9 14 15 Aufgabe 12.4.3. Es soll untersucht werden, ob die beiden Ausgleichsgeraden, die durch das folgende Datenmaterial gegeben sind, signifikant voneinander verschieden sind. Das Signifikanzniveau ist 1%. x1i y1i x1i y1i 1.0 7.0 4.0 4.0 1.3 6.9 4.1 3.9 1.4 6.7 4.2 3.7 1.6 6.5 4.4 3.4 1.7 6.3 4.8 3.2 1.9 5.4 5.4 2.9 2.0 5.4 5.8 2.8 2.1 5.3 6.1 2.8 2.4 5.2 6.3 2.7 2.6 5.1 7.3 2.5 2.7 5.0 7.4 2.3 2.9 4.9 8.5 2.1 3.0 3.3 3.6 3.7 3.9 4.8 4.6 4.4 4.3 4.2 8.6 2.0 x2i y2i x2i y2i 1.4 10.0 3.3 5.1 1.4 9.4 3.5 4.7 1.5 9.3 3.6 4.2 1.6 9.4 3.7 3.7 1.7 8.6 3.9 3.4 1.8 8.5 4.2 2.8 1.9 8.4 4.6 2.5 2.0 8.2 4.8 2.1 2.1 8.1 4.9 1.8 2.3 7.9 5.0 1.6 2.5 7.5 5.1 1.3 2.6 7.0 5.7 1.0 2.6 6.9 5.8 0.5 2.7 6.3 6.0 0.0 2.7 6.2 6.7 -0.5 2.9 3.0 5.9 5.3 7.0 -1.0 112 Kapitel 12. Regressionsanalyse Kapitel 13 Zeitreihen Bei den Verfahren der mathematischen Statistik sind wir in den vorangegangenen Kapiteln meistens davon ausgegangen, dass die vorliegenden Stichprobenwerte x1 , . . . , xN unabhängig voneinander sind und dem gleichen Verteilungsgesetz gehorchen. Wir sagen, die Stichprobenwerte sind i.i.d1 . Diese Bedingungen können dann verletzt sein, wenn die Stichprobe aus zeitlich aufeinander folgenden Beobachtungen eines Merkmals besteht, d.h., wenn eine so genannte Zeitreihe vorliegt. Definition 13.0.1. Eine Zeitreihe ist eine zeitlich geordnete Folge (xt ) mit t = 1, 2, 3, . . . , N von Messwerten xt , die zur Zeit t aufgenommen wurden. Zeitreihen kommen in der Natur- und Ingenieurwissenschaften, der Ökonomie2 und Medizin vor. Sie werden in Form von Datensammlungen oder grafischen Darstellungen veröffentlicht. Wir geben einige Beispiele aus unterschiedlichen Anwendungsgebieten: • In einem meteorologischen Institut werden in regelmässigen Abständen die Lufttemperaturen (vgl. Abbildung 7.2.i), Niederschlagsmengen oder Windstärken gemessen. • In der Umweltforschung werden die täglichen Luftbelastungen durch Messung der Ozon-, Stickstoffdioxid- und Schwefeldioxidwerte untersucht. • Bei der maschinellen Herstellung eines Produktes werden die Masse eines Qualitätsmerkmals während des Produktionsprozesses in vorgegebenen Abständen kontrolliert. • Zur Überwachung der wirtschaftlichen Entwicklung eines Landes werden tägliche, monatliche, jährliche Daten von Preisen, Verkehrs- und Energieaufkommen, Sparguthaben, Zinsen, Aktienkurse (vgl. Abbildung 1.2.i) gesammelt und ausgewertet. • In der Medizin werden Fieberkurven von Patienten durch Messungen zu festgelegten Zeiten angefertigt. 1 i ndipendent and i dentically d istributed Der Wirtschafts-Nobelpreise 2003 ging an R. F. Engle (1942) und C. W. J. Granger (1932), die zu gleichen Teilen für ihre Forschungen zur Analyse ökonomischer Zeitreihen ausgezeichnet wurden. In der Begründung für die Vergabe heisst es, Engle und Granger hätten in den achtziger Jahren des zwanzigsten Jahrhunderts die Möglichkeiten zur statistischen Verarbeitung von Zeitreihen verbessert. Diese werden in der Wirtschaftswissenschaft als Abfolge von Daten in ihrer chronologischen Abfolge definiert. Engle habe dabei vor allem bahnbrechende Arbeiten zum besseren Umgang mit sich verändernden und prinzipiell schwankenden Zeitreihen etwa bei Aktienkursen geschaffen. Granger wurde für seine Arbeit an Zeitreihen mit stationären Daten ausgezeichnet, die nur wenig um einen vorgegebenen Wert schwanken. 2 113 114 Kapitel 13. Zeitreihen Bei der Beschreibung und Auswertung von Zeitreihen treten folgende Aufgabenstellungen auf: • Beschreiben der Zeitreihe durch grafische Darstellungen und durch charakteristische Kenngrössen, mit denen Aussagen über das mittlere Verhalten, über Abhängigkeit benachbarter Beobachtungen, über Periodizität gemacht werden können. • Kontrolle des zeitlichen Verlaufs (z.B. eines Produktionsprozesses), um Veränderungen frühzeitig zu erfassen und eventuell erforderliche Eingriffe vorzunehmen (Qualitätskontrolle). • Anpassung eines geeigneten mathematischen Modells an die Zeitreihe zur Erkennung von Gesetzmässigkeiten und Interpretation der Ergebnisse. • Prognosen des zukünftigen Verhaltens. Im Rahmen dieser kurzen Einführung können wir nur auf wenige Methoden der Zeitreihenanalysis eingehen. Für weiterführende Literatur über Zeitreihen verweise ich auf [4]. 13.1 Universelles Beispiel Um die nachfolgenden Verfahren besser zu verstehen, werden wir hier ein universelles Beispiel betrachten, das uns im ganzen Kapitel zur Illustration dienen wird. Beispiel 13.1.1 (Verkauf von australischem Rotwein). Der monatliche Verkauf von australischem Rotwein [in 1000 Liter] zwischen Januar 1980 und Dezember 1991 ist in untenstehender Tabelle erfasst. In diesem Fall besteht die Zeitreihe aus N = 144 Datenpunkte. Januar Februar März April Mai Juni Juli August September Oktober November Dezember 1980 464 675 703 887 1139 1077 1318 1260 1120 963 996 960 1981 530 883 894 1045 1199 1287 1565 1577 1076 918 1008 1063 1982 544 635 804 980 1018 1064 1404 1286 1104 999 996 1015 1983 615 722 832 977 1270 1437 1520 1708 1151 934 1159 1209 1984 699 830 996 1124 1458 1270 1753 2258 1208 1241 1265 1828 1985 809 997 1164 1205 1538 1513 1378 2083 1357 1536 1526 1376 1986 779 1005 1193 1522 1539 1546 2116 2326 1596 1356 1553 1613 1987 814 1150 1225 1691 1759 1754 2100 2062 2012 1897 1964 2186 1988 966 1549 1538 1612 2078 2137 2907 2249 1883 1739 1828 1868 1989 1138 1430 1809 1763 2200 2067 2503 2141 2103 1972 2181 2344 1990 970 1199 1718 1683 2025 2051 2439 2353 2230 1852 2147 2286 1991 1007 1665 1642 1525 1838 1892 2920 2572 2617 2047 2176 2313 Es scheint, dass der Verkauf über diese Zeitperiode einem Aufwärtstrend folgt. Weiter können wir ein saisonales Muster mit einem Peak im Juli und und einem kleinen Verkauf im Januar ausmachen. Um dieses Sachverhalt zu untersuchen, fertigen wir zunächst eine grafische Darstellung der Datenpunkte an (vgl. Abbildung 13.1.i). 13.2 Zerlegung einer Zeitreihe in Komponenten Aus dem universellen Beispiel 13.1.1 können wir bereits einige charakteristische Eigenschaften einer Zeitreihe erkennen, die bei der Zerlegung einer Zeitreihe in Komponenten berücksichtigt werden. 13.3. Schätzung und Elimination des Trends 115 Liter 3000 b b b b b b bb 1500 b b b b b 1000 b b b bbb b bb b b b b bb b 1980 b b b b b b bb bbb b b b b b 1982 b b b b b bb bb bb b b b bb b b b b b bb bb b bb b b b 2000 500 bb b 2500 b bb b b 1984 bbb b bb b b b bb b 1986 b bb b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b bb bb b b b b b b b b b 1988 1990 b b 1992 Abbildung 13.1.i: Der australische Rotweinverkauf zwischen Januar 1980 und Dezember 1991. Das additive Trend-Saison-Model ist durch xt = gt + st + εt , mit t ∈ {1, 2, 3, . . . , N } gegeben. Dabei bezeichnen: gt den Trend: eine langfristige systematische Änderung des mittleren Verlaufs der Zeitreihe, wachsend oder fallend in Abhängigkeit der Zeit t, im Spezialfall auch konstant. st die Saisonkomponente: eine regelmässige, zyklische Schwankung über das Jahr, die Woche, den Tag (allgemein die Saison) mit (meist) unbekannter Periode s. εt die zufällige Restkomponente: kurzfristige, zufällig um null schwankende Einflüsse oder Störungen. Ziel der Zeitreihenanalyse ist es, allein aus den Beobachtungswerten xt , die drei Trendkomponenten wenigstens näherungsweise zu schätzen. 13.3 Schätzung und Elimination des Trends Der Trend beschreibt die langfristige Entwicklung zeitlicher Verläufe. Für zukünftige Prognosen möchten wir daher den Trend wenigstens näherungsweise bestimmen. Nach Subtraktion der Trendkomponente gt , also nach der so genannten Trendbereinigung können die Werte xt − gt = st + εt besser untersucht werden. Es gibt eine Vielzahl von Verfahren zur Schätzung und Eliminatrion der Trendkomponente. Dabei wird die Trendkomponente stets als nichtzufällig angenommen. Nachfolgend behandeln wir zwei verschiedene Methoden zur Trendschätzung: Regression und gleitender Durchschnitt. Schätzung des Trends mit Regression Globale Trendmodelle sollen für den gesamten betrachteten Zeitbereich gültig sein. Sie eignen sich vor allem zur Schätzung einfacher, monotoner Trendfunktionen, deren Verlauf schon aus den Daten ersichtlich ist. Die Modellierung erfolgt in Form eines Regressionsansatzes. Wir unterscheiden zwei Fälle: 116 Kapitel 13. Zeitreihen 1. Linearer Trend: Falls der betrachtete Zeitraum nicht zu lang ist, wird bei vielen Modellen der Trend durch eine Gerade gt = at + b beschrieben. Die Parameter a und b der Trendgeraden (Regressionsgeraden) müssen mit Hilfe der Methode der kleinsten Quadrate aus den Daten der Zeitreihe (xt ) geschätzt werden (vgl. Kapitel 12.2). 2. Nichtlinearer Trend: Wird mit dem linearen Trendmodel kein gutes Resultat erziehlt, oder wenn offensichtlich ein nichtlinearer Trend ersichtlich ist, so wählen wir eine Trendfunktion gt eines anderen Funktionstyps. Zum Beispiel eine Polynomfunktion k-ten Grades gt = a0 + a1 t + · · · + ak tk mit den k + 1 unbekannten Parametern a0 , a1 , . . . , ak oder eine Exponentialfunktion gt = abt mit den beiden unbekannten Parametern a und b. Diese unbekannten Parameter werden nach der Methode der kleinsten Quadrate aus den Daten der Zeitreihe geschätzt (vgl. Analysis 4, Kapitel 20.2). Eine Trendbereinigung der Zeitreihe erfolgt durch Differenzenbildung der ursprünglichen und der geglätteten Werte der Zeitreihe, das heisst, wir bilden für jedes t den Wert xt − gt . Beispiel 13.3.1. Beim australischen Rotweinverkauf (vgl. Beispiel 13.1.1) drängt sich ein lineares Trendmodel auf. Wir schätzen also den Regressionskoeffizienten a und die Regressionskonstante b der Regressionsgeraden, die am besten zu den Daten des Weinverkaufs passt. Es ergibt sich die Trendkomponente gt = 9.402 t + 806.770 (vgl. Abbildung 13.3.i). Danach bereinigen wir die Zeitreihe vom Trend, indem wir für jedes Liter Liter 1500 3000 b b b 2500 b b 2000 b b bb 1500 b b b b b 1000 b b b bbb b bb bb 500 b b b b b b b b b b b b b bbb bb b b b b b b b b b bb b b b b b bbb bb bb bb b b b b bb b b b bb b b b b bb b bb b b b bb b mt b bb b b b b b b b b b b b b b b b b b b b b b b 1000 bb b b b b b b b 0 bb 1980 b b −500 b −1000 b bb 500 b b b b b b bb b b b b b b b b bb b b bb bbb b b b b b bb bb b b b b b b b b bb bbb 1982b b b b b b b b b b b bb 1984b b b b b b b b b b b bb b b b b bb b bb b b bbb b bb bb b bbb 1986 b bb b b b b b b b b b b bbb 1988 b b b b b b b b b b b b b 1990b b b b b bb b b b b b bb b b bb b b b 1992 bb b b b b −1500 1980 1982 1984 1986 1988 1990 1992 Abbildung 13.3.i: Der Trend beim australischen Rotweinverkauf zwischen Januar 1980 und Dezember 1991. Abbildung 13.3.ii: Der mit dem linearen Trend bereinigte australischen Rotweinverkauf. t ∈ {1, . . . , 144} die Differenz xt − gt = xt − (9.402 t + 806.770) bilden. In Abbildung 13.3.ii sehen wir den australischen Rotweinverkauf, der von einem linearen Trend bereinigt wurde. Es handelt sich dabei um nichts anderes als die Residuen der Regressionsrechnung. 13.3. Schätzung und Elimination des Trends 117 Schätzung des Trends mit gleitendem Durchschnitt – Moving Average Während wir im vorangegangenen Kapitel den Trend global über die gesamte Zeitreihe geschätzt haben, verfolgen wir nun das Anliegen, mit Hilfe von gleitenden Durchschnitten (Moving Averages) eine stückweise lokale Glättung der Zeitreihe durchzuführen. Hierbei wird in kleinen Zeitintervallen eine lokale Anpassung vorgenommen, indem jeder Beobachtungswert xt durch einen Wert x̄t , ein gewichtetes Mittel aus xt und benachbarten Werten von xt , ersetzt wird. Auf diese Weise können grosse unregelmässige Schwankungen der Zeitreihe ausgeglichen und die glatte Komponente kann approximiert werden. Definition 13.3.1. Das arithmetische Mittel der 2m + 1 Werte xt−m , . . . , xt , . . . , xt+m x̄t = m X 1 xt+i 2m + 1 i=−m für t ∈ {m + 1, . . . , N − m} heisst gleitender Durchschnitt der ungeraden Ordnung 2m + 1, mit m < N für den Wert xt einer Zeitreihe; und m−1 X 1 1 1 für t ∈ {m + 1, . . . , N − m} xt−m + xt+i + xt+m x̄t = 2m 2 2 i=−(m−1) heisst gleitender Durchschnitt der geraden Ordnung 2m, mit m < N für den Wert xt einer Zeitreihe. Die dadurch geglättete Zeitreihe x̄m+1 , . . . , x̄N −m besitzt nur noch N − 2m Werte, da an den Enden jeweils m Werte wegfallen. Es ist einleuchtend, dass die Glättung der Zeitreihe umso stärker ist, je mehr Werte jeweils zur Glättung herangezogen werden. Wenn die Periode s der Saisonkomponenete st bekannt ist, dann bietet sich ein gleitender Durchschnitt der Ordnung s an. Zum Beispiel ist bei Monatsdaten s = 12, also verwenden wir den gleitenden 12-Monats-Durchschnitt 1 1 1 x̄t = xt−6 + xt−5 + · · · + xt+5 + xt+6 , 12 2 2 bei Wochendaten den gleitenden Siebnerdurchschnitt 1 x̄t = (xt−3 + xt−2 + xt−1 + xt + xt+1 + xt+2 + xt+3 ) . 7 oder bei Quartalsdaten den gleitenden Viererdurchschnitt 1 1 1 x̄t = xt−2 + xt−1 + xt + xt+1 + xt+2 . 4 2 2 Eine Trendbereinigung der Zeitreihe erfolgt durch Differenzenbildung der ursprünglichen und der geglätteten Werte der Zeitreihe, das heisst, wir bilden für jedes t den Wert xt − x̄t . Beispiel 13.3.2. Beim australischen Rotweinverkauf (vgl. Beispiel 13.1.1) drängt sich ein gleitender 12-Monats-Durchschnitt zur Schätzung des Trends auf (vgl. Abbildung 13.3.iii). Danach bereinigen wir die Zeitreihe vom Trend, indem wir für jedes t ∈ {7, . . . , 138} die Differenz xt − x̄t bilden. Die sechs Randwerte auf beiden Seiten werden einfach weggelassen. In Abbildung 13.3.iv sehen wir den australischen Rotweinverkauf, der von einem gleitenden 12-Monats-Durchschnitt bereinigt wurde. 118 Kapitel 13. Zeitreihen Liter Liter 1500 3000 b 2000 1500 1000 b 1000 2500 b b 500 b bbb bbb bbb bbbbbbbbbbb bbb bbbbbbbbbb bbbbb bb bb bbbbbb bb bbbbbbbbbb bbb b bbbbbbbb bbbbbbbbbbbb bbb bbbbbbbbb bbbb bbbbbbbbbb bbbbbbbbbbbbbb bbbbbbbb 0 1980 bb b b b b bbb b b b bb b −500 b b b b bb b b b bbb bb b 1982 b b b b b b b b b b b bb b b b b b b b 1984 b b bb bb bb b bb b bb b b b bb bb b bbb bbb b bb 1986b b b b bb b bb b 1988 bb b b b bb b b b b b b b b b b b b bb b bb b bb bb b bb b b b 1990 1992 b b b −1000 500 −1500 1980 1982 1984 1986 1988 1990 1992 Abbildung 13.3.iii: Gleitender 12-MonatsDurchschnitt beim australischen Rotweinverkauf. Abbildung 13.3.iv: Trendbereinigte Zeitreihe mit der 12-Monats-Durchschnitt Methode. Aufgabe Aufgabe 13.3.1. Nachfolgende Tabelle zeigt die Bevölkerung in den USA [in 1000] zwischen 1790 und 2000, die alle zehn Jahre aufgenommen wurde. Quelle: www.census.gov 1790 1800 1810 1820 1830 1840 1850 1860 1870 1880 1890 3929 5308 7239 9638 12861 17063 23192 31443 38558 50189 62980 1990 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 76212 92228 106020 123200 132160 151330 179320 203300 226540 248710 281420 a. Bereinigen Sie diese Zeitreihe mit einer Regression von ihrer Trendkomponente. Wählen Sie das beste Model, d.h. polynomial, logarithmisch, exponentiel. b. Bereinigen Sie diese Zeitreihe mit einem gleitenden Durchschnitt der Ordnung 3 von ihrer Trendkomponente. 13.4 Schätzung und Elimination der Saisonkomponente Wir nehmen an, dass die Zeitreihe entweder keinen Trend aufweisst, oder mit einem der in Kapitel 13.3 beschriebenen Verfahren vom Trend bereinigt wurde. Zusätzlich gehen wir davon aus, dass die Saisonkomponente st eine konstante nicht zufällige Saisonfigur hat, d.h., die saisonalen Schwankungen in der trendbereinigten Zeitreihe sehen alle ungefähr gleich aus. Wir bezeichnen die trendbereinigte Zeitreihe wieder mit (xt ), so können wir eine Schätzung für die Saisonkomponente und damit eine saisonbereinigte Zeitreihe durch das folgende, so genannte Phasendurchschnittsverfahren erhalten. Dazu betrachten wir eine Zeitreihe mit Periode s und gehen davon aus, dass die Beobachtungswerte für m Perioden zur Verfügung stehen, d.h., es gilt N = m · s. Nun werden die arithmetischen Mittel m−1 1 X xk+i·s x̄k = m i=0 mit k ∈ {1, . . . , s} aller xt -Werte gebildet, die zur k-ten Saison gehören, zum Beispiel für den Februar (mit k = 2) das arithmetische Mittel aller m Februarwerte (vgl. untenstehende Tabelle und Abbildung 13.4.i). 13.4. Schätzung und Elimination der Saisonkomponente 119 Die Saisonkomponente st wird dann geschätzt durch den Saisonindex für t ∈ {1, . . . , s} s ¯ ŝt = x̄t − x̄ mit ¯= x̄ 1X x̄k (Gesamtmittel) s k=1 und für t > s durch periodische Fortsetzung ŝt = ŝt−s . Handelt es sich bei der Zeitreihe xt ¯ = 0. bereits um eine linear trendbereinigte Zeitreihe, dann ist natürlich das Gesamtmittel x̄ 3 Die Saisonbereinigte Zeitreihe ist durch xt − ŝt mit t ∈ {1, . . . , N } gegeben. Beispiel 13.4.1. Beim australischen Rotweinverkauf (vgl. Beispiel 13.3.1), den wir bereits linear trendbereinigt haben, bilden wir nun mit dem Phasendurchschnittsverfahren die 12 arithmetischen Durchschnittsweinverkäufe x̄k für jeden Monat k ∈ {1, . . . , 12} (vgl. letzte Spalte der Tabelle). 1980 1981 1982 1983 1984 1985 1986 -352 -399 -498 -540 -568 -571 -714 -151 -55 -416 -442 -447 -393 -498 -132 -54 -257 -341 -290 -235 -319 43 88 -90 -206 -172 -203 1 285 232 -61 78 153 120 8 214 311 -25 235 -44 86 6 445 580 306 309 429 -59 566 378 582 178 488 925 637 767 229 72 -13 -79 -135 -99 28 62 -96 -127 -305 -111 71 -222 86 -15 -140 -90 -96 52 -34 40 31 -130 -49 457 -108 16 Januar Februar März April Mai Juni Juli August September Oktober November Dezember 1987 -792 -465 -400 57 115 101 438 390 331 206 264 477 1988 1989 1990 1991 -753 -694 -974 -1050 -179 -411 -755 -402 -200 -41 -245 -434 -135 -97 -290 -560 322 331 43 -257 371 188 60 -212 1132 615 438 806 464 244 343 449 89 196 210 485 -64 56 -177 -95 15 255 109 25 46 409 238 152 x̄k -658.8 -384.4 -245.7 -130.4 114.1 107.5 500.5 487.1 109.5 -66.8 35.9 131.6 ¯=0 x̄ Danach bilden wir die periodisch fortgesetzte Saisonkomponente ŝt (vgl. Abbildung 13.4.i). Schlussendlich berechnen wir die trend- und saisonbereinigte Zeitreihe εt = xt − gt − ŝt mit t ∈ {1, . . . , 144}. Es bleibt nur noch die zufällige Restkomponente εt übrig (vgl. Abbildung 13.4.ii). Liter Liter 1500 1500 1000 1000 bb 500 cbbc bb b b b b 0 1980bb b −500 b b cbbc b c c c b c b bc bc cb bc bb c c bb c c b bb c c c c b c b c b 1982bcbc c b c b b bb c c c c b c b c b c b c b b c c b bb c c bb c c b bb c c c c b c b c b 1984bcbc c b c b b bb c c c c b c b c b c b c b b c c b bb c c bb c c b bb c c c c b c b c b 1986bcbc c b c b b bb c c c c b c b c b c b c b b c c b bb c c bb c c b bb c c c c b c b c b 1988bcbc c b c b b bb c c c c b c b c b c b c b b c c b bb c c b bb c c c c b c b c b 1990bcbc c b c b b cbbc 500 cbbc bc cb bc bc bc c b cb 1992 c b b b b b b b b b b b b b b b b bb b b b bb b b bb b bb b b bb b b b b bb b bb b b bb bb b b b b b b b b bb b bb b bbbb bb b b bbb bb b bb b b b bbbbb 0 b b bb b bbbb bb b b b b b b b b b b b b bb b bb b b b b b b b1984 b 1980 1982 bbb b b 1988 1990b b 1992 b1986 b b b b b b b b b b bb −500 b −1000 −1000 −1500 −1500 Abbildung 13.4.i: Durchschnittliches Saisonbild des (linear) trendbereinigten Rotweinverkaufs periodisch fortgesetzt. Abbildung 13.4.ii: Saison- und (linear) trendberinigter australischen Rotweinverkauf. 3 Die Zeitreihe xt sei schon trendbereinigt. 120 Kapitel 13. Zeitreihen Aufgabe Aufgabe 13.4.1. Die tödlichen Unfälle in den USA pro Monat in den Jahren 1973-1978, die in untenstehender Tabelle aufgeliestet sind, zeigen ein starkes saisonales Muster. Wir stellen ein Maximum für jedes Jahr im Juli fest und ein Minimum im Februar. Ein Trend ist kaum auszumachen. Bereinigen Sie diese Zeitreihe von ihrer Saisonkomponente. Januar Februar März April Mai Juni Juli August September Oktober November Dezember 13.5 1973 1974 1975 1976 1977 1978 9007 7750 8162 7717 7792 7836 8106 6981 7306 7461 6957 6892 8928 8038 8124 7776 7726 7791 9137 8422 7870 7925 8106 8129 10017 8714 9387 8634 8890 9115 10826 9512 9556 8945 9299 9434 11317 10120 10093 10078 10625 10484 10744 9823 9620 9179 9302 9827 9713 8743 8285 8037 8314 9110 9938 9129 8433 8488 8850 9070 9161 8710 8160 7874 8265 8633 8927 8680 8034 8647 8796 9240 Prognose Nun haben wir die ursprüngliche Zeitreihe xt = gt + st + εt mit t ∈ {1, . . . , N } in ihre additiven Komponenten zerlegt. Nach der Subtraktion der Trend- gt und der periodisch fortgesetzten Saisonkomponente ŝt bleibt nur noch die zufällige Restkomponente εt = xt −gt −st übrig. Diese sollte jetzt, wenn unser Modell gut gewählt wurde, keine Struktur mehr aufzeigen (vgl. Abbildung 13.4.ii). Nun könnte diese Restkomponente als Realisierung eines stochastischen Prozesses weiter untersucht werden. Zum Beispiel interessiert nun, ob die Restkomponente zufällig ist (vgl. Kapitel 7.2). Wir wollen uns hier mit der wichtigen Aufgabe der Prognose oder Vorhersage zukünftiger Beobachtungswerte der Zeitreihe (xt ) mit t ∈ {1, . . . , N } für die Zeitpunkte t ∈ {N, N +1, N + 2, . . .} auseinander setzen. So möchten wir z.B. meteorologische, hydrologische oder Umweltdaten, Produktions- oder andere ökonomische Daten über den beobachteten Zeitraum hinaus prognostizieren. Dazu dienen Prognoseverfahren. Bei diesen gehen wir davon aus, dass sich die vorliegende Zeitreihe in naher Zukunft wie in der Vergangenheit verhalten wird. Dass dies nicht so sein muss, zeigt der Aktienkurs der Vodafone Group deutlich (vgl. Abbildung 1.2.i). Also Achtung! Vorhersagen sind im besten Fall nur kurzfristig verantwortbar. Definition 13.5.1. Eine Prognose oder Vorhersage ist eine von der Zeitreihe (xt ) abhängige Schätzung des Wertes xN +h , wobei h ≥ 1, die so genannte h-Schritt-Prognose. Um den Wert xN +h zu schätzen, benutzen wir unser Modell und setzen4 x̂N +h = gN +h + ŝN +h , 4 Das Symbol ˆ soll andeuten, dass es sich bei x̂N+h um einen Schätzwert von xN+h handelt. 13.5. Prognose 121 wobei gN +h die Regressionsfunktion des Trends und ŝN +h die periodisch fortgesetzte Saisonkomponente der Zeitreihe (xt ) an der Stelle t = N + h bezeichnet. Die zufällige Restkomponente ignorieren wir bei diesem einfachen Modell, da sie sich im Mittel ungefähr aufhebt. Beispiel 13.5.1. Beim australischen Rotweinverkauf (vgl. Beispiel 13.3.1) haben wir die Trend- und Saisonkomponente bestimmt. Nun können wir diese beiden extrapolieren, dies in der Annahme, dass der australische Wein auf dem Weltmarkt in Zukunft der gleichen Nachfrage ausgesetzt ist, wie in der Vergangenheit. Wir erhalten die folgenden prognostizierten Weinmengen [in 1000 Liter] für das Jahr 1992: Jan. 92 Feb. 92 Mrz. 92 Apr. 92 Mai 92 Jun. 92 Jul. 92 Aug. 92 Sep. 92 Okt. 92 Nov. 92 Dez. 92 x̂144+1 x̂144+2 x̂144+3 x̂144+4 x̂144+5 x̂144+6 x̂144+7 x̂144+8 x̂144+9 x̂144+10 x̂144+11 x̂144+12 1511 1795 1943 2068 2322 2325 2727 2723 2355 2188 2300 2405 Es sei an dieser Stelle noch einmal ausdrücklich darauf hingewiesen, dass Prognosen für die Zukunft mit sehr grosser Vorsicht zu geniessen sind. Im besten Fall sind Prognosen für die nahe Gegenwart zu vertreten. Die Fehlerbalken der prognostizierten Werte wachsen mit zunehmender Zeit h exponentiel an. Liter b b b b bb 1500 b b b b b 1000 b b b bbb b bb bb b 1980 b b b b b b b b b b b b b b bb bbb b b b 1982 b b b b b b bb b b b b b 1984 b b bbb b bb bb bb b b b b bb bb b bb b b b 2000 500 bb b 2500 b bb b bb b b b 1986 b bb b b b b b b b b b b b bb b b b b b b b b b b b b b b b b b bb b b b b b bb b b b b 1988 1990 Prognose 3000 b b 1992 1993 Abbildung 13.5.i: Das mit einer Trend- und einer Saisonkomponente angepasste Modell (grau) des australischen Rotweinverkaufs zwischen Januar 1980 und Dezember 1991 und die Prognose für das Jahr 1992. Aufgabe Aufgabe 13.5.1. Die Zeitreihe der Anzahl internationaler Flugpassagiere für jeden Monat zwischen Januar 1949 und Dezember 1960 sind in unten stehender Tabelle aufgelistet. 122 Kapitel 13. Zeitreihen Januar Februar März April Mai Juni Juli August September Oktober November Dezember 1949 47185 47707 48828 48598 47958 49053 49972 49972 49127 47791 46444 47707 1950 47449 48363 49488 49053 48283 50039 51358 51358 50626 48903 47362 49416 1951 49767 50106 51818 50938 51475 51818 52933 52933 52149 50876 49836 51120 1952 51417 51930 52627 51985 52095 53845 54381 54889 53423 52523 51475 52679 1953 52781 52781 54638 54596 54337 54931 55759 56058 54681 53519 51930 53033 1954 53181 52364 54596 54250 54553 55759 57104 56802 55568 54337 53132 54337 1955 54889 54510 55872 55947 55984 57526 58972 58493 57430 56131 54681 56276 1956 56490 56240 57589 57462 57621 59243 60234 60039 58721 57236 56021 57236 1957 57526 57071 58749 58522 58721 60450 61420 61463 60014 58493 57203 58171 1958 58289 57621 58916 58522 58944 60753 61964 62246 60014 58833 57366 58201 1959 58861 58348 60064 59814 60403 61570 63063 63261 61377 60088 58916 60039 1960 60331 59687 60379 61334 61570 62823 64329 64069 62305 61334 59661 60684 Führen Sie eine Trend- und Saisonbereinigung der Daten von 1949 bis 1959 durch. Vergleichen Sie dann die daraus resultierende Prognose für das Jahr 1960 mit der Wirklichkeit. 13.6 Ein-Schritt-Prognose bei bereinigten Zeitreihen Eine wichtige Rolle vor allem bei kurzfristigen Prognosen spielt das exponentielle Glätten. Ausgehend von der trend- und saisonfreien Zeitreihe (xt ) mit t = 1, 2, 3, . . . , N erhalten wir die so genannte Ein-Schritt-Prognose x̂N +1 = β N −2 X t=0 (1 − β)t xN −t + (1 − β)N −1 x1 = βxN + β(1 − β)xN −1 + · · · + β(1 − β)N −2 x2 + (1 − β)N −1 x1 , wobei die Konstante β mit 0 < β < 1 den Glättungsfaktor bezeichnet. Beachten Sie, dass sich alle Gewichte zu Eins summieren5 β N −2 X t=0 (1 − β)t + (1 − β)N −1 = β 1 − (1 − β)N −1 + (1 − β)N −1 = 1. 1 − (1 − β) Die Prognose zur Zeit t = N + 1 ergibt sich also aus dem letzten Wert xN und allen vorangegangenen Beobachtungswerten. Dabei bestimmt der Glättungsfaktor den Einfluss zurückliegender Werte auf die Ein-Schritt-Prognose x̂N +1 . Je kleiner β ist, umso mehr Werte der Zeitreihe werden zur Prognose herangezogen. Wir diskutieren kurz die Bedeutung des Glättungsfaktors β für die Prognose, die Reaktion auf irreguläre Schwankungen und den Einfluss der Zeitreihenwerte. Glättungseffekt der Vorhersage Reaktion auf irreguläre Schwankungen Berücksichtigung neuer Zeitreihenwerte Berücksichtigung älterer Zeitreihenwerte β klein gross klein schwach stark β gross klein gross stark schwach Je näher β bei 1 liegt auf ein desto kürzeres Gedächtnis basiert die Prognose. In der Praxis wird häufig ein β-Wert zwischen 0.1 und 0.3 gewählt. In diesem Fall sind auch weiter zurückliegende Zeitreihenwerte für die Prognose bedeutsam. Die Verwendung von Computerprogrammen erlaubt es, durch probieren ein geeignetes β zu finden. 5 Wir benutzen die Summenformel für eine endliche geometrische Reihe, d.h. Pn t=0 qn = 1−q n+1 . 1−q 13.6. Ein-Schritt-Prognose bei bereinigten Zeitreihen 123 Aufgabe Aufgabe 13.6.1. Eine mittelgrosse Autogarage mit einer Markenvertretung machte im letzten Jahr von April bis März den folgenden Umsatz [in SFr]. Apr. Mai Jun. Jul. Aug. Sep. Okt. Nov. Dez. Jan. Feb. Mrz. 70000 53000 87000 80000 81000 82000 71000 69000 87000 78000 65000 68000 Berechnen Sie die Ein-Schritt-Prognose für den Monat April. Wählen Sie dabei β zwischen 0.1 und 0.3. Beachten Sie, dass die Zeitreihe keinen offensichtlichen Trend oder offensichtliches Saisonmuster zeigt. 124 Kapitel 13. Zeitreihen Kapitel 14 Fehlerquellen bei statistischen Untersuchungen Im Folgenden möchten wir einige Fehlerquellen bei statistischen Untersuchungen aufzeigen. Fehler bei der Gewinnung des statistischen Materials • Ungenaue und beschönigende Auskünfte, zum Beispiel Befragung der Arbeiter nach den Produktionsaussichten, Befragung von Kindern nach der Regelmässigkeit des Zähneputzens. • Erhebung an verschiedenartigem Material, zum Beispiel Messungen physikalischer Einflüsse an frisch geschäumten Polysterol, ohne Berücksichtigung, dass dieser Kunststoff von einem Versuchstag zum nächsten reagiert. • Unhomogenes Material, zum Beispiel eine Statistik der Dehnfähigkeit von Kunststofffolien, bei der PVC-Folien verschiedener Herstellungsart zu einer Gesamtheit zusammengefasst wurde, ist wertlos. • Änderung der Methode von einer Erhebung zur anderen. Zum Beispiel: je feiner die Untersuchungsmethoden werden, desto häufiger wird eine Ab- oder Zunahme irgend einer phsikalischen Grösse beobachtet. Der Schluss auf einen wirklichen Qualitätsabfall ist falsch. • Systematische Messfehler, erzeugt durch fehlerhafte Messungen. Zum Beispiel: Welche Ausbeute bei einer Synthese wirklich resultiert, kann oft nicht genau ermittelt werden, weil ein Teil einer Flüssigkeit verdunstet oder weil eine Restmenge nicht mehr nachgewiesen werden kann. Der Fehler besitzt immer das gleiche Vorzeichen. • Extrem gelagerte Einzelwerte, die den Mittelwert so stark beeinflussen, dass dieser für die Grundgesamtheit nicht mehr typisch ist, z.B. Berechnung des Durchschnittsvermögen der Bewohner einer kleinen Landgemeinde, das sich infolge des Zuzugs eines Millionärs plötzlich vervielfacht. 125 126 Kapitel 14. Fehlerquellen bei statistischen Untersuchungen Nicht alle Grössen eignen sich für statistische Auswertungen Gewisse Messwerte haben nur eine Bedeutung in Bezug auf eine andere Grösse, zum Beispiel die abzuführende Wärmemenge, d.h. der Kühlwasserbedarf einer exothermen Reaktion muss in ein Verhältnis zur Grösse des Ansatzes gebracht werden. Falsche Deutung von statistischen Masszahlen • Die prozentuale Zu- oder Abnahme kann zweideutig sein. Zum Beispiel: Hat sich etwa die Häufigkeit eines Verkaufs verdoppelt, so kann dies als 100%ige oder 50%ige Zunahme gedeutet werden, je nachdem, ob die frühere oder die spätere Häufigkeit als 100% angenommen wird. • Verschieden definierte Lageparameter können wesentlich voneinander abweichen. Zum Beispiel: Bei gleicher Einkommensstatistik kann das durchschnittliche Einkommen mit 4000 SFr., 6000 SFr. oder 10000 SFr. angegeben werden, ohne dass ein Fehler begangen wird. Einmal wurde der Modus1 , das zweite Mal der Median und das dritte Mal das arithmetische Mittel angegeben. • Ein Lageparameter ohne Varianzangabe gibt ein falsches Bild. Zum Beispiel: Seit der ” Einführung eines Stabilisators hat sich die Qualität unserer Produkte um durchschnittlich drei Punkte gehoben.” Der wahre Sachverhalt ist aber: nur bei 12 von 100 Produkten ist die Qualität überhaupt gehoben worden, um je 25 Punkte, bei allen anderen hatte das Mittel keinen Einfluss. Vortäuschen nicht vorhandener Genauigkeit Zum Beispiel: als Mittelwert der drei Messwerte 13.2, 15.8 und 14.7 wird 14.5667 angegeben. Korrekter und ehrlicher wäre 14.6. Falsche Vergleiche Zum Beispiel: Die amerikanische Marine verlor während des spanisch-amerikanischen Krieges 9 von 1000 Soldaten. In der gleichen Zeitperiode war das Sterbeverhältnis in New York 16 auf 1000. Der naheliegenden Schluss, es sei weniger gefährlich gewesen, in der Marine zu dienen als in New York zu leben, ist falsch. In der Marine kamen nämlich nur junge und gesunde Männer ums leben, in New York aber starben vorwiegend alte und kranke Leute. Falsche Vergleiche • Unfug mit Prozentzahlen. Zum Beispiel: In dieser Versuchsrerihe lagen 60% aller Mess” werte über dem Durchschnitt.” Bei einer Nachfrage stellte sich heraus, dass es drei von fünf Werten waren • Vergleiche zweier Mittelwerte ohne Angabe der Signifikanz. Zum Beispiel: Die Verkaufs” zahlen in der Westschweiz sind vom März bis April wesentlich angestiegen.” Die Zahlen aus denen dieser Schluss fälschlicherweise gezogen wurde, lauten: Im Januar sechs, im Februar vier, im März drei und im April fünf Stück mehr verkauft. 1 häufigster vorkommender Wert 127 • Änderung der relativen Häufigkeit ohne Angabe der Signifikanz. Zum Beispiel: Bei einer ” in der Nähe einer neu erstellten Kunststofffabrik weidenden Kuhherde änderte sich das Geschlechtsverhältnis der Geburten.” Dieser unbegründete Schluss wurde gezogen, weil auf 12 Kälber 8 männliche und 4 weibliche entfiehlen. • Falscher Schluss auf die Gestalt einer Verteilungskurve. Zum Beispiel: An 10 Sportlern gleichen Alters wird der Puls nach einer Stunde Fahrradfahren gemessen. Das Histogramm ist zweigipflig. Daraus wird zu unrecht der Schluss gezogen, es gäbe zwei Populationen. Auswahleffekte durch nichtrepräsentative Stichproben • Als Folge mangelnder Beobachtungsmöglichkeit. Zum Beispiel: Eine regionale Kunststoffherstellungs-, Verarbeitungs- und Verbrauchsstatistik leidet fast immer daran, dass nur wenige Firmen ihre tatsächlichen Zahlen zur Verfügung stellen. • als folge unbewusster Auswahl • als Folge nicht zufälliger Auswahl der Stichprobe. Zum Beispiel: Die Produktion einer Fabrik für Massengüter soll einer Kontrolle unterworfen werden. Die Stichprobe darf nicht bloss aus den Erzeugnissen der gleichen Arbeitsstunde bestehen. • als Folge nur teilweise beantworteter Fragebogen • Als Folge einer nicht ganz eindeutigen Schichtung der Stichprobe. Zum Beispiel: Die zu beurteilenden Personen werden in Selbstständig- und Unselbstständigerwerbende eingeteilt. Es gibt aber viele, deren Einteilung unklar ist, etwa bei einem Künstler, der zum Nebenerwerb Büroarbeit leistet. Falsche Anwendung eines Tests • Mathematische Voraussetzungen sind nicht erfüllt. Zum Beispiel: Anwendung eines Student-t-Tests bei nicht normalverteilter Grundgesamtheit. • Rechenfehler Irrtum bei Anwendung eines richtigen Tests Zum Beispiel: Wird 5% Irrtumswahrscheinlichkeit angenommen, so wird im Mittel bei 5 von 100 statistischen Schlüssen falsch geschlossen. Falsche Extrapolation Zum Beispiel: Die Entwicklung des Weltrekordes auf der Marathondistanz bei den Frauen und den Männern im Artikel aus Der Spiegel (vgl. Kapitel 1.3). Dabei wurde von den Autoren des Artikels ohne einsichtigen Grund angenommen, dass sich Weltrekorde linear verbessern. Dies ist aber unmöglich, da dem Menschen physikalische Grenzen gesetzt sind. 128 Kapitel 14. Fehlerquellen bei statistischen Untersuchungen Weitere Lektüre Dem interessierten Leser empfehle ich das Buch “So lügt man mit Statistik” von W. Krämer (vgl. [10]). Hier eine Kurzbeschreibung:2 Dieses Buch, sachkundig und humorvoll, ist hilfreich für alle, die mit Statistik zu tun haben – sei es beruflich oder als Zeitungsleser. Es zeigt, wo Vorsicht von Nöten ist. Es stellt dubiose Praktiken bei der grafischen Aufbereitung von Daten bloss, entlarvt die Illusion der Präzision, führt vorsortierte Stichproben, naive Trends und gefälschte Tests vor, deckt synthetische Superlative und manipulierte Mittelwerte auf, sieht statistischen Falschmünzern bei Basismanipulationen zu. Vorkenntnisse sind nicht erforderlich: Die vier Grundrechenarten und eine gewisse Skepsis gegenüber Datenhändlern aller Art genügen. Oder das Buch “Der Hund, der Eier legt” von H.-P. Beck-Bornholdt und H.-H Dubben (vgl. [1]). Hier eine Kurzbeschreibung:2 Mit Statistik lässt sich fast alles beweisen - das ist eine Binsenwahrheit. Und doch vertrauen wir bereitwillig jeder neuen Studie, die Wissenschaftler und Journalisten verbreiten. Glauben Sie gar nichts!“ ist dagegen das Credo der Autoren, die mit ” bissigem Humor das gesunde Misstrauen stärken. 2 www.amazon.de Tafeln T.1 T.2 T.3 T.4 T.5 T.6 T.7 T.8 T.9 T.10 T.11 T.12 T.13 T.14 T.15 T.16 T.17 T.18 T.19 Verteilungsfunktion Φ(z, 0, 1) der standardisierten Normalverteilung Quantile zq der standardisierten Normalverteilung . . . . . . . . . . Quantile tn,q der Student-t-Verteilung mit n Freiheitsgraden . . . . . Quantile χ2n,q (unten) der χ2 -Verteilung mit n Freiheitsgraden . . . . Quantile χ2n,q (oben) der χ2 -Verteilung mit n Freiheitsgraden . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . . Quantile gk,n,q des Cochran-Tests . . . . . . . . . . . . . . . . . . . . Quantile kn,q des Vorzeichentests . . . . . . . . . . . . . . . . . . . . Quantile rm,q des Runtests . . . . . . . . . . . . . . . . . . . . . . . . Quantile DN,1−α des Lilliefors-Test auf Normalverteilung . . . . . . . Quantile GN,1−α des Ausreissertests nach Grubbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 Die nachfolgenden Tafeln, ausser Tafel T.18, wurden alle mit Hilfe von Excel berechnet. Aufgabe Aufgabe T.1. Fertigen Sie selber mit Hilfe eines Computerprogrammes (z.B. Excel) die nachfolgenden Tafeln an, ausser Tafel T.18. 129 130 Tafeln ϕ(z, 0, 1) ϕ(z, 0, 1) Φ(z, 0, 1) 0 q z z 0 1−q zq z Tabelle T.1: Verteilung Φ(z, 0, 1) der standardisierten Normalverteilung N (0, 1) z 0.0 0.1 0.2 0.3 0.4 0.00 0.5000 0.5398 0.5793 0.6179 0.6554 0.01 0.5040 0.5438 0.5832 0.6217 0.6591 0.02 0.5080 0.5478 0.5871 0.6255 0.6628 0.03 0.5120 0.5517 0.5910 0.6293 0.6664 0.04 0.5160 0.5557 0.5948 0.6331 0.6700 0.05 0.5199 0.5596 0.5987 0.6368 0.6736 0.06 0.5239 0.5636 0.6026 0.6406 0.6772 0.07 0.5279 0.5675 0.6064 0.6443 0.6808 0.08 0.5319 0.5714 0.6103 0.6480 0.6844 0.09 0.5359 0.5753 0.6141 0.6517 0.6879 0.5 0.6 0.7 0.8 0.9 0.6915 0.7257 0.7580 0.7881 0.8159 0.6950 0.7291 0.7611 0.7910 0.8186 0.6985 0.7324 0.7642 0.7939 0.8212 0.7019 0.7357 0.7673 0.7967 0.8238 0.7054 0.7389 0.7704 0.7995 0.8264 0.7088 0.7422 0.7734 0.8023 0.8289 0.7123 0.7454 0.7764 0.8051 0.8315 0.7157 0.7486 0.7794 0.8078 0.8340 0.7190 0.7517 0.7823 0.8106 0.8365 0.7224 0.7549 0.7852 0.8133 0.8389 1.0 1.1 1.2 1.3 1.4 0.8413 0.8643 0.8849 0.9032 0.9192 0.8438 0.8665 0.8869 0.9049 0.9207 0.8461 0.8686 0.8888 0.9066 0.9222 0.8485 0.8708 0.8907 0.9082 0.9236 0.8508 0.8729 0.8925 0.9099 0.9251 0.8531 0.8749 0.8944 0.9115 0.9265 0.8554 0.8770 0.8962 0.9131 0.9279 0.8577 0.8790 0.8980 0.9147 0.9292 0.8599 0.8810 0.8997 0.9162 0.9306 0.8621 0.8830 0.9015 0.9177 0.9319 1.5 1.6 1.7 1.8 1.9 0.9332 0.9452 0.9554 0.9641 0.9713 0.9345 0.9463 0.9564 0.9649 0.9719 0.9357 0.9474 0.9573 0.9656 0.9726 0.9370 0.9484 0.9582 0.9664 0.9732 0.9382 0.9495 0.9591 0.9671 0.9738 0.9394 0.9505 0.9599 0.9678 0.9744 0.9406 0.9515 0.9608 0.9686 0.9750 0.9418 0.9525 0.9616 0.9693 0.9756 0.9429 0.9535 0.9625 0.9699 0.9761 0.9441 0.9545 0.9633 0.9706 0.9767 2.0 2.1 2.2 2.3 2.4 0.9772 0.9821 0.9861 0.9893 0.9918 0.9778 0.9826 0.9864 0.9896 0.9920 0.9783 0.9830 0.9868 0.9898 0.9922 0.9788 0.9834 0.9871 0.9901 0.9925 0.9793 0.9838 0.9875 0.9904 0.9927 0.9798 0.9842 0.9878 0.9906 0.9929 0.9803 0.9846 0.9881 0.9909 0.9931 0.9808 0.9850 0.9884 0.9911 0.9932 0.9812 0.9854 0.9887 0.9913 0.9934 0.9817 0.9857 0.9890 0.9916 0.9936 2.5 2.6 2.7 2.8 2.9 0.9938 0.9953 0.9965 0.9974 0.9981 0.9940 0.9955 0.9966 0.9975 0.9982 0.9941 0.9956 0.9967 0.9976 0.9982 0.9943 0.9957 0.9968 0.9977 0.9983 0.9945 0.9959 0.9969 0.9977 0.9984 0.9946 0.9960 0.9970 0.9978 0.9984 0.9948 0.9961 0.9971 0.9979 0.9985 0.9949 0.9962 0.9972 0.9979 0.9985 0.9951 0.9963 0.9973 0.9980 0.9986 0.9952 0.9964 0.9974 0.9981 0.9986 3.0 3.1 3.2 3.3 3.4 0.9987 0.9990 0.9993 0.9995 0.9997 0.9987 0.9991 0.9993 0.9995 0.9997 0.9987 0.9991 0.9994 0.9995 0.9997 0.9988 0.9991 0.9994 0.9996 0.9997 0.9988 0.9992 0.9994 0.9996 0.9997 0.9989 0.9992 0.9994 0.9996 0.9997 0.9989 0.9992 0.9994 0.9996 0.9997 0.9989 0.9992 0.9995 0.9996 0.9997 0.9990 0.9993 0.9995 0.9996 0.9997 0.9990 0.9993 0.9995 0.9997 0.9998 3.5 3.6 3.7 3.8 3.9 0.9998 0.9998 0.9999 0.9999 1.0000 0.9998 0.9998 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 0.9998 0.9999 0.9999 0.9999 1.0000 Tabelle T.2: Das q-Quantil zq der standardisierten Normalverteilung N (0, 1). Es gilt z1−q = −zq . q zq 0.9000 1.28155 0.9500 1.64485 0.9750 1.95996 0.9900 2.32634 0.9950 2.57583 0.9990 3.09024 0.9995 3.29048 Tafeln 131 fn (t) q 1−q 0 tn,q t Tabelle T.3: q-Quantile tn,q der Student-t-Verteilung mit n Freiheitsgraden. Da die Dichte symmetrisch ist, gilt tn,1−q = −tn,q . n 1 2 3 4 5 6 7 8 9 0.9000 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 0.9500 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 0.9750 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 q 0.9900 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 0.9950 63.656 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 0.9990 318.289 22.328 10.214 7.173 5.894 5.208 4.785 4.501 4.297 0.9995 636.578 31.600 12.924 8.610 6.869 5.959 5.408 5.041 4.781 n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 4.144 4.025 3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.965 3.922 3.883 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 3.408 3.396 3.850 3.819 3.792 3.768 3.745 3.725 3.707 3.689 3.674 3.660 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 1.310 1.303 1.299 1.296 1.294 1.292 1.291 1.697 1.684 1.676 1.671 1.667 1.664 1.662 2.042 2.021 2.009 2.000 1.994 1.990 1.987 2.457 2.423 2.403 2.390 2.381 2.374 2.368 2.750 2.704 2.678 2.660 2.648 2.639 2.632 3.385 3.307 3.261 3.232 3.211 3.195 3.183 3.646 3.551 3.496 3.460 3.435 3.416 3.402 30 40 50 60 70 80 90 100 150 200 300 400 500 600 800 1000 1.290 1.287 1.286 1.284 1.284 1.283 1.283 1.283 1.282 1.660 1.655 1.653 1.650 1.649 1.648 1.647 1.647 1.646 1.984 1.976 1.972 1.968 1.966 1.965 1.964 1.963 1.962 2.364 2.351 2.345 2.339 2.336 2.334 2.333 2.331 2.330 2.626 2.609 2.601 2.592 2.588 2.586 2.584 2.582 2.581 3.174 3.145 3.131 3.118 3.111 3.107 3.104 3.100 3.098 3.390 3.357 3.340 3.323 3.315 3.310 3.307 3.303 3.300 100 150 200 300 400 500 600 800 1000 ∞ 1.282 1.645 1.960 2.326 2.576 3.090 3.291 ∞ 132 Tafeln fn (x) 1−q q x χ2n,q Tabelle T.4: q-Quantile χ2n,q der χ2 -Verteilung mit n Freiheitsgraden n 1 2 3 4 5 6 7 8 9 0.005 0.000 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 0.010 0.000 0.020 0.115 0.297 0.554 0.872 1.239 1.647 2.088 0.025 0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 q 0.050 0.004 0.103 0.352 0.711 1.145 1.635 2.167 2.733 3.325 0.100 0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 0.250 0.102 0.575 1.213 1.923 2.675 3.455 4.255 5.071 5.899 0.500 0.455 1.386 2.366 3.357 4.351 5.348 6.346 7.344 8.343 n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 4.865 5.578 6.304 7.041 7.790 8.547 9.312 10.085 10.865 11.651 6.737 7.584 8.438 9.299 10.165 11.037 11.912 12.792 13.675 14.562 9.342 10.341 11.340 12.340 13.339 14.339 15.338 16.338 17.338 18.338 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.878 13.565 14.256 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 15.452 16.344 17.240 18.137 19.037 19.939 20.843 21.749 22.657 23.567 19.337 20.337 21.337 22.337 23.337 24.337 25.336 26.336 27.336 28.336 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 13.787 14.458 15.134 15.815 16.501 17.192 17.887 18.586 19.289 19.996 14.953 15.655 16.362 17.073 17.789 18.509 19.233 19.960 20.691 21.426 16.791 17.539 18.291 19.047 19.806 20.569 21.336 22.106 22.878 23.654 18.493 19.281 20.072 20.867 21.664 22.465 23.269 24.075 24.884 25.695 20.599 21.434 22.271 23.110 23.952 24.797 25.643 26.492 27.343 28.196 24.478 25.390 26.304 27.219 28.136 29.054 29.973 30.893 31.815 32.737 29.336 30.336 31.336 32.336 33.336 34.336 35.336 36.336 37.335 38.335 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80 90 100 20.707 27.991 35.534 43.275 51.172 59.196 67.328 22.164 29.707 37.485 45.442 53.540 61.754 70.065 24.433 32.357 40.482 48.758 57.153 65.647 74.222 26.509 34.764 43.188 51.739 60.391 69.126 77.929 29.051 37.689 46.459 55.329 64.278 73.291 82.358 33.660 42.942 52.294 61.698 71.145 80.625 90.133 39.335 49.335 59.335 69.334 79.334 89.334 99.334 40 50 60 70 80 90 100 Tafeln 133 fn (x) q 1−q χ2n,q x Tabelle T.5: q-Quantile χ2n,q der χ2 -Verteilung mit n Freiheitsgraden n 1 2 3 4 5 6 7 8 9 0.750 1.323 2.773 4.108 5.385 6.626 7.841 9.037 10.219 11.389 0.900 2.706 4.605 6.251 7.779 9.236 10.645 12.017 13.362 14.684 0.950 3.841 5.991 7.815 9.488 11.070 12.592 14.067 15.507 16.919 q 0.975 5.024 7.378 9.348 11.143 12.832 14.449 16.013 17.535 19.023 0.990 6.635 9.210 11.345 13.277 15.086 16.812 18.475 20.090 21.666 0.995 7.879 10.597 12.838 14.860 16.750 18.548 20.278 21.955 23.589 0.999 10.827 13.815 16.266 18.466 20.515 22.457 24.321 26.124 27.877 n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 12.549 13.701 14.845 15.984 17.117 18.245 19.369 20.489 21.605 22.718 15.987 17.275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 18.307 19.675 21.026 22.362 23.685 24.996 26.296 27.587 28.869 30.144 20.483 21.920 23.337 24.736 26.119 27.488 28.845 30.191 31.526 32.852 23.209 24.725 26.217 27.688 29.141 30.578 32.000 33.409 34.805 36.191 25.188 26.757 28.300 29.819 31.319 32.801 34.267 35.718 37.156 38.582 29.588 31.264 32.909 34.527 36.124 37.698 39.252 40.791 42.312 43.819 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 23.828 24.935 26.039 27.141 28.241 29.339 30.435 31.528 32.620 33.711 28.412 29.615 30.813 32.007 33.196 34.382 35.563 36.741 37.916 39.087 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 34.170 35.479 36.781 38.076 39.364 40.646 41.923 43.195 44.461 45.722 37.566 38.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 49.588 39.997 41.401 42.796 44.181 45.558 46.928 48.290 49.645 50.994 52.335 45.314 46.796 48.268 49.728 51.179 52.619 54.051 55.475 56.892 58.301 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 34.800 35.887 36.973 38.058 39.141 40.223 41.304 42.383 43.462 44.539 40.256 41.422 42.585 43.745 44.903 46.059 47.212 48.363 49.513 50.660 43.773 44.985 46.194 47.400 48.602 49.802 50.998 52.192 53.384 54.572 46.979 48.232 49.480 50.725 51.966 53.203 54.437 55.668 56.895 58.120 50.892 52.191 53.486 54.775 56.061 57.342 58.619 59.893 61.162 62.428 53.672 55.002 56.328 57.648 58.964 60.275 61.581 62.883 64.181 65.475 59.702 61.098 62.487 63.869 65.247 66.619 67.985 69.348 70.704 72.055 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80 90 100 45.616 56.334 66.981 77.577 88.130 98.650 109.141 51.805 63.167 74.397 85.527 96.578 107.565 118.498 55.758 67.505 79.082 90.531 101.879 113.145 124.342 59.342 71.420 83.298 95.023 106.629 118.136 129.561 63.691 76.154 88.379 100.425 112.329 124.116 135.807 66.766 79.490 91.952 104.215 116.321 128.299 140.170 73.403 86.660 99.608 112.317 124.839 137.208 149.449 40 50 60 70 80 90 100 134 Tafeln fm,n (x) q 1−q x Fm,n,q Tabelle T.6: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 1 q 0.990 0.975 0.950 0.900 1 4052 647.8 161.4 39.86 2 4999 799.5 199.5 49.50 3 5404 864.2 215.7 53.59 4 5624 899.6 224.6 55.83 5 5764 921.8 230.2 57.24 6 5859 937.1 234.0 58.20 7 5928 948.2 236.8 58.91 8 5981 956.6 238.9 59.44 9 6022 963.3 240.5 59.86 10 6056 968.6 241.9 60.19 2 0.990 0.975 0.950 0.900 98.50 38.51 18.51 8.526 99.00 39.00 19.00 9.000 99.16 39.17 19.16 9.162 99.25 39.25 19.25 9.243 99.30 39.30 19.30 9.293 99.33 39.33 19.33 9.326 99.36 39.36 19.35 9.349 99.38 39.37 19.37 9.367 99.39 39.39 19.38 9.381 99.40 39.40 19.40 9.392 3 0.990 0.975 0.950 0.900 34.12 17.44 10.13 5.538 30.82 16.04 9.552 5.462 29.46 15.44 9.277 5.391 28.71 15.10 9.117 5.343 28.24 14.88 9.013 5.309 27.91 14.73 8.941 5.285 27.67 14.62 8.887 5.266 27.49 14.54 8.845 5.252 27.34 14.47 8.812 5.240 27.23 14.42 8.785 5.230 4 0.990 0.975 0.950 0.900 21.20 12.22 7.709 4.545 18.00 10.65 6.944 4.325 16.69 9.979 6.591 4.191 15.98 9.604 6.388 4.107 15.52 9.364 6.256 4.051 15.21 9.197 6.163 4.010 14.98 9.074 6.094 3.979 14.80 8.980 6.041 3.955 14.66 8.905 5.999 3.936 14.55 8.844 5.964 3.920 5 0.990 0.975 0.950 0.900 16.26 10.01 6.608 4.060 13.27 8.434 5.786 3.780 12.06 7.764 5.409 3.619 11.39 7.388 5.192 3.520 10.97 7.146 5.050 3.453 10.67 6.978 4.950 3.405 10.46 6.853 4.876 3.368 10.29 6.757 4.818 3.339 10.16 6.681 4.772 3.316 10.05 6.619 4.735 3.297 6 0.990 0.975 0.950 0.900 13.75 8.813 5.987 3.776 10.92 7.260 5.143 3.463 9.780 6.599 4.757 3.289 9.148 6.227 4.534 3.181 8.746 5.988 4.387 3.108 8.466 5.820 4.284 3.055 8.260 5.695 4.207 3.014 8.102 5.600 4.147 2.983 7.976 5.523 4.099 2.958 7.874 5.461 4.060 2.937 7 0.990 0.975 0.950 0.900 12.25 8.073 5.591 3.589 9.547 6.542 4.737 3.257 8.451 5.890 4.347 3.074 7.847 5.523 4.120 2.961 7.460 5.285 3.972 2.883 7.191 5.119 3.866 2.827 6.993 4.995 3.787 2.785 6.840 4.899 3.726 2.752 6.719 4.823 3.677 2.725 6.620 4.761 3.637 2.703 8 0.990 0.975 0.950 0.900 11.26 7.571 5.318 3.458 8.649 6.059 4.459 3.113 7.591 5.416 4.066 2.924 7.006 5.053 3.838 2.806 6.632 4.817 3.688 2.726 6.371 4.652 3.581 2.668 6.178 4.529 3.500 2.624 6.029 4.433 3.438 2.589 5.911 4.357 3.388 2.561 5.814 4.295 3.347 2.538 9 0.990 0.975 0.950 0.900 10.56 7.209 5.117 3.360 8.022 5.715 4.256 3.006 6.992 5.078 3.863 2.813 6.422 4.718 3.633 2.693 6.057 4.484 3.482 2.611 5.802 4.320 3.374 2.551 5.613 4.197 3.293 2.505 5.467 4.102 3.230 2.469 5.351 4.026 3.179 2.440 5.257 3.964 3.137 2.416 10 0.990 0.975 0.950 0.900 10.04 6.937 4.965 3.285 7.559 5.456 4.103 2.924 6.552 4.826 3.708 2.728 5.994 4.468 3.478 2.605 5.636 4.236 3.326 2.522 5.386 4.072 3.217 2.461 5.200 3.950 3.135 2.414 5.057 3.855 3.072 2.377 4.942 3.779 3.020 2.347 4.849 3.717 2.978 2.323 Tafeln 135 fm,n (x) q 1−q x Fm,n,q Tabelle T.7: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 1 q 0.990 0.975 0.950 0.900 11 6083 973.0 243.0 60.47 12 6107 976.7 243.9 60.71 13 6126 979.8 244.7 60.90 14 6143 982.5 245.4 61.07 15 6157 984.9 245.9 61.22 16 6170 986.9 246.5 61.35 17 6181 988.7 246.9 61.46 18 6191 990.3 247.3 61.57 19 6201 991.8 247.7 61.66 20 6209 993.1 248.0 61.74 2 0.990 0.975 0.950 0.900 99.41 39.41 19.40 9.401 99.42 39.41 19.41 9.408 99.42 39.42 19.42 9.415 99.43 39.43 19.42 9.420 99.43 39.43 19.43 9.425 99.44 39.44 19.43 9.429 99.44 39.44 19.44 9.433 99.44 39.44 19.44 9.436 99.45 39.45 19.44 9.439 99.45 39.45 19.45 9.441 3 0.990 0.975 0.950 0.900 27.13 14.37 8.763 5.222 27.05 14.34 8.745 5.216 26.98 14.30 8.729 5.210 26.92 14.28 8.715 5.205 26.87 14.25 8.703 5.200 26.83 14.23 8.692 5.196 26.79 14.21 8.683 5.193 26.75 14.20 8.675 5.190 26.72 14.18 8.667 5.187 26.69 14.17 8.660 5.184 4 0.990 0.975 0.950 0.900 14.45 8.794 5.936 3.907 14.37 8.751 5.912 3.896 14.31 8.715 5.891 3.886 14.25 8.684 5.873 3.878 14.20 8.657 5.858 3.870 14.15 8.633 5.844 3.864 14.11 8.611 5.832 3.858 14.08 8.592 5.821 3.853 14.05 8.575 5.811 3.848 14.02 8.560 5.803 3.844 5 0.990 0.975 0.950 0.900 9.963 6.568 4.704 3.282 9.888 6.525 4.678 3.268 9.82 6.488 4.655 3.257 9.77 6.456 4.636 3.247 9.72 6.428 4.619 3.238 9.68 6.403 4.604 3.230 9.64 6.381 4.590 3.223 9.61 6.362 4.579 3.217 9.58 6.344 4.568 3.212 9.55 6.329 4.558 3.207 6 0.990 0.975 0.950 0.900 7.790 5.410 4.027 2.920 7.718 5.366 4.000 2.905 7.657 5.329 3.976 2.892 7.605 5.297 3.956 2.881 7.559 5.269 3.938 2.871 7.519 5.244 3.922 2.863 7.483 5.222 3.908 2.855 7.451 5.202 3.896 2.848 7.422 5.184 3.884 2.842 7.396 5.168 3.874 2.836 7 0.990 0.975 0.950 0.900 6.538 4.709 3.603 2.684 6.469 4.666 3.575 2.668 6.410 4.628 3.550 2.654 6.359 4.596 3.529 2.643 6.314 4.568 3.511 2.632 6.275 4.543 3.494 2.623 6.240 4.521 3.480 2.615 6.209 4.501 3.467 2.607 6.181 4.483 3.455 2.601 6.155 4.467 3.445 2.595 8 0.990 0.975 0.950 0.900 5.734 4.243 3.313 2.519 5.667 4.200 3.284 2.502 5.609 4.162 3.259 2.488 5.559 4.130 3.237 2.475 5.515 4.101 3.218 2.464 5.477 4.076 3.202 2.454 5.442 4.054 3.187 2.446 5.412 4.034 3.173 2.438 5.384 4.016 3.161 2.431 5.359 3.999 3.150 2.425 9 0.990 0.975 0.950 0.900 5.178 3.912 3.102 2.396 5.111 3.868 3.073 2.379 5.055 3.831 3.048 2.364 5.005 3.798 3.025 2.351 4.962 3.769 3.006 2.340 4.924 3.744 2.989 2.330 4.890 3.722 2.974 2.320 4.860 3.701 2.960 2.312 4.833 3.683 2.948 2.305 4.808 3.667 2.936 2.298 10 0.990 0.975 0.950 0.900 4.772 3.665 2.943 2.302 4.706 3.621 2.913 2.284 4.650 3.583 2.887 2.269 4.601 3.550 2.865 2.255 4.558 3.522 2.845 2.244 4.520 3.496 2.828 2.233 4.487 3.474 2.812 2.224 4.457 3.453 2.798 2.215 4.430 3.435 2.785 2.208 4.405 3.419 2.774 2.201 136 Tafeln fm,n (x) q 1−q x Fm,n,q Tabelle T.8: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 1 q 0.990 0.975 0.950 0.900 25 6240 998.1 249.3 62.05 30 6260 1001 250.1 62.26 40 6286 1006 251.1 62.53 50 6302 1008 251.8 62.69 60 6313 1010 252.2 62.79 80 6326 1012 252.7 62.93 100 6334 1013 253.0 63.01 200 6350 1016 253.7 63.17 500 6360 1017 254.1 63.26 ∞ 6366 1018 254.3 63.33 2 0.990 0.975 0.950 0.900 99.46 39.46 19.46 9.451 99.47 39.46 19.46 9.458 99.48 39.47 19.47 9.466 99.48 39.48 19.48 9.471 99.48 39.48 19.48 9.475 99.48 39.49 19.48 9.479 99.49 39.49 19.49 9.481 99.49 39.49 19.49 9.486 99.50 39.50 19.49 9.489 99.50 39.50 19.50 9.491 3 0.990 0.975 0.950 0.900 26.58 14.12 8.634 5.175 26.50 14.08 8.617 5.168 26.41 14.04 8.594 5.160 26.35 14.01 8.581 5.155 26.32 13.99 8.572 5.151 26.27 13.97 8.561 5.147 26.24 13.96 8.554 5.144 26.18 13.93 8.540 5.139 26.15 13.91 8.532 5.136 26.13 13.90 8.527 5.134 4 0.990 0.975 0.950 0.900 13.91 8.501 5.769 3.828 13.84 8.461 5.746 3.817 13.75 8.411 5.717 3.804 13.69 8.381 5.699 3.795 13.65 8.360 5.688 3.790 13.61 8.335 5.673 3.782 13.58 8.319 5.664 3.778 13.52 8.288 5.646 3.769 13.49 8.270 5.635 3.764 13.46 8.257 5.628 3.761 5 0.990 0.975 0.950 0.900 9.449 6.268 4.521 3.187 9.379 6.227 4.496 3.174 9.29 6.175 4.464 3.157 9.24 6.144 4.444 3.147 9.20 6.123 4.431 3.140 9.16 6.096 4.415 3.132 9.13 6.080 4.405 3.126 9.08 6.048 4.385 3.116 9.04 6.028 4.373 3.109 9.02 6.015 4.365 3.105 6 0.990 0.975 0.950 0.900 7.296 5.107 3.835 2.815 7.229 5.065 3.808 2.800 7.143 5.012 3.774 2.781 7.091 4.980 3.754 2.770 7.057 4.959 3.740 2.762 7.013 4.932 3.722 2.752 6.987 4.915 3.712 2.746 6.934 4.882 3.690 2.734 6.901 4.862 3.678 2.727 6.880 4.849 3.669 2.722 7 0.990 0.975 0.950 0.900 6.058 4.405 3.404 2.571 5.992 4.362 3.376 2.555 5.908 4.309 3.340 2.535 5.858 4.276 3.319 2.523 5.824 4.254 3.304 2.514 5.781 4.227 3.286 2.504 5.755 4.210 3.275 2.497 5.702 4.176 3.252 2.484 5.671 4.156 3.239 2.476 5.650 4.142 3.230 2.471 8 0.990 0.975 0.950 0.900 5.263 3.937 3.108 2.400 5.198 3.894 3.079 2.383 5.116 3.840 3.043 2.361 5.065 3.807 3.020 2.348 5.032 3.784 3.005 2.339 4.989 3.756 2.986 2.328 4.963 3.739 2.975 2.321 4.911 3.705 2.951 2.307 4.880 3.684 2.937 2.298 4.859 3.670 2.928 2.293 9 0.990 0.975 0.950 0.900 4.713 3.604 2.893 2.272 4.649 3.560 2.864 2.255 4.567 3.505 2.826 2.232 4.517 3.472 2.803 2.218 4.483 3.449 2.787 2.208 4.441 3.421 2.768 2.196 4.415 3.403 2.756 2.189 4.363 3.368 2.731 2.174 4.332 3.347 2.717 2.165 4.311 3.333 2.707 2.159 10 0.990 0.975 0.950 0.900 4.311 3.355 2.730 2.174 4.247 3.311 2.700 2.155 4.165 3.255 2.661 2.132 4.115 3.221 2.637 2.117 4.082 3.198 2.621 2.107 4.039 3.169 2.601 2.095 4.014 3.152 2.588 2.087 3.962 3.116 2.563 2.071 3.930 3.094 2.548 2.062 3.909 3.080 2.538 2.055 Tafeln 137 fm,n (x) q 1−q x Fm,n,q Tabelle T.9: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 11 q 0.990 0.975 0.950 0.900 1 9.646 6.724 4.844 3.225 2 7.206 5.256 3.982 2.860 3 6.217 4.630 3.587 2.660 4 5.668 4.275 3.357 2.536 5 5.316 4.044 3.204 2.451 6 5.069 3.881 3.095 2.389 7 4.886 3.759 3.012 2.342 8 4.744 3.664 2.948 2.304 9 4.632 3.588 2.896 2.274 10 4.539 3.526 2.854 2.248 12 0.990 0.975 0.950 0.900 9.330 6.554 4.747 3.177 6.927 5.096 3.885 2.807 5.953 4.474 3.490 2.606 5.412 4.121 3.259 2.480 5.064 3.891 3.106 2.394 4.821 3.728 2.996 2.331 4.640 3.607 2.913 2.283 4.499 3.512 2.849 2.245 4.388 3.436 2.796 2.214 4.296 3.374 2.753 2.188 13 0.990 0.975 0.950 0.900 9.074 6.414 4.667 3.136 6.701 4.965 3.806 2.763 5.739 4.347 3.411 2.560 5.205 3.996 3.179 2.434 4.862 3.767 3.025 2.347 4.620 3.604 2.915 2.283 4.441 3.483 2.832 2.234 4.302 3.388 2.767 2.195 4.191 3.312 2.714 2.164 4.100 3.250 2.671 2.138 14 0.990 0.975 0.950 0.900 8.862 6.298 4.600 3.102 6.515 4.857 3.739 2.726 5.564 4.242 3.344 2.522 5.035 3.892 3.112 2.395 4.695 3.663 2.958 2.307 4.456 3.501 2.848 2.243 4.278 3.380 2.764 2.193 4.140 3.285 2.699 2.154 4.030 3.209 2.646 2.122 3.939 3.147 2.602 2.095 15 0.990 0.975 0.950 0.900 8.683 6.200 4.543 3.073 6.359 4.765 3.682 2.695 5.417 4.153 3.287 2.490 4.893 3.804 3.056 2.361 4.556 3.576 2.901 2.273 4.318 3.415 2.790 2.208 4.142 3.293 2.707 2.158 4.004 3.199 2.641 2.119 3.895 3.123 2.588 2.086 3.805 3.060 2.544 2.059 16 0.990 0.975 0.950 0.900 8.531 6.115 4.494 3.048 6.226 4.687 3.634 2.668 5.292 4.077 3.239 2.462 4.773 3.729 3.007 2.333 4.437 3.502 2.852 2.244 4.202 3.341 2.741 2.178 4.026 3.219 2.657 2.128 3.890 3.125 2.591 2.088 3.780 3.049 2.538 2.055 3.691 2.986 2.494 2.028 17 0.990 0.975 0.950 0.900 8.400 6.042 4.451 3.026 6.112 4.619 3.592 2.645 5.185 4.011 3.197 2.437 4.669 3.665 2.965 2.308 4.336 3.438 2.810 2.218 4.101 3.277 2.699 2.152 3.927 3.156 2.614 2.102 3.791 3.061 2.548 2.061 3.682 2.985 2.494 2.028 3.593 2.922 2.450 2.001 18 0.990 0.975 0.950 0.900 8.285 5.978 4.414 3.007 6.013 4.560 3.555 2.624 5.092 3.954 3.160 2.416 4.579 3.608 2.928 2.286 4.248 3.382 2.773 2.196 4.015 3.221 2.661 2.130 3.841 3.100 2.577 2.079 3.705 3.005 2.510 2.038 3.597 2.929 2.456 2.005 3.508 2.866 2.412 1.977 19 0.990 0.975 0.950 0.900 8.185 5.922 4.381 2.990 5.926 4.508 3.522 2.606 5.010 3.903 3.127 2.397 4.500 3.559 2.895 2.266 4.171 3.333 2.740 2.176 3.939 3.172 2.628 2.109 3.765 3.051 2.544 2.058 3.631 2.956 2.477 2.017 3.523 2.880 2.423 1.984 3.434 2.817 2.378 1.956 20 0.990 0.975 0.950 0.900 8.096 5.871 4.351 2.975 5.849 4.461 3.493 2.589 4.938 3.859 3.098 2.380 4.431 3.515 2.866 2.249 4.103 3.289 2.711 2.158 3.871 3.128 2.599 2.091 3.699 3.007 2.514 2.040 3.564 2.913 2.447 1.999 3.457 2.837 2.393 1.965 3.368 2.774 2.348 1.937 138 Tafeln fm,n (x) q 1−q x Fm,n,q Tabelle T.10: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 11 q 0.990 0.975 0.950 0.900 11 4.462 3.474 2.818 2.227 12 4.397 3.430 2.788 2.209 13 4.342 3.392 2.761 2.193 14 4.293 3.359 2.739 2.179 15 4.251 3.330 2.719 2.167 16 4.213 3.304 2.701 2.156 17 4.180 3.282 2.685 2.147 18 4.150 3.261 2.671 2.138 19 4.123 3.243 2.658 2.130 20 4.099 3.226 2.646 2.123 12 0.990 0.975 0.950 0.900 4.220 3.321 2.717 2.166 4.155 3.277 2.687 2.147 4.100 3.239 2.660 2.131 4.052 3.206 2.637 2.117 4.010 3.177 2.617 2.105 3.972 3.152 2.599 2.094 3.939 3.129 2.583 2.084 3.910 3.108 2.568 2.075 3.883 3.090 2.555 2.067 3.858 3.073 2.544 2.060 13 0.990 0.975 0.950 0.900 4.025 3.197 2.635 2.116 3.960 3.153 2.604 2.097 3.905 3.115 2.577 2.080 3.857 3.082 2.554 2.066 3.815 3.053 2.533 2.053 3.778 3.027 2.515 2.042 3.745 3.004 2.499 2.032 3.716 2.983 2.484 2.023 3.689 2.965 2.471 2.014 3.665 2.948 2.459 2.007 14 0.990 0.975 0.950 0.900 3.864 3.095 2.565 2.073 3.800 3.050 2.534 2.054 3.745 3.012 2.507 2.037 3.698 2.979 2.484 2.022 3.656 2.949 2.463 2.010 3.619 2.923 2.445 1.998 3.586 2.900 2.428 1.988 3.556 2.879 2.413 1.978 3.529 2.861 2.400 1.970 3.505 2.844 2.388 1.962 15 0.990 0.975 0.950 0.900 3.730 3.008 2.507 2.037 3.666 2.963 2.475 2.017 3.612 2.925 2.448 2.000 3.564 2.891 2.424 1.985 3.522 2.862 2.403 1.972 3.485 2.836 2.385 1.961 3.452 2.813 2.368 1.950 3.423 2.792 2.353 1.941 3.396 2.773 2.340 1.932 3.372 2.756 2.328 1.924 16 0.990 0.975 0.950 0.900 3.616 2.934 2.456 2.005 3.553 2.889 2.425 1.985 3.498 2.851 2.397 1.968 3.451 2.817 2.373 1.953 3.409 2.788 2.352 1.940 3.372 2.761 2.333 1.928 3.339 2.738 2.317 1.917 3.310 2.717 2.302 1.908 3.283 2.698 2.288 1.899 3.259 2.681 2.276 1.891 17 0.990 0.975 0.950 0.900 3.518 2.870 2.413 1.978 3.455 2.825 2.381 1.958 3.401 2.786 2.353 1.940 3.353 2.753 2.329 1.925 3.312 2.723 2.308 1.912 3.275 2.697 2.289 1.900 3.242 2.673 2.272 1.889 3.212 2.652 2.257 1.879 3.186 2.633 2.243 1.870 3.162 2.616 2.230 1.862 18 0.990 0.975 0.950 0.900 3.434 2.814 2.374 1.954 3.371 2.769 2.342 1.933 3.316 2.730 2.314 1.916 3.269 2.696 2.290 1.900 3.227 2.667 2.269 1.887 3.190 2.640 2.250 1.875 3.158 2.617 2.233 1.864 3.128 2.596 2.217 1.854 3.101 2.576 2.203 1.845 3.077 2.559 2.191 1.837 19 0.990 0.975 0.950 0.900 3.360 2.765 2.340 1.932 3.297 2.720 2.308 1.912 3.242 2.681 2.280 1.894 3.195 2.647 2.256 1.878 3.153 2.617 2.234 1.865 3.116 2.591 2.215 1.852 3.084 2.567 2.198 1.841 3.054 2.546 2.182 1.831 3.027 2.526 2.168 1.822 3.003 2.509 2.155 1.814 20 0.990 0.975 0.950 0.900 3.294 2.721 2.310 1.913 3.231 2.676 2.278 1.892 3.177 2.637 2.250 1.875 3.130 2.603 2.225 1.859 3.088 2.573 2.203 1.845 3.051 2.547 2.184 1.833 3.018 2.523 2.167 1.821 2.989 2.501 2.151 1.811 2.962 2.482 2.137 1.802 2.938 2.464 2.124 1.794 Tafeln 139 fm,n (x) q 1−q x Fm,n,q Tabelle T.11: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 11 q 0.990 0.975 0.950 0.900 25 4.005 3.162 2.601 2.095 30 3.941 3.118 2.570 2.076 40 3.860 3.061 2.531 2.052 50 3.810 3.027 2.507 2.036 60 3.776 3.004 2.490 2.026 80 3.734 2.974 2.469 2.013 100 3.708 2.956 2.457 2.005 200 3.656 2.920 2.431 1.989 500 3.624 2.898 2.415 1.979 ∞ 3.603 2.883 2.405 1.972 12 0.990 0.975 0.950 0.900 3.765 3.008 2.498 2.031 3.701 2.963 2.466 2.011 3.619 2.906 2.426 1.986 3.569 2.871 2.401 1.970 3.535 2.848 2.384 1.960 3.493 2.818 2.363 1.946 3.467 2.800 2.350 1.938 3.414 2.763 2.323 1.921 3.382 2.740 2.307 1.911 3.361 2.725 2.296 1.904 13 0.990 0.975 0.950 0.900 3.571 2.882 2.412 1.978 3.507 2.837 2.380 1.958 3.425 2.780 2.339 1.931 3.375 2.744 2.314 1.915 3.341 2.720 2.297 1.904 3.298 2.690 2.275 1.890 3.272 2.671 2.261 1.882 3.219 2.634 2.234 1.864 3.187 2.611 2.218 1.853 3.165 2.596 2.206 1.846 14 0.990 0.975 0.950 0.900 3.412 2.778 2.341 1.933 3.348 2.732 2.308 1.912 3.266 2.674 2.266 1.885 3.215 2.638 2.241 1.869 3.181 2.614 2.223 1.857 3.138 2.583 2.201 1.843 3.112 2.565 2.187 1.834 3.059 2.526 2.159 1.816 3.026 2.503 2.142 1.805 3.004 2.487 2.131 1.797 15 0.990 0.975 0.950 0.900 3.278 2.689 2.280 1.894 3.214 2.644 2.247 1.873 3.132 2.585 2.204 1.845 3.081 2.549 2.178 1.828 3.047 2.524 2.160 1.817 3.004 2.493 2.137 1.802 2.977 2.474 2.123 1.793 2.923 2.435 2.095 1.774 2.891 2.411 2.078 1.763 2.869 2.395 2.066 1.755 16 0.990 0.975 0.950 0.900 3.165 2.614 2.227 1.860 3.101 2.568 2.194 1.839 3.018 2.509 2.151 1.811 2.967 2.472 2.124 1.793 2.933 2.447 2.106 1.782 2.889 2.415 2.083 1.766 2.863 2.396 2.068 1.757 2.808 2.357 2.039 1.738 2.775 2.333 2.022 1.726 2.753 2.316 2.010 1.718 17 0.990 0.975 0.950 0.900 3.068 2.548 2.181 1.831 3.003 2.502 2.148 1.809 2.920 2.442 2.104 1.781 2.869 2.405 2.077 1.763 2.835 2.380 2.058 1.751 2.791 2.348 2.035 1.735 2.764 2.329 2.020 1.726 2.709 2.289 1.991 1.706 2.676 2.264 1.973 1.694 2.653 2.248 1.960 1.686 18 0.990 0.975 0.950 0.900 2.983 2.491 2.141 1.805 2.919 2.445 2.107 1.783 2.835 2.384 2.063 1.754 2.784 2.347 2.035 1.736 2.749 2.321 2.017 1.723 2.705 2.289 1.993 1.707 2.678 2.269 1.978 1.698 2.623 2.229 1.948 1.678 2.589 2.204 1.929 1.665 2.566 2.187 1.917 1.657 19 0.990 0.975 0.950 0.900 2.909 2.441 2.106 1.782 2.844 2.394 2.071 1.759 2.761 2.333 2.026 1.730 2.709 2.295 1.999 1.711 2.674 2.270 1.980 1.699 2.630 2.237 1.955 1.683 2.602 2.217 1.940 1.673 2.547 2.176 1.910 1.652 2.512 2.150 1.891 1.639 2.489 2.133 1.878 1.631 20 0.990 0.975 0.950 0.900 2.843 2.396 2.074 1.761 2.778 2.349 2.039 1.738 2.695 2.287 1.994 1.708 2.643 2.249 1.966 1.690 2.608 2.223 1.946 1.677 2.563 2.190 1.922 1.660 2.535 2.170 1.907 1.650 2.479 2.128 1.875 1.629 2.445 2.103 1.856 1.616 2.421 2.085 1.843 1.607 140 Tafeln fm,n (x) q 1−q x Fm,n,q Tabelle T.12: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 25 q 0.990 0.975 0.950 0.900 1 7.770 5.686 4.242 2.918 2 5.568 4.291 3.385 2.528 3 4.675 3.694 2.991 2.317 4 4.177 3.353 2.759 2.184 5 3.855 3.129 2.603 2.092 6 3.627 2.969 2.490 2.024 7 3.457 2.848 2.405 1.971 8 3.324 2.753 2.337 1.929 9 3.217 2.677 2.282 1.895 10 3.129 2.613 2.236 1.866 30 0.990 0.975 0.950 0.900 7.562 5.568 4.171 2.881 5.390 4.182 3.316 2.489 4.510 3.589 2.922 2.276 4.018 3.250 2.690 2.142 3.699 3.026 2.534 2.049 3.473 2.867 2.421 1.980 3.305 2.746 2.334 1.927 3.173 2.651 2.266 1.884 3.067 2.575 2.211 1.849 2.979 2.511 2.165 1.819 40 0.990 0.975 0.950 0.900 7.314 5.424 4.085 2.835 5.178 4.051 3.232 2.440 4.313 3.463 2.839 2.226 3.828 3.126 2.606 2.091 3.514 2.904 2.449 1.997 3.291 2.744 2.336 1.927 3.124 2.624 2.249 1.873 2.993 2.529 2.180 1.829 2.888 2.452 2.124 1.793 2.801 2.388 2.077 1.763 50 0.990 0.975 0.950 0.900 7.171 5.340 4.034 2.809 5.057 3.975 3.183 2.412 4.199 3.390 2.790 2.197 3.720 3.054 2.557 2.061 3.408 2.833 2.400 1.966 3.186 2.674 2.286 1.895 3.020 2.553 2.199 1.840 2.890 2.458 2.130 1.796 2.785 2.381 2.073 1.760 2.698 2.317 2.026 1.729 60 0.990 0.975 0.950 0.900 7.077 5.286 4.001 2.791 4.977 3.925 3.150 2.393 4.126 3.343 2.758 2.177 3.649 3.008 2.525 2.041 3.339 2.786 2.368 1.946 3.119 2.627 2.254 1.875 2.953 2.507 2.167 1.819 2.823 2.412 2.097 1.775 2.718 2.334 2.040 1.738 2.632 2.270 1.993 1.707 80 0.990 0.975 0.950 0.900 6.963 5.218 3.960 2.769 4.881 3.864 3.111 2.370 4.036 3.284 2.719 2.154 3.563 2.950 2.486 2.016 3.255 2.730 2.329 1.921 3.036 2.571 2.214 1.849 2.871 2.450 2.126 1.793 2.742 2.355 2.056 1.748 2.637 2.277 1.999 1.711 2.551 2.213 1.951 1.680 100 0.990 0.975 0.950 0.900 6.895 5.179 3.936 2.756 4.824 3.828 3.087 2.356 3.984 3.250 2.696 2.139 3.513 2.917 2.463 2.002 3.206 2.696 2.305 1.906 2.988 2.537 2.191 1.834 2.823 2.417 2.103 1.778 2.694 2.321 2.032 1.732 2.590 2.244 1.975 1.695 2.503 2.179 1.927 1.663 200 0.990 0.975 0.950 0.900 6.763 5.100 3.888 2.731 4.713 3.758 3.041 2.329 3.881 3.182 2.650 2.111 3.414 2.850 2.417 1.973 3.110 2.630 2.259 1.876 2.893 2.472 2.144 1.804 2.730 2.351 2.056 1.747 2.601 2.256 1.985 1.701 2.497 2.178 1.927 1.663 2.411 2.113 1.878 1.631 500 0.990 0.975 0.950 0.900 6.686 5.054 3.860 2.716 4.648 3.716 3.014 2.313 3.821 3.142 2.623 2.095 3.357 2.811 2.390 1.956 3.054 2.592 2.232 1.859 2.838 2.434 2.117 1.786 2.675 2.313 2.028 1.729 2.547 2.217 1.957 1.683 2.443 2.139 1.899 1.644 2.356 2.074 1.850 1.612 ∞ 0.990 0.975 0.950 0.900 6.635 5.024 3.841 2.706 4.605 3.689 2.996 2.303 3.782 3.116 2.605 2.084 3.319 2.786 2.372 1.945 3.017 2.567 2.214 1.847 2.802 2.408 2.099 1.774 2.639 2.288 2.010 1.717 2.511 2.192 1.938 1.670 2.407 2.114 1.880 1.632 2.321 2.048 1.831 1.599 Tafeln 141 fm,n (x) q 1−q x Fm,n,q Tabelle T.13: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 25 q 0.990 0.975 0.950 0.900 11 3.056 2.560 2.198 1.841 12 2.993 2.515 2.165 1.820 13 2.939 2.476 2.136 1.802 14 2.892 2.441 2.111 1.785 15 2.850 2.411 2.089 1.771 16 2.813 2.384 2.069 1.758 17 2.780 2.360 2.051 1.746 18 2.751 2.338 2.035 1.736 19 2.724 2.318 2.021 1.726 20 2.699 2.300 2.007 1.718 30 0.990 0.975 0.950 0.900 2.906 2.458 2.126 1.794 2.843 2.412 2.092 1.773 2.789 2.372 2.063 1.754 2.742 2.338 2.037 1.737 2.700 2.307 2.015 1.722 2.663 2.280 1.995 1.709 2.630 2.255 1.976 1.697 2.600 2.233 1.960 1.686 2.573 2.213 1.945 1.676 2.549 2.195 1.932 1.667 40 0.990 0.975 0.950 0.900 2.727 2.334 2.038 1.737 2.665 2.288 2.003 1.715 2.611 2.248 1.974 1.695 2.563 2.213 1.948 1.678 2.522 2.182 1.924 1.662 2.484 2.154 1.904 1.649 2.451 2.129 1.885 1.636 2.421 2.107 1.868 1.625 2.394 2.086 1.853 1.615 2.369 2.068 1.839 1.605 50 0.990 0.975 0.950 0.900 2.625 2.263 1.986 1.703 2.563 2.216 1.952 1.680 2.508 2.176 1.921 1.660 2.461 2.140 1.895 1.643 2.419 2.109 1.871 1.627 2.382 2.081 1.850 1.613 2.348 2.056 1.831 1.600 2.318 2.033 1.814 1.588 2.290 2.012 1.798 1.578 2.265 1.993 1.784 1.568 60 0.990 0.975 0.950 0.900 2.559 2.216 1.952 1.680 2.496 2.169 1.917 1.657 2.442 2.129 1.887 1.637 2.394 2.093 1.860 1.619 2.352 2.061 1.836 1.603 2.315 2.033 1.815 1.589 2.281 2.008 1.796 1.576 2.251 1.985 1.778 1.564 2.223 1.964 1.763 1.553 2.198 1.944 1.748 1.543 80 0.990 0.975 0.950 0.900 2.478 2.158 1.910 1.653 2.415 2.111 1.875 1.629 2.361 2.071 1.845 1.609 2.313 2.035 1.817 1.590 2.271 2.003 1.793 1.574 2.233 1.974 1.772 1.559 2.199 1.948 1.752 1.546 2.169 1.925 1.734 1.534 2.141 1.904 1.718 1.523 2.115 1.884 1.703 1.513 100 0.990 0.975 0.950 0.900 2.430 2.124 1.886 1.636 2.368 2.077 1.850 1.612 2.313 2.036 1.819 1.592 2.265 2.000 1.792 1.573 2.223 1.968 1.768 1.557 2.185 1.939 1.746 1.542 2.151 1.913 1.726 1.528 2.120 1.890 1.708 1.516 2.092 1.868 1.691 1.505 2.067 1.849 1.676 1.494 200 0.990 0.975 0.950 0.900 2.338 2.058 1.837 1.603 2.275 2.010 1.801 1.579 2.220 1.969 1.769 1.558 2.172 1.932 1.742 1.539 2.129 1.900 1.717 1.522 2.091 1.870 1.694 1.507 2.057 1.844 1.674 1.493 2.026 1.820 1.656 1.480 1.997 1.798 1.639 1.468 1.971 1.778 1.623 1.458 500 0.990 0.975 0.950 0.900 2.283 2.019 1.808 1.583 2.220 1.971 1.772 1.559 2.166 1.929 1.740 1.537 2.117 1.892 1.712 1.518 2.075 1.859 1.686 1.501 2.036 1.830 1.664 1.485 2.002 1.803 1.643 1.471 1.970 1.779 1.625 1.458 1.942 1.757 1.607 1.446 1.915 1.736 1.592 1.435 ∞ 0.990 0.975 0.950 0.900 2.248 1.993 1.789 1.570 2.185 1.945 1.752 1.546 2.130 1.903 1.720 1.524 2.082 1.866 1.692 1.505 2.039 1.833 1.666 1.487 2.000 1.803 1.644 1.471 1.965 1.776 1.623 1.457 1.934 1.751 1.604 1.444 1.905 1.729 1.587 1.432 1.878 1.708 1.571 1.421 142 Tafeln fm,n (x) q 1−q x Fm,n,q Tabelle T.14: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die 1 Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q . m n 25 q 0.990 0.975 0.950 0.900 25 2.604 2.230 1.955 1.683 30 2.538 2.182 1.919 1.659 40 2.453 2.118 1.872 1.627 50 2.400 2.079 1.842 1.607 60 2.364 2.052 1.822 1.593 80 2.317 2.017 1.796 1.576 100 2.289 1.996 1.779 1.565 200 2.230 1.952 1.746 1.542 500 2.194 1.924 1.725 1.527 ∞ 2.170 1.906 1.711 1.518 30 0.990 0.975 0.950 0.900 2.453 2.124 1.878 1.632 2.386 2.074 1.841 1.606 2.299 2.009 1.792 1.573 2.245 1.968 1.761 1.552 2.208 1.940 1.740 1.538 2.160 1.904 1.712 1.519 2.131 1.882 1.695 1.507 2.070 1.835 1.660 1.482 2.032 1.806 1.637 1.467 2.006 1.787 1.622 1.456 40 0.990 0.975 0.950 0.900 2.271 1.994 1.783 1.568 2.203 1.943 1.744 1.541 2.114 1.875 1.693 1.506 2.058 1.832 1.660 1.483 2.019 1.803 1.637 1.467 1.969 1.764 1.608 1.447 1.938 1.741 1.589 1.434 1.874 1.691 1.551 1.406 1.833 1.659 1.526 1.389 1.805 1.637 1.509 1.377 50 0.990 0.975 0.950 0.900 2.167 1.919 1.727 1.529 2.098 1.866 1.687 1.502 2.007 1.796 1.634 1.465 1.949 1.752 1.599 1.441 1.909 1.721 1.576 1.424 1.857 1.681 1.544 1.402 1.825 1.656 1.525 1.388 1.757 1.603 1.484 1.359 1.713 1.569 1.457 1.340 1.683 1.545 1.438 1.327 60 0.990 0.975 0.950 0.900 2.098 1.869 1.690 1.504 2.028 1.815 1.649 1.476 1.936 1.744 1.594 1.437 1.877 1.699 1.559 1.413 1.836 1.667 1.534 1.395 1.783 1.625 1.502 1.372 1.749 1.599 1.481 1.358 1.678 1.543 1.438 1.326 1.633 1.507 1.409 1.306 1.601 1.482 1.389 1.292 80 0.990 0.975 0.950 0.900 2.015 1.807 1.644 1.472 1.944 1.752 1.602 1.443 1.849 1.679 1.545 1.403 1.788 1.632 1.508 1.377 1.746 1.599 1.482 1.358 1.690 1.555 1.448 1.334 1.655 1.527 1.426 1.318 1.579 1.467 1.379 1.284 1.530 1.428 1.347 1.261 1.494 1.400 1.325 1.245 100 0.990 0.975 0.950 0.900 1.965 1.770 1.616 1.453 1.893 1.715 1.573 1.423 1.797 1.640 1.515 1.382 1.735 1.592 1.477 1.355 1.692 1.558 1.450 1.336 1.634 1.512 1.415 1.310 1.598 1.483 1.392 1.293 1.518 1.420 1.342 1.257 1.466 1.378 1.308 1.232 1.427 1.347 1.283 1.214 200 0.990 0.975 0.950 0.900 1.868 1.698 1.561 1.414 1.794 1.640 1.516 1.383 1.694 1.562 1.455 1.339 1.629 1.511 1.415 1.310 1.583 1.474 1.386 1.289 1.521 1.425 1.346 1.261 1.481 1.393 1.321 1.242 1.391 1.320 1.263 1.199 1.328 1.269 1.221 1.168 1.279 1.229 1.189 1.144 500 0.990 0.975 0.950 0.900 1.810 1.655 1.528 1.391 1.735 1.596 1.482 1.358 1.633 1.515 1.419 1.313 1.566 1.462 1.376 1.282 1.517 1.423 1.345 1.260 1.452 1.370 1.303 1.229 1.408 1.336 1.275 1.209 1.308 1.254 1.210 1.160 1.232 1.192 1.159 1.122 1.165 1.137 1.113 1.087 ∞ 0.990 0.975 0.950 0.900 1.773 1.626 1.506 1.375 1.696 1.566 1.459 1.342 1.592 1.484 1.394 1.295 1.523 1.428 1.350 1.263 1.473 1.388 1.318 1.240 1.404 1.333 1.274 1.207 1.358 1.296 1.243 1.185 1.247 1.205 1.170 1.130 1.153 1.128 1.106 1.082 1.000 1.000 1.000 1.000 Tafeln 143 Tabelle T.15: Kritische Werte gk,n,α des Cochran-Tests zum Signifikanzniveau α. α = 0.01 n 7 8 0.8988 0.8823 0.7335 0.7107 0.6129 0.5897 k 2 3 4 1 0.9999 0.9933 0.9676 2 0.9950 0.9423 0.8643 3 0.9794 0.8831 0.7814 4 0.9586 0.8335 0.7212 5 0.9373 0.7933 0.6761 6 0.9172 0.7606 0.6410 9 0.8674 0.6912 0.5702 10 0.8539 0.6743 0.5536 16 0.7949 0.6059 0.4884 36 0.7067 0.5153 0.4057 144 0.6062 0.4230 0.3251 ∞ 0.5000 0.3333 0.2500 5 6 7 0.9279 0.8828 0.8376 0.7885 0.7218 0.6644 0.6957 0.6258 0.5685 0.6329 0.5635 0.5080 0.5875 0.5195 0.4659 0.5531 0.4866 0.4347 0.5259 0.4608 0.4105 0.5037 0.4401 0.3911 0.4854 0.4229 0.3751 0.4697 0.4084 0.3616 0.4094 0.3529 0.3105 0.3351 0.2858 0.2494 0.2644 0.2229 0.1929 0.2000 0.1667 0.1429 8 9 10 0.7945 0.7544 0.7175 0.6152 0.5727 0.5358 0.5209 0.4810 0.4469 0.4627 0.4251 0.3934 0.4226 0.3870 0.3572 0.3932 0.3592 0.3308 0.3704 0.3378 0.3106 0.3522 0.3207 0.2945 0.3373 0.3067 0.2813 0.3248 0.2950 0.2704 0.2779 0.2514 0.2297 0.2214 0.1992 0.1811 0.1700 0.1521 0.1376 0.1250 0.1111 0.1000 12 15 20 0.6528 0.5747 0.4799 0.4751 0.4069 0.3297 0.3919 0.3317 0.2654 0.3428 0.2882 0.2288 0.3099 0.2593 0.2048 0.2861 0.2386 0.1877 0.2680 0.2228 0.1748 0.2535 0.2104 0.1646 0.2419 0.2002 0.1567 0.2320 0.1918 0.1501 0.1961 0.1612 0.1248 0.1535 0.1251 0.0960 0.1157 0.0934 0.0709 0.0833 0.0667 0.0500 24 30 40 0.4247 0.3632 0.2940 0.2871 0.2412 0.1915 0.2295 0.1913 0.1508 0.1970 0.1635 0.1281 0.1759 0.1454 0.1135 0.1608 0.1327 0.1033 0.1495 0.1232 0.0957 0.1406 0.1157 0.0898 0.1338 0.1100 0.0853 0.1283 0.1054 0.0816 0.1060 0.0867 0.0668 0.0810 0.0658 0.0503 0.0595 0.0480 0.0363 0.0417 0.0333 0.0250 60 120 ∞ 0.2151 0.1225 0.0000 0.1371 0.0759 0.0000 0.1069 0.0585 0.0000 0.0902 0.0489 0.0000 0.0796 0.0429 0.0000 0.0722 0.0387 0.0000 0.0668 0.0357 0.0000 0.0625 0.0334 0.0000 0.0594 0.0316 0.0000 0.0567 0.0302 0.0000 0.0461 0.0242 0.0000 0.0344 0.0178 0.0000 0.0245 0.0125 0.0000 0.0167 0.0083 0.0000 α = 0.05 n 7 8 0.8332 0.8159 0.6530 0.6333 0.5365 0.5175 9 0.8010 0.6167 0.5017 10 0.7880 0.6025 0.4884 16 0.7341 0.5466 0.4366 36 0.6602 0.4748 0.3720 144 0.5813 0.4031 0.3093 ∞ 0.5000 0.3333 0.2500 k 2 3 4 1 0.9985 0.9669 0.9065 2 0.9750 0.8709 0.7679 3 0.9392 0.7977 0.6841 4 0.9057 0.7457 0.6287 5 0.8772 0.7071 0.5895 6 0.8534 0.6771 0.5598 5 6 7 0.8412 0.7808 0.7271 0.6838 0.6161 0.5612 0.5981 0.5321 0.4800 0.5441 0.4803 0.4307 0.5065 0.4447 0.3974 0.4783 0.4184 0.3726 0.4564 0.3980 0.3535 0.4387 0.3817 0.3384 0.4241 0.3682 0.3259 0.4118 0.3568 0.3154 0.3645 0.3135 0.2756 0.3066 0.2612 0.2278 0.2513 0.2119 0.1833 0.2000 0.1667 0.1429 8 9 10 0.6798 0.6385 0.6020 0.5157 0.4775 0.4450 0.4377 0.4027 0.3733 0.3910 0.3584 0.3311 0.3595 0.3286 0.3029 0.3362 0.3067 0.2823 0.3185 0.2901 0.2666 0.3043 0.2768 0.2541 0.2926 0.2659 0.2439 0.2829 0.2568 0.2353 0.2462 0.2226 0.2032 0.2022 0.1820 0.1655 0.1616 0.1446 0.1308 0.1250 0.1111 0.1000 12 15 20 0.5410 0.4709 0.3894 0.3924 0.3346 0.2705 0.3264 0.2758 0.2205 0.2880 0.2419 0.1921 0.2624 0.2195 0.1735 0.2439 0.2034 0.1602 0.2299 0.1911 0.1501 0.2187 0.1815 0.1422 0.2098 0.1736 0.1357 0.2020 0.1671 0.1303 0.1737 0.1429 0.1108 0.1403 0.1144 0.0879 0.1100 0.0889 0.0675 0.0833 0.0667 0.0500 24 30 40 0.3434 0.2929 0.2370 0.2354 0.1980 0.1576 0.1907 0.1593 0.1259 0.1656 0.1377 0.1082 0.1493 0.1237 0.0968 0.1374 0.1137 0.0887 0.1286 0.1061 0.0827 0.1216 0.1002 0.0780 0.1160 0.0958 0.0745 0.1113 0.0921 0.0713 0.0942 0.0771 0.0595 0.0743 0.0604 0.0462 0.0567 0.0457 0.0347 0.0417 0.0333 0.0250 60 120 ∞ 0.1737 0.0998 0.0000 0.1131 0.0632 0.0000 0.0895 0.0495 0.0000 0.0765 0.0419 0.0000 0.0682 0.0371 0.0000 0.0623 0.0337 0.0000 0.0583 0.0312 0.0000 0.0552 0.0292 0.0000 0.0520 0.0279 0.0000 0.0497 0.0266 0.0000 0.0411 0.0218 0.0000 0.0316 0.0165 0.0000 0.0234 0.0120 0.0000 0.0167 0.0083 0.0000 Die kritischen Werte gk,n,1−α für k und n = N − 1 Freiheitsgrade zum Signifikanzniveau α berechnen sich mit Fn,n(k−1),1− αk gk,n,1−α = , Fn,n(k−1),1− αk + (k − 1) wobei Fm,n,q das q-Quantil der F -Verteilung mit Freiheitsgrad (m, n) darstellt (vgl. Tafeln T.6 bis T.14). 144 Tafeln Tabelle T.16: Kritische Werte kn,α (links) und kn,1−α = n−kn,α (rechts) des Vorzeichentests zum Signifikanzniveau α. Ausserhalb der kritischen Werte ist der Effekt gesichert. n 1 2 3 4 5 6 7 8 9 10 α = 0.025 0 1 0 2 0 3 0 4 0 5 1 5 1 6 1 7 2 7 2 8 Einseitig α = 0.010 0 1 0 2 0 3 0 4 0 5 0 6 1 6 1 7 1 8 1 9 α = 0.005 0 1 0 2 0 3 0 4 0 5 0 6 0 7 1 7 1 8 1 9 n 51 52 53 54 55 56 57 58 59 60 α = 0.025 19 32 19 33 19 34 20 34 20 35 21 35 21 36 22 36 22 37 22 38 Einseitig α = 0.010 17 34 18 34 18 35 19 35 19 36 19 37 20 37 20 38 21 38 21 39 α = 0.005 16 35 17 35 17 36 18 36 18 37 18 38 19 38 19 39 20 39 20 40 11 12 13 14 15 16 17 18 19 20 2 3 3 3 4 4 5 5 5 6 9 9 10 11 11 12 12 13 14 14 2 2 2 3 3 3 4 4 5 5 9 10 11 11 12 13 13 14 14 15 1 2 2 2 3 3 3 4 4 4 10 10 11 12 12 13 14 14 15 16 61 62 63 64 65 66 67 68 69 70 23 23 24 24 25 25 26 26 26 27 38 39 39 40 40 41 41 42 43 43 21 22 22 23 23 24 24 24 25 25 40 40 41 41 42 42 43 44 44 45 21 21 21 22 22 23 23 23 24 24 40 41 42 42 43 43 44 45 45 46 21 22 23 24 25 26 27 28 29 30 6 6 7 7 8 8 8 9 9 10 15 16 16 17 17 18 19 19 20 20 5 6 6 6 7 7 8 8 8 9 16 16 17 18 18 19 19 20 21 21 5 5 5 6 6 7 7 7 8 8 16 17 18 18 19 19 20 21 21 22 71 72 73 74 75 76 77 78 79 80 27 28 28 29 29 29 30 30 31 31 44 44 45 45 46 47 47 48 48 49 26 26 27 27 27 28 28 29 29 30 45 46 46 47 48 48 49 49 50 50 25 25 26 26 26 27 27 28 28 29 46 47 47 48 49 49 50 50 51 51 31 32 33 34 35 36 37 38 39 40 10 10 11 11 12 12 13 13 13 14 21 22 22 23 23 24 24 25 26 26 9 9 10 10 11 11 11 12 12 13 22 23 23 24 24 25 26 26 27 27 8 9 9 10 10 10 11 11 12 12 23 23 24 24 25 26 26 27 27 28 81 82 83 84 85 86 87 88 89 90 32 32 33 33 33 34 34 35 35 36 49 50 50 51 52 52 53 53 54 54 30 31 31 31 32 32 33 33 34 34 51 51 52 53 53 54 54 55 55 56 29 29 30 30 31 31 32 32 32 33 52 53 53 54 54 55 55 56 57 57 41 42 43 44 45 46 47 48 49 50 n 14 27 15 27 15 28 16 28 16 29 16 30 17 30 17 31 18 31 18 32 α = 0.05 29 29 30 30 31 32 32 33 33 34 0.01 91 92 93 94 95 96 97 98 99 100 n 36 55 37 55 37 56 38 56 38 57 38 58 39 58 39 59 40 59 40 60 α = 0.05 13 28 14 28 14 29 14 30 15 30 15 31 16 31 16 32 16 33 17 33 α = 0.02 Zweiseitig 12 13 13 14 14 14 15 15 16 16 α= 34 57 35 57 35 58 36 58 36 59 37 59 37 60 38 60 38 61 38 62 α = 0.02 Zweiseitig 33 58 34 58 34 59 35 59 35 60 35 61 36 61 36 62 37 62 37 63 α = 0.01 Das q-Quantil kn,q mit reduziertem Stichprobenumfang n wird aus der Beziehung P (k+ ≤ kn,q ) = bestimmt. Es gilt kn,1−q = n − kn,q . kn,q X i=0 P (k+ = i) = kn,q n X n 1 i=0 i 2 ≤q Tafeln 145 Tabelle T.17: Kritische Werte rm, α2 (links) und rm,1− α2 (rechts) des Runtests bei m Pluszeichen zum Signifikanzniveau α. Innerhalb der kritischen Werte gilt Zufälligkeit der Stichprobe. 0.10 2 4 6 7 8 10 11 12 13 15 Zweiseitig α = 0.05 α= 1 2 1 1 4 1 1 6 1 1 8 1 2 9 2 3 10 2 3 12 3 4 13 4 5 14 4 6 15 5 m 1 2 3 4 5 6 7 8 9 10 α= 1 1 1 2 3 3 4 5 6 6 11 12 13 14 15 16 17 18 19 20 7 8 9 10 11 11 12 13 14 15 16 17 18 19 20 22 23 24 25 26 7 7 8 9 10 11 11 12 13 14 16 18 19 20 21 22 24 25 26 27 6 7 7 8 9 10 10 11 12 13 21 22 23 24 25 26 27 28 29 30 16 17 17 18 19 20 21 22 23 24 27 28 30 31 32 33 34 35 36 37 15 16 16 17 18 19 20 21 22 23 28 29 31 32 33 34 35 36 37 38 31 32 33 34 35 36 37 38 39 40 25 25 26 27 28 29 30 31 32 33 38 40 41 42 43 44 45 46 47 48 23 24 25 26 27 28 29 30 30 31 40 41 42 43 44 45 46 47 49 50 0.02 2 4 6 8 9 11 12 13 15 16 0.10 49 50 52 53 54 55 56 57 58 59 Zweiseitig α = 0.05 α= 32 51 31 33 52 31 34 53 32 35 54 33 36 55 34 37 56 35 38 57 36 38 59 37 39 60 38 40 61 38 α = 0.01 1 2 1 4 1 6 1 8 1 10 2 11 3 12 3 14 4 15 5 16 m 41 42 43 44 45 46 47 48 49 50 α= 34 35 35 36 37 38 39 40 41 42 0.02 52 54 55 56 57 58 59 60 61 63 17 18 20 21 22 23 25 26 27 28 5 6 7 7 8 9 10 11 11 12 18 19 20 22 23 24 25 26 28 29 51 52 53 54 55 56 57 58 59 60 43 44 45 45 46 47 48 49 50 51 60 61 62 64 65 66 67 68 69 70 41 42 43 44 45 46 47 48 48 49 62 63 64 65 66 67 68 69 71 72 39 40 41 42 43 44 45 46 46 47 64 65 66 67 68 69 70 71 73 74 38 39 40 41 42 42 43 44 45 46 65 66 67 68 69 71 72 73 74 75 14 14 15 16 17 18 19 19 20 21 29 31 32 33 34 35 36 38 39 40 13 14 14 15 16 17 18 19 19 20 30 31 33 34 35 36 37 38 40 41 61 62 63 64 65 66 67 68 69 70 52 53 54 55 56 57 58 58 59 60 71 72 73 74 75 76 77 79 80 81 50 51 52 53 54 55 56 57 58 58 73 74 75 76 77 78 79 80 81 83 48 49 50 51 52 53 54 55 55 56 75 76 77 78 79 80 81 82 84 85 47 48 49 50 50 51 52 53 54 55 76 77 78 79 81 82 83 84 85 86 22 23 24 25 25 26 27 28 29 30 41 42 43 44 46 47 48 49 50 51 21 22 23 24 24 25 26 27 28 29 42 43 44 45 47 48 49 50 51 52 71 72 73 74 75 76 77 78 79 80 61 62 63 64 65 66 67 68 69 70 82 83 84 85 86 87 88 89 90 91 59 60 61 62 63 64 65 66 67 68 84 85 86 87 88 89 90 91 92 93 57 58 59 60 61 62 63 64 64 65 86 87 88 89 90 91 92 93 95 96 56 57 58 58 59 60 61 62 63 64 87 88 89 91 92 93 94 95 96 97 Das q-Quantil rm,q des Runtests mit m Pluszeichen wird aus der Beziehung rm,q P (r ≤ rm,q ) = bestimmt, wobei f (r) = 2 2 X r=2 m−1 m−1 (r−1)/2 (r−3)/2 2m m m−1 2 (r−2)/2 2m m f (r) ≤ q wenn r ungerade wenn r gerade. α = 0.01 29 54 30 55 31 56 32 57 33 58 34 59 35 60 36 61 36 63 37 64 146 Tafeln Tabelle T.18: Kritische Werte DN,1−α des Lilliefors-Test auf Normalverteilung bei einem Stichprobenumfang von N zum Signifikanzniveau α. Quelle: [21], Seite 398. N 4 5 α = 0.10 0.352 0.315 α = 0.05 0.381 0.337 α = 0.01 0.417 0.405 6 7 8 9 10 0.294 0.276 0.261 0.249 0.239 0.319 0.300 0.285 0.271 0.258 0.364 0.348 0.331 0.311 0.294 11 12 13 14 15 0.230 0.223 0.214 0.207 0.201 0.249 0.242 0.234 0.227 0.220 0.284 0.275 0.268 0.261 0.257 16 17 18 19 20 0.195 0.189 0.184 0.179 0.174 0.213 0.206 0.200 0.195 0.190 0.250 0.245 0.239 0.235 0.231 25 30 30 < N 0.165 0.144 0.180 0.161 0.203 0.187 0.805 √ N 0.886 √ N 1.031 √ N Tafeln 147 Tabelle T.19: Kritische Werte GN,1−α des Ausreissertests nach Grubbs bei einem Stichprobenumfang von N zum Signifikanzniveau α. N 1 2 3 4 5 6 7 8 9 10 α = 0.10 α = 0.05 α = 0.02 α = 0.01 1.155 1.493 1.749 1.944 2.097 2.221 2.323 2.410 N 51 52 53 54 55 56 57 58 59 60 α = 0.10 2.780 2.787 2.794 2.801 2.808 2.815 2.822 2.828 2.835 2.841 α = 0.05 2.965 2.972 2.980 2.987 2.994 3.001 3.007 3.014 3.021 3.027 α = 0.02 3.189 3.196 3.204 3.212 3.219 3.226 3.233 3.240 3.246 3.253 α = 0.01 3.345 3.353 3.361 3.369 3.376 3.384 3.390 3.398 3.404 3.411 1.148 1.425 1.602 1.729 1.828 1.909 1.977 2.036 1.153 1.463 1.671 1.822 1.938 2.032 2.110 2.176 1.154 1.485 1.725 1.904 2.042 2.152 2.244 2.322 11 12 13 14 15 16 17 18 19 20 2.088 2.134 2.176 2.213 2.248 2.279 2.309 2.336 2.361 2.385 2.234 2.285 2.331 2.372 2.409 2.443 2.475 2.504 2.531 2.557 2.389 2.448 2.500 2.547 2.589 2.628 2.663 2.695 2.725 2.753 2.484 2.549 2.607 2.658 2.705 2.747 2.785 2.821 2.854 2.884 61 62 63 64 65 66 67 68 69 70 2.847 2.853 2.859 2.865 2.871 2.876 2.882 2.887 2.893 2.898 3.033 3.039 3.045 3.051 3.057 3.062 3.068 3.073 3.079 3.084 3.259 3.265 3.271 3.278 3.283 3.289 3.295 3.300 3.306 3.311 3.418 3.424 3.430 3.437 3.443 3.449 3.454 3.460 3.466 3.471 21 22 23 24 25 26 27 28 29 30 2.408 2.429 2.449 2.468 2.486 2.503 2.520 2.536 2.551 2.565 2.580 2.603 2.624 2.644 2.663 2.681 2.698 2.714 2.730 2.745 2.780 2.804 2.827 2.849 2.869 2.889 2.907 2.925 2.942 2.958 2.912 2.938 2.963 2.987 3.009 3.029 3.049 3.068 3.086 3.103 71 72 73 74 75 76 77 78 79 80 2.903 2.908 2.913 2.918 2.923 2.928 2.932 2.937 2.941 2.946 3.089 3.094 3.099 3.104 3.109 3.114 3.118 3.123 3.127 3.132 3.316 3.322 3.327 3.332 3.337 3.341 3.346 3.351 3.355 3.360 3.476 3.482 3.487 3.492 3.497 3.502 3.507 3.511 3.516 3.521 31 32 33 34 35 36 37 38 39 40 2.579 2.592 2.605 2.618 2.630 2.641 2.652 2.663 2.674 2.684 2.760 2.773 2.787 2.799 2.812 2.824 2.835 2.846 2.857 2.868 2.973 2.988 3.002 3.016 3.029 3.041 3.053 3.065 3.077 3.088 3.119 3.135 3.150 3.164 3.178 3.191 3.204 3.216 3.228 3.239 81 82 83 84 85 86 87 88 89 90 2.950 2.955 2.959 2.963 2.967 2.972 2.976 2.980 2.984 2.987 3.136 3.141 3.145 3.149 3.153 3.157 3.161 3.165 3.169 3.173 3.364 3.369 3.373 3.377 3.382 3.386 3.390 3.394 3.398 3.402 3.525 3.530 3.534 3.539 3.543 3.547 3.551 3.555 3.559 3.563 41 42 43 44 45 46 47 48 49 50 2.694 2.704 2.713 2.722 2.731 2.739 2.748 2.756 2.764 2.772 2.878 2.888 2.897 2.906 2.915 2.924 2.933 2.941 2.949 2.957 3.098 3.108 3.118 3.128 3.138 3.147 3.156 3.164 3.172 3.181 3.251 3.261 3.272 3.282 3.292 3.301 3.310 3.319 3.328 3.337 91 92 93 94 95 96 97 98 99 100 2.991 2.995 2.999 3.003 3.006 3.010 3.013 3.017 3.020 3.024 3.177 3.181 3.185 3.188 3.192 3.196 3.199 3.203 3.206 3.210 3.405 3.409 3.413 3.417 3.421 3.424 3.428 3.431 3.435 3.438 3.567 3.571 3.575 3.579 3.582 3.586 3.590 3.593 3.597 3.601 Die kritischen Werte GN,1−α für N Messwerte zum Signifikanzniveau α berechnen sich mit v u t2N −2, α N − 1u N t , GN,1−α = √ t2N −2, α + (N − 2) N N wobei tn,q das q-Quantil der Student-t-Verteilung mit n Freiheitsgraden ist (vgl. Tafel T.3). 148 Tafeln Literaturverzeichnis [1] H.-P. Beck-Bornholdt und H.-H Dubben, Der Hund, der Eier legt, 6. Auflage, Rowohlt Taschenbuch Verlag, Hamburg, 2005. [2] K. Bosch, Großes Lehrbuch der Statistik, Oldenburg Verlag, München, 1996. [3] K. Bosch, Elementare Einführung in die angewandte Statistik, 7. Auflage, Vieweg Studium-Basiswissen, 2000. [4] P. J. Brockwell und R. A. Davis, Introduction to Time Series and Forecasting, 2nd Edition, Springer Texts in Statistics, 2003. [5] B. Efron und R. J. Tibshirani, An Introduction to the Bootstrap, Monographs on Statistics and Applied Probability 57, Chapman & Hall, 1993. [6] L. Fahrmeir, R. Künstler, I. Pigeot und G.Tutz, Statistik. Der Weg zur Datenanalyse, Springer-Verlag, Berlin, 2002. [7] P. Gschwind, Einführung in die Stochastik, Skriptum FHBB, Version 00, 2000. [8] P. Gschwind, Statistische Methoden, Skriptum FHBB, Version 98, 1998. [9] T. Heim, Stochastik, Skriptum FHBB, 2003. [10] W. Krämer, So lügt man mit Statistik, Piper Verlag, 2002. [11] U. Krengel, Einführung in die Wahrscheinlichkeitstheorie und Statistik, 6. Auflage, Vieweg Studium-Aufbaukurs Mathematik, 2000. [12] E. Kreyszig, Statistische Methoden und ihre Anwendungen, Vandenhoeck & Ruprecht, 6. Auflage, 1977. [13] M. Kühlmeyer, Statistische Auswertungsmethoden für Ingenieure, Springer-Verlag, 2001. [14] D. C. Montgomery, Introduction to Statistical Quality Control, 4th Edition, John Wiley & Sons, Inc., 2001. [15] L. Papula, Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 10. Auflage, Viewegs Fachbücher der Technik, 2001. [16] L. Papula, Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 4. Auflage, Viewegs Fachbücher der Technik, 2001. 149 150 Literaturverzeichnis [17] J. A. Rice, Mathematical Statistics and Data Analysis, 2nd Edition, Duxbury Press, 1995. [18] L. Sachs, Angewandte Statistik - Anwendung statistischer Methoden, Springer, 10. Auflage, 2002. [19] D. Schmid, Tabellenfunktionen in Visual Basic, Skriptum FHBB, 2000. [20] W. A. Stahel, Statistische Datenanalyse, 4. Auflage, Viewegs Fachbücher der Technik, 2002. [21] R. Storm, Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle, 11. Auflage, Fachbuchverlag Leipzig, 2001. [22] M. Steiner-Curtis, Wahrscheinlichkeitstheorie und Statistik, Skriptum FHNW, 2015. [23] B. L. van der Warden, Mathematische Statistik, 3. Auflage, Springer-Verlag, Berlin, 1973. [24] W. A. Wallis und A. V. Roberts, Methoden der Statistik, Rowohlt, Reinbeck, 1969. Index Alternativhypothese, 27 ANOVA, 87 Faktor, 87 Gruppe, 87 Merkmal, 87 Anpassungstest, 77 Approximation, 96 Ausgleichs -kurve, 96 Ausreisser, 83 Ausreisserproblem, 83 Ausreissertest, 83 nach Cochran für Varianzen, 85 nach Grubbs für Mittelwerte, 85 nach Grubbs für Stichprobenwerte, 84 F -Test, 54 F -Verteilung, 55 Fadenpendel, 24 Fehler 1. Art, 31 2. Art, 31 absolute, 18 grobe, 14, 17 Mittelwertes relativer, 19 mittlerer, 18 relative, 18 systematische, 14, 17 wahrscheinlichste, 20 zufällige, 14, 17 Fehlerfortpflanzung, 17 Fehlerfortpflanzungsgesetz, 19 Fehlerkurve, 14 Fehlerquadratsumme, 93, 96, 105 Fehlerquellen, 125 Fisher Sir Ronald Aylmer, 1890-1962, 2 Fisher-Test, 54 Freiheitsgrade χ2 -Varianztest, 50 χ2 -Verteilung, 51 F -Test, 54 F -Verteilung, 55 Student-t-Test, 37 Student-t-Verteilung, 38 Behrens-Fisher-Problem, 45 Bindung, 62 Carl Friedrich Gauss, 1777-1855, 93 χ2 -Anpassungstest, 76 χ2 -Varianztest, 49 χ2 -Verteilung, 51 Cochran William Gemmell, 1909-1980, 59 Cochran-Test, 58 Cramersche Regel, 94 Einstichproben-t-Test, 36 empirische Summenfunktion, 80 erforderliche Messgenauigkeit, 17 Erwartungswert, 8 F -Verteilung, 56 χ2 -Verteilung, 51 Binomialverteilung, 8 Normalverteilung, 13 Poissonverteilung, 10 stetige Zufallsgrösse, 11 Student-t-Verteilung, 39 exponentielles Glätten, 122 Exzess, 74 Gammafunktion, 39 Gausssche Glockenkurve, 13 Normalverteilung, 13 Glättung, 117 Glättungsfaktor, 122 Gleichungssystem lineares, 97 gleitender Durchschnitt, 117 151 152 siebner, 117 vierer, 117 12-Monate, 117 Gosset William Sealey, 1876-1937, 40 Grenzwertsatz von de Moivre und Laplace, 15 zentraler, 14 Grundgesamtheit, 1 heteroskedastisch, 45 Histogramm, 71 homoskedastisch, 43 Hypothese, 27 i.i.d, 113 Intervallschätzungen, 40 Irrtumswahrscheinlichkeit, 28 Kolmogoroff N. Andrey, 1903-1987, 2 Kolmogoroff-Smirnov-Test, 80 Konfidenzintervall χ2 -Varianztest, 52 Einstichproben-t-Test, 40 Erwartungswert, 40 Student-t-Test, 40 Varianz, 52 Kurtosis, 74 Lilliefors-Test, 80 Macht eines Tests, 32 mathematisches Pendel, 24 Maximalfehler, 20 absoluter, 20 relativer, 20 Median, 65 Medianlinie, 65 Messfehler, 18 Methode der kleinsten Quadrate, 18, 93, 105 Mittel arithmetische, 18 Mittelwert bei Klasseneinteilung, 73 geschätzt, 36, 43, 45 mittlerer Fehler, 18 MKQ, 18, 93, 105 Modus, 126 Index Momente zentrale, 74 Momentenmethode, 74 Moving Average, 117 Normalgleichungssystem, 98 Normalverteilung mit Parametern µ und σ, 13 standardisiert, 13 Transformation, 13 Nullhypothese, 27 Operationscharakteristik, 33 Paarweiser Vergleich zweier Mittelwerte, 46 Pearson Egon Sharpe, 1895-1980, 2 Pearson Karl, 1857-1936, 2 Pendel mathematisches, 24 Phasendurchschnittsverfahren, 118 Placebo, 87 Poissonverteilung, 10 Prüfen auf Normalverteilung, 71 einer Verteilung, 69 von Erwartungswerten, 35 von Varianzen, 49 Prognose h-Schritt-, 120 Prognoseverfahren, 120 Quantil F -Verteilung, 56 χ2 -Verteilung, 51 Runtest, 67, 145 Student-t-Verteilung, 39 Vorzeichentest, 63, 144 Regel von Cramer, 94 Regression, 104 Regressions -funktion, 96 -gerade, 93, 104, 105 -koeffizient, 95, 106 -konstante, 95, 106 Regressionsanalyse, 103 Index einer Geraden, 106 zweier Geraden, 109 Regressionsrechnung, 93 Residuen, 81, 116 Restkomponente, 115 Restvarianz, 107 robust, 37, 83 Rotweinverkauf, 114 Runtest, 64 Saisonindex, 119 Saisonkomponente, 115 Schiefe, 74 σ-Bereich, 15 Signifikanzniveau, 28 Signifikanztest, 28 Skewness, 74 Standardabweichung, 8 Binomialverteilung, 8 Statistik, 1 beschreibende, 1 deskriptive, 1 induktive, 1 schliessende, 1 statistische Datenanalyse, 1 statistischen Tests, 28 Statistischer Test, 27 Stichprobe, 1 Stichprobenumfang erforderlicher, 42 Streuung F -Verteilung, 56 χ2 -Verteilung, 51 Binomialverteilung, 8 diskrete Zufallsgrösse, 8 Normalverteilung, 13 Poissonverteilung, 10 stetige Zufallsgrösse, 11 Student-t-Verteilung, 39 Student-t-Test, 36 Student-t-Verteilung, 38 Summenfunktion empirische, 80 Summenhäufigkeit absolute, 71 relative, 71 Summenzeichen 153 vertauschen, 98 t-Verteilung, 38 Tafeln, 129 Ausreissertest nach Grubbs, 147 χ-Verteilung, 132, 133 Cochran-Test, 143 F -Verteilung, 134–142 Lilliefors-Test, 146 Quantile der standardisierten Normalverteilung, 130 Runtest, 145 standardisierte Normalverteilung, 130 Student-t-Verteilung, 131 Vorzeichentest, 144 Temperaturmonatsmittel, 64 Test auf Ausreisser nach Cochran für Varianzen, 85 auf Ausreisser nach Grubbs für Mittelwerte, 85 auf Ausreisser nach Grubbs für Stichprobenwerte, 84 auf Schiefe und Exzess, 74 auf Zufälligkeit, 64 χ2 -Anpassungs-, 76 χ2 -Varianzen, 49 Cochran-, 58 Einstichproben-t-, 36 F -, 54 Kolmogoroff-Smirnov, 80 Lilliefors-, 80 parameterfrei, 61 t-, 36 verteilungsfrei, 61 z-, 31 Zweistichproben-t-, 42 Testgrösse, 28 ANOVA, 89 Ausreissertest, 84 χ2 -Anpassungstest, 78 χ2 -Varianzentest, 50 F -Test, 54 Lilliefors-Test, 81 Regressionsanalyse, 107 Regressionskoeffizienten, 110 Regressionskonstanten, 110 154 Runtest, 66 Student-t-Test, 36 Varianzanalyse, 89 Trend, 115 Trend-Saison-Model, 115 Trendbereinigung, 115–117 Trennschärfe eines Tests, 32 Ungleichung Cauchy-Schwarz, 95 Variable nichtstochastisch, 103 stochastisch, 104 Varianz, 19 F -Verteilung, 56 χ2 -Verteilung, 51 bei Klasseneinteilung, 73 Binomialverteilung, 8 diskrete Zufallsgrösse, 8 geschätzt, 36, 43, 45, 49 gewogene Mittel der, 43 Normalverteilung, 13 Poissonverteilung, 10 stetige Zufallsgrösse, 11 Student-t-Verteilung, 39 Varianzanalyse, 87 einfaktorielle, 87 Faktor, 87 Gruppe, 87 Merkmal, 87 Varianzzerlegung, 89 Verteilung F -, 55 χ2 -, 51 diskret, 7 Normal-, 13 stetig, 7, 11 Student-t, 38 t-, 38 Verteilungsfunktion, 8, 11 Vertrauensintervall χ2 -Varianztest, 52 Einstichproben-t-Test, 40 Erwartungswert, 40 Student-t-Test, 40 Varianz, 52 Index Vertrauenswahrscheinlichkeit, 41, 52 Vorzeichentest, 61 Wölbung, 74 Wahrscheinlichkeit, 7 Wahrscheinlichkeitsdichte, 11 Wahrscheinlichkeitsfunktion, 7 Wahrscheinlichkeitsnetz, 69 Wahrscheinlichkeitspapier, 69 Wirtschafts-Nobelpreise, 113 z-Test, 31 Zeichentest, 61 Zeitreihe, 3, 113 Ein-Schritt-Prognose, 122 Prognose, 120 Saisonkomponente eliminieren, 118 Saisonkomponente schätzen, 118 Trend eliminieren, 115 Trend schätzen, 115 Zerlegung, 114 Zeitreihenanalyse, 115 Zeitreihenmodel additives, 115 Zentralwert, 65 Zufallsgrösse, 7 Zufallsvariable, 7 Zweistichproben-t-Test, 42 unbekannte Varianzen, 45 unbekannten gleiche Varianzen, 43