Datenanalyse (dan)

Werbung
Datenanalyse (dan)
Prof. Dr. Marcel Steiner-Curtis
10. November 2015
Prof. Dr. Marcel Steiner-Curtis
FHNW Fachhochschule Nordwestschweiz
Hochschule für Technik
Bahnhofstrasse 6
CH-5210 Windisch
[email protected]
www.fhnw.ch/personenseiten/marcel.steiner/
Liebe Studierende
Was, schon wieder Mathematik! So, oder ähnlich könnte es zu Beginn der statistischen Datenanalyse tönen. Jein, die statistische Datenanalyse basiert zwar auf der Mathematik, ist aber in
den letzten Jahren zunehmend zu einem eigenständigen, voll akzeptierten und nicht mehr weg
zu denkenden Teil der modernen Natur- und Ingenieurwissenschaften geworden. Im Gegensatz zur klassischen Mathematik, in der die meisten Ideen seit mehr als 200 Jahren bekannt
sind, ist Statistik eine moderne Wissenschaft. Sie hat mit dem Aufkommen leistungsfähiger
Computer immense Fortschritte gemacht. Plötzlich ist es möglich, riesige Datenmengen zu
verarbeiten und z.B. auf interessante und verborgene Muster systematisch zu durchkämmen.
(Stichwort: Data-Mining.)
Dies ist mitunter ein Grund, wenn nicht der Grund, dass wir bei den Übungen voll auf
den Computer setzen. Die Aufgaben in diesem Skriptum bearbeiten wir (fast) alle mit Excel.
Dazu verwenden wir die zahlreichen eingebauten Statistikfunktionen, z.B. NORMINV, TTEST,
FTEST, CHIVERT, um nur einige zu nennen. Tafeln lesen ist nun endgültig passé – halt, nicht
ganz. Die Tafeln im Anhang dienen Ihnen zur “Kalibrierung” der Computerbefehle. Häufig
stehen wir nämlich vor dem Problem Wie ist das Quantil mit diesem oder dem anderen
”
Computerprogramm definiert?” Um dies zu beantworten, können Sie nun solange mit dem
jeweiligen Computerbefehl herum hantieren, bis Sie den Zahlenwert in der Tafel – die Sie ja
verstehen – erhalten. Und dann steht Ihnen nichts mehr im Weg, statistische Tests en Masse
durchzuführen. Aber Achtung! Zuerst denken – dann Computereinsatz.
Zum Vorlesungs- und Übungsbetrieb ist nicht viel zu schreiben: Ich erkläre, motiviere, führe vor; Sie üben, lernen, üben, versuchen zu begreifen, und üben. Die Aufgaben und
Lösungen können Sie vom Active Directory der Hochschule für Technik, FHNW herunterladen.
Ich bin mir sicher, Statistik ist eines der wenigen Fachgebiete, das Sie bis in alle Ewigkeit
verfolgen wird, sei es beim Zeitunglesen, bei der TV- und Radio-Berieselung oder im Beruf.
Eine Bitte noch habe ich an Sie: Seien Sie auf der Hut! Wie Sie wissen, wird mit Statistik
jede Menge Unfug betrieben. Es ist mir ein besonderes Anliegen, dass Sie kritisch und wachsam
betreffend allen Zahlenangaben und Statistiken sind, die Sie selber anfertigen und antreffen
(speziell meinen gegenüber).
Sie kennen sicher einige der häufig gehörten Bonmots:
Ich glaube keiner Statistik, die ich nicht selbst gefälscht habe.“
”
Sir Winston Churchill, 1874-1965 (ungesichert)
Alles, was lediglich wahrscheinlich ist, ist wahrscheinlich falsch.“
”
René Descartes, 1596-1650
Die Statistik ist die erste der ungenauen Wissenschaften.“
”
Edmond de Goncourt, 1822-1896
i
ii
Es gibt drei Arten der Lüge, die gewöhnliche Lüge, die Notlüge und die Statistik.“
”
Mark Twain, 1835-1910
To call in the statistician after the experiment is done may be no more than
”
asking him to perform a postmortem examination: he may be able to say what the
experiment died of.“
Sir R. A. Fisher, Indian Statistical Congress, Sankhya, um 1938
Je planmässiger ein Mensch vorgeht, desto wirksamer vermag ihn der Zufall zu
”
treffen.“
Friedrich Dürrenmatt, 1921-1990.
Man sollte alles so einfach wie möglich sehen, aber nicht einfacher.“
”
Albert Einstein, 1879-1955
Prediction is very difficult, especially about the future.“
”
Niels Bohr, 1885-1962
Sie sind die n plus ersten Studierenden, die mit diesem Skriptum arbeiten. Urteilen Sie
nicht zu hart über den Autor (und die k-ten Studierenden, wobei k ∈ {1, . . . , n}), wenn Sie
Fehler und Ungereimtheiten finden, sondern teilen Sie mir diese bitte mit.
10. November 2015, Marcel Steiner-Curtis
Inhaltsverzeichnis
Liebe Studierende
i
Inhaltsverzeichnis
iii
1 Einführung
1.1
Was ist Statistik, statistische Datenanalyse? . . . . . .
1.2
Aktienkurse – Der Traum, die Zukunft vorauszusagen
1.3
Prognosen zu Weltrekorden im Sport . . . . . . . . . .
1.4
Was die Werbung verspricht . . . . . . . . . . . . . . .
.
.
.
.
1
1
3
3
5
2 Grundlagen
2.1
Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2
Stetige Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
11
3 Fehlerrechnung
3.1
Der wahre Wert einer zu messenden Grösse . . . . . .
3.2
Wahrscheinlichster Wert einer Messgrösse . . . . . . .
3.3
Fehlerfortpflanzung . . . . . . . . . . . . . . . . . . . .
3.4
Berechnung des Fehlers bei speziellen Funktionstypen .
3.5
Erforderliche Messgenauigkeit . . . . . . . . . . . . . .
.
.
.
.
.
17
18
18
19
22
24
4 Statistische Tests
4.1
Das Prinzip des statistischen Tests . . . . . . . . . . . . . . . . . . . . . . .
4.2
Einseitiger und zweiseitiger Test . . . . . . . . . . . . . . . . . . . . . . . . .
4.3
Mögliche Fehler bei statistischen Tests . . . . . . . . . . . . . . . . . . . . .
27
27
29
31
5 Prüfen von Erwartungswerten (Parametertests)
5.1
Problemstellung der technischen Statistik . . . . . . . . . . . . . . . . .
5.2
Einstichproben-t-Test, Student-t-Test . . . . . . . . . . . . . . . . . . . .
5.2.1 Vertrauensintervall für den Erwartungswert . . . . . . . . . . . .
5.2.2 Ungefähr erforderlicher Stichprobenumfang . . . . . . . . . . . .
5.3
Vergleich zweier Mittelwerte unverbundener Stichproben . . . . . . . . .
5.3.1 Zweistichproben-t-Test bei unbekannten aber gleichen Varianzen
5.3.2 Zweistichproben-t-Test bei unbekannten Varianzen . . . . . . . .
5.4
Paarweiser Vergleich bei verbundenen Stichproben . . . . . . . . . . . .
35
35
36
40
42
42
43
45
46
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
Inhaltsverzeichnis
6 Prüfen von Varianzen (Parametertests)
6.1
Abweichung einer Varianz vom theoretischen Wert, χ2 -Varianztest
6.1.1 Vertrauensintervall für die Varianz . . . . . . . . . . . . . .
6.2
Vergleich zweier Varianzen, F -Test . . . . . . . . . . . . . . . . . .
6.3
Vergleich von mehreren Varianzen, Cochran-Test . . . . . . . . . .
.
.
.
.
49
49
52
54
58
7 Verteilungsfreie (parameterfreie) Tests
7.1
Vorzeichentest nach Dixon und Mood . . . . . . . . . . . . . . . . . . . . . .
7.2
Test auf Zufälligkeit – Runtest . . . . . . . . . . . . . . . . . . . . . . . . .
61
61
64
8 Prüfen der Verteilung der Grundgesamtheit
8.1
Wahrscheinlichkeitspapier für die Normalverteilung
8.2
Test auf Schiefe und Exzess – Momentenmethode .
8.3
χ2 -Anpassungstest . . . . . . . . . . . . . . . . . .
8.4
Lilliefors-Test auf Normalverteilung . . . . . . . . .
.
.
.
.
69
69
74
76
80
9 Das Ausreisserproblem
9.1
Ausreissertest nach Grubbs für Stichprobenwerte . . . . . . . . . . . . . . .
9.2
Ausreissertest nach Grubbs für Mittelwerte . . . . . . . . . . . . . . . . . .
9.3
Ausreissertest nach Cochran für Varianzen . . . . . . . . . . . . . . . . . . .
83
84
85
85
10 Varianzanalyse – ANOVA
10.1 Einfaktorielle Varianzanalyse . . . . . . . . . . . . . . . . . . . . . . . . . .
87
87
11 Regressionsrechnung
11.1 Regressionsgerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2 Allgemeine Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
93
96
12 Regressionsanalyse
12.1 Allgemeines . . . . . . . . . . . . .
12.2 Regressionsgerade . . . . . . . . . .
12.3 Regressionsanalyse einer Geraden .
12.4 Regressionsanalyse zweier Geraden
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
103
105
106
109
13 Zeitreihen
13.1 Universelles Beispiel . . . . . . . . . . . . . . . . .
13.2 Zerlegung einer Zeitreihe in Komponenten . . . . .
13.3 Schätzung und Elimination des Trends . . . . . . .
13.4 Schätzung und Elimination der Saisonkomponente
13.5 Prognose . . . . . . . . . . . . . . . . . . . . . . . .
13.6 Ein-Schritt-Prognose bei bereinigten Zeitreihen . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
114
114
115
118
120
122
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14 Fehlerquellen bei statistischen Untersuchungen
125
Tafeln
129
Literaturverzeichnis
148
Index
151
Kapitel 1
Einführung
1.1
Was ist Statistik, statistische Datenanalyse?
Statistik1 ist eine Sammlung von Methoden, welche uns erlauben, vernünftige Entscheidungen
”
im Fall von Unsicherheit zu treffen.“ (vgl. [24]).
Die statistische Datenanalyse hat die Aufgabe, Erscheinungen in der Natur, Wirtschaft
und Technik mit den Mitteln der Stochastik anhand von konkreten Daten zu untersuchen
und wissenschaftlich zu beurteilen. Ihr Anwendungsgebiet reicht heutzutage von der Medizin
über die Biologie, Physik, Wirtschaftswissenschaften und Technik bis zur Industrie. Die Methoden der mathematischen Statistik sind überall dort zu einem unentbehrlichen Hilfsmittel
geworden, wo Versuchsergebnisse auszuwerten sind.
Der Ursprung der mathematischen Statistik liegt im Sammeln und Zusammenstellen von
Daten und in der grafischen Darstellung dieser Messergebnisse. In der Bevölkerungsstatistik
entstanden auf diese Weise die ersten Geburts-, Heirats- und Sterberegister. Seit jeher war es
ein grundlegendes Ziel, das umfangreiche und oft unübersichtliche Datenmaterial zu ordnen
und auf einzelne charakteristische Werte zu reduzieren. Dies führte zu Tabellen, grafischen
Darstellungen und zur Bildung von Mittelwerten und Varianzen. Später wurden diese Methoden der beschreibenden (deskriptiven) Statistik auch auf die naturwissenschaftlichen
und technischen Gebiete angewandt. Mit Hilfe der beschreibenden Statistik erhalten wir aber
immer nur Aussagen über die vorliegende Stichprobe2 .
Wir möchten aber auch ausgehend von der konkret vorhandenen Stichprobe allgemeingültige
Aussagen über die Grundgesamtheit machen können. Dabei handelt es sich um die schliessende (induktive) Statistik, welche vor allem durch die bahnbrechenden Arbeiten von
K. Pearson (1857-1936), seinem Sohn E. S. Pearson (1895-1980), R. A. Fisher (1890-1962),
A. N. Kolmogoroff (1903-1987), und N. W. Smirnov (1900-1966) vorangetrieben wurden.
Heute sind wir bestrebt, die schliessende Statistik auf allen Gebieten der Ingenieur- und Naturwissenschaften einzusetzen, in denen Daten auszuwerten und zu analysieren sind. Da ohne
sie eine fundierte wissenschaftliche Beurteilung der zu untersuchenden Messergebnisse nur
unvollständig möglich ist.
Wegen den grossen anfallenden Datenmengen ist der Einsatz modernster Computerhilfsmittel
1
status lat. Beschreibung des Zustandes eines Gemeinwesens wie der Bevölkerungsgrösse.
Das Wort stammt aus der Verhüttung von Eisenerz des ausgehenden Mittelalters. Die Hüttenleute haben
aus dem Schmelzofen eine zufällige Probe genommen, indem Sie mit einem Probelöffel in das flüssige Eisenerz
hineinstachen und so einen Stich herausnahmen, um dessen Reinheit und Schmelzzustand zu überprüfen.
2
1
2
Kapitel 1. Einführung
Abbildung 1.1.i: Karl Pearson, 1857-1936
Abbildung 1.1.ii: Egon Sharpe Pearson,
1895-1980
Abbildung 1.1.iii: Sir Ronald Aylmer Fisher, 1890-1962
Abbildung 1.1.iv: Andrey Nikolaevich
Kolmogoroff, 1903-1987
(Excel, S-Plus, R, SAP) zur statistischen Datenanalyse unumgänglich. Gerade deswegen muss
der Anwender wissen, was die verwendeten Programme berechnen, und wie die Ergebnisse zu
interpretieren sind.
Heutzutage wird leider jede Menge Unfug mit Statistik betrieben. Mit zu präzisen Zahlen
und statistischen Auswertungen werden dem interessierten Leser oft Seriosität vorgegaukelt,
die nicht sein kann. Die Verwendung von statistischen Tests, deren Voraussetzungen nicht
erfüllt sind, führt oft zu falschen Rückschlüssen. Aus kleinen Stichproben dürfen Aussagen
mit Statistik gemacht werden aber mit einer entsprechenden grossen Unsicherheit3 . Bei einer
gegebenen Fragestellung gibt es oft mehrere richtige Ansätze zur Datenanalyse. Wichtig dabei
ist, Statistik korrekt einzusetzen, Resultate nicht über zu interpretieren und vor allem nicht
voreingenommen Datenmaterial zu untersuchen. Oft wird aus Unwissenheit oder manipulativ
so lange statistische Datenanalyse betrieben, bis das gewünschte Resultat vorliegt. Dies hat
3
Ideal ist natürlich immer, die Stichprobe grösser zu machen. Dass dies aber nicht immer möglich ist, zeigt
das Beispiel eines Biologen, der Aussagen über eine bestimmte Fischspezie machen will (muss) und der in
seinem Aquarium nur fünf Fische hat. Er muss einfach damit leben können, dass die Unsicherheiten seiner
Aussagen sehr gross sind.
1.2. Aktienkurse – Der Traum, die Zukunft vorauszusagen
3
aber nichts mit wissenschaftlichem Arbeiten zu tun (vgl. [10]). Deshalb müssen wir lernen,
was mit statistischen Methoden alles ausgesagt werden darf und kann.
1.2
Aktienkurse – Der Traum, die Zukunft vorauszusagen
Ein wichtiges und sicher einträgliches Anwendungsgebiet der statistischen Datenanalyse ist
die Analyse von Finanzmarktdaten, z.B. von Aktien-, Wechsel- und Zinskursen. Ziele sind
etwa das Aufspüren von systematischen Strukturen, der Einfluss bestimmter politischer oder
wirtschaftlicher Ereignisse, schnelles Erkennen von Veränderungen und Entscheidungsunterstützung für An- und Verkauf sowie Portfoliogestaltung. Neben Kursen einzelner Aktien
bilden dazu auch die Werte eines Aktienindex eine wichtige Datengrundlage. Bekannte Aktienindizes sind etwa der Dow-Jones-Index, NASDAQ, Nikkei-Index (Japan), der Deutsche
Aktienindex oder der Swiss Market Index.
Haben wir zum Beispiel eine Aktie über die letzten paar Jahre oder Monate beobachtet und
jeweils ihren Kurswert xt in einem Diagramm in Funktion der diskreten Zeit t (z.B. jeden
Handelstag) aufgezeichnet, so erhalten wir eine so genannte Zeitreihe (vgl. Kapitel 13).
Indem wir nun versuchen einen Trend, saisonale oder andere, eventuell periodische Einflüsse
mit einem geeigneten Model zu erkennen, könnten wir zukunftsgerichtete Aussagen über die
Rendite einer Aktie unter Berücksichtigung ihres Risikos machen. Diese Überlegungen, die
jeden Tag zig-tausendfach gemacht werden, basieren natürlich auf der Idee, dass sich hinter
der Kursentwicklung einer Aktie eine mathematische Gesetzmässigkeit verbirgt.
Abbildung 1.2.i: Aktienkurs der Vodafone Group, einem Telekommunikationsunternehmen,
über die letzten fünf Jahre betrachtet. Der Kurseinbruch im Frühjahr 2000 liess sich in keiner
Weise aus dem vorhandenen Datenmaterial schliessen. Hingegen können wir lokale Trends
ausmachen. Aber wir sehen deutlich, dass je länger der Prognosehorizont wird, desto unzuverlässiger wird der vergangene Trend.
1.3
Prognosen zu Weltrekorden im Sport
Der Spiegel hat 1992 gemeldet, dass die schnellste Frau im Jahr 1998 den Marathon in derselben Zeit läuft wie der schnellste Mann. Es stellt sich natürlich die Frage, wie diese Hypothese
4
Kapitel 1. Einführung
entstanden ist und wieso die Folgerungen der Autoren falsch waren, denn bis zum heutigen
Zeitpunkt, also nach 1998, sind die Männer im Marathon immer noch deutlich schneller als
die Frauen. Zeigt dies, dass in der Statistik jede beliebige Aussage bekommen werden kann,
wenn die Daten nur ins entsprechende Licht gerückt werden?
Rekorde auf der Aschenbahn: Frauen holen auf4
Keine der derzeitigen Weltrekordhalterinnen in den Laufdisziplinen könnte bei den Olym”
pischen Spielen im Sommer bei der männlichen Konkurrenz mitmachen: Die Frauen würden
die Qualifikationsnormen nicht erreichen. Das wird sich, so jedenfalls spekulieren die amerikanischen Physiologen Brian J. Whipp und seine Kollegin Susan A. Ward von der University
of California, im Laufe der kommenden Jahrzehnte ändern. Schon 1998 wird nach Ansicht
der Wissenschaftler eine Frau in der Lage sein, die Marathonstrecke von 42.195 Kilometer
ebenso schnell zu laufen wie der dann schnellste Mann ... in zwei Stunden und zwei Minuten.
Die Gleichheit der Geschlechter auf der 200-Meter-Strecke soll, bei einer Zeit von 18.6 Sekunden, spätestens im Jahre 2050 erreicht sein. Zu dieser kühnen Hochrechnung gelangten die
Physiologen bei einem Vergleich der Durchschnittsgeschwindigkeiten, die auf den verschiedenen Laufstrecken gemessen wurden. Dabei ergab sich über die Jahrzehnte ein gleichmässiger
Tempozuwachs – mit nur einem Unterschied: Bei den Frauen stieg die Beschleunigungskurve
doppelt so schnell. So steigerten die männlichen Weltrekordler ihre Durchschnittsleistung seit
1908 von 241 Meter je Minute auf 332 Meter. Die Frauen hingegen schafften allein seit 1963
etwa 105 Meter mehr – ihre Minutenleistung stieg von 194 auf 299 Meter.“
Abbildung 1.3.i: Entwicklung der Weltrekorde im Marathon bei den Männern und Frauen. Die
Laufgeschwindigkeit wurde jeweils in Metern pro Minute aufgetragen. Die Frauen konnten die
Durchschnittsgeschwindigkeit in den letzten 30 Jahren erheblich verbessern, die Steigerung
bei den Männern verlief viel langsamer. Dies veranlasste die Autoren des Artikels zur offensichtlich falschen Schlussfolgerung, dass die Marathonlaufzeiten von Frauen und Männern
spätestens im Jahre 1998 gleich sein werden. Zum Glück haben die Autoren keine Prognose
für das Jahr in dem wir leben gewagt. Es ginge gar nicht so lang, bis die Marathonstrecke
mit Lichtgeschwindigkeit durchlaufen würde.
Aufgabe
Aufgabe 1.3.1. Finden Sie anhand der beiden Tabellen der Entwicklung der Weltrekorde im
Marathon heraus, wie die amerikanischen Physiologen zu obiger Behauptung kamen. Wieso
ist die Studie falsch? Wo liegen die Fehlüberlegungen?
4
vgl. Der Spiegel 3/1992
1.4. Was die Werbung verspricht
Jahr
1908
1909
1913
1920
1925
1935
1947
1952
1953
1954
1958
1960
1963
1964
1965
1967
1969
1984
1985
1988
(1998)
(1999)
(2002)
(2003)
(2007)
(2008)
Männer [in min]
175.31
160.57
156.11
152.60
149.03
146.70
145.65
140.70
138.58
137.66
135.28
135.27
134.47
132.19
132.00
129.61
128.56
128.08
127.20
126.93
(126.05)
(125.42)
(125.38)
(124.55)
(124.26)
(123.59)
5
Jahr
1963
1964
1967
1970
1974
1975
1977
1978
1979
1980
1981
1983
1985
(1998)
(1999)
(2001)
(2002)
(2003)
Frauen [in min]
217.12
199.55
195.37
182.88
163.90
158.32
154.80
152.50
147.55
145.68
145.48
142.72
141.10
(140.47)
(139.46)
(138.47)
(137.18)
(135.25)
In Klammern sind die Weltrekorde aufgetragen, die nach 1998 gelaufen wurden. Die Zeiten
sind erst ab 1908 aufgeführt, da vorher die Marathonstrecke etwas kürzer war. Wenn in
einem Jahr die Zeit mehrmals verbessert wurde, ist nur die Jahresweltbestzeit in der Tabelle
aufgenommen. Quelle: http://de.wikipedia.org/wiki/Marathonlauf
1.4
Was die Werbung verspricht
Wie zufrieden sind Firmenkunden mit ihren Telekommunikationsanbietern? Das Beratungsunternehmen ocha GmbH untersuchte im Auftrag der Zeitschrift BILANZ die Zufriedenheit der Schweizer Wirtschaft mit den Telecom-Providern in der Schweiz. Dabei ging es um
die Aspekte Qualität, Innovation, Preis, Flexibilität und Support – das alles in den Bereichen Festnetz, Mobile, Corporate Networks und Internet-Service-Provider. Angefragt wurden
15000 Informatik- und Telecom-Leiter aus verschiedenen Unternehmen.
Die Studie wurde in der Septemberausgabe 2003 der Zeitschrift BILANZ publiziert. Die
Quintessenz der Studie ist gemäss BILANZ : Besser werden dürften alle. Am besten schlägt
”
sich [der Anbieter] Colt – als Sieger in zwei Disziplinen.“ In der Studie steht weiter: Deutlich
”
nach unten ging es mit Sunrise dafür im Bereich Internet-Service-Provider“ und . . .im Mo”
bilfunk, sind die drei Anbieter Swisscom, Orange und Sunrise nahe zusammengerückt. Nach
stetigem Aufwärtstrend hat heuer zum ersten Mal Orange die Führung übernommen“.
Generell lässt sich aus der Studie herauslesen, dass sich die beiden Anbieter Swisscom und
Sunrise im breiten Mittelfeld mit einer durchschnittlichen Leistung befinden.
Nun hat auf Grund dieser Studie die Firma Sunrise ein ganzseitiges Inserat in der Basler
6
Kapitel 1. Einführung
Zeitung vom 4. Oktober 2003 geschaltet, in dem sich Sunrise nur mit Swisscom vergleicht. Dies
mit der Begründung, dass die beiden die einzigen Full-Service-Provider sind. Im Inserat befand
sich die in Abbildung 1.4.i abgebildete Säulengrafik. Aus diesen Zahlen kommt nun Sunrise
zum Schluss: Möchten Sie von Ihrem Provider einen Full-Service, gibt es in der Schweiz nur
”
zwei Varianten. Welche die bessere ist, können Sie sich jetzt noch leichter ausrechnen. . .“
Abbildung 1.4.i: Säulengrafik der Sunrise-Werbung in der BaZ vom Freitag, 4. Oktober 2003.
Es steht da . . .können Sie sich jetzt noch leichter ausrechnen. . .“, nichts leichteres als das.
”
Leider kommen beim Betrachten der Säulengrafik starke Zweifel auf. Die vertikale Achse ist
genau so angeschrieben, dass ein maximaler Werbeeffekt erzielt werden konnte. Informieren
wir uns aber in der BILANZ -Studie, so vernehmen wir, dass sich die vertikale Achse in
Wirklichkeit von 5(!) bis 30 erstreckt5 . Sind Unterschiede von 0.1, 0.4 und 1.5 Punkten auf
total 25 wirklich signifikant? Wohl kaum. In Kapitel 5.4 werden wir einen statistischen Test
kennen lernen, der uns besagt, dass aus diesem Zahlenmaterial unter keinen Umständen der
Schluss gezogen werden kann, dass Sunrise besser ist als Swisscom.
Die Frage, ob es sich bei der BILANZ -Studie um eine seriöse handelt, ist eine andere. Tatsache
ist, dass 19.5 beim Sunrise-Festnetz falsch ist. In der Studie wird 4.6 + 4.1 + 3.3 + 4.4 + 3.2
gleich 19.5 gesetzt. Hätten die Leute bei Sunrise die BILANZ -Studie wirklich angeschaut, so
hätten sie sich vielleicht zu folgender Inserate-Headline hinreissen lassen: Ein Kantersieg auf
”
der ganzen Linie!“
Aufgabe
Aufgabe 1.4.1 (lebenslang zu lösen). Seien Sie wachsam, ob in den Medien, in der Werbung,
in der Politik, am Arbeitsplatz oder unter Freunden statistische Daten seriös verarbeitet und
kommuniziert werden. Identifizieren Sie unseriöse Ergebnisse und seien Sie in der Lage, bessere
Analysen durchzuführen. Im Extremfall sollten Sie bei jeder Prozent- und Zahlenangabe, die
Ihnen an den Kopf geworfen wird, nachfragen, wie diese zu Stande gekommen sei.
5
Die einzelnen Punkte setzen sich aus fünf Teilnoten von 1 bis 6 zusammen.
Kapitel 2
Grundlagen
Die mathematische Statistik und im Speziellen die Statistische Datenanalyse, für die wir
uns hier interessieren, basieren wesentlich auf der Stochastik. Die Vorlesung über Stochastik
aus dem dritten Semester (vgl. [7], [9] oder [22]) wird hiermit als bekannt vorausgesetzt. Im
Folgenden wollen wir kurz die wichtigsten Begriffe und Ideen repetieren.
Betrachten wir einen Versuch mit dem Stichprobenraum S. Jedem Ausfall s von S sei eine
reelle Zahl zugeordnet
X : S −→ R
s 7−→ X(s) = x
Eine solche Zuordnung heisst eine Wahrscheinlichkeitsfunktion und X eine Zufallsgrösse
oder Zufallsvariable.1 Nimmt die Wahrscheinlichkeitsverteilung nur diskrete Werte an, dann
handelt es sich um eine diskrete Verteilung sonst um eine stetige Verteilung.
An Hand eines einprägsamen Beispiels betrachten wir den Unterschied zwischen einer diskreten und einer stetigen Verteilung:
Beispiel 2.0.1. Der Stichprobenraum S sei die Menge aller Studierenden einer Klasse. Die
Zufallsgrösse X ordne nun jedem Studierenden s die Länge in Zentimeter seines rechten Fusses
zu. In diesem Fall können alle Fusslängen im Intervall [5cm, 40cm] angenommen werden. Die
Fusslängen einer Klasse sind also stetig verteilt.
Fragen wir nun aber nach der jeweiligen Schuhnummer der Studierenden, so erhalten wir nur
Werte in der Menge {34, 34 12 , 36, . . . , 46, 46 12 }. Die Schuhnummern einer Klasse sind somit
diskret verteilt. Je nach dem welches Merkmal betrachtet wird, kann also eine Stichprobe zu
einer diskreten oder stetigen Verteilung führen.
2.1
Diskrete Verteilungen
Die Verteilung einer diskreten Zufallsgrösse X, die die Werte x1 , . . . , xn annehmen kann, wird
durch die Angabe ihrer Wahrscheinlichkeiten charakterisiert. Jedem Ausfall si aus dem
Stichprobenraum S, respektive X(si ) = xi , entspricht eine Wahrscheinlichkeit
pi = P (X = xi ) ∈ [0, 1]
1
Zufallsgrössen werden im Allgemeinen mit grossen lateinischen Buchstaben X, Y, Z, . . . und die Werte, die
sie annehmen, mit kleinen lateinischen Buchstaben x, y, z, . . . bezeichnet.
7
8
Kapitel 2. Grundlagen
als Funktion von xi aufgefasst. Im diskreten Fall gilt
n
X
pi = 1.
i=1
Die pi können in Form einer Tabelle angegeben werden. Die Verteilungsfunktion F einer
diskreten Zufallsgrösse ist durch
X
F (x) = P (X ≤ x) =
pi
alle i mit xi ≤x
gegeben. Die Summation erfolgt über alle pi , für die xi höchstens gleich x ist. Die Verteilungsfunktion F ist eine monoton wachsende Treppenfunktion mit Sprüngen der Höhe pi an den
Stellen xi . Der Erwartungswert der diskreten Zufallsgrösse X beträgt
µ = E(X) =
n
X
xi p i ,
i=1
die Varianz oder Streuung ist
n
n
X
X
σ 2 = Var(X) = E (X − µ)2 =
(xi − µ)2 pi =
x2i pi − µ2 .
i=1
i=1
Die (positive) Quadratwurzel σ heisst Standardabweichung. Wir repetieren kurz einige
wichtige diskrete Verteilungen.
Die Binomialverteilung
Die Binomialverteilung beschäftigt sich mit Ereignissen, bei denen zwei alternative Ausgänge
auftreten können, wie zum Beispiel Münzwurf (Kopf oder Zahl, gleich wahrscheinlich) oder
beim Werfen eines Würfels (6 oder keine 6 geworfen, ungleich wahrscheinlich). Wir betrachten
also einen Versuch mit zwei möglichen Ausfällen:
• Erfolg mit Wahrscheinlichkeit p ∈ [0, 1].
• Misserfolg mit Wahrscheinlichkeit q = 1 − p ∈ [0, 1].
Dieser Versuch werde n mal durchgeführt. Es sei X die Zufallsgrösse, deren Werte x die Anzahl
Erfolge bei n Versuchen bedeute. Wir bestimmen nun die Wahrscheinlichkeitsverteilung von
X.
Bei n Versuchen gibt es genau nx Anordnungen mit x Erfolgen und n−x Misserfolgen. Damit
erhalten wir die Binomialverteilung
n x n−x
n x
=
p (1 − p)n−x .
P (X = x) =
p q
x
x
Der Erwartungswert einer binomialverteilten Zufallsgrösse beträgt
µ = E(X) = np,
die Varianz oder Streuung einer binomialverteilten Zufallsgrösse ist
σ 2 = Var(X) = npq.
Die Standardabweichung der binomialverteilten Zufallsgrösse beträgt σ =
√
npq.
2.1. Diskrete Verteilungen
9
p
p
pn
q
pn−1 q
p
pn−2 q 2
q
pn−3 q 3
p
q
q
p
p
px q n−x
q
px−1 q n−x+1
p
q
q
p
p
q
q
1
2
···
n−1
p
p3 q n−3
q
p2 q n−2
p
pq n−1
q
qn
n
Abbildung 2.1.i: Wahrscheinlichkeitsbaum der Binomialverteilung mit Erfolgs- p und Misserfolgswahrscheinlichkeit q = 1 − p.
Aufgaben
Aufgabe 2.1.1. Es werden drei ideale Würfel gleichzeitig geworfen. Die Zufallsgrösse X sei
die Anzahl Sechsen. Bestimmen Sie die Wahrscheinlichkeitsverteilung, den Erwartungswert
und die Varianz von X.
Aufgabe 2.1.2. Einer Lieferung wird mit Zurücklegen eine Stichprobe vom Umfang n = 40
entnommen. Falls die Stichprobe mehr als zwei unbrauchbare Teile enthält, dann wird die
Lieferung zurückgewiesen. Gesucht ist die Annahmewahrscheinlichkeit P der Lieferung, wenn
sie p = 1% unbrauchbare Teile enthält.
Lösungen
Lösung 2.1.1. Wahrscheinlichkeitsverteilung
xi
pi
0
0.5787
Erwartungswert µ = 0.5, Varianz σ 2 =
Lösung 2.1.2. P = 0.9925
1
0.3472
5
12 .
2
0.0694
3
0.0046
10
Kapitel 2. Grundlagen
Die Poissonverteilung
Bei vielen Anwendungen, die eigentlich mit der Binomialverteilung zusammenhängen, ist die
Erfolgswahrscheinlichkeit p beim einzelnen Experiment klein, das heisst, der Erfolg ist ein
seltenes Ereignis. Gleichzeitig ist die Anzahl n der Ausführungen sehr gross. In einem solchen
Fall approximieren wir die Binomialverteilung durch die Poissonverteilung. Diese ergibt
sich, wenn n so gegen unendlich strebt, dass der Erwartungswert
µ = np
gegen einen endlichen Wert strebt. Die Poissonverteilung besitzt die folgende Wahrscheinlichkeitsverteilung
µx −µ
P (X = x) =
e
x!
mit dem positiven Parameter µ und x ∈ N0 . Der Erwartungswert und die Varianz oder
Streuung der Poissonverteilung sind
µ = E(X) = µ
und
σ 2 = Var(X) = µ,
d.h., bei der Poissonverteilung sind Erwartungswert und Varianz gleich dem Parameter µ.
In der praktischen Anwendung finden sich zahlreiche Beispiele für das Auftreten poissonverteilter Zufallsgrössen. So kann die Anzahl der auf einer Kreuzung innerhalb einer festen
Zeitspanne (eine Minute) vorbeifahrender Fahrradfahrer als poissonverteilt angesehen werden. Die Wahrscheinlichkeit dafür, dass in einer Minute genau x Fahrradfahrer vorbeifahren,
wenn die Anzahl der vorbeifahrenden Fahrradfahrer je Minute im Durchschnitt µ beträgt, ist
x
dann durch µx! e−µ gegeben. Weitere Beispiele für poissonverteilte Zufallsgrössen sind:
• Die Anzahl der innerhalb einer kurzen Zeitspanne zerfallenden Atome eines radioaktiven
Präparats.
• In einer Spinnerei die Anzahl der Fadenbrüche innerhalb einer vorgegebenen Zeitspanne
bei einer bestimmten Garnsorte.
• Die Anzahl der während einer festen Zeit beobachteten Sternschnuppen.
• Die Anzahl Kinder, die an einem Tag in einer Stadt zur Welt kommen.
Da die Poissonverteilung ein Grenzfall der Binomialverteilung ist, kann je nach Genauigkeitsansprüchen für etwa p ≤ 0.1 und n ≥ 100 statt der Binomialverteilung auch die Poissonverteilung verwendet werden.
Aufgaben
Aufgabe 2.1.3. Eine Fabrik produziert Präzisonswerkstücke, die mit einer Wahrscheinlichkeit p = 0.001 defekt sind. Wie gross ist die Wahrscheinlichkeit, dass eine Lieferung von
n = 500 Werkstücken mindestens 2 unbrauchbare Werkstücke enthält.
Aufgabe 2.1.4. Die Schwiegermutter kommt im Jahr etwa zehnmal zu Besuch. Wie gross ist
die Wahrscheinlichkeit, dass sie in den nächsten drei Wochen mindestens einmal vorbeischaut?
2.2. Stetige Verteilungen
11
Lösungen
Lösung 2.1.3. P = 0.0902
Lösung 2.1.4. P = 44%
2.2
Stetige Verteilungen
Viele physikalische Messungen sind Beispiele von stetigen Zufallsgrössen. Für die Verteilungsfunktion F einer stetigen Zufallsgrösse X, die jeden Wert in einem bestimmten Intervall annehmen kann, gilt
Z x
Z x
F (x) = P (X ≤ x) =
f (x) dx =
f (t) dt.
−∞
−∞
Die nichtnegative Funktion f heisst Wahrscheinlichkeitsdichte von X. Wir stellen die
wichtigsten Eigenschaften der Funktionen F und f zusammen.
1. Die Funktion F ist stetig, monoton wachsend mit F (−∞) = 0 und F (+∞) = 1.
2. Der Gesamtflächeninhalt unter der Wahrscheinlichkeitsdichtekurve ist gleich 1, d.h.
Z ∞
f (x) dx = 1.
−∞
3. Es gilt
d
dx F (x)
= F ′ (x) = f (x) für alle x ∈ R.
4. Die Wahrscheinlichkeit ein Ereignis zwischen x1 und x2 zu erhalten, beträgt
Z x2
P (x1 ≤ X ≤ x2 ) =
f (x) dx = F (x2 ) − F (x1 ).
x1
y
1
F (x)
f (x)
x
x
Abbildung 2.2.i: Verteilungsfunktion F und Wahrscheinlichkeitsdichte F ′ = f .
Der Erwartungswert der stetigen Zufallsgrösse X beträgt
Z ∞
µ = E(X) =
xf (x) dx,
die Varianz oder Streuung ist
Z
σ 2 = Var(X) = E (X − µ)2 =
−∞
∞
−∞
(x − µ)2 f (x) dx =
Z
∞
−∞
x2 f (x) dx − µ2 .
12
Kapitel 2. Grundlagen
Aufgaben
Aufgabe 2.2.1. Bestimmen Sie den Parameter a in
ax2 wenn 0 ≤ x ≤ 1
f (x) =
0
sonst.
so, dass f eine Wahrscheinlichkeitsdichte ist. Bestimmen Sie dann den Erwartungswert und
die Varianz dieser Verteilung. Berechnen Sie P (0.5 ≤ X ≤ 1).
Aufgabe 2.2.2. Die Dichtefunktion einer stetigen Verteilung laute
ax(2 − x) wenn 0 ≤ x ≤ 2
f (x) =
0
sonst.
a. Bestimmen Sie den Parameter a, so dass es sich bei f in der Tat um eine Dichtefunktion
handelt.
b. Wie lautet die dazugehörige Verteilungsfunktion?
c. Berechnen Sie die Wahrscheinlichkeit, dass die Zufallsgrösse X einen Wert kleiner oder
gleich 1 annimmt.
Aufgabe 2.2.3. Pumpen eines bestimmten Typs laufen im Mittel etwa 100 Stunden bis
zum Ausfall. Eine bestimmte Pumpe sei ununterbrochen in Betrieb, bis sie ausfalle. Die
Zufallsgrösse X, die die zufällige Dauer der Funktionsfähigkeit der Pumpe beschreibt, sei
stetig verteilt mit der Dichte der Form
0
wenn x < 0
f (x) =
2
−λx
λ xe
wenn x ≥ 0.
Bestimmen Sie den Parameter λ so, dass der Erwartungswert der Verteilung der Erfahrung
mit dem Pumpentyp entspricht. Wie gross ist die Wahrscheinlichkeit, dass eine Pumpe dieses
Typs weniger als 100 Stunden läuft?
Lösungen
Lösung 2.2.1. a = 3, µ = 34 , σ 2 =
3
80 ,
P (0.5 ≤ X ≤ 1) =
Lösung 2.2.2.
a. a =
3
4
b. F (x) =

 0

1
2
4 (3x
1
wenn x < 0
− x3 ) wenn 0 ≤ x ≤ 2
wenn x > 2
c. P (X ≤ 1) = 0.5
Lösung 2.2.3. λ =
1
50 ,
P (X ≤ 100) = 0.5941
7
8
2.2. Stetige Verteilungen
13
Die Normalverteilung
Die bekannteste und bei allen Problemen der Statistik und der statistischen Datenanalyse am
häufigsten verwendete Verteilung einer stetigen Zufallsgrösse ist die Gausssche Normalverteilung. Die stetige Zufallsgrösse X, die alle reellen Werte zwischen −∞ und +∞ annehmen
kann, besitzt eine Normalverteilung mit den Parametern µ und σ 2 , wenn ihre Dichte
durch
(x−µ)2
1
f (x) = ϕ(x, µ, σ 2 ) = √
e− 2σ2
für − ∞ < x < ∞
2πσ 2
gegeben ist. Symbolisch schreiben wir X ∼ N (µ, σ 2 ). Bei bekannten Werten µ und σ ist
die Gestalt der Dichtefunktion völlig bestimmt. Die Verteilungsfunktion erhalten wir durch
Integration der Dichte
Z x
(x−µ)2
1
2
e− 2σ2 dx.
F (x) = Φ(x, µ, σ ) = √
2πσ 2 −∞
Für obiges Integral gibt es keine elementare Stammfunktion, dies ist aber kein Problem, da
für die Anwendungen stets Tafeln oder Computerprogramme (z.B. Excel) verwendet werden
können.
Tragen wir die Dichte ϕ in Abhängigkeit von x in ein kartesisches Koordinatensystem ein,
so ergibt sich die bekannte Gestalt der Gaussschen Glockenkurve. Das Maximum von ϕ
liegt bei x = µ und beträgt √ 1 2 . Die Dichte ist symmetrisch bezüglich x = µ und nähert
2πσ
sich für x → ±∞ asymptotisch der x-Achse. Die Wendepunkte liegen bei x = µ ± σ. Damit
ist die Glockenkurve um so höher und steiler, je kleiner σ ist.
Der Erwartungswert und die Varianz oder Streuung der normalverteilten Zufallsgrösse
X beträgt
E(X) = µ und Var(X) = σ 2 .
Die Parameter der Normalverteilung lassen sich damit leicht deuten: µ ist der Erwartungswert
der Zufallsgrösse X und σ 2 die Varianz.
Durch eine Massstabsänderung auf der Koordinatenachse und einer Nullpunktverschiebung
auf der x-Achse
x−µ
z=
σ
kann von der Normalverteilung mit den Parametern µ und σ 2 zur standardisierte Normalverteilung mit den Parametern µ = 0 und σ 2 = 1 übergegangen werden, symbolisch
Z ∼ N (0, 1). Die Dichte ist dann
z2
1
f (z) = ϕ(z, 0, 1) = √ e− 2
2π
und die Verteilungsfunktion
1
F (z) = Φ(z, 0, 1) = √
2π
Z
z
e−
z2
2
dz.
−∞
Diese Transformation gestattet die Benutzung der Tabelle T.1 zur Berechnung der Verteilungsfunktion einer N (µ, σ 2 ) normalverteilten Zufallsgrösse aus der standardisierten Normalverteilung. Die Anwendung dieser Transformation, die im wesentlichen einer Integralsubstitution entspricht, führt uns auf folgende Berechnungsformeln für Wahrscheinlichkeiten von
14
Kapitel 2. Grundlagen
normalverteilten Zufallsgrössen X ∼ N (µ, σ 2 ). Es gilt
Z x2
(x−µ)2
1
P (x1 ≤ X ≤ x2 ) = √
e− 2σ2 dx = Φ(x2 , µ, σ 2 ) − Φ(x1 , µ, σ 2 )
2πσ 2 x1
Z x2 −µ
σ
z2
1
=√
e− 2 dz = Φ x2σ−µ , 0, 1 − Φ x1σ−µ , 0, 1
x1 −µ
2π
σ
und im Falle von unbeschränkten Intervallen
P (X ≤ x2 ) = Φ(x2 , µ, σ 2 ) = Φ
x2 −µ
σ , 0, 1 ,
P (x1 ≤ X) = 1 − P (X < x1 ) = 1 − Φ(x1 , µ, σ 2 ) = 1 − Φ
x1 −µ
σ , 0, 1 .
Die letzte Beziehung folgt direkt aus der Symmetrie der Normalverteilung bezüglich x = µ
und der Normierung des gesamten Flächeninhalts unter der Glockenkurve auf Eins.
Die Bedeutung der Normalverteilung in der Statistik
Die Normalverteilung wurde von C. F. Gauss (1809) im Zusammenhang mit seiner Theorie
der Beobachtungsfehler entdeckt. Sie wird daher auch Fehlerkurve genannt. Führen wir in
der Praxis wiederholt Messungen an ein und demselben Gegenstand, etwa der Länge eines
Stabes oder Durchmessers einer Welle durch, so ergibt bekanntlich nicht jede Messung den
gleichen Wert. Die erhaltenen Werte weisen kleinere oder grössere Abweichungen voneinander und von einem bestimmten “wahren” Wert, dem Mittelwert, auf. Diese Abweichungen
oder Beobachtungsfehler haben verschiedene Ursachen, wie zum Beispiel Schwankungen der
Raumtemperatur, Einflüsse der Umgebung auf das Messgerät, Ungenauigkeiten der Messskala, Wechsel im Prüfpersonal usw. Nach ihrer Herkunft unterscheiden wir zwischen systematischen und zufälligen Fehlern. Die groben Fehler (z.B. Ablesefehler oder defekte Instrumente)
schliessen wir von vornherein aus, da sie im Prinzip vermeidbar sind.
1. Systematische Fehler: Systematische Fehler sind oft nicht vermeidbar. Zu ihnen
gehören Nullpunktsverschiebungen oder Skalenfehler. Die Ursache kann bei Mängeln
an den Instrumenten liegen. Systematische Fehler können meistens beseitigt werden.
2. Zufällige Fehler: Sie ergeben sich aus dem Zusammenwirken zahlreicher Fehlerursachen, die vom Beobachter nicht erfasst oder beseitigt werden können. Zufällige Fehler
sind unvermeidbar. Sie entstehen zum Beispiel aus Mängeln des Beobachters, Witterungseinflüssen, Erschütterungen, Ablagerung von Staub usw. Solche Einflüsse ergeben
Zufälligkeiten. Solche zufällige Fehler, Zufallsgrössen, verursachen bei Messungen Abweichungen nach beiden Seiten vom wahren Wert. Sprechweise: Die Messwerte streuen.
Mit Hilfe der Theorie der Grenzwertsätze können Verteilungen für diese zufälligen Fehler
gefunden werden. In den meisten Fällen, wo durch additive Überlagerung einer grossen Anzahl
voneinander unabhängiger, zufälliger Effekte entstehen, wobei jeder dieser Effekte nur einen
unbedeutenden Einfluss auf den zufälligen Gesamtfehler hat, ergibt sich als Grenzverteilung
die Normalverteilung. Diesem Sachverhalt liegt der Zentrale Grenzwertsatz zu Grunde,
der aussagt, dass unter bestimmten Bedingungen jede Summe (unabhängiger) Zufallsgrössen
näherungsweise normalverteilt ist. Aus diesem Grund können in den meisten praktischen
Anwendungsfälle die Beobachtungsfehler bei Messvorgängen wenigstens näherungsweise als
normalverteilt angesehen werden.
2.2. Stetige Verteilungen
15
Ein wichtiger Spezialfall des Zentralen Grenzwertsatzes, der Grenzwertsatz von de Moivre
und Laplace, spielt eine wichtige Rolle in der mathematischen Statistik. Dieser besagt,
dass eine binomialverteilte Zufallsgrösse X mit Erwartungswert E(X) = np und Varianz
Var(X) = np(1 − p), näherungsweise normalverteilt mit den Parametern
µ = np
und
σ 2 = np(1 − p)
ist. Danach können wir für eine binomialverteilte Zufallsgrösse X für grosses n die Näherungsformel
!
!
x2 − np
x1 − np
P (x1 ≤ X ≤ x2 ) ≈ Φ p
, 0, 1 − Φ p
, 0, 1
(2.2.a)
np(1 − p)
np(1 − p)
verwenden. In der Literatur wird diese Näherung als Faustregel für n >
9
p(1−p)
empfohlen.
Aufgaben
Aufgabe 2.2.4. Bestimmen Sie die folgenden Wahrscheinlichkeiten einer standardisierten
Normalverteilung.
a. Ein-σ-Bereich: P (−1 ≤ X ≤ 1)
b. Zwei-σ-Bereich: P (−2 ≤ X ≤ 2)
c. Drei-σ-Bereich: P (−3 ≤ X ≤ 3)
d. P (X ≤ 1)
e. P (|X| ≥ 12 )
f. P (−3 ≤ X ≤ 1)
Aufgabe 2.2.5. Berechnen Sie
a. die Wahrscheinlichkeit P (−4 ≤ X ≤ 8) wenn X ∼ N (2, 4);
b. die Wahrscheinlichkeit P (2 ≤ X) wenn X ∼ N (1, 9);
c. die Wahrscheinlichkeit P (|X| ≤ 1) wenn X ∼ N (−1, 16).
Aufgabe 2.2.6. Bei einer Herstellung von Kugellagerkugeln ist der Durchmesser einer Kugel
eine normalverteilte Zufallsgrösse mit µ = 5.00 mm und σ = 0.04 mm. Alle Kugeln, deren
Durchmesser um mehr als 0.05 mm vom Sollwert abweichen, werden als Ausschuss aussortiert.
Wie gross ist der Ausschussprozentsatz?
Aufgabe 2.2.7. Der Intelligenzquotient (IQ) ist eine in guter Näherung normalverteilte Zufallsgrösse X und habe in einer bestimmten Population die Parameterwerte µ = 100 und
σ = 15.
a. Mit welcher Wahrscheinlichkeit hat eine zufällig ausgewählte Person einen IQ zwischen
100 und 130?
b. Mit welcher Wahrscheinlichkeit nimmt die Zufallsgrösse IQ einen Wert an, der grösser
ist, als 130?
16
Kapitel 2. Grundlagen
c. Welchen Mindestintelligenzquotienten haben die 10% der Intelligentesten dieser Population?
Aufgabe 2.2.8. Eine Abfüllmaschine füllt ein Erzeugnis in Dosen. Das Nettogewicht einer Dose ist eine normalverteilte Zufallsgrösse. Die Standardabweichung, als Mass für die
Präzision mit der die Maschine arbeitet, sei 8 g. Auf welchen Mittelwert ist die Maschine
einzustellen, wenn höchstens 5% aller Dosen weniger als 250 g enthalten sollen?
Lösungen
Lösung 2.2.4.
a. P (−1 ≤ X ≤ 1) = 0.6827
b. P (−2 ≤ X ≤ 2) = 0.9545
c. P (−3 ≤ X ≤ 3) = 0.9973
d. P (X ≤ 1) = 0.8413
e. P (|X| ≥ 12 ) = 0.6171
f. P (−3 ≤ X ≤ 1) = 0.8400
Lösung 2.2.5.
a. P (−4 ≤ X ≤ 8) = 0.9973
b. P (2 ≤ X) = 0.3694
c. P (|X| ≤ 1) = 0.1915
Lösung 2.2.6. 21.13%
Lösung 2.2.7.
a. P (100 ≤ X ≤ 130) = 0.4772
b. P (130 ≤ X) = 0.0228
c. IQ ≥ 119.23
Lösung 2.2.8. µ = 263.2 g
Kapitel 3
Fehlerrechnung
Jede physikalische Messung ist mit Fehlern behaftet. Die so genannten groben, systematischen
und die zufälligen Fehler können unterschieden werden:
1. Grobe Fehler: Sie entstehen etwa bei falscher Beobachtung oder schadhaften Instrumenten. Sie sind im Prinzip vermeidbar.
2. Systematische Fehler: Zu ihnen gehören Nullpunktsverschiebungen oder Skalenfehler.
Die Ursache kann bei Mängeln an den Instrumenten liegen. Systematische Fehler sind
entweder systematisch grösser oder systematisch kleiner als der wahre Wert einer Grösse.
Sie können meistens beseitigt werden.
3. Zufällige Fehler: Sie ergeben sich aus dem Zusammenwirken zahlreicher Fehlerursachen, die vom Beobachter nicht erfasst oder beseitigt werden können. Sie entstehen zum
Beispiel aus Mängeln des Beobachters, Witterungseinflüssen usw. Solche Einflüsse ergeben Zufälligkeiten. Da positive und negative Vorzeichen gleich wahrscheinlich sind,
kompensieren sich gewisse Teilfehler. Zufällige Fehler gehorchen den Gesetzen der Statistik. Sie sind unvermeidbar, und wir müssen mit ihnen leben und umgehen können.
Zu den zwei wichtigsten Aufgaben der Fehlerrechnung gehören die Fehlerfortpflanzung und
erforderliche Messgenauigkeit einer Messung. Die beiden Aufgaben sind als zueinander invers
zu betrachten.
1. Fehlerfortpflanzung: Sind die Fehler gemessener Grössen ungefähr bekannt, und werden aus den gemessenen Grössen andere Grössen berechnet, so ist anzugeben, wie sich
die Messfehler auf die zu berechnenden Grössen auswirken. So wird nicht durch Rechnung eine nicht vorhandene Genauigkeit vorgetäuscht.
2. Erforderliche Messgenauigkeit: Wird vorgeschrieben, mit welcher Genauigkeit eine
Grösse aus einer Messung zu bestimmen ist, so lassen sich mit Hilfe der Fehlerrechnung
die einzuhaltenden Messfehler abschätzen und Entscheidungen über die zu verwendenden Instrumente und Messmethoden treffen.
17
18
3.1
Kapitel 3. Fehlerrechnung
Der wahre Wert einer zu messenden Grösse
Ist X der wahre Wert einer zu messenden Grösse und x ein entsprechender Messwert1 , so
heisst
ǫ=X −x
der Messfehler des Messwertes. Als zufälliger Fehler muss ǫ klein und in gewissen Grenzen
bleiben. Werden mehrere Messungen durchgeführt, so ergeben sich Werte x1 , . . . , xN , die um
den wahren Wert X streuen. Die Fehler ǫi = X − xi für alle i ∈ {1, . . . , N } werden gleich
wahrscheinlich negativ und positiv sein und normalverteilt um ǫ = 0 liegen. Dies folgt aus
dem zentralen Grenzwertsatz (vgl. Kap. 2.2). Hingegen sind die Fehler ǫ1 , . . . , ǫN selbst meist
unbekannt.
Ist ∆x eine Schätzung für den Messfehler ǫ und x eine für die zu messende Grösse X, so wird
x − |∆x| ≤ X ≤ x + |∆x|
geschrieben. Es heisst ∆x der absolute Fehler und
in Prozenten angegeben.
∆x
x
der relative Fehler. Dieser wird oft
Beispiel 3.1.1. An einem Voltmeter wurde eine Spannung von U = 42.9 V abgelesen und
der Messfehler mit ∆U = 0.3 V geschätzt. Dann gilt
U = (42.9 ± 0.3) V,
d.h., der wahre Wert von U liegt zwischen 42.6 V und 43.2 V. Der relative Fehler beträgt
∆U
±0.3 V
=
= ±0.007 = 0.7%.
U
42.9 V
3.2
Wahrscheinlichster Wert einer Messgrösse
Soll eine Grösse X, deren Wert unbekannt ist, durch eine N -fache Messung bestimmt werden,
so lässt sich ein wahrscheinlichster Wert angeben.
Wir ermitteln N Messwerte x1 , . . . , xN und berechnen nach den Gesetzen der Statistik das
arithmetische Mittel
N
1 X
x̄ =
xi ,
N
i=1
i.e. der wahrscheinlichste Wert der Grösse X. In der Praxis wird deshalb mit diesem Wert
statt dem wahren Wert X gerechnet.
Nach der Methode der kleinsten Quadrate2 ist der mittlere Fehler durch
s
∆x = ± √
N
gegeben, wobei
N
1 X
s =
(xi − x̄)2
N −1
2
i=1
1
Wie in der Statistik üblich werden Messwerte mit einem kleinen Buchstaben x und die wahren, aber
unbekannten (Zufalls-)grössen mit einem grossen Buchstaben X bezeichnet.
P
2
2
Der Mittelwert x̄ wird so bestimmt, dass die Fehlerquadratsumme N
i=1 (xi − x̄) minimal wird.
3.3. Fehlerfortpflanzung
19
die aus den Messdaten geschätzte Varianz ist. Demzufolge gilt
v
u
N
u
X
1
ǫ ≈ ∆x = ±t
(xi − x̄)2 .
N (N − 1)
i=1
Das heisst, ∆x wird als absoluter wahrscheinlichster Fehler des Mittelwertes x̄ verwendet.
Die Grösse
∆x
x̄
heisst relativer Fehler des Mittelwertes x̄.
3.3
Fehlerfortpflanzung
Oft lässt sich eine Grösse Y nicht unmittelbar messen, sondern sie muss aus anderen Grössen
X1 , . . . , Xn rechnerisch ermittelt werden. Es sei
Y = f (X1 , . . . , Xn ).
Die Messung der Grössen X1 , . . . , Xn ergeben die Messgrössen x1 , . . . , xn und die dazu gehörigen
Messfehler ǫ1 , . . . , ǫn , d.h. ǫi = Xi − xi . Mit den Messgrössen kann
y = f (x1 , . . . , xn ).
berechnet werden. Wie wirken sich nun die Fehler ǫ1 , . . . , ǫn der n Messgrössen x1 , . . . , xn auf
das Ergebnis der Rechnung aus?
Der wahre Wert Y wird durch die Messfehler ǫ1 , . . . , ǫn der Messgrössen x1 , . . . , xn um
ǫ=Y −y
= f (X1 , . . . , Xn ) − f (x1 , . . . , xn )
= f (x1 + ǫ1 , . . . , xn + ǫn ) − f (x1 , . . . , xn )
verfälscht. Da die Messfehler erstens klein und zweitens unbekannt sind, also auch ǫ nicht
exakt berechenbar ist, wird das vollständige Differenzial dy anstatt ǫ berechnet, d.h.,
dy =
∂f
∂f
dx1 + · · · +
dxn .
∂x1
∂xn
Wir setzen dxi = ǫi für alle i ∈ {1, . . . , n}. Näherungsweise gilt dann das Fehlerfortpflanzungsgesetz
∂f
∂f
ǫ≈
ǫ1 + · · · +
ǫn
∂x1
∂xn
für den Fehler von Y .
In der Praxis setzen wir für die unbekannten Messfehler ǫ1 , . . . , ǫn geschätzte oder nach der
Methode der kleinsten Quadrate berechnete Werte ∆x1 , . . . , ∆xn ein. Das heisst die n Messwerte sind durch
x1 ± ∆x1 , . . . , xn ± ∆xn
20
Kapitel 3. Fehlerrechnung
gegeben. Da die Vorzeichen der ∆xi nicht bekannt sind, gehen wir auf Nummer sicher und
betrachten den absoluten Maximalfehler3
∂f
∂f
∆ymax = ± ∆x1 + · · · + ∆xn ∂x1
∂xn
oder den relativen Maximalfehler
∆yrel =
∆ymax
.
y
Eine andere Fehlerversion, die wir hier nur aus Gründen der Vollständigkeit angeben, ist der
wahrscheinlichste Fehler
s
2
2
∂f
∂f
∆yw = ±
∆x1 + · · · +
∆xn .
∂x1
∂xn
Da die Ungleichung |∆yw | ≤ |∆ymax | gilt, ist diese Fehlerart weniger pessimistisch als der
absolute Maximalfehler.
Beispiel 3.3.1. Zur Bestimmung eines elektrischen Widerstandes R wurden die Stromstärke
I = (15 ± 0.3) A und die Spannung U = (110 ± 2) V gemessen. Wie gross ist der absolute und
der relative Maximalfehler?
Der Widerstand in Funktion von U und I ist durch
R(U, I) =
U
110 V
=
≈ 7.3 Ω
I
15 A
gegeben. Der absolute Maximalfehler ist
∂R
∂R 1
U
∆Rmax = ± ∆U + ∆I = ± ∆U + 2 ∆I ,
∂U
∂I
I
I
und der relative Maximalfehler
∆Rrel
1
U
∆U ∆I ∆Rmax
=
=± ∆U + 2 ∆I = ± +
R
RI
RI
U I = ± (|∆Urel | + |∆Irel |) .
Einsetzen der gemessenen Grössen ergibt für den absoluten und den relativen Maximalfehler
1
110 V
∆Rmax = ±
2V +
0.3
A
≈ ±0.28 Ω,
15 A
(15 A)2
2V
0.3 A
∆Rrel = ±
+
≈ ±0.04
110 V
15 A
für unsere Messung.
3
Für den Spezialfall n = 1 haben wir für den absoluten Maximalfehler
df
∆ymax = ± ∆x = ± f ′ ∆x .
dx
3.3. Fehlerfortpflanzung
21
Aufgaben
Aufgabe 3.3.1. Der Durchmesser eines Drahtes wurde unter Verwendung eines Mikrometers
mit d = (0.361 ± 0.005) mm gemessen. Mit welchem relativen Maximalfehler kann daraus die
Querschnittsfläche berechnet werden?
Aufgabe 3.3.2. Von einem Quader wurden die Kanten mit a = (32.2 ± 0.1) cm, b =
(12.0 ± 0.1) cm und c = (6.7 ± 0.1) cm bestimmt. Wie gross ist der absolute Maximalfehler des Quadervolumens?
Aufgabe 3.3.3. Zur Bestimmung der Brennweite einer einfachen bikonvexen Linse wurden
die Gegenstandsweite a = 42.4 cm und die Bildweite b = 26.6 cm mit den Messfehlern ∆a =
∆b = ±0.1 cm ermittelt. Wie gross ist die Brennweite f und ihr absoluter Maximalfehler?
Aufgabe 3.3.4. Im rechtwinkligen Dreieck wurden die Hypothenuse c = (130 ± 0.06) m und
die Kathete a = (50 ± 0.02) m gemessen. Welcher absoluter Maximalfehler ergibt sich hieraus
für den Winkel α?
Aufgabe 3.3.5. Zur genauen Messung unbekannter Widerstände wird eine so genannte
Wheatstonesche Brückenschaltung verwendet. Der zu bestimmende Widerstand ergibt
sich aus
x
Rx = R
,
1000 mm − x
wobei R = (1000 ± 1) Ω der bekannte Widerstand und x = (765.8 ± 0.3) mm die Masszahl der
am Massstab abgelesenen Länge sind. Mit welchem absoluten Maximalfehler ergibt sich der
gesuchte Widerstand Rx ?
Aufgabe 3.3.6. Die drei Widerstände R1 = (100±1) Ω, R2 = (50±1) Ω und R3 = (250±2) Ω
sind hintereinander geschaltet. Wie gross ist für die Spannung U = (220±2) V die Stromstärke
des durchfliessenden Stromes und ihr relativer Maximalfehler?
Aufgabe 3.3.7. Die Widerstände R1 = (350 ± 2) Ω und R2 = (100 ± 1) Ω sind parallel
geschaltet. Berechnen Sie den Ersatzwiderstand R und sein relativer Maximalfehler.
Aufgabe 3.3.8. Mit welcher Genauigkeit ergibt sich L = log10 (sin(α)), wenn α = 24◦ 10′ mit
dem Fehler von ∆α = ±2′ versehen ist?
Aufgabe 3.3.9. Zur Bestimmung des Elastizitätsmoduls eines Stahldrahtes wurden dessen
Länge l = (2473 ± 3) mm und der Durchmesser d = (0.292 ± 0.001) cm gemessen. Durch
eine am Draht angreifende Kraft F = (1 ± 0.005) kN ergab sich eine Längenänderung δ =
(1.750 ± 0.005) mm. Den Elastizitätsmodul ist durch
E=
π
Fl
d 2
2
δ
gegeben. Bestimmen Sie E sowie seinen absoluten und relativen Maximalfehler.
22
Kapitel 3. Fehlerrechnung
Lösungen
Lösung 3.3.1. Relativer Maximalfehler der Querschnittsfläche ist ∆Frel = ±2.8%.
Lösung 3.3.2. Absoluter Maximalfehler des Quadervolumens ist ∆Vmax = ±68 cm3 .
Lösung 3.3.3. Brennweite der Linse ist f =
ist ∆fmax = ±0.05 cm.
1
1
+ 1b
a
= 16.3 cm und ihr absoluter Maximalfehler
Lösung 3.3.4. Absoluter Maximalfehler des Winkels α ist ∆αmax = ±0.000358.
Lösung 3.3.5. Der maximale Fehler beträgt ±8.7 Ω.
Lösung 3.3.6. Die Stromstärke beträgt I = 0.55 A und der relative Maximalfehler ±2%.
Lösung 3.3.7. Der Ersatzwiderstand beträgt R = 77.78 Ω und der relative Fehler ±0.9%.
Lösung 3.3.8. ∆L = ±6 · 10−4
Lösung 3.3.9. Den Elastizitätsmodul beträgt E = 211 kN mm−2 , sein absoluter Fehler ∆E =
3.4 kN mm−2 und sein relativer Fehler ungefähr ±1.6%.
3.4
Berechnung des Fehlers bei speziellen Funktionstypen
Wir unterscheiden zwei Funktionstypen:
1. Die Funktion ist eine Summe von Funktionen einer Variablen, d.h.,
f (x1 , . . . , xn ) = f1 (x1 ) + · · · + fn (xn ) =
n
X
fi (xi ).
i=1
Dann wird das vollständige Differenzial zu
df = d(f1 + · · · + fn ) = df1 + · · · + dfn = f1′ dx1 + · · · + fn′ dxn
und somit erhalten wir den absoluten Maximalfehler
∆fmax = ±(|f1′ ∆x1 | + · · · + |fn′ ∆xn |) = ±(|∆f1 max | + · · · + |∆fn max |).
Bei Summen addieren sich die absoluten Maximalfehler der Summanden.4
2. Die Funktion ist ein Produkt von Funktionen einer Variablen, d.h.,
g(x1 , . . . , xn ) = g1 (x1 ) · · · gn (xn ) =
4
n
Y
gi (xi ).
i=1
Für die relativen Fehler gilt dann aber nicht das Selbe. Wir erhalten
∆frel =
∆fmax
|∆f1 max | + · · · + |∆fn max |
|∆f1 max | + · · · + |∆fn max |
=±
=±
.
f
f
f1 + · · · + fn
3.5. Erforderliche Messgenauigkeit
23
Hier wenden wir die logarithmische Differenziation an. Wir logarithmieren
ln(g) = ln(g1 ) + · · · + ln(gn ),
dann folgt für das vollständige Differenzial
d ln(g) = d(ln(g1 ) + · · · + ln(gn )) = d ln(g1 ) + · · · + d ln(gn )),
also
dg
dgn
dg1
+ ··· +
.
=
g
g1
gn
Hieraus folgt
∆grel
∆g1 ∆gn dg
= ± (|∆g1 rel | + · · · + |∆gn rel |) .
=
=± + ··· + g
g1 gn Bei Produkten (und Quotienten) addieren sich die relativen Maximalfehler der Faktoren.
Beispiel 3.4.1. Von einem Zylinder wurde der Durchmesser D = (4.84 ± 0.01) cm, die Länge
l = (6.74± 0.01) cm und durch Wägung die Masse m = (968.5± 0.1) g bestimmt. Mit welchem
relativen Fehler lässt sich daraus die Dichte ρ berechnen?
Die Masse dividiert durch das Volumen ergibt die Dichte, also folgt
ρ(D, m, l) =
Durch logarithmieren erhalten wir
m
4 m
.
=
D 2
π
D2 l
π 2 l
ln(ρ) = ln(m) − 2 ln(D) − ln(l) + ln( π4 ),
davon das vollständige Differenzial ergibt
d ln(ρ) =
dρ
dm
dD dl
=
−2
− .
ρ
m
D
l
Somit erhalten wir für den relativen Fehler der Dichte
∆m ∆D ∆l ∆ρ
+ 2
= ± ∆ρrel =
D + l .
ρ
m Nun können wir die gemessenen Werte einsetzen und erhalten
∆ρrel
±0.1 g ±0.01 cm ±0.01 cm = ±0.0057.
=± + 2
+
968.5 g 4.84 cm 6.74 cm Dies entspricht ungefähr einem relativen Fehler von ±0.6%.
24
Kapitel 3. Fehlerrechnung
b
α
l
m
b
s
−mg sin(α)
mg
Abbildung 3.5.i: Mathematisches Pendel
3.5
Erforderliche Messgenauigkeit
Beispiel 3.5.1. Aus der Länge l = 12 m und der Schwingungsdauer T = 6.95 s eines mathematischen Pendels (Fadenpendels) soll die Erdbeschleunigung g berechnet werden. Wie
genau müssen l und T bestimmt werden, damit der absolute Maximalfehler von g nicht mehr
als ±1 cm s−2 beträgt?
Zuerst wollen wir die Differenzialgleichung des mathematischen Pendels aufstellen. Die Rücktreibende Kraft beträgt F = −mg sin(α) und der zurückgelegte Weg s = lα, also erhalten wir
die Differenzialgleichung des mathematischen Pendels
s
ms̈ = −mg sin(α) = −mg sin
.
l
Diese Differenzialgleichung ist nicht linear und mit unseren Methoden nicht lösbar. Deshalb
betrachten wir das Problem nur für kleine Auslenkungen α. In diesem Fall linearisieren wir
sin und erhalten sin(α) ≈ α = sl für kleine Winkel5 α. Damit folgt
ms̈ = −
mg
s.
l
Dabei handelt es sich nun um die lineare Differenzialgleichung zweiter Ordnung s̈ + gl s = 0
mit der allgemeinen Lösung
q q g
g
s(t) = c1 sin
t
+
c
cos
2
l
l t ,
wobei c1 und c2 noch aus den Anfangsbedingungen zu bestimmende Konstanten sind. Dadurch
ergibt sich die Schwingungsdauer T des mathematischen Pendels6 aus der Bedingung
r
r
g
g
(t + T ) =
t + 2π,
l
l
5
Winkel, die kleiner sind als ungefähr 5◦ , diese entsprechen 0.08727 im Bogenmass, also ist sin(0.08727) =
0.08716. Der Linearisierungsfehler liegt also unterhalb dem Promillebereich. Die Approximation sin(α) ≈ α
für kleine Winkel α kann mit Hilfe von Taylorreihen begründet werden.
6
Die exakte Formel für die Periodendauer eines mathematischen Pendels hängt zusätzlich von der maxi-
3.5. Erforderliche Messgenauigkeit
25
also
T = 2π
s
l
.
g
Nun folgt
g(l, T ) =
4π 2 l
T2
und damit für den absoluten Maximalfehler
∆gmax
2 ∂g ∂g
4π
−8π 2 l
∆T = ± 2 ∆l + = ± ∆l + ∆T = ±1 cm s−2 .
3
∂l
∂T
T
T
Da dies nur eine Gleichung mit zwei Unbekannten ∆l und ∆T ist, muss eine Annahme getroffen werden, dass der Fehler je zur Hälfte aus den Fehlern der Messung von l und von T
stammt. Damit ergibt sich
T2
· 0.5 cm s−2 = ±0.612 cm,
4π 2
T3
∆T = ± 2 · 0.5 cm s−2 = ±0.0018 s.
8π l
∆l = ±
Aufgaben
Aufgabe 3.5.1. Ein Hohlzylinder hat den äusseren Radius r1 ≈ 10 cm, den inneren Radius
r2 ≈ 8 cm und die Höhe h ≈ 12 cm. Mit welchen absoluten Fehlern dürfen diese drei Grössen
gemessen werden, damit der relative Maximalfehler des Volumens höchstens ±0.2% beträgt?
Aufgabe 3.5.2. Im Dreieck sollen die Seite b und die Winkel α und β gemessen und daraus
die Seite a berechnet werden.
a. Stellen Sie mit Hilfe der logarithmischen Differenziation die Fehlerformel für den relativen Maximalfehler von a auf.
b. Wie genau müssen b ≈ 220 m, α ≈ 63◦ und β ≈ 42◦ gemessen werden, damit ein relativer
Maximalfehler
∆amax
= ±0.0003
a
nicht überschritten wird?
malen Auslenkung αmax ab und lässt sich nur als elliptisches Integral angeben
Tgenau (αmax ) = 2π
s
l
·
g
Z
αmax
0
dα
q
.
2 αmax
π sin ( 2 ) − sin2 ( α2 )
26
Kapitel 3. Fehlerrechnung
Lösungen
Lösung 3.5.1. Absolute Fehler der Radien ∆r1 = ±0.0012 cm, ∆r2 = ±0.0015 cm und der
Höhe ∆h = ±0.008 cm.
Lösung 3.5.2.
a. Formel für den relativen Maximalfehler
∆amax
a
= ± ∆b
b + |cot(α)∆α| + |cot(β)∆β| .
b. Maximale Fehler der Einzelmessungen ∆b = ±0.02 m und ∆α = ±0.000196 = ±0.7′ ,
∆β = ±0.000090 = ±0.3′ .
Kapitel 4
Statistische Tests
Statistische Tests dienen dazu, an Hand von Stichproben Annahmen (sog. Hypothesen1 )
über das Verteilungsgesetz in der Grundgesamtheit zu überprüfen. Oft existiert über die
unbekannte Verteilungsfunktion F oder ihre unbekannten Parameter, wie zum Beispiel µ und
σ 2 bei der Normalverteilung oder p bei der Binomialverteilung, eine bestimmte Vorstellung.
Diese wird in Gestalt einer Nullhypothese, die mit H0 bezeichnet wird, ausgedrückt. Wird
auch eine die Nullhypothese ausschliessende Alternative betrachtet, so bezeichnen wir diese
Alternativhypothese mit H1 . Das Anliegen eines statistischen Tests zur Prüfung von H0
gegen H1 ist es, eine Entscheidung darüber zu treffen, ob die aus einer konkreten Stichprobe
entnommenen Angaben zur aufgestellten Hypothese H0 im Widerspruch stehen oder nicht,
d.h., ob H0 abzulehnen ist oder nicht.
4.1
Das Prinzip des statistischen Tests
Wir beginnen mit einem ausführlichen Einführungsbeispiel, bei dem wir den Parameter p der
Binomialverteilung einem statistischen Test unterziehen.
Beispiel 4.1.1. Bei 12000 Würfen eines Würfels wurden x = 2107 Sechsen gezählt. Ist dieser
Würfel unsymmetrisch, d.h. werden Sechsen bevorzugt gewürfelt?
Uns scheint die Anzahl Sechsen ein bisschen zu gross. Da es aber in den modernen Natur- und
Ingenieurwissenschaften nicht erlaubt ist, aus dem Bauch Gefühle zu äussern, benötigen wir
einen rigorosen statistischen Test, um unseren Eindruck wissenschaftlich zu belegen. Dazu
bezeichnen wir mit X die Zufallsgrösse der Anzahl “Sechsen” unter n = 12000 Würfen,
und mit p die Wahrscheinlichkeit mit dem betrachteten Würfel eine “Sechs” zu würfeln.
Anschliessend formulieren wir zwei sich ausschliessende Hypothesen:
Nullhypothese
H0 : p = 16 , d.h., der Würfel ist symmetrisch.
Alternativhypothese H1 : p > 16 , d.h., es werden Sechsen bevorzugt gewürfelt.
Beachten Sie, dass sich die Hypothesen gegenseitig ausschliessen und sich nur auf die Ereignisse “Sechs” oder “nicht Sechs” beziehen. Wie die anderen Augenzahlen ausfallen ist nicht
von Belang.
Unter der Voraussetzung der Nullhypothese H0 berechnen wir nun den Erwartungswert
E(X) = np = 12000 ·
1
1
6
= 2000.
Hypothese enthält die Wörter hypo-thesis = das Unter-Gestellte.
27
28
Kapitel 4. Statistische Tests
In unserem Experiment stellen wir eine Abweichung vom Erwartungswert
x − E(X) = 2107 − 2000 = 107
fest. Nun bestimmen wir die Wahrscheinlichkeit P (2107 ≤ X) einer so grossen oder grösseren
Abweichung vom Erwartungswert. Dazu benutzen wir den Grenzwertsatz von de Moivre
und Laplace (vgl. Gleichung (2.2.a)), d.h., wir approximieren2 die Binomialverteilung mit
einer Normalverteilung mit den Parametern
µ = np = 12000 ·
1
6
= 2000
und
σ 2 = np(1 − p) = 12000 ·
1
6
·
5
6
= 1666 23 .
Wir erhalten nun mit Tafel T.1


2107 − 2000
P (2107 ≤ X) ≈ 1 − Φ  q
, 0, 1 = 1 − Φ (2.621, 0, 1)
2
1666 3
= 1 − 0.9956 = 0.0044.
Die Wahrscheinlichkeit unter der Voraussetzung der Nullhypothese mindestens so viel Abweichung vom Erwartungswert zu erhalten, ist somit ausserordentlich klein. Dies erlaubt uns,
die Nullhypothese abzulehnen. Die Irrtumswahrscheinlichkeit dieses Schlusses entspricht
dem berechneten Wert P (2107 ≤ X) ≈ 0.0044.
Im Allgemeinen müssen wir uns entscheiden, wann eine berechnete Abweichung zur Ablehnung der Nullhypothese führen soll. Dazu wird eine Schranke α ∈ ]0, 1[, das so genannte Signifikanzniveau, gewählt. Ist die berechnete Wahrscheinlichkeit der Abweichung kleiner als
das Signifikanzniveau, so wird die Nullhypothese abgelehnt, sonst angenommen. Die zulässige
Grösse des Signifikanzniveaus α hängt stark vom Fachgebiet ab und ist eine Vereinbarungssache. Häufig verwendete Niveaus sind α = 0.01, 0.05 und 0.1.
Das Prinzip eines statistischen Tests oder Signifikanztest lässt sich in folgenden Schritten
zusammenfassen:
1. Aufstellen der Nullhypothese H0 und der Alternativhypothese H1 und Vorgabe
des Signifikanzniveaus α.
2. Bestimmen eines Ablehnungsbereichs in Abhängigkeit von α, für den die Wahrscheinlichkeit, dass die Stichprobenfunktion Werte aus dem Ablehnungsbereich annimmt,
höchstens gleich α ist.
3. Berechnung der Testgrösse aus der vorliegenden konkreten Stichprobe.
4. Statistischer Schluss: Liegt die Testgrösse im Ablehnungsbereichs, so wird H0 abgelehnt, sonst wird H0 angenommen.
2
Die Approximation ist erlaubt, da die Faustregel np(1 − p) = 1666 23 > 9 erfüllt ist.
4.2. Einseitiger und zweiseitiger Test
4.2
29
Einseitiger und zweiseitiger Test
In Beispiel 4.1.1 haben wir uns für die Abweichung vom Erwartungswert (nach einer Seite)
interessiert. Im Gegensatz dazu können wir auch Abweichungen nach beiden Seiten Beachtung schenken. In allen Fällen gehen wir von der Nullhypothese H0 : µ = µ0 aus. Für die
Alternativhypothese H1 bieten sich nun die nachfolgenden Möglichkeiten an, die je nach Aufgabenstellung angewandt werden müssen.
1. Zweiseitiger Test H1 : µ 6= µ0 . Zur Konstruktion des Ablehnungsbereiches wird der
Flächeninhalt α symmetrisch auf beiden Seiten der Kurve aufgeteilt, und es ergibt sich
einen zweiseitigen Ablehnungsbereich mit den beiden kritischen Grössen z α2 und z1− α2 .
Die Abweichung zwischen dem Stichprobenparameter und dem hypothetischen Wert µ0
1−α
α
2
α
2
µ0
z α2
Ablehnungsbereich
z1− α2
Annahmebereich
z
Ablehnungsbereich
Abbildung 4.2.i: H1 : µ 6= µ0 , zweiseitige
Fragestellung mit den kritischen Grössen
z α2 und z1− α2 .
wird nur dem Absolutbetrag nach beurteilt.
2. Einseitiger Test H1 : µ > µ0 (resp. H1 : µ < µ0 ). Zur Konstruktion des Ablehnungsbereiches wird der Flächeninhalt α nur auf einer Seite der Kurve abgeschnitten, und
es ergibt sich einen einseitigen Ablehnungsbereich mit der kritischen Grösse zα (resp.
z1−α ). Die damit verbundene einseitige Fragestellung liegt dann vor, wenn nur Abwei-
1−α
1−α
α
α
zα
Ablehnungsbereich
µ0
µ0
z
Annahmebereich
Abbildung 4.2.ii: H1 : µ < µ0 , einseitige untere Fragestellung mit der kritischen
Grösse zα .
Annahmebereich
z1−α
z
Ablehnungsbereich
Abbildung 4.2.iii: H1 : µ > µ0 , einseitige obere Fragestellung mit der kritischen
Grösse z1−α .
30
Kapitel 4. Statistische Tests
chungen nach einer Seite interessieren, d.h., wenn es zum Beispiel darauf ankommt zu
beurteilen, ob ein Stichprobenparameter nicht zu gross ist, während einem zu kleinen
Stichprobenparameter keine Bedeutung beigemessen wird. Hier müssen also grosse positive (resp. negative) Abweichungen zu einer Ablehnung der Nullhypothese führen.
Ob eine Hypothese mit einem zweiseitigen oder einseitigen Test zu prüfen ist, hängt vom
praktischen Problem ab und wird vor Testbeginn festgelegt. Sind keine Vorkenntnisse über
die Richtung der möglichen Abweichungen vorhanden, so wird ein zweiseitiger Test verwendet.
Ist von vornherein einer der Fälle µ > µ0 oder µ < µ0 ausgeschlossen, so wird ein einseitiger
Test zur Anwendung kommen.
Beispiel 4.2.1 (z-Test). Letztes Jahr waren 75% der SBB-Fahrgäste Inhaber von Halbtaxabonnementen. Bei einer kürzlich durchgeführten Fahrgastbefragung gaben 270 von 350 Befragten an, dass sie ein Halbtaxabonnement besitzen. Hat sich der Anteil der Besitzer von
Halbtaxabonnementen wesentlich verändert? Das Signifikanzniveau sei α = 10%.
Um diese Frage zu beantworten, führen wir einen statistischen Test nach obigem Prinzip
durch: Es sei p = 0.75 der relative Anteil von Halbtaxabonnementbesitzer im letzten Jahr.
Nun formulieren wir die Null- und Alternativhypothesen für einen statistischen Test:
H0 : p = 0.75, d.h., die Anzahl Halbtaxabonnementbesitzer ist gleich wie letztes Jahr.
H1 : p 6= 0.75, d.h., die Anzahl Halbtaxabonnementbesitzer hat sich verändert.
Es handelt sich hier um einen so genannten zweiseitigen Test, da hier die Alternativhypothese nur Werte p 6= 0.75 zulässt. Weiter beschreibe die Zufallsgrösse X die Anzahl der
Halbtaxabonnementbesitzer unter den n = 350 befragten Fahrgästen. Die Zufallsgrösse X
ist binomialverteilt. Wir berechnen den Erwartungswert und die Varianz unter Annahme der
Nullhypothese H0
E(X) = np = 262.5
und
Var(X) = np(1 − p) = 65.625.
Es stellt sich also die Frage, ob sich die Zahl der gezählten 270 Halbtaxabonnementbesitzer
signifikant vom Erwartungswert E(X) = 262.5 unterscheidet.
Weil np(1 − p) = 65.625 > 9 können wir die Binomialverteilung mit einer Normalverteilung
mit den Parametern µ = 262.5 und σ 2 = 65.625 approximieren (vgl. Grenzwertsatz von de
Moivre und Laplace, Gleichung (2.2.a)).
Durch eine Massstabsänderung auf der Koordinatenachse und einer Nullpunktverschiebung
auf der x-Achse
x−µ
z=
σ
kann von der Normalverteilung mit den Parametern µ und σ 2 zur standardisierte Normalverteilung mit den Parametern µ = 0 und σ 2 = 1 übergegangen werden.
Da es sich hier um einen zweiseitigen Test handelt, verteilen wir α = 0.10 = 0.05 + 0.05
gleichmässig auf beiden Seiten der Standardnormalverteilung (vgl. Abbildung 4.2.iv). Aus
der Beziehung
P (Z ≤ z0.05 ) = Φ (z0.05 , 0, 1) = 0.05
bestimmen wir mit Tafel T.2 oder einem Computerprogramm (z.B. Excel) die untere kritische
Grösse z0.05 = −1.645, d.h. das 0.05-Quantil z0.05 der Standardnormalverteilung; und aus der
Beziehung
P (z0.95 ≤ Z) = 1 − Φ (z0.95 , 0, 1) = 0.05
4.3. Mögliche Fehler bei statistischen Tests
31
0.90
0.05
z0.05
Ablehnungsbereich
0.05
0
z
Annahmebereich
z0.95
z
Ablehnungsbereich
Abbildung 4.2.iv: Bestimmung des 0.05-Quantils z0.05 = −1.645 und des 0.95-Quantils z0.95 =
1.645 bei der Standardnormalverteilung bei einer zweiseitigen Fragestellung. Die Testgrösse
z = 0.926 liegt im Annahmebereich, damit wird die Nullhypothese angenommen.
bestimmen wir die obere kritische Grösse z0.95 = 1.645, d.h. das 0.95-Quantil z0.95 der Standardnormalverteilung. Da die Standardnormalverteilung symmetrisch bezüglich µ = 0 ist,
folgt z0.95 = −z0.05 .
Die Berechnung der Testgrösse aus den vorliegenden Angaben ergibt
z=
270 − µ
270 − 262.5
= √
= 0.926.
σ
65.625
Es gilt nun z0.05 = −1.645 < z = 0.926 < z0.95 = 1.645, d.h., die Testgrösse z liegt im
Annahmebereich und somit lautet der statistische Schluss:
Wir nehmen die Nullhypothese auf dem Niveau 10% an. Der Anteil der Besitzer von Halbtaxabonnementen hat sich nicht signifikant verändert.
Hierbei handelt es sich um einen so genannten z-Test.
4.3
Mögliche Fehler bei statistischen Tests
Am Ende eines statistischen Tests fällen wir immer einen statistischen Schluss, der dabei
zugunsten der Nullhypothese H0 oder der Alternativhypothese H1 ausfällt. In beiden Fällen
werden gewisse Rückschlüsse von einer Stichprobe auf die entsprechende Grundgesamtheit gezogen. Dabei müssen wir unbedingt bedenken, dass es absolut sichere Schlüsse grundsätzlich
nicht gibt. Bei einer Testentscheidung besteht immer eine bestimmte Wahrscheinlichkeit dafür,
dass die getroffene Entscheidung falsch ist. Dabei werden zwei Arten von Fehlern unterschieden:
Definition 4.3.1.
a. Ein Fehler 1. Art liegt vor, wenn eine richtige Nullhypothese H0 abgelehnt wird.
b. Ein Fehler 2. Art liegt vor, wenn eine falsche Nullhypothese H0 nicht abgelehnt wird.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht der Irrtumswahrscheinlichkeit, für
welche wir das Signifikanzniveau α vorgegeben haben. Die Wahrscheinlichkeit für einen Fehler
2. Art wird mit β bezeichnet.
32
Kapitel 4. Statistische Tests
1−α
1−α
α
µ0
α
z1−α
z
µ0
z1−α
z
Ablehnungsbereich
Annahmebereich
Abbildung 4.3.ii: Es sei H0 richtig: Da
z ≥ z1−α wird die Nullhypothese abgelehnt. Dies ist die falsche Entscheidung
(Fehler 1. Art), welche mit einer Wahrscheinlichkeit von α getroffen wird.
β α
β α
z1−α
µ1
z
µ0
µ1
z1−α
z
z
z
Annahmebereich
1−β
1−α
1−β
1−α
Ablehnungsbereich
Annahmebereich
Abbildung 4.3.i: Es sei H0 richtig: Da
z < z1−α wird die Nullhypothese angenommen. Dies ist die richtige Entscheidung, welche mit einer Wahrscheinlichkeit
von 1 − α getroffen wird.
µ0
z
z
Ablehnungsbereich
Abbildung 4.3.iii: Es sei H0 falsch, H1
richtig, d.h., die gestrichelte Dichte ist die
richtige: Da z < z1−α wird die Nullhypothese angenommen. Dies ist die falsche
Entscheidung (Fehler 2. Art), welche
mit einer Wahrscheinlichkeit von β getroffen wird.
Annahmebereich
Ablehnungsbereich
Abbildung 4.3.iv: Es sei H0 falsch, H1
richtig, d.h., die gestrichelte Dichte ist die
richtige: Da z ≥ z1−α wird die Nullhypothese abgelehnt. Dies ist die richtige Entscheidung, welche mit einer Wahrscheinlichkeit (so genannte Trennschärfe) von
1 − β getroffen wird.
Wir erläutern nun die möglichen Fälle an Hand eines einseitigen Tests, bei dem die Nullhypothese H0 : µ = µ0 gegen die Alternativhypothese H1 : µ > µ0 getestet wird. Dabei bezeichnet
µ den zu testenden unbekannten Parameter der Verteilung.
Als Trennschärfe oder Macht eines Tests bezeichnen wir die Wahrscheinlichkeit 1−β mit der
die Nullhypothese abgelehnt wird, wenn sie tatsächlich nicht stimmt (vgl. Abbildung 4.3.iv).
Trennschärfe = P (Entscheidung H0 nicht anzunehmen | H1 sei richtig) = 1 − β
In der Praxis sind wir bestrebt, die Fehler 1. und 2. Art (d.h. gleichzeitig α und β) möglichst
klein zu halten. Dazu betrachten wir die Abbildungen 4.3.iv und 4.3.iii und stellen fest, dass
eine Verkleinerung von α (Verschiebung der kritischen Grösse z1−α nach rechts) automatisch
eine Vergrösserung von β nach sich zieht und umgekehrt. Entscheiden wir uns im konkreten
Fall für ein kleines α und damit für ein kleines Risiko eine an sich richtige Nullhypothese
4.3. Mögliche Fehler bei statistischen Tests
33
abzulehnen, dann nehmen wir gleichzeitig ein deutlich erhöhtes Risiko für einen Fehler 2. Art
in Kauf. Wir müssen also von Fall zu Fall entscheiden, welcher der beiden Fehler letztendlich
die grösseren Konsequenzen hat. Soll gleichwohl das Risiko für einen Fehler 2. Art, d.h. β, verringert werden, ohne gleichzeitig die Wahrscheinlichkeit α für einen Fehler 1. Art vergrössern
zu müssen, so bleibt uns nur die Vergrösserung des Stichprobenumfangs3 (Verbesserung der
Trennschärfe des Tests).
In Abbildung 4.3.iii sehen wir zusätzlich, dass die Wahrscheinlichkeit β einen Fehler 2. Art
zu begehen, wesentlich von der Alternativhypothese H1 , d.h. Lage von µ1 , abhängt. Diesen funktionalen Zusammenhang zwischen β und µ1 wird als Operationscharakteristik
bezeichnet.
Aufgaben
Formulieren Sie jeweils die Null- und Alternativhypothese und den problemorientierten statistischen Schluss in Worten.
Aufgabe 4.3.1. Wir würfeln mit einem Würfel. Bei 20 Würfen erhalten wir 9 Sechsen. Ist
der Würfel gezinkt, d.h., werden bevorzugt Sechsen gewürfelt? Das Signifikanzniveau ist 5%.
Aufgabe 4.3.2. In 10000 Würfen zeigte eine Münze 5150 mal Zahl. Mit welcher Wahrscheinlichkeit können wir behaupten, dass sie unsymmetrisch ist, d.h. bevorzugt Zahl geworfen wird?
Das Signifikanzniveau ist 5%.
Aufgabe 4.3.3. Bei einer Umfrage vor einer Wahl sagten 285 der 2000 befragten Personen,
sie würden nicht zur Wahl gehen. Nachdem in der Zwischenzeit ein medienintensiver Wahlkampf stattfand, betrug die tatsächliche Wahlbeteiligung 88.5%. Kann daraus mit 99%-iger
Sicherheit geschlossen werden, dass in der Zwischenzeit Personen, die ursprünglich nicht zur
Wahl gehen wollten, umgestimmt wurden?
Aufgabe 4.3.4. Unter 3000 in einer Klinik neugeborenen Kindern befanden sich 1578 Knaben. Testen Sie mit einer Irrtumswahrscheinlichkeit α = 0.01 die Hypothesen
H0 : P (Knabengeburt) = 0.5
H1 : P (Knabengeburt) 6= 0.5
Formulieren Sie den entsprechenden statistischen Schluss.
Aufgabe 4.3.5. Eine Multiple-Choice-Prüfung bestehe aus 100 Einzelfragen, wobei bei jeder
Frage in zufälliger Reihenfolge 4 Antworten angegeben sind, wovon genau eine richtig ist. Der
Prüfling darf jeweils nur eine Antwort ankreuzen. Wieviel richtig angekreuzte Antworten
müssen zum Bestehen der Prüfung mindestens verlangt werden, damit die Prüfung durch
(zufälliges Ankreuzen) höchstens mit Wahrscheinlichkeit
a. 0.05
b. 0.01
c. 0.001
d. 0.0001
bestanden werden kann?
3
Dabei werden die Verteilungen schlanker und somit α und β gleichzeitig kleiner.
34
Kapitel 4. Statistische Tests
Lösungen
Lösung 4.3.1. Eine Approximation mit der Normalverteilung ist wegen np(1−p) = 2.778 ≤ 9
nicht erlaubt. Wir berechnen mit der Binomialverteilung exakt die Irrtumswahrscheinlichkeit
P (9 ≤ X) = 1 − P (X ≤ 8) = 0.00284.
Lösung 4.3.2. Die Wahrscheinlichkeit einer so grossen oder grösseren Abweichung nach oben
ist P (5150 ≤ X) = 0.0013. Also ist die Münze unsymmetrisch.
Lösung 4.3.3. Es hätten höchsten x1−α = 264 Personen nicht zur Wahl gehen dürfen, damit
die Hypothese angenommen werden könnte.
Lösung 4.3.4. Der Annahmebereich ist ]1430, 1571[, also H0 ablehnen.
Lösung 4.3.5. Die Ablehnungsgrenzen sind:
a. n1−0.05 = 33
b. n1−0.01 = 36
c. n1−0.001 = 39
d. n1−0.0001 = 42
Kapitel 5
Prüfen von Erwartungswerten
(Parametertests)
5.1
Problemstellung der technischen Statistik
Die meisten Fragestellungen der angewandten Statistik führen auf den Vergleich von zwei oder
mehreren normalverteilten Grundgesamtheiten. Da eine Normalverteilung durch die beiden
Parameter µ und σ 2 vollständig definiert ist, bedeutet dies, dass wir herausfinden müssen, ob
die entsprechenden Parameter bei zwei normalverteilten Grundgesamtheiten übereinstimmen
oder nicht.
Beispiel 5.1.1. Gegeben seien zwei Maschinen des gleichen Typs. Beide produzieren Produkte von einer bestimmten gleichen Art. Produzieren sie Produkte aus der gleichen Grundgesamtheit oder nicht? Das heisst, arbeiten sie gleich genau, ist also die Varianz identisch
und sind sie auf den gleichen Sollwert eingestellt, d.h., ist der Erwartungswert der beiden
Grundgesamtheiten gleich?
Fragestellung der Statistik
• Gegeben: Zwei normalverteilte Grundgesamtheiten mit den Parametern µ1 , σ12 und
µ2 , σ22 .
• Frage: Sind die beiden Grundgesamtheiten identisch, d.h., gilt µ1 = µ2 und σ12 = σ22 ?
• Vorgehen der Statistik zur Beantwortung dieser Frage: Jeder Grundgesamtheit entnehmen wir je eine Stichprobe S1 und S2 , dann berechnen wir aus diesen Stichproben
die geschätzten Parameter x̄1 , s22 und s21 , x̄2 , vergleichen sie in einem statistischen Test
und schliessen die Grundgesamtheiten sind gleich oder nicht.
In einigen Fällen kann bereits vorausgesetzt werden, dass zum Beispiel µ1 = µ2 ist, so dass
ein Test auf σ12 = σ22 durchzuführen ist. Oder die Varianzen sind gleich, und die Gleichheit
der Erwartungswerte wird getestet. Je nach Problemstellung ist ein bestimmter Test durchzufüren.
In den bisherigen Betrachtungen in Kapitel 4 war zur Prüfung der Hypothese H0 : µ = µ0
für die Berechnung der Testgrösse die Kenntnis der Varianz σ 2 in der Grundgesamtheit erforderlich. Dazu sind umfangreiche Voruntersuchungen notwendig, oder wir ersetzen für einen
grossen Stichprobenumfang σ 2 durch die geschätzte Stichprobenvarianz s2 . Welche Testgrösse
35
36
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
können wir nun bei kleinen Stichprobenumfängen zur Prüfung der Hypothese H0 : µ = µ0
heranziehen, wenn σ 2 nicht als Erfahrungswert vorliegt?
Beim Prüfen von Erwartungswerten gibt es mehrere verschieden Problemstellungen. Diese
wollen wir nun untersuchen.
5.2
Einstichproben-t-Test, Student-t-Test
Beim Einstichproben-t-Test oder Student-t-Test ist der Erwartungswert µ der Grundgesamtheit G bekannt und es sind folgende Voraussetzungen zu beachten:
1. Die normalverteilte Grundgesamtheit G hat den bekannten Erwartungswert µ und die
unbekannte Varianz σ 2 .
2. Es sind zufällig N Stichprobenwerte x1 , . . . , xN aus einer normalverteilten Grundgesamtheit gewählt.
Wir wollen nun wissen, ob die gewählte Stichprobe der N Werte x1 , . . . , xN aus der Grundgesamtheit G mit dem Erwartungswert µ stammt. Dazu berechnen wir den geschätzten
Mittelwert
N
1 X
x̄ =
xi
N
i=1
und vergleichen ihn mit dem bekannten Erwartungswert µ der Grundgesamtheit G, indem
wir folgende alternativen Hypothese aufstellen.
H0 : µ = x̄, d.h., Stichprobe stammt aus der Grundgesamtheit G mit Erwartungswert µ.
H1 : µ 6= x̄, d.h., Stichprobe stammt aus einer anderen Grundgesamtheit.
Zur Beantwortung dieser Fragestellung machen wir nun folgende gedankliche Konstruktion,
die typisch ist für die statistische Denkweise: Wir betrachten die Gesamtheit aller zufälligen
Stichproben mit N Werten x1 , . . . , xN aus einer normalen Grundgesamtheit mit Erwartungswert µ und unbekannter Varianz. Zu jeder Stichprobe berechnen wir aus den Werten
x1 , . . . , xN den geschätzten Mittelwert x̄ und die geschätzte Varianz
N
s2 =
1 X
(xi − x̄)2
N −1
i=1
und daraus die Testgrösse
x̄ − µ √
N.
s
Der Wert der Testgrösse t wird umso grösser,
t=
(5.2.a)
• je grösser die Abweichung des geschätzten Mittelwerts x̄ vom Erwartungswert µ ist,
• je grösser der Stichprobenumfang N gewählt ist und
• je kleiner die geschätzte Varianz s2 ist, d.h., je weniger die Stichprobenwerte um den
Mittelwert streuen.
5.2. Einstichproben-t-Test, Student-t-Test
37
Für jede Stichprobe erhalten wir nun einen anderen Wert für t und demzufolge wieder eine
Wahrscheinlichkeitsverteilung. Ist die Zufallsgrösse X normalverteilt, so gehorcht die neue
Zufallsgrösse
X − µ√
N
T =
s
einer sogenannten Student-t-Verteilung mit n = N − 1 Freiheitsgraden, die nicht mehr
der Normalverteilung entspricht1 .
Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α
ist für die zweiseitige Fragestellung durch die kritischen Grössen tn,1− α2 und tn, α2 = −tn,1− α2
gegeben. Die kritischen Grössen lassen sich für die zweiseitige Fragestellung aus der Beziehung
P |T | ≥ tn,1− α2 = α
mit Hilfe von Tafel T.3 oder einem Computerprogramm (z.B. Excel) ermitteln. Jetzt ziehen
fn (t)
1−α
α
2
α
2
tn, α2 = −tn,1− α2
tn,1− α2
Annahmebereich
Ablehnungsbereich
t
Ablehnungsbereich
Abbildung 5.2.i: Kritische Grössen tn, α2 und tn,1− α2 beim Student-t-Test, mit tn, α2 = −tn,1− α2 .
wir den statistischen Schluss (hier für die zweiseitige Fragestellung):
• Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h.,
Abweichungen vom idealen Wert t = 0 sind zufälliger Natur. Die Stichprobe stammt
somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus der Grundgesamtheit mit dem
Erwartungswert µ.
• Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit.
Der Student-t-Test ist gegenüber Abweichungen von der Voraussetzung (1), dass die Grundgesamtheit G normalverteilt sein muss, ziemlich unempfindlich. Der Student-t-Test ist ein so
genannt robuster Test.
Beispiel 5.2.1. Es sei die folgende Stichprobe mit zehn Werten gegeben:
5
1
-5
7
4
15
-7
5
10
18
16
Dass die Summe X +Y zweier gleich verteilter Zufallsvariablen X und Y nicht mehr der gleichen Verteilung
wie die der Summanden gehorchen muss, sehen wir an folgendem Beispiel: Ein einzelner Würfel hat für jede
Augenzahl die gleiche Wahrscheinlichkeit. Betrachten wir nun die Summe der Augenzahlen zweier Würfel, so
stellen wir fest, dass die Summe 7 viel häufiger ist als 2 oder 12. Dies wird zum Beispiel beim berühmten
Gesellschaftsspiel Die Siedler von Catan von Klaus Teuber ausgenutzt.
38
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
Uns interessiert nun, ob die Stichprobe aus einer Grundgesamtheit mit Erwartungswert µ = 0
und unbekannter Varianz stammt oder nicht. Es handelt sich dabei um einen zweiseitigen
Student-t-Test, da wir nur wissen wollen, ob der Mittelwert x̄ gleich oder ungleich von µ = 0
ist. Dazu wollen wir für die zweiseitige Fragestellung die folgende Nullhypothese gegen die
Alternative testen:
H0 : µ = 0, d.h., Stichprobe stammt aus Grundgesamtheit mit Erwartungswert µ = 0.
H1 : µ 6= 0, d.h., Stichprobe stammt aus anderer Grundgesamtheit.
Wir identifizieren den Stichprobenumfang mit N = 10 und berechnen x̄ = 6.80 und s2 =
70.18. Die Nullhypothese besagt in diesem Fall, dass das Mittel x̄ = 6.80 rein zufällig, auswahlbedingt, vom erwarteten theoretischen Wert µ = 0 abweicht. Da hier der Erwartungswert µ = 0 der Grundgesamtheit bekannt und die Varianz unbekannt ist, benutzen wir einen
Student-t-Test mit n = N − 1 = 9 Freiheitsgraden, um obige Hypothese zu untersuchen. Wir
berechnen die Testgrösse
6.80 − 0 √
x̄ − µ √
N= √
10 = 2.567.
(5.2.b)
t=
s
70.18
Zum Signifikanzniveau α = 0.05 bestimmen wir nun die kritische Grösse t9,1−0.025 = 2.262 für
die zweiseitige Fragestellung.
Nun führen wir den statistischen Schluss durch: Es gilt |t| = 2.567 ≥ t9,1−0.025 = 2.262,
also wird die Nullhypothese H0 abgelehnt. Das Mittel x̄ = 6.80 weicht somit wesentlich vom
theoretischen Wert µ = 0 ab.
Bemerkungen:
• Falls das Signifikanzniveau kleiner gewählt würde, z.B. α = 0.01, dann ergäbe sich ein
kritischer Wert von t9,1−0.005 = 3.250 und es ergäbe keine signifikante Abweichung mehr.
Es ist deshalb wichtig, dass immer bei einem statistischen Schluss das Signifikanzniveau
angegeben wird, damit alle wissen, was von der Aussage zu halten ist.
• Auch wenn die Nullhypothese abgelehnt werden kann, besteht, wie wir bereits in Kapitel 4.3 gesehen haben, eine gewisse Wahrscheinlichkeit, dass wir einen falschen Schluss
ziehen. Die Wahrscheinlichkeit, dass ein berechneter Wert von t unter der Voraussetzung
der Nullhypothese so extrem wird, ist bekanntlich nicht null, sondern nur klein. Beim
Ablehnen der Nullhypothese müssen wir also auch eine Irrtumswahrscheinlichkeit angeben. Sie entspricht der Wahrscheinlichkeit, die besteht, dass der Wert der Testgrösse
t rein zufällig so extrem herauskommt. Sie ist also kleiner als das gewählte Signifikanzniveau.
• Kann hingegen die Nullhypothese nicht abgelehnt werden, so besteht trotzdem eine
gewisse Wahrscheinlichkeit, dass eine signifikante Abweichung vorliegt. Wir sprechen
vom Risiko für einen Fehler 2. Art.
Die Student-t-Verteilung
Die von W. S. Gosset (1876-1937) (vgl. Abbildung 5.2.iii) gefundene Student-t-Verteilung
mit n = N − 1 Freiheitsgraden hat die Wahrscheinlichkeitsdichte
− n+1
2
t2
fn (t) = cn 1 +
für t ∈ R,
n
5.2. Einstichproben-t-Test, Student-t-Test
39
Γ( n+1 )
2
2
wobei cn = √nπ Γ(
n eine nur von der Anzahl Freiheitsgraden n abhängige Konstante ist. Der
)
2
Erwartungswert und die Varianz oder Streuung einer mit n Freiheitsgraden Student-tverteilten Zufallsgrösse T beträgt
E(T ) = 0
für n > 1
Wie bei jeder Verteilung gilt auch hier
und
Var(T ) =
R∞
−∞ fn (t) dt
n
n−2
für n > 2.
= 1.
0.4
0.3
0.2
0.1
–6
–4
–2
0
2
4
6
x
Abbildung 5.2.ii: Die Student-t-Verteilung (schwarze Kurven) für verschiedene Freiheitsgrade
n. Die Kurven ähneln denen der standardisierten Normalverteilung (graue Kurven), stimmen
aber erst für grosse n einigermassen überein.
Die Dichte der Student-t-Verteilung ist symmetrisch bezüglich des Nullpunktes t = 0. Sie
hat einen um so flacheren Verlauf, je kleiner n ist, und strebt für n → ∞ gegen die Dichte
der standardisierten Normalverteilung N (0, 1). Das q-Quantil der Student-t-Verteilung mit
n Freiheitsgraden wird mit tn,q bezeichnet und ist vertafelt (vgl. Tafel T.3). Das q-Quantil
tn,q kann aus der Beziehung
P (T ≤ tn,q ) = q
bestimmt werden. Da die Dichte symmetrisch ist, gilt für das (1 − q)-Quantil tn,1−q = −tn,q .
Aufgaben
Aufgabe 5.2.1. Durch Messung wurden die Längen von fünf Wellen bestimmt. Es wurden
8, 9, 11, 10, 10 Einheiten gemessen. Weicht der Mittelwert signifikant von µ = 10E ab? Das
Signifikanzniveau ist 1%.
Aufgabe 5.2.2. Bei einem Spannvorgang wurde bisher mit einem Vorgabewert von 135s
gerechnet. Eine Zeitaufnahme lieferte bei N = 32 aufgenommenen Zeiten für diesen Teilvorgang einen mittleren Zeitbedarf in der Höhe von x̄ = 128s bei einer Standardabweichung von
2
R∞
Es ist Γ(x) = 0 tx−1 e−t dt die Gammafunktion, die die Fakultät auf reelle Zahlen verallgemeinert. Es
gilt Γ(1) = 1 und Γ(n) = (n − 1)! für alle n ∈ N.
40
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
Abbildung 5.2.iii: William Sealey Gosset (1876-1937), der bei Guinness als Bierbrauer
beschäftigt war, veröffentlichte im Jahr 1908 die t-Verteilung zum Mittelwertsvergleich. Da er
damit den Malzgehalt verschiedener Getreidesorten untersuchte, war seine Firma von einer
Veröffentlichung nicht begeistert. Daher publizierte er seinen t-Test (t vom engl. test) unter
dem Pseudonym “Student”, was dem Test den Namen “Student-t-Test” eingebracht hat.
s = 4.7s. Kann aus dem Unterschied zwischen 135s und 128s darauf geschlossen werden, dass
der wahre jedoch unbekannte mittlere Zeitbedarf für diesen Teilvorgang generell nicht bei
135s liegt? Das Signifikanzniveau ist 1%.
Aufgabe 5.2.3. Auf vier Äckern von je 40 Aren konnte der Ertrag von Kartoffeln durch
neuartige Behandlung um 0.55, 0.30, 1.52, 0.68 Tonnen gesteigert werden. Ist diese Behandlungsmethode wirksamer als frühere? Das Signifikanzniveau ist 1%.
Aufgabe 5.2.4. Es werden die Zugriffszeiten bei einem bestimmten Produktionsprozess untersucht. Folgende Stichprobe [in Sekunden] wurde ermittelt. Sind diese Zeiten wirklich von
0.4 Sekunden verschieden? Das Signifikanzniveau ist 1%.
0.23
0.43
0.54
0.62
5.2.1
0.23
0.43
0.54
0.65
0.23
0.43
0.54
0.65
0.30
0.43
0.54
0.65
0.32
0.45
0.54
0.67
0.32
0.45
0.54
0.67
0.34
0.45
0.56
0.68
0.34
0.45
0.56
0.76
0.34
0.45
0.56
0.76
Vertrauensintervall für den Erwartungswert
Aus einer gegebenen Stichprobe können wir gewisse Parameter wie Mittelwert oder Varianz schätzen (berechnen). Hierbei fehlen aber noch Genauigkeitsangaben zu den berechneten
Werten, und vielleicht möchten wir auch wissen, wie die Genauigkeit vom Stichprobenumfang
abhängt. Dazu dienen die Intervallschätzungen, das sind aus der Stichprobe berechnete Intervalle, in denen der wahre, aber unbekannt Wert mit grosser Wahrscheinlichkeit zu erwarten
ist. Solche Intervalle heissen Vertrauens- oder Konfidenzintervalle.
Haben wir eine Stichprobe x1 , . . . , xN vom Umfang N aus einer normalverteilten Grundgesamtheit genommen, so interessieren wir uns für ein Vertrauensintervall des unbekannten
Erwartungswertes µ der normalverteilten Grundgesamtheit. Dazu schätzen (berechnen) wir
vorerst den Mittelwert
N
1 X
x̄ =
xi
N
i=1
5.2. Einstichproben-t-Test, Student-t-Test
und die Varianz
41
N
1 X
s =
(xi − x̄)2
N −1
2
i=1
aus der Stichprobe. Nun können wir Vertrauens- oder Konfidenzgrenzen für den unbekannten Wert µ angeben, innerhalb welchen der wahre Erwartungswert mit einer gewissen
vorgegebenen Wahrscheinlichkeit γ liegt. Aus der vorgegebenen Vertrauenswahrscheinlichkeit γ = 1 − α bestimmen wir die kritische Grösse tn,1− α2 der Student-t-Verteilung mit
n = N − 1 Freiheitsgraden. Beachten Sie, dass wir den Flächeninhalt α auf beiden Seiten unter der Student-t-Verteilung gleichmässig verteilen, d.h. zweiseitige Fragestellung. Wir suchen
also alle möglichen µ, so dass
√ α
P |T | < tn,1− α2 = P X̄−µ
N
<
t
=1−α
n,1−
s
2
√ gilt. Nun können wir die Ungleichung x̄−µ
N < tn,1− α2 nach µ umformen und erhalten das
s
Vertrauensintervall für den unbekannten Erwartungswert µ durch
tn,1− α
tn,1− α
x̄ − √ 2 s ≤ µ ≤ x̄ + √ 2 s.
N
N
Je grösser der Stichprobenumfang N ist, desto kleiner wird das Vertrauensintervall. Wollen
wir also genaue Aussagen über den unbekannten Mittelwert machen, so sind wir gezwungen
den Stichprobenumfang N möglichst gross zu wählen.
Das Vertrauensintervall kann wie folgt interpretiert werden: von 100 aus Stichproben derselben
Grundgesamtheit mit dem unbekannten Erwartungswert µ berechneten Vertrauensintervallen
überdecken im Mittel γ · 100 = (1 − α) · 100 den wahren Erwartungswert µ.
Beispiel 5.2.2. Es sei eine Stichprobe vom Umfang N = 10 mit geschätztem Mittelwert
x̄ = 5 und Standardabweichung s = 0.2 gegeben. In welchem Intervall liegt nun der wahre
aber unbekannte Erwartungswert µ der normalverteilten Grundgesamtheit? Dazu berechnen
wir zur Vertrauenswahrscheinlichkeit γ = 0.95 die kritische Grösse t9,1−0.025 = 2.262 der
Student-t-Verteilung. Damit ergibt sich das gesuchte Vertrauensintervall
2.262
2.262
5 − √ 0.2 ≤ µ ≤ 5 + √ 0.2,
10
10
also 4.86 ≤ µ ≤ 5.14 mit 95% Wahrscheinlichkeit.
Aufgaben
Aufgabe 5.2.5. An Hand einer Stichprobe von 10 auf einem Drehautomaten bearbeiteten
Wellen soll ein Vertrauensintervall zur Vertrauenswahrscheinlichkeit 0.99 für den Erwartungswert µ der Grundgesamtheit der Abweichungen des Wellendurchmessers von der Mitte des
Toleranzfeldes bestimmt werden. Folgende Abweichungen [in Mikrometer] der ist-Masse von
der Mitte des Toleranzfeldes sind festgestellt worden:
2
1
-2
3
a. Verwenden Sie die Normalverteilung!
2
4
-2
5
3
4
42
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
b. Verwenden Sie die Student-t-Verteilung!
Aufgabe 5.2.6. Gegeben sei wieder die Stichprobe aus Aufgabe 5.2.4 der Zugriffszeiten. In
welchem Vertrauensintervall zur Vertrauenswahrscheinlichkeit 0.99 liegt der wirkliche Wert
des Mittels der Zugriffszeiten?
5.2.2
Ungefähr erforderlicher Stichprobenumfang
Wirtschaftliche und rationelle Arbeitsweise erfordern die Angabe des Arbeitsaufwandes, um
bestimmte Genauigkeiten bei Mess- und Analysenergebnissen zu erziehlen. So ist es etwa
wichtig, abzuschätzen, wie gross der Stichprobenumfang bei einem statistischen Test ungefähr
sein muss, um eine bestimmte Zuverlässigkeit der Aussage zu erhalten.
Mit Hilfe der Testgrösse t (vgl. Gleichung (5.2.a)) lässt sich eine solche ungefähre Abschätzung
machen. Formen wir die Gleichung (5.2.a) nach N um, so erhalten wir
N=
t2 s 2
.
(x̄ − µ)2
(5.2.c)
Wir geben uns einen bestimmten Toleranzbereich ∆µ = |x̄ − µ| vor. Ist zusätzlich die Varianz
s2 aus Voruntersuchungen etwa in Form einer oberen Schranke bekannt, so können wir für den
Stichprobenumfang N einen ungefähren Wert abschätzen, indem wir einen Durchschnittswert
für t = tn,1− α2 ≈ 2 bei einer Vertrauenswahrscheinlichkeit γ = 1 − α einsetzen. Wir erhalten
damit einen ungefähren Stichprobenumfang
N ≈4
s2
.
∆µ2
Es sei hier ausdrücklich gesagt, dass diese Abschätzung nur einen ungefähren3 Wert für den
Stichprobenumfang liefert.
Aufgabe
Aufgabe 5.2.7. Der Kupfergehalt einer Partie Schwefelkies-Abbrände (Fe3 O3 Hüttrückstände) soll auf ∆µ = ±0.05% Cu genau bestimmt werden. Zur Bestimmung von s wurden 24
Proben genommen und getrennt analysiert. Es ergaben sich x̄ = 2.034% Cu und s = 0.271%
Cu. Wie viele Proben sind etwa zu nehmen?
5.3
Vergleich zweier Mittelwerte unverbundener Stichproben
Im Folgenden wollen wir wir den Vergleich zweier Mittelwerte aus normalverteilten Grundgesamtheiten anstellen. Wir unterscheiden die beiden Fälle, wenn die unbekannten Varianzen
der normalverteilten Grundgesamtheit gleich oder ungleich sind.
3
Die rechte Seite der Gleichung (5.2.c) hängt via der kritischen Grösse tn,1− α2 auch noch von n = N − 1
ab. Somit liesse sich der Stichprobenumfang N nur iterativ bestimmen. Wir umgehen das Problem indem wir
einen Durchschnittswert für t einsetzten.
5.3. Vergleich zweier Mittelwerte unverbundener Stichproben
5.3.1
43
Zweistichproben-t-Test bei unbekannten aber gleichen Varianzen
Beispiel 5.3.1 (Parallelklassen). An einer Fachhochschule werden eine Klasse A von 25
Studierenden und eine Parallelklasse B von 28 Studierenden vom gleichen Dozenten in Mathematik unterrichtet. Der Dozent gestaltet jeweils den Unterricht in beiden Klassen gleich.
Demzufolge wurden die beiden Klassen gleichzeitig zur gleichen Klausur aufgeboten. Die erreichten Notendurchschnitte waren x̄A = 3.9 und x̄B = 4.2 und die Standardabweichungen
betrugen je sA = sB = 1. Der Dozent stellt sich nun sofort die Frage, ob die B-Klasse
signifikant besser als die A-Klasse sei. Was denken Sie?
Beim Zweistichproben-t-Test sind folgende Voraussetzungen zu beachten:
1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten aber gleichen4 Varianzen σ12 = σ22 = σ 2 ,
so genannt homoskedastischer Fall. Der Wert von σ 2 braucht jedoch nicht bekannt
zu sein.
2. Es sind zufällig zwei Stichproben x1 , . . . , xN1 und y1 , . . . , yN2 aus den normalverteilten
Grundgesamtheiten G1 und G2 gewählt.
Wir wollen nun wissen, ob sich die Mittelwerte x̄ und ȳ der gewählten Stichproben signifikant voneinander unterscheiden um herauszufinden, ob die Stichproben aus der gleichen
Grundgesamtheit stammen. Dazu formulieren wir die beiden alternativen Hypothesen
H0 : µ1 = µ2 , d.h., Stichproben stammen aus der gleichen Grundgesamtheit.
H1 : µ1 6= µ2 , d.h., Stichproben stammen aus unterschiedlichen Grundgesamtheiten.
Um diese Frage zu beantworten berechnen wir die geschätzten Mittelwerte
N1
1 X
xi
x̄ =
N1
und
i=1
N2
1 X
ȳ =
yi
N2
i=1
und die geschätzten Varianzen
N
s21
1
X
1
=
(xi − x̄)2
N1 − 1
N
und
s22
i=1
und daraus das gewogene Mittel der Varianzen
s2 =
2
X
1
=
(yi − ȳ)2
N2 − 1
i=1
(N1 − 1)s21 + (N2 − 1)s22
.
N1 + N2 − 2
Mit diesen Werten berechnen wir nun die Testgrösse
r
x̄ − ȳ
N1 N2
t=
,
s
N1 + N2
(5.3.a)
welche unter den obigen Voraussetzungen und der Nullhypothese einer Student-t-Verteilung
mit n = N1 + N2 − 2 Freiheitsgraden genügt. Damit können wir nun nach Vorgabe eines
Signifikanzniveaus α die kritische Grösse tn,1− α2 für die zweiseitige Fragestellung bestimmen.
Danach ziehen wir wieder den statistischen Schluss:
4
Die Gleichheit der Varianzen in den Grundgesamtheiten kann mit einem in Kapitel 6 angegebenen statistischen Test überprüft werden. Ist diese Gleichheit nicht erfüllt, so haben wir ein so genanntes Behrens-FisherProblem (vgl. Kapitel 5.3.2).
44
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
• Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., die
Unterschiede zwischen x̄ und ȳ sind zufälliger Natur.
• Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt.
Sind im Falle unabhängiger Stichproben ihre Umfänge gleich, gilt also N1 = N2 = N , so
vereinfacht sich die Testgrösse (5.3.a) zu
x̄ − ȳ √
N.
t= p 2
s1 + s22
Der Zweistichproben-t-Test ist auch dann anwendbar, wenn die Grundgesamtheiten nicht
normalverteilt, ihre Verteilungen aber nicht allzu unsymmetrisch sind.
Beispiel 5.3.2. Gegeben seien die Messreihen x = {1, 2, 3, 2, 1} und y = {2, 2, 4, 1} aus normalverteilten Grundgesamtheiten. Wir testen unter der Voraussetzung σ12 = σ22 die Gleichheit der Erwartungswerte. Dazu stellen wir die geeigneten Hypothesen auf und berechnen
die geschätzten Mittelwerte x̄ = 1.8 und ȳ = 2.25 und das gewogene Mittel der Varianzen
s2 = 1.079. Die Anzahl Freiheitsgrade ist n = 5 + 4 − 2 = 7. Daraus berechnen wir die
Testgrösse t = 0.646. Zum Signifikanzniveau α = 0.05 bestimmen wir für die zweiseitige Fragestellung den kritischen Wert t7,1−0.025 = 2.365.
Nun führen wir den statistischen Schluss durch: Es gilt |t| = 0.646 < t7,1−0.025 = 2.365,
also wird die Nullhypothese H0 angenommen. Die Mittelwerte x̄ = 1.8 und ȳ = 2.25 weichen
demzufolge nur unwesentlich, zufallsbedingt, voneinander ab. Dieses eventuell überraschende
Resultat ist erstens auf die grossen Varianzen und zweitens auf die sehr kleinen Stichprobenumfänge zurückzuführen.
Aufgaben
Aufgabe 5.3.1. Stammen die drei Messreihen x, y und z unter der Voraussetzung σx2 = σy2 =
σz2 aus der gleichen normalverteilten Grundgesamtheit? Das Signifikanzniveau ist α = 1%.
x
y
z
18.0
27.0
21.5
14.5
34.0
20.5
13.5
20.5
19.0
12.5
29.5
24.5
23.0
20.0
16.0
24.0
28.0
13.0
21.0
20.0
20.0
17.0
26.5
16.5
18.5
22.0
17.5
9.5
24.5
19.0
14.0
34.0
35.5
19.0
Aufgabe 5.3.2. Der durchschnittliche Verbrauch eines bestimmten Hilfsstoffes in zwei vergleichbaren Filialen einer Unternehmung soll geprüft werden. Dazu wurde der Verbrauch
während einer Anzahl Tage bei beiden Filialen ermittelt. Es ergaben sich die folgenden Stichproben. Kann statistisch erhärtet werden, dass die eine Filiale signifikant mehr von dem
entsprechenden Hilfsstoff verbraucht? Das Signifikanzniveau sei α = 1%.
x
y
1.5
8.8
3.4
5.5
6.6
5.5
3.5
4.5
4.5
6.6
6.4
5.4
2.6
7.1
6.6
5.6
7.8
6.6
4.9
8.3
5.5
6.6
6.6
5.5
6.8
3.6
7.7
6.1
7.7
8.8
4.9
7.6
8.8
8.3
5.5
8.8
6.2
7.7
4.7
5.5
7.7
9.9
5.8
4.9
6.3
7.3
6.6
7.7
6.4
5.9
8.8
6.6
5.3. Vergleich zweier Mittelwerte unverbundener Stichproben
5.3.2
45
Zweistichproben-t-Test bei unbekannten Varianzen
Im Falle ungleicher Varianzen der Grundgesamtheiten σ12 6= σ22 , oder bei Ablehnung der Hypothese über die Gleichheit der Varianzen σ12 und σ22 durch einen in Kapitel 6 angegebenen
Test kann zur Prüfung der Hypothese H0 : µ1 = µ2 ein von B. L. Welch (1947) vorgeschlagener Näherungstest verwendet werden. Diese Aufgabenstellung wird als Behrens-FisherProblem bezeichnet.
Beispiel 5.3.3 (Markenjeans). Wir haben zwei Lieferungen von Markenjeans vom gleichen
Importeur. Dieser behauptet, beide Lieferungen seien in den USA hergestellt worden. Wir
vermuten aber, dass eine Lieferung aus Fernost mit schlechter Qualität stammt. Wie können
wir unsere Vermutung überprüfen? Zum Beispiel, indem wir ein Qualitätsmerkmal (z.B.
Reisfestigkeit der Jeans nach 20 Mal waschen) bestimmen und von diesem Merkmal den
Mittelwert für beide Lieferungen bilden und diese Mittelwerte mit einem unverbundenen
Zweistichproben-t-Test untersuchen. Da wir vermuten, dass die Lieferungen aus zwei verschiedenen Fabriken stammen, müssen wir davon ausgehen, dass die Varianzen verschieden
sein könnten.
Beim Behrens-Fisher-Problem sind folgende Voraussetzungen zu beachten:
1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten Varianzen σ12 und σ22 , so genannt heteroskedastischer Fall.
2. Es sind zufällig zwei Stichproben x1 , . . . , xN1 und y1 , . . . , yN2 aus den normalverteilten
Grundgesamtheiten G1 und G2 gewählt.
Wir wollen nun wissen, ob sich die Mittelwerte x̄ und ȳ der gewählten Stichproben signifikant voneinander unterscheiden um herauszufinden, ob die Stichproben aus der gleichen
Grundgesamtheit stammen. Dazu formulieren wir die beiden alternativen Hypothesen:
H0 : µ1 = µ2 , d.h., Stichproben stammen aus der gleichen Grundgesamtheit.
H1 : µ1 6= µ2 , d.h., Stichproben stammen aus unterschiedlichen Grundgesamtheiten.
Um diese Frage zu beantworten berechnen wir die geschätzten Mittelwerte
x̄ =
N1
1 X
xi
N1
und
ȳ =
i=1
N2
1 X
yi
N2
i=1
und die geschätzten Varianzen
N
s21 =
N
1
X
1
(xi − x̄)2
N1 − 1
und
s22 =
i=1
und daraus die gewogene Varianz
s2 =
2
X
1
(yi − ȳ)2
N2 − 1
i=1
s21
s2
+ 2.
N1 N2
Wir stellen fest, dass die gewogene Varianz s2 anders berechnet wird, als im Fall gleicher
Varianzen (vgl. Gleichung (5.3.a)). Mit diesen Werten berechnen wir nun die Testgrösse
t=
x̄ − ȳ
.
s
(5.3.b)
46
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
Die Testgrösse t gehorcht wiederum einer Student-t-Verteilung mit
n=
$
1
c2
N1 −1
+
(1−c)2
N2 −1
%
mit
c=
s21
N1
s21
N1
+
s22
N2
Freiheitsgraden, wobei ⌊ . ⌋ die Abrundungsfunktion bezeichnet. Damit können wir nun nach
Vorgabe eines Signifikanzniveaus α die kritische Grösse tn,1− α2 für die zweiseitige Fragestellung
bestimmen und den statistischen Schluss ziehen:
• Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen.
• Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt.
Aufgabe
Aufgabe 5.3.3. Mit zwei verschiedenen Holzwerkstoffbindemitteln A und B werden Spanplatten hergestellt. Mit dem Bindemittel A erhalten wir 10 Prüfkörper, mit dem Mittel B
deren 12. Alle Prüfkörper werden einem Querzugfestigkeitstest unterworfen. Folgende Werte
wurden gemessen:
A
B
0.745
0.745
0.824
0.686
0.804
1.049
0.863
1.059
0.873
0.873
0.814
0.834
0.804
0.735
0.794
0.971
0.804
0.932
0.745
0.932
0.843
0.873
Sind die beiden Bindemittel gleichwertig? Das Signifikanzniveau ist α = 1%.
5.4
Paarweiser Vergleich bei verbundenen Stichproben
Oft stehen wir in der Praxis vor der Aufgabe, Unterschiede zwischen zwei verschiedenen
Produktionsverfahren, Behandlungsmethoden, Messgeräten, Messmethoden oder Laboranten
miteinander zu vergleichen. Zu diesem Zweck werden mit beiden Verfahren an denselben
Einheiten Messungen des Merkmals durchgeführt und paarweise verglichen. Folgendes Beispiel
soll zur näheren Erläuterung dienen.
Beispiel 5.4.1. Zwei verschiedene Messmethoden für Widerstände sollen miteinander verglichen werden. Vergleichsmessungen an fünf Widerständen ergaben das folgende Messprotokoll:
i
1. Methode: xi [in Ω]
2. Methode: yi [in Ω]
1
100.5
98.2
2
102.4
99.1
3
104.3
102.4
4
101.5
101.1
5
98.4
96.2
Wir wollen wissen, ob beide Messmethoden als gleichwertig angesehen werden können oder
ob die beobachteten Abweichungen signifikant sind.
Um diese Aufgabe zu bewältigen, verwenden wir einen paarweisen Vergleichstest, bei dem
folgende Voraussetzungen zu beachten sind:
1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten aber gleichen Varianzen σ12 = σ22 = σ 2 . Der
Wert von σ 2 braucht jedoch nicht bekannt zu sein.
5.4. Paarweiser Vergleich bei verbundenen Stichproben
47
2. Es sind zufällig zwei verbundene Stichproben x1 , . . . , xN und y1 , . . . , yN aus den normalverteilten Grundgesamtheiten G1 und G2 gewählt, d.h., xi lässt sich mit yi vergleichen.
Wir wollen nun wissen, ob sich sich die verbundenen Messwerte xi und yi signifikant voneinander unterscheiden. Dazu berechnen wir aus den paarweise zusammengehörigen Messwerten
die Differenzen
di = xi − yi für alle i ∈ {1, . . . , N }
Diese Reihe der Differenzen di wird als Stichprobe vom Umfang N aus einer normalverteilten
Grundgesamtheit mit dem Erwartungswert µd und der im Allgemeinen unbekannten Varianz
σd2 aufgefasst. Die Untersuchung einer signifikanten Abweichung entspricht der Prüfung der
alternativen Hypothesen:
H0 : µd = 0, d.h. im Mittel kein Unterschied zwischen den verbundenen Messwerten.
H1 : µd 6= 0, d.h. im Mittel Unterschied zwischen den verbundenen Messwerten.
Damit können wir den in Kapitel 5.2 beschriebenen Einstichproben-t-Test mit der Testgrösse
t=
d¯ − µd √
d¯ √
N=
N,
sd
sd
(5.4.a)
verwenden, wobei
N
1 X
d¯ =
di
N
N
und
s2d =
i=1
1 X
¯2
(di − d)
N −1
i=1
das arithmetische Mittel und die geschätzte Varianz der Differenzenreihe bedeutet. Die Testgrösse t gehorcht einer Student-t-Verteilung mit n = N −1 Freiheitsgraden. Damit können wir
nun nach Vorgabe eines Signifikanzniveaus α die kritische Grösse tn,1− α2 für die zweiseitige
Fragestellung bestimmen und den statistischen Schluss ziehen:
• Ist die Testgrösse |t| < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h., die
Messwerte unterscheiden sich nur zufällig.
• Ist die Testgrösse |t| ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt.
Aufgaben
Aufgabe 5.4.1. Es soll untersucht werden, ob zwei Laboranten vergleichbare Ergebnisse bei
der Bestimmung des Leimungsgrades von Papieren mit einem bestimmten Test liefern. Beide
Laboranten haben 8 verschiedene Papiersorten gemessen. Das Signifikanzniveau ist α = 1%.
Sorte
Labor A
Labor B
1
18.60
18.58
2
27.60
27.37
3
27.50
27.27
4
25.00
24.64
5
24.50
24.10
6
26.80
26.33
7
29.70
29.33
8
26.50
26.63
Aufgabe 5.4.2. Die folgenden Zahlenpaare sind entstanden aus Messungen von spezifischen
Gewichten einer Anzahl Materialien durch zwei Experimentatoren. Vergleichen Sie sie paarweise. Sind die beiden Messreihen gleichwertig? Das Signifikanzniveau ist α = 1%.
48
Kapitel 5. Prüfen von Erwartungswerten (Parametertests)
Paar
x
y
1
3.3
3.2
2
3.2
3.4
3
3.8
3.5
4
3.4
3.2
5
3.5
3.2
6
3.4
3.4
7
3.4
3.4
8
3.6
3.2
9
3.9
3.3
10
3.8
3.1
Paar
x
y
11
3.6
3.0
12
3.3
3.5
13
3.4
3.4
14
3.5
3.2
15
3.8
3.2
16
3.8
3.5
17
3.3
3.2
18
3.2
3.5
19
3.2
3.1
20
3.5
3.0
Kapitel 6
Prüfen von Varianzen
(Parametertests)
Ebenso wie über den Mittelwert µ der normalverteilten Grundgesamtheit können wir auch
über die Varianz σ 2 eine statistische Hypothese aufstellen und diese mit geeigneten Testverfahren nachprüfen. Solche Prüfmethoden sind von besonderer Wichtigkeit, wenn die Genauigkeit
und Gleichmässigkeit der Arbeitsweise technologischer Prozesse, Messgeräte oder Maschinen
untersucht werden soll. Wir unterscheiden dabei zwei Fälle.
6.1
Abweichung einer Varianz vom theoretischen Wert, χ2 Varianztest
Eine einzige Stichprobe von N Werten x1 , . . . , xN liegt vor. Ihre Varianz s2 ist zu vergleichen
mit einem Wert σ 2 , der irgendwie, unabhängig von den Beobachtungen, gegeben ist.
Wir benutzen dazu den χ2 -Varianztest1 , bei dem folgende Voraussetzungen zu beachten
sind:
1. Die normalverteilte Grundgesamtheit G hat die bekannte Varianz σ 2 .
2. Es sind zufällig N Stichprobenwerte x1 , . . . , xN aus einer normalverteilten Grundgesamtheit gewählt.
Beachten Sie, dass bei diesem Test der Erwartungswert µ der Grundgesamtheit ohne Einfluss
bleibt. Wir wollen nun wissen, ob die gewählte Stichprobe der N Werte x1 , . . . , xN aus der
Grundgesamtheit G mit der Varianz σ 2 stammt. Dazu berechnen wir die geschätzte Varianz
N
s2 =
1 X
(xi − x̄)2
N −1
i=1
mit
x̄ =
N
1 X
xi
N
i=1
und vergleichen sie mit der bekannten Varianz σ 2 der Grundgesamtheit G, indem wir folgende
alternativen Hypothesen aufstellen.
H0 : σ 2 = s2 , d.h., die Stichprobe stammt aus der Grundgesamtheit G mit Varianz σ 2 .
H1 : σ 2 6= s2 , d.h., die Stichprobe stammt aus einer anderen Grundgesamtheit.
1
sprich Chi-Quadrat
49
50
Kapitel 6. Prüfen von Varianzen (Parametertests)
Zur Beantwortung dieser Fragestellung machen wir nun folgende gedankliche Konstruktion:
Wir betrachten die Gesamtheit aller zufälligen Stichproben mit N Werten x1 , . . . , xN aus
einer normalen Grundgesamtheit mit Varianz σ 2 . Zu jeder Stichprobe berechnen wir aus den
Werten x1 , . . . , xN die geschätzte Varianz und daraus die Testgrösse
χ2 =
(N − 1)s2
.
σ2
(6.1.a)
Für jede Stichprobe erhalten wir nun einen anderen Wert für χ2 und demzufolge wieder eine
Wahrscheinlichkeitsverteilung, die so genannte χ2 -Verteilung mit n = N − 1 Freiheitsgraden.
Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α
ist für die zweiseitige Fragestellung durch die kritischen Grössen χn, α2 (unten) und χn,1− α2
(oben) gegeben. Die kritischen Grössen lassen sich für die zweiseitige Fragestellung aus den
Beziehungen
P χ2 ≤ χ2n, α = α2
und P χ2n,1− α ≤ χ2 = α2
2
2
mit Hilfe von Tafeln T.4 und T.5 oder einem Computerprogramm (z.B. Excel) ermitteln.
Jetzt ziehen wir den statistischen Schluss (hier für die zweiseitige Fragestellung):
fn (x)
1−α
α
2
α
2
χ2n,1− α
2
χ2n, α
2
Ablehnungsbereich
Annahmebereich
x
Ablehnungsbereich
Abbildung 6.1.i: Kritische Grössen χ2n, α und χ2n,1− α beim χ2 -Varianztest.
2
2
• Ist die Testgrösse χ2n, α < χ2 < χ2n,1− α , dann wird die Nullhypothese H0 angenommen,
2
2
d.h., Abweichungen vom idealen Wert χ2 = N − 1 sind zufälliger Natur. Die Stichprobe
stammt somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus der Grundgesamtheit
mit der Varianz σ 2 .
• Ist die Testgrösse χ2 ≤ χ2n, α oder χ2n,1− α ≤ χ2 , dann wird die Nullhypothese H0 auf
2
2
dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen
Grundgesamtheit.
Beispiel 6.1.1. Es sei eine Stichprobe aus einer normalverteilten Grundgesamtheit von
N = 10 Messungen gegeben. Wir berechnen die Varianz s2 = 16.25 und fragen uns, ob
eine signifikante Abweichung der Varianz s2 vom theoretisch zu erwartenden Wert σ = 2.3
vorliegt. Das Signifikanzniveau sei α = 0.01.
Dazu stellen wir die geeigneten Hypothesen für die zweiseitige Fragestellung auf und berechnen
die Testgrösse des χ2 -Varianztest
χ2 =
(N − 1)s2
9 · 16.25
=
= 63.587.
σ2
2.3
6.1. Abweichung einer Varianz vom theoretischen Wert, χ2 -Varianztest
51
Die Anzahl Freiheitsgrade ist n = 10 − 1 = 9. Zum Signifikanzniveau α = 0.01 bestimmen wir
für die zweiseitige Fragestellung mit Hilfe von Tafeln T.4 und T.5 oder einem Computerprogramm die kritischen Werte
χ29,0.005 = 1.735
χ29,1−0.005 = 23.589.
und
Nun führen wir den statistischen Schluss durch: Es gilt χ2 = 63.587 6∈ ]1.735, 23.589[, also
wird die Nullhypothese H0 abgelehnt. Die Stichprobe stammt demnach mit einer Irrtumswahrscheinlichkeit von 99% aus einer anderen Grundgesamtheit.
Die χ2 -Verteilung
Die von K. Pearson (1857-1936) (vgl. Abbildung 1.1.i) gefundene χ2 -Verteilung mit n Freiheitsgraden hat die Wahrscheinlichkeitsdichte
(
0
wenn x < 0
fn (x) =
n
x
−1
−
cn x 2 e 2
wenn x ≥ 0,
wobei cn =
1
n
2 2 Γ( n
)
2
eine nur von der Anzahl Freiheitsgraden n abhängige Konstante2 ist. Der
Erwartungswert und die Varianz oder Streuung einer mit n Freiheitsgraden χ2 -verteilten
Zufallsgrösse χ2 beträgt
E(χ2 ) = n und Var(χ2 ) = 2n.
R∞
Wie bei jeder Verteilung gilt auch hier −∞ fn (x) dx = 1.
0.6
0.5
0.4
0.3
0.2
0.1
0
2
4
6
8
10
12
x
Abbildung 6.1.ii: Die χ2 -Verteilung für verschiedene Freiheitsgrade n. Der Erwartungswert
E(χ2 ) = n wandert mit zunehmendem n nach rechts und die Verteilungen werden flacher.
Die Dichte der χ2 -Verteilung ist im Allgemeinen unsymmetrisch linkssteil. Für n → ∞ strebt
die Dichte gegen eine N (n, 2n)-Verteilung (vgl. Abbildungen 6.1.iii und 6.1.iv).
Das q-Quantil der χ2 -Verteilung mit n Freiheitsgraden wird mit χ2n,q bezeichnet und ist
vertafelt (vgl. Tafeln T.4 und T.5). Das q-Quantil χ2n,q kann aus der Beziehung
P χ2 ≤ χ2n,q = q
bestimmt werden.
2
Es bezeichnet Γ die Gammafunktion.
52
Kapitel 6. Prüfen von Varianzen (Parametertests)
–10
0.12
0.06
0.1
0.05
0.08
0.04
0.06
0.03
0.04
0.02
0.02
0.01
0
–5
5
10
15
20
–10
10
20
x
30
40
50
x
Abbildung 6.1.iii: Die χ2 -Verteilung mit
Freiheitsgrad n = 5 (schwarz) und die approximative N (n, 2n)-Verteilung (grau).
Abbildung 6.1.iv: Die χ2 -Verteilung mit
Freiheitsgrad n = 20 (schwarz) und die approximative N (n, 2n)-Verteilung (grau).
Aufgaben
Aufgabe 6.1.1. Die Zeitaufnahme für einen Spannvorgang in der Produktion lieferte eine beobachtete Messwertstandardabweichung von s = 4.7 Sekunden. Ist dieses Stichprobenergebnis
vereinbar mit dem für diesen Vorgang bisher geltenden Wert für die Standardabweichung in
der Höhe von σ = 3 Sekunden, wenn N = 32? Das Signifikanzniveau sei α = 1%.
Aufgabe 6.1.2. Der Wirkungsgrad einer Maschine wurde viermal täglich ermittelt. ln 17
Tagen ergaben sich für die vier Messungen untenstehende Standardabweichungen.
Tag
s
Tag
s
1
5.62
11
5.23
2
4.57
12
4.69
3
7.59
13
3.7
4
5.48
14
5.6
5
7.44
15
13.7
6
4.51
16
6.86
7
1.5
17
3.37
8
10.3
9
10.4
10
5.32
Weichen die beobachteten Standardabweichungen wesentlich vom theoretisch angenommenen
Wert σ = 5.24 ab? Das Signifikanzniveau sei α = 2%.
6.1.1
Vertrauensintervall für die Varianz
Haben wir eine Stichprobe x1 , . . . , xN vom Umfang N aus einer normalverteilten Grundgesamtheit genommen, so interessieren wir uns für ein Vertrauensintervall der unbekannten
Varianz σ 2 der normalverteilten Grundgesamtheit. Dazu schätzen wir die Varianz s2 aus der
Stichprobe. Nun können wir mit Hilfe des χ2 -Varianztests ein Vertrauens- oder Konfidenzintervall für den unbekannten Wert σ 2 angeben, innerhalb welchem die wahre Varianz mit einer
gewissen vorgegebenen Wahrscheinlichkeit γ liegt. Aus der vorgegebenen Vertrauenswahrscheinlichkeit γ = 1 − α bestimmen wir die beiden kritischen Grössen χ2n, α und χ2n,1− α der
χ2 -Verteilung, so dass
P χ2n, α ≤ χ2 ≤ χ2n,1− α = P χ2n, α ≤
2
2
2
gilt. Nun können wir die Ungleichung χ2n, α ≤
2
2
(N −1)s2
σ2
(N −1)s2
σ2
≤ χ2n,1− α
2
2
=1−α
≤ χ2n,1− α nach σ 2 umformen und
2
6.1. Abweichung einer Varianz vom theoretischen Wert, χ2 -Varianztest
53
fn (x)
1−α
α
2
α
2
χ2n,1− α
χ2n, α
2
x
2
Abbildung 6.1.v: Die benötigten kritischen Grenzen zur Berechnung des Vertrauensintervalls.
erhalten das Vertrauensintervall
N −1 2
N −1
s ≤ σ 2 ≤ 2 s2
2
χn,1− α
χn, α
2
2
für die unbekannte Varianz σ 2 . Das Vertrauensintervall kann wie folgt interpretiert werden:
von 100 aus Stichproben derselben Grundgesamtheit mit der unbekannten Varianz σ 2 berechneten Vertrauensintervallen überdecken im Mittel γ · 100 = (1 − α) · 100 die wahre Varianz
σ2 .
Beispiel 6.1.2. Es sei eine Stichprobe vom Umfang N = 8 mit geschätzter Standardabweichung s = 2 gegeben. In welchem Intervall liegt nun die wahre aber unbekannte Standardabweichung σ der normalverteilten Grundgesamtheit? Dazu berechnen wir zur Vertrauenswahrscheinlichkeit γ = 0.98 die kritischen Grössen χ27,0.01 = 1.239 und χ27,0.99 = 18.475 der
χ2 -Verteilung. Damit ergibt sich das gesuchte Vertrauensintervall
8−1 2
8−1 2
2 = 1.516 ≤ σ 2 ≤
2 = 22.598,
18.475
1.239
also 1.231 ≤ σ ≤ 4.7542 mit 98% Wahrscheinlichkeit.
Aufgaben
Aufgabe 6.1.3. Zum Vertrauensniveau α = 0.1 sei ein Vertrauensintervall für die Standardabweichung der Breite der Rohlinge von Kugellagerinnenringen aufgrund einer Stichprobe von
20 Stück zu bestimmen. Es soll vorausgesetzt werden, dass die Breite der Rohlinge normalverteilt ist. Die Messungen ergaben x̄ = 32.2975mm, s2 = 0.13306mm2 .
Aufgabe 6.1.4. Die folgenden Werte ergaben sich als Stichprobe von 19 aufgenommenen
Zeiten bei einem Arbeitsvorgang.
3.12
3.00
3.15
3.22
3.12
3.11
3.20
3.81
3.10
3.30
3.13
3.24
3.16
3.16
3.18
3.51
3.21
3.21
3.01
In welchem Intervall liegt die Standardabweichung dieses Arbeitsvorgangs mit 98% Wahrscheinlichkeit?
54
Kapitel 6. Prüfen von Varianzen (Parametertests)
6.2
Vergleich zweier Varianzen, F -Test
Der Unterschied zweier Varianzen ist zu prüfen, wobei zwei voneinander unabhängige Stichproben von N1 und N2 Werten bestimmt wurden.
Wir benutzen dazu den F -Test3 oder Fisher-Test bei dem folgende Voraussetzungen zu
beachten sind:
1. Die normalverteilten Grundgesamtheiten G1 und G2 haben die unbekannten Erwartungswerte µ1 und µ2 und die unbekannten Varianzen σ12 und σ22 .
2. Es sind zufällig zwei unabhängige Stichproben x1 , . . . , xN1 und y1 , . . . , yN2 aus den normalverteilten Grundgesamtheiten G1 und G2 gewählt.
Wir wollen nun wissen, ob sich die Varianzen
N
s21
1
X
1
=
(xi − x̄)2
N1 − 1
s22 =
1
N2 − 1
i=1
N2
X
i=1
(yi − ȳ)2
mit
mit
N1
1 X
x̄ =
xi ,
N1
ȳ =
1
N2
i=1
N2
X
yi
i=1
der beiden Grundgesamtheiten signifikant voneinander unterscheiden. Indem wir gegebenenfalls die beiden Stichproben vertauschen, können wir zusätzlich annehmen, dass die
zusätzliche Voraussetzung
s21 ≥ s22
(6.2.a)
gilt. Nun formulieren wir die beiden alternativen Hypothesen für die einseitige Fragestellung,
da wir wegen der zusätzlichen Voraussetzung (6.2.a) nur an einer Abweichung nach oben
interessiert sind:
H0 : σ12 = σ22 , d.h., die Stichproben haben die gleichen Varianzen.
H1 : σ12 > σ22 , d.h., die Varianz der ersten Stichprobe ist grösser als die der zweiten.
Zur Beantwortung dieser Fragestellung machen wir nun folgende gedankliche Konstruktion: Es werden beliebig viele Paare von Stichproben vom Umfang N1 und N2 aus den jeweiligen Grundgesamtheiten entnommen. Zu jedem Stichprobenpaar berechnen wir aus den
geschätzten Varianzen die Testgrösse
F =
s21
.
s22
(6.2.b)
Wegen der zusätzlichen Voraussetzung (6.2.a) gilt F ≥ 1. Für jedes Stichprobenpaar erhalten
wir nun einen anderen Wert für F , und demzufolge wieder eine Wahrscheinlichkeitsverteilung,
die so genannte F -Verteilung mit m = N1 − 1 und n = N2 − 1 Freiheitsgraden.
Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α
ist für die einseitige Fragestellung durch den kritischen Wert Fm,n,1−α gegeben. Der kritische
Wert lässt sich für die einseitige Fragestellung aus der Beziehung
P (Fm,n,1−α ≤ F ) = α
mit Hilfe von Tafeln T.6 bis T.14 oder einem Computerprogramm (z.B. Excel) ermitteln.
Jetzt ziehen wir den statistischen Schluss:
3
F von F isher
6.2. Vergleich zweier Varianzen, F -Test
55
fm,n (x)
1−α
α
Fm,n,1−α
x
Ablehnungsbereich
Annahmebereich
Abbildung 6.2.i: Kritische Grösse Fm,n,1−α beim F -Test.
• Ist die Testgrösse F < Fm,n,1−α , dann wird die Nullhypothese H0 angenommen, d.h.,
Abweichungen vom idealen Wert F = 1 sind zufälliger Natur. Die beiden Stichproben
stammen somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus Grundgesamtheiten
mit gleichen Varianzen.
• Ist die Testgrösse Fm,n,1−α ≤ F , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt.
Beispiel 6.2.1. Es seien zwei Stichproben vom Umfang N1 = 21 mit s21 = 11.0 und N2 = 16
mit s22 = 7.6 aus normalverteilten Grundgesamtheiten gegeben. Können wie an Hand dieser
Angaben mit einer Irrtumswahertscheinlichkeit von α = 1% entscheiden, ob sich die Varianzen
σ12 und σ22 der beiden Grundgesamtheiten signifikant voneinander unterscheiden?
Da die zusätzliche Voraussetzung (6.2.a) erfüllt ist, können wir die Testgrösse
11.0
= 1.447
7.6
F =
berechnen. Die Anzahl Freiheitsgrade sind m = 21 − 1 = 20 und n = 16 − 1 = 15. Zum Signifikanzniveau α = 0.01 bestimmen wir mit Hilfe von Tafel T.10 oder einem Computerprogramm
den kritischen Wert
F20,15,0.99 = 3.372.
Nun führen wir den statistischen Schluss durch: Es gilt F = 1.447 < F20,15,0.99 = 3.372,
also wird die Nullhypothese H0 angenommen. Die Stichproben stammen demzufolge mit einer
Irrtumswahrscheinlichkeit von 99% aus normalverteilten Grundgesamtheiten mit der gleichen
Varianz.
Die F -Verteilung
Die von R. A. Fisher (1890-1962) (vgl. Abbildung 1.1.iii) gefundene F -Verteilung mit (m, n)
Freiheitsgraden hat die Wahrscheinlichkeitsdichte
fm,n (x) =

0
cm,n
wenn x < 0
m −1
2
m+n
m
2
1+ n x
x
(
)
wenn x ≥ 0,
56
Kapitel 6. Prüfen von Varianzen (Parametertests)
wobei cm,n =
stante4
Γ( m+n
)
2
n
Γ( m
)Γ(
)
2
2
m
n
m
2
eine nur von der Anzahl Freiheitsgrade (m, n) abhängige Kon-
ist. Der Erwartungswert und die Varianz oder Streuung einer mit (m, n) Freiheitsgraden F -verteilten Zufallsgrösse F beträgt
E(F ) =
n
n−2
für n > 2
und
Wie bei jeder Verteilung gilt auch hier
Var(F ) =
R∞
−∞ fm,n (x) dx
2n2 (m + n − 2)
m(n − 2)2 (n − 4)
für n > 4.
= 1.
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
2
4
6
8
10
x
Abbildung 6.2.ii: Die F -Verteilung für verschiedene Freiheitsgrade (6, n). Der Erwartungswert
n
konvergiert mit zunehmendem n gegen 1 und die Verteilungen werden steiler.
E(F ) = n−2
Die Dichte
der F2-Verteilung
ist unsymmetrisch. Für grosse m und n strebt die Dichte gegen
2n (m+n−2)
n
eine N n−2 , m(n−2)2 (n−4) -Verteilung (vgl. Abbildungen 6.2.iii und 6.2.iv).
1
1.6
1.4
0.8
1.2
1
0.6
0.8
0.4
0.6
0.4
0.2
0.2
–1
0
1
2
3
x
Abbildung 6.2.iii: Die F -Verteilung mit
Freiheitsgrad (20, 30) (schwarz) und die
approximative Normalverteilung (grau).
–1
0
1
2
3
x
Abbildung 6.2.iv: Die F -Verteilung mit
Freiheitsgrad (60, 90) (schwarz) und die
approximative Normalverteilung (grau).
Das q-Quantil der F -Verteilung mit (m, n) Freiheitsgraden wird mit Fm,n,q bezeichnet und
4
Es bezeichnet Γ die Gammafunktion.
6.2. Vergleich zweier Varianzen, F -Test
57
ist vertafelt (vgl. Tafeln T.6 bis T.14). Das q-Quantil Fm,n,q wird aus der Beziehung
P (F ≤ Fm,n,q ) = q
bestimmt. Es gilt
Fn,m,1−q =
1
.
Fm,n,q
Aufgaben
Aufgabe 6.2.1. Für eine auszuführende Arbeit stehen zwei Arbeitsverfahren zur Diskussion.
Da es bei der Arbeit wesentlich auf die gleichmässige Arbeitsausführung ankommt, werden
beide Verfahren getestet und hierüber Zeitaufnahmen gemacht. Das erste Verfahren wurde insgesamt N1 = 125 Mal beobachtet und dabei eine Messwertstandardabweichung von
s1 = 2.2 s festgestellt. Das zweite Verfahren lieferte aufgrund von N2 = 20 Messwerten die
Standardabweichung s2 = 3.0 s. Kann aus diesem Vergleich beider Versuchsergebnisse geschlossen werden, dass das erste Verfahren eine gleichmässigere Arbeitsausführung, d.h. eine
geringere Zeitstreuung gewährleistet? Das Signifikanzniveau ist α = 1%.
Aufgabe 6.2.2. Abhängigkeit der Varianzen der Arbeitszeiten [in Sekunden im Quadrat]
von der Arbeitseile. Es wird geglaubt, dass die Varianz der Griffzeiten mit zunehmender Arbeitseile zuerst abnimmt und dann wieder zunimmt. Dies jedenfalls suggerieren die folgenden
Zahlen.
Aufnahme
1
2
3
4
Anzahl
Messungen
30
30
30
30
Durchschnitt
Arbeitszeiten
51.97
46.80
42.43
37.53
Varianz s2
Arbeitszeiten
8.847
3.614
7.236
10.516
Kann die Abnahme respektive Zunahme als gesichert betrachtet werden? Das Signifikanzniveau ist α = 1%.
Aufgabe 6.2.3 (Mischwirkung pharmazeutischer verwendeter Pulvermischer). Die Vermischungsgüte von vier verschiedenen Mischertypen soll an Hand der Vermischung von 60%
Sulfisomidin und 40% Weizenstärke untersucht werden. Hierbei ist die Teilchenbeschaffenheit
unterschiedlich. Es werden die folgenden Mischertypen untersucht:
1. Schüttelmischer
2. Doppelzylindermischer
3. Trommelmischer
4. Rührmischer
An zehn Punkten wurden in jedem Mischertyp nach bestimmten Umdrehungszahlen Proben
entnommen und analysiert. Es ergaben sich als Standardabweichungen s folgende Werte:
Umdrehungen
1. Schüttelmischer
2. Doppelzylindermischer
3. Trommelmischer
4. Rührmischer
10
31.00
9.26
18.65
11.80
100
11.05
10.05
4.00
8.95
500
8.76
9.50
3.92
6.58
1500
4.40
7.15
3.54
5.60
3500
2.12
5.25
3.64
3.99
8500
2.56
3.06
3.64
2.06
13500
2.18
1.93
2.49
3.54
18500
2.18
1.96
2.47
4.56
58
Kapitel 6. Prüfen von Varianzen (Parametertests)
Wegen der zufälligen Natur des Mischprozesses wir eine absolute Homogenität nie erreicht.
Toleranzen müssen deshalb akzeptiert werden. Für den Versuch wurde folgende Vereinbarung getroffen. Eine Mischung wird als homogen bezeichnet, wenn von 10 Stichproben einer
Mischstufe deren 9 eine Abweichung bis ±5% und nur eine Stichprobe eine Abweichung bis
±10% vom Mittelwert zeigen, und wenn das Mittel einer Mischerstufe nicht mehr als ±5%
vom Sollwert abweicht.
Die obigen Zahlen legen nun eine spezielle Untersuchung des Rührmischers nahe. Ist die auftretende Inhomogenität nach 18500 Umdrehungen statistisch gesichert oder nicht? Vergleichen
Sie die Mischgüte von folgenden Mischern und Stufen:
a. Rührmischer: bei 3500 und 8500 Umdrehungen
b. Rührmischer: bei 8500 und 13500 Umdrehungen
c. Rührmischer: bei 8500 und 18500 Umdrehungen
d. Schüttelmischer und Doppelzylindermischer: bei 3500 Umdrehungen
6.3
Vergleich von mehreren Varianzen, Cochran-Test
Der Cochran-Test ist ein vereinfachtes Verfahren zur Beurteilung von mehreren Varianzen.
Als Voraussetzung haben wir eine Reihe von k unabhängigen Stichproben gleichen Umfangs N aus normalverteilten Grundgesamtheiten gegeben. Das Problem stellt sich nun zu
entscheiden, ob die Varianzen der Grundgesamtheiten der k unabhängigen Stichproben alle gleich sind. Die Untersuchung einer signifikanten Abweichung entspricht der Prüfung der
alternativen Hypothesen:
H0 : σ12 = · · · = σk2 , d.h., alle Varianzen der k Grundgesamtheiten sind gleich.
H1 : σi2 6= σj2 für mindestens zwei verschiedene Indizes i, j ∈ {1, . . . , k}.
Dazu berechnen wir aus den k Stichproben die Testgrösse
s2i
2,
1≤i≤k s2
1 + · · · + sk
g = max
wobei s21 , . . . , s2k die geschätzten Varianzen der k Stichproben sind. Die Wahrscheinlichkeitsverteilung von g entspricht keiner der uns bekannten Verteilungen, sie lässt sich aber im Prinzip
bestimmen. Die kritischen Werte gk,n,1−α für entsprechende Freiheitsgrade k und n = N − 1
zu gegebenem Signifikanzniveau α berechnen wir mit
gk,n,1−α =
Fn,n(k−1),1− αk
Fn,n(k−1),1− αk + (k − 1)
,
wobei Fm,n,q das q-Quantil der F -Verteilung mit Freiheitsgrad (m, n) darstellt (vgl. Tafeln T.6
bis T.14) oder entnehmen sie der Tafel T.15. Danach ziehen wir wieder den statistischen
Schluss:
• Ist die Testgrösse g < gk,n,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die
Unterschiede zwischen den k Varianzen sind zufälliger Natur.
• Ist die Testgrösse gk,n,1−α ≤ g, dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt.
6.3. Vergleich von mehreren Varianzen, Cochran-Test
59
Abbildung 6.3.i: William Gemmell Cochran, 1909-1980
Aufgaben
Aufgabe 6.3.1. Der Produktion einer Waagerechtschmiedemaschine wurden im Verlaufe von
sieben Schichten sieben Proben von je 17 Schmiedstücken entnommen. Es wurde an jedem
Teil ein bestimmtes Mass gemessen. Die empirischen Varianzen der einzelnen Proben ergaben
sich zu [in mm2 ]:
s21
0.067
s22
0.136
s23
0.168
s24
0.068
s25
0.066
s26
0.102
s27
0.137
Prüfen Sie die Hypothese, dass die wahren Varianzen alle gleich sind. Die Irrtumswahrscheinlichkeit ist α = 0.01.
Aufgabe 6.3.2. Beurteilen Sie, ob die sechs Stichproben verschiedene Varianzen haben. Das
Signifikanzniveau sei α = 1%.
x1
1
2
3
6
5
4
3
4
5
6
5
4
3
4
x2
4
5
4
5
4
5
4
3
4
5
4
3
4
3
x3
2
3
4
3
4
3
4
6
5
8
4
5
3
4
x4
3
4
3
4
4
3
4
3
6
5
8
6
7
2
x5
1
9
2
8
5
8
2
7
4
8
1
5
3
7
x6
5
5
5
6
5
5
5
6
5
5
5
5
5
5
60
Kapitel 6. Prüfen von Varianzen (Parametertests)
Kapitel 7
Verteilungsfreie (parameterfreie)
Tests
Fast alle bisher betrachten statistischen Tests (Ein- und Zweistichproben-t-Test, χ2 -Varianztest, F -Test, Cochran-Test) beschäftigen sich mit der Prüfung von Parameterhypothesen,
wobei die Gestalt der Verteilungsfunktion in der Grundgesamtheit bis auf einzelne Parameter
als bekannt vorausgesetzt wird. Die Hypothesen beziehen sich auf diese unbekannten Parameter.
Ein Vorteil der parameterfreien Verfahren liegt vor allem darin, dass für ihre Durchführung
keine oder nur geringe Voraussetzungen über die Verteilungsfunktion oder ihren Typ in der
Grundgesamtheit erfüllt sein müssen und sie daher zum Beispiel von der Annahme, dass die
Grundgesamtheit normalverteilt ist, unabhängig sind. Allerdings wird dieser Vorteil häufig
durch eine geringere Trennschärfe des nichtparametrischen Tests gegenüber dem entsprechenden Parametertest erkauft, wenn in Wirklichkeit Normalverteilung vorliegt. In der Regel ist
ein vorhandener Unterschied bei Verwendung eines nichtparametrischen Tests etwas weniger
oft signifikant als bei Benutzung des entsprechenden Parametertests. Wird jedoch bereits mit
einem parameterfreien Test ein Unterschied als signifikant erkannt, d.h. die Nullhypothese
abgelehnt, wenn sie falsch ist, so wird mit dem entsprechenden Parametertest kein anderes
Ergebnis erreicht. Liegt dagegen keine Normalverteilung vor, so können parameterfreie Tests
sogar erheblich wirksamer sein als Parametertests.
Grundsätzlich führen diese Überlegungen zu folgenden Schlussfolgerungen: Sind die für einen
Parametertest erforderlichen Voraussetzungen, wie zum Beispiel Normalverteilung der Grundgesamtheit oder Gleichheit ihrer Varianzen, erfüllt, so sollte der Parametertest als der wirksamere angewandt werden. In allen anderen Fällen ist ein entsprechendes nichtparametrisches
Verfahren vorzuziehen.
7.1
Vorzeichentest nach Dixon und Mood
Im folgenden Abschnitt wollen wir uns einem speziellen parameterfreien oder verteilungsfreien Test ausführlich widmen, dem Vorzeichentest oder Zeichentest.
Beispiel 7.1.1. Wenn bei 10 Mitarbeitern einer Firma während einer Kündigungswelle bei allen plötzlich eine Erhöhung des Blutdruckes festgestellt wird, so sagen wir rein gefühlsmässig:
Dies kann kein Zufall sein. Zur Begründung dieses sich spontan einstellenden Eindrucks
61
62
Kapitel 7. Verteilungsfreie (parameterfreie) Tests
können wir folgendes anführen. Wären die beobachteten Änderungen des Blutdruckes rein
zufällige Schwankungen, so müsste etwa die Hälfte der Differenzen positiv und die Hälfte
negativ sein. Die Wahrscheinlichkeit wäre bei jedem einzelnen Mitarbeiter 0.5. Die Wahrscheinlichkeit, dass alle 10 Differenzen positiv ausfallen, wäre also P = ( 12 )10 ≈ 0.001. Mit so
unwahrscheinlichen Ereignissen braucht aber nicht gerechnet zu werden, also ist anzunehmen,
dass der gefunden Effekt (Existenzangst erhöht den Blutdruck) real ist.
Der Vorzeichentest oder Zeichentest nach W. J. Dixon und A. M. Mood (1946), der auf
den Vorzeichen der Differenzen von je zwei Messwerten beruht, ist eines der rechnerisch einfachsten nichtparametrischen Prüfverfahren. Er wird vor allem beim Vergleich zweier Produktionsverfahren oder Behandlungsmethoden, wo die Messwerte einander paarweise zugeordnet
sind, also verbundene Stichproben vorliegen, angewendet und ist dem entsprechenden Parametertest, in diesem Falle dem paarweisen Vergleichstest bei verbundenen Stichproben (vgl.
5.4), dann vorzuziehen, wenn dessen Voraussetzungen, Normalverteilung der Grundgesamtheit nicht erfüllt ist. Da die Rechenarbeit beim Vorzeichentest gering ist, wird er auch als
Schnelltest dazu verwendet, sich rasch einen Überblick über zwei Verfahren zu verschaffen.
Beim Vorzeichentest sind folgende Voraussetzungen zu beachten:
1. Es sind zufällig zwei verbundene Stichproben x1 , . . . , xN und y1 , . . . , yN aus zwei Grundgesamtheiten gegeben, d.h., xi lässt sich mit yi vergleichen.
2. Die Verteilungsfunktionen der Grundgesamtheiten sind stetig.
Wir wollen nun wissen, ob sich sich die verbundenen Messwerte xi und yi signifikant voneinander unterscheiden. Dazu berechnen wir aus den paarweise zusammengehörigen Messwerten
die Differenzen di = xi − yi für alle i ∈ {1, . . . , N }. Wegen der Voraussetzung der Stetigkeit
der Verteilungen verschwindet die Wahrscheinlichkeit für das Auftreten einer Differenz di = 0,
d.h., es gilt P (di = 0) = 0. Ist gleichwohl eine Differenz gleich null, so sprechen wir von einer
so genannten Bindung und das entsprechende Stichprobenpaar wird einfach weggelassen und
der Stichprobenumfang entsprechend auf N ∗ reduziert.
Die Hypothese, die wir prüfen wollen, besagt, dass für jedes i die beiden beobachteten xi
und yi unabhängige zufällige Grössen sind. Unter dieser Hypothese ist die Wahrscheinlichkeit
einer positiven Differenz di = xi − yi ebenso gross wie die für das Auftreten einer negativen,
nämlich
P (di > 0) = P (di < 0) = 12 .
Es sei p = P (di > 0) die Wahrscheinlichkeit einer positiven Differenz. Die oben formulierte
Hypothese lässt sich nun auf die alternativen Hypothesen (für die zweiseitige Fragestellung)
umschreiben
H0 : p = 12 , d.h., die Anzahl der negativen und positiven Differenzen ist gleich.
H1 : p 6= 12 , d.h., die Anzahl der negativen und positiven Differenzen ist verschieden.
Zur Prüfung der Hypothese H0 dient nun die Testgrösse
k+ = Anzahl positiver Differenzen.
Diese Testgrösse k+ ist die Realisierung einer Stichprobenfunktion, die unter der Nullhypothese der Binomialverteilung mit den Parametern n = N ∗ und p = 12 genügt, so dass gilt
i n
n i
n
1
1 n−i
n
1
n−i
+
P (k = i) =
p (1 − p)
=
1−
=
.
i
i
2
2
i
2
7.1. Vorzeichentest nach Dixon und Mood
63
Das q-Quantil des Vorzeichentests mit reduziertem Stichprobenumfang n wird mit kn,q bezeichnet und ist vertafelt (vgl. Tafel T.16). Es kann aus der Beziehung
kn,q
kn,q n
X
X
n
1
P (k+ ≤ kn,q ) =
P (k+ = i) =
≤q
i
2
i=0
i=0
bestimmt werden. Es gilt kn,1−q = n − kn,q .
Jetzt ziehen wir den statistischen Schluss bei einem gegebenen Signifikanzniveau α (hier
für die zweiseitige Fragestellung):
• Ist die Testgrösse kn, α2 < k+ < kn,1− α2 , dann wird die Nullhypothese H0 angenommen,
d.h., die xi -Werte unterscheiden sich nur zufällig von den yi -Werten.
• Ist die Testgrösse k+ ≤ kn, α2 oder kn,1− α2 ≤ k+ , dann wird die Nullhypothese H0 auf
dem Signifikanzniveau α abgelehnt. Die xi -Werte unterscheiden sich signifikant von den
yi -Werten.
Dieses Prüfverfahren heisst Vorzeichen- oder Zeichentest, da es lediglich mit den Vorzeichen
der Differenzen arbeitet. Für grobe Überlegungen reichen bereits Stichproben mit 10 bis 15
k+
Messdaten. Liegt aber der Wert von N
∗ nahe bei 0.5, dann muss der Stichprobenumfang sehr
gross gewählt werden, um eine signifikante Abweichung festzustellen.
Beispiel 7.1.2. Bei einer Untersuchung wurden 51 Kartoffeln halbiert und jeweils bei beiden
Hälften mit Hilfe zweier verschiedener Verfahren der Stärkegehalt gemessen. Vier Mal wurde
mit beiden Verfahren der gleiche Wert gemessen. In 29 Fällen ergab das erste Verfahren
gegenüber dem zweiten einen erhöhten Wert. Wir wollen nun mit dem Vorzeichentest testen,
ob diese Abweichungen rein zufällig sind.
Dazu wählen wir ein Signifikanzniveau von α = 0.05. Wir stellen vier Bindungen fest, also
beträgt der reduzierte Stichprobenumfang N ∗ = 51 − 4 = 47. Es handelt sich um einen
zweiseitigen Test. Aus Tafel T.16 lesen wir die beiden kritischen Werte k47,0.025 = 17 und
k47,1−0.025 = 47 − 17 = 30 ab. Nun ziehen wir den statistischen Schluss: da
k47,0.025 = 17 < 29 < k47,1−0.025 = 30
können wir die Nullhypothese nicht ablehnen. Die beiden Verfahren unterscheiden sich also
nur zufällig.
Aufgaben
Aufgabe 7.1.1. Vergleichen Sie die drei folgenden Messreihen paarweise mit dem Vorzeichentest. Das Signifikanzniveau ist 1%.
i
1
2
3
4
5
6
7
8
9
10
xi
18.0
14.5
13.5
12.5
23.0
24.0
21.0
17.0
18.5
9.5
yi
27.0
34.0
20.5
29.5
20.0
28.0
20.0
26.5
22.0
24.5
zi
21.5
20.5
19.0
24.5
16.0
13.0
20.0
16.5
17.5
19.0
64
Kapitel 7. Verteilungsfreie (parameterfreie) Tests
Aufgabe 7.1.2. Vergleichen Sie die folgenden Messreihen mit dem Vorzeichentest. Das Signifikanzniveau ist 1%.
i
xi
yi
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
15 23 26 27 19 26 24 25 26 27 28 26 20 24 25 26 24 23 26 27
24 25 28 29 20 24 25 26 27 25 26 27 24 19 28 28 25 24 27 29
Aufgabe 7.1.3. Bei 200 Personen wurden die Reaktionszeiten auf zwei verschiedene Reizsignale gemessen. Dabei waren bei 120 Personen die Reaktionszeiten auf das erste Signal grösser.
Testen Sie mit einem Signifikanzniveau α = 0.05 die Hypothese, dass die Reaktionszeit auf
das erste Signal deutlich grösser ist.
7.2
Test auf Zufälligkeit – Runtest
Wollen wir aus einer Stichprobe mit unseren bisher betrachteten Tests Rückschlüsse auf die
Grundgesamtheit ziehen, so muss die Stichprobe zufällig sein, d.h., das Zahlenmaterial muss
frei von einem Trend sein. Ein Trend kann zum Beispiel dann auftreten, wenn sich im Laufe der
Erhebung die Voraussetzungen ändern. Andererseits könnten wir gerade am Vorhandensein
eines solchen Trends interessiert sein (vgl. Beispiel 7.2.1). Zur Prüfung muss ein statistischer
Test auf Zufälligkeit mit den Messdaten der Urliste vorgenommen werden.
Beispiel 7.2.1 (Juni-Temperaturmonatsmittel in Basel). Wir betrachten die Monatsmittel
der Temperatur im Juni seit 1864 gemessen in Basel (vgl. Abbildung 7.2.i). Das Monatsmit-
Abbildung 7.2.i: Das Monatsmittel der Temperatur im Juni von 1864 bis 2003 gemessen in
Basel. Quelle: Meteo Schweiz
tel der Temperatur im Juni 2003 liegt weit über den bisherigen Erfahrungswerten seit dem
offiziellen Messbeginn im Jahr 1864. In den Niederungen der Nordschweiz liegt es zwischen
6.5 und 7.5 Grad über dem normalen Wert. Die Juni-Wärme 2003 wird deshalb als die bisher
extremste in die Annalen eingehen.
Es stellt sich aber auch die Frage der so genannten Klimaerwärmung, bei welcher nicht Maximalwerte sondern der globale Trend interessiert. Ist also die Stichprobe der Junitemperaturen in Basel eine zufällige Grösse oder können wir einen Trend ausmachen? Für eine erste
Einschätzung der Situation können wir einen so genannten Runtest verwenden. Um genauere
Analysen zu machen, sollten wir eine Zeitreihenanalyse durchführen (vgl. Kapitel 13).
Beim parameterfreien Runtest unterscheiden wir nur wie oft die gegebene Messreihe zwischen zwei Extremen hin- und herschwankt. Handelt es sich bei der Messreihe um Zahlen-
7.2. Test auf Zufälligkeit – Runtest
65
werte x1 , . . . , xN aus einer stetigen Grundgesamtheit, dann definieren wir als Mass für die
Zufälligkeit so genannte Iterationen oder Runs.
Ein zentrales Konzept zur Durchführung des Runtests ist der Median einer Stichprobe. Dazu
ordnen wir die Stichprobenwerte der aufsteigenden Grösse nach
x(1) ≤ · · · ≤ x(i) ≤ · · · ≤ x(N ) .
Dann ist der Median oder Zentralwert der Stichprobe durch

x N+1
wenn N ungerade
(
)
x
e= 12
 x N +x N
wenn N gerade
2
( +1)
( )
2
2
gegeben. Es handelt sich dabei um den “mittelsten“ Zahlenwert der geordneten Stichprobe.
Beispiel 7.2.2. Es sei die folgende Stichprobe gegeben.
5.3
3.8
4.0
5.5
5.0
4.9
2.2
4.1
3.1
5.5
Wir bilden den Median indem wir die Stichprobe der Grösse nach ordnen
2.2
3.1
3.8
4.0
4.1
4.9
5.0
5.3
5.5
und x(5) = 4.1 und x(6) = 4.9 ablesen. Dann ist der Median x
e=
1
2
5.5
(4.1 + 4.9) = 4.5.
Nun sind wir in der Lage, Iterationen oder Runs zu definieren. Dazu zeichnen wir die
Stichprobenwerte x1 , . . . , xN der Reihe nach auf und ziehen eine horizontale Gerade M auf
der Höhe des Medians, die so genannte Medianlinie. Diese teilt die Stichprobenwerte in
zwei Hälften1 . Unter jedem Wert schreiben wir ein Plus- bzw. Minuszeichen je nachdem, ob
er oberhalb oder unterhalb der Medianlinie liegt (vgl. Abbildung 7.2.ii).
xi
6
4
b
b
b
b
5
b
b
M
b
b
b
3
b
2
+
−
−
+
+
+
−
−
−
+
1
2
3
4
5
6
7
8
9
10
1
i
Abbildung 7.2.ii: Eine Stichprobe (vgl. Beispiel 7.2.2) mit r = 5 Iterationen und m = 5
Pluszeichen.
Definition 7.2.1. Eine Iteration oder Run ist eine Folge von gleichen Vorzeichen. Die
Anzahl Iterationen bezeichnen wir mit r und die Anzahl Pluszeichen mit m.
1
Falls zu viele Stichprobenwerte auf der Medianlinie liegen, ist der in diesem Kapitel beschriebenen Runtest
nicht geeignet. Der “erweiterte Runtest“ in [13] hilft weiter.
66
Kapitel 7. Verteilungsfreie (parameterfreie) Tests
Die Anzahl Iterationen verglichen mit dem Stichprobenumfang ist ein Kriterium für die
Zufälligkeit der Messwertanordnung einer Stichprobe. Wir können drei Fälle unterscheiden:
1. Trend: Verglichen mit dem Stichprobenumfang weist die Strichprobe nur wenige Iterationen auf (vgl. Abbildung 7.2.iii).
2. Schwingung: Verglichen mit dem Stichprobenumfang weist die Strichprobe sehr viele
Iterationen auf. Der schwingungsförmige Verlauf der Messwerte lässt auf systematische
Schwankungen schliessen (vgl. Abbildung 7.2.iv).
3. Zufallsanordnung: Verglichen mit dem Stichprobenumfang weist die Strichprobe eine
mittlere Anzahl Iterationen auf (vgl. Abbildung 7.2.v).
xi
xi
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
M
b
b
b
M
b
b
b
i
i
Abbildung 7.2.iv: m = 8 Pluszeichen
und r = 16 Iterationen impliziert eine
Schwingung.
Abbildung 7.2.iii: m = 8 Pluszeichen
und r = 2 Iterationen impliziert einen
Trend.
xi
b
b
b
b
b
b
b
b
M
b
b
b
b
b
b
b
b
i
Abbildung 7.2.v: m = 8 Pluszeichen
und r = 9 Iterationen impliziert eine
Zufallsanordnung.
Zur quantitativen Beurteilung, ob die Stichprobenwerte zufällig angeordnet sind, wird nun
der so genannte Runtest von W. A. Wallis und P. G. Moore durchgeführt. Dazu formulieren
wir folgende alternativen Hypothesen:
H0 : Die Messwerte sind zufällig verteilt.
H1 : Die Messwerte sind nicht zufällig verteilt.
Im Falle einer stetigen Verteilung hat die Testgrösse
r = Anzahl der Iterationen
(7.2.a)
7.2. Test auf Zufälligkeit – Runtest
67
bei Zutreffen der Nullhypothese H0 die folgende Verteilungsfunktion

m−1 m−1 2 (r−1)/2

(r−3)/2


wenn r ungerade

2m


m
f (r) =
m−1 2


2

(r−2)/2


wenn r gerade.

2m
m
Das q-Quantil des Runtests mit m Pluszeichen wird mit rm,q bezeichnet und ist vertafelt
(vgl. Tafel T.17). Es kann aus der Beziehung
rm,q
P (r ≤ rm,q ) =
X
r=2
f (r) ≤ q
bestimmt werden. Jetzt ziehen wir den statistischen Schluss bei einem gegebenen Signifikanzniveau α:
• Ist die Testgrösse rm, α2 < r < rm,1− α2 , dann wird die Nullhypothese H0 angenommen,
d.h., die Messwerte sind zufällig verteilt.
• Ist die Testgrösse r ≤ rm, α2 (resp. rm,1− α2 ≤ r), dann wird die Nullhypothese H0 auf
dem Signifikanzniveau α abgelehnt. In diesem Fall haben wir einen signifikanten Trend
(resp. eine signifikante Schwingung).
Aufgabe
Aufgabe 7.2.1. Bei einer Messreihe wurden die folgenden Werte ermittelt:
2
4
3
5
2
4
2
6
1
3
2
4
4
4
6
6
5
4
2
3
2
2
Testen Sie mit einem Runtest, ob es sich dabei um eine zufällige Stichprobe handelt. Das
Signifikanzniveau ist 10%.
68
Kapitel 7. Verteilungsfreie (parameterfreie) Tests
Kapitel 8
Prüfen der Verteilung der
Grundgesamtheit
Bei einem Test auf Prüfung einer speziellen Verteilung der Grundgesamtheit wollen wir herausfinden, ob die Messdaten der Urliste unseren Vorstellungen über die Verteilung der Grundgesamtheit entsprechen. Bei den meisten bisher betrachteten statistischen Tests wurde vorausgesetzt, dass das gemessene Merkmal in der Grundgesamtheit normalverteilt ist. Diese Voraussetzung erscheint gerechtfertigt, solange wir es mit der Untersuchung von Beobachtungs- und
Messfehlern zu tun haben, die aus einer Anzahl sich additiv überlagernder Ursachen entstehen, wobei jede dieser Ursachen nur einen geringen Einfluss im Vergleich zur Gesamtwirkung
auf das Messergebnis hat (vgl. die Ausführungen in Kapitel 2.2).
In der Praxis gibt es jedoch zahlreiche Beispiele, auf die diese Bedingungen nicht zutreffen,
so dass Verfahren gefordert werden, die darüber entscheiden, ob es sich bei einer vorliegenden
Messreihe um eine Stichprobe aus einer normalverteilten Grundgesamtheit handelt oder nicht.
Im Folgenden werden wir vier der gebräuchlichsten Verfahren zur Prüfung auf Normalverteilung vorstellen. In Kapitel 8.1 lernen wir ein rein qualitatives Verfahren kennen. Die Kapitel 8.2, 8.3 und 8.4 behandeln quantitative Verfahren, die die Abweichung von der Normalverteilung auf Signifikanz untersuchen.
8.1
Wahrscheinlichkeitspapier für die Normalverteilung
Das erste Verfahren ist ein rein grafisches mit Hilfe eines speziellen Wahrscheinlichkeitspapieres (vgl. Abbildung 8.1.iv), das von A. Hazen (1914) entwickelt wurde. Es ist ein rein
qualitatives Verfahren. In einem kartesischen Koordinatensystem mit jeweils gleichmässiger
Skalierung auf der x- und y-Achse stellt die Verteilungsfunktion
Z x
(x−µ)2
1
2
e− 2σ2 dx.
Φ(x, µ, σ ) = √
2πσ 2 −∞
einer normalverteilten Zufallsvariable eine S-förmige Kurve dar (vgl. Abbildung 8.1.i. Zum
besseren und einfacheren Zeichnen dieser Kurve wählen wir im so genannten Wahrscheinlichkeitspapier die Ordinateneinteilung so, dass die Kurve der standardisierten Normalverteilungsfunktion y = Φ(x, 0, 1) dort als Gerade erscheint. Dazu transformieren wir die y-Achse
in der Form z = Φ−1 (y, 0, 1). Die Einteilung auf der Ordinatenachse des Wahrscheinlichkeitspapier ist dann nicht mehr äquidistant. Dort werden auch nicht die Funktionswerte selbst,
69
70
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
sondern ihre Werte in Prozenten eingetragen. Die Ordinatenabstände nehmen von der 50%Linie jeweils nach oben und unten hin zu. Die 0%- und die 100%-Linien können nicht mehr
dargestellt werden, da sie wegen Φ(−∞, 0, 1) = 0 und Φ(+∞, 0, 1) = 1 die Ordinatenwerte
−∞ und +∞ besitzen würden.
y
y = Φ(x, 0, 1)
100%
90%
70%
50%
30%
10%
0%
x
1
−1
z
98%
90%
84.13%
70%
50%−4
−3
−2
−1
0
1
2
3
4
x
30%
15.87%
10%
2%
Abbildung 8.1.i: Konstruktion des Wahrscheinlichkeitspapiers.
Dann ergibt sich im xz-Koordinatensystem für den Grafen der Verteilungsfunktion y =
Φ(x, µ, σ 2 ) der Normalverteilung mit den Parametern µ und σ 2 die Gerade
x−µ
,
z = Φ−1 (y, 0, 1) = Φ−1 Φ(x, µ, σ 2 ), 0, 1 =
σ
mit der Steigung σ1 . Diese Gerade schneidet die 50%-Linie an der Stelle x = µ. Für x = µ + σ
gilt
Φ x−µ
σ , 0, 1 = Φ(1, 0, 1) = 0.8413.
8.1. Wahrscheinlichkeitspapier für die Normalverteilung
71
Das heisst, über dem Abszissenwert x = µ + σ schneidet die Gerade die 84.13%-Linie und
wegen der Symmetrie über x = µ − σ die 15.87%-Linie. Daher können wir aus der Gerade im
Wahrscheinlichkeitspapier die Parameter µ und σ heraus lesen.
Ist nun eine Stichprobe aus einer Grundgesamtheit gegeben, von der wir wissen wollen, ob
sie normalverteilt ist, so zeichnen wir zur Prüfung auf Normalverteilung die empirische
Verteilungsfunktion der Stichprobe als Punkte ins Wahrscheinlichkeitspapier. Lässt sich nun
durch die Funktionswerte der empirischen Verteilungsfunktion eine Gerade legen, die sich
dieser Punkte gut anpasst, so entscheiden wir uns für eine Normalverteilung. Die Beurteilung
der Geradlinigkeit sollte etwa zwischen den Ordinaten 10% und 90% erfolgen, da für kleinere
resp. grössere Ordinaten das Wahrscheinlichkeitspapier stark verzerrt ist, so dass geringe
Abweichungen stark bemerkbar sind.
Falls wir uns für eine Normalverteilung entschieden haben, lassen sich aus dieser angepassten Gerade Näherungswerte für µ und σ gewinnen. Beachten Sie, dass dieses Verfahren nur
ein grobes Näherungsverfahren ist, da wir im Allgemeinen näherungsweise mehrere Geraden
durch die Punkte legen können. Ferner müssen wir nach Augenmass entscheiden, ob die Approximation tatsächlich gut ist. Für präzise Aussagen sollte auf jeden Fall ein weiterer Test
angewandt werden.
Beispiel 8.1.1. Wir betrachten die in k = 9 Klassen eingeteilte Stichprobe vom Umfang
N = 50
Anzahl pro Klasse
Klassenmitten
1
2
hi
xi
1
4
7
6
9
8
14
10
9
12
6
14
2
16
1
18
Eine erste einfache Einschätzung der Situation ergibt sich, wenn wir ein Histogramm der
Daten anfertigen (vgl. Abbildung 8.1.ii). Wir stellen bereits am Histogramm eine zur Norhi
si
50
50
40
40
30
30
20
20
82%
41
7
1
1
2
4
9
9
36%
18
10
6
2
1
16
18
0
0
6
8
10
12
14
98% 100%
50
49
64%
32
14
10
94%
47
2%
1
4%
2
2
4
18%
9
0
xi
0
Abbildung 8.1.ii: Ein Histogramm der
Stichprobe
6
8
10
12
14
16
18
xi
Abbildung 8.1.iii: Absolute und relative Summenhäufigkeit
malverteilung ähnliche Form fest. Die Prüfung auf Normalverteilung mit Hilfe eines Wahrscheinlichkeitspapieres benötigt die absolute Summenhäufigkeit der in Klassen eingeteilten Stichprobe und relative Summenhäufigkeit in Prozent (vgl. Abbildung 8.1.iii)
si =
i
X
j=1
Wir erhalten
hj
und
ri =
si
· 100%.
N
72
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
relative Summenhäufigkeit
absolute Summenhäufigkeit
Klassenmitten
ri
si
xi
2%
1
2
4%
2
4
18%
9
6
36%
18
8
64%
32
10
82%
41
12
96%
47
14
98%
49
16
100%
50
18
Unter Zugrundelegung obiger Häufigkeitstabelle werden nun die relativen Summenhäufigkeiten als Ordinaten zu den entsprechenden oberen Klassengrenzen 3, 5, 7, . . . in das Wahrscheinlichkeitspapier 8.1.iv eingetragen. Durch diese Punkte können wir nun näherungsweise
eine Gerade legen. Weil alle Punkte zwischen den Ordinaten 10% und 90% sehr nahe der
Geraden liegen, können wir davon ausgehen, dass es sich bei der Stichprobe um eine aus einer
normalverteilten Grundgesamtheit handelt.
Diese grafische Methode zur Beurteilung der Geradlinigkeit und damit der Normalität der
Grundgesamtheit ist natürlich sehr subjektiv und lässt nur eine grobe Entscheidung zu. Sie
hängt nur vom Stichprobenumfang ab und wird umso ungenauer, je weniger Klassen gebildet
werden.
99
95
90
80
70
60
50
40
30
20
10
5
1
Abbildung 8.1.iv: Wahrscheinlichkeitspapier
Daneben bietet sich nun die Möglichkeit, den Mittelwert µ und die Standardabweichung σ aus
der Zeichnung zu schätzen. Zu diesem Zweck bringen wir die durch die Punkte gezeichnete
Gerade mit der Horizontalen durch den Ordinatenpunkt 50% zum Schnitt. Die Abszisse des
Schnittpunktes ist ein Näherungswert µabgelesen für den Mittelwert µ. Entsprechend ergibt
sich aus den Schnittpunkten der eingezeichneten Gerade mit den Horizontalen durch die
Ordinatenpunkte 15.87% und 84.13% (gestrichelte Linien im Wahrscheinlichkeitspapier 8.1.iv)
ein Näherungswert σabgelesen für die Standardabweichung σ. Wir erhalten
µabgelesen ≈ 10.0
und
σabgelesen ≈ 3.2.
8.1. Wahrscheinlichkeitspapier für die Normalverteilung
73
Wir wollen diese geschätzten Werte mit den berechneten vergleichen. Der Mittelwert und
die Varianz einer Stichprobe, die in k Klassen eingeteilt ist, berechnen sich mit den Formeln
k
1 X
x̄ =
hi xi
N
k
1 X
s =
hi (xi − x̄)2 ,
N −1
2
und
i=1
i=1
wobei hi die Anzahl
Messwerte in der i-ten Klasse mit Klassenmitte xi bezeichnet. Es gilt
P
natürlich N = ki=1 hi .
Wir erhalten x̄ = 10.04 und s = 3.24. Dies zeigt, dass die Genauigkeit der aus dem Wahrscheinlichkeitspapier abgelesenen Werte für praktische Zwecke ausreichend sein kann. Allerdings sei hier darauf hingewiesen, dass dieses grafische Schätzverfahren nur dann gut funktioniert, wenn sich eine Gerade einigermassen gut an die Punkte anpassen lässt.
Aufgaben
Aufgabe 8.1.1. Prüfen Sie mit Hilfe eines Wahrscheinlichkeitspapiers, ob die folgende Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Bestimmen Sie ferner Näherungswerte für µ und σ.
xi
0
1
2
3
4
5
6
7
8
9
10
hi
2
4
14
22
18
40
36
24
20
14
6
N = 200
prozentuale Häufigkeit
1
2
7
11
9
20
18
12
10
7
3
prozentuale Summenhäufigkeit
1
3
10
21
30
50
68
80
90
97
100
Aufgabe 8.1.2. Bei der Bestimmung des Blutzuckergehalts [in mg %] an 25 Patienten ergaben sich folgende Messwerte:
79
107
88
92
110
77
122
100
84
113
94
102
116
104
95
88
109
99
108
86
98
84
82
105
101
Prüfen Sie mit Hilfe eines Wahrscheinlichkeitspapiers, ob die Grundgesamtheit normalverteilt
ist. Bestimmen Sie ferner Näherungswerte für µ und σ und vergleichen Sie diese mit den
berechneten Werten.
Aufgabe 8.1.3. Prüfen Sie mit Hilfe eines Wahrscheinlichkeitspapiers, ob die folgende Stichprobe aus einer normalverteilten Grundgesamtheit stammt. Bestimmen Sie ferner Näherungswerte für µ und σ und vergleichen Sie diese mit den berechneten Werten.
Absolute Häufigkeiten
Klassenmitten
hi
xi
1
26
4
29
13
32
23
35
22
38
29
41
29
44
16
47
11
50
2
53
74
8.2
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
Test auf Schiefe und Exzess – Momentenmethode
Ein weiterer Test zur Prüfung einer Verteilung auf Normalität ist der Test auf Schiefe und
Exzess oder die Momentenmethode. Bei diesem Test wird die Form des Histogramms
mit der Form einer Normalverteilung mit den aus der Stichprobe geschätzten Parameter
verglichen. Dabei interessiert uns, ob das Histogramm links- oder rechtsschief, und über- oder
unterhöht ist.
überhöht
γ2 > 0
linksschief
normal
rechtsschief
γ1 > 0
γ1 = 0
γ1 < 0
normal
γ2 = 0
unterhöht
γ2 < 0
Abbildung 8.2.i: Schiefe
Abbildung 8.2.ii: Exzess
Es sei eine Stichprobe x1 , . . . , xN vom Umfang N gegeben. Wir fragen uns, ob diese Stichprobe
aus einer normalverteilten Grundgesamtheit stammt. Dazu berechnen wir den geschätzten
Mittelwert
N
1 X
xi
x̄ =
N
i=1
und daraus für j ∈ N die geschätzten zentralen Momente1
mj =
N
1 X
(xi − x̄)j .
N
i=1
Das erste Moment m1 verschwindet nach Definition des Mittelwertes. Aus m2 , m3 und m4
berechnen wir nun die Schiefe2 und den Exzess3
m3
m4
g1 = p 3 und
g2 = 2 − 3.
m2
m2
Für grossen Stichprobenumfang N sind alle Momente mj sowie g1 und g2 asymptotisch normalverteilt. Wir können g1 und g2 als Schätzung für die Schiefe γ1 und den Exzess γ2 der
wahren Verteilung verwenden. Für die Normalverteilung sind die Schiefe, welche die Symmetrie einer Verteilung misst, und der Exzess, welche die Über- resp. Unterhöhung der Verteilung
misst, beide gleich null.
Also formulieren wir die alternativen Hypothesen für den Test auf Schiefe
HSchiefe,0 : γ1 = 0, d.h., die Verteilung ist symmetrisch.
HSchiefe,1 : γ1 6= 0, d.h., die Verteilung ist schief.
1
Bei einer Klasseneinteilungen
in der i-ten Klasse mit Klassenmitte
Pk in k Klassen mit hi1 Messwerten
PN
Pk xi sind
j
die gewogenen Formeln x̄ = N1
i=1 hi xi und mj = N
i=1 hi (xi − x̄) zu benutzen. Es gilt N =
i=1 hi .
2
engl. Skewness
m4
3
Die Grösse m
2 wird Kurtosis oder Wölbung genannt.
2
8.2. Test auf Schiefe und Exzess – Momentenmethode
75
und für den Test auf Exzess
HExzess,0 : γ2 = 0, d.h., die Verteilung ist nicht über- oder unterhöht.
HExzess,1 : γ2 6= 0, d.h., die Verteilung ist über- oder unterhöht.
Zur Durchführung des Tests auf Schiefe und Exzess berechnen wir die beiden Testgrössen:
p
N (N − 1 g1
6N (N − 1)
G1 =
mit s2g1 =
N − 2 sg1
(N − 2)(N + 1)(N + 3)
(N − 1)(N + 1) g2
24N (N − 1)2
G2 =
mit s2g2 =
(N − 2)(N − 3) sg2
(N − 3)(N − 2)(N + 3)(N + 5)
Die Testgrössen G1 und G2 sind asymptotisch N (0, 1)-verteilt. Das q-Quantil zq der Standardnormalverteilung lesen wir in Tafel T.2 ab.
Der statistische Schluss bei einem gegebenen Signifikanzniveau α für den Test auf Schiefe
lautet:
• Ist die Testgrösse −z α2 < G1 < z α2 , dann wird die Nullhypothese H0 angenommen, d.h.,
die Verteilung ist symmetrisch.
• Ist die Testgrösse G1 ≤ −z α2 (resp. z α2 ≤ G1 ), dann wird die Nullhypothese HSchiefe,0 auf
dem Signifikanzniveau α abgelehnt. Die Verteilung ist linksschief (resp. rechtsschief).
Der statistische Schluss bei einem gegebenen Signifikanzniveau α für den Test auf Exzess
lautet:
• Ist die Testgrösse −z α2 < G2 < z α2 , dann wird die Nullhypothese H0 angenommen, d.h.,
die Verteilung ist weder über- noch unterhöht.
• Ist die Testgrösse G2 ≤ −z α2 (resp. z α2 ≤ G2 ), dann wird die Nullhypothese HExzess,0
auf dem Signifikanzniveau α abgelehnt. Die Verteilung ist unterhöht (resp. überhöht).
Erst wenn wir beide Nullhypothesen HSchiefe,0 und HExzess,0 annehmen, können wir davon
ausgehen, dass es sich bei der gegebenen Stichprobe aus Messwerten aus einer normalverteilten
Grundgesamtheit handelt.
Beispiel 8.2.1. Wir untersuchen die in k = 12 Klassen eingeteilte Stichprobe, ob sie einer
normalverteilten Grundgesamtheit entstammt.
Absolute Häufigkeiten
Klassenmitten
hi
xi
1
-5
1
-4
4
-3
9
-2
14
-1
20
0
17
1
15
2
10
3
5
4
3
5
1
6
Dazu verwenden wir den Test auf Schief und Exzess. Zuerst berechnen wir den geschätzten
Mittelwert und die geschätzten zentralen Momente
x̄ = 0.650,
m2 = 4.428,
m3 = 0.442,
m4 = 56.259.
Daraus berechnen wir die geschätzte Schiefe g1 = 0.047 und den Exzess g2 = −0.130 der
Stichprobe. Indem wir Schiefe und Exzess normieren, erhalten wir die beiden Testgrössen
G1 = 0.199
und
G2 = −0.286.
Wir bestimmen aus Tafel T.2 oder mit Hilfe eines Computerprogrammes die kritischen Werte
(zweiseitig) z1−0.025 = 1.960 und z0.025 = −1.960 zum Signifikanzniveau α = 0.05. Nun führen
wir den statistischen Schluss für den Test auf Schiefe und danach für den Test auf
Exzess durch:
76
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
a. Es gilt z0.025 = −1.960 < G1 = 0.199 < z1−0.025 = 1.960, also wird die Nullhypothese
HSchiefe,0 angenommen, d.h., die Verteilung ist symmetrisch.
b. Es gilt z0.025 = −1.960 < G2 = −0.286 < z1−0.025 = 1.960, also wird die Nullhypothese
HExzess,0 angenommen, d.h., die Verteilung ist weder über- noch unterhöht.
Damit haben wir beide Nullhypothesen angenommen, und wir können davon ausgehen, dass
die Stichprobe aus einer normalverteilten Grundgesamtheit stammt.
Aufgaben
Aufgabe 8.2.1. Prüfen Sie mit dem Test auf Schiefe und Exzess die folgende Stichprobe auf
Normalverteilung und erzeugen Sie ein Histogramm. Das Signifikanzniveau sei α = 5%.
Absolute Häufigkeiten
Klassenmitten
1
-1
hi
xi
8
0
1
1
Aufgabe 8.2.2. Prüfen Sie mit dem Test auf Schiefe und Exzess die folgende Stichprobe auf
Normalverteilung und erzeugen Sie ein Histogramm. Das Signifikanzniveau sei α = 10%.
Absolute Häufigkeiten
Klassenmitten
Absolute Häufigkeiten
Klassenmitten
hi
xi
hi
xi
6
0.0
31
2.2
8
0.2
27
2.4
9
0.4
23
2.6
11
0.6
19
2.8
13
0.8
16
3.0
16
1.0
13
3.2
19
1.2
11
3.4
23
1.4
9
3.6
27
1.6
8
3.8
31
1.8
6
4.0
32
2.0
Aufgabe 8.2.3. Prüfen Sie mit dem Test auf Schiefe und Exzess die folgende Stichprobe auf
Normalverteilung und erzeugen Sie ein Histogramm. Das Signifikanzniveau sei α = 5%.
Absolute Häufigkeiten
Klassenmitten
hi
xi
1
78
1
83
4
88
9
93
14
98
20
103
17
108
15
113
10
118
5
123
3
128
1
133
Aufgabe 8.2.4. Die Angaben eines Maschinenlieferanten zur Genauigkeit seiner Maschinen
sollen überprüft werden. Eine Stichprobe von Werkstücken aus einer normalen Produktion, die
vom Lieferanten zur Verfügung gestellt wurde, ergab die unten stehenden Abweichungen der
Masse vom Sollwert. Ist dieser Lieferant ehrlich? Erzeugen Sie ein Histogramm der Stichprobe.
Das Signifikanzniveau ist 5%.
Absolute Häufigkeiten
Klassenmitten
hi
xi
9
-5
9
-4
10
-3
12
-2
15
-1
18
0
20
1
16
2
14
3
13
4
12
5
11
6
Aufgabe 8.2.5. Verändern Sie Anzahlen hi der Stichprobe aus Aufgabe 8.2.4 möglichst
geringfügig so, dass sowohl signifikante Asymmetrie als auch signifikante Überhöhung beim
Test auf Schiefe und Exzess angezeigt werden. Das Signifikanzniveau sei konstant gleich 5%
zu belassen.
8.3
χ2 -Anpassungstest
Eine rechnerische Methode zur Beurteilung, ob eine vorgegebene Stichprobe mit Stichprobenumfang grösser als etwa 50 aus einer normalverteilten Grundgesamtheit stammt, ist der
χ2 -Anpassungstest, der von K. Pearson (vgl. Abbildung 1.1.i) entwickelt wurde. Dieses statistische Testverfahren vergleicht das Histogramm der Stichprobe, mit der angenommenen
theoretischen Normalverteilung der dazugehörigen Grundgesamtheit.
8.3. χ2 -Anpassungstest
77
Dazu stellen wir über die unbekannte Verteilungsfunktion F der Grundgesamtheit die alternativen Hypothesen auf:
H0 : F (x) = Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer normalverteilten
Grundgesamtheit mit den Parametern µ und σ 2 .
H1 : F (x) 6= Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer anderen Grundgesamtheit.
Da sich die Nullhypothese auf die gesamte Verteilungsfunktion F und nicht nur auf einzelne
ihrer Parameter bezieht, liegt eine nichtparametrische Hypothese vor. Der dazugehörige Test
wird als Anpassungstest4 bezeichnet.
Zur Konstruktion einer passenden Testgrösse für die Prüfung von H0 teilen wir die Stichprobe x1 , . . . , xN in k sich nicht überschneidende Klassen ein. Dann zählen wir aus, wie viele
Werte hi (absolute Klassenhäufigkeit) in die i-te Klasse fallen. Als Mass für die Abweichung
zwischen der empirischen Verteilung der Stichprobe und der durch die Nullhypothese festgelegten theoretischen Normalverteilung dienen die Differenzen zwischen den beobachteten
Häufigkeiten hi und den entsprechenden theoretischen Häufigkeiten derselben Klasse, mit h∗i
bezeichnet (vgl. Abbildung 8.3.i).
y = ϕ(x, µ, σ 2 )
hi
h∗i
xi,u
xi,o
x
µ
Abbildung 8.3.i: Beim χ2 -Anpassungstest werden die theoretischen Häufigkeiten h∗i mit den
absoluten Häufigkeiten hi in der i-ten Klasse verglichen.
Da im Allgemeinen weder der Erwartungswert µ noch die Varianz σ 2 der Normalverteilung
zahlenmässig festgelegt sind, müssen diese im Voraus aus der Stichprobe geschätzt werden5
N
1 X
µ ≈ x̄ =
xi
N
i=1
N
und
1 X
σ ≈s =
(xi − x̄)2 .
N −1
2
2
i=1
Danach berechnen wir die theoretischen Wahrscheinlichkeiten
pi = Φ(xi,o , µ, σ 2 ) − Φ(xi,u , µ, σ 2 ) ≈ Φ(xi,o , x̄, s2 ) − Φ(xi,u , x̄, s2 ),
4
Die unbekannte Verteilungsfunktion F der Grundgesamtheit wird durch eine theoretische Normalverteilung
angepasst.
5
Bei einer Klasseneinteilungen
hi Messwerten
in der i-ten Klasse mit Klassenmitte
Pk in k Klassen mit
PN
Pkxi sind
2
2
1
die gewogenen Formeln x̄ = N1
h
x
und
s
=
h
(x
−
x̄)
zu
benutzen.
Es
gilt
N
=
i
i
i
i
i=1
i=1
i=1 hi .
N−1
78
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
die den Flächenanteil unter der durch H0 festgelegten Gaussschen Glockenkurve zwischen der
oberen xi,o und der unteren xi,u Klassengrenze der i-ten Klasse angibt. Die Berechnung der
theoretischen Häufigkeiten erfolgt durch h∗i = N pi . Dann bilden wir die Testgrösse
X2 =
k
X
(hi − h∗ )2
i
i=1
h∗i
.
(8.3.a)
Diese Testgrösse ist approximativ χ2 -verteilt mit n = k − 1 − r Freiheitsgraden, wobei r gleich
der Anzahl unbekannter6 Parameter der Verteilung ist, also r = 2 für µ und σ 2 .
Damit die Testgrösse näherungsweise eine χ2 -Verteilung besitzt müssen die folgenden Voraussetzungen erfüllt sein:
• Der Stichprobenumfang N ist grösser als etwa 50.
• Für alle Klassen sollten die theoretischen Häufigkeiten h∗i ≥ 5 sein. Ist für einige Klassen
diese Forderung verletzt, müssen benachbarte Klassen zusammengefasst werden.
Das Testverfahren für die Nullhypothese, kann dann folgendermassen formuliert werden: Nach
Wahl eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.5 oder einem Computerprogramm den kritischen Wert χ2n,1−α aus der approximativen Beziehung
P X 2 ≥ χ2n,1−α ≈ α.
Jetzt ziehen wir den statistischen Schluss:
• Ist die Testgrösse X 2 < χ2n,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die
Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ
und σ 2 .
• Ist die Testgrösse χ2n,1−α ≤ X 2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit.
Der χ2 -Anpassungstest findet nicht nur im Zusammenhang mit der Prüfung der Grundgesamtheit auf Normalverteilung Verwendung, sondern er kann allgemeiner dazu bunutzt werden um
zu beurteilen, ob eine gegebene Stichprobe aus einer Grundgesamtheit stammt, von der wir
eine bestimmte, zu testende Idee über die Verteilung haben (vgl. zum Beispiel [2]).
Beispiel 8.3.1 (Prüfung auf Normalverteilung mit dem χ2 -Anpassungstest). Es soll geprüft
werden, ob die folgende Stichprobe vom Umfang N = 140 aus einer normalverteilten Grundgesamtheit stammt. Die Nullhypothese lautet also H0 : F (x) = Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ und σ 2 . Das
Signifikanzniveau ist α = 0.05.
Um diese Frage zu beantworten, berechnen wir zuerst den geschätzten Mittelwert x̄ = 94.991
und die geschätzte Standardabweichung s = 0.213. Wir beachten, dass die Klassenbreiten
konstant gleich 0.1 sind. Dann erstellen wir die folgende Tabelle:
6
Falls der eine oder andere Parameter µ und σ 2 der Normalverteilung der Grundgesamtheit bekannt sein
sollte, dann ist r entsprechend anzupassen.
8.3. χ2 -Anpassungstest
i
1
2
3
4
5
6
7
8
9
10
11
hi
4
5
10
15
23
27
23
19
9
3
2
xi
94.5
94.6
94.7
94.8
94.9
95.0
95.1
95.2
95.3
95.4
95.5
xi,u
94.45
94.55
94.65
94.75
94.85
94.95
95.05
95.15
95.25
95.35
95.45
79
xi,o
94.55
94.65
94.75
94.85
94.95
95.05
95.15
95.25
95.35
95.45
95.55
Φ(xi,u , x̄, s2 )
0.006
0.019
0.055
0.129
0.254
0.424
0.610
0.773
0.888
0.954
0.985
Φ(xi,o , x̄, s2 )
0.019
0.055
0.129
0.254
0.424
0.610
0.773
0.888
0.954
0.985
0.996
pi
0.014
0.036
0.074
0.125
0.170
0.186
0.163
0.116
0.066
0.030
0.011
h∗i
1.91
4.97
10.41
17.53
23.78
25.98
22.84
16.18
9.22
4.23
1.56
2
hi −h∗
i)
h∗
i
2.276
0.000
0.016
0.366
0.026
0.040
0.001
0.493
0.005
0.359
0.121
Wir stellen fest, dass einige Randklassen weniger als 5 Elemente aufweisen und somit die
Voraussetzung zur Durchführung des χ2 -Anpassungstest nicht erfüllt ist. Dies veranlasst uns,
je die beiden Randklassen zusammenzufassen. Dabei reichen die Klassenbreiten der neuen
Randklassen bis nach −∞ resp. +∞. Wir erhalten die nachfolgende, modifizierte Tabelle.
i
1
2
3
4
5
6
7
8
9
hi
9
10
15
23
27
23
19
9
5
xi
94.55
94.7
94.8
94.9
95.0
95.1
95.2
95.3
95.45
xi,u
−∞
94.65
94.75
94.85
94.95
95.05
95.15
95.25
95.35
xi,o
94.65
94.75
94.85
94.95
95.05
95.15
95.25
95.35
+∞
Φ(xi,u , x̄, s2 )
0
0.055
0.129
0.254
0.424
0.610
0.773
0.888
0.954
Φ(xi,o , x̄, s2 )
0.055
0.129
0.254
0.424
0.610
0.773
0.888
0.954
1
pi
0.055
0.074
0.125
0.170
0.186
0.163
0.116
0.066
0.046
h∗i
7.66
10.41
17.53
23.78
25.98
22.84
16.18
9.22
6.40
2
hi −h∗
i)
h∗
i
0.234
0.016
0.366
0.026
0.040
0.001
0.493
0.005
0.306
Nun sind wir in der Lage die Testgrösse X 2 = 1.487 zu berechnen. Den kritischen Wert
χ26,0.95 = 12.592 der χ2 -Verteilung mit n = 9 − 3 = 6 Freiheitsgraden bestimmen wir mit
Tafel T.5 oder einem Computerprogramm.
Da X 2 = 1.487 < χ26,0.95 = 12.592 gilt, kann die Nullhypothese angenommen werden. Die
Stichprobe stammt somit mit einer Irrtumswahrscheinlichkeit von 5% aus einer normalverteilten Grundgesamtheit mit den geschätzten Parametern µ ≈ x̄ = 94.991 und σ 2 ≈ s2 = 0.045.
Aufgaben
Aufgabe 8.3.1. Prüfen Sie mit dem χ2 -Anpassungstest die folgende Stichprobe vom Umfang
N = 366 auf Normalverteilung. Das Signifikanzniveau sei α = 10%.
hi
xi
8 9 10 11 13 16 19 23 27 31 32 31 27 23 19 16 13 11 10 9 8
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0
Aufgabe 8.3.2. Prüfen Sie mit dem χ2 -Anpassungstest die folgende Stichprobe vom Umfang
N = 150 auf Normalverteilung. Das Signifikanzniveau sei α = 5%.
hi
xi
1
26
4
29
13
32
23
35
22
38
29
41
29
44
16
47
11
50
2
53
80
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
8.4
Lilliefors-Test auf Normalverteilung
Eine weitere rechnerische Methode zur Beurteilung, ob eine vorgegebene Stichprobe aus einer
normalverteilten Grundgesamtheit stammt, ist der Kolmogoroff-Smirnov-Test, der von
A. N. Kolmogoroff (vgl. Abbildung 1.1.iv) und N. V. Smirnov (1933) entwickelt wurde. Bei
diesem Test müssen allerdings alle Parameter der Verteilungsfunktion der Grundgesamtheit
bekannt sein. Da dies bei praktischen Anwendungen meistens nicht der Fall ist, hat H. W. Lilliefors (1967) den Test verfeinert.
Der Lilliefors-Test auf Normalverteilung vergleicht die empirische Summenfunktion der
Stichprobe, mit der Verteilungsfunktion Φ(x, µ, σ 2 ) der angenommenen Normalverteilung der
dazugehörigen Grundgesamtheit. Dabei sind folgende Voraussetzungen zu beachten.
• Der Stichprobenumfang N ist kleiner als etwa 50.
• Die Verteilungsfunktion der Grundgesamtheit ist stetig, d.h., die gemessenen Merkmale
können alle Werte in einem bestimmten Intervall annehmen.
Dazu stellen wir über die unbekannte Verteilungsfunktion F der Grundgesamtheit die alternativen Hypothesen auf:
H0 : F (x) = Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer normalverteilten Grundgesamtheit mit den Parametern µ und σ 2 .
H1 : F (x) 6= Φ(x, µ, σ 2 ), d.h., die Stichprobe stammt aus einer anderen Grundgesamtheit.
Da sich die Nullhypothese auf die gesamte Verteilungsfunktion F und nicht nur auf einzelne
ihrer Parameter bezieht, liegt eine nichtparametrische Hypothese vor.
Zur Konstruktion einer passenden Testgrösse für die Prüfung von H0 ordnen wir die Stichprobe x1 , . . . , xN der aufsteigenden Grösse nach x(1) ≤ · · · ≤ x(i) ≤ · · · ≤ x(N ) und bilden die
empirische Summenfunktion, eine Treppenfunktion,
FN (x) =


0
i
N

1
für
für
für
x < x(1)
x(i) ≤ x < x(i+1) ,
x(N ) ≤ x
d.h., i zählt die Anzahl der Stichprobenwerte, die kleiner oder gleich x sind. (vgl. Abbildung 8.4.i).
Zur Prüfung der Nullhypothese berechnen wir die maximale Abweichung zwischen der empirischen Summenfunktion FN und der angenommenen Verteilungsfunktion Φ(x, µ, σ 2 ) der
Normalverteilung mit den aus der Stichprobe geschätzten Parametern
N
1 X
µ ≈ x̄ =
xi
N
i=1
N
und
1 X
σ ≈s =
(xi − x̄)2 .
N −1
2
2
i=1
Da die empirische Summenfunktion FN eine Treppenfunktion ist, müssen die maximalen Abweichungen jeweils an den Sprungstellen x(i) liegen (vgl. Abbildung 8.4.i). Deshalb berechnen
8.4. Lilliefors-Test auf Normalverteilung
81
y
b
b
b
b
FN (x(i) ) =
i
N
b
d′′i
Φ(x(i) , x̄, s2 )
FN (x(i−1) ) =
i−1
N
b
d′i
b
b
b
x(i−1) x(i) x(i+1)
x
Abbildung 8.4.i: Beim Lilliefors-Test auf Normalverteilung werden die maximalen Abweichungen jeweils an den Sprungstellen der empirischen Summenfunktion FN mit der angenommenen
Verteilungsfunktion Φ(x, x̄, s2 ) der Normalverteilung verglichen.
wir an jeder Sprungstelle die Grössen
i − 1
2 2 − Φ(x(i) , x̄, s ) ,
= FN (x(i−1) ) − Φ(x(i) , x̄, s ) = N
i
′′
2 2 di = FN (x(i) ) − Φ(x(i) , x̄, s ) = − Φ(x(i) , x̄, s ) .
N
d′i
Die Testgrösse des Lilliefors-Test auf Normalverteilung ist dann der grösste auf diese Weise
ermittelte Zahlenwerte
dN = max {d′i , d′′i }.
(8.4.a)
1≤i≤N
Die Wahrscheinlichkeitsverteilung von dN entspricht keiner der uns bekannten Verteilungen,
sie lässt sich aber im Prinzip bestimmen. Die kritischen Werte DN,1−α bei entsprechendem
Stichprobenumfang N zu gegebenem Signifikanzniveau α lassen sich aus Tafel T.18 ablesen.
Jetzt ziehen wir den statistischen Schluss:
• Ist die Testgrösse dN < DN,1−α , dann wird die Nullhypothese H0 angenommen, d.h.,
die Stichprobe stammt aus einer normalverteilten Grundgesamtheit.
• Ist die Testgrösse DN,1−α ≤ dN , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt. Die Stichprobe stammt demnach aus einer anderen Grundgesamtheit.
Der Vorteil des Lilliefors-Test auf Normalverteilung gegenüber dem χ2 -Anpassungstest besteht darin, dass er auch bei kleinem Stichprobenumfang, wo eine Klasseneinteilung der Messwerte und damit die Verwendung des χ2 -Anpassungstest nicht sinnvoll ist, angewandt werden
kann.
Beispiel 8.4.1. Untersuchen Sie die Residuen7 der Scherfestigkeiten von Spanplatten mit
dem Lilliefors-Test auf Normalverteilung. Das Signifikanzniveau ist 5%. Es ergeben sich die
folgenden N = 28 Werte.
7
Die Abweichungen zwischen den gemessenen Werten und den entsprechenden Werten auf der zu den
Messwerten gehörenden Regressionsgeraden werden als Residuen bezeichnet.
82
Kapitel 8. Prüfen der Verteilung der Grundgesamtheit
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
FN (xi−1 ) =
0.000
0.036
0.071
0.107
0.143
0.179
0.214
0.250
0.286
0.321
0.357
0.393
0.429
0.464
0.500
0.536
0.571
0.607
0.643
0.679
0.714
0.750
0.786
0.821
0.857
0.893
0.929
0.964
xi
-0.14
-0.12
-0.11
-0.11
-0.11
-0.10
-0.09
-0.06
-0.06
-0.06
-0.05
-0.04
-0.03
-0.02
-0.01
-0.01
-0.01
0.02
0.03
0.05
0.06
0.06
0.08
0.09
0.09
0.09
0.11
0.11
i−1
N
FN (xi ) =
0.036
0.071
0.107
0.143
0.179
0.214
0.250
0.286
0.321
0.357
0.393
0.429
0.464
0.500
0.536
0.571
0.607
0.643
0.679
0.714
0.750
0.786
0.821
0.857
0.893
0.929
0.964
1.000
Φ(xi , x̄, s2 )
0.052
0.085
0.106
0.106
0.106
0.132
0.161
0.271
0.271
0.271
0.315
0.361
0.410
0.460
0.511
0.511
0.511
0.659
0.704
0.786
0.821
0.821
0.880
0.903
0.903
0.903
0.940
0.940
i
N
d′i
0.052
0.049
0.035
0.001
0.036
0.047
0.053
0.021
0.014
0.050
0.042
0.031
0.018
0.004
0.011
0.025
0.061
0.052
0.061
0.107
0.106
0.071
0.094
0.082
0.046
0.010
0.011
0.024
d′′i
0.016
0.013
0.001
0.036
0.072
0.083
0.089
0.014
0.050
0.086
0.078
0.067
0.054
0.040
0.025
0.061
0.096
0.016
0.026
0.071
0.071
0.035
0.058
0.046
0.010
0.025
0.024
0.060
Wir bestimmen aus obiger Tabelle die Testgrösse
dN = max {d′i , d′′i } = max{0.107, 0.096} = 0.107.
1≤i≤N
Für den Stichprobenumfang von N = 28 und zum Signifikanzniveau α = 0.05 lesen wir den
kritischen Wert D28,1−0.05 ≈ 0.16 aus Tafel T.18 ab.
Da dN = 0.107 < D28,1−0.05 ≈ 0.16 gilt, kann die Nullhypothese angenommen werden. Die
Stichprobe stammt somit mit einer Irrtumswahrscheinlichkeit von 5% aus einer normalverteilten Grundgesamtheit mit den geschätzten Parametern µ ≈ x̄ = −0.01 und σ 2 ≈ s2 = 0.006.
Aufgabe
Aufgabe 8.4.1. An 50 auf einem Automaten hergestellten Vorderachszapfen wurde der
Durchmesser kontrolliert, wobei die in untenstehender Tabelle angegebenen (positiven) Abweichungen [in µm] vom Nennmass 20 mm erhalten wurden. Es ist zu prüfen, ob die vorliegende
Stichprobe aus der normalverteilten Grundgesamtheit mit dem geschätzten Erwartungswert
x̄ = 41.6 und der geschätzten Standardabweichung s = 2.22 stammt. Das Signifikanzniveau
ist 5%.
hi
xi
36
1
37
1
38
3
39
3
40
6
41
9
42
10
43
5
44
8
45
3
46
1
Kapitel 9
Das Ausreisserproblem
Unter den Messwerten x1 , . . . , xN einer Stichprobe treten manchmal einzelne extrem hohe
oder niedrige Werte auf, die weitere Berechnungen, z.B. des arithmetischen Mittelwertes x̄,
wesentlich beeinflussen können. Es stellt sich also die Frage, ob wir diese Extremwerte oder
Ausreisser einfach aus der Stichprobe streichen können. Dazu muss entschieden werden, ob
ein solcher Wert wirklich verfälscht ist und damit nicht als Realisierung der Zufallsgrösse
X mit der Verteilungsfunktion F angesehen werden kann, also für die vorliegende nach F
verteilte Grundgesamtheit nicht repräsentativ ist. Andererseits ist zu bedenken, dass zum
Beispiel eine normalverteilte Zufallsgrösse alle Werte zwischen minus und plus unendlich
annehmen kann und damit auch als Realisierungen in der Stichprobe sehr grosse oder sehr
kleine Werte durchaus (wenn auch mit kleiner Wahrscheinlichkeit) auftreten können. Dies
zeigt die Kompliziertheit dieses so genannten Ausreisserproblems.
In der mathematischen Statistik sind wir bestrebt, für diese subjektiven Einschätzungen
verdächtiger Werte objektive Kriterien zu finden. Wir bezeichnen einen extrem grossen oder
extrem kleinen Wert x∗ der Stichprobe x1 , . . . , xN als Ausreisser, wenn durch einen Ausreissertest die Hypothese, dass x∗ ein Stichprobenwert aus der Grundgesamtheit ist, abgelehnt
wird.
Wird ein Wert x∗ durch einen Ausreissertest als Ausreisser erkannt, so wird er in der Regel aus
der Stichprobe entfernt, die Stichprobe wird von Ausreisser bereinigt. Nach dem Entfernen
eines Ausreissers sollte die bereinigte Stichprobe wiederum auf erneute Ausreisser untersucht
werden, bis keine verdächtigen Werte mehr vorhanden sind.
In der Praxis sollten jedoch die als Ausreisser identifizierten und aus der Stichprobe gestrichenen Werte gesondert erfasst werden. Zumindest ist ihre Anzahl fest zu halten. Auch
sollte sich der Anwender beim Erkennen von Ausreissern durch einen Ausreissertest stets
überlegen, ob bei der Datenerfassung verfälschte Messwerte zum Beispiel durch Ablese- oder
Übertragungsfehler möglich sind oder ob nicht gerade die Extremwerte die aufschlussreichsten
Werte der Stichprobe darstellen können. Im letzten Fall würde ein Entfernen dieser Werte zu
falschen Schlussfolgerungen führen.
Der Anwender sollte sich auch bewusst sein, dass einige Verfahren der statistischen Datenanalyse sehr stark auf Ausreisser reagieren, z.B. alle auf dem arithmetischen Mittel x̄ und der
Varianz s2 beruhenden Schätz- und Prüfverfahren1 . Im Gegensatz dazu ist zum Beispiel der
Median x
e unempfindlich, so genannt robust, auf Ausreisser.
1
Beobachten Sie einmal, wie sich eine Regressionsgerade ändert, wenn ein einziger Wert stark geändert wird
(vgl. Abbildungen 11.1.ii und 11.1.iii).
83
84
Kapitel 9. Das Ausreisserproblem
9.1
Ausreissertest nach Grubbs für Stichprobenwerte
Aus der grossen Zahl von Ausreissertests wollen wir im Folgenden den Ausreissertest nach
F. E. Grubbs (1969) vorstellen, der eine normalverteilte Grundgesamtheit voraussetzt.
Es seien also N Messwerte x1 , . . . , xN eines zufälligen Merkmales aus einer normalverteilten
Grundgesamtheit gegeben2 . Mit dem Ausreissertest nach Grubbs wollen wir die alternativen
Hypothesen
H0 : Alle N Messwerte stammen aus der gleichen Grundgesamtheit.
H1 : Mindestens ein Stichprobenwert stammt aus einer anderen Grundgesamtheit.
testen. Zur Prüfung von H0 berechnen wir den geschätzten Mittelwert und die geschätzte
Varianz der Stichprobe
x̄ =
N
1 X
xi
N
N
und
s2 =
i=1
1 X
(xi − x̄)2
N −1
i=1
und daraus die Testgrösse
G=
max |xi − x̄|
1≤i≤N
.
(9.1.a)
s
Die Wahrscheinlichkeitsverteilung von G entspricht keiner der uns bekannten Verteilungen,
sie lässt sich aber im Prinzip bestimmen. Die kritischen Werte GN,1−α für entsprechenden
Stichprobenumfang N zu gegebenem Signifikanzniveau α berechnen wir mit
v
u
t2N −2, α
N − 1u
N
t
,
GN,1−α = √
t2N −2, α + (N − 2)
N
N
wobei tn,q das q-Quantil der Student-t-Verteilung mit n Freiheitsgraden darstellt (vgl. Tafel T.3) oder entnehmen sie der Tafel T.19. Jetzt ziehen wir den statistischen Schluss:
• Ist die Testgrösse G < GN,1−α , dann wird die Nullhypothese H0 angenommen, d.h., die
Stichprobe enthält keine Ausreisser.
• Ist die Testgrösse GN,1−α ≤ G, dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt, d.h., derjenige Wert der Stichprobe, der am weitesten vom arithmetischen Mittel x̄ entfernt liegt – das kann entweder der kleinste xmin oder der grösste xmax
Wert der Stichprobe sein –, als Ausreisser erkannt ist und aus der Stichprobe entfernt
wird.
Nach dem Entfernen eines Ausreissers sollte die bereinigte Stichprobe wiederum auf erneute
Ausreisser untersucht werden, bis keine verdächtigen Werte mehr vorhanden sind. Der Ausreissertest nach Grubbs entdeckt zu grosse Ausreisser nur dann, wenn gleichzeitig keine zu
kleinen Messwerte vorhanden sind. Treten Extremwerte an beiden Rändern der geordneten
Messreihe auf, so wird die geschätzte Varianz s2 grösser und demzufolge die Testgrösse G
kleiner.
2
Die Parameter µ und σ 2 der Grundgesamtheit brauchen nicht bekannt zu sein.
9.2. Ausreissertest nach Grubbs für Mittelwerte
9.2
85
Ausreissertest nach Grubbs für Mittelwerte
Es liegen k unabhängige Stichproben vom gleichen Umfang N mit den Mittelwerten x̄1 , . . . , x̄k
aus k normalverteilten Grundgesamtheiten vor. Es wird vermutet, dass µ1 = · · · = µk , d.h.,
alle Mittelwerte der k normalverteilten Grundgesamtheiten seien gleich.
Die Prüfung, ob der kleinste oder grösste Mittelwert
x̄min = min x̄i
1≤i≤k
oder
x̄max = max x̄i
1≤i≤k
der k Stichproben aus einer normalverteilten Grundgesamtheit mit grösserem Mittelwert
stammt, also als Ausreisser anzusehen ist, prüfen wir mit dem Ausreissertest nach Grubbs
(vgl. Kapitel 9.1).
9.3
Ausreissertest nach Cochran für Varianzen
Es liegen k unabhängige Stichproben vom gleichen Umfang N mit den Varianzen s21 , . . . , s2k
aus k normalverteilten Grundgesamtheiten vor. Es wird vermutet, dass σ12 = · · · = σk2 , d.h.,
alle Varianzen der k normalverteilten Grundgesamtheiten seien gleich.
Die Prüfung, ob die grösste
s2max = max s2i
1≤i≤k
der k Varianzen aus einer normalverteilten Grundgesamtheit mit grösserer Varianz stammt,
also als Ausreisser anzusehen ist, prüfen wir mit dem Cochran-Test (vgl. Kapitel 6.3).
Aufgaben
Aufgabe 9.3.1. Es soll die Genauigkeit einer technologischen Operation untersucht werden.
Zu bestimmten Zeitpunkten wurden Proben entnommen. Folgende Masse der Teile [in mm]
wurden festgestellt (geordnet):
0.07
0.09
0.10
0.12
0.13
0.15
0.16
0.17
0.31
Gibt es hier beim Niveau α = 0.01 Ausreisser?
Aufgabe 9.3.2. Bei einer Untersuchung der Zeit, die ein Arbeiter für einen bestimmten
Arbeitsgang benötigt, ergaben sich die folgenden 8 Zeitmessungen [in Minuten]:
84
83
86
81
92
82
85
83
Bereinigen Sie diese Stichprobe auf einem Signifikanzniveau von 10% von allen Ausreissern.
Beschreiben Sie, was Sie mit allfälligen Ausreissern machen.
86
Kapitel 9. Das Ausreisserproblem
Kapitel 10
Varianzanalyse – ANOVA
Die Varianzanalyse oder ANOVA1 ist ein spezielles Verfahren, das ursprünglich von R. A.
Fisher (vgl. Abbildung 1.1.iii) entwickelt wurde. Sie stellt inhaltlich eine Verallgemeinerung
des Zweistichproben-t-Tests zum Vergleich von Mittelwerten zweier unabhängiger Stichproben aus normalverteilten Grundgesamtheiten (vgl. Kapitel 5.3) dar. Sie gestattet, mehrere
Stichprobenmittelwerte gleichzeitig auf einen signifikanten Unterschied zu testen und damit
den Einfluss eines so genannten Faktors auf ein messbares Merkmal zu untersuchen.
Beispiel 10.0.1. Ein Arzt in einer Klinik meint bezüglich einer bestimmten Art von Schmerzen folgendes herausgefunden zu haben: Die mittlere Zeitdauer, die sich ein Patient nach
Einnahme einer Tablette schmerzfrei fühlt, hängt nicht vom Wirkstoff ab, den eine Tablette
enthält, sondern nur von der Tatsache, dass dem Patienten eine Tablette verabreicht wird. Um
diese Behauptung zu prüfen, gibt er einer Anzahl Patienten, die an solchen Schmerzen leiden
entweder ein so genanntes Placebo (Tablette ohne Wirkstoff) oder eines von zwei schmerzstillenden Mitteln A und B. Er notiert dann, für wie viele Stunden sich der Patient schmerzfrei
fühlt. Geprüft werden soll, ob hinsichtlich der schmerzfreien Zeit bei den 3 Gruppen signifikante, d.h. durch das unterschiedliche Medikament A, B und Placebo hervorgerufene, oder bloss
zufallsbedingte Unterschiede bestehen. In diesem Fall liefert die Varianzanalyse das geeignete
statistische Analyseverfahren.
10.1
Einfaktorielle Varianzanalyse
Gegeben seien r Stichproben, so genannte Gruppen, mit jeweils n1 , . . . , nr Werten aus normalverteilten Grundgesamtheiten mit den Erwartungswerten µ1 , . . . , µr und den im Allgemeinen unbekannten aber gleichen Varianzen σ12 = · · · = σr2 . Die Gesamtanzahl der Messwerte
ist dann
r
X
N=
ni .
i=1
Die N Messwerte, die mit xij (wobei i ∈ {1, . . . , r}, und j ∈ {1, . . . , ni }) bezeichnet werden,
können wir in das folgende Versuchsschema eintragen.
1
Analysis of Variances
87
88
Kapitel 10. Varianzanalyse – ANOVA
Gruppen (Faktor)
1. Stichprobe
2. Stichprobe
..
.
Stichprobenwerte (Merkmal)
x11 x12 · · · x1j · · · x1n1
x21 x22 · · · x2j · · · x2n2
..
..
..
..
.
.
.
.
Mittelwerte
x̄1
x̄2
..
.
Varianzen
s21
s22
..
.
i. Stichprobe
..
.
xi1
..
.
xi2
..
.
···
xij
..
.
···
xini
..
.
x̄i
..
.
s2i
..
.
r. Stichprobe
xr1
xr2
···
xrj
···
xrnr
x̄r
s2r
Dieses Versuchsschema haben wir durch die Mittelwerte und die Varianzen
ni
1 X
x̄i =
xij
ni
n
s2i
und
j=1
i
1 X
=
(xij − x̄i )2
ni − 1
j=1
der einzelnen Gruppen ergänzt.
Aufgabe der Varianzanalyse ist es, die Mittelwerte x̄1 , . . . , x̄r der r Gruppen miteinander zu
vergleichen und damit die Wirkung des Faktors auf das gemessene Merkmal zu untersuchen.
Dazu stellen wir die alternativen Hypothesen auf.
H0 : µ1 = · · · = µr , d.h., alle Stichproben stammen aus der gleichen Grundgesamtheit
mit µ und σ 2 , der Faktor hat keinen Einfluss auf das Merkmal.
für mindestens zwei verschiedene Indizes i, i′ ∈ {1, . . . , r}.
H1 : µi 6= µi′
Die Idee der Varianzanalyse besteht darin, die Varianz zwischen den Stichproben, die durch
die Stichprobenmittelwerte vertreten sind, mit den Varianzen innerhalb der Stichproben zu
vergleichen. Dazu berechnen wir den Mittelwert aller Messwerte sämtlicher Stichproben
x̄ =
r ni
r
1 XX
1 X
xij =
ni x̄i
N
N
i=1 j=1
i=1
und die Varianz aller Messwerte sämtlicher Stichproben
r
s2 =
n
i
1 XX
(xij − x̄)2 .
N −1
(10.1.a)
i=1 j=1
Die mit (N − 1) multiplizierte Varianz (10.1.a) zerlegen wir nun in zwei Teile:
(N − 1)s2 =
=
=
ni
r X
X
(xij − x̄)2
i=1 j=1
ni
r X
X
i=1 j=1
ni
r X
X
i=1 j=1
=
r
X
i=1
((xij − x̄i ) + (x̄i − x̄))2
(xij − x̄i )2 + 2(xij − x̄i )(x̄i − x̄) + (x̄i − x̄)2


ni
ni
ni
X
X
X
 (xij − x̄i )2 + 2(x̄i − x̄)
(xij − x̄i ) +
(x̄i − x̄)2  .
j=1
j=1
j=1
10.1. Einfaktorielle Varianzanalyse
Der mittlere Summand
ni
X
j=1
(xij − x̄i ) =
ni
X
j=1
89
xij −
ni
X
j=1
x̄i = ni x̄i − ni x̄i = 0
verschwindet für alle i ∈ {1, . . . , r}. Den ersten und den letzten Summanden der übrigbleibenden zerlegten Varianz schreiben wir nun wie folgt um


ni
ni
r
X
X
X
 (xij − x̄i )2 +
(x̄i − x̄)2 
(N − 1)s2 =
i=1
=
r
X
i=1
j=1
j=1
(ni − 1)s2i + ni (x̄i − x̄)2
r
r
X
X
=
(ni − 1)s2i +
ni (x̄i − x̄)2 .
i=1
i=1
Dies ist die gesuchte Zerlegung. Wir beachten, dass nicht die Varianz selbst, sondern die
Summe der Abweichungsquadrate, also ihre Zähler additiv zerlegt wurden. Durch Division
der Summe der Abweichungsquadrate durch N − 1, n − r resp. r − 1 (diese Zahlen ergeben
sich als zugehörige Freiheitsgrade) erhalten wir die so genannte Varianzzerlegung.
1. Varianz innerhalb der Gruppen: Es handelt sich dabei um das gewogene Mittel der
Stichprobenvarianzen
r
1 X
2
(ni − 1)s2i
sin =
N −r
i=1
mit N − r Freiheitsgraden.
2. Varianz zwischen den Gruppen: Es handelt sich dabei um die Abweichungsquadrate
zwischen den Stichproben, die durch ihre Mittelwerte vertreten sind,
r
s2zw =
1 X
ni (x̄i − x̄)2
r−1
i=1
mit r − 1 Freiheitsgraden.
Unter der Voraussetzung, dass die r Stichproben alle aus Grundgesamtheiten mit der gleichen, aber unbekannten Varianz σ 2 stammen, besitzt die Zufallsgrösse s2in eine Verteilung mit
Erwartungswert
E(s2in ) = σ 2 .
Im Gegensatz dazu besitzt die Zufallsgrösse s2zw eine Verteilung mit dem Erwartungswert
r
E(s2zw ) = σ 2 +
1 X
ni (µi − µ)2 .
r−1
i=1
Ist nun die Nullhypothese H0 richtig, so verschwindet wegen µi − µ = 0 für alle i ∈ {1, . . . , r}
der zweite Summand, und die Zufallsgrösse s2zw hat ebenfalls einen Erwartungswert von σ 2 .
Aus diesem Grund eignet sich die Testgrösse
f=
s2zw
s2in
(10.1.b)
90
Kapitel 10. Varianzanalyse – ANOVA
vorzüglich zur Überprüfung der Nullhypothese, da die Bedingung µ1 = · · · = µr = µ impliziert, dass die Erwartungswerte von s2zw und s2in gleich sind und somit f gleich 1 sein sollte.
Die Testgrösse (10.1.b) ist F -verteilt mit (r − 1, N − r) Freiheitsgraden.
Der Ablehnungsbereich für die Nullhypothese H0 bei einem gegebenen Signifikanzniveau α
ist durch den kritischen Wert Fr−1,N −r,1−α gegeben. Der kritische Wert lässt sich aus der
Beziehung
P (Fr−1,N −r,1−α ≤ f ) = α
mit Hilfe von Tafeln T.6 bis T.14 oder einem Computerprogramm ermitteln.
Jetzt ziehen wir den statistischen Schluss:
• Ist die Testgrösse f < Fr−1,N −r,1−α , dann wird die Nullhypothese H0 angenommen,
d.h., Abweichungen vom idealen Wert f = 1 sind zufälliger Natur. Die r Stichproben
stammen somit mit einer Irrtumswahrscheinlichkeit von 1 − α aus der gleichen Grundgesamtheit.
• Ist die Testgrösse Fr−1,N −r,1−α ≤ f , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt.
Beispiel 10.1.1. Aus r = 4 Lieferungen von Gussasphalt wurden je ni = 5 Stichprobenwerte
entnommen, um zu prüfen, ob der Bindemittelgehalt gleich ist. Wir erhalten das folgende
Versuchsschema:
Gruppen (Faktor)
1. Stichprobe
2. Stichprobe
3. Stichprobe
4. Stichprobe
7.4820
7.5924
7.5372
7.5468
Stichprobenwerte (Merkmal)
7.5646 7.9233 7.8625 7.1769
7.5472 7.9446 7.8803 7.1517
7.5559 7.9340 7.8714 7.1643
7.2451 7.9255 7.9286 7.0809
Mittelwerte
7.6019
7.6232
7.6126
7.5454
Varianzen
0.0919
0.0996
0.0950
0.1493
Das Signifikanzniveau ist α = 0.05. Wir stellen die alternativen Hypothesen auf.
H0 : µ1 = µ2 = µ3 = µ4 , d.h., der durchschnittliche Bindemittelgehalt ist gleich.
H1 : µi 6= µi′ ,
für mindestens zwei verschiedene Indizes i, i′ ∈ {1, 2, 3, 4},
d.h., der durchschnittliche Bindemittelgehalt ist nicht gleich.
Nun führen wir die Varianzanalyse oder ANOVA durch und berechnen die nötigen Zwischenwerte s2in = 0.1090 und s2zw = 0.0060 und daraus die Testgrösse f = 0.0553. Zu gegebenem
Signifikanzniveau α = 0.05 und den Freiheitsgraden (r − 1, N − r) = (3, 16) bestimmen wir
aus Tafel T.9 oder einem Computerprogramm den kritischen Wert F3,16,0.95 = 3.2389.
Da f = 0.0553 < F3,16,0.95 = 3.2389 gilt, kann die Nullhypothese angenommen werden. Die
Stichproben stammen somit mit einer Irrtumswahrscheinlichkeit von 5% aus der selben normalverteilten Grundgesamtheit. D.h., der Bindemittelgehalt ist bei allen Stichproben gleich.
Aufgaben
Aufgabe 10.1.1. Während der Fussballweltmeisterschaften 1982 in Spanien ermittelte der
medizinische Betreuer einer Mannschaft folgende Gewichtsverluste [in kg] einiger Feldspieler
bei drei Vorrundenspielen:
10.1. Einfaktorielle Varianzanalyse
Gruppen (Faktor)
1. Spiel
2. Spiel
3. Spiel
91
Stichprobenwerte
1.84 1.97 1.75
1.98 1.77 1.85
1.76 1.73 1.82
1.86
1.67
1.61
(Merkmal)
1.83 1.88
2.01
1.74 1.68
1.69
Testen Sie auf dem Niveau 5% die Annahme der Gleichheit des mittleren Gewichtsverlustes
in allen Vorrundenspielen.
Aufgabe 10.1.2. Ein Walzwerk liefert Eisenplatten, die von 4 verschiedenen Walzen stammen. Der Verwendungszweck dieser Platten erfordert, dass sie alle die gleiche Dicke besitzen.
Zur Untersuchung dieses Merkmals wurden 20 Platten nachgemessen, wobei von jeder der
Walzen 5 dieser Platten stammten. Es ergaben sich die folgenden Werte [in mm]:
Gruppen (Faktor)
1. Walze
2. Walze
3. Walze
4. Walze
Stichprobenwerte
9.34 9.38 9.12
9.67 9.51 9.61
9.14 9.13 9.06
9.71 9.75 9.50
(Merkmal)
9.32 9.28
9.52 9.57
9.02 9.07
9.54 9.55
Prüfen Sie auf dem 1% Niveau die Annahme, dass die mittlere Plattendicke bei allen 4 Walzen
gleich sei.
Aufgabe 10.1.3. Von 18 untersuchten Getreidefelder wurden n1 = 5 mit Düngemittel D1 ,
n2 = 7 mit Düngemittel D2 und n3 = 6 mit Düngemittel D3 gedüngt. Die Ernteerträge der
entsprechenden Felder [in kg] sind in folgender Tabelle angegeben:
Gruppen (Faktor)
Düngemittel D1
Düngemittel D2
Düngemittel D3
781
545
696
Stichprobenwerte
655 611 789
786 976 663
660 639 467
(Merkmal)
596
790 568
65 380
720
Prüfen sie auf dem 5% Niveau die Annahme, dass die drei Düngemittel im Mittel zu den
gleichen Ernteerträge führen.
Aufgabe 10.1.4. Um drei Trainingsmethoden A, B und C für den Speerwurf zu erproben,
wurden 23 untrainierte Sportstudenten zufällig in drei Gruppen zu n1 = 6, n2 = 9 und n3 = 8
Studenten eingeteilt. Vor der Tainingsphase wurde zunächst ein Leistungstest durchgeführt
und für jeden Studenten die Weite des besten von drei Würfen notiert. Nach Abschluss des
Trainings, die Studenten der Gruppe 1 wurden nach System A, die Studenten der zweiten
Gruppe nach B usw. trainiert, wurde ein zweiter Leistungstest durchgeführt. Es ergaben sich
folgende Werte [in m] der Differenzen zwischen erstem und zweitem Test:
Gruppen (Faktor)
1. Gruppe
2. Gruppe
3. Gruppe
7.06
8.73
5.00
13.50
10.24
10.88
Stichprobenwerte (Merkmal)
4.86 12.00
8.38
9.20
9.78
7.30
7.42 10.54 12.98
4.70
6.90 12.80
8.68
8.34
17.80
9.04
Sind die drei Trainingsmethoden gleichwertig? Das Signifikanzniveau ist 5%.
9.40
92
Kapitel 10. Varianzanalyse – ANOVA
Kapitel 11
Regressionsrechnung
Problemstellung: Gegeben sei eine empirisch vorliegende, d.h. durch eine Anzahl Messpunkte gegebene Funktion. Gesucht wird eine Funktion f , die diese Funktion nach der Gaussschen
Methode der kleinsten Quadrate am besten annähert.
Das Prinzip der Regressionsrechnung wird auch als Gausssche Methode der kleinsten
Quadrate (MKQ) bezeichnet oder unter dem Begriff Ausgleichsrechnung zusammengefasst. Es geht auf Carl Friedrich Gauss, 1777-1855, zürück.
Abbildung 11.0.i: Carl Friedrich Gauss, 1777-1855
11.1
Regressionsgerade
Gegeben sei eine Punktewolke von n Punkten Pi (xi , yi ). Gesucht ist die Gerade mit der
Gleichung y = ax+b, die diese Punktewolke im Sinne von Gauss möglichst gut annähert. Dies
bedeutet, dass die Gerade, d.h. a und b, so gewählt wird, dass die so genannte Fehlerquadratsumme
n
X
∆yi2 ,
S(a, b) =
i=1
die Summe der quadratischen Abweichungen von den gegebenen Punkten minimal ist. Für
93
94
Kapitel 11. Regressionsrechnung
y
b
Pi (xi , yi )
b
b
∆yi
b
b
y = ax + b
b
x
Abbildung 11.1.i: Regressionsgerade
die Fehlerquadratsumme erhalten wir
S(a, b) =
n
X
i=1
(yi − axi − b)2 .
Sie ist zu minimalisieren, also berechnen wir die ersten partiellen Ableitungen und setzen sie
gleich null
n
X
(yi − axi − b)xi = 0,
Sa (a, b) = −2
i=1
n
X
Sb (a, b) = −2
(yi − axi − b) = 0.
i=1
Dies ergibt das lineare Gleichungssystem in den Variablen a und b
a
n
X
x2i + b
i=1
n
X
xi =
i=1
a
n
X
xi + bn =
i=1
n
X
i=1
n
X
xi y i ,
(11.1.a)
yi ,
(11.1.b)
i=1
welches mit der Cramerschen Regel (vgl. [15] Seiten 86ff) die Lösung
 n

n
X
X
xi y i
xi 



i=1
i=1


det  X
n
n
n
n

X
X
X


y
n
n
xy −
x
y
i
a=

i=1
n
X
x2i


i=1
det 
n
 X

xi
i=1
i i
n
X
 =
xi 

i=1


n 
i=1
n
X
n
i=1
x2i −
i
i
i=1
i=1
!2
n
X
xi
i=1
11.1. Regressionsgerade
und

b=
n
X
95
x2i


i=1
det 
n
 X

xi
 i=1
n
X
x2i


i=1
det 
n
 X

xi
n
X

xi y i 



y 
i=1
n
X
i=1
n
X
i
 =
n
X
i=1
xi 



n 
i=1
i=1
x2i
n
X
i=1
n
n
X
i=1
yi −
n
X
x2i −
xi
n
X
xi y i
i=1
i=1
!2
n
X
xi
i=1
ergibt. Der Koeffizient a heisst Regressionskoeffizient und b die Regressionskonstante.
Aus der Gleichung (11.1.b) entnehmen wir, dass der Schwerpunkt
!
n
n
1X
1X
P (x̄, ȳ) = P
xi ,
yi
n
n
i=1
i=1
der Punktewolke auf der Geraden y = ax + b liegt.
Die Frage stellt sich nun wiederum, ob es sich bei der gefundenen Lösung um ein Extremum
oder einen Sattelpunkt handelt. Um dies abzuklären, berechnen wir die zweiten partiellen
Ableitungen der Funktion S
Saa (a, b) = 2
n
X
x2i
i=1
Sbb (a, b) = 2n
n
X
Sab (a, b) = Sba (a, b) = 2
xi
i=1
und betrachten
2
Saa (a, b) · Sbb (a, b) − Sab (a, b) = 4n
n
X
i=1
x2i
−4
n
X
i=i
xi
!2
.
Wir benutzen die Cauchy-Schwarzsche Ungleichung
|h~u, ~v i| ≤ |~u| · |~v |,
die in Komponenten ausgeschrieben die folgende Form hat
!2
n
n
n
X
X
X
2
ui vi
≤
ui
vi2 .
i=1
i=1
i=1
Wenn die Vektoren ~u und ~v parallel sind, dann gilt die Gleichheit in der Cauchy-Schwarzschen
Ungleichung.
Mit der Setzung u1 = 1, . . . , un = 1 und v1 = x1 , . . . , vn = xn folgt
!2
n
n
X
X
xi
>n
x2i ,
i=i
i=1
96
Kapitel 11. Regressionsrechnung
da die Vektoren ~u und ~v nicht parallel sind. Damit ergibt sich die hinreichende Bedingung
!2
n
n
X
X
Saa (a, b) · Sbb (a, b) − Sab (a, b)2 = 4n
x2i − 4
xi
>0
für einen Extrempunkt. Da Saa (a, b) = 2
Minimum.
Pn
2
i=1 xi
i=1
i=i
> 0 gilt, handelt es sich in der Tat um ein
Achtung bei Datenmaterial mit Ausreissern!
Die Ausgleichsrechnung ist sehr anfällig auf Ausreisser (vgl. Abbildungen 11.1.ii und 11.1.iii).
Deshalb sollten wir immer grösste Vorsicht walten lassen und die Stichprobe zuerst auf Ausreisser untersuchen. Dies kann entweder grafisch oder mit dem Ausreissertest nach Grubbs
(vgl. Kapitel 9.1) geschehen.
y
y
b
c
b
b
b
b
b
b
b
b
b
b
b
b
b
c
b
x
x
Abbildung 11.1.ii: Eine falsche Regressionsgerade wegen einem Ausreisser
11.2
Abbildung 11.1.iii: Eine vorgetäuschte
Abhängigkeit wegen einem Ausreisser
Allgemeine Regression
Gegeben seien n Punkte P1 (x1 , y1 ), . . . , Pn (xn , yn ). Gesucht ist eine Funktion f der Form
f (x) =
m
X
k=1
ak fk (x) = a1 f1 (x) + · · · + am fm (x), wobei m < n.
Die m Funktionen f1 , . . . , fm sind vorgegebene Funktionen in analytischer Form, wie zum
Beispiel x2 , sin(x) oder x1 . Die Koeffizienten a1 , . . . , am werden so bestimmt, dass die Fehlerquadratsumme
n
n
X
X
S(a1 , . . . , am ) =
(f (xi ) − yi )2 =
∆yi2
i=1
i=1
bezüglich der n Punkte Pi minimal wird. Dies stellt eine Verallgemeinerung der bereits besprochenen Methode der kleinsten Quadrate dar. Für a1 = a, a2 = b und f1 (x) = x, f2 (x) = 1
ergibt sich der der Spezialfall einer Ausgleichsgeraden. Wir wollen also die Fehlerquadratsumme
!2
n
n
m
X
X
X
S(a1 , . . . , am ) =
(f (xi ) − yi )2 =
ak fk (xi ) − yi
i=1
i=1
k=1
11.2. Allgemeine Regression
97
y
b
b
b
f (xi )
b
y = f (x)
b
b
b
∆yi
b
bP
b
i (xi , yi )
b
b
xi
x
Abbildung 11.2.i: Allgemeine Approximation mit minimalem quadratischen Fehler.
minimieren, dazu berechnen wir alle ersten partiellen Ableitungen
Sa1 (a1 , . . . , am ) = 2
n
m
X
X
i=1
..
.
Sam (a1 , . . . , am ) = 2
k=1
n
m
X
X
i=1
k=1
ak fk (xi ) − yi
ak fk (xi ) − yi
!
!
f1 (xi ) = 0,
..
.
fm (xi ) = 0.
Dies ergibt ein lineares Gleichungssystem mit m Gleichungen für die m unbekannten Koeffizienten a1 , . . . , am .
n
m
X
X
i=1
k=1
n
m
X
X
i=1
k=1
!
ak fk (xi ) f1 (xi ) =
!
n
m
X
X
i=1
..
.
ak fk (xi ) fm (xi ) =
k=1
n
m
X
X
i=1
k=1
!
ak fk (xi )f1 (xi )
!
ak fk (xi )fm (xi )
=
n
X
yi f1 (xi ),
n
X
yi fm (xi ).
i=1
..
.
=
i=1
98
Kapitel 11. Regressionsrechnung
Jetzt sollen die Summenbildungen vertauscht werden1 . Wir erhalten
!
!
m
n
m
n
n
X
X
X
X
X
ak fk (xi )f1 (xi ) =
ak
fk (xi )f1 (xi ) =
yi f1 (xi ),
k=1
i=1
m
n
X
X
k=1
i=1
k=1
!
ak fk (xi )fm (xi )
i=1
i=1
..
.
=
m
X
n
X
ak
!
fk (xi )fm (xi )
i=1
k=1
..
.
n
X
=
yi fm (xi )
i=1
und ausführlich geschrieben
a1
n
X
!
f1 (xi )f1 (xi )
i=1
a1
n
X
!
f1 (xi )fm (xi )
i=1
+ · · · + am
+ · · · + am
n
X
i=1
n
X
i=1
!
fm (xi )f1 (xi )
!
fm (xi )fm (xi )
=
n
X
yi f1 (xi ),
i=1
..
.
=
(11.2.a)
n
X
yi fm (xi ).
i=1
Beim linearen Gleichungssystem (11.2.a) handelt es sich um das so genannte Normalgleichungssystem der Ausgleichsrechnung. Dieses lässt sich auch mit Hilfe vom Matrizen schreiben
 n
 n


n
X
X
X
f1 (xi )f1 (xi ) · · ·
fm (xi )f1 (xi )  
yi f1 (xi ) 

 




a1
i=1
 i=1

 i=1







..
.
.
.
.
.
.
.
.

· . =
 . (11.2.b)
.
.
.
.

 n


n
n
 X



X
X
a
m


f1 (xi )fm (xi ) · · ·
fm (xi )fm (xi ) 
yi fm (xi ) 
i=1
i=1
i=1
In abkürzender Schreibweise können wir das obige lineare Normalgleichungssystem (11.2.b)
gemäss
A~a = ~b
(11.2.c)
schreiben, wobei die m gesuchten unbekannten Koeffizienten a1 , . . . , am zum Vektor ~a zusammengefasst wurden. Die Koeffizienten
Akj =
n
X
fk (xi )fj (xi ),
i=1
k, j ∈ {1, . . . , m}
1
Wir betrachten dazu ein vereinfachtes Beispiel von Doppelsummen und der Vertauschung von Summenzeichen
!
3
2
X
X
aik = (a11 + a12 ) + (a21 + a22 ) + (a31 + a32 )
i=1
k=1
= (a11 + a21 + a31 ) + (a12 + a22 + a32 )
!
2
3
X
X
=
aik .
k=1
i=1
11.2. Allgemeine Regression
99
der symmetrischen (m × m)-Matrix A und die Koeffizienten
n
X
bk =
yi fk (xi ),
i=1
k ∈ {1, . . . , m}.
des Störvektors ~b berechnen wir aus den Koordinaten der gegebenen Punkte. Damit lassen sich
nun die gesuchten Koeffizienten a1 , . . . , am durch lösen des linearen Normalgleichungssystems
(11.2.c) berechnen. Bei grossem m geschieht dies mittels Computer. Damit ist das gegebene
Problem im Prinzip gelöst.
Beispiel 11.2.1. Eine Punktmenge sei durch eine Funktion der Form
f (x) = ax + b sin(x)
[x im Bogenmass]
im Gaussschen Sinne zu approximieren. Die folgenden 8 Punkte P1 , . . . , P8 seien tabellarisch
gegeben
1
0
0.0
i
xi
yi
2
1
0.2
Wir minimieren
S(a, b) =
3
2
1.1
8
X
i=1
4
3
2.9
5
4
4.8
6
5
6.0
7
6
6.3
8
7
6.3
(axi + b sin(xi ) − yi )2 ,
dazu berechnen wir die ersten partiellen Ableitungen
Sa (a, b) = 2
Sb (a, b) = 2
8
X
i=1
8
X
i=1
(axi + b sin(xi ) − yi ) xi = 0,
(axi + b sin(xi ) − yi ) sin(xi ) = 0.
Dies ergibt das lineare Gleichungssystem2 mit zwei Gleichungen für die zwei unbekannten
Koeffizienten a und b.
8
X
ax2i +
i=1
8
X
8
X
bxi sin(xi ) =
i=1
8
X
b sin2 (xi ) =
8
X
xi sin(xi ) =
axi sin(xi ) +
i=1
8
X
y i xi ,
i=1
i=1
8
X
yi sin(xi )
8
X
y i xi ,
i=1
oder
a
8
X
i=1
a
8
X
i=1
2
x2i + b
i=1
8
X
xi sin(xi ) + b
i=1
sin2 (xi ) =
i=1
8
X
(11.2.d)
yi sin(xi ).
i=1
Dieses lineare Gleichungssystem hätte sich auch direkt aus dem linearen Normalgleichungssystem (11.2.a)
durch Einsetzen von n = 8, m = 2 und a1 = a, a2 = b und f1 (x) = x, f2 (x) = sin(x) ergeben.
100
Kapitel 11. Regressionsrechnung
Daraus lassen sich die gesuchten Koeffizienten a und b berechnen. Dieses Normalgleichungssystem lässt sich wiederum mit Hilfe einer Matrizengleichung schreiben




8
8
8
X
X
X
x2i
xi sin(xi )  
y i xi






i=1
i=1
i=1

· a =
.
8
8
8
 X



X
b
X




xi sin(xi )
sin2 (xi )
yi sin(xi )
i=1
i=1
i=1
Aus den Koordinaten der gegebenen 8 Punkte P1 (x1 , y1 ), . . . , P8 (x8 , y8 ) lassen sich die Koeffizienten dieses Normalgleichungssystems numerisch berechnen. Wir erhalten3
8
X
8
X
x2i = 140,
i=1
8
X
sin2 (xi ) = 3.5568,
i=1
8
X
i=1
8
X
xi yi = 142.2,
i=1
i=1
xi sin(xi ) = −1.8160,
yi sin(xi ) = −5.4297.
Damit ergibt sich das zu lösende lineare Normalgleichungssystem
140
−1.8160
a
142.2
·
=
−1.8160 3.5568
b
−5.4297
mit der Lösung4 a = 1.0026 und b = −1.0147. Die gesuchte Ausgleichsfunktion ist also durch
f (x) = 1.0026x − 1.0147 sin(x)
3
4
x im Bogenmass
Wir könnten auch mit der Cramerschen Regel (vgl. [15], Seiten 86ff) die Lösung


8
8
X
X
yi x i
xi sin(xi ) 



i=1
i=1

det 
8
8
8
8
8
8
 X

X
X
X
X
X


2
yi sin(xi )
sin (xi )
x i yi
sin2 (xi ) −
yi sin(xi )
xi sin(xi )
i=1
a=
i=1
8
X

x2i


i=1
det 
8
 X

xi sin(xi )
i=1
und
8
X

b=
x2i


i=1
det 
8
 X

xi sin(xi )
i=1
8
X

x2i


i=1
det 
8
 X

xi sin(xi )
i=1
8
X
 =
i=1
xi sin(xi ) 




2
sin (xi )
i=1
8
X
i=1
8
X
i=1
i=1
8
X
2
xi
i=1
8
X
2
sin (xi ) −
i=1
xi sin(xi )
i=1
!2
i=1
8
X
yi x i
i=1
8
X
i=1
8
X
yi sin(xi )






 =
xi sin(xi ) 




2
sin (xi )
i=1
8
X
8
X
x2i
i=1
8
X
i=1
8
X
yi sin(xi ) −
i=1
x2i
8
X
i=1
i=1
direkt aus dem Normalgleichungssystem (11.2.d) explizit berechnen.
8
X
xi sin(xi )
i=1
2
sin (xi ) −
8
X
i=1
8
X
x i yi
i=1
xi sin(xi )
!2
.
11.2. Allgemeine Regression
101
gegeben.
Die berechneten Werte im Vergleich zu den gegebenen ergeben sich zu:
i
xi
yi
f (xi )
1
0
0.0
0.0000
2
1
0.2
0.1488
3
2
1.1
1.0825
4
3
2.9
2.8646
5
4
4.8
4.7783
6
5
6.0
5.9860
7
6
6.3
6.2991
8
7
6.3
6.3526
Aufgaben
Aufgabe 11.2.1. In einem Wald sind die Durchmesser x1 , . . . , xn und die dazu gehörigen
Höhen y1 , . . . , yn von n Bäumen gemessen worden, so dass n empirische Zahlenpaare (x1 , y1 ),
. . . , (xn , yn ) gegeben sind. Durch die Punkte kann am ehesten eine passende logarithmische
Ausgleichskurve gelegt werden. Bestimmen Sie diese Funktion in der Form
f (x) = a log10 (x) + b.
Numerisches Beispiel: P1 (1, 1), P2 (2, 2), P3 (4, 2.5)
Aufgabe 11.2.2. Bestimmen Sie die beste Funktion der Form
f (x) = ax2 + be−x
zu den folgenden Punkten:
i
xi
yi
1
0
-1.0
2
1
1.6
3
2
7.9
4
3
17.9
5
4
32.0
Aufgabe 11.2.3. Bestimmen Sie die beste Funktion der Form
f (x) = a + bx + c sin(x)
[x im Bogenmass]
zu den folgenden Punkten:
i
xi
yi
1
0
1.0000
2
1
1.1585
3
2
2.0907
4
3
3.8589
Aufgabe 11.2.4. Bestimmen Sie die beste Funktion der Form
f (x) = a + bx2 + c sin(x) + d cos(x)
[x im Bogenmass]
zu den folgenden Punkten:
i
xi
yi
1
-2
-3.7416
2
-1
1.2391
3
0
4.0000
4
1
2.9221
5
2
-1.9230
6
3
-8.8389
Lösungen
Lösung 11.2.1. a = 2.491 und b = 1.083
Lösung 11.2.2. a = 1.999897 und b = −1.007806
Lösung 11.2.3. a = 0.9999968, b = 1.00001021 und c = −1.0000318
Lösung 11.2.4. a = 2.0000, b = −1.0000, c = 1.0000 und d = 1.9999
102
Kapitel 11. Regressionsrechnung
Kapitel 12
Regressionsanalyse
Die Regressionsanalyse behandelt folgendes Problem: Aus den Realisierungen einer Zufallsgrösse X sollen wahrscheinlichkeitstheoretische Aussagen, d.h., Vorhersagen über die Werte
einer zweiten Zufallsgrösse Y gemacht werden. Dabei sind natürlich nur dann sinnvolle Vorhersagen möglich, wenn die beiden Zufallsgrössen X und Y abhängig sind, wenn also eine
Verbindung zwischen X und Y besteht.
12.1
Allgemeines
Beispiel 12.1.1. Der Bremsweg eines bestimmten Autos hängt wesentlich von der Geschwindigkeit ab, die das Auto unmittelbar vor dem Bremsbeginn erreicht hat. Diese Geschwindigkeit
bestimmt jedoch den Bremsweg nicht eindeutig, weil er durch viele weitere Grössen beeinflusst
wird, z.B. durch den Zustand der Bremsen und Reifen, die Strassenbeschaffenheit, das Ladegewicht und das Verhalten des Fahrers während des Bremsvorgangs. Werden bei konstanter
Geschwindigkeit x mehrere Bremsversuche unternommen, so erhalten wir im Allgemeinen
verschiedene Bremswege als Realisierungen einer Zufallsvariable Y (x). Zu jedem Geschwindigkeitswert x gehört also eine Zufallsvariable Y (x). Aus Erfahrung ist bekannt, dass der
erwartete Bremsweg und die Streuung der Bremswege mit wachsender Geschwindigkeit x
grösser werden. Es gilt die Faustregel “grössere Geschwindigkeit gleich längerer Bremsweg”.
Aus der Geschwindigkeit können also keine deterministischen, sondern nur wahrscheinlichkeitstheoretische Aussagen über den Bremsweg gemacht werden. Diesen Zusammenhang
können wir mit einer Regression beschreiben.
Die Regressionsanalyse gibt uns Auskunft darüber, wie gut die angepasste Kurve zur Realität passt, d.h., ob das gewählte Modell (z.B. linear, polynomial oder exponentiel) ein angepasstes ist.
Beispiel 12.1.2. Im Gegensatz zu Beispiel 12.1.1 ist der Zusammenhang zwischen der Seitenlänge x eines Quadrates und dessen Flächeninhalt y ein deterministischer. Es gilt die
funktionale Beziehung y = x2 . Durch die Vorgabe einer Seitenlänge x ist also der Flächeninhalt
y = x2 eindeutig bestimmt.
Wir unterscheiden zwei Arten von Variablen:
1. Nichtstochastische Variablen, die fest vorgegeben sind, wie Stützpunkte, Klassenmitten oder Messpunkte (z.B. Geschwindigkeit vor Bremsbeginn in Beispiel 12.1.1).
Diese werden im Allgemeinen mit x bezeichnet.
103
104
Kapitel 12. Regressionsanalyse
2. Stochastische Variablen, die meistens einer Normalverteilung gehorchen (z.B. Bremsweg in Beispiel 12.1.1). Diese werden im Allgemeinen mit y bezeichnet.
b
y
b
b
b
ȳi
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
xi
x
Abbildung 12.1.i: Nichtstochastische Variablen in x-Richtung und im Allgemeinen normalverteilte stochastische Variablen in y-Richtung
Der Zusammenhang des durchschnittlichen Wertes ȳ von y je Messpunkt mit den verschiedenen Messpunkten der nichtstochastischen Variablen x heisst Regression. Im Folgenden
nehmen wir an, dass die stochastischen Variablen y einer Normalverteilung mit den Parametern µ und σ 2 gehorchen. Im Wesentlichen gibt es drei typische Fälle der Regression:
1. Kein Zusammenhang zwischen x und y, d.h., die y-Werte sind unabhängig von den
x-Werten (vgl. Abbildung 12.1.ii).
2. Linearer Zusammenhang zwischen x und y, d.h., die Verbindungslinie der Mittelwerte ȳ der einzelnen Verteilungen liegen alle auf einer Geraden, der so genannten Regressionsgeraden (vgl. Abbildung 12.1.iii). Die Regressionsgerade ist der geometrische
Ort der wahrscheinlichsten Werte von y je Messpunkt x.
3. Nichtlinearer Zusammenhang zwischen x und y, d.h., die Verbindungslinie der Mittelwerte ȳ der einzelnen Verteilungen liegen z.B. auf einer polynomialen (Grad mindestens zwei), exponentiellen oder logarithmischen Kurve (vgl. Abbildung 12.1.iv).
y
y
ȳ7
ȳ6
ȳ1
b
ȳ2
b
ȳ3
b
ȳ4
b
ȳ5
b
ȳ6
b
ȳ7
b
ȳ5
y = ax + b
ȳ4
ȳ3
ȳ2
y = const
ȳ1
x1
x2
x3
x4
x5
x6
x7
x
Abbildung 12.1.ii: Kein Zusammenhang
zwischen x und y.
b
b
b
b
b
b
b
x1
x2
x3
x4
x5
x6
x7
x
Abbildung 12.1.iii: Linearer Zusammenhang zwischen x und y
12.2. Regressionsgerade
105
y
ȳ5
ȳ4
y = f (x)
ȳ3
ȳ2
ȳ1
ȳ6
ȳ7
b
b
b
b
b
b
b
x2
x1
x4
x3
x5
x6
x7
x
Abbildung 12.1.iv: Nichtlinearer Zusammenhang zwischen x und y
In der Praxis sind meistens nicht so viele Messpunkte vorhanden, dass für viele Werte von
x annähernde Normalverteilungen entstehen. Es steht meistens eine mehr oder weniger beschränkte Stichprobe pro Messpunkt zur Verfügung, die von Messpunkt zu Messpunkt anders
sein kann.
12.2
Regressionsgerade
Gegeben sei eine Punktewolke von N Punkten P1 (x1 , y1 ), . . . , PN (xN , yN ). Gesucht ist die
Gerade mit der Gleichung y = ax + b, die diese Punktewolke im Sinne von Gauss möglichst
gut annähert. Dies bedeutet, dass die Konstanten a und b der Geraden so gewählt werden,
dass die so genannte Fehlerquadratsumme
S(a, b) =
N
X
∆yi2
i=1
N
X
=
(yi − axi − b)2 ,
i=1
die Summe der senkrechten quadratischen Abweichungen von den gegebenen Punkten zur Geraden minimal ist. Sie ist zu minimieren, also berechnen wir die ersten partiellen Ableitungen
b
y
b
Pi (xi , yi )
b
b
∆yi
b
b
b
b
b
b
b
b
b
b
y = ax + b
b
b
x
Abbildung 12.2.i: Regressionsgerade
106
Kapitel 12. Regressionsanalyse
und setzen diese gleich null
N
X
(yi − axi − b)xi = 0
Sa (a, b) = −2
Sb (a, b) = −2
und
i=1
N
X
i=1
(yi − axi − b) = 0.
Dies ergibt das lineare Gleichungssystem in den Variablen a und b
a
N
X
x2i
+b
i=1
N
X
xi =
i=1
N
X
xi y i
und
i=1
a
N
X
xi + bN =
i=1
N
X
(12.2.a)
yi ,
i=1
welches die Lösung
N
a=
N
X
i=1
N
xi y i −
N
X
i=1
x2i
−
N
X
xi
i=1
N
X
i=1
N
X
yi
i=1
xi
!2
und
b=
N
X
x2i
i=1
N
X
i=1
N
n
X
yi −
x2i
i=1
−
N
X
xi
i=1
N
X
i=1
N
X
xi y i
i=1
xi
!2
hat. Der Koeffizient a heisst Regressionskoeffizient und b die Regressionskonstante. Aus
der zweiten Gleichung (12.2.a) entnehmen wir, dass der Schwerpunkt
P (x̄, ȳ) = P
N
N
1 X
1 X
xi ,
yi
N
N
i=1
i=1
!
der Punktewolke auf der Regressionsgeraden y = ax + b liegt.
12.3
Regressionsanalyse einer Geraden
Wir sollten folgendes Problem bei der Regressionsrechnung nicht aus den Augen verlieren:
Da die Punkte um die Regressionsgerade mehr oder weniger streuen, enthalten sowohl der
Regressionskoeffizient a als auch die Regressionskonstante b eine gewisse Unsicherheit. Die
Frage stellt sich nun, ab welcher Grösse des Regressionskoeffizienten a von einem wirklichen
Einfluss der Grösse x auf die Grösse y gesprochen werden kann, d.h., ist die Regressionsgerade
signifikant von einer zur x-Achse parallelen Geraden verschieden.
Eine Berücksichtigung der Variable x ist nur dann sinnvoll, wenn die Veränderung von y
nicht rein zufällig auf ein Veränderung von x erfolgt. Mit Hilfe eines statistischen Tests, der
so genannten Regressionsanalyse, wollen wir nun diese Abhängigkeit quantifizieren.
Es seien also N Messpunkte P1 (x1 , y1 ), . . . , PN (xN , yN ) gegeben, dabei bezeichnet x die nichtstochastische und y die stochastische Variable. Nach der Methode der kleinsten Quadrate (vgl.
Kapitel 12.2) wurde eine beste Gerade Y = ax + b an diese Punktewolke angepasst.
Über den Regressionskoeffizienten a stellen wir nun eine Annahme in Form einer statistischen
Hypothese auf.
H0 : a = 0, d.h., es besteht keine Abhängigkeit zwischen x und y.
H1 : a 6= 0, d.h., es besteht eine Abhängigkeit zwischen x und y.
12.3. Regressionsanalyse einer Geraden
107
Zur Beantwortung dieser Fragestellung berechnen wir aus den Koordinaten der N Punkte
P1 (x1 , y1 ), . . . , PN (xN , yN ) die (theoretischen) Werte
Yi = axi + b
und damit die folgenden Grössen
N
s2x
N
1 X
mit x̄ =
xi ,
N
1 X
=
(xi − x̄)2
N −1
s2y =
1
N −2
i=1
N
X
i=1
i=1
(yi − Yi )2 =
und aus diesen die Testgrösse
tReg =
√
1
N −2
N −1
N
X
i=1
(yi − (axi + b))2
sx
a.
sy
(12.3.a)
Zur quantitativen Beurteilung der Abhängigkeit der Variablen y von der Grösse x sind folgende Gesichtspunkt massgebend:
• Die absolute Grösse des Regressionskoeffizienten a, d.h. die Steilheit der Regressionsgeraden. Grosse Werte des Regressionskoeffizienten deuten auf eine starke Abhängigkeit.
• Die Varianz s2x der unabhängigen x-Werte um den Mittelwert x̄. Grosse Streuung in
x-Richtung gibt Sicherheit für die Aussage. Für die Praxis heisst das, es muss dafür
gesorgt werden, dass die Grössen xi über ein möglichst grossen Bereich vorhanden sind.
• Die Restvarianz s2y der Punkte um die Gerade, d.h. die Fehlerquadratsumme in yRichtung. Kleine Streuungen in y-Richtung ergeben eine Zuverlässigkeit der Aussage.
Die Testgrösse tReg ist Student-t-verteilt mit n = N − 2 Freiheitsgraden. Das Testverfahren
für die Nullhypothese kann dann folgendermassen formuliert werden: Nach Wahl eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.3 oder einem Computerprogramm den
kritischen Wert tn,1− α2 bei einer zweiseitigen Fragestellung. Dann ziehen wir den statistischen Schluss:
• Ist die Testgrösse |tReg | < tn,1− α2 , dann wird die Nullhypothese H0 angenommen, d.h.,
es besteht keine signifikante Abhängigkeit zwischen x und y.
• Ist die Testgrösse |tReg | ≥ tn,1− α2 , dann wird die Nullhypothese H0 auf dem Signifikanzniveau α abgelehnt, d.h., es besteht eine signifikante Abhängigkeit.
Beispiel 12.3.1. Die Abhängigkeit der stochastischen Variablen y von der Grösse x soll
untersucht werden. Die folgenden Messwerte liegen vor.
xi
yi
0
9
1
8
3
7
4
5
5
5
6
3
7
3
8
1
Kann von einer signifikanten Abhängigkeit gesprochen werden? Wir wählen das Signifikanzniveau α = 0.001. Aus dem vorliegenden Datenmaterial berechnen wir vorerst die Regressionsgerade mit der Methode der kleinsten Quadrate
y = −0.9595 x + 9.2027.
108
Kapitel 12. Regressionsanalyse
Nun wollen wir mit der Regressionsanalyse überprüfen, ob a = −0.9595 eine signifikante
Abhängigkeit darstellt. Dazu berechnen wir s2x = 7.9286 und s2y = 0.2973 und daraus die
Testgrösse tReg = −13.1092, wobei N = 8 ist. Zum Signifikanzniveau 0.1% bestimmen wir
aus Tafel T.3 oder einem Computerprogramm den kritischen Wert t6,0.9995 = 5.9587.
Da |tReg | = 13.1092 ≥ t6,0.9995 = 5.9587 gilt, wird die Nullhypothese abgelehnt. D.h., x
hat einen wesentlichen Einfluss auf y oder anders ausgedrückt, der Regressionskoeffizient
a = −0.9595 ist signifikant von Nullverschieden.
Beispiel 12.3.2 (Meeresspiegel in Venedig). Die folgende Messreihe zeigt den jährlichen
maximalen Meeresspiegel1 [in cm] in Venedig für die Jahre von 1931 bis 1981.
xi
yi
xi
yi
xi
yi
xi
yi
1931
103
1944
106
1957
119
1970
123
1932
78
1945
105
1958
124
1971
122
1933
121
1946
136
1959
118
1972
120
1934
116
1947
126
1960
145
1973
114
1935
115
1948
132
1961
122
1974
96
1936
147
1949
104
1962
114
1975
125
1937
119
1950
117
1963
118
1976
124
1938
114
1951
151
1964
107
1977
120
1939
89
1952
116
1965
110
1978
132
1940
102
1953
107
1966
194
1979
166
1941
99
1954
112
1967
138
1980
134
1942
91
1955
97
1968
144
1981
138
1943
97
1956
95
1969
138
Ist die Zunahme des Meeresspiegels in Venedig über diese Periode signifikant? Das Signifikanzniveau sei 5%.
Die Regressionsgerade lautet
y = 0.57 x − 989.38.
Mit der Regressionsanalyse überprüfen wir, ob die Steigung a = 0.57 signifikant von Nullverschieden ist. Dazu berechnen wir s2x = 221.00 und s2y = 346.70 und daraus die Testgrösse
tReg = 3.20, wobei N = 51 ist. Zum Signifikanzniveau 5% bestimmen wir aus Tafel T.3 oder
einem Computerprogramm den kritischen Wert t49,0.975 = 2.01.
Da |tReg | = 3.20 ≥ t49,0.975 = 2.01 gilt, wird die Nullhypothese abgelehnt. Das heisst, der
Anstieg des Meeresspiegels in Venedig in den Jahren 1931 bis 1981 ist real.
Aufgaben
Aufgabe 12.3.1. Die Abhängigkeit der stochastischen Variablen y von der Grösse x soll
untersucht werden. Die folgenden Messwerte liegen vor.
xi
yi
1
1
2
1
5
4
8
3
10
6
Kann von einer signifikanten Abhängigkeit gesprochen werden? Das Signifikanzniveau ist 1%.
Aufgabe 12.3.2. Die Abhängigkeit der stochastischen Variablen y von der Grösse x soll
untersucht werden. Die folgenden Messwerte liegen vor.
xi
yi
xi
yi
1.1
2.0
4.6
0.8
1.2
1.9
5.1
0.8
1.4
1.8
6.3
0.7
1.6
1.8
7.8
0.6
1.7
1.7
8.3
0.5
1.9
1.7
9.4
0.4
2.0
1.6
10.3
0.3
2.3
1.5
10.5
0.2
2.7
1.5
10.7
0.2
2.8
1.4
11.0
0.1
2.9
1.3
11.6
0.4
3.3
1.2
11.9
0.1
3.8
1.1
12.0
0.0
4.0
0.9
12.6
-0.1
Kann von einer signifikanten Abhängigkeit gesprochen werden? Das Signifikanzniveau ist 1%.
1
Der aufmerksame Leser wird realisieren, dass der steigende Meeresspiegel nicht auf ein Ansteigen des
Wassers in der Adria zurückzuführen ist, sondern auf das Sinken der Markierung an der der Meeresspiegel in
Venedig abgelesen wird.
12.4. Regressionsanalyse zweier Geraden
12.4
109
Regressionsanalyse zweier Geraden
In der Praxis kommt es oft vor, dass zwei Stichproben der Umfänge N1 und N2 mit den
Messpunkten P11 (x11 , y11 ), . . . , P1N1 (x1N1 , y1N1 ) und P21 (x21 , y21 ), . . . , P2N2 (x2N2 , y2N2 ) gegeben sind. Daraus lassen sich mit der Methode der kleinsten Quadrate (vgl. Kapitel 12.2) zwei
Regressionsgeraden
y = a1 x + b1 und y = a2 x + b2 .
berechnen. Es interessiert, ob die beiden Regressionsgeraden nur zufällig voneinander abweichen.
y
b
b
bc
y = a2 x + b2
b
b
c
b
c
b
c
b
b
b
b
b
b
bc
bc
bc
y = a1 x + b1
bc
b
x
Abbildung 12.4.i: Regressionsanalyse zweier Geraden. Unterscheiden sich die beiden Gereaden
signifikant, d.h., sind die Steigungen oder die y-Achsenabschnitte verschieden?
Prüfung der Regressionskoeffizienten
Dazu stellen wir die alternativen Hypothesen auf.
Ha,0 : a1 = a2 , d.h., gleiche Steigungen der beiden Regressionsgeraden.
Ha,1 : a1 6= a2 , d.h., verschiedene Steigungen der beiden Regressionsgeraden.
Zur Beantwortung dieser Fragestellung berechnen wir aus den zwei gegebenen Stichproben
P11 (x11 , y11 ), . . ., P1N1 (x1N1 , y1N1 ) und P21 (x21 , y21 ), . . . , P2N2 (x2N2 , y2N2 ) die Grössen
x̄1 =
N1
1 X
x1i
N1
und
i=1
x̄2 =
N2
1 X
x2i
N2
i=1
und
N
s2x1
1
X
1
=
(x1i − x̄1 )2
N1 − 1
N
und
s2x2
i=1
2
X
1
=
(x2i − x̄2 )2
N2 − 1
(12.4.a)
i=1
und
N
s2y1
1
X
1
=
(y1i − (ax1i + b))2
N1 − 2
i=1
N
und
s2y2
2
X
1
=
(y2i − (ax2i + b))2 (12.4.b)
N2 − 2
i=1
110
Kapitel 12. Regressionsanalyse
und damit
s2a
(N1 − 2)s2y1 + (N2 − 2)s2y2
=
N1 + N2 − 4
1
1
+
2
(N1 − 1)sx1
(N2 − 1)s2x2
.
Aus diesen Grössen entsteht dann schlussendlich die Testgrösse
ta =
a1 − a2
.
sa
(12.4.c)
Die Testgrösse ta ist Student-t-verteilt mit n = N1 + N2 − 4 Freiheitsgraden. Nach Wahl
eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.3 oder einem Computerprogramm den kritischen Wert tn,1− α2 bei einer zweiseitigen Fragestellung. Dann ziehen wir den
statistischen Schluss:
• Ist die Testgrösse |ta | < tn,1− α2 , dann wird die Nullhypothese Ha,0 angenommen, d.h.,
es besteht kein signifikanter Unterschied zwischen den Steigungen der beiden Regressionsgeraden.
• Ist die Testgrösse |ta | ≥ tn,1− α2 , dann wird die Nullhypothese Ha,0 auf dem Signifikanzniveau α abgelehnt, d.h., die beiden Regressionsgeraden haben signifikant verschiedene
Steigungen.
Wird die Nullhypothese nicht abgelehhnt, so müssen wir zur Untersuchung der Gleichheit
der beiden Regressionsgeraden auch noch die Regressionskonstanten auf einen signifikanten
Unterschied hin untersuchen. Dies geschieht abermals mit einem statistischen Test und einer
geeigneten Testgrösse.
Prüfung der Regressionskonstanten
Dazu stellen wir die alternativen Hypothesen auf.
Hb,0 : b1 = b2 , d.h., gleiche y-Achsenabschnitte der beiden Regressionsgeraden.
Hb,1 : b1 6= b2 , d.h., verschiedene y-Achsenabschnitte der beiden Regressionsgeraden.
Zur Beantwortung dieser Fragestellung berechnen wir aus den Messpunkten die Grössen (vgl.
Gleichungen (12.4.a) und (12.4.b)) s2x1 , s2x2 und s2y1 , s2y2 und
s2b
(N1 − 2)s2y1 + (N2 − 2)s2y2
=
N1 + N2 − 4
x̄21
x̄22
1
1
+
+
+
2
2
(N1 − 1)sx1
(N2 − 1)sx2
N1 N2
.
Aus diesen Grössen entsteht dann schlussendlich die Testgrösse
tb =
b1 − b2
.
sb
(12.4.d)
Die Testgrösse tb ist Student-t-verteilt mit n = N1 + N2 − 4 Freiheitsgraden. Nach Wahl
eines Signifikanzniveaus α ermitteln wir mit Hilfe von Tafel T.3 oder einem Computerprogramm den kritischen Wert tn,1− α2 bei einer zweiseitigen Fragestellung. Dann ziehen wir den
statistischen Schluss:
12.4. Regressionsanalyse zweier Geraden
111
• Ist die Testgrösse |tb | < tn,1− α2 , dann wird die Nullhypothese Hb,0 angenommen, d.h.,
es besteht kein signifikanter Unterschied zwischen den y-Achsenabschnitten der beiden
Regressionsgeraden.
• Ist die Testgrösse |tb | ≥ tn,1− α2 , dann wird die Nullhypothese Hb,0 auf dem Signifikanzniveau α abgelehnt, d.h., die beiden Regressionsgeraden haben signifikant verschiedene
y-Achsenabschnitte.
Haben wir beide Nullhypothesen Ha,0 und Hb,0 angenommen, so können wir davon ausgehen,
dass sich die beiden Regressionsgeraden nur zufällig voneinander unterscheiden.
Aufgaben
Aufgabe 12.4.1. Es soll untersucht werden, ob die Steigungen und die y-Achsenabschnitte
der beiden Ausgleichsgeraden, die durch das folgende Datenmaterial gegeben sind, signifikant
voneinander verschieden sind. Das Signifikanzniveau ist 10%.
x1i
y1i
1 2 5 8 10
1 1 4 3 6
x2i
y2i
3 4 5 6 7 8
1 1 1 7 6 7
Aufgabe 12.4.2. Es soll untersucht werden, ob die beiden Ausgleichsgeraden, die durch das
folgende Datenmaterial gegeben sind, signifikant voneinander verschieden sind. Das Signifikanzniveau ist 5%.
x1i
y1i
1 2 5 8 10 12 14 18
1 1 4 3 6 9 8 13
x2i
y2i
3 4 5 6 7 8 9 10 11 12
1 1 1 7 6 7 8 9 14 15
Aufgabe 12.4.3. Es soll untersucht werden, ob die beiden Ausgleichsgeraden, die durch das
folgende Datenmaterial gegeben sind, signifikant voneinander verschieden sind. Das Signifikanzniveau ist 1%.
x1i
y1i
x1i
y1i
1.0
7.0
4.0
4.0
1.3
6.9
4.1
3.9
1.4
6.7
4.2
3.7
1.6
6.5
4.4
3.4
1.7
6.3
4.8
3.2
1.9
5.4
5.4
2.9
2.0
5.4
5.8
2.8
2.1
5.3
6.1
2.8
2.4
5.2
6.3
2.7
2.6
5.1
7.3
2.5
2.7
5.0
7.4
2.3
2.9
4.9
8.5
2.1
3.0 3.3 3.6 3.7 3.9
4.8 4.6 4.4 4.3 4.2
8.6
2.0
x2i
y2i
x2i
y2i
1.4
10.0
3.3
5.1
1.4
9.4
3.5
4.7
1.5
9.3
3.6
4.2
1.6
9.4
3.7
3.7
1.7
8.6
3.9
3.4
1.8
8.5
4.2
2.8
1.9
8.4
4.6
2.5
2.0
8.2
4.8
2.1
2.1
8.1
4.9
1.8
2.3
7.9
5.0
1.6
2.5
7.5
5.1
1.3
2.6
7.0
5.7
1.0
2.6
6.9
5.8
0.5
2.7
6.3
6.0
0.0
2.7
6.2
6.7
-0.5
2.9 3.0
5.9 5.3
7.0
-1.0
112
Kapitel 12. Regressionsanalyse
Kapitel 13
Zeitreihen
Bei den Verfahren der mathematischen Statistik sind wir in den vorangegangenen Kapiteln
meistens davon ausgegangen, dass die vorliegenden Stichprobenwerte x1 , . . . , xN unabhängig
voneinander sind und dem gleichen Verteilungsgesetz gehorchen. Wir sagen, die Stichprobenwerte sind i.i.d1 . Diese Bedingungen können dann verletzt sein, wenn die Stichprobe aus
zeitlich aufeinander folgenden Beobachtungen eines Merkmals besteht, d.h., wenn eine so
genannte Zeitreihe vorliegt.
Definition 13.0.1. Eine Zeitreihe ist eine zeitlich geordnete Folge (xt ) mit t = 1, 2, 3, . . . , N
von Messwerten xt , die zur Zeit t aufgenommen wurden.
Zeitreihen kommen in der Natur- und Ingenieurwissenschaften, der Ökonomie2 und Medizin
vor. Sie werden in Form von Datensammlungen oder grafischen Darstellungen veröffentlicht.
Wir geben einige Beispiele aus unterschiedlichen Anwendungsgebieten:
• In einem meteorologischen Institut werden in regelmässigen Abständen die Lufttemperaturen (vgl. Abbildung 7.2.i), Niederschlagsmengen oder Windstärken gemessen.
• In der Umweltforschung werden die täglichen Luftbelastungen durch Messung der Ozon-,
Stickstoffdioxid- und Schwefeldioxidwerte untersucht.
• Bei der maschinellen Herstellung eines Produktes werden die Masse eines Qualitätsmerkmals während des Produktionsprozesses in vorgegebenen Abständen kontrolliert.
• Zur Überwachung der wirtschaftlichen Entwicklung eines Landes werden tägliche, monatliche, jährliche Daten von Preisen, Verkehrs- und Energieaufkommen, Sparguthaben,
Zinsen, Aktienkurse (vgl. Abbildung 1.2.i) gesammelt und ausgewertet.
• In der Medizin werden Fieberkurven von Patienten durch Messungen zu festgelegten
Zeiten angefertigt.
1
i ndipendent and i dentically d istributed
Der Wirtschafts-Nobelpreise 2003 ging an R. F. Engle (1942) und C. W. J. Granger (1932), die zu gleichen
Teilen für ihre Forschungen zur Analyse ökonomischer Zeitreihen ausgezeichnet wurden. In der Begründung
für die Vergabe heisst es, Engle und Granger hätten in den achtziger Jahren des zwanzigsten Jahrhunderts
die Möglichkeiten zur statistischen Verarbeitung von Zeitreihen verbessert. Diese werden in der Wirtschaftswissenschaft als Abfolge von Daten in ihrer chronologischen Abfolge definiert. Engle habe dabei vor allem
bahnbrechende Arbeiten zum besseren Umgang mit sich verändernden und prinzipiell schwankenden Zeitreihen etwa bei Aktienkursen geschaffen. Granger wurde für seine Arbeit an Zeitreihen mit stationären Daten
ausgezeichnet, die nur wenig um einen vorgegebenen Wert schwanken.
2
113
114
Kapitel 13. Zeitreihen
Bei der Beschreibung und Auswertung von Zeitreihen treten folgende Aufgabenstellungen auf:
• Beschreiben der Zeitreihe durch grafische Darstellungen und durch charakteristische
Kenngrössen, mit denen Aussagen über das mittlere Verhalten, über Abhängigkeit benachbarter Beobachtungen, über Periodizität gemacht werden können.
• Kontrolle des zeitlichen Verlaufs (z.B. eines Produktionsprozesses), um Veränderungen
frühzeitig zu erfassen und eventuell erforderliche Eingriffe vorzunehmen (Qualitätskontrolle).
• Anpassung eines geeigneten mathematischen Modells an die Zeitreihe zur Erkennung
von Gesetzmässigkeiten und Interpretation der Ergebnisse.
• Prognosen des zukünftigen Verhaltens.
Im Rahmen dieser kurzen Einführung können wir nur auf wenige Methoden der Zeitreihenanalysis eingehen. Für weiterführende Literatur über Zeitreihen verweise ich auf [4].
13.1
Universelles Beispiel
Um die nachfolgenden Verfahren besser zu verstehen, werden wir hier ein universelles Beispiel
betrachten, das uns im ganzen Kapitel zur Illustration dienen wird.
Beispiel 13.1.1 (Verkauf von australischem Rotwein). Der monatliche Verkauf von australischem Rotwein [in 1000 Liter] zwischen Januar 1980 und Dezember 1991 ist in untenstehender
Tabelle erfasst. In diesem Fall besteht die Zeitreihe aus N = 144 Datenpunkte.
Januar
Februar
März
April
Mai
Juni
Juli
August
September
Oktober
November
Dezember
1980
464
675
703
887
1139
1077
1318
1260
1120
963
996
960
1981
530
883
894
1045
1199
1287
1565
1577
1076
918
1008
1063
1982
544
635
804
980
1018
1064
1404
1286
1104
999
996
1015
1983
615
722
832
977
1270
1437
1520
1708
1151
934
1159
1209
1984
699
830
996
1124
1458
1270
1753
2258
1208
1241
1265
1828
1985
809
997
1164
1205
1538
1513
1378
2083
1357
1536
1526
1376
1986
779
1005
1193
1522
1539
1546
2116
2326
1596
1356
1553
1613
1987
814
1150
1225
1691
1759
1754
2100
2062
2012
1897
1964
2186
1988
966
1549
1538
1612
2078
2137
2907
2249
1883
1739
1828
1868
1989
1138
1430
1809
1763
2200
2067
2503
2141
2103
1972
2181
2344
1990
970
1199
1718
1683
2025
2051
2439
2353
2230
1852
2147
2286
1991
1007
1665
1642
1525
1838
1892
2920
2572
2617
2047
2176
2313
Es scheint, dass der Verkauf über diese Zeitperiode einem Aufwärtstrend folgt. Weiter können
wir ein saisonales Muster mit einem Peak im Juli und und einem kleinen Verkauf im Januar ausmachen. Um dieses Sachverhalt zu untersuchen, fertigen wir zunächst eine grafische
Darstellung der Datenpunkte an (vgl. Abbildung 13.1.i).
13.2
Zerlegung einer Zeitreihe in Komponenten
Aus dem universellen Beispiel 13.1.1 können wir bereits einige charakteristische Eigenschaften
einer Zeitreihe erkennen, die bei der Zerlegung einer Zeitreihe in Komponenten berücksichtigt
werden.
13.3. Schätzung und Elimination des Trends
115
Liter
3000
b
b
b
b
b
b
bb
1500
b
b
b b
b
1000
b
b
b
bbb
b
bb
b b
b
b
bb
b
1980
b
b
b
b
b b
bb bbb
b
b
b
b
b
1982
b
b
b
b
b
bb bb
bb b
b
b
bb
b
b
b
b
b
bb
bb
b
bb
b
b
b
2000
500
bb
b
2500
b
bb
b
b
1984
bbb
b
bb
b
b
b bb
b
1986
b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b b
b b
b
b b
b b
b
b
b
b
b
bb
bb
b
b
b
b
b
b
b
b
b
1988
1990
b
b
1992
Abbildung 13.1.i: Der australische Rotweinverkauf zwischen Januar 1980 und Dezember 1991.
Das additive Trend-Saison-Model ist durch
xt = gt + st + εt ,
mit t ∈ {1, 2, 3, . . . , N }
gegeben. Dabei bezeichnen:
gt den Trend: eine langfristige systematische Änderung des mittleren Verlaufs der Zeitreihe,
wachsend oder fallend in Abhängigkeit der Zeit t, im Spezialfall auch konstant.
st die Saisonkomponente: eine regelmässige, zyklische Schwankung über das Jahr, die Woche, den Tag (allgemein die Saison) mit (meist) unbekannter Periode s.
εt die zufällige Restkomponente: kurzfristige, zufällig um null schwankende Einflüsse oder
Störungen.
Ziel der Zeitreihenanalyse ist es, allein aus den Beobachtungswerten xt , die drei Trendkomponenten wenigstens näherungsweise zu schätzen.
13.3
Schätzung und Elimination des Trends
Der Trend beschreibt die langfristige Entwicklung zeitlicher Verläufe. Für zukünftige Prognosen möchten wir daher den Trend wenigstens näherungsweise bestimmen. Nach Subtraktion der Trendkomponente gt , also nach der so genannten Trendbereinigung können die
Werte xt − gt = st + εt besser untersucht werden. Es gibt eine Vielzahl von Verfahren zur
Schätzung und Eliminatrion der Trendkomponente. Dabei wird die Trendkomponente stets
als nichtzufällig angenommen. Nachfolgend behandeln wir zwei verschiedene Methoden zur
Trendschätzung: Regression und gleitender Durchschnitt.
Schätzung des Trends mit Regression
Globale Trendmodelle sollen für den gesamten betrachteten Zeitbereich gültig sein. Sie eignen
sich vor allem zur Schätzung einfacher, monotoner Trendfunktionen, deren Verlauf schon aus
den Daten ersichtlich ist. Die Modellierung erfolgt in Form eines Regressionsansatzes. Wir
unterscheiden zwei Fälle:
116
Kapitel 13. Zeitreihen
1. Linearer Trend: Falls der betrachtete Zeitraum nicht zu lang ist, wird bei vielen
Modellen der Trend durch eine Gerade
gt = at + b
beschrieben. Die Parameter a und b der Trendgeraden (Regressionsgeraden) müssen
mit Hilfe der Methode der kleinsten Quadrate aus den Daten der Zeitreihe (xt ) geschätzt
werden (vgl. Kapitel 12.2).
2. Nichtlinearer Trend: Wird mit dem linearen Trendmodel kein gutes Resultat erziehlt, oder wenn offensichtlich ein nichtlinearer Trend ersichtlich ist, so wählen wir
eine Trendfunktion gt eines anderen Funktionstyps. Zum Beispiel eine Polynomfunktion
k-ten Grades
gt = a0 + a1 t + · · · + ak tk
mit den k + 1 unbekannten Parametern a0 , a1 , . . . , ak oder eine Exponentialfunktion
gt = abt
mit den beiden unbekannten Parametern a und b. Diese unbekannten Parameter werden
nach der Methode der kleinsten Quadrate aus den Daten der Zeitreihe geschätzt (vgl.
Analysis 4, Kapitel 20.2).
Eine Trendbereinigung der Zeitreihe erfolgt durch Differenzenbildung der ursprünglichen
und der geglätteten Werte der Zeitreihe, das heisst, wir bilden für jedes t den Wert
xt − gt .
Beispiel 13.3.1. Beim australischen Rotweinverkauf (vgl. Beispiel 13.1.1) drängt sich ein
lineares Trendmodel auf. Wir schätzen also den Regressionskoeffizienten a und die Regressionskonstante b der Regressionsgeraden, die am besten zu den Daten des Weinverkaufs passt.
Es ergibt sich die Trendkomponente
gt = 9.402 t + 806.770
(vgl. Abbildung 13.3.i). Danach bereinigen wir die Zeitreihe vom Trend, indem wir für jedes
Liter
Liter
1500
3000
b
b
b
2500
b
b
2000
b
b
bb
1500
b
b
b b
b
1000
b
b
b
bbb
b
bb
bb
500
b
b
b
b
b
b
b b
b
b
b
b b
bbb
bb
b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
bbb
bb bb
bb b
b
b
b
bb
b
b
b
bb
b
b
b
b
bb
b
bb
b
b
b bb
b
mt
b
bb
b
b
b
b
b
b
b
b b
b b
b
b b
b b
b
b
b
b
b
b
1000
bb
b
b
b
b
b b
b
0
bb
1980
b
b
−500
b
−1000
b
bb
500
b
b
b
b
b
b
bb
b
b
b
b
b
b
b
b
bb
b
b
bb
bbb
b
b
b
b b
bb
bb
b
b
b
b
b
b
b b
bb
bbb
1982b
b
b
b
b
b
b
b
b
b
b bb
1984b
b
b
b
b
b
b
b
b
b
b
bb b
b
b
b
bb
b
bb b
b
bbb b bb
bb
b
bbb
1986
b
bb
b
b
b
b
b
b
b
b
b
b
bbb
1988
b
b
b b
b b
b
b b
b
b
b
b
1990b
b
b
b
b
bb
b
b
b b
b
bb
b
b
bb
b
b
b
1992
bb
b
b
b
b
−1500
1980
1982
1984
1986
1988
1990
1992
Abbildung 13.3.i: Der Trend beim australischen Rotweinverkauf zwischen Januar 1980 und Dezember 1991.
Abbildung 13.3.ii: Der mit dem linearen
Trend bereinigte australischen Rotweinverkauf.
t ∈ {1, . . . , 144} die Differenz xt − gt = xt − (9.402 t + 806.770) bilden. In Abbildung 13.3.ii
sehen wir den australischen Rotweinverkauf, der von einem linearen Trend bereinigt wurde.
Es handelt sich dabei um nichts anderes als die Residuen der Regressionsrechnung.
13.3. Schätzung und Elimination des Trends
117
Schätzung des Trends mit gleitendem Durchschnitt – Moving Average
Während wir im vorangegangenen Kapitel den Trend global über die gesamte Zeitreihe
geschätzt haben, verfolgen wir nun das Anliegen, mit Hilfe von gleitenden Durchschnitten (Moving Averages) eine stückweise lokale Glättung der Zeitreihe durchzuführen. Hierbei
wird in kleinen Zeitintervallen eine lokale Anpassung vorgenommen, indem jeder Beobachtungswert xt durch einen Wert x̄t , ein gewichtetes Mittel aus xt und benachbarten Werten von
xt , ersetzt wird. Auf diese Weise können grosse unregelmässige Schwankungen der Zeitreihe
ausgeglichen und die glatte Komponente kann approximiert werden.
Definition 13.3.1. Das arithmetische Mittel der 2m + 1 Werte xt−m , . . . , xt , . . . , xt+m
x̄t =
m
X
1
xt+i
2m + 1
i=−m
für t ∈ {m + 1, . . . , N − m}
heisst gleitender Durchschnitt der ungeraden Ordnung 2m + 1, mit m < N für den
Wert xt einer Zeitreihe; und


m−1
X
1 1
1
für t ∈ {m + 1, . . . , N − m}
xt−m +
xt+i + xt+m 
x̄t =
2m 2
2
i=−(m−1)
heisst gleitender Durchschnitt der geraden Ordnung 2m, mit m < N für den Wert xt
einer Zeitreihe.
Die dadurch geglättete Zeitreihe x̄m+1 , . . . , x̄N −m besitzt nur noch N − 2m Werte, da an den
Enden jeweils m Werte wegfallen. Es ist einleuchtend, dass die Glättung der Zeitreihe umso
stärker ist, je mehr Werte jeweils zur Glättung herangezogen werden.
Wenn die Periode s der Saisonkomponenete st bekannt ist, dann bietet sich ein gleitender
Durchschnitt der Ordnung s an. Zum Beispiel ist bei Monatsdaten s = 12, also verwenden
wir den gleitenden 12-Monats-Durchschnitt
1 1
1
x̄t =
xt−6 + xt−5 + · · · + xt+5 + xt+6 ,
12 2
2
bei Wochendaten den gleitenden Siebnerdurchschnitt
1
x̄t = (xt−3 + xt−2 + xt−1 + xt + xt+1 + xt+2 + xt+3 ) .
7
oder bei Quartalsdaten den gleitenden Viererdurchschnitt
1 1
1
x̄t =
xt−2 + xt−1 + xt + xt+1 + xt+2 .
4 2
2
Eine Trendbereinigung der Zeitreihe erfolgt durch Differenzenbildung der ursprünglichen
und der geglätteten Werte der Zeitreihe, das heisst, wir bilden für jedes t den Wert
xt − x̄t .
Beispiel 13.3.2. Beim australischen Rotweinverkauf (vgl. Beispiel 13.1.1) drängt sich ein
gleitender 12-Monats-Durchschnitt zur Schätzung des Trends auf (vgl. Abbildung 13.3.iii).
Danach bereinigen wir die Zeitreihe vom Trend, indem wir für jedes t ∈ {7, . . . , 138} die
Differenz xt − x̄t bilden. Die sechs Randwerte auf beiden Seiten werden einfach weggelassen.
In Abbildung 13.3.iv sehen wir den australischen Rotweinverkauf, der von einem gleitenden
12-Monats-Durchschnitt bereinigt wurde.
118
Kapitel 13. Zeitreihen
Liter
Liter
1500
3000
b
2000
1500
1000
b
1000
2500
b
b
500
b
bbb
bbb
bbb
bbbbbbbbbbb bbb bbbbbbbbbb bbbbb
bb
bb
bbbbbb
bb
bbbbbbbbbb
bbb
b
bbbbbbbb
bbbbbbbbbbbb
bbb
bbbbbbbbb
bbbb
bbbbbbbbbb
bbbbbbbbbbbbbb
bbbbbbbb
0
1980
bb
b
b
b b
bbb
b
b
b
bb
b
−500
b
b
b
b
bb
b
b b
bbb
bb
b
1982
b
b
b
b
b
b
b
b
b
b
b
bb
b
b
b
b
b
b b
1984
b
b
bb bb
bb b
bb
b
bb
b
b
b
bb
bb
b
bbb
bbb b bb
1986b
b
b
b
bb
b
bb
b
1988
bb
b
b
b bb
b
b
b
b
b
b
b
b
b
b
b b
bb
b
bb
b
bb
bb
b
bb
b
b
b
1990
1992
b
b
b
−1000
500
−1500
1980
1982
1984
1986
1988
1990
1992
Abbildung 13.3.iii: Gleitender 12-MonatsDurchschnitt beim australischen Rotweinverkauf.
Abbildung 13.3.iv: Trendbereinigte Zeitreihe mit der 12-Monats-Durchschnitt Methode.
Aufgabe
Aufgabe 13.3.1. Nachfolgende Tabelle zeigt die Bevölkerung in den USA [in 1000] zwischen
1790 und 2000, die alle zehn Jahre aufgenommen wurde. Quelle: www.census.gov
1790 1800
1810
1820
1830
1840
1850
1860
1870
1880
1890
3929 5308
7239
9638 12861 17063 23192 31443 38558 50189 62980
1990 1910
1920
1930
1940
1950
1960
1970
1980
1990
2000
76212 92228 106020 123200 132160 151330 179320 203300 226540 248710 281420
a. Bereinigen Sie diese Zeitreihe mit einer Regression von ihrer Trendkomponente. Wählen
Sie das beste Model, d.h. polynomial, logarithmisch, exponentiel.
b. Bereinigen Sie diese Zeitreihe mit einem gleitenden Durchschnitt der Ordnung 3 von
ihrer Trendkomponente.
13.4
Schätzung und Elimination der Saisonkomponente
Wir nehmen an, dass die Zeitreihe entweder keinen Trend aufweisst, oder mit einem der
in Kapitel 13.3 beschriebenen Verfahren vom Trend bereinigt wurde. Zusätzlich gehen wir
davon aus, dass die Saisonkomponente st eine konstante nicht zufällige Saisonfigur hat, d.h.,
die saisonalen Schwankungen in der trendbereinigten Zeitreihe sehen alle ungefähr gleich aus.
Wir bezeichnen die trendbereinigte Zeitreihe wieder mit (xt ), so können wir eine Schätzung
für die Saisonkomponente und damit eine saisonbereinigte Zeitreihe durch das folgende, so
genannte Phasendurchschnittsverfahren erhalten.
Dazu betrachten wir eine Zeitreihe mit Periode s und gehen davon aus, dass die Beobachtungswerte für m Perioden zur Verfügung stehen, d.h., es gilt N = m · s. Nun werden die
arithmetischen Mittel
m−1
1 X
xk+i·s
x̄k =
m
i=0
mit k ∈ {1, . . . , s} aller xt -Werte gebildet, die zur k-ten Saison gehören, zum Beispiel für
den Februar (mit k = 2) das arithmetische Mittel aller m Februarwerte (vgl. untenstehende
Tabelle und Abbildung 13.4.i).
13.4. Schätzung und Elimination der Saisonkomponente
119
Die Saisonkomponente st wird dann geschätzt durch den Saisonindex für t ∈ {1, . . . , s}
s
¯
ŝt = x̄t − x̄
mit
¯=
x̄
1X
x̄k (Gesamtmittel)
s
k=1
und für t > s durch periodische Fortsetzung ŝt = ŝt−s . Handelt es sich bei der Zeitreihe xt
¯ = 0.
bereits um eine linear trendbereinigte Zeitreihe, dann ist natürlich das Gesamtmittel x̄
3
Die Saisonbereinigte Zeitreihe ist durch xt − ŝt mit t ∈ {1, . . . , N } gegeben.
Beispiel 13.4.1. Beim australischen Rotweinverkauf (vgl. Beispiel 13.3.1), den wir bereits
linear trendbereinigt haben, bilden wir nun mit dem Phasendurchschnittsverfahren die 12
arithmetischen Durchschnittsweinverkäufe x̄k für jeden Monat k ∈ {1, . . . , 12} (vgl. letzte
Spalte der Tabelle).
1980 1981 1982 1983 1984 1985 1986
-352 -399 -498 -540 -568 -571 -714
-151 -55 -416 -442 -447 -393 -498
-132 -54 -257 -341 -290 -235 -319
43
88 -90 -206 -172 -203
1
285 232 -61
78 153 120
8
214 311 -25 235 -44
86
6
445 580 306 309 429 -59 566
378 582 178 488 925 637 767
229
72 -13 -79 -135 -99
28
62 -96 -127 -305 -111
71 -222
86 -15 -140 -90 -96
52 -34
40
31 -130 -49 457 -108
16
Januar
Februar
März
April
Mai
Juni
Juli
August
September
Oktober
November
Dezember
1987
-792
-465
-400
57
115
101
438
390
331
206
264
477
1988 1989 1990 1991
-753 -694 -974 -1050
-179 -411 -755 -402
-200 -41 -245 -434
-135 -97 -290 -560
322 331
43 -257
371 188
60 -212
1132 615 438 806
464 244 343 449
89 196 210 485
-64
56 -177
-95
15 255 109
25
46 409 238 152
x̄k
-658.8
-384.4
-245.7
-130.4
114.1
107.5
500.5
487.1
109.5
-66.8
35.9
131.6
¯=0
x̄
Danach bilden wir die periodisch fortgesetzte Saisonkomponente ŝt (vgl. Abbildung 13.4.i).
Schlussendlich berechnen wir die trend- und saisonbereinigte Zeitreihe
εt = xt − gt − ŝt
mit t ∈ {1, . . . , 144}.
Es bleibt nur noch die zufällige Restkomponente εt übrig (vgl. Abbildung 13.4.ii).
Liter
Liter
1500
1500
1000
1000
bb
500
cbbc
bb b b
b
b
0
1980bb
b
−500
b
b
cbbc b
c c
c
b
c
b
bc
bc
cb
bc
bb
c
c
bb
c
c
b
bb
c
c c
c b
c
b
c
b
1982bcbc
c
b
c
b
b
bb
c
c c
c b
c
b
c
b
c
b
c
b
b
c
c
b
bb
c
c
bb
c
c
b
bb
c
c c
c b
c
b
c
b
1984bcbc
c
b
c
b
b
bb
c
c c
c b
c
b
c
b
c
b
c
b
b
c
c
b
bb
c
c
bb
c
c
b
bb
c
c c
c b
c
b
c
b
1986bcbc
c
b
c
b
b
bb
c
c c
c b
c
b
c
b
c
b
c
b
b
c
c
b
bb
c
c
bb
c
c
b
bb
c
c c
c b
c
b
c
b
1988bcbc
c
b
c
b
b
bb
c
c c
c b
c
b
c
b
c
b
c
b
b
c
c
b
bb
c
c
b
bb
c
c c
c b
c
b
c
b
1990bcbc
c
b
c
b
b
cbbc
500
cbbc bc cb
bc
bc
bc
c
b
cb
1992
c
b
b
b
b
b
b
b
b
b
b
b
b
b b
b
b
bb
b b
b bb b b
bb
b
bb
b
b bb
b b
b b bb
b bb
b
b
bb bb
b
b
b
b
b
b
b
b
bb
b bb
b bbbb bb b
b
bbb bb
b bb
b b b bbbbb
0
b b
bb
b bbbb
bb
b
b
b
b
b
b
b
b
b
b
b
b bb b bb b
b
b
b
b
b b1984
b
1980
1982 bbb b b
1988
1990b b
1992
b1986
b
b
b
b
b b
b
b
b
b bb
−500
b
−1000
−1000
−1500
−1500
Abbildung 13.4.i: Durchschnittliches Saisonbild des (linear) trendbereinigten Rotweinverkaufs periodisch fortgesetzt.
Abbildung 13.4.ii: Saison- und (linear)
trendberinigter australischen Rotweinverkauf.
3
Die Zeitreihe xt sei schon trendbereinigt.
120
Kapitel 13. Zeitreihen
Aufgabe
Aufgabe 13.4.1. Die tödlichen Unfälle in den USA pro Monat in den Jahren 1973-1978, die
in untenstehender Tabelle aufgeliestet sind, zeigen ein starkes saisonales Muster. Wir stellen
ein Maximum für jedes Jahr im Juli fest und ein Minimum im Februar. Ein Trend ist kaum
auszumachen. Bereinigen Sie diese Zeitreihe von ihrer Saisonkomponente.
Januar
Februar
März
April
Mai
Juni
Juli
August
September
Oktober
November
Dezember
13.5
1973 1974 1975 1976 1977 1978
9007 7750 8162 7717 7792 7836
8106 6981 7306 7461 6957 6892
8928 8038 8124 7776 7726 7791
9137 8422 7870 7925 8106 8129
10017 8714 9387 8634 8890 9115
10826 9512 9556 8945 9299 9434
11317 10120 10093 10078 10625 10484
10744 9823 9620 9179 9302 9827
9713 8743 8285 8037 8314 9110
9938 9129 8433 8488 8850 9070
9161 8710 8160 7874 8265 8633
8927 8680 8034 8647 8796 9240
Prognose
Nun haben wir die ursprüngliche Zeitreihe
xt = gt + st + εt
mit t ∈ {1, . . . , N }
in ihre additiven Komponenten zerlegt. Nach der Subtraktion der Trend- gt und der periodisch fortgesetzten Saisonkomponente ŝt bleibt nur noch die zufällige Restkomponente
εt = xt −gt −st übrig. Diese sollte jetzt, wenn unser Modell gut gewählt wurde, keine Struktur
mehr aufzeigen (vgl. Abbildung 13.4.ii). Nun könnte diese Restkomponente als Realisierung
eines stochastischen Prozesses weiter untersucht werden. Zum Beispiel interessiert nun, ob die
Restkomponente zufällig ist (vgl. Kapitel 7.2).
Wir wollen uns hier mit der wichtigen Aufgabe der Prognose oder Vorhersage zukünftiger
Beobachtungswerte der Zeitreihe (xt ) mit t ∈ {1, . . . , N } für die Zeitpunkte t ∈ {N, N +1, N +
2, . . .} auseinander setzen. So möchten wir z.B. meteorologische, hydrologische oder Umweltdaten, Produktions- oder andere ökonomische Daten über den beobachteten Zeitraum hinaus
prognostizieren. Dazu dienen Prognoseverfahren. Bei diesen gehen wir davon aus, dass sich
die vorliegende Zeitreihe in naher Zukunft wie in der Vergangenheit verhalten wird. Dass dies
nicht so sein muss, zeigt der Aktienkurs der Vodafone Group deutlich (vgl. Abbildung 1.2.i).
Also Achtung! Vorhersagen sind im besten Fall nur kurzfristig verantwortbar.
Definition 13.5.1. Eine Prognose oder Vorhersage ist eine von der Zeitreihe (xt ) abhängige Schätzung des Wertes xN +h , wobei h ≥ 1, die so genannte h-Schritt-Prognose.
Um den Wert xN +h zu schätzen, benutzen wir unser Modell und setzen4
x̂N +h = gN +h + ŝN +h ,
4
Das Symbol ˆ soll andeuten, dass es sich bei x̂N+h um einen Schätzwert von xN+h handelt.
13.5. Prognose
121
wobei gN +h die Regressionsfunktion des Trends und ŝN +h die periodisch fortgesetzte Saisonkomponente der Zeitreihe (xt ) an der Stelle t = N + h bezeichnet. Die zufällige Restkomponente ignorieren wir bei diesem einfachen Modell, da sie sich im Mittel ungefähr aufhebt.
Beispiel 13.5.1. Beim australischen Rotweinverkauf (vgl. Beispiel 13.3.1) haben wir die
Trend- und Saisonkomponente bestimmt. Nun können wir diese beiden extrapolieren, dies in
der Annahme, dass der australische Wein auf dem Weltmarkt in Zukunft der gleichen Nachfrage ausgesetzt ist, wie in der Vergangenheit. Wir erhalten die folgenden prognostizierten
Weinmengen [in 1000 Liter] für das Jahr 1992:
Jan. 92 Feb. 92 Mrz. 92 Apr. 92 Mai 92 Jun. 92 Jul. 92 Aug. 92 Sep. 92 Okt. 92 Nov. 92 Dez. 92
x̂144+1 x̂144+2 x̂144+3 x̂144+4 x̂144+5 x̂144+6 x̂144+7 x̂144+8 x̂144+9 x̂144+10 x̂144+11 x̂144+12
1511
1795
1943
2068 2322 2325 2727
2723
2355
2188
2300
2405
Es sei an dieser Stelle noch einmal ausdrücklich darauf hingewiesen, dass Prognosen für die
Zukunft mit sehr grosser Vorsicht zu geniessen sind. Im besten Fall sind Prognosen für die
nahe Gegenwart zu vertreten. Die Fehlerbalken der prognostizierten Werte wachsen mit zunehmender Zeit h exponentiel an.
Liter
b
b
b
b
bb
1500
b
b
b b
b
1000
b
b
b
bbb
b
bb
bb
b
1980
b
b
b
b
b
b
b
b b
b
b
b
b b
bb bbb
b
b
b
1982
b
b
b
b
b
b
bb
b
b
b
b
b
1984
b b
bbb b
bb bb
bb b
b
b
b
bb
bb
b
bb
b
b
b
2000
500
bb
b
2500
b
bb
b
bb
b
b
b
1986
b
bb
b
b
b
b
b
b
b
b
b
b
b
bb
b
b
b
b b
b b
b
b b
b b
b
b
b
b
b
bb
b
b
b
b
b
bb
b
b
b
b
1988
1990
Prognose
3000
b
b
1992
1993
Abbildung 13.5.i: Das mit einer Trend- und einer Saisonkomponente angepasste Modell (grau)
des australischen Rotweinverkaufs zwischen Januar 1980 und Dezember 1991 und die Prognose
für das Jahr 1992.
Aufgabe
Aufgabe 13.5.1. Die Zeitreihe der Anzahl internationaler Flugpassagiere für jeden Monat
zwischen Januar 1949 und Dezember 1960 sind in unten stehender Tabelle aufgelistet.
122
Kapitel 13. Zeitreihen
Januar
Februar
März
April
Mai
Juni
Juli
August
September
Oktober
November
Dezember
1949
47185
47707
48828
48598
47958
49053
49972
49972
49127
47791
46444
47707
1950
47449
48363
49488
49053
48283
50039
51358
51358
50626
48903
47362
49416
1951
49767
50106
51818
50938
51475
51818
52933
52933
52149
50876
49836
51120
1952
51417
51930
52627
51985
52095
53845
54381
54889
53423
52523
51475
52679
1953
52781
52781
54638
54596
54337
54931
55759
56058
54681
53519
51930
53033
1954
53181
52364
54596
54250
54553
55759
57104
56802
55568
54337
53132
54337
1955
54889
54510
55872
55947
55984
57526
58972
58493
57430
56131
54681
56276
1956
56490
56240
57589
57462
57621
59243
60234
60039
58721
57236
56021
57236
1957
57526
57071
58749
58522
58721
60450
61420
61463
60014
58493
57203
58171
1958
58289
57621
58916
58522
58944
60753
61964
62246
60014
58833
57366
58201
1959
58861
58348
60064
59814
60403
61570
63063
63261
61377
60088
58916
60039
1960
60331
59687
60379
61334
61570
62823
64329
64069
62305
61334
59661
60684
Führen Sie eine Trend- und Saisonbereinigung der Daten von 1949 bis 1959 durch. Vergleichen
Sie dann die daraus resultierende Prognose für das Jahr 1960 mit der Wirklichkeit.
13.6
Ein-Schritt-Prognose bei bereinigten Zeitreihen
Eine wichtige Rolle vor allem bei kurzfristigen Prognosen spielt das exponentielle Glätten.
Ausgehend von der trend- und saisonfreien Zeitreihe (xt ) mit t = 1, 2, 3, . . . , N erhalten wir
die so genannte Ein-Schritt-Prognose
x̂N +1 = β
N
−2
X
t=0
(1 − β)t xN −t + (1 − β)N −1 x1
= βxN + β(1 − β)xN −1 + · · · + β(1 − β)N −2 x2 + (1 − β)N −1 x1 ,
wobei die Konstante β mit 0 < β < 1 den Glättungsfaktor bezeichnet. Beachten Sie, dass
sich alle Gewichte zu Eins summieren5
β
N
−2
X
t=0
(1 − β)t + (1 − β)N −1 = β
1 − (1 − β)N −1
+ (1 − β)N −1 = 1.
1 − (1 − β)
Die Prognose zur Zeit t = N + 1 ergibt sich also aus dem letzten Wert xN und allen
vorangegangenen Beobachtungswerten. Dabei bestimmt der Glättungsfaktor den Einfluss
zurückliegender Werte auf die Ein-Schritt-Prognose x̂N +1 . Je kleiner β ist, umso mehr Werte
der Zeitreihe werden zur Prognose herangezogen.
Wir diskutieren kurz die Bedeutung des Glättungsfaktors β für die Prognose, die Reaktion
auf irreguläre Schwankungen und den Einfluss der Zeitreihenwerte.
Glättungseffekt der Vorhersage
Reaktion auf irreguläre Schwankungen
Berücksichtigung neuer Zeitreihenwerte
Berücksichtigung älterer Zeitreihenwerte
β klein
gross
klein
schwach
stark
β gross
klein
gross
stark
schwach
Je näher β bei 1 liegt auf ein desto kürzeres Gedächtnis basiert die Prognose. In der Praxis wird
häufig ein β-Wert zwischen 0.1 und 0.3 gewählt. In diesem Fall sind auch weiter zurückliegende
Zeitreihenwerte für die Prognose bedeutsam. Die Verwendung von Computerprogrammen
erlaubt es, durch probieren ein geeignetes β zu finden.
5
Wir benutzen die Summenformel für eine endliche geometrische Reihe, d.h.
Pn
t=0
qn =
1−q n+1
.
1−q
13.6. Ein-Schritt-Prognose bei bereinigten Zeitreihen
123
Aufgabe
Aufgabe 13.6.1. Eine mittelgrosse Autogarage mit einer Markenvertretung machte im letzten Jahr von April bis März den folgenden Umsatz [in SFr].
Apr. Mai Jun. Jul. Aug. Sep. Okt. Nov. Dez. Jan. Feb. Mrz.
70000 53000 87000 80000 81000 82000 71000 69000 87000 78000 65000 68000
Berechnen Sie die Ein-Schritt-Prognose für den Monat April. Wählen Sie dabei β zwischen
0.1 und 0.3. Beachten Sie, dass die Zeitreihe keinen offensichtlichen Trend oder offensichtliches
Saisonmuster zeigt.
124
Kapitel 13. Zeitreihen
Kapitel 14
Fehlerquellen bei statistischen
Untersuchungen
Im Folgenden möchten wir einige Fehlerquellen bei statistischen Untersuchungen aufzeigen.
Fehler bei der Gewinnung des statistischen Materials
• Ungenaue und beschönigende Auskünfte, zum Beispiel Befragung der Arbeiter nach den
Produktionsaussichten, Befragung von Kindern nach der Regelmässigkeit des Zähneputzens.
• Erhebung an verschiedenartigem Material, zum Beispiel Messungen physikalischer Einflüsse an frisch geschäumten Polysterol, ohne Berücksichtigung, dass dieser Kunststoff
von einem Versuchstag zum nächsten reagiert.
• Unhomogenes Material, zum Beispiel eine Statistik der Dehnfähigkeit von Kunststofffolien, bei der PVC-Folien verschiedener Herstellungsart zu einer Gesamtheit zusammengefasst wurde, ist wertlos.
• Änderung der Methode von einer Erhebung zur anderen. Zum Beispiel: je feiner die
Untersuchungsmethoden werden, desto häufiger wird eine Ab- oder Zunahme irgend
einer phsikalischen Grösse beobachtet. Der Schluss auf einen wirklichen Qualitätsabfall
ist falsch.
• Systematische Messfehler, erzeugt durch fehlerhafte Messungen. Zum Beispiel: Welche
Ausbeute bei einer Synthese wirklich resultiert, kann oft nicht genau ermittelt werden,
weil ein Teil einer Flüssigkeit verdunstet oder weil eine Restmenge nicht mehr nachgewiesen werden kann. Der Fehler besitzt immer das gleiche Vorzeichen.
• Extrem gelagerte Einzelwerte, die den Mittelwert so stark beeinflussen, dass dieser
für die Grundgesamtheit nicht mehr typisch ist, z.B. Berechnung des Durchschnittsvermögen der Bewohner einer kleinen Landgemeinde, das sich infolge des Zuzugs eines
Millionärs plötzlich vervielfacht.
125
126
Kapitel 14. Fehlerquellen bei statistischen Untersuchungen
Nicht alle Grössen eignen sich für statistische Auswertungen
Gewisse Messwerte haben nur eine Bedeutung in Bezug auf eine andere Grösse, zum Beispiel
die abzuführende Wärmemenge, d.h. der Kühlwasserbedarf einer exothermen Reaktion muss
in ein Verhältnis zur Grösse des Ansatzes gebracht werden.
Falsche Deutung von statistischen Masszahlen
• Die prozentuale Zu- oder Abnahme kann zweideutig sein. Zum Beispiel: Hat sich etwa
die Häufigkeit eines Verkaufs verdoppelt, so kann dies als 100%ige oder 50%ige Zunahme gedeutet werden, je nachdem, ob die frühere oder die spätere Häufigkeit als 100%
angenommen wird.
• Verschieden definierte Lageparameter können wesentlich voneinander abweichen. Zum
Beispiel: Bei gleicher Einkommensstatistik kann das durchschnittliche Einkommen mit
4000 SFr., 6000 SFr. oder 10000 SFr. angegeben werden, ohne dass ein Fehler begangen
wird. Einmal wurde der Modus1 , das zweite Mal der Median und das dritte Mal das
arithmetische Mittel angegeben.
• Ein Lageparameter ohne Varianzangabe gibt ein falsches Bild. Zum Beispiel: Seit der
”
Einführung eines Stabilisators hat sich die Qualität unserer Produkte um durchschnittlich drei Punkte gehoben.” Der wahre Sachverhalt ist aber: nur bei 12 von 100 Produkten
ist die Qualität überhaupt gehoben worden, um je 25 Punkte, bei allen anderen hatte
das Mittel keinen Einfluss.
Vortäuschen nicht vorhandener Genauigkeit
Zum Beispiel: als Mittelwert der drei Messwerte 13.2, 15.8 und 14.7 wird 14.5667 angegeben.
Korrekter und ehrlicher wäre 14.6.
Falsche Vergleiche
Zum Beispiel: Die amerikanische Marine verlor während des spanisch-amerikanischen Krieges
9 von 1000 Soldaten. In der gleichen Zeitperiode war das Sterbeverhältnis in New York 16 auf
1000. Der naheliegenden Schluss, es sei weniger gefährlich gewesen, in der Marine zu dienen
als in New York zu leben, ist falsch. In der Marine kamen nämlich nur junge und gesunde
Männer ums leben, in New York aber starben vorwiegend alte und kranke Leute.
Falsche Vergleiche
• Unfug mit Prozentzahlen. Zum Beispiel: In dieser Versuchsrerihe lagen 60% aller Mess”
werte über dem Durchschnitt.” Bei einer Nachfrage stellte sich heraus, dass es drei von
fünf Werten waren
• Vergleiche zweier Mittelwerte ohne Angabe der Signifikanz. Zum Beispiel: Die Verkaufs”
zahlen in der Westschweiz sind vom März bis April wesentlich angestiegen.” Die Zahlen
aus denen dieser Schluss fälschlicherweise gezogen wurde, lauten: Im Januar sechs, im
Februar vier, im März drei und im April fünf Stück mehr verkauft.
1
häufigster vorkommender Wert
127
• Änderung der relativen Häufigkeit ohne Angabe der Signifikanz. Zum Beispiel: Bei einer
”
in der Nähe einer neu erstellten Kunststofffabrik weidenden Kuhherde änderte sich das
Geschlechtsverhältnis der Geburten.” Dieser unbegründete Schluss wurde gezogen, weil
auf 12 Kälber 8 männliche und 4 weibliche entfiehlen.
• Falscher Schluss auf die Gestalt einer Verteilungskurve. Zum Beispiel: An 10 Sportlern gleichen Alters wird der Puls nach einer Stunde Fahrradfahren gemessen. Das Histogramm ist zweigipflig. Daraus wird zu unrecht der Schluss gezogen, es gäbe zwei
Populationen.
Auswahleffekte durch nichtrepräsentative Stichproben
• Als Folge mangelnder Beobachtungsmöglichkeit. Zum Beispiel: Eine regionale Kunststoffherstellungs-, Verarbeitungs- und Verbrauchsstatistik leidet fast immer daran, dass
nur wenige Firmen ihre tatsächlichen Zahlen zur Verfügung stellen.
• als folge unbewusster Auswahl
• als Folge nicht zufälliger Auswahl der Stichprobe. Zum Beispiel: Die Produktion einer
Fabrik für Massengüter soll einer Kontrolle unterworfen werden. Die Stichprobe darf
nicht bloss aus den Erzeugnissen der gleichen Arbeitsstunde bestehen.
• als Folge nur teilweise beantworteter Fragebogen
• Als Folge einer nicht ganz eindeutigen Schichtung der Stichprobe. Zum Beispiel: Die
zu beurteilenden Personen werden in Selbstständig- und Unselbstständigerwerbende
eingeteilt. Es gibt aber viele, deren Einteilung unklar ist, etwa bei einem Künstler, der
zum Nebenerwerb Büroarbeit leistet.
Falsche Anwendung eines Tests
• Mathematische Voraussetzungen sind nicht erfüllt. Zum Beispiel: Anwendung eines
Student-t-Tests bei nicht normalverteilter Grundgesamtheit.
• Rechenfehler
Irrtum bei Anwendung eines richtigen Tests
Zum Beispiel: Wird 5% Irrtumswahrscheinlichkeit angenommen, so wird im Mittel bei 5 von
100 statistischen Schlüssen falsch geschlossen.
Falsche Extrapolation
Zum Beispiel: Die Entwicklung des Weltrekordes auf der Marathondistanz bei den Frauen und
den Männern im Artikel aus Der Spiegel (vgl. Kapitel 1.3). Dabei wurde von den Autoren
des Artikels ohne einsichtigen Grund angenommen, dass sich Weltrekorde linear verbessern.
Dies ist aber unmöglich, da dem Menschen physikalische Grenzen gesetzt sind.
128
Kapitel 14. Fehlerquellen bei statistischen Untersuchungen
Weitere Lektüre
Dem interessierten Leser empfehle ich das Buch “So lügt man mit Statistik” von W. Krämer
(vgl. [10]). Hier eine Kurzbeschreibung:2
Dieses Buch, sachkundig und humorvoll, ist hilfreich für alle, die mit Statistik
zu tun haben – sei es beruflich oder als Zeitungsleser. Es zeigt, wo Vorsicht von
Nöten ist. Es stellt dubiose Praktiken bei der grafischen Aufbereitung von Daten bloss, entlarvt die Illusion der Präzision, führt vorsortierte Stichproben, naive
Trends und gefälschte Tests vor, deckt synthetische Superlative und manipulierte Mittelwerte auf, sieht statistischen Falschmünzern bei Basismanipulationen zu.
Vorkenntnisse sind nicht erforderlich: Die vier Grundrechenarten und eine gewisse
Skepsis gegenüber Datenhändlern aller Art genügen.
Oder das Buch “Der Hund, der Eier legt” von H.-P. Beck-Bornholdt und H.-H Dubben (vgl.
[1]). Hier eine Kurzbeschreibung:2
Mit Statistik lässt sich fast alles beweisen - das ist eine Binsenwahrheit. Und doch
vertrauen wir bereitwillig jeder neuen Studie, die Wissenschaftler und Journalisten
verbreiten. Glauben Sie gar nichts!“ ist dagegen das Credo der Autoren, die mit
”
bissigem Humor das gesunde Misstrauen stärken.
2
www.amazon.de
Tafeln
T.1
T.2
T.3
T.4
T.5
T.6
T.7
T.8
T.9
T.10
T.11
T.12
T.13
T.14
T.15
T.16
T.17
T.18
T.19
Verteilungsfunktion Φ(z, 0, 1) der standardisierten Normalverteilung
Quantile zq der standardisierten Normalverteilung . . . . . . . . . .
Quantile tn,q der Student-t-Verteilung mit n Freiheitsgraden . . . . .
Quantile χ2n,q (unten) der χ2 -Verteilung mit n Freiheitsgraden . . . .
Quantile χ2n,q (oben) der χ2 -Verteilung mit n Freiheitsgraden . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden . . . . .
Quantile gk,n,q des Cochran-Tests . . . . . . . . . . . . . . . . . . . .
Quantile kn,q des Vorzeichentests . . . . . . . . . . . . . . . . . . . .
Quantile rm,q des Runtests . . . . . . . . . . . . . . . . . . . . . . . .
Quantile DN,1−α des Lilliefors-Test auf Normalverteilung . . . . . . .
Quantile GN,1−α des Ausreissertests nach Grubbs . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
130
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
Die nachfolgenden Tafeln, ausser Tafel T.18, wurden alle mit Hilfe von Excel berechnet.
Aufgabe
Aufgabe T.1. Fertigen Sie selber mit Hilfe eines Computerprogrammes (z.B. Excel) die
nachfolgenden Tafeln an, ausser Tafel T.18.
129
130
Tafeln
ϕ(z, 0, 1)
ϕ(z, 0, 1)
Φ(z, 0, 1)
0
q
z
z
0
1−q
zq
z
Tabelle T.1: Verteilung Φ(z, 0, 1) der standardisierten Normalverteilung N (0, 1)
z
0.0
0.1
0.2
0.3
0.4
0.00
0.5000
0.5398
0.5793
0.6179
0.6554
0.01
0.5040
0.5438
0.5832
0.6217
0.6591
0.02
0.5080
0.5478
0.5871
0.6255
0.6628
0.03
0.5120
0.5517
0.5910
0.6293
0.6664
0.04
0.5160
0.5557
0.5948
0.6331
0.6700
0.05
0.5199
0.5596
0.5987
0.6368
0.6736
0.06
0.5239
0.5636
0.6026
0.6406
0.6772
0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.5
0.6
0.7
0.8
0.9
0.6915
0.7257
0.7580
0.7881
0.8159
0.6950
0.7291
0.7611
0.7910
0.8186
0.6985
0.7324
0.7642
0.7939
0.8212
0.7019
0.7357
0.7673
0.7967
0.8238
0.7054
0.7389
0.7704
0.7995
0.8264
0.7088
0.7422
0.7734
0.8023
0.8289
0.7123
0.7454
0.7764
0.8051
0.8315
0.7157
0.7486
0.7794
0.8078
0.8340
0.7190
0.7517
0.7823
0.8106
0.8365
0.7224
0.7549
0.7852
0.8133
0.8389
1.0
1.1
1.2
1.3
1.4
0.8413
0.8643
0.8849
0.9032
0.9192
0.8438
0.8665
0.8869
0.9049
0.9207
0.8461
0.8686
0.8888
0.9066
0.9222
0.8485
0.8708
0.8907
0.9082
0.9236
0.8508
0.8729
0.8925
0.9099
0.9251
0.8531
0.8749
0.8944
0.9115
0.9265
0.8554
0.8770
0.8962
0.9131
0.9279
0.8577
0.8790
0.8980
0.9147
0.9292
0.8599
0.8810
0.8997
0.9162
0.9306
0.8621
0.8830
0.9015
0.9177
0.9319
1.5
1.6
1.7
1.8
1.9
0.9332
0.9452
0.9554
0.9641
0.9713
0.9345
0.9463
0.9564
0.9649
0.9719
0.9357
0.9474
0.9573
0.9656
0.9726
0.9370
0.9484
0.9582
0.9664
0.9732
0.9382
0.9495
0.9591
0.9671
0.9738
0.9394
0.9505
0.9599
0.9678
0.9744
0.9406
0.9515
0.9608
0.9686
0.9750
0.9418
0.9525
0.9616
0.9693
0.9756
0.9429
0.9535
0.9625
0.9699
0.9761
0.9441
0.9545
0.9633
0.9706
0.9767
2.0
2.1
2.2
2.3
2.4
0.9772
0.9821
0.9861
0.9893
0.9918
0.9778
0.9826
0.9864
0.9896
0.9920
0.9783
0.9830
0.9868
0.9898
0.9922
0.9788
0.9834
0.9871
0.9901
0.9925
0.9793
0.9838
0.9875
0.9904
0.9927
0.9798
0.9842
0.9878
0.9906
0.9929
0.9803
0.9846
0.9881
0.9909
0.9931
0.9808
0.9850
0.9884
0.9911
0.9932
0.9812
0.9854
0.9887
0.9913
0.9934
0.9817
0.9857
0.9890
0.9916
0.9936
2.5
2.6
2.7
2.8
2.9
0.9938
0.9953
0.9965
0.9974
0.9981
0.9940
0.9955
0.9966
0.9975
0.9982
0.9941
0.9956
0.9967
0.9976
0.9982
0.9943
0.9957
0.9968
0.9977
0.9983
0.9945
0.9959
0.9969
0.9977
0.9984
0.9946
0.9960
0.9970
0.9978
0.9984
0.9948
0.9961
0.9971
0.9979
0.9985
0.9949
0.9962
0.9972
0.9979
0.9985
0.9951
0.9963
0.9973
0.9980
0.9986
0.9952
0.9964
0.9974
0.9981
0.9986
3.0
3.1
3.2
3.3
3.4
0.9987
0.9990
0.9993
0.9995
0.9997
0.9987
0.9991
0.9993
0.9995
0.9997
0.9987
0.9991
0.9994
0.9995
0.9997
0.9988
0.9991
0.9994
0.9996
0.9997
0.9988
0.9992
0.9994
0.9996
0.9997
0.9989
0.9992
0.9994
0.9996
0.9997
0.9989
0.9992
0.9994
0.9996
0.9997
0.9989
0.9992
0.9995
0.9996
0.9997
0.9990
0.9993
0.9995
0.9996
0.9997
0.9990
0.9993
0.9995
0.9997
0.9998
3.5
3.6
3.7
3.8
3.9
0.9998
0.9998
0.9999
0.9999
1.0000
0.9998
0.9998
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
0.9998
0.9999
0.9999
0.9999
1.0000
Tabelle T.2: Das q-Quantil zq der standardisierten Normalverteilung N (0, 1). Es gilt
z1−q = −zq .
q
zq
0.9000
1.28155
0.9500
1.64485
0.9750
1.95996
0.9900
2.32634
0.9950
2.57583
0.9990
3.09024
0.9995
3.29048
Tafeln
131
fn (t)
q
1−q
0
tn,q
t
Tabelle T.3: q-Quantile tn,q der Student-t-Verteilung mit n Freiheitsgraden. Da die Dichte
symmetrisch ist, gilt tn,1−q = −tn,q .
n
1
2
3
4
5
6
7
8
9
0.9000
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
0.9500
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
0.9750
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
q
0.9900
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
0.9950
63.656
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
0.9990
318.289
22.328
10.214
7.173
5.894
5.208
4.785
4.501
4.297
0.9995
636.578
31.600
12.924
8.610
6.869
5.959
5.408
5.041
4.781
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
4.144
4.025
3.930
3.852
3.787
3.733
3.686
3.646
3.610
3.579
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
3.552
3.527
3.505
3.485
3.467
3.450
3.435
3.421
3.408
3.396
3.850
3.819
3.792
3.768
3.745
3.725
3.707
3.689
3.674
3.660
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
1.310
1.303
1.299
1.296
1.294
1.292
1.291
1.697
1.684
1.676
1.671
1.667
1.664
1.662
2.042
2.021
2.009
2.000
1.994
1.990
1.987
2.457
2.423
2.403
2.390
2.381
2.374
2.368
2.750
2.704
2.678
2.660
2.648
2.639
2.632
3.385
3.307
3.261
3.232
3.211
3.195
3.183
3.646
3.551
3.496
3.460
3.435
3.416
3.402
30
40
50
60
70
80
90
100
150
200
300
400
500
600
800
1000
1.290
1.287
1.286
1.284
1.284
1.283
1.283
1.283
1.282
1.660
1.655
1.653
1.650
1.649
1.648
1.647
1.647
1.646
1.984
1.976
1.972
1.968
1.966
1.965
1.964
1.963
1.962
2.364
2.351
2.345
2.339
2.336
2.334
2.333
2.331
2.330
2.626
2.609
2.601
2.592
2.588
2.586
2.584
2.582
2.581
3.174
3.145
3.131
3.118
3.111
3.107
3.104
3.100
3.098
3.390
3.357
3.340
3.323
3.315
3.310
3.307
3.303
3.300
100
150
200
300
400
500
600
800
1000
∞
1.282
1.645
1.960
2.326
2.576
3.090
3.291
∞
132
Tafeln
fn (x)
1−q
q
x
χ2n,q
Tabelle T.4: q-Quantile χ2n,q der χ2 -Verteilung mit n Freiheitsgraden
n
1
2
3
4
5
6
7
8
9
0.005
0.000
0.010
0.072
0.207
0.412
0.676
0.989
1.344
1.735
0.010
0.000
0.020
0.115
0.297
0.554
0.872
1.239
1.647
2.088
0.025
0.001
0.051
0.216
0.484
0.831
1.237
1.690
2.180
2.700
q
0.050
0.004
0.103
0.352
0.711
1.145
1.635
2.167
2.733
3.325
0.100
0.016
0.211
0.584
1.064
1.610
2.204
2.833
3.490
4.168
0.250
0.102
0.575
1.213
1.923
2.675
3.455
4.255
5.071
5.899
0.500
0.455
1.386
2.366
3.357
4.351
5.348
6.346
7.344
8.343
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2.156
2.603
3.074
3.565
4.075
4.601
5.142
5.697
6.265
6.844
2.558
3.053
3.571
4.107
4.660
5.229
5.812
6.408
7.015
7.633
3.247
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
3.940
4.575
5.226
5.892
6.571
7.261
7.962
8.672
9.390
10.117
4.865
5.578
6.304
7.041
7.790
8.547
9.312
10.085
10.865
11.651
6.737
7.584
8.438
9.299
10.165
11.037
11.912
12.792
13.675
14.562
9.342
10.341
11.340
12.340
13.339
14.339
15.338
16.338
17.338
18.338
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
7.434
8.034
8.643
9.260
9.886
10.520
11.160
11.808
12.461
13.121
8.260
8.897
9.542
10.196
10.856
11.524
12.198
12.878
13.565
14.256
9.591
10.283
10.982
11.689
12.401
13.120
13.844
14.573
15.308
16.047
10.851
11.591
12.338
13.091
13.848
14.611
15.379
16.151
16.928
17.708
12.443
13.240
14.041
14.848
15.659
16.473
17.292
18.114
18.939
19.768
15.452
16.344
17.240
18.137
19.037
19.939
20.843
21.749
22.657
23.567
19.337
20.337
21.337
22.337
23.337
24.337
25.336
26.336
27.336
28.336
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
13.787
14.458
15.134
15.815
16.501
17.192
17.887
18.586
19.289
19.996
14.953
15.655
16.362
17.073
17.789
18.509
19.233
19.960
20.691
21.426
16.791
17.539
18.291
19.047
19.806
20.569
21.336
22.106
22.878
23.654
18.493
19.281
20.072
20.867
21.664
22.465
23.269
24.075
24.884
25.695
20.599
21.434
22.271
23.110
23.952
24.797
25.643
26.492
27.343
28.196
24.478
25.390
26.304
27.219
28.136
29.054
29.973
30.893
31.815
32.737
29.336
30.336
31.336
32.336
33.336
34.336
35.336
36.336
37.335
38.335
30
31
32
33
34
35
36
37
38
39
40
50
60
70
80
90
100
20.707
27.991
35.534
43.275
51.172
59.196
67.328
22.164
29.707
37.485
45.442
53.540
61.754
70.065
24.433
32.357
40.482
48.758
57.153
65.647
74.222
26.509
34.764
43.188
51.739
60.391
69.126
77.929
29.051
37.689
46.459
55.329
64.278
73.291
82.358
33.660
42.942
52.294
61.698
71.145
80.625
90.133
39.335
49.335
59.335
69.334
79.334
89.334
99.334
40
50
60
70
80
90
100
Tafeln
133
fn (x)
q
1−q
χ2n,q
x
Tabelle T.5: q-Quantile χ2n,q der χ2 -Verteilung mit n Freiheitsgraden
n
1
2
3
4
5
6
7
8
9
0.750
1.323
2.773
4.108
5.385
6.626
7.841
9.037
10.219
11.389
0.900
2.706
4.605
6.251
7.779
9.236
10.645
12.017
13.362
14.684
0.950
3.841
5.991
7.815
9.488
11.070
12.592
14.067
15.507
16.919
q
0.975
5.024
7.378
9.348
11.143
12.832
14.449
16.013
17.535
19.023
0.990
6.635
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
0.995
7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
0.999
10.827
13.815
16.266
18.466
20.515
22.457
24.321
26.124
27.877
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
12.549
13.701
14.845
15.984
17.117
18.245
19.369
20.489
21.605
22.718
15.987
17.275
18.549
19.812
21.064
22.307
23.542
24.769
25.989
27.204
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
20.483
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.852
23.209
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
25.188
26.757
28.300
29.819
31.319
32.801
34.267
35.718
37.156
38.582
29.588
31.264
32.909
34.527
36.124
37.698
39.252
40.791
42.312
43.819
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
23.828
24.935
26.039
27.141
28.241
29.339
30.435
31.528
32.620
33.711
28.412
29.615
30.813
32.007
33.196
34.382
35.563
36.741
37.916
39.087
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
34.170
35.479
36.781
38.076
39.364
40.646
41.923
43.195
44.461
45.722
37.566
38.932
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
39.997
41.401
42.796
44.181
45.558
46.928
48.290
49.645
50.994
52.335
45.314
46.796
48.268
49.728
51.179
52.619
54.051
55.475
56.892
58.301
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
34.800
35.887
36.973
38.058
39.141
40.223
41.304
42.383
43.462
44.539
40.256
41.422
42.585
43.745
44.903
46.059
47.212
48.363
49.513
50.660
43.773
44.985
46.194
47.400
48.602
49.802
50.998
52.192
53.384
54.572
46.979
48.232
49.480
50.725
51.966
53.203
54.437
55.668
56.895
58.120
50.892
52.191
53.486
54.775
56.061
57.342
58.619
59.893
61.162
62.428
53.672
55.002
56.328
57.648
58.964
60.275
61.581
62.883
64.181
65.475
59.702
61.098
62.487
63.869
65.247
66.619
67.985
69.348
70.704
72.055
30
31
32
33
34
35
36
37
38
39
40
50
60
70
80
90
100
45.616
56.334
66.981
77.577
88.130
98.650
109.141
51.805
63.167
74.397
85.527
96.578
107.565
118.498
55.758
67.505
79.082
90.531
101.879
113.145
124.342
59.342
71.420
83.298
95.023
106.629
118.136
129.561
63.691
76.154
88.379
100.425
112.329
124.116
135.807
66.766
79.490
91.952
104.215
116.321
128.299
140.170
73.403
86.660
99.608
112.317
124.839
137.208
149.449
40
50
60
70
80
90
100
134
Tafeln
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.6: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
1
q
0.990
0.975
0.950
0.900
1
4052
647.8
161.4
39.86
2
4999
799.5
199.5
49.50
3
5404
864.2
215.7
53.59
4
5624
899.6
224.6
55.83
5
5764
921.8
230.2
57.24
6
5859
937.1
234.0
58.20
7
5928
948.2
236.8
58.91
8
5981
956.6
238.9
59.44
9
6022
963.3
240.5
59.86
10
6056
968.6
241.9
60.19
2
0.990
0.975
0.950
0.900
98.50
38.51
18.51
8.526
99.00
39.00
19.00
9.000
99.16
39.17
19.16
9.162
99.25
39.25
19.25
9.243
99.30
39.30
19.30
9.293
99.33
39.33
19.33
9.326
99.36
39.36
19.35
9.349
99.38
39.37
19.37
9.367
99.39
39.39
19.38
9.381
99.40
39.40
19.40
9.392
3
0.990
0.975
0.950
0.900
34.12
17.44
10.13
5.538
30.82
16.04
9.552
5.462
29.46
15.44
9.277
5.391
28.71
15.10
9.117
5.343
28.24
14.88
9.013
5.309
27.91
14.73
8.941
5.285
27.67
14.62
8.887
5.266
27.49
14.54
8.845
5.252
27.34
14.47
8.812
5.240
27.23
14.42
8.785
5.230
4
0.990
0.975
0.950
0.900
21.20
12.22
7.709
4.545
18.00
10.65
6.944
4.325
16.69
9.979
6.591
4.191
15.98
9.604
6.388
4.107
15.52
9.364
6.256
4.051
15.21
9.197
6.163
4.010
14.98
9.074
6.094
3.979
14.80
8.980
6.041
3.955
14.66
8.905
5.999
3.936
14.55
8.844
5.964
3.920
5
0.990
0.975
0.950
0.900
16.26
10.01
6.608
4.060
13.27
8.434
5.786
3.780
12.06
7.764
5.409
3.619
11.39
7.388
5.192
3.520
10.97
7.146
5.050
3.453
10.67
6.978
4.950
3.405
10.46
6.853
4.876
3.368
10.29
6.757
4.818
3.339
10.16
6.681
4.772
3.316
10.05
6.619
4.735
3.297
6
0.990
0.975
0.950
0.900
13.75
8.813
5.987
3.776
10.92
7.260
5.143
3.463
9.780
6.599
4.757
3.289
9.148
6.227
4.534
3.181
8.746
5.988
4.387
3.108
8.466
5.820
4.284
3.055
8.260
5.695
4.207
3.014
8.102
5.600
4.147
2.983
7.976
5.523
4.099
2.958
7.874
5.461
4.060
2.937
7
0.990
0.975
0.950
0.900
12.25
8.073
5.591
3.589
9.547
6.542
4.737
3.257
8.451
5.890
4.347
3.074
7.847
5.523
4.120
2.961
7.460
5.285
3.972
2.883
7.191
5.119
3.866
2.827
6.993
4.995
3.787
2.785
6.840
4.899
3.726
2.752
6.719
4.823
3.677
2.725
6.620
4.761
3.637
2.703
8
0.990
0.975
0.950
0.900
11.26
7.571
5.318
3.458
8.649
6.059
4.459
3.113
7.591
5.416
4.066
2.924
7.006
5.053
3.838
2.806
6.632
4.817
3.688
2.726
6.371
4.652
3.581
2.668
6.178
4.529
3.500
2.624
6.029
4.433
3.438
2.589
5.911
4.357
3.388
2.561
5.814
4.295
3.347
2.538
9
0.990
0.975
0.950
0.900
10.56
7.209
5.117
3.360
8.022
5.715
4.256
3.006
6.992
5.078
3.863
2.813
6.422
4.718
3.633
2.693
6.057
4.484
3.482
2.611
5.802
4.320
3.374
2.551
5.613
4.197
3.293
2.505
5.467
4.102
3.230
2.469
5.351
4.026
3.179
2.440
5.257
3.964
3.137
2.416
10
0.990
0.975
0.950
0.900
10.04
6.937
4.965
3.285
7.559
5.456
4.103
2.924
6.552
4.826
3.708
2.728
5.994
4.468
3.478
2.605
5.636
4.236
3.326
2.522
5.386
4.072
3.217
2.461
5.200
3.950
3.135
2.414
5.057
3.855
3.072
2.377
4.942
3.779
3.020
2.347
4.849
3.717
2.978
2.323
Tafeln
135
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.7: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
1
q
0.990
0.975
0.950
0.900
11
6083
973.0
243.0
60.47
12
6107
976.7
243.9
60.71
13
6126
979.8
244.7
60.90
14
6143
982.5
245.4
61.07
15
6157
984.9
245.9
61.22
16
6170
986.9
246.5
61.35
17
6181
988.7
246.9
61.46
18
6191
990.3
247.3
61.57
19
6201
991.8
247.7
61.66
20
6209
993.1
248.0
61.74
2
0.990
0.975
0.950
0.900
99.41
39.41
19.40
9.401
99.42
39.41
19.41
9.408
99.42
39.42
19.42
9.415
99.43
39.43
19.42
9.420
99.43
39.43
19.43
9.425
99.44
39.44
19.43
9.429
99.44
39.44
19.44
9.433
99.44
39.44
19.44
9.436
99.45
39.45
19.44
9.439
99.45
39.45
19.45
9.441
3
0.990
0.975
0.950
0.900
27.13
14.37
8.763
5.222
27.05
14.34
8.745
5.216
26.98
14.30
8.729
5.210
26.92
14.28
8.715
5.205
26.87
14.25
8.703
5.200
26.83
14.23
8.692
5.196
26.79
14.21
8.683
5.193
26.75
14.20
8.675
5.190
26.72
14.18
8.667
5.187
26.69
14.17
8.660
5.184
4
0.990
0.975
0.950
0.900
14.45
8.794
5.936
3.907
14.37
8.751
5.912
3.896
14.31
8.715
5.891
3.886
14.25
8.684
5.873
3.878
14.20
8.657
5.858
3.870
14.15
8.633
5.844
3.864
14.11
8.611
5.832
3.858
14.08
8.592
5.821
3.853
14.05
8.575
5.811
3.848
14.02
8.560
5.803
3.844
5
0.990
0.975
0.950
0.900
9.963
6.568
4.704
3.282
9.888
6.525
4.678
3.268
9.82
6.488
4.655
3.257
9.77
6.456
4.636
3.247
9.72
6.428
4.619
3.238
9.68
6.403
4.604
3.230
9.64
6.381
4.590
3.223
9.61
6.362
4.579
3.217
9.58
6.344
4.568
3.212
9.55
6.329
4.558
3.207
6
0.990
0.975
0.950
0.900
7.790
5.410
4.027
2.920
7.718
5.366
4.000
2.905
7.657
5.329
3.976
2.892
7.605
5.297
3.956
2.881
7.559
5.269
3.938
2.871
7.519
5.244
3.922
2.863
7.483
5.222
3.908
2.855
7.451
5.202
3.896
2.848
7.422
5.184
3.884
2.842
7.396
5.168
3.874
2.836
7
0.990
0.975
0.950
0.900
6.538
4.709
3.603
2.684
6.469
4.666
3.575
2.668
6.410
4.628
3.550
2.654
6.359
4.596
3.529
2.643
6.314
4.568
3.511
2.632
6.275
4.543
3.494
2.623
6.240
4.521
3.480
2.615
6.209
4.501
3.467
2.607
6.181
4.483
3.455
2.601
6.155
4.467
3.445
2.595
8
0.990
0.975
0.950
0.900
5.734
4.243
3.313
2.519
5.667
4.200
3.284
2.502
5.609
4.162
3.259
2.488
5.559
4.130
3.237
2.475
5.515
4.101
3.218
2.464
5.477
4.076
3.202
2.454
5.442
4.054
3.187
2.446
5.412
4.034
3.173
2.438
5.384
4.016
3.161
2.431
5.359
3.999
3.150
2.425
9
0.990
0.975
0.950
0.900
5.178
3.912
3.102
2.396
5.111
3.868
3.073
2.379
5.055
3.831
3.048
2.364
5.005
3.798
3.025
2.351
4.962
3.769
3.006
2.340
4.924
3.744
2.989
2.330
4.890
3.722
2.974
2.320
4.860
3.701
2.960
2.312
4.833
3.683
2.948
2.305
4.808
3.667
2.936
2.298
10
0.990
0.975
0.950
0.900
4.772
3.665
2.943
2.302
4.706
3.621
2.913
2.284
4.650
3.583
2.887
2.269
4.601
3.550
2.865
2.255
4.558
3.522
2.845
2.244
4.520
3.496
2.828
2.233
4.487
3.474
2.812
2.224
4.457
3.453
2.798
2.215
4.430
3.435
2.785
2.208
4.405
3.419
2.774
2.201
136
Tafeln
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.8: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
1
q
0.990
0.975
0.950
0.900
25
6240
998.1
249.3
62.05
30
6260
1001
250.1
62.26
40
6286
1006
251.1
62.53
50
6302
1008
251.8
62.69
60
6313
1010
252.2
62.79
80
6326
1012
252.7
62.93
100
6334
1013
253.0
63.01
200
6350
1016
253.7
63.17
500
6360
1017
254.1
63.26
∞
6366
1018
254.3
63.33
2
0.990
0.975
0.950
0.900
99.46
39.46
19.46
9.451
99.47
39.46
19.46
9.458
99.48
39.47
19.47
9.466
99.48
39.48
19.48
9.471
99.48
39.48
19.48
9.475
99.48
39.49
19.48
9.479
99.49
39.49
19.49
9.481
99.49
39.49
19.49
9.486
99.50
39.50
19.49
9.489
99.50
39.50
19.50
9.491
3
0.990
0.975
0.950
0.900
26.58
14.12
8.634
5.175
26.50
14.08
8.617
5.168
26.41
14.04
8.594
5.160
26.35
14.01
8.581
5.155
26.32
13.99
8.572
5.151
26.27
13.97
8.561
5.147
26.24
13.96
8.554
5.144
26.18
13.93
8.540
5.139
26.15
13.91
8.532
5.136
26.13
13.90
8.527
5.134
4
0.990
0.975
0.950
0.900
13.91
8.501
5.769
3.828
13.84
8.461
5.746
3.817
13.75
8.411
5.717
3.804
13.69
8.381
5.699
3.795
13.65
8.360
5.688
3.790
13.61
8.335
5.673
3.782
13.58
8.319
5.664
3.778
13.52
8.288
5.646
3.769
13.49
8.270
5.635
3.764
13.46
8.257
5.628
3.761
5
0.990
0.975
0.950
0.900
9.449
6.268
4.521
3.187
9.379
6.227
4.496
3.174
9.29
6.175
4.464
3.157
9.24
6.144
4.444
3.147
9.20
6.123
4.431
3.140
9.16
6.096
4.415
3.132
9.13
6.080
4.405
3.126
9.08
6.048
4.385
3.116
9.04
6.028
4.373
3.109
9.02
6.015
4.365
3.105
6
0.990
0.975
0.950
0.900
7.296
5.107
3.835
2.815
7.229
5.065
3.808
2.800
7.143
5.012
3.774
2.781
7.091
4.980
3.754
2.770
7.057
4.959
3.740
2.762
7.013
4.932
3.722
2.752
6.987
4.915
3.712
2.746
6.934
4.882
3.690
2.734
6.901
4.862
3.678
2.727
6.880
4.849
3.669
2.722
7
0.990
0.975
0.950
0.900
6.058
4.405
3.404
2.571
5.992
4.362
3.376
2.555
5.908
4.309
3.340
2.535
5.858
4.276
3.319
2.523
5.824
4.254
3.304
2.514
5.781
4.227
3.286
2.504
5.755
4.210
3.275
2.497
5.702
4.176
3.252
2.484
5.671
4.156
3.239
2.476
5.650
4.142
3.230
2.471
8
0.990
0.975
0.950
0.900
5.263
3.937
3.108
2.400
5.198
3.894
3.079
2.383
5.116
3.840
3.043
2.361
5.065
3.807
3.020
2.348
5.032
3.784
3.005
2.339
4.989
3.756
2.986
2.328
4.963
3.739
2.975
2.321
4.911
3.705
2.951
2.307
4.880
3.684
2.937
2.298
4.859
3.670
2.928
2.293
9
0.990
0.975
0.950
0.900
4.713
3.604
2.893
2.272
4.649
3.560
2.864
2.255
4.567
3.505
2.826
2.232
4.517
3.472
2.803
2.218
4.483
3.449
2.787
2.208
4.441
3.421
2.768
2.196
4.415
3.403
2.756
2.189
4.363
3.368
2.731
2.174
4.332
3.347
2.717
2.165
4.311
3.333
2.707
2.159
10
0.990
0.975
0.950
0.900
4.311
3.355
2.730
2.174
4.247
3.311
2.700
2.155
4.165
3.255
2.661
2.132
4.115
3.221
2.637
2.117
4.082
3.198
2.621
2.107
4.039
3.169
2.601
2.095
4.014
3.152
2.588
2.087
3.962
3.116
2.563
2.071
3.930
3.094
2.548
2.062
3.909
3.080
2.538
2.055
Tafeln
137
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.9: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
11
q
0.990
0.975
0.950
0.900
1
9.646
6.724
4.844
3.225
2
7.206
5.256
3.982
2.860
3
6.217
4.630
3.587
2.660
4
5.668
4.275
3.357
2.536
5
5.316
4.044
3.204
2.451
6
5.069
3.881
3.095
2.389
7
4.886
3.759
3.012
2.342
8
4.744
3.664
2.948
2.304
9
4.632
3.588
2.896
2.274
10
4.539
3.526
2.854
2.248
12
0.990
0.975
0.950
0.900
9.330
6.554
4.747
3.177
6.927
5.096
3.885
2.807
5.953
4.474
3.490
2.606
5.412
4.121
3.259
2.480
5.064
3.891
3.106
2.394
4.821
3.728
2.996
2.331
4.640
3.607
2.913
2.283
4.499
3.512
2.849
2.245
4.388
3.436
2.796
2.214
4.296
3.374
2.753
2.188
13
0.990
0.975
0.950
0.900
9.074
6.414
4.667
3.136
6.701
4.965
3.806
2.763
5.739
4.347
3.411
2.560
5.205
3.996
3.179
2.434
4.862
3.767
3.025
2.347
4.620
3.604
2.915
2.283
4.441
3.483
2.832
2.234
4.302
3.388
2.767
2.195
4.191
3.312
2.714
2.164
4.100
3.250
2.671
2.138
14
0.990
0.975
0.950
0.900
8.862
6.298
4.600
3.102
6.515
4.857
3.739
2.726
5.564
4.242
3.344
2.522
5.035
3.892
3.112
2.395
4.695
3.663
2.958
2.307
4.456
3.501
2.848
2.243
4.278
3.380
2.764
2.193
4.140
3.285
2.699
2.154
4.030
3.209
2.646
2.122
3.939
3.147
2.602
2.095
15
0.990
0.975
0.950
0.900
8.683
6.200
4.543
3.073
6.359
4.765
3.682
2.695
5.417
4.153
3.287
2.490
4.893
3.804
3.056
2.361
4.556
3.576
2.901
2.273
4.318
3.415
2.790
2.208
4.142
3.293
2.707
2.158
4.004
3.199
2.641
2.119
3.895
3.123
2.588
2.086
3.805
3.060
2.544
2.059
16
0.990
0.975
0.950
0.900
8.531
6.115
4.494
3.048
6.226
4.687
3.634
2.668
5.292
4.077
3.239
2.462
4.773
3.729
3.007
2.333
4.437
3.502
2.852
2.244
4.202
3.341
2.741
2.178
4.026
3.219
2.657
2.128
3.890
3.125
2.591
2.088
3.780
3.049
2.538
2.055
3.691
2.986
2.494
2.028
17
0.990
0.975
0.950
0.900
8.400
6.042
4.451
3.026
6.112
4.619
3.592
2.645
5.185
4.011
3.197
2.437
4.669
3.665
2.965
2.308
4.336
3.438
2.810
2.218
4.101
3.277
2.699
2.152
3.927
3.156
2.614
2.102
3.791
3.061
2.548
2.061
3.682
2.985
2.494
2.028
3.593
2.922
2.450
2.001
18
0.990
0.975
0.950
0.900
8.285
5.978
4.414
3.007
6.013
4.560
3.555
2.624
5.092
3.954
3.160
2.416
4.579
3.608
2.928
2.286
4.248
3.382
2.773
2.196
4.015
3.221
2.661
2.130
3.841
3.100
2.577
2.079
3.705
3.005
2.510
2.038
3.597
2.929
2.456
2.005
3.508
2.866
2.412
1.977
19
0.990
0.975
0.950
0.900
8.185
5.922
4.381
2.990
5.926
4.508
3.522
2.606
5.010
3.903
3.127
2.397
4.500
3.559
2.895
2.266
4.171
3.333
2.740
2.176
3.939
3.172
2.628
2.109
3.765
3.051
2.544
2.058
3.631
2.956
2.477
2.017
3.523
2.880
2.423
1.984
3.434
2.817
2.378
1.956
20
0.990
0.975
0.950
0.900
8.096
5.871
4.351
2.975
5.849
4.461
3.493
2.589
4.938
3.859
3.098
2.380
4.431
3.515
2.866
2.249
4.103
3.289
2.711
2.158
3.871
3.128
2.599
2.091
3.699
3.007
2.514
2.040
3.564
2.913
2.447
1.999
3.457
2.837
2.393
1.965
3.368
2.774
2.348
1.937
138
Tafeln
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.10: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
11
q
0.990
0.975
0.950
0.900
11
4.462
3.474
2.818
2.227
12
4.397
3.430
2.788
2.209
13
4.342
3.392
2.761
2.193
14
4.293
3.359
2.739
2.179
15
4.251
3.330
2.719
2.167
16
4.213
3.304
2.701
2.156
17
4.180
3.282
2.685
2.147
18
4.150
3.261
2.671
2.138
19
4.123
3.243
2.658
2.130
20
4.099
3.226
2.646
2.123
12
0.990
0.975
0.950
0.900
4.220
3.321
2.717
2.166
4.155
3.277
2.687
2.147
4.100
3.239
2.660
2.131
4.052
3.206
2.637
2.117
4.010
3.177
2.617
2.105
3.972
3.152
2.599
2.094
3.939
3.129
2.583
2.084
3.910
3.108
2.568
2.075
3.883
3.090
2.555
2.067
3.858
3.073
2.544
2.060
13
0.990
0.975
0.950
0.900
4.025
3.197
2.635
2.116
3.960
3.153
2.604
2.097
3.905
3.115
2.577
2.080
3.857
3.082
2.554
2.066
3.815
3.053
2.533
2.053
3.778
3.027
2.515
2.042
3.745
3.004
2.499
2.032
3.716
2.983
2.484
2.023
3.689
2.965
2.471
2.014
3.665
2.948
2.459
2.007
14
0.990
0.975
0.950
0.900
3.864
3.095
2.565
2.073
3.800
3.050
2.534
2.054
3.745
3.012
2.507
2.037
3.698
2.979
2.484
2.022
3.656
2.949
2.463
2.010
3.619
2.923
2.445
1.998
3.586
2.900
2.428
1.988
3.556
2.879
2.413
1.978
3.529
2.861
2.400
1.970
3.505
2.844
2.388
1.962
15
0.990
0.975
0.950
0.900
3.730
3.008
2.507
2.037
3.666
2.963
2.475
2.017
3.612
2.925
2.448
2.000
3.564
2.891
2.424
1.985
3.522
2.862
2.403
1.972
3.485
2.836
2.385
1.961
3.452
2.813
2.368
1.950
3.423
2.792
2.353
1.941
3.396
2.773
2.340
1.932
3.372
2.756
2.328
1.924
16
0.990
0.975
0.950
0.900
3.616
2.934
2.456
2.005
3.553
2.889
2.425
1.985
3.498
2.851
2.397
1.968
3.451
2.817
2.373
1.953
3.409
2.788
2.352
1.940
3.372
2.761
2.333
1.928
3.339
2.738
2.317
1.917
3.310
2.717
2.302
1.908
3.283
2.698
2.288
1.899
3.259
2.681
2.276
1.891
17
0.990
0.975
0.950
0.900
3.518
2.870
2.413
1.978
3.455
2.825
2.381
1.958
3.401
2.786
2.353
1.940
3.353
2.753
2.329
1.925
3.312
2.723
2.308
1.912
3.275
2.697
2.289
1.900
3.242
2.673
2.272
1.889
3.212
2.652
2.257
1.879
3.186
2.633
2.243
1.870
3.162
2.616
2.230
1.862
18
0.990
0.975
0.950
0.900
3.434
2.814
2.374
1.954
3.371
2.769
2.342
1.933
3.316
2.730
2.314
1.916
3.269
2.696
2.290
1.900
3.227
2.667
2.269
1.887
3.190
2.640
2.250
1.875
3.158
2.617
2.233
1.864
3.128
2.596
2.217
1.854
3.101
2.576
2.203
1.845
3.077
2.559
2.191
1.837
19
0.990
0.975
0.950
0.900
3.360
2.765
2.340
1.932
3.297
2.720
2.308
1.912
3.242
2.681
2.280
1.894
3.195
2.647
2.256
1.878
3.153
2.617
2.234
1.865
3.116
2.591
2.215
1.852
3.084
2.567
2.198
1.841
3.054
2.546
2.182
1.831
3.027
2.526
2.168
1.822
3.003
2.509
2.155
1.814
20
0.990
0.975
0.950
0.900
3.294
2.721
2.310
1.913
3.231
2.676
2.278
1.892
3.177
2.637
2.250
1.875
3.130
2.603
2.225
1.859
3.088
2.573
2.203
1.845
3.051
2.547
2.184
1.833
3.018
2.523
2.167
1.821
2.989
2.501
2.151
1.811
2.962
2.482
2.137
1.802
2.938
2.464
2.124
1.794
Tafeln
139
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.11: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
11
q
0.990
0.975
0.950
0.900
25
4.005
3.162
2.601
2.095
30
3.941
3.118
2.570
2.076
40
3.860
3.061
2.531
2.052
50
3.810
3.027
2.507
2.036
60
3.776
3.004
2.490
2.026
80
3.734
2.974
2.469
2.013
100
3.708
2.956
2.457
2.005
200
3.656
2.920
2.431
1.989
500
3.624
2.898
2.415
1.979
∞
3.603
2.883
2.405
1.972
12
0.990
0.975
0.950
0.900
3.765
3.008
2.498
2.031
3.701
2.963
2.466
2.011
3.619
2.906
2.426
1.986
3.569
2.871
2.401
1.970
3.535
2.848
2.384
1.960
3.493
2.818
2.363
1.946
3.467
2.800
2.350
1.938
3.414
2.763
2.323
1.921
3.382
2.740
2.307
1.911
3.361
2.725
2.296
1.904
13
0.990
0.975
0.950
0.900
3.571
2.882
2.412
1.978
3.507
2.837
2.380
1.958
3.425
2.780
2.339
1.931
3.375
2.744
2.314
1.915
3.341
2.720
2.297
1.904
3.298
2.690
2.275
1.890
3.272
2.671
2.261
1.882
3.219
2.634
2.234
1.864
3.187
2.611
2.218
1.853
3.165
2.596
2.206
1.846
14
0.990
0.975
0.950
0.900
3.412
2.778
2.341
1.933
3.348
2.732
2.308
1.912
3.266
2.674
2.266
1.885
3.215
2.638
2.241
1.869
3.181
2.614
2.223
1.857
3.138
2.583
2.201
1.843
3.112
2.565
2.187
1.834
3.059
2.526
2.159
1.816
3.026
2.503
2.142
1.805
3.004
2.487
2.131
1.797
15
0.990
0.975
0.950
0.900
3.278
2.689
2.280
1.894
3.214
2.644
2.247
1.873
3.132
2.585
2.204
1.845
3.081
2.549
2.178
1.828
3.047
2.524
2.160
1.817
3.004
2.493
2.137
1.802
2.977
2.474
2.123
1.793
2.923
2.435
2.095
1.774
2.891
2.411
2.078
1.763
2.869
2.395
2.066
1.755
16
0.990
0.975
0.950
0.900
3.165
2.614
2.227
1.860
3.101
2.568
2.194
1.839
3.018
2.509
2.151
1.811
2.967
2.472
2.124
1.793
2.933
2.447
2.106
1.782
2.889
2.415
2.083
1.766
2.863
2.396
2.068
1.757
2.808
2.357
2.039
1.738
2.775
2.333
2.022
1.726
2.753
2.316
2.010
1.718
17
0.990
0.975
0.950
0.900
3.068
2.548
2.181
1.831
3.003
2.502
2.148
1.809
2.920
2.442
2.104
1.781
2.869
2.405
2.077
1.763
2.835
2.380
2.058
1.751
2.791
2.348
2.035
1.735
2.764
2.329
2.020
1.726
2.709
2.289
1.991
1.706
2.676
2.264
1.973
1.694
2.653
2.248
1.960
1.686
18
0.990
0.975
0.950
0.900
2.983
2.491
2.141
1.805
2.919
2.445
2.107
1.783
2.835
2.384
2.063
1.754
2.784
2.347
2.035
1.736
2.749
2.321
2.017
1.723
2.705
2.289
1.993
1.707
2.678
2.269
1.978
1.698
2.623
2.229
1.948
1.678
2.589
2.204
1.929
1.665
2.566
2.187
1.917
1.657
19
0.990
0.975
0.950
0.900
2.909
2.441
2.106
1.782
2.844
2.394
2.071
1.759
2.761
2.333
2.026
1.730
2.709
2.295
1.999
1.711
2.674
2.270
1.980
1.699
2.630
2.237
1.955
1.683
2.602
2.217
1.940
1.673
2.547
2.176
1.910
1.652
2.512
2.150
1.891
1.639
2.489
2.133
1.878
1.631
20
0.990
0.975
0.950
0.900
2.843
2.396
2.074
1.761
2.778
2.349
2.039
1.738
2.695
2.287
1.994
1.708
2.643
2.249
1.966
1.690
2.608
2.223
1.946
1.677
2.563
2.190
1.922
1.660
2.535
2.170
1.907
1.650
2.479
2.128
1.875
1.629
2.445
2.103
1.856
1.616
2.421
2.085
1.843
1.607
140
Tafeln
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.12: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
25
q
0.990
0.975
0.950
0.900
1
7.770
5.686
4.242
2.918
2
5.568
4.291
3.385
2.528
3
4.675
3.694
2.991
2.317
4
4.177
3.353
2.759
2.184
5
3.855
3.129
2.603
2.092
6
3.627
2.969
2.490
2.024
7
3.457
2.848
2.405
1.971
8
3.324
2.753
2.337
1.929
9
3.217
2.677
2.282
1.895
10
3.129
2.613
2.236
1.866
30
0.990
0.975
0.950
0.900
7.562
5.568
4.171
2.881
5.390
4.182
3.316
2.489
4.510
3.589
2.922
2.276
4.018
3.250
2.690
2.142
3.699
3.026
2.534
2.049
3.473
2.867
2.421
1.980
3.305
2.746
2.334
1.927
3.173
2.651
2.266
1.884
3.067
2.575
2.211
1.849
2.979
2.511
2.165
1.819
40
0.990
0.975
0.950
0.900
7.314
5.424
4.085
2.835
5.178
4.051
3.232
2.440
4.313
3.463
2.839
2.226
3.828
3.126
2.606
2.091
3.514
2.904
2.449
1.997
3.291
2.744
2.336
1.927
3.124
2.624
2.249
1.873
2.993
2.529
2.180
1.829
2.888
2.452
2.124
1.793
2.801
2.388
2.077
1.763
50
0.990
0.975
0.950
0.900
7.171
5.340
4.034
2.809
5.057
3.975
3.183
2.412
4.199
3.390
2.790
2.197
3.720
3.054
2.557
2.061
3.408
2.833
2.400
1.966
3.186
2.674
2.286
1.895
3.020
2.553
2.199
1.840
2.890
2.458
2.130
1.796
2.785
2.381
2.073
1.760
2.698
2.317
2.026
1.729
60
0.990
0.975
0.950
0.900
7.077
5.286
4.001
2.791
4.977
3.925
3.150
2.393
4.126
3.343
2.758
2.177
3.649
3.008
2.525
2.041
3.339
2.786
2.368
1.946
3.119
2.627
2.254
1.875
2.953
2.507
2.167
1.819
2.823
2.412
2.097
1.775
2.718
2.334
2.040
1.738
2.632
2.270
1.993
1.707
80
0.990
0.975
0.950
0.900
6.963
5.218
3.960
2.769
4.881
3.864
3.111
2.370
4.036
3.284
2.719
2.154
3.563
2.950
2.486
2.016
3.255
2.730
2.329
1.921
3.036
2.571
2.214
1.849
2.871
2.450
2.126
1.793
2.742
2.355
2.056
1.748
2.637
2.277
1.999
1.711
2.551
2.213
1.951
1.680
100
0.990
0.975
0.950
0.900
6.895
5.179
3.936
2.756
4.824
3.828
3.087
2.356
3.984
3.250
2.696
2.139
3.513
2.917
2.463
2.002
3.206
2.696
2.305
1.906
2.988
2.537
2.191
1.834
2.823
2.417
2.103
1.778
2.694
2.321
2.032
1.732
2.590
2.244
1.975
1.695
2.503
2.179
1.927
1.663
200
0.990
0.975
0.950
0.900
6.763
5.100
3.888
2.731
4.713
3.758
3.041
2.329
3.881
3.182
2.650
2.111
3.414
2.850
2.417
1.973
3.110
2.630
2.259
1.876
2.893
2.472
2.144
1.804
2.730
2.351
2.056
1.747
2.601
2.256
1.985
1.701
2.497
2.178
1.927
1.663
2.411
2.113
1.878
1.631
500
0.990
0.975
0.950
0.900
6.686
5.054
3.860
2.716
4.648
3.716
3.014
2.313
3.821
3.142
2.623
2.095
3.357
2.811
2.390
1.956
3.054
2.592
2.232
1.859
2.838
2.434
2.117
1.786
2.675
2.313
2.028
1.729
2.547
2.217
1.957
1.683
2.443
2.139
1.899
1.644
2.356
2.074
1.850
1.612
∞
0.990
0.975
0.950
0.900
6.635
5.024
3.841
2.706
4.605
3.689
2.996
2.303
3.782
3.116
2.605
2.084
3.319
2.786
2.372
1.945
3.017
2.567
2.214
1.847
2.802
2.408
2.099
1.774
2.639
2.288
2.010
1.717
2.511
2.192
1.938
1.670
2.407
2.114
1.880
1.632
2.321
2.048
1.831
1.599
Tafeln
141
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.13: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
25
q
0.990
0.975
0.950
0.900
11
3.056
2.560
2.198
1.841
12
2.993
2.515
2.165
1.820
13
2.939
2.476
2.136
1.802
14
2.892
2.441
2.111
1.785
15
2.850
2.411
2.089
1.771
16
2.813
2.384
2.069
1.758
17
2.780
2.360
2.051
1.746
18
2.751
2.338
2.035
1.736
19
2.724
2.318
2.021
1.726
20
2.699
2.300
2.007
1.718
30
0.990
0.975
0.950
0.900
2.906
2.458
2.126
1.794
2.843
2.412
2.092
1.773
2.789
2.372
2.063
1.754
2.742
2.338
2.037
1.737
2.700
2.307
2.015
1.722
2.663
2.280
1.995
1.709
2.630
2.255
1.976
1.697
2.600
2.233
1.960
1.686
2.573
2.213
1.945
1.676
2.549
2.195
1.932
1.667
40
0.990
0.975
0.950
0.900
2.727
2.334
2.038
1.737
2.665
2.288
2.003
1.715
2.611
2.248
1.974
1.695
2.563
2.213
1.948
1.678
2.522
2.182
1.924
1.662
2.484
2.154
1.904
1.649
2.451
2.129
1.885
1.636
2.421
2.107
1.868
1.625
2.394
2.086
1.853
1.615
2.369
2.068
1.839
1.605
50
0.990
0.975
0.950
0.900
2.625
2.263
1.986
1.703
2.563
2.216
1.952
1.680
2.508
2.176
1.921
1.660
2.461
2.140
1.895
1.643
2.419
2.109
1.871
1.627
2.382
2.081
1.850
1.613
2.348
2.056
1.831
1.600
2.318
2.033
1.814
1.588
2.290
2.012
1.798
1.578
2.265
1.993
1.784
1.568
60
0.990
0.975
0.950
0.900
2.559
2.216
1.952
1.680
2.496
2.169
1.917
1.657
2.442
2.129
1.887
1.637
2.394
2.093
1.860
1.619
2.352
2.061
1.836
1.603
2.315
2.033
1.815
1.589
2.281
2.008
1.796
1.576
2.251
1.985
1.778
1.564
2.223
1.964
1.763
1.553
2.198
1.944
1.748
1.543
80
0.990
0.975
0.950
0.900
2.478
2.158
1.910
1.653
2.415
2.111
1.875
1.629
2.361
2.071
1.845
1.609
2.313
2.035
1.817
1.590
2.271
2.003
1.793
1.574
2.233
1.974
1.772
1.559
2.199
1.948
1.752
1.546
2.169
1.925
1.734
1.534
2.141
1.904
1.718
1.523
2.115
1.884
1.703
1.513
100
0.990
0.975
0.950
0.900
2.430
2.124
1.886
1.636
2.368
2.077
1.850
1.612
2.313
2.036
1.819
1.592
2.265
2.000
1.792
1.573
2.223
1.968
1.768
1.557
2.185
1.939
1.746
1.542
2.151
1.913
1.726
1.528
2.120
1.890
1.708
1.516
2.092
1.868
1.691
1.505
2.067
1.849
1.676
1.494
200
0.990
0.975
0.950
0.900
2.338
2.058
1.837
1.603
2.275
2.010
1.801
1.579
2.220
1.969
1.769
1.558
2.172
1.932
1.742
1.539
2.129
1.900
1.717
1.522
2.091
1.870
1.694
1.507
2.057
1.844
1.674
1.493
2.026
1.820
1.656
1.480
1.997
1.798
1.639
1.468
1.971
1.778
1.623
1.458
500
0.990
0.975
0.950
0.900
2.283
2.019
1.808
1.583
2.220
1.971
1.772
1.559
2.166
1.929
1.740
1.537
2.117
1.892
1.712
1.518
2.075
1.859
1.686
1.501
2.036
1.830
1.664
1.485
2.002
1.803
1.643
1.471
1.970
1.779
1.625
1.458
1.942
1.757
1.607
1.446
1.915
1.736
1.592
1.435
∞
0.990
0.975
0.950
0.900
2.248
1.993
1.789
1.570
2.185
1.945
1.752
1.546
2.130
1.903
1.720
1.524
2.082
1.866
1.692
1.505
2.039
1.833
1.666
1.487
2.000
1.803
1.644
1.471
1.965
1.776
1.623
1.457
1.934
1.751
1.604
1.444
1.905
1.729
1.587
1.432
1.878
1.708
1.571
1.421
142
Tafeln
fm,n (x)
q
1−q
x
Fm,n,q
Tabelle T.14: q-Quantile Fm,n,q der F -Verteilung mit (m, n) Freiheitsgraden, wobei m die
1
Freiheitsgrade des Zählers und n die Freiheitsgrade des Nenners sind. Es gilt Fn,m,1−q = Fm,n,q
.
m
n
25
q
0.990
0.975
0.950
0.900
25
2.604
2.230
1.955
1.683
30
2.538
2.182
1.919
1.659
40
2.453
2.118
1.872
1.627
50
2.400
2.079
1.842
1.607
60
2.364
2.052
1.822
1.593
80
2.317
2.017
1.796
1.576
100
2.289
1.996
1.779
1.565
200
2.230
1.952
1.746
1.542
500
2.194
1.924
1.725
1.527
∞
2.170
1.906
1.711
1.518
30
0.990
0.975
0.950
0.900
2.453
2.124
1.878
1.632
2.386
2.074
1.841
1.606
2.299
2.009
1.792
1.573
2.245
1.968
1.761
1.552
2.208
1.940
1.740
1.538
2.160
1.904
1.712
1.519
2.131
1.882
1.695
1.507
2.070
1.835
1.660
1.482
2.032
1.806
1.637
1.467
2.006
1.787
1.622
1.456
40
0.990
0.975
0.950
0.900
2.271
1.994
1.783
1.568
2.203
1.943
1.744
1.541
2.114
1.875
1.693
1.506
2.058
1.832
1.660
1.483
2.019
1.803
1.637
1.467
1.969
1.764
1.608
1.447
1.938
1.741
1.589
1.434
1.874
1.691
1.551
1.406
1.833
1.659
1.526
1.389
1.805
1.637
1.509
1.377
50
0.990
0.975
0.950
0.900
2.167
1.919
1.727
1.529
2.098
1.866
1.687
1.502
2.007
1.796
1.634
1.465
1.949
1.752
1.599
1.441
1.909
1.721
1.576
1.424
1.857
1.681
1.544
1.402
1.825
1.656
1.525
1.388
1.757
1.603
1.484
1.359
1.713
1.569
1.457
1.340
1.683
1.545
1.438
1.327
60
0.990
0.975
0.950
0.900
2.098
1.869
1.690
1.504
2.028
1.815
1.649
1.476
1.936
1.744
1.594
1.437
1.877
1.699
1.559
1.413
1.836
1.667
1.534
1.395
1.783
1.625
1.502
1.372
1.749
1.599
1.481
1.358
1.678
1.543
1.438
1.326
1.633
1.507
1.409
1.306
1.601
1.482
1.389
1.292
80
0.990
0.975
0.950
0.900
2.015
1.807
1.644
1.472
1.944
1.752
1.602
1.443
1.849
1.679
1.545
1.403
1.788
1.632
1.508
1.377
1.746
1.599
1.482
1.358
1.690
1.555
1.448
1.334
1.655
1.527
1.426
1.318
1.579
1.467
1.379
1.284
1.530
1.428
1.347
1.261
1.494
1.400
1.325
1.245
100
0.990
0.975
0.950
0.900
1.965
1.770
1.616
1.453
1.893
1.715
1.573
1.423
1.797
1.640
1.515
1.382
1.735
1.592
1.477
1.355
1.692
1.558
1.450
1.336
1.634
1.512
1.415
1.310
1.598
1.483
1.392
1.293
1.518
1.420
1.342
1.257
1.466
1.378
1.308
1.232
1.427
1.347
1.283
1.214
200
0.990
0.975
0.950
0.900
1.868
1.698
1.561
1.414
1.794
1.640
1.516
1.383
1.694
1.562
1.455
1.339
1.629
1.511
1.415
1.310
1.583
1.474
1.386
1.289
1.521
1.425
1.346
1.261
1.481
1.393
1.321
1.242
1.391
1.320
1.263
1.199
1.328
1.269
1.221
1.168
1.279
1.229
1.189
1.144
500
0.990
0.975
0.950
0.900
1.810
1.655
1.528
1.391
1.735
1.596
1.482
1.358
1.633
1.515
1.419
1.313
1.566
1.462
1.376
1.282
1.517
1.423
1.345
1.260
1.452
1.370
1.303
1.229
1.408
1.336
1.275
1.209
1.308
1.254
1.210
1.160
1.232
1.192
1.159
1.122
1.165
1.137
1.113
1.087
∞
0.990
0.975
0.950
0.900
1.773
1.626
1.506
1.375
1.696
1.566
1.459
1.342
1.592
1.484
1.394
1.295
1.523
1.428
1.350
1.263
1.473
1.388
1.318
1.240
1.404
1.333
1.274
1.207
1.358
1.296
1.243
1.185
1.247
1.205
1.170
1.130
1.153
1.128
1.106
1.082
1.000
1.000
1.000
1.000
Tafeln
143
Tabelle T.15: Kritische Werte gk,n,α des Cochran-Tests zum Signifikanzniveau α.
α = 0.01
n
7
8
0.8988 0.8823
0.7335 0.7107
0.6129 0.5897
k
2
3
4
1
0.9999
0.9933
0.9676
2
0.9950
0.9423
0.8643
3
0.9794
0.8831
0.7814
4
0.9586
0.8335
0.7212
5
0.9373
0.7933
0.6761
6
0.9172
0.7606
0.6410
9
0.8674
0.6912
0.5702
10
0.8539
0.6743
0.5536
16
0.7949
0.6059
0.4884
36
0.7067
0.5153
0.4057
144
0.6062
0.4230
0.3251
∞
0.5000
0.3333
0.2500
5
6
7
0.9279
0.8828
0.8376
0.7885
0.7218
0.6644
0.6957
0.6258
0.5685
0.6329
0.5635
0.5080
0.5875
0.5195
0.4659
0.5531
0.4866
0.4347
0.5259
0.4608
0.4105
0.5037
0.4401
0.3911
0.4854
0.4229
0.3751
0.4697
0.4084
0.3616
0.4094
0.3529
0.3105
0.3351
0.2858
0.2494
0.2644
0.2229
0.1929
0.2000
0.1667
0.1429
8
9
10
0.7945
0.7544
0.7175
0.6152
0.5727
0.5358
0.5209
0.4810
0.4469
0.4627
0.4251
0.3934
0.4226
0.3870
0.3572
0.3932
0.3592
0.3308
0.3704
0.3378
0.3106
0.3522
0.3207
0.2945
0.3373
0.3067
0.2813
0.3248
0.2950
0.2704
0.2779
0.2514
0.2297
0.2214
0.1992
0.1811
0.1700
0.1521
0.1376
0.1250
0.1111
0.1000
12
15
20
0.6528
0.5747
0.4799
0.4751
0.4069
0.3297
0.3919
0.3317
0.2654
0.3428
0.2882
0.2288
0.3099
0.2593
0.2048
0.2861
0.2386
0.1877
0.2680
0.2228
0.1748
0.2535
0.2104
0.1646
0.2419
0.2002
0.1567
0.2320
0.1918
0.1501
0.1961
0.1612
0.1248
0.1535
0.1251
0.0960
0.1157
0.0934
0.0709
0.0833
0.0667
0.0500
24
30
40
0.4247
0.3632
0.2940
0.2871
0.2412
0.1915
0.2295
0.1913
0.1508
0.1970
0.1635
0.1281
0.1759
0.1454
0.1135
0.1608
0.1327
0.1033
0.1495
0.1232
0.0957
0.1406
0.1157
0.0898
0.1338
0.1100
0.0853
0.1283
0.1054
0.0816
0.1060
0.0867
0.0668
0.0810
0.0658
0.0503
0.0595
0.0480
0.0363
0.0417
0.0333
0.0250
60
120
∞
0.2151
0.1225
0.0000
0.1371
0.0759
0.0000
0.1069
0.0585
0.0000
0.0902
0.0489
0.0000
0.0796
0.0429
0.0000
0.0722
0.0387
0.0000
0.0668
0.0357
0.0000
0.0625
0.0334
0.0000
0.0594
0.0316
0.0000
0.0567
0.0302
0.0000
0.0461
0.0242
0.0000
0.0344
0.0178
0.0000
0.0245
0.0125
0.0000
0.0167
0.0083
0.0000
α = 0.05
n
7
8
0.8332 0.8159
0.6530 0.6333
0.5365 0.5175
9
0.8010
0.6167
0.5017
10
0.7880
0.6025
0.4884
16
0.7341
0.5466
0.4366
36
0.6602
0.4748
0.3720
144
0.5813
0.4031
0.3093
∞
0.5000
0.3333
0.2500
k
2
3
4
1
0.9985
0.9669
0.9065
2
0.9750
0.8709
0.7679
3
0.9392
0.7977
0.6841
4
0.9057
0.7457
0.6287
5
0.8772
0.7071
0.5895
6
0.8534
0.6771
0.5598
5
6
7
0.8412
0.7808
0.7271
0.6838
0.6161
0.5612
0.5981
0.5321
0.4800
0.5441
0.4803
0.4307
0.5065
0.4447
0.3974
0.4783
0.4184
0.3726
0.4564
0.3980
0.3535
0.4387
0.3817
0.3384
0.4241
0.3682
0.3259
0.4118
0.3568
0.3154
0.3645
0.3135
0.2756
0.3066
0.2612
0.2278
0.2513
0.2119
0.1833
0.2000
0.1667
0.1429
8
9
10
0.6798
0.6385
0.6020
0.5157
0.4775
0.4450
0.4377
0.4027
0.3733
0.3910
0.3584
0.3311
0.3595
0.3286
0.3029
0.3362
0.3067
0.2823
0.3185
0.2901
0.2666
0.3043
0.2768
0.2541
0.2926
0.2659
0.2439
0.2829
0.2568
0.2353
0.2462
0.2226
0.2032
0.2022
0.1820
0.1655
0.1616
0.1446
0.1308
0.1250
0.1111
0.1000
12
15
20
0.5410
0.4709
0.3894
0.3924
0.3346
0.2705
0.3264
0.2758
0.2205
0.2880
0.2419
0.1921
0.2624
0.2195
0.1735
0.2439
0.2034
0.1602
0.2299
0.1911
0.1501
0.2187
0.1815
0.1422
0.2098
0.1736
0.1357
0.2020
0.1671
0.1303
0.1737
0.1429
0.1108
0.1403
0.1144
0.0879
0.1100
0.0889
0.0675
0.0833
0.0667
0.0500
24
30
40
0.3434
0.2929
0.2370
0.2354
0.1980
0.1576
0.1907
0.1593
0.1259
0.1656
0.1377
0.1082
0.1493
0.1237
0.0968
0.1374
0.1137
0.0887
0.1286
0.1061
0.0827
0.1216
0.1002
0.0780
0.1160
0.0958
0.0745
0.1113
0.0921
0.0713
0.0942
0.0771
0.0595
0.0743
0.0604
0.0462
0.0567
0.0457
0.0347
0.0417
0.0333
0.0250
60
120
∞
0.1737
0.0998
0.0000
0.1131
0.0632
0.0000
0.0895
0.0495
0.0000
0.0765
0.0419
0.0000
0.0682
0.0371
0.0000
0.0623
0.0337
0.0000
0.0583
0.0312
0.0000
0.0552
0.0292
0.0000
0.0520
0.0279
0.0000
0.0497
0.0266
0.0000
0.0411
0.0218
0.0000
0.0316
0.0165
0.0000
0.0234
0.0120
0.0000
0.0167
0.0083
0.0000
Die kritischen Werte gk,n,1−α für k und n = N − 1 Freiheitsgrade zum Signifikanzniveau α
berechnen sich mit
Fn,n(k−1),1− αk
gk,n,1−α =
,
Fn,n(k−1),1− αk + (k − 1)
wobei Fm,n,q das q-Quantil der F -Verteilung mit Freiheitsgrad (m, n) darstellt (vgl. Tafeln T.6
bis T.14).
144
Tafeln
Tabelle T.16: Kritische Werte kn,α (links) und kn,1−α = n−kn,α (rechts) des Vorzeichentests
zum Signifikanzniveau α. Ausserhalb der kritischen Werte ist der Effekt gesichert.
n
1
2
3
4
5
6
7
8
9
10
α = 0.025
0
1
0
2
0
3
0
4
0
5
1
5
1
6
1
7
2
7
2
8
Einseitig
α = 0.010
0
1
0
2
0
3
0
4
0
5
0
6
1
6
1
7
1
8
1
9
α = 0.005
0
1
0
2
0
3
0
4
0
5
0
6
0
7
1
7
1
8
1
9
n
51
52
53
54
55
56
57
58
59
60
α = 0.025
19
32
19
33
19
34
20
34
20
35
21
35
21
36
22
36
22
37
22
38
Einseitig
α = 0.010
17
34
18
34
18
35
19
35
19
36
19
37
20
37
20
38
21
38
21
39
α = 0.005
16
35
17
35
17
36
18
36
18
37
18
38
19
38
19
39
20
39
20
40
11
12
13
14
15
16
17
18
19
20
2
3
3
3
4
4
5
5
5
6
9
9
10
11
11
12
12
13
14
14
2
2
2
3
3
3
4
4
5
5
9
10
11
11
12
13
13
14
14
15
1
2
2
2
3
3
3
4
4
4
10
10
11
12
12
13
14
14
15
16
61
62
63
64
65
66
67
68
69
70
23
23
24
24
25
25
26
26
26
27
38
39
39
40
40
41
41
42
43
43
21
22
22
23
23
24
24
24
25
25
40
40
41
41
42
42
43
44
44
45
21
21
21
22
22
23
23
23
24
24
40
41
42
42
43
43
44
45
45
46
21
22
23
24
25
26
27
28
29
30
6
6
7
7
8
8
8
9
9
10
15
16
16
17
17
18
19
19
20
20
5
6
6
6
7
7
8
8
8
9
16
16
17
18
18
19
19
20
21
21
5
5
5
6
6
7
7
7
8
8
16
17
18
18
19
19
20
21
21
22
71
72
73
74
75
76
77
78
79
80
27
28
28
29
29
29
30
30
31
31
44
44
45
45
46
47
47
48
48
49
26
26
27
27
27
28
28
29
29
30
45
46
46
47
48
48
49
49
50
50
25
25
26
26
26
27
27
28
28
29
46
47
47
48
49
49
50
50
51
51
31
32
33
34
35
36
37
38
39
40
10
10
11
11
12
12
13
13
13
14
21
22
22
23
23
24
24
25
26
26
9
9
10
10
11
11
11
12
12
13
22
23
23
24
24
25
26
26
27
27
8
9
9
10
10
10
11
11
12
12
23
23
24
24
25
26
26
27
27
28
81
82
83
84
85
86
87
88
89
90
32
32
33
33
33
34
34
35
35
36
49
50
50
51
52
52
53
53
54
54
30
31
31
31
32
32
33
33
34
34
51
51
52
53
53
54
54
55
55
56
29
29
30
30
31
31
32
32
32
33
52
53
53
54
54
55
55
56
57
57
41
42
43
44
45
46
47
48
49
50
n
14
27
15
27
15
28
16
28
16
29
16
30
17
30
17
31
18
31
18
32
α = 0.05
29
29
30
30
31
32
32
33
33
34
0.01
91
92
93
94
95
96
97
98
99
100
n
36
55
37
55
37
56
38
56
38
57
38
58
39
58
39
59
40
59
40
60
α = 0.05
13
28
14
28
14
29
14
30
15
30
15
31
16
31
16
32
16
33
17
33
α = 0.02
Zweiseitig
12
13
13
14
14
14
15
15
16
16
α=
34
57
35
57
35
58
36
58
36
59
37
59
37
60
38
60
38
61
38
62
α = 0.02
Zweiseitig
33
58
34
58
34
59
35
59
35
60
35
61
36
61
36
62
37
62
37
63
α = 0.01
Das q-Quantil kn,q mit reduziertem Stichprobenumfang n wird aus der Beziehung
P (k+ ≤ kn,q ) =
bestimmt. Es gilt kn,1−q = n − kn,q .
kn,q
X
i=0
P (k+ = i) =
kn,q n
X
n
1
i=0
i
2
≤q
Tafeln
145
Tabelle T.17: Kritische Werte rm, α2 (links) und rm,1− α2 (rechts) des Runtests bei m Pluszeichen zum Signifikanzniveau α. Innerhalb der kritischen Werte gilt Zufälligkeit der Stichprobe.
0.10
2
4
6
7
8
10
11
12
13
15
Zweiseitig
α = 0.05
α=
1
2
1
1
4
1
1
6
1
1
8
1
2
9
2
3
10
2
3
12
3
4
13
4
5
14
4
6
15
5
m
1
2
3
4
5
6
7
8
9
10
α=
1
1
1
2
3
3
4
5
6
6
11
12
13
14
15
16
17
18
19
20
7
8
9
10
11
11
12
13
14
15
16
17
18
19
20
22
23
24
25
26
7
7
8
9
10
11
11
12
13
14
16
18
19
20
21
22
24
25
26
27
6
7
7
8
9
10
10
11
12
13
21
22
23
24
25
26
27
28
29
30
16
17
17
18
19
20
21
22
23
24
27
28
30
31
32
33
34
35
36
37
15
16
16
17
18
19
20
21
22
23
28
29
31
32
33
34
35
36
37
38
31
32
33
34
35
36
37
38
39
40
25
25
26
27
28
29
30
31
32
33
38
40
41
42
43
44
45
46
47
48
23
24
25
26
27
28
29
30
30
31
40
41
42
43
44
45
46
47
49
50
0.02
2
4
6
8
9
11
12
13
15
16
0.10
49
50
52
53
54
55
56
57
58
59
Zweiseitig
α = 0.05
α=
32
51
31
33
52
31
34
53
32
35
54
33
36
55
34
37
56
35
38
57
36
38
59
37
39
60
38
40
61
38
α = 0.01
1
2
1
4
1
6
1
8
1
10
2
11
3
12
3
14
4
15
5
16
m
41
42
43
44
45
46
47
48
49
50
α=
34
35
35
36
37
38
39
40
41
42
0.02
52
54
55
56
57
58
59
60
61
63
17
18
20
21
22
23
25
26
27
28
5
6
7
7
8
9
10
11
11
12
18
19
20
22
23
24
25
26
28
29
51
52
53
54
55
56
57
58
59
60
43
44
45
45
46
47
48
49
50
51
60
61
62
64
65
66
67
68
69
70
41
42
43
44
45
46
47
48
48
49
62
63
64
65
66
67
68
69
71
72
39
40
41
42
43
44
45
46
46
47
64
65
66
67
68
69
70
71
73
74
38
39
40
41
42
42
43
44
45
46
65
66
67
68
69
71
72
73
74
75
14
14
15
16
17
18
19
19
20
21
29
31
32
33
34
35
36
38
39
40
13
14
14
15
16
17
18
19
19
20
30
31
33
34
35
36
37
38
40
41
61
62
63
64
65
66
67
68
69
70
52
53
54
55
56
57
58
58
59
60
71
72
73
74
75
76
77
79
80
81
50
51
52
53
54
55
56
57
58
58
73
74
75
76
77
78
79
80
81
83
48
49
50
51
52
53
54
55
55
56
75
76
77
78
79
80
81
82
84
85
47
48
49
50
50
51
52
53
54
55
76
77
78
79
81
82
83
84
85
86
22
23
24
25
25
26
27
28
29
30
41
42
43
44
46
47
48
49
50
51
21
22
23
24
24
25
26
27
28
29
42
43
44
45
47
48
49
50
51
52
71
72
73
74
75
76
77
78
79
80
61
62
63
64
65
66
67
68
69
70
82
83
84
85
86
87
88
89
90
91
59
60
61
62
63
64
65
66
67
68
84
85
86
87
88
89
90
91
92
93
57
58
59
60
61
62
63
64
64
65
86
87
88
89
90
91
92
93
95
96
56
57
58
58
59
60
61
62
63
64
87
88
89
91
92
93
94
95
96
97
Das q-Quantil rm,q des Runtests mit m Pluszeichen wird aus der Beziehung
rm,q
P (r ≤ rm,q ) =
bestimmt, wobei
f (r) =

2








2




X
r=2
m−1 m−1 (r−1)/2 (r−3)/2
2m
m
m−1 2
(r−2)/2
2m
m
f (r) ≤ q
wenn r ungerade
wenn r gerade.
α = 0.01
29
54
30
55
31
56
32
57
33
58
34
59
35
60
36
61
36
63
37
64
146
Tafeln
Tabelle T.18: Kritische Werte DN,1−α des Lilliefors-Test auf Normalverteilung bei einem
Stichprobenumfang von N zum Signifikanzniveau α. Quelle: [21], Seite 398.
N
4
5
α = 0.10
0.352
0.315
α = 0.05
0.381
0.337
α = 0.01
0.417
0.405
6
7
8
9
10
0.294
0.276
0.261
0.249
0.239
0.319
0.300
0.285
0.271
0.258
0.364
0.348
0.331
0.311
0.294
11
12
13
14
15
0.230
0.223
0.214
0.207
0.201
0.249
0.242
0.234
0.227
0.220
0.284
0.275
0.268
0.261
0.257
16
17
18
19
20
0.195
0.189
0.184
0.179
0.174
0.213
0.206
0.200
0.195
0.190
0.250
0.245
0.239
0.235
0.231
25
30
30 < N
0.165
0.144
0.180
0.161
0.203
0.187
0.805
√
N
0.886
√
N
1.031
√
N
Tafeln
147
Tabelle T.19: Kritische Werte GN,1−α des Ausreissertests nach Grubbs bei einem Stichprobenumfang von N zum Signifikanzniveau α.
N
1
2
3
4
5
6
7
8
9
10
α = 0.10
α = 0.05
α = 0.02
α = 0.01
1.155
1.493
1.749
1.944
2.097
2.221
2.323
2.410
N
51
52
53
54
55
56
57
58
59
60
α = 0.10
2.780
2.787
2.794
2.801
2.808
2.815
2.822
2.828
2.835
2.841
α = 0.05
2.965
2.972
2.980
2.987
2.994
3.001
3.007
3.014
3.021
3.027
α = 0.02
3.189
3.196
3.204
3.212
3.219
3.226
3.233
3.240
3.246
3.253
α = 0.01
3.345
3.353
3.361
3.369
3.376
3.384
3.390
3.398
3.404
3.411
1.148
1.425
1.602
1.729
1.828
1.909
1.977
2.036
1.153
1.463
1.671
1.822
1.938
2.032
2.110
2.176
1.154
1.485
1.725
1.904
2.042
2.152
2.244
2.322
11
12
13
14
15
16
17
18
19
20
2.088
2.134
2.176
2.213
2.248
2.279
2.309
2.336
2.361
2.385
2.234
2.285
2.331
2.372
2.409
2.443
2.475
2.504
2.531
2.557
2.389
2.448
2.500
2.547
2.589
2.628
2.663
2.695
2.725
2.753
2.484
2.549
2.607
2.658
2.705
2.747
2.785
2.821
2.854
2.884
61
62
63
64
65
66
67
68
69
70
2.847
2.853
2.859
2.865
2.871
2.876
2.882
2.887
2.893
2.898
3.033
3.039
3.045
3.051
3.057
3.062
3.068
3.073
3.079
3.084
3.259
3.265
3.271
3.278
3.283
3.289
3.295
3.300
3.306
3.311
3.418
3.424
3.430
3.437
3.443
3.449
3.454
3.460
3.466
3.471
21
22
23
24
25
26
27
28
29
30
2.408
2.429
2.449
2.468
2.486
2.503
2.520
2.536
2.551
2.565
2.580
2.603
2.624
2.644
2.663
2.681
2.698
2.714
2.730
2.745
2.780
2.804
2.827
2.849
2.869
2.889
2.907
2.925
2.942
2.958
2.912
2.938
2.963
2.987
3.009
3.029
3.049
3.068
3.086
3.103
71
72
73
74
75
76
77
78
79
80
2.903
2.908
2.913
2.918
2.923
2.928
2.932
2.937
2.941
2.946
3.089
3.094
3.099
3.104
3.109
3.114
3.118
3.123
3.127
3.132
3.316
3.322
3.327
3.332
3.337
3.341
3.346
3.351
3.355
3.360
3.476
3.482
3.487
3.492
3.497
3.502
3.507
3.511
3.516
3.521
31
32
33
34
35
36
37
38
39
40
2.579
2.592
2.605
2.618
2.630
2.641
2.652
2.663
2.674
2.684
2.760
2.773
2.787
2.799
2.812
2.824
2.835
2.846
2.857
2.868
2.973
2.988
3.002
3.016
3.029
3.041
3.053
3.065
3.077
3.088
3.119
3.135
3.150
3.164
3.178
3.191
3.204
3.216
3.228
3.239
81
82
83
84
85
86
87
88
89
90
2.950
2.955
2.959
2.963
2.967
2.972
2.976
2.980
2.984
2.987
3.136
3.141
3.145
3.149
3.153
3.157
3.161
3.165
3.169
3.173
3.364
3.369
3.373
3.377
3.382
3.386
3.390
3.394
3.398
3.402
3.525
3.530
3.534
3.539
3.543
3.547
3.551
3.555
3.559
3.563
41
42
43
44
45
46
47
48
49
50
2.694
2.704
2.713
2.722
2.731
2.739
2.748
2.756
2.764
2.772
2.878
2.888
2.897
2.906
2.915
2.924
2.933
2.941
2.949
2.957
3.098
3.108
3.118
3.128
3.138
3.147
3.156
3.164
3.172
3.181
3.251
3.261
3.272
3.282
3.292
3.301
3.310
3.319
3.328
3.337
91
92
93
94
95
96
97
98
99
100
2.991
2.995
2.999
3.003
3.006
3.010
3.013
3.017
3.020
3.024
3.177
3.181
3.185
3.188
3.192
3.196
3.199
3.203
3.206
3.210
3.405
3.409
3.413
3.417
3.421
3.424
3.428
3.431
3.435
3.438
3.567
3.571
3.575
3.579
3.582
3.586
3.590
3.593
3.597
3.601
Die kritischen Werte GN,1−α für N Messwerte zum Signifikanzniveau α berechnen sich mit
v
u
t2N −2, α
N − 1u
N
t
,
GN,1−α = √
t2N −2, α + (N − 2)
N
N
wobei tn,q das q-Quantil der Student-t-Verteilung mit n Freiheitsgraden ist (vgl. Tafel T.3).
148
Tafeln
Literaturverzeichnis
[1] H.-P. Beck-Bornholdt und H.-H Dubben, Der Hund, der Eier legt, 6. Auflage, Rowohlt
Taschenbuch Verlag, Hamburg, 2005.
[2] K. Bosch, Großes Lehrbuch der Statistik, Oldenburg Verlag, München, 1996.
[3] K. Bosch, Elementare Einführung in die angewandte Statistik, 7. Auflage, Vieweg
Studium-Basiswissen, 2000.
[4] P. J. Brockwell und R. A. Davis, Introduction to Time Series and Forecasting, 2nd
Edition, Springer Texts in Statistics, 2003.
[5] B. Efron und R. J. Tibshirani, An Introduction to the Bootstrap, Monographs on
Statistics and Applied Probability 57, Chapman & Hall, 1993.
[6] L. Fahrmeir, R. Künstler, I. Pigeot und G.Tutz, Statistik. Der Weg zur Datenanalyse,
Springer-Verlag, Berlin, 2002.
[7] P. Gschwind, Einführung in die Stochastik, Skriptum FHBB, Version 00, 2000.
[8] P. Gschwind, Statistische Methoden, Skriptum FHBB, Version 98, 1998.
[9] T. Heim, Stochastik, Skriptum FHBB, 2003.
[10] W. Krämer, So lügt man mit Statistik, Piper Verlag, 2002.
[11] U. Krengel, Einführung in die Wahrscheinlichkeitstheorie und Statistik, 6. Auflage,
Vieweg Studium-Aufbaukurs Mathematik, 2000.
[12] E. Kreyszig, Statistische Methoden und ihre Anwendungen, Vandenhoeck & Ruprecht,
6. Auflage, 1977.
[13] M. Kühlmeyer, Statistische Auswertungsmethoden für Ingenieure, Springer-Verlag,
2001.
[14] D. C. Montgomery, Introduction to Statistical Quality Control, 4th Edition, John Wiley
& Sons, Inc., 2001.
[15] L. Papula, Mathematik für Ingenieure und Naturwissenschaftler, Band 2, 10. Auflage,
Viewegs Fachbücher der Technik, 2001.
[16] L. Papula, Mathematik für Ingenieure und Naturwissenschaftler, Band 3, 4. Auflage,
Viewegs Fachbücher der Technik, 2001.
149
150
Literaturverzeichnis
[17] J. A. Rice, Mathematical Statistics and Data Analysis, 2nd Edition, Duxbury Press,
1995.
[18] L. Sachs, Angewandte Statistik - Anwendung statistischer Methoden, Springer, 10. Auflage, 2002.
[19] D. Schmid, Tabellenfunktionen in Visual Basic, Skriptum FHBB, 2000.
[20] W. A. Stahel, Statistische Datenanalyse, 4. Auflage, Viewegs Fachbücher der Technik,
2002.
[21] R. Storm, Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle, 11. Auflage, Fachbuchverlag Leipzig, 2001.
[22] M. Steiner-Curtis, Wahrscheinlichkeitstheorie und Statistik, Skriptum FHNW, 2015.
[23] B. L. van der Warden, Mathematische Statistik, 3. Auflage, Springer-Verlag, Berlin,
1973.
[24] W. A. Wallis und A. V. Roberts, Methoden der Statistik, Rowohlt, Reinbeck, 1969.
Index
Alternativhypothese, 27
ANOVA, 87
Faktor, 87
Gruppe, 87
Merkmal, 87
Anpassungstest, 77
Approximation, 96
Ausgleichs
-kurve, 96
Ausreisser, 83
Ausreisserproblem, 83
Ausreissertest, 83
nach Cochran für Varianzen, 85
nach Grubbs für Mittelwerte, 85
nach Grubbs für Stichprobenwerte, 84
F -Test, 54
F -Verteilung, 55
Fadenpendel, 24
Fehler
1. Art, 31
2. Art, 31
absolute, 18
grobe, 14, 17
Mittelwertes
relativer, 19
mittlerer, 18
relative, 18
systematische, 14, 17
wahrscheinlichste, 20
zufällige, 14, 17
Fehlerfortpflanzung, 17
Fehlerfortpflanzungsgesetz, 19
Fehlerkurve, 14
Fehlerquadratsumme, 93, 96, 105
Fehlerquellen, 125
Fisher Sir Ronald Aylmer, 1890-1962, 2
Fisher-Test, 54
Freiheitsgrade
χ2 -Varianztest, 50
χ2 -Verteilung, 51
F -Test, 54
F -Verteilung, 55
Student-t-Test, 37
Student-t-Verteilung, 38
Behrens-Fisher-Problem, 45
Bindung, 62
Carl Friedrich Gauss, 1777-1855, 93
χ2 -Anpassungstest, 76
χ2 -Varianztest, 49
χ2 -Verteilung, 51
Cochran William Gemmell, 1909-1980, 59
Cochran-Test, 58
Cramersche Regel, 94
Einstichproben-t-Test, 36
empirische Summenfunktion, 80
erforderliche Messgenauigkeit, 17
Erwartungswert, 8
F -Verteilung, 56
χ2 -Verteilung, 51
Binomialverteilung, 8
Normalverteilung, 13
Poissonverteilung, 10
stetige Zufallsgrösse, 11
Student-t-Verteilung, 39
exponentielles Glätten, 122
Exzess, 74
Gammafunktion, 39
Gausssche
Glockenkurve, 13
Normalverteilung, 13
Glättung, 117
Glättungsfaktor, 122
Gleichungssystem
lineares, 97
gleitender Durchschnitt, 117
151
152
siebner, 117
vierer, 117
12-Monate, 117
Gosset William Sealey, 1876-1937, 40
Grenzwertsatz
von de Moivre und Laplace, 15
zentraler, 14
Grundgesamtheit, 1
heteroskedastisch, 45
Histogramm, 71
homoskedastisch, 43
Hypothese, 27
i.i.d, 113
Intervallschätzungen, 40
Irrtumswahrscheinlichkeit, 28
Kolmogoroff N. Andrey, 1903-1987, 2
Kolmogoroff-Smirnov-Test, 80
Konfidenzintervall
χ2 -Varianztest, 52
Einstichproben-t-Test, 40
Erwartungswert, 40
Student-t-Test, 40
Varianz, 52
Kurtosis, 74
Lilliefors-Test, 80
Macht eines Tests, 32
mathematisches Pendel, 24
Maximalfehler, 20
absoluter, 20
relativer, 20
Median, 65
Medianlinie, 65
Messfehler, 18
Methode der kleinsten Quadrate, 18, 93,
105
Mittel
arithmetische, 18
Mittelwert
bei Klasseneinteilung, 73
geschätzt, 36, 43, 45
mittlerer Fehler, 18
MKQ, 18, 93, 105
Modus, 126
Index
Momente
zentrale, 74
Momentenmethode, 74
Moving Average, 117
Normalgleichungssystem, 98
Normalverteilung
mit Parametern µ und σ, 13
standardisiert, 13
Transformation, 13
Nullhypothese, 27
Operationscharakteristik, 33
Paarweiser Vergleich
zweier Mittelwerte, 46
Pearson Egon Sharpe, 1895-1980, 2
Pearson Karl, 1857-1936, 2
Pendel
mathematisches, 24
Phasendurchschnittsverfahren, 118
Placebo, 87
Poissonverteilung, 10
Prüfen
auf Normalverteilung, 71
einer Verteilung, 69
von Erwartungswerten, 35
von Varianzen, 49
Prognose
h-Schritt-, 120
Prognoseverfahren, 120
Quantil
F -Verteilung, 56
χ2 -Verteilung, 51
Runtest, 67, 145
Student-t-Verteilung, 39
Vorzeichentest, 63, 144
Regel
von Cramer, 94
Regression, 104
Regressions
-funktion, 96
-gerade, 93, 104, 105
-koeffizient, 95, 106
-konstante, 95, 106
Regressionsanalyse, 103
Index
einer Geraden, 106
zweier Geraden, 109
Regressionsrechnung, 93
Residuen, 81, 116
Restkomponente, 115
Restvarianz, 107
robust, 37, 83
Rotweinverkauf, 114
Runtest, 64
Saisonindex, 119
Saisonkomponente, 115
Schiefe, 74
σ-Bereich, 15
Signifikanzniveau, 28
Signifikanztest, 28
Skewness, 74
Standardabweichung, 8
Binomialverteilung, 8
Statistik, 1
beschreibende, 1
deskriptive, 1
induktive, 1
schliessende, 1
statistische Datenanalyse, 1
statistischen Tests, 28
Statistischer Test, 27
Stichprobe, 1
Stichprobenumfang
erforderlicher, 42
Streuung
F -Verteilung, 56
χ2 -Verteilung, 51
Binomialverteilung, 8
diskrete Zufallsgrösse, 8
Normalverteilung, 13
Poissonverteilung, 10
stetige Zufallsgrösse, 11
Student-t-Verteilung, 39
Student-t-Test, 36
Student-t-Verteilung, 38
Summenfunktion
empirische, 80
Summenhäufigkeit
absolute, 71
relative, 71
Summenzeichen
153
vertauschen, 98
t-Verteilung, 38
Tafeln, 129
Ausreissertest nach Grubbs, 147
χ-Verteilung, 132, 133
Cochran-Test, 143
F -Verteilung, 134–142
Lilliefors-Test, 146
Quantile der standardisierten Normalverteilung, 130
Runtest, 145
standardisierte Normalverteilung, 130
Student-t-Verteilung, 131
Vorzeichentest, 144
Temperaturmonatsmittel, 64
Test
auf Ausreisser nach Cochran für Varianzen, 85
auf Ausreisser nach Grubbs für Mittelwerte, 85
auf Ausreisser nach Grubbs für Stichprobenwerte, 84
auf Schiefe und Exzess, 74
auf Zufälligkeit, 64
χ2 -Anpassungs-, 76
χ2 -Varianzen, 49
Cochran-, 58
Einstichproben-t-, 36
F -, 54
Kolmogoroff-Smirnov, 80
Lilliefors-, 80
parameterfrei, 61
t-, 36
verteilungsfrei, 61
z-, 31
Zweistichproben-t-, 42
Testgrösse, 28
ANOVA, 89
Ausreissertest, 84
χ2 -Anpassungstest, 78
χ2 -Varianzentest, 50
F -Test, 54
Lilliefors-Test, 81
Regressionsanalyse, 107
Regressionskoeffizienten, 110
Regressionskonstanten, 110
154
Runtest, 66
Student-t-Test, 36
Varianzanalyse, 89
Trend, 115
Trend-Saison-Model, 115
Trendbereinigung, 115–117
Trennschärfe eines Tests, 32
Ungleichung
Cauchy-Schwarz, 95
Variable
nichtstochastisch, 103
stochastisch, 104
Varianz, 19
F -Verteilung, 56
χ2 -Verteilung, 51
bei Klasseneinteilung, 73
Binomialverteilung, 8
diskrete Zufallsgrösse, 8
geschätzt, 36, 43, 45, 49
gewogene Mittel der, 43
Normalverteilung, 13
Poissonverteilung, 10
stetige Zufallsgrösse, 11
Student-t-Verteilung, 39
Varianzanalyse, 87
einfaktorielle, 87
Faktor, 87
Gruppe, 87
Merkmal, 87
Varianzzerlegung, 89
Verteilung
F -, 55
χ2 -, 51
diskret, 7
Normal-, 13
stetig, 7, 11
Student-t, 38
t-, 38
Verteilungsfunktion, 8, 11
Vertrauensintervall
χ2 -Varianztest, 52
Einstichproben-t-Test, 40
Erwartungswert, 40
Student-t-Test, 40
Varianz, 52
Index
Vertrauenswahrscheinlichkeit, 41, 52
Vorzeichentest, 61
Wölbung, 74
Wahrscheinlichkeit, 7
Wahrscheinlichkeitsdichte, 11
Wahrscheinlichkeitsfunktion, 7
Wahrscheinlichkeitsnetz, 69
Wahrscheinlichkeitspapier, 69
Wirtschafts-Nobelpreise, 113
z-Test, 31
Zeichentest, 61
Zeitreihe, 3, 113
Ein-Schritt-Prognose, 122
Prognose, 120
Saisonkomponente eliminieren, 118
Saisonkomponente schätzen, 118
Trend eliminieren, 115
Trend schätzen, 115
Zerlegung, 114
Zeitreihenanalyse, 115
Zeitreihenmodel
additives, 115
Zentralwert, 65
Zufallsgrösse, 7
Zufallsvariable, 7
Zweistichproben-t-Test, 42
unbekannte Varianzen, 45
unbekannten gleiche Varianzen, 43
Herunterladen
Study collections