Script zur Statistik - Carl-Engler

Carl-Engler-Schule Karlsruhe
Statistik-Script
1 (25)
Statistik-Script
Inhaltsverzeichnis
Statistik-Script........................................................................................................... 1
1. Teilgebiete der Statistik............................................................................................. 3
2. Kenngrößen der beschreibende Statistik ........................................................................4
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
Stichproben...................................................................................................................4
Lagemaße.....................................................................................................................4
Streumaße....................................................................................................................4
Standardfehler des Mittelwerts...........................................................................................5
Häufigkeiten..................................................................................................................5
Histogramm...................................................................................................................5
Statistik-Übung: Augensumme.............................................................................................6
Statistik mit dem Kugelkasten (Kombinatorik)..........................................................................7
2.8.1 Grundlagen........................................................................................................7
2.8.2 Binomialverteilung...............................................................................................7
2.8.3 Hypergeometrische Verteilung: ...............................................................................7
2.8.4 Geometrische Verteilung .......................................................................................7
2.9 Aufgaben zu Stichproben-Kenngrößen...................................................................................8
2.9.1 Stabilisierung der relativen Häufigkeit........................................................................8
2.9.2 Verteilung der Häufigkeiten....................................................................................8
2.10 Aufgaben zur Kombinatorik ..............................................................................................8
2.10.1 Reihenfolgen.....................................................................................................8
2.10.2 Lotto..............................................................................................................8
2.10.3 Binomialverteilung..............................................................................................8
2.10.4 Hypergeometrische Verteilung................................................................................8
2.10.5 Geometrische Verteilung......................................................................................8
2.11 Aufgaben zum Häufigkeitsdiagramm....................................................................................9
3. Normalverteilung.................................................................................................... 10
3.1
3.2
3.3
3.4
3.5
3.6
3.7
Problemstellung............................................................................................................10
Mathematische Beschreibung............................................................................................10
Dichte- und Verteilungsfunktion.........................................................................................10
Berechnung von Wahrscheinlichkeiten.................................................................................11
Wahrscheinlichkeits-Skalierung..........................................................................................11
Aufgabe zur Normalverteilung...........................................................................................11
Aufgabe zum Wahrscheinlichkeitsnetz .................................................................................11
4. Konfidenzintervalle.................................................................................................13
4.1
4.2
4.3
4.4
Standardfehler (Standardunsicherheit) des Mittelwerts.............................................................13
Konfidenzintervall des Mittelwertes....................................................................................13
Beispiel zum Konfidenzintervall.........................................................................................14
Aufgaben zum Konfidenzintervall.......................................................................................14
5. Ausreissertest nach Grubbs.......................................................................................15
5.1 Ziel des Tests...............................................................................................................15
5.2 Durchführung des Tests..................................................................................................15
5.3 Bemerkungen..............................................................................................................15
6. Chi-Quadrat-Anpassungstest .....................................................................................16
6.1
6.2
6.3
6.4
6.5
6.6
Problemstellung............................................................................................................16
Hypothese und Irrtumswahrscheinlichkeit.............................................................................16
Durchführung des Tests...................................................................................................16
Achtung Fussangeln........................................................................................................17
Funktionen in EXCEL.......................................................................................................17
Aufgabe zum CHI-Quadrat-Anpassungstest.............................................................................17
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 1 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
2 (25)
7. Trendtest nach Neumann.......................................................................................... 18
7.1 Zweck des Tests............................................................................................................18
7.2 Durchführung...............................................................................................................18
7.3 Beispiel zum Trendtest....................................................................................................18
8. Linearitätstest....................................................................................................... 19
8.1 Zweck des Tests............................................................................................................19
8.2 Durchführung...............................................................................................................19
8.3 Beispiel zum Linearitätstest..............................................................................................19
9. Signifikanz- und Kontingenztest.................................................................................20
9.1 Problemstellung............................................................................................................20
9.2 Zwei typische Fälle........................................................................................................20
9.2.1 Signifikanztest (t-Test für den Vergleich der Gruppen-Mittelwerte)...................................20
9.2.2 Signifikanztest (t-Test für einen Gruppen-Mittelwert gegen festen Mittelwert)......................20
9.3 Kontingenztest (Vierfeldertafel, Kontingenztafel)...................................................................21
9.4 Ergänzungen................................................................................................................21
10. Varianzanalyse (ANOVA)......................................................................................... 22
10.1 Problemstellung...........................................................................................................22
10.2 Verfahren..................................................................................................................22
10.3 Beispiel zur Varianzanalyse (Ringversuch)............................................................................22
11. Statistische Versuchsplanung SVP..............................................................................24
11.1 Ziele........................................................................................................................24
11.2 Erforderlicher Umfang der Stichprobe ...............................................................................24
11.3 Beziehungen zwischen Einflussfaktoren...............................................................................24
12. Anhang............................................................................................................... 25
12.1 Simulation von Zufallszahlen...........................................................................................25
Die Größen, Methoden, Rechenverfahren und Darstellungsmöglichkeiten aus der Statistik spielen eine im mer größere Rolle bei der Verarbeitung von Daten, die im Bereich von Labor und Produktion anfallen. Es
sind besonders die Verfahren zur Bewertung und Sicherung von Qualität, bei deren Anwendung und Inter pretation detaillierte Kenntnisse aus der Statistik erforderlich sind.
Im Rahmen der Berufsausbildungen und -fortbildungen an unserer Schule werden jeweils Teile dieses
Scripts erarbeitet und mit Hilfe einer Tabellenkalkulation geübt und veranschaulicht.
Berufsschule Physiklaborant
Berufsschule Chemielaborant
Berufskolleg Chemisch-Technischer Assistent
Fachschule für Technik (Chemietechnik)
Das Script erhebt keinen Anspruch auf Vollständigkeit. Es gibt einen großen Umfang an Literatur zu den
Grundlagen und zur Vertiefung.
Die Inhalte dieses Scripts nehmen mit Formeln, Beispielen und Aufgaben Bezug auf die Möglichkeiten einer
Tabellenkalkulation. Namen, Formelzeichen und Zahlenangaben von Größen sind an manchen Stellen der
Literatur nicht einheitlich verwendet, besonders bei der Angabe von Größen mit Wahrscheinlichkeitsaussa gen.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 2 von 25
Carl-Engler-Schule Karlsruhe
1.
Statistik-Script
3 (25)
Teilgebiete der Statistik
Die Statistik ist ein Themengebiet der Mathematik und lässt sich in (mindestens) fünf grosse Teilgebiete
(Bereiche) einteilen:
Die Wahrscheinlichkeitstheorie bildet die Grundlage. Sie ist eine mathematische Theorie, mit der Gesetzmässigkeiten und Rechenverfahren entwickelt und begründet werden können.
Da man bei Vorhersagen nicht sicher sein kann, ob sie tatsächlich eintreten werden, es auf der anderen
Seite verschiedene Niveaus von Sicherheiten gibt, ist der Begriff der Wahrscheinlichkeit der zentrale
Begriff der Statistik. Die Wahrscheinlichkeit p wird durch einen Zahlenwert zwischen Null (unmöglich)
und Eins (sicher) angegeben.
Die Beschreibende Statistik (auch deskriptive Statistik) stellt Verfahren zur Verfügung, mit denen aus
Stichproben Kennwerte (z.B. Mittelwerte, Streuwerte) bestimmt werden, so dass sich Stichproben miteinander vergleichen lassen. Die Parameterschätzung schließt aus den Kennwerten der Stichprobe auf
die Kennwerte der Grundgesamtheit. Zur beschreibenden Statistik gehört auch die Bestimmung von
Konfidenzintervallen (Intervall, in dem der richtige Wert mit einer angebbaren Sicherheit liegt).
Die Beurteilende Statistik (auch induktive Statistik) stellt Verfahren zur Verfügung, mit denen sich
Entscheidungen treffen lassen. Man nennt diese auch Testverfahren. Typische Tests sind der GrubbsTest (Ausreissertest), der Trendtest nach Neumann oder der Chi^2-Anpassungstest. Für einen Test wird
eine Hypothese (Vermutung) formuliert und aus den Daten eine Prüfgröße berechnet. Diese wird mit einer Vergleichsgröße (aus einer Tabelle oder nach einer Formel) verglichen. Ziel ist es, die aufgestellte
Hypothese zu widerlegen.
Die Statistische Analyse (auch explorative Statistik) ermittelt, welche Beziehungen und Abhängigkeiten zwischen Datengruppen vorhanden sind. Die Werkzeuge hierzu sind sog. Multivariate Verfahren und
die Vorgehensweise wird Data Mining genannt. Die zugehörige Mathematik ist nicht leicht und die Re chenverfahren sind meist aufwändig. Sie werden in der Praxis mit speziellen Programmen ausgeführt.
Die Versuchsplanung (DoE: Design of Experiments) ermittelt, unter welchen Bedingungen ein Experiment Ergebnisse einer festgelegten Genauigkeit und Sicherheit liefert. So lassen sich neben den zu
erfassenden Merkmalsgrößen z.B. die Zeitintervalle bestimmen, nach denen jeweils eine neue
Stichprobe gezogen werden muss und der Umfang der Stichproben, der eine zuverlässige Aussage
ermöglicht.
In der Praxis sind oft viele Verfahren kombiniert, so dass die obige Aufteilung nicht sofort erkannt wird
(z.B. bei der Bestimmung des Vertrauensbandes an einer Kalibriergeraden). Auch hier lassen sich die
meisten Statistik-Verfahren nur mit Hilfe eines Computers ausführen. Der Anwender ist oft nicht in der
Lage, die von den Programmen ausgeführten Schritte nachzuvollziehen oder zu überprüfen. Es ist jedoch
hilfreich für die Auswahl von Alternativen und Parametern, wenn Zweck und Idee eines Verfahrens
bekannt sind und Ergebnisse auf Plausibilität geprüft werden können.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 3 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
2.
Kenngrößen der beschreibende Statistik
2.1
Stichproben
4 (25)
Jede Messreihe die aus Werten besteht, die unter gleichen Bedingungen erfasst wurden, ist eine Stichprobe. Von den (endlich oder unendlich) vielen Messungen, die man sich vorstellen kann (dies ist die
Grundgesamtheit), wurden n Stück (Messungen) durchgeführt. Die Anzahl n der Merkmalswerte (der Merkmalsgröße) nennt man auch den Umfang n der Stichprobe. Die ursprüngliche, unveränderte Werteliste
heisst Urliste.
Im Beispiel soll der Wurf mit zwei Würfeln simuliert werden. Die Augensumme stellt einen Messwert dar.
In der Statistik sagt man dazu Merkmalswert. Die Merkmalswerte sind hier ganze Zahlen zwischen zwei und
zwölf. Jeder Würfel wird in der Tabellenkalkulation simuliert mit der Formel:
=GANZZAHL(6*ZUFALLSZAHL()+1)
In der ersten Spalte wird der erste und in der zweiten Spalte der zweite Würfel simuliert. Die dritte Spalte
enthält die Augensumme AS. Der Bereich in der Tabelle mit Platz für mindestens 100 Werte für die Augen summe erhält den Namen "werte".
Bei jedem Eintrag in eine Zelle werden alle Zufallszahlen neu berechnet. Diese Automatik lässt sich unter
Extras - Optionen ausschalten, so dass eine Neuberechnung nur noch mit der Funktionstaste F9 gestartet
wird.
Die Zahlen im Bereich "werte" sind unsere Stichprobe. Von ihr sollen verschiedene Kennwerte berechnet
werden. Der erste ist der Umfang n, der in der Tabellenkalkulation automatisch ermittelt wird mit der
Funktion:
=ANZAHL(werte)
2.2
Lagemaße
Der arithmetische Mittelwert (oder Durchschnitt oder 1. Moment) ist der gebräuchlichste Wert, um die
Lage der Stichprobenwerte anzugeben. In der Tabellenkalkulation wird er berechnet mit dem Befehl:
=MITTELWERT(werte)
Zieht man mehrere gleichartige Stichproben (d.h. macht mehrere gleichartige Messungen), erhält man je weils etwas unterschiedliche Mittelwerte. Der Standardfehler des Mittelwerts beschreibt diese Schwankung. Er lässt sich aus der Standardabweichung berechnen, indem man diese durch die Wurzel aus dem
Umfang n der Stichprobe dividiert. Weitere lagemaße sind der Median, das harmonische Mittel, das
gewogene Mittel oder das gestutzte Mittel (siehe Funktionsasssistent der Tabellenkalkulation).
2.3
Streumaße
Die Streumaße beschreiben Intervalle (Bereiche) um das Lagemaß, in denen die Werte der Stichprobe anzutreffen sind. Die Differenz aus Maximum und Minimum ergibt die Spanne (oder Spannweite):
=MIN(werte)
=MAX(werte)
=MAX(werte) - MIN(werte)
Eine automatische Markierung von Minimum und Maximum lässt sich über Format - bedingte Formatierung
einrichten.
Da ein Ausreisser die Spanne sehr vergrössert, wäre ein durchschnittlicher Abstand zum Mittelwert sinn voll. Aus theoretischen Gründen (Normalverteilung) wird hierfür jedoch meist die Varianz verwendet
(mittlere quadratische Abweichung). Da sie aber die quadrierte Masseinheit der Stichprobenwerte hat,
verwendet man auch die anschaulichere Standardabweichung. Die Standardabweichung ist die
(Quadrat-)Wurzel aus der Varianz.
=VARIANZ(werte)
=STABW(werte)
Der Variationskoeffizient V (auch relative Standardabweichung) ergibt sich aus dem Quotienten Standardabweichung/Mittelwert und wird als Dezimalzahl oder als Prozentzahl angegeben. Die Angabe ist nur
brauchbar, wenn die Streuung deutlich kleiner ist als die vorkommenden Merkmalswerte.
Die Quartile geben an, an welchen Stellen das 1., 2. bzw. 3.Viertel der Datenmenge endet.
=Quartile(werte;quartil) 0: Minimum 1: 1.Quartil 2: 2.Quartil (Median) 3: 3.Quartil 4: Maximum
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 4 von 25
Carl-Engler-Schule Karlsruhe
2.4
Statistik-Script
5 (25)
Standardfehler des Mittelwerts
Untersucht man mehrere Stichproben aus der selben Grundgesamtheit, wird man unterschiedliche Mittelwerte erhalten. Trotz grosser Standardabweichung in den Stichproben werden die Mittelwerte nahe beieinander liegen. Die Abstände zwischen diesen Mittelwerten sind um so kleiner, je grösser der Umfang der
Stichproben ist. Dies wird durch den Standardfehler des Mittelwertes angegeben. Er wird berechnet,
indem man die Standardabweichung der Stichprobe durch die Wurzel aus N (Umfang) dividiert. Er wird
auch mit SEM: Standard Error Mean bezeichnet.
Mit Hilfe des Standardfehlers des Mittelwerts (und Werten aus der t-Verteilung) lassen sich Konfidenzintervalle (Vertrauensintervalle) um den Mittelwert bestimmen (siehe Kap. 4).
2.5
Häufigkeiten
Sortiert man die Urliste nach den Merkmalswerten über Daten - Sortieren, dann kann man leicht abzählen,
wie oft ein bestimmter Wert (bzw. ein Wert innerhalb eines festgelegten Intervalls) vorgekommen ist. Man
erhält die absoluten Häufigkeiten. Dieses Abzählen lässt sich auch ohne Sortieren automatisch durchführen. Die zugehörige Funktion ist eine Matrix-Funktion und muss auf besondere Weise eingegeben werden.
In einem Bereich (Name "klassen") werden die Klassenobergrenzen angegeben. Für die spätere DiagrammDarstellung bleibt eine Spalte noch frei. Dann wird der Bereich für die Häufigkeitswerte markiert. Bei bestehender Markierung wird die Formel eingetragen:
=HÄUFIGKEIT(werte;klassen)
Dabei ist auf das eingestellte Trennzeichen, hier ";" zu achten. Die Übernahme erfolgt mit der Tastenkombination <shift><strg><enter>.
Die Häufigkeiten sind von den Grenzen der Klassen abhängig. Die Anzahl m der Klassen sollte so gewählt
werden, dass es mindestens eine Häufigkeit grösser als zwei gibt. Mehr als 20 Klassen sind oft nicht
sinnvoll. Dazwischen kann m gleich Wurzel aus n gelten.
2.6
Histogramm
Die Häufigkeiten lassen sich absolut oder relativ schön in einem Histogramm (auch Stabdiagramm) darstel len (Balken: waagrechte Stäbe; Säulen: senkrechte Stäbe). Sollen statt der Klassenobergrenze zur Be schriftung die Klassenmitten verwendet werden, dann können diese in der noch frei gehaltenen Spalte ein getragen oder berechnet werden.
15
15
Histogramm
14
12
Histogramm
11
10
Häufigkeit
Häufigkeit
10
7
6
5
3
5
3
1
1
0
0
0
2
5
8
11
0
0
-1
0
-1
1
0
1
1
3
5
7
9
Klas s e nm itte n
14
Klas se nm itte n
15
Histogramm
10
10
Klasseneinteilung abhängig
Häufigkeit
Häufigkeiten sind von der
8
6
5
4
1
1
0
0
0
0
2
4
6
8
10
Klas s enm itte n
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 5 von 25
Carl-Engler-Schule Karlsruhe
2.7
Statistik-Script
6 (25)
Statistik-Übung: Augensumme
Beim Würfeln mit drei Würfeln zeigt jeder Würfel eine Augenzahl. Die Summe davon ist die Augensumme
AS. Manche Werte von AS kommen seltener, andere häufiger vor. Durch die Simulation in einem
Tabellenblatt lassen sich diese Eigenschaften untersuchen. Die Grundgesamtheit ist die Menge aller
durchführbaren Würfe. Die Ausführung von n Würfen stellt eine Stichprobe vom Umfang n dar, mit dem
Merkmal Augenzahl und Merkmalswerten im Bereich von 3 bis 18. Ein Wurf eines einzelnen Würfels wird
mit =GANZZAHL(6*ZUFALLSZAHL())+1 simuliert. Zufallszahlen liegen zwischen 0 und 1 und werden nach
jeder Eingabe in die Tabelle (oder F9) neu berechnet. Durch geeignetes Kopieren kann schnell eine
Tabelle mit vielen Würfen mit drei Würfeln erzeugt werden.
Mit Funktionen, die von der Tabellenkalkulation bereit gestellt werden, lassen sich viele Kenngrößen der
beschreibenden Statistik berechnen (siehe Formelsammlung). Eine Vereinfachung ergibt sich auch, wenn
der gesamte Bereich der Augensumme mit einem Namen (z.B. AS) belegt wird.
Beobachtet man eine Zelle aus AS und aktualisiert ständig (mit F9), erhält man Werte über den gesamten
zulässigen Bereich. Beobachtet man dagegen der arithmetischen Mittelwert, ändert sich dieser
vergleichsweise wenig. Er zeigt eine geringere Streuung. Es ist also zu unterscheiden zwischen der
Streuung der Stichprobenwerte und der Streuung des Mittelwertes (siehe 2.4 Standardfehler des
Mittelwertes).
Man stellt auch fest, dass die mittleren Werte bei der Augensumme häufiger vorkommen. Durch die
Einteilung des Merkmalbereichs in Klassen und die Bestimmung der absoluten bzw. relativen Häufigkeiten
lässt sich diese Beobachtung grafisch in einem Säulendiagramm darstellen.
Man kann jetzt vermuten, dass die Daten normalverteilt sind und zum Vergleich eine Normalverteilung
dazu zeichnen. Ifür das Diagramm der absoluten Häufigkeiten muss die Standard-Normalverteilung mit der
Klassenbreite und dem Umfang der Stichprobe multipliziert werden.
=NORMVERT(klassenmitte;mittelwert;standardabweichung;FALSCH) * klassenbreite * umfang
Mit einem CHI-Quadrat-Test (beurteilende Statistik) lässt sich prüfen und entscheiden, ob die vorhandenen
Unterschiede gegen eine Normalverteilung sprechen.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 6 von 25
Carl-Engler-Schule Karlsruhe
2.8
Statistik-Script
7 (25)
Statistik mit dem Kugelkasten (Kombinatorik)
2.8.1 Grundlagen
Oft ist es nicht möglich, oder zu aufwändig, alles zu messen oder zu zählen, was eigentlich interessant
und wichtig wäre. Man beschränkt sich daher auf eine Stichprobe und schließt daraus auf die Eigenschaften der Grundgesamtheit.
Viele Begriffe, Formeln und Verfahren lassen sich dazu mit dem sog. Kugelkasten (früher nannte man es
Urne) erklären und simulieren. In einem Kasten befinden sich z.B. N=10000 Kugeln (Grundgesamtheit oder
bei der Qualitätssicherung Losumfang). Diese haben bestimmte Merkmale (z.B. weiss, rot, schwarz, grün).
Aus dem Kasten wird blind eine Kugel herausgenommen, die Farbe notiert und wieder in den Kasten zu rückgelegt. Man zieht nacheinander z.B. eine Anzahl von n=200 Kugeln (Ziehung einer Stichprobe). Die
Stichprobe hat einen Umfang von n=200. Hat man dabei z.B. k=18 rote Kugeln erwischt, ist die absolute
Häufigkeit h(rot)=18, die relative Häufigkeit r(rot)=h(rot)/n=18/200=0,09 (oder 9%). Man wird jetzt vermuten, dass im Kugelkasten etwa 9% der Kugeln rot sind, was aber nicht ganz sicher ist und nicht genau
stimmen muss. Bei jeder Ziehung kann ein anderes Ergebnis herauskommen.
Man wird sagen, dass die Wahrscheinlichkeit für das Ziehen einer roten Kugel p(rot)=9% beträgt. Bei der
Untersuchung des gesamten Inhalts hat sich allerdings ergeben, dass von 10000 Kugeln 800 Kugeln rot sind.
Ein wichtiger Satz in der Statistik ist die Annahme, dass die relative Häufigkeit um so weniger schwankt
und damit die Aussagen um so sicherer werden, je größer der Umfang der Stichprobe ist.
Mit dem Kugelkasten lassen sich verschiedene Modelle aus der Statistik durchspielen. Im Kugelkasten befinden sich N Kugeln von denen M Stück rot sind. Für die Berechnungen werden die Binomialkoeffizienten
benötigt, die über folgende Formel definiert sind:
n!
n =
k !∗n−k !
k

Sie gibt die Anzahl der möglichen unsortierten Kombinationen bei der Auswahl von k aus n Elementen an.
Die Fakultät n! Wird berechnet durch n!=1*2*3* ... (n-1)*n
mit 0!=1
n unterschiedliche Objekte lassen sich in n! verschiedenen Reihenfolgen anordnen.
2.8.2 Binomialverteilung
Es wird nacheinander eine feste Anzahl n von Kugeln gezogen und die Farbe notiert. Jede Kugel wird sofort wieder in den Kasten zurückgelegt. Die Anzahl k der gezogenen roten Kugeln (von N gezogenen Kugeln) wird für die Auswertung notiert.
Die Wahrscheinlichkeit für das Ereignis „es sind k rote Kugeln gezogen“ ist:

n−k 
k
f k = n p  1− p 
k
Das Zurücklegen lässt den Anteil roter Kugeln im Kasten konstant und entspricht damit einem Kugelkasten
mit unendlich viele Kugeln.
2.8.3 Hypergeometrische Verteilung:
Man verfährt wie im vorhergehenden Fall, legt die gezogenen Kugeln jedoch nicht wieder zurück. Es ist
das Gleiche, wie wenn man alle n Kugeln auf einmal entnimmt. Die Wahrscheinlichkeit für das Ereignis „es
sind k rote Kugeln gezogen“ ist:
M ⋅ N −M

k   n−k 
f k =
 Nn 
2.8.4 Geometrische Verteilung
Es wird nacheinander jeweils eine Kugel entnommen und wieder zurück gelegt, bis eine rote Kugel
gezogen wird. Die Anzahl k der gezogenen Kugeln (mit der roten) wird notiert.
Die Wahrscheinlichkeit für das Ereignis „es wurden k Kugeln gezogen“ ist:
f k = p⋅ 1− p 
statistikscript.odt
Okt 2013
 k−1
www.ces.karlsruhe.de/culm/
Seite 7 von 25
Carl-Engler-Schule Karlsruhe
2.9
Statistik-Script
8 (25)
Aufgaben zu Stichproben-Kenngrößen
Prüfen Sie an einem Stichproben-Beispiel vom Umfang n=6, ob sich nach allen Formeln der gleiche Wert
für die Varianz ergibt.
n
1
2
s=
 xi−
x
∑
n−1 i =1
2
n
1
s=
x 2i −n x 2
∑
n−1 i =1
2
n
1
s=
 ∑ x 2i −n 
x 2
n−1 i=1
2
2.9.1 Stabilisierung der relativen Häufigkeit
Simulieren Sie in der Tabellenkalkulation das Werfen einer Münze mit den möglichen Ereignissen Kopf (0)
oder Zahl (1) durch entsprechende Zufallszahlen. Führen Sie etwa m=100 Ziehungen (Würfe) durch.
Summiert man die Ergebnisse, erhält man die Anzahl der Ereignisse „Zahl“. Berechnen Sie für jeden Wurf
die relative Häufigkeit von „Zahl“ bei den bisherigen Würfen und stellen den Verlauf dieser Werte in
einem Diagramm dar.
Interpretieren Sie das Diagramm.
2.9.2 Verteilung der Häufigkeiten
Laden Sie das Tabellenblatt kugelkasten.xls und simulieren Sie jeweils eine Ziehung durch Drücken der
Taste F9. Wählen Sie eine Wahrscheinlichkeit für Rot von p=0,1. Der Stichprobenumfang liegt bei n=60.
Bestimmen Sie die absoluten Häufigkeiten der einzelnen Ergebnisse (rot), indem Sie eine Strichliste erstellen. Stellen Sie die Häufigkeitsverteilung in einem Säulendiagramm dar. Skalieren Sie sowohl in absoluten
als auch in relativen Häufigkeiten.
Berechnen Sie Mittelwert und Standardabweichung und markieren Sie den dadurch festgelegten
Streubereich auf der Merkmalsachse (x-Achse) des Diagramms.
Schätzen oder berechnen Sie den Anteil der Würfe, die innerhalb bzw. außerhalb dieses Bereichs liegen.
2.10 Aufgaben zur Kombinatorik
2.10.1 Reihenfolgen
In einer Arztpraxis warten 6 Patienten. Wie viele Möglichkeiten der Einteilung zur Behandlung hat die
Arzthelferin (alles Kassenpatienten)?
2.10.2 Lotto
Wie viele verschiedene Spiele gibt es beim Lotto?
2.10.3 Binomialverteilung
Von 50 Spritzen einer Packung für die Gaschromatografie sind 3 undicht. Wie groß ist die Wahrscheinlichkeit, dass von 4 entnommenen Spritzen mehr als eine undicht ist?
2.10.4 Hypergeometrische Verteilung
Die Wahrscheinlichkeit für eine fehlgeschlagene Analyse an einem Analyseautomaten ist p=0,01. Pro Tag
werden 120 Analysen durchgeführt. Stellen Sie die erwarteten Häufigkeiten an fehlgeschlagenen Analysen
pro Tag in einem Säulendiagramm dar.
Wie groß ist die Wahrscheinlichkeit, mehr als drei Fehlanalysen an einem Tag zu erhalten?
2.10.5 Geometrische Verteilung
Von den Spritzen für die Gaschromatografie sind im Schnitt 6% undicht. Wie groß ist die Wahrscheinlich keit, dass die ersten fünf entnommenen Spritzen dicht sind?
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 8 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
9 (25)
2.11 Aufgaben zum Häufigkeitsdiagramm
In einer Produktionshalle wird die Temperatur (Auflösung 0,1K) zwischen 8.00Uhr und 17.00Uhr im 10-Minutentakt gemessen und gespeichert (erste Messung um 8.05 Uhr). Zur Auswertung wird ein Häufigkeitsdiagramm mit den Klassenobergrenzen 17°C, 19°C, 21°C ... 35°C erstellt. Zeichnen Sie die erwarteten
Häufigkeitsdiagramme.
1.
2.
3.
4.
Die Temperatur wird von der Klimaanalage auf 22,2°C gehalten.
Die Temperatur wird von der Klimaanalage (schwankend) zwischen 22,0°C und 24,0°C gehalten.
Bis 13.00Uhr beträgt die Temperatur 26°C, dann fällt sie rasch wegen geöffneter Tore auf 22°C.
Die Temperatur steigt bis 12.30Uhr gleichmäßig von 19,1°C auf 30,9°C und fällt am Nachmittag
ebenso gleichmäßig wieder auf 19,1°C zurück.
5. Die Temperatur steigt bis 10.00Uhr gleichmäßig von 19,1°C auf 30,9°C und fällt anschließend bis
17.00Uhr gleichmäßig wieder auf 19,1°C zurück.
6. Die Temperatur steigt bis 11.00Uhr gleichmäßig von 19,1°C auf 30,9°C, liegt zwischen 11.00Uhr
und 13.00Uhr bei 30,9°C und fällt am Nachmittag gleichmäßig von 30,9°C auf 25,1°C zurück.
statistikscript.odt
Häufigkeitsdiagramm
Häufigkeitsdiagramm
Häufigkeitsdiagramm
Häufigkeitsdiagramm
Häufigkeitsdiagramm
Häufigkeitsdiagramm
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 9 von 25
Carl-Engler-Schule Karlsruhe
3.
Normalverteilung
3.1
Problemstellung
Statistik-Script
10 (25)
Die Merkmalswerte einer Stichprobe zeigen eine Streuung. In bestimmten Fällen, z.B. beim Würfeln, soll ten alle Merkmalswerte etwa mit gleicher Häufigkeit vorkommen. In diesem Fall liegt eine Gleichvertei lung vor. Sind die Merkmalswerte von mehreren Faktoren zufällig beeinflusst, werden die Merkmalswerte
in der Nähe des Mittelwerts häufiger vorkommen, als weiter entfernte. Bei grossem Stichprobenumfang
lässt sich die erwartete Verteilung durch die Formel der Normalverteilung oder Gaussverteilung beschrei ben.
3.2
Mathematische Beschreibung
Für einen gegebenen Mittelwert und eine gegebene Standardabweichung wird mit der folgender Formel
die sog. Dichtefunktion (Glockenkurve) berechnet:
Die um den Mittelwert symmetrische
Form drückt die nach aussen abnehmende erwartete Häufigkeit aus. Die Funktionswerte sagen jedoch nur wenig aus.
Die verwertbaren Ausssagen sind in der
Fläche zwischen Kurve und x-Achse enthalten (Integration). Durch den Faktor
(vor der e-Funktion) wird die Gesamtfläche auf den Wert 1 (100%) normiert. Die
zu einen Intervall (auf der x-Achse) gehörende Teilfläche gibt die Wahrscheinlichkeit für einen Wert innerhalb dieses
Intervalls an.
3.3
Dichte- und Verteilungsfunktion
Für die Integration benötigt man die Stammfunktion. Sie heisst Verteilungsfunktion der Normalverteilung
(NV) oder auch Summenkurve der NV. Diese Funktion kann nicht in einer geschlossenen Formel angegeben
werden, aber sie existiert. Es gibt dazu
jedoch (beliebig genaue) Näherungsfunktionen. In Tabellenkalkulationen oder Statistik-Programmen sind sie verfügbar, in
Tabellenwerken liegen ihre Funktionswerte tabelliert vor. Die Integrationskonstante ist dabei immer so gewählt, dass sich
beim Mittelwert der Funktionswert 0.50
ergibt. bzw. das Integral von -unendlich
bis +unendlich den Wert 1 erhält. Diese
spezielle Stammfunktion ist die Verteilungsfunktion
(Summenkurve)
der
Normalverteilung.
In einer Tabellenkalkulation lassen sich
die Funktionswerte der Dichtefunktion
und der Verteilungsfunktion auch mit der
vorbereiteten Funktion =NORMVERT(...)
berechnen.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 10 von 25
Carl-Engler-Schule Karlsruhe
3.4
Statistik-Script
11 (25)
Berechnung von Wahrscheinlichkeiten
Für Wahrscheinlichkeitsberechnungen wird die Verteilungsfunktion verwendet. In der Standardform wird
die unabhängige Variable in Vielfachen der Standardabweichung angegeben. Die Differenz zweier Funktionswerte gibt die erwartete Häufigkeit eines Merkmalswertes im zugehörigen Intervall (der x-Achse) an.
So lässt sich ermitteln, dass im Bereich bis zu einer Entfernung von einer Standardabweichung vom Mittelwert 68.269% der Werte zu erwarten sind. Weitere häufig verwendete Intervalle sind in der Tabelle ange geben.
Intervall (in Standardabweichungen)
Flächenanteil (Wahrscheinlichkeit)
µ-1σ< µ < µ+1σ
0.68269
µ-2σ< µ < µ+2σ
0.95450
µ-3σ< µ < µ+3σ
0.99730
µ-1.65σ< µ < µ+1.65σ
0.900
µ-1.96σ< µ < µ+1.96σ
0.950
µ-2.58σ< µ < µ+2.58σ
0.990
Üblicherweise werden Grössen der Grundgesamtheit mit griechischen Buchstaben, die der Stichprobe mit
lateinischen Buchstaben bezeichnet.
3.5
Wahrscheinlichkeits-Skalierung
Durch eine geeignete Verzerrung der Skalierung der y-Achse (Wahrscheinlichkeitspapier), lässt sich die
Verteilungsfunktion der Normalverteilung als Gerade darstellen (probability plot). Abweichungen von der
Normalverteilung führen zu einer Abweichung von der Geraden. Zur Darstellung werden die Stichproben werte in eine aufsteigende Reihenfolge gebracht und von i=1 bis n durchnummeriert. Über jedem
Merkmalswert wird der Prozentwert Y im Wahrscheinlichkeitsnetz aufgetragen.
Y=
i−0,5
∗100
n
Bei einem sehr großen Umfang der Stichprobe wird in der Regel in Klassen eingeteilt. Die relativen
Häufigkeiten werden schrittweise zu Y aufsummiert und über der Klassenmitte im Wahrscheinlichkeitsnetz
aufgetragen.
3.6
Aufgabe zur Normalverteilung
In einer Abfüllanlage für ein Pulver streut die Abfüllmasse mit einer Standardabweichung von 3g. Es sollen
Packungen mit m=60g abgefüllt werden. Höchstens 5% der Packungen dürfen eine Masse von weniger als
60g haben.
a) Auf welchen Mittelwert ist die Anlage einzustellen?
b) Wie groß ist die Materialeinsparung, wenn eine neue Anlage eingesetzt wird, die nur noch eine
Standardabweichung von 1g aufweist?
3.7
Aufgabe zum Wahrscheinlichkeitsnetz
Stellen Sie die Summenkurve für folgende Messreihe im obigen Wahrscheinlichkeitsnetz grafisch dar:
6; 4; 10; 8; 6; 9; 8; 7; 5; 7
Es ergibt sich hier eine Treppenfunktion (Stufen), die durch eine Gerade auszugleichen ist.
a) Bestimmen Sie den Mittelwert und die Standardabweichung rechnerisch und aus dem Diagramm. Wählen
Sie eine geeignete Skalierung der Merkmalsachse.
b) Stellen Sie eine Normalverteilung mit einem Mittelwert von 9 und einer Standardabweichung von 3 als
Gerade dar.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 11 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
12 (25)
99,9%
99%
95%
90%
70%
50%
30%
10%
5%
1%
0,1%
99,9%
99%
95%
90%
70%
50%
30%
10%
5%
1%
0,1%
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 12 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
13 (25)
4.
Konfidenzintervalle
4.1
Standardfehler (Standardunsicherheit) des Mittelwerts
Untersucht man das Merkmal einer Stichprobe, dann wird der Mittelwert der
Stichprobe in der Regel nicht genau mit dem Mittelwert der Grundgesamtheit
übereinstimmen. Zieht man mehrere Stichproben aus der Grundgesamtheit, so lässt
sich
die Standardabweichung der einzelnen Mittelwerte berechnen. Diese nennt man den
Standardfehler des Mittelwerts. Er ist immer kleiner als der Mittelwert der einzelnen
Standardabweichungen. In den Begriffen aus dem Bereich der Qualitätssicherung spricht man besser (bei
unveränderter Bedeutung) von der Standardunsicherheit als vom Standardfehler.
Der Standardfehler des Mittelwerts lässt sich aus einer einzelnen Stichprobe abschätzen durch:
In diesem damit beschriebenen Intervall ist der Mittelwert der Grundgesamtheit mit 68%-iger Wahrscheinlichkeit zu finden. Intervalle, die den Mittelwert der Grundgesamtheit auch mit einer anderen Wahrscheinlichkeit α einschliessen, nennt man Konfidenzintervalle zum Signifikanzniveau α. Die Formel geht
von der Standardabweichung der Grundgesamtheit aus. Da sie hier jedoch nur durch die Stichprobe
geschätzt wird, ist eine Korrektur (durch die t-Verteilung) erforderlich.
4.2
Konfidenzintervall des Mittelwertes
Das Konfidenzintervall gibt einen meist symmetrischen Bereich um den Mittelwert der Stichprobe an, innerhalb dessen der Mittelwert der Grundgesamtheit mit einer festgelegten Sicherheit zu erwarten ist.
Verwendete Bezeichnungen:
n
Umfang der Stichprobe
x( i )
Merkmalswert
∆x
Abstand zur Intervallgrenze
s
Standardabweichung
α
Irrtumswahrscheinlichkeit
t
Quantil der t-Verteilung
Je größer die Sicherheit bzw. je kleiner die Irrtumswahrscheinlichkeit sein soll, desto weiter werden die
Intervallgrenzen vom Stichproben-Mittelwert entfernt sein. Die Größe des Konfidenzintervalls hängt also
vom Stichprobenumfang, von der Varianz und der noch akzeptierten Irrtumswahrscheinlichkeit ab. Der
Stichprobenumfang geht nur mit der Wurzel in die Berechnung ein, so dass z.B. bei vierfachem Umfang die
Intervallbreite nur halbiert wird. Sinnvoller als eine Erhöhung der Anzahl der Messungen ist es also, wenige
Messungen sorgfältig und genau auszuführen.
Kleine Irrtumswahrscheinlichkeiten α führen zu sehr großen Konfidenzintervallen (Achtung!). Der Zusammenhang wird durch eine besondere mathematische Funktion, die t-Verteilung (auch Student-Verteilung
genannt) beschrieben. Deren Werte sind tabelliert oder können von Computerprogrammen berechnet werden.
Das Verfahren geht davon aus, dass die Grundgesamtheit normalverteilt ist (prüfbar z.B. mit CHIQuadrattest). Diese Bedingung ist in der messtechnischen Praxis häufig erfüllt. Außerdem wird davon
ausgegangen, dass die Varianz der Grundgesamtheit nicht genau bekannt ist, denn sie wird ja nur aus der
Varianz der Stichprobe geschätzt. Der t-Faktor hängt damit auch von n ab. Dies wird bei der Berechnung
des t-Faktors mit der Größe Freiheitsgrad f berücksichtigt, die in diesem Fall dann den Wert (n-1) besitzt.
Der Erwartungswert für x mit dem Konfidenzintervall ergibt sich somit nach der Formel:
Die zugehörige Quantile der t-Verteilung lässt sich in einer Tabellenkalkulation berechnen mit der
Funktion
=TINV(α;f)
Sie liefert z.B. für =TINV(0,05;4) den Wert 2,7765.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 13 von 25
Carl-Engler-Schule Karlsruhe
4.3
Statistik-Script
14 (25)
Beispiel zum Konfidenzintervall
Die Datenreihe 22; 24; 29; 22; 23 hat einen Umfang von n=5, einen Mittelwert von xm=24 und eine
Standardabweichung von s= 2,92. Bei einer Irrtumswahrscheinlichkeit von p=5% (Signifikanzniveau 95%)
und dem Freiheitsgrad n-1=4 ist der t-Faktor t=2,78. Der Grenzabstand vom Mittelwert beträgt damit
(t*s)/√(n)=1,24*s=3,62.
In der folgenden Tabelle ist der Grenzabstand in Standardabweichungen ausgedrückt und das Konfidenzintervall ist beispielhaft für einen Mittelwert von 5 angegeben.
Für den Fall bekannter Varianz stammt der entsprechende Faktor aus der Normalverteilung (und nicht aus
der t-Verteilung) und hängt selbst nicht mehr von n ab. Für das Sicherheitsniveau von 95% hat er den Wert
1.96. Bei grossem Stichprobenumfang gleichen sich die Werte an (bereits durch √(n) dividiert). Z.B.:
für n=5 ( 95%)
Faktor 0.880 (Normalverteilung) statt t=1.240 (t-Verteilung)
für n=25 (95%)
Faktor 0.390 (Normalverteilung) statt t=0.413 (t-Verteilung)
für n=100 (95%)
Faktor 0.196 (Normalverteilung) statt t=0.198 (t-Verteilung)
Das Verfahren zur Bestimmung des Konfidenzintervalls des Mittelwerts einer Stichprobe bei unbekannter
Varianz lässt sich übertragen auf die Bestimmung von Konfidenzintervallen anderer Kennwerte der
Beschreibenden Statistik wie z.B.:
Konfidenzintervall der Standardabweichung
Konfidenintervall des Medians
Konfidenzintervall der Steigung einer Ausgleichsgeraden
4.4
Aufgaben zum Konfidenzintervall
a) Bestimmen Sie für die folgende Datenreihe das Konfidenzintervall für den Mittelwert auf einem Signifi kanzniveau von 95% bzw. von 99%:
8; 5, 0; 6; 9; 4; 4, 5; 7; 3
b) Bestimmen Sie für jeden x-Wert aus den zugehörigen y-Werten den Mittelwert und die Standardabweichung, sowie das t-Quantil zur Irrtumswahrscheinlichkeit von 5% und dem Freiheitsgrad (hier) f=4. Berechnen Sie zu jedem x-Wert die Halbbreite des Konfidenzintervalls. Stellen Sie in der Tabellenkalkulation die
y-Mittelwerte als Funktion von x mit den jeweiligen Konfidenzintervallen als Fehlerbalken grafisch dar.
x-werte
1
3
5
8
statistikscript.odt
Okt 2013
y1-werte y2-werte y3-werte y4-werte y5-werte
18
17
20
17
16
12
15
9
10
11
7
6
6
8
7
14
13
14
11
14
www.ces.karlsruhe.de/culm/
Seite 14 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
5.
Ausreißertest nach Grubbs
5.1
Ziel des Tests
15 (25)
In einer Datenreihe kann es einzelne Werte geben, die viel weiter vom Mittelwert entfernt sind, als die
übrigen Werte (möglicherweise ist bei der Erfassung ein Fehler unterlaufen). Man nennt sie Ausreißer
(outliner). Als Ausreißer kommen jeweils Minimum und Maximum der Datenreihe in Betracht. Für einen
verdächtigen Wert wird eine Prüfgröße PG berechnet, die den Abstand vom Mittelwert bewertet. Beim
Grubbs-Test gibt die Prüfgröße PG an, wieviele Standardabweichungen der zu testende Wert x i vom Mittelwert entfernt ist. Ist die Entfernung "zu groß", wird der Wert als Ausreißer betrachtet. Welche Abstände
noch akzeptabel sind, ist in der Tabelle der Grubbs-Verteilung festgelegt. Ein gefundener Ausreißer wird
in der Tabelle markiert und nicht mehr in die Berechnung einbezogen. Die neuen Minimum- und Maximumwerte werden einem erneuten Test unterzogen. Der Test kann nur auf normalverteilte Daten angewendet werden. In kritischen Fällen muss dies durch einen eigenen Test geprüft werden.
5.2
Durchführung des Tests
Die Schritte des Tests sind:
Das Signifikanzniveau (z.B. 95%) ist festzulegen. Von der Datenreihe
sind Minimum und Maximum zu ermitteln.
Von der Datenreihe sind Mittelwert und Standardabweichung (n-1gewichtet) zu berechnen. Der ausreißerverdächtige Wert ist jeweils
in die Berechnung einbezogen.
Die Prüfgröße PG wird nach der Formel für den ausreißerverdächtigen Wert berechnet.
Die Vergleichsgröße VG (für das gewählte Signifikanzniveau und den vorliegenden Umfang n) wird aus der
Tabelle abgelesen.
Das Testergebnis wird ermittelt: Bei PG>VG wird der Wert als Ausreißer betrachtet und aus der Datenliste
gestrichen (d.h. nicht mehr in die weitere Auswertung einbezogen). Er sollte als eliminierter Wert sichtbar
bleiben.
Der Ausreißertest wird mit dem nächsten, verdächtigen Wert wiederholt. Dabei ergeben sich neue Mittelwerte und Standardabweichungen. Der Test ist zu Ende, wenn keine weiteren Ausreißer gefunden werden.
Er wird üblicherweise auf dem 95%-Signifikanzniveau ausgeführt.
5.3
Bemerkungen
n
Der Grubbs-Test kann als Ausreißertest (in DIN 32645, auch
in DIN 38402) bei der Kalibrierung von Analyseverfahren
verwendet werden.
Andere Ausreißer-Tests sind bei kleinem Stichproben-Umfang
Q-Test, W-Test und Test nach Dixon und Dean, bei grossem
Stichproben-Umfang kann das Chauvenetsche Kriterium oder
der Test nach Graf und Henning verwendet werden.
Da der Mittelwert und die Standardabweichung sehr stark
vom Ausreißer bestimmt sind, wird auch der Ausreißertest
nach Hampel angewendet. Dabei wird statt des
arithmetischen Mittelwerts der Median und statt der
Standardabweichung der Median der Abweichungen
verwendet. Auch hier wird eine Normalverteilng der
Stichprobenwerte vorausgesetzt.
Der Test entscheidet nur die Hypothese H:„x* ist ein
Ausreißer“. Er kann nicht nachweisen, dass kein Ausreißer in
der Datenreihe ist. Das Gegenteil von „x ist Ausreißer“ heißt
nicht „x ist kein Ausreißer“, sondern „ich weiß nicht, ob x
ein Ausreißer ist“.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
3
4
5
6
7
8
9
10
12
14
16
18
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
125
145
90%
1,148
1,425
1,602
1,729
1,828
1,909
1,977
2,036
2,134
2,213
2,279
2,335
2,385
2,486
2,563
95%
1,153
1,436
1,671
1,822
1,938
2,031
2,109
2,177
2,287
2,372
2,442
2,505
2,557
2,663
2,745
2,811
2,866
2,914
2,956
2,992
3,025
3,055
3,082
3,107
3,130
3,151
3,171
3,189
3,207
3,281
3,328
99%
1,155
1,492
1,748
1,945
2,097
2,220
2,324
2,410
2,551
2,660
2,746
2,822
2,885
3,009
3,103
3,178
3,240
3,292
3,336
3,376
3,411
3,442
3,471
3,496
3,521
3,543
3,563
3,582
3,600
3,675
3,723
Seite 15 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
6.
Chi-Quadrat-Anpassungstest
6.1
Problemstellung
16 (25)
Lassen sich Stichprobenwerte in Klassen einteilen, enthält jede Klasse eine bestimmte Anzahl von Stichprobenwerten, die Klassenhäufigkeit. Die gesamte Stichprobe zeigt eine Häufigkeitsverteilung. Beim Wür feln ist die Augenzahl eines Würfels (hoffentlich) gleichverteilt. Die Augensumme zweier Würfel ist in ei ner Dreiecksform verteilt. Messwerte sind meist normalverteilt.
Der Anpassungstest prüft die Verträglichkeit experimenteller Daten mit einer erwarteten Verteilungsform.
Die in einem statistischen Experiment ermittelte Häufigkeitsverteilung einer Grösse x stimmt in der Regel
nicht genau mit der nach einem Wahrscheinlichkeitsmodell erwarteten Häufigkeitsverteilung überein.
Der Test soll entscheiden, ob die Abweichungen rein statistischer Natur sind, oder ob das Experiment vom
Statistik-Modell nicht richtig beschrieben wird.
Ein Test kann eine Aussage (Hypothese) mit einer bestimmter Wahrscheinlichkeit widerlegen, sie aber
nicht bestätigen oder gar beweisen.
Beim Test wird die gesamte Abweichung (Prüfgrösse) berechnet und mit dem Wert einer mathematischen
Funktion (Vergleichsgrösse) verglichen. Liegt die Prüfgrösse über der Vergleichsgrösse, kann die Hypothese
als widerlegt betrachtet werden.
6.2
Hypothese und Irrtumswahrscheinlichkeit
Im Beispiel werden n=100 mal drei Zahlen (zwischen 0 und 8) eines Zufallsgenerators addiert und in 13
Klassen der Breite 2 eingeteilt. Von einem Maximum im mittleren Bereich fällt die Verteilung nach aussen
hin ab, in der grössten Klasse ist die Häufigkeit gleich Null. Sind die Werte normalverteilt?
Hypothese: Die Werte stammen aus einer normalverteilten Grundgesamtheit.
Da die Antwort nicht mit absoluter Sicherheit gegeben werden kann, muss angegeben werden, welche Irrtumswahrscheinlichkeit (Signifikanzzahl) α beim Testergebnis noch akzeptiert wird. Das Gegenstück ist das
Signifikanzniveau (1-α)
z.B.: Irrtumswahrscheinlichkeit (Signifikanzzahl) α =5%
Dies heisst, dass ein Risiko von 5% besteht, dass die Hypothese abgelehnt wird, obwohl sie richtig ist (Feh ler 1. Art). Beim Fehler 2. Art wird die Hypothese akzeptiert, obwohl sie falsch ist.
Das Testergebnis ist eine von zwei möglichen Antworten:
Ergebnis 1 (Verwerfung der Hypothese): Die Grundgesamtheit ist nicht normalverteilt.
Ergebnis 2 (Annahme der Hypothese): Es spricht nichts gegen eine Normalverteilung der Grundgesamtheit
Gelingt die Widerlegung der Hypothese nicht, dann können die Abweichungen auch auf zufällige Schwankungen zurückgeführt werden. Ein Beweis für eine normalverteilte Grundgesamtheit ist damit aber nicht
erbracht.
6.3
Durchführung des Tests
Eine feste Schrittfolge sollte eingehalten werden:
●
Aufnahme der Daten (Urliste)
●
Festlegung des Signifikanzniveaus (oder der Irrtumswahrscheinlichkeit)
●
Berechnung von Umfang (Anzahl), Mittelwert und Standardabweichung (n-1)-gewichtet
●
Festlegung der k Klassen(-ober)grenzen
●
Bestimmung der absoluten Häufigkeiten h(i)
●
Berechnung der erwarteten absoluten Häufigkeiten e(i) (hier nach der Normalverteilung)
●
Berechnung von CHI-Quadrat Χ² = SUMME( [ (h(i) - e(i))^2 ] / e(i) )
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 16 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
17 (25)
●
Bestimmung der Vergleichsgrösse (Berechnung oder Tabellenwert)
●
Entscheidung über die Hypothese:
Χ²< = c : Hypothese annehmen
Χ² > c : Hypothese verwerfen
6.4
Achtung Fussangeln
Klasseneinteilung:
Der Merkmalsbereich wird in Klassen eingeteilt. Ist der Umfang der Stichprobe kleiner als 40, wählt
man etwa m=anz/6 Klassen. Andernfalls wählt man etwa m=Wurzel(anz), wobei m=20 aber normalerweise nicht überschritten werden muss.
Ist der Umfang anz<40, dann variiert man die Klassenobergrenzen so, dass die erwartete absolute Häufigkeit für jede Klasse mindestens 5 beträgt, da sonst die Aussagekraft des Tests eingeschränkt ist. Im
anderen Fall dürfen in den Randklassen auch Werte <5 stehen. Die Klassenbreiten müssen nicht gleich
gross sein.
Freiheitgrad:
Die Anzahl k der Klassen stellt den Freiheitgrad f dar. Allerdings wird für jede berechnete StatistikGrösse ein Freiheitgrad "verbraucht". Die Prüfgrösse "verbraucht" also immer einen Freiheitsgrad, also
f=k-1. In unserem Beispiel werden aber auch die Standardabweichung und der Mittelwert berechnet
(aus der Stichprobe ermittelt), also gilt hier f=k-3. Der Mittelwert muss aber hier gleich 12 sein, so
dass er auch fest vorgegeben werden kann; es gilt dann f=k-2.
vorgefertigte Testfunktionen:
In Programmpaketen zur Statistik wird der Chi^2-Test manchmal als fertige Funktion angeboten, in die
nur die gemessenen und erwarteten Häufigkeiten eingetragen werden müssen. Hier wird von einer be reits geeigneten Klasseneinteilung, sowie von sicherem Mittelwert und sicherer Standardabweichung
ausgegangen.
6.5
Funktionen in EXCEL
In EXCEL gibt es die fertige Testfunktion
=CHITEST(gemessen;erwartet)
mit den oben genannten Einschränkungen.
Die Prüfgrösse lässt sich berechnen mit der Funktion:
=CHIINV(wahrscheinlichkeit;freiheitsgrad)
z.B. CHIINV(0,05;2) = 5,99
Achtung: In EXCEL ist die Irrtumswahrscheinlichkeit (Signifikanzzahl) einzutragen, nicht das
Sicherheitsniveau.
Tabellenblatt dazu: anpassung.xls
6.6
Aufgabe zum CHI-Quadrat-Anpassungstest
Prüfen Sie mit dem CHI-Quadrat-Test, ob die Datenreihe mit den folgenden Werten bei einer Klassenbreite
von 2 auf dem 5%-Niveau als normalverteilt akzeptiert werden kann:
8
6
7
6
2
5
4
5
6
5
4
7
6
8
5
5
5
4
5
6
Anmerkung
Für kleinere Stichprobenumfänge (5≤n≤50) eignet sich besser der Shapiro-Wilk-Test, der allerdings nur auf
„Normalverteilung“ prüfen kann. Üblich ist dabei eine Irrtumswahrscheinlichkeit von α=5%. Eine
vorbereitete Online-Version des Tests findet sich auf http://dittami.gmxhome.de/shapiro/ .
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 17 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
7.
Trendtest nach Neumann
7.1
Zweck des Tests
18 (25)
Lassen sich die Werte einer Stichprobe in Reihenfolge bringen (z.B. zeitlich, örtlich), wird ein Trendtest
sinnvoll. Beim Vorliegen eines Trends erhält man eine grosse Standardabweichung und möglicherweise
verlieren dann weitere Auswerteverfahren ihren Sinn. Beim Vorliegen eines Trends sind die Abweichungen
benachbarter Werte voneinander im Schnitt geringer als vom Mittelwert.
Die Prüfgrösse PG ergibt sich aus der Summe der quadrierten Nachbarschaftsabstände Δ2 dividiert durch
die Varianz s2. Die Vergleichsgrösse VG liegt für verschiedene Signifikanzniveaus tabelliert vor.
Literatur: Sachs, Angewandte Statistik, Springer Berlin, 7.Auflage, S.481ff
7.2
Durchführung
Die Reihenfolge der Stichprobenwerte darf nicht verändert werden. Aus den Differenzen benachbarter
Stichprobenwerte ist die Prüfgrösse PG zu berechnen. Das gewünschte Signifikanzniveau (z.B 1%) bzw. das
Sicherheitsniveau (z.B. 99%) werden festgelegt. Die Vergleichsgrösse VG wird aus der Tabelle abgelesen.
Für PG<VG kann von einem vorliegenden Trend ausgegangen werden.
Für PG>VG kann nicht von einem vorliegenden Trend ausgegangen werden.
Der Test ist erst ab einem Stichprobenumfang von n=4 sinnvoll. Auch wenn sich innerhalb der Stichprobe
Trends verschiedener Richtung zeigen, spricht der Test an. Es gibt aber auch Fälle (z.B. Verklumpung), bei
denen der Test fälschlich einen Trend anzeigt.
Die Nullhypothese heisst: Ein Trend ist nicht erkennbar. Der Test kann diese Hypothese widerlegen, aber
nicht beweisen.
Ein Signifikanzniveau von z.B.1% besagt, dass nur in 1% der Tests, bei denen die Hypothese widerlegt
wurde, doch kein Trend in der Grundgesamtheit vorliegt.
7.3
Beispiel zum Trendtest
Im voliegenden Beispiel wird der Test in der Tabellenkalkulation durch eine Prozedur automatisch nach
jeder Eingabe oder nach Tastendruck ausgeführt.
Tabellenblatt
dazu
(mit
VBA-Prozedur):
neumann.xls
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 18 von 25
Carl-Engler-Schule Karlsruhe
8.
Linearitätstest
8.1
Zweck des Tests
Statistik-Script
19 (25)
Ergibt die Darstellung der Abhängigkeit zweier Größen voneinander in einem Diagramm näherungsweise
eine Gerade (Lineare Funktion), dann ist zu prüfen, ob die Daten nicht besser durch eine andere Funktion
angepasst werden sollten. Normalerweise wird als Alternative eine Parabel (quadratische Funktion)
verwendet. Zu jeder der bereits optimierten Funktionen werden die Residuen (die Reste), als die Abstände
der Punkte von der zugehörigen Kurve, berechnet, quadriert und aufsummiert (Χ²: Chi-Quadrat). Ist
dieser Wert für die Gerade deutlich größer als für die Parabel, ist die Gerade nicht geeignet, der
Zusammenhang also nichtlinear. Die Prüfgröße PG wird wieder aus den Daten, die Vergleichsgröße VG mit
Hilfe der F-Verteilung bestimmt. Die selbe VG erhält man auch bei Verwendung der um den Faktor n-1
kleineren Varianzen s² (n: Anzahl der Datenpunkte). Zwei verschiedene Linearitätstests (F-Test nach
Fisher bzw. Linearitätstest nach Mandel) liefern lassen sich anwenden. Der Linearitätstest nach Mandel
spricht etwas früher an als der Fisher-Test.
8.2
Durchführung
Berechnung der Größe ΧG² bzw. sG² für die Lineare Ausgleichsfunktion (Gerade)
Freiheitsgrad fG=n-2
Berechnung der Größe ΧP² bzw. sP² für die Quadratische Ausgleichsfunktion (Parabel)
Freiheitsgrad fP=n-3
Nullhypothese:
Die beiden Varianzen sG²und sP² unterscheiden
sich nicht signifikant
F-Test nach Fisher:
Prüfgröße PG = sG²/ sP² = ΧG²/ ΧP²
oder
Linearitätstest nach Mandel:
Prüfgröße PG = [(n-2)* sG² - (n-3)*sP²]/ sP²
in beiden Fällen (Signifikanzniveau α): Vergleichsgröße VG = Fn-2,n-3,α
Bei PG>VG wird die Hypothese abgelehnt, d.h. es gibt keine Linearität der Abhängigkeit.
8.3
Beispiel zum Linearitätstest
Das vorliegende Beispiel prüft die Linearität der Abhängigkeit der Signalgröße von der Merkmalsgröße bei
einer Kalibrierung. In der Tabellenkalkulation werden die Parameter der quadratischen Funktion nur im
Diagramm, nicht aber in der Tabelle ausgegeben. Daher werden sie separat durch Lösung eines Linearen
Gleichungssystems LGS berechnet. Die erforderlichen Größen lassen sich schrittweise berechnen.
Die Vergleichsgröße VG kann einer Tabelle entnommen werden oder läßt sich in der Tabellenkalkulation
berechnen mit der Formel
=FINV(α;fG;fP). Dabei ist α die Irrtumswahrscheinlichkeit (nicht das Signifikanzniveau) und liegt zwischen Null und Eins.
Tabellenblatt: linearitaet.xls
F-Test
Freiheitsgrad Zähler
Freiheitsgrad Nenner
Prüfgröße PG:
Vergleichsgröße VG:
Signifikanzniveau in %
6,00
Signalgröße
5,00
y = 0,8289x + 1,7519
4,00
3,00
2,00
Mandel
8
7
0,29352677 9,43749893
3,72571662 3,72571662
95,0
95,0
Testergebnis Ein Linearer Ausgleich ist akzeptiert
1,00
0,00
0,00
Fisher
ungünstig
y = -0,0607x 2 + 1,1144x + 1,4616
0,50
1,00
1,50
2,00
2,50
3,00
3,50
4,00
Merkm alsgröße
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 19 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
9.
Signifikanz- und Kontingenztest
9.1
Problemstellung
20 (25)
Was ist gemeint, wenn man sagt, die Konzentration zweier Lösungen unterscheide sich signifikant? Ab welchem Unterschied kann man ihn als signifikant bezeichnen?
Zur Entscheidung über die Hypothese „Beide Stichproben haben den selben Mittelwert“ wird die Wahr scheinlichkeit berechnet, mit der die eine Stichprobe nur zufällig vom Mittelwert der anderen Stichprobe
abweicht. Ist diese Wahrscheinlichkeit klein, z.B. kleiner als 1%, geht man davon aus, dass sich die beiden
Mittelwerte signifikant voneinander unterscheiden. Die oben genannte Hypothese gilt dann (auf dem 1%Niveau, bzw. 99%-Niveau) als widerlegt. Zur Entscheidung wird eine aus den Daten berechnete Prüfgröße
PG mit einer theoretisch bestimmten Vergleichsgröße VG verglichen.
Kann die Hypothese
nicht auf dem 95%nein
nein
nein
nicht signifikant
Niveau
widerlegt
ja
nein
nein
indifferent
werden,
ist
der
Unterschied
nicht
ja
ja
nein
signifikant
signifikant. Kann sie
ja
ja
ja
hoch signifikant
zwar
auf
dem
95%Niveau, nicht aber auf dem 99%-Niveau widerlegt werden, ist die Aussage indifferent und man sollte
weitere Daten hinzunehmen. Oberhalb des 99%-Niveaus ist das Erbgebnis signifikant und oberhalb des
99,9%-Niveaus sogar hochsignifikant.
PG>VG(95%)
PG>VG(99%)
PG>VG(99,9%)
Ergebnis
Es gibt viele unterschiedliche Fragestellungen, für die jeweils eine andere Berechnung erforderlich ist.
Statistik-Programme können mit all diesen Fällen korrekt umgehen.
9.2
Zwei typische Fälle
9.2.1 Signifikanztest (t-Test für den Vergleich der Gruppen-Mittelwerte)
Die Ausführungen hier beziehen sich auf die arithmetischen Mittelwerte zweier normalverteilter Stichproben mit beliebigem Umfang und mit als gleich anzunehmender Standardabweichung. Weder für die
Mittelwerte noch für die Standardabweichung sind theoretische Werte bekannt. Es liegen also nur die
Kenngrößen der beiden Stichproben vor. Getestet wird, ob sie bezüglich der Mittelwerte aus der gleichen
Grundgesamtheit stammen.
Die Prüfgröße PG wird nach der folgender
Formel berechnet.
PG=

n 1 n 2 n1n2−2
x 1 −x 2
∗
n1n 2
 n 1−1s 21n 2−1 s22
Die Vergleichsgröße VG stammt aus der t-Verteilung mit dem Freiheitsgrad f=(n 1+n2-2)
Von einer Lösungen wurden 14 Proben gezogen und jeweils 7 an einem Analysengerät untersucht.
Die Hypothese „Beide Geräte liefern den gleichen Mittelwert“ soll getestet werden. Die Analysen
liefern Massenkonzentrationen w in mg/L.
9.2.2 Signifikanztest (t-Test für einen Gruppen-Mittelwert gegen festen Mittelwert)
Will man testen, ob eine Stichprobe aus einer Grundgesamtheitstammen kann, deren Mittelwert bekannt
ist, wird die Prüfgröße PG aus Mittelwert und Standardabweichung der Stichprobe nach folgender Formel
berechnet:
PG=  n
X −
s
Die Vergleichsgröße VG stammt aus der t-Verteilung mit dem Freiheitsgrad f=(n-1)
Für eine Stichprobe vom Umfang n=7 soll die Hypothese „Die Grundgesamtheit hat den Mittelwert
w=78mg/L“ geprüft werden. Praktisch bedeutet das die Prüfung, ob ein vorliegendes Gebinde mit
der vorgeschriebenen Massenkonzentration von w=78mg/L verträglich ist.
Die wiederholte Berechnung für
„hochsignifikanter Unterschied“ zu.
statistikscript.odt
Okt 2013
unterschiedliche
www.ces.karlsruhe.de/culm/
Signifikanzniveaus
läßt
Aussage
Seite 20 von 25
Carl-Engler-Schule Karlsruhe
9.3
Statistik-Script
21 (25)
Kontingenztest (Vierfeldertafel, Kontingenztafel)
Der Test wird bei sog. kategorialen Daten angewendet (Stichprobe zerfällt in zwei Klassen, in den Zellen
müssen Zählwerte stehen). Es wird gezählt, wie viele Elemente in die eine bzw. in die andere Kategorie
fallen. Verglichen wird mit den Häufigkeiten einer anderen Untersuchung oder mit theoretisch ermittelten
Häufigkeiten. In einer Tabelle mit vier Feldern lässt sich die Berechnung einfach durchführen (Kontingenz
= zufälliges Zusammentreffen).
Beispiel:
Die Hypothese "20% der Bevölkerung sind Linkshänder" wird in einer Gruppe mit 30 Personen getestet. Man
findet nur einen Linkshänder. Ist damit die Hypothese wiederlegt, oder liegt das Ergebnis im Bereich zufälliger Schwankungen? Bei Ablehnung der Hypothese darf die Irrtumswahrscheinlichkeit nur α=5% betragen
(Signifikanzniveau 95%).
Linkshänder
Rechtshänder
Summe
Linkshänder
Rechtshänder
Summe
gezählt
a
b
a+b
gezählt
1
29
30
erwartet
c
d
c+d
erwartet
6
24
30
Summe
a+c
b+d
a+b+c+d
Summe
7
53
60
Die Prüfgrösse Χ2 wird errechnet nach der Formel:
X 2=
n∗ad −bc 2
abcd ac bd 
Χ2 = 60(24-174)2 / [30*30*7*53] = 4.043 (Prüfgröße PG)
Die zugehörige Vergleichsgrösse der Χ2-Verteilung ist VG=3.84 bei einem Signifikanzniveau von 95% für
einen Freiheitsgrad von f=1 (die Vierfeldertafel hat immer den Freiheitsgrad f=1). Die zugehörige Tabel lenfunktion ist =CHIINV(0,05;1). Da PG>VG gilt die Hypothese auf dem 95%-Niveau als widerlegt.
In EXCEL gibt es hierfür die Funktion CHITEST. Liegen die vier Felder z.B. in den Zellen B2:C3, dann lautet
die Formel =CHITEST(B2:C2;B3:C3) und liefert den Wert 0,0225. Die Wahrscheinlichkeit für eine so grosse
Abweichung ist 2.25%. Da dieser Wert kleiner als die vorher festgelegte Irrtumswahrscheinlichkeit von 5%
ist, gilt die Hypothese als wiederlegt.
9.4
Ergänzungen
Weitere Hypothesen können z.B. sein:
H0:
H0:
H0:
H0:
Der Mittelwert der Grundgesamtheit liegt zwischen 37 und 39. Die Standardabweichung ist 3.
Der Mittelwert der Grundgesamtheit liegt zwischen 37 und 39. Die Standardabweichung ist unbekannt.
Die Varianz der Grundgesamtheit ist 6.
Die Varianzen der beiden Grundgesamtheiten sind gleich gross.
Abhängig von der Fragestellung sind verschiedene Verteilungsfunktionen zu verwenden und die Prüfgrössen
nach unterschiedlichen Formeln zu berechnen.
Die Berechnung ist in der Mappe signifikanz.xls ausgeführt.
Achtung: In Tabellen bzw. Rechenfunktionen muss darauf geachtet werden, ob die Werte für einseitige
oder zweiseitige Fragestellungen bereit gestellt werden.
Aufgaben Testen Sie mit geeigneten unabhängigen Sichproben die Hypothesen:
a) Die Körpergrößen von Jungen und Mädchen sind gleich.
b) Das Durchschnittsalter der Physiker des 20.Jahrhunderts beträgt 69 Jahre.
c) 10% der Münzen tragen das Prägezeichen G (Karlsruhe)
Vermeiden Sie eine Vorauswahl vor dem Test, da sonst jedes beliebige Ergebnis erzielt werden kann.
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 21 von 25
Carl-Engler-Schule Karlsruhe
10.
Statistik-Script
22 (25)
Varianzanalyse (ANOVA)
10.1 Problemstellung
Bei der Varianzanalyse (ANOVA: ANalysis Of VAriance) wird die Gleichheit von mehreren Mittelwerten
(oder auch anderen Lageparametern) getestet. Dazu werden die Varianzen von Datengruppen miteinander
verglichen.
Bei einer typischen Fragestellung wird geklärt, ob Gruppen von Daten bezüglich des Mittelwertes aus der
selben Grundgesamtheit stammen, oder die Gruppe einen Einfluss auf den Mittelwert hat.
10.2 Verfahren
Von jeder Gruppe wird die Varianz bezüglich ihres Gruppenmittelwertes bestimmt und die Varianzen (mit
dem Gruppenumfang gewichtet) addiert. Dieser Wert wird verglichen mit der Varianz der (gewichteten)
Gruppenmittelwerte bezüglich des Mittelwerts aller Werte. Als Testverteilung dient die F-Verteilung.
10.3 Beispiel zur Varianzanalyse (Ringversuch)
Für eine einfache Varianzanalyse wird eine einzige Grösse (z.B. die Viskosität eines Motoröls) in vier verschiedenen Labors nach dem gleichen Verfahren (z.B. Höppler-Viskosimeter) jeweils fünfmal ermittelt.
Normalerweise ergibt jede Messung einen etwas anderen Wert und jedes Labor bestimmt aus seinen Messwerten einen Mittelwert als Laborergebnis.
Die Hypothese: "Es gibt keinen signifikanten Unterschied zwischen den Laborergebnissen." soll getestet
werden.
Wenn die Messwerte eines jeden Labors (innerhalb der Gruppe) schon stark streuen, können die Unter schiede in den Laborergebnissen (zwischen den Gruppen) zufällig sein. Es werden die Streuungen der zwischen den Gruppen mit denen innerhalb der Gruppen verglichen. Da keine statistische Aussage ganz sicher
ist, wird ein Signifikanzniveau (hier 5%) festgelegt.
Programme zur Datenanalyse (z.B. EXCEL - Extras - Analysefunktionen) sind für diese Form der Varianzanalyse bereits vorbereitet. In dem Verfahren wird die Anzahl der Messungen eines Labors durch die t-Verteilung berücksichtigt. Aus den eingegebenen Daten wird eine Prüfgrösse berechnet. Ist sie grösser als die
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 22 von 25
Carl-Engler-Schule Karlsruhe
Statistik-Script
23 (25)
Vergleichsgrösse (hier. kritischer F-Wert), dann gilt die Hypothese als widerlegt. In unserem Fall sind da mit also signifikante Unterschiede zwischen den Labors nachgewiesen. Es ist also von systematischen Unterschieden auszugehen. Der P-Wert im Beispiel gibt an, dass bei gleichen Varianzen ein so grosser F-Wert
nur in 1,11% der Fälle zu erwarten ist.
Folgende Voraussetzungen müssen für die Analyse erfüllt sein (sonst wird die Rechnung komplizierter):
o
in jedem Labor werden gleich viele Messungen durchgeführt (nicht notwendig, aber günstig)
o
die Messwerte sind normalverteilt
o
es sind keine Ausreisser enthalten
o
in jedem Labor erhält man etwa die gleiche Streuung der Messwerte (Varianz)
Jede der Bedingungen muss überprüft werden (Anpassungstest, Ausreissertest, Varianzenhomogenitätstest). Zum Test der Varianzengleichheit gibt es mehrere Verfahren. Der Test nach Hartley bildet den Quotienten aus dem Maximum und dem Minimum der Varianzen als Prüfgrösse. Die Vergleichsgrösse liegt ta belliert vor und liefert für den Fall des Beispiels einen zulässigen Wert von 20,6 bei einer Prüfgrösse von
1,54. (Sachs, Angewandte Statistik, Springer 1992, S.614)
Tabellenblatt: anova.xls
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 23 von 25
Carl-Engler-Schule Karlsruhe
11.
Statistik-Script
24 (25)
Statistische Versuchsplanung SVP
11.1 Ziele
Die statistische Versuchsplanung SVP (DoE: Design of Experiments) beschreibt Verfahren, die dabei helfen,
den Aufwand für einen Versuch zu reduzieren. Versuche mit Statistik-Auswertung werden in Labor und
Produktion z.B. für folgende Ziele eingesetzt:
Prozesse (eingesetzte Mittel, Zeit, Lagerplatz) verbessern
Produktqualität verbessern
Robuste Prozesse / Produkte planen
Produktqualität testen
Um aussagekräftige Ergebnisse zu erhalten, sollte einerseits ein großer Datenumfang vorliegen und andererseits Beziehungen zwischen Einflussfaktoren deutlich werden. Zur Planung und Auswertung gibt es
spezielle Programme, die auch helfen, typische Fehler zu vermeiden. Zwei einfache Probleme sind als
Beispiele dargestellt.
11.2 Erforderlicher Umfang der Stichprobe
Zwei Produktionsverfahren sollen mit Hilfe des t-Tests für zwei Stichproben-Mittelwerte miteinander ver glichen werden (siehe 9.2.1). Aus jedem Verfahren soll eine Stichprobe vom Umfang n entnommen werden. Ist n zu klein, kann der Test die Hypothese „Die Mittelwerte sind gleich“ nicht widerlegen, auch
wenn sie unterschiedlich sind. Was man als unterschiedliche Mittelwerte betrachtet, wird durch den Ausdruck (σ/∆µ) beschrieben, den Quotienten aus der (gleichen) Standardabweichung der Produktionen und
dem Abstand der Mittelwerte. Die SVP liefert folgende Regel:
erforderlicher Versuchsumfang zum t-Test für zwei Stichproben-Mittelwerte gegeneinander
N=2*n=60*(σ/∆µ)^2
(wenn sich N<40 ergibt, sollte man den Umfang vergrößern)
(mit der angegebenen Formel liefert der Test auf dem 99%-Niveau in 90% der Fälle das richtige Ergebnis)
Beispiel: Für einen Abstand der Mittelwerte von ∆µ=2 bei einer Standardabweichung von σ=3 ergibt sich so
ein erforderlicher Stichprobenumfang (je Produktionsverfahren) von n=68.
11.3 Beziehungen zwischen Einflussfaktoren
Neben den Verfahren „Regressionsanalyse“, „Korrelationsanalyse“ und „Varianzanalyse“ zählen hierzu die
„Screening-Versuchspläne“ als „vollständiger faktorieller Versuchsplan“ und „fraktioneller faktorieller
Versuchsplan“, die „Taguchi-Verfahren“ und weitere.
Beispiel: Um in einem Produktionsprozess die Einflüsse von Druck (A), Temperatur (B) und pH-Wert (C) auf
die Produktqualität zu untersuchen, muss jede Größe mindestens zwei unterschiedliche Werte (Stufen -,+)
annehmen. Daraus ergeben sich bereits 8 Kombinationen, für die jeweils eine eigene Stichprobe zu
erfassen und auszuwerten ist. Durch eine geeignete statistische Kombination der Aussagen erhält man mit
nur 4 Kombinationen eine (fast) so sichere Aussage (fraktioneller faktorieller Versuchsplan).
vollständiger faktorieller Versuchsplan
Nr
1
2
3
4
5
6
7
8
statistikscript.odt
A
+
+
+
+
B
+
+
+
+
Okt 2013
fraktioneller faktorieller Versuchsplan
C
+
+
+
+
Nr
1
2
3
4
www.ces.karlsruhe.de/culm/
A
+
+
B
+
+
C
+
+
Seite 24 von 25
Carl-Engler-Schule Karlsruhe
12.
Statistik-Script
25 (25)
Anhang
12.1 Simulation von Zufallszahlen
In der Tabellenkalkulation (und normalerweise in jeder Programmiersprache) lassen sich gleichverteilte
Zufallszahlen zwischen 0 und 1 erzeugen. Zufallszahlen mit 15 Dezimalstellen lassen sich erzeugen mit
=ZUFALLSZAHL()
Jede Änderung im Tabellenblatt (oder F9) führt zu einer neuen Zufallszahl. Durch Multiplikation bzw.
Addition lässt sich der Zufallsbereich erweitern bzw. verschieben.
Normalverteilte Zufallszahlen erhält man mit folgendem Befehl, mit dem auch der Mittelwert und die
Standardabweichung festgelegt werden können:
=NORMINV(ZUFALLSZAHL(): mittelwert; standardabweichung)
statistikscript.odt
Okt 2013
www.ces.karlsruhe.de/culm/
Seite 25 von 25