Carl-Engler-Schule Karlsruhe Statistik-Script 1 (25) Statistik-Script Inhaltsverzeichnis Statistik-Script........................................................................................................... 1 1. Teilgebiete der Statistik............................................................................................. 3 2. Kenngrößen der beschreibende Statistik ........................................................................4 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 Stichproben...................................................................................................................4 Lagemaße.....................................................................................................................4 Streumaße....................................................................................................................4 Standardfehler des Mittelwerts...........................................................................................5 Häufigkeiten..................................................................................................................5 Histogramm...................................................................................................................5 Statistik-Übung: Augensumme.............................................................................................6 Statistik mit dem Kugelkasten (Kombinatorik)..........................................................................7 2.8.1 Grundlagen........................................................................................................7 2.8.2 Binomialverteilung...............................................................................................7 2.8.3 Hypergeometrische Verteilung: ...............................................................................7 2.8.4 Geometrische Verteilung .......................................................................................7 2.9 Aufgaben zu Stichproben-Kenngrößen...................................................................................8 2.9.1 Stabilisierung der relativen Häufigkeit........................................................................8 2.9.2 Verteilung der Häufigkeiten....................................................................................8 2.10 Aufgaben zur Kombinatorik ..............................................................................................8 2.10.1 Reihenfolgen.....................................................................................................8 2.10.2 Lotto..............................................................................................................8 2.10.3 Binomialverteilung..............................................................................................8 2.10.4 Hypergeometrische Verteilung................................................................................8 2.10.5 Geometrische Verteilung......................................................................................8 2.11 Aufgaben zum Häufigkeitsdiagramm....................................................................................9 3. Normalverteilung.................................................................................................... 10 3.1 3.2 3.3 3.4 3.5 3.6 3.7 Problemstellung............................................................................................................10 Mathematische Beschreibung............................................................................................10 Dichte- und Verteilungsfunktion.........................................................................................10 Berechnung von Wahrscheinlichkeiten.................................................................................11 Wahrscheinlichkeits-Skalierung..........................................................................................11 Aufgabe zur Normalverteilung...........................................................................................11 Aufgabe zum Wahrscheinlichkeitsnetz .................................................................................11 4. Konfidenzintervalle.................................................................................................13 4.1 4.2 4.3 4.4 Standardfehler (Standardunsicherheit) des Mittelwerts.............................................................13 Konfidenzintervall des Mittelwertes....................................................................................13 Beispiel zum Konfidenzintervall.........................................................................................14 Aufgaben zum Konfidenzintervall.......................................................................................14 5. Ausreissertest nach Grubbs.......................................................................................15 5.1 Ziel des Tests...............................................................................................................15 5.2 Durchführung des Tests..................................................................................................15 5.3 Bemerkungen..............................................................................................................15 6. Chi-Quadrat-Anpassungstest .....................................................................................16 6.1 6.2 6.3 6.4 6.5 6.6 Problemstellung............................................................................................................16 Hypothese und Irrtumswahrscheinlichkeit.............................................................................16 Durchführung des Tests...................................................................................................16 Achtung Fussangeln........................................................................................................17 Funktionen in EXCEL.......................................................................................................17 Aufgabe zum CHI-Quadrat-Anpassungstest.............................................................................17 statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 1 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 2 (25) 7. Trendtest nach Neumann.......................................................................................... 18 7.1 Zweck des Tests............................................................................................................18 7.2 Durchführung...............................................................................................................18 7.3 Beispiel zum Trendtest....................................................................................................18 8. Linearitätstest....................................................................................................... 19 8.1 Zweck des Tests............................................................................................................19 8.2 Durchführung...............................................................................................................19 8.3 Beispiel zum Linearitätstest..............................................................................................19 9. Signifikanz- und Kontingenztest.................................................................................20 9.1 Problemstellung............................................................................................................20 9.2 Zwei typische Fälle........................................................................................................20 9.2.1 Signifikanztest (t-Test für den Vergleich der Gruppen-Mittelwerte)...................................20 9.2.2 Signifikanztest (t-Test für einen Gruppen-Mittelwert gegen festen Mittelwert)......................20 9.3 Kontingenztest (Vierfeldertafel, Kontingenztafel)...................................................................21 9.4 Ergänzungen................................................................................................................21 10. Varianzanalyse (ANOVA)......................................................................................... 22 10.1 Problemstellung...........................................................................................................22 10.2 Verfahren..................................................................................................................22 10.3 Beispiel zur Varianzanalyse (Ringversuch)............................................................................22 11. Statistische Versuchsplanung SVP..............................................................................24 11.1 Ziele........................................................................................................................24 11.2 Erforderlicher Umfang der Stichprobe ...............................................................................24 11.3 Beziehungen zwischen Einflussfaktoren...............................................................................24 12. Anhang............................................................................................................... 25 12.1 Simulation von Zufallszahlen...........................................................................................25 Die Größen, Methoden, Rechenverfahren und Darstellungsmöglichkeiten aus der Statistik spielen eine im mer größere Rolle bei der Verarbeitung von Daten, die im Bereich von Labor und Produktion anfallen. Es sind besonders die Verfahren zur Bewertung und Sicherung von Qualität, bei deren Anwendung und Inter pretation detaillierte Kenntnisse aus der Statistik erforderlich sind. Im Rahmen der Berufsausbildungen und -fortbildungen an unserer Schule werden jeweils Teile dieses Scripts erarbeitet und mit Hilfe einer Tabellenkalkulation geübt und veranschaulicht. Berufsschule Physiklaborant Berufsschule Chemielaborant Berufskolleg Chemisch-Technischer Assistent Fachschule für Technik (Chemietechnik) Das Script erhebt keinen Anspruch auf Vollständigkeit. Es gibt einen großen Umfang an Literatur zu den Grundlagen und zur Vertiefung. Die Inhalte dieses Scripts nehmen mit Formeln, Beispielen und Aufgaben Bezug auf die Möglichkeiten einer Tabellenkalkulation. Namen, Formelzeichen und Zahlenangaben von Größen sind an manchen Stellen der Literatur nicht einheitlich verwendet, besonders bei der Angabe von Größen mit Wahrscheinlichkeitsaussa gen. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 2 von 25 Carl-Engler-Schule Karlsruhe 1. Statistik-Script 3 (25) Teilgebiete der Statistik Die Statistik ist ein Themengebiet der Mathematik und lässt sich in (mindestens) fünf grosse Teilgebiete (Bereiche) einteilen: Die Wahrscheinlichkeitstheorie bildet die Grundlage. Sie ist eine mathematische Theorie, mit der Gesetzmässigkeiten und Rechenverfahren entwickelt und begründet werden können. Da man bei Vorhersagen nicht sicher sein kann, ob sie tatsächlich eintreten werden, es auf der anderen Seite verschiedene Niveaus von Sicherheiten gibt, ist der Begriff der Wahrscheinlichkeit der zentrale Begriff der Statistik. Die Wahrscheinlichkeit p wird durch einen Zahlenwert zwischen Null (unmöglich) und Eins (sicher) angegeben. Die Beschreibende Statistik (auch deskriptive Statistik) stellt Verfahren zur Verfügung, mit denen aus Stichproben Kennwerte (z.B. Mittelwerte, Streuwerte) bestimmt werden, so dass sich Stichproben miteinander vergleichen lassen. Die Parameterschätzung schließt aus den Kennwerten der Stichprobe auf die Kennwerte der Grundgesamtheit. Zur beschreibenden Statistik gehört auch die Bestimmung von Konfidenzintervallen (Intervall, in dem der richtige Wert mit einer angebbaren Sicherheit liegt). Die Beurteilende Statistik (auch induktive Statistik) stellt Verfahren zur Verfügung, mit denen sich Entscheidungen treffen lassen. Man nennt diese auch Testverfahren. Typische Tests sind der GrubbsTest (Ausreissertest), der Trendtest nach Neumann oder der Chi^2-Anpassungstest. Für einen Test wird eine Hypothese (Vermutung) formuliert und aus den Daten eine Prüfgröße berechnet. Diese wird mit einer Vergleichsgröße (aus einer Tabelle oder nach einer Formel) verglichen. Ziel ist es, die aufgestellte Hypothese zu widerlegen. Die Statistische Analyse (auch explorative Statistik) ermittelt, welche Beziehungen und Abhängigkeiten zwischen Datengruppen vorhanden sind. Die Werkzeuge hierzu sind sog. Multivariate Verfahren und die Vorgehensweise wird Data Mining genannt. Die zugehörige Mathematik ist nicht leicht und die Re chenverfahren sind meist aufwändig. Sie werden in der Praxis mit speziellen Programmen ausgeführt. Die Versuchsplanung (DoE: Design of Experiments) ermittelt, unter welchen Bedingungen ein Experiment Ergebnisse einer festgelegten Genauigkeit und Sicherheit liefert. So lassen sich neben den zu erfassenden Merkmalsgrößen z.B. die Zeitintervalle bestimmen, nach denen jeweils eine neue Stichprobe gezogen werden muss und der Umfang der Stichproben, der eine zuverlässige Aussage ermöglicht. In der Praxis sind oft viele Verfahren kombiniert, so dass die obige Aufteilung nicht sofort erkannt wird (z.B. bei der Bestimmung des Vertrauensbandes an einer Kalibriergeraden). Auch hier lassen sich die meisten Statistik-Verfahren nur mit Hilfe eines Computers ausführen. Der Anwender ist oft nicht in der Lage, die von den Programmen ausgeführten Schritte nachzuvollziehen oder zu überprüfen. Es ist jedoch hilfreich für die Auswahl von Alternativen und Parametern, wenn Zweck und Idee eines Verfahrens bekannt sind und Ergebnisse auf Plausibilität geprüft werden können. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 3 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 2. Kenngrößen der beschreibende Statistik 2.1 Stichproben 4 (25) Jede Messreihe die aus Werten besteht, die unter gleichen Bedingungen erfasst wurden, ist eine Stichprobe. Von den (endlich oder unendlich) vielen Messungen, die man sich vorstellen kann (dies ist die Grundgesamtheit), wurden n Stück (Messungen) durchgeführt. Die Anzahl n der Merkmalswerte (der Merkmalsgröße) nennt man auch den Umfang n der Stichprobe. Die ursprüngliche, unveränderte Werteliste heisst Urliste. Im Beispiel soll der Wurf mit zwei Würfeln simuliert werden. Die Augensumme stellt einen Messwert dar. In der Statistik sagt man dazu Merkmalswert. Die Merkmalswerte sind hier ganze Zahlen zwischen zwei und zwölf. Jeder Würfel wird in der Tabellenkalkulation simuliert mit der Formel: =GANZZAHL(6*ZUFALLSZAHL()+1) In der ersten Spalte wird der erste und in der zweiten Spalte der zweite Würfel simuliert. Die dritte Spalte enthält die Augensumme AS. Der Bereich in der Tabelle mit Platz für mindestens 100 Werte für die Augen summe erhält den Namen "werte". Bei jedem Eintrag in eine Zelle werden alle Zufallszahlen neu berechnet. Diese Automatik lässt sich unter Extras - Optionen ausschalten, so dass eine Neuberechnung nur noch mit der Funktionstaste F9 gestartet wird. Die Zahlen im Bereich "werte" sind unsere Stichprobe. Von ihr sollen verschiedene Kennwerte berechnet werden. Der erste ist der Umfang n, der in der Tabellenkalkulation automatisch ermittelt wird mit der Funktion: =ANZAHL(werte) 2.2 Lagemaße Der arithmetische Mittelwert (oder Durchschnitt oder 1. Moment) ist der gebräuchlichste Wert, um die Lage der Stichprobenwerte anzugeben. In der Tabellenkalkulation wird er berechnet mit dem Befehl: =MITTELWERT(werte) Zieht man mehrere gleichartige Stichproben (d.h. macht mehrere gleichartige Messungen), erhält man je weils etwas unterschiedliche Mittelwerte. Der Standardfehler des Mittelwerts beschreibt diese Schwankung. Er lässt sich aus der Standardabweichung berechnen, indem man diese durch die Wurzel aus dem Umfang n der Stichprobe dividiert. Weitere lagemaße sind der Median, das harmonische Mittel, das gewogene Mittel oder das gestutzte Mittel (siehe Funktionsasssistent der Tabellenkalkulation). 2.3 Streumaße Die Streumaße beschreiben Intervalle (Bereiche) um das Lagemaß, in denen die Werte der Stichprobe anzutreffen sind. Die Differenz aus Maximum und Minimum ergibt die Spanne (oder Spannweite): =MIN(werte) =MAX(werte) =MAX(werte) - MIN(werte) Eine automatische Markierung von Minimum und Maximum lässt sich über Format - bedingte Formatierung einrichten. Da ein Ausreisser die Spanne sehr vergrössert, wäre ein durchschnittlicher Abstand zum Mittelwert sinn voll. Aus theoretischen Gründen (Normalverteilung) wird hierfür jedoch meist die Varianz verwendet (mittlere quadratische Abweichung). Da sie aber die quadrierte Masseinheit der Stichprobenwerte hat, verwendet man auch die anschaulichere Standardabweichung. Die Standardabweichung ist die (Quadrat-)Wurzel aus der Varianz. =VARIANZ(werte) =STABW(werte) Der Variationskoeffizient V (auch relative Standardabweichung) ergibt sich aus dem Quotienten Standardabweichung/Mittelwert und wird als Dezimalzahl oder als Prozentzahl angegeben. Die Angabe ist nur brauchbar, wenn die Streuung deutlich kleiner ist als die vorkommenden Merkmalswerte. Die Quartile geben an, an welchen Stellen das 1., 2. bzw. 3.Viertel der Datenmenge endet. =Quartile(werte;quartil) 0: Minimum 1: 1.Quartil 2: 2.Quartil (Median) 3: 3.Quartil 4: Maximum statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 4 von 25 Carl-Engler-Schule Karlsruhe 2.4 Statistik-Script 5 (25) Standardfehler des Mittelwerts Untersucht man mehrere Stichproben aus der selben Grundgesamtheit, wird man unterschiedliche Mittelwerte erhalten. Trotz grosser Standardabweichung in den Stichproben werden die Mittelwerte nahe beieinander liegen. Die Abstände zwischen diesen Mittelwerten sind um so kleiner, je grösser der Umfang der Stichproben ist. Dies wird durch den Standardfehler des Mittelwertes angegeben. Er wird berechnet, indem man die Standardabweichung der Stichprobe durch die Wurzel aus N (Umfang) dividiert. Er wird auch mit SEM: Standard Error Mean bezeichnet. Mit Hilfe des Standardfehlers des Mittelwerts (und Werten aus der t-Verteilung) lassen sich Konfidenzintervalle (Vertrauensintervalle) um den Mittelwert bestimmen (siehe Kap. 4). 2.5 Häufigkeiten Sortiert man die Urliste nach den Merkmalswerten über Daten - Sortieren, dann kann man leicht abzählen, wie oft ein bestimmter Wert (bzw. ein Wert innerhalb eines festgelegten Intervalls) vorgekommen ist. Man erhält die absoluten Häufigkeiten. Dieses Abzählen lässt sich auch ohne Sortieren automatisch durchführen. Die zugehörige Funktion ist eine Matrix-Funktion und muss auf besondere Weise eingegeben werden. In einem Bereich (Name "klassen") werden die Klassenobergrenzen angegeben. Für die spätere DiagrammDarstellung bleibt eine Spalte noch frei. Dann wird der Bereich für die Häufigkeitswerte markiert. Bei bestehender Markierung wird die Formel eingetragen: =HÄUFIGKEIT(werte;klassen) Dabei ist auf das eingestellte Trennzeichen, hier ";" zu achten. Die Übernahme erfolgt mit der Tastenkombination <shift><strg><enter>. Die Häufigkeiten sind von den Grenzen der Klassen abhängig. Die Anzahl m der Klassen sollte so gewählt werden, dass es mindestens eine Häufigkeit grösser als zwei gibt. Mehr als 20 Klassen sind oft nicht sinnvoll. Dazwischen kann m gleich Wurzel aus n gelten. 2.6 Histogramm Die Häufigkeiten lassen sich absolut oder relativ schön in einem Histogramm (auch Stabdiagramm) darstel len (Balken: waagrechte Stäbe; Säulen: senkrechte Stäbe). Sollen statt der Klassenobergrenze zur Be schriftung die Klassenmitten verwendet werden, dann können diese in der noch frei gehaltenen Spalte ein getragen oder berechnet werden. 15 15 Histogramm 14 12 Histogramm 11 10 Häufigkeit Häufigkeit 10 7 6 5 3 5 3 1 1 0 0 0 2 5 8 11 0 0 -1 0 -1 1 0 1 1 3 5 7 9 Klas s e nm itte n 14 Klas se nm itte n 15 Histogramm 10 10 Klasseneinteilung abhängig Häufigkeit Häufigkeiten sind von der 8 6 5 4 1 1 0 0 0 0 2 4 6 8 10 Klas s enm itte n statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 5 von 25 Carl-Engler-Schule Karlsruhe 2.7 Statistik-Script 6 (25) Statistik-Übung: Augensumme Beim Würfeln mit drei Würfeln zeigt jeder Würfel eine Augenzahl. Die Summe davon ist die Augensumme AS. Manche Werte von AS kommen seltener, andere häufiger vor. Durch die Simulation in einem Tabellenblatt lassen sich diese Eigenschaften untersuchen. Die Grundgesamtheit ist die Menge aller durchführbaren Würfe. Die Ausführung von n Würfen stellt eine Stichprobe vom Umfang n dar, mit dem Merkmal Augenzahl und Merkmalswerten im Bereich von 3 bis 18. Ein Wurf eines einzelnen Würfels wird mit =GANZZAHL(6*ZUFALLSZAHL())+1 simuliert. Zufallszahlen liegen zwischen 0 und 1 und werden nach jeder Eingabe in die Tabelle (oder F9) neu berechnet. Durch geeignetes Kopieren kann schnell eine Tabelle mit vielen Würfen mit drei Würfeln erzeugt werden. Mit Funktionen, die von der Tabellenkalkulation bereit gestellt werden, lassen sich viele Kenngrößen der beschreibenden Statistik berechnen (siehe Formelsammlung). Eine Vereinfachung ergibt sich auch, wenn der gesamte Bereich der Augensumme mit einem Namen (z.B. AS) belegt wird. Beobachtet man eine Zelle aus AS und aktualisiert ständig (mit F9), erhält man Werte über den gesamten zulässigen Bereich. Beobachtet man dagegen der arithmetischen Mittelwert, ändert sich dieser vergleichsweise wenig. Er zeigt eine geringere Streuung. Es ist also zu unterscheiden zwischen der Streuung der Stichprobenwerte und der Streuung des Mittelwertes (siehe 2.4 Standardfehler des Mittelwertes). Man stellt auch fest, dass die mittleren Werte bei der Augensumme häufiger vorkommen. Durch die Einteilung des Merkmalbereichs in Klassen und die Bestimmung der absoluten bzw. relativen Häufigkeiten lässt sich diese Beobachtung grafisch in einem Säulendiagramm darstellen. Man kann jetzt vermuten, dass die Daten normalverteilt sind und zum Vergleich eine Normalverteilung dazu zeichnen. Ifür das Diagramm der absoluten Häufigkeiten muss die Standard-Normalverteilung mit der Klassenbreite und dem Umfang der Stichprobe multipliziert werden. =NORMVERT(klassenmitte;mittelwert;standardabweichung;FALSCH) * klassenbreite * umfang Mit einem CHI-Quadrat-Test (beurteilende Statistik) lässt sich prüfen und entscheiden, ob die vorhandenen Unterschiede gegen eine Normalverteilung sprechen. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 6 von 25 Carl-Engler-Schule Karlsruhe 2.8 Statistik-Script 7 (25) Statistik mit dem Kugelkasten (Kombinatorik) 2.8.1 Grundlagen Oft ist es nicht möglich, oder zu aufwändig, alles zu messen oder zu zählen, was eigentlich interessant und wichtig wäre. Man beschränkt sich daher auf eine Stichprobe und schließt daraus auf die Eigenschaften der Grundgesamtheit. Viele Begriffe, Formeln und Verfahren lassen sich dazu mit dem sog. Kugelkasten (früher nannte man es Urne) erklären und simulieren. In einem Kasten befinden sich z.B. N=10000 Kugeln (Grundgesamtheit oder bei der Qualitätssicherung Losumfang). Diese haben bestimmte Merkmale (z.B. weiss, rot, schwarz, grün). Aus dem Kasten wird blind eine Kugel herausgenommen, die Farbe notiert und wieder in den Kasten zu rückgelegt. Man zieht nacheinander z.B. eine Anzahl von n=200 Kugeln (Ziehung einer Stichprobe). Die Stichprobe hat einen Umfang von n=200. Hat man dabei z.B. k=18 rote Kugeln erwischt, ist die absolute Häufigkeit h(rot)=18, die relative Häufigkeit r(rot)=h(rot)/n=18/200=0,09 (oder 9%). Man wird jetzt vermuten, dass im Kugelkasten etwa 9% der Kugeln rot sind, was aber nicht ganz sicher ist und nicht genau stimmen muss. Bei jeder Ziehung kann ein anderes Ergebnis herauskommen. Man wird sagen, dass die Wahrscheinlichkeit für das Ziehen einer roten Kugel p(rot)=9% beträgt. Bei der Untersuchung des gesamten Inhalts hat sich allerdings ergeben, dass von 10000 Kugeln 800 Kugeln rot sind. Ein wichtiger Satz in der Statistik ist die Annahme, dass die relative Häufigkeit um so weniger schwankt und damit die Aussagen um so sicherer werden, je größer der Umfang der Stichprobe ist. Mit dem Kugelkasten lassen sich verschiedene Modelle aus der Statistik durchspielen. Im Kugelkasten befinden sich N Kugeln von denen M Stück rot sind. Für die Berechnungen werden die Binomialkoeffizienten benötigt, die über folgende Formel definiert sind: n! n = k !∗n−k ! k Sie gibt die Anzahl der möglichen unsortierten Kombinationen bei der Auswahl von k aus n Elementen an. Die Fakultät n! Wird berechnet durch n!=1*2*3* ... (n-1)*n mit 0!=1 n unterschiedliche Objekte lassen sich in n! verschiedenen Reihenfolgen anordnen. 2.8.2 Binomialverteilung Es wird nacheinander eine feste Anzahl n von Kugeln gezogen und die Farbe notiert. Jede Kugel wird sofort wieder in den Kasten zurückgelegt. Die Anzahl k der gezogenen roten Kugeln (von N gezogenen Kugeln) wird für die Auswertung notiert. Die Wahrscheinlichkeit für das Ereignis „es sind k rote Kugeln gezogen“ ist: n−k k f k = n p 1− p k Das Zurücklegen lässt den Anteil roter Kugeln im Kasten konstant und entspricht damit einem Kugelkasten mit unendlich viele Kugeln. 2.8.3 Hypergeometrische Verteilung: Man verfährt wie im vorhergehenden Fall, legt die gezogenen Kugeln jedoch nicht wieder zurück. Es ist das Gleiche, wie wenn man alle n Kugeln auf einmal entnimmt. Die Wahrscheinlichkeit für das Ereignis „es sind k rote Kugeln gezogen“ ist: M ⋅ N −M k n−k f k = Nn 2.8.4 Geometrische Verteilung Es wird nacheinander jeweils eine Kugel entnommen und wieder zurück gelegt, bis eine rote Kugel gezogen wird. Die Anzahl k der gezogenen Kugeln (mit der roten) wird notiert. Die Wahrscheinlichkeit für das Ereignis „es wurden k Kugeln gezogen“ ist: f k = p⋅ 1− p statistikscript.odt Okt 2013 k−1 www.ces.karlsruhe.de/culm/ Seite 7 von 25 Carl-Engler-Schule Karlsruhe 2.9 Statistik-Script 8 (25) Aufgaben zu Stichproben-Kenngrößen Prüfen Sie an einem Stichproben-Beispiel vom Umfang n=6, ob sich nach allen Formeln der gleiche Wert für die Varianz ergibt. n 1 2 s= xi− x ∑ n−1 i =1 2 n 1 s= x 2i −n x 2 ∑ n−1 i =1 2 n 1 s= ∑ x 2i −n x 2 n−1 i=1 2 2.9.1 Stabilisierung der relativen Häufigkeit Simulieren Sie in der Tabellenkalkulation das Werfen einer Münze mit den möglichen Ereignissen Kopf (0) oder Zahl (1) durch entsprechende Zufallszahlen. Führen Sie etwa m=100 Ziehungen (Würfe) durch. Summiert man die Ergebnisse, erhält man die Anzahl der Ereignisse „Zahl“. Berechnen Sie für jeden Wurf die relative Häufigkeit von „Zahl“ bei den bisherigen Würfen und stellen den Verlauf dieser Werte in einem Diagramm dar. Interpretieren Sie das Diagramm. 2.9.2 Verteilung der Häufigkeiten Laden Sie das Tabellenblatt kugelkasten.xls und simulieren Sie jeweils eine Ziehung durch Drücken der Taste F9. Wählen Sie eine Wahrscheinlichkeit für Rot von p=0,1. Der Stichprobenumfang liegt bei n=60. Bestimmen Sie die absoluten Häufigkeiten der einzelnen Ergebnisse (rot), indem Sie eine Strichliste erstellen. Stellen Sie die Häufigkeitsverteilung in einem Säulendiagramm dar. Skalieren Sie sowohl in absoluten als auch in relativen Häufigkeiten. Berechnen Sie Mittelwert und Standardabweichung und markieren Sie den dadurch festgelegten Streubereich auf der Merkmalsachse (x-Achse) des Diagramms. Schätzen oder berechnen Sie den Anteil der Würfe, die innerhalb bzw. außerhalb dieses Bereichs liegen. 2.10 Aufgaben zur Kombinatorik 2.10.1 Reihenfolgen In einer Arztpraxis warten 6 Patienten. Wie viele Möglichkeiten der Einteilung zur Behandlung hat die Arzthelferin (alles Kassenpatienten)? 2.10.2 Lotto Wie viele verschiedene Spiele gibt es beim Lotto? 2.10.3 Binomialverteilung Von 50 Spritzen einer Packung für die Gaschromatografie sind 3 undicht. Wie groß ist die Wahrscheinlichkeit, dass von 4 entnommenen Spritzen mehr als eine undicht ist? 2.10.4 Hypergeometrische Verteilung Die Wahrscheinlichkeit für eine fehlgeschlagene Analyse an einem Analyseautomaten ist p=0,01. Pro Tag werden 120 Analysen durchgeführt. Stellen Sie die erwarteten Häufigkeiten an fehlgeschlagenen Analysen pro Tag in einem Säulendiagramm dar. Wie groß ist die Wahrscheinlichkeit, mehr als drei Fehlanalysen an einem Tag zu erhalten? 2.10.5 Geometrische Verteilung Von den Spritzen für die Gaschromatografie sind im Schnitt 6% undicht. Wie groß ist die Wahrscheinlich keit, dass die ersten fünf entnommenen Spritzen dicht sind? statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 8 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 9 (25) 2.11 Aufgaben zum Häufigkeitsdiagramm In einer Produktionshalle wird die Temperatur (Auflösung 0,1K) zwischen 8.00Uhr und 17.00Uhr im 10-Minutentakt gemessen und gespeichert (erste Messung um 8.05 Uhr). Zur Auswertung wird ein Häufigkeitsdiagramm mit den Klassenobergrenzen 17°C, 19°C, 21°C ... 35°C erstellt. Zeichnen Sie die erwarteten Häufigkeitsdiagramme. 1. 2. 3. 4. Die Temperatur wird von der Klimaanalage auf 22,2°C gehalten. Die Temperatur wird von der Klimaanalage (schwankend) zwischen 22,0°C und 24,0°C gehalten. Bis 13.00Uhr beträgt die Temperatur 26°C, dann fällt sie rasch wegen geöffneter Tore auf 22°C. Die Temperatur steigt bis 12.30Uhr gleichmäßig von 19,1°C auf 30,9°C und fällt am Nachmittag ebenso gleichmäßig wieder auf 19,1°C zurück. 5. Die Temperatur steigt bis 10.00Uhr gleichmäßig von 19,1°C auf 30,9°C und fällt anschließend bis 17.00Uhr gleichmäßig wieder auf 19,1°C zurück. 6. Die Temperatur steigt bis 11.00Uhr gleichmäßig von 19,1°C auf 30,9°C, liegt zwischen 11.00Uhr und 13.00Uhr bei 30,9°C und fällt am Nachmittag gleichmäßig von 30,9°C auf 25,1°C zurück. statistikscript.odt Häufigkeitsdiagramm Häufigkeitsdiagramm Häufigkeitsdiagramm Häufigkeitsdiagramm Häufigkeitsdiagramm Häufigkeitsdiagramm Okt 2013 www.ces.karlsruhe.de/culm/ Seite 9 von 25 Carl-Engler-Schule Karlsruhe 3. Normalverteilung 3.1 Problemstellung Statistik-Script 10 (25) Die Merkmalswerte einer Stichprobe zeigen eine Streuung. In bestimmten Fällen, z.B. beim Würfeln, soll ten alle Merkmalswerte etwa mit gleicher Häufigkeit vorkommen. In diesem Fall liegt eine Gleichvertei lung vor. Sind die Merkmalswerte von mehreren Faktoren zufällig beeinflusst, werden die Merkmalswerte in der Nähe des Mittelwerts häufiger vorkommen, als weiter entfernte. Bei grossem Stichprobenumfang lässt sich die erwartete Verteilung durch die Formel der Normalverteilung oder Gaussverteilung beschrei ben. 3.2 Mathematische Beschreibung Für einen gegebenen Mittelwert und eine gegebene Standardabweichung wird mit der folgender Formel die sog. Dichtefunktion (Glockenkurve) berechnet: Die um den Mittelwert symmetrische Form drückt die nach aussen abnehmende erwartete Häufigkeit aus. Die Funktionswerte sagen jedoch nur wenig aus. Die verwertbaren Ausssagen sind in der Fläche zwischen Kurve und x-Achse enthalten (Integration). Durch den Faktor (vor der e-Funktion) wird die Gesamtfläche auf den Wert 1 (100%) normiert. Die zu einen Intervall (auf der x-Achse) gehörende Teilfläche gibt die Wahrscheinlichkeit für einen Wert innerhalb dieses Intervalls an. 3.3 Dichte- und Verteilungsfunktion Für die Integration benötigt man die Stammfunktion. Sie heisst Verteilungsfunktion der Normalverteilung (NV) oder auch Summenkurve der NV. Diese Funktion kann nicht in einer geschlossenen Formel angegeben werden, aber sie existiert. Es gibt dazu jedoch (beliebig genaue) Näherungsfunktionen. In Tabellenkalkulationen oder Statistik-Programmen sind sie verfügbar, in Tabellenwerken liegen ihre Funktionswerte tabelliert vor. Die Integrationskonstante ist dabei immer so gewählt, dass sich beim Mittelwert der Funktionswert 0.50 ergibt. bzw. das Integral von -unendlich bis +unendlich den Wert 1 erhält. Diese spezielle Stammfunktion ist die Verteilungsfunktion (Summenkurve) der Normalverteilung. In einer Tabellenkalkulation lassen sich die Funktionswerte der Dichtefunktion und der Verteilungsfunktion auch mit der vorbereiteten Funktion =NORMVERT(...) berechnen. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 10 von 25 Carl-Engler-Schule Karlsruhe 3.4 Statistik-Script 11 (25) Berechnung von Wahrscheinlichkeiten Für Wahrscheinlichkeitsberechnungen wird die Verteilungsfunktion verwendet. In der Standardform wird die unabhängige Variable in Vielfachen der Standardabweichung angegeben. Die Differenz zweier Funktionswerte gibt die erwartete Häufigkeit eines Merkmalswertes im zugehörigen Intervall (der x-Achse) an. So lässt sich ermitteln, dass im Bereich bis zu einer Entfernung von einer Standardabweichung vom Mittelwert 68.269% der Werte zu erwarten sind. Weitere häufig verwendete Intervalle sind in der Tabelle ange geben. Intervall (in Standardabweichungen) Flächenanteil (Wahrscheinlichkeit) µ-1σ< µ < µ+1σ 0.68269 µ-2σ< µ < µ+2σ 0.95450 µ-3σ< µ < µ+3σ 0.99730 µ-1.65σ< µ < µ+1.65σ 0.900 µ-1.96σ< µ < µ+1.96σ 0.950 µ-2.58σ< µ < µ+2.58σ 0.990 Üblicherweise werden Grössen der Grundgesamtheit mit griechischen Buchstaben, die der Stichprobe mit lateinischen Buchstaben bezeichnet. 3.5 Wahrscheinlichkeits-Skalierung Durch eine geeignete Verzerrung der Skalierung der y-Achse (Wahrscheinlichkeitspapier), lässt sich die Verteilungsfunktion der Normalverteilung als Gerade darstellen (probability plot). Abweichungen von der Normalverteilung führen zu einer Abweichung von der Geraden. Zur Darstellung werden die Stichproben werte in eine aufsteigende Reihenfolge gebracht und von i=1 bis n durchnummeriert. Über jedem Merkmalswert wird der Prozentwert Y im Wahrscheinlichkeitsnetz aufgetragen. Y= i−0,5 ∗100 n Bei einem sehr großen Umfang der Stichprobe wird in der Regel in Klassen eingeteilt. Die relativen Häufigkeiten werden schrittweise zu Y aufsummiert und über der Klassenmitte im Wahrscheinlichkeitsnetz aufgetragen. 3.6 Aufgabe zur Normalverteilung In einer Abfüllanlage für ein Pulver streut die Abfüllmasse mit einer Standardabweichung von 3g. Es sollen Packungen mit m=60g abgefüllt werden. Höchstens 5% der Packungen dürfen eine Masse von weniger als 60g haben. a) Auf welchen Mittelwert ist die Anlage einzustellen? b) Wie groß ist die Materialeinsparung, wenn eine neue Anlage eingesetzt wird, die nur noch eine Standardabweichung von 1g aufweist? 3.7 Aufgabe zum Wahrscheinlichkeitsnetz Stellen Sie die Summenkurve für folgende Messreihe im obigen Wahrscheinlichkeitsnetz grafisch dar: 6; 4; 10; 8; 6; 9; 8; 7; 5; 7 Es ergibt sich hier eine Treppenfunktion (Stufen), die durch eine Gerade auszugleichen ist. a) Bestimmen Sie den Mittelwert und die Standardabweichung rechnerisch und aus dem Diagramm. Wählen Sie eine geeignete Skalierung der Merkmalsachse. b) Stellen Sie eine Normalverteilung mit einem Mittelwert von 9 und einer Standardabweichung von 3 als Gerade dar. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 11 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 12 (25) 99,9% 99% 95% 90% 70% 50% 30% 10% 5% 1% 0,1% 99,9% 99% 95% 90% 70% 50% 30% 10% 5% 1% 0,1% statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 12 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 13 (25) 4. Konfidenzintervalle 4.1 Standardfehler (Standardunsicherheit) des Mittelwerts Untersucht man das Merkmal einer Stichprobe, dann wird der Mittelwert der Stichprobe in der Regel nicht genau mit dem Mittelwert der Grundgesamtheit übereinstimmen. Zieht man mehrere Stichproben aus der Grundgesamtheit, so lässt sich die Standardabweichung der einzelnen Mittelwerte berechnen. Diese nennt man den Standardfehler des Mittelwerts. Er ist immer kleiner als der Mittelwert der einzelnen Standardabweichungen. In den Begriffen aus dem Bereich der Qualitätssicherung spricht man besser (bei unveränderter Bedeutung) von der Standardunsicherheit als vom Standardfehler. Der Standardfehler des Mittelwerts lässt sich aus einer einzelnen Stichprobe abschätzen durch: In diesem damit beschriebenen Intervall ist der Mittelwert der Grundgesamtheit mit 68%-iger Wahrscheinlichkeit zu finden. Intervalle, die den Mittelwert der Grundgesamtheit auch mit einer anderen Wahrscheinlichkeit α einschliessen, nennt man Konfidenzintervalle zum Signifikanzniveau α. Die Formel geht von der Standardabweichung der Grundgesamtheit aus. Da sie hier jedoch nur durch die Stichprobe geschätzt wird, ist eine Korrektur (durch die t-Verteilung) erforderlich. 4.2 Konfidenzintervall des Mittelwertes Das Konfidenzintervall gibt einen meist symmetrischen Bereich um den Mittelwert der Stichprobe an, innerhalb dessen der Mittelwert der Grundgesamtheit mit einer festgelegten Sicherheit zu erwarten ist. Verwendete Bezeichnungen: n Umfang der Stichprobe x( i ) Merkmalswert ∆x Abstand zur Intervallgrenze s Standardabweichung α Irrtumswahrscheinlichkeit t Quantil der t-Verteilung Je größer die Sicherheit bzw. je kleiner die Irrtumswahrscheinlichkeit sein soll, desto weiter werden die Intervallgrenzen vom Stichproben-Mittelwert entfernt sein. Die Größe des Konfidenzintervalls hängt also vom Stichprobenumfang, von der Varianz und der noch akzeptierten Irrtumswahrscheinlichkeit ab. Der Stichprobenumfang geht nur mit der Wurzel in die Berechnung ein, so dass z.B. bei vierfachem Umfang die Intervallbreite nur halbiert wird. Sinnvoller als eine Erhöhung der Anzahl der Messungen ist es also, wenige Messungen sorgfältig und genau auszuführen. Kleine Irrtumswahrscheinlichkeiten α führen zu sehr großen Konfidenzintervallen (Achtung!). Der Zusammenhang wird durch eine besondere mathematische Funktion, die t-Verteilung (auch Student-Verteilung genannt) beschrieben. Deren Werte sind tabelliert oder können von Computerprogrammen berechnet werden. Das Verfahren geht davon aus, dass die Grundgesamtheit normalverteilt ist (prüfbar z.B. mit CHIQuadrattest). Diese Bedingung ist in der messtechnischen Praxis häufig erfüllt. Außerdem wird davon ausgegangen, dass die Varianz der Grundgesamtheit nicht genau bekannt ist, denn sie wird ja nur aus der Varianz der Stichprobe geschätzt. Der t-Faktor hängt damit auch von n ab. Dies wird bei der Berechnung des t-Faktors mit der Größe Freiheitsgrad f berücksichtigt, die in diesem Fall dann den Wert (n-1) besitzt. Der Erwartungswert für x mit dem Konfidenzintervall ergibt sich somit nach der Formel: Die zugehörige Quantile der t-Verteilung lässt sich in einer Tabellenkalkulation berechnen mit der Funktion =TINV(α;f) Sie liefert z.B. für =TINV(0,05;4) den Wert 2,7765. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 13 von 25 Carl-Engler-Schule Karlsruhe 4.3 Statistik-Script 14 (25) Beispiel zum Konfidenzintervall Die Datenreihe 22; 24; 29; 22; 23 hat einen Umfang von n=5, einen Mittelwert von xm=24 und eine Standardabweichung von s= 2,92. Bei einer Irrtumswahrscheinlichkeit von p=5% (Signifikanzniveau 95%) und dem Freiheitsgrad n-1=4 ist der t-Faktor t=2,78. Der Grenzabstand vom Mittelwert beträgt damit (t*s)/√(n)=1,24*s=3,62. In der folgenden Tabelle ist der Grenzabstand in Standardabweichungen ausgedrückt und das Konfidenzintervall ist beispielhaft für einen Mittelwert von 5 angegeben. Für den Fall bekannter Varianz stammt der entsprechende Faktor aus der Normalverteilung (und nicht aus der t-Verteilung) und hängt selbst nicht mehr von n ab. Für das Sicherheitsniveau von 95% hat er den Wert 1.96. Bei grossem Stichprobenumfang gleichen sich die Werte an (bereits durch √(n) dividiert). Z.B.: für n=5 ( 95%) Faktor 0.880 (Normalverteilung) statt t=1.240 (t-Verteilung) für n=25 (95%) Faktor 0.390 (Normalverteilung) statt t=0.413 (t-Verteilung) für n=100 (95%) Faktor 0.196 (Normalverteilung) statt t=0.198 (t-Verteilung) Das Verfahren zur Bestimmung des Konfidenzintervalls des Mittelwerts einer Stichprobe bei unbekannter Varianz lässt sich übertragen auf die Bestimmung von Konfidenzintervallen anderer Kennwerte der Beschreibenden Statistik wie z.B.: Konfidenzintervall der Standardabweichung Konfidenintervall des Medians Konfidenzintervall der Steigung einer Ausgleichsgeraden 4.4 Aufgaben zum Konfidenzintervall a) Bestimmen Sie für die folgende Datenreihe das Konfidenzintervall für den Mittelwert auf einem Signifi kanzniveau von 95% bzw. von 99%: 8; 5, 0; 6; 9; 4; 4, 5; 7; 3 b) Bestimmen Sie für jeden x-Wert aus den zugehörigen y-Werten den Mittelwert und die Standardabweichung, sowie das t-Quantil zur Irrtumswahrscheinlichkeit von 5% und dem Freiheitsgrad (hier) f=4. Berechnen Sie zu jedem x-Wert die Halbbreite des Konfidenzintervalls. Stellen Sie in der Tabellenkalkulation die y-Mittelwerte als Funktion von x mit den jeweiligen Konfidenzintervallen als Fehlerbalken grafisch dar. x-werte 1 3 5 8 statistikscript.odt Okt 2013 y1-werte y2-werte y3-werte y4-werte y5-werte 18 17 20 17 16 12 15 9 10 11 7 6 6 8 7 14 13 14 11 14 www.ces.karlsruhe.de/culm/ Seite 14 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 5. Ausreißertest nach Grubbs 5.1 Ziel des Tests 15 (25) In einer Datenreihe kann es einzelne Werte geben, die viel weiter vom Mittelwert entfernt sind, als die übrigen Werte (möglicherweise ist bei der Erfassung ein Fehler unterlaufen). Man nennt sie Ausreißer (outliner). Als Ausreißer kommen jeweils Minimum und Maximum der Datenreihe in Betracht. Für einen verdächtigen Wert wird eine Prüfgröße PG berechnet, die den Abstand vom Mittelwert bewertet. Beim Grubbs-Test gibt die Prüfgröße PG an, wieviele Standardabweichungen der zu testende Wert x i vom Mittelwert entfernt ist. Ist die Entfernung "zu groß", wird der Wert als Ausreißer betrachtet. Welche Abstände noch akzeptabel sind, ist in der Tabelle der Grubbs-Verteilung festgelegt. Ein gefundener Ausreißer wird in der Tabelle markiert und nicht mehr in die Berechnung einbezogen. Die neuen Minimum- und Maximumwerte werden einem erneuten Test unterzogen. Der Test kann nur auf normalverteilte Daten angewendet werden. In kritischen Fällen muss dies durch einen eigenen Test geprüft werden. 5.2 Durchführung des Tests Die Schritte des Tests sind: Das Signifikanzniveau (z.B. 95%) ist festzulegen. Von der Datenreihe sind Minimum und Maximum zu ermitteln. Von der Datenreihe sind Mittelwert und Standardabweichung (n-1gewichtet) zu berechnen. Der ausreißerverdächtige Wert ist jeweils in die Berechnung einbezogen. Die Prüfgröße PG wird nach der Formel für den ausreißerverdächtigen Wert berechnet. Die Vergleichsgröße VG (für das gewählte Signifikanzniveau und den vorliegenden Umfang n) wird aus der Tabelle abgelesen. Das Testergebnis wird ermittelt: Bei PG>VG wird der Wert als Ausreißer betrachtet und aus der Datenliste gestrichen (d.h. nicht mehr in die weitere Auswertung einbezogen). Er sollte als eliminierter Wert sichtbar bleiben. Der Ausreißertest wird mit dem nächsten, verdächtigen Wert wiederholt. Dabei ergeben sich neue Mittelwerte und Standardabweichungen. Der Test ist zu Ende, wenn keine weiteren Ausreißer gefunden werden. Er wird üblicherweise auf dem 95%-Signifikanzniveau ausgeführt. 5.3 Bemerkungen n Der Grubbs-Test kann als Ausreißertest (in DIN 32645, auch in DIN 38402) bei der Kalibrierung von Analyseverfahren verwendet werden. Andere Ausreißer-Tests sind bei kleinem Stichproben-Umfang Q-Test, W-Test und Test nach Dixon und Dean, bei grossem Stichproben-Umfang kann das Chauvenetsche Kriterium oder der Test nach Graf und Henning verwendet werden. Da der Mittelwert und die Standardabweichung sehr stark vom Ausreißer bestimmt sind, wird auch der Ausreißertest nach Hampel angewendet. Dabei wird statt des arithmetischen Mittelwerts der Median und statt der Standardabweichung der Median der Abweichungen verwendet. Auch hier wird eine Normalverteilng der Stichprobenwerte vorausgesetzt. Der Test entscheidet nur die Hypothese H:„x* ist ein Ausreißer“. Er kann nicht nachweisen, dass kein Ausreißer in der Datenreihe ist. Das Gegenteil von „x ist Ausreißer“ heißt nicht „x ist kein Ausreißer“, sondern „ich weiß nicht, ob x ein Ausreißer ist“. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ 3 4 5 6 7 8 9 10 12 14 16 18 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 125 145 90% 1,148 1,425 1,602 1,729 1,828 1,909 1,977 2,036 2,134 2,213 2,279 2,335 2,385 2,486 2,563 95% 1,153 1,436 1,671 1,822 1,938 2,031 2,109 2,177 2,287 2,372 2,442 2,505 2,557 2,663 2,745 2,811 2,866 2,914 2,956 2,992 3,025 3,055 3,082 3,107 3,130 3,151 3,171 3,189 3,207 3,281 3,328 99% 1,155 1,492 1,748 1,945 2,097 2,220 2,324 2,410 2,551 2,660 2,746 2,822 2,885 3,009 3,103 3,178 3,240 3,292 3,336 3,376 3,411 3,442 3,471 3,496 3,521 3,543 3,563 3,582 3,600 3,675 3,723 Seite 15 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 6. Chi-Quadrat-Anpassungstest 6.1 Problemstellung 16 (25) Lassen sich Stichprobenwerte in Klassen einteilen, enthält jede Klasse eine bestimmte Anzahl von Stichprobenwerten, die Klassenhäufigkeit. Die gesamte Stichprobe zeigt eine Häufigkeitsverteilung. Beim Wür feln ist die Augenzahl eines Würfels (hoffentlich) gleichverteilt. Die Augensumme zweier Würfel ist in ei ner Dreiecksform verteilt. Messwerte sind meist normalverteilt. Der Anpassungstest prüft die Verträglichkeit experimenteller Daten mit einer erwarteten Verteilungsform. Die in einem statistischen Experiment ermittelte Häufigkeitsverteilung einer Grösse x stimmt in der Regel nicht genau mit der nach einem Wahrscheinlichkeitsmodell erwarteten Häufigkeitsverteilung überein. Der Test soll entscheiden, ob die Abweichungen rein statistischer Natur sind, oder ob das Experiment vom Statistik-Modell nicht richtig beschrieben wird. Ein Test kann eine Aussage (Hypothese) mit einer bestimmter Wahrscheinlichkeit widerlegen, sie aber nicht bestätigen oder gar beweisen. Beim Test wird die gesamte Abweichung (Prüfgrösse) berechnet und mit dem Wert einer mathematischen Funktion (Vergleichsgrösse) verglichen. Liegt die Prüfgrösse über der Vergleichsgrösse, kann die Hypothese als widerlegt betrachtet werden. 6.2 Hypothese und Irrtumswahrscheinlichkeit Im Beispiel werden n=100 mal drei Zahlen (zwischen 0 und 8) eines Zufallsgenerators addiert und in 13 Klassen der Breite 2 eingeteilt. Von einem Maximum im mittleren Bereich fällt die Verteilung nach aussen hin ab, in der grössten Klasse ist die Häufigkeit gleich Null. Sind die Werte normalverteilt? Hypothese: Die Werte stammen aus einer normalverteilten Grundgesamtheit. Da die Antwort nicht mit absoluter Sicherheit gegeben werden kann, muss angegeben werden, welche Irrtumswahrscheinlichkeit (Signifikanzzahl) α beim Testergebnis noch akzeptiert wird. Das Gegenstück ist das Signifikanzniveau (1-α) z.B.: Irrtumswahrscheinlichkeit (Signifikanzzahl) α =5% Dies heisst, dass ein Risiko von 5% besteht, dass die Hypothese abgelehnt wird, obwohl sie richtig ist (Feh ler 1. Art). Beim Fehler 2. Art wird die Hypothese akzeptiert, obwohl sie falsch ist. Das Testergebnis ist eine von zwei möglichen Antworten: Ergebnis 1 (Verwerfung der Hypothese): Die Grundgesamtheit ist nicht normalverteilt. Ergebnis 2 (Annahme der Hypothese): Es spricht nichts gegen eine Normalverteilung der Grundgesamtheit Gelingt die Widerlegung der Hypothese nicht, dann können die Abweichungen auch auf zufällige Schwankungen zurückgeführt werden. Ein Beweis für eine normalverteilte Grundgesamtheit ist damit aber nicht erbracht. 6.3 Durchführung des Tests Eine feste Schrittfolge sollte eingehalten werden: ● Aufnahme der Daten (Urliste) ● Festlegung des Signifikanzniveaus (oder der Irrtumswahrscheinlichkeit) ● Berechnung von Umfang (Anzahl), Mittelwert und Standardabweichung (n-1)-gewichtet ● Festlegung der k Klassen(-ober)grenzen ● Bestimmung der absoluten Häufigkeiten h(i) ● Berechnung der erwarteten absoluten Häufigkeiten e(i) (hier nach der Normalverteilung) ● Berechnung von CHI-Quadrat Χ² = SUMME( [ (h(i) - e(i))^2 ] / e(i) ) statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 16 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 17 (25) ● Bestimmung der Vergleichsgrösse (Berechnung oder Tabellenwert) ● Entscheidung über die Hypothese: Χ²< = c : Hypothese annehmen Χ² > c : Hypothese verwerfen 6.4 Achtung Fussangeln Klasseneinteilung: Der Merkmalsbereich wird in Klassen eingeteilt. Ist der Umfang der Stichprobe kleiner als 40, wählt man etwa m=anz/6 Klassen. Andernfalls wählt man etwa m=Wurzel(anz), wobei m=20 aber normalerweise nicht überschritten werden muss. Ist der Umfang anz<40, dann variiert man die Klassenobergrenzen so, dass die erwartete absolute Häufigkeit für jede Klasse mindestens 5 beträgt, da sonst die Aussagekraft des Tests eingeschränkt ist. Im anderen Fall dürfen in den Randklassen auch Werte <5 stehen. Die Klassenbreiten müssen nicht gleich gross sein. Freiheitgrad: Die Anzahl k der Klassen stellt den Freiheitgrad f dar. Allerdings wird für jede berechnete StatistikGrösse ein Freiheitgrad "verbraucht". Die Prüfgrösse "verbraucht" also immer einen Freiheitsgrad, also f=k-1. In unserem Beispiel werden aber auch die Standardabweichung und der Mittelwert berechnet (aus der Stichprobe ermittelt), also gilt hier f=k-3. Der Mittelwert muss aber hier gleich 12 sein, so dass er auch fest vorgegeben werden kann; es gilt dann f=k-2. vorgefertigte Testfunktionen: In Programmpaketen zur Statistik wird der Chi^2-Test manchmal als fertige Funktion angeboten, in die nur die gemessenen und erwarteten Häufigkeiten eingetragen werden müssen. Hier wird von einer be reits geeigneten Klasseneinteilung, sowie von sicherem Mittelwert und sicherer Standardabweichung ausgegangen. 6.5 Funktionen in EXCEL In EXCEL gibt es die fertige Testfunktion =CHITEST(gemessen;erwartet) mit den oben genannten Einschränkungen. Die Prüfgrösse lässt sich berechnen mit der Funktion: =CHIINV(wahrscheinlichkeit;freiheitsgrad) z.B. CHIINV(0,05;2) = 5,99 Achtung: In EXCEL ist die Irrtumswahrscheinlichkeit (Signifikanzzahl) einzutragen, nicht das Sicherheitsniveau. Tabellenblatt dazu: anpassung.xls 6.6 Aufgabe zum CHI-Quadrat-Anpassungstest Prüfen Sie mit dem CHI-Quadrat-Test, ob die Datenreihe mit den folgenden Werten bei einer Klassenbreite von 2 auf dem 5%-Niveau als normalverteilt akzeptiert werden kann: 8 6 7 6 2 5 4 5 6 5 4 7 6 8 5 5 5 4 5 6 Anmerkung Für kleinere Stichprobenumfänge (5≤n≤50) eignet sich besser der Shapiro-Wilk-Test, der allerdings nur auf „Normalverteilung“ prüfen kann. Üblich ist dabei eine Irrtumswahrscheinlichkeit von α=5%. Eine vorbereitete Online-Version des Tests findet sich auf http://dittami.gmxhome.de/shapiro/ . statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 17 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 7. Trendtest nach Neumann 7.1 Zweck des Tests 18 (25) Lassen sich die Werte einer Stichprobe in Reihenfolge bringen (z.B. zeitlich, örtlich), wird ein Trendtest sinnvoll. Beim Vorliegen eines Trends erhält man eine grosse Standardabweichung und möglicherweise verlieren dann weitere Auswerteverfahren ihren Sinn. Beim Vorliegen eines Trends sind die Abweichungen benachbarter Werte voneinander im Schnitt geringer als vom Mittelwert. Die Prüfgrösse PG ergibt sich aus der Summe der quadrierten Nachbarschaftsabstände Δ2 dividiert durch die Varianz s2. Die Vergleichsgrösse VG liegt für verschiedene Signifikanzniveaus tabelliert vor. Literatur: Sachs, Angewandte Statistik, Springer Berlin, 7.Auflage, S.481ff 7.2 Durchführung Die Reihenfolge der Stichprobenwerte darf nicht verändert werden. Aus den Differenzen benachbarter Stichprobenwerte ist die Prüfgrösse PG zu berechnen. Das gewünschte Signifikanzniveau (z.B 1%) bzw. das Sicherheitsniveau (z.B. 99%) werden festgelegt. Die Vergleichsgrösse VG wird aus der Tabelle abgelesen. Für PG<VG kann von einem vorliegenden Trend ausgegangen werden. Für PG>VG kann nicht von einem vorliegenden Trend ausgegangen werden. Der Test ist erst ab einem Stichprobenumfang von n=4 sinnvoll. Auch wenn sich innerhalb der Stichprobe Trends verschiedener Richtung zeigen, spricht der Test an. Es gibt aber auch Fälle (z.B. Verklumpung), bei denen der Test fälschlich einen Trend anzeigt. Die Nullhypothese heisst: Ein Trend ist nicht erkennbar. Der Test kann diese Hypothese widerlegen, aber nicht beweisen. Ein Signifikanzniveau von z.B.1% besagt, dass nur in 1% der Tests, bei denen die Hypothese widerlegt wurde, doch kein Trend in der Grundgesamtheit vorliegt. 7.3 Beispiel zum Trendtest Im voliegenden Beispiel wird der Test in der Tabellenkalkulation durch eine Prozedur automatisch nach jeder Eingabe oder nach Tastendruck ausgeführt. Tabellenblatt dazu (mit VBA-Prozedur): neumann.xls statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 18 von 25 Carl-Engler-Schule Karlsruhe 8. Linearitätstest 8.1 Zweck des Tests Statistik-Script 19 (25) Ergibt die Darstellung der Abhängigkeit zweier Größen voneinander in einem Diagramm näherungsweise eine Gerade (Lineare Funktion), dann ist zu prüfen, ob die Daten nicht besser durch eine andere Funktion angepasst werden sollten. Normalerweise wird als Alternative eine Parabel (quadratische Funktion) verwendet. Zu jeder der bereits optimierten Funktionen werden die Residuen (die Reste), als die Abstände der Punkte von der zugehörigen Kurve, berechnet, quadriert und aufsummiert (Χ²: Chi-Quadrat). Ist dieser Wert für die Gerade deutlich größer als für die Parabel, ist die Gerade nicht geeignet, der Zusammenhang also nichtlinear. Die Prüfgröße PG wird wieder aus den Daten, die Vergleichsgröße VG mit Hilfe der F-Verteilung bestimmt. Die selbe VG erhält man auch bei Verwendung der um den Faktor n-1 kleineren Varianzen s² (n: Anzahl der Datenpunkte). Zwei verschiedene Linearitätstests (F-Test nach Fisher bzw. Linearitätstest nach Mandel) liefern lassen sich anwenden. Der Linearitätstest nach Mandel spricht etwas früher an als der Fisher-Test. 8.2 Durchführung Berechnung der Größe ΧG² bzw. sG² für die Lineare Ausgleichsfunktion (Gerade) Freiheitsgrad fG=n-2 Berechnung der Größe ΧP² bzw. sP² für die Quadratische Ausgleichsfunktion (Parabel) Freiheitsgrad fP=n-3 Nullhypothese: Die beiden Varianzen sG²und sP² unterscheiden sich nicht signifikant F-Test nach Fisher: Prüfgröße PG = sG²/ sP² = ΧG²/ ΧP² oder Linearitätstest nach Mandel: Prüfgröße PG = [(n-2)* sG² - (n-3)*sP²]/ sP² in beiden Fällen (Signifikanzniveau α): Vergleichsgröße VG = Fn-2,n-3,α Bei PG>VG wird die Hypothese abgelehnt, d.h. es gibt keine Linearität der Abhängigkeit. 8.3 Beispiel zum Linearitätstest Das vorliegende Beispiel prüft die Linearität der Abhängigkeit der Signalgröße von der Merkmalsgröße bei einer Kalibrierung. In der Tabellenkalkulation werden die Parameter der quadratischen Funktion nur im Diagramm, nicht aber in der Tabelle ausgegeben. Daher werden sie separat durch Lösung eines Linearen Gleichungssystems LGS berechnet. Die erforderlichen Größen lassen sich schrittweise berechnen. Die Vergleichsgröße VG kann einer Tabelle entnommen werden oder läßt sich in der Tabellenkalkulation berechnen mit der Formel =FINV(α;fG;fP). Dabei ist α die Irrtumswahrscheinlichkeit (nicht das Signifikanzniveau) und liegt zwischen Null und Eins. Tabellenblatt: linearitaet.xls F-Test Freiheitsgrad Zähler Freiheitsgrad Nenner Prüfgröße PG: Vergleichsgröße VG: Signifikanzniveau in % 6,00 Signalgröße 5,00 y = 0,8289x + 1,7519 4,00 3,00 2,00 Mandel 8 7 0,29352677 9,43749893 3,72571662 3,72571662 95,0 95,0 Testergebnis Ein Linearer Ausgleich ist akzeptiert 1,00 0,00 0,00 Fisher ungünstig y = -0,0607x 2 + 1,1144x + 1,4616 0,50 1,00 1,50 2,00 2,50 3,00 3,50 4,00 Merkm alsgröße statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 19 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 9. Signifikanz- und Kontingenztest 9.1 Problemstellung 20 (25) Was ist gemeint, wenn man sagt, die Konzentration zweier Lösungen unterscheide sich signifikant? Ab welchem Unterschied kann man ihn als signifikant bezeichnen? Zur Entscheidung über die Hypothese „Beide Stichproben haben den selben Mittelwert“ wird die Wahr scheinlichkeit berechnet, mit der die eine Stichprobe nur zufällig vom Mittelwert der anderen Stichprobe abweicht. Ist diese Wahrscheinlichkeit klein, z.B. kleiner als 1%, geht man davon aus, dass sich die beiden Mittelwerte signifikant voneinander unterscheiden. Die oben genannte Hypothese gilt dann (auf dem 1%Niveau, bzw. 99%-Niveau) als widerlegt. Zur Entscheidung wird eine aus den Daten berechnete Prüfgröße PG mit einer theoretisch bestimmten Vergleichsgröße VG verglichen. Kann die Hypothese nicht auf dem 95%nein nein nein nicht signifikant Niveau widerlegt ja nein nein indifferent werden, ist der Unterschied nicht ja ja nein signifikant signifikant. Kann sie ja ja ja hoch signifikant zwar auf dem 95%Niveau, nicht aber auf dem 99%-Niveau widerlegt werden, ist die Aussage indifferent und man sollte weitere Daten hinzunehmen. Oberhalb des 99%-Niveaus ist das Erbgebnis signifikant und oberhalb des 99,9%-Niveaus sogar hochsignifikant. PG>VG(95%) PG>VG(99%) PG>VG(99,9%) Ergebnis Es gibt viele unterschiedliche Fragestellungen, für die jeweils eine andere Berechnung erforderlich ist. Statistik-Programme können mit all diesen Fällen korrekt umgehen. 9.2 Zwei typische Fälle 9.2.1 Signifikanztest (t-Test für den Vergleich der Gruppen-Mittelwerte) Die Ausführungen hier beziehen sich auf die arithmetischen Mittelwerte zweier normalverteilter Stichproben mit beliebigem Umfang und mit als gleich anzunehmender Standardabweichung. Weder für die Mittelwerte noch für die Standardabweichung sind theoretische Werte bekannt. Es liegen also nur die Kenngrößen der beiden Stichproben vor. Getestet wird, ob sie bezüglich der Mittelwerte aus der gleichen Grundgesamtheit stammen. Die Prüfgröße PG wird nach der folgender Formel berechnet. PG= n 1 n 2 n1n2−2 x 1 −x 2 ∗ n1n 2 n 1−1s 21n 2−1 s22 Die Vergleichsgröße VG stammt aus der t-Verteilung mit dem Freiheitsgrad f=(n 1+n2-2) Von einer Lösungen wurden 14 Proben gezogen und jeweils 7 an einem Analysengerät untersucht. Die Hypothese „Beide Geräte liefern den gleichen Mittelwert“ soll getestet werden. Die Analysen liefern Massenkonzentrationen w in mg/L. 9.2.2 Signifikanztest (t-Test für einen Gruppen-Mittelwert gegen festen Mittelwert) Will man testen, ob eine Stichprobe aus einer Grundgesamtheitstammen kann, deren Mittelwert bekannt ist, wird die Prüfgröße PG aus Mittelwert und Standardabweichung der Stichprobe nach folgender Formel berechnet: PG= n X − s Die Vergleichsgröße VG stammt aus der t-Verteilung mit dem Freiheitsgrad f=(n-1) Für eine Stichprobe vom Umfang n=7 soll die Hypothese „Die Grundgesamtheit hat den Mittelwert w=78mg/L“ geprüft werden. Praktisch bedeutet das die Prüfung, ob ein vorliegendes Gebinde mit der vorgeschriebenen Massenkonzentration von w=78mg/L verträglich ist. Die wiederholte Berechnung für „hochsignifikanter Unterschied“ zu. statistikscript.odt Okt 2013 unterschiedliche www.ces.karlsruhe.de/culm/ Signifikanzniveaus läßt Aussage Seite 20 von 25 Carl-Engler-Schule Karlsruhe 9.3 Statistik-Script 21 (25) Kontingenztest (Vierfeldertafel, Kontingenztafel) Der Test wird bei sog. kategorialen Daten angewendet (Stichprobe zerfällt in zwei Klassen, in den Zellen müssen Zählwerte stehen). Es wird gezählt, wie viele Elemente in die eine bzw. in die andere Kategorie fallen. Verglichen wird mit den Häufigkeiten einer anderen Untersuchung oder mit theoretisch ermittelten Häufigkeiten. In einer Tabelle mit vier Feldern lässt sich die Berechnung einfach durchführen (Kontingenz = zufälliges Zusammentreffen). Beispiel: Die Hypothese "20% der Bevölkerung sind Linkshänder" wird in einer Gruppe mit 30 Personen getestet. Man findet nur einen Linkshänder. Ist damit die Hypothese wiederlegt, oder liegt das Ergebnis im Bereich zufälliger Schwankungen? Bei Ablehnung der Hypothese darf die Irrtumswahrscheinlichkeit nur α=5% betragen (Signifikanzniveau 95%). Linkshänder Rechtshänder Summe Linkshänder Rechtshänder Summe gezählt a b a+b gezählt 1 29 30 erwartet c d c+d erwartet 6 24 30 Summe a+c b+d a+b+c+d Summe 7 53 60 Die Prüfgrösse Χ2 wird errechnet nach der Formel: X 2= n∗ad −bc 2 abcd ac bd Χ2 = 60(24-174)2 / [30*30*7*53] = 4.043 (Prüfgröße PG) Die zugehörige Vergleichsgrösse der Χ2-Verteilung ist VG=3.84 bei einem Signifikanzniveau von 95% für einen Freiheitsgrad von f=1 (die Vierfeldertafel hat immer den Freiheitsgrad f=1). Die zugehörige Tabel lenfunktion ist =CHIINV(0,05;1). Da PG>VG gilt die Hypothese auf dem 95%-Niveau als widerlegt. In EXCEL gibt es hierfür die Funktion CHITEST. Liegen die vier Felder z.B. in den Zellen B2:C3, dann lautet die Formel =CHITEST(B2:C2;B3:C3) und liefert den Wert 0,0225. Die Wahrscheinlichkeit für eine so grosse Abweichung ist 2.25%. Da dieser Wert kleiner als die vorher festgelegte Irrtumswahrscheinlichkeit von 5% ist, gilt die Hypothese als wiederlegt. 9.4 Ergänzungen Weitere Hypothesen können z.B. sein: H0: H0: H0: H0: Der Mittelwert der Grundgesamtheit liegt zwischen 37 und 39. Die Standardabweichung ist 3. Der Mittelwert der Grundgesamtheit liegt zwischen 37 und 39. Die Standardabweichung ist unbekannt. Die Varianz der Grundgesamtheit ist 6. Die Varianzen der beiden Grundgesamtheiten sind gleich gross. Abhängig von der Fragestellung sind verschiedene Verteilungsfunktionen zu verwenden und die Prüfgrössen nach unterschiedlichen Formeln zu berechnen. Die Berechnung ist in der Mappe signifikanz.xls ausgeführt. Achtung: In Tabellen bzw. Rechenfunktionen muss darauf geachtet werden, ob die Werte für einseitige oder zweiseitige Fragestellungen bereit gestellt werden. Aufgaben Testen Sie mit geeigneten unabhängigen Sichproben die Hypothesen: a) Die Körpergrößen von Jungen und Mädchen sind gleich. b) Das Durchschnittsalter der Physiker des 20.Jahrhunderts beträgt 69 Jahre. c) 10% der Münzen tragen das Prägezeichen G (Karlsruhe) Vermeiden Sie eine Vorauswahl vor dem Test, da sonst jedes beliebige Ergebnis erzielt werden kann. statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 21 von 25 Carl-Engler-Schule Karlsruhe 10. Statistik-Script 22 (25) Varianzanalyse (ANOVA) 10.1 Problemstellung Bei der Varianzanalyse (ANOVA: ANalysis Of VAriance) wird die Gleichheit von mehreren Mittelwerten (oder auch anderen Lageparametern) getestet. Dazu werden die Varianzen von Datengruppen miteinander verglichen. Bei einer typischen Fragestellung wird geklärt, ob Gruppen von Daten bezüglich des Mittelwertes aus der selben Grundgesamtheit stammen, oder die Gruppe einen Einfluss auf den Mittelwert hat. 10.2 Verfahren Von jeder Gruppe wird die Varianz bezüglich ihres Gruppenmittelwertes bestimmt und die Varianzen (mit dem Gruppenumfang gewichtet) addiert. Dieser Wert wird verglichen mit der Varianz der (gewichteten) Gruppenmittelwerte bezüglich des Mittelwerts aller Werte. Als Testverteilung dient die F-Verteilung. 10.3 Beispiel zur Varianzanalyse (Ringversuch) Für eine einfache Varianzanalyse wird eine einzige Grösse (z.B. die Viskosität eines Motoröls) in vier verschiedenen Labors nach dem gleichen Verfahren (z.B. Höppler-Viskosimeter) jeweils fünfmal ermittelt. Normalerweise ergibt jede Messung einen etwas anderen Wert und jedes Labor bestimmt aus seinen Messwerten einen Mittelwert als Laborergebnis. Die Hypothese: "Es gibt keinen signifikanten Unterschied zwischen den Laborergebnissen." soll getestet werden. Wenn die Messwerte eines jeden Labors (innerhalb der Gruppe) schon stark streuen, können die Unter schiede in den Laborergebnissen (zwischen den Gruppen) zufällig sein. Es werden die Streuungen der zwischen den Gruppen mit denen innerhalb der Gruppen verglichen. Da keine statistische Aussage ganz sicher ist, wird ein Signifikanzniveau (hier 5%) festgelegt. Programme zur Datenanalyse (z.B. EXCEL - Extras - Analysefunktionen) sind für diese Form der Varianzanalyse bereits vorbereitet. In dem Verfahren wird die Anzahl der Messungen eines Labors durch die t-Verteilung berücksichtigt. Aus den eingegebenen Daten wird eine Prüfgrösse berechnet. Ist sie grösser als die statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 22 von 25 Carl-Engler-Schule Karlsruhe Statistik-Script 23 (25) Vergleichsgrösse (hier. kritischer F-Wert), dann gilt die Hypothese als widerlegt. In unserem Fall sind da mit also signifikante Unterschiede zwischen den Labors nachgewiesen. Es ist also von systematischen Unterschieden auszugehen. Der P-Wert im Beispiel gibt an, dass bei gleichen Varianzen ein so grosser F-Wert nur in 1,11% der Fälle zu erwarten ist. Folgende Voraussetzungen müssen für die Analyse erfüllt sein (sonst wird die Rechnung komplizierter): o in jedem Labor werden gleich viele Messungen durchgeführt (nicht notwendig, aber günstig) o die Messwerte sind normalverteilt o es sind keine Ausreisser enthalten o in jedem Labor erhält man etwa die gleiche Streuung der Messwerte (Varianz) Jede der Bedingungen muss überprüft werden (Anpassungstest, Ausreissertest, Varianzenhomogenitätstest). Zum Test der Varianzengleichheit gibt es mehrere Verfahren. Der Test nach Hartley bildet den Quotienten aus dem Maximum und dem Minimum der Varianzen als Prüfgrösse. Die Vergleichsgrösse liegt ta belliert vor und liefert für den Fall des Beispiels einen zulässigen Wert von 20,6 bei einer Prüfgrösse von 1,54. (Sachs, Angewandte Statistik, Springer 1992, S.614) Tabellenblatt: anova.xls statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 23 von 25 Carl-Engler-Schule Karlsruhe 11. Statistik-Script 24 (25) Statistische Versuchsplanung SVP 11.1 Ziele Die statistische Versuchsplanung SVP (DoE: Design of Experiments) beschreibt Verfahren, die dabei helfen, den Aufwand für einen Versuch zu reduzieren. Versuche mit Statistik-Auswertung werden in Labor und Produktion z.B. für folgende Ziele eingesetzt: Prozesse (eingesetzte Mittel, Zeit, Lagerplatz) verbessern Produktqualität verbessern Robuste Prozesse / Produkte planen Produktqualität testen Um aussagekräftige Ergebnisse zu erhalten, sollte einerseits ein großer Datenumfang vorliegen und andererseits Beziehungen zwischen Einflussfaktoren deutlich werden. Zur Planung und Auswertung gibt es spezielle Programme, die auch helfen, typische Fehler zu vermeiden. Zwei einfache Probleme sind als Beispiele dargestellt. 11.2 Erforderlicher Umfang der Stichprobe Zwei Produktionsverfahren sollen mit Hilfe des t-Tests für zwei Stichproben-Mittelwerte miteinander ver glichen werden (siehe 9.2.1). Aus jedem Verfahren soll eine Stichprobe vom Umfang n entnommen werden. Ist n zu klein, kann der Test die Hypothese „Die Mittelwerte sind gleich“ nicht widerlegen, auch wenn sie unterschiedlich sind. Was man als unterschiedliche Mittelwerte betrachtet, wird durch den Ausdruck (σ/∆µ) beschrieben, den Quotienten aus der (gleichen) Standardabweichung der Produktionen und dem Abstand der Mittelwerte. Die SVP liefert folgende Regel: erforderlicher Versuchsumfang zum t-Test für zwei Stichproben-Mittelwerte gegeneinander N=2*n=60*(σ/∆µ)^2 (wenn sich N<40 ergibt, sollte man den Umfang vergrößern) (mit der angegebenen Formel liefert der Test auf dem 99%-Niveau in 90% der Fälle das richtige Ergebnis) Beispiel: Für einen Abstand der Mittelwerte von ∆µ=2 bei einer Standardabweichung von σ=3 ergibt sich so ein erforderlicher Stichprobenumfang (je Produktionsverfahren) von n=68. 11.3 Beziehungen zwischen Einflussfaktoren Neben den Verfahren „Regressionsanalyse“, „Korrelationsanalyse“ und „Varianzanalyse“ zählen hierzu die „Screening-Versuchspläne“ als „vollständiger faktorieller Versuchsplan“ und „fraktioneller faktorieller Versuchsplan“, die „Taguchi-Verfahren“ und weitere. Beispiel: Um in einem Produktionsprozess die Einflüsse von Druck (A), Temperatur (B) und pH-Wert (C) auf die Produktqualität zu untersuchen, muss jede Größe mindestens zwei unterschiedliche Werte (Stufen -,+) annehmen. Daraus ergeben sich bereits 8 Kombinationen, für die jeweils eine eigene Stichprobe zu erfassen und auszuwerten ist. Durch eine geeignete statistische Kombination der Aussagen erhält man mit nur 4 Kombinationen eine (fast) so sichere Aussage (fraktioneller faktorieller Versuchsplan). vollständiger faktorieller Versuchsplan Nr 1 2 3 4 5 6 7 8 statistikscript.odt A + + + + B + + + + Okt 2013 fraktioneller faktorieller Versuchsplan C + + + + Nr 1 2 3 4 www.ces.karlsruhe.de/culm/ A + + B + + C + + Seite 24 von 25 Carl-Engler-Schule Karlsruhe 12. Statistik-Script 25 (25) Anhang 12.1 Simulation von Zufallszahlen In der Tabellenkalkulation (und normalerweise in jeder Programmiersprache) lassen sich gleichverteilte Zufallszahlen zwischen 0 und 1 erzeugen. Zufallszahlen mit 15 Dezimalstellen lassen sich erzeugen mit =ZUFALLSZAHL() Jede Änderung im Tabellenblatt (oder F9) führt zu einer neuen Zufallszahl. Durch Multiplikation bzw. Addition lässt sich der Zufallsbereich erweitern bzw. verschieben. Normalverteilte Zufallszahlen erhält man mit folgendem Befehl, mit dem auch der Mittelwert und die Standardabweichung festgelegt werden können: =NORMINV(ZUFALLSZAHL(): mittelwert; standardabweichung) statistikscript.odt Okt 2013 www.ces.karlsruhe.de/culm/ Seite 25 von 25