Verbesserung der Entscheidungssicherheit bei der Bestimmung von Prüfmittelfähigkeitsindizes Ausarbeitung zum Seminar im Studiengang „Scientific Programming“ Nikolai Giesbrecht Betreuer: Prof. Dr. Horst Schäfer Prof. Dr. Christoph Weigand 2 Inhalt Einleitung .................................................................................................................................... 5 Grundlagen ................................................................................................................................. 6 Definitionen ............................................................................................................................ 6 Teilbereich Qualität............................................................................................................. 6 Teilbereich Messen ............................................................................................................. 7 Teilbereich Statistik ............................................................................................................. 8 Teilbereich Prüfmittel ....................................................................................................... 10 Qualität im Unternehmen .................................................................................................... 11 Prüfmittel .............................................................................................................................. 12 Verwendung ...................................................................................................................... 12 Auswahlmessungen/Kalibrierung ..................................................................................... 12 Berechnung signifikanter Werte ....................................................................................... 13 Auswertung von Ergebnissen bei der Bestimmung von Prüfmittelfähigkeitsindizes .............. 14 Allgemein .............................................................................................................................. 14 Prüfmittelpotential ............................................................................................................... 14 Prüfmittelfähigkeit ................................................................................................................ 15 Bootstrapping ........................................................................................................................... 16 Theorie .................................................................................................................................. 16 Durchführung........................................................................................................................ 16 Aufwand................................................................................................................................ 16 Fallbeispiele .............................................................................................................................. 17 Anmerkungen ....................................................................................................................... 17 Beispiel 1 ............................................................................................................................... 17 Beispiel 2 ............................................................................................................................... 18 Variante: Erhöhung des Stichprobenumfangs ......................................................................... 20 3 Fallbeispiele .......................................................................................................................... 20 Beispiel 1 ........................................................................................................................... 20 Beispiel 2 ........................................................................................................................... 20 Aufwand................................................................................................................................ 21 Variante: Bootstrapping ........................................................................................................... 22 Fallbeispiele .......................................................................................................................... 22 Beispiel 1 ........................................................................................................................... 22 Beispiel 2 ........................................................................................................................... 22 Aufwand................................................................................................................................ 23 Vergleich der Varianten............................................................................................................ 24 Fallbeispiel 1 ......................................................................................................................... 24 Fallbeispiel 2 ......................................................................................................................... 24 Zusammenfassung ................................................................................................................ 25 Fazit .......................................................................................................................................... 26 Literaturverzeichnis .................................................................................................................. 27 Anhang...................................................................................................................................... 31 4 Einleitung Aussagen über eine Menge kann man treffen, wenn man deren alle Elemente kennt. Möglicherweise ist die Mächtigkeit der Menge jedoch zu groß oder das Informieren zu aufwändig. Eventuell genügt es dann, wenn die Aussagen mit einer bestimmten Wahrscheinlichkeit wahr sind. Derartige Aussagen werden in verschiedenen Lebensbereichen getroffen, z. B. über das politische Meinungsbild oder wie verbreitet eine Erkrankung ist. Im technischen Bereich werden Aussagen z. B. über eine Fehlerquote oder die Verteilung von Stichprobenparametern gemacht. Die meisten von ihnen haben gemein, dass mit möglichst wenig Aufwand Aussagen getroffen werden sollen, die mit hoher Wahrscheinlichkeit stimmen. Unter Umständen kann ein anderes Verfahren oder Mehraufwand die Wahrscheinlichkeit relativ stark erhöhen. In dieser Arbeit wird geprüft, ob und wie man bei der Bestimmung von Prüfmittelfähigkeitsindizes die Aussagekraft stärken kann. Prüfmittel sind in der Produktion von großer Bedeutung und können sich dabei deutlich auf die Qualität der Produkte auswirken. Der Auswahl oder der Entscheidung über die Weiterverwendung eines Prüfmittels sollte man sich deshalb sehr sicher sein. Im ersten Kapitel der Arbeit werden verschiedene Grundlagen vorgestellt. Darin sind neben Definition auch mehr Informationen über die Bedeutung von Qualität und über Prüfmittel enthalten. Anschließend folgt das Kapitel „Auswertung von Ergebnissen bei der Bestimmung von Prüfmittelfähigkeitsindizes“. Daraufhin wird der Bootstrap vorgestellt. In den nächsten vier Kapiteln werden Fallbeispiele vorgestellt und die Indizes mit verschiedenen Varianten bestimmt. Dazu kommt auch ein Vergleich der Ergebnisse. Am Schluss der Arbeit folgt noch ein Fazit. Zu erwähnen ist noch das Literaturverzeichnis und der Anhang. 5 Grundlagen Definitionen Teilbereich Qualität Prozess Ein Prozess ist ein Satz von in Wechselbeziehung oder Wechselwirkung stehenden Tätigkeiten, der Eingaben in Ergebnisse umwandelt. (1) Produkt Ergebnis eines Prozesses. (1) Qualität (allgemeine Definition) Gesamtheit von Eigenschaften und Merkmalen eines Produkts oder einer Dienstleistung, die sich auf deren Eignung zur Erfüllung festgelegter oder vorausgesetzter Erfordernisse beziehen. (2) Qualität (operationalisierte Definition): Grad der Einhaltung von Planungsvorgaben für Eigenschaften und Merkmale bei Produkten und Dienstleistungen. (3) Qualtitätsmanagement Qualitätsmanagement bezeichnet alle organisierten Maßnahmen, die der Verbesserung der von Produkten, Prozessen oder Leistungen jeglicher Art dienen. (4) Qualitätssicherung Qualitätssicherung oder Qualitätskontrolle ist ein Sammelbegriff für unterschiedliche Ansätze und Maßnahmen zur Sicherstellung festgelegter Qualitätsanforderungen. (5) Qualitätsforderung Gesamtheit der Einzelforderungen an die Beschaffenheit einer Einheit. (6) Statistische Qualitätssicherung (Zielbeschreibung): Die Statistische Qualitätssicherung (SQS) leitet anhand von Stichprobenprüfungen unter Verwendung mathematisch-statistischer Methoden Aussagen über den Grad der Erfüllung von Qualitätsforderungen ab. (7) 6 Messbare Qualitätsmerkmale Produkt- oder Prozessmerkmale, die mit Hilfe von quantitativen Werten einer Messgröße ausgedrückt werden. (6) Konformität Erfüllung einer Forderung. (6) Ressource Eine Ressource ist ein Mittel, um eine Handlung zu tätigen oder einen Vorgang ablaufen zu lassen. (8) Teilbereich Messen Messung Ermittlung von numerischen Werten kontinuierlicher Merkmale. (9) Auflösung Quantitatives Merkmal eines Messgerätes zur eindeutigen Unterscheidung zwischen nahe beieinander liegenden Messwerten. (10) Toleranz Toleranz ist das Ausmaß der Abweichung einer Größe vom Normzustand oder Normmaß, das die Funktion eines Systems nicht gefährdet. (11) In dieser Arbeit ist die Toleranz die Differenz zwischen dem erlaubten oberen und unteren Grenzwert. Kalibrierung Die Tätigkeiten, die unter vorgegebenen Bedingungen die gegenseitige Zuordnung zwischen den ausgegebenen Werten einer Messeinrichtung oder einem Referenzmaterial dargestellten Werten einerseits und den zugehörigen Werten einer durch ein Bezugsnormal dargestellten Größe andererseits bestimmen. (12) Prüfung Eine Prüfung ist eine Tätigkeit wie Messen, Untersuchen, Ausmessen bei einem oder mehreren Merkmalen einer Einheit, sowie Vergleichen der Ergebnisse mit festgelegten 7 Forderungen, um festzustellen, ob Konformität für jedes Merkmal erzielt ist. Sie wird auch als innere Genauigkeit bezeichnet (s. u.). (13) Genauigkeit Genauigkeit wird in dieser Arbeit als Maß für die Überstimmung von berechneten Mittelwerten mit dem tatsächlichen verwendet. Wiederholpräzision Ausmaß der gegenseitigen Annäherung zwischen Ergebnissen aufeinanderfolgender Messungen derselben Messgröße, ausgeführt unter denselben Messbedingungen. (14) Systematische Abweichung Als systematische Abweichung (oder systematischer Fehler) werden Messfehler bezeichnet, die sich bei wiederholter Messung nicht im Mittel aufheben. (15) Zufällige Abweichung Als zufällige Abweichungen (oder Zufallsfehler) werden die Abweichungen der Messwerte von ihrem Mittelwert bezeichnet. (16) Vollprüfung Prüfung aller Produkte der Grundgesamtheit auf vorgegebene Prüfmerkmale. (17) Teilbereich Statistik Grundgesamtheit Die Grundgesamtheit ist eine Menge, die endlich oder auch unendlich viele Elemente umfasst. (18) Häufigkeitsverteilung Eine Häufigkeitsverteilung ist eine Funktion, die zu jedem vorgekommenem Wert angibt, wie häufig er vorgekommen ist. (19) Wahrscheinlichkeitsverteilung Die Wahrscheinlichkeitsverteilung gibt an, wie sich die Wahrscheinlichkeiten auf die möglichen Zufallsergebnisse verteilen. (20) 8 Dichte Falls die Verteilungsfunktion F einer stetigen Zufallsvariablen differenzierbar ist, nennt man ihre Ableitung die Dichtefunktion oder die Dichte der Verteilung von X. (21) Verteilungsfunktion Sei P(X=x) die Eintrittswahrscheinlichkeit für das Eintreten von X=x. Die Wahrscheinlichkeitsfunktion wird dann wie folgt definiert: Sie gibt somit die Wahrscheinlichkeit an, dass X Werte bis einschließlich x annimmt. (22) Stichprobe Als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit, die unter bestimmten Gesichtspunkten ausgewählt wurde. (23) Lageparameter Ein Lageparameter beschreibt eine der wesentlichen Eigenschaften einer Häufigkeits- oder Wahrscheinlichkeitsverteilung. (24) Mittelwert Ein Mittelwert ist ein Lageparameter einer Häufigkeits- oder Wahrscheinlichkeitsverteilung, der die Lage der Elemente einer Stichprobe oder Grundgesamtheit in Bezug auf die Messskala beschreibt. (25) Verwendet wird hier das arithmetische Mittel, das auch als Stichproben- bzw. als empirischer Mittelwert für eine Stichprobe x1, x2, …, xn wie folgt definiert ist: 9 Erwartungswert Der Erwartungswert einer Zufallsvariablen ist jener Wert, der sich (in der Regel) bei oftmaligem Wiederholen des zugrunde liegenden Experiments als Mittelwert der Ergebnisse ergibt. (26) Notation1: µ Berechnung des Erwartungswertes E(X) für die Zufallsvariable X: - Diskrete Zufallsvariable: - Stetige Zufallsvariable: Varianz Die Varianz ist ein Streuungsmaß der zugehörigen Zufallsvariable. (27) Notation: σ² Die Stichproben- oder empirische Varianz für eine Stichprobe x1, x2, …, xn ist wie folgt definiert: Standardabweichung Die Standardabweichung ist die Quadratwurzel aus der Varianz. Bei der Notation wird dem gefolgt. Teilbereich Prüfmittel Messprozess Satz von Tätigkeiten zur Ermittlung eines Größenwertes. (6) Messmittel Ein Messgerät, Software, Messnormal, Referenzmaterial oder Hilfsmittel oder eine Kombination davon, die für einen Messprozess benötigt wird, ist ein Messmittel. (28) 1 Bei Schätzwerten wird ein Dach über das Zeichen gesetzt, z. B. . Die Stichproben- bzw. empirische Werte können als solche fungieren. 10 Prüfmittel Prüfmittel sind Messmittel, die zur Darlegung der Konformität bezüglich festgelegter Qualitätsforderungen benutzt werden. (29) Prüfmittelfähigkeitsindizes Die beiden Indizes sind Maßzahlen für die Güte von Messgeräten. (30) Potential Das Messgerätepotential cg gibt an, wie oft der 0,954-Zufallsstreubereich der Messwerte in 20 % der Toleranz enthalten ist. (30) Mit der Toleranz T und der Standardabweichung σ berechnet man das Potential wie folgt: Fähigkeit Die Messgerätefähigkeit cgk enthält neben der zufälligen auch die systematische Messabweichung. (30) Die systematische Messabweichung Bi und die Standardabweichung σ werden zur Berechnung benötigt: Qualität im Unternehmen Die Gewinnmaximierung ist für Unternehmen ein wichtiger Faktor (31). Allerdings wird diese durch viele Aspekte bedingt. Wenn dieses Ziel auch langfristig erreicht werden soll, ist die Qualität der Produkte, die man verkaufen will, von entscheidender Bedeutung, da sie für Kunden neben dem Preis und dem Nutzen zu den wesentlichen Anhaltspunkten bei Kaufentscheidungen gehört. Folglich ist eine Qualitätssicherung erwägenswert. Diese ist in den verschiedenen Stufen eines Produktlebenszyklus möglich. Um den Qualität nicht nur zu kontrollieren, kann ein Qualitätsmanagement erforderlich sein. Die Maßnahmen können so organisiert und die Güte 11 der Qualität beeinflusst werden. Inzwischen gibt es viele Standards im Bereich des Qualitätsmanagements, z. B. die ISO 9000 Familie. Aus der Mischung der Marktsituation, den Kundenwünschen, den Ansprüchen und verfügbaren Ressourcen des Unternehmens entstehen eigene Qualitätsforderungen an die Verkaufsprodukte. Diese Produkte, eventuelle Einzelbestandteile oder Zwischenprodukte sollten also geprüft werden, z. B. in Form von Kundenumfragen, Zählungen oder Messungen. Bei der Prüfung von messbaren Qualitätsmerkmalen kann die SQS nützlich sein. Eine Vollprüfung ist meistens nicht notwendig, bei zerstörender Prüfung schließt sie sich natürlich aus. Zudem werden für jede Prüfung Ressourcen benötigt, d. h. sie kostet letztendlich Geld. Im Rahmen der SQS wird deshalb versucht, den Stichprobenumfang zu reduzieren und gleichzeitig die Konformität in Bezug auf das jeweilige Prüfmerkmal zu gewährleisten. Die Bewertung von Produktionsprozessen im Hinblick auf messbare Qualitätsmerkmale samt der Bestimmung von sinnvollen Grenz- und Eingriffswerten können ebenfalls mit der SQS geregelt werden. Prüfmittel Verwendung Prüfmittel werden zu messenden Prüfungen verwendet. Diese werden vor allem im Anfertigungsprozess von Produkten, bei ankommenden und ausgehenden Lieferungen durchgeführt. Das setzt voraus, dass sie selbst hohen Anforderungen genügen müssen. Bei der Auswahl eines Prüfmittels werden deshalb nicht nur grundsätzliche Kriterien, wie beispielsweise die Art der Messgröße und die Spezifikationsgrenze berücksichtigt. Es werden auch eigene Messungen im Sinne einer Kalibrierung durchgeführt, um die Eignung zu bewerten. Auswahlmessungen/Kalibrierung Bei Messprozessen kann es viele Ursachen für Messabweichungen geben. In (32) werden u. a. folgende genannt: Messgeräteabweichungen, Umwelteinflüsse und das Messverfahren. Dadurch können systematische und zufällige Abweichungen entstehen. Bei der Messsystemanalyse, s. (33), wird genauer unterschieden. Bei der Bestimmung von Prüfmittelfähigkeitsindizes sind die Genauigkeit für die systematische und die 12 Wiederholpräzision für die zufällige Abweichung von Bedeutung. Vor allem in der Produktion sollte auch die Vergleichspräzision, die Stabilität und die Linearität eines Messverfahrens beachtet werden. Abhängig von der Kategorie der Messabweichung, die man betrachten will, sind verschiedene Verfahren notwendig. In diesem Fall sind die Genauigkeit und die Wiederholbarkeit von zentraler Bedeutung. Für diese Prüfung werden hintereinander 50, jedoch mindestens 25, Messungen, mit dem Prüfmittel durchgeführt. Dazu misst derselbe Bediener die entsprechenden Eigenschaften eines Normals oder eines Produkts, deren Größenwerte bekannt sind. Zu beachten ist, dass die Messungen unabhängig voneinander stattfinden müssen. Die Aussagekraft eines Messwertes wird auch durch die Auflösung des Prüfmittels bedingt. Der Quotient aus Auflösung und Toleranz sollte möglichst klein sein. In (34) wird dafür ein Maximum von 5 % als „anzustreben“ bezeichnet. Berechnung signifikanter Werte Aus der Stichprobe können einige signifikante Werte berechnet werden. Benötigt werden zunächst der Stichprobenmittelwert und die –varianz. Daraus können das Potential und die Fähigkeit des Prüfmittels berechnet werden. Die Ergebnisse können mit in die Entscheidung einfließen, ob oder welches Prüfmittel ausgewählt oder weiterverwendet wird. 13 Auswertung von Ergebnissen bei der Bestimmung von Prüfmittelfähigkeitsindizes Allgemein Die Stichprobenergebnisse der oben erwähnten Prüfung sind zufällige Ereignisse und damit nur bedingt aussagekräftig. Ein Stichprobenwert bzw. Schätzwert von 1,33 für das Potential ergibt, dass das Potential nur mit einer Wahrscheinlichkeit, in die verschiedene Faktoren einfließen, einen Wert von größer oder gleich dem erhaltenen hat. Als Prüfmittelpotential wird oft ein Mindestwert von mindestens 1,33 gefordert. Die Prüfmittelfähigkeit sollte am besten gleich dem –potential sein, da es dann keine systematische Messabweichung gäbe, was für Prüfmittel sinnvoll wäre. Bei der Entscheidung hinsichtlich der Auswahl oder Weiterbenutzung eines Prüfmittels ist es also wichtig zu wissen, wie wahrscheinlich es bei einem tatsächlichen Index ist, dass der Schätzwert über oder unter dem geforderten liegt2. In den folgenden Unterkapiteln werden Berechnungsmöglichkeiten dafür hergeleitet. Prüfmittelpotential Die Wahrscheinlichkeit, dass der Schätzwert über dem geforderten Mindestwert liegt, kann man für das Prüfmittelpotential wie folgt berechnen: Es ergibt sich eine χ² - Verteilung. Die Wahrscheinlichkeit, dass der Schätzwert unter dem geforderten Wert liegt, ist komplementär zur obigen: 2 Einbezogen ist auch die Gleichheit. 14 So kann sich folgende beispielhafte Rechnung ergeben: n = 50; = 1,33 Prüfmittelfähigkeit Für die Prüfmittelfähigkeit kann man die Wahrscheinlichkeit, dass der Schätzwert über dem geforderten Mindestwert liegt, wie folgt berechnen: Dies ist leider keine bekannte Verteilung. Man könnte sie simulieren, was in dieser Arbeit unterlassen wird. Der komplementäre Wert, also die Wahrscheinlichkeit, dass der Schätzwert unter dem geforderten Mindestwert liegt, ist dann entsprechend: 15 Bootstrapping Theorie Durchführung Aus einer Stichprobe von einer unabhängig identisch verteilten Zufallsvariable wird der gewünschte Parameter geschätzt. Anschließend werden aus der originalen Stichprobe Stichproben gezogen und jeweils ebenfalls der gewünschte Parameter geschätzt. Die Auswertung kann auf verschiedene Weisen geschen. Falls der geschätzte Parameter normalverteilt ist, kann die normale Approximationsmethode, s. (35), verwendet werden. Zu den berechneten BootstrapParametern wird die empirische Standardabweichung berechnet, mit deren Hilfe man ein Konfidenzintervall um den geschätzten Parameter bilden kann. Eine andere Möglichkeit ist die Perzentil-Methode, s. (36). Die geschätzten BootstrapParameter werden geordnet und daraus dann ein Konfidenzintervall gebildet. D. h. bei einem beidseitigen Konfidenzintervall von 90 %, fallen jeweils die kleinsten und größten fünf Prozent weg. Diese Methode setzt jedoch eine hohe Anzahl an Bootstrap-Stichproben voraus und funktioniert bei kleinen Stichproben nicht immer. Aufwand Der Mehraufwand besteht hauptsächlich aus der Verfügbarkeit einer geeigneten Software. Die Messwerte werden normalerweise auch elektronisch gespeichert werden und die Berechnungen dauern meist maximal nur wenige Sekunden. 16 Fallbeispiele Anmerkungen Die in den Beispielen verwendeten Stichproben wurden mithilfe der Programmiersprache Java erzeugt. Der Code ist dem Anhang beigefügt. Zur Funktionsweise der Methoden zur Zufallszahlengenerierung s. (37). In der unten stehenden Tabelle erfolgt die Zählung der Stichprobenwerte zeilenweise. Beispiel 1 Für das erste Beispiel wurde eine Stichprobe mit standardnormalverteilten Zufallszahlen erzeugt: 1,562; -0,608; -1,091; -0,625; -1,118; -1,658; -1,882; 0,059; -0,408; 0,445; -0,956; -0,335; -0,991; 0,611; 0,957; -0,190; 0,009; 0,426; -1,161; 2,831; 0,355; -1,360; 0,455; -1,163; -1,305; 0,164; -0,498; -0,381; -1,497; 1,032; 1,734; -0,829; 0,332; -2,224; -0,650; -1,935; 0,001; 0,090; 0,236; 0,741; 2,593; -2,894; -0,658; -1,772; -0,484; 1,829; 2,073; 0,412; 1,358; 0,651; -0,966; -0,724; 0,821; 0,421; -1,044; 0,426; -0,249; 0,324; 0,957; 1,033; 0,006; 0,322; -0,782; 0,288; -0,626; -1,333; -0,660; -0,546; 0,466; 0,475; Die Werte könnten beispielsweise die Abweichung von einer Füllhöhe eines Flüssigkeitsbehälters, gemessen in Millimeter, angeben. Von den 70 Werten werden an dieser Stelle nur die ersten 50 verwendet. Die zusätzlichen werden an anderen Stellen der Arbeit benötigt. Als Toleranz wird T = 30,4 gewählt. Die Auflösung beträgt ein Tausendstel. Sie ist damit kleiner als fünf Prozent der Toleranz, d. h. sie ist hinreichend klein. Die daraus berechneten signifikanten Werte sind: - Stichprobenmittelwert: - Stichprobenvarianz: - Stichprobenstandardabweichung: - Prüfmittelpotential: - Prüfmittelfähigkeit: 17 Das Prüfmittelpotential kann nach unten abgeschätzt werden. Die Zufallsvariable ist chi-quadrat-verteilt. Daraus kann man folgern: Z ≥ χn-1; 1-γ² (n – 1) s²/σ² ≥ χn-1; 1-γ² σ² ≤ (n-1) s² / χn-1; 1-γ² Mit einem Vertrauensniveau von γ = 95 % kann man für das obige Beispiel berechnen: σ² ≤ (n-1) s² / χ49; 0,05² = 49 ∙ 1,30 / 33,9 ≈ 1,88 => cg ≥ 0,20 ∙ 30,4 /(4 ∙ √1,88) ≈ 1,11 Die Prüfmittelfähigkeit wird hier nicht nach unten abgeschätzt, weil die Bildung eines Vertrauensintervalls aufgrund der zwei Stichprobenwerte in diesem Fall schwierig ist. Beispiel 2 Die folgende Stichprobe stammt von einer Normalverteilung mit µ = 58,9 und σ² = 0,10. 59,17660; 59,04002; 58,81725; 58,82020; 59,06810; 58,37409; 58,94407; 59,55664; 58,81236; 58,90706; 59,13118; 59,20330; 58,95561; 59,86536; 58,60928; 58,82534; 59,31280; 58,52816; 59,08031; 59,12474; 58,81915; 59,52188; 59,00366; 59,27400; 58,65951; 58,89254; 58,85279; 58,88104; 59,25828; 59,04609; 58,47960; 59,37833; 59,28173; 58,65176; 58,50989; 58,73018; 58,39779; 58,88953; 58,98562; 58,95127; 58,41758; 59,18553; 58,75459; 58,83895; 58,74483; 58,66168; 58,89611; 58,86512; 58,61198; 58,79431; 59,09662; 58,97949; 58,95183; 58,49232; 59,70542; 58,39240; 59,13205; 58,89263; 58,30462; 59,16530; 58,87674; 59,45481; 58,76099; 58,94151; 58,88598; 58,65455; 58,95241; 58,92724; 59,04293; 59,34591; Diese Werte könnten z. B. für die Länge eines Werkstücks, gemessen in Zentimeter, stehen. Wie auch beim ersten Beispiel werden hier nur die ersten 50 Stichprobenwerte verwendet. Als Toleranz wird diesmal T = 10 gewählt. Die Toleranz ist mit einem Hunderttausendstel im Vergleich dazu deutlich kleiner als 5 % und somit ausreichend. Somit kann man folgende Kennwerte berechnen: - Stichprobenmittelwert: - Stichprobenvarianz: - Stichprobenstandardabweichung: 0 18 - Prüfmittelpotential: - Prüfmittelfähigkeit: Die Abschätzung des Prüfmittelpotentials gegen einen unteren Grenzwert ergibt: σ² ≤ (n-1) s² / χ49; 0,05² = 49 ∙ 0,0854 / 33,9 ≈ 0,123 => cg ≥ 0,20 ∙ 10 /(4 ∙ √0,123) ≈ 1,43 19 Variante: Erhöhung des Stichprobenumfangs Fallbeispiele Beispiel 1 Bei diesem Beispiel werden alle 70 Werte aus dem ersten Fallbeispiel zur Stichprobe gerechnet. Daraus können die folgenden Werte berechnet werden: - Stichprobenmittelwert: - Stichprobenvarianz: - Stichprobenstandardabweichung: - Prüfmittelpotential: - Prüfmittelfähigkeit: Die Abschätzung des Prüfmittelpotentials nach unten ergibt: σ² ≤ (n-1) s² / χ69; 0,05² = 69 ∙ 1,237 / 50,9 ≈ 1,68 => cg ≥ 0,20 ∙ 30,4 /(4 ∙ √1,68) ≈ 1,17 Beispiel 2 Die gesamte Stichprobe mit dem Umfang 70 aus dem zweiten Fallbeispiel wird hier genutzt. Als signifikante Werte ergeben sich: - Stichprobenmittelwert: - Stichprobenvarianz: - Stichprobenstandardabweichung: - Prüfmittelpotential: - Prüfmittelfähigkeit: Hinzu kommt die Abschätzung des Prüfmittelpotentials nach unten: 20 σ² ≤ (n-1) s² / χ69; 0,05² = 69 ∙ 0,0997 / 50,9 ≈ 0,135 => cg ≥ 0,20 ∙ 10 /(4 ∙ √0,135) ≈ 1,36 Aufwand Die zusätzlichen Prüfungen bereiten den hinzukommenden Aufwand, da diese Ressourcen binden. Bei der Nutzung dieser Variante muss also überprüft werden, ob die Aussagekraft in einem guten Verhältnis zur Aufwendung der Ressourcen steht. Z. B. sehr kosten- oder zeitintensive Prüfungen sind deshalb möglichst zu vermeiden. 21 Variante: Bootstrapping Fallbeispiele Beispiel 1 Aus der 50er-Stichprobe aus Beispiel 1 wurden B = 1000 Stichproben gezogen. Zu den Stichproben wurden jeweils die Mittelwerte und die Varianzen berechnet. Es ergaben sich folgende Werte: - Mittelwert (der Mittelwerte): - Mittelwert der Varianzen: - Mittelwert der Standardabweichungen: - Prüfmittelpotential: - Prüfmittelfähigkeit: Die Varianzen wurden der Größe nach geordnet und 95 % - Perzentil ausgelesen, um das Prüfmittelpotential nach unten abzuschätzen: |P(σ² ≤ y) ≥ 0,95 => σ² ≤ 1,81 => cg ≥ 0,20 ∙ 30,4 / (4 ∙ √1,81) ≈ 1,13 Beispiel 2 Von Beispiel 2 wurde die 50er-Stichprobe genommen und daraus wurden B = 1000 Stichproben gezogen. Die folgenden Kennwerte wurden errechnet: - Mittelwert (der Mittelwerte): - Mittelwert der Varianzen: - Mittelwert der Standardabweichungen: - Prüfmittelpotential: - Prüfmittelfähigkeit: 22 Mit dem 95 % - Perzentil für die Varianzen ergibt sich für das Prüfmittelpotential als untere Grenze: |P(σ² ≤ y) ≥ 0,95 => σ² ≤ 0,110 => cg ≥ 0,20 ∙ 10 / (4 ∙ √0,119) ≈ 1,51 Aufwand Bei dieser Variante müssen zusätzlich zur grundsätzlichen Prüfung viele Berechnungen durchgeführt werden. Auch dafür müssen Ressourcen zur Verfügung stehen, beispielsweise ein Computer und einer geeigneten Software. Die Berechnungen an sich gehen innerhalb weniger Sekunden vonstatten. In diesem Fall ist also zu prüfen, ob sich die entsprechenden Anschaffungen rechnen und ob dafür qualifizierte Mitarbeiter/innen verfügbar sind. 23 Vergleich der Varianten Fallbeispiel 1 Ursprüngliche Verteilung Standardprüfung Variante 1 Variante 2 0 -0,338 -0,130 -0,340 s² 1 1,30 1,237 1,28 s 1 1,14 1,112 1,13 1,52 1,33 1,37 1,35 1,52 1,18 1,31 1,19 - 1,11 1,17 1,13 Beide Alternativvarianten ergaben im Vergleich zur Standardprüfung eine Verbesserung (s. obige Tabelle). Die Schätzungen des Prüfmittelpotentials änderten sich jedoch nicht sehr. Die Variante 1 ergab zwar eine Verbesserung von etwa 5 %, jedoch steht dem eine Erhöhung des Stichprobenumfangs von 40 % gegenüber. Diese verringerte jedoch die Abweichung des Stichprobenmittelwertes vom tatsächlichen, sodass die Schätzung für die Prüfmittelfähigkeit mit 1,31 zu 1,18 deutlich besser ist. Die Variante 2 brachte nur eine geringe Verbesserung. Fallbeispiel 2 Ursprüngliche Verteilung Standardprüfung Variante 1 Variante 2 58,9 58,9110 58,9335 58,9133 s² 0,10 0,0854 0,997 0,0835 s 0,316 0,292 0,316 0,289 1,58 1,71 1,58 1,73 1,58 1,69 1,53 1,71 - 1,43 1,36 1,51 24 In diesem Beispiel (s. obige Tabelle) bekommt man mit der Variante 1 schlechtere Abschätzungen als mit der Standardprüfung, da die Abweichung des Stichprobenmittelwertes zum tatsächlichen sich deutlich erhöhte. Die Variante 2 hat im Vergleich zur Standardprüfung ebenfalls eine Erhöhung der Abweichung ergeben und gleichzeitig eine etwas niedrigere Varianz. Die grundsätzlichen Schätzwerte für das Prüfmittelpotential und die –fähigkeit sind für die Standardvariante und der Variante 2 ähnlich mit leichtem Vorteil für letztere. Bei der Abschätzung des Prüfmittelpotentials nach unten ist sie sogar deutlich besser, da die Varianzen nur geringfügig streuten (Varianz der Varianzen: Ungefähr 0,00024). Zusammenfassung Die Variante 1 brachte im ersten Fallbeispiel im Vergleich zur Standardprüfung merkliche Verbesserungen. Ob diese den Aufwand rechtfertigen, hängt davon ab, ob und welche Ressourcen zur Verfügung stehen. Im zweiten Fallbeispiel hingegen brachte der höhere Stichprobenumfang keinerlei Vorteile, eher das Gegenteil. Möglicherweise ist dies der konkreten Stichprobe geschuldet, denn die Stichprobenergebnisse konvergieren für einen gegen unendlich gehenden Stichprobenumfang gegen die ursprüngliche Verteilung. Jedoch kann man aus dem Beispiel auch schließen, dass eine Erhöhung des Stichprobenumfangs bei unbekannten Prüflingen eventuelle Abweichungen leichter aufzeigt. In beiden Fallbeispielen waren die Ergebnisse der Variante 2 eine Verbesserung gegenüber der der Standardprüfung. Allerdings waren die Änderungen in den meisten Fällen nur geringfügig. Falls die benötigten Ressourcen verfügbar sind, kann die Variante verwendet werden, da sie nur wenig Mehraufwand verlangt und teilweise auch merklich bessere Daten liefert. 25 Fazit Man konnte sehen, dass es Möglichkeiten gibt, die Entscheidungssicherheit bei der Bestimmung von Prüfmittelfähigkeitsindizes zu verbessern. Allerdings ging aus den Fallbeispielen nicht hervor, ob und welche der verwendeten Varianten sinnvoll ist. Die Erhöhung des Stichprobenumfangs ergibt nicht zwangsläufig eine Verbesserung. Falls sie relativ kostengünstig ist, sollte man sie jedoch in Erwägung ziehen, da Besserungen deutlich sein können. Hinzu kommt, dass man sich in den Fällen gegen falsche Entscheidungen besser abgesichert ist. Bootstrapping hat bei den Fallbeispielen nur geringe Verbesserungen hervorgebracht. Dies könnte auch durch den Umfang der Bootstrapstichprobe bedingt sein. Zumindest kleinere Verbesserungen gab es und da das Verfahren kein großer Mehraufwand ist, könnte es vorteilhaft sein, es bei jeder Stichprobe zu benutzen. Zu berücksichtigen ist auch, dass es weitere Bootstrap-Verfahren gibt, die auch andere Eigenheiten der Bootstrapstichprobe berücksichtigt. Alternativ könnte man auch die Verwendung anderer Resampling-Methoden prüfen. Somit ist von Fall zu Fall zu unterscheiden, ob und welche Varianten man verwendet. Wobei man, wie schon im ersten Absatz dieses Kapitels angedeutet, vorher eingehender prüfen sollte, wie groß der Nutzen jeweils ist. 26 Literaturverzeichnis 1. "Prüfmittelmanagement", Arbeitsgruppe 136. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 115. Bde. 13-61. 3-410-32960-9/0949-4782. 2. Rinne, Horst und Mittag, Hans-Joachim. Statistische Methoden der Qualitätssicherung. 3. Auflage. München : Carl Hanser Verlag, 1995. S. 9. 3-446-18006-0. 3. —. Statistische Methoden der Qualitätssicherung. 3. Auflage. München : Carl Hanser Verlag, 1995. S. 10. 3-446-18006-0. 4. Qualitätsmanagement. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Qualit%C3%A4tsmanagement. 5. Qualitätssicherung. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Qualit%C3%A4tssicherung. 6. "Prüfmittelmanagement", Arbeitsgruppe 136. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 114. Bde. 13-61. 3-410-32960-9/0949-4782. 7. Rinne, Horst und Mittag, Hans-Joachim. Statistische Methoden der Qualitätssicherung. 3. Auflage. München : Carl Hanser Verlag, 1995. S. 17. 3-446-18006-0. 8. Ressource. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Ressource. 9. "Prüfmittelmanagement", Arbeitsgruppe 136. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 119. Bde. 13-61. 3-410-32960-9/0949-4782. 10. —. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 117. Bde. 13-61. 3-410-32960-9/0949-4782. 11. Toleranz (Technik). Wikipedia. [Online] [Zitat vom: 12. 12 2010.] http://de.wikipedia.org/wiki/Toleranz_(Technik). 27 12. "Prüfmittelmanagement", Arbeitsgruppe 136. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 118. Bde. 13-61. 3-410-32960-9/0949-4782. 13. —. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 121. Bde. 13-61. 3-410-32960-9/0949-4782. 14. —. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 122. Bde. 13-61. 3-410-32960-9/0949-4782. 15. Systematischer Fehler. Wikipedia. [Online] [Zitat vom: 12. 12 2010.] http://de.wikipedia.org/wiki/Systematische_Abweichung. 16. Zufällige Abweichung. Wikipedia. [Online] [Zitat vom: 12. 12 2010.] http://de.wikipedia.org/wiki/Zuf%C3%A4llige_Abweichung. 17. Vollprüfung (Qualitätsmanagement). Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Vollkontrolle. 18. Rinne, Horst und Mittag, Hans-Joachim. Statistische Methoden der Qualitätssicherung. 3. Auflage. München : Carl Hanser Verlag, 1995. S. 78. 3-446-18006-0. 19. Häufigkeitsverteilung. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/H%C3%A4ufigkeitsverteilung. 20. Wahrscheinlichkeitsverteilung. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Wahrscheinlichkeitsverteilung. 21. Rinne, Horst und Mittag, Hans-Joachim. Statistische Methoden der Qualitätssicherung. 3. Auflage. München : Carl Hanser Verlag, 1995. S. 59. 3-446-18006-0. 22. —. Statistische Methoden der Qualitätssicherung. 3. Auflage. München : Carl Hanser Verlag, 1995. S. 44. 3-446-18006-0. 23. Stichprobe. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Stichprobe. 28 24. Parameter (Statistik). Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Lageparameter. 25. Mittelwert. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Mittelwert. 26. Erwartungswert. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Erwartungswert. 27. Varianz. Wikipedia. [Online] [Zitat vom: 10. 12 2010.] http://de.wikipedia.org/wiki/Varianz. 28. "Prüfmittelmanagement", Arbeitsgruppe 136. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 120. Bde. 13-61. 3-410-32960-9/0949-4782. 29. —. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 121. Bde. 13-61. 3-410-32960-9/0949-4782. 30. Statistische Methoden der Qualitätssicherung - Grundlagen. 1. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität, 2008. S. 67/68. Lehrgangsunterlagen. 31. Wöhe, Günter. Einführung in die Allgemeine Betriebswirtschaftslehre. 16. Auflage. München : Verlag Franz Vahlen, 1986. S. 41-53. 3-8006-1202-X. 32. Messabweichung. Wikipedia. [Online] [Zitat vom: 12. 12 2010.] http://de.wikipedia.org/wiki/Messabweichung. 33. Messsystemanalyse. Wikipedia. [Online] [Zitat vom: 12. 12 2010.] http://de.wikipedia.org/wiki/Messsystemanalyse. 34. "Prüfmittelmanagement", Arbeitsgruppe 136. Prüfmittelmanagement - Planen, Überwachen, Organisieren und Verbessern von Prüfprozessen. 2. Auflage. Frankfurt : Deutsche Gesellschaft für Qualität e. V., 2003. S. 68. Bde. 13-61. 3-410-32960-9/0949-4782. 29 35. Shikano, Susumu. Bootstrap and Jackknife. [Online] [Zitat vom: 15.12.2010] http://webrum.uni-mannheim.de/sowi/shikanos/Publikation/BootstrapMethodenbuch-2012-05.pdf 36. Chernik, Michael R. Bootstrap Methods – A Guide for Practitioners and Researchers. 2. Auflage. Hoboken, New Yersey: John Wiley & Sons, Inc., 2008. S. 57/58.978-0-471-75621-7. 37. Class Random. [Online] [Zitat vom: 14. 12 2010.] http://download.oracle.com/javase/1.3/docs/api/java/util/Random.html#nextDouble(). 30 Anhang Java - Code, der zur Erzeugung von Zufallsvariablen genutzt wurde: package Beispielmethoden; import java.util.Random; public class Methoden { public static double[][] normalverteilteWerte(long seed, int anzahl, double mittelwert, double varianz) { double[][] feld = new double[1][anzahl]; Random generator = new Random(seed); double standardabweichung = Math.sqrt(varianz); for (int i = 0; i < feld[0].length; i++) { feld[0][i] = mittelwert + standardabweichung * generator.nextGaussian(); } return feld; } public static double[] mittelwerteBerechnen(double[][] stichproben, int anzahlStichproben) { double[] feld = new double[stichproben.length]; int obergrenze = anzahlStichproben; if (obergrenze > stichproben[0].length) obergrenze = stichproben.length; for (int i = 0; i < stichproben.length; i++) { double summe = 0; for (int j = 0; j < obergrenze; j++) { summe += stichproben[i][j]; } feld[i] = summe / obergrenze; } return feld; } public static double[] varianzenBerechnen(double[][] stichproben, double[] mittelwerte, int anzahlStichproben) { double[] feld = new double[mittelwerte.length]; int obergrenze = anzahlStichproben; if (obergrenze > stichproben[0].length) obergrenze = stichproben.length; for (int i = 0; i < stichproben.length; i++) { double summe = 0; for (int j = 0; j < obergrenze; j++) { summe += Math.pow(stichproben[i][j] - mittelwerte[i], 2); } feld[i] = summe / (obergrenze - 1); } return feld; } public static double[][] bootstrappen(long seed, double[][] stichproben, int anzahlBsStichproben, int anzahlStichproben) { int obergrenze = anzahlStichproben; if (obergrenze > stichproben[0].length) obergrenze = stichproben.length; double[][] feld = new double[anzahlBsStichproben][obergrenze]; Random generator = new Random(seed); for (int i = 0; i < feld.length; i++) { for (int j = 0; j < feld[i].length; j++) { feld[i][j] = stichproben[0][generator.nextInt(obergrenze)]; } } 31 return feld; } public static double quantil(double[][] feld, double quantil) { for (int i = 0; i < feld[0].length; i++) { for (int j = i + 1; j < feld[0].length; j++) { if (feld[0][i] > feld[0][j]) { double wert = feld[0][i]; feld[0][i] = feld[0][j]; feld[0][j] = wert; } } } for(int i=0; i<feld[0].length; i++) { //System.out.println(feld[0][i]); } return feld[0][((int)(feld[0].length*quantil))+1]; } } 32