Praxisleitfaden Qualität Prozessoptimierung mit multivariater Statistik in 150 Beispielen von Walter Jahn, Lorenz Braun 1. Auflage Hanser München 2006 Verlag C.H. Beck im Internet: www.beck.de ISBN 978 3 446 40616 2 Zu Inhaltsverzeichnis schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG Produktinformation Seite 1 von 1 Praxisleitfaden Qualität Walter Jahn, Lorenz Braun Prozessoptimierung mit multivariater Statistik in 150 Beispielen ISBN 3-446-40616-6 Leseprobe Weitere Informationen oder Bestellungen unter http://www.hanser.de/3-446-40616-6 sowie im Buchhandel http://www.hanser.de/deckblatt/deckblatt1.asp?isbn=3-446-40616-6&style=Leseprobe 17.08.2006 5 Qualität in der Fertigung Dieses Kapitel ist zweifelsfrei für den Nutzer aus der Fertigung das wichtigste, da in diesem grundsätzliche Fragen, wie z. B. • Was ist Qualität? • Was besagen die Bezeichnungen Produktqualität, Prozessqualität und Lieferantenqualität? • Wie kann die Qualität für Vergleiche messbar gemacht werden? • Wie können Sie die Kundenanforderungen spezifizieren? • Was ist Fähigkeit? • Wie können Sie die Fähigkeit ermitteln? • Wie können Sie aufgrund der Fähigkeiten entscheiden? • Welche Entscheidungsmöglichkeiten haben Sie? • Was heißt Prozessverbesserung? • Was ist eine Prozessgleichung? • Wie können Sie mit der Prozessgleichung die Prozesse steuern? • Wie können Sie die Ergebnisse der statistischen Prozessanalyse und Steuerung der Prozesse in die Praxis überführen? beantwortet werden. Zur Beantwortung dieser und zahlreicher anderer Fragen müssen wir strukturiert vorgehen, um die komplizierte Materie für Sie so aufzubereiten, damit Sie die Methoden zur notwendigen Lösung Ihrer betrieblichen Probleme anwenden und vor allem deren Ergebnisse zum Nutzen für das Unternehmen interpretieren können. 5.1 Was ist ein Produkt? Das Ergebnis jeder Tätigkeit und jedes (Herstellungs- oder Dienstleistungs-) Prozesses ist ein Produkt. Das Produkt kann z. B. ein Nahrungsmittel sein, oder es ist ein Teil für die Weiterverwendung in umfassenderen Produkten, wie z. B. der Motor für ein Auto usw. Das Produkt kann aber auch eine Dienstleitung, z. B. eine Taxi-Fahrt oder die Bestellung von Materialien für die Herstellung, der Vertrieb der Produkte usw. sein. Jedes Produkt wird auf einem Markt realisiert, d. h. angeboten und gekauft. Aber damit ein Produkt gekauft wird, muss es Anforderungen von Kunden erfüllen. Diese Anforderungen werden häufig durch Eigenschaften charakterisiert, so z. B. muss ein PKW modern sein, geringen Benzinverbrauch haben, ständig einsatzbereit sein. Die Eigenschaften werden z. B. auch für Produktweiterentwicklungen durch die WAS Fragen ermittelt. 1316han05.indd 155 25.07.2006 11:38:56 156 5 Qualität in der Fertigung Eigenschaften sind aber häufig nicht oder nicht einfach zu messen. Daher müssen die Eigenschaften parametrisiert werden. Oft sind die Parameter physikalisch, chemisch, biologisch oder ökonomisch stetig messbare Variablen. Der Spritverbrauch beim PKW ist ein physikalisch messbarer Parameter. Die Eigenschaft „modern“ muss aber erst noch in solche Parameter übersetzt werden. Modern könnte sich auf die Elektronik im PKW beziehen und die Motorsteuerung oder die Klimaanlage betreffen. Diese Aggregate können dann durch eine Vielzahl von Variablen parametrisiert werden. Die Ausprägungen der Variablen, d. h. welche Werte sollen die Variablen annehmen, werden unter der Frage WIE z. B. bei QFD charakterisiert. Die immense Vielzahl verschiedener Produkte, die unterschiedlichen Anforderungen an die Produkte und die zahlreichen Weiterverwendungen der Produkte zwingen uns dazu, eine Ordnung in diese riesige Menge und den unterschiedlichen Sprachgebrauch zu bringen. Daher vereinbaren wir, dass ein Produkt durch m, m ≥ 1 Produktvariable Y1, …, Ym beschrieben wird. Die Produktvariablen sind Realisierungen von Zufallsgrößen. Das wird deutlich, wenn wir uns ein konkretes Produkt anschauen. Beispiel 5.1.1: Ziegelsteinherstellung. Nicht unabhängige Zufallsgrößen Ein Ziegelstein besteht aus einer Mischung aus Lehm, Kalk, Feldspat und gewissen Additiven. Die Verteilung der Komponenten wird auch nach sehr langer Mischzeit nicht völlig homogen sein. Die geformten Ziegelsteine werden in Stapeln auf Paletten geschichtet und langsam durch einen Brennofen gefahren. Das heterogene Gemisch aus verschiedenen Komponenten, die unterschiedliche Lage eines Ziegelstein im Stapel, die unterschiedlich lange Dauer der Ofenreise und die damit verbundene unterschiedliche Temperaturkapazität pro Stein führen dazu, dass die Produktvariablen des Ziegelsteins, wie die Bruchfestigkeit, die geometrischen Abmessungen, das Gewicht usw. selbst für eine „gleichbehandelte“ Charge in gewissen Grenzen schwanken. Die Messwerte für die Produktvariablen sind zufallsbehaftet, d. h. die Messwerte haben einen mehr oder weniger großen zufälligen Fehler. Die Produktvariablen sind nicht unabhängig voneinander, sondern sie sind mehr oder weniger stark miteinander korreliert. Diesen Sachverhalt können Sie sich anhand der Abbildung 5.1.1 verdeutlichen. r 12 Y 2± Δ Y 2 Y1 r 23 r1 3 Y3 Abb. 5.1.1: Korrelative Abhängigkeiten für Produktvariable 1316han05.indd 156 25.07.2006 11:38:57 5.1 Was ist ein Produkt? 157 Diese Abbildung zeigt Ihnen, dass sich z. B. die Veränderung des Wertes von Y2 um den Betrag ΔY2 sowohl auf Y1 als auch auf Y3 auswirken kann. Die „Größe“ dieser Abhängigkeiten, besser der Grad der linearen Abhängigkeiten zwischen jeweils zwei Zufallsvariable wird durch den Korrelationskoeffizienten rjk, j, k = 1,2,3 gemessen. Das sind dimensionslose Zahlen, die zwischen –1 und +1 liegen. Sind zwei Variablen unabhängig voneinander, dann ist der Korrelationskoeffizient gleich null. Beispiel 5.1.2: Dämpfung der Motorvibration. Abhängigkeiten Für die Dämpfung der Motorvibration werden Hydrolager verwendet. An diesem Produkt werden viele Produktvariablen gemessen. Wir wollen hier nur die beiden Produktvariablen Y1 = dynamische Steifigkeit [N/mm] und Y2 = Phasenverschiebung [Φ] betrachten Mit den Daten aus einer großen Stichprobe wurde die dreidimensionale Häufigkeitsverteilung in Abbildung 5.1.2 gezeichnet. Was können Sie aus der Abbildung 5.1.2 ablesen? • Die Werte für die beiden Produktvariable streuen sehr stark. Das ist ein Ausdruck für den zufälligen Charakter der Produktvariablen. • Es gibt viele Ausreißer. • Die Grundfläche der Häufigkeitsverteilung, d. h. die Punktwolke für die Messwertpaare, ausgedrückt durch das Streudiagramm in Abbildung 5.1.3, ist offensichtlich nicht kreisförmig, sondern elliptisch umrissen. Das zeigt Ihnen, dass die beiden Produktvariablen nicht unabhängig voneinander sind. Abb. 5.1.2: Dreidimensionale Häufigkeitsverteilung für zwei Produktvariablen eines Hydrolagers 1316han05.indd 157 25.07.2006 11:38:57 158 5 Qualität in der Fertigung CDYN 250 200 150 100 0 10 20 30 PHASE 40 50 60 Abb. 5.1.3: Streudiagramm für die hydraulischen Motorlager Aus Abbildung 5.1.2 und Abbildung 5.1.3 müssen Sie die Schlussfolgerungen ziehen, dass • die Daten aufbereitet werden müssen; Ausreißer sind zu erkennen und zu eliminieren, • jeder Prozess zu Herstellung eines Produktes gesteuert werden muss, um die vielen Ausreißer zu vermeiden und die Streuung zu reduzieren. Für die Steuerung benötigen Sie Zielwerte und zulässige Streuintervalle für die Produktvariablen und eine Prozessgleichung. 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind oder verbessert werden müssen? Die konkreten Produktdarstellungen zeigen Ihnen, dass • jedes Produkt durch die Angabe von Sollwerten und Toleranzgrenzen für alle nicht unabhängigen Produktvariablen präzisiert werden muss – man spricht in diesem Zusammenhang von der Spezifizierung aller relevanten Kundenanforderungen und • ein Kriterium gesucht wird, nach dem entschieden wird, ob ein Produkt simultan alle relevanten Kundenanforderungen erfüllt oder der Prozess verbessert werden muss. 1316han05.indd 158 25.07.2006 11:38:58 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 5.2.1 159 Was ist ein modernes Produktaudit? Audits im Qualitätsmanagement sind durch die Unternehmensleitung initiierte, systematische und unabhängige Qualitätsprüfungen, um festzustellen, ob die qualitätsbezogenen Tätigkeiten den geplanten Anforderungen entsprechen, ob diese Anforderungen tatsächlich verwirklicht sind und ob sie geeignet sind, die Ziele zu erreichen (Linß [2005, 393]). Nach Linß wird in Systemaudits, Produktaudits und Prozessaudits unterschieden. Durch das Produktaudit soll nach ISO 9000: 2000 ff. und Linß [2004, 394] die Übereinstimmung der Ausführung von Produkten mit den festgelegten Qualitätsforderungen untersucht und beurteilt werden. Die beiden Seiten eines Audits, nämlich die • Anforderungen und • der Istzustand eines Produktes müssen quantifiziert werden. Das Gleiche gilt für die Beurteilung der Übereinstimmung, damit z. B. Übereinstimmungen verglichen werden können, um festzustellen, ob Verbesserungsmaßnahmen wirksam waren. Zu diesem Zweck zählen wir zum „modernen“ Produktaudit die Aktivitäten: 1. Zusammenstellung der (ex- und/oder internen) Kundenanforderungen zu einem KundenAnforderungs-Profil (KAP), 2. Parametrisierung der Kundenanforderungen durch die Produktvariablen, 3. Datensammlung für alle Produktvariablen, 4. Zusammenstellung der Sollwerte und Toleranzgrenzen; falls erforderlich muss die statistische Tolerierung für alle nicht unabhängigen Produktvariablen durchgeführt werden, 5. Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen mit 6. korrigierten univariaten und multivariaten Prozessfähigkeitsindizes, 7. Entscheidung aufgrund der Indizes für – Prozessverbesserung im Sinne der · Reduktion der Variabilität mindestens einer Produktvariablen, · Übereinstimmung der Mittel- mit den Sollwerten, – neue statistische Tolerierung, – Kontrolle des Prozesses mit den uni- und/oder multivariaten Kontrollkarten, – Investitionen in Maschinen, Anlagen, Mitarbeiter, Methodik usw. 5.2.1.1 Was beinhaltet das Kunden-Anforderungs-Profil (KAP)? Ein (in- oder externer) Kunde, der eine Dienstleistung oder das materielles Produkt eines Vorläuferprozesses benötigt, stellt Anforderungen an das Produkt und seine zu gewährleistenden Funktionen. Die Anforderungen werden häufig in Form von Eigenschaften formuliert. Über die Kundenanforderungen wird das Produkt definiert. 1316han05.indd 159 25.07.2006 11:38:59 160 5 Qualität in der Fertigung Beispiel 5.2.1: Kunststoffscheiben. Definition von Kundenanforderungen Problem: Die Glasscheiben in einem PKW sollen durch Kunststoffscheiben auf Basis von Polycarbonat mit Hartbeschichtung ersetzt werden, um das • zukünftige Design von Scheiben und Karosserie durch ganzheitliches Design und Konstruktion zu revolutionieren. • die Sicherheitsaspekte zu verbessern, • das Gewicht zu reduzieren usw. Aus der Analyse der Marktsituation sollen unter Beachtung der KAP der europäischen Automobilhersteller nachfolgenden Studien 1. über die Machbarkeit und 2. internationalen Verfügbarkeit der Prozesse erarbeitet werden. Hierbei sollen die globalen Ziele • • • • • • • • • Verbesserung der Sicherheit gegen Einbruch, Reduktion des Gewichts, Verbesserung des Komfort (Geräuschdämpfung, thermische Eigenschaften) Verbesserung des Schutzes gegen Unfälle, Überfälle usw., Erhöhung der Verschleißfestigkeit (Kratzfestigkeit, …) Verbesserung der Formgebung/Design und Konstruktion, Erhaltung der optischen Eigenschaften des Glases, Erhöhung der Wirtschaftlichkeit bei den Herstellern und Verbesserung der Instandhaltungsfreundlichkeit verfolgt werden. Die globalen Ziele werden auf geforderte Eigenschaften und auch schon geforderte Parameter zurückgeführt und im Kunden-Anforderungs-Profil (KAP) zusammengefasst. Unter einem Parameter wollen wir hier eine messbare Variable verstehen. Zu den Eigenschaften gehören z. B. • die Zähigkeit • diese kann parametrisiert werden durch die physikalischen Variablen – Biegefestigkeit, – Schlagfestigkeit, – Bruchfestigkeit, – E-Modul • Beständigkeit der Oberfläche nach dem Verkleben, – Temperaturbereich, – Medien, 1316han05.indd 160 25.07.2006 11:38:59 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? • • • • 161 – Luftfeuchte, – NaCl bzw. CaCl-Lösungen, – Tenside Verformbarkeit, – Spannungs- Verformungs- Verhalten mit der – Normalspannung, – Tangentialspannung, – Scherspannung optische Eigenschaften, – Trübung – Lichtreflektion, – Lichttransmission, – Verzerrung, – Brechungsindex, – Lichtdurchlässigkeit Oberflächeneigenschaften – Farbe – Verfärbung, – Schlierenbildung, – Glanz, – Beschichtungsdefekte, – Abriebfestigkeit, – Kratzfestigkeit Thermisches Verhalten – Wärmedämmung, – Wärmedurchgang, – Wärmeausdehnung, – Überwölbung Anforderungen in Parameterform sind z. B. • • • • • Steifigkeit, Gewicht, Lebensdauer, geometrische Maße, wie z. B. Scheibendicke, Kantenrundung, Oberflächenspannung, und vieles mehr. Die Parametrisierung führt zur Benennung der Produktvariablen. Hier einige Beispiele: Y1 Y2 Y3 Y4 Y5 Y6 Y7 1316han05.indd 161 = Biegefestigkeit = Bruchfestigkeit (gleiche Bruchfestigkeit über einem großen Temperaturbereich) = Formbarkeit = Lichtdurchlässigkeit (Transparenz) = Elastizitätsmodul = Einbaustabilität = Geräuschdämpfung 25.07.2006 11:38:59 162 5 Qualität in der Fertigung Y8 = Kratzfestigkeit Y9 = Witterungsbeständigkeit Y10 = Korrosionsbeständigkeit Y11 = Gewicht Y12 = Reflexion der Wärmestrahlung Y13 = Wirtschaftlichkeit, Preis Y14 = Abriebfestigkeit Y15 = optische Verzerrung und viele mehr. Die Produktvariable sind mit Sicherheit nicht unabhängig voneinander. Alle Eigenschaften müssen parametrisiert werden. Das ist bisher nicht gelungen. Ursachen hierfür sind: • fehlende Gewissheit über die Vollständigkeit der Eigenschaften und damit der Parametrisierung, • fehlende Invarianz der vom Kunden beschriebenen Eigenschaften, • mehrere Eigenschaften sind Funktionen von diversen anderen Parametern. • Diese Funktionen sind mitunter kompliziert. • Keine klare Trennung von Eigenschaften, Parametern und deren Prüfungen. • Die bisher parametrisierten Eigenschaften sind unvollständig spezifiziert. • Die Sollwerte liegen z. T. als Bereiche und nur selten als Zahlen vor, Toleranzgrenzen fehlen grundsätzlich. Dieses Beispiel demonstriert, das die Zusammenstellung des KAP eine wichtige und auch komplizierte Aufgabe ist, an der verschiedene Experten zusammenarbeiten sollten. 5.2.1.2 Wie kann man die parametrisierten Kundenanforderungen statistisch tolerieren? Bei der Definition des Produktaudits wird auf die beiden Seiten, nämlich die • Anforderungen und • den Istzustand eines Produktes hingewiesen. Hier wollen wir uns damit befassen, wie • gegebene CAD Toleranzen zu überprüfen sind oder • diese beim Fehlen von Sollwerten und Toleranzgrenzen berechnet werden können. Die Frage der statistischen Tolerierung ist bedeutsam, da die Produktvariablen in der Regel nicht unabhängig, sondern im Gegenteil sehr häufig sehr stark miteinander korreliert sind. Die meisten – bisher bekannten – statistischen Tolerierungsverfahren basieren auf dem Faltungssatz für Zufallsgrößen. Dieser setzt die Unabhängigkeit der Zufallsgrößen voraus. Wie wir bei der Korrelationsanalyse im Abschnitt 5.6 sehen, wird die Straffheit einer Abhängigkeitsstruktur durch die Determinante der Korrelationsmatrix beurteilt. 1316han05.indd 162 25.07.2006 11:38:59 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 163 Bei einem Autobauer sollten für den Karosseriebau die Toleranzen vieler Maße überprüft werden, da es Probleme bei der Montage gab. Zur Auswahl standen • das Maßkettenkonzept nach dem Faltungssatz und • die statistische Tolerierung von Jahn. Als Entscheidungskriterium wählte ich die Determinante der Korrelationsmatrix. Für ca. 60 Produktvariable galt Det(RYY) = 1.28 10–135. Dieser Wert liegt sehr viel näher an der Null als an der für das Maßkettenkonzept geforderten 1! Das Maßkettenkonzept muss zugunsten der statistischen Tolerierung von Jahn verworfen werden. Problem Ein Kunde kommt mit seinem Wunsch nach einem bestimmten Produkt zu einem Unternehmen. Z. B. ein Autobauer möchte ein Dämpfungssystem (Motorlager) von seinem Lieferanten. Der Kunde formuliert seine Anforderungen an die Eigenschaften des Motorlagers hinsichtlich der Vibration, des Fahrverhaltens und der Dämmung des Geräuschpegels. Der Hersteller des Dämpfungssystems (der Lieferant) akzeptiert den Wunsch, parametrisiert die Eigenschaften, z. B. in die Produktvariablen statische und dynamische Steifigkeiten, Phasenverschiebung, Ausreißkräfte usw., spezifiziert die Produktvariablen in Form von Sollwerten und Toleranzgrenzen für die Produktentwicklung mit Hilfe eines CAD Systems oder des Maßkettenkonzeptes. Für die Herstellung sind diese Toleranzen in der Regel nicht geeignet. Hierfür sollten aufgrund der Abhängigkeitsstruktur der Produktvariablen die Maßtoleranzen zumindest durch die statistische Tolerierung für alle relevanten Produktvariablen überprüft werden. Die statistischen Toleranzen für eine Pilotfertigung oder für Vorläuferprodukte werden mit dem Kunden abgestimmt, denn die Anforderungen können zu einem Widerspruch innerhalb der Maßkettentoleranzen oder zwischen den Maßketten- und statistischen Toleranzen führen, wie auch im vorliegenden Fall, zu einer hohen Steifigkeit der Gummimischung für das Fahrverhalten und einer niedrigen Steifigkeit für die Geräuschdämmung. Die statistischen Toleranzen werden als Toleranzen anerkannt und die Produkte werden produziert. Der Produzent für das Motorlager liefert die Produkte und weist nach, dass die geforderte Qualität im Sinne der simultan Erfüllung aller relevanten Kundenanforderungen geliefert wird. Danach stellt er die Rechnung und verlangt sein Geld. Das Problem beinhaltet zwei zu lösende Teilprobleme: • Tolerierung der nicht unabhängigen Produktvariable für die Entwicklung und Fertigung, • Nachweis der simultanen Erfüllung aller spezifizierten relevanten Kundenanforderungen. Problemlösung Bisheriges Kernstück einer funktions-, fertigungs- und montagegerechten Tolerierung ist die Maßkettentheorie. Sie ist die Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Toleranzen sich summieren. Die Maßkette ist eine Aneinanderreihung von zusammenwirkenden Einzelmaßen und dem von ihnen abhängigen Schlussmaß. Sie bildet bei schematischer Darstellung einen geschlossenen Linienzug (eine Masche). Die Maße (Einzelmaße – Schlussmaß) sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette mit Schlussmaß ist ihre Geschlossenheit. Bei der Berechnung von Maßketten (Toleranzketten) ist zu 1316han05.indd 163 25.07.2006 11:38:59 164 5 Qualität in der Fertigung beachten, dass die Einzelmaße unterschiedlichen Systemen angehören können, und zwar dem herzustellenden Gerät, dem Werkstück, der Bearbeitungseinheit aus Maschine, Vorrichtung, Werkzeug usw. Die Maßkette schafft Voraussetzungen zur Festlegung der Abmessungen der Einzelteile und des Gerätes, der Einzeltoleranzen, der Bearbeitungsfolge, der Arbeitszugaben usw. Die Toleranzkettentheorie ist die Lehre von der möglichen Größe und Lage der Toleranz (Schlusstoleranz) des funktionsbestimmenden resultierenden Maßes (Summenmaß) einer Maßkette. Unter Funktionssicherheit wird dabei die Einhaltung der für ein Erzeugnis vorgegebenen Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen verstanden. Innerhalb dieser Grenzen ist das Produkt funktionstüchtig. Die Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die Funktionstüchtigkeit beschreibenden Eigenschaften eines Produktes. Die Herstellungstoleranz ist die Differenz zwischen dem oberen und unteren erreichten Grenzwert bei der Herstellung mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigprodukte. Die Maßtoleranz ist die Differenz zwischen dem zulässigen Größt- und Kleinstmaß. Die Messtoleranz ist die Differenz zwischen der zulässigen oberen und unteren Abweichung des Messwertes von der Messgröße. Sie entspricht der zulässigen Fehlergrenze der Messung. Die Bedeutung der Tolerierung liegt in • der Gewinnung von Zielwerten und den zugehörigen Intervallen für die Steuer- und Regelung von Prozessen und • der Ableitung von Genauigkeitsintervallen (Toleranzintervallen) für die Input- und Prozessvariablen. Wie wird eine Maßkette berechnet? Das Nennmaß N0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen Maßkettengliedern additiv aus den Nennmaßen Nj der m Einzelmaße N0 = m ∑ kj N j j =1 zusammen, wobei die kj die Richtungskoeffizienten sind, siehe z. B. Hofmann [1986]. Diese Koeffizienten nehmen die Werte +1 oder –1 an, je nachdem, ob der Einfluss des Einzelmaßes auf das Schlussmaß positiv oder negativ ist. Positive Einzelmaße bewirken bei ihrer Vergrößerung oder Verkleinerung eine gleichsinnige Veränderung des Schlussmaßes. Der Richtungskoeffizient ist der Maßkette zu entnehmen. Wie wird eine Toleranzkette berechnet? Sind die Toleranzen der Einzelmaße und die Kleinstspiele Skj gegeben, so beträgt nach Hofmann [1986] die Schlusstoleranz T0 des Schlussmaßes T0 = m−e m j =1 j = m − e +1 ∑ Tj + ∑ Skj . Hieraus können die Einzeltoleranzen Tj berechnet werden. 1316han05.indd 164 25.07.2006 11:38:59 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 165 Unterscheidet sich die Tolerierung für die Produktentwicklung von der für die Fertigung? Dem Maßkettenkonzept soll die statistische Tolerierung gegenüber gestellt werden, denn • die Produktvariablen der gefertigten Produkte sind Zufallsgrößen und • die Zufallsgrößen sind nicht unabhängig voneinander. Das Maßkettenkonzept auf die Fertigung angewandt, basiert auf der Faltung von Zufallsgrößen und setzt Unabhängigkeit voraus. Diese Voraussetzung ist aber nur selten erfüllt. Daher wollen wir uns mit einer Möglichkeit der statistischen Tolerierung befassen, die auch bei korrelierten Produktvariablen richtige Resultate liefert. Die statistische Tolerierung quantifiziert das „Können des Prozesses“. Folglich müssen die statistischen Toleranzgrenzen für alle relevanten Produktvariablen mit den Experten der Produktentwicklung abgestimmt werden, damit aus den statistischen allgemeingültige Toleranzen werden. Für die Berechnung der multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten Potentials des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren (Qualität), benötigen wir, neben dem Können des Prozesses, die Möglichkeit des Vergleiches des Soll- und Istzustandes der Fertigung für den multivariaten Fall. Der Vektor der Produktvariablen sei wieder YT = (Y1, …, Ym). Dieser Vektor sei m-dimensional normal verteilt Y ~ Nm(µ, ΣYY), wobei die Kovarianzmatrix ΣYY positiv definit sein soll oder die Verteilung von Y gehöre zur Familie der elliptisch umrissenen Verteilungen. 5.2.1.3 Auf welchem Prinzip basiert die statistische Tolerierung? Der Vektor Y wird in die beiden Teile YT = (Yj, YTm – j) zerlegt. Die einzelnen Produktvariablen sind nicht unabhängig voneinander, sondern durch die Abhängigkeitsstruktur, ausgedrückt durch die folgende partitionierte Kovarianzmatrix des aufgespalteten Vektors der Produktvariablen, miteinander verbunden. Die Kovarianzmatrix der Produktvariablen ist ΣYY ⎛ σ 2j =⎜ ⎝ σ j .m − j ⎞ ⎟. Σ m − j .m − j ⎠ Die Realisierungen (Messwertvektoren) des normal verteilten Vektors der Produktvariablen sind Punkte im m-dimensionalen euklidischen Raum und liegen wegen der Verteilungsvoraussetzung innerhalb eines Hyperellipsoides. Das sieht man, wenn man den Exponent der multivariaten Normalverteilung f ( y ; μ, ΣYY ) = 1 2⋅π ⋅ 1 ΣYY 2 ⎧ 1 ⎫ −1 ⋅ exp ⎨− ⋅ (Y − μ)T ⋅ ΣYY ⋅ (Y − μ)⎬ ⎩ 2 ⎭ gleich einer Konstanten setzt, z. B. −1 (Y − μ)T ⋅ ΣYY ⋅ (Y − μ) = c1− α . 1316han05.indd 165 (1) 25.07.2006 11:39:00 166 5 Qualität in der Fertigung Dann ist das die Gleichung für ein Hyperellipsoid mit dem Mittelpunkt µ, wobei 1 – α die Wahrscheinlichkeit ist, mit der die Punkte innerhalb des Hyperellipsoides liegen. Das Hyperellipsoid beschreibt das Können des Prozesses. Die Form des Hyperellipsoides wird durch die Abhängigkeitsstruktur bestimmt. Diese wiederum haben wir durch den Grad der Multikollinearität δ = R YY −1 (2) charakterisiert. Zunehmender Grad der Multikollinearität führt zu größeren Diagonalelemente der inversen Korrelationsmatrix, −1 RYY ⎧ (1 − ρ2j / m − j )−1 , für alle j = 1, …, m ⎪ ⎪ −ρ jk / m − ( j ,k) =⎨ , j , k = 1, …, m, j ≠ 1 ⎪ 2 2 2 ⎪⎩ ⎡⎣(1 − ρ j / m − j ) (1 − ρk / m − k )⎤⎦ wobei ρ2j/m – j das Quadrat des multiplen Korrelationskoeffizienten zwischen Yj und einer Linearkombination in den restlichen (Y1, …, Yj – 1, Yj + 1, …, Ym) = Ym – j ist. ρjk/m – (j, k) sind die partiellen Korrelationskoeffizienten zwischen Yj und Yk unter der Bedingung der restlichen Produktvariablen. Zumindest einige der multiplen Korrelationskoeffizienten für beliebige Yj in Abhängigkeit von den Linearkombinationen in den anderen Produktvariablen werden mit wachsendem δ größer. Damit werden die Differenzen 1 – ρ2j/m – j kleiner und somit die Quotienten (1 – ρ2j/m – j)–1 größer. Das heißt aber nicht anderes, als dass sich ein oder mehrere Produktvariablen sehr gut durch andere darstellen lassen. Sind die zugehörigen multiplen Korrelationskoeffizienten groß genug, dann sagt man, diese Produktvariablen sind redundant. Beachtet man noch den dritten Fakt, dass die Längen der Hauptachsen des Hyperellipsoides gleich Lj sind, mit 2 L j = 2 ⋅ λ j ⋅ χm ,1− α für j = 1,…m wobei λj die Eigenwerte der Kovarianzmatrix ΣYY sind, dann sieht man, dass mit zunehmendem Grad der Multikollinearität das Hyperellipsoid einer „Zigarre“ immer ähnlicher und zumindest die 1. Hauptachse des Ellipsoides immer länger wird. Ist der Grad der Multikolinearität δ = 1, dann sind die Produktvariablen nach der obigen Beziehung unkorreliert und das Hyperellipsoid wird zu einer Hyperkugel. Bei vielen Anwendungen ist für jede Produktvariable Yj, j = 1, …, m ein Toleranzintervall gegeben. Inwieweit bei deren Festlegungen die Abhängigkeitsstruktur zwischen den Produktvariablen beachtet wurde, muss in jedem konkreten Fall hinterfragt werden. In der Regel wird das nicht der Fall sein. In diesen Fällen müssen die Toleranzgrenzen aufgrund der statistischen Kenntnisse über den Prozess zumindest überprüft, meist jedoch neu berechnet und mit den Konstrukteuren abgestimmt werden. Sind die Toleranzgrenzen aus technischer Sicht bindend, dann könnte das kartesische Produkt dieser Toleranzintervalle, das ist dann ein Hyperkubus für den gemeinsamen Toleranzbereich, gebildet werden. Die Forderung der simultanen Erfüllung aller relevanten Kundenanforderungen bedeutet geometrisch, dass das Hyperellipsoid mit vorgebbarer Wahrscheinlichkeit in diesem Hyperkubus enthalten sein muss, d. h. 1316han05.indd 166 25.07.2006 11:39:00 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? m ⎡ ⎤ −1 P ⎢(Y j − μ j )T ⋅ ΣYY ⋅ (Y j − μ j ) ∈ X (To, j − Tu, j )⎥ = 1 − α. ⎢⎣ ⎥⎦ j =1 167 (5) Die Frage ist nun, 5.2.1.4 Wie können unter der Bedingung (1) die Toleranzintervalle für jede einzelne Produktvariable unter Beachtung der Abhängigkeitsstruktur statistisch bestimmt werden? So, dass das kartesische Produkt der einzelnen Toleranzintervalle die Bedingung (2) erfüllt. Y2 (Produktvariable) Y1 (Produktvariable) Abb. 5.2.1: Toleranzgebiet und Streuungsellipse Die Lösung dieses Problems ist: Wie aus der Abbildung ersichtlich ist, müssen hier im 2-dimensionalen Fall die Tangenten an die Ellipse, parallel zu den beiden Achsen der Produktvariable, bestimmt werden. Im m-dimensionalen Fall müssen die Tangentialhyperebenen an das Hyperellipsoid bestimmt werden. Für diese Konstruktion ist das nachfolgende Theorem von ausschlaggebender Bedeutung. Satz 1 (Jahn): Die Projektionen der Ellipse bzw. des Hyperellipsoides auf die Koordinatenachsen haben die Längen Yj ≤ σ 2j / m − j = σ j / m − j , wobei σ2j/m – 1 die bedingte Varianz der j-ten Komponente von Y unter der Bedingung der Konstanz der restlichen Komponenten des Vektors der Produktvariable ist, wobei m – j = m – 1 wieder die Indexmenge {1, …, j – 1, j + 1, …, m} bezeichnet. Den Beweis für diesen überaus wichtigen Satz findet man auf der beiliegenden CD. 1316han05.indd 167 25.07.2006 11:39:00 168 5 Qualität in der Fertigung Bemerkungen: 1. Das Theorem ist für die Berechnung der statistischen Toleranzgrenzen über die Momente der bedingten Verteilung von Yj unter der Bedingung Ym – j = ym – j d. h. konstant, überaus bedeutsam. Korollar 1 (Jahn): Die oberen und unteren statistischen Toleranzgrenzen für die einzelnen, nicht unabhängigen Produktvariablen können nach den Beziehungen USL j = μ j + 2 2 χm ,1− α ⋅ σ j / m − j LSL j = μ j − 2 2 χm ,1− α ⋅ σ j / m − j berechnet werden, wobei χ2m,1 – α das 1 – α Quantil der Chi Quadrat Verteilung mit m Freiheitsgraden ist. 2. Die statistischen Toleranzgrenzen USTL und LSTL (upper and lower tolerance limits) beschreiben das “Können” des Prozesses. Diese Grenzen sind daher unbedingt mit den Konstrukteuren abzustimmen. Korollar 2 (Wang et. al[1999]): Die statistischen Toleranzgrenzen werden nach den Beziehungen USL j = μ j + χ2m,1− α ⋅ Det(SY−1−1.Y −1 ) −1 Det(SYY ) = μj + χ2m,1− α ⋅ Det(SYY ) Det(SY −1.Y −1 ) und LSL j = μ j − χ2m,1− α ⋅ Det(SY−1−1.Y −1 ) −1 Det(SYY ) = μj − χ2m,1− α ⋅ Det(SYY ) Det(SY −1.Y −1 ) berechnet. Korollar 3 (Jahn): Die bedingten Stichprobenvarianzen S2j/m – j können auch aus den Diagonalelementen der inversen Kovarianzmatrix berechnet werden. Es gilt −1 SYY 1316han05.indd 168 ⎧ ⎡S 2j ⋅ (1 − R 2j / m − j )−1 = S-2 ⎤ j / m − j , für j = 1, …, m ⎦ ⎪⎣ ⎪ S j ⋅ Sk ⋅ R j k / m − j ,k = ⎨− , für j ≠ k 1 ⎪ 2 2 2 ⎪ ⎡⎣(1 − R j / m − j ) ⋅ (1 − Rk / m − k )⎤⎦ ⎩ 25.07.2006 11:39:00 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 169 Beispiel 5.2.2: Akkubohrschrauber. Statistische Tolerierung Die Produktvariablen und der Sollzustand für dieses Beispiel sind in der Tabelle 5.2.1 zusammengestellt. Tabelle 5.2.1: Sollzustand für die Plastikschalen Parameter Sollwert Y1 = Thermoschrumpf Y2 = Axialität Y3 = Dicke Y4 = Parallelität, Toleranzgrenzen 1,1 0 3,1 0 Tu To 0,2 –0,3 2,9 –0,6 2 0,3 3,3 0,6 Für die Berechnung der statistischen Toleranzgrenzen benötigen wir die Stichprobenkovarianzmatrix und deren Inverse. Beide Matrizen sind in Tabelle 5.2.2 und Tabelle 5.2.3 enthalten. Tabelle 5.2.2: Kovarianzmatrix für die Produktvariablen Thermoschrumpf Axialit Dicke Parallel Thermoschrumpf Axialität Dicke Parallel 0,22495 0,00353 –0,00455 –0,10751 0,00353 0,04206 –0,00081 0,04239 –0,00455 –0,00081 0,00882 0,01654 –0,10751 0,04239 0,01654 0,24588 Axialität Dicke Parallel Tabelle 5.2.3: Inverse Kovarianzmatrix Thermoschrumpf Thermoschrumpf Axialit Dicke Parallel 62.301 –44.043 –42.555 37.697 –44.043 –42.555 37.697 334.037 173.955 –88.554 173.955 1.394.678 –142.413 –88.554 –142.413 82.002 Mit den Elementen der inversen Kovarianzmatrix kann man nach Korollar 1 die statistischen Toleranzgrenzen für die vier Produktvariablen berechnen. In der Tabelle 5.2.4 sind die Werte zusammengestellt. Tabelle 5.2.4: Sollwerte und statistische Toleranzgrenzen Thermoschrumpf Axialität Dicke Parallelität Sollwert ±Toleranz 1,1 0 3,1 0 ±1,62 ±0,7 ±0,34 ±1,4 Mit den statistischen Toleranzgrenzen können wir die univariaten und multivariaten Prozessfähigkeitsindizes berechnen (vgl. Abschnitt 5.2.1.6 und 5.2.1.7). 1316han05.indd 169 25.07.2006 11:39:01 170 5 Qualität in der Fertigung 5.2.1.5 Wie kann man das „Produkt“ statistisch tolerieren? Wir stellten bereits fest, dass ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen Y1, …, Ym beschrieben wird. Wir forderten auch schon, dass ein Prozess so gesteuert werden muss, dass simultan alle Kundenanforderungen erfüllt werden. Wir wissen auch, dass ein Prozess nur • mit einer Einstellung der Input- und Prozessvariablen, • mit einer optimalen Teilmenge von Input- und Prozessvariablen, • entweder mit Blick auf eine Produktvariable oder einer geschickten Zusammenfassung aller Produktvariablen gesteuerten werden kann und • dass wir hierfür entweder den Sollwert und die Toleranzgrenzen für die eine Produktvariable oder die vereinigten Sollvorgaben für das „Produkt“ als Ziele für die Steuerung benötigen. Die vereinigten Sollvorgaben wollen wir Toleranzbereich für das Produkt nennen und deren Grenze Toleranzgrenze für das Produkt (TGProd) nennen. In dem Ausdruck Σ∗YY ⎛ To, j − Tu, j * ΣYY = diag ⎜ 6 ⎝ ⎞ ⎛ To, j − Tu, j ⎞ ⎟⎠ R YY diag ⎜⎝ ⎟⎠ 6 bezeichnen RYY die Abhängigkeitsstruktur und ToT = (To,1 … To,m) bzw. TuT = (Tu,1 … Tu,m) die Vektoren der oberen bzw. unteren Toleranzgrenzen für alle relevanten Produktvariablen. Die Korrelationsmatrix muss aus einer großen Stichprobe geschätzt werden. Unter diesen Annahmen gilt c* = * −1 (To − M )T (ΣYY ) (To − M ) = TGProd . TGProd ist die Toleranzgrenze für das Produkt T2, d. h. die über T2 zusammengefassten Produktvariablen. Die Toleranzgrenze (TGProd) für das Produkt hängt ab von 1. der Abhängigkeitsstruktur RYY – über die theoretische Kovarianzmatrix Σ*YY, 2. die Toleranzgrenzen für die einzelnen Produktvariablen und 3. den Vektor der Sollwerte. Mit der berechneten Toleranzgrenze TGProd wird die simultane Erfüllung aller relevanten Kundenanforderungen geprüft. Die Gleichung für T2 ist auch bekannt als Mahalanobis Abstand. 5.2.1.6 Univariate Prozessfähigkeitsindizes Was heißt „ein Prozess ist fähig“? Die Fähigkeit ist das inhärente Potential eines Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren. Die Anwendung auf betriebliche Prozesse bedeutet, • dass für eine, mehrere oder alle Produktvariablen Toleranzgrenze vorliegen, die den „vorgegebenen Eigenschaften“ entsprechen und 1316han05.indd 170 25.07.2006 11:39:01 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 171 • impliziert, dass geprüft werden kann, ob die produzierten Produkte den vorgegebenen Eigenschaften entsprechen. In der Folge werden wir uns ausführlich mit • den univariaten und • multivariaten Prozessfähigkeitsindizes befassen. Wie kann die Eigenschaft „ein Prozess ist fähig“ nachprüfbar formuliert und quantifiziert werden? Für die Beantwortung der Frage stellen wir zunächst alles zusammen, was uns bekannt ist. Die Produktvariable sei Y. To und Tu seien die gegebenen Toleranzgrenzen und M sei der Sollwert. Die Produktvariable Y sei normal verteilt mit dem geforderten Erwartungswert µ = Sollwert = M und der zulässigen Standardabweichung σ Zul = To − Tu . 6 Dieser Ausdruck ist das Ergebnis der 3 σ-Regel, die besagt, dass im Intervall µ – 3 σ ≤ Y ≤ µ + 3 σ ca. 99.73 % aller Einzelwerte der vorausgesetzten Normalverteilung mit dem Erwartungswert µ und der Standardabweichung σ liegen. Die Produktion liefert Produkte an denen nach einer zufälligen Auswahl die Werte Yi, i = 1, …, N gemessen werden, wobei N den Stichprobenumfang bezeichnet. Es ist nun zu prüfen, ob die Stichprobe mit den spezifizierten Kundenanforderungen in Form des Sollwertes und der Toleranzgrenzen übereinstimmt. Hierfür können statistische Hypothesentests verwendet werden. • Die Nullhypothese H0: σ2 = σ2zul gegen die Alternative H1: σ2 ≠ σ2zul kann mit dem F-Test σ2 (To − Tu )2 Fˆ = zul = σ2 36 ⋅ S 2 • und die Hypothese H0: µ = M gegen H1: µ ≠ M kann mit dem Abweichungstest zˆ = Y −M σ zul N − 1. geprüft werden. Die beiden Tests wurden formalisiert, so dass wir Ausdrücke für die univariaten Prozessfähigkeitsindizes erhalten. Wie können Sie die univariate Prozessfähigkeitsindizes für eine Produktvariable berechnen? Eine Produktvariable wird mit Y bezeichnet, deren Verhalten durch die Verteilungsfunktion (Vf)Y ~ P(Y ≤ y) = F(y) oder falls sie existiert durch die Verteilungsdichte (Vd) f(y) charakterisiert wird. Durch die Prozessfähigkeiten wird beurteilt, ob die statistische Breite von f(y) 1316han05.indd 171 25.07.2006 11:39:01 172 5 Qualität in der Fertigung vollständig oder nur z. T. innerhalb des Toleranzintervalls liegt. Die statistische Breite wird nach der 3 σ-Regel berechnet. Bevor wir eine Formel für den Vergleich zwischen der Toleranzbreite und Breite der Verteilungsdichte angeben, sollen noch einige wichtige Begriffe erläutert und präzisiert werden. Häufig wird der Ausdruck, „der Prozess wird beherrscht“ verwendet und durch die Zeitinvarianz der Verteilung erklärt, wobei darauf hingewiesen wird, dass die zeitlichen Veränderungen eine Verschiebung der Verteilung auf der Achse der Produktvariablen, eine Änderung der Streuung oder eine Änderung der Form der Verteilung sein kann, siehe z. B. Rinne, Mittag [1999]). An dieser Stelle muss darauf hingewiesen werden, dass der Prozess zur Herstellung eines Produktes durch die Häufigkeitsverteilung einer Produktvariablen beurteilt werden soll. Das ist nur bedingt möglich. Die Beherrschbarkeit eines Prozesses wird durch die folgende Definition präzisiert. Definition: Die Aufschlüsselung der Varianz der Produktvariablen Y durch die in der Prozessgleichung vorkommenden Input- und Prozessvariablen wird durch das Maß der Beherrschbarkeit gemessen. Diese Definition ist notwendig, denn die Produktvariable Y ist Ergebnis des Wirkens eines Prozesses, die Produktvariable ist eine Zufallsgröße und die Verteilung der Produktvariablen kann nur nach dem Ursache-Wirkungs-Prinzip über die Veränderung der Input- und Prozessvariablen verändert werden. Ein beherrschter Prozess bedeutet, dass er so gesteuert werden muss, dass alle spezifizierten Kundenanforderungen an das Produkt simultan erfüllt werden, d. h. der Vektor der Mittelwerte der gemessenen Werte für die Produktvariablen Y1, …, Ym muss im statistischen Sinne mit dem Vektor der Sollwerte M1, …, Mm übereinstimmen, die Variabilität des Vektors der Produktvariablen muss so klein sein, dass die Verteilung innerhalb des Toleranzbereiches liegt und die Verteilung muss zeitlich stabil bleiben, d. h. die Mittelwertvektoren und die Stichprobenkovarianzmatrizen zeitlich aufeinanderfolgender Stichproben dürfen keinen Trend besitzen. Für die Überprüfung der statistischen Beherrschbarkeit eines Prozesses müssen wir die Maße der Beherrschbarkeit und die uni- und multivariaten Prozessfähigkeitsindizes berechnen. Die uni- und multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten Potential eines Prozesses, Produkte mit den durch die Toleranzgrenzen für alle relevanten Produktvariablen vorgegebenen Eigenschaften zu produzieren, werden als Entscheidungskriterium für die Notwendigkeit der Prozessverbesserung im Sinne der Reduktion der Variabilität der Produktvariablen und damit der Vergrößerung des Maßes der Beherrschbarkeit verwendet. Die Maße der Beherrschbarkeit dienen ebenfalls für die Entscheidung zur Prozessverbesserung im Sinne der Suche nach weiteren Input- und Prozessvariablen, die die Variabilität der Produktvariablen besser erklären. Bei der Festlegung der CAD Toleranzgrenzen unterscheiden wir die Möglichkeiten, die in der Abbildung dargestellt sind. • Einseitige Tolerierung, d. h. es gibt nur eine obere To oder untere Tu Toleranzgrenze. • Auf die Angabe des Sollwertes wird in diesen Fällen häufig verzichtet. Wir müssen prüfen, ob das sinnvoll ist, denn der Sollwert wird als Zielwert für die Steuerung des Prozesses benötigt. • Zweiseitige Tolerierung. Hier müssen wir zwischen dem symmetrischen und unsymmetrischen Fall unterscheiden. 1316han05.indd 172 25.07.2006 11:39:01 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 173 Fall 1 Fall 2 Fall 3 Tu Sollwert To Produktvariable Y Abb. 5.2.2: Toleranzintervalle Die Toleranz wird nun wie folgt definiert: bei Vorgabe von To ⎧To − Sollwert, ⎪Sollwert − T , bei Vorgabe von Tu u ⎪ ⎪ To − Tu bei Vorgabe von To und Tu Δ=⎨ , ⎪ 2 ⎪min{(Soll − Tu ),(To − Soll)}, bei gegebenen Tu und To und ⎪ asymmetrischer Tolerierung ⎩ Für den Toleranzbereich schreiben wir in der Regel [To, Tu] = To – Tu = 2 Δ. Im symmetrischen Fall gilt Sollwert = To + Tu = Toleranzmittelwert. 2 Zweiseitige Toleranzgrenzen – die Produktvariable ist normal verteilt Der Sollzustand für die Produktvariable Y wird durch • den Sollwert M und die • Toleranzgrenzen – Tu untere Toleranzgrenze – To obere Toleranzgrenze definiert. Der Prozess sei optimal eingestellt. An zufällig ausgewählten Produkten wird die normal verteilte Produktvariable Y gemessen. Die Messwerte sind Y1, …, YN, wobei N der Stichprobenumfang ist. Visuell kann der Istzustand mit dem Sollzustand verglichen werden, indem man schaut, ob die Häufigkeitsverteilung der Messwerte, wie die Durchmesser der gedrehten Welle in der Abbildung 5.2.3, innerhalb der eingezeichneten Toleranzgrenzen liegt und der Mittelwert der Wellendurchmesser im statistischen Sinne mit dem Sollwert übereinstimmt. Bei der Welle in 1316han05.indd 173 25.07.2006 11:39:01 174 5 Qualität in der Fertigung Häufigkeiten Tu To Sollwert 50 40 -3s 30 +3s 20 10 0 19.8 19.9 20 20.1 20.2 Wellendurchmesser [mm] Abb. 5.2.3: Häufigkeitsverteilung der Durchmesser einer Welle Abbildung 5.2.3 liegt die ±3 S Breite der Häufigkeitsverteilung vollständig im Toleranzintervall. Die univariate Prozessfähigkeit als Quotient der Toleranzbreite zur Breite der Häufigkeitsverteilung muss größer als 1 sein. Es wird kein Ausschuss produziert. Der Sprachgebrauch „im statistischen Sinn“ soll jeweils deutlich machen, dass wir es mit stochastischen Sachverhalten zu tun haben. Hieraus folgt, dass alle Aussagen mit einer Unschärfe versehen sind, die der Streuung von Variablen adäquat sind. Der zahlenmäßige Vergleich zwischen dem Soll- und Istzustand basiert auf einem Charakterisierungssatz, nach dem eine Normalverteilung vollständig durch den Mittelwert y und die Standardabweichung s beschrieben wird. Die Schätzfunktionen y für den Erwartungswert und s2 für die Varianz sind unabhängig voneinander. Nach der 3 σ-Regel erhält man mit der Irrtumswahrscheinlichkeit α = 0.0027 die Breite der Häufigkeitsverteilung y + 3 ⋅ s − [ y − 3 ⋅ s] = 6 ⋅ s . Die einfache Prozessfähigkeit Cp (siehe Bhote [1990], Omnias [1992], Rinne, Mittag [1999]) vergleicht die Sollbreite (To – Tu) mit der Breite 6 · s der Häufigkeitsverteilung: Cp = Toleranzbreite was der Kunde fordert To − Tu = = Breite der Häufigkeitsverteilung was der Kunde erhält 6⋅s (1) Wenn Cp < 1, dann ist die Breite der Häufigkeitsverteilung größer als die Toleranzbreite. Produkte mit Werten für den Produktvariable, die nicht den Anforderungen genügen sind die Folge. Wenn Cp > 1, dann ist die Breite der Häufigkeitsverteilung kleiner als die Toleranzbreite, d. h. die Häufigkeitsverteilung passt vollständig in das Toleranzintervall. Aber trotzdem kann Ausschuss produziert werden. Das liegt daran, dass bisher nur das Streuverhalten des Produktes mit der Toleranzbreite verglichen wurde. Nach dem Charakterisierungssatz muss in diesen Vergleich die Abweichung zwischen dem Soll- und Mittelwert einbezogen werden. Hierzu muss der Korrekturfaktor 1316han05.indd 174 25.07.2006 11:39:02 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? k= y−M 1 ⋅ (To − Tu ) 2 175 (2) berechnet werden, mit dem Cp zu Cpk = (1 – k) Cp (3) korrigiert wird. Diese Darstellung setzt voraus, dass der Sollwert in der Mitte des Toleranzintervalls liegt und bewertet die Abweichungen vom Sollwert. Ist Cpk < 1, dann wird Ausschuss produziert, der Prozess muss verbessert werden, siehe Juran [1990]. Ist Cpk > 1, dann genügen die Produkte der durch den Sollwert und die Toleranzgrenzen spezifizierten Anforderung. Welche Entscheidungen aufgrund der univariaten Prozessfähigkeitsindizes können Sie treffen? Die besprochenen möglichen Entscheidungen aufgrund der Prozessfähigkeiten werden durch die Abbildung 5.2.4 visualisiert. Damit kann man sagen, die Fähigkeit beschreibt das inhärente Potential eines Prozesses, Produkte oder Dienstleistungen zu produzieren, die spezifizierten Anforderungen genügen. Daten Tu M T o T u M T o T u M T Cp ≤ 1 Cp > 1 Cp > 1 Cpk ≤1 Cpk < 1 Cpk > 1 Prozessverbesserung oder Überprüfung der Tolerierung Reduktion der Streuung o SPC Justierung Abb. 5.2.4: Entscheidungen aufgrund der Prozessfähigkeiten Beispiel 5.2.3: Wellendurchmesser. Univariate Prozessfähigkeit Eine zu drehende Welle soll den Solldurchmesser M = 12.5 [mm] und die Toleranzen Tu = 12.35 [mm] und To = 12.65 [mm] haben. Eine Stichprobe von N = 130 Wellen ergab die statistischen Maßzahlen Y = 12,499 [mm] und s = 0,05012 [mm]. 1316han05.indd 175 25.07.2006 11:39:02 176 5 Qualität in der Fertigung Setzt man diese Größe in die Formeln für die Prozessfähigkeitsindizes ein, dann erhält man Cp = 1,00, k = –0,01 und Cpk = 0,99. Die Häufigkeitsverteilung liegt vollständig im Toleranzintervall, darf aber nicht hin- und herbewegen. Nach der Abbildung 5.2.4 muss der Prozess verbessert werden, um zu garantieren, dass kein Ausschuss produziert wird. Bemerkung zu den univariaten Prozessfähigkeitsindizes Die univariaten Prozessfähigkeitsindizes besitzen die äquivalente Darstellung Cp = To − Tu 6S und ⎧ T − Y Y − Tu ⎫ Cpk = Min ⎨ o , ⎬ = Min {Clo , Cpu }, 3S ⎭ ⎩ 3S wobei Cpo die Prozessfähigkeit für die obere und Cpu für die untere einseitige Toleranzgrenze bezeichnen. Diese Darstellung bewertet eindeutig die Abweichungen von den Toleranzgrenzen und ist insbesondere dann zu empfehlen, wenn die Streuung der Produktvariablen sehr groß ist, oder die Verteilung der Werte der Produktvariablen nahe bei einer Toleranzgrenze liegt. Sind Rückschlüsse von den Fähigkeiten auf den Ausschussanteil möglich? Bei der Antwort auf diese Frage sind einige Aspekte zu beachten. Prozessfähigkeiten und Verlustfunktion Die ökonomischen Kennzahlen werden über die Verlustfunktion bewertet, wobei der ökonomische Verlust einer produzierten Einheit durch den Abstand seines Wertes für die Produktvariablen vom Sollwert entsteht. Der erwartete Verlust ist dann im Grunde genommen eine Kennzahl für die Fähigkeit. Erste Hinweise auf diese Problematik finden sich bereits bei den British Standards 2564 aus dem Jahre 1955 und bei Juran [1974] in seinem Quality Control Handbook. L(y) 1 Tu Sollwert To Y Abb. 5.2.5: Verlustfunktion 1316han05.indd 176 25.07.2006 11:39:02 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 177 Um diese Zusammenhänge zu verdeutlichen, betrachten wir zunächst einmal den Ausschussanteil p. Zu p gehört die binäre Verlustfunktion ⎧0, für Y ∈ [To − Tu ] L( y ) = ⎨ ⎩1, für Y ∉ [To − Tu ] Diese Verlustfunktion ist ein Sprungfunktion. Das zeigt die Abbildung 5.2.5. Besitzt Y die Vd f(y) und die Vf F(y), dann erhält man den erwarteten Verlust ∞ E [L(Y )] = ∫ L( y) ⋅ f ( y) dy −∞ = ∫ 0 ⋅ f ( y ) dy + y ∈TB ∫ 1 ⋅ f ( y ) dy y ∉TB = P (Y ∉ TB) =: p wobei [To – Tu] =: TB. Für die zweiseitige Betrachtung erhält man p = 1 – P(Tu ≤ Y ≤ To) = 1 – F(To) + F(Tu) = po + pu. Für die einseitige Betrachtung erhält man p = P(Y > To) = 1 – F(To) bzw. p = P(Y < Tu) = F(Tu). Diese Betrachtung über die traditionelle Verlustfunktion hat wesentliche Nachteile. Zum einen drückt sie nur den Verlust des Produzenten aus, obwohl der Konsument natürlich ebenfalls durch die nicht zielwertkonformen Produkte Verluste erleidet. Zum anderen ist der Verlauf dieser Verlustfunktion in keiner Weise plausibel. Betrachten wir z. B. ein Produkt, dessen Wert für die Produktvariable in unmittelbarer Nähe der oberen oder unteren Toleranzgrenze, aber noch innerhalb des Toleranzintervalls liegt, so wird der Verlust mit 0 bewertet. Für einen anderen Wert, der sich vom vorangegangenen nur ganz wenig unterscheidet, aber außerhalb des Toleranzbereiches liegt, wird der Verlust 1 angenommen. Taguchi hat diesen Missstand durch die Einführung der quadratischen Verlustfunktion korrigiert. Danach ist ein Produkt umso besser, je näher der Wert seines Produktvariables am Sollwert liegt. Je größer die Differenz zwischen Soll- und Istwert ist, desto größer ist der Verlust über die gesamte Lebenszeit des Produktes. Für die zweiseitige Tolerierung lautet die Taguchi-Verlustfunktion LT (y) = c (y – MY)2, wobei MY der Sollwert für die Produktvariable Y und c ein Proportionalitätsfaktor sind. Analog kann man die Verlustfunktion für einseitige Tolerierung aufschreiben. 1316han05.indd 177 25.07.2006 11:39:02 178 5 Qualität in der Fertigung Für den Erwartungswert der Verlustfunktion – das Risiko – erhält man mit der Vd f(y) ∞ E [L( y )] = ∫ ∞ c ⋅ ( y − M y )2 ⋅ f ( y ) dy = c ⋅ −∞ ∫ [( y − μ y ) + (μY − M Y )]2 f ( y ) dy −∞ ∞ ∞ ∞ ⎪⎧ ⎪⎫ = c ⋅ ⎨ ∫ ( y − μY )2 f ( y ) dy + 2 ⋅(μY − M Y )⋅ ∫ ( y − μY )⋅ f ( y ) dy + (μY − M Y )2 ⋅ ∫ f ( y ) dy ⎬ ⎪⎩ −∞ ⎪⎭ −∞ −∞ = c ⋅ {σ 2 + (μY − M Y )2 } Das ist der bekannte mittlere quadratische Fehler (engl. mean square error), der z. B. für die Güte einer Schätzfunktion verwendet wird. Der Term (µY – MY)2 ist der quadratische Bias. Damit werden die zwei Hauptaufgaben aus der Abbildung zur Entscheidung mit den Prozessfähigkeiten noch einmal verdeutlicht. Der Bias gibt die Abweichung des Mittelwertes vom Sollwert an. Ist ein Bias vorhanden, dann muss der Prozess neu zentriert werden, sodass diese Abweichung null wird. Ist die Streuung so groß, dass die „Schwänze“ der Verteilung über die Toleranzgrenzen hinausragen, dann muss der Prozess so verbessert werden, dass die Streuung kleiner wird. Prozessfähigkeit nach Taguchi auf der Grundlage der Verlustfunktion Nach Rammelmüller [1993] und Taam [1993] können die univariaten Prozessfähigkeitsindizes auch wie folgt geschrieben werden Cpm = To − Tu 6 S 2 + (Y − M )2 = To − Tu 6S 1 M )2 ⎤ 2 ⎡ (Y − ⎢1 + S2 ⎣ = Cp D ⎥ ⎦ wobei 1 ⎡ (Y − M )2 ⎤ 2 D = ⎢1 + ⎥ S2 ⎣ ⎦ die Abweichung des Mittelwertes der Werte für die Produktvariable vom Sollwert M misst. Beispiel 5.2.4: Wellendurchmesser. Prozessfähigkeit nach Taguchi Verwenden Sie die Angaben für den Soll- und Istzustand von oben und setzen diese Werte in die Formeln für die Taguchi Fähigkeiten ein, dann erhalten Sie die Werte D = 1.000199 und Cpm = 0,9998. Diese Werte stimmen mit den Werten von oben überein. Damit ist auch die zu fällende Entscheidung dieselbe. Welche Schlüsse können Sie aus den verschiedenen univariaten Prozessfähigkeitsindizes für die praktische Anwendung ziehen? Cp beschreibt das Verhältnis von Spezifikationsbreite zur Breite der Verteilung der Messwerte für die Produktvariable. Je größer Cp wird, desto weniger streuen die Werte für die Produktvariable. Bei Cp = 1 stimmt die 6 s Breite der Häufigkeitsverteilung mit der Toleranzbreite überein. 1316han05.indd 178 25.07.2006 11:39:02 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 179 Cpk wächst für jedes konstante σ linear mit der Annäherung des Mittelwertes Y an den Sollwert. Das heißt aber, ein Mittelwert Y nahe beim Sollwert wird genauso bewertet wie ein Mittelwert nahe einer der Toleranzgrenzen. Daraus folgt für die Anwendung, dass ein großer Cpk-Wert mitunter zu wenig über die Zentriertheit des Prozesses aussagt. Cpm beinhaltet sowohl die Streuung der Produktvariablen, wie auch die Zentriertheit (Y − M ) der Verteilung der Produktvariablen auf den Sollwert. Cpm = 1 besagt, dass Y innerhalb der mittleren Drittels von (To – Tu) liegt. Hieraus folgt, der Index Cpk sollte durch Cpm ersetzt werden. Das ist ein positiver Beitrag zur Diskussion, welcher Philosophie bei der Kontrolle von Prozessen zu folgen ist, • dem Nachweis der Erfüllung der spezifizierten Kundenanforderungen oder • der Erfüllung gewisser statistischer Gesetzmäßigkeiten. Im Kapitel 6 wird diese Diskussion noch einmal aufgegriffen. Prozessfähigkeit und Ausfallrate Wir betrachten nur die univariate Produktvariable Y mit dem Sollzustand M = Sollwert und der unteren Tu und oberen To Toleranzgrenze. [To – Tu] ist das Toleranzintervall. Falls der Wert Yi eines Produktes für die Produktvariable Y innerhalb des Toleranzintervalls liegt, d. h. falls Yi ∈ [To – Tu], dann sagen wir das Produkt ist konform zur Spezifikation. Wenn Yi ∉ [To – Tu], dann sagen wir, das Produkt ist nicht konform zur Spezifikation. Die Wahrscheinlichkeit dafür, dass ein Messwert Yi, i = 1, …, N von Y außerhalb der Toleranzgrenzen liegt, ist p = 1 – F(To) + F(Tu). Die Fähigkeit des Prozesses ist eine Funktion der Ausfallrate, d. h. p = P (Y ∈ [To − Tu ]) = 1 − ∫ f ( y ) dy . [To −Tu ] Prozesse mit kleinem p werden fähig genannt. Wie klein p sein muss, um einen Prozess als fähig zu charakterisieren ist das Anliegen des Qualitätsverantwortlichen des Unternehmens. In der Praxis hat sich die Forderung p < 0.0027 für fähige Prozess bewährt. Es muss aber darauf verwiesen werden, dass eine solche Forderung von den Herstellungskosten abhängig ist und daher nur akademischen Charakter hat. Setzen wir noch voraus, dass Y ~ N (µ, σ2) gilt, dann erhalten wir für das einseitig nach oben begrenzten Toleranzintervall ∞ po = P (Y > To ) = 2 ⎪⎧ ( y − μ) ⎪⎫ exp − ⎨ ⎬ dy . ∫ 2 σ 2 ⎭⎪ ⎩⎪ To σ 2 π 1 Hierfür können wir nach der Standardisierung der Zufallsgröße Y und deren Toleranzgrenzen auch schreiben T − μ⎞ ⎛ po = P ⎜ Z > o ⎟= ⎝ σ ⎠ ∞ ⎛ To − μ ⎞ ⎛ μ − To ⎞ ⎟ = Φ ⎜⎝ ⎟. ω ⎠ σ ⎠ ∫ Φ(z) dz = 1 − Φ ⎜⎝ T −μ o σ 1316han05.indd 179 25.07.2006 11:39:03 180 5 Qualität in der Fertigung Hieraus folgt, po = 1 – Φ (3 Cpo) = Φ (–3 Cpo). Ein analoger Ausdruck ist der Ausschussanteil bei dem einseitig unten begrenzten Toleranzintervall. Das p ist nun leider unbekannt. Daher betrachten wir für eine Stichprobe die Schätzung 1 Fˆ ( y ) = N N ∑ I (Yi < y) i =1 für unbekannte Verteilungsfunktion F, wobei I (Yi < y) die Indikatorfunktion ⎧1, falls Yi < y I (Yi < y ) = ⎨ ⎩0, falls Yi ≥ y bezeichnet. Damit erhalten wir 1 pˆ = 1 − Fˆ (To ) + Fˆ (Tu ) = 1 − N N ∑ I (Tu i =1 ≤ Yi ≤ To ) und die Schätzungen ⎛T − Y ⎞ ⎛ Y − Tu ⎞ p = 1 − Φ ⎜ o +Φ⎜ ⎟ ⎝ s ⎠ ⎝ s ⎟⎠ bzw. ⎛T − Y ⎞ ⎛T − Y ⎞ , p To = Φ ⎜ o p Tu = Φ ⎜ u ⎝ s ⎟⎠ ⎝ s ⎟⎠ und p = p Tu + p To . Damit können wir für den Prozessfähigkeitsindex schreiben ⎛ Y − Tu Cpk = min ⎜ ⎝ s ⎞ ⎛ To − Y ⎞ 1 −1 −1 ⎟⎠ , ⎜⎝ s ⎟⎠ = 3 min {−Φ ( p Tu ), Φ ( p To )} . Beispiel 5.2.5: Fähigkeiten und Ausfallrate Y ~ N(0, σ2). Der Sollzustand für diese Produktvariable ist Sollwert M = 0, Tu = –0,3 To = 0,3. Da s und p unbekannt sind, ziehen wir eine Stichprobe vom Umfang N = 113. Mit den Werten dieser Stichprobe berechnen wir den Mittelwert = 0,00968 und die Standardabweichung s = 0,20509. Damit berechnen wir die statistischen 3 s-Grenzen [–0,605596, 0,624958]. Die univariaten Prozessfähigkeitsindizes sind Cp = 0,49, k = 0,03 und Cpk = 0,47. 1316han05.indd 180 25.07.2006 11:39:03 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 181 Damit gilt To − Y 0,3 − 0,00968 = = 1,415 s 0,20509 und Y − Tu 0,00968 − (−0,3) = = 1,51 s 0,20509 Aus einer Tafel mit den Werten der standardisierten Normalverteilung erhalten wir für diese beiden Zahlen die Werte F(1,42) = 1 – 0,92219 = 0,0778 und F(1,51) = 1 – 0,934478 = 0,0655. Oberhalb der oberen Toleranzgrenze To liegen 7,78 % aller Einzelwerte und unterhalb der unteren Toleranzgrenze liegen 6,55 % der Werte. Zusammenfassend können sagen, bei der univariaten Prozessfähigkeit Cpk = 0,47 liegen ca. 14,3 % aller Werte außerhalb der Toleranzen. Bei einer Prozessfähigkeit Cpk = 0,8 lägen nur noch ca. 1,4 % außerhalb der Toleranzgrenzen. Hieraus lesen wir ab, dass die Vergrößerung der Prozessfähigkeit um ca. 58 % eine Verringerung des Ausschusses von ca. 90 % zur Folge hat. Beispiel 5.2.6: Wellendurchmesser. Ausfallrate Die Prozessfähigkeit Cp = 1 zeigt, dass kein Messwert für die gefertigten Wellen außerhalb des Toleranzintervalls liegt, d. h. die Anteil der Messwert oberhalb der oberen Toleranzgrenze ist null und der Anteil der Messwerte unterhalb von Tu ist ebenfalls null. Wenn wir allerdings diese Anteile nach obiger Formel schätzen, dann erhalten wir die Werte: • geschätzter Anteil oberhalb der oberen Toleranzgrenze ist 1296 [ppm] • geschätzter Anteil unterhalb der unteren Toleranzgrenze ist 1472 [ppm] Zusammen ergibt das einen Anteil außerhalb des Toleranzintervalls von 2768 [ppm]. Voraussetzungen für die Durchführung von Fähigkeitsnachweisen Wie jedes mathematische oder mathematisch statistisches Verfahren ist die Durchführung von Prozessfähigkeitsnachweisen an Voraussetzungen geknüpft. Diese betreffen • • • • • die Fähigkeit des Mitarbeiters, die Fähigkeit des Messprozesses, die Fähigkeit der Prozesse, Maschinen und Anlagen, Verteilung der Produktvariablen, die Prozessbeherrschung. 1316han05.indd 181 25.07.2006 11:39:03 182 5 Qualität in der Fertigung Wenn Sie die Fähigkeit des Messprozesses oder der Maschinen untersuchen wollen, verweise ich Sie auf das Buch von Rinne, Mittag [1999]. Dort werden diese Verfahren sehr ausführlich beschrieben. Wenn Sie Hypothesen über die zugrunde liegende Verteilung der Produktvariablen Y prüfen wollen, verweise ich Sie auf die einschlägigen Bücher über die univariate Statistik von Schwarze [1997], Lehnen, Wegmann [1985], Rinne, Mittag [1999] u. a. In der Literatur, so z. B. auch bei Rinne und Mittag, wird auf die Bedeutung der Stabilität der „Verhältnisse in der Produktion“ hingewiesen und erklärt, dass damit die zeitliche Konstanz der Verteilung der Produktvariablen gemeint ist. Braucht man die Stabilität für die Interpretation der Prozessfähigkeitsindizes? Ich meine nicht, denn die Stabilitätsanforderung müsste vor der Fähigkeitsanalyse überprüft werden. Erst nachdem nachgewiesen wurde, dass ein Prozess fähig ist, sollten Regelkarten eingeführt werden. Andererseits wird behauptet, die Stabilität mit Regelkarten nachzuweisen. Das sieht aus, wie eine Katze, die sich in den Schwanz beißt. Die Toleranzgrenzen liegen fest. Jedes Produkt, dessen Wert für die Produktvariable außerhalb des Toleranzintervalls liegt, ist Ausschuss. Der Grund, warum das Produkt Ausschuss ist, ist zwar interessant, aber erst bei der Ursachenforschung und nicht bei der Definition der Fähigkeiten. Der Begriff Stabilität sorgt immer wieder für Irritationen, so z. B. in den Arbeiten von Stark [1999] und Kaiser, Nowack [1999]. In diesen Arbeiten will man neue Gesichtspunkte für die univariaten Fähigkeitsberechnungen und Kontrollkartentechniken ableiten, lässt aber die spezifizierten Kundenanforderungen außer acht und bezieht nur statistische Aspekte ein. Das ist nicht zulässig. Können wir auch univariate Prozessfähigkeitsindizes berechnen, wenn die Produktvariable nicht normal verteilt ist? Ja. Wir betrachten als Benchmark den Fall, die Produktvariable Y ist binomial verteilt. Die Produktvariable Y kann nur zwei verschiedene Werte annehmen, z. B. ⎧0, wenn das Produkt n. i. O. Y =⎨ ⎩1, wenn das Produkt i. O. wie z. B. bei der Wareneingangsprüfung. Die Wahrscheinlichkeiten für diese beiden Fälle seien P(Y = 0) = p und P(Y = 1) = 1 – p. Die Ausschusswahrscheinlichkeit p ist unbekannt und wird mit einer Stichprobe von N Werten, die ja nur 0 oder 1 sein können, bestimmt. Die Wahrscheinlichkeit dafür, dass in der Stichprobe vom Umfang N k Produkte defekt sind, ist durch die folgende Formel gegeben, ⎛N ⎞ ⎛N ⎞ P ⎜ ∑ yi = k ⎟ = ⎜ ⎟ pk ⋅ (1 − p)N − k ⎝ i =1 ⎠ ⎝k⎠ wobei k zwischen 0 und N liegt. 1316han05.indd 182 25.07.2006 11:39:03 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 183 Die Häufigkeiten für die verschiedenen k, d. h. für k = 0, k = 1, … werden durch die Häufigkeitsverteilung visualisiert und durch das Einzeichnen des Sollwertes p und der Toleranzgrenzen pu und po mit dem Sollzustand verglichen. Die Binomialverteilung wird ebenfalls vollständig durch den Mittelwert Y = pˆ und die Standardabweichung s = pˆ (1 − pˆ ) N charakterisiert. Damit können die obigen Formeln 1, 2 und 3 zur Berechnung der Prozessfähigkeitsindizes verwendet werden. Man erhält Cp = pˆ − p po − pu , k= und Cpk = (1 − k) ⋅ Cp . 1 6⋅s ( po − pu ) 2 Wir betrachten noch den etwas selteneren Fall, die Produktvariable Y ist nach Poisson verteilt. Bei dieser Verteilung sind Mittelwert und Standardabweichung gleich, d. h. es gilt Y = λ und s = λ . Hiermit sind wiederum die Formeln 1, 2 und 3 von oben anwendbar. Müssen Sie etwas über die Verteilungen der Prozessfähigkeitsindizes wissen? Ja, denn die univariaten Prozessfähigkeitsindizes sind Zufallsgrößen. Das wird deutlich, wenn Sie beachten, dass diese von Y und s abhängen. Y und s sind aber Zufallsgrößen, denn diese hängen wiederum nur von den Stichprobenwerten Y1, …, YN ab. Aus der Verteilung der Prozessfähigkeitsindizes können Sie die Konfidenzintervalle für die Indizes berechnen. Wozu benötigen Sie die Konfidenzintervalle für die Prozessfähigkeitsindizes? Die Prozessfähigkeitsindizes sind Zufallsgrößen. Sie schwanken von Stichprobe zu Stichprobe, obwohl die Produktionsbedingungen gleich sind. Ist die ursprüngliche Streuung groß, so kann das zu Fehlentscheidungen führen. Daher wollen wir Ihnen mit den Konfidenzintervallen ein Instrument in die Hand geben, um die Unsicherheit zu quantifizieren. Für die Ableitung der Konfidenzintervalle benötigen wir die Verteilung der Indizes. Um diese berechnen zu können, fasse ich die bisherigen Ergebnisse zusammen. Unter der Voraussetzung Y ∼ N (μ, σ2) gilt ⎛ σ2 ⎞ 1. Y ∼ N ⎜ μ, ⎟ , wobei N der Stichprobenumfang ist ⎝ N⎠ 2. (N − 1) ⋅ s 2 σ2 ∼ χ2 , falls Y1, …, YN unabhängig nach N (0, 1) verteilt sind 3. Y und s2 sind unabhängig voneinander verteilt und 1316han05.indd 183 25.07.2006 11:39:04 184 5 Qualität in der Fertigung Y −μ σ 4. ⋅ N = (N − 1) ⋅ s (N − 1) ⋅ σ2 2 Y −μ s ⋅ N ∼ t N −1 5. Konfidenzintervall für σ2 ist durch (N − 1) ⋅ s 2 χ2 1− ≤ σ2 ≤ (N − 1) ⋅ s 2 χ2α α 2 2 gegeben. Daraus folgt (N − 1) ⋅ s 2 χ2R ≤ σ2 ≤ (N − 1) ⋅ s 2 χ2L , wobei R den rechten Schwanz und L den linken Schwanz der χ2-Verteilung bezeichnen. Beweise: siehe z. B. Schmetterer [1956, S 131]. In Cp = To − Tu 6⋅s sind To und Tu fest. Nur s ist eine Zufallsgröße. Damit erhält man für Cp das Konfidenzintervall: Cp ≤ κ p ≤ Cp mit Cp = Cp ⋅ 1 1 und Cp = Cp ⋅ bu bo wobei bo,α = N −1 χ2 N −1,1− bu,α = N −1 χ2 N −1, κp = α 2 α 2 To − Tu 6⋅σ In ähnlicher Weise kann man ein Konfidenzintervall für Cpk berechnen. Ausgangspunkt ist die Darstellung von Cpk in der Form 1316han05.indd 184 25.07.2006 11:39:04 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? Cpk 185 1 ⋅ (To − Tu ) − Y − M ⎧ To − Y Y − Tu ⎫ 2 = Min ⎨ , = . ⎬ 3⋅s ⎭ 3⋅s ⎩ 3⋅s Die Konfidenzintervalle für µ und σ2 sind: s ⋅t Y − N −1, s ⋅t α 2 ≤μ≤Y + N N −1, α 2 N und (N − 1) ⋅ s 2 (N − 1) ⋅ s 2 ≤ σ2 ≤ χ χ α α N −1,1− N −1, 2 2 Indem man die Konfidenzintervalle für µ und σ2 in die Formel für Cpk einsetzt, erhält man das Konfidenzintervall für Cpk mit der unteren Intervallgrenze Cpk t 1 ⋅ (To − Tu ) − Y − 2 Cpk = 3⋅s⋅ N −1, N N −1 χ2 α N −1, α 2 ⋅s −M . 2 Zur Abkürzung setzen wir t aα := bo.α = N −1, α 2 N , N −1 χ2 N −1,1− α 2 und bu,α = N −1 χ2 N −1, α 2 Damit erhält man Cpk 1 1 ⋅ (To − Tu ) − Y − M − aα ⋅ s ⋅ (To − Tu ) − Y − M aα 2 = = 2 − 3 ⋅ s ⋅ bu,α 3 ⋅ s ⋅ bu,α 3 ⋅ bu,α = Cpk ⋅ 1316han05.indd 185 1 bu,α − 3 ⋅ Cpk − aα aα . = 3 ⋅ bu,α 3 ⋅ bu,α 25.07.2006 11:39:04 186 5 Qualität in der Fertigung Analog erhält man für die obere Intervallgrenze Cpk Cpk = 3 ⋅ Cpk + aα 3 ⋅ bo,α so dass 3 ⋅ Cpk + aα ⎞ ⎛ 3 ⋅ Cpk − aα P⎜ ≤ κ pk ≤ = 1 − α. 3 ⋅ bo,ε ⎟⎠ ⎝ 3 ⋅ bu,ε Beispiel 5.2.7: Akkubohrschrauber. Konfidenzintervalle für Cp und Cpk Die Sollvorgaben für die Produktvariable Y2 Produktvariable sind M2 = 0 [mm] Tu,3 = –0.3 [mm] To,3 = 0.3 [mm] Aus der Stichprobe von N = 113 vermessenen Gehäusen erhält man die statistischen Maßzahlen für den Istzustand Y2 = 0.0099 [mm] s2 = 0.204 [mm] Damit erhält man Cp = k= 0.6 = 0.49 6 ⋅ 0.204 0.0099 = 0.033 0.3 Cpk = 0.474. Die Konfidenzintervalle zu Cp und Cpk sollen für die Irrtumswahrscheinlichkeit α = 0.05 bestimmt werden. Dazu muss man die Koeffizienten aα und bo,α und bu,α berechnen. t aα = α 2 N −1, N = 1.9814 113 = 0.18639 mit t112,0.025 = 1.9814 und bo,α = N −1 χ 2 N −1,1− = α 2 112 = 0.92998 129.5 und bu,α = 1316han05.indd 186 N −1 χ 2 N −1, α 2 = 112 = 1.22842 74.22 25.07.2006 11:39:05 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 187 mit 2 χ112,0.975 = 129.5 2 χ112,0.025 = 74.22 Damit erhält man P (Cp ≤ κ p ≤ Cp ) = 1 − α P (0.3989 ≤ κ p ≤ 0.5268) = 0.95 und P (Cpk ≤ κ pk ≤ Cpk ) = 1 − α P (0.335 ≤ κ pk ≤ 0.577) = 0.995 Die berechneten Prozessfähigkeiten und deren Konfidenzintervalle zeigen, dass der Prozess zur Herstellung der Plastikschalen verbessert werden muss. Zusammenstellung der Eigenschaften des univariaten Prozessfähigkeitsindizes Cp • Der einfache Prozessfähigkeitsindex Cp ist eine streng monoton fallende Funktion von σ. • Die Funktion Cp ist konvex, d. h. dC p dσ =− To − Tu 6⋅σ 2 =− 1 Cp σ Die grafische Darstellung von Cp ist in der Abbildung 5.2.6 enthalten 5 Cp j 0.33333 0.2 sj 3 Abb. 5.2.6: Cp in Abhängigkeit von σ Die Elastizität der Funktion Cp wird nach der Beziehung dC p η (Cp ) = 1316han05.indd 187 Cp = −1 dσ σ 25.07.2006 11:39:05 188 5 Qualität in der Fertigung berechnet. Dieser Ausdruck bedeutet, Cp ist isoelastisch, d. h. eine Vergrößerung von σ um 1 % führt zu einer Verkleinerung von Cp von 1 %. • Die Anforderung an Cp lautet nach Montgomery [1996], S. 446 Cp > 1.33. • Die Aussagen über Cp betreffen die Verbindung zum Gutanteil der Produktion oder zur Ausschussquote. Diese können erst nach der Korrektur mit dem Korrekturfaktor k formuliert werden, da eine Verteilung, insbesondere die Normalverteilung, durch die beiden Momente Mittelwert und Standardabweichung vollständig charakterisiert wird. • Die Schätzfunktion für Cp, hier mit Ĉp bezeichnet, ist T − Tu Cˆ p = o 6⋅s • Die Verteilung von Cp ist unter der Annahme Y ~ N(μ, σ2) eine χ2N – 1 Verteilung mit N – 1 FG. Die Schätzfunktion Ĉp ist asymptotisch erwartungstreu und MSE-konsistent • Das Konfidenzintervall für Cp ist ⎛⎧ ⎜ ⎪⎪ P ⎜ ⎨Cˆ p ⋅ ⎜⎪ ⎜⎝ ⎪ ⎩ χ2 N −1, α 2 N −1 ⎫⎞ ⎪⎪ ⎟ ⎬⎟ = 1 − α N − 1 ⎪⎟ ⎪⎭ ⎟⎠ χ2 ≤ Cp ≤ N −1,1− α 2 • Ein Test zur Prüfung der Hypothese H0: C p ≤ C p0 gegen die Alternative H1: C p > C p0 ist χ2 = Cp0 ⋅ N −1 χ 2 N −1,1− α 2 Die Hypothese H0 bedeutet, der Prozess ist nicht fähig. C p0 bezeichnet die Vorgabe des Unternehmens bzgl. der Prozessfähigkeit, z. B. den Wert cp0 = 1.33 . • Für den Korrekturfaktor k erhält man die Resultate k= μ−M 1 (To − Tu ) 2 k=0 ⇔µ=M k = 1 ⇔ µ = To oder µ = Tu 0 < k < 1 ⇔ µ ∈ {( To, Tu) \ {M}} k > 1 ⇔ µ ∉ [Tu, To] lim k=∞ μ → ±∞ k ist eine lineare Funktion von µ, wie die Abbildung 5.2.7 zeigt. k ist nur von µ abhängig. Die Funktion k ist nicht monoton. K ist linear fallend für µ < M und linear wachsend für µ > M. k ist somit ein dimensionsloses Maß für die Dezentrierung, bzw. 1 – k ist ein Maß für die Zentrierung des Prozesses auf den Sollwert M. 1316han05.indd 188 25.07.2006 11:39:05 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 189 0.8 0.6667 0.6 0.4 ki 0.2 0 -2 -1 0 mi 1 2 Abb. 5.2.7: Darstellung von k Eine Schätzfunktion für k ist kˆ = Y −M 1 (To − Tu ) 2 kˆ ∼ N1 (μ k , σ 2k ), mit μk = μ−M 1 (To − Tu ) 2 und σ 2k = σY2 N (To − Tu ) 2 = σY2 . N ⋅Δ Die Schätzfunktion k̂ ist verzerrt. k wird systematisch zu groß geschätzt. Die Schätzfunktion ist aber asymptotisch erwartungstreu, d. h. der Bias konvergiert mit dem Stichprobenumfang N gegen null. Für die Ableitung eines Tests zur Prüfung von Hypothesen über k muss k̂ etwas umgeformt werden. Es gilt k − μk μk Y −M kˆ =: Z = = σk + . Δ σk σk Der Ausdruck U = k − μk ∼ N (0, 1) σk Für den 2. Ausdruck kann man schreiben 2 2 ⎛μ − M ⎞ ⎛μ ⎞ Δ2 k2 N δ =⎜ k⎟ =⎜ Y = ⎟ ⎝ σk ⎠ σY2 ⎝ σY / N ⎠ 2 Der Ausdruck (U + δ)2 ~ χ2 (1; δ2), d. h. das Quadrat der Summe der beiden Summanden U und δ2 ist nichtzentral χ2 verteilt mit einem Freiheitsgrad und dem Nichtzentralitätsparameter δ2. 1316han05.indd 189 25.07.2006 11:39:06 190 5 Qualität in der Fertigung Mit diesen Darstellungen erhält man das Schwankungsintervall für k̂ σY Δ N ⎛ Δ2 k2 N ⎞ σY ˆ χ2α ⎜ ⎟ ≤k≤ 2 Δ N σ ⎝ ⎠ Y 2 ⎛ Δ2 k2 N ⎞ χ1− 2α ⎜ ⎟. σY2 ⎠ 2 ⎝ Setzt man in den Nichtzentralitätsparameter ein hypothetisches k0 ein, dann kann man das Intervall als Test verwenden. Vorstellung von Cpk: Die Verbindung zwischen Cpk und der Ausschussquote bzw. dem Anteil der guten Produktion (Gutanteil) ist gegeben durch ⎛ T − μY ⎞ ⎛ T − μY ⎞ −Φ⎜ u Q = P({Tu ≤ Y ≤ To }) = Φ ⎜ o ⎟ ⎝ σY ⎠ ⎝ σY ⎟⎠ Löst man Cp nach σ auf, dann erhält man ⎛ ⎛ T − μY ⎞ T − μY ⎞ Q = Φ ⎜ 6 ⋅ Cp o − Φ ⎜ 6 ⋅ Cp u To − Tu ⎟⎠ To − Tu ⎟⎠ ⎝ ⎝ Hieraus kann man zunächst ablesen, dass Cp allein zur Beschreibung der Ausschusses oder alternativ dazu des Gutanteils nicht ausreicht. Die Verwendung von μY = To + Tu T − Tu +κ o , mit κ ∈ R 2 2 liefert Q = Q (Cp , κ) = Φ [3 ⋅ (1 − κ) Cp ] − Φ [−3 ⋅ (1 + κ) Cp ]. Sind k und Cp bekannt, dann ist die zweiseitige Ausschussquote eindeutig durch P = 2 − Φ [3 ⋅ Cp (1 + k)] − Φ [3 ⋅ Cp (1 − k)] d. h. 1+ k⎞ ⎛ P = 2 − Φ (3 Cpk ) + Φ ⎜ 3 Cpk ⎟ ⎝ 1− k⎠ bestimmt. Korrigierter Prozessfähigkeitsindex Cpk Cpk = min (To − μY ; μY − Tu ) Δ − μY − M = = (1 − k) Cp 3 σY 3 σY Cpk soll möglichst groß sein, denn große Cpk garantieren geringe Ausschussquoten. Cpk 1316han05.indd 190 ⎧Cpo ⎪ = ⎨C p ⎪C ⎩ pu für μY < M für μY = M für μY > M 25.07.2006 11:39:06 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? wobei Cpu = 191 μY − Tu T − μY und Cpo = o . 3 ⋅ σY 3 ⋅ σY Die Funktion Cpk = Cpk (µY, σY) besitzt bezüglich der Argumentvariablen die Eigenschaften max C (μ ; σ ) = Cpk (M ; σY ) = Cp μY ∈ R pk Y Y lim μY → ±∞ Cpk (μY ; σY ) − ∞ und bzgl. der Variablen σ ⎧∞ für Tu < μY < To lim ⎪ Cpk (μY ; σY ) = ⎨0 für μY = Tu oder μY = To σ→0 ⎪−∞ für μ < T oder μ > T ⎩ Y u Y o und lim C (μ ; σ ) = 0. σY → ∞ pk Y Y Cpk > η, wenn der Streubereich [μY – 3 η σY; μY + 3 η σY] vollständig im Toleranzbereich [Tu; To] enthalten ist. Hieraus folgt, dass Cpk > 1, wenn [μY – 3 σY; μY + 3 σY] vollständig in [Tu; To] liegt. Die partiellen Ableitungen von Cpk nach µY und σY sind ∂Cpk ∂μ Y ∂Cpk ∂σ Y ⎧ 1 ⎪− 3 σ ⎪ Y =⎨ 1 ⎪ ⎩⎪ 3 σY =− für μY > M für μY < M 1 Cpk . σY Hiermit können die Elastizitäten berechnet werden Es gilt ησ (Cpk ) = ∂Cpk ∂σ Y : Cpk σY = −1 d. h. bzgl. σY ist Cpk eine isoelastische Funktion. ημ (Cpk ) = ∂Cpk ∂μ Y : Cpk μY μY ⎧ ⎪− Δ − μ − M ⎪ Y =⎨ μ Y ⎪+ ⎩⎪ Δ − μY − M ist nicht eindeutig, so dass bzgl. µY keine Aussage über die Elastizität formuliert werden kann. Die Darstellung von Cpk ist in der Abbildung 5.2.8 zu sehen. 1316han05.indd 191 25.07.2006 11:39:07 192 5 Qualität in der Fertigung 4 3 2 40 30 1 20 20 10 10 0 0 Abb. 5.2.8: Darstellung des korrigierten Prozessfähigkeitsindexes Die Schätzfunktion für Cpk ist Cˆ pk = 0.5 (To − Tu ) − Y − M 3 sY = (1 − k) Cˆ p Die Verteilungsdichte für Ĉpk ist recht kompliziert. Diese wurde von Chou, Owen [1989] abgeleitet. Hier soll auf die Wiederholung der Darstellung verzichtet werden, da deren Angabe keinen praktischen Nutzen zeigt. Prozessfähigkeitsindex Cpm nach Taguchi Ausgangspunkt für diese Darstellung ist die Variabilität τ2 von Y bzgl. des Sollwertes M, d. h. die Beziehung E [(Y – M)2] = σ2Y + (µY – M)2 =: τ2, in der σ2Y die Varianz um den Erwartungswert µY und der zweite Term den quadratischen Bias angibt. Da σ ≤ τ mit der Gleichheit nur für µY = M, gilt selbstverständlich Cpm ≤ Cp. Genauer kann man schreiben Cpm = σY / τ Cp. Die grafische Darstellung von Cpm ist in der Abbildung 5.2.9 enthalten. Die beiden Graphen für Cpk und Cpm unterscheiden sich vor allem hinsichtlich der nichtlinearen Abhängigkeit des Indexes Cpm von µY und σY. 1316han05.indd 192 25.07.2006 11:39:07 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 193 2 1.5 40 1 30 20 20 10 0 0.5 0 10 Abb. 5.2.9: Darstellung des Prozessfähigkeitsindexes nach Taguchi 5.2.1.7 Was sind multivariate Prozessfähigkeitsindizes? Problem Ein Prozess wird fähig genannt, wenn er konsequent Produkte produziert, dessen Produktvariablen innerhalb des Spezifikationsbereiches liegen. Ein Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariable Y1, …, Ym beschrieben. Der rechteckige Spezifikations- oder Toleranzbereich ist TB := {Y : Y ∈ R m und Y j ∈ [Tu, j , To, j ] für j = 1, …, m}. Manchmal ist TB durch ein Hyperellipsoid oder ein anderes Gebilde spezifiziert. Ein Maß für die Fähigkeit des Prozesses, der aufgrund aller relevanten, nicht unabhängigen Produktvariablen beurteilt werden soll, wird multivariater Prozessfähigkeitsindex genannt und mit MCp (einfacher) bzw. MCpk (korrigierter) bezeichnet. Das Problem besteht nun darin, die multivariaten Prozessfähigkeitsindizes zu bestimmen und Entscheidungen aufgrund der multivariaten Prozessfähigkeitsindizes zu treffen. Sind die Entscheidungsmöglichkeiten analog denen der univariaten Prozessfähigkeitsindizes? In der neueren Literatur gibt es einige Ansätze für multivariate Prozessfähigkeitsindizes, so wie diese in den Arbeiten von Chan, Chen, Spiring [1988], Taam et al. [1993], Wang et al. [2000], Jahn [1997]. Die Notwendigkeit für die Ableitung von Formeln soll an Beispielen mit unterschiedlicher Abhängigkeitsstruktur betrachtet werden. 1316han05.indd 193 25.07.2006 11:39:07 194 5 Qualität in der Fertigung Beispiel 5.2.8: Simulationen. Maßzahlen und univariate Fähigkeiten Es wird der zweidimensionale Fall mit den beiden Produktvariablen Y1 und Y2 betrachtet. Der Y sei normal verteilt mit dem Vektor der Erwartungswerte µT = (µ1, µ2) und der Kovarianzmatrix ⎛ σ12 ΣYY = ⎜ ⎝ σ12 ⎞ ⎟. σ 22 ⎠ Die Sollwerte seien MT = (5.0, 5.0), und die unteren und oberen Toleranzgrenzen seien ToT = (7.5, 7.5) TuT = (2.5, 2.5). Für die beiden Fälle werden Stichproben mit den sehr großen Stichprobenumfängen N1 = N2 = 5000 simuliert. Für den unkorrelierter Fall erhält man die Schätzungen r12 = –0.0078, −0.0053 ⎞ , 0.7395 ⎟⎠ ⎛ 0.6261 SYY = ⎜ ⎝ und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.5. Tabelle 5.2.5: Univariate Prozessfähigkeitsindizes für den unkorrelierten Fall Tu To Mittel Stdabw. Cp k Cpk Y1 2,5 7,5 5,505 0,7913 1,053 0,202 0,8401 Y2 2,5 7,5 4,288 0,86 0,969 0,2846 0,6933 Für den extrem hoch korrelierten Fall erhält man die Schätzungen r12 = 0.9987, ⎛ 0.6591 0.70827 ⎞ SYY = ⎜ , 0.76344 ⎟⎠ ⎝ und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.6. Tabelle 5.2.6: Univariate Prozessfähigkeitsindizes für den hoch korrelierten Fall Tu To Mittel Stdabw. Cp k Cpk Y1 2,5 7,5 5,4904 0,8122 1,0261 0,1962 0,8248 Y2 2,5 7,5 4,2899 0,8732 0,9544 0,2841 0,6833 Aus den Tabellen liest man ab, dass sich die statistischen Maßzahlen für den unkorrelierten und hoch korrelierten Fall im statistischen Sinne nicht unterscheiden und die Kovarianzmatrizen und damit natürlich die Korrelationsmatrizen sich wesentlich unterscheiden. 1316han05.indd 194 25.07.2006 11:39:08 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 195 Sind der unkorrelierte und hoch korrelierte Fall aber bzgl. der simultanen Erfüllung der Kundenanforderungen beider Produktvariablen als gleich anzusehen? Zur Beantwortung dieser Frage müssen weitere Charakteristika berechnet werden. Zu diesen zählen die Eigenwerte, die Längen der Hauptachsen der Streuungsellipsen, in deren Inneren alle Punkte (Yi1, Yi2), i = 1, …, N mit der Wahrscheinlichkeit 1 – α = 0.0027 liegen und die Projektionen der Hauptachsen auf die Achsen der Produktvariablen. Längen der Hauptachsen der Ellipse: Für die Kovarianzmatrix ΣYY können wir die Eigenwerte über die charakteristische Gleichung det(SYY – λ I) = 0, d. h. s12 − λ s21 s12 s22 −λ =0 berechnen. Wir erhalten die quadratische Gleichung 2 2 (s12 − λ) (s22 − λ) − s12 = λ 2 − λ (s12 + s22 ) + (s12 s22 − s12 ) = λ 2 − λ ⋅ Sp (SYY ) + det(SYY ) = 0 Beispiel 5.2.9: Simulationen. Eigenwerte und Längen der Hauptachsen Hieraus können wir für beide Fälle die Eigenwerte für den unkorrelierten Fall λ1 = 0.73975 und λ2 = 0.62585 und den hoch korrelierten Fall λ1 = 1.42092 und λ2 = 0.0006178 berechnen. Die Eigenwerte unterscheiden sich wesentlich. Mit den Eigenwerten können wir die Längen der Hauptachsen der Streuungsellipsen nach der Formel Lj = 2 λ j ⋅ c , berechnen, wobei 2 c = −2 ⋅ ln (2 ⋅ π ⋅ h ⋅ 1 − ρ12 ). Die maximale Höhe hmax der Vd ist Φ (0, 0). Die Höhe der Vd für eine vorgegebene Wahrscheinlichkeit α ist hα = 0.0027 = 1316han05.indd 195 1 2 π det(ΣYY ) = 1 = 0.083367 11.995087 25.07.2006 11:39:08 196 5 Qualität in der Fertigung Hieraus folgt c = −2 ⋅ ln (2 ⋅ π ⋅ h0.0027 det(ΣYY ) = −2 ln = −2 ln(α) = −2 ln(0.0027) = 11.82973 = 2 π ⋅ 0.0027 ⋅ det(ΣYY ) 2π det(ΣYY ) χ12− α ,m . Die Längen der Hauptachsen der Ellipsen für die beiden Fälle sind L1,unkorr = 0.73975 ⋅ 11.82973 = 2 ⋅ 2.95822 = 5.9164 L2,unkorr = 0.62585 ⋅ 11.82973 = 2 ⋅ 2.72096 = 5.4419 und L1,hochkorr = 2 ⋅ 1.42092 ⋅ 11.82973 = 2 ⋅ 4.09989 = 8.19978, L2,hochkorr = 2 ⋅ 0.0006178 ⋅ 11.82973 = 2 ⋅ 0.08548 = 0.17097 Die Projektionen der ersten beiden Hauptachsen auf die Koordinaten- (Toleranz-) Achsen ergibt P1 = 4.18 P2 = 5.798. Die Flächeninhalte der beiden Ellipsen sind für den unkorrelierten Fall Funkorr = 25.287 und für den hoch korrelierten Fall Fhoch korr = 1.101. Aus dem Beispiel 5.2.9 erkennt man, dass im Falle der Unkorreliertheit die Ellipse im Toleranzgebiet liegen würde, wenn die Abweichung zwischen den Soll- und Mittelwerten klein genug wäre. Im Falle der starken Korreliertheit ragt die Ellipse auch für den Fall kleiner Abweichungen zwischen den Soll- und Mittelwerten über das Toleranzgebiet hinaus. Das bedeutet aber, dass in dem unkorrelierten Fall der Prozess hinsichtlich des Streuungsverhaltens fähig und im korrelierten Fall nicht fähig ist. Dieses Verhalten wird durch die univariaten Prozessfähigkeitsindizes nicht wider gespiegelt. Daher ist die Verallgemeinerung der uni- auf die multivariaten Prozessfähigkeitsindizes notwendig. Die nachfolgende Abbildung verdeutlich diesen Schluss geometrisch. In Abbildung 5.2.10. werden die beiden Grundflächen der schwach und hochkorrelierten Verteilung in einer Grafik in Bezug auf den • gemeinsamen Sollzustand (MT = (5; 5) und TT = (To,1 – Tu,1; To,2 – Tu,2) = (5; 5) und • den Mittelpunkt Y T = (Y1 Y2 ) dargestellt. Wir können aus dieser Abbildung folgende Sachverhalte ablesen: 1. Für den unkorrelierten Fall liegt die Streuungsellipse in Sollwertlage, d. h. mit dem Mittelpunkt M vollständig innerhalb des Toleranzrechteckes mit den Diagonalen der Länge 7.071. 1316han05.indd 196 25.07.2006 11:39:08 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 197 To2 = 7,5 M2 = 5 Y2 Tu,2 = 2,5 Tu.1 = 2,5 M1 = 5 T0,1 = 7,5 Y1 Abb. 5.2.10: Streuungsellipsen für den schwach und hoch korrelierten Fall im Toleranzgebiet 2. Die Streuungsellipse für den hoch korrelierten Fall ragt auch in der Sollwertlage über das Toleranzgebiet hinaus. 3. Die Streuungsellipsen in Mittelwertlage ragen in beiden Fällen über die Toleranzgrenzen hinaus, d. h. die zu beiden Verteilungen gehörenden Prozesse liefern Ausschuss. Die Prozesse sind nicht fähig. Diese Abbildung wird durch die Streuungsellipsen der Abbildung 5.2.11 und Abbildung 5.2.12 für den unkorrelierten und hoch korrelierten Fall bestätigt. Die Abbildungen bestätigen die obigen Aussagen, dass mit größer werdenden Korrelationskoeffizienten der Anteil der Punkte außerhalb des Toleranzgebietes größer wird und dass dadurch die multivariaten Prozessfähigkeitsindizes kleiner werden und deren Berechnung notwendig ist. 8 6 Y2 4 2 0 2 3 4 5 6 7 8 Y1 Abb. 5.2.11: Streudiagramm für den unkorrelierten Fall 1316han05.indd 197 25.07.2006 11:39:08 198 5 Qualität in der Fertigung 8 6 Y2 4 2 0 2 3 4 5 6 7 8 Y1 Abb. 5.2.12: Streudiagramm für den hoch korrelierten Fall Vor der Ableitung neuer multivariater Prozessfähigkeitsindizes (multivariate process capability indices) MCp und MCpk werden die folgenden Voraussetzungen und Anforderungen gestellt: • Die Produktivität eines Unternehmens ist wesentlich von dem Niveau der im Unternehmen angewendeten Methoden für die Strukturierung des Unternehmens, die statistische Prozessanalyse und die Entscheidungsfindung für die Prozessverbesserung, die Tolerierung oder Überprüfung der Toleranzen mit multivariaten statistischen Methoden auf der Grundlage der Prozessfähigkeiten abhängig. • Jedes Produkt wird durch mehrere (m ≥ 1) Produktvariablen Y1, …, Ym beschrieben. Die Produktvariablen sind nicht unabhängig voneinander. Der Sollzustand wird durch • den Vektor der Sollwerte MT = (M1, …, Mm) und • die Vektoren der Toleranzgrenzen TTo = (To1, …, Tom) und TTu = (Tu1, …, Tum) und der Istzustand durch • den Vektor der Mittelwerte YT = (Y1 … Ym ) und • die positiv definite Stichprobenkovarianzmatrix SYY beschrieben. Was ist Qualität? (Wir müssen hier von Produktqualität sprechen) Die Qualität eines Produktes wird durch die simultane Erfüllung aller relevanten Kundenanforderungen definiert. Für den Vergleich ist es notwendig, dass • die relevanten Kundenanforderungen unter Beachtung der Abhängigkeitsstruktur zwischen den Produktvariablen durch Sollwerte und Toleranzgrenzen spezifiziert werden müssen. 1316han05.indd 198 25.07.2006 11:39:09 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 199 • Zum anderen ist es ebenfalls notwendig, den Istzustand für alle relevanten, nicht unabhängigen Produktvariablen durch die m-dimensionale Häufigkeitsverteilung, bzw. durch die Angabe des Mittelwertvektors und der Stichprobenkovarianzmatrix SYY zu erfassen. • Über den Vergleich von Soll- und Istzustand muss die Qualität quantifiziert werden, um sinnvolle Entscheidungen treffen zu können. Die multivariaten Prozessfähigkeitsindizes quantifizieren die Qualität • Der Vektor der Produktvariable Y sei entweder gemeinsam normal verteilt, d. h. Y ~ Nm (µ, ΣYY), ΣYY > 0 oder die gemeinsame Verteilung gehört zur Klasse der elliptisch umrissenen Verteilungen. • Die multivariaten Prozessfähigkeitsindizes sollen Eigenschaften haben, die analog zu denen der univariaten Prozessfähigkeitsindizes sind. Insbesondere sollen die multivariaten Prozessfähigkeitsindizes als Entscheidungsgrundlage für – die Prozessverbesserung im Sinne der Reduktion der Variabilität der Produktvariable, falls MCp < 1, – der Justierung des Prozesses, falls MCp > 1 und MCpk < 1, – der Überprüfung oder Neuberechnung der Toleranzgrenzen, falls MCp < 1 und die Differenz zwischen MCp und MCpk sehr groß ist, dienen. – Der multivariate Prozessfähigkeitsindex MCp, der das Streuverhalten des zufälligen Vektors der Produktvariablen im Vergleich zum Toleranzbereich beurteilt, muss 1 sein, falls das Streuungsellipsoid den Toleranzbereich an allen Koordinatenebenen berührt, – MCpk ≤ MCp für K ≥ 0. – K ist nichtlinear von Y − M abhängig, – die Form des Ellipsoids oder Hyperellipsoids der Realisierungen des Vektors der Pro1 abhängig. duktvariablen ist vom Grad der Multikollinearität δ = RYY – Je größer der Grad der Multikollinearität ist, desto kleiner wird die kleinste Hauptachse des Hyperellipsoides. – MCp muss folglich ebenfalls von δ abhängen. – MCp soll für verschiedene Toleranzbereiche m · unabhängige Spezifikationsbereiche ∏ (Toj − Tuj ) j =1 · abhängige Spezifikationsbereiche (To – M)T A (To – M) – gelten. Sind die Produktvariablen unabhängig voneinander, kann die Benferoni Ungleichung angewandt werden, um sicher zustellen, dass dieselbe Wahrscheinlichkeit α für alle Produktvariablen gilt. Außerdem kann in diesem Fall die multivariate Prozessfähigkeit durch das Produkt über alle Prozessfähigkeiten für jeden Produktvariable MPCp′ = m ∏ Cp, j j =1 abgeschätzt werden. 1316han05.indd 199 25.07.2006 11:39:09 200 5 Qualität in der Fertigung Sind die Produktvariablen nicht unabhängig voneinander, dann sind sie korreliert. Die Abhängigkeitsstruktur zwischen den Produktvariablen, ausgedrückt durch die Korrelationsoder Kovarianzmatrix, muss berechnet werden. In diesen Fällen liefern die Produkte über die einfachen Prozessfähigkeitsindizes unsinnige Ergebnisse. Was müssen wir tun, um im multivariaten Fall den Soll- mit dem Istzustand vergleichen zu können? Im univariaten Fall haben wir Intervalle (Breite des Toleranzintervalls und Breite der Häufigkeitsverteilung) miteinander verglichen. Im zweidimensionalen Fall könnten wir Flächen – die Streuungsellipse und den Toleranzbereich – miteinander vergleichen. Das hieße, dass wir im m-dimensionalen Fall Volumen vergleichen müssten. Welche Zahl können wir für m = 2 einer Fläche zuordnen? Die Flächeninhalte des Kreises und der Ellipse mit dem Flächeninhalt des Toleranzbereiches zu vergleichen, ergäbe für den unkorrelierten Fall den Wert Toleranzbereich 25 = = 0.988 Streuungsbereich 25.287 und für den hoch korrelierten Fall Toleranzbereich 25 = = 22.706. Streuungsbereich 1.101 Dieser Vergleich macht keinen Sinn, denn die Abbildungen 5.14 und 5.15 zeigen, dass • Die „Ecken“ des Toleranzbereiches durch den Prozess nicht belegt werden können, • der Streuungskreis für den unkorrelierten Fall und • die Streuungsellipse für den hoch korrelierten Fall über die Toleranzgrenzen hinausragen. An dieser Stelle möchte ich Ihnen die Frage stellen, warum sind Schießscheiben rund? Natürlich weil die Trefferbilder eines jeden Schießgerätes kreisförmig umrissen sind. Die Ecke eines rechteckigen Zielgebietes zu treffen ist genauso schwierig, wie in das Zentrum zu treffen, ja man kann sagen, jeder Eckpunkt ist der Mittelpunkt eines Vierteilkreises. Da der Flächenvergleich kein Ergebnis liefert, müssen wir uns etwas anderes überlegen. Wir können die Definition des univariaten Prozessfähigkeitsindex auch anders interpretieren, indem wir fragen, wie groß ist der Abstand zwischen der oberen und unteren Toleranzgrenze relativ zur Standardabweichung der betrachteten Produktvariablen? Das würde bedeuten, dass wir die Abstände zwischen Punkten in beliebig dimensionalen Räumen unter Beachtung der Abhängigkeitsstruktur zwischen den Produktvariablen betrachten und nach passenden Abstandsdefinitionen suchen. Im Kapitel 10 über die Klassifikationsverfahren, speziell bei der Einführung der Clusteranalyse, werden einige Abstandsdefinitionen eingeführt und betrachtet. Der für die Ableitung der multivariaten Prozessfähigkeitsindizes passende Abstandsbegriff ist der 1316han05.indd 200 25.07.2006 11:39:10 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 201 Mahalanobis Abstand Der gewichtete Abstand zwischen den beiden Vektoren z. B. Y1 und Y2 mit den Gewichten, die durch die inversen Kovarianzmatrix geliefert werden, ist durch D = (Y1 − Y2 )T A (Y1 − Y2 ) −1 = (Y1 − Y2 )T ⋅ ΣYY ⋅ (Y1 − Y2 ) definiert, wobei die Gewichtsmatrix A durch die inverse Kovarianzmatrix ersetzt wird. Ist ΣYY unbekannt, so wird sie durch die Stichprobenkovarianzmatrix SYY ersetzt. Sind die Stichprobenkovarianzmatrizen von Y1 und Y2 verschieden, so kann man SYY durch die gemittelte (pooled) Kovarianzmatrix ersetzen. Nehmen wir wie oben an, dass der zufällige Vektor Y der Produktvariablen Y1, …, Ym m-dimensional normal verteilt ist, dann hat er die Verteilungsdichte fY ( y ; μ , Σ ) = 1 m (2 π) 2 ⋅ 1 ΣYY 2 ⎧ 1 ⎫ −1 ⋅ exp ⎨− (Y − μY )T ⋅ ΣYY ⋅ (Y − μY )⎬ , ⎩ 2 ⎭ wobei ΣYY eine positiv definite Kovarianzmatrix ist. Diesen Sachverhalt kürzen wir durch ΣYY > 0 ab. In dieser Darstellung erkennen wir, dass die quadratische Form im Exponenten der m-dimensionalen Normalverteilung mit den Abweichungen der Messwertvektoren Yi vom −1 Erwartungswertvektor µ genau ein Mahalanobis Abstand D = (Yi − μ)T ΣYY (Yi − μ) ist, der den „gewichteten“ Abstand einer Zufallsgröße Yi von ihrem Erwartungswert misst. Das wollen wir uns für die Definition der multivariaten Prozessfähigkeitsindizes zunutze machen. Neue Definition der multivariaten Prozessfähigkeitsindizes Beim Übergang von den univariaten zu den multivariaten Prozessfähigkeitsindizes müssen wir anmerken, dass sich von Stichprobe zu Stichprobe mit den Vektoren der Einzelwerte Yi, i = 1, …, N auch die Vektoren der Mittelwerte Y und die Stichprobenkovarianzmatrizen ändern können. Die einzige nahezu unveränderliche „Größe“ ist die Korrelationsmatrix für die Produktvariablen. Bedingte Prozessfähigkeitsindizes Infolgedessen suchen wir den mit der Stichprobenkovarianzmatrix gewichteten Abstand zwischen dem Vektor der Abweichungen des Einzelwertes Yi vom Vektor der Mittelwerte. Das wäre der mittlere Mahalanobis Abstand 1 N N −1 (Yi − Y ). ∑ (Yi − Y )T SYY i =1 Nun gilt aber ⎡ ⎛1 E ⎢Sp ⎜ ⎢⎣ ⎝ N 1316han05.indd 201 ⎞⎤ ⎧1 N ⎫ −1 T −1 Y Y S Y Y E ⎣⎡SYY ( − ) ( − ) = Sp (Yi − Y )(Yi − Y )T ⎦⎤ ⎬ ⎥ ⎨ ∑ i ∑ YY i ⎟⎠ ⎥⎦ ⎩ N i =1 ⎭ i =1 n = = const N N 25.07.2006 11:39:10 202 5 Qualität in der Fertigung Zudem muss dieser Abstand relativ zu dem gewichteten Abstand zwischen den Vektoren der oberen Toleranzgrenzen und den Sollwerten −1 (To − M )T SYY (To − M ) betrachtet werden. Dieser Abstand kann auch mit dem Spurkriterium in den Ausdruck (To − M ) T −1 SYY ⎡ m (To, j − M j ) ⎤ −1 ⎤ (To − M ) = Sp ⎣⎡(To − M )(To − M )T SYY = ⎢ ⎥ ∑ ⎦ ⎢⎣ j =1 S j / m − j ⎥⎦ 2 umgeformt werden. Die Summanden dieser Summe sehen aus wie die einfachen Prozessfähigkeitsindizes mit den bedingten anstelle der einfachen Standardabweichungen. Für die einzelnen Produktvariablen kann die Formel MCp ( j) = (To, j − Tu, j ) 6 ⋅ S j /m− j , ∀j = 1, …, m als einfacher bedingter oder multivariater Prozessfähigkeitsindex für die j-te Produktvariable verwendet werden. Der Korrekturterm für die Messung der Abweichung des Mittelwertes vom Sollwert ist kj = 2 M j − E (Y j / Ym − j ) To, j − Tu, j , ∀j = 1, …, m. Der korrigierte bedingte (oder multivariate) Prozessfähigkeitsindex für die j-te Produktvariable ist MCpk ( j) = [1 − k j MCp ( j)]. Die bedingten Prozessfähigkeitsindizes hängen noch über die bedingte Varianz von der Kovarianzmatrix ab. Daher ist es sinnvoll, noch ein globales Maß für die multivariate Prozessfähigkeit auszurechnen. Multivariate Prozessfähigkeitsindizes Wir gehen wieder vom univariaten Prozessfähigkeitsindex Cp aus und schreiben den in der Form Cp = To − Tu 1 1 ⋅ = σ* 6 S S wobei To − Tu = σ* 6 die maximale Streuung für die Produktvariable ist, die garantiert, dass die Häufigkeitsverteilung für die Werte der Produktvariablen innerhalb des Toleranzintervalls liegt. Ist S > σ*, dann ist Cp < 1. Diesen Ausdruck für Cp wollen wir auf den multivariaten Fall verallgemeinern. Eine Möglichkeit der Verallgemeinerung wäre die Bildung des verallgemeinerten Varianzquotienten * −1 (ΣYY SYY ). 1316han05.indd 202 25.07.2006 11:39:10 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 203 Dieser Ausdruck oder gewisse Funktionale davon scheinen nicht geeignet zu sein. Daher wählen wir für den multivariaten Prozessfähigkeitsindex den Quotient zweier quadratischer Formen. Die quadratische Form im Zähler ist die schon betrachtete −1 (To − M )T SYY (To − M ). Die im Nenner stehende zweite quadratische Form wird mit der so genannten „theoretischen“ * * Kovarianzmatrix ΣYY anstelle der Stichprobenkovarianzmatrix SYY gebildet. ΣYY wird aus der Korrelationsmatrix, den Toleranzgrenzen und Sollwerten für alle m Produktvariablen berechnet. Mit diesen Überlegungen erhält man für die Vektoren der oberen Toleranzgrenzen ToT = (To,1 … To,m ) und der Sollwerte M T = (M 1 … M m ) den Ausdruck MCp = (To − M )T S-1 YY (To − M ) * −1 (To − M )T (ΣYY ) (To − M ) wobei ⎛T − M ⎞ ⎛T − M ⎞ * ΣYY = diag ⎜ o R diag ⎜ o ⎝ 3 ⎟⎠ YY ⎝ 3 ⎟⎠ die theoretische Kovarianzmatrix und RYY die Korrelationsmatrix des Vektors YT = (Y1, …, Ym) der m, m ≥ 1 Produktvariablen ist. Für schiefsymmetrische Toleranzgrenzen verwendet man MCpo = MCpu = −1 (To − M )T SYY (To − M ) * −1 (To − M )T (ΣYY ) (To − M ) −1 (M − Tu )T SYY (M − Tu ) * −1 (M − Tu )T (ΣYY ) (M − Tu ) Der Korrekturterm wird nach der Formel MCpu = −1 (M − Tu )T SYY (M − Tu ) * −1 (M − Tu )T (ΣYY ) (M − Tu ) berechnet. Damit wir der korrigierte multivariate Prozessfähigkeitsindex MCpk = MCp / K berechnet. Die Entscheidung wird entsprechend den Größen von MCp und MCpk vorgenommen. 1316han05.indd 203 25.07.2006 11:39:11 204 5 Qualität in der Fertigung Daten Y2 Y2 Y2 Tu 2 Tu 2 Tu 2 M2 M2 M2 Tl 2 Tl 2 Tl 2 Tl 1 M1 Tu 1 Y1 MC p < 1 MC pk< 1 Tl 1 M1 Tu 1 Y1 MC p > 1 MCpk < 1 Prozessverbesserung Reduktion der Variation Tl 1 M1 Tu 1 Y1 MCp > 1 MCpk >1 Kontrolle des Prozesses Justierung des Prozesses Abb. 5.2.13: Entscheidungen aufgrund der multivariaten Prozessfähigkeitsindizes Gilt MCp < 1 (bzw. 1.33), dann ragt die multivariate Häufigkeitsverteilung der Produktvariablen an einer, mehreren oder allen Rändern über den Toleranzbereich hinaus. Ausschuss wird produziert. Der Prozess muss so verbessert werden, dass die Variabilität der Produktvariablen kleiner wird. Das kann nur über die Steuerung des Prozesses mit den Sollwerten und Toleranzgrenzen als Zielwerte für die Produktvariablen erreicht werden. In diesem Fall ist auch MCpk < 1, da K > 0 ist. Gilt MCp > 1 (bzw. 1.33) und MCpk < 1 (bzw. 1.33), dann weicht der Vektor der Mittelwerte zu stark vom Vektor der Sollwerte ab. Die multivariate Häufigkeitsverteilung der Produktvariablen kann über den Toleranzbereich hinausragen. Das bedeutet aber, dass trotz MCp > 1 (bzw. > 1.33) Ausschuss produziert wird. Der Prozess muss verbessert werden, so dass die Mittel- und Sollwerte übereinstimmen. Gelten sowohl MCp > 1 und MCpk > 1 (bzw. > 1.33), dann ist der Prozess fähig, Produkte mit den durch Sollwerte und Toleranzgrenzen vorgegebenen Eigenschaften zu produzieren. In diesem Fall muss der Prozess mit den multivariaten Kontrollkarten des Kapitels 6 ständig überwacht werden. Die Entscheidungen werden durch die Abbildung 5.2.13 visualisiert. Was besagen die Begriffe Produktqualität, Lieferantenqualität und Prozessqualität? Die bedingten und multivariaten Prozessfähigkeitsindizes sind auf die Produkte, die Inputoder Lieferantenprodukte und die Prozesse anwendbar. In jedem Falle müssen die Sollzustände, ausgedrückt durch Sollwerte und Toleranzgrenzen, für die nicht unabhängigen Variablen mit den Istzuständen, ausgedrückt durch die Schätzungen für die Mittelwertvektoren und Kovarianzmatrizen, verglichen werden. Für die Anwendung der multivariaten Prozessfähigkeitsindizes MCp und MCpk auf die Produkte, Prozesse und Lieferantenprodukte wollen wir die folgenden Bezeichnungen einführen. 1316han05.indd 204 25.07.2006 11:39:11 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 205 • PCp und PCpk werden für die Messung der simultanen Erfüllung aller relevanten Kundenanforderungen verwendet. Diese Fähigkeitsindices wollen wir Produktfähigkeiten nennen. Die Produktfähigkeit PCpk misst die Produktqualität. • LCp und LCpk werden für die Beurteilung der Input- oder Lieferantenprodukte verwendet. Die Lieferantenfähigkeit LCpk misst die Lieferantenqualität. • ProzCp und ProzCpk wollen wir für die Beurteilung der Prozesse verwenden. • Die Prozessfähigkeit ProzCpk misst die Prozessqualität. • Die Lieferanten- und Prozessqualität sind die notwendigen Voraussetzungen für die Produktqualität. Mitunter, wenn keine Verwechslungen möglich sind, werden aber die übergeordneten Bezeichnungen MCp und MCpk verwendet. An mehreren Beispielen wollen wir jetzt demonstrieren, wie die multivariaten Prozessfähigkeitsindizes zu interpretieren sind. Beispiel 5.2.10: Demonstrationsbeispiel. Multivariate Fähigkeiten Für fünf Produktvariable mit den Sollwerten und Toleranzgrenzen der folgenden Tabelle Tabelle 5.2.7: Sollzustand Demonstrationsbeispiel Produktvariable Sollwert untere Toleranzgrenze obere Toleranzgrenze Y1 7,5 5,7 9,3 Y3 128 113 143 Y3 65 56 74 Y4 1,2 1,05 1,35 Y5 1,8 0,3 3,3 und eine gegebene Korrelationsmatrix RYY wurden zwei Stichproben erzeugt. Die Stichprobenkovarianzmatrix der einen Stichprobe ist ⎛ 0,502067 3,042725 0,546106 0,0160155 0,147379 ⎞ ⎜ 29,794251 3,073832 0,140759 1,768678 ⎟ ⎜ ⎟ 11,653298 0,127856 0,991572 ⎟ SYY (1) = ⎜ ⎜ 0,0021438 0,0153684 ⎟ ⎜ ⎟ 0,185228 ⎠ ⎝ und die der zweiten ⎛ 0,346178 2,356153 0,481964 ⎜ 26,378731 3,025746 ⎜ 9,128812 SYY (2) = ⎜ ⎜ ⎜ ⎝ 1316han05.indd 205 0,014896 0,147258 0,122732 0,0025146 0,161749 ⎞ 2,095516 ⎟ ⎟ 1,047801 ⎟ . 0,020078 ⎟ ⎟ 0,268881 ⎠ 25.07.2006 11:39:11 206 5 Qualität in der Fertigung Die theoretische Kovarianzmatrix ist * ΣYY ⎛ 0,36 2,360133 0,40639 0,014645 0,144981 ⎞ ⎜ 25 2,47446 0,139237 1,882212 ⎟ ⎜ ⎟ 9 0,121336 1,012367 ⎟ . =⎜ ⎜ 0,0025 0,01928 ⎟ ⎜ ⎟ 0,25 ⎝ ⎠ Sie sehen, die Stichprobenkovarianzmatrix SYY(2) unterscheidet sich von Σ*YY sehr viel weniger als SYY(1). Folglich müssen die multivariaten Prozessfähigkeitsindizes der zweiten Stichprobe in der Nähe von 1 liegen und die der 1. Stichprobe kleiner sein. Die Prozessfähigkeitsindizes der ersten Stichprobe sind Tabelle 5.2.8: Fähigkeiten der Stichprobe 1 Univariate Capabilities: LSL USL Mean Stdv Cp k Cpk 0.7086 0.8468 0.2019 0.6758 Y1 5.70 9.30 7.8634 Y2 113.00 143.00 129.6605 5.4584 0.9160 0.1107 0.8146 Y3 56.00 74.00 64.8889 3.4137 0.8788 0.0123 0.8680 Y4 1.05 1.35 1.2015 0.0463 1.0799 0.0102 1.0689 Y5 0.30 3.30 1.8390 0.4304 1.1618 0.0260 1.1316 Stdv Cp k Cpk Multivariate Capabilities: PCp: 0.658 D: 1.2892 PCpm: 0.5104 und die der zweiten Tabelle 5.2.9: Fähigkeiten der Stichprobe 2 Univariate Capabilities: LSL USL Mean Y1 5.70 9.30 7.5328 0.5884 1.0198 0.0182 1.0012 Y2 113.00 143.00 128.3841 5.1360 0.9735 0.0256 0.9486 Y3 56.00 74.00 64.9522 3.0214 0.9929 0.0053 0.9876 Y4 1.05 1.35 1.2009 0.0501 0.9971 0.0057 0.9914 Y5 0.30 3.30 1.8220 0.5185 0.9643 0.0147 0.9501 Multivariate Capabilities: 1316han05.indd 206 PCp: 0.9735 K: 0.014 PCpk: 0.9599 D: 1.0238 PCpm: 0.9509 25.07.2006 11:39:11 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 207 Der multivariate Prozessfähigkeitsindex MCp, der eine Aussage über das Streuverhalten gestattet, liegt bei der zweiten Stichprobe nahe an der 1 und bei der ersten Stichprobe ist er bedeutend kleiner als 1. −1 Der Mittelwert der Eigenwerte von (Σ * SYY ) als Test für die Gleichheit von Kovarianzmatrizen ist für die 1. Stichprobe 1,772 und für die 2. Stichprobe 0,989. Hieraus folgt, dass bei der 1. Stichprobe die theoretische Kovarianzmatrix ungleich der Stichprobenkovarianzmatrix ist. Im zweiten Fall stimmen die Kovarianzmatrizen fast überein. Beispiel 5.2.11: Dämpfung der Motorvibration. Multivariate Fähigkeiten Das Hydrolager wurde durch die beiden Produktvariablen Y1 = Phasenverschiebung [Φ] und Y2 = dynamische Steifigkeit [N/mm] beschrieben. Die dreidimensionale Häufigkeitsverteilung und das Streudiagramm sind in Abbildung 5.1.2 und Abbildung 5.1.3 dargestellt. Die Sollvorgaben sind Tabelle 5.2.10: Sollvorgaben für die Produktvariable Phasenverschiebung und Steifigkeit Sollwert Phasenverschiebung dyn. Steifigkeit 43 185 untere Toleranzgrenze 36 140 obere Toleranzgrenze 48 230 Die Kennzahlen für den Istzustand nach der Ausreißererkennung mit dem aerk-Kriterium und Elimination sind in der Tabelle 5.2.11 zusammengestellt. Tabelle 5.2.11: Istzustand Phasenverschiebung dyn. Steifigkeit Minimum 2.90 119.92 Mittelwert 42.526 196.587 Standardabweichung Maximum 2.83727 60.00 8.193489 272.79 Tabelle 5.2.12: Univariate Prozessfähigkeitsindizes Phasenverschiebung dyn. Steifigkeit Cp 0.7049 1.8307 K 0.0877 0.2575 Cpk 06431 1.3593 Hier hat man den Fall, dass eine Produktvariable eine univariate Prozessfähigkeit hat, die größer ist als 1.33 und eine, deren Fähigkeit kleiner als 1.33 ist. 1316han05.indd 207 25.07.2006 11:39:12 208 5 Qualität in der Fertigung Wie soll man entscheiden? Die multivariaten Prozessfähigkeitsindizes müssen berechnet werden. Wir erhalten die Werte MCp = 1.375 MCpk = 1.057. Da der korrigierte multivariate Prozessfähigkeitsindex kleiner als 1.33 ist, muss der Prozess verbessert werden, sodass vor allem die Streuung der dynamische Steifigkeit Y2 kleiner wird. Beispiel 5.2.12: Akkubohrschrauber. Prozessfähigkeiten Für das Plastikgehäuse des Akku-Bohrschraubers haben wir vorn die statistischen Toleranzgrenzen berechnet. Die statistischen Toleranzgrenzen unterscheiden sich von den gegebenen CAD Toleranzen. Mit den statistischen Toleranzgrenzen haben wir die Fähigkeiten berechnet und in der Tabelle 5.2.13 zusammengestellt. Tabelle 5.2.13: Univariate Prozessfähigkeitsindizes Beispiel Akkubohrschrauber Variable Toleranzgrenzen Thermoschrumpf Axialität Parallelität Dicke untere obere –0,52 –0,7 –1,4 2,76 2,72 0,7 1,4 3,44 Mittelwert Stabw. Cp k Cpk 1,5152 0,0097 0,0788 3,137 0,4743 0,205 0,496 0,094 1,138 1,138 0,941 1,207 0,256 0,014 0,056 0,108 0,847 1,122 0,888 1,076 Die multivariaten Prozessfähigkeitsindizes sind: MCp 1,0963 D 1,4317 MCpk 0,766 Da MCpk < 1 ist, muss der Prozess so verbessert werden, dass die Streuungen für die Produktvariablen kleiner werden. Der Vektor der Produktvariablen kann aber auch der allgemeineren Klasse der elliptisch umrissenen Verteilungen zugeordnet werden, zu der natürlich auch die Normalverteilungen gehören. Diese Klasse ist durch die Verteilungsdichte charakterisiert fY ( y ; μ, Σ) = ΣYY − 1 2 −1 g ⎡⎣(Y − μY )T ⋅ ΣYY ⋅ (Y − μY )⎤⎦ , wobei g eine nicht wachsende Funktion ist. Wählt man für g die Funktion − g (u) = (2 π) m 2 ⋅e 1 − ⋅u 2 dann erhält man die Verteilungsdichte der m-dimensionale Normalverteilung. Der Exponent −1 (Y − μY )T ⋅ ΣYY ⋅ (Y − μY ) der multivariaten normalen oder elliptisch umrissenen Dichte spezifiziert die Gleichung eines Hyperellipsoides im m-dimensionalen Raum, wenn er gleich einer beliebigen positiven Konstante c gesetzt wird. 1316han05.indd 208 25.07.2006 11:39:12 209 5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? Beispiel 5.2.13: Karosseriebau. Multivariate Fähigkeiten An einer Karosserie wurden nach dem Tür-, Heckklappen- und Motorhaubeneinbau m = 73 Produktvariable, wie Spaltmaße, Symmetrien, Parallelitäten, Längen, Höhen, Distanzen usw. gemessen. Der Stichprobenumfang betrug N = 228. Der Grad der Multikollinearität war sehr hoch, d. h. die Determinante der Korrelationsmatrix der Produktvariablen nahm den überaus kleinen Wert Det(RYY) = 2,2 10–135 an. Aus der Analyse wurden über das Red-Auswahlverfahren und die multiple Korrelationsanalyse p = 59 Produktvariable gestrichen. Die übrig gebliebenen Produktvariablen wurden neu mit Y1, …, Y14 nummeriert. Die gegebenen Toleranzen für alle Produktvariablen wurden nach der arithmetischen Tolerierung berechnet. Diese setzt aber die Unabhängigkeit der Produktvariablen, d. h. Det(RYY) ≅ 1 voraus. Der tatsächliche Wert für die Determinante der Korrelationsmatrix liegt aber sehr viel näher an Null als an der Eins! Hieraus folgt, dass auf alle Fälle das Ergebnis der gegebenen Tolerierung infrage gestellt werden muss. Die statistischen Toleranzgrenzen wurden berechnet und in der Tabelle 5.2.14 zusammengestellt. Tabelle 5.2.14: Produktvariable mit den statistischen Maßzahlen und den Toleranzgrenzen Produktvar. Mittelwert Standardabw. Tu To Dimension Y1 0,51 0,4435 –0,924 1,944 mm Y2 –0,5144 0,1904 –1,172 0,142 mm Y3 –0,3546 0,0512 –0,528 –0,182 mm Y4 –0,211 0,5532 –0,638 0,216 mm Y5 1,558 0,1154 1,016 2,1 mm Y6 –0,1112 0,088 –0,576 0,353 mm Y7 1,671 0,115 1,188 2,154 mm Y8 –0,0916 0,1305 –0,802 0,62 mm Y9 0,0171 0,0615 –0,208 0,242 mm Y10 –0,1681 0,0841 –0,498 0,162 mm Y11 –0,1603 0,0566 –0,464 0,143 mm Y12 –0,5871 0,0814 –0,865 –0,309 mm –0,0445 0,1017 –0,292 0,203 mm 0,8507 –19,919 –11,131 mm Y13 Y14 –15,525 Die berechneten statistischen Toleranzgrenzen wurden mit dem Vertragspartner abgestimmt und akzeptiert. Mit den berechneten Toleranzgrenzen wurde die uni- und multivariaten Prozessfähigkeitsindizes berechnet und in Tabelle 5.2.15 zusammengestellt. Nur eine der univariaten, korrigierten Prozessfähigkeitsindizes ist kleiner als 1 und fünf sind kleiner als 1.33. Für die Entscheidung, ob der Prozess verbessert werden muss, ist die Berechnung der multivariaten Prozessfähigkeitsindizes unerlässlich. 1316han05.indd 209 25.07.2006 11:39:12 210 5 Qualität in der Fertigung Tabelle 5.2.15: Univariate Prozessfähigkeiten für die wesentlichen Produktvariablen Prod.Par. Cp k Cpk Y1 Y2 1,0778 0,0003 1,0775 1,15 0,001 1,1489 Y3 1,1483 0,0023 1,1458 Y4 1,5436 0,0001 1,5436 Y5 1,5653 0,0001 1,5652 Y6 1,7585 0,0006 1,7573 Y7 1,3993 0,0001 1,3993 Y8 1,8158 0,0008 1,8143 Y9 1,2187 0,0004 1,2183 Y10 1,3081 0,0004 1,3076 Y11 1,7863 0,0006 1,7852 Y12 1,1382 0,0002 1,1377 Y13 0,8108 0,0002 0,8107 Y14 1,7216 0,0001 1,7215 Die multivariaten Prozessfähigkeitsindizes sind PCp = 1,5518 PCpk = 1,5517 Die multivariaten Prozessfähigkeitsindizes besagen, der Prozess ist in Ordnung. Trotzdem muss der Prozess mit den multivariaten Kontrollkarten kontinuierlich überprüft werden. 5.3 Vergleich verschiedener Tolerierungsverfahren an 6- und 5-dimensionalen Beispielen Für die Tolerierung gibt es, wie wir gesehen haben, verschiedene Herangehensweisen. Einmal die Art der Tolerierung, die von Technikern eingeführt wurde und den technischen Aspekt in den Vordergrund stellt. Mathematisch basiert diese Art der Tolerierung auf dem Fehlerfortpflanzungsgesetz und letztlich auf der Faltung voneinander unabhängiger Zufallsgrößen. Die andere von Jahn eingeführte multivariate statistische Tolerierung basiert auf den Tatsachen, dass • • • • • es nicht nur Montageprozesse gibt, das Produkt eines jeden (Herstellungs- oder Service-) Prozesses durch m, m ≥ 1 nicht unabhängige Produktvariable Y1, …, Ym beschrieben wird, die Produktvariablen Realisierungen von Zufallsgrößen sind und die Sollwerte und Toleranzgrenzen für jeden Prozess Zielwerte der Steuer- und Regelung sind. 1316han05.indd 210 25.07.2006 11:39:12 5.3 Vergleich verschiedener Tolerierungsverfahren 5.3.1 211 Charakteristische Zusammenhänge zwischen Funktionssicherheit und Toleranz aus Sicht der Techniker Hoffmann [1986] definiert einige bedeutende Grundlagen, wie z. B. • die Funktionssicherheit ist die Einhaltung der für ein Erzeugnis vorgegebenen Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen. Innerhalb der Funktionsfehlergrenzen ist das Erzeugnis funktionstüchtig. • Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die Funktionstüchtigkeit beschreibenden Eigenschaften eines Erzeugnisses. • Die Herstellungstoleranz ist Differenz zwischen dem oberen und unteren erreichten Grenzwert bei der Herstellung mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigerzeugnisse. • Die Maßtoleranz ist die Differenz zwischen dem zulässigen Größt- und Kleinstmaß. • Die Messtoleranz ist die Differenz zwischen der zulässigen oberen und unteren Abweichung des Messwertes von der Messgröße. (Fehlergrenze der Messung). Die Funktionstoleranz ist in der Regel größer als die Maßtoleranz. Die Herstellungstoleranz und die Messtoleranz sind bei beherrschter Produktion grundsätzlich kleines als die Maßtoleranz. Die verschiedenen Toleranzen müssen für ein Projekt optimiert werden, denn • kleiner werdende Toleranzen führen zu höheren Fertigungs- und Prüfkosten, • größer werdende Toleranzen führen zu höheren Kosten für Nacharbeit und zusätzlichen Leistungen bei der Montage (Siehe Beispiel Akku-Bohrschrauber – MOST: Maynard Operation Sequence Technic, Zeitmessungen bei der Montage). Grundsätzlich ist anzustreben, die Produktion zu „entfeinern“, d. h. die Herstellungstoleranzen so groß wie möglich zu machen. Andererseits ist erwiesen, dass die Verringerung des spezifischen Aufwandes an vergegenständlichter und lebendiger Arbeit nur durch eine Einengung vor allem der Herstellungs-, aber auch der Funktions- und Messtoleranzen möglich ist. Gründe für das Nichterreichen der Fertigungssollmaße können sein: • • • • • • Ungenauigkeiten der Maschinen, Werkzeuge, Vorrichtungen, Verschleiß der Maschinen, Werkzeuge und Vorrichtungen, Einstellfehler an Maschinen, Werkzeugen und Vorrichtungen, elastische Verformungen durch Spann- und Schnittkräfte, Verformungen durch Temperatureinfluss, zufällige Fehler. Was muss alles gemessen werden? Die Produktvariablen Y1, …, Ym, (nach Hoffmann [1986] die Werkstückabmessungen), die Input- und Prozessvariable (nach Hoffmann: Werkzeugeinstellung, Verschleiß, Schnittkräfte, Drehzahl, Drehmoment, Spannkräfte, Temperaturen, …) und die noise Variablen müssen gemessen werden, wenn eine vernünftige Tolerierung bewerkstelligt werden soll. 1316han05.indd 211 25.07.2006 11:39:12 212 5 Qualität in der Fertigung Wie werden Maß- und Toleranzketten aufgebaut? Wie üblich benötigen wir einige neue Definitionen, bevor wir mit dem Aufbau der Maßketten beginnen können. Maßkette Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Werte sich summieren. Die Maßkette ist eine Aneinanderreihung von zusammenwirkenden Einzelmaßen und dem von ihnen abhängigen Schlussmaß. Die Maßkette bildet einen Linienzug, d. h. eine Masche. Die Einzelmaße sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette ist ihre Geschlossenheit. Bei der Berechnung der Maßketten ist zu beachten, dass die Einzelmaße aus unterschiedlichen Systemen stammen können, und zwar dem herzustellenden Gerät (Produkt), dem Werkstück (Input) oder der Werkzeugmaschine, Vorrichtung, Werkzeug (Prozess). Die in Klammern stehenden Bezeichnungen stellen die Verbindung zu meiner viel allgemeineren Theorie der Tolerierung dar. Zur Berechnung der Maßkette werden für die Einzelmaße Mj, j = 1, …, m die Nennmaße Nj, und die dazu gehörenden Toleranzmittenabmaße ECj, oder Erwartungsabmaße EEj bestimmt. Auftretende Spiele werden mit der halben Größe des Kleinstspiels ½ Skj wie Einzelmaße behandelt. Für das Schlussmaß M0 bestimmt man das Nennmaß N0 und die zugehörige Toleranz EC0, oder das Erwartungsabmaß EE0. Ist die Schlusstoleranz eine Passtoleranz oder ein Spiel, so wird das Toleranzmittenabmaß EC0 oder das Erwartungsabmaß EE0 durch das mittlere oder halbe Größtspiel ½ Sg0 gebildet. Es werden die folgenden Bezeichnungen verwendet: Nennmaß Einzelmaß Istmaß Größtmaß Kleinstmaß Toleranzmittenmaß Erwartungsmaß Istabmaß Oberes Abmaß Unteres Abmaß Toleranzmittenabmaß = = = = = = = = = = = N ist das Maß auf das die Maßkette bezogen wird, Mj (mitunter sind Einzel- und Nennmaße gleich), I ist das Maß des gefertigten Werkstücks, G ist das zulässiges Maximum des Istmaßes, K ist das zulässiges Minimum des Istmaßes, C ist der arithmetische Mittelwert aus Größt- und Kleinstmaß, E ist der arithmetische Mittelwert aus eine Serie von Istmaßen, Aj ist die Differenz zwischen Ist- und Nennmaß, ES ist die Differenz zwischen Größt- und Nennmaß, El ist die Differenz zwischen Kleinst- und Nennmaß, EC ist die Differenz zwischen Toleranzmittenmaß und Nennmaß, Erwartungsabmaß = AE ist die Differenz zwischen Toleranzmitten- und Nennmaß, Maßtoleranz, Toleranz = T ist die Differenz zwischen Größt- und Kleinstmaß, Spiele = S ist die halbe Größe des Kleinstspiels = 1/2 Skj, sie werden wie Einzelmaße behandelt, Anzahl der Spiel- und Übergangspassungen = e Koeffizient der relativen cj = 2 sj / Tj Standardabweichung, Koeffizient der relativen aj = (AEj – ECj) / Tj und die Asymmetrie. 1316han05.indd 212 25.07.2006 11:39:12 5.3 Vergleich verschiedener Tolerierungsverfahren 5.3.2 213 Berechnung von Maß- und Toleranzketten für vollständige Austauschbarkeit Maßketten Das Nennmaß N0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen Maßkettengliedern additiv aus den Nennmaßen Nj der j = 1, …, m Einzelmaße Mj zusammen. m ∑ kj N j , N0 = j =1 wobei kj den Richtungskoeffizient des j-ten Einzelmaßes auf das Schlussmaß bezeichnet. Dieser Koeffizient ist gleich +1, wenn der Einfluss des Einzelmaßes positiv ist. Positive Einzelmaße bewirken bei ihrer Vergrößerung oder Verkleinerung eine gleichsinnige Veränderung des Schlussmaßes. Ist das Nennmaß N0 des Schlussmaßes bekannt und sind die Nennmaße Nj der Einzelmaße unbekannt, so ergibt sich für das j-te Nennmaß die Berechnungsformel 1 kj Nj = j −1 m ⎛ ⎞ N − ⎜ 0 ∑ kl N j − ∑ kl N j ⎟ ⎝ ⎠ l =1 l =1 wobei j = 1, …, m die Laufvariable und m die Anzahl der Einzelmaße ohne Schlussmaß ist. Sind die Toleranzmittenabmaße ECj der Einzelmaße gegeben und soll aus denen das Toleranzmittenabmaß EC0 des Schlussmaßes berechnet werden, so ist unter Beachtung aller e Spiel- und Übergangspassungen die funktionell mindestens erforderliche Spiel- und Übergangspassung m−e ∑ EC0 = j =1 k j ECj − 1 m ∑ Skj , 2 j = m − e −1 zu berechnen. Toleranzketten Sind die Einzeltoleranzen Tj, j = 1, …, m der Einzelmaße und die Kleinstwerte der Spiel- und Übergangspassungen gegeben, so beträgt die Schlusstoleranz T0 des Schlussmaßes T0 = m −e m j =1 j = m − e −1 ∑ Tj + ∑ Skj , wobei e die Anzahl der Spiel- und Übergangspassungen ist. Skj bezeichnet das Kleinstspiel des Maßes j. Die Einzeltoleranz Tj des j-ten Einzelmaßes resultiert aus j −1 m −e m l =1 l = j +1 j = m − e +1 Tj = T0 − ∑ Tl − ∑ Tl − ∑ Skj Dieser Ausdruck ist für m > 1, e > 1 unbestimmt. Daher wird zunächst für jedes Einzelmaß eine durchschnittliche Einzeltoleranz T = 1 ⎛ ⎜T0 − m−e⎝ ⎞ Skj ⎟ ⎠ j = m − e −1 m ∑ berechnet. Anschließend werden auf dieser Grundlage die Einzeltoleranzen berechnet. 1316han05.indd 213 25.07.2006 11:39:12 214 5 Qualität in der Fertigung Beispiel 5.3.1: Einfaches Getriebe. Maßketten Ein einfaches Getriebe wird durch die folgende Skizze beschrieben. M5 M1 M2 M4 M3 M0 Abb. 5.3.1: Schematische Darstellung des einfachen Getriebes Die Maßkette für das einfache Getriebe besteht aus 6 Gliedern, die sich aus m = 5 Einzelmaßen und dem Schlussmaß zusammensetzt. Der Konstrukteur gab die Nennmaße Nj, j = 1, …, 5 für die einzelnen Glieder vor. Die Richtungskoeffizienten resultieren aus dem Verlauf der Maßkette und sind k1 = +1, k2 = +1, k3 = –1, k4 = –1, k5 = –1 und k0 = –1. Die Werte für die Nennmaße Nj, Toleranzen Tj, Richtungskoeffizienten kj, Toleranzmittenabmaße ECj und der Einzelmaße Mj sind aus der folgenden Wertetabelle zu entnehmen. Tabelle 5.3.1: Wertetabelle für die Tolerierung in [mm] j Nj 0 0 Tj kj 0,15 –1 ECj 0,105 Mj 0 + Tj, – Tj oder ±Tj 0,18 0,03 1 25 0,033 1 0,035 25 0,0515 0,0185 2 40 0,04 1 0,04 40 0,06 0,02 3 4 2,5 60 0,015 –1 0,047 –1 0 –0,03 2,5 60 ±5700,0 –0,0065 –0,0535 5 1316han05.indd 214 2,5 0,015 –1 0 2,5 ±5700,0 25.07.2006 11:39:13 5.3 Vergleich verschiedener Tolerierungsverfahren 215 Die Mj bedeuten hierbei ⎧⎪ ECj + 0.5 Tj Mj = Nj + ⎨ . ⎪⎩ ECj − 0.5 Tj Das Nennmaß des Schlussgliedes ist N0 = 25 + 40 –2.5 – 60 – 2.5 = 0 [mm]. Die Summe der Einzeltoleranzen Tj ergibt die Schlusstoleranz T0 = 0.033 + 0.04 + 0.015 + 0.047 + 0.015 = 0.15 [mm]. Um den freien Lauf der Getriebewelle im Gehäuse zu gewährleisten, soll das untere Abmaß mindestens eju0 = 0.03 [mm] betragen. Das Toleranzmittenabmaß des Schlussmaßes muss dann mindestens EC0 = eju + 0.5 T0 = (0.03 + 0.075) [mm] = 0.105 [mm] sein. Das Toleranzmittenabmaß des Schlussmaßes ist EC0 = k1 EC1 + k2 EC2 +k4 EC4 = (+1) 0.035 + (+1) 0.04 + (–1) – 0.03 = 0.105 [mm]. Mit der Schlusstoleranz T0 0.15 [mm] und dem Toleranzmittenabmaß EC0 lassen sich schließlich die oberen und unteren Abmaße eso0 = 0.18 [mm] und esu0 = 0.03 [mm]berechnen. Das axiale größte Spiel beträgt Sg = 180 [µm] und das axiale kleinste Spiel Sk = 30 [µm]. Warum habe ich bisher die technische Tolerierung nicht verstanden? Warum fiel es mir schwer, diese Art der Tolerierung zu verallgemeinern? Weil: • drei- oder zweidimensionale Gebilde der Einfachheit wegen auf den R1 (den eindimensionalen Vektorraum) reduziert wurden, obwohl das nicht unbedingt einzusehen ist und • daher die Metrik nicht verallgemeinerungsfähig ist. 5.3.3 Verallgemeinerung der Tolerierung Für die Verallgemeinerung der Tolerierung wird der reelle Vektorraum benötigt, um z. B. dreidimensionale Gebilde auch dreidimensional behandeln zu können. Ein Getriebe z. B. ist nun einmal ein dreidimensionales Gebilde. Die Reduktion der Dimension des Raumes auf die Ebene oder wie bei der Tolerierung durch Maß- und Toleranzketten auf den R1 hat offensichtlich nur den Zweck der Vereinfachung. Der reelle Vektorraum Für die Definition von Vektoren benötigt man den Vektorraum. Wir wollen hier den dreidimensionalen realen physikalischen Anschauungsraum R3, indem wir alle uns befinden, betrachten. Ein Element dieses Raumes, ein Punkt in diesem Raum wird durch ein dreier- Tupel (x1, x2, x3) reeller Zahlen charakterisiert. Mit diesen reellen Zahlen kann man rechnen. Sind (x1, x2, x3) und (y1, y2, y3) solche drei-Tupel reeller Zahlen, so werde deren Summe durch (x1, x2, x3) + (y1, y2, y3) = (x1 + y1, x2 + y2, x3 + y3) erklärt. Die Summe ist wieder ein drei-Tupel reeller Zahlen. Ist λ ∈ R1 und (x1, x2, x3) ∈ R3, so ist λ (x1, x2, x3) = (λ x1, λ x2, λ x3) ∈ R3. Da die Rechenoperationen dadurch entstanden sind, dass einfach die Operationen des Rechnens mit reellen Zahlen auf die Komponenten (x1, x2, x3) des R3 übertragen wurden, so übertragen sich auch deren Rechenregeln. Wählt man einen Punkt 0 zum Nullpunkt, so kann man alle 1316han05.indd 215 25.07.2006 11:39:13 216 5 Qualität in der Fertigung Punkte als Ortsvektoren bezüglich null auffassen, kann sie mit reellen Zahlen multiplizieren und wie im Kräfteparallelogramm addieren. Dadurch erhält man einen Vektorraum. Definition: Ein Tripel (V, +, ⋅) bestehend aus einer Menge V, einer Addition und einer Multiplikation heißt ein reeller Vektorraum. Die Physiker verstehen unter Vektoren etwas anderes als die Mathematiker. Daher soll der Gesichtspunkt der Physiker in den Blickpunkt gerückt werden, denn die Tolerierung fällt im weitesten Sinne in das Gebiet der Physiker. Nach diesem Gesichtspunkt werden Vektoren durch ihre Größe (quantity), Richtung (direction) und ihren Betragt (magnitude) erklärt. Der Betrag eines Vektors, die Norm z. B. aus dem R3 wird durch x = x12 + x22 + x32 definiert. (Das ist der Satz des Pythagoras.) Für zwei Vektoren x1, x2 ∈ R3 nennt man die Zahl 〈x1, x2〉 = x11 x21 + x12 x22 + x31 x23 das Skalarprodukt von x1 und x2. Einen reellen Vektorraum mit einem Skalarprodukt nennt man einen euklidischen Vektorraum. Der Winkel zwischen den beiden Vektoren x1 und x2 wird durch α (x1 , x2 ) = arccos x1 , x2 x1 x2 für x1 ≠ 0 und x2 ≠ 0 , berechnet. Mit dieser Definition kann die Orthogonalität zwischen Vektoren definiert werden. Ein r-Tupel von Vektoren (x1, …, xr) ∈ Rn heißt orthogonal, wenn x j = 1, j = 1, … r und 〈xj, xk〉 = δjk. Beispiel 5.3.2: Einfaches Getriebe. Ortsvektoren Wir betrachten wieder das Getriebebeispiel. Es wird das Koordinatensystem x1, x2 eingeführt und als Benchmark für alle Punkte betrachten wir die beiden Ortsvektoren, die wir mit m1 und m2 bezeichnen. x2 M5 M1 M2 m2 m1 M6 M4 x1 0 M3 M0 Abb. 5.3.2: Getriebe mit zwei Ortsvektoren anstelle der üblichen Bemaßung 1316han05.indd 216 25.07.2006 11:39:13 5.3 Vergleich verschiedener Tolerierungsverfahren 217 Ortsvektoren ordnen jedem Punkt Mj der Ebene (des Raumes) die Verschiebung mj = Mj – 0, j = 1, …, n zu. Aus der Abbildung und der Wertetabelle kann man ablesen, das z. B. m1 = (M2, M6)T = (40, 40)T m2 = (M3, M6)T = (65, 40)T. Damit erhalten wir ⎛ 65 ⎞ ⎛ 40 ⎞ ⎛ 25 ⎞ m2 − m1 = ⎜ ⎟ − ⎜ ⎟ = ⎜ ⎟ ⎝ 40 ⎠ ⎝ 40 ⎠ ⎝ 0 ⎠ Auf diese Art kann man alle Punkte einer Abbildung (einer Ebene oder eines Raumes) als Ortsvektoren darstellen und die Abstände durch Bildung der Differenzen von Vektoren ermitteln. Ein weiterer wesentlicher Begriff ist die Linearkombination von Vektoren. Sind x1, …, xr Vektoren aus dem n-dimensionalen Euklidischen Vektorraum Rn, dann nennt man λ1 x1 + … + λr xr = y eine Linearkombination, wobei λj ∈ R1 . Die Menge aller Linearkombinationen heißt lineare Hülle des r-Tupels von Vektoren. Ein r-Tupel x1, …, xr von Vektoren aus dem Euklidischen Vektorraum heißt linear abhängig, wenn einer dieser Vektoren aus den anderen linear kombiniert werden kann. Diesen linear kombinierten Vektor kann man dann ohne Schaden für die lineare Hülle weglassen. Mit dieser Definition kann man natürlich auch die lineare Unabhängigkeit definieren. V sei wieder ein Vektorraum, x1, …, xr ∈ V. Dieses r-Tupel heißt linear unabhängig, wenn eine Linearkombination von x1, …, xr nur dann null sein kann, wenn alle Koeffizienten verschwinden, d. h. wenn aus λ1 x1 + … + λr xr = 0 stets folgt, dass λ1 = … = λr = 0. Man kann auch sagen, (x1, …, xr) ist genau dann linear unabhängig, wenn keiner dieser Vektoren Linearkombination der übrigen ist. Sei jetzt y = λ1 x1 + … + λn xn eine Linearkombination von n Vektoren aus dem Euklidischen Vektorraum. Damit bilden wir das Skalarprodukt mit dem Vektor x, d. h. ⎛ y1 ⎞ x , y = (x1 … xn ) ⎜ … ⎟ = a1 x1 x1 + … + an xn xn = ⎜ ⎟ ⎝ yn ⎠ n ∑ aj x j x j j =1 ⎛ a1 … 0 ⎞ ⎛ x1 ⎞ = (x1 … xn ) ⎜ 0 … 0 ⎟ ⎜ … ⎟ . ⎜ ⎟⎜ ⎟ ⎝ 0 … an ⎠ ⎝ xn ⎠ Eine solche Form nennt man quadratische Form und schreibt abkürzend dafür xT A x = QA(x). 1316han05.indd 217 25.07.2006 11:39:14 218 5 Qualität in der Fertigung Beispiel 5.3.3: Quadratische Form Betrachten wir (x1, x2) ∈ R2, Fall 1: ⎛1 0⎞ A=⎜ , dann ist die quadratische Form ⎝ 0 1 ⎟⎠ ⎛ 1 0 ⎞ ⎛ x1 ⎞ ⎛ x1 ⎞ Q A (x) = (x1 x2 ) ⎜ = (x1 x2 ) ⎜ ⎟ = x12 + x22 . ⎟ ⎜ ⎟ ⎝ 0 1 ⎠ ⎝ x2 ⎠ ⎝ x2 ⎠ In diesem Falle gilt Q A (x) = x . Betrachten wir den konkreten Vektor xT = (x1, x2) = (0.8, 0.3), dann gilt ⎛ 1 0 ⎞ ⎛ 0.8 ⎞ (0.8 0.3) ⎜ = 0.73 und 0.73 = 0.854. ⎝ 0 1 ⎟⎠ ⎜⎝ 0.3 ⎟⎠ Fall 2: ⎛1 c ⎞ Es sei A = ⎜ , c ≤ 1 , so dass A positiv definit ist. In diesem Fall gilt ⎝ c 1 ⎟⎠ ⎛ 1 c ⎞ ⎛ x1 ⎞ ⎛ x1 ⎞ = (x1 + c x2 c x1 + x2 ) ⎜ ⎟ Q A (x) = (x1 x2 ) ⎜ ⎟ ⎜ ⎟ ⎝ c 1 ⎠ ⎝ x2 ⎠ ⎝ x2 ⎠ = x12 + 2 c x1 x2 + x22 . Hieraus folgt x12 + 2 c x1 x2 + x22 ist die Länge des Vektors x, wenn die Komponenten von x nicht linear unabhängig voneinander sind. Betrachten wir anstelle der Einheitsmatrix die positiv definite Matrix ⎛ 1 0.6 ⎞ A=⎜ ⎝ 0.6 1 ⎟⎠ dann erhält man für die quadratische Form ⎛ 1 0.6 ⎞ ⎛ 0.8 ⎞ ⎛ 0.8 ⎞ (0.8 0.3) ⎜ = (0.8 + 0.18 0.18 + 0.3) ⎜ ⎟ ⎝ 0.6 1 ⎟⎠ ⎜⎝ 0.3 ⎟⎠ ⎝ 0.3 ⎠ = 0.928 und 0.928 = 0.9633. Die beiden Längen des Vektors x sind je nachdem, ob die Matrix eine Diagonal- oder vollständige Matrix ist, verschieden. Erinnern wir uns daran, dass bei der Konstruktion von Produkten, insbesondere Montageprodukten, Toleranzketten verwendet werden können, diese aber nicht auf alle Produkte, z. B. chemische Produkte und die Fertigung übertragen werden können, dann sind weitere Verallgemeinerungen notwendig. 1316han05.indd 218 25.07.2006 11:39:14 219 5.3 Vergleich verschiedener Tolerierungsverfahren Insbesondere nach der Herstellung der Produkte können die Messwerte für die verschiedenen Produktvariablen nicht mehr als beliebige reelle Zahlen, sondern müssen als Realisierungen von Zufallsgrößen angesehen werden. 5.3.3.1 Statistische Tolerierung Der Ausgangspunkt bei dieser Art der Tolerierung ist, dass die Einzelmaße Y1, …, Ym unabhängig und identisch nach Fj(yj) j = 1, …, m verteilt sind. Die Toleranzen To,j und Tu,j, j = 1, …, m sind entweder unbekannt oder sollen mit den Maßen, an gefertigten Produkten gemessen, überprüft werden. Sind die Zufallsgrößen außerdem normal verteilt mit den Erwartungswerten µj und σj2, dann gilt, die Summenvariable Y = m ∑ Yj j =1 ist normal verteilt mit den beiden Momenten μ= m ∑ j =1 μ j und σ 2 = m ∑ σ2j . j =1 Sind die Einzelmaße nicht normal verteilt, dann folgt aus dem zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung, dass die Summenvariable approximativ normal verteilt ist, ebenfalls mit den Summenmomenten. Nach der 3 σ-Regel liegen mit der Wahrscheinlichkeit 1 – α = 1 – 0.0027 = 0.9973 fast alle Realisierungen einer normal verteilten Zufallsgröße im Intervall µ ± 3 σ. Hieraus folgt die Toleranzbreite To – Tu sollte 6 σ sein. Die Toleranzkette kann unter diesen Voraussetzungen nach der Formel m T = 6 ∑ Sj j =1 berechnet werden, wobei die Sj die Stichprobenstandardabweichungen für die Einzelmaße Mj, j = 1, …, m sind. Beispiel 5.3.4: Einfaches Getriebe. Tolerierung Fall 1: Wir nehmen an, dass Y1, …, Y6 unabhängig voneinander sind. An N Getrieben wurden die obigen Maße gemessen. Die statistischen Maßzahlen sind Tabelle 5.3.2: Statistische Maßzahlen für die Maße des Getriebes Y0 Y1 Y2 Y3 Y4 Y5 –6,6976445 2498,2527947 3998,0283577 249,3489343 5997,5019191 249,4489296 Mean: 0,1312104 2499,9594152 4000,0388603 250,0179791 5999,9552836 249,9896311 Max: 6,3486367 2501,4088584 4002,4427941 250,5956959 6001,6589824 250,5393647 Std.Dev.: 2,3978975 Min: 0,6064117 0,7160356 0,2388075 0,7569649 0,2253856 Die Korrelationsmatrix zur Überprüfung der Voraussetzung der Unabhängigkeit ist in der Tabelle 5.3.3 zusammengestellt. 1316han05.indd 219 25.07.2006 11:39:14 220 5 Qualität in der Fertigung Tabelle 5.3.3: Korrelationsmatrix für die 6 Maße des Getriebes Y0 Y0 Y1 1 Y2 0,1388 1 Y1 Y3 Y4 Y5 0,0211 0,005 –0,0144 –0,0351 –0,1343 –0,065 –0,0746 0,028 0,1598 –0,0264 –0,0264 –0,0899 1 Y2 0,0246 Y3 1 1 Y4 0,0213 1 Y5 Die Korrelationskoeffizienten für alle Paare von Maßen sind sehr klein. Das globale Maß für die Korreliertheit ist det (R) = 0.9150239. Die univariate statistische Tolerierung kann angewandt werden. Wir erhalten die Toleranzgrenzen in der Tabelle 5.3.4. Tabelle 5.3.4: Toleranzgrenzen nach der univariaten statistischen Tolerierung Variable Mittelwert 6* Stabw. Zielwert Toleranzgrenze untere Y0 0,1312 obere 14,3874 0 Y1 2499,95 3,6385 2500 2497,35 2502,65 Y2 4000,04 4,2962 4000 3996,86 4003,14 Y3 250,02 1,4328 250 248,94 251,06 Y4 5999,95 4,5418 6000 5996,67 6003,33 1,3523 250 249,9896 Y5 –10,6188 248,996 10,6188 251,004 Für das Schließmaß T0 erhalten wir nach der obigen Formel (6* Sigma) T0 = 3.6385 + 4.2962 + 1.4328 + 4.5418 + 1.3523 = 15.2616, d. h. in etwa den mit CAD geplanten Wert von 15, bzw. nach Division durch 100 den Wert T0 = 0.1526. Die Vergleiche der uni- und multivariaten statistischen und CAD Tolerierung sind in der Tabelle 5.3.5 enthalten. Der Einfachheit halber wurden in diese Tabelle nur die Toleranzbreiten (nach Division durch 100) aufgenommen. Tabelle 5.3.5: Vergleich der der statistischen Toleranzbreiten und der CAD Toleranzbreiten Maß 1316han05.indd 220 Statistische Tolerierung CAD Toleranzen univariat multivariat 6* sj To – Tu To – Tu Y0 0,1438 0,2123 0,15 Y1 0,0364 0,053 0,033 Y2 0,0429 0,0627 0,04 Y3 0,0143 0,0212 0,015 Y4 0,0454 0,0665 0,047 25.07.2006 11:39:15 221 5.3 Vergleich verschiedener Tolerierungsverfahren Die Unterschiede resultieren aus den Standardabweichungen, die z. T. doch etwas größer sind als (To – Tu)/6 und den doch vorhandenen, wenn auch kleinen Korrelationskoeffizienten. Fall 2: Korrelierter Fall Für den korrelierten Fall erhalten wir die statistischen Maßzahlen der Tabelle: Tabelle 5.3.6: Statistische Maßzahlen für die Maße des Getriebes Y0 Y1 Y2 Y3 Y4 Y5 Min: –6,5002924 2498,1719699 3998,1664578 249,402514 5998,1848565 249,3888472 Mean: –0,1628116 2499,9900478 3999,9855229 249,989664 5999,9347344 250,0006535 Max: 6,0165154 2501,5162199 4001,8814676 250,525068 6002,2974761 250,6449878 Std.Dev.: 2,3576676 0,5884604 0,6832856 0,240879 0,8346444 0,2479773 Die statistischen Maßzahlen unterscheiden sich nicht wesentlich von denen des Falles 1. In der Tabelle 5.3.7 steht die Korrelationsmatrix. Tabelle 5.3.7: Korrelationsmatrix Y0 Y0 Y1 Y2 1 0,4212 0,3697 1 Y1 Y4 Y5 0,856 0,5342 0,7047 0,1977 0,3841 0,2669 0,0732 1 0,1893 0,1479 0,2386 1 0,3767 0,5799 1 0,1817 Y2 Y3 Y3 Y4 Y5 1 Die Korrelationsmatrix zeigt einige sehr große Korrelationskoeffizienten. Die Annahme der Unabhängigkeit ist nicht mehr gerechtfertigt. Das globale Maß der Korreliertheit ist det(R) = 0.04598723. Die statistische Tolerierung liefert die Werte der Tabelle 5.3.8. Tabelle 5.3.8: Uni- und multivariate statistische Toleranzen Variable Mittelwert Stabw. Zielwert Toleranzgrenzen untere Y0 1316han05.indd 221 –0,1628 14,146 obere 0 –3,522 3,522 Y1 2499,99 3,5308 2500 2497,766 2502,234 Y2 3999,986 4,0997 4000 3997,293 4002,707 Y3 249,9897 1,4453 250 Y4 5999,9347 5,0079 6000 Y5 250,0007 1,4879 250 249,4806 5997,117 249,3086 250,5194 6002,883 250,6914 25.07.2006 11:39:15 222 5 Qualität in der Fertigung Tabelle 5.3.9: Vergleich der statistischen und CAD Toleranzbreiten Maß Statistische Tolerierung CAD Toleranzen univariat multivariat 6* sj To – Tu To – Tu Y0 0,1415 0,0704 0,15 Y1 0,0353 0,0447 0,033 Y2 0,04099 0,0541 0,04 Y3 0,0144 0,0103 0,015 Y4 0,05 0,0577 0,047 Y5 0,0149 0,0138 0,015 Die univariate statistische Toleranzkettenformel liefert für die Schließtoleranz den Wert T0 = 0.1556. Die multivariate statistische Tolerierung liefert im korrelierten Fall schmalere Toleranzbreiten für die Einzelmaße. Die 6* S Toleranzen sind wiederum ähnlich denen im unkorrelierten Fall. Das ist nicht verwunderlich, wirken sich doch in der Regel die korrelativen Abhängigkeiten nicht auf die Standardabweichungen der Einzelmaße aus. Die multiplen Korrelationskoeffizienten für die Einzelmaße sind: R20/1,2,3,4,5 = 0.8888, R21/0,2,3,4,5 = 0.28132, R22/0,1,3,4,5 = 0.21746, R23/0,1,2,4,5 = 0.76823, R24/0,1,2,3,5 = 0.40528 und R25/0,1,2,3,4 = 0.61256. Aus diesen Korrelationskoeffizienten liest man ab, dass sich das Schließmaß T0 am besten aus den anderen Maßen ableiten lässt, oder anders gesprochen, die anderen Maße haben einen großen Einfluss auf das Schließmaß. Folglich ist die Differenz zwischen der uni- und multivariaten Berechnung für dieses Maß am größten. 5.3.3.2 Übung Ein Produkt wird durch m nicht unabhängige Produktvariable Y1, …, Ym beschrieben. Der Vektor der Produktvariable YT = (Y1, …, Ym) ist ein zufälliger Vektor. Die Verteilung des zufälligen Vektors Y gehöre zur Klasse der m-dimensionalen Normalverteilungen Y ~ Nm (µ, ΣYY), wobei ΣYY positiv definit sein möge. Das von Ihnen zu untersuchende Produkt ist ein Tippgeber, der in automatischen Schaltgetrieben benötigt wird. Tabelle 5.3.10: Sollzustand für den Tippgeber 1316han05.indd 222 Variable Sollwert Toleranzgrenzen Y1 14,23 ±0,05 Y2 6,45 ±0,05 Y3 0,55 ±0,15 Y4 0,55 ±0,15 Y5 2,25 ±0,15 Y6 2,25 ±0,15 25.07.2006 11:39:15 5.3 Vergleich verschiedener Tolerierungsverfahren 223 Diese müssen verschiedene Funktionen, wie z. B. die automatische Rückstellung in die „=“ Position, geräuscharmes Schalten usw. realisieren. Die Tippgeber werden durch sechs Produktvariablen charakterisiert. Der Sollzustand wird durch die Werte der Tabelle 5.3.10 beschrieben. Problem Der Kunde ist mit der Qualität der Tippgeber nicht zufrieden. Was müssen Sie tun? Sie müssen das Problem definieren. Wie definieren Sie das Problem? Dazu müssen Sie eine Stichprobe von Tippgebern zufällig der Fertigung entnehmen und die Werte für die Produktvariablen messen. Die Werte für den Tippgeber sind in der Datei Ü5.3 enthalten. Für Sie habe ich die Daten dieser Datei als Star Plots visualisiert (siehe auch Seite 282). 46 40 30 20 10 1 Abb. 5.3.3: Star Plots für die Tippgeber 1316han05.indd 223 25.07.2006 11:39:15 224 5 Qualität in der Fertigung Y3 . Y2 Y4 Y1 Y5 Y6 Abb. 5.3.4: Schlüssel für die Star Plots der Tippgeber In der Abbildung 5.3.5 habe ich für Sie noch die Korrelationsdiagramme dargestellt. Y2 Y3 Y4 Y5 Y6 Y1 Y2 Y3 Y4 Y5 Abb. 5.3.5: Korrelationsdiagramme für die Tippgeber Welche Schlüsse ziehen Sie aus den beiden Abbildungen? Definieren Sie bitte das Problem und überprüfen Sie die gegebene Tolerierung mit den beigefügten Programmen. Was müssen Sie tun, um das Problem zu lösen? 5.4 Warum sollen Sie die Prozessdarstellung wählen? Sie haben anerkannt, dass jede Tätigkeit und jedes (materielle und/oder immaterielle) Produkt das Ergebnis eines Prozesses ist. Jetzt müssen Sie mir weiter folgen und den zugehörigen Prozess strukturieren. Die Produktvariablen sind Funktionen der Input-, Prozess- und Störvariablen und können nach dem Ursache-Wirkungs-Prinzip nur über diese Variablen verändert werden. 1316han05.indd 224 25.07.2006 11:39:15 5.4 Warum sollen Sie die Prozessdarstellung wählen? 225 äußere Variable (Störvariable) Inputs Prozess Inputvariable Prozessvariable Ursachen Produkt Produktvariable Wirkungen Abb. 5.4.1: Prozessdarstellung Die Inputvariablen, wie Material, Maschinen, Anlagen, Zusatzstoffe und auch die Fähigkeiten der Mitarbeiter fließen mit ihren Eigenschaften in den Prozess hinein. Die Produktvariablen müssen die spezifizierten Kundenanforderungen erfüllen. Über die Veränderung der Prozessvariablen muss aus den gegebenen Inputvariablen das Produkt mit seinen geforderten Eigenschaften entstehen. Damit dieses spannende Zusammenspiel zwischen den Variablen klappt, müssen die Inputvariablen, die ja Produktvariablen von Vorläuferprozessen sind, ebenfalls die spezifizierten Anforderungen des Prozesses erfüllen. Die spezifizierten Anforderungen kann man beim Eintreffen der Inputs überprüfen (Wareneingangsprüfung) oder man vereinbart in einem Dialog mit den Lieferanten, dass die Inputs mit ihren entsprechenden uni- und multivariaten Fähigkeitsnachweisen geliefert werden. Die Werte für die Prozessvariablen kann man auch nicht beliebig einstellen, da auf dieser Basis bestimmt nicht das Produkt mit den geforderten Eigenschaften entsteht. Der Prozess muss mit einer Prozessgleichung so gesteuert werden, dass bei Kenntnis der Inputvariablen das geforderte Produkt herauskommt. Beispiel 5.4.1: Drehen einer Welle. Prozessdarstellung Aus einem Rundstahl soll eine Welle gedreht werden. Die Welle soll Kundenanforderungen erfüllen. Zu diesen gehören die Maßhaltigkeit, die Rundheit, die Konizität und gewisse Festigkeitseigenschaften. Die Inputs sind der Rundstahlrohling, die Eigenschaften der Drehmaschine, der Kühlmittelstand usw. Zu den Prozessvariablen zählen die Drehgeschwindigkeit, die Kühlmitteltemperatur, die Standzeit der Schneidwerkzeuge usw. Die Menge der Produktvariablen umfasst die Maßhaltigkeit, die Rundheit der Welle, d. h. die Differenz zweier Durchmesser vorn und hinten an der Welle gemessen usw. Die Prozessdarstellung ist in der Abbildung 5.4.2 enthalten. Fordert der Kunde vom Lieferanten (Dreherei) eine Welle z. B. mit einem spezifizierten Elastizitätsmodul [N/m2], so muss der Wellenhersteller bei seinem Lieferanten für die Rohlinge diese Eigenschaft anfordern, denn beim Drehen wird der Elastizitätsmodul kaum verändert. 1316han05.indd 225 25.07.2006 11:39:15 226 5 Qualität in der Fertigung äußere Variable (Störvariable) Rundstahl, Kühlflüssigkeit, Schneidwerkzeug, .. Inputvariable Rundheit Konizität Stahleigenschaften Ursachen Drehen einer Welle Prozessvariable Drehgeschwindigkeit Standzeit Temp. Kühlflüssigkeit Temp. Werkzeug Stand der Kühlflüssigkeit, .. ... Welle Produktvariable Rundheit Konizität Maßhaltigkeit Wirkungen Abb. 5.4.2: Drehen einer Welle Dieses Beispiel zeigt schon, dass zwischen den Kunden und Lieferanten ein Dialog stattfinden muss. Wie kann man den Dialog zwischen Kunden und Lieferanten führen? Bevor wir diesen Dialog aufbauen, wollen wir ein Netzwerk von Prozessen betrachten. 5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk von Dienstleistungs- und Fertigungsprozessen darstellen? Ein Unternehmen muss durch Fertigungs- und Dienstleistungsprozesse strukturiert werden. Ziele der Steuerung und Regelung des gesamten Unternehmens sind Erfüllung aller (Markt-) Kundenanforderungen, Erwirtschaftung der notwendigen Gelder zur erweiterten Reproduktion, das Bestehen im internationalen Wettbewerb, die Steigerung der betriebswirtschaftlichen Kennziffern und damit die Existenzsicherung. Die Strukturierung dient ebenfalls der Veränderung der Organisationsstruktur, nach der die Aufgaben und Verantwortlichkeiten eindeutig festlegt und die Mitarbeiter dadurch motiviert werden, an der Realisierung der betrieblichen Ziele mitzuwirken. Nicht zuletzt ist die Strukturierung auch die Grundlage für eine verbesserte Kostenrechnung auf der Basis des notwendigen Verbrauchs an allen Ressourcen, die z. B. gewährleistet, dass die stetig steigenden, nicht aufschlüsselbaren Gemeinkostenzuschläge der Vergangenheit angehören werden. 1316han05.indd 226 25.07.2006 11:39:15 5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk darstellen? 227 Wir betrachten zunächst zwei Prozesse, um daran die Vernetzung zu demonstrieren. Diese beiden Prozesse mögen einfach A und B heißen. Der eine Prozess, nehmen wir an, es sei der Prozess B, soll der Vorläufer- oder Lieferantenprozess vom Prozess A sein. Der Prozess A verarbeitet die Produkte von Prozess B, d. h. die Produkte B werden zu Inputs von A. Der Prozess A ist damit der Kundenprozess von B. Folglich muss A formulieren, was er von B verlangt. A muss also sein (Kunden-) Anforderungsprofil an B formulieren. B muss die Kundenanforderungen durch Sollwerte und Toleranzgrenzen für alle Produktvariablen des Produktes B spezifizieren. B muss dann seinen Prozess mit den Sollwerten für alle relevanten Produktvariablen als Zielwerte so steuern und regeln, dass alle Anforderungen erfüllt werden. B muss außerdem den Nachweis führen, dass die in B produzierten Produkte alle Kundenanforderungen erfüllen. Die Produkte von A werden von einem weiteren (externen oder internen) Kunden benötigt. Dieser Kunde stellt natürlich seine Anforderungen an die Produkte von A. Hieraus wird deutlich, dass jeder Prozess Kunden- und Lieferantenprozess zugleich ist. Dieses Zusammenspiel ist in der Abbildung 5.5.1 schematisch dargestellt. Dieses Zusammenspiel zwischen zwei Prozessen ist in der Literatur unter dem Begriff „internes Kunden-Lieferanten-Verhältnis“ (KLV) bekannt geworden und charakterisiert in unserem Verständnis die Schnittstelle zwischen zwei Prozessen. In der Literatur wird das KLV nur beschrieben, es kommt aber darauf an, das KLV zu modellieren und zu realisieren. Anforderungen Inputs Inputvariable Prozess B Prozessvariable Produkt B Input für A Produktvariable Prozess A Prozessvariable Produkt A Produktvariable Nachweis der Erfüllung aller Anforderungen Vorläuferprozess = Lieferant Nachfolgerprozess = Kunde Abb. 5.5.1: Kunden-Lieferanten-Verhältnis Beispiel 5.5.1: Papierfeeder. Prozessnetzwerk Wir betrachten in der Abbildung 5.5.2 die Herstellung eines Papierfeeders als ein Netzwerk von Prozessen, in denen mechanische Teile, elektronische Komponenten und Kunststoffteile hergestellt werden. Das Netzwerk sieht recht einfach aus. Aber wir haben das Netzwerk ohne Kommunikation dargestellt. So kann das Netzwerk nicht funktionieren. 1316han05.indd 227 25.07.2006 11:39:16 228 5 Qualität in der Fertigung Input Inputvariable Input Kunststoffherst. Plastikteile Prozessvariable Produktvariable Metallherstellung . Inputvariable Input Prozessvariable Elektroteileherst . Inputvariable Prozessvariable Metallteile Produktvariable Montage Prozessvariable Feeder Funktionen Produktvariable Funktionen Par. Elektroteile Produktvariable Abb. 5.5.2: Netzwerk von Herstellungsprozessen 5.6 Kommunikation zwischen Prozessen Im Vorangegangenen haben wir alles Tun in einem Unternehmen durch Prozesse modelliert. Wie haben des weiteren gesehen, dass die Prozesse nicht unabhängig voneinander sind, schon allein deswegen, weil jeder Prozess Kunden- und Lieferantenprozess zugleich ist. Eine Kommunikation zwischen den Prozessen ist somit notwendig. Ohne diese beobachten wir das tägliche Chaos. Jede Kommunikation braucht eine Sprache. Die für die Kommunikation zwischen Prozessen benötigte Sprache haben wir schon bereit gestellt. Diese Sprache hat die Worte bzw. Phrasen (Teilsätze) oder Elemente • Zusammenstellung des externes und/oder internen Kundenanforderungsprofils (KAP), Parametrisierung der gewünschten Eigenschaften, • Datengewinnung für die Produktvariablen, • Spezifizierung des KAP durch Sollwerte und Toleranzgrenzen, mit der CAD oder statistischer Tolerierung, • Nachweis der simultanen Erfüllung aller (ex- oder internen) Kundenanforderungen mit uni- und multivariaten Prozessfähigkeitsindizes, • Treffen einer Entscheidung auf der Grundlage der uni- und multivariaten Prozessfähigkeitsindizes für die statistische Prozessanalyse, falls die Fähigkeiten kleines als 1 sind, – mit anschließender Prozessverbesserung durch die Steuerung der Prozesse mit der Prozessgleichung und den Sollwerten und Toleranzgrenzen als Zielwerte bzw. Zielgebiet, 1316han05.indd 228 25.07.2006 11:39:16 5.6 Kommunikation zwischen Prozessen 229 – Justierung der Prozesse, falls die einfachen uni- und multivariaten Prozessfähigkeitsindizes größer und die korrigierten Indizes kleines als 1 sind, • laufende Kontrolle der Prozesse mit den uni- und vor allem multivariaten Kontrollkarten, falls die einfachen und korrigierten Fähigkeiten größer als eins sind, • neue Tolerierung, falls die Abhängigkeiten zwischen den Produktvariablen bei der Tolerierung vernachlässigt wurden, • Investitionen, falls das vorherige Ausreizen aller Möglichkeiten nicht ausreichte, Produkte zu produzieren, die alle Kundenanforderungen erfüllen und trotz der vorgegebenen Marktpreise durch den Verkauf einen Gewinn erzielen. Wie man sehen kann, ist diese technische Sprache recht einfach. Die Schwierigkeit liegt in der Bereitstellung der Elemente, die für Sprache benötigt werden, wie der Definition des Problems, der Berechnung der Sollwerte und Toleranzgrenzen für alle, nicht unabhängigen Produktvariablen mit Hilfe CAD oder multivariaten statistischen Tolerierung, der Berechnung der uniund multivariaten Prozessfähigkeitsindizes, des Treffens einer Entscheidung, der Kontrolle der Prozesse mit uni- und multivariaten Kontrollkarten und der Datenerfassung. Diese Schwierigkeiten traten in der Vergangenheit auf, weil viele der genannten Elemente bisher, aus mir nicht bekannten Gründen, nicht zur Verfügung standen. Im Abschnitt 5.3. habe ich Ihnen die von mir entwickelten neuen Methoden für die Durchführung eines modernen Audits zur Definition eines Problems und Entscheidungsfindung zur Verfügung gestellt. Beispiel 5.6.1: Papierfeeder. Prozessnetzwerk mit Kommunikation Wir betrachten jetzt, nachdem wir die Elemente der technischen Sprache genannt und im Abschnitt 5.3 zur Verfügung gestellt haben, dasselbe Netzwerk mit Kommunikation in der Abbildung 5.6.1. KAP Input KAP Plastikteile Kunststoffherst. Inputvariable KAP Prozessvariable Produktvariable MCPK KAP Input Input KAP Metallteile Metallherstellg. KAP KAP MCPK Prozessvariable Produktvariable MCPK KAP Input KAP Elektroteileherst. Inputvariable Prozessvariable Montage KAP Feeder Funktionen Prozessvariable Produktvariable Funktionenvariable KAP Elektroteile MCPK Produktvariable MCPK Abb. 5.6.1: Netzwerk für die Feederherstellung mit Kommunikation 1316han05.indd 229 25.07.2006 11:39:16 230 5 Qualität in der Fertigung Die Abbildung zeigt, dass dieses Netzwerk mit Kommunikation auf den ersten Blick kompliziert aussieht. Aber die Kommunikation ist notwendig, um das tägliches Chaos zu ordnen, die Prozesse zu verbessern, Produkte mit geforderten Eigenschaften zu produzieren, die Qualität der Produkte nachzuweisen und zu quantifizieren. Es gilt die alte Weisheit: „… je flacher die Fertigungstiefe wird, desto intensiver muss die Kommunikation geführt werden …“. Die Antwort auf die Frage: „Wie wird in Ihrem Unternehmen die Kommunikation zwischen Prozessen geführt?“ wird entweder nicht verstanden oder aber lapidar damit beantwortet, dass man sagt, „… wir regeln die Angelegenheit mit unseren Lieferanten durch Lasten- oder Pflichtenhefte …“ Ich habe mir in vielen Unternehmen Lasten und/oder Pflichtenhefte angeschaut und daher die neuen Methoden entwickelt. 5.7 Was heißt Prozessverbesserung und was müssen Sie tun? Nach dem Entscheidungsgraphen in Abbildung 5.16 beim Produktaudit im Abschnitt 5.3 muss im Fall MCpk < 1 entschieden werden, dass der Prozess zu verbessern ist, denn der Prozess ist nicht fähig, Produkte (materielle oder immaterielle) mit geforderten Eigenschaften zu produzieren. Ausschuss ist die Folge und der kostet Geld. Außerdem führt er zur Nichteinhaltung der versprochenen Liefertermine. Die Ursachen hierfür können sein: • die Prozesse werden heuristisch ohne Zielwerte gesteuert, das Methodenniveau ist zu niedrig, • daher können die Streuungen der Produktvariablen zu groß sein oder • die Mittelwerte von den Sollwerten abweichen, • die Tolerierung wurde unter Missachtung der Abhängigkeiten zwischen den Produktvariablen vorgenommen und ist daher nicht korrekt, • die Anlagen und Maschinen sind zu alt und nicht mehr fähig, • die Mitarbeiter sind nicht genügend qualifiziert und vieles mehr. Gilt ebenfalls MCp < 1, dann bedeutet das, die Streuung mindestens einer Produktvariablen ist zu groß. Die Reduktion der Variabilität – man nennt diesen Sachverhalt schlicht Prozessverbesserung – mindestens einer Produktvariablen ist notwendig. Gilt MCp > 1 und MCpk < 1, dann ist das Streuverhalten der Produktvariablen in Ordnung, aber der Vektor der Mittelwerte weicht vom Vektor der Sollwerte an. Der Prozess ist zu justieren. Die verschiedenen Zielstellungen, die man aufgrund der Größen für die uni- und multivariaten Prozessfähigkeitsindizes zu verfolgen hat, sind unterschiedlich aufwendig und kosten daher unterschiedlich viel. Daher ist ja die Entscheidung für den einen oder anderen Weg so vorteilhaft für die Qualitätsverbesserungsprojekte. 1316han05.indd 230 25.07.2006 11:39:16 5.7 Was heißt Prozessverbesserung und was müssen Sie tun? 231 Beispiel 5.7.1: Chemischer Prozess. Prozessverbesserung Das Produkt eines chemischen Prozesses wird durch m = 6 Produktvariable erklärt, von denen die Variable Y1 den Anteil einer unerwünschten Substanz beschreibt, die für viel Geld aus dem Produkt herausgefiltert werden muss. Die Frage lautet, kann der Prozess so gesteuert werden, dass der Anteil der unerwünschte Substanz so klein wird, dass die unerwünschte Substanz dem Verbraucher keinen Schaden mehr zufügen kann? Die Ausgangssituation bzgl. der Produktvariablen Y1, d. h. der ungesteuerte Prozess und der verbesserte Prozess sind in Abbildung 5.7.1 und Abbildung 5.7.2 dargestellt. ungesteuerter Prozess Y Y 40 40 30 30 20 20 10 10 0 0 20 40 60 80 gesteuerter Prozess 100 t 0 0 20 40 60 80 100 t Abb. 5.7.1: Vergleich der Ergebnisse des ungesteuerten und gesteuerten Prozesses Beim heuristisch oder ungesteuerten Prozess sieht man, dass die unerwünschte Substanz mal häufiger und mal seltener vorkommt und ein Trend beobachtet wird. Daraus kann man aber bereits ableiten, dass zumindest ein Teil der Ursachen für das Vorkommen der unerwünschten Substanz im Prozess oder den Inputs liegt. Der gesteuerte Prozess zeigt, dass die unerwünschte Substanz durch die Steuerung des Prozesses mit einer Prozessgleichung nahezu vollständig vermieden werden kann. Genau das ist das zu erreichende Ziel, mit Hilfe der geistigen Investition, oder anders formuliert, der Anwendung multivariater statistischer Methoden, Prozesse wesentlich zu verbessern. Das spricht nicht gegen das hohe Expertenwissen der Mitarbeiter, die aufgrund ihrer Erfahrung das heutige hohe Niveau der „heuristischen“ Steuerung erreicht haben. Ich habe großen Respekt vor diesen Leistungen. Allerdings müssen wir uns heute dem Diktat der Globalisierung und des internationalen Marktes beugen und jeden möglichen Euro für die Sicherung der Existenz deutscher Unternehmen herausfiltern. Und das ist nur mit den modernen Methoden der multivariaten Statistik möglich. Die Verteilung der Produktvariablen Y1 (unerwünschtes Nebenprodukt) des ungesteuerten Prozesses lässt sich in der Abbildung 5.7.2, links, darstellen. Diese Abbildung repräsentiert die univariate Betrachtung. Es wird ausschließlich die Produktvariable Y1 betrachtet, ohne die anderen vorhandenen Informationen zu berücksichtigen. Können wir uns das noch leisten? Schon die linke Darstellung in Abbildung 5.7.2 zeigt, dass außer den Werten für die Produktvariable Y1 weitere Informationen in Form wenigstens einer Input- und/oder Prozessvariablen, hier mit t bezeichnet, vorliegt. Betrachten Sie nach dem Ursache-Wirkungs-Prinzip Y1 als Funktion von den Input- und Prozessvariablen, dann erhalten Sie als Ergebnis die 1316han05.indd 231 25.07.2006 11:39:16 232 5 Qualität in der Fertigung Prozessverbesserung Was müssen wir tun? Die Prozessgleichung berechnen und die Verteilung von Y1 um die Gleichung betrachten Ausgangssituation Was haben wir? Ohne die Anwendung der multivariaten statistischen Methoden eine breite Verteilung von Y1 Y Y Y 40 40 40 30 30 30 20 20 20 10 10 10 0 0 20 40 60 80 100 t 0 0 20 40 60 80 100 t 0 0 20 40 60 80 100 t Abb. 5.7.2: Schritte der Prozessverbesserung Prozessgleichung, die hier in der rechten Abbildung durch die Gerade markiert ist. Uns interessiert nun die Streuung der Werte von Y1 um die Prozessgleichung. Diese Verteilung ist auch im rechten Bild der Abbildung 5.7.2 zu sehen. Die Breite der Verteilung ist wesentlich kleiner als die Breite der Verteilung von Y1. Das ist nach der Shannon Theorie auf den Informationsgewinn durch die Betrachtung der zusätzlichen Variablen zurück zuführen. Die Verkleinerung der Breite der ursprünglichen Verteilung durch die Betrachtung zusätzlicher Variabler messen wir mit dem Maß der Beherrschbarkeit des Prozesses. Der Informationsgewinn ist aber bereits eine Prozessverbesserung ohne materielle Investitionen. Wir können die Prozessverbesserung steigern, indem wir den Prozess mit der Prozessgleichung steuern. Das Ergebnis ist das Bild 3 in der Abbildung 5.7.2. Die unerwünschte Substanz kommt kaum noch vor, die Verteilung der Messwerte für Y1 des gesteuerten Prozesses ist sehr schmal, d. h. deren Streuung ist sehr klein. 5.8 Wie können wir das Ergebnis erreichen? Der Prozess wurde eingeführt, da sich damit zeigen lässt, dass die Produktvariablen nach dem Ursache-Wirkungs-Prinzips nur verändert werden können, wenn sowohl die Input- als auch die Prozessvariablen verändert werden. Die Folge daraus ist, dass die Variation der Produktvariablen nur dann reduziert werden kann, wenn sowohl die Input- als auch die Prozessvariablen verändert werden. Nichts anderes tun die Prozessexperten aufgrund „ihrer“ Erfahrung. Wir müssen die Erfahrung durch Wissen ersetzen. Das können wir nur dann tun, wenn wir dem Prozess sein Wissen abluchsen. Dazu müssen wir mit den Prozessen kommunizieren und das ist nach dem Grundsatz des Galilei: „messe alles, und das nicht Messbare mache messbar“ nur über die Daten für alle Produkt-, Input-, Prozess- und Störvariablen möglich. Mit diesen Daten kann • die Abhängigkeitsstruktur zwischen den Input-, Prozess- und Produktvariablen quantifiziert und analysiert und • eine Prozessgleichung berechnet werden, die über die Input- und Prozessvariablen die Steuerung der Produktvariablen so ermöglicht, dass simultan alle Kundenanforderungen durch die produzierten Produkte erfüllt werden. 1316han05.indd 232 25.07.2006 11:39:17 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 233 An dieser Stelle sei noch einmal daran erinnert, dass wir mit dieser Methodik sowohl Herstellungs- als auch Dienstleistungsprozesse behandeln müssen, um betriebswirtschaftliche Verbesserungen zu erzielen. Die Verfahren der univariaten Statistik können dieses Anliegen nicht erfüllen. Daher ist die multivariate Statistik die geeignete Methodik. Multivariat heißt nichts anderes als mehrdimensional. Und mehrdimensional müssen die statistischen Methoden schon sein, denn es gibt ja im trivialsten Fall wenigstens eine Prozess- und eine Produktvariable. Für die Prozessverbesserung benötigt man multivariate statistische Methoden zur • Analyse der Abhängigkeitsstruktur, • Klassifikation einer heterogenen Stichprobe in homogene Teilstichproben, • Auswahl der wesentlichen Input- und Prozessvariablen und Berechnung der Prozessgleichung, • Optimierung und Steuerung des Prozesses, • Kontrolle des verbesserten Prozesses mit uni- und multivariaten Kontrollkarten. 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? Ein Prozess wird durch die Input-, Prozess-, noise- und Produktvariablen beschrieben. Diese Variablen werden in dem Vektor der Zufallsgrößen (Z1, …, Zl, X1, …, Xn, U1, …, Up, Y1, …, Ym)T = (ZT, XT, UT, YT)T zusammengefasst. Die Zufallsgrößen sind nicht unabhängig voneinander, sondern durch eine Abhängigkeitsstruktur miteinander verbunden. Das soll die Abbildung 5.9.1 verdeutlichen. Prozess Inputs X 1 X 2 X Produkt Y 1 Y 2 3 Abb. 5.9.1: Abhängigkeitsstruktur zwischen Input-, Prozess- und Produktvariablen 1316han05.indd 233 25.07.2006 11:39:17 234 5 Qualität in der Fertigung Der Einfachheit halber wurden die Input- und Prozessvariablen mit dem Buchstaben X bezeichnet. Diese Abbildung zeigt, dass selbst bei einer geringen Anzahl von Variablen die Abhängigkeitsstruktur schon recht kompliziert werden kann. Stellt man sich noch vor, dass die Abhängigkeiten sowohl positiv als auch negativ sein können, dann kann man sich vorstellen, dass selbst für die logische Analyse der kleiner Abhängigkeitsstrukturen der menschliche Verstand nicht mehr ausreicht und an dessen Stelle statistische Modelle eingesetzt werden müssen. Diese Abhängigkeitsstruktur muss quantifiziert werden. Dazu dienen die Korrelations-, die Hauptkomponenten- und Faktoranalysen. 5.9.1 Wie führt man eine Korrelationsanalyse (KA) durch und was besagen die Ergebnisse? Unter der Korrelationsanalyse verstehen wir die Berechnung der Abhängigkeiten • zwischen jeweils zwei Zufallsgrößen – in unserem Sprachgebrauch zwischen jeweils zwei (Input-, Prozess- und/oder Produkt-) Variablen mit dem einfachen Korrelationskoeffi⎛n + p + m ⎞ zienten. Die Berechnung der paarweisen Abhängigkeiten zwischen allen ⎜ ⎟⎠ 2 ⎝ Variablen liefert ebenso viele Korrelationskoeffizienten, die in der Korrelationsmatrix R zusammengefasst werden. • Häufig müssen Korrelationskoeffizienten zwischen jeweils zwei Zufallsgrößen unter der Bedingung, dass andere Zufallsgrößen konstant gehalten werden, berechnet werden. Diese Korrelationskoeffizienten heißen partielle Korrelationskoeffizienten. So wird häufig die Frage gestellt, wie ist die lineare Abhängigkeit zwischen zwei Prozessvariablen, wenn die Inputvariablen konstant gehalten werden müssen, oder anders formuliert, wenn die Werte für die Inputvariablen gegeben sind? Das bedeutet, es sind die Korrelationskoeffizienten für die Zufallsgrößen einer bedingten Verteilung, im vorliegenden Fall der bedingten Verteilung der Prozessvariablen unter der Bedingung der gegebenen Inputvariablen zu berechnen. • Zur Korrelationsanalyse zählen wir auch die Berechnung der Abhängigkeit einer Zufallsgröße, z. B. einer Produktvariablen Yj, j = 1, …, m von einer Linearkombination aller Input- und Prozessvariablen. Diese Korrelationskoeffizienten nennt man multiple Korrelationskoeffizienten und bezeichnet sie mit R2Y j / allen Input- und Prozessvariablen . • Außer diesen Abhängigkeiten ist häufig die Abhängigkeit zwischen einer Zufallsgröße, z. B. der Produktvariablen Y und einer Linearkombination der wesentlichen Prozessvariablen X unter der Bedingung der wesentlichen Inputvariablen Z zu quantifizieren. Ein solches Maß der Abhängigkeit nennt man partiell multipler Korrelationskoeffizient. • Da ein Produkt durch mehrere, z. B. m, m ≥ 1 Produktvariable beschrieben wird und die Kenntnis der Abhängigkeit der Gesamtheit der Produktvariablen von allen Input- und Prozessvariablen als verallgemeinertes Maß der Beherrschbarkeit eines Prozesses notwendig ist, wird auch der multivariate, multiple Korrelationskoeffizient berechnet. • Für weiterführende Analysen werden noch die multivariat partiell-multiplen und die multivariat semipartiell-multiplen Korrelationskoeffizienten eingeführt. Es versteht sich von selbst, dass die Analyse einer Abhängigkeitsstruktur mit der Berechnung der einfachen Korrelationskoeffizienten beginnt. 1316han05.indd 234 25.07.2006 11:39:17 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 235 Was sind einfache Korrelationskoeffizienten? Die einfachen Korrelationskoeffizienten messen die lineare Abhängigkeit zwischen zwei zufälligen Variablen. Beispiel 5.9.1: Bremsweg eines PKW. Korrelationskoeffizienten Fährt man mit einem PKW durch eine Stadt und muss vor einem auftretenden Hindernis plötzlich bremsen, dann können der Bremsweg und die gefahrene Geschwindigkeit gemessen werden. Für die Rekapitulation von Unfallgeschehen möchte die Polizei wissen, wie streng die Länge des Bremsweges von der gefahrenen Geschwindigkeit des PKW abhängt. Lässt man z. B. N PKW’s fahren, dann erhält man N Wertepaare. Die Wertepaare können als Punkte in einer Ebene gedeutet und aufgezeichnet werden. Für das Experiment erhält man die Abbildung 5.9.2. 51 46 Bremsweg 41 36 31 26 21 53 58 63 Geschwindigkeit 68 Abb. 5.9.2: Länge des Bremsweges in Abhängigkeit von der Geschwindigkeit Die Punktwolke der Wertepaare ergeben eine elliptisch umrissene Punktwolke. Intuitiv würde man sagen, der Zusammenhang zwischen der Geschwindigkeit und dem Bremsweg ist eng. Aber diese Aussage muss quantifiziert werden, denn eine qualitative Einschätzung sagt sehr wenig aus und man kann nicht für alle möglichen Abhängigkeiten erst eine Abbildung zeichnen und dann eine subjektive Einschätzung vornehmen. Der berechnete Korrelationskoeffizient rBremweg, Geschwindigkeit = 0.88. Was besagt dieser Koeffizient und wie kann man den Korrelationskoeffizienten berechnen? Der Korrelationskoeffizient ist eine dimensionslose Zahl, die zwischen –1 und +1 liegt. Ist der Korrelationskoeffizient groß gegen 1, dann nähert sich das Aussehen der Punktwolke immer stärker dem Aussehen einer Zigarre an, d. h. die eine Hauptachse der Ellipse wird immer länger, die andere immer kürzer. Ist der Korrelationskoeffizient gleich 1, dann wird aus der Ellipse eine Gerade. Der Anstieg der Gerade kann positiv oder negativ sein. Entsprechend dem Anstieg ist der Korrelationskoeffizient positiv oder negativ. Gibt es zwischen den beiden 1316han05.indd 235 25.07.2006 11:39:17 236 5 Qualität in der Fertigung Variablen keine Abhängigkeit, d. h. sind die beiden Variablen unabhängig voneinander, dann ist der Korrelationskoeffizient null. Für den einfachen Korrelationskoeffizienten ρ12 = σ12 Kovarianz = σ1 ⋅ σ 2 Produkt der Streuungen erhält man nach der Maximum Likelihood Methode die Schätzung r12 = S12 . S1 ⋅ S2 S12 = ∑ (Yi,1 − Y1 )(Yi,2 − Y2 ) wobei N i =1 die Stichprobenkovarianz zwischen Y1 und Y2 ist. Zur Begründung des eben gesagten betrachten wir zunächst nur zwei Produktvariable Y1 und Y2 und nehmen an, dass der Vektor dieser beiden Variablen YT = (Y1, Y2) normalverteilt ist mit dem Vektor der Erwartungswerte (Mittelwerte der Grundgesamtheit) µT = (µ1, µ2) und der Kovarianzmatrix ⎛ σ12 ΣYY = ⎜ ⎝ σ12 ⎞ ⎟ σ 22 ⎠ in der σ12 die Varianz von Y1 (Quadrat der Standardabweichung von Y1 in der Grundgesamtheit), σ22 die Varianz von Y2 und σ12 die Kovarianz zwischen Y1 und Y2 ist. Die Kovarianz von Y1 und Y2 ist als Produkt der Abweichungen der Y1 Werte vom Erwartungswert µ1 und der Y2 Werte von µ2 durch E [(Y1 – µ1) (Y2 – µ2)] = σ12 definiert. Die Kovarianz ist ein Abhängigkeitsmaß zwischen Y1 und Y2, d. h. diese gibt an, wie sich z. B. Y1 in Abhängigkeit von Veränderungen von Y2 verändert. Die Kovarianz ist aber von den Dimensionen der beiden Zufallsgrößen Y1 und Y2 abhängig. Das ist unschön und soll durch Standardisierung der beiden Zufallsgrößen Y1 und Y2 aufgehoben werden. Unter Standardisierung versteht man dabei den Übergang von Yj zu Zj über die Beziehung Zj = Yj − μ j σj , j = 1, 2. Für die standardisierten Zufallsgrößen Z1 und Z2 ist die Kovarianz E [Z1 Z2] durch E [Z1 ⋅ Z 2 ] = E [(Y1 − μ1 ) ⋅ (Y2 − μ 2 )] σ1 ⋅ σ 2 gegeben. Die Kovarianz zwischen den standardisierten Zufallsgrößen Y1 und Y2 nennt man Korrelationskoeffizient ρ12 1316han05.indd 236 25.07.2006 11:39:17 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 237 Y2 ρ12 = 1 Y2 + ΔY2 Y2 Y1 Y1 Y1 + ΔY1 Abb. 5.9.3: Lineare Abhängigkeit zwischen Y1 und Y2 Für diesen gilt: • 1 ≤ ρ12 ≤ 1, wobei ρ12 = 1 genau dann gilt, wenn Y1 und Y2 mit der Wahrscheinlichkeit eins linear abhängig sind, wie das in der Abbildung 5.9.3 dargestellt ist. Linear abhängig heißt in diesem Zusammenhang, wenn mit der Wahrscheinlichkeit 1 eine Veränderung von z. B. Y1 zu einer determinierten Veränderung von Y2 führt und umgekehrt, d. h. wenn P (Y2 = β0 + βY.1 Y1) = 1, wobei β0 und βY.1 die unbekannten Koeffizienten der Geradengleichung sind. Man kann diesen Sachverhalt auch in der folgenden Art beschreiben: die Punkte (Y1, Y2) liegen auf der Geraden, die den funktionalen Zusammenhang zwischen Y1 und Y2 beschreibt, d. h. Y1 und Y2 haben keine Streuungen. Das wiederum heißt aber, dass der Zusammenhang zwischen Y1 und Y2 determiniert ist. Diesen Sachverhalt verdeutlicht die Abbildung 5.9.3. • ρ12 = 0 gilt nur dann, wenn Y1 und Y2 linear unabhängig sind. In diesem Falle liegen die Realisierungen von Y1 und Y2, d. h. die Wertepaare von Y1 und Y2 in einem kreisförmigen Gebiet. • Für alle anderen Werte des Korrelationskoeffizienten liegen die Wertepaare in elliptisch umrissenen Gebieten. Diese Ellipsen können steigend oder fallend sein, je nachdem wie das Vorzeichen des Korrelationskoeffizienten ist. • Von ρ12 = 0 bzw. r12 = 0 kann man nicht auf die Unabhängigkeit von Y1 und Y2 schließen. • Der Korrelationskoeffizient der Grundgesamtheit ρ12 wird mit der Formel N r12 = ∑ (Y1,i − Y1 ) ⋅ (Y2,i − Y2 ) i =1 N N i =1 i =1 ∑ (Y1,i − Y1 )2 ⋅ ∑ (Y2,i − Y2 )2 und den Wertepaaren (Y11, Y21), …, (Y1,N, Y2,N), d. h. der Stichprobe geschätzt. ⎛m ⎞ Die Korrelationskoeffizienten für alle möglichen ⎜ ⎟ Paare von Produktvariablen werden ⎝2⎠ in der Korrelationsmatrix 1316han05.indd 237 25.07.2006 11:39:18 238 5 Qualität in der Fertigung R YY ⎛ 1 r12 ⎜ 1 =⎜ ⎜ ⎜⎝ ... r1m ⎞ ... r2m ⎟ ⎟ ... ⎟ 1 ⎟⎠ zusammengestellt. Die Korrelationsmatrix ist symmetrisch, denn es gilt rjk = rkj für alle j, k = 1, … (j – 1) j (j + 1), …, (k – 1), k, (k + 1), …, m, j ≠ k. Für j = k ist ρjj = ρkk = 1. Die Korrelationsmatrix ist für reguläre m-dimensionale Verteilungen positiv definit, wenn das Produkt widerspruchsfrei durch die Produktvariablen beschrieben wird. Wie kann geprüft werden, ob ein berechneter Korrelationskoeffizient eine Abhängigkeit ausdrückt, die statistisch gesichert von null verschieden ist? Zu diesem Sachverhalt sagt man kurz, die Abhängigkeit zwischen zwei Zufallsgrößen ist „signifikant von null verschieden“. Da der Korrelationskoeffizient mit den Werten einer Stichprobe geschätzt wurde, hängt er einmal vom Stichprobenumfang und von der „Zufälligkeit“ der beteiligten Variablen, d. h. der Größe der Streuungen ab. Aus diesem Grund muss beim Korrelationskoeffizienten stets gefragt werden, wie groß kann r12 von null abweichen, ohne dass die Unabhängigkeit von Y1 und Y2 verletzt ist? Zur Beantwortung dieser Frage müssen Hypothesen über ρ12 formuliert werden, die mit r12 zu beantworten sind, d. h. man benötigt einen Test. Die Hypothesen lauten: H0: ρ12 = 0 (d. h. die Zufallsgrößen Y1 und Y2 sind nicht miteinander korreliert) und H1: ρ12 ≠ 0 (d. h. die Zufallsgrößen sind linear nicht unabhängig voneinander) Die Prüfung der H0 gegen die Alternativhypothese H1 wird mit dem t-Test tˆ = r12 1 − r122 ⋅ N −2 geprüft. Ist tˆ < t α ,N − 2 , dann kann die H0 nicht verworfen werden. Aufgrund der Stichprobe d. h. der Größe von r12 kann dann gesagt werden, dass Y1 und Y2 nicht linear abhängig voneinander sind. Beispiel 5.9.2: Bremsweg eines PKW. Abhängigkeit des Bremsweges Das erweiterte Bremswegbeispiel enthält die Produktvariable Y Länge des Bremsweges in [m] und die Input- und Prozessvariablen X1 X2 X3 Geschwindigkeit des PKW in einer Ortschaft [km/h] mittlere Profiltiefe der Reifen aller 4 Räder [mm] Reaktionszeit des Fahrers in [sec]. Die statistischen Maßzahlen sind in der folgenden Tabelle 5.9.1 zusammengestellt. 1316han05.indd 238 25.07.2006 11:39:18 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 239 Tabelle 5.9.1: Statistische Maßzahlen für das Bremswegbeispiel Bremsweg Geschwindigkeit Profiltiefe Mittelwert 29,96 49,74 3,47 1,24 Varianz 33,5398 95,4792 0,59036 0,14773 S 5,791 9,771 Reaktionszeit 0,768 0,384 Min 13,65 19,3 1,44 0,064 Max 46,41 76,5 5,26 2,076 R 32,7 57,2 3,8 V 19 19 22 2,01 31 Für dieses Beispiel ist die Korrelationsmatrix in der Tabelle 5.9.2 enthalten. Tabelle 5.9.2: Korrelationsmatrix Beispiel Bremsweg Bremsweg Bremsweg Geschwindigkeit Profiltiefe 1 Geschw Reaktionszeit 0,837 –0,373 0,457 1 –0,207 0,168 Profil 1 Reaktion 0,098 1 Der Abhängigkeitsgraph für diese vier Variablen ist in der Abbildung 5.9.4 dargestellt. X1 = r Y1 Y 4 0.8 r12 = - 0.20 X2 r13= 0.1 rY2= - 0.37 X3 rY = 3 0.4 5 r23= 0.17 Abb. 5.9.4: Abhängigkeitsgraph für das Bremswegbeispiel Zur Demonstration der Anwendung des t-Tests überprüfen wir die Nullhypothese H0 des Korrelationskoeffizienten r23, die lautet H0: ρ23 = 0 gegen H1: ρ23 ≠ 0 Der t-Test liefert tˆ = 1316han05.indd 239 0.1 1 − 0.12 ⋅ 28 = 0.532 25.07.2006 11:39:18 240 5 Qualität in der Fertigung Der zugehörige Tafelwert für die einseitige Fragestellung ist t0.05; 28 = 2.048. Der berechnete t-Wert ist kleiner als der Tafelwert. Folglich kann die Nullhypothese nicht verworfen werden, d. h. der aus der Stichprobe vom Umfang N = 30 berechnete Korrelationskoeffizient r23 = 0.1 unterscheidet sich nicht statistisch gesichert von null. Der Stichprobenkorrelationskoeffizient r23 weicht nur zufällig von null ab, d. h. X2 und X3 sind nicht miteinander korreliert. Es ist an dieser Stelle notwendig darauf hinzuweisen, dass man im Fall der Ablehnung der H0 nicht einfach sagen kann, Xj und Xk sind linear abhängig, denn der Korrelationskoeffizient ist ein Maß für den Grad der linearen Abhängigkeit zwischen den beiden Zufallsgrößen. Man kann in diesem Fall nur sagen, Xj und Xk sind korreliert. Die Hypothesen H0 bzgl. aller anderen Korrelationskoeffizienten müssen analog geprüft werden. Am stärksten ist die Abhängigkeit zwischen der Reaktionszeit X3 und der Alkoholkonzentration X5 gefolgt von der Korrelation zwischen dem Bremsweg und der Geschwindigkeit. Die Korrelationsmatrix ist der Ausdruck für die Abhängigkeitsstruktur der Produkt- und Prozessvariablen (oder nur der Produkt-, oder nur der Prozessvariable), die in der nebenstehenden Abbildung für die Produktvariable und die ersten drei Input- und Prozessvariablen symbolisiert ist. Aus dieser Abbildung wird deutlich, dass die Abhängigkeit zwischen zwei Parametern natürlich durch die anderen Parameter beeinflusst wird. Der Zusammenhang zwischen der Kovarianz- und Korrelationsmatrix wird matriziell durch die Beziehung ⎛ 1 ⎞ ⎛ 1 ⎞ R = D ⎜ ⎟ ⋅ Σ ⋅ D ⎜ ⎟ , j = 1, 2, … n, bzw. ⎝σj ⎠ ⎝σj ⎠ Σ = D (σ j ) ⋅ R ⋅ D (σ j ) ausgedrückt. Außerdem gilt für die Determinanten der Korrelations-RXX und Kovarianzmatrix ΣXX der oft nützliche Zusammenhang Σ XX = n ∏ σ2j j =1 R XX wobei ⎧⎪1, falls ρ jk = 0, ∀ j, k = 1, …, n, j ≠ k R XX = ⎨ ⎪⎩0, falls wenigstens ein ρ jk = 1, für j ≠ k. Das Modell der Korrelationskoeffizienten ist – wie jedes Modell – von den Voraussetzungen abhängig. Hier bei diesem Modell handelt es sich um die Voraussetzungen der Normalverteiltheit, Linearität der Abhängigkeiten und der Unabhängigkeit der Elemente der Stichprobe. Gibt es ein globales Maß für die Straffheit der Abhängigkeitsstruktur? ⎛n + m ⎞ verschieIn einer Korrelationsmatrix gibt es aufgrund der Symmetrie der Matrix ⎜ ⎝ 2 ⎟⎠ dene Korrelationskoeffizienten. Diese können groß oder klein, positiv oder negativ sein. Diese 1316han05.indd 240 25.07.2006 11:39:18 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 241 Verhältnisse erschweren die Interpretation der Abhängigkeitsstruktur. Daher suchen wir ein globales Maß für die Abhängigkeitsstruktur. Dieses Maß ist die Determinante det(R) der Korrelationsmatrix. Der maximale Wert der Determinante ist det(R) = 1. Dieser Wert wird erreicht, wenn alle Korrelationskoeffizienten gleich null sind. (Zur Erinnerung sei wiederholt, dass im Falle der Unabhängigkeit alle Korrelationskoeffizienten gleich null sind.) Die Determinante ist null, wenn wenigstens ein Korrelationskoeffizient außerhalb der Hauptdiagonalen gleich 1 ist. Beispiel 5.9.3: Bremsweg eines PKW. Determinante der Korrelationsmatrix Die Determinante der Korrelationsmatrix für die Input-, Prozess- und Produktvariablen ist det(R) = 0.12163. Interessanter ist die Determinante der Input- und Prozessvariablen, denn diese bestimmt den Grad der Multikollinearität. Hierfür berechnen wir den Wert det(RXX) = 0.9124. Der Grad der Multikollinearität ist sehr gering und beeinflusst später folgende Resultate, wie z. B. die Berechnung der Prozessgleichung nicht. Was passiert, wenn eine oder beide Voraussetzungen verletzt sind? In diesem Fall können die verteilungsfreien Korrelationskoeffizienten berechnet werden. 5.9.2 Verteilungsfreie Korrelationskoeffizienten Verteilungsfreie Korrelationskoeffizienten benötigen keine Annahme über die zugrunde liegende Verteilung der Zufallsgrößen. Diese Koeffizienten sind daher robuster als die anderen. 5.9.2.1 Was ist ein Vierfelder Korrelationskoeffizient? Es seien X, Y zwei Zufallsgrößen mit diskreter Verteilung, die nur qualitativ gemessen werden können, d. h. die Messwerte sind die Häufigkeiten einer Alternative, wie z. B. Raucher und Nichtraucher, Produkt in Ordnung und Produkt defekt usw. Eine Stichprobe eines zweidimensionalen Vektors alternativ verteilter Zufallsgrößen, wie z. B. die Zufallsgröße X besteht im Vorhandensein oder Nichtvorhandensein einer Eigenschaft A und Y bezieht sich analog auf eine Eigenschaft B, liefert vier verschiedene Häufigkeiten, die in einer Vierfeldertafel, siehe Tabelle 5.9.3 aufgeschrieben und mit dem Vierfelder Korrelationskoeffizienten ausgewertet werden müssen. Tabelle 5.9.3: Vierfeldertafel Eigenschaft A Zeilensumme vorhanden nicht vorhanden vorhanden a b a+b nicht vorhanden c d c+d Spaltensumme a+c b+d =a+b+c+d Eigenschaft B 1316han05.indd 241 25.07.2006 11:39:19 242 5 Qualität in der Fertigung In dieser Tafel bezeichnen a die Häufigkeit des Vorkommens von A und B a+c die Häufigkeit des Vorkommens von A a+b die Häufigkeit des Vorkommens von B d die Häufigkeit der Alternative von A und B, d. h. des Nichtvorkommens von A und B b+d die Häufigkeit des Nichtvorkommens von A c+d die Häufigkeit des Nichtvorkommens von B. Die zu prüfende Nullhypothese lautet H0: „die beiden Alternativen verteilen sich unabhängig voneinander“ Zur Prüfung dieser Hypothese verwendet man den χ2-Test V = χ2 = N a⋅d −b⋅c [(a + b) ⋅ (a + c ) ⋅ (b + d) ⋅ (c + d)] Für diesen Koeffizienten gilt –1 ≤ V ≤ 1. Beispiel 5.9.4: Stillstandszeiten Es soll überprüft werden, ob es zwischen den Stillständen einer Anlage und den Ausschussteilen, einen Zusammenhang gibt. Die Anlage arbeitet in 3 Schichten. Pro Stunde werden 2 Produkte auf der Anlage hergestellt. Die Produkte werden beurteilt ob sie i. O. oder defekt sind. Über eine längere Zeitspanne wurden die kurzfristigen Ausfälle der Anlage notiert. Man erhielt das Ergebnis in der Tabelle 5.9.4. Tabelle 5.9.4: Stillstandszeiten und defekte Produkte Produkt Zeilensumme i. O. defekt kein Stillstand 91 39 130 Stillstand 8 18 26 Spaltensumme 99 57 156 Anlage Damit können wir den Vierfelderkorrelationskoeffizienten χ2 = 156 ⋅ (91 ⋅ 18 − 39 ⋅ 8) = 14.38 130 ⋅ 26 ⋅ 99 ⋅ 57 und V = 14.38 = 0.3 156 ausrechnen. Dieser Wert besagt aufgrund des zugehörigen χ2-Wertes, dass ein Zusammenhang zwischen den Stillständen und den defekten Produkten vorhanden ist, oder anders formuliert, dass die Stillstandszeiten der Anlage die Qualität beeinflussen. 1316han05.indd 242 25.07.2006 11:39:19 243 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 5.9.2.2 Was für ein Abhängigkeitsmaß können wir berechnen, wenn die Variablen über eine Rangskala quantifiziert wurden? Beispiel 5.9.5: Lieferterminüberschreitung. Rangkorrelationskoeffizienten Bei 14 Kunden wurden die Lieferfristenüberschreitungen Y in Tagen gemessen. Gleichzeitig wurden für die Partien, aus denen die Kundenlieferungen stammten, die univariaten Prozessfähigkeiten für eine sehr wichtige Produktvariable ermittelt. Da weder die Lieferfristenüberschreitungen noch die korrigierten univariaten Prozessfähigkeitsindizes normal verteilt sind, wurde entschieden, anstelle des einfachen Korrelationskoeffizienten den Rangkorrelationskoeffizienten nach Spearman zu berechnen. Die Rangkorrelationskoeffizienten sind aus dem Konzept entstanden, eine Rangskala als eine Intervallskala aufzufassen und die Rangwerte als Messwerte zu behandeln. Das Ergebnis dieses Konzeptes sind die Rangkorrelationen von Spearman and Kendall (siehe Kandall [1952]). Der Spearman’scher Rangkorrelationskoeffizient Für die beiden Variablen X und Y kann man aus den Beobachtungsreihen Xi, Yi, i = 1, …, N die beiden Rangreihen x[i] und y[i], i = 1, …, N bilden und als neue als Messwerte auffassen. Haben Sie z. B. die Messwerte 5, 2, 7, 4 vorliegen, dann können Sie diese der Größe nach in 2, 4, 5, 7 ordnen. Der Wert x1 = 5 wird in den Rangreihe zu x[3]. Mit der Gauß’schen Summe erhält man N ∑ xi = i =1 N ⋅ (N + 1) 2 = N ∑ yi i =1 und N ∑ xi2 = i =1 N ⋅ (N + 1) ⋅ 2 N + 1 = 6 N ∑ yi2 i =1 Außerdem gilt N N i =1 i =1 ∑(xi − x )2 = ∑ xi2 − = ⎛N ⎞ ⎜⎝ ∑ xi ⎟⎠ i =1 N 2 ⎡ N ⋅ (N + 1) ⎤ ⎥⎦ N ⋅ (N + 1) ⋅ (2 N + 1) ⎢⎣ 2 = − 6 N 2 N ⋅ (N 2 − 1) 12 Für die Summe der quadratischen Abweichungen der yi Werte von ihrem Mittelwert erhält man denselben Ausdruck. Es sind nun noch die Differenzen der Rangpaare di = X[i] – y[i], i = 1, …, N, zu bilden. 1316han05.indd 243 25.07.2006 11:39:19 244 5 Qualität in der Fertigung Setzt man all diese Umformungen in die Formel N ∑ ( xi − x ) ⋅ ( y i − y ) i =1 rxy = N N . ∑(xi − x ) ⋅∑( yi − y ) 2 i =1 2 i =1 der einfachen Korrelationskoeffizienten ein, dann erhält man für den Spearman’schen Korrelationskoeffizienten N rs = 1 − 6 ⋅ ∑ di2 i =1 N ⋅ (N 2 − 1) . Signifikanzprüfung für den Spearman’schen Rangkorrelationskoeffizient Die H0: X und Y sind unabhängig. Gegen die Alternativhypothese wird mit dem t-Test tˆ = rs 1 − rs2 ⋅ N −2 geprüft. Falls tˆ > tα; N – 2 dann muss die H0 verworfen werden, d. h. in diesem Falle sagen wir die beiden Parameter X und Y sind korreliert. Beispiel 5.9.6: Lieferfristenüberschreitung. Spearmanscher Rangkorrelationskoeffizient Die Daten für dieses Beispiel sind in der Matrix der Tabelle 5.9.5 zusammengestellt. Tabelle 5.9.5: Daten für Lieferfristenüberschreitung und Prozessfähigkeiten, Rangreihen und deren Differenzen 1316han05.indd 244 Lieferfristenüberschreitung Prozessfähigkeiten Rangreihe X[i] Rangreihe Y[i] di 13 14 15 16 17 19 20 21 24 25 30 31 36 40 1,30 1,05 1,65 1,19 1,11 1,13 1,17 1,15 0,95 1,20 1,10 0,92 0,94 0,81 1 2 3 4 5 6 7 8 9 10 11 12 13 14 14 5 13 11 7 8 10 9 4 12 6 2 3 1 –13 –3 –10 –7 –2 –2 –3 –1 5 –2 5 10 10 13 25.07.2006 11:39:19 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 245 Für den Spearman’schen Rangkorrelationskoeffizienten erhält man den Wert rs = 1 − 6 ⋅ 768 = −0.69. 14 ⋅ (142 − 1) Der zugehörige t-Wert ist tˆ = 0.69 1 − 0.692 ⋅ 12 = 3.3. Der t-Wert aus der Tafel ist t0.05; 12 = 1.78. Da der berechnete t-Wert größer als der Tafelwert ist, muss die H0 verworfen werden, d. h. die beiden Parameter sind nicht unabhängig voneinander. Die Lieferfristenüberschreitung ist von den Prozessfähigkeiten abhängig. Je kleiner die Prozessfähigkeiten für eine wesentliche Produktvariable sind, desto größer sind die Lieferfristenüberschreitungen. Die berechnete Irrtumswahrscheinlichkeit für die Ablehnung der H0 ist α = 0.0059. In der Abbildung 5.9.5 ist das Korrelationsdiagramm für diese beiden Variablen enthalten. Man erkennt deutlich die fallende Tendenz, d. h. je größer die Prozessfähigkeiten sind, desto kleiner sind die Lieferfristenüberschreitungen. 40 35 LTU 30 25 20 15 10 0.8 1.0 1.2 Cpk 1.4 1.6 Abb. 5.9.5: Lieferterminüberschreitung und Prozessfähigkeit Was ist der Kendall’scher Rangkorrelationskoeffizient? Es seien wieder zwei Rangfolgen für N Objekte gegeben, d. h. für die nicht normal verteilten oder skalierten Messwerte zweier Parameter liegen zwei Rangfolgen [i] und [j], i, j = 1, …, N vor. Als Beispiel stellen wir uns das Lieferfristenbeispiel vor. Für jedes Paar ([i],[j]) von Objekten (Messwerten) schreiben wir einen Beitrag +1 auf, wenn die Ränge [i] und [j] in der gleichen aufsteigenden Reihenfolge vorkommen, sonst –1. Konkret bedeutet das, wir definieren für die erste Rangfolge eine Zufallsgröße Vik, die den Wert +1 annimmt, wenn Xi < Xk, den Wert 0, wenn Xi = Xk und den Wert –1, wenn Xi > Xk. Analog verfahren wir für den zweiten Parameter Y. 1316han05.indd 245 25.07.2006 11:39:19 246 5 Qualität in der Fertigung Die Summe der Beiträge aller Paare ist dann S= N ∑ xij ⋅ yij . i , j =1 Der Maximalwert dieser Summe ist ⎛N ⎞ 1 ⎜⎝ 2 ⎟⎠ = 2 ⋅ N ⋅ (N − 1). Setzt man T = S 1 ⋅ N ⋅ (N − 1) 2 so nimmt T nur Werte zwischen –1 und +1 an. T = +1 gilt nur dann, wenn die beiden Rangfolgen übereinstimmen. T = –1 erhält man nur dann, wenn die beiden Rangfolgen entgegengesetzt sind. Für die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ordnet man die erste Rangfolge der Größe nach von 1 bis N. Darunter schreibt man die zugeordneten Ränge der zweiten Rangfolge, also für X: 1 2 3 … N für Y: Y1 = Y[1] Y2 = Y[N] Y3 = Y[3] … YN = Y[2]. Damit kann man S wie folgt berechnen: man zählt, wie viele der Y’s größer als Y1 rechts von Y1 stehen, dann zählt man wie viele der Y’s größer als Y2 rechts von Y2 stehen usw. Die Summe aller dieser Anzahlen sei P. Damit kann S umgeschrieben werden. Es gilt S ist die Summe von ⎛N ⎞ P Beiträgen +1 und ⎜ ⎟ − P Beiträgen –1, d. h. ⎝2⎠ S = 2⋅P − 1 ⋅ N ⋅ (N − 1), 2 bzw. T = 2⋅P − 1. 1 ⋅ N ⋅ (N − 1) 2 Beispiel 5.9.7: Lieferfristenüberschreitung. Kendallscher Rangkorrelationskoeffizient Die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ergibt für das Beispiel der Lieferterminüberschreitung den Wert T = –0.538. T ist asymptotisch normal verteilt mit dem Erwartungswert 0 und der Varianz σT2 = 2 ⋅ (2 ⋅ N + 5) , 9 ⋅ N ⋅ (N − 1) siehe z. B. van der Waerden [1957]. Damit kann man die Hypothese der Unabhängigkeit von X und Y verwerfen, wenn T größer ist als Tα = σT ⋅ Φ (1 − α) , wobei Φ die Verteilungsfunktion der standardisierten Normalverteilung ist. 1316han05.indd 246 25.07.2006 11:39:20 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 247 Die H0 der Unabhängigkeit der beiden Zufallsgrößen muss aufgrund des Ergebnisses T = –0.538 verworfen werden. Die berechnete Irrtumswahrscheinlichkeit ist α′ = 0.0073. Zum Vergleich wurde der einfache Korrelationskoeffizient berechnet. Man erhält hierfür den Wert rXY = –0.795. Die berechnete Irrtumswahrscheinlichkeit für die Ablehnung der H0 ist α′ = 0.0007. Neben den einfachen und Rangkorrelationskoeffizienten gibt es weitere Abhängigkeitsmaße. Diese sind vor allem die • partiellen oder bedingten Korrelationskoeffizienten, • die multiplen Korrelationskoeffizienten und • die multivariaten multiplen Korrelationskoeffizienten. 5.9.3 Was sind partielle Korrelationskoeffizienten Wozu werden die bedingten (partielle) Korrelationskoeffizienten gebraucht? Wie werden die bedingten Korrelationskoeffizienten berechnet? Bisher haben wir die Abhängigkeitsstruktur für die Input-, Prozess- und Produktvariablen durch die einfachen (paarweisen) Korrelationskoeffizienten beschrieben. Wir haben aber auch gesehen, dass mitunter Antworten auf praktisch relevante Fragen, wie z. B. die Frage nach den Abhängigkeiten zwischen den Produkt- und Prozessvariablen ohne den Einfluss der Inputvariablen erforderlich sind. Diese Frage kann man auch so formulieren, Wie groß sind die bedingten Abhängigkeitsmaße zwischen den Produkt- und Prozessvariablen unter der Bedingung der Inputvariablen? Zur Vereinfachung der Lösung auf die Frage betrachten wir ein triviales Beispiel. Beispiel 5.9.8: Einfluss von zwei Prozess- auf eine Produktvariable. Abhängigkeiten In dem Graphen der Abbildung 5.9.6 ist der Einfluss zweier korrelierter Prozessvariablen auf eine Produktvariable dargestellt. X1 rY1= 0.84 r12= 0.95 Y X2 rY2= 0.86 Abb. 5.9.6: Einfluss von zwei Prozess- auf eine Produktvariable 1316han05.indd 247 25.07.2006 11:39:20 248 5 Qualität in der Fertigung Die Korrelationsmatrix für dieses Beispiel ist ⎛ 1 0.84 0.86 ⎞ R=⎜ 1 0.95 ⎟ ⎜ ⎟ 1 ⎠ ⎝ Die beiden Prozessvariablen haben den Korrelationskoeffizient r12 = 0,95. Für die Steuerung des Prozessen müssen wir aber wissen, wie z. B. X1 auf Y wirkt, ohne dass dieser Einfluss durch das Wirken der zweiten Prozessvariablen „verfälscht“ wird. Der Einfluss von X2 auf X1 soll eliminiert oder konstant gehalten werden. Das ist nur in einem Modell möglich, denn in der Natur lässt sich dieser Einfluss nicht eliminieren oder konstant halten. Ein Korrelationskoeffizient dieser Art wird als partieller Korrelationskoeffizient bezeichnet. Dieser misst den partiellen Einfluss von X1 auf Y, oder anders ausgedrückt den Einfluss von X1 auf Y unter der Bedingung, dass X2 konstant gehalten wird. Wir können auch sagen, der zu findende Korrelationskoeffizient ist ein Korrelationskoeffizient der bedingten Verteilung von Y und X1 unter der Bedingung von X2. Für diesen Fall wollen wir im Folgenden die Formel zur Berechnung der partiellen Korrelationskoeffizienten betrachten. Es gilt rY 1/2 = rY 1 − rY 2 ⋅ r12 (1 − rY22 ) ⋅ (1 − r122 ) wobei rY1/2 die symbolische Darstellung für die Abhängigkeit zwischen Y und X1 unter der Bedingung ist. Beispiel 5.9.9: Einfluss von zwei Prozess- auf eine Produktvariable. Partieller Korrelationskoeffizient Für das Demonstrationsbeispiel gilt rY 1/2 = 0.84 − 0.86 ⋅ 0.95 (1 − 0.862 ) ⋅ (1 − 0.952 ) = 0.146. Das Ergebnis der einfachen- und partiellen Korrelationsanalyse besagt, dass die paarweise (oder auch totale) Abhängigkeit zwischen Y und X1 sehr straff ist (rYX1 = 0.84). Es besagt aber auch, dass diese Abhängigkeit sehr stark durch X2 beeinflusst wird, denn X2 wirkt sehr stark auf X1 (r12 = 0.95) und sehr stark auf Y (rY2 = 0.86). Hält man diesen Einfluss konstant, oder eliminiert man diesen Einfluss, dann ist die verbleibende Abhängigkeit nur noch gering (rY1/2 = 0.146). Was können Sie aus den Unterschieden zwischen den einfachen und partiellen Korrelationskoeffizienten ablesen? Beispiel 5.9.10: Einfluss von zwei Prozess- auf eine Produktvariable. Maß der Beherrschbarkeit Y kann einzeln sowohl durch X1 oder X2 und gemeinsam durch X1 und X2 zusammen dargestellt werden. Die Genauigkeit der unterschiedlichen Darstellungen wird durch das Maß der Beherrschbarkeit und durch die Streuungen um die Regressionsgleichung (Reststreuung) ausgedrückt. 1316han05.indd 248 25.07.2006 11:39:20 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 249 Die Darstellungen von Y durch X1 oder X2 liefern die beiden Gleichungen Y = bY1 X1 = 0.84 X1 mit dem Maß der Beherrschbarkeit R2Y1 = 0.7056 und der Reststreuung SY/1 = 0.5425 bzw. Y = bY2 X2 = 0.86 X2 mit dem Maß der Beherrschbarkeit R2Y/2 = 0.7396 und der Reststreuung SY/2 = 0.5203. Wird Y durch beide X gemeinsam dargestellt, dann erhält man die Gleichung Y = bY.1/2 X1 + bY.2/1 X2 = 0.2359 X1 + 0.6359 X2 mit dem Maß der Beherrschbarkeit R2Y/1, 2 = 0.7450 und der Reststreuung SY/1, 2 = 0.5049. Hieraus können Sie ablesen, dass • die Varianz von Y durch X1 oder X2 zu ca. 70 % erklärt wird, • durch den gemeinsamen Ansatz mit beiden Einflussvariablen X1 und X2 wird das Maß der Beherrschbarkeit nicht wesentlich kleiner. Die Ursache hierfür ist der große Korrelationskoeffizient für X1 und X2. • Man nennt diesen Effekt Einfluss der Multikollinearität zwischen den Einflussgrößen auf die Regressionsgleichung und nennt eine der beiden Variablen redundant. Berechnung der partiellen Korrelationskoeffizienten über die bedingte Verteilung Für die allgemeine Ableitung setzen wir voraus, dass der zufällige Vektor (YT, XT) normal verteilt ist. Gesucht sind die partiellen Korrelationskoeffizienten zwischen den Produktvariablen, d. h. die bedingten Korrelationskoeffizienten der Produktvariablen Y unter der Bedingung, dass die Input- und Prozessvariablen X konstant gehalten werden, d. h. gegeben sind. Die bedingte Verteilung von Y unter der Bedingung X ist eine m-dimensionale Normalverteilung ist mit den bedingten Momenten E[Y/X] und var(Y/X). Für diesen verallgemeinerten Fall erhält man den Vektor bedingter Erwartungswerte 1 E [Y / X ] = μY + ΣYX ⋅ Σ −XX ⋅ ( X − μ X ) = μ + βYT / X ⋅ ( X − μ X ) und die bedingte Kovarianzmatrix 1 var [Y / X ] = ΣYY − ΣYX ⋅ Σ −XX ⋅ Σ XY = ΣYY / X . Die Elemente σkl/1, … n, k, l = 1, …, m der bedingten Kovarianzmatrix ΣYY/X „messen“ in der Hauptdiagonalen die Variabilität der Produktvariablen und in den Nebendiagonalen die Abhängigkeiten zwischen den Produktvariablen unter der Bedingung X, d. h. unter der Bedingung, dass die Input- und Prozessvariable gegeben sind. Die partiellen Korrelationskoeffizienten zwischen den Produktvariablen unter der Bedingung, dass die Input- und Prozessvariable realisiert sind, werden analog den gewöhnlichen Korrelationskoeffizienten, nur mit den Elementen der bedingten Kovarianmatrix ΣYY/X berechnet. Wir erhalten die Formel 1316han05.indd 249 25.07.2006 11:39:20 250 5 Qualität in der Fertigung ρkl /1, …, n = σ kl /1, …, n σ kk /1, …, n ⋅ σ kk /1, …, n = σ kl / X . σ kk / X ⋅ σ ll / X Für σkk/X kann man natürlich auch σ2k/X schreiben. Die Matrizenformel zur Berechnung der Korrelationskoeffizienten aus der Kovarianzmatrix kann natürlich auch für die bedingte Kovarianzmatrix aufgeschrieben werden. Wir erhalten 2 ⎛ σ1/ X ⎜ D = Diag (ΣYY / X ) = Diag ⎜ ⎜⎝ ⎞ ⎟ … ⎟ 2 σ m / X ⎟⎠ und damit D − 1 2 ⋅ ΣYY / X ⋅ D − 1 2 = PYY / X , wobei PYY/X die Matrix der partiellen Korrelationskoeffizienten bezeichnet. Beispiel 5.9.11: Bremsweg eines PKW. Partielle Korrelationskoeffizienten Die partiellen Korrelationskoeffizienten für das Bremswegbeispiel sind in der Tabelle zusammen gestellt. Tabelle 5.4.5: Matrix der partiellen Korrelationskoeffizienten Rpartiell ⎛ 1 0.885 −0.566 0.695 ⎞ ⎜ 1 0.413 −0.55 ⎟ ⎟ =⎜ 1 0.475 ⎟ ⎜ ⎜⎝ 1 ⎟⎠ Vergleicht man die Matrix der bedingten mit der Matrix der einfachen Korrelationskoeffizienten für dieses Beispiel, dann sieht man, dass • sich die bedingten wesentlich von den einfachen Korrelationskoeffizienten unterscheiden können und • die bedingten auch wesentlich größer als die einfachen Korrelationskoeffizienten werden können. Die Vergrößerung oder Verkleinerung hängt im wesentlichen von den Vorzeichen der einfachen Korrelationskoeffizienten ab. 5.9.4 Was sind multiple Korrelationskoeffizienten und wozu benötigt man diese? Der multiple Korrelationskoeffizient ist ein immens wichtiges Abhängigkeitsmaß zwischen der Produktvariablen Y und der Prozessgleichung, oder anders formuliert dem bedingten Erwartungswert einer Produktvariablen unter der Bedingung der Input- und Prozessvariablen, dem ja die Prozessgleichung entspricht. 1316han05.indd 250 25.07.2006 11:39:20 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 251 1 E [Y / X] = μY + σTY . X Σ −XX (X − μ X ) mit der bedingten Varianz 2 1 var(Y / X ) = σYX − σTY . X Σ −XX σY . X . Die Bezeichnungen liefern uns die Zerlegung der positiv definiten Kovarianzmatrix Σ entsprechend der Zerlegung des zufälligen Vektors in die Produktvariable Y und den Vektor X der Prozess- und Inputvariablen ZT = (Y, XT) in ⎛ σ2 Σ=⎜ Y ⎝ σTY . X ⎞ ⎟. Σ XX ⎠ Warum ist der multiple Korrelationskoeffizient für die Anwendungen so wichtig? Mit dem multiplen Korrelationskoeffizienten können Sie beurteilen, • wie gut die Menge der Input- und Prozessvariablen die Produktvariable beeinflusst und • wie gut die Varianz einer Produktvariablen durch die Input- und Prozessvariablen erklärt wird. Aus diesem Grunde nennen wir den multiplen Korrelationskoeffizienten das Maß der Beherrschbarkeit eines Prozesses. Je größer der multiple Korrelationskoeffizient ist, desto besser wird die Varianz der Produktvariablen durch die Input- und Prozessvariablen aufgeklärt, d. h. umso sicherer wird der Prozess beherrscht. Das bedeutet aber auch, dass Sie beurteilen können, wie gut Sie den Prozess nach der Steuerung mit der Prozessgleichung beherrschen. Streuen die Werte der Produktvariablen nach der Steuerung nur noch gering um die Prozessgleichung, dann werden die Werte auch nur noch sehr wenig um den Zielwert streuen. Der Zielwert für die Steuerung ist aber der Sollwert für die Produktvariable. Damit wird erreicht, dass die Kundenanforderungen überaus präzise erfüllt werden können. Für die Definition des multiplen Korrelationskoeffizienten betrachten wir wieder den zufälligen Vektor (Y, XT) = ZT und nehmen an, dass Z ~ Nn + 1 (µ, Σ) und μ und Σ entsprechend dem Z partitioniert sind. Definition des multiplen Korrelationskoeffizienten: ρY2 / X = 1 σTY . X ⋅ Σ −XX ⋅ σY . X σY2 = 1− σY2 / X σY2 Es gilt 0 ≤ ρ2Y/X ≤ 1. Wenn Y unabhängig von X ist, dann ist ρ2Y/X = 0. Wenn Y mit Wahrscheinlichkeit 1 eine Linearkombination der Komponenten von X ist, dann ist ρ2Y/X = 1. Wenn der zufällige Vektor X nur eine Komponente hat, dann ist ρ2Y/X = ρ2Y.X, d. h. dem Quadrat des einfachen Korrelationskoeffizienten. Im standardisierten Fall wird aus der Kovarianzmatrix Σ die Korrelationsmatrix R. R wird genauso zerlegt wie Σ, d. h. ⎛ 1 ρTY . X ⎞ R=⎜ ⎟. R XX ⎠ ⎝ 1316han05.indd 251 25.07.2006 11:39:21 252 5 Qualität in der Fertigung Damit erhält man als Formel zur Berechnung des multiplen Korrelationskoeffizienten −1 ρY2 / X = ρTY . X ⋅ R XX ⋅ ρY . X . Die Maximum Likelihood Schätzung ist 1 RY2 / X = RYT. X R −XX RY . X , wobei die einzelnen Terme in dieser Formel aus der partitionierten Korrelationsmatrix ⎛ 1 RYT. X ⎞ R =⎜ ⎟ R XX ⎠ ⎝ kommen, bzw. mit der Zerlegung der Matrix A in ⎛ a2 A =⎜ Y ⎝ RY2 / X = aYT . X ⎞ ⎟ A XX ⎠ 1 aYT . X A −XX aY . X aY2 . Wie kann eine Hypothese über den multiplen Korrelationskoeffizienten geprüft werden? Unter den sehr allgemeinen Voraussetzungen, dass der N-dimensionale Stichprobenvektor der Produktvariablen Y sphärisch mit P (Y = 0) = 0 und die Stichprobenmatrix X unabhängig von Y ist und mit Wahrscheinlichkeit 1 den Rang n hat, ist der multiple Stichprobenkorrelationskoeffizient R2Y/X nach Muirhead [1982] Beta verteilt, bzw. RY2 / X N − n −1 ⋅ n 1 − RY2 / X ist Fn, N – n – 1 verteilt. Zur Prüfung der H0: ρ2Y/X = 0 gegen die allgemeine Alternative H1: ρ2Y/X ≠ 0 wird der F-Test RY2 / X N −n −1 ⋅ = Fˆ n 1 − RY2 / X verwendet. F̂ ist bei Gültigkeit der H0 Fn, N – n – 1 verteilt mit n und N – n – 1 FG. Der Test zum Niveau α lehnt die H0 ab, wenn Fˆ > Fn , N −n −1 (α) , wobei Fn, N − n −1(α) den oberen 100 α % Punkt der Fn, N – n – 1 Verteilung bezeichnet. Beispiel 5.9.12: Bremsweg eines PKW. Multipler Korrelationskoeffizient Zur Demonstration des Rechenweges betrachten wir die Abhängigkeit des Bremsweges Y von der Geschwindigkeit X1, der Profiltiefe X2 und der Reaktionszeit X3. Aus der Stichproben Kovarianzmatrix S der Tabelle 5.9.6 lesen wir die Werte ab, die in die Formel zur Berechnung des multiplen Korrelationskoeffizienten einfließen. 1316han05.indd 252 25.07.2006 11:39:21 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 253 Tabelle 5.9.6: Stichprobenkovarianzmatrix für das Bremswegbeispiel Bremsweg Bremsweg Geschwindigkeit Profil Reaktion 31,5056 22,5578 –1,393 1,2417 Geschwindigkeit 22,5578 23,0575 –0,6619 0,3899 Profil –1,393 –0,6619 0,4417 0,0314 0,3899 0,0314 0,234 Reaktion 1,2417 RY2 /1,2,3 ⎛ 23.0575 −0.6619 0.3899 ⎞ (22.5578 − 1.393 1.2417) ⋅ ⎜ 0.4417 0.0314 ⎟ ⎜ ⎟ 0.234 ⎠ ⎝ = 31.5056 = 0.867. −1 ⎛ 22.5578 ⎞ ⋅ ⎜ −1.393 ⎟ ⎜ ⎟ ⎝ 1.2417 ⎠ Das Ergebnis bedeutet, dass die Varianz des Bremsweges zu 87 % durch die Input- und Prozessvariablen wie Geschwindigkeit, Profiltiefe und Reaktionszeit erklärt wird. Betrachten wir die Abhängigkeit des Bremsweges nur von der Geschwindigkeit, dann ist der multiple Korrelationskoeffizient – das Quadrat des einfachen Korrelationskoeffizienten – gleich R2Y/X = r2Y.1 = 0.83692 = 0.700, also kleiner als vorher bei der Betrachtung von 3 Prozessvariablen. Hieraus liest man ab, dass die multiplen Korrelationskoeffizienten bei Vergrößerung der Anzahl der Input- und Prozessvariablen nie kleiner werden können, sondern, wenn die Produktvariable Y und die hinzugenommenen Input- und Prozessvariable nicht unabhängig voneinander sind, stets größer werden. Das ist logisch, denn durch die Hinzunahme neuer Information kann die Varianz des Produktvariables immer besser erklärt werden. Zur Prüfung der H0: ρ2Y/X = 0 verwenden wir den F-Test Fˆ = 0.867 30 − 3 − 1 ⋅ = 56.49 1 − 0.867 3 Aus der Tafel für die F-Verteilung findet man den Wert F3,140 – 3 = 2.60. Da F̂ > F3, ∞, (0.05) , muss die H0 verworfen werden, d. h. Y hängt statistisch gesichert von den drei Parametern Geschwindigkeit, Profiltiefe und Reaktionszeit ab, oder anders ausgedrückt, die Varianz des Bremsweges wird zu mehr als 86 % durch die drei Prozessvariablen erklärt. 5.9.5 Was sind partiell multiple Korrelationskoeffizienten und wozu benötigt man diese? Neben den einfachen, den partiellen und den multiplen Korrelationskoeffizienten muss ich noch den partiell multiplen Korrelationskoeffizienten einführen. Dieser ist für den Nachweis erforderlich, dass nach der Zerlegung des Vektors X in die Teilvektoren X(k) und X(h) die Komponenten von X(h) unwesentlich sind. Hierzu muss gezeigt werden, dass die Menge der unwesentlichen (Input- und Prozess-) Variablen, in X(h) zusammengefasst, tatsächlich unab- 1316han05.indd 253 25.07.2006 11:39:21 254 5 Qualität in der Fertigung hängig von der Menge der wesentlichen Variablen und von Y ist und damit aus einer statistischen Prozessanalyse gestrichen werden kann, oder anders formuliert, ob die Variablen aus X(h) nach ihrer Streichung die bedingte Varianz von Y unter der Bedingung X(k) kaum vergrößern. Diesen Sachverhalt kann man auch durch die folgende Frage ausdrücken. Wie verändern sich der Grad der linearen Abhängigkeit und die Beziehung zwischen Y und X, wenn der Einfluss von X(h) auf Y und X(k) eliminiert wurde? Multipel bedeutet in diesem Sprachgebrauch die Messung des Grades der linearen Abhängigkeit zwischen einer Zufallsgröße – der Produktvariablen Y – und einer Linearkombination von Zufallsgrößen – der Prozessgleichung in X(k) und partiell bedeutet die Messung des Grades zwischen zwei „bedingten“ zufälligen Größen, nämlich zwischen den beiden bedingten Erwartungswerten Y unter X(h) und X(k) unter X(h). Ausgangspunkt für die Darstellung dieses Korrelationskoeffizienten ist die obige Zerlegung, in der Y eine Produktvariable bezeichnet, X(k) p und X(h) n – p Parameter enthält, und der Zerlegungssatz für die bedingten Erwartungswerte und Varianzen. Mit der analogen Zerlegung des Vektors der Erwartungswerte µT = (µY, µ(k)T, µ(h)T) und der Kovarianzmatrix ⎛ σY2 ⎜ Σ=⎜ ⎜⎝ σYT .k Σ kk σYT .h ⎞ ⎟ Σ kh ⎟ Σ hh ⎟⎠ erhält man die Momente der bedingten Verteilung von (Y, X(k)T) unter der Bedingung X(h) ⎛ σT ⎞ −1 E {[Y , X (k)T )/ X (h)]T } = (μY μTk ) − ⎜ Y .h ⎟ ⋅ Σ hh ⋅ [ X (h) − μ(h)] ⎝ Σ kh ⎠ und ⎛ σ2 var[(Y X (k)T )/ X (h)T ] = ⎜ Y ⎝ ⎛ σ2 =⎜ Y ⎝ ⎛ σ2 = ⎜ Y /h ⎝ σYT .k ⎞ ⎛ σYT .h ⎞ −1 T ⎟−⎜ ⎟ ⋅ Σ hh ⋅ (σY .h Σ hk ) Σ kk ⎠ ⎝ Σ kh ⎠ T −1 σYT .k ⎞ ⎛ σY .h Σ hh σY .h − ⎜ ⎟ −1 Σ kk ⎠ ⎝ Σ kh Σ hh σ Y .h −1 σYT .h Σ hh Σ hk ⎞ ⎟ −1 Σ kh Σ hh Σ hk ⎠ σYT .k / h ⎞ ⎟. Σ kk / h ⎠ Die Linearkombination zwischen E[X(k)/X(h)] und E[Y/X(h)] hat die Koeffizienten −1 βTY .k / h = σTY .k / h Σ kk /h und die maximale Korrelation ρY2 .k / h = −1 σTY .k / h Σ kk / h σY .k / h σY2 / h . Dieser Korrelationskoeffizient wird partiell multipler Korrelationskoeffizient genannt. 1316han05.indd 254 25.07.2006 11:39:22 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 255 Für die Interpretation dieses Korrelationskoeffizienten betrachten wir die folgenden Beziehungen 1 − ρY2 .k / h = −1 σTY .k / h Σ kk / h σY .k / h σY2 / h = σY2 / X σY2 / h oder ρY2 .k / h = 1 − σY2 / X σY2 / h . Es gilt 0 ≤ ρ2Y.k/h ≤ 1. Damit wird deutlich, dass der partiell multiple Korrelationskoeffizient ein Maß für die Reduktion der bedingten Varianz von Y unter der Bedingung X(k) ist, wenn man den Vektor X(h) zu X(k) hinzu nimmt. Sind σ2Y/X und σ2Y/h nahezu gleich groß, dann wird der Quotient nahezu gleich 1, d. h. ρ2Y.k/h wird sehr klein sein. Andererseits, wenn σ2Y/X im Vergleich zu σ2Y/h sehr klein ist, dann wird ρ2Y.k/h groß sein. Kleine Werte von ρ2Y.k/h bedeuten eine kleine Reduktion der bedingten Varianz von Y unter X(k) durch Hinzunahme von X(h). Weitere nützliche Beziehungen in Bezug auf den partiell multiplen Korrelationskoeffizienten 1. Mit var[Y/X(h)] = σ2Y (1 – ρ2Y/h) und var[Y/X(k), X(h)] = σ2Y (1 – ρ2Y/X) erhält man ρY2 .k / h = ρY2 / X 1 − ρY2 / h ρY2 .k / h 1 − ρY2 .k / h = . ρY2 / X − ρY2 / h 1 − ρY2 / X 2. Den Zusammenhang zwischen den partiellen und multiplen Korrelationskoeffizienten erkennt man sofort, wenn X (k) und X(h) als einfache Zufallsgrößen angesehen werden. In diesem Falle wird aus der Matrix Σkk/h die skalare Größe σ2kh und damit ρY2 .k / h = σTY .k / h σ k−2/ h σY .k / h σY2 / h = σY2 .h / k σY2 / h ⋅ σY2 / k . Wie können Hypothesen bzgl. des partiell multiplen Korrelationskoeffizienten geprüft werden? Es soll die Hypothese H0: ρ2Y.h/k = 0 gegen die Alternative H1: ρ2Y.h/k ≠ 0 geprüft werden. Hierzu ist der F-Test anwendbar. Es gilt Fˆ = RY2 .k / h 1− RY2 .k / h ⋅ N − p − (n − p) n−p ist Fn – p, N – n verteilt. 1316han05.indd 255 25.07.2006 11:39:22 256 5 Qualität in der Fertigung Beispiel 5.9.13: Bremsweg eines PKW. Partiell multipler Korrelationskoeffizient Wir betrachten die Prozessgleichung Y = 17.1505 + 0.2935 Geschwindigkeit – 3.5605 Profiltiefe + 8.516 Reaktionszeit. Das Maß der Beherrschbarkeit (Quadrat des multiplen Korrelationskoeffizienten) ist R2Y/1, 2, 3 = 0.867 und die Streuung um die Prozessgleichung (bedingte Standardabweichung) ist sY/1, 2, 3 = 2.164 (S2Y/1, 2, 3 = 4.6828). Die Frage ist, ob zwei weitere Variable, wie z. B. Rauheit der Straße und Alkoholkonzentration den multiplen Korrelationskoeffizienten wesentlich vergrößern können. Die Kovarianzmatrix bei Einbeziehung der zusätzlichen Variablen und mit einer neuen Stichprobe ist ⎛ 33.540 34.581 −1.878 ⎜ 95.479 −0.367 ⎜ 0.5904 ⎜ S=⎜ ⎜ ⎜ ⎜ ⎝ 1.300 −7.441 0.617 −6.665 0.0389 0.203 0.1477 0.0313 5.0646 0.474 ⎞ 0.863 ⎟ ⎟ 0.0127 ⎟ 0.04026 ⎟ ⎟ 0.0367 ⎟ 0.0217 ⎟⎠ Zur Beantwortung der Frage wird der partiell multiple Korrelationskoeffizient berechnet. Man erhält ⎛ SYT.h ⎞ −1 ⎜ ⎟ ⋅ Shh ⋅ (S y .h ⎝ Shh ⎠ ⎛ 23.935114 32.237561 −0.021682 ⎜ 47.516117 0.210268 Shk ) = ⎜ 0.014019 ⎜ ⎜⎝ 0.94003 ⎞ 1.660873 ⎟ ⎟ 0.022227 ⎟ 0.074965 ⎟⎠ und damit ⎛ SY2 / h SYT.k / h ⎜ ⎝ Skk / h ⎛ 9.6048 2.3434 −1.8563 0.35997 ⎞ ⎞ ⎜ 47.9629 −0.5773 −1.0439 ⎟ ⎟ ⎟=⎜ 0.5764 0.01667 ⎟ ⎠ ⎜ ⎜⎝ 0.07273 ⎟⎠ Mit diesen Werten erhält man die Maximum Likelihood Schätzung für den partiell multiplen Korrelationskoeffizienten RY2 .k / h = −1 SYT.k / h ⋅ Skk / h ⋅ SY .k / h SY2 / h = 9.583 = 0.997. 9.605 Für die Prüfung der Hypothese H0: ρ2Y.k/h = 0 gegen die Alternative H1: ρ2Y.k/h ≠ 0 wird der F-Test verwendet. Man berechnet Fˆ = 1316han05.indd 256 ρY2 .k / h 1− ρY2 .k / h ⋅ N − p − (n − p) 0.997 140 − 3 − 2 = ⋅ = 2243 n−p 1 − 0.997 2 25.07.2006 11:39:22 5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 257 Hieraus folgt schon – auch ohne den Tafelwert nach zu schlagen –, dass dieser Wert statistisch gesichert von null verschieden ist, d. h. dass die beiden Parameter Rauheit der Strasse und Alkoholkonzentration im Blut das Maß der Beherrschbarkeit wesentlich vergrößern. Die vollständige Prozessgleichung ist Y = 27.362 + 0.1939 Geschwindigkeit – 3.272 Profiltiefe + 8.4829 Reaktionszeit – 1.151 Rauheit + 2.265 Alkoholkonzentration Das Maß der Beherrschbarkeit ist R2Y/X = 0.999 und die Streuung um die Prozessgleichung ist SY/X = 0.11677 (S2Y/X = 0.01363). Welche Aussagen sind mit dem multivariaten, multiplen Korrelationskoeffizient möglich? Häufig wird eine Maßzahl zur Bewertung der Abhängigkeit zwischen zwei zufälligen Vektoren gesucht, wie z. B. bei der multivariaten, multiplen Regressionsanalyse mit stochastischen Input- und Prozessvariablen. Der multivariate, multiple Korrelationskoeffizient wird über die Formel τY2 / X = 1 − ΣYY / X Σ XX definiert. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit z. B. zwischen dem zufälligen Vektor Y und E(Y/X). Für m = 1 ist τ2Y/X identisch mit dem multiplen Korrelationskoeffizienten ρ2Y/X. Bemerkungen 1. Ein weiteres Maß für die lineare Abhängigkeit zwischen zwei zufälligen Vektoren ist die Spurkorrelation nach Anderson [1984] und Höschel [1974, 1976], die über −1 1 VYX = Sp (ΣYY ⋅ ΣY . X ⋅ Σ −XX ⋅ Σ X .Y ) = m − Sp (Σ −yy1 ⋅ Σ yy / x ) durch ηY2 / X = VYX min(m, n) definiert wird. 2. Zusammenhang zwischen den multivariaten, multiplen und kanonischen Korrelationskoeffizienten κ. Es gilt 1 − τY2 / X = (1 − κ12 ) ⋅ … ⋅ [1 − κ 2min(m,n) ]. Die kanonischen Korrelationskoeffizienten werden am einfachsten aus den nicht negativen −1 1 Eigenwerten von ΣYY ⋅ ΣY . X ⋅ Σ −XX ⋅ Σ X .Y berechnet. 1316han05.indd 257 25.07.2006 11:39:22 258 5 Qualität in der Fertigung 5.9.6 Was besagen der multivariat partiell-multiple und der multivariat semipartiell-multiple Korrelationskoeffizient? Die Berechnung von Prozessgleichungen im Rahmen des multivariaten, multiplen linearen Modells wird mit der Auswahl der wesentlichen Input- und Prozessvariablen gekoppelt. Hieraus folgt aber, dass wir Korrelationskoeffizienten für die Beurteilung der Abhängigkeiten nach der Zerlegung des zufälligen Vektors der Produkt- und Input- und Prozessvariablen in ZT = (YT, X(k)T, X(h)T) für die bedingten Erwartungswerte E[X(h)/X(k)] −1 = Σ h.k ⋅ Σ kk ⋅ X (k) =: βYT / X ⋅ X (k) mit var[X(h)/X(k)] = Σhh/k benötigen. Bezeichnen wir die Fehlermatrizen mit E [FY / k ⋅ Fh / k ] = ΣY .h / k −1 E [FY / k / Fh / k ] = ΣY .h / k ⋅ Σ hh ⋅ Fh / k und −1 var [FY / k / Fh / k ] = ΣYY / k − ΣTY .h / k Σ hh / k Σ Y .h / k dann können wir den multivariaten partiell-multiplen Korrelationskoeffizienten in der folgenden Form τY2 .h / k = 1 − ΣYY /(k ,h) ΣYY / k ΣYY / X = 1− ΣYY / k definieren. Dieser Korrelationskoeffizient misst den Grad der linearen Abhängigkeit zwischen den bedingten Erwartungswerten E[Y/X] und E[Y/X(k)]. Für jede Produktvariable Yr, r = 1, …, m kann man aufgrund der Darstellung für τ2Y.h/k die Beziehung τY2r .h / k = ρr2.h / k = 1 − σY2 / X σY2 / k = σ r2/ k − σ 2r / X σ 2r / k = Red r , p (h) σ 2r / k aufschreiben, die besagt, dass Hypothesen über die Redp(h) bzw. Redr, p(h) des Abschnittes 5.9.2 mit den partiell-multiplen Korrelationskoeffizienten geprüft werden können. Aus ρ2r.h/k = 0 folgt mit Wahrscheinlichkeit 1, dass die Streichung der Input- und Prozessvariablen in X(h) keine Vergrößerung der bedingten Varianz σ2Y/X zur Folge hat. In diesem Fall muss gelten, sowohl Σhk = 0 als auch σr.h = 0. Aus ρ2r.h/k = 1 folgt mit Wahrscheinlichkeit 1, dass X(h) eine lineare Funktion von X(k) ist. Für die Zerlegung des Vektors der Input- und Prozessvariablen in X(k) und X(h) gilt für den partiell-multiplen Korrelationskoeffizienten σ 2r / X = σ 2r / k ⋅ (1 − ρ2r .h / k ) = σ 2r ⋅ (1 − ρ2r / k ) ⋅ (1 − ρ2r .h / k ). Dieser interessante Zusammenhang lässt sich auf den multivariaten Fall übertragen. Für die Zerlegung des Vektors der Produktvariablen Y in Y(s) und Y(t) mit s = (s1, …, sq), s1 < … < sq und t = (t1, …, tm – q), t1 < … < tm – q gilt 1316han05.indd 258 25.07.2006 11:39:23 5.10 Was ist eine Prozessgleichung und wozu benötigt man diese? 259 1 − τY2 / X = (1 − τ2s / X ) ⋅ (1 − τt2. X / s ) und für die Zerlegung von X in X(k) und X(h) gilt 1 − τY2 / X = (1 − τY2 .h / k ) ⋅ (1 − τY2 / k ). In analoger Weise kann der multivariate semi partielle Korrelationskoeffizient τY2 .(h / k) = 1 − ΣYY /(k ,h) ΣYY gebildet werden. 5.10 Was ist eine Prozessgleichung und wozu benötigt man diese? Wie wir schon wiederholt feststellten, ist jedes Produkt (materielles Produkt oder Dienstleistung) das Ergebnis eines (Herstellungs- oder Dienstleistungs-) Prozesses. Jedes Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariable beschrieben. Der Kunde, der ein Produkt kaufen möchte, stellt seine Anforderungen an das Produkt. Diese Anforderungen werden in einem Kundenanforderungsprofil (KAP) zusammen gestellt. Das KAP wird parametrisiert und durch Sollwerte und Toleranzgrenzen für alle relevanten Produktvariable spezifiziert. Ein Prozess wird durch die Input-, Prozessvariablen X als Ursachen und die Produktvariablen Y als Wirkungen beschrieben. Eine Veränderung der Produktvariablen kann nach dem Ursache-Wirkungs-Prinzip nur durch die Veränderung der Input- und/oder Prozessvariablen erreicht werden. Die Veränderungen durch die Störvariablen (noise variables) sind zufällig und nicht steuerbar, müssen aber trotz alledem berücksichtigt werden, denn deren Einfluss kann erheblich sein. Damit die Kundenanforderungen durch die gefertigten Produkte auch wirklich erfüllt werden, muss der Prozess gesteuert werden. Dazu benötigen wir die Prozessgleichung. In die können wir Werte für die Input- und Prozessvariable einsetzen und damit die Werte für die Produktvariable (oder Produktvariablen) berechnen. Definition der Prozessgleichung Die Prozessgleichung ist eine Funktion, die den Input- Z und Prozessvariablen X die Produktvariablen Y zuordnet, sodass eine Steuerung des Prozesses möglich ist. Die Funktion ist in der Regel unbekannt. Es sind kaum Gesetze bekannt, nach denen die Prozessgleichung gefunden werden kann. Daher muss die Funktion statistisch bestimmt werden. Dazu benötigt man möglichst fehlerfreie, vollständige, zuordenbare Messwertsätze in ausreichender Anzahl für die Input-, Prozess- und Produktvariablen. Die Input- und Produktvariablen sind dabei in der Regel zufällige Vektoren, denn die Inputvariablen sind nach Abschnitt 5.5 die Produktvariablen der Produkte von Vorläuferprozessen. Produktvariable sind zufällige Vektoren, da in jedem Prozess zufällige Komponenten wirken, deren Beitrag sich auf die Werte der Produktvariablen auswirkt. 1316han05.indd 259 25.07.2006 11:39:23 260 5 Qualität in der Fertigung Die Prozessvariablen können zufällig oder determiniert sein. Häufig wirken aber auch die determinierten Einstellvariablen zufällig auf das Produkt. Diese Voraussetzung bedingt, dass für die Berechnung der Prozessgleichung gewisse Verteilungsvoraussetzungen benötigt werden. Beispiel 5.10.1: Brennen von Porzellan. Technologie Porzellan wird aus Kaolin, Quarz und Feldspat hergestellt. Die aus der Porzellanmasse geformten Gegenstände werden zuerst in einem Glühbrand von 900 [°C] gesintert, wobei der Scherben entsteht. Nach dem Verglühen wird der Scherben glasiert und dem Gar- oder Glattbrennen von 1400 – 1500 [°C] unterworfen. Der Quarz und Feldspat geraten bei der hohen Temperatur in Fluss und füllen das Gerippe von Kaolin vollständig aus. Der Brennofen wird auf 900 [°C] oder 1400 [°C] hoch geheizt. Dass Brenngut wird in Regale einsortiert und eingeschoben. An jeder Stelle des Regals wirkt eine klein wenig unterschiedliche Temperatur, d. h. trotz der festen Einstellung des Ofens wirken auf die zu brennenden Gegenstände verschiedene Temperaturen. Wie kann man eine Prozessgleichung gewinnen? In der Antwort zu dieser Frage werden Methoden zur Prüfung der Homogenität und zur Klassifikation der inhomogenen Stichprobe in homogene Teilstichproben, zur Berechnung der Prozessgleichung und zur Auswahl der wesentlichen Input- und Prozessvariablen bereit gestellt. Um die Verbindung zur klassischen Literatur über die Regressionsanalyse herzustellen, betrachten wir zunächst den klassischen Fall, bei dem angenommen wird, dass nur Y eine Zufallsgröße oder ein zufälligen Vektor ist und erweitern diesen dann auf den praktikablen Fall, in dem sowohl die Input-, Prozess- und Produktvariable zufällige Vektoren sind. 5.11 Modelle für die Prozessgleichung 5.11.1 Nur die Produktvariable Y ist zufällig Wir wollen annehmen, dass Y ~ Nm (µY, ΣYY). Die Input- und Prozessvariablen, wir fassen diese zu dem Vektor x zusammen, sind determiniert. Die funktionale Darstellung der Produktvariable Y durch die determinierten Input- und Prozessvariablen Y = f (x) + ε bezeichnen wir als Prozessgleichung. Wir können dafür auch schreiben, Y ~ Nm (f (x), ΣYY). Da x ein Vektor fester Einstellgrößen für die Input- und Prozessvariablen ist, wird das Modell multivariates lineares Modell mit festen Input- und Prozessvariablen genannt. Ist X ein zufälliger Vektor von Input- und Prozessvariablen und sind Y und X gemeinsam nach einer n + m dimensionalen Normalverteilung verteilt, dann wird das Modell multivariates lineares multiples Modell mit stochastischen Input- und Prozessvariablen genannt. Wir beginnen mit dem Modell mit determinierten Input- und Prozessvariablen, da dieses aus der Literatur bekannt ist. 1316han05.indd 260 25.07.2006 11:39:23 5.11 Modelle für die Prozessgleichung 261 Den Vektor der Input- und Prozessvariablen bezeichnen wir mit x, den Vektor der Produktvariablen mit Y. Um das Ursache-Wirkungs-Prinzip auch in diesem Falle zu betonen, schreiben wir anstelle der Y auch Y = Y(x1, …, xn). Das multivariate lineare Modell mit festen Input- und Prozessvariablen wird wie folgt geschrieben Y(x1, …, xn) = f (x1, …, xn) + ε, wobei f (x1, …, xn) ist eine lineare Funktion, E[Y(x1, …, xn)] = f (x1, …, xn), ε ∼ Nμ(0, Σ), Σ ist positiv definit und f (x1, …, xn) und ε sind unabhängig voneinander. Die Kovarianzmatrix Σ, kann zwei grundsätzliche verschiedene Strukturen haben. Beim klassischen linearen Modell gilt var(ε) = σ2 IN, d. h. var(εi) = σ 2 und cov(εi, εk) = 0 für i ≠ k. Für das allgemeine lineare Modell gilt var(ε) = σ2 ΣYY. ΣYY wird manchmal als bekannt vorausgesetzt, kann aber auch unbekannte Modellparameter enthalten. σ2 ist in jedem Fall ein unbekannter Modellparameter. Die Eigenschaft gleicher Varianz σ2 der Fehlervariablen εi, i = 1, …, N wird als Homoskedastizität bezeichnet. Manchmal ist Σ diagonal, aber ≠ IN, so nennt man diesen Fakt Heteroskedastizität. Im Fall von Zeitreihendaten ist die Voraussetzung cov(εi, εk) = 0 für i ≠ k, d. h. der Unkorreliertheit der Fehlervariablen verletzt. In Kurzschrift können wir hierfür auch schreiben Y ~ Nm (f (x1, …, xn), Σ) mit den Eigenschaften der positiven Definitheit von Σ und der Unabhängigkeit von Fehler und linearer Funktion. Die statistischen Aufgaben sind in diesem Fall die • Bestimmung der linearen Funktion f (x1, …, xn), • Berechnung des Maßes der Beherrschbarkeit des Prozesses durch die ausgewählten Inputund Prozessvariablen, • Beantwortung der Frage, ob das berechnete Maß der Beherrschbarkeit auch mit weniger Input- und Prozessvariablen erreicht werden kann, d. h. Auswahl der optimalen Teilmenge von wesentlichen Input- und Prozessvariablen und Streichung der redundanten Variablen. Das lineare Modell mit festen Input- und Prozessvariablen kann nun durch • Varianzanalysen oder • Regressionsanalysen realisiert werden. Das Unterscheidungskriterium zwischen diesen beiden Modelltypen ist die Messbarkeit der Input- und Prozessvariablen. Sind x1, …, xn nur qualitativ messbar, d. h. lassen sich hierfür Abstufungen angeben, dann ist die Varianzanalyse der passende Modelltyp. Die Input- und Prozessvariablen sind feste Einstellgrößen, d. h. x1, x2, …, xn ∈ Rn. Die m, m ≥ 1 Produktvariablen Y1, Y2, …, Ym sind Zufallsgrößen und Funktionen der determinierten Inputund Prozessvariablen. Auch dieser Sachverhalt wird in Verbindung mit einer Verteilungsannahme 1316han05.indd 261 25.07.2006 11:39:23 262 5 Qualität in der Fertigung Y ∼ N m (B x , ΣYY ) , Y .x dargestellt, wobei BY.x die Matrix der unbekannten Koeffizienten der Prozessgleichungen ist, die den Vektor der Produktvariablen YT = (Y1 … Ym) als Linearkombination von den Inputund Prozessvariablen xT = (x1 … xn) darstellt. ΣYY ist die Kovarianzmatrix des Vektors der Produktvariablen. Die Normalverteilungsannahme ist oft gerechtfertigt und wird genau so oft, zumindest von Kritikern infrage gestellt. Unter den hier formulierten Voraussetzungen ist sowohl der lineare als auch nichtlineare Modellansatz möglich. Bei all diesen höher dimensionalen Problemen sollte die statistische Prozessanalyse zunächst mit linearen Modellen begonnen werden. Sind die Maße der Beherrschbarkeit niedrig und können nicht durch zusätzliche Input- und/oder Prozessvariable vergrößert werden, dann kann man zu den nichtlinearen Modellen übergehen. Die Stichprobe Y 1T = Y T (x11 , …, x1n ) … Y TN = Y T (x N 1 , …, x Nn ) an den N Messwertstellen für die Input- und Prozessvariablen ⎛ x11 … x1n ⎞ ⎜ ⎟ … ⎜ ⎟ ⎝ x N 1 … x Nn ⎠ und die Darstellung Y i = f (xi1 , …, xin ) + εi , ∀i = 1, …, N sind Grundlagen für die Berechnung der Prozessgleichung mit festen Input- und Prozessvariablen. Es wird noch vorausgesetzt, dass E [εi ] = 0 var (εi ) = Σ Des weiteren wird angenommen, daß f (x1, …, xn) von den unbekannten Modellparametern βY.1, …, βY.n abhängen möge. Es gibt folglich eine Funktionenschar f (x1 , …, xn ; β Y .1 , …, β Y .n ), mit (β Y .1 , …, β Y .n ) ∈ R n⋅m , die die unbekannte Funktion enthält. Für die Ableitung von Schätzfunktionen für die unbekannten Modellparameter wollen wir voraussetzen, daß die Funktion f nur linear von den unbekannten Koeffizienten abhängt, d. h. f (x1 , …, xn ; β Y .1 , …, β Y .n )=β Y .1 ⋅ g (x1 , …, xn ) + … + β Y .n ⋅ g (x1 , …, xn ) wobei g(x1, …, xn) bekannte linear unabhängige Funktionen sind. Diese Gleichung nennen wir Prozessgleichung, wenn xT = (x1, …, xn) der Vektor der determinierten Input- und Prozessvariablen ist. 1316han05.indd 262 25.07.2006 11:39:24 5.11 Modelle für die Prozessgleichung 263 5.11.1.1 Was versteht man unter einem univariaten, linearen, multiplen Modell mit festen Input- und Prozessvariablen? Dieses Modell besitzt die Darstellung Y = βTY . x ⋅ x + ε. In diesem Modell ist Y eine nach Y ~ N1 (βTY…x x, σ2) verteilte Zufallsgröße, xT = (x1, …, xn) der Vektor der festen Input- und Prozessvariablen und ε der Anpassungsfehler Y – βTY…x x mit der Verteilung ε ~ N1 (0, σ2). Y und ε sind unabhängig voneinander verteilt. Das dazugehörige statistische univariate, lineare, multiple Modell mit festen Input- und Prozessvariablen ist Y = βTY . x ⋅ x + ε wobei ⎛ Y1 ⎞ ⎛ x11 … x1N ⎞ ⎟ Y = ⎜ … ⎟ und x = ⎜ … ⎜ ⎟ ⎜ ⎟ ⎝YN ⎠ ⎝ x N 1 … x Nn ⎠ die Stichproben vom Umfang N für die Produktvariable Y und den Vektor der determinierten Input- und Prozessvariablen sind. In der Schreibweise mit der Verteilung gilt für dieses Modell Y ∼ N N (βYT . x ⋅ x , σ 2 ⋅ I N ) und ε ~ N N (0, σ 2 ⋅ I N ) wobei IN die N dimensionale Einheitsmatrix ist. Was müssen wir weiter tun? Wir müssen mit der Stichprobe für Y und x die unbekannten Modellparameter für das multivariate, lineare, multiple Modell mit festen Input- und Prozessvariablen schätzen. Hierzu verwenden wir die bekannte Methode der kleinsten Quadrate, die von Gauß eingeführt wurde. Diese Methode wollen wir an dem vereinfachten Beispiel 5.11.1 demonstrieren. Vereinfacht bedeutet, dass wir nur die eine Prozessvariable Geschwindigkeit betrachten und hierfür annehmen, dass diese Variable fest ist. Die Festlegung kann realisiert werden, idem wir die Geschwindigkeiten vorgeben und nach dem plötzlichen Bremsen die Länge des Bremsweges messen. Beispiel 5.11.1: Bremsweg. Einfache Prozessgleichung Wir betrachten nur die Abhängigkeit des Bremsweges Y [m] von der vorgegebenen Geschwindigkeit x [km/h]. In diesem einfachsten Fall erhalten wir das einfache lineare Modell mit einer festen Prozessvariablen Y = βY. x x + ε. Wir wollen annehmen, dass ε ~ N (0, σ2). Die beiden Modellparameter βY.x und σ2 sind unbekannt. Für deren Bestimmung wird eine Stichprobe für die beiden Produkt- und Prozessvariablen vom Umfang N benötigt. Um das Nachrechnen zu ermöglichen, betrachten wir nur die kleine Stichprobe in der Tabelle 5.11.1, die auch in der Datei 052Bremsweg03 auf der beiliegenden CD enthalten ist. 1316han05.indd 263 25.07.2006 11:39:24 264 5 Qualität in der Fertigung Tabelle 5.11.1: Messwerte für das Bremswegbeispiel Nr. Y x 1 2 3 4 5 6 7 8 9 10 35,1 34,1 39,5 36,9 34,1 34,4 30,7 30,3 33,9 49,7 58,0 55,6 60,4 59,8 58,4 58,7 56,3 52,5 54,4 70,5 Zuerst werden die statistischen Maßzahlen berechnet. Man erhält die Werte: Tabelle 5.11.2: Statistische Maßzahlen für das Bremswegbeispiel Statistische Maßzahl Y X Mittelwert Standardabweichung Minimum Maximum Spannweite Variationskoeffizient 35,87 5,539 30,3 49,7 19,4 15,4 58,46 4,895 52,5 70,5 18 8,4 Die statistischen Maßzahlen verraten nichts über die Abhängigkeit des Bremsweges von der Geschwindigkeit, obwohl die natürlich gegeben ist. Das lehrt die Erfahrung und zeigt die Abbildung 5.11.1. Diese Abbildung zeigt uns auch, dass die Abhängigkeit zwischen diesen beiden Variablen linear ist. Für das Bremswegbeispiel erhalten wir die Punktwolke der Abbildung 5.11.1. Plot Bremsweg über der Geschwindigkeit Bremsweg 50 46 42 38 34 30 52 56 60 64 68 72 Geschwindigkeit Abb. 5.11.1: Punktwolke für das Bremswegbeispiel Was ist in dieser Situation zu tun? Wir denken uns eine Gerade Y = b0 + bY.x x durch die „Punktwolke“ gelegt und fragen, wie die unbekannten Koeffizienten der Gleichung aus den Messwertepaaren für die beiden Variablen bestimmen werden können. 1316han05.indd 264 25.07.2006 11:39:24 5.11 Modelle für die Prozessgleichung 265 Das plausibelste Prinzip hierfür ist, den Abstand der einzelnen Punkte von der gedachten Gerade zu minimieren. Hierbei ist darauf zu achten, dass die Summe der Abstände oberhalb der Geraden genauso groß ist, wie die Summe der Abstände unterhalb der Geraden. Für diese Lösung betrachten wir die Quadrate der Abstände der Punkte von der Geraden. Der quadratische Abstand eines Punktes i mit den Koordinaten (xi, yi), i = 1, …, N von der gedachten Geraden yˆ = b 0 + b y . x x ist ( yˆ − yi )2 . Die Summe der quadratischen Abstände aller Punkte von der gedachten Ausgleichsgeraden ist N ∑ ( yi − yˆ )2 = i =1 N ∑ [ yi − (b0 + by . x x)]2 . i =1 Diese Summe soll minimiert werden. Für diese Aufgabe sind die Methoden der Differentialrechnung zu verwenden. Es müssen zunächst die partiellen Ableitungen der Summe der quadratischen Abweichungen gebildet und dann null gesetzt werden. Das so entstehende Gleichungssystem ist zu lösen. Formelmäßig erhält man QS = N N i =1 i =1 ∑ ( yi − yˆ )2 = ∑ ( yi − b0 − by . x x)2 ⇒ Min! N ∂QS = −2 ⋅ ∑ ( yi − b0 − b y . x x) ∂b0 i =1 N ∂QS = −2 ⋅ ∑ ( yi − b0 − b y . x x) ⋅ x ∂b y . x i =1 d. h. man muss das Gleichungssystem N ∑ ( yi − b0 − by . x x) = 0 i =1 N ∑ ( yi − b0 − by . x x) ⋅ x = 0 i =1 lösen. Das Gleichungssystem kann man umformen zu N ∑ yi i =1 N ∑ xi ⋅ y i i =1 N = N ⋅ b0 + b y . x ⋅ ∑ xi i =1 N N i =1 i =1 = b0 ⋅ ∑ xi + b y . x ⋅ ∑ xi2 Dieses Gleichungssystem nennt man Normal Gleichungs System (NGS) für die unbekannten Koeffizienten b0 und by.x der linearen Gleichung und die bekannten Ausdrücke 1316han05.indd 265 25.07.2006 11:39:24 266 5 Qualität in der Fertigung N N ∑ xi und ∑ xi2 . i =1 i =1 Dieses einfache NGS löst man am schnellsten mit der Kramer’schen Regel (siehe Bronstein [1960]). Die Koeffizientendeterminante des NGS ist N ∑ xi N N i =1 N i =1 i =1 D= ∑ xi ∑ xi2 D0 ist die Determinante, die sich aus D ergibt, wenn man in dieser die Spalte der KoeffiN zienten für das unbekannte b0 durch die Spalte der Absolutglieder ersetzt, d. h. N D0 = ∑ yi i =1 ∑ yi und i =1 N ∑ xi ⋅ y i i =1 N ∑ xi N i =1 N i =1 i =1 ∑ xi ⋅ yi ∑ xi2 Analog erhält man N ∑ yi N Dy.x = i =1 N N i =1 i =1 ∑ xi ∑ xi . ⋅ yi Damit erhält man für by.x den Ausdruck by . x = Dy.x D = N N N i =1 i =1 i =1 2 N ⋅ ∑ xi ⋅ y i − ∑ y i ⋅ ∑ xi ⎛N ⎞ N ⋅ ∑ xi2 − ⎜ ∑ xi ⎟ ⎝ ⎠ = Ax . y Ax ⋅ A y . i =1 Mit den Daten aus obiger Tabelle erhält man die Matrix ⎛ 2156.44 2324.68 ⎞ A =⎜ 2761.61 ⎟⎠ ⎝ und damit by . x = 1316han05.indd 266 2324.68 = 1.078. 2156.44 25.07.2006 11:39:25 5.11 Modelle für die Prozessgleichung 267 b0 kann man wie folgt berechnen: b0 = y − b y . x ⋅ x = 35.87 − 1.078 ⋅ 58.46 = −27.15 . Damit lautet die Prozessgleichung für die Länge des Bremsweges in Abhängigkeit von der Geschwindigkeit yˆ = −27.15 + 1.078 ⋅ x. Für den Korrelationskoeffizienten erhält man den Wert rxy = 2324.68 2156.44 ⋅ 2761.61 = 0.952. Zur Prüfung der Hypothese, ob der Bremsweg unabhängig von der gefahrenen Geschwindigkeit ist, muss der t-Test berechnet werden. Man erhält tˆ = 0.95 1 − 0.952 8 = 8.6. Der Tafelwert tα, FG für die Irrtumswahrscheinlichkeit α = 0.05 und 8 FG ist 1.859, d. h. die aufgestellte Hypothese der Unabhängigkeit muss verworfen werden. Die Länge des Bremsweges ist abhängig von der gefahrenen Geschwindigkeit. Die Stichprobenvarianz der einzelnen Messwerte um die Prozessgleichung, d. h. die Restvarianz kann man wie folgt berechnen: s 2y / x = N N 1 1 ⋅ ∑ ( yi − yˆ i )2 = ⋅ ∑ ( yi − b0 − b y . x ⋅ x)2 . N − 2 i =1 N − 2 i =1 Diese Art der Berechnung ist sehr aufwendig. Daher rechnet man die obige Formel um und erhält sY2 / x = s 2y ⋅ (1 − ry2/ x ), wobei rY/x der einfache Korrelationskoeffizient zwischen der Produktvariable Y und der Prozessvariable x ist. Nach dieser Formel erhält man die bedingte Stichprobenvarianz s2Y/x = 2.99 bzw. die bedingte Standardabweichung sY/x = 1.73. 5.11.1.2 Multivariates, multiples lineares Modell mit determinierten Input- und Prozessvariablen; Y ist ein zufälliger Vektor Anstelle der einen Produktvariablen Y müssen wir dem Vektor der m, m ≥ 1 nicht unabhängigen Produktvariablen YT = (Y1, …, Ym) betrachten. Mit den Abkürzungen T ⎛ Y1 ⎞ ⎛ βY 1.1 … βY 1.n ⎞ ⎛ βY 1. x ⎞ ⎛ εY 1 ⎞ ⎜ ⎟ = ⎜ … ⎟⎟ ∈ Μ m × n und ε = ⎜ … ⎟ Y = ⎜ … ⎟ , ΒY . x = ⎜ … ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝Ym ⎠ ⎝ βYm.1 … βYm.n ⎠ ⎜⎝ βT ⎟⎠ ⎝ εYm ⎠ Ym. x lautet dieses Modell Y = ΒTY . x ⋅ x + ε 1316han05.indd 267 25.07.2006 11:39:25 268 5 Qualität in der Fertigung wobei Y ~ Nm (ΒTY.x x, Σεε ) ε ~ Nm (0, Σεε ), Σ εε … cov(ε1 , εm )⎞ ⎛ σ12 … σ1m ⎞ ⎛ var(ε1 ) ⎟ ⎟=⎜ =⎜ … … ⎟. ⎜ ⎟ ⎜ 2 var(εm ) ⎠ ⎜⎝ σ m1 … σ m ⎟⎠ ⎝ cov(εm , ε1 ) … Y und ε sind unabhängig voneinander. In diesem Modell sind die Modellparameter ΒY.x und Σεε unbekannt und müssen mit den Werten einer Stichprobe geschätzt werden. Das statistische Modell ist gegeben durch Y = ΒTY.x x + ε, wobei gilt ⎛ Y11 … Y1N ⎞ ⎛ x11 … x1n ⎞ ⎟, x = ⎜ ⎟ die Stichprobe und Y =⎜ … … ⎜ ⎟ ⎜ ⎟ ⎝Ym1 … YmN ⎠ ⎝ x N 1 … x Nn ⎠ ⎛ ε11 … ε1N ⎞ ⎟ ε=⎜ … ⎜ ⎟ ⎝ ηm1 … εmN ⎠ In diesem Modell ist Y ~ NN (ΒY.xT x, ΣYY ⊗ IN), wobei ⊗ das Kronecker Produkt der beiden Matrizen ΣYY und IN bezeichnet. Dieses Produkt ist in diesem Spezialfall ΣYY ⊗ I N ⎛ ΣYY ⎜ 0 =⎜ ⎜… ⎜⎝ 0 0 ΣYY 0 … … 0 ⎞ 0 ⎟ ⎟ ⎟ … ΣYY ⎟⎠ eine Block-Diagonalmatrix, die N mal die Kovarianzmatrix der Produktvariable Y enthält. 5.11.2 Lineare Modelle mit stochastischen Input- und Prozessvariablen Diese Modelle haben formal dasselbe Aussehen wie die Modelle mit determinierten Inputund Prozessvariablen. Trotzdem unterscheiden sich die Modelle wesentlich, vorallem bzgl. der Verteilungen für die Schätz- und Teststatistiken. Warum müssen wir Modelle mit stochastischen Input- und Prozessvariablen betrachten? Sehr häufig ist die Voraussetzung, dass die Input- und Prozessvariablen feste Einstellgrößen sind, in der Praxis verletzt. Betrachtet man z. B. die Prozessvariable Temperatur bei der Her- 1316han05.indd 268 25.07.2006 11:39:26 5.11 Modelle für die Prozessgleichung 269 stellung von Hochbrand Porzellan, dann wird diese zwar auf 1400 °C eingestellt, aber an den verschiedenen Stellen des Ofens und damit für verschiedene Teile des zu brennenden Gutes im Ofen sind die Temperaturen zufällig unterschiedlich. Der fest eingestellte Parameter wirkt somit auf das Produkt stochastisch. Daraus folgt, dass neben den bisher genannten Modellen die Modelle mit stochastischen Input- und Prozessvariablen betrachtet werden müssen. Es gibt einen weiteren Grund für die Verwendung dieses Modells. Die Inputvariablen sind Produktvariable eines Vorläuferprozesses und damit natürlich stochastisch. 5.11.2.1 Wie sieht das multiple lineare Modell mit stochastischen Input- und Prozessvariablen aus und wodurch unterscheidet es sich von dem Modell mit festen Input- und Prozessvariablen? Die Ableitung des Modells für diesen praktisch relevanten Fall basiert auf der gemeinsamen, multivariaten Verteilung für die Input- (Z1, …, Zl), Prozess- (X1, …, Xn) und Produktvariablen (Y1, …, Ym). Im univariaten, multiplen, linearen Modell wird nur eine Produktvariable Y betrachtet. X und Z können Vektoren von Input- und Prozessvariablen sein. Wir wollen hier annehmen, dass die gemeinsame Verteilung des Vektors (ZT, XT, Y) = (XT, Y) ~ Nn + 1 (µ, Σ), wobei die Input- und Prozessvariablen der Einfachheit halber zu dem Vektor X zusammengefasst werden und Σ als positiv definit vorausgesetzt wird. Mit der Zerlegung des zufälligen Vektors (Y, XT) in den Teilvektor der Input- und Prozessvariablen X, d. h. die Ursachen und die Wirkung Y, erhält man für die Momente µT = (µY, µTX) und ⎛ σ2 Σ=⎜ Y ⎝ σTY . X ⎞ ⎟ Σ XX ⎠ den bedingten Erwartungswert 1 E [Y / X ] = μY + σTY . X Σ −XX ( X − μ X ) = β0 + βYT / X X und die bedingte Varianz 1 var [Y / X ] = σY2 − σTY . X Σ −XX σY . X . In diesen Formeln haben die einzelnen Symbole die folgenden Bedeutungen: σ2Y ist die Varianz der Produktvariablen Y, σY.X ist der Vektor der Kovarianzen zwischen der Produktvariablen und dem Vektor der Inputund Prozessvariablen X und ΣXX ist die Kovarianzmatrix für die Input- und Prozessvariable. Der bedingte Erwartungswert wird auch Regressionsfunktion genannt. Sie sehen erstens den Unterschied zur Regressionsanalyse mit festen Input- und Prozessvariablen und zweitens die Möglichkeit der anderen Darstellung in Form der Prozessgleichung Y = β0 + βY/X X + FY/X, 2 wobei βY/X = σY.X Σ–1 YY, β0 = µY – βY/X µX und FY/X = Y – E [Y/X] ~ N1 (0, σ Y/X) ist der normalverteilte Anpassungsfehler. Y und FY/X sind unabhängig voneinander. 1316han05.indd 269 25.07.2006 11:39:26 270 5 Qualität in der Fertigung Beispiel 5.11.2: Bremsweg. Prozessgleichung mit mehreren Prozessvariablen Neben der Produktvariable Y werden die Prozessvariablen X1 = Geschwindigkeit [km/h] X2 = Profiltiefe [mm] X3 = Reaktionszeit [sec] betrachtet. Die Prozessvariablen sind Zufallsgrößen. Die Kovarianzmatrix ist ⎛ σY2 ⎜ ⎜ Σ=⎜ ⎜ ⎜⎝ σY .1 σY .2 σ 2x1 σ x1. x 2 σ 2x 2 σY .3 ⎞ ⎟ σ x1. x 3 ⎟ ⎛ σY2 ⎟=⎜ σ x 2. x 3 ⎟ ⎝ σ 2x 2 ⎟⎠ σYT . X ⎞ ⎟. Σ XX ⎠ Das Modell lautet Y = β0 + βY.1/2, 3 X1 + βY.2/1, 3 X2 + βY.3/1, 2 X3 und var[Y/X] = σ2Y/X = σ2Y – σTY.X Σ–1 XX σY.X, wobei β0 = βTY / X (μY − μ X ) und 1 βTY / X = σTY . X Σ −XX bedeuten. Die beiden Modellparameter σY2 / X und βY / X sind unbekannt und müssen mit einer Stichprobe geschätzt werden. Die Unterschiede zum Modell mit festen Input- und Prozessvariablen bestehen hauptsächlich darin, dass • die Modellparameter im Modell mit stochastischen Input- und Prozessvariablen die Parameter einer bedingten Verteilung sind, • in den Verteilungen der Schätzungen für die unbekannten Modellparameter und • in den Verteilungen der Teststatistiken. Was ist das Maß der Beherrschbarkeit? Das Quadrat des multiplen Korrelationskoeffizienten ρ2Y/X zwischen Y und der linearen Prozessgleichung wird Maß der Beherrschbarkeit des Prozesses genannt, denn dieses Maß gibt an, wie gut die Varianz der Produktvariablen Y durch die Input- und Prozessvariablen erklärt wird. Der Sprachgebrauch „Maß der Beherrschbarkeit“ wird durch die Beziehung σY2 / X = σY2 ⋅ (1 − ρY2 / X ) deutlich, in der σ2Y die Varianz von Y und ρ2Y/X den multiplen Korrelationskoeffizienten zwischen Y und der Prozessgleichung bezeichnen. Man kann von der bedingten Varianz ausgehen und daraus das Maß der Beherrschbarkeit über die Beziehung 1316han05.indd 270 25.07.2006 11:39:26 271 5.11 Modelle für die Prozessgleichung ρY2 / X = 1 − σY2 / X σY2 = 1 σTY . X ⋅ Σ −XX ⋅ σY . X σY2 = βTY / X ⋅ Σ XX ⋅ βY / X σY2 ausrechnen. Sind Y und X unabhängig voneinander, dann ist ρ2Y/X = 0 und daraus folgt σ2Y/X = σ2Y, d. h. der Vektor der Input- und Prozessvariable trägt nicht zur Erklärung der Varianz der Produktvariablen bei. Sind Y und X mit Wahrscheinlichkeit 1 voneinander linear abhängig, dann ist ρ2Y/X = 1 und somit ist σ2Y/X = 0, d. h. alle Punkte Ŷ liegen auf der Ausgleichshyperebene. Die bedingte Varianz der Produktvariablen unter der Wirkung der Input- und Prozessvariablen ist null, d. h. die Varianz von Y wird durch die Input- und Prozessvariablen vollständig erklärt. Beispiel 5.11.3: Bremsweg. Mehrere Prozessvariable Der Prozess ist das Bremsen eines PKW’s vor einem plötzlich auftauchenden Hindernis. Die Produktvariable Y ist der Bremsweg in [m]. Die Prozessvariablen sind X1 = Geschwindigkeit in [km/h], X2 = Gewicht des PKW [kg] und X3 = Profiltiefe des Reifens in [mm]. Ein PKW vom selben Typ wurde von ein und denselben Fahrer auf ein und derselben Strasse unter den gleichen Wetterbedingungen mit verschiedenen Reifen auf unterschiedliche Geschwindigkeiten beschleunigt und vor dem Hindernis abgebremst. Die Daten dieses Versuches sind im Internet unter dem Namen 05.11.3 Bremsweg enthalten. Die statistischen Maßzahlen sind in der Tabelle 5.11.3 enthalten. Tabelle 5.11.3: Statistische Maßzahlen Statistische Maßzahlen Mittelwert Standardabweichung Y X1 X2 X3 25,907 49,862 1440,23 3,549 0,832 3,276 168,0 0,496 Minimum 23,98 42,60 1040,4 2,165 Maximum 28,11 57,45 1832,8 5,18 Die statistischen Maßzahlen sagen nichts aus über die Abhängigkeitsstruktur zwischen den Variablen. Man kann aus ihnen nicht ablesen, ob die Vergrößerung der Geschwindigkeit des PKW zu einem längeren Bremsweg führt. Um das ablesen zu können müssen wir zunächst die Korrelationsmatrix für diese Variablen berechnen. Die Werrte stehen in der Tabelle 5.11.4. Tabelle 5.11.4: Korrelationsmatrix Korr.Matrix Y X1 X2 X3 Y 1 0,828 0,748 –0,677 1 0,425 –0,275 1 –0,437 X1 X2 X3 1316han05.indd 271 1 25.07.2006 11:39:26 272 5 Qualität in der Fertigung Die Korrelationsmatrix sagt uns, dass die Länge des Bremsweges und die Geschwindigkeit hoch miteinander korreliert sind. Die Länge des Bremsweges hängt aber außerdem von dem Gewicht und der Profiltiefe ab, wobei die Länge des Bremsweges und die Profiltiefe negativ korreliert sind, d. h. je tiefer die Profile sind, desto kürzer ist der Bremsweg, oder anders ausgedrückt, je abgefahrener die Reifen sind, desto länger wird der Bremsweg. Die Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen unter den Bedingungen, dass alle anderen Variablen konstant gehalten werden, sind in der Tabelle 5.11.5 enthalten. Tabelle 5.11.5: Matrix der partiellen Korrelationskoeffizienten Part.Korr.Matrix Y Y X1 X2 X1 X2 X3 0,976 0,926 –0,943 –0,875 0,913 0,827 X3 Der partielle Korrelationskoeffizient rY.1/2, 3 = 0,976 zwischen der Länge des Bremsweges Y und der Geschwindigkeit X1 unter der Bedingung, dass sowohl das Gewicht X2 als auch die Profiltiefe X3 konstant gehalten werden, ist größer als der ursprüngliche einfache Korrelationskoeffizient. Der partielle Korrelationskoeffizient r1.2/X, 3 = –0,875 zwischen X1 und X2 unter der Bedingung Y und X3 wird sogar negativ. Das zeigt, dass die Variablen sehr stark voneinander abhängen. Die partiellen Korrelationskoeffizienten für die Produktvariable Y mit allen Prozessvariablen liefert eine Rangfolge für den Einfluss der Prozessvariablen auf die Produktvariable. Den stärksten Einfluss hat die Prozessvariable X1, gefolgt von der Prozessvariablen X3 und X2. Da alle diese partiellen Korrelationskoeffizienten groß sind, folgt, dass alle Prozessvariablen einen starken Einfluss auf die Produktvariable Y haben. Die Determinante der Korrelationsmatrix R als globales Maß für die Abhängigkeitsstruktur besitzt den Wert det(R) = 0,00885. Die Kleinheit dieses Wertes zeigt die Straffheit der Abhängigkeitsstruktur. Der Grad der Multikollinearität ist der Kehrwert der Determinante der Korrelationsmatrix nur für die Prozessvariablen. Die Determinante det(RXX) = 0,655 ist erfreulich groß, d. h. die Schätzungen für die Koeffizienten der Prozessgleichung werden nicht wesentlich durch den Grad der Multikollinearität beeinflusst. Die Folge der Prozessgleichungen für die Produktvariable, in der Tabelle 5.11.6 zusammengestellt, nacheinander für die Abhängigkeit nur von X1, dann in Abhängigkeit von X1 und X2 und dann von X1, X2 und X3 zeigen, dass die multiplen Korrelationskoeffizienten für die Produktvariable Y in Abhängigkeit von den Prozessvariablen mit zunehmender Information durch die größer werdende Anzahl von Prozessvariablen größer werden und die bedingten Standardabweichungen die gegensätzliche Tendenz aufweisen. 1316han05.indd 272 25.07.2006 11:39:26 273 5.11 Modelle für die Prozessgleichung Tabelle 5.11.6: Folge der Prozessgleichungen für die zunehmende Anzahl von Prozessvariablen Absolutglied X1 X2 X3 R2Y/X SY/X F-Wert – – 0,6861 0,4683 292,9 Koeffizienten t-Test 15,41 25,07 0,2105 17,11 Koeffizienten t-Test 14,56 37,3 0,1583 18,6 0,0024 14,4 – 0,8774 0,2938 475,9 Koeffizienten t-Test 18,30 105,7 0,1481 51,84 0,0017 28,2 –0,6198 32,6 0,9865 0,09788 3213 Betrachten wir die Prozessgleichung für Y in Abhängigkeit von X1 allein, dann ist das Maß der Beherrschbarkeit 0,686 und die bedingte Standardabweichung ist sY/X = 0,468. Betrachten wir Y in Abhängigkeit von X1, X2 und X3 dann ist das Maß der Beherrschbarkeit R2Y/X = 0,986 und die bedingte Standardabweichung ist sY/X = 0,09788. Für die Prozessgleichungen in der Anwendung bedeutet die Anforderung, dass das Maß der Beherrschbarkeit größer als 0,9 sein soll keine Utopie, sondern lediglich die verschärfte Suche nach Input- und Prozessvariablen, die einen Einfluss auf den oder die Produktvariablen haben. Als Prozessverbesserung definierten wir • die Reduktion der Variabilität der Produktvariablen und • die Steuerung des Prozesses mit der Prozessgleichung, so dass simultan alle relevanten Kundenanforderungen erfüllt werden. Diese beiden Anliegen werden durch die Abbildung 5.11.2 und Abbildung 5.11.3 verdeutlicht. 28 27 26 Y 25 24 24.5 25.0 25.5 26.0 26.5 27.0 27.5 Fitted : X1 Abb. 5.11.2: Streuung der Messwerte für Y um die Prozessgleichung mit einer Prozessvariablen 1316han05.indd 273 25.07.2006 11:39:27 274 5 Qualität in der Fertigung 28 27 26 Y 25 24 24 25 26 27 28 Fitted : X1 + X2 + X3 Abb. 5.11.3: Messwerte für Y um die Prozessgleichung mit drei Prozessvariablen Diese beiden Abbildungen zeigen deutlich, dass sich die Suche nach der erschöpfenden Anzahl von Input- und Prozessvariablen lohnt. 5.11.2.2 Das multivariate, multiple, lineare Modell mit stochastischen Input- und Prozessvariablen Jedes Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben. Folglich benötigen wir ein Modell, in dem Y ein Vektor von Produktvariablen ist, der durch Linearkombinationen in den Input- und Prozessvariablen erklärt werden soll. In diesem Fall betrachten wir die Zerlegung der Kovarianzmatrix ⎛ ΣYY Σ=⎜ ⎝ Σ XY ΣYX ⎞ Σ XX ⎟⎠ und damit das Modell Y = β0 + βTY/X X + FY/X, wobei FY/X ~ N (0, ΣYY/X) der Vektor der Fehler, βTY/X = ΣYX Σ–1 XX die Matrix der unbekannten Koeffizienten des Systems der Prozessgleichungen und FY/X = Y – βTY/X X ~ ΣYY/X 1 ist. Die bedingte Kovarianzmatrix ΣYY/X wird nach der Beziehung ΣYY / X = ΣYX ⋅ Σ −XX ⋅ Σ XY berechnet. 1316han05.indd 274 25.07.2006 11:39:27 5.11 Modelle für die Prozessgleichung 275 Beispiel 5.11.4: Multivariates multiples Modell mit zwei Produkt- und zwei stochastischen Prozessvariablen. Bedingte Kovarianz und bedingte Erwartungswerte Für zwei Produkt- und zwei Input- und Prozessvariablen soll das multivariate multiple lineare Modell mit stochastischen Input- und Prozessvariablen ausführlich aufgeschrieben werden. Mit der Zerlegung der Kovarianzmatrix in die Elemente ⎛ ΣYY Σ=⎜ ⎝ ⎛ σY2 1 ⎜ ΣYx ⎞ ⎜ = Σ XX ⎟⎠ ⎜⎜ ⎜ ⎝ σY1Y2 σY1 .1 σY22 σY2 .1 σY1 .2 ⎞ ⎟ σY2 .2 ⎟ ⎟ σ12 ⎟ ⎟ σ 22 ⎠ σ12 erhalten wir die Matrix der bedingten Erwartungswerte und die bedingte Kovarianzmatrix 1 E [Y / X] = ΣY . X Σ −XX (X − μ X ) =: ΒY / X (X − μ X ) und 1 var(Y / X) = ΣYY − ΣY . X Σ −XX Σ X .Y = ΣYY / X Schreiben wir diese Ausdrücke ausführlich auf, dann erhalten wir ⎛ σ 22 ⎛ σY1 .1 σY1 .2 ⎞ 1 E [Y / X] = ⎜ ⎟ 2 2 2 ⎜ ⎝ σY2 .1 σY2 .2 ⎠ σ1 ⋅ σ 2 (1 − ρ12 ) ⎝ −σ12 ⎛ σY .1σ 22 − σY .2 σ12 1 1 ⎜ 2 2 2 ) σ1 ⋅ σ 2 (1 − ρ12 =⎜ ⎜ σ σ2 − σ σ2 Y2 .1 2 ⎜ Y2 .1 2 ⎜⎝ σ 2 ⋅ σ 2 (1 − ρ2 ) 1 2 12 ⎛ βY1 .1/ 2 =⎜ ⎝ βY2 .1/ 2 −σ12 ⎞ ⎛ X1 − μ1 ⎞ ⎟⋅⎜ ⎟ σ12 ⎠ ⎝ X 2 − μ 2 ⎠ −σY1 .2 σ12 + σ12 σY1 .2 ⎞ ⎟ 2 ) ⎟ ⎛ X1 − μ1 ⎞ σ12 ⋅ σ 22 (1 − ρ12 ⋅⎜ ⎟ σY2 .2 σ12 − σY2 .1σ12 ⎟ ⎝ X 2 − μ 2 ⎠ ⎟ σ 2 ⋅ σ 2 (1 − ρ2 ) ⎟⎠ 1 2 12 βY1 .2 /1 ⎞ ⎛ X1 − μ1 ⎞ ⋅ βY2 .2 /1 ⎟⎠ ⎜⎝ X 2 − μ 2 ⎟⎠ Formt man einen Regressionskoeffizienten, z. B. den ersten aus der Matrix der Regressionskoeffizienten unter Verwendung der Korrelationskoeffizienten um, dann erhält man βY1 .1/2 = ρY1 .1 σY1 σ 22 − ρY1 .2 σY1 σ 2 ρ12 σ1 σ 2 σ12 ⋅ σ 22 (1 − 2 ρ12 ) = ρY1 .1/2 σY1 2 σ1 ⋅ (1 − ρ12 ) einen Quotienten mit dem partiellen Korrelationskoeffizienten im Zähler. Hieraus erklärt sich der Sprachgebrauch partieller Regressionskoeffizient. Ähnliche Umformungen der bedingten Kovarianzmatrix liefern ⎛ σY2 / X 1 var(Y / X) = ⎜ ⎜⎝ 1316han05.indd 275 σY1Y2 / X ⎞ ⎟. σY22 / X ⎟⎠ 25.07.2006 11:39:27 276 5 Qualität in der Fertigung Gibt es auch für das multivariate multiple Modell ein Maß der Beherrschbarkeit? Ja, für das multivariate multiple Modell zur Berechnung des Systems der Prozessgleichungen benötigen wir ein verallgemeinertes Maß der Beherrschbarkeit. Diese ist der multivariate, multiple Korrelationskoeffizient τY2 / X = 1 − ΣYY / X ΣYY , wobei ΣYY / X und Σ YY die Determinanten der bedingten bzw. unbedingten Kovarianzmatrix der Produktvariable sind. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit zwischen dem Vektor der Produktvariablen und dem System der Prozessgleichungen. Beispiel 5.11.5: Multivariates multiples Modell mit zwei Produkt- und zwei stochastischen Prozessvariablen. Multivariater multipler Korrelationskoeffizient Für das Beispiel 16 kann man den multivariaten, multiplen Korrelationskoeffizienten umformen. Man erhält: τ2Y / X = 1 − ΣYY / X ΣYY = 1− σY21 σY1Y2 / X σY1Y2 / X σY22 / X σY21 σY1Y2 = 1− σY21 / X σY22 / X − σY21Y2 / X σY21 σY22 − σY21Y2 σY22 = 1− (1 − ρY21 / X )(1 − ρY21Y2 / X ) (1 − ρY21Y2 ) Für m = 1 ist τ2Y/X gleich ρ2Y/X. τ2Y/X gibt also auch an, wie gut die verallgemeinerte Varianz des Vektors der Produktvariable durch die Kovarianzmatrix der Input- und Prozessvariable erklärt wird. 5.11.3 Statistische Modelle mit stochastischen Input- und Prozessvariablen Die statistischen Modelle sehen sehr ähnlich wie die theoretischen Modelle aus. Der Unterschied besteht darin, dass anstelle der Zufallsgrößen zufällige Stichprobenvektoren, anstelle der zufälligen Vektoren zufällige Stichprobenmatrizen stehen und anstelle der Modellparameter die statistischen Schätzungen stehen. Aus den verschiedenen Modellen erkennt man, dass das lineare Modell mit festen Input- und Prozessvariablen das bedingte Modell des entsprechenden Modells mit stochastischen Inputund Prozessvariablen ist. Diese Feststellung ist bedeutsam für die Ableitung der Schätzfunktionen. 1316han05.indd 276 25.07.2006 11:39:27 5.11 Modelle für die Prozessgleichung 277 Welche Ziele können mit den linearen Modellen erreicht werden? Das statistische lineare Modell mit stochastischen Input- und Prozessvariablen liefert uns • die notwendige Prozessgleichung. Damit können die Produktvariablen zielgerichtet über die Input- und Prozessvariablen so gesteuert werden, dass – simultan alle Kundenanforderungen erfüll und – die Varianzen der Produktvariablen reduziert werden können. • An die Stelle der Streuung der Produktvariablen tritt die bedingten Streuung der Produktvariablen unter der Bedingung, dass die Input- und Prozessvariablen realisiert sind, d. h. als Messwerte vorliegen. Die Bedeutung dieses zweiten Faktes zeigt uns noch einmal die Abbildung 5.11.4. Diese Bedingung ist Ausdruck der Wirkungsweise des Ursache-Wirkungs-Prinzipes und bezieht die Informationsmenge ein, die durch die Wirkung der Input- und Prozessvariablen gegeben ist. Die bedingte Varianz σ2Y/X ist stets kleiner oder gleich der unbedingten Varianz σ2Y für die Produktvariable Y. Das folgt sofort aus der Formel σY2 / x = σY2 ⋅ (1 − Ρ Y2 / x ) in der P2Y/x der multiple Korrelationskoeffizient zwischen einer Produktvariablen Y und der Prozessgleichung ist. Produktvariable Y obere Toleranz Sollwert untere Toleranz Prozessvariable X Abb. 5.11.4: Vergleich der Breiten der Verteilung der Produktvariablen Y und der bedingten Verteilung von Y unter X 1316han05.indd 277 25.07.2006 11:39:27 278 5 Qualität in der Fertigung 5.11.4 Wie kann man die Schätzungen für die unbekannten Modellparameter für die Modelle mit stochastischen Input- und Prozessvariablen gewinnen? Das Modell mit stochastischen Input- und Prozessvariablen wurde aus der gemeinsamen multivariaten Verteilung für die Produkt-, Prozess- und Inputvariablen abgeleitet. Zu diesem Zweck haben wir angenommen, dass der Vektor mit allen Komponenten multivariat normalverteilt ist, oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Das bedeutet aber, dass die analytische Form der Verteilungsdichte bekannt ist. Andererseits haben wir immer wieder darauf hingewiesen, dass die unbekannten Modellparameter nur mit Hilfe einer Stichprobe geschätzt werden können. Eine Stichprobe besteht aus N unabhängigen „Beobachtungsvektoren“ für den Vektor der Produkt-, Prozess- und Inputvariablen. Damit können wir die sogenannte Likelihood Funktion als Produkt der Verteilungsdichten L (βY / X , σY2 / X ) = N ∏ f [( yi , xi ); βY / X , σY2 / X ] i =1 an den Stellen der Beobachtungsvektoren aufschreiben und diesen Ausdruck mit den bekannten Werten für die Input-, Prozess- und Produktvariablen als Funktion der unbekannten Modellparameter auffassen. Die Maximierung der Likelihood Funktion liefert Schätzungen für die unbekannten Modellparameter. Auch das ist ein heuristisches Prinzip. Es liefert aber praktisch vernünftige Schätzfunktionen für die unbekannten Modellparameter. Wir haben die Stichprobe ⎛ X11 ⎜ X ⎜ 21 ⎜ … (X , Y ) = ⎜ ⎜ ⎜ X N −1.1 ⎜ X ⎝ N1 … … X1n X 2n Y11 Y21 … … X N −1.n … X Nn YN −1.1 YN 1 … … Y1m ⎞ Y2m ⎟ ⎟ ⎟ ⎟ ⎟ … YN −1.m ⎟ … YNm ⎟⎠ für den multivariaten, multiplen Fall. Die Maximum Likelihood Methode liefert uns die Schätzfunktionen ⎛1 N (X T , YT ) = ⎜ ⋅ ∑ X Ti ⎝ N i =1 1 N T⎞ ⋅ ∑ Yi N i =1 ⎟⎠ für den Mittelwertvektor. Für die Schätzfunktion gilt ⎡⎛μ X ⎞ 1 ⎛X⎞ ⎢ ∼ N ⎜ ⎟, n m + ⎜⎝ Y ⎟⎠ ⎢⎣ ⎝ μY ⎠ N ⎛ Σ XX ⋅⎜ ⎝ Σ XY ⎞ ⎤ ⎥ ΣYY ⎟⎠ ⎥ ⎦ Außerdem erhalten wir die Schätzfunktion A= N ∑ (Vi − V)T (Vi − V), i =1 1316han05.indd 278 25.07.2006 11:39:27 5.11 Modelle für die Prozessgleichung 279 für die Kovarianzmatrix, wobei wir der Einfachheit halber die Input-, Prozess- und Produktvariablen in V zusammengefasst haben. Die Schätzfunktion A für die Kovarianzmatrix ist Wishart verteilt, mit N – 1 FG und dem Verteilungsparameter Σ. Hierfür schreiben wir abkürzend A ~ Wn + m (N – 1, Σ). Die Schätzfunktionen für den Vektor der Erwartungswerte und die Kovarianzmatrix sind unabhängig voneinander. Die Stichprobenmatrix A wird analog zu Σ in ⎛ A2 A=⎜ Y ⎝ AYT. X ⎞ ⎟ AXX ⎠ zerlegt. Mit diesen Größen können wir die Schätzfunktionen für die unbekannten Koeffizienten in den Prozessgleichungen und die unbekannten bedingten Varianzen (Restvarianzen) aufschreiben. Wir erhalten BTY/X = A −xx1 ⋅ AY . x B0 = Y − BTY/X x SYY / X = 1 1 1 1 (AYY − AYX ⋅ A −XX ⋅ A XY ) = (A YY − BTY/X ⋅ A XX ⋅ BY / X ) = ⋅ AYY / X . N N N Am Beispiel des Plastikgehäuses für den Akku-Bohrschrauber wollen wir alle Schritte ausführlich demonstrieren. Beispiel 5.11.6: Akkubohrschrauber. Statistische Prozessanalysen Das Problem Bei der Montage des Akku-Bohrschraubers treten Probleme auf. Diese wurden erstmals bei der Durchführung einer Montagezeitstudie mit MOST (Maynards Operation Sequence Technique) deutlich. Als Ursachen hierfür wurden Qualitätsmängel an den Plastikschalen für den Bohrschrauber erkannt. Einige Schalen ließen sich gut, andere weniger gut montieren. Für das Plastikgehäuse eines Akku-Bohrschraubers in der Abbildung 5.11.1 wurde daraufhin ein Produktaudit durchgeführt. Die Daten für die Prozess- und Produktvariablen sind in der Datei 05.11.6 Akkubohrschrauber im Internet enthalten. Zu diesem Zweck werden das Plastikschalen durch die Produktvariablen Y1 = Thermoschrumpf in [%] Y2 = Abweichung in axialer Richtung [mm] Y3 = Abweichung von der Parallelität [mm] Y4 = Dicke [mm] parametrisiert. Das ist eine Auswahl und diese erhebt nicht den Anspruch auf Vollständigkeit. Die gegebenen Toleranzen der Tabelle 5.2.1 wurden mit der statistischen Tolerierung überprüft. Die statistischen Toleranzen sind in der Tabelle 5.2.4 zusammengestellt. 1316han05.indd 279 25.07.2006 11:39:28 280 5 Qualität in der Fertigung Abb. 5.11.5: Akku-Bohrschrauber Problemdefinition Das Problem wird mit den uni- und multivariaten Prozessfähigkeitsindizes aus dem Abschnitt 5.2. definiert. Es gilt MCpk = 0,73 mit den berechneten statistischen Toleranzen. Da dieser Wert kleiner als eins ist, muss der Prozess verbessert werden. Problemlösung Die Verbesserung der Produktqualität ist nur durch die Steuerung des Herstellungsprozesses mit einer Prozessgleichung möglich. Daher müssen wir eine umfassende statistische Prozessanalyse durchführen, die wesentlichen Input- und Prozessvariablen auswählen und die Prozessgleichungen für die Produktvariablen berechnen. Statistische Prozessanalyse Der Herstellungsprozess für die Plastikgehäuse wird durch die Input- und Prozessvariablen X1 = Friktion im Extruder (Reibungszahl µ, dimensionslos) X2 = Heiztemperatur [°C] X3 = Masse – Volumen – Index (mvi) X4 = Dichte X5 = Massetemperatur [°C] beschrieben. Auch das ist nur eine Auswahl. Modellierung Das multivariate multiple lineare Modell hat das Aussehen Y1 = β0.1 + βY1.1/2, 3, 4, 5 X1 + βY1.2/1, 3, 4, 5 X2 + βY1.3/1, 2, 4, 5 X3 + βY1.4/1, 2, 3, 5 X4 + βY1.5/1, 2, 3, 4 X5 Y2 = β0.2 + βY2.1/2, 3, 4, 5 X1 + βY2.2/1, 3, 4, 5 X2 + βY2.3/1, 2, 4, 5 X3 + βY2.4/1, 2, 3, 5 X4 + βY2.5/1, 2, 3, 4 X5 Y3 = β0.3 + βY3.1/2, 3, 4, 5 X1 + βY3.2/1, 3, 4, 5 X2 + βY3.3/1, 2, 4, 5 X3 + βY3.4/1, 2, 3, 5 X4 + βY3.5/1, 2, 3, 4 X5 Y4 = β0.4 + βY4.1/2, 3, 4, 5 X1 + βY4.2/1, 3, 4, 5 X2 + βY4.3/1, 2, 4, 5 X3 + βY4.4/1, 2, 3, 5 X4 + βY4.5/1, 2, 3, 4 X5. 1316han05.indd 280 25.07.2006 11:39:28 281 5.11 Modelle für die Prozessgleichung Die Matrix der Prozessgleichungskoeffizienten wurde nach der Beziehung 1 ΒY / X = ΣY . X Σ −XX erhalten, wobei diese Matrizen aus der Zerlegung ⎛ ΣYY Σ=⎜ ⎝ ⎛ σY 1Y 1 σY 1Y 2 σY 1Y 3 ⎜ σY 2Y 2 σY 2Y 3 ⎜ ⎜ σY 3Y 3 ⎜ ΣYX ⎞ ⎜ =⎜ Σ XX ⎟⎠ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝ σY 1Y 4 σY 1X1 σY 1X 2 σY 1X 3 σY 1X 4 σY 1X 5 ⎞ σY 2Y 4 σY 2 X 1 σY 2 X 2 σY 2 X 3 σY 2 X 4 σY 2 X 5 ⎟ ⎟ σY 3Y 4 σY 3 X1 σY 3 X 2 σY 3 X 3 σY 3 X 4 σY 3 X 5 ⎟ ⎟ σ Y 4Y 4 σ Y 4 X 1 σ Y 4 X 2 σ Y 4 X 3 σ Y 4 X 4 σ Y 4 X 5 ⎟ σ X1X1 σ X1X 2 σ X1X 3 σ X1X 4 σ X1X 5 ⎟ ⎟ σX2X2 σX2X3 σX2X4 σX2X5 ⎟ σ X3X3 σ X3X 4 σ X3X5 ⎟ ⎟ σX4X4 σX4X5 ⎟ σ X 5 X 5 ⎟⎠ stammen. Die bedingte Kovarianzmatrix wird nach der Gleichung 1 ΣYY / X = ΣYY − ΣYY . X Σ −XX Σ X .YY berechnet. In den linearen Modellen sind die Modellparameter BY/X und ΣYY/X unbekannt. Diese müssen aufgrund einer Stichprobe geschätzt werden. Die Korrelationsmatrix hierfür ist Tabelle 5.11.7: Korrelationsmatrix für den Akku-Bohrschrauber Y1 Y1 Y2 Y3 Y4 X1 X2 X3 X4 X5 1 0,036 –0,457 –0,102 –0,136 0,414 0,275 –0,41 0,224 0,417 –0,042 –0,113 0,081 –0,332 0,108 –0,132 1 Y2 Y3 1 Y4 0,355 1 X1 –0,133 –0,151 –0,236 0,2 –0,285 0,387 0,272 0,045 0,257 0,032 0,561 0,346 –0,108 0,319 0,447 –0,371 0,547 –0,878 0,838 1 X2 1 X3 1 X4 1 X5 –0,782 1 Diese Korrelationsmatrix entspricht der Zerlegung der Gesamtkorrelationsmatrix R in die Blöcke ⎛ RYY R=⎜ ⎝ R XY 1316han05.indd 281 RYX ⎞ R XX ⎟⎠ 25.07.2006 11:39:28 282 5 Qualität in der Fertigung RYY = Korrelationsmatrix der Produktvariablen, RYX = Korrelationsmatrix zwischen den Produkt- und Prozessvariablen, RXX = Korrelationsmatrix der Prozessvariablen. Aus der Korrelationsmatrix RYY lesen wir ab, dass die Korrelationskoeffizienten der Produktvariablen Y1 mit Y3 und der Produktvariablen Y2 mit Y3 statistisch gesichert von null verschieden sind. Aus der Matrix RYX lesen wir ab, dass X2 mit Y1 und X4 mit Y1 korreliert ist. Aus RXX lesen wir ab, dass X3 mit X4, X3 mit X5 und X4 mit X5 hoch korreliert sind und X1 mit X2, X2 mit X3, und X2 mit X5 korreliert sind. Die Größen der Korrelationskoeffizienten entsprechen den Erwartungen der Experten. Das globale Maß für die Abhängigkeitsstruktur des Plastikgehäuses ist det(R) = 0.0007809236. Dieser Wert ist sehr klein, d. h. die Abhängigkeitsstruktur ist eng. Für später ist es notwendig zu wissen, ob die Produktvariablen, die Prozessvariablen oder die Produkt- mit den Prozessvariablen stark miteinander korreliert sind. Zu diesem Zweck berechnen wir die entsprechenden Determinanten der Korrelationsmatrizen. Es gilt det(RYY) = 0.4894116, d. h. das globale Maß für die Straffheit der Abhängigkeitsstruktur der Produktvariablen ist groß, d. h. die Produktvariablen hängen nur gering voneinander ab. det(RXX) = 0.02383498, d. h. die Prozessvariablen hängen stark voneinander ab. Grafische Abbildungen für das Gehäusebeispiel: Star Plots für die Produktvariablen in Abbildung 5.11.6 Ein Star Plot ist eine ideale Darstellung für einen multivariaten Datensatz, z. B. für ein Produkt, aber auch für ein Produkt in Abhängigkeit von seinen Input- und Prozessvariablen. Jeder Stern visualisiert z. B. ein Produkt. Jeder Stern besteht aus einer Anzahl von Strahlen, die vom Mittelpunkt aus gezeichnet werden. Jeder Strahl repräsentiert eine Variable. Auf jeden Strahl wir ein spezieller „Relativwert“ für den entsprechenden Wert der Variablen aufgetragen. Werden z. B. die Gehäuse durch star plots visualisiert, dann entspricht der Strahl in der 300 Position der 1. Produktvariablen Y1 = Thermoschrumpf. Der 2. Strahl entgegen dem Uhrzeigersinn entspricht der 2. Produktvariablen usw. Der kürzeste Strahl entspricht dem kleinsten Wert einer Produktvariable, der größte dem größten. Die Achsen der Star Plots sind in den Schlüssel der Abbildung 5.11.7 bezeichnet. Die N = 113 Star Plots sind sehr verschieden. Betrachtet man z. B. die Stars für die Produkte 2 und 19, dann kann man sich kaum vorstellen, dass diese Produkte gleich sein sollen. Auf diese Art findet man viele sehr Paare von verschiedenen Stars. Pauschal kann man sagen, dass die Produkte, beschrieben durch die vier Produktvariablen hinsichtlich eines jeden Parameters stark streuen. Eine andere ganz wichtige Abbildung ist das Korrelationsdiagramm. Die Zusammenfassung mehrerer Korrelationsdiagramme nennt man Draftsman Plots. Diese Darstellungen sind sehr wichtig, da die paarweisen Abhängigkeit visualisiert werden. 1316han05.indd 282 25.07.2006 11:39:28 283 5.11 Modelle für die Prozessgleichung 111 112 113 100 101 102 103 104 105 106 107 108 109 110 89 90 91 92 93 94 95 96 97 98 99 78 79 80 81 82 83 84 85 86 87 88 67 68 69 70 71 72 73 74 75 76 77 56 57 58 59 60 61 62 63 64 65 66 45 46 47 48 49 50 51 52 53 54 55 34 35 36 37 38 39 40 41 42 43 44 23 24 25 26 27 28 29 30 31 32 33 12 13 14 15 16 17 18 19 20 21 22 1 2 3 4 5 6 7 8 9 10 11 Abb. 5.11.6 : Star Plots für die Produktvariablen AXIALITY PARALLEL THERMOSHR THICKNESS Abb. 5.11.7: Schlüssel für die Star Plots Draftsman Plots Die draftsman Plots (Abbildung 5.11.8) zeigen, dass die vier Produktvariablen nicht unabhängig voneinander sind. Die stärkste Abhängigkeit finden wir zwischen den Produktvariablen Parallelität und Thermoschrumpf. Diese Abhängigkeit ist negativ. Jedes Korrelationsdiagramm wird durch einen Korrelationskoeffizienten quantifiziert. 1316han05.indd 283 25.07.2006 11:39:29 284 5 Qualität in der Fertigung AXIALITY PARALLEL THICKNESS THERMOSHR AXIALITY PARALLEL Abb. 5.11.8: Draftman Plots für die Produktvariable des Gehäuses Häufigkeitsverteilungen Eine Häufigkeitsverteilung ist die grafische Darstellung der Verteilung der Werte einer Stichprobe für eine Variable. Diese Darstellung wird gern verwendet, um Hypothesen bzgl. der Verteilung einer Variablen aufzustellen, sofern diese nicht durch irgendwelche theoretischen Annahmen gefunden werden können. Die Häufigkeitsverteilungen liefern des weiteren eine erste Information darüber, ob der Stichprobenumfang ausreichend ist und ob die Anzahl der Klassen in Anhängigkeit davon klein genug gewählt wurde, über den mittleren Wert, die Streuung und über mögliche Ausreißer. Die Häufigkeitsverteilungen für das Gehäusebeispiel sind in der Abbildung 5.11.9 dargestellt. Histogram for THERMOSHR Histogram for AXIALITY 40 30 30 frequency frequency 40 20 10 0 20 10 0 0 0,5 1 1,5 2 2,5 3 -0,7 -0,3 THERMOSHR 0,1 0,5 0,9 AXIALITY Histogram for THICKNESS Histogram for PARALLEL 40 30 30 frequency frequency 40 20 10 20 10 0 0 -1,5 -0,5 0,5 1,5 2,5 PARALLEL 2,8 2,9 3 3,1 3,2 3,3 3,4 THICKNESS Abb. 5.11.9: Häufigkeitsverteilungen für die Produktvariablen 1316han05.indd 284 25.07.2006 11:39:29 285 5.11 Modelle für die Prozessgleichung Diese vier Häufigkeitsverteilungen zeigen, dass bzgl. aller vier Produktvariablen die Verteilungshypothese H0: „die Produktvariable sind normalverteilt“ formuliert werden kann. Die H0 kann mit verschiedenen Tests geprüft werden. Hier wurden der χ2-Test, der Test von Shapiro-Wilks (W) und der Kolmogorov-SmirnovTest (DN) angewandt. Die berechneten Teststatistiken und Irrtumswahrscheinlichkeiten p dieser Anpassungstests sind in der Tabelle 5.4.4 zusammen gefasst: Tabelle 5.11.8: Ergebnisse der Anpassungstests χ2 p W p DN p Thermoschrumpf 22.62 0.42 0.98 0.5 0.052 0.92 Axialität 27.92 0.18 0.98 0.716 0.042 0.985 Parallelität 13.76 0.909 0.983 0.668 0.0488 0.95 Dicke 13.32 0.923 0.981 0.565 0.038 0.996 Die Entscheidung über die Ablehnung oder Annahme der H0 wird aufgrund der p-Werte getroffen. Da der kleinste p-Wert > 0.1 ist, können die H0 mit Wahrscheinlichkeiten, die größer als 0.9 sind, nicht verworfen werden, d. h. die einzelnen Produktvariable sind, jeder für sich betrachtet, normal verteilt. 3D Häufigkeitsverteilung Die 3D (3 dimensionale) Häufigkeitsverteilung fasst die Informationen der Häufigkeitsverteilungen für zwei Variable und des zugehörigen Korrelationsdiagramms zusammen. Eine 3D-Häufigkeitsverteilung ist demzufolge eine Häufigkeitsverteilung über einem Korrelationsdiagramm. In der Abbildung 5.11.10 ist die 3D Häufigkeitsverteilung für den Thermoschrumpf und die Dicke enthalten. Frequency 10 6 3.4 2 3.2 0 3 0 1 2 2.8 Dicke 3 Thermoschrumpf Abb. 5.11.10: 3D Häufigkeitsverteilung für den Akku-Bohrschrauber 1316han05.indd 285 25.07.2006 11:39:29 286 5 Qualität in der Fertigung Man erkennt aus dieser Darstellung, dass die Werte in der Ebene mit den Achsen Thermoschrumpf und Dicke in einem elliptisch umrissenen Gebiet liegen und das „Gebirge“ durch eine 2-dimensionale Normalverteilung angepasst werden kann. Man sieht aber auch, dass man für eine 3D Häufigkeitsverteilung mehr als die vorliegenden N = 113 Wertesätze benötigt, um ein klares Bild zu erhalten. Stichprobenkovarianzmatrix Die gesamte Stichprobenkovarianzmatrix für alle Variablen wurde in der Tabelle 5.11.9 zusammengestellt. Tabelle 5.11.9: Stichprobenkovarianzmatrix für den Akku-Bohrschrauber Thermo Thermo Axialit Parallel Dicke Friktion Heiztemp. MVI Dichte Massetemp. 0,2249 0,00353 –0,10751 –0,00455 –0,0365 0,97655 0,4792 –0,005321 0,1211 0,04206 0,04239 –0,000809 –0,01316 0,08313 –0,2507 0,000605 –0,0309 0,24587 0,01653 –0,037465 –0,4309 0,002714 –0,16129 0,00882 0,020592 0,12701 0,01546 0,000659 0,003443 0,3215 1,584 0,72217 –0,001669 0,206865 24,7719 8,19388 –0,05056 3,10952 –0,088371 3,523025 Axialit Parallel Dicke Friktion Heiztemp. MVI –0,3723 13,5408 Dichte 0,0007485 Massetemp. –0,024429 1,304455 Die Berechnung der Schätzungen für BY/X und ΣYY/X nach den obigen Formeln ergeben die Resultate: BTY/X = A −xx1 ⋅ AY . x ⎛ −0.38891 ⎜ 0.02941 =⎜ ⎜ −0.04865 ⎜⎝ 0.003045 0.068 0.008913 −8.6534 −0.19371 ⎞ 0.009073 −0.07755 −6.3397 0.04074 ⎟ ⎟ 0.004145 −0.001863 −0.93452 −0.13828 ⎟ 0.0050539 0.02557 4.29743 0.001544 ⎟⎠ B0T = (29.022 1.602 22.272 − 3.927) und SYY / X ⎛ 0.117493 −0.005757 −0.100668 0.001048 ⎞ ⎜ ⎟ 0.027342 0.037235 0.00267 ⎟ =⎜ 0.22503 0.018135 ⎟ ⎜ ⎜⎝ 0.00488349 ⎟⎠ Aus diesen Ergebnissen kann man die Prozessgleichungen für die verschiedenen Produktvariablen zusammenstellen, so z. B. für Y1: Y1 = 29.022 – 0.38891 X1 + 0.068 X2 + 0.008913 X3 – 8.6534 X4 – 0.19371 X5 1316han05.indd 286 25.07.2006 11:39:29 5.11 Modelle für die Prozessgleichung 287 Die Reststreuung ist die Quadratwurzel aus dem 1. Diagonalelement von SYY/X, d. h. 0.117493 = 0.3428. Diese Resultate erhält man auch, wenn man die Prozessgleichung für jede Produktvariable einzeln berechnet. Das multivariate Maß der Beherrschbarkeit hatten wir bei der Betrachtung der Korrelationsanalyse berechnet. Es galt τY2 / X = 1 − ΣYY / X Σ XX = 1− 6.737213333 10^-7 = 0.9329 1.004384604 10^-5 d. h. die Variabilität der Produktvariablen wird zu ca. 93 % durch die Prozessvariablen erklärt. Prozessgleichungen für die einzelnen Produktvariablen im multivariaten, multiplen Modell Im multivariaten, multiplen Modell mit stochastischen Input- und Prozessvariablen erhält man einen Vektor von Prozessgleichungen, für jede Produktvariable eine. Das Problem besteht nun aber darin, dass der Prozess nur mit einer optimalen Teilmenge von Inputund Prozessvariablen gefahren werden kann. Das bedeutet, dass die globale Teilmenge an wesentlichen Input- und Prozessvariablen für die Vorhersagen gesucht werden muss. Tabelle 5.11.10: Prozessgleichungen für die einzelnen Produktvariablen Prozessgleichung f. Y1 ----------------------------------------------------------------------------Dependent variable: Thermo ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT 27,9028 10,1695 2,74377 0,0071 Friktion -0,388912 0,0808537 -4,81007 0,0000 Heiztemp 0,0679991 0,00925225 7,34947 0,0000 MVI 0,00891195 0,0244504 0,36449 0,7162 Dichte -8,65339 2,90976 -2,97392 0,0036 Massetemp -0,193712 0,0581907 -3,32893 0,0012 ----------------------------------------------------------------------------- Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 12,0353 5 2,40707 19,57 0,0000 Residual 13,159 107 0,122981 ----------------------------------------------------------------------------Total (Corr.) 25,1944 112 R-squared = 47,77 percent R-squared (adjusted for d.f.) = 45,3294 percent Standard Error of Est. = 0,350687 Mean absolute error = 0,265689 Durbin-Watson statistic = 2,22739 1316han05.indd 287 25.07.2006 11:39:30 288 5 Qualität in der Fertigung Prozessgleichung f. Y2 ----------------------------------------------------------------------------Dependent variable: Axialit ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT 0,763646 4,90555 0,15567 0,8766 Friktion 0,0294221 0,0390021 0,754373 0,4523 Heiztemp 0,00907345 0,00446308 2,033 0,0445 MVI -0,0775608 0,0117944 -6,57609 0,0000 Dichte -6,34085 1,4036 -4,51755 0,0000 Massetemp 0,0407386 0,0280699 1,45133 0,1496 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 1,64909 5 0,329818 11,53 0,0000 Residual 3,06195 107 0,0286164 ----------------------------------------------------------------------------Total (Corr.) 4,71104 112 R-squared = 35,0048 percent R-squared (adjusted for d.f.) = 31,9676 percent Standard Error of Est. = 0,169164 Mean absolute error = 0,128768 Durbin-Watson statistic = 1,83917 Prozessgleichung f. Y3 ----------------------------------------------------------------------------Dependent variable: Parallel ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT 21,7397 14,074 1,54467 0,1254 Friktion -0,0486358 0,111897 -0,434649 0,6647 Heiztemp 0,00414507 0,0128046 0,323719 0,7468 MVI -0,00187052 0,033838 -0,0552787 0,9560 Dichte -0,935801 4,02693 -0,232386 0,8167 Massetemp -0,138288 0,0805324 -1,71717 0,0888 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 2,33505 5 0,46701 1,98 0,0870 Residual 25,2033 107 0,235545 ----------------------------------------------------------------------------Total (Corr.) 27,5384 112 R-squared = 8,47926 percent R-squared (adjusted for d.f.) = 4,20259 percent Standard Error of Est. = 0,48533 Mean absolute error = 0,380747 Durbin-Watson statistic = 2,37876 1316han05.indd 288 25.07.2006 11:39:30 5.11 Modelle für die Prozessgleichung 289 Prozessgleichung f. Y4 ----------------------------------------------------------------------------Dependent variable: Dicke ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT -3,48103 2,07271 -1,67946 0,0960 Friktion 0,00302197 0,0164793 0,18338 0,8548 Heiztemp 0,00505451 0,00188576 2,68036 0,0085 MVI 0,0255782 0,0049834 5,13268 0,0000 Dichte 4,29957 0,593056 7,24985 0,0000 Massetemp 0,00155342 0,0118602 0,130978 0,8960 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 0,441305 5 0,088261 17,28 0,0000 Residual 0,54664 107 0,00510878 ----------------------------------------------------------------------------Total (Corr.) 0,987945 112 R-squared = 44,669 percent R-squared (adjusted for d.f.) = 42,0834 percent Standard Error of Est. = 0,0714757 Mean absolute error = 0,0554062 Durbin-Watson statistic = 2,10562 Gewisse Unterschiede in den Ergebnissen resultieren z. T. aus Rundungsfehlern und insbesondere bei den Reststreuungen aus der Tatsache, dass ich SYY/X aus 1/N AYY/X berechnet habe. Diese Schätzung ist nicht erwartungstreu. Die erwartungstreue Schätzung verwendet anstelle des Faktors 1/N den Faktor 1/(N – m). Die Güte des Ausgleichs kann aus • der bedingten Standardabweichung (Reststreuung) und • dem Maß der Beherrschbarkeit (multipler Korrelationskoeffizient R2Yj/X abgelesen werden. Für die Produktvariable Y1 (Thermoschrumpf) liest man ab: sY1/X = 0,3506 und R2Y1/X = 0.4532. Es gibt hier einen 2. Wert, der „R squared adjusted” genannt wird. Dieser Wert verwendet die erwartungstreue Schätzung für S2Y/X. Die Programme zur Berechnung der Prozessgleichungen gestatten noch das Zeichnen verschiedener Sachverhalte. Hier wollen wir nur schauen, wie gut die Residuen εˆ i1 = (Yi1 − Yˆi1 ) , i = 1, … N (Abweichungen der Messwerte von den berechneten Werten) durch eine Normalverteilung angepasst werden können. Die Abbildung 5.11.11 zeigt, dass die Residuen sehr gut durch eine Normalverteilung approximiert werden können. 1316han05.indd 289 25.07.2006 11:39:30 290 5 Qualität in der Fertigung 8 0.0 -0.5 Residuals 0.5 49 60 -2 -1 0 1 2 Quantiles of Standard Normal Abb. 5.11.11: Residuen εi1 für die Anpassung von Y1 durch die Prozessgleichung über den Quantilen der Normalverteilung Es bleibt noch die Frage zu klären, wie die Auswahl der wesentlichen Input- und Prozessvariablen im multivariaten, multiplen Fall zu realisieren ist, denn Fakt ist ja, dass der Prozess nur mit einer optimalen Teilmenge von Input- und Prozessvariablen für alle Produktvariablen gesteuert werden kann. Die Antwort auf diese Frage wird bei der Lösung des Problems nach der Auswahl der wesentlichen Input- und Prozessvariablen gegeben. 5.12 Welche Eigenschaften haben die Schätzungen für die unbekannten Modellparameter? Die Eigenschaften für diese Schätzfunktionen werden stellvertretend für das multivariate, multiple Modell mit stochastischen Input- und Prozessvariablen aufgeschrieben. • Sie sind: E[BY/X /X] = E[BY/X] = βY/X, d. h. die Schätzfunktion für die Matrix (Vektor) der unbekannten Koeffizienten der Prozessgleichung ist erwartungstreu. • E[AYY/X/X] = E[AYY/X] = ΣYY/X (N – n –1) • cov(BY/X /X) = A–1 XX ⊗ ΣYY/X und cov(BY/X) = (N – n –1)–1 Σ–1 XX ⊗ ΣYY/X (N) • {B Y/X}N→∞ ist konsistent • BY/X und SYY/X sind unabhängig • V(BY/X /X) = N(BY/X, A–1 XX ⊗ ΣYY/X) und die unbedingte Verteilung ist eine multivariate t-Verteilung. 1316han05.indd 290 25.07.2006 11:39:30 5.12 Welche Eigenschaften haben die Schätzungen? 291 Die Beweise für diese Behauptungen findet man in Jahn [1991a]. Vorhersagen für die Werte der Produktvariablen Die Prozessgleichung wird für die Steuerung des Prozesses gebraucht. Für die Input- und Prozessvariablen werden Werte eingesetzt und der oder die Werte für den oder die Produktvariablen werden ausgerechnet. Diesen Vorgang bezeichnen wir im linearen Modell als „Vorhersage“. Die vorhergesagten Werte für den oder die Produktvariablen streuen natürlich auch. Daher müssen wir den Vorhersagefehler berechnen. Wie kann man den Vorhersagefehler berechnen und wie groß ist der Fehler für diese Vorhersagen? Vorhersagen sind hier im Sinne der Extra- oder Interpolation des oder der Produktvariablen Y aufgrund der Kenntnis der Input- und Prozessvariablen gemeint. Wir betrachten die Vorhersage gleich für den Vektor von Produktvariablen Y. Für eine Produktvariable gelten dieselben Formeln. Den Vektor der Input- und Prozessvariablen, für den wir die „Vorhersage“ berechnen wollen, bezeichnen wir mit XE. Es muss selbstverständlich gelten, dass XE ~ Nn(µ, ΣXX) und XE ist unabhängig von X, d. h. von X1, …, XN. Mit diesem Vektor wird Y (X E ) = YE = B0 + BYT / X ⋅ X E . Die Beurteilung der „Vorhersage“ erfolgt mit den bedingten und unbedingten Vorhersagefehlern. Der bedingte Vorhersagefehler ist M N ,n = E [(YE − Y E ) ⋅ (YE − Y E )T / X , X E ] = MSEP (Y E /, X E ) 1 = ΣYY / X ⋅ (1 + X TE ⋅ A −XX ⋅ XE) und n ⎛ ⎞ U N ,n = E [(YE − Y E ) ⋅ (YE − Y E )T ] = MSEP (Y E ) = ΣYY / X ⋅ ⎜1 + ⎟. ⎝ N − n − 1⎠ Den Beweis kann man in Jahn [1991b] nachlesen. Der unbedingte Vorhersagefehler des linearen Modells mit stochastischen Input- und Prozessvariablen stimmt mit dem Vorhersagefehler des Modells mit festen Input- und Prozessvariablen überein. Beispiel 5.12.1: Bremsweg. Vorhersagen 1. Beispiel zum Nachrechnen (05.11.3 Bremsweg) Die berechnete Prozessgleichung war Yˆ = −27.151 + 1.078 ⋅ x Fasst man auch die gefahrene Geschwindigkeit als Zufallsgröße auf, dann erhält man für dieses Demonstrationsbeispiel den unbedingten „Vorhersagefehler“ U10,1 = 2.991 (1 + 1/8) = 3.3648 1316han05.indd 291 25.07.2006 11:39:30 292 5 Qualität in der Fertigung und damit die „Vorhersagestandardabweichung“ U10,1 = 3.3648 = 1.83 Wählt man für xE die Werte 45, 50 und 55, dann erhält man hierfür die „vorhergesagten“ Bremswege: Tabelle 5.12.1: „Vorhersagewerte“ für den Bremsweg bei einer Prozessvariablen und dem Stichprobenumfang N = 10. xE Vorhersage Konfidenzintervall YE unten oben 45 21,3 17,7 24,9 50 26,7 23,1 30,3 55 32,1 28,5 35,7 2. Beispiel aus dem Kapitel 1 (Datei 01.3.6 Bremsweg) Mit dem Programm Statgraphics Plus 7.0 oder SPLUSWIN erhält man die Prozessgleichung Yˆ = −10.0798 + 0.84465 ⋅ X − 2.18613 ⋅ X + 4.1934 ⋅ X 1 2 3 wobei X1 = Geschwindigkeit [km/h] X2 = Profiltiefe [mm] X3 = Reaktionszeit [sec], anstelle des PKW-Gewichtes und die bedingte Varianz bzw. die bedingte Standardabweichung S2Y/X = 4.68432 und SY/X = 2.1643. Der unbedingte Vorhersagefehler ist U33,3 = 4.68432 [1 + 3 / (30 – 3 – 1)] = 5.2248 und die unbedingte Vorhersage-Standardabweichung ist U 33,3 = 2.2858 . Das Maß der Beherrschbarkeit des Prozesses „Bremsen vor einem Hindernis“ ist R2Y/X = 0.8667, bzw. nach der Korrektur mit den Freiheitsgraden R′2Y/x = 0.851318, wobei die Korrektur mit der Formel RY′ 2/ x = 1 − N −1 (1 − RY2 / x ), N −n −1 vorgenommen wird. Das Maß der Beherrschbarkeit besagt, ca. 86 % der Varianz des Bremsweges werden durch die drei Prozessvariablen X1 (Geschwindigkeit), X2 (Profiltiefe) und X3 (Reaktionszeit) erklärt. Verwendet man das Maß der Beherrschbarkeit zur Berechnung der bedingten Varianz, dann erhält man S2Y/X = 31.50563 (1 – 0.851318) = 4.68432 und damit sY/x = 2.1643. also denselben Wert für die bedingte Standardabweichung wie oben. 1316han05.indd 292 25.07.2006 11:39:31 5.12 Welche Eigenschaften haben die Schätzungen? 293 Wie können Sie Hypothesen über die unbekannten Modellparameter prüfen? Die unbekannten Modellparameter sind im univariaten multiplen Modell mit stochastischen Input- und Prozessvariablen • der Vektor der Koeffizienten der Prozessgleichung βY/X und • die bedingte Varianz σ2Y/X. Wir wollen Antworten auf die Fragen 1. Welche Input- und Prozessvariable hat einen statistisch gesicherten Einfluss auf die Produktvariable? 2. ist die bedingte Varianz statistisch gesichert kleiner als die Varianz der Produktvariablen Y? 3. ist das Maß der Beherrschbarkeit statistisch gesichert größer als Null? Prüfung von Hypothesen über den Vektor der Koeffizienten der Prozessgleichung Die Prüfung der Hypothese über den Vektor der Regressionskoeffizienten H0: βY/X = 0 gegen die alternative Hypothese H1: βY/X ≠ 0 mit dem F-Test BT S B N − n −1 Fˆ = Y / X XX2 Y / X SY / X (n + 1) und P (Fˆ ≤ Fα /H0 ) = 1 − α , wobei Fˆ ∼ Fn +1,N −m −1 (α) wird durch das bekannte „finite intersection“ Prinzip auf die Prüfung der Einzelhypothesen H0,j: βY.j/n – j = β*Y.j/n – j gegen H1: βY.j/n – j ≠ β*Y.j/n – j zurückgeführt, wobei β*Y.j/n – j gegeben sein möge. Die Teststatistik für eine bestimmte Input- oder Prozessvariable Xj ist tj = (βY . j / n − j − BY . j / n − j ) sY / X ⋅ S 2j / n − j ⋅ N − n − 1, j = 1, …, n. Oft wird einfach angenommen, dass β*Y.j/n – j = 0. Die t-Prüfstatistik kann auch mit der F-Statistik geschrieben werden. Es gilt Fˆj = BY2 . j / n − j (N − n) SY2 / X S jj = (RY2 / X − RY2 / n − j )(N − n) 1 − RY2 / X , wobei Sjj die Diagonalelemente von S–1 XX sind. Für diese gilt aber 1 S −XX ⎧[S 2j (1 − R 2j / n − j )]−1 , für alle j = 1, …, n ⎪⎪ − R jk / n-{j ,k} =⎨ , für j , k = 1, …, n, j ≠ k ⎪ 2 2 ⎪⎩ S j Sk (1 − R j / n − j )(1 − Rk / n − k ) und [S 2j (1 − R 2j / n − j )] = S 2j / n −1 . 1316han05.indd 293 25.07.2006 11:39:31 294 5 Qualität in der Fertigung Varianzanalyse für die berechnete Prozessgleichung Für die Prüfung der linearen Prozessgleichung, d. h. für die Prüfung der Hypothese, ob wenigstens eine Input- und/oder Prozessvariable einen statistisch gesicherten Einfluss auf die Produktvariable hat, wird die Varianzanalyse der Tabelle 5.12.2 durchgeführt. Diese Analyse basiert auf der Identität Y − Y = Y − Yˆ + Yˆ − Y i i i i nach der die Abweichung einer Beobachtung der Produktvariablen Yi vom Mittelwert Y zerlegt wird in die Abweichung der Beobachtung Yi von dem mit der Prozessgleichung berechneten Wert Yˆi und die Abweichung Yˆi − Y der berechneten Werte vom Mittelwert. Werden die Abweichungen quadriert und über alle Beobachtungen summiert, so erhält man die Zerlegung der Summe der Abweichungsquadrate der Einzelwerte vom Mittelwert SAQ gesamt = N ∑ (Yi − Y )2 i =1 in die beiden Summanden 1. Summe der Abweichungsquadrate der berechneten Werte vom Mittelwert, SAQModell = N ∑ (Yˆi − Y )2 und i =1 2. die Summe der Abweichungsquadrate der einzelnen Beobachtungswerte von den berechneten Werten SAQ Fehler = N ∑ (Yi − Yˆi )2 . i =1 Die Summen der Abweichungsquadrate werden in Varianztabelle Tabelle 5.11.1 zusammen gestellt. Tabelle 5.12.2: Varianztabelle für die „Güte“ der Prozessgleichung Variationsursache Summe der quadratischen Abweichungen FG N Gesamt ∑ (Yi − Y )2 N–1 i =1 Mittlere Summe der quadratischen Abweichungen F-Quotient 1 N ∑ (Yi − Y )2 N − 1 i =1 N Modell ∑ (Yˆi − Y )2 m i =1 N N N ∑ (Yi − Y )2 − ∑ (Yˆi − Y )2 Fehler i =1 = i =1 N ∑ i =1 (Yi − Yˆi ) 2 ∑ (Yˆi − Y )2 N–m–1 i =1 N ∑ i =1 =F (Yi − Yˆi )2 Mit der Varianzanalyse kann man auch noch einmal die Bedeutung des Maßes der Beherrschbarkeit sehr klar erkennen. 1316han05.indd 294 25.07.2006 11:39:31 5.12 Welche Eigenschaften haben die Schätzungen? 295 Beispiel 5.12.2: Bremsweg. Varianzanalyse Für das Beispiel erhalten wir mit den Daten aus der Datei 03.5.1 Bremsweg (im Internet) die Tabelle 5.12.3. Tabelle 5.12.3: Varianzanalyse für die Prozessgleichung Variationsursache Summe der quadratischen Abweichungen FG Gesamt Modell Fehler 913,663 791,871 121,7934 29 3 26 Mittlere Summe der quadratischen Abweichungen F-Quotient 263,957 4,6843 56,35 Der berechnete Wert des F-Testes ist sehr viel größer als der entsprechende Tafelwert F0.05; 29,3 = 2.93, d. h. die Hypothese, dass die Varianz der Produktvariablen Y durch die Input- und Prozessvariablen nicht reduziert wird, muss mit sehr kleiner Irrtumswahrscheinlichkeit verworfen werden. Die Modellvarianz kann weiter zerlegt werden. Man erhält die weiterführende Tabelle 5.12.4. Tabelle 5.12.4: Weiterführende Varianzanalyse Variationsursache Summe der quadratischen Abweichungen F-Quotient Wahrscheinlichkeit Modell 791,871 136,63 0,0000 Geschwindigkeit 639,997 Profiltiefe 38,1208 Reaktionszeit 113,752 Residuum 121,7927 8,14 0,0084 24,28 0,0000 Aus dieser Varianztabelle kann man die Bedeutungen der einzelnen Input- und Prozessvariablen ablesen. Die Geschwindigkeit ist die wichtigste Prozessvariable. Dieser Parameter hat den größten F-Wert und die kleinste Irrtumswahrscheinlichkeit. Die „Vorhersagen“ mit diesem statistischen Modell sind in der Tabelle 5.2.15 enthalten Tabelle 5.12.5: Vorhersagewerte und Vorhersageintervalle für den Bremsweg Werte XE für die Input- Input- und Prozessvariable Vorhersage XE,1 XE,2 XE,3 YE 45 50 55 2 2 2 1 2 1 27,7 32,0 36,2 V.-Intervall [23,0; 32,5] [27,3: 36,6] [31,5; 40,8] Die Vorhersagen mit dem ausführlicheren Modell unterscheiden sich von denen, die mit dem einfachen Modell gewonnen wurden. Das ist aber klar, denn in dem ausführlicheren Modell steckt sehr viel mehr Information. 1316han05.indd 295 25.07.2006 11:39:32 296 5 Qualität in der Fertigung 5.13 Einfluss der Multikollinearität auf die Schätzfunktionen In vielen Arbeiten, so z. B. in Johnston [1963], Mason [1975], Harvey [1981], Gunst [1983], Sen and Srivastava [1990] usw. wird der Einfluss der Multikollinearität auf die Schätzfunktionen im linearen Modell studiert. Dabei begnügen sich die Autoren häufig mit einer intuitiven Darstellung des Einflusses der Multikollinearität. Wir wollen hier speziell den Einfluss auf die Prozessgleichung studieren und ein quantitatives Maß für die Multikollinearität verwenden, um zu erkennen, wie groß der Einfluss der Multikollinearität ist. Was ist die Multikollinearität? Wie können wir die Multikollinearität messen? Nach Anderson [1984] wird die Variabilität eines zufälligen Vektors X durch die verallgemeinerte Varianz Σ XX beurteilt. Gleichzeitig gilt aber Σ XX = 0 , wenn mit der Wahrscheinlichkeit 1 lineare Abhängigkeiten zwischen den Input- und/oder Prozessvariablen vorkommen. Hieraus folgt schon, dass der Begriff verallgemeinerte Varianz viel zu eng gefasst ist, wenn es um den Grad der Multikollinearität geht, denn durch die Determinante werden sowohl die Varianzen als auch die Abhängigkeitsstruktur erfasst. Definition der Multikollinearität: Die Straffheit der Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen wird Multikollinearität genannt und durch die Determinante der Korrelationsmatrix beurteilt. Für die Determinante der Korrelationsmatrix RXX gilt n Σ XX = R XX ⋅ ∏ σ 2j j =1 und für alle j, k = 1, …, n, j ≠ k ⎧⎪1, falls ρ jk = 0, R XX = ⎨ ⎪⎩0, falls wenigstens ein ρ jk = 1, für j ≠ k, j, k = 1, …, n Als Maß für die Multikollinearität verwenden wir daher δ= 1 R XX . Welchen Einfluss hat die Multikollinearität auf die Prozessgleichung und auf das Maß der Beherrschbarkeit? Im Netzwerk von betrieblichen Prozessen wurde deutlich ersichtlich, dass die Inputvariablen eines Prozesses die Produktvariablen eines Vorläuferprozesses sind. Ein Produkt wurde aber durch mehrere, nicht unabhängige Produktvariable charakterisiert. Der Vektor der Produktvariablen ist ein zufälliger Vektor. Der Vektor der Prozessvariablen ist in sehr vielen Fällen ebenfalls ein zufälliger Vektor. Hieraus folgte ja, dass zur Berechnung der Prozessgleichung das lineare Modell mit stochastischen Input- und Prozessvariablen zu verwenden ist. D. h. aber auch, dass die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen, ausgedrückt durch deren Korrelations- oder Kovarianzmatrix, die Schätzfunktionen für die unbekannten Koeffizienten in den Gleichungen beeinflusst. Die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen kann sehr unterschiedlich sein. Einerseits kann diese durch einen 1316han05.indd 296 25.07.2006 11:39:32 5.13 Einfluss der Multikollinearität auf die Schätzfunktionen 297 großen Korrelationskoeffizienten zwischen zwei Parametern oder andererseits durch mäßig große Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen und deren unterschiedliche Vorzeichen geprägt sein. Diese Feststellungen führen auf drei Probleme, die im Rahmen der Multikollinearitätsproblematik beantwortet werden müssen. • Wie beeinflusst die Abhängigkeitsstruktur und damit die Multikollinearität die Schätzfunktionen für die unbekannten Koeffizienten und die bedingte Varianz? • Wie kann die Abhängigkeitsstruktur beurteilt werden? • Wie kann ein großer Grad der Multikollinearität korrigiert werden? In den meisten Schätzfunktionen für die unbekannten Modellparameter kommt die Inverse der Kovarianzmatrix vor. Folglich schreiben wir die Inverse elementeweise auf und erhalten die Darstellung 1 A −XX ⎧ A −j 2 (1 − R 2j / n − j )−1 , für alle j = 1, …, n ⎪ ⎪ − R jk / m − j ,k =⎨ , für j , k = 1, …, n, j ≠ k 1 ⎪ 2 2 2 2 2 ⎡ ⎤ ⎪⎩ ⎣ A j Ak (1 − R j / n − j ) ⋅ (1 − Rk / n − k )⎦ wobei R jk / n −( j ,k) die Korrelationskoeffizienten der bedingten Verteilung von (Xj, Xk) unter der Bedingung der restlichen Variablen (X1, …, Xj – 1, Xj + 1, …, Xk – 1, Xk + 1, …, Xn) d. h. die partiellen Korrelationskoeffizienten bezeichnen. [n – (j, k)] bezeichnet die Indexmenge der restlichen Variablen. Diese zeigt, dass mit zunehmender Strenge der Abhängigkeit innerhalb des Vektors der Inputund Prozessvariablen der multiple Korrelationskoeffizient zwischen einem beliebigen Xj und einer Linearkombination in den restlichen Input- und Prozessvariablen R2j/n – j stets größer wird. Dadurch wird 1 – R2j/n – j immer kleiner und somit das Diagonalelement A −j 2 ⋅ (1 − R 2j / n − j )−1 von A–1 XX immer größer. Für die globale Beurteilung der Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen benötigt man ein Maß. Zur Ableitung eines solchen betrachtet man den bekannten Zusammenhang (Muirehead [1982]) 1 P [ X T ⋅ Σ −XX ⋅ X ≤ χn2 (α)] = 1 − α, d. h. mit der Wahrscheinlichkeit 1 – α fällt X in das Innere des Konzentrationsellipsoides 1 X T ⋅ Σ −XX ⋅ X = χn2 (α) mit dem Volumen 1 V = n 1 (2 ⋅ π)2⋅n ⋅ R XX ⋅ ∏ σ 2j ⋅ [χn2 (α)]2⋅n j =1 ⎛ 1 ⎞ Γ⎜ ⋅n ⎝ 2 ⋅ n ⎟⎠ , falls X ∼ Nn (0, ΣXX). Das Volumen ist nur von RXX abhängig, denn die anderen Variablen bleiben für diese Betrachtung konstant. Somit sollte sich ein Maß für die Multikollinearität auf die Determinante beziehen. 1316han05.indd 297 25.07.2006 11:39:32 298 5 Qualität in der Fertigung Beispiel 5.13.1: Multikollinearität Der Einfluss der Multikollinearität auf die Parameter des linearen Modells wird durch ein Beispiel transparent. Es sei Z ~ N3 (0, RZZ), RZZ sei positiv definit und R ZZ ⎛ 1 ρY 1 ρY 2 ⎞ ⎛ 1 ρY . X ⎞ =⎜ 1 ρ12 ⎟ = ⎜ . ⎜ ⎟ ⎝ R XX ⎟⎠ 1 ⎠ ⎝ Für diesen einfachen Fall sagt man XT = (X1, X2) habe den Grad der Multikollinearität R XX −1 =δ= 1 , 2 1 − ρ12 wenn 2 ρ12 = δ −1 . δ In diesem Fall gilt ⎧⎪1 − (ρY2 1 + ρY2 2 ) δ + 2 ⋅ ρY 1 ⋅ ρY 2 ⋅ (δ − 1) ⋅ δ , falls ρ12 ≥ 0 σY2 / X = σY2 / X (δ) = ⎨ 2 2 ⎪⎩1 − (ρY 1 + ρY 2 ) δ − 2 ⋅ ρY 1 ⋅ ρY 2 ⋅ (δ − 1) ⋅ δ , falls ρ12 < 0 Da RZZ positiv definit vorausgesetzt wurde, gilt ρY2 1 < 1, ρ2Y2 < 1 und ρ12 ∈ (a, b) mit a, b = ρY 1 ⋅ ρY 2 ± 1 − ρY2 1 − ρY2 2 + ρY2 1 ⋅ ρY2 2 . Nur für ρY1 = ρY2 erhält man b = 1. Setzt man ⎧ 1 , für a ≥ 0 ⎪ A = ⎨1 − a 2 ⎪⎩ 0, für a < 0 und ⎧ 1 , für ρY 1 ≠ ρY 2 ⎪ B = ⎨1 − b 2 ⎪⎩∞, für ρY 1 = ρY 2 dann ist δ ∈ [A, B] und für a ≥ 0 ⎧⎪0 σY2 / X ( A + 0) = ⎨ 2 2 ⎪⎩1 − (ρY 1 + ρY 2 ) für a < 0 bzw. 1316han05.indd 298 25.07.2006 11:39:32 5.13 Einfluss der Multikollinearität auf die Schätzfunktionen 299 für ρY 1 ≠ ρY 2 ⎧⎪0 σY2 / X (B − 0) = ⎨ 2 ⎪⎩1 − ρY 2 für ρY 1 = ρY 2 Aus Symmetriegründen ist nur der Fall a < 0 < b und ρ12 < 0 zu untersuchen. Es gilt σY2 / X (δ) ist monoton wachsend in (A, δ0] und monoton fallend in [δ0, B), wobei ⎧ max(ρY2 1 , ρY2 2 ) für ρY 1 ≠ ρY 2 ⎪ δ 0 = ⎨ ρY2 1 − ρY2 2 ⎪ für ρY 1 = ρY 2 ⎩∞ Die Funktion σY2 / X (δ) erreicht ihr Maximum 1 − max (ρY2 1 , ρY2 2 ) an der Stelle δ0. Zum Beweis für ρY1 ≠ ρY2 wird −(ρY 1 + ρY 2 ) δ + 2 ρY 1 ρY 2 (δ − 1) ⋅ δ =: g1 (δ) untersucht. Zur Abkürzung wird ρY12 + ρY22 =: c und ρY1 ρY2 =: d gesetzt. Mit diesen Abkürzungen gilt g1′(δ) = −c + d ⋅ (2 δ − 1) (δ − 1) ⋅ δ . Aus g ′(δ) = c 2 ⋅ (δ 2 − δ) − d 2 (4 ⋅ δ 2 − 4 ⋅ δ + 1) = 0 und c 2 = 4 ⋅ d 2 + (ρY2 1 − ρY2 2 )2 erhält man δ2 − δ − d2 (ρY2 1 − ρY2 2 )2 =0 und somit δ1/2 = ρY2 1 − ρY2 2 ± (ρY2 1 + ρY2 2 ) ρY2 1 − ρY2 2 . Für ρY1 = ρY2 wird g 2 (δ) = 2 ⋅ ρY 1 ⋅ ⎡⎣ (δ − 1) ⋅ δ − δ ⎤⎦ untersucht. Da ⎡ 2⋅δ −1 ⎤ g 2′ (δ) = 2 ⋅ ρY2 1 ⎢ − 1⎥ ⎣ (δ − 1) ⋅ δ ⎦ folgt aus g 2′ (δ) = 0 , dass keine reelle Lösung existiert. Zur Demonstration dieser Resultate betrachten wir die Korrelationsmatrix ⎛ 1 0.9 0.6 ⎞ R =⎜ 1 ρ12 ⎟ ⎜ ⎟ 1 ⎠ ⎝ für den Vektor (Y, X1, X2). 1316han05.indd 299 25.07.2006 11:39:33 300 5 Qualität in der Fertigung Die Grenzen des Variationsintervalls für den Korrelationskoeffizienten ρ12 sind a, b = ρY 1 ⋅ ρY 2 ± 1 − ρY2 1 − ρY2 2 + ρY2 1 ⋅ ρY2 2 = 0.9 ⋅ 0.6 ± 1 − 0.92 − 0.62 + 0.81 ⋅ 0.36 = 0.54 ± 0.348 −4 ⎪⎧0.192, für a, mit R ′ = 4.96 ⋅ 10 und δ(a) = 1.038 =⎨ −4 ⎪⎩0.888, für b, mit R ′′ = 4.96 ⋅ 10 und δ(b) = 4.729 Der Grad der Multikollinearität bis zu dem σ2Y/X monoton wächst ist δ0 = max (ρY2 1 , ρY2 2 ) ρY2 1 − ρY2 2 = 0.81 = 1.8. 0.45 Die bedingte Varianz im standardisierten Modell wird nach der Beziehung ⎛ 1 ρ12 ⎞ σY2 / X = 1 − (ρY 1 ρY 2 ) ⋅ ⎜ 1 ⎟⎠ ⎝ = 1 − (ρY 1 ρY 2 ) ⋅ =1− 1 2 1 − ρ12 −1 ⎛ ρY 1 ⎞ ⋅⎜ ⎝ ρY 2 ⎟⎠ ⎛ 1 −ρ12 ⎞ ⎛ ρY 1 ⎞ ⋅⎜ ⋅ 1 ⎟⎠ ⎜⎝ ρY 2 ⎟⎠ ⎝ ρY2 1 + ρY2 2 − 2 ⋅ ρY 1 ⋅ ρY 2 ⋅ ρ12 2 1 − ρ12 berechnet. Für a, b, δ0 und einige weitere Zwischenstellen für den Grad der Multikollinearität erhält man die folgenden Werte für die bedingte Varianz bzw. bedingte Standardabweichung: σY2 / X (a) = 0.000515, σ Y/X (a) = 0.0227, σY2 / X (δ1 = 1.19) = 0.1214, σ Y/X (δ1 ) = 0.3484, σY2 / X (δ 2 = 1.312) = 0.1561, σ Y/X (δ 2 ) = 0.395, σY2 / X (δ 3 = 1.33) = 0.16, σ Y/X (δ 3 ) = 0.4, σY2 / X (δ 0 ) = 0.18999, σ Y/X (δ 0 ) = 0.4359, max σ 2Y/X (δ) = 1 − max (ρY2 1 , ρY2 2 ) = 0.19, σY2 / X (δ 4 = 2.5) = 0.1776, σ Y/X (δ 4 ) = 0.4083, σY2 / X (δ 5 = 3.249) = 0.118, σ Y/X (δ 5 ) = 0.3435, σY2 / X (δ 6 = 4) = 0.0611, σ Y/X (δ 6 ) = 0.2472, σY2 / X (b) = 0.002346, σ Y/X (b) = 0.0484. Die Abbildung 5.13.1 zeigt die Werte für die bedingte Standardabweichung über den verschiedenen Graden der Multikollinearität. Wie berechnet, steigen die Werte der bedingten Standardabweichung vom kleinst möglichen Grad a bis zum Grad δ0 der Multikollinearität an und fallen dann wieder bis zum maximal möglichen Grad b der Multikollinearität. 1316han05.indd 300 25.07.2006 11:39:33 301 5.13 Einfluss der Multikollinearität auf die Schätzfunktionen 0.4 0.3 0.2 bedStreuung 0.1 0.0 0 1 2 3 4 5 Det Abb. 5.13.1: Bedingte Standardabweichung über dem Grad der Multikollinearität Für höher dimensionale Vektoren (n ≥ 3) von Input- und Prozessvariablen kann man die Abhängigkeit der bedingten Varianz (Standardabweichung) vom Grad der Multikollinearität δ nicht mehr analytisch darstellen. Es bleibt hier nur die Möglichkeit, mit Beispielen die Vermutung, dass bei den höher dimensionalen Fällen die gleiche Tendenz gilt, zu untermauern. Gibt es einen Zusammenhang zwischen dem Grad der Multikollinearität und der Konditionszahl? Um die Auswirkung eines großen δ auf die Schätzfunktionen für die unbekannten Parameter in der Prozessgleichung zu untersuchen, bietet sich die Berechnung der Fehler E an, die bei der Lösung des Normalgleichungssystems BYT / X R XX = RY . X entstehen. Um diesen Fehler berechnen zu können, führen wir die Konditionszahl kE = R XX ⎛ R XX ⎞ ⎜⎝ n ⎟⎠ n mit 1 R XX ⎛ ⎞2 = ⎜ n + 2∑ rjk2 ⎟ ⎝ ⎠ j <k ein. Damit gilt nach Focke [1962] E ≤ 1316han05.indd 301 3⋅n a , kE RXX 25.07.2006 11:39:33 302 5 Qualität in der Fertigung wobei a der Vektor der Abweichungen ist, die man erhält, wenn man die Lösung BY/X in das Normalgleichungssystem BYT / X RXX = RY . X einsetzt, d. h. a = BYT / X R XX − RY . X . Je größer der Grad der Multikollinearität ist, desto größer werden die Fehler. Unter den genannten Voraussetzungen, dass der zufällige Vektor Z = (YT, XT) aus den m Produkt- und n Input- und Prozessvariablen m + n dimensional normal- oder elliptisch umrissen verteilt und die gemeinsame Kovarianzmatrix positiv definit ist, gilt für eine Stichprobe (Yi, Xi), i = 1, …, N von unabhängigen und identisch nach Z verteilten zufälligen Vektoren mit der Schätzfunktion A ZZ = N ∑(Zi − Z) ⋅ (Zi − Z)T i =1 für die Kovarianzmatrix und deren Zerlegung ⎛ AYY A ZZ = ⎜ ⎝ AYX ⎞ , A XX ⎟⎠ die Maximum Likelihood Schätzfunktion MLSF) für die Matrix der Regressionskoeffizienten wird nach der Beziehung 1 BTY / X = ATYX ⋅ A −XX berechnet. Der Vektor der Absolutglieder besitzt die Darstellung B0 = Y − BTY / X ⋅ X . 1 Die MLSF für die bedingte Kovarianzmatrix ΣYY / X = ΣYY − ΣYX ⋅ Σ −XX ⋅ Σ XY ist 1 AYY / X = AYY − A −XX ⋅ A XY bzw. mit der MLSF S ZZ = 1 ⋅ A ZZ N −1 1 SYY / X = SYY − SYX ⋅ S −XX ⋅ S XY . Für die MLSF haben wir schon gezeigt, dass E [BY / X / X] = E [BY / X ] = ΒY / X , E [AYY / X / X] = (N − n − 1) ΣYY / X , 1 1 cov [BY / X / X] = A −XX ⊗ ΣYY / X und cov [BY / X ] = (N − n − 1) ⋅ Σ −XX ⋅ ΣYY / X . Aus diesen Eigenschaften können Sie schon ablesen, dass die Varianzen der MLSF für die Regressionskoeffizienten immer größer werden, je größer der Grad der Multikollinearität ist, denn überall dort wo die Inverse Kovarianzmatrix ins Spiel kommt, wirkt der Grad der Multikollinearität. Das gilt auch für die folgenden Eigenschaften. 1316han05.indd 302 25.07.2006 11:39:34 5.13 Einfluss der Multikollinearität auf die Schätzfunktionen 303 1 • die bedingte Verteilung von BY/X ist N (ΒY / X , A −XX ⊗ ΣYY / X ) , • die unbedingte Verteilung von BY/X ist eine multivariate t-Verteilung, • (N − 1) ⋅ SYY / X ist Wishart verteilt, d. h. Wm (N − m − 1, ΣYY / X ). Außerdem gelten für die bedingten und unbedingten Vorhersagefehler die folgenden Beziehungen. Der bedingte Vorhersagefehler wird nach der Beziehung 1 M N ,m = ΣYY / X ⋅ (1 + X E ⋅ A −XX ⋅ XE ) und der unbedingte nach n ⎛ ⎞ U N ,m = ΣYY / X ⋅ ⎜1 + ⎟ ⎝ N − n − 1⎠ berechnet. Aus den Modellparametern bzw. den MLSF und deren Eigenschaften liest man die Abhängigkeit von A–1 XX und damit vom Grad der Multikollinearität ab. Beispiel 5.13.2: Einfluss der Multikollinearität. Einfluss auf die Modellparameter Für n = 4 wird ein Beispiel nach faktoranalytisch folgender Vorschrift konstruiert: X1 = ½ (X2 + X3 + X4) X2 = 2 A + U2 X3 = –A X4 = A + 2 U3 + U4 wobei A einen gemeinsamen Faktor und Uj, j = 2, 3, 4 spezielle Faktoren bezeichnen. Durch das Einsetzen der falktoranalytischen Annahmen erhält man X1 = ½ (U2 + 2 U3 + U4) + A. Die Voraussetzungen an die gemeinsamen und speziellen Faktoren der Faktoranalyse, E(A) = E(Uj) = 0, und var(A) = var(Uj) = 1, j = 1, 2, 3, 4 ermöglichen die Berechnung der Varianzen und Kovarianzen zwischen den vier Prozessvariablen X1 bis X4. Man erhält var(X1) = E [1/4 (U2 + 2 U3 + U4)2 + A2 + (U2 + 2 U3 + U4) A] = ¼ (1 + 4 + 1) + σA2 = 6/4 + 1 = 5/2, var(X2) = E (2 A + U2)2 = 5, var(X3) = E (–A + 2 U3)2 = 5, var(X4) = E (A – U4)2 = 2 cov(X1 X2) = E (X1 X2) = E [(1/2 (U2 + 2 U3 + U4) + A) (2 A + U2)] = 5/2, cov(X1 X3) = E (X1 X3) = E [(1/2 (U2 + 2 U3 + U4) + A) (–A + 2 U3)] = 1 cov(X1 X4) = E (X1 X4) = E [(1/2 (U2 + 2 U3 + U4) + A) (A + U4)] = 3/2, cov(X2 X3) = E (X2 X3) = E [(2 A + U2) (–A + 2 U3)] = – 2, cov(X2 X4) = E (X2 X4) = E [(2 A + U2) (A + U4)] = 2, cov(X3 X4) = E (X3 X4) = E [(–A + 2 U3) (A + U4)] = – 1. 1316han05.indd 303 25.07.2006 11:39:34 304 5 Qualität in der Fertigung Mit den Varianzen und Kovarianzen können die Korrelationskoeffizienten ρ jk = cov( X j , X k ) [var( X j ) ⋅ var( X k )]1/ 2 , j , k = 1, …, 4, j ≠ k berechnet werden. Man erhält die Korrelationsmatrix R XX ⎛ ⎜1 ⎜ ⎜ =⎜ ⎜ ⎜ ⎜ ⎜ ⎝ 1 2 2 5 1 −2 5 1 2/3 ⎞ 5 ⎟⎟ ⎛ 1 0.707 0.282 0.670 ⎞ 2 ⎟ ⎜ −0.400 0.632 ⎟ 1 ⎟ ⎟, 5 ⎟=⎜ −0.316 ⎟ 1 ⎜ −1 ⎟ ⎜ 1 ⎟⎠ ⎟ ⎝ 10 ⎟ 1 ⎠ wobei die Dezimalbrüche durch die Berechnungen von 3 Stellen nach dem Komma zustande kommen. Das Wesen dieser Korrelationsmatrix besteht darin, dass der Rang der Korrelationsmatrix durch das aufgeprägte weiße Rauschen 4 beträgt; ansonsten nur 3! und der Einfluss des weißen Rauschens mit zunehmender Anzahl von Stellen für die Dezimalbrüche immer kleiner wird. Aus der zweiten Eigenschaft folgt, dass der Grad der Multikollinearität durch die Anzahl der Dezimalstellen verändert werden kann. Die Determinante für die Korrelationsmatrix mit drei Dezimalstellen ist det(RXX) = 9.66 10–4. Für 4 Stellen nach dem Komma erhält man det(RXX) = 3.53 10–5. Für 6 Dezimalstellen erhält man den Wert det (RXX) = 1.306 10–6 usw. Erweitert man die Korrelationsmatrix RXX mit 3 Dezimalstellen um den Vektor der Korrelationskoeffizienten ρTY.X = (1 0.3 0.3 –0.3 0.65), dann erhält man eine Korrelationsmatrix für den gemeinsamen Vektor (Y, XT) von einem Produkt- und vier Prozessvariablen. Die inverse Korrelationsmatrix hat die Elemente ⎡ 518.00409761864935308 −366.52374300262834013 −365.67403717048603733 ⎢ −366.52374300262834013 261.13943712283653603 259.13986870735832069 ⎢ ⎢ −365.67403717048603733 259.13986870735832069 259.33982968888505582 ⎢ 162.41898206165352646 163.17659406286286398 ⎣ −230.9727355727075434 −230.972735572707543 ⎤ 162.4189820616535264 ⎥⎥ 163.1765940628628639 ⎥ ⎥ 104.6667398946136903 ⎦ Mit den Elementen der inversen Korrelationsmatrix kann man die Koeffizienten der Regressionsfunktion (bedingten Erwartungswertes) berechnen. Man erhält die Funktion E[Y/X] = 5.014039 X1 – 3.784914 X2 – 3.697413 X3 – 1.485723 X4 und die bedingte Varianz σ2Y/X = 1 – 0.512241 = 0.487759. Berechnet man 4 Dezimalstellen der Korrelationsmatrix und rundet auf 3 Stellen, dann erhält man die inverse Korrelationsmatrix 1316han05.indd 304 25.07.2006 11:39:35 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 1 R −XX 305 ⎡ 3903.7774652061360842 −2759.4607872664600142 −2759.9198281797504894 −1744.8306665184492782 ⎤ ⎢ −2759.4607872664600142 1952.3805292153284385 1951.3032020137744162 1232.3531250988444835 ⎥ ⎥, =⎢ ⎢ −2759.9198281797504894 1951.3032020137744162 1952.4272516129524397 1233.6982893435863439 ⎥ ⎢ ⎥ 781.55050847888419224 ⎦ ⎣ −1744.8306665184492782 1232.3531250988444835 1233.6982893435863439 die Determinante der Korrelationsmatrix der Prozessvariable det(RXX) = 1.279 10–4, den bedingten Erwartungswert E[Y/X] = 37.131019 X1 – 26.485507X2 – 26.409275 X3 – 15.844919 X4 und die bedingte Varianz σ2Y/X = 1 – 0.817239 = 0.182761. Die geringfügige Veränderung der einzelnen Elemente der Korrelationsmatrix führt zu starken Veränderungen der Ergebnisse (Elemente der inversen Korrelationsmatrix und damit der multiplen Korrelationskoeffizienten, Koeffizienten des bedingten Erwartungswertes, bedingte Varianz). Aus dieser Darstellung erkennt man, dass die Fehler mit kleiner werdender Determinante der Korrelationsmatrix für die Input- und Prozessvariable und damit mit kleiner werdenden Konditionszahlen größer werden. 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? In den Regressionsansätzen mit festen oder stochastischen Input- und Prozessvariablen wird der Zusammenhang zwischen einem (oder mehreren) Produktvariablen Y und den n Inputund Prozessvariablen XT = (X′, Z) gesucht. Da zu Beginn der Analyse nicht bekannt ist, welche Input- und Prozessvariablen den (oder die) Produktvariable wesentlich beeinflussen, misst man nach dem Grundsatz des Galilei: „Messe alles, und das nicht Messbare mache messbar“, so viel wie möglich Input- und Prozessvariablen und hofft, dass unter den gemessenen diejenigen sind, die Y gut erklären. Hinter dieser Formulierung steht die Frage nach der Adäquatheit des Modells. Hierfür verwenden wir das Maß der Beherrschbarkeit, den F-Test, die t-Tests und Residualanalysen. Diese Analysen reichen aber nicht aus, den optimalen Ansatz zu finden. 5.14.1 Warum müssen aber nun wieder Input- und/oder Prozessvariablen aus dem Ansatz gestrichen werden? Es ist doch offensichtlich, dass mit zunehmender Anzahl von Input- und Prozessvariablen die Information über Y nicht geringer werden kann. Das ist der Inhalt der Wiener Shannon’sche Theorie, wonach die Entropie als Maß der Unbestimmtheit einer oder mehrerer Produktvariablen mit zunehmender Anzahl von Input- und Prozessvariablen desselben Prozesses stets kleiner wird. 1316han05.indd 305 25.07.2006 11:39:35 306 5 Qualität in der Fertigung Trotzdem gibt es verschiedene Gründe für die Notwendigkeit der Auswahl der wesentlichen Input- und Prozessvariablen. Zwei dieser Gründe sind: Der Grad der Multikollinearität nimmt mit wachsender Anzahl n von Input- und Prozessvariablen zu. Daraus folgt aber sofort, dass die Anzahl der redundanten oder unwesentlichen Input- und Prozessvariablen ebenfalls zunimmt und aufgrund des zunehmenden Grades der Multikollinearität die numerischen Fehler bei der Lösung des Normalgleichungssystems größer werden. Die beiden Terme des unbedingten Vorhersagefehlers (das ist auch der Vorhersagefehler im n ⎛ ⎞ linearen Modell mit festen Input- und Prozessvariablen) U N ,n = σY2 / X ⎜1 + ⎟⎠ zeigen ⎝ N − n − 1 2 unterschiedliches Verhalten. Die Folge {σY / X (n) }, n → ∞ ist antiton (monoton nicht wachsend, wenn die Anzahl der Input- und Prozessvariablen größer wird) und n ⎛ ⎞ ⎜⎝1 + ⎟, n → ∞ N − n − 1⎠ ist streng isoton (monoton wachsend). Die Abbildung 5.14.1 zeigt, dass ein p* = p*(N) mit p* ∈ {0, 1, …, n} gefunden werden kann, für dass p < p* und p > p* UN.p > UN,p* ist. Das p* wollen wir optimale Anzahl nennen. Mit den Auswahlverfahren sollen sowohl das p* wie auch die wesentlichen Input- und Prozessvariablen gefunden werden. Dabei beinhaltet die Teilmenge der unwesentlichen Input- und Prozessvariablen diejenigen Variablen, die • entweder mit den Produktvariablen nicht oder nur sehr gering korreliert • oder aber redundant sind. Neben der „Vorhersage“ der Produktvariablen aufgrund von Werten für die Input- und Prozessvariablen ist somit die Auswahl der wesentlichen Input- und Prozessvariablen ein vorrangiges Ziel der Anwendung der Regressionsanalyse sowohl mit bekannten, festen (nicht stochastischen) als auch stochastischen Input- und Prozessvariablen. σY/X § · n ¸, n → ∞ ¨1 + − − © N n 1¹ σY/X optimale Anzahl n Abb. 5.14.1: Optimale Anzahl p* 1316han05.indd 306 25.07.2006 11:39:35 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 307 Es ist notwendig an dieser Stelle noch einmal darauf hinzuweisen, dass es zwischen den beiden Modellen grundsätzliche Unterschiede gibt. Diese sind: Wird in dem Modell mit festen Input- und Prozessvariablen z. B. Xn gestrichen, dann • verändert sich das Modell Y = βTY . x ⋅ x + ε, mit ε = Y − n ∑ βY . j x j j =1 in das Modell Y = n −1 ∑ βY . j x j + ε *, j =1 in dem E(ε*) verschieden von null ist. • Im Modell mit stochastischen Input- und Prozessvariablen Y = β0 + βY/X X + FY/X, mit 2 βTY/X = σY.X Σ–1 YY, β0 = µY – βY/X μX und FY/X = Y – E[Y/X] ~ N1(0, σ Y/X) und Y und FY/X sind unabhängig voneinander, gilt auch nach der Streichung des Input- oder Prozessvariables Xn, dass FY/X = Y – E[Y/X] ~ N1(0, σ2Y/X) ist. Es ist aber klar, in diesem Modell wird σ2Y/X größer. Alle Verfahren zur Auswahl der wesentlichen Input- und Prozessvariablen werden unter der Bezeichnung Teilmengenregression sublimiert. Die meisten Verfahren entstanden unter der Annahme, dass die Input- und Prozessvariablen feste Einstellgrößen sind. Diese Annahme ist – zumindest für die Anwendung der Verfahren zur statistischen Analyse von Prozessen – nicht gerechtfertigt, denn zumindest die Inputvariablen sind Zufallsgrößen, da sie als Produktvariablen von Vorläuferprozessen aufgefasst werden müssen. Diese Verfahren, siehe z. B. Hocking [1972, 1976], Hocking and Leslie [1967], Thompson [1978], Kinal and Lahiri [1983], Mallows [1966, 1977]Miller [1990] und viele andere, werden nicht im Detail beschrieben, sondern nur für die Einschätzung des universellen Red-Verfahrens von Jahn [1984, 1991] verwendet. 5.14.2 Welche Verfahren können für die Auswahl optimaler Teilmengen von „fixen“ Input- und Prozessvariablen verwendet werden? Für das Modell mit festen Input- und Prozessvariablen (feste Einstellgrößen) wurden in den letzten Jahren zahlreiche Auswahlverfahren entwickelt. Diese Verfahren lassen sich in drei Gruppen einteilen. 1316han05.indd 307 25.07.2006 11:39:35 308 5 Qualität in der Fertigung 1. Berechnungsalgorithmen zum Auffinden der besten Anpassungsteilmengen. Diese Verfahren basieren entweder auf dem „Kleinst Quadrat Anpassungskriterium“, der Minimax Anpassung oder der L1 bzw. L∞ Anpassung. Bei all diesen Verfahren müssen die Restsummen der Abweichungsquadrate für alle 2n – 1 Teilmengen berechnet werden. Das ist ein Riesenaufwand, vgl. z. B. Edwards and Havra’nek [1987]. 2. Vorhersagefehler Minimierungsverfahren. Der Vorhersagefehler für das Modell mit festen Input- und Prozessvariablen wird genauso berechnet wie der unbedingte Vorhersagefehler im Modell mit stochastischen Input- und Prozessvariablen. Auswahlverfahren, die darauf basieren, sind das Cp-Verfahren von Mallows [1973], das PSS von Allen [1971] und das BIC von Schwarz [1978]. Informationstheoretische Betrachtungen im Zusammenhang mit dem Vorhersagefehler führen auf das AIC von Akaike [1973, 1976]. An dieser Stelle soll nur das Cp Kriterium von Mallows für das lineare Modell mit festen Input- und Prozessvariablen etwas ausführlicher skizziert werden. Nach obigen Grundanliegen soll der Vektor x der festen Input- und Prozessvariablen in zwei Teilvektoren zerlegt werden. Dabei beinhaltet der Teilvektor x(k) die wesentlichen und x(h) die unwesentlichen Input- und Prozessvariablen, wobei k = (k1, …, kp), mit k1 < … < kp die Teilmenge der Indices für die wesentlichen und h = (h1, …, hn – p), mit h1 < … < hn – p die Teilmenge der Indices der unwesentlichen Variablen bezeichnen. Das Teilmengenregressionsmodell lautet dann Y = βTY.k x (k) + ε(k). Der Vorhersagefehler für dieses Modell ist N N . p = E [Y − Yˆ (k)]2 = σ 2R + var [Yˆ (k)] + {E [Yˆ (k) − Y ]}2 . Eine Mittelung über die Zeilen der Design Matrix x liefert N N i =1 i =1 ∑U N , p,i = ∑ E [Yi − Yˆi (k)]2 = N σ 2R + N N i =1 i =1 ∑ var [Yˆi (k)] + ∑ {E [Yˆi (k) − Yi ]}2 . Mallows betrachtet nun das folgende Kriterium Γp = 1 ⎛N ∑ var [Yˆi (k)] + σ 2R ⎜⎝ i =1 N ⎞ ∑ {E [Yˆi (k) − Yi ]}2 ⎟⎠ i =1 1 = 2 E [Yˆ (k) − βTY . x (k) x(k)]T E [Yˆ (k) − βTY . x (k) x(k)] + p . σR Den Bias E [Yˆ (k) − βTY . x (k) x(k)]T E [Yˆ (k) − βTY . x (k) x(k) = SSB] 1316han05.indd 308 25.07.2006 11:39:35 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 309 kann man ausdrücken durch T SSE = ⎡⎣Y − BYx (. xk()Tk) ⎤⎦ ⎡⎣Y − BYx (. xk()Tk) ⎤⎦ = RSE (Bezeichnung in manchen Programmen). Der Erwartungswert von SSE ist E (SSE) = (N − p) σ 2R + SSB . Für die Schätzung von Γp verwendet Mallows die Statistik Cp = (N − p) σˆ 2R + 2 p − N ≈ p. σˆ 2R 3. Testverfahren Zu diesen Verfahren gehören die stufenweisen oder schrittweisen Verfahren (Vorwärts- und Rückwärtsauswahl) von Draper, Smith [1981], Miller [1990] als die bekanntesten. Außerdem gehören der overall F-Test und der finite intersection Test von Krishnaiah [1982] zu dieser Gruppe. Die stufenweisen Verfahren verwenden die F-Statistik Fˆj = Y ⋅ X Tj ⋅ ( X j ⋅ X Tj )−1 ⋅ X j ⋅ Y T ⋅ (N − 1) Y ⋅ [I − X Tj ⋅ ( X j ⋅ X Tj )−1 ⋅ X j ] ⋅ Y T zur Prüfung der Einzelhypothese H0,j: βY/j = 0, für j = 1, …, n, wobei βY/j aus dem Modell E[Y] = βY/j Xj kommt. Unter der Normalverteilungsannahme ist Fˆj ∼ F1,N −1 verteilt. Wird die H0, j nicht verworfen, dann wird xj als unwesentlich angesehen. Werden die H0, j j = 1, …, n verworfen, dann wird die Input- oder Prozessvariable als wesentlich deklariert, der max (Fˆ1 , …, Fˆn ) > Fα entspricht. Diese Variable ist dann x[1]. Gilt z. B. max (Fˆ1 , …, Fˆn ) = F1 , dann wird x1 zur wichtigsten Prozessvariablen erklärt. Ist max (Fˆ1 , …, Fˆn ) ≤ Fα , dann wird keine der Input- und Prozessvariablen als wichtig erkannt und die Analyse ist beendet. Nach dem Auffinden von x1 wird die zweitwichtigste Input- oder Prozessvariable gesucht. Hierzu werden die F-Statistiken Fˆjk = Y ⋅ M 0. jk ⋅ Y T ⋅ (N − 2) Y ⋅ M jk Y T , j = 1, …, n mit M 0, jk = [I − X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ] ⋅ X Tj [ X j ⋅ X Tj − X j ⋅ X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ⋅ X Tj ]−1 ⋅ X j =I− ( X Tj , X kT ) ⋅ ⎡ ⎛ Xk ⎞ ⎤ T T ⎢ ⎜ ⎟ ⋅ (xk X j )⎥ X ⎢⎣ ⎝ j ⎠ ⎥⎦ −1 ⎛ Xk ⎞ ⎜⎝ X ⎟⎠ j berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen, d. h. ist max (Fˆ12 , …, Fˆ1n ) ≤ F1α , dann ist keine der Prozessvariablen X2, …, Xn wesentlich und wir sind fertig. F1α ist der obere 100α % Punkt der zentralen F-Verteilung. Wenn max (Fˆ12 , …, Fˆ1n ) > F1α , dann ist die zu dem Maximum gehörende Variable die zweitwichtigste Input- oder Prozessvariable. In dieser Weise wird das Verfahren fortgesetzt. Die F-Statistik ist nichts anderes als der Test zur Prüfung der Hypothese 1316han05.indd 309 25.07.2006 11:39:36 310 5 Qualität in der Fertigung H0: βY.j = 0 für das klassische Modell E[Y] = βY.j Xj, für j = 1, …, n. Für dieses Modell ist Fj zentral F-verteilt mit (1, N – 1) FG. Wenn H0 „wahr“ ist, dann ist xj unwichtig. Wenn H0 nicht „wahr“ ist, dann bedeutet das jedoch nicht, dass xj im 1. Schritt in die Prozessgleichung einbezogen wird. In der 1. Stufe, wenn alle Prozessvariablen nicht unwesentlich sind, picken wir nur die wesentlichste heraus und formulieren keine Aussage über die Auswahl der anderen Prozessvariablen, die als nicht unwichtig deklariert werden. Das Vorgehen führt somit in einen Bereich, in dem keine Entscheidung getroffen wird. Bei diesem Verfahren werden die n Einzelhypothesen individuell und nicht simultan geprüft, denn der Fehler 1. Art wird in jeder Stufe separat gewählt unter der Bedingung, dass P[Fj ≤ Fα/H0,j] = 1 – α. Nehmen wir nun an, dass für ein beliebiges j das Modell E[Y] = βY.j Xj nicht korrekt ist, dann ist F nicht zentral F-verteilt mit (1, N – 1) FG. Betrachten wir nur einmal in der r-te Stufe das Modell E[Y] = βY.1 X1 + … + βY.r Xr + βY.j Xj für j = r + 1, …, n. Dann gilt auch hier, dass die F-Statistik diejenige Statistik ist, die zur Prüfung der H0 unter diesem Modell ist. Damit wird deutlich, dass auf der (j + 1)-ten Stufe der kritische Fj, α Wert gewählt wird, ohne Beachtung der Entscheidungen in den vorangegangenen Stufen. Nimmt man z. B. die 2. Stufe, dann sollte man die bedingten Wahrscheinlichkeiten P[F1j ≤ F1α/H0; max(F1, …, Fn) ≥ Fα] für j = 2, …, n berechnen, um den Fehler 1. Art für die Prüfung der H0 für ein gegebenes j anstelle der P[F1j ≤ Fα /H0] zu bestimmen, denn wir wollen ja zur 2. Stufe übergehen, nur wenn max (Fˆ12 , …, Fˆ1n ) > Fα . Beispiel 5.14.1: Chemischer Prozess. Teilmengenregressionen Auswahl der wesentlichen Input- und Prozessvariablen nach dem Cp-Kriterium von Mallows. Die Auswahl wird mit dem Datensatz 05.7.1 chem. Prozess demonstriert. Die Produktvariable ist Y1, als Prozessvariablen habe ich aus der Gesamtmenge der Inputund Prozessvariablen die folgende Teilmenge der Prozessvariablen ausgewählt und mit den Buchstaben A bis L bezeichnet, da das Programm von Mallows Buchstaben anstelle von Symbolen erwartet. X3 = A X4 = B X5 = C X6 = D X7 = E X9 = F X16 = G X17 = H X18 = I X19 = J X20 = K X21 = L Der Stichprobenumfang umfasst N = 107 Beobachtungsvektoren. Die Anzahl der möglichen Modellansätze ist 212 = 4096. Es ist vollkommen klar, dass ich nicht alle 4096 Detailergebnisse hier darstellen kann. Daher wähle ich nur eine Teilmenge von Resultaten aus. 1316han05.indd 310 25.07.2006 11:39:36 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 311 Die Teilmengen mit einer Prozessvariablen sind Model Results -------------------------------------------------------------------Adjusted Included MSE R-Squared R-Squared Cp Variables -------------------------------------------------------------------47,5433 0,0 0,0 207,759 44,5049 7,27389 6,39078 187,01 A 46,4821 3,15448 2,23214 199,893 B 47,5433 0,943396 0,0 209,731 C 38,1133 20,5909 19,8346 145,359 D 47,5433 0,943396 0,0 207,453 E 30,7136 36,008 35,3986 97,1408 F 45,6049 4,98194 4,07701 194,178 G 26,0692 45,6846 45,1673 66,8763 H 25,4059 47,0667 46,5626 62,5538 I 44,7453 6,77295 5,88507 188,576 J 45,6593 4,86876 3,96275 194,532 K 44,1012 8,11493 7,23983 184,379 L Teilmengen mit zwei Prozessvariablen 44,9072 44,8954 36,7184 44,9241 24,8555 42,5661 26,258 25,5116 7,32686 7,35104 24,2257 7,29186 48,7066 12,1581 45,8124 47,3528 5,54468 5,56933 22,7685 5,50901 47,7202 10,4688 44,7704 46,3403 188,844 188,768 135,991 188,953 59,4249 173,734 68,4767 63,659 AB AC AD AE AF AG AH AI Teilmengen mit drei Prozessvariablen 45,3041 36,8847 45,289 25,0909 42,9776 26,5118 25,7582 43,0642 43,9621 7,40662 24,6144 7,43763 48,7188 12,1617 45,8148 47,355 11,9846 10,1495 4,70972 22,4187 4,74164 47,2252 9,60326 44,2366 45,8216 9,42104 7,53251 190,594 136,776 190,497 61,3867 175,723 70,4692 65,6522 176,276 182,016 ABC ABD ABE ABF ABG ABH ABI ABJ ABK 45,3041 36,8847 45,289 25,0909 42,9776 26,5118 25,7582 43,0642 43,9621 7,40662 24,6144 7,43763 48,7188 12,1617 45,8148 47,355 11,9846 10,1495 4,70972 22,4187 4,74164 47,2252 9,60326 44,2366 45,8216 9,42104 7,53251 190,594 136,776 190,497 61,3867 175,723 70,4692 65,6522 176,276 182,016 ABC ABD ABE ABF ABG ABH ABI ABJ ABK 1316han05.indd 311 25.07.2006 11:39:36 312 5 Qualität in der Fertigung 44,1848 22,5179 21,9735 28,8272 29,5788 28,2781 20,0571 9,69442 53,9776 55,0902 41,0824 39,5463 42,2048 59,007 7,06416 52,6371 53,7821 39,3664 37,7855 40,5215 57,813 183,439 44,9394 41,4596 85,2701 90,0747 81,7598 29,2095 EKL FGH FGI FGJ FGK FGL FHI Teilmengen mit vier Prozessvariablen 31,5516 45,7117 25,3001 43,3714 26,1166 25,3429 43,4204 44,3193 44,3107 34,7803 25,0574 35,457 26,7585 26,0094 36,4121 37,1576 36,1403 7,48072 48,7932 12,2174 47,1406 48,7066 12,1182 10,2989 10,3163 29,6056 49,2845 28,2359 45,8414 47,3576 26,3029 24,794 33,636 3,85251 46,7851 8,77489 45,0677 46,6951 8,67186 6,78124 6,79932 26,8451 47,2957 25,4216 43,7175 45,2932 23,4128 21,8447 102,727 192,363 63,154 177,548 68,3227 63,4247 177,858 183,548 183,494 123,165 61,6174 127,449 72,386 67,6439 133,494 138,214 ABCD ABCE ABCF ABCG ABCH ABCI ABCJ ABCK ABCL ABDE ABDF ABDG ABDH ABDI ABDJ ABDK 135,539 171,799 169,755 45,1393 63,1561 68,9047 65,6858 58,3311 64,6003 60,0338 172,215 ACEGJ ACEGK ACEGL ACEHI ACEHJ ACEHK ACEHL ACEIJ ACEIK ACEIL ACEJK 69,3295 17,9989 21,0359 10,7779 43,4456 40,7509 54,6351 DEFGKL DEFHIJ DEFHIK DEFHIL DEFHJK DEFHJL DEFHKL Teilmengen mit 5 Prozessvariablen 36,7797 42,5645 42,2385 22,3575 25,2319 26,149 25,6355 24,4621 25,4623 24,7337 42,6308 26,2887 14,6951 15,3485 55,1926 49,432 47,594 48,6232 50,9747 48,9702 50,4303 14,5622 22,6396 10,4721 11,1578 52,9744 46,9286 44,9996 46,0798 48,5477 46,444 47,9764 10,3326 Teilmengen mit 6 Prozessvariablen 26,1567 17,8856 18,375 16,7221 21,9859 21,5517 23,7889 1316han05.indd 312 48,0976 64,5098 63,5388 66,8186 56,3736 57,2352 52,7959 44,9835 62,3804 61,3511 64,8277 53,756 54,6693 49,9637 25.07.2006 11:39:37 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 313 Teilmengen mit 7 Prozessvariablen 27,39 18,0465 18,5408 16,742 22,0387 21,3412 23,1807 46,1938 64,5487 63,5777 67,1113 56,7062 58,0764 54,4627 42,3893 62,042 61,0023 64,7858 53,645 55,1121 51,2429 77,284 19,8774 22,9143 11,8625 44,4055 40,12 51,422 BCEFGKL BCEFHIJ BCEFHIK BCEFHIL BCEFHJK BCEFHJL BCEFHKL 56,9304 17,8034 6,54646 12,8058 36,2209 32,4466 ACEFGJKL ACEFHIJK ACEFHIJL ACEFHIKL ACEFHJKL ACEFIJKL 38,5712 7,44312 40,448 16,4915 18,7015 8,5704 11,8678 45,3311 40,2539 7,45684 BCEFGIJKL BCEFHIJKL BCEGHIJKL BCFGHIJKL BDEFGHIJK BDEFGHIJL BDEFGHIKL BDEFGHJKL BDEFGIJKL BDEFHIJKL 13,7785 43,4915 39,2742 9,43186 40,0348 16,9016 9,38847 9,40572 BCDEFGHIKL BCDEFGHJKL BCDEFGIJKL BCDEFHIJKL BCDEGHIJKL BCDFGHIJKL BCEFGHIJKL BDEFGHIJKL 11,0881 38,004 18,7405 11,0057 11,0533 11,0153 11,3796 ABCDEFHIJKL ABCDEGHIJKL ABCDFGHIJKL ABCEFGHIJKL ABDEFGHIJKL ACDEFGHIJKL BCDEFGHIJKL Teilmengen mit 8 Prozessvariablen 23,9941 17,5608 15,7099 16,7391 20,589 19,9684 53,341 65,8513 69,4505 67,4492 59,9625 61,1693 49,5321 63,0636 66,9566 64,7919 56,6942 57,9995 Teilmengen mit 9 Prozessvariablen 20,8595 15,6886 21,1712 17,1917 17,5588 15,8758 16,4236 21,9824 21,139 15,6909 59,8505 69,8033 59,2505 66,9102 66,2036 69,4428 68,3885 57,6892 59,3125 69,7989 56,1253 67,0015 55,4696 63,84 63,0678 66,6076 65,4555 53,7634 55,5374 66,9967 Teilmengen mit 10 Prozessvariablen 16,5797 21,5669 20,8591 15,8501 20,9867 17,1039 15,8428 15,8457 68,4171 58,9168 60,2652 69,8069 60,022 67,4185 69,8207 69,8152 65,1272 54,6373 56,1262 66,6617 55,8577 64,0246 66,6771 66,671 Teilmengen mit 11 Prozessvariablen 15,9586 20,524 17,2566 15,9447 15,9527 15,9463 16,0081 69,9168 61,3108 67,47 69,9431 69,9279 69,94 69,8236 66,4334 56,831 63,7034 66,4628 66,4459 66,4594 66,3294 Teilmenge mit allen 12 Prozessvariablen 16,1133 1316han05.indd 313 69,9449 66,1081 13,0 ABCDEFGHIJKL 25.07.2006 11:39:37 314 5 Qualität in der Fertigung Tabelle 5.14.1: Kleinste Cp innerhalb der Teilmengen gleicher Mächtigkeit Models with Smallest Cp Model Results ---------------------------------------------------------------Adjusted Included MSE R-Squared R-Squared Cp Variables ---------------------------------------------------------------15,4953 69,2528 67,408 3,16473 EFHIJL 15,4133 69,7215 67,5806 3,69893 EFHIJKL 15,5857 69,3828 67,218 4,75808 AEFHIJL 15,6116 69,3319 67,1634 4,91743 DEFHIJL 15,6167 69,3218 67,1526 4,94894 BEFHIJL 15,6168 69,3217 67,1526 4,94916 EFGHIJL 15,4847 69,8885 67,4304 5,17655 AEFHIJKL 15,548 69,7653 67,2972 5,5618 BEFHIJKL 15,5531 69,7555 67,2865 5,59256 EFGHIJKL 15,556 69,7497 67,2803 5,61057 DEFHIJKL 15,5592 69,7435 67,2736 5,62989 CEFHIJKL 15,6304 69,9152 67,1238 7,09298 ACEFHIJKL 15,6324 69,9114 67,1197 7,10487 AEFGHIJKL 15,6387 69,8992 67,1063 7,14302 ADEFHIJKL 15,6422 69,8925 67,0991 7,16386 ABEFHIJKL 15,6886 69,8033 67,0015 7,44312 BCEFHIJKL 16,3819 67,4935 65,5431 8,667 EFGHIL 15,7809 69,9388 66,8074 9,01932 ACEFGHIJKL 16,5957 66,7401 65,0935 9,02353 EFHIL 15,7896 69,922 66,7889 9,07166 ABEFGHIJKL 15,7901 69,9212 66,788 9,07414 ADEFGHIJKL 15,7928 69,9159 66,7822 9,09072 ACDEFHIJKL 15,7929 69,9159 66,7822 9,09076 ABCEFHIJKL 16,5026 67,2541 65,2894 9,41573 EFHIKL 16,6609 66,94 64,9564 10,3981 BEFHIL 16,7079 66,8466 64,8574 10,6902 CEFHIL 15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL 15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL 15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL 15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL 16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL 16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL 17,6875 64,552 62,7971 15,867 BFHIL 17,8372 64,2519 62,4822 16,8056 EFHIJ 17,848 64,2303 62,4595 16,8731 DFHIL 18,2284 63,4679 61,6594 19,2575 EFHIK 18,6575 62,2376 60,7567 21,1054 FHIL 18,8727 61,8022 60,3042 22,4673 EFHI 19,3647 60,8064 59,2694 25,5817 DFHI 19,3769 60,7817 59,2438 25,6587 FGHI 19,6796 60,1689 58,6069 27,5753 FHIK 20,0571 59,007 57,813 29,2095 FHI 21,5712 55,9124 54,6283 38,8881 FIJ 21,7327 55,5824 54,2887 39,9202 HIL 21,9735 55,0902 53,7821 41,4596 FGI 22,1304 54,7696 53,4522 42,4623 FHJ 22,7717 53,0069 52,1032 45,9754 FI 23,3479 51,818 50,8914 49,6938 FH 23,6865 51,1191 50,1791 51,8795 HI 24,6811 49,0666 48,0871 58,299 GI 24,7316 48,9625 47,981 58,6246 IJ 25,4059 47,0667 46,5626 62,5538 I 26,0692 45,6846 45,1673 66,8763 H 30,7136 36,008 35,3986 97,1408 F 38,1133 20,5909 19,8346 145,359 D 44,1012 8,11493 7,23983 184,379 L 47,5433 0,0 0,0 207,759 ---------------------------------------------------------------- 1316han05.indd 314 25.07.2006 11:39:37 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 315 Mallows' Cp Plot for y1 240 Cp 200 160 120 80 40 0 0 3 6 9 Number of Coefficients 12 15 Abb. 5.14.2: Cp-Kriterium von Mallows Die Darstellung des besten (kleinsten) Cp innerhalb jeder Teilmenge von Prozessvariablen gleichen Umfangs ist in der Abbildung 5.14.2 enthalten. Diese Abbildung zeigt, dass die Mächtigkeit der Teilmenge mit dem kleinsten Cp zwischen n = 6 und n = 8 zu liegen scheint. Für eine genauere Bestimmung sucht der Computer innerhalb jeder Mächtigkeit der Teilmengen das kleinste Cp. Die Werte sind in der Tabelle 5.14.1 angegeben. Das Gesamtmodell (das Modell mit allen 12 Prozessvariablen) ist in der Tabelle 5.14.2 enthalten. Tabelle 5.14.2: Prozessgleichung mit allen Prozessvariablen Prozessgleichung ----------------------------------------------------------------------------Produktvariable: y1 ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT -408,705 214,545 -1,90499 0,0598 x3 -0,63914 0,852096 -0,750079 0,4551 x4 0,201308 0,523085 0,384847 0,7012 x5 1,92428 18,9108 0,101756 0,9192 x6 1,27445 17,1746 0,0742055 0,9410 x7 -11,723 3,98068 -2,94496 0,0041 x9 0,322213 0,0597561 5,39213 0,0000 x16 -0,0941571 0,845685 -0,111338 0,9116 x17 89,7031 18,5206 4,84342 0,0000 x18 -91,06 17,9793 -5,06472 0,0000 x19 1,07786 0,47749 2,25734 0,0263 x20 3,53736 2,78535 1,26999 0,2072 x21 0,802039 0,23722 3,381 0,0010 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 3537,88 12 294,824 18,48 0,0000 Residual 1515,41 95 15,9517 ----------------------------------------------------------------------------Total (Corr.) 5053,3 107 R-squared = 70,0114 percent R-squared (adjusted for d.f.) = 66,2233 percent Standard Error of Est. = 3,99396 Mean absolute error = 2,89319 Durbin-Watson statistic = 1,02239 1316han05.indd 315 25.07.2006 11:39:37 316 5 Qualität in der Fertigung Das Maß der Beherrschbarkeit für diesen Ansatz ist R2Y.X = 0.700 und die Reststandardabweichung ist s = 3.9939. Diese Gleichung kann auch in der üblichen Form y1 = -408,705 - 0,63914*x3 + 0,201308*x4 + 1,92428*x5 + 1,27445*x6 11,723*x7 + 0,322213*x9 - 0,0941571*x16 + 89,7031*x17 - 91,06*x18 + 1,07786*x19 + 3,53736*x20 + 0,802039*x21 geschrieben werden. Verwendet man die optimale Teilmenge {X7, X9, X17, X18, X19, X21} die man nach dem Cp Kriterium von Mallows über alle möglichen Teilmengen von Prozessvariablen aufgefunden hat, dann erhält man die Prozessgleichung in folgender Tabelle. Tabelle 5.14.3: Prozessgleichung für die Cp optimale Teilmenge von Prozessvariablen Optimale Prozessgleichung ----------------------------------------------------------------------------Produktvariablee: y1 y1 Produktvariable: ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT -229,092 48,0022 -4,77254 0,0000 x7 -10,9841 2,41239 -4,5532 0,0000 x9 0,278296 0,043022 6,4687 0,0000 x17 90,2917 15,5109 5,82117 0,0000 x18 -92,135 14,6712 -6,28001 0,0000 x19 0,973529 0,332094 2,93148 0,0042 x21 0,824957 0,203737 4,04912 0,0001 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 3501,64 6 583,607 37,99 0,0000 Residual 1551,65 101 15,3629 ----------------------------------------------------------------------------Total (Corr.) 5053,3 107 R-squared = 69,2942 percent R-squared (adjusted for d.f.) = 67,4701 percent Standard Error of Est. = 3,91956 Mean absolute error = 2,85277 Durbin-Watson statistic = 1,0026 Bemerkung zur Tabelle 5.14.3 Die 1. Spalte der beiden Tabellen beinhaltet die Parameterbezeichnung, die 2. Spalte die Koeffizienten der Prozessgleichung. Die Prozessgleichung kann auch in der Form y1 = -229,092 - 10,9841*x7 + 0,278296*x9 + 90,2917*x17 - 92,135*x18 + 0,973529*x19 + 0,824957*x21 geschrieben werden. In der 3. Spalte stehen die Standardabweichungen für die Koeffizienten der Prozessgleichung. Die 4. Spalte ist für die Werte der t-Statistik 1316han05.indd 316 25.07.2006 11:39:38 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? tj = BY . j SR ⋅ 317 N −n A jj mit Ajj als einem Diagonalelement von A–1 xx reserviert. Die letzte Spalte beinhaltet die berechneten Irrtumswahrscheinlichkeiten für den t-Test. Sind diese Werte < 0.05, dann ist der zugehörige Regressionskoeffizient statistisch gesichert von null verschieden, d. h. dann hat xj einen wesentlichen Einfluss auf Y. Das Maß der Beherrschbarkeit des vollständigen Ansatzes sinkt durch den Übergang zum Cp-optimalen Ansatz. Die Reststandardabweichung wird geringfügig kleiner. Das liegt aber offensichtlich an der Anzahl der FG. Schrittweise Auswahl der unwesentlichen Prozessvariablen nach dem Verfahren von Draper, Smith Das schrittweise Verfahren von Draper Smith wurde von Miller [1984] beschrieben und vorn in diesem Abschnitt diskutiert. Beispiel 5.14.2: Chemischer Prozess. Schrittweise Auswahl der unwesentlichen Prozessvariablen Das Verfahren liefert die Prozessgleichung Tabelle 5.14.4: Ergebnis für die Prozessgleichung nach der schrittweisen Auswahl Prozessgleichung ----------------------------------------------------------------------------Produktvariable: y1 ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT -224,444 49,8182 -4,50527 0,0000 x7 -10,9184 2,42925 -4,49457 0,0000 x9 0,273991 0,0447462 6,12322 0,0000 x17 90,3134 15,5777 5,7976 0,0000 x18 -92,2535 14,7377 -6,25969 0,0000 x19 0,959545 0,335657 2,85871 0,0052 x21 0,838724 0,207968 4,03294 0,0001 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 3490,06 6 581,676 37,54 0,0000 Residual 1549,53 100 15,4953 ----------------------------------------------------------------------------Total (Corr.) 5039,59 106 R-squared = 69,2528 percent R-squared (adjusted for d.f.) = 67,408 percent Standard Error of Est. = 3,93641 Mean absolute error = 2,86302 Durbin-Watson statistic = 1,00251 1316han05.indd 317 25.07.2006 11:39:38 318 5 Qualität in der Fertigung oder wird in der üblichen Weise geschrieben: y1 = -224,444 - 10,9184*x7 + 0,273991*x9 + 90,3134*x17 - 92,2535*x18 + 0,959545*x19 + 0,838724*x21 Diese Gleichung stimmt mit der Cp-optimalen Gleichung überein. Die geringfügigen Abweichungen sind numerischer Art. 5.14.3 Red-Auswahlverfahren von Jahn Für das Modell mit stochastischen Input- und Prozessvariablen wurde von Jahn [1991] das Red Auswahlverfahren entwickelt. Dieses Verfahren basiert auf der Reduktion der bedingten Varianz σY2 / X durch Hinzunahme weiterer Input- und Prozessvariablen bzw. auf der Reduzierung dieser Varianz durch Streichen von Input- und Prozessvariablen und realisiert die Anforderungen an das optimale p* und die dazu gehörende Teilmenge von wesentlichen Input- und Prozessvariablen. Außerdem liefert dieses Verfahren die „wahre“ Rangfolge der Input- und Prozessvariable bzgl. ihres Einflusses auf den (die) Produktvariablen. Zur Untersuchung der durch die Streichung eines Teilvektors bedingten Veränderungen auf die Modellparameter Regressionskoeffizienten, bedingte Varianz (Restvarianz), „Vorhersagefehler“, Maß der Beherrschbarkeit des Prozesses und die Teststatistiken, wird von einer beliebigen, disjunkten Zerlegung des Vektors X der Input- und Prozessvariable in XT = [X(k)T, X(h)T], mit k = (k1, …, kp), k1 < k2 < … < kp und h = (h1, …, hn – p), h1 < h2 < … < hn – p ausgegangen. Damit erhält man die Zerlegung (siehe Glossar) der positiv definiten Kovarianzmatrix ⎛ ΣYY Σ=⎜ ⎜ ⎝ ΣYk Σ kk ΣYh ⎞ Σ kh ⎟ , ⎟ Σ hh ⎠ wobei die Teilmatrizen die Ordnungen ΣYY: m × m, Σkk: p × p, Σhh: (n – p) × (n – p), ΣYk: m × p, ΣYh: m × (n – p) und Σkh: p × (n – p) haben. Entsprechend der Kovarianzmatrix kann man die Momente der bedingten Verteilung, den bedingten Erwartungswert (Regressionsfunktion) und die bedingte Kovarianzmatrix zerlegen. Man erhält das folgende Ergebnis. Zerlegungssatz für die Momente einer bedingten Verteilung: Es sei Z ~ Nm + n(0, Σ), Σ > 0 (positiv definit). E [Y / X(k), X(h)] = βTY .k / h ⋅ X(k) + βTY .h / k ⋅ X(h) und var [Y / X(k), X(h)] = ΣYY / k − βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k := ΣYY / X , 1316han05.indd 318 25.07.2006 11:39:38 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 319 wobei −1 βTY .k / h = ΣY .k / h ⋅ Σ kk /h, −1 βTY .h / k = ΣY .h / k ⋅ Σ hh /k, −1 ⋅ Σ hk = cov{[Y , X (k)]/ X (h)}, ΣY .k / h = ΣYk − ΣYh ⋅ Σ hh −1 ⋅ Σ kh = cov{[Y , X (h)]/ X (k)}, ΣY .h / k = ΣYh − ΣYk ⋅ Σ kk −1 ⋅ Σ kh , Σ hh / k = Σ hh − Σ hk ⋅ Σ kk −1 ⋅ Σ hk . Σ kk / h = Σ kk − Σ kh ⋅ Σ hh Beweis: Jahn [1991]. Dieser Satz besagt, dass eine Regressionsfunktion als Summe zweier bedingter Regressionsfunktionen darstellbar ist; einmal zwischen Y und X(k) unter der Bedingung X(h) und zum anderen zwischen Y und X(h) unter der Bedingung X(k). Analog zerfällt die bedingte Kovarianzmatrix ebenfalls in zwei Bestandteile; einmal die bedingte Kovarianzmatrix des Vektors der Produktvariable Y unter der Bedingung X(k) und zum anderen in die quadratische Form βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k . Diese Form ist der Anteil, um den die bedingten Varianzen und Kovarianzen von Y unter der Bedingung X(k) verringert werden, wenn der Teilvektor der Input- und Prozessvariable X(h) zu dem Teilvektor X(k) hinzu genommen wird. Daher wird die quadratische Form βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k REDp(h) genannt. Die Umkehr dieser Interpretation ist, Redp(h) ist die proportionale Vergrößerung der bedingten Varianz z. B. der Produktvariablen Yr, r = 1, …, m unter der Bedingung X, wenn die Input- und Prozessvariablen X(h) gemeinsam gestrichen werden. Was bedeutet die Teilmengenregression? Die Zerlegung des bedingten Erwartungswertes und der bedingten Varianz dienen dem Auffinden eines Auswahlverfahrens für eine optimale Teilmenge von Input- und Prozessvariablen im Sinne der Minimierung des unbedingten Vorhersagefehlers und der Auseinandersetzung mit der Hocking’schen Teilmengenregression, die z. B. in Hocking and Lesie [1967], Hocking [1972, 1976], beschrieben wurde. Y = βTY / k ⋅ X (k) + FY / k −1 mit FY/k ∼ Np (0, ΣYY/k) und ist unabhängig von X(k), wobei βTY / k = ΣY .k Σ kk . Der Vergleich der Teilmengenregression mit dem Zerlegungssatz zeigt eine Übereinstimmung des vollständigen Ansatzes mit der Teilmengenregression nur für den Fall ΣYh = 0 und Σkh = 0. Ist nur Σkh = 0, dann gilt Y = βTY / k ⋅ X (k) + βTY / h ⋅ X (h) + FY / X mit var (FY / X ) = ΣYY / k − βTY / h ⋅ ΣYY / h ⋅ βY / h . Da diese Fälle bei praktischen Anwendungen erkannt würden, besitzen sie nur theoretisches Interesse. Über die Auswirkung der Streichung von X(h) aus dem Ansatz gibt der folgende Satz Auskunft. 1316han05.indd 319 25.07.2006 11:39:38 320 5 Qualität in der Fertigung Satz: Unter den bisherigen Voraussetzungen gilt −1 βTY / k = βTY .k / h + βTY .h / k ⋅ Σ hk ⋅ Σ kk , −1 FY / k = FY / X + βTY .h / k ⋅ [ X (h) − Σ hk ⋅ Σ kk ] und damit ΣYY / k = ΣYY / X + βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k . Die Elemente der bedingten Kovarianzmatrix ΣYY/k sind größer als die von ΣYY/X und zwar um genau die Elemente von Redp(h). Die Vorhersagefehler der Teilmengenregression sind −1 M N .k = (ΣYY / k + βYT .h / k ⋅ Σ hh / k ⋅ βY .h / k ) ⋅ [1 + X E (k)T ⋅ Akk ⋅ X E (k)] und ⎛ ⎞ p . U N .k = (ΣYY / k + βYT .h / k ⋅ Σ hh / k ⋅ βY .h / k ) ⋅ ⎜1 + N − p − 1 ⎟⎠ ⎝ Der Vergleich der beiden unbedingten Vorhersagefehler UN.n und UN.k liefert ein erstes Indiz für die Konstruktion des Auswahlverfahrens, denn die Diagonalelemente der Vorhersagefehlermatrizen sind die Vorhersagefehler für jede Produktvariable Yj, j = 1, …, m und für diese genügt es, wenn gilt βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k ≤ ΣYY / X ⋅ Fˆjk = Y ⋅ M 0. jk ⋅ Y T ⋅ (N − 2) Y ⋅ M jk Y T n−p . N −n −1 , j = 1, …, n mit M 0, jk = (I − X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ) ⋅ X Tj [ X j ⋅ X Tj − X j ⋅ X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ⋅ X Tj ]−1 ⋅ X j −1 =I− ( X Tj , X kT ) ⋅ ⎡ ⎛ Xk ⎞ ⎤ ⎛ Xk ⎞ T T ⎢ ⎜ ⎟ ⋅ ( X k X j )⎥ ⎜ ⎟ ⎢⎣ ⎝ X j ⎠ ⎥⎦ ⎝ X j ⎠ berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen. Die Vorhersagefehler sind unbekannt und müssen ebenfalls bestimmt werden. Die ML-Schätzfunktion für den Vorhersagefehler ist n ⎛ ⎞ Uˆ N .n = SY2 / X ⎜1 + ⎟. ⎝ N − n − 1⎠ Der Vorhersagefehler kann nun mit der Stichprobenkovarianzmatrix und dem geschätzten Red nach der Formel ⎛ ⎞ p 2 ˆ Uˆ N′ .n = [Red p (h) + (N − n − 1) SY / X ] ⎜1 + N − p − 1 ⎟⎠ ⎝ bestimmt werden. 1316han05.indd 320 25.07.2006 11:39:38 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 321 Bei einem sehr hohen Grad der Multikollinearität δ können Sie anstelle der Stichprobenkovarianzmatrix besser die Stichprobenkorrelationsmatrix R ⎞ p ˆ ′ (h) + (N − n − 1) S ′ 2 ] ⎛1 + Uˆ N′′ .n = [Red p Y /X ⎜ N − p − 1 ⎟⎠ ⎝ 1 verwenden, wobei R̂ed ′p (h) mit den Diagonalelementen der inversen Korrelationsmatrix R −XX 2 gebildet wird. Analoges gilt für S′ Y / X . Die ML-Schätzfunktionen für den unbedingten Vorhersagefehler können umgeschrieben werden. Man erhält ⎛ ⎞ p 2 ˆ Uˆ N′ .n = [Red p (h) + (N − n − 1) SY / X ] ⎜1 + N − p − 1 ⎟⎠ ⎝ 2 ˆ = [Red p (h) + (N − n − 1) SY / X ] N −1 N − p −1 ⎞ p ˆ ′ (h) + (N − n − 1) S ′ 2 ) ⎛1 + Uˆ N′′ .n = [Red p Y /X ⎜ N − p − 1 ⎟⎠ ⎝ ˆ ′ (h) + (N − n − 1) S ′ 2 ) = [Red p Y /X N −1 N − p −1 . N ist konstant, daher kann man die Vorhersage im Sinne des Kriterium von Mallows umschreiben, d. h. N – 1 weglassen. Damit erhält man Sn = Uˆ C ,N .n = R̂ed p (h) + (N − n − 1) SY2 / X (N − p − 1)2 . p* wird dann geschätzt, indem man für alle möglichen Teilmengen das kleinste Uˆ C ,N .n sucht. Das dazu gehörende p bezeichnet man mit p̂ und betrachtet es als Schätzung für p*. Da p̂ eine Schätzung für p* ist, die aus den Realisierungen der Produktvariablen Y und des Vektors der Input- und Prozessvariablen X ermittelt wurde, kann anstelle der Optimalität des Verfahrens nur die asymptotische Optimalität nachgewiesen werden, d. h. es gilt die Wahrscheinlichkeit, dass Uˆ N . pˆ (N ) U N . pˆ (N ) ⎯⎯⎯⎯⎯ → 1. N − n (N )→ ∞ R̂ed p (h) = AY2 / k − AY2 / X = (N − p) ⋅ SY2 / k − (N − n) ⋅ SY2 / X = BYT.h / k ⋅ Ahh / k ⋅ BY .h / k ist die Schätzfunktion für Redp(h). Die Minimierung des unbedingten Vorhersagefehlers beinhaltet zwei Teilaufgaben, nämlich • die Bestimmung der optimalen Anzahl der Elemente der Teilmenge und • die Auswahl der wesentlichen Input- und Prozessvariablen. 1316han05.indd 321 25.07.2006 11:39:39 322 5 Qualität in der Fertigung Das Red Auswahlverfahren Da der Term N – 1 in der Formel Uˆ N . p konstant ist, genügt es, den Ausdruck Sp = ˆ (N − n − 1) ⋅ SY2 / X + Red p (h) (N − p − 1) ⋅ (N − p − 1) zu minimieren. Das Red Auswahlverfahren läuft in mehreren Schritten ab. Im ersten Schritt wird für jede Input- und Prozessvariable R̂ed p ( j) = BY2 . j / n − j ⋅ S 2j / n − j berechnet, wobei die Indexmenge h nur das Element j und demzufolge die Indexmenge k die restlichen n – j Elementen beinhaltet. S 2j / n − j ist die Maximum Likelihood Schätzfunktion für die bedingte Varianz der jten Input- oder Prozessvariablen unter der Bedingung, dass die −1 restlichen Input- und Prozessvariablen konstant gehalten werden. Aus der Matrix S XX kann −2 S j / n − j abgelesen werden. Analog kann man natürlich auch mit der Korrelationsmatrix RXX rechnen. Durch die Kehrwertbildung erhält man sofort den Wert A2j / n − j . BY.j/n – j ist folglich der j-te Regressionskoeffizient der j-ten Input- oder Prozessvariablen. Dieser Koeffizient kann nach dem Zerlegungssatz gemäß der Zerlegung BYT / X = (BY . j / n − j , BYT.n − j / j ) sofort aus dem vollständigen Ansatz abgelesen werden. Die Minimierung des unbedingten Vorhersagefehlers Uˆ N . p mit Redp(h) erfolgt über die Lösung der oben genannten zwei Probleme • Bestimmung des optimalen pˆ * und • die Auswahl der Input- und Prozessvariablen, die in X(k) zusammengefasst werden und die Uˆ N . p minimieren. Weiter oben wurde bereits darauf verwiesen, dass es aufgrund der Konstanz von N ausreichend ist, Sp(hn – p) zu minimieren. Für den vollen Ansatz gilt SY2 / X N −n −1 anstelle von Uˆ N .n . Mit den berechneten R̂ed n −1( j) , j = 1, …, n werden alle Input- und Prozessvariablen in eine Rangfolge X[1], …, X[n – p – 1], X[n – p], X[n – p + 1], …, X[n] geordnet, in der X[1] die unwichtigste Input- oder Prozessvariable ist, da diese beim Streichen den unbedingten Vorhersagefehler am geringsten vergrößert. Der Ansatz ohne die unwichtigste Input- oder Prozessvariable Sn = Sn −1(h[1]) = R̂ed n −1([1]) + (N − n − 1) ⋅ SY2 / X (N − n) ⋅ (N − n − 1) wird mit Sn verglichen. 1316han05.indd 322 25.07.2006 11:39:39 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 323 Gilt Sn −1 ≤ Sn , dann wird X[1] d. h. h[1] = h1 = ([1]) aus der Analyse entfernt. Im anderen Fall, d. h. falls Sn −1 > Sn , kann der vollständige Ansatz nicht reduziert werden. Im nächsten Schritt ist zu prüfen, ob mit X[1] auch X[2] gestrichen werden kann. Hierfür ist R̂ed n − 2 (h2 ) zu berechnen, wobei h2 = ([1], [2]) die zweielementige Teilmenge der beiden unwichtigsten Input- und Prozessvariablen ist. Gilt nun ˆ ˆ Red n − 2 (h2 ) ≤ Red n −1 ([3]) und Sn − 2 ≤ Sn −1 , dann kann die Teilmenge X(h2)T = (X[1], X[2]) aus dem Ansatz gestrichen werden. Gilt dagegen ˆ ˆ Red n − 2 (h2 ) > Red n −1 ([3]), aber Sn − 2 ≤ Sn −1 , muss man prüfen, ob alle möglichen Zweier-Teilmengen, die alle die 3. Input- oder Prozessvariable beinhalten, ein kleineres R̂ed n − 2 als R̂ed n −1 ([3]) liefern und damit ein kleineres ˆ S p [Red n − 2 (h2 )] ergeben. In diesem Fall wird das Verfahren fortgesetzt. Andernfalls ist das Verfahren beendet. Es gilt ⎛ bY .[1]/ n −[1] ⎞ −1 R̂ed n − 2 (h2 ) = (bY .[1]/ n −[1] , bY .[2]/ n − 2]) ⋅ S[1].[2]/ , n −[1].[2] ⋅ ⎜ ⎝ bY .[2]/ n − 2] ⎟⎠ wobei wiederum die beiden Regressionskoeffizienten bY .[1]/ n −[1] und bY .[2]/ n − 2] aus dem voll−1 ständigen Ansatz abgelesen werden und S[1].[2]/n – [1].[2] entweder aus der inversen Matrix S XX abgelesen oder entsprechend durch Invertierung der zerlegten Matrizen gebildet wird. In dieser Weise wird das Verfahren so lange fortgesetzt, wie ˆ ˆ Red p (hn − p ) ≤ Red n −1 ([n − p + 1]) und S p (hn − p ) ≤ S p +1 (hn − p −1 ) gilt, wobei im (n – p)-ten Schritt hn – p = ([1], [2], …, [n – p]). Die Teilmenge hn – p kann in diesem Fall gestrichen und das Verfahren mit der Erweiterung der Teilmenge hn – p um die [n – p + 1]-te Input- oder Prozessvariable fortgesetzt werden. Sind beide Bedingungen nicht erfüllt, dann ist man am Ende des Auswahlprozesses angelangt. Gilt jedoch ˆ ˆ Red p (hn − p ) > Red n −1 ([n − p + 1]) 1316han05.indd 323 25.07.2006 11:39:40 324 5 Qualität in der Fertigung und S p (hn − p ) ≤ S p +1 (hn − p −1 ) , dann ist das Verfahren in der 2. Stufe fortzusetzen. Wie vorher wird die Teilmenge ([1], …, [n – p], [n – p + 1]) betrachtet. Aus dieser werden alle Teilmengen mit (n – p) Input- und/oder Prozessvariablen, die alle die [n – p + 1]-te Input- oder Prozessvariable beinhalten, gebildet. Es sind dies die Teilmengen hn(1)− p = ([2], [3], …, [n − p], [n − p + 1]), hn(2)− p = ([1], [3], …, [n − p], [n − p + 1]), hn(n−−pp) = ([1], [2], …, [n − p − 1], [n − p + 1]) Hierfür werden die R̂ed p (hn − p ) berechnet. Ist das Kleinste aller bisher berechneten ⎡ ⎛ n − p ⎞ ⎤ ⎛ n − p + 1⎞ ⎢1 + ⎜ ⎥= ⎟⎠ , d. h. 1 ⎝ 1 ⎟⎠ ⎦ ⎜⎝ ⎣ ⎧ ⎫ ⎛n − p ⎞ ⎪ ⎪ ⎜⎝ 1 ⎟⎠ ⎪⎪ ⎪⎪ l ˆ ˆ ˆ h h Min ⎨Red ( ), Min [Red ( )] p n− p p n − p ⎬ ≤ Red n − p ([n − p + 2]), ⎪ ⎪ l =1 ⎪ ⎪ ⎩⎪ ⎭⎪ dann ist die Auswahl beendet und die zugehörige Teilmenge wird gestrichen. Gilt dagegen ⎧ ⎫ ⎛n − p ⎞ ⎪ ⎪ ⎜⎝ 1 ⎟⎠ ⎪⎪ ⎪⎪ l ˆ ˆ ˆ h h Min ⎨Red ( ), Min [Red ( )] p n− p p n − p ⎬ > Red n − p ([n − p + 2]), ⎪ ⎪ l =1 ⎪ ⎪ ⎪⎩ ⎪⎭ dann wird das Verfahren fortgesetzt. Hierzu wird die Teilmenge hn − p + 2 = ([1], …, [n − p + 2]) gebildet. Aus dieser werden alle Teilmengen mit (n – p) Input- und Prozessvariablen, die alle die [n – p + 2]-te Input- oder Prozessvariable beinhalten, gebildet. Für all diese Teilmengen werden die Red’s berechnet. Ist das Kleinste aller bisher berechneten 1316han05.indd 324 25.07.2006 11:39:40 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? ⎡ ⎢1 + ⎣ 325 ⎛ n − p ⎞ ⎛ n − p + 1⎞ ⎤ ⎛ n − p + 2 ⎞ ⎜⎝ 1 ⎟⎠ + ⎜⎝ ⎟⎠ ⎥ = ⎜⎝ ⎟⎠ 2 2 ⎦ R̂ed p (hn − p ) kleiner oder gleich R̂ed n −1([n − p + 3]) , dann hat man die optimale Teilmenge gefunden und das Verfahren ist beendet. Andernfalls ist das Verfahren wie bisher beschrieben fortzusetzen. In der q-ten Stufe müssten ⎡ ⎛n − p ⎞ ⎛ n − p + q − 1⎞ ⎤ ⎛ n − p + q ⎞ +…+ ⎜ ⎢1 + ⎜ ⎟ ⎟⎠ ⎥ = ⎜⎝ ⎟⎠ q q ⎝ 1 ⎠ ⎝ ⎣ ⎦ R̂ed p (hnl − p ) berechnet und mit R̂ed n −1([n − p + q]) verglichen werden. Da q = 1, …, n – p ⎛n ⎞ müssten im ungünstigsten Fall ⎜ ⎟ solche Teilmengenuntersuchungen durchgeführt werden. ⎝ p⎠ Satz: Dieser Algorithmus liefert das Minimum des unbedingten Vorhersagefehlers. Beweis: siehe Jahn [1991b]. Empfehlungen Insbesondere im Falle hoch multikollinearer Kovarianzmatrizen sind alle Berechnungen im standardisierten Modell durchzuführen, d. h. auf der Basis der Korrelationsmatrix. Die Rechenzeiten werden kürzer und die Ergebnisse wesentlich genauer. Abbruch des Verfahrens: Gilt sowohl ˆ ˆ Red p (hn − p ) > Red n −1 ([n − p + 1]) als auch S p (hn − p ) > S p +1 (hn − p −1 ), dann ist das Verfahren beendet und hn – p ist die zu streichende Teilmenge, die UN.n minimiert. Gilt ˆ ˆ Red p (hn − p ) > Red n −1 ([n − p + 1]) aber S p (hn − p ) ≤ S p +1 (hn − p −1 ), dann ist das Verfahren in der 2. Stufe fortzusetzen. In dieser Stufe werden alle Teilmengen mit n – p Input- und Prozessvariablen, die alle die [n – p + 1]-te Variable beinhalten, gebildet. Das Verfahren kann nach der 2. Stufe abgebrochen werden, da der Rechenaufwand sehr hoch wird und die Verbesserung minimal ist. Bei sehr hoch multikollinearen Matrizen sollte das Verfahren eventuell nach der 1. Auswahl noch einmal mit den verbleibenden wesentlichen Input- und Prozessvariablen neu gestartet werden. 1316han05.indd 325 25.07.2006 11:39:41 326 5 Qualität in der Fertigung Beispiel 5.14.3: Chemischer Prozess. Red-Auswahlverfahren Das obige Beispiel ist ein Modell mit stochastischen Input- und Prozessvariablen. Der vollständige Ansatz mit n = 12 Prozessvariablen liefert das Ergebnis der Tabelle 5.14.5. Tabelle 5.14.5: Prozessgleichung mit allen Prozessvariablen Prozessvar. Koeff.Proz.Gleich. b0 X3 X4 X5 X6 X7 X9 X16 X17 X18 X19 X20 X21 –408,705 –0,63914 0,2013 1,92428 1,2744 –11,7229 0,32221 –0,094157 89,703117 –91,06 1,07785 3,53736 0,80203 t-Wert –1,905 –0,75 0,385 0,1017 0,0742 –2,9449 5,3921 –0,1113 4,8434 –5,0647 2,2573 1,26999 3,38099 Irrtumswahrsch. 0,0598 0,455 0,701 0,919 0,941 0,00406 0 0,9116 0 0 0,0263 0,20719 0,001 Red(j) 0 0,0838 0,02208 0,00154 0,00082 1,2929 4,3345 0,001848 3,49726 3,82416 0,75965 0,24045 1,7041 Das Modell mit den wesentlichen Prozessvariablen ist in der Tabelle 5.14.6 enthalten. Tabelle 5.14.6: Prozessgleichung mit den wesentlichen Prozessvariablen Prozessvar. Koeff.Proz.Gleich. b0 X20 X19 X7 X21 X17 X18 X9 –367,637 3,14768 0,96515 –11,1443 0,75278 95,681 –97,11326 0,29609 t-Wert –3,029 1,242 2,913 –4,6253 3,562 5,9554 –6,401 6,54563 Irrtumswahrsch. 0,00312 0,217 0,0044 0,00001 0,00057 0,0000 0,0000 0,0000 Red(j) 0,0000 0,2404 0,75965 1,2929 1,7042 3,4973 3,8241 4,33456 Die F-Statistik hat den Wert 32.956 mit der Irrtumswahrscheinlichkeit p = 2.662e–023. Das vollständige wird mit dem reduzierten Modell anhand des Maßes der Beherrschbarkeit, des Vorhersagefehlers und der bedingten Standardabweichung verglichen. Tabelle 5.14.7: Vergleich des vollständigen und reduzierten Modells Statistik Reduziertes Maß d. Beherrschbarkeit 0,7001 0,6976 Vorhersagefehler 3,9939 3,909 Bedingte Standardabw. FG d. Residuen 1316han05.indd 326 Vollständiges 3,7633 95 3,779 100 25.07.2006 11:39:41 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 327 Der Vergleich mit den „klassischen“ Auswahlverfahren liefert uns die folgenden Resultate: • Nach dem Red-Auswahlverfahren verbleiben 7 Prozessvariablen im Ansatz. • Die wesentlichen Prozessvariablen nach dem Red-Verfahren sind X7, X9, X17, X18, X19, X20 und X21. Die Prozessvariablen X3, X4, X5, X6, X16 werden als unwesentlich erkannt und gestrichen. • Die Rangfolge der wichtigen Prozessvariablen nach dem Red-Verfahren ist X[1] = X9, X[2] = X18, X[3] = X17, X[4] = X21, X[5] = X7, X[6] = X19, X[7] = X20. • Nach den „klassischen“ Verfahren verbleiben 5 Prozessvariablen im Ansatz. • Die wesentlichen Prozessvariablen nach den „klassischen“ Verfahren sind X7, X9, X17, X18, X19 und X21. Die Prozessvariablen X3, X4, X5, X6, X16 und X20 werden als unwesentlich erkannt und gestrichen. • Die Rangfolge ist: X[1] = X9, X[2] = X18, X[3] = X17, X[4] = X7, X[5] = X21, X[6] = X19. • Die Rangfolgen unterscheiden sich. • Die Maße der Beherrschbarkeit sind nach der klassischen Auswahl RY2 / p = 0.6929 und nach der Red-Auswahl R2Y/p = 0.6976 unterscheiden sich. • Die Reststandardabweichungen nach der klassisch Auswahl SY/X = 3.919 und nach der Red-Auswahl sY/X = 3.779 unterscheiden sich. Warum unterscheiden sich die „klassischen“ von dem Red-Auswahlverfahren? Die Ursachen für die Ungleichheit der verschiedenen Verfahren sind: • Bei den klassischen Verfahren werden alle n Einzelhypothesen des 1. Schrittes individuell, nacheinander und nicht simultan geprüft, d. h. der Fehler 1. Art wird separat für jede Einzelhypothese nach P (Fˆ ≤ F / H ) = 1 − α j α 0. j gewählt. Das ist nicht korrekt! • Die univariaten einfachen Modelle E[Y] = βY/j Xj müssen nicht unbedingt „wahr“ sein. In diesen Fällen ist Fˆj nichtzentral F verteilt mit 1 und (N – 1) FG. Die univariaten Modelle müssen auch nicht unter Gültigkeit der H0.j richtig sein. Die Nichtzentralitätsparameter sind unbekannt. • Bei der k-ten Entscheidung werden bei den klassischen Verfahren die vorangegangenen Entscheidungen nicht beachtet. • Das Red-Auswahlverfahren basiert in natürlicher Weise auf der Verringerung der bedingten Varianz (Restvarianz) durch Hinzufügen einer neuen Prozessvariablen, oder alternativ, auf der Vergrößerung der bedingten Varianz durch Streichen einer Prozessvariablen. • Die bedingte Varianz und die Tests werden unterschiedlich vom Grad der Multikollinearität beeinflusst. Nimmt der Unterschied zwischen den beiden Verfahren mit zunehmender Anzahl von Variablen zu? Zur Beantwortung dieser Frage betrachten wir das Beispiel des chemischen Prozesses mit einer größeren Anzahl von Input- und Prozessvariablen. 1316han05.indd 327 25.07.2006 11:39:41 328 5 Qualität in der Fertigung Beispiel 5.14.4: Chemischer Prozess. Vergleich von Reduktionsverfahren Y1 sei wieder der Anteil der unerwünschten Substanz. Gegeben sind des weiteren p = 11 Input und n = 21 Prozessvariablen. Das Modell nach der schrittweisen Auswahl ist in der Tabelle 5.14.8 enthalten. Tabelle 5.14.8: Modell nach der schrittweisen Auswahl Prozessgleichung ----------------------------------------------------------------------------Produktvariable: y1 ----------------------------------------------------------------------------Standard T Parameter Estimate Error Statistic P-Value ----------------------------------------------------------------------------CONSTANT 32,7401 13,4005 2,4432 0,0164 x7 -6,31507 1,49519 -4,22359 0,0001 x11 -0,011167 0,00382231 -2,92152 0,0043 x17 5,07868 1,34843 3,76636 0,0003 x21 0,689957 0,12185 5,66233 0,0000 z1 0,752165 0,143026 5,25895 0,0000 z2 2,01531 0,631772 3,18994 0,0019 z3 0,0160964 0,00763823 2,10735 0,0377 z5 0,121066 0,0086293 14,0297 0,0000 z9 -0,0037483 0,00126582 -2,96116 0,0039 z11 0,000460799 0,000129713 3,55245 0,0006 ----------------------------------------------------------------------------Analysis of Variance ----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value ----------------------------------------------------------------------------Model 4625,68 10 462,568 104,93 0,0000 Residual 427,621 97 4,40846 ----------------------------------------------------------------------------Total (Corr.) 5053,3 107 R-squared = 91,5378 percent R-squared (adjusted for d.f.) = 90,6654 percent Standard Error of Est. = 2,09963 Mean absolute error = 1,48313 Durbin-Watson statistic = 1,41397 Die Red-Auswahl liefert das Modell in der Tabelle 5.14.9. Der Vergleich des schrittweisen und des Red-Auswahlverfahrens liefert folgende Ergebnisse: Nach dem schrittweisen Verfahren werden die Variablen x1, x2, x3, x4, x5, x6, x8, x9, x10, x12, x13, x14, x15, x16, x18, x19, x20, z4, z6, z7, z10 gestrichen, nach dem Red-Auswahlverfahren werden die Variablen x4, x5, x8, x12, x13, x14, x15, x16 gestrichen. Die Mengen der unwesentlichen, gestrichenen Variablen sind verschieden. 1316han05.indd 328 25.07.2006 11:39:42 329 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? Tabelle 5.14.9: Red-Auswahl Value Std.Error t-value Pr(>|t|) Redn1 b0 2.027252e+002 2.243049e+002 0.90379 0.36872 0.00000000 z10 –6.204065e–004 5.822072e–004 –1.06561 0.28969 0.01659399 z4 1.954888e–001 1.817600e–001 1.07553 0.28525 0.03508154 x11 –2.643214e–002 1.165562e–002 –2.26776 0.02594 0.03583230 x6 –7.249619e+000 6.719864e+000 –1.07883 0.28379 0.03744574 v18 –2.017283e+001 1.669251e+001 –1.20850 0.23029 0.04066924 v19 3.563528e–001 2.197435e–001 1.62168 0.10867 0.04790650 x17 2.299280e+001 1.575657e+001 1.45925 0.14827 0.05208574 x1 1.117445e+000 6.533908e–001 1.71022 0.09096 0.05374786 z6 –1.495682e–002 1.464805e–002 –1.02108 0.31018 0.05745906 x7 –7.100759e+000 2.046982e+000 –3.46889 0.00083 0.05826068 z8 –3.658574e–001 2.529059e–001 –1.44661 0.15177 0.06943185 x3 –6.214773e–001 5.310112e–001 –1.17037 0.24520 0.07239814 z7 –5.642632e+001 3.649344e+001 –1.54620 0.12586 0.09617223 x9 2.859829e–001 1.464424e–001 1.95287 0.05421 0.09727591 x20 4.399184e+000 2.540006e+000 1.73196 0.08700 0.14827725 z2 1.457339e+000 6.175290e–001 2.35995 0.02062 0.16755061 z3 1.739045e–002 7.359728e–003 2.36292 0.02047 0.17278911 z11 9.192015e–004 3.210841e–004 2.86281 0.00531 0.19585702 x10 3.788326e–002 1.252605e–002 3.02436 0.00332 0.20522901 z9 –4.191362e–003 1.502543e–003 –2.78951 0.00655 0.23452021 x2 –5.915323e+000 2.305041e+000 –2.56625 0.01208 0.26927001 x21 6.039320e–001 1.607141e–001 3.75780 0.00032 0.28263726 z1 1.586419 0.38234719 4.14916 8e–005 0.5332058 z5 0.103754 0.01126534 9.21002 0e+000 1.2338190 F-Statistic: 51.6531840865295 with a p-value of: 3.16569470906557e–040 Statistic Complete_Model Red_Reduction Rsquared 0.939247 0.9372484 UNn/UNp 4.093372 3.8205083 Sqrt_UNn/UNp 2.023208 1.9546121 307.002919 317.1021928 1.693867 1.7215028 RSS syx/syp Residual_df 1316han05.indd 329 75 83 25.07.2006 11:39:42 330 5 Qualität in der Fertigung Die Rangfolge für das schrittweise Verfahren ist Z5, X21, Z1, X7, X17, Z11, Z2, Z9, X11, Z3 und für das Red-Auswahlverfahren Z5, Z1, X21, X2, Z9, X10, Z11, Z3, Z2, X20, X9, Z7, Z6, X1, X17, X19, X18, X6, X11, Z4 und Z10. Die Rangfolgen sind verschieden. Die Maße der Beherrschbarkeit (klassisch R2 = 0.915, Red R2Y/X = 0.937) sind verschieden. Die Reststreuungen (klassisch s = 2.099, Red sY/X = 1.72) sind ebenfalls verschieden. Wir wollen noch ein zweites Beispiel mit einer großen Anzahl von Input- und Prozessvariablen betrachten, bevor ich meine Schlussfolgerungen ziehe. Beispiel 5.14.5: Mikroelektronik. Red-Verfahren Die Herstellung mikroelektronischer Schaltkreise ist kompliziert. Die Anzahl der verschiedenen Prozesse des Netzwerkes „Herstellung“ ist groß. Die Anzahl der Input- und Prozessvariablen ist sehr groß. Wir wollen hier die Ausbeute an mikroelektronischen Schaltkreisen für zwei Netzwerke betrachten. Im 1. Netzwerk ist die Anzahl der Input- und Prozessvariablen n = 52. Der Grad der Multikollinearität ist δ = 0.8 1058. Im 2. Netzwerk ist n = 45 und δ = 0.2 1027. Die Ergebnisse der schrittweisen Verfahren, des Cp von Mollows und des Red Auswahlverfahrens sind in der folgenden Tabelle zusammengestellt. Tabelle 5.14.10: Ergebnisse der Auswahl nach dem schrittweisen und Red-Verfahren n S2Y/p R2Y/p UN, p p 1. Netzwerk vollständig schrittweise Red 52 0,0017 0,0051 0,0022 0,708 0,12 0,62 0,00404 0,0052 0,00306 2 25 2. Netzwerk vollständig schrittweise Red 45 69,55 112,6 78,9 0,52 0,22 0,45 140,7 116,5 94,9 3 15 Diese Beispiele zeigen: • Die schrittweisen Auswahlverfahren tendieren zu mächtigeren Auswahlmengen unwesentlicher Input- und Prozessvariablen, d. h. die Anzahl der wesentlichen Input- und Prozessvariablen wird zu klein. • Mit zunehmender Anzahl von Input- und Prozessvariablen werden die klassischen Verfahren schlechter, da bei diesen die Maße der Beherrschbarkeit zu klein und demzufolge die Reststandardabweichungen zu groß werden. • Mit zunehmenden Grad der Multikollinearität werden die klassischen Verfahren schlechter, da die Reduktion der Dimension des Parameterraumes größer, ja sogar zu groß wird. 1316han05.indd 330 25.07.2006 11:39:42 5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 331 Gibt es Tests zur Prüfung von Hypothesen über Redp(h)? Ja. Zur Prüfung von Hypothesen über Redp(h) kann man den overall-F-Test, Varianzanalysen oder Tests zur Prüfung der partiell multiplen Korrelationskoeffizienten verwenden. Wir wollen die Tests im Einzelnen betrachten. Test zur Prüfung der Hypothese über Redn – 1(j) Aus der Darstellung [Re dn −1 ( j)]2 = BY2 . j / n − j ⋅ S 2j / n − j folgt, dass wir zur Prüfung der H0: Redn – 1(j) = 0 gegen die Alternative H1: Redn – 1(j) ≠ 0 den F-Test in der Form Red n −1( j) (N − n) Fˆ = SY2 / X verwenden können. Ist Fˆ ≥ Fn ,N − n (a) , dann muss die H0 zugunsten der H1 verworfen werden. Dieser Test ist identisch mit dem F-Test zur Prüfung einer Einzelhypothese über einen Koeffizienten BY.j/n – j der Prozessgleichung. Tests zur Prüfung der Hypothese über Redp(h) Zur Prüfung dieser Hypothese kann ebenfalls der F-Test verwendet werden. Die Teststatistik ist Fˆ (h) = Red p (h) ⋅ (N − n) (n − p) SY2 / X = (RY2 / X − RY2 / k ) ⋅ (N − n) BYT.h / k Shh / k BY .h / k (N − n) = . (1 − RY2 / X ) ⋅ (n − p) SY2 / X (n − p) Ist Fˆ (h) ≥ Fn − p,N − n (α) , dann muss die H0 zugunsten der H1 verworfen werden. Varianzanalytische Prüfung Ausgangspunkt für diese Prüfung ist die Teilmengenregression Y = βTY / k ⋅ X (k) + FY / k . Die zu prüfende Hypothese lautet H 0(1) : βY / k = 0 . Verlängert man den Vektor der Input- und Prozessvariablen X(k) durch Hinzufügen von Komponenten aus X(h), die im Vektor X(u) zusammengefasst werden, wobei u = (u1, …, us), u1 < … < us, s ≤ n – p, dann kann man prüfen, ob die Verkleinerung der Summe der Abweichungsquadrate um die Prozessgleichung durch Verlängerung des Vektors X(k) null ist. Dieser Umstand wird durch die Hypothese T H(2) 0 : βY .u / k ⋅ Σ uu / k ⋅ βY .u / k = 0 = Red p (h) abgebildet. Zur Prüfung dieser Hypothese wird die folgende Varianztabelle aufgebaut. In dieser Tabelle bedeuten −1 H p = X (k)T ⋅ A kk ⋅ X (k), −1 H s = T T ⋅ ATT ⋅ T, T = X (u) ⋅ (I − H p ), ATT = T ⋅ T T 1316han05.indd 331 25.07.2006 11:39:42 332 5 Qualität in der Fertigung Tabelle 5.14.11: Varianztabelle für die Prüfung der H0 über Redp(h) Variationsursache Summe der Abweichungsquadrate FG F-Test Prozessgleichung in X(k) Y ⋅ Hp ⋅ YT p Prozessgleichung in X(k) und X(u) Y ⋅ Hs ⋅ Y T s Fˆ1 = Rest Y ⋅ (I − H p − H s ) ⋅ Y T N–p–s F̂ (2) Gesamt Y ⋅ YT Y ⋅ H p ⋅ Y T ⋅ (N − p) Y ⋅ (I − H p ) ⋅ Y T ⋅ p und somit T ⋅ T T = A uu / k , so dass Y ⋅ H s ⋅ Y T = R̂ed p ( j). Fˆ1 ∼ Fp′,N − p (δ1 ) mit δ1 = βTY / k ⋅ A kk ⋅ βY / k σY2 / k . Bei Gültigkeit der H0 gilt σY.k = 0 und damit ρY2 / k = 0 , δ1 = 0 und folglich Fˆ1 ∼ Fp,N − p . Bemerkungen 1. Die Teststatistik F1 kann man mit multiplen Korrelationskoeffizienten darstellen. Es gilt 2 R 2 ⋅ (N − p) χ p (δ1 ) ⋅ (N − p) Fˆ1 = Y / k 2 = ∼ Fp′,N − p (δ1 ). (1 − RY / k ) ⋅ p χ2N − p ⋅ p Für die Prüfung der zweiten Hypothese H(2) 0 wird die Statistik X ⋅ H s ⋅ Y T ⋅ (N − p − s) Fˆ (2) = Y ⋅ (I − H p − H s ) ⋅ Y T ⋅ s verwendet, wobei Fˆ (2) ∼ Fs ,N − p − s (δ 2 ) 1316han05.indd 332 25.07.2006 11:39:43 5.15 Unter welchen Umständen ist die Annahme der Linearität gerechtfertigt? 333 ist und δ2 = βTY .u / k ⋅ A uu / k ⋅ βY .u / k σY2 / k ,u . Für die Gültigkeit der H(2) 0 ist auch diese F-Statistik zentral F verteilt mit den angegebenen Freiheitsgraden. 2. Wegen der Darstellung Red p (h) = ρY2 .h / k ⋅ σY2 / k können zur Prüfung von Hypothesen über Redp(h) auch die Tests zur Prüfung von partiell multiplen Korrelationskoeffizienten verwendet werden. 5.15 Unter welchen Umständen ist die Annahme der Linearität gerechtfertigt? Über die Voraussetzung der Linearität in den Modellen für die Prozessgleichung wird oft und heftig gestritten. Wir wollen zur Schlichtung des Streits hier von dem Modell mit stochastischen Input- und Prozessvariablen ausgehen. Für dieses Modell hatten wir vorausgesetzt, dass der Vektor ZT = (XT, YT) der Input-, Prozess- und Produktvariablen entweder multivariat normalverteilt ist oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Beide Annahmen sind praktisch relevant. Im Glossar wurde die bedingte multivariate Normalverteilung mit dem bedingten Erwartungswert und der bedingten Varianz beschrieben. Für den Vektor Z gilt unter den beiden Voraussetzungen 1 E [Y / X ] = μY + ΣYX Σ −XX ( X − μ X ). Das ist eine lineare Funktion in X. Diese Funktion wird Regressionsfunktion genannt. Für die bedingte Varianz gilt 1 var [Y / X ] = ΣYY − ΣYX Σ −XX Σ XY =: ΣYY / X . Dieser Ausdruck hängt nicht von X ab. Damit kann man den für die Anwendungen wichtigen Charakterisierungsatz aufschreiben, der einen Zusammenhang zwischen der Verteilungsvoraussetzung und der Linearität der Regressionsfunktion präzisiert. Wenn der bedingte Erwartungswert eine lineare Funktion in den Variablen unter Bedingung und die bedingte Varianz unabhängig von X ist, dann ist die zugrunde liegende gemeinsame Verteilung eine Normalverteilung. Wenn die Verteilung von Z eine multivariate Normalverteilung ist, dann ist der bedingte Erwartungswert eine lineare Funktion der Variablen unter der Bedingung und die bedingte Kovarianz ist unabhängig von den Variablen unter der Bedingung. Aus diesem Satz wird deutlich, dass der Streit entweder auf der Basis des Modells mit festen Input- und Prozessvariablen oder akademisch geführt wird. 1316han05.indd 333 25.07.2006 11:39:43 334 5 Qualität in der Fertigung 5.16 Warum muss ein Prozess gesteuert werden und wie können wir einen Prozess steuern? Jeder, der sich in sein Auto setzt und die Absicht hat, loszufahren, überlegt sich vorher, wohin er fahren und welche Strecke er benutzen will. Niemand startet sein Auto, macht die Augen zu und fährt los! Das Ziel der Autofahrt entspricht dem Sollwert und die zu fahrende Strecke – entweder über das Gebirge oder durch das flache Land – kann mit der Steuerung eines Prozesses verglichen werden. Was jeder mit seinem privaten Fahrzeug macht, kann er auch mit den betrieblichen Prozessen tun. In einem heuristisch, d. h. durch Erfahrung gesteuerten oder ungesteuerten Prozess sind • die Streuungen der Input-, Prozess- und Produktvariablen in der Regel sehr groß, • die Zielwerte für die Steuerung in Form von Sollwerten und Toleranzgrenzen in der Regel nicht bekannt, • der Ausschuss sehr hoch, die Kundenanforderungen werden nur mangelhaft erfüllt und • die uni- und multivariaten Prozessfähigkeitsindizes sind in der Regel kleiner als 1. Die Folge hiervon ist, der Prozess muss verbessert werden, um die Verluste durch mangelhafte Qualität zu reduzieren. Das ist nur durch die statistische Prozessanalyse mit anschließender Steuerung des Prozesses möglich. Die statistische Prozessanalyse liefert uns hierfür die Prozessgleichung mit den wesentlichen Input- und Prozessvariablen. Die Zielwerte und den Zielbereich für die Steuerung liefert uns die statistische Tolerierung. In diesem Zusammenhang müssen wir darüber sprechen, dass die Qualität des Prozesses notwendige Voraussetzung für die Qualität des Produktes ist. Was ist die Qualität des Prozesses? Die Qualität des Prozesses ist die Fähigkeit des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren, wobei die vorgegebenen Eigenschaften eines Produktes durch die Sollwerte und Toleranzgrenzen für die Menge der nicht unabhängigen Produktvariablen spezifiziert werden. Die Produktion solcher Produkte (materielle Produkte oder Dienstleistungen) erfordert, dass der dazu gehörende Prozess mit der Prozessgleichung in Richtung der Zielwerte gesteuert wird, so dass die Werte für die Produktvariablen der produzierten Produkte in dem durch die Toleranzgrenzen vorgegebenen Zielgebiet liegen. Die Steuerung besteht nun im wesentlichen darin, solche Werte für die Input- und Prozessvariablen in die Prozessgleichung einzusetzen, die • garantieren, dass die Werte für die Produktvariablen in dem gegebenen Zielgebiet liegen und deren Mittelwerte mit den Sollwerten übereinstimmen, • zu einer Verringerung der Variation der Produktvariablen von bislang ungesteuerten Prozessen führen • und somit simultan alle Kundenanforderungen erfüllt werden. Die Frage ist nun nur noch, Wie können wir diese Werte für die wesentlichen Input- und Prozessvariablen finden? Für die Lösung stehen uns mindestens zwei Wege zur Verfügung. 1316han05.indd 334 25.07.2006 11:39:43 5.16 Warum und wie muss ein Prozess gesteuert werden? 335 Der 1. Weg führt auf die Berechnung der statistischen Sollwerte und Toleranzgrenzen für die Input- und Prozessvariablen und der 2. Weg auf die Optimierung des gesamten Prozesses mit den Methoden der linearen und nichtlinearen Optimierung (vgl. Kapitel 12). Hauptsächlich befassen wir uns in diesem Kapitel mit dem 1. Weg, da uns dieser die Sollwerte und Toleranzgrenzen für die Inputprodukte liefert. Und diese sind ja notwendige Voraussetzung für die Realisierung der Kommunikation zwischen den Kunden und Lieferanten. 5.16.1 Statistische Tolerierung der Inputvariablen Zuerst berechnen wir nach dem bekannten Verfahren der statistischen Tolerierung aus dem Abschnitt 5.2 die statistischen Sollwerte und Toleranzgrenzen für die wesentlichen Inputvariablen unter der Bedingung, dass die Werte für die Produktvariablen vorgegeben sind. Danach berechnen wir die Sollwerte und statistischen Toleranzgrenzen für die Prozessvariablen unter der Bedingung, dass die Produkt- und Inputvariablen gegeben sind. Mit einer vorliegenden Stichprobe berechnen wir die Inputgleichungen. Das sind Gleichungen, in denen die Inputvariablen die abhängigen Zielvariablen sind und die Produktvariablen als unabhängige Variablen fungieren. In diese Gleichungen setzen wir die Sollwerte und die Toleranzgrenzen für die Produktvariablen ein, um die Sollwerte und Toleranzgrenzen für die Inputvariablen zu berechnen. Für all die Fälle, in denen keine Sollwerte und Toleranzgrenzen für die Produktvariablen vorhanden sind, verwenden wir die Formeln der statistischen Tolerierung für die Produktund Inputvariablen und berechnen die statistischen Sollwerte und Toleranzgrenzen für die Inputvariablen. Die Berechnungen der statistischen Sollwerte und Toleranzgrenzen für die Input- und Prozessvariablen unter den entsprechenden Bedingungen werde ich an dem folgenden Beispiel demonstrieren. Beispiel 5.16.1: Chemischer Prozess. Statistische Tolerierung der Input- und Prozessvariablen Die statistischen Toleranzgrenzen wurden mit dem Prozessspezialisten abgesprochen, geringfügig korrigiert und in der Tabelle 5.16.1 zusammengefasst. Tabelle 5.16.1: Statistische Toleranzgrenzen für die Produktvariablen Produktvariable Untere Toleranz Obere Toleranz Y1 0 8 Y2 1680 1820 Y3 1902 1920 Y4 1546 1565 Y5 8000 10000 Y6 320 400 Mit den abgestimmten statistischen Toleranzgrenzen wurden die uni- und multivariaten Prozessfähigkeitsindizes berechnet und in der Tabelle 5.16.2 zusammengestellt. Die Prozessfähigkeiten sind kleiner als 1; der Prozess muss verbessert werden. 1316han05.indd 335 25.07.2006 11:39:43 336 5 Qualität in der Fertigung Tabelle 5.16.2: Uni- und multivariate Prozessfähigkeitsindizes Produktvariable Cp k Cpk Y1 0,194 3,82 –0,55 Y2 1,38 0,005 1,375 Y3 0,315 0,342 0,207 Y4 0,432 0,038 0,415 Y5 0,227 0,194 0,183 Y6 0,217 0,268 0,159 Multivariate Prozessfähigkeiten MCp 0,65 MCpk 0,038 Die folgenden beiden Abbildungen enthalten die Star Plots für alle Input-, Prozess- und Produktvariablen und nur für die Inputvariablen, da der Verdacht besteht, dass für die Inputvariablen weder Sollwerte und Toleranzgrenzen berechnet, noch Eingangsprüfungen vorgenommen wurden. 100 108 90 80 70 60 50 40 30 20 10 Abb. 5.16.1: Star Plots für die Input-, Prozess- und Produktvariablen 1316han05.indd 336 25.07.2006 11:39:44 5.16 Warum und wie muss ein Prozess gesteuert werden? X9 X7 X11 X10 X17 337 X6 X3 X18 X2 X19 X1 X20 Y1 X21 Z11 Z1 Z10 Z2 Z9 Z3 Z4 Z5 Z6 Z7 Z8 Abb. 5.16.2: Schlüssel für die Star Plots Die Star plots zeigen: • die Streuungen für die einzelnen Variablen sind sehr groß; man vergleiche z. B. die Stars 55 und 104 miteinander, • der Prozess zeigt ein gewisses „Atmen“, d. h. eine gewisse systematische Veränderung bis zum Star 50 und dann eine ziemlich rigide Veränderung. • Innerhalb der Gruppen gibt es aber auch noch sehr starke Veränderungen, • die Produktvariable Y1 (unerwünschtes Nebenprodukt) kommt mal sehr selten, siehe z. B. die Star Plots 86, 87, 49, 40 und ein anderes Mal sehr häufig vor, siehe z. B. die Star Plots 90, 91, 10, … 100 90 80 70 60 50 40 30 20 10 Abb. 5.16.3: Star Plots für die Input- und Produktvariable Y1 1316han05.indd 337 25.07.2006 11:39:44 338 5 Qualität in der Fertigung Da die Stars aufgrund der vielen Achsen (Variablen) schwer zu interpretieren sind, weil sowohl Input-, Prozess- und Produktvariablen dargestellt wurden, wollen wir noch die Inputund die Produktvariablen allein betrachten, um zu sehen, ob die Inputvariablen ebenfalls stark streuen und diese Streuungen einen Einfluss auf die Produktvariable Y1 haben. Z5 Z4 Z3 Z2 Z6 Z1 Z7 Z8 Y1 . Z9 Z11 Z10 Abb. 5.16.4: Schlüssel für die Star Plots für die Input- und Produktvariablen Y1 100 0 50 T2 150 Interpretation der Star Plots für die Input- und die Produktvariablen Die Inputvariablen schwanken sehr stark. Das Produkt kann daher gar nicht homogen sein, oder anders gesprochen, das unerwünschte Nebenprodukt kommt mal vor und mal nicht. Schauen Sie sich nur einmal die Plots mit den Nummern 49 und 91 an, dann sehen Sie die gewaltigen Unterschiede. Beim Plot Nummer 91 kommt das unerwünschte Nebenprodukt in hoher Konzentration vor. Beim Plot Nummer 40 kommt das Nebenprodukt praktisch 5 10 15 20 Abb. 5.16.5: Multivariate Kontrollkarte für das „Lieferantenprodukt“ 1316han05.indd 338 25.07.2006 11:39:44 339 5.16 Warum und wie muss ein Prozess gesteuert werden? überhaupt nicht vor. Schon hieraus muss man schließen, dass das unerwünschte Nebenprodukt im Herstellungsprozess entsteht und dass der Prozess so gesteuert werden kann, dass das Nebenprodukt nicht mehr vorkommt. Die moderne Industrie muss nach meinem Dafürhalten anders, präziser arbeiten. Die multivariate Kontrollkarte für die Inputvariablen mit der berechneten Toleranzgrenze für das Inputprodukt in der Abbildung 5.16.5 bestätigt unsere Vermutung hinsichtlich der Inputvariablen, dass für diese nämlich keine Sollwerte und Toleranzgrenzen zu existieren scheinen. Das „Lieferantenprodukt“ sind die zusammengefassten Inputvariablen des chemischen Prozesses. Die Abbildung zeigt ganz deutlich: Die meisten Werte der Teilstichproben liegen oberhalb der Toleranzgrenze für das „Lieferprodukt“, d. h. die meisten Lieferantenprodukte sind Ausschuss. Die Inputvariablen erfüllen offenbar keinerlei Vorgaben. Es muss etwas getan werden. Uni- und multivariater Prozessfähigkeitsnachweis für die Inputprodukte Der Nachweis der simultanen Erfüllung der Kundenanforderungen bzgl. der Lieferantenprodukte (Menge der Inputvariablen) erfolgt über die Fähigkeiten der Tabelle 5.16.3. Tabelle 5.16.3: Univariate Prozessfähigkeitsindizes Inputvariable untere Toleranz obere Toleranz Mittel Stabw. Cp k Z1 19,4 28,6 24,857 1,88 0,815 0,186 0,663 Z2 0,8 1,2 1,223 0,363 0,183 1,115 –0,021 40,136 0,249 0,161 0,209 0,0147 0,129 0,0128 Z3 100 Z4 0,3 160 0,4 134,85 0,3565 1,1326 Cpk Z5 100 180 144,56 51,654 0,258 0,114 0,229 Z6 90 130 107,93 26,86 0,248 0,103 0,222 0,282 Z7 1,12 1,18 1,13 0,0118 0,846 0,667 Z8 9,22 10,78 9,749 0,962 0,27 0,32 0,183 0,135 0,142 0,116 Z9 1600 1780 1677,25 221,79 Z10 900 1000 905,68 1147,18 0,0145 0,886 0,0017 Z11 2500 3300 2991,58 2033,33 0,066 0,229 0,051 Die multivariaten Prozessfähigkeitsindizes sind MCp = 0.3104 MCpk = 0.0372 Die uni- und multivariaten Prozessfähigkeitsindizes bestätigen die vorangegangene Vermutung. Sie sind viel kleiner als 1. Die Inputvariablen erfüllen nicht die Anforderungen. Wie kann man die Werte für die wesentlichen Input- und Prozessvariablen finden, die auf jeden Fall die genannten Ziele der Reduktion der Variation und der Übereinstimmung von Mittel- und Sollwerten erfüllen? 1316han05.indd 339 25.07.2006 11:39:44 340 5 Qualität in der Fertigung 5.16.2 Berechnung der statistischen Sollwerte und Toleranzgrenzen für die Inputvariablen unter der Bedingung der gegebenen Werte für die Produktvariablen Diese Berechnungen werden mit dem linearen Modell mit stochastischen Variablen realisiert, wobei die Inputvariablen als Zielgrößen fungieren und für die Produktvariablen die Sollwerte und Toleranzgrenzen eingesetzt werden. Die so zu berechnenden Gleichungen nennen wir Inputgleichungen. Nach Diskussion und Abstimmung mit den Prozessexperten erhalten wir die Resultate in Tabelle 5.16.4. Tabelle 5.16.4: Statistische Sollwerte und Toleranzgrenzen für die Inputvariablen Inputvariable Sollwert Z1 Z2 23,57 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 Z11 115,5 0,014 65,6 101,1 1,12 11,3 1867 733 2351 0,89 untere Toleranz 22,2 0,11 46,5 0 30,4 60,4 1,1 9,2 1511 633 1160 obere Toleranz 24,9 1,66 184,6 2,59 100,9 141,7 1,14 13,4 2223 933 3538 Berechnung der statistischen Toleranzen für die wesentlichen Prozessvariablen Analog wie vorher werden Einstellgleichungen für die wesentlichen Prozessvariablen berechnet. In diese werden die Sollwerte und Toleranzgrenzen für die Produktvariablen und die abgestimmten statistischen Sollwerte und statistischen Toleranzgrenzen für die Inputvariablen eingesetzt. Damit erhält man die Einstellwerte und zugehörigen statistischen Toleranzgrenzen für die wesentlichen Prozessvariablen in Tabelle 5.16.5. Die Kunden haben für die unerwünschte Produktvariable die obere Grenze (oG) für Y1 vorgegeben. Diese ist oG (Y1) = 8.00 [‰]. Die optimale Einstellung der Input- und wesentlichen Prozessvariablen für die Erreichung des Zieles: „die Werte von Y1 dürfen nicht größer als 8 [‰] sein, sollten aber mehr in der Nähe der Null liegen“ ist durch die statistischen Sollwerte und Toleranzgrenzen für die Prozessvariablen und die unter den Bedingungen gegebener Produkt- und Prozessvariablen berechneten Sollwerte und Toleranzgrenzen für die Inputprodukte gegeben. Prozessgleichung für den gesteuerten Prozess Nach der Steuerung mit der Prozessgleichung wurde eine neue Stichprobe gezogen. Die erneute Berechnung der Prozessgleichung findet sich in Tabelle 5.16.6. Nach der erneuten Red-Auswahl erhält man die noch einmal reduzierte Prozessgleichung der Tabelle 5.16.7. 1316han05.indd 340 25.07.2006 11:39:44 5.16 Warum und wie muss ein Prozess gesteuert werden? 341 Tabelle 5.16.5: Statistische Toleranzgrenzen für die wesentlichen Prozessvariablen Prozessvariable X1 X2 X3 X6 X7 X9 X10 X11 X17 X18 X19 X20 X21 Sollwert untere Toleranz 67,8 99,7 65,2 9,7 10 1130 1060 1500 2,6 2,7 36 38,6 25 66 99,2 63 9,5 9,4 1123 960 1400 2,5 2,6 30 38,1 17,8 obere Toleranz 69,6 100,3 67,4 9,9 10,6 1137 1160 1600 2,7 2,8 42 39,1 32,2 Tabelle 5.16.6: Prozessgleichung nach der Steuerung Variable bo X1 X2 X3 X6 X7 X9 X10 X11 X17 X18 X19 X20 X21 Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 Z11 1316han05.indd 341 Koeff.Proz.Gleich. –273,416 0,32589 –1,08663 –0,20621 –0,595993 –1,36983 0,261945 0,114271 –0,0716 85,48145 –49,4267 0,114293 0,635618 0,167596 0,455685 1,633097 0,0121218 4,065848 0,068044 –0,01391 –18,1231 –0,385073 –0,006996 –0,00021174 0,0015124 Red(j) 0 0,00137 0,01091 0,002856 0,000465 0,0152204 0,0047759 0,010079 0,0073467 0,0024669 0,0015969 0,00582 0,007018 0,027981 0,026173 0,0080945 0,005202 0,002721 0,07361 0,00199 0,00493298 0,005596 0,011288 9,91 E–7 3,177 E–3 25.07.2006 11:39:45 342 5 Qualität in der Fertigung Tabelle 5.16.7: Prozessgleichung nach der erneuten Red-Auswahl Variable Koeff.Proz.Gleich. b0 X1 X18 Z6 X17 Z4 X3 Z11 X9 Z7 Z3 Z8 X19 X20 X11 Z2 X10 X2 Z9 X7 Z1 X21 Z5 –280,853 0,333204 –50,0706 –0,013221 87,2177 4,431869 –0,225889 0,0013754 0,259213 –18,15834 0,012232 –0,381648 0,11539 0,656262 –0,07158 1,601321 0,114915 –1,064585 –0,0072043 –1,470685 0,462309 0,173212 0,067565 Red(j) 0 0,001372 0,001596 0,001992 0,002466 0,002721 0,0028566 0,0031779 0,0047758 0,004932 0,005202 0,005596 0,00582 0,007019 0,007346 0,0080945 0,010079 0,010916 0,011288 0,01522 0,026173 0,027981 0,07361 Die erneute Red-Auswahl führte dazu, dass die beiden Variablen X6 und Z10 gestrichen werden konnten. Das Maß der Beherrschbarkeit für die Prozessgleichung des gesteuerten Prozesses ist mit RY2 / X = 0,9072 sehr hoch. Die bedingte Standardabweichung (Streuung um die Prozessgleichung) ist sY/X = 0,369. Die graphische Darstellung der Werte für Y1 vor und nach der Steuerung zeigt die Abbildung 5.16.6 50 y1(ungesteuert) 45 y1(gesteuert) Anteil in ppm 40 35 30 25 20 15 10 5 0 1 51 101 151 201 Messwertsatz Abb. 5.16.6: Werte für die Produktvariable Y1 vor und nach der Steuerung mit der Prozessgleichung 1316han05.indd 342 25.07.2006 11:39:45 5.16 Warum und wie muss ein Prozess gesteuert werden? 343 Die Prozessverbesserung ist enorm. Hinsichtlich der Mittelwerte beträgt die Verbesserung ca. 450 %! Oder anders ausgedrückt, der Anteil des unerwünschten Nebenproduktes wird auf ca. 1/5 reduziert. Der Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen erfolgt durch uni- und multivariate Prozessfähigkeitsindizes. Tabelle 5.16.8: Univariate Prozessfähigkeiten für den gesteuerten Prozess Produktvariable Cp k Cpk Y1 Y2 Y3 Y5 Y6 1,099 1,005 1,0086 1,0676 1,072 0,0048 0,0015 0,027 0,009 0,0113 1,094 1,003 1,004 1,0579 1,06 Die multivariaten Prozessfähigkeitsindizes sind MCp = 1,182 MCpk = 1,173. Das Maß der Beherrschbarkeit und die Prozessfähigkeitsindizes zeigen, dass der Prozess beherrscht wird und fähig ist, Produkte mit den geforderten Eigenschaften zu produzieren. Die Inputvariablen erfüllen ebenfalls simultan die Anforderungen, wie die uni- und multivariaten Prozessfähigkeitsindizes der folgenden Tabelle zeigen. Tabelle 5.16.9: Univariate Prozessfähigkeitsindizes für die Inputvariablen nach der Steuerung Inputvariable Cp k Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 Z10 Z11 1,041 0,957 0,993 1,103 1,0778 1,0294 0,991 0,937 0,959 1,035 0,976 0,0075 0,025 0,0047 0,0056 0,0052 0,0055 0,0001 0,01 0,0073 0,0099 0,0008 Cpk 1,034 0,933 0,998 1,097 1,072 1,072 0,99 0,927 0,953 1,024 0,975 Die multivariaten Prozessfähigkeitsindizes für die Lieferantenprodukte sind MCp = 1,027 MCpk = 1,017. Auch die Lieferantenprodukte haben sich verbessert. Die Qualität der Lieferantenprodukte, ausgedrückt durch die multivariaten Prozessfähigkeitsindizes ist geringfügig größer als 1, kann also noch etwas verbessert werden. Die uni- und multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die Prozessvariablen sind in folgender Tabelle dargestellt. 1316han05.indd 343 25.07.2006 11:39:45 344 5 Qualität in der Fertigung Tabelle 5.16.10: Univariate Prozessfähigkeitsindizes Prozessvariable X1 X2 X3 X6 X9 X10 X11 X17 X18 X19 X20 X21 Cp 0.38 0.84 0.619 1.11 0.20 0.12 0.12 0.05 0.049 1.31 0.937 0.98 k 0.025 0.083 0.026 0.11 0.4 0.003 0.11 0.12 0.18 0.097 0.048 0.12 Cpk 0.37 0.77 0.60 0.98 0.12 0.12 0.105 0.045 0.04 1.18 0.89 0.85 Die multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die Prozessvariablen sind MCp = 0.9399 MCpk = 0.0798. Die Einstellung der Prozessvariablen ist nicht in Ordnung. Mit den berechneten Einstellwerten für die Prozessvariablen erhält man die Fähigkeitsindizes der Tabelle 5.16.11. Tabelle 5.16.11: Univariate Prozessfähigkeitsindizes für die Prozessvariablen Prozessvariable X1 X2 X3 X6 X9 X10 X11 X17 X18 X19 X20 X21 Cp 0.48 0.98 0.68 1.21 0.26 0.15 0.12 0.033 0.03 0.89 0.86 1.22 k 0.008 0.14 0.00 0.05 0.004 0.005 0.01 0.004 0.03 0.01 0.05 0.005 Cpk 0.48 0.84 0.68 1.15 0.26 0.15 0.12 0.03 0.03 0.88 0.81 1.22 Die multivariaten Prozessfähigkeitsindizes für die Prozessvariablen sind MCp = 0.992 MCpk = 0.8226. Die Qualität des Prozesses muss weiter verbessert werden. Die Zentrierung ist in Ordnung, die Reduktion der Variabilität der Prozessvariablen ist nicht ausreichend. Die Entscheidung muss aber das Management fällen, da die weitere Verbesserung Kosten verursacht. 1316han05.indd 344 25.07.2006 11:39:45 5.16 Warum und wie muss ein Prozess gesteuert werden? 345 0 1 2 T2 3 4 5 Die Verbesserung des Prozesses durch die Steuerung mit der Prozessgleichung kann durch die multivariate Regelkarte für die „Produkte“ in Abbildung 5.16.7 sichtbar gemacht werden. Auch die Verbesserung der Lieferantenprodukte durch die Steuerung des Lieferantenprozesses mit den berechneten Sollwerten und Toleranzgrenzen als Zielgebiet kann visualisiert werden. 0 10 20 30 40 Abb. 5.16.7: Multivariate Kontrollkarte für die Produkte des gesteuerten Prozesses 3 0 1 2 T2 4 5 6 Alle Produkte liegen unterhalb der Toleranzgrenze für das Produkt. Der Prozess ist in Ordnung, d. h. die Produkte erfüllen simultan alle relevanten Kundenanforderungen. Die multivariate Kontrollkarte für die Lieferantenprodukte ist in der Abbildung gegeben. 0 10 20 30 40 Abb. 5.16.8: Kontrollkarte für die gesteuerten Lieferantenprodukte Bei dieser Karte liegen zwei Stichproben oberhalb der Kontrollgrenze. Der Lieferantenprozess muss noch weiter verbessert werden. 1316han05.indd 345 25.07.2006 11:39:45 346 5 Qualität in der Fertigung 5.17 Zusammenfassung der Produktvariablen Welches Problem soll mit der Zusammenfassung gelöst werden? Wiederholt habe ich darauf hingewiesen, dass • ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben wird, • sich die Produktvariablen mitunter bzgl. ihrer Zielstellung gegensätzlich verhalten, d. h. die eine Produktvariable muss eventuell maximiert, die andere minimiert werden, • der Prozess zur Herstellung eines Produktes aber nur nach dem Zielwert einer Produktvariablen gesteuert werden kann, • die Steuerung nur mit einer optimalen Teilmenge von Input- und Prozessvariablen möglich ist und • nur mit einer optimalen Einstellung für die Input- und Prozessvariablen vorgenommen werden kann. Aus diesen Feststellungen folgt, dass für die Ermittlung der einen optimalen Teilmenge von Input- und Prozessvariablen und die Berechnung der optimalen Einstellung, die Produktvariablen zusammengefasst werden müssen. Diese Zusammenfassung kann natürlich nicht auf der Addition basieren, denn die Produktvariablen haben verschiedene Dimensionen und sind nicht unabhängig voneinander. Wie können die verschiedenen Produktvariablen zusammengefasst werden? Um diese Frage beantworten zu können, müssen wir einige Sachverhalte aus der Schätztheorie wiederholen. Es liege wieder eine Stichprobe X1, …, XN für den zufälligen Vektor XT = (X1, …, Xn) vor. Der Vektor der Mittelwerte X T = ( X1 , …, X n ) ist n-dimensional normalverteilt mit dem Erwartungswert μT = (µ1, …, µn) und der Kovarianzmatrix N –1 Σ. Wir symbolisieren diese Tatsache durch X ∼ N n (μ, N −1 Σ) . Die Schätzfunktion N S ist Wishart verteilt mit den Verteilungsparametern Σ und N – 1, wobei S die Stichprobenkovarianzmatrix bezeichnet. Die Wishart Verteilung ist eine multivariate Verallgemeinerung der χ2 Verteilung. Diesen Sachverhalt kürzen wir durch die Symbolik N S ~ Wn (Σ, N – 1) ab. Analog wie im univariaten Fall gilt auch im multivariaten Fall, dass X und N S unabhängig voneinander sind. Mit diesen Bezeichnungen gilt, (N − 1) (X − μ)T S −1 (X − μ) = T 2 . T2 bezeichnet die Hotelling Statistik und leistet genau das von uns Gewünschte. Wir verwenden also die T2-Statistik für die Zusammenfassung der m, m ≥ 1 Produktvariablen zu einer neuen univariaten Statistik in der Form Ti2 = (X i − X)T S −1 (X i − X). Die T2-Statistik von Hotelling ist die multivariate Verallgemeinerung des Quadrates der univariaten t2-Statistik. 1316han05.indd 346 25.07.2006 11:39:46 5.17 Zusammenfassung der Produktvariablen 347 Beispiel 5.17.1: Karosseriebau. Zusammenfassung der Produktvariablen Die m = 14 nicht unabhängigen Produktvariablen Y1, …, Y14 werden zu „Produkten“ über die T2-Statistik von Hotelling zusammengefasst. Die Werte für diese Statistik werden in der Abbildung 5.17.1 dargestellt. Produkte 80 60 40 20 0 0 40 80 120 160 200 240 Messwertsätze Abb. 5.17.1: Produkte für die Karosserievariablen Es ist, so glaube ich, sofort einzusehen, dass sich die univariaten T2i-Werte leichter einschätzen lassen als die Matrix der m = 14 mal N Einzelwerte. Große Werte können vorkommen, weil • entweder ein Einzelwert für eine Produktvariable sehr groß wird oder • die Werte für mehrere oder alle Produktvariablen an den Grenzen der statistischen Konfidenzintervalle liegen. Für die T2-Statistik gilt des weiteren T2 ≥ (N − 1) n Fn ,N − n (α). N −n Mit dieser Eigenschaft kann die T2-Statistik von Hotelling verwendet werden, um verschiedene Hypothesen über den Vektor X bzw. X zu prüfen. Außerdem gilt E [(X i − X)T S −1 (X i − X)] = Sp {E [X i − X) (X i − X) S −1]] = n. Diese Eigenschaft ist bei vielen praktischen Anwendungen nachteilig. So kann man aufgrund dieser Eigenschaft die T2-Statistik nicht verwenden, um die Prozessverbesserung nachzuweisen, indem man die Produktvariablen Y1, …, Ym vor und nach der Prozessverbesserung zu den Produkten zusammenfasst. Übung Kneterprozess Probleme In einem Unternehmen der Kunststoffindustrie gibt es Probleme mit den Knetern. Die ex- und internen Kundenanforderungen sind nur in einem Lastenheft verbal hinterlegt. Die Kunden der Kneterprodukte sind unzufrieden, können aber ihre Unzufriedenheit nicht quantitativ belegen. Die Streuungen der einzelnen Produktvariablen sind nachweisbar zu groß. Der Messwertaufwand ist für die vorliegenden Resultate zu hoch. 1316han05.indd 347 25.07.2006 11:39:46 348 5 Qualität in der Fertigung Prozessbeschreibung Die Inputprodukte werden durch k = 14 Inputvariablen, der Prozess wird durch n = 21 Prozessvariablen und die Produkte werden durch m = 16 Produktvariablen beschrieben. Die Visualisierung einer Stichprobe von N = 155 Wertesätzen für die Produktvariablen liefert die Star Plots der Abbildung 5.17.2. Diese bestätigen die großen Streuungen der einzelnen Variablen. Die Stars variieren in ihrer Form sehr stark, zeigen aber auch gewisse periodische Schwankungen, deren Ursache wir nicht kennen. Die Zusammenfassung der Produktvariablen liefert die Abbildung 5.17.4. Die Zusammenfassung der Inputvariablen liefert die Abbildung 5.17.5. Der Vergleich der beiden Abbildungen zeigt einen deutlichen Zusammenhang zwischen den Input- und Produktvariablen. Daraus folgt, dass die Ursache für das Problem in der Kommunikation zwischen dem Kunden- und Lieferantenprozess zu liegen scheint. 144 150 131 118 105 92 79 66 53 Abb. 5.17.2: Star Plots für die Kneterprodukte 1316han05.indd 348 25.07.2006 11:39:46 5.17 Zusammenfassung der Produktvariablen MISCH05.Y5 349 MISCH05.Y4 MISCH05.Y7 MISCH05.Y2 MISCH05.Y8 MISCH05.Y1 MISCH05.Y10 MISCH05.Y12 MISCH05.Y14 Abb. 5.17.3: Schlüssel für die Star Plots T-Squared Multivariate Control Chart 30 25 20 15 10 5 0 UCL = 25,37 0 30 60 90 Observation 120 150 Abb. 5.17.4: Zusammenfassung der Produktvariablen T-Squared zusammengefasste Inputparameter 30 25 20 15 10 5 0 UCL = 20,38 0 30 60 90 Observation 120 150 Abb. 5.17.5: Zusammenfassung der Inputvariablen Für die statistische Prozessanalyse habe ich für Sie eine Auswahl für die Input-, Prozess- und Produktvariablen getroffen, damit Sie mit den beiliegenden Programmen arbeiten können. Diese sind: • zwei Rohstoffe, die durch Z13 und Z14 beschrieben werden, • die drei Prozessvariablen X4 Masse [kg] X10 Drehzahl [U/min] X12 Mischzeit [min] und die beiden 1316han05.indd 349 25.07.2006 11:39:46 350 5 Qualität in der Fertigung • Produktvariablen mit den Sollwerten und Toleranzgrenzen Y9 Rheo Wert (Soll = 0,6, Tu = 0,59, To = 0,61) Y12 Dichte (Soll = 1,05, Tu = 1,024, To = 1,076). Führen Sie bitte eine umfassende statistische Prozessanalyse mit den Zwischenergebnissen • • • • Definition des Problems, Quantifizierung der Abhängigkeitsstruktur, Berechnung der Prozessgleichungen, Steuerung des Prozesses mit der Prozessgleichung durch. 5.18 Kalibrierung Die praktische Erfahrungen – nicht immer positiv – eines Labors zur Untersuchung von Bodenproben mit der DIN ISO 8466-2 „Kalibrierstrategie für nichtlineare Kalibrierfunktionen zweiten Grades“, Auftraggebern und Gutachtern für die Verfahrensetablierung, veranlassten uns, diesen Beitrag aufzunehmen. Das Problem aus dem Zusammenspiel der Kombattanten besteht häufig in der Vorgabe einer linearen Kalibrierung durch die Verfahrensetablierung, obwohl der Sachverhalt nichtlinear ist. Zur Lösung dieses Problems muss dafür Sorge getragen werden, dass obige Norm unbedingt angewandt wird. Dazu sind einige Verbesserungen erforderlich, die wir im Folgenden diskutieren wollen. Messwerte und Entscheidungen Eine umweltbelastende Konsequenz der industriellen Ansiedlungen sind kontaminierte Böden. Diese müssen gereinigt und in den Kreislauf zurückgeführt werden. Dazu sucht der Besitzer des Bodens durch Ausschreibung einen Sanierer. Zur Konkretisierung der Ausschreibung und für den Nachweis der simultanen Erfüllung aller relevanten Kunden – Besitzer und Gesetzgeber – Anforderungen schaltet der Sanierer ein Labor und falls erforderlich einen Gutachter ein. Das Labor ermittelt für die kontaminierten Böden nach einer entsprechenden Parametrisierung die Istwerte für die festgelegten Variablen. In diesem Zusammenhang ist die Kalibrierung von grundlegender Bedeutung, da die Konzentrationen bestimmter Substanzen nicht direkt gemessen werden können. Es lässt sich nur eine Funktion Y (Kalibrierfunktion) der Konzentration X, Y = f(X) messen. Der Funktionstyp und die Koeffizienten der Funktion sind unbekannt und müssen so genau wie möglich bestimmt werden. Hierfür werden Daten für Standardproben gewonnen. Die Konzentration Xi wird vorgegeben und die Funktion der Konzentration Yi, i = 1, …, N wird gemessen. Die Werte Yi nennt man der Einfachheit halber Messwerte der Variablen. Bei den praktischen Problemen gewinnt man die Messwerte Yi und will durch einen Umkehrschluss X = g(Y) die Konzentration der Verbindung bestimmen. Die Funktion g(X) nennt man Analysefunktion. Vom Kunden (Gesetzgeber, Besitzer, Weiterverwerter, …) werden die Anforderungen an den weiter zu verwertenden Boden gestellt. Das Labor hat nach der Reinigung der Böden die 1316han05.indd 350 25.07.2006 11:39:47 5.18 Kalibrierung Kundenanforderungen Kundenanforderungen 351 Gesetzgeber N kontaminierter Boden Sanierung Bodenvariablen Prozessvariablen gereinigter Boden E J Bodenvariablen Verbringung In den Kreislauf zurückgeführt Prozessvariablen Bodenvariablen Labor Labor Messwertermittlung Messwertermittlung Nachweis der Erfüllung Nachweis der Erfüllung Abb. 5.18.1: Netzwerk der Prozesse für die Bodensanierung Werte für die Variablen erneut zu bestimmen und den Nachweis zu führen, dass simultan alle relevanten Anforderungen durch den gereinigten Boden erfüllt werden. Das Zusammenspiel der Prozesse und Verantwortlichen wird durch das abgebildete Netzwerk der Prozesse mit Kommunikation dargestellt. Nach dieser Abbildung sind die folgenden Fehlentscheidungen möglich: Tabelle 5.18.1: Entscheidungen und Fehlentscheidungen Entscheidungen Boden A Anforderungen nicht erfüllt B Anforderungen erfüllt kontaminiert Ja Fehlentscheidung 1 saniert Fehlentscheidung 2 ja Die Fehlentscheidung 1 besagt, dass ein kontaminierter Boden in den Kreislauf zurückkommt und die Umwelt weiter schwer belastet. Durch das Zurückholen und erneute Reinigen des Bodens entsteht ein enormer Verlust für den Kunden. Die Fehlentscheidung 2 verlangt, dass ein ausreichend sanierter Boden erneut saniert wird und daher ein Verlust für die Bodensanierer entsteht. Die Wahrscheinlichkeiten für Fehlentscheidungen müssen minimiert werden, um Verluste zu vermeiden oder zumindest ebenfalls zu minimieren. Hierfür stehen uns aber nur zwei Möglichkeiten zur Verfügung. Der erste Weg bedeutet Investitionen in neue Geräte. Der zweite Weg verlangt geistige Investition, um die Gesetzmäßigkeiten der Sanierung und den simultanen Nachweis der Erfüllung aller relevanten Anforderungen im Sinne der DIN ISO Norm zu erkennen und auszunutzen. Damit wird deutlich, dass der erste Weg nur dann beschritten werden darf, wenn der zweite nicht mehr weiter führt, zumal in der Regel die materiellen Investitionen ausgeschöpft sind. 1316han05.indd 351 25.07.2006 11:39:47 352 5 Qualität in der Fertigung Beispiel 5.18.1: Kalibrierung. Linear Für die Kalibrierung liegen die Messwerte M1 und die Konzentrationen vor. Die Darstellung dieser Wertepaare enthält die Abbildung 5.18.2. Werden die Punkte durch eine lineare Kalibrierfunktion angepasst, dann erhält man die Abbildung 5.18.3. Die Kalibriergerade hat die Koeffizienten Y = M1 = b0 + bY/X X = –44611 + 1,36577 Konzentration. Zur Beurteilung der Kalibrierfunktion werden das Quadrat des Korrelationskoeffizienten rY2 / X = 0.9935 und die Reststandardabweichung SY/X = 37540 angegeben. Der quadrierte Korrelationskoeffizient ist ein Maß für die lineare Abhängigkeit zwischen den Messwerten Y und der Konzentration X und gibt an, zu wieviel Prozent die Varianz der Messwerte Y durch die Konzentration erklärt wird. Dieser Koeffizient ist erfreulicherweise überaus groß, d. h. ca. 99.3 % der Varianz der Messwerte werden durch die Konzentration (X 100000) 15 12 M1 9 6 3 0 0 0,2 0,4 0,6 0,8 1 Konzentration Abb. 5.18.2: Statistischer Zusammenhang zwischen den Messwerten M1 und den Konzentrationen (X 100000) 15 12 M1 9 6 3 0 0 0,2 0,4 0,6 0,8 1 Konzentration Abb. 5.18.3: Anpassung der Messwerte durch eine lineare Kalibrierfunktion 1316han05.indd 352 25.07.2006 11:39:47 5.18 Kalibrierung 353 erklärt. Die Reststandardabweichung ist die Standardabweichung der Messwerte um die Kalibriergerade. Diese kann nach der einfachen Beziehung SY2 / X = SY2 (1 − RY2 / X ) berechnet werden. Die quadratische Kalibrierfunktion ist Y = M1 + b0′ + bY′ / X X + bY′ / XX X 2 = 6398,8 + 991257 Konz + 383015 Konz 2 Das Quadrat des (in diesem Falle multiplen) Korrelationskoeffizienten ist RY2 / X = 0.9987. Würde man aufgrund des Korrelationskoeffizienten entscheiden, ob die lineare Kalibrierung ausreichend ist, so würde man – wie so häufig – entscheiden, dass die lineare Kalibrierung ausreicht. Aber berechnet man die Reststandardabweichung, dann erhält man den Wert SY/X = 16325. Das ist eine Verbesserung von mehr als 220 %! Die Darstellung der quadratischen Kalibrierfunktion ist in der Abbildung 5.18.4 zu sehen. (X 100000) 15 12 M1 9 6 3 0 0 0,2 0,4 0,6 0,8 1 Konzentration Abb. 5.18.4: Quadratische Kalibrierfunktion mit dem 95 % Konfidenzintervall Auswirkungen des linearen und quadratischen Ansatzes auf die Kalibrierfunktion Für die Bestimmung der unbekannten Konzentration einer Substanz wird die Analysefunktion X =g(Y) verwendet. Diese Funktion wird in den verschiedenen Standards als Umkehrfunktion der Kalibrierfunktion bestimmt. Das ist nicht zulässig, da der Zusammenhang zwischen den Messwerten M1 und der Konzentration stochastisch und damit nicht eineindeutig ist. Es ist besser allgemein anzunehmen, dass (Y, X) ~ N2(µ, Σ), wobei µT = (µY, µX) und ⎛ σY2 Σ=⎜ ⎝ 1316han05.indd 353 σYX ⎞ ⎟. σ 2X ⎠ 25.07.2006 11:39:47 354 5 Qualität in der Fertigung Da zu Beginn der Analysen alles unbekannt ist, verwendet man Standardproben und bestimmt hierfür für vorgegebene Konzentrationen die Messwerte. Unter dieser Annahmen kann man mit derselben Methode und denselben Werten die Analysefunktion X = g(Y) bestimmen. Mit dieser Funktion kann der Nachweis über das Vorhandensein einer Verbindung geführt werden. Darüber hinaus kann aber auch die Konzentration (Gehalt) einer Verbindung bestimmt werden. Die Chemiker sind an weiteren Charakteristika interessiert. Zu diesen gehören der kritische Wert einer Messgröße, die Nachweisgrenze, die Erfassungsgrenze und die Bestimmungsgrenze. Diese Charakteristika hängen natürlich ganz stark vom Kurventyp der Kalibrier- bzw. Analysefunktion ab und können daher auch als Entscheidung für den einen oder anderen Funktionstyp dienen. Der kritische Wert der Messgröße Y weist darauf hin, dass mit vorgebbarer Wahrscheinlichkeit die Substanz vorhanden ist. Der kritische Wert muss berechnet werden. Als Modell wird die Breite des „Prognoseintervalls“ an der Stelle X = 0 (Konzentration ist gleich null) verwendet. Für den Vergleich der verschiedenen Typen der Kalibrierfunktion werden die Prognosevarianz und damit die Prognoseintervallbreite für den linearen und quadratischen Fall berechnet. Für die lineare Kalibrierfunktion erhält man aus den Berechnungen die Schätzung für die Prognosevarianz v̂ar [Yˆ ( X E )] = SY2 / X ⎛ ⎞ ⎜ 2 ⎟ 1 (X − X ) ⎜1 + ⎟ + N E N ⎜ 2⎟ ∑ (Xi − X ) ⎟⎠ ⎜ ⎝ i =1 und damit die halbe Breite des Prognoseintervalls 1 ( X − X )2 YˆE + t FG,α ⋅ SY / X ⋅ 1 + + N E . N 2 ∑ ( Xi − X ) i =1 In diesen Darstellungen ist XE die Konzentration für die man die Prognose berechnen möchte und YˆE = Yˆ ( X E ) . Für die quadratische Kalibrierfunktion gilt 1 ⎡ ⎤ −1 v̂ar (YˆE ) = SY2 / X ⎢1 + + ( X E − X )T AXX ( X E − X )⎥ N ⎣ ⎦ und damit 1 −1 YˆE + t FG,α ⋅ SY / X ⋅ 1 + + ( X E − X )T AXX (X E − X ) . N 1316han05.indd 354 25.07.2006 11:39:48 5.18 Kalibrierung 355 Beispiel 5.18.2: Kalibrierung. Vorhersageintervall Für die lineare Kalibrierfunktion erhält man das Prognoseintervall für die Stelle XE = 0 1 ( X − X )2 YˆE + t FG,α ⋅ SY / X ⋅ 1 + + N E = −44611 ± 97845, N 2 ∑ ( Xi − X ) i =1 d. h. die halbe Breite des Prognoseintervalls ist 97845. Der kritische Messwert für die lineare Kalibrierfunktion ist Yk = b0 + t FG,α ⋅ SY / X ⋅ 1 + 1 + N X2 N ∑ i =1 = −44611 + 97845 = 53234. ( Xi − X )2 Für die quadratische Kalibrierfunktion erhalten wir 1 −1 YˆE + t FG,α ⋅ SY / X ⋅ 1 + + ( X E − X )T AXX ( X E − X ) = 6398.8 ± 44542 N d. h. die halbe Breite des Prognoseintervalls 44542 ist sehr viel kleiner als bei der linearen Kalibrierfunktion. Der Wert Yˆ ( X E = 0) entspricht dem Wert b0 in den Kalibrierfunktionen. Der kritische Messwert für die quadratische Kalibrierfunktion ist Yk = b0 + t FG,α ⋅ SY / X ⋅ 1 + 1 −1 + ( X E − X )T AXX ( X E − X ) = 6398 + 44542 N = 50940. Beispiel 5.18.3: Nachweisgrenze Die Nachweisgrenze ist die Konzentration, die dem kritischen Wert des Messwertes entspricht. Im linearen Fall erhält man für die Funktion X = g(Y) die halbe Breite des Prognoseintervalls 1 (Y − Y )2 Xˆ E + t FG,α ⋅ S X / Y ⋅ 1 + + N E N ∑ (Yi − Y )2 i =1 und damit die Nachweisgrenze X NG = t FG,α ⋅ S X / Y ⋅ 1 + (Y − Y )2 1 + N k = 0.069987. N 2 ( ) Y − Y ∑ i i =1 1316han05.indd 355 25.07.2006 11:39:48 356 5 Qualität in der Fertigung Im quadratischen Fall erhält man 1 −1 Xˆ E = b0′ + t FG,α ⋅ S X / Y ⋅ 1 + + (YE − Y )T AYY (YE − Y ) N und die Nachweisgrenze 1 −1 + (YE − Y )T AYY (YE − Y ) = 0.05696. N X NG = t FG,α ⋅ S X / Y ⋅ 1 + Die Nachweisgrenze für den quadratischen Ansatz liegt ungefähr bei nur 80 % des linearen Ansatzes. Beispiel 5.18.4: Erfassungsgrenze Diese Grenze bezeichnet die kleinste Konzentration bei der mit vorgebbarer Wahrscheinlichkeit der Nachweis der Substanz möglich ist. Für den linearen Fall erhält man für die vorgebbare Wahrscheinlichkeit β = α die Erfassungsgrenze X EG = X NG + t FG,α ⋅ S X / Y ⋅ 1 + (Y − Y )2 1 + N k = 0.1399. N 2 ∑ (Yi − Y ) i =1 Für den quadratischen Fall gilt X EG = X NG + t FG,α ⋅ S X / Y ⋅ 1 + 1 −1 + (YE − Y )T AYY (YE − Y ) = 0.11392. N Beispiel 5.18.5: Bestimmungsgrenze Für diese Grenze muss die relative Ergebnisunsicherheit, die sich aus der halben Breite des Prognoseintervalls für die Konzentration X und der Bestimmungsgrenze XBG sowohl für den linearen t FG,α ⋅ S X / Y ⋅ 1 + 1 + N (Yi − Y )2 N ∑ (Yi − Y )2 i =1 X BG = ΔX BG = Vr (lin) X BG als auch quadratischen Fall t FG,α ⋅ S X / Y ⋅ 1 + 1 −1 + (Yi − Y )T AYY (Yi − Y ) ΔX BG N = = Vr (quad) X BG X BG ergibt, bestimmt werden. Dieser Quotient soll nun mit vorgegebener Wahrscheinlichkeit α einen vorher definierten Wert k annehmen, z. B. k =3. Symbolisch kann man hierfür schreiben P (Vr ≥ k) = α. 1316han05.indd 356 25.07.2006 11:39:48 5.18 Kalibrierung 357 In die Formeln für die Prognoseintervalle muss anstelle des beliebigen Messwertes Yi der Messwert an der Stelle der Bestimmungsgrenze eingesetzt werden. Dieser Wert ist aber unbekannt. Folglich müsste man ein approximatives Verfahren entwickeln oder eine Schätzung einsetzen. Als Schätzung wird nach dem HBU Standard der Wert YBG = k ΔYBG verwendet. Hierfür gilt P (ΔXBG ≥ k XBG) = α. Formt man nun die Quotienten Vr um, dann erhält man für den linearen Fall die Bestimmungsgrenze X BG = k ⋅ t FG,α ⋅ S X / Y ⋅ 1 + 1 (k ⋅ YNG − Y )2 + N = 0.167822 N 2 ∑ (Yi − Y ) i =1 bzw. für den quadratischen Fall die Grenze X BG = k ⋅ t FG,α ⋅ S X / Y ⋅ 1 + 1 −1 + (k ⋅ YNG − Y )T AYY (k ⋅ YNG − Y ) = 0.065005. N Auch hier sieht man wieder die Verbesserung um ca. 250 % beim Übergang vom linearen zum quadratischen Ansatz. Schlussfolgerungen Wenn der Zusammenhang zwischen der Konzentration und dem Messwert nichtlinear ist, dann muss mit der nichtlinearen Kalibrierfunktion gearbeitet werden, da ansonsten der Verlust an Genauigkeit (Reststandardabweichung) zu groß wird und damit der kritische Messwert, die Nachweis-, Erfassungs- und Bestimmungsgrenzen zu ungenau – ebenfalls zu hoch – bestimmt werden. Die Verschlechterungen können in der Regel nicht durch die materielle Investition in Geräte aufgefangen werden und sind außerdem sehr teuer. Die DIN ISO Norm 8466-2: 2000-09 sollte mit den hier vorgestellten Verfahren vervollständigt werden, damit das Konfliktpotential bei der Ausschreibung zwischen den Kombattanten im Sinne einer klaren Entscheidung aufgrund eindeutiger statistischer Ergebnisse reduziert werden kann. In diesem Zusammenhang sollten auch die Konfliktpotentiale, die auf der Bestimmung der Kalibrierfunktion mit Wiederholungen und der Rekalibrierung basieren, diskutiert und beseitigt werden. 1316han05.indd 357 25.07.2006 11:39:49 1316han05.indd 358 25.07.2006 11:39:49