Leseprobe - Beck-Shop

Werbung
Praxisleitfaden Qualität
Prozessoptimierung mit multivariater Statistik in 150 Beispielen
von
Walter Jahn, Lorenz Braun
1. Auflage
Hanser München 2006
Verlag C.H. Beck im Internet:
www.beck.de
ISBN 978 3 446 40616 2
Zu Inhaltsverzeichnis
schnell und portofrei erhältlich bei beck-shop.de DIE FACHBUCHHANDLUNG
Produktinformation
Seite 1 von 1
Praxisleitfaden Qualität
Walter Jahn, Lorenz Braun
Prozessoptimierung mit multivariater Statistik in 150
Beispielen
ISBN 3-446-40616-6
Leseprobe
Weitere Informationen oder Bestellungen unter
http://www.hanser.de/3-446-40616-6 sowie im Buchhandel
http://www.hanser.de/deckblatt/deckblatt1.asp?isbn=3-446-40616-6&style=Leseprobe
17.08.2006
5
Qualität in der Fertigung
Dieses Kapitel ist zweifelsfrei für den Nutzer aus der Fertigung das wichtigste, da in diesem
grundsätzliche Fragen, wie z. B.
• Was ist Qualität?
• Was besagen die Bezeichnungen Produktqualität, Prozessqualität und Lieferantenqualität?
• Wie kann die Qualität für Vergleiche messbar gemacht werden?
• Wie können Sie die Kundenanforderungen spezifizieren?
• Was ist Fähigkeit?
• Wie können Sie die Fähigkeit ermitteln?
• Wie können Sie aufgrund der Fähigkeiten entscheiden?
• Welche Entscheidungsmöglichkeiten haben Sie?
• Was heißt Prozessverbesserung?
• Was ist eine Prozessgleichung?
• Wie können Sie mit der Prozessgleichung die Prozesse steuern?
• Wie können Sie die Ergebnisse der statistischen Prozessanalyse und Steuerung der Prozesse
in die Praxis überführen?
beantwortet werden.
Zur Beantwortung dieser und zahlreicher anderer Fragen müssen wir strukturiert vorgehen,
um die komplizierte Materie für Sie so aufzubereiten, damit Sie die Methoden zur notwendigen
Lösung Ihrer betrieblichen Probleme anwenden und vor allem deren Ergebnisse zum Nutzen
für das Unternehmen interpretieren können.
5.1
Was ist ein Produkt?
Das Ergebnis jeder Tätigkeit und jedes (Herstellungs- oder Dienstleistungs-) Prozesses ist ein
Produkt.
Das Produkt kann z. B. ein Nahrungsmittel sein, oder es ist ein Teil für die Weiterverwendung
in umfassenderen Produkten, wie z. B. der Motor für ein Auto usw. Das Produkt kann aber
auch eine Dienstleitung, z. B. eine Taxi-Fahrt oder die Bestellung von Materialien für die Herstellung, der Vertrieb der Produkte usw. sein.
Jedes Produkt wird auf einem Markt realisiert, d. h. angeboten und gekauft. Aber damit ein
Produkt gekauft wird, muss es Anforderungen von Kunden erfüllen. Diese Anforderungen werden häufig durch Eigenschaften charakterisiert, so z. B. muss ein PKW modern sein, geringen
Benzinverbrauch haben, ständig einsatzbereit sein. Die Eigenschaften werden z. B. auch für
Produktweiterentwicklungen durch die WAS Fragen ermittelt.
1316han05.indd 155
25.07.2006 11:38:56
156
5 Qualität in der Fertigung
Eigenschaften sind aber häufig nicht oder nicht einfach zu messen. Daher müssen die Eigenschaften parametrisiert werden. Oft sind die Parameter physikalisch, chemisch, biologisch oder
ökonomisch stetig messbare Variablen. Der Spritverbrauch beim PKW ist ein physikalisch
messbarer Parameter. Die Eigenschaft „modern“ muss aber erst noch in solche Parameter
übersetzt werden. Modern könnte sich auf die Elektronik im PKW beziehen und die Motorsteuerung oder die Klimaanlage betreffen. Diese Aggregate können dann durch eine Vielzahl
von Variablen parametrisiert werden.
Die Ausprägungen der Variablen, d. h. welche Werte sollen die Variablen annehmen, werden
unter der Frage WIE z. B. bei QFD charakterisiert.
Die immense Vielzahl verschiedener Produkte, die unterschiedlichen Anforderungen an die
Produkte und die zahlreichen Weiterverwendungen der Produkte zwingen uns dazu, eine
Ordnung in diese riesige Menge und den unterschiedlichen Sprachgebrauch zu bringen.
Daher vereinbaren wir, dass ein Produkt durch m, m ≥ 1 Produktvariable Y1, …, Ym beschrieben wird.
Die Produktvariablen sind Realisierungen von Zufallsgrößen. Das wird deutlich, wenn wir uns
ein konkretes Produkt anschauen.
Beispiel 5.1.1: Ziegelsteinherstellung. Nicht unabhängige Zufallsgrößen
Ein Ziegelstein besteht aus einer Mischung aus Lehm, Kalk, Feldspat und gewissen Additiven. Die Verteilung der Komponenten wird auch nach sehr langer Mischzeit nicht völlig
homogen sein.
Die geformten Ziegelsteine werden in Stapeln auf Paletten geschichtet und langsam durch
einen Brennofen gefahren.
Das heterogene Gemisch aus verschiedenen Komponenten, die unterschiedliche Lage eines
Ziegelstein im Stapel, die unterschiedlich lange Dauer der Ofenreise und die damit verbundene unterschiedliche Temperaturkapazität pro Stein führen dazu, dass die Produktvariablen
des Ziegelsteins, wie die Bruchfestigkeit, die geometrischen Abmessungen, das Gewicht usw.
selbst für eine „gleichbehandelte“ Charge in gewissen Grenzen schwanken. Die Messwerte
für die Produktvariablen sind zufallsbehaftet, d. h. die Messwerte haben einen mehr oder
weniger großen zufälligen Fehler.
Die Produktvariablen sind nicht unabhängig voneinander, sondern sie sind mehr oder weniger
stark miteinander korreliert. Diesen Sachverhalt können Sie sich anhand der Abbildung 5.1.1
verdeutlichen.
r 12
Y 2± Δ Y 2
Y1
r 23
r1
3
Y3
Abb. 5.1.1: Korrelative Abhängigkeiten für Produktvariable
1316han05.indd 156
25.07.2006 11:38:57
5.1 Was ist ein Produkt?
157
Diese Abbildung zeigt Ihnen, dass sich z. B. die Veränderung des Wertes von Y2 um den Betrag ΔY2 sowohl auf Y1 als auch auf Y3 auswirken kann. Die „Größe“ dieser Abhängigkeiten,
besser der Grad der linearen Abhängigkeiten zwischen jeweils zwei Zufallsvariable wird durch
den Korrelationskoeffizienten rjk, j, k = 1,2,3 gemessen. Das sind dimensionslose Zahlen, die
zwischen –1 und +1 liegen. Sind zwei Variablen unabhängig voneinander, dann ist der Korrelationskoeffizient gleich null.
Beispiel 5.1.2: Dämpfung der Motorvibration. Abhängigkeiten
Für die Dämpfung der Motorvibration werden Hydrolager verwendet. An diesem Produkt
werden viele Produktvariablen gemessen. Wir wollen hier nur die beiden Produktvariablen
Y1 = dynamische Steifigkeit [N/mm] und Y2 = Phasenverschiebung [Φ] betrachten Mit den
Daten aus einer großen Stichprobe wurde die dreidimensionale Häufigkeitsverteilung in
Abbildung 5.1.2 gezeichnet.
Was können Sie aus der Abbildung 5.1.2 ablesen?
• Die Werte für die beiden Produktvariable streuen sehr stark. Das ist ein Ausdruck für
den zufälligen Charakter der Produktvariablen.
• Es gibt viele Ausreißer.
• Die Grundfläche der Häufigkeitsverteilung, d. h. die Punktwolke für die Messwertpaare,
ausgedrückt durch das Streudiagramm in Abbildung 5.1.3, ist offensichtlich nicht kreisförmig, sondern elliptisch umrissen. Das zeigt Ihnen, dass die beiden Produktvariablen
nicht unabhängig voneinander sind.
Abb. 5.1.2: Dreidimensionale Häufigkeitsverteilung für zwei Produktvariablen eines Hydrolagers
1316han05.indd 157
25.07.2006 11:38:57
158
5 Qualität in der Fertigung
CDYN
250
200
150
100
0
10
20
30
PHASE
40
50
60
Abb. 5.1.3: Streudiagramm für die hydraulischen Motorlager
Aus Abbildung 5.1.2 und Abbildung 5.1.3 müssen Sie die Schlussfolgerungen ziehen,
dass
• die Daten aufbereitet werden müssen; Ausreißer sind zu erkennen und zu eliminieren,
• jeder Prozess zu Herstellung eines Produktes gesteuert werden muss, um die vielen
Ausreißer zu vermeiden und die Streuung zu reduzieren.
Für die Steuerung benötigen Sie Zielwerte und zulässige Streuintervalle für die Produktvariablen und eine Prozessgleichung.
5.2
Wie können Sie entscheiden, ob Ihre Prozesse in
Ordnung sind oder verbessert werden müssen?
Die konkreten Produktdarstellungen zeigen Ihnen, dass
• jedes Produkt durch die Angabe von Sollwerten und Toleranzgrenzen für alle nicht unabhängigen Produktvariablen präzisiert werden muss – man spricht in diesem Zusammenhang
von der Spezifizierung aller relevanten Kundenanforderungen und
• ein Kriterium gesucht wird, nach dem entschieden wird, ob ein Produkt simultan alle
relevanten Kundenanforderungen erfüllt oder der Prozess verbessert werden muss.
1316han05.indd 158
25.07.2006 11:38:58
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
5.2.1
159
Was ist ein modernes Produktaudit?
Audits im Qualitätsmanagement sind durch die Unternehmensleitung initiierte, systematische
und unabhängige Qualitätsprüfungen, um festzustellen, ob die qualitätsbezogenen Tätigkeiten
den geplanten Anforderungen entsprechen, ob diese Anforderungen tatsächlich verwirklicht
sind und ob sie geeignet sind, die Ziele zu erreichen (Linß [2005, 393]). Nach Linß wird in
Systemaudits, Produktaudits und Prozessaudits unterschieden.
Durch das Produktaudit soll nach ISO 9000: 2000 ff. und Linß [2004, 394] die Übereinstimmung der Ausführung von Produkten mit den festgelegten Qualitätsforderungen untersucht
und beurteilt werden.
Die beiden Seiten eines Audits, nämlich die
• Anforderungen und
• der Istzustand eines Produktes
müssen quantifiziert werden. Das Gleiche gilt für die Beurteilung der Übereinstimmung, damit
z. B. Übereinstimmungen verglichen werden können, um festzustellen, ob Verbesserungsmaßnahmen wirksam waren. Zu diesem Zweck zählen wir zum „modernen“ Produktaudit
die Aktivitäten:
1. Zusammenstellung der (ex- und/oder internen) Kundenanforderungen zu einem KundenAnforderungs-Profil (KAP),
2. Parametrisierung der Kundenanforderungen durch die Produktvariablen,
3. Datensammlung für alle Produktvariablen,
4. Zusammenstellung der Sollwerte und Toleranzgrenzen; falls erforderlich muss die statistische Tolerierung für alle nicht unabhängigen Produktvariablen durchgeführt werden,
5. Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen mit
6. korrigierten univariaten und multivariaten Prozessfähigkeitsindizes,
7. Entscheidung aufgrund der Indizes für
– Prozessverbesserung im Sinne der
· Reduktion der Variabilität mindestens einer Produktvariablen,
· Übereinstimmung der Mittel- mit den Sollwerten,
– neue statistische Tolerierung,
– Kontrolle des Prozesses mit den uni- und/oder multivariaten Kontrollkarten,
– Investitionen in Maschinen, Anlagen, Mitarbeiter, Methodik usw.
5.2.1.1
Was beinhaltet das Kunden-Anforderungs-Profil (KAP)?
Ein (in- oder externer) Kunde, der eine Dienstleistung oder das materielles Produkt eines Vorläuferprozesses benötigt, stellt Anforderungen an das Produkt und seine zu gewährleistenden
Funktionen. Die Anforderungen werden häufig in Form von Eigenschaften formuliert.
Über die Kundenanforderungen wird das Produkt definiert.
1316han05.indd 159
25.07.2006 11:38:59
160
5 Qualität in der Fertigung
Beispiel 5.2.1: Kunststoffscheiben. Definition von Kundenanforderungen
Problem:
Die Glasscheiben in einem PKW sollen durch Kunststoffscheiben auf Basis von Polycarbonat
mit Hartbeschichtung ersetzt werden, um das
• zukünftige Design von Scheiben und Karosserie durch ganzheitliches Design und
Konstruktion zu revolutionieren.
• die Sicherheitsaspekte zu verbessern,
• das Gewicht zu reduzieren usw.
Aus der Analyse der Marktsituation sollen unter Beachtung der KAP der europäischen
Automobilhersteller nachfolgenden Studien
1. über die Machbarkeit und
2. internationalen Verfügbarkeit der Prozesse
erarbeitet werden.
Hierbei sollen die globalen Ziele
•
•
•
•
•
•
•
•
•
Verbesserung der Sicherheit gegen Einbruch,
Reduktion des Gewichts,
Verbesserung des Komfort (Geräuschdämpfung, thermische Eigenschaften)
Verbesserung des Schutzes gegen Unfälle, Überfälle usw.,
Erhöhung der Verschleißfestigkeit (Kratzfestigkeit, …)
Verbesserung der Formgebung/Design und Konstruktion,
Erhaltung der optischen Eigenschaften des Glases,
Erhöhung der Wirtschaftlichkeit bei den Herstellern und
Verbesserung der Instandhaltungsfreundlichkeit
verfolgt werden.
Die globalen Ziele werden auf geforderte Eigenschaften und auch schon geforderte Parameter zurückgeführt und im Kunden-Anforderungs-Profil (KAP) zusammengefasst.
Unter einem Parameter wollen wir hier eine messbare Variable verstehen.
Zu den Eigenschaften gehören z. B.
• die Zähigkeit
• diese kann parametrisiert werden durch die physikalischen Variablen
– Biegefestigkeit,
– Schlagfestigkeit,
– Bruchfestigkeit,
– E-Modul
• Beständigkeit der Oberfläche nach dem Verkleben,
– Temperaturbereich,
– Medien,
1316han05.indd 160
25.07.2006 11:38:59
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
•
•
•
•
161
– Luftfeuchte,
– NaCl bzw. CaCl-Lösungen,
– Tenside
Verformbarkeit,
– Spannungs- Verformungs- Verhalten mit der
– Normalspannung,
– Tangentialspannung,
– Scherspannung
optische Eigenschaften,
– Trübung
– Lichtreflektion,
– Lichttransmission,
– Verzerrung,
– Brechungsindex,
– Lichtdurchlässigkeit
Oberflächeneigenschaften
– Farbe
– Verfärbung,
– Schlierenbildung,
– Glanz,
– Beschichtungsdefekte,
– Abriebfestigkeit,
– Kratzfestigkeit
Thermisches Verhalten
– Wärmedämmung,
– Wärmedurchgang,
– Wärmeausdehnung,
– Überwölbung
Anforderungen in Parameterform sind z. B.
•
•
•
•
•
Steifigkeit,
Gewicht,
Lebensdauer,
geometrische Maße, wie z. B. Scheibendicke, Kantenrundung,
Oberflächenspannung,
und vieles mehr.
Die Parametrisierung führt zur Benennung der Produktvariablen. Hier einige Beispiele:
Y1
Y2
Y3
Y4
Y5
Y6
Y7
1316han05.indd 161
= Biegefestigkeit
= Bruchfestigkeit (gleiche Bruchfestigkeit über einem großen Temperaturbereich)
= Formbarkeit
= Lichtdurchlässigkeit (Transparenz)
= Elastizitätsmodul
= Einbaustabilität
= Geräuschdämpfung
25.07.2006 11:38:59
162
5 Qualität in der Fertigung
Y8 = Kratzfestigkeit
Y9 = Witterungsbeständigkeit
Y10 = Korrosionsbeständigkeit
Y11 = Gewicht
Y12 = Reflexion der Wärmestrahlung
Y13 = Wirtschaftlichkeit, Preis
Y14 = Abriebfestigkeit
Y15 = optische Verzerrung
und viele mehr.
Die Produktvariable sind mit Sicherheit nicht unabhängig voneinander.
Alle Eigenschaften müssen parametrisiert werden. Das ist bisher nicht gelungen. Ursachen
hierfür sind:
• fehlende Gewissheit über die Vollständigkeit der Eigenschaften und damit der Parametrisierung,
• fehlende Invarianz der vom Kunden beschriebenen Eigenschaften,
• mehrere Eigenschaften sind Funktionen von diversen anderen Parametern.
• Diese Funktionen sind mitunter kompliziert.
• Keine klare Trennung von Eigenschaften, Parametern und deren Prüfungen.
• Die bisher parametrisierten Eigenschaften sind unvollständig spezifiziert.
• Die Sollwerte liegen z. T. als Bereiche und nur selten als Zahlen vor, Toleranzgrenzen fehlen
grundsätzlich.
Dieses Beispiel demonstriert, das die Zusammenstellung des KAP eine wichtige und auch
komplizierte Aufgabe ist, an der verschiedene Experten zusammenarbeiten sollten.
5.2.1.2
Wie kann man die parametrisierten Kundenanforderungen statistisch
tolerieren?
Bei der Definition des Produktaudits wird auf die beiden Seiten, nämlich die
• Anforderungen und
• den Istzustand eines Produktes
hingewiesen. Hier wollen wir uns damit befassen, wie
• gegebene CAD Toleranzen zu überprüfen sind oder
• diese beim Fehlen von Sollwerten und Toleranzgrenzen berechnet werden können.
Die Frage der statistischen Tolerierung ist bedeutsam, da die Produktvariablen in der Regel
nicht unabhängig, sondern im Gegenteil sehr häufig sehr stark miteinander korreliert sind. Die
meisten – bisher bekannten – statistischen Tolerierungsverfahren basieren auf dem Faltungssatz
für Zufallsgrößen. Dieser setzt die Unabhängigkeit der Zufallsgrößen voraus. Wie wir bei der
Korrelationsanalyse im Abschnitt 5.6 sehen, wird die Straffheit einer Abhängigkeitsstruktur
durch die Determinante der Korrelationsmatrix beurteilt.
1316han05.indd 162
25.07.2006 11:38:59
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
163
Bei einem Autobauer sollten für den Karosseriebau die Toleranzen vieler Maße überprüft
werden, da es Probleme bei der Montage gab. Zur Auswahl standen
• das Maßkettenkonzept nach dem Faltungssatz und
• die statistische Tolerierung von Jahn.
Als Entscheidungskriterium wählte ich die Determinante der Korrelationsmatrix.
Für ca. 60 Produktvariable galt Det(RYY) = 1.28 10–135. Dieser Wert liegt sehr viel näher an
der Null als an der für das Maßkettenkonzept geforderten 1! Das Maßkettenkonzept muss
zugunsten der statistischen Tolerierung von Jahn verworfen werden.
Problem
Ein Kunde kommt mit seinem Wunsch nach einem bestimmten Produkt zu einem Unternehmen.
Z. B. ein Autobauer möchte ein Dämpfungssystem (Motorlager) von seinem Lieferanten. Der
Kunde formuliert seine Anforderungen an die Eigenschaften des Motorlagers hinsichtlich
der Vibration, des Fahrverhaltens und der Dämmung des Geräuschpegels. Der Hersteller des
Dämpfungssystems (der Lieferant) akzeptiert den Wunsch, parametrisiert die Eigenschaften,
z. B. in die Produktvariablen statische und dynamische Steifigkeiten, Phasenverschiebung,
Ausreißkräfte usw., spezifiziert die Produktvariablen in Form von Sollwerten und Toleranzgrenzen für die Produktentwicklung mit Hilfe eines CAD Systems oder des Maßkettenkonzeptes. Für die Herstellung sind diese Toleranzen in der Regel nicht geeignet. Hierfür sollten
aufgrund der Abhängigkeitsstruktur der Produktvariablen die Maßtoleranzen zumindest
durch die statistische Tolerierung für alle relevanten Produktvariablen überprüft werden. Die
statistischen Toleranzen für eine Pilotfertigung oder für Vorläuferprodukte werden mit dem
Kunden abgestimmt, denn die Anforderungen können zu einem Widerspruch innerhalb der
Maßkettentoleranzen oder zwischen den Maßketten- und statistischen Toleranzen führen, wie
auch im vorliegenden Fall, zu einer hohen Steifigkeit der Gummimischung für das Fahrverhalten und einer niedrigen Steifigkeit für die Geräuschdämmung. Die statistischen Toleranzen
werden als Toleranzen anerkannt und die Produkte werden produziert. Der Produzent für
das Motorlager liefert die Produkte und weist nach, dass die geforderte Qualität im Sinne der
simultan Erfüllung aller relevanten Kundenanforderungen geliefert wird. Danach stellt er die
Rechnung und verlangt sein Geld.
Das Problem beinhaltet zwei zu lösende Teilprobleme:
• Tolerierung der nicht unabhängigen Produktvariable für die Entwicklung und Fertigung,
• Nachweis der simultanen Erfüllung aller spezifizierten relevanten Kundenanforderungen.
Problemlösung
Bisheriges Kernstück einer funktions-, fertigungs- und montagegerechten Tolerierung ist die
Maßkettentheorie. Sie ist die Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Toleranzen sich summieren. Die Maßkette ist eine Aneinanderreihung von
zusammenwirkenden Einzelmaßen und dem von ihnen abhängigen Schlussmaß. Sie bildet bei
schematischer Darstellung einen geschlossenen Linienzug (eine Masche). Die Maße (Einzelmaße – Schlussmaß) sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette mit
Schlussmaß ist ihre Geschlossenheit. Bei der Berechnung von Maßketten (Toleranzketten) ist zu
1316han05.indd 163
25.07.2006 11:38:59
164
5 Qualität in der Fertigung
beachten, dass die Einzelmaße unterschiedlichen Systemen angehören können, und zwar dem
herzustellenden Gerät, dem Werkstück, der Bearbeitungseinheit aus Maschine, Vorrichtung,
Werkzeug usw. Die Maßkette schafft Voraussetzungen zur Festlegung der Abmessungen der
Einzelteile und des Gerätes, der Einzeltoleranzen, der Bearbeitungsfolge, der Arbeitszugaben
usw. Die Toleranzkettentheorie ist die Lehre von der möglichen Größe und Lage der Toleranz
(Schlusstoleranz) des funktionsbestimmenden resultierenden Maßes (Summenmaß) einer
Maßkette. Unter Funktionssicherheit wird dabei die Einhaltung der für ein Erzeugnis vorgegebenen Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen verstanden. Innerhalb dieser Grenzen ist das Produkt funktionstüchtig. Die Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die
Funktionstüchtigkeit beschreibenden Eigenschaften eines Produktes. Die Herstellungstoleranz
ist die Differenz zwischen dem oberen und unteren erreichten Grenzwert bei der Herstellung
mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigprodukte. Die Maßtoleranz ist die
Differenz zwischen dem zulässigen Größt- und Kleinstmaß. Die Messtoleranz ist die Differenz
zwischen der zulässigen oberen und unteren Abweichung des Messwertes von der Messgröße.
Sie entspricht der zulässigen Fehlergrenze der Messung.
Die Bedeutung der Tolerierung liegt in
• der Gewinnung von Zielwerten und den zugehörigen Intervallen für die Steuer- und Regelung von Prozessen und
• der Ableitung von Genauigkeitsintervallen (Toleranzintervallen) für die Input- und Prozessvariablen.
Wie wird eine Maßkette berechnet?
Das Nennmaß N0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen
Maßkettengliedern additiv aus den Nennmaßen Nj der m Einzelmaße
N0 =
m
∑ kj N j
j =1
zusammen, wobei die kj die Richtungskoeffizienten sind, siehe z. B. Hofmann [1986]. Diese
Koeffizienten nehmen die Werte +1 oder –1 an, je nachdem, ob der Einfluss des Einzelmaßes auf
das Schlussmaß positiv oder negativ ist. Positive Einzelmaße bewirken bei ihrer Vergrößerung
oder Verkleinerung eine gleichsinnige Veränderung des Schlussmaßes. Der Richtungskoeffizient
ist der Maßkette zu entnehmen.
Wie wird eine Toleranzkette berechnet?
Sind die Toleranzen der Einzelmaße und die Kleinstspiele Skj gegeben, so beträgt nach Hofmann
[1986] die Schlusstoleranz T0 des Schlussmaßes
T0 =
m−e
m
j =1
j = m − e +1
∑ Tj + ∑
Skj .
Hieraus können die Einzeltoleranzen Tj berechnet werden.
1316han05.indd 164
25.07.2006 11:38:59
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
165
Unterscheidet sich die Tolerierung für die Produktentwicklung von der für die Fertigung?
Dem Maßkettenkonzept soll die statistische Tolerierung gegenüber gestellt werden, denn
• die Produktvariablen der gefertigten Produkte sind Zufallsgrößen und
• die Zufallsgrößen sind nicht unabhängig voneinander.
Das Maßkettenkonzept auf die Fertigung angewandt, basiert auf der Faltung von Zufallsgrößen
und setzt Unabhängigkeit voraus. Diese Voraussetzung ist aber nur selten erfüllt. Daher wollen
wir uns mit einer Möglichkeit der statistischen Tolerierung befassen, die auch bei korrelierten
Produktvariablen richtige Resultate liefert.
Die statistische Tolerierung quantifiziert das „Können des Prozesses“. Folglich müssen die
statistischen Toleranzgrenzen für alle relevanten Produktvariablen mit den Experten der Produktentwicklung abgestimmt werden, damit aus den statistischen allgemeingültige Toleranzen
werden.
Für die Berechnung der multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten
Potentials des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren (Qualität),
benötigen wir, neben dem Können des Prozesses, die Möglichkeit des Vergleiches des Soll- und
Istzustandes der Fertigung für den multivariaten Fall.
Der Vektor der Produktvariablen sei wieder YT = (Y1, …, Ym). Dieser Vektor sei m-dimensional
normal verteilt Y ~ Nm(µ, ΣYY), wobei die Kovarianzmatrix ΣYY positiv definit sein soll oder die
Verteilung von Y gehöre zur Familie der elliptisch umrissenen Verteilungen.
5.2.1.3
Auf welchem Prinzip basiert die statistische Tolerierung?
Der Vektor Y wird in die beiden Teile
YT = (Yj, YTm – j)
zerlegt.
Die einzelnen Produktvariablen sind nicht unabhängig voneinander, sondern durch die
Abhängigkeitsstruktur, ausgedrückt durch die folgende partitionierte Kovarianzmatrix des
aufgespalteten Vektors der Produktvariablen, miteinander verbunden.
Die Kovarianzmatrix der Produktvariablen ist
ΣYY
⎛ σ 2j
=⎜
⎝
σ j .m − j ⎞
⎟.
Σ m − j .m − j ⎠
Die Realisierungen (Messwertvektoren) des normal verteilten Vektors der Produktvariablen
sind Punkte im m-dimensionalen euklidischen Raum und liegen wegen der Verteilungsvoraussetzung innerhalb eines Hyperellipsoides. Das sieht man, wenn man den Exponent der
multivariaten Normalverteilung
f ( y ; μ, ΣYY ) =
1
2⋅π ⋅
1
ΣYY 2
⎧ 1
⎫
−1
⋅ exp ⎨− ⋅ (Y − μ)T ⋅ ΣYY
⋅ (Y − μ)⎬
⎩ 2
⎭
gleich einer Konstanten setzt, z. B.
−1
(Y − μ)T ⋅ ΣYY
⋅ (Y − μ) = c1− α .
1316han05.indd 165
(1)
25.07.2006 11:39:00
166
5 Qualität in der Fertigung
Dann ist das die Gleichung für ein Hyperellipsoid mit dem Mittelpunkt µ, wobei 1 – α die
Wahrscheinlichkeit ist, mit der die Punkte innerhalb des Hyperellipsoides liegen. Das Hyperellipsoid beschreibt das Können des Prozesses. Die Form des Hyperellipsoides wird durch die
Abhängigkeitsstruktur bestimmt. Diese wiederum haben wir durch den Grad der Multikollinearität
δ = R YY
−1
(2)
charakterisiert.
Zunehmender Grad der Multikollinearität führt zu größeren Diagonalelemente der inversen
Korrelationsmatrix,
−1
RYY
⎧ (1 − ρ2j / m − j )−1 , für alle j = 1, …, m
⎪
⎪
−ρ jk / m − ( j ,k)
=⎨
, j , k = 1, …, m, j ≠
1
⎪
2
2
2
⎪⎩ ⎡⎣(1 − ρ j / m − j ) (1 − ρk / m − k )⎤⎦
wobei ρ2j/m – j das Quadrat des multiplen Korrelationskoeffizienten zwischen Yj und einer Linearkombination in den restlichen (Y1, …, Yj – 1, Yj + 1, …, Ym) = Ym – j ist. ρjk/m – (j, k) sind die
partiellen Korrelationskoeffizienten zwischen Yj und Yk unter der Bedingung der restlichen
Produktvariablen.
Zumindest einige der multiplen Korrelationskoeffizienten für beliebige Yj in Abhängigkeit von
den Linearkombinationen in den anderen Produktvariablen werden mit wachsendem δ größer. Damit werden die Differenzen 1 – ρ2j/m – j kleiner und somit die Quotienten (1 – ρ2j/m – j)–1
größer. Das heißt aber nicht anderes, als dass sich ein oder mehrere Produktvariablen sehr gut
durch andere darstellen lassen. Sind die zugehörigen multiplen Korrelationskoeffizienten groß
genug, dann sagt man, diese Produktvariablen sind redundant.
Beachtet man noch den dritten Fakt, dass die Längen der Hauptachsen des Hyperellipsoides
gleich Lj sind, mit
2
L j = 2 ⋅ λ j ⋅ χm
,1− α für j = 1,…m
wobei λj die Eigenwerte der Kovarianzmatrix ΣYY sind, dann sieht man, dass mit zunehmendem
Grad der Multikollinearität das Hyperellipsoid einer „Zigarre“ immer ähnlicher und zumindest
die 1. Hauptachse des Ellipsoides immer länger wird.
Ist der Grad der Multikolinearität δ = 1, dann sind die Produktvariablen nach der obigen
Beziehung unkorreliert und das Hyperellipsoid wird zu einer Hyperkugel.
Bei vielen Anwendungen ist für jede Produktvariable Yj, j = 1, …, m ein Toleranzintervall
gegeben. Inwieweit bei deren Festlegungen die Abhängigkeitsstruktur zwischen den Produktvariablen beachtet wurde, muss in jedem konkreten Fall hinterfragt werden. In der Regel wird
das nicht der Fall sein. In diesen Fällen müssen die Toleranzgrenzen aufgrund der statistischen
Kenntnisse über den Prozess zumindest überprüft, meist jedoch neu berechnet und mit den
Konstrukteuren abgestimmt werden. Sind die Toleranzgrenzen aus technischer Sicht bindend,
dann könnte das kartesische Produkt dieser Toleranzintervalle, das ist dann ein Hyperkubus für
den gemeinsamen Toleranzbereich, gebildet werden. Die Forderung der simultanen Erfüllung
aller relevanten Kundenanforderungen bedeutet geometrisch, dass das Hyperellipsoid mit
vorgebbarer Wahrscheinlichkeit in diesem Hyperkubus enthalten sein muss, d. h.
1316han05.indd 166
25.07.2006 11:39:00
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
m
⎡
⎤
−1
P ⎢(Y j − μ j )T ⋅ ΣYY
⋅ (Y j − μ j ) ∈ X (To, j − Tu, j )⎥ = 1 − α.
⎢⎣
⎥⎦
j =1
167
(5)
Die Frage ist nun,
5.2.1.4
Wie können unter der Bedingung (1) die Toleranzintervalle für jede
einzelne Produktvariable unter Beachtung der Abhängigkeitsstruktur
statistisch bestimmt werden?
So, dass das kartesische Produkt der einzelnen Toleranzintervalle die Bedingung (2) erfüllt.
Y2 (Produktvariable)
Y1 (Produktvariable)
Abb. 5.2.1: Toleranzgebiet und Streuungsellipse
Die Lösung dieses Problems ist:
Wie aus der Abbildung ersichtlich ist, müssen hier im 2-dimensionalen Fall die Tangenten an
die Ellipse, parallel zu den beiden Achsen der Produktvariable, bestimmt werden. Im m-dimensionalen Fall müssen die Tangentialhyperebenen an das Hyperellipsoid bestimmt werden.
Für diese Konstruktion ist das nachfolgende Theorem von ausschlaggebender Bedeutung.
Satz 1 (Jahn): Die Projektionen der Ellipse bzw. des Hyperellipsoides auf die Koordinatenachsen haben die Längen
Yj ≤
σ 2j / m − j = σ j / m − j ,
wobei σ2j/m – 1 die bedingte Varianz der j-ten Komponente von Y unter der Bedingung der
Konstanz der restlichen Komponenten des Vektors der Produktvariable ist, wobei m – j = m – 1
wieder die Indexmenge {1, …, j – 1, j + 1, …, m} bezeichnet.
Den Beweis für diesen überaus wichtigen Satz findet man auf der beiliegenden CD.
1316han05.indd 167
25.07.2006 11:39:00
168
5 Qualität in der Fertigung
Bemerkungen:
1. Das Theorem ist für die Berechnung der statistischen Toleranzgrenzen über die Momente
der bedingten Verteilung von Yj unter der Bedingung Ym – j = ym – j d. h. konstant, überaus
bedeutsam.
Korollar 1 (Jahn): Die oberen und unteren statistischen Toleranzgrenzen für die einzelnen,
nicht unabhängigen Produktvariablen können nach den Beziehungen
USL j = μ j +
2
2
χm
,1− α ⋅ σ j / m − j
LSL j = μ j −
2
2
χm
,1− α ⋅ σ j / m − j
berechnet werden, wobei χ2m,1 – α das 1 – α Quantil der Chi Quadrat Verteilung mit m
Freiheitsgraden ist.
2. Die statistischen Toleranzgrenzen USTL und LSTL (upper and lower tolerance limits)
beschreiben das “Können” des Prozesses. Diese Grenzen sind daher unbedingt mit den
Konstrukteuren abzustimmen.
Korollar 2 (Wang et. al[1999]): Die statistischen Toleranzgrenzen werden nach den Beziehungen
USL j = μ j +
χ2m,1− α ⋅ Det(SY−1−1.Y −1 )
−1
Det(SYY
)
= μj +
χ2m,1− α ⋅ Det(SYY )
Det(SY −1.Y −1 )
und
LSL j = μ j −
χ2m,1− α ⋅ Det(SY−1−1.Y −1 )
−1
Det(SYY
)
= μj −
χ2m,1− α ⋅ Det(SYY )
Det(SY −1.Y −1 )
berechnet.
Korollar 3 (Jahn):
Die bedingten Stichprobenvarianzen S2j/m – j können auch aus den Diagonalelementen der
inversen Kovarianzmatrix berechnet werden. Es gilt
−1
SYY
1316han05.indd 168
⎧ ⎡S 2j ⋅ (1 − R 2j / m − j )−1 = S-2
⎤
j / m − j , für j = 1, …, m ⎦
⎪⎣
⎪
S j ⋅ Sk ⋅ R j k / m − j ,k
= ⎨−
, für j ≠ k
1
⎪
2
2
2
⎪ ⎡⎣(1 − R j / m − j ) ⋅ (1 − Rk / m − k )⎤⎦
⎩
25.07.2006 11:39:00
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
169
Beispiel 5.2.2: Akkubohrschrauber. Statistische Tolerierung
Die Produktvariablen und der Sollzustand für dieses Beispiel sind in der Tabelle 5.2.1
zusammengestellt.
Tabelle 5.2.1: Sollzustand für die Plastikschalen
Parameter
Sollwert
Y1 = Thermoschrumpf
Y2 = Axialität
Y3 = Dicke
Y4 = Parallelität,
Toleranzgrenzen
1,1
0
3,1
0
Tu
To
0,2
–0,3
2,9
–0,6
2
0,3
3,3
0,6
Für die Berechnung der statistischen Toleranzgrenzen benötigen wir die Stichprobenkovarianzmatrix und deren Inverse. Beide Matrizen sind in Tabelle 5.2.2 und Tabelle 5.2.3
enthalten.
Tabelle 5.2.2: Kovarianzmatrix für die Produktvariablen
Thermoschrumpf
Axialit
Dicke
Parallel
Thermoschrumpf
Axialität
Dicke
Parallel
0,22495
0,00353
–0,00455
–0,10751
0,00353
0,04206
–0,00081
0,04239
–0,00455
–0,00081
0,00882
0,01654
–0,10751
0,04239
0,01654
0,24588
Axialität
Dicke
Parallel
Tabelle 5.2.3: Inverse Kovarianzmatrix
Thermoschrumpf
Thermoschrumpf
Axialit
Dicke
Parallel
62.301
–44.043
–42.555
37.697
–44.043
–42.555
37.697
334.037
173.955
–88.554
173.955
1.394.678
–142.413
–88.554
–142.413
82.002
Mit den Elementen der inversen Kovarianzmatrix kann man nach Korollar 1 die statistischen Toleranzgrenzen für die vier Produktvariablen berechnen. In der Tabelle 5.2.4 sind
die Werte zusammengestellt.
Tabelle 5.2.4: Sollwerte und statistische Toleranzgrenzen
Thermoschrumpf
Axialität
Dicke
Parallelität
Sollwert
±Toleranz
1,1
0
3,1
0
±1,62
±0,7
±0,34
±1,4
Mit den statistischen Toleranzgrenzen können wir die univariaten und multivariaten Prozessfähigkeitsindizes berechnen (vgl. Abschnitt 5.2.1.6 und 5.2.1.7).
1316han05.indd 169
25.07.2006 11:39:01
170
5 Qualität in der Fertigung
5.2.1.5
Wie kann man das „Produkt“ statistisch tolerieren?
Wir stellten bereits fest, dass ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen
Y1, …, Ym beschrieben wird.
Wir forderten auch schon, dass ein Prozess so gesteuert werden muss, dass simultan alle Kundenanforderungen erfüllt werden. Wir wissen auch, dass ein Prozess nur
• mit einer Einstellung der Input- und Prozessvariablen,
• mit einer optimalen Teilmenge von Input- und Prozessvariablen,
• entweder mit Blick auf eine Produktvariable oder einer geschickten Zusammenfassung
aller Produktvariablen gesteuerten werden kann und
• dass wir hierfür entweder den Sollwert und die Toleranzgrenzen für die eine Produktvariable oder die vereinigten Sollvorgaben für das „Produkt“ als Ziele für die Steuerung
benötigen.
Die vereinigten Sollvorgaben wollen wir Toleranzbereich für das Produkt nennen und deren
Grenze Toleranzgrenze für das Produkt (TGProd) nennen.
In dem Ausdruck Σ∗YY
⎛ To, j − Tu, j
*
ΣYY
= diag ⎜
6
⎝
⎞
⎛ To, j − Tu, j ⎞
⎟⎠ R YY diag ⎜⎝
⎟⎠
6
bezeichnen RYY die Abhängigkeitsstruktur und ToT = (To,1 … To,m) bzw. TuT = (Tu,1 … Tu,m) die
Vektoren der oberen bzw. unteren Toleranzgrenzen für alle relevanten Produktvariablen. Die
Korrelationsmatrix muss aus einer großen Stichprobe geschätzt werden.
Unter diesen Annahmen gilt
c* =
* −1
(To − M )T (ΣYY
) (To − M ) = TGProd .
TGProd ist die Toleranzgrenze für das Produkt T2, d. h. die über T2 zusammengefassten Produktvariablen. Die Toleranzgrenze (TGProd) für das Produkt hängt ab von
1. der Abhängigkeitsstruktur RYY – über die theoretische Kovarianzmatrix Σ*YY,
2. die Toleranzgrenzen für die einzelnen Produktvariablen und
3. den Vektor der Sollwerte.
Mit der berechneten Toleranzgrenze TGProd wird die simultane Erfüllung aller relevanten Kundenanforderungen geprüft. Die Gleichung für T2 ist auch bekannt als Mahalanobis Abstand.
5.2.1.6
Univariate Prozessfähigkeitsindizes
Was heißt „ein Prozess ist fähig“?
Die Fähigkeit ist das inhärente Potential eines Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren. Die Anwendung auf betriebliche Prozesse bedeutet,
• dass für eine, mehrere oder alle Produktvariablen Toleranzgrenze vorliegen, die den „vorgegebenen Eigenschaften“ entsprechen und
1316han05.indd 170
25.07.2006 11:39:01
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
171
• impliziert, dass geprüft werden kann, ob die produzierten Produkte den vorgegebenen
Eigenschaften entsprechen.
In der Folge werden wir uns ausführlich mit
• den univariaten und
• multivariaten Prozessfähigkeitsindizes
befassen.
Wie kann die Eigenschaft „ein Prozess ist fähig“ nachprüfbar formuliert und quantifiziert
werden?
Für die Beantwortung der Frage stellen wir zunächst alles zusammen, was uns bekannt ist. Die
Produktvariable sei Y. To und Tu seien die gegebenen Toleranzgrenzen und M sei der Sollwert.
Die Produktvariable Y sei normal verteilt mit dem geforderten Erwartungswert µ = Sollwert
= M und der zulässigen Standardabweichung
σ Zul =
To − Tu
.
6
Dieser Ausdruck ist das Ergebnis der 3 σ-Regel, die besagt, dass im Intervall µ – 3 σ ≤ Y ≤ µ + 3 σ
ca. 99.73 % aller Einzelwerte der vorausgesetzten Normalverteilung mit dem Erwartungswert
µ und der Standardabweichung σ liegen.
Die Produktion liefert Produkte an denen nach einer zufälligen Auswahl die Werte Yi, i = 1, …, N
gemessen werden, wobei N den Stichprobenumfang bezeichnet.
Es ist nun zu prüfen, ob die Stichprobe mit den spezifizierten Kundenanforderungen in Form
des Sollwertes und der Toleranzgrenzen übereinstimmt. Hierfür können statistische Hypothesentests verwendet werden.
• Die Nullhypothese H0: σ2 = σ2zul gegen die Alternative H1: σ2 ≠ σ2zul kann mit dem F-Test
σ2
(To − Tu )2
Fˆ = zul
=
σ2
36 ⋅ S 2
• und die Hypothese H0: µ = M gegen H1: µ ≠ M kann mit dem Abweichungstest
zˆ =
Y −M
σ zul
N − 1.
geprüft werden.
Die beiden Tests wurden formalisiert, so dass wir Ausdrücke für die univariaten Prozessfähigkeitsindizes erhalten.
Wie können Sie die univariate Prozessfähigkeitsindizes für eine Produktvariable berechnen?
Eine Produktvariable wird mit Y bezeichnet, deren Verhalten durch die Verteilungsfunktion
(Vf)Y ~ P(Y ≤ y) = F(y) oder falls sie existiert durch die Verteilungsdichte (Vd) f(y) charakterisiert wird. Durch die Prozessfähigkeiten wird beurteilt, ob die statistische Breite von f(y)
1316han05.indd 171
25.07.2006 11:39:01
172
5 Qualität in der Fertigung
vollständig oder nur z. T. innerhalb des Toleranzintervalls liegt. Die statistische Breite wird
nach der 3 σ-Regel berechnet.
Bevor wir eine Formel für den Vergleich zwischen der Toleranzbreite und Breite der Verteilungsdichte angeben, sollen noch einige wichtige Begriffe erläutert und präzisiert werden.
Häufig wird der Ausdruck, „der Prozess wird beherrscht“ verwendet und durch die Zeitinvarianz der Verteilung erklärt, wobei darauf hingewiesen wird, dass die zeitlichen Veränderungen
eine Verschiebung der Verteilung auf der Achse der Produktvariablen, eine Änderung der
Streuung oder eine Änderung der Form der Verteilung sein kann, siehe z. B. Rinne, Mittag
[1999]).
An dieser Stelle muss darauf hingewiesen werden, dass der Prozess zur Herstellung eines Produktes durch die Häufigkeitsverteilung einer Produktvariablen beurteilt werden soll. Das ist
nur bedingt möglich. Die Beherrschbarkeit eines Prozesses wird durch die folgende Definition
präzisiert.
Definition: Die Aufschlüsselung der Varianz der Produktvariablen Y durch die in der Prozessgleichung vorkommenden Input- und Prozessvariablen wird durch das Maß der Beherrschbarkeit gemessen.
Diese Definition ist notwendig, denn die Produktvariable Y ist Ergebnis des Wirkens eines
Prozesses, die Produktvariable ist eine Zufallsgröße und die Verteilung der Produktvariablen
kann nur nach dem Ursache-Wirkungs-Prinzip über die Veränderung der Input- und Prozessvariablen verändert werden. Ein beherrschter Prozess bedeutet, dass er so gesteuert werden
muss, dass alle spezifizierten Kundenanforderungen an das Produkt simultan erfüllt werden,
d. h. der Vektor der Mittelwerte der gemessenen Werte für die Produktvariablen Y1, …, Ym
muss im statistischen Sinne mit dem Vektor der Sollwerte M1, …, Mm übereinstimmen, die
Variabilität des Vektors der Produktvariablen muss so klein sein, dass die Verteilung innerhalb
des Toleranzbereiches liegt und die Verteilung muss zeitlich stabil bleiben, d. h. die Mittelwertvektoren und die Stichprobenkovarianzmatrizen zeitlich aufeinanderfolgender Stichproben
dürfen keinen Trend besitzen.
Für die Überprüfung der statistischen Beherrschbarkeit eines Prozesses müssen wir die Maße
der Beherrschbarkeit und die uni- und multivariaten Prozessfähigkeitsindizes berechnen.
Die uni- und multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten Potential
eines Prozesses, Produkte mit den durch die Toleranzgrenzen für alle relevanten Produktvariablen vorgegebenen Eigenschaften zu produzieren, werden als Entscheidungskriterium
für die Notwendigkeit der Prozessverbesserung im Sinne der Reduktion der Variabilität der
Produktvariablen und damit der Vergrößerung des Maßes der Beherrschbarkeit verwendet.
Die Maße der Beherrschbarkeit dienen ebenfalls für die Entscheidung zur Prozessverbesserung im Sinne der Suche nach weiteren Input- und Prozessvariablen, die die Variabilität der
Produktvariablen besser erklären.
Bei der Festlegung der CAD Toleranzgrenzen unterscheiden wir die Möglichkeiten, die in der
Abbildung dargestellt sind.
• Einseitige Tolerierung, d. h. es gibt nur eine obere To oder untere Tu Toleranzgrenze.
• Auf die Angabe des Sollwertes wird in diesen Fällen häufig verzichtet. Wir müssen prüfen,
ob das sinnvoll ist, denn der Sollwert wird als Zielwert für die Steuerung des Prozesses
benötigt.
• Zweiseitige Tolerierung. Hier müssen wir zwischen dem symmetrischen und unsymmetrischen Fall unterscheiden.
1316han05.indd 172
25.07.2006 11:39:01
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
173
Fall 1
Fall 2
Fall 3
Tu
Sollwert
To
Produktvariable Y
Abb. 5.2.2: Toleranzintervalle
Die Toleranz wird nun wie folgt definiert:
bei Vorgabe von To
⎧To − Sollwert,
⎪Sollwert − T ,
bei Vorgabe von Tu
u
⎪
⎪ To − Tu
bei Vorgabe von To und Tu
Δ=⎨
,
⎪ 2
⎪min{(Soll − Tu ),(To − Soll)}, bei gegebenen Tu und To und
⎪
asymmetrischer Tolerierung
⎩
Für den Toleranzbereich schreiben wir in der Regel [To, Tu] = To – Tu = 2 Δ.
Im symmetrischen Fall gilt
Sollwert =
To + Tu
= Toleranzmittelwert.
2
Zweiseitige Toleranzgrenzen – die Produktvariable ist normal verteilt
Der Sollzustand für die Produktvariable Y wird durch
• den Sollwert M und die
• Toleranzgrenzen
– Tu untere Toleranzgrenze
– To obere Toleranzgrenze
definiert.
Der Prozess sei optimal eingestellt. An zufällig ausgewählten Produkten wird die normal
verteilte Produktvariable Y gemessen. Die Messwerte sind Y1, …, YN, wobei N der Stichprobenumfang ist.
Visuell kann der Istzustand mit dem Sollzustand verglichen werden, indem man schaut, ob
die Häufigkeitsverteilung der Messwerte, wie die Durchmesser der gedrehten Welle in der
Abbildung 5.2.3, innerhalb der eingezeichneten Toleranzgrenzen liegt und der Mittelwert der
Wellendurchmesser im statistischen Sinne mit dem Sollwert übereinstimmt. Bei der Welle in
1316han05.indd 173
25.07.2006 11:39:01
174
5 Qualität in der Fertigung
Häufigkeiten
Tu
To
Sollwert
50
40
-3s
30
+3s
20
10
0
19.8
19.9
20
20.1
20.2
Wellendurchmesser [mm]
Abb. 5.2.3: Häufigkeitsverteilung der Durchmesser einer Welle
Abbildung 5.2.3 liegt die ±3 S Breite der Häufigkeitsverteilung vollständig im Toleranzintervall.
Die univariate Prozessfähigkeit als Quotient der Toleranzbreite zur Breite der Häufigkeitsverteilung muss größer als 1 sein. Es wird kein Ausschuss produziert. Der Sprachgebrauch „im
statistischen Sinn“ soll jeweils deutlich machen, dass wir es mit stochastischen Sachverhalten
zu tun haben. Hieraus folgt, dass alle Aussagen mit einer Unschärfe versehen sind, die der
Streuung von Variablen adäquat sind.
Der zahlenmäßige Vergleich zwischen dem Soll- und Istzustand basiert auf einem Charakterisierungssatz, nach dem eine Normalverteilung vollständig durch den Mittelwert y
und die Standardabweichung s beschrieben wird. Die Schätzfunktionen y für den Erwartungswert und s2 für die Varianz sind unabhängig voneinander. Nach der 3 σ-Regel erhält
man mit der Irrtumswahrscheinlichkeit α = 0.0027 die Breite der Häufigkeitsverteilung
y + 3 ⋅ s − [ y − 3 ⋅ s] = 6 ⋅ s .
Die einfache Prozessfähigkeit Cp (siehe Bhote [1990], Omnias [1992], Rinne, Mittag [1999])
vergleicht die Sollbreite (To – Tu) mit der Breite 6 · s der Häufigkeitsverteilung:
Cp =
Toleranzbreite
was der Kunde fordert To − Tu
=
=
Breite der Häufigkeitsverteilung
was der Kunde erhält
6⋅s
(1)
Wenn Cp < 1, dann ist die Breite der Häufigkeitsverteilung größer als die Toleranzbreite.
Produkte mit Werten für den Produktvariable, die nicht den Anforderungen genügen sind
die Folge.
Wenn Cp > 1, dann ist die Breite der Häufigkeitsverteilung kleiner als die Toleranzbreite, d. h.
die Häufigkeitsverteilung passt vollständig in das Toleranzintervall.
Aber trotzdem kann Ausschuss produziert werden. Das liegt daran, dass bisher nur das
Streuverhalten des Produktes mit der Toleranzbreite verglichen wurde. Nach dem Charakterisierungssatz muss in diesen Vergleich die Abweichung zwischen dem Soll- und Mittelwert
einbezogen werden. Hierzu muss der Korrekturfaktor
1316han05.indd 174
25.07.2006 11:39:02
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
k=
y−M
1
⋅ (To − Tu )
2
175
(2)
berechnet werden, mit dem Cp zu
Cpk = (1 – k) Cp
(3)
korrigiert wird. Diese Darstellung setzt voraus, dass der Sollwert in der Mitte des Toleranzintervalls liegt und bewertet die Abweichungen vom Sollwert.
Ist Cpk < 1, dann wird Ausschuss produziert, der Prozess muss verbessert werden, siehe Juran
[1990]. Ist Cpk > 1, dann genügen die Produkte der durch den Sollwert und die Toleranzgrenzen
spezifizierten Anforderung.
Welche Entscheidungen aufgrund der univariaten Prozessfähigkeitsindizes können Sie treffen?
Die besprochenen möglichen Entscheidungen aufgrund der Prozessfähigkeiten werden durch
die Abbildung 5.2.4 visualisiert.
Damit kann man sagen, die Fähigkeit beschreibt das inhärente Potential eines Prozesses, Produkte oder Dienstleistungen zu produzieren, die spezifizierten Anforderungen genügen.
Daten
Tu
M
T
o
T
u
M
T
o
T
u
M
T
Cp ≤ 1
Cp > 1
Cp > 1
Cpk ≤1
Cpk < 1
Cpk > 1
Prozessverbesserung
oder Überprüfung der
Tolerierung
Reduktion der
Streuung
o
SPC
Justierung
Abb. 5.2.4: Entscheidungen aufgrund der Prozessfähigkeiten
Beispiel 5.2.3: Wellendurchmesser. Univariate Prozessfähigkeit
Eine zu drehende Welle soll den Solldurchmesser M = 12.5 [mm] und die Toleranzen
Tu = 12.35 [mm] und To = 12.65 [mm] haben. Eine Stichprobe von N = 130 Wellen ergab
die statistischen Maßzahlen
Y = 12,499 [mm] und s = 0,05012 [mm].
1316han05.indd 175
25.07.2006 11:39:02
176
5 Qualität in der Fertigung
Setzt man diese Größe in die Formeln für die Prozessfähigkeitsindizes ein, dann erhält
man
Cp = 1,00, k = –0,01 und Cpk = 0,99.
Die Häufigkeitsverteilung liegt vollständig im Toleranzintervall, darf aber nicht hin- und
herbewegen. Nach der Abbildung 5.2.4 muss der Prozess verbessert werden, um zu garantieren, dass kein Ausschuss produziert wird.
Bemerkung zu den univariaten Prozessfähigkeitsindizes
Die univariaten Prozessfähigkeitsindizes besitzen die äquivalente Darstellung
Cp =
To − Tu
6S
und
⎧ T − Y Y − Tu ⎫
Cpk = Min ⎨ o
,
⎬ = Min {Clo , Cpu },
3S ⎭
⎩ 3S
wobei Cpo die Prozessfähigkeit für die obere und Cpu für die untere einseitige Toleranzgrenze
bezeichnen.
Diese Darstellung bewertet eindeutig die Abweichungen von den Toleranzgrenzen und ist
insbesondere dann zu empfehlen, wenn die Streuung der Produktvariablen sehr groß ist, oder
die Verteilung der Werte der Produktvariablen nahe bei einer Toleranzgrenze liegt.
Sind Rückschlüsse von den Fähigkeiten auf den Ausschussanteil möglich?
Bei der Antwort auf diese Frage sind einige Aspekte zu beachten.
Prozessfähigkeiten und Verlustfunktion
Die ökonomischen Kennzahlen werden über die Verlustfunktion bewertet, wobei der ökonomische Verlust einer produzierten Einheit durch den Abstand seines Wertes für die Produktvariablen vom Sollwert entsteht. Der erwartete Verlust ist dann im Grunde genommen eine
Kennzahl für die Fähigkeit.
Erste Hinweise auf diese Problematik finden sich bereits bei den British Standards 2564 aus
dem Jahre 1955 und bei Juran [1974] in seinem Quality Control Handbook.
L(y)
1
Tu
Sollwert To
Y
Abb. 5.2.5: Verlustfunktion
1316han05.indd 176
25.07.2006 11:39:02
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
177
Um diese Zusammenhänge zu verdeutlichen, betrachten wir zunächst einmal den Ausschussanteil p.
Zu p gehört die binäre Verlustfunktion
⎧0, für Y ∈ [To − Tu ]
L( y ) = ⎨
⎩1, für Y ∉ [To − Tu ]
Diese Verlustfunktion ist ein Sprungfunktion. Das zeigt die Abbildung 5.2.5.
Besitzt Y die Vd f(y) und die Vf F(y), dann erhält man den erwarteten Verlust
∞
E [L(Y )] =
∫ L( y) ⋅ f ( y) dy
−∞
=
∫
0 ⋅ f ( y ) dy +
y ∈TB
∫
1 ⋅ f ( y ) dy
y ∉TB
= P (Y ∉ TB) =: p
wobei [To – Tu] =: TB.
Für die zweiseitige Betrachtung erhält man
p = 1 – P(Tu ≤ Y ≤ To) = 1 – F(To) + F(Tu) = po + pu.
Für die einseitige Betrachtung erhält man
p = P(Y > To) = 1 – F(To)
bzw.
p = P(Y < Tu) = F(Tu).
Diese Betrachtung über die traditionelle Verlustfunktion hat wesentliche Nachteile. Zum einen
drückt sie nur den Verlust des Produzenten aus, obwohl der Konsument natürlich ebenfalls
durch die nicht zielwertkonformen Produkte Verluste erleidet. Zum anderen ist der Verlauf
dieser Verlustfunktion in keiner Weise plausibel. Betrachten wir z. B. ein Produkt, dessen Wert
für die Produktvariable in unmittelbarer Nähe der oberen oder unteren Toleranzgrenze, aber
noch innerhalb des Toleranzintervalls liegt, so wird der Verlust mit 0 bewertet. Für einen anderen Wert, der sich vom vorangegangenen nur ganz wenig unterscheidet, aber außerhalb des
Toleranzbereiches liegt, wird der Verlust 1 angenommen.
Taguchi hat diesen Missstand durch die Einführung der quadratischen Verlustfunktion korrigiert. Danach ist ein Produkt umso besser, je näher der Wert seines Produktvariables am
Sollwert liegt. Je größer die Differenz zwischen Soll- und Istwert ist, desto größer ist der Verlust
über die gesamte Lebenszeit des Produktes.
Für die zweiseitige Tolerierung lautet die Taguchi-Verlustfunktion
LT (y) = c (y – MY)2,
wobei MY der Sollwert für die Produktvariable Y und c ein Proportionalitätsfaktor sind. Analog
kann man die Verlustfunktion für einseitige Tolerierung aufschreiben.
1316han05.indd 177
25.07.2006 11:39:02
178
5 Qualität in der Fertigung
Für den Erwartungswert der Verlustfunktion – das Risiko – erhält man mit der Vd f(y)
∞
E [L( y )] =
∫
∞
c ⋅ ( y − M y )2 ⋅ f ( y ) dy = c ⋅
−∞
∫ [( y − μ y ) + (μY
− M Y )]2 f ( y ) dy
−∞
∞
∞
∞
⎪⎧
⎪⎫
= c ⋅ ⎨ ∫ ( y − μY )2 f ( y ) dy + 2 ⋅(μY − M Y )⋅ ∫ ( y − μY )⋅ f ( y ) dy + (μY − M Y )2 ⋅ ∫ f ( y ) dy ⎬
⎪⎩ −∞
⎪⎭
−∞
−∞
= c ⋅ {σ 2 + (μY − M Y )2 }
Das ist der bekannte mittlere quadratische Fehler (engl. mean square error), der z. B. für die
Güte einer Schätzfunktion verwendet wird. Der Term (µY – MY)2 ist der quadratische Bias.
Damit werden die zwei Hauptaufgaben aus der Abbildung zur Entscheidung mit den Prozessfähigkeiten noch einmal verdeutlicht. Der Bias gibt die Abweichung des Mittelwertes vom
Sollwert an. Ist ein Bias vorhanden, dann muss der Prozess neu zentriert werden, sodass diese
Abweichung null wird. Ist die Streuung so groß, dass die „Schwänze“ der Verteilung über die
Toleranzgrenzen hinausragen, dann muss der Prozess so verbessert werden, dass die Streuung
kleiner wird.
Prozessfähigkeit nach Taguchi auf der Grundlage der Verlustfunktion
Nach Rammelmüller [1993] und Taam [1993] können die univariaten Prozessfähigkeitsindizes
auch wie folgt geschrieben werden
Cpm =
To − Tu
6 S 2 + (Y − M )2
=
To − Tu
6S
1
M )2 ⎤ 2
⎡
(Y −
⎢1 +
S2
⎣
=
Cp
D
⎥
⎦
wobei
1
⎡
(Y − M )2 ⎤ 2
D = ⎢1 +
⎥
S2
⎣
⎦
die Abweichung des Mittelwertes der Werte für die Produktvariable vom Sollwert M misst.
Beispiel 5.2.4: Wellendurchmesser. Prozessfähigkeit nach Taguchi
Verwenden Sie die Angaben für den Soll- und Istzustand von oben und setzen diese Werte
in die Formeln für die Taguchi Fähigkeiten ein, dann erhalten Sie die Werte D = 1.000199
und Cpm = 0,9998. Diese Werte stimmen mit den Werten von oben überein. Damit ist auch
die zu fällende Entscheidung dieselbe.
Welche Schlüsse können Sie aus den verschiedenen univariaten Prozessfähigkeitsindizes für
die praktische Anwendung ziehen?
Cp beschreibt das Verhältnis von Spezifikationsbreite zur Breite der Verteilung der Messwerte für
die Produktvariable. Je größer Cp wird, desto weniger streuen die Werte für die Produktvariable.
Bei Cp = 1 stimmt die 6 s Breite der Häufigkeitsverteilung mit der Toleranzbreite überein.
1316han05.indd 178
25.07.2006 11:39:02
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
179
Cpk wächst für jedes konstante σ linear mit der Annäherung des Mittelwertes Y an den Sollwert.
Das heißt aber, ein Mittelwert Y nahe beim Sollwert wird genauso bewertet wie ein Mittelwert
nahe einer der Toleranzgrenzen. Daraus folgt für die Anwendung, dass ein großer Cpk-Wert
mitunter zu wenig über die Zentriertheit des Prozesses aussagt.
Cpm beinhaltet sowohl die Streuung der Produktvariablen, wie auch die Zentriertheit (Y − M )
der Verteilung der Produktvariablen auf den Sollwert. Cpm = 1 besagt, dass Y innerhalb der mittleren Drittels von (To – Tu) liegt. Hieraus folgt, der Index Cpk sollte durch Cpm ersetzt werden.
Das ist ein positiver Beitrag zur Diskussion, welcher Philosophie bei der Kontrolle von Prozessen zu folgen ist,
• dem Nachweis der Erfüllung der spezifizierten Kundenanforderungen oder
• der Erfüllung gewisser statistischer Gesetzmäßigkeiten.
Im Kapitel 6 wird diese Diskussion noch einmal aufgegriffen.
Prozessfähigkeit und Ausfallrate
Wir betrachten nur die univariate Produktvariable Y mit dem Sollzustand M = Sollwert und
der unteren Tu und oberen To Toleranzgrenze.
[To – Tu] ist das Toleranzintervall. Falls der Wert Yi eines Produktes für die Produktvariable
Y innerhalb des Toleranzintervalls liegt, d. h. falls Yi ∈ [To – Tu], dann sagen wir das Produkt
ist konform zur Spezifikation. Wenn Yi ∉ [To – Tu], dann sagen wir, das Produkt ist nicht
konform zur Spezifikation.
Die Wahrscheinlichkeit dafür, dass ein Messwert Yi, i = 1, …, N von Y außerhalb der Toleranzgrenzen liegt, ist
p = 1 – F(To) + F(Tu).
Die Fähigkeit des Prozesses ist eine Funktion der Ausfallrate, d. h.
p = P (Y ∈ [To − Tu ]) = 1 −
∫
f ( y ) dy .
[To −Tu ]
Prozesse mit kleinem p werden fähig genannt. Wie klein p sein muss, um einen Prozess als
fähig zu charakterisieren ist das Anliegen des Qualitätsverantwortlichen des Unternehmens. In
der Praxis hat sich die Forderung p < 0.0027 für fähige Prozess bewährt. Es muss aber darauf
verwiesen werden, dass eine solche Forderung von den Herstellungskosten abhängig ist und
daher nur akademischen Charakter hat.
Setzen wir noch voraus, dass Y ~ N (µ, σ2) gilt, dann erhalten wir für das einseitig nach oben
begrenzten Toleranzintervall
∞
po = P (Y > To ) =
2
⎪⎧ ( y − μ) ⎪⎫
exp
−
⎨
⎬ dy .
∫
2 σ 2 ⎭⎪
⎩⎪
To σ 2 π
1
Hierfür können wir nach der Standardisierung der Zufallsgröße Y und deren Toleranzgrenzen
auch schreiben
T − μ⎞
⎛
po = P ⎜ Z > o
⎟=
⎝
σ ⎠
∞
⎛ To − μ ⎞
⎛ μ − To ⎞
⎟ = Φ ⎜⎝
⎟.
ω ⎠
σ ⎠
∫ Φ(z) dz = 1 − Φ ⎜⎝
T −μ
o
σ
1316han05.indd 179
25.07.2006 11:39:03
180
5 Qualität in der Fertigung
Hieraus folgt,
po = 1 – Φ (3 Cpo) = Φ (–3 Cpo).
Ein analoger Ausdruck ist der Ausschussanteil bei dem einseitig unten begrenzten Toleranzintervall.
Das p ist nun leider unbekannt. Daher betrachten wir für eine Stichprobe die Schätzung
1
Fˆ ( y ) =
N
N
∑ I (Yi
< y)
i =1
für unbekannte Verteilungsfunktion F, wobei I (Yi < y) die Indikatorfunktion
⎧1, falls Yi < y
I (Yi < y ) = ⎨
⎩0, falls Yi ≥ y
bezeichnet.
Damit erhalten wir
1
pˆ = 1 − Fˆ (To ) + Fˆ (Tu ) = 1 −
N
N
∑ I (Tu
i =1
≤ Yi ≤ To )
und die Schätzungen
⎛T − Y ⎞
⎛ Y − Tu ⎞
p = 1 − Φ ⎜ o
+Φ⎜
⎟
⎝ s ⎠
⎝ s ⎟⎠
bzw.
⎛T − Y ⎞
⎛T − Y ⎞
, p To = Φ ⎜ o
p Tu = Φ ⎜ u
⎝ s ⎟⎠
⎝ s ⎟⎠
und
p = p Tu + p To .
Damit können wir für den Prozessfähigkeitsindex schreiben
⎛ Y − Tu
Cpk = min ⎜
⎝ s
⎞ ⎛ To − Y ⎞ 1
−1
−1
⎟⎠ , ⎜⎝ s ⎟⎠ = 3 min {−Φ ( p Tu ), Φ ( p To )} .
Beispiel 5.2.5: Fähigkeiten und Ausfallrate
Y ~ N(0, σ2). Der Sollzustand für diese Produktvariable ist
Sollwert M = 0,
Tu = –0,3
To = 0,3.
Da s und p unbekannt sind, ziehen wir eine Stichprobe vom Umfang N = 113.
Mit den Werten dieser Stichprobe berechnen wir den Mittelwert = 0,00968 und die Standardabweichung s = 0,20509.
Damit berechnen wir die statistischen 3 s-Grenzen [–0,605596, 0,624958].
Die univariaten Prozessfähigkeitsindizes sind Cp = 0,49, k = 0,03 und Cpk = 0,47.
1316han05.indd 180
25.07.2006 11:39:03
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
181
Damit gilt
To − Y
0,3 − 0,00968
=
= 1,415
s
0,20509
und
Y − Tu
0,00968 − (−0,3)
=
= 1,51
s
0,20509
Aus einer Tafel mit den Werten der standardisierten Normalverteilung erhalten wir für
diese beiden Zahlen die Werte
F(1,42) = 1 – 0,92219 = 0,0778
und
F(1,51) = 1 – 0,934478 = 0,0655.
Oberhalb der oberen Toleranzgrenze To liegen 7,78 % aller Einzelwerte und unterhalb der
unteren Toleranzgrenze liegen 6,55 % der Werte.
Zusammenfassend können sagen, bei der univariaten Prozessfähigkeit Cpk = 0,47 liegen ca.
14,3 % aller Werte außerhalb der Toleranzen.
Bei einer Prozessfähigkeit Cpk = 0,8 lägen nur noch ca. 1,4 % außerhalb der Toleranzgrenzen.
Hieraus lesen wir ab, dass die Vergrößerung der Prozessfähigkeit um ca. 58 % eine Verringerung des Ausschusses von ca. 90 % zur Folge hat.
Beispiel 5.2.6: Wellendurchmesser. Ausfallrate
Die Prozessfähigkeit Cp = 1 zeigt, dass kein Messwert für die gefertigten Wellen außerhalb
des Toleranzintervalls liegt, d. h. die Anteil der Messwert oberhalb der oberen Toleranzgrenze
ist null und der Anteil der Messwerte unterhalb von Tu ist ebenfalls null.
Wenn wir allerdings diese Anteile nach obiger Formel schätzen, dann erhalten wir die
Werte:
• geschätzter Anteil oberhalb der oberen Toleranzgrenze ist 1296 [ppm]
• geschätzter Anteil unterhalb der unteren Toleranzgrenze ist 1472 [ppm]
Zusammen ergibt das einen Anteil außerhalb des Toleranzintervalls von 2768 [ppm].
Voraussetzungen für die Durchführung von Fähigkeitsnachweisen
Wie jedes mathematische oder mathematisch statistisches Verfahren ist die Durchführung von
Prozessfähigkeitsnachweisen an Voraussetzungen geknüpft. Diese betreffen
•
•
•
•
•
die Fähigkeit des Mitarbeiters,
die Fähigkeit des Messprozesses,
die Fähigkeit der Prozesse, Maschinen und Anlagen,
Verteilung der Produktvariablen,
die Prozessbeherrschung.
1316han05.indd 181
25.07.2006 11:39:03
182
5 Qualität in der Fertigung
Wenn Sie die Fähigkeit des Messprozesses oder der Maschinen untersuchen wollen, verweise
ich Sie auf das Buch von Rinne, Mittag [1999]. Dort werden diese Verfahren sehr ausführlich
beschrieben.
Wenn Sie Hypothesen über die zugrunde liegende Verteilung der Produktvariablen Y prüfen
wollen, verweise ich Sie auf die einschlägigen Bücher über die univariate Statistik von Schwarze
[1997], Lehnen, Wegmann [1985], Rinne, Mittag [1999] u. a.
In der Literatur, so z. B. auch bei Rinne und Mittag, wird auf die Bedeutung der Stabilität der
„Verhältnisse in der Produktion“ hingewiesen und erklärt, dass damit die zeitliche Konstanz
der Verteilung der Produktvariablen gemeint ist.
Braucht man die Stabilität für die Interpretation der Prozessfähigkeitsindizes?
Ich meine nicht, denn die Stabilitätsanforderung müsste vor der Fähigkeitsanalyse überprüft
werden. Erst nachdem nachgewiesen wurde, dass ein Prozess fähig ist, sollten Regelkarten
eingeführt werden. Andererseits wird behauptet, die Stabilität mit Regelkarten nachzuweisen.
Das sieht aus, wie eine Katze, die sich in den Schwanz beißt.
Die Toleranzgrenzen liegen fest. Jedes Produkt, dessen Wert für die Produktvariable außerhalb
des Toleranzintervalls liegt, ist Ausschuss. Der Grund, warum das Produkt Ausschuss ist, ist
zwar interessant, aber erst bei der Ursachenforschung und nicht bei der Definition der Fähigkeiten. Der Begriff Stabilität sorgt immer wieder für Irritationen, so z. B. in den Arbeiten von
Stark [1999] und Kaiser, Nowack [1999]. In diesen Arbeiten will man neue Gesichtspunkte
für die univariaten Fähigkeitsberechnungen und Kontrollkartentechniken ableiten, lässt aber
die spezifizierten Kundenanforderungen außer acht und bezieht nur statistische Aspekte ein.
Das ist nicht zulässig.
Können wir auch univariate Prozessfähigkeitsindizes berechnen, wenn die Produktvariable
nicht normal verteilt ist?
Ja. Wir betrachten als Benchmark den Fall, die
Produktvariable Y ist binomial verteilt.
Die Produktvariable Y kann nur zwei verschiedene Werte annehmen, z. B.
⎧0, wenn das Produkt n. i. O.
Y =⎨
⎩1, wenn das Produkt i. O.
wie z. B. bei der Wareneingangsprüfung.
Die Wahrscheinlichkeiten für diese beiden Fälle seien P(Y = 0) = p und P(Y = 1) = 1 – p. Die
Ausschusswahrscheinlichkeit p ist unbekannt und wird mit einer Stichprobe von N Werten,
die ja nur 0 oder 1 sein können, bestimmt.
Die Wahrscheinlichkeit dafür, dass in der Stichprobe vom Umfang N k Produkte defekt sind,
ist durch die folgende Formel gegeben,
⎛N
⎞ ⎛N ⎞
P ⎜ ∑ yi = k ⎟ = ⎜ ⎟ pk ⋅ (1 − p)N − k
⎝ i =1
⎠ ⎝k⎠
wobei k zwischen 0 und N liegt.
1316han05.indd 182
25.07.2006 11:39:03
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
183
Die Häufigkeiten für die verschiedenen k, d. h. für k = 0, k = 1, … werden durch die Häufigkeitsverteilung visualisiert und durch das Einzeichnen des Sollwertes p und der Toleranzgrenzen
pu und po mit dem Sollzustand verglichen. Die Binomialverteilung wird ebenfalls vollständig
durch den Mittelwert
Y = pˆ und die Standardabweichung s =
pˆ (1 − pˆ )
N
charakterisiert. Damit können die obigen Formeln 1, 2 und 3 zur Berechnung der Prozessfähigkeitsindizes verwendet werden. Man erhält
Cp =
pˆ − p
po − pu
, k=
und Cpk = (1 − k) ⋅ Cp .
1
6⋅s
( po − pu )
2
Wir betrachten noch den etwas selteneren Fall,
die Produktvariable Y ist nach Poisson verteilt.
Bei dieser Verteilung sind Mittelwert und Standardabweichung gleich, d. h. es gilt Y = λ und
s = λ . Hiermit sind wiederum die Formeln 1, 2 und 3 von oben anwendbar.
Müssen Sie etwas über die Verteilungen der Prozessfähigkeitsindizes wissen?
Ja, denn die univariaten Prozessfähigkeitsindizes sind Zufallsgrößen. Das wird deutlich, wenn
Sie beachten, dass diese von Y und s abhängen. Y und s sind aber Zufallsgrößen, denn diese
hängen wiederum nur von den Stichprobenwerten Y1, …, YN ab.
Aus der Verteilung der Prozessfähigkeitsindizes können Sie die Konfidenzintervalle für die
Indizes berechnen.
Wozu benötigen Sie die Konfidenzintervalle für die Prozessfähigkeitsindizes?
Die Prozessfähigkeitsindizes sind Zufallsgrößen. Sie schwanken von Stichprobe zu Stichprobe,
obwohl die Produktionsbedingungen gleich sind. Ist die ursprüngliche Streuung groß, so kann
das zu Fehlentscheidungen führen. Daher wollen wir Ihnen mit den Konfidenzintervallen ein
Instrument in die Hand geben, um die Unsicherheit zu quantifizieren.
Für die Ableitung der Konfidenzintervalle benötigen wir die Verteilung der Indizes. Um diese
berechnen zu können, fasse ich die bisherigen Ergebnisse zusammen.
Unter der Voraussetzung Y ∼ N (μ, σ2) gilt
⎛ σ2 ⎞
1. Y ∼ N ⎜ μ,
⎟ , wobei N der Stichprobenumfang ist
⎝ N⎠
2.
(N − 1) ⋅ s 2
σ2
∼ χ2 , falls Y1, …, YN unabhängig nach N (0, 1) verteilt sind
3. Y und s2 sind unabhängig voneinander verteilt und
1316han05.indd 183
25.07.2006 11:39:04
184
5 Qualität in der Fertigung
Y −μ
σ
4.
⋅ N
=
(N − 1) ⋅ s
(N − 1) ⋅ σ2
2
Y −μ
s
⋅ N ∼ t N −1
5. Konfidenzintervall für σ2 ist durch
(N − 1) ⋅ s 2
χ2
1−
≤ σ2 ≤
(N − 1) ⋅ s 2
χ2α
α
2
2
gegeben. Daraus folgt
(N − 1) ⋅ s 2
χ2R
≤ σ2 ≤
(N − 1) ⋅ s 2
χ2L
,
wobei R den rechten Schwanz und L den linken Schwanz der χ2-Verteilung bezeichnen.
Beweise: siehe z. B. Schmetterer [1956, S 131].
In
Cp =
To − Tu
6⋅s
sind To und Tu fest. Nur s ist eine Zufallsgröße. Damit erhält man für Cp das Konfidenzintervall:
Cp ≤ κ p ≤ Cp
mit
Cp = Cp ⋅
1
1
und Cp = Cp ⋅
bu
bo
wobei
bo,α =
N −1
χ2
N −1,1−
bu,α =
N −1
χ2
N −1,
κp =
α
2
α
2
To − Tu
6⋅σ
In ähnlicher Weise kann man ein Konfidenzintervall für Cpk berechnen. Ausgangspunkt ist die
Darstellung von Cpk in der Form
1316han05.indd 184
25.07.2006 11:39:04
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
Cpk
185
1
⋅ (To − Tu ) − Y − M
⎧ To − Y Y − Tu ⎫ 2
= Min ⎨
,
=
.
⎬
3⋅s ⎭
3⋅s
⎩ 3⋅s
Die Konfidenzintervalle für µ und σ2 sind:
s ⋅t
Y −
N −1,
s ⋅t
α
2
≤μ≤Y +
N
N −1,
α
2
N
und
(N − 1) ⋅ s 2
(N − 1) ⋅ s 2
≤ σ2 ≤
χ
χ
α
α
N −1,1−
N −1,
2
2
Indem man die Konfidenzintervalle für µ und σ2 in die Formel für Cpk einsetzt, erhält
man das Konfidenzintervall für Cpk mit der unteren Intervallgrenze Cpk
t
1
⋅ (To − Tu ) − Y −
2
Cpk =
3⋅s⋅
N −1,
N
N −1
χ2 α
N −1,
α
2
⋅s
−M
.
2
Zur Abkürzung setzen wir
t
aα :=
bo.α =
N −1,
α
2
N
,
N −1
χ2
N −1,1−
α
2
und
bu,α =
N −1
χ2
N −1,
α
2
Damit erhält man
Cpk
1
1
⋅ (To − Tu ) − Y − M − aα ⋅ s
⋅ (To − Tu ) − Y − M
aα
2
=
= 2
−
3 ⋅ s ⋅ bu,α
3 ⋅ s ⋅ bu,α
3 ⋅ bu,α
= Cpk ⋅
1316han05.indd 185
1
bu,α
−
3 ⋅ Cpk − aα
aα
.
=
3 ⋅ bu,α
3 ⋅ bu,α
25.07.2006 11:39:04
186
5 Qualität in der Fertigung
Analog erhält man für die obere Intervallgrenze Cpk
Cpk =
3 ⋅ Cpk + aα
3 ⋅ bo,α
so dass
3 ⋅ Cpk + aα ⎞
⎛ 3 ⋅ Cpk − aα
P⎜
≤ κ pk ≤
= 1 − α.
3 ⋅ bo,ε ⎟⎠
⎝ 3 ⋅ bu,ε
Beispiel 5.2.7: Akkubohrschrauber. Konfidenzintervalle für Cp und Cpk
Die Sollvorgaben für die Produktvariable Y2 Produktvariable sind
M2 = 0
[mm]
Tu,3 = –0.3
[mm]
To,3 = 0.3
[mm]
Aus der Stichprobe von N = 113 vermessenen Gehäusen erhält man die statistischen Maßzahlen für den Istzustand
Y2 = 0.0099 [mm]
s2 = 0.204 [mm]
Damit erhält man
Cp =
k=
0.6
= 0.49
6 ⋅ 0.204
0.0099
= 0.033
0.3
Cpk = 0.474.
Die Konfidenzintervalle zu Cp und Cpk sollen für die Irrtumswahrscheinlichkeit α = 0.05
bestimmt werden. Dazu muss man die Koeffizienten aα und bo,α und bu,α berechnen.
t
aα =
α
2
N −1,
N
=
1.9814
113
= 0.18639
mit
t112,0.025 = 1.9814
und
bo,α =
N −1
χ
2
N −1,1−
=
α
2
112
= 0.92998
129.5
und
bu,α =
1316han05.indd 186
N −1
χ
2
N −1,
α
2
=
112
= 1.22842
74.22
25.07.2006 11:39:05
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
187
mit
2
χ112,0.975
= 129.5
2
χ112,0.025
= 74.22
Damit erhält man
P (Cp ≤ κ p ≤ Cp ) = 1 − α
P (0.3989 ≤ κ p ≤ 0.5268) = 0.95
und
P (Cpk ≤ κ pk ≤ Cpk ) = 1 − α
P (0.335 ≤ κ pk ≤ 0.577) = 0.995
Die berechneten Prozessfähigkeiten und deren Konfidenzintervalle zeigen, dass der Prozess
zur Herstellung der Plastikschalen verbessert werden muss.
Zusammenstellung der Eigenschaften des univariaten Prozessfähigkeitsindizes Cp
• Der einfache Prozessfähigkeitsindex Cp ist eine streng monoton fallende Funktion von σ.
• Die Funktion Cp ist konvex, d. h.
dC p
dσ
=−
To − Tu
6⋅σ
2
=−
1
Cp
σ
Die grafische Darstellung von Cp ist in der Abbildung 5.2.6 enthalten
5
Cp j
0.33333
0.2
sj
3
Abb. 5.2.6: Cp in Abhängigkeit von σ
Die Elastizität der Funktion Cp wird nach der Beziehung
dC p
η (Cp ) =
1316han05.indd 187
Cp
= −1
dσ
σ
25.07.2006 11:39:05
188
5 Qualität in der Fertigung
berechnet. Dieser Ausdruck bedeutet, Cp ist isoelastisch, d. h. eine Vergrößerung von σ um 1 %
führt zu einer Verkleinerung von Cp von 1 %.
• Die Anforderung an Cp lautet nach Montgomery [1996], S. 446 Cp > 1.33.
• Die Aussagen über Cp betreffen die Verbindung zum Gutanteil der Produktion oder zur
Ausschussquote. Diese können erst nach der Korrektur mit dem Korrekturfaktor k formuliert werden, da eine Verteilung, insbesondere die Normalverteilung, durch die beiden
Momente Mittelwert und Standardabweichung vollständig charakterisiert wird.
• Die Schätzfunktion für Cp, hier mit Ĉp bezeichnet, ist
T − Tu
Cˆ p = o
6⋅s
• Die Verteilung von Cp ist unter der Annahme Y ~ N(μ, σ2) eine χ2N – 1 Verteilung mit
N – 1 FG. Die Schätzfunktion Ĉp ist asymptotisch erwartungstreu und MSE-konsistent
• Das Konfidenzintervall für Cp ist
⎛⎧
⎜ ⎪⎪
P ⎜ ⎨Cˆ p ⋅
⎜⎪
⎜⎝ ⎪
⎩
χ2
N −1,
α
2
N −1
⎫⎞
⎪⎪ ⎟
⎬⎟ = 1 − α
N − 1 ⎪⎟
⎪⎭ ⎟⎠
χ2
≤ Cp ≤
N −1,1−
α
2
• Ein Test zur Prüfung der Hypothese H0: C p ≤ C p0 gegen die Alternative H1: C p > C p0 ist
χ2 = Cp0 ⋅
N −1
χ
2
N −1,1−
α
2
Die Hypothese H0 bedeutet, der Prozess ist nicht fähig. C p0 bezeichnet die Vorgabe des
Unternehmens bzgl. der Prozessfähigkeit, z. B. den Wert cp0 = 1.33 .
• Für den Korrekturfaktor k erhält man die Resultate
k=
μ−M
1
(To − Tu )
2
k=0 ⇔µ=M
k = 1 ⇔ µ = To oder µ = Tu
0 < k < 1 ⇔ µ ∈ {( To, Tu) \ {M}}
k > 1 ⇔ µ ∉ [Tu, To]
lim
k=∞
μ → ±∞
k ist eine lineare Funktion von µ, wie die Abbildung 5.2.7 zeigt.
k ist nur von µ abhängig. Die Funktion k ist nicht monoton.
K ist linear fallend für µ < M und linear wachsend für µ > M.
k ist somit ein dimensionsloses Maß für die Dezentrierung, bzw. 1 – k ist ein Maß für die
Zentrierung des Prozesses auf den Sollwert M.
1316han05.indd 188
25.07.2006 11:39:05
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
189
0.8
0.6667
0.6
0.4
ki
0.2
0
-2
-1
0
mi
1
2
Abb. 5.2.7: Darstellung von k
Eine Schätzfunktion für k ist
kˆ =
Y −M
1
(To − Tu )
2
kˆ ∼ N1 (μ k , σ 2k ),
mit
μk =
μ−M
1
(To − Tu )
2
und σ 2k =
σY2
N
(To − Tu )
2
=
σY2
.
N ⋅Δ
Die Schätzfunktion k̂ ist verzerrt. k wird systematisch zu groß geschätzt. Die Schätzfunktion
ist aber asymptotisch erwartungstreu, d. h. der Bias konvergiert mit dem Stichprobenumfang
N gegen null.
Für die Ableitung eines Tests zur Prüfung von Hypothesen über k muss k̂ etwas umgeformt
werden.
Es gilt
k − μk μk
Y −M
kˆ =: Z =
= σk
+
.
Δ
σk
σk
Der Ausdruck
U =
k − μk
∼ N (0, 1)
σk
Für den 2. Ausdruck kann man schreiben
2
2
⎛μ − M ⎞
⎛μ ⎞
Δ2 k2 N
δ =⎜ k⎟ =⎜ Y
=
⎟
⎝ σk ⎠
σY2
⎝ σY / N ⎠
2
Der Ausdruck (U + δ)2 ~ χ2 (1; δ2), d. h. das Quadrat der Summe der beiden Summanden U und
δ2 ist nichtzentral χ2 verteilt mit einem Freiheitsgrad und dem Nichtzentralitätsparameter δ2.
1316han05.indd 189
25.07.2006 11:39:06
190
5 Qualität in der Fertigung
Mit diesen Darstellungen erhält man das Schwankungsintervall für k̂
σY
Δ N
⎛ Δ2 k2 N ⎞
σY
ˆ
χ2α ⎜
⎟ ≤k≤
2
Δ
N
σ
⎝
⎠
Y
2
⎛ Δ2 k2 N ⎞
χ1− 2α ⎜
⎟.
σY2 ⎠
2 ⎝
Setzt man in den Nichtzentralitätsparameter ein hypothetisches k0 ein, dann kann man das
Intervall als Test verwenden.
Vorstellung von Cpk:
Die Verbindung zwischen Cpk und der Ausschussquote bzw. dem Anteil der guten Produktion
(Gutanteil) ist gegeben durch
⎛ T − μY ⎞
⎛ T − μY ⎞
−Φ⎜ u
Q = P({Tu ≤ Y ≤ To }) = Φ ⎜ o
⎟
⎝ σY ⎠
⎝ σY ⎟⎠
Löst man Cp nach σ auf, dann erhält man
⎛
⎛
T − μY ⎞
T − μY ⎞
Q = Φ ⎜ 6 ⋅ Cp o
− Φ ⎜ 6 ⋅ Cp u
To − Tu ⎟⎠
To − Tu ⎟⎠
⎝
⎝
Hieraus kann man zunächst ablesen, dass Cp allein zur Beschreibung der Ausschusses oder
alternativ dazu des Gutanteils nicht ausreicht.
Die Verwendung von
μY =
To + Tu
T − Tu
+κ o
, mit κ ∈ R
2
2
liefert
Q = Q (Cp , κ) = Φ [3 ⋅ (1 − κ) Cp ] − Φ [−3 ⋅ (1 + κ) Cp ].
Sind k und Cp bekannt, dann ist die zweiseitige Ausschussquote eindeutig durch
P = 2 − Φ [3 ⋅ Cp (1 + k)] − Φ [3 ⋅ Cp (1 − k)]
d. h.
1+ k⎞
⎛
P = 2 − Φ (3 Cpk ) + Φ ⎜ 3 Cpk
⎟
⎝
1− k⎠
bestimmt.
Korrigierter Prozessfähigkeitsindex Cpk
Cpk =
min (To − μY ; μY − Tu ) Δ − μY − M
=
= (1 − k) Cp
3 σY
3 σY
Cpk soll möglichst groß sein, denn große Cpk garantieren geringe Ausschussquoten.
Cpk
1316han05.indd 190
⎧Cpo
⎪
= ⎨C p
⎪C
⎩ pu
für μY < M
für μY = M
für μY > M
25.07.2006 11:39:06
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
wobei Cpu =
191
μY − Tu
T − μY
und Cpo = o
.
3 ⋅ σY
3 ⋅ σY
Die Funktion Cpk = Cpk (µY, σY) besitzt bezüglich der Argumentvariablen die Eigenschaften
max
C (μ ; σ ) = Cpk (M ; σY ) = Cp
μY ∈ R pk Y Y
lim
μY → ±∞
Cpk (μY ; σY ) − ∞
und bzgl. der Variablen σ
⎧∞ für Tu < μY < To
lim
⎪
Cpk (μY ; σY ) = ⎨0
für μY = Tu oder μY = To
σ→0
⎪−∞ für μ < T oder μ > T
⎩
Y
u
Y
o
und
lim
C (μ ; σ ) = 0.
σY → ∞ pk Y Y
Cpk > η, wenn der Streubereich [μY – 3 η σY; μY + 3 η σY] vollständig im Toleranzbereich
[Tu; To] enthalten ist. Hieraus folgt, dass Cpk > 1, wenn [μY – 3 σY; μY + 3 σY] vollständig in
[Tu; To] liegt.
Die partiellen Ableitungen von Cpk nach µY und σY sind
∂Cpk
∂μ Y
∂Cpk
∂σ Y
⎧ 1
⎪− 3 σ
⎪
Y
=⎨
1
⎪
⎩⎪ 3 σY
=−
für μY > M
für μY < M
1
Cpk .
σY
Hiermit können die Elastizitäten berechnet werden Es gilt
ησ (Cpk ) =
∂Cpk
∂σ Y
:
Cpk
σY
= −1
d. h. bzgl. σY ist Cpk eine isoelastische Funktion.
ημ (Cpk ) =
∂Cpk
∂μ Y
:
Cpk
μY
μY
⎧
⎪− Δ − μ − M
⎪
Y
=⎨
μ
Y
⎪+
⎩⎪ Δ − μY − M
ist nicht eindeutig, so dass bzgl. µY keine Aussage über die Elastizität formuliert werden kann.
Die Darstellung von Cpk ist in der Abbildung 5.2.8 zu sehen.
1316han05.indd 191
25.07.2006 11:39:07
192
5 Qualität in der Fertigung
4
3
2
40
30
1
20
20
10
10
0
0
Abb. 5.2.8: Darstellung des korrigierten Prozessfähigkeitsindexes
Die Schätzfunktion für Cpk ist
Cˆ pk =
0.5 (To − Tu ) − Y − M
3 sY
= (1 − k) Cˆ p
Die Verteilungsdichte für Ĉpk ist recht kompliziert. Diese wurde von Chou, Owen [1989]
abgeleitet. Hier soll auf die Wiederholung der Darstellung verzichtet werden, da deren Angabe
keinen praktischen Nutzen zeigt.
Prozessfähigkeitsindex Cpm nach Taguchi
Ausgangspunkt für diese Darstellung ist die Variabilität τ2 von Y bzgl. des Sollwertes M, d. h. die
Beziehung E [(Y – M)2] = σ2Y + (µY – M)2 =: τ2, in der σ2Y die Varianz um den Erwartungswert
µY und der zweite Term den quadratischen Bias angibt. Da σ ≤ τ mit der Gleichheit nur für
µY = M, gilt selbstverständlich Cpm ≤ Cp. Genauer kann man schreiben
Cpm = σY / τ Cp.
Die grafische Darstellung von Cpm ist in der Abbildung 5.2.9 enthalten.
Die beiden Graphen für Cpk und Cpm unterscheiden sich vor allem hinsichtlich der nichtlinearen
Abhängigkeit des Indexes Cpm von µY und σY.
1316han05.indd 192
25.07.2006 11:39:07
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
193
2
1.5
40
1
30
20
20
10
0
0.5
0
10
Abb. 5.2.9: Darstellung des Prozessfähigkeitsindexes nach Taguchi
5.2.1.7
Was sind multivariate Prozessfähigkeitsindizes?
Problem
Ein Prozess wird fähig genannt, wenn er konsequent Produkte produziert, dessen Produktvariablen innerhalb des Spezifikationsbereiches liegen. Ein Produkt wird durch m, m ≥ 1 nicht
unabhängige Produktvariable Y1, …, Ym beschrieben. Der rechteckige Spezifikations- oder
Toleranzbereich ist
TB := {Y : Y ∈ R m und Y j ∈ [Tu, j , To, j ] für j = 1, …, m}.
Manchmal ist TB durch ein Hyperellipsoid oder ein anderes Gebilde spezifiziert.
Ein Maß für die Fähigkeit des Prozesses, der aufgrund aller relevanten, nicht unabhängigen
Produktvariablen beurteilt werden soll, wird multivariater Prozessfähigkeitsindex genannt und
mit MCp (einfacher) bzw. MCpk (korrigierter) bezeichnet. Das Problem besteht nun darin,
die multivariaten Prozessfähigkeitsindizes zu bestimmen und Entscheidungen aufgrund der
multivariaten Prozessfähigkeitsindizes zu treffen.
Sind die Entscheidungsmöglichkeiten analog denen der univariaten Prozessfähigkeitsindizes?
In der neueren Literatur gibt es einige Ansätze für multivariate Prozessfähigkeitsindizes, so wie
diese in den Arbeiten von Chan, Chen, Spiring [1988], Taam et al. [1993], Wang et al. [2000],
Jahn [1997].
Die Notwendigkeit für die Ableitung von Formeln soll an Beispielen mit unterschiedlicher
Abhängigkeitsstruktur betrachtet werden.
1316han05.indd 193
25.07.2006 11:39:07
194
5 Qualität in der Fertigung
Beispiel 5.2.8: Simulationen. Maßzahlen und univariate Fähigkeiten
Es wird der zweidimensionale Fall mit den beiden Produktvariablen Y1 und Y2 betrachtet. Der Y sei normal verteilt mit dem Vektor der Erwartungswerte µT = (µ1, µ2) und der
Kovarianzmatrix
⎛ σ12
ΣYY = ⎜
⎝
σ12 ⎞
⎟.
σ 22 ⎠
Die Sollwerte seien MT = (5.0, 5.0),
und die unteren und oberen Toleranzgrenzen seien
ToT = (7.5, 7.5)
TuT = (2.5, 2.5).
Für die beiden Fälle werden Stichproben mit den sehr großen Stichprobenumfängen
N1 = N2 = 5000 simuliert.
Für den unkorrelierter Fall erhält man die Schätzungen r12 = –0.0078,
−0.0053 ⎞
,
0.7395 ⎟⎠
⎛ 0.6261
SYY = ⎜
⎝
und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.5.
Tabelle 5.2.5: Univariate Prozessfähigkeitsindizes für den unkorrelierten Fall
Tu
To
Mittel
Stdabw.
Cp
k
Cpk
Y1
2,5
7,5
5,505
0,7913
1,053
0,202
0,8401
Y2
2,5
7,5
4,288
0,86
0,969
0,2846
0,6933
Für den extrem hoch korrelierten Fall erhält man die Schätzungen r12 = 0.9987,
⎛ 0.6591 0.70827 ⎞
SYY = ⎜
,
0.76344 ⎟⎠
⎝
und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.6.
Tabelle 5.2.6: Univariate Prozessfähigkeitsindizes für den hoch korrelierten Fall
Tu
To
Mittel
Stdabw.
Cp
k
Cpk
Y1
2,5
7,5
5,4904
0,8122
1,0261
0,1962
0,8248
Y2
2,5
7,5
4,2899
0,8732
0,9544
0,2841
0,6833
Aus den Tabellen liest man ab, dass sich die statistischen Maßzahlen für den unkorrelierten
und hoch korrelierten Fall im statistischen Sinne nicht unterscheiden und die Kovarianzmatrizen und damit natürlich die Korrelationsmatrizen sich wesentlich unterscheiden.
1316han05.indd 194
25.07.2006 11:39:08
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
195
Sind der unkorrelierte und hoch korrelierte Fall aber bzgl. der simultanen Erfüllung der
Kundenanforderungen beider Produktvariablen als gleich anzusehen?
Zur Beantwortung dieser Frage müssen weitere Charakteristika berechnet werden. Zu diesen
zählen die Eigenwerte, die Längen der Hauptachsen der Streuungsellipsen, in deren Inneren
alle Punkte (Yi1, Yi2), i = 1, …, N mit der Wahrscheinlichkeit 1 – α = 0.0027 liegen und die
Projektionen der Hauptachsen auf die Achsen der Produktvariablen.
Längen der Hauptachsen der Ellipse:
Für die Kovarianzmatrix ΣYY können wir die Eigenwerte über die charakteristische Gleichung
det(SYY – λ I) = 0,
d. h.
s12 − λ
s21
s12
s22
−λ
=0
berechnen.
Wir erhalten die quadratische Gleichung
2
2
(s12 − λ) (s22 − λ) − s12
= λ 2 − λ (s12 + s22 ) + (s12 s22 − s12
)
= λ 2 − λ ⋅ Sp (SYY ) + det(SYY ) = 0
Beispiel 5.2.9: Simulationen. Eigenwerte und Längen der Hauptachsen
Hieraus können wir für beide Fälle die Eigenwerte für den
unkorrelierten Fall
λ1 = 0.73975 und λ2 = 0.62585 und den
hoch korrelierten Fall
λ1 = 1.42092 und λ2 = 0.0006178
berechnen.
Die Eigenwerte unterscheiden sich wesentlich.
Mit den Eigenwerten können wir die Längen der Hauptachsen der Streuungsellipsen nach
der Formel
Lj = 2 λ j ⋅ c ,
berechnen, wobei
2
c = −2 ⋅ ln (2 ⋅ π ⋅ h ⋅ 1 − ρ12
).
Die maximale Höhe hmax der Vd ist Φ (0, 0). Die Höhe der Vd für eine vorgegebene Wahrscheinlichkeit α ist
hα = 0.0027 =
1316han05.indd 195
1
2 π det(ΣYY )
=
1
= 0.083367
11.995087
25.07.2006 11:39:08
196
5 Qualität in der Fertigung
Hieraus folgt
c = −2 ⋅ ln (2 ⋅ π ⋅ h0.0027 det(ΣYY ) = −2 ln
= −2 ln(α) = −2 ln(0.0027) = 11.82973 =
2 π ⋅ 0.0027 ⋅ det(ΣYY )
2π det(ΣYY )
χ12− α ,m .
Die Längen der Hauptachsen der Ellipsen für die beiden Fälle sind
L1,unkorr =
0.73975 ⋅ 11.82973 = 2 ⋅ 2.95822 = 5.9164
L2,unkorr =
0.62585 ⋅ 11.82973 = 2 ⋅ 2.72096 = 5.4419
und
L1,hochkorr = 2 ⋅ 1.42092 ⋅ 11.82973 = 2 ⋅ 4.09989 = 8.19978,
L2,hochkorr = 2 ⋅ 0.0006178 ⋅ 11.82973 = 2 ⋅ 0.08548 = 0.17097
Die Projektionen der ersten beiden Hauptachsen auf die Koordinaten- (Toleranz-) Achsen
ergibt
P1 = 4.18
P2 = 5.798.
Die Flächeninhalte der beiden Ellipsen sind
für den unkorrelierten Fall
Funkorr = 25.287 und
für den hoch korrelierten Fall Fhoch korr = 1.101.
Aus dem Beispiel 5.2.9 erkennt man, dass im Falle der Unkorreliertheit die Ellipse im Toleranzgebiet liegen würde, wenn die Abweichung zwischen den Soll- und Mittelwerten klein
genug wäre.
Im Falle der starken Korreliertheit ragt die Ellipse auch für den Fall kleiner Abweichungen
zwischen den Soll- und Mittelwerten über das Toleranzgebiet hinaus.
Das bedeutet aber, dass in dem unkorrelierten Fall der Prozess hinsichtlich des
Streuungsverhaltens fähig und im korrelierten Fall nicht fähig ist.
Dieses Verhalten wird durch die univariaten Prozessfähigkeitsindizes nicht wider gespiegelt.
Daher ist die Verallgemeinerung der uni- auf die multivariaten Prozessfähigkeitsindizes notwendig. Die nachfolgende Abbildung verdeutlich diesen Schluss geometrisch.
In Abbildung 5.2.10. werden die beiden Grundflächen der schwach und hochkorrelierten
Verteilung in einer Grafik in Bezug auf den
• gemeinsamen Sollzustand (MT = (5; 5) und TT = (To,1 – Tu,1; To,2 – Tu,2) = (5; 5) und
• den Mittelpunkt Y T = (Y1 Y2 ) dargestellt.
Wir können aus dieser Abbildung folgende Sachverhalte ablesen:
1. Für den unkorrelierten Fall liegt die Streuungsellipse in Sollwertlage, d. h. mit dem Mittelpunkt M vollständig innerhalb des Toleranzrechteckes mit den Diagonalen der Länge
7.071.
1316han05.indd 196
25.07.2006 11:39:08
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
197
To2 = 7,5
M2 = 5
Y2
Tu,2 = 2,5
Tu.1 = 2,5
M1 = 5
T0,1 = 7,5
Y1
Abb. 5.2.10: Streuungsellipsen für den schwach und hoch korrelierten Fall im Toleranzgebiet
2. Die Streuungsellipse für den hoch korrelierten Fall ragt auch in der Sollwertlage über das
Toleranzgebiet hinaus.
3. Die Streuungsellipsen in Mittelwertlage ragen in beiden Fällen über die Toleranzgrenzen
hinaus, d. h. die zu beiden Verteilungen gehörenden Prozesse liefern Ausschuss. Die Prozesse
sind nicht fähig.
Diese Abbildung wird durch die Streuungsellipsen der Abbildung 5.2.11 und Abbildung 5.2.12
für den unkorrelierten und hoch korrelierten Fall bestätigt.
Die Abbildungen bestätigen die obigen Aussagen, dass mit größer werdenden Korrelationskoeffizienten der Anteil der Punkte außerhalb des Toleranzgebietes größer wird und dass
dadurch die multivariaten Prozessfähigkeitsindizes kleiner werden und deren Berechnung
notwendig ist.
8
6
Y2
4
2
0
2
3
4
5
6
7
8
Y1
Abb. 5.2.11: Streudiagramm für den unkorrelierten Fall
1316han05.indd 197
25.07.2006 11:39:08
198
5 Qualität in der Fertigung
8
6
Y2
4
2
0
2
3
4
5
6
7
8
Y1
Abb. 5.2.12: Streudiagramm für den hoch korrelierten Fall
Vor der Ableitung neuer multivariater Prozessfähigkeitsindizes (multivariate process capability
indices) MCp und MCpk werden die folgenden Voraussetzungen und Anforderungen gestellt:
• Die Produktivität eines Unternehmens ist wesentlich von dem Niveau der im Unternehmen
angewendeten Methoden für die Strukturierung des Unternehmens, die statistische Prozessanalyse und die Entscheidungsfindung für die Prozessverbesserung, die Tolerierung oder
Überprüfung der Toleranzen mit multivariaten statistischen Methoden auf der Grundlage
der Prozessfähigkeiten abhängig.
• Jedes Produkt wird durch mehrere (m ≥ 1) Produktvariablen Y1, …, Ym beschrieben. Die
Produktvariablen sind nicht unabhängig voneinander.
Der Sollzustand wird durch
• den Vektor der Sollwerte MT = (M1, …, Mm) und
• die Vektoren der Toleranzgrenzen TTo = (To1, …, Tom) und TTu = (Tu1, …, Tum)
und der Istzustand durch
• den Vektor der Mittelwerte YT = (Y1 … Ym ) und
• die positiv definite Stichprobenkovarianzmatrix SYY
beschrieben.
Was ist Qualität? (Wir müssen hier von Produktqualität sprechen)
Die Qualität eines Produktes wird durch die simultane Erfüllung aller relevanten Kundenanforderungen definiert. Für den Vergleich ist es notwendig, dass
• die relevanten Kundenanforderungen unter Beachtung der Abhängigkeitsstruktur zwischen
den Produktvariablen durch Sollwerte und Toleranzgrenzen spezifiziert werden müssen.
1316han05.indd 198
25.07.2006 11:39:09
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
199
• Zum anderen ist es ebenfalls notwendig, den Istzustand für alle relevanten, nicht unabhängigen Produktvariablen durch die m-dimensionale Häufigkeitsverteilung, bzw. durch die
Angabe des Mittelwertvektors und der Stichprobenkovarianzmatrix SYY zu erfassen.
• Über den Vergleich von Soll- und Istzustand muss die Qualität quantifiziert werden, um
sinnvolle Entscheidungen treffen zu können.
Die multivariaten Prozessfähigkeitsindizes quantifizieren die Qualität
• Der Vektor der Produktvariable Y sei entweder
gemeinsam normal verteilt, d. h. Y ~ Nm (µ, ΣYY), ΣYY > 0
oder die gemeinsame Verteilung gehört zur Klasse der elliptisch umrissenen Verteilungen.
• Die multivariaten Prozessfähigkeitsindizes sollen Eigenschaften haben, die analog zu denen der univariaten Prozessfähigkeitsindizes sind. Insbesondere sollen die multivariaten
Prozessfähigkeitsindizes als Entscheidungsgrundlage für
– die Prozessverbesserung im Sinne der Reduktion der Variabilität der Produktvariable,
falls MCp < 1,
– der Justierung des Prozesses, falls MCp > 1 und MCpk < 1,
– der Überprüfung oder Neuberechnung der Toleranzgrenzen, falls MCp < 1 und die
Differenz zwischen MCp und MCpk sehr groß ist,
dienen.
– Der multivariate Prozessfähigkeitsindex MCp, der das Streuverhalten des zufälligen Vektors der Produktvariablen im Vergleich zum Toleranzbereich beurteilt, muss 1 sein, falls
das Streuungsellipsoid den Toleranzbereich an allen Koordinatenebenen berührt,
– MCpk ≤ MCp für K ≥ 0.
– K ist nichtlinear von Y − M abhängig,
– die Form des Ellipsoids oder Hyperellipsoids der Realisierungen des Vektors der Pro1
abhängig.
duktvariablen ist vom Grad der Multikollinearität δ =
RYY
– Je größer der Grad der Multikollinearität ist, desto kleiner wird die kleinste Hauptachse
des Hyperellipsoides.
– MCp muss folglich ebenfalls von δ abhängen.
– MCp soll für verschiedene Toleranzbereiche
m
·
unabhängige Spezifikationsbereiche
∏ (Toj − Tuj )
j =1
· abhängige Spezifikationsbereiche (To – M)T A (To – M)
– gelten.
Sind die Produktvariablen unabhängig voneinander, kann die Benferoni Ungleichung angewandt werden, um sicher zustellen, dass dieselbe Wahrscheinlichkeit α für alle Produktvariablen
gilt. Außerdem kann in diesem Fall die multivariate Prozessfähigkeit durch das Produkt über
alle Prozessfähigkeiten für jeden Produktvariable
MPCp′ =
m
∏ Cp, j
j =1
abgeschätzt werden.
1316han05.indd 199
25.07.2006 11:39:09
200
5 Qualität in der Fertigung
Sind die Produktvariablen nicht unabhängig voneinander, dann sind sie korreliert. Die
Abhängigkeitsstruktur zwischen den Produktvariablen, ausgedrückt durch die Korrelationsoder Kovarianzmatrix, muss berechnet werden. In diesen Fällen liefern die Produkte über die
einfachen Prozessfähigkeitsindizes unsinnige Ergebnisse.
Was müssen wir tun, um im multivariaten Fall den Soll- mit dem Istzustand vergleichen zu
können?
Im univariaten Fall haben wir Intervalle (Breite des Toleranzintervalls und Breite der Häufigkeitsverteilung) miteinander verglichen.
Im zweidimensionalen Fall könnten wir Flächen – die Streuungsellipse und den Toleranzbereich – miteinander vergleichen. Das hieße, dass wir im m-dimensionalen Fall Volumen
vergleichen müssten.
Welche Zahl können wir für m = 2 einer Fläche zuordnen?
Die Flächeninhalte des Kreises und der Ellipse mit dem Flächeninhalt des Toleranzbereiches
zu vergleichen, ergäbe für den unkorrelierten Fall den Wert
Toleranzbereich
25
=
= 0.988
Streuungsbereich 25.287
und für den hoch korrelierten Fall
Toleranzbereich
25
=
= 22.706.
Streuungsbereich 1.101
Dieser Vergleich macht keinen Sinn, denn die Abbildungen 5.14 und 5.15 zeigen, dass
• Die „Ecken“ des Toleranzbereiches durch den Prozess nicht belegt werden können,
• der Streuungskreis für den unkorrelierten Fall und
• die Streuungsellipse für den hoch korrelierten Fall
über die Toleranzgrenzen hinausragen.
An dieser Stelle möchte ich Ihnen die Frage stellen, warum sind Schießscheiben rund?
Natürlich weil die Trefferbilder eines jeden Schießgerätes kreisförmig umrissen sind. Die Ecke
eines rechteckigen Zielgebietes zu treffen ist genauso schwierig, wie in das Zentrum zu treffen,
ja man kann sagen, jeder Eckpunkt ist der Mittelpunkt eines Vierteilkreises. Da der Flächenvergleich kein Ergebnis liefert, müssen wir uns etwas anderes überlegen.
Wir können die Definition des univariaten Prozessfähigkeitsindex auch anders interpretieren,
indem wir fragen, wie groß ist der Abstand zwischen der oberen und unteren Toleranzgrenze
relativ zur Standardabweichung der betrachteten Produktvariablen?
Das würde bedeuten, dass wir die Abstände zwischen Punkten in beliebig dimensionalen Räumen unter Beachtung der Abhängigkeitsstruktur zwischen den Produktvariablen betrachten
und nach passenden Abstandsdefinitionen suchen.
Im Kapitel 10 über die Klassifikationsverfahren, speziell bei der Einführung der Clusteranalyse, werden einige Abstandsdefinitionen eingeführt und betrachtet. Der für die Ableitung der
multivariaten Prozessfähigkeitsindizes passende Abstandsbegriff ist der
1316han05.indd 200
25.07.2006 11:39:10
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
201
Mahalanobis Abstand
Der gewichtete Abstand zwischen den beiden Vektoren z. B. Y1 und Y2 mit den Gewichten, die
durch die inversen Kovarianzmatrix geliefert werden, ist durch
D = (Y1 − Y2 )T A (Y1 − Y2 )
−1
= (Y1 − Y2 )T ⋅ ΣYY
⋅ (Y1 − Y2 )
definiert, wobei die Gewichtsmatrix A durch die inverse Kovarianzmatrix ersetzt wird. Ist
ΣYY unbekannt, so wird sie durch die Stichprobenkovarianzmatrix SYY ersetzt. Sind die Stichprobenkovarianzmatrizen von Y1 und Y2 verschieden, so kann man SYY durch die gemittelte
(pooled) Kovarianzmatrix ersetzen.
Nehmen wir wie oben an, dass der zufällige Vektor Y der Produktvariablen Y1, …, Ym m-dimensional normal verteilt ist, dann hat er die Verteilungsdichte
fY ( y ; μ , Σ ) =
1
m
(2 π) 2
⋅
1
ΣYY 2
⎧ 1
⎫
−1
⋅ exp ⎨− (Y − μY )T ⋅ ΣYY
⋅ (Y − μY )⎬ ,
⎩ 2
⎭
wobei ΣYY eine positiv definite Kovarianzmatrix ist. Diesen Sachverhalt kürzen wir durch
ΣYY > 0 ab. In dieser Darstellung erkennen wir, dass die quadratische Form im Exponenten
der m-dimensionalen Normalverteilung mit den Abweichungen der Messwertvektoren Yi vom
−1
Erwartungswertvektor µ genau ein Mahalanobis Abstand D = (Yi − μ)T ΣYY
(Yi − μ) ist, der
den „gewichteten“ Abstand einer Zufallsgröße Yi von ihrem Erwartungswert misst.
Das wollen wir uns für die Definition der multivariaten Prozessfähigkeitsindizes zunutze
machen.
Neue Definition der multivariaten Prozessfähigkeitsindizes
Beim Übergang von den univariaten zu den multivariaten Prozessfähigkeitsindizes müssen
wir anmerken, dass sich von Stichprobe zu Stichprobe mit den Vektoren der Einzelwerte
Yi, i = 1, …, N auch die Vektoren der Mittelwerte Y und die Stichprobenkovarianzmatrizen
ändern können. Die einzige nahezu unveränderliche „Größe“ ist die Korrelationsmatrix für
die Produktvariablen.
Bedingte Prozessfähigkeitsindizes
Infolgedessen suchen wir den mit der Stichprobenkovarianzmatrix gewichteten Abstand
zwischen dem Vektor der Abweichungen des Einzelwertes Yi vom Vektor der Mittelwerte. Das
wäre der mittlere Mahalanobis Abstand
1
N
N
−1
(Yi − Y ).
∑ (Yi − Y )T SYY
i =1
Nun gilt aber
⎡ ⎛1
E ⎢Sp ⎜
⎢⎣ ⎝ N
1316han05.indd 201
⎞⎤
⎧1 N
⎫
−1
T −1
Y
Y
S
Y
Y
E ⎣⎡SYY
(
−
)
(
−
)
=
Sp
(Yi − Y )(Yi − Y )T ⎦⎤ ⎬
⎥
⎨
∑ i
∑
YY
i
⎟⎠
⎥⎦
⎩ N i =1
⎭
i =1
n
=
= const
N
N
25.07.2006 11:39:10
202
5 Qualität in der Fertigung
Zudem muss dieser Abstand relativ zu dem gewichteten Abstand zwischen den Vektoren der
oberen Toleranzgrenzen und den Sollwerten
−1
(To − M )T SYY
(To − M )
betrachtet werden.
Dieser Abstand kann auch mit dem Spurkriterium in den Ausdruck
(To − M )
T
−1
SYY
⎡ m (To, j − M j ) ⎤
−1 ⎤
(To − M ) = Sp ⎣⎡(To − M )(To − M )T SYY
=
⎢
⎥
∑
⎦
⎢⎣ j =1 S j / m − j ⎥⎦
2
umgeformt werden. Die Summanden dieser Summe sehen aus wie die einfachen Prozessfähigkeitsindizes mit den bedingten anstelle der einfachen Standardabweichungen. Für die einzelnen
Produktvariablen kann die Formel
MCp ( j) =
(To, j − Tu, j )
6 ⋅ S j /m− j
, ∀j = 1, …, m
als einfacher bedingter oder multivariater Prozessfähigkeitsindex für die j-te Produktvariable
verwendet werden. Der Korrekturterm für die Messung der Abweichung des Mittelwertes vom
Sollwert ist
kj = 2
M j − E (Y j / Ym − j )
To, j − Tu, j
, ∀j = 1, …, m.
Der korrigierte bedingte (oder multivariate) Prozessfähigkeitsindex für die j-te Produktvariable ist
MCpk ( j) = [1 − k j MCp ( j)].
Die bedingten Prozessfähigkeitsindizes hängen noch über die bedingte Varianz von der Kovarianzmatrix ab. Daher ist es sinnvoll, noch ein globales Maß für die multivariate Prozessfähigkeit
auszurechnen.
Multivariate Prozessfähigkeitsindizes
Wir gehen wieder vom univariaten Prozessfähigkeitsindex Cp aus und schreiben den in der
Form
Cp =
To − Tu 1
1
⋅ = σ*
6
S
S
wobei
To − Tu
= σ*
6
die maximale Streuung für die Produktvariable ist, die garantiert, dass die Häufigkeitsverteilung
für die Werte der Produktvariablen innerhalb des Toleranzintervalls liegt. Ist S > σ*, dann ist
Cp < 1. Diesen Ausdruck für Cp wollen wir auf den multivariaten Fall verallgemeinern.
Eine Möglichkeit der Verallgemeinerung wäre die Bildung des verallgemeinerten Varianzquotienten
*
−1
(ΣYY
SYY
).
1316han05.indd 202
25.07.2006 11:39:10
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
203
Dieser Ausdruck oder gewisse Funktionale davon scheinen nicht geeignet zu sein. Daher wählen
wir für den multivariaten Prozessfähigkeitsindex den Quotient zweier quadratischer Formen.
Die quadratische Form im Zähler ist die schon betrachtete
−1
(To − M )T SYY
(To − M ).
Die im Nenner stehende zweite quadratische Form wird mit der so genannten „theoretischen“
*
*
Kovarianzmatrix ΣYY
anstelle der Stichprobenkovarianzmatrix SYY gebildet. ΣYY
wird aus der
Korrelationsmatrix, den Toleranzgrenzen und Sollwerten für alle m Produktvariablen berechnet.
Mit diesen Überlegungen erhält man für die Vektoren der oberen Toleranzgrenzen
ToT = (To,1 … To,m )
und der Sollwerte
M T = (M 1 … M m )
den Ausdruck
MCp =
(To − M )T S-1
YY (To − M )
* −1
(To − M )T (ΣYY
) (To − M )
wobei
⎛T − M ⎞
⎛T − M ⎞
*
ΣYY
= diag ⎜ o
R diag ⎜ o
⎝ 3 ⎟⎠ YY
⎝ 3 ⎟⎠
die theoretische Kovarianzmatrix und RYY die Korrelationsmatrix des Vektors YT = (Y1, …, Ym)
der m, m ≥ 1 Produktvariablen ist.
Für schiefsymmetrische Toleranzgrenzen verwendet man
MCpo =
MCpu =
−1
(To − M )T SYY
(To − M )
* −1
(To − M )T (ΣYY
) (To − M )
−1
(M − Tu )T SYY
(M − Tu )
* −1
(M − Tu )T (ΣYY
) (M − Tu )
Der Korrekturterm wird nach der Formel
MCpu =
−1
(M − Tu )T SYY
(M − Tu )
* −1
(M − Tu )T (ΣYY
) (M − Tu )
berechnet. Damit wir der korrigierte multivariate Prozessfähigkeitsindex
MCpk = MCp / K
berechnet.
Die Entscheidung wird entsprechend den Größen von MCp und MCpk vorgenommen.
1316han05.indd 203
25.07.2006 11:39:11
204
5 Qualität in der Fertigung
Daten
Y2
Y2
Y2
Tu 2
Tu 2
Tu 2
M2
M2
M2
Tl 2
Tl 2
Tl 2
Tl 1
M1
Tu 1 Y1
MC p < 1
MC pk< 1
Tl 1
M1
Tu 1 Y1
MC p > 1
MCpk < 1
Prozessverbesserung
Reduktion der
Variation
Tl 1
M1
Tu 1 Y1
MCp > 1
MCpk >1
Kontrolle des Prozesses
Justierung des
Prozesses
Abb. 5.2.13: Entscheidungen aufgrund der multivariaten Prozessfähigkeitsindizes
Gilt MCp < 1 (bzw. 1.33), dann ragt die multivariate Häufigkeitsverteilung der Produktvariablen an einer, mehreren oder allen Rändern über den Toleranzbereich hinaus. Ausschuss wird
produziert. Der Prozess muss so verbessert werden, dass die Variabilität der Produktvariablen
kleiner wird. Das kann nur über die Steuerung des Prozesses mit den Sollwerten und Toleranzgrenzen als Zielwerte für die Produktvariablen erreicht werden. In diesem Fall ist auch
MCpk < 1, da K > 0 ist.
Gilt MCp > 1 (bzw. 1.33) und MCpk < 1 (bzw. 1.33), dann weicht der Vektor der Mittelwerte
zu stark vom Vektor der Sollwerte ab. Die multivariate Häufigkeitsverteilung der Produktvariablen kann über den Toleranzbereich hinausragen. Das bedeutet aber, dass trotz MCp > 1
(bzw. > 1.33) Ausschuss produziert wird. Der Prozess muss verbessert werden, so dass die
Mittel- und Sollwerte übereinstimmen.
Gelten sowohl MCp > 1 und MCpk > 1 (bzw. > 1.33), dann ist der Prozess fähig, Produkte
mit den durch Sollwerte und Toleranzgrenzen vorgegebenen Eigenschaften zu produzieren.
In diesem Fall muss der Prozess mit den multivariaten Kontrollkarten des Kapitels 6 ständig
überwacht werden. Die Entscheidungen werden durch die Abbildung 5.2.13 visualisiert.
Was besagen die Begriffe Produktqualität, Lieferantenqualität und Prozessqualität?
Die bedingten und multivariaten Prozessfähigkeitsindizes sind auf die Produkte, die Inputoder Lieferantenprodukte und die Prozesse anwendbar. In jedem Falle müssen die Sollzustände,
ausgedrückt durch Sollwerte und Toleranzgrenzen, für die nicht unabhängigen Variablen mit
den Istzuständen, ausgedrückt durch die Schätzungen für die Mittelwertvektoren und Kovarianzmatrizen, verglichen werden.
Für die Anwendung der multivariaten Prozessfähigkeitsindizes MCp und MCpk auf die Produkte,
Prozesse und Lieferantenprodukte wollen wir die folgenden Bezeichnungen einführen.
1316han05.indd 204
25.07.2006 11:39:11
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
205
• PCp und PCpk werden für die Messung der simultanen Erfüllung aller relevanten Kundenanforderungen verwendet. Diese Fähigkeitsindices wollen wir Produktfähigkeiten nennen.
Die Produktfähigkeit PCpk misst die Produktqualität.
• LCp und LCpk werden für die Beurteilung der Input- oder Lieferantenprodukte verwendet.
Die Lieferantenfähigkeit LCpk misst die Lieferantenqualität.
• ProzCp und ProzCpk wollen wir für die Beurteilung der Prozesse verwenden.
• Die Prozessfähigkeit ProzCpk misst die Prozessqualität.
• Die Lieferanten- und Prozessqualität sind die notwendigen Voraussetzungen für die Produktqualität.
Mitunter, wenn keine Verwechslungen möglich sind, werden aber die übergeordneten Bezeichnungen MCp und MCpk verwendet.
An mehreren Beispielen wollen wir jetzt demonstrieren, wie die multivariaten Prozessfähigkeitsindizes zu interpretieren sind.
Beispiel 5.2.10: Demonstrationsbeispiel. Multivariate Fähigkeiten
Für fünf Produktvariable mit den Sollwerten und Toleranzgrenzen der folgenden Tabelle
Tabelle 5.2.7: Sollzustand Demonstrationsbeispiel
Produktvariable
Sollwert
untere
Toleranzgrenze
obere
Toleranzgrenze
Y1
7,5
5,7
9,3
Y3
128
113
143
Y3
65
56
74
Y4
1,2
1,05
1,35
Y5
1,8
0,3
3,3
und eine gegebene Korrelationsmatrix RYY wurden zwei Stichproben erzeugt.
Die Stichprobenkovarianzmatrix der einen Stichprobe ist
⎛ 0,502067 3,042725 0,546106 0,0160155 0,147379 ⎞
⎜
29,794251 3,073832 0,140759
1,768678 ⎟
⎜
⎟
11,653298 0,127856 0,991572 ⎟
SYY (1) = ⎜
⎜
0,0021438 0,0153684 ⎟
⎜
⎟
0,185228 ⎠
⎝
und die der zweiten
⎛ 0,346178 2,356153 0,481964
⎜
26,378731 3,025746
⎜
9,128812
SYY (2) = ⎜
⎜
⎜
⎝
1316han05.indd 205
0,014896
0,147258
0,122732
0,0025146
0,161749 ⎞
2,095516 ⎟
⎟
1,047801 ⎟ .
0,020078 ⎟
⎟
0,268881 ⎠
25.07.2006 11:39:11
206
5 Qualität in der Fertigung
Die theoretische Kovarianzmatrix ist
*
ΣYY
⎛ 0,36 2,360133 0,40639 0,014645 0,144981 ⎞
⎜
25
2,47446 0,139237 1,882212 ⎟
⎜
⎟
9
0,121336 1,012367 ⎟ .
=⎜
⎜
0,0025
0,01928 ⎟
⎜
⎟
0,25
⎝
⎠
Sie sehen, die Stichprobenkovarianzmatrix SYY(2) unterscheidet sich von Σ*YY sehr viel
weniger als SYY(1). Folglich müssen die multivariaten Prozessfähigkeitsindizes der zweiten
Stichprobe in der Nähe von 1 liegen und die der 1. Stichprobe kleiner sein. Die Prozessfähigkeitsindizes der ersten Stichprobe sind
Tabelle 5.2.8: Fähigkeiten der Stichprobe 1
Univariate Capabilities:
LSL
USL
Mean
Stdv
Cp
k
Cpk
0.7086
0.8468
0.2019
0.6758
Y1
5.70
9.30
7.8634
Y2
113.00
143.00
129.6605
5.4584
0.9160
0.1107
0.8146
Y3
56.00
74.00
64.8889
3.4137
0.8788
0.0123
0.8680
Y4
1.05
1.35
1.2015
0.0463
1.0799
0.0102
1.0689
Y5
0.30
3.30
1.8390
0.4304
1.1618
0.0260
1.1316
Stdv
Cp
k
Cpk
Multivariate Capabilities:
PCp:
0.658
D:
1.2892
PCpm:
0.5104
und die der zweiten
Tabelle 5.2.9: Fähigkeiten der Stichprobe 2
Univariate Capabilities:
LSL
USL
Mean
Y1
5.70
9.30
7.5328
0.5884
1.0198
0.0182
1.0012
Y2
113.00
143.00
128.3841
5.1360
0.9735
0.0256
0.9486
Y3
56.00
74.00
64.9522
3.0214
0.9929
0.0053
0.9876
Y4
1.05
1.35
1.2009
0.0501
0.9971
0.0057
0.9914
Y5
0.30
3.30
1.8220
0.5185
0.9643
0.0147
0.9501
Multivariate Capabilities:
1316han05.indd 206
PCp:
0.9735
K:
0.014
PCpk:
0.9599
D:
1.0238
PCpm:
0.9509
25.07.2006 11:39:11
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
207
Der multivariate Prozessfähigkeitsindex MCp, der eine Aussage über das Streuverhalten
gestattet, liegt bei der zweiten Stichprobe nahe an der 1 und bei der ersten Stichprobe ist
er bedeutend kleiner als 1.
−1
Der Mittelwert der Eigenwerte von (Σ * SYY
) als Test für die Gleichheit von Kovarianzmatrizen ist für die 1. Stichprobe 1,772 und für die 2. Stichprobe 0,989. Hieraus folgt, dass bei der
1. Stichprobe die theoretische Kovarianzmatrix ungleich der Stichprobenkovarianzmatrix
ist. Im zweiten Fall stimmen die Kovarianzmatrizen fast überein.
Beispiel 5.2.11: Dämpfung der Motorvibration. Multivariate Fähigkeiten
Das Hydrolager wurde durch die beiden Produktvariablen
Y1 = Phasenverschiebung [Φ] und
Y2 = dynamische Steifigkeit [N/mm]
beschrieben. Die dreidimensionale Häufigkeitsverteilung und das Streudiagramm sind in
Abbildung 5.1.2 und Abbildung 5.1.3 dargestellt.
Die Sollvorgaben sind
Tabelle 5.2.10: Sollvorgaben für die Produktvariable Phasenverschiebung und Steifigkeit
Sollwert
Phasenverschiebung
dyn. Steifigkeit
43
185
untere Toleranzgrenze
36
140
obere Toleranzgrenze
48
230
Die Kennzahlen für den Istzustand nach der Ausreißererkennung mit dem aerk-Kriterium
und Elimination sind in der Tabelle 5.2.11 zusammengestellt.
Tabelle 5.2.11: Istzustand
Phasenverschiebung
dyn. Steifigkeit
Minimum
2.90
119.92
Mittelwert
42.526
196.587
Standardabweichung
Maximum
2.83727
60.00
8.193489
272.79
Tabelle 5.2.12: Univariate Prozessfähigkeitsindizes
Phasenverschiebung
dyn. Steifigkeit
Cp
0.7049
1.8307
K
0.0877
0.2575
Cpk
06431
1.3593
Hier hat man den Fall, dass eine Produktvariable eine univariate Prozessfähigkeit hat, die
größer ist als 1.33 und eine, deren Fähigkeit kleiner als 1.33 ist.
1316han05.indd 207
25.07.2006 11:39:12
208
5 Qualität in der Fertigung
Wie soll man entscheiden?
Die multivariaten Prozessfähigkeitsindizes müssen berechnet werden.
Wir erhalten die Werte
MCp = 1.375
MCpk = 1.057.
Da der korrigierte multivariate Prozessfähigkeitsindex kleiner als 1.33 ist, muss der Prozess
verbessert werden, sodass vor allem die Streuung der dynamische Steifigkeit Y2 kleiner
wird.
Beispiel 5.2.12: Akkubohrschrauber. Prozessfähigkeiten
Für das Plastikgehäuse des Akku-Bohrschraubers haben wir vorn die statistischen Toleranzgrenzen berechnet. Die statistischen Toleranzgrenzen unterscheiden sich von den gegebenen
CAD Toleranzen. Mit den statistischen Toleranzgrenzen haben wir die Fähigkeiten berechnet
und in der Tabelle 5.2.13 zusammengestellt.
Tabelle 5.2.13: Univariate Prozessfähigkeitsindizes Beispiel Akkubohrschrauber
Variable
Toleranzgrenzen
Thermoschrumpf
Axialität
Parallelität
Dicke
untere
obere
–0,52
–0,7
–1,4
2,76
2,72
0,7
1,4
3,44
Mittelwert
Stabw.
Cp
k
Cpk
1,5152
0,0097
0,0788
3,137
0,4743
0,205
0,496
0,094
1,138
1,138
0,941
1,207
0,256
0,014
0,056
0,108
0,847
1,122
0,888
1,076
Die multivariaten Prozessfähigkeitsindizes sind:
MCp
1,0963
D
1,4317
MCpk 0,766
Da MCpk < 1 ist, muss der Prozess so verbessert werden, dass die Streuungen für die Produktvariablen kleiner werden.
Der Vektor der Produktvariablen kann aber auch der allgemeineren Klasse der elliptisch
umrissenen Verteilungen zugeordnet werden, zu der natürlich auch die Normalverteilungen
gehören. Diese Klasse ist durch die Verteilungsdichte charakterisiert
fY ( y ; μ, Σ) = ΣYY
−
1
2
−1
g ⎡⎣(Y − μY )T ⋅ ΣYY
⋅ (Y − μY )⎤⎦ ,
wobei g eine nicht wachsende Funktion ist. Wählt man für g die Funktion
−
g (u) = (2 π)
m
2
⋅e
1
− ⋅u
2
dann erhält man die Verteilungsdichte der m-dimensionale Normalverteilung. Der Exponent
−1
(Y − μY )T ⋅ ΣYY
⋅ (Y − μY )
der multivariaten normalen oder elliptisch umrissenen Dichte spezifiziert die Gleichung
eines Hyperellipsoides im m-dimensionalen Raum, wenn er gleich einer beliebigen positiven
Konstante c gesetzt wird.
1316han05.indd 208
25.07.2006 11:39:12
209
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?
Beispiel 5.2.13: Karosseriebau. Multivariate Fähigkeiten
An einer Karosserie wurden nach dem Tür-, Heckklappen- und Motorhaubeneinbau m = 73
Produktvariable, wie Spaltmaße, Symmetrien, Parallelitäten, Längen, Höhen, Distanzen
usw. gemessen. Der Stichprobenumfang betrug N = 228.
Der Grad der Multikollinearität war sehr hoch, d. h. die Determinante der Korrelationsmatrix der Produktvariablen nahm den überaus kleinen Wert Det(RYY) = 2,2 10–135 an. Aus
der Analyse wurden über das Red-Auswahlverfahren und die multiple Korrelationsanalyse
p = 59 Produktvariable gestrichen.
Die übrig gebliebenen Produktvariablen wurden neu mit Y1, …, Y14 nummeriert.
Die gegebenen Toleranzen für alle Produktvariablen wurden nach der arithmetischen
Tolerierung berechnet. Diese setzt aber die Unabhängigkeit der Produktvariablen, d. h.
Det(RYY) ≅ 1 voraus. Der tatsächliche Wert für die Determinante der Korrelationsmatrix
liegt aber sehr viel näher an Null als an der Eins! Hieraus folgt, dass auf alle Fälle das Ergebnis der gegebenen Tolerierung infrage gestellt werden muss.
Die statistischen Toleranzgrenzen wurden berechnet und in der Tabelle 5.2.14 zusammengestellt.
Tabelle 5.2.14: Produktvariable mit den statistischen Maßzahlen und den Toleranzgrenzen
Produktvar.
Mittelwert
Standardabw.
Tu
To
Dimension
Y1
0,51
0,4435
–0,924
1,944
mm
Y2
–0,5144
0,1904
–1,172
0,142
mm
Y3
–0,3546
0,0512
–0,528
–0,182
mm
Y4
–0,211
0,5532
–0,638
0,216
mm
Y5
1,558
0,1154
1,016
2,1
mm
Y6
–0,1112
0,088
–0,576
0,353
mm
Y7
1,671
0,115
1,188
2,154
mm
Y8
–0,0916
0,1305
–0,802
0,62
mm
Y9
0,0171
0,0615
–0,208
0,242
mm
Y10
–0,1681
0,0841
–0,498
0,162
mm
Y11
–0,1603
0,0566
–0,464
0,143
mm
Y12
–0,5871
0,0814
–0,865
–0,309
mm
–0,0445
0,1017
–0,292
0,203
mm
0,8507
–19,919
–11,131
mm
Y13
Y14
–15,525
Die berechneten statistischen Toleranzgrenzen wurden mit dem Vertragspartner abgestimmt
und akzeptiert.
Mit den berechneten Toleranzgrenzen wurde die uni- und multivariaten Prozessfähigkeitsindizes berechnet und in Tabelle 5.2.15 zusammengestellt.
Nur eine der univariaten, korrigierten Prozessfähigkeitsindizes ist kleiner als 1 und fünf
sind kleiner als 1.33. Für die Entscheidung, ob der Prozess verbessert werden muss, ist die
Berechnung der multivariaten Prozessfähigkeitsindizes unerlässlich.
1316han05.indd 209
25.07.2006 11:39:12
210
5 Qualität in der Fertigung
Tabelle 5.2.15: Univariate Prozessfähigkeiten für die wesentlichen Produktvariablen
Prod.Par.
Cp
k
Cpk
Y1
Y2
1,0778
0,0003
1,0775
1,15
0,001
1,1489
Y3
1,1483
0,0023
1,1458
Y4
1,5436
0,0001
1,5436
Y5
1,5653
0,0001
1,5652
Y6
1,7585
0,0006
1,7573
Y7
1,3993
0,0001
1,3993
Y8
1,8158
0,0008
1,8143
Y9
1,2187
0,0004
1,2183
Y10
1,3081
0,0004
1,3076
Y11
1,7863
0,0006
1,7852
Y12
1,1382
0,0002
1,1377
Y13
0,8108
0,0002
0,8107
Y14
1,7216
0,0001
1,7215
Die multivariaten Prozessfähigkeitsindizes sind
PCp = 1,5518
PCpk = 1,5517
Die multivariaten Prozessfähigkeitsindizes besagen, der Prozess ist in Ordnung. Trotzdem
muss der Prozess mit den multivariaten Kontrollkarten kontinuierlich überprüft werden.
5.3
Vergleich verschiedener Tolerierungsverfahren
an 6- und 5-dimensionalen Beispielen
Für die Tolerierung gibt es, wie wir gesehen haben, verschiedene Herangehensweisen. Einmal
die Art der Tolerierung, die von Technikern eingeführt wurde und den technischen Aspekt in
den Vordergrund stellt. Mathematisch basiert diese Art der Tolerierung auf dem Fehlerfortpflanzungsgesetz und letztlich auf der Faltung voneinander unabhängiger Zufallsgrößen.
Die andere von Jahn eingeführte multivariate statistische Tolerierung basiert auf den Tatsachen, dass
•
•
•
•
•
es nicht nur Montageprozesse gibt,
das Produkt eines jeden (Herstellungs- oder Service-) Prozesses durch m,
m ≥ 1 nicht unabhängige Produktvariable Y1, …, Ym beschrieben wird,
die Produktvariablen Realisierungen von Zufallsgrößen sind und
die Sollwerte und Toleranzgrenzen für jeden Prozess Zielwerte der Steuer- und Regelung
sind.
1316han05.indd 210
25.07.2006 11:39:12
5.3 Vergleich verschiedener Tolerierungsverfahren
5.3.1
211
Charakteristische Zusammenhänge zwischen Funktionssicherheit
und Toleranz aus Sicht der Techniker
Hoffmann [1986] definiert einige bedeutende Grundlagen, wie z. B.
• die Funktionssicherheit ist die Einhaltung der für ein Erzeugnis vorgegebenen Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen.
Innerhalb der Funktionsfehlergrenzen ist das Erzeugnis funktionstüchtig.
• Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die Funktionstüchtigkeit beschreibenden Eigenschaften eines Erzeugnisses.
• Die Herstellungstoleranz ist Differenz zwischen dem oberen und unteren erreichten
Grenzwert bei der Herstellung mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigerzeugnisse.
• Die Maßtoleranz ist die Differenz zwischen dem zulässigen Größt- und Kleinstmaß.
• Die Messtoleranz ist die Differenz zwischen der zulässigen oberen und unteren Abweichung
des Messwertes von der Messgröße. (Fehlergrenze der Messung).
Die Funktionstoleranz ist in der Regel größer als die Maßtoleranz. Die Herstellungstoleranz und
die Messtoleranz sind bei beherrschter Produktion grundsätzlich kleines als die Maßtoleranz.
Die verschiedenen Toleranzen müssen für ein Projekt optimiert werden, denn
• kleiner werdende Toleranzen führen zu höheren Fertigungs- und Prüfkosten,
• größer werdende Toleranzen führen zu höheren Kosten für Nacharbeit und zusätzlichen
Leistungen bei der Montage (Siehe Beispiel Akku-Bohrschrauber – MOST: Maynard Operation Sequence Technic, Zeitmessungen bei der Montage).
Grundsätzlich ist anzustreben, die Produktion zu „entfeinern“, d. h. die Herstellungstoleranzen
so groß wie möglich zu machen. Andererseits ist erwiesen, dass die Verringerung des spezifischen
Aufwandes an vergegenständlichter und lebendiger Arbeit nur durch eine Einengung vor allem
der Herstellungs-, aber auch der Funktions- und Messtoleranzen möglich ist. Gründe für das
Nichterreichen der Fertigungssollmaße können sein:
•
•
•
•
•
•
Ungenauigkeiten der Maschinen, Werkzeuge, Vorrichtungen,
Verschleiß der Maschinen, Werkzeuge und Vorrichtungen,
Einstellfehler an Maschinen, Werkzeugen und Vorrichtungen,
elastische Verformungen durch Spann- und Schnittkräfte,
Verformungen durch Temperatureinfluss,
zufällige Fehler.
Was muss alles gemessen werden?
Die Produktvariablen Y1, …, Ym, (nach Hoffmann [1986] die Werkstückabmessungen), die
Input- und Prozessvariable (nach Hoffmann: Werkzeugeinstellung, Verschleiß, Schnittkräfte,
Drehzahl, Drehmoment, Spannkräfte, Temperaturen, …) und die noise Variablen müssen
gemessen werden, wenn eine vernünftige Tolerierung bewerkstelligt werden soll.
1316han05.indd 211
25.07.2006 11:39:12
212
5 Qualität in der Fertigung
Wie werden Maß- und Toleranzketten aufgebaut?
Wie üblich benötigen wir einige neue Definitionen, bevor wir mit dem Aufbau der Maßketten
beginnen können.
Maßkette
Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Werte sich
summieren. Die Maßkette ist eine Aneinanderreihung von zusammenwirkenden Einzelmaßen
und dem von ihnen abhängigen Schlussmaß. Die Maßkette bildet einen Linienzug, d. h. eine
Masche. Die Einzelmaße sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette
ist ihre Geschlossenheit.
Bei der Berechnung der Maßketten ist zu beachten, dass die Einzelmaße aus unterschiedlichen
Systemen stammen können, und zwar dem herzustellenden Gerät (Produkt), dem Werkstück
(Input) oder der Werkzeugmaschine, Vorrichtung, Werkzeug (Prozess). Die in Klammern
stehenden Bezeichnungen stellen die Verbindung zu meiner viel allgemeineren Theorie der
Tolerierung dar.
Zur Berechnung der Maßkette werden für die Einzelmaße Mj, j = 1, …, m die Nennmaße Nj,
und die dazu gehörenden Toleranzmittenabmaße ECj, oder Erwartungsabmaße EEj bestimmt.
Auftretende Spiele werden mit der halben Größe des Kleinstspiels ½ Skj wie Einzelmaße behandelt. Für das Schlussmaß M0 bestimmt man das Nennmaß N0 und die zugehörige Toleranz
EC0, oder das Erwartungsabmaß EE0. Ist die Schlusstoleranz eine Passtoleranz oder ein Spiel,
so wird das Toleranzmittenabmaß EC0 oder das Erwartungsabmaß EE0 durch das mittlere oder
halbe Größtspiel ½ Sg0 gebildet.
Es werden die folgenden Bezeichnungen verwendet:
Nennmaß
Einzelmaß
Istmaß
Größtmaß
Kleinstmaß
Toleranzmittenmaß
Erwartungsmaß
Istabmaß
Oberes Abmaß
Unteres Abmaß
Toleranzmittenabmaß
=
=
=
=
=
=
=
=
=
=
=
N ist das Maß auf das die Maßkette bezogen wird,
Mj (mitunter sind Einzel- und Nennmaße gleich),
I ist das Maß des gefertigten Werkstücks,
G ist das zulässiges Maximum des Istmaßes,
K ist das zulässiges Minimum des Istmaßes,
C ist der arithmetische Mittelwert aus Größt- und Kleinstmaß,
E ist der arithmetische Mittelwert aus eine Serie von Istmaßen,
Aj ist die Differenz zwischen Ist- und Nennmaß,
ES ist die Differenz zwischen Größt- und Nennmaß,
El ist die Differenz zwischen Kleinst- und Nennmaß,
EC ist die Differenz zwischen Toleranzmittenmaß und Nennmaß,
Erwartungsabmaß
= AE ist die Differenz zwischen Toleranzmitten- und Nennmaß,
Maßtoleranz, Toleranz = T ist die Differenz zwischen Größt- und Kleinstmaß,
Spiele
= S ist die halbe Größe des Kleinstspiels = 1/2 Skj, sie werden wie
Einzelmaße behandelt,
Anzahl der Spiel- und Übergangspassungen = e
Koeffizient der relativen cj = 2 sj / Tj Standardabweichung,
Koeffizient der relativen aj = (AEj – ECj) / Tj und die Asymmetrie.
1316han05.indd 212
25.07.2006 11:39:12
5.3 Vergleich verschiedener Tolerierungsverfahren
5.3.2
213
Berechnung von Maß- und Toleranzketten für vollständige
Austauschbarkeit
Maßketten
Das Nennmaß N0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen Maßkettengliedern additiv aus den Nennmaßen Nj der j = 1, …, m Einzelmaße Mj zusammen.
m
∑ kj N j ,
N0 =
j =1
wobei kj den Richtungskoeffizient des j-ten Einzelmaßes auf das Schlussmaß bezeichnet. Dieser
Koeffizient ist gleich +1, wenn der Einfluss des Einzelmaßes positiv ist. Positive Einzelmaße
bewirken bei ihrer Vergrößerung oder Verkleinerung eine gleichsinnige Veränderung des
Schlussmaßes.
Ist das Nennmaß N0 des Schlussmaßes bekannt und sind die Nennmaße Nj der Einzelmaße
unbekannt, so ergibt sich für das j-te Nennmaß die Berechnungsformel
1
kj
Nj =
j −1
m
⎛
⎞
N
−
⎜ 0 ∑ kl N j − ∑ kl N j ⎟
⎝
⎠
l =1
l =1
wobei j = 1, …, m die Laufvariable und m die Anzahl der Einzelmaße ohne Schlussmaß ist. Sind
die Toleranzmittenabmaße ECj der Einzelmaße gegeben und soll aus denen das Toleranzmittenabmaß EC0 des Schlussmaßes berechnet werden, so ist unter Beachtung aller e Spiel- und
Übergangspassungen die funktionell mindestens erforderliche Spiel- und Übergangspassung
m−e
∑
EC0 =
j =1
k j ECj −
1 m
∑ Skj ,
2 j = m − e −1
zu berechnen.
Toleranzketten
Sind die Einzeltoleranzen Tj, j = 1, …, m der Einzelmaße und die Kleinstwerte der Spiel- und
Übergangspassungen gegeben, so beträgt die Schlusstoleranz T0 des Schlussmaßes
T0 =
m −e
m
j =1
j = m − e −1
∑ Tj + ∑
Skj ,
wobei e die Anzahl der Spiel- und Übergangspassungen ist. Skj bezeichnet das Kleinstspiel des
Maßes j. Die Einzeltoleranz Tj des j-ten Einzelmaßes resultiert aus
j −1
m −e
m
l =1
l = j +1
j = m − e +1
Tj = T0 − ∑ Tl −
∑ Tl − ∑
Skj
Dieser Ausdruck ist für m > 1, e > 1 unbestimmt. Daher wird zunächst für jedes Einzelmaß
eine durchschnittliche Einzeltoleranz
T =
1 ⎛
⎜T0 −
m−e⎝
⎞
Skj ⎟
⎠
j = m − e −1
m
∑
berechnet. Anschließend werden auf dieser Grundlage die Einzeltoleranzen berechnet.
1316han05.indd 213
25.07.2006 11:39:12
214
5 Qualität in der Fertigung
Beispiel 5.3.1: Einfaches Getriebe. Maßketten
Ein einfaches Getriebe wird durch die folgende Skizze beschrieben.
M5
M1
M2
M4
M3
M0
Abb. 5.3.1: Schematische Darstellung des einfachen Getriebes
Die Maßkette für das einfache Getriebe besteht aus 6 Gliedern, die sich aus m = 5 Einzelmaßen und dem Schlussmaß zusammensetzt. Der Konstrukteur gab die Nennmaße Nj,
j = 1, …, 5 für die einzelnen Glieder vor. Die Richtungskoeffizienten resultieren aus dem
Verlauf der Maßkette und sind k1 = +1, k2 = +1, k3 = –1, k4 = –1, k5 = –1 und k0 = –1.
Die Werte für die Nennmaße Nj, Toleranzen Tj, Richtungskoeffizienten kj, Toleranzmittenabmaße ECj und der Einzelmaße Mj sind aus der folgenden Wertetabelle zu entnehmen.
Tabelle 5.3.1: Wertetabelle für die Tolerierung in [mm]
j
Nj
0
0
Tj
kj
0,15
–1
ECj
0,105
Mj
0
+ Tj, – Tj oder ±Tj
0,18
0,03
1
25
0,033
1
0,035
25
0,0515
0,0185
2
40
0,04
1
0,04
40
0,06
0,02
3
4
2,5
60
0,015
–1
0,047
–1
0
–0,03
2,5
60
±5700,0
–0,0065
–0,0535
5
1316han05.indd 214
2,5
0,015
–1
0
2,5
±5700,0
25.07.2006 11:39:13
5.3 Vergleich verschiedener Tolerierungsverfahren
215
Die Mj bedeuten hierbei
⎧⎪ ECj + 0.5 Tj
Mj = Nj + ⎨
.
⎪⎩ ECj − 0.5 Tj
Das Nennmaß des Schlussgliedes ist N0 = 25 + 40 –2.5 – 60 – 2.5 = 0 [mm]. Die Summe der
Einzeltoleranzen Tj ergibt die Schlusstoleranz
T0 = 0.033 + 0.04 + 0.015 + 0.047 + 0.015 = 0.15 [mm].
Um den freien Lauf der Getriebewelle im Gehäuse zu gewährleisten, soll das untere Abmaß
mindestens eju0 = 0.03 [mm] betragen. Das Toleranzmittenabmaß des Schlussmaßes muss
dann mindestens EC0 = eju + 0.5 T0 = (0.03 + 0.075) [mm] = 0.105 [mm] sein. Das Toleranzmittenabmaß des Schlussmaßes ist
EC0 = k1 EC1 + k2 EC2 +k4 EC4 = (+1) 0.035 + (+1) 0.04 + (–1) – 0.03 = 0.105 [mm].
Mit der Schlusstoleranz T0 0.15 [mm] und dem Toleranzmittenabmaß EC0 lassen sich schließlich
die oberen und unteren Abmaße eso0 = 0.18 [mm] und esu0 = 0.03 [mm]berechnen. Das axiale
größte Spiel beträgt Sg = 180 [µm] und das axiale kleinste Spiel Sk = 30 [µm].
Warum habe ich bisher die technische Tolerierung nicht verstanden?
Warum fiel es mir schwer, diese Art der Tolerierung zu verallgemeinern?
Weil:
• drei- oder zweidimensionale Gebilde der Einfachheit wegen auf den R1 (den eindimensionalen Vektorraum) reduziert wurden, obwohl das nicht unbedingt einzusehen ist und
• daher die Metrik nicht verallgemeinerungsfähig ist.
5.3.3
Verallgemeinerung der Tolerierung
Für die Verallgemeinerung der Tolerierung wird der reelle Vektorraum benötigt, um z. B. dreidimensionale Gebilde auch dreidimensional behandeln zu können. Ein Getriebe z. B. ist nun
einmal ein dreidimensionales Gebilde. Die Reduktion der Dimension des Raumes auf die Ebene
oder wie bei der Tolerierung durch Maß- und Toleranzketten auf den R1 hat offensichtlich nur
den Zweck der Vereinfachung.
Der reelle Vektorraum
Für die Definition von Vektoren benötigt man den Vektorraum. Wir wollen hier den dreidimensionalen realen physikalischen Anschauungsraum R3, indem wir alle uns befinden, betrachten.
Ein Element dieses Raumes, ein Punkt in diesem Raum wird durch ein dreier- Tupel (x1, x2, x3)
reeller Zahlen charakterisiert. Mit diesen reellen Zahlen kann man rechnen.
Sind (x1, x2, x3) und (y1, y2, y3) solche drei-Tupel reeller Zahlen, so werde deren Summe durch
(x1, x2, x3) + (y1, y2, y3) = (x1 + y1, x2 + y2, x3 + y3) erklärt. Die Summe ist wieder ein drei-Tupel
reeller Zahlen. Ist λ ∈ R1 und (x1, x2, x3) ∈ R3, so ist λ (x1, x2, x3) = (λ x1, λ x2, λ x3) ∈ R3.
Da die Rechenoperationen dadurch entstanden sind, dass einfach die Operationen des Rechnens
mit reellen Zahlen auf die Komponenten (x1, x2, x3) des R3 übertragen wurden, so übertragen
sich auch deren Rechenregeln. Wählt man einen Punkt 0 zum Nullpunkt, so kann man alle
1316han05.indd 215
25.07.2006 11:39:13
216
5 Qualität in der Fertigung
Punkte als Ortsvektoren bezüglich null auffassen, kann sie mit reellen Zahlen multiplizieren
und wie im Kräfteparallelogramm addieren. Dadurch erhält man einen Vektorraum.
Definition: Ein Tripel (V, +, ⋅) bestehend aus einer Menge V, einer Addition und einer Multiplikation heißt ein reeller Vektorraum.
Die Physiker verstehen unter Vektoren etwas anderes als die Mathematiker. Daher soll der
Gesichtspunkt der Physiker in den Blickpunkt gerückt werden, denn die Tolerierung fällt im
weitesten Sinne in das Gebiet der Physiker. Nach diesem Gesichtspunkt werden Vektoren durch
ihre Größe (quantity), Richtung (direction) und ihren Betragt (magnitude) erklärt. Der Betrag
eines Vektors, die Norm z. B. aus dem R3 wird durch
x =
x12 + x22 + x32
definiert. (Das ist der Satz des Pythagoras.) Für zwei Vektoren x1, x2 ∈ R3 nennt man die Zahl
⟨x1, x2⟩ = x11 x21 + x12 x22 + x31 x23 das Skalarprodukt von x1 und x2. Einen reellen Vektorraum
mit einem Skalarprodukt nennt man einen euklidischen Vektorraum.
Der Winkel zwischen den beiden Vektoren x1 und x2 wird durch
α (x1 , x2 ) = arccos
x1 , x2
x1 x2
für x1 ≠ 0 und x2 ≠ 0
,
berechnet.
Mit dieser Definition kann die Orthogonalität zwischen Vektoren definiert werden. Ein r-Tupel
von Vektoren (x1, …, xr) ∈ Rn heißt orthogonal, wenn x j = 1, j = 1, … r und ⟨xj, xk⟩ = δjk.
Beispiel 5.3.2: Einfaches Getriebe. Ortsvektoren
Wir betrachten wieder das Getriebebeispiel. Es wird das Koordinatensystem x1, x2 eingeführt und als Benchmark für alle Punkte betrachten wir die beiden Ortsvektoren, die wir
mit m1 und m2 bezeichnen.
x2
M5
M1
M2
m2
m1
M6
M4
x1
0
M3
M0
Abb. 5.3.2: Getriebe mit zwei Ortsvektoren anstelle der üblichen Bemaßung
1316han05.indd 216
25.07.2006 11:39:13
5.3 Vergleich verschiedener Tolerierungsverfahren
217
Ortsvektoren ordnen jedem Punkt Mj der Ebene (des Raumes) die Verschiebung
mj = Mj – 0, j = 1, …, n
zu.
Aus der Abbildung und der Wertetabelle kann man ablesen, das z. B.
m1 = (M2, M6)T = (40, 40)T
m2 = (M3, M6)T = (65, 40)T.
Damit erhalten wir
⎛ 65 ⎞ ⎛ 40 ⎞ ⎛ 25 ⎞
m2 − m1 = ⎜ ⎟ − ⎜ ⎟ = ⎜ ⎟
⎝ 40 ⎠ ⎝ 40 ⎠ ⎝ 0 ⎠
Auf diese Art kann man alle Punkte einer Abbildung (einer Ebene oder eines Raumes) als
Ortsvektoren darstellen und die Abstände durch Bildung der Differenzen von Vektoren ermitteln.
Ein weiterer wesentlicher Begriff ist die Linearkombination von Vektoren. Sind x1, …, xr Vektoren aus dem n-dimensionalen Euklidischen Vektorraum Rn, dann nennt man λ1 x1 + … + λr
xr = y eine Linearkombination, wobei λj ∈ R1 . Die Menge aller Linearkombinationen heißt
lineare Hülle des r-Tupels von Vektoren.
Ein r-Tupel x1, …, xr von Vektoren aus dem Euklidischen Vektorraum heißt linear abhängig,
wenn einer dieser Vektoren aus den anderen linear kombiniert werden kann. Diesen linear
kombinierten Vektor kann man dann ohne Schaden für die lineare Hülle weglassen. Mit dieser
Definition kann man natürlich auch die lineare Unabhängigkeit definieren. V sei wieder ein Vektorraum, x1, …, xr ∈ V. Dieses r-Tupel heißt linear unabhängig, wenn eine Linearkombination
von x1, …, xr nur dann null sein kann, wenn alle Koeffizienten verschwinden, d. h. wenn aus
λ1 x1 + … + λr xr = 0
stets folgt, dass λ1 = … = λr = 0. Man kann auch sagen, (x1, …, xr) ist genau dann linear unabhängig, wenn keiner dieser Vektoren Linearkombination der übrigen ist.
Sei jetzt y = λ1 x1 + … + λn xn eine Linearkombination von n Vektoren aus dem Euklidischen
Vektorraum. Damit bilden wir das Skalarprodukt mit dem Vektor x, d. h.
⎛ y1 ⎞
x , y = (x1 … xn ) ⎜ … ⎟ = a1 x1 x1 + … + an xn xn =
⎜ ⎟
⎝ yn ⎠
n
∑ aj x j x j
j =1
⎛ a1 … 0 ⎞ ⎛ x1 ⎞
= (x1 … xn ) ⎜ 0 … 0 ⎟ ⎜ … ⎟ .
⎜
⎟⎜ ⎟
⎝ 0 … an ⎠ ⎝ xn ⎠
Eine solche Form nennt man quadratische Form und schreibt abkürzend dafür
xT A x = QA(x).
1316han05.indd 217
25.07.2006 11:39:14
218
5 Qualität in der Fertigung
Beispiel 5.3.3: Quadratische Form
Betrachten wir (x1, x2) ∈ R2,
Fall 1:
⎛1 0⎞
A=⎜
, dann ist die quadratische Form
⎝ 0 1 ⎟⎠
⎛ 1 0 ⎞ ⎛ x1 ⎞
⎛ x1 ⎞
Q A (x) = (x1 x2 ) ⎜
= (x1 x2 ) ⎜ ⎟ = x12 + x22 .
⎟
⎜
⎟
⎝ 0 1 ⎠ ⎝ x2 ⎠
⎝ x2 ⎠
In diesem Falle gilt Q A (x) = x .
Betrachten wir den konkreten Vektor xT = (x1, x2) = (0.8, 0.3), dann gilt
⎛ 1 0 ⎞ ⎛ 0.8 ⎞
(0.8 0.3) ⎜
= 0.73 und 0.73 = 0.854.
⎝ 0 1 ⎟⎠ ⎜⎝ 0.3 ⎟⎠
Fall 2:
⎛1 c ⎞
Es sei A = ⎜
, c ≤ 1 , so dass A positiv definit ist. In diesem Fall gilt
⎝ c 1 ⎟⎠
⎛ 1 c ⎞ ⎛ x1 ⎞
⎛ x1 ⎞
= (x1 + c x2 c x1 + x2 ) ⎜ ⎟
Q A (x) = (x1 x2 ) ⎜
⎟
⎜
⎟
⎝ c 1 ⎠ ⎝ x2 ⎠
⎝ x2 ⎠
= x12 + 2 c x1 x2 + x22 .
Hieraus folgt
x12 + 2 c x1 x2 + x22
ist die Länge des Vektors x, wenn die Komponenten von x nicht linear unabhängig voneinander sind.
Betrachten wir anstelle der Einheitsmatrix die positiv definite Matrix
⎛ 1 0.6 ⎞
A=⎜
⎝ 0.6 1 ⎟⎠
dann erhält man für die quadratische Form
⎛ 1 0.6 ⎞ ⎛ 0.8 ⎞
⎛ 0.8 ⎞
(0.8 0.3) ⎜
= (0.8 + 0.18 0.18 + 0.3) ⎜ ⎟
⎝ 0.6 1 ⎟⎠ ⎜⎝ 0.3 ⎟⎠
⎝ 0.3 ⎠
= 0.928 und 0.928 = 0.9633.
Die beiden Längen des Vektors x sind je nachdem, ob die Matrix eine Diagonal- oder vollständige Matrix ist, verschieden.
Erinnern wir uns daran, dass bei der Konstruktion von Produkten, insbesondere Montageprodukten, Toleranzketten verwendet werden können, diese aber nicht auf alle Produkte,
z. B. chemische Produkte und die Fertigung übertragen werden können, dann sind weitere
Verallgemeinerungen notwendig.
1316han05.indd 218
25.07.2006 11:39:14
219
5.3 Vergleich verschiedener Tolerierungsverfahren
Insbesondere nach der Herstellung der Produkte können die Messwerte für die verschiedenen
Produktvariablen nicht mehr als beliebige reelle Zahlen, sondern müssen als Realisierungen
von Zufallsgrößen angesehen werden.
5.3.3.1
Statistische Tolerierung
Der Ausgangspunkt bei dieser Art der Tolerierung ist, dass die Einzelmaße Y1, …, Ym unabhängig und identisch nach Fj(yj) j = 1, …, m verteilt sind. Die Toleranzen To,j und Tu,j, j = 1, …, m
sind entweder unbekannt oder sollen mit den Maßen, an gefertigten Produkten gemessen,
überprüft werden. Sind die Zufallsgrößen außerdem normal verteilt mit den Erwartungswerten
µj und σj2, dann gilt, die Summenvariable
Y =
m
∑ Yj
j =1
ist normal verteilt mit den beiden Momenten
μ=
m
∑
j =1
μ j und σ 2 =
m
∑ σ2j .
j =1
Sind die Einzelmaße nicht normal verteilt, dann folgt aus dem zentralen Grenzwertsatz der
Wahrscheinlichkeitsrechnung, dass die Summenvariable approximativ normal verteilt ist,
ebenfalls mit den Summenmomenten.
Nach der 3 σ-Regel liegen mit der Wahrscheinlichkeit 1 – α = 1 – 0.0027 = 0.9973 fast alle
Realisierungen einer normal verteilten Zufallsgröße im Intervall µ ± 3 σ. Hieraus folgt die
Toleranzbreite To – Tu sollte 6 σ sein.
Die Toleranzkette kann unter diesen Voraussetzungen nach der Formel
m
T = 6 ∑ Sj
j =1
berechnet werden, wobei die Sj die Stichprobenstandardabweichungen für die Einzelmaße Mj,
j = 1, …, m sind.
Beispiel 5.3.4: Einfaches Getriebe. Tolerierung
Fall 1: Wir nehmen an, dass Y1, …, Y6 unabhängig voneinander sind. An N Getrieben
wurden die obigen Maße gemessen. Die statistischen Maßzahlen sind
Tabelle 5.3.2: Statistische Maßzahlen für die Maße des Getriebes
Y0
Y1
Y2
Y3
Y4
Y5
–6,6976445
2498,2527947 3998,0283577 249,3489343
5997,5019191 249,4489296
Mean:
0,1312104
2499,9594152 4000,0388603 250,0179791
5999,9552836 249,9896311
Max:
6,3486367
2501,4088584 4002,4427941 250,5956959
6001,6589824 250,5393647
Std.Dev.:
2,3978975
Min:
0,6064117
0,7160356
0,2388075
0,7569649
0,2253856
Die Korrelationsmatrix zur Überprüfung der Voraussetzung der Unabhängigkeit ist in der
Tabelle 5.3.3 zusammengestellt.
1316han05.indd 219
25.07.2006 11:39:14
220
5 Qualität in der Fertigung
Tabelle 5.3.3: Korrelationsmatrix für die 6 Maße des Getriebes
Y0
Y0
Y1
1
Y2
0,1388
1
Y1
Y3
Y4
Y5
0,0211
0,005
–0,0144
–0,0351
–0,1343
–0,065
–0,0746
0,028
0,1598
–0,0264
–0,0264
–0,0899
1
Y2
0,0246
Y3
1
1
Y4
0,0213
1
Y5
Die Korrelationskoeffizienten für alle Paare von Maßen sind sehr klein. Das globale Maß
für die Korreliertheit ist det (R) = 0.9150239. Die univariate statistische Tolerierung kann
angewandt werden. Wir erhalten die Toleranzgrenzen in der Tabelle 5.3.4.
Tabelle 5.3.4: Toleranzgrenzen nach der univariaten statistischen Tolerierung
Variable
Mittelwert
6* Stabw.
Zielwert
Toleranzgrenze
untere
Y0
0,1312
obere
14,3874
0
Y1
2499,95
3,6385
2500
2497,35
2502,65
Y2
4000,04
4,2962
4000
3996,86
4003,14
Y3
250,02
1,4328
250
248,94
251,06
Y4
5999,95
4,5418
6000
5996,67
6003,33
1,3523
250
249,9896
Y5
–10,6188
248,996
10,6188
251,004
Für das Schließmaß T0 erhalten wir nach der obigen Formel (6* Sigma)
T0 = 3.6385 + 4.2962 + 1.4328 + 4.5418 + 1.3523 = 15.2616,
d. h. in etwa den mit CAD geplanten Wert von 15, bzw. nach Division durch 100 den Wert
T0 = 0.1526. Die Vergleiche der uni- und multivariaten statistischen und CAD Tolerierung
sind in der Tabelle 5.3.5 enthalten. Der Einfachheit halber wurden in diese Tabelle nur die
Toleranzbreiten (nach Division durch 100) aufgenommen.
Tabelle 5.3.5: Vergleich der der statistischen Toleranzbreiten und der CAD Toleranzbreiten
Maß
1316han05.indd 220
Statistische Tolerierung
CAD Toleranzen
univariat
multivariat
6* sj
To – Tu
To – Tu
Y0
0,1438
0,2123
0,15
Y1
0,0364
0,053
0,033
Y2
0,0429
0,0627
0,04
Y3
0,0143
0,0212
0,015
Y4
0,0454
0,0665
0,047
25.07.2006 11:39:15
221
5.3 Vergleich verschiedener Tolerierungsverfahren
Die Unterschiede resultieren aus den Standardabweichungen, die z. T. doch etwas größer
sind als (To – Tu)/6 und den doch vorhandenen, wenn auch kleinen Korrelationskoeffizienten.
Fall 2: Korrelierter Fall
Für den korrelierten Fall erhalten wir die statistischen Maßzahlen der Tabelle:
Tabelle 5.3.6: Statistische Maßzahlen für die Maße des Getriebes
Y0
Y1
Y2
Y3
Y4
Y5
Min:
–6,5002924
2498,1719699 3998,1664578 249,402514
5998,1848565 249,3888472
Mean:
–0,1628116
2499,9900478 3999,9855229 249,989664
5999,9347344 250,0006535
Max:
6,0165154
2501,5162199 4001,8814676 250,525068
6002,2974761 250,6449878
Std.Dev.:
2,3576676
0,5884604
0,6832856
0,240879
0,8346444
0,2479773
Die statistischen Maßzahlen unterscheiden sich nicht wesentlich von denen des Falles 1.
In der Tabelle 5.3.7 steht die Korrelationsmatrix.
Tabelle 5.3.7: Korrelationsmatrix
Y0
Y0
Y1
Y2
1
0,4212
0,3697
1
Y1
Y4
Y5
0,856
0,5342
0,7047
0,1977
0,3841
0,2669
0,0732
1
0,1893
0,1479
0,2386
1
0,3767
0,5799
1
0,1817
Y2
Y3
Y3
Y4
Y5
1
Die Korrelationsmatrix zeigt einige sehr große Korrelationskoeffizienten. Die Annahme
der Unabhängigkeit ist nicht mehr gerechtfertigt. Das globale Maß der Korreliertheit ist
det(R) = 0.04598723.
Die statistische Tolerierung liefert die Werte der Tabelle 5.3.8.
Tabelle 5.3.8: Uni- und multivariate statistische Toleranzen
Variable
Mittelwert
Stabw.
Zielwert
Toleranzgrenzen
untere
Y0
1316han05.indd 221
–0,1628
14,146
obere
0
–3,522
3,522
Y1
2499,99
3,5308
2500
2497,766
2502,234
Y2
3999,986
4,0997
4000
3997,293
4002,707
Y3
249,9897
1,4453
250
Y4
5999,9347
5,0079
6000
Y5
250,0007
1,4879
250
249,4806
5997,117
249,3086
250,5194
6002,883
250,6914
25.07.2006 11:39:15
222
5 Qualität in der Fertigung
Tabelle 5.3.9: Vergleich der statistischen und CAD Toleranzbreiten
Maß
Statistische Tolerierung
CAD Toleranzen
univariat
multivariat
6* sj
To – Tu
To – Tu
Y0
0,1415
0,0704
0,15
Y1
0,0353
0,0447
0,033
Y2
0,04099
0,0541
0,04
Y3
0,0144
0,0103
0,015
Y4
0,05
0,0577
0,047
Y5
0,0149
0,0138
0,015
Die univariate statistische Toleranzkettenformel liefert für die Schließtoleranz den Wert
T0 = 0.1556. Die multivariate statistische Tolerierung liefert im korrelierten Fall schmalere
Toleranzbreiten für die Einzelmaße. Die 6* S Toleranzen sind wiederum ähnlich denen im
unkorrelierten Fall. Das ist nicht verwunderlich, wirken sich doch in der Regel die korrelativen Abhängigkeiten nicht auf die Standardabweichungen der Einzelmaße aus.
Die multiplen Korrelationskoeffizienten für die Einzelmaße sind:
R20/1,2,3,4,5 = 0.8888, R21/0,2,3,4,5 = 0.28132, R22/0,1,3,4,5 = 0.21746,
R23/0,1,2,4,5 = 0.76823, R24/0,1,2,3,5 = 0.40528 und R25/0,1,2,3,4 = 0.61256.
Aus diesen Korrelationskoeffizienten liest man ab, dass sich das Schließmaß T0 am besten
aus den anderen Maßen ableiten lässt, oder anders gesprochen, die anderen Maße haben
einen großen Einfluss auf das Schließmaß. Folglich ist die Differenz zwischen der uni- und
multivariaten Berechnung für dieses Maß am größten.
5.3.3.2
Übung
Ein Produkt wird durch m nicht unabhängige Produktvariable Y1, …, Ym beschrieben. Der Vektor der Produktvariable YT = (Y1, …, Ym) ist ein zufälliger Vektor. Die Verteilung des zufälligen
Vektors Y gehöre zur Klasse der m-dimensionalen Normalverteilungen Y ~ Nm (µ, ΣYY), wobei
ΣYY positiv definit sein möge. Das von Ihnen zu untersuchende Produkt ist ein Tippgeber, der
in automatischen Schaltgetrieben benötigt wird.
Tabelle 5.3.10: Sollzustand für den Tippgeber
1316han05.indd 222
Variable
Sollwert
Toleranzgrenzen
Y1
14,23
±0,05
Y2
6,45
±0,05
Y3
0,55
±0,15
Y4
0,55
±0,15
Y5
2,25
±0,15
Y6
2,25
±0,15
25.07.2006 11:39:15
5.3 Vergleich verschiedener Tolerierungsverfahren
223
Diese müssen verschiedene Funktionen, wie z. B. die automatische Rückstellung in die
„=“ Position, geräuscharmes Schalten usw. realisieren. Die Tippgeber werden durch sechs
Produktvariablen charakterisiert. Der Sollzustand wird durch die Werte der Tabelle 5.3.10
beschrieben.
Problem
Der Kunde ist mit der Qualität der Tippgeber nicht zufrieden.
Was müssen Sie tun?
Sie müssen das Problem definieren.
Wie definieren Sie das Problem?
Dazu müssen Sie eine Stichprobe von Tippgebern zufällig der Fertigung entnehmen und die
Werte für die Produktvariablen messen.
Die Werte für den Tippgeber sind in der Datei Ü5.3 enthalten.
Für Sie habe ich die Daten dieser Datei als Star Plots visualisiert (siehe auch Seite 282).
46
40
30
20
10
1
Abb. 5.3.3: Star Plots für die Tippgeber
1316han05.indd 223
25.07.2006 11:39:15
224
5 Qualität in der Fertigung
Y3
. Y2
Y4
Y1
Y5
Y6
Abb. 5.3.4: Schlüssel für die Star Plots der Tippgeber
In der Abbildung 5.3.5 habe ich für Sie noch die Korrelationsdiagramme dargestellt.
Y2
Y3
Y4
Y5
Y6
Y1
Y2
Y3
Y4
Y5
Abb. 5.3.5: Korrelationsdiagramme für die Tippgeber
Welche Schlüsse ziehen Sie aus den beiden Abbildungen?
Definieren Sie bitte das Problem und überprüfen Sie die gegebene Tolerierung mit den beigefügten Programmen.
Was müssen Sie tun, um das Problem zu lösen?
5.4
Warum sollen Sie die Prozessdarstellung wählen?
Sie haben anerkannt, dass jede Tätigkeit und jedes (materielle und/oder immaterielle) Produkt
das Ergebnis eines Prozesses ist. Jetzt müssen Sie mir weiter folgen und den zugehörigen Prozess
strukturieren. Die Produktvariablen sind Funktionen der Input-, Prozess- und Störvariablen
und können nach dem Ursache-Wirkungs-Prinzip nur über diese Variablen verändert werden.
1316han05.indd 224
25.07.2006 11:39:15
5.4 Warum sollen Sie die Prozessdarstellung wählen?
225
äußere Variable (Störvariable)
Inputs
Prozess
Inputvariable
Prozessvariable
Ursachen
Produkt
Produktvariable
Wirkungen
Abb. 5.4.1: Prozessdarstellung
Die Inputvariablen, wie Material, Maschinen, Anlagen, Zusatzstoffe und auch die Fähigkeiten
der Mitarbeiter fließen mit ihren Eigenschaften in den Prozess hinein.
Die Produktvariablen müssen die spezifizierten Kundenanforderungen erfüllen. Über die Veränderung der Prozessvariablen muss aus den gegebenen Inputvariablen das Produkt mit seinen
geforderten Eigenschaften entstehen. Damit dieses spannende Zusammenspiel zwischen den
Variablen klappt, müssen die Inputvariablen, die ja Produktvariablen von Vorläuferprozessen
sind, ebenfalls die spezifizierten Anforderungen des Prozesses erfüllen. Die spezifizierten Anforderungen kann man beim Eintreffen der Inputs überprüfen (Wareneingangsprüfung) oder
man vereinbart in einem Dialog mit den Lieferanten, dass die Inputs mit ihren entsprechenden
uni- und multivariaten Fähigkeitsnachweisen geliefert werden.
Die Werte für die Prozessvariablen kann man auch nicht beliebig einstellen, da auf dieser Basis
bestimmt nicht das Produkt mit den geforderten Eigenschaften entsteht. Der Prozess muss mit
einer Prozessgleichung so gesteuert werden, dass bei Kenntnis der Inputvariablen das geforderte
Produkt herauskommt.
Beispiel 5.4.1: Drehen einer Welle. Prozessdarstellung
Aus einem Rundstahl soll eine Welle gedreht werden. Die Welle soll Kundenanforderungen
erfüllen. Zu diesen gehören die Maßhaltigkeit, die Rundheit, die Konizität und gewisse
Festigkeitseigenschaften.
Die Inputs sind der Rundstahlrohling, die Eigenschaften der Drehmaschine, der Kühlmittelstand usw. Zu den Prozessvariablen zählen die Drehgeschwindigkeit, die Kühlmitteltemperatur, die Standzeit der Schneidwerkzeuge usw. Die Menge der Produktvariablen umfasst
die Maßhaltigkeit, die Rundheit der Welle, d. h. die Differenz zweier Durchmesser vorn
und hinten an der Welle gemessen usw. Die Prozessdarstellung ist in der Abbildung 5.4.2
enthalten.
Fordert der Kunde vom Lieferanten (Dreherei) eine Welle z. B. mit einem spezifizierten
Elastizitätsmodul [N/m2], so muss der Wellenhersteller bei seinem Lieferanten für die
Rohlinge diese Eigenschaft anfordern, denn beim Drehen wird der Elastizitätsmodul kaum
verändert.
1316han05.indd 225
25.07.2006 11:39:15
226
5 Qualität in der Fertigung
äußere Variable (Störvariable)
Rundstahl,
Kühlflüssigkeit,
Schneidwerkzeug, ..
Inputvariable
Rundheit
Konizität
Stahleigenschaften
Ursachen
Drehen einer Welle
Prozessvariable
Drehgeschwindigkeit
Standzeit
Temp. Kühlflüssigkeit
Temp. Werkzeug
Stand der Kühlflüssigkeit,
..
...
Welle
Produktvariable
Rundheit
Konizität
Maßhaltigkeit
Wirkungen
Abb. 5.4.2: Drehen einer Welle
Dieses Beispiel zeigt schon, dass zwischen den Kunden und Lieferanten ein Dialog stattfinden
muss.
Wie kann man den Dialog zwischen Kunden und Lieferanten führen?
Bevor wir diesen Dialog aufbauen, wollen wir ein Netzwerk von Prozessen betrachten.
5.5
Warum müssen Sie Ihr Unternehmen als Netzwerk von
Dienstleistungs- und Fertigungsprozessen darstellen?
Ein Unternehmen muss durch Fertigungs- und Dienstleistungsprozesse strukturiert werden.
Ziele der Steuerung und Regelung des gesamten Unternehmens sind Erfüllung aller (Markt-)
Kundenanforderungen, Erwirtschaftung der notwendigen Gelder zur erweiterten Reproduktion, das Bestehen im internationalen Wettbewerb, die Steigerung der betriebswirtschaftlichen
Kennziffern und damit die Existenzsicherung. Die Strukturierung dient ebenfalls der Veränderung der Organisationsstruktur, nach der die Aufgaben und Verantwortlichkeiten eindeutig
festlegt und die Mitarbeiter dadurch motiviert werden, an der Realisierung der betrieblichen
Ziele mitzuwirken. Nicht zuletzt ist die Strukturierung auch die Grundlage für eine verbesserte Kostenrechnung auf der Basis des notwendigen Verbrauchs an allen Ressourcen, die z. B.
gewährleistet, dass die stetig steigenden, nicht aufschlüsselbaren Gemeinkostenzuschläge der
Vergangenheit angehören werden.
1316han05.indd 226
25.07.2006 11:39:15
5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk darstellen?
227
Wir betrachten zunächst zwei Prozesse, um daran die Vernetzung zu demonstrieren. Diese beiden Prozesse mögen einfach A und B heißen. Der eine Prozess, nehmen wir an, es sei der Prozess
B, soll der Vorläufer- oder Lieferantenprozess vom Prozess A sein. Der Prozess A verarbeitet die
Produkte von Prozess B, d. h. die Produkte B werden zu Inputs von A. Der Prozess A ist damit
der Kundenprozess von B. Folglich muss A formulieren, was er von B verlangt. A muss also
sein (Kunden-) Anforderungsprofil an B formulieren. B muss die Kundenanforderungen durch
Sollwerte und Toleranzgrenzen für alle Produktvariablen des Produktes B spezifizieren. B muss
dann seinen Prozess mit den Sollwerten für alle relevanten Produktvariablen als Zielwerte so
steuern und regeln, dass alle Anforderungen erfüllt werden. B muss außerdem den Nachweis
führen, dass die in B produzierten Produkte alle Kundenanforderungen erfüllen.
Die Produkte von A werden von einem weiteren (externen oder internen) Kunden benötigt.
Dieser Kunde stellt natürlich seine Anforderungen an die Produkte von A. Hieraus wird deutlich, dass jeder Prozess Kunden- und Lieferantenprozess zugleich ist.
Dieses Zusammenspiel ist in der Abbildung 5.5.1 schematisch dargestellt. Dieses Zusammenspiel zwischen zwei Prozessen ist in der Literatur unter dem Begriff „internes Kunden-Lieferanten-Verhältnis“ (KLV) bekannt geworden und charakterisiert in unserem Verständnis die
Schnittstelle zwischen zwei Prozessen. In der Literatur wird das KLV nur beschrieben, es kommt
aber darauf an, das KLV zu modellieren und zu realisieren.
Anforderungen
Inputs
Inputvariable
Prozess B
Prozessvariable
Produkt B
Input für A
Produktvariable
Prozess A
Prozessvariable
Produkt A
Produktvariable
Nachweis der
Erfüllung aller
Anforderungen
Vorläuferprozess
= Lieferant
Nachfolgerprozess
= Kunde
Abb. 5.5.1: Kunden-Lieferanten-Verhältnis
Beispiel 5.5.1: Papierfeeder. Prozessnetzwerk
Wir betrachten in der Abbildung 5.5.2 die Herstellung eines Papierfeeders als ein Netzwerk
von Prozessen, in denen mechanische Teile, elektronische Komponenten und Kunststoffteile
hergestellt werden.
Das Netzwerk sieht recht einfach aus. Aber wir haben das Netzwerk ohne Kommunikation
dargestellt. So kann das Netzwerk nicht funktionieren.
1316han05.indd 227
25.07.2006 11:39:16
228
5 Qualität in der Fertigung
Input
Inputvariable
Input
Kunststoffherst.
Plastikteile
Prozessvariable
Produktvariable
Metallherstellung
.
Inputvariable
Input
Prozessvariable
Elektroteileherst .
Inputvariable
Prozessvariable
Metallteile
Produktvariable
Montage
Prozessvariable
Feeder
Funktionen
Produktvariable Funktionen Par.
Elektroteile
Produktvariable
Abb. 5.5.2: Netzwerk von Herstellungsprozessen
5.6
Kommunikation zwischen Prozessen
Im Vorangegangenen haben wir alles Tun in einem Unternehmen durch Prozesse modelliert.
Wie haben des weiteren gesehen, dass die Prozesse nicht unabhängig voneinander sind, schon
allein deswegen, weil jeder Prozess Kunden- und Lieferantenprozess zugleich ist. Eine Kommunikation zwischen den Prozessen ist somit notwendig. Ohne diese beobachten wir das
tägliche Chaos.
Jede Kommunikation braucht eine Sprache. Die für die Kommunikation zwischen Prozessen
benötigte Sprache haben wir schon bereit gestellt. Diese Sprache hat die Worte bzw. Phrasen
(Teilsätze) oder Elemente
• Zusammenstellung des externes und/oder internen Kundenanforderungsprofils (KAP),
Parametrisierung der gewünschten Eigenschaften,
• Datengewinnung für die Produktvariablen,
• Spezifizierung des KAP durch Sollwerte und Toleranzgrenzen, mit der CAD oder statistischer Tolerierung,
• Nachweis der simultanen Erfüllung aller (ex- oder internen) Kundenanforderungen mit
uni- und multivariaten Prozessfähigkeitsindizes,
• Treffen einer Entscheidung auf der Grundlage der uni- und multivariaten Prozessfähigkeitsindizes für die statistische Prozessanalyse, falls die Fähigkeiten kleines als 1 sind,
– mit anschließender Prozessverbesserung durch die Steuerung der Prozesse mit der Prozessgleichung und den Sollwerten und Toleranzgrenzen als Zielwerte bzw. Zielgebiet,
1316han05.indd 228
25.07.2006 11:39:16
5.6 Kommunikation zwischen Prozessen
229
– Justierung der Prozesse, falls die einfachen uni- und multivariaten Prozessfähigkeitsindizes größer und die korrigierten Indizes kleines als 1 sind,
• laufende Kontrolle der Prozesse mit den uni- und vor allem multivariaten Kontrollkarten,
falls die einfachen und korrigierten Fähigkeiten größer als eins sind,
• neue Tolerierung, falls die Abhängigkeiten zwischen den Produktvariablen bei der Tolerierung vernachlässigt wurden,
• Investitionen, falls das vorherige Ausreizen aller Möglichkeiten nicht ausreichte, Produkte
zu produzieren, die alle Kundenanforderungen erfüllen und trotz der vorgegebenen Marktpreise durch den Verkauf einen Gewinn erzielen.
Wie man sehen kann, ist diese technische Sprache recht einfach. Die Schwierigkeit liegt in der
Bereitstellung der Elemente, die für Sprache benötigt werden, wie der Definition des Problems,
der Berechnung der Sollwerte und Toleranzgrenzen für alle, nicht unabhängigen Produktvariablen mit Hilfe CAD oder multivariaten statistischen Tolerierung, der Berechnung der uniund multivariaten Prozessfähigkeitsindizes, des Treffens einer Entscheidung, der Kontrolle der
Prozesse mit uni- und multivariaten Kontrollkarten und der Datenerfassung.
Diese Schwierigkeiten traten in der Vergangenheit auf, weil viele der genannten Elemente bisher,
aus mir nicht bekannten Gründen, nicht zur Verfügung standen. Im Abschnitt 5.3. habe ich
Ihnen die von mir entwickelten neuen Methoden für die Durchführung eines modernen Audits
zur Definition eines Problems und Entscheidungsfindung zur Verfügung gestellt.
Beispiel 5.6.1: Papierfeeder. Prozessnetzwerk mit Kommunikation
Wir betrachten jetzt, nachdem wir die Elemente der technischen Sprache genannt und im
Abschnitt 5.3 zur Verfügung gestellt haben, dasselbe Netzwerk mit Kommunikation in der
Abbildung 5.6.1.
KAP
Input
KAP
Plastikteile
Kunststoffherst.
Inputvariable
KAP
Prozessvariable Produktvariable
MCPK
KAP
Input
Input
KAP
Metallteile
Metallherstellg.
KAP
KAP
MCPK
Prozessvariable Produktvariable
MCPK
KAP
Input
KAP
Elektroteileherst.
Inputvariable
Prozessvariable
Montage
KAP
Feeder
Funktionen
Prozessvariable Produktvariable Funktionenvariable
KAP
Elektroteile
MCPK
Produktvariable
MCPK
Abb. 5.6.1: Netzwerk für die Feederherstellung mit Kommunikation
1316han05.indd 229
25.07.2006 11:39:16
230
5 Qualität in der Fertigung
Die Abbildung zeigt, dass dieses Netzwerk mit Kommunikation auf den ersten Blick kompliziert aussieht. Aber die Kommunikation ist notwendig, um das tägliches Chaos zu ordnen,
die Prozesse zu verbessern, Produkte mit geforderten Eigenschaften zu produzieren, die
Qualität der Produkte nachzuweisen und zu quantifizieren.
Es gilt die alte Weisheit: „… je flacher die Fertigungstiefe wird, desto intensiver muss die Kommunikation geführt werden …“.
Die Antwort auf die Frage:
„Wie wird in Ihrem Unternehmen die Kommunikation zwischen Prozessen geführt?“
wird entweder nicht verstanden oder aber lapidar damit beantwortet, dass man sagt, „… wir
regeln die Angelegenheit mit unseren Lieferanten durch Lasten- oder Pflichtenhefte …“
Ich habe mir in vielen Unternehmen Lasten und/oder Pflichtenhefte angeschaut und daher
die neuen Methoden entwickelt.
5.7
Was heißt Prozessverbesserung und was müssen Sie
tun?
Nach dem Entscheidungsgraphen in Abbildung 5.16 beim Produktaudit im Abschnitt 5.3 muss
im Fall MCpk < 1 entschieden werden, dass der Prozess zu verbessern ist, denn der Prozess ist
nicht fähig, Produkte (materielle oder immaterielle) mit geforderten Eigenschaften zu produzieren. Ausschuss ist die Folge und der kostet Geld. Außerdem führt er zur Nichteinhaltung
der versprochenen Liefertermine.
Die Ursachen hierfür können sein:
• die Prozesse werden heuristisch ohne Zielwerte gesteuert, das Methodenniveau ist zu
niedrig,
• daher können die Streuungen der Produktvariablen zu groß sein oder
• die Mittelwerte von den Sollwerten abweichen,
• die Tolerierung wurde unter Missachtung der Abhängigkeiten zwischen den Produktvariablen vorgenommen und ist daher nicht korrekt,
• die Anlagen und Maschinen sind zu alt und nicht mehr fähig,
• die Mitarbeiter sind nicht genügend qualifiziert und vieles mehr.
Gilt ebenfalls MCp < 1, dann bedeutet das, die Streuung mindestens einer Produktvariablen
ist zu groß. Die Reduktion der Variabilität – man nennt diesen Sachverhalt schlicht Prozessverbesserung – mindestens einer Produktvariablen ist notwendig.
Gilt MCp > 1 und MCpk < 1, dann ist das Streuverhalten der Produktvariablen in Ordnung, aber
der Vektor der Mittelwerte weicht vom Vektor der Sollwerte an. Der Prozess ist zu justieren.
Die verschiedenen Zielstellungen, die man aufgrund der Größen für die uni- und multivariaten Prozessfähigkeitsindizes zu verfolgen hat, sind unterschiedlich aufwendig und kosten
daher unterschiedlich viel. Daher ist ja die Entscheidung für den einen oder anderen Weg so
vorteilhaft für die Qualitätsverbesserungsprojekte.
1316han05.indd 230
25.07.2006 11:39:16
5.7 Was heißt Prozessverbesserung und was müssen Sie tun?
231
Beispiel 5.7.1: Chemischer Prozess. Prozessverbesserung
Das Produkt eines chemischen Prozesses wird durch m = 6 Produktvariable erklärt, von
denen die Variable Y1 den Anteil einer unerwünschten Substanz beschreibt, die für viel Geld
aus dem Produkt herausgefiltert werden muss. Die Frage lautet, kann der Prozess so gesteuert
werden, dass der Anteil der unerwünschte Substanz so klein wird, dass die unerwünschte
Substanz dem Verbraucher keinen Schaden mehr zufügen kann?
Die Ausgangssituation bzgl. der Produktvariablen Y1, d. h. der ungesteuerte Prozess und
der verbesserte Prozess sind in Abbildung 5.7.1 und Abbildung 5.7.2 dargestellt.
ungesteuerter
Prozess
Y
Y
40
40
30
30
20
20
10
10
0
0
20
40
60
80
gesteuerter
Prozess
100
t
0
0
20
40
60
80
100
t
Abb. 5.7.1: Vergleich der Ergebnisse des ungesteuerten und gesteuerten Prozesses
Beim heuristisch oder ungesteuerten Prozess sieht man, dass die unerwünschte Substanz
mal häufiger und mal seltener vorkommt und ein Trend beobachtet wird. Daraus kann
man aber bereits ableiten, dass zumindest ein Teil der Ursachen für das Vorkommen der
unerwünschten Substanz im Prozess oder den Inputs liegt.
Der gesteuerte Prozess zeigt, dass die unerwünschte Substanz durch die Steuerung des
Prozesses mit einer Prozessgleichung nahezu vollständig vermieden werden kann. Genau
das ist das zu erreichende Ziel, mit Hilfe der geistigen Investition, oder anders formuliert,
der Anwendung multivariater statistischer Methoden, Prozesse wesentlich zu verbessern.
Das spricht nicht gegen das hohe Expertenwissen der Mitarbeiter, die aufgrund ihrer Erfahrung das heutige hohe Niveau der „heuristischen“ Steuerung erreicht haben. Ich habe
großen Respekt vor diesen Leistungen. Allerdings müssen wir uns heute dem Diktat der
Globalisierung und des internationalen Marktes beugen und jeden möglichen Euro für
die Sicherung der Existenz deutscher Unternehmen herausfiltern. Und das ist nur mit den
modernen Methoden der multivariaten Statistik möglich.
Die Verteilung der Produktvariablen Y1 (unerwünschtes Nebenprodukt) des ungesteuerten
Prozesses lässt sich in der Abbildung 5.7.2, links, darstellen.
Diese Abbildung repräsentiert die univariate Betrachtung. Es wird ausschließlich die
Produktvariable Y1 betrachtet, ohne die anderen vorhandenen Informationen zu berücksichtigen.
Können wir uns das noch leisten?
Schon die linke Darstellung in Abbildung 5.7.2 zeigt, dass außer den Werten für die Produktvariable Y1 weitere Informationen in Form wenigstens einer Input- und/oder Prozessvariablen, hier mit t bezeichnet, vorliegt. Betrachten Sie nach dem Ursache-Wirkungs-Prinzip
Y1 als Funktion von den Input- und Prozessvariablen, dann erhalten Sie als Ergebnis die
1316han05.indd 231
25.07.2006 11:39:16
232
5 Qualität in der Fertigung
Prozessverbesserung
Was müssen wir tun?
Die Prozessgleichung berechnen und die
Verteilung von Y1 um die Gleichung
betrachten
Ausgangssituation
Was haben wir?
Ohne die Anwendung der multivariaten statistischen
Methoden eine breite Verteilung von Y1
Y
Y
Y
40
40
40
30
30
30
20
20
20
10
10
10
0
0
20
40
60
80
100
t
0
0
20
40
60
80
100
t
0
0
20
40
60
80
100
t
Abb. 5.7.2: Schritte der Prozessverbesserung
Prozessgleichung, die hier in der rechten Abbildung durch die Gerade markiert ist. Uns
interessiert nun die Streuung der Werte von Y1 um die Prozessgleichung. Diese Verteilung ist
auch im rechten Bild der Abbildung 5.7.2 zu sehen. Die Breite der Verteilung ist wesentlich
kleiner als die Breite der Verteilung von Y1. Das ist nach der Shannon Theorie auf den Informationsgewinn durch die Betrachtung der zusätzlichen Variablen zurück zuführen. Die
Verkleinerung der Breite der ursprünglichen Verteilung durch die Betrachtung zusätzlicher
Variabler messen wir mit dem Maß der Beherrschbarkeit des Prozesses. Der Informationsgewinn ist aber bereits eine Prozessverbesserung ohne materielle Investitionen. Wir
können die Prozessverbesserung steigern, indem wir den Prozess mit der Prozessgleichung
steuern. Das Ergebnis ist das Bild 3 in der Abbildung 5.7.2. Die unerwünschte Substanz
kommt kaum noch vor, die Verteilung der Messwerte für Y1 des gesteuerten Prozesses ist
sehr schmal, d. h. deren Streuung ist sehr klein.
5.8
Wie können wir das Ergebnis erreichen?
Der Prozess wurde eingeführt, da sich damit zeigen lässt, dass die Produktvariablen nach dem
Ursache-Wirkungs-Prinzips nur verändert werden können, wenn sowohl die Input- als auch
die Prozessvariablen verändert werden. Die Folge daraus ist, dass die Variation der Produktvariablen nur dann reduziert werden kann, wenn sowohl die Input- als auch die Prozessvariablen
verändert werden. Nichts anderes tun die Prozessexperten aufgrund „ihrer“ Erfahrung.
Wir müssen die Erfahrung durch Wissen ersetzen. Das können wir nur dann tun, wenn wir
dem Prozess sein Wissen abluchsen. Dazu müssen wir mit den Prozessen kommunizieren und
das ist nach dem Grundsatz des Galilei: „messe alles, und das nicht Messbare mache messbar“
nur über die Daten für alle Produkt-, Input-, Prozess- und Störvariablen möglich. Mit diesen
Daten kann
• die Abhängigkeitsstruktur zwischen den Input-, Prozess- und Produktvariablen quantifiziert und analysiert und
• eine Prozessgleichung berechnet werden, die über die Input- und Prozessvariablen die
Steuerung der Produktvariablen so ermöglicht, dass simultan alle Kundenanforderungen
durch die produzierten Produkte erfüllt werden.
1316han05.indd 232
25.07.2006 11:39:17
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
233
An dieser Stelle sei noch einmal daran erinnert, dass wir mit dieser Methodik sowohl Herstellungs- als auch Dienstleistungsprozesse behandeln müssen, um betriebswirtschaftliche
Verbesserungen zu erzielen.
Die Verfahren der univariaten Statistik können dieses Anliegen nicht erfüllen. Daher ist die
multivariate Statistik die geeignete Methodik. Multivariat heißt nichts anderes als mehrdimensional. Und mehrdimensional müssen die statistischen Methoden schon sein, denn es gibt ja
im trivialsten Fall wenigstens eine Prozess- und eine Produktvariable.
Für die Prozessverbesserung benötigt man multivariate statistische Methoden zur
• Analyse der Abhängigkeitsstruktur,
• Klassifikation einer heterogenen Stichprobe in homogene Teilstichproben,
• Auswahl der wesentlichen Input- und Prozessvariablen und Berechnung der Prozessgleichung,
• Optimierung und Steuerung des Prozesses,
• Kontrolle des verbesserten Prozesses mit uni- und multivariaten Kontrollkarten.
5.9
Was bedeutet Abhängigkeitsstruktur eines Prozesses?
Ein Prozess wird durch die Input-, Prozess-, noise- und Produktvariablen beschrieben. Diese
Variablen werden in dem Vektor der Zufallsgrößen
(Z1, …, Zl, X1, …, Xn, U1, …, Up, Y1, …, Ym)T = (ZT, XT, UT, YT)T
zusammengefasst.
Die Zufallsgrößen sind nicht unabhängig voneinander, sondern durch eine Abhängigkeitsstruktur miteinander verbunden. Das soll die Abbildung 5.9.1 verdeutlichen.
Prozess
Inputs
X
1
X
2
X
Produkt
Y
1
Y
2
3
Abb. 5.9.1: Abhängigkeitsstruktur zwischen Input-, Prozess- und Produktvariablen
1316han05.indd 233
25.07.2006 11:39:17
234
5 Qualität in der Fertigung
Der Einfachheit halber wurden die Input- und Prozessvariablen mit dem Buchstaben X
bezeichnet. Diese Abbildung zeigt, dass selbst bei einer geringen Anzahl von Variablen die
Abhängigkeitsstruktur schon recht kompliziert werden kann. Stellt man sich noch vor, dass
die Abhängigkeiten sowohl positiv als auch negativ sein können, dann kann man sich vorstellen, dass selbst für die logische Analyse der kleiner Abhängigkeitsstrukturen der menschliche
Verstand nicht mehr ausreicht und an dessen Stelle statistische Modelle eingesetzt werden
müssen.
Diese Abhängigkeitsstruktur muss quantifiziert werden. Dazu dienen die Korrelations-, die
Hauptkomponenten- und Faktoranalysen.
5.9.1
Wie führt man eine Korrelationsanalyse (KA) durch und was
besagen die Ergebnisse?
Unter der Korrelationsanalyse verstehen wir die Berechnung der Abhängigkeiten
• zwischen jeweils zwei Zufallsgrößen – in unserem Sprachgebrauch zwischen jeweils zwei
(Input-, Prozess- und/oder Produkt-) Variablen mit dem einfachen Korrelationskoeffi⎛n + p + m ⎞
zienten. Die Berechnung der paarweisen Abhängigkeiten zwischen allen ⎜
⎟⎠
2
⎝
Variablen liefert ebenso viele Korrelationskoeffizienten, die in der Korrelationsmatrix R
zusammengefasst werden.
• Häufig müssen Korrelationskoeffizienten zwischen jeweils zwei Zufallsgrößen unter der
Bedingung, dass andere Zufallsgrößen konstant gehalten werden, berechnet werden. Diese
Korrelationskoeffizienten heißen partielle Korrelationskoeffizienten. So wird häufig die
Frage gestellt, wie ist die lineare Abhängigkeit zwischen zwei Prozessvariablen, wenn die
Inputvariablen konstant gehalten werden müssen, oder anders formuliert, wenn die Werte
für die Inputvariablen gegeben sind? Das bedeutet, es sind die Korrelationskoeffizienten für
die Zufallsgrößen einer bedingten Verteilung, im vorliegenden Fall der bedingten Verteilung
der Prozessvariablen unter der Bedingung der gegebenen Inputvariablen zu berechnen.
• Zur Korrelationsanalyse zählen wir auch die Berechnung der Abhängigkeit einer Zufallsgröße, z. B. einer Produktvariablen Yj, j = 1, …, m von einer Linearkombination aller
Input- und Prozessvariablen. Diese Korrelationskoeffizienten nennt man multiple Korrelationskoeffizienten und bezeichnet sie mit R2Y j / allen Input- und Prozessvariablen .
• Außer diesen Abhängigkeiten ist häufig die Abhängigkeit zwischen einer Zufallsgröße, z. B.
der Produktvariablen Y und einer Linearkombination der wesentlichen Prozessvariablen
X unter der Bedingung der wesentlichen Inputvariablen Z zu quantifizieren. Ein solches
Maß der Abhängigkeit nennt man partiell multipler Korrelationskoeffizient.
• Da ein Produkt durch mehrere, z. B. m, m ≥ 1 Produktvariable beschrieben wird und die
Kenntnis der Abhängigkeit der Gesamtheit der Produktvariablen von allen Input- und
Prozessvariablen als verallgemeinertes Maß der Beherrschbarkeit eines Prozesses notwendig
ist, wird auch der multivariate, multiple Korrelationskoeffizient berechnet.
• Für weiterführende Analysen werden noch die multivariat partiell-multiplen und die
multivariat semipartiell-multiplen Korrelationskoeffizienten eingeführt.
Es versteht sich von selbst, dass die Analyse einer Abhängigkeitsstruktur mit der Berechnung
der einfachen Korrelationskoeffizienten beginnt.
1316han05.indd 234
25.07.2006 11:39:17
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
235
Was sind einfache Korrelationskoeffizienten?
Die einfachen Korrelationskoeffizienten messen die lineare Abhängigkeit zwischen zwei zufälligen Variablen.
Beispiel 5.9.1: Bremsweg eines PKW. Korrelationskoeffizienten
Fährt man mit einem PKW durch eine Stadt und muss vor einem auftretenden Hindernis plötzlich bremsen, dann können der Bremsweg und die gefahrene Geschwindigkeit
gemessen werden. Für die Rekapitulation von Unfallgeschehen möchte die Polizei wissen,
wie streng die Länge des Bremsweges von der gefahrenen Geschwindigkeit des PKW abhängt.
Lässt man z. B. N PKW’s fahren, dann erhält man N Wertepaare. Die Wertepaare können
als Punkte in einer Ebene gedeutet und aufgezeichnet werden. Für das Experiment erhält
man die Abbildung 5.9.2.
51
46
Bremsweg
41
36
31
26
21
53
58
63
Geschwindigkeit
68
Abb. 5.9.2: Länge des Bremsweges in Abhängigkeit von der Geschwindigkeit
Die Punktwolke der Wertepaare ergeben eine elliptisch umrissene Punktwolke. Intuitiv
würde man sagen, der Zusammenhang zwischen der Geschwindigkeit und dem Bremsweg
ist eng. Aber diese Aussage muss quantifiziert werden, denn eine qualitative Einschätzung
sagt sehr wenig aus und man kann nicht für alle möglichen Abhängigkeiten erst eine
Abbildung zeichnen und dann eine subjektive Einschätzung vornehmen. Der berechnete
Korrelationskoeffizient rBremweg, Geschwindigkeit = 0.88.
Was besagt dieser Koeffizient und wie kann man den Korrelationskoeffizienten berechnen?
Der Korrelationskoeffizient ist eine dimensionslose Zahl, die zwischen –1 und +1 liegt. Ist der
Korrelationskoeffizient groß gegen 1, dann nähert sich das Aussehen der Punktwolke immer
stärker dem Aussehen einer Zigarre an, d. h. die eine Hauptachse der Ellipse wird immer
länger, die andere immer kürzer. Ist der Korrelationskoeffizient gleich 1, dann wird aus der
Ellipse eine Gerade. Der Anstieg der Gerade kann positiv oder negativ sein. Entsprechend
dem Anstieg ist der Korrelationskoeffizient positiv oder negativ. Gibt es zwischen den beiden
1316han05.indd 235
25.07.2006 11:39:17
236
5 Qualität in der Fertigung
Variablen keine Abhängigkeit, d. h. sind die beiden Variablen unabhängig voneinander, dann
ist der Korrelationskoeffizient null.
Für den einfachen Korrelationskoeffizienten
ρ12 =
σ12
Kovarianz
=
σ1 ⋅ σ 2
Produkt der Streuungen
erhält man nach der Maximum Likelihood Methode die Schätzung
r12 =
S12
.
S1 ⋅ S2
S12 =
∑ (Yi,1 − Y1 )(Yi,2 − Y2 )
wobei
N
i =1
die Stichprobenkovarianz zwischen Y1 und Y2 ist. Zur Begründung des eben gesagten betrachten
wir zunächst nur zwei Produktvariable Y1 und Y2 und nehmen an, dass der Vektor dieser beiden
Variablen YT = (Y1, Y2) normalverteilt ist mit dem Vektor der Erwartungswerte (Mittelwerte
der Grundgesamtheit)
µT = (µ1, µ2)
und der Kovarianzmatrix
⎛ σ12
ΣYY = ⎜
⎝
σ12 ⎞
⎟
σ 22 ⎠
in der σ12 die Varianz von Y1 (Quadrat der Standardabweichung von Y1 in der Grundgesamtheit),
σ22 die Varianz von Y2 und σ12 die Kovarianz zwischen Y1 und Y2 ist. Die Kovarianz von Y1 und
Y2 ist als Produkt der Abweichungen der Y1 Werte vom Erwartungswert µ1 und der Y2 Werte
von µ2 durch
E [(Y1 – µ1) (Y2 – µ2)] = σ12
definiert. Die Kovarianz ist ein Abhängigkeitsmaß zwischen Y1 und Y2, d. h. diese gibt an, wie
sich z. B. Y1 in Abhängigkeit von Veränderungen von Y2 verändert. Die Kovarianz ist aber von
den Dimensionen der beiden Zufallsgrößen Y1 und Y2 abhängig. Das ist unschön und soll
durch Standardisierung der beiden Zufallsgrößen Y1 und Y2 aufgehoben werden.
Unter Standardisierung versteht man dabei den Übergang von Yj zu Zj über die Beziehung
Zj =
Yj − μ j
σj
, j = 1, 2.
Für die standardisierten Zufallsgrößen Z1 und Z2 ist die Kovarianz E [Z1 Z2] durch
E [Z1 ⋅ Z 2 ] =
E [(Y1 − μ1 ) ⋅ (Y2 − μ 2 )]
σ1 ⋅ σ 2
gegeben. Die Kovarianz zwischen den standardisierten Zufallsgrößen Y1 und Y2 nennt man
Korrelationskoeffizient ρ12
1316han05.indd 236
25.07.2006 11:39:17
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
237
Y2
ρ12 = 1
Y2 + ΔY2
Y2
Y1
Y1
Y1 + ΔY1
Abb. 5.9.3: Lineare Abhängigkeit zwischen Y1 und Y2
Für diesen gilt:
• 1 ≤ ρ12 ≤ 1,
wobei ρ12 = 1 genau dann gilt, wenn Y1 und Y2 mit der Wahrscheinlichkeit eins linear abhängig sind, wie das in der Abbildung 5.9.3 dargestellt ist. Linear abhängig heißt in diesem
Zusammenhang, wenn mit der Wahrscheinlichkeit 1 eine Veränderung von z. B. Y1 zu einer
determinierten Veränderung von Y2 führt und umgekehrt, d. h. wenn P (Y2 = β0 + βY.1 Y1)
= 1, wobei β0 und βY.1 die unbekannten Koeffizienten der Geradengleichung sind.
Man kann diesen Sachverhalt auch in der folgenden Art beschreiben: die Punkte (Y1, Y2)
liegen auf der Geraden, die den funktionalen Zusammenhang zwischen Y1 und Y2 beschreibt,
d. h. Y1 und Y2 haben keine Streuungen. Das wiederum heißt aber, dass der Zusammenhang
zwischen Y1 und Y2 determiniert ist. Diesen Sachverhalt verdeutlicht die Abbildung 5.9.3.
• ρ12 = 0 gilt nur dann, wenn Y1 und Y2 linear unabhängig sind. In diesem Falle liegen die
Realisierungen von Y1 und Y2, d. h. die Wertepaare von Y1 und Y2 in einem kreisförmigen
Gebiet.
• Für alle anderen Werte des Korrelationskoeffizienten liegen die Wertepaare in elliptisch
umrissenen Gebieten. Diese Ellipsen können steigend oder fallend sein, je nachdem wie
das Vorzeichen des Korrelationskoeffizienten ist.
• Von ρ12 = 0 bzw. r12 = 0 kann man nicht auf die Unabhängigkeit von Y1 und Y2 schließen.
• Der Korrelationskoeffizient der Grundgesamtheit ρ12 wird mit der Formel
N
r12 =
∑ (Y1,i − Y1 ) ⋅ (Y2,i − Y2 )
i =1
N
N
i =1
i =1
∑ (Y1,i − Y1 )2 ⋅ ∑ (Y2,i − Y2 )2
und den Wertepaaren (Y11, Y21), …, (Y1,N, Y2,N), d. h. der Stichprobe geschätzt.
⎛m ⎞
Die Korrelationskoeffizienten für alle möglichen ⎜ ⎟ Paare von Produktvariablen werden
⎝2⎠
in der Korrelationsmatrix
1316han05.indd 237
25.07.2006 11:39:18
238
5 Qualität in der Fertigung
R YY
⎛ 1 r12
⎜
1
=⎜
⎜
⎜⎝
... r1m ⎞
... r2m ⎟
⎟
...
⎟
1 ⎟⎠
zusammengestellt.
Die Korrelationsmatrix ist symmetrisch, denn es gilt rjk = rkj für alle
j, k = 1, … (j – 1) j (j + 1), …, (k – 1), k, (k + 1), …, m, j ≠ k. Für j = k ist ρjj = ρkk = 1.
Die Korrelationsmatrix ist für reguläre m-dimensionale Verteilungen positiv definit, wenn
das Produkt widerspruchsfrei durch die Produktvariablen beschrieben wird.
Wie kann geprüft werden, ob ein berechneter Korrelationskoeffizient eine Abhängigkeit
ausdrückt, die statistisch gesichert von null verschieden ist?
Zu diesem Sachverhalt sagt man kurz, die Abhängigkeit zwischen zwei Zufallsgrößen ist „signifikant von null verschieden“.
Da der Korrelationskoeffizient mit den Werten einer Stichprobe geschätzt wurde, hängt er
einmal vom Stichprobenumfang und von der „Zufälligkeit“ der beteiligten Variablen, d. h.
der Größe der Streuungen ab. Aus diesem Grund muss beim Korrelationskoeffizienten stets
gefragt werden, wie groß kann r12 von null abweichen, ohne dass die Unabhängigkeit von Y1
und Y2 verletzt ist?
Zur Beantwortung dieser Frage müssen Hypothesen über ρ12 formuliert werden, die mit r12
zu beantworten sind, d. h. man benötigt einen Test. Die Hypothesen lauten:
H0: ρ12 = 0 (d. h. die Zufallsgrößen Y1 und Y2 sind nicht miteinander korreliert) und
H1: ρ12 ≠ 0 (d. h. die Zufallsgrößen sind linear nicht unabhängig voneinander)
Die Prüfung der H0 gegen die Alternativhypothese H1 wird mit dem t-Test
tˆ =
r12
1 − r122
⋅ N −2
geprüft. Ist tˆ < t α ,N − 2 , dann kann die H0 nicht verworfen werden. Aufgrund der Stichprobe
d. h. der Größe von r12 kann dann gesagt werden, dass Y1 und Y2 nicht linear abhängig voneinander sind.
Beispiel 5.9.2: Bremsweg eines PKW. Abhängigkeit des Bremsweges
Das erweiterte Bremswegbeispiel enthält die Produktvariable
Y
Länge des Bremsweges in [m]
und die Input- und Prozessvariablen
X1
X2
X3
Geschwindigkeit des PKW in einer Ortschaft [km/h]
mittlere Profiltiefe der Reifen aller 4 Räder [mm]
Reaktionszeit des Fahrers in [sec].
Die statistischen Maßzahlen sind in der folgenden Tabelle 5.9.1 zusammengestellt.
1316han05.indd 238
25.07.2006 11:39:18
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
239
Tabelle 5.9.1: Statistische Maßzahlen für das Bremswegbeispiel
Bremsweg
Geschwindigkeit Profiltiefe
Mittelwert
29,96
49,74
3,47
1,24
Varianz
33,5398
95,4792
0,59036
0,14773
S
5,791
9,771
Reaktionszeit
0,768
0,384
Min
13,65
19,3
1,44
0,064
Max
46,41
76,5
5,26
2,076
R
32,7
57,2
3,8
V
19
19
22
2,01
31
Für dieses Beispiel ist die Korrelationsmatrix in der Tabelle 5.9.2 enthalten.
Tabelle 5.9.2: Korrelationsmatrix Beispiel Bremsweg
Bremsweg
Bremsweg
Geschwindigkeit Profiltiefe
1
Geschw
Reaktionszeit
0,837
–0,373
0,457
1
–0,207
0,168
Profil
1
Reaktion
0,098
1
Der Abhängigkeitsgraph für diese vier Variablen ist in der Abbildung 5.9.4 dargestellt.
X1
=
r Y1
Y
4
0.8
r12 = - 0.20
X2
r13= 0.1
rY2= - 0.37
X3
rY =
3
0.4
5
r23= 0.17
Abb. 5.9.4: Abhängigkeitsgraph für das Bremswegbeispiel
Zur Demonstration der Anwendung des t-Tests überprüfen wir die Nullhypothese H0 des
Korrelationskoeffizienten r23, die lautet H0: ρ23 = 0 gegen H1: ρ23 ≠ 0
Der t-Test liefert
tˆ =
1316han05.indd 239
0.1
1 − 0.12
⋅ 28 = 0.532
25.07.2006 11:39:18
240
5 Qualität in der Fertigung
Der zugehörige Tafelwert für die einseitige Fragestellung ist t0.05; 28 = 2.048. Der berechnete
t-Wert ist kleiner als der Tafelwert. Folglich kann die Nullhypothese nicht verworfen werden,
d. h. der aus der Stichprobe vom Umfang N = 30 berechnete Korrelationskoeffizient r23 = 0.1
unterscheidet sich nicht statistisch gesichert von null. Der Stichprobenkorrelationskoeffizient r23 weicht nur zufällig von null ab, d. h. X2 und X3 sind nicht miteinander korreliert.
Es ist an dieser Stelle notwendig darauf hinzuweisen, dass man im Fall der Ablehnung der H0
nicht einfach sagen kann, Xj und Xk sind linear abhängig, denn der Korrelationskoeffizient
ist ein Maß für den Grad der linearen Abhängigkeit zwischen den beiden Zufallsgrößen.
Man kann in diesem Fall nur sagen, Xj und Xk sind korreliert.
Die Hypothesen H0 bzgl. aller anderen Korrelationskoeffizienten müssen analog geprüft
werden. Am stärksten ist die Abhängigkeit zwischen der Reaktionszeit X3 und der Alkoholkonzentration X5 gefolgt von der Korrelation zwischen dem Bremsweg und der
Geschwindigkeit.
Die Korrelationsmatrix ist der Ausdruck für die Abhängigkeitsstruktur der Produkt- und
Prozessvariablen (oder nur der Produkt-, oder nur der Prozessvariable), die in der nebenstehenden Abbildung für die Produktvariable und die ersten drei Input- und Prozessvariablen
symbolisiert ist. Aus dieser Abbildung wird deutlich, dass die Abhängigkeit zwischen zwei
Parametern natürlich durch die anderen Parameter beeinflusst wird.
Der Zusammenhang zwischen der Kovarianz- und Korrelationsmatrix wird matriziell durch
die Beziehung
⎛ 1 ⎞
⎛ 1 ⎞
R = D ⎜ ⎟ ⋅ Σ ⋅ D ⎜ ⎟ , j = 1, 2, … n, bzw.
⎝σj ⎠
⎝σj ⎠
Σ = D (σ j ) ⋅ R ⋅ D (σ j )
ausgedrückt.
Außerdem gilt für die Determinanten der Korrelations-RXX und Kovarianzmatrix ΣXX der oft
nützliche Zusammenhang
Σ XX =
n
∏ σ2j
j =1
R XX
wobei
⎧⎪1, falls ρ jk = 0, ∀ j, k = 1, …, n, j ≠ k
R XX = ⎨
⎪⎩0, falls wenigstens ein ρ jk = 1, für j ≠ k.
Das Modell der Korrelationskoeffizienten ist – wie jedes Modell – von den Voraussetzungen
abhängig. Hier bei diesem Modell handelt es sich um die Voraussetzungen der Normalverteiltheit, Linearität der Abhängigkeiten und der Unabhängigkeit der Elemente der Stichprobe.
Gibt es ein globales Maß für die Straffheit der Abhängigkeitsstruktur?
⎛n + m ⎞
verschieIn einer Korrelationsmatrix gibt es aufgrund der Symmetrie der Matrix ⎜
⎝ 2 ⎟⎠
dene Korrelationskoeffizienten. Diese können groß oder klein, positiv oder negativ sein. Diese
1316han05.indd 240
25.07.2006 11:39:18
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
241
Verhältnisse erschweren die Interpretation der Abhängigkeitsstruktur. Daher suchen wir ein
globales Maß für die Abhängigkeitsstruktur. Dieses Maß ist die Determinante det(R) der
Korrelationsmatrix.
Der maximale Wert der Determinante ist det(R) = 1. Dieser Wert wird erreicht, wenn alle
Korrelationskoeffizienten gleich null sind. (Zur Erinnerung sei wiederholt, dass im Falle der
Unabhängigkeit alle Korrelationskoeffizienten gleich null sind.) Die Determinante ist null,
wenn wenigstens ein Korrelationskoeffizient außerhalb der Hauptdiagonalen gleich 1 ist.
Beispiel 5.9.3: Bremsweg eines PKW. Determinante der Korrelationsmatrix
Die Determinante der Korrelationsmatrix für die Input-, Prozess- und Produktvariablen
ist det(R) = 0.12163. Interessanter ist die Determinante der Input- und Prozessvariablen,
denn diese bestimmt den Grad der Multikollinearität. Hierfür berechnen wir den Wert
det(RXX) = 0.9124. Der Grad der Multikollinearität ist sehr gering und beeinflusst später
folgende Resultate, wie z. B. die Berechnung der Prozessgleichung nicht.
Was passiert, wenn eine oder beide Voraussetzungen verletzt sind?
In diesem Fall können die verteilungsfreien Korrelationskoeffizienten berechnet werden.
5.9.2
Verteilungsfreie Korrelationskoeffizienten
Verteilungsfreie Korrelationskoeffizienten benötigen keine Annahme über die zugrunde liegende Verteilung der Zufallsgrößen. Diese Koeffizienten sind daher robuster als die anderen.
5.9.2.1
Was ist ein Vierfelder Korrelationskoeffizient?
Es seien X, Y zwei Zufallsgrößen mit diskreter Verteilung, die nur qualitativ gemessen werden
können, d. h. die Messwerte sind die Häufigkeiten einer Alternative, wie z. B. Raucher und
Nichtraucher, Produkt in Ordnung und Produkt defekt usw. Eine Stichprobe eines zweidimensionalen Vektors alternativ verteilter Zufallsgrößen, wie z. B. die Zufallsgröße X besteht
im Vorhandensein oder Nichtvorhandensein einer Eigenschaft A und Y bezieht sich analog
auf eine Eigenschaft B, liefert vier verschiedene Häufigkeiten, die in einer Vierfeldertafel, siehe
Tabelle 5.9.3 aufgeschrieben und mit dem Vierfelder Korrelationskoeffizienten ausgewertet
werden müssen.
Tabelle 5.9.3: Vierfeldertafel
Eigenschaft A
Zeilensumme
vorhanden
nicht vorhanden
vorhanden
a
b
a+b
nicht vorhanden
c
d
c+d
Spaltensumme
a+c
b+d
=a+b+c+d
Eigenschaft B
1316han05.indd 241
25.07.2006 11:39:19
242
5 Qualität in der Fertigung
In dieser Tafel bezeichnen
a
die Häufigkeit des Vorkommens von A und B
a+c
die Häufigkeit des Vorkommens von A
a+b
die Häufigkeit des Vorkommens von B
d
die Häufigkeit der Alternative von A und B,
d. h. des Nichtvorkommens von A und B
b+d
die Häufigkeit des Nichtvorkommens von A
c+d
die Häufigkeit des Nichtvorkommens von B.
Die zu prüfende Nullhypothese lautet
H0: „die beiden Alternativen verteilen sich unabhängig voneinander“
Zur Prüfung dieser Hypothese verwendet man den χ2-Test
V =
χ2
=
N
a⋅d −b⋅c
[(a + b) ⋅ (a + c ) ⋅ (b + d) ⋅ (c + d)]
Für diesen Koeffizienten gilt –1 ≤ V ≤ 1.
Beispiel 5.9.4: Stillstandszeiten
Es soll überprüft werden, ob es zwischen den Stillständen einer Anlage und den Ausschussteilen, einen Zusammenhang gibt. Die Anlage arbeitet in 3 Schichten. Pro Stunde werden 2
Produkte auf der Anlage hergestellt. Die Produkte werden beurteilt ob sie i. O. oder defekt
sind. Über eine längere Zeitspanne wurden die kurzfristigen Ausfälle der Anlage notiert.
Man erhielt das Ergebnis in der Tabelle 5.9.4.
Tabelle 5.9.4: Stillstandszeiten und defekte Produkte
Produkt
Zeilensumme
i. O.
defekt
kein Stillstand
91
39
130
Stillstand
8
18
26
Spaltensumme
99
57
156
Anlage
Damit können wir den Vierfelderkorrelationskoeffizienten
χ2 =
156 ⋅ (91 ⋅ 18 − 39 ⋅ 8)
= 14.38
130 ⋅ 26 ⋅ 99 ⋅ 57
und
V =
14.38
= 0.3
156
ausrechnen. Dieser Wert besagt aufgrund des zugehörigen χ2-Wertes, dass ein Zusammenhang zwischen den Stillständen und den defekten Produkten vorhanden ist, oder anders
formuliert, dass die Stillstandszeiten der Anlage die Qualität beeinflussen.
1316han05.indd 242
25.07.2006 11:39:19
243
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
5.9.2.2
Was für ein Abhängigkeitsmaß können wir berechnen,
wenn die Variablen über eine Rangskala quantifiziert wurden?
Beispiel 5.9.5: Lieferterminüberschreitung. Rangkorrelationskoeffizienten
Bei 14 Kunden wurden die Lieferfristenüberschreitungen Y in Tagen gemessen. Gleichzeitig wurden für die Partien, aus denen die Kundenlieferungen stammten, die univariaten Prozessfähigkeiten für eine sehr wichtige Produktvariable ermittelt. Da weder die
Lieferfristenüberschreitungen noch die korrigierten univariaten Prozessfähigkeitsindizes
normal verteilt sind, wurde entschieden, anstelle des einfachen Korrelationskoeffizienten
den Rangkorrelationskoeffizienten nach Spearman zu berechnen.
Die Rangkorrelationskoeffizienten sind aus dem Konzept entstanden, eine Rangskala als eine
Intervallskala aufzufassen und die Rangwerte als Messwerte zu behandeln. Das Ergebnis dieses
Konzeptes sind die Rangkorrelationen von Spearman and Kendall (siehe Kandall [1952]).
Der Spearman’scher Rangkorrelationskoeffizient
Für die beiden Variablen X und Y kann man aus den Beobachtungsreihen Xi, Yi, i = 1, …, N die
beiden Rangreihen x[i] und y[i], i = 1, …, N bilden und als neue als Messwerte auffassen.
Haben Sie z. B. die Messwerte 5, 2, 7, 4 vorliegen, dann können Sie diese der Größe nach in
2, 4, 5, 7 ordnen. Der Wert x1 = 5 wird in den Rangreihe zu x[3]. Mit der Gauß’schen Summe
erhält man
N
∑ xi
=
i =1
N ⋅ (N + 1)
2
=
N
∑ yi
i =1
und
N
∑ xi2
=
i =1
N ⋅ (N + 1) ⋅ 2 N + 1
=
6
N
∑ yi2
i =1
Außerdem gilt
N
N
i =1
i =1
∑(xi − x )2 = ∑ xi2 −
=
⎛N ⎞
⎜⎝ ∑ xi ⎟⎠
i =1
N
2
⎡ N ⋅ (N + 1) ⎤
⎥⎦
N ⋅ (N + 1) ⋅ (2 N + 1) ⎢⎣
2
=
−
6
N
2
N ⋅ (N 2 − 1)
12
Für die Summe der quadratischen Abweichungen der yi Werte von ihrem Mittelwert erhält
man denselben Ausdruck. Es sind nun noch die Differenzen der Rangpaare
di = X[i] – y[i], i = 1, …, N,
zu bilden.
1316han05.indd 243
25.07.2006 11:39:19
244
5 Qualität in der Fertigung
Setzt man all diese Umformungen in die Formel
N
∑ ( xi − x ) ⋅ ( y i − y )
i =1
rxy =
N
N
.
∑(xi − x ) ⋅∑( yi − y )
2
i =1
2
i =1
der einfachen Korrelationskoeffizienten ein, dann erhält man für den Spearman’schen Korrelationskoeffizienten
N
rs = 1 −
6 ⋅ ∑ di2
i =1
N ⋅ (N 2 − 1)
.
Signifikanzprüfung für den Spearman’schen Rangkorrelationskoeffizient
Die H0: X und Y sind unabhängig.
Gegen die Alternativhypothese wird mit dem t-Test
tˆ =
rs
1 − rs2
⋅ N −2
geprüft. Falls tˆ > tα; N – 2 dann muss die H0 verworfen werden, d. h. in diesem Falle sagen wir
die beiden Parameter X und Y sind korreliert.
Beispiel 5.9.6: Lieferfristenüberschreitung. Spearmanscher
Rangkorrelationskoeffizient
Die Daten für dieses Beispiel sind in der Matrix der Tabelle 5.9.5 zusammengestellt.
Tabelle 5.9.5: Daten für Lieferfristenüberschreitung und Prozessfähigkeiten, Rangreihen und deren
Differenzen
1316han05.indd 244
Lieferfristenüberschreitung
Prozessfähigkeiten
Rangreihe
X[i]
Rangreihe
Y[i]
di
13
14
15
16
17
19
20
21
24
25
30
31
36
40
1,30
1,05
1,65
1,19
1,11
1,13
1,17
1,15
0,95
1,20
1,10
0,92
0,94
0,81
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14
5
13
11
7
8
10
9
4
12
6
2
3
1
–13
–3
–10
–7
–2
–2
–3
–1
5
–2
5
10
10
13
25.07.2006 11:39:19
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
245
Für den Spearman’schen Rangkorrelationskoeffizienten erhält man den Wert
rs = 1 −
6 ⋅ 768
= −0.69.
14 ⋅ (142 − 1)
Der zugehörige t-Wert ist
tˆ =
0.69
1 − 0.692
⋅ 12 = 3.3.
Der t-Wert aus der Tafel ist t0.05; 12 = 1.78. Da der berechnete t-Wert größer als der Tafelwert ist, muss die H0 verworfen werden, d. h. die beiden Parameter sind nicht unabhängig
voneinander. Die Lieferfristenüberschreitung ist von den Prozessfähigkeiten abhängig.
Je kleiner die Prozessfähigkeiten für eine wesentliche Produktvariable sind, desto größer
sind die Lieferfristenüberschreitungen. Die berechnete Irrtumswahrscheinlichkeit für die
Ablehnung der H0 ist α = 0.0059.
In der Abbildung 5.9.5 ist das Korrelationsdiagramm für diese beiden Variablen enthalten.
Man erkennt deutlich die fallende Tendenz, d. h. je größer die Prozessfähigkeiten sind, desto
kleiner sind die Lieferfristenüberschreitungen.
40
35
LTU
30
25
20
15
10
0.8
1.0
1.2
Cpk
1.4
1.6
Abb. 5.9.5: Lieferterminüberschreitung und Prozessfähigkeit
Was ist der Kendall’scher Rangkorrelationskoeffizient?
Es seien wieder zwei Rangfolgen für N Objekte gegeben, d. h. für die nicht normal verteilten
oder skalierten Messwerte zweier Parameter liegen zwei Rangfolgen [i] und [j], i, j = 1, …, N
vor. Als Beispiel stellen wir uns das Lieferfristenbeispiel vor. Für jedes Paar ([i],[j]) von Objekten
(Messwerten) schreiben wir einen Beitrag +1 auf, wenn die Ränge [i] und [j] in der gleichen
aufsteigenden Reihenfolge vorkommen, sonst –1. Konkret bedeutet das, wir definieren für die
erste Rangfolge eine Zufallsgröße Vik, die den Wert +1 annimmt, wenn Xi < Xk, den Wert 0, wenn
Xi = Xk und den Wert –1, wenn Xi > Xk. Analog verfahren wir für den zweiten Parameter Y.
1316han05.indd 245
25.07.2006 11:39:19
246
5 Qualität in der Fertigung
Die Summe der Beiträge aller Paare ist dann
S=
N
∑ xij ⋅ yij .
i , j =1
Der Maximalwert dieser Summe ist
⎛N ⎞ 1
⎜⎝ 2 ⎟⎠ = 2 ⋅ N ⋅ (N − 1).
Setzt man
T =
S
1
⋅ N ⋅ (N − 1)
2
so nimmt T nur Werte zwischen –1 und +1 an. T = +1 gilt nur dann, wenn die beiden Rangfolgen übereinstimmen. T = –1 erhält man nur dann, wenn die beiden Rangfolgen entgegengesetzt sind. Für die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ordnet man
die erste Rangfolge der Größe nach von 1 bis N. Darunter schreibt man die zugeordneten Ränge
der zweiten Rangfolge, also
für X:
1
2
3
…
N
für Y:
Y1 = Y[1] Y2 = Y[N] Y3 = Y[3] …
YN = Y[2].
Damit kann man S wie folgt berechnen: man zählt, wie viele der Y’s größer als Y1 rechts von
Y1 stehen, dann zählt man wie viele der Y’s größer als Y2 rechts von Y2 stehen usw. Die Summe
aller dieser Anzahlen sei P. Damit kann S umgeschrieben werden. Es gilt S ist die Summe von
⎛N ⎞
P Beiträgen +1 und ⎜ ⎟ − P Beiträgen –1, d. h.
⎝2⎠
S = 2⋅P −
1
⋅ N ⋅ (N − 1),
2
bzw.
T =
2⋅P
− 1.
1
⋅ N ⋅ (N − 1)
2
Beispiel 5.9.7: Lieferfristenüberschreitung. Kendallscher Rangkorrelationskoeffizient
Die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ergibt für das Beispiel
der Lieferterminüberschreitung den Wert T = –0.538. T ist asymptotisch normal verteilt
mit dem Erwartungswert 0 und der Varianz
σT2 =
2 ⋅ (2 ⋅ N + 5)
,
9 ⋅ N ⋅ (N − 1)
siehe z. B. van der Waerden [1957]. Damit kann man die Hypothese der Unabhängigkeit
von X und Y verwerfen, wenn T größer ist als Tα = σT ⋅ Φ (1 − α) , wobei Φ die Verteilungsfunktion der standardisierten Normalverteilung ist.
1316han05.indd 246
25.07.2006 11:39:20
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
247
Die H0 der Unabhängigkeit der beiden Zufallsgrößen muss aufgrund des Ergebnisses
T = –0.538 verworfen werden. Die berechnete Irrtumswahrscheinlichkeit ist α′ = 0.0073.
Zum Vergleich wurde der einfache Korrelationskoeffizient berechnet. Man erhält hierfür
den Wert rXY = –0.795. Die berechnete Irrtumswahrscheinlichkeit für die Ablehnung der
H0 ist α′ = 0.0007.
Neben den einfachen und Rangkorrelationskoeffizienten gibt es weitere Abhängigkeitsmaße.
Diese sind vor allem die
• partiellen oder bedingten Korrelationskoeffizienten,
• die multiplen Korrelationskoeffizienten und
• die multivariaten multiplen Korrelationskoeffizienten.
5.9.3
Was sind partielle Korrelationskoeffizienten
Wozu werden die bedingten (partielle) Korrelationskoeffizienten gebraucht?
Wie werden die bedingten Korrelationskoeffizienten berechnet?
Bisher haben wir die Abhängigkeitsstruktur für die Input-, Prozess- und Produktvariablen
durch die einfachen (paarweisen) Korrelationskoeffizienten beschrieben. Wir haben aber auch
gesehen, dass mitunter Antworten auf praktisch relevante Fragen, wie z. B. die Frage nach den
Abhängigkeiten zwischen den Produkt- und Prozessvariablen ohne den Einfluss der Inputvariablen erforderlich sind. Diese Frage kann man auch so formulieren,
Wie groß sind die bedingten Abhängigkeitsmaße zwischen den Produkt- und
Prozessvariablen unter der Bedingung der Inputvariablen?
Zur Vereinfachung der Lösung auf die Frage betrachten wir ein triviales Beispiel.
Beispiel 5.9.8: Einfluss von zwei Prozess- auf eine Produktvariable. Abhängigkeiten
In dem Graphen der Abbildung 5.9.6 ist der Einfluss zweier korrelierter Prozessvariablen
auf eine Produktvariable dargestellt.
X1
rY1= 0.84
r12= 0.95
Y
X2
rY2= 0.86
Abb. 5.9.6: Einfluss von zwei Prozess- auf eine Produktvariable
1316han05.indd 247
25.07.2006 11:39:20
248
5 Qualität in der Fertigung
Die Korrelationsmatrix für dieses Beispiel ist
⎛ 1 0.84 0.86 ⎞
R=⎜
1
0.95 ⎟
⎜
⎟
1 ⎠
⎝
Die beiden Prozessvariablen haben den Korrelationskoeffizient r12 = 0,95. Für die Steuerung
des Prozessen müssen wir aber wissen, wie z. B. X1 auf Y wirkt, ohne dass dieser Einfluss
durch das Wirken der zweiten Prozessvariablen „verfälscht“ wird. Der Einfluss von X2 auf
X1 soll eliminiert oder konstant gehalten werden. Das ist nur in einem Modell möglich,
denn in der Natur lässt sich dieser Einfluss nicht eliminieren oder konstant halten.
Ein Korrelationskoeffizient dieser Art wird als partieller Korrelationskoeffizient bezeichnet.
Dieser misst den partiellen Einfluss von X1 auf Y, oder anders ausgedrückt den Einfluss von
X1 auf Y unter der Bedingung, dass X2 konstant gehalten wird. Wir können auch sagen, der zu
findende Korrelationskoeffizient ist ein Korrelationskoeffizient der bedingten Verteilung von
Y und X1 unter der Bedingung von X2.
Für diesen Fall wollen wir im Folgenden die Formel zur Berechnung der partiellen Korrelationskoeffizienten betrachten. Es gilt
rY 1/2 =
rY 1 − rY 2 ⋅ r12
(1 − rY22 ) ⋅ (1 − r122 )
wobei rY1/2 die symbolische Darstellung für die Abhängigkeit zwischen Y und X1 unter der
Bedingung ist.
Beispiel 5.9.9: Einfluss von zwei Prozess- auf eine Produktvariable.
Partieller Korrelationskoeffizient
Für das Demonstrationsbeispiel gilt
rY 1/2 =
0.84 − 0.86 ⋅ 0.95
(1 − 0.862 ) ⋅ (1 − 0.952 )
= 0.146.
Das Ergebnis der einfachen- und partiellen Korrelationsanalyse besagt, dass die paarweise
(oder auch totale) Abhängigkeit zwischen Y und X1 sehr straff ist (rYX1 = 0.84). Es besagt
aber auch, dass diese Abhängigkeit sehr stark durch X2 beeinflusst wird, denn X2 wirkt
sehr stark auf X1 (r12 = 0.95) und sehr stark auf Y (rY2 = 0.86). Hält man diesen Einfluss
konstant, oder eliminiert man diesen Einfluss, dann ist die verbleibende Abhängigkeit nur
noch gering (rY1/2 = 0.146).
Was können Sie aus den Unterschieden zwischen den einfachen und partiellen
Korrelationskoeffizienten ablesen?
Beispiel 5.9.10: Einfluss von zwei Prozess- auf eine Produktvariable.
Maß der Beherrschbarkeit
Y kann einzeln sowohl durch X1 oder X2 und gemeinsam durch X1 und X2 zusammen
dargestellt werden. Die Genauigkeit der unterschiedlichen Darstellungen wird durch das
Maß der Beherrschbarkeit und durch die Streuungen um die Regressionsgleichung (Reststreuung) ausgedrückt.
1316han05.indd 248
25.07.2006 11:39:20
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
249
Die Darstellungen von Y durch X1 oder X2 liefern die beiden Gleichungen
Y = bY1 X1 = 0.84 X1
mit dem Maß der Beherrschbarkeit R2Y1 = 0.7056 und der Reststreuung
SY/1 = 0.5425 bzw.
Y = bY2 X2 = 0.86 X2
mit dem Maß der Beherrschbarkeit R2Y/2 = 0.7396 und der Reststreuung
SY/2 = 0.5203.
Wird Y durch beide X gemeinsam dargestellt, dann erhält man die Gleichung
Y = bY.1/2 X1 + bY.2/1 X2 = 0.2359 X1 + 0.6359 X2
mit dem Maß der Beherrschbarkeit R2Y/1, 2 = 0.7450 und der Reststreuung
SY/1, 2 = 0.5049.
Hieraus können Sie ablesen, dass
• die Varianz von Y durch X1 oder X2 zu ca. 70 % erklärt wird,
• durch den gemeinsamen Ansatz mit beiden Einflussvariablen X1 und X2 wird das Maß
der Beherrschbarkeit nicht wesentlich kleiner. Die Ursache hierfür ist der große Korrelationskoeffizient für X1 und X2.
• Man nennt diesen Effekt Einfluss der Multikollinearität zwischen den Einflussgrößen
auf die Regressionsgleichung und nennt eine der beiden Variablen redundant.
Berechnung der partiellen Korrelationskoeffizienten über die bedingte Verteilung
Für die allgemeine Ableitung setzen wir voraus, dass der zufällige Vektor (YT, XT) normal verteilt
ist. Gesucht sind die partiellen Korrelationskoeffizienten zwischen den Produktvariablen, d. h.
die bedingten Korrelationskoeffizienten der Produktvariablen Y unter der Bedingung, dass die
Input- und Prozessvariablen X konstant gehalten werden, d. h. gegeben sind.
Die bedingte Verteilung von Y unter der Bedingung X ist eine m-dimensionale Normalverteilung ist mit den bedingten Momenten E[Y/X] und var(Y/X). Für diesen verallgemeinerten
Fall erhält man den Vektor bedingter Erwartungswerte
1
E [Y / X ] = μY + ΣYX ⋅ Σ −XX
⋅ ( X − μ X ) = μ + βYT / X ⋅ ( X − μ X )
und die bedingte Kovarianzmatrix
1
var [Y / X ] = ΣYY − ΣYX ⋅ Σ −XX
⋅ Σ XY = ΣYY / X .
Die Elemente σkl/1, … n, k, l = 1, …, m der bedingten Kovarianzmatrix ΣYY/X „messen“ in der
Hauptdiagonalen die Variabilität der Produktvariablen und in den Nebendiagonalen die Abhängigkeiten zwischen den Produktvariablen unter der Bedingung X, d. h. unter der Bedingung,
dass die Input- und Prozessvariable gegeben sind.
Die partiellen Korrelationskoeffizienten zwischen den Produktvariablen unter der Bedingung,
dass die Input- und Prozessvariable realisiert sind, werden analog den gewöhnlichen Korrelationskoeffizienten, nur mit den Elementen der bedingten Kovarianmatrix ΣYY/X berechnet.
Wir erhalten die Formel
1316han05.indd 249
25.07.2006 11:39:20
250
5 Qualität in der Fertigung
ρkl /1, …, n =
σ kl /1, …, n
σ kk /1, …, n ⋅ σ kk /1, …, n
=
σ kl / X
.
σ kk / X ⋅ σ ll / X
Für σkk/X kann man natürlich auch σ2k/X schreiben. Die Matrizenformel zur Berechnung der
Korrelationskoeffizienten aus der Kovarianzmatrix kann natürlich auch für die bedingte Kovarianzmatrix aufgeschrieben werden. Wir erhalten
2
⎛ σ1/
X
⎜
D = Diag (ΣYY / X ) = Diag ⎜
⎜⎝
⎞
⎟
…
⎟
2
σ m / X ⎟⎠
und damit
D
−
1
2
⋅ ΣYY / X ⋅ D
−
1
2
= PYY / X ,
wobei PYY/X die Matrix der partiellen Korrelationskoeffizienten bezeichnet.
Beispiel 5.9.11: Bremsweg eines PKW. Partielle Korrelationskoeffizienten
Die partiellen Korrelationskoeffizienten für das Bremswegbeispiel sind in der Tabelle zusammen gestellt.
Tabelle 5.4.5: Matrix der partiellen Korrelationskoeffizienten
Rpartiell
⎛ 1 0.885 −0.566 0.695 ⎞
⎜
1
0.413 −0.55 ⎟
⎟
=⎜
1
0.475 ⎟
⎜
⎜⎝
1 ⎟⎠
Vergleicht man die Matrix der bedingten mit der Matrix der einfachen Korrelationskoeffizienten für dieses Beispiel, dann sieht man, dass
• sich die bedingten wesentlich von den einfachen Korrelationskoeffizienten unterscheiden können und
• die bedingten auch wesentlich größer als die einfachen Korrelationskoeffizienten werden können.
Die Vergrößerung oder Verkleinerung hängt im wesentlichen von den Vorzeichen der
einfachen Korrelationskoeffizienten ab.
5.9.4
Was sind multiple Korrelationskoeffizienten und wozu benötigt
man diese?
Der multiple Korrelationskoeffizient ist ein immens wichtiges Abhängigkeitsmaß zwischen
der Produktvariablen Y und der Prozessgleichung, oder anders formuliert dem bedingten Erwartungswert einer Produktvariablen unter der Bedingung der Input- und Prozessvariablen,
dem ja die Prozessgleichung entspricht.
1316han05.indd 250
25.07.2006 11:39:20
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
251
1
E [Y / X] = μY + σTY . X Σ −XX
(X − μ X )
mit der bedingten Varianz
2
1
var(Y / X ) = σYX
− σTY . X Σ −XX
σY . X .
Die Bezeichnungen liefern uns die Zerlegung der positiv definiten Kovarianzmatrix Σ entsprechend der Zerlegung des zufälligen Vektors in die Produktvariable Y und den Vektor X der
Prozess- und Inputvariablen ZT = (Y, XT) in
⎛ σ2
Σ=⎜ Y
⎝
σTY . X ⎞
⎟.
Σ XX ⎠
Warum ist der multiple Korrelationskoeffizient für die Anwendungen so wichtig?
Mit dem multiplen Korrelationskoeffizienten können Sie beurteilen,
• wie gut die Menge der Input- und Prozessvariablen die Produktvariable beeinflusst und
• wie gut die Varianz einer Produktvariablen durch die Input- und Prozessvariablen erklärt
wird.
Aus diesem Grunde nennen wir den multiplen Korrelationskoeffizienten das Maß der Beherrschbarkeit eines Prozesses. Je größer der multiple Korrelationskoeffizient ist, desto besser
wird die Varianz der Produktvariablen durch die Input- und Prozessvariablen aufgeklärt, d. h.
umso sicherer wird der Prozess beherrscht.
Das bedeutet aber auch, dass Sie beurteilen können, wie gut Sie den Prozess nach der Steuerung mit der Prozessgleichung beherrschen. Streuen die Werte der Produktvariablen nach
der Steuerung nur noch gering um die Prozessgleichung, dann werden die Werte auch nur
noch sehr wenig um den Zielwert streuen. Der Zielwert für die Steuerung ist aber der Sollwert
für die Produktvariable. Damit wird erreicht, dass die Kundenanforderungen überaus präzise
erfüllt werden können.
Für die Definition des multiplen Korrelationskoeffizienten betrachten wir wieder den zufälligen
Vektor (Y, XT) = ZT und nehmen an, dass Z ~ Nn + 1 (µ, Σ) und μ und Σ entsprechend dem Z
partitioniert sind.
Definition des multiplen Korrelationskoeffizienten:
ρY2 / X =
1
σTY . X ⋅ Σ −XX
⋅ σY . X
σY2
= 1−
σY2 / X
σY2
Es gilt 0 ≤ ρ2Y/X ≤ 1.
Wenn Y unabhängig von X ist, dann ist ρ2Y/X = 0. Wenn Y mit Wahrscheinlichkeit 1 eine Linearkombination der Komponenten von X ist, dann ist ρ2Y/X = 1.
Wenn der zufällige Vektor X nur eine Komponente hat, dann ist ρ2Y/X = ρ2Y.X, d. h. dem Quadrat
des einfachen Korrelationskoeffizienten.
Im standardisierten Fall wird aus der Kovarianzmatrix Σ die Korrelationsmatrix R. R wird
genauso zerlegt wie Σ, d. h.
⎛ 1 ρTY . X ⎞
R=⎜
⎟.
R XX ⎠
⎝
1316han05.indd 251
25.07.2006 11:39:21
252
5 Qualität in der Fertigung
Damit erhält man als Formel zur Berechnung des multiplen Korrelationskoeffizienten
−1
ρY2 / X = ρTY . X ⋅ R XX
⋅ ρY . X .
Die Maximum Likelihood Schätzung ist
1
RY2 / X = RYT. X R −XX
RY . X ,
wobei die einzelnen Terme in dieser Formel aus der partitionierten Korrelationsmatrix
⎛ 1 RYT. X ⎞
R =⎜
⎟
R XX ⎠
⎝
kommen, bzw. mit der Zerlegung der Matrix A in
⎛ a2
A =⎜ Y
⎝
RY2 / X =
aYT . X ⎞
⎟
A XX ⎠
1
aYT . X A −XX
aY . X
aY2
.
Wie kann eine Hypothese über den multiplen Korrelationskoeffizienten geprüft werden?
Unter den sehr allgemeinen Voraussetzungen, dass der N-dimensionale Stichprobenvektor der
Produktvariablen Y sphärisch mit P (Y = 0) = 0 und die Stichprobenmatrix X unabhängig von
Y ist und mit Wahrscheinlichkeit 1 den Rang n hat, ist der multiple Stichprobenkorrelationskoeffizient R2Y/X nach Muirhead [1982] Beta verteilt, bzw.
RY2 / X
N − n −1
⋅
n
1 − RY2 / X
ist Fn, N – n – 1 verteilt. Zur Prüfung der H0: ρ2Y/X = 0 gegen die allgemeine Alternative H1: ρ2Y/X ≠ 0
wird der F-Test
RY2 / X
N −n −1
⋅
= Fˆ
n
1 − RY2 / X
verwendet. F̂ ist bei Gültigkeit der H0 Fn, N – n – 1 verteilt mit n und N – n – 1 FG. Der Test zum
Niveau α lehnt die H0 ab, wenn Fˆ > Fn , N −n −1 (α) , wobei Fn, N − n −1(α) den oberen 100 α % Punkt
der Fn, N – n – 1 Verteilung bezeichnet.
Beispiel 5.9.12: Bremsweg eines PKW. Multipler Korrelationskoeffizient
Zur Demonstration des Rechenweges betrachten wir die Abhängigkeit des Bremsweges
Y von der Geschwindigkeit X1, der Profiltiefe X2 und der Reaktionszeit X3. Aus der Stichproben Kovarianzmatrix S der Tabelle 5.9.6 lesen wir die Werte ab, die in die Formel zur
Berechnung des multiplen Korrelationskoeffizienten einfließen.
1316han05.indd 252
25.07.2006 11:39:21
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
253
Tabelle 5.9.6: Stichprobenkovarianzmatrix für das Bremswegbeispiel
Bremsweg
Bremsweg
Geschwindigkeit
Profil
Reaktion
31,5056
22,5578
–1,393
1,2417
Geschwindigkeit
22,5578
23,0575
–0,6619
0,3899
Profil
–1,393
–0,6619
0,4417
0,0314
0,3899
0,0314
0,234
Reaktion
1,2417
RY2 /1,2,3
⎛ 23.0575 −0.6619 0.3899 ⎞
(22.5578 − 1.393 1.2417) ⋅ ⎜
0.4417 0.0314 ⎟
⎜
⎟
0.234 ⎠
⎝
=
31.5056
= 0.867.
−1
⎛ 22.5578 ⎞
⋅ ⎜ −1.393 ⎟
⎜
⎟
⎝ 1.2417 ⎠
Das Ergebnis bedeutet, dass die Varianz des Bremsweges zu 87 % durch die Input- und
Prozessvariablen wie Geschwindigkeit, Profiltiefe und Reaktionszeit erklärt wird. Betrachten
wir die Abhängigkeit des Bremsweges nur von der Geschwindigkeit, dann ist der multiple
Korrelationskoeffizient – das Quadrat des einfachen Korrelationskoeffizienten – gleich
R2Y/X = r2Y.1 = 0.83692 = 0.700,
also kleiner als vorher bei der Betrachtung von 3 Prozessvariablen. Hieraus liest man ab,
dass die multiplen Korrelationskoeffizienten bei Vergrößerung der Anzahl der Input- und
Prozessvariablen nie kleiner werden können, sondern, wenn die Produktvariable Y und die
hinzugenommenen Input- und Prozessvariable nicht unabhängig voneinander sind, stets
größer werden. Das ist logisch, denn durch die Hinzunahme neuer Information kann die
Varianz des Produktvariables immer besser erklärt werden.
Zur Prüfung der H0: ρ2Y/X = 0 verwenden wir den F-Test
Fˆ =
0.867
30 − 3 − 1
⋅
= 56.49
1 − 0.867
3
Aus der Tafel für die F-Verteilung findet man den Wert F3,140 – 3 = 2.60. Da F̂ > F3, ∞, (0.05) ,
muss die H0 verworfen werden, d. h. Y hängt statistisch gesichert von den drei Parametern
Geschwindigkeit, Profiltiefe und Reaktionszeit ab, oder anders ausgedrückt, die Varianz des
Bremsweges wird zu mehr als 86 % durch die drei Prozessvariablen erklärt.
5.9.5
Was sind partiell multiple Korrelationskoeffizienten
und wozu benötigt man diese?
Neben den einfachen, den partiellen und den multiplen Korrelationskoeffizienten muss ich
noch den partiell multiplen Korrelationskoeffizienten einführen. Dieser ist für den Nachweis
erforderlich, dass nach der Zerlegung des Vektors X in die Teilvektoren X(k) und X(h) die
Komponenten von X(h) unwesentlich sind. Hierzu muss gezeigt werden, dass die Menge der
unwesentlichen (Input- und Prozess-) Variablen, in X(h) zusammengefasst, tatsächlich unab-
1316han05.indd 253
25.07.2006 11:39:21
254
5 Qualität in der Fertigung
hängig von der Menge der wesentlichen Variablen und von Y ist und damit aus einer statistischen
Prozessanalyse gestrichen werden kann, oder anders formuliert, ob die Variablen aus X(h) nach
ihrer Streichung die bedingte Varianz von Y unter der Bedingung X(k) kaum vergrößern.
Diesen Sachverhalt kann man auch durch die folgende Frage ausdrücken.
Wie verändern sich der Grad der linearen Abhängigkeit und die Beziehung zwischen Y und X,
wenn der Einfluss von X(h) auf Y und X(k) eliminiert wurde?
Multipel bedeutet in diesem Sprachgebrauch die Messung des Grades der linearen Abhängigkeit
zwischen einer Zufallsgröße – der Produktvariablen Y – und einer Linearkombination von
Zufallsgrößen – der Prozessgleichung in X(k) und partiell bedeutet die Messung des Grades
zwischen zwei „bedingten“ zufälligen Größen, nämlich zwischen den beiden bedingten Erwartungswerten Y unter X(h) und X(k) unter X(h).
Ausgangspunkt für die Darstellung dieses Korrelationskoeffizienten ist die obige Zerlegung,
in der Y eine Produktvariable bezeichnet, X(k) p und X(h) n – p Parameter enthält, und der
Zerlegungssatz für die bedingten Erwartungswerte und Varianzen.
Mit der analogen Zerlegung des Vektors der Erwartungswerte µT = (µY, µ(k)T, µ(h)T) und der
Kovarianzmatrix
⎛ σY2
⎜
Σ=⎜
⎜⎝
σYT .k
Σ kk
σYT .h ⎞
⎟
Σ kh ⎟
Σ hh ⎟⎠
erhält man die Momente der bedingten Verteilung von (Y, X(k)T) unter der Bedingung X(h)
⎛ σT ⎞ −1
E {[Y , X (k)T )/ X (h)]T } = (μY μTk ) − ⎜ Y .h ⎟ ⋅ Σ hh
⋅ [ X (h) − μ(h)]
⎝ Σ kh ⎠
und
⎛ σ2
var[(Y X (k)T )/ X (h)T ] = ⎜ Y
⎝
⎛ σ2
=⎜ Y
⎝
⎛ σ2
= ⎜ Y /h
⎝
σYT .k ⎞ ⎛ σYT .h ⎞ −1
T
⎟−⎜
⎟ ⋅ Σ hh ⋅ (σY .h Σ hk )
Σ kk ⎠ ⎝ Σ kh ⎠
T
−1
σYT .k ⎞ ⎛ σY .h Σ hh σY .h
−
⎜
⎟
−1
Σ kk ⎠ ⎝ Σ kh Σ hh
σ Y .h
−1
σYT .h Σ hh
Σ hk ⎞
⎟
−1
Σ kh Σ hh Σ hk ⎠
σYT .k / h ⎞
⎟.
Σ kk / h ⎠
Die Linearkombination zwischen E[X(k)/X(h)] und E[Y/X(h)] hat die Koeffizienten
−1
βTY .k / h = σTY .k / h Σ kk
/h
und die maximale Korrelation
ρY2 .k / h =
−1
σTY .k / h Σ kk
/ h σY .k / h
σY2 / h
.
Dieser Korrelationskoeffizient wird partiell multipler Korrelationskoeffizient genannt.
1316han05.indd 254
25.07.2006 11:39:22
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
255
Für die Interpretation dieses Korrelationskoeffizienten betrachten wir die folgenden Beziehungen
1 − ρY2 .k / h =
−1
σTY .k / h Σ kk
/ h σY .k / h
σY2 / h
=
σY2 / X
σY2 / h
oder
ρY2 .k / h = 1 −
σY2 / X
σY2 / h
.
Es gilt 0 ≤ ρ2Y.k/h ≤ 1.
Damit wird deutlich, dass der partiell multiple Korrelationskoeffizient ein Maß für die Reduktion der bedingten Varianz von Y unter der Bedingung X(k) ist, wenn man den Vektor X(h)
zu X(k) hinzu nimmt.
Sind σ2Y/X und σ2Y/h nahezu gleich groß, dann wird der Quotient nahezu gleich 1, d. h. ρ2Y.k/h
wird sehr klein sein. Andererseits, wenn σ2Y/X im Vergleich zu σ2Y/h sehr klein ist, dann wird
ρ2Y.k/h groß sein.
Kleine Werte von ρ2Y.k/h bedeuten eine kleine Reduktion der bedingten Varianz von Y unter
X(k) durch Hinzunahme von X(h).
Weitere nützliche Beziehungen in Bezug auf den partiell multiplen Korrelationskoeffizienten
1. Mit var[Y/X(h)] = σ2Y (1 – ρ2Y/h) und
var[Y/X(k), X(h)] = σ2Y (1 – ρ2Y/X) erhält man
ρY2 .k / h =
ρY2 / X
1 − ρY2 / h
ρY2 .k / h
1 − ρY2 .k / h
=
.
ρY2 / X − ρY2 / h
1 − ρY2 / X
2. Den Zusammenhang zwischen den partiellen und multiplen Korrelationskoeffizienten
erkennt man sofort, wenn X (k) und X(h) als einfache Zufallsgrößen angesehen werden.
In diesem Falle wird aus der Matrix Σkk/h die skalare Größe σ2kh und damit
ρY2 .k / h =
σTY .k / h σ k−2/ h σY .k / h
σY2 / h
=
σY2 .h / k
σY2 / h ⋅ σY2 / k
.
Wie können Hypothesen bzgl. des partiell multiplen Korrelationskoeffizienten geprüft
werden?
Es soll die Hypothese H0: ρ2Y.h/k = 0 gegen die Alternative H1: ρ2Y.h/k ≠ 0 geprüft werden. Hierzu
ist der F-Test anwendbar. Es gilt
Fˆ =
RY2 .k / h
1−
RY2 .k / h
⋅
N − p − (n − p)
n−p
ist Fn – p, N – n verteilt.
1316han05.indd 255
25.07.2006 11:39:22
256
5 Qualität in der Fertigung
Beispiel 5.9.13: Bremsweg eines PKW. Partiell multipler Korrelationskoeffizient
Wir betrachten die Prozessgleichung
Y = 17.1505 + 0.2935 Geschwindigkeit – 3.5605 Profiltiefe
+ 8.516 Reaktionszeit.
Das Maß der Beherrschbarkeit (Quadrat des multiplen Korrelationskoeffizienten) ist
R2Y/1, 2, 3 = 0.867 und die Streuung um die Prozessgleichung (bedingte Standardabweichung)
ist sY/1, 2, 3 = 2.164 (S2Y/1, 2, 3 = 4.6828).
Die Frage ist, ob zwei weitere Variable, wie z. B. Rauheit der Straße und Alkoholkonzentration den multiplen Korrelationskoeffizienten wesentlich vergrößern können. Die Kovarianzmatrix bei Einbeziehung der zusätzlichen Variablen und mit einer neuen Stichprobe ist
⎛ 33.540 34.581 −1.878
⎜
95.479 −0.367
⎜
0.5904
⎜
S=⎜
⎜
⎜
⎜
⎝
1.300
−7.441
0.617 −6.665
0.0389 0.203
0.1477 0.0313
5.0646
0.474 ⎞
0.863 ⎟
⎟
0.0127 ⎟
0.04026 ⎟
⎟
0.0367 ⎟
0.0217 ⎟⎠
Zur Beantwortung der Frage wird der partiell multiple Korrelationskoeffizient berechnet.
Man erhält
⎛ SYT.h
⎞ −1
⎜
⎟ ⋅ Shh ⋅ (S y .h
⎝ Shh ⎠
⎛ 23.935114 32.237561 −0.021682
⎜
47.516117 0.210268
Shk ) = ⎜
0.014019
⎜
⎜⎝
0.94003 ⎞
1.660873 ⎟
⎟
0.022227 ⎟
0.074965 ⎟⎠
und damit
⎛ SY2 / h
SYT.k / h
⎜
⎝
Skk / h
⎛ 9.6048 2.3434 −1.8563 0.35997 ⎞
⎞ ⎜
47.9629 −0.5773 −1.0439 ⎟
⎟
⎟=⎜
0.5764 0.01667 ⎟
⎠ ⎜
⎜⎝
0.07273 ⎟⎠
Mit diesen Werten erhält man die Maximum Likelihood Schätzung für den partiell multiplen Korrelationskoeffizienten
RY2 .k / h =
−1
SYT.k / h ⋅ Skk
/ h ⋅ SY .k / h
SY2 / h
=
9.583
= 0.997.
9.605
Für die Prüfung der Hypothese H0: ρ2Y.k/h = 0 gegen die Alternative H1: ρ2Y.k/h ≠ 0 wird der
F-Test verwendet. Man berechnet
Fˆ =
1316han05.indd 256
ρY2 .k / h
1−
ρY2 .k / h
⋅
N − p − (n − p)
0.997
140 − 3 − 2
=
⋅
= 2243
n−p
1 − 0.997
2
25.07.2006 11:39:22
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?
257
Hieraus folgt schon – auch ohne den Tafelwert nach zu schlagen –, dass dieser Wert statistisch
gesichert von null verschieden ist, d. h. dass die beiden Parameter Rauheit der Strasse und
Alkoholkonzentration im Blut das Maß der Beherrschbarkeit wesentlich vergrößern.
Die vollständige Prozessgleichung ist
Y = 27.362 + 0.1939 Geschwindigkeit – 3.272 Profiltiefe
+ 8.4829 Reaktionszeit – 1.151 Rauheit + 2.265 Alkoholkonzentration
Das Maß der Beherrschbarkeit ist R2Y/X = 0.999 und die Streuung um die Prozessgleichung
ist SY/X = 0.11677 (S2Y/X = 0.01363).
Welche Aussagen sind mit dem multivariaten, multiplen Korrelationskoeffizient möglich?
Häufig wird eine Maßzahl zur Bewertung der Abhängigkeit zwischen zwei zufälligen Vektoren
gesucht, wie z. B. bei der multivariaten, multiplen Regressionsanalyse mit stochastischen Input- und Prozessvariablen.
Der multivariate, multiple Korrelationskoeffizient wird über die Formel
τY2 / X = 1 −
ΣYY / X
Σ XX
definiert. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit z. B. zwischen dem zufälligen Vektor Y und E(Y/X).
Für m = 1 ist τ2Y/X identisch mit dem multiplen Korrelationskoeffizienten ρ2Y/X.
Bemerkungen
1. Ein weiteres Maß für die lineare Abhängigkeit zwischen zwei zufälligen Vektoren ist die
Spurkorrelation nach Anderson [1984] und Höschel [1974, 1976], die über
−1
1
VYX = Sp (ΣYY
⋅ ΣY . X ⋅ Σ −XX
⋅ Σ X .Y )
= m − Sp (Σ −yy1 ⋅ Σ yy / x )
durch
ηY2 / X =
VYX
min(m, n)
definiert wird.
2. Zusammenhang zwischen den multivariaten, multiplen und kanonischen Korrelationskoeffizienten κ. Es gilt
1 − τY2 / X = (1 − κ12 ) ⋅ … ⋅ [1 − κ 2min(m,n) ].
Die kanonischen Korrelationskoeffizienten werden am einfachsten aus den nicht negativen
−1
1
Eigenwerten von ΣYY
⋅ ΣY . X ⋅ Σ −XX
⋅ Σ X .Y berechnet.
1316han05.indd 257
25.07.2006 11:39:22
258
5 Qualität in der Fertigung
5.9.6
Was besagen der multivariat partiell-multiple und der multivariat
semipartiell-multiple Korrelationskoeffizient?
Die Berechnung von Prozessgleichungen im Rahmen des multivariaten, multiplen linearen Modells wird mit der Auswahl der wesentlichen Input- und Prozessvariablen gekoppelt. Hieraus folgt aber, dass wir Korrelationskoeffizienten für die Beurteilung der
Abhängigkeiten nach der Zerlegung des zufälligen Vektors der Produkt- und Input- und
Prozessvariablen in ZT = (YT, X(k)T, X(h)T) für die bedingten Erwartungswerte E[X(h)/X(k)]
−1
= Σ h.k ⋅ Σ kk
⋅ X (k) =: βYT / X ⋅ X (k) mit var[X(h)/X(k)] = Σhh/k benötigen. Bezeichnen wir die
Fehlermatrizen mit
E [FY / k ⋅ Fh / k ] = ΣY .h / k
−1
E [FY / k / Fh / k ] = ΣY .h / k ⋅ Σ hh
⋅ Fh / k
und
−1
var [FY / k / Fh / k ] = ΣYY / k − ΣTY .h / k Σ hh
/ k Σ Y .h / k
dann können wir den multivariaten partiell-multiplen Korrelationskoeffizienten in der folgenden Form
τY2 .h / k = 1 −
ΣYY /(k ,h)
ΣYY / k
ΣYY / X
= 1−
ΣYY / k
definieren.
Dieser Korrelationskoeffizient misst den Grad der linearen Abhängigkeit zwischen den bedingten Erwartungswerten E[Y/X] und E[Y/X(k)].
Für jede Produktvariable Yr, r = 1, …, m kann man aufgrund der Darstellung für τ2Y.h/k die
Beziehung
τY2r .h / k = ρr2.h / k = 1 −
σY2 / X
σY2 / k
=
σ r2/ k − σ 2r / X
σ 2r / k
=
Red r , p (h)
σ 2r / k
aufschreiben, die besagt, dass Hypothesen über die Redp(h) bzw. Redr, p(h) des Abschnittes 5.9.2
mit den partiell-multiplen Korrelationskoeffizienten geprüft werden können.
Aus ρ2r.h/k = 0 folgt mit Wahrscheinlichkeit 1, dass die Streichung der Input- und Prozessvariablen in X(h) keine Vergrößerung der bedingten Varianz σ2Y/X zur Folge hat. In diesem Fall
muss gelten, sowohl Σhk = 0 als auch σr.h = 0.
Aus ρ2r.h/k = 1 folgt mit Wahrscheinlichkeit 1, dass X(h) eine lineare Funktion von X(k) ist.
Für die Zerlegung des Vektors der Input- und Prozessvariablen in X(k) und X(h) gilt für den
partiell-multiplen Korrelationskoeffizienten
σ 2r / X = σ 2r / k ⋅ (1 − ρ2r .h / k ) = σ 2r ⋅ (1 − ρ2r / k ) ⋅ (1 − ρ2r .h / k ).
Dieser interessante Zusammenhang lässt sich auf den multivariaten Fall übertragen.
Für die Zerlegung des Vektors der Produktvariablen Y in Y(s) und Y(t) mit
s = (s1, …, sq), s1 < … < sq und
t = (t1, …, tm – q), t1 < … < tm – q gilt
1316han05.indd 258
25.07.2006 11:39:23
5.10 Was ist eine Prozessgleichung und wozu benötigt man diese?
259
1 − τY2 / X = (1 − τ2s / X ) ⋅ (1 − τt2. X / s )
und für die Zerlegung von X in X(k) und X(h) gilt
1 − τY2 / X = (1 − τY2 .h / k ) ⋅ (1 − τY2 / k ).
In analoger Weise kann der multivariate semi partielle Korrelationskoeffizient
τY2 .(h / k) = 1 −
ΣYY /(k ,h)
ΣYY
gebildet werden.
5.10
Was ist eine Prozessgleichung und wozu benötigt man
diese?
Wie wir schon wiederholt feststellten, ist jedes Produkt (materielles Produkt oder Dienstleistung) das Ergebnis eines (Herstellungs- oder Dienstleistungs-) Prozesses. Jedes Produkt wird
durch m, m ≥ 1 nicht unabhängige Produktvariable beschrieben. Der Kunde, der ein Produkt
kaufen möchte, stellt seine Anforderungen an das Produkt. Diese Anforderungen werden in
einem Kundenanforderungsprofil (KAP) zusammen gestellt. Das KAP wird parametrisiert und
durch Sollwerte und Toleranzgrenzen für alle relevanten Produktvariable spezifiziert.
Ein Prozess wird durch die Input-, Prozessvariablen X als Ursachen und die Produktvariablen
Y als Wirkungen beschrieben. Eine Veränderung der Produktvariablen kann nach dem Ursache-Wirkungs-Prinzip nur durch die Veränderung der Input- und/oder Prozessvariablen
erreicht werden. Die Veränderungen durch die Störvariablen (noise variables) sind zufällig
und nicht steuerbar, müssen aber trotz alledem berücksichtigt werden, denn deren Einfluss
kann erheblich sein.
Damit die Kundenanforderungen durch die gefertigten Produkte auch wirklich erfüllt werden,
muss der Prozess gesteuert werden. Dazu benötigen wir die Prozessgleichung. In die können
wir Werte für die Input- und Prozessvariable einsetzen und damit die Werte für die Produktvariable (oder Produktvariablen) berechnen.
Definition der Prozessgleichung
Die Prozessgleichung ist eine Funktion, die den Input- Z und Prozessvariablen X die Produktvariablen Y zuordnet, sodass eine Steuerung des Prozesses möglich ist.
Die Funktion ist in der Regel unbekannt. Es sind kaum Gesetze bekannt, nach denen die Prozessgleichung gefunden werden kann. Daher muss die Funktion statistisch bestimmt werden.
Dazu benötigt man möglichst fehlerfreie, vollständige, zuordenbare Messwertsätze in ausreichender Anzahl für die Input-, Prozess- und Produktvariablen.
Die Input- und Produktvariablen sind dabei in der Regel zufällige Vektoren, denn die Inputvariablen sind nach Abschnitt 5.5 die Produktvariablen der Produkte von Vorläuferprozessen.
Produktvariable sind zufällige Vektoren, da in jedem Prozess zufällige Komponenten wirken,
deren Beitrag sich auf die Werte der Produktvariablen auswirkt.
1316han05.indd 259
25.07.2006 11:39:23
260
5 Qualität in der Fertigung
Die Prozessvariablen können zufällig oder determiniert sein. Häufig wirken aber auch die determinierten Einstellvariablen zufällig auf das Produkt. Diese Voraussetzung bedingt, dass für
die Berechnung der Prozessgleichung gewisse Verteilungsvoraussetzungen benötigt werden.
Beispiel 5.10.1: Brennen von Porzellan. Technologie
Porzellan wird aus Kaolin, Quarz und Feldspat hergestellt. Die aus der Porzellanmasse
geformten Gegenstände werden zuerst in einem Glühbrand von 900 [°C] gesintert, wobei
der Scherben entsteht. Nach dem Verglühen wird der Scherben glasiert und dem Gar- oder
Glattbrennen von 1400 – 1500 [°C] unterworfen. Der Quarz und Feldspat geraten bei der
hohen Temperatur in Fluss und füllen das Gerippe von Kaolin vollständig aus.
Der Brennofen wird auf 900 [°C] oder 1400 [°C] hoch geheizt. Dass Brenngut wird in
Regale einsortiert und eingeschoben. An jeder Stelle des Regals wirkt eine klein wenig
unterschiedliche Temperatur, d. h. trotz der festen Einstellung des Ofens wirken auf die zu
brennenden Gegenstände verschiedene Temperaturen.
Wie kann man eine Prozessgleichung gewinnen?
In der Antwort zu dieser Frage werden Methoden zur Prüfung der Homogenität und zur
Klassifikation der inhomogenen Stichprobe in homogene Teilstichproben, zur Berechnung
der Prozessgleichung und zur Auswahl der wesentlichen Input- und Prozessvariablen bereit
gestellt.
Um die Verbindung zur klassischen Literatur über die Regressionsanalyse herzustellen, betrachten wir zunächst den klassischen Fall, bei dem angenommen wird, dass nur Y eine Zufallsgröße
oder ein zufälligen Vektor ist und erweitern diesen dann auf den praktikablen Fall, in dem
sowohl die Input-, Prozess- und Produktvariable zufällige Vektoren sind.
5.11
Modelle für die Prozessgleichung
5.11.1
Nur die Produktvariable Y ist zufällig
Wir wollen annehmen, dass Y ~ Nm (µY, ΣYY). Die Input- und Prozessvariablen, wir fassen diese
zu dem Vektor x zusammen, sind determiniert. Die funktionale Darstellung der Produktvariable
Y durch die determinierten Input- und Prozessvariablen
Y = f (x) + ε
bezeichnen wir als Prozessgleichung. Wir können dafür auch schreiben,
Y ~ Nm (f (x), ΣYY).
Da x ein Vektor fester Einstellgrößen für die Input- und Prozessvariablen ist, wird das Modell
multivariates lineares Modell mit festen Input- und Prozessvariablen genannt. Ist X ein zufälliger Vektor von Input- und Prozessvariablen und sind Y und X gemeinsam nach einer n + m
dimensionalen Normalverteilung verteilt, dann wird das Modell multivariates lineares multiples
Modell mit stochastischen Input- und Prozessvariablen genannt. Wir beginnen mit dem Modell
mit determinierten Input- und Prozessvariablen, da dieses aus der Literatur bekannt ist.
1316han05.indd 260
25.07.2006 11:39:23
5.11 Modelle für die Prozessgleichung
261
Den Vektor der Input- und Prozessvariablen bezeichnen wir mit x, den Vektor der Produktvariablen mit Y. Um das Ursache-Wirkungs-Prinzip auch in diesem Falle zu betonen, schreiben
wir anstelle der Y auch Y = Y(x1, …, xn).
Das multivariate lineare Modell mit festen Input- und Prozessvariablen wird wie folgt geschrieben
Y(x1, …, xn) = f (x1, …, xn) + ε,
wobei
f (x1, …, xn) ist eine lineare Funktion,
E[Y(x1, …, xn)] = f (x1, …, xn),
ε ∼ Nμ(0, Σ), Σ ist positiv definit und
f (x1, …, xn) und ε sind unabhängig voneinander. Die Kovarianzmatrix Σ, kann zwei grundsätzliche verschiedene Strukturen haben. Beim klassischen linearen Modell gilt
var(ε) = σ2 IN, d. h. var(εi) = σ 2 und cov(εi, εk) = 0 für i ≠ k.
Für das allgemeine lineare Modell gilt
var(ε) = σ2 ΣYY.
ΣYY wird manchmal als bekannt vorausgesetzt, kann aber auch unbekannte Modellparameter
enthalten. σ2 ist in jedem Fall ein unbekannter Modellparameter. Die Eigenschaft gleicher
Varianz σ2 der Fehlervariablen εi, i = 1, …, N wird als Homoskedastizität bezeichnet.
Manchmal ist Σ diagonal, aber ≠ IN, so nennt man diesen Fakt Heteroskedastizität. Im Fall von
Zeitreihendaten ist die Voraussetzung cov(εi, εk) = 0 für i ≠ k, d. h. der Unkorreliertheit der Fehlervariablen verletzt. In Kurzschrift können wir hierfür auch schreiben Y ~ Nm (f (x1, …, xn), Σ)
mit den Eigenschaften der positiven Definitheit von Σ und der Unabhängigkeit von Fehler
und linearer Funktion.
Die statistischen Aufgaben sind in diesem Fall die
• Bestimmung der linearen Funktion f (x1, …, xn),
• Berechnung des Maßes der Beherrschbarkeit des Prozesses durch die ausgewählten Inputund Prozessvariablen,
• Beantwortung der Frage, ob das berechnete Maß der Beherrschbarkeit auch mit weniger Input- und Prozessvariablen erreicht werden kann, d. h. Auswahl der optimalen Teilmenge von
wesentlichen Input- und Prozessvariablen und Streichung der redundanten Variablen.
Das lineare Modell mit festen Input- und Prozessvariablen kann nun durch
• Varianzanalysen oder
• Regressionsanalysen
realisiert werden. Das Unterscheidungskriterium zwischen diesen beiden Modelltypen ist die
Messbarkeit der Input- und Prozessvariablen. Sind x1, …, xn nur qualitativ messbar, d. h. lassen
sich hierfür Abstufungen angeben, dann ist die Varianzanalyse der passende Modelltyp.
Die Input- und Prozessvariablen sind feste Einstellgrößen, d. h. x1, x2, …, xn ∈ Rn. Die m, m ≥ 1
Produktvariablen Y1, Y2, …, Ym sind Zufallsgrößen und Funktionen der determinierten Inputund Prozessvariablen. Auch dieser Sachverhalt wird in Verbindung mit einer Verteilungsannahme
1316han05.indd 261
25.07.2006 11:39:23
262
5 Qualität in der Fertigung
Y ∼ N m (B
x , ΣYY ) ,
Y .x
dargestellt, wobei BY.x die Matrix der unbekannten Koeffizienten der Prozessgleichungen ist,
die den Vektor der Produktvariablen YT = (Y1 … Ym) als Linearkombination von den Inputund Prozessvariablen xT = (x1 … xn) darstellt. ΣYY ist die Kovarianzmatrix des Vektors der
Produktvariablen.
Die Normalverteilungsannahme ist oft gerechtfertigt und wird genau so oft, zumindest von
Kritikern infrage gestellt. Unter den hier formulierten Voraussetzungen ist sowohl der lineare
als auch nichtlineare Modellansatz möglich.
Bei all diesen höher dimensionalen Problemen sollte die statistische Prozessanalyse zunächst
mit linearen Modellen begonnen werden. Sind die Maße der Beherrschbarkeit niedrig und
können nicht durch zusätzliche Input- und/oder Prozessvariable vergrößert werden, dann
kann man zu den nichtlinearen Modellen übergehen.
Die Stichprobe
Y 1T = Y T (x11 , …, x1n )
…
Y TN = Y T (x N 1 , …, x Nn )
an den N Messwertstellen für die Input- und Prozessvariablen
⎛ x11 … x1n ⎞
⎜
⎟
…
⎜
⎟
⎝ x N 1 … x Nn ⎠
und die Darstellung
Y i = f (xi1 , …, xin ) + εi , ∀i = 1, …, N
sind Grundlagen für die Berechnung der Prozessgleichung mit festen Input- und Prozessvariablen. Es wird noch vorausgesetzt, dass
E [εi ] = 0
var (εi ) = Σ
Des weiteren wird angenommen, daß f (x1, …, xn) von den unbekannten Modellparametern
βY.1, …, βY.n abhängen möge. Es gibt folglich eine Funktionenschar
f (x1 , …, xn ; β
Y .1
, …, β
Y .n
), mit (β
Y .1
, …, β
Y .n
) ∈ R n⋅m ,
die die unbekannte Funktion enthält. Für die Ableitung von Schätzfunktionen für die unbekannten Modellparameter wollen wir voraussetzen, daß die Funktion f nur linear von den
unbekannten Koeffizienten abhängt, d. h.
f (x1 , …, xn ; β
Y .1
, …, β
Y .n
)=β
Y .1
⋅ g (x1 , …, xn ) + … + β
Y .n
⋅ g (x1 , …, xn )
wobei g(x1, …, xn) bekannte linear unabhängige Funktionen sind. Diese Gleichung nennen
wir Prozessgleichung, wenn xT = (x1, …, xn) der Vektor der determinierten Input- und Prozessvariablen ist.
1316han05.indd 262
25.07.2006 11:39:24
5.11 Modelle für die Prozessgleichung
263
5.11.1.1 Was versteht man unter einem univariaten, linearen, multiplen Modell
mit festen Input- und Prozessvariablen?
Dieses Modell besitzt die Darstellung
Y = βTY . x ⋅ x + ε.
In diesem Modell ist Y eine nach Y ~ N1 (βTY…x x, σ2) verteilte Zufallsgröße, xT = (x1, …, xn)
der Vektor der festen Input- und Prozessvariablen und ε der Anpassungsfehler Y – βTY…x x mit
der Verteilung ε ~ N1 (0, σ2). Y und ε sind unabhängig voneinander verteilt. Das dazugehörige
statistische univariate, lineare, multiple Modell mit festen Input- und Prozessvariablen ist
Y = βTY . x ⋅ x + ε
wobei
⎛ Y1 ⎞
⎛ x11 … x1N ⎞
⎟
Y = ⎜ … ⎟ und x = ⎜
…
⎜ ⎟
⎜
⎟
⎝YN ⎠
⎝ x N 1 … x Nn ⎠
die Stichproben vom Umfang N für die Produktvariable Y und den Vektor der determinierten
Input- und Prozessvariablen sind. In der Schreibweise mit der Verteilung gilt für dieses Modell
Y ∼ N N (βYT . x ⋅ x , σ 2 ⋅ I N ) und ε ~ N N (0, σ 2 ⋅ I N )
wobei IN die N dimensionale Einheitsmatrix ist.
Was müssen wir weiter tun?
Wir müssen mit der Stichprobe für Y und x die unbekannten Modellparameter für das multivariate, lineare, multiple Modell mit festen Input- und Prozessvariablen schätzen. Hierzu verwenden wir die bekannte Methode der kleinsten Quadrate, die von Gauß eingeführt wurde. Diese
Methode wollen wir an dem vereinfachten Beispiel 5.11.1 demonstrieren. Vereinfacht bedeutet,
dass wir nur die eine Prozessvariable Geschwindigkeit betrachten und hierfür annehmen, dass
diese Variable fest ist. Die Festlegung kann realisiert werden, idem wir die Geschwindigkeiten
vorgeben und nach dem plötzlichen Bremsen die Länge des Bremsweges messen.
Beispiel 5.11.1: Bremsweg. Einfache Prozessgleichung
Wir betrachten nur die Abhängigkeit des Bremsweges Y [m] von der vorgegebenen Geschwindigkeit x [km/h]. In diesem einfachsten Fall erhalten wir das einfache lineare Modell
mit einer festen Prozessvariablen
Y = βY. x x + ε.
Wir wollen annehmen, dass ε ~ N (0, σ2). Die beiden Modellparameter βY.x und σ2 sind
unbekannt. Für deren Bestimmung wird eine Stichprobe für die beiden Produkt- und Prozessvariablen vom Umfang N benötigt. Um das Nachrechnen zu ermöglichen, betrachten
wir nur die kleine Stichprobe in der Tabelle 5.11.1, die auch in der Datei 052Bremsweg03
auf der beiliegenden CD enthalten ist.
1316han05.indd 263
25.07.2006 11:39:24
264
5 Qualität in der Fertigung
Tabelle 5.11.1: Messwerte für das Bremswegbeispiel
Nr.
Y
x
1
2
3
4
5
6
7
8
9
10
35,1
34,1
39,5
36,9
34,1
34,4
30,7
30,3
33,9
49,7
58,0
55,6
60,4
59,8
58,4
58,7
56,3
52,5
54,4
70,5
Zuerst werden die statistischen Maßzahlen berechnet. Man erhält die Werte:
Tabelle 5.11.2: Statistische Maßzahlen für das Bremswegbeispiel
Statistische Maßzahl
Y
X
Mittelwert
Standardabweichung
Minimum
Maximum
Spannweite
Variationskoeffizient
35,87
5,539
30,3
49,7
19,4
15,4
58,46
4,895
52,5
70,5
18
8,4
Die statistischen Maßzahlen verraten nichts über die Abhängigkeit des Bremsweges von der
Geschwindigkeit, obwohl die natürlich gegeben ist. Das lehrt die Erfahrung und zeigt die
Abbildung 5.11.1. Diese Abbildung zeigt uns auch, dass die Abhängigkeit zwischen diesen
beiden Variablen linear ist.
Für das Bremswegbeispiel erhalten wir die Punktwolke der Abbildung 5.11.1.
Plot Bremsweg über der Geschwindigkeit
Bremsweg
50
46
42
38
34
30
52
56
60
64
68
72
Geschwindigkeit
Abb. 5.11.1: Punktwolke für das Bremswegbeispiel
Was ist in dieser Situation zu tun? Wir denken uns eine Gerade Y = b0 + bY.x x durch die
„Punktwolke“ gelegt und fragen, wie die unbekannten Koeffizienten der Gleichung aus den
Messwertepaaren für die beiden Variablen bestimmen werden können.
1316han05.indd 264
25.07.2006 11:39:24
5.11 Modelle für die Prozessgleichung
265
Das plausibelste Prinzip hierfür ist, den Abstand der einzelnen Punkte von der gedachten
Gerade zu minimieren. Hierbei ist darauf zu achten, dass die Summe der Abstände oberhalb der Geraden genauso groß ist, wie die Summe der Abstände unterhalb der Geraden.
Für diese Lösung betrachten wir die Quadrate der Abstände der Punkte von der Geraden.
Der quadratische Abstand eines Punktes i mit den Koordinaten (xi, yi), i = 1, …, N von
der gedachten Geraden
yˆ = b 0 + b y . x x
ist ( yˆ − yi )2 . Die Summe der quadratischen Abstände aller Punkte von der gedachten
Ausgleichsgeraden ist
N
∑ ( yi − yˆ )2 =
i =1
N
∑ [ yi − (b0 + by . x x)]2 .
i =1
Diese Summe soll minimiert werden. Für diese Aufgabe sind die Methoden der Differentialrechnung zu verwenden. Es müssen zunächst die partiellen Ableitungen der Summe der
quadratischen Abweichungen gebildet und dann null gesetzt werden. Das so entstehende
Gleichungssystem ist zu lösen. Formelmäßig erhält man
QS =
N
N
i =1
i =1
∑ ( yi − yˆ )2 = ∑ ( yi − b0 − by . x x)2
⇒ Min!
N
∂QS
= −2 ⋅ ∑ ( yi − b0 − b y . x x)
∂b0
i =1
N
∂QS
= −2 ⋅ ∑ ( yi − b0 − b y . x x) ⋅ x
∂b y . x
i =1
d. h. man muss das Gleichungssystem
N
∑ ( yi − b0 − by . x x) = 0
i =1
N
∑ ( yi − b0 − by . x x) ⋅ x = 0
i =1
lösen.
Das Gleichungssystem kann man umformen zu
N
∑ yi
i =1
N
∑ xi ⋅ y i
i =1
N
= N ⋅ b0 + b y . x ⋅ ∑ xi
i =1
N
N
i =1
i =1
= b0 ⋅ ∑ xi + b y . x ⋅ ∑ xi2
Dieses Gleichungssystem nennt man Normal Gleichungs System (NGS) für die unbekannten Koeffizienten b0 und by.x der linearen Gleichung und die bekannten Ausdrücke
1316han05.indd 265
25.07.2006 11:39:24
266
5 Qualität in der Fertigung
N
N
∑ xi und
∑ xi2 .
i =1
i =1
Dieses einfache NGS löst man am schnellsten mit der Kramer’schen Regel (siehe Bronstein
[1960]).
Die Koeffizientendeterminante des NGS ist
N
∑ xi
N
N
i =1
N
i =1
i =1
D=
∑ xi ∑ xi2
D0 ist die Determinante, die sich aus D ergibt, wenn man in dieser die Spalte der KoeffiN
zienten für das unbekannte b0 durch die Spalte der Absolutglieder
ersetzt, d. h.
N
D0 =
∑ yi
i =1
∑ yi und
i =1
N
∑ xi ⋅ y i
i =1
N
∑ xi
N
i =1
N
i =1
i =1
∑ xi ⋅ yi ∑ xi2
Analog erhält man
N
∑ yi
N
Dy.x =
i =1
N
N
i =1
i =1
∑ xi ∑ xi
.
⋅ yi
Damit erhält man für by.x den Ausdruck
by . x =
Dy.x
D
=
N
N
N
i =1
i =1
i =1
2
N ⋅ ∑ xi ⋅ y i − ∑ y i ⋅ ∑ xi
⎛N ⎞
N ⋅ ∑ xi2 − ⎜ ∑ xi ⎟
⎝
⎠
=
Ax . y
Ax ⋅ A y
.
i =1
Mit den Daten aus obiger Tabelle erhält man die Matrix
⎛ 2156.44 2324.68 ⎞
A =⎜
2761.61 ⎟⎠
⎝
und damit
by . x =
1316han05.indd 266
2324.68
= 1.078.
2156.44
25.07.2006 11:39:25
5.11 Modelle für die Prozessgleichung
267
b0 kann man wie folgt berechnen:
b0 = y − b y . x ⋅ x = 35.87 − 1.078 ⋅ 58.46 = −27.15 .
Damit lautet die Prozessgleichung für die Länge des Bremsweges in Abhängigkeit von der
Geschwindigkeit
yˆ = −27.15 + 1.078 ⋅ x.
Für den Korrelationskoeffizienten erhält man den Wert
rxy =
2324.68
2156.44 ⋅ 2761.61
= 0.952.
Zur Prüfung der Hypothese, ob der Bremsweg unabhängig von der gefahrenen Geschwindigkeit ist, muss der t-Test berechnet werden. Man erhält
tˆ =
0.95
1 − 0.952
8 = 8.6.
Der Tafelwert tα, FG für die Irrtumswahrscheinlichkeit α = 0.05 und 8 FG ist 1.859, d. h.
die aufgestellte Hypothese der Unabhängigkeit muss verworfen werden. Die Länge des
Bremsweges ist abhängig von der gefahrenen Geschwindigkeit.
Die Stichprobenvarianz der einzelnen Messwerte um die Prozessgleichung, d. h. die Restvarianz kann man wie folgt berechnen:
s 2y / x =
N
N
1
1
⋅ ∑ ( yi − yˆ i )2 =
⋅ ∑ ( yi − b0 − b y . x ⋅ x)2 .
N − 2 i =1
N − 2 i =1
Diese Art der Berechnung ist sehr aufwendig. Daher rechnet man die obige Formel um
und erhält
sY2 / x = s 2y ⋅ (1 − ry2/ x ),
wobei rY/x der einfache Korrelationskoeffizient zwischen der Produktvariable Y und der
Prozessvariable x ist. Nach dieser Formel erhält man die bedingte Stichprobenvarianz
s2Y/x = 2.99 bzw. die bedingte Standardabweichung sY/x = 1.73.
5.11.1.2 Multivariates, multiples lineares Modell mit determinierten Input- und
Prozessvariablen; Y ist ein zufälliger Vektor
Anstelle der einen Produktvariablen Y müssen wir dem Vektor der m, m ≥ 1 nicht unabhängigen
Produktvariablen YT = (Y1, …, Ym) betrachten. Mit den Abkürzungen
T
⎛ Y1 ⎞
⎛ βY 1.1 … βY 1.n ⎞ ⎛ βY 1. x ⎞
⎛ εY 1 ⎞
⎜
⎟ = ⎜ … ⎟⎟ ∈ Μ m × n und ε = ⎜ … ⎟
Y = ⎜ … ⎟ , ΒY . x = ⎜
…
⎜ ⎟
⎜
⎟
⎜
⎟
⎝Ym ⎠
⎝ βYm.1 … βYm.n ⎠ ⎜⎝ βT ⎟⎠
⎝ εYm ⎠
Ym. x
lautet dieses Modell
Y = ΒTY . x ⋅ x + ε
1316han05.indd 267
25.07.2006 11:39:25
268
5 Qualität in der Fertigung
wobei
Y ~ Nm (ΒTY.x x, Σεε )
ε ~ Nm (0, Σεε ),
Σ εε
… cov(ε1 , εm )⎞ ⎛ σ12 … σ1m ⎞
⎛ var(ε1 )
⎟
⎟=⎜
=⎜
…
…
⎟.
⎜
⎟ ⎜
2
var(εm ) ⎠ ⎜⎝ σ m1 … σ m ⎟⎠
⎝ cov(εm , ε1 ) …
Y und ε sind unabhängig voneinander. In diesem Modell sind die Modellparameter ΒY.x und
Σεε unbekannt und müssen mit den Werten einer Stichprobe geschätzt werden.
Das statistische Modell ist gegeben durch
Y = ΒTY.x x + ε,
wobei gilt
⎛ Y11 … Y1N ⎞
⎛ x11 … x1n ⎞
⎟, x = ⎜
⎟ die Stichprobe und
Y =⎜
…
…
⎜
⎟
⎜
⎟
⎝Ym1 … YmN ⎠
⎝ x N 1 … x Nn ⎠
⎛ ε11 … ε1N ⎞
⎟
ε=⎜
…
⎜
⎟
⎝ ηm1 … εmN ⎠
In diesem Modell ist
Y ~ NN (ΒY.xT x, ΣYY ⊗ IN),
wobei ⊗ das Kronecker Produkt der beiden Matrizen ΣYY und IN bezeichnet. Dieses Produkt
ist in diesem Spezialfall
ΣYY ⊗ I N
⎛ ΣYY
⎜ 0
=⎜
⎜…
⎜⎝ 0
0
ΣYY
0
…
…
0 ⎞
0 ⎟
⎟
⎟
… ΣYY ⎟⎠
eine Block-Diagonalmatrix, die N mal die Kovarianzmatrix der Produktvariable Y enthält.
5.11.2
Lineare Modelle mit stochastischen Input- und Prozessvariablen
Diese Modelle haben formal dasselbe Aussehen wie die Modelle mit determinierten Inputund Prozessvariablen. Trotzdem unterscheiden sich die Modelle wesentlich, vorallem bzgl. der
Verteilungen für die Schätz- und Teststatistiken.
Warum müssen wir Modelle mit stochastischen Input- und Prozessvariablen betrachten?
Sehr häufig ist die Voraussetzung, dass die Input- und Prozessvariablen feste Einstellgrößen
sind, in der Praxis verletzt. Betrachtet man z. B. die Prozessvariable Temperatur bei der Her-
1316han05.indd 268
25.07.2006 11:39:26
5.11 Modelle für die Prozessgleichung
269
stellung von Hochbrand Porzellan, dann wird diese zwar auf 1400 °C eingestellt, aber an den
verschiedenen Stellen des Ofens und damit für verschiedene Teile des zu brennenden Gutes
im Ofen sind die Temperaturen zufällig unterschiedlich. Der fest eingestellte Parameter wirkt
somit auf das Produkt stochastisch. Daraus folgt, dass neben den bisher genannten Modellen
die Modelle mit stochastischen Input- und Prozessvariablen betrachtet werden müssen.
Es gibt einen weiteren Grund für die Verwendung dieses Modells. Die Inputvariablen sind
Produktvariable eines Vorläuferprozesses und damit natürlich stochastisch.
5.11.2.1 Wie sieht das multiple lineare Modell mit stochastischen Input- und
Prozessvariablen aus und wodurch unterscheidet es sich von dem Modell
mit festen Input- und Prozessvariablen?
Die Ableitung des Modells für diesen praktisch relevanten Fall basiert auf der gemeinsamen,
multivariaten Verteilung für die Input- (Z1, …, Zl), Prozess- (X1, …, Xn) und Produktvariablen (Y1, …, Ym). Im univariaten, multiplen, linearen Modell wird nur eine Produktvariable Y
betrachtet. X und Z können Vektoren von Input- und Prozessvariablen sein.
Wir wollen hier annehmen, dass die gemeinsame Verteilung des Vektors
(ZT, XT, Y) = (XT, Y) ~ Nn + 1 (µ, Σ),
wobei die Input- und Prozessvariablen der Einfachheit halber zu dem Vektor X zusammengefasst werden und Σ als positiv definit vorausgesetzt wird. Mit der Zerlegung des zufälligen
Vektors (Y, XT) in den Teilvektor der Input- und Prozessvariablen X, d. h. die Ursachen und
die Wirkung Y, erhält man für die Momente µT = (µY, µTX) und
⎛ σ2
Σ=⎜ Y
⎝
σTY . X ⎞
⎟
Σ XX ⎠
den bedingten Erwartungswert
1
E [Y / X ] = μY + σTY . X Σ −XX
( X − μ X ) = β0 + βYT / X X
und die bedingte Varianz
1
var [Y / X ] = σY2 − σTY . X Σ −XX
σY . X .
In diesen Formeln haben die einzelnen Symbole die folgenden Bedeutungen:
σ2Y ist die Varianz der Produktvariablen Y,
σY.X ist der Vektor der Kovarianzen zwischen der Produktvariablen und dem Vektor der Inputund Prozessvariablen X und
ΣXX ist die Kovarianzmatrix für die Input- und Prozessvariable.
Der bedingte Erwartungswert wird auch Regressionsfunktion genannt. Sie sehen erstens den
Unterschied zur Regressionsanalyse mit festen Input- und Prozessvariablen und zweitens die
Möglichkeit der anderen Darstellung in Form der Prozessgleichung
Y = β0 + βY/X X + FY/X,
2
wobei βY/X = σY.X Σ–1
YY, β0 = µY – βY/X µX und FY/X = Y – E [Y/X] ~ N1 (0, σ Y/X) ist der normalverteilte Anpassungsfehler. Y und FY/X sind unabhängig voneinander.
1316han05.indd 269
25.07.2006 11:39:26
270
5 Qualität in der Fertigung
Beispiel 5.11.2: Bremsweg. Prozessgleichung mit mehreren Prozessvariablen
Neben der Produktvariable Y werden die Prozessvariablen
X1 = Geschwindigkeit [km/h]
X2 = Profiltiefe [mm]
X3 = Reaktionszeit [sec]
betrachtet. Die Prozessvariablen sind Zufallsgrößen.
Die Kovarianzmatrix ist
⎛ σY2
⎜
⎜
Σ=⎜
⎜
⎜⎝
σY .1
σY .2
σ 2x1
σ x1. x 2
σ 2x 2
σY .3 ⎞
⎟
σ x1. x 3 ⎟ ⎛ σY2
⎟=⎜
σ x 2. x 3 ⎟ ⎝
σ 2x 2 ⎟⎠
σYT . X ⎞
⎟.
Σ XX ⎠
Das Modell lautet
Y = β0 + βY.1/2, 3 X1 + βY.2/1, 3 X2 + βY.3/1, 2 X3
und
var[Y/X] = σ2Y/X = σ2Y – σTY.X Σ–1
XX σY.X,
wobei
β0 = βTY / X (μY − μ X )
und
1
βTY / X = σTY . X Σ −XX
bedeuten. Die beiden Modellparameter σY2 / X und βY / X sind unbekannt und müssen mit
einer Stichprobe geschätzt werden.
Die Unterschiede zum Modell mit festen Input- und Prozessvariablen bestehen hauptsächlich
darin, dass
• die Modellparameter im Modell mit stochastischen Input- und Prozessvariablen die Parameter einer bedingten Verteilung sind,
• in den Verteilungen der Schätzungen für die unbekannten Modellparameter und
• in den Verteilungen der Teststatistiken.
Was ist das Maß der Beherrschbarkeit?
Das Quadrat des multiplen Korrelationskoeffizienten ρ2Y/X zwischen Y und der linearen Prozessgleichung wird Maß der Beherrschbarkeit des Prozesses genannt, denn dieses Maß gibt an, wie
gut die Varianz der Produktvariablen Y durch die Input- und Prozessvariablen erklärt wird.
Der Sprachgebrauch „Maß der Beherrschbarkeit“ wird durch die Beziehung
σY2 / X = σY2 ⋅ (1 − ρY2 / X )
deutlich, in der σ2Y die Varianz von Y und ρ2Y/X den multiplen Korrelationskoeffizienten zwischen
Y und der Prozessgleichung bezeichnen. Man kann von der bedingten Varianz ausgehen und
daraus das Maß der Beherrschbarkeit über die Beziehung
1316han05.indd 270
25.07.2006 11:39:26
271
5.11 Modelle für die Prozessgleichung
ρY2 / X = 1 −
σY2 / X
σY2
=
1
σTY . X ⋅ Σ −XX
⋅ σY . X
σY2
=
βTY / X ⋅ Σ XX ⋅ βY / X
σY2
ausrechnen.
Sind Y und X unabhängig voneinander, dann ist ρ2Y/X = 0 und daraus folgt σ2Y/X = σ2Y, d. h. der
Vektor der Input- und Prozessvariable trägt nicht zur Erklärung der Varianz der Produktvariablen bei.
Sind Y und X mit Wahrscheinlichkeit 1 voneinander linear abhängig, dann ist ρ2Y/X = 1 und
somit ist σ2Y/X = 0, d. h. alle Punkte Ŷ liegen auf der Ausgleichshyperebene. Die bedingte Varianz der Produktvariablen unter der Wirkung der Input- und Prozessvariablen ist null, d. h.
die Varianz von Y wird durch die Input- und Prozessvariablen vollständig erklärt.
Beispiel 5.11.3: Bremsweg. Mehrere Prozessvariable
Der Prozess ist das Bremsen eines PKW’s vor einem plötzlich auftauchenden Hindernis.
Die Produktvariable Y ist der Bremsweg in [m]. Die Prozessvariablen sind
X1 = Geschwindigkeit in [km/h],
X2 = Gewicht des PKW [kg] und
X3 = Profiltiefe des Reifens in [mm].
Ein PKW vom selben Typ wurde von ein und denselben Fahrer auf ein und derselben Strasse unter den gleichen Wetterbedingungen mit verschiedenen Reifen auf unterschiedliche
Geschwindigkeiten beschleunigt und vor dem Hindernis abgebremst. Die Daten dieses
Versuches sind im Internet unter dem Namen 05.11.3 Bremsweg enthalten.
Die statistischen Maßzahlen sind in der Tabelle 5.11.3 enthalten.
Tabelle 5.11.3: Statistische Maßzahlen
Statistische Maßzahlen
Mittelwert
Standardabweichung
Y
X1
X2
X3
25,907
49,862
1440,23
3,549
0,832
3,276
168,0
0,496
Minimum
23,98
42,60
1040,4
2,165
Maximum
28,11
57,45
1832,8
5,18
Die statistischen Maßzahlen sagen nichts aus über die Abhängigkeitsstruktur zwischen den
Variablen. Man kann aus ihnen nicht ablesen, ob die Vergrößerung der Geschwindigkeit
des PKW zu einem längeren Bremsweg führt.
Um das ablesen zu können müssen wir zunächst die Korrelationsmatrix für diese Variablen
berechnen. Die Werrte stehen in der Tabelle 5.11.4.
Tabelle 5.11.4: Korrelationsmatrix
Korr.Matrix
Y
X1
X2
X3
Y
1
0,828
0,748
–0,677
1
0,425
–0,275
1
–0,437
X1
X2
X3
1316han05.indd 271
1
25.07.2006 11:39:26
272
5 Qualität in der Fertigung
Die Korrelationsmatrix sagt uns, dass die Länge des Bremsweges und die Geschwindigkeit
hoch miteinander korreliert sind. Die Länge des Bremsweges hängt aber außerdem von
dem Gewicht und der Profiltiefe ab, wobei die Länge des Bremsweges und die Profiltiefe
negativ korreliert sind, d. h. je tiefer die Profile sind, desto kürzer ist der Bremsweg, oder
anders ausgedrückt, je abgefahrener die Reifen sind, desto länger wird der Bremsweg.
Die Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen unter den
Bedingungen, dass alle anderen Variablen konstant gehalten werden, sind in der Tabelle 5.11.5 enthalten.
Tabelle 5.11.5: Matrix der partiellen Korrelationskoeffizienten
Part.Korr.Matrix
Y
Y
X1
X2
X1
X2
X3
0,976
0,926
–0,943
–0,875
0,913
0,827
X3
Der partielle Korrelationskoeffizient
rY.1/2, 3 = 0,976
zwischen der Länge des Bremsweges Y und der Geschwindigkeit X1 unter der Bedingung,
dass sowohl das Gewicht X2 als auch die Profiltiefe X3 konstant gehalten werden, ist größer als
der ursprüngliche einfache Korrelationskoeffizient. Der partielle Korrelationskoeffizient
r1.2/X, 3 = –0,875
zwischen X1 und X2 unter der Bedingung Y und X3 wird sogar negativ. Das zeigt, dass die
Variablen sehr stark voneinander abhängen. Die partiellen Korrelationskoeffizienten für
die Produktvariable Y mit allen Prozessvariablen liefert eine Rangfolge für den Einfluss der
Prozessvariablen auf die Produktvariable. Den stärksten Einfluss hat die Prozessvariable X1,
gefolgt von der Prozessvariablen X3 und X2. Da alle diese partiellen Korrelationskoeffizienten
groß sind, folgt, dass alle Prozessvariablen einen starken Einfluss auf die Produktvariable
Y haben.
Die Determinante der Korrelationsmatrix R als globales Maß für die Abhängigkeitsstruktur besitzt den Wert det(R) = 0,00885. Die Kleinheit dieses Wertes zeigt die Straffheit der
Abhängigkeitsstruktur.
Der Grad der Multikollinearität ist der Kehrwert der Determinante der Korrelationsmatrix
nur für die Prozessvariablen. Die Determinante det(RXX) = 0,655 ist erfreulich groß, d. h.
die Schätzungen für die Koeffizienten der Prozessgleichung werden nicht wesentlich durch
den Grad der Multikollinearität beeinflusst.
Die Folge der Prozessgleichungen für die Produktvariable, in der Tabelle 5.11.6 zusammengestellt, nacheinander für die Abhängigkeit nur von X1, dann in Abhängigkeit von X1
und X2 und dann von X1, X2 und X3 zeigen, dass die multiplen Korrelationskoeffizienten
für die Produktvariable Y in Abhängigkeit von den Prozessvariablen mit zunehmender
Information durch die größer werdende Anzahl von Prozessvariablen größer werden und
die bedingten Standardabweichungen die gegensätzliche Tendenz aufweisen.
1316han05.indd 272
25.07.2006 11:39:26
273
5.11 Modelle für die Prozessgleichung
Tabelle 5.11.6: Folge der Prozessgleichungen für die zunehmende Anzahl von Prozessvariablen
Absolutglied
X1
X2
X3
R2Y/X
SY/X
F-Wert
–
–
0,6861
0,4683
292,9
Koeffizienten
t-Test
15,41
25,07
0,2105
17,11
Koeffizienten
t-Test
14,56
37,3
0,1583
18,6
0,0024
14,4
–
0,8774
0,2938
475,9
Koeffizienten
t-Test
18,30
105,7
0,1481
51,84
0,0017
28,2
–0,6198
32,6
0,9865
0,09788
3213
Betrachten wir die Prozessgleichung für Y in Abhängigkeit von X1 allein, dann ist das
Maß der Beherrschbarkeit 0,686 und die bedingte Standardabweichung ist sY/X = 0,468.
Betrachten wir Y in Abhängigkeit von X1, X2 und X3 dann ist das Maß der Beherrschbarkeit
R2Y/X = 0,986 und die bedingte Standardabweichung ist sY/X = 0,09788.
Für die Prozessgleichungen in der Anwendung bedeutet die Anforderung, dass das Maß
der Beherrschbarkeit größer als 0,9 sein soll keine Utopie, sondern lediglich die verschärfte
Suche nach Input- und Prozessvariablen, die einen Einfluss auf den oder die Produktvariablen haben.
Als Prozessverbesserung definierten wir
• die Reduktion der Variabilität der Produktvariablen und
• die Steuerung des Prozesses mit der Prozessgleichung, so dass simultan alle relevanten
Kundenanforderungen erfüllt werden.
Diese beiden Anliegen werden durch die Abbildung 5.11.2 und Abbildung 5.11.3 verdeutlicht.
28
27
26
Y
25
24
24.5
25.0
25.5
26.0
26.5
27.0
27.5
Fitted : X1
Abb. 5.11.2: Streuung der Messwerte für Y um die Prozessgleichung mit einer Prozessvariablen
1316han05.indd 273
25.07.2006 11:39:27
274
5 Qualität in der Fertigung
28
27
26
Y
25
24
24
25
26
27
28
Fitted : X1 + X2 + X3
Abb. 5.11.3: Messwerte für Y um die Prozessgleichung mit drei Prozessvariablen
Diese beiden Abbildungen zeigen deutlich, dass sich die Suche nach der erschöpfenden
Anzahl von Input- und Prozessvariablen lohnt.
5.11.2.2 Das multivariate, multiple, lineare Modell mit stochastischen Input- und
Prozessvariablen
Jedes Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben. Folglich
benötigen wir ein Modell, in dem Y ein Vektor von Produktvariablen ist, der durch Linearkombinationen in den Input- und Prozessvariablen erklärt werden soll. In diesem Fall betrachten
wir die Zerlegung der Kovarianzmatrix
⎛ ΣYY
Σ=⎜
⎝ Σ XY
ΣYX ⎞
Σ XX ⎟⎠
und damit das Modell
Y = β0 + βTY/X X + FY/X,
wobei
FY/X ~ N (0, ΣYY/X) der Vektor der Fehler, βTY/X = ΣYX Σ–1
XX die Matrix der unbekannten Koeffizienten des Systems der Prozessgleichungen und
FY/X = Y – βTY/X X ~ ΣYY/X
1
ist. Die bedingte Kovarianzmatrix ΣYY/X wird nach der Beziehung ΣYY / X = ΣYX ⋅ Σ −XX
⋅ Σ XY
berechnet.
1316han05.indd 274
25.07.2006 11:39:27
5.11 Modelle für die Prozessgleichung
275
Beispiel 5.11.4: Multivariates multiples Modell mit zwei Produkt- und zwei
stochastischen Prozessvariablen. Bedingte Kovarianz und bedingte Erwartungswerte
Für zwei Produkt- und zwei Input- und Prozessvariablen soll das multivariate multiple
lineare Modell mit stochastischen Input- und Prozessvariablen ausführlich aufgeschrieben
werden. Mit der Zerlegung der Kovarianzmatrix in die Elemente
⎛ ΣYY
Σ=⎜
⎝
⎛ σY2
1
⎜
ΣYx ⎞ ⎜
=
Σ XX ⎟⎠ ⎜⎜
⎜
⎝
σY1Y2
σY1 .1
σY22
σY2 .1
σY1 .2 ⎞
⎟
σY2 .2 ⎟
⎟
σ12 ⎟
⎟
σ 22 ⎠
σ12
erhalten wir die Matrix der bedingten Erwartungswerte und die bedingte Kovarianzmatrix
1
E [Y / X] = ΣY . X Σ −XX
(X − μ X ) =: ΒY / X (X − μ X )
und
1
var(Y / X) = ΣYY − ΣY . X Σ −XX
Σ X .Y = ΣYY / X
Schreiben wir diese Ausdrücke ausführlich auf, dann erhalten wir
⎛ σ 22
⎛ σY1 .1 σY1 .2 ⎞
1
E [Y / X] = ⎜
⎟ 2 2
2 ⎜
⎝ σY2 .1 σY2 .2 ⎠ σ1 ⋅ σ 2 (1 − ρ12 ) ⎝ −σ12
⎛ σY .1σ 22 − σY .2 σ12
1
1
⎜ 2 2
2
)
σ1 ⋅ σ 2 (1 − ρ12
=⎜
⎜ σ σ2 − σ σ2
Y2 .1 2
⎜ Y2 .1 2
⎜⎝ σ 2 ⋅ σ 2 (1 − ρ2 )
1
2
12
⎛ βY1 .1/ 2
=⎜
⎝ βY2 .1/ 2
−σ12 ⎞ ⎛ X1 − μ1 ⎞
⎟⋅⎜
⎟
σ12 ⎠ ⎝ X 2 − μ 2 ⎠
−σY1 .2 σ12 + σ12 σY1 .2 ⎞
⎟
2
) ⎟ ⎛ X1 − μ1 ⎞
σ12 ⋅ σ 22 (1 − ρ12
⋅⎜
⎟
σY2 .2 σ12 − σY2 .1σ12 ⎟ ⎝ X 2 − μ 2 ⎠
⎟
σ 2 ⋅ σ 2 (1 − ρ2 ) ⎟⎠
1
2
12
βY1 .2 /1 ⎞ ⎛ X1 − μ1 ⎞
⋅
βY2 .2 /1 ⎟⎠ ⎜⎝ X 2 − μ 2 ⎟⎠
Formt man einen Regressionskoeffizienten, z. B. den ersten aus der Matrix der Regressionskoeffizienten unter Verwendung der Korrelationskoeffizienten um, dann erhält man
βY1 .1/2 =
ρY1 .1 σY1 σ 22 − ρY1 .2 σY1 σ 2 ρ12 σ1 σ 2
σ12
⋅
σ 22
(1 −
2
ρ12
)
=
ρY1 .1/2 σY1
2
σ1 ⋅ (1 − ρ12
)
einen Quotienten mit dem partiellen Korrelationskoeffizienten im Zähler. Hieraus erklärt
sich der Sprachgebrauch partieller Regressionskoeffizient. Ähnliche Umformungen der
bedingten Kovarianzmatrix liefern
⎛ σY2 / X
1
var(Y / X) = ⎜
⎜⎝
1316han05.indd 275
σY1Y2 / X ⎞
⎟.
σY22 / X ⎟⎠
25.07.2006 11:39:27
276
5 Qualität in der Fertigung
Gibt es auch für das multivariate multiple Modell ein Maß der Beherrschbarkeit?
Ja, für das multivariate multiple Modell zur Berechnung des Systems der Prozessgleichungen
benötigen wir ein verallgemeinertes Maß der Beherrschbarkeit. Diese ist der multivariate,
multiple Korrelationskoeffizient
τY2 / X = 1 −
ΣYY / X
ΣYY
,
wobei
ΣYY / X und Σ YY
die Determinanten der bedingten bzw. unbedingten Kovarianzmatrix der Produktvariable
sind. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit zwischen dem Vektor der
Produktvariablen und dem System der Prozessgleichungen.
Beispiel 5.11.5: Multivariates multiples Modell mit zwei Produkt- und zwei
stochastischen Prozessvariablen. Multivariater multipler Korrelationskoeffizient
Für das Beispiel 16 kann man den multivariaten, multiplen Korrelationskoeffizienten
umformen. Man erhält:
τ2Y / X = 1 −
ΣYY / X
ΣYY
= 1−
σY21
σY1Y2 / X
σY1Y2 / X
σY22 / X
σY21
σY1Y2
= 1−
σY21 / X σY22 / X − σY21Y2 / X
σY21 σY22 − σY21Y2
σY22
= 1−
(1 − ρY21 / X )(1 − ρY21Y2 / X )
(1 − ρY21Y2 )
Für m = 1 ist τ2Y/X gleich ρ2Y/X.
τ2Y/X gibt also auch an, wie gut die verallgemeinerte Varianz des Vektors der Produktvariable
durch die Kovarianzmatrix der Input- und Prozessvariable erklärt wird.
5.11.3
Statistische Modelle mit stochastischen Input- und
Prozessvariablen
Die statistischen Modelle sehen sehr ähnlich wie die theoretischen Modelle aus. Der Unterschied besteht darin, dass anstelle der Zufallsgrößen zufällige Stichprobenvektoren, anstelle der
zufälligen Vektoren zufällige Stichprobenmatrizen stehen und anstelle der Modellparameter
die statistischen Schätzungen stehen.
Aus den verschiedenen Modellen erkennt man, dass das lineare Modell mit festen Input- und
Prozessvariablen das bedingte Modell des entsprechenden Modells mit stochastischen Inputund Prozessvariablen ist. Diese Feststellung ist bedeutsam für die Ableitung der Schätzfunktionen.
1316han05.indd 276
25.07.2006 11:39:27
5.11 Modelle für die Prozessgleichung
277
Welche Ziele können mit den linearen Modellen erreicht werden?
Das statistische lineare Modell mit stochastischen Input- und Prozessvariablen liefert uns
• die notwendige Prozessgleichung. Damit können die Produktvariablen zielgerichtet über
die Input- und Prozessvariablen so gesteuert werden, dass
– simultan alle Kundenanforderungen erfüll und
– die Varianzen der Produktvariablen reduziert werden können.
• An die Stelle der Streuung der Produktvariablen tritt die bedingten Streuung der Produktvariablen unter der Bedingung, dass die Input- und Prozessvariablen realisiert sind, d. h.
als Messwerte vorliegen.
Die Bedeutung dieses zweiten Faktes zeigt uns noch einmal die Abbildung 5.11.4. Diese Bedingung ist Ausdruck der Wirkungsweise des Ursache-Wirkungs-Prinzipes und bezieht die
Informationsmenge ein, die durch die Wirkung der Input- und Prozessvariablen gegeben ist.
Die bedingte Varianz σ2Y/X ist stets kleiner oder gleich der unbedingten Varianz σ2Y für die
Produktvariable Y. Das folgt sofort aus der Formel
σY2 / x = σY2 ⋅ (1 − Ρ Y2 / x )
in der P2Y/x der multiple Korrelationskoeffizient zwischen einer Produktvariablen Y und der
Prozessgleichung ist.
Produktvariable Y
obere Toleranz
Sollwert
untere Toleranz
Prozessvariable X
Abb. 5.11.4: Vergleich der Breiten der Verteilung der Produktvariablen Y und der bedingten Verteilung
von Y unter X
1316han05.indd 277
25.07.2006 11:39:27
278
5 Qualität in der Fertigung
5.11.4
Wie kann man die Schätzungen für die unbekannten
Modellparameter für die Modelle mit stochastischen Input- und
Prozessvariablen gewinnen?
Das Modell mit stochastischen Input- und Prozessvariablen wurde aus der gemeinsamen multivariaten Verteilung für die Produkt-, Prozess- und Inputvariablen abgeleitet. Zu diesem Zweck
haben wir angenommen, dass der Vektor mit allen Komponenten multivariat normalverteilt
ist, oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Das bedeutet aber, dass die
analytische Form der Verteilungsdichte bekannt ist. Andererseits haben wir immer wieder darauf
hingewiesen, dass die unbekannten Modellparameter nur mit Hilfe einer Stichprobe geschätzt
werden können. Eine Stichprobe besteht aus N unabhängigen „Beobachtungsvektoren“ für den
Vektor der Produkt-, Prozess- und Inputvariablen.
Damit können wir die sogenannte Likelihood Funktion als Produkt der Verteilungsdichten
L (βY / X , σY2 / X ) =
N
∏ f [( yi , xi ); βY / X , σY2 / X ]
i =1
an den Stellen der Beobachtungsvektoren aufschreiben und diesen Ausdruck mit den bekannten
Werten für die Input-, Prozess- und Produktvariablen als Funktion der unbekannten Modellparameter auffassen. Die Maximierung der Likelihood Funktion liefert Schätzungen für die
unbekannten Modellparameter.
Auch das ist ein heuristisches Prinzip. Es liefert aber praktisch vernünftige Schätzfunktionen
für die unbekannten Modellparameter.
Wir haben die Stichprobe
⎛ X11
⎜ X
⎜ 21
⎜ …
(X , Y ) = ⎜
⎜
⎜ X N −1.1
⎜ X
⎝ N1
…
…
X1n
X 2n
Y11
Y21
…
… X N −1.n
… X Nn
YN −1.1
YN 1
…
…
Y1m ⎞
Y2m ⎟
⎟
⎟
⎟
⎟
… YN −1.m ⎟
… YNm ⎟⎠
für den multivariaten, multiplen Fall. Die Maximum Likelihood Methode liefert uns die
Schätzfunktionen
⎛1 N
(X T , YT ) = ⎜ ⋅ ∑ X Ti
⎝ N i =1
1 N T⎞
⋅ ∑ Yi
N i =1 ⎟⎠
für den Mittelwertvektor. Für die Schätzfunktion gilt
⎡⎛μ X ⎞ 1
⎛X⎞
⎢
∼
N
⎜ ⎟,
n
m
+
⎜⎝ Y ⎟⎠
⎢⎣ ⎝ μY ⎠ N
⎛ Σ XX
⋅⎜
⎝
Σ XY ⎞ ⎤
⎥
ΣYY ⎟⎠ ⎥
⎦
Außerdem erhalten wir die Schätzfunktion
A=
N
∑ (Vi − V)T (Vi − V),
i =1
1316han05.indd 278
25.07.2006 11:39:27
5.11 Modelle für die Prozessgleichung
279
für die Kovarianzmatrix, wobei wir der Einfachheit halber die Input-, Prozess- und Produktvariablen in V zusammengefasst haben. Die Schätzfunktion A für die Kovarianzmatrix ist Wishart
verteilt, mit N – 1 FG und dem Verteilungsparameter Σ. Hierfür schreiben wir abkürzend
A ~ Wn + m (N – 1, Σ).
Die Schätzfunktionen für den Vektor der Erwartungswerte und die Kovarianzmatrix sind
unabhängig voneinander. Die Stichprobenmatrix A wird analog zu Σ in
⎛ A2
A=⎜ Y
⎝
AYT. X ⎞
⎟
AXX ⎠
zerlegt.
Mit diesen Größen können wir die Schätzfunktionen für die unbekannten Koeffizienten in den
Prozessgleichungen und die unbekannten bedingten Varianzen (Restvarianzen) aufschreiben.
Wir erhalten
BTY/X = A −xx1 ⋅ AY . x
B0 = Y − BTY/X x
SYY / X =
1
1
1
1
(AYY − AYX ⋅ A −XX
⋅ A XY ) =
(A YY − BTY/X ⋅ A XX ⋅ BY / X ) =
⋅ AYY / X .
N
N
N
Am Beispiel des Plastikgehäuses für den Akku-Bohrschrauber wollen wir alle Schritte ausführlich demonstrieren.
Beispiel 5.11.6: Akkubohrschrauber. Statistische Prozessanalysen
Das Problem
Bei der Montage des Akku-Bohrschraubers treten Probleme auf. Diese wurden erstmals
bei der Durchführung einer Montagezeitstudie mit MOST (Maynards Operation Sequence
Technique) deutlich. Als Ursachen hierfür wurden Qualitätsmängel an den Plastikschalen
für den Bohrschrauber erkannt. Einige Schalen ließen sich gut, andere weniger gut montieren. Für das Plastikgehäuse eines Akku-Bohrschraubers in der Abbildung 5.11.1 wurde
daraufhin ein Produktaudit durchgeführt. Die Daten für die Prozess- und Produktvariablen
sind in der Datei 05.11.6 Akkubohrschrauber im Internet enthalten.
Zu diesem Zweck werden das Plastikschalen durch die Produktvariablen
Y1 = Thermoschrumpf in [%]
Y2 = Abweichung in axialer Richtung [mm]
Y3 = Abweichung von der Parallelität [mm]
Y4 = Dicke [mm]
parametrisiert. Das ist eine Auswahl und diese erhebt nicht den Anspruch auf Vollständigkeit.
Die gegebenen Toleranzen der Tabelle 5.2.1 wurden mit der statistischen Tolerierung überprüft. Die statistischen Toleranzen sind in der Tabelle 5.2.4 zusammengestellt.
1316han05.indd 279
25.07.2006 11:39:28
280
5 Qualität in der Fertigung
Abb. 5.11.5: Akku-Bohrschrauber
Problemdefinition
Das Problem wird mit den uni- und multivariaten Prozessfähigkeitsindizes aus dem Abschnitt 5.2. definiert. Es gilt MCpk = 0,73 mit den berechneten statistischen Toleranzen. Da
dieser Wert kleiner als eins ist, muss der Prozess verbessert werden.
Problemlösung
Die Verbesserung der Produktqualität ist nur durch die Steuerung des Herstellungsprozesses mit einer Prozessgleichung möglich. Daher müssen wir eine umfassende statistische
Prozessanalyse durchführen, die wesentlichen Input- und Prozessvariablen auswählen und
die Prozessgleichungen für die Produktvariablen berechnen.
Statistische Prozessanalyse
Der Herstellungsprozess für die Plastikgehäuse wird durch die Input- und Prozessvariablen
X1 = Friktion im Extruder (Reibungszahl µ, dimensionslos)
X2 = Heiztemperatur [°C]
X3 = Masse – Volumen – Index (mvi)
X4 = Dichte
X5 = Massetemperatur [°C]
beschrieben. Auch das ist nur eine Auswahl.
Modellierung
Das multivariate multiple lineare Modell hat das Aussehen
Y1 = β0.1 + βY1.1/2, 3, 4, 5 X1 + βY1.2/1, 3, 4, 5 X2 + βY1.3/1, 2, 4, 5 X3 + βY1.4/1, 2, 3, 5 X4 + βY1.5/1, 2, 3, 4 X5
Y2 = β0.2 + βY2.1/2, 3, 4, 5 X1 + βY2.2/1, 3, 4, 5 X2 + βY2.3/1, 2, 4, 5 X3 + βY2.4/1, 2, 3, 5 X4 + βY2.5/1, 2, 3, 4 X5
Y3 = β0.3 + βY3.1/2, 3, 4, 5 X1 + βY3.2/1, 3, 4, 5 X2 + βY3.3/1, 2, 4, 5 X3 + βY3.4/1, 2, 3, 5 X4 + βY3.5/1, 2, 3, 4 X5
Y4 = β0.4 + βY4.1/2, 3, 4, 5 X1 + βY4.2/1, 3, 4, 5 X2 + βY4.3/1, 2, 4, 5 X3 + βY4.4/1, 2, 3, 5 X4 + βY4.5/1, 2, 3, 4 X5.
1316han05.indd 280
25.07.2006 11:39:28
281
5.11 Modelle für die Prozessgleichung
Die Matrix der Prozessgleichungskoeffizienten wurde nach der Beziehung
1
ΒY / X = ΣY . X Σ −XX
erhalten, wobei diese Matrizen aus der Zerlegung
⎛ ΣYY
Σ=⎜
⎝
⎛ σY 1Y 1 σY 1Y 2 σY 1Y 3
⎜
σY 2Y 2 σY 2Y 3
⎜
⎜
σY 3Y 3
⎜
ΣYX ⎞ ⎜
=⎜
Σ XX ⎟⎠ ⎜
⎜
⎜
⎜
⎜
⎜⎝
σY 1Y 4 σY 1X1 σY 1X 2 σY 1X 3 σY 1X 4 σY 1X 5 ⎞
σY 2Y 4 σY 2 X 1 σY 2 X 2 σY 2 X 3 σY 2 X 4 σY 2 X 5 ⎟
⎟
σY 3Y 4 σY 3 X1 σY 3 X 2 σY 3 X 3 σY 3 X 4 σY 3 X 5 ⎟
⎟
σ Y 4Y 4 σ Y 4 X 1 σ Y 4 X 2 σ Y 4 X 3 σ Y 4 X 4 σ Y 4 X 5 ⎟
σ X1X1 σ X1X 2 σ X1X 3 σ X1X 4 σ X1X 5 ⎟
⎟
σX2X2 σX2X3 σX2X4 σX2X5 ⎟
σ X3X3 σ X3X 4 σ X3X5 ⎟
⎟
σX4X4 σX4X5 ⎟
σ X 5 X 5 ⎟⎠
stammen. Die bedingte Kovarianzmatrix wird nach der Gleichung
1
ΣYY / X = ΣYY − ΣYY . X Σ −XX
Σ X .YY
berechnet. In den linearen Modellen sind die Modellparameter BY/X und ΣYY/X unbekannt.
Diese müssen aufgrund einer Stichprobe geschätzt werden.
Die Korrelationsmatrix hierfür ist
Tabelle 5.11.7: Korrelationsmatrix für den Akku-Bohrschrauber
Y1
Y1
Y2
Y3
Y4
X1
X2
X3
X4
X5
1
0,036
–0,457
–0,102
–0,136
0,414
0,275
–0,41
0,224
0,417
–0,042
–0,113
0,081
–0,332
0,108
–0,132
1
Y2
Y3
1
Y4
0,355
1
X1
–0,133
–0,151
–0,236
0,2
–0,285
0,387
0,272
0,045
0,257
0,032
0,561
0,346
–0,108
0,319
0,447
–0,371
0,547
–0,878
0,838
1
X2
1
X3
1
X4
1
X5
–0,782
1
Diese Korrelationsmatrix entspricht der Zerlegung der Gesamtkorrelationsmatrix R in
die Blöcke
⎛ RYY
R=⎜
⎝ R XY
1316han05.indd 281
RYX ⎞
R XX ⎟⎠
25.07.2006 11:39:28
282
5 Qualität in der Fertigung
RYY = Korrelationsmatrix der Produktvariablen,
RYX = Korrelationsmatrix zwischen den Produkt- und Prozessvariablen,
RXX = Korrelationsmatrix der Prozessvariablen.
Aus der Korrelationsmatrix RYY lesen wir ab, dass die Korrelationskoeffizienten der Produktvariablen Y1 mit Y3 und der Produktvariablen Y2 mit Y3 statistisch gesichert von null
verschieden sind.
Aus der Matrix RYX lesen wir ab, dass X2 mit Y1 und X4 mit Y1 korreliert ist.
Aus RXX lesen wir ab, dass X3 mit X4, X3 mit X5 und X4 mit X5 hoch korreliert sind und X1
mit X2, X2 mit X3, und X2 mit X5 korreliert sind. Die Größen der Korrelationskoeffizienten
entsprechen den Erwartungen der Experten.
Das globale Maß für die Abhängigkeitsstruktur des Plastikgehäuses ist
det(R) = 0.0007809236.
Dieser Wert ist sehr klein, d. h. die Abhängigkeitsstruktur ist eng.
Für später ist es notwendig zu wissen, ob die Produktvariablen, die Prozessvariablen oder
die Produkt- mit den Prozessvariablen stark miteinander korreliert sind. Zu diesem Zweck
berechnen wir die entsprechenden Determinanten der Korrelationsmatrizen. Es gilt
det(RYY) = 0.4894116,
d. h. das globale Maß für die Straffheit der Abhängigkeitsstruktur der Produktvariablen ist
groß, d. h. die Produktvariablen hängen nur gering voneinander ab.
det(RXX) = 0.02383498, d. h. die Prozessvariablen hängen stark voneinander ab.
Grafische Abbildungen für das Gehäusebeispiel:
Star Plots für die Produktvariablen in Abbildung 5.11.6
Ein Star Plot ist eine ideale Darstellung für einen multivariaten Datensatz, z. B. für ein Produkt, aber auch für ein Produkt in Abhängigkeit von seinen Input- und Prozessvariablen.
Jeder Stern visualisiert z. B. ein Produkt.
Jeder Stern besteht aus einer Anzahl von Strahlen, die vom Mittelpunkt aus gezeichnet
werden. Jeder Strahl repräsentiert eine Variable. Auf jeden Strahl wir ein spezieller „Relativwert“ für den entsprechenden Wert der Variablen aufgetragen. Werden z. B. die Gehäuse
durch star plots visualisiert, dann entspricht der Strahl in der 300 Position der 1. Produktvariablen Y1 = Thermoschrumpf. Der 2. Strahl entgegen dem Uhrzeigersinn entspricht
der 2. Produktvariablen usw. Der kürzeste Strahl entspricht dem kleinsten Wert einer
Produktvariable, der größte dem größten.
Die Achsen der Star Plots sind in den Schlüssel der Abbildung 5.11.7 bezeichnet.
Die N = 113 Star Plots sind sehr verschieden. Betrachtet man z. B. die Stars für die Produkte
2 und 19, dann kann man sich kaum vorstellen, dass diese Produkte gleich sein sollen. Auf
diese Art findet man viele sehr Paare von verschiedenen Stars. Pauschal kann man sagen,
dass die Produkte, beschrieben durch die vier Produktvariablen hinsichtlich eines jeden
Parameters stark streuen.
Eine andere ganz wichtige Abbildung ist das Korrelationsdiagramm. Die Zusammenfassung
mehrerer Korrelationsdiagramme nennt man Draftsman Plots. Diese Darstellungen sind
sehr wichtig, da die paarweisen Abhängigkeit visualisiert werden.
1316han05.indd 282
25.07.2006 11:39:28
283
5.11 Modelle für die Prozessgleichung
111
112
113
100
101
102
103
104
105
106
107
108
109
110
89
90
91
92
93
94
95
96
97
98
99
78
79
80
81
82
83
84
85
86
87
88
67
68
69
70
71
72
73
74
75
76
77
56
57
58
59
60
61
62
63
64
65
66
45
46
47
48
49
50
51
52
53
54
55
34
35
36
37
38
39
40
41
42
43
44
23
24
25
26
27
28
29
30
31
32
33
12
13
14
15
16
17
18
19
20
21
22
1
2
3
4
5
6
7
8
9
10
11
Abb. 5.11.6 : Star Plots für die Produktvariablen
AXIALITY
PARALLEL
THERMOSHR
THICKNESS
Abb. 5.11.7: Schlüssel für die Star Plots
Draftsman Plots
Die draftsman Plots (Abbildung 5.11.8) zeigen, dass die vier Produktvariablen nicht unabhängig voneinander sind. Die stärkste Abhängigkeit finden wir zwischen den Produktvariablen Parallelität und Thermoschrumpf. Diese Abhängigkeit ist negativ.
Jedes Korrelationsdiagramm wird durch einen Korrelationskoeffizienten quantifiziert.
1316han05.indd 283
25.07.2006 11:39:29
284
5 Qualität in der Fertigung
AXIALITY
PARALLEL
THICKNESS
THERMOSHR
AXIALITY
PARALLEL
Abb. 5.11.8: Draftman Plots für die Produktvariable des Gehäuses
Häufigkeitsverteilungen
Eine Häufigkeitsverteilung ist die grafische Darstellung der Verteilung der Werte einer
Stichprobe für eine Variable. Diese Darstellung wird gern verwendet, um Hypothesen
bzgl. der Verteilung einer Variablen aufzustellen, sofern diese nicht durch irgendwelche
theoretischen Annahmen gefunden werden können. Die Häufigkeitsverteilungen liefern
des weiteren eine erste Information darüber, ob der Stichprobenumfang ausreichend ist
und ob die Anzahl der Klassen in Anhängigkeit davon klein genug gewählt wurde, über den
mittleren Wert, die Streuung und über mögliche Ausreißer. Die Häufigkeitsverteilungen
für das Gehäusebeispiel sind in der Abbildung 5.11.9 dargestellt.
Histogram for THERMOSHR
Histogram for AXIALITY
40
30
30
frequency
frequency
40
20
10
0
20
10
0
0
0,5
1
1,5
2
2,5
3
-0,7
-0,3
THERMOSHR
0,1
0,5
0,9
AXIALITY
Histogram for THICKNESS
Histogram for PARALLEL
40
30
30
frequency
frequency
40
20
10
20
10
0
0
-1,5
-0,5
0,5
1,5
2,5
PARALLEL
2,8
2,9
3
3,1
3,2
3,3
3,4
THICKNESS
Abb. 5.11.9: Häufigkeitsverteilungen für die Produktvariablen
1316han05.indd 284
25.07.2006 11:39:29
285
5.11 Modelle für die Prozessgleichung
Diese vier Häufigkeitsverteilungen zeigen, dass bzgl. aller vier Produktvariablen die Verteilungshypothese H0: „die Produktvariable sind normalverteilt“ formuliert werden kann.
Die H0 kann mit verschiedenen Tests geprüft werden.
Hier wurden der χ2-Test, der Test von Shapiro-Wilks (W) und der Kolmogorov-SmirnovTest (DN) angewandt.
Die berechneten Teststatistiken und Irrtumswahrscheinlichkeiten p dieser Anpassungstests
sind in der Tabelle 5.4.4 zusammen gefasst:
Tabelle 5.11.8: Ergebnisse der Anpassungstests
χ2
p
W
p
DN
p
Thermoschrumpf
22.62
0.42
0.98
0.5
0.052
0.92
Axialität
27.92
0.18
0.98
0.716
0.042
0.985
Parallelität
13.76
0.909
0.983
0.668
0.0488
0.95
Dicke
13.32
0.923
0.981
0.565
0.038
0.996
Die Entscheidung über die Ablehnung oder Annahme der H0 wird aufgrund der p-Werte
getroffen. Da der kleinste p-Wert > 0.1 ist, können die H0 mit Wahrscheinlichkeiten, die
größer als 0.9 sind, nicht verworfen werden, d. h. die einzelnen Produktvariable sind, jeder
für sich betrachtet, normal verteilt.
3D Häufigkeitsverteilung
Die 3D (3 dimensionale) Häufigkeitsverteilung fasst die Informationen der Häufigkeitsverteilungen für zwei Variable und des zugehörigen Korrelationsdiagramms zusammen.
Eine 3D-Häufigkeitsverteilung ist demzufolge eine Häufigkeitsverteilung über einem
Korrelationsdiagramm. In der Abbildung 5.11.10 ist die 3D Häufigkeitsverteilung für den
Thermoschrumpf und die Dicke enthalten.
Frequency
10
6
3.4
2
3.2
0
3
0
1
2
2.8
Dicke
3
Thermoschrumpf
Abb. 5.11.10: 3D Häufigkeitsverteilung für den Akku-Bohrschrauber
1316han05.indd 285
25.07.2006 11:39:29
286
5 Qualität in der Fertigung
Man erkennt aus dieser Darstellung, dass die Werte in der Ebene mit den Achsen Thermoschrumpf und Dicke in einem elliptisch umrissenen Gebiet liegen und das „Gebirge“
durch eine 2-dimensionale Normalverteilung angepasst werden kann. Man sieht aber auch,
dass man für eine 3D Häufigkeitsverteilung mehr als die vorliegenden N = 113 Wertesätze
benötigt, um ein klares Bild zu erhalten.
Stichprobenkovarianzmatrix
Die gesamte Stichprobenkovarianzmatrix für alle Variablen wurde in der Tabelle 5.11.9
zusammengestellt.
Tabelle 5.11.9: Stichprobenkovarianzmatrix für den Akku-Bohrschrauber
Thermo
Thermo
Axialit
Parallel
Dicke
Friktion
Heiztemp.
MVI
Dichte
Massetemp.
0,2249
0,00353
–0,10751
–0,00455
–0,0365
0,97655
0,4792
–0,005321
0,1211
0,04206
0,04239
–0,000809
–0,01316
0,08313
–0,2507
0,000605
–0,0309
0,24587
0,01653
–0,037465
–0,4309
0,002714
–0,16129
0,00882
0,020592
0,12701
0,01546
0,000659
0,003443
0,3215
1,584
0,72217
–0,001669
0,206865
24,7719
8,19388
–0,05056
3,10952
–0,088371
3,523025
Axialit
Parallel
Dicke
Friktion
Heiztemp.
MVI
–0,3723
13,5408
Dichte
0,0007485
Massetemp.
–0,024429
1,304455
Die Berechnung der Schätzungen für BY/X und ΣYY/X nach den obigen Formeln ergeben
die Resultate:
BTY/X = A −xx1 ⋅ AY . x
⎛ −0.38891
⎜ 0.02941
=⎜
⎜ −0.04865
⎜⎝ 0.003045
0.068
0.008913 −8.6534 −0.19371 ⎞
0.009073 −0.07755 −6.3397
0.04074 ⎟
⎟
0.004145 −0.001863 −0.93452 −0.13828 ⎟
0.0050539 0.02557
4.29743 0.001544 ⎟⎠
B0T = (29.022 1.602 22.272 − 3.927)
und
SYY / X
⎛ 0.117493 −0.005757 −0.100668 0.001048 ⎞
⎜
⎟
0.027342
0.037235 0.00267
⎟
=⎜
0.22503 0.018135 ⎟
⎜
⎜⎝
0.00488349 ⎟⎠
Aus diesen Ergebnissen kann man die Prozessgleichungen für die verschiedenen Produktvariablen zusammenstellen, so z. B. für Y1:
Y1 = 29.022 – 0.38891 X1 + 0.068 X2 + 0.008913 X3 – 8.6534 X4 – 0.19371 X5
1316han05.indd 286
25.07.2006 11:39:29
5.11 Modelle für die Prozessgleichung
287
Die Reststreuung ist die Quadratwurzel aus dem 1. Diagonalelement von SYY/X, d. h.
0.117493 = 0.3428.
Diese Resultate erhält man auch, wenn man die Prozessgleichung für jede Produktvariable
einzeln berechnet.
Das multivariate Maß der Beherrschbarkeit hatten wir bei der Betrachtung der Korrelationsanalyse berechnet. Es galt
τY2 / X = 1 −
ΣYY / X
Σ XX
= 1−
6.737213333 10^-7
= 0.9329
1.004384604 10^-5
d. h. die Variabilität der Produktvariablen wird zu ca. 93 % durch die Prozessvariablen
erklärt.
Prozessgleichungen für die einzelnen Produktvariablen im multivariaten, multiplen
Modell
Im multivariaten, multiplen Modell mit stochastischen Input- und Prozessvariablen erhält
man einen Vektor von Prozessgleichungen, für jede Produktvariable eine. Das Problem
besteht nun aber darin, dass der Prozess nur mit einer optimalen Teilmenge von Inputund Prozessvariablen gefahren werden kann. Das bedeutet, dass die globale Teilmenge an
wesentlichen Input- und Prozessvariablen für die Vorhersagen gesucht werden muss.
Tabelle 5.11.10: Prozessgleichungen für die einzelnen Produktvariablen
Prozessgleichung f. Y1
----------------------------------------------------------------------------Dependent variable: Thermo
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
27,9028
10,1695
2,74377
0,0071
Friktion
-0,388912
0,0808537
-4,81007
0,0000
Heiztemp
0,0679991
0,00925225
7,34947
0,0000
MVI
0,00891195
0,0244504
0,36449
0,7162
Dichte
-8,65339
2,90976
-2,97392
0,0036
Massetemp
-0,193712
0,0581907
-3,32893
0,0012
-----------------------------------------------------------------------------
Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
12,0353
5
2,40707
19,57
0,0000
Residual
13,159
107
0,122981
----------------------------------------------------------------------------Total (Corr.)
25,1944
112
R-squared = 47,77 percent
R-squared (adjusted for d.f.) = 45,3294 percent
Standard Error of Est. = 0,350687
Mean absolute error = 0,265689
Durbin-Watson statistic = 2,22739
1316han05.indd 287
25.07.2006 11:39:30
288
5 Qualität in der Fertigung
Prozessgleichung f. Y2
----------------------------------------------------------------------------Dependent variable: Axialit
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
0,763646
4,90555
0,15567
0,8766
Friktion
0,0294221
0,0390021
0,754373
0,4523
Heiztemp
0,00907345
0,00446308
2,033
0,0445
MVI
-0,0775608
0,0117944
-6,57609
0,0000
Dichte
-6,34085
1,4036
-4,51755
0,0000
Massetemp
0,0407386
0,0280699
1,45133
0,1496
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
1,64909
5
0,329818
11,53
0,0000
Residual
3,06195
107
0,0286164
----------------------------------------------------------------------------Total (Corr.)
4,71104
112
R-squared = 35,0048 percent
R-squared (adjusted for d.f.) = 31,9676 percent
Standard Error of Est. = 0,169164
Mean absolute error = 0,128768
Durbin-Watson statistic = 1,83917
Prozessgleichung f. Y3
----------------------------------------------------------------------------Dependent variable: Parallel
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
21,7397
14,074
1,54467
0,1254
Friktion
-0,0486358
0,111897
-0,434649
0,6647
Heiztemp
0,00414507
0,0128046
0,323719
0,7468
MVI
-0,00187052
0,033838
-0,0552787
0,9560
Dichte
-0,935801
4,02693
-0,232386
0,8167
Massetemp
-0,138288
0,0805324
-1,71717
0,0888
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
2,33505
5
0,46701
1,98
0,0870
Residual
25,2033
107
0,235545
----------------------------------------------------------------------------Total (Corr.)
27,5384
112
R-squared = 8,47926 percent
R-squared (adjusted for d.f.) = 4,20259 percent
Standard Error of Est. = 0,48533
Mean absolute error = 0,380747
Durbin-Watson statistic = 2,37876
1316han05.indd 288
25.07.2006 11:39:30
5.11 Modelle für die Prozessgleichung
289
Prozessgleichung f. Y4
----------------------------------------------------------------------------Dependent variable: Dicke
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
-3,48103
2,07271
-1,67946
0,0960
Friktion
0,00302197
0,0164793
0,18338
0,8548
Heiztemp
0,00505451
0,00188576
2,68036
0,0085
MVI
0,0255782
0,0049834
5,13268
0,0000
Dichte
4,29957
0,593056
7,24985
0,0000
Massetemp
0,00155342
0,0118602
0,130978
0,8960
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
0,441305
5
0,088261
17,28
0,0000
Residual
0,54664
107
0,00510878
----------------------------------------------------------------------------Total (Corr.)
0,987945
112
R-squared = 44,669 percent
R-squared (adjusted for d.f.) = 42,0834 percent
Standard Error of Est. = 0,0714757
Mean absolute error = 0,0554062
Durbin-Watson statistic = 2,10562
Gewisse Unterschiede in den Ergebnissen resultieren z. T. aus Rundungsfehlern und insbesondere bei den Reststreuungen aus der Tatsache, dass ich SYY/X aus 1/N AYY/X berechnet
habe. Diese Schätzung ist nicht erwartungstreu. Die erwartungstreue Schätzung verwendet
anstelle des Faktors 1/N den Faktor 1/(N – m).
Die Güte des Ausgleichs kann aus
• der bedingten Standardabweichung (Reststreuung) und
• dem Maß der Beherrschbarkeit (multipler Korrelationskoeffizient R2Yj/X
abgelesen werden.
Für die Produktvariable Y1 (Thermoschrumpf) liest man ab:
sY1/X = 0,3506 und R2Y1/X = 0.4532. Es gibt hier einen 2. Wert, der „R squared adjusted”
genannt wird. Dieser Wert verwendet die erwartungstreue Schätzung für S2Y/X.
Die Programme zur Berechnung der Prozessgleichungen gestatten noch das Zeichnen verschiedener Sachverhalte. Hier wollen wir nur schauen, wie gut die Residuen εˆ i1 = (Yi1 − Yˆi1 ) ,
i = 1, … N (Abweichungen der Messwerte von den berechneten Werten) durch eine Normalverteilung angepasst werden können.
Die Abbildung 5.11.11 zeigt, dass die Residuen sehr gut durch eine Normalverteilung
approximiert werden können.
1316han05.indd 289
25.07.2006 11:39:30
290
5 Qualität in der Fertigung
8
0.0
-0.5
Residuals
0.5
49
60
-2
-1
0
1
2
Quantiles of Standard Normal
Abb. 5.11.11: Residuen εi1 für die Anpassung von Y1 durch die Prozessgleichung über den
Quantilen der Normalverteilung
Es bleibt noch die Frage zu klären, wie die Auswahl der wesentlichen Input- und Prozessvariablen im multivariaten, multiplen Fall zu realisieren ist, denn Fakt ist ja, dass der Prozess nur
mit einer optimalen Teilmenge von Input- und Prozessvariablen für alle Produktvariablen
gesteuert werden kann. Die Antwort auf diese Frage wird bei der Lösung des Problems nach
der Auswahl der wesentlichen Input- und Prozessvariablen gegeben.
5.12
Welche Eigenschaften haben die Schätzungen für die
unbekannten Modellparameter?
Die Eigenschaften für diese Schätzfunktionen werden stellvertretend für das multivariate,
multiple Modell mit stochastischen Input- und Prozessvariablen aufgeschrieben.
• Sie sind:
E[BY/X /X] = E[BY/X] = βY/X,
d. h. die Schätzfunktion für die Matrix (Vektor) der unbekannten Koeffizienten der Prozessgleichung ist erwartungstreu.
• E[AYY/X/X] = E[AYY/X] = ΣYY/X (N – n –1)
• cov(BY/X /X) = A–1
XX ⊗ ΣYY/X
und cov(BY/X) = (N – n –1)–1 Σ–1
XX ⊗ ΣYY/X
(N)
• {B Y/X}N→∞ ist konsistent
• BY/X und SYY/X sind unabhängig
• V(BY/X /X) = N(BY/X, A–1
XX ⊗ ΣYY/X)
und die unbedingte Verteilung ist eine multivariate t-Verteilung.
1316han05.indd 290
25.07.2006 11:39:30
5.12 Welche Eigenschaften haben die Schätzungen?
291
Die Beweise für diese Behauptungen findet man in Jahn [1991a].
Vorhersagen für die Werte der Produktvariablen
Die Prozessgleichung wird für die Steuerung des Prozesses gebraucht. Für die Input- und Prozessvariablen werden Werte eingesetzt und der oder die Werte für den oder die Produktvariablen
werden ausgerechnet. Diesen Vorgang bezeichnen wir im linearen Modell als „Vorhersage“.
Die vorhergesagten Werte für den oder die Produktvariablen streuen natürlich auch. Daher
müssen wir den Vorhersagefehler berechnen.
Wie kann man den Vorhersagefehler berechnen und wie groß ist der Fehler für diese
Vorhersagen?
Vorhersagen sind hier im Sinne der Extra- oder Interpolation des oder der Produktvariablen Y aufgrund der Kenntnis der Input- und Prozessvariablen gemeint. Wir betrachten die
Vorhersage gleich für den Vektor von Produktvariablen Y. Für eine Produktvariable gelten
dieselben Formeln.
Den Vektor der Input- und Prozessvariablen, für den wir die „Vorhersage“ berechnen wollen,
bezeichnen wir mit XE. Es muss selbstverständlich gelten, dass
XE ~ Nn(µ, ΣXX) und XE ist unabhängig von X, d. h. von X1, …, XN.
Mit diesem Vektor wird Y (X E ) = YE = B0 + BYT / X ⋅ X E .
Die Beurteilung der „Vorhersage“ erfolgt mit den bedingten und unbedingten Vorhersagefehlern. Der bedingte Vorhersagefehler ist
M N ,n = E [(YE − Y E ) ⋅ (YE − Y E )T / X , X E ] = MSEP (Y E /, X E )
1
= ΣYY / X ⋅ (1 + X TE ⋅ A −XX
⋅ XE)
und
n
⎛
⎞
U N ,n = E [(YE − Y E ) ⋅ (YE − Y E )T ] = MSEP (Y E ) = ΣYY / X ⋅ ⎜1 +
⎟.
⎝
N − n − 1⎠
Den Beweis kann man in Jahn [1991b] nachlesen.
Der unbedingte Vorhersagefehler des linearen Modells mit stochastischen Input- und
Prozessvariablen stimmt mit dem Vorhersagefehler des Modells mit festen Input- und
Prozessvariablen überein.
Beispiel 5.12.1: Bremsweg. Vorhersagen
1. Beispiel zum Nachrechnen (05.11.3 Bremsweg)
Die berechnete Prozessgleichung war
Yˆ = −27.151 + 1.078 ⋅ x
Fasst man auch die gefahrene Geschwindigkeit als Zufallsgröße auf, dann erhält man für
dieses Demonstrationsbeispiel den unbedingten „Vorhersagefehler“
U10,1 = 2.991 (1 + 1/8) = 3.3648
1316han05.indd 291
25.07.2006 11:39:30
292
5 Qualität in der Fertigung
und damit die „Vorhersagestandardabweichung“
U10,1 =
3.3648 = 1.83
Wählt man für xE die Werte 45, 50 und 55, dann erhält man hierfür die „vorhergesagten“
Bremswege:
Tabelle 5.12.1: „Vorhersagewerte“ für den Bremsweg bei einer Prozessvariablen und dem
Stichprobenumfang N = 10.
xE
Vorhersage
Konfidenzintervall
YE
unten
oben
45
21,3
17,7
24,9
50
26,7
23,1
30,3
55
32,1
28,5
35,7
2. Beispiel aus dem Kapitel 1 (Datei 01.3.6 Bremsweg)
Mit dem Programm Statgraphics Plus 7.0 oder SPLUSWIN erhält man die Prozessgleichung
Yˆ = −10.0798 + 0.84465 ⋅ X − 2.18613 ⋅ X + 4.1934 ⋅ X
1
2
3
wobei
X1 = Geschwindigkeit [km/h]
X2 = Profiltiefe [mm]
X3 = Reaktionszeit [sec], anstelle des PKW-Gewichtes
und die bedingte Varianz bzw. die bedingte Standardabweichung
S2Y/X = 4.68432 und SY/X = 2.1643.
Der unbedingte Vorhersagefehler ist
U33,3 = 4.68432 [1 + 3 / (30 – 3 – 1)] = 5.2248
und die unbedingte Vorhersage-Standardabweichung ist
U 33,3 = 2.2858 .
Das Maß der Beherrschbarkeit des Prozesses „Bremsen vor einem Hindernis“ ist R2Y/X
= 0.8667, bzw. nach der Korrektur mit den Freiheitsgraden R′2Y/x = 0.851318, wobei die
Korrektur mit der Formel
RY′ 2/ x = 1 −
N −1
(1 − RY2 / x ),
N −n −1
vorgenommen wird. Das Maß der Beherrschbarkeit besagt, ca. 86 % der Varianz des Bremsweges werden durch die drei Prozessvariablen X1 (Geschwindigkeit), X2 (Profiltiefe) und
X3 (Reaktionszeit) erklärt. Verwendet man das Maß der Beherrschbarkeit zur Berechnung
der bedingten Varianz, dann erhält man
S2Y/X = 31.50563 (1 – 0.851318) = 4.68432 und damit sY/x = 2.1643.
also denselben Wert für die bedingte Standardabweichung wie oben.
1316han05.indd 292
25.07.2006 11:39:31
5.12 Welche Eigenschaften haben die Schätzungen?
293
Wie können Sie Hypothesen über die unbekannten Modellparameter prüfen?
Die unbekannten Modellparameter sind im univariaten multiplen Modell mit stochastischen
Input- und Prozessvariablen
• der Vektor der Koeffizienten der Prozessgleichung βY/X und
• die bedingte Varianz σ2Y/X.
Wir wollen Antworten auf die Fragen
1. Welche Input- und Prozessvariable hat einen statistisch gesicherten Einfluss auf die Produktvariable?
2. ist die bedingte Varianz statistisch gesichert kleiner als die Varianz der Produktvariablen
Y?
3. ist das Maß der Beherrschbarkeit statistisch gesichert größer als Null?
Prüfung von Hypothesen über den Vektor der Koeffizienten der Prozessgleichung
Die Prüfung der Hypothese über den Vektor der Regressionskoeffizienten
H0: βY/X = 0 gegen die alternative Hypothese H1: βY/X ≠ 0 mit dem F-Test
BT S B
N − n −1
Fˆ = Y / X XX2 Y / X
SY / X (n + 1)
und P (Fˆ ≤ Fα /H0 ) = 1 − α , wobei Fˆ ∼ Fn +1,N −m −1 (α) wird durch das bekannte „finite
intersection“ Prinzip auf die Prüfung der Einzelhypothesen H0,j: βY.j/n – j = β*Y.j/n – j gegen H1:
βY.j/n – j ≠ β*Y.j/n – j zurückgeführt, wobei β*Y.j/n – j gegeben sein möge. Die Teststatistik für eine
bestimmte Input- oder Prozessvariable Xj ist
tj =
(βY . j / n − j − BY . j / n − j )
sY / X
⋅ S 2j / n − j ⋅ N − n − 1, j = 1, …, n.
Oft wird einfach angenommen, dass β*Y.j/n – j = 0.
Die t-Prüfstatistik kann auch mit der F-Statistik geschrieben werden. Es gilt
Fˆj =
BY2 . j / n − j (N − n)
SY2 / X S jj
=
(RY2 / X − RY2 / n − j )(N − n)
1 − RY2 / X
,
wobei Sjj die Diagonalelemente von S–1
XX sind. Für diese gilt aber
1
S −XX
⎧[S 2j (1 − R 2j / n − j )]−1 ,
für alle j = 1, …, n
⎪⎪
− R jk / n-{j ,k}
=⎨
, für j , k = 1, …, n, j ≠ k
⎪
2
2
⎪⎩ S j Sk (1 − R j / n − j )(1 − Rk / n − k )
und
[S 2j (1 − R 2j / n − j )] = S 2j / n −1 .
1316han05.indd 293
25.07.2006 11:39:31
294
5 Qualität in der Fertigung
Varianzanalyse für die berechnete Prozessgleichung
Für die Prüfung der linearen Prozessgleichung, d. h. für die Prüfung der Hypothese, ob wenigstens eine Input- und/oder Prozessvariable einen statistisch gesicherten Einfluss auf die
Produktvariable hat, wird die Varianzanalyse der
Tabelle 5.12.2 durchgeführt. Diese Analyse basiert auf der Identität
Y − Y = Y − Yˆ + Yˆ − Y
i
i
i
i
nach der die Abweichung einer Beobachtung der Produktvariablen Yi vom Mittelwert Y zerlegt
wird in die Abweichung der Beobachtung Yi von dem mit der Prozessgleichung berechneten
Wert Yˆi und die Abweichung Yˆi − Y der berechneten Werte vom Mittelwert. Werden die
Abweichungen quadriert und über alle Beobachtungen summiert, so erhält man die Zerlegung
der Summe der Abweichungsquadrate der Einzelwerte vom Mittelwert
SAQ gesamt =
N
∑ (Yi − Y )2
i =1
in die beiden Summanden
1. Summe der Abweichungsquadrate der berechneten Werte vom Mittelwert, SAQModell =
N
∑ (Yˆi − Y )2
und
i =1
2. die Summe der Abweichungsquadrate der einzelnen Beobachtungswerte von den berechneten Werten SAQ Fehler =
N
∑ (Yi − Yˆi )2 .
i =1
Die Summen der Abweichungsquadrate werden in Varianztabelle Tabelle 5.11.1 zusammen
gestellt.
Tabelle 5.12.2: Varianztabelle für die „Güte“ der Prozessgleichung
Variationsursache
Summe
der quadratischen
Abweichungen
FG
N
Gesamt
∑ (Yi − Y )2
N–1
i =1
Mittlere Summe
der quadratischen
Abweichungen
F-Quotient
1 N
∑ (Yi − Y )2
N − 1 i =1
N
Modell
∑ (Yˆi − Y )2
m
i =1
N
N
N
∑ (Yi − Y )2 − ∑ (Yˆi − Y )2
Fehler
i =1
=
i =1
N
∑
i =1
(Yi − Yˆi )
2
∑ (Yˆi − Y )2
N–m–1
i =1
N
∑
i =1
=F
(Yi − Yˆi )2
Mit der Varianzanalyse kann man auch noch einmal die Bedeutung des Maßes der Beherrschbarkeit sehr klar erkennen.
1316han05.indd 294
25.07.2006 11:39:31
5.12 Welche Eigenschaften haben die Schätzungen?
295
Beispiel 5.12.2: Bremsweg. Varianzanalyse
Für das Beispiel erhalten wir mit den Daten aus der Datei 03.5.1 Bremsweg (im Internet)
die Tabelle 5.12.3.
Tabelle 5.12.3: Varianzanalyse für die Prozessgleichung
Variationsursache
Summe
der quadratischen
Abweichungen
FG
Gesamt
Modell
Fehler
913,663
791,871
121,7934
29
3
26
Mittlere Summe
der quadratischen
Abweichungen
F-Quotient
263,957
4,6843
56,35
Der berechnete Wert des F-Testes ist sehr viel größer als der entsprechende Tafelwert
F0.05; 29,3 = 2.93, d. h. die Hypothese, dass die Varianz der Produktvariablen Y durch die
Input- und Prozessvariablen nicht reduziert wird, muss mit sehr kleiner Irrtumswahrscheinlichkeit verworfen werden.
Die Modellvarianz kann weiter zerlegt werden. Man erhält die weiterführende Tabelle 5.12.4.
Tabelle 5.12.4: Weiterführende Varianzanalyse
Variationsursache
Summe der quadratischen
Abweichungen
F-Quotient
Wahrscheinlichkeit
Modell
791,871
136,63
0,0000
Geschwindigkeit
639,997
Profiltiefe
38,1208
Reaktionszeit
113,752
Residuum
121,7927
8,14
0,0084
24,28
0,0000
Aus dieser Varianztabelle kann man die Bedeutungen der einzelnen Input- und Prozessvariablen ablesen. Die Geschwindigkeit ist die wichtigste Prozessvariable. Dieser Parameter
hat den größten F-Wert und die kleinste Irrtumswahrscheinlichkeit.
Die „Vorhersagen“ mit diesem statistischen Modell sind in der Tabelle 5.2.15 enthalten
Tabelle 5.12.5: Vorhersagewerte und Vorhersageintervalle für den Bremsweg
Werte XE für
die Input-
Input- und
Prozessvariable
Vorhersage
XE,1
XE,2
XE,3
YE
45
50
55
2
2
2
1
2
1
27,7
32,0
36,2
V.-Intervall
[23,0; 32,5]
[27,3: 36,6]
[31,5; 40,8]
Die Vorhersagen mit dem ausführlicheren Modell unterscheiden sich von denen, die mit
dem einfachen Modell gewonnen wurden. Das ist aber klar, denn in dem ausführlicheren
Modell steckt sehr viel mehr Information.
1316han05.indd 295
25.07.2006 11:39:32
296
5 Qualität in der Fertigung
5.13
Einfluss der Multikollinearität auf die Schätzfunktionen
In vielen Arbeiten, so z. B. in Johnston [1963], Mason [1975], Harvey [1981], Gunst [1983],
Sen and Srivastava [1990] usw. wird der Einfluss der Multikollinearität auf die Schätzfunktionen im linearen Modell studiert. Dabei begnügen sich die Autoren häufig mit einer intuitiven
Darstellung des Einflusses der Multikollinearität. Wir wollen hier speziell den Einfluss auf die
Prozessgleichung studieren und ein quantitatives Maß für die Multikollinearität verwenden,
um zu erkennen, wie groß der Einfluss der Multikollinearität ist.
Was ist die Multikollinearität?
Wie können wir die Multikollinearität messen?
Nach Anderson [1984] wird die Variabilität eines zufälligen Vektors X durch die verallgemeinerte
Varianz Σ XX beurteilt. Gleichzeitig gilt aber Σ XX = 0 , wenn mit der Wahrscheinlichkeit 1
lineare Abhängigkeiten zwischen den Input- und/oder Prozessvariablen vorkommen. Hieraus
folgt schon, dass der Begriff verallgemeinerte Varianz viel zu eng gefasst ist, wenn es um den
Grad der Multikollinearität geht, denn durch die Determinante werden sowohl die Varianzen
als auch die Abhängigkeitsstruktur erfasst.
Definition der Multikollinearität: Die Straffheit der Abhängigkeitsstruktur zwischen den
Input- und Prozessvariablen wird Multikollinearität genannt und durch die Determinante der
Korrelationsmatrix beurteilt. Für die Determinante der Korrelationsmatrix RXX gilt
n
Σ XX = R XX ⋅ ∏ σ 2j
j =1
und
für alle j, k = 1, …, n, j ≠ k
⎧⎪1, falls ρ jk = 0,
R XX = ⎨
⎪⎩0, falls wenigstens ein ρ jk = 1, für j ≠ k, j, k = 1, …, n
Als Maß für die Multikollinearität verwenden wir daher
δ=
1
R XX
.
Welchen Einfluss hat die Multikollinearität auf die Prozessgleichung und auf das Maß der
Beherrschbarkeit?
Im Netzwerk von betrieblichen Prozessen wurde deutlich ersichtlich, dass die Inputvariablen
eines Prozesses die Produktvariablen eines Vorläuferprozesses sind. Ein Produkt wurde aber
durch mehrere, nicht unabhängige Produktvariable charakterisiert. Der Vektor der Produktvariablen ist ein zufälliger Vektor. Der Vektor der Prozessvariablen ist in sehr vielen Fällen
ebenfalls ein zufälliger Vektor. Hieraus folgte ja, dass zur Berechnung der Prozessgleichung das
lineare Modell mit stochastischen Input- und Prozessvariablen zu verwenden ist. D. h. aber
auch, dass die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen, ausgedrückt
durch deren Korrelations- oder Kovarianzmatrix, die Schätzfunktionen für die unbekannten
Koeffizienten in den Gleichungen beeinflusst. Die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen kann sehr unterschiedlich sein. Einerseits kann diese durch einen
1316han05.indd 296
25.07.2006 11:39:32
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen
297
großen Korrelationskoeffizienten zwischen zwei Parametern oder andererseits durch mäßig
große Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen und deren
unterschiedliche Vorzeichen geprägt sein.
Diese Feststellungen führen auf drei Probleme, die im Rahmen der Multikollinearitätsproblematik beantwortet werden müssen.
• Wie beeinflusst die Abhängigkeitsstruktur und damit die Multikollinearität die Schätzfunktionen für die unbekannten Koeffizienten und die bedingte Varianz?
• Wie kann die Abhängigkeitsstruktur beurteilt werden?
• Wie kann ein großer Grad der Multikollinearität korrigiert werden?
In den meisten Schätzfunktionen für die unbekannten Modellparameter kommt die Inverse
der Kovarianzmatrix vor. Folglich schreiben wir die Inverse elementeweise auf und erhalten
die Darstellung
1
A −XX
⎧ A −j 2 (1 − R 2j / n − j )−1 ,
für alle j = 1, …, n
⎪
⎪
− R jk / m − j ,k
=⎨
, für j , k = 1, …, n, j ≠ k
1
⎪ 2 2
2
2
2
⎡
⎤
⎪⎩ ⎣ A j Ak (1 − R j / n − j ) ⋅ (1 − Rk / n − k )⎦
wobei R jk / n −( j ,k) die Korrelationskoeffizienten der bedingten Verteilung von (Xj, Xk) unter
der Bedingung der restlichen Variablen (X1, …, Xj – 1, Xj + 1, …, Xk – 1, Xk + 1, …, Xn) d. h. die
partiellen Korrelationskoeffizienten bezeichnen. [n – (j, k)] bezeichnet die Indexmenge der
restlichen Variablen.
Diese zeigt, dass mit zunehmender Strenge der Abhängigkeit innerhalb des Vektors der Inputund Prozessvariablen der multiple Korrelationskoeffizient zwischen einem beliebigen Xj und
einer Linearkombination in den restlichen Input- und Prozessvariablen R2j/n – j stets größer wird.
Dadurch wird 1 – R2j/n – j immer kleiner und somit das Diagonalelement A −j 2 ⋅ (1 − R 2j / n − j )−1
von A–1
XX immer größer.
Für die globale Beurteilung der Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen benötigt man ein Maß. Zur Ableitung eines solchen betrachtet man den bekannten
Zusammenhang (Muirehead [1982])
1
P [ X T ⋅ Σ −XX
⋅ X ≤ χn2 (α)] = 1 − α,
d. h. mit der Wahrscheinlichkeit 1 – α fällt X in das Innere des Konzentrationsellipsoides
1
X T ⋅ Σ −XX
⋅ X = χn2 (α) mit dem Volumen
1
V =
n
1
(2 ⋅ π)2⋅n ⋅ R XX ⋅ ∏ σ 2j ⋅ [χn2 (α)]2⋅n
j =1
⎛ 1 ⎞
Γ⎜
⋅n
⎝ 2 ⋅ n ⎟⎠
,
falls X ∼ Nn (0, ΣXX). Das Volumen ist nur von RXX abhängig, denn die anderen Variablen
bleiben für diese Betrachtung konstant. Somit sollte sich ein Maß für die Multikollinearität
auf die Determinante beziehen.
1316han05.indd 297
25.07.2006 11:39:32
298
5 Qualität in der Fertigung
Beispiel 5.13.1: Multikollinearität
Der Einfluss der Multikollinearität auf die Parameter des linearen Modells wird durch ein
Beispiel transparent. Es sei Z ~ N3 (0, RZZ), RZZ sei positiv definit und
R ZZ
⎛ 1 ρY 1 ρY 2 ⎞
⎛ 1 ρY . X ⎞
=⎜
1 ρ12 ⎟ = ⎜
.
⎜
⎟ ⎝ R XX ⎟⎠
1 ⎠
⎝
Für diesen einfachen Fall sagt man XT = (X1, X2) habe den Grad der Multikollinearität
R XX
−1
=δ=
1
,
2
1 − ρ12
wenn
2
ρ12
=
δ −1
.
δ
In diesem Fall gilt
⎧⎪1 − (ρY2 1 + ρY2 2 ) δ + 2 ⋅ ρY 1 ⋅ ρY 2 ⋅ (δ − 1) ⋅ δ , falls ρ12 ≥ 0
σY2 / X = σY2 / X (δ) = ⎨
2
2
⎪⎩1 − (ρY 1 + ρY 2 ) δ − 2 ⋅ ρY 1 ⋅ ρY 2 ⋅ (δ − 1) ⋅ δ , falls ρ12 < 0
Da RZZ positiv definit vorausgesetzt wurde, gilt
ρY2 1 < 1, ρ2Y2 < 1 und ρ12 ∈ (a, b)
mit
a, b = ρY 1 ⋅ ρY 2 ± 1 − ρY2 1 − ρY2 2 + ρY2 1 ⋅ ρY2 2 .
Nur für ρY1 = ρY2 erhält man b = 1. Setzt man
⎧ 1
, für a ≥ 0
⎪
A = ⎨1 − a 2
⎪⎩ 0,
für a < 0
und
⎧ 1
, für ρY 1 ≠ ρY 2
⎪
B = ⎨1 − b 2
⎪⎩∞,
für ρY 1 = ρY 2
dann ist δ ∈ [A, B] und
für a ≥ 0
⎧⎪0
σY2 / X ( A + 0) = ⎨
2
2
⎪⎩1 − (ρY 1 + ρY 2 ) für a < 0
bzw.
1316han05.indd 298
25.07.2006 11:39:32
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen
299
für ρY 1 ≠ ρY 2
⎧⎪0
σY2 / X (B − 0) = ⎨
2
⎪⎩1 − ρY 2
für ρY 1 = ρY 2
Aus Symmetriegründen ist nur der Fall a < 0 < b und ρ12 < 0 zu untersuchen.
Es gilt σY2 / X (δ) ist monoton wachsend in (A, δ0] und monoton fallend in [δ0, B), wobei
⎧ max(ρY2 1 , ρY2 2 )
für ρY 1 ≠ ρY 2
⎪
δ 0 = ⎨ ρY2 1 − ρY2 2
⎪
für ρY 1 = ρY 2
⎩∞
Die Funktion σY2 / X (δ) erreicht ihr Maximum 1 − max (ρY2 1 , ρY2 2 ) an der Stelle δ0.
Zum Beweis für ρY1 ≠ ρY2 wird −(ρY 1 + ρY 2 ) δ + 2 ρY 1 ρY 2 (δ − 1) ⋅ δ =: g1 (δ) untersucht.
Zur Abkürzung wird ρY12 + ρY22 =: c und ρY1 ρY2 =: d gesetzt. Mit diesen Abkürzungen
gilt
g1′(δ) = −c +
d ⋅ (2 δ − 1)
(δ − 1) ⋅ δ
.
Aus g ′(δ) = c 2 ⋅ (δ 2 − δ) − d 2 (4 ⋅ δ 2 − 4 ⋅ δ + 1) = 0 und c 2 = 4 ⋅ d 2 + (ρY2 1 − ρY2 2 )2 erhält man
δ2 − δ −
d2
(ρY2 1 − ρY2 2 )2
=0
und somit
δ1/2 =
ρY2 1 − ρY2 2 ± (ρY2 1 + ρY2 2 )
ρY2 1 − ρY2 2
.
Für ρY1 = ρY2 wird
g 2 (δ) = 2 ⋅ ρY 1 ⋅ ⎡⎣ (δ − 1) ⋅ δ − δ ⎤⎦
untersucht. Da
⎡ 2⋅δ −1
⎤
g 2′ (δ) = 2 ⋅ ρY2 1 ⎢
− 1⎥
⎣ (δ − 1) ⋅ δ
⎦
folgt aus g 2′ (δ) = 0 , dass keine reelle Lösung existiert.
Zur Demonstration dieser Resultate betrachten wir die Korrelationsmatrix
⎛ 1 0.9 0.6 ⎞
R =⎜
1 ρ12 ⎟
⎜
⎟
1 ⎠
⎝
für den Vektor (Y, X1, X2).
1316han05.indd 299
25.07.2006 11:39:33
300
5 Qualität in der Fertigung
Die Grenzen des Variationsintervalls für den Korrelationskoeffizienten ρ12 sind
a, b = ρY 1 ⋅ ρY 2 ± 1 − ρY2 1 − ρY2 2 + ρY2 1 ⋅ ρY2 2
= 0.9 ⋅ 0.6 ± 1 − 0.92 − 0.62 + 0.81 ⋅ 0.36 = 0.54 ± 0.348
−4
⎪⎧0.192, für a, mit R ′ = 4.96 ⋅ 10 und δ(a) = 1.038
=⎨
−4
⎪⎩0.888, für b, mit R ′′ = 4.96 ⋅ 10 und δ(b) = 4.729
Der Grad der Multikollinearität bis zu dem σ2Y/X monoton wächst ist
δ0 =
max (ρY2 1 , ρY2 2 )
ρY2 1
−
ρY2 2
=
0.81
= 1.8.
0.45
Die bedingte Varianz im standardisierten Modell wird nach der Beziehung
⎛ 1 ρ12 ⎞
σY2 / X = 1 − (ρY 1 ρY 2 ) ⋅ ⎜
1 ⎟⎠
⎝
= 1 − (ρY 1 ρY 2 ) ⋅
=1−
1
2
1 − ρ12
−1
⎛ ρY 1 ⎞
⋅⎜
⎝ ρY 2 ⎟⎠
⎛ 1 −ρ12 ⎞ ⎛ ρY 1 ⎞
⋅⎜
⋅
1 ⎟⎠ ⎜⎝ ρY 2 ⎟⎠
⎝
ρY2 1 + ρY2 2 − 2 ⋅ ρY 1 ⋅ ρY 2 ⋅ ρ12
2
1 − ρ12
berechnet.
Für a, b, δ0 und einige weitere Zwischenstellen für den Grad der Multikollinearität erhält
man die folgenden Werte für die bedingte Varianz bzw. bedingte Standardabweichung:
σY2 / X (a) = 0.000515, σ Y/X (a) = 0.0227,
σY2 / X (δ1 = 1.19) = 0.1214, σ Y/X (δ1 ) = 0.3484,
σY2 / X (δ 2 = 1.312) = 0.1561, σ Y/X (δ 2 ) = 0.395,
σY2 / X (δ 3 = 1.33) = 0.16, σ Y/X (δ 3 ) = 0.4,
σY2 / X (δ 0 ) = 0.18999, σ Y/X (δ 0 ) = 0.4359, max σ 2Y/X (δ) = 1 − max (ρY2 1 , ρY2 2 ) = 0.19,
σY2 / X (δ 4 = 2.5) = 0.1776, σ Y/X (δ 4 ) = 0.4083,
σY2 / X (δ 5 = 3.249) = 0.118, σ Y/X (δ 5 ) = 0.3435,
σY2 / X (δ 6 = 4) = 0.0611, σ Y/X (δ 6 ) = 0.2472,
σY2 / X (b) = 0.002346, σ Y/X (b) = 0.0484.
Die Abbildung 5.13.1 zeigt die Werte für die bedingte Standardabweichung über den verschiedenen Graden der Multikollinearität. Wie berechnet, steigen die Werte der bedingten
Standardabweichung vom kleinst möglichen Grad a bis zum Grad δ0 der Multikollinearität an
und fallen dann wieder bis zum maximal möglichen Grad b der Multikollinearität.
1316han05.indd 300
25.07.2006 11:39:33
301
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen
0.4
0.3
0.2
bedStreuung
0.1
0.0
0
1
2
3
4
5
Det
Abb. 5.13.1: Bedingte Standardabweichung über dem Grad der Multikollinearität
Für höher dimensionale Vektoren (n ≥ 3) von Input- und Prozessvariablen kann man die Abhängigkeit der bedingten Varianz (Standardabweichung) vom Grad der Multikollinearität δ
nicht mehr analytisch darstellen. Es bleibt hier nur die Möglichkeit, mit Beispielen die Vermutung, dass bei den höher dimensionalen Fällen die gleiche Tendenz gilt, zu untermauern.
Gibt es einen Zusammenhang zwischen dem Grad der Multikollinearität und der
Konditionszahl?
Um die Auswirkung eines großen δ auf die Schätzfunktionen für die unbekannten Parameter
in der Prozessgleichung zu untersuchen, bietet sich die Berechnung der Fehler E an, die bei
der Lösung des Normalgleichungssystems
BYT / X R XX = RY . X
entstehen. Um diesen Fehler berechnen zu können, führen wir die Konditionszahl
kE =
R XX
⎛ R XX ⎞
⎜⎝ n ⎟⎠
n
mit
1
R XX
⎛
⎞2
= ⎜ n + 2∑ rjk2 ⎟
⎝
⎠
j <k
ein. Damit gilt nach Focke [1962]
E ≤
1316han05.indd 301
3⋅n a
,
kE RXX
25.07.2006 11:39:33
302
5 Qualität in der Fertigung
wobei a der Vektor der Abweichungen ist, die man erhält, wenn man die Lösung BY/X in das
Normalgleichungssystem BYT / X RXX = RY . X einsetzt, d. h. a = BYT / X R XX − RY . X .
Je größer der Grad der Multikollinearität ist, desto größer werden die Fehler. Unter den genannten Voraussetzungen, dass der zufällige Vektor Z = (YT, XT) aus den m Produkt- und n
Input- und Prozessvariablen m + n dimensional normal- oder elliptisch umrissen verteilt und
die gemeinsame Kovarianzmatrix positiv definit ist, gilt für eine Stichprobe
(Yi, Xi), i = 1, …, N
von unabhängigen und identisch nach Z verteilten zufälligen Vektoren mit der Schätzfunktion
A ZZ =
N
∑(Zi − Z) ⋅ (Zi − Z)T
i =1
für die Kovarianzmatrix und deren Zerlegung
⎛ AYY
A ZZ = ⎜
⎝
AYX ⎞
,
A XX ⎟⎠
die Maximum Likelihood Schätzfunktion MLSF) für die Matrix der Regressionskoeffizienten
wird nach der Beziehung
1
BTY / X = ATYX ⋅ A −XX
berechnet.
Der Vektor der Absolutglieder besitzt die Darstellung
B0 = Y − BTY / X ⋅ X .
1
Die MLSF für die bedingte Kovarianzmatrix ΣYY / X = ΣYY − ΣYX ⋅ Σ −XX
⋅ Σ XY ist
1
AYY / X = AYY − A −XX
⋅ A XY
bzw. mit der MLSF
S ZZ =
1
⋅ A ZZ
N −1
1
SYY / X = SYY − SYX ⋅ S −XX
⋅ S XY .
Für die MLSF haben wir schon gezeigt, dass
E [BY / X / X] = E [BY / X ] = ΒY / X ,
E [AYY / X / X] = (N − n − 1) ΣYY / X ,
1
1
cov [BY / X / X] = A −XX
⊗ ΣYY / X und cov [BY / X ] = (N − n − 1) ⋅ Σ −XX
⋅ ΣYY / X .
Aus diesen Eigenschaften können Sie schon ablesen, dass die Varianzen der MLSF für die
Regressionskoeffizienten immer größer werden, je größer der Grad der Multikollinearität ist,
denn überall dort wo die Inverse Kovarianzmatrix ins Spiel kommt, wirkt der Grad der Multikollinearität. Das gilt auch für die folgenden Eigenschaften.
1316han05.indd 302
25.07.2006 11:39:34
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen
303
1
• die bedingte Verteilung von BY/X ist N (ΒY / X , A −XX
⊗ ΣYY / X ) ,
• die unbedingte Verteilung von BY/X ist eine multivariate t-Verteilung,
• (N − 1) ⋅ SYY / X ist Wishart verteilt, d. h. Wm (N − m − 1, ΣYY / X ).
Außerdem gelten für die bedingten und unbedingten Vorhersagefehler die folgenden Beziehungen. Der bedingte Vorhersagefehler wird nach der Beziehung
1
M N ,m = ΣYY / X ⋅ (1 + X E ⋅ A −XX
⋅ XE )
und der unbedingte nach
n
⎛
⎞
U N ,m = ΣYY / X ⋅ ⎜1 +
⎟
⎝
N − n − 1⎠
berechnet. Aus den Modellparametern bzw. den MLSF und deren Eigenschaften liest man die
Abhängigkeit von A–1
XX und damit vom Grad der Multikollinearität ab.
Beispiel 5.13.2: Einfluss der Multikollinearität. Einfluss auf die Modellparameter
Für n = 4 wird ein Beispiel nach faktoranalytisch folgender Vorschrift konstruiert:
X1 = ½ (X2 + X3 + X4)
X2 = 2 A + U2
X3 = –A
X4 = A
+ 2 U3
+ U4
wobei A einen gemeinsamen Faktor und Uj, j = 2, 3, 4 spezielle Faktoren bezeichnen. Durch
das Einsetzen der falktoranalytischen Annahmen erhält man
X1 = ½ (U2 + 2 U3 + U4) + A.
Die Voraussetzungen an die gemeinsamen und speziellen Faktoren der Faktoranalyse,
E(A) = E(Uj) = 0, und var(A) = var(Uj) = 1, j = 1, 2, 3, 4 ermöglichen die Berechnung der
Varianzen und Kovarianzen zwischen den vier Prozessvariablen X1 bis X4. Man erhält
var(X1)
= E [1/4 (U2 + 2 U3 + U4)2 + A2 + (U2 + 2 U3 + U4) A]
= ¼ (1 + 4 + 1) + σA2 = 6/4 + 1 = 5/2,
var(X2)
= E (2 A + U2)2 = 5,
var(X3)
= E (–A + 2 U3)2 = 5,
var(X4)
= E (A – U4)2 = 2
cov(X1 X2) = E (X1 X2) = E [(1/2 (U2 + 2 U3 + U4) + A) (2 A + U2)] = 5/2,
cov(X1 X3) = E (X1 X3) = E [(1/2 (U2 + 2 U3 + U4) + A) (–A + 2 U3)] = 1
cov(X1 X4) = E (X1 X4) = E [(1/2 (U2 + 2 U3 + U4) + A) (A + U4)] = 3/2,
cov(X2 X3) = E (X2 X3) = E [(2 A + U2) (–A + 2 U3)] = – 2,
cov(X2 X4) = E (X2 X4) = E [(2 A + U2) (A + U4)] = 2,
cov(X3 X4) = E (X3 X4) = E [(–A + 2 U3) (A + U4)] = – 1.
1316han05.indd 303
25.07.2006 11:39:34
304
5 Qualität in der Fertigung
Mit den Varianzen und Kovarianzen können die Korrelationskoeffizienten
ρ jk =
cov( X j , X k )
[var( X j ) ⋅ var( X k )]1/ 2
, j , k = 1, …, 4, j ≠ k
berechnet werden. Man erhält die Korrelationsmatrix
R XX
⎛
⎜1
⎜
⎜
=⎜
⎜
⎜
⎜
⎜
⎝
1
2
2
5
1
−2
5
1
2/3 ⎞
5 ⎟⎟
⎛ 1 0.707 0.282 0.670 ⎞
2 ⎟ ⎜
−0.400 0.632 ⎟
1
⎟
⎟,
5 ⎟=⎜
−0.316 ⎟
1
⎜
−1 ⎟ ⎜
1 ⎟⎠
⎟ ⎝
10 ⎟
1 ⎠
wobei die Dezimalbrüche durch die Berechnungen von 3 Stellen nach dem Komma zustande
kommen. Das Wesen dieser Korrelationsmatrix besteht darin, dass der Rang der Korrelationsmatrix durch das aufgeprägte weiße Rauschen 4 beträgt; ansonsten nur 3! und der
Einfluss des weißen Rauschens mit zunehmender Anzahl von Stellen für die Dezimalbrüche
immer kleiner wird. Aus der zweiten Eigenschaft folgt, dass der Grad der Multikollinearität
durch die Anzahl der Dezimalstellen verändert werden kann. Die Determinante für die
Korrelationsmatrix mit drei Dezimalstellen ist det(RXX) = 9.66 10–4.
Für 4 Stellen nach dem Komma erhält man det(RXX) = 3.53 10–5. Für 6 Dezimalstellen erhält
man den Wert det (RXX) = 1.306 10–6 usw. Erweitert man die Korrelationsmatrix RXX mit
3 Dezimalstellen um den Vektor der Korrelationskoeffizienten
ρTY.X = (1 0.3 0.3 –0.3 0.65),
dann erhält man eine Korrelationsmatrix für den gemeinsamen Vektor (Y, XT) von einem
Produkt- und vier Prozessvariablen.
Die inverse Korrelationsmatrix hat die Elemente
⎡ 518.00409761864935308 −366.52374300262834013 −365.67403717048603733
⎢ −366.52374300262834013 261.13943712283653603 259.13986870735832069
⎢
⎢ −365.67403717048603733 259.13986870735832069 259.33982968888505582
⎢
162.41898206165352646 163.17659406286286398
⎣ −230.9727355727075434
−230.972735572707543 ⎤
162.4189820616535264 ⎥⎥
163.1765940628628639 ⎥
⎥
104.6667398946136903 ⎦
Mit den Elementen der inversen Korrelationsmatrix kann man die Koeffizienten der Regressionsfunktion (bedingten Erwartungswertes) berechnen. Man erhält die Funktion
E[Y/X] = 5.014039 X1 – 3.784914 X2 – 3.697413 X3 – 1.485723 X4
und die bedingte Varianz
σ2Y/X = 1 – 0.512241 = 0.487759.
Berechnet man 4 Dezimalstellen der Korrelationsmatrix und rundet auf 3 Stellen, dann
erhält man die inverse Korrelationsmatrix
1316han05.indd 304
25.07.2006 11:39:35
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
1
R −XX
305
⎡ 3903.7774652061360842 −2759.4607872664600142 −2759.9198281797504894 −1744.8306665184492782 ⎤
⎢ −2759.4607872664600142 1952.3805292153284385 1951.3032020137744162 1232.3531250988444835 ⎥
⎥,
=⎢
⎢ −2759.9198281797504894 1951.3032020137744162 1952.4272516129524397 1233.6982893435863439 ⎥
⎢
⎥
781.55050847888419224 ⎦
⎣ −1744.8306665184492782 1232.3531250988444835 1233.6982893435863439
die Determinante der Korrelationsmatrix der Prozessvariable det(RXX) = 1.279 10–4, den
bedingten Erwartungswert
E[Y/X] = 37.131019 X1 – 26.485507X2 – 26.409275 X3 – 15.844919 X4
und die bedingte Varianz
σ2Y/X = 1 – 0.817239 = 0.182761.
Die geringfügige Veränderung der einzelnen Elemente der Korrelationsmatrix führt zu
starken Veränderungen der Ergebnisse (Elemente der inversen Korrelationsmatrix und
damit der multiplen Korrelationskoeffizienten, Koeffizienten des bedingten Erwartungswertes, bedingte Varianz).
Aus dieser Darstellung erkennt man, dass die Fehler mit kleiner werdender Determinante
der Korrelationsmatrix für die Input- und Prozessvariable und damit mit kleiner werdenden
Konditionszahlen größer werden.
5.14
Wie können wir die wesentlichen Input- und
Prozessvariablen auswählen?
In den Regressionsansätzen mit festen oder stochastischen Input- und Prozessvariablen wird
der Zusammenhang zwischen einem (oder mehreren) Produktvariablen Y und den n Inputund Prozessvariablen XT = (X′, Z) gesucht. Da zu Beginn der Analyse nicht bekannt ist, welche
Input- und Prozessvariablen den (oder die) Produktvariable wesentlich beeinflussen, misst
man nach dem Grundsatz des
Galilei: „Messe alles, und das nicht Messbare mache messbar“,
so viel wie möglich Input- und Prozessvariablen und hofft, dass unter den gemessenen diejenigen sind, die Y gut erklären. Hinter dieser Formulierung steht die Frage nach der Adäquatheit
des Modells. Hierfür verwenden wir das Maß der Beherrschbarkeit, den F-Test, die t-Tests und
Residualanalysen. Diese Analysen reichen aber nicht aus, den optimalen Ansatz zu finden.
5.14.1
Warum müssen aber nun wieder Input- und/oder Prozessvariablen
aus dem Ansatz gestrichen werden?
Es ist doch offensichtlich, dass mit zunehmender Anzahl von Input- und Prozessvariablen die
Information über Y nicht geringer werden kann. Das ist der Inhalt der Wiener Shannon’sche
Theorie, wonach die Entropie als Maß der Unbestimmtheit einer oder mehrerer Produktvariablen mit zunehmender Anzahl von Input- und Prozessvariablen desselben Prozesses stets
kleiner wird.
1316han05.indd 305
25.07.2006 11:39:35
306
5 Qualität in der Fertigung
Trotzdem gibt es verschiedene Gründe für die Notwendigkeit der Auswahl der wesentlichen
Input- und Prozessvariablen. Zwei dieser Gründe sind:
Der Grad der Multikollinearität nimmt mit wachsender Anzahl n von Input- und Prozessvariablen zu. Daraus folgt aber sofort, dass die Anzahl der redundanten oder unwesentlichen
Input- und Prozessvariablen ebenfalls zunimmt und aufgrund des zunehmenden Grades
der Multikollinearität die numerischen Fehler bei der Lösung des Normalgleichungssystems
größer werden.
Die beiden Terme des unbedingten Vorhersagefehlers (das ist auch der Vorhersagefehler im
n
⎛
⎞
linearen Modell mit festen Input- und Prozessvariablen) U N ,n = σY2 / X ⎜1 +
⎟⎠ zeigen
⎝
N
−
n
−
1
2
unterschiedliches Verhalten. Die Folge {σY / X (n) }, n → ∞ ist antiton (monoton nicht wachsend,
wenn die Anzahl der Input- und Prozessvariablen größer wird) und
n
⎛
⎞
⎜⎝1 +
⎟, n → ∞
N − n − 1⎠
ist streng isoton (monoton wachsend). Die Abbildung 5.14.1 zeigt, dass ein p* = p*(N) mit
p* ∈ {0, 1, …, n} gefunden werden kann, für dass p < p* und p > p* UN.p > UN,p* ist. Das p*
wollen wir optimale Anzahl nennen.
Mit den Auswahlverfahren sollen sowohl das p* wie auch die wesentlichen Input- und Prozessvariablen gefunden werden.
Dabei beinhaltet die Teilmenge der unwesentlichen Input- und Prozessvariablen diejenigen
Variablen, die
• entweder mit den Produktvariablen nicht oder nur sehr gering korreliert
• oder aber redundant sind.
Neben der „Vorhersage“ der Produktvariablen aufgrund von Werten für die Input- und
Prozessvariablen ist somit die Auswahl der wesentlichen Input- und Prozessvariablen ein
vorrangiges Ziel der Anwendung der Regressionsanalyse sowohl mit bekannten, festen (nicht
stochastischen) als auch stochastischen Input- und Prozessvariablen.
σY/X
§
·
n
¸, n → ∞
¨1 +
−
−
© N n 1¹
σY/X
optimale Anzahl
n
Abb. 5.14.1: Optimale Anzahl p*
1316han05.indd 306
25.07.2006 11:39:35
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
307
Es ist notwendig an dieser Stelle noch einmal darauf hinzuweisen, dass es zwischen den beiden
Modellen grundsätzliche Unterschiede gibt. Diese sind:
Wird in dem Modell mit festen Input- und Prozessvariablen z. B. Xn gestrichen, dann
• verändert sich das Modell
Y = βTY . x ⋅ x + ε, mit ε = Y −
n
∑ βY . j x j
j =1
in das Modell
Y =
n −1
∑ βY . j x j + ε *,
j =1
in dem E(ε*) verschieden von null ist.
• Im Modell mit stochastischen Input- und Prozessvariablen
Y = β0 + βY/X X + FY/X,
mit
2
βTY/X = σY.X Σ–1
YY, β0 = µY – βY/X μX und FY/X = Y – E[Y/X] ~ N1(0, σ Y/X)
und
Y und FY/X sind unabhängig voneinander,
gilt auch nach der Streichung des Input- oder Prozessvariables Xn, dass
FY/X = Y – E[Y/X] ~ N1(0, σ2Y/X) ist.
Es ist aber klar, in diesem Modell wird σ2Y/X größer.
Alle Verfahren zur Auswahl der wesentlichen Input- und Prozessvariablen werden unter der
Bezeichnung Teilmengenregression sublimiert. Die meisten Verfahren entstanden unter der
Annahme, dass die Input- und Prozessvariablen feste Einstellgrößen sind. Diese Annahme
ist – zumindest für die Anwendung der Verfahren zur statistischen Analyse von Prozessen
– nicht gerechtfertigt, denn zumindest die Inputvariablen sind Zufallsgrößen, da sie als
Produktvariablen von Vorläuferprozessen aufgefasst werden müssen. Diese Verfahren, siehe
z. B. Hocking [1972, 1976], Hocking and Leslie [1967], Thompson [1978], Kinal and Lahiri
[1983], Mallows [1966, 1977]Miller [1990] und viele andere, werden nicht im Detail beschrieben, sondern nur für die Einschätzung des universellen Red-Verfahrens von Jahn [1984,
1991] verwendet.
5.14.2
Welche Verfahren können für die Auswahl optimaler Teilmengen
von „fixen“ Input- und Prozessvariablen verwendet werden?
Für das Modell mit festen Input- und Prozessvariablen (feste Einstellgrößen) wurden in den
letzten Jahren zahlreiche Auswahlverfahren entwickelt. Diese Verfahren lassen sich in drei
Gruppen einteilen.
1316han05.indd 307
25.07.2006 11:39:35
308
5 Qualität in der Fertigung
1. Berechnungsalgorithmen zum Auffinden der besten Anpassungsteilmengen.
Diese Verfahren basieren entweder auf dem „Kleinst Quadrat Anpassungskriterium“, der
Minimax Anpassung oder der L1 bzw. L∞ Anpassung. Bei all diesen Verfahren müssen die
Restsummen der Abweichungsquadrate für alle 2n – 1 Teilmengen berechnet werden. Das ist
ein Riesenaufwand, vgl. z. B. Edwards and Havra’nek [1987].
2. Vorhersagefehler Minimierungsverfahren.
Der Vorhersagefehler für das Modell mit festen Input- und Prozessvariablen wird genauso
berechnet wie der unbedingte Vorhersagefehler im Modell mit stochastischen Input- und
Prozessvariablen. Auswahlverfahren, die darauf basieren, sind das Cp-Verfahren von Mallows
[1973], das PSS von Allen [1971] und das BIC von Schwarz [1978]. Informationstheoretische
Betrachtungen im Zusammenhang mit dem Vorhersagefehler führen auf das AIC von Akaike
[1973, 1976].
An dieser Stelle soll nur das Cp Kriterium von Mallows für das lineare Modell mit festen Input- und Prozessvariablen etwas ausführlicher skizziert werden. Nach obigen Grundanliegen
soll der Vektor x der festen Input- und Prozessvariablen in zwei Teilvektoren zerlegt werden.
Dabei beinhaltet der Teilvektor x(k) die wesentlichen und x(h) die unwesentlichen Input- und
Prozessvariablen, wobei k = (k1, …, kp), mit
k1 < … < kp die Teilmenge der Indices für die wesentlichen und h = (h1, …, hn – p),
mit
h1 < … < hn – p die Teilmenge der Indices der unwesentlichen Variablen bezeichnen.
Das Teilmengenregressionsmodell lautet dann
Y = βTY.k x (k) + ε(k).
Der Vorhersagefehler für dieses Modell ist
N N . p = E [Y − Yˆ (k)]2 = σ 2R + var [Yˆ (k)] + {E [Yˆ (k) − Y ]}2 .
Eine Mittelung über die Zeilen der Design Matrix x liefert
N
N
i =1
i =1
∑U N , p,i = ∑ E [Yi − Yˆi (k)]2
= N σ 2R +
N
N
i =1
i =1
∑ var [Yˆi (k)] + ∑ {E [Yˆi (k) − Yi ]}2 .
Mallows betrachtet nun das folgende Kriterium
Γp =
1 ⎛N
∑ var [Yˆi (k)] +
σ 2R ⎜⎝ i =1
N
⎞
∑ {E [Yˆi (k) − Yi ]}2 ⎟⎠
i =1
1
= 2 E [Yˆ (k) − βTY . x (k) x(k)]T E [Yˆ (k) − βTY . x (k) x(k)] + p .
σR
Den Bias
E [Yˆ (k) − βTY . x (k) x(k)]T E [Yˆ (k) − βTY . x (k) x(k) = SSB]
1316han05.indd 308
25.07.2006 11:39:35
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
309
kann man ausdrücken durch
T
SSE = ⎡⎣Y − BYx (. xk()Tk) ⎤⎦ ⎡⎣Y − BYx (. xk()Tk) ⎤⎦ = RSE (Bezeichnung in manchen Programmen).
Der Erwartungswert von SSE ist E (SSE) = (N − p) σ 2R + SSB .
Für die Schätzung von Γp verwendet Mallows die Statistik
Cp =
(N − p) σˆ 2R
+ 2 p − N ≈ p.
σˆ 2R
3. Testverfahren
Zu diesen Verfahren gehören die stufenweisen oder schrittweisen Verfahren (Vorwärts- und
Rückwärtsauswahl) von Draper, Smith [1981], Miller [1990] als die bekanntesten. Außerdem
gehören der overall F-Test und der finite intersection Test von Krishnaiah [1982] zu dieser
Gruppe.
Die stufenweisen Verfahren verwenden die F-Statistik
Fˆj =
Y ⋅ X Tj ⋅ ( X j ⋅ X Tj )−1 ⋅ X j ⋅ Y T ⋅ (N − 1)
Y ⋅ [I − X Tj ⋅ ( X j ⋅ X Tj )−1 ⋅ X j ] ⋅ Y T
zur Prüfung der Einzelhypothese H0,j: βY/j = 0, für j = 1, …, n, wobei βY/j aus dem Modell E[Y] = βY/j Xj kommt. Unter der Normalverteilungsannahme ist Fˆj ∼ F1,N −1 verteilt.
Wird die H0, j nicht verworfen, dann wird xj als unwesentlich angesehen. Werden die H0, j
j = 1, …, n verworfen, dann wird die Input- oder Prozessvariable als wesentlich deklariert, der
max (Fˆ1 , …, Fˆn ) > Fα entspricht. Diese Variable ist dann x[1]. Gilt z. B. max (Fˆ1 , …, Fˆn ) = F1 ,
dann wird x1 zur wichtigsten Prozessvariablen erklärt. Ist max (Fˆ1 , …, Fˆn ) ≤ Fα , dann wird
keine der Input- und Prozessvariablen als wichtig erkannt und die Analyse ist beendet.
Nach dem Auffinden von x1 wird die zweitwichtigste Input- oder Prozessvariable gesucht.
Hierzu werden die F-Statistiken
Fˆjk =
Y ⋅ M 0. jk ⋅ Y T ⋅ (N − 2)
Y ⋅ M jk Y T
, j = 1, …, n
mit
M 0, jk = [I − X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ] ⋅ X Tj [ X j ⋅ X Tj − X j ⋅ X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ⋅ X Tj ]−1 ⋅ X j
=I−
( X Tj ,
X kT ) ⋅
⎡ ⎛ Xk ⎞
⎤
T
T
⎢ ⎜ ⎟ ⋅ (xk X j )⎥
X
⎢⎣ ⎝ j ⎠
⎥⎦
−1
⎛ Xk ⎞
⎜⎝ X ⎟⎠
j
berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen, d. h. ist
max (Fˆ12 , …, Fˆ1n ) ≤ F1α , dann ist keine der Prozessvariablen X2, …, Xn wesentlich und wir sind
fertig. F1α ist der obere 100α % Punkt der zentralen F-Verteilung. Wenn max (Fˆ12 , …, Fˆ1n ) > F1α ,
dann ist die zu dem Maximum gehörende Variable die zweitwichtigste Input- oder Prozessvariable. In dieser Weise wird das Verfahren fortgesetzt.
Die F-Statistik ist nichts anderes als der Test zur Prüfung der Hypothese
1316han05.indd 309
25.07.2006 11:39:36
310
5 Qualität in der Fertigung
H0: βY.j = 0 für das klassische Modell E[Y] = βY.j Xj, für j = 1, …, n. Für dieses Modell ist Fj
zentral F-verteilt mit (1, N – 1) FG. Wenn H0 „wahr“ ist, dann ist xj unwichtig. Wenn H0 nicht
„wahr“ ist, dann bedeutet das jedoch nicht, dass xj im 1. Schritt in die Prozessgleichung einbezogen wird. In der 1. Stufe, wenn alle Prozessvariablen nicht unwesentlich sind, picken wir
nur die wesentlichste heraus und formulieren keine Aussage über die Auswahl der anderen
Prozessvariablen, die als nicht unwichtig deklariert werden. Das Vorgehen führt somit in einen
Bereich, in dem keine Entscheidung getroffen wird.
Bei diesem Verfahren werden die n Einzelhypothesen individuell und nicht simultan geprüft, denn der Fehler 1. Art wird in jeder Stufe separat gewählt unter der Bedingung, dass
P[Fj ≤ Fα/H0,j] = 1 – α. Nehmen wir nun an, dass für ein beliebiges j das Modell E[Y] = βY.j Xj
nicht korrekt ist, dann ist F nicht zentral F-verteilt mit
(1, N – 1) FG.
Betrachten wir nur einmal in der r-te Stufe das Modell
E[Y] = βY.1 X1 + … + βY.r Xr + βY.j Xj für j = r + 1, …, n. Dann gilt auch hier, dass die F-Statistik
diejenige Statistik ist, die zur Prüfung der H0 unter diesem Modell ist. Damit wird deutlich,
dass auf der (j + 1)-ten Stufe der kritische Fj, α Wert gewählt wird, ohne Beachtung der Entscheidungen in den vorangegangenen Stufen. Nimmt man z. B. die 2. Stufe, dann sollte man die
bedingten Wahrscheinlichkeiten P[F1j ≤ F1α/H0; max(F1, …, Fn) ≥ Fα] für j = 2, …, n berechnen,
um den Fehler 1. Art für die Prüfung der H0 für ein gegebenes j anstelle der P[F1j ≤ Fα /H0] zu
bestimmen, denn wir wollen ja zur 2. Stufe übergehen, nur wenn max (Fˆ12 , …, Fˆ1n ) > Fα .
Beispiel 5.14.1: Chemischer Prozess. Teilmengenregressionen
Auswahl der wesentlichen Input- und Prozessvariablen nach dem Cp-Kriterium von Mallows. Die Auswahl wird mit dem Datensatz 05.7.1 chem. Prozess demonstriert.
Die Produktvariable ist Y1, als Prozessvariablen habe ich aus der Gesamtmenge der Inputund Prozessvariablen die folgende Teilmenge der Prozessvariablen ausgewählt und mit
den Buchstaben A bis L bezeichnet, da das Programm von Mallows Buchstaben anstelle
von Symbolen erwartet.
X3 = A
X4 = B
X5 = C
X6 = D
X7 = E
X9 = F
X16 = G
X17 = H
X18 = I
X19 = J
X20 = K
X21 = L
Der Stichprobenumfang umfasst N = 107 Beobachtungsvektoren.
Die Anzahl der möglichen Modellansätze ist 212 = 4096.
Es ist vollkommen klar, dass ich nicht alle 4096 Detailergebnisse hier darstellen kann. Daher
wähle ich nur eine Teilmenge von Resultaten aus.
1316han05.indd 310
25.07.2006 11:39:36
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
311
Die Teilmengen mit einer Prozessvariablen sind
Model Results
-------------------------------------------------------------------Adjusted
Included
MSE
R-Squared
R-Squared
Cp
Variables
-------------------------------------------------------------------47,5433
0,0
0,0
207,759
44,5049
7,27389
6,39078
187,01
A
46,4821
3,15448
2,23214
199,893
B
47,5433
0,943396
0,0
209,731
C
38,1133
20,5909
19,8346
145,359
D
47,5433
0,943396
0,0
207,453
E
30,7136
36,008
35,3986
97,1408
F
45,6049
4,98194
4,07701
194,178
G
26,0692
45,6846
45,1673
66,8763
H
25,4059
47,0667
46,5626
62,5538
I
44,7453
6,77295
5,88507
188,576
J
45,6593
4,86876
3,96275
194,532
K
44,1012
8,11493
7,23983
184,379
L
Teilmengen mit zwei Prozessvariablen
44,9072
44,8954
36,7184
44,9241
24,8555
42,5661
26,258
25,5116
7,32686
7,35104
24,2257
7,29186
48,7066
12,1581
45,8124
47,3528
5,54468
5,56933
22,7685
5,50901
47,7202
10,4688
44,7704
46,3403
188,844
188,768
135,991
188,953
59,4249
173,734
68,4767
63,659
AB
AC
AD
AE
AF
AG
AH
AI
Teilmengen mit drei Prozessvariablen
45,3041
36,8847
45,289
25,0909
42,9776
26,5118
25,7582
43,0642
43,9621
7,40662
24,6144
7,43763
48,7188
12,1617
45,8148
47,355
11,9846
10,1495
4,70972
22,4187
4,74164
47,2252
9,60326
44,2366
45,8216
9,42104
7,53251
190,594
136,776
190,497
61,3867
175,723
70,4692
65,6522
176,276
182,016
ABC
ABD
ABE
ABF
ABG
ABH
ABI
ABJ
ABK
45,3041
36,8847
45,289
25,0909
42,9776
26,5118
25,7582
43,0642
43,9621
7,40662
24,6144
7,43763
48,7188
12,1617
45,8148
47,355
11,9846
10,1495
4,70972
22,4187
4,74164
47,2252
9,60326
44,2366
45,8216
9,42104
7,53251
190,594
136,776
190,497
61,3867
175,723
70,4692
65,6522
176,276
182,016
ABC
ABD
ABE
ABF
ABG
ABH
ABI
ABJ
ABK
1316han05.indd 311
25.07.2006 11:39:36
312
5 Qualität in der Fertigung
44,1848
22,5179
21,9735
28,8272
29,5788
28,2781
20,0571
9,69442
53,9776
55,0902
41,0824
39,5463
42,2048
59,007
7,06416
52,6371
53,7821
39,3664
37,7855
40,5215
57,813
183,439
44,9394
41,4596
85,2701
90,0747
81,7598
29,2095
EKL
FGH
FGI
FGJ
FGK
FGL
FHI
Teilmengen mit vier Prozessvariablen
31,5516
45,7117
25,3001
43,3714
26,1166
25,3429
43,4204
44,3193
44,3107
34,7803
25,0574
35,457
26,7585
26,0094
36,4121
37,1576
36,1403
7,48072
48,7932
12,2174
47,1406
48,7066
12,1182
10,2989
10,3163
29,6056
49,2845
28,2359
45,8414
47,3576
26,3029
24,794
33,636
3,85251
46,7851
8,77489
45,0677
46,6951
8,67186
6,78124
6,79932
26,8451
47,2957
25,4216
43,7175
45,2932
23,4128
21,8447
102,727
192,363
63,154
177,548
68,3227
63,4247
177,858
183,548
183,494
123,165
61,6174
127,449
72,386
67,6439
133,494
138,214
ABCD
ABCE
ABCF
ABCG
ABCH
ABCI
ABCJ
ABCK
ABCL
ABDE
ABDF
ABDG
ABDH
ABDI
ABDJ
ABDK
135,539
171,799
169,755
45,1393
63,1561
68,9047
65,6858
58,3311
64,6003
60,0338
172,215
ACEGJ
ACEGK
ACEGL
ACEHI
ACEHJ
ACEHK
ACEHL
ACEIJ
ACEIK
ACEIL
ACEJK
69,3295
17,9989
21,0359
10,7779
43,4456
40,7509
54,6351
DEFGKL
DEFHIJ
DEFHIK
DEFHIL
DEFHJK
DEFHJL
DEFHKL
Teilmengen mit 5 Prozessvariablen
36,7797
42,5645
42,2385
22,3575
25,2319
26,149
25,6355
24,4621
25,4623
24,7337
42,6308
26,2887
14,6951
15,3485
55,1926
49,432
47,594
48,6232
50,9747
48,9702
50,4303
14,5622
22,6396
10,4721
11,1578
52,9744
46,9286
44,9996
46,0798
48,5477
46,444
47,9764
10,3326
Teilmengen mit 6 Prozessvariablen
26,1567
17,8856
18,375
16,7221
21,9859
21,5517
23,7889
1316han05.indd 312
48,0976
64,5098
63,5388
66,8186
56,3736
57,2352
52,7959
44,9835
62,3804
61,3511
64,8277
53,756
54,6693
49,9637
25.07.2006 11:39:37
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
313
Teilmengen mit 7 Prozessvariablen
27,39
18,0465
18,5408
16,742
22,0387
21,3412
23,1807
46,1938
64,5487
63,5777
67,1113
56,7062
58,0764
54,4627
42,3893
62,042
61,0023
64,7858
53,645
55,1121
51,2429
77,284
19,8774
22,9143
11,8625
44,4055
40,12
51,422
BCEFGKL
BCEFHIJ
BCEFHIK
BCEFHIL
BCEFHJK
BCEFHJL
BCEFHKL
56,9304
17,8034
6,54646
12,8058
36,2209
32,4466
ACEFGJKL
ACEFHIJK
ACEFHIJL
ACEFHIKL
ACEFHJKL
ACEFIJKL
38,5712
7,44312
40,448
16,4915
18,7015
8,5704
11,8678
45,3311
40,2539
7,45684
BCEFGIJKL
BCEFHIJKL
BCEGHIJKL
BCFGHIJKL
BDEFGHIJK
BDEFGHIJL
BDEFGHIKL
BDEFGHJKL
BDEFGIJKL
BDEFHIJKL
13,7785
43,4915
39,2742
9,43186
40,0348
16,9016
9,38847
9,40572
BCDEFGHIKL
BCDEFGHJKL
BCDEFGIJKL
BCDEFHIJKL
BCDEGHIJKL
BCDFGHIJKL
BCEFGHIJKL
BDEFGHIJKL
11,0881
38,004
18,7405
11,0057
11,0533
11,0153
11,3796
ABCDEFHIJKL
ABCDEGHIJKL
ABCDFGHIJKL
ABCEFGHIJKL
ABDEFGHIJKL
ACDEFGHIJKL
BCDEFGHIJKL
Teilmengen mit 8 Prozessvariablen
23,9941
17,5608
15,7099
16,7391
20,589
19,9684
53,341
65,8513
69,4505
67,4492
59,9625
61,1693
49,5321
63,0636
66,9566
64,7919
56,6942
57,9995
Teilmengen mit 9 Prozessvariablen
20,8595
15,6886
21,1712
17,1917
17,5588
15,8758
16,4236
21,9824
21,139
15,6909
59,8505
69,8033
59,2505
66,9102
66,2036
69,4428
68,3885
57,6892
59,3125
69,7989
56,1253
67,0015
55,4696
63,84
63,0678
66,6076
65,4555
53,7634
55,5374
66,9967
Teilmengen mit 10 Prozessvariablen
16,5797
21,5669
20,8591
15,8501
20,9867
17,1039
15,8428
15,8457
68,4171
58,9168
60,2652
69,8069
60,022
67,4185
69,8207
69,8152
65,1272
54,6373
56,1262
66,6617
55,8577
64,0246
66,6771
66,671
Teilmengen mit 11 Prozessvariablen
15,9586
20,524
17,2566
15,9447
15,9527
15,9463
16,0081
69,9168
61,3108
67,47
69,9431
69,9279
69,94
69,8236
66,4334
56,831
63,7034
66,4628
66,4459
66,4594
66,3294
Teilmenge mit allen 12 Prozessvariablen
16,1133
1316han05.indd 313
69,9449
66,1081
13,0
ABCDEFGHIJKL
25.07.2006 11:39:37
314
5 Qualität in der Fertigung
Tabelle 5.14.1: Kleinste Cp innerhalb der Teilmengen gleicher Mächtigkeit
Models with Smallest Cp
Model Results
---------------------------------------------------------------Adjusted
Included
MSE
R-Squared
R-Squared
Cp
Variables
---------------------------------------------------------------15,4953
69,2528
67,408
3,16473
EFHIJL
15,4133
69,7215
67,5806
3,69893
EFHIJKL
15,5857
69,3828
67,218
4,75808
AEFHIJL
15,6116
69,3319
67,1634
4,91743
DEFHIJL
15,6167
69,3218
67,1526
4,94894
BEFHIJL
15,6168
69,3217
67,1526
4,94916
EFGHIJL
15,4847
69,8885
67,4304
5,17655
AEFHIJKL
15,548
69,7653
67,2972
5,5618
BEFHIJKL
15,5531
69,7555
67,2865
5,59256
EFGHIJKL
15,556
69,7497
67,2803
5,61057
DEFHIJKL
15,5592
69,7435
67,2736
5,62989
CEFHIJKL
15,6304
69,9152
67,1238
7,09298
ACEFHIJKL
15,6324
69,9114
67,1197
7,10487
AEFGHIJKL
15,6387
69,8992
67,1063
7,14302
ADEFHIJKL
15,6422
69,8925
67,0991
7,16386
ABEFHIJKL
15,6886
69,8033
67,0015
7,44312
BCEFHIJKL
16,3819
67,4935
65,5431
8,667
EFGHIL
15,7809
69,9388
66,8074
9,01932
ACEFGHIJKL
16,5957
66,7401
65,0935
9,02353
EFHIL
15,7896
69,922
66,7889
9,07166
ABEFGHIJKL
15,7901
69,9212
66,788
9,07414
ADEFGHIJKL
15,7928
69,9159
66,7822
9,09072
ACDEFHIJKL
15,7929
69,9159
66,7822
9,09076
ABCEFHIJKL
16,5026
67,2541
65,2894
9,41573
EFHIKL
16,6609
66,94
64,9564
10,3981
BEFHIL
16,7079
66,8466
64,8574
10,6902
CEFHIL
15,9447
69,9431
66,4628
11,0057
ABCEFGHIJKL
15,9463
69,94
66,4594
11,0153
ACDEFGHIJKL
15,9527
69,9279
66,4459
11,0533
ABDEFGHIJKL
15,9586
69,9168
66,4334
11,0881
ABCDEFHIJKL
16,0081
69,8236
66,3294
11,3796
BCDEFGHIJKL
16,1133
69,9449
66,1081
13,0
ABCDEFGHIJKL
17,6875
64,552
62,7971
15,867
BFHIL
17,8372
64,2519
62,4822
16,8056
EFHIJ
17,848
64,2303
62,4595
16,8731
DFHIL
18,2284
63,4679
61,6594
19,2575
EFHIK
18,6575
62,2376
60,7567
21,1054
FHIL
18,8727
61,8022
60,3042
22,4673
EFHI
19,3647
60,8064
59,2694
25,5817
DFHI
19,3769
60,7817
59,2438
25,6587
FGHI
19,6796
60,1689
58,6069
27,5753
FHIK
20,0571
59,007
57,813
29,2095
FHI
21,5712
55,9124
54,6283
38,8881
FIJ
21,7327
55,5824
54,2887
39,9202
HIL
21,9735
55,0902
53,7821
41,4596
FGI
22,1304
54,7696
53,4522
42,4623
FHJ
22,7717
53,0069
52,1032
45,9754
FI
23,3479
51,818
50,8914
49,6938
FH
23,6865
51,1191
50,1791
51,8795
HI
24,6811
49,0666
48,0871
58,299
GI
24,7316
48,9625
47,981
58,6246
IJ
25,4059
47,0667
46,5626
62,5538
I
26,0692
45,6846
45,1673
66,8763
H
30,7136
36,008
35,3986
97,1408
F
38,1133
20,5909
19,8346
145,359
D
44,1012
8,11493
7,23983
184,379
L
47,5433
0,0
0,0
207,759
----------------------------------------------------------------
1316han05.indd 314
25.07.2006 11:39:37
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
315
Mallows' Cp Plot for y1
240
Cp
200
160
120
80
40
0
0
3
6
9
Number of Coefficients
12
15
Abb. 5.14.2: Cp-Kriterium von Mallows
Die Darstellung des besten (kleinsten) Cp innerhalb jeder Teilmenge von Prozessvariablen
gleichen Umfangs ist in der Abbildung 5.14.2 enthalten.
Diese Abbildung zeigt, dass die Mächtigkeit der Teilmenge mit dem kleinsten Cp zwischen
n = 6 und n = 8 zu liegen scheint.
Für eine genauere Bestimmung sucht der Computer innerhalb jeder Mächtigkeit der Teilmengen das kleinste Cp. Die Werte sind in der Tabelle 5.14.1 angegeben.
Das Gesamtmodell (das Modell mit allen 12 Prozessvariablen) ist in der Tabelle 5.14.2
enthalten.
Tabelle 5.14.2: Prozessgleichung mit allen Prozessvariablen
Prozessgleichung
----------------------------------------------------------------------------Produktvariable: y1
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
-408,705
214,545
-1,90499
0,0598
x3
-0,63914
0,852096
-0,750079
0,4551
x4
0,201308
0,523085
0,384847
0,7012
x5
1,92428
18,9108
0,101756
0,9192
x6
1,27445
17,1746
0,0742055
0,9410
x7
-11,723
3,98068
-2,94496
0,0041
x9
0,322213
0,0597561
5,39213
0,0000
x16
-0,0941571
0,845685
-0,111338
0,9116
x17
89,7031
18,5206
4,84342
0,0000
x18
-91,06
17,9793
-5,06472
0,0000
x19
1,07786
0,47749
2,25734
0,0263
x20
3,53736
2,78535
1,26999
0,2072
x21
0,802039
0,23722
3,381
0,0010
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
3537,88
12
294,824
18,48
0,0000
Residual
1515,41
95
15,9517
----------------------------------------------------------------------------Total (Corr.)
5053,3
107
R-squared = 70,0114 percent
R-squared (adjusted for d.f.) = 66,2233 percent
Standard Error of Est. = 3,99396
Mean absolute error = 2,89319
Durbin-Watson statistic = 1,02239
1316han05.indd 315
25.07.2006 11:39:37
316
5 Qualität in der Fertigung
Das Maß der Beherrschbarkeit für diesen Ansatz ist R2Y.X = 0.700 und die Reststandardabweichung ist s = 3.9939.
Diese Gleichung kann auch in der üblichen Form
y1 = -408,705 - 0,63914*x3 + 0,201308*x4 + 1,92428*x5 + 1,27445*x6 11,723*x7 + 0,322213*x9 - 0,0941571*x16 + 89,7031*x17 - 91,06*x18 +
1,07786*x19 + 3,53736*x20 + 0,802039*x21
geschrieben werden.
Verwendet man die optimale Teilmenge {X7, X9, X17, X18, X19, X21} die man nach dem Cp
Kriterium von Mallows über alle möglichen Teilmengen von Prozessvariablen aufgefunden
hat, dann erhält man die Prozessgleichung in folgender Tabelle.
Tabelle 5.14.3: Prozessgleichung für die Cp optimale Teilmenge von Prozessvariablen
Optimale Prozessgleichung
----------------------------------------------------------------------------Produktvariablee: y1
y1
Produktvariable:
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
-229,092
48,0022
-4,77254
0,0000
x7
-10,9841
2,41239
-4,5532
0,0000
x9
0,278296
0,043022
6,4687
0,0000
x17
90,2917
15,5109
5,82117
0,0000
x18
-92,135
14,6712
-6,28001
0,0000
x19
0,973529
0,332094
2,93148
0,0042
x21
0,824957
0,203737
4,04912
0,0001
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
3501,64
6
583,607
37,99
0,0000
Residual
1551,65
101
15,3629
----------------------------------------------------------------------------Total (Corr.)
5053,3
107
R-squared = 69,2942 percent
R-squared (adjusted for d.f.) = 67,4701 percent
Standard Error of Est. = 3,91956
Mean absolute error = 2,85277
Durbin-Watson statistic = 1,0026
Bemerkung zur Tabelle 5.14.3
Die 1. Spalte der beiden Tabellen beinhaltet die Parameterbezeichnung, die 2. Spalte die
Koeffizienten der Prozessgleichung. Die Prozessgleichung kann auch in der Form
y1 = -229,092 - 10,9841*x7 + 0,278296*x9 + 90,2917*x17 - 92,135*x18 +
0,973529*x19 + 0,824957*x21
geschrieben werden. In der 3. Spalte stehen die Standardabweichungen für die Koeffizienten
der Prozessgleichung. Die 4. Spalte ist für die Werte der t-Statistik
1316han05.indd 316
25.07.2006 11:39:38
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
tj =
BY . j
SR
⋅
317
N −n
A jj
mit Ajj als einem Diagonalelement von A–1
xx reserviert. Die letzte Spalte beinhaltet die berechneten Irrtumswahrscheinlichkeiten für den t-Test. Sind diese Werte < 0.05, dann ist
der zugehörige Regressionskoeffizient statistisch gesichert von null verschieden, d. h. dann
hat xj einen wesentlichen Einfluss auf Y.
Das Maß der Beherrschbarkeit des vollständigen Ansatzes sinkt durch den Übergang zum
Cp-optimalen Ansatz. Die Reststandardabweichung wird geringfügig kleiner. Das liegt aber
offensichtlich an der Anzahl der FG.
Schrittweise Auswahl der unwesentlichen Prozessvariablen nach dem Verfahren von Draper,
Smith
Das schrittweise Verfahren von Draper Smith wurde von Miller [1984] beschrieben und vorn
in diesem Abschnitt diskutiert.
Beispiel 5.14.2: Chemischer Prozess. Schrittweise Auswahl der unwesentlichen
Prozessvariablen
Das Verfahren liefert die Prozessgleichung
Tabelle 5.14.4: Ergebnis für die Prozessgleichung nach der schrittweisen Auswahl
Prozessgleichung
----------------------------------------------------------------------------Produktvariable: y1
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
-224,444
49,8182
-4,50527
0,0000
x7
-10,9184
2,42925
-4,49457
0,0000
x9
0,273991
0,0447462
6,12322
0,0000
x17
90,3134
15,5777
5,7976
0,0000
x18
-92,2535
14,7377
-6,25969
0,0000
x19
0,959545
0,335657
2,85871
0,0052
x21
0,838724
0,207968
4,03294
0,0001
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
3490,06
6
581,676
37,54
0,0000
Residual
1549,53
100
15,4953
----------------------------------------------------------------------------Total (Corr.)
5039,59
106
R-squared = 69,2528 percent
R-squared (adjusted for d.f.) = 67,408 percent
Standard Error of Est. = 3,93641
Mean absolute error = 2,86302
Durbin-Watson statistic = 1,00251
1316han05.indd 317
25.07.2006 11:39:38
318
5 Qualität in der Fertigung
oder wird in der üblichen Weise geschrieben:
y1 = -224,444 - 10,9184*x7 + 0,273991*x9 + 90,3134*x17 - 92,2535*x18 +
0,959545*x19 + 0,838724*x21
Diese Gleichung stimmt mit der Cp-optimalen Gleichung überein. Die geringfügigen Abweichungen sind numerischer Art.
5.14.3
Red-Auswahlverfahren von Jahn
Für das Modell mit stochastischen Input- und Prozessvariablen wurde von Jahn [1991] das Red
Auswahlverfahren entwickelt. Dieses Verfahren basiert auf der Reduktion der bedingten Varianz
σY2 / X durch Hinzunahme weiterer Input- und Prozessvariablen bzw. auf der Reduzierung dieser
Varianz durch Streichen von Input- und Prozessvariablen und realisiert die Anforderungen an
das optimale p* und die dazu gehörende Teilmenge von wesentlichen Input- und Prozessvariablen. Außerdem liefert dieses Verfahren die „wahre“ Rangfolge der Input- und Prozessvariable
bzgl. ihres Einflusses auf den (die) Produktvariablen.
Zur Untersuchung der durch die Streichung eines Teilvektors bedingten Veränderungen auf die
Modellparameter Regressionskoeffizienten, bedingte Varianz (Restvarianz), „Vorhersagefehler“,
Maß der Beherrschbarkeit des Prozesses und die Teststatistiken, wird von einer beliebigen,
disjunkten Zerlegung des Vektors X der Input- und Prozessvariable in XT = [X(k)T, X(h)T],
mit
k = (k1, …, kp), k1 < k2 < … < kp und h = (h1, …, hn – p), h1 < h2 < … < hn – p
ausgegangen. Damit erhält man die Zerlegung (siehe Glossar) der positiv definiten Kovarianzmatrix
⎛ ΣYY
Σ=⎜
⎜
⎝
ΣYk
Σ kk
ΣYh ⎞
Σ kh ⎟ ,
⎟
Σ hh ⎠
wobei die Teilmatrizen die Ordnungen ΣYY: m × m, Σkk: p × p, Σhh: (n – p) × (n – p), ΣYk: m × p,
ΣYh: m × (n – p) und Σkh: p × (n – p) haben.
Entsprechend der Kovarianzmatrix kann man die Momente der bedingten Verteilung, den
bedingten Erwartungswert (Regressionsfunktion) und die bedingte Kovarianzmatrix zerlegen.
Man erhält das folgende Ergebnis.
Zerlegungssatz für die Momente einer bedingten Verteilung:
Es sei Z ~ Nm + n(0, Σ), Σ > 0 (positiv definit).
E [Y / X(k), X(h)] = βTY .k / h ⋅ X(k) + βTY .h / k ⋅ X(h)
und
var [Y / X(k), X(h)] = ΣYY / k − βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k := ΣYY / X ,
1316han05.indd 318
25.07.2006 11:39:38
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
319
wobei
−1
βTY .k / h = ΣY .k / h ⋅ Σ kk
/h,
−1
βTY .h / k = ΣY .h / k ⋅ Σ hh
/k,
−1
⋅ Σ hk = cov{[Y , X (k)]/ X (h)},
ΣY .k / h = ΣYk − ΣYh ⋅ Σ hh
−1
⋅ Σ kh = cov{[Y , X (h)]/ X (k)},
ΣY .h / k = ΣYh − ΣYk ⋅ Σ kk
−1
⋅ Σ kh ,
Σ hh / k = Σ hh − Σ hk ⋅ Σ kk
−1
⋅ Σ hk .
Σ kk / h = Σ kk − Σ kh ⋅ Σ hh
Beweis: Jahn [1991].
Dieser Satz besagt, dass eine Regressionsfunktion als Summe zweier bedingter Regressionsfunktionen darstellbar ist; einmal zwischen Y und X(k) unter der Bedingung X(h) und zum
anderen zwischen Y und X(h) unter der Bedingung X(k). Analog zerfällt die bedingte Kovarianzmatrix ebenfalls in zwei Bestandteile; einmal die bedingte Kovarianzmatrix des Vektors
der Produktvariable Y unter der Bedingung X(k) und zum anderen in die quadratische Form
βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k .
Diese Form ist der Anteil, um den die bedingten Varianzen und Kovarianzen von Y unter
der Bedingung X(k) verringert werden, wenn der Teilvektor der Input- und Prozessvariable
X(h) zu dem Teilvektor X(k) hinzu genommen wird. Daher wird die quadratische Form
βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k REDp(h) genannt. Die Umkehr dieser Interpretation ist, Redp(h) ist die
proportionale Vergrößerung der bedingten Varianz z. B. der Produktvariablen Yr, r = 1, …, m
unter der Bedingung X, wenn die Input- und Prozessvariablen X(h) gemeinsam gestrichen
werden.
Was bedeutet die Teilmengenregression?
Die Zerlegung des bedingten Erwartungswertes und der bedingten Varianz dienen dem Auffinden eines Auswahlverfahrens für eine optimale Teilmenge von Input- und Prozessvariablen
im Sinne der Minimierung des unbedingten Vorhersagefehlers und der Auseinandersetzung
mit der Hocking’schen Teilmengenregression, die z. B. in Hocking and Lesie [1967], Hocking
[1972, 1976], beschrieben wurde.
Y = βTY / k ⋅ X (k) + FY / k
−1
mit FY/k ∼ Np (0, ΣYY/k) und ist unabhängig von X(k), wobei βTY / k = ΣY .k Σ kk
. Der Vergleich der
Teilmengenregression mit dem Zerlegungssatz zeigt eine Übereinstimmung des vollständigen
Ansatzes mit der Teilmengenregression nur für den Fall ΣYh = 0 und Σkh = 0. Ist nur Σkh = 0,
dann gilt
Y = βTY / k ⋅ X (k) + βTY / h ⋅ X (h) + FY / X
mit
var (FY / X ) = ΣYY / k − βTY / h ⋅ ΣYY / h ⋅ βY / h .
Da diese Fälle bei praktischen Anwendungen erkannt würden, besitzen sie nur theoretisches
Interesse. Über die Auswirkung der Streichung von X(h) aus dem Ansatz gibt der folgende
Satz Auskunft.
1316han05.indd 319
25.07.2006 11:39:38
320
5 Qualität in der Fertigung
Satz: Unter den bisherigen Voraussetzungen gilt
−1
βTY / k = βTY .k / h + βTY .h / k ⋅ Σ hk ⋅ Σ kk
,
−1
FY / k = FY / X + βTY .h / k ⋅ [ X (h) − Σ hk ⋅ Σ kk
]
und damit
ΣYY / k = ΣYY / X + βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k .
Die Elemente der bedingten Kovarianzmatrix ΣYY/k sind größer als die von ΣYY/X und zwar um
genau die Elemente von Redp(h).
Die Vorhersagefehler der Teilmengenregression sind
−1
M N .k = (ΣYY / k + βYT .h / k ⋅ Σ hh / k ⋅ βY .h / k ) ⋅ [1 + X E (k)T ⋅ Akk
⋅ X E (k)]
und
⎛
⎞
p
.
U N .k = (ΣYY / k + βYT .h / k ⋅ Σ hh / k ⋅ βY .h / k ) ⋅ ⎜1 +
N − p − 1 ⎟⎠
⎝
Der Vergleich der beiden unbedingten Vorhersagefehler UN.n und UN.k liefert ein erstes Indiz
für die Konstruktion des Auswahlverfahrens, denn die Diagonalelemente der Vorhersagefehlermatrizen sind die Vorhersagefehler für jede Produktvariable Yj, j = 1, …, m und für diese
genügt es, wenn gilt
βTY .h / k ⋅ Σ hh / k ⋅ βY .h / k ≤ ΣYY / X ⋅
Fˆjk =
Y ⋅ M 0. jk ⋅ Y T ⋅ (N − 2)
Y ⋅ M jk Y T
n−p
.
N −n −1
, j = 1, …, n
mit
M 0, jk = (I − X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ) ⋅ X Tj [ X j ⋅ X Tj − X j ⋅ X kT ⋅ ( X k ⋅ X kT )−1 ⋅ X k ⋅ X Tj ]−1 ⋅ X j
−1
=I−
( X Tj ,
X kT ) ⋅
⎡ ⎛ Xk ⎞
⎤ ⎛ Xk ⎞
T
T
⎢ ⎜ ⎟ ⋅ ( X k X j )⎥ ⎜ ⎟
⎢⎣ ⎝ X j ⎠
⎥⎦ ⎝ X j ⎠
berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen.
Die Vorhersagefehler sind unbekannt und müssen ebenfalls bestimmt werden. Die ML-Schätzfunktion für den Vorhersagefehler ist
n
⎛
⎞
Uˆ N .n = SY2 / X ⎜1 +
⎟.
⎝
N − n − 1⎠
Der Vorhersagefehler kann nun mit der Stichprobenkovarianzmatrix und dem geschätzten
Red nach der Formel
⎛
⎞
p
2
ˆ
Uˆ N′ .n = [Red
p (h) + (N − n − 1) SY / X ] ⎜1 +
N − p − 1 ⎟⎠
⎝
bestimmt werden.
1316han05.indd 320
25.07.2006 11:39:38
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
321
Bei einem sehr hohen Grad der Multikollinearität δ können Sie anstelle der Stichprobenkovarianzmatrix besser die Stichprobenkorrelationsmatrix R
⎞
p
ˆ ′ (h) + (N − n − 1) S ′ 2 ] ⎛1 +
Uˆ N′′ .n = [Red
p
Y /X ⎜
N − p − 1 ⎟⎠
⎝
1
verwenden, wobei R̂ed ′p (h) mit den Diagonalelementen der inversen Korrelationsmatrix R −XX
2
gebildet wird. Analoges gilt für S′ Y / X .
Die ML-Schätzfunktionen für den unbedingten Vorhersagefehler können umgeschrieben
werden. Man erhält
⎛
⎞
p
2
ˆ
Uˆ N′ .n = [Red
p (h) + (N − n − 1) SY / X ] ⎜1 +
N − p − 1 ⎟⎠
⎝
2
ˆ
= [Red
p (h) + (N − n − 1) SY / X ]
N −1
N − p −1
⎞
p
ˆ ′ (h) + (N − n − 1) S ′ 2 ) ⎛1 +
Uˆ N′′ .n = [Red
p
Y /X ⎜
N − p − 1 ⎟⎠
⎝
ˆ ′ (h) + (N − n − 1) S ′ 2 )
= [Red
p
Y /X
N −1
N − p −1
.
N ist konstant, daher kann man die Vorhersage im Sinne des Kriterium von Mallows umschreiben, d. h. N – 1 weglassen. Damit erhält man
Sn = Uˆ C ,N .n =
R̂ed p (h) + (N − n − 1) SY2 / X
(N − p − 1)2
.
p* wird dann geschätzt, indem man für alle möglichen Teilmengen das kleinste Uˆ C ,N .n sucht.
Das dazu gehörende p bezeichnet man mit p̂ und betrachtet es als Schätzung für p*. Da p̂ eine
Schätzung für p* ist, die aus den Realisierungen der Produktvariablen Y und des Vektors der
Input- und Prozessvariablen X ermittelt wurde, kann anstelle der Optimalität des Verfahrens
nur die asymptotische Optimalität nachgewiesen werden, d. h. es gilt die Wahrscheinlichkeit,
dass
Uˆ N . pˆ (N )
U N . pˆ (N )
⎯⎯⎯⎯⎯
→ 1.
N − n (N )→ ∞
R̂ed p (h) = AY2 / k − AY2 / X = (N − p) ⋅ SY2 / k − (N − n) ⋅ SY2 / X = BYT.h / k ⋅ Ahh / k ⋅ BY .h / k
ist die Schätzfunktion für Redp(h). Die Minimierung des unbedingten Vorhersagefehlers beinhaltet zwei Teilaufgaben, nämlich
• die Bestimmung der optimalen Anzahl der Elemente der Teilmenge und
• die Auswahl der wesentlichen Input- und Prozessvariablen.
1316han05.indd 321
25.07.2006 11:39:39
322
5 Qualität in der Fertigung
Das Red Auswahlverfahren
Da der Term N – 1 in der Formel Uˆ N . p konstant ist, genügt es, den Ausdruck
Sp =
ˆ
(N − n − 1) ⋅ SY2 / X + Red
p (h)
(N − p − 1) ⋅ (N − p − 1)
zu minimieren.
Das Red Auswahlverfahren läuft in mehreren Schritten ab.
Im ersten Schritt wird für jede Input- und Prozessvariable
R̂ed p ( j) = BY2 . j / n − j ⋅ S 2j / n − j
berechnet, wobei die Indexmenge h nur das Element j und demzufolge die Indexmenge k die
restlichen n – j Elementen beinhaltet. S 2j / n − j ist die Maximum Likelihood Schätzfunktion
für die bedingte Varianz der jten Input- oder Prozessvariablen unter der Bedingung, dass die
−1
restlichen Input- und Prozessvariablen konstant gehalten werden. Aus der Matrix S XX
kann
−2
S j / n − j abgelesen werden. Analog kann man natürlich auch mit der Korrelationsmatrix RXX
rechnen. Durch die Kehrwertbildung erhält man sofort den Wert A2j / n − j .
BY.j/n – j ist folglich der j-te Regressionskoeffizient der j-ten Input- oder Prozessvariablen. Dieser
Koeffizient kann nach dem Zerlegungssatz gemäß der Zerlegung
BYT / X = (BY . j / n − j , BYT.n − j / j )
sofort aus dem vollständigen Ansatz abgelesen werden.
Die Minimierung des unbedingten Vorhersagefehlers Uˆ N . p mit Redp(h) erfolgt über die Lösung
der oben genannten zwei Probleme
• Bestimmung des optimalen pˆ * und
• die Auswahl der Input- und Prozessvariablen, die in X(k) zusammengefasst werden und
die Uˆ N . p minimieren.
Weiter oben wurde bereits darauf verwiesen, dass es aufgrund der Konstanz von N ausreichend
ist, Sp(hn – p) zu minimieren. Für den vollen Ansatz gilt
SY2 / X
N −n −1
anstelle von Uˆ N .n .
Mit den berechneten R̂ed n −1( j) , j = 1, …, n werden alle Input- und Prozessvariablen in eine
Rangfolge X[1], …, X[n – p – 1], X[n – p], X[n – p + 1], …, X[n] geordnet, in der X[1] die unwichtigste
Input- oder Prozessvariable ist, da diese beim Streichen den unbedingten Vorhersagefehler
am geringsten vergrößert.
Der Ansatz ohne die unwichtigste Input- oder Prozessvariable
Sn =
Sn −1(h[1]) =
R̂ed n −1([1]) + (N − n − 1) ⋅ SY2 / X
(N − n) ⋅ (N − n − 1)
wird mit Sn verglichen.
1316han05.indd 322
25.07.2006 11:39:39
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
323
Gilt
Sn −1 ≤ Sn ,
dann wird X[1] d. h. h[1] = h1 = ([1]) aus der Analyse entfernt. Im anderen Fall, d. h. falls
Sn −1 > Sn , kann der vollständige Ansatz nicht reduziert werden.
Im nächsten Schritt ist zu prüfen, ob mit X[1] auch X[2] gestrichen werden kann. Hierfür ist
R̂ed n − 2 (h2 ) zu berechnen, wobei h2 = ([1], [2]) die zweielementige Teilmenge der beiden
unwichtigsten Input- und Prozessvariablen ist.
Gilt nun
ˆ
ˆ
Red
n − 2 (h2 ) ≤ Red n −1 ([3])
und
Sn − 2 ≤ Sn −1 ,
dann kann die Teilmenge X(h2)T = (X[1], X[2]) aus dem Ansatz gestrichen werden.
Gilt dagegen
ˆ
ˆ
Red
n − 2 (h2 ) > Red n −1 ([3]),
aber
Sn − 2 ≤ Sn −1 ,
muss man prüfen, ob alle möglichen Zweier-Teilmengen, die alle die 3. Input- oder Prozessvariable beinhalten, ein kleineres R̂ed n − 2 als R̂ed n −1 ([3]) liefern und damit ein kleineres
ˆ
S p [Red
n − 2 (h2 )] ergeben. In diesem Fall wird das Verfahren fortgesetzt. Andernfalls ist das
Verfahren beendet.
Es gilt
⎛ bY .[1]/ n −[1] ⎞
−1
R̂ed n − 2 (h2 ) = (bY .[1]/ n −[1] , bY .[2]/ n − 2]) ⋅ S[1].[2]/
,
n −[1].[2] ⋅ ⎜
⎝ bY .[2]/ n − 2] ⎟⎠
wobei wiederum die beiden Regressionskoeffizienten bY .[1]/ n −[1] und bY .[2]/ n − 2] aus dem voll−1
ständigen Ansatz abgelesen werden und S[1].[2]/n – [1].[2] entweder aus der inversen Matrix S XX
abgelesen oder entsprechend durch Invertierung der zerlegten Matrizen gebildet wird.
In dieser Weise wird das Verfahren so lange fortgesetzt, wie
ˆ
ˆ
Red
p (hn − p ) ≤ Red n −1 ([n − p + 1])
und
S p (hn − p ) ≤ S p +1 (hn − p −1 )
gilt, wobei im (n – p)-ten Schritt hn – p = ([1], [2], …, [n – p]). Die Teilmenge hn – p kann in
diesem Fall gestrichen und das Verfahren mit der Erweiterung der Teilmenge hn – p um die
[n – p + 1]-te Input- oder Prozessvariable fortgesetzt werden.
Sind beide Bedingungen nicht erfüllt, dann ist man am Ende des Auswahlprozesses angelangt.
Gilt jedoch
ˆ
ˆ
Red
p (hn − p ) > Red n −1 ([n − p + 1])
1316han05.indd 323
25.07.2006 11:39:40
324
5 Qualität in der Fertigung
und
S p (hn − p ) ≤ S p +1 (hn − p −1 ) ,
dann ist das Verfahren in der 2. Stufe fortzusetzen.
Wie vorher wird die Teilmenge
([1], …, [n – p], [n – p + 1])
betrachtet. Aus dieser werden alle Teilmengen mit (n – p) Input- und/oder Prozessvariablen,
die alle die [n – p + 1]-te Input- oder Prozessvariable beinhalten, gebildet. Es sind dies die
Teilmengen
hn(1)− p = ([2], [3], …, [n − p], [n − p + 1]),
hn(2)− p = ([1], [3], …, [n − p], [n − p + 1]),
hn(n−−pp) = ([1], [2], …, [n − p − 1], [n − p + 1])
Hierfür werden die R̂ed p (hn − p ) berechnet.
Ist das Kleinste aller bisher berechneten
⎡
⎛ n − p ⎞ ⎤ ⎛ n − p + 1⎞
⎢1 + ⎜
⎥=
⎟⎠ , d. h.
1
⎝ 1 ⎟⎠ ⎦ ⎜⎝
⎣
⎧
⎫
⎛n − p ⎞
⎪
⎪
⎜⎝ 1 ⎟⎠
⎪⎪
⎪⎪
l
ˆ
ˆ
ˆ
h
h
Min ⎨Red
(
),
Min
[Red
(
)]
p n− p
p n − p ⎬ ≤ Red n − p ([n − p + 2]),
⎪
⎪
l =1
⎪
⎪
⎩⎪
⎭⎪
dann ist die Auswahl beendet und die zugehörige Teilmenge wird gestrichen.
Gilt dagegen
⎧
⎫
⎛n − p ⎞
⎪
⎪
⎜⎝ 1 ⎟⎠
⎪⎪
⎪⎪
l
ˆ
ˆ
ˆ
h
h
Min ⎨Red
(
),
Min
[Red
(
)]
p n− p
p n − p ⎬ > Red n − p ([n − p + 2]),
⎪
⎪
l =1
⎪
⎪
⎪⎩
⎪⎭
dann wird das Verfahren fortgesetzt. Hierzu wird die Teilmenge
hn − p + 2 = ([1], …, [n − p + 2])
gebildet. Aus dieser werden alle Teilmengen mit (n – p) Input- und Prozessvariablen, die alle
die [n – p + 2]-te Input- oder Prozessvariable beinhalten, gebildet. Für all diese Teilmengen
werden die Red’s berechnet. Ist das Kleinste aller bisher berechneten
1316han05.indd 324
25.07.2006 11:39:40
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
⎡
⎢1 +
⎣
325
⎛ n − p ⎞ ⎛ n − p + 1⎞ ⎤ ⎛ n − p + 2 ⎞
⎜⎝ 1 ⎟⎠ + ⎜⎝
⎟⎠ ⎥ = ⎜⎝
⎟⎠
2
2
⎦
R̂ed p (hn − p ) kleiner oder gleich R̂ed n −1([n − p + 3]) , dann hat man die optimale Teilmenge
gefunden und das Verfahren ist beendet.
Andernfalls ist das Verfahren wie bisher beschrieben fortzusetzen. In der q-ten Stufe müssten
⎡
⎛n − p ⎞
⎛ n − p + q − 1⎞ ⎤ ⎛ n − p + q ⎞
+…+ ⎜
⎢1 + ⎜
⎟
⎟⎠ ⎥ = ⎜⎝
⎟⎠
q
q
⎝ 1 ⎠
⎝
⎣
⎦
R̂ed p (hnl − p ) berechnet und mit R̂ed n −1([n − p + q]) verglichen werden. Da q = 1, …, n – p
⎛n ⎞
müssten im ungünstigsten Fall ⎜ ⎟ solche Teilmengenuntersuchungen durchgeführt werden.
⎝ p⎠
Satz: Dieser Algorithmus liefert das Minimum des unbedingten Vorhersagefehlers.
Beweis: siehe Jahn [1991b].
Empfehlungen
Insbesondere im Falle hoch multikollinearer Kovarianzmatrizen sind alle Berechnungen
im standardisierten Modell durchzuführen, d. h. auf der Basis der Korrelationsmatrix. Die
Rechenzeiten werden kürzer und die Ergebnisse wesentlich genauer.
Abbruch des Verfahrens:
Gilt sowohl
ˆ
ˆ
Red
p (hn − p ) > Red n −1 ([n − p + 1])
als auch
S p (hn − p ) > S p +1 (hn − p −1 ),
dann ist das Verfahren beendet und hn – p ist die zu streichende Teilmenge, die UN.n minimiert.
Gilt
ˆ
ˆ
Red
p (hn − p ) > Red n −1 ([n − p + 1])
aber
S p (hn − p ) ≤ S p +1 (hn − p −1 ),
dann ist das Verfahren in der 2. Stufe fortzusetzen. In dieser Stufe werden alle Teilmengen mit
n – p Input- und Prozessvariablen, die alle die [n – p + 1]-te Variable beinhalten, gebildet. Das
Verfahren kann nach der 2. Stufe abgebrochen werden, da der Rechenaufwand sehr hoch wird
und die Verbesserung minimal ist.
Bei sehr hoch multikollinearen Matrizen sollte das Verfahren eventuell nach der 1. Auswahl noch
einmal mit den verbleibenden wesentlichen Input- und Prozessvariablen neu gestartet werden.
1316han05.indd 325
25.07.2006 11:39:41
326
5 Qualität in der Fertigung
Beispiel 5.14.3: Chemischer Prozess. Red-Auswahlverfahren
Das obige Beispiel ist ein Modell mit stochastischen Input- und Prozessvariablen. Der
vollständige Ansatz mit n = 12 Prozessvariablen liefert das Ergebnis der Tabelle 5.14.5.
Tabelle 5.14.5: Prozessgleichung mit allen Prozessvariablen
Prozessvar.
Koeff.Proz.Gleich.
b0
X3
X4
X5
X6
X7
X9
X16
X17
X18
X19
X20
X21
–408,705
–0,63914
0,2013
1,92428
1,2744
–11,7229
0,32221
–0,094157
89,703117
–91,06
1,07785
3,53736
0,80203
t-Wert
–1,905
–0,75
0,385
0,1017
0,0742
–2,9449
5,3921
–0,1113
4,8434
–5,0647
2,2573
1,26999
3,38099
Irrtumswahrsch.
0,0598
0,455
0,701
0,919
0,941
0,00406
0
0,9116
0
0
0,0263
0,20719
0,001
Red(j)
0
0,0838
0,02208
0,00154
0,00082
1,2929
4,3345
0,001848
3,49726
3,82416
0,75965
0,24045
1,7041
Das Modell mit den wesentlichen Prozessvariablen ist in der Tabelle 5.14.6 enthalten.
Tabelle 5.14.6: Prozessgleichung mit den wesentlichen Prozessvariablen
Prozessvar.
Koeff.Proz.Gleich.
b0
X20
X19
X7
X21
X17
X18
X9
–367,637
3,14768
0,96515
–11,1443
0,75278
95,681
–97,11326
0,29609
t-Wert
–3,029
1,242
2,913
–4,6253
3,562
5,9554
–6,401
6,54563
Irrtumswahrsch.
0,00312
0,217
0,0044
0,00001
0,00057
0,0000
0,0000
0,0000
Red(j)
0,0000
0,2404
0,75965
1,2929
1,7042
3,4973
3,8241
4,33456
Die F-Statistik hat den Wert 32.956 mit der Irrtumswahrscheinlichkeit p = 2.662e–023. Das
vollständige wird mit dem reduzierten Modell anhand des Maßes der Beherrschbarkeit, des
Vorhersagefehlers und der bedingten Standardabweichung verglichen.
Tabelle 5.14.7: Vergleich des vollständigen und reduzierten Modells
Statistik
Reduziertes
Maß d. Beherrschbarkeit
0,7001
0,6976
Vorhersagefehler
3,9939
3,909
Bedingte Standardabw.
FG d. Residuen
1316han05.indd 326
Vollständiges
3,7633
95
3,779
100
25.07.2006 11:39:41
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
327
Der Vergleich mit den „klassischen“ Auswahlverfahren liefert uns die folgenden Resultate:
• Nach dem Red-Auswahlverfahren verbleiben 7 Prozessvariablen im Ansatz.
• Die wesentlichen Prozessvariablen nach dem Red-Verfahren sind X7, X9, X17, X18, X19,
X20 und X21. Die Prozessvariablen X3, X4, X5, X6, X16 werden als unwesentlich erkannt
und gestrichen.
• Die Rangfolge der wichtigen Prozessvariablen nach dem Red-Verfahren ist X[1] = X9,
X[2] = X18, X[3] = X17, X[4] = X21, X[5] = X7, X[6] = X19, X[7] = X20.
• Nach den „klassischen“ Verfahren verbleiben 5 Prozessvariablen im Ansatz.
• Die wesentlichen Prozessvariablen nach den „klassischen“ Verfahren sind X7, X9, X17, X18,
X19 und X21. Die Prozessvariablen X3, X4, X5, X6, X16 und X20 werden als unwesentlich
erkannt und gestrichen.
• Die Rangfolge ist: X[1] = X9, X[2] = X18, X[3] = X17, X[4] = X7, X[5] = X21, X[6] = X19.
• Die Rangfolgen unterscheiden sich.
• Die Maße der Beherrschbarkeit sind nach der klassischen Auswahl RY2 / p = 0.6929 und
nach der Red-Auswahl R2Y/p = 0.6976 unterscheiden sich.
• Die Reststandardabweichungen nach der klassisch Auswahl SY/X = 3.919 und nach der
Red-Auswahl sY/X = 3.779 unterscheiden sich.
Warum unterscheiden sich die „klassischen“ von dem Red-Auswahlverfahren?
Die Ursachen für die Ungleichheit der verschiedenen Verfahren sind:
• Bei den klassischen Verfahren werden alle n Einzelhypothesen des 1. Schrittes individuell,
nacheinander und nicht simultan geprüft, d. h. der Fehler 1. Art wird separat für jede
Einzelhypothese nach
P (Fˆ ≤ F / H ) = 1 − α
j
α
0. j
gewählt. Das ist nicht korrekt!
• Die univariaten einfachen Modelle E[Y] = βY/j Xj müssen nicht unbedingt „wahr“ sein. In
diesen Fällen ist Fˆj nichtzentral F verteilt mit 1 und (N – 1) FG. Die univariaten Modelle
müssen auch nicht unter Gültigkeit der H0.j richtig sein. Die Nichtzentralitätsparameter
sind unbekannt.
• Bei der k-ten Entscheidung werden bei den klassischen Verfahren die vorangegangenen
Entscheidungen nicht beachtet.
• Das Red-Auswahlverfahren basiert in natürlicher Weise auf der Verringerung der bedingten
Varianz (Restvarianz) durch Hinzufügen einer neuen Prozessvariablen, oder alternativ, auf
der Vergrößerung der bedingten Varianz durch Streichen einer Prozessvariablen.
• Die bedingte Varianz und die Tests werden unterschiedlich vom Grad der Multikollinearität
beeinflusst.
Nimmt der Unterschied zwischen den beiden Verfahren mit zunehmender Anzahl von
Variablen zu?
Zur Beantwortung dieser Frage betrachten wir das Beispiel des chemischen Prozesses mit einer
größeren Anzahl von Input- und Prozessvariablen.
1316han05.indd 327
25.07.2006 11:39:41
328
5 Qualität in der Fertigung
Beispiel 5.14.4: Chemischer Prozess. Vergleich von Reduktionsverfahren
Y1 sei wieder der Anteil der unerwünschten Substanz. Gegeben sind des weiteren p = 11
Input und n = 21 Prozessvariablen. Das Modell nach der schrittweisen Auswahl ist in der
Tabelle 5.14.8 enthalten.
Tabelle 5.14.8: Modell nach der schrittweisen Auswahl
Prozessgleichung
----------------------------------------------------------------------------Produktvariable: y1
----------------------------------------------------------------------------Standard
T
Parameter
Estimate
Error
Statistic
P-Value
----------------------------------------------------------------------------CONSTANT
32,7401
13,4005
2,4432
0,0164
x7
-6,31507
1,49519
-4,22359
0,0001
x11
-0,011167
0,00382231
-2,92152
0,0043
x17
5,07868
1,34843
3,76636
0,0003
x21
0,689957
0,12185
5,66233
0,0000
z1
0,752165
0,143026
5,25895
0,0000
z2
2,01531
0,631772
3,18994
0,0019
z3
0,0160964
0,00763823
2,10735
0,0377
z5
0,121066
0,0086293
14,0297
0,0000
z9
-0,0037483
0,00126582
-2,96116
0,0039
z11
0,000460799
0,000129713
3,55245
0,0006
----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source
Sum of Squares
Df Mean Square
F-Ratio
P-Value
----------------------------------------------------------------------------Model
4625,68
10
462,568
104,93
0,0000
Residual
427,621
97
4,40846
----------------------------------------------------------------------------Total (Corr.)
5053,3
107
R-squared = 91,5378 percent
R-squared (adjusted for d.f.) = 90,6654 percent
Standard Error of Est. = 2,09963
Mean absolute error = 1,48313
Durbin-Watson statistic = 1,41397
Die Red-Auswahl liefert das Modell in der Tabelle 5.14.9.
Der Vergleich des schrittweisen und des Red-Auswahlverfahrens liefert folgende Ergebnisse:
Nach dem schrittweisen Verfahren werden die Variablen
x1, x2, x3, x4, x5, x6, x8, x9, x10, x12, x13, x14, x15, x16, x18, x19, x20, z4, z6, z7, z10
gestrichen, nach dem Red-Auswahlverfahren werden die Variablen
x4, x5, x8, x12, x13, x14, x15, x16
gestrichen. Die Mengen der unwesentlichen, gestrichenen Variablen sind verschieden.
1316han05.indd 328
25.07.2006 11:39:42
329
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
Tabelle 5.14.9: Red-Auswahl
Value
Std.Error
t-value
Pr(>|t|)
Redn1
b0
2.027252e+002
2.243049e+002
0.90379
0.36872
0.00000000
z10
–6.204065e–004
5.822072e–004
–1.06561
0.28969
0.01659399
z4
1.954888e–001
1.817600e–001
1.07553
0.28525
0.03508154
x11
–2.643214e–002
1.165562e–002
–2.26776
0.02594
0.03583230
x6
–7.249619e+000
6.719864e+000
–1.07883
0.28379
0.03744574
v18
–2.017283e+001
1.669251e+001
–1.20850
0.23029
0.04066924
v19
3.563528e–001
2.197435e–001
1.62168
0.10867
0.04790650
x17
2.299280e+001
1.575657e+001
1.45925
0.14827
0.05208574
x1
1.117445e+000
6.533908e–001
1.71022
0.09096
0.05374786
z6
–1.495682e–002
1.464805e–002
–1.02108
0.31018
0.05745906
x7
–7.100759e+000
2.046982e+000
–3.46889
0.00083
0.05826068
z8
–3.658574e–001
2.529059e–001
–1.44661
0.15177
0.06943185
x3
–6.214773e–001
5.310112e–001
–1.17037
0.24520
0.07239814
z7
–5.642632e+001
3.649344e+001
–1.54620
0.12586
0.09617223
x9
2.859829e–001
1.464424e–001
1.95287
0.05421
0.09727591
x20
4.399184e+000
2.540006e+000
1.73196
0.08700
0.14827725
z2
1.457339e+000
6.175290e–001
2.35995
0.02062
0.16755061
z3
1.739045e–002
7.359728e–003
2.36292
0.02047
0.17278911
z11
9.192015e–004
3.210841e–004
2.86281
0.00531
0.19585702
x10
3.788326e–002
1.252605e–002
3.02436
0.00332
0.20522901
z9
–4.191362e–003
1.502543e–003
–2.78951
0.00655
0.23452021
x2
–5.915323e+000
2.305041e+000
–2.56625
0.01208
0.26927001
x21
6.039320e–001
1.607141e–001
3.75780
0.00032
0.28263726
z1
1.586419
0.38234719
4.14916
8e–005
0.5332058
z5
0.103754
0.01126534
9.21002
0e+000
1.2338190
F-Statistic: 51.6531840865295 with a p-value of: 3.16569470906557e–040
Statistic
Complete_Model
Red_Reduction
Rsquared
0.939247
0.9372484
UNn/UNp
4.093372
3.8205083
Sqrt_UNn/UNp
2.023208
1.9546121
307.002919
317.1021928
1.693867
1.7215028
RSS
syx/syp
Residual_df
1316han05.indd 329
75
83
25.07.2006 11:39:42
330
5 Qualität in der Fertigung
Die Rangfolge für das schrittweise Verfahren ist
Z5, X21, Z1, X7, X17, Z11, Z2, Z9, X11, Z3
und für das Red-Auswahlverfahren
Z5, Z1, X21, X2, Z9, X10, Z11, Z3, Z2, X20, X9, Z7, Z6, X1, X17, X19, X18, X6, X11, Z4 und Z10.
Die Rangfolgen sind verschieden.
Die Maße der Beherrschbarkeit (klassisch R2 = 0.915, Red R2Y/X = 0.937) sind verschieden.
Die Reststreuungen (klassisch s = 2.099, Red sY/X = 1.72) sind ebenfalls verschieden.
Wir wollen noch ein zweites Beispiel mit einer großen Anzahl von Input- und Prozessvariablen
betrachten, bevor ich meine Schlussfolgerungen ziehe.
Beispiel 5.14.5: Mikroelektronik. Red-Verfahren
Die Herstellung mikroelektronischer Schaltkreise ist kompliziert. Die Anzahl der verschiedenen Prozesse des Netzwerkes „Herstellung“ ist groß. Die Anzahl der Input- und
Prozessvariablen ist sehr groß.
Wir wollen hier die Ausbeute an mikroelektronischen Schaltkreisen für zwei Netzwerke
betrachten. Im 1. Netzwerk ist die Anzahl der Input- und Prozessvariablen n = 52. Der
Grad der Multikollinearität ist δ = 0.8 1058. Im 2. Netzwerk ist n = 45 und δ = 0.2 1027. Die
Ergebnisse der schrittweisen Verfahren, des Cp von Mollows und des Red Auswahlverfahrens
sind in der folgenden Tabelle zusammengestellt.
Tabelle 5.14.10: Ergebnisse der Auswahl nach dem schrittweisen und Red-Verfahren
n
S2Y/p
R2Y/p
UN, p
p
1. Netzwerk
vollständig
schrittweise
Red
52
0,0017
0,0051
0,0022
0,708
0,12
0,62
0,00404
0,0052
0,00306
2
25
2. Netzwerk
vollständig
schrittweise
Red
45
69,55
112,6
78,9
0,52
0,22
0,45
140,7
116,5
94,9
3
15
Diese Beispiele zeigen:
• Die schrittweisen Auswahlverfahren tendieren zu mächtigeren Auswahlmengen unwesentlicher Input- und Prozessvariablen, d. h. die Anzahl der wesentlichen Input- und
Prozessvariablen wird zu klein.
• Mit zunehmender Anzahl von Input- und Prozessvariablen werden die klassischen Verfahren schlechter, da bei diesen die Maße der Beherrschbarkeit zu klein und demzufolge
die Reststandardabweichungen zu groß werden.
• Mit zunehmenden Grad der Multikollinearität werden die klassischen Verfahren
schlechter, da die Reduktion der Dimension des Parameterraumes größer, ja sogar zu
groß wird.
1316han05.indd 330
25.07.2006 11:39:42
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?
331
Gibt es Tests zur Prüfung von Hypothesen über Redp(h)?
Ja. Zur Prüfung von Hypothesen über Redp(h) kann man den overall-F-Test, Varianzanalysen
oder Tests zur Prüfung der partiell multiplen Korrelationskoeffizienten verwenden.
Wir wollen die Tests im Einzelnen betrachten.
Test zur Prüfung der Hypothese über Redn – 1(j)
Aus der Darstellung [Re dn −1 ( j)]2 = BY2 . j / n − j ⋅ S 2j / n − j folgt, dass wir zur Prüfung der
H0: Redn – 1(j) = 0 gegen die Alternative H1: Redn – 1(j) ≠ 0 den F-Test in der Form
Red n −1( j) (N − n)
Fˆ =
SY2 / X
verwenden können. Ist Fˆ ≥ Fn ,N − n (a) , dann muss die H0 zugunsten der H1 verworfen werden. Dieser Test ist identisch mit dem F-Test zur Prüfung einer Einzelhypothese über einen
Koeffizienten BY.j/n – j der Prozessgleichung.
Tests zur Prüfung der Hypothese über Redp(h)
Zur Prüfung dieser Hypothese kann ebenfalls der F-Test verwendet werden.
Die Teststatistik ist
Fˆ (h) =
Red p (h) ⋅ (N − n)
(n − p) SY2 / X
=
(RY2 / X − RY2 / k ) ⋅ (N − n) BYT.h / k Shh / k BY .h / k (N − n)
=
.
(1 − RY2 / X ) ⋅ (n − p)
SY2 / X (n − p)
Ist Fˆ (h) ≥ Fn − p,N − n (α) , dann muss die H0 zugunsten der H1 verworfen werden.
Varianzanalytische Prüfung
Ausgangspunkt für diese Prüfung ist die Teilmengenregression
Y = βTY / k ⋅ X (k) + FY / k .
Die zu prüfende Hypothese lautet H 0(1) : βY / k = 0 .
Verlängert man den Vektor der Input- und Prozessvariablen X(k) durch Hinzufügen von
Komponenten aus X(h), die im Vektor X(u) zusammengefasst werden, wobei u = (u1, …, us),
u1 < … < us, s ≤ n – p, dann kann man prüfen, ob die Verkleinerung der Summe der Abweichungsquadrate um die Prozessgleichung durch Verlängerung des Vektors X(k) null ist. Dieser
Umstand wird durch die Hypothese
T
H(2)
0 : βY .u / k ⋅ Σ uu / k ⋅ βY .u / k = 0 = Red p (h)
abgebildet. Zur Prüfung dieser Hypothese wird die folgende Varianztabelle aufgebaut.
In dieser Tabelle bedeuten
−1
H p = X (k)T ⋅ A kk
⋅ X (k),
−1
H s = T T ⋅ ATT
⋅ T,
T = X (u) ⋅ (I − H p ),
ATT = T ⋅ T T
1316han05.indd 331
25.07.2006 11:39:42
332
5 Qualität in der Fertigung
Tabelle 5.14.11: Varianztabelle für die Prüfung der H0 über Redp(h)
Variationsursache
Summe der
Abweichungsquadrate
FG
F-Test
Prozessgleichung
in X(k)
Y ⋅ Hp ⋅ YT
p
Prozessgleichung
in X(k) und X(u)
Y ⋅ Hs ⋅ Y T
s
Fˆ1 =
Rest
Y ⋅ (I − H p − H s ) ⋅ Y T
N–p–s
F̂ (2)
Gesamt
Y ⋅ YT
Y ⋅ H p ⋅ Y T ⋅ (N − p)
Y ⋅ (I − H p ) ⋅ Y T ⋅ p
und somit
T ⋅ T T = A uu / k ,
so dass
Y ⋅ H s ⋅ Y T = R̂ed p ( j).
Fˆ1 ∼ Fp′,N − p (δ1 )
mit
δ1 =
βTY / k ⋅ A kk ⋅ βY / k
σY2 / k
.
Bei Gültigkeit der H0 gilt σY.k = 0 und damit ρY2 / k = 0 , δ1 = 0 und folglich
Fˆ1 ∼ Fp,N − p .
Bemerkungen
1. Die Teststatistik F1 kann man mit multiplen Korrelationskoeffizienten darstellen. Es gilt
2
R 2 ⋅ (N − p) χ p (δ1 ) ⋅ (N − p)
Fˆ1 = Y / k 2
=
∼ Fp′,N − p (δ1 ).
(1 − RY / k ) ⋅ p
χ2N − p ⋅ p
Für die Prüfung der zweiten Hypothese H(2)
0 wird die Statistik
X ⋅ H s ⋅ Y T ⋅ (N − p − s)
Fˆ (2) =
Y ⋅ (I − H p − H s ) ⋅ Y T ⋅ s
verwendet, wobei
Fˆ (2) ∼ Fs ,N − p − s (δ 2 )
1316han05.indd 332
25.07.2006 11:39:43
5.15 Unter welchen Umständen ist die Annahme der Linearität gerechtfertigt?
333
ist und
δ2 =
βTY .u / k ⋅ A uu / k ⋅ βY .u / k
σY2 / k ,u
.
Für die Gültigkeit der H(2)
0 ist auch diese F-Statistik zentral F verteilt mit den angegebenen
Freiheitsgraden.
2. Wegen der Darstellung
Red p (h) = ρY2 .h / k ⋅ σY2 / k
können zur Prüfung von Hypothesen über Redp(h) auch die Tests zur Prüfung von partiell
multiplen Korrelationskoeffizienten verwendet werden.
5.15
Unter welchen Umständen ist die Annahme der
Linearität gerechtfertigt?
Über die Voraussetzung der Linearität in den Modellen für die Prozessgleichung wird oft und
heftig gestritten. Wir wollen zur Schlichtung des Streits hier von dem Modell mit stochastischen
Input- und Prozessvariablen ausgehen. Für dieses Modell hatten wir vorausgesetzt, dass der
Vektor ZT = (XT, YT) der Input-, Prozess- und Produktvariablen entweder multivariat normalverteilt ist oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Beide Annahmen
sind praktisch relevant.
Im Glossar wurde die bedingte multivariate Normalverteilung mit dem bedingten Erwartungswert und der bedingten Varianz beschrieben.
Für den Vektor Z gilt unter den beiden Voraussetzungen
1
E [Y / X ] = μY + ΣYX Σ −XX
( X − μ X ).
Das ist eine lineare Funktion in X. Diese Funktion wird Regressionsfunktion genannt. Für die
bedingte Varianz gilt
1
var [Y / X ] = ΣYY − ΣYX Σ −XX
Σ XY =: ΣYY / X .
Dieser Ausdruck hängt nicht von X ab.
Damit kann man den für die Anwendungen wichtigen Charakterisierungsatz aufschreiben,
der einen Zusammenhang zwischen der Verteilungsvoraussetzung und der Linearität der
Regressionsfunktion präzisiert.
Wenn der bedingte Erwartungswert eine lineare Funktion in den Variablen unter Bedingung und
die bedingte Varianz unabhängig von X ist, dann ist die zugrunde liegende gemeinsame Verteilung eine Normalverteilung. Wenn die Verteilung von Z eine multivariate Normalverteilung ist,
dann ist der bedingte Erwartungswert eine lineare Funktion der Variablen unter der Bedingung
und die bedingte Kovarianz ist unabhängig von den Variablen unter der Bedingung.
Aus diesem Satz wird deutlich, dass der Streit entweder auf der Basis des Modells mit festen
Input- und Prozessvariablen oder akademisch geführt wird.
1316han05.indd 333
25.07.2006 11:39:43
334
5 Qualität in der Fertigung
5.16
Warum muss ein Prozess gesteuert werden und wie
können wir einen Prozess steuern?
Jeder, der sich in sein Auto setzt und die Absicht hat, loszufahren, überlegt sich vorher, wohin
er fahren und welche Strecke er benutzen will. Niemand startet sein Auto, macht die Augen
zu und fährt los! Das Ziel der Autofahrt entspricht dem Sollwert und die zu fahrende Strecke
– entweder über das Gebirge oder durch das flache Land – kann mit der Steuerung eines Prozesses verglichen werden. Was jeder mit seinem privaten Fahrzeug macht, kann er auch mit
den betrieblichen Prozessen tun.
In einem heuristisch, d. h. durch Erfahrung gesteuerten oder ungesteuerten Prozess sind
• die Streuungen der Input-, Prozess- und Produktvariablen in der Regel sehr groß,
• die Zielwerte für die Steuerung in Form von Sollwerten und Toleranzgrenzen in der Regel
nicht bekannt,
• der Ausschuss sehr hoch, die Kundenanforderungen werden nur mangelhaft erfüllt und
• die uni- und multivariaten Prozessfähigkeitsindizes sind in der Regel kleiner als 1.
Die Folge hiervon ist, der Prozess muss verbessert werden, um die Verluste durch mangelhafte
Qualität zu reduzieren. Das ist nur durch die statistische Prozessanalyse mit anschließender
Steuerung des Prozesses möglich.
Die statistische Prozessanalyse liefert uns hierfür die Prozessgleichung mit den wesentlichen
Input- und Prozessvariablen. Die Zielwerte und den Zielbereich für die Steuerung liefert uns
die statistische Tolerierung. In diesem Zusammenhang müssen wir darüber sprechen, dass die
Qualität des Prozesses notwendige Voraussetzung für die Qualität des Produktes ist.
Was ist die Qualität des Prozesses?
Die Qualität des Prozesses ist die Fähigkeit des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren, wobei die vorgegebenen Eigenschaften eines Produktes durch die
Sollwerte und Toleranzgrenzen für die Menge der nicht unabhängigen Produktvariablen spezifiziert werden. Die Produktion solcher Produkte (materielle Produkte oder Dienstleistungen)
erfordert, dass der dazu gehörende Prozess mit der Prozessgleichung in Richtung der Zielwerte
gesteuert wird, so dass die Werte für die Produktvariablen der produzierten Produkte in dem
durch die Toleranzgrenzen vorgegebenen Zielgebiet liegen.
Die Steuerung besteht nun im wesentlichen darin, solche Werte für die Input- und Prozessvariablen in die Prozessgleichung einzusetzen, die
• garantieren, dass die Werte für die Produktvariablen in dem gegebenen Zielgebiet liegen
und deren Mittelwerte mit den Sollwerten übereinstimmen,
• zu einer Verringerung der Variation der Produktvariablen von bislang ungesteuerten
Prozessen führen
• und somit simultan alle Kundenanforderungen erfüllt werden.
Die Frage ist nun nur noch,
Wie können wir diese Werte für die wesentlichen Input- und Prozessvariablen finden?
Für die Lösung stehen uns mindestens zwei Wege zur Verfügung.
1316han05.indd 334
25.07.2006 11:39:43
5.16 Warum und wie muss ein Prozess gesteuert werden?
335
Der 1. Weg führt auf die Berechnung der statistischen Sollwerte und Toleranzgrenzen für die
Input- und Prozessvariablen und der 2. Weg auf die Optimierung des gesamten Prozesses mit
den Methoden der linearen und nichtlinearen Optimierung (vgl. Kapitel 12).
Hauptsächlich befassen wir uns in diesem Kapitel mit dem 1. Weg, da uns dieser die Sollwerte
und Toleranzgrenzen für die Inputprodukte liefert. Und diese sind ja notwendige Voraussetzung
für die Realisierung der Kommunikation zwischen den Kunden und Lieferanten.
5.16.1
Statistische Tolerierung der Inputvariablen
Zuerst berechnen wir nach dem bekannten Verfahren der statistischen Tolerierung aus dem
Abschnitt 5.2 die statistischen Sollwerte und Toleranzgrenzen für die wesentlichen Inputvariablen unter der Bedingung, dass die Werte für die Produktvariablen vorgegeben sind. Danach
berechnen wir die Sollwerte und statistischen Toleranzgrenzen für die Prozessvariablen unter
der Bedingung, dass die Produkt- und Inputvariablen gegeben sind.
Mit einer vorliegenden Stichprobe berechnen wir die Inputgleichungen. Das sind Gleichungen,
in denen die Inputvariablen die abhängigen Zielvariablen sind und die Produktvariablen
als unabhängige Variablen fungieren. In diese Gleichungen setzen wir die Sollwerte und die
Toleranzgrenzen für die Produktvariablen ein, um die Sollwerte und Toleranzgrenzen für die
Inputvariablen zu berechnen.
Für all die Fälle, in denen keine Sollwerte und Toleranzgrenzen für die Produktvariablen
vorhanden sind, verwenden wir die Formeln der statistischen Tolerierung für die Produktund Inputvariablen und berechnen die statistischen Sollwerte und Toleranzgrenzen für die
Inputvariablen.
Die Berechnungen der statistischen Sollwerte und Toleranzgrenzen für die Input- und Prozessvariablen unter den entsprechenden Bedingungen werde ich an dem folgenden Beispiel
demonstrieren.
Beispiel 5.16.1: Chemischer Prozess. Statistische Tolerierung der Input- und
Prozessvariablen
Die statistischen Toleranzgrenzen wurden mit dem Prozessspezialisten abgesprochen,
geringfügig korrigiert und in der Tabelle 5.16.1 zusammengefasst.
Tabelle 5.16.1: Statistische Toleranzgrenzen für die Produktvariablen
Produktvariable
Untere Toleranz
Obere Toleranz
Y1
0
8
Y2
1680
1820
Y3
1902
1920
Y4
1546
1565
Y5
8000
10000
Y6
320
400
Mit den abgestimmten statistischen Toleranzgrenzen wurden die uni- und multivariaten
Prozessfähigkeitsindizes berechnet und in der Tabelle 5.16.2 zusammengestellt.
Die Prozessfähigkeiten sind kleiner als 1; der Prozess muss verbessert werden.
1316han05.indd 335
25.07.2006 11:39:43
336
5 Qualität in der Fertigung
Tabelle 5.16.2: Uni- und multivariate Prozessfähigkeitsindizes
Produktvariable
Cp
k
Cpk
Y1
0,194
3,82
–0,55
Y2
1,38
0,005
1,375
Y3
0,315
0,342
0,207
Y4
0,432
0,038
0,415
Y5
0,227
0,194
0,183
Y6
0,217
0,268
0,159
Multivariate Prozessfähigkeiten
MCp
0,65
MCpk
0,038
Die folgenden beiden Abbildungen enthalten die Star Plots für alle Input-, Prozess- und
Produktvariablen und nur für die Inputvariablen, da der Verdacht besteht, dass für die
Inputvariablen weder Sollwerte und Toleranzgrenzen berechnet, noch Eingangsprüfungen
vorgenommen wurden.
100
108
90
80
70
60
50
40
30
20
10
Abb. 5.16.1: Star Plots für die Input-, Prozess- und Produktvariablen
1316han05.indd 336
25.07.2006 11:39:44
5.16 Warum und wie muss ein Prozess gesteuert werden?
X9 X7
X11 X10
X17
337
X6
X3
X18
X2
X19
X1
X20
Y1
X21
Z11
Z1
Z10
Z2
Z9
Z3
Z4
Z5 Z6
Z7
Z8
Abb. 5.16.2: Schlüssel für die Star Plots
Die Star plots zeigen:
• die Streuungen für die einzelnen Variablen sind sehr groß; man vergleiche z. B. die Stars
55 und 104 miteinander,
• der Prozess zeigt ein gewisses „Atmen“, d. h. eine gewisse systematische Veränderung
bis zum Star 50 und dann eine ziemlich rigide Veränderung.
• Innerhalb der Gruppen gibt es aber auch noch sehr starke Veränderungen,
• die Produktvariable Y1 (unerwünschtes Nebenprodukt) kommt mal sehr selten, siehe
z. B. die Star Plots 86, 87, 49, 40 und ein anderes Mal sehr häufig vor, siehe z. B. die Star
Plots 90, 91, 10, …
100
90
80
70
60
50
40
30
20
10
Abb. 5.16.3: Star Plots für die Input- und Produktvariable Y1
1316han05.indd 337
25.07.2006 11:39:44
338
5 Qualität in der Fertigung
Da die Stars aufgrund der vielen Achsen (Variablen) schwer zu interpretieren sind, weil sowohl Input-, Prozess- und Produktvariablen dargestellt wurden, wollen wir noch die Inputund die Produktvariablen allein betrachten, um zu sehen, ob die Inputvariablen ebenfalls
stark streuen und diese Streuungen einen Einfluss auf die Produktvariable Y1 haben.
Z5
Z4
Z3
Z2
Z6
Z1
Z7
Z8
Y1
.
Z9
Z11
Z10
Abb. 5.16.4: Schlüssel für die Star Plots für die Input- und Produktvariablen Y1
100
0
50
T2
150
Interpretation der Star Plots für die Input- und die Produktvariablen
Die Inputvariablen schwanken sehr stark. Das Produkt kann daher gar nicht homogen sein,
oder anders gesprochen, das unerwünschte Nebenprodukt kommt mal vor und mal nicht.
Schauen Sie sich nur einmal die Plots mit den Nummern 49 und 91 an, dann sehen Sie die
gewaltigen Unterschiede. Beim Plot Nummer 91 kommt das unerwünschte Nebenprodukt
in hoher Konzentration vor. Beim Plot Nummer 40 kommt das Nebenprodukt praktisch
5
10
15
20
Abb. 5.16.5: Multivariate Kontrollkarte für das „Lieferantenprodukt“
1316han05.indd 338
25.07.2006 11:39:44
339
5.16 Warum und wie muss ein Prozess gesteuert werden?
überhaupt nicht vor. Schon hieraus muss man schließen, dass das unerwünschte Nebenprodukt im Herstellungsprozess entsteht und dass der Prozess so gesteuert werden kann,
dass das Nebenprodukt nicht mehr vorkommt. Die moderne Industrie muss nach meinem
Dafürhalten anders, präziser arbeiten.
Die multivariate Kontrollkarte für die Inputvariablen mit der berechneten Toleranzgrenze
für das Inputprodukt in der Abbildung 5.16.5 bestätigt unsere Vermutung hinsichtlich der
Inputvariablen, dass für diese nämlich keine Sollwerte und Toleranzgrenzen zu existieren
scheinen.
Das „Lieferantenprodukt“ sind die zusammengefassten Inputvariablen des chemischen
Prozesses. Die Abbildung zeigt ganz deutlich: Die meisten Werte der Teilstichproben liegen
oberhalb der Toleranzgrenze für das „Lieferprodukt“, d. h. die meisten Lieferantenprodukte
sind Ausschuss. Die Inputvariablen erfüllen offenbar keinerlei Vorgaben. Es muss etwas
getan werden.
Uni- und multivariater Prozessfähigkeitsnachweis für die Inputprodukte
Der Nachweis der simultanen Erfüllung der Kundenanforderungen bzgl. der Lieferantenprodukte (Menge der Inputvariablen) erfolgt über die Fähigkeiten der Tabelle 5.16.3.
Tabelle 5.16.3: Univariate Prozessfähigkeitsindizes
Inputvariable
untere
Toleranz
obere
Toleranz
Mittel
Stabw.
Cp
k
Z1
19,4
28,6
24,857
1,88
0,815
0,186
0,663
Z2
0,8
1,2
1,223
0,363
0,183
1,115
–0,021
40,136
0,249
0,161
0,209
0,0147
0,129
0,0128
Z3
100
Z4
0,3
160
0,4
134,85
0,3565
1,1326
Cpk
Z5
100
180
144,56
51,654
0,258
0,114
0,229
Z6
90
130
107,93
26,86
0,248
0,103
0,222
0,282
Z7
1,12
1,18
1,13
0,0118
0,846
0,667
Z8
9,22
10,78
9,749
0,962
0,27
0,32
0,183
0,135
0,142
0,116
Z9
1600
1780
1677,25
221,79
Z10
900
1000
905,68
1147,18
0,0145
0,886
0,0017
Z11
2500
3300
2991,58
2033,33
0,066
0,229
0,051
Die multivariaten Prozessfähigkeitsindizes sind
MCp = 0.3104
MCpk = 0.0372
Die uni- und multivariaten Prozessfähigkeitsindizes bestätigen die vorangegangene Vermutung. Sie sind viel kleiner als 1. Die Inputvariablen erfüllen nicht die Anforderungen.
Wie kann man die Werte für die wesentlichen Input- und Prozessvariablen finden, die auf
jeden Fall die genannten Ziele der Reduktion der Variation und der Übereinstimmung
von Mittel- und Sollwerten erfüllen?
1316han05.indd 339
25.07.2006 11:39:44
340
5 Qualität in der Fertigung
5.16.2
Berechnung der statistischen Sollwerte und Toleranzgrenzen für
die Inputvariablen unter der Bedingung der gegebenen Werte für
die Produktvariablen
Diese Berechnungen werden mit dem linearen Modell mit stochastischen Variablen realisiert, wobei die Inputvariablen als Zielgrößen fungieren und für die Produktvariablen die
Sollwerte und Toleranzgrenzen eingesetzt werden.
Die so zu berechnenden Gleichungen nennen wir Inputgleichungen.
Nach Diskussion und Abstimmung mit den Prozessexperten erhalten wir die Resultate in
Tabelle 5.16.4.
Tabelle 5.16.4: Statistische Sollwerte und Toleranzgrenzen für die Inputvariablen
Inputvariable
Sollwert
Z1
Z2
23,57
Z3
Z4
Z5
Z6
Z7
Z8
Z9
Z10
Z11
115,5
0,014
65,6
101,1
1,12
11,3
1867
733
2351
0,89
untere Toleranz
22,2
0,11
46,5
0
30,4
60,4
1,1
9,2
1511
633
1160
obere Toleranz
24,9
1,66
184,6
2,59
100,9
141,7
1,14
13,4
2223
933
3538
Berechnung der statistischen Toleranzen für die wesentlichen Prozessvariablen
Analog wie vorher werden Einstellgleichungen für die wesentlichen Prozessvariablen
berechnet. In diese werden die Sollwerte und Toleranzgrenzen für die Produktvariablen
und die abgestimmten statistischen Sollwerte und statistischen Toleranzgrenzen für die
Inputvariablen eingesetzt. Damit erhält man die Einstellwerte und zugehörigen statistischen
Toleranzgrenzen für die wesentlichen Prozessvariablen in Tabelle 5.16.5.
Die Kunden haben für die unerwünschte Produktvariable die obere Grenze (oG) für Y1
vorgegeben. Diese ist oG (Y1) = 8.00 [‰]. Die optimale Einstellung der Input- und wesentlichen Prozessvariablen für die Erreichung des Zieles: „die Werte von Y1 dürfen nicht größer
als 8 [‰] sein, sollten aber mehr in der Nähe der Null liegen“ ist durch die statistischen
Sollwerte und Toleranzgrenzen für die Prozessvariablen und die unter den Bedingungen
gegebener Produkt- und Prozessvariablen berechneten Sollwerte und Toleranzgrenzen für
die Inputprodukte gegeben.
Prozessgleichung für den gesteuerten Prozess
Nach der Steuerung mit der Prozessgleichung wurde eine neue Stichprobe gezogen. Die
erneute Berechnung der Prozessgleichung findet sich in Tabelle 5.16.6.
Nach der erneuten Red-Auswahl erhält man die noch einmal reduzierte Prozessgleichung
der Tabelle 5.16.7.
1316han05.indd 340
25.07.2006 11:39:44
5.16 Warum und wie muss ein Prozess gesteuert werden?
341
Tabelle 5.16.5: Statistische Toleranzgrenzen für die wesentlichen Prozessvariablen
Prozessvariable
X1
X2
X3
X6
X7
X9
X10
X11
X17
X18
X19
X20
X21
Sollwert
untere Toleranz
67,8
99,7
65,2
9,7
10
1130
1060
1500
2,6
2,7
36
38,6
25
66
99,2
63
9,5
9,4
1123
960
1400
2,5
2,6
30
38,1
17,8
obere Toleranz
69,6
100,3
67,4
9,9
10,6
1137
1160
1600
2,7
2,8
42
39,1
32,2
Tabelle 5.16.6: Prozessgleichung nach der Steuerung
Variable
bo
X1
X2
X3
X6
X7
X9
X10
X11
X17
X18
X19
X20
X21
Z1
Z2
Z3
Z4
Z5
Z6
Z7
Z8
Z9
Z10
Z11
1316han05.indd 341
Koeff.Proz.Gleich.
–273,416
0,32589
–1,08663
–0,20621
–0,595993
–1,36983
0,261945
0,114271
–0,0716
85,48145
–49,4267
0,114293
0,635618
0,167596
0,455685
1,633097
0,0121218
4,065848
0,068044
–0,01391
–18,1231
–0,385073
–0,006996
–0,00021174
0,0015124
Red(j)
0
0,00137
0,01091
0,002856
0,000465
0,0152204
0,0047759
0,010079
0,0073467
0,0024669
0,0015969
0,00582
0,007018
0,027981
0,026173
0,0080945
0,005202
0,002721
0,07361
0,00199
0,00493298
0,005596
0,011288
9,91 E–7
3,177 E–3
25.07.2006 11:39:45
342
5 Qualität in der Fertigung
Tabelle 5.16.7: Prozessgleichung nach der erneuten Red-Auswahl
Variable
Koeff.Proz.Gleich.
b0
X1
X18
Z6
X17
Z4
X3
Z11
X9
Z7
Z3
Z8
X19
X20
X11
Z2
X10
X2
Z9
X7
Z1
X21
Z5
–280,853
0,333204
–50,0706
–0,013221
87,2177
4,431869
–0,225889
0,0013754
0,259213
–18,15834
0,012232
–0,381648
0,11539
0,656262
–0,07158
1,601321
0,114915
–1,064585
–0,0072043
–1,470685
0,462309
0,173212
0,067565
Red(j)
0
0,001372
0,001596
0,001992
0,002466
0,002721
0,0028566
0,0031779
0,0047758
0,004932
0,005202
0,005596
0,00582
0,007019
0,007346
0,0080945
0,010079
0,010916
0,011288
0,01522
0,026173
0,027981
0,07361
Die erneute Red-Auswahl führte dazu, dass die beiden Variablen X6 und Z10 gestrichen
werden konnten. Das Maß der Beherrschbarkeit für die Prozessgleichung des gesteuerten
Prozesses ist mit RY2 / X = 0,9072 sehr hoch. Die bedingte Standardabweichung (Streuung
um die Prozessgleichung) ist sY/X = 0,369.
Die graphische Darstellung der Werte für Y1 vor und nach der Steuerung zeigt die Abbildung 5.16.6
50
y1(ungesteuert)
45
y1(gesteuert)
Anteil in ppm
40
35
30
25
20
15
10
5
0
1
51
101
151
201
Messwertsatz
Abb. 5.16.6: Werte für die Produktvariable Y1 vor und nach der Steuerung mit der Prozessgleichung
1316han05.indd 342
25.07.2006 11:39:45
5.16 Warum und wie muss ein Prozess gesteuert werden?
343
Die Prozessverbesserung ist enorm. Hinsichtlich der Mittelwerte beträgt die Verbesserung
ca. 450 %! Oder anders ausgedrückt, der Anteil des unerwünschten Nebenproduktes wird
auf ca. 1/5 reduziert.
Der Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen erfolgt
durch uni- und multivariate Prozessfähigkeitsindizes.
Tabelle 5.16.8: Univariate Prozessfähigkeiten für den gesteuerten Prozess
Produktvariable
Cp
k
Cpk
Y1
Y2
Y3
Y5
Y6
1,099
1,005
1,0086
1,0676
1,072
0,0048
0,0015
0,027
0,009
0,0113
1,094
1,003
1,004
1,0579
1,06
Die multivariaten Prozessfähigkeitsindizes sind
MCp = 1,182
MCpk = 1,173.
Das Maß der Beherrschbarkeit und die Prozessfähigkeitsindizes zeigen, dass der Prozess beherrscht wird und fähig ist, Produkte mit den geforderten Eigenschaften zu produzieren.
Die Inputvariablen erfüllen ebenfalls simultan die Anforderungen, wie die uni- und multivariaten Prozessfähigkeitsindizes der folgenden Tabelle zeigen.
Tabelle 5.16.9: Univariate Prozessfähigkeitsindizes für die Inputvariablen nach der Steuerung
Inputvariable
Cp
k
Z1
Z2
Z3
Z4
Z5
Z6
Z7
Z8
Z9
Z10
Z11
1,041
0,957
0,993
1,103
1,0778
1,0294
0,991
0,937
0,959
1,035
0,976
0,0075
0,025
0,0047
0,0056
0,0052
0,0055
0,0001
0,01
0,0073
0,0099
0,0008
Cpk
1,034
0,933
0,998
1,097
1,072
1,072
0,99
0,927
0,953
1,024
0,975
Die multivariaten Prozessfähigkeitsindizes für die Lieferantenprodukte sind
MCp = 1,027
MCpk = 1,017.
Auch die Lieferantenprodukte haben sich verbessert. Die Qualität der Lieferantenprodukte,
ausgedrückt durch die multivariaten Prozessfähigkeitsindizes ist geringfügig größer als 1,
kann also noch etwas verbessert werden.
Die uni- und multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die
Prozessvariablen sind in folgender Tabelle dargestellt.
1316han05.indd 343
25.07.2006 11:39:45
344
5 Qualität in der Fertigung
Tabelle 5.16.10: Univariate Prozessfähigkeitsindizes
Prozessvariable
X1
X2
X3
X6
X9
X10
X11
X17
X18
X19
X20
X21
Cp
0.38
0.84
0.619
1.11
0.20
0.12
0.12
0.05
0.049
1.31
0.937
0.98
k
0.025
0.083
0.026
0.11
0.4
0.003
0.11
0.12
0.18
0.097
0.048
0.12
Cpk
0.37
0.77
0.60
0.98
0.12
0.12
0.105
0.045
0.04
1.18
0.89
0.85
Die multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die Prozessvariablen sind
MCp = 0.9399
MCpk = 0.0798.
Die Einstellung der Prozessvariablen ist nicht in Ordnung. Mit den berechneten Einstellwerten für die Prozessvariablen erhält man die Fähigkeitsindizes der Tabelle 5.16.11.
Tabelle 5.16.11: Univariate Prozessfähigkeitsindizes für die Prozessvariablen
Prozessvariable
X1
X2
X3
X6
X9
X10
X11
X17
X18
X19
X20
X21
Cp
0.48
0.98
0.68
1.21
0.26
0.15
0.12
0.033
0.03
0.89
0.86
1.22
k
0.008
0.14
0.00
0.05
0.004
0.005
0.01
0.004
0.03
0.01
0.05
0.005
Cpk
0.48
0.84
0.68
1.15
0.26
0.15
0.12
0.03
0.03
0.88
0.81
1.22
Die multivariaten Prozessfähigkeitsindizes für die Prozessvariablen sind
MCp = 0.992
MCpk = 0.8226.
Die Qualität des Prozesses muss weiter verbessert werden. Die Zentrierung ist in Ordnung,
die Reduktion der Variabilität der Prozessvariablen ist nicht ausreichend. Die Entscheidung
muss aber das Management fällen, da die weitere Verbesserung Kosten verursacht.
1316han05.indd 344
25.07.2006 11:39:45
5.16 Warum und wie muss ein Prozess gesteuert werden?
345
0
1
2
T2
3
4
5
Die Verbesserung des Prozesses durch die Steuerung mit der Prozessgleichung kann durch
die multivariate Regelkarte für die „Produkte“ in Abbildung 5.16.7 sichtbar gemacht
werden. Auch die Verbesserung der Lieferantenprodukte durch die Steuerung des Lieferantenprozesses mit den berechneten Sollwerten und Toleranzgrenzen als Zielgebiet kann
visualisiert werden.
0
10
20
30
40
Abb. 5.16.7: Multivariate Kontrollkarte für die Produkte des gesteuerten Prozesses
3
0
1
2
T2
4
5
6
Alle Produkte liegen unterhalb der Toleranzgrenze für das Produkt. Der Prozess ist in Ordnung, d. h. die Produkte erfüllen simultan alle relevanten Kundenanforderungen.
Die multivariate Kontrollkarte für die Lieferantenprodukte ist in der Abbildung gegeben.
0
10
20
30
40
Abb. 5.16.8: Kontrollkarte für die gesteuerten Lieferantenprodukte
Bei dieser Karte liegen zwei Stichproben oberhalb der Kontrollgrenze. Der Lieferantenprozess muss noch weiter verbessert werden.
1316han05.indd 345
25.07.2006 11:39:45
346
5 Qualität in der Fertigung
5.17
Zusammenfassung der Produktvariablen
Welches Problem soll mit der Zusammenfassung gelöst werden?
Wiederholt habe ich darauf hingewiesen, dass
• ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben wird,
• sich die Produktvariablen mitunter bzgl. ihrer Zielstellung gegensätzlich verhalten, d. h. die
eine Produktvariable muss eventuell maximiert, die andere minimiert werden,
• der Prozess zur Herstellung eines Produktes aber nur nach dem Zielwert einer Produktvariablen gesteuert werden kann,
• die Steuerung nur mit einer optimalen Teilmenge von Input- und Prozessvariablen möglich
ist und
• nur mit einer optimalen Einstellung für die Input- und Prozessvariablen vorgenommen
werden kann.
Aus diesen Feststellungen folgt, dass für die Ermittlung der einen optimalen Teilmenge von
Input- und Prozessvariablen und die Berechnung der optimalen Einstellung, die Produktvariablen zusammengefasst werden müssen.
Diese Zusammenfassung kann natürlich nicht auf der Addition basieren, denn die Produktvariablen haben verschiedene Dimensionen und sind nicht unabhängig voneinander.
Wie können die verschiedenen Produktvariablen zusammengefasst werden?
Um diese Frage beantworten zu können, müssen wir einige Sachverhalte aus der Schätztheorie
wiederholen.
Es liege wieder eine Stichprobe X1, …, XN für den zufälligen Vektor XT = (X1, …, Xn) vor. Der
Vektor der Mittelwerte X T = ( X1 , …, X n ) ist n-dimensional normalverteilt mit dem Erwartungswert μT = (µ1, …, µn) und der Kovarianzmatrix N –1 Σ. Wir symbolisieren diese Tatsache
durch X ∼ N n (μ, N −1 Σ) .
Die Schätzfunktion N S ist Wishart verteilt mit den Verteilungsparametern Σ und N – 1, wobei
S die Stichprobenkovarianzmatrix bezeichnet. Die Wishart Verteilung ist eine multivariate
Verallgemeinerung der χ2 Verteilung. Diesen Sachverhalt kürzen wir durch die Symbolik
N S ~ Wn (Σ, N – 1) ab.
Analog wie im univariaten Fall gilt auch im multivariaten Fall, dass X und N S unabhängig
voneinander sind. Mit diesen Bezeichnungen gilt,
(N − 1) (X − μ)T S −1 (X − μ) = T 2 .
T2 bezeichnet die Hotelling Statistik und leistet genau das von uns Gewünschte. Wir verwenden
also die T2-Statistik für die Zusammenfassung der m, m ≥ 1 Produktvariablen zu einer neuen
univariaten Statistik in der Form
Ti2 = (X i − X)T S −1 (X i − X).
Die T2-Statistik von Hotelling ist die multivariate Verallgemeinerung des Quadrates der univariaten t2-Statistik.
1316han05.indd 346
25.07.2006 11:39:46
5.17 Zusammenfassung der Produktvariablen
347
Beispiel 5.17.1: Karosseriebau. Zusammenfassung der Produktvariablen
Die m = 14 nicht unabhängigen Produktvariablen Y1, …, Y14 werden zu „Produkten“ über
die T2-Statistik von Hotelling zusammengefasst. Die Werte für diese Statistik werden in
der Abbildung 5.17.1 dargestellt.
Produkte
80
60
40
20
0
0
40
80
120
160
200
240
Messwertsätze
Abb. 5.17.1: Produkte für die Karosserievariablen
Es ist, so glaube ich, sofort einzusehen, dass sich die univariaten T2i-Werte leichter einschätzen
lassen als die Matrix der m = 14 mal N Einzelwerte.
Große Werte können vorkommen, weil
• entweder ein Einzelwert für eine Produktvariable sehr groß wird oder
• die Werte für mehrere oder alle Produktvariablen an den Grenzen der statistischen
Konfidenzintervalle liegen.
Für die T2-Statistik gilt des weiteren
T2 ≥
(N − 1) n
Fn ,N − n (α).
N −n
Mit dieser Eigenschaft kann die T2-Statistik von Hotelling verwendet werden, um verschiedene
Hypothesen über den Vektor X bzw. X zu prüfen.
Außerdem gilt
E [(X i − X)T S −1 (X i − X)] = Sp {E [X i − X) (X i − X) S −1]] = n.
Diese Eigenschaft ist bei vielen praktischen Anwendungen nachteilig. So kann man aufgrund
dieser Eigenschaft die T2-Statistik nicht verwenden, um die Prozessverbesserung nachzuweisen,
indem man die Produktvariablen Y1, …, Ym vor und nach der Prozessverbesserung zu den
Produkten zusammenfasst.
Übung Kneterprozess
Probleme
In einem Unternehmen der Kunststoffindustrie gibt es Probleme mit den Knetern.
Die ex- und internen Kundenanforderungen sind nur in einem Lastenheft verbal hinterlegt.
Die Kunden der Kneterprodukte sind unzufrieden, können aber ihre Unzufriedenheit nicht
quantitativ belegen. Die Streuungen der einzelnen Produktvariablen sind nachweisbar zu groß.
Der Messwertaufwand ist für die vorliegenden Resultate zu hoch.
1316han05.indd 347
25.07.2006 11:39:46
348
5 Qualität in der Fertigung
Prozessbeschreibung
Die Inputprodukte werden durch k = 14 Inputvariablen, der Prozess wird durch n = 21 Prozessvariablen und die Produkte werden durch m = 16 Produktvariablen beschrieben.
Die Visualisierung einer Stichprobe von N = 155 Wertesätzen für die Produktvariablen liefert
die Star Plots der Abbildung 5.17.2. Diese bestätigen die großen Streuungen der einzelnen
Variablen. Die Stars variieren in ihrer Form sehr stark, zeigen aber auch gewisse periodische
Schwankungen, deren Ursache wir nicht kennen.
Die Zusammenfassung der Produktvariablen liefert die Abbildung 5.17.4.
Die Zusammenfassung der Inputvariablen liefert die Abbildung 5.17.5.
Der Vergleich der beiden Abbildungen zeigt einen deutlichen Zusammenhang zwischen den
Input- und Produktvariablen. Daraus folgt, dass die Ursache für das Problem in der Kommunikation zwischen dem Kunden- und Lieferantenprozess zu liegen scheint.
144
150
131
118
105
92
79
66
53
Abb. 5.17.2: Star Plots für die Kneterprodukte
1316han05.indd 348
25.07.2006 11:39:46
5.17 Zusammenfassung der Produktvariablen
MISCH05.Y5
349
MISCH05.Y4
MISCH05.Y7
MISCH05.Y2
MISCH05.Y8
MISCH05.Y1
MISCH05.Y10
MISCH05.Y12
MISCH05.Y14
Abb. 5.17.3: Schlüssel für die Star Plots
T-Squared
Multivariate Control Chart
30
25
20
15
10
5
0
UCL = 25,37
0
30
60
90
Observation
120
150
Abb. 5.17.4: Zusammenfassung der Produktvariablen
T-Squared
zusammengefasste Inputparameter
30
25
20
15
10
5
0
UCL = 20,38
0
30
60
90
Observation
120
150
Abb. 5.17.5: Zusammenfassung der Inputvariablen
Für die statistische Prozessanalyse habe ich für Sie eine Auswahl für die Input-, Prozess- und
Produktvariablen getroffen, damit Sie mit den beiliegenden Programmen arbeiten können.
Diese sind:
• zwei Rohstoffe, die durch Z13 und Z14 beschrieben werden,
• die drei Prozessvariablen
X4 Masse [kg]
X10 Drehzahl [U/min]
X12 Mischzeit [min]
und die beiden
1316han05.indd 349
25.07.2006 11:39:46
350
5 Qualität in der Fertigung
• Produktvariablen mit den Sollwerten und Toleranzgrenzen
Y9 Rheo Wert (Soll = 0,6, Tu = 0,59, To = 0,61)
Y12 Dichte (Soll = 1,05, Tu = 1,024, To = 1,076).
Führen Sie bitte eine umfassende statistische Prozessanalyse mit den Zwischenergebnissen
•
•
•
•
Definition des Problems,
Quantifizierung der Abhängigkeitsstruktur,
Berechnung der Prozessgleichungen,
Steuerung des Prozesses mit der Prozessgleichung
durch.
5.18
Kalibrierung
Die praktische Erfahrungen – nicht immer positiv – eines Labors zur Untersuchung von Bodenproben mit der DIN ISO 8466-2 „Kalibrierstrategie für nichtlineare Kalibrierfunktionen
zweiten Grades“, Auftraggebern und Gutachtern für die Verfahrensetablierung, veranlassten
uns, diesen Beitrag aufzunehmen.
Das Problem aus dem Zusammenspiel der Kombattanten besteht häufig in der Vorgabe einer linearen Kalibrierung durch die Verfahrensetablierung, obwohl der Sachverhalt nichtlinear ist.
Zur Lösung dieses Problems muss dafür Sorge getragen werden, dass obige Norm unbedingt
angewandt wird. Dazu sind einige Verbesserungen erforderlich, die wir im Folgenden diskutieren wollen.
Messwerte und Entscheidungen
Eine umweltbelastende Konsequenz der industriellen Ansiedlungen sind kontaminierte Böden.
Diese müssen gereinigt und in den Kreislauf zurückgeführt werden. Dazu sucht der Besitzer
des Bodens durch Ausschreibung einen Sanierer. Zur Konkretisierung der Ausschreibung und
für den Nachweis der simultanen Erfüllung aller relevanten Kunden – Besitzer und Gesetzgeber
– Anforderungen schaltet der Sanierer ein Labor und falls erforderlich einen Gutachter ein. Das
Labor ermittelt für die kontaminierten Böden nach einer entsprechenden Parametrisierung
die Istwerte für die festgelegten Variablen.
In diesem Zusammenhang ist die Kalibrierung von grundlegender Bedeutung, da die Konzentrationen bestimmter Substanzen nicht direkt gemessen werden können. Es lässt sich nur eine
Funktion Y (Kalibrierfunktion) der Konzentration X, Y = f(X) messen. Der Funktionstyp und
die Koeffizienten der Funktion sind unbekannt und müssen so genau wie möglich bestimmt
werden. Hierfür werden Daten für Standardproben gewonnen. Die Konzentration Xi wird
vorgegeben und die Funktion der Konzentration Yi, i = 1, …, N wird gemessen. Die Werte Yi
nennt man der Einfachheit halber Messwerte der Variablen. Bei den praktischen Problemen
gewinnt man die Messwerte Yi und will durch einen Umkehrschluss X = g(Y) die Konzentration
der Verbindung bestimmen. Die Funktion g(X) nennt man Analysefunktion.
Vom Kunden (Gesetzgeber, Besitzer, Weiterverwerter, …) werden die Anforderungen an den
weiter zu verwertenden Boden gestellt. Das Labor hat nach der Reinigung der Böden die
1316han05.indd 350
25.07.2006 11:39:47
5.18 Kalibrierung
Kundenanforderungen
Kundenanforderungen
351
Gesetzgeber
N
kontaminierter
Boden
Sanierung
Bodenvariablen
Prozessvariablen
gereinigter
Boden
E
J
Bodenvariablen
Verbringung
In den Kreislauf
zurückgeführt
Prozessvariablen
Bodenvariablen
Labor
Labor
Messwertermittlung
Messwertermittlung
Nachweis der Erfüllung
Nachweis der Erfüllung
Abb. 5.18.1: Netzwerk der Prozesse für die Bodensanierung
Werte für die Variablen erneut zu bestimmen und den Nachweis zu führen, dass simultan alle
relevanten Anforderungen durch den gereinigten Boden erfüllt werden. Das Zusammenspiel
der Prozesse und Verantwortlichen wird durch das abgebildete Netzwerk der Prozesse mit
Kommunikation dargestellt.
Nach dieser Abbildung sind die folgenden Fehlentscheidungen möglich:
Tabelle 5.18.1: Entscheidungen und Fehlentscheidungen
Entscheidungen
Boden
A Anforderungen nicht erfüllt
B Anforderungen erfüllt
kontaminiert
Ja
Fehlentscheidung 1
saniert
Fehlentscheidung 2
ja
Die Fehlentscheidung 1 besagt, dass ein kontaminierter Boden in den Kreislauf zurückkommt
und die Umwelt weiter schwer belastet. Durch das Zurückholen und erneute Reinigen des Bodens entsteht ein enormer Verlust für den Kunden. Die Fehlentscheidung 2 verlangt, dass ein
ausreichend sanierter Boden erneut saniert wird und daher ein Verlust für die Bodensanierer
entsteht.
Die Wahrscheinlichkeiten für Fehlentscheidungen müssen minimiert werden, um Verluste zu
vermeiden oder zumindest ebenfalls zu minimieren.
Hierfür stehen uns aber nur zwei Möglichkeiten zur Verfügung. Der erste Weg bedeutet Investitionen in neue Geräte. Der zweite Weg verlangt geistige Investition, um die Gesetzmäßigkeiten
der Sanierung und den simultanen Nachweis der Erfüllung aller relevanten Anforderungen im
Sinne der DIN ISO Norm zu erkennen und auszunutzen. Damit wird deutlich, dass der erste
Weg nur dann beschritten werden darf, wenn der zweite nicht mehr weiter führt, zumal in der
Regel die materiellen Investitionen ausgeschöpft sind.
1316han05.indd 351
25.07.2006 11:39:47
352
5 Qualität in der Fertigung
Beispiel 5.18.1: Kalibrierung. Linear
Für die Kalibrierung liegen die Messwerte M1 und die Konzentrationen vor. Die Darstellung
dieser Wertepaare enthält die Abbildung 5.18.2.
Werden die Punkte durch eine lineare Kalibrierfunktion angepasst, dann erhält man die
Abbildung 5.18.3.
Die Kalibriergerade hat die Koeffizienten
Y = M1 = b0 + bY/X X = –44611 + 1,36577 Konzentration.
Zur Beurteilung der Kalibrierfunktion werden das Quadrat des Korrelationskoeffizienten
rY2 / X = 0.9935 und die Reststandardabweichung SY/X = 37540 angegeben.
Der quadrierte Korrelationskoeffizient ist ein Maß für die lineare Abhängigkeit zwischen
den Messwerten Y und der Konzentration X und gibt an, zu wieviel Prozent die Varianz der
Messwerte Y durch die Konzentration erklärt wird. Dieser Koeffizient ist erfreulicherweise
überaus groß, d. h. ca. 99.3 % der Varianz der Messwerte werden durch die Konzentration
(X 100000)
15
12
M1
9
6
3
0
0
0,2
0,4
0,6
0,8
1
Konzentration
Abb. 5.18.2: Statistischer Zusammenhang zwischen den Messwerten M1 und den Konzentrationen
(X 100000)
15
12
M1
9
6
3
0
0
0,2
0,4
0,6
0,8
1
Konzentration
Abb. 5.18.3: Anpassung der Messwerte durch eine lineare Kalibrierfunktion
1316han05.indd 352
25.07.2006 11:39:47
5.18 Kalibrierung
353
erklärt. Die Reststandardabweichung ist die Standardabweichung der Messwerte um die
Kalibriergerade. Diese kann nach der einfachen Beziehung
SY2 / X = SY2 (1 − RY2 / X )
berechnet werden.
Die quadratische Kalibrierfunktion ist
Y = M1 + b0′ + bY′ / X X + bY′ / XX X 2 = 6398,8 + 991257 Konz + 383015 Konz 2
Das Quadrat des (in diesem Falle multiplen) Korrelationskoeffizienten ist
RY2 / X = 0.9987.
Würde man aufgrund des Korrelationskoeffizienten entscheiden, ob die lineare Kalibrierung
ausreichend ist, so würde man – wie so häufig – entscheiden, dass die lineare Kalibrierung
ausreicht. Aber berechnet man die Reststandardabweichung, dann erhält man den Wert
SY/X = 16325.
Das ist eine Verbesserung von mehr als 220 %!
Die Darstellung der quadratischen Kalibrierfunktion ist in der Abbildung 5.18.4 zu sehen.
(X 100000)
15
12
M1
9
6
3
0
0
0,2
0,4
0,6
0,8
1
Konzentration
Abb. 5.18.4: Quadratische Kalibrierfunktion mit dem 95 % Konfidenzintervall
Auswirkungen des linearen und quadratischen Ansatzes auf die Kalibrierfunktion
Für die Bestimmung der unbekannten Konzentration einer Substanz wird die Analysefunktion
X =g(Y) verwendet. Diese Funktion wird in den verschiedenen Standards als Umkehrfunktion
der Kalibrierfunktion bestimmt. Das ist nicht zulässig, da der Zusammenhang zwischen den
Messwerten M1 und der Konzentration stochastisch und damit nicht eineindeutig ist. Es ist
besser allgemein anzunehmen, dass
(Y, X) ~ N2(µ, Σ),
wobei µT = (µY, µX) und
⎛ σY2
Σ=⎜
⎝
1316han05.indd 353
σYX ⎞
⎟.
σ 2X ⎠
25.07.2006 11:39:47
354
5 Qualität in der Fertigung
Da zu Beginn der Analysen alles unbekannt ist, verwendet man Standardproben und bestimmt
hierfür für vorgegebene Konzentrationen die Messwerte.
Unter dieser Annahmen kann man mit derselben Methode und denselben Werten die Analysefunktion X = g(Y) bestimmen.
Mit dieser Funktion kann der Nachweis über das Vorhandensein einer Verbindung geführt
werden. Darüber hinaus kann aber auch die Konzentration (Gehalt) einer Verbindung bestimmt werden.
Die Chemiker sind an weiteren Charakteristika interessiert. Zu diesen gehören der kritische
Wert einer Messgröße, die Nachweisgrenze, die Erfassungsgrenze und die Bestimmungsgrenze. Diese Charakteristika hängen natürlich ganz stark vom Kurventyp der Kalibrier- bzw.
Analysefunktion ab und können daher auch als Entscheidung für den einen oder anderen
Funktionstyp dienen.
Der kritische Wert der Messgröße Y weist darauf hin, dass mit vorgebbarer Wahrscheinlichkeit
die Substanz vorhanden ist.
Der kritische Wert muss berechnet werden. Als Modell wird die Breite des „Prognoseintervalls“
an der Stelle X = 0 (Konzentration ist gleich null) verwendet.
Für den Vergleich der verschiedenen Typen der Kalibrierfunktion werden die Prognosevarianz
und damit die Prognoseintervallbreite für den linearen und quadratischen Fall berechnet.
Für die lineare Kalibrierfunktion erhält man aus den Berechnungen die Schätzung für die
Prognosevarianz
v̂ar [Yˆ ( X E )] = SY2 / X
⎛
⎞
⎜
2 ⎟
1
(X − X )
⎜1 +
⎟
+ N E
N
⎜
2⎟
∑ (Xi − X ) ⎟⎠
⎜
⎝
i =1
und damit die halbe Breite des Prognoseintervalls
1
( X − X )2
YˆE + t FG,α ⋅ SY / X ⋅ 1 +
+ N E
.
N
2
∑ ( Xi − X )
i =1
In diesen Darstellungen ist XE die Konzentration für die man die Prognose berechnen möchte
und YˆE = Yˆ ( X E ) .
Für die quadratische Kalibrierfunktion gilt
1
⎡
⎤
−1
v̂ar (YˆE ) = SY2 / X ⎢1 +
+ ( X E − X )T AXX
( X E − X )⎥
N
⎣
⎦
und damit
1
−1
YˆE + t FG,α ⋅ SY / X ⋅ 1 +
+ ( X E − X )T AXX
(X E − X ) .
N
1316han05.indd 354
25.07.2006 11:39:48
5.18 Kalibrierung
355
Beispiel 5.18.2: Kalibrierung. Vorhersageintervall
Für die lineare Kalibrierfunktion erhält man das Prognoseintervall für die Stelle XE = 0
1
( X − X )2
YˆE + t FG,α ⋅ SY / X ⋅ 1 +
+ N E
= −44611 ± 97845,
N
2
∑ ( Xi − X )
i =1
d. h. die halbe Breite des Prognoseintervalls ist 97845.
Der kritische Messwert für die lineare Kalibrierfunktion ist
Yk = b0 + t FG,α ⋅ SY / X ⋅ 1 +
1
+
N
X2
N
∑
i =1
= −44611 + 97845 = 53234.
( Xi − X )2
Für die quadratische Kalibrierfunktion erhalten wir
1
−1
YˆE + t FG,α ⋅ SY / X ⋅ 1 +
+ ( X E − X )T AXX
( X E − X ) = 6398.8 ± 44542
N
d. h. die halbe Breite des Prognoseintervalls 44542 ist sehr viel kleiner als bei der linearen
Kalibrierfunktion.
Der Wert Yˆ ( X E = 0) entspricht dem Wert b0 in den Kalibrierfunktionen.
Der kritische Messwert für die quadratische Kalibrierfunktion ist
Yk = b0 + t FG,α ⋅ SY / X ⋅ 1 +
1
−1
+ ( X E − X )T AXX
( X E − X ) = 6398 + 44542
N
= 50940.
Beispiel 5.18.3: Nachweisgrenze
Die Nachweisgrenze ist die Konzentration, die dem kritischen Wert des Messwertes entspricht.
Im linearen Fall erhält man für die Funktion X = g(Y) die halbe Breite des Prognoseintervalls
1
(Y − Y )2
Xˆ E + t FG,α ⋅ S X / Y ⋅ 1 +
+ N E
N
∑ (Yi − Y )2
i =1
und damit die Nachweisgrenze
X NG = t FG,α ⋅ S X / Y ⋅ 1 +
(Y − Y )2
1
+ N k
= 0.069987.
N
2
(
)
Y
−
Y
∑ i
i =1
1316han05.indd 355
25.07.2006 11:39:48
356
5 Qualität in der Fertigung
Im quadratischen Fall erhält man
1
−1
Xˆ E = b0′ + t FG,α ⋅ S X / Y ⋅ 1 +
+ (YE − Y )T AYY
(YE − Y )
N
und die Nachweisgrenze
1
−1
+ (YE − Y )T AYY
(YE − Y ) = 0.05696.
N
X NG = t FG,α ⋅ S X / Y ⋅ 1 +
Die Nachweisgrenze für den quadratischen Ansatz liegt ungefähr bei nur 80 % des linearen
Ansatzes.
Beispiel 5.18.4: Erfassungsgrenze
Diese Grenze bezeichnet die kleinste Konzentration bei der mit vorgebbarer Wahrscheinlichkeit der Nachweis der Substanz möglich ist.
Für den linearen Fall erhält man für die vorgebbare Wahrscheinlichkeit β = α die Erfassungsgrenze
X EG = X NG + t FG,α ⋅ S X / Y ⋅ 1 +
(Y − Y )2
1
+ N k
= 0.1399.
N
2
∑ (Yi − Y )
i =1
Für den quadratischen Fall gilt
X EG = X NG + t FG,α ⋅ S X / Y ⋅ 1 +
1
−1
+ (YE − Y )T AYY
(YE − Y ) = 0.11392.
N
Beispiel 5.18.5: Bestimmungsgrenze
Für diese Grenze muss die relative Ergebnisunsicherheit, die sich aus der halben Breite des
Prognoseintervalls für die Konzentration X und der Bestimmungsgrenze XBG sowohl für
den linearen
t FG,α ⋅ S X / Y ⋅ 1 +
1
+
N
(Yi − Y )2
N
∑ (Yi − Y )2
i =1
X BG
=
ΔX BG
= Vr (lin)
X BG
als auch quadratischen Fall
t FG,α ⋅ S X / Y ⋅ 1 +
1
−1
+ (Yi − Y )T AYY
(Yi − Y )
ΔX BG
N
=
= Vr (quad)
X BG
X BG
ergibt, bestimmt werden. Dieser Quotient soll nun mit vorgegebener Wahrscheinlichkeit
α einen vorher definierten Wert k annehmen, z. B. k =3. Symbolisch kann man hierfür
schreiben P (Vr ≥ k) = α.
1316han05.indd 356
25.07.2006 11:39:48
5.18 Kalibrierung
357
In die Formeln für die Prognoseintervalle muss anstelle des beliebigen Messwertes Yi der
Messwert an der Stelle der Bestimmungsgrenze eingesetzt werden. Dieser Wert ist aber unbekannt. Folglich müsste man ein approximatives Verfahren entwickeln oder eine Schätzung
einsetzen. Als Schätzung wird nach dem HBU Standard der Wert YBG = k ΔYBG verwendet.
Hierfür gilt P (ΔXBG ≥ k XBG) = α.
Formt man nun die Quotienten Vr um, dann erhält man für den linearen Fall die Bestimmungsgrenze
X BG = k ⋅ t FG,α ⋅ S X / Y ⋅ 1 +
1 (k ⋅ YNG − Y )2
+ N
= 0.167822
N
2
∑ (Yi − Y )
i =1
bzw. für den quadratischen Fall die Grenze
X BG = k ⋅ t FG,α ⋅ S X / Y ⋅ 1 +
1
−1
+ (k ⋅ YNG − Y )T AYY
(k ⋅ YNG − Y ) = 0.065005.
N
Auch hier sieht man wieder die Verbesserung um ca. 250 % beim Übergang vom linearen
zum quadratischen Ansatz.
Schlussfolgerungen
Wenn der Zusammenhang zwischen der Konzentration und dem Messwert nichtlinear ist, dann
muss mit der nichtlinearen Kalibrierfunktion gearbeitet werden, da ansonsten der Verlust an
Genauigkeit (Reststandardabweichung) zu groß wird und damit der kritische Messwert, die
Nachweis-, Erfassungs- und Bestimmungsgrenzen zu ungenau – ebenfalls zu hoch – bestimmt
werden. Die Verschlechterungen können in der Regel nicht durch die materielle Investition in
Geräte aufgefangen werden und sind außerdem sehr teuer.
Die DIN ISO Norm 8466-2: 2000-09 sollte mit den hier vorgestellten Verfahren vervollständigt werden, damit das Konfliktpotential bei der Ausschreibung zwischen den Kombattanten
im Sinne einer klaren Entscheidung aufgrund eindeutiger statistischer Ergebnisse reduziert
werden kann.
In diesem Zusammenhang sollten auch die Konfliktpotentiale, die auf der Bestimmung der
Kalibrierfunktion mit Wiederholungen und der Rekalibrierung basieren, diskutiert und beseitigt werden.
1316han05.indd 357
25.07.2006 11:39:49
1316han05.indd 358
25.07.2006 11:39:49
Herunterladen