Grundlagen der Zuverlässigkeitstechnik Ziele, Methoden & Begriffe: • Ausfallwahrscheinlichkeit F ( t ) : Lebensdauer erreicht bestimmte Betriebsdauer nicht • Überlebenswahrscheinlichkeit R ( t ) = 1 − F ( t ) • Ausfalldichte: f ( t ) = dF ( t ) dt • Ausfallrate: λ ( t ) = f ( t ) R ( t ) • Zuverlässigkeit (Reliability): Betrachtungseinheit führt geforderte Funktion für festgelegte Zeitdauer ausfallfrei aus • Zuverlässigkeitsfunktion: R ( t ) = 1 − F ( t ) • Mean Time Between Failures (MTBF): MTBF = 1 λ • Verfügbarkeit v ( t ) : Wahrscheinlichkeit, dass Einheit zu vorgegebenem Zeitpunkt der geforderten Anwendungsdauer funktionsfähig ist (nicht reparierbar: v ( t ) = e − λt ) • Nichtverfügbarkeit: n ( t ) = 1 − v ( t ) • • • • • • Anforderungsprofil: Spezifische Aufgabe, während bestimmter Zeit, unter bestimmten Bedingungen Anwendungsdauer: Zeitspanne nach der Betrachtungseinheit aus dem Betrieb genommen wird Ausfall: Beendigung der Fähigkeit geforderte Funktion auszuführen Betrachtungseinheit: Anordnung von Bauteilen, Geräten, Anlagen,... die als Einheit betrachtet werden Burn-in: Betrieb unter erhöhten Beanspruchungen, um Ausfall zu beschleunigen Concurrent Engineering: Systematisches Vorgehen zur parallelen Entwicklung einer Betrachtungseinheit und der Fertigungsprozesse für ihre Produktion • Konfigurationsmanagement: Verfahren zur Festlegung, Beschreibung, Prüfung, Genehmigung der Konfiguration einer Betrachtungseinheit • Defekt: Abweichen mindestens einer Eigenschaft von den festegelegten Anforderungen • Run-in (Einlaufen): Betrieb unter normalen Beanspruchungen Æ Fertigungsfehler • Geforderte Funktion: Anforderungen an Betrachtungseinheit (Sollwert, Toleranzen) • Instandhaltbarkeit: Zeitaufwand für Wartung kleiner als vorgegebenes Zeitintervall • Instandsetzung: Aktivitäten zur Wiederherstellung des Sollzustandes • Lebensdauer: Zeitintervall zwischen Beanspruchungsbeginn und Ausfallzeitpunkt • Lebenslaufkosten: Kosten für Anschaffung, Betrieb, Instandhaltung, Ausscheidung • Operationelle Verfügbarkeit (Dependability): Zuverlässigkeit, Verfügbarkeit, Instandhaltbarkeit,... • Qualität: Eignung zur Erfüllung gegebener Erfordernisse • Qualitätsdatensystem: System zur Erfassung, Analyse, Korrektur aller Defekte/Ausfälle • Qualitätssicherung: Maßnahmen um gefordertes Qualitätsniveau sicherzustellen • Redundanz: Nicht nur Vervielfachung schwacher Systemteile (Unterscheidung in Heiße/Warme/KalteRedundanz) • Risiko: Wahrscheinlichkeit für Auftreten bestimmter Schäden in bestimmter Zeiteinheit • Sicherheit: Eigenschaft, Menschen/Sachen/Umwelt nicht zu gefährden • Störung: Geforderte Funktion wird nicht oder nur noch unvollständig erfüllt • System: Zusammenfassung von Mitteln zur autonom. Erfüllung eines Aufgabenkomplexes • Systematischer Ausfall: Ausfall durch Fehler in der Entwicklung/Fertigung/Nutzung • Unsicherheit: (Aleatorische Unsicherheit, Epistemische Unsicherheit) • Unterlastung: Nichtausnutzung der max Belastbarkeit um Ausfallrate zu verringern • Vorbehandlung: Folge von Beanspruchungen um Frühausfälle zu provozieren • Wartung: Erhaltung des Sollzustands einer funktionstüchtigen Betrachtungseinheit • Zuverlässigkeitstechnik: Verfahren und ‚Regeln der Kunst’, Systeme zuverlässig zu machen • Zuverlässigkeitswachstum: Erhöhung der Zuverlässigkeit durch Behebung von Entwicklungs- und Fertigungsmängeln Copyright by ~Gesus~ Stand: 19.07.2006 1/21 Einflüsse auf Zuverlässigkeit: • Qualität bei der Herstellung • Alterung/Verschleiß • Umgebungsbedingungen • Instandhaltung • Nutzungsdauer Kosten für Zuverlässigkeit: Mathematische Grundlagen (Probabilistik): Venn-Diagramme (Mengendiagramme): Vereinigungsmenge (vereinigt) A∪ B Schnittmenge (geschnitten) A∩ B Gegenereignis (A nicht) A De Morgan: A ∩ B = A ∪ B, A ∪ B = A ∩ B A ∩ B = Φ A und B sind unvereinbar (disjunkt) P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) A ⊆ B : ⇒ P ( A) ≤ P ( B ) P ( B − A) = P ( B ) − P ( A) A impliziert B Ereignis A A A Ω Gegenereignis von A A A Ω Sowohl A als auch B A∩ B Ω A∪ B Ω A B A B Mindestens eines der beiden Ereignisse Keines der beiden Ereignisse A∪ B Ω A B Höchstens eines der Ereignisse A∩ B ( Ω ) ( A∩ B ∪ A∩ B ) A∩ B = Φ Copyright by ~Gesus~ A B Genau eines der beiden Ereignisse Ω A B A und B sind disjunkt Ω A B Stand: 19.07.2006 2/21 Wahrscheinlichkeit: Laplace-Experiment: P = Anzahl günstige Fälle Fläche A = Anzahl alle Fälle Flaäche Ω Bedingte Wahrscheinlichkeit: P ( Aj | B ) = Kombinatorik: Stichproben vom Umfang n aus {1...N } mit Beachtung der Reihenfolge ohne Beachtung der Reihenfolge k : Anzahl der ausgewählten Elemente P ( B | Aj ) ⋅ P ( Aj ) P ( B) j = 1,...k n : Anzahl der möglichen Experimente mit Zurücklegen ohne Zurücklegen nk n! ( n − k )! unterscheidbare Elemente ⎛n⎞ n! =⎜ ⎟ ( n − k )!⋅ k ! ⎝ k ⎠ ununterscheidbare Elemente ohne Mehrfachbelegung Verteilung von n Elementen auf N Zeilen ⎛ n + k − 1⎞ ⎜ ⎟ ⎝ k ⎠ mit Mehrfachbelegung Diskrete Verteilungen: Binomialverteilung: ⎛n⎞ n−k P = ⎜ ⎟ p k (1 − p ) ⎝k ⎠ Multinomialverteilung: Wahrscheinlichkeit in n Teilversuchen insgesamt k1 mal das Ergebnis 1 ,… und kr mal das Ergebnis r zu erhalten: n! p1k1 ⋅ ... ⋅ p1kr k1 !⋅ ... ⋅ kr ! Geometrische Verteilung: Wahrscheinlichkeit den ersten Erfolg genau im k -ten Versuch zu erhalten. P ( k ) = p ⋅ q k −1 ⎛ S ⎞⎛ N − S ⎞ ⎜ ⎟⎜ ⎟ s w ⎠ h ( s, n, N , S ) = ⎝ ⎠ ⎝ ⎛N⎞ ⎜ ⎟ ⎝n⎠ n⋅ p = λ Hypergeometrische Verteilung: Stichprobe enthält genau s schwarze und ( n − s ) weiße Kugeln. N = S + W Poisson-Verteilung: ⎛ 1 ⎞⎛ 2 ⎞ ⎛ k − 1 ⎞ 1 − ⎟" ⎜1 − n ⎜1 − ⎟ k ⎛n⎞ k λ ⎛ λ ⎞ ⎝ n ⎟⎜ n−k n⎠ ⎝ n ⎠ ⎠⎝ − P = ⎜ ⎟ p (1 − p ) = 1 ⎜ ⎟ k k! ⎝ n ⎠ ⎛ λ⎞ ⎝k ⎠ ⎜1 − ⎟ ⎝ n⎠ Parameter diskreter Verteilungen: Copyright by ~Gesus~ Stand: 19.07.2006 3/21 Kontinuierliche Verteilungen und Grenzwertsätze: Dichte: f ( x ) = dF ( x ) dx +∞ ∫ f ( x ) dx = 1 −∞ x Verteilungsfunktion: F ( x ) = f ( z ) dz ∫ Erwartungswert: E ( g ( X ) ) = −∞ +∞ b Î P ([ a, b ]) = ∫ f ( z ) dz a ∫ g ( x ) f ( x ) dx Î E(X ) = −∞ Moment k-ter Ordnung: E ( X +∞ k )= ∫ x k +∞ ∫ x ⋅ f ( x ) dx −∞ ⋅ f ( x ) dx k >1 −∞ Exponentialverteilung: Ausfallrate: λ = h ( t ) = − 1 dR ( t ) ⋅ R ( t ) dt Zuverlässigkeitsfunktion: R ( t ) = e − λt Erwartungswert (MTBF): Θ = 1 λ F ( t ) = 1 − R ( t ) = 1 − e − λt ∞ = ∫ t ⋅ λ ⋅ e − λt dt 0 Normalverteilung, Gauß-Verteilung: 1 ⎛ x−μ ⎞ σ ⎟⎠ Als Näherung der Binomialverteilung : μ = n⋅ p 2 − ⎜ 1 ⋅ e 2⎝ Dichte: f ( x ) = σ 2π Transformation: z = x−μ σ = n⋅ p⋅q 1 − z2 1 Î Standardnormalverteilung: f ( z ) = ⋅e 2 2π σ σ '= σ 1 Φ ( z) = 2π n z ∫e 1 − ξ2 2 dξ −∞ Logarithmische Normalverteilung: 1 ⎛ ln x + ln λ ⎞ ⎧ 1 − ⎜ ⎟ ⎪ e 2 ⎝ σ ⎠ für x ≥ 0 f ( x ) = ⎨σ x 2π ⎪ für x < 0 ⎩0 2 ⎛ ln ( λ x ) ⎞ F ( x) = Φ ⎜ ⎟ ⎝ σ ⎠ μ σ → Normalverteilung Gammaverteilung: α −1 − λ x ⎧ λ für x ≥ 0 ⎪Γ α (λ x) e f ( x) = ⎨ ( ) ⎪0 für x < 0 ⎩ ∞ Γ (α ) = ∫ xα −1e − x dx 0 Weibull-Verteilung: ⎛x⎞ ⎧α −⎜ ⎟ α −1 ⎝ β ⎠ ⎪ x e f ( x) = ⎨ β α ⎪ ⎩0 α Copyright by ~Gesus~ α : Gestalt-Parameter β : Maßstab-Parameter α ⎛t ⎞ −⎜ ⎟ ⎝β⎠ für x ≥ 0 R (t ) = e für x < 0 ⎧ −⎛⎜ t −γ ⎞⎟ ⎪ β R ( t ) = ⎨e ⎝ ⎠ für t ≥ γ ⎪⎩ 1 für 0 ≤ t ≤ γ Stand: 19.07.2006 α 4/21 χ 2 -Verteilung: F ( x) = ν x −1 − 1 2 2 x ⋅ e dx ν ν ⎞ ∫0 2 ⎛ 2 Γ⎜ ⎟ ⎝2⎠ x Quantile der χ 2 -Verteilung: Parameter kontinuierlicher Verteilungen: Copyright by ~Gesus~ Stand: 19.07.2006 5/21 Methoden der mathematischen Statistik: Schätzfunktionen (Schätzer): Punktschätzungen: Aufgrund einer Reihe von Beobachtungen eines Zufallsphänomens Aussagen über den unbekannten Wert eines unbekannten Parameters treffen. Dem unbekannten Paramter eine Zahl zuordnen, die als bester Näherungswert angesehen werden kann. Æ Punktschätzung des Erwartungswertes μ einer Zufallsvariable X : • Mehrfache Durchführung des Experimentes • Menge aller beobachteten Werte stellt statistische Reihe dar • Arithmetisches Mittel x der Reihe gibt den Erwartungswert μ an x= 1 n ∑ xi n i =1 Maximum-Likelihood-Schätzer: 1. Likelihood-Funktion aufstellen: L (ϑ ) = ...Wahrscheinlichkeitsfunktion... 2. Logarithmieren der Likelihood-Funktion: ℑ (ϑ ) = ln L (ϑ ) = ... 3. Ableitung bestimmen: ℑ ' (ϑ ) = ... 4. Maximierung für Nullstelle der Ableitung: ℑ ' (ϑ ) = 0 ⇒ ϑ = ... Schätzung einer Erfolgswahrscheinlichkeit (Bernoulli-Experiment): ⎛n⎞ x n− x Lx ( p ) = ⎜ ⎟ p x (1 − p ) Î Maximum Likelihood Schätzung von p = n ⎝ x⎠ Schätzung der Parameter der Normalverteilung: n n ⎛ 1 ⎞ − Lx (ϑ ) = f ( x | ϑ ) = ⎜ ⎟ e ⎝ 2πσ ⎠ ∑ ( xi − μ ) 2 i =1 2σ 2 1 n ∑ xi n i =1 1 n 2 • μ = μ0 ist bekannt und σ 2 > 0 ist unbekannt: σ 2 = ∑ ( xi − μ0 ) n i =1 1 n 1 n 2 2 s2 = • μ ist unbekannt und σ 2 > 0 ist unbekannt: σ 2 = ∑ ( xi − x ) ( xi − x ) ∑ n i =1 n − 1 i =1 Statistische Tests: Aufgrund von Ergebnissen mehrerer Veruschsreihen feststellen, ob die Hypothese über einen Paramter anzunhemen oder abzulehnen ist. • μ ist unbekannt und σ 2 = σ 02 ist bekannt: μ = x = Æ Nullhypothese ( H 0 ), Alternativhypothese ( H1 ) Fehler 1. Art: H 0 ist in Wirklichkeit richtig, wird aber verworfen! α = P ( Fehler 1. Art ) Signifikanzniveau Fehler 2. Art: H 0 ist in Wirklichkeit falsch, wird aber angenommen! β = P ( Fehler 2. Art ) Signifikanzniveau Copyright by ~Gesus~ Stand: 19.07.2006 6/21 Copyright by ~Gesus~ Stand: 19.07.2006 7/21 1 + A + B + AB = 1 Boolsche Algebra: A ∨ B = A + B − AB A ∨ B = A + AB Normalformen: KNF: DNF: ( A ∨ B ) ∧ (C ∨ D ) ( A ∧ B ) ∨ (C ∧ D ) (Funktionswert 0!) (Funktionswert 1!) Konzepte zur Realisierung zuverlässiger Systeme: Allgemeine Konzepte zum Aufbau zuverlässiger Systeme: • • • • • • • Festlegung von Zuverlässigkeitsanforderungen (MTBF, MTTR, Verfügbarkeit) Nachweis von MTBF, MTTR und Verfügbarkeit Projektorganisation, -planung, -ablauf (Æ Pflichtenheft, Arbeitspakete) Zuverlässigkeits- & Sicherheitsanalyse (für Zuverlässigkeit wesentliche Faktoren, Optimierungsmöglichkeiten) Wahl/Qualifikation von Bauteilen, Stoffen, Fertigungsprozessen Konfigurationsmanagement (Phasen: Dokumentation, Überprüfung Æ kritische Bewertung mittels Checkliste, Steuerung von Änderungen, Überwachung von Konfiguration) Qualitätsprüfungen (Qualitätssicherungs- & Zuverlässigkeitssicherungsprogramme, Qualitätsdatensysteme Æ Systematische Erfassung, Analyse und Korrektur von Defekten/Ausfällen) Qualitäts- & Zuverlässigkeitsprogramme: Zusammenfassung aller projektbezogenen Aktivitäten zur Sicherstellung der Qualität und Zuverlässigkeit der Betrachtungseinheit. Elemente: • Projektorganisation, Projektplanung, Projektablauf • Checklisten • Zuverlässigkeits- und Sicherheitsanalysen • Wahl und Qualifikation von Bauteilen, Stoffen, Fertigungsprozessen • Konfigurationsmanagement • Qualitätsprüfungen • Qualitätsdatensystem Projektplanung & Pflichtenheft: • Veranlassung, Ziele • Marktchance • Kosten, Termine • Technische & operationelle Eigenschaften • Umweltbedingungen • Qualitäts- und Zuverlässigkeitssicherung • Tätigkeitslisten, Ableitung der Projektorganisation • Quantifizierung der personellen, materiellen, finanziellen Mittel Copyright by ~Gesus~ Stand: 19.07.2006 8/21 Checkliste für Planung von Q&Z-Programmen: • Zuteilung der Aufgaben zur Sicherstellung der Qualität und Zuverlässigkeit komplexer Systeme • Festlegung der projektspezifischen Aufgaben • V Verkauf F Federführung E Entwicklung M Mitwirkung F Fertigung I Information Z Zentrale Stelle Auslegung sicherheitskritischer Prozessanlagen: Allgemeine Schutzziele: • Gefährdungspotentiale durch Prozessanlagen identifizieren • Schutz vor Expositionen, Kontaminationen, Energieeinwirkungen (Schutzziele festlegen) • Schutz für Betriebspersonal, Bevölkerung, Umwelt (Schutzmaßnahmen planen) • Systemtechnik als hochzuverlässiges System gestalten Grundlegende Schutzkonzepte: • Schutzarten (Schadenverhütung, Schadenbegrenzung) • Mehrstufige Schutzkonzepte bei großen Gefährdungspotentialen Mehrstufenkonzept Kernkraftwerk: Æ Störfälle unwahrscheinlich machen & Störfälle beherrschen Normalbetrieb: • Auslegung mit hohen Sicherheitsreserven • Umfassende Qualitätssicherung (Auswertung von Betriebserfahrung, Schulung,...) Störung: • Ziel: Abfangen/Verhüten von Störfällen • Inhärent stabiles Regelverhalten der Anlage • Laufende Messung/Anzeige aller wichtigen Prozessgrößen • Begrenzungseinrichtungen Störfall: • Ereignisablauf, bei dessen Eintreten der Betrieb der Anlage oder die Tätigkeit aus sicherheitstechnischen Gründen nicht fortgeführt werden kann und für den die Anlage auszulegen ist oder vorsorglich Schutzvorkehrungen vorzusehen sind Î Mehrstufenkonzept mit dem Ziel der Beherrschung/Verhütung von schweren Unfällen Auslegungsgrundsätze für Sicherheitseinrichtungen (Fehlertolerante Auslegung): Copyright by ~Gesus~ Stand: 19.07.2006 9/21 Wichtige Kenntnisse für die Festlegung von Sicherheitsmaßnahmen: • Allgemeine Gefahrenpotentiale (z.B. verwendete Stoffe) • Spezifische Gefahrenquellen (Primär Æ chemische Reaktionen, Sekundär Æ Mensch) • Wichtige Sicherheitstechnische Informationen (Reaktionsablauf/Apparatur) • Grundsatzfragen zur Sicherheit bei Anlagenplanung • Detailfragen zur Sicherheit bei Anlagenplanung (Fehlermechanismen,...) • Mögliche Auslöser von Störfällen (run-away, unreine Stoffe,...) Verfahren der Zuverlässigkeitsanalyse: Grundlegende Methoden der Zuverlässigkeitsanalyse: Zuverlässigkeitsblockdiagramm (Z-Blockdiagramm): Ereignisdiagramm, in dem grafisch dargestellt ist, welche Elemente zur Erfüllung der geforderten Funktion funktionieren müssen und welche als Folge von Redundanzen ausfallen dürfen, ohne die Funktion des Systems zu beeinträchtigen. Vorraussetzung: unabhängige Systemelemente, nichtreparierbares System Æ System ist genau dann funktionsfähig, wenn im resultierenden Diagramm eine Verbindung zwischen Ein- & Ausgang besteht, auf der sämtliche Komponenten intakt sind Copyright by ~Gesus~ Stand: 19.07.2006 10/21 Typische Strukturen: PAAG-Verfahren: Prognose von Störungen, Auffinden der Ursachen, Abschätzen der Auswirkungen, Gegenmaßnahmen Methodik: Qualitative Analyse des Gefärdungspotentials, das mit Fehlbedienung oder Fehlfunktion einzelner technischer Einrichtungen verbunden ist, durch interdisziplinäres Team (Betriebsingenieur, Verfahrenstechniker,...) Copyright by ~Gesus~ Stand: 19.07.2006 11/21 Fehlermöglichkeits & -einflussanalyse (FMEA): Induktive (bottom-up) Vorgehensweise zur Untersuchung der Folgen von Ausfallarten zur höheren Systemebene und Ursachen von Ausfallarten zur tieferen Systemebene Hauptschritte: • Erfassung aller Einzelkomponenten eines Systems • Identifizierung möglicher Ausfallarten für jede Komponente • Ermittlung von Folgen dieser Ausfälle für das Gesamtsystem • Ermittlung potentieller Fehlerursachen • Bildung der RPZ aus Eintritts-, Entdeckungswahrscheinlichkeit und Bedeutung • Verbesserungsmaßnahem zur Verrringerung der RPZ Copyright by ~Gesus~ Stand: 19.07.2006 12/21 Berechnung der Risikorioritätszahl (RPZ): Fehlerbaum-Analyse: Logische Verknüpfung zwischen einem unerwünschten Systemausfall (Top-Ereignis) und den verursachenden Ausfällen von Teilsystemen, Komponeneten, Elementen Æ Grafische Darstellung der booleschen Systemfunktion Æ Bestimmung der Ausfallwahrscheinlichkeit der einzelnen Systemelemente Deduktive (top-down) Vorgehensweise zur Beschreibung der Funktion von Ausfällen und Erassung der Ausfallkombinationen Erstellung eines Fehlerbaumes: • Detailierte Untersuchung des Systems mit einer Systemanalyse • Festlegung des unerwünschten Ereignisses und der Ausfallkriterien • Festlegung der relevanten Zuverlässigkeitskenngröße und der zu betrachtenden Zeitintervalle • Überlegungen zu Ausfallarten der Komponenten Minimalschnitte (MCS): • Auffinden der minimalen Gruppierungen von Komponenten, deren gleichzeitig vorliegender Ausfall den Systemausfall bewirkt • Berechnung der Zuverlässigkeitsmerkmale der gefundenen Minimalschnitte und, daraus resultierend, der des Systems • Ergebnis: logische Systemstruktur, Ausfallkombination für Gesamtausfall, Systemschwächen • Keine Änderungen der logischen Struktur durch Abhängigkeit von Phänomenen, Aktivierungen/Deaktivierungen, menschlichen Eingriffen erfassbar Aus Berechnung der Minimalschnitte und Minimalpfade folgt der Bereich, indem die Zuverlässigkeit RS eines Systems liegt: Minimalschnitte: RS > 1 − ∑∏ (1 − Ri , j ) mit Ri , j i -tes Element aus j -tem Schnitt N n j =1 i =1 N n Minimalpfade: RS < ∑∏ Ri', j mit Ri', j i -tes Element aus j -tem Pfad j =1 i =1 Copyright by ~Gesus~ Stand: 19.07.2006 13/21 Markoffsche Prozesse: PA ( t ) = μ + λ ⋅ e( − μ t − λ t ) μ +λ μ +λ λ λ − μt −λt ) PB ( t ) = − ⋅ e( μ +λ μ +λ Dynamische PSA: Mensch-Maschine-Software-System bei wechselseitiger Abhängigkeit von dynamischen Entwicklungen des Systemzustands und Fehlern, Reparaturen, automatischen/menschlichen Eingriffen. Æ Lösung: Fehlerbaum- bzw. Ereignisbaummethode wird ersetzt durch wiederholte dynamische Simulation der Abläufe, wobei die unsicheren Bedingungen jeweils ausgespielt werden (Integration in traditionelle Ereignisbäume möglich). Probabilistische Sicherheitsanalyse (PSA): Grundkonzept: Struktur Methode Redundanz und Diversität sind wichtige Maßnahmen zur Erhöhung der Verfügbarkeit wichtiger Sicherheitssysteme! Der dadurch erzielte Gewinn an Zuverlässigkeit wird begrenzt durch gemeinsam verursachte Ausfälle (GVA) und menschliche Fehler (MF) Häufigkeit von Systemunfällen (S1): Copyright by ~Gesus~ Stand: 19.07.2006 14/21 Gemeinsam verursachte Ausfälle: GVA-Analyse: • Bei hochredundanten Systemen spielen Zufallsausfälle eine untergeordnete Rolle • Kaum Erfahrungen mit echtem GVA von >2 Redundanzen • Effekte werden häufig nach Entdeckung rasch beseitigt • Modellierung schwierig, Bewertung subjektiv Kopplungsmodell des GVA: Systematisierung der GVA: Die Ausfallrate λK = λU + λA der Einzelkomponenten setzt sich zusammen aus der Rate der unabhängigen Zufallsausfälle λU und der Rate der abhängigen Ausfälle λA . Beta-Faktor-Modell: Rate abhängiger Komponentenausfälle: λA = β ⋅ λK ( β typischerweise 10%) Rate unabhängiger Komponentenausfälle: λU = (1 − β ) ⋅ λK GVA-Rate eines Systems: λS = λS (1) + ... + λS ( n ) = n ⋅ (1 − β ) λK + β ⋅ λK Modell der binomischen Fehlerraten (BFRM): Primäre Ursache wird als Schock definiert, der zum Ausfall der betroffenen Komponenten führen kann. Häufigkeit von Mehrfachausfällen: λk / n ⎧ (1 − λU )n +ν ⋅ n ⋅ (1 − p )n , k = 0 ⎪ = ⎨⎛ n ⎞ k n−k k ,1 ≤ k ≤ n ⎪⎜ ⎟ λU +ν ⋅ p ⋅ (1 − p ) ⎩⎝ k ⎠ ( ) Zuverlässigkeit menschlichen Handelns: Klassifizierung menschlicher Handlungen: Zeitbedarf für menschliches Handeln: Copyright by ~Gesus~ Stand: 19.07.2006 15/21 Menschlicher Einfluss auf Störungen: • Handlungen, die eine Störung verursachen oder verschlimmern • Handlungen, die eine Störung beenden oder deren Folgen mindern Leistungsbeeinflussende Faktoren: • Schwierigkeit der Aufgabe (einfach Æ komplex) • Bedingungen, die eine optimale Bearbeitung stören (Monotonie, Stress) • Î Formalisierung durch Performance Shaping Factors (PSF) Wahrscheinlichkeit fehlerhafter Ausführung (WFA): WFAi = Zahl der fehlerhaft ausgeführten Aufgaben des Typs i Zahl aller Aufgaben des Typs i Instandhaltung: Entwicklung der Instandhaltungstechniken: 1. Generation (1940-1960): Reparatur bei Ausfall 2. Generation (1960-1980): Geplante Überholung, Erste Systeme der Instandhaltungsplanung 3. Generation (1980-2000): Zustandsüberwachung, Risikostudien, Analyse Ausfallursachen Instandhaltungsaufgaben: • Gewährleistung einer hohen technischen Verfügbarkeit • Sicherstellung einer möglichst langen Lebensdauer der Anlagen • Reibungslose Ersatzteilversorgung Instandhaltungsstrategien: Auswahlkriterien für Instandhaltungsstrategien: Copyright by ~Gesus~ Stand: 19.07.2006 16/21 Zustandsorientierte Instandhaltung: • • • • Ermittlung des optimalen Intervalls für vorbeugende Instandhaltungsmaßnahmen Anlagenüberwachung und Anlagendiagnose Condition Monitoring Diagnose eingetretener Schäden und Verminderung von Folgeschäden Techniken der Zustandsüberwachung: • Dynamische Effekte (Echtzeitanalyse, Näherungsanalyse) • Temperatureffekte (Thermografie, Glasfaserthermometrie) • Chemische Effekte (Spektrometrische Ölanalyse, Gaschromatografie) • Physikalische Effekte (Flüssigkeitsfarbstoffpenetration,el.stat. Fluoreszenzpenetration) • Elektrische Effekte (Linearer Polarisationswiderstand, Elektrischer Widerstand) • Partikeleffekte (Ferrografie, Schrittweise Filtration) Zuverlässigkeitsorientierte Instandhaltung: Wartungsintervalle festlegen, um Zuverlässigkeit maximal zu halten. Badewannenkurve: Sechs Störungsmuster: RCM-Analyse (sieben Grundfragen): 1. Welche Funktionen und damit verbundene Leistungsnormen erfüllt die Maschine unter Berücksichtigung der momentanen Betriebsbedingungen? 2. In welcher Weise kann die Maschine bei der Erfüllung dieser Funktion gestört sein? 3. Welche Ursache hat die Funktionsstörung? 4. Welche Folgen hat die Störung? 5. Auf welche Weise wirkt sich die Störung aus? 6. Wie kann man der Störung vorbeugen? 7. Was ist zu unternehmen, wenn keine vorbeugende Lösung gefunden werden kann? Copyright by ~Gesus~ Stand: 19.07.2006 17/21 Auswahlprozess für vorwegnehmende Instandhaltungsmaßnahmen: Software-Zuverlässigkeit: Ziel (Grundsatz): Software soll keinen wesentlichen Beitrag zu Ausfällen liefern!! Methoden und Techniken zur Entwicklung zuverlässiger Software: Zuverlässigkeit Software – Hardware: Copyright by ~Gesus~ Stand: 19.07.2006 18/21 Fehlervermeidung (Fault Prevention): Der effektivste Weg zuverlässige Software zu erstellen ist das Vermeiden von Fehlern bereits im Entwicklungsprozess der Software! Modelle für Software Entwicklungszyklus: • Prototypingmodell (Funktionalitätsnachweis an rasch erstellten Prototypmodellen) • Wasserfallmodell (Anforderungsanalyse, Konzeption, Spezifikation, Realisierung) • Spiralmodell (Um Managementaufgaben erweitertes Wasserfallmodell) • V-Modell (Verifikation der einzelnen Schritte bis hin zur Validierung der Software) Î Sicherheitsintegrität der Software und Entwicklungslebenszyklus Spezifikation der SW-Sicherheitsanforderungen Æ Software-Architektur Æ SoftwareSystementwurf Æ Modulentwurf Æ Kodierung Fault Tolerance: Techniken, die das Erfüllen einer Funktion von einem System trotz Fehler gewährleisten! Verbesserung der Softwarezuverlässigkeit ist nicht durch Redundanz möglich! Wesentlich ist die Diversität: • N-Version Programmierung (Entwurf von N-Programmen unter unterschiedlichen Bedingungen mit unterschiedlichen Algorithmen, gleichzeitige Ausführung) • Unterschiedliche Hardware (zumindest für einige Redundanzen) • Problem: 100% diversitäres System nicht möglich! Fault Removal: Praktisch ist es unmöglich fehlerfreie Software zu entwickeln. Durch Verifikation (Betrachtungseinheit erfüllt vollständig die Anforderungsspezifikationen) und Validierung (System genügt seinen Anforderungen) werden Fehler aufgespürt und entfernt. Durch Einbau neuer Fehler (Fault Injection) und damit ungewöhnlicher Situationen werden Kenntnisse über das Vehalten der Software gewonnen (Besseres Verständnis der Auswirkungen möglicher Fehler Æ Vorhersage des Systemverhaltens). Arten: compile-time-injection (vor Kompilierung), run-time-injection (zur Laufzeit) Fault Estimation (Ausfallschätzung): Die Ausfallschätzung soll die Anzahl der Fehler, die noch im System sind, und wie sie sich auswirken, angeben. Große Anzahl verschiedenster Modelle, die zum größten Teil auf der stochastischen Zuverlässigkeitstheorie bassieren. Î Quantifizierung (Wertmäßige Bestimmung der Zuverlässigkeitsparameter und Kenngrößen) Æ Gesamtsystemzuverlässigkeit mit Hilfe von Zuverlässigkeitsblockdiagrammen (ZBD), Fehlerbäumen (FT), Petri-Netzen (PN) oder Markoffschen Prozessen Nicht reparierbare Systeme: Verfügbarkeit=Zuverlässigkeit F ( t ) = 1 − R ( t ) = 1 − e− λ t * Reparierbare Systeme: Verfügbarkeit: V = Copyright by ~Gesus~ MTBF 1/ λ = MTBF + MTTR 1/ λ + MTTR Stand: 19.07.2006 λ * : Ausfallrate aus experimentell ermittelten Daten 19/21 Software-Zuverlässigkeitswachstumsmodelle (ZWM): Einteilung der Modelle unter Berücksichtigung der funktionellen Beziehung: • Makromodelle: System als Black-Box (Fehler wirkt sich immer auf die gleiche Art aus, Ausfallrate meist proportional der im System vorhandenen Fehler, Die meisten ZWM sind Makromodelle) • Mikromodelle: System als White-Box (Vorraussetzung: Verfügbarkeit des Programm-Quelltext, Höherer Aufwand als Makromodelle) Makromodell (Jelinski-Moranda-Modell): Modellannahme: λ0 = φ N N : Anzahl Fehler im Programm φ : Proportionalitätskonstante λ0 : Versagensrate zu Beginn i −1 ⎛ ⎞ Versagensrate ab Zeitpunkt i: λi = φ ⎜ N − ∑ N j ⎟ j =1 ⎝ ⎠ Überlebenswahrscheinlichkeit Zeitraum t: R ( t ) = e − λit Testen (Prüfmethoden): Ausführen von Funktionen eines Programms in einer definierten Umgebung und Vergleich der erzielten mit den erwarteten Ergebnissen. • Dynamischer Test (Ausführen mit konkreten, stichprobenartigen Eingabewerten Î Demonstriert die Anwesenheit, nicht die Abwesenheit von Fehlern) • Statischer Test (Keine Ausführung der Software, Keine vollständige Aussage über Korrektheit oder Zuverlässigkeit) • Symbolischer Test (Quellcode wird mit allgemeinen symbolischen Werten durch einen Interpreter ausgeführt, Allgemeine Aussage über die Korrektheit für ganze Einzelbereiche bzw. SoftwareModule) Zuverlässigkeit sicherheitskritischer Software: Für sicherheitsbezogene Anwendungen existieren mit der IEC 61508 Norm quantitative Grenzwerte für die mittlere Ausfallwahrscheinlichkeit bzw. für die Wahrscheinlichkeit eines gefahrbringenden Ausfalls pro Stunde. Safety Integrity Levels (SIL 1-4): Quantitative Intervalle für die Ausfallwahrscheinlichkeit, abhängig von der Anforderungsrate: Probleme: Datenmangel (Updates, Problem der vollständigen Fehlererfassung), Komplexität (wechselseitige Abhängigkeit), Zuverlässigkeitswachstumsmodelle nicht anwendbar Lösungsansätze: Ganzheitliche Verfahren, die es erlauben Expertenurteile, Erkenntnisse aus Testverfahren, Betriebserfahrungen, Merkmale der Softwarestruktur zu einer Gesamtaussage zusammenzuführen! Copyright by ~Gesus~ Stand: 19.07.2006 20/21 Schlussfolgerungen: • Zuverlässigkeit technischer Systeme ist eine der wichtigsten Qualitätseigenschaften • Versagen des Systems nicht vollständig verhinderbar Î Zuverlässigkeitsbetrachtung notwendig • Beitrag der Software zur Gesamtzuverlässigkeit steigt durch zunehmenden Rechnereinsatz Sicherung der Zuverlässigkeit elektronischer Bauelemente: Qualifikation elektronsicher Bauteile: • Festlegung der Anwendung • Durchführung der Charakterisierung • Durchführung der Umwelt- und Spezialprüfungen • Durchführung der Zuverlässigkeitsprüfungen • Durchführung von Ausfallanalysen • Beurteilung der Beschaffungsbedingungen Zuverlässigkeitsprüfungen elektronischer Bauteile: • Ausfallrate • Langzeitverhalten kritischer Leistungsparameter • Vorbehandlung im Rahmen der Eingangsprüfung der Serienbauteile Burn-in: • Ermittlung von vorauseilenden Zulässigkeitsdaten • Eliminierung von Frühausfällen • Tests über längere Zeiträume unter verschärften Betriebsbedingungen • Æ Beschleunigungsfaktor von etwa 60 Unterlastung: • Betreibung unterhalb ihrer Nennwerte • Î Gewinn an Zuverlässigkeit • Derating factor (Quotient der tatsächlichen Größe und ihrem Nennwert) • Grenzen des Konzepts: Abnahme der Zuverlässigkeit infolge der gestiegenen Zahl von Komponenten Copyright by ~Gesus~ Stand: 19.07.2006 21/21