Die Weibull-Verteilung

Die Weibull-Verteilung ist eine asymptotische Extremwertverteilung, die für den Fall gilt, dass ein kleinster Wert für die Stichprobe nicht unterschritten werden kann. Die Theorie der asymptotischen Extremwertverteilungen wurde ab Ende der 20er Jahre des 20.Jahrhunderts entwickelt. Gleichzeitig wurde die Verteilung auf verschiedenen Gebieten angewendet.

Ihren Namen erhielt sie, als der schwedische Werkstoffwissenschaftler Waloddi Weibull 1951 eine Arbeit mit dem Titel "A statistical distribution function of wide applicability" veröffentlichte und darin ihre Anwendung für Festigkeitsuntersuchungen an Werkstoffen und für die Lebensdauer von Komponenten unter Lastwechseln beschrieb und dadurch einem großen Kreis von Anwendern bekannt machte.

Am Beispiel der Bruchmechanik kann gezeigt werden, dass der größte Riss im belasteten Bereich einer Bruchprobe bruchauslösend ist. Da die risslänge die dimensionen der Probe nicht überschreiten kann, ist ein minimaler wert für die Bruchspannung gegeben. Folgerichtig gehorchen Die Bruchspannungen von Materialproben aus einer einheitlichen Grundgesamtheit der Weibull-Verteilung. Die theoretisch erwarteten Effekte der Probengröße und des durch die Untersuchungsmethode belasteten Probenvolumens sind nachweisbar.

Immer dann, wenn ein System dadurch versagt, dass ein schwächstes Glied ausfällt, ist die Weibull-Verteilung geeignet, die Beobachtungen zu beschreiben.

Mathematische Formulierung und Eigenschaften

Bei Prüfungen, bei denen die Bestimmung der Zuverlässigkeit von Produkten oder von Komponenten das Ziel ist, wird für eine Stichprobe von Prüflingen die Zeit oder ein Parameter der mit der Zeit korreliert ist, bis zum Ausfall der Prüflinge gesteigert. Bei der Planung und Verifikation von Zuverlässigkeit kann auch, unabhängig von zeitlichen Abläufen, eine Last (mechanische Spannung, elektrische Spannung, Strom) kontinuierlich oder in Stufen bis zum Ausfall von Bauteilen gesteigert werden. Der Zusammenhang mit der Zuverlässigkeit ergibt sich dann aus dem Operationsprofil des Produktes, das Aussagen darüber macht, wie häufig Belastungen in gegebener Höhe auftreten. Den Parameter (Zeit, Zyklenzahl, Belastung), als dessen Funktion der Ausfall untersucht wird, wollen wir hier allgemein als Lebensdauermerkmal t bezeichnen. Das primäre Ergebnis eines solchen Versuches ist eine Liste, in der die Ordnungszahl des Ausfalls und die Ausprägung des Lebensdauermerkmals, bei der der Ausfall aufgetreten ist, aufgezeichnet sind. Von einer Auswertung erwarten wir, dass sie eine Zuverlässigkeitsfunktion über den untersuchten Bereich und eine Aussagewahrscheinlichkeit liefert.

Eine zur Auswertung von Versuchen des beschriebenen Typs universell anwendbare Verteilungsfunktion ist die Weibull-Verteilung:

(1)

Darin bedeuten:

F(t)

Ausfallwahrscheinlichkeit, 0 ≤ F(t) ≤ 1

t0

Ausfallfreie Zeit

τ

Charakteristische Lebensdauer

β

Formparameter (Steigung der Ausgleichsgeraden im Lebensdauernetz)

Die ausfallfreie Zeit t0 ist für elektronische Bauteile und für komplexe Zusammenbauten in vielen Fällen 0. Daher wird neben der 3-parametrigen Form der Weibull-Verteilung häufig eine 2-parametrige Form verwendet, auf der die weiteren Erläuterungen basieren. Eine ausfallfreie Zeit kann über die Koordinatentransformation t*=t-t0 berücksichtigt werden.

(2)

Ableitung der Weibull-Verteilung nach dem Lebensdauermerkmal t ergibt die Dichtefunktion f(t).

(3)

Auftragung der Dichtefunktion für verschiedene Formparameter β zeigt, dass die Weibull-Verteilung sehr unterschiedliche Formen des Ausfallverhaltens beschreiben kann (Abb. 1). Die charakteristische Lebensdauer ist gleich 1 gesetzt. Neben der Exponentialverteilung für β=1 werden mit β=2 die Log-Normalverteilung und mit β=3,5 die Normalverteilung gut angenähert. Für β>3,5 ergeben sich Dichtefunktionen, deren Maximum sich der charakteristischen Lebensdauer nähert und die jenseits des Maximums steil abfallen.

Abb. 1

Dichtefunktion der Weibull-Verteilung in Abhängigkeit vom Formparameter

Neben der Dichtefunktion, welche die Zahl der Ausfälle für eine ursprüngliche Population in Abhängigkeit von dem Lebensdauerparameter angibt, ist natürlich auch die Ausfallrate, die sich auf den überlebenden Anteil der Population bezieht, von Interesse. Dies trifft besonders für reparierbare Systeme zu, da hier nach einer Anlaufphase, in der sich ein stationärer Zustand zwischen in Betrieb und gerade in Reparatur befindlichen Systemen einstellt, die Zahl der intakten Systeme konstant ist. Die Ausfallrate ist in Abb. 2 dargestellt. Für Formparameter <1 ergibt sich eine mit der Zeit (dem Lebensdauerparameter) fallende Ausfallrate. Wenn der Formparameter gerade 1 ist, liegt eine Exponentialverteilung mit konstanter Ausfallrate vor. Nimmt der Formparameter Werte >1 an, ergibt sich eine zunehmend progressiv steigende Ausfallrate.

Neben den Ausfallraten für eine Auswahl von Formparametern ist in Abb. 2 auch eine Summenkurve dargestellt, die sich durch Addition der Ausfallraten für die Formparameter 0,5, 1, und 4,5 ergibt. Eine solche Kurve hat im Prinzip die Form der empirischen Badewannenkurve (Abschnitt 3.2). Daher ist das gleichzeitige Vorliegen von Ausfallmechanismen mit Formparametern <1, =1 und >1 eine mögliche Hypothese zur Erklärung der Badewannenkurve.

Abb. 2

Ausfallrate in Abhängigkeit vom Formparameter



Die geringe Ausdehnung des Gebietes mit konstanter Ausfallrate in Abb. 2 ist darauf zurückzuführen, dass für alle Mechanismen eine charakteristische Lebensdauer von 1 und für den Mechanismus mit einem Formparameter von 4,5 keine ausfallfreie Zeit angenommen wurde.

Nachdem nun gezeigt ist, dass die Weibull-Verteilung geeignet ist, Lebensdauerdaten zu beschreiben, wenden wir uns der Bestimmung der Parameter der Verteilung zu. Diese wird zweckmäßig mit Hilfe einer Linearisierung der Gleichung 2 durchgeführt. Die erfolgt in den folgenden Schritten:

(4)

Die Auftragung von lnln1/1-F(t) gegen ln t ergibt also eine Gerade mit der Steigung β und dem Achsenabschnitt β lnτ.

Die registrierten Ausfälle werden nun nach der Größe des Lebensdauermerkmals aufsteigend sortiert. Sofern die Zahl der Daten n>50 ist, erfolgt eine Klassierung der Daten. Es werden ca. 5*log n Klassen gebildet und die Ausfälle diesen Klassen zugeordnet. Der kumulierte Ausfall F(t) entspricht der Häufigkeitssumme Hj der Klasse j. Dieses Verfahren ist wichtig, wenn Felddaten ausgewertet werden sollen. Hier ist die Zahl der Prüflinge gewöhnlich groß. Bei Labortests hingegen stehen häufig weniger als 50 Prüflinge zur Verfügung. Dann wird jedem Prüfling nach Sortieren der Daten eine Summenhäufigkeit zu geordnet. Diese Werte sind tabelliert oder können nach der Näherungsformel Hj=(j-0,3)/(n+0,4) berechnet werden.

Nach oben ⇑

Bestimmung der mittleren Lebensdauer und des Formfaktors im Labortest

Abbildung 3 zeigt als Beispiel das Ergebnis eines beschleunigten Tests an 12 I/O-Modulen für eine elektronische Steuerung. Die Beschleunigung wird durch erhöhte Temperatur und erhöhte Betriebsspannung erzielt. Der Beschleunigungsfaktor beträgt etwa 100 und wurde zuvor durch einen faktoriellen Versuch und Extrapolation auf Normalbedingungen ermittelt.

Die linke Seite der Tabelle in Abb. 3 enthält die Eingangsdaten der Berechnung, die Zeiten zu denen Ausfälle festgestellt wurden, t in Stunden und die Ordnungszahlen j. Daraus werden für die Bestimmung der Ausgleichsgeraden die Häufigkeitssummen Hj, die Kehrwerte der doppelten Logarithmen der Zuverlässigkeitsfunktion und die Logarithmen des Lebensdauermerkmals lnt berechnet. In der Spalte tm sind die zu der berechneten Ausgleichsgerade gehörigen Werte des Lebensdauermerkmals angegeben. Der Formparameter ergibt sich für diesen Versuch zu 0,94. Die charakteristische Lebensdauer τ beträgt 1451 Stunden. Die mittlere Lebensdauer MTTF ergibt sich daraus unter Berücksichtigung der Schiefe der Verteilung zu 1495 Stunden.

Abb. 3

Auswertung eines Lebensdauerversuchs mit der Weibull-Verteilung

Diese Schätzung der Parameter der Verteilung muß nun noch durch eine Angabe des Vertrauensbereiches ergänzt werden. Dazu dient die Berechnung von Häufigkeitssummen bezogen auf die tm, zwischen denen die Werte der Grundgesamtheit mit einer Aussagewahrscheinlichkleit von 90% liegen.

In Abb. 4 ist das Ergebnis grafisch dargestellt. Es wird deutlich, dass die Werte recht gut auf der Ausgleichsgeraden mit der Steigung 0,94 liegen. Dies zeigt, dass während der gesamten Dauer des Versuchs Zufallsausfälle vorherrschend waren und weder Frühausfälle noch Verschleiß erkennbar sind. Doch etwas ernüchternd ist die Betrachtung des Vertrauensbereiches. Mit der gewählten Aussagewahrscheinlichkeit von 90% liegt die charakteristische Lebensdauer, die Zeit, zu der 63,2% ausgefallen sind, in einem Bereich zwischen 700 und 2800 Stunden. Noch gravierender werden die Differenzen, wenn man den unteren Bereich der Verteilung betrachtet:

Abb. 4

Auswertung eines Lebensdauerversuchs mit der Weibull-Verteilung, grafische Darstellung im Weibull-Diagramm

Nach 100 Stunden können knapp 1% oder auch 25% ausgefallen sein. Der Vertrauensbereich wird durch eine größere Stichprobe eingeengt. Die andere Seite ist der relativ hohe Zeitbedarf für einen Versuch. Hier wurden selbst bei einem Raffungsfaktor von 100 über 4000 Stunden bis zum Abschluß des Versuchs benötigt.

Abkürzung der Versuchszeit im Labortest durch Einbeziehung noch nicht eingetretener Ereignisse

Durch Testen einer größeren Zahl von Prüflingen kann einerseits der Vertrauensbereich eingeengt, andererseits aber auch die Prüfzeit abgekürzt werden. Letzteres gelingt durch Unterteilen der Stichprobe in gleich große Prüflose, die dann parallel unter gleichen Bedingungen bis zum ersten Ausfall getestet werden (Sudden Death Testing). Dazu wird eine Stichprobe von 120 I/O-Modulen in 12 Prüflose zu je 10 Modulen aufgeteilt. Die Prüflose werden jeweils bis zum ersten Ausfall getestet. Die restlichen 9 Prüflinge werden nicht weiter geprüft. Die zwölf registrierten Ausfälle werden zu den folgenden Zeiten registriert:

Nr.

1

2

3

4

5

6

7

8

9

10

11

12

t(h)

6

18

26

45

59

78

110

132

178

205

256

410

Hj

5,6

13,6

21,7

29,8

37,9

46,0

54,0

62,1

70,2

78,3

86,4

94,4

Diese Daten werden in das Weibull-Diagramm eingetragen und die Ausgleichsgerade ermittelt. Die Ausgleichsgerade für die gesamte Stichprobe, und damit eine Schätzung für die Grundgesamtheit, findet man, indem man von dem Median-Wert der jeweils ersten Ausfälle aus den 10er-Gruppen Hj=50% eine Lotrechte auf den Medianrang für den ersten Wert von 10 fällt. Dieser Medianrang wird mit der Näherungsformel H1=(1-0,3)/(10+0,4) ermittelt und beträgt 6,7%. Die Parallele zu der Ausgleichsgerade der ersten Ausfälle durch diesen Punkt ist die geschätzte Ausfallverteilung für die Grundgesamtheit. Diese ist in Abb 5 dargestellt. Zum Vergleich sind die Ergebnisse des urspr√ľnglichen Versuchs mit 12 Modulen (blaue Dreiecke) nochmals mit in dei Grafik aufgenommen.

Abb. 5

Sudden Death Testing und Messung einer Stichprobe im Vergleich, grafische Darstellung im Weibull-Diagramm. 12er Stichprobe zum Vergleich

Der Versuch ist, wie schon die Wertetabelle zeigt, nach 410 Stunden beendet und führt zu einer Ausfallverteilung der Grundgesamtheit, die sich praktisch mit der aus dem Test an 12 Einheiten gewonnenen deckt. Voraussetzung für die Anwendung der Methode ist, dass der Formparameter für die Grundgesamtheit einheitlich ist.

Eine alternative Möglichkeit zur Abkürzung der Versuchszeit ist offensichtlich die Prüfung einer größeren Stichprobe und der Abbruch des Versuches nach dem Ausfall eines vorher festgelegten Prozentsatzes der Proben. Um die Vergleichbarkeit mit dem Sudden Death Verfahren zu gewährleisten, betrachten wir die Untersuchung von 120 I/O-Modulen bei Abbruch des Versuches nach dem 12. Ausfall. Das Ergebnis dieses Versuches zeigt Abb. 6. Die Ausfälle liegen im Weibulldiagramm gut auf einer Geraden und schließen sich an die Punkte, die zuerst mit der Stichprobe von 12 Einheiten ermittelt wurden, an. Allerdings liegt der Formparameter mit 0,8 etwas niedriger als der in den vorhergehenden Versuchen gemessene Wert. Dies schlägt sich in einer mittleren Lebensdauer nieder, die mit 2800 Stunden beinahe doppelt so hoch ist wie diejenige, die mit der Stichprobe von 12 Einheiten bestimmt wurde. Dieser Wert liegt auch an der Grenze des 95% Vertrauensbereiches für die Stichprobe mit 12 Einheiten. Der Grund für diese Abweichungen ist darin zu sehen, dass die ersten beiden Ausfälle bei 4 und 10 Stunden, bezogen auf die Ausgleichsgerade des ersten Versuchs und auch auf die weiteren 10 Ausfälle in diesem Versuch, Frühausfälle sind.

Insgesamt ist die Versuchsdauer hier gegenüber der Sudden Death Methode noch weiter verkürzt. Weil aber die Information aus 108 nicht ausgefallenen Einheiten weniger berücksichtigt wird, als bei der Sudden Death Methode ist auch das Ergebnis insgesamt unsicherer. Allerdings kann die Information auf einfache Art verbessert werden, indem man den Versuch fortsetzt.

Abb. 6

Untersuchung einer Stichprobe von 120 Einheiten und Abbruch nach dem 12. Ausfall. 12er Stichprobe im Vergleich.

Ob man die Sudden Death Methode oder einen frühzeitigen Versuchsabbruch wählt, um die Testzeit zu verkürzen, hängt nicht zuletzt auch von den experimentellen Gegebenheiten ab. Die Sudden Death Methode ist vor allem dann günstig, wenn eine entsprechende Anzahl von Einheiten mit einem Meßgerät untersucht werden kann. (Simples Beispiel: 10 Glühbirnen in Reihe schalten und den Strom registrieren. Wenn der Strom auf 0 abfällt, ist der erste Ausfall in diesem Prüflos aufgetreten.)

Nach oben ⇑

Auswertung von Felddaten

Felddaten haben als Informationsquelle zu Ausfällen den Vorteil, dass sie

Die komplementären Nachteile sind gewöhnlich:

Die Frage nach der Vorgeschichte ist für eine Auswertung zunächst sekundär und stellt sich erst dann konkret, wenn bei der Auswertung Ereignisse gefunden werden, die sich signifikant vom Rest der Stichprobe unterscheiden. Die Unvollständigkeit der Informationen läßt sich durch die Einbeziehung noch nicht eingetretener Ereignisse in die Auswertung ausgleichen. Wir wollen zwei Beispiele betrachten.

Ein Hersteller von Computermonitoren überwacht die Ausfallstatistik seiner neuen Geräte, indem er bezogen auf Typklassen während der Garantiezeit von zwei Jahren die Ausfälle in einem Testmarkt, der kontinuierlich beliefert wird, auswertet. Die Geräte sind für den Bürobereich bestimmt. Daher ist die genaue Betriebsdauer zum Zeitpunkt des Ausfalls unbekannt. Unbekannt sind auch die Betriebszeiten der nicht ausgefallenen Geräte. Von der Typklasse 19" LCD-Monitore wurden im ersten Halbjahr 2004 7600 Einheiten in den beobachteten Markt geliefert. Bis Ende Dezember 2004 waren die folgenden Ausfälle gemeldet (Werte in aufsteigender Reihenfolge sortiert:

Nr.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

t(d)

2

5

9

13

18

22

26

33

39

48

54

70

91

128

Hj

4,8

11,8

18,8

25,7

32,6

39,6

46,5

53,5

60,4

67,4

74,3

81,3

88,2

95,1

Es wird nun angenommen, dass die Lebensdauern der intakten Geräte gleichmäßig auf die Zeiten vor, zwischen und nach den registrierten Ausfällen verteilt sind. Damit ergibt sich die gleiche Situation wie beim Sudden Death Testing abgesehen davon, dass es ein zusätzliches Los gibt, aus dem noch kein Teil ausgefallen ist. Über dieses Los ist eine Aussage zum ersten Ausfall noch nicht möglich. Damit wird die Zahl der Teile pro Prüflos k=7600/15=507. Der Medianrang für den ersten Ausfall der Grundgesamtheit, der mit der Häufigkeitssumme 50% für die Verteilung der ersten Ausfälle korreliert ist, beträgt 0,14%. Damit ergibt sich das in Abb. 7 dargestellte Bild. Der Formparameter für die Ausfallverteilung beträgt 0,99. Es handelt sich also auch hier um Zufallsausfälle. Die charakteristische Lebensdauer von 22700 Tagen kann allerdings nur als Parameter zur Beschreibung der Verteilung ohne physikalische Bedeutung gesehen werden. Bei Zeiten >10 Jahre muß man wohl damit rechnen, dass Verschleißausfälle vorherrschend werden. Aussagen dazu müßten in einem beschleunigten Test gewonnen werden. Außerdem ist bei der untersuchten Anwendung die Betriebszeit wahrscheinlich deutlich kleiner als die Bruttozeit.

Die vorliegende Schätzung zum Ausfallverhalten der Grundgesamtheit erlaubt die Aussagen, dass die Garantieausfälle wahrscheinlich über 2% liegen werden, dass nach 3 Jahren mit einem Ausfall von nahezu 5% der Geräte zu rechnen ist und dass 85% der Geräte wahrscheinlich eine Betriebszeit von 8 Jahren überstehen werden. Das entspricht nicht den Qualitätszielen, die der Hersteller sich gesetzt hatte.

Abb. 7

Sudden Death Auswertung von Felddaten

Durch die konsequente Auswertung der Garantiereparaturen wird dieses Defizit jedoch bereits nach etwa zwei Monaten als Trend erkennbar. Durch Analyse und Behebung der Fehlerschwerpunkte kann eine Verbesserung erzielt werden.

Eine sicherere Auswertung ergibt sich, wenn die Lebensdauerparameter für alle Einheiten der beobachteten Stichprobe bekannt sind. Nehmen wir an, dass unser Monitorhersteller auch Profigeräte, die rund um die Uhr in Betrieb sind, an Großkunden liefert. Für eine Stichprobe von 690 dieser Geräte seien die Inbetriebnahmedaten genau bekannt. Durch Beobachtung dieser Geräte über einen Zeitraum von 4 Jahren versucht der Hersteller seine Zuverlässigkeitsplanung abzusichern und sich eine Datenbasis für die Ausdehnung der Garantie auf 3 Jahre zu schaffen. In dem Beobachtungszeitraum wurden zehn Ausfälle verzeichnet. Eine Übersicht über die Auswertung gibt Abb. 8.

Abb. 8

Auswertung von Felddaten bei bekanntn Betriebsdaten für die gesamte Stichprobe

Die Symbole haben die folgenden Bedeutungen:

j

Ordnungszahl

t

Lebensdauer in Tagen

nf

Zahl der Ausfälle am Zeitpunkt t (hier immer 1)

ns

Zahl der Überlebenden am Zeitpunkt t mit Lebensdauern t(j-1)<t≤t(j)

N(t)

Zuwachs, Hilfsgröße zur Berechnung von j(t)

j(t)

Mittlere Ordnungszahl

H(j)

Häufigkeitssumme bezogen auf die mittlere Ordnungszahl

Die mittlere Ordnungszahl wird rekursiv berechnet.

(5)

N bezeichnet die gesamte Stichprobe. Ferner gilt j0=0.

Die Auftragung des Ergebnisses im Weibull-Diagramm ergibt einen Formparameter von 1,2. Auch hier wird das Geschehen also durch Zufallsausfälle bestimmt. Der kumulierte Fehler liegt nach drei Jahren unter 5%. Diese Aussage ist ziemlich sicher, obwohl zum Zeitpunkt der Auswertung erst weniger als 30% der Stichprobe die Lebensdauer von 3 Jahren überschritten hat. Eine Ausdehnung der Garantiezeit wird damit kalkulierbar. Die charakteristische Lebensdauer von 22900 Tagen ist wiederum nur eine Größe, die die Lage der Verteilung charakterisiert, nicht eine physikalisch zu erwartende Lebensdauer. Für den Bereich konstanter Ausfallrate, der sich nach der durchgeführten Untersuchung bis mindestens 4 Jahre erstreckt, beträgt diese 1,9∗10-6.

Abb. 9

Auswertung von Felddaten bei bekannten Betriebsdaten.

Neben der hier vorgestellten Auswertung von Labor- und Felddaten bietet die Weibull-Verteilung noch weitere Möglichkeiten zur Analyse und Berechnung von Lebensdauerdaten. Erkannt und analysiert werden können im Weibull-Diagramm inhomogene Verteilungen, Verteilungen mit einer ausfallfreien Zeit und Mischverteilungen, bei denn sich der bestimmende Ausfallmechanismus während der Untersuchung ändert. Außerdem lassen sich bei bekannten Weibull-Verteilungen von Komponenten und bekannter Struktur die Zuverlässigkeitsfunktionen von Systemen berechnen. Insgesamt ist der Rückfluß von Daten aus Laborversuchen und aus dem Feld für die realistische Planung von Zuverlässigkeit unverzichtbar. Unter den Auswerteverfahren, die der Analyse solcher Daten dienen, ist die Gruppe derer, die auf der Weibull-Verteilung basieren, die variabelste.

Nach oben ⇑

Abkürzungen, Definitionen

Summenhäufigkeit, Häufigkeitssumme:
Die Summenhäufigkeit, die ein Versuch an einer Stichprobe für einen festgelegten Wert der Lebensdauer erbringt, ist eine Zufallsgröße, die einer Verteilung unterliegt, welche nur vom Stichprobenumfang n und von der Ordnungszahl j des Ergebnisses bei der Größ nach geordneten Werten abhängt. Der Erwartungswert der Verteilung ist j/(n+1), der Median ungefähr (j-0,3)/(n+0,4). Für die Auswertung im Weibull-Netz wird in der Regel eine mediantreue Auftragung gewählt.

Hinweise, Verweise

Waloddi Weibull
Biografische Daten bei Wikipedia
Literatur
Auswahl und Anwendung von Verfahren zur Sicherung der Zuverlässigkeit: VDA-Band 3, Teil 2: Zuverlässigkeits-Methoden und -Hilfsmittel
Dort weitere Literaturhinweise

SMQE Qualitätsmanagement (2006 - 2008)