Experimentieren und Evaluieren Oliviero Chiodo Hochschule für Technik Rapperswil Frühlingssemster 2015 Inhaltsverzeichnis 1 Theorie 1.1 Statistische Grundbegrie . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Merkmalsträger und Grundgesamtheit . . . . . . . . . . . . . 1.1.2 Skalen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Bedeutung der Messkalen . . . . . . . . . . . . . . . . . . . . 1.2 Häugkeitsverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Spannweite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Theoretische Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Binominal-Verteilung . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Poisonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Rechteckverteilung . . . . . . . . . . . . . . . . . . . . . . . . 1.4.4 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . 1.4.5 Weibull-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . 1.4.6 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.7 Simulation und Zufallsvariable . . . . . . . . . . . . . . . . . 1.5 Grundlagen der schliessenden Statistik . . . . . . . . . . . . . . . . . 1.5.1 Stichprobenerhebung . . . . . . . . . . . . . . . . . . . . . . . 1.6 Chi-Quadrat Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Dichte der t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Kondenzintervalle für den Wert µ der Normalverteilung . . . . . . . 1.9 Schätzfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9.1 Problembeschreibung . . . . . . . . . . . . . . . . . . . . . . . 1.9.2 Gütekriterien für Schätzunktionen . . . . . . . . . . . . . . . 1.9.3 Varianzen für die Schätzfunktion . . . . . . . . . . . . . . . . 1.9.4 Erstellen des Kondenzintervalls . . . . . . . . . . . . . . . . 1.9.5 Berechnung Stichrpobenumfangs grosser Grundgesamtheiten 1.9.6 Kondenzinterfall für die Varianz . . . . . . . . . . . . . . . . 1.10 Testverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.1 Fehler erster Art . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.2 Fehler zweiter Art . . . . . . . . . . . . . . . . . . . . . . . . 1.10.3 Fallunterscheidungen . . . . . . . . . . . . . . . . . . . . . . . 1.10.4 Parametertest . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.5 Anteilswerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.6 Dierenztests . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.7 Verteilungstests . . . . . . . . . . . . . . . . . . . . . . . . . . 1.10.8 Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . 1.11 Zusammenhang zwischen zwei Merkmalen . . . . . . . . . . . . . . . 1.11.1 Regressionsanalyse . . . . . . . . . . . . . . . . . . . . . . . . 1.11.2 Korrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 3 4 4 4 5 6 7 7 7 8 8 8 8 9 9 10 10 11 11 12 12 12 13 14 15 15 16 16 17 17 17 18 18 19 19 20 20 21 21 1.11.3 Bravais Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.11.4 Interpretation des Korrelationskoezienten von Bravais Pearson . . . . . . 1.11.5 Zeitreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Beispiele 2.1 Mittelwerte und Spannweite . . . . . . . . 2.2 Grundlagen der schliessenden Statistik . . 2.3 Schätzverfahren . . . . . . . . . . . . . . . 2.4 Testverfahren . . . . . . . . . . . . . . . . 2.4.1 Parametertest . . . . . . . . . . . . 2.5 Unabhängigkeitstest . . . . . . . . . . . . 2.6 Zusammenhang zwischen zwei Merkmalen 2.6.1 Regressionsanalyse . . . . . . . . . 2.6.2 Lineare Regression . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 22 23 24 24 25 26 27 27 27 28 28 29 1 Theorie 1.1 Statistische Grundbegrie 1.1.1 Merkmalsträger und Grundgesamtheit • Merkmalsträger Der Merkmalsträger ist der Gegenstand der statistischen Untersuchung, er ist der Träger der interessierenden statistischen Information. • Grundgesamtheit Die Grundgesamtheit ist die Menger aller Merkmalsträger. Die übereinstimmende Abgrenzungsmerkmale besitzen. Abgrenzungsmerkmale sind räumlich, sachlich und zeitlich vorzunehmen. • Merkmal Die Eigenschaft des Merkmalsträger, die bei der statistischen Untersuchung von Interesse ist. • Merkmalswert Der Wert, der bei der Beobachtung, der Befragung, der Messung oder Zählvorgang festgestellt wurde. 1.1.2 Skalen Skalen Die statistische Messskala, kurz Skala, ist dabei das Instrument, mit dem die Merkmalswerte ermittelt werden. SKala sind die möglichen Merkmalswerte nach einem bestimmten Ordnungsprinzip als Skalenwerte abtragen. • Nominalskala Aus der Nominalskala sind die Skalenwerte Namen abgetragen die gleichberechtigt bzw. gleichbedeutend nebeneinander angeordnet sind. Sie sind stets qualitiative Merkmale Merkmal Familienstand Geschlecht Rebsorte Merkmalswert verheiratet, ledig, geschieden, verwitwert Feminin/Maskulin Riesling, Silvaner • Ordinalskala Auf der Ordnialskala (Rangskala) sind als Skalenwerte Klassenbeziehungen abgetragen. Die Skalenwerte stehen jetzt nicht mehr gleichberechtigt bzw. gleichwertig nebeneinander. Sondern sind entsprechende ihrer Klasse in auf- oder absteigender Folge (Rangfolge, Rangordnung) auf der Skala angeordnet. Ordinalskalierte Merkmale sind stets intensitätsmässig abgestufte Merkmale und umgekehrt Merkmal Schulnote Qualitätstufe Merkmalswert Sehr gut, gut, befriedigend, ausreichend, mangelhaft Standard, Business, First Class • Metrische Skala Auf er metrischen Skala (Kardinalskala) sind die Skalenwerte als reele Zahlen abgetragen, entsprechende ihrem Zahlenwert in auf- oder absteigender Folge auf der Skala angeordnet. Sie entspricht unserer Vorstellung von einem Experiment, wo als Ergebniss dem Merkmal eines Merkmalsträger als Merkmalwert ein eine reele Zahl zugewiesen wird. Metrische Merkmale sind stets quantitative Merkmale und umgekhert. Diese Skala wird abhängig vom Nullpunkt in Intervallskala und Verhältnisskala unterschieden. 3 • Intervallskala Auf der Intervallskala ist der Skalenwert Null ein mehr oder weniger willkürlich gewählter Nullpunkt. Das heisst, zwischen zwei Merkmalswerten kann der einfache Abstand (Intervall) gemessen werden. Es kann jedoch nicht der verhältnissmässige (relative) Abstand (Verhältniss, Quotient) gemessen werden. Merkmal Temperatur Uhrzeit Merkmalswert −12, . . . , 0, . . . , 42 20:00, 0:00, 10:00 • Verhältnisskala Auf der Verhältnisskala entspricht der Skalenwert Null dem natürlichen, absoluten Nullpunkt. Negative Werte sind damit nicht möglich. Das hat zur Folge, dass zwischen zwei Merkmalswerten neben dem einfachen Abstand (Intervall) auch der verhältnismässige Abstand (Quotient, Verhältnis) gemessen werden kann. Das heisst ein Merkmalswert kann jetzt als das Vielfache eines anderen Merkmalwertes ausgedrückt werden Merkmal Gewicht(kg) Alter(Jahre) 1.1.3 Merkmalswert 0,...10,...20,...40 0, 1,..40,...89,... Bedeutung der Messkalen Bedeutung der Messskalen Die Verhältnisskala besitzt das höchste Informationsniveau. Es lassen sich die Verschiedenartgkeit die einfachen und die verhältnissmässigen Abstände für Merkmalswerte feststellen. 1.2 Häugkeitsverteilung Hinweis zur Notation: xum bedeutet, das (kleine) x aus der Klasse m, das u steht für die Untere Grenze einer Klasse. 1.2.1 Mittelwerte • Dichte: Die Dichte sagt aus, wie viel der Grundgesamtheit innerhalb der gewählten Klasse sind dj = xoj hj − xuj (1) • Modus: Der Modus ist derjenige Merkmalswert, der am häugsten beobachtet wird Mo = xum + hm − hm−1 · (xom − xum ) (hm − hm−1 ) + (hm − hm+1 ) (2) • Modus bei unterschiedlichen Klassengrössen M = xum + dm − dm−1 (dm − dm−1 ) + (dm − dm+1 ) (3) • Quantile: Ein Quartil ist ein Merkmals wert durch den die Gesamtheit in zwei Teile zerlegt Ansatt 12 n wird 34 n genommen: Me = xum + n 2 − Hm−1 · (xom − xum ) (Hm − Hm−1 ) (4) Die Formel des Medians ist diesselbe Formel wie die fürs zweite Quantil(hier beschrieben) 4 • Arithmetisches Mittel: Das arithmetische Mittel ist der Wert, der sich bei gleichmässiger Verteilung der Summe aller beobachteten Merkmalswerte auf alle Merkmalsträger ergibt. Nicht klassizierte berechnung: v 1X xi · hi n i=1 x = v X x = (5) (6) xi · fi i=1 (7) • Harmonisches Mittel: Das harmonische Mittel ist derjenige Wert, zu dem die in der Häug- keitsverteilung vor ihm liegende Merkmals werte in der Summe gesehen relativ gleich weit entfernt sind wie die nach ihm liegenden Merkmals werte Pv hi M H = Pvi=1 hi (8) i=1 xi • Geometrisches Mittel: Das geometrische Mittel ist die n-te Wurzel aus dem Produkt aller beobachteten Merkmals werte. v s u n uY endwert n M G = t xi = n anfangswert i=1 r −→ 3 57 = 1.125 40 (9) • Binominalkoezient: Dieser wird verwendet, wenn man mögliche Kombinationen berechnen möchte. n n! 18 18 · 17 · 16 = ⇒ (10) = k k!(n − k)! 3 3! Weitere Informationen gibt es im Unterabschnitt 2.1 1.2.2 Spannweite • Spannweite: Die Spannweite R ist die Dierenz aus dem grössten und dem kleinsten beob- achteten Merkmalswert. R = grösster Merkmalswert − kleinster Merkmalswert R = x[n] − x[1] (11) (12) (13) Klassizierte Häugkeitsverteilung R = xov − xu1 (14) • Zentralen Quartilsabstand: Der zentrale Quartislabstand ist die Entfernung zwischen den beiden Merkmalswerten, welche die in der Rangordnung zentral gelegenen 50% der Merkmalsträger eingrenzen. ZQA = Q3 − Q1 5 (15) • Mittlere absolute Abweichung: Die mittlere absolute Abweichung ist die durchschnittliche Entfernung aller beobachteten Merkmalswerte von arithmetischen Mitteln (alternativ: Median) δ= v 1 X · ·|xi − x| · hi n i=1 (16) n: Anzahl Merkmalsträger v : Anzahl der verschiedenen Merkmalswerte hi : Absolute einfache Häugkeit der an Merkmalsträger mit dem Merkmalswert: xi • Varianz und Standardabweichung: Die Varianz ist die SUmme der quadrierten Abweichungen der Merkmalswerte vom arithmetischen Mittel, dividiert durch die Anzahl der Merkmalsträger. Die Standardabweichung ist die Quadratwurzel aus der Varianz n σ2 = 1X (xi − x)2 hi n i=1 (17) • Variationskoezienten: Der Variationskoezient misst nicht die absolute, sondern die relative Streuung. Das heisst, er setzt die Streuung in Relation zur Lage der Häugkeitsverteilung. Der Variationskoezient ist der Quotient aus Standardabweichung und arithmetischem Mittel, multipliziert mit 100 VK = 1.2.3 σ · 100 x (18) Boxplot Ein Boxplot stellt die Verteilung kardinalskalierter Daten dar, fasst verschiedene robuste Streuungsund Lagemasse in einer Darstellung zusammen. Es vermittelt schnell einen Eindruck, in welchem Bereich die Daten liegen und wie sie sich über diesen Bereich verteilen. Abbildung 1: Boxplot Beispiel 6 1.3 Zufallsvariable Die Zufallsvariable lässt sich als Funktion darstellen, die bei jedem Ergebnis eines Zufallsexperiments einen Wert (Realisierung) zuordnet. Zur Beschreibung stochastischer Phänomene sind Grössen (Variablen) zu betrachten, deren Werte vom Zufall beeinusst werden. Beispiel eines Münzwurfs X : {Wappen, Zahl} → R, X(ω) = 1 −1 , falls ω = Wappen , falls ω = Zahl (19) Gegeben sei ein Wahrscheinlichkeitsaum (Ω, A, P ). • Wahrscheinlichkeitsmass P ordnet jedem Ergebnis A ∈ A seine Wahrscheinlichkeit zu: P : A → [0, 1] (20) • Eine Zufallsvariable X ordnet jedem Ergebniss ω ∈ Ω einen Zahlenwert zu: X:Ω→R (21) Um die Wahrscheinlichkeit dafür zu berechnen, dass die Zufallsvariable X bestimmte Werte annimmt, benötigen wir eine Verbindung zum Wahrscheinlichkeitsmass P und dem System der Ereignisse. Denition der Zufallsvariable Eine Funktion X : Ω → R, die jedem Ereignis ω eines Ergenisraums Ω eine reele Zahl x zuordnet, bildet eine Zufallsvariable, falls jedes Intervall I ∈ R. Ist diese Teilmenge Ai des Ergebnisraums ω ein Element des Systems der Ereignisse in einem Wahrscheinlichkeitsraum (ω, A, P ) so ist P (Ai ) die gesuchte Wahrscheinlichkeit A = {ω ∈ Ω|X(ω) ∈ I} ∈ A (22) Das sich einstellende Ergebnis des Experiments hängt vom Zufall ab. Daher wird auch der ermittlete Zahlenwert X(ω) vom Zufall abhängen. Gesucht ist die Wahrscheinlichkeit dafür, dass X(ω) in einem bestimmten Intervall I ⊂ R liegt. Zu bestimmen ist die Menge der Ergebnisse, für die X(ω) ∈ I gilt. Gesucht ist die Teilmenge des Ergenisraums aus Gleichung 22. Für die Wahrscheinlichkeit des Ereignisses ω ∈ Ω|X(ω) ∈ I , schreiben wir abkürzend P (X ∈ I) und entsprechend P (a < X ≤ b) 1.4 Theoretische Verteilungen 1.4.1 Binominal-Verteilung Anwendung ndet dies wenn sich beispielsweise ein Zufallsexperiment nur in zwei Ergebnissen unterscheidt, das Experiment n-mal wiederholt wird (Zufallsstichprobe vom Umfang n). Gesucht ist meist die Wahrscheinlichkeit, dass bei n-maliger Durchführung des Experimentes das Ereignis: genau, mindistens oder höchstens x-mal Eintrit. • Wahrscheinlichkeitsfunktion: n x f (x) = P (X = x) = p (1 − p)n−x x (23) E(X) = n · p (24) V ar(X) = n · p(1 − p) (25) • Erwartungswert: • Varianz 7 1.4.2 Poisonverteilung Diese Verteilung wird angewendet, wenn man sich dafür interessiert, wie hoch die Wahrscheinlichkeit ist, dass das Ergebnis E in einem Intervall genau oder höchstens x-mal eintritt, wenn bekannt ist, dass in diesem Intervall das Ereignis im Mittel µ-mal auftritt. µ gibt eine Rate pro Zeitintervall an. • Wahrscheinlichkeitsfunktion: f (x) = P (X = x) = µx −µ e x! (26) x: Anzahl der Ereignisse z.B Ereignis x tritt 1, 2, . . . , n-mal bei der Rate Beobachtungsintervall µ ein. • Erwartungswert/Varianz E(X) = V ar(X) = µ 1.4.3 (27) Rechteckverteilung Die Rechteckverteilung eignet sich zur Beschreibung von Vorgängen, bei denen die Ergebnisse nur Zahlen eines bestimmten Intervalls [a, b] sein können. Die Wahrscheinlichkeit, dass ein Ergebnis in ein bestimmtes Teilintervall fällt, wird nur durch dessen Länge bestimmt. Alle Ergebnisse eine bestimmten Intervalls [a, b] sind gleich wahrscheinlich und daher auch die Gleichverteilung im Intervall [a, b]. Hierzu gibt es keine Formeln in dieser Vorlesung 1.4.4 Exponentialverteilung Diese Verteilung wird angewendet, wenn man Beispielsweise die Zeitspanne zwischen zwei Anrufen in einer Telefonzentrale, die Dauer eines Telefongesprächs, die Lebensdauer eines Geräts (wenn Defekte durch äussere Einüsse und nicht durch den Verschliess verursacht werden) ermitteln will. Exponentialverteilung mit Parameter λ > 0 f (t) = F (x) = 1.4.5 , für t ≥ 0 , sonst λe−λt 0 , für x ≥ 0 , für x < 0 1 − e−λx 0 (28) (29) Weibull-Verteilung Diese Verteilung wird Angewendet um die Lebensdauer von Geräten oder Materialien mit Abnutzungserscheinungen zu beschreiben. α ist ein Skalierungsparameter, β ist ein Formparameter. f (t) = β α · β · tβ−1 eαt 0 F (x) = β 1 − e−αx 0 , für t ≥ 0 , sonst , für x ≥ 0 , für x < 0 (30) (31) Interpretation des Formparameters β > 0 • β < 1: Ausfallrate nimmt mit der Zeit ab (Ausfälle nden frühzeitig statt) • β = 1: Ausfallrate konstant (zufällige äussere Einüsse sind Ursache des Versagens) • β > 1: Ausfallrate nimmt mit der Zeit zu (Alterungsprozesse) Bemerkung: Der Parameterwert β = 1 führt auf die Exponentialverteilung welche somit einen Spezialfall der Weibull-Verteilung darstellt. 8 1.4.6 Normalverteilung Die Normalverteilung ist die wohl wichtigste stetige Verteilung und spielt neben andrem in der schliessenden Statistik eine entscheidende Rolle. Der zentrale Grenzwertsatz besagt z.B: Dass sich eine Zufallsvariable X , die sich als Summe der n Zufallsvariablen X1 , X2 , . . . , Xn ergibt, nähreungsweise normalverteilt ist, wenn die Anzahl der Zufalls-variablen hinreichend gross ist, die Zufallsvariablen X1 , X2 , . . . , Xn unabhängig sind oder nicht eine der Zufallsvariablen X1 , X2 , . . . , Xn stark dominant ist (sehr salopp formuliert). • Wahrscheinlichkeitsdichtverteilung f (x) = • Verteilungsfunktion: 1 −1 √ e 2 σ 2π Zx F (x) = −∞ x−µ 2 σ ,σ > 0 1 t−µ 2 1 √ e− 2 ( σ ) dt , σ > 0 σ 2π (32) (33) Dieses Integral lässt sich leider nicht lösen Das bedeutet, dass wir keine Stammfunktion nden. • Erwartungswert E(X) = µ (34) V ar(X) = σ (35) • Varianz Die Normalverteilung ist eine stetige symmetrische Verteilung. Das Maximum der Dichteverteilung liegt bei xmax = µ. Die Wendepunkte liegen bei xw = µ±σ . Die Verteilungsfuntkon mit den Werten µ = 0 und σ = 1 wird als Standart-Normalverteilung bezeichnet. N (0; 1) = F0 (x). z= x−µ σ (36) Zwischen einer Verteilungsfunktion F (X) und einer Standartnormalverteilung gibt es die folgende Beziehung. x−µ F (x) = F0 (37) σ Daher reicht es aus, nur die Standartnormalverteilung zu kennen,diese wird in Tabellen angegeben. 1.4.7 Simulation und Zufallsvariable In einem dynamischen Simulationsexperiment: • Werden Ereignisse (Events) zu zufälligen Zeiten erzeugt oder zerstört • Unterliegen Bearbeitungszeiten stochastischen Schwankungen • Sind Entscheidungen im Event-Flow zufällig • schwankungen Mengenangaben von Gütern, Nachfragen, Ressourcen etc. • Die Beschreibung dieser scheinbar zufälligen Prozesse erfolgt durch die Denition geeigneter Zufallsvariablen 9 1.5 Grundlagen der schliessenden Statistik Abbildung 2: Wahrscheinlichkeitstheorie Abbildung 3: Schliessende Statistik Wahrscheinlichkeitstheorie Die Wahrscheinlichkeitstheorie untersucht Grössen die vom Zufall beeinusst werden. Die Art des Zufallseinusses wird durch die spezielle Wahl der Verteilungsfunktion bestimmt. Mittels rein mathematiscner Überlegungen lassen sich bezüglich solcher Grössen bestimmte charakteristische Eigenschaften ableiten, welche schliesslich Rückschlüsse auf die Eigenschaften von Realisierungen solcher Grössen zulassen. Die schliessende Statistik befasst sich mit Messreihen deren konkrete Ausprägung vom Zufall beeinusst werden. Diese Messreihen können ebenfalls charakteristische Grössen etwa in Form des arithmetischen Mittels und der Varianz zugeordnet werden. Hier stellt sich die Frage nach der Gestalt des unbekannten Verteilungsgesetzes unter dem die vorliegende Realisierung zustande kam. Eine Entscheidung über die Annahme oder Ablehnung einer angenommenen Verteilung kann durch ein Vergleich der gemessenen charakteristischen Grössen der Realisierung und aus der Theorie abgeleiteten charakteristischen Grössen des hypothetischen Verteilungsgesetzes getroen werden. 1.5.1 Stichprobenerhebung • Einfache Zufallsstichprobe • Geschichtete Stichprobe • Klumpenstichprobe • Systematische Stichprobe • Mehrstuge Stichprobe Um gut Stichproben zu erheben muss man folgende Punkte beachten 1. Im Rahmen der Datenerhebung Isolierende Abstraktion Hier sind die unterschiedlichen Eigenschaften der Stichprobenerhebung zu beachten. Das passende Verfahren hängt stark von der Fragestellung und dem zu untersuchenden Objekt 10 bzw. System ab, die durch die Simulation beantwortet werden soll. Um signikante Aussagen machen zu können, ist die Grösse der Stichprobe zu bestimmen. Generalisierende Abstraktion Es muss eine geeignete Verteilungsfunktion gefunden werden, um die Anzahl der möglichen Experimente zu erhöhen und eine gewisse Variabilität zu ermöglichen. 2. Im Rahmen der Experimentauswertung Festlegung der Verteilung der Eingangsdaten Sind diese festgelegt folgen die Experimente. Sind die Verteilungen zufällig, so kann diese nur durch die Festlegung eines Seeds bestimmt werden, sodass sich die Streuung um einen Mittelwert ergibt. Wurden die Eingangsdaten falsch bestimmt, wird in den folgenden Experimenten ein systematischer Fehler gemacht, der zu falschen Rückschlüssen führt Für die Experimentplanung und Auswertung ergeben sich folgende Fragen: • Wie sieht die Stichprobenfunktion und ihre Wahrscheinlichkeitsverteilung aus? • Wie kann ein Vertrauensintervall für den Mittelwert bzw. die Varianz einer Messreihe ermittelt werden? • Wie kann der Stichprobenumfang d.h. die Anzahl der Experimente, festgelegt werden? • Welche etablierten Testverfahren gibt es? Testverteilungen Testverteilungen sind Verteilungen, die bei vielen statistischen Tests Verwendung nden. Wichtige Testverteilungen sind • Chi-Quadrat Verteilung (Unterabschnitt 1.6) • t-Verteilung (auch Student t-Verteilung) wenn die Stichprobe < 30 ist (Unterab- schnitt 1.7) • Normalverteilung wenn die Stichprobe ≤ 30 ist (Unterunterabschnitt 1.4.6) 1.6 Chi-Quadrat Verteilung Dies ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen. Ihr einziger Parameter muss eine natürliche Zahl sein und wird Freiheitsgrad genannt. Sie ist eine der Verteilungen, die aus der Normalverteilung abgeleitet werden könne. Ha man Zufalls-variablen, die unabhängig und standardorientiert sind, so ist die Chi-Quadrat Verteilung mit Freiheitsgraden deniert als die Verteilung der Summe der quadrierten Zufalls-variablen. Solche Summen quadrierter Zufalls-variablen treten bei der Schätzung der Varianz einer Stichprobe auf. Dichte der χ2r -Verteilung mit r Freiheitsgraden: ( f (t) = 1 r 2 2 Γ( r2 ) r t · t 2 −1 · e− 2 , für t > 0 , für t ≤ 0 0 Erwartungswert: (38) E(X) = r (39) V ar(X) = 2r (40) Varianz: 1.7 Dichte der t-Verteilung Dichte der tr -Verteilung mit r Freiheitsgraden: f (t) = √ 1 t2 − 1 (r+1) · (1 + ) 2 ,t ∈ R r r · B( 12 , 2r ) 11 (41) Erwartungswert: E(X) = 0(für r > 1) Varianz: V ar(X) = r (für r > 2) r−2 (42) (43) Diese Verteilungen hängen von einem bzw. mehreren Parametern ab und repräsentieren somit jeweils eine ganze Klasse von Verteilungen. Sie lassen sich als Verteilungen von Zufallsvariablen denieren, die man als Funktion von standartnormalverteilten Zufallsvariablen darstellen kann. Sie lassen sich ebenfalls für hinreichend grosse Werte ihrer Parameter durch Normalverteilungen approximieren. Für den praktischen Gebrauch existieren Tabellen, deren Aufbau sich an der Anwendung in der Schliessenden Statistik orientiert. 1.8 Kondenzintervalle für den Wert µ der Normalverteilung Liegt eine konkrete Stichprobe {x1 , x2 , x3 , . . . , xn } vor, so gilt für das Stichprobenmittel: n E[X] = µ = x = 1X xi n i=1 (44) Betrachtet man jeden einzelnen Wert der Stichprobe xi als zufälligen Wert der Zufallsvariablen Xi so ist der Stichprobenmittelwert wieder eine Funktion, die Stichprobenfunktion: n X= 1X Xi n i=1 (45) • Satz 1: Es sei X eine Zufallsvariable mit dem Erwartungswert µ und der Varianz σ 2 . Fasst man den Stichprobenmittelwert als Funktion der n unabhängigen Zufalls-variablen Xi auf, die alle gleiche Wahrscheinlichkeitsverteilung wie X unterliegen. Dann gilt n X= 1X Xi n i=1 Der Erwartungswert (46) n X = µx = 1X Xi = µ n i=1 Die Varianz: 2 σX = σ2 n (47) (48) Interpretation: Der Stichprobenmittelwert hat den gleichen Erwartungswert, wie die Grundgesamtheit. Dieser Mittelwert ist selbst wieder eine Zufallsvariable oder Stichprobenfunktion und streut um den Mittelwert der Grundgesamtheit. Je grösser n ist, desto kleiner die Streuung oder, um so besser die Näherung. • Satz 2 Es gelten die Voraussetzungn von Satz 1. Ist X darüber hinaus normalverteilt, ist auch der Stichprobenmittelwert Normal-verteilt. Ist X N (µ; σ)-verteilt, dann gilt: σ X ⇒ N (µ; √ ) n (49) wobei: σ die Standartabweichung, µ der Mittelwert und n die Anzahl Stichproben ist. 1.9 Schätzfunktion 1.9.1 Problembeschreibung Bisher sind wir davon ausgegangen, dass die Parameter µ und σ und die Verteilungsfunktion f bekannt sind. Diese Annahme ist zulässig, wenn sehr viele Ergebnisse von Messungen oder Experimenten vorhanden sind. Experimente sind jedoch teuer, Zeit und Ressourcenintensiv. Es ist daher so, dass 12 man die Anzahl der Experimente zu minimieren versucht. Mit dieser Fragestellung beschäftigt sich das DoE (Design of Experiments) Letzlich müssen die Parameter oft geschätz werden. Damit man nicht blind raten muss, werden Schätzverfahren, Schätzfunktion und Gütekriterien für die Schätzfunktion deniert. • Schätzverfahren: Haben die Aufgabe, den oder die unbekannten Parameter der Verteilung eines Merkmals in der Grundgesamtheit anhand einer Stichprobe zu schätzen. Die Schätzung kann durch die Angabe eines einzigen Wertes erfolgen (Punktschätzung) oder durch Angabe eines Intervalls (Invervallschätzung). • Schätzfunktion: Ist ein mathematischen Instrument und ordnet einer konkreten Stichprobe einen Wert zu. Sie stellt somit ein Bindeglied zwischen der Grundgesamtheit und der Stichprobe dar. Sie bildet die Beziehung zwischen den Parametern der Schätzfunktion und den entsprechenden Parametern in der Grundgesamtheit bekannt. Dabei ist die Verteilung der Schätzfunktion zumindest approximativ bekannt. So wird der Rückschluss von der Stichprobe auf die Grundgesamtheit möglich. Es erlaubt auch die Angabe des Fehlerrisikos. 1.9.2 Gütekriterien für Schätzunktionen Ein Gütekriterium ist die quadratische Abweichung von Schätzfunktionen Tb und Parameter T . Abweichung vom Schätz- oder Basiswertes Tb vom Wert des Parameters der Grundgesamtheit T . E[(Tb − T )2 ] = V ar(Tb) + [E[Tb] − T ]2 (50) V ar[·] ist die Varianz der Schätzfunktion, [E[Tb] − T ]2 ist die quadrierte Abweichung von der Schätzfunktion T und Parameter T der Grundgesamtheit. Ist E(Tb) − T = 0 ist es Erwartungstreu. Konstruktion dieser Funktion: n X (xi − µ b)2 (51) i=1 n µ b= 1X xi = x n i=1 (52) Zuerst minimiert man die Summe des Schätzwertes Gleichung 51, danach dierenziert man nach µ = 0 und erhät die Schätzfunktion zu Gleichung 52. Das Ziel des Schätzverfahrens ist, von einer Stichprobe auf eine Grundgesamtheit zu schliessen und den Fehler einer falschen Schätzung zu minimieren oder zu bestimmen. Hierbei wird zwischen zwei Schätzverfahren: • Punktschätzung Für die Simulation untersuchen wir hier die Parameterschätzung für den Mittelwert µ, die Varianz σ 2 und für unbekannte Wahrscheinlichkeiten p (auch Anteilswerte genannt). • Intervallschätzung Hier geht es um die Bestimmung von Vertrauensinvervallen für die oben aufgeführten Parameter und das damit verbundene Risiko einer Fehleinschätzung oder Fehlinterpretation. Die Angabe des Fehlers oder der Genauigkeit einer Schätzung wird auch als ihre Zuverlässigkeit bezeichnet. • Mittelwert µ: n x= • Varianz σ 2 : 1X xi n i=1 (53) n s2 = 1 X (xi − x)2 n − 1 i=1 (54) Die Varianz der Stichprobe ist abhängig von n und damit nicht Erwartungstreu. Daher wird hier die Korrektur (n − 1) vorgenommen. Für grosse Stichproben spielt das aber keine Rolle. 13 • Anteilswert/Wahrscheinlichkeit p: p= k n (55) Wobei k = gute Fälle sind, und n = Stichprobenumfang Die Verteilungsformen für das Stichprobenmittel X : Verteilung des Merkmals X Varianz bekannt Variant unbekannt Bekannt und normalverteilt X ist normalverteilt X ist t-verteilt Bekannt und nicht normalverteilt Unbekannt 1.9.3 X ist approximativ normalverteilt Varianzen für die Schätzfunktion • Verteilungsformen für das Stichprobenmittel X Stichprobe Varianz σ 2 bekannt Ohne Zurücklegen n N Mit zurücklegen ≥ 0.05 n N < 0.05 Varianz σ 2 unbekannt 2 σX ≈ σ n 2 σ bX ≈ s2 n 2 = σX σ2 N − n · n N −1 2 = σ bX s2 N − n · n N 2 Hinweis: Das Sigma beinhaltet keinen Bruch: σX 6= σ X2 14 • Varianzen der Schätzfunktion X 1.9.4 Erstellen des Kondenzintervalls 1. 2. 3. 4. Feststellung der Verteilungsform von X Feststellung der Varianz von X ggf. schätzen mit s2 Ermittlung des Quantislwertes z oder t Berechnung des maximalen Schätzfehlers. Der maximale Schätzfehler ist das Produkt aus Quantilswert und Standartabweichung von X 5. Ermittlung der Kondenzgrenzen Die untere und obere Kondenzgrenze ergeben sich durch Substraktion bzw. Addition des maximalen Schätzfehlers vom bzw. zum Stichprobenmittel X • Die Varianzen der Schätzfunktion P ergeben sich aus P = k =θ n (56) Für nP (1 − P ) > 9 = appriximativ normalverteilt. Stichprobe Varianz bekannt Mit Zurücklegen σ P2 = θ(1−θ) n σ b P2 = P (1−P ) n n N < 0.05 σ P2 ≈ θ(1−θ) n σ b P2 ≈ P (1−P ) n n N ≥ 0.05 2 σX = θ(1−θ) n · N −n N −1 Varianz unbekannt σ b= P (1−P ) n · N −n N In allen Tabellen dieses Kapitels gilt: N ist die Grundmenge, n die Grösse der Stichprobe und bzw. NN−n sind Korrekturfaktoren. Erstellen eines kondenzienintervalls N −n N −1 1. Festellung der Verteilungsform von P , die Schätzfunktion ist approximativ normalverteilt wenn nP (1 − P ) > 9 2. Festellung der Varianz von P 3. Ermittlung des Quantilwertes z 4. Berechnung des maximalen Schätzfehlers Der maximale Schätzfehler ist das Produkt des Quantilwerts und Standardabweichung von P 5. Ermittlung der Kondenzgrenzen Die untere und die obere Kondenzgrenze ergeben sich durch Sustraktion bzw. Addition des maximalen Schätzfehlers vom bzw. zum Stichprobenmittel P 1.9.5 Berechnung Stichrpobenumfangs grosser Grundgesamtheiten Die Berechnung des notwendigen Stichprobenumfangs für die Intervallschätzung mit Zurücklegen oder Grossergrundgesamtheit unterscheidet sich vom den vorherigen Beispielen. Bisher war die Frage: Wie gross ist das Vertraunsintervall bei einer gegebenen Anzahl von Stichproben: −W σ σ µ − z√ ≤ x ≤ µ + z√ n n 15 =1−α (57) Jetzt soll ein maximaler Fehler vorgegeben werden σ n Fehler: µ ± e = µ ± z √ Wahrscheinlichkeit: 1 − α σ Vorgabe: e ≤ ±z √ n (58) (59) (60) Daraus folgt bei vorgegebener Wahrscheinlichkeit 1 − α zur Bestimmung des Z -Wertes der Standartnormalverteilung Z 2 σ2 e2 n≥ (61) Bei der Berechnung des notwendigen Stichprobenumfangs für die Intervallschätzung ohne Zurücklegen, muss man anders vorgehen. Mit dem bekannten Korrekturfaktor aus Gleichung 58, erhält man z2 N σ2 n≥ 2 (62) 2 2 e (N − 1) + z σ 1.9.6 Kondenzinterfall für die Varianz Für die Schätzfunktion galt Gleichung 51 und Gleichung 52, sind die Xi normalverteilt gilt: n s2 = σ2 X 2 Z n − 1 i=1 i n X (63) Zi2 = i=1 s2 (n − 1) σ2 (64) Zur berechnung eines asymmetrischen Kondenzintervall, beispielsweise durch die Chi-Quadrat Verteilung, in Gleichung 38 angegeben. Das heisst die Zufallsvariable Y in der die zu schäzende Varianz der Grundgesamtheit einiesst, ist Chi-Quadrat-verteilt mit r = n − 1 Freiheitsgraden. (n − 1)s2 α ≤ y1− 2 W y ≤ σ2 (n − 1)s2 (n − 1)s2 2 W ≤σ ≤ y1− α2 y α2 α 2 (65) (66) Anmerkung zu diesen Funktionen: • Anstatt r wird für den Freiheitsgrad oft auch k verwendet • Die y -Werte (Quantilswerte für bzw. 1 − Chi-Quadrat Verteilung zu entnehmen α 2 α 2 bei r Freiheitsgraden) sind der Tabelle der 1.10 Testverfahren Denition Testverfahren Im Testverfahren erhält man mit einer vorgegebenen Wahrscheinlichkeit von mindestens 1 − α auf Grund einer Stichprobe ein Intervall [a, b], das einen unbekannten Parameter v enthält, so heisst dieses Intervall für v bei einem Vertrauensniveau von 1 − α α wird in diesem Zusammenhang auch als Signikanzzahl bezeichnet und ist ein Mass für die Irrtumswahrscheinlichkeit. Das heisst die Null-Hypothese abzulehnen, obwohl sie richtig ist. Damit hat man auch eine Aussage über die Wahrscheinlichkeit eines Fehlers. 16 1.10.1 Fehler erster Art Der Fehler ersten Art, bedeutet fehlerhaftes Ablehnen einer Hypothese. Liegt der ermittelte Wert ausserhalb des Annahmebereichs, so wird die Hypothese verworfen. Die Wahrscheinlichkeit, dass die Hyptohese fälschlicherweise verworfen wird, wird durch die Fläche unter der Verteilungsfunktion ausserhalb des Annahmebereichs repräsentiert und lässt sich bestimmen als α. Abbildung 4: Fehler ersten Art 1.10.2 Fehler zweiter Art Der Fehler der zweiten Art, bedeutet eine fehlerhaftes Annehmen einer Hypothese. Beim Aufstellen Abbildung 5: Fehler zweiter Art einer Hypothese kann es passieren, dass diese nicht komplett der Wahrheit entspricht. Der Fehler der Hypothese und der Wahrheit wird als Fehler β durch die Fläche von ∞ bis an das Ende der Annahme angegeben. 1.10.3 Fallunterscheidungen Man kann unter verschiedenen Fällen unterscheiden. Unter anderem: • Der/die interessierenden Parameter der Grundgesamtheit sind z.B als Erfahrungswert be- kannt. Durch Stichproben soll überprüft werden, ob diese Werte noch eingehalten werden. • Hypothesen basieren auf Sollwerten und Normen. Diese Werte müssen also durch Vorgaben eingehalten werden. es ist zu überprüfen, ob ein Standard eingehalten wird. • Hypothesen aufgrund einer Theorie oder auch auf Grund von Ergebnissen aus Simulations- läufen. 17 Ein statistischer Test ist eine Methoden, die eine Entscheidung ermöglichen soll. Deshalb braucht man ein bestimmtes Verfahren, um Hypothesen zu testen. 1. Festlegen der Grundgesamtheit und Formulieren der Nullhypothese H0 und der Alternativhypothese H1 (im Allgemeinen die Verneinung der Nullhypothese) 2. Festlegen der Signikanzzahl α, gibt die Irrtumswahrscheinlichkeit an oder das Vertrauensintervall 1 − α 3. Bestimmen der Testgrösse und des Annahme und Ablehnungsbereichs. Testgrösse kann der Stichprobenmittelwert sein 4. Berechnen des Wertes der Testgrösse mit den Daten der Stichprobe und Testentscheidung Um Hypothesen zu beweisen, formuliert man oft eine Verneinung dieser Hypothese als Nullhypothese und versucht dann, diese durch einen statistischen Test zu wiederlegen. Dies ist Vergleichbar mit dem Indirekten Beweis der Mathematik. 1.10.4 Parametertest Der Paramtertest überprüft die Hypothese über Paramter einer Grundgesamtheit. σ σ µ0 − z √ ≤ x ≤ µ0 + z √ n n (67) Die Fragen die sich beim Paramtertest stellen sollten sind: • Liegt eine systembedingte Störung vor? • Ist der angegebene Mittelwert korrekt? • Liegt das Ergebniss im Bereich der statistischen Schwankungsbreite (Tolleranz)? Diese Fragen können über das Vertrauensintervall (Gleichung 67) beantwortet werden. 1.10.5 Anteilswerte Diese können analog zu den Paramtertests angewendet werden: 1. Wähle die Signikanzzahl α und bestimme daraus die Werte für Z aus der Tabelle (1 − α) 2. Berechne die Annahmegrenzen r p0 (1 − p0 ) n r r p0 (1 − p0 ) N − n cu = p0 − z n N −1 r p0 (1 − p0 ) c0 = p0 + z n r r p0 (1 − p0 ) N − n c0 = p0 + z n N −1 cu = p0 − z 3. Man berechne den Anteil p = oder (68) und (69) oder (70) (71) k n 4. Fällt p in den Annahmebereich: cu ≤ p ≤ c0 , wird die Hypothese angenommen, sonst abgelehnt. 18 1.10.6 Dierenztests Manchmal will man mit Hilfe von Stichproben untersuchen, ob zwei Mittelwerte µ1 = µ2 sind, oder signikant voneinander abweichen. Zum Beispiel ist das Ergebnis des einen (Simulations)Experiments signikant unterschiedlich von dem anderen. Dabei werden zwischen zwei Stichproben unterschieden • Abhängige Stichproben Diese werden in der Regel angestrebt, wenn es sonst zu Überlagerungen kommt, die das Ergebnis verzerren könnten. • Unabhängige Stichproben Diese liegen dann vor, wenn zum Beispiel für ein Herstellungsprozess zwei unterschiedliche Modellvarianten untersucht werden sollen, in denen der Durchsatz untersucht werden soll. Abhängige Stichproben erstellen: 1. Bilden der Nullhypothese H0 : µ1 = µ2 (72) 2. Die Diernezen der Stichprobe müssen für alle i erfasst werden di = xi − yi (73) 3. Dann gilt die Nullhypothese H0 gleich, wenn der Mittelwert von di im Bereich von 1 − α liegt 4. Es wird die Signikanzzahl α gewählt 5. Mit Hilfe der Tabelle für Normalverteilung werden die Annahmegrenzen festgelegt Unabhängige Stichproben erstellen: 1. Lege eine Signikanzzahl α fest 2. Mit Hilfe der Tabelle für Normalverteilung wird der Werte ∓Z festgelegt 3. Berechnung des Annahmebereichs 1 s c = ∓z σ12 σ2 + 2 n1 n2 (74) 4. Berechnung der Mittelwerte der Stichproben µ1 und µ2 5. Man nehme die Nullhypothese aus Gleichung 72 an, wenn die Dierenz aus Gleichung 73 in den Annahmebereich fällt 1.10.7 Verteilungstests Bisher wurden Tests behandelt, die sich auf Parameter der Grundgesamtheit beziehen. Nun soll mithilfe von Stichproben überprüft werden, ob Hypothesen über Wahrscheinlichkeitsverteilungen überprüft werden können. Verbreitete Testverfahren in den Verteilungstests sind:2 • Chi-Quadrat Test (Unterabschnitt 1.6) • Kolmogoro-Smirno Test • Spezielle Tests, die für die Überprüfung bestimmter Verteilungen zugeschnitten sind 1 Nach wie vor ist der Mittelwert gleich dem Mittelwert der Dierenz. Aber jetzt muss die Varianz für jede Probe separat angenommen bzw. Geschätz werden. 2 Als einziger dieser Verfahren haben wir die Chi-Quadrat Verteilung behandelt 19 Die Idee des χ-Quadrat Test ist, es werden die Häugkeiten der empirische ermittelten Verteilun mit der theoretischen Verteilung verglichen. Dazu werden wieder die Dierenzen der Häugkeitswerte quadriert, normiert und aufaddiert. y= y= m 2 X (ni − npi ) i m X i npi hei − hth i hth i 2 (75) (76) Geht man davon aus, dass die einzelnen Messungen wieder Normalverteilt sind, dann ist die Summe y Chi-Quadrat verteilt mit m − 1 Freiheitsgraden. Um den Test zu erhalten, geht man folgendermassen vor: 1. H0 : Die empirische Häugkeit entspricht der theoretischen Häugkeit 2. Man wähle eine Signikanzzahl α und bestimme die Anzahl der Freiheitsgrade Sind alle Parameter der Verteilungfunktion bekannt, haben wir m − 1 Freiheitsgrade Wenn die Parameter der Verteilungsfunktion geschätzt werden müssen, kann die Anzahl Freiheitsgrade für jeden geschätzen Parameter um eins reduziert werden. 3. Die Annahmegrenze Co wird aus der Tablle für die Chi-Quadrat Verteilung ermittelt. Die Häugkeit sollte nicht kleiner als 5 und der Stichprobenumfang nicht grösser als 30 sein. Sonst muss man mit der YATES Korrektur arbeiten 4. Man berechnet für die vorliegenden Sithcproben den Testwert mit Gleichung 75 5. Gilt Y > C0 , dann lehnt man die Hypothese H0 ab, ansonsten nimmt man sie an 1.10.8 Unabhängigkeitstest Die Unabhängigkeitstests beinhaltet die Überprüfung von eventuellen Abhängigkeiten zwischen bestimmten Zufallsvariablen. Man spricht auch von einem Chi-Quadrat Unabhängigkeitstest. Voraussetzungen dafür sind, dass die Häugkeit grösser als 5 ist und der Stichprobenumfang grösser als 30. Dieser Test liefert eine Entscheidung ob eine Abhängigkeit besteht, jedoch keine Information oder Mass über die Stärke der Abhängigkeit (siehe Unterunterabschnitt 1.11.1). Sind diese Voraussetzungen nicht erfüllt können Korrekturen vorgenommen werden, die sogenannte YATES Korrektur. Da es jedoch auch hier keine festen Regeln gibt, und die Ergebnisse mit Vorsicht zu bewerten sind, sollten aus praktischer Sicht die Voraussetzungen erfüllt werden. 1.11 Zusammenhang zwischen zwei Merkmalen Dem Erkennen des Zusammenhangs zwischen zwei oder meBhr Merkmalen kommt der betrieblichen Praxis eine grosse Bedeutung zu. Bei der Untersuchung des Zusammenhangs zwischen zwei Merkmalen X und Y sind folgende Fragen interessant: • Besteht ein Zusammenhang zwischen X und Y? (siehe Unterabschnitt 1.6) • Von welcher Form ist der Zusammenhang? • Von welcher Stärke (Intensität) ist der Zusammenhang? Abhängigkeit Zwei Merkmale sind statistisch unabhängig, wenn der Wert des einen Merkmals nicht davon abhängt, welcher Wert das andere Merkmal besitzt. Sonst sind sie abhängig. 20 Zu unterscheiden sind dabei: • Formale Abhängigkeit: Liegt eine zahlenmässig begründete Abhängigkeit zwischen den Merkmalen vor? • Sachliche Abhängigket Ist der Wert des einene Merkmals ursächlich für den Wert des anderen Merkmals? Die Feststellung der Kausalität bzw. der Ursache-Wirkungsbeziehung kann die Zusammenarbeit mit dem auf dem jeweiligen Sektor Fachkundigen erforderlich machen. Hier muss man sich aber vor Ünsinns-Korrelationenïn acht nehmen. Ein Beispiel ndet sich in Abschnitt 2.6.1 Herausnden ob eine Tabelle unabhängig ist hi,k = hi hi,k n (77) 1.11.1 Regressionsanalyse Die Regressionsanalyse beschreibt die Form bzw. Tendenz des Zusammenhangs durch eine mathematische Funktion. Durch sie werden die Wertkombinationen (x, y) der Merkmalsträger in ein Koordinatensystem eingetragen, dann ergitb sich ein sogenanntes Streuungsdiagramm (Punktewolke). In der linearen Regressionsanalyse wird die Tendenz durch die Funktion bestimmt. • Bei einseitiger Beeinussung (y wird nur durch den Parameter x bestimmt) (78) y = a1 + b1 · x • Bei wechselseitiger oder unbekannter Abhängigkeit zusätzlich 3 x = a2 + b2 · y (79) Dabei müssen jedoch die Parameter a und b bekannt sein. Zur bestimmung dieser verwendet man kleine Quadrate. Die Aufgabe besteht darin, Gleichung 80 zu minimieren. Dies erreicht man mit partiellem Ableiten des Ausdrucks nach a und b, nullsetzen der beiden partiellen Ableitungen und auösen der beiden Gleichungen nach a und b. n X (yi − a − bxi ) 2 (80) i Dies ergibt: a1 =y + b1 x Pn xi yi − nxy b1 = Pi=1 2 2 i=1 xi − nx (81) x = a2 + b2 y ⇐⇒ a2 = x + b2 y Pn xi yi − nxy ⇐⇒ b2 = Pi=1 2 2 i=1 yi − ny (83) (82) Analog folgt für: 1.11.2 Korrelation Die Korrelationsanalyse hat die Aufgabe: • Die Stärke (Intensität) des Zusammenhangs festzustellen • Wie ausgeprägt der Einuss des einen Merkmals auf das andere Merkmal ist 3 Achtung, dies ist keine Umkehrfunktion von Gleichung 78 21 (84) • Zur Bewertung dieses Einusses sind Kenngrössen zu entwickeln bzw. zu berechnen Je nach Skalierungsgrad stehen verschiedene Verfahren zur Verfügung: 1. Sind beide Merkmale mindestens Intervallskaliert: Korrelationskoezienz von Bravais Pearson 2. Ist ein Merkmal ordinalskaliert und das ander Merkmal mindestens ordinalskaliert: Rangkorrelationskoezient von Spearman 3. Ist mindestens eines der beiden Merkmale Nominalskaliert: Kontingenzkoezienten und Assoziationsmasse 4. Grundsätzlich können Skalierungsvoraussetzungen von den Merkmalen überfüllt sein, dies ist jedoch nicht ratsam, da das mit einem Informationsverlust verbunden ist. 1.11.3 Bravais Pearson 1. Schritt: Kovarianz Diese ist ein Mass für die Streuung der Merkmalsträger bzw. deren Merkmalswertkombinationen (xi , yi ) um den Mittelpunkt oder Durchschnitt (x, y). Die Kovarianz erfolgt analog zu der, der Varianz Formel: n σXY = 1X (xi − x)(yi − y) n i=1 σXY = 1X xi yi − xy n i=1 (85) n (86) 2. Schritt: Normierung der Kovarianz Es entsteht der Korrelazionskoezient (Normiert wird auf den Wertebereich [−1, 1] r= σXY σX σY (87) oder etwas ausführlicher Pn (xi − x)(yi − y) r = p Pn i=1 Pn ( i=1 (xi − x)2 )( i=1 (yi − y)2 ) Durch Umformung gilt (88) (89) Dabei ist r positiv zu setzen, wenn beide Steigungsmasse positiv sind, oder negativ wenn beide Steigungsmasse negativ sind. Dazu benötigen wir aber Gleichung 85 und Gleichung 86 r= p b1 b2 1.11.4 Interpretation des Korrelationskoezienten von Bravais Pearson Der Korrelationskoezient r berechnet sich zu r. r= Pn σXY i=1 (xi − x) (yi − y) = r P Pn σXσY 2 n 2 (x − x) (y − y) i i i i Pn xi yi − nxy b1 = Pi=1 n x2 − nx2 Pni=1 i xi yi − nxy b2 = Pi=1 n 2 2 i=1 yi − ny (90) (91) (92) • bei positivem r ist der lineare Zusammehang der Merkmale X und Y positiv, bzw gleichläug • bei negativem r ist der lineare Zusammehnahng der Merkmale X und Y negaziv bzw. gegen- läug • Der Betrag von r kann die Werte 0 bis 1 annehmen. 1 bedeutet sehr startker linearer Zusam- mehnang, 0 kein linearer Zusammehnang. Die beiden Regressionsgeraden stehen senkrecht aufeinander 22 1.11.5 Zeitreihe Zeitreihe Eine Zeitreihe ist eine zeitlich geordnete Folge von Merkmalswerten. • Kosten/Gewinnentwicklung • Verbrauch von Ressourcen • Auftrangseingang • Bearbeitungs oder Durchlaufzeiten Die Aufgabe der Zeitreihenanalyse besteht darin, eine Struktur und Gesetzmässigkeit einer Zeitreihe zu erkennen. Sie ist ein Mittel zur Progrnose, oder erkennen eines Trends. Der Trend beschreibt die langfristige Grundrichtung einer Zeitreihe. Um ihn streuen die Zeitreihenwerte im Zeitablauf unf für seine Entwicklung sind dauerhaft wirksame Einüsse verantwortlich. Der Verlauf kann linear oder nichtlinear sein. Wenn er nichtlinear ist, kann er sich einer Exponential, Potenz oder Logistische Funktion annhähern. Die nichtlinearen Verläufe entziehen sich häug aber der intiuitiven Vorstellung werden daher oft falsch bewertet. Die Zeitreihe hat aber einige Stolpersteine. Beispielsweise ist es nicht immer einfach periodische Schwankungen zu erkennen oder besonderer Ereignisse zu identizieren. Lösen lasen sich diese Probleme durch sogenanntes Glätten des Verlaufs durch beispielsweise den gleitenden Durchschnitt oder die Methode der kleinsten Quadrate (siehe Regression:Unterunterabschnitt 1.11.1). 23 2 Beispiele 2.1 Mittelwerte und Spannweite Versicherungssumme in Tsd Anzahl Verträge Median der Klasse xi hi Hj Std. Abweichung Varianz 4-10 10-20 20-30 30-40 40-80 80-120 20 160 80 40 88 12 7 15 25 35 50 100 140 2400 2000 1500 5280 1200 20 180 260 300 388 400 481 2568 484 158 2547.6 827.4 11568.05 41214.4 2928.20 624.1 73752.02 57049.23 • Durchschnittliche Versicherungssume(Gleichung 5): x= 1X 1 xj hj = · 12420 = 3105 n j 400 • Dichte (Gleichung 1) d1 = 20 = 3.33, d2 = 16, d3 = 8, d4 = 4, d5 = 2.2, d6 = 0.3 10 − 4 • Modus Aus den Dichten lässt sich herauslesen, dass Klasse 2 die höchste Dichte hat, diese ist also die Modusklasse. Berechnung des Modus(Gleichung 3) M0 = M0 = d2 − d1 · (xo2 − xu2 ) (d1 − d1 ) + (d2 − d3 ) 16 − 3.33 · (20 − 10) 10 + (16 − 3.33) + (16 − 8) xu2 + = 16130 • Median Der Median ist der Wert der geordneten Mitte von 400 (Summe aller Verträge), also 200. Diese Anzahl kommt in der 3. Klasse zu liegen. Damit ergibt sich der Median(Gleichung 4): Me = Me = n 2 − H2 o (x3 − xu3 ) h3 400 ÷ 2 − 180 (30 − 20) 20 + 80 xu3 + = 22500 • Quantil Die erste Quantilklasse it 400 4 = 100. Dies ist in Klasse 2. Analog zum Median berechnet sich das erste Quantil(Gleichung 4). Q1 = Q1 = n − H1 o xu2 + 4 (x2 − xU 2) h2 400 ÷ 4 − 20 10 (20 − 10) 160 = 50000 Das zweite Quantil ist der Median und das dritte Quantil entspricht dem ersten Quantil plus dem Median. 24 • Quantils und Dezilabstände Quantilsabstände: Der Quantilsabstand bewegt sich 50% um den Median. Q3 − Q1 = 40000 − 15000 = ZQA 25000 Dezilabstände 1 10 − Hj−1 · (xoj − xuj ) hj 9 − 300 400 · 10 · (80 − 40) D9 = 40 + 88 Der Dezilabstand ist D9 − D1 = 56020. Dj = xuj + n· = 67270 2.2 Grundlagen der schliessenden Statistik 1. Es sei X die Zufallsvariable X = Augenzahl bei Würfeln, dann galt für einen Wurf: µ = 3.5, σ 2 = 2, 92. Wie sieht die Häugkeit (Wahrscheinlichkeit), Varianz, Mittelwerte bei einem, zwei oder drei Würfen aus? Die 5 tritt 4 mal auf, die 6 Tritt 10 mal auf. 1. Wurf 3.5 2.92 1.71 Mittelwert µ Varianzσ 2 Std. Abweichung σ 2. Wurf 3.5 2.92 2 1.21 3. Wurf 3.5 = 1.46 2.92 3 0.98 = 0.97 2. Sie haben ein Situationsmodell einer Produktionseinrichtung erstellt, vom realen System wissen sie, dass diese Maschine im normalverteilten Mittel 10 Stück pro Sekunde produziert und die Standardabweichung von 1 Stück pro Sekunde besitzt. Sie führen der Simulationsumgebung 25 Experimente (Replications) durch. Mit welcher Wahrscheinlichkeit wird der mittlere Ausstoss zwischen 9.8 und 10.2 Stück pro Sekunde liegen? Mit welcher Wahrscheinlichkeit wird der Ausstoss über 10.2 liegen? Wie verändert sich das Ergebniss, wenn sie statt dessen nur 5 bzw. 100 Experimente machen? 1S Mit µ = 10S sec und σ = sec . Daraus folgt: ZStichprobe = X −µ √σ n Gesucht ist nun: P (9.8 ≥ x ≥ 10.2) 9.8 − µ P √σ n =⇒ P P ≥ x−µ √σ n ≥ 10.2 − µ ! √σ n 9.8 − 10 x − 10 10.2 − 10 ≥ ≥ 0.2 0.2 0.1 (Z1 ≥ Z ≥ Z2 ) = 1 − α 25 3. In welchem symmetrischen Intervall liegt der Mittelwert bei vorgegebener Wahrscheinlichkeit, oft mit 1 − α bezeichnet. Hier sei 1 − α = 0.9. Z ist nach Voraussetzung N(0,1) verteilt, dann folgt unmittelbar: P (−z ≤ z ≤ z) = 1 − α ⇒ 1 − α = F0 (z) − F0 (−z), wobei z die obere und untere Schranke bildet: Dies nden n σ ÷ n2 Z · σ ÷ n2 5 25 100 0.45 0.2 0.1 0.738 0.328 0.164 Intervall [9.262;10.738] [9.672;10.328] [9.836;10.164] wir wiederum mit der folgenden Formel heraus: Z= X −µ √σ n Daraus folgt Gleichung 57. 2.3 Schätzverfahren Beispiel In einer Wurstfabrik werden u.a. Leberwürste hergestellt. Aus langjährigen Messreihen ist bekannt, dass das Füllgewicht der Leberwürste normalvertwilt ist. Das Soll-Mindestgewicht der Würste beträgt 125g. Aus der Tagesproduktion von 600 Würsten wurder 26 Würste zufällig ohne Zrücklegen entnommen und gewogen. Die Messergebnisse für das Füllgewicht (in Gramm) wurden in eine Tabelle eingetragen. 128.4 123.1 123.3 127.1 123.8 126.6 123.2 125.8 123.5 121.9 123.2 123.7 126.9 125.3 124 125.9 125.5 123.4 122.8 124.9 123.1 122.1 127.1 124.9 124 125.7 Die Daten haben den Mittelwert: X = 124.5g und eine Varianz s = 1.72g. Erstellen des 95% Kondenzintervall: µ = 26. Da s = σ 2 : √ 1.72 z= √ = 0.2572 26 Nun muss man den gesuchrten Wert in der Tabelle der Normalverteilung nachschlagen, in unserem Fall 0.975 (weil es das Mittel von 95% ist, und die Verteilung Normalverteilt ist, können wir einfach die hälfte von 5 dazuzählen). Dabei erhalten wir 1.96. Damit nun das Intervall festgelegt werden kann, muss man erst z mit dem Wert der Tabelle multiplizieren, und dann das Intervall dazu bzw. abziehen. 0.272 · 1.96 = 0.5041 W (123.9959 ≤ 124.5 ≤ 125.0041) Ermittlung der Kondenz für das mit 125g nach unten begrenze Intervall für µ Wir kennen aus Gleichung 57 dass: µ − z √σn > 125g. Da wir n = 26, σ 2 = 1.72, N = 124.5 bereits kennen, können wir diese lediglich einsetzen. 124.5 − z ⇒ → √ √1.72 26 z z(97.5%) > 125 > 1.9440 Den Wert für z(x) muss man in der Tabelle "rückwärts"nachschlagen, also den entsprechenden Wert so genau wie möglich bestimmen und die Zahlen am linken und oberern Rand kombinieren. 26 Beispiel Einer Lieferung von 1000 Paketen Zucker ist mit einer 95% Kondenz bei einem Fehler von e = 0.2g zu untersuchen, ob bei einer bekannten Standardabweichung von 1.2g der garantierte Mittelwert eingehalten wird. Wie viele Proben sind aus der Lieferung mindestens zu entnehmen? • Z aus Tabelle der Standardnormalverteilung: 1.96 • Aus Gleichung 62 folgt: n ≥ n ≥ 1.962 ·1000·1.22 0.22 ·(1000−1)+1.962 ·1.22 121.6 2.4 Testverfahren 2.4.1 Parametertest Eine Autozeitschrift möchte wissen, ob der Benzinverbrauch eines bestimmten Autotyps µ = 1l und mit σ = 100km eingehalten wird. Dazu sollen 25 Autos untersucht werden. Als Nullhypothese H0 geht man davon aus, dass die Angabe stimmt. Bestimmen des Stichprobenmittels der 25 Testfahrzeuge: • einmal 10.2l 100km • einmal 10.4l 100km 10l 100km Die Frage ist: • liegt iene systembedingte Störung und der angegebene Mittelwert ist falsch oder • liegt das Ergebnis im Bereich der statistischen Schwankungen (Toleranz) • Die Frage kann über das Vertrauensintervall beantwortet werden (Gleichung 67) Mit den gegebenen Werten füllen wir die Gleichung 67 aus: µ0 = 10, σ = 1, n = 25, 1 − α = 0.95 1 1 10 − 1.96 √ ≤ x ≤ 10 + 1.96 √ 25 25 Unter der gegebenen Wahrscheinlichkeitsangabe würde die Nullhypothese mit dem Stichprobenmitel von 10.2 noch angenommen und der Unterschied als statistische Schwankung akzeptiert. Hingegen wird das Stichprobenmittel von 10.4 als signikante Abweichung betrachten und somit die Nullhypothese zurückgewiesen. Der mögliche Fehler liegt bei 2.5%. 2.5 Unabhängigkeitstest Ein Unternehmen stellt ein Produkt in vier Zweigwerken her. Je nach erreichter Qualität wird ein Produkt in eine von 3 Qualitätstufen eingeordnet. Es soll mittels einer Stichprobe von 500 Stück untersucht werde, ob zwischen der Qualität der Produkte und den Zweigwerken, in denen sie hergestellt werden, ein Zusammenhang beziehungsweise Abhängigkeit besteht Die Randhäugkeiten sind gelb markiert. Zweigwerk 1 2 3 4 Summe Qualitätsstufe 1 2 3 125 25 10 75 20 10 60 25 15 75 40 20 335 110 55 Summe 160 105 100 135 500 1 Schritt: Signikanzzahl 0.01 festgelegt. Freiheitsgrade sind: 3 Qualitätsstufen 3 − 1 = 2 und 4 Zweigwerke 4 − 1 = 3. Multipliziert ergibt das, dass es 6 Freiheitsgrade gibt. 27 2 Schritt: Der Testwert y berechnet sich auch hier als Summe der quadrierten Dierenzen zwischen tatsächlicher und erwarteter Häugkeit jeweils dividiert durch die erwartete Häugkeit. Die erwartete Häugkeit ermittelt man durch die Randverteilung: hth 32 100 = 110 500 hth 32 = 110·100 500 hth 32 = 22 Die Zahlen werden durch die Randhäugkeiten in der Tabelle entnommen. 500 ist die Summe aller Randhäugkeiten, 100 die Summe aus der Zeile 3, 110 die Summe aus der Spalte 2, daher auch hth 32 3 Schritt: Daraus ergibt sich, mit Vorlage aus Gleichung 75: y= (125 − 107.2)2 (25 − 35.2)2 (20 − 14.85)2 + + ... + = 20.72 107.2 35.2 14.85 Daraus ergibt sich eine Tabelle mit neuen Werten. Zweigwerk 1 2 3 4 Summe 1 107.2 70.35 67 90.45 335 Qualitätsstufe 2 3 35.2 17.6 23.1 11.55 22 11 29.7 14.85 110 55 Summe 160 105 100 135 500 C0 aus der Tabelle ist 15.086 < 20.72. Die Hypothese wird abgelehnt, die Ergebnisse der Zweigwerke sind nicht unabhängig. 2.6 Zusammenhang zwischen zwei Merkmalen 2.6.1 Regressionsanalyse Zusammehang zwischen Merkmalen nw = 1500 weibliche und nm = 500 männliche Kunden haben alle einen Artikel gekauf, der in verschiedenen Farben verfügbar ist: Wenn das Einkaufs- Farbe Häugkeit Blau 1000 Grün 600 Rot 400 Summe 2000 verhalten unabhängig ist, so müssten die relativen Häugkeiten bezogen auf Männer und Frauen gleich sein, oder mindestens sehr nahe beieinander liegen(siehe Gleichung 77). Geschlecht Weiblich Männlich Summe Farbe Blau Grün (1000 · 1500) ÷ 2000 (1000 · 150) ÷ 2000 (600 · 1500) ÷ 2000 (1000 · 150) ÷ 2000 1000 600 Rot (400 · 1500) ÷ 2000 (1000 · 150) ÷ 2000 400 Summe 1500 500 2000 Wenn man nun die Resultate mit einer Tabelle aus, beispielsweise dem Vorjahr, vergleicht, und die Werte über "Pi-mal-Daumen"passen, sind die Merkmale eher voneinander abhängig. 28 Minimiere die Summenformel n X (yi − a − bxi )2 i 1. Partielles Ableiten des Ausdrucks nach a und nach b 2. Nullsetzen der beiden partiellen Ableitungen 3. Auösen der beiden Gleichungen nach a und b a1 b1 2.6.2 = y + b1 · x Pn i=1 xi yi − n · x · y Pn = 2 2 i=1 xi − nx Lineare Regression Beispiel 12 Studenten gingen im letzten Semester neben dem Studium einer Erwerbstätigkeit nach. In der nachstehenden Tabelle sind für die 12 Studenten A bis L der zeitliche Aufwand (Std/Woche) für die Erwerbstätigkeit X und der zeitzliche Aufwand (Std./Woche) für das Studium Y angegeben Student A B C D E F G H I J K L Erwerbstätigkeit Studium 1 39 2 37 2 36 3 40 3 36 4 37 5 34 6 36 8 33 12 33 15 32 33 27 Ein Student, der für die Bestreitung seines Lebensunterhalts 6 Stunden pro Woche erwärbstätig sein muss, will anhand der vorliegenden Daten ermitteln, wieviel Zeit er für sein Studium aufbringen kann. Die Berechnung erfolgt mit Gleichung 81 und Gleichung 82. Student xi yi xi yi x2i yi2 A B C D E F G H I J K L Summe 1 2 2 3 3 4 5 6 8 12 15 23 84 39 37 36 40 36 37 34 36 33 33 32 27 420 39 74 72 120 108 148 170 216 264 396 480 621 2708 1 4 4 9 9 16 25 36 64 144 225 529 1066 1521 1369 1296 1600 1296 1369 1156 1296 1089 1089 1024 729 14834 Wir können nun mit den oben erwähnten Gleichungen die Werte berechnen. b1 = a1 = = = = = 420 2708−12· 84 12 · 12 2 1066−12·( 84 12 ) 116 − 239 −0.49 420 116 12 − (− 239 ) · 9177 239 38.43 29 84 12 Daraus folgt zu allgemeinen Berechnung y = 38.43 − 0.49 · x mit y(6) = 35.5h 30