1415 Kompetenzfeld Qualitätsmanagement Grundkurs II Statistik für Produktion und Dienstleistung Peter Hackl, Abteilung für Wirtschaftsstatistik, UZA II, 4. Ebene Sprechstunden: Fr, 10:45 -11:45 http://statistik.wuwien.ac.at/stat4/hackl/ss04/qmss04.htm Statistische Grundlagen: Überblick Literatur: Hackl & Katzenbeisser, Statistik für Sozial- und Wirtschaftswissenschaften: Kap.9: Konzepte der statistischen Inferenz; Kap. 10.1: Das Lageproblem. Ledolter & Burrill, Statistical Quality Control: Kap. 6: Measurements and Their Importance for Sampling; Kap. 9: Sample Surveys; Kap. 10: Statistical Inference under Simple Random Sampling. 27.2.2004 Statistische Grundlagen: Überblick 2 Woher kommen die Daten? Datengewinnung durch Primärstatistiken Beobachtung (passiv oder aktiv [Experiment]) Befragung der statischen Einheiten 27.2.2004 Statistische Grundlagen: Überblick 3 Messen Messen: Ist Ergebnis eines Messprozesses mit Messinstrumenten Messverfahren messenden Personen Beispiele: gemessen werden (A) die Länge eines Tisches, (B) die Länge eines Eies, (C) die Härte von Stahl, (D) die Zufriedenheit des Käufers eines PKW 27.2.2004 Statistische Grundlagen: Überblick 4 Qualität von Messungen Kriterien für die Qualität von Messungen systematischer Fehler (Bias) Präzision Reproduzierbarkeit Stabilität 27.2.2004 Statistische Grundlagen: Überblick 5 Qualität von Messungen, Forts. Problembereiche für hohe Datenqualität Deming (Out of the Crisis, 1986): "Clear operational definitions" Soziale Faktoren beeinflussen die Messung Sind die Daten relevant für Fragestellung? 27.2.2004 Statistische Grundlagen: Überblick 6 Prozesse: Messen - Variabilität Beobachten (Messen) ist zentrales Element für Qualität von Produktions- und Dienstleistungsprozessen Prozessvariabilität Messvariabilität Beispiele 27.2.2004 Statistische Grundlagen: Überblick 7 Datenerhebungen (surveys) Vollerhebung (census) und Stichprobe Grundgesamtheit (Umfang N; N meist sehr groß) Statistische Einheiten, Elemente Stichprobenrahmen (Liste aller Elemente der Grundgesamtheit) Stichprobe (Umfang n; n meist klein) 27.2.2004 Statistische Grundlagen: Überblick 8 Auswahl der Stichprobe Auswahl ohne Zufallsmechanismus (nonprobability sample survey) Bequemlichkeits-Stichprobe (convenience sampling) Systematische Stichprobe Auswahl nach Zufallsprinzip (probability sample survey) Einfache Zufallsstichprobe (simple random sample) Geschichtete Zufallsstichprobe (stratified random sample) Systematische Zufallsstichprobe Klumpen- (Cluster)stichprobe 27.2.2004 Statistische Grundlagen: Überblick 9 Einfache Zufallsstichprobe jede mögliche Stichprobe vom Umfang n hat die gleiche Wahrscheinlichkeit, gezogen zu werden 27.2.2004 Statistische Grundlagen: Überblick 10 Beispiel 1: Einfache Zufalls-SP G = {a,b,c,d,e}, n=2: es gibt 10 mögliche Stichproben: (a,b), (a,c), ..., (a,e), ..., (d,e) Urne enthält 10 Zettel mit den 10 Paaren; wir wählen zufällig einen aus Urne enthält 5 Zettel mit den 5 Buchstaben; wir wählen zufällig zwei (ohne Zurücklegen) aus Zufallszahlen 27.2.2004 Statistische Grundlagen: Überblick 11 Zufallszahlen In Büchern; z.B. in Ledolter & Burrill, S.233; Hackl & Katzenbeisser, S. 434 Statistik-Software kann Pseudozufallszahlen erzeugen, z.B. EXCEL: Analyse-Funktionen >> Zufallszahlengenerierung >> Diskrete Verteilung 27.2.2004 Statistische Grundlagen: Überblick 12 Einfache ZSP: Vor-/Nachteile Vorteile Ergebnisse haben keinen systematischen Fehler (Bias); sie sind "unverzerrt" kontrollierter Stichprobenfehler Nachteil in Praxis nicht leicht realisierbar, oft aufwendig 27.2.2004 Statistische Grundlagen: Überblick 13 Erhebungsfehler Reiner Stichprobenfehler (pure sampling error): Variation des Ergebnisses dadurch, dass bestimmte Elemente ausgewählt werden; messbar Nicht-Stichprobenfehler (nonsampling error): Effekte von schlechter Repräsentation, Problemen der Erhebungstechnik, der beteiligten Personen, schlechte Fehlerkontrolle, etc.; kaum messbar 27.2.2004 Statistische Grundlagen: Überblick 14 Geschichtete Zufallsstichprobe Zerlegung der Grundgesamtheit in Schichten; innerhalb jeder Schicht: Einfache Zufallsstichprobe Vorteil: reduzierter Stichprobenfehler 27.2.2004 Statistische Grundlagen: Überblick 15 Beispiel 4: Einkommen Reine ZSP Geschichtete ZSP a=2, b=3, MW=2.5 nicht möglich a=2, c=6, MW=4.0 a=2, c=6, MW=4.0 a=2, d=7, MW=4.5 a=2, d=7, MW=4.5 b=3, c=6, MW=4.5 b=3, c=6, MW=4.5 b=3, d=7, MW=5.0 b=3, d=7, MW=5.0 c=6, d=7, MW=6.5 nicht möglich 27.2.2004 Statistische Grundlagen: Überblick 16 Klumpenstichprobe Vollerhebung in zufällig ausgewählten Teilmengen (Klumpen; Teilmengen, die die Grundgesamtheit gut repräsentieren) Geschichtete und Klumpenstichprobe: sind Beispiele für zweistufige Stichprobenverfahren 27.2.2004 Statistische Grundlagen: Überblick 17 Statistische Entscheidungen Auch „Statistische Inferenz“ Einfache Zufalls-Stichproben 27.2.2004 Statistische Grundlagen: Überblick 18 Beispiel 5: Abfüllmenge unbekannter Mittelwert μ der Füllmenge soll geschätzt werden Stichprobe (n = 25): x-bar = 126.7, s = 0.5. Punktschätzer für μ ist x-bar Konfidenzintervall für μ: x-bar ± c. Testen von H0: μ = 126.4 gegen H1: μ > 126.4 27.2.2004 Statistische Grundlagen: Überblick 19 Beispiel 6: Ausschussanteil Unbekannter Ausschussanteil θ Stichprobe (n = 200) gibt Ausschussanteil von p = 3.5% Punktschätzer für θ ist p = 0.035 Konfidenzintervall p ± c Testen die Nullhypothese H0: θ = 0.02 gegen H1: µ > 0.02 27.2.2004 Statistische Grundlagen: Überblick 20 Stichprobenverteilungen Wahrscheinlichkeitsverteilungen von x-bar und p erlauben statistische Entscheidungsverfahren Zentraler Grenzwertsatz 27.2.2004 Statistische Grundlagen: Überblick 21 Stichprobenmittelwert Grundgesamtheit: X mit (beliebiger) Verteilung, und . Stichprobenmittelwert x-bar: Mittelwert von x-bar ist Standardabweichung (Standardfehler, standard error) von x-bar ist StdAbw(x-bar) = /n Für nicht zu kleines n: x-bar ist näherungsweise normalverteilt 27.2.2004 Statistische Grundlagen: Überblick 22 Konfidenzintervall für μ Konfidenzintervall zur Konfidenzzahl γ = 0.95 x-bar ± c Mit c = 2/n genauer: c = 1.96 /n 99.7%-iges KI: x-bar ± 3 /n 90%-iges KI: x-bar ± 1.645 /n 27.2.2004 Statistische Grundlagen: Überblick 23 Test für μ Lege H0 (μ = μ0) und H1 fest Wähle den maximal tolerierten p-Wert (probability value), d.i. die Wahrscheinlichkeit, den Fehler 1. Art zu begehen (das Signifikanzniveau, auch mit bezeichnet); z.B. 0.05 Ziehe die Stichprobe, berechne x-bar Berechne den p-Wert Verwerfe H0, wenn der p-Wert kleiner als ist 27.2.2004 Statistische Grundlagen: Überblick 24 Konfidenzintervall, Test für θ Analog zu den Aufgaben für μ Der Anteil p hat analoge Verteilungseigenschaften zu x-bar: p ist näherungsweise normalverteilt N(θ, [θ (1- θ)/n]) 27.2.2004 Statistische Grundlagen: Überblick 25 Stichprobenumfang Bei Vorgabe von c und γ=0.95 kann n berechnet werden aus n =(2σ/c)2 27.2.2004 Statistische Grundlagen: Überblick 26 Wahrscheinlichkeitsverteilungen Testverteilungen: Normal-, t-, ChiQuadrat-, F-Verteilung Verteilungen in der Zuverlässigkeitstheorie: Exponentialverteilung Gammaverteilung Weibullverteilung 27.2.2004 Statistische Grundlagen: Überblick 27