Statistik II für Betriebswirte Vorlesung 1 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 19. Oktober 2016 Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 1 Organisatorisches I Vorlesung: Mi., 7:30-9:00, KKB-2030. I Übungen: I I I I Mo., 14:00-15:30, WER-1118, Dr. Ballani, 3.BWIW. Do., 9:15-10:45, PRÜ-1104, Dipl.-Math. Dietz, 3.BBWL. Do., 14:00-15:30, PRÜ-1104, Dr. Wünsche, 3.BBWL, 3.BWLRW. Fr., 11:00-12:30, HUM-1115, Dipl.-Math. Dietz, 3.BBWL. I Selbststudium (Laut Modulbeschreibung zusammen für beide Semester 120 h Präsenzzeit und 150 h Selbststudium.) I Information: http://www.mathe.tu-freiberg.de/wiwistat I Prüfung: Klausur 120 Minuten, zugelassen sind Taschenrechner, Bücher, Mitschriften; nicht zugelassen sind Laptops, Handys. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 2 Themenkomplexe in diesem Semester I Statistische Tests. I Stichprobenpläne. I Varianzanalyse. I Regressionsanalyse. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 3 Klausurergebnisse Statistik 1 für Betriebswirte Prof. ANOVA Table for Punkte by Fach Source Sum of Squares Df Mean Square F-Ratio Between groups 666,085 3 222,028 3,10 Within groups 6952,78 Statistik97 71,6781 Vorlesung 1 Dr. Hans-Jörg Starkloff II für Betriebswirte P-Value 0,0304 Version: 18. Oktober 2016 4 Erinnerung: Statistik I I Statistische Grundsituation: Zufallsgröße X , für die die Verteilung gar nicht oder nicht vollständig bekannt ist. I Bekannt: Konkrete Stichprobe (x1 , . . . , xn ) vom Umfang n , die als Realisierung einer mathematischen Stichprobe (X1 , . . . , Xn ) modelliert wird (X1 , . . . , Xn sind unabhängige Zufallsgrößen, die dieselbe Verteilung wie X besitzen). I Parameterschätzungen durch Punktschätzungen mit Hilfe von Stichprobenfunktionen, z.B. falls X ∼ N(µ, σ 2 ), µ, σ 2 unbekannt: 1 (x1 + . . . + xn ) ; n c2 (x1 , . . . , xn ) = s 2 = 1 ((x1 − x)2 + . . . + (xn − x)2 ) . VarX ≈ σ n−1 EX ≈ µ b(x1 , . . . , xn ) = x = Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 5 Fortsetzung Erinnerung: Statistik I I Parameterschätzungen durch Intervallschätzungen mit Hilfe von Stichprobenfunktionen für die untere und obere Intervallgrenze, z.B. falls X ∼ N(µ, σ 2 ), µ, σ 2 unbekannt: Mit dem Quantil tn−1;1− α2 zum Niveau 1 − α2 der t-Verteilung mit n − 1 Freiheitsgraden gilt √ X −µ ≤ tn−1;1− α2 = 1 − α , P −tn−1;1− α2 ≤ n S S S P X − √ tn−1;1− α2 ≤ µ ≤ X + √ tn−1;1− α2 = 1 − α . n n I Damit erhält man die Formel für das (zweiseitige) Konfidenzintervall Iµ für den Erwartungswert µ einer Normalverteilung bei unbekannter Varianz σ 2 zum Konfidenzniveau 1 − α S S Iµ = X − √ tn−1;1− α2 ; X + √ tn−1;1− α2 . n n Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 6 4. Grundlagen des statistischen Schließens II (Tests) 4.1 Parametertests I I Eine Hauptaufgabe der schließenden Statistik besteht in der Durchführung von Tests. Dabei werden Hypothesen (d.h. Annahmen, Vorgaben, etc.) über wahrscheinlichkeitstheoretische Modelle mit Hilfe von Stichproben überprüft, z.B. I I I I die Einhaltung von Sollwerten, die Einhaltung von Toleranzgrenzen, die Einhaltung von Ausschusswahrscheinlichkeiten oder der Vergleich von unterschiedlichen Verfahren hinsichtlich eines (mittleren) Qualitätsparameters. Der Zufallseinfluss (man nutzt Werte einer Stichprobe zur Entscheidung, eine andere Stichprobe kann zu einer anderen Entscheidung führen) spielt eine wesentliche Rolle. ⇒ Man kann keine 100%-ig richtigen Entscheidungen treffen, sondern die Entscheidungen sind immer auch mit möglichen Fehlern und entsprechenden Fehlerwahrscheinlichkeiten verbunden. I Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 7 Beispielaufgabe: Waschmittelpackungen I Bei einem Verbrauchertest für Waschmittel werde auch die Abfüllmenge kontrolliert. Dabei ergaben sich bei 10 zufällig ausgewählten 5 kg Packungen einer bestimmten Sorte folgende Abfüllmengen (in kg): 4.6 , 4.95 , 4.8 , 4.9 , 4.75 , 5.05 , 4.9 , 5.1 , 4.85 , 4.95 . Ist auf der Basis dieser Beobachtungswerte die Auffassung vertretbar, dass die Packungen im Mittel weniger Waschmittel als angegeben enthalten ? I Wir modellieren die tatsächliche Abfüllmenge (in kg) einer Waschmittelpackung als Zufallsgröße X . I Berechnete Schätzwerte für den Erwartungswert, die Standardabweichung und die Varianz der Merkmalsgröße sind: x = 4.885 , Prof. Dr. Hans-Jörg Starkloff s = 0.145 , s 2 = 0.0211 . Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 8 Mathematische Überlegungen zur Beispielaufgabe I Wir nehmen an, diese Zufallsgröße X ist normalverteilt (Addition vieler kleiner zufälliger Schwankungen im Abfüllprozess und zentraler Grenzwertsatz). I Der Erwartungswert µ ist unbekannt. I Zur Vereinfachung nehmen wir an, die Varianz sei σ 2 = 0.025 . I Zu überprüfen ist die Richtigkeit der Vermutung, dass der Erwartungswert µ kleiner ist als der Sollwert µ0 = 5 . I Dies kann aber nicht einfach aus der Tatsache x = 4.885 < 5 = µ0 gefolgert werden. I Man kann schließlich zufällig eine Stichprobe mit geringen Abfüllmengen erwischt haben. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 9 Grundlegende Überlegungen zu statistischen Tests I I Aufstellen der Hypothesen: man formuliert 2 komplementäre Hypothesen, die Nullhypothese H0 und die Alternativhypothese HA (oft auch mit H1 bezeichnet) z.B. oder H0 : µ = µ 0 H0 : µ ≥ µ 0 und und HA : µ 6= µ0 HA : µ < µ0 . Beachte: Die Hypothese, die statistisch abgesichert werden soll, sollte als Alternativhypothese formuliert werden! I 2 mögliche Entscheidungen beim Testen: 1. H0 wird verworfen: Es gibt in der erhobenen Stichprobe starke Hinweise darauf, dass H0 nicht gelten kann, also HA gelten muss. Diese Hinweise sind so stark, dass man nicht von einem zufälligen Zustandekommen ausgehen kann. 2. H0 wird nicht verworfen: Man hat keine Hinweise gefunden, die gegen H0 sprechen. Alle aufgetretenen Effekte könnten genauso gut zufallsbedingt sein. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 10 Grundlegende Überlegungen zu statistischen Tests II I Statistisches Testproblem: Aufgabenstellung, zwischen der Gültigkeit von H0 und HA zu unterscheiden. I Statistischer Test: formale Entscheidungsregel für eine der 2 Möglichkeiten. I Mögliche Fehler beim Testen: I I Fehler 1. Art: man verwirft H0 , obwohl H0 richtig ist; Fehler 2. Art: man verwirft H0 nicht, obwohl H0 falsch ist. ⇒ Tests sind so zu konstruieren, dass beide Fehler möglichst klein sind. I Aber: Es können nicht beide Fehler gleichzeitig kontrolliert werden. ⇒ Man gibt sich eine (relativ kleine) obere Schranke für die Wahrscheinlichkeit des Fehlers 1. Art vor, die nicht überschritten werden soll – das sogenannte Signifikanzniveau α. I Übliche Werte für das Signifikanzniveau α sind 0.05 oder 0.01. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 11 Grundlegende Überlegungen zu statistischen Tests III I In der Regel wird ein statistischer Test so konstruiert, dass er unter allen Tests, für die die Wahrscheinlichkeit des Fehlers 1. Art das gegebene Signifikanzniveau nicht überschreitet, den Fehler 2. Art minimiert. I Wie erhält man eine Entscheidungsregel für ein gegebenes Testproblem? I Im obigen Beispiel würde man intuitiv so vorgehen: I I I I Hypothesen: H0 : µ ≥ µ0 = 5 , HA : µ < 5 ; liegt der Schätzwert x für µ über oder nur knapp unter µ0 = 5 , so kann man nicht mit hinreichender Sicherheit schließen, dass H0 : µ ≥ µ0 = 5 nicht gilt; liegt hingegen x unter einem kritischen Wert deutlich unter µ0 = 5 , so kann man die Nullhypothese verwerfen. Wie weit der kritische Wert unter µ0 liegen muss, hängt vom Signifikanzniveau α ab. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 12 Allgemeine Struktur der Entscheidungsregel I Testgröße T : I I I I I Kritischer Bereich Kα (auch Ablehnungsbereich) : I I I I ist eine Stichprobenfunktion (d.h. eine Funktion der mathematischen Stichprobe X1 , ..., Xn ), also eine Zufallsgröße; ist bei Parametertests oft eine Schätzfunktion für den zu testenden Parameter oder davon abgeleitet (im Beispiel X ); die Verteilung von T bei Gültigkeit der Nullhypothese muss bekannt sein; setzt man statt der mathematischen Stichprobe eine konkrete Stichprobe x1 , ..., xn ein, so erhält man eine reelle Zahl t als Realisierung der Zufallsgröße T . ist von α abhängig; wird so konstruiert, dass P(T ∈ Kα |H0 ) ≤ α gilt; im Beispiel ist Kα = {t ∈ R : t < tα } , wobei tα der oben erwähnte kritische Wert ist. Die Entscheidung lautet dann: ist t ∈ Kα , so wird H0 verworfen, andernfalls nicht. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 13 Allgemeiner Testablauf I Alternative Entscheidungsregel (zumeist in statistischer Software umgesetzt): I I I Berechnung eines p-Werts : p = min{α : t ∈ Kα } ; H0 wird verworfen, wenn p ≤ α , bei p > α wird H0 beibehalten. Allgemeiner Ablauf eines statistischen Tests: 1. 2. 3. 4. Aufstellen der Hypothesen Festlegen des Signifikanzniveaus α Bestimmen der Testgröße T Berechnung der Realisierung t der Testgröße T auf der Basis der konkreten Stichprobe (x1 , . . . , xn ) 5. Bestimmen des kritischen Bereichs Kα bzw. des p-Wertes 6. Testentscheidung: t ∈ Kα t 6∈ Kα I ⇔ ⇔ p≤α p>α ⇒ Ablehnung von H0 ; ⇒ Stichprobe spricht nicht gegen H0 . Neben der formalen Testentscheidung sollte noch eine inhaltliche Aussage entsprechend der Aufgabenstellung getroffen werden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 14 Interpretation der Testergebnisse I Beim Testen wird nur die Wahrscheinlichkeit für den Fehler 1. Art kontrolliert, d.h. P(H0 ablehnen | H0 wahr) ≤ α . I Wenn also H0 tatsächlich gilt, wird man sich nur in α · 100% der Fälle für HA entscheiden. I Die Entscheidung für HA ist in diesem Sinn statistisch abgesichert. I Bei einer Entscheidung gegen H0 und damit für HA spricht man von einem signifikanten Ergebnis. I Die Wahrscheinlichkeit für den Fehler 2. Art wird erst einmal nicht kontrolliert. ⇒ Eine Entscheidung H0 beizubehalten ist nicht statistisch abgesichert. ⇒ Kann man H0 nicht verwerfen, bedeutet das daher nicht, dass man sich aktiv“ für H0 entscheidet; es spricht nur nichts gegen H0 . ” Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 15 Einfluss verschiedener Größen auf das Ergebnis eines Tests I Einfluss von α (andere Parameter fest): I I I Für kleiner werdende Werte α wird die Wahrscheinlichkeit für den Fehler 1. Art kleiner, d.h. H0 wird weniger häufig abgelehnt, falls H0 tatsächlich zutrifft. Je kleiner α ist, desto kleiner ist der kritische Bereich. Einfluss von n (andere Parameter fest): I I Für größer werdende Werte n werden die Schätzungen auf Basis von erwartungstreuen und konsistenten Schätzgrößen genauer und man wird öfters richtig entscheiden. Insbesondere wird die Wahrscheinlichkeit für den Fehler 2. Art kleiner und damit wird man öfter die Nullhypothese H0 ablehnen, wenn sie falsch ist. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 16 Konfidenzintervalle und Parametertests I Eine Hypothese über einen Parameter einer Verteilung heißt einfach, wenn durch sie nur ein Element der Parametermenge festgelegt wird (z.B. µ = µ0 ), sonst heißt eine Hypothese zusammengesetzt. I Ein Konfidenzintervall mit Konfidenzniveau 1 − α für einen Parameter enthält genau diejenigen Werte des Parameters, für die die einfache Nullhypothese zu diesem Parameter mit einem Signifikanzniveau α nicht abgelehnt wird. I Im Folgenden sollen einige wichtige Tests bei normalverteilten Grundgesamtheiten kurz vorgestellt werden. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 17 Mittelwerttest bei bekanntem σ (Gauß-Test) I Annahme: X ∼ N(µ, σ 2 ), I Zweiseitiger Test I I I I I σ 2 bekannt. Hypothesen: H0 : µ = µ0 , HA : µ 6= µ0 . 2 Unter H0 gilt: X ∼ N µ0 , σn . X − µ0 √ n ∼ N(0, 1) . σ Kritischer Bereich: Kα = {t ∈ R : |t| > z1−α/2 } . Testgröße: T = Einseitige Tests I Im Fall von H0 : µ ≥ µ0 , HA : µ < µ0 gilt Kα = {t ∈ R : t < zα = −z1−α } . I Im Fall von H0 : µ ≤ µ0 , HA : µ > µ0 gilt Kα = {t ∈ R : t > z1−α } . I Die Tests sind für große Werte n (n ≥ 30) auch ohne Normalverteilungsvoraussetzung anwendbar. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 18 Mittelwerttest bei unbekanntem σ ( t−Test“) ” I Annahme: X ∼ N(µ, σ 2 ), I Zweiseitiger Test I I I I σ 2 unbekannt. Hypothesen: H0 : µ = µ0 , HA : µ 6= µ0 . X − µ0 √ Testgröße: T = n ∼ tn−1 (t−Verteilung mit n − 1 S Freiheitsgraden). Kritischer Bereich: Kα = {t ∈ R : |t| > tn−1;1−α/2 } . Einseitige Tests I Im Fall von H0 : µ ≥ µ0 , HA : µ < µ0 gilt Kα = {t ∈ R : t < tn−1;α = −tn−1;1−α } . I Im Fall von H0 : µ ≤ µ0 , HA : µ > µ0 gilt Kα = {t ∈ R : t > tn−1;1−α } . I Die Tests sind für große Werte n (n ≥ 30) auch ohne Normalverteilungsvoraussetzung anwendbar. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 19 Streuungstest ( χ2 −Streuungstest“) ” I Annahme: X ∼ N(µ, σ 2 ) , I Zweiseitiger Test I I I I µ unbekannt. Hypothesen: H0 : σ = σ0 , HA : σ 6= σ0 . (n − 1)S 2 ∼ χ2n−1 (χ2 -Verteilung mit n − 1 Testgröße: T = σ02 Freiheitsgraden). Kritischer Bereich: Kα = {t ∈ R : t < χ2n−1;α/2 } ∪ {t ∈ R : t > χ2n−1;1−α/2 } Einseitige Tests I Im Fall von H0 : σ ≥ σ0 , HA : σ < σ0 gilt Kα = {t ∈ R : t < χ2n−1;α } . I Im Fall von H0 : σ ≤ σ0 , HA : σ > σ0 gilt Kα = {t ∈ R : t > χ2n−1;1−α } . Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 20 Mittelwertvergleich bei gleichen (unbekannten) Varianzen ( doppelter t−Test“) ” I Geg.: zwei unabh. Merkmale X ∼ N(µ , σ2 ), X ∼ N(µ , σ2 ) ; 1 1 2 2 entsprechend zwei Stichproben vom Umfang n1 und n2 mit arithmetischen Mittelwerten X 1 und X 2 und Stichprobenvarianzen S12 und S22 . I Voraussetzung: beide Varianzen sind gleich σ 2 , σ 2 ist unbekannt. I Hypothesen: H0 : µ1 = µ2 , HA : µ1 6= µ2 (zweiseitiger Test). r X1 − X2 n1 n2 Testgröße: T = q . (n1 −1)S12 +(n2 −1)S22 n1 + n2 I n1 +n2 −2 Im Fall von n1 = n2 = n gilt X1 − X2 √ T =q n. S12 + S22 I Kritischer Bereich: Kα = {t ∈ R : |t| > tn1 +n2 −2;1−α/2 } . I Die Tests sind für große Werte n1 , n2 (Faustregel: n1 , n2 ≥ 30) auch ohne Normalverteilungsvoraussetzung anwendbar. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 21 Mittelwertvergleich bei möglicherweise ungleichen Varianzen ( Welch-Test“) ” I Geg.: Zwei unabh. Merkmale X1 ∼ N(µ1 , σ12 ) , X2 ∼ N(µ2 , σ22 ) ; entsprechend zwei Stichproben vom Umfang n1 und n2 mit arithmetischen Mittelwerten X 1 und X 2 und Stichprobenvarianzen S12 und S22 . I Voraussetzung: σ12 , σ22 sind unbekannt. I Hypothesen: H0 : µ1 = µ2 , X1 − X2 Testgröße: T = q 2 S1 S22 n1 + n2 I I (zweiseitiger Test). Kritischer Bereich: Kα = {t ∈ R : |t| > tm;1−α/2 }, 2 2 2 m= I HA : µ1 6= µ2 S1 n1 1 n1 −1 S2 1 n1 S + n2 2 2 + n 1−1 2 S2 2 n2 2 (Abrundung zur ganzen Zahl) int Bemerkung: Dies ist ein approximativer Test. Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 22 Streuungsvergleich ( F −Test“) ” I Geg.: Zwei unabh. Merkmale X1 ∼ N(µ1 , σ12 ) , X2 ∼ N(µ2 , σ22 ) ; entsprechend zwei Stichproben vom Umfang n1 und n2 mit Stichprobenvarianzen S12 und S22 . I Voraussetzung: µ1 , µ2 unbekannt. I Hypothesen: H0 : σ12 = σ22 , I Testgröße: T = I Kritischer Bereich: Kα = {t > 0 : t < Fn1 −1;n2 −1;α/2 } ∪ {t > 0 : t > Fn1 −1;n2 −1;1−α/2 } HA : σ12 6= σ22 (zweiseitiger Test). S12 . S22 (Quantile der F −Verteilung mit (n1 − 1; n2 − 1)-Freiheitsgraden). Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 23 Beispiel: Analyseverfahren I Verfahren 1 : x 1 = 0.99 , s1 = 0.0236 , n1 = 10 . 1.01 , 0.99 , 1.02 , 0.97 , 1.00 , 0.94 , 0.98 , 1.00 , 1.01 , 0.98 Verfahren 2 : x 2 = 1.00 , s2 = 0.0471 , n2 = 10 . 0.98 , 1.02 , 1.04 , 1.00 , 1.06 , 0.96 , 1.02 , 0.90 , 0.98 , 1.04 I H0 : µ1 = 1.00 , HA : µ1 6= 1.00 , α = 0.05 . I H0 : σ1 ≤ 0.01 , HA : σ1 > 0.01 , α = 0.05 . I H0 : σ12 = σ22 , HA : σ12 6= σ22 , α = 0.10 . I H 0 : µ1 = µ2 , HA : µ1 6= µ2 , α = 0.05 (Welch-Test). Prof. Dr. Hans-Jörg Starkloff Statistik II für Betriebswirte Vorlesung 1 Version: 18. Oktober 2016 24