WEBINAR@LUNCHTIME C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . THEMA: "STATISTIK IN DER PRAXIS – TESTEN IST BESSER ALS VERMUTEN" TORSTEN SCHOLZ WEBINAR@LUNCHTIME EINLEITENDES BEISPIEL • SAT: Standardisierter Test, der von Studienplatzbewerbern an amerikanischen Unis gefordert wird • Bewertet werden (u.a.) mathematische Kenntnisse und sprachliche Ausdrucksfähigkeit • Allgemeiner Bildungsstand soll anhand des durchschnittlichen Testergebnisses bewertet werden • Bildungsausschuss vermutet Abweichung der mittleren Punktzahl vom Sollwert (1200 Punkte) • Vermutung soll empirisch überprüft werden C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME PRINZIPIEN DES STATISTISCHEN TESTENS Statistisches Testen: Empirische Überprüfung von Annahmen über das Verhalten eines Merkmals in der Grundgesamtheit H0 versus H1 Durchführung eines statistischen Tests muss gewissen Prinzipien genügen: • Auffassen der inhaltlichen Fragestellung als statistisches Testproblem • Definieren einer Entscheidungsregel • Sammeln von Daten für die empirische Bewertung • Anwenden der Entscheidungsregel, d.h. fällen einer Testentscheidung C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME HYPOTHESEN AUFSTELLEN • Formalisieren der Problemstellung: Zufallsvariable π beschreibe die erzielte Punktzahl Vorgabe der Schulbehörde als Aussage über den Erwartungswert von π formulierbar: π = πΈ π = π0 = 1200 • Auffassen der inhaltlichen Fragestellung als statistisches Testproblem: π»0 : π = π0 vs. π»1 : π ≠ π0 • Empirische Überprüfung anhand von Stichprobe vom Umfang π. Testergebnisse als Realisationen unabhängiger Wiederholungen π1 , … , ππ von π interpretierbar • U.U. Formulierung weiterer Modellannahmen, z.B. über Verteilung von π bzw. π1 , … , ππ π~π π, π 2 , π 2 unbekannt C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME SIGNIFIKANZNIVEAU FESTLEGEN Festlegung des Ablehnungsbereichs (Stichprobenergebnisse, die für π»1 sprechen): • Verdichten der Stichprobeninformation zu geeigneter Prüfgröße / Teststatistik • Anforderung 1: Sensibel für Testproblem: π = π π=1 ππ , da πΈπ»0 π = π0 • Welche Werte von π sind so „extrem unwahrscheinlich“, dass sie unter π»0 zustande gekommen sind? Quantifizierung über Signifikanzniveau πΌ , πΌ ∈ 0.01, 0.05, 0.10 : ππ»0 π >π =πΌ • Anforderung 2: Bekannte Verteilung unter π»0 . Betrachte „normierte“ Version von π π= π − π0 β π~π‘ π−1 π C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . ππ»0 π >π =πΌ π = π‘1−πΌ 2 π−1 WEBINAR@LUNCHTIME DATEN SAMMELN • Ziehen einer zufälligen Stichprobe von π = 80 Testteilnehmern • Stichprobenmittel und Stichprobenvarianz aus Werten π₯1 , … , π₯80 berechnen: π₯= π π₯π = 1190.63 π=1 π = 1 β π−1 π π=1 • Wert der Prüfgröße / Teststatistik berechnen: π₯ − π0 π‘= β π = −0.57 π C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . π₯π − π₯ 2 = 147.06 WEBINAR@LUNCHTIME TESTENTSCHEIDUNG FÄLLEN (1) • Entscheidung, ob π»0 zugunsten von π»1 verworfen wird oder beibehalten werden muss • Liegt berechneter Prüfgrößenwert im Ablehnungsbereich? Gilt π‘ > π‘1−πΌ 2 π − 1 ? πΌ = 0.05 π‘1−πΌ 2 π − 1 = 1.99 π‘ < π‘1−πΌ 2 π−1 Nullhypothese kann nicht zum Signifikanzniveau πΌ = 0.05 verworfen werden • Formulierung der Testentscheidung als Bedingung an π0 : π‘ > π‘1−πΌ 2 π−1 π0 ∈β π₯ − π»0 zum Niveau πΌ verwerfen C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . π β π‘1−πΌ π 2 π − 1 ,π₯ + π β π‘1−πΌ π 2 π−1 π0 nicht in 1 − πΌ β 100% Konfidenzintervall für π WEBINAR@LUNCHTIME TESTENTSCHEIDUNG FÄLLEN (2) • Entscheidung, ob π»0 zugunsten von π»1 verworfen wird oder beibehalten werden muss • Ist p-Wert kleiner oder größer bzw. gleich vorgegebenem Signifikanzniveau πΌ ? • p-Wert ist Wahrscheinlichkeit, unter Nullhypothese beobachteten Prüfgrößenwert oder in Richtung Alternative extremeren Wert zu erhalten • Im Beispiel ist π = ππ»0 π‘ > π‘1−πΌ 2 π−1 π ≥ π‘ = ππ»0 π ≥ 0.57 . Dabei gilt ππ»0 π ≥ π‘ < ππ»0 π ≥ π‘1−πΌ 2 π−1 π»0 beibehalten, falls π ≥ πΌ. π»0 verwerfen, falls π < πΌ. • p-Werte werden standardmäßig von Software-Paketen ausgegeben C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . π<πΌ WEBINAR@LUNCHTIME KURZUMFRAGE C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . FRAGE ANTWORTEN C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WELCHE DER FOLGENDEN GRÖßEN BEEINFLUSST DAS SIGNIFIKANZNIVEAU πΆ EINES STATISTISCHEN TESTS? a. Der p-Wert b. Der Stichprobenumfang π c. Beide genannten Größen d. Keine der genannten Größen FRAGE ANTWORTEN C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WELCHE DER FOLGENDEN GRÖßEN BEEINFLUSST DAS SIGNIFIKANZNIVEAU πΆ EINES STATISTISCHEN TESTS? a. Der p-Wert b. Der Stichprobenumfang π c. Beide genannten Größen d. Keine der genannten Größen WEBINAR@LUNCHTIME FEHLENTSCHEIDUNGEN • Rückschlüsse von Stichprobe auf Grundgesamtheit implizieren Fehlentscheidungen Entscheidung für H0 H1 H0 wahr richtig Fehler 1. Art H1 wahr Fehler 2. Art richtig • Wahrscheinlichkeit für Fehler 1. Art wird kontrolliert durch πΌ • Wahrscheinlichkeit für Fehler 2. Art wird nicht vorgegeben • Ungleichbehandlung der Fehlerarten führt zu asymmetrischen Testentscheidungen • π < πΌ heißt, π»1 bestätigt bzw. signifikant (zum Niveau πΌ) nachgewiesen • π ≥ πΌ heißt nicht, π»0 bestätigt, nur π»0 ist beizubehalten bzw. nicht zu verwerfen • Interessierende Forschungshypothese als Alternative formulieren! C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME GÜTEFUNKTION (1) • Fehler 1. und 2. Art als Kriterien zur Qualitätsbeurteilung statistischer Tests lassen sich in Gütefunktion zusammenführen • Gibt für Test in Abhängigkeit des interessierenden Parameters die Wahrscheinlichkeit an, die Nullhypothese zu verwerfen π π = ππ π»0 verwerfen • Gilt π ∈ π»0 , hier π = π0 , so ist π π = πΌ , d.h. die Wahrscheinlichkeit für Fehler 1. Art • Gilt π ∈ π»1 , hier π ≠ π0 , so ist 1 − π π die Wahrscheinlichkeit für Fehler 2. Art • Enthält neben Signifikanzniveau auch Informationen darüber, für welche Parameterwerte die Nullhypothese mit großer Wahrscheinlichkeit verworfen wird • Wird zum Vergleich mehrerer konkurrierender Tests herangezogen C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME GÜTEFUNKTION (2) Eigenschaften einer Gütefunktion: • Heißt für Werte aus π»1 Trennschärfe oder Macht • Ist für Werte aus π»0 (kleiner) gleich πΌ • Macht wird größer − mit wachsendem Stichprobenumfang π − mit wachsendem Signifikanzniveau πΌ − mit wachsender Abweichung von π»0 C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME DEMO C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . FRAGEN? C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME VIELEN DANK FÜR IHRE AUFMERKSAMKEIT Interesse an weiterem Austausch? • Diskutieren Sie mit uns in der XING-Gruppe Business Analytics mit SAS • Sprechen Sie uns direkt an: [email protected] • Treffen Sie uns auf Veranstaltungen: C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME WEITERE INFORMATIONEN UND KURSE ZU DIESEM THEMA… • Varianzanalyse, Regression und logistische Regression mit dem SAS® Enterprise Guide® 26.08. - 29.08.13 Heidelberg 16.09. - 19.09.13 Wien 02.12. - 05.12.13 München • Statistik 1: Varianzanalyse, Regression und logistische Regression 02.07. - 04.07.13 Wien 21.08. - 23.08.13 München 08.10. - 10.10.13 Heidelberg • Vorhersagemodellierung mit der logistischen Regression 17.07. - 18.07.13 Heidelberg 28.11. - 29.11.13 Heidelberg C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . WEBINAR@LUNCHTIME NÄCHSTES WEBINAR@LUNCHTIME C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . FOLIEN ZUM DOWNLOAD UNTER WWW.SAS.DE/LUNCHTIME WIE HAT IHNEN UNSER WEBINAR GEFALLEN? C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . www.SAS.com