nächstes webinar@lunchtime

Werbung
WEBINAR@LUNCHTIME
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
THEMA: "STATISTIK IN DER PRAXIS –
TESTEN IST BESSER ALS VERMUTEN"
TORSTEN SCHOLZ
WEBINAR@LUNCHTIME EINLEITENDES BEISPIEL
• SAT: Standardisierter Test, der von Studienplatzbewerbern an amerikanischen Unis gefordert wird
• Bewertet werden (u.a.) mathematische Kenntnisse
und sprachliche Ausdrucksfähigkeit
• Allgemeiner Bildungsstand soll anhand des durchschnittlichen Testergebnisses bewertet werden
• Bildungsausschuss vermutet Abweichung der mittleren Punktzahl vom Sollwert (1200 Punkte)
• Vermutung soll empirisch überprüft werden
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME PRINZIPIEN DES STATISTISCHEN TESTENS
Statistisches Testen: Empirische Überprüfung von Annahmen über das Verhalten eines Merkmals in der Grundgesamtheit
H0 versus H1
Durchführung eines statistischen Tests
muss gewissen Prinzipien genügen:
• Auffassen der inhaltlichen Fragestellung
als statistisches Testproblem
• Definieren einer Entscheidungsregel
• Sammeln von Daten für die empirische
Bewertung
• Anwenden der Entscheidungsregel, d.h.
fällen einer Testentscheidung
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME HYPOTHESEN AUFSTELLEN
• Formalisieren der Problemstellung: Zufallsvariable 𝑋 beschreibe die erzielte Punktzahl
Vorgabe der Schulbehörde als Aussage über den Erwartungswert von 𝑋 formulierbar:
πœ‡ = 𝐸 𝑋 = πœ‡0 = 1200
• Auffassen der inhaltlichen Fragestellung als statistisches Testproblem:
𝐻0 : πœ‡ = πœ‡0
vs.
𝐻1 : πœ‡ ≠ πœ‡0
• Empirische Überprüfung anhand von Stichprobe vom Umfang 𝑛. Testergebnisse als Realisationen unabhängiger Wiederholungen 𝑋1 , … , 𝑋𝑛 von 𝑋 interpretierbar
• U.U. Formulierung weiterer Modellannahmen, z.B. über Verteilung von 𝑋 bzw. 𝑋1 , … , 𝑋𝑛
𝑋~𝑁 πœ‡, 𝜎 2 , 𝜎 2 unbekannt
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME SIGNIFIKANZNIVEAU FESTLEGEN
Festlegung des Ablehnungsbereichs (Stichprobenergebnisse, die für 𝐻1 sprechen):
• Verdichten der Stichprobeninformation zu geeigneter Prüfgröße / Teststatistik
• Anforderung 1: Sensibel für Testproblem: 𝑋 =
𝑛
𝑖=1 𝑋𝑖 , da 𝐸𝐻0
𝑋 = πœ‡0
• Welche Werte von 𝑋 sind so „extrem unwahrscheinlich“, dass sie unter 𝐻0 zustande gekommen sind? Quantifizierung über Signifikanzniveau 𝛼 , 𝛼 ∈ 0.01, 0.05, 0.10 :
𝑃𝐻0
𝑋 >𝑐
=𝛼
• Anforderung 2: Bekannte Verteilung unter 𝐻0 . Betrachte „normierte“ Version von 𝑋
𝑇=
𝑋 − πœ‡0
βˆ™ 𝑛~𝑑 𝑛−1
𝑆
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
𝑃𝐻0
𝑇 >𝑐
=𝛼
𝑐 = 𝑑1−𝛼
2
𝑛−1
WEBINAR@LUNCHTIME DATEN SAMMELN
• Ziehen einer zufälligen Stichprobe von 𝑛 = 80 Testteilnehmern
• Stichprobenmittel und Stichprobenvarianz aus Werten π‘₯1 , … , π‘₯80 berechnen:
π‘₯=
𝑛
π‘₯𝑖 = 1190.63
𝑖=1
𝑠=
1
βˆ™
𝑛−1
𝑛
𝑖=1
• Wert der Prüfgröße / Teststatistik berechnen:
π‘₯ − πœ‡0
𝑑=
βˆ™ 𝑛 = −0.57
𝑠
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
π‘₯𝑖 − π‘₯
2
= 147.06
WEBINAR@LUNCHTIME TESTENTSCHEIDUNG FÄLLEN (1)
• Entscheidung, ob 𝐻0 zugunsten von 𝐻1 verworfen wird oder beibehalten werden muss
• Liegt berechneter Prüfgrößenwert im Ablehnungsbereich? Gilt 𝑑 > 𝑑1−𝛼 2 𝑛 − 1 ?
𝛼 = 0.05
𝑑1−𝛼
2
𝑛 − 1 = 1.99
𝑑 < 𝑑1−𝛼
2
𝑛−1
Nullhypothese kann nicht zum Signifikanzniveau 𝛼 = 0.05 verworfen werden
• Formulierung der Testentscheidung als Bedingung an πœ‡0 :
𝑑 > 𝑑1−𝛼
2
𝑛−1
πœ‡0 ∈βˆ• π‘₯ −
𝐻0 zum Niveau 𝛼 verwerfen
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
𝑠
βˆ™ 𝑑1−𝛼
𝑛
2
𝑛 − 1 ,π‘₯ +
𝑠
βˆ™ 𝑑1−𝛼
𝑛
2
𝑛−1
πœ‡0 nicht in 1 − 𝛼 βˆ™ 100% Konfidenzintervall für πœ‡
WEBINAR@LUNCHTIME TESTENTSCHEIDUNG FÄLLEN (2)
• Entscheidung, ob 𝐻0 zugunsten von 𝐻1 verworfen wird oder beibehalten werden muss
• Ist p-Wert kleiner oder größer bzw. gleich vorgegebenem Signifikanzniveau 𝛼 ?
• p-Wert ist Wahrscheinlichkeit, unter Nullhypothese beobachteten Prüfgrößenwert oder in
Richtung Alternative extremeren Wert zu erhalten
• Im Beispiel ist 𝑝 = 𝑃𝐻0
𝑑 > 𝑑1−𝛼
2
𝑛−1
𝑇 ≥ 𝑑
= 𝑃𝐻0 𝑇 ≥ 0.57 . Dabei gilt
𝑃𝐻0 𝑇 ≥ 𝑑
< 𝑃𝐻0
𝑇 ≥ 𝑑1−𝛼
2
𝑛−1
𝐻0 beibehalten, falls 𝑝 ≥ 𝛼. 𝐻0 verwerfen, falls 𝑝 < 𝛼.
• p-Werte werden standardmäßig von Software-Paketen ausgegeben
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
𝑝<𝛼
WEBINAR@LUNCHTIME
KURZUMFRAGE
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
FRAGE
ANTWORTEN
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WELCHE DER FOLGENDEN GRÖßEN BEEINFLUSST DAS
SIGNIFIKANZNIVEAU 𝜢 EINES STATISTISCHEN TESTS?
a.
Der p-Wert
b.
Der Stichprobenumfang 𝑛
c.
Beide genannten Größen
d.
Keine der genannten Größen
FRAGE
ANTWORTEN
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WELCHE DER FOLGENDEN GRÖßEN BEEINFLUSST DAS
SIGNIFIKANZNIVEAU 𝜢 EINES STATISTISCHEN TESTS?
a.
Der p-Wert
b.
Der Stichprobenumfang 𝑛
c.
Beide genannten Größen
d.
Keine der genannten Größen
WEBINAR@LUNCHTIME FEHLENTSCHEIDUNGEN
• Rückschlüsse von Stichprobe auf Grundgesamtheit implizieren Fehlentscheidungen
Entscheidung für
H0
H1
H0 wahr
richtig
Fehler 1. Art
H1 wahr
Fehler 2. Art
richtig
• Wahrscheinlichkeit für Fehler 1. Art
wird kontrolliert durch 𝛼
• Wahrscheinlichkeit für Fehler 2. Art
wird nicht vorgegeben
• Ungleichbehandlung der Fehlerarten führt zu asymmetrischen Testentscheidungen
• 𝑝 < 𝛼 heißt, 𝐻1 bestätigt bzw. signifikant (zum Niveau 𝛼) nachgewiesen
• 𝑝 ≥ 𝛼 heißt nicht, 𝐻0 bestätigt, nur 𝐻0 ist beizubehalten bzw. nicht zu verwerfen
• Interessierende Forschungshypothese als Alternative formulieren!
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME GÜTEFUNKTION (1)
• Fehler 1. und 2. Art als Kriterien zur Qualitätsbeurteilung statistischer Tests lassen sich in
Gütefunktion zusammenführen
• Gibt für Test in Abhängigkeit des interessierenden Parameters die Wahrscheinlichkeit an,
die Nullhypothese zu verwerfen
𝑔 πœ‡ = π‘ƒπœ‡ 𝐻0 verwerfen
• Gilt πœ‡ ∈ 𝐻0 , hier πœ‡ = πœ‡0 , so ist 𝑔 πœ‡ = 𝛼 , d.h. die Wahrscheinlichkeit für Fehler 1. Art
• Gilt πœ‡ ∈ 𝐻1 , hier πœ‡ ≠ πœ‡0 , so ist 1 − 𝑔 πœ‡ die Wahrscheinlichkeit für Fehler 2. Art
• Enthält neben Signifikanzniveau auch Informationen darüber, für welche Parameterwerte
die Nullhypothese mit großer Wahrscheinlichkeit verworfen wird
• Wird zum Vergleich mehrerer konkurrierender Tests herangezogen
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME GÜTEFUNKTION (2)
Eigenschaften einer Gütefunktion:
• Heißt für Werte aus 𝐻1 Trennschärfe oder Macht
• Ist für Werte aus 𝐻0 (kleiner) gleich 𝛼
• Macht wird größer
− mit wachsendem Stichprobenumfang 𝑛
− mit wachsendem Signifikanzniveau 𝛼
− mit wachsender Abweichung von 𝐻0
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME
DEMO
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
FRAGEN?
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME VIELEN DANK FÜR IHRE AUFMERKSAMKEIT
Interesse an weiterem Austausch?
•
Diskutieren Sie mit uns in der XING-Gruppe
Business Analytics mit SAS
•
Sprechen Sie uns direkt an:
[email protected]
•
Treffen Sie uns auf Veranstaltungen:
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME WEITERE INFORMATIONEN UND KURSE ZU DIESEM THEMA…
•
Varianzanalyse, Regression und logistische Regression mit dem SAS®
Enterprise Guide®
26.08. - 29.08.13 Heidelberg
16.09. - 19.09.13 Wien
02.12. - 05.12.13 München
•
Statistik 1: Varianzanalyse, Regression und logistische Regression
02.07. - 04.07.13 Wien
21.08. - 23.08.13 München
08.10. - 10.10.13 Heidelberg
•
Vorhersagemodellierung mit der logistischen Regression
17.07. - 18.07.13 Heidelberg
28.11. - 29.11.13 Heidelberg
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
WEBINAR@LUNCHTIME NÄCHSTES WEBINAR@LUNCHTIME
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
FOLIEN ZUM DOWNLOAD UNTER
WWW.SAS.DE/LUNCHTIME
WIE HAT IHNEN UNSER WEBINAR GEFALLEN?
C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
www.SAS.com
Herunterladen