Konfidenzintervalle Statistische Methoden in der Korpuslinguistik Heike Zinsmeister WS 2008/09 Münzspiel • Experiment – 100 Münzwürfe: Stefan gewinnt bei "Kopf" • Hypothesen – H0: Stefan wird so oft gewinnen wie der andere Spieler – H1: Stefan wird öfter gewinnen als der andere Spieler • Bei welchem Ergebnis unterstellen Sie Stefan, dass er schummelt? – bei 51 mal Kopf? Bei 55 mal? Bei 80 mal? – Signifikanztest 20. 11. 2008 1 Münzspiel • Annahme, dass H0 stimmt • Berechnung der Wahrscheinlichkeit p (Irrtumswahrscheinlichkeit), dass das beobachtete Resultat oder alle weiteren Resultate, die genauso hoch oder noch weiter von der Nullhypothese abweichen, zu erhalten • Vorher definiertes Signifikanzniveau, bei dem H0 abgelehnt werden kann – 5% (Signifikanzniveau von 0,05), 1% (Niveau von 0,01),... 20. 11. 2008 2 Signifikanz • Wenn ein Effekt signifikant ist, dann ist er groß genug, dass sein Auftreten bei der Größe der getesteten Stichprobe(n) wahrscheinlich nicht zufällig ist. 20. 11. 2008 3 Vereinfachtes Münzexperiment (Gries 2008: 40) 20. 11. 2008 4 Diskrete Verteilung (Gries 2008: 42) 20. 11. 2008 5 Diskrete Verteilung (Gries 2008: 45) 20. 11. 2008 6 Binomialverteilung • Funktion dbinom() – x: die Häufigkeit, mit der ein fragliches Ereignis auftritt – s: die Anzahl an Versuchen – p: Wahrscheinlichkeit des Ereignisses • Wahrscheinlichkeit, dass in drei Würfen dreimal Kopf oben liegt dbinom(3, 3, 0.5) • Wahrscheinlichkeit, dass in drei Würfen ein- bis dreimal Kopf oben liegt dbinom(0:3, 3, 0.5) • Kopf taucht zwei oder dreimal auf sum(dbinom(2:3, 3, 0.5)) 20. 11. 2008 7 Münzenexperiment 1 barplot(dbinom(0:3,3,0.5), xlab="Anzahl an 'Kopf'", ylab="Auftretenswahrscheinlichkeit", col="gray40", 20. 11. 2008 names.arg=c(0:3),ylim=c(0,0.4)) 8 Münzenexperiment 2 barplot(dbinom(0:100,100,0.5), xlab="Anzahl an 'Kopf'", ylab="Auftretenswahrscheinlichkeit", col="gray40", 20. 11. 2008 names.arg=c(0:100),ylim=c(0,0.1)) 9 Testen • Wie wahrscheinlich ist es, bei 100 Würfen 58 mal oder öfter Kopf zu erhalten? • sum(dbinom(58:100, 100, 0.5)) • Wie wahrscheinlich ist es, bei 100 Würfen 59 mal oder öfter Kopf zu erhalten? • sum(dbinom(59:100, 100, 0.5)) 20. 11. 2008 10 Stetige Verteilungen • und zugehörige Funktion, die ermittelt, welcher Wert wie viel Prozent der Fläche unter der Kurve der entsprechenden Funktion, welche als 1 definiert ist, abschneidet. • Standardnormalverteilung mit z-Werten qnorm() • t-Verteilung: qt() • F-Verteilung: qf() • Chi-Quadrat-Verteilung (χ2): chisq() 20. 11. 2008 11 Normalverteilung • Bsp: IQ-Verteilung, Mean=100, SD=16 20. 11. 2008 12 Normalverteilung • Eigenschaften – unimodal – symmetrisch – zwischen • Mittelwert µ -Standardabweichung sd und Mittelwert+Standardabweichung • liegen ca. 2/3 aller Fälle (68,26%) – zwischen • µ±2*sd • befinden sich ca. 95% aller Fälle (95,44%) 20. 11. 2008 13 Andere Verteilungen • "linkssteil" 20. 11. 2008 14 Bimodale Verteilung 20. 11. 2008 15 Varianz und Standardabweichung von Stichproben • Varianz – Summe der quadratischen Abweichungen vom Mittelwert µ der Stichprobe n – Stichproben vs. Populationsvarianz: (x i " µ) 2 # Normalisierungsfaktor i=1 • Standardabweichung var ianz _ Stichprobe = – Wurzel der Varianz ! n "1 n 2 (x " µ ) # i sd _ Stichprobe = – Bemerke: sd in R berechnet die Standardabweichung auf der Basis der Stichprobenvarianz i=1 n "1 ! 20. 11. 2008 16 Standardfehler • definiert als die Standardabweichungen der Mittelwerte von gleich großen Stichproben aus einer Population/Grundgesamtheit • Abschätzung des Standardfehlers einer Stichprobe (Stichprobengröße n>30, normal verteilt) SE Mittelwert = var sd = n n ! 20. 11. 2008 17 Standardfehler der Planungspausen • Einlesen von /Users/cluser/_sflwr/_inputfiles/g_data_chapters_15/03-1_aeh(m).txt • Standardfehler vom Mittelwert AEHM<-read.table(file.choose(), header=T, sep="\t", comment.char="", quote="") attach(AEHM) str(AEHM) mean(LAENGE) sqrt(var(LAENGE)/length(LAENGE)) # oder sd(LAENGE)/sqrt(length(LAENGE)) 20. 11. 2008 18 Weitere Standardfehler • Standardfehler von Prozentwerten SE Pr ozentwerte = p " (1# p) n ! • Standardfehler von Mittelwertsdifferenzen 2 SE Mittelwertsdifferenz = SE MittelwertGruppr1 + SE MittelwertGruppe2 ! 20. 11. 2008 2 19 Konfidenzintervalle • Kann man gegebene Stichprobenergebnisse auf die Grundgesamtheit/Population verallgemeinern? • Nur unter Angabe von Konfidenzintervallen! 20. 11. 2008 20 Konfidenzintervalle arithmethischer Mittelwerte • Ziel – Ermittlung der Grenzen, innerhalb derer sich der wahre Populationsmittelpunkt mit hoher Wahrscheinlichkeit p befindet • Konfidenzintervall CI • Wahrscheinlichkeit p = Konfidenzkoeffizient – definiert als 1-Signifikanzniveau – bei Signifikanzniveau 0,05 • Konfidenzkoeffizint: 1-0,05 = 0,95 20. 11. 2008 21 Konfidenzintervalle arithmethischer Mittelwerte • Standardfehler SEMittelwert: se<-sqrt(var(LAENGE)/length(LAENGE)); se • 95%-Konfidenzintervall – – – – CI = x ± t " SE Parameter t aus der t-Verteilung da t-Wert anhand des p-Werts zu ermitteln: qt() ! 2,5%) Zweiseitiger Test (2* Freiheitsgrade df= Länge des Vektors-1 t<-qt(0.025, df=999, lower.tail=F); t • Mittels des t-Werts die Grenzen des Konfidenzintervalls berechnen 20. 11. 2008 22 Konfidenzintervalle arithmethischer Mittelwerte • Berechnung der Grenzen des Konfidenzintervalls mittels des t-Werts mean(LAENGE)-(se*t); mean(LAENGE)+(se*t) • Ausgabe [1] 891.3354 [1] 938.7506 • Interpretation – alle wahren Populationsmittelwerte, die den Stichprobenmittelwert von 915,043 mit 95%iger Wahrscheinlichkeit erzeugt haben könnte, liegen zwischen 891,34 und 938,75. – die Chancen stehen 95:5, das das ermittelte Konfidenzintervall des Stichprobenmittelwerts den Populationsmittelwert tatsächlich umschließt 20. 11. 2008 23 Konfidenzintervalle arithmethischer Mittelwerte • R bietet für den T-Test eine Funktion an: t.test(LAENGE, conf.level=0.95)$conf.int • Bemerkung da hier Konfindenzintervalle über Standardfehler berechnet werden, gilt, dass n>30 und die Daten normalverteilt sein sollten. 20. 11. 2008 24 Konfidenzintervalle relativer Häufigkeiten • Ziel – Ermittlung des Bereichs in der Grundgesamtheit, in den ein gegebener Prozentanteil einer Stichprobe fällt bzw. – wie der Stichprobenanteil in der Grundgesamtheit aussieht • Methode – Ermittlung des z-Werts der Standardnormalverteilung 20. 11. 2008 25 Konfidenzintervalle relativer Häufigkeiten • "Zu Fuß" – Stichprobenanteil a = 33,2% (Anteil von Stille) – Stichprobengröße n =1000 – Ermittlung des Standardfehlers SEProzentwerte se<-sqrt(0.332*(1-0.332)/1000); se • z bei Konfidenz von 95% z<-qnorm(0.025, lower.tail=F); z • z bei Konfidenz von 99% z<-qnorm(0.005, lower.tail=F); z 20. 11. 2008 26 Konfidenzintervalle relativer Häufigkeiten • "Zu Fuß" (Fortstz.) – Berechnung der Grenzen des Konfidenzintervalls mittels des z-Werts z<-qnorm(0.025, lower.tail=F) 0.332+z*se; 0.332-z*se • Ausgabe [1] 0.3611881 [1] 0.3028119 • Interpretation • die wahren Populationsanteile von "Stille" aller Verteilungen, bei denen mit 95%iger Wahrscheinlichkeit der Anteil 33,2% ermittelt wurde, befinden sich in einem Bereich von 30,28% und 36,12% 20. 11. 2008 27 Konfidenzintervalle relativer Häufigkeiten • Funktion in R: prop.test() – gefundene Häufigkeit (hier 33,2%) – Gesamtstichprobengröße (hier 1000) – Wahrscheinlichkeit für das Konfidenzintervall (hier 0,95) prop.test(332, 1000, conf.level=0.95)$conf.int 20. 11. 2008 28 Referenzen • Gries, Stefan Th. 2008. Statistik für Sprachwissenschaftler. Göttingen: Vandenhoeck & Ruprecht. Kapitel 1.3 und 3.1.5 20. 11. 2008 29