Statistische Überprüfung von Hypothesen Hypothesen sind allgemeine Aussagen über Zusammenhänge zwischen empirischen und logischen Sachverhalten.Allgemein bezeichnet man diejenigen Aussagen als Hypothesen, die einen Zusammenhang zwischen mindestens zwei Variablen postulieren. Aussagen, die den bisherigen Wissensstand ergänzen und bislang noch nicht bestätigt sind, bezeichnet man als Alternativhypothese. Unterschiedshypothesen Vergleiche von Häufigkeiten bzw. Mittelwerten zwischen (mindestens) zwei Gruppen Zusammenhangshypothesen Korrelationsanalysen Gerichtete und ungerichtete Hypothesen Spezifische und unspezifische Hypothesen 1. Schritt: Von der empirischen Hypothese zur statistischen Hypothese Hypothese: Eine neue Lernmethode ist besser als die herkömmliche. Hypothese: Das Interesse am Umweltschutz ist bei Jugendlichen in den neuen Bundesländern geringer als bei den Jugendlichen in den alten Bundesländern. H1 : µ ost < µ west ===============Hypothesen: Formulieren und Testen === Folie 1======================== Eine konkurrierende Nullhypothese wird formuliert. Diese behauptet, daß der in H1 formulierte Zusammenhang nicht zutrifft. Die Nullhypothese ist eine Negativhypothese, mit der behauptet wird, daß die zur Alternativhypothese komplementäre Aussage richtig ist. Aus den Alternativhypothesen ergeben sich qua Logik statistische Nullhypothesen: H1 : H1 : H1 : µost < µwest µost > µwest µost ≠ µwest H0 : H0 : H0 : µost > µwest µost < µwest µost = µwest 2. Schritt: Formulierung der Nullhypothese Der statistische Entscheidungsprozeß: Welche Hypothese ist richtig? Die Nullhypothese ist die Basis aller Entscheidungen. Kann man die empirischen Daten mit ihr erklären oder nicht? Zu berücksichtigen: Grundgesamtheit ⇔ Stichprobenauswahl ===============Hypothesen: Formulieren und Testen === Folie 2======================== Die Zufälligkeiten der Stichprobe sind in Erwägung zu ziehen, und zwar in beide Richtungen der Entscheidungen. Entscheidung aufgrund der Stichprobe zugunsten der: H0 H1 In der Population gilt die H0 H1 richtige β-Fehler Fehler 2. Art α-Fehler Fehler 1. Art richtige Entscheidung Abwägen der Konsequenzen von (Fehl-)Entscheidungen. 3. Schritt: Bestimmung der Irrtumswahrscheinlichkeit Beispiel: eine Unterschiedshypothese (Lernerfolg) Normalverteilung der Mittelwerte um µ0 mit der Streuung sx ===============Hypothesen: Formulieren und Testen === Folie 3======================== Ermittelt wird also die Wahrscheinlichkeit, diesen Wert auch mit der alten Methode zu erreichen bzw. die Wahrscheinlichkeit, daß die H0 gilt. Mit welcher Wahrscheinlickeit wird ein α Fehler begangen? Die Statistik gibt nur ein Entscheidungskriterium (Irrtumswahrscheinlichkeit) an die Hand, sie trifft keine Entscheidung. Welches Risiko will man akzeptieren? Signifikanzniveau Definition: Beträgt die Wahrscheinlichkeit des gefundenen oder eines extremeren Untersuchungsergebnisses unter der Annahme, die H0 sei richtig, höchstens 5%, so wird dieses Ergebnis als signifikant bezeichnet. Beträgt diese Wahrscheinlichkeit höchstens 1%, so ist das Ergebnis sehr signifikant. Signifikanzniveau ⇒ die Schwellenwerte des α-Fehlers 1% und 5% Wahl des Signifikanzniveaus ⇒ abhängig von den Konsequenzen eines α-Fehlers, bei gravierenden Folgen 1% Niveau Mißverständnisse des Signifikanzniveaus ⇒ Wahrscheinlichkeit der Nullhypothese, Gegenwahrscheinlichkeit der Alternativhypothese ===============Hypothesen: Formulieren und Testen === Folie 4======================== Falsifikationsprinzip: Signifikanz und Wahrheit Man findet keine Wahrheiten, sondern muß stets mit einem α-Fehler rechnen. Die Alternativhypothese wird immer nur indirekt bestätigt, nämlich als Umkehrschluß. Ein nichtsignifikantes Ergebnis ist kein Beleg für die Richtigkeit der Nullhypothese. (Beispiel: wenn das Ergebnis nahe an der Signifikanzschwelle ist!) Wann verringert sich die Irrtumswahrscheinlichkeit: • mit größer werdender Differenz von Stichprobenmittelwert und Mittelwert der Grundgesamtheit • mit kleiner werdender Populationsstreuung • mit vergrößertem Stichprobenumfang Einseitige und zweiseitige Tests gerichtete Hypothese ⇒ einseitiger Test ungerichtete Hypothese ⇒ zweiseitiger Test (Quelle Bortz, S. 113) ===============Hypothesen: Formulieren und Testen === Folie 5======================== Konsequenz: Die Signifikanzhürde ist bei der gerichteten Hypothese niedriger. Die Frage gerichtet/ungerichtet muß vor der Durchführung eines Signifikanztestes geklärt werden. Eine Modifikation der Hypothese angesichts der gefundenen Daten ist nicht statthaft. Signifikanz und Bedeutsamkeit Ist ein signifikanter Unterschied (z. B. zwischen Lehrmethoden) auch immer ein bedeutsamer Unterschied? Bei genügend großer Stichprobe werden hypothesenkonforme Unterschiede immer signifikant. Bedeutsamkeit ist eine Frage der absoluten Differenz von Stichprobenmittelwert und Mittelwert der Grundgesamtheit ===============Hypothesen: Formulieren und Testen === Folie 6======================== Hypothese: Interesse am Umweltschutz V132 INTERESSE:UMWELTSCHUTZ V3 OST-WEST-FILTER V3 by Page 1 of 1 Count | Col Pct |Westdeut Ostdeuts |schland chland Row | 1 | 2 | Total V132 --------+--------+--------+ 0 | 404 | 274 | 678 nicht genannt | 40,9 | 49,5 | 44,0 +--------+--------+ 1 | 584 | 280 | 864 genannt | 59,1 | 50,5 | 56,0 +--------+--------+ Column 988 554 1542 Total 64,1 35,9 100,0 Chi-Square Value ------------------------Pearson 10,57659 ===============Hypothesen: Formulieren und Testen === Folie DF ---1 Significance -----------,00115 7======================== ===============Hypothesen: Formulieren und Testen === Folie 8========================