Mathematik für MolekularbiologInnen Vorlesung IX Ausgewählte Kapitel der Statistik Übersicht • Statistische Stichproben- und Schätztheorie • Entscheidungstheorie (Signifikanztests) • Theorie der kleinen Stichproben, t-Test (und der Chi2-Test) • Literatur: Murray R. Spiegel, Statistik, Mc-Graw Hill-Book; Schaum‘s Outline Stichproben- und Schätztheorie Eigenschaften großer und kleiner Stichproben • Es werden sogenannte große Stichproben mit N ≥ 30 unterschieden von den kleinen Stichproben. • Große Stichproben, bzw Stichprobenverteilungen von hinreichend großem Umfang (üblicherweise N ≥ 30) sind annähernd oder exakt normal(verteilt), selbst wenn die Grundgesamtheit nicht normalverteilt ist. • Normalerweise müssen für kleine Stichproben andere Annahmen gemacht werden als für große, was zu einer eigenen Theorie der kleinen Stichproben (tVerteilung) geführt hat. Stichproben- und Schätztheorie Stichprobenverteilungen von Parametern • Parameter der Grundgesamtheit wie μ oder σ finden ihre Entsprechung in den Stichproben und werden dort als Stichprobenfunktionen S bezeichnet. Wenn mehrere Stichproben gezogen werden, erhält man eine Verteilung der Stichprobenfunktionen (da die Werte von Probe zu Probe verschieden sind) • Die Verteilung beliebiger Funktionen, genannt Stichprobenverteilung, hat ihrerseits einen Mittelwert μS und eine Standardabweichung σS. Letztere wird auch als Standardfehler der jeweiligen Stichprobenfunktion, so z.B. als Standardfehler des Mittelwerts ( X ) bezeichnet. • Die Stichproben werden mit einem Umfang N aus einer Grundgesamtheit gezogen, wieder wird bei der Berechnung zwischen Ziehen mit oder ohne Zurücklegen unterschieden. Stichproben- und Schätztheorie Stichprobenverteilungen von Parametern • Stichprobenverteilung der Mittelwerte – Unter der Voraussetzung, dass NP > N für mehrere (alle möglichen) ohne Zurücklegen erhaltenen Proben aus einer endlichen Grundgesamtheit, gilt für die Stichprobenverteilung: X X N NP N N P 1 – dagegen vereinfacht für unendliche Grundgesamtheiten bzw. Proben mit Zurücklegen: X X N Stichproben- und Schätztheorie Konfidenzintervalle • In der Praxis werden oft Stichprobenfunktionen S anhand einer einzigen Stichprobe ermittelt. Die Frage ist, mit welcher Wahrscheinlichkeit der Wert von S innerhalb eines bestimmten Abstandes vom theoretischen Stichproben-Verteilungsmittel (wenn mehrere bzw. möglichst viele Stichproben gemacht würden), und somit auch vom gesuchten Parameter der Grundgesamtheit entfernt ist. • Da man Gruppen von Stichproben des Umfangs N ≥ 30 bezüglich ihrer Funktionen S als normalverteilt annehmen kann, macht man sich die Eigenschaften der Normalverteilung (vgl VL 7, 8) zunutze: – der Wert einer einzigen Stichprobe liegt mit 95,45%-iger Wahrscheinlichkeit innerhalb von S 2 S –das unbekannte Verteilungsmittel μS liegt mit 95,45%-iger Wahrscheinlichkeit innerhalb von S 2 S S Standardfehler der Verteilung der Stichprobenfunktion Stichproben- und Schätztheorie Konfidenzintervalle • Diese Wahrscheinlichkeit ist ein Ausmaß des Vertrauens auf einen Wert S als möglichst exaktes Schätzmaß für den Grundgesamtheits-Parameter. Das Vertrauen wird als Konfidenz bezeichnet, sein Ausmaß als Konfidenzniveau. 68,3% 95,45% 99,73% • Ein bestimmtes Konfidenzniveau entspricht also einem Konfidenzintervall, dessen Grenzen ein Vielfaches der Standardabweichung sind. Der Faktor zK für den zK ∙ σ einem gewünschten Niveau entspricht ist für Normalverteilungen tabelliert und wird als Sicherheitskoeffizient bezeichnet • Tabelle der Konfidenzintervalle: Konfidenzniveau (%) zK 99,73 99,0 98,0 96,00 95,45 95,00 90,00 80,00 68,27 50,00 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745 Stichproben- und Schätztheorie Konfidenzintervalle des Stichproben-Mittelwerts • Für die Berechnung von Konfidenzintervallen bräuchte man den Standardfehler der Stichprobenfunktion, S , welcher von der Varianz der Grundgesamtheit abhängt (Standardfehler des Mittelwerts, X ). N Konfidenzniveau (%) zK 99,73 99,0 98,0 96,00 95,45 95,00 90,00 80,00 68,27 50,00 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745 Für den Mittelwert einer einzelnen Stichprobe mit 90%-Konfidenzintervall gilt: X liegt innerhalb von X zk X X 1,645 X X 1,645 N • Man kennt jedoch die Grundgesamtheit nicht und kann auch auf keine Stichprobenverteilung zurückgreifen um den Standardfehler zu bestimmen. Deswegen setzt man als Approximation die Varianz der Stichprobe in die jeweilige Formel ein. Für N≥30 führt das zu befriedigenden Lösungen, für N<30 muß die Theorie der kleinen Stichproben verwendet werden. Entscheidungstheorie Kontext der statistischen Entscheidungstheorie • Die Stichprobentheorie leitet die Zusammenhänge zwischen den Parametern einer Grundgesamtheit und den korrespondierenden Stichprobenfunktionen her, basierend auf dem Vergleich der bekannten Grundgesamtheit mit den Funktionsverteilungen möglichst vieler Stichproben. • Die statistische Schätztheorie verwendet die Ergebnisse der Stichprobentheorie, um Parameter unbekannter Grundgesamtheiten anhand einzelner Stichproben mit einer bestimmten Konfidenz abschätzen zu können. • Die statistische Entscheidungstheorie testet Hypothesen für Parameter der Grundgesamtheit anhand der Abweichung entsprechender Funktionen von einzelnen Stichproben. Sie macht Aussagen über die Signifikanz solcher Abweichungen bei gegebenen Irrtumswahrscheinlichkeiten. Entscheidungstheorie Statistische Hypothesen • Statistische Hypothese: Annahme oder Vermutung über die Eigenschaften der interessierenden Grundgesamtheit, oder über Differenzen zwischen zwei oder mehreren Grundgesamtheiten. Oft wird die Hypothese nur aufgestellt, um sie widerlegen zu können (z.B. Wirksamkeit Medikament A = B) • Die Grundannahme wird auch als Nullhypothese H0 bezeichnet; eine sich davon unterscheidende Vermutung als alternative Hypothese H1. Beispiel: statistische Hypothese: Behauptung, eine Münze sei „echt“ => die Wahrscheinlichkeit für Kopf betrage p = 0,5 (H0: p= 0,5) bzw. Der Erwartungswert E (X) = E (Kopf) = Σ pi ∙ Xi = 0,5 (Binomialverteilung mit N = 1). Das entspricht dem Mittelwert μ = 0,5 für die unendliche Grundgesamtheit von Münzwürfen. Eine Stichprobe mit N = 50 Münzwürfen, die 40 mal Kopf ergibt, hat einen Mittelwert von X 10 0 40 1 0,8 50 Man würde intuitiv dazu neigen, die Nullhypothese (die Münze sei echt, p=0,5) abzulehnen. Entscheidungstheorie Statistische Hypothesen • Statistische Hypothesen werden durch Zufallsstichproben überprüft, diesen Vorgang nennt man Hypothesentest oder Signifikanztest. Wenn sich das Ergebnis der Stichprobe deutlich von der Annahme unterscheidet, wird die Hypothese verworfen (bzw. durch eine alternative Hypothese ersetzt). • Das irrtümliche Ablehnen von Hypothesen wird als Fehler 1. Art bezeichnet. Wird dagegen eine abzulehnende Hypothese fälschlicherweise angenommen, spricht man von einem Fehler 2. Art. Die maximal zulässige Irrtumswahrscheinlichkeit wird als Signifikanzniveau α (oder p-Values) bezeichnet. Die Nullhypothese wird verworfen (rejected), wenn die p-Werte kleiner als 0,05, 0,01, oder 0,001 sind, was den Wahrscheinlichkeiten von 5%, 1% oder 0,1% entspricht, einen Fehler 1.Art zu begehen. z.B: α = 0,05, die maximal zulässige Wahrscheinlichkeit für irrtümliches Ablehnen einer eigentlich richtigen Nullhypothese beträgt 5 %. Entscheidungstheorie Hypothesen- und Signifikanztests • Was genau bedeutet „deutlich unterscheiden“? Unter der Annahme, dass Stichprobenfunktionen normalverteilt sind, sollten die Werte der Funktionen S für einzelne Stichproben mit einer Wahrscheinlichkeit von (z.B.) 95% innerhalb von S 1.96 S liegen. Wird S S S S 1,96 S S z 1,96 standardisiert (Z-Transformation), so dass S S dann sollte mit 95%-iger Wahrscheinlichkeit z innerhalb von ± 1,96 liegen. kritischer Bereich p = 0,025 p = 0,95 kritischer Bereich p = 0,025 Liegt der Wert der Stichprobe außerhalb des Intervalls, ist die Wahrscheinlichkeit, dass ein solches Ereignis vorkommt nur 5 % wenn die Hypothese richtig ist (und das ist eher unwahrscheinlich). – die kritischen Bereiche werden auch als Ablehnungsbereiche des Tests bezeichnet. – p = 5% (für die kritischen Bereiche) wird Irrtumswahrscheinlichkeit α des Tests genannt. – zK = ±1,96 sind die kritischen Werte für 5% Irrtumswahrscheinlichkeit (vgl. Konfidenz) Entscheidungstheorie Hypothesen- und Signifikanztests • Welche Schlussfolgerungen ergeben sich für die Hypothese, wenn der zWert einer Stichprobe außerhalb von ± zK (1,96 in unserem Beispiel) liegt? – man sagt, der z-Wert sei signifikant (dies bedeutet, er weicht signifikant vom Wert der Hypothese H0 ab). – die Nullhypothese wird folglich mit 5% Irrtumswahrscheinlichkeit abgelehnt. – es besteht jedoch eine 5%-ige Wahrscheinlichkeit, dass die Stichprobenfunktion dem Parameter der Grundgesamtheit entspricht, dass also die Hypothese hätte angenommen werden sollen (Fehler 1. Art). Entscheidungstheorie Signifikanztest für Mittelwerte • Ist die Stichprobenfunktion S das arithmetische Mittel der Stichprobe, dann gilt nach der Stichprobentheorie: X und X N • Es ergibt sich für den z-Wert des Stichprobenmittels /Hypothesentest: Z Transformation : z S S S z X X X N ( X ) wobei anstelle σ der Grundgesamtheit der Wert s der einzelnen Stichprobe genommen werden kann Entscheidungstheorie Beispiel Münzwurf: Signifikanztest für Mittelwerte Eine Münze wird 50 mal geworfen und ergibt 40 mal Kopf; Annahme bei einer echten Münze: μ = 0,5 , Aufstellen der Nullhypothese: H0: p=0,5; Eine Stichprobe mit N = 50 Münzwürfen, die 40 mal Kopf ergibt, hat einen Mittelwert von 10 0 40 1 0,8 50 Man würde intuitiv dazu neigen, die Nullhypothese (die Münze sei echt, p=0,5) abzulehnen. Berechnung: Ist die Abweichung signifikant? 2 2 N 10 ( 0 0 , 8 ) 40 ( 1 0 , 8 ) 2 Die Stichprobe mit N = 50 Münzwürfen (Xi X ) s 0,4 i 1 und dem Mittelwert 0,8 hat eine s 49 N 1 Standardabweichung von 0,4 Damit ergibt sich als z-Wert bei gegebener z N ( X ) z 50 (0,8 0,5) 5,3 0,4 Nullhypothese (Annahme, dass μ = 0,5) X Konfidenzniveau (%) zK 99,73 99,0 98,0 96,00 95,45 95,00 90,00 80,00 68,27 50,00 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745 Dieser Wert ist deutlich größer als selbst der kritische Wert zK = 3,9 für α = 0,1 %. Lehnen wir die Hypothese ab, dass μ = 0,5, ist das Risiko für einen Fehler 1. Art << 1‰ Entscheidungstheorie Einseitige und zweiseitige Signifikanztests • Wenn man lediglich darauf testet, ob die Stichprobenfunktion größer als zK ist (z.B. beim Test, ob eine Methode besser ist als eine andere), dann muss man die Wahrscheinlichkeit lediglich auf der rechten Seite des Stichprobenmittels berechnen • Es ergeben sich andere Beträge für den kritischen Wert zK kritischer Bereich p = 0,025 p = 0,95 p = 0,95 kritischer Bereich p = 0,025 kritischer Bereich p = 0,05 α zK einseitig zK zweiseitig 0,10 –1,28 1,28 –1,645 1,645 0,05 –1,645 1,645 –1,96 1,96 0,01 –2,33 2.33 –2,58 2,58 0,005 –2,58 2,58 –2,81 2,81 0,002 –2,88 2,88 –3,08 3,08 Entscheidungstheorie Beispiel I: Aufstellen einer Entscheidungsregel • Aufgabe: Ein etabliertes PCR-Verfahren hat eine mittlere Effizienz von 84,5% mit einer Standardabweichung von 12,0%. Eine Firma behauptet, durch ein verbessertes Verfahren die Effizienz bei gleicher Standardabweichung signifikant zu. a) Stellen Sie eine Entscheidungsregel für die negative Nullhypothese auf, wobei für Stichproben des Umfangs N = 64 die Irrtumswahrscheinlichkeit 0,01 betragen soll. • Lösung: a) Die negative Nullhypothese H0 besagt, dass neue Verfahren sei nicht signifikant besser, also gleich effizient, d.h 84.5% Der Hypothesentest (= Entscheidungsregel) soll diese Hypothese verwerfen, wenn für das Stichprobenmittel gilt: N ( X ) z z K mit zK = 2,33 für α = 0,01 im einseitigen Test 12 Auflösen nach X ergibt: X z K 84,5 2,33 88,0 N 64 Die Entscheidungsregel lautet: 1. Ein Mittelwert der Stichprobe bis 88,0% bestätigt die Nullhypothese. Dies bedeutet, dass das neue Verfahren nicht signifikant besser ist. 2. Liegt der Stichproben-Mittelwert über 88,0%, ist die Hypothese zu verwerfen. Das neue Verfahren ist signifikant besser Entscheidungstheorie Beispiel I: Aufstellen einer Entscheidungsregel • Aufgabe: Ein etabliertes PCR-Verfahren hat eine mittlere Effizienz von 84,5% mit einer Standardabweichung von 12,0%. Eine Firma behauptet, durch ein verbessertes Verfahren die Effizienz bei gleicher Standardabweichung signifikant zu. b) Die tatsächliche Effizienz des neuen PCR-Verfahrens beträgt 90,0% (s = 12,0%). Mit welcher Wahrscheinlichkeit wird nach der in a) aufgestellten Regel das neue Verfahren abgelehnt? b) Tatsächlich ist das neue PCR-Verfahren mit 90,0% Effizienz signifikant besser. Es ist nun die Frage zu klären, welcher Anteil von Stichproben unter dem Ablehnungswert von 88,0% liegen würde. Zur Veranschaulichung ist eine Kurven-Überlagerung hilfreich. Rechnerisch ergibt sich der z-Wert für die Verteilung des neuen Verfahrens aus der Abweichung zwischen dessen Mittelwert (90,0) und dem kritischen Wert des Hypothesentests: z N ( X ) α' = 9% 64 (88 90) 1,33 12 zK = -1,33 entspricht α‘ = 0,09 (Entnahme aus Tabelle: z-1,33=0,09) Mit 9% Wahrscheinlichkeit würde eine Stichprobe des neuen Verfahrens abgelehnt werden. Entscheidungstheorie Signifikanz der Differenz von Mittelwerten • Von Bedeutung ist häufig die Fragestellung, ob sich zwei Ergebnisse oder Methoden signifikant unterscheiden. Die Theorie geht hierbei von zwei Grundgesamtheiten aus, für die separat Stichproben genommen werden. • Die Stichprobentheorie liefert dann für S = X folgende Ergebnisse hinsichtlich der Verteilungen der Differenzen zwischen zwei (Gruppen von) Stichproben: X X X X 1 2 1 und 2 1 X X 1 2 2 2 X1 2 X2 21 N1 22 N2 • Lautet die Nullhypothese, zwei Grundgesamtheiten unterschieden sich nicht signifikant bezüglich ihrer Mittelwerte, so behauptet man: z 1 2 X X 0 1 und es ergibt sich: 2 z ( X 1 X 2 ) X1 X 2 X X 1 2 X X X X1 X 2 ( 12 N1 ) ( 22 N 2 ) Entscheidungstheorie Beispiel II: Signifikanztest bezüglich eines Unterschieds • Aufgabe: Zwei Gruppen von Studierenden absolvieren eine Prüfung; Gruppe 1, N = 40, mit einer mittleren Punktezahl von 74 und einer Standardabweichung von 8; Gruppe 2, N = 50, mit einer mittleren Punktezahl von 78 und einer Standardabweichung von 7. Besteht ein signifikanter Unterschied zwischen den Ergebnissen der beiden Gruppen? (Der Signifikanztest soll 5% Irrtumswahrscheinlichkeit haben.) • Lösung: Die Nullhypothese lautet: H0: 1 2 d.h. es existiere kein signifikanter Unterschied. Die Abweichung wäre demnach rein zufällig (und die beiden Gruppen repräsentieren 2 Stichproben der selben Grundgesamtheit). Zur Überprüfung ermitteln wir den z-Wert für Mittelwert-Differenzen von Stichproben z X1 X 2 ( 2 1 N1 ) ( 2 2 N2 ) 74 78 8 / 40 7 / 50 2 2 2,49 Bei α = 0,05 (zweiseitig) ist zK = –1,96 und +1,96. Für die 2 vorliegenden Stichproben liegt z außerhalb dieses Intervalls, also im Ablehnungsbereich. Wir müssen die Nullhypothese verwerfen und feststellen, dass Gruppe 2 signifikant besser abgeschnitten hat. Theorie der kleinen Stichproben Eigenschaften kleiner Stichproben • Als kleine Stichproben bezeichnet man solche mit N < 30. • Funktionen kleiner Stichproben sind für gewöhnlich nicht normalverteilt, und die Abweichung von der Normalverteilung wird größer, je kleiner N ist. • Die Ergebnisse der allgemeinen Stichprobentheorie treffen daher für kleine Stichproben nicht oder nur unzureichend zu. Es besteht die Notwendigkeit einer Theorie der kleinen Stichproben • Diese modifizierte Theorie definiert (standardisierte) Stichprobenfunktionen, deren Verteilungen im Falle N < 30 der Realität besser entsprechen. Da diese Funktionen jedoch gleichzeitig für große N gültig sind, d.h. die Annäherung an die Normalverteilung korrekt wiedergeben, sollte man die Theorie kleiner Stichproben passenderer weise exakte Stichprobentheorie nennen. Theorie der kleinen Stichproben Der Begriff der Freiheitsgrade • Funktionen bzw. Verteilungen innerhalb der Theorie kleiner Stichproben berechnen sich über den Parameter ν, der die Anzahl der Freiheitsgrade der Stichprobenfunktion spezifiziert. • Ist N der Umfang einer Stichprobe, d.h. die Anzahl unabhängiger Beobachtungen, und entspricht k der Anzahl von Parametern der Grundgesamtheit, die aus den Stichproben-Beobachtungen geschätzt werden müssen, dann gilt: v N k • Wird beispielsweise nur der Mittelwert der Grundgesamtheit anhand einer oder mehrerer Stichproben geschätzt, dann ist k = 1, und für die Freiheitsgrade der Stichprobe(n) gilt: v N 1 Theorie der kleinen Stichproben Student‘s t-Verteilung (nach W. Gossett) • Das Verhältnis t zwischen der Differenz des Stichprobenmittelwerts und des Populationsmittelwerts und dem Standardfehler des Mittelwerts nicht normal verteilt ist, wenn die Populationsparameter unbekannt sind • Berechnung des t-Wertes: 1 N 2 s X X i N i 1 N 1( X ) N ( X ) t bzw. s t mit sˆ sˆ s N ( N 1) Hierbei ist die Verwendung der Stichproben-Standardabweichung s, im Ggs. zu den Formeln für normalverteilte große Stichproben, keine Approximation, sondern exakt. Die Formel impliziert nämlich bereits die korrigierte Standardabweichung ŝ für kleine N (Formel STABW in Excel). X N sˆ 1 N X N 1 i X 2 N ( N 1) i X 1 ( N 1) 2 Theorie der kleinen Stichproben Student‘s t-Verteilung (nach W. Gossett) • Diese Verteilung ergibt sich für die Mittelwerte von Stichproben, wenn die standardisierte Mittelwertfunktion definiert wird als: X N t N 1( X ) s t bzw. N ( X ) sˆ mit sˆ i X 2 1 ( N 1) • Wird die Funktion t für jede mögliche Stichprobe berechnet, ergibt sich die t- Verteilung, die gegeben ist durch Y Y0 t2 1 ( 1) 2 Y0 t2 1 N 1 N 2 Hierbei ist Y0 eine Konstante, die für eine gegebene Verteilung von N abhängt sodass die Fläche unter der Kurve, wie für Verteilungen gefordert, 1 beträgt. Theorie der kleinen Stichproben Student‘s t-Verteilung • Die t-Verteilung ist glockenförmig, jedoch flacher als die Normalverteilung. • Wie anhand der Verteilungs-Graphen ersichtlich, nähert sich die t-Verteilung für steigende N bzw. ν der Normalverteilung an (bei ν ≥30 wird die t-Verteilung in der Praxis meist durch die Normalverteilung geschätzt): Normalverteilung ν = 30 ν=3 Je kleiner N (bzw. die Freiheitsgrade ν) umso flacher ist die Kurve, d.h. in kleinen Stichproben treten Extremwerte häufiger auf. ν = 100 ν = 10 http://campus.unimuenster.de/fileadmin/einrichtung/imib/lehre/skripte/biomathe /bio/gif/kap7/t1.gif ν=2 Theorie der kleinen Stichproben Der t-Test für Hypothesen • Signifikanztests unter Verwendung der t-Verteilung nennt man t-Tests. • Hierbei wird die normierte Funktion t mit dem kritischen Wert für eine gegebene Irrtumswahrscheinlichkeit α (entsprechend 1 – Konfidenz) verglichen, um über die Ablehnung oder Annahme einer Hypothese zu entscheiden • Anwendung bei N<30 oder wenn die Standardabweichung der zugrundeliegenden Normalverteilung nicht bekannt ist und durch die Standardabweichung der Stichprobe ersetzt wird. Theorie der kleinen Stichproben Signifikanztests für Mittelwerte • Im Falle t-verteilter kleiner Stichproben verwendet man die kritischen Werte tK und erhält für die Konfidenzgrenzen des Mittelwerts einer Grundgesamtheit: X tK s N 1 X tK ŝ bzw. X tK s s X tK N 1 N 1 N • Die kritischen Werte hängen sowohl von der Konfidenz (α) als auch von der Zahl der Freiheitsgrade (ν) ab. • Die kritischen Werte sie sind als einseitige oder zweiseitige Werte tabelliert (siehe Anhang)- richtige Auswahl trifft der/die ExperimentatorIn je nach Fragestellung. Theorie der kleinen Stichproben Signifikanztests für Differenzen von Mittelwerten • 2 Zufallsstichproben N1 und N2 aus normalverteilten Grundgesamtheiten mit gleicher Standardabweichung σ werden gezogen, die MW und Standardabweichungen X1 und X2 bzw mit s1 und s2 gegeben sind. • Hypothese: beide Proben sind aus der gleichen Grundgesamtheit H0: μ1= μ2 und σ1= σ2 • Berechnung: t X1 X 2 1 1 N1 N 2 N s N 2 s22 N1 N 2 2 2 1 1 • Die Verteilung von t ist die Student-Verteilung mit ν= N1+N2-2 Freiheitsgraden. • Die kritischen Werte sie sind als einseitige oder zweiseitige Werte tabelliert (siehe Anhang). Beispiel: N=5; 1 Parameter bestimmen: ν=4 Quelle: http://files.hanser.de/hanser/docs/20040 419_244191129-96_3-446-215948Anhang4.pdf Die Tabelle der einseitigen Abgrenzen kann leicht für ‚zweiseitige‘ Problemstellungen verwendet werden. z.B.: 99% Konfidenz (ν=4), statistische Sicherheit (1-α)=0,99, dh 1% liegt nicht im Konfidenzintervall und kommt jeweils zur Hälfte vom rechten und linken Rand der symmetrischen Kurve kommen. Dementsprechend wird der t-Wert bei (1- 0,01/2)=(10,005)=0,995 abgelesen. einseitig: t0,995(ν = 4) = 4,6 zweiseitig: t0,99 (ν = 4) = 4,6 Quelle:http://files.hanser.de/hanser/docs/20040419_244191129-96_3-446-21594-8Anhang4.pdf Theorie der kleinen Stichproben Beispiel I: Konfidenzintervall des Mittelwerts bei kleiner Stichprobe • Aufgabe: Die Reaktionszeit einer Person wurde auf 0,28, 0,30, 0,27, 0,33 und 0,31 s gemessen. Schätzen Sie die tatsächliche Reaktionszeit mit 99% Konfidenz. •Lösung: 1) Ermittlung des Stichprobenmittelwertes X und der Standardabweichung N X X i 1 N X N i 0,298 sˆ i X 1 ( N 1) 2 0,0239 2) Da eine kleine Stichprobe (N = 5) vorliegt, muss man das Konfidenzintervall der Schätzung über die t-Verteilung berechnen; Anzahl der Parameter =1 (Reaktionszeit) Zahl der Freiheitsgrade ν=N-1=5-1=4 3) Wahl des Konfidenzintervalls: 99% Konfidenz, statistische Sicherheit (1-α)=0,99; zweiseitige Abgrenzung (größer oder kleiner); 0,0239 0,298 0,049 N 5 Antwort: Die Reaktionszeit μ liegt mit 99% Konfidenz innerhalb von 0,298 ± 0,049 Sekunden t0,99 (ν = 4) = 4,6 X tK ŝ 0,298 4,6 Theorie der kleinen Stichproben Beispiel II: t-Tests: Vergleich eines Mittelwertes mit einem theoretischen Wert • Aufgabe: Die mittlere Lebensdauer einer Spezies wurde bislang mit μ = 1120 d angenommen. Eine Stichprobe von 8 Individuen ergab eine mittlere Lebensdauer 1070 d mit s = 125 d. Überprüfen Sie bei einer Irrtumswahrscheinlichkeit von 0,05 die Hypothese, dass die bisherige Annahme richtig war. • Lösung: 1) Nullhypothese: H0: μ = 1120 d; H1: μ ist größer oder kleiner als 1120 2) Testen der Hypothese durch Berechnung des t-Wertes der Stichprobe (N=8), t N 1( X ) s 7 (1070 1120) 1,06 125 3) Vergleich mit kritischen t-Werten: N=8, 1 Parameter wird untersucht, ν = 7 zweiseitige Tabelle: α = 0,05, 1- α = 0,95, t0,95(7)= ± 2,365 einseitige Tabelle: α/2 = 0,025; 1- α = 0,9575, t0,975(7)= ± 2,365 Antwort: Da t im Konfidenzintervall liegt und nicht im Ablehnungsbereich, können wir die Hypothese mit einer 95%-igen Konfidenz (oder mit 5% Irrtumswahrscheinlichkeit) annehmen. Theorie der kleinen Stichproben Einfacher t-test mit Excel: • Funktion TTEST gibt dem P-Wert zurück (üblicherweise wird ein P-Wert unter 0,05 als signifikant angesehen (α=95%)) Bsp: Besteht ein signifikanter Unterschied im Kaffeekonsum (Anzahl an Tassen Kaffee pro Tag) zwischen Studierenden der Chemie bzw. Molekularbiologie? Typ 1: gepaart (abhängig) z.B: vor und nach einer Behandlung Typ 2: ungepaart (unabhängig) mit angenommener gleicher Varianz Typ 3: ungepaart (unabhängig) mit angenommener ungleicher Varianz Meßwerte (Chemie, bzw. Molbio) einseitig oder zweiseitig (one-tailed, two-tailed)? Theorie der kleinen Stichproben Einfacher t-test mit Excel: • Funktion TTEST gibt dem P-Wert zurück (üblicherweise wird ein P-Wert unter 0,05 als signifikant angesehen (α=95%)) Bsp: Besteht ein signifikanter Unterschied im Kaffeekonsum (Anzahl an Tassen Kaffee pro Tag) zwischen Studierenden der Chemie bzw. Molekularbiologie? Typ 1: gepaart (abhängig) z.B: vor und nach einer Behandlung Typ 2: ungepaart (unabhängig) mit angenommener gleicher Varianz Typ 3: ungepaart (unabhängig) mit angenommener ungleicher Varianz Meßwerte (Chemie, bzw. Molbio) einseitig oder zweiseitig (one-tailed, two-tailed)? Theorie der kleinen Stichproben Einfacher t-test mit Excel: • Funktion TTEST gibt dem P-Wert zurück (üblicherweise wird ein P-Wert unter 0,05 als signifikant angesehen (α=95%)) Bsp: Besteht ein signifikanter Unterschied im Kaffeekonsum (Anzahl an Tassen Kaffee pro Tag) zwischen Studierenden der Chemie bzw. Molekularbiologie? Antwort: P=0,65; es besteht kein signifikanter Unterschied im Kaffeekonsum der beiden Gruppen. Beispiel Hypothesen- und Signifikanztests Radner F P W et al. J. Biol. Chem. 2010;285:7300-7311 ©2010 by American Society for Biochemistry and Molecular Biology Dermis and epidermis of Cgi-58−/− mice accumulate TG and exhibit impaired TG hydrolase activity. Dermis and epidermis of Cgi-58−/− mice accumulate TG and exhibit impaired TG hydrolase activity. A, skins of newborn wildtype, Cgi-58−/−, and Atgl−/− mice were surgically removed. Epidermis was separated from dermis and epidermal and dermal lipids were extracted for determination of TG content. B, TG hydrolase activities of epidermal and dermal lysates from newborn wild-type, Cgi-58−/−, and Atgl−/− mice were determined using phospholipid-emulsified triolein substrate, containing [9,103H]triolein as tracer. Release of radiolabeled FA was determined by liquid scintillation counting. Data are means ± S.D. (n = 6–8) and representative for three independent experiments. Statistical significance was determined by the two-tailed Student's t test (*, p < 0.05; ***, p < 0.001).