Statistik & Methodenlehre e ode e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 ((Raum 06-206)) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. g Mathematische und statistische Methoden II Dr. Malte Persike } [email protected] http://psymet03.sowi.uni-mainz.de/methods/ SS 2010 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Statistik & Methodenlehre e ode e e Multiplikations satz Mengenlehre Wk-Theorie Stochastische Unabhängigkeit Wenn gilt: p(B) = p(B | A) Wechselseitigkeit Gegenereignisse werden die Ereignisse A und B stochastisch unabhängig genannt, weil die Wahrscheinlichkeit des Auftretens des Ereignisses B nicht vom Auftreten von A abhängt. Setzen wir die rechte Seite der Gleichung in das Multiplikationstheorem ein, erhalten wir: p(A (A ∩ B) = p(B (B | A) p(A) (A) = p(A) (A) p(B) (B) Kurz: p(A ∩ B) = p(A) P(B) Multiplikationssatz für stoch. unabh. Ereignisse Statistik & Methodenlehre e ode e e Multiplikations satz Wechselseitigkeit Gegenereignisse Mengenlehre Wk-Theorie Stochastische Unabhängigkeit Verallgemeinerung des Multiplikationssatzes Wenn die Ereignisse A1, A2, … Ak insgesamt unabhängig sind, so gilt p(A1∩A2∩… ∩ ∩Ak) = p(A1))·p(A p(A2))·… ·p(A p(Ak) Achtung: g Die Disjunktheit j von Ereignissen g hat mit der stochastischen Unabhängigkeit nichts zu tun. A und B sind disjunkt (A ∩ B = {∅}). Wenn aber A eingetreten ist, verändert sich p(B) zu p(B) / p(Ω \ A), wird also größer, solange A ≠ {∅}. A B Ω Statistik & Methodenlehre e ode e e Multiplikations satz Mengenlehre Wk-Theorie Stochastische Unabhängigkeit Wechselseitigkeit Wir haben beim Multiplikationstheorem gesehen, gesehen dass Wechselseitigkeit Gegenereignisse p(A ∩ B) = p(B | A) p(A) = p(A | B) p(B) Und beim Multiplikationssatz, dass für ein von A stochastisch unabhängiges Ereignis B [also p(B) = p(B | A)] gilt: p(A ∩ B) = p(A) p(B) Ei Einsetzen t der d zweiten it Gleichung Gl i h in i die di erste t führt füh t zu p(A | B) p(B) = p(A) p(B) also p(A | B) = p(A) Also: Ist B von A unabhängig, so ist es auch A von B. Statistik & Methodenlehre e ode e e Multiplikations satz Mengenlehre Wk-Theorie Stochastische Unabhängigkeit Gegenereignisse Nach de Morgans Gesetzen gilt: Wechselseitigkeit Gegenereignisse A∪ B = A∩ B A∩ B = A∪ B Damit lässt sich zeigen, dass p ( A ∩ B ) = p ( A) ⋅ p ( B ) p ( A ∩ B ) = p ( A) ⋅ p ( B ) p ( A ∩ B ) = p ( A) ⋅ p( B ) A B Wenn also die Ereignisse A und B stochastisch unabhängig sind, so sind es auch ihre Gegenereignisse und alle Paarungen daraus. Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Definition Bernoulli Experimente Binomialvert. Poisson Vert. Eine Zufallsvariable, Ei Z f ll i bl die di abzählbar b ählb viele i l Werte W t annehmen kann (in endlich oder unendlich vielen Ausprägungen), wird als diskrete Zufallsvariable bezeichnet Das Ereignis, dass die diskrete Zufallsvariable X eine bestimmte (die i-te) Ausprägung annimmt, wird bezeichnet als X = xi Die Wk für X = xi wird als p(X = xi) oder kurz pi bezeichnet pi ist eine Punktwahrscheinlichkeit Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Diskrete Zufallsvariablen Übersicht Bernoulli Experimente Binomialvert. Poisson Vert. Stetige Verteilungen Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Wahrscheinlichkeitsverteilung Bernoulli Experimente Binomialvert. Poisson Vert. Die Verteilung der p(X = xi) wird als diskrete Wahrscheinlichkeitsverteilung bezeichnet. Sie beschreibt theoretische Punktwahrscheinlichkeiten und wird definiert als ⎧ p( X = xi ) = pi falls x i ∈ { x1 … xk } f ( x) = ⎨ 0 sonst ⎩ Wert von X p(X = xi) x1 x2 p(x1) p(x2) … xi p(xi) … xk p(xk) Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Verteilungsfunktion Bernoulli Experimente Binomialvert. Die Verteilung der P(X ≤ xm) wird als Verteilungsfunktion der Zufallsvariablen X oder kumulierte Wahrscheinlichkeitsverteilung bezeichnet. Sie beschreibt theoretische Intervallwahrscheinlichkeiten und wird definiert als m Poisson Vert. F ( x) = p( X ≤ xm ) = p1 + p2 + … + pm = ∑ pi i =1 Wert von X p(X ≤ xi) x1 x2 p(x1) p(x1) + p(x2) … xm … p(x1) + p(x2) + … + p(xm) Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Häufigkeit und Wahrscheinlichkeit Bernoulli Experimente Binomialvert. Poisson Vert. Die empirische beobachtete Häufigkeit des Auftretens einer Realisation X = xi in einem Z fallse pe iment wird Zufallsexperiment i d als h(X = xi) geschrieben. gesch ieben h(X = xi) wird auch als absolute Häufigkeit bezeichnet. g f(X = xi) ist dann f( Die relative Häufigkeit definiert als der Quotient aus absoluter Häufigkeit und der Anzahl n aller Versuche, also f(X = xi) = h(X = xi) / n Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Zusammenfassung Notation Bernoulli Experimente Relative Häufigkeit eines Wertes x: Binomialvert. h ( x) Absolute Häufigkeit eines Wertes x: (n = Anzahl aller Werte) h( x) f ( x) = n ((Empirische p Häufigkeitsverteilung) g g) Poisson Vert. Kumulierte absolute Häufigkeit bis zu einer Schranke u: Relative kumulierte Häufigkeit bis zu einer Schranke u: H ( u ) = ∑ h ( xi ) xi ≤ u ( ) ( ) i F ( u ) = ∑ f ( xi ) xi ≤ u i (Empirische Verteilungsfunktion) Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Theoretische und empirische Wk-Verteilung Bernoulli Experimente Die empirische Di i i h Häufigkeitsverteilung Hä fi k it t il f( ) und f(x) d die di Wahrscheinlichkeitsverteilung p(x) sind konzeptuell strikt zu trennen Binomialvert. Die empirische Verteilungsfunktion und die Verteilungsfunktion g einer Zufallsvariablen sind ebenfalls konzeptuell strikt zu trennen Poisson Vert. Die theoretischen Verteilungen bedürfen keiner Daten, denn sie sind gegeben Die theoretischen Verteilungen bestimmen bestimmen, was für die empirischen Verteilungen zu erwarten ist Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Folgen g unabhängiger g g Ereignisse g Bernoulli Experimente Bernoulli Experimente Kann ein Zufallsexperiment mehrfach unter demselben Komplex Ξ durchgeführt werden und sind die einzelnen Versuche stochastisch unabhängig, so spricht man von einem Bernoulli Versuch. Binomialvert. Poisson Vert. Wenn eine einzelne Durchführung die Ergebnisse x1, x2 … xk ergeben kann und diesen Realisierungen die Wahrscheinlichkeiten p(x1), p(x2), …, p(xk) zugeordnet sind, so ist die Wahrscheinlichkeit einer bestimmten Folge von n Zi h Ziehungen n px1 , x2 ... xn = p ( x1 ) ⋅ p ( x2 ) ⋅… ⋅ p ( xn ) = ∏ p ( xi ) i =1 Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Folgen g unabhängiger g g Ereignisse g Bernoulli Experimente Bernoulli Experimente Der Stichprobenraum Ω eines Bernoulli Experimentes umfasst alle möglichen Folgen der Ergebnisse der einzelnen Ziehungen. Binomialvert. Beispiel: Eine Münze wird 20 Mal geworfen Wurf Nr. Poisson Vert. Ergebnis x 1 Kopf 0 2 Kopf 0 3 Zahl 1 4 Kopf 0 5 Z hl Zahl 1 … … … Ein Elementarereignis Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen g Binomialverteilung Bernoulli Experimente Der Stichprobenraum Ω eines Bernoulli Experimentes umfasst alle möglichen Folgen der Ergebnisse der einzelnen Ziehungen. Binomialvert. Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte Poisson Vert. n m p q sei sei sei sei die die die die Anzahl aller Versuche mit Zurücklegen g Anzahl günstiger Ergebnisse in den n Ziehungen Wk für jedes m Wk der übrigen g n-m Ergebnisse, g also, q = 1 - p ⎛ n ⎞ m n−m f (m, n, p ) = ⎜ ⎟ p q ⎝m⎠ Dies ist die Binomialverteilung Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens Bernoulli Experimente Binomialvert. Poisson Vert. Gustav Fechner, Urvater der Experimentellen Psychologie, entwickelte t i k lt zentrale t l Methoden M th d der d modernen d Psychophysik P h h ik mit genau einem Ziel: den Beweis zu führen, dass Pflanzen eine Seele haben. Er perfektionierte eine Methode der Mikrostimulation, auf die hin er eine biologische Reaktion und bei Pflanzen nachweisen wollte. Eine solche Reaktion wäre der Beleg, dass Pflanzen fühlen können. Damit wäre es zum Denken und schließlich zur Seele nicht mehr weit. Fechner führte insgesamt nn=24576 24576 Messungen von ReizReaktionsmusters bei Pflanzen durch. Angenommen, Pflanzen zeigen die gewünschte Reaktion auch h ohne h Stimulation Sti l ti (d.h. (d h zufällig) fälli ) mit it einer i Wahrscheinlichkeit von p=.25. Fechner möge eine Reaktion in m=6306 Fällen finden. Haben Pflanzen eine Seele? Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens Bernoulli Experimente Binomialvert. Poisson Vert. Wenn die Wahrscheinlichkeitsfunktion eines Zufallsexperimentes theoretisch bekannt ist, können die bei einer Durchführung erwarteten empirischen Häufigkeiten bestimmt werden. werden Beobachtete absolute oder relative Häufigkeiten können dann mit den erwarteten Häufigkeiten verglichen werden. Wenn eine beobachtete Häufigkeit „zu unwahrscheinlich“ ist,, um unter der gegebenen g g Wahrscheinlichkeitsfunktion zu entstehen, kann die Wahrscheinlichkeitsfunktion als nicht zutreffend betrachtet werden. Entweder sind dann ihre Parameter falsch definiert oder die Funktion selbst ist nicht zutreffend. Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens – Binomialtest Bernoulli Experimente Binomialvert. Poisson Vert. Grundgedanke: Eine beobachtete Häufigkeit m in einem Bernoulli Experiment sollte im Bereich „typischer“ erwarteter Häufigkeiten liegen. Diese erwarteten Di t t Häufigkeiten Hä fi k it hä hängen b beii binomialverteilten Zufallsvariablen von der Anzahl der Versuche n und den Auftretenswahrscheinlichkeiten p und q ab. ab Problem: Allein aufgrund der zufälligen Ziehung wird die beobachtete Häufigkeit schwanken (Stichprobenfehler). Frage: Wie extrem muss eine beobachtete Häufigkeit sein, damit wir begründet annehmen können, dass diese Beobachtung „nicht passt“? Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens – Binomialtest Bernoulli Experimente Binomialvert. Die Häufigkeitsverteilung einer binomialverteilten V i bl ist Variablen i t bekannt, b k t sie i lässt lä t sich i h durch d h eine i mathematische Formel beschreiben ⎛ n ⎞ m n−m f ( m, n , p ) = ⎜ ⎟ p q ⎝m⎠ Daraus sind die erwarteten Häufigkeiten zu berechnen berechnen. Poisson Vert. Beim statistischen Testen fragen wir niemals nach der Punktwahrscheinlichkeit sondern immer nach Punktwahrscheinlichkeit, Intervallwahrscheinlichkeiten, z.B. f ( X ≤ xi ) → Ein so kleiner oder noch kleinerer Wert f ( X ≥ xi ) → Ein so großer oder noch größerer Wert 1 − f ( xi < X < x j ) → Ein so extremer oder noch extremerer Wert Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens – Binomialtest Bernoulli Experimente Ist die berechnete Wahrscheinlichkeit zu klein, ist die Beobachtung einer so extremen Häufigkeit vermutlich nicht zufällig, sondern systematisch. Die Beobachtung ist dann statistisch signifikant. signifikant Binomialvert. Problem: Wie klein ist „zu unwahrscheinlich“? Poisson Vert. Hier haben sich in der Praxis zwei Cut-Off Werte eingebürgert, die als α–Niveaus oder Signifikanzniveaus bezeichnet werden. Es gilt: α ≥ 0.05 α < 00.05 05 α < 0.01 → statistisch nicht signifikant → statistisch signifikant → statistisch hochsignifikant Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens – Binomialtest Bernoulli Experimente In einem Experiment p mit einer angenommenen g Binomialverteilung f(m, n=24576, p=0.25) erhalte man ein m=6306. Binomialvert. Man berechnet M b h t nun die di Auftretenswahrscheinlichkeit A ft t h h i li hk it p(X ≥ m) unter der Annahme, dass die angenommene Häufigkeitsverteilung gilt. Poisson Vert. Es sei p=0.008. Nach unseren Konventionen würden wir auf jedem αNi Niveau sagen, dass d m signifikant i ifik t ist. i t Aber Achtung: Das m=6306 hat eine Auftretenswahrscheinlichkeit von p(m) p(m)=00.008. 008. Mit diesem p kann es also auch dann vorkommen, wenn die angenommene Binomialverteilung zutrifft. Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens – Binomialtest Bernoulli Experimente Binomialvert. Poisson Vert. Die Aussage, g , ein m sei statistisch signifikant, g , ist eine Wahrscheinlichkeitsaussage bei der immer ein Restirrtum verbleibt, die Irrtumswahrscheinlichkeit. Diese Irrtumswahrscheinlichkeit hängt nicht von der konkret erhaltenen Wahrscheinlichkeit p ab, sondern vom gewählten Signifikanzniveau α. Bei α=0.05 beträgt die Irrtumswahrscheinlichkeit also 5%, bei α=0.01 ist sie 1%. Praxis: In der Praxis wird α demzufolge entweder als α–Niveau, Signifikanzniveau oder auch Irrtumswahrscheinlichkeit bezeichnet. bezeichnet Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens – Binomialtest Bernoulli Experimente Beobachtung im Experiment: X=m Frage: Kann m aus einer bestimmten Verteilung stammen? Geht die Höhe der Häufigkeit auf einen Stichprobenfehler zurück? Binomialvert. (1) Bestimmung der Verteilung der Zufallsvariablen X ((2)) Festlegung g g eines Signifikanzniveaus g α Poisson Vert. (3) Berechnung der Wahrscheinlichkeit für dieses oder ein extremeres m: z. B. p(X≥m) (4) Vergleich von p mit α und Treffen der Signifikanzaussage Aber: Bei dieser Aussage irrt man sich mit einer Wahrscheinlichkeit von α·100% Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen g Poisson Verteilung Bernoulli Experimente Binomialvert. Poisson Vert. Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte Die Wahrscheinlichkeit, dass ein Ereignis in einem bestimmten Zeitintervall auftritt, sei λ. Die Wahrscheinlichkeit Di W h h i li hk i des d Eintretens Ei von m Ereignissen E i i in einem Zeitintervall ist nur von der Länge des Intervalls abhängig, nicht von seiner Lage auf der Zeitachse Ereignisse sind stochastisch unabhängig Die Wahrscheinlichkeit für das Eintreten von m Ereignissen in einem Zeitintervall ist dann e−λ λ m f (m, λ ) = m! Poisson Verteilung g (e = Eulersche Zahl; 2.718) Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen g Poisson Verteilung Bernoulli Experimente e−λ λ m f (m, λ ) = m! Binomialvert. λ wird i d auch h als l Intensitätsparameter I t ität t der d PoissonP i Poisson Vert. Verteilung bezeichnet Anders als die Binomialverteilung ist die PoissonPoisson Verteilung unendlich abzählbar. Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen g Poisson Verteilung als Approximation der Binomialvert. Bernoulli Experimente Wenn n groß ist und p klein, klein ist die Bestimmung von Wahrscheinlichkeiten aus der Binomialverteilung mathematisch aufwändig. Binomialvert. Die Poisson-Verteilung approximiert die Binomialverteilung für seltene Ereignisse sehr gut Poisson Vert. Dabei wird angenommen, dass λ = n·p e − n⋅ p ( n ⋅ p ) m ⎛ n ⎞ m f (m, n ⋅ p ) = ≈ ⎜ ⎟ p (1 − p ) n − m = f (m, n, p ) m! ⎝m⎠ Poisson Binomial Statistik & Methodenlehre e ode e e Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen g Poisson Verteilung als Approximation der Binomialvert. Bernoulli Experimente Die Poisson Verteilung wird wegen ihrer Nähe zur Binomialverteilung mit kleinem p auch häufig als Verteilung für seltene Ereignisse bezeichnet. bezeichnet Binomialvert. Poisson Vert. Hier ist streng zu unterscheiden zwischen einer kleinen Wahrscheinlichkeit p und einer theoretisch beliebig großen Anzahl der seltenen Ereignisse n·p. Die Güte der Approximation bezieht sich auf den relativen Approximationsfehler, d.h. den Quotienten aus der Binomial-Wk und der Poisson-Wk Statistik & Methodenlehre e ode e e Relevante Excel Funktionen Diskrete Wahrscheinlichkeitsverteilungen • BINOMVERT() • POISSON() oder EXP() und POTENZ() bzw. bzw ^ ((„hoch hoch“)) • SUMME()