Statistik & Methodenlehre Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike [email protected] http://psymet03.sowi.uni-mainz.de/ SoSe 2011 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Folie 1 Statistik & Methodenlehre Inhalte dieser Sitzung Theoretische Wahrscheinlichkeiten und empirische Häufigkeiten Bernoulli Experimente Binomial- und Poisson-Verteilung Ausblick: Statistisches Testen Folie 2 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Recap – Notation Bernoulli Experimente Binomialvert. Poisson Vert. Eine Zufallsvariable, die abzählbar viele Werte annehmen kann (in endlich oder unendlich vielen Ausprägungen), wird als diskrete Zufallsvariable bezeichnet Das Ereignis, dass die diskrete Zufallsvariable X eine bestimmte (die i-te) Ausprägung annimmt, wird bezeichnet als X = xi Die Wk für X = xi wird als p(X = xi) oder kürzer p(xi) oder ganz kurz pi bezeichnet p(X = xi) ist eine Punktwahrscheinlichkeit Folie 3 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Recap – Wahrscheinlichkeitsverteilung Bernoulli Experimente Binomialvert. Poisson Vert. Die Verteilung der p(X = xi) auf alle möglichen Ausprägungen von X wird als diskrete Wahrscheinlichkeitsverteilung bezeichnet. Sie beschreibt theoretische Punktwahrscheinlichkeiten und wird definiert als p ( X xi ) : falls x i x1 xk p ( x) 0 sonst Wert von X p(X = xi) Folie 4 x1 x2 p(x1) p(x2) … xi p(xi) … xk p(xk) Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Recap – Verteilungsfunktion Bernoulli Experimente Binomialvert. Die Verteilung der p(X ≤ xm) wird als Verteilungsfunktion der Zufallsvariablen X oder kumulierte Wahrscheinlichkeitsverteilung bezeichnet. Sie beschreibt theoretische Intervallwahrscheinlichkeiten und wird definiert als m Poisson Vert. P( x) p ( X xm ) p1 p2 pm pi i 1 Wert von X p(X ≤ xi) Folie 5 x1 x2 p(x1) p(x1) + p(x2) … xm … p(x1) + p(x2) + … + p(xm) Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Recap – Häufigkeit und Wahrscheinlichkeit Bernoulli Experimente Binomialvert. Poisson Vert. Folie 6 Statistik & Methodenlehre Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Recap – Häufigkeit und Wahrscheinlichkeit Absolute Häufigkeit eines Wertes x: Relative Häufigkeit eines Wertes x: (n = Anzahl aller Werte) Empirisch Theoretisch h x h x f x n p x (Häufigkeitsverteilung) Kumulierte absolute Häufigkeit bis zu einer Schranke u: Relative kumulierte Häufigkeit bis zu einer Schranke u: H x h xi xi u P x p xi i F x f xi xi u i (Emp. Verteilungsfunktion) Folie 7 (Wk.-Verteilung) i (Verteilungsfunktion) Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Zufallsvariablen Recap – Häufigkeit und Wahrscheinlichkeit Bernoulli Experimente Die empirische Häufigkeitsverteilung f(x) und die Wahrscheinlichkeitsverteilung p(x) einer Zufallsvariablen sind konzeptuell strikt zu trennen Binomialvert. Die empirische und theoretische Verteilungsfunktion sind ebenfalls strikt zu trennen Poisson Vert. Die theoretischen Verteilungen bedürfen keiner Daten, denn sie sind gegeben Die theoretische Verteilung bestimmt, was für die empirische Verteilung zu erwarten ist Aber: In der Notation wird oft einfach f(x) bzw. F(x) geschrieben, gleichgültig, ob es um Häufigkeiten oder Wahrscheinlichkeiten geht. Folie 8 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Binomialvert. Poisson Vert. Kann ein Zufallsexperiment mehrfach unter demselben Komplex Ξ durchgeführt werden und sind die einzelnen Versuche stochastisch unabhängig, so spricht man von einem Bernoulli Experiment. Das Bernoulli Experiment ist ein Art MetaExperiment, dessen Trials aus der mehrfachen Durchführung des zugrunde liegenden Experimentes bestehen. Der typische Stichprobenraum eines Bernoulli Experimentes ergibt sich erst nach der sinnvollen Definition einer Zufallsvariablen. Folie 9 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Beispiel: Das Experiment Ξ sei der einmalige Wurf einer fairen Münze, wobei die Münze nicht auf der Kante liegen bleiben kann. Binomialvert. Der Stichprobenraum ist Kopf , Zahl Poisson Vert. Als Zufallsvariable könnte man definieren y1: 0, wenn Kopf Y mit y2 : 1, wenn Zahl Folie 10 p Y y1 : 0.5 p y p Y y2 : 0.5 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Beispiel: Das Bernoulli Experiment bestehe nun in der 20maligen Durchführung des Zufallsexperimentes Ξ Binomialvert. Sein Stichprobenraum umfasst alle möglichen 20elementigen Folgen von Kopf und Zahl, also Poisson Vert. K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , K , , , , , , , , , , , , , , , , , , , , , K K K K K K K K K K K K K K K K K K K Z ' , K , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z , Z Folie 11 Ein Elementarereignis Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Auf dem Stichprobenraum eines solchen Bernoulli Experimentes können viele verschiedene Zufallsvariablen definiert werden. Binomialvert. Beispiel: Jedem möglichen der insgesamt k Elemente des Stichprobenraumes wird eine eindeutige Zahl zugewiesen: Poisson Vert. X x1 : 1, wenn K , K , , K X x : 2, wenn K , K , , Z 2 X X xk : 1048576, wenn K , Z , , Z Folie 12 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Auf dem Stichprobenraum eines solchen Bernoulli Experimentes können viele verschiedene Zufallsvariablen definiert werden. Binomialvert. Beispiel: Jedem möglichen der insgesamt k Elemente des Stichprobenraumes wird eine eindeutige Zahl zugewiesen: Poisson Vert. X x1 : 1, wenn y1 , y1 , , y1 X x : 2, wenn y , y , , y 2 1 1 2 X X xk : 1048576, wenn y1 , y2 , , y2 Folie 13 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Binomialvert. Poisson Vert. Folie 14 Zur Definition der Wahrscheinlichkeitsverteilung dieser Zufallsvariablen kann der Multiplikationssatz für stochastisch unabhängige Ereignisse herangezogen werden p X x1 : p y1 p y1 p y1 p X x2 : p y1 p y1 p y2 p x p X x : p y p y p y k 1 2 2 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Aber: Zu Zeiten Bernoullis wurde Wahrscheinlichkeitsrechnung vor allem zum besseren Verständnis des Glücksspieles betrieben Binomialvert. Deshalb spielte die Ordnung der Ergebnisse aus den Trials eines Bernoulli Experimentes eher keine Rolle Poisson Vert. Die Zufallsvariable eines Bernoulli Experimentes ist per definitionem einfach die Summe der Realisationen aus den n durchgeführten Trials, also n X y1 y2 yn yi i 1 mit n=20 in unserem Beispiel Folie 15 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Binomialvert. Poisson Vert. Im Beispiel mit n=20 ist dies aber gleichbedeutend mit der Definition X x1 : 0, wenn 0 Zahl X x : 1, wenn 1 Zahl 2 X X x21 : 1, wenn 20 Zahl Wenn in der zugrunde liegenden Zufallsvariable Y ein „Treffer“ (hier: Zahl) die 1 erhalten hat, liefert X also einfach die Anzahl der Treffer in den n Trials Achtung: Diese Übertragung ist nicht mehr gültig, sobald die Zufallsvariable Y anders definiert wird Folie 16 (z.B. mit umgekehrter Zuweisung von 0/1 zu Kopf/Zahl) Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Folgen unabhängiger Ereignisse Bernoulli Experimente Bernoulli Experimente Frage: Angenommen, die Wahrscheinlichkeitsfunktion der Zufallsvariablen X aus dem zugrunde liegenden Experiment ist bekannt – kann dann die Wahrscheinlichkeitsfunktion von Y ermittelt werden? Binomialvert. Am Beispiel: Gibt es die mathematische Beziehung Poisson Vert. p Y y1 : 0.5 p y p Y y2 : 0.5 Folie 17 ? p X x1 p X x2 p x p X x 20 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente Der einfachste Fall eines Bernoulli Experimentes beruht auf einem Experiment mit nur zwei möglichen disjunkten Ergebnissen Binomialvert. Man definiere für dieses Experiment die folgende Zufallsvariable und Wahrscheinlichkeitsfunktion: Poisson Vert. Y y1 : 0 Y Y y2 : 1 p Y y1 : q p y p Y y2 : p mit q = 1–p Beispiel: Beim Münzwurf wäre z.B. p = q = 0.5 Folie 18 (p ist die so genannte „Treffer- oder Erfolgswahrscheinlichkeit“) Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente Man hat Y y1 : 0 Y Y y2 :1 und kennt p Y y1 : 1 p p( y) p Y y2 : p Binomialvert. Poisson Vert. ist gesucht p X x1 : ? p X x2 : ? p ( x) pX x : ? n 1 Folie 19 Bei n Trials X x1 : 0 X x :1 2 X X xn 1 : n Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente Wird ein dichotomes Experiment n mal durchgeführt, kann die Wahrscheinlichkeitsfunktion der möglichen Realisationen für das resultierende Bernoulli Experiment mathematisch hergeleitet werden: Binomialvert. Poisson Vert. n x n x f ( x , n, p ) p q x mit n = Anzahl aller Trials Dies ist die Binomialverteilung x = Anzahl günstiger Ergebnisse in den n Trials p = Wk für jedes x q = Wk der übrigen n-x Ergebnisse, also, q = 1–p Folie 20 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente und kennt Man hat Y y1 : 0 Y Y y2 :1 p Y y1 : 1 p p( y) p Y y2 : p Binomialvert. Poisson Vert. ist gesucht n f ( x , n, p ) p x q n x x Bei n Trials p X x1 : ? p X x2 : ? p ( x) pX x : ? n 1 Folie 21 X x1 : 0 X x :1 2 X X xn 1 : n Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Exkurs: Fakultät und der Binomialkoeffizient Bernoulli Experimente Der Binomialkoeffizient ist definiert als n n! x x ! (n x)! Binomialvert. Poisson Vert. Dabei ist n ! 1 2 3 n per definitionem mit 0! = 1 Folie 22 lies: „n über x“ lies: „n Fakultät“ Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente Die Binomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung, da sie nur endlich viele verschiedene Werte annehmen kann Binomialvert. Die mathematische Funktion kann nur dann angewandt werden, wenn die Zufallsvariable des zugrunde liegenden Experimentes 0/1-kodiert ist Poisson Vert. Die Funktion f(x,n,p) gibt dann die Wahrscheinlichkeit für jede mögliche Häufigkeit von 1en in den n Versuchen an Anzahl der „Treffer“ Die Binomialverteilung ist die „Mutter aller Verteilungen“, da aus ihr praktisch alle wichtigen weiteren Verteilungen abgeleitet werden können Folie 23 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente Die Wahrscheinlichkeitsfunktion f(x,n,p) liefert die Punktwahrscheinlichkeiten für ein genau xmaliges Auftreten der Realisation 1 einer 0/1 kodierten Zufallsvariablen. Binomialvert. Zusätzlich existiert auch die Verteilungsfunktion der Intervallwahrscheinlichkeiten für ein maximal x-maliges Auftreten der Realisation 1 Poisson Vert. Diese ist einfach die Summe aller Punktwahrscheinlichkeiten bis zur Realisation xi k F x, n, p f xi , n, p i 1 Folie 24 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Binomialverteilung Bernoulli Experimente Am Beispiel mit p=0.5 und n=20 ergäbe sich x Binomialvert. Poisson Vert. Folie 25 f(x) F(x) 0 0.000 0.000 1 0.000 0.000 2 0.000 0.000 3 0.001 0.001 4 0.005 0.006 5 0.015 0.021 … … … 20 0.000 1.000 x x Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Poisson Verteilung Bernoulli Experimente Binomialvert. Poisson Vert. Für ein Bernoulli Experiment mit 2 disjunkten Ergebnissen gelte die Häufigkeit, mit dem ein Ereignis in einem bestimmten Zeitintervall typischerweise auftritt, sei . die Wahrscheinlichkeit des Eintretens von m Ereignissen in einem Zeitintervall ist nur von der Länge des Intervalls abhängig, nicht von seiner Lage auf der Zeitachse die Ereignisse sind stochastisch unabhängig Die Wahrscheinlichkeit für das Eintreten von m Ereignissen in einem Zeitintervall ist dann e x f ( x, ) x! Folie 26 Poisson Verteilung (e = Eulersche Zahl; 2.718) Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Poisson Verteilung Bernoulli Experimente e x f ( x, ) x! Binomialvert. Poisson Vert. wird auch als Intensitätsparameter der PoissonVerteilung bezeichnet Anders als die Binomialverteilung ist die PoissonVerteilung unendlich abzählbar. Folie 27 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Poisson Verteilung als Approximation der Binomialvert. Bernoulli Experimente Wenn n groß ist und p klein, ist die Bestimmung von Wahrscheinlichkeiten aus der Binomialverteilung mathematisch aufwändig Binomialvert. Die Poisson-Verteilung approximiert die Binomialverteilung für seltene Ereignisse sehr gut, wenn n ≥ 100 und np ≤ 10 Poisson Vert. Dabei wird angenommen, dass λ = np e n p ( n p ) x n x f ( x, n p ) p (1 p ) n x f ( x, n, p ) x! x Poisson Folie 28 Binomial Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Diskrete Wk-Verteilungen Poisson Verteilung als Approximation der Binomialvert. Bernoulli Experimente Die Poisson Verteilung geht mathematisch unmittelbar aus der Binomialverteilung hervor Binomialvert. Die Poisson Verteilung wird häufig als Verteilung für seltene Ereignisse bezeichnet. Poisson Vert. Hier ist streng zu unterscheiden zwischen einer kleinen Wahrscheinlichkeit p und einer theoretisch recht großen Anzahl n·p der unwahrscheinlichen Ereignisse. Die Güte der Approximation bezieht sich auf den relativen Approximationsfehler, d.h. den Quotienten aus der Binomial-Wk und der Poisson-Wk Folie 29 Statistik & Methodenlehre Definition Diskrete Verteilungen Stetige Verteilungen Inferenzstatistik – Primer Das Prinzip des statistischen Testens Bernoulli Experimente Binomialvert. Poisson Vert. Gustav Fechner, Urvater der Experimentellen Psychologie, entwickelte zentrale Methoden der modernen Psychophysik mit genau einem Ziel: den Beweis zu führen, dass Pflanzen eine Seele haben. Er perfektionierte eine Methode der Mikrostimulation, auf die hin er eine biologische Reaktion und bei Pflanzen nachweisen wollte. Eine solche Reaktion wäre der Beleg, dass Pflanzen fühlen können. Damit wäre es zum Denken und schließlich zur Seele nicht mehr weit. Fechner führte insgesamt n=24576 Messungen von ReizReaktionsmusters bei Pflanzen durch. Folie 30 Angenommen, Pflanzen zeigen die gewünschte Reaktion auch ohne Stimulation (d.h. zufällig) mit einer Wahrscheinlichkeit von p=.25. Fechner möge eine Reaktion in m=6306 Fällen finden. Haben Pflanzen eine Seele? Statistik & Methodenlehre Relevante Excel Funktionen Diskrete Wahrscheinlichkeitsverteilungen • BINOM.VERT() • POISSON.VERT() oder EXP() und POTENZ() bzw. ^ („hoch“) • SUMME(), PRODUKT(), FAKULTÄT() Folie 31