Statistik & Methodenlehre Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike } [email protected] http://psymet03.sowi.uni-mainz.de/ SoSe 2011 Fachbereich Sozialwissenschaften Psychologisches Institut Johannes Gutenberg Universität Mainz Folie 1 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Merkmale & Variablen Grundlagen Zufallsexperimente Eigenschaften, deren Werte bei den statistischen Einheiten beobachtet werden, heißen Merkmale Stichprobenraum Die Ausprägungen eines Merkmals können beliebiger Art sein (z.B. Worte, Formen, Farben etc.) Zufallsvariablen Die „Werte“, die ein Merkmal annehmen kann, heißen Ausprägungen Eine Variable wird definiert, indem den Ausprägungen des Merkmals Zahlen zugeordnet werden. Diese Zahlen heißen Realisationen oder Werte. Merkmal Punkte auf Fläche Folie 2 „2“ „5“ Variable Zahlen Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Merkmale & Variablen Grundlagen Zufallsexperimente Eigenschaften, deren Werte bei den statistischen Einheiten beobachtet werden, heißen Merkmale Stichprobenraum Die Ausprägungen eines Merkmals können beliebiger Art sein (z.B. Worte, Formen, Farben etc.) Zufallsvariablen Die „Werte“, die ein Merkmal annehmen kann, heißen Ausprägungen Eine Variable wird definiert, indem den Ausprägungen des Merkmals Zahlen zugeordnet werden. Diese Zahlen heißen Realisationen oder Werte. Merkmal Punkte auf Fläche Folie 3 „14“ „35“ Variable Zahlen Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Merkmale & Variablen Notation Zufallsexperimente Stichprobenraum Zufallsvariablen Folie 4 Variablen werden mit Großbuchstaben symbolisiert, häufig verwendet man X und Y Die Realisationen einer Variablen werden dann mit den entsprechenden Kleinbuchstaben gekennzeichnet, also x und y Die Menge aller möglichen Realisationen ist der Wertebereich einer Variablen Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Variablen Notation Zufallsexperimente Frage: Wie werden Realisationen formal kodiert? Stichprobenraum Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x1, x2, …, xk indiziert Zufallsvariablen Folie 5 Ziel: Eine symbolische Schreibweise für „Der Wert der vierten Ausprägung von X“ zu finden Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). ⎧ x1: 1, wenn <18 ⎪ Alter X = ⎨ x2 : 2, wenn <68 ⎪ x : 3, wenn ≥ 68 ⎩ 3 ⎧ x1 : 0, wenn <18 ⎪ Alter X = ⎨ x2 : 18, wenn <68 ⎪ x : 68, wenn ≥ 68 ⎩ 3 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Variablen Notation Zufallsexperimente Frage: Wie werden Realisationen formal kodiert? Stichprobenraum Hat eine Variable X genau k mögliche Realisationen, so werden diese mit x1, x2, …, xk indiziert Zufallsvariablen Folie 6 Ziel: Eine symbolische Schreibweise für „Der Wert der vierten Ausprägung von X“ zu finden Laufindizes (oft i oder j) helfen, die einzelnen Realisationen symbolisch zu adressieren (Beginn bei 1). Das Symbol xj mit j = 1…k bezeichnet dann die j-te Realisation der Zufallsvariablen X. Diese Indizierung ist nur für diskrete Variablen sinnvoll, da stetige Variablen unendlich viele Realisationen haben Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Variablen Definition Zufallsexperimente Variablen werden immer über eine mathematische Formulierung definiert, z.B. Merkmal Stichprobenraum Zufallsvariablen Variable 0, wenn ⎧ x1: 1, ⎪ x : 2, ⎪ 2 1, wenn X =⎨ ⎪ ⎪⎩ x 6 : 6, 5, wenn Die extensionale Definition zählt alle Realisationen der Variablen auf. Folie 7 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Variablen Definition Zufallsexperimente Variablen werden immer über eine mathematische Formulierung definiert, z.B. Merkmal Stichprobenraum Variable X = {0… + ∞} Zufallsvariablen Die intensionale Definition gibt eine Vorschrift an, die die Variable eindeutig spezifiziert. Folie 8 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Variablen Typisierung von Merkmalen und Variablen Zufallsexperimente Stichprobenraum Die wichtigste Typisierung unterschied diskrete von stetigen (kontinuierlichen) Daten Hierbei sind Typen von Merkmalen und Typen von Variablen streng zu unterscheiden. ● ⎧ x1: 0, wenn <18 ⎪ Alter X = ⎨ x 2 : 1, wenn <68 ⎪ x : 2, wenn ≥ 68 ⎩ 3 Zufallsvariablen ● Folie 9 Alter ist ein stetiges Merkmal. Eine Variable „Alter“ kann aber diskret definiert werden als Gleiches gilt z.B. für Intelligenz, Schulleistung, Sehvermögen, Fahreignung Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Variablen & Messungen Unterscheidung Zufallsexperimente Die empirische Feststellung der Realisation einer Variablen wird als Messung bezeichnet Stichprobenraum Dabei ist zu unterscheiden zwischen der Beobachtung der Ausprägung des Merkmals und der Messung der Realisation der Variablen Zufallsvariablen Denn: Die Beobachtung kann eine Information in beliebiger Form erheben (z.B. verbal, bildlich), die Messung liefert immer eine Zahl. Die gemessenen Zahlenwerte einer Variablen heißen Messwerte Folie 10 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Das Zufallsexperiment Von Variablen zu Zufallsvariablen Zufallsexperimente Eine Variable wird zur Zufallsvariablen, wenn ihre Realisation in einem Zufallsexperiment festgestellt wird. Stichprobenraum (Zufalls-)Experiment = Ein Satz von Regeln, unter denen eine bestimmte Handlung ausgeführt wird (Bedingungskomplex Ξ, „Xi“) Trial = Eine Durchführung des Experimentes Zufallsvariablen Ergebnis = Beobachtung am Ende des Trials (in beliebiger Form, z.B. als Zahl, Bild, Symbol, Farbe etc.) Ereignis = Jede beliebige Menge von Ergebnissen Achtung: Ergebnisse & Ereignisse sind noch nicht zwangsläufig Realisationen einer Zufallsvariablen Folie 11 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Folie 12 Variablen Zufallsvariablen Das Zufallsexperiment Von Variablen zu Zufallsvariablen Beispiel I: Einmaliger Würfelwurf Zufallsexperiment (Ξ): Ein 6-seitiger Würfel ist einmal zu werfen. Er kann nicht auf einer Kante liegen bleiben. Ergebnis ist die Augenzahl der oben liegenden Seite. Ergebnisse: Jede mögliche Augenzahl (1, 2, 3, 4, 5, 6) Ereignisse: „1“, „1 oder 6“, „Augenzahl ≤ 3“, „ungerade Zahl“, „irgendeine Zahl“ Trial: Der einmalige Wurf des Würfels Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Das Zufallsexperiment Von Variablen zu Zufallsvariablen Beispiel II: Zweimaliger Münzwurf Zufallsexperiment (Ξ): Eine Münze ist zweimal zu werfen. Sie kann nicht auf einer Kante liegen bleiben. Ergebnis ist die oben liegende Seite. Ergebnisse: Jede mögliche Kombination der zwei Münzen (K+K, K+Z, Z+K, Z+Z) Ereignisse: „zweimal dieselbe Seite“, „Kein Kopf“ Trial: Der zweimalige Wurf der Münze Achtung: Die Durchführung von 2 Trials des Zufallsexperimentes „Eine Münze wird einmal geworfen“ ist ein anderes Experiment. Folie 13 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Das Zufallsexperiment Von Variablen zu Zufallsvariablen Beispiel III: Zulassung zum Psychologiestudium Zufallsexperiment (Ξ): Aus 782 Bewerbern werden 44 verschiedene Personen zufällig ausgewählt. Ergebnis ist die Menge der 44 Personen. Ergebnisse: Jede Menge von 44 Personen Ereignisse: „die 44 Besten“, „die 44 Besten oder die 44 Schlechtesten“, „jede Auswahl von 44 Personen aus den besten 391“ Trial: Die einmalige Auswahl von 44 Personen Achtung: Die Durchführung von 44 Trials des Zufallsexperimentes „Aus 742 Bewerbern wird 1 Person ausgewählt“ ist ein anderes Experiment. Folie 14 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Das Zufallsexperiment Von Variablen zu Zufallsvariablen Das Zufallsexperiment ist in weiten Teilen ein sehr deterministisches Konzept, denn − der Ablauf eines Trials ist a-priori vollständig bestimmt − die möglichen Ergebnisse sind a-priori vollständig bestimmt − nur das konkrete Ergebnis (die Beobachtung) ist a-priori unbestimmt Daher kann sich die Statistik dem Verständnis des Zufallsexperimentes über mathematische Hilfsmittel nähern, nämlich der Mengenlehre Folie 15 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre Zufallsexperimente Definition: Ergebnisse eines Zufallsexperimentes sind immer Mengen. Diese Mengen können auch nur aus einem Element bestehen. Stichprobenraum Beispiel I: Einmaliger Würfelwurf Zufallsvariablen {1}, {2}, {3}, {4}, {5}, {6} Beispiel II: Zweimaliger Münzwurf {K, K}, {K, Z}, {Z, K}, {Z, Z} Beispiel III: IQ-Test {0}, {1}, {2}, …, {100}, {101}, … Folie 16 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre Zufallsexperimente Es galt: Ereignis = Jede beliebige Menge (Kombination) möglicher Ergebnisse eines Trials Stichprobenraum Elementarereignis = die kleinste Menge disjunkter Ereignisse, in die sich die möglichen Ergebnisse eines Trials zerlegen lassen Zufallsvariablen Zwei Ereignisse E1 und E2 heißen disjunkt (paarweise unvereinbar), wenn gilt E1 ∩ E2 = ∅ Schnittmenge Folie 17 Unmögliches Ereignis Statistik & Methodenlehre Variablen Zufallsexperimente Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre Beispiel I: Beim Wurf eines Würfels lauten die Elementarereignisse {1}, {2}, {3}, {4}, {5}, {6}, Stichprobenraum nicht aber {{2}, {4}, {6}} oder {{1},{ 5}} Zufallsvariablen Beispiel II: Beim Wurf zweier Würfel sind die Elementarereignisse (obwohl diese disjunkt sind) {1,1} , {1,2} , {1,3},…, {6,5}, {6,6}, nicht aber {{1, 6}, {6, 1}} oder {{1, 1}, {3, 3}, {6, 6}} (und vor allem nicht das Ereignis {1}, das überhaupt nicht vorkommen kann) Folie 18 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre Zufallsexperimente Die vollständige Menge der Elementarereignisse eines Zufallsexperimentes heißt Stichprobenraum Ω. Stichprobenraum Der Stichprobenraum umfasst alle Elementarereignisse (also alle möglichen Ergebnisse) eines Zufallsexperimentes Zufallsvariablen Der Stichprobenraum ist eine Menge Beispiel: Der Stichprobenraum beim einmaligen Würfelwurf ist Ω = {1, 2, 3, 4, 5, 6} Hinweis: Eigentlich müsste man schreiben: Ω = {{1}, {2}, {3}, {4}, {5}, {6}} Folie 19 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Partitionierung Jedes Ereignis E teilt den gesamten Stichprobenraum Ω immer in zwei Untermengen Ein Teil der Elementarereignisse gehört zum Ereignis E, der andere Teil gehört nicht dazu Diese Aufteilung nennt man Partitionierung des Stichprobenraums „Alle geraden Augenzahlen“ E = {2, 4, 6} Folie 20 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Partitionierung Jedes Ereignis E teilt den gesamten Stichprobenraum Ω immer in zwei Untermengen Ein Teil der Elementarereignisse gehört zum Ereignis E, der andere Teil gehört nicht dazu Diese Aufteilung nennt man Partitionierung des Stichprobenraums „Eins oder Sechs“ E = {1, 6} Folie 21 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Partitionierung Jedes Ereignis E teilt den gesamten Stichprobenraum Ω immer in zwei Untermengen Ein Teil der Elementarereignisse gehört zum Ereignis E, der andere Teil gehört nicht dazu Diese Aufteilung nennt man Partitionierung des Stichprobenraums „Drei“ E = {3} Folie 22 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Partitionierung Jedes Ereignis E teilt den gesamten Stichprobenraum Ω immer in zwei Untermengen Ein Teil der Elementarereignisse gehört zum Ereignis E, der andere Teil gehört nicht dazu Diese Aufteilung nennt man Partitionierung des Stichprobenraums „Irgend eine Zahl“ E = {1, 2, 3, 4, 5, 6} Folie 23 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Partitionierung Jedes Ereignis E teilt den gesamten Stichprobenraum Ω immer in zwei Untermengen Ein Teil der Elementarereignisse gehört zum Ereignis E, der andere Teil gehört nicht dazu Diese Aufteilung nennt man Partitionierung des Stichprobenraums „Keine Zahl“ E = {∅} Folie 24 Statistik & Methodenlehre Variablen Zufallsexperimente Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre Die Menge aller Kombinationen von Ereignissen aus dem Stichprobenraum heißt Sigma-Algebra σ Zusätzlich enthält σ noch das unmögliche Ereignis ∅ Stichprobenraum σ umfasst also alle möglichen Kombinationen aus den Elementarereignissen plus ∅ Achtung: Dabei spielt die Reihenfolge der Elementarereignisse keine Rolle. Zufallsvariablen Folie 25 Beispiel: Einmaliger Münzwurf Elementarereignisse: K, Z, S Stichprobenraum: Ω = {K, Z, S} Sigma-Algebra: σ = {{∅}, {K}, {Z}, {S}, {K,Z}, {K,S}, {Z,S}, {K,Z,S}} Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Zufallsvariablen Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre σ = {{∅} ,{ K } ,{Z } ,{S } ,{K , Z } ,{K , S } ,{Z , S } ,{K , Z , S }} Die Anzahl der Elemente in der σ-Algebra nennt man Mächtigkeit Wenn der Stichprobenraum Ω insgesamt k Elementarereignisse enthält, so gilt für die Mächtigkeit der σ-Algebra σ =2 k Schreibweise für Mächtigkeit Folie 26 Statistik & Methodenlehre Variablen Zufallsexperimente Stichprobenraum Variablen Zufallsvariablen Ereignisse & Elementarereignisse Verbindung zur Mengenlehre Ω σ = {{∅} ,{ K } ,{Z } ,{S } ,{K , Z } ,{K , S } ,{Z , S } ,{K , Z , S }} Die σ–Algebra erfüllt das Kriterium der Abgeschlossenheit für das betrachtete Zufallsexperiment. Es erfüllt folgende Axiome (E sei 1 von k Ereignissen aus σ ): 1. Ω∈ σ und ∅ ∈ σ Sicheres/unmögliches Ereignis in σ 2. Wenn E ∈ σ, dann auch „Ω ohne E“ ∈ σ Zufallsvariablen 3. E1 ∪ E2 ∪ … ∪ Ek ∈ σ und E1 ∩ E2 ∩ … ∩ Ek ∈ σ Komplementereignis in σ Vereinigungs-/Schnittmenge in σ Also: Alle denkbaren Ausgänge des Zufallsexperimentes und Kombinationen daraus sind in σ enthalten. Frage: Was ist hier die Zufallsvariable? Folie 27 Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Zufallsvariablen Definition Zufallsexperimente Eine Zufallsvariable ist eine 1:1 Abbildung („bijektiv“) der Elemente des Stichprobenraums Ω auf eine Menge von Zahlen. Stichprobenraum Es gelten alle Regeln, die bereits für Variablen eingeführt wurden. Zufallsvariablen Beispiel: Ω Ω =={{KK,,ZZ,,SS}} Folie 28 0, wenn wenn "K" "K" ⎧⎧xx11:: -1, ⎪⎪ XX ((Ω Ω)) == ⎨⎨xx22:: 1, wenn "Z" ⎪⎪ x : 0, ⎩⎩ 3 2, wenn "S" Statistik & Methodenlehre Variablen Variablen Zufallsvariablen Zufallsvariablen Prinzip Zufallsexperimente Stichprobenraum Zufallsvariablen Beispiel: Experiment = Eimaliger Münzwurf Definition eines Zufallsexperimentes: Ξ Mögliche Ergebnisse eines Trials: Kopf, Zahl, Seite Definition des Stichprobenraums Ω und damit auch von σ Definition einer Zufallsvariablen X(Ω) und damit auch von X(σ) Durchführung eines Trials und Feststellung des Ergebnisses: Zahl Messung: X = 1 Frage: Was bedeutet „zufällig“? Folie 29 Statistik & Methodenlehre Geschichte Laplace Kolmogoroff Geschichte der WT Definition Anfänge Mitte des 17. Jh. (Huygens, Pascal, Fermat, Bernoulli). Aufgaben des Glücksspiels. Nur Arithmetik und Kombinatorik. Vererbung Weiterentwicklungen im 18.-19. Jh. durch Laplace, Gauss, Poisson: Fehlertheorie, Ballistik, Populationsstatistik. Beispiele Durchbruch zu Beginn des 20. Jh: Entwicklung der WTheorie, Fundament im axiomatischen Aufbau (Kolmogoroff). Theorie der stochastischen Prozesse (Wiener, Markoff, Chintchin). Heute zentraler Bestandteil wiss. Betätigung: Informationstheorie, Physik, Bevölkerungsstatistik, Epidemiologie, Materialprüfung, Statik, Personalauswahl, psychologische Testung, Versuchsplanung und Stichprobentheorie. Folie 30 Statistik & Methodenlehre Geschichte Definition Vererbung Beispiele Laplace Kolmogoroff Die Wahrscheinlichkeitsdefinition von Laplace Wahrscheinlichkeiten im Stichprobenraum Grundannahme: Alle Elementarereignisse ω im Stichprobenraum Ω sind gleichmöglich Wenn der Stichprobenraum die k Elementarereignisse ω1 bis ωk enthält, so ist die Wahrscheinlichkeit für jedes von diesen einfach 1 p (ω ) = k p(ω) ist demnach eine auf dem Stichprobenraum definierte mathematische Funktion (i.e. eine Konstante), die so genannte Wahrscheinlichkeitsfunktion. Folie 31 Statistik & Methodenlehre Geschichte Definition Vererbung Beispiele Laplace Kolmogoroff Die Wahrscheinlichkeitsdefinition von Laplace Wahrscheinlichkeiten in der σ-Algebra Jedem Ereignis E, welches der σ-Algebra angehört, kann nun ebenfalls eine Wahrscheinlichkeit zugewiesen werden. m = Mächtigkeit der Menge an gleichmöglichen Elementarereignissen aus Ω, die Teilereignis von E sind. m p( E ) = k „Günstige durch Mögliche“ k = Mächtigkeit des Stichprobenraumes (also Anzahl aller Elementarereignisse aus Ω) p(E) ist wieder eine Wahrscheinlichkeitsfunktion, diesmal definiert auf der σ-Algebra. Folie 32 Statistik & Methodenlehre Geschichte Definition Vererbung Laplace Kolmogoroff Die Wahrscheinlichkeitsdefinition von Laplace Wahrscheinlichkeiten in der σ-Algebra Laplaces Definition der Wahrscheinlichkeitsfunktion p(E) beruht auf dem Prinzip der Partitionierung Das Ereignis E partitioniert den Stichprobenraum in Beispiele ● m Elementarereignisse, die Teil von E sind. ● k–m Elementarereignisse, die nicht Teil von E sind Die Wahrscheinlichkeit p(E) ist also einfach die Summe der Wahrscheinlichkeiten seiner m Elementarereignisse 1 1 1 m p( E ) = + + … + = k k k k Folie 33 m-mal Statistik & Methodenlehre Geschichte Definition Vererbung Beispiele Laplace Die Wahrscheinlichkeitsdefinition von Laplace Vererbung Frage: Der Stichprobenraum Ω ist noch keine Zufallsvariable – wie erhält man deren Wahrscheinlichkeiten? Definition: Die Zufallsvariable „erbt“ die Wahrscheinlichkeitsfunktion des Stichprobenraums, auf dem sie beruht. Stichprobenraum: Zufallsvariable: Folie 34 Kolmogoroff Ω = { Bube, Dame, König , As} { p (Ω) = 1 , 4 1 , 4 1 , 4 1 } 4 X = { x1 : 0, x2 : 1, x3 : 2, x3 : 4} { p( X ) = 1 , 4 1 , 4 1 , 4 1 } 4 Statistik & Methodenlehre Geschichte Definition Vererbung Laplace Kolmogoroff Die Wahrscheinlichkeitsdefinition von Laplace Vererbung Vollständige Schreibweise für Zufallsvariable und Wahrscheinlichkeitsfunktion: ⎧ x1 : 0, wenn Bube ⎪ x : 1, wenn Dame ⎪ X =⎨ 2 ⎪ x3 : 2, wenn König ⎪⎩ x3 : 4, wenn As Beispiele ⎧p(X ⎪ ⎪p(X ⎪ p( X ) = ⎨ ⎪p(X ⎪ ⎪p(X ⎩ Folie 35 = x1 ) : 1 4 = x2 ) : 1 4 = x3 ) : 1 4 = x4 ) : 1 4 Statistik & Methodenlehre Geschichte Definition Vererbung Laplace Kolmogoroff Die Wahrscheinlichkeitsdefinition von Laplace Beispiele Summe von 2 Würfelwürfen Beispiele Anzahl von „Zahl“ bei 3 Münzwürfen Frage des Landsknechts an Huygens Folie 36