Population und Stichprobe Wahrscheinlichkeitstheorie II 5. Sitzung 18 S. Peter Schmidt 2003 1 Stichprobenziehung als Zufallsexperiment • Definition Stichprobe: – Teilmenge der Elemente der Grundgesamtheit bzw. Population • Zufallsvariable beim Stichprobenziehen: – Verteilung der aus der Population gezogenen Elemente • Kennwerte der Stichprobe i.a. bekannt Kennwerte der Population i.a. unbekannt • Daher: Schluß von der Stichprobe auf die Population 5. Sitzung 18 S. Peter Schmidt 2003 2 1 Stichprobenziehung und Urnenmodell • Ziel: Verallgemeinerung von Stichprobenergebnissen • Urnenmodell: „Prototyp“ des Zufallsexperiments Stichprobenziehung • Ziehung von n Kugeln aus einer Urne, die N Kugeln enthält • Zwei Varianten der Ziehung möglich: – Einfache Zufallsauswahl ohne Zurücklegen – Einfache Zufallsauswahl mit Zurücklegen 5. Sitzung 18 S. Peter Schmidt 2003 3 Urnenmodell und Wahrscheinlichkeit • Annahme: Realisationswahrscheinlichkeiten sind gleichverteilt • Folgerung:Die Wahrscheinlichkeit der Realisation der jeweiligen Ziehung errechnet sich über: 5. Sitzung 18 S. Peter Schmidt 2003 4 2 Permutation • Berechnung der Anzahl der Sortierungsmöglichkeiten der Elemente einer N Elementigen Menge N ! wird auch N - Fakultät genannt 5. Sitzung 18 S. Peter Schmidt 2003 5 Anzahl Stichproben: ohne Zurücklegen (ohne Sortierung) • Wobei N = Anzahl der Kugeln in der Urne n = Größe der Stichprobe 5. Sitzung 18 S. Peter Schmidt 2003 6 3 ! " " # $% & " ' ( )+*+,%" ) - . /+( 0 " - ( ' ( )1*+2" 3 - )( & 4. 5 6 " 97 8: 7;: 7 98: 7;: 8 9 7: 7;: 9 8 7: 7;: : 879 7 ; 9%7 ; 9.7 ; 9<7 ; 97 ; 9=7 ; 9>7 ; 9%7 ; 9.7 ; 9<7 ; 9%7 ; 9.7 ; 9 8 9 : 7 9 : 7 8 : 7 8 9 79 8 9: 8: 89 9: 7: 7 7 8 7 7 : : 8 9 9 8 7 7 7 8 8 8 9 9 9 : : : : : 8 9 7 9 7 8 : 7 8 9 5. Sitzung 18 S. Peter Schmidt 2003 7 Abbildung aus Kühnel/Krebs, 2001: 138 Anzahl Stichproben:ohne Zurücklegen (mit Sortierung) • Wobei N = Anzahl der Kugeln in der Urne n = Größe der Stichprobe 5. Sitzung 18 S. Peter Schmidt 2003 8 4 Anzahl Stichproben: mit Zurücklegen (ohne Sortierung) • Wobei N = Anzahl der Kugeln in der Urne n = Größe der Stichprobe 5. Sitzung 18 S. Peter Schmidt 2003 9 Anzahl Stichproben: mit Zurücklegen (mit Sortierung) • Wobei N = Anzahl der Kugeln in der Urne n = Größe der Stichprobe 5. Sitzung 18 S. Peter Schmidt 2003 10 5 % ! " " # $% & " ' ( )+*+,%" ) - . /+( 0 " - ( ' ( )1*%" 3 - )3 -4. 5 6 " ) 7 8 9 7 7;9 ) 7 8 9 7;9 7;9 7;9 7 8 9 ) 7 8 7)8 7)8 9 9 9 7 7 7 7 8 9 7;9 8 7;9 9 7)8 9 7)8 9 7;9 7;9 7 8 7)8 7)8 9 9 8 8 7 8 7;9 9 7)8 9 8 9 7;9 7;9 7;9 7 8 9 7)8 7)8 7)8 9 9 9 9 9 9 7 8 9 5. Sitzung 18 S. Peter Schmidt 2003 11 Abbildung aus Kühnel/Krebs, 2001: 145 Zufallsvariable und Wahrscheinlichkeitsverteilung • Definition Zufallsvariable: – Eine Variable deren Ausprägungen für Ereignisse eines Zufallsexperiment stehen • Verteilungen von Zufallsvariablen – Beziehen sich nicht auf empirische Häufigkeiten, sondern auf Wahrscheinlichkeiten und sind daher Wahrscheinlichkeitsverteilungen. (Wahrscheinlichkeiten können jedoch auch als Grenzwerte von Häufigkeiten betrachtet werden) 5. Sitzung 18 S. Peter Schmidt 2003 12 6 Verteilungsfunktionen von Zufallsvariablen • Wahrscheinlichkeitsverteilungen können mit ähnlichen Methoden wie Häufigkeitsverteilungen betrachtet werden • Es besteht die Möglichkeit Quantile ( und damit den Median) für die Verteilungsfunktion der Zufallsvariable anzugeben. • Dies geschieht analog zum Vorgehen bei Häufigkeitsverteilungen 5. Sitzung 18 S. Peter Schmidt 2003 13 Erwartungswert und Varianz von Zufallsvariablen • Weitere Kennwerte von Wahrscheinlichkeitsverteilungen sind Erwartungswert und Varianz • Der Erwartungswert einer Zufallsvariablen entspricht im Prinzip dem arithmetischen Mittel einer Häufigkeitsverteilung • Die Varianz einer Zufallsvariablen ist ebenso zu interpretieren wie die Varianz von Häufigkeitsverteilungen 5. Sitzung 18 S. Peter Schmidt 2003 14 7 Erwartungswert • Beschreibt die mittlere Realisation einer Zufallsvariablen Wobei: µx = Erwartungswert der Zufallsvariable X P(X=xk ) = Wahrscheinlichkeit für die Ausprägung xk der Zufallsvariablen X 5. Sitzung 18 S. Peter Schmidt 2003 15 Varianz einer Zufallsvariablen • Symbol: • Beschreibt den Erwartungswert der quadrierten Abweichungen der Realisationen vom Erwartungswert der Variablen • Populationsstandardabweichung: 5. Sitzung 18 S. Peter Schmidt 2003 16 8 Kennwerteverteilungen • Mit Hilfe der Konzeption der Stichprobenziehung als Zufallsexperiment kann die Kluft zwischen (1) empirischen Kennwerten und (2) Populationskennwerten überwunden werden: – Man nimmt an, daß es eine (3) Verteilung von Stichprobenkennwerten gibt, deren Mittelwert der Erwartungswert der Zufallsvariablen „Stichprobenziehung“ ist 5. Sitzung 18 S. Peter Schmidt 2003 17 9