Wahrscheinlichkeitsrechnung Kapitel 15: Die Normalverteilung Abraham Demoivre: um 1711 entdeckt er bei einem fairen Münzwurf p=0.5. Er widmete sich dem gezinkten Münzwurf. Nicht symmetrisch, steigt steil an und wird schnell flach. Wenn man die Zahl der Trials n nach oben schraubt, erscheint die Asymmetrie, aber wenn man auf die ersten Ergebnisse einzoomt, dann ist dort eine Symmetrie vorhanden. Eine Glockenform wird deutlich, deren mathematische Funktion aber erst Laplace entdeckte. Karl Friedrich Gauss: er fand dieselbe Formel, aber er erntet den Ruhm für die Entdeckung der Normalverteilung. = Gauss’sche Normalverteilung. Binomial, Poisson, Hypergeometrisch sind praktisch unbekannt. Die Normalverteilung ist aber sehr bekannt. Klassisches Beispiel: Brustumfänge gemessen an schottischen Soldaten zeigen Normalverteilung, und in vielen anderen Fällen, wie Delinquenz oder Krankheiten, zeigt sich ähnliches Resultat. Die Normalverteilung kann NICHT aus dem Bedingungskomplex abgeleitet werden. Folgt nicht zwingend aus Xi. Man kann nur Gründe vermuten, warum die Normalverteilung zutrifft. µ und sigma sind die Basisparameter, die Anpassung an verschiedene Situationen erlauben. µ ist verantwortlich für Verschiebungen auf der X-Achse = Erwartungswert sigma : je höher, desto flacher und breiter wird die Normalverteilung = Streuung, Standardabweichung Diese Abweichungen sind aber nur Ausprägungen der Achsenskalen. Die Kurve wird aber NIEMALS die 0 erreichen, unendlich bis links und rechts. Die Verteilungsfunktion der Normalverteilung wird mit dem griechischen Buchstaben Phi dargestellt. 68/95/99 Regel: Wo liegen die Realisationen? 1* Standardabweichung ist nicht immer ausreichend: 1,96*Standardabweichung deckt 95% aller Relisationen ab. Wichtige Quantile der Normalverteilung: 1% (-2,33*sigma): die Werte sind verschieden, aber vorhersehbar: hängen ab von µ und sigma. 5% (-1,64*sigma) 10% (-1,28*sigma) 50% (0*sigma) 90% (1,28*sigma), etc. Inverse Verteilungsfunktion: Quantilzahl per Unterschreitungswahrscheinlichkeit. Zurück zur Frage: Ist es Zufall, dass so viele Merkmale der Normalverteilung folgen? Der Zentrale Grenzwertsatz (Laplace): bei einer grossen Zahl stochastisch unabhängiger Zufallsvariablen, ist die Summe der Realisationen normalverteilt. Bsp: Würfelwurf. Zwei Würfel zusammen: Summe der Würfelergebnisse ist nicht gleich warscheinlich. Kleine und grosse Summen sind weniger wahrscheinlich. Bei zehn Würfeln sieht es eher aus wie eine Normalverteilung. Die Werte des Experiments ist zwar nicht GANZ genau, aber es nähert sich an. Gegen-Bsp: Würfelwurf: 12-seitiger gezinkter Würfel, mit extremen Werten (1,12) wahrscheinlicher. Plausible Erklärung von Brustumfang, IQ, Schulleistung: Die verschiedenen Gene kann man als Bernoulli-Experiment auffassen: und das muss normalverteilt sein. Sir Francis Galton (1899): „Kosmische Ordnung … als Gottheit angebetet … Gelassenheit in wildester Konfusion.“ Normalverteilung Viele gleichartige Zufallsprozesse wirken zusammen Verteilung der Summe und des Mittelwerts aller Realisierungen sehr häufiger Wiederholung eines Zufallsexperiments ! oft auch die Verteilung unsystematischer Messfehler ! Grosse Schwankungen sind seltener als kleine. Einfach darzustellen. Standardnormalverteilung = Spezialfall: µ=0, sigma=1 Taucht in vielen statistischen Verfahren auf: Statistiker versuchen normalerweise ihre Verfahren zu vereinfachen, damit man die einfachere Formel nehmen kann. Aber auch: man kann dann schnell per Augenmass die wichtigsten Quantile abschätzen. Es ist umständlich, spezifische Fragen zu beantworten, dann man muss immer erst umrechnen. Wenn man die Basiswerte für die Hauptquantile im Kopf hat, kann man die Werte einfach einschätzen. z-Standardisierung (=z-Transformation): Eigentlich ist es ein Dreisatz: A= 210, B=25, beide werden auf verschiedenen Skalen gemessen. Vergleichbar? Ohne weitere Info geht es nicht. A: µ=200, sigma=5 und B: µ=0, sigma=10. Man muss die Glocken angleichen und dann per Augenmass die Lage der Werte betrachten. 205=1*sigma, 210=?*sigma >>> x = µ(x)+z*sigma(x) >>> z = (x-µ(x)) / sigma(x) In diesem Fall ist also der Gymnasiast (oben) Teil der oberen 5% (mehr als 1,96), die Waldorfschülerin (unten) Teil der oberen 1% (mehr als 2,33). Nach z-Skalierung sind die Werte direkt vergleichbar: 2,0 <> 2,5. Im Prinzip wird einfach umgerechnet, und dann die x-Achse durch eine Einheitsachse ersetzt. Skalentransformation: