Wahrscheinlichkeitsrechnung

Werbung
Wahrscheinlichkeitsrechnung
Kapitel 15: Die Normalverteilung
Abraham Demoivre: um 1711 entdeckt er bei einem fairen Münzwurf p=0.5. Er widmete sich
dem gezinkten Münzwurf. Nicht symmetrisch, steigt steil an und wird schnell flach.
Wenn man die Zahl der Trials n nach oben schraubt, erscheint die Asymmetrie, aber wenn man
auf die ersten Ergebnisse einzoomt, dann ist dort eine Symmetrie vorhanden. Eine
Glockenform wird deutlich, deren mathematische Funktion aber erst Laplace entdeckte.
Karl Friedrich Gauss: er fand dieselbe Formel, aber er erntet den Ruhm für die Entdeckung der
Normalverteilung. = Gauss’sche Normalverteilung.
Binomial, Poisson, Hypergeometrisch sind praktisch unbekannt. Die Normalverteilung ist aber
sehr bekannt.
Klassisches Beispiel: Brustumfänge gemessen an schottischen Soldaten zeigen
Normalverteilung, und in vielen anderen Fällen, wie Delinquenz oder Krankheiten, zeigt sich
ähnliches Resultat.
Die Normalverteilung kann NICHT aus dem Bedingungskomplex abgeleitet werden. Folgt nicht
zwingend aus Xi. Man kann nur Gründe vermuten, warum die Normalverteilung zutrifft.
µ und sigma sind die Basisparameter, die Anpassung an verschiedene Situationen erlauben.
µ ist verantwortlich für Verschiebungen auf der X-Achse = Erwartungswert
sigma : je höher, desto flacher und breiter wird die Normalverteilung = Streuung,
Standardabweichung
Diese Abweichungen sind aber nur Ausprägungen der Achsenskalen. Die Kurve wird aber
NIEMALS die 0 erreichen, unendlich bis links und rechts. Die Verteilungsfunktion der
Normalverteilung wird mit dem griechischen Buchstaben Phi dargestellt.
68/95/99 Regel: Wo liegen die Realisationen?
1* Standardabweichung ist nicht immer ausreichend: 1,96*Standardabweichung deckt 95%
aller Relisationen ab.
Wichtige Quantile der Normalverteilung:
1% (-2,33*sigma): die Werte sind verschieden, aber vorhersehbar: hängen ab von µ und sigma.
5% (-1,64*sigma)
10% (-1,28*sigma)
50% (0*sigma)
90% (1,28*sigma), etc.
Inverse Verteilungsfunktion: Quantilzahl per Unterschreitungswahrscheinlichkeit.
Zurück zur Frage: Ist es Zufall, dass so viele Merkmale der Normalverteilung folgen?
Der Zentrale Grenzwertsatz (Laplace): bei einer grossen Zahl stochastisch unabhängiger
Zufallsvariablen, ist die Summe der Realisationen normalverteilt.
Bsp: Würfelwurf. Zwei Würfel zusammen: Summe der Würfelergebnisse ist nicht gleich
warscheinlich. Kleine und grosse Summen sind weniger wahrscheinlich. Bei zehn Würfeln
sieht es eher aus wie eine Normalverteilung. Die Werte des Experiments ist zwar nicht GANZ
genau, aber es nähert sich an.
Gegen-Bsp: Würfelwurf: 12-seitiger gezinkter Würfel, mit extremen Werten (1,12)
wahrscheinlicher.
Plausible Erklärung von Brustumfang, IQ, Schulleistung: Die verschiedenen Gene kann man als
Bernoulli-Experiment auffassen: und das muss normalverteilt sein.
Sir Francis Galton (1899): „Kosmische Ordnung … als Gottheit angebetet … Gelassenheit in
wildester Konfusion.“
Normalverteilung

Viele gleichartige Zufallsprozesse wirken zusammen

Verteilung der Summe und des Mittelwerts aller Realisierungen sehr häufiger
Wiederholung eines Zufallsexperiments

! oft auch die Verteilung unsystematischer Messfehler ! Grosse Schwankungen sind
seltener als kleine.

Einfach darzustellen.
Standardnormalverteilung = Spezialfall:
µ=0, sigma=1
Taucht in vielen statistischen Verfahren auf: Statistiker versuchen normalerweise ihre
Verfahren zu vereinfachen, damit man die einfachere Formel nehmen kann.
Aber auch: man kann dann schnell per Augenmass die wichtigsten Quantile abschätzen.
Es ist umständlich, spezifische Fragen zu beantworten, dann man muss immer erst umrechnen.
Wenn man die Basiswerte für die Hauptquantile im Kopf hat, kann man die Werte einfach
einschätzen.
z-Standardisierung (=z-Transformation):
Eigentlich ist es ein Dreisatz: A= 210, B=25, beide werden auf verschiedenen Skalen gemessen.
Vergleichbar? Ohne weitere Info geht es nicht. A: µ=200, sigma=5 und B: µ=0, sigma=10.
Man muss die Glocken angleichen und dann per Augenmass die Lage der Werte betrachten.
205=1*sigma, 210=?*sigma >>> x = µ(x)+z*sigma(x) >>> z = (x-µ(x)) / sigma(x)
In diesem Fall ist also der Gymnasiast (oben) Teil der oberen 5% (mehr als 1,96), die
Waldorfschülerin (unten) Teil der oberen 1% (mehr als 2,33). Nach z-Skalierung sind die Werte
direkt vergleichbar: 2,0 <> 2,5.
Im Prinzip wird einfach umgerechnet, und dann die x-Achse durch eine Einheitsachse ersetzt.
Skalentransformation:
Herunterladen