Übersicht über die Vorlesung Statistik Statistik R. Frühwirth R. Frühwirth Teil 1: Deskriptive Statistik Statistik Teil 2: Wahrscheinlichkeitsrechnung R. Frühwirth [email protected] Teil 3: Zufallsvariable und Verteilungen VO 142.090 http://tinyurl.com/TU142090 Teil 4: Schätzen von Parametern Februar 2010 R. Frühwirth Statistik 1/297 R. Frühwirth Statistik 2/297 Übersicht über die Vorlesung Statistik Statistik R. Frühwirth R. Frühwirth Teil 5: Testen von Hypothesen Einleitung Grundbegriffe Merkmal- und Skalentypen Aussagen und Häufigkeiten Teil 6: Regression und lineare Modelle Teil 1 Eindimensionale Merkmale Graphische Darstellung Empirische Verteilungsfunktion Kernschätzer Maßzahlen Beispiele Teil 7: Einführung in die Bayes-Statistik Deskriptive Statistik Zweidimensionale Merkmale Qualitative Merkmale Quantitative Merkmale Korrelation Teil 8: Simulation von Experimenten R. Frühwirth Statistik 3/297 R. Frühwirth Statistik 4/297 Übersicht Teil 3 Statistik Statistik R. Frühwirth R. Frühwirth Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Teil 3 Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Zufallsvariable und Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Statistik R. Frühwirth Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 9 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Eindimensionale Zufallsvariable Momente 11 Momente 12 Rechnen mit Verteilungen Statistik 150/297 8 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente 12 Rechnen mit Verteilungen Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Mehrdimensionale Zufallsvariable Wichtige Verteilungen 10 Wichtige Verteilungen 11 Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Wichtige Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 10 Unterabschnitt: Grundbegriffe Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable R. Frühwirth R. Frühwirth 8 9 149/297 Abschnitt 8: Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen R. Frühwirth 8 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 12 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 151/297 R. Frühwirth Statistik 152/297 Grundbegriffe Grundbegriffe Statistik R. Frühwirth Eindimensionale Zufallsvariable Statistik Definition (Zufallsvariable) Grundbegriffe Randverteilungen und bedingte Verteilungen Eindimensionale Zufallsvariable Eine Abbildung X: Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable R. Frühwirth Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable ω ∈ Ω 7→ x = X(ω) ∈ R Mehrdimensionale Zufallsvariable die jedem Element ω des Ereignisraums Ω eine reelle Zahl zuordnet, heißt eine (eindimensionale) Zufallsvariable. Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Ist Ω endlich oder abzählbar unendlich, ist jede beliebige Abbildung X zugelassen. Ist Ω überabzählbar unendlich, muss X eine messbare Abbildung sein. Momente Erwartung Varianz Schiefe Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Erwartung Varianz Schiefe Statistik Grundbegriffe Randverteilungen und bedingte Verteilungen 9 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Mehrdimensionale Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Wichtige Verteilungen 10 Wichtige Verteilungen 11 Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 12 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Die Abbildung, die dem Zerfall eines Teilchens die Lebensdauer x zuordnet, ist eine kontinuierliche Zufallsvariable. Statistik 154/297 Diskrete Zufallsvariable R. Frühwirth Mehrdimensionale Zufallsvariable Beispiel R. Frühwirth 153/297 Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Die Abbildung, die beim Würfeln dem Elementarereignis ei die Augenzahl i zuordnet, ist eine diskrete Zufallsvariable. Natürlich wäre auch die Abbildung ei :−→ 7 − i eine diskrete Zufallsvariable. Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth 8 Beispiel Rechnen mit Verteilungen Unterabschnitt: Diskrete Zufallsvariable Eindimensionale Zufallsvariable Nimmt die Zufallsvariable X ein Kontinuum von Werte an, heißt sie kontinuierlich. Momente Da der Wert einer Zufallsvariablen vom Ausgang des Experiments abhängt, kann man den möglichen Werten Wahrscheinlichkeiten zuschreiben. Rechnen mit Verteilungen Nimmt die Zufallsvariable X nur endlich oder abzählbar unendlich viele Werte an, heißt sie diskret. 155/297 Diskrete Zufallsvariable sind oft das Resultat von Zählvorgängen. In der physikalischen Praxis kommen diskrete Zufallsvariable häufig vor: man denke an das Zählen von Ereignissen in einem festen Zeitintervall (Poissonverteilung), an das Abzählen von Alternativversuchen (Binomialverteilung), oder auch an die Besetzungshäufigkeit der diskreten Energieniveaus des Wasserstoffatoms. Im folgenden nehmen wir an, dass die Werte einer diskreten Zufallsvariablen nichtnegative ganze Zahlen sind. Dies ist keine Einschränkung, weil jede abzählbare Menge von reellen Zahlen bijektiv auf (eine Teilmenge von) N0 abgebildet werden kann. Die Ereignisalgebra ist die Potenzmenge (Menge aller Teilmengen) P von N0 . R. Frühwirth Statistik 156/297 Diskrete Zufallsvariable Diskrete Zufallsvariable Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Ist auf der Ereignisalgebra Σ(Ω) ein Wahrscheinlichkeitsmaß W definiert, so kann man mit Hilfe der Zufallsvariablen X auf der Potenzmenge P von N0 ebenfalls ein Wahrscheinlichkeitsmaß definieren. Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Definition (Verteilung einer diskreten Zufallsvariablen) Es sei Σ(Ω) eine diskrete Ereignisalgebra. Die diskrete Zufallsvariable X : Ω 7→ N0 induziert ein Wahrscheinlichkeitsmaß auf N0 mittels WX ({k}) = W (X −1 (k)) = W ({ω|X(ω) = k}) Momente Erwartung Varianz Schiefe R. Frühwirth Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 157/297 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Statistik 158/297 Statistik Beispiel R. Frühwirth Wir ordnen dem Ausgang eines Doppelwurfs die Summe der Augenzahlen zu: Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable X : (i, j) 7→ i + j Mehrdimensionale Zufallsvariable Wichtige Verteilungen 1 2 1 −1 WX (1) = W (X (1)) = W ({1, 3, 5}) = 2 WX (0) = W (X −1 (0)) = W ({2, 4, 6}) = Diskrete Zufallsvariable Statistik Grundbegriffe Randverteilungen und bedingte Verteilungen Die Verteilung von X ist dann gegeben durch R. Frühwirth Diskrete Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable X : ω 7→ mod (ω, 2) Erwartung Varianz Schiefe Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Wir ordnen den geraden Augenzahlen des Würfels die Zahl 0 zu, den ungeraden die Zahl 1: Momente WX wird als die Verteilung von X bezeichnet, und zwar als diskrete oder Spektralverteilung. Rechnen mit Verteilungen R. Frühwirth Beispiel Mehrdimensionale Zufallsvariable Die Werte von X sind die natürlichen Zahlen von 2 bis 12. Die Verteilung von X ist dann gegeben durch k−1 , k≤7 X −1 36 WX (k) = W (X (k)) = W ({(i, j)}) = i+j=k 13 − k , k ≥ 7 36 Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 159/297 Die Funktion fX (k) wird als Wahrscheinlichkeitsdichtefunktion oder kurz Dichte der Zufallsvariablen X bezeichnet. Momente Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Definition (Diskrete Dichtefunktion) Wichtige Verteilungen Rechnen mit Verteilungen R. Frühwirth Die Zahlen WX (k) können als Funktionswerte einer Spektralfunktion fX angesehen werden: ( WX (k), wenn x = k fX (x) = 0, sonst R. Frühwirth Statistik 160/297 Diskrete Zufallsvariable Diskrete Zufallsvariable Statistik Statistik Die Dichte der Zufallsvariablen X = i + j: R. Frühwirth Eindimensionale Zufallsvariable R. Frühwirth Eindimensionale Zufallsvariable Dichtefunktion 0.18 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.16 Mehrdimensionale Zufallsvariable 0.12 Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen 0.1 Wichtige Verteilungen f(x) Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0.08 0.06 Momente Erwartung Varianz Schiefe 0.04 0.02 Rechnen mit Verteilungen 0 2 3 4 R. Frühwirth 5 6 7 x 8 9 10 11 12 Statistik Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe FX (x) = X fX (k) = k≤x R. Frühwirth X WX ({k}) k≤x Statistik 162/297 Diskrete Zufallsvariable Statistik Eigenschaften einer diskreten Verteilungsfunktion F 1 R. Frühwirth F hat eine Sprungstelle in allen Punkten des Wertebereichs 2 Die Sprunghöhe im Punkt k ist gleich fX (k) 3 0 ≤ F (x) ≤ 1 ∀x ∈ R Die Verteilungsfunktion der Zufallsvariablen X = i + j: Eindimensionale Zufallsvariable Verteilungsfunktion 1 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.9 0.8 Mehrdimensionale Zufallsvariable 4 x ≤ y =⇒ F (x) ≤ F (y) ∀x, y ∈ R 5 limx→−∞ F (x) = 0; limx→∞ F (x) = 1 6 Die Wahrscheinlichkeit, dass r in das Intervall (a, b] fällt, ist F (b) − F (a): Grundbegriffe Randverteilungen und bedingte Verteilungen W (r ≤ a) + W (a < r ≤ b) = W (r ≤ b) =⇒ 0.6 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe W (a < r ≤ b) = F (b) − F (a) 0.7 F(x) Grundbegriffe Randverteilungen und bedingte Verteilungen Es gilt offenbar: 161/297 Statistik Mehrdimensionale Zufallsvariable FX (x) = W (X ≤ x) Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Diskrete Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Ist X eine diskrete Zufallsvariable, so ist die Verteilungsfunktion FX von X definiert durch: Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Definition (Diskrete Verteilungsfunktion) Momente Erwartung Varianz Schiefe R. Frühwirth k∈E Mehrdimensionale Zufallsvariable 0.14 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Die Wahrscheinlichkeit WX (E) eines Ereignisses E lässt sich bequem mit Hilfe der Dichte von X berechnen: X WX (E) = fX (k) 0.5 0.4 0.3 0.2 0.1 Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 163/297 0 2 3 4 R. Frühwirth 5 6 Statistik 7 x 8 9 10 11 12 164/297 Unterabschnitt: Stetige Zufallsvariable Stetige Zufallsvariable Statistik Statistik R. Frühwirth R. Frühwirth Eindimensionale Zufallsvariable 8 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 9 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Eindimensionale Zufallsvariable Momente Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Mehrdimensionale Zufallsvariable Wichtige Verteilungen 11 Momente 12 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 165/297 R. Frühwirth Stetige Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Momente Erwartung Varianz Schiefe 166/297 Statistik Definition (Stetige Verteilungsfunktion) R. Frühwirth Es sei (Σ, W ) ein Wahrscheinlichkeitsraum über einem überabzählbaren Ereignisraum Ω. X sei eine Zufallsvariable, also eine (messbare) Funktion von Ω in R. Die Funktion FX , definiert durch: Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen FX (x) = W (X ≤ x) Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Stetige Zufallsvariable Statistik R. Frühwirth Eine Funktion X, die auf einer solchen überabzählbaren Menge von Elementarereignissen definiert ist, kann beliebige reelle Werte annehmen. Wichtige Verteilungen 10 Erwartung Varianz Schiefe Rechnen mit Verteilungen Diese Beschränkung soll nun fallengelassen werden, d.h es werden jetzt überabzählbar viele Elementarereignisse zugelassen. Das ist notwendig, wenn nicht nur Zählvorgänge, sondern beliebige Messvorgänge zugelassen werden. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Bisher wurden nur solche Zufallsvariable behandelt, die auf diskreten Ereignisalgebren definiert waren. Wichtige Verteilungen heißt die Verteilungsfunktion von X. Die Wahrscheinlichkeit, dass X in ein Intervall (x, x + ∆x] fällt, ist dann: Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente W (x < X ≤ x + ∆x) = FX (x + ∆x) − FX (x) = ∆FX . Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 167/297 Eigenschaften einer stetigen Verteilungsfunktion 1 0 ≤ F (x) ≤ 1 ∀x ∈ R 2 x1 ≤ x2 =⇒ F (x1 ) ≤ F (x2 ) ∀x1 , x2 ∈ R 3 limx→−∞ F (x) = 0; limx→∞ F (x) = 1 Definition (Quantil) Es sei FX (x) eine stetige Verteilungsfunktion. Der Wert xα , für den FX (xα ) = α, 0 < α < 1 gilt, heißt das α-Quantil der Verteilung von X. Die Funktion −1 x = FX (α), 0<α<1 heißt die Quantilsfunktion der Verteilung von X. R. Frühwirth Statistik 168/297 Stetige Zufallsvariable Stetige Zufallsvariable Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik Definition (Quartil) R. Frühwirth Die Quantile zu den Werten α = 0.25, 0.5, 0.75 heißen Quartile. Das Quantil zum Wert α = 0.5 heißt Median der Verteilung. Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Quantile können auch für diskrete Verteilungen definiert werden, jedoch sind sie dann nicht immer eindeutig. Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 169/297 Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik 170/297 Stetige Zufallsvariable Statistik Mehrdimensionale Zufallsvariable 0 wobei fX (x) = FX (x) ist. Die Ableitung der Verteilungsfunktion, die Funktion fX , wird als Wahrscheinlichkeitsdichtefunktion oder wieder kurz Dichte von X bezeichnet. R. Frühwirth Stetige Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable x1 Erwartung Varianz Schiefe Rechnen mit Verteilungen Eindimensionale Zufallsvariable Ist FX differenzierbar, heißt X eine stetige Zufallsvariable. Für die Verteilung von X gilt nach dem Hauptsatz der Integralrechnung: Z x2 WX (x1 < X ≤ x2 ) = FX (x2 ) − FX (x1 ) = fX (x) dx Momente Erwartung Varianz Schiefe R. Frühwirth Definition (Stetige Dichtefunktion) Statistik Das Wahrscheinlichkeitsmaß WX heißt die Verteilung von X. Es ist auf einer Ereignisalgebra Σ definiert, die aus Mengen reeller Zahlen besteht und zumindest alle Intervalle und deren Vereinigungen als Elemente enthält. Ähnlich wie bei diskreten Zufallsvariablen lässt sich die Wahrscheinlichkeit WX einer Menge M ∈ Σ leicht mit Hilfe der Dichte angeben: Z WX (M ) = fX (x) dx M Die Wahrscheinlichkeit eines einzelnen Punktes ist immer gleich 0: Z x WX ({x}) = fX (x) dx = 0 Statistik Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Daher ist auch WX ((x1 , x2 ]) = WX ((x1 , x2 )) = WX ([x1 , x2 ]). Ganz allgemein erhält man eine Aussage über stetige Zufallsvariable dadurch, dass man in einer Aussage über diskrete Zufallsvariable die Summation durch eine Integration ersetzt. Gilt zum Beispiel für eine diskrete Dichte f : X f (k) = 1 k∈N0 Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze x R. Frühwirth R. Frühwirth 171/297 so gilt für eine stetige Dichte f : Z ∞ f (x) dx = 1 −∞ R. Frühwirth Statistik 172/297 Stetige Zufallsvariable Abschnitt 9: Mehrdimensionale Zufallsvariable Statistik Statistik R. Frühwirth R. Frühwirth Dichtefunktion Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable f(x) Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe 1 0.18 0.9 0.16 0.8 0.14 0.7 0.12 0.6 0.1 0.06 0.3 0.04 0.2 0.02 0.1 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 10 x 15 R. Frühwirth 20 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0 0 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Erwartung Varianz Schiefe 5 Statistik 10 x 15 20 Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 11 Momente 12 Rechnen mit Verteilungen R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik 174/297 Definition (Zufallsvariable) Eine Abbildung X: ω ∈ Ω 7→ x = X(ω) ∈ Rd die jedem Element ω des Ereignisraums Ω einen reellen Vektor x ∈ Rd zuordnet, heißt eine d-dimensionale Zufallsvariable. Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Momente Grundbegriffe Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen 11 173/297 Eindimensionale Zufallsvariable 10 Wichtige Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Mehrdimensionale Zufallsvariable 10 Rechnen mit Verteilungen R. Frühwirth 9 Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Momente Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 9 Grundbegriffe Randverteilungen und bedingte Verteilungen R. Frühwirth 8 Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Unterabschnitt: Grundbegriffe Eindimensionale Zufallsvariable 8 Wichtige Verteilungen 0.4 5 Eindimensionale Zufallsvariable 0.5 0.08 0 0 Rechnen mit Verteilungen Verteilungsfunktion 0.2 F(x) Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariablen können diskret oder stetig sein. Momente 12 Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 175/297 R. Frühwirth Statistik 176/297 Grundbegriffe Grundbegriffe Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik Definition (Verteilungsfunktion) R. Frühwirth Ist X = (X1 , . . . , Xd ) eine d-dimensionale Zufallsvariable, so ist die Verteilungsfunktion FX durch FX (x1 , . . . , xd ) = W (X1 ≤ x1 ∩ . . . ∩ Xd ≤ xd ) Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen definiert. Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Erwartung Varianz Schiefe Definition (Dichtefunktion) Ist X = (X1 , . . . , Xd ) eine d-dimensionale diskrete Zufallsvariable, so ist die Dichtefunktion fX durch Statistik Statistik Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable 0.03 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.025 1 2 w(x ,x ) 0.02 Statistik 178/297 Beispiel (Fortsetzung) Die Verteilungsfunktion F ist daher: F (x1 , x2 ) = W (X1 ≤ x1 ∩ X2 ≤ x2 ) = 0.015 Grundbegriffe Randverteilungen und bedingte Verteilungen 0.01 Wichtige Verteilungen 0.005 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0 1 Momente 2 3 4 5 4 5 Rechnen mit Verteilungen Rechnen mit Verteilungen 3 6 2 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 1 x2 R. Frühwirth Erwartung Varianz Schiefe 6 x1 Statistik 179/297 X f (i, j) i≤x1 ∩j≤x2 Mehrdimensionale Zufallsvariable Wichtige Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze x1 ∈ {1, . . . , 6} ∩ x2 ∈ {1, . . . , 6} sonst Grundbegriffe R. Frühwirth Erwartung Varianz Schiefe 0, R. Frühwirth 177/297 Statistik Momente 1 , 36 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze definiert. R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen fX (x1 , x2 ) = Rechnen mit Verteilungen Grundbegriffe Grundbegriffe Randverteilungen und bedingte Verteilungen Die Dichte fX lautet: ( Erwartung Varianz Schiefe fX (x1 , . . . , xd ) = W (X1 = x1 ∩ . . . ∩ Xd = xd ) R. Frühwirth Mehrdimensionale Zufallsvariable 1 WX {(i, j)} = 36 Momente Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Die zweidimensionale Zufallsvariable X = (X1 , X2 ) ordnet dem Ergebnis des Wurfs mit zwei Würfeln die Augenzahlen (i, j) zu. Sind alle Ausgänge gleichwahrscheinlich, so ist WX gegeben durch: Mehrdimensionale Zufallsvariable Wichtige Verteilungen Momente Beispiel Beispielsweise ist F (3, 4) = 1 i≤3∩j≤4 36 P = 12 36 = 13 . Wegen der Abzählbarkeit der Elementarereignisse können diese auch durch eine eindimensionale Zufallsvariable Y eindeutig in R abgebildet werden, z. B.: Y : (ei , ej ) −→ 6i + j − 6 Der Wertevorrat von Y sind die natürlichen Zahlen zwischen 1 und 36, und WY ist gegeben durch: 1 WY {k} = , 1 ≤ k ≤ 36 36 R. Frühwirth Statistik 180/297 Unterabschnitt: Randverteilungen und bedingte Verteilungen Grundbegriffe Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Statistik Definition (Dichtefunktion) Ist X = (X1 , . . . , Xd ) eine d-dimensionale stetige Zufallsvariable, so ist die Dichtefunktion fX durch ∂ d FX fX (x1 , . . . , xd ) = ∂x1 . . . ∂xd Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable definiert. Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 181/297 11 Momente 12 Rechnen mit Verteilungen Statistik 182/297 Randverteilungen und bedingte Verteilungen Statistik Wichtige Verteilungen Wichtige Verteilungen R. Frühwirth Randverteilungen und bedingte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen 10 Momente Rechnen mit Verteilungen Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Erwartung Varianz Schiefe Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 9 Grundbegriffe Randverteilungen und bedingte Verteilungen Momente Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen R. Frühwirth 8 Statistik Sind X1 und X2 zwei (diskrete oder stetige) 1-dimensionale Zufallsvariable, so ist X = (X1 , X2 ) eine zweidimensionale Zufallsvariable. Die Verteilung (Verteilungsfunktion, Dichte) von X heißt auch die gemeinsame Verteilung (Verteilungsfunktion, Dichte) von X1 und X2 . Es stellt sich nun das folgende Problem: Kann man die Verteilung von X1 bzw. X2 aus der gemeinsamen Verteilung berechnen? Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Es sei F die Verteilungsfunktion und f die Dichte der stetigen Zufallsvariablen X = (X1 , X2 ). Dann ist die Verteilungsfunktion F1 von X1 gegeben durch: F1 (x1 ) = W (X1 ≤ x1 ) = W (X1 ≤ x1 ∩ −∞ < X2 < ∞) = Z x1 Z ∞ = f (x1 , x2 ) dx2 dx1 −∞ −∞ Daraus folgt: Z Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 183/297 f (x1 , x2 ) dx2 −∞ Momente Erwartung Varianz Schiefe ∞ f1 (x1 ) = ist die Dichte von X1 . R. Frühwirth Statistik 184/297 Randverteilungen und bedingte Verteilungen Randverteilungen und bedingte Verteilungen Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Statistik Definition (Randverteilung) R. Frühwirth Es sei X = (X1 , X2 ) eine zweidimensionale stetige Zufallsvariable mit der Verteilungsfunktion F und der Dichte f . Die Verteilung von X1 heißt die Randverteilung von X1 bezüglich X. Ihre Dichte f1 lautet: Z ∞ f1 (x1 ) = f (x1 , x2 ) dx2 . −∞ Statistik Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 185/297 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Momente Erwartung Varianz Schiefe W (X1 = k1 ∩ X2 = k2 ) f (k1 , k2 ) = W (X2 = k2 ) f2 (k2 ) Statistik 186/297 Statistik Definition (Bedingte Dichte) R. Frühwirth Es sei X = (X1 , X2 ) eine 2-dimensionale diskrete Zufallsvariable mit der Dichte f (k1 , k2 ) und den Randverteilungsdichten f1 (k1 ) bzw. f2 (k2 ). Die Funktion f (k1 |k2 ), definiert durch: Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen heißt die durch X2 bedingte Dichte von X1 . Die bedingte Dichte ist für festes k2 die Dichte eine Verteilung, der durch X2 = k2 bedingten Verteilung von X1 . Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 187/297 Ist X = (X1 , X2 ) stetig, so ist analog f (x1 |x2 ) definiert durch: Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable f (k1 , k2 ) f (k1 |k2 ) = f2 (k2 ) Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen W (X1 = k1 |X2 = k2 ) = Randverteilungen und bedingte Verteilungen Statistik Eindimensionale Zufallsvariable Es seien X1 und X2 zwei diskrete Zufallsvariable mit der gemeinsamen Dichte f (k1 , k2 ) und den Randverteilungsdichten f1 (k1 ) und f2 (k2 ). Dann ist die bedingte Wahrscheinlichkeit des Ereignisses X1 = k1 unter der Bedingung X2 = k2 gegeben durch: R. Frühwirth Randverteilungen und bedingte Verteilungen R. Frühwirth Der umgekehrte Vorgang ist im allgemeinen nicht möglich, da die gemeinsame Verteilung auch Information über mögliche Zusammenhänge (Kopplung) zwischen X1 und X2 enthält. Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze k2 R. Frühwirth Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Ist X = (X1 , X2 ) diskret mit der Dichte f , so ist analog die Dichte f1 der Randverteilung von X1 bezüglich X gegeben durch: X f1 (k1 ) = f (k1 , k2 ) Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Die Verteilungen von X1 und X2 lassen sich also aus der gemeinsamen Verteilung von X1 und X2 berechnen. f (x1 |x2 ) = f (x1 , x2 ) (f2 (x2 ) 6= 0) f2 (x2 ) f (x1 |x2 ) ist für festes x2 die Dichte einer Verteilung, der durch X2 = x2 bedingten Verteilung von X1 . Dass f (x1 |x2 ) tatsächlich eine Dichte ist, läßt sich leicht nachprüfen: Z ∞ Z ∞ f (x1 , x2 ) f2 (x2 ) f (x1 |x2 ) dx1 = dx1 = =1 f2 (x2 ) −∞ −∞ f2 (x2 ) und analog für diskretes X. R. Frühwirth Statistik 188/297 Randverteilungen und bedingte Verteilungen Randverteilungen und bedingte Verteilungen Statistik R. Frühwirth Statistik Es gilt: R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable −∞ Grundbegriffe Randverteilungen und bedingte Verteilungen und analog für diskrete Dichten. Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Definition (Unabhängigkeit von Zufallsvariablen) Ist die (unbedingte) Dichte der Randverteilung von X1 gleich der durch X2 bedingten Dichte, so heißen X1 und X2 unabhängig. X1 und X2 unabhängig ⇐⇒ f (x1 |x2 ) = f1 (x1 ) Statistik Momente Erwartung Varianz Schiefe Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik 190/297 Randverteilungen und bedingte Verteilungen Statistik Die Dichte der Randverteilung von Xi1 , . . . , Xim ist gegeben durch: R. Frühwirth Eindimensionale Zufallsvariable fi1 ,...,im (xi1 , . . . , xim ) Z ∞ Z ∞ = ... f (x1 , . . . , xn ) dxim+1 . . . dxin −∞ Mehrdimensionale Zufallsvariable −∞ Grundbegriffe Randverteilungen und bedingte Verteilungen Die durch Xj bedingte Dichte von Xi ist gegeben durch: Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen f (xi |xj ) = Momente fi,j (xi , xj ) fj (xj ) Momente wobei fi,j (xi , xj ) die Randverteilungsdichte von Xi , Xj ist. Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Xi1 , . . . , Xik heißen unabhängig, wenn die Dichte der Randverteilung von Xi1 , . . . , Xik das Produkt der Dichten der Randverteilungen der einzelnen Xij ist. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Erwartung Varianz Schiefe Ist X = (X1 , . . . , Xd ), d > 2, so müssen die Definitionen der Randverteilung, der bedingten Dichten und der Unabhängigkeit entsprechend verallgemeinert werden. R. Frühwirth 189/297 Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable und analog für diskretes X. Für unabhängige Zufallsvariable X1 ,X2 ist also die Dichte der gemeinsamen Verteilung gleich dem Produkt der einzelnen Dichten. Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable ⇐⇒ f (x1 , x2 ) = f1 (x1 ) · f2 (x2 ) Rechnen mit Verteilungen Randverteilungen und bedingte Verteilungen R. Frühwirth f (x1 |x2 ) = f1 (x1 ) ⇐⇒ f (x2 |x1 ) = f2 (x1 ) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable f (x1 , x2 ) = f (x1 |x2 ) · f2 (x2 ) Z ∞ f1 (x1 ) = f (x1 |x2 ) · f2 (x2 ) dx2 R. Frühwirth Für unabhängige Zufallsvariablen X1 und X2 gilt: 191/297 R. Frühwirth Statistik 192/297 Randverteilungen und bedingte Verteilungen Randverteilungen und bedingte Verteilungen Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik Beispiel (Die Akzeptanz oder Nachweiswahrscheinlichkeit) R. Frühwirth X sei eine Zufallsvariable mit der Dichte f (x). Nimmt X den Wert x an, so gibt es eine Wahrscheinlichkeit a(x) dafür, dass x auch tatsächlich beobachtet wird. Man definiert nun eine Zufallsvariable I, die 1 ist, wenn x beobachtet wird, und 0 sonst. Dann ist I unter der Bedingung X = x alternativ nach Aa(x) verteilt: W (I = 1|X = x) = a(x) Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Die gemeinsame Dichte von X und I ist daher: Momente f (x, 1) = a(x)f (x) Erwartung Varianz Schiefe f (x, 0) = [1 − a(x)]f (x) Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik R. Frühwirth Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Statistik 194/297 Abschnitt 10: Wichtige Verteilungen Statistik Mehrdimensionale Zufallsvariable f (x, 1) a(x)f (x) = R f2 (1) a(x)f (x) dx Als konkretes Beispiel diene die Messung einer Lebensdauer. Die Messung möge bei tmin beginnen und bei tmax enden. Dann hat a(t) die folgende Gestalt: 0, für t ≤ tmin a(t) = 1, für tmin < t ≤ tmax 0, für t > tmax 193/297 Randverteilungen und bedingte Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable fA (x) = f (x|I = 1) = Wichtige Verteilungen W (I = 0|X = x) = 1 − a(x) Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Da der Experimentator nur mit beobachteten Größen arbeiten kann, schränkt er seine Grundgesamtheit auf die nachgewiesenen Ereignisse ein, d.h. er braucht die Dichte von X unter der Bedingung, dass X beobachtet wird: Grundbegriffe Randverteilungen und bedingte Verteilungen Rechnen mit Verteilungen R. Frühwirth Beispiel (Fortsetzung) Statistik Beispiel (Fortsetzung) R. Frühwirth Eindimensionale Zufallsvariable Für die gemessene Wahrscheinlichkeitsdichte gilt: 0, t ≤ tmin 1 exp(−t/τ ) τ fA (t) = , tmin ≤ t < tmax exp(−t min /τ ) − exp(−tmax /τ ) 0, t > t max Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 8 Eindimensionale Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 11 Momente 12 Rechnen mit Verteilungen Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Der Faktor 1/[exp(−tmin /τ ) − exp(−tmax /τ )] korrigiert für jene Teilchen, die vor tmin oder nach tmax zerfallen. Die Nachweiswahrscheinlichkeit a(t) kann auch von der Geometrie des Detektors oder deren Ansprechwahrscheinlichkeit bestimmt werden und eine komplizierte Abhängigkeit von t haben. So kann es etwa von der Konfiguration der Zerfallsprodukte abhängen, ob ein Zerfall bei t beobachtet werden kann oder nicht. Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 195/297 R. Frühwirth Statistik 196/297 Unterabschnitt: Diskrete Verteilungen Diskrete Verteilungen Statistik Statistik R. Frühwirth R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 8 9 Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente 11 Erwartung Varianz Schiefe Rechnen mit Verteilungen 12 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Rechnen mit Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik 197/297 Momente 1 n, 0, x ∈ {1, . . . , n} sonst Die Verteilungsfunktion FX ist eine Stufenfunktion mit Sprüngen der Größe n1 in den Punkten 1, . . . , n. R. Frühwirth Statistik 198/297 Diskrete Verteilungen Statistik Die Alternativ- oder Bernoulliverteilung Al(p) R. Frühwirth Eindimensionale Zufallsvariable Die Verteilung einer Zufallsvariablen, die den Ausgängen eines Alternativversuchs die Werte 1 (Erfolg) bzw. 0 (Misserfolg) zuordnet. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Die Dichte fX lautet: Grundbegriffe Randverteilungen und bedingte Verteilungen fX (0) = 1 − p, fX (1) = p Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen fX = Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Mehrdimensionale Zufallsvariable ( Rechnen mit Verteilungen Diskrete Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Die Dichte fX lautet: Erwartung Varianz Schiefe R. Frühwirth Eindimensionale Zufallsvariable Die Verteilung einer Zufallsvariablen X, die die Werte 1, . . . , n mit gleicher Wahrscheinlichkeit annimmt.. Wichtige Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Die diskrete Gleichverteilung auf n Punkten, Gl(n) Die Binomialverteilung Bi(n, p) Wird der Alternativversuch n mal unabhängig durchgeführt, so gibt es 2n Elementarereignisse, nämlich die Folgen der Form e = (ei1 , . . . , ein ), ij = 0 oder 1. Die diskrete Zufallsvariable X bildet die Folge e auf die Häufigkeit von e1 ab: Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen oder fX (x) = px (1 − p)1−x , x ∈ {0, 1} Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 199/297 X(e) = n X ij j=1 Der Wertebereich von X ist die Menge {0, 1, . . . , n}. Auf die Zahl k (0 ≤ k ≤ n) werden alle Folgen abgebildet, bei denen e1 genau k-mal eintritt. Es gibt Ckn solche Folgen, und jede hat die Wahrscheinlichkeit pk (1 − p)n−k . R. Frühwirth Statistik 200/297 Diskrete Verteilungen Diskrete Verteilungen Statistik Statistik Die Dichte fX ist daher: ! n k fX (k) = p (1 − p)n−k , 0 ≤ k ≤ n k R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Die Verteilung von X wird als Binomialverteilung Bi(n, p) mit den Parametern n und p bezeichnet. Grundbegriffe Randverteilungen und bedingte Verteilungen Es gilt Wichtige Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen n X Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen ! fX (k) = k=0 Momente Erwartung Varianz Schiefe Mehrdimensionale Zufallsvariable n X n k p (1 − p)n−k = 1 k k=0 Momente Erwartung Varianz Schiefe Das ist gerade der binomische Lehrsatz. Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 201/297 Statistik Statistik R. Frühwirth 0.4 0.4 Bi(10,0.3) P(k) P(k) 0.2 0 Eindimensionale Zufallsvariable 0.3 0.1 Grundbegriffe Randverteilungen und bedingte Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.2 0.1 0 1 2 3 4 5 k 6 7 8 9 0 10 Mehrdimensionale Zufallsvariable 0 1 2 3 4 5 k 6 7 8 9 Grundbegriffe Randverteilungen und bedingte Verteilungen 10 Wichtige Verteilungen Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 0.4 Bi(10,0.7) 0.3 0.3 0.2 0.1 0 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Bi(10,0.9) P(k) Momente Wichtige Verteilungen 0.4 P(k) Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0.2 Momente Erwartung Varianz Schiefe 0.1 0 1 wenn (n + 1)p ∈ {1, . . . , n} wenn p = 1 Die Verteilungsfunktion kann durch die unvollständige regularisierte Betafunktion β(x; a, b) ausgedrückt werden: FX (k; n, p) = W (X ≤ k) = β(1 − p; n − k, k + 1) Z 1−p n−k−1 t (1 − t)k = dt B(n − k, k + 1) 0 Statistik 202/297 Die negative Binomialverteilung Bi(10,0.5) 0.3 Mehrdimensionale Zufallsvariable wenn p = 0 oder (n + 1)p ∈ /N Diskrete Verteilungen R. Frühwirth Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable b(n + 1)pc, (n + 1)p und m= (n + 1)p − 1, 1, R. Frühwirth Diskrete Verteilungen Eindimensionale Zufallsvariable Der Modus m (der wahrscheinlichste Wert) ist gleich 2 3 4 5 k 6 7 R. Frühwirth 8 9 10 Statistik 0 0 1 2 3 4 5 k 6 7 8 9 Rechnen mit Verteilungen 10 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 203/297 Ein Alternativversuch wird solange wiederholt, bis r Erfolge eingetreten sind. Die Verteilung der dazu benötigten Anzahl X von Misserfolgen wird als negative Binomialverteilung Nb(r, p) bezeichnet. Ihre Dichte lautet: ! r+k−1 r fX (k) = p (1 − p)k , k ≥ 0 k Der Modus m (der wahrscheinlichste Wert) ist gleich ( b(r − 1) 1−p p c, wenn r > 1 m= 0, wenn r = 0 Ist m ∈ N, so ist auch m − 1 ein Modus. R. Frühwirth Statistik 204/297 Diskrete Verteilungen Diskrete Verteilungen Statistik Statistik 0.2 R. Frühwirth 0.1 Eindimensionale Zufallsvariable P(k) 0.15 P(k) Nb(2,0.6) 0.1 Eindimensionale Zufallsvariable 0.06 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.04 0.05 Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 0 0 1 2 3 4 5 k 6 7 8 0 9 10 11 12 0 5 10 15 Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 0.08 0.06 0.06 P(k) 0.08 0.04 Momente 0.04 0.02 0 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Nb(8,0.3) Erwartung Varianz Schiefe 0.02 0 10 20 0 30 0 10 k 20 30 Rechnen mit Verteilungen 40 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze k Statistik 205/297 Mehrdimensionale Zufallsvariable Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Der Alternativversuch kann dahingehend verallgemeinert werden, dass man nicht nur zwei, sondern d Elementarereignisse e1 , . . . , ed zulässt, denen die Wahrscheinlichkeiten p1 , . . . , pd zugeordnet werden, die nur d X Wichtige Verteilungen Momente 0 1 2 k 3 4 5 0 6 0 1 2 3 4 5 k 6 7 8 9 10 11 12 0.2 0.2 Nb(6,0.6) Nb(8,0.6) 0.15 0.15 0.1 0.05 0 0.1 0.05 0 5 10 0 15 0 5 k 10 15 20 k Statistik 206/297 Statistik Die Multinomialverteilung Mu(n, p1 , . . . , pd ) Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0 Diskrete Verteilungen Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.05 R. Frühwirth Diskrete Verteilungen Eindimensionale Zufallsvariable 0.1 0.1 P(k) 0.1 Nb(6,0.3) R. Frühwirth R. Frühwirth 0.15 Wichtige Verteilungen 0.1 P(k) Momente 0.3 0.2 Grundbegriffe Randverteilungen und bedingte Verteilungen 20 k Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0.2 Mehrdimensionale Zufallsvariable 0.02 Nb(4,0.6) 0.25 0.4 P(k) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.3 0.5 Nb(4,0.3) 0.08 P(k) Nb(2,0.3) P(k) R. Frühwirth pi = 1 Mehrdimensionale Zufallsvariable Wichtige Verteilungen erfüllen müssen. Führt man den verallgemeinerten Alternativversuch n-mal durch, so sind die Elementarereignisse die Folgen der Form: Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 207/297 W (ei1 , . . . , ein ) = n Y W (eij ) = j=1 n Y j=1 pij = d Y pni i i=1 wobei ni die Anzahl des Eintretens von ei ist. Die Summe der ni ist daher n. Die d-dimensionale Zufallsvariable X = (X1 , . . . , Xd ) bildet die Folge (ei1 , . . . , ein ) auf den Vektor (n1 , . . . , nd ) ab. Dabei werden n!/(n1 !· · ·nd !) Folgen auf den gleichen Vektor abgebildet. Momente Erwartung Varianz Schiefe Die Dichte von X lautet daher: Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze (ei1 , . . . , ein ), 1 ≤ ij ≤ d Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen i=1 R. Frühwirth Eindimensionale Zufallsvariable Sind die n Teilversuche unabhängig, gilt: fX (n1 , . . . , nd ) = R. Frühwirth d d d Y X X n! pni i , ni = n, pi = 1 n1 ! . . . nd ! i=1 i=1 i=1 Statistik 208/297 Diskrete Verteilungen Diskrete Verteilungen Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Die Verteilung von X wird als Multinomialverteilung mit den Parametern n und p1 , . . . , pd bezeichnet: WX = Mu(n, p1 , . . . , pd ) Das klassische Beispiel einer multinomialverteilten Zufallsvariablen ist das Histogramm (gruppierte Häufigkeitsverteilung), das zur graphischen Darstellung der (absoluten) experimentellen Häufigkeit verwendet wird. Xi ist die Anzahl der Fälle, in denen die Zufallsvariable R, das experimentelle Ergebnis, in Gruppe i fällt. Die Wahrscheinlichkeit, dass R in Gruppe i fällt, sei gleich pi . Werden in das Histogramm n Ergebnisse eingefüllt, so sind die Gruppeninhalte (X1 , . . . , Xd ) multinomial nach Mu(n, p1 , . . . , pd ) verteilt. R. Frühwirth Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 15 10 5 0 0 1 2 3 R. Frühwirth 4 5 x 6 7 8 9 Statistik 10 210/297 Diskrete Verteilungen Statistik Die Poissonverteilung Po(λ) R. Frühwirth Die Poissonverteilung entsteht aus der Binomialverteilung durch den Grenzübergang n → ∞ unter der Bedingung n · p = λ. Das klassische Beispiel einer Poissonverteilten Zufallsvariablen ist die Anzahl der Zerfälle pro Zeiteinheit in einer radioaktiven Quelle. Allgemein gilt: Ist die Wartezeit zwischen zwei Ereignissen eines Zufallsprozesses exponentialverteilt, so ist die Anzahl der Ereignisse pro Zeiteinheit Poissonverteilt. Erwartung Varianz Schiefe Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth 20 Mehrdimensionale Zufallsvariable 209/297 Statistik Eindimensionale Zufallsvariable 25 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Diskrete Verteilungen R. Frühwirth Ein Histogramm ni Statistik R. Frühwirth Statistik 211/297 Die Dichte der Poissonverteilung folgt aus der Berechnung des Grenzwertes: Pλ (k) = lim Bn; λ (k) n→∞ = lim n→∞ = n n! k!(n − k)! k n−k λ λ 1− = n n λk −λ ·e k! Der Modus m (der wahrscheinlichste Wert) ist gleich wenn λ ∈ /N bλc, m = λ und λ − 1, wenn λ ∈ N 0, wenn λ = 0 R. Frühwirth Statistik 212/297 Diskrete Verteilungen Diskrete Verteilungen Statistik Statistik 0.4 Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 Mehrdimensionale Zufallsvariable 0 1 2 3 4 k 5 6 7 8 9 10 k Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Po(5) 0.15 w(k) 0.15 0.1 0.05 0 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Po(10) 0.1 Momente Erwartung Varianz Schiefe 0.05 0 5 10 15 k R. Frühwirth 0 0 5 10 15 20 25 Statistik Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze k 213/297 R. Frühwirth Diskrete Verteilungen Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Statistik 214/297 Diskrete Verteilungen Statistik Der Modus m (der wahrscheinlichste Wert) ist gleich (n + 1)(M + 1) m= N +2 0.5 R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente 0.5 Hy(20,12,10) P(k) Rechnen mit Verteilungen 0.2 Bi(10,0.6) 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 1 2 3 4 5 k 6 7 8 9 0 10 0.4 0 1 2 3 4 5 k 6 7 8 9 10 2 3 4 5 k 6 7 8 9 10 0.4 Hy(100,40,10) Bi(10,0.4) 0.3 P(k) Erwartung Varianz Schiefe Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen 0.2 w(k) Momente Grundgesamtheit von N Objekten, davon haben M eine bestimmte Eigenschaft E. Es werden n Objekte gezogen, wobei jedes Objekt die gleiche Wahrscheinlickeit hat, gezogen zu werden. Einmal gezogene Objekte werden nicht zurückgelegt. Die Anzahl der gezogenen Objekte mit der Eigenschaft E ist eine Zufallsvariable X. Die Verteilung von X wird hypergeometrische Verteilung Hy(N, M, n) genannt. Ihre Dichte lautet: M N −M m n−m f (m) = , 0 ≤ m ≤ min(n, M ) N n Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Die hypergeometrische Verteilung Hy(N, M, n) Eindimensionale Zufallsvariable 0.2 0.1 0 Po(2) 0.3 w(k) 0.3 w(k) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Po(1) P(k) Eindimensionale Zufallsvariable R. Frühwirth 0.4 0.3 P(k) R. Frühwirth 0.2 0.2 Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 215/297 0.1 0 0.1 0 1 2 3 4 5 k 6 7 8 9 10 0 0 1 Zwei Hypergeometrische Verteilungen und die entsprechenden Binomialverteilungen R. Frühwirth Statistik 216/297 Stetige Verteilungen Statistik Statistik R. Frühwirth R. Frühwirth Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 9 Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente 11 Erwartung Varianz Schiefe Rechnen mit Verteilungen 12 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Dichtefunktion der Gleichverteilung Un(0,1) Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Statistik 1.2 1 1 0.8 0.8 0.6 0.4 0 −0.5 217/297 0.2 0 0.5 x R. Frühwirth Stetige Verteilungen 0.6 0.4 0.2 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Verteilungsfunktion der Gleichverteilung Un(0,1) 1.2 Momente Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 1 0 −0.5 1.5 0 0.5 x Statistik 1 1.5 218/297 Stetige Verteilungen Statistik R. Frühwirth Die stetige Gleichverteilung auf dem Intervall [a, b] hat die Dichte: 0, x < a 1 f (x|a, b) = I[a,b] = 1/(b − a), a ≤ x ≤ b b−a 0, b < x Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Die stetige Gleichverteilung Un(a, b) f(x) Eindimensionale Zufallsvariable 8 F(x) Unterabschnitt: Stetige Verteilungen Statistik Die Gauß- oder Normalverteilung No(µ, σ 2 ) R. Frühwirth Dichtefunktion der Standardnormalverteilung Verteilungsfunktion der Standardnormalverteilung 0.5 Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Die Normalverteilung ist eine der wichtigsten Verteilungen in Wissenschaft und Technik. Ihre Dichte lautet: Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze f (x|µ, σ 2 ) = √ (x−µ)2 1 e− 2σ2 2πσ Grundbegriffe Randverteilungen und bedingte Verteilungen 0.35 0.25 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Die Verteilungsfunktion Φ(x) ist nicht durch elementare Funktionen darstellbar. 0.6 0.4 0.15 0.1 0.2 0.05 Momente Erwartung Varianz Schiefe Der Modus m (das Maximum der Dichtefunktion) ist bei m = µ. Statistik 0.8 0.3 0.2 Im Fall von µ = 0, σ = 1 heißt sie Standardnormalverteilung. R. Frühwirth 1 0.4 Mehrdimensionale Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0.45 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable F(x) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Eindimensionale Zufallsvariable f(x) Eindimensionale Zufallsvariable 0 −5 0 x 5 0 −5 0 x 5 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 219/297 R. Frühwirth Statistik 220/297 Stetige Verteilungen Stetige Verteilungen Statistik Die Exponentialverteilung Ex(τ ) Die Exponentialverteilung ist die Wartezeitverteilung des radioaktiven Zerfalls von Atomen und allgemein des Zerfalls von Elementarteilchen. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Ihre Dichte lautet: Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Mehrdimensionale Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Erwartung Varianz Schiefe Statistik 221/297 R. Frühwirth Wir beobachten einen Prozess, bei dem gewisse Ereignisse zu zufälligen Zeitpunkten eintreten. Ist die Anzahl der Ereignisse pro Zeiteinheit unabhängig und Poisson-verteilt gemäß Po(λ), sprechen wir von einem Poissonprozess mit Intensität λ. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Eigenschaften eines Poissonprozesses Die Anzahl der Ereignisse in einem Zeitintervall der Länge T ist Poisson-verteilt gemäß Po(λT ). 2 Die Wartezeit zwischen zwei aufeinanderfolgenden Ereignissen ist exponentialverteilt gemäß Ex(1/λ). 3 Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Sind die Wartezeiten eines Prozesses unabhängig und exponentialverteilt gemäß Ex(τ ), so ist der Prozess ein Poissonprozess mit Intensität λ = 1/τ . R. Frühwirth Eindimensionale Zufallsvariable Wichtige Verteilungen 1 Erwartung Varianz Schiefe Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 0.6 0.2 0.4 0.1 0.2 0 0 2 4 6 8 10 x 0 0 2 4 6 8 10 x Statistik 222/297 Statistik Der Poissonprozess Eindimensionale Zufallsvariable Rechnen mit Verteilungen 0.3 Stetige Verteilungen Statistik Momente 0.8 R. Frühwirth Stetige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0.4 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Wichtige Verteilungen 1 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth 0.5 Momente Der Modus m ist bei m = 0. Rechnen mit Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Ihre Verteilungsfunktion lautet: F (x|τ ) = 1 − e−x/τ · I[0,∞) (x) Verteilungsfunktion der Exponentialverteilung Ex(2) Eindimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 1 f (x|τ ) = e−x/τ · I[0,∞) (x) τ Dichtefunktion der Exponentialverteilung Ex(2) f(x) Eindimensionale Zufallsvariable R. Frühwirth F(x) Statistik R. Frühwirth Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 223/297 Die Gammaverteilung Ga(a, b) Die Exponentialverteilung ist ein Spezialfall einer allgemeineren Familie von Verteilungen, der Gammaverteilung. Die Dichte der Gammaverteilung lautet: f (x|a, b) = xa−1 e−x/b · I[0,∞) (x) ba Γ(a) Ihre Verteilungsfunktion ist die regularisierte unvollständige Gammafunktion: Z x a−1 −t/b t e γ(a, x/b) F (x|a, b) = dt = a b Γ(a) Γ(a) 0 Der Modus m ist bei m = (a − 1)b, wenn a ≥ 1. R. Frühwirth Statistik 224/297 Stetige Verteilungen Stetige Verteilungen Statistik Statistik R. Frühwirth R. Frühwirth 0 0 0.5 1 f(x) 0 0 1.5 1 2 x Wichtige Verteilungen f(x) Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 3 x Dichtefunktion der Gammaverteilung Ga(a,b) 1 a=2 b=0.5 a=2 b=1 0.8 a=2 b=2 0.6 0.2 0.2 0.1 Eindimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 2 4 0 0 6 5 10 x 15 x R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze B(a, b) = Γ(a)Γ(b) Γ(a + b) R. Frühwirth Statistik R. Frühwirth Dichtefunktion der Betaverteilung Beta(a,b) Dichtefunktion der Betaverteilung Beta(a,b) 5 5 a=0.5 b=0.5 a=0.5 b=1 a=0.5 b=2 a=0.5 b=3 Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen 3 2 1 1 0.2 0.4 0.6 0.8 0.2 0.4 0.6 0.8 1 x Dichtefunktion der Betaverteilung Beta(a,b) 5 a=2 b=0.5 a=2 b=1 a=2 b=2 a=2 b=3 3 a=3 b=0.5 a=3 b=1 a=3 b=2 a=3 b=3 4 3 2 2 1 1 Grundbegriffe Randverteilungen und bedingte Verteilungen 0.4 0.6 0.8 1 x R. Frühwirth 0 0 0.2 0.4 0.6 0.8 1 x Statistik 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 11 Momente 12 Rechnen mit Verteilungen Erwartung Varianz Schiefe Rechnen mit Verteilungen 0.2 Eindimensionale Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Rechnen mit Verteilungen 0 0 8 Wichtige Verteilungen 5 f(x) f(x) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable x 4 226/297 Mehrdimensionale Zufallsvariable 0 0 1 Eindimensionale Zufallsvariable Dichtefunktion der Betaverteilung Beta(a,b) Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 3 2 0 0 a=1 b=0.5 a=1 b=1 a=1 b=2 a=1 b=3 4 f(x) f(x) 4 Statistik Unterabschnitt: Die Normalverteilung und verwandte Verteilungen Statistik Eindimensionale Zufallsvariable Der Modus m ist bei m = (a − 1)/(a + b − 2), wenn a, b > 1. 225/297 R. Frühwirth Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze xa−1 (1 − x)b−1 · I[0,1] (x), B(a, b) Ihre Verteilungsfunktion ist die regularisierte unvollständige Betafunktion: Z x 1 F (x|a, b) = ta−1 (1 − t)b−1 dt B(a, b) 0 Momente Stetige Verteilungen Erwartung Varianz Schiefe f (x|a, b) = Rechnen mit Verteilungen 0 0 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Momente Die Dichte der Betaverteilung lautet: Erwartung Varianz Schiefe Rechnen mit Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Die Gleichverteilung ist ein Spezialfall einer allgemeineren Familie von Verteilungen, der Betaverteilung. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Dichtefunktion der Gammaverteilung Ga(a,b) 0.5 a=5 b=0.5 a=5 b=1 0.4 a=5 b=2 0.3 0.4 Die Betaverteilung Beta(a, b) Mehrdimensionale Zufallsvariable 0.5 1 Grundbegriffe Randverteilungen und bedingte Verteilungen Erwartung Varianz Schiefe 1 2 Mehrdimensionale Zufallsvariable Momente Dichtefunktion der Gammaverteilung Ga(a,b) 2 a=1 b=0.5 a=1 b=1 1.5 a=1 b=2 f(x) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable f(x) Eindimensionale Zufallsvariable Dichtefunktion der Gammaverteilung Ga(a,b) 5 a=0.5 b=0.5 a=0.5 b=1 4 a=0.5 b=2 3 227/297 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 228/297 Die Normalverteilung und verwandte Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Eindimensionale Zufallsvariable Statistik Die eindimensionale Normalverteilung f (x) = Mehrdimensionale Zufallsvariable Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable (x−µ)2 1 √ e− 2σ2 σ 2π Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Das Maximum ist bei x = µ, die Wendepunkte bei x = µ ± σ. Die √ halbe Breite auf halber Höhe (HWHM) ist gleich σ 2 ln 2 ≈ 1, 177σ. Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik HWHM 0.2 0.1 0 −4 −3 −2 −1 0 (x−µ)/σ 1 2 3 4 Eindimensionale Normalverteilung, gelber Bereich = 68.2% R. Frühwirth Statistik 230/297 Die Normalverteilung und verwandte Verteilungen Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.3 229/297 Die Normalverteilung und verwandte Verteilungen Eindimensionale Zufallsvariable fmax=0.39894 0.4 Erwartung Varianz Schiefe Rechnen mit Verteilungen R. Frühwirth 0.5 Eindimensionale Zufallsvariable Ihre Dichte ist die bekannte Gauß’sche Glockenkurve: Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen R. Frühwirth f((x−µ)/σ) R. Frühwirth Statistik Es gilt: R. Frühwirth W (|r − µ| ≥ σ) W (|r − µ| ≥ 2σ) W (|r − µ| ≥ 3σ) = 31.8% = 4.6% = 0.2% Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 231/297 Die d-dimensionale Normalverteilung No(µ, V) Ihre Dichte lautet: f (x) = 1 1 T −1 p (x − µ) V (x − µ) exp − d 2 (2π) 2 |V| V und V−1 sind symmetrische positiv definite d × d-Matrizen. Ist X normalverteilt gemäß No(µ, V) und H eine m × d Matrix, so ist Y = HX normalverteilt gemäß No(Hµ, HVHT ). Jede Randverteilung einer Normalverteilung ist wieder eine Normalverteilung. Mittelwert und Matrix der Randverteilung entstehen durch Streichen der Spalten und Zeilen der restlichen Variablen. R. Frühwirth Statistik 232/297 Die Normalverteilung und verwandte Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Statistik Jede bedingte Verteilung einer Normalverteilung ist wieder eine Normalverteilung. R. Frühwirth Eindimensionale Zufallsvariable Ist X normalverteilt gemäß No(µ, V), so kann V als positiv definite symmetrische Matrix mittels einer orthogonalen Transformation auf Diagonalform gebracht werden: Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable UVUT = D2 Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Alle Digonalelemente von D2 sind positiv. Die Zufallsvariable Y = DU(X − µ) ist dann standardnormalverteilt. Die Drehung U heißt Hauptachsentransformation. Wichtige Verteilungen R. Frühwirth Momente Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Statistik R. Frühwirth Grundbegriffe Randverteilungen und bedingte Verteilungen σ1=1, σ2=1, ρ=0.6 3 Eindimensionale Zufallsvariable 0.2 2 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.15 1 Mehrdimensionale Zufallsvariable 0.1 0 Grundbegriffe Randverteilungen und bedingte Verteilungen 0.05 −1 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Wichtige Verteilungen 0 −2 2 2 0 0 −2 −3 −3 −2 −1 0 1 2 3 −2 1 i ρ = σ12 /(σ1 σ2 ) ist der Korrelationskoeffizient. Sind X1 und X2 unkorreliert, also ρ = 0, folgt: 1 x21 x22 1 f (x1 , x2 ) = exp − + 2 = f1 (x1 ) · f2 (x2 ) 2πσ1 σ2 2 σ12 σ2 Zwei unkorrelierte normalverteilte Zufallsvariable mit gemeinsamer Normalverteilung sind daher unabhängig. Statistik 234/297 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Die bedingte Dichte f (x1 |x2 ) ist gegeben durch f (x1 |x2 ) = f (x1 , x2 ) = f (x2 ) " 1 1 p =√ exp − 2 2 2 σ1 (1 − ρ2 ) 2πσ1 1 − ρ 2 # ρ x2 σ1 x1 − σ2 X1 |X2 = x2 ist also eine normalverteilte Zufallsvariable mit der Erwartung E[X1 |X2 ] = ρx2 σ1 /σ2 Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth 1−ρ x22 σ22 Die Normalverteilung und verwandte Verteilungen Statistik Mehrdimensionale Zufallsvariable 2πσ1 σ2 R. Frühwirth R. Frühwirth Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Für d = 2 und µ = 0 kann die Dichte folgendermaßen angeschrieben werden: 2 h x1 1√ 1 f (x1 , x2 ) = exp − 2(1−ρ − 2 σρ 1xσ1 2x2 + 2) σ2 2 233/297 Die Normalverteilung und verwandte Verteilungen Eindimensionale Zufallsvariable Die zweidimensionale Normalverteilung Statistik 235/297 E[X1 |X2 ] heißt die bedingte Erwartung. R. Frühwirth Statistik 236/297 Die Normalverteilung und verwandte Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Statistik Je nach Vorzeichen von ρ fällt oder wächst die bedingte Erwartung von X1 , wenn X2 wächst. R. Frühwirth Eindimensionale Zufallsvariable Ist ρ = 1, sind X1 und X2 proportional: X1 = X2 σ1 /σ2 . Die Hauptachsentransformation ist jene Drehung, die die Ellipsen in achsenparallele Lage bringt. Sie hängt im Fall d = 2 nur von ρ ab. Ist ρ = 0, sind X1 und X2 bereits unabhängig, und der Drehwinkel ist gleich 0. Ist ρ 6= 0, ist die Drehmatrix U gleich ! cos ϕ − sin ϕ 1 σ 2 − σ12 U= mit ϕ = − arccot 2 2 2ρσ1 σ2 sin ϕ cos ϕ Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen R. Frühwirth Statistik 238/297 Statistik Die F-Verteilung F(n, m) R. Frühwirth Eindimensionale Zufallsvariable Die Dichte der F-Verteilung (Fisher-Snedecor-Verteilung) mit n bzw. m Freiheitsgraden lautet: Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable n/2 m/2 Γ( n+m m xn/2−1 2 )n f (x|n, m) = · I[0,∞) (x) n m Γ( 2 )Γ( 2 ) (m + nx)(n+m)/2 F = Erwartung Varianz Schiefe 8 Eindimensionale Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente Erwartung Varianz Schiefe 12 Rechnen mit Verteilungen Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Sind X und Y unabhängig und χ2 -verteilt mit n bzw. n Freiheitsgraden, so ist Momente Rechnen mit Verteilungen xn/2−1 e−x/2 · I[0,∞) (x) Abschnitt 11: Momente Statistik Mehrdimensionale Zufallsvariable 1 2n/2 Γ( n2 ) Sie ist die Gammaverteilung Ga(n/2, 2). Ist X standardnormalverteilt, so ist Y = X 2 χ2 -verteilt mit einem Freiheitsgrad. 237/297 Die Normalverteilung und verwandte Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable f (x|n) = Erwartung Varianz Schiefe Rechnen mit Verteilungen Eindimensionale Zufallsvariable Die Dichte der χ2 -Verteilung mit n Freiheitsgraden lautet: Momente Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Die χ2 -Verteilung χ2 (n) Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Rechnen mit Verteilungen Statistik Die Dichte der t-Verteilung mit n Freiheitsgraden lautet: −(n+1)/2 Γ( n+1 x2 2 ) f (x|n) = √ 1+ n nπ Γ( n2 ) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Die Höhenschichtlinien der Dichtefunktion sind Ellipsen. R. Frühwirth Die t-Verteilung t(n) Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen X/n Y /m Momente Erwartung Varianz Schiefe verteilt gemäß F(n, m). Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 239/297 R. Frühwirth Statistik 240/297 Unterabschnitt: Erwartung Erwartung Statistik Statistik R. Frühwirth R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 8 9 Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente Erwartung Varianz Schiefe Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 12 Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik 241/297 R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe 242/297 Statistik Definition (Erwartung einer Zufallsvariablen) −∞ −∞ Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik f (x) = 243/297 1 , x∈R π(1 + x2 ) Wichtige Verteilungen Rechnen mit Verteilungen R. Frühwirth Die Erwartung braucht nicht zu existieren. Ein Beispiel ist die Cauchy-Verteilung (t-Verteilung mit einem Freiheitsgrad) mit der Dichte Eindimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen k∈N0 Ist X = (X1 , . . . , Xd ), wird die Erwartung entsprechend verallgemeinert: Z ∞ Z ∞ EX [g] = ... g(x1 , . . . , xd ) f (x1 , . . . , xd ) dx1 . . . dxd −∞ Die Erwartung ist ein Lageparameter. R. Frühwirth Ist g(x) = x, so heißt E[g(X)] = E[X] die Erwartung oder der Mittelwert von X. Z ∞ X E[X] = xf (x) dx bzw. E[X] = k f (k) Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Statistik Erwartung Statistik Mehrdimensionale Zufallsvariable EX [g] = E[g(X)] heißt die Erwartung von g(X). Ist g ein k-dimensionaler Vektor von Funktionen, dann ist auch E[g(X)] ein k-dimensionaler Vektor. Rechnen mit Verteilungen Erwartung Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable −∞ k∈N0 Erwartung Varianz Schiefe R. Frühwirth Eindimensionale Zufallsvariable Es sei X eine (diskrete oder stetige) Zufallsvariable mit der Dichte f (x). Ferner sei g eine beliebige stetige reelle oder komplexe Funktion. Man definiert EX [g] = E[g(X)] durch: Z ∞ X g(x)f (x) dx g(k)f (k) bzw. E[g(X)] = E[g(X)] = Wichtige Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Definition (Erwartung) Eigenschaften der Erwartung 1 E[c] = c, c ∈ R 2 E[aX + b] = aE[X] + b 3 E[X1 + X2 ] = E[X1 ] + E[X2 ] 4 X1 und X2 unabhängig =⇒ E[X1 X2 ] = E[X1 ] · E[X2 ] R. Frühwirth Statistik 244/297 Erwartung Erwartung Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Die Erwartung von diskreten Zufallsvariablen Gleichverteilung Gl(n) Alternativverteilung Al(p) Binomialverteilung Bi(n, p) Negative Binomialverteilung Nb(r, p) Poissonverteilung Po(λ) Hypergeometrische Verteilung Hy(N, M, n) Multinomialverteilung Mu(n, p1 , . . . , pd ) R. Frühwirth n+1 2 E[X] = E[X] = p E[X] = np E[X] = r(1−p) p E[X] = λ E[X] = nM N E[Xi ] = npi Momente Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik R. Frühwirth 245/297 Erwartung Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Statistik E[X] = a+b 2 E[X] = τ E[X] = µ E[X] = µ E[X] = ab a E[X] = a+b E[X] = n E[X] = 0, n > 1 m E[X] = m−2 ,m > 2 246/297 Unterabschnitt: Varianz Statistik Eindimensionale Zufallsvariable Stetige Gleichverteilung Un(a, b) Exponentialverteilung Ex(τ ) Normalverteilung No(µ, σ 2 ) Normalverteilung No(µ, V) Gammaverteilung Ga(a, b) Betaverteilung Beta(a, b) χ2 -Verteilung χ2 (n) t-Verteilung t(n) F-Verteilung F(n, m) Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Momente Erwartung Varianz Schiefe R. Frühwirth Die Erwartung von stetigen Zufallsvariablen Eindimensionale Zufallsvariable Statistik Definition (Momente) R. Frühwirth Sei X eine Zufallsvariable. Die Erwartung von g(x) = (x − a)k , sofern sie existiert, heißt k-tes Moment von X um a. Das k-te Moment um 0 wird mit µ0k bezeichnet. Das k-te Moment um den Erwartungswert E[X] wird als zentrales Moment µk bezeichnet. Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Selbst wenn alle Momente einer Verteilung existieren, ist sie dadurch nicht eindeutig bestimmt. Momente Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 247/297 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente Erwartung Varianz Schiefe 12 Rechnen mit Verteilungen Erwartung Varianz Schiefe Rechnen mit Verteilungen Statistik Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Die zentralen Momente µ1 , . . . , µk können aus den Momenten um 0 µ01 , . . . , µ0k berechnet werden, und umgekehrt. R. Frühwirth 8 R. Frühwirth Statistik 248/297 Varianz Varianz Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Statistik Definition (Varianz) R. Frühwirth Das zweite zentrale Moment µ2 heißt die Varianz von X, bezeichnet mit var[X]. Die Wurzel aus der Varianz heißt die Standardabweichung von X, bezeichnet mit σ[X]. Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Die Standardabweichung ist ein Skalenparameter, der die Breite der Verteilung beschreiben. Die Standardabweichung hat die gleiche Dimension wie die Zufallsvariable. Varianz und Standardabweichung sind (wie alle zentralen Momente) invariant gegen Translationen. Die Varianz braucht nicht zu existieren. Ein Beispiel ist die t-Verteilung mit zwei Freiheitsgraden mit der Dichte Rechnen mit Verteilungen R. Frühwirth Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 1 g2 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Statistik Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth 249/297 Statistik 250/297 Varianz Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable W (|X − µ| > gσ) ≤ Grundbegriffe Randverteilungen und bedingte Verteilungen Varianz Eindimensionale Zufallsvariable Es sei X eine Zufallsvariable mit der Erwartung E[X] = µ und der Varianz var[X] = σ 2 . Für g > 0 gilt: Rechnen mit Verteilungen 1 f (x) = , x∈R (2 + x2 )3/2 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Die Tschebyscheff’sche Ungleichung Statistik Definition (Kovarianz) R. Frühwirth Sei X = (X1 , . . . , Xn ) eine n-dimensionale Zufallsvariable und E[Xi ] = µ0i . cov[Xi , Xj ] = E[(Xi − µ0i )(Xj − µ0j )] = Z = (xi − µ0i )(xj − µ0j ) f (x1 , . . . xn ) dx1 . . . dxn = Rn Z ∞Z ∞ (xi − µ0i )(xj − µ0j ) fij (xi , xj ) dxi dxj = −∞ −∞ heißt die Kovarianz von Xi und Xj , auch σij geschrieben. Die Matrix V mit Vij = cov[Xi , Xj ] heißt die Kovarianzmatrix von X, bezeichnet mit Cov[X]. Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Eigenschaften der Varianz bzw. der Kovarianz 1 var[X] = E[r2 ] − (E[X])2 2 cov[X1 , X2 ] = E[X1 X2 ] − E[X1 ] · E[X2 ] 3 var[aX + b] = a2 var[X] 4 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe 5 var[a1 X1 + a2 X2 ] = a21 var[X1 ] + a22 var[X2 ] + 2a1 a2 cov[X1 , X2 ] " n # n X n X X var Xi = cov[Xi , Xj ] = i=1 n X i=1 i=1 j=1 var[Xi ] + 2 n n X X cov[Xi , Xj ] i=1 j=i+1 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 251/297 R. Frühwirth Statistik 252/297 Varianz Varianz Statistik Statistik Für unabhängige Zufallsgrößen gilt: R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen R. Frühwirth 1 X1 , X2 unabhängig =⇒ cov[X1 , X2 ] = 0 2 X1 , . . . , Xn unabhängig: " n # n X X var Xi = var[Xi ] i=1 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen i=1 Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Ist |ρij | = 1, so sind Xi und Xj linear abhängig. R. Frühwirth Statistik 254/297 Varianz Statistik Mehrdimensionale Zufallsvariable −1 ≤ ρij ≤ 1 2 253/297 Varianz Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 1 Erwartung Varianz Schiefe Rechnen mit Verteilungen Eindimensionale Zufallsvariable Eigenschaften des Korrelationskoeffizienten Momente Erwartung Varianz Schiefe R. Frühwirth Definition (Korrelationskoeffizient) σij heißt der Korrelationskoeffizient von Xi Die Größe ρij = σi σj und Xj . Statistik Die Varianz von diskreten Zufallsvariablen R. Frühwirth n2 −1 12 Gleichvt. Gl(n) Alternativvt. Al(p) Binomialvt. Bi(n, p) var[X] = var[X] = p(1 − p) var[X] = np(1 − p) Negative Binomialvt. Nb(r, p) Poissonvt. Po(λ) Hypergeom. Vt. Hy(N, M, n) var[X] = r(1−p) p var[X] = λ −n)(N −M ) var[X] = nM (N N 2 (N −1) Multinomialvt. Mu(n, p1 , . . . , pd ) cov[Xi , Xj ] = δij npi − npi pj Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable 2 Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 255/297 Die Varianz von stetigen Zufallsvariablen 2 Gleichverteilung Un(a, b) Exponentialverteilung Ex(τ ) Normalverteilung No(µ, σ 2 ) Normalverteilung No(µ, V) Gammaverteilung Ga(a, b) Betaverteilung Beta(a, b) var[X] = (b−a) 12 var[X] = τ 2 var[X] = σ 2 Cov[X] = V var[X] = ab2 var[X] = (a+b)2ab (a+b+1) χ2 -Verteilung χ2 (n) t-Verteilung t(n) var[X] = 2 n n ,n > 2 var[X] = n−2 F-Verteilung F(n, m) var[X] = R. Frühwirth Statistik 2m2 (n+m−2) n(m−2)2 (m−4) , m >4 256/297 Unterabschnitt: Schiefe Schiefe Statistik Statistik R. Frühwirth R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 8 9 Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen 11 Momente Erwartung Varianz Schiefe Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 12 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik ∞ Z 0 (t − τ )3 −t/τ e dt = 2τ 3 τ Die Schiefe ist daher gleich γ = 2. 257/297 R. Frühwirth Statistik 258/297 Abschnitt 12: Rechnen mit Verteilungen Statistik Mehrdimensionale Zufallsvariable µ3 = E[(X − E[X])3 ] = Erwartung Varianz Schiefe Schiefe Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Beispiel (Die Schiefe der Exponentialverteilung) Momente R. Frühwirth Eindimensionale Zufallsvariable Die Schiefe misst die Asymmetrie einer Verteilung. Ist die Schiefe positiv (negativ), heißt die Verteilung rechtsschief (linksschief). Für symmetrische Verteilungen ist sie 0. Grundbegriffe Randverteilungen und bedingte Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Das reduzierte dritte zentrale Moment γ = µ3 /σ 3 heißt die Schiefe. Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Definition (Schiefe) Statistik Beispiel (Die Schiefe der Gammaverteilung) R. Frühwirth ∞ (x − ab)3 a−1 −x/b x e dx = 2ab3 ba Γ(a) 0 √ Die Schiefe ist daher gleich γ = 2/ a und strebt für a → ∞ gegen 0. µ3 = E[(X − E[X])3 ] = Z Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 259/297 8 Eindimensionale Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente 12 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable R. Frühwirth Statistik 260/297 Unterabschnitt: Faltung und Messfehler Faltung und Messfehler Statistik Statistik R. Frühwirth R. Frühwirth 8 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente 12 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen R. Frühwirth Statistik Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 261/297 Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe −∞ R. Frühwirth Statistik 262/297 Statistik Die Dichte g wird als Faltungsprodukt von f1 und f2 bezeichnet: g = f1 ∗ f2 . R. Frühwirth Eindimensionale Zufallsvariable Mehrdimensionale Zufallsvariable Satz Sind X1 und X2 zwei unabhängige Zufallsvariable mit der gemeinsamen Dichte f (x1 , x2 ) = f1 (x1 ) · f2 (x2 ), so hat ihre Summe X = X1 + X2 die Dichte Z ∞ f1 (x − x2 ) · f2 (x2 ) dx2 = g(x) = −∞ Z ∞ = f1 (x1 ) · f2 (x − x1 ) dx1 Faltung und Messfehler Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Es seien X1 und X2 zwei unabhängige Zufallsvariablen. Die Summe X = X1 + X2 heißt die Faltung von X1 und X2 . Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler R. Frühwirth Definition (Faltung) Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Beispiel (Faltung von zwei Exponentialverteilungen) Es seien X1 und X2 exponentialverteilt gemäß Eτ . Die Summe X = X1 + X2 hat die folgende Dichte: Z ∞ g(t) = f1 (t − t2 )f2 (t2 ) dt2 = Z Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen −∞ t = 0 = Mehrdimensionale Zufallsvariable Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 1 (t2 −t)/τ −t2 /τ e e dt2 = τ2 1 −t/τ te τ2 Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 263/297 Beispiel (Faltung von zwei Gleichverteilungen) Es seien X1 und X2 gleichverteilt im Intervall [0, 1]. Die Summe X = X1 + X2 hat die folgende Dichte: Z ∞ g(x) = f1 (x − x2 )f2 (x2 ) dx2 −∞ Das Produkt der Dichten ist nur ungleich 0, wenn 0 ≤ x − x2 ≤ 1 und 0 ≤ x2 ≤ 1 gilt. Die effektiven Integrationsgrenzen sind daher xmin = max(0, x − 1) und xmax = min(x, 1). Ist 0 ≤ x ≤ 1, ist xmin = 0 und xmax = x; ist 1 ≤ x ≤ 2, ist xmin = x − 1 und xmax = 1. Die Dichte g(x) lautet daher: wenn 0 ≤ x ≤ 1 x, g(x) = 2 − x, wenn 1 ≤ x ≤ 2 0, sonst Die Summenverteilung heißt Dreiecksverteilung. R. Frühwirth Statistik 264/297 Faltung und Messfehler Faltung und Messfehler Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Statistik Zwei Eigenschaften der Normalverteilung 1 2 R. Frühwirth Die Faltung zweier Normalverteilungen ist wieder eine Normalverteilung. Eindimensionale Zufallsvariable Ist die Faltung von zwei Verteilungen eine Normalverteilung, so sind auch die beiden Summanden Normalverteilungen. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 265/297 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Im günstigsten Fall hängt b nur von der Differenz x0 − x ab, oder eine weitere explizite Abhängigkeit von x ist vernachlässigbar. Dann wird aus dem Integral ein Faltungsintegral. Dies ist genau dann der Fall, wenn der Messfehler und die Messung unabhängig sind. Statistik 266/297 Statistik Die Faltung von zwei Zufallsvariablen X1 und X2 kann auch mit Hilfe ihrer charakteristischen Funktionen berechnet werden. R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Definition (Charakteristische Funktion) Es sei X eine Zufallsvariable. Die charakteristische Funktion von X ist definiert durch: ϕX (t) = E[ exp(itX) ], t ∈ R Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Beispiel (Faltung von zwei Poissonverteilungen) Es seien X1 und X2 Poisson-verteilt gemäß Po(λ1 ) bzw. Po(λ2 ). Die charakteristische Funktion von Xi lautet: ϕXi (t) = ∞ X eikt λki e−λi = exp[λi (eit − 1)] k! k=0 Die charakteristische Funktion von X = X1 + X2 ist daher gleich ϕX (t) = exp[λ1 (eit − 1)] exp[λ2 (eit − 1)] = exp[(λ1 + λ2 )(eit − 1)] X ist also Poisson-verteilt gemäß Po(λ) mit λ = λ1 + λ2 . Momente Satz Ist X = X1 + X2 die Faltung von X1 und X2 , so gilt: Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze −∞ −∞ Faltung und Messfehler Statistik Eindimensionale Zufallsvariable Es wird eine Zufallsgröße X beobachtet. Der Messfehler wird durch eine bedingte Dichte b(x0 |x) beschrieben, die die Wahrscheinlichkeit angibt, dass x0 bei der Messung registriert wird, wenn X den Wert x annimmt. Für die gemessene Verteilung gilt dann: Z ∞ Z ∞ f (x0 , x) dx b(x0 |x)f (x) dx = fM (x0 ) = R. Frühwirth Faltung und Messfehler R. Frühwirth Beispiel (Der Messfehler) Rechnen mit Verteilungen ϕX (t) = ϕX1 (t) · ϕX2 (t) R. Frühwirth Statistik Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 267/297 R. Frühwirth Statistik 268/297 Faltung und Messfehler Faltung und Messfehler Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Statistik 2 Beispiel (Faltung von zwei χ -Verteilungen) 2 Es seien X1 und X2 χ -verteilt mit n1 bzw. n2 Freiheitsgraden. Die charakteristische Funktion von Xi lautet: ϕXi (t) = Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Momente 1 (1 − 2it)ni /2 ϕX (t) = Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable X ist also χ2 -verteilt mit n = n1 + n2 Freiheitsgraden. Erwartung Varianz Schiefe Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik R. Frühwirth 269/297 Unterabschnitt: Fehlerfortpflanzung, Transformation von Dichten Statistik Statistik R. Frühwirth 8 Eindimensionale Zufallsvariable Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente 12 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Es sei X = (X1 , . . . , Xn ) eine n-dimensionale Zufallsvariable und H eine m × n - Matrix. Dann ist Y = (Y1 , . . . Ym ) = HX — wie jede deterministische Funktion einer Zufallsvariablen — wieder eine Zufallsvariable. Wie ist Y verteilt? Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Statistik 270/297 Im folgenden Abschnitt sollen Linearkombinationen von — nicht notwendig unabhängigen — Zufallsvariablen betrachtet werden. Wichtige Verteilungen R. Frühwirth Statistik Fehlerfortpflanzung, Transformation von Dichten R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Ist die Faltung von zwei Verteilungen eine Normalverteilung, so sind auch die beiden Summanden Normalverteilungen. Momente Rechnen mit Verteilungen Wichtige Verteilungen 2 Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Grundbegriffe Randverteilungen und bedingte Verteilungen Die Faltung zweier Normalverteilungen ist wieder eine Normalverteilung. Wichtige Verteilungen 1 1 = (1 − 2it)n1 /2 (1 − 2it)n2 /2 (1 − 2it)(n1 +n2 )/2 Rechnen mit Verteilungen Mehrdimensionale Zufallsvariable 1 Grundbegriffe Randverteilungen und bedingte Verteilungen Erwartung Varianz Schiefe Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Zwei Eigenschaften der Normalverteilung Mehrdimensionale Zufallsvariable Die charakteristische Funktion von X = X1 + X2 ist daher gleich Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Es gilt exakt: Lineare Transformation von Erwartung und Varianz 1 E[Y ] ≈ H · E[X] 2 Cov[Y ] ≈ H · Cov[X] · HT Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 271/297 R. Frühwirth Statistik 272/297 Fehlerfortpflanzung, Transformation von Dichten Fehlerfortpflanzung, Transformation von Dichten Statistik Statistik Es soll nun statt der linearen Abbildung H eine allgemeine Funktion h = (h1 , . . . , hm ) betrachtet werden. R. Frühwirth Eindimensionale Zufallsvariable Es wird angenommen, dass h in jenem Bereich, in dem die Dichte von X signifikant von 0 verschieden ist, genügend gut durch eine lineare Funktion angenähert werden kann. Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Entwickelt man h an der Stelle E[X], so gilt in 1. Näherung: Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Lineare Fehlerfortpflanzung 1 2 R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable R. Frühwirth R. Frühwirth Es sei X eine d-dimensionale Zufallsvariable mit Dichte fX (x) und Y = AX + b. Ist A regulär, ist die Dichte von Y gegeben durch: fY (y) = fX (A−1 (y − b)) · Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 1 |A| Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik 274/297 Statistik Beispiel (Transformation unter einer affinen Abbildung) Mehrdimensionale Zufallsvariable Wichtige Verteilungen ∂g fY (y1 , . . . , yd ) = fX (g(y1 , . . . , yd )) · ∂y ∂g wobei der Betrag der Funktionaldeterminante ist. ∂y Fehlerfortpflanzung, Transformation von Dichten Statistik Eindimensionale Zufallsvariable Transformation der Dichte 273/297 Fehlerfortpflanzung, Transformation von Dichten R. Frühwirth Es sei X = (X1 , . . . , Xd ) eine d-dimensionale Zufallsvariable mit der Dichte fX (x1 , . . . , xd ), h eine umkehrbare Abbildung h : Rd → Rd , g die Umkehrfunktion von h, Y = h(X) und fY (y1 , . . . , yd ) die Dichte von Y . Dann gilt: Wichtige Verteilungen E[Y ] = h(E[X]) T ∂h ∂h Cov[Y ] = · Cov[X] · ∂x ∂x R. Frühwirth Ist h = (h1 , . . . , hn ) eine umkehrbar eindeutige Abbildung h : Rn → Rn , so läßt sich die Dichte von Y = (Y1 , . . . , Yn ) = h(X1 , . . . , Xn ) berechnen. Grundbegriffe Randverteilungen und bedingte Verteilungen Beispiel (Transformation mit der Verteilungsfunktion) Wichtige Verteilungen Es sei X eine stetige Zufallsvariable mit der Dichte f (x) und der Verteilungsfunktion F (x), und Y = F (X). Dann ist die Dichte von Y gegeben durch: dF −1 = f (x)/f (x) = 1 g(y) = f (x) · dy Statistik Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Y ist also gleichverteilt im Intervall [0, 1]. Y wird als p-Wert (probability transform) von X bezeichnet. R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 275/297 Beispiel (Transformation mit der inversen Verteilungsfunktion) Es sei U gleichverteilt im Intervall [0, 1], F (x) (f (x)) die Verteilungsfunktion (Dichtefunktion) einer stetigen Verteilung, und X = F −1 (U ). Dann ist die Dichte von X gegeben durch: dF = f (x) g(x) = 1 · dx X ist also verteilt mit der Verteilungsfunktion F und der Dichte f . Beispiel Es sei X gleichverteilt im Intervall [0, 1] und Y = − ln(X). Dann ist g(y) = exp(−y) und dg = e−y fY (y) = fX (exp(−y)) · dy Y ist daher exponentialverteilt mit τ = 1. R. Frühwirth Statistik 276/297 Fehlerfortpflanzung, Transformation von Dichten Unterabschnitt: Systematische Fehler Statistik R. Frühwirth Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Statistik Beispiel (Der Kehrwert einer gammaverteilten Zufallsvariablen) Es sei X Gammaverteilt gemäß Ga(a, b). Wir suchen die Verteilung von Y = 1/X. Es gilt: (1/y)a+1 e−b/x 1 fY (y) = fX (1/y) · 2 = y ba Γ(a) R. Frühwirth Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Die Verteilung von Y wird als inverse Gammaverteilung IG(a, b) bezeichnet. Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Momente Erwartung Varianz Schiefe Erwartung Varianz Schiefe Rechnen mit Verteilungen Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen 11 Momente 12 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 278/297 Systematische Fehler Statistik Eindimensionale Zufallsvariable Eindimensionale Zufallsvariable 277/297 Systematische Fehler R. Frühwirth 8 Eindimensionale Zufallsvariable Statistik Kann der Messfehler durch eine Zufallsvariable mit Mittel 0 beschrieben werden, hat die Messung nur einen statistischen Fehler. Die Messung kann jedoch durch eine falsche Kalibration (z.B. Skalenfehler oder Nullpunktfehler) des Messgeräts verfälscht sein. Solche Fehler werden systematische Fehler genannt. Systematische Fehler werden durch Vergrößerung der Stichprobe nicht kleiner! Das Gesetz der Fehlerfortpflanzung gilt nicht für systematische Fehler! Statistik Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Die Korrektur von systematischen Fehlern erfordert solgfältige Kalibaration der Messaparatur, Überprüfung von theoretischen Annahmen, etc. R. Frühwirth R. Frühwirth Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Beispiel Wir messen zwei Spannungen U1 , U2 mit dem gleichen Messgerät. Durch fehlerhafte Kalibration misst das Gerät statt der wahren Spannung U die Spannung Um = aU + b + ε, mit a = 0.99, b = 0.05, σ[ε] = 0.03 V. Der Mittelwert Ū der beiden Spannungen hat dann einen statistischen Fehler von 0.02 V. Der systematische Fehler des Mittelwerts wird beschrieben durch Ūm = aŪ + b, ist also der der Einzelmessung. Der systematische Fehler der Differenz ∆U wird beschrieben durch ∆Um = a∆U . Der Nullpunktfehler ist verschwunden. Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 279/297 R. Frühwirth Statistik 280/297 Unterabschnitt: Grenzverteilungssätze Grenzverteilungssätze Statistik Statistik R. Frühwirth R. Frühwirth 8 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Eindimensionale Zufallsvariable 9 Mehrdimensionale Zufallsvariable 10 Wichtige Verteilungen Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen 11 Momente 12 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Sn = n X Xi , Un = i=1 Sn − E[Sn ] Sn − nµ = √ σ[Sn ] n·σ so ist U = limn→∞ Un standardnormalverteilt. Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze 281/297 R. Frühwirth Statistik 282/297 Grenzverteilungssätze Statistik Eindimensionale Zufallsvariable Sei (Xi )i∈N eine Folge von unabhängigen Zufallsvariablen, die die gleiche Verteilung besitzen, mit endlicher Erwartung µ und endlicher Varianz σ 2 . Definiert man Sn und Un durch: Momente Grenzverteilungssätze R. Frühwirth Zentraler Grenzwertsatz für identisch verteilte Folgen von Zufallsvariablen Statistik Zentraler Grenzwertsatz für beliebig verteilte Folgen von Zufallsvariablen R. Frühwirth Eindimensionale Zufallsvariable Sei (Xi )i∈N eine Folge von unabhängigen Zufallsvariablen mit beliebigen Verteilungen. µi = E[Xi ] und σi2 = var[Xi ] seien endlich für alle i ∈ N. Definiert man für jedes n ∈ N Ui und Yn durch: Xi − µi , Yn = Ui = √ nσi n X Mehrdimensionale Zufallsvariable Grundbegriffe Randverteilungen und bedingte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen i=1 Beispiel (Binomialverteilung für großes n) Da eine gemäß Bi(n, p) verteilte Zufallsvariable als Summe von n alternativverteilten Zufallsvariablen dargestellt werden kann, muss die Binomialverteilung für n → ∞ gegen eine Normalverteilung streben. Die Abbildung zeigt die Verteilungsfunktion der Binomialverteilung Bi(n, p) mit n = 200 und p = 0.1, sowie die Verteilungsfunktion der Normalverteilung No(µ, σ 2 ) mit µ = np = 20 und σ 2 = np(1 − p) = 18. Momente Der zentrale Grenzwertsatz erklärt, warum die Normalverteilung in der Natur eine so bedeutende Rolle spielt, etwa bei der Verteilung der Impulskomponenten von Gasmolekülen, die das Ergebnis von zahlreichen Stößen ist. Statistik Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Wichtige Verteilungen Ui so ist Y = limn→∞ Yn standardnormalverteilt. R. Frühwirth Auch bei relativ kleinem n ist die Normalverteilung of eine gute Näherung für die Summe von Zufallsvariablen. 283/297 Erwartung Varianz Schiefe Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 284/297 Grenzverteilungssätze Grenzverteilungssätze Statistik Statistik R. Frühwirth Eindimensionale Zufallsvariable Bi(200,0.1) No(20,18) 0.9 Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.8 0.7 Mehrdimensionale Zufallsvariable Mehrdimensionale Zufallsvariable 0.6 F(x) Grundbegriffe Randverteilungen und bedingte Verteilungen R. Frühwirth 1 Grundbegriffe Randverteilungen und bedingte Verteilungen 0.5 Wichtige Verteilungen Beispiel (Poissonverteilung für großes n) Da eine gemäß Po(λ) verteilte Zufallsvariable als Summe von λ P (1)-verteilten Zufallsvariablen dargestellt werden kann, muss die Poissonverteilung für λ → ∞ gegen eine Normalverteilung streben. Die Abbildung zeigt die Verteilungsfunktion der Poissonverteilung Po(λ) mit λ = 25, sowie die Verteilungsfunktion der Normalverteilung No(µ, σ 2 ) mit µ = λ = 25 und σ 2 = λ = 25. Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen 0.4 0.3 0.2 Momente Erwartung Varianz Schiefe Momente Erwartung Varianz Schiefe 0.1 0 Rechnen mit Verteilungen 0 5 10 15 20 x Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth 25 30 35 40 Rechnen mit Verteilungen Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze Statistik R. Frühwirth 285/297 Statistik 286/297 Grenzverteilungssätze Statistik Statistik R. Frühwirth R. Frühwirth 1 Eindimensionale Zufallsvariable Grundbegriffe Diskrete Zufallsvariable Stetige Zufallsvariable 0.8 Teil 4 0.7 Mehrdimensionale Zufallsvariable 0.6 F(x) Grundbegriffe Randverteilungen und bedingte Verteilungen Po(25) N(25,25) 0.9 Schätzen von Parametern 0.5 Wichtige Verteilungen Diskrete Verteilungen Stetige Verteilungen Die Normalverteilung und verwandte Verteilungen Momente Erwartung Varianz Schiefe Rechnen mit Verteilungen 0.4 0.3 0.2 0.1 0 0 5 10 15 20 Faltung und Messfehler Fehlerfortpflanzung, Transformation von Dichten Systematische Fehler Grenzverteilungssätze R. Frühwirth Statistik 25 x 30 35 40 45 50 287/297 R. Frühwirth Statistik 288/297