Prof. U. Gerland Theory of Complex Biosystems Physik Department, TUM Statistische Mechanik und Thermodynamik (4A) WS 2015/16, Blatt 1 12. Okt. 2015 Aufgabe 1: Binomialverteilung Für ein Bernoulli-Experiment (ein Zufallsexperiment mit nur zwei Ausgängen, z.B. Kopf/Zahl oder Spin up/down) sei P rob(Kopf ) = a und P rob(Zahl) = b, mit a + b = 1. Man betrachte für eine Folge von N Wiederholungen die Zufallsvariable “Zahl der Würfe, die Kopf lieferten”. Der Ereignisraum ist Ω = {1, 2, . . . , N } und die Wahrscheinlichkeitsverteilung auf Ω, N n N −n pn = a b , n hat die Parameter N und a. Hinweis: Der Trick bei allen Berechnungen zur Binomialverteilung ist (i) zu bemerken, dass pn der n−te Term in (a + b)N ist, und (ii) erst am Ende der Rechnung a + b = 1 zu setzen. (a) Der Erwartungswert sei mit E[.] bezeicnet. Zeigen Sie, dass E[n] = a∂a (a + b)N ist und berechnen Sie den Erwartungswert. Analog verfahren Sie für E[n2 ]. (b) Zeigen Sie allgemein, dass die mittlere quadratische Abweichung (∆n)2 := E[(n − E[n])2 )] auch als (∆n)2 = E[n2 ]−E[n]2 berechnet werden kann. Für die Binomialverteilung berechnen Sie die relative Schwankung ∆n/E[n] und finden die Wurzel-N -Regel. (c) Berechnen Sie die Momenterzeugende Funktion und die ersten beiden Momente. (d) Berechnen Sie die Kumulantenerzeugende Funktion und die ersten beiden Kumulanten. Man erkennt den allgemeinen Zusammenhang, dass sich die Kumulanten von unabhängigen Zufallsvariablen addieren. (e) (Freiwillige Zusatzaufgabe) Begründen Sie, warum für große N die Binomialverteilung in eine Normalverteilung übergeht und bestimmen sie µ und σ. Als Anwendung betrachte man ein Idealgases bei Normbedingungen in einem Volumen von 1 mm3 und denke sich das Volumen in zwei Hälften geteilt. Als Maß für zufällige Abwechungen von der Gleichverteilung auf beide Hälften betrachte man die relative Schwankung. Wie wahrscheinlich sind relative Schwankungen größer als 10−6 ? Drücken Sie das Ergebnis durch die Fehlerfunktion aus. Aufgabe 2: Poissonverteilung Ein Poissonprozess ist durch eine Rate λ von Ereignissen gegeben, die unkorreliert erfolgen, z.B. Klicks in einem Geigerzähler. Die Poissonverteilung ist die Wahrscheinlichkeitsverteilung, pro Zeiteinheit genau n Klicks zu registrieren, wobei n ∈ {0, 1, 2, . . . }. 1 (a) Herleitung als Grenzübergang der Binomialverteilung: Man denke sich das Einheitsintervall in N Intervalle der Länge ∆t = 1/N unterteilt, in jedem ist die Ereigniswahrscheinlichkeit demnach a = λ∆t. Betrachte nun N → ∞, also auch a → 0. Die Wahrscheinlichkeit für mehr als ein Ereignis in ∆t kann im Limes vernachlässigt werden. In ∆t hat man demnach ein Bernoulli-Experiment, die Wahrscheinlichkeit für n Ereignisse in [0,1] kann also mit der Binomialverteilung aus Aufgabe 1 angenähert werden. Führen Sie den Grenzübergang durch und finden Sie die Poissonverteilung pλ (n) = e−λ λn n! Warum hat die Poissonverteilung nur einen Parameter, die Binomialverteilung aber zwei? (b) Bestimmen Sie die Momenterzeugende Funktion. (c) Bestimmen Sie die Kumulantenerzeugende Funktion und berechnen Sie alle Kumulanten. Gilt für die Poissonverteilung die Wurzel-N -Regel? Aufgabe 3: Zentraler Grenzwertsatz (a) Die Zufallsvariable X habe eine uniforme Wahrscheinlichkeitsverteilung auf [−1, 1] ( 1/2 für |x| ≤ 1 pX (x) = 0 sonst √ PN Es sei YN = 1/ N i Xi die (standardisierte) Summe von N Kopien von X. Berechnen Sie explizit pY2 (x) (durch benutzen der Faltung). (b) Skizzieren Sie pX (x), pY2 (x), sowie pY∞ (x). Wenn Sie wollen, fügen Sie, z.B. per Computer, pY3 (x) hinzu. Ist mit dem bloßen Auge noch ein Unterschied zwischen pY3 (x) und pY∞ (x) feststellbar? Aufgabe 4: Bayes-Formel Angenommen bei einem Fahrradrennen mit 1000 Teilnehmern sein 10% aller Fahrer gedoped. Der verwendete Dopingtest habe eine Verlässlichkeit p(positiv|doped) von 90% und eine Falsch-Positivrate p(positiv|clean) von 1%. Dabei bezeichnet p(A|B) die bedingte Wahrscheinlichkeit p(“A, falls B”). (a) Berechnen Sie p(doped|positiv), den positive Vorhersagewert. (b) Wiederholen Sie die Berechnung für eine geringere Prävalenz von nur 1% gedopeden Fahrern. Ist der positive Vorhersagewert eine Eigenschaft des Tests selbst? (c) Eine oft durchsichtigere Herangehensweise als die Bayes-Formel ist das Verwenden von absoluten Häufigkeiten: Berechnen Sie die Ergebnisse nochmals mithilfe von Entscheidungsbäumen (starten sie mit 1000 Teilnehmern, davon sind ... gedoped, ...). 2