1/22 Biometeorologie & Mathematische Epidemiologie Gruppe Bayes-Analyse eines dynamischen Modells für die Epidemiologie des USUTU Virus Jenı Reiczigel1,2, Katharina Brugger1, Franz Rubel1 1 Department für Naturwissenschaften, Veterinärmedizinische Universität Wien 2 Szent István Universität, Veterinärmedizinische Fakultät, Budapest [email protected] DVG Fachtagung, 5-7. September 2007, München 2/22 Biometeorologie & Mathematische Epidemiologie Gruppe Die Krankheit Das USUTU-Virus: • mit dem West Nil Virus verwandt • übertragen durch Stechmücke • betrifft Vögel, v.a. Amseln • erschien in Austria in 2001 Die Beobachtungsdaten: • Monitoring in Ost-Österreich • 2001 bis 2005 Juli, Aug, Sep 60 40 20 0 • Gesamtanzahl: 138 infizierte Vögel J A S 2001 DVG Fachtagung, 5-7. September 2007, München J A S 2002 J A S 2003 J A S 2004 J A S 2005 3/22 Biometeorologie & Mathematische Epidemiologie Gruppe Das Ausgangsmodell • Rubel et al. (2007)* haben ein Arbovirus-Modell zur Erklärung der West Nil Virus (WNV) und Usutu Virus (USUV) Dynamik entwickelt. *submitted to Preventive Veterinary Medicine • Das Modell ist vom Typ SEIR (Susceptible-InfectedInfectious-Recovered) mit 9 Kompartimenten, davon 4 für Moskitos und 5 für Vögel. • Dementsprechend wird das Modell mit einem System von 9 Differentialgleichungen beschrieben. DVG Fachtagung, 5-7. September 2007, München 4/22 Biometeorologie & Mathematische Epidemiologie Gruppe Diagramm des Modells DVG Fachtagung, 5-7. September 2007, München 5/22 Biometeorologie & Mathematische Epidemiologie Gruppe Die Modellparameter wurden aus der Literatur abgeschätzt (Raten: pro Tag und Kopf) Geburtenrate (Vögel) Jahreszeit-abhängig Geburtenrate (Mückenlarven) temperaturabhängig Natürliche Mortalitätsrate (Vögel) 0.0012 Mortalitätsrate zufolge USUV (Vögel) 0.3 Inkubationszeit des Virus (in Vögel) 1.5 Tag Inkubationszeit des Virus (in Mücken) temperaturabhängig und so weiter… DVG Fachtagung, 5-7. September 2007, München 6/22 Biometeorologie & Mathematische Epidemiologie Gruppe Motivation für Erweiterung des Modells 1. Parameter eines deterministischen Modells sind feste Werte, aber der zu analysierende epidemiologische Prozess hat immanente stochastische Komponente: • Anzahl der gefundenen infizierten Vögel • Tagestemperaturwerte • Modellparameter, z.B. Vermehrungsraten, Sterberaten, usw. (Vogel- und Mückepopulationen sind heterogen, bestehend aus Subpopulationen) 2. Ergebnisse sind auch feste Werte, aber man interessiert sich für die Zuverlässigkeit der Ergebnisse: möchte Standardfehler, Vertrauensintervalle, usw. für Parameter und Vorhersage angeben. DVG Fachtagung, 5-7. September 2007, München 7/22 Biometeorologie & Mathematische Epidemiologie Gruppe Das erweiterte, stochastische Modell Basierend auf diesem Modell haben wir ein hierarchisches Bayes-Modell aufgebaut: auf jeder Ebene des Modells haben wir stochastische Komponenten eingeführt: • einige Modellparameter haben wir randomisiert, • auch die Temperaturdaten haben wir randomisiert, • die Anzahl der toten Vögel haben wir mit einer Poissonverteilten Variable modelliert, deren Mittelwert aus dem Modell kommt. (Details später) DVG Fachtagung, 5-7. September 2007, München 8/22 Biometeorologie & Mathematische Epidemiologie Gruppe Bayes-Analyse eines stochastischen Modells In einem Bayes-Modell sind die zu untersuchenden Parameter Zufallsvariablen, die man mit Hilfe von Wahrscheinlichkeitsverteilungen charakterisiert. • Man hat eine Vorstellung über den zu untersuchenden Parameter schon vor der Beobachtung der Daten: das wird die prior Verteilung genannt. • Die Beobachtung der Daten kann diese Vorstellung verändern: diese veränderte Vorstellung wird in der posterior Verteilung verkörpert. DVG Fachtagung, 5-7. September 2007, München 9/22 Biometeorologie & Mathematische Epidemiologie Gruppe Beispiel für die prior und posterior Verteilung Parameter: Infektionswahrscheinlichkeit Vogel → Mücke (falls eine empfängliche Mücke einen infektiösen Vogel sticht) Prior Verteilung: Gleichverteilung im Bereich [0,1] Geschätzte posterior Verteilung: (Histogramm basiert auf 10.000 simulierten Werten) Interpretation: die Information in den Beobachtungsdaten hat die Unsicherheit hinsichtlich des Parameters vermindert! DVG Fachtagung, 5-7. September 2007, München 10/22 Biometeorologie & Mathematische Epidemiologie Gruppe Bayes’sche Punkt- und Intervallschätzung • posterior Mittelwert (posterior mean) • posterior Median • 90, 95%, 99% posterior Intervall oder Vertrauensintervall (posterior interval, credible interval) Im vorigen Beispiel: Posterior MW = 0.178 Posterior Median = 0.175 90% posterior Intervall: (0.137, 0.227) 95% (0.119, 0.236) 99% (0.103, 0.266) DVG Fachtagung, 5-7. September 2007, München 11/22 Biometeorologie & Mathematische Epidemiologie Gruppe Analyse durch Computersimulation: die MCMC (Markov Chain Monte Carlo) Methode Wenn das Modell zu komplex ist, ist die analytische Berechnung der posterior Verteilung zu kompliziert. Lösung: Computersimulation. Grundidee der MCMC: • Man konstruiert eine Markov-Kette, deren stationäre Verteilung die posterior Verteilung ist (es gibt verschiedene Methode dafür) und generiert eine lange Reihe von Kettenglieder • Nach einer anfänglichen transienten Periode folgen die Kettenglieder die posterior Verteilung DVG Fachtagung, 5-7. September 2007, München 12/22 Biometeorologie & Mathematische Epidemiologie Gruppe Was bedeutet die „Markov-Kette“ in unserem Fall? Wir machten 100.000 Schritte und haben die letzten 10.000 Konfigurationen genommen, um die posterior Verteilung zu representieren. DVG Fachtagung, 5-7. September 2007, München 13/22 Biometeorologie & Mathematische Epidemiologie Gruppe Das erweiterte Modell: Details • Vier Modellparameter wurden zur Analyse ausgewählt mit Gleichverteilung als prior Verteilung Parameter Infektionsrate Vogel → Mücke Infektionsrate Mücke → Vogel Überwinternde Mücken (pro Vogel) Kapazität der Mückenlarven (pro Vogel) Bereich (0.05, 0.5) (0.5, 1) (0.5, 2) (5,150) • Die anderen Parameter blieben fest (nach der Literatur eingestellt). DVG Fachtagung, 5-7. September 2007, München 14/22 Biometeorologie & Mathematische Epidemiologie Gruppe • Vermehrungsrate der Vögel wurde randomisiert durch Multiplikation mit gleichverteilten Zufallszahlen zwischen 0.9 und 1.1 (±10%). • Temperaturdaten wurden randomisiert durch Addition normalverteilter Zufallszahlen (µ=0, σ =1.25, σ geschätzt aus der Temperaturdaten von 12 Wetterstationen). • MCMC Methode wurde angewendet mit 100.000 Simulationsschritten. Ergebnisse sind auf den letzten 10.000 Schritten basiert. (Konvergenz wurde überprüft durchs Vergleichen der posterior Verteilungen aus den letzten, vorletzten und vorvorletzten 10.000 Schritte.) • Das Modell wurde in FORTRAN implementiert, die Analysen mit R gemacht. DVG Fachtagung, 5-7. September 2007, München 15/22 Biometeorologie & Mathematische Epidemiologie Gruppe 0.178 Posterior Median: 0.175 95% Vertrauensintervall: 1500 0 1500 (0.05,0.5) Posterior Mittelwert: (0.129,0.237) 0.25 0.05 0.15 0.25 Vorvorletzte 10000 0 1500 3500 Bereich der prior Gleichverteilung: 0.125 0.15 Vorletzte 10000 Frequency Wert im Ausgangsmodell: 0.05 0 Parameter: Infektionswahrscheinl. Vogel → Mücke (falls eine empfängliche Mücke einen infektiösen Vogel sticht) Frequency Ergebnisse Frequency Letzte 10000 0.05 DVG Fachtagung, 5-7. September 2007, München 0.15 0.25 16/22 Biometeorologie & Mathematische Epidemiologie Gruppe 1500 1 0.750 (0.601,0.903) 1.0 1500 Posterior Median: 0.9 0 0.750 0.8 0.5 0.6 0.7 0.8 0.9 1.0 Vorvorletzte 10000 1500 Posterior Mittelwert: 0.7 0 (0.5,1) 0.6 Vorletzte 10000 Frequency Bereich der prior Gleichverteilung: 95% Vertrauensintervall: 0.5 Frequency Wert im Ausgangsmodell: 0 Parameter: Infektionswahrscheinl. Mücke → Vogel (falls eine infektiöse Mücke einen empfänglichen Vogel sticht) Frequency Letzte 10000 0.5 DVG Fachtagung, 5-7. September 2007, München 0.6 0.7 0.8 0.9 1.0 Biometeorologie & Mathematische Epidemiologie Gruppe 1.36 Posterior Median: 1.37 1500 1.5 2.0 1500 Vorletzte 10000 0 (0.5,2) Posterior Mittelwert: 0.5 1.0 1.5 2.0 Vorvorletzte 10000 (1.03,1.73) Frequency 95% Vertrauensintervall: 0 1 1.0 1500 Bereich der prior Gleichverteilung: 0.5 0 Wert im Ausgangsmodell: Frequency Parameter: Überwinternde Mücken (pro Vogel) (Anzahl der Mücken pro Vogel, die den Winter überleben) Letzte 10000 Frequency 17/22 0.5 DVG Fachtagung, 5-7. September 2007, München 1.0 1.5 2.0 18/22 Biometeorologie & Mathematische Epidemiologie Gruppe 100 15.9 Posterior Median: 15.6 95% Vertrauensintervall: (9.4,22.9) 20 25 30 1500 0 5 10 15 20 25 30 Vorvorletzte 10000 2500 Posterior Mittelwert: 15 0 1000 (5,150) 10 Vorletzte 10000 Frequency Bereich der prior Gleichverteilung: 5 Frequency Wert im Ausgangsmodell: 0 1000 Parameter: Kapazität der Larven (pro Vogel) (Umweltkapazität der Mückenlarven, d.h. maximale Anzahl der Larven pro Vogel) Frequency Letzte 10000 5 DVG Fachtagung, 5-7. September 2007, München 10 15 20 25 30 19/22 Biometeorologie & Mathematische Epidemiologie Gruppe Schätzung der Zuverlässigkeit der Ergebnisse Mit den posterior Verteilungen der Modellparameter kann man weiter simulieren, um die Variabilität der Modellergebnisse zu entdecken. (Graph basiert auf 10.000 Simulationen) DVG Fachtagung, 5-7. September 2007, München 20/22 Biometeorologie & Mathematische Epidemiologie Gruppe Weitere Aufgaben: • Ähnliche Analyse der anderen Modellparameter • Anwendung von verfeinerten Methoden zur Überprüfung der Konvergenz der MCMC Methode • Anwendung der Methoden für die amerikanischen WNV Daten DVG Fachtagung, 5-7. September 2007, München 21/22 Biometeorologie & Mathematische Epidemiologie Gruppe Freitag 11:20 Katharina Brugger - Franz Rubel: Flavivirus Epidemien im Licht der globalen Klimaerwärmung DVG Fachtagung, 5-7. September 2007, München 22/22 Biometeorologie & Mathematische Epidemiologie Gruppe Freitag 11:20 Katharina Brugger - Franz Rubel: Flavivirus Epidemien im Licht der globalen Klimaerwärmung Danke für Ihre Aufmerksamkeit! DVG Fachtagung, 5-7. September 2007, München