Bayes-Analyse eines dynamischen Modells für die Epidemiologie

Werbung
1/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Bayes-Analyse eines dynamischen Modells
für die Epidemiologie des USUTU Virus
Jenı Reiczigel1,2, Katharina Brugger1, Franz Rubel1
1
Department für Naturwissenschaften,
Veterinärmedizinische Universität Wien
2
Szent István Universität,
Veterinärmedizinische Fakultät, Budapest
[email protected]
DVG Fachtagung, 5-7. September 2007, München
2/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Die Krankheit
Das USUTU-Virus:
• mit dem West Nil Virus verwandt
• übertragen durch Stechmücke
• betrifft Vögel, v.a. Amseln
• erschien in Austria in 2001
Die Beobachtungsdaten:
• Monitoring in Ost-Österreich
• 2001 bis 2005
Juli, Aug, Sep
60
40
20
0
• Gesamtanzahl:
138 infizierte Vögel
J A S
2001
DVG Fachtagung, 5-7. September 2007, München
J A S
2002
J A S
2003
J A S
2004
J A S
2005
3/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Das Ausgangsmodell
• Rubel et al. (2007)* haben ein Arbovirus-Modell zur
Erklärung der West Nil Virus (WNV) und Usutu Virus
(USUV) Dynamik entwickelt.
*submitted to Preventive Veterinary Medicine
• Das Modell ist vom Typ SEIR (Susceptible-InfectedInfectious-Recovered) mit 9 Kompartimenten, davon 4 für
Moskitos und 5 für Vögel.
• Dementsprechend wird das Modell mit einem System von
9 Differentialgleichungen beschrieben.
DVG Fachtagung, 5-7. September 2007, München
4/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Diagramm des Modells
DVG Fachtagung, 5-7. September 2007, München
5/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Die Modellparameter wurden aus der Literatur abgeschätzt
(Raten: pro Tag und Kopf)
Geburtenrate (Vögel)
Jahreszeit-abhängig
Geburtenrate (Mückenlarven)
temperaturabhängig
Natürliche Mortalitätsrate (Vögel)
0.0012
Mortalitätsrate zufolge USUV (Vögel)
0.3
Inkubationszeit des Virus (in Vögel)
1.5 Tag
Inkubationszeit des Virus (in Mücken) temperaturabhängig
und so weiter…
DVG Fachtagung, 5-7. September 2007, München
6/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Motivation für Erweiterung des Modells
1. Parameter eines deterministischen Modells sind feste
Werte, aber der zu analysierende epidemiologische
Prozess hat immanente stochastische Komponente:
• Anzahl der gefundenen infizierten Vögel
• Tagestemperaturwerte
• Modellparameter, z.B. Vermehrungsraten, Sterberaten, usw. (Vogel- und Mückepopulationen sind
heterogen, bestehend aus Subpopulationen)
2. Ergebnisse sind auch feste Werte, aber man interessiert
sich für die Zuverlässigkeit der Ergebnisse: möchte
Standardfehler, Vertrauensintervalle, usw. für Parameter
und Vorhersage angeben.
DVG Fachtagung, 5-7. September 2007, München
7/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Das erweiterte, stochastische Modell
Basierend auf diesem Modell haben wir ein hierarchisches
Bayes-Modell aufgebaut: auf jeder Ebene des Modells
haben wir stochastische Komponenten eingeführt:
• einige Modellparameter haben wir randomisiert,
• auch die Temperaturdaten haben wir randomisiert,
• die Anzahl der toten Vögel haben wir mit einer Poissonverteilten Variable modelliert, deren Mittelwert aus dem
Modell kommt.
(Details später)
DVG Fachtagung, 5-7. September 2007, München
8/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Bayes-Analyse eines stochastischen Modells
In einem Bayes-Modell sind die zu untersuchenden
Parameter Zufallsvariablen, die man mit Hilfe von
Wahrscheinlichkeitsverteilungen charakterisiert.
• Man hat eine Vorstellung über den zu untersuchenden
Parameter schon vor der Beobachtung der Daten: das
wird die prior Verteilung genannt.
• Die Beobachtung der Daten kann diese Vorstellung
verändern: diese veränderte Vorstellung wird in der
posterior Verteilung verkörpert.
DVG Fachtagung, 5-7. September 2007, München
9/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Beispiel für die prior und posterior Verteilung
Parameter: Infektionswahrscheinlichkeit Vogel → Mücke
(falls eine empfängliche Mücke einen infektiösen Vogel sticht)
Prior Verteilung: Gleichverteilung im Bereich [0,1]
Geschätzte posterior Verteilung:
(Histogramm basiert auf 10.000 simulierten Werten)
Interpretation: die Information in den Beobachtungsdaten
hat die Unsicherheit hinsichtlich des Parameters vermindert!
DVG Fachtagung, 5-7. September 2007, München
10/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Bayes’sche Punkt- und Intervallschätzung
• posterior Mittelwert (posterior mean)
• posterior Median
• 90, 95%, 99% posterior Intervall oder Vertrauensintervall
(posterior interval, credible interval)
Im vorigen Beispiel:
Posterior MW = 0.178
Posterior Median = 0.175
90% posterior Intervall: (0.137, 0.227)
95%
(0.119, 0.236)
99%
(0.103, 0.266)
DVG Fachtagung, 5-7. September 2007, München
11/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Analyse durch Computersimulation: die MCMC
(Markov Chain Monte Carlo) Methode
Wenn das Modell zu komplex ist, ist die analytische
Berechnung der posterior Verteilung zu kompliziert.
Lösung: Computersimulation.
Grundidee der MCMC:
• Man konstruiert eine Markov-Kette, deren stationäre
Verteilung die posterior Verteilung ist (es gibt
verschiedene Methode dafür) und generiert eine lange
Reihe von Kettenglieder
• Nach einer anfänglichen transienten Periode folgen die
Kettenglieder die posterior Verteilung
DVG Fachtagung, 5-7. September 2007, München
12/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Was bedeutet die „Markov-Kette“ in unserem Fall?
Wir machten 100.000 Schritte und haben die letzten 10.000
Konfigurationen genommen, um die posterior Verteilung zu
representieren.
DVG Fachtagung, 5-7. September 2007, München
13/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Das erweiterte Modell: Details
• Vier Modellparameter wurden zur Analyse ausgewählt
mit Gleichverteilung als prior Verteilung
Parameter
Infektionsrate Vogel → Mücke
Infektionsrate Mücke → Vogel
Überwinternde Mücken (pro Vogel)
Kapazität der Mückenlarven (pro Vogel)
Bereich
(0.05, 0.5)
(0.5, 1)
(0.5, 2)
(5,150)
• Die anderen Parameter blieben fest (nach der Literatur
eingestellt).
DVG Fachtagung, 5-7. September 2007, München
14/22
Biometeorologie & Mathematische Epidemiologie Gruppe
• Vermehrungsrate der Vögel wurde randomisiert durch
Multiplikation mit gleichverteilten Zufallszahlen zwischen
0.9 und 1.1 (±10%).
• Temperaturdaten wurden randomisiert durch Addition
normalverteilter Zufallszahlen (µ=0, σ =1.25, σ geschätzt
aus der Temperaturdaten von 12 Wetterstationen).
• MCMC Methode wurde angewendet mit 100.000
Simulationsschritten. Ergebnisse sind auf den letzten
10.000 Schritten basiert. (Konvergenz wurde überprüft
durchs Vergleichen der posterior Verteilungen aus den
letzten, vorletzten und vorvorletzten 10.000 Schritte.)
• Das Modell wurde in FORTRAN implementiert, die
Analysen mit R gemacht.
DVG Fachtagung, 5-7. September 2007, München
15/22
Biometeorologie & Mathematische Epidemiologie Gruppe
0.178
Posterior Median:
0.175
95% Vertrauensintervall:
1500
0
1500
(0.05,0.5)
Posterior Mittelwert:
(0.129,0.237)
0.25
0.05
0.15
0.25
Vorvorletzte 10000
0 1500 3500
Bereich der prior
Gleichverteilung:
0.125
0.15
Vorletzte 10000
Frequency
Wert im Ausgangsmodell:
0.05
0
Parameter:
Infektionswahrscheinl. Vogel → Mücke
(falls eine empfängliche Mücke
einen infektiösen Vogel sticht)
Frequency
Ergebnisse
Frequency
Letzte 10000
0.05
DVG Fachtagung, 5-7. September 2007, München
0.15
0.25
16/22
Biometeorologie & Mathematische Epidemiologie Gruppe
1500
1
0.750
(0.601,0.903)
1.0
1500
Posterior Median:
0.9
0
0.750
0.8
0.5
0.6
0.7
0.8
0.9
1.0
Vorvorletzte 10000
1500
Posterior Mittelwert:
0.7
0
(0.5,1)
0.6
Vorletzte 10000
Frequency
Bereich der prior
Gleichverteilung:
95% Vertrauensintervall:
0.5
Frequency
Wert im Ausgangsmodell:
0
Parameter:
Infektionswahrscheinl. Mücke → Vogel
(falls eine infektiöse Mücke einen
empfänglichen Vogel sticht)
Frequency
Letzte 10000
0.5
DVG Fachtagung, 5-7. September 2007, München
0.6
0.7
0.8
0.9
1.0
Biometeorologie & Mathematische Epidemiologie Gruppe
1.36
Posterior Median:
1.37
1500
1.5
2.0
1500
Vorletzte 10000
0
(0.5,2)
Posterior Mittelwert:
0.5
1.0
1.5
2.0
Vorvorletzte 10000
(1.03,1.73)
Frequency
95% Vertrauensintervall:
0
1
1.0
1500
Bereich der prior
Gleichverteilung:
0.5
0
Wert im Ausgangsmodell:
Frequency
Parameter:
Überwinternde Mücken (pro Vogel)
(Anzahl der Mücken pro Vogel, die
den Winter überleben)
Letzte 10000
Frequency
17/22
0.5
DVG Fachtagung, 5-7. September 2007, München
1.0
1.5
2.0
18/22
Biometeorologie & Mathematische Epidemiologie Gruppe
100
15.9
Posterior Median:
15.6
95% Vertrauensintervall:
(9.4,22.9)
20
25
30
1500
0
5
10
15
20
25
30
Vorvorletzte 10000
2500
Posterior Mittelwert:
15
0 1000
(5,150)
10
Vorletzte 10000
Frequency
Bereich der prior
Gleichverteilung:
5
Frequency
Wert im Ausgangsmodell:
0 1000
Parameter:
Kapazität der Larven (pro Vogel)
(Umweltkapazität der Mückenlarven, d.h.
maximale Anzahl der Larven pro Vogel)
Frequency
Letzte 10000
5
DVG Fachtagung, 5-7. September 2007, München
10
15
20
25
30
19/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Schätzung der Zuverlässigkeit der Ergebnisse
Mit den posterior Verteilungen der Modellparameter kann
man weiter simulieren, um die Variabilität der Modellergebnisse zu entdecken.
(Graph basiert auf 10.000 Simulationen)
DVG Fachtagung, 5-7. September 2007, München
20/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Weitere Aufgaben:
• Ähnliche Analyse der anderen Modellparameter
• Anwendung von verfeinerten Methoden zur Überprüfung
der Konvergenz der MCMC Methode
• Anwendung der Methoden für die amerikanischen WNV
Daten
DVG Fachtagung, 5-7. September 2007, München
21/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Freitag 11:20
Katharina Brugger - Franz Rubel:
Flavivirus Epidemien im Licht der globalen
Klimaerwärmung
DVG Fachtagung, 5-7. September 2007, München
22/22
Biometeorologie & Mathematische Epidemiologie Gruppe
Freitag 11:20
Katharina Brugger - Franz Rubel:
Flavivirus Epidemien im Licht der globalen
Klimaerwärmung
Danke für Ihre Aufmerksamkeit!
DVG Fachtagung, 5-7. September 2007, München
Herunterladen