Titel - Open PHACTS

Werbung
Offener Zugang zu Arznei-Infos
Bei der Medikamenten-Entwicklung müssen enorme Datenmengen verarbeitet werden.
Die neue Plattform verknüpft das Wissen von hunderten Datenbanken, um die
Arzneimittel-Forschung zu vereinfachen.
Die Entwicklung neuer Medikamente dauert im Schnitt zehn Jahre. Da will man als Forscher
zu Beginn einer solchen Entwicklung nicht Monate investieren, um die Arznei und ihre
Wirkung mühsam in hunderten Datenbanken zu recherchieren. „Es gibt unzählige frei
zugängliche Datenbanken, in der man Substanzen, Gene, Proteine etc. nachschlagen kann.
Wir ertrinken quasi in Informationen“, sagt Gerhard F. Ecker, Leiter der Forschungsgruppe
Pharmako-Informatik an der Uni Wien: „Man kann etwa nach Informationen suchen, welche
chemischen Verbindungen lebertoxisch sind oder wie eine Lebertoxizität entstehen kann.
Doch jede Datenbank basiert auf einem anderen Format.“ Daher konnten die Forscher
bisher nur ihre Suchanfrage hundertfach in diese Register eintippen und dann die
Ergebnisse langwierig sichten: Vieles war doppelt und dreifach da, andere Infos fand man
gar nicht.
„Vor einigen Jahren hat die Innovative Medicine Initiative, IMI, eine Public-PrivatePartnership der EU mit der Pharmaindustrie, eine Analyse gemacht, wo es in der ArzneistoffEntwicklung wirklich hapert“, erzählt Ecker. Man wollte wissen, wo man „präkompetitiv“
zusammenarbeiten kann, ohne dass sich die Pharmafirmen gegenseitig ihre Erfindungen
stehlen. Immerhin sind unter dem Dachverband der europäischen Pharmaindustrie EFPIA
alle großen Player vereint. Im aktuellen Projekt sind nun 22 Partner, davon 14 europäische
Universitäten und Firmen wie Pfizer, GlaxoSmithKline, Novartis, AstraZeneca, und Merck
vertreten. „Eines der Dinge, die verbesserungswürdig sind, ist das Knowledge-Management“,
weiß Ecker: „Jede Pharmafirma muss bisher intern selbst die Informationen aus hunderten
Datenbanken verknüpfen.“ Das Projekt Open-Phacts soll diese Lücke schließen: „Wir wollen
keine Superdatenbank sein, sondern die bisherigen Datenbanken bleiben, wo sie sind.
Unser Konzept ist, einen Triple-Store zu etablieren.“ Was gibt es denn in einem „TripleGeschäft“? „Triples sind Kernaussagen, die aus drei semantischen Teilen bestehen, also
Subjekt, Prädikat und Objekt“, sagt Ecker: „Solche Suchen sind in der Bioinformatik schon
üblich, bei Datenbanken mit chemischen Verbindungen aber nicht.“ Ein klassisches Triple
wäre demnach: „Malaria (Subjekt) wird übertragen (Prädikat) von Stechmücken (Objekt)“.
Diese Information findet man mehr als fünftausendmal in verschiedensten Variationen in der
Litrératur, im Triple Store wäre sie dann nur mehr einmal enthalten. Das alleine führt schon
zu einer deutlichen Reduktion der Informationsflut. Eigentliches Ziel des Projektes sind
jedoch Fragen wie "Gib mir alle Substanzen die mit Lebertoxizität in Verbindung gebracht
werden und deren Aktivität auf alle Transportproteine, die in der Leber vorkommen". Solch
komplexe Anfragen kann man bisher kaum in wissenschaftliche Datenbanken eintippen –
darum findet man auch schwer das Wissen, das rund um das Thema verfügbar ist.
Bei chemischen Verbindungen stehen zusätzlich auch quantitative Informationen im
Vordergrund: Welche Kennwerte bzw. Dosis diese oder jene Substanz hat. „Open-Phacts
soll nun sowohl qualitative wie auch quantitative Informationen bieten, hier werden Literatur-,
Chemie- und Bioinformatikdatenbanken verknüpft.“ Das Team um Ecker arbeitet nun an der
Erstellung der „Triple-Wörterbücher“: Als Hauptwörter dienen etwa: Malaria, Alzheimer,
Substanz A, Protein B, Gen C etc. Die Wörterbücher für die Zeitwörter sind: wird aktiviert,
wird übertragen, ist löslich, ist inaktiv usw. „Dabei haben wir das große und eigentlich
unlösbare Problem der Nomenklatur-Standards. Während vor 30, 40 Jahren noch ein
Monopol vorgab, wie Verbindungen benannt werden, gibt es das heute nicht mehr“, sagt
Ecker. In seinem Forschungsbereich heißt z.B. ein- und dasselbe Protein in einer Datenbank
p-Glykoprotein, in einer anderen ABCB1 und in noch einer anderen Benennung MDR1. „Wir
brauchen nun ein Wörterbuch, das uns sagt, dass alle diese Namen dasselbe Protein
bezeichnen.“
Wichtig ist den Betreibern, dass Open-Phacts all das kann und offen für jeden zugänglich ist:
„Schickt man die Suchanfrage an unser System, so holt es die Informationen aus allen
verknüpften Datenbanken und liefert eine Antwort – und nicht hundert verschiedene
Antworten.“ Die Hoffnung ist, dass dieser Open-Access-, Open-Source-Ansatz das Projekt
permanent wachsen lässt – ähnlich wie beim Open-Source-Vorzeigeprojekt Linux. „Die
Community arbeitet ständig daran und es muss auch möglich ein, dass Firmen damit Geld
machen können.“ Ecker schweben etwa Start-Up-Unternehmen vor, die den großen
Pharmafirmen anbieten, deren Suche zu übernehmen: „Also Spezialisten, die genau nach
dem suchen, was die Industrie braucht, und dafür komplette Geheimhaltung garantieren.
Sonst würde ja kein Pharmaunternehmen nach chemischen Verbindungen suchen, wenn
dann jeder erfährt, woran die momentan interessiert sind.“
Klappt in dem dreijährigen Projekt alles, dann müssten in Zukunft die Anbieter von
Datenbanken „scharf drauf sein, ihre Daten mit Open-Phacts zu verknüpfen“, so Ecker:
„Auch kommerzielle Anbieter.“ Denn auch an so einem Modell wird gerade gearbeitet, dass
die Suchmaschine dann als Information ausspuckt: „Zu dieser Frage wurden 7000 Treffer in
Open-Access-Datenbanken gefunden. Weitere 2000 Treffe finden Sie in kostenpflichtigen
Datenbanken, wenn Sie Zugang möchten geben sie bitte hier Ihre Kreditkartennummer ein.“
Oder so ähnlich. „Jedoch machen uns zur Zeit schon die Lizenzen der frei zugänglichen
Datenbanken zu schaffen: Jede hat ein eigenes Lizenzmodell, wie die Informationen
verarbeitet werden dürfen. Denn auch bei Open-Access darf man nicht mit den Ergebnissen
machen, was man will.“
Info:
EU-Projekt
Die Europäische Kommission ist mit der Pharmaindustrie eine „Public-Private-Partnership“
eingegangen, die sich „Innovative Medicines Initiative“ (IMI) nennt. Die Pharmafirmen geben
in den Projekten vor, wie viel Geld sie in die Forschung investieren, woraufhin die EU das
Geld für die Forschungsförderung verdoppelt.
Open-Phacts vereint ein Konsortium von 22 Partner (europäische Universitäten und
Pharmafirmen) und agiert mit einem Gesamtvolumen von 16 Millionen Euro. Damit zählt es
zu den größten laufenden Drittmittelprojekten der Uni Wien, deren Forschungsgruppe
Pharmako-Informatik der Fakultät für Lebenswissenschaften die Koordination inne hat. Die
erste Rohversion der Arzneitmittel-Suchmaschine Open-Phacts soll laut Plan in einem Jahr
online gestellt werden.
Herunterladen