Offener Zugang zu Arznei-Infos Bei der Medikamenten-Entwicklung müssen enorme Datenmengen verarbeitet werden. Die neue Plattform verknüpft das Wissen von hunderten Datenbanken, um die Arzneimittel-Forschung zu vereinfachen. Die Entwicklung neuer Medikamente dauert im Schnitt zehn Jahre. Da will man als Forscher zu Beginn einer solchen Entwicklung nicht Monate investieren, um die Arznei und ihre Wirkung mühsam in hunderten Datenbanken zu recherchieren. „Es gibt unzählige frei zugängliche Datenbanken, in der man Substanzen, Gene, Proteine etc. nachschlagen kann. Wir ertrinken quasi in Informationen“, sagt Gerhard F. Ecker, Leiter der Forschungsgruppe Pharmako-Informatik an der Uni Wien: „Man kann etwa nach Informationen suchen, welche chemischen Verbindungen lebertoxisch sind oder wie eine Lebertoxizität entstehen kann. Doch jede Datenbank basiert auf einem anderen Format.“ Daher konnten die Forscher bisher nur ihre Suchanfrage hundertfach in diese Register eintippen und dann die Ergebnisse langwierig sichten: Vieles war doppelt und dreifach da, andere Infos fand man gar nicht. „Vor einigen Jahren hat die Innovative Medicine Initiative, IMI, eine Public-PrivatePartnership der EU mit der Pharmaindustrie, eine Analyse gemacht, wo es in der ArzneistoffEntwicklung wirklich hapert“, erzählt Ecker. Man wollte wissen, wo man „präkompetitiv“ zusammenarbeiten kann, ohne dass sich die Pharmafirmen gegenseitig ihre Erfindungen stehlen. Immerhin sind unter dem Dachverband der europäischen Pharmaindustrie EFPIA alle großen Player vereint. Im aktuellen Projekt sind nun 22 Partner, davon 14 europäische Universitäten und Firmen wie Pfizer, GlaxoSmithKline, Novartis, AstraZeneca, und Merck vertreten. „Eines der Dinge, die verbesserungswürdig sind, ist das Knowledge-Management“, weiß Ecker: „Jede Pharmafirma muss bisher intern selbst die Informationen aus hunderten Datenbanken verknüpfen.“ Das Projekt Open-Phacts soll diese Lücke schließen: „Wir wollen keine Superdatenbank sein, sondern die bisherigen Datenbanken bleiben, wo sie sind. Unser Konzept ist, einen Triple-Store zu etablieren.“ Was gibt es denn in einem „TripleGeschäft“? „Triples sind Kernaussagen, die aus drei semantischen Teilen bestehen, also Subjekt, Prädikat und Objekt“, sagt Ecker: „Solche Suchen sind in der Bioinformatik schon üblich, bei Datenbanken mit chemischen Verbindungen aber nicht.“ Ein klassisches Triple wäre demnach: „Malaria (Subjekt) wird übertragen (Prädikat) von Stechmücken (Objekt)“. Diese Information findet man mehr als fünftausendmal in verschiedensten Variationen in der Litrératur, im Triple Store wäre sie dann nur mehr einmal enthalten. Das alleine führt schon zu einer deutlichen Reduktion der Informationsflut. Eigentliches Ziel des Projektes sind jedoch Fragen wie "Gib mir alle Substanzen die mit Lebertoxizität in Verbindung gebracht werden und deren Aktivität auf alle Transportproteine, die in der Leber vorkommen". Solch komplexe Anfragen kann man bisher kaum in wissenschaftliche Datenbanken eintippen – darum findet man auch schwer das Wissen, das rund um das Thema verfügbar ist. Bei chemischen Verbindungen stehen zusätzlich auch quantitative Informationen im Vordergrund: Welche Kennwerte bzw. Dosis diese oder jene Substanz hat. „Open-Phacts soll nun sowohl qualitative wie auch quantitative Informationen bieten, hier werden Literatur-, Chemie- und Bioinformatikdatenbanken verknüpft.“ Das Team um Ecker arbeitet nun an der Erstellung der „Triple-Wörterbücher“: Als Hauptwörter dienen etwa: Malaria, Alzheimer, Substanz A, Protein B, Gen C etc. Die Wörterbücher für die Zeitwörter sind: wird aktiviert, wird übertragen, ist löslich, ist inaktiv usw. „Dabei haben wir das große und eigentlich unlösbare Problem der Nomenklatur-Standards. Während vor 30, 40 Jahren noch ein Monopol vorgab, wie Verbindungen benannt werden, gibt es das heute nicht mehr“, sagt Ecker. In seinem Forschungsbereich heißt z.B. ein- und dasselbe Protein in einer Datenbank p-Glykoprotein, in einer anderen ABCB1 und in noch einer anderen Benennung MDR1. „Wir brauchen nun ein Wörterbuch, das uns sagt, dass alle diese Namen dasselbe Protein bezeichnen.“ Wichtig ist den Betreibern, dass Open-Phacts all das kann und offen für jeden zugänglich ist: „Schickt man die Suchanfrage an unser System, so holt es die Informationen aus allen verknüpften Datenbanken und liefert eine Antwort – und nicht hundert verschiedene Antworten.“ Die Hoffnung ist, dass dieser Open-Access-, Open-Source-Ansatz das Projekt permanent wachsen lässt – ähnlich wie beim Open-Source-Vorzeigeprojekt Linux. „Die Community arbeitet ständig daran und es muss auch möglich ein, dass Firmen damit Geld machen können.“ Ecker schweben etwa Start-Up-Unternehmen vor, die den großen Pharmafirmen anbieten, deren Suche zu übernehmen: „Also Spezialisten, die genau nach dem suchen, was die Industrie braucht, und dafür komplette Geheimhaltung garantieren. Sonst würde ja kein Pharmaunternehmen nach chemischen Verbindungen suchen, wenn dann jeder erfährt, woran die momentan interessiert sind.“ Klappt in dem dreijährigen Projekt alles, dann müssten in Zukunft die Anbieter von Datenbanken „scharf drauf sein, ihre Daten mit Open-Phacts zu verknüpfen“, so Ecker: „Auch kommerzielle Anbieter.“ Denn auch an so einem Modell wird gerade gearbeitet, dass die Suchmaschine dann als Information ausspuckt: „Zu dieser Frage wurden 7000 Treffer in Open-Access-Datenbanken gefunden. Weitere 2000 Treffe finden Sie in kostenpflichtigen Datenbanken, wenn Sie Zugang möchten geben sie bitte hier Ihre Kreditkartennummer ein.“ Oder so ähnlich. „Jedoch machen uns zur Zeit schon die Lizenzen der frei zugänglichen Datenbanken zu schaffen: Jede hat ein eigenes Lizenzmodell, wie die Informationen verarbeitet werden dürfen. Denn auch bei Open-Access darf man nicht mit den Ergebnissen machen, was man will.“ Info: EU-Projekt Die Europäische Kommission ist mit der Pharmaindustrie eine „Public-Private-Partnership“ eingegangen, die sich „Innovative Medicines Initiative“ (IMI) nennt. Die Pharmafirmen geben in den Projekten vor, wie viel Geld sie in die Forschung investieren, woraufhin die EU das Geld für die Forschungsförderung verdoppelt. Open-Phacts vereint ein Konsortium von 22 Partner (europäische Universitäten und Pharmafirmen) und agiert mit einem Gesamtvolumen von 16 Millionen Euro. Damit zählt es zu den größten laufenden Drittmittelprojekten der Uni Wien, deren Forschungsgruppe Pharmako-Informatik der Fakultät für Lebenswissenschaften die Koordination inne hat. Die erste Rohversion der Arzneitmittel-Suchmaschine Open-Phacts soll laut Plan in einem Jahr online gestellt werden.