Universität Bielefeld Technische Fakultät AG Angewandte Informatik 10. Dezember 2004 Bachelorarbeit Arbeitsgebiet In unserer Arbeitsgruppe werden unter anderem die Wechselwirkungen von Proteinen untersucht. Dazu werden Algorithmen entwickelt, die das Docken von Proteinen vorhersagen. Neben den Erkenntnissen über die Interaktion und die Funktion der untersuchten Proteine wird das Proteindocking auch im Rahmen des Wirkstoffdesigns verwendet. Einen Überblick der momentanen Projekte im Bereich Proteindocking findest Du unter http://www.techfak.uni-bielefeld.de/ags/ai/projects/docking/welcome.html Thema: Automatische Generierung von Testdatensätzen für das Proteindocking In unserer Arbeitsgruppe wurde das Dockingsystem ElMaR entwickelt. Für die Entwicklung und das Testen von Dockingalgorithmen werden sog. Test Cases benötigt. Ein Test Case besteht immer aus einem Komplex (als Referenz) und zwei ungebundenen Proteinen. Die ungebundenen Proteine werden gedockt und anschließend für die Evaluation mit dem bekannten Komplex verglichen. Die benötigten Strukturdaten werden aus der Brookhaven Protein Databank (Pdb) bezogen. Da die Anzahl an kristallographierten Strukturen exponentiell wächst, muss die Erstellung von Test Cases automatisiert werden. Gefundene Test Cases werden in einer Datenbank gespeichert und sind über ein Webinterface weltweit verfügbar (siehe http://bibiserv. techfak.uni-bielefeld.de/agt-sdp/). Complex 2PTC E 2PTC I 1TLD 1BPI 2PTN 3PTN 6PTI Im Rahmen dieser Arbeit soll daher der schon bestehende Ansatz verbessert werden. Zum einen soll das entwickelte System robuster gemacht werden, so dass es in einer Produktionsumgebung eingesetzt werden kann. Zum anderen sollen weitere Verfahren für die Generierung von Test Cases umgesetzt werden. Zu weiteren Details dieser Bachelorarbeit frage einfach den unten stehenden Mitarbeiter! Voraussetzungen Das vorhandene System ist modularisiert. Die Module wurden in unterschiedlichsten Sprachen implementiert. Alle Daten werden in einer Datenbank gespeichert. Daher sind folgende Punkte wichtig: • Programmierkenntnisse in C/C++, Perl, Shellscripte • Kenntnisse im Bereich SQL/ Datenbanken, u.a. auch die Schnittstellen der Programmiersprachen • Bereitschaft zur Einarbeitung in das vorhandene System/ benötigten Programmiersprachen • Grundlegende Kenntnisse über den Aufbau von Proteinen • Bachelorstudium Bioinformatik und Genomforschung Kontakt Frank Zöllner Büro: M6-115 Tel: 106-2951 Mail: fzoellne@techfak. . .