Dr. Kay Nieselt Mathematisch-Naturwissenschaftliche Fakultät Zentrum für Bioinformatik Tübingen Vorlesung: Einführung in die Bioinformatik SoSe 2011 Übungsblatt Nr. 8 Gut vernetzt hält besser: Analyse biologischer Netzwerke Elektronische Abgabe an: [email protected] 1. Definitionen Definieren Sie folgende Begriffe in eigenen Worten oder formal und geben Sie Beispielgraphen an. • Subgraph • Zyklus • Induzierter Subgraph • Gerichteter Zyklus • Aufspannender Subgraph • Baum • Zusammenhängender Graph • Spannbaum • Zusammenhangskomponente • Netzwerk • Starke Zusammenhangskomponente 2. PPI - Protein-Protein Interaktion (a) Der erste Schritt in der Suche nach Komplexen, ist die Beschaffung der Rohdaten. Gesucht sind dabei Proteine, die in irgendeiner Weise miteinander interagieren. Experimentelle Methoden erlauben es solche Proteine zu bestimmen. Informieren Sie sich über die beiden Methoden Yeast Two Hybrid (Y2H) und Tandem Affinity Purification (TAP). Erläutern sie kurz deren Funktionsweise und nennen Sie Vor- und Nachteile dieser beiden Methoden. (b) Es soll nun nach Protein-Protein Interaktionen in der STRING1 Datenbank gesucht werden. i. Gegeben ist das Protein Phenylalanine hydroxylase (Homo sapiens), versuchen Sie die Interaktionspartner in der STRING Datenbank zu finden. Listen Sie alle Interaktionspartner mit einem Score > 0.900 aus Ihrem Suchergebnis auf. Wieviele PPI sind mit experimentellen Methoden detektiert? Welche PPI hat den höchsten Score? ii. Verwenden Sie die Proteine mit der höchsten Konfidenz (Score > 0.900) unter Berücksichtigung aller Vorhersagemethoden und berechnen sie die Gradverteilung 2n (P (k)) und den Clusterkoeffizient (C). Der Clusterkoeffizient ist k(k−1) , n ist die Anzahl der Links, die die Nachbarn des zu untersuchenden Knotens verbindet. 1 STRING: http://string-db.org/ 3. KEGG: Kyoto Encyclopedia of Genes and Genomes Machen Sie sich mit dem KEGG-System2 vertraut. Suchen Sie dazu Informationen zum Stoffwechselweg der Glykolyse. (a) In welchen Organismen ist dieser Stoffwechselweg beschrieben? (b) Wie viele biochemische Reaktionen sind in diesem Stoffwechselweg bekannt? (c) Welche Enzyme überschneiden sich bei der Glykolyse zwischen Mensch und der AckerSchmalwand (Arabidopsis thaliana). 4. Anwendung molekularbiologischer Datenbanken Ein Kind kommt in die Praxis und hat einen schweren geistigen Defekt (mental retardation). Zudem leidet es an epileptischen Anfällen (seizures) und ist auch oft sehr übererregt (irritability). Dem Arzt fällt auf, dass das Kind Pigmentstörungen auf der Haut und einen unangenehmen Geruch wie Mäusekot (mouse odor) hat. Der Arzt nimmt an, dass es sich bei der Krankheit um eine Erbkrankheit handeln könnte, da die Tante des Kindes ähnliche Symptome aufgewiesen hat. (a) Um welche Krankheit kann es sich bei diesem Kind handeln und wie kann das überprüft werden? Geben Sie außerdem an, um welches Gen bzw. das daraus resultierende Protein es sich handelt. Wie lautet dessen EC Nummer? Nutzen Sie zur Lösung dieser Aufgabe OMIM3 . (b) Die Frage ist nun, welche biochemische Reaktion durch dieses Enzym katalysiert wird und in welchem biochemischen Pathway es benötigt wird. Suchen Sie dazu in der KEGG Datenbank nach der EC Nummer des gefundenen Enzyms. Was bedeutet es, wenn dieses Enzym nicht funktionell ist, d.h. die Reaktion nicht katalysiert? 2 3 KEGG: http://www.genome.ad.jp/kegg/kegg2.html OMIM: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM