Blatt 8

Werbung
Dr. Kay Nieselt
Mathematisch-Naturwissenschaftliche Fakultät
Zentrum für Bioinformatik Tübingen
Vorlesung: Einführung in die Bioinformatik
SoSe 2011
Übungsblatt Nr. 8
Gut vernetzt hält besser: Analyse biologischer Netzwerke
Elektronische Abgabe an: [email protected]
1. Definitionen
Definieren Sie folgende Begriffe in eigenen Worten oder formal und geben Sie Beispielgraphen
an.
• Subgraph
• Zyklus
• Induzierter Subgraph
• Gerichteter Zyklus
• Aufspannender Subgraph
• Baum
• Zusammenhängender Graph
• Spannbaum
• Zusammenhangskomponente
• Netzwerk
• Starke Zusammenhangskomponente
2. PPI - Protein-Protein Interaktion
(a) Der erste Schritt in der Suche nach Komplexen, ist die Beschaffung der Rohdaten. Gesucht sind dabei Proteine, die in irgendeiner Weise miteinander interagieren. Experimentelle Methoden erlauben es solche Proteine zu bestimmen. Informieren Sie sich über die
beiden Methoden Yeast Two Hybrid (Y2H) und Tandem Affinity Purification (TAP).
Erläutern sie kurz deren Funktionsweise und nennen Sie Vor- und Nachteile dieser beiden
Methoden.
(b) Es soll nun nach Protein-Protein Interaktionen in der STRING1 Datenbank gesucht
werden.
i. Gegeben ist das Protein Phenylalanine hydroxylase (Homo sapiens), versuchen Sie
die Interaktionspartner in der STRING Datenbank zu finden. Listen Sie alle Interaktionspartner mit einem Score > 0.900 aus Ihrem Suchergebnis auf. Wieviele PPI
sind mit experimentellen Methoden detektiert? Welche PPI hat den höchsten Score?
ii. Verwenden Sie die Proteine mit der höchsten Konfidenz (Score > 0.900) unter
Berücksichtigung aller Vorhersagemethoden und berechnen sie die Gradverteilung
2n
(P (k)) und den Clusterkoeffizient (C). Der Clusterkoeffizient ist k(k−1)
, n ist die
Anzahl der Links, die die Nachbarn des zu untersuchenden Knotens verbindet.
1
STRING: http://string-db.org/
3. KEGG: Kyoto Encyclopedia of Genes and Genomes
Machen Sie sich mit dem KEGG-System2 vertraut. Suchen Sie dazu Informationen zum Stoffwechselweg der Glykolyse.
(a) In welchen Organismen ist dieser Stoffwechselweg beschrieben?
(b) Wie viele biochemische Reaktionen sind in diesem Stoffwechselweg bekannt?
(c) Welche Enzyme überschneiden sich bei der Glykolyse zwischen Mensch und der AckerSchmalwand (Arabidopsis thaliana).
4. Anwendung molekularbiologischer Datenbanken
Ein Kind kommt in die Praxis und hat einen schweren geistigen Defekt (mental retardation). Zudem leidet es an epileptischen Anfällen (seizures) und ist auch oft sehr übererregt
(irritability). Dem Arzt fällt auf, dass das Kind Pigmentstörungen auf der Haut und einen
unangenehmen Geruch wie Mäusekot (mouse odor) hat. Der Arzt nimmt an, dass es sich
bei der Krankheit um eine Erbkrankheit handeln könnte, da die Tante des Kindes ähnliche
Symptome aufgewiesen hat.
(a) Um welche Krankheit kann es sich bei diesem Kind handeln und wie kann das überprüft
werden? Geben Sie außerdem an, um welches Gen bzw. das daraus resultierende Protein
es sich handelt. Wie lautet dessen EC Nummer? Nutzen Sie zur Lösung dieser Aufgabe
OMIM3 .
(b) Die Frage ist nun, welche biochemische Reaktion durch dieses Enzym katalysiert wird
und in welchem biochemischen Pathway es benötigt wird. Suchen Sie dazu in der KEGG
Datenbank nach der EC Nummer des gefundenen Enzyms. Was bedeutet es, wenn dieses
Enzym nicht funktionell ist, d.h. die Reaktion nicht katalysiert?
2
3
KEGG: http://www.genome.ad.jp/kegg/kegg2.html
OMIM: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM
Herunterladen