Softwarewerkzeuge der Bioinformatik SS 2009 Übungen

Softwarewerkzeuge der Bioinformatik SS 2009
Übungen Sequenzanalyse 1: Biologische Datenbanken
1. Logge Dich mit Benutzername und Password ein. Öffne über den Button links unten bzw. oben
Internet – Firefox und gehe auf die NCBI-Seite (http://www.ncbi.nlm.nih.gov/). Suche mit Entrez
das Protein Cytochrom C in der Isoform c1 mit der UniProtKB/swissprot-Zugangsnummer
(accession) P00044, das aus der Bäckerhefe (Saccharomyces cerevisiae) stammt.
a) Was ist die Funktion dieses Proteins? In welchem Zellkompartiment ist es zu finden? Wie heißt
das zugehörige Gen? Lasse Dir die Proteinsequenz im FASTA- Format anzeigen und speichere sie.
Ein Textverarbeitungsprogramm findest Du z.B. unter Office – OpenOffice Writer.
b) Öffne den link zum Eintrag des Proteins in der Datenbank UniProtKB in einem neuen Tab oder
Fenster. Zu welcher Proteinfamilie ( PFAM) gehört das Protein? Folge – wieder in einem neuen Tab
oder Fenster – dem link zu PRINTS. Wieviele PRINTS-Motive gibt es und aus wievielen Proteinen
wurden die Motive ursprünglich erstellt? Hat das Protein P00044 alle Motive? (Tipp: Textsuche mit
der Bezeichnung, die in Klammern neben der Zugangsnummer bei UniProtKB zu finden ist.)
Versuche, ein Motiv in der gespeicherten Sequenz wiederzufinden.
2. Suche bei UniProtKB das Protein mit der accession P00042. Von welchem Organismus stammt es?
Was hat es mit dem Protein aus Aufgabe 1 gemeinsam?
3. Finde mit der Stichwortsuche von Entrez Proteine, die für die Tetracyclin-Resistenz (tetracycline
resistance) von Bacillus subtilis verantwortlich sind, indem sie als Antiporter den Efflux des
Antibiotikums steigern. Versuche, möglichst wenige und spezifische Treffer zu erzielen. Welche
beiden Einträge aus der UniProtKB sind die richtigen? Wo findest Du die Nukleotidsequenzen der
zugehörigen Gene?
Vergiss nicht, Dich am Ende auszuloggen ;)