Softwarewerkzeuge der Bioinformatik SS 2009 Übungen Sequenzanalyse 1: Biologische Datenbanken 1. Logge Dich mit Benutzername und Password ein. Öffne über den Button links unten bzw. oben Internet – Firefox und gehe auf die NCBI-Seite (http://www.ncbi.nlm.nih.gov/). Suche mit Entrez das Protein Cytochrom C in der Isoform c1 mit der UniProtKB/swissprot-Zugangsnummer (accession) P00044, das aus der Bäckerhefe (Saccharomyces cerevisiae) stammt. a) Was ist die Funktion dieses Proteins? In welchem Zellkompartiment ist es zu finden? Wie heißt das zugehörige Gen? Lasse Dir die Proteinsequenz im FASTA- Format anzeigen und speichere sie. Ein Textverarbeitungsprogramm findest Du z.B. unter Office – OpenOffice Writer. b) Öffne den link zum Eintrag des Proteins in der Datenbank UniProtKB in einem neuen Tab oder Fenster. Zu welcher Proteinfamilie ( PFAM) gehört das Protein? Folge – wieder in einem neuen Tab oder Fenster – dem link zu PRINTS. Wieviele PRINTS-Motive gibt es und aus wievielen Proteinen wurden die Motive ursprünglich erstellt? Hat das Protein P00044 alle Motive? (Tipp: Textsuche mit der Bezeichnung, die in Klammern neben der Zugangsnummer bei UniProtKB zu finden ist.) Versuche, ein Motiv in der gespeicherten Sequenz wiederzufinden. 2. Suche bei UniProtKB das Protein mit der accession P00042. Von welchem Organismus stammt es? Was hat es mit dem Protein aus Aufgabe 1 gemeinsam? 3. Finde mit der Stichwortsuche von Entrez Proteine, die für die Tetracyclin-Resistenz (tetracycline resistance) von Bacillus subtilis verantwortlich sind, indem sie als Antiporter den Efflux des Antibiotikums steigern. Versuche, möglichst wenige und spezifische Treffer zu erzielen. Welche beiden Einträge aus der UniProtKB sind die richtigen? Wo findest Du die Nukleotidsequenzen der zugehörigen Gene? Vergiss nicht, Dich am Ende auszuloggen ;)