Softwarewerkzeuge der Bioinformatik WS06/07 Übungen 1

Werbung
Softwarewerkzeuge der Bioinformatik WS06/07
Übungen 1: Datenbanken, SRS
1. Öffne über Deinen Webbrowser (mozilla) das Interface zu SRS (http://srs.ebi.ac.uk) und mache
Dich kurz mit dem Layout der Seite vertraut.
2. Quick Search: Suche die Proteinsequenz von Cytochrome c in der Iso-1 Form aus der Bäckerhefe
(Saccharomyces cerevisiae). Versuche nun unter Verwendung der Standard Query Form ein
eindeutiges Suchergebnis zu erzielen. (Beachte: Vor der Suche muss zunächst einmal eine
Datenbank ausgewählt werden. Welche ist zu bevorzugen?) Betrachte die Ausgabe und die
Einträge etwas näher.
3. Standard Query Form: Suche die Sequenz eines Proteins aus dem Organismus Bacillus subtilis,
das die Hydrolyse terminaler nicht-reduzierender Arabinofuranosid-Einheiten durchführt. Dieses
Enzym stammt vom Gen XSA. Verteile die Abfrage möglichst auf verschiedene Rubriken.
(Achtung: die Begriffe müssen natürlich auf Englisch sein.) Wie lautet der Proteinname?
4. Versuche das Gen zum Protein mit dem Entry name ABFA_BACSU aus Bacillus subtilis zu
finden. Für welches Protein codiert das Gen? Finde dann einen Eintrag aus der NukleotidsequenzDatenbank EMBL zu diesem Gen, in der auch das Gen aus Aufgabe 3 (XSA) auftaucht. Wie lauten
die jeweiligen Nukleotidsequenzen der beiden Gene?
5. Link: Rufe das Ergebnis aus Aufgabe 4 auf, indem Du auf den Tab Results klickst. Wähle den
Eintrag aus und verlinke ihn mit der Nukleotidsequenz-Datenbank EMBL (klicke auf den Button
„Link“ und wähle dann die jeweilige Datenbank aus). Dies wäre ein alternatives Verfahren, um an
die zugehörige Nukleotidsequenz zu gelangen. Warum bekommst Du aber 2 Ergebnisse und
welcher EMBL-Eintrag beinhaltet tatsächlich das Gen XSA? Schaue Dir dazu den Swiss-ProtEintrag des Proteins aus Aufgabe 4 noch mal genauer an.
6. Suche in SRS die Proteinsequenz mit der Accession Number P00042. Versuche von dieser Sequenz
zu einem Eintrag in der Datenbank PRINTS zu kommen. Welchen Eintrag findest Du? Schaue Dir
auch den Datenbankeintrag an.
7. Zu welcher Proteinfamilie (PFAMA) gehört das Protein aus Aufgabe 6? Wie viele Sequenzen aus
der Swiss-Prot-Datenbank gehören dieser Proteinfamilie an?
8. Weitere Übungen:
a. Suche in SRS nach dem Protein zum Gen APX1 aus dem Organismus Arabidopsis
thaliana. Notiere die Accession Number.
b. Suche nach einer Proteinstruktur (PDB) mit der ID 2PCC. Welche Proteinsequenzen
besitzt dieses Protein in der PDB-Datei und warum 2? Notiere die Accession Number.
c. Gehören die Proteinsequenzen aus a und b zur selben Proteinfamilie (PFAMA)?
Herunterladen