Mittwoch, 24.04.2002 Name: Biochemisches Praktikum Kurstag: Angewandte Bioinformatik Protokoll An diesem Kurstag sollten grundlegende Kenntnisse im Umgang mit biologischen Datenbanken bzw. Literaturrecherche vermittelt werden. Darüber hinaus sollten die gewonnen Ergebnisse in geeigneten Programmen graphisch dargestellt werden. Teil 1 Datenbanken und Datenbankenabfragen 1.1 Stichwortsuche im Entrez-System des NCBI nach einem Enzym aus dem Organismus des Bacillus subtilis: Gefunden wurden zwei Enzyme. Die Alpha-L-arabinofuranosidase 1 (AN: P94531) bzw. die Alpha-L-arabinofuranosidase 2 (AN: P 94552) 1.2 Enzymsuche in der Nukleotiddatenbank: Dabei wurden zahlreiche Einträge, teilweise das ganze Genom des Bacillus subtilis, gefunden. Darunter war ein Operon, das sechs Proteine (darunter auch das Gesuchte, mit der Einschränkung „putative“) codiert, mit insgesamt 6811 Basenpaaren. Wenn man im DNA-Man die Basensequenz nach Proteinen abscannt, kann man die sechs Proteine als potentielle Open-reading-frames erkennen. 1.3 1.4 1.5 Suche nach dem selben Protein in verschiedenen Datenbanken (NCBI, EBI, SWISSPROT): In allen Datenbanken ist diese Protein unter derselben AN zu finden. 1.6 Nähere Betrachtung des TextEntry-Eintrags: Zwei Einträge, von denen der Ältere (1996) nur eine partielle Sequenzierung dokumentiert, und der Neuere (1997) eine Komplettsequenzierung darstellt. Angegeben sind jeweils die Namen der Autoren und Links zu Zusammenfassungen der Arbeiten. 1.7 SwissEntryAnsicht: Über den Link zur Zeitschrift Microbiology findet man genauere Informationen über die Autoren, das Projekt und die Zielsetzung der Arbeit, die zur Entschlüsselung dieser Gensequenz durchgeführt wurde. 1.8 Zwei Gene arf I und arf II, die zu Alpha-L-arabinofuranosidase 1 und 2 homolog sind, sollen nach ihrer Herkunft bestimmt werden: Die Recherche in der PubMed-Datenbank des NCBI ergab, dass es sich um Gene der Cytophaga xylanolytica, einem Bakterium der CFG Gruppe, handelt. Weitere homologe Gene haben auch: Bacteroides ovatus, Bacillus subtilis, Clostridium stercorarium 1.9 Suche nach Namensvettern in der PubMed-Datenbank: Zenneck: 3 Verwandte 1 Lueb: 2 mal Gesche: 36 mal Haas: 6710 Verwandte Teil 2: Datenbanksuchen mit Nukleotid- bzw. Proteinsequenzen sowie paarweise und multiple Sequenzvergleiche 2.1 Suche in der NCBI-Protein Datenbank nach einem Serotonin-Rezeptor des Menschen: Ergebnis, AN: P28223 2.2 BLAST-Suche mit dieser Sequenz nach ähnlichen Sequenzen im NCBI: Es wurden 102 ähnliche Sequenzen gefunden, die nach einem E-value geordnet sind. Je näher dieser E-value gegen Null geht, desto ähnlicher ist die Sequenz. Sieben human Alignments wurden gefunden. Aus der Grafik kann man erkennen, dass über dem gesamten Bereich des Proteins eine hohe Ähnlichkeit besteht. 2.3 Suche nach AN: AB037513 (anschließende Suche mittels blastn und blastx, allerdings nicht gegen die Drosophila-Genom-Datenbank): Unter blastn wurden 63 ähnliche Sequenzen gefunden, unter blastx 173. In blastn werden ähnliche Nukleotide in der Nukleotid-Datenbank verglichen, wobei sich dieses Verfahren für den Vergleich kurzer Sequenzen besonders eignet. Bei der blastxSuche wird das translatierte Nukleotid in der Protein-Datenbank gesucht. 2.4 Durchführung eines lokalen Alignments zweier Sequenzen mit blast2Sequences: Der humane Rezeptor und der homologe Rezeptor aus D.melanogaster weisen zwei ähnliche Bereiche auf, die auf die Serotonin-Bindungsstelle hinweisen. 2.5 Multiples Alignment dreier Sequenzen: Die beiden Sequenzen aus 2.4 und eine weitere Sequenz von D.melanogaster wurden über den DNA-Man verglichen. Auch hierbei imponierten wieder die zwei ähnlichen Bereiche, die in allen drei Sequenzen mit einer Identität von 16,3% zu finden waren. Somit musste es sich bei der dritten Proteinsequenz auch um einen Serotonin-Rezeptor handeln. 2.6/7 nicht durchgeführt Teil 3: Proteinstrukturen 3.1 Suche in der Swissprot-Datenbank nach CHER_SALTY: Es handelt sich hierbei um eine Methyltransferase, wobei nur herauszufinden war, dass eine Kristallstruktur von diesem Protein existiert. Eine 3d-Struktur wurde nicht direkt angezeigt, wurde jedoch auf Anfrage von der Swissprot-Datenbank zugeschickt. 3.2 Struktur im DNA-Man: Die Aminosäuren wurden nach Ramachandran beurteilt, wobei Loops, beta-Faltblatt und vorwiegend alpha-Helix-Strukturen gefunden wurden. 2 3.3 nicht durchgeführt 3.4 nicht durchgeführt 3.5 Besitzt CHER_SALTY ein Signalpeptid? Vermutlich nicht, da in der Hydrophobizitätsbetrachtung kein Bereich von insgesamt 21 Aminosäuren einen Wert über 2 erreicht, der als Transmembrandomäne in Frage kommt. 3.6 Funktionsweise von SignalP: SignalP erkennt potentielle Signalpeptide (Alanin als Schnittstelle für Signalpeptidase). Sicherzustellen sind diese jedoch nur experimentell. Obwohl es aus einem Bakterium (Salmonelle) stammte, konnte das Programm für Eukaryonten eine Signalsequenz nachweisen. 3.7 Bestimmung der Transmembranregionen des G-Proteins (AN: Q99527): Sechs Transmembranregionen wurden gefunden. 3.8 nicht durchgeführt Tübingen, 24.4.2002 ____________________________ Unterschrift 3