K URSTAG 12 R AS M OL – RIBOSOMALE RNA An diesem Kurstag geht es erneut um die Visualisierung einer aufgelösten Struktur eines biologischen Makromoleküls. Nachdem Sie sich mit dem Programm RasMol und einer tRNA auseinandergesetzt haben, sollen Sie sich an diesem Tag mit einer ribosomalen RNA, der 16 S-rRNA beschäftigen. Escherichia coli besitzt sieben ribosomale Operons, die mit den Buchstaben A, B, C, D, E, G und H durchnummeriert sind (siehe Abb. 12.1). Diese sind polycistronisch und kodieren alle die 16 S-rRNA, die 23 S-rRNA, die 5 S-rRNA sowie mindestens eine tRNA. Die 16 S-rRNA ist Bestandteil der kleinen ribosomalen Untereinheit. Neben der 16 S-rRNA sind in E. coli noch 21 Proteine an der Bildung der kleinen ribosomalen Untereinheit beteiligt. Ziel der folgenden Aufgabe ist es, die Sequenzunterschiede der verschiedenen 16 S-rRNAs aus E. coli in der kleinen ribosomalen Untereinheit bzw. in der 3D-Struktur der 16 S-rRNA zu lokalisieren. Für die kleine ribosomale Untereinheit aus dem thermophilen Bakterium Thermus thermophilus ist die Röntgenstruktur bekannt, aber nicht für die Untereinheit aus E. coli. (Nehmen Sie das für die Aufgabe als Fakt ;-) Abbildung 12.1: Übersicht über die sieben ribosomalen Operons von E. coli. Verteilung der heterogenen Positionen in den Strukturgenen der sieben ribosomalen Operons. Jede blaue Linie markiert dabei die Position mit mindestens einer Sequenzabweichung. 62 RasMol – ribosomale RNA Abbildung 12.2: Sekundärstruktur der 16 S-rRNA aus E. coli. In Rot dargestellt sind die sogenannten Mikroheterogenitäten. 63 Ihre erste Aufgabe wird es sein, sich zunächst die Sequenzen der 16 S-rRNA aus E. coli herunterzuladen. Desweiteren benötigen Sie zusätzlich noch die Sequenz der 16 S-rRNA aus T. thermophilus. Erstellen Sie zunächst mit Clustal oder MAFFT (google!) ein Alignment der sieben 16 S-rRNA-Sequenzen aus E. coli und der 16 S-rRNA-Sequenz aus T. thermophilus. Wie Sie erkennen können, sind sich die Sequenzen untereinander sehr ähnlich. Nur an wenigen Positionen unterscheiden sich die 16 S-rRNA-Sequenzen voneinander. Versuchen Sie mit dem Auge abzuschätzen, wieviele Positionen es ungefähr sind und vergleichen Sie Ihre gefundenen Positionen mit denen aus Abbildung 12.2. Wo befinden sich die Mikroheterogenitäten? Wo sind diese lokalisiert? Interessant wird es nun, die Mikroheterogenitäten in der 3D-Struktur der 16 S-rRNA heruszufinden. In der Protein Data Bank gibt es unter der PDB-ID 1j5e eine aufgelöste Struktur aus T. thermophilus. Laden Sie sich das PDB-File von der Webseite der Protein Data Bank herunter. Schreiben Sie nun ein Programm, welches das Alignment auf die Mikroheterogenitäten hin untersucht. Dabei sollen nur die sieben 16 S-rRNA-Sequenzen aus E. coli betrachtet werden. Geben Sie die Positionen in dem Alignment aus. In einem zweiten Schritt sollen Sie nun Ihr Programm so abändern, dass es die ermittelten Positionen auf die 16 S-rRNA-Sequenz aus T. thermophilus transformiert. Beachten Sie, dass in Ihrem Alignment in die Sequenz aus T. thermophilus Gaps eingefügt wurden, so dass sich die absoluten Positionen in der Sequenz um die Anzahl der bisher aufgetretenen Gaps reduziert. Geben Sie die ermittelten Positionen in der T. thermophilus aus. In der letzten Aufgabe sollen Sie nun ein RasMol-Skript schreiben, welches das entsprechende PDB-File einliest und die von Ihnen ermittelten Positionen in der 3D-Struktur hervorhebt. Besitzen die Mikroheterogenitäten eine auffällige Verteilung in der 3D-Struktur? Können Sie aus deren Position in der 3D-Struktur auf ihren „Sinn“ schließen?