Seite als PDF downloaden - Max-Planck

Werbung
Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?
Gibt es zwei Klassen von Promotoren?
Are there two classes of promoters?
Vingron, Martin
Max-Planck-Institut für molekulare Genetik, Berlin
Korrespondierender Autor
E-Mail: [email protected]
Zusammenfassung
Analysen der Sequenz von humanen Genen und deren Promotorsequenzen w eisen auf zw ei unterschiedliche
Klassen von Promotoren hin. Mit diesen zw ei Klassen geht eine Reihe von Eigenschaften einher, die
nahelegen, dass auch die Regulation der jew eiligen Promotoren entsprechende Unterschiede aufw eist. In
diesem Artikel w erden die Sequenzeigenschaften und Merkmale der jew eiligen Klasse dargestellt. W ir zeigen,
w ie mathematische Zusammenhänge, die man in den gesamtgenomischen Daten erkennen kann, auf
biologische Mechanismen hinw eisen können.
Summary
A mathematical analysis of human gene promoter sequences show s that these promoters fall into tw o distinct
classes. A number of features correlate w ith these tw o classes, suggesting that this distinction is actually a
reflection of different regulatory mechanisms. This article summarizes sequence features and biological
properties specific for the promoters of the tw o classes. We explain how a mathematical analysis of w holegenome data could point tow ards particular biological mechanisms.
Einleitung
Nachdem über viele Jahre das Interesse der Genomforschung auf der Bestimmung der Gene gelegen hat,
rückte im letzten Jahrzehnt die Frage in den Mittelpunkt, w ie w elches Gen zu einem bestimmten Zeitpunkt
oder unter bestimmten Bedingungen an- oder abgeschaltet w ird. Diese Kontrollebene w ird als Genregulation
bezeichnet. Sie ist verantw ortlich dafür, dass in den verschiedenen Zellen eines Organismus unterschiedliche
Proteine erzeugt w erden oder dass eine bestimmte Zelle zu unterschiedlichen Zeiten unterschiedliche Proteine
erzeugt, um zum Beispiel auf eine Infektion mit einer Immunantw ort zu reagieren.
Die Information, w ann w elches Gen exprimiert, das heißt, in ein Protein übersetzt w erden soll, ist bis zu einem
gew issen Grad in der Buchstabenfolge des Genoms kodiert – allerdings nicht in der systematischen Art und
Weise, in der die Proteine durch den genetischen Code definiert w erden. Das An- oder Abschalten von Genen
geschieht durch sogenannte Transkriptionsfaktoren. Dies sind ebenfalls Proteine, die an die DNA unter
anderem vor dem zu regulierendem Gen andocken und dessen Expression aktivieren oder unterdrücken
© 2014 Max-Planck-Gesellschaft
w w w .mpg.de
1/5
Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?
können. In dem Forschungsbericht "Untersuchung von Bindungsstellen zur Aktivierung von Genen" für das
Jahrbuch der Max-Planck-Gesellschaft 2005 w urde die Funktionsw eise der Transkriptionsfaktoren beschrieben
[1]. Diejenigen Bereiche im Genom, in denen sich die Bindungsstellen der Transkriptionsfaktoren hauptsächlich
befinden, w erden als Promotoren und Enhancer bezeichnet. Promotoren liegen nahe am Beginn eines Gens
und kontrollieren es genau. Enhancer sind in ihrer Position zum regulierten Gen frei und können unter
Umständen bis zu einer Million Basenpaaren entfernt liegen. Häufig befinden sich sogar noch andere Gene
zw ischen einem Enhancer und dem von ihm kontrollierten Gen.
Der Beitrag im diesjährigen Jahrbuch konzentriert sich auf die Promotoren im menschlichen Genom. In der
Literatur w erden im Allgemeinen zw ei mögliche Charakteristika der Promotoren betont. Zum einen gibt es das
TATA-binding protein (TBP), das an viele dieser Promotoren bindet. Sie verfügen alle über einen bestimmten
Sequenzabschnitt, die TATA-Box – eine Abfolge der Basenpaare TATA -, an die TBP bindet. Ein anderes
Charakteristikum vieler humaner Promotoren ist die sogenannte CpG-Insel (CpG island, CGI). Sie bezeichnet
einen Sequenzbereich, in dem die Basenpaarfolge CG signifikant häufiger vorkommt als in anderen Bereichen
der DNA. Das humane Genom nutzt dieses Dinukleotid eigentlich selten, sodass eine Häufung von CG-Abfolgen
statistisch hervorsticht. Das „p“ in CpG betont die Phosphatbindung zw ischen den Basen, um eine
Verw echslung mit der komplementären Abfolge GC auszuschließen.
Promotoren unterscheiden sich im CpG-Gehalt
Abbildung 1 zeigt ein Histogramm mit der Dichte an CpGs in den Sequenzen der menschlichen Promotoren.
Man w ürde erw arten, dass die Dichte an CpGs um einen Mittelw ert gleichmäßig variiert. Statt dessen sieht
man zw ei Klassen von Promotoren, nämlich solche mit einer hohen Dichte an CpGs und solche mit niedrigem
Gehalt an CpGs [2]. Diese Beobachtung w irft eine Reihe von Fragen auf, vor allem die nach den
regulatorischen
Mechanismen
in
den
beiden
Klassen
von
Promotoren.
Funktionieren
die
beiden
Promotorklassen nach dem gleichen Muster oder gibt es unterschiedliche regulatorische Mechanismen?
A bb. 1: Histogra m m de r C pG-Dichte in m e nschliche n
P rom otore n. LCP: Low C pG P rom otore n, HCP: High C pG
P rom otore n.
© Ma x -P la nck -Institut für m ole k ula re Ge ne tik /R oide r
Es gibt eine Reihe w eiterer Eigenschaften von Genen und Promotoren, die mit der gezeigten Zw eiteilung der
Promotoren einhergehen. Zuerst ist festzustellen, dass die High-CpG-Promotoren (HCPs) genau jene
Promotoren sind, die über eine CpG-Insel verfügen. Umgekehrt haben viele der Low -CpG-Promotoren (LCPs)
eine TATA-Box-Bindungsstelle. Die TATA-Box gilt allgemein als ein Kennzeichen von gew ebespezifisch
© 2014 Max-Planck-Gesellschaft
w w w .mpg.de
2/5
Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?
exprimierten Genen. Abbildung 2 zeigt das Auftreten einer TATA-Box in den Promotoren von Genen mit LCPPromotoren, die in verschiedenen Gew eben exprimiert w erden [3]. Die Höhe der Balken symbolisiert die
Häufigkeit der vorhergesagten TATA-Box. Die rechte ebene Dimension zeigt die Sequenz in der Umgebung des
Startpunkts der Transkription, also den Übergang vom Promoter in den kodierenden Bereich des betreffenden
Gens.
Negative
Zahlen
beziehen
sich
auf
den
DNA-Bereich
vor
dem
Gen,
TSS
bezeichnet
den
Transkriptionsstart und positive Zahlen bezeichnen Positionen in bereits kodierenden Regionen des Gens. Auf
der linken Achse sind diejenigen Gew ebe benannt, für die Gene beziehungsw eise Promotoren ausgew ählt und
analysiert w urden. Zum Beispiel sieht man bei Genen, die in der Lunge exprimiert w erden, unmittelbar vor dem
Transkriptionsstart einen hohen gelben Balken, also eine klare Präferenz für eine TATA-Box an dieser Stelle in
diesen Genen. Die Abbildung insgesamt illustriert die Bedeutung der TATA-Box bei der Regulation von
gew ebespezifisch
exprimierten
LCP
Genen.
Die
gleiche
Analyse
für
HCP-Gene,
auch
w enn
diese
gew ebespezifisch exprimiert sind, zeigt ein w eitaus schw ächeres Signal.
A bb. 2: Ausprä gung de s TATA-Box Motivs in hum a ne n
P rom otore n m it nie drige m C pG-Ge ha lt, a ufge te ilt na ch
de m je nige n Ge we be , in de m da s je we ilige Ge n e x prim ie rt wird
(we ite re Erk lä runge n sie he Te x t).
© Ma x -P la nck -Institut für m ole k ula re Ge ne tik , m odifizie rt
na ch [3]
Gewebespezifische Regulation
Neben der TATA-Box mit ihrem Bindungsprotein TBP gibt es zahlreiche w eitere sequenzspezifisch bindende
Transkriptionsfaktoren. Als ein Beispiel sei hier MEF2 erw ähnt, der eine w ichtige Rolle bei der Regulation der
Gene in Muskulatur und im Herzmuskelgew ebe spielt. Abbildung 3 zeigt in gleicher Weise w ie Abbildung 2 die
Prominenz der MEF2-Bindungsstellen in LCP-Genen verschiedener Gew ebe. Man sieht, dass nur diejenigen
Gene, die nachw eislich in Muskulatur oder Herzmuskelgew ebe exprimiert w erden, die MEF2-Bindungsstelle
enthalten. W ird
die
entsprechende
Analyse
bei HCP-Genen
durchgeführt, fehlt
grundsätzlich
diese
Bindungsstelle und es gibt dementsprechend keinen Unterschied zw ischen ihrem Auftreten in denjenigen
Genen, die in verschiedenen Gew eben exprimiert sind.
© 2014 Max-Planck-Gesellschaft
w w w .mpg.de
3/5
Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?
A bb. 3: Ausprä gung de s Bindungsm otivs de s
Tra nsk riptionsfa k tors MEF2 in hum a ne n P rom otore n m it
nie drige m (link s) und hohe m (re chts) C pG-Ge ha lt, a ufge te ilt
na ch Ge we be n, in de ne n da s je we ilige Ge n e x prim ie rt wird.
© Ma x -P la nck -Institut für m ole k ula re Ge ne tik , m odifizie rt
na ch [3]
Epigenetische Regulation
Die beschriebenen Beobachtungen deuten auf unterschiedliche Kontrollmechanismen der LCPs und HCPs hin.
Unterstützt w ird diese Annahme durch einen Blick auf eine w eitere Ebene der Genregulation. Neben den
Sequenzmustern, die von Transkriptionsfaktoren erkannt w erden, gibt es biochemische Markierungen an den
sogenannten Histonproteinen, die über w eite Strecken die DNA bedecken. Diese Markierungen können
Acetylierungen,
Methylierungen
oder
andere
Modifikationen
sein.
Summarisch
w erden
sie
als
Histonmodifikationen bezeichnet, ihre genaue Beschreibung ergibt sich aus dem betreffenden Histon und der
Position und Art der Modifikation (zum Beispiel Histon3-Lysin4-Acetylierung, H3K4ac). Man hat festgestellt,
dass die Markierungen mit dem Aktivitätsstatus eines Promotors einhergehen. Daraus folgt, dass aus den
Markierungen, die sich in einem Promotor befinden, über mathematische Methoden die Expression eines Gens
vorhergesagt w erden kann.
Es gibt eine Vielzahl solcher Modifikationen, von denen über 30 entlang des Genoms biochemisch in ihrer
Stärke gemessen w urden. Mithilfe eines mathematischen Modells gelang es den Bioinformatikern des MaxPlanck-Instituts für molekulare Genetik zu bestimmen, w elche Modifikationen die meisten Informationen über
die Expression der Gene tragen [4]. Wenn aber die Unterscheidung der Promotoren in HCPs und LCPs
tatsächlich so fundamental ist, w ie die W issenschaftler meinen, sollte sich diese Zw eiteilung auf der Ebene der
Modifikationen w iederfinden. Um dies zu überprüfen, stellten sie das mathematische Modell separat für die
beiden Gruppen von Promotoren auf und bestimmten jew eils die informationstragenden Histonmodifikationen.
In der Tat konnten sie nachw eisen, dass unterschiedliche Gruppen von Histonmodifikationen mit der
Aktivierung in HCPs und LCPs verbunden sind. Dies erhärtet die Annahme, dass die beiden Gruppen von
Promotoren unterschiedlich reguliert w erden.
Noch sind die regulatorischen Mechanismen zur Expression von Genen nicht vollständig verstanden. Die
Forscher der Abteilung Bioinformatik haben aber Hypothesen aufgestellt, w ie sie funktionieren könnten. Von
den HCPs ist bekannt, dass die RNA-Polymerase, also jenes Enzym, das für die Transkription zuständig ist, die
meiste Zeit am Promoter der HCP-Gene präsent ist - unabhängig davon, ob das Gen transkribiert w ird oder
nicht. Bei den LCPs verhält sich die RNA-Polymerase anders. Wenn ein von einem LCP kontrolliertes Gen nicht
aktiv ist, befindet sich auch keine RNA-Polymerase an dessen Promoter. Dieser (w eitere) Unterschied lässt
vermuten, dass die Kommandos, die zur Aktivierung eines HCP-Gens führen, nur den eigentlichen Start des
Transkriptionsvorgangs einleiten. Bei einem LCP-Gen hingegen muss vor der Aktivierung zuerst die
Transkriptionsmaschinerie an ihren Einsatzort, den LCP-Promotor, geholt w erden. Dies könnte der Hintergrund
© 2014 Max-Planck-Gesellschaft
w w w .mpg.de
4/5
Jahrbuch 2013/2014 | Vingron, Martin | Gibt es zw ei Klassen von Promotoren?
für die unterschiedlichen Histonmodifikationen sein. Gleichzeitig nimmt man an, dass HCP-Gene häufig in vielen
Gew eben exprimiert w erden - folglich ist bei ihnen die gew ebespezifische Regulation w eniger w ichtig als bei
LCPs.
Die heute verfügbaren Sequenzdaten zusammen mit einer Vielzahl biochemischer Messungen ermöglichen
Analysen w ie die hier beschriebenen. In der Summe lassen sich daraus Hypothesen über biochemische
Mechanismen aufstellen oder untermauern, die dann w iederum zu neuen Experimenten und w eiteren
Einsichten führen. Diese Form des Studiums der Genregulation w ird regulatory genomics genannt und ist eines
der aktuellen und spannendsten Gebiete der Molekulargenetik und Genomforschung.
Literaturhinweise
[1] Vingron M.
Untersuchung von Bindungsstellen zur Aktivierung von Genen
Jahrbuch der Max-Planck-Gesellschaft 2005
[2] Saxonov, S.; Berg, P.; Brutlag, D. L.
A genome-wide analysis of CpG dinucleotides in the human genome distinguishes two distinct classes of
promoters
Proceedings of the National Academy of Sciences USA 103, 1412-1417 (2006)
[3] Roider, H. G.; Lenhard, B.; Kanhere, A.; Haas, S. A.; Vingron, M.
CpG-depleted promoters harbor tissue-specific transcription factor binding signals - implications for motif
overrepresentation analyses
Nucleic Acids Research 37, 6305-6315 (2009)
[4] Karlić, R.; Chung, H. R.; Lasserre, J.; Vlahovicek, K.; Vingron, M.
Histone modification levels are predictive for gene expression
Proceedings of the National Academy of Sciences USA 107, 2926-2931 (2010)
© 2014 Max-Planck-Gesellschaft
w w w .mpg.de
5/5
Herunterladen