Research Collection Doctoral Thesis The chromatin architecture in Arabidopsis thaliana Author(s): Shu, Huan Publication Date: 2011 Permanent Link: https://doi.org/10.3929/ethz-a-006526640 Rights / License: In Copyright - Non-Commercial Use Permitted This page was generated automatically upon download from the ETH Zurich Research Collection. For more information please consult the Terms of use. ETH Library DISS. ETH NO. 19604 THE CHROMATIN ARCHITECTURE IN ARABIDOPSIS THALIANA A dissertation submitted to ETH ZURICH for the degree of Doctor of Sciences presented by HUAN SHU MSc in Plant Genetic Manipulation, University of Nottingham (UK) born 18th April, 1983 citizen of China accepted on the recommendation of Prof. Dr. Wilhelm Gruissem, examiner Prof. Dr. Lars Hennig, co-examiner Prof. Dr. Renato Paro, co-examiner 2011 Abstract DNA accessibility and nucleosome dynamics are two important aspects of chromatin regulation. During interphase, eukaryotic chromatin is organized into cytologically condensed (heterochromatin) and loose (euchromatin) regions. The typical heterochromatin regions are often enriched for repetitive sequences and transposable elements. They are subjected to DNA methylation, silencing histone modifications and Heterochromatin Protein 1 (HP1) mediated chromatin packaging in animals. It is believed that the chromatin compaction of the heterochromatin reduces its accessibility to the transcriptional machinery and therefore helps to prevent parasitic sequences from being activated and invading the host genome. Furthermore, it has been proposed that the molecular mechanisms by which Polycomb group (PcG) proteins, whose major role involves repressing developmentally regulated genes, repress their target genes include long-distance contacts between binding sites and local chromatin compaction. In contrast to heterochromatin, gene-rich euchromatin often adapts a more open conformation. Nucleosomes in euchromatin often carry activating histone modifications and contain replacement histones that favour higher rates of nucleosome turnover. It is believed that increased nucleosome dynamics and open chromatin conformation facilitate the accessibility of transcriptional machineries and other regulatory proteins to DNA. Histone turnover can be measured using the incorporation of histone variant H3.3. In animals, H3.3 was shown to be targeted to promoters, active genes, and transcription factor binding sites, and paradoxically, telomeres. H3.3 is incorporated throughout the cell cycle, and nucleosomes containing H3.3 were shown to be labile. Therefore, H3.3-nucleosomes might form a molecular memory for increased accessibility of DNA. Here, I performed genome-wide profiling of chromatin DNase I sensitivity and H3.3 incorporation pattern in interphase cells to interrogate DNA accessibility and dynamics of chromatin in Arabidopsis thaliana using the former as a measure for chromatin openness and the latter as a measure for nucleosome turnover. I showed that DNase I hyposensitivity (chromatin compactness) correlates inversely with the transcriptional activity of genes. Gene-poor pericentric heterochromatin regions were least accessible while genes with high tri-methylation at histone H3 lysine 4 (H3K4me3) levels were most accessible. We identified three distinct classes of inaccessible genes: (i) Genes with high levels of H3K9me2 such as transposable element genes. (ii) Polycomb target genes, which carry H3K27me3. (iii) Very long genes without high levels of H3K9me2 or H3K27me3 but with DNA methylation. While the first class represents genes from constitutive heterochromatin, the two other classes might represent facultative heterochromatin in Arabidopsis. The finding that Polycomb group target genes had greatly reduced accessibility suggests that local chromatin compaction is a major mechanism of Polycomb group protein-mediated gene silencing. In the second study, I show that Arabidopsis H3.3 is predominantly incorporated into the gene-rich chromosome arms, but largely depleted from the pericentric heterochromatin. H3.3 is mainly enriched at promoters, gene bodies with a 3’-bias, and at post-transcription terminator regions. Notably, the gene-proximal pattern of H3.3 enrichment correlates with Pol II in the initiation and elongation state respectively, suggesting an association between Pol II occupancy and increased nucleosome dynamics. Consistently, genes’ H3.3 levels correlated positively with mRNA levels. Interestingly, H3.3 was shown to be preferentially targeted to promoters of a group of repressed genes with GA-motif, and this enrichment seems to potentiate these genes for transcriptional activation, implicating the involvement of nucleosome turnover in maintaining epigenetic memory for gene activation. When integrating the two data sets, a clear pattern emerged: Low DNase I sensitivity (low accessibility) inversely correlated with high H3.3 level (high nucleosome turnover). Specifically, H3.3 was depleted from the inaccessible genes but enriched in highly accessible genes. Altogether, this work probed the Arabidopsis chromatin from both a static and a dynamic point of view. The data gave rise to a model of Arabidopsis chromatin architecture, where the heterochromatic chromatin is compact, inaccessible and relatively static, while chromatin regions involved in active transcription are highly accessible and dynamic. Some genes, e.g. when repressed by PcG proteins, can temporarily assume inaccessible and static chromatin states, which, however, will likely resolve upon transcriptional activation. Zusammenfassung Die Zugänglichkeit des Chromatins und die Dynamik der Nukleosomen sind zwei wichtige Aspekte der Chromatinregulation. Während der Interphase organisiert sich eukaryotisches Chromatin in kondensierte (Heterochromatin) und lockere (Euchromatin) Regionen. Die typischen heterochromatischen Regionen haben eine Anhäufung von sich wiederholenden Sequenzen und transposablen Elementen. Diese Regionen beinhalten DNA-Methylierungen, dämpfende Histonmodifikationen und in Tieren Heterochromatin Protein 1 (HP1) vermittelnde Chromatinpackungen. Es wird angenommen, dass die Chromatinverdichtung des Heterochromatins die Zugänglichkeit der Transkriptionsmaschinerie reduziert und dadurch die Aktivierung von parasitären Sequenzen, die in das Wirtsgenom eindringen könnten, zu verhindern hilft. Desweiteren wird angenommen, dass Polycomb Gruppen (PcG) Proteine, deren Hauptaufgabe es ist, entwicklungsregulierte Gene zu unterdrücken, über grosse Distanz Kontakte zwischen Bindungsstellen einführen, und so das Chromatin lokal kompaktieren. Im Gegensatz zu Heterochromatin ist Euchromatin oft genreich und hat eine offene Konformation. Nukleosomen im Euchromatin tragen häufig eine aktivierende Histonmodifikation und besitzen Histonarten die zu einer höheren Nukleosomen-Austauschrate führen. Es wird angenommen, dass eine höhere Nukleosomdynamik und eine offene Chromatinkonformation die Zugänglichkeit der Transkriptionsmaschinerie und anderer regulatorischer Proteine zur DNA vereinfacht. Die Austauschrate der Histone kann durch die Messung der Histonvariante H3.3 definiert werden. In Tieren wurde gezeigt, dass H3.3 gezielt bei Promotoren, aktiven Genen, bei Bindungsstellen für Transkriptionsfaktoren und paradoxerweise bei Telomeren inkooperiert wird. H3.3 wird im ganzen Zellzyklus durchgehend inkooperiert und es wurde gezeigt, dass Nukleosomen, die H3.3 beinhalten, instabil sind. Aus diesem Grund könnte H3.3-Nukleosomen eine Art Molekulares Gedächtnis für erhöhte DNA-Zugänglichkeit bilden. In dieser Arbeit führte ich ein genomweites Profiling der DNase I Sensitivität und der H3.3 Inkooperationsmustern in Interphasenzellen, um Antworten auf Zugänglichkeit und Dynamik des Chromatins in Arabidopsis thaliana zu bekommen, durch. Dafür wurde mit der DNase I Sensitivität, der Frage der Chromatinzugänglichkeit und mit den H3.3 Inkooperationsmustern deren der Nukleosomendynamik nachgegangen. Ich konnte zeigten, dass DNase I Hyposensitivität (kompaktes Chromatin) reziprok mit dem Vorhandensein von transkriptionell aktiven Genen korreliert. Genarme perizentromerische Heterochromatinregionen waren weniger zugänglich, während Gene mit vermehrter Trimethylierung an Histon H3 Lysin 4 (H3K4me3) äusserst zugänglich waren. Ich identifizierte drei unterschiedliche Klassen von nicht zugänglichen Genen: (i) Gene mit hohem Niveau an H3K9me2, wie transposable Elemente. (ii) Polycomb anvisierte Gene, welche H3K27me3 tragen. (iii) Sehr lange Gene ohne hohem Niveau an H3K9me2 oder H3K27me3, aber mit DNAMethylierung. Während Gene der ersten Klasse konstitutives Heterochromatin repräsentieren, könnten die zwei anderen Klassen fakultatives Heterochromatin in Arabidopsis repräsentieren. Da Zielgene, der Polycomb Gruppen Proteine, eine markant reduzierte Zugänglichkeit hatten zeigt, dass lokale Chromatinkompaktion ein Hauptmechanismus zur Dämpfung der Aktivität von Genen ist, welche durch Polycomb Gruppen Proteinen vermittelt wird. In der zweiten Studie zeigte ich, dass Arabidopsis H3.3 hauptsächlich in genreichen Chromosomarmen inkooperiert wird, aber grösstenteils in perizentrischem Heterochromatin abwesend ist. H3.3 ist hauptsächlich in Promotoren, Genabschnitten mit 3‘-Tendenz, und in posttranskriptionellen Terminatoren inkooperiert. Bemerkenswert ist, dass das genproximale Muster der H3.3 Anreicherung mit Pol II bei der Initiationslage und bei der Elongationslage korreliert, welches eine Verbindung zwischen Pol II Besetzung und hoher Nukleosomen Dynamik nahe legt. Dementsprechend stimmt das Gen H3.3 Niveau mit dem mRNA Level überein. Interessanterweise wurde gezeigt, dass H3.3 bevorzugt bei Promotoren von Gruppen von reprimierten Genen mit GAMotiv inkooperiert wird und diese Anreicherung scheint die transkriptionelle Aktivierung zu verstärken. Dies impliziert eine Beteiligung des Nukleosomenumsatzes bei der Aufrechterhaltung des epigenetischen Gedächtnisses für die Genaktivierung. Wenn diese zwei Datensätze zusammengenommen werden, taucht ein klares Muster auf: niedrige DNase I Sensitivität (niedrige Zugänglichkeit) invers mit hohem H3.3 Niveau (hohem Nukleosomenumsatz) korreliert. Hervorzuheben ist, dass H3.3 abwesend in unzugänglichen Genen, aber angereichert in höchst zugänglichen Genen ist. Zusammenfassend zeigen meine Experimente das Arabidopsis Chromatin aus einer statischen und aus einer dynamischen Sicht. Diese Daten geben Einsicht in die Arabidopsis Chromatin Architektur, in der das heterochromatische Chromatin kompakt ist, unzugänglich und relativ statisch, während Chromatinregionen, die in aktive Transkription involviert sind, höchst zugänglich und dynamisch sind. Einige Gene, zum Beispiel solche reprimiert durch PcG Proteine, können temporär unzugänglich sein und einen ruhenden Chromatinstatus haben. Diese Gene können wahrscheinlich bei einer transkriptionellen Aktivierung diesen ruhenden Status überwinden.