DISS. ETH NO. 22048 N-LINKED PROTEIN GLYCOSYLATION IN THE CYTOPLASM A thesis submitted to attain the degree of DOCTOR OF SCIENCES of ETH ZURICH (Dr. sc. ETH Zurich) presented by ANDREAS FABIAN NÄGELI MSc ETH Biology, ETH Zürich born on 17. 12. 1984 citizen of Marthalen/ZH accepted on the recommendation of Prof. Dr. Markus Aebi, examiner Prof. Dr. Dario Neri, co-examiner Prof. Dr. Rudolf Glockshuber, co-examiner 2014 Summary SUMMARY N-linked protein glycosylation is a very common post translational modification that is found throughout the three domains of life. A classical, highly conserved pathway entails the assembly of an oligosaccharide on a lipid carrier, its translocation across a membrane (the endoplasmic reticulum membrane in eukaryotes, the plasma membrane in prokaryotes) and the en bloc transfer of the oligosaccharide to the side chain amide group of an asparagine residue in the sequon N-X-S/T of secreted polypeptides. This transfer is catalyzed by a membrane-bound oligosaccharyltransferase (OST). After the transfer, oligosaccharide undergoes a number of trimming and elongation steps to give rise to a vast array of different glycan structures. N-glycans are involved in many biological processes such as for example protein folding and quality control in the endoplasmic reticulum, cell-cell recognition or immune modulation and inflammation. Certain species in the class of γ-proteobacteria encode an unusual pathway for N-linked protein glycosylation. This pathway takes place in the cytoplasm and is mediated by a soluble Nglycosyltransferase (NGT) that uses nucleotide-activated sugars to modify asparagine residues with single monosaccharides. Surprisingly, it uses the same consensus sequon (N-X-S/T) as OST even though the two enzymes are not related. NGT constitutes a novel class of N-glycosylation catalyzing enzymes. Chapter 1 of this thesis offers a brief overview of protein glycosylation in general and more detailed introduction to both the classical and the cytoplasmic N-glycosylation pathways. Furthermore some of the efforts taken to use bacteria as expression hosts for glycoproteins are discussed. The following chapters are dedicated to the detailed characterization of the cytoplasmic N-glycosylation system, the enzymology of NGT and its potential biotechnological application. To study cytoplasmic N-glycosylation in more detail, we needed a readily accessible experimental system. Chapter 2 unveils the study of the cytoplasmic N-glycosylation in the porcine respiratory tract pathogen Actinobacillus pleuropneumoniae and its functional transfer to Escherichia coli. N-linked glucose specific human sera as well as mass spectrometric approaches were used for the analysis of the glycosylation process. We identified autotransporter adhesins as the preferred protein substrate of NGT in vivo and in-depth analysis of the modified sites in E. coli revealed a relaxed peptide substrate specificity. While N-X-S/T is the preferred acceptor sequon, we detected glycosylation of alternative sequons, including modification of glutamine and serine residues. In order to further characterize the NGT catalyzed reaction, we performed a detailed biochemical analysis, which is reported in chapter 3. We developed a sensitive and quantitative in vitro assay based on HPLC separation and quantification of fluorescently labeled substrate peptides. With this assay we were able to directly quantify glycopeptide formation by A. pleuropneumoniae NGT and determine its substrate specificities: NGT turns over a number of different sugar donor substrates I Summary and allows activation by both UDP and GDP. Quantitative analysis of peptide substrate turnover demonstrated a strikingly similar specificity as the classical, oligosaccharyltransferase-catalyzed N-glycosylation. N-X-S/T sequons turned out to be the optimal NGT substrates, which confirmed our in vivo findings. NGT offers a new route for the production of N-linked glycoproteins. Chapter 4 describes the development of a chemoenzymatic method for direct glycosylation of polypeptides: A glucose moiety was introduced at the consensus N-glycosylation sequence (N-X-S/T) in a polypeptide by NGT followed by attachment of a complex N-glycan to the glucose primer by endoglycosidase (ENGase)-catalyzed transglycosylation. Different high-mannose and complex type N-glycans could be readily transferred to the glucose moiety by ENGases to provide full-size glycopeptides. The usefulness of the chemoenzymatic method was exemplified by an efficient synthesis of a complex glycoform of polypeptide C34, a potent HIV inhibitor derived from HIV-1 gp41. Interestingly, the Glc-Asn linked glycopeptide was completely resistant to PNGase F digestion, as well as significantly less susceptible to hydrolysis by Endo-M compared to the natural GlcNAc-Asn linked glycopeptide. The chemoenzymatic glycosylation method provides an efficient way for introducing complex N-glycans into polypeptides, for gain of novel properties that could be valuable for drug discovery. II Zusammenfassung ZUSAMMENFASSUNG N-gebundene Proteinglykosylierung ist eine sehr häufige posttranslationale Modifikation die in allen drei Domänen des Lebens vorkommt. Ein klassischer, hochkonservierter Biosyntheseweg beinhaltet den Aufbau eines Oligosaccharids auf einem Lipid, seine Translokation über eine Membran (die Membran des endoplasamatischen Retikulums in Eukaryoten, die Plasmamembran in Prokaryoten) und den en bloc Transfer auf die Seitenkettenamidgruppe eines Asparaginrests im Sequon N-X-S/T eines sekretierten Proteins. Dieser Transfer wird von einem membrangebundenen Enzym, der Oligosaccharyltransferase (OST) katalysiert. Nach dem Transfer wird das Oligosaccharid einer Reihe von Trimm- und Elongationsschritten unterzogen und es entsteht eine Vielzahl verschiedener Glykanstrukturen. N-Glykane sind in viele verschieden biologische Prozesse involviert, wie zum Beispiel Proteinfaltung und Qualitätssicherung im Endoplasmatischen Retikulum, Zell-Zell Erkennung oder Modulation des Immunsystems und Entzündung. Einige Spezies der Klasse γ-Proteobacteria vollführen eine sehr ungewöhnliche Art der N-Glykosylierung. Diese Glykosylierung findet im Zytoplasma statt und wird von einer löslichen N-Glykosyltransferase katalysiert. Dieses Enzym verwendet Nukleotid-aktivierte Zucker um Asparaginreste mit einzelnen Monosacchariden zu modifizieren. Überraschenderweise erkennt dieses Enzym die gleiche Konsensussequenz (N-X-S/T) wie OST, obwohl die beiden Enzyme nicht miteinander verwandt sind. NGT stellt eine neue Klasse von NGlykosylierungsenzymen dar. Kapitel 1 dieser Arbeit bietet eine kurze Übersicht über Proteinglykosylierung im Allgemeinen und eine detailliertere Einführung in die klassische und die zytoplasmatische N-Glykosylierung. Ausserdem werden einige Möglichkeiten der Anwendung von Bakterien als Expressionswirte zur Herstellung von Glykoproteinen diskutiert. Die folgenden Kapitel sind der detaillierten Charakterisierung des zytoplasmatischen N-Glykosylierungssystems, der Enzymologie von NGT und seiner potenziellen biotechnologischen Anwendung gewidmet. Zur Untersuchung der zytoplasmatische N-Glykosylierung benötigten wir ein experimentelles System, welches einfache Manipulation und Analyse erlaubt. Kapitel 2 zeigt die Erforschung der zytoplasmatische N-Glykosylierung in Actinobacillus pleuropneumoniae, einem Atemwegserreger in Schweinen, und die Rekonstruktion des Glykosylierungssystem in Escherichia coli. Zur Analyse des Glykosylierungsprozesses wurden menschliche Seren die spezifisch mit Ngebundener Glukose reagieren sowie Massenspektrometrie verwendet. Wir haben Autotransporteradhesine als bevorzugte Substratproteine von NGT in vivo identifiziert und eine detaillierte Analyse der modifizierten Stellen in E. coli hat eine Peptidsubstratspezifität ergeben, die weit weniger steng ist als bisher angenommen. Während N-X-S/T das bevorzugte Akzeptorsequon darstellt, haben wir auch III Zusammenfassung Glykosylierung von alternativen Sequons sowie Modifikation von Glutamin- und Serinresten nachgewiesen. Um die von NGT katalysierte Reaktion besser zu charakterisieren, haben wir eine detaillierte biochemische Analyse durchgeführt welche in Kapitel 3 beschrieben wird. Wir haben eine sensitive und quantitative in vitro Testmethode entwickelt um die Bildung von Glykopeptiden durch A. pleuropneumoniae NGT direkt zu messen. Sie basiert auf der Trennung und Quantifizierung von fluoreszierenden Substratpeptiden per HPLC und erlaubte uns die Substratspezifitäten von NGT zu eruieren. NGT setzt diverse Zuckerdonorsubstrate um und toleriert die Aktivierung des Zuckers durch sowohl UDP als auch GDP. Quantitative Analyse der Peptidsubstratspezifität von NGT ergab eine überraschend ähnliche Spezifität wie sie für die klassische, OST-katalysierte N-Glykosylierung beschrieben wurde. N-X-S/T Sequons wurden am besten umgesetzt, was unsere vorhergehenden in vivo Resultate bestätigte. NGT bietet neue Möglichkeiten zur Herstellung von N-Glykoproteinen. Kapitel 4 schildert die Entwicklung einer chemoenzymatischen Methode zur direkten Glykosylierung von Polypeptiden: Modifikation eines Peptides mit einer Glukoseeinheit an der N-Glycosylierungskonsensussequenz (N-X-S/T) durch NGT, gefolgt von der Anlagerung eines komplexen N-Glykans an die Glukose via Endoglykosidase (ENGase)-katalysierter Transglykosylierung. Sowohl Mannosereiche als auch komplexe N-Glykanstrukturen konnten durch ENGase auf die Glukose transferiert werden. Die Nützlichkeit dieser Methode konnte durch die effiziente Synthese einer komplexen Glykoform von Polypeptid C34 (einem potenten HIV Inhibitor abgeleitet von HIV-1 gp419) demonstriert werden. Interessanterweise war das Glc-Asn gebundenen Glykopeptid komplett resistent gegen Spaltung durch PNGase F und auch signifikant weniger anfällig auf Hydrolyse durch Endo-M als das natürliche, GlcNAc-Asn gebundene Glykopeptid. Die chemoenzymatische Glykosylierungsmethode bietet daher eine effiziente Möglichkeit zur Modifikation von Polypeptide mit komplexen N-Glykanen und schafft Glykopeptide mit neuen Eigenschaften, die für die Arzneimittelforschung sehr wertvoll sein könnten. IV