3.2 3.3.2 Andere Modifikationen Einige Proteine müssen posttranslational durch proteolytische Spaltung aktiviert werden. Typische Beispiele sind die Proteine der Blutgerinnungskaskade. Sollen solche Proteine als Wirkstoffe entwickelt werden, muss man entscheiden, ob der rekombinante Wirkstoff zunächst einmal in der inaktiven Form hergestellt werden soll oder ob direkt das aktive Protein produziert werden kann. Gegebenenfalls muss man eine Protease, die den Wirkstoff durch Spaltung aktivieren kann, ebenfalls rekombinant herstellen. Ein Beispiel hierfür ist die CoExpression des Blutgerinnungsfaktors IX mit der Serin-Protease PACE-SOL (siehe Kapitel II.9). Manche Proteine sind auch unter physiologischen Bedingungen labil und müssen durch Bindung an andere Proteine permanent stabilisiert werden. Ein Beispiel hierfür ist der Blutgerinnungsfaktor VIII, der im Blutplasma durch die Bindung an von-Willebrand-Faktor stabilisiert wird. Deshalb wird bei der biotechnologischen Herstellung von Faktor VIII zum Teil eine cDNA für von-Willebrand-Faktor in den Produktionszellen eingebracht, damit Faktor VIII während des Herstellungsprozesses in der aktiven Form gewonnen werden kann (siehe Kapitel II.9). Manche Proteine müssen posttranslational acyliert werden, um biologisch aktiv zu sein. Bei der Acylierung werden Fettsäuren an bestimmte Aminosäuren eines Proteins geheftet. Je nach Fettsäure unterscheiden wir distinkte Klassen acylierter Proteine. Die C16-Fettsäure Palmitinsäure wird in der Regel über einen Thioester an einen Cystein-Rest gebunden. Die C14-Fettsäure Myristinsäure wird dagegen exklusiv über eine Amid-Bindung an N-terminale Glycin-Reste gekoppelt. Durch Acylierung erwerben die Proteine meist die Fähigkeit, mit Membranen zu interagieren. Oft ist diese Fähigkeit essentiell für die Funktionsfähigkeit des entsprechenden Proteins. Hieraus ergeben sich auch attraktive Ansätze für eine Pharmakotherapie. Durch Hem- Herstellung rekombinanter Expressionseinheiten mung der Acylierung lassen sich fehlregulierte Varianten derartiger Proteine in ihrer Funktion inhibieren. Interessante Beispiele für einen solchen Therapieansatz sind die Proteine p60src und p21ras. In beiden Fällen handelt es sich um Onkogen-Produkte, d. h. um Proteine, die an der Krebsentstehung beteiligt sind. Sie fungieren normalerweise als Teilstationen innerhalb komplexer Signalkaskaden, an deren Enden Signale zur Zellteilung in den Kern gelangen. Sind die p60src- bzw. p21ras-codierenden Gene mutiert, lassen sich die Proteine nicht mehr inaktivieren und senden ständig Proliferationssignale aus. Beide Proteine sind in ihrer aktiven Form obligat acyliert. Es wird daher versucht Inhibitoren zu entwickeln, die die Acylierung dieser Proteine verhindern, um damit die gestörte Funktion der Proteine zu neutralisieren. Damit wäre der unphysiologische Teilungsreiz der betroffenen Zelle abgestellt. Die Zelle würde wieder einer geregelten Wachstumskontrolle unterliegen und sich nicht permanent teilen. Dies ist eines von vielen attraktiven neuen Konzepten, Tumore kausal zu behandeln. Sulfatierungen oder γ-Carboxylierungen von Aminosäuren in Proteinen ermöglichen eine Bindung von Calcium und können sich auf die biologische Aktivität der entsprechenden Proteine auswirken. Innerhalb der Blutgerinnungskaskade beispielsweise gibt es verschiedene Proteine, wie die Faktoren II, VIII, IX und das Protein C, die umfassend posttranslational modifiziert werden. Generell verlieren diese Proteine ihre biologische Aktivität, wenn typische Modifikationen ausbleiben. Dazu zählt beispielsweise die γ-Carboxylierung an Glutamat-Resten durch eine Vitamin-K-abhängige mikrosomale Carboxylase (Abb. I.3.31). Da die entsprechenden Enzyme nur in ganz bestimmten Zellen vorkommen, müssen unter Umständen Produktionszellen mit den entsprechenden Enzymen gentechnisch ausgestattet werden, um korrekt modifizierte, heterolog exprimierte Proteine für die Wirkstoffentwicklung zu erhalten. 113 I 114 3 Genexpression H N O H N H Zusammenfassung O COOH COOH COOH CO2 Carboxylase O2 OH O CH3 CH3 O R R OH O Vitamin-K-Hydrochinon NAD Vitamin-K-Epoxid CinonReduktase O EpoxidReduktase CH3 NADH + H+ R O Vitamin K Abb. I.3.31: Vitamin-K-abhängige γ-Carboxylierung. Bei der γ- Carboxylierung werden Glutaminsäure-Seitenketten von Proteinen in einem Vitamin-K-abhängigen Schritt durch das Enzym Carboxylase am γ-C-Atom carboxyliert. Dadurch sind an das γ-C-Atom gleichzeitig zwei COOH-Gruppen gebunden, die im deprotonierten Zustand Ca2+-Ionen komplexieren können. Bei der γ-Carboxylierung wird das Vitamin-K-Hydrochinon zum Epoxid oxidiert. Dieses wird in zwei Schritten wieder zum Hydrochinon reduziert. Glycosylierungen von Proteinen gehören zu den wichtigsten posttranslationalen Modifikationen. Das Anheften von zum Teil sehr komplexen Zuckerketten an Asparagin- oder Serin-/Threonin-Seitenketten (N-Glycosylierung bzw. OGlycosylierung) der Proteine beeinflusst die Stabilität von Proteinen ebenso wie ihre Funktionalität. Die N-Glycosylierung von Proteinen erfolgt auf dem „sekretorischen Weg“. Gemeint ist die Synthese von Proteinen in das Lumen des Endoplasmatischen Retikulums, von wo aus die Proteine über vesikulären Transport zum Golgi-Apparat und von dort aus in die Zytoplasmamembran oder den Extrazellularraum gebracht werden. Im Endoplasmatischen Retikulum und dem Golgi-Appart werden die Proteine umfangreich glycosyliert. Dabei wird zunächst ein in allen Eukaryonten gleiches Zucker-Polymer (Glc3Man9GlcNAc2) übertragen, das allerdings durch Trimming und Anfügen weiterer Kohlenhydrate so stark verändert wird, dass für jeden Organismus typische Glycosylierungsmuster generiert werden. Bei der Wahl der Strategie zur Herstellung rekombinanter Proteinwirkstoffe muss auf eine eventuell notwendige Glycosylierung der rekombinanten Proteine besondere Rücksicht genommen werden. Falsche Glycosylierungsmuster können sich auf die Löslichkeit, die Aktivität, die Clearance aus dem Blutstrom und auf die antigenen Eigenschaften eines Proteinwirkstoffs auswirken. Bakterien kennen die NGlycosylierung von Proteinen gar nicht, so dass in Bakterien hergestellte Proteine grundsätzlich unglycosyliert gebildet werden. Auch heterolog in tierischen Zellen exprimierte menschliche Proteine entsprechen in der Regel nicht genau dem für diese Proteine authentischen Glycosylierungsmuster. 4 Expressionssysteme zur Proteinherstellung Zu den Hauptzielen der Gentechnik im Bereich biotechnologischer Anwendungen gehört die Expression fremder genetischer Information durch prokaryontische und eukaryontische Mikroorganismen sowie höhere Zellen aus Pflanzen oder Tieren. Für den medizinisch/pharmazeutischen Bereich handelt es sich dabei meistens – aber längst nicht immer – um Information aus dem menschlichen Genom, die zu Proteinwirkstoffen entwickelt werden sollen. Generell sprechen wir von „heterologer Genexpression“, wenn fremdes genetisches Material in egal welchem Organismus exprimiert wird. Leider gibt es keine einheitliche Strategie, nach der wir vorgehen können, um ein Protein in einem industriellen Prozess mit hoher Effizienz in einem Fremdorganismus herstellen zu lassen. Vielmehr muss für jeden Einzelfall die beste Strategie empirisch erarbeitet werden. Ein ideales, industriell nutzbares Expressionssystem sollte folgende Eigenschaften in sich vereinen: es beinhaltet ein Fermentationssystem mit hoher Ausbeute an rekombinantem Protein, Insekten- Säugetier (1) zellen (1) Hefe (26) Säugetierzellen (60) Bakterien (39) Abb. I.4.1: Nutzung von Expressionssystemen für die in Deutschland zugelassenen Biologika. Angegeben ist die Anzahl am Markt befindlicher Arzneimittel. (Quelle: Verband Forschender Arzneimittelhersteller) es liefert ein dem authentischen Vorbild möglichst nahe kommendes Produkt (z. B. wenn möglich naturidentische Aminosäuresequenz und notwendige posttranslationale Modifikationen), es bewerkstelligt die Faltung des hergestellten Proteins in die korrekte Tertiärstruktur, es erlaubt eine steuerbare Expression des rekombinanten Proteins, das Verfahren ermöglicht eine einfache Reinigung des Produktes (z. B. Sekretion in das Kulturmedium), es sichert die Abwesenheit von Pathogenen (z. B. humanpathogene Viren), es sichert die Abwesenheit von Pyrogenen, es verursacht möglichst geringe Produktionskosten (möglichst kurze Fermentationszeiten, geringe Fermentationskosten, kostengünstige Medien), es bietet die Möglichkeit zum „Upscaling“. Im Folgenden wird auf die Expressionssysteme besonders eingegangen, für die von der pharmazeutischen Industrie bereits Produkte bis zur Markreife entwickelt wurden. Eine Übersicht über die Häufigkeit der Anwendung der verschiedenen Expressionswirte in den derzeit in Deutschland zugelassenen Protein-Arzneimitteln gibt Abbildung I.4.1. 4.1 Bakterien 4.1.1 Regulierbare Operons Die effiziente Expression fremder genetischer Information interferiert oft stark mit dem normalen Wachstum der Wirtszelle. Deshalb ist es meist nicht wünschenswert, dass das FremdProtein in allen Wachstumsphasen synthetisiert wird. Dieses Problem lässt sich durch den Einsatz eines regulierbaren Promotors lösen. Viele Promotoren werden immer mit vergleichbarer I 116 4 Expressionssysteme zur Proteinherstellung Bakteriendichte Produktmenge lag-Phase logarithmische Phase Repression stationäre Phase Zeit Induktion Abb. I.4.2: Gezielte Proteinproduktion durch regulierbare Promotoren. Regulierbare Promotoren gestatten eine gezielte Produktbildung unabhängig vom Wachstum der Kultur. Um das Wachstum so wenig wie möglich durch ein Fremdprodukt zu beeinflussen, wird der Promotor, der die Expression des Fremdproduktes kontrolliert, möglichst in einem reprimierten Zustand gehalten. Erst wenn die Kultur nahezu die stationäre Wachstumsphase erreicht hat, wird die Promotoraktivität induziert. Von diesem Zeitpunkt an steigt die Produktmenge stetig, wohingegen die Bakteriendichte praktisch konstant bleibt. Rate abgelesen, sie sind „konstitutiv aktiv“. Auf der anderen Seite werden regulierbare Promotoren nur unter bestimmten Bedingungen aktiviert (induziert) bzw. inaktiviert (reprimiert). Für die Herstellung von Proteinwirkstoffen wird häufig auf regulierbare Promotoren zurückgegriffen, damit zunächst unter optimalen Wachstumsbedingungen Biomasse akkumuliert werden kann. Spät in der logarithmischen Wachstumsphase der Zellen wird dann die Expression des Fremd-Proteins induziert (Abb. I.4.2). Dies geschieht dadurch, dass wir entweder einen Repressor aus dem Kulturmedium entfernen oder dem Medium einen geeigneten Induktor hinzufügen. Einer der bekanntesten regulierbaren Promotoren steuert das Lactose-Operon (lacOperon) aus E. coli (Abb. I.4.3 A). Das lacOperon ist ein polycistronisches Operon, das für drei Proteine codiert, die E. coli für die Ver- wertung von Lactose benötigt. Eines dieser Enzyme ist die β-Galactosidase, die in der Gentechnik eine ganz große Rolle spielt, wie wir bereits in Abschnitt I.2.4 gesehen haben. Das lac-Operon wird sowohl negativ als auch positiv reguliert. Wir schauen uns zunächst die negative Regulation an. Das Regulationselement auf DNA-Ebene ist der lac-Operator (Abb. I.4.4), ein palindromisches Sequenzmotiv aus 35 Basenpaaren, das teilweise mit dem Promotor des lac-Operons überlappt. An dieses Motiv binden als Tetramer vier Moleküle des so genannten lac-Repressors. Die Synthese des lac-Repressors wird nicht reguliert, d. h. der lac-Repressor wird bei jeder Stoffwechsellage mit gleicher Rate (konstitutiv) exprimiert. Durch die Bindung des lac-Repressors an den lac-Operator wird die Transkription des lac-Operons verhindert, so dass unter „normalen“ Bedingungen in E. coli das lac-Operon nicht exprimiert wird, sondern inaktiv ist (Abb. I.4.3 B). Was verstehen wir unter „normalen“ Bedingungen? E. coli bevorzugt als Kohlenstoffquelle ganz ausgeprägt Glucose. Diese Vorliebe ist so groß, dass das Bakterium Enzyme, die andere Zucker abbauen könnten, erst gar nicht synthetisiert, solange Glucose als C-Quelle verfügbar ist. Das lac-Operon ist eine genetische Informationseinheit, die zuckerverwertende Enzyme – nämlich u. a. die β-Galactosidase zum Abbau von Lactose – codiert. Erst wenn keine Glucose mehr verfügbar ist, greift E. coli auf alternative C-Quellen wie Lactose zurück. Ein Induktor ist ein niedermolekulares Molekül, das der Zelle signalisiert, dass eine Stoffwechsellage eingetreten ist, die die Aktivierung eines reprimierten Operons erfordert. Als Induktoren für das lac-Operon fungieren Galactose(β1–4)glucose (Lactose) bzw. Galactose(β1–6)glucose (Allolactose) und auch andere β-Galactoside. Der Induktor ist ein Ligand an einem Repressorprotein, hier dem lac-Repressor. Der Repressor ändert durch die Bindung des Induktors seine Konformation und verliert dadurch seine Affinität zum Operator. Er dissoziiert also von seiner Bindungsstelle und gibt das lac-Operon zur Transkription frei (Abb. I.4.3 C). 4.1 A lac I Promotor ATG lac Z lac Y ATG Bakterien 117 Termilac A nator ATG DNA Operator Operator „verschlossen“ lac Z B lac I I lac Y lac A DNA keine Transkription mRNA Repressor tetramer monomer C Operator Promotor „offen“ lac Z lac I lac Y lac A DNA Transkription mRNA Repressor (Protein) Transaceβ-Galactotylase Permease sidase Induktor OH Lactose 4 OH O HO β OH Galactose 1 OH 1 HO O OH O 4 OH Glucose β-galactosidische Bindung Abb. I.4.3: Regulation des lac-Operons. A. Das Lactose-Operon aus E. coli ist ein polycistronisches Operon, dessen regulierbarer Promotor die Expression dreier Gene (Cistrons) kontrolliert. Die Gene codieren die Proteine β-Galactosidase (lacZ), Permease (lacY) und Transacylase (lacA). Der für die Regulation verantwortliche Bereich ist eine kurze Sequenz zwischen Promotor und dem β-Galactosidase-Gen, den wir als lac-Operator bezeichnen. B. Der lac-Operator fungiert als spezifische Bindestelle für den lac-Repressor (LacI), einem Protein, das als Tetramer an den lac-Operator bindet und damit die Transkription des lac-Operons verhindert, d. h. das lac-Operon befindet sich in einem reprimierten Zustand. Dies ist natürlicherweise immer dann der Fall, wenn die Zellen auf Glucose als C-Quelle zugreifen können. C. Ist keine Glucose vorhanden, statt dessen aber Lactose, Allolactose oder artifizielle Galactoside wie beispielsweise Isopropyl-β-D-thiogalactosid (siehe Abb. I.4.5), so binden diese Induktoren an den lac-Repressor, der dadurch seine Affinität zum lac-Operator verliert. Nun kann das Operon transkribiert werden, und unter diesen Induktionsbedingungen werden die drei von dem Operon codierten Proteine synthetisiert. Es gibt auch artifizielle Induktoren für das lacOperon wie z. B. Isopropyl-β-D-thiogalactosid (IPTG) (Abb. I.4.5). IPTG besitzt eine hohe Affinität zum lac-Repressor, ist allerdings kein Substrat für die β-Galactosidase, die thioglycosidischen Bindungen nicht spalten kann. Das ist wichtig, weil normale Produktionsstämme in der Regel neben dem vom lac-Promotor kontrollierten Transgen auch ihr endogenes Lactose-Operon enthalten. Würden wir einen solchen Produktionsstamm mit Lactose zur Bildung des rekombinanten Proteins anregen, würde die Produktion sehr schnell wieder abnehmen, weil die β-Galactosidase den Induktor spalten würde. Wollen wir ein Fremdgen in E. coli reguliert exprimieren, können wir uns eines modifizierten lac-Operons bedienen (Abb. I.4.5). Im Prinzip tauschen wir dazu die lac-Gene des lacOperons durch die zu exprimierende cDNA aus. 118 4 Expressionssysteme zur Proteinherstellung 5'-… 3'-… TGTGTGGAATTGTGAGCGGATAACAATTTCACACA ACACACCTTAACACTCGCCTATTGTTAAAGTGTGT …-3' …-5' Palindrom 5'-… 3'-… C GG G A A T G A T–A G–C T–A T–A A–T A–T G T G–C T–A G–C T–A G–C T–A A–T C–G A–T C–G A–T C–G C A T–A T–A A–T A–T C–G A–T C T T A C T GCC …-3' …-5' Abb. I.4.4: Der palindromisch organisierte lac-Operator. Allerdings wird nicht das bakterielle lacOperon selbst modifiziert. Vielmehr werden auf einem Expressionsplasmid alle benötigten Komponenten kloniert: der lac-Promotor nebst Operatorsequenz, ein Transkriptions-Terminator, sowie das Gen für den lac-Repressor. Obwohl ja das E.-coli-Genom den lac-Repressor bereits enthält, ist es oft vorteilhaft, eine weitere Kopie des lac-Repressors auf das Expressionsplasmid zu klonieren. Dadurch wird die Konzentration des lac-Repressors in der Bakterienzelle ausreichend erhöht, um die lac-Promotoren auf allen Plasmidkopien zu reprimieren. Neben der negativen Regulation des lacOperons durch den lac-Repressor gibt es noch eine positive Regulation. Diese Regulation bezeichnen wir als Katabolit-Aktivierung. Sie beruht darauf, dass in Abwesenheit von Glucose die intrazelluläre Konzentration von cyclischem Adenosin-3',5'-Monophosphat (cAMP) ansteigt. Das ist übrigens nicht nur in E. coli so. Ein Hungerzustand ist auch in tierischen Zellen unter anderem dadurch charakterisiert, dass die intrazelluläre cAMP-Konzentration ansteigt. Daher kann man cAMP auch als ubiquitäres Hungersignal bezeichnen. In Bakterien bindet ein Teil dieses cAMPs an ein Protein mit 210 Aminosäuren, das wir als CRP (cAMP-Rezeptorprotein) bezeichnen. Zwei dieser mit cAMP beladenen Proteinkopien binden oberhalb des lac-Promotors (Abb. I.4.6). Dadurch erhöhen sie die Affinität der RNA-Polymerase zum lac-Promotor, was seinerseits die Effizienz der Transkription steigert. Praktisch wirkt sich die Regulation des lacPromotors so aus: Wachsen die Zellen in Gegenwart von Glu- cose, ist der lac-Promotor inaktiv. Das in E. coli konstitutiv synthetisierte lac-Repressor- 4.1 A lac I 119 Terminator Transgen Promotor Bakterien DNA keine Transkription I B lac I Operator Transgen DNA Transkription mRNA OH IPTG OH O HO CH3 β 1 S CH OH CH3 Isopropyl-β-D-thiogalactosid Induktor Abb. I.4.5: Regulation eines rekombinanten Operons. Die induzierte Transkription des lac-Operons (vgl. Abb. I.4.3) kann man nutzen, um die Expression von Transgenen zu regulieren. Dazu werden die Gene des lac-Operons entfernt und durch die cDNA für das Transgen ersetzt. Die Expression des Transgens wird durch den lac-Repressor (LacI) reprimiert. Induziert wird die Expression des Transgens durch Zugabe des Induktors Isopropyl-β-D-thiogalactosid (IPTG). Protein bindet in dieser Stoffwechsellage an den lac-Operator und blockiert die Transkription. Geben wir zu der Kultur den nicht metabolisierbaren Induktor IPTG, bindet dieses nicht verstoffwechselbare Galactosid an den Repressor. Dadurch ändert sich die Konformation des Repressors derart, dass er seine Affinität zum Operator verliert, abdissoziiert und den Promotor für die Bindung der RNA-Polymerase frei gibt. Wollen wir die volle Promotorstärke erreichen, darf keine Glucose mehr im Medium vorhanden sein. Erst dann bindet der CRPcAMP-Komplex oberhalb des lac-Promotors und gewährleistet eine maximale Affinität der RNA-Polymerase an den lac-Promotor (Abb. I.4.6). CRP cAMP Operator Promotor lac Z lac I lac Y lac A Terminator DNA Transkription mRNA Repressor Transaceβ-GalactoPermease tylase sidase Induktor Abb. I.4.6: Katabolit-Aktivierung des lac-Operons. Entzieht man einer E.-coli-Zelle Glucose, so steigt die intrazelluläre cAMP-Konzentra- tion an. Ein Teil dieses cAMPs bindet an ein Protein, das wir als CRP (cAMP-Rezeptorprotein) bezeichnen. Dieser CRP-cAMP-Komplex bindet an eine Sequenz innerhalb des Kontrollbereiches des lac-Operons und erhöht dadurch die Effizienz der Transkription. Somit wird das lacOperon durch den CRP-cAMP-Komplex positiv und durch den lac-Repressor (LacI) negativ reguliert. 120 4 Expressionssysteme zur Proteinherstellung In der Praxis lassen wir die Kultur in Gegenwart einer limitierenden Konzentration von Glucose wachsen. Die Glucose-Menge ist so berechnet, dass sie kurz vor dem Eintreten der Kultur in die stationäre Phase verbraucht ist. Zu diesem Zeitpunkt mischen wir der Kultur IPTG bei, worauf sehr bald die Expression des Fremd-Gens maximal induziert wird. Der regulierbare trp-Promotor steuert das Tryptophan-Operon. Auch dieser Promotor wird negativ durch ein entsprechendes Repressorprotein, dem trp-Repressor, kontrolliert. Der Interaktionspartner des trp-Repressors ist die Aminosäure Tryptophan. Anders als beim lacRepressor, der durch die Bindung des Induktors seine Affinität zum lac-Operator verliert, bindet der trp-Repressor dann an den Operator, wenn er mit Tryptophan assoziiert ist. Physiologisch wird dadurch sichergestellt, dass die Enzyme für die Tryptophan-Biosynthese nur dann synthetisiert werden, wenn in der Zelle ein Tryptophan-Mangel herrscht. Liegt Tryptophan hingegen im Überschuss vor, wird das trp-Operon durch den Tryptophan/trp-Repressor-Komplex abgeschaltet. Wollen wir nun den trp-Promotor induzieren, müssen wir dafür sorgen, dass sich kein Komplex zwischen dem trp-Repressor und der Aminosäure Tryptophan bilden kann. Dies können wir dadurch erreichen, dass wir dem Medium 3-Indolacrylsäure oder 3-Indolpropionsäure zusetzen. Einer der am häufigsten verwendeten starken Promotoren für E. coli ist der so genannte tac-Promotor. Hierbei handelt es sich nicht um einen natürlichen Promotor, sondern um einen artifiziellen Hybrid-Promotor aus den Promotoren des lac-Operons (lac-Promotor) und des Tryptophan-Operons (trp-Promotor). Zur Konstruktion des tac-Promotors wurde die –10-Region dem lac-Promotor und die –35-Region dem trp-Promotor entliehen. Der tac-Promotor ist wegen der besseren –35-Region stärker als der lac-Promotor, wird aber ähnlich reguliert wie der lac-Promotor. Ein weiterer, starker, regulierbarer Promotor ist der pL-Promotor des Bakteriophagen Lambda. Dieser Promotor wird durch das cIRepressorprotein negativ kontrolliert. In der Praxis wird häufig eine Temperatur-sensitive Mutante des cI-Repressors verwendet, der cI857-Repressor. Die Zellen, die diesen temperatursensitiven cI857-Repressor enthalten, werden zunächst bei 28 °C bis 30 °C gezüchtet. Bei dieser „permissiven“ Temperatur liegt der cI857Repressor in seiner aktiven Form vor und blockiert den pL-Promotor. Haben die Zellen die gewünschte Kulturdichte erreicht, wird die Wachstumstemperatur auf die nicht-permissive Temperatur von 42 °C erhöht. Bei dieser Temperatur kann der cI857-Repressor nicht mehr an den pL-Promotor binden. Er wird inaktiviert und gibt den Promotor für die Bindung der RNA-Polymerase frei. Wir sprachen von der Repression der drei Promotoren lac, tac und pL. Lassen sie sich wirklich vollständig abschalten? Weder der lac-Promotor noch der tac-Promotor noch der pL-Promotor lassen sich zu 100 % reprimieren. So wird selbst unter reprimierten Bedingungen eine geringe Menge an Fremd-Protein synthetisiert. Handelt es sich bei dem Fremd-Protein um ein Molekül, das für die Bakterienzellen toxisch ist und sehr effizient das Wachstum der E.-coli-Zelle verhindert, so ist es fast nicht möglich, das gewünschte Plasmid herzustellen. Wir sprechen in diesem Fall von „natürlicher Gegenregulation“, eine gefürchtete Komplikation bei der Realisierung eines gentechnischen Vorhabens. In diesem Fall helfen wir uns dadurch, dass wir die Fremd-DNA in einem Zweikomponentensystem klonieren: Die erste Komponente erlaubt die Klonierung des Plasmides in absoluter Abwesenheit der Expression des rekombinanten Proteins, die zweite Komponente erlaubt die Expression des Transgens unter definierten Bedingungen. Der Bakteriophage T7 enthält zwei Promotoren: einen „frühen“ und einem „späten“ Promotor. Wenn der T7-Phage seine DNA in die infizierte Zelle transferiert hat, erkennt die E.-coli-RNA-Polymerase den frühen Promotor. Eines der Genprodukte, die dann hergestellt werden, ist die T7-RNA-Polymerase. Die T7-RNA-Polymerase bindet an den „späten“ T7-Promotor und transkribiert die später im Infektionszyklus erforderlichen Gene. Der „späte“ T7-Promotor wird in speziellen bakteriellen Expressionsplasmiden verwendet. 4.1 colE1-ori T7-Terminator MCS T7-Promotor pET-16b ampR lacI Abb. I.4.7: pET-Vektor. Die Abkürzung pET steht für „plasmid for expression by T7 RNA polymerase“. In pET-Plasmiden wird der T7Promotor zur Expression eines Transgens benutzt. Die RNA-Polymerase normaler E.-coli-Zellen kann den T7-Promotor nicht erkennen, so dass das Transgen zunächst nicht exprimiert werden kann. Dies ermöglicht die Herstellung rekombinanter Vektoren bei absoluter Abwesenheit des von der einklonierten cDNA codierten Proteins. Die Expression des rekombinanten Proteins wird erst dann ermöglicht, wenn das fertig gestellte Plasmid in einen speziellen Expressionsstamm transformiert wird, der den Lambda-Phagen DE3 lysogen enthält. Im DE3-Genom ist das Gen für die T7-RNA-Polymerase enthalten. Die Bildung der T7-RNA-Polymerase steht unter der Kontrolle des mit IPTG induzierbaren lacUV5-Promotors. In einem solchen Expressionsstamm wird zunächst die Bildung der T7-RNAPolymerase induziert, welche dann wiederum die Expression der transgenen cDNA bewirkt. Dieser Promotor ist in normalen, nicht mit T7 infizierten Zellen absolut inaktiv, da die T7RNA-Polymerase fehlt. Wir klonieren also die zu exprimierende cDNA in ein solches Expressionsplasmid (z. B. pET-Vektoren; Abb. I.4.7) und erst danach wird die Expression des Transgens induziert. Dies kann auf zwei Arten geschehen: Bakterien gebildete T7-RNA-Polymerase wiederum bindet an den T7-Promotor oberhalb des Transgens und sorgt so für dessen Expression. Der Vorteil dieser Methode ist, dass die T7-RNA-Polymerase ein sehr aktives Enzym ist und große Mengen RNA produziert, so dass wir viel rekombinantes Protein bekommen. Allerdings ist – wie schon erwähnt – der lac-Promotor auch im reprimierten Zustand etwas aktiv, so dass das Transgen in den BL21(DE3)-Zellen auch im nicht-induzierten Zustand in geringen Mengen vorhanden sein könnte. Ist das rekombinante Protein extrem toxisch für die Zellen des Produktionsstamms, wird das Wachstum der Bakterien und damit die Akkumulation von Biomasse möglicherweise auch in diesem System beeinträchtigt. Die Alternative ist deshalb, das rekombinante pET-Plasmid in einem Klonierstamm zu belassen, der keine T7-RNA-Polymerase besitzt. Die Bakterien werden zunächst vermehrt, bis ausreichend Biomasse gewonnen wurde. Nun werden die Bakterien mit dem λ-Phagen CE6 infiziert. Dieser Phage trägt das Gen für die T7-RNA-Polymerase unter der Kontrolle des pL-Promotors. Da bei dieser Methode das Wachstum der Bakterienzellen in Abwesenheit des rekombinanten Proteins erfolgt, kann man mit dieser Methode auch solche Proteine exprimieren, die zu toxisch für eine Produktion in DE3-lysogenen BL21-Zellen sind. 4.1.2 Optimierung der Translationseffizienz Das rekombinante pET-Plasmid wird in ei- nen speziellen Expressionsstamm transformiert (BL21). Dieser Expressionsstamm wurde zuvor mit dem λ-Phagen DE3 infiziert, der die T7-RNA-Polymerase unter der Kontrolle des oben erwähnten lac-Promotors enthält. Der DE3-Phage liegt im lysogenen Zustand (vgl. Kapitel I.2.4.3) in den BL21-Zellen vor. Nachdem das pET-Plasmid in den BL21(DE3)-Stamm transformiert wurde, wird die Expression der T7-RNA-Polymerase mit IPTG induziert. Die daraufhin Bakterielle Expressionssysteme benötigen im Gegensatz zu eukaryontischen Expressionssystemen eine Kontrollregion, die die Translation optimiert. Wir haben diese Kontrollregion bereits als Shine-Dalgarno-Sequenz kennengelernt (siehe Abschnitt I.3.1.2). Ohne eine solche Kontrollregion wäre die Translation sehr ineffizient. Somit könnte auch keine Bemühung zur Optimierung der Transkriptions-Effizienz greifen, da die effizient synthetisierte mRNA nur sehr ineffizient in Protein übersetzt würde. 121 I 122 4 Expressionssysteme zur Proteinherstellung Um die Translation möglichst optimal starten zu lassen, sind einige Punkte zu beachten: Mindestens vier Nukleotide der Shine-Dal- garno-Konsensus-Sequenz 5'-AGGAGG-3' sollten vorhanden sein. Diese Shine-Dalgarno-Sequenz sollte möglichst exakt acht Nukleotide vor dem AUGStart-Codon liegen. Ferner sollte die Sequenz zwischen der Shine-Dalgarno-Region und dem AUG möglichst ausschließlich aus A- und U-Nukleotiden bestehen. Schließlich sollten sich in diesem Bereich keine Sekundärstrukturen ausbilden können, die ebenfalls die Translations-Effizienz negativ beeinflussen würden. Neben dem Methionin-Codon AUG können auch die Codons GUG für Valin oder UUG für Leucin als Initiations-Codons fungieren. Bei der Optimierung eines Expressions-Plasmids sollte daher zwischen dem Promotor und dem eigentlichen Translations-Initiations-Codon kein weiteres AUG oder eines der alternativen Start-Codons vorkommen. Ferner ist es ratsam, unmittelbar vor der Shine-Dalgarno-Sequenz eine Reihe von Translations-Terminations-Signalen zu positionieren, wobei möglichst alle drei Leserahmen durch mindestens ein Stopp-Codon abgedeckt werden sollten. 4.1.3 Sekretionssysteme E. coli bietet nur relativ wenig Möglichkeiten, heterolog exprimierte Proteine in das Kulturmedium zu sezernieren. Dennoch ist es sehr häufig wünschenswert, durch geeignete Signalsequenzen sicherzustellen, dass das Produkt sezerniert wird. Warum? Zum Beispiel lassen sich sezernierte Pro- teine in der Regel besser aufarbeiten als solche, die in der Zelle verbleiben. Es würde sich erübrigen, die Bakterien-Zellen aufzuschließen und das Produkt würde nicht unnötig mit zellulären Komponenten des Bak- teriums kontaminiert werden (Abb. I.4.8). Eine besonders relevante Kontamination ist bakterielle DNA, die zuverlässig entfernt werden muss, wenn das Produkt als Therapeutikum verwendet werden soll. Wird ein Protein sezerniert, wird meist während des Sekretions-Prozesses ein Teil vom N-Terminus, dem Beginn des Proteins, abgeschnitten. Nur so ist es möglich, Proteine zu gewinnen, die an ihrem N-Terminus kein Methionin tragen. Warum dies wichtig ist, wollen wir uns an folgendem Beispiel verdeutlichen. Die erste verfügbare rekombinante Variante des humanen Wachstumshormons (hGH = human growth hormone), das in den USA unter dem Namen Somatrem im Handel war, enthielt das so genannte Met-hGH (Methionyl-hGH). Dieses Wachstumshormon beginnt mit einem Methionin, das allerdings in authentischem humanem Wachstumshormon nicht vorhanden ist. Durch Variation der ExpressionsKassette gelang es, eine Variante zu konstruieren, die von E.-coli-Zellen sezerniert wird. Dabei verliert das rekombinante Protein einen Teil seines N-Terminus. So erhält man ein rekombinantes hGH, das ebenso wie das authentische humane Wachstumshormon mit der Aminosäure Phenylalanin beginnt. Obwohl beide Varianten des humanen Wachstumsfaktors physiologisch aktiv sind, wird doch angestrebt, ein möglichst authentisches Produkt herzustellen. So lassen sich Risiken, wie die ungewollte Induktion von Antikörpern durch ein verfremdetes Protein, weitestgehend ausschließen. In Deutschland sind heute Präparate mit MethGH als Wirkstoff nicht mehr im Handel. Für die physiologische Wirkung nahezu aller Proteine ist eine korrekte Faltung, d. h. die Ausbildung einer nativen Sekundärund Tertiärstruktur sehr wichtig. Eine solche korrekte Proteinfaltung scheint sich oft im periplasmatischen Raum – das ist der Spalt zwischen der Zytoplasmamembran und der bakteriellen Zellwand – besser ausbilden zu können. Auch Disulfid-Brücken, die in vielen Proteinen die Tertiärstruktur stabilisieren, werden generell wesentlich besser im 4.1 Bakterien 123 Transgenes Bakterium I Expression des Gens rekombinantes Protein im Periplasma rekombinantes Protein in Einschlusskörpern Isolierung des rekombinanten Proteins Zelllyse und Isolierung der Einschlusskörper mit dem denaturierten Protein “Osmotische” Zerstörung der äußeren Membran und Isolierung des nativen Proteins Abb. I.4.8: Intrazelluläre Produkt-Akkumulation vs. Proteinsekretion. Prinzipiell sind zwei Möglichkeiten bei der heterologen Expression von Transgenen in Bakterien denkbar: Entweder akkumuliert das Genprodukt intrazellulär (linke Bildhälfte) oder es wird in das Periplasma sezerniert (rechte Bildhälfte). Bei der Bildung von Proteinen im Zytoplasma der Bakterienzelle bilden sich häufig Einschlusskörper (inclusion bodies). Im Periplasma liegen die rekombinanten Proteine meist im nativen Zustand vor. Bei intrazellulärer Ablagerung des rekombinanten Proteins muss die gesamte Bakterienzelle lysiert werden, wenn das Protein gereinigt werden soll. Demgegenüber kann man den Großteil zellulärer Proteine abtrennen, wenn man das rekombinante Protein aus dem Periplasma isoliert. Dazu wird die äußere Membran der Bakterien durch Inkubation in 20-%iger Saccharose und EDTA destabilisiert und dann durch Transfer in einem Mg2+-haltigen Puffer durch osmotischen Schock abgelöst und so das Periplasma freigesetzt. Periplasma ausgebildet als im Inneren der bakteriellen Zelle. Im Periplasma herrscht nämlich ein Milieu vor, das die Reduktion zweier Cysteine zu einer Disulfidbrücke deutlich erleichtert. Das wohl am häufigsten verwendete Sekretions-System für E. coli basiert auf der Signalsequenz der Alkalischen Phosphatase, die durch das phoA-Gen codiert wird. Dieses Gen beginnt mit einer Sequenz, die für einen relativ hydrophoben Proteinteil codiert. Dieser Bereich wird noch während der Synthese des Restproteins von Zellkomponenten erkannt, die dafür sorgen, dass das Protein durch die Membran ins Periplasma transportiert wird. Fusionieren wir die DNA-Sequenz für dieses N-terminale Sig- nalpeptid des phoA-Gens mit dem Beginn unseres heterolog zu exprimierenden Gens, so dirigiert diese Sequenz unser Protein zur Zellmembran und schiebt es durch die Membran. Noch während dieses Translokationsprozesses ins Periplasma wird das Signalpeptid durch membranständige Proteasen entfernt. Nun verstehen wir auch, wie es möglich ist, Proteine zu erhalten, die – wie im Falle des hGH – nicht mit einem Methionin beginnen. Wir integrieren die Sequenz für das Signalpeptid so vor das Gen, dessen Produkt die E.-coli-Zelle sezernieren soll, dass nach Hydrolyse durch die membranständige Protease das rekombinante Protein mit der korrekten Aminosäure beginnt. Eine andere Möglichkeit, heterolog exprimierte Proteine aus der E.-coli-Zelle auszu- 124 4 Expressionssysteme zur Proteinherstellung schleusen, bietet eine Signalsequenz des Hämolysins. Hämolysin akkumuliert nicht im Periplasma, sondern wird durch die Zytoplasmamembran, durch die Zellwand und durch die äußere Membran der gramnegativen Bakterien ins Medium sezerniert. Die Signalsequenz befindet sich in diesem Fall nicht am N-Terminus des Proteins, sondern an seinem C-Terminus. Dieses System lässt sich nutzen, indem die codierende DNA für das Signalpeptid an das Ende des Gens für das heterolog zu exprimierende Protein gehängt wird. Damit erreichen wir, dass auch unser Protein – ähnlich wie Hämolysin – direkt ins Kulturmedium abgegeben wird. 4.1.4 Fusionssysteme zur effizienten Produktreinigung Nicht alle heterolog gewonnenen Proteine können, wie beschrieben, von den Zellen sezerniert werden. In solchen Fällen brauchen wir Möglichkeiten, um die synthetisierten und in der Zelle akkumulierten Proteine effizient von Zellproteinen trennen zu können. Eine Möglichkeit ist, sie als Fusionsproteine zu exprimieren, wobei der Fusionsanteil die rekombinanten Proteine mit Eigenschaften versieht, die die Aufreinigung der Proteine erleichtern. Nach der Aufreinigung werden die Fusionsteile – im englischen Sprachgebrauch auch Tags genannt – z. B. durch spezifische Proteasen wieder entfernt. Eine andere Möglichkeit besteht darin, das zu exprimierende Gen mit dem β-Galactosidase-Gen aus E. coli zu fusionieren. Für die bakterielle β-Galactosidase steht eine Vielzahl spezifischer Antikörper zur Verfügung, die sich an eine Matrix, beispielsweise aus Sepharose, kovalent binden lassen. Diese modifizierte Matrix kann nun in eine Chromatographiesäule gefüllt werden, wodurch ein Affinitätsmedium entsteht, das den β-Galactosidase-Anteil des Fusionsproteins effektiv bindet. Alternativ zur β-Galactosidase kann auch das Gen für die Chloramphenicol-Acetyltransferase als Fusionsanteil verwendet werden, der ebenfalls über ein Affinitätsmedium mit Antikörper aufgerei- nigt werden kann. Demgegenüber lassen sich Fusionen mit dem Enzym Glutathion-S-Transferase über Säulen reinigen, an die Glutathion kovalent gebunden wurde. Darüber hinaus gibt es eine Reihe weiterer Protein-Tags, die speziell für eine effiziente Reinigung der rekombinanten Fusionsproteine entwickelt wurden. Ein solcher Ansatz beruht darauf, das rekombinante Protein über Metallchelat-Komplexe zu reinigen. Dazu wird das zu exprimierende Protein um einen Fusionsteil verlängert, der an Metallionen auf der Säulenmatrix bindet und mit dessen Hilfe eine Aufreinigung möglich ist. Dieser Ansatz wird derzeit durch die „His-Tags“ häufig angewendet. Ein His-Tag ist ein aus 6–8 Aminosäuren bestehendes Peptid, das ausschließlich aus Histidin-Resten besteht. Ein solcher His6-Tag kann N- oder C-terminal an das rekombinante Protein fusioniert werden (Abb. I.4.9). Die Histidine binden über die Ausbildung eines Metallchelat-Komplexes an kommerziell verfügbare Säulen, die mit Zn2+- oder Ni2+-Ionen beladen sind (Abb. I.4.9). Von diesen Chelatsäulen lassen sich die Fusionsproteine durch einen Imidazolgradienten eluieren. Abbildung I.4.9 zeigt beispielhaft einen häufig gebrauchten Expressionsvektor aus der pGEX-Reihe, der es erlaubt, ein Fusionsprotein gleich mit zwei Tags zu versehen: einem Peptid aus sechs Histidinen und der Glutathion-S-Transferase. Damit kann das rekombinante Protein über eine mit Ni2+ beladene Metallchelat-Affinitätschromatographie und/ oder über die Affinitätschromatographie an Glutathion gereinigt werden. Der Fusionsanteil ist zwar für die Reinigung des gewonnenen Proteins nützlich, aber er muss sich nach der Reinigung wieder möglichst einfach entfernen lassen, um einerseits die Funktionalität und andererseits die Authentizität des Proteins zu gewährleisten. Dazu muss an der Fusionsstelle eine Sequenz eingebaut werden, die eine möglichst spezifische Abspaltung erlaubt. Zum Abspalten des Fusionsanteils können entweder chemische oder enzymatische Methoden angewendet werden. 4.1 A Bakterien 125 B tac-Promotor his6 ATG¬CAT¬CAC¬CAT¬CAC¬CAT¬CAC¬...¬... ... ... ... ... ... Met¬His¬His¬His¬His¬His¬His¬Rek¬omb¬ina¬nte¬s_P rot¬ein lacI I GST C R pGEM-5T HN O O CH2 N – O N MCS ampR O CH2 HN colE1-ori N N N H N Ni2+ – O OH O O O O R Abb. I.4.9: Affinitätsreinigung von Fusionsproteinen über „Tags“. A. Der Vektor pGEX-5T enthält einen tac-Promotor, der die Expression eines Transgens kontrolliert. Außerdem befinden sich auf dem Plasmid ein Gen für den lac-Repressor (LacI) und ein Ampicillin-Resistenzgen. B. Der Vektor enthält hinter dem Translationsstart-Codon ATG sechs Basen-Tripletts, die jeweils für Histidin codieren. Hinter diesen His6-Tag kann man im fortlaufenden Leserahmen ein Gen für ein rekombinantes Protein klonieren. Das Produkt wäre dann ein His6-markiertes rekombinantes Protein. Im Fall des Vektors pGEX-5T folgt auf den His6-Tag zunächst die codierende Region für eine Glutathion-S-Transferase (GST) und dann eine Multiple cloning site (MCS), in die ein Transgen einkloniert werden kann. Das Produkt des Vektors ist also ein His6-GSTmarkiertes Protein, das sowohl an Ni2+/NTA- (Nitriloessigsäure) als auch an Glutathion-Säulen gereinigt werden kann. C. His6-markierte Proteine lassen sich an Metallchelat-Säulen wie Ni2+/NTA aufreinigen. Histidinreste können über ihre Imidazolringe zwei Koordinierungsstellen des Ni2+ einnehmen. Chemische Methoden sind u. a. Cyanbromid oder Cyanchlorid, wobei die Spaltung in saurem Milieu ausschließlich nach einem Methionin erfolgt. Ameisensäure spaltet zwischen einem Asparagin und einem Prolin. Hydroxylamin hingegen hydrolysiert bei pH 9 die Peptidbindungen zwischen einem Asparagin- und einem Glycin-Rest. 2-Nitro-5-thiocyanobenzoesäure spaltet Proteine vor Cysteinen. Enzymatische Methoden beinhalten den Einsatz von Exopeptidasen, wie Carboxypeptidase A, die alle C-terminalen Aminosäuren mit Ausnahme der Aminosäuren Arginin oder Lysin entfernt, oder Carboxypeptidase B, die Cterminale Arginin- oder Lysin-Reste entfernt. Als sequenzspezifische Endopeptidasen lassen sich z. B. Faktor Xa oder Thrombin verwenden. 4.1.5 Plasmidstabilisierung Die Plasmide, die wir für die Proteingewinnung in die Zellen einschleusen, sind für die transformierten Zellen immer eine Bürde. Das trifft vor allem dann zu, wenn diese Plasmide für Produkte codieren, die die Zellphysiologie beeinträchtigen. Somit beobachten wir häufig die Tendenz, dass Plasmide von der Wirtszelle „abgestoßen“ werden. Dieses Gleichgewicht zwischen Zellen mit und ohne Plasmid muss möglichst zugunsten von Zellen eingestellt werden, die das Plasmid enthalten. Dies gilt um so mehr, wenn ein Produktionsstamm über längere Zeit ausreichende Mengen eines rekombinanten Produktes liefern soll. Warum Plasmide verloren gehen, bzw. warum Produktionsstämme instabil werden, kann verschiedene Ursachen haben. Die Verteilung von Plasmiden bei der Zellteilung ist häufig ein Zufallsprozess. Wenn sich eine Zelle teilt, die Plasmidmoleküle enthält, kann jede Tochterzelle theoretisch 0 bis Plasmidmoleküle er- 126 4 Expressionssysteme zur Proteinherstellung halten („segregationale Instabilität“). Für Plasmide, die zufällig auf die Tochterzellen verteilt werden, ist die Wahrscheinlichkeit P(0), dass plasmidfreie Zellen entstehen, durch die Binominalverteilung P(0) = 2(n–x) gegeben. Dabei ist die Anzahl der Plasmide pro Zelle. Zudem verbrauchen Plasmid-tragende Zellen deutlich mehr Energie als Plasmid-freie Zellen, da die zusätzliche genetische Information repliziert, transkribiert und translatiert werden muss. Ein weiterer Aspekt ist, dass man umso häufiger Segreganden erhält, je höher die Genexpressionsrate eines Plasmids ist. Zusätzlich werden rekombinante Plasmide dann besonders instabil, wenn das Produkt des klonierten Gens inhibierend auf das Wachstum der Wirtszelle wirkt. Nicht immer muss das komplette Plasmid verlorengehen, um Veränderungen der Produktionszelle hervorzurufen. Auch Punktmutationen oder Rekombinationen auf dem Plasmid können die Ursache für Produktionseinbußen sein. Man bezeichnet dies als „strukturelle Instabilität“. Zudem können mobile genetische Elemente, wie Transposons oder Insertionssequenzen, die Deletion von DNA-Bereichen aus rekombinanten Plasmiden fördern und sollten daher auf Plasmiden möglichst nicht vorhanden sein. Generell können wir festhalten, dass Plasmid-freie Zellen oft schneller wachsen als Plasmid-tragende Zellen, so dass in einer Mischpopulation – auch bereits während eines einzelnen Fermentationsprozesses – plasmidfreie Zellen sehr schnell akkumulieren und die Plasmid-haltigen Zellen überwachsen können. 4.1.6 Möglichkeiten, rekombinante Stämme zu stabilisieren Obwohl der Verlust eines Plasmids nicht ausgeschlossen werden kann, sind doch Maßnahmen denkbar, die das Risiko eines Plasmidverlustes minimieren. Im Folgenden wollen wir auf einige Möglichkeiten dazu kurz eingehen. Plasmide können dadurch stabilisiert werden, dass auf dem Plasmid Funktionen implementiert werden, die für das Zellwachstum in einer bestimmten Umgebung erforderlich sind. Resistenz-Marker sorgen dafür, dass nur Zellen mit einem entsprechenden Plasmid in Gegenwart eines korrespondierenden Antibiotikums überleben können. Beispielweise können Zellen in Gegenwart von Ampicillin nur wachsen, wenn sie ein entsprechendes Resistenzgen tragen. Dieses Resistenzgen positionieren wir auf dem Expressions-Plasmid, so dass nur Zellen in einem ampicillinhaltigen Medium wachsen können, die auch ein Plasmid tragen (Abb. I.4.10). Geht das Plasmid verloren, sterben die Zellen. Ein Überwachsen des Produktionsstammes durch plasmidlose Zellen ist somit nicht möglich. Ebenso können wir auch Auxotrophie-Marker auf Plasmiden verwenden, um ein WirtVektor-System zu stabilisieren. AuxotrophieMarker sind Gene, die eine Mutation im Wirtsgenom korrigieren. Ohne diese Korrektur würden die Zellen einen bestimmten Nährstoffzusatz, beispielsweise eine Aminosäure oder ein Vitamin, benötigen, um wachsen zu können. Auch durch diese Strategie selektionieren wir gezielt auf Zellen mit einem Plasmid. Ein Überwachsen der Kultur durch plasmidfreie Zellen ist auch hier unwahrscheinlich. Rekombinante Stämme sind auch dann wesentlich stabiler, wenn die zu exprimierende genetische Information auf dem Plasmid über weite Phasen des Wachstums in einem reprimierten Zustand gehalten wird. Daher werden in Produktionsstämmen möglichst nur solche Plasmide eingesetzt, die eine kontrollierte Expression der fremden genetischen Information erlauben. Eine weitere Möglichkeit, Plasmide zu stabilisieren, besteht darin, dass sie ein DNA-Fragment oder ein Gen enthalten, das die Wachstumsrate der Wirtszellen positiv beeinflusst. Wie bereits erwähnt, sollten Elemente aus Transposons oder Insertionselementen unter allen Umständen gemieden werden. Derartige Elemente neigen naturgemäß stark zur Rekombination und gehen leicht verloren. Auch ist es ratsam, unnötige DNA von Plasmiden zu eliminieren. Je kleiner die Plasmide sind, um so stabiler sind sie. Auch sollte keine redundante DNA auf dem Plasmid vorhanden sein, denn dadurch steigt die Wahrscheinlichkeit von Re- 4.1 Bakterien 127 I + Selektion – Selektion Bakteriendichte Bakteriendichte Zeit Zeit Abb. I.4.10: Stabilisierung von plasmidhaltigen Zellen durch Resistenz- oder Auxotrophiemarker auf dem Plasmid. Unter Selektions- bedingungen können nur Zellen wachsen, die ein Plasmid mit einem entsprechenden Selektionsmarker tragen. Zellen, die das Plasmid verloren haben, werden unter diesen Selektionsbedingungen sterben. kombinationen und folglich von Verlust von DNA-Segmenten. Sequenz-Redundanz sollte dabei nicht nur innerhalb eines Plasmids vermieden werden, sondern auch zwischen Plasmid und chromosomaler DNA. So können auch Plasmidbereiche mit chromosomaler DNA über homologe Bereiche rekombinieren und DNA verlieren. Um die Möglichkeit einer ungewollten Rekombination weiter zu minimieren, sollten möglichst Wirtsstämme verwendet werden, deren enzymatisches Rekombinationssystem durch Mutationen inaktiviert oder zumindest geschwächt ist. Zur Plasmid-Stabilisierung kann auch eine so genannte par-Region in das Plasmid eingebracht werden (Abb. I.4.11). Diese codiert für einen Mechanismus, durch den replizierte Plasmide auf Tochterzellen nicht zufällig, sondern aktiv verteilt werden (partition). Ähnlich fördert eine cer-Region das Auflösen (colE1-resolution) von Plasmid-Ketten (Concatemeren) in Plasmid-Monomere und trägt damit zur Plasmid-Stabilität bei. Daher zeigen Plasmide, die die par-Region und die cer-Region enthalten, eine beträchtlich höhere Stabilität. Weiterhin sollten Stämme selektioniert werden, die eine in Bezug auf Plasmid-Stabilität optimierte Plasmidkopienzahl enthalten. Diese lässt sich nur bedingt vorhersagen und muss daher von Fall zu Fall ausgetestet werden. par-Region Zellteilung Segregand gleichmäßige Verteilung der Plasmide Abb. I.4.11: Plasmidstabilisierung durch par-Region. Die par-Region sorgt für eine aktive Verteilung von Plasmiden auf die beiden Tochterzellen. Dadurch wird das Risiko minimiert, dass eine der Tochterzellen kein Plasmid bekommt. 128 4 Expressionssysteme zur Proteinherstellung Zusammenfassung Die Umsetzung einer fremden genetischen Information in einem Organismus nennen wir heterologe Expression. Eine Informationseinheit für die heterologe Expression eines Proteins besteht aus der genetischen Information für das Protein selbst und den Kontrolleinheiten (Promotor und Transkriptions-Terminator) aus dem jeweiligen Wirtsorganismus, der das Protein herstellen soll. Das „ideale“ WirtVektor-System gibt es nicht, vielmehr muss für jedes heterolog zu exprimierende Protein der richtige Wirtsorganismus experimentell gefunden werden. Die Vor- und Nachteile eines Expressionssystems lassen sich am Beispiel des meistverwendeten Wirtssystems für die Herstellung rekombinanter Proteinwirkstoffe, dem Bakterium Escherichia coli, besonders gut zeigen. E. coli hat als Expressionssystem viele Vorteile, aber auch gravierende Nachteile (Tab. I.4.1). Der größte Nutzen von Bakterien ist ihr schnelles Wachstum in einem relativ einfachen und kostengünstigen Fermentationsprozess. E.-coli-Zellen produzieren große Mengen des rekombinanten Wirkstoffs. Man kann die Expression des rekombinanten Proteins steuern, indem man die natürliche Genregulation bakterieller Operons nachahmt. Es gibt große Erfahrungen darin, die Expressionsplasmide in den Bakterienzellen zu stabilisieren, die Translationseffizienz fremder Gene in Bakterien zu optimieren und Proteine mit genetischen Fusionen auszustatten, die eine effiziente Reinigung durch Affinitätschromatographie erlauben. Die größten Nachteile von Bakterien sind aber nach wie vor die mangelnde Sekretion der produzierten Proteine und die intrazelluläre Ablagerung der Proteine in denaturierter Form in so genannten Einschlusskörpern. Grundsätzlich müssen wir beachten, dass Bakterien posttranslationale Modifikationen wie N-Glycosylierungen nicht kennen, so dass heterolog exprimierte Proteine, die von korrekten N-Glycanen für ihre Funktionalität abhängen, in Bakterien nicht hergestellt werden können. 4.2 Pilze 4.2.1 Hefen Hefen sind einzellig wachsende Pilze. Die Bäckerhefe Saccharomyces cerevisiae wird bereits seit langem für biochemische und genetische Studien genutzt. Eine Fülle fundamentaler biologischer Erkenntnisse wurden in S. cerevisiae erarbeitet und bildeten dann die Basis für das Studium analoger Prozesse in höheren Organismen. Die Hefe ist somit – ähnlich wie E. coli – ein echter Modellorganismus, wobei allerdings E. coli ein Prokaryont, die Hefe hingegen ein Eukaryont ist. Welches Gewicht S. cerevi- Tab. I.4.1: Vorteile und Nachteile von E. coli als Expressionssystem Vorteile nicht pathogen Genom komplett bekannt umfangreiche Erfahrung der Genetik nimmt leicht DNA auf schnelles Wachstum einfache Handhabung kostengünstige Medien zum Teil extrem hohe Proteinausbeuten Nachteile keine Prozessierung von RNA keine posttranslationalen Modifikationen Proteine oft nicht in der korrekten Tertiärstruktur Proteine oft denaturiert („Inclusion bodies“) Freisetzung von Endotoxinen (Pyrogene) siae als biologischer Modellorganismus hat, erkennt man auch daran, dass man sich bereits früh in der Entwicklung der ersten Genomprojekte dazu entschlossen hatte, das gesamte Genom von S. cerevisiae zu sequenzieren. Somit war die Bäckerhefe der erste eukaryontische Organismus, dessen Genom komplett entschlüsselt wurde, was übrigens etwa zur gleichen Zeit geschah wie die Veröffentlichung des Genoms von E. coli im Jahr 1997. Eine der Stärken des biologischen Systems S. cerevisiae war und ist die ausgefeilte Genetik. Einen ganz kleinen Teil dieser Genetik werden wir im Rahmen dieses Kapitels kennenlernen. Die Hefe wächst vegetativ als haploider Organismus. Sie trägt also nur einen einfachen Chromosomensatz. Wie wir noch sehen werden, lassen sich Gene in der Hefe gezielt ansteuern und inaktivieren, wodurch definierte Mutanten erzeugt werden können, an denen sich dann die Funktionen der entsprechenden Proteine studieren lassen. In haploiden Zellen können wir sehr leicht rezessive Mutationen studieren. Diese Mutationen sind in diploiden Zellen oft nicht erkennbar, da sie durch die Funktion des intakten Allels überdeckt werden.