Gewinnung glykosylierter Naturstoffe durch Biotransformation in Saccharothrix espanaensis sowie funktionelle Charakterisierung dreier Polyketidbiosynthesegencluster aus dem Mensacarcinproduzenten Streptomyces sp. Gö C4/4 INAUGURALDISSERTATION zur Erlangung des Doktorgrades der Fakultät für Chemie, Pharmazie und Geowissenschaften der Albert-Ludwigs-Universität Freiburg im Breisgau vorgelegt von Anton Linnenbrink aus Filderstadt-Bonlanden 2009 Dekan: Prof. Dr. Harald Hillebrecht Vorsitzender des Promotionsausschusses: Prof. Dr. Rolf Schubert Referent: Prof. Dr. Andreas Bechthold Korreferent: Prof. Dr. Michael Müller Datum der Promotion: 05.02.2009 V Publikationen 1. Mayer A, Taguchi T, Linnenbrink A, Hofmann C, Luzhetskyy A, Bechthold A: LanV, a bifunctional enzyme involved in aromatization and dehydration during landomycin A synthesis. ChemBioChem 2005, 6: 2312-2315. 2. Luzhetskyy A, Weiss H, Chargé A, Welle E, Linnenbrink A, Vente A, Bechthold A: A strategy for cloning glycosyltransferase genes involved in natural product biosynthesis. Applied Microbiology and Biotechnology 2007, 6: 1367-1375. 3. Daum M*, Peintner I*, Linnenbrink A, Frerich A, Weber M, Paululat T, Bechthold A: Organization of the biosynthetic gene cluster and tailoring enzymes in the biosynthesis of the tetracyclic quinone glycoside antibiotic polyketomycin. Vorläufig akzeptiert zur Publikation in ChemBioChem. 4. Linnenbrink A, Bechthold A: Polyketide biosynthesis in the mensacarcin producer Streptomyces sp. Gö C4/4: endogenous ketosynthase cross-complementation and chain-length control by dimethyl sulfoxide. In Vorbereitung. 5. Linnenbrink A, Luzhetskyy A, Taguchi T, Müller M, Novikov V, Bechthold A: Exploiting the xenobiotic metabolism of soil bacteria for biocatalytic glycosylation. In Vorbereitung. Vorträge 1. Neue Naturstoffe durch Biotransformation. Vogesen-Seminar der Arbeitsgruppe Bechthold, La Schildmatt 2006. 2. Fighting cancer with colours. Workshop Presentation Skills for Scientists, Zentrum für Schlüsselqualifikationen der Albert-Ludwigs-Universität, Freiburg 2006. 3. Biokatalytische Verwendung des Fremdstoffmetabolismus von Bodenbakterien. Doktorandenseminar des Instituts für Pharmazie der Albert-Ludwigs-Universität, Freiburg 2007. 4. Glycosylated new molecular entities and prodrugs by biotransformation. European BioPerspectives, Köln 2007. 5. Kontrollierte Gen-Inaktivierung in Actinomycetales - Entwicklung und Anwendung der [safe-knock]-Strategie. Vogesen-Seminar der Arbeitsgruppe Bechthold, La Schildmatt 2007. 6. Vom Naturstoff zum Gen. Gastvortrag in der Biotechnologie-Ringvorlesung für Pharmaziestudierende des Hauptstudiums, Freiburg 2008. VI Poster 1. Luzhetskyy A, Linnenbrink A, Welle E, Bechthold A: Freiburger glycosyltransferase collection and its use in combinatorial biosynthesis of natural products. 10th International Symposium on the Genetics of Industrial Microorganisms, Prag 2006. 2. Linnenbrink A, Luzhetskyy A, Taguchi T, Novikov V, Bechthold A: A powerful tool for deoxysugar glycosylation. VAAM-Fachgruppentagung: Biology of Bacteria Producing Natural Products, Tübingen 2006. Gewinner des Posterpreises. 3. Luzhetskyy A, Chargé A, Krauth C, Linnenbrink A, Weiß H, Welle E, Bechthold A: Using of Freiburger glycosyltransferase collection in combinatorial biosynthesis of natural products. VAAM-Fachgruppentagung: Biology of Bacteria Producing Natural Products, Tübingen 2006. 4. Bechthold A, Luzhetskyy A, Krauth C, Linnenbrink A, Mittler M, Schulz GE: Functions and specificity of glycosyltransferases. DFG-Symposium, Halle 2007. 5. Chargé A*, Hardter U*, Linnenbrink A*, Bechthold A: The impact of glycosyltransferases on natural product research. Tag der Forschung der Fakultät für Chemie, Pharmazie und Geowissenschaften, Freiburg 2007. 6. Linnenbrink A, Bechthold A: Three PKS II biosynthetic gene clusters in the mensacarcin producer S. sp. Gö C4/4. New Directions in Molecular Genetics and Genomics, Freiburg 2008. Erfindungsmeldung 1. Linnenbrink A, Luzhetskyy A, Bechthold A: Verwendung von Saccharothrix espanaensis zur Glykosylierung von Stoffen. Zentrum für Technologietransfer der Albert-Ludwigs-Universität, Aktenzeichen: ZEE20051124, Freiburg 2005. VII Zusammenfassung Bei den im Bereich der Biotechnologie, Molekularbiologie und Naturstoffanalytik durchgeführten Arbeiten lag der Schwerpunkt auf zwei Projekten: der biokatalytischen Gewinnung von Glykosiden und der Charakterisierung der Biosynthesegene des Zytostatikums Mensacarcin. Das Glykosylierungsmuster hat einen wesentlichen Einfluss auf die Pharmakokinetik und Pharmakodynamik bioaktiver Moleküle und entscheidet damit über ihre Eignung als Arzneistoffe. In einer Biotransformationsstudie konnte das Bodenbakterium Saccharothrix espanaensis als geeigneter Stamm für die Glykosylierung aromatischer Moleküle identifiziert werden. Eine Bibliothek von 40 Naturstoffen und synthetisch gewonnenen Substanzen wurde in Kulturen von S. espanaensis auf Biotransformation zu glykosylierten Derivaten überprüft. Die Auswertung erfolgte durch die LC/MS-Analytik von Kulturextrakten. Mit der Isolierung und chemischen Charakterisierung von neun Transformationsprodukten per NMR-Spektroskopie und HR-MS-Spektrometrie konnten die Biotransformationsreaktionen von S. espanaensis als Hydroxylierungen und O-Glykosylierungen mit dem Zucker α-L-Rhamnose identifiziert werden. Die absolute Konfiguration des Zuckers wurde durch die Aufnahme von Circulardichroismen bestimmt. Die eingesetzte Substanzbibliothek enthielt vor allem Strukturen aus der Klasse der Anthrachinone. Auch Flavonoide, Coumarine und Stilbene wurden von der Glykosylierungsaktivität erfasst. Ein durch regioselektive Rhamnosylierung entstandenes Derivat des Flavonoids Quercetin konnte mit einer Ausbeute von 35 % isoliert werden. Durch die Rhamnosylierung des Coumarins Novobiocinsäure konnte der ohne Zucker nicht antibiotisch wirksame Naturstoff in ein Antibiotikum transformiert werden. Streptomyces sp. Gö C4/4 ist der Produzent des aromatischen Decaketids Mensacarcin, das ein ähnliches zytostatisches Potential wie das klinisch eingesetzte Anthrazyklin Doxorubicin zeigt. Mensacarcin ist jedoch auch gegen Doxorubicin resistente Tumorzellen aktiv. Es wurde angenommen, dass die Biosynthese von Mensacarcin an einer Polyketidsynthase vom Typ II (PKS II) abläuft. Ein entsprechendes PKS II-Gencluster aus S. sp. Gö C4/4 ist seit dem Jahr 2002 bekannt und ein Ziel intensiver Forschung geworden. Durch drei Geninaktivierungen konnte in der vorliegenden Arbeit gezeigt werden, dass es sich bei dem bekannten Gencluster nicht wie angenommen um das Mensacarcinbiosynthesegencluster handelt. Molekularbiologische Experimente identifizierten zwei zusätzliche PKS II-Gencluster im Genom von S. sp. Gö C4/4. Die Expression von Genen eines der neuen Gencluster löste in einem anderen Bodenbakterium die Produktion von Mensacarcinbiosynthesevorläufern aus. Die Gene der Mensacarcinbiosynthese waren damit identifiziert. Weiterführende Untersuchungen zeigten, dass es sich um das einzige aktive Mensacarcinbiosynthesegencluster in S. sp. Gö C4/4 handelt und deckten die endogene Kreuzkomplementierung von Ketosynthasegenen unterschiedlicher Gencluster auf. Eine weitere Besonderheit ist die Beobachtung, dass die Mensacarcin-PKS durch den Einfluss von Dimethylsulfoxid ihre Spezifität zur Synthese von Decaketiden verliert. Die Identifizierung des Genclusters schafft die notwendige Grundlage zur biotechnologischen Gewinnung von Derivaten des Zytostatikums Mensacarcin. VIII Inhaltsverzeichnis 1 EINLEITUNG ............................................................................................................................... 1 1.1 PRIMÄRSTOFF, SEKUNDÄRSTOFF, XENOBIOTIKUM ................................................................ 1 1.2 AROMATISCHE POLYKETIDE ................................................................................................... 2 1.2.1 Die Biosynthese aromatischer Polyketide .............................................................. 3 1.3 ARZNEISTOFFE AUS BODENBAKTERIEN .................................................................................. 7 1.3.1 Die Bedeutung der Zuckereinheit glykosylierter Arzneistoffe ............................... 7 1.3.2 Saccharomicine aus Saccharothrix espanaensis..................................................... 8 1.3.3 Novobiocin aus Streptomyces spheroides NCIMB11891....................................... 9 1.3.4 Polyketomycin aus Streptomyces diastatochromogenes Tü6028 ............................. 10 1.3.5 Mensacarcin aus Streptomyces sp. Gö C4/4 ......................................................... 11 1.4 DAS ERBGUT VON STREPTOMYCES SPP. ................................................................................. 14 1.5 ERHÖHUNG DER DIVERSITÄT BAKTERIELLER SEKUNDÄRSTOFFE ........................................ 15 1.5.1 Geninaktivierung .................................................................................................. 15 1.5.2 OSMAC und genome mining ............................................................................... 15 1.5.3 Biotransformation ................................................................................................. 16 1.5.4 Kombinatorische Biosynthese .............................................................................. 16 2 ZIELSETZUNG DER ARBEIT ..................................................................................................... 18 3 ERGEBNISSE ............................................................................................................................. 19 3.1 GLYKOSYLIERTE NATURSTOFFE DURCH BIOTRANSFORMATION IN SACCHAROTHRIX ESPANAENSIS .......................................................................................................................... 19 3.1.1 3.1.2 3.1.3 3.1.4 3.1.5 3.1.6 3.1.7 3.1.8 3.1.9 3.2 Biotransformation von Alizarin und Emodin ....................................................... 19 Screening einer Bibliothek von Anthrachinonderivaten....................................... 32 Gewinnung und Biotransformation von Norsolorinsäure..................................... 45 Biotransformation von Flavonoiden ..................................................................... 47 Evaluierung des Substratspektrums der Rhamnosylierungsaktivität .................... 51 Gewinnung neuer Derivate des Antibiotikums Novobiocin ................................. 55 In-vitro-Glykosylierungsassay.............................................................................. 62 Untersuchung weiterer Stämme............................................................................ 63 Identifizierung von Glykosyltransferasegenen mit degenerierten Oligonukleotidprimern.......................................................................................... 65 ERSTELLUNG EINER NULLMUTANTE UND SELEKTION EINES POLYKETOMYCINÜBERPRODUZENTEN DES STAMMES STREPTOMYCES DIASTATOCHROMOGENES TÜ6028........ 68 3.2.1 Fehlgeschlagene pok-KSα-Inaktivierungsstrategien.............................................. 68 3.2.2 Erfolgreiche Inaktivierung mit der [safe-knock]-Strategie................................... 73 3.2.3 Biosynthesestudie mit S. diastatochromogenes Tü6028 ∆pok-KSα .............................. 78 3.2.4 S. diastatochromogenes Tü6028 ∆pok-KSα als Expressionswirt ............................ 81 3.2.5 Polymorphismus von S. diastatochromogenes Tü6028........................................ 81 IX 3.3 4 FUNKTIONELLE CHARAKTERISIERUNG DREIER PKS II-BIOSYNTHESEGENCLUSTER DES MENSACARCINPRODUZENTEN S. SP. GÖ C4/4....................................................................... 83 3.3.1 Anzucht und Sekundärstoffanalytik von S. sp. Gö C4/4 ...................................... 83 3.3.2 Analyse des msc-Clusters (Synthese der Substanzen MSC-X) ............................ 87 3.3.3 PCR-basiertes Screening auf weitere PKS II-Cluster ......................................... 103 3.3.4 Analyse des mec-Clusters (Sporenpigmentsynthese) ......................................... 106 3.3.5 Analyse des msn-Clusters (Mensacarcinsynthese) ............................................. 116 3.3.6 Vergleich von msc- und msn-Cluster auf Proteinebene ...................................... 141 3.3.7 Weiterführende Untersuchungen zur Biosynthese von Mensalon, Aloesol und der Substanz MSC-X1 ........................................................................................ 142 DISKUSSION ............................................................................................................................ 147 4.1 BIOKATALYTISCHE VERWENDUNG DES XENOBIOTIKAMETABOLISMUS VON BODENBAKTERIEN .............................................................................................................. 147 4.1.1 Glykokonjugate: spezifische Markenzeichen der Lebewesen ............................ 147 4.1.2 Die Glykosylierung endo- und exogener Moleküle: ein überlebenswichtiges Prinzip................................................................................................................. 149 4.1.3 Phase I- und Phase II-Reaktion versus Biodegradation ...................................... 151 4.1.4 Biokatalytische Verwendung der mikrobiellen Xenobiotikaglykosylierung...... 152 4.2 URSPRUNG DER FREIBURGER GLYKOSYLTRANSFERASEN-TOOLBOX ................................ 156 4.3 DIE [SAFE-KNOCK]-STRATEGIE ZUR GEZIELTEN GENINAKTIVIERUNG ............................... 157 4.3.1 Revertanten bei der Verwendung klassischer Strategien.................................... 157 4.3.2 λ-Red-Rekombination zur Konstruktion des Inaktivierungsplasmids ................ 158 4.3.3 Neue Einsatzgebiete und Erweiterungen der [safe-knock]-Strategie ................. 159 4.4 GENETISCHE INSTABILITÄT IN S. DIASTATOCHROMOGENES TÜ6028 ................................... 161 4.5 ENDOGENE KREUZKOMPLEMENTIERUNG UND KONTROLLE DER KETTENLÄNGE DURCH DMSO IM PKS II-METABOLISMUS VON STREPTOMYCES SP. GÖ C4/4 ................................ 162 4.5.1 Identifikation des Mensacarcinbiosynthesegenclusters ...................................... 162 4.5.2 Endogene PKS II-Kreuzkomplementierung ....................................................... 163 4.5.3 Die Biosynthese von Mensacarcin...................................................................... 165 4.5.4 Der Einfluss von DMSO auf den Msn-Multienzymkomplex führt zum vorzeitigen Kettenabbruch.................................................................................. 169 5 MATERIAL UND METHODEN ................................................................................................. 173 5.1 LABORGERÄTE / ANALYSEINSTRUMENTE ........................................................................... 173 5.2 LÖSUNGEN, NÄHRMEDIEN, CHEMIKALIEN, ENZYME UND KITS ......................................... 174 5.2.1 Lösungen für biochemische und molekularbiologische Arbeiten....................... 174 5.2.2 Nährmedien......................................................................................................... 176 5.2.3 Selektionsantibiotika........................................................................................... 181 5.2.4 Chemikalien und Medienbestandteile................................................................. 181 5.2.5 Enzyme und molekularbiologische Kits ............................................................. 183 5.3 BAKTERIENSTÄMME UND DEREN KULTIVIERUNG .............................................................. 183 5.4 VEKTOREN UND PLASMIDE ................................................................................................. 187 5.4.1 Allgemeine Plasmidkonstrukte und Vektoren .................................................... 187 5.4.2 Spezielle Plasmidkonstrukte und Cosmide......................................................... 188 X 5.5 ALLGEMEINE METHODEN DER MOLEKULARBIOLOGIE ....................................................... 205 5.5.1 Einbringen von DNA in E. coli Laborstämme.................................................... 205 5.5.2 Isolierung von DNA ........................................................................................... 207 5.5.3 Reinigung und Aufkonzentrierung von DNA..................................................... 209 5.5.4 Qualitative und quantitative DNA-Analytik....................................................... 210 5.5.5 Klonierungstechniken ......................................................................................... 212 5.6 POLYMERASEKETTENREAKTION (PCR) UND DNA-SEQUENZIERUNG ................................ 216 5.6.1 PCR..................................................................................................................... 216 5.6.2 DNA-Sequenzierung........................................................................................... 218 5.6.3 Primerlisten geordnet nach Projekt..................................................................... 220 5.7 GENTRANSFER IN SACCHAROTHRIX SPP. UND STREPTOMYCES SPP....................................... 227 5.7.1 Protoplastentransformation................................................................................. 227 5.7.2 Intergenerische Konjugation............................................................................... 229 5.8 GENINAKTIVIERUNG IN STREPTOMYCES SPP........................................................................ 232 5.8.1 Klassische Strategien der gezielten Geninaktivierung........................................ 232 5.8.2 Die [safe-knock]-Strategie.................................................................................. 234 5.9 FLP UND CRE VERMITTELTE REKOMBINATION IN STREPTOMYCES SPP. .............................. 238 5.10 METHODEN DER BIOCHEMIE ............................................................................................... 240 5.10.1 Glykosylierungsassay ......................................................................................... 240 5.10.2 Proteinanalytik mit SDS-PAGE.......................................................................... 241 5.11 ANALYTIK UND ISOLIERUNG NIEDERMOLEKULARER NATURSTOFFE ................................. 241 5.11.1 Naturstoffextraktion aus Bakterienkulturen........................................................ 241 5.11.2 Dünnschichtchromatographie (DC) .................................................................... 242 5.11.3 Säulenchromatographie ...................................................................................... 243 5.11.4 Analytische HPLC .............................................................................................. 243 5.11.5 Präparative HPLC ............................................................................................... 244 5.11.6 HPLC/MS Analytik ............................................................................................ 244 5.11.7 Bestimmung der exakten Masse ......................................................................... 246 5.11.8 NMR-Spektren.................................................................................................... 246 5.11.9 Circulardichroismus............................................................................................ 246 5.11.10 Gefriertrocknung................................................................................................. 247 5.12 DARSTELLUNG VON NOVOBIOCINSÄURE ............................................................................ 247 5.13 TESTUNG VON NATURSTOFFEN AUF ANTIMIKROBIELLE AKTIVITÄT .................................. 249 5.14 PC-PROGRAMME UND INTERNETSERVICES ......................................................................... 250 6 LITERATURVERZEICHNIS ...................................................................................................... 251 7 ANHANG ................................................................................................................................. 286 7.1 ABKÜRZUNGSVERZEICHNIS ................................................................................................ 286 7.2 NMR-TABELLEN UND -SPEKTREN ...................................................................................... 289 7.3 DNA-SEQUENZEN DER PKS II-CLUSTER AUS S. SP. GÖ C4/4............................................. 309 7.3.1 Sequenz des msc-Contigs.................................................................................... 309 7.3.2 Sequenz des mec-Contigs ................................................................................... 372 7.3.3 Sequenz des msn-Contigs ................................................................................... 386 7.4 DANKSAGUNG ..................................................................................................................... 447 Einleitung 1 Einleitung 1.1 Primärstoff, Sekundärstoff, Xenobiotikum 1 Neben dem für Wachstum und Entwicklung aller Organismen essentiellen Primärstoffwechsel bilden viele Arten Sekundärstoffe, die in dieser Hinsicht entbehrlich sind. Charakteristisch für den Primärstoffwechsel sind Reaktionen der Energieumwandlung, des Zellaufbaus und der Reproduktion. Aus einer begrenzten Zahl von Primärstoffen wie Shikimisäure, Aminosäuren, Zuckern und Acyl-CoA-Verbindungen geht eine große Vielfalt von Sekundärstoffen hervor, deren chemische Strukturen typische Kennzeichen bestimmter Lebewesen sind und eine taxonomische Einteilung ermöglichen. Zahlreiche pflanzliche, tierische und mikrobielle Sekundärstoffe wirken auf Rezeptoren im menschlichen Körper und werden deshalb als Arzneistoffe eingesetzt. Hierzu zählt das pflanzliche Analgetikum Morphin, das in den Jahren 1803 - 1805 durch den Apotheker F. Sertürner aus Opium isoliert wurde [1]. Vom Bodenbakterium Streptomyces peuceticus wird das Anthrazyklinzytostatikum Doxorubicin produziert, das Antibiotikum Penicillin ist ein Sekundärmetabolit des Pilzes Penicillium notatum. Die Funktion der Sekundärstoffe im produzierenden Organismus ist weitgehend unbekannt. Der Sekundärmetabolismus wurde deshalb als "luxurierender Metabolismus" angesehen [2]. H. Zähner bezeichnete ihn als eine "biochemische Spielwiese", auf der sich das Biosynthesepotential eines Organismus durch nicht letale Mutationen zufällig verändert, bis ein positiver Effekt für den Produzenten erreicht wird [3]. Sekundärstoffe spielen eine wichtige Rolle in der chemischen Kommunikation, darin eingeschlossen der Verteidigung [2]. Sie tragen zum Erhalt der Position eines Organismus in seinem ökologischen Umfeld bei. Die in bestimmten Wachstumsphasen gebildeten Sekundärmetaboliten sind nicht immer als Endpunkte von Stoffwechselwegen zu verstehen. Sie können oft wieder abgebaut werden und als Reservestoffe für den Primärmetabolismus dienen. Die Grenze zwischen Primär- und Sekundärmetabolismus ist nicht eindeutig zu ziehen. Xenobiotika (aus dem griechischem: ξεύος = fremd, βιος = Leben) sind fremde Stoffe in Bezug auf ein bestimmtes Lebewesen [4;5]. Die Umwandlung und Verteilung von Fremdstoffen in einem Organismus wird als Xenobiotikametabolismus bezeichnet [6]. Nach Art der ablaufenden Reaktion wird dieser in verschiedene Phasen eingeteilt. In der Phase I findet eine Funktionalisierung von meist unpolaren Molekülen statt. Typische Phase I-Reaktionen sind hydrolytische Spaltungen, Oxidationen und Reduktionen. In der Phase II erfolgt die Bildung polarer Konjugate, zum Beispiel die Glucuronidierung oder Sulfatierung [7]. Weitere Biotransformationsreaktionen können sich anschließen. Die Produkte werden teilweise von aktiven Transporten erkannt und in andere Kompartimente oder aus der Zelle heraus verlagert. 2 Einleitung 1.2 Aromatische Polyketide Polyketide werden in einer Reaktionsfolge, ähnlich der Fettsäuresynthese aus Acyl-CoAVerbindungen zusammengesetzt. Sie bilden eine vielfältige Klasse von Sekundärstoffen, deren Vertreter bisher in Pflanzen, Mikroorganismen, Protisten und Insekten identifiziert wurden [8;9]. Strukturelle Merkmale erlauben eine Unterscheidung von aliphatischen und aromatischen Polyketiden. Aliphatische Polyketide gliedern sich in Makrolide wie das Antibiotikum Erythromycin, Polyether wie das Algengift Brevetoxin A und Polyene wie das Immunsuppressivum Rapamycin. Durch Ringschluss, Dehydratisierung und Keto-Enol-Tautomerie können aus der Ketidkette aromatische Strukturen hervorgehen (s. Abb. 1). Flavonoide und Stilbene wurden bisher fast ausschließlich aus Pflanzen isoliert. Anthranoide leiten sich von der tricyclischen Verbindung Anthracen ab. Unterschiedlich oxidierte, reduzierte und substituierte Anthranoide treten in Pflanzen, Pilzen und Bakterien auf. In der Pflanze werden Flavonoide, Stilbene und Anthranoide als Glykoside gespeichert. Flavonoide Stilbene OH OH HO A O C B OH O Quercetin A OH OH Anthranoide B OH HO OH O OH A C B O trans-Resveratrol Chrysophanol Kohlenstoff aus einer Acetateinheit Abb. 1: Aromatische Produkte des Polyketidbiosynthesewegs. Flavonoide und Stilbene werden aus einer Phenylpropanstartereinheit und drei Acetateinheiten gebildet. Das Grundgerüst des polyketidischen Anthrachinons Chrysophanol setzt sich aus acht Acetateinheiten zusammen. Über den Verzehr von Obst und Gemüse nimmt ein Mensch mit den Ernährungsgewohnheiten der westlichen Industrieländer durchschnittlich 1 - 2 g Flavonoidglykoside pro Tag auf [10]. Den Verbindungen wird antitumorale, antimikrobielle, antiallergische, antiinflammatorische und östrogene Wirkung zugeschrieben. Die biologische Wirksamkeit ist zum Teil auf Radikalfängereigenschaften zurückzuführen [11]. Ein Liter Rotwein enthält etwa 0,1 - 14,3 mg des Stilbens Resveratrol [12]. In den letzten Jahren zog Resveratrol große Aufmerksamkeit auf sich: 2008 wurden über 200 Originalarbeiten und 14 Übersichtsartikel veröffentlicht, deren Titel den Namen der Substanz enthält [13]. Resveratrol wird für das "Französische Paradox" verantwortlich gemacht [14]. Der Begriff beschreibt die Beobachtung, dass der regelmäßige Konsum von Rotwein mit einem verminderten Auftreten kardiovasculärer Krankheiten korreliert. Studien an Tieren zeigen das Potential des Stilbens als Wirkstoff gegen altersbedingte Krankheiten wie Krebs, 3 Einleitung Diabetes, Alzheimer, Herz- und Lungenkrankheiten. Etwa 20 molekulare Bindungspartner von Resveratrol wurden bisher in der menschlichen Zelle identifiziert [14]. Glykosylierte Anthranoide (Anthraglykoside) sind das aktive Prinzip pflanzlicher Laxantien wie Aloeextrakt, Faulbaumrinde und Sennesblättern. Das freie Anthrachinon Aloe-Emodin zeigt in vitro und in vivo selektive Aktivität gegen neuroectodermale Tumorzellen [15]. Eine anthranoide Substruktur ist auch in bioaktiven aromatischen Polyketiden aus Bakterien zu finden (s. 1.3.4 - 6). Der Anthrachinongrundkörper ist Bestandteil der Anthrazyklinzytostatika (s. Abb. 5, Doxorubicin). 1.2.1 Die Biosynthese aromatischer Polyketide Aromatische Polyketide können durch die unterschiedliche Lage der Acetateinheiten voneinander abgegrenzt werden (s. Abb. 2). Die Biosynthese annelierter Ringsysteme folgt in Pilzen dem F-Cyclisierungsmodus (F: fungal), in Bodenbakterien der Gattung Streptomyces werden die Verbindungen über den S-Modus cyclisiert [16]. Die Klassifizierung beruht auf der Regiospezifität der Aldolreaktion zur Ausbildung des initialen Rings. Beim F-Modus trägt dieser zwei, beim S-Modus drei intakte Acetateinheiten (s. Abb. 2). O O O O O O OH OH O S-Enz O F-Modus O OH O OH S-Enz O O O O O O O O OH OH O O OH S-Modus O O O OH O S-Enz intakte Acetateinheit O O S-Enz einzelner Kohlenstoff aus einer Acetateinheit Decarboxylierung Abb. 2: Zwei unterschiedliche Cyclisierungsmodi der Octaketidkette führen in der Natur zur Biosynthese des Anthrachinons Chrysophanol. Die Abgrenzung ist nach der Fütterung des Vorläufers [1,2-13C2]-Acetat durch 2D INADEQUAT-NMR-Experimente möglich. Zwei weitere Cyclisierungsmodi sind bei einem nukleophilen Angriff durch den Kohlenstoff der terminalen Methylgruppe denkbar. Diese chemisch weniger wahrscheinlichen Modi, als F' und S' bezeichnet, wurden noch nicht beobachtet. Sie sind jedoch nicht grundsätzlich auszuschließen. Das einzelne, mit einem Quadrat gekennzeichnete Kohlenstoffatom aus der Acetateinheit am Carboxylterminus ist nach einer F'- oder S'-Cyclisierung in der Methylgruppe von Chrysophanol zu erwarten [8]. Verschiedene Cyclisierungsmodi können zum gleichen Produkt führen (s. Abb. 2). In einer Vergleichsstudie zur Biosynthese des Anthrachinons Chrysophanol konnte in einem Pilz, einer Pflanze und einem Insekt jeweils der F-Modus nachgewiesen werden. Im eingesetzten Bakterium folgte die Cyclisierung dem S-Modus [8]. Die Rekrutierung von 4 Einleitung Polyketidsynthasen (PKS) unterschiedlichen Typs könnte für abweichende Cyclisierungsmodi in der Biosynthese von Chrysophanol verantwortlich sein. Eine stark vereinfachte Klassifizierung unterscheidet drei Typen von Polyketidsynthasen [9]: Die Mono- oder Polymodulare PKS I leitet sich von der Fettsäuresynthase der Säugetiere ab, die als Enzymkomplex arbeitende PKS II zeigt Ähnlichkeit zur bakteriellen Fettsäuresynthase, kein Homolog im Primärstoffwechsel hat die homodimäre PKS III. Anthranoide (wie zum Beispiel Chrysophanol) werden in Bakterien von einer PKS II, in Pilzen hingegen von einer PKS I aufgebaut [17]. Für ihre Biosynthese in Pflanzen wird eine PKS III postuliert [18]. In Insekten konnten bisher keine entsprechenden Enzyme identifiziert werden [19]. In Bakterien der intensiv beforschten Gattung Streptomyces sind alle drei Typen von Polyketidsynthasen (PKS I, PKS II, PKS III) anzutreffen [20]. Streptomyces spp. sind terrestrische oder marine Gram+ Eubakterien der Ordnung Actinomycetales mit einem komplexen Lebenszyklus [21]. Sie stellen die reichste bisher erschlossene Quelle bioaktiver mikrobieller Sekundärstoffe dar [22]. Aromatische Polyketide aus Streptomyces spp. werden vorwiegend durch Polyketidsynthasen vom Typ II aufgebaut. Im Hinblick auf die Zielsetzung der vorliegenden Arbeit wird dieser Typ der Polyketidsynthasen detailliert vorgestellt. Die Polyketidsynthase vom Typ II Die PKS II setzt sich aus separaten Enzymen zusammen, die jeweils eine bestimmte Funktion übernehmen [23]. Eine Gemeinsamkeit aller PKS II ist die sogenannte "minimale PKS". Sie besteht aus zwei Ketosynthaseuntereinheiten (KSα / KSβ) und dem Acyl-Carrier-Protein (ACP) (s. Abb. 3). KSα und KSβ bilden ein Heterodimer, wobei das aktive Zentrum zur Katalyse der C-C-Verknüpfung auf der α-Untereinheit lokalisiert ist. Die KSβ ist an der Festlegung der finalen Kettenlänge beteiligt und kann eine Rolle bei der Generierung von Acetyl-KSα durch Decarboxylierung von Malonyl-ACP spielen. Das ACP dient als Anker für die wachsende Ketidkette. Vor dem Beginn der Kettenverlängerung wird die KSα mit einer Acyl-CoA-Starterverbindung (Primer) versehen. Das Priming der KSα kann von Malonyl-ACP ausgehen (s. o.). Als Mechanismus zur Generierung von Malonyl-ACP werden sowohl die Selbst-Acylierung des ACP, als auch eine Beteiligung des Enzyms Malonyl-CoA:ACP-Transferase (MCAT) diskutiert [23]. Mit einem KSα-Priming ausgehend von Malonyl-ACP steht am Anfang der Ketidkette eine Acetateinheit. Alternativ kann die KSα direkt mittels einer Acyltransferase (AT) beladen werden. Auf diese Weise sind abweichende Startereinheiten möglich. Für die Verlängerungsschritte wird das ACP stets erneut malonyliert. Durch eine Claisen ähnliche Kondensationsreaktion wird die C-C-Bindung geknüpft. Der entstandene ACPKetoester wird zurück auf die KSα transferiert und der nächste Verlängerungsschritt kann sich anschließen. Zusätzliche PKS-Untereinheiten, wie Ketoreduktasen, Cyclasen und Aromatasen 5 Einleitung bestimmen den Cyclisierungsmodus der Poly-β-Ketidkette. Die Cyclisierung läuft im Sinne einer Aldolreaktion ab. Modifizierende Enzyme wie Oxygenasen, Methyltransferasen und Glykosyltransferasen verleihen dem Polyketid individuelle Strukturmerkmale [23]. PKS II-Produkte sind meist aromatisch und polycyclisch. Wertvolle Einblicke in das Zusammenspiel der PKS II-Komponenten lieferten Pionierarbeiten zu Genen und Enzymen der Actinorhodinbiosynthese von Streptomyces coelicolor [24]. O NaO S O O ACS CoA-S SH S S O R O ACC O CoA-S OH SH S O O R O HO + CO 2 O R Abb. 3: Integration von 13C markiertem Acetat (fett) in die β-Ketidkette über die Enzyme der minimalen Polyketidsynthase vom Typ II (s. Text). ACS: Acetyl-CoA-Synthetase, ACC: Acetyl-CoA-Carboxylase. Abb. 3 zeigt den Verbleib von 13C markiertem Acetat in der Polyketidkette. Obwohl der Biosynthesevorläufer mit unmarkiertem Kohlenstoff erweitert wird, führt die Decarboxylierung während der Kettenverlängerung dazu, dass im Endprodukt alle aus Acetyl- oder Malonyl-CoA hervorgegangenen C-Atome markiert sind. Die Polyketidsynthase vom Typ I Die PKS I ist modular aufgebaut. Ein Modul besitzt mehrere katalytische Domänen, wobei für pro Verlängerungsschritt zumindest eine Acyltransferase, ein Acyl-Carrier-Protein und eine Ketosynthase vorliegen müssen. In Analogie zur Fettsäuresynthese können zusätzlich in den Modulen vorhandene Ketoreduktase-, Dehydratase-, und Enoylreduktase-Domänen zur schrittweisen Reduktion der ACP gebundenen Ketidkette führen. Mono- und Polymodulare PKS I sind bekannt. Der polymodularen PKS I oder "modularen PKS I" steht typischerweise für jeden Verlängerungsschritt ein neues Modul zur Verfügung. Module der polymodularen PKS I können jedoch auch mehrfach eingesetzt werden [9]. Bei der monomodularen oder "iterativen PKS I" ist dies die Regel. Wie bei der PKS II können beim Typ I einzelne Domänen auf externe Enzyme ausgelagert werden [9]. Eine Thioesterasedomäne des letzten Moduls setzt das Produkt frei. 6 Einleitung Die Metaboliten der bakteriellen PKS I sind fast ausschließlich aliphatische Polyketide. Das Aglykon des Antibiotikums Avilamycin aus Streptomyces viridochromogenes Tü57 ist eine der wenigen Ausnahmen (s. Abb. 5). In Pilzen hingegen gelten aromatische Polyketide, wie Aflatoxin B als typische Produkte der dort vorkommenden iterativen PKS I [17]. Die Polyketidsynthase vom Typ III Zu den Polyketidsynthasen vom Typ III gehören die Chalconsynthasen (CHS) und die Stilbensynthasen (STS) der Pflanzen. Ihre Architektur ist einfach. Sie bestehen aus einem Dimer identischer Ketosynthasedomänen. Die Reaktionsfolge von Decarboxylierung, Kondensation, Cyclisierung und Aromatisierung erfolgt an nur einem aktiven Zentrum [25]. Als erste PKS überhaupt wurde die CHS aus der Petersilie von F. Kreuzaler und K. Hahlbrock am Biologischen Institut II der Universität Freiburg charakterisiert [26]. Quercetin (s. Abb. 1) wird von einer CHS aus p-Coumaroyl-CoA und drei Acetateinheiten aus Malonyl-CoA zusammengesetzt, der C-Ring wird durch eine Chalconisomerase stereospezifisch geschlossen. Sich anschließende Oxidationen und Reduktionen geben dem Flavonol seine endgültige Struktur [25]. Resveratrol (s. Abb. 1) ist das unmittelbare Produkt einer STS von p-Coumaroyl-CoA und drei Acetateinheiten aus Malonyl-CoA [25]. Im Jahr 1999 wurde mit dem Enzym RppA aus Streptomyces griseus die erste PKS III aus einem Bakterium beschrieben [27]. Die Vielfalt der Polyketidsynthasen geht über die drei genannten Typen hinaus [9], wie der vor kurzem veröffentlichte Mechanismus der Stilbensynthese im Gram− Enterobakterium Photorhabdus luminescens zeigt [28]. Ein alternativer Biosyntheseweg zu Anthrachinonen Nicht immer handelt es sich bei natürlich vorkommenden Anthrachinonen um Polyketide. In Rubiaceae werden Anthrachinone durch eine Kombination von Shikimisäureweg und Methylerythritolphosphat-(MEP)-Weg gebildet [29]. Ring A und B der Anthrachinone vom Rubiatyp stammen aus der Isochorisminsäure und α-Ketoglutarsäure, Ring C aus Isopentenyldiphosphat, das über den MEP-Weg aufgebaut wird [30]. Anthrachinone vom Rubiatyp sind meist nur am Ring C substituiert, wie zum Beispiel Alizarin aus Rubia tinctorum [31]. Allein aus dem Substitutionsmuster lässt sich die biogenetische Herkunft des Anthrachinons jedoch nicht ableiten. Erst Experimente mit Isotop markierten Vorläufern konnten die Zugehörigkeit von Robustachinon B aus Cinchona "Robusta" (s. Abb. 4) zum Rubiatyp festlegen [32]. 7 Einleitung Shikimisäure Isochorismin+ α-Ketoglutarsäure säure Pyruvat + Glyceraldehyd-3-P OH COOH A B O OH B C MeO A + MeO OP P OH O Abb. 4: Biosyntheseweg des Anthrachinons Robustachinon B in Cinchona "Robusta" [32]. 1.3 Arzneistoffe aus Bodenbakterien 1.3.1 Die Bedeutung der Zuckereinheit glykosylierter Arzneistoffe Der Zuckeranteil ist oft ausschlaggebend für die pharmakokinetischen und pharmakodynamischen Eigenschaften glykosylierter Arzneistoffe. Die höhere Wasserlöslichkeit der Anthraglykoside im Vergleich zu den Anthrachinonaglyka verhindert eine Adsorption im oberen Magen-Darmtrakt und verleiht den Glykosiden, die im Dickdarm durch bakterielle Glykosidasen hydrolysiert werden, Prodrug-Eigenschaften [33]. O O OH OH O OH OH OH OH O HO O O O O HN OH O HN H N OH N OMe O OH O OMe O NH2 OH OH O OH O Erythromycin OH N H Mitoxantron Doxorubicin O O OMe O Cl O HO HO O O HO O MeO O O O O O OH Cl O HO OMe OMe O O O O O O O O O OH Avilamycin A Abb. 5: Zuckereinheiten bestimmen die Pharmakokinetik und die Pharmakodynamik von Arzneistoffen. Das nicht glykosylierte Anthrazyklinanalogon Mitoxantron ist synthetischen Ursprungs. 8 Einleitung Eine durch den Zuckeranteil erhöhte Lipophilie zeigt das Orthosomycinantibiotikum Avilamycin A [34]. Die Heptasaccharidkette ist vorwiegend aus Desoxyzuckern aufgebaut. Verbleibende Hydroxylgruppen sind zu einem großen Teil an Etherbindungen beteiligt. Die Wirksamkeit zahlreicher Antibiotika und Zytostatika ist an die Präsenz von Zuckern im Molekül gebunden [35]. Ein Verlust der Zuckereinheit geht bei Erythromycin, Doxorubicin (s. Abb. 5), Novobiocin (s. Abb. 7) und Polyketomycin (s. Abb. 8) mit dem Verlust der Wirksamkeit einher. Es wird angenommen, dass der Zucker an Wechselwirkungen mit dem Zielmolekül beteiligt ist [36-38]. Für diese Funktion werden beim nicht glykosylierten Anthrazyklinanalogon Mitoxantron die Seitenketten postuliert. 1.3.2 Saccharomicine aus Saccharothrix espanaensis Zwei von Saccharothrix espanaensis produzierte Heptadecaglykosidantibiotika zeigen einzigartige Strukturmerkmale (s. Abb. 6). Die Saccharomicine bestehen aus einer einfach verzweigten Kette von 17 Zuckern, die O-glykosidisch mit dem aus Kaffeesäure und Taurin aufgebauten Aglykon verknüpft ist. Alle 17 Zucker sind Desoxyhexosen. Der Aminozucker Saccharosamin wurde in den Saccharomicinen zum ersten Mal entdeckt [39]. S. espanaensis ist ein filamentöses Bodenbakterium der Ordnung Actinomycetales und wird der Familie Actinosynnematacae zugeschrieben [40]. In dieser Arbeit wird das Potential des Stammes zur biokatalytischen Glykosylierung kleiner, aromatischer Moleküle evaluiert (s. 3.1). OH + H3N O HO Eva-9 O Sac-7 Fuc-8 O O O OH R2 O R1 R3 O A: Rha-10 B: Dig-10 O O HO O NH2 O O O NH2 HO Fuc-5 OH OH O Fuc-12 O O Sac-4 O O OH HO NH2 Fuc-3 OH OH O H N OSO3- Sac-2 Fuc-1 SO3- O OH Sac-11 A: R1 = R3 = OH; R2 = H B: R1 = R3 = H; R2 = OH O O OH O NH2 O O Rha-6 O O Dig-13 O O Eva-14 NH2 O OH O Dig-15 O O Eva-16 NH2 O O NH3+ OH Eva-17 Abb. 6: Die Heptadecaglykosidantibiotika Saccharomicin A und Saccharomicin B. Fuc: D-Fucose; Sac: D-Saccharosamin; Rha: L-Rhamnose; Eva: L-4-epi-Vancosamin; Dig: L-Digitoxose. Die absolute Konfiguration wurde nicht bestimmt, sondern aufgrund natürlicher Häufigkeiten vorgeschlagen [39]. 9 Einleitung 1.3.3 Novobiocin aus Streptomyces spheroides NCIMB11891 Das Aminocoumarinantibiotikum Novobiocin wurde 1964 unter dem Handelsnamen Albamycin in den USA zur Therapie von Infektionen mit multiresistenten, Gram+ Bakterien zugelassen [41]. Wegen starker Nebenwirkungen und der geringen Wasserlöslichkeit von Novobiocin wurde die Anwendung beim Menschen ausgesetzt [41;42]. Zur Zeit ist Novobiocin noch zur Behandlung boviner Mastitis im Einsatz [43;44]. Die Struktur setzt sich aus einer prenylierten 4-Hydroxybenzoesäureeinheit (Ring A), einer substituierten 3-Aminocoumarineinheit (Ring B) und einem Desoxyzucker (Ring C) zusammen (s. Abb. 7). Ring B und Ring C sind an der Bindung mit dem Zielmolekül, der bakteriellen Gyrase, beteiligt [42]. Eine Variation von Ring A kann ohne Verlust der antibiotischen Aktivität vorgenommen werden, was bereits die Entwicklung zahlreicher Strukturanaloga erlaubte [45]. Über seine Anti-Hsp90-Aktivität interferiert Novobiocin auch mit metabolischen Prozessen in eukaryotischen Zellen [46]. Das Hitzeschockprotein 90 (Hsp90) stabilisiert onkogene Kinasen. Hsp90-Inhibitoren können deshalb in der Krebstherapie eingesetzt werden [47]. In der vorliegenden Arbeit wird durch Biotransformation in Saccharothrix espanaensis ein rhamnosyliertes Novobiocinderivat gewonnen (s. 3.1.6). OH 5' Ring C H3C H3CO O O NH2 O O CH3 1'' O 2'' OH 4' OH 6 H N O 12 O 7 CH3 11 Ring A 3-O-Carbamoyl-4-O-methyl-α-L-noviose Abb. 7: Das Aminocoumarinantibiotikum Novobiocin. CH3 8 CH3 Ring B 10 2 10 Einleitung 1.3.4 Polyketomycin aus Streptomyces diastatochromogenes Tü6028 Polyketomycin (s. Abb. 8) wurde aus Streptomyces sp. MK277-AF1 [48;49] und Streptomyces diastatochromogenes Tü6028 [50] isoliert. Eine Bioaktivitätsstudie identifizierte Polyketomycin als Antibiotikum mit starker Wirksamkeit (MHK < 0,2 µg/mL) gegen Gram+ Keime unter denen sich auch ein Methicillin resistenter Staphylococcus aureus befand [48]. Die von einer PKS II initiierte Biosynthese folgt einem Cyclisierungsmodus, ähnlich dem der Aureolsäuren Mithramycin und Chromomycin [16]. Wie beim Aufbau von Cervimycin [51], Dutomycin [52] und DMI-2 [53] bleibt der vierte Ring (Ring A) erhalten. Die beiden seltenen Desoxyzucker D-Amicetose und L-Axenose bilden zusammen mit 3,6-Dimethylsalicylsäure die Seitenkette von Polyketomycin. O OH O D C O OH 1 OH 9 H3CO H3C O HO H3C 2''' O O O OH O CH3 CH3 H3C A 5 OH H O 2' 1'' 2'' B O CH3 O β-D-Amicetose 1' α-L-Axenose 1''' CH3 Abb. 8: Das tetrazyklische Chinonglykosid Polyketomycin. Aufgrund seiner Fähigkeit zur Bereitstellung nukleotidaktivierter Zuckerbausteine konnte S. diastatochromogenes Tü6028 zur Generierung neuer Derivate des Anthrazyklins Aranciamycin eingesetzt werden. Dazu wurde das Aranciamycinbiosynthesegencluster heterolog in S. diastatochromogenes Tü6028 unter der Bildung von Desmethoxyaranciamycinon (s. Abb. 9, R1 = H, R2 = H) exprimiert. Die Gene der Zuckerbiosynthese liegen außerhalb des Clusters. Die Aranciamycinglykosyltransferase AraGT zeigt eine außergewöhnliche Donorflexibilität und verknüpft das Anthrazyklinaglykon im Sinne der kombinatorischen Biosynthese mit D-Amicetose oder L-Axenose (s. Abb. 9) [54;55]. S. diastatochromogenes Tü6028 ist ein interessanter Wirt für die Expression von PKS IIGenclustern. Die endogene Polyketomycinproduktion des Stammes beschränkt die Biosynthese weiterer Polyketide jedoch durch Vorläuferentzug und erschwert die Detektion neu auftretender Metabolite. Durch gezielte Inaktivierung von pok-KSα, dem Gen der Ketosynthase Untereinheit α, wird in dieser Arbeit eine Mutante erstellt, die kein Polyketomycin und keine Polyketomycinvorläufer produziert (s. 3.2). 11 Einleitung O O OH CH3 R2 OH O R1: H3C HO O OH R2: OCH3 H3C HO OH OR1 OH O HO H3C O CH3 OCH3 H H Aranciamycin Aranciamycin C Aranciamycin D Abb. 9: S. diastatochromogenes Tü6028 als Wirt für das Aranciamycinbiosynthesegencluster. Durch kombinatorische Biosynthese werden die Hybridzytostatika Aranciamycin C und D sowie weitere Derivate gebildet [54;55]. 1.3.5 Mensacarcin aus Streptomyces sp. Gö C4/4 Der einprägsame Name Mensacarcin verbindet die Antitumorwirkung der Substanz mit dem Fundort ihres Produzenten Streptomyces sp. Gö C4/4, dem Erdboden in der Nähe der Göttinger Nordmensa [56]. Die Substanz fiel in einem Screening auf Circulardichroismus aktive Metabolite auf und ließ sich in Ausbeuten von 60 mg/L aus Fermenterkulturen isolieren [56]. Strukturell verwandt ist Cervicarcin aus Streptomyces ogaensis, das im Gegensatz zu Mensacarcin keine Methoxygruppen trägt und eine deutlich abweichende Stereochemie besitzt [57]. Cervicarcin ist ein Diastereomer des Mensacarcinvorläufers Didesmethylmensacarcin. Als Nährmediumvariation im Sinne des OSMAC-Ansatzes (s. 1.5.2) führte der Zusatz von 2 % DMSO zur Produktion der Heptaketide Mensalon und Aloesol, die in Ausbeuten von 2 mg/L, respektive 2,3 mg/L isoliert wurden [56]. Mensalon wird auch von einer Micromonospora sp. produziert und fiel bei einem Screening auf Radikalfänger auf, wo die Substanz mit dem Kürzel GTRI-02 bezeichnet wurde [58]. Der Drehwert von Mensalon und GTRI-02 ist identisch, die Stereochemie an C-3 bisher nicht geklärt [56]. Glykosylierte Derivate von Aloesol sind aus Pflanzen bekannt [59;60]. Aus S. sp. Gö C4/4 wurde vermutlich ein ungleiches Gemisch von Enantiomeren der Konstitution von Aloesol isoliert [56]. 12 Einleitung 16 17 OMe OMe OH O OH O 1 10 11 O 6 4 O 14 O 9 5 4 OH 1 9 10 * HO 15 O OH Mensacarcin O 11 8 5 4 OH HO O 8 Mensalon * 1' 1 3' Aloesol Abb. 10: Polyketide aus S. sp. Gö C4/4. Die Biosynthese von Mensacarcin Aufgrund des spezifischen Einbaus von Isotop markiertem Acetat und des aromatischen Charakters wurde Mensacarcin als ein Produkt des PKS II-Metabolismus postuliert [56]. Die Biosynthese des Decaketids folgt einem Cyclisierungsmodus, ähnlich dem der Anthrazykline und Tetrazykline (s. Abb. 11), wobei jedoch unterschiedliche Startereinheiten eingesetzt werden. Ein vierter Ring fehlt in der Struktur von Mensacarcin. Der hohe Oxygenierungsgrad, insbesondere die Ausbildung zweier Oxiranringe macht Mensacarcin zu einem interessanten Ziel der Biosyntheseforschung. Die genetischen Grundlagen der Epoxidierung im PKS II-Metabolismus sind bisher noch nicht bekannt. O O O O O O O O O O O O O O O O O O O O O O O O O O O O S-Enz O NH2 O S-Enz S-Enz OH NH2 O OMe O OH O OMe OMe OH O OH O OH O OH OH Doxorubicin O O OH Mensacarcin O NH2 O OH O OH O OH HO H OH H OH N(Me)2 Oxytetrazyklin Abb. 11: Mit dem Einsatz unterschiedlicher Startereinheiten führen ähnliche Cyclisierungsmodi zur Bildung der ersten drei Ringe von Anthrazyklinen (Doxorubicin), Tetrazyklinen (Oxytetrazyklin) und Mensacarcin. Einleitung 13 Das Zytostatikum Mensacarcin Die In-vitro-Aktivität von Mensacarcin auf verschiedene humane Krebszellen wurde gemäß [61] von Beil et al. bestimmt. Neben HMO2-Magenkrebszellen, HEP G2-Leberkrebszellen und MCF 7-Brustkrebszellen wurde auch die multiresistente Magenkrebszelllinie KATO III in die Versuche einbezogen. Tab. 1: Vergleich der zytostatischen (TGI = 100 % Inhibition des Zellwachstums) und zytotoxischen (LC50 = letale Dosis für 50 % der Zellen) Wirkung von Mensacarcin, Doxorubicin und Cisplatin [61]. Substanz Mensacarcin Doxorubicin Cisplatin Wert TGI LC50 TGI LC50 TGI LC50 Wirkung auf Tumorzellen (Konzentration in µmol/L) HMO 2 HEP G2 MCF 7 Kato III 0,6 5,0 0,2 < 0,5 2,4 > 50 0,4 1,6 0,1 1,0 0,2 > 50 0,4 > 50 > 10 > 50 1,5 5,0 10 > 50 36 > 50 > 50 > 50 Mensacarcin zeigt eine hohe zytostatische und zytotoxische Aktivität, vergleichbar mit jener der klinisch eingesetzten Krebstherapeutika Doxorubicin und Cisplatin. Mensacarcin ist jedoch auch gegen die multiresistente Zelllinie Kato III wirksam. Ein gemeinsamer biogenetischer Ursprung verbindet Doxorubicin und Mensacarcin (s. Abb. 11). Durch die in der Struktur von Mensacarcin fehlende Zuckereinheit lassen sich die beiden Polyketide voneinander abgrenzen. Der Zucker stabilisiert die Interkalation der Anthrazykline durch Wechselwirkungen mit dem zweiten DNA-Strang und ist essentiell für ihre Wirksamkeit [62]. Untersuchungen mit dem Verfahren Durchflusszytometrie geben Hinweise auf einen neuartigen Mechanismus für die Aktivität von Mensacarcin [63]. Es werden bevorzugt Zellen in der S-Phase arretiert - eine Spezifität die bisher nur von Antimetaboliten bekannt ist [64]. Die Oxiranringe von Mensacarcin sind typische Strukturmerkmale von Zytostatika, die als Alkylantien kovalente DNA-Addukte bilden [65]. Mensacarcinderivate ohne Epoxidierung der Seitenkette zeigen eine deutlich verringerte Aktivität, was auf die Alkylierung als Wirkkomponente hinweist. Die Spezifität für die S-Phase des Zellzyklus kann jedoch nicht auf die phasenunabhängige Alkylierungsaktivität zurückgeführt werden. Ein Problem des therapeutischen Einsatzes der Anthrazykline ist die kumulative Kardiotoxizität der Wirkstoffe. Zahlreiche Mechanismen werden für die besondere Empfindlichkeit von Kardiomyozyten verantwortlich gemacht [62]. Durch einen Redoxzyklus zwischen Chinon und Hydrochinon entstehen im menschlichen Körper vermehrt Superoxidanionradikale und Wasserstoffperoxid [62]. Der dadurch hervorgerufene oxidative Stress wirkt zellschädigend. In Kardiomyozyten stehen nur geringe Konzentrationen der H2O2 detoxifizierenden Katalase zur Verfügung. Der zweite Weg zur H2O2-Umwandlung über die Selen abhängige GSH-Peroxidase 1 wird durch Anthrazyklin bedingte Inaktivierung des Enzyms blockiert [62]. Im Gegensatz zu den Anthrazyklinen weist Mensacarcin keine 14 Einleitung Chinonstruktur auf. Der Unterschied weckt die Hoffnung, dass Mensacarcin nicht über die Dosis limitierende, kumulative Kardiotoxizität der Anthrazykline verfügt. Entsprechende Untersuchungen liegen noch nicht vor. Die in dieser Arbeit angestrebte Identifikation des Mensacarcinbiosynthesegenclusters sollte Einblick in die Biosynthese des Zytostatikums geben und die notwendige Grundlage zur biotechnologischen Gewinnung von Derivaten schaffen. 1.4 Das Erbgut von Streptomyces spp. Das lineare Chromosom von Streptomyces spp. hat eine Größe von etwa neun Millionen Basenpaaren und liegt in den vegetativen Zellen in mehreren Kopien vor [66]. Die erste zusammenhängende Karte verschiedener Gene des Chromosoms von S. coelicolor wurde 1967 veröffentlicht [67]. Zur Gesamtheit der Erbinformation können lineare Plasmide mit einer Größe bis zu einigen Hundert Kilobasenpaaren beitragen [68]. Genomsequenzierungen von Streptomyces spp. [69-71] offenbaren das Potential der Stämme viele, derzeit noch nicht identifizierte Sekundärstoffe zu produzieren. Gene eines Sekundärstoffbiosynthesewegs sind oft direkt hintereinandergeschaltet. Der zusammenhängende DNA-Bereich wird als Biosynthesegencluster bezeichnet [68]. Durch die natürliche genetische Instabilität des Streptomyces-Genoms kann sich die Kopienzahl von Sekundärstoffbiosynthese-, Resistenzund Regulatorgenen erhöhen [72]. Die Selektion von natürlich oder forciert entstandenen Zufallsmutanten ermöglicht die Gewinnung von Antibiotikaüberproduzenten zum industriellen Einsatz. Der Einsatz gezielter Mutationen im Genom von Streptomyces spp. wurde 1983 erstmals publiziert. Durch Phagen vermittelten Genaustausch gelang es, den funktionellen Zusammenhang eines bestimmten DNA-Bereichs des Riesenplasmids SCP1 aus Streptomyces coelicolor mit der Methylenomycin A-Biosynthese in Verbindung zu bringen [73]. Im folgenden Jahr konnte das Actinorhodinbiosynthesegencluster des Stammes, als erstes Sekundärstoffbiosynthesegencluster einer Streptomyces sp. vollständig subkloniert werden. In Streptomyces parvulus eingebracht, initiierte der Subklon die Produktion von Actinorhodin [74]. Das Ziel der genetischen Experimente mit Streptomyces spp. ist ein besseres Verständnis der metabolischen und regulatorischen Prozesse dieser für den Menschen wichtigsten Antibiotikalieferanten [75]. Die Produktivität und Diversität der Antibiotika kann gezielt erhöht werden, um im Kampf gegen Resistenz erwerbende pathogene Bakterien mitzuhalten. Einleitung 1.5 15 Erhöhung der Diversität bakterieller Sekundärstoffe 1.5.1 Geninaktivierung Die Inaktivierung negativer Regulatorgene und die Blockade von Biosynthesewegen, die auf die gleichen Vorläufermoleküle zurückgreifen, können neben der Erhöhung der Kopienzahl von Biosynthesegenen zur Überproduktion eines Sekundärstoffs führen. Mutationen in Genen, deren Translationsprodukte frühe Schritte einer Biosynthese katalysieren, können zum vollständigen Abbruch der Produktion des Sekundärmetaboliten führen. Betrifft die Mutation Gene, die zum Aufbau des Grundgerüsts nicht essentiell sind, treten meist neue Metaboliten im Produktionsprofil des Stammes auf: dabei kann es sich um Biosynthesevorläufer oder Shuntprodukte handeln, die aus einem Nebenast des Biosynthesewegs hervorgehen [24]. Die ungezielte Geninaktivierung ist durch energiereiche Strahlung und Chemikalien sowie enzymatisch durch Integrasen und Transposasen realisierbar [66]. Eine detaillierte Übersicht zu Methoden der gezielten Geninaktivierung findet sich unter 5.8.1. 1.5.2 OSMAC und genome mining Schon vor Verfügbarkeit der ersten Genomsequenzen von Streptomyces spp. konnte das große Potential einzelner Bakterien dieser Gattung zur Produktion unterschiedlicher Sekundärstoffe mit dem OSMAC-(one strain - many compounds)-Ansatz teilweise aufgedeckt werden [76]. Beim OSMAC-Ansatz wird das Metabolitenprofil eines Stammes in verschiedenen Nährmedien unter variierten Fermentationsbedingungen analysiert. Auch der Zusatz von organischen Lösungsmitteln oder Signalstoffen kann zur Erhöhung der chemischen Diversität bestimmter Stämme führen [77;78]. Nicht immer ist die unter veränderten Kulturbedingungen auftretende Biosynthese neuer Sekundärstoffe auf ein separates Gencluster zurückzuführen. Der postgenomische Ansatz des "genome mining" bringt den OSMAC-Gedanken auf genetische Ebene. Bakterielle Genome beherbergen in der Regel viel mehr Sekundärstoffbiosynthesegencluster, als entsprechende Metaboliten des Stammes bekannt sind. Eine Aktivierung der "stillen Cluster" kann die Produktion neuer Sekundärstoffe auslösen [79]. Insbesondere für Produkte der modularen PKS I lässt sich bereits aus der DNA-Sequenz des Clusters ein Strukturvorschlag ableiten [80]. 16 Einleitung 1.5.3 Biotransformation In der Biochemie versteht man unter Biotransformation die in zwei Phasen unterteilbare Umwandlung von Xenobiotika innerhalb eines Lebewesens (vgl. 1.1). Als Methode der organischen Chemie wird mit den Begriffen Biotransformation und Biokatalyse die Umwandlung von chemischen Stoffen durch isolierte Enzyme, lebende oder permeabilisierte Zellen bezeichnet. Weiterführend ist unter Biokonversion die Umwandlung von Xenobiotika in ganzen Organismen zu verstehen [81;82]. Haben die zugefütterten Substrate Ähnlichkeit mit den Vorläufern endogener Metaboliten spricht man von Vorläufer dirigierter Biosynthese, wenn es sich um Wildtyp-Stämme handelt [83], von Mutasynthese, wenn mit Mutanten mit Defekt im entsprechenden Biosyntheseweg gearbeitet wird [84]. Die Verwendung lebender Zellen hat gegenüber dem Einsatz isolierter Enzyme den Vorteil, dass Kofaktoren der Reaktion kontinuierlich bereitgestellt werden. Innerhalb der Zellen liegt eine Umgebung vor, die die Effektivität der Katalyse und die Stabilität der Enzyme begünstigen kann. Vom Enzymsystem der Zellen katalysierte Nebenreaktionen können die Ausbeute jedoch verringern. Bei intakten Zellen stellt die Zellmembran eine Barriere zwischen dem Akzeptormolekül im Kulturmedium und dem Enzym im Zytoplasma dar. Die Zellmembran ist semipermeabel. Frei diffundieren können nur kleine, ungeladene Moleküle. Durch den Einsatz mechanisch oder chemisch permeabilisierter Zellen kann diese Einschränkung umgangen werden. Die Biotransformation ist ein wichtiges Werkzeug zur Erhöhung der chemischen Diversität. Industriell wird sie vor allem eingesetzt, um strukturelle Modifikationen durchzuführen, die mit den klassischen Methoden der organischen Chemie schwerer zu realisieren sind. Dazu gehört zum Beispiel die regio- und stereoselektive Hydroxylierung von Steroiden in der Arzneistoffsynthese [85]. 1.5.4 Kombinatorische Biosynthese Durch die Hintereinanderschaltung enzymkatalysierter Reaktionen entsteht in Bakterien aus einer begrenzten Anzahl von Biosynthesevorläufern eine große strukturelle Vielfalt von Sekundärstoffen. Der zwischen Bakterien mögliche horizontale Gentransfer könnte mit der Bildung neuer Kombinationen auf natürliche Weise zu dieser Vielfalt beigetragen haben [86]. Mit dem Begriff "kombinatorische Biosynthese" wird ein Ansatz bezeichnet, der mit molekularbiologischen Methoden Gene oder Teile von Genen aus unterschiedlichen Biosynthesewegen vereint. Ein Hauptziel der kombinatorischen Biosynthese ist die Gewinnung neuer bioaktiver Moleküle mit optimierten Eigenschaften für den Einsatz als Arzneistoffe [87]. Einleitung 17 Ein klassisches Beispiel ist die Kombinatorik mit Bestandteilen der modularen PKS I. Durch den Einsatz von Hybridmodulen, aufgebaut aus Domänen der Erythromycin- und der Rapamycin-PKS, konnten neue Analoga des Erythromycinvorläufers 6-Desoxyerythronolid B gewonnen werden [88]. Bei einem Ansatz mit 14 synthetischen Modulen, zusammengestellt aus acht unterschiedlichen PKS, führte die Hälfte der überprüften Dreierkombinationen zur Produktion von Triketidlactonen [89]. Auch die Kombination von Ketosynthase-, Acyl-Carrier-Protein-, Ketoreduktase- und Cyclasegenen aus verschiedenen PKS II-Biosynthesewegen führte zum Auftreten neuartiger Polyketide [90]. Die gezielte Synthese von PKS II-Metaboliten ist jedoch nur schwer zu realisieren [91]. Das Glykosylierungsmuster bakterieller Sekundärstoffe kann durch kombinatorische Biosynthese verändert werden. Der Austausch eines Ketoreduktasegens der Zuckerbiosynthese im Doxorubicinproduzenten Streptomyces peuceticus führte zur Produktion des klinisch relevanten Anthrazyklinzytostatikums Epirubicin [92]. Die Gewinnung von Aranciamycinderivaten mit alternativer Zuckereinheit ist ein weiteres Beispiel (s. 1.3.4). Oft limitiert die hohe Substratspezifität von Glykosyltransferasen jedoch ihre Anwendung in der kombinatorischen Biosynthese [93]. Durch den Einsatz von Hybridgenen [94] oder Sättigungsmutagenese [95] kann die Spezifität der Enzyme für alternative Substrate optimiert werden. 18 2 Zielsetzung der Arbeit In Biokonversionsversuchen mit dem Bakterium Saccharothrix espanaensis war eine Derivatisierung von zum Kulturmedium hinzugefügten, stammfremden Naturstoffen beobachtet worden. Die Art der Derivatisierung sollte bestimmt werden (s. 3.1). Aus einer Bibliothek von vorselektierten Cosmiden sollten Glykosyltransferasegene isoliert werden und damit der Grundstein für den Aufbau der Freiburger GlykosyltransferasenToolbox gelegt werden (s. 3.1.9). Die Produktion des Antibiotikums und Zytostatikums Polyketomycin in Streptomyces diastatochromogenes Tü6028 sollte durch gezielte Mutation ausgeschaltet werden, um einen Stamm für die Genexpression, Biotransformation und kombinatorische Biosynthese zu gewinnen (s. 3.2). Teile eines PKS II-Biosynthesegenclusters aus dem Mensacarcinproduzenten Streptomyces sp. Gö C4/4 lagen vor. Ein Zusammenhang des Genclusters mit der Biosynthese des Zytostatikums Mensacarcin sollte überprüft werden (s. 3.3). 19 Ergebnisse 3 Ergebnisse 3.1 Glykosylierte Naturstoffe durch Biotransformation in Saccharothrix espanaensis 3.1.1 Biotransformation von Alizarin und Emodin Nach einer Kultivierung von Saccharothrix espanaensis unter Zusatz der Anthrachinone Alizarin oder Emodin (s. Abb. 12) konnten in den Kulturextrakten per HPLC neue Substanzen detektiert werden, deren UV/VIS-Absorptionsspektren Ähnlichkeit zu denen der zugefütterten Anthrachinone zeigten. Diese Beobachtung führte zur Annahme, dass in den Kulturen eine Derivatisierung stattgefunden hatte [96]. O OH 8 12 7 6 11 13 9 10 5 1 OH OH 2 3 14 4 8 7 12 6 HO 11 Mr: 240,21 OH 13 9 1 2 3 10 14 5 O Alizarin O 4 CH3 O Emodin Mr: 270,24 Abb. 12: Strukturformeln von Alizarin und Emodin. Zunächst galt es, die Reproduzierbarkeit der Transformation zu überprüfen und standardisierte Kulturbedingungen zu etablieren (s. 5.3.1.4). Die Umsetzung von Alizarin oder Emodin wurde in allen getesteten Medien (NL111, E1, SG, NL5, s. 5.2.2.4) erreicht, wobei das aus Fleisch- und Malzextrakt zusammengesetzte NL111-Medium laut HPLCAnalyse die höchsten Ausbeuten erwarten ließ. Unter identischen Bedingungen angesetzte Kontrollen mit sterilem Nährmedium zeigten keine Derivatisierung. Es handelt sich folglich um Biotransformationsreaktionen. Nach der Umsetzung von Alizarin tritt die Substanz AliPro1 als Hauptprodukt mit Alizarin ähnlichem UV/VIS-Absorptionsspektrum im Chromatogramm des Kulturextrakts auf (s. Abb. 13). In den Massenspektren von AliPro1 liegen die Signale höchster Intensität bei m/z = 425 [M+K]+ bzw. m/z = 385 [M−H]−. Die Fragmentionen mit m/z = 241 (positiv geladen) bzw. m/z = 239 (negativ geladen) identifizieren Alizarin (Mberechnet: 240,04) als Grundkörper von AliPro1. Der Massengewinn deutet auf eine Konjugatbildung hin. Aufgrund der erhöhten Hydrophilie und einer Massendifferenz von 146 u könnte es sich bei AliPro1 um ein Glykokonjugat mit einer O- oder C-verknüpften Monodesoxyhexose handeln. Das Isotopenmuster des Metaboliten steht im Einklang mit dieser Hypothese. 20 Ergebnisse Die α-Hydroxylgruppe von Alizarin (1-OH) ist ein wesentlicher Bestandteil des chromophoren Systems mit λmax = 430 nm. Der benachbarten Hydroxylgruppe (2-OH) wird ein bathochromer Effekt zugeschrieben [97]. Das Absorptionsmaximum von AliPro1 (λmax = 417 nm) ist im Vergleich zu dem der Ausgangsverbindung um 13 nm hypsochrom verschoben (s. Abb. 13). Eine Verschiebung in dieser Größenordnung wird bei der Substitution eines Hydroxylgruppenwasserstoffatoms erwartet. Beispielsweise weichen die Werte von 1-Hydroxyanthrachinon (λmax = 402 nm) und 1-Methoxyanthrachinon (λmax = 378 nm) um 24 nm voneinander ab. Bei 2-Hydroxyanthrachinon (λmax = 378 nm) und 2-Methoxyanthrachinon (λmax = 363 nm) beträgt die Differenz 15 nm (gemessen in Ethanol) [97]. mAU int. [%] (430 nm) 80 [M-146+H]+ 241 40 200 + + [M+Na] 409 240 400 int. [%] [M-H] 80 385 40 [M-146-H] 239 100 240 400 [M+K] 425 420 rel. Abs. 1000 Alizarin (19.5 min) AliPro1 (15.7 min) m/z 500 - [M+Cl] 421 420 AliPro1 Alizarin m/z 0 300 400 500 nm 0 0 10 20 30 min. Abb. 13: LC/ESI-MS Analyse des Ethylacetatextrakts einer Kultur von S. espanaensis nach Zufütterung von Alizarin (Methode: antqui, s. 5.11.6). Die Biotransformation von Emodin in Kulturen von S. espanaensis führt zu drei Hauptmetaboliten: EmoPro1, EmoPro2 und EmoPro3 (s. Abb. 14). Die Massenspektren der Metaboliten signalisieren, wie bei der Umsetzung von Alizarin, eine Konjugatbildung mit Molekülmassenzunahme um 146 u (EmoPro1, EmoPro2) bzw. 2×146 u (EmoPro3). Die Absorptionsbande mit Maximum bei 440 nm ist bei allen Derivaten hypsochrom verschoben und hat relativ zu den Banden zwischen 248 nm und 288 nm deutlich an Ausprägung verloren. Zur Intensität dieser Absorptionsbande tragen alle drei Hydroxylgruppen von Emodin gemeinsam bei [97]. Die beobachtete Verringerung der Intensität zeigt eine Substitution von Hydroxylgruppenprotonen an. Die UV-Absorptionsbande zwischen 248 nm und 288 nm weist eine Feinstruktur mit drei Maxima auf: 1. 251 nm ± 3 nm 2. 270 nm ± 3 nm 3. 285 nm ± 3 nm Die Ausprägung der Maxima hängt vom Substitutionsmuster von Emodin ab. 21 Ergebnisse mAU (430 nm) 300 Emodin 24,1 min EmoPro2 13,4 min 200 100 EmoPro3 12,3 min EmoPro1 15,3 min 10 20 0 0 EmoPro3 (M: 562) mAU EmoPro2 (M: 416) mAU 268nm 80 160 418nm 80 220 300 40 0 300 400 500 int.[%] m/z - - 300 400 500 nm + [2M+Na] 855 500 0 300 220 300 m/z 400 + 80 40 840 m/z 0 300 220 300 + [2M+Na] 855 int.[%] 40 0 0 m/z 400 400 500 nm CI-Quelle, keine pos. Ionisierung durch ES + 80 [M+H] 271 40 840 m/z 0 int.[%] - [M-H] 415 80 40 400 500 nm [M-146+K] + [M+K] 293 455 int.[%] - 300 400 440nm 400 + [M-H] 415 80 254nm 267nm 288nm 800 mAU 423nm [M-146+H] int.[%] 271 [M-146+K] + [M+K] 293 455 int.[%] [M-146-H] 415 40 0 40 [M+Cl] 597 80 40 + 80 + [M+K] 601 Emodin (M: 270) mAU 248nm 272nm 282nm 80 400 + 417 80 220 300 [M-146+H] int.[%] 271 + [M-2*146+K] 293 [M-146+H]+ int.[%] EmoPro1 (M: 416) 424nm 40 500 nm 400 254nm 268nm 284nm min. 30 80 400 m/z 300 - [M-H] 269 40 300 400 m/z 0 300 400 m/z Abb. 14: LC/ESI-MS Analyse des Ethylacetatextrakts einer Kultur von S. espanaensis nach Zufütterung von Emodin (Methode: antqui, s. 5.11.6). 3.1.1.1 Isolierung und Strukturaufklärung der Biotransformationsprodukte Um für die Strukturaufklärung per NMR-Spektroskopie ausreichende Mengen der Reinsubstanzen isolieren zu können, wurde unter Beibehaltung der etablierten Kultur- und Zufütterungsbedingungen (s. 5.3.1.4) die Anzahl der Schüttelkolben erhöht. Isolierung von AliPro1 In insgesamt 1 L NL111-Flüssigmedium wurde S. espanaensis unter Zufütterung von insgesamt 50 mg Alizarin kultiviert (s. 5.3.1.4). Nach Abschluss der Inkubationszeit wurde die Kultur mit Ethylacetat extrahiert (s. 5.11.1.1). Der in Wasser suspendierte Rohextrakt wurde 22 Ergebnisse zur Festphasenextraktion auf eine 10 g Sep-Pak-C18-Kartusche aufgebracht und stufenweise mit 80 % bis 0 % Wasser in Methanol eluiert (s. 5.11.1.2). AliPro1 lag fast ausschließlich in der Fraktion mit 40 % Wasseranteil vor und wurde nach Gefriertrocknung dieser Fraktion (s. 5.11.10) mit der präparativen HPLC isoliert (Methode: alipro1, s. 5.11.5). Nach Gefriertrocknung der AliPro1 führenden HPLC-Fraktionen wurden 5,1 mg eines roten Pulvers erhalten und für die NMR-Analyse in DMSO-d6 gelöst. Isolierung von EmoPro1, EmoPro2 und EmoPro3 Über wiederholte Flash-Chromatographie (s. 5.11.3) mit Methanol-Wasser-Gradienten und LiChroprep RP 18 als stationärer Phase bzw. Gelfiltrationen über Sephadex LH-20 und Methanol als Fließmittel wurden aus dem Ethylacetatextrakt einer mit 200 mg Emodin gefütterten 4 L-Kultur von S. espanaensis in NL111-Medium 3,5 mg EmoPro1 als oranges Pulver erhalten. Die Abtrennung von EmoPro2 von den anderen Metaboliten gestaltete sich schwierig, gelang aber letztlich durch Kristallisation aus Methanol / H2O, wobei 2,0 mg EmoPro2 als hellgelbe Nadeln ausfielen. In einem Versuch zur Medienoptimierung zeichnete sich die Biotransformation in E1-Medium durch eine verstärkte Bildung von EmoPro2 aus. S. espanaensis wurde zur Gewinnung von weiterem EmoPro2 in 2 L E1-Medium unter Zufütterung von 100 mg Emodin angezogen. Überraschenderweise hatte sich bei dieser Kultivierung fast ausschließlich EmoPro3 gebildet. Über wiederholte Flash-Chromatographie an LiChroprep RP 18 und Sephadex LH-20 konnten 24,6 mg EmoPro3 als gelbes Pulver gewonnen werden. Bezogen auf die im weiteren Verlauf der Experimente bestimmte relative Molekülmasse von EmoPro3 entspricht dies einer Ausbeute von 12 %. Durch Kristallisation aus Methanol / H2O wurden gelbe Nadeln erhalten. 9,5 mg des kristallisierten EmoPro3 sowie die gesamte zur Verfügung stehende Substanz von EmoPro1 und EmoPro2 wurden für NMR-Analysen in DMSO-d6 gelöst. NMR-Interpretation von EmoPro3 Die NMR-Interpretation lässt sich durch den Vergleich der 1H-Spektren von EmoPro3 und der Vorläufersubstanz Emodin veranschaulichen (s. Abb. 15). Die Protonensignale der drei Hydroxylgruppen von Emodin sind bei δH = 11 - 12 ppm zu finden. Die Wasserstoffatome der α-Hydroxylgruppen (1-OH, 8-OH) werden vom benachbarten Sauerstoffatom an C-9 koordiniert. Die entsprechenden 1H-Signale lassen sich durch ihre scharfe Form identifizieren. Im Gegensatz dazu erscheint das Signal des 6-OHProtons verbreitert bei etwas höherem Feld. Das 1H-Spektrum von EmoPro3 lässt nur noch ein scharfes Signal bei δH = 13,12 ppm erkennen. Eine HMBC-Korrelation mit C-2 identifiziert es als Protonensignal der 1-OH-Gruppe (s. Abb. 19 A). Die durch die Biotrans- 23 Ergebnisse formation eingeführten Konjugationspartner könnten demnach über die Sauerstoffatome an C-8 und C-6 verknüpft vorliegen. Die bei δH = 6,5 ppm bis 7,5 ppm auftretenden Signale der aromatischen Protonen von Emodin finden sich vollständig im 1H-Spektrum von EmoPro3 wieder. Bei identischen Kopplungsmustern weisen sie jedoch deutlich abweichende chemische Verschiebungen auf. Zahlreiche zusätzliche Signale ergibt EmoPro3 bei δH = 1 - 6 ppm. Zwei Dubletts (jeweils J = 1,7 Hz) mit dem Integral von je einem Proton erscheinen bei einer charakteristischen Verschiebung (δH = 5,58 ppm) für anomere Protonen O-glykosidisch verknüpfter Zucker. Im HSQC-Spektrum korrelieren die Dubletts mit Signalen bei δC = 98,65 ppm bzw. 99,01 ppm (C-1', C-1''), was ebenfalls für eine O-glykosidische Verknüpfung spricht. Die chemische Verschiebung des C-1-Signals einer C-glykosidischen Bindung betrüge etwa 75 ppm. Der Massengewinn von 2×146 u durch die Biotransformation lässt auf zwei Monodesoxyzucker schließen. Den häufigsten natürlich vorkommenden Monodesoxyzuckern fehlt die Hydroxylgruppe am sechsten Kohlenstoffatom. In diesem Fall sind bei δH = 1 - 2 ppm bzw. δC = 15 - 18 ppm die Signale der CH3-Gruppe zu erwarten. In den Spektren von EmoPro3 lassen sich entsprechende, im HSQC-Spektrum korrelierende Signale, bei δH = 1,12 ppm und δH = 1,13 ppm (J = 6,2 Hz, 6H, 2 Dubletts) sowie δC = 17.82 ppm und 17.86 ppm detektieren. DMSO H2O Emodin 14 13 12 11 10 9 8 . . EmoPro3 7 ppm 6 5 4 Abb. 15: 1H-NMR-Spektren (DMSO-d6, 400 MHz) von Emodin und EmoPro3. 3 2 1 0 24 Ergebnisse Um weitere Informationen zur Identität der verknüpften Zucker zu sammeln, mussten die sich im 1H-Spektrum überlagernden Signale beider Zucker getrennt werden. Eine Zuordnung aller Signale zu jeweils einer der Zuckereinheiten gelang mit 1D-TOCSY-Experimenten (s. Abb. 16). Dabei wird selektiv auf ein Signal eingestrahlt. Die Intensität der Signale des resultierenden Subspektrums hängt vom Grad der Beteiligung der entsprechenden Protonen am getroffenen Spinsystem ab. Über COSY-Konnektivitäten lässt sich ausgehend von den Signalen der anomeren Protonen die Zuordnung der Zuckerprotonen vornehmen. Die sich entsprechenden Signale beider Zuckereinheiten weisen identische Kopplungskonstanten auf. Mit Ausnahme des 3'-H- / 3''-HSignals sind auch die chemischen Verschiebungen sehr ähnlich. Das 4'-H- / 4''-H-Signal wird vom H2O-Signal überlagert. Die Bestimmung der Kopplungskonstanten letzterer Signale wurde durch 1D-ROESY-Experimente erreicht. Die Kopplungskonstanten hängen gemäß der Karplus-Beziehung vom Torsionswinkel der C-H-Bindungen an der C-C-Achse ab (s. Abb. 17). Für beide Zuckereinheiten von EmoPro3 werden Torsionswinkel bestimmt (s. Tab. 2), die gut mit den berechneten Werten von Rhamnose übereinstimmen, wobei sich die Torsionswinkel von anomerer α- und βKonfiguration nur wenig unterscheiden. Wertvolle Hinweise zur relativen Konfiguration der Zuckereinheit erhält man durch die per NOESY detektierten nuklearen Overhauser Effekte (NOEs). Sie signalisieren räumliche Nähe von Protonen mit Abständen < 4 Å. Im NOESY-Spektrum auftretende NOEs sind für kleine Moleküle (M < 600) positiv, haben bei mittelgroßen Molekülen (M = 700 - 1200) einen Nulldurchgang und sind negativ für große Moleküle (M > 1200) [98]. Da die Molekülmasse von EmoPro3 (M: 562) in der Nähe des Nulldurchgangs des NOESY-Spektrums liegt, wurde auf das hier besser geeignete, aber vergleichbare Spektren ergebende ROESY-Pulsprogramm ausgewichen. Es wurde zunächst ein 2D-ROESY-Spektrum aufgenommen. ROESY-Kreuzpeaks erscheinen hier immer in der entgegengesetzten Phase zu den Diagonalpeaks. Peaks in der Phase der Diagonale sind Artefakte, die auf TOCSY-Transfer oder chemischen Austausch zurückzuführen sind. Im 2D-Spektrum überlagerten Artefakte einige der ROESY-Kreuzpeaks der Zuckereinheiten. Durch selektive Einstrahlung konnten durch 1D-ROESY-Experimente wichtige räumliche Nachbarschaften abgesichert werden. Beide Zuckereinheiten zeigen alle für Rhamnoside mit anomerer α-Konfiguration (s. Abb. 18) erwarteten NOEs (s. Tab. 2). Eine anomere β-Konfiguration ließe zusätzlich charakteristische Kreuzpeaks zwischen 1-H und 5-H sowie 1-H und 3-H erwarten. Diese NOEs treten jedoch nicht auf. Für beide Zuckereinheiten wird deshalb die α-Konfiguration vorgeschlagen. Die Zugehörigkeit von Zuckern zur D- oder L-Reihe lässt sich indirekt über die Klyne-Regel bestimmen [99]. Diese empirisch gefundene Regel besagt, dass Desoxyzucker in Naturstoffen entweder der β-D- oder der α-L-Reihe zuzuordnen sind. Demnach würde es sich bei den Zuckern von EmoPro3 um α-L-Rhamnose handeln. Eine Ausnahme der Klyne-Regel ist die α-verknüpfte 3-O-Carbamoyl-2-desoxy-D-rhamnose als Bestandteil von Irumamycin aus Streptomyces subflavus subsp. irumaensis AM-3603 [100]. Unter 3.1.4.1 konnte die absolute 25 Ergebnisse Konfiguration der Zuckereinheit des Biotransformationsprodukts QuercPro1 aus S. espanaensis als α-L-Rhamnose bestimmt werden. Die unter 4.1.1 präsentierte Literaturrecherche zeigt, dass Lebewesen zum Glykosyltransfer auf kleine, lipophile Moleküle meist nur einen, für den jeweiligen Organismus spezifischen Zuckerbaustein einsetzen. Es kann deshalb davon ausgegangen werden, dass es sich bei EmoPro3 um 6,8-Di-O-α-L-rhamnosylemodin handelt. 4'-OH 3'-OH 2'-OH 3'-H 5'-H 2'-H 1D-TOCSY 1'-H 1''-H 4'-H 2''-OH 3''-OH 2''-H 4''-H 4''-OH 3''-H 5''-H 1D-TOCSY 1 H Abb. 16: 1D-TOCSY-Subspektren erlauben die Zuordnung der 1H-Signale zu jeweils einer der beiden Zuckereinheiten. Das Signal der selektiven Einstrahlung ist gekennzeichnet ( ). Das Signal von 6'-H tritt bei δH = 1,13 ppm (J = 6,2 Hz), das Signal von 6''-H bei δH = 1,12 ppm (J = 6,2 Hz) auf. H H H3C HO 5' 6' 3' 51° OR O 4' 174° Karplus-Beziehung HO H 168° 1' H H 68° 2' OH O-α-L-Rhamnosid Abb. 17: Abhängigkeit der Kopplungskonstanten vom Torsionswinkel: Karplus-Beziehung (Abb. aus [101]) und Modelling der Torsionswinkel für O-α-L-Rhamnoside [102]. 26 Ergebnisse Tab. 2: Kopplungskonstanten und NOEs zur Bestimmung der Konfiguration der Zuckereinheiten (identisch für beide Zucker). 1 H 1'-H 2'-H 3'-H 4'-H 5'-H 6'-H m, J (Hz) d 1,6 m<5 ddd 3,3; 5,9; 9,2 t 9,2 (1D-ROESY) qd 6,2; 9,3 d 6,2 H 2,47Å HO 5' 6' 3' 4' 2,5-3,1Å H HO erwartete Torsionswinkel 1'-H / 2'-H : ca. 60° 2'-H / 3'-H : ca. 60° 3'-H / 4'-H : ca. 180° 4'-H / 5'-H : ca. 180° H 2,68Å H H3C NOEs 2'-H 1'-H, 3'-H 2'-H, 5'-H 6'-H 3'-H, 6'-H 4'-H, 5'-H 2,44Å O OR 1' 2' OH O-α-L-Rhamnosid H H 4' 2,54Å 2,5-3,1Å 2,50Å H3C OH O 6' HO HO 5' 2' 3' 2,67Å H 1' H H 2,47Å 2,40Å H OR 2,49Å 2,57Å O-β-D-Rhamnosid Abb. 18: Aufgrund kurzer Protonenabstände erwartete NOEs für Rhamnoside mit α- und β-Konfiguration. Zu klären blieb hingegen noch die Frage, warum die chemischen Verschiebungen der Signale von 3'-H (δH = 3,67 ppm) und 3''-H (δH = 3,95 ppm) deutlich stärker voneinander abweichen, als alle anderen sich entsprechenden Signale beider Zuckereinheiten. Aus der Literatur sind die NMR-Spektren von 6-O-α-L-Rhamnosylemodin (= Frangulin A) und von Frangulin ADerivaten bekannt, bei denen das 3'-H-Signal in DMSO-d6 eine Verschiebung von δH = 3,64 ppm aufweist [103]. Die O-glykosidische Verknüpfung von α-L-Rhamnose mit der α-Hydroxylgruppe eines Anguzyklins findet sich in der Struktur der Atramycine aus Streptomyces atratus BY90. Die chemische Verschiebung des 3'-H-Signals beträgt 4,22 ppm, die weiteren 1H-Signalverschiebungen der Zuckereinheit entsprechen den Literaturwerten von Frangulin A (jeweils gemessen in CD3OD) [104]. Somit wird die Abhängigkeit der 3'-H-Verschiebung von der Verknüpfungsposition der α-L-Rhamnose am Anthrachinongrundgerüst deutlich, wobei das Signal bei Glykosylierung in α-Position zu tieferem Feld verschoben ist. Eine Erklärung für die Verschiebung des 3''-H-Signal von EmoPro3 zu tieferem Feld könnte die räumliche Nähe zum Carbonylsauerstoff an C-9 sein. Dieser signifikante Unterschied erlaubt die Zuordnung des ersten Zuckers (eingestrichen) zur C-6-Verknüpfung und des zweiten Zuckers (zweigestrichen) zu C-8-Verknüpfung mit dem Aglykon. Die postulierten Glykosylierungspositionen lassen sich durch das aufmerksame Studium der zweidimensionalen Spektren absichern. Abb. 19 A zeigt die bereits oben erwähnte HMBCKorrelation zwischen dem einzigem 1H-Signal einer aromatischen Hydroxylgruppe und dem 27 Ergebnisse 13 C-Signal von C-2. Damit kann C-1 als Glykosylierungsposition ausgeschlossen werden. Eine differenzierte Zuordnung des Signals der anomeren Protonen (dd, δH = 5,58 ppm) wird durch leicht gegeneinander verschobenen NOEs (Abb. 19 C, D) ermöglicht. Das bei höherem Feld erscheinende Dublett korreliert mit 5''-H des zweiten Zuckers und 7-H des Aglykons. Das bei tieferem Feld erscheinende Dublett korreliert mit 5'-H des ersten Zuckers und 5-H des Aglykons. Die Zuordnung der beiden Zuckereinheiten zu ihren Verknüpfungspunkten wird damit bestätigt. Zusätzlich lassen sich mit diesem Ergebnis über das HMBC-Spektrum auch die 13C-Signale von C-1 / C-6 / C-8 zuordnen (Abb. 19 B). 1-OH 1''-H 1''-H ppm ppm C-4 155 120 C-2 125 C-8 C-6 C-1 160 165 130 C-11 / C-14 13.15 13.10 ppm 5.6 A) HMBC-Korrelation von 1-OH und C-2 5''-H 5.5 ppm B) HMBC-Korrelation der anomeren Protonen und C-8 / C-6 5-H 4-H 5'-H 7-H 2-H ppm ppm 5.5 5.55 1''-H 1''-H 1''-H 5.60 5.6 1''-H 5.7 5.65 3.55 3.50 3.45 3.40 ppm C) ROESY-Kreuzpeaks der anomeren Protonen und 5'-H / 5''-H 7.4 7.2 ppm D) ROESY-Kreuzpeaks der anomeren Protonen und 5-H / 7-H Abb. 19: Bestimmung der Glykosylierungspositionen durch ausgewählte HMBC-Korrelationen und ROESYKreuzpeaks. Die vollständigen Spektren sind im Anhang abgebildet. 28 Ergebnisse Bestimmung der exakten Masse von EmoPro3 Aus der LC/MS-Analyse konnte die Nominalmasse von EmoPro3 abgeleitet werden. Mit dieser in Einklang steht das Ergebnis der NMR-Interpretation. Nur bedingt kann mit den eingesetzten 1H- und 13C-Techniken jedoch auf weitere an der Molekülstruktur beteiligte Atome geschlossen werden. Die Bestimmung der exakten Masse kann den Strukturvorschlag absichern. Mit einem hochauflösenden Hybrid-Massenspektrometer (LTQ-Orbitrap, s. 5.11.7) wurde dazu die exakte Masse des intensivsten monoisotopischen Peaks des positiv geladenen Pseudomolekülions ermittelt. Für den für EmoPro3 bestimmten m/z-Wert wurden Summenformelvorschläge mit den Elementen C, H, N, O und bis zu zwei S in einem Toleranzfenster von ± 5 ppm berücksichtigt (s. Tab. 3). Aus der atomaren Zusammensetzung wird für jeden Vorschlag die Anzahl an Ring-/ Doppelbindungsäquivalenten (RDB equiv.) berechnet. Über die vorausgegangene LC/ESI-MS-Analyse (s. Abb. 14) konnte für EmoPro3 eine Molekülmasse von 562 vorgeschlagen werden. Der über die Orbitrap-Analyse ermittelte m/z-Wert für [M+H]+ ist 563,17590. Die Anzahl der RDB-Äquivalente des ungeladenen Moleküls liegt stets um 0,5 Zähler höher als der für [M+H]+ Ionen berechnete Wert. Damit scheiden die Summenformelvorschläge (1, 3, 6, 9) mit gerader Zahl der RDB-Äquivalente aus. Diese Vorschläge entsprechen auch nicht der "Stickstoffregel" die besagt, dass bei geradzahliger Molekülmasse kein N oder eine gerade Zahl an Stickstoffatomen in der Summerformel zu erwarten ist. Durch die relative Intensität der Isotopensatelliten im Massenspektrum kann kein weiterer Vorschlag ausgeschlossen werden. Nur Vorschlag 2 mit der Summenformel C27H30O13 (ungeladenes Molekül) und 13 RDB-Äquivalenten lässt sich mit der NMR-Interpretation von EmoPro3 in Einklang bringen. Tab. 3: LTQ-Orbitrap-Analyse von EmoPro3. m/z 563.17590 Theo. Mass 1. 2. 3. 4. 5. 6. 7. 8. 9. 563.17591 563.17592 563.17458 563.17457 563.17726 563.17776 563.17323 563.17859 563.17860 Delta (ppm) -0.02 -0.03 2.35 2.36 -2.41 -3.31 4.74 -4.78 -4.79 RDB equiv. Composition 18.0 12.5 13.0 18.5 17.5 5.0 13.5 22.5 17.0 C26H25O8N7 C27H31O13 C25H29O12N3 C24H23O7N10 C28H27O9N4 C14H29O15N9 C23H27O11N6 C29H23O5N8 C30H29O10N Durch die Betrachtung aller von EmoPro3 aufgenommen NMR-Spektren (1H, 13C, COSY, HSQC, HMBC, 2D-ROESY, verschiedene 1D-ROESY und 1D-TOCSY) und die Bestimmung der exakten Masse lässt sich die Struktur von EmoPro3 als 6,8-Di-O-α-L-rhamnosylemodin (s. Abb. 20) beschreiben. Eine CAS-Datenbankabfrage mit 29 Ergebnisse SciFinder Scholar (s. 5.14) ergab für diese Struktur keinen Treffer [105], weshalb 6,8-Di-O-α-L-rhamnosylemodin als neuer Naturstoff angesehen werden kann. H 6'' OH O EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin) CH3 4'' 5'' OH H OH 2'' 1'' 3'' H H O O H 8 H OH 1 9 7 12 6' Mr: 562,52 5' H H3C HO 5 1' O 3' 4' HO H 3 10 O H 2 11 6 H H 13 14 4 O CH3 H H H 2' OH ROESY-Kreuzpeak HMBC-Korrelation Abb. 20: Struktur von EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin). Strukturen von EmoPro1 und EmoPro2 Die 1H-NMR-Spektren von EmoPro1 und EmoPro2 (s. Abb. 21) offenbaren jeweils den einfachen Signalsatz O-glykosidisch verknüpfter α-L-Rhamnose. In Analogie zur EmoPro3NMR-Interpretation konnte für EmoPro1 und EmoPro2 durch die Auswertung weiterer Spektren (13C, COSY, HSQC, HMBC, 1D- / 2D-ROESY (nur EmoPro1), 2D-NOESY (nur EmoPro2)) eine Zuordnung der 1H-Signale vorgenommenen werden (s. Abb. 21) und die in Abb. 22 gezeigten Strukturen vorgeschlagen werden. In beiden Fällen fand die Rhamnosylierung einer α-Hydroxylgruppe (1-OH bzw. 8-OH) statt. Wie beim ebenfalls mit einer α-Hydroxylgruppe (8-OH) verknüpften zweigestrichenen Zucker von EmoPro3 liegt die chemische Verschiebung des 3'-H-Signals von EmoPro1 und EmoPro2 bei δH = 3,95 ppm ± 0,01 ppm. Trotz ähnlicher chemischer Strukturen von EmoPro1 und EmoPro2 unterscheiden sich die 1 H-NMR-Spektren der Stoffe grundsätzlich (s. Abb. 21). Während im Spektrum von EmoPro2 scharfe Signale der Protonen der Zuckerhydroxylgruppen und der verbleibenden α-Hydroxylgruppe erscheinen, sind die entsprechenden Signale von EmoPro1 deutlich breiter und erlauben keine Bestimmung der Multiplizität. Das 6-OH-Signal fehlt bei EmoPro1. Der deutlichste Unterschied besteht hinsichtlich des H2O-Signals. Das flache, breite H2O-Signal im Spektrum von EmoPro1 gewährt erstmalig einen Blick auf das 4'-H-Signal. Das Dublettvon-Dublett mit transdiaxialer 9,2 Hz-Kopplung erscheint als Pseudotriplett. 30 Ergebnisse Eine Erklärung der Unterschiede im 1H-Spektrum ist beim Isolierungsverfahren der Metaboliten zu suchen. EmoPro1 wurde als Pulver nach dem Abziehen des Lösungsmittels aus einer Fraktion der Flash-Chromatographie gewonnen und nach Gefriertrocknung direkt zur Herstellung der NMR-Probe verwendet. Im Gegensatz dazu wurden die NMR-Proben von EmoPro2 und EmoPro3 erst nach der Kristallisation aus Methanol / H2O und anschließender Gefriertrocknung hergestellt. Eingeschlossenes Kristallwasser, das durch Gefriertrocknung nicht entfernt wird, könnte zur Koordinierung der Hydroxylgruppenprotonen und damit zur festgestellten, scharfen Signalform führen. ~ H2O (4'-H) EmoPro2 (1-O-α-L-Rhamnosylemodin) 5-H / 7-H 8-OH 2-H 4-H 6-OH DMSO 4'-H 7-H 5-H 4-H / 2-H 1-OH H2O 2'-OH / 3'-OH / 4'-OH 2'-H / 3'-H DMSO 3-CH3 5'-CH3 3'-OH 5'-H 4'-OH 2'-H 2'-OH 3'-H 1'-H EmoPro1 (8-O-α-L-Rhamnosylemodin) 5'-H ~ ~ 3-CH3 5'-CH3 1'-H ppm Abb. 21: 1H-NMR-Spektren (DMSO-d6, 400 MHz) von EmoPro2 und EmoPro1. Die exakte Masse von EmoPro1 und EmoPro2 wurde mit dem LTQ-Orbitrap-Hybridmassenspektrometer (s. 5.11.7) bestimmt. Mit den für [M+H]+ gemessenen m/z-Werten 417,11808 (EmoPro1) und 417,11809 (EmoPro2) kommt als einziger Summenformelvorschlag C21H21O9 (Mberechnet: 417,11801, 11,5 RDB-Äquivalente) in Betracht. Die für das ungeladene Molekül abgeleitete Formel C21H20O9 entspricht den Strukturvorschlägen der NMR-Interpretation. Bei EmoPro1 handelt es sich demnach um 8-O-α-L-Rhamnosylemodin, bei EmoPro2 um 1-O-α-L-Rhamnosylemodin (s. Abb. 22). 31 Ergebnisse EmoPro1 Mr: 416,38 H 6' O CH3 OH EmoPro2 H 4' 4' 5' O H 12 9 5' H 13 6 HO 10 H 3 6 CH3 O H O 1 9 12 7 4 5 O 8 H 2 14 H 1' H OH H OH 7 11 O H3C 1 8 H H 6' 3' H H O HO OH 2' 1' 2' 3' OH H OH HO H 13 2 3 11 HO 14 10 H ROESY / NOESY-Kreuzpeak HMBC-Korrelation CH3 4 5 H O Abb. 22: Strukturen von EmoPro1 (8-O-α-L-Rhamnosylemodin) und EmoPro2 (1-O-α-L-Rhamnosylemodin). Struktur von AliPro1 Die Interpretation der NMR-Spektren von AliPro1 (1H, 13C, COSY, HSQC, HMBC, 2DNOESY) wurde in Kooperation mit Dr. T. Taguchi (AK Ichinose, Musashino University, Tokyo) durchgeführt. Die Struktur von AliPro1 ließ sich als 2-O-α-L-Rhamnosylalizarin beschreiben. Die Bestimmung von 2-OH als Glykosylierungsposition gelingt über einen NOE zwischen 3-H und 1'-H. Hinweis auf die Verknüpfungsposition ist des Weiteren die Präsenz eines 1H-Singuletts mit der typischen chemischen Verschiebung eines α-Hydroxylgruppenprotons (δH = 12,68 ppm). Das 1H-Signal von 3'-H liegt bei δH = 3,72 ppm und erscheint damit bei ähnlicher chemischer Verschiebung wie das äquivalente Protonensignal des 6-O-verknüpften Zuckers von Emodin (δH = 3,67 ppm). Die Abhängigkeit der chemischen Verschiebung des 3'-H-Signals von der Glykosylierungsposition wird mit diesem weiteren Beispiel bestätigt. AliPro1 (2-O-α-L-Rhamnosylalizarin) H 6' O CH3 OH 5' 4' OH H O OH H 1' H Mr: 386,35 H 1 8 H 12 9 O 13 7 2 6 3 11 10 14 4 5 H O Abb. 23: Struktur von AliPro1 (2-O-α-L-Rhamnosylalizarin). H OH 2' 3' H H NOESY-Kreuzpeak H 32 Ergebnisse Aus dem gemessenen m/z-Wert 387,10752 für [M+H]+ lässt sich für das ungeladene Molekül die Summenformel C20H18O8 (12 RDB-Äquivalente) ableiten, die sich mit dem Strukturvorschlag 2-O-α-L-Rhamnosylalizarin deckt. Die Substanz ist noch nicht in der CASDatenbank gelistet [105]. 3.1.2 Screening einer Bibliothek von Anthrachinonderivaten Alizarin und Emodin wurden in Kulturen von S. espanaensis rhamnosyliert. Diese Biotransformation mit der Konjugation eines Desoxyzuckers weckte das Interesse einer biokatalytischen Verwendung in der organischen Synthese. Speziell die Glykosylierung mit Desoxyzuckern erfordert mit klassischen Synthesemethoden zahlreiche Schritte bei oft geringen Ausbeuten [106]. Die festgestellte Spezifität für aktivierte Rhamnose als Donor des Glykosyltransfers ermöglicht dabei die gezielte Anwendung von S. espanaensis. Mit einer Bibliothek verschiedener Anthrachinone natürlichen oder synthetischen Ursprungs sollte die Akzeptorflexibilität der Glykosylierungsaktivität gestestet werden. Die eingesetzten Substanzen wurden ursprünglich für die Verwendung als Farbstoffe von Prof. Dr. V. Novikov (National University „Lvivs'ka Politechnika”, Lviv, Ukraine) synthetisiert oder wurden speziell für dieses Experiment erworben (s. 5.2.4, Tab. 29). Die Fütterung von je 5 mg der entsprechenden Substanz an 100 mL Kulturen erfolgte wie auch die Extraktion nach sechstägiger Inkubationszeit gemäß eines standardisierten Protokolls (s. 5.3.1.4). Zur Detektion der Transformationsprodukte wurde der Rohextrakt einer LC/ESI-MS-Analyse unterzogen (Methode: antqui, s. 5.11.6). Die Chromatogramme wurden auf neu auftretende Derivate mit Aglykon ähnlichen UV/VIS-Absorptionsspektren untersucht. Bisherige Ergebnisse zeigten, dass aufgrund von Rhamnosylierungen von Anthrachinonen keine grundsätzlichen Abweichungen vom UV/VIS-Absorptionsspektrum des Aglykons zu erwarten sind (s. 3.1.1). Für entsprechende Peaks des Chromatogramms wurde aus korrespondierenden MS-Signalen ein Massenvorschlag abgeleitet. Parallel wurden mit der "extract ions" Funktion MS-Diagramme für m/z-Werte der Ionen von rhamnosylierten (+146 u) und hydroxylierten (+16 u) Derivaten erstellt. Beim Zusammentreffen von charakteristischen Absorptionsspektren und MS-Signalen bei korrespondierenden Retentionszeiten wurde der entsprechende Peak durch Abgleich mit einer Probe aus der gefütterten Lösung, sowie einer Negativkontrolle (Rohextrakt einer parallel durchgeführten Anthrachinonfütterung) auf Signifikanz überprüft. Peaks, deren Präsenz sich eindeutig auf das gefütterte Aglykon zurückführen ließ, flossen in die Auswertung (s. Tab. 4) ein. 33 Ergebnisse Tab. 4: Biotransformation von Anthrachinonen in Kulturen von S. espanaensis. Die Detektion von Metaboliten in Ethylacetatextrakten der gefütterten Kulturen erfolgte per LC/MS (Methode: antqui, s. 5.11.6). Berücksichtigt wurden nur Metaboliten mit einem UV/VIS-Absorptionsspektrum, ähnlich dem der gefütterten Substanz, oder offensichtliche Transformationsprodukte. Die Produkte wurden in drei Klassen eingeteilt: A: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines hydroxylierten Derivats. B: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines rhamnosylierten Derivats oder eines rhamnosylierten und hydroxylierten Derivats. C: Weitere Transformationsprodukte, liegen Zusatzinformationen vor, sind diese unter der Tabelle gelistet. Im Chromatogramm der angegebenen Wellenlänge (λ) wurde die Gesamt-AUC der Peaks einer Produktklasse bestimmt und als prozentualer Anteil an der Gesamt-AUC des Eduktpeaks und aller Produktpeaks von Substanzen mit ähnlichem Absorptionsspektrum angegeben. -anthrachinon Struktur O unsubstituiert (1) Metabolitendetektion λ A B C 330 nm 0 0 0 430 nm 0 4 Peaks 0 (87 %) O O 1,2-Dihydroxy(Alizarin) (2) OH OH AliPro1 (55 %) O 1,4-Dihydroxy(Chinizarin) (3) 1,5-Dihydroxy(4) 1,8-Dihydroxy(Danthron) (5) O OH O OH O OH O OH O 480 nm 0 1 Peak (5 %) 0 OH 430 nm 0 1 Peak (14 %) 0 OH 430 nm 0 1 Peak (19 %) 0 360 nm 0 7 Peaks 0 (91 %) O 2,6- / 2,7-Dihydroxy(Anthraflavin / Isoanthraflavin) (6) O OH HO O 34 -anthrachinon Ergebnisse Struktur OH 1,8-Dihydroxy3-methyl(Chrysophanol) (7) Metabolitendetektion λ A B O OH C 430 nm 0 3 Peaks 0 (49 %) 430 nm 0 1 Peak (92 %) 430 nm 0 7 Peaks 1 Peak (37 %) (< 1 %) CH3 O OH 1,8-Dihydroxy3-(hydroxymethyl)(Aloe-Emodin) (8) O OH 0 OH O 1,3,8-Trihydroxy6-methyl(Emodin) (9) 1,8-dihydroxy3-methoxy-6-methyl(Physcion) (10) 1,4,5,8-Tetrahydroxy(11) 1,2,5,8-Tetrahydroxy(Quinalizarin) (12) OH OH HO CH3 EmoPro3 (13 %), EmoPro2 (7 %), EmoPro1 (5 %) O OH O OH 400 nm 0 3 Peaks 0 (85 %) s. *10 s. *10 550 nm 0 0 s. *11 480 nm 0 7 Peaks 0 (73 %) NH2 480 nm 0 2 Peaks 0 (1 %) NH2 480 nm 0 4 Peaks 3 Peaks (18 %) (8 %) H3C OMe O OH O OH OH O OH OH O OH OH OH 1-Amino(Smoke Orange G) (13) O 0 s. *11 O O O 1-Amino-4-chlor(14) O Ant14Pro1 O Cl (17 %) 35 Ergebnisse -anthrachinon Struktur Metabolitendetektion λ A B O 1-Amino-2-chlor(15) NH2 C 480 nm 0 1 Peak 0 (< 1 %) 480 nm 0 3 Peaks 0 (93 %) 550 nm 1 Peak (1 %) 4 Peaks 0 (6 %) NH2 480 nm 0 1 Peaks 0 (2 %) NH2 600 nm 0 3 Peaks 0 (4 %) 600 nm 1 Peak (18 %) 1 Peak (2 %) 0 480 nm 0 0 2 Peaks (48 %) 480 nm 0 0 2 Peaks (11 %) Cl O O 1-Amino-4-hydroxy(Duranol) (16) NH2 O 1-Amino-2-phenoxy4-hydroxy(Disperse Red 60) (17) 1,5-Diamino(Smoke Red F) (18) O OH NH2 O O OH O NH2 O O 1-Amino-4-[(2-hydroxyethyl)amino](19) O HN OH 1-Amino-4-[(4-methylphenyl)amino](Fat Soluble Pure Sky Blue) (20) 1-Amino-2-carboxy(21) O NH2 O N H O CH3 NH2 COOH O 1-Amino-4-brom2-carboxy(22) O NH2 COOH O Br 36 -anthrachinon Ergebnisse Struktur O 1-Amino-2-carboxy4-(methylamino) / 1,4-Diamino-2-carboxy(23) OH O R = H, CH3 N R H O OH NO2 O O HN OH O HN O HO H N N H OH O OH O 550 nm 0 0 360 nm 0 600 nm 4 Peaks s. *24 (48 %) Metabolitendetektion λ A B OH OH C 2 Peaks (18 %) NO2 Struktur Mitoxantron (25) Norsolorinsäure (26) NH2 COOH 1,8-Dihydroxy-4,5dinitro(4,5-Dinitrochrysazin) (24) Name Metabolitendetektion λ A B OH C 600 nm 0 0 3 Peaks (18 %) 480 nm 0 4 Peaks 3 Peaks (90 %) (10 %) s. *26 OH Pro1: +2 Rha (50 %) *10: Von Roth bezogenes 10 war mit 7 verunreinigt. Eine weitere Charge des Herstellers zeigte sich ebenfalls als Stoffgemisch. In die Auswertung flossen auch die Transformationsprodukte von 7 ein. *11: Die gefütterte Substanz enthält neben 11 ein laut MS-Signalen um 1 u leichteres Molekül mit ähnlichem UV/VIS-Absorptionsspektrum. Nur dieses Derivat wurde wahrscheinlich rhamnosyliert. *24: Aufgrund einer stark bathochromen Verschiebung des VIS-Absorptionsmaximums ist von einer Reduktion der Nitrogruppen zu Aminogruppen auszugehen, was auch von den gemessenen MS-Signalen bestätigt wird. Angegeben sind die Transformationsprodukte von 1,8-Diaminino-4,5-dihydroxyanthrachion (24rr) (s. Abb. 26). *26: Nur über MS-Signale konnten Spuren von verbliebenem Aglykon detektiert werden. Abb. 24: Biotransformation in Saccharothrix espanaensis: Mit Anthrachinonaglyka gefütterte Kulturen vor dem Schüttelinkubator (links) und eine Farbpalette verschiedener Anthrachinonglykoside nach der Extraktion mit Ethylacetat (rechts). Ergebnisse 37 Das Ausmaß der Konversion wird bei Biotransformationsreaktionen häufig über das Verhältnis der AUC des Produktpeaks zur Summe der AUC von Produkt- und Eduktpeaks bei einer bestimmten Wellenlänge abgeschätzt. Dieses Vorgehen ist nur bedingt zulässig. Relative Aussagen zu Konzentrationsverhältnissen in einem Substanzgemisch auf Basis von AUCs können nur durch die Anwendung von Korrekturfaktoren innerhalb eines validierten Verfahrens gemacht werden. Laut Pharmacopoeia Europaea 4.0 werden auf diese Weise Obergrenzen für Verunreinigungen in Arzneistoffen festgelegt. Die Bestimmung von Korrekturfaktoren ist nur mit Referenzsubstanzen möglich. Das Verhältnis von AUCs ohne Anwendung von Korrekturfaktoren führt nur in Ausnahmefällen zu den tatsächlichen Konzentrationsverhältnissen. Nämlich dann, wenn alle Peak spezifischen Korrekturfaktoren den Wert 1 haben. Vor diesem Hintergrund sind die in Tab. 4, Tab. 5 und Tab. 6 angegebenen AUC-Verhältnisse nur als Anhaltspunkt für die Konzentrationsverhältnisse im Rohextrakt zu verstehen. Die AUCs wurden im Allgemeinen bei einer Wellenlänge im Bereich des langwelligsten Absorptionsmaximums der Ausgangsverbindung bestimmt, das für alle Amino- und Hydroxyanthrachinone im VIS-Bereich liegt. Im Vergleich zu den Absorptionsmaxima der Anthrachinone bei 250 nm - 300 nm verläuft die Kurvenform im VIS-Bereich relativ flach, so dass leicht abweichende Maxima der verschiedenen Derivate nur einen geringeren Einfluss auf die AUC haben. Durch Glykosylierung an Positionen, die am Aufbau des Chromophors mit Absorption im VIS-Bereich beteiligt sind ändern sich jedoch die molaren Extinktionskoeffizienten im VIS-Bereich. Es konnte keine Biotransformation von unsubstituiertem Anthrachinon (1) festgestellt werden. Bei fast allen Hydroxyanthrachinonen lässt die Auswertung der LC/MS-Läufe auf eine Rhamnosylierung schließen. Nur im Rohextrakt von 11 (vier α-Hydroxylgruppen) konnte ein um 146 u (+Rha) schwereres Derivat der gefütterten Verbindung nicht nachgewiesen werden (vgl. Tab. 4, Anmerkung *11). Der Vergleich des AUC-Anteils glykosylierter Derivate von Anthrachinonen mit α-Hydroxylgruppen als einzigen Substituenten (3, 4, 5, 11 mit 0 - 19 %) und von Vertretern mit weiteren aromatischen Hydroxylgruppen (2, 6, 12 mit 73 - 91 %) zeigt die deutliche Präferenz der verantwortlichen Glykosyltransferase(n) für β-Hydroxylgruppen, was auch durch die Rhamnosylierung von Alizarin (2) mit hoher Regioselektivität an 2-O (s. 3.1.1) bestätigt wird. Weitere Substituenten wie Methyl-, Methoxy- und Aminogruppen scheinen zu einer Aktivierung von α-Hydroxylgruppen zu führen wie die deutliche Umsetzung von 7, 8, 9, 10, 16 (37 - 93 %) zeigt. Die drei bekannten Hauptprodukte der Biotransformation von Emodin (9) tragen alle eine α-ständige, O-glykosidisch verknüpfte Rhamnose (s. 3.1.1). Mit Spannung wurde die Biotransformation der Aminoanthrachinone (13 - 23) verfolgt. Während davon auszugehen ist, dass das Bodenbakterium S. espanaensis auch in seinem natürlichen Umfeld mit Hydroxyanthrachinonen in Berührung kommt, scheint dies für die synthetisch gewonnenen Aminoanthrachinone unwahrscheinlich. Erstaunlicherweise erfuhr 38 Ergebnisse jedes der zugesetzten Aminoanthrachinone eine Transformation, die S. espanaensis offensichtlich der hohen Flexibilität seiner für den (Xenobiotika-)Metabolismus zur Verfügung stehenden Enzyme zu verdanken hat. Die Hauptprodukte der Transformation von 13 - 20 zeichnen sich durch einen Massengewinn von 162 u aus, was entweder einer Hydroxylierung und Rhamnosylierung (+16 u+146 u) oder der Konjugation einer Hexopyranose (+162 u) entspricht. Durch die Isolierung und Strukturaufklärung von Ant14Pro1, einem Transformationsprodukt von (14) wurde dieser Frage nachgegangen (s. 3.1.2.1). Die carboxylierten Aminoanthrachinone (21 - 23) erfuhren eine Transformation zu später eluierenden (= im leicht sauren Milieu lipophileren) Derivaten. Der Gedanke an eine Veresterung liegt nahe, MS-Signale konnten den Substanzen vermutlich aufgrund mangelnder Ionisierung nicht zugeordnet werden. Zu einer Überraschung führte die Fütterung von 1,8-Dihydroxy-4,5-dinitroanthrachinon (24). Lösungen von 24 in Wasser (pH 7), Ethylacetat oder DMSO weisen eine gelbe Färbung auf. Der Ethylacetatextrakt der mit 24 gefütterten Kulturen war intensiv violett gefärbt. Die aus MS-Signalen abgeleiteten Massen der violetten Stoffe deuten auf die Reduktion einer Nitrogruppe (Derivat 24r) bzw. beider Nitrogruppen (Derivat 24rr) zu Aminogruppen hin. Diese Derivatisierung würde auch die stark bathochrome Verschiebung des VIS-Absorptionsmaximums erklären. Beim Derivat 24rrPro1 mit der aus MS-Signalen abgeleiteten Masse 416 könnte es sich um ein rhamnosyliertes Derivat von 24rr handeln. Ein entsprechendes Derivat von 24r wurde nicht detektiert. Extrakt nach Biotransformation Gefütterte Lösung 254 nm mAU 1600 24 M: 330 mAU mAU 400 1000 mAU 600 500 800 0 220 0 550 nm mAU 24 400 600 nm 10 20 30 0 220 min. 24r M: 300 240 12 600 nm 24rrPro1 M: 416 120 0 400 0 220 400 600 nm mAU 20 0 200 550 nm mAU 40 0 220 400 200 400 10 24rr M: 270 24r 600 nm 20 30 min. 0 0 10 20 30 min. Abb. 25: Biotransformation von 1,8-Dihydroxy-4,5-dinitroanthrachinon (24). Links: Nachweis von 24r mit einer reduzierten Nitrogruppe in der gefütterten Lösung. Rechts: 24rr mit zwei reduzierten Nitrogruppen sowie das glykosylierte Derivat 24rrPro1 entstehen durch Biotransformation in Kulturen von S. espanaensis (LC/MSMethode: antqui, s. 5.11.6). 39 Ergebnisse Gefütterte Lösung OH O OH O OH Biotransformationsprodukte OH HO OH O OH NH2 O NH2 + NO2 O 24 NO2 NO2 O 24r NH2 24rr OH HO O OH O O NH2 O NH2 24rrPro1 Abb. 26: Hypothetischer Weg der Biotransformation von (24) in Kulturen von S. espanaensis. Das Chromatogramm der gefütterten Lösung bei 550 nm (s. Abb. 25) zeigt, dass schon die gefütterte Lösung mit Spuren von 24r verunreinigt war. Es schien somit fraglich, ob die Nitroreduktion tatsächlich eine Biotransformation ist oder ohne enzymatische Katalyse abläuft. In sterilem Kulturmedium konnte unter identischen Bedingungen kein 24rr nachgewiesen werden. Folglich handelt es sich bei der Umsetzung von 24 in Kulturen von S. espanaensis um eine zweistufige Biotransformation: Nitroreduktion und Glykosylierung (s. Abb. 26). Die Reduktion aromatischer Nitrogruppen ist eine seltene und wertvolle Biotransformationsleistung von Bodenbakterien, die ihre gezielte Anwendung in der Altlastenentsorgung auf Industriegeländen ehemaliger Sprengstofffabriken findet (Metabolisierung von Trinitrotuluol (TNT)) [107]. Das klinisch gegen Multiple Sklerose [108] oder als Zytostatikum [109] eingesetzte Aminoanthrachinon Mitoxantron (25) liegt bei physiologischem pH-Wert vorwiegend in protonierter Form vor. Ein passives Eindringen in die Zellen durch Membrandiffusion, wie bei den anderen gefütterten Anthrachinonen, kann für 25 deshalb nicht erwartet werden. Die Extraktionsbedingungen wurden speziell auf 25 angepasst. Da die Wasserlöslichkeit laut Berechnungen mit der Software von Advanced Chemistry Development (über SciFinder Scholar, s. 5.14) bei pH 8 - 9 am geringsten ist, wurde der pH-Wert vor der Extraktion entsprechend eingestellt. Beim Standardextraktionsverfahren werden Myzel und Kulturüberstand getrennt voneinander mit Ethylacetat extrahiert (s. 5.11.1.1). Bei anderen Anthrachinonen signalisiert eine deutliche Färbung des Myzelextrakts die erfolgreiche Extraktion des Anthrachinonderivats aus den Zellen. Der Myzelextrakt der mit 25 gefütterten Kultur blieb jedoch weitgehend farblos. Im Gegensatz dazu war die erfolgreiche Extraktion von 25 aus dem Kulturüberstand durch die intensiv türkis gefärbte Ethylacetatphase gut nachvollziehbar. Rhamnokonjugate konnten per LC/MS-Analyse nicht nachgewiesen werden. Korrespondierende MS-Signale von neu entstandenen Peaks mit dem charakteristischen Absorptionsmaximum von 25 bei ca. 600 nm ließen auf die Bildung oxidierter Formen schließen, wie sie auch als Produkte des menschlichen Mitoxantronmetabolismus bekannt sind [109]. 40 Ergebnisse Außer nur geringer Permeation von 25 in die Zellen könnten auch sterische Effekte der Seitenketten den Kontakt mit der Rhamnosyltransferase verhindern. Beide Faktoren sollten weiter untersucht werden: die sterische Behinderung durch Fütterung der ebenfalls Seitenketten tragenden Norsolorinsäure 26, die eigens für dieses Experiment aus dem Pilz Aspergillus nidulans TTRM1 gewonnen wurde (s. 3.1.3). Die geringe Membranpermeation sollte durch den Einsatz aufgeschlossener Zellen umgangen werden (s. 3.1.7). 3.1.2.1 Biotransformation von 1-Amino-4-chloranthrachinon Besonderes Interesse galt den Transformationsprodukten nicht hydroxylierter Aminoanthrachinone, deren Moleküle im Vergleich zum Aglykon 162 u und deutlich an Hydrophilie gewonnen hatten. Nur durch N-Rhamnosylierung (+146 u) lässt sich der Massengewinn nicht erklären. Sollte es sich um N-Glykoside handeln, könnte alternativ eine Hexopyranose verknüpft sein. Falls es sich um O-Glykoside handelt, müsste der Glykosylierung mit einem Monodesoxyzucker eine Hydroxylierung des Aglykons vorausgehen. Die Isolierung und Strukturaufklärung des Hauptmetaboliten von 14 sollte Klarheit bringen. Isolierung von Ant14Pro1 Zur Gewinnung von Ant14Pro1 wurden S. espanaensis-Kulturen in NL111-Medium mit einem Gesamtvolumen von 2 L angesetzt. Die Kultivierung, Zufütterung von insgesamt 100 mg 1-Amino-4-chloranthrachinon (14) sowie die Extraktion mit Ethylacetat folgte standardisierten Protokollen (s. 5.3.1.4, 5.11.1.1). Über wiederholte Flash-Chromatographie (s. 5.11.3) mit Methanol-Wasser-Gradienten und LiChroprep RP 18 als stationärer Phase bzw. Gelfiltrationen über Sephadex LH-20 und Methanol als Fließmittel sowie anschließender Kristallisation aus Methanol / H2O wurden 4,0 mg Ant14Pro1 als rote Nadeln erhalten. Für die NMR-Analyse wurden die Kristalle in DMSO-d6 gelöst. Struktur von Ant14Pro1 Das UV/VIS-Absorptionsspektrum von Ant14Pro1 (s. Abb. 27) zeigt wie auch das Spektrum der Ausgangsverbindung ein Maximum bei 476 nm. Die entsprechende Absorptionsbande ist auf ein chromophores System mit maßgeblicher Beteiligung der α-ständigen Aminogruppe zurückzuführen [97]. Die exakte Beibehaltung von λmax = 476 nm im Spektrum des Transformationsprodukts Ant14Pro1 spricht gegen die in Erwägung gezogene N-Glykosylierung. Die korrespondierenden Massenspektren zeigen das typische Isotopenmuster von Ionen mit einem Chloratom und deuten auf eine Molekülmasse von 419 hin (s. Abb. 27). 41 Ergebnisse mAU 400 252 nm int. + [M+H] 420 80 285 nm 200 314 nm 40 476 nm 0 0 250 500 nm + [M-146+H] 274 300 [M+Cl] 454 [M-146-H] 272 int. + [M+K] 458 + [M+K+CH3CN] 499 400 80 40 [M+Na+2K-4H] 516 0 260 400 450 m/z [M+2Na+CH3CN-3H] 503 m/z Abb. 27: Daten aus der LC/ESI-MS-Analyse von Ant14Pro1 (Methode: antqui, s. 5.11.6). Im 1H-NMR-Spektrum von Ant14Pro1 finden sich nur fünf der sechs Signale aromatischer Protonen des parallel analysierten 14 wieder. Die Interpretation der 13C-, HMBC- und HSQCSpektren ergibt, dass bei sonst unveränderter Struktur des Anthrachinons eine zusätzliche Substitution an C-2 oder C-3 stattgefunden hat. Weiterhin treten Signale einer Zuckereinheit auf. Über die chemische Verschiebung des 13C-Signals des anomeren Kohlenstoffkerns (C-1') kann die Natur der Verknüpfung eindeutig als O-glykosidisch bestimmt werden. Das Signal erscheint bei δC = 99,1 ppm und entspricht damit den Literaturwerten bei O-glykosidischer Verknüpfung [103]. Das Signal des anomeren Kohlenstoffkerns liegt für N-Glykoside bei ca. 85 ppm [110], für C-Glykoside bei ca. 75 ppm. Über Kopplungskonstanten und NOEs gelingt die Identifizierung der Zuckereinheit. Wie bei den zuvor isolierten Biotransformationsprodukten von S. espanaensis deuten die Daten darauf hin, dass es sich bei Ant14Pro1 um ein α-L-Rhamnosid handelt. Über die NMR-Daten sollte die Glykosylierungsposition bestimmt werden: Position 2 (Möglichkeit A) oder Position 3 (Möglichkeit B). Hilfreich für die Zuordnung könnte die HMBC-Korrelation des am substituierten, aromatischen Ring verbleibenden Protons mit einem der beiden Carbonyl-13C-Signale sein (s. Abb. 28, fett). Es war jedoch nicht möglich, die Signale von C-9 und C-10 differenziert zuzuordnen. Die weiteren Korrelationen leiten sich von der Festlegung der fett markierten Korrelation. Entsprechende Korrelationen sind jedoch auch für Möglichkeit B (Glykosylierungsposition C-3, Festlegung der fett markierten Korrelation auf C-9) zu erwarten. Zucker 1'-H RO NH2 O H 1 9 8 2 Möglichkeit A 3 H 4 Cl 12 13 11 14 10 5 O H H 7 HMBC-Korrelationen mit 5-H / 6-H / 7-H / 8-H 6 H Abb. 28: HMBC-Korrelationen des Aglykons von Ant14Pro1, falls es sich um eine Rhamnosylierung an C-2 handelt (Möglichkeit A). 42 Ergebnisse Mit bedingter Genauigkeit lassen sich chemische Verschiebungen über Inkrementsysteme berechnen und aus den Spektren ähnlicher Moleküle ableiten. Gute Vorhersagen lassen sich für 13C-Verschiebungen aufstellen, da diese weniger als 1H-Verschiebungen vom verwendeten Lösungsmittel oder vorhandenen Verunreinigungen abhängen. Mit den Programmen ChemNMR aus dem ChemOffice-Paket und NMR-Predict von Mestrelab (s. 5.14) wurden unabhängig voneinander Spektren für die Möglichkeiten A und B berechnet (s. Abb. 29). Das Programm ChemNMR greift für die Vorhersage des 13C-Spektrums auf ca. 4000 Parameter zu. Das Programm NMR-Predict bedient sich einer fortlaufend aktualisierten OnlineSpektrendatenbank und verwendet bei mangelnder Verfügbarkeit korrespondierender Daten Inkrementsysteme. Durch den Abgleich der berechneten mit den gemessenen Werten sollte ein Hinweis auf die Glykosylierungsposition gewonnen werden. Im 13C-Spektrum von 14 erscheint das Signal von C-1 bei δC = 151,5 ppm. Durch eine O-Glykosylierung an C-2 (Möglichkeit A) ist durch den resultierenden +M-Effekt eine Erhöhung der negativen Ladungsdichte an C-1 und damit eine Verschiebung des C-1-Signals zu höherem Feld zu erwarten, während die Verschiebung bei Möglichkeit B weitgehend unverändert bliebe. Der für das C-1-Signal ermittelte Wert von δC = 142,8 ppm spricht für eine Substitution an C-2. Die für Möglichkeit A nur um 0,1 ppm bzw. 0,6 ppm vom gemessenen Wert (δC = 119,5 ppm) abweichenden Berechnungen für die chemische Verschiebung des C-3-Signals bestärken die Annahme einer O-Glykosylierung an C-2. Für Möglichkeit B wären für das Signal von C-2 Werte bei δC = 105 ppm zu erwarten, da bei äquivalentem +M-Effekt des Zuckersubstituenten der -I-Effekt der Aminogruppe geringer als der des Chlorsubstituenten ausfällt. Die Auswertung der Spektrenberechnung lässt eine klare Tendenz zu Möglichkeit A erkennen. Für die differenzierte Zuordnung der beiden Carbonyl-13C-Signale liefert die Vorhersage von NMR-Predict einen Hinweis darauf, dass C-9 mit stärkerer Tieffeldverschiebung als C-10 erscheint. Mit SciFinder Scholar (s. 5.14) wurden 13C-Referenzdaten von 14 in DMSO-d6 gefunden. Die Autoren geben δC-9 mit 183,1 ppm, δC-10 mit 181,7 ppm an [111]. Wird diese Zuordnung auf Ant14Pro1 übertragen, lässt sich über HMBC-Korrelationen C-2 als Glykosylierungsposition (Möglichkeit A) bestimmen. Durch Zusammenfassung aller Ergebnisse der NMR-Interpretation wird davon ausgegangen, das AntPro1 als 1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon beschrieben werden kann. Der Strukturvorschlag entspricht der von der exakten Masse m/z = 420.08446 [M+H]+ für das ungeladene Molekül abgeleiteten Summenformel C20H19O7NCl. Die Substanz ist noch nicht in der CAS-Datenbank gelistet [105]. 43 Ergebnisse ChemOffice ChemNMR 130.0 O H2N A 137.9 114.6 149.0 16.9 H3C HO 77.7 70.5 119.4 101.5 O 73.1 73.4 HO 149.6 O 105.6 104.3 130.0 155.6 182.1 O O 125.3 H H 132.2 133.6 121.7 O 6.20 133.6 182.1 NH2 132.2 16.9 H3C HO Cl 6.82 77.7 OH 70.5 101.0 O 73.1 130.7 110.8 Cl 133.6 182.1 182.1 133.6 130.0 132.2 132.2 130.0 O B 73.4 HO OH Mestrelab NMR-Predict 126.8 O H2N A 139.8 143.7 118.3 127.4 O 17.7 H3C HO 72.6 72.5 103.3 72.1 O 118.9 H 71.9 HO 126.2 NH2 6.92 128.8 188.4 134.4 H 134.4 128.8 160.3 O O 17.7 H3C HO 7.65 111.7 106.5 126.8 181.8 Cl 149.6 O 72.6 OH 72.5 72.1 103.3 O 134.4 126.2 Cl 128.8 187.0 183.1 128.8 126.8 134.4 134.4 126.8 O B 71.9 HO OH Abb. 29: NMR-Vorhersagen von 13C-Verschiebungen und 1H-Verschiebungen (eingerahmt) der beiden Strukturvorschläge für Ant14Pro1 (Angaben in ppm). Die für jede Position am besten mit den gemessenen Verschiebungen übereinstimmenden Werte sind rot markiert. 70.1 17.8 1.14 4.96 H3.41 H3.86 H3C O OR 99.1 H 5.65 H4.01 HO 71.7 3.3 H HO 4.70 70.0 69.4 OH 5.21 NH2 142.8 RO 147.8 119.5 7.30 H 112.2 2 1 O 183.5 H8.18 125.9 9 H7.86 133.3/133.5/ 133.6/133.7 10 126.3 Cl 121.9/ 122.2 O 180.8 H7.86 H 8.11 Abb. 30: Zuordnung der NMR-Signale (chemische Verschiebung in ppm) zur Struktur von Ant14Pro1 (1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon, Mr: 419,81, Mberechnet: 419,08) 44 Ergebnisse Zweistufige Biotransformation von 1-Amino-4-chloranthrachinon Die O-Rhamnosylierung von 14 impliziert eine vorausgehende Hydroxylierung. Weder nach steriler Inkubation von 14 mit Nährmedium als Negativkontrolle noch im Kulturextrakt des mit 14 gefütterten S. espanaensis konnte ein hydroxyliertes Derivat von 14 nachgewiesen werden. Die Hydroxylierung stellt sich folglich als limitierender Schritt der zweistufigen Biotransformation dar. NH2 O NH2 O I. O HO H2N II. III. O Cl O Cl O H3C HO O O HO Cl OH Saccharothrix espanaensis NH2 O Cl O 1-Amino-4-chloranthrachinon (Ant14) O H2N I. Funktionalisierung II. Konjugation III. Export O H3C HO O O HO Cl OH 2-O-α-L-Rhamnosyl-Ant14 Abb. 31: Metabolismus von 1-Amino-4-chloranthrachinon in Saccharothrix espanaensis. Die Umsetzung von 14 zeigt Parallelen zum menschlichen Xenobiotikametabolismus, der sich in drei Phasen gliedert (s. Abb. 31). Phase I-Reaktionen funktionalisieren das Zielmolekül durch Einführung polarer oder reaktiver Substituenten wie Hydroxyl- oder Sulfatgruppen. In Phase II wird das funktionalisierte Molekül mit einem Konjugationspartner verknüpft (zum Beispiel Glucuronsäure) um anschließend aktiv aus der metabolisierenden Zelle exportiert zu werden (1.5.3). Die LC/MS-Analyse des Kulturextrakts nach 14-Fütterung lässt auf die parallele Bildung eines Isomers von Ant14Pro1 mit alternativer Glykosylierungsposition schließen. Die geringere Konzentration des Isomers (5 % der Gesamt-AUC480nm aller 14-Derivate) im Vergleich zu Ant14Pro1 (17 % der Gesamt-AUC480nm aller 14-Derivate) deutet auf eine bevorzugte Hydroxylierung von C-2 hin. Im Einklang damit steht die Beobachtung, dass von 15, einem 2-Chlor-Regioisomer von 14, nur Spuren hydroxyliert und glykosyliert werden (s. Tab. 4) 45 Ergebnisse 3.1.3 Gewinnung und Biotransformation von Norsolorinsäure Als Ursache der fehlenden Rhamnosylierungsaktivität von S. espanaensis auf den Arzneistoff Mitoxantron (25) kommt eine sterische Behinderung des Enzymkontakts durch die Seitenketten in Betracht. Am Beispiel der Norsolorinsäure (26) sollte der Einfluss sterisch anspruchsvoller Seitenketten auf den Rhamnosyltransfer untersucht werden. Norsolorinsäure ist ein stabiles Zwischenprodukt der Aflatoxin- / Sterigmatocystinbiosynthese im Pilz Aspergillus nidulans [112]. Erst vor kurzem konnte für 26 eine zytostatische Wirkung auf MCF 7-Brustkrebszellen nachgewiesen werden [113]. Produktion von Norsolorinsäure durch Aspergillus nidulans TTRM1 Aspergillus nidulans TTRM1 ist eine Biotin auxotrophe Mutante mit Blockade der Aflatoxin- / Sterigmatocystinbiosynthese auf Stufe von 26. Der Stamm wurde im Labor von Prof. Dr. N. Keller (University of Wisconsin, Madison, USA) gewonnen und mir von Prof. Dr. D. Hoffmeister (University of Minnesota, St. Paul, USA) überstellt. mAU (480 nm) 26 int. [%] 80 + [M+H] 371 26 235 nm mAU 283 nm 309 nm 120 40 40 int. [%] 80 20 250 500 m/z 80 - [M-H] 369 40 250 364 nm 40 500 m/z 26 (28,1 min) 0 300 400 463 nm 500 nm 0 0 10 20 30 min Abb. 32: LC/CI-MS-Analyse des Kulturextrakts von Aspergillus nidulans TTRM1 (Methode: antqui, s. 5.11.6). Norsolorinsäure (26): Mr: 370,35. Aus Kulturen von A. nidulans TTRM1 sollten mindestens 5 mg 26 zur Fütterung an S. espanaensis gewonnen werden. Die Produktion von 26 lässt sich gut über die Lilafärbung des Kulturmediums nachvollziehen. Die lila Farbe ist auf deprotonierte Norsolorinsäure zurückzuführen. Nach Abschluss der siebentägigen Inkubationszeit hatte der Kulturüberstand einen pH-Wert von 8,7. Mit der Einstellung auf pH 7,5 zur Extraktion mit Ethylacetat schwenkte die Farbe auf rotbraun über. Der Peak von 26 dominiert das Chromatogramm des Rohextrakts bei 480 nm (s. Abb. 32) und 254 nm (nicht gezeigt). Durch Gelelution aus Sephadex LH-20 mit Methanol als Fließmittel wurden aus 1 L Kulturvolumen 28,4 mg 26 als orange-rotes Pulver gewonnen. 46 Ergebnisse Biotransformation von Norsolorinsäure Mit den auch unter 3.1.2 verwendeten Bedingungen wurde 26 auf Biotransformation in S. espanaensis überprüft. Sieben neu auftretende Peaks konnten über ihr charakteristisches UV/VIS-Absorptionsspektrum als Derivate von 26 identifiziert werden (s. Abb. 33). Die korrespondierenden MS-Signale sprechen dabei für Rhamnosylierungen (+146 u) und Hydroxylierungen (+16 u) von Norsolorinsäure. Vom Aglykon lassen sich nur noch Spuren über die MS-Signale nachweisen. Die Umsetzung von Norsolorinsäure zeigt, dass grundsätzlich auch Anthrachinonderivate mit längeren Seitenketten von S. espanaensis glykosyliert werden können. M: 370+2x146 mAU (480 nm) M: 370+16+146 - m/z = 661: [M-H] - m/z = 531: [M-H] - m/z = 515: [M-146-H] - - m/z = 369: [M-2x146-H] 40 m/z = 421: [M-146+Cl] - m/z = 385: [M-146-H] - m/z = 515: [M-H] M: 370+2x146 - m/z = 369: [M-146-H] - m/z = 661: [M-H] 20 M: 370+146 - m/z = 515: [M-146-H] - m/z = 369: [M-2x146-H] 26 (M: 370) * * 0 0 10 20 30 min Abb. 33: Detektion der Biotransformationsprodukte von 26 mittels LC/CI-MS-Analytik (Methode: antqui, s. 5.11.6). Für einige Derivate mit 26 ähnlichem UV/VIS-Absorptionsspektrum konnte aus m/z-Werten ein Massenvorschlag abgeleitet werden. Bei 12,6 min und 12,7 min überlagern sich zwei Peaks. * Derivate ohne Massenvorschlag aber 26 ähnlichem UV/VIS-Absorptionsspektrum. 47 Ergebnisse 3.1.4 Biotransformation von Flavonoiden Mit den bisherigen Versuchen wurde das Potential des Bodenbakteriums Saccharothrix espanaensis zur Glykosylierung, teilweise auch Hydroxylierung, zahlreicher Anthrachinonderivate aufgedeckt. Anthrachinone treten im natürlichen Lebensraum von S. espanaensis als Sekundärstoffe von Pflanzen, Pilzen oder Mikroorganismen auf. Die beobachtete Funktionalisierung und Konjugation stammfremder Moleküle ist eine typische Reaktionsfolge des Xenobiotikametabolismus (vgl. Abb. 31) und kann als Anpassung von S. espanaensis an sein chemisches Umfeld interpretiert werden. Flavonoide, eine weitere, pharmazeutisch interessante Naturstoffklasse, erreichen den natürlichen Lebensraum von Bodenbakterien wie auch die Anthrachinone vor allem aus dem Pflanzenreich. Anhand der zwei Beispielsubstanzen Quercetin (27) und Catechin (28) sollte der Flavonoidmetabolismus in S. espanaensis untersucht werden. Die Fütterungsexperimente und deren Auswertung folgten der auch unter 3.1.2 eingesetzten Methodik. Tab. 5: Biotransformation von Flavonoiden in Kulturen von S. espanaensis. Auswertung: s. Tab. 4. A: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines hydroxylierten Derivats. B: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines rhamnosylierten Derivats oder eines rhamnosylierten und hydroxylierten Derivats. C: Weitere Transformationsprodukte. Name 3,3',4',5,7-Pentahydroxyflavon (Quercetin) (27) (+)-(2R:3S)-5,7,3',4'Tetrahydroxyflavan-3-ol (Catechin) (28) Struktur OH O HO Metabolitendetektion λ A B C 360 nm 0 0 OH QuercPro1 (100 %) OH OH O OH O HO 1 (100 %) 254 nm 0 0 0 OH OH OH Das Ergebnis der Flavonoidfütterungen könnte unterschiedlicher nicht ausfallen. Vom stark hydrophilen 28 wurden keine Biotransformationsprodukte detektiert. 28 wurde unverändert aus dem Kulturextrakt zurückgewonnen. Der Peak von 27 ist im Chromatogramm des Kulturextraktes nicht mehr vorhanden, der Nachweis verbliebener Spuren von 27 gelingt erst über die Auswertung der MS-Diagramme. Nur ein Metabolit (QuercPro1) mit Aglykon ähnlichem UV/VIS-Absorptionsspektrum tritt im Chromatogramm auf. Über MS-Signale lässt sich QuercPro1 die Molekülmasse 448 zuordnen. Sie entspricht der Masse von Rhamnosyl-27. 48 Ergebnisse 3.1.4.1 Biokatalytische Darstellung von Quercitrin Die LC/MS-Auswertung der Biotransformation von Quercetin (27) zu QuercPro1 legt nahe, dass in den Zellen von S. espanaensis die vollständige Umsetzung von 27 zu genau einem Produkt erfolgte. Derart spezifische Reaktionen in Verbindung mit hohen Umsätzen (Stoffmenge pro Kulturvolumen) sind ein heiß begehrtes Werkzeug der organischen Chemie. Zunächst galt es aber zu prüfen, ob der Metabolit QuercPro1 tatsächlich das Hauptprodukt der Biotransformation darstellt oder ob vorwiegend ein Abbau von 27 zu Produkten stattfindet, die bei der LC/MS-Auswertung nicht auffallen. Mit einer deutlich höheren Konzentration der Ausgangssubstanz als zuvor üblich sollte S. espanaensis gleichzeitig seine Leistungsfähigkeit unter Beweis stellen. Isolierung von QuercPro1 Mit 250 mg Quercetin×2H2O (in 1 mL DMSO) pro Liter Mediumvolumen wurde S. espanaensis für sieben Tage unter Standardbedingungen (s. 5.3.1.4) inkubiert. Um trotz der hohen Wasserlöslichkeit des putativen Rhamnosids QuercPro1 optimale Ausbeuten zu erzielen, wurde das Extraktionsprotokoll an Methoden der Phytochemie [114] angeglichen. 1333 mL Kultur (mit 333,3 mg bzw. 0,9853 mMol zugefüttertem Quercetin×2H2O, Mr: 338,27) wurden gefriergetrocknet (s. 5.11.10) und zweimal mit 500 mL Methanol extrahiert. Über Flash-Chromatographie mit einem Methanol-Wasser-Gradienten (50 % 80 % Methanol) an LiChroprep RP 18 und anschließende Gelfiltrationen über Sephadex LH-20 und Methanol als Fließmittel (s. 5.11.3) gelang die Isolierung von 159,6 mg QuercPro1 als gelbes Pulver in einer Reinheit von > 98 % (HPLC, 254 nm). 30 mg davon wurden zur NMR-Analyse in DMSO-d6 gelöst. Mit der relativen Molekülmasse Mr: 448,38 von QuercPro1 (= Quercitrin, s. nächstes Kapitel) errechnet sich bei einer Reinheit von 98 % eine Ausbeute von 35 %. Aufgrund der hohen Ausbeute ist davon auszugehen, dass mit QuercPro1 das Transformationshauptprodukt von Quercetin isoliert wurde. Verluste können durch Degradation oder während der Aufreinigung entstanden sein. Die Kapazität der Biotransformation von 27 in S. espanaensis wurde mit 250 mg Edukt / Liter Kultur noch nicht ausgereizt, da kein verlangsamtes Wachstum des Stammes festgestellt wurde. Für die industrielle Biokatalyse werden Konzentrationen im Grammbereich angestrebt. Speziell für die Herstellung von QuercPro1 (= Quercitrin) erscheint dieses Ziel nicht unrealistisch. 49 Ergebnisse Struktur von QuercPro1 Der hohen Substanzkonzentration, dem Verzicht auf Rekristallisation aus Methanol / Wasser und einer effektiven Gefriertrocknung ist es zu verdanken, dass das sonst dominierende Protonensignal von H2O nur als kleine Zacke im Pseudotriplett von 4''-H der Zuckereinheit auftritt. Die Abwesenheit aller Hydroxylgruppensignale außer des von über 4-O koordinierten 5-OH gestaltet das 1H-Spektrum von QuercPro1 übersichtlich. Über die HMBC-Korrelation von C-3 und 1''-H kann die Verknüpfungsposition der Rhamnose zugeordnet werden. Als Charakteristikum der Glykosylierung an C-3 erscheint das 13C-Signal von C-2 bei deutlich tieferem Feld (δC-2 = 156,9 ppm) als das entsprechende Signal von Quercetin (δC-2 = 146,7 ppm). Alle anderen δC-Differenzen liegen < 2 ppm. Durch die Interpretation der aufgenommenen Spektren (1H, 13C, COSY, HSQC, HMBC, 2D-ROESY, verschiedene 1D-ROESY) konnte das Produkt als 3-O-α-L-Rhamnosylquercetin (= Quercitrin) identifiziert werden. Quercitrin ist ein verbreiteter, pflanzlicher Naturstoff, der auch in Extrakten der Arzneipflanze Hypericum perforatum enthalten ist [115]. NMR-Vergleichspektren von kommerziell erhältlichem Quercitrin (Roth) zeigten identische Verschiebungen und Multiplizitäten. Die NMR-Daten waren in Einklang mit Werten aus der Literatur [116] und der Spectral Database for Organic Compounds (s. 5.14). OH 3' H H HO 8 O 7 9 H 4 5 OH QuercPro1 (= Quercitrin) 1 1' 5' 2 H 3 O 1'' O 2'' H HMBC-Korrelation O OH H 5'' 4''-H 2''-H H H H-NMR-Spektrum H 6' 10 6 OH 4' 2' 3''-H 5''-H 3'' OH OH CH3 6'' 4'' 4.0 H Mr: 448,38 2'-H 3.8 ppm 3.6 3.4 6'-H 8-H 5'-H 6-H 3.2 DMSO 5''-CH3 1''-H 5-OH 13 12 11 10 9 8 7 ppm 6 5 4 Abb. 34: Strukturaufklärung der Substanz QuercPro1 mittels NMR-Spektroskopie. 3 2 1 0 50 Ergebnisse Aus der exakten Masse des Ions [M+H]+: m/z = 449,10665 lässt sich für QuercPro1 die mit der NMR-Interpretation konforme Summenformel C21H20O11 (12 RDB-Äquivalente) ableiten. Die absolute Konfiguration der Zuckereinheit der durch Biotransformation in S. espanaensis entstandenen Glykoside konnte bisher nur indirekt über die Klyne-Regel vorhergesagt werden (s. 3.1.1.1 NMR-Interpretation von EmoPro3). Es kann nicht ausgeschlossen werden, dass es sich um α-D-Rhamnoside handelt. Der Vergleich von QuerPro1 und dem kommerziell erhältlichem α-L-Rhamnosid Quercitrin sollte eine Aussage zur absoluten Konfiguration der von S. espanaensis mit Quercetin verknüpften Rhamnopyranose zulassen. In der Struktur von 3-O-α-Rhamnosylquercetin sind außerhalb der Zuckereinheit keine chiralen Kohlenstoffatome lokalisiert. Das heißt, die beiden möglichen Strukturen 3-O-α-D-Rhamnosylquercetin und 3-O-α-L-Rhamnosylquercetin sind Enantiomere, die sich mit Ausnahme der chiroptischen Eigenschaften nicht in ihren physikalischen Eigenschaften unterscheiden. Die Abgrenzung von Enantiomeren ist mit dem Circulardichroismus (CD) möglich (s. 5.11.9). Rechtsdrehende und linksdrehende Form lassen einen spiegelbildlichen Kurvenverlauf erwarten. —— QuercPro1 - - - - Quercitrin der Firma Roth Abb. 35: Molarer Circulardichroismus von QuercPro1 und einer authentischen Probe Quercitrin (Firma Roth). Beide Substanzen wurden als 0,26 mM Lösungen in Methanol vermessen. Maxima / Minima (Mol. CD): QuercPro1: 1: 229 nm (−2,08), 2: 252 nm (2,27), 3: 268 nm (0,71), 4: 300 nm (−0,84), 5: 343 nm (−2,37). Quercitrin: 1: 229 nm (−2,68), 2: 253 nm (2,15), 3: 268 nm (0,41), 4: 300 nm (−1,00) 5: 346 nm (−2,64). Der Kurvenverlauf des CD von QuercPro1 deckt sich mit dem der Vergleichssubstanz Quercitrin. Es handelt sich um das gleiche Enantiomer. Die mit der Klyne-Regel vorgeschlagene absolute Konfiguration kann bestätigt werden. Bei QuercPro1 handelt es sich um 3-O-α-L-Rhamnosylquercetin. 51 Ergebnisse 3.1.5 Evaluierung des Substratspektrums der Rhamnosylierungsaktivität Das Ziel der folgenden Experimente war, mit der Rhamnosylierung durch Saccharothrix espanaensis weitere Strukturklassen zu erschließen. Besonderes Interesse galt dabei klinisch eingesetzten Arzneistoffen und Naturstoffen, deren Struktur Ähnlichkeit mit den erfolgreich glykosylierten Anthrachinonen und Flavonoiden hat. Durch die Glykokonjugatbildung kann die Pharmakokinetik und Pharmakodynamik der eingesetzten Arzneistoffe modifiziert werden (s. 1.3.1). Es wurden grundsätzlich nur Stoffe ausgewählt, die mindestens einen aromatischen Ring besitzen, vorzugsweise ein System aus annelierten Ringen aufweisen und eine phenolische Hydroxylgruppe haben. Tab. 6: Biotransformation unterschiedlicher Moleküle in Kulturen von S. espanaensis. Auswertung: s. Tab. 4. A: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines hydroxylierten Derivats. B: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines rhamnosylierten Derivats oder eines rhamnosylierten und hydroxylierten Derivats. C: Weitere Transformationsprodukte, liegen Zusatzinformationen vor, sind diese unter der Tabelle gelistet. Name Struktur 9,10-Dihydro9-oxoacridin (Acridon) (29) O 9H-Fluoren-9-on (Fluorenon) (30) O C 400 nm 1 Peak (< 1 %) 1 Peak (< 1 %) 0 254 nm 1 Peak (66 %) 1 Peak (2 %) 0 254 nm / 400 nm - - s. *31 254 nm 0 0 0 s. *32 254 nm 0 0 0 N H 1,8-Dihydroxyanthrone (Dithranol) (31) Morphin (32) Metabolitendetektion λ A B OH O OH OH OH OH HO O N CH3 HO Phenytoin (33) H N HO N O 52 Name Ergebnisse Struktur Novobiocinsäure (34) Metabolitendetektion λ A B OH HO O OH H N O 330 nm 3 Peaks (64 %) 4 Peaks (19 %) NovPro1 (37 %) NovPro3 (20 %) NovPro5 (13 %) 254 nm - - s. *35 300 nm 0 0 0 360 nm 0 0 0 s. *37 360 nm - - s. *38 254 nm - - s. *39 300 nm 0 9 Peaks (76 %) 2 Peaks (4 %) O CH3 O Phenprocoumon (35) O C Cyclo-34 (1 %) s. *34 OH O Chromon (36) O O Lawson (37) OH O O Juglon (38) OH O O Menadion (Vitamin K3) (39) CH3 O trans-Resveratrol (40) OH HO OH *31: Spontane Oxidation zu 5 mit Luft-O2, h·ν. *32: Kultur mit Alufolie umwickelt, lyophilisiert, mit MeOH extrahiert, zusätzlich DC. *34: Gefütterte 34 war mit geringen Mengen (< 1 %) Cyclonovobiocinsäure und Novobiocin verunreinigt. *35: Nur Spuren von 35 wurden im Ethylacetatextrakt detektiert. In der Wasserphase konnte kein 35 nachgewiesen werden. *37: Das gewählte Extraktionsverfahren des auf pH 7 eingestellten Kulturüberstands mit Ethylacetat erwies sich als ungeeignet. Nur im Myzelextrakt (Ethylacetat) waren Spuren von 37 nachweisbar. Nach wiederholtem Fütterungsexperiment wurde die Kultur lyophilisiert und mit Methanol extrahiert. 37 konnte nachgewiesen werden, Derivate wurden nicht detektiert. 53 Ergebnisse *38: 38 ist in wässriger Lösung instabil. Weder 38 noch hydroxylierte oder rhamnosylierte Derivate konnten in den Kulturextrakten detektiert werden. *39: In Kulturen von S. espanaensis wird 39 in mehrere hydrophile Derivate unbekannter Molekülmasse transformiert. Es handelt sich jedoch nicht oder nicht ausschließlich um eine Biotransformation, da die Derivate auch bei der sterilen Inkubation von 39 mit Nährmedium auftreten. Acridon (29) ist chemisch stabil [117]. Derivate, deren MS-Signale und UV/VISAbsorptionsspektren auf hydroxylierte und rhamnosylierte Derivate hindeuten, lassen sich nur in äußerst geringer Konzentration nachweisen. Fluorenon (30) ist ein chemisch stabiles [117] Oxidationsprodukt des Umweltgiftes Fluoren. Als ein Zwischenprodukt des Metabolismus von Fluoren entsteht 30 in Arthrobacter sp. strain F101. Endpunkt der Umsetzung ist 4-Hydroxyfluorenon [118]. In Analogie zu diesen Ergebnissen lässt sich nach der Transformation in S. espanaensis ein mit einem Sauerstoffatom funktionalisiertes Derivat von 30 als dominanter Metabolit per LC/MS-Analyse detektieren. Morphin (32) wird im Rahmen des menschlichen Arzneistoffmetabolismus glucuronidiert [119]; Phenytoin (33) hydroxyliert und glucuronidiert [120]. In S. espanaensis hingegen konnte keine Biotransformation der beiden Substanzen festgestellt werden. Novobiocinsäure (34), das Aglykon des Aminocoumarinantibiotikums Novobiocin, wurde zu hydroxylierten und zu rhamnosylierten Derivaten umgesetzt. Isolierung und Strukturaufklärung sind im folgenden Kapitel 3.1.6 beschrieben. Die Struktur von Novobiocinsäure enthält wie auch Quercetin (27) ein Chromen. Mit Phenprocoumon (35) und Chromon (36) wurden weitere Chromenderivate auf ihre Biotransformation in S. espanaensis überprüft. In beiden Fällen wurden jedoch keine Transformationsprodukte detektiert. Bei der Analyse der Kulturextrakte zeigte sich, wie instabil viele der Verbindungen unter Kulturbedingungen sind. 32 und 37 - 40 sind lichtempfindlich [117]. Die Kulturgefäße wurden deshalb mit Alufolie abgeschirmt. Als besonders instabil zeigte sich Juglon (38). Auch mit Lichtschutz wurde in wässriger Lösung bereits nach wenigen Stunden eine fast vollständige Derivatisierung von 38 festgestellt (vermutlich sind Polymerisationsprodukte entstanden). Lawson (37), ein Konfigurationsisomer von 38, ist deutlich stabiler. Transformationsprodukte wurden hier nicht detektiert. Menadion (39) wurde auch ohne S. espanaensis im Kulturmedium zu hydrophilen Substanzen umgewandelt. OH OH HO OH h·ν im Sauren OH trans-Resveratrol (40) HO cis-Resveratrol Abb. 36: Photoisomerisierung von trans-Resveratrol in cis-Resveratrol durch UV-Strahlung sowie die inverse Reaktion bei niedrigen pH-Werten [121;122]. 54 Ergebnisse In wässriger Lösung bei neutralem pH isomerisiert das gefütterte trans-Resveratrol (40) unter dem Einfluss von UV-Strahlung zum sterisch gehinderten cis-Resveratrol (s. Abb. 36). Die LC/MS-Analyse lässt auf eine geringe Konzentration von cis-Resveratrol im Extrakt des gefütterten Stammes schließen (s. Abb. 37, Peak bei 14,6 min). Das Absorptionsspektrum von der bei 14,6 min eluierenden Substanz hat ein Maximum bei 268 nm. Der Kurvenverlauf deckt sich mit für cis-Resveratrol publizierten Daten [121]. Das UV/VIS-Absorptionsspektrum von trans-Resveratrol (40) weist eine charakteristische Feinstruktur der Absorptionsbande mit Maxima bei 306 nm und 320 nm auf (s. Abb. 37, Peak bei 11,7 min). Durch Biotransformation in S. espanaensis sind zahlreiche neue Derivate von 40 entstanden, deren MS-Signale auf die Hydroxylierung und zum Teil mehrfache Rhamnosylierung von 40 hindeuten. Die Absorptionsspektren der Peaks bei 7,6 min und 9,4 min entsprechen dem Kurvenverlauf von trans-Resveratrol. Überraschenderweise treten vier Subtanzen auf, deren aus MS-Signalen abgeleitete Molekülmasse der Konjugation einer Rhamnoseeinheit (+146 u) an die Ausgangsverbindung entspricht. Drei Substanzen lassen die Addition zweier Rhamnoseeinheiten (+2×146) vermuten (s. Abb. 37). Unter Beibehaltung der freien Drehbarkeit um die Achse von Einfachbindungen sind nur zwei verschiedene Monoglykoside und zwei verschiedene Diglykoside von 40 denkbar. Möglicherweise entstehen sterisch gehinderte Isomere und Konformere, die ein unterschiedliches Elutionsverhalten zeigen. rel. Abs. M: +16 +2×146 +2×146 +16 +146 2×146 3,0 min 5,3 5,6 6,1 230 300 300 ? 300 300 Wellenlänge / nm 6,7 2×146 +146 +146 +146 +146 7,1 7,6 8,1 9,1 9,4 300 300 300 mAU (300 nm) 300 300 300 11,7 14,6 300 300 9,4 40 11,7 400 7,6 3,0 200 5,3 5,6 6,7 6,1 7,1 0 0 2 4 6 8,1 9,1 8 transcisResveratrol 14,6 10 12 14 min. Abb. 37: Ausschnitt aus dem Chromatogramm des Kulturextrakts nach Zufütterung von trans-Resveratrol (40) und Analyse der Peaks mit Aglykon ähnlichem UV/VIS-Absorptionsspektrum per CI-MS-Kopplung (LC/MS, Methode: antqui, s. 5.11.6). 55 Ergebnisse 3.1.6 Gewinnung neuer Derivate des Antibiotikums Novobiocin Wegen ihrer hohen Donorspezifität für den Zucker L-Noviose ist die Glykosyltransferase der Novobiocinbiosynthese (NovM) nicht für die Generierung von rhamnosylierten Derivaten des Antibiotikums geeignet [123;124]. Dies sollte durch Biotransformation von Novobiocinsäure (34) in Kulturen von S. espanaensis erreicht werden. 3.1.6.1 Darstellung von Novobiocinsäure Novobiocinsäure (34) ließ sich aus kommerziell erhältlichem Novobiocin-Natrium darstellen. Die säurekatalysierte Abspaltung der Zuckereinheit muss schonend im wasserfreien Milieu durchgeführt werden (s. Abb. 38). Durch Hydrolyse in HCl saurer, wässriger Lösung würde Cyclonovobiocinsäure, ein Konstitutionsisomer von 34, entstehen [125]. Versuchsaufbau und Durchführung des Experiments sind unter 5.12 beschrieben. Aus 4,00 g Novobiocin-Na konnten 1,15 g Novobiocinsäure gewonnen werden, was einer Ausbeute von 46 % entspricht. Alternativ wurde Novobiocinsäure aus der Blockmutante Streptomyces spheroides AM1T2 des Novobiocinproduzenten Streptomyces spheroides NCIMB11891 extrahiert [126]. O O Cl + OH ONa 5' B H3C C H3CO O O 1'' O OH CH3 H N O OH HO A 12 O HCl OH 6 + 7 2 B O O CH3 4' + O HCl 10 CH3 + 8 CH3 11 O OH H N O CH3 HCl O CH3 34 CH3 + CH3 OH H3C H3CO O O NH2 O O OH + NaCl NH2 Abb. 38: Darstellung von Novobiocinsäure aus Novobiocin-Na in ethanolischer Lösung unter Katalyse von aus Acetylchlorid freigesetztem Chlorwasserstoff nach Hinman et al. (1957) [125]. 3.1.6.2 Biotransformation in Saccharothrix espanaensis Die Biotransformation von 34 in Kulturen von S. espanaensis wurde wie unter 3.1.2 angegeben überprüft. Vor der Extraktion mit Ethylacetat wurde der pH-Wert der Kulturbrühe auf pH 3 eingestellt, um die sauer reagierenden Aminocoumarine in die lipophile, protonierte Form zu überführen. 56 Ergebnisse Im Chromatogramm des Kulturextrakts lassen sich außer 34 und Cyclonovobiocinsäure sieben neue Peaks mit dem charakteristischem UV/VIS-Absorptionsspektrum der Aminocoumarine detektieren (s. Abb. 39). Korrespondierende MS-Signale lassen auf drei Novobiocinsäuremetaboliten mit einem zusätzlichen Sauerstoffatom schließen (M: 411). Dazu gehören NovPro1, NovPro3 und eine weitere Substanz, die bei 16,1 min eluiert. Beim Screening auf die Masse eines rhamnosylierten Metaboliten (M: 541) fällt nur ein Derivat mit deutlich hervortretendem Peak im Chromatogramm auf (NovPro5). Zwei weitere möglicherweise rhamnosylierte Novobiocinsäuremetaboliten eluieren bei 16,4 min bzw. 18,2 min. mAU (330nm) 80 NovPro1 NovPro3 34 NovPro5 40 ** * 0 0 5 int. [%] m/z =410 neg. 80 Cyclonovobiocinsäure * 10 15 20 25 min. 10 15 20 25 min. 10 15 20 25 min. 10 15 20 25 min. 40 0 0 5 int. [%] m/z = 540 neg. 80 40 0 0 5 int. [%] m/z = 394 neg. 80 40 0 0 NovPro5 mAU 40 323nm 20 220 300 400 nm 5 NovPro1 mAU 60 NovPro3 mAU 328nm 30 220 300 400 nm 100 328nm 50 220 300 400 nm 34 mAU 60 Cyclonovobiocinsäure mAU 335nm 30 220 300 400 nm 334nm 2 1 220 300 400 nm Abb. 39: Analyse der Metabolisierung von Novobiocinsäure (34) in S. espanaensis per LC/ESI-MS (Ausschnitt aus einem Lauf mit Methode nova11, s. 5.11.6). Signale bei m/z = 410 im negativen Detektionsmodus werden von Pseudomolekülionen hydroxylierter 34 erwartet, Signale bei m/z = 540 für rhamnosylierte 34, bei m/z = 394 für 34. Alle markierten Peaks weisen das charakteristische UV/VIS-Absorptionsspektrum von Novobiocinderivaten auf. *: Derivate unbekannter Struktur. Ergebnisse 57 Im Vergleich zu 34 deutlich an Hydrophilie gewonnen hat ein Metabolit mit einer Retentionszeit von 9,4 min. Korrespondierende MS-Signale deuten auf eine Molekülmasse von 556 hin, was der Masse von hydroxylierter und rhamnosylierter Novobiocinsäure entspricht (detektierte Signale: pos. Modus: m/z = 558 [M+H]+, m/z = 580 [M+Na]+, m/z =596 [M+K]+; neg. Modus: m/z = 556 [M-H]−). Zur Isolierung der Biotransformationsprodukte wurde der Ethylacetatextrakt (s. 5.11.1.1) zunächst per Gelelution an Sephadex LH-20 mit Methanol als Fließmittel fraktioniert (s. 5.11.3). Um an Umkehrphasen eine ausreichende Retention zu erreichen, musste angesäuertes Fließmittel eingesetzt werden. Für die Isolierung des hydrolyseempfindlichen Glykosids NovPro5 mittels präparativer LC/MS (Methode: nova11prep s. 5.11.6) stellte dies eine besondere Herausforderung dar. Die Trennung von NovPro1 und NovPro3 gelang mit einer analytischen Xbridge-Säule an einer HPLC-Anlage der Firma Waters (Methode: novaprep, s. 5.11.4). Für die Charakterisierung per NMR-Spektroskopie (in DMSO-d6) konnten 4,9 mg NovPro1, 2,1 mg NovPro3 und 10,2 mg NovPro5 jeweils als beige-weißes Pulver erhalten werden. Strukturen von NovPro1, NovPro3 Mit dem hochauflösenden LTQ-Orbitrap Hybrid-Massenspektrometer (s. 5.11.7) wurde das Signal des einfach positiv geladenen Pseudomolekülions [M+H]+ von NovPro1 bei m/z = 412.13888, von NovPro3 bei m/z = 412.13890 gemessen. Die daraus abgeleitete Summenformel des ungeladenen Moleküls C22H21O7N (Mr: 411,40) entspricht einfach hydroxylierter 34. Die 1H-NMR-Spektren von NovPro1 und NovPro3 sind fast identisch. Vom Spektrum des Vorläufers Novobiocinsäure unterscheiden sie sich durch je zwei zusätzliche, breite Singuletts bei δH = 3,81 ppm (2H) / δH = 4,70 ppm (1H) (NovPro1) bzw. δH = 4,06 ppm (2H) / δH = 4,64 ppm (1H) (NovPro3). Gleichzeitig ist das Integral des 1H-Signals der Methylgruppen an C-9 um drei Protonenäquivalente kleiner (3H statt 6H). Es war demnach jeweils zur Hydroxylierung einer der beiden Methylgruppen an C-9 gekommen. 13C-, COSY-, HSQC-, HMBC-Spektren lassen die ansonsten unveränderte Struktur von 34 erkennen. Durch die Hydroxylierung entstehen E/Z-Isomere, die sich in ihren chemischen und physikalischen Eigenschaften unterscheiden. Die Retentionszeiten der Derivate (s. Abb. 39) sowie δH der neu entstandenen -CH2-Gruppe weichen leicht voneinander ab. Die Bestimmung der Konfiguration an der Doppelbindung der Prenylseitenkette gelingt über ROESY-Kreuzpeaks (s. Abb. 40 und Abb. 41). In der Struktur von NovPro1 befindet sich 7-H in der Nähe der Protonen der Methylgruppe (10-H), 8-H in der Nähe der kohlenstoffgebundenen Protonen der Hydroxymethylgruppe (11-H). Die entsprechenden Kreuzpeaks im Spektrum von NovPro3 sind genau umgekehrt. Damit lässt sich NovPro1 als E-Isomer identifizieren und als 11-Hydroxynovobiocinsäure bezeichnen. NovPro3, das Z-Isomer (10-Hydroxynovobiocinsäure), wurde auch als Produkt des Novobiocinsäuremetabolismus im ActinomycetalesStamm UC5762 NRRL11111 identifiziert [127]. 58 Ergebnisse H2O NovPro1 ROESYsym. DMSO 8'-CH3 10-H CH3CN 8-H 11-OH 7-H 11-H ppm 2 3 5 5' 4' 6' HO O 7 5.0 4.5 4.0 10 8 O 11 CH3 ppm 5.5 4 3 1 2 2' O 8' 12 3' 4'a 8'a 7' H N OH 4 6 OH 9 CH3 5 CH2OH 3.5 3.0 2.5 2.0 1.5 Abb. 40: Auszug aus dem symmetrisierten ROESY-Spektrum zur Bestimmung der E/Z-Isomerie von NovPro1. Nur ROESY-Kreuzpeaks in Antiphase (hier rot) sind auf nukleare Overhauser-Effekte zurückzuführen. H2O NovPro3 ROESYsym. DMSO 8'-CH3 CH3CN 8-H 10-OH 11-H 7-H 10-H ppm 2 3 5 6 OH 5' 6' HO 7' H N 4' 4'a 8'a O 8' 12 3' 4 O O 5.5 5.0 4.5 4.0 3.5 7 10 8 11 CH3 ppm 4 3 1 2 2' OH 9 CH2OH CH3 3.0 2.5 5 2.0 Abb. 41: Auszug aus dem symmetrisierten ROESY-Spektrum zur Bestimmung der E/Z-Isomerie von NovPro3. Nur ROESY-Kreuzpeaks in Antiphase (hier rot) sind auf nukleare Overhauser-Effekte zurückzuführen. 59 Ergebnisse Struktur von NovPro5 (Novalbiocin E) Die aus der exakten Masse (m/z = 542.20201) des [M+H]+-Ions abgeleitete Summenformel lautet C28H31O10N und entspricht einfach rhamnosylierter Novobiocinsäure. Wie aus Abb. 39, Zeile 4 hervorgeht, kommt es unter ESI-Bedingungen (s. 5.11.6) zur Spaltung der glykosidischen Bindung. Das deprotonierte Molekülion von Novobiocinsäure entsteht als Fragment. Zusätzlich zu den Signalen von Novobiocinsäure treten im 1H-NMR-Spektrum von NovPro5 die charakteristischen Signale einer O-glykosidisch verknüpften L-Rhamnose auf. 13 C-, HSQC- und HMBC-Spektren geben keinen Hinweis auf strukturelle Modifikationen der Aglykoneinheit Novobiocinsäure. Eindrucksvoll offenbaren mit ROESY detektierte nukleare Overhauser-Effekte die Glykosylierungsposition (s. Abb. 42). Der Abgleich der Struktur von NovPro5 mit der CAS-Datenbank über das Interface SciFinder Scholar ergab keinen Treffer [105]. Die erweiterte Suche zeigt, dass bisher noch kein Novobiocinderivat mit O-Glykosylierung an C-4' beschrieben wurde. Neue Strukturen werden durch Silbenwechsel im Namen der Referenzverbindung Novobiocin gekennzeichnet: zum Beispiel Clorobiocin, Novclobiocin. Für C-4' glykosylierte Novobiocinderivate wird die Bezeichnung Novalbiocin vorgeschlagen. Das mit "5" indizierte Produkt der Novobiocinsäurebiotransformation wird als Novalbiocin mit dem fünften Buchstaben des Alphabets indiziert. NovPro5 (Novalbiocin E) H OH HO ROESY-Kreuzpeak mit 2-H/6-H H HO H3C O 1'' H H H H H H H O H N 4' 12 2' HO O 7' OH O O 2 3 7 H 10 H H H CH3 CH3 CH3 11 ROESY-Kreuzpeaks Mr: 541,55 Abb. 42: Struktur von NovPro5 (Novalbiocin E) mit allen per ROESY detektierten nuklearen Overhauser Effekten. 60 Ergebnisse 3.1.6.3 Antibiotische Aktivität gegen Bacillus subtilis Die drei Derivate NovPro1, NovPro3 und NovPro5 wurden auf ihre wachstumshemmende Aktivität gegenüber Bacillus subtilis mit einem Agardiffusionsassay im Vergleich zu Novobiocin-Na untersucht. Durch einen Vergleich der Hemmhofdurchmesser kann die relative Aktivität der Substanzen abgeschätzt werden. Mit 200 nmol NovPro5 wird ein vergleichbarer Hemmhofdurchmesser wie mit 2 nmol Novobiocin-Na erreicht (s. Abb. 43). NovPro5 ist folglich antibiotisch aktiv, hat jedoch nur etwa 1 % der Aktivität von Novobiocin gegenüber dem Testkeim B. subtilis. Für die nicht glykosylierten Novobiocinsäurederivate NovPro1 und NovPro3 ist auch mit einer Stoffmenge von 200 nmol keine Wachstumshemmung feststellbar. Die Produkte sind inaktiv gegenüber B. subtilis. Novobiocinsäure, die Ausgangsverbindung der Biotransformation, wird ebenfalls als antibiotisch inaktiv beschrieben [128]. Das Ergebnis unterstreicht die Bedeutung der Zuckereinheit als essentiellen Bestandteil des Pharmakophors. Das rhamnosylierte Aminocoumarinantibiotikum Novalbiocin E unterscheidet sich von der Leitstruktur Novobiocin in der Art des Zuckers, der Glykosylierungsposition und durch fehlende Carbamoylierung der Zuckereinheit. Die Carbamoylgruppe ist an der Bindung mit der bakteriellen Gyrase beteiligt und ein wichtiges Strukturmerkmal für die antibiotische Aktivität von Novobiocin [129]. 4'-Desoxynovobiocin zeigt nur 0,5 % der gyrasehemmenden Aktivität von Novobiocin, 3''-Descarbamoyl-4'-desoxynovobiocin ist inaktiv [47]. In der Struktur von Novalbiocin E ist die Hydroxylgruppe an C-4' durch die Zuckereinheit besetzt. Eigentlich wäre nach den aufgestellten Struktur-Wirkungsbeziehungen keine gyrasehemmende Aktivität von Novalbiocin E zu erwarten. Die Wachstumshemmung von B. subtilis könnte auf einen alternativen Wirkungsmechanismus zurückzuführen sein. Aktuelle Untersuchungen zeigen, dass 3''-Descarbamoyl- und 4'-Desoxyderivate im Vergleich zu Novobiocin eine deutlich erhöhte Hsp90-Inhibition zeigen und deshalb möglicherweise in der Krebstherapie einzusetzen sind [47]. 3 1 5 N — Abb. 43: Bestimmung der antibiotischen Aktivität gegenüber B. subtilis im Hemmhoftest (s. 5.13). 1: 200 nmol NovPro1 3: 200 nmol NovPro3 5: 200 nmol Novalbiocin E (NovPro5) —: Methanol N: 2 nmol Novobiocin-Na Ergebnisse 61 3.1.6.4 Carbamoylierung des Glykosids NovPro5 Die gyrasehemmende Wirkung der Novobiocinderivate lässt sich im Allgemeinen durch Carbamoylierung der Zuckereinheit erhöhen (vgl. 3.1.6.3). Zunächst rhamnosylierte Novobiocinsäure (Novalbiocin E) sollte in einem weiteren Biotransformationsschritt mit einer Carbamoylgruppe an 3''-O des Zuckers versehen werden. Die Carbamoylierung sollte in S. coelicolor M512 [130] mit integriertem Cosmid nov-CA7 [45] erfolgen. Das Cosmid trägt das Novobiocinbiosynthesegencluster auf dem das Prenyltransferasegen novQ durch eine Kanamycinresistenzkassette ersetzt wurde. Durch die Inaktivierung wird die vom Ring A ausgehende Biosynthese des Aglykons verhindert. Durch polare Effekte auf nachgeschaltete Gene des novQ enthaltenden Operons (novR, S, T, U, V, W) wird die Biosynthese von nukleotidaktivierter L-Noviose unterbunden. Das Carbamoyltransferasegen novN bleibt funktionell [45]. Zur Gewinnung von Novalbiocin E wurden 100 mg Novobiocinsäure zu einer 2 Liter-Kultur von S. espanaensis in NL111-Medium zugesetzt. Nach siebentägiger Inkubation unter Standardbedingungen (s. 5.3.1.4) wurde die mit HCl auf pH 3 eingestellte Kulturbrühe mit Ethylacetat extrahiert (s. 5.11.1.1). Durch eine Gelfiltration über Sephadex LH-20 mit Methanol wurde der Rohextrakt von Verunreinigungen befreit. Die Novobiocinderivate lassen sich während der Elution mit UV-Licht mit einer Wellenlänge von 366 nm sichtbar machen. Sie fluoreszieren weißlich. Novalbiocin E haltige Fraktionen wurden vereinigt und die Lösung bis zur Trockene eingeengt. Für den zweiten Biotransformationsschritt, die Fütterung an S. coelicolor M512 [130] mit integriertem Cosmid nov-CA7 [45], wurde das gewonnene Novalbiocin E in 3 mL Ethanol gelöst und zu einer 0,75 L-Kultur des Stammes (15 Kolben à 50 mL) zugesetzt. Als Kontrolle wurde eine nicht gefütterte Kultur angesetzt. Die Extraktion der auf pH 3 eingestellten (HCl) Kulturbrühe mit Ethylacetat erfolgte nach siebentägiger Inkubation bei 30 °C. Per LC/ESIMS konnten zahlreiche neue Novobiocinderivate anhand eines Aminocoumarin typischen UV-Absorptionsspektrums identifiziert werden. Für eine der Substanzen korreliert der Absorptionspeak mit MS-Signalen, die auf die Masse von carbamoyliertem Novalbiocin E (Mberechnet: 584,20) hinweisen: negativer Detektionsmodus: m/z = 583 [M−H]−, m/z = 540 [M−43(Carbamoyl)−H]−, positiver Detektionsmodus: m/z = 585 [M+H]+. In der Negativkontrolle fehlen die Signale. Die präparative Aufreinigung der Substanz wurde wegen der geringen Konzentration in Relation zu bei ähnlichen Retentionszeiten eluierenden Novobiocinderivaten nicht angestrebt. Stattdessen sollte über die Bestimmung der exakten Masse eine Summenformel abgeleitet und über Fragmentionen ein Strukturvorschlag erarbeitet werden. Dazu wurde der Extrakt mit einem hochauflösenden Hybrid-Massenspektrometer (LC/ESI-MS/MS-Anordnung mit LTQ-Orbitrap, s. 5.11.7) analysiert (s. Abb. 44). Das im positiven Detektionsmodus bei m/z = 585,20754 gemessene Signal lässt sich der Summenformel C29H33O11N2+ (m/z = 585,20789) zuordnen. Die atomare Zusammensetzung entspricht dem [M+H]+-Ion von 62 Ergebnisse carbamoyliertem NovPro5. Für zwei der gemessenen Fragmentionen (s. Abb. 44 unten) kann über die aus der exakten Masse abgeleitete Summenformel ein Strukturvorschlag gemacht werden. Das bei m/z = 189,09084 auftretende Fragmention ist durch eine Amidspaltung entstanden. Das Signal bei m/z = 396,14411 ist auf ein Fragmention zurückzuführen, das aus der Spaltung der glykosidischen Bindung hervorgegangen ist. Die Daten zeigen, dass durch die kombinierte Biotransformation in einem zweistufigen Prozess zunächst rhamnosylierte Novobiocinsäure entstanden ist, die anschließend mit einer Carbamoylgruppe versehen wurde. 5.96 Relative Abundance 100 m/z: 585.20754 60 40 0 0.15 1.17 1.54 2.08 1 4 5 6 8.12 8.82 9.33 8 9.63 9 10.68 10.85 10 11 11.56 min AnLi_13_fragmente # 795-807 RT:5.93-5.99 AV: 6 NL:4.61E6 F:FTMS + c NSI Full ms2 [email protected] [160.00-2000.00] O OH CH3 189.09084 317.13835 CH3 HO O CH3 30 20 0 7.33 7 189.09101 40 10 6.88 7.83 OH 80 50 3 5.52 6.27 6.67 5.63 396.14411 90 60 4.23 3.27 2.42 2 100 70 2.32 6.22 5.79 3.55 20 0 Relative Abundance NL: 2.90E7 m/z= 585.09-586.09 F: FTMS + c NSI Full ms [200.00-2000.00] 80 378.15475 286.56158 299.12776 328.79001 363.22110 195.02489 233.08096 257.11727 200 250 300 350 405.23145 440.20685 400 450 OH H N O H O 396.14416 506.18075 500 CH3 CH3 567.19675 597.53021 550 600 m/z Abb. 44: LC/ESI-MS/MS-Analyse des Ethylacetatextrakts nach kombinierter Biotransformation. Die berechnete Masse der Fragmentionen ist in dunkelgrün neben den Strukturformeln angegeben. 3.1.7 In-vitro-Glykosylierungsassay Bei der Untersuchung einer Bibliothek von Anthrachinonderivaten auf ihre Biotransformation in S. espanaensis konnte keine Rhamnosylierung des Arzneistoffs Mitoxantron (25) erreicht werden (s. 3.1.2). In-vitro-Experimente sollten zeigen, ob eine unzureichende Aufnahme von 25 in die Bakterienzellen für die ausbleibende Biotransformation verantwortlich ist. In Ganzzellbiotransformationssystemen bildet die Zytoplasmamembran eine Barriere zwischen dem Akzeptormolekül im Kulturmedium und dem Enzym im Zytoplasma. Die Zellmembran ist semipermeabel. Frei diffundieren können nur kleine, ungeladene Moleküle. Ohne aktiven Transport kann das polare 25 möglicherweise nicht mit der Rhamnosyltransferase in Kontakt treten. Ergebnisse 63 Mit aufgeschlossenen Zellen oder zellfreiem Lysat kann der direkte Kontakt von Substrat und Enzym unabhängig von aktiven Transportvorgängen hergestellt werden. Zunächst wurde mit zellfreien Lysaten des Myzels von S. espanaensis gearbeitet. Diese wurden durch Zerstörung der Bakterienzellen mit einer French Pressure Cell Press (s. 5.1) und anschließende Abtrennung von Zelltrümmern durch Zentrifugation gewonnen (s. 5.10.1). Das Lysat wurde mit Substratlösung versetzt und 30 min bei 28 °C inkubiert (s. 5.10.1). Getestet wurden zunächst die beiden Substanzen Emodin (9) und Quercetin×H2O (27), deren Metaboliten bereits charakterisiert sind. Über die LC/MS-Analyse konnte keine Derivatisierung von Emodin festgestellt werden, im Assay mit Quercetin hingegen kam es zur Bildung des Rhamnokonjugats Quercitrin. Die AUC360nm des Produktpeaks macht etwa 1 % der GesamtAUC360nm von Edukt und Produkt aus. Wird auf die Zentrifugation zur Abtrennung von Zelltrümmern verzichtet und direkt mit den physikalisch durch die French Pressure Cell aufgeschlossenen Zellen gearbeitet, kann der Umsatz von 27 verdoppelt werden. Mit aufgeschlossenen Zellen wurde die Biotransformation von Mitoxantron (25) überprüft. Die LC/MS-Analyse des Ansatzes ergab keinen Hinweis auf rhamnosylierte Derivate von 25. Die Präsenz eines Xenobiotikums führt in vielen Fällen zur Transkriptionsinduktion und damit zur Konzentrationserhöhung des metabolisierenden Enzyms. Für eine Versuchsreihe wurde das Lysat aus Zellen gewonnen, die unter Zusatz von 9 oder 27 in einer Konzentration von 2,5 mg/100 mL NL111-Flüssigmedium kultiviert wurden. Per SDS-PAGE (s. 5.10.2) wurden die Lysate auf Proteinbanden gesteigerter Intensität untersucht. Ein Unterschied zu Lysaten nicht induzierter Kulturen war nicht zu erkennen. Geringe Abweichungen lassen sich per SDS-PAGE jedoch nicht detektieren. Das Lysat der induzierten Kulturen wurde im Glykosylierungsassay mit der jeweils anderen Substanz versetzt. Weder 9 noch 27 wurden umgesetzt. Möglicherweise wird durch den vorausgegangenen Kontakt mit einem Zuckerakzeptor mehr NDP-Rhamnose verbraucht, als nachgebildet werden kann. 3.1.8 Untersuchung weiterer Stämme 3.1.8.1 Stammauswahl In der Literatur sind bereits einige Beispiele mikrobieller Glykosylierung bekannt (s. 4.1.1). Die Art der verknüpften Zuckereinheit ist ein charakteristisches Merkmal unterschiedlicher Stämme. S. espanaensis wird in die Familie Actinosynnematacae eingeordnet [131]. Unter der Hypothese, dass sich die Rhamnosylierungsaktivität auch auf weitere Familienmitglieder erstreckt wurden die Stämme Saccharothrix australiensis (DSM43800) und Saccharothrix tangerinus (DSM44720) aus der Deutschen Sammlung von Mikroorganismen und Zellkulturen (Braunschweig) bestellt. Von besonderem Interesse war auch der Stamm Streptomyces griseoviridis Tü3634, dessen Potential, aromatische Carbonsäuren mit L-Rhamnose zu verestern, aus der Literatur bekannt ist (s. 4.1.1). S. griseoviridis Tü3634 wurde freundlicherweise von Prof. Dr. A. Zeeck und PD Dr. S. Grond (Göttingen) zur 64 Ergebnisse Verfügung gestellt. In Stämmen, deren Genomsequenz bereits erschlossen ist, gestaltet sich die Identifizierung der verantwortlichen Glykosyltransferasegene deutlich einfacher (s. 4.1.4). Aus diesem Grund wurde der Stamm Rhodococcus sp. RHA1 ausgewählt, der seine Eigenschaft als "metabolic powerhouse" bereits bei der Biodegradation von polychlorierten Biphenylen (PCBs) unter Beweis gestellt hat [132]. Der Stamm wurde freundlicherweise von Prof. Dr. L. Eltis (Vancouver, Canada) überstellt. Der Modellorganismus Streptomyces coelicolor A3(2) [70] wurde über L. Petzke von Prof. Dr. M. Redenbach (Kaiserslautern) erhalten. 3.1.8.2 Ergebnis der Kultivierung unter Zusatz von Emodin Die Biotransformation von Emodin in Kulturen der fünf neuen Stämme wurde mit dem für S. espanaensis etablierten Protokoll überprüft (s. 3.1.2). In allen Stämmen, bis auf Rhodococcus sp. RHA1, ließ sich die Metabolisierung von Emodin feststellen. Im Extrakt von Saccharothrix tangerinus war kein Derivat mit Emodin ähnlichem UV/VIS-Absorptionsspektrum zu detektieren, was auf die Degradation der gefütterten Substanz schließen lässt. Spuren von Emodin waren noch über MS-Signale nachweisbar. Das Metabolitenprofil in den Extrakten von S. espanaensis (vgl. Abb. 14), Saccharothrix australiensis und Streptomyces griseoviridis ist sehr ähnlich. In jedem der drei Stämme kam es zur Bildung von EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin). Im Extrakt von Saccharothrix australiensis trat außerdem das aus S. espanaensis bekannte Produkt EmoPro1 (8-O-α-L-Rhamnosylemodin), im Extrakt von Streptomyces griseoviridis EmoPro2 (1-O-α-L-Rhamnosylemodin) auf. Mit diesen Experimenten konnte ein weiterer Rhamnosylierungsstamm (Saccharothrix australiensis) entdeckt werden und bekannte Fähigkeit von Streptomyces griseoviridis zur Rhamnokonjugatbildung auf eine weitere Klasse von Substraten erweitert werden. Die Analyse der Fütterung an Streptomyces coelicolor A3(2) zeigte eine Variation des Emodinmetabolismus. Als Hauptmetabolit konnte ein Derivat der Masse 286 detektiert werden. Die Masse entspricht der von Emodin mit zusätzlichem Sauerstoffatom (270+16 u), vermutlich ein hydroxyliertes Derivat. Für ein weiteres, deutlich hydrophileres Derivat lässt sich eine Masse von 448 abgleiten. Der Massengewinn von 178 u entspricht einem Sauerstoffatom und einer konjugierten Hexopyranose (16 u+162 u) oder der Konjugation eines Desoxyzuckers und entsprechend vielen Sauerstoffatomen an anderer Stelle im Molekül. Als Erklärung wird aufgrund vergleichbarer Ergebnisse mit anderen Streptomyces spp. (s. 4.1.1) eine Funktionalisierung von Emodin durch Hydroxylierung und anschließende Konjugation mit einer Hexopyranose (zum Beispiel Glucose) vorgeschlagen. Mit der Umsetzung von Emodin durch Streptomyces coelicolor A3(2) gelang erstmalig die Xenobiotikaglykosylierung in einer Streptomyces sp. mit vollständig sequenziertem Genom. Die Identifikation des Glykosyltransferasegens, das eine wertvolle Bereicherung der Freiburger Glykosyltransferasen-Toolbox (s. 3.1.9) darstellen wird, sollte durch Analyse des Genoms möglich sein (s. 4.1.4). Ergebnisse 65 3.1.9 Identifizierung von Glykosyltransferasegenen mit degenerierten Oligonukleotidprimern Neben der Bereitstellung von Nukleotidzuckern als Donoren ist die Verfügbarkeit geeigneter Glykosyltransferasen (GTs) eine Herausforderung bei der Durchführung enzymatischer Glykosylierungsreaktionen. Ein Werkzeugkasten (Toolbox) mit Plasmiden, auf denen die Biosyntheseenzyme unterschiedlicher Nukleotidzucker codiert werden, liegt im Arbeitskreis unseres Kooperationspartners Prof. Dr. J. A. Salas (Oviedo, Spanien) vor und wird ständig erweitert [133;134]. Eine entsprechende Bibliothek mit Glykosyltransferasegenen aufzubauen, ist das Ziel des Arbeitskreises Bechthold. Die Koexpression von Enzymen der NDP-Zuckerbiosynthese zusammen mit einer geeigneten Glykosyltransferase soll es ermöglichen, im Sinne der kombinatorischen Biosynthese (s. 1.5.4), den gewünschten Zucker in vivo mit einem ausgewählten Akzeptor zu verknüpfen. Das Akzeptormolekül wird dabei entweder vom Wirt produziert oder der Reaktion über das Kulturmedium zugeführt. Die folgend beschriebenen Experimente waren der erste Schritt zum Aufbau einer Toolbox von Glykosyltransferasegenen aus einer vorselektierten Cosmidbank der Firma Combinature Biopharm AG (Berlin). Die Strategie zur Identifizierung von Glykosyltransferasegenen wurde auch auf genomische DNA von S. espanaensis angewandt. 3.1.9.1 Cosmidisolierung Die Cosmidbank enthielt 246 E. coli DH5α-Stabkulturen. Die in den Bakterien vorliegenden Cosmide stammten aus unterschiedlichen Actinomycetales-Arten und waren durch Hybridisierungssignale im Sondenscreening auf Desoxyzuckerbiosynthesegene aufgefallen. Decker et al. (1996) [135] stellten fest, dass die Biosynthesegene für im Primärstoffwechsel unübliche Zucker oft im Gencluster des entsprechenden Sekundärstoffs und damit auch assoziiert mit Glykosyltransferase-(GT)-Genen vorliegen. Obwohl heute einige Sekundärstoffbiosynthesegencluster bekannt sind, deren GT-Gene nicht mit den Zuckerbiosynthesegenen assoziiert sind [136-139], kann der Nachweis von Biosynthesegenen für den Aufbau seltener Desoxyzucker auf einem Cosmid im Allgemeinen als Indikator für dort ebenfalls codierte Glykosyltransferasen angesehen werden. Die 246 vorselektierten Cosmide der Combinature Biopharm AG sind demnach potentielle Träger von Glykosyltransferasegenen, die dem Aufbau der Freiburger GT-Toolbox dienen können. Der erste Arbeitsschritt war die Kultivierung der Cosmid tragenden E. coli zur Vervielfältigung der Cosmid-DNA. Für jede der 246 Kulturen wurden zwei Cosmidpräparationen mit dem Kit "Wizard Minipreps DNA Purification System" durchgeführt (s. 5.5.2.1). Durch BamHI-Restriktion und anschließende Gelelektrophorese (s. 5.5.4.1; 5.5.4.2) wurden die DNA-Lösungen stichprobenartig überprüft. 66 Ergebnisse 3.1.9.2 Degenerierte Oligonukleotidprimer Um GT-Gene auf den Cosmiden zu identifizieren, sollten PCRs (s. 5.6.1) mit degenerierten, GT-Gen spezifischen Primern durchgeführt werden. Diese Strategie wurde bereits in anderen Arbeitsgruppen erfolgreich zur Identifikation von GT-Genen oder auch vollständigen Sekundärstoffbiosynthesegenclustern eingesetzt [140-142]. Ein degenerierter Primer ist eine Mischung von unterschiedlichen Oligonukleotiden, die sich an bestimmten Positionen unterscheiden. Die degenerierten Positionen (= Wobbles) sind in der Primersequenz durch Buchstaben ≠ GATC zu erkennen und symbolisieren das Auftreten unterschiedlicher Basen an dieser Position (s. 7.1). Die GT-Primer wurden von konservierten Bereichen unterschiedlicher GT-Gene abgeleitet. Das erste Primerpaar, genGT-F / -R, trug über die gesamte Nukleotidsequenz verteilt Wobbles. In 18 PCRs mit je einem zufällig ausgewählten Cosmid als Matrize wurden dieses Primerpaar auf seine Eignung überprüft, spezifisch GT-Genfragmente zu amplifizieren (s. 5.6.3.2). Die beiden konservierten Bindungsregionen liegen auf den GT-Genen etwa 900 bp von einander entfernt. In fünf Fällen kam es zur Bildung von PCR-Produkten entsprechender Größe. Diese wurden mittels präparativer Agarosegelelektrophorese (s. 5.5.4.2) isoliert, über TA-Klonierung in den Vektor pGEM-T Easy insertiert (s. 5.5.5.3) und mit einem Standardprimer ansequenziert (s. 5.6.2.1). Bei den PCR-Produkten handelte es sich jedoch nicht um GT-Genfragmente sondern um unspezifische Amplifikate. Die CODEHOP-Strategie Als Ursache der mangelnden Spezifität wurde vor allem der hohe Degenerierungsgrad des Primerpaars genGT-F / -R angesehen (25 % bzw. 30 % Wobbles). Der hohe Degenerierungsgrad geht mit einer geringen Konzentration der einzelnen Oligonukleotide im Mix einher. Selbst wenn nun ein bestimmtes Oligonukleotidpaar zur Amplifikation eines GT-Genfragments führt, kommt die Reaktion mit dem Abbau dieses Paars nach wenigen Zyklen zum Erliegen. Eine Lösung bot das Primerdesign nach der CODEHOP- (consensusdegenerate hybrid oligonucleotide primer) Strategie [143]. Die von Dr. A. Luzhetskyy nach der CODEHOP-Strategie abgeleiteten Primer P1 / P2 (20 % bzw. 14 % Wobbles, s. 5.6.3.2) haben nur eine kurze, degenerierte Domäne am 3'-Ende (= degenerate core). Der Rest des Primers ist nicht degeneriert (= consensus clamp). Als Basis der Nukleotidsequenzen dienten AS-Sequenzblöcke konservierter Bereiche von sechs Makrolid-GTs (s. Abb. 45). Die Bindungsregion des "degenerate core" ist grau hinterlegt. Im "degenerate core" bildet der Primer gemäß des Streptomyces typischen Codongebrauchs [144] einige der häufigsten Tripletts nach; im "consensus clamp" enthalten die Primersequenzen nur das häufigste Triplett, das für die im AS-Consensus häufigste Aminosäure codiert. In den ersten Zyklen der PCR binden die sich am 3'-Ende unterscheidenden Oligonukleotide spezifisch an komplementären Basenfolgen der GT-Gene. Unabhängig vom amplifizierten Bereich besitzen alle entstehenden PCR-Produkte identische Randbereiche mit der Sequenz des "consensus clamp". In den folgenden Zyklen tragen deshalb alle Primer zur 67 Ergebnisse Vervielfältigung der Primärprodukte bei. Durch PCRs von H. Weiß wurde die Eignung des Primerpaars P1 / P2 zur Amplifikation von GT-Genfragmenten gezeigt. Die vorselektierten Cosmide dienten als Matrize [145]. P1 DesVII EryBV EryCIII MegBV MegCIII MegDI 48 47 48 48 48 48 VLWEPTTYAGAVAAQVTGAAHARVLWG WSSGPQTFAASIAATVTGVAHARLLWG VIWEPLTFAAPIAAAVTGTPHARLLWG IVWEPLTFAAPIAARVTGTPHARMLWG VLWEPFTFAGAVAAKACGAAHARLLWG VLWEPFTFAGAVAARACGAAHARLLWG P2 222 223 222 225 218 218 RFTDFVPMHALLPSCSAIIHHGGAGTYATAVI RTVGFVPMHALLPTCAATVHHGGPGSWHTAAI RTVGFVPMHALLPTCAATVHHGGPGSWHTAAI RTAGFVPMNVLLPTCAATVHHGGTGSWLTAAI RLVDFVPMNILLPGCAAVIHHGGAGSWATALH RLVDFVPMGVLLQNCAAIIHHGGAGTWATALH Abb. 45: AS-Sequenzblöcke konservierter Bereiche der Glykosyltransferasen DesVII (Biosynthese von Methymycin, Neomethymycin, Narbomycin, Pikromycin [146]), EryBV / EryBV (Erythromycinbiosynthese [137]), MegBV / MegCIII / MegDI (Megalomicinbiosynthese [147]). Design der Primer P1 / P2 s. Text. Anwendung auf genomische DNA von Saccharothrix espanaensis Xenobiotikaglykosylierungen, wie unter 3.1 für Saccharothrix espanaensis beschrieben, werden im Allgemeinen von UGTs (UDP abhängige Glykosyltransferasen) katalysiert (vgl. 4.1). Enzyme dieser Familie werden deshalb auch für die Glykosylierungsaktivität von S. espanaensis verantwortlich gemacht (s. 4.1). Von den bisher bekannten 17 GT-Genen des Stammes lässt sich phylogenetisch keines einer UGT zuordnen (s. 4.1.4.1, Abb. 93). Eine Möglichkeit zur Identifizierung weiterer GT-Gene des Stammes könnte das CODEHOPPrimerpaar P1 / P2 bieten. Die ersten PCRs wurden mit vorselektierten Cosmiden aus der Bibliothek des S. espanaensisGenoms angesetzt, die im Sondenscreening auf Zuckerbiosynthesegene Hybridisierungssignale zeigten. Mit keinem der Cosmide noch unbekannter Sequenz kam es zur Bildung detektierbarer PCR-Produkte. Überraschenderweise führte auch das Cosmid 4L16 (Locus 1) nicht zur Amplifizierung von GT-Genfragmenten, obwohl darauf sieben GT-Gene des samClusters liegen [148]. Im Gegensatz dazu kam es mit Cosmid 2L12 (Locus 2, 10 GT-Gene) zur Produktbildung. Das Primerpaar P1 / P2 ist folglich nicht für alle GT-Gene gleichermaßen geeignet. Auch galt es die gewählte Strategie mit vorselektierten Cosmiden zu überdenken, da bakterielle UGT-Gene nicht obligat in Assoziation mit Zuckerbiosynthesegenen vorliegen [149]. Als Matrize der folgenden PCRs wurde deshalb genomische DNA (s. 5.5.2.2) aus S. espanaensis eingesetzt. Zwei Hauptprodukte mit einer Größe von 0,8 kb und 1,2 kb wurden in pGEM-T Easy insertiert und mit einem Standardprimer ansequenziert. Es handelte sich jedoch nicht um GT-Genfragmente. Die Spezifität der CODEHOP-Primer ist demnach ausreichend für die Anwendung auf vorselektierte Cosmide, jedoch unzureichend für gezielte Amplifikationen ausgehend von genomischer Gesamt-DNA. 68 3.2 Ergebnisse Erstellung einer Nullmutante und Selektion eines Polyketomycinüberproduzenten des Stammes Streptomyces diastatochromogenes Tü6028 Mit dem Polyketomycinbiosynthesegencluster besitzt Streptomyces diastatochromogenes Tü6028 die genetische Grundlage zur Bereitstellung der seltenen Zuckerbausteine L-Axenose und D-Amicetose in nukleotidaktivierter Form. Im Rahmen der kombinatorischen Biosynthese zur Bildung neuer Glykoside konnte der Stamm seine Eignung als Wirt für die heterologe Expression von PKS II-Biosynthesegenclustern unter Beweis stellen [54]. Die Produktion des endogenen Polyketids Polyketomycin beschränkt die Biosynthese weiterer Polyketide jedoch durch Entzug des Vorläufers Malonyl-CoA. Gleichzeitig erschwert die Anwesenheit von Polyketomycin und seinen Derivaten im Kulturextrakt die Detektion neu auftretender Metaboliten. Durch gezielte Inaktivierung von pok-KSα, dem Gen der Ketosynthase Untereinheit α, sollte die Polyketomycinproduktion zum Erliegen gebracht werden (s. 3.2.1, 3.2.2). Die gewonnene ∆pok-KSα-Mutante sollte für Biosyntheseuntersuchungen (s. 3.2.3) und als Expressionswirt (s. 3.2.4) eingesetzt werden. 3.2.1 Fehlgeschlagene pok-KSα-Inaktivierungsstrategien Der schließlich innerhalb kürzester Zeit erfolgreichen, in dieser Arbeit erstmalig beschriebenen, [safe-knock]-Strategie (s. 3.2.2), gingen drei erfolglose Versuche zur Inaktivierung von pok-KSα voraus, die im Folgenden kurz beschrieben werden. 3.2.1.1 In-frame-Deletion auf einem 3,7 kb Clusterfragment Inaktivierungsplasmid Das im ersten Versuch eingesetzte Inaktivierungsplasmid pKC-P3,7 (s. 5.4.2.2) trägt ein pokKSα-Allel mit 390 bp In-frame-Deletion (vgl. 5.8.1.3) in der Mitte eines 3,7 kb großen Clusterfragments. Mittels intergenerischer Konjugation sollte pKC-P3,7 in S. diastatochromogenes Tü6028 eingebracht werden und über homologe Rekombination zu einem ersten Crossover-Ereignis mit dem Chromosom des Stammes führen. Das Plasmid wird durch den ersten Crossover in das Chromosom integriert und vermittelt der entstehenden Mutante Resistenz gegen das Selektionsantibiotikum Apramycin. Ergebnisse 69 Intergenerische Konjugation Die intergenerische Konjugation wurde nach dem unter 5.7.2 beschriebenen Protokoll durchgeführt. Wie sich erst in späteren Experimenten feststellen ließ, zeichnet sich S. diastatochromogenes Tü6028 durch das Bedürfnis eines außergewöhnlich langen Intervalls (20 h) zwischen dem Aufbringen auf die Konjugationsplatte und dem Überschichten mit Antibiotikalösung aus. Für die Versuche mit pKC-P3,7 variierte das Intervall zwischen 12 h und 14 h Stunden. Retrospektiv war es deshalb nicht überraschend, dass auch mehr als 30 Konjugationsversuche bei Einsatz von Donor- und Rezipientenkulturen verschiedener Kulturdauer ausgehend von Myzel oder Sporen nicht zum Erhalt einer Mutante mit erstem Crossover führten. Positivkontrollen mit dem Vektor pSET152 (s. 5.4.1) zeigten stets das Wachstum einiger Konjuganten; bei den später gefundenen Idealbedingungen (s. 5.7.2) wuchsen mit pSET152 jedoch mehrere Hundert Kolonien pro Konjugationsplatte (∅ = 9 cm). 3.2.1.2 In-frame-Deletion auf einem 7,3 kb Clusterfragment Inaktivierungsplasmid Die Wahrscheinlichkeit der homologen Rekombination zweier DNA-Doppelstränge erhöht sich mit der Länge des homologen Bereichs. Mit 7,3 kb Länge wurde für den zweiten Versuch der pok-KSα-Inaktivierung ein etwa doppelt so großes, subkloniertes Clusterfragment eingesetzt. Zur Konstruktion des Inaktivierungsplasmids pKC-P7,3 mit funktionslosem pok-KSα-Allel war ursprünglich die Einführung eines Frameshifts durch Blunting und Religation geplant (s. 5.4.2.2). Es kam jedoch nicht wie erwartet nur zur Abtragung der an der Schnittstelle zurückgelassenen 3'-Überhänge, sondern zum Verlust von insgesamt 69 bp (Sequenzierergebnis). Es war ein Allel mit In-frame-Deletion entstanden. Das Konstrukt war dennoch verwendbar, da der Verlust von 69 bp an genetischer Information (entsprechend 23 AS) zum Funktionsverlust des Gens führen sollte. Intergenerische Konjugation und Protoplastentransformation Per intergenerischer Konjugation (s. 5.7.2) konnte pKC-P7,3 erfolgreich in S. diastatochromogenes Tü6028 eingebracht werden. Auch die parallel durchgeführte Protoplastentransformation (s. 5.7.1) führte zur Bildung von Transformanten. Für den Nachweis der Integration von pKC-P7,3 in das Genom von S. diastatochromogenes Tü6028 wurde genomische DNA eines Konjuganten (P7,3Ex1) isoliert (s. 5.5.2.2). Per PCR (Primer P7,3-F / -R, s. 5.6.3.1) wurde der Bereich von pok-KSα amplifiziert. Nach dem ersten Crossover-Ereignis befinden sich sowohl Wildtypallel als auch das mutierte Allel auf dem Chromosom. Da die erwarteten Produktgrößen (Wildtypallel: 1501 bp; mutiertes Allel: 1432 bp) nur gering von einander abweichen, wurde die DNA aus dem PCR-Ansatz isoliert (Kit "Wizard SV Gel and PCR Clean-up System" s. 5.2.5) und mit KpnI restringiert. Die 70 Ergebnisse KpnI-Erkennungsstelle liegt auf dem 69 bp-Bereich, der dem mutierten Allel fehlt. Da nur PCR-Produkte des Wildtypallels in 687 bp und 814 bp große Fragmente gespalten werden, konnten sie von Produkten des mutierten Allels durch eine anschließende Gelelektrophorese unterschieden werden. Cosmid 30-6D20 (Wildtypallel, [38]) und pKC-P7,3 (mutiertes Allel) dienten als Matrize in parallel durchgeführten Kontrollansätzen. Ansätze mit DNA des Konjuganten P7,3Ex1 zeigten nach KpnI-Restriktion in der Gelelektrophorese sowohl die Fragmente des Produkts mit Wildtypallel als auch das unverdaute PCR-Produkt mit mutiertem Allel. Im Kulturextrakt des Konjuganten P7,3Ex1 konnte Polyketomycin per LC/MS-Analytik (Methode: antqui, s. 5.11.6) nicht nachgewiesen werden. Selektion auf zweites Crossover Der apramycinresistente Konjugant P7,3Ex1 wurde zur Herbeiführung des zweiten Crossovers (vgl. 5.8.1.3) ohne Selektionsdruck abwechselnd durch HA-Medium und HAAgar passagiert (vgl. 5.8.2.5). Zur Gewinnung von 58 apramycinsensitiven Klonen wurden sukzessive nach 6, 8 und 10 Passagen insgesamt 1232 Kolonien je auf HA-Agar mit Apramycin und HA-Agar überpickt. Durch Isolierung von genomischer DNA (s. 5.5.2.2), PCR (Primer P7,3-F / -R sowie P7,31-F / P7,32-R, s. 5.6.3.1) und KpnI-Restriktion konnten die Klone bezüglich pok-KSα genotypisiert werden. Nur einer der Doppelcrossover-Klone ergab das für die Knockout-Mutante erwartete, nicht von KpnI restringierbare PCR-Produkt. Zur weiteren Überprüfung wurde das Produkt aus dem PCR-Ansatz isoliert und per TA-Klonierung (s. 5.5.5.3) in den Vektor pGEM-T Easy kloniert und mit einem Standardprimer ansequenziert (s. 5.6.2.1). Die Sequenz entsprach dem mutierten Allel. Damit schien das Vorliegen der gewünschten ∆pok-KSα-Mutante bewiesen zu sein. Wie erwartet, ließ sich in Extrakten der Doppelcrossover-Mutante kein Polyketomycin nachweisen. Bei wiederholten PCRs mit genomischer DNA des gleichen Klons als Matrize wurde überraschenderweise das PCR-Produkt des Wildtypallels erhalten. Dies wurde per Sequenzierung bestätigt. Die zunächst über Apramycinsensitivität und Sequenzierung identifizierte Knockout-Mutante besaß nun wieder das pok-KSα-Wildtypallel. Das Ergebnis wird unter 4.3 diskutiert. Aus der Mutante nach erstem Crossover (P7,3Ex1) konnte folglich keine stabile ∆pok-KSαMutante gewonnen werden. 3.2.1.3 Einbringen einer Redirect-Kassette in das 7,3 kb Clusterfragment Im vorangegangenen pok-KSα-Inaktivierungsversuch (s. 3.2.1.2) konnte ein erstes CrossoverEreignis herbeigeführt werden; es entstand jedoch keine stabile Doppelcrossover-Mutante. Im folgenden Ansatz sollte das Wildtypallel durch eine Antibiotikaresistenzkassette ausgetauscht werden (vgl. 5.8.1.2). Der ins Genom integrierte Marker vereinfacht nach stattgefundenem zweiten Crossover die Unterscheidung zwischen Mutante (resistent) und Wildtyp (sensitiv). 71 Ergebnisse Das Selektionsantibiotikum kann eingesetzt werden, um bei den Filialgenerationen das Wachstum von Revertanten zum Wildtyp (s. 4.3) zu verhindern. Es sollten die multifunktionellen Redirect-Kassetten des John Innes Centre (Norwich, UK) eingesetzt werden [150] (s. 5.5.5.5). Neben einem Resistenzgen tragen diese auch das für die intergenerische Konjugation notwendige origin of transfer (oriT) sowie zwei flankierende FRT- oder loxP-sites zur sequenzspezifischen Rekombination (s. 5.9). Die Kassette sollte über λ-Red vermittelte Rekombination (s. 5.5.5.5) den Bereich des Gens pok-KSα auf pKC-P7,3 (s. 5.4.2.2) ersetzen. Auswahl eines weiteren Selektionsmarkers für S. diastatochromogenes Tü6028 Zusätzlich zu der vom Vektor vermittelten Resistenz (gegen Apramycin) wurde für die geplante Inaktivierung ein weiterer geeigneter Marker für den Stamm S. diastatochromogenes Tü6028 benötigt. In einem Antibiotikum basierten Selektionssystem sollte das Antibiotikum das Wachstum des Wildtyps hemmen, das Wachstum von Klonen mit Resistenzgen hingegen möglichst wenig beeinflussen. Auf HA-Agar mit gebräuchlichen Konzentrationen der getesteten Antibiotika wurden je 0,2 mL Saccharosedauerkultur des Wildtyps (s. 5.3.1.4) ausplattiert und bei 28 °C inkubiert. Nach 4 und 8 Tagen wurden die Platten (∅ = 9 cm) auf Koloniewachstum überprüft. Tab. 7: Wachstum von S. diastatochromogenes Tü6028 unter Einfluss von Antibiotika. Antibiotikum Hygromycin Lincomycin Spectinomycin Spectinomycin Streptomycin ohne (Kontrolle) [µg/mL] 100 50 50 100 50 - nach 4 Tagen kein Wachstum 7 Kolonien 10 Kolonien kein Wachstum kein Wachstum überwuchert nach 8 Tagen kein Wachstum 7 Kolonien 30 Kolonien kein Wachstum kein Wachstum überwuchert Mit vollständiger Wachstumshemmung reagierte der Wildtyp auf die Antibiotika Hygromycin (100 µg/mL), Spectinomycin (100 µg/mL) und Streptomycin (50 µg/mL). Da es sich um Konzentrationen handelt, die das Wachstum von Stämmen mit entsprechender Resistenzkassette nicht wesentlich beeinflussen, sind die drei Antibiotika in den angegebenen Konzentrationen zur Selektion geeignet. Die verfügbaren Redirect-Kassetten [151] tragen bevorzugt das aac(3)IV-Gen der Apramycinresistenz vermittelnden Aminoglykosid 3-N-Acetyltransferase [152] oder aadA-Gen der Spectinomycin- und Streptomycinresistenz vermittelnden Aminoglykosid-3''-adenyltransferase [153]. Das aadA-Gen wurde deshalb neben aac(3)IV als zweiter Marker gewählt. Auch in Flüssigmedium wurde die Sensitivität von S. diastatochromogenes Tü6028 gegenüber Spectinomycin überprüft, wozu je 10 µL Saccharosedauerkultur als Inokulum für 1 mL HA-Medium unterschiedlicher Konzentration des Antibiotikums dienten. Nach 7 Tagen 72 Ergebnisse bei 28 °C war nur bei Konzentrationen von ≤ 50 µg/mL Myzelwachstum zu beobachten. Die Konzentration von 100 µg/mL konnte damit als geeignet bestätigt werden. λ-Red vermittelte Rekombination mit der pIJ785Spec Redirect-Kassette Eigens für dieses Projekt wurde das Plasmid pIJ785Spec mit einer neuen Redirect-Kassette erstellt (s. 5.4.2.1). Eine Besonderheit der Kassette ist der zusätzlich zum Spectinomycinresistenzgen vorliegende thiostreptoninduzierbare tipA-Promotor [154]. Mit dem eingebrachten tipA-Promotor wurde die steuerbare Überexpression nachgeschalteter Gene der Desoxyzuckerbiosynthese [38] angestrebt. Analog zum Protokoll von Gust et al. (2002) [150] sollte pok-KSα in dem subklonierten, 7,3 kb großen Clusterfragment von pKC7,3 durch die Redirect-Kassette von pIJ785Spec pokKSα ersetzt werden. Die Redirect-Kassette diente als Matrize einer PCR mit dem Primerpaar P7,3red-F / -R (s. 5.6.3.1). Um die erhaltene lineare DNA für die λ-Red vermittelte Rekombination zu qualifizieren, trug diese, durch Primerüberhänge bedingt, beidseitig einen 40 bp-Sequenzabschnitt, der Bereichen am Anfang bzw. Ende von pok-KSα entsprach. An den identischen Bereichen des PCR-Produkts und pKC-P7,3 wurde nach Induktion der red-Gene (s. 5.5.5.5) die homologe Rekombination erwartet. Die gewünschte Rekombination fand jedoch nicht statt. Als Grund wurden weitere, unerwünschte Sequenzähnlichkeiten zwischen pKC-P7,3 und dem PCR-Produkt verantwortlich gemacht. Die Nukleotidsequenz des pKC-P7,3 zugrunde liegenden Vektors pKC1132 (s. 5.4.1) ist unbekannt. Der Vektor trägt das origin of transfer (oriT) aus RK2, sowie ein Apramycinresistenzgen. Da auch in der pIJ785Spec-Kassette das oriT sowie ein vom Promotor des Apramycinresistenzgens kontrolliertes Spectinomycinresistenzgen liegt, scheint eine homologe Rekombination in diesen deutlich über 40 bp langen, identischen Sequenzbereichen wahrscheinlicher als die gewünschte Rekombination zum Austausch von pok-KSα. Zur Umgehung aller unerwünschten Rekombinationen unter Beibehaltung der gewählten Selektionsmarker wurde die im nächsten Kapitel beschriebene [safe-knock]-Strategie entwickelt. Ergebnisse 73 3.2.2 Erfolgreiche Inaktivierung mit der [safe-knock]-Strategie Mit Erkenntnissen aus den fehlgeschlagenen Inaktivierungsversuchen wurde eine Strategie entwickelt, bei der jeder Schritt der Inaktivierung mit hoher Sicherheit beim ersten Versuch erfolgreich ist (s. 4.3). Die [safe-knock]-Strategie wurde zur Methode der Wahl für alle folgenden Inaktivierungen und ist deshalb im Methodenteil beschrieben (s. 5.8.2). Das allgemein gültige Schema zur Erstellung von Inaktivierungsplasmiden, ausgehend von einem Subklon und dem spezifischen PCR-Produkt einer Redirect-Kassette, ist in Abb. 46 dargestellt. Inaktivierungsplasmid Für die Inaktivierung von pok-KSα wurde gemäß der [safe-knock]-Strategie das Inaktivierungsplasmid pB-P3,7red erstellt (s. 5.4.2.2). Wie schon beim vorangegangenen Versuch (s. 3.2.1.3) sollte pok-KSα zur Konstruktion des Inaktivierungsplasmids durch die Redirect-Kassette von pIJ785Spec ersetzt werden. Der entscheidende Unterschied zu vorangegangenen Klonierversuchen liegt darin, dass der Resistenzmarker des Vektors (apra) erst nach der λ-Red vermittelten Rekombination in das Konstrukt integriert wird (vgl. Abb. 46). Da ein Clustersubklon in einem Kloniervektor bekannter Sequenz eingesetzt wird, können unerwünschte Rekombinationen vermieden werden. Das Einbringen in S. diastatochromogenes Tü6028 (Phänotyp WS-R, s. 3.2.5) erfolgte über intergenerische Konjugation (s. 5.5.2.2). Nachweis der Rekombinationsereignisse Auf der nach 20 h mit Apramycin und Phosphomycin (s. 5.2.3) überschichteten Konjugationsplatte (∅ = 9 cm) waren 12 Streptomyces-Kolonien gewachsen. Die Klone wurden zur Überprüfung ihrer Resistenz auf HA-Agar mit Apramycin, Spectinomycin und Phosphomycin übertragen. Alle Klone wuchsen an. Die Anwesenheit beider Marker (Vektor: apra, in pok-KSα integriert: spec) lässt mit hoher Sicherheit auf das Vorliegen eines ersten Crossovers schließen. Per PCR mit genomischer DNA wurde dies bestätigt (s. Abb. 47). Einer der Konjuganten, bezeichnet als P3,7redEx1, wurde ohne Selektionsdruck abwechselnd durch HA-Flüssigmedium und HA-Agar passagiert (s. 5.8.2.5). Das effektive Passagieren wurde dadurch begünstigt, das sich auf dem Festmedium schnell Sporen bildeten (s. 5.8.2.5). Während des Passagierens wurde die Stabilität des Phänotypen WS-R deutlich. Es traten ausschließlich die für den Phänotyp WS-R charakteristischen, weißen Sporen auf. 74 Ergebnisse PCR der Redirect-Kassette Subklon mit Clusterfragment auszutauschender Bereich angrenzende Clusterbereiche Primer mit 40nt angrenzender Clustersequenz als Überhang P1 / P2: priming site; FRT: FRT-site; spec: Spectinomycinresistenzgen; oriT: origin of transfer 5' 3' P1 4000 5' oriT s pec FRT 1000 FRT carb P2 3' HindIII Simultane Elektroporation mit Subklon und PCR-Produkt E. coli DH5α mit vorinduzierten red-Genen Selektion auf LB-Agar mit Carbenicillin und Spectinomycin α β γ Red-Proteine + HindIII HindIII Plasmidisolation und Restriktion mit HindIII Apramycinresistenzkassette aus pHPΩ45aac über HindIII Präparative Gelelektrophorese Leiter Probe apra Ligation mit Apramycinresistenzkassette Transformation von E. coli mit pUZ8002 für die Konjugation carb 2000 6000 HindIII apra spec Selektion mit Carbenicillin, Spectinomycin, Apramycin, Kanamycin HindIII Abb. 46: Konstruktion eines Inaktivierungsplasmids mittels [safe-knock]-Strategie. Darstellung der RedirectKassette gemäß [150]. 75 Ergebnisse Die Sporensuspension der zweiten Agarkultur (= vierten Passage) wurden in unterschiedlichen Verdünnungen auf HA-Agar mit Spectinomycin kultiviert. Alle anwachsenden Klone haben entweder den Genotyp nach erstem Crossover (wie P3,7redEx1) oder den der gewünschten Doppelcrossover-Mutante (= Knockout-Mutante). Von 352 auf gerasterte HA-Agarplatten übertragenen Klonen waren zwei spectinomycinresistent und apramycinsensitiv. Diese Eigenschaft charakterisiert die gewünschte Doppelcrossover-Mutante mit integrierter Spectinomycinresistenzkassette. Die beiden Klone wurden auf HA-Agar mit Spectinomycin ausgestrichen. Von einigen Klonen, bezeichnet als P3,7redDCOx (x = Nummer des Klons) wurde genomische DNA isoliert und per PCR-Analyse (Primer P3,7-F / -R, s. 5.6.3.1) genotypisiert. Das erwartete Produkt des Wildtypallels (auf Cosmid 30-6D20 [38]) hat eine Größe von 1,6 kb, für das mutierte Allel (auf pB-P3,7red) wurden 2,1 kb erwartet. Das Gelbild der Agarosegelelektrophorese (s. Abb. 47) weist für die Mutante nach erstem Crossover wie erwartet beide Amplifikate auf. Mit genomischer DNA des Doppelcrossovers zur Mutante bildete sich nur noch das 2,1 kb große Produkt. Der über das Resistenzverhalten der Klone bestimmte Genotyp bezüglich pok-KSα konnte damit bestätigt werden. Für anschließende Experimente wurde der Klon P3,7redDCO14 ausgewählt und forthin als S. diastatochromogenes Tü6028 ∆pok-KSα bezeichnet. Im Extrakt von Standardkulturen (s. 5.3.1.4) des Stammes konnte Polyketomycin nicht nachgewiesen werden. S. diastatochromogenes Tü6028 ∆pok-KSα ist bezogen auf Polyketomycin, wie angestrebt, eine Nullmutante. 10 kb 8 kb 6 kb 5 kb 4 kb 3 kb 2,5 kb 2,0 kb 2067bp 1624bp 1,5 kb 1,0 kb 0,75 kb 0,50 kb 0,25 kb 1 2 3 4 L 1: P3,7redEx1 nach erstem Crossover 2: P3,7redDCO14 mit Doppelcrossover 3: Cosmid 30-6D20 mit Wildtypallel 4: Plasmid pB-P3,7red mit mutiertem Allel L: 1 kb Leiter (Promega) Abb. 47: Agarosegelelektrophorese von PCR-Ansätzen zur Genotypisierung bezüglich pok-KSα (Ausschnitt). 76 Ergebnisse Komplementierung des pok-KSα-Gendefekts Das Gen pok-KSα markiert den Beginn eines Operons des Polyketomycinbiosynthesegenclusters. Die Expression der nachgeschalteten Gene wird durch den Promotor vor pok-KSα kontrolliert. Diese Gene codieren unter anderem die weiteren essentiellen Komponenten der minimalen PKS: KSβ und ACP (s. Abb. 48). Um zu überprüfen, ob durch die eingebrachte Redirect-Kassette auch die Expression von pok-KSβ oder pok-ACP inhibiert wird, sollte der pok-KSα-Gendefekt mit einer intakten Kopie des Gens komplementiert werden. Wenn es dadurch zu einer Wiederaufnahme der Polyketomycinproduktion kommt, ist davon auszugehen, dass nur pok-KSα von dem generierten Gendefekt betroffen ist. Zur Erstellung des Komplementierungskonstrukts pSET-P3,7kompl wurde pok-KSα mit seinem nativen Promotor in den integrativen Vektor pSET152 insertiert (s. 5.4.1). Nach dem Einbringen des Plasmids pSET-P3,7kompl in S. diastatochromogenes Tü6028 ∆pok-KSα über intergenerische Konjugation wurden sechs der Konjuganten per LC/MS auf die Produktion von Polyketomycin überprüft (Methode: antqui, s. 5.11.6). Polyketomycin oder bekannte Derivate des Antibiotikums konnten in keinem der Extrakte nachgewiesen werden. Parallel wurde ein Cosmid (30-6D20), dessen Insert das betroffene Operon vollständig abdeckt, in S. diastatochromogenes Tü6028 ∆pok-KSα eingebracht. Es kam zur Wiederaufnahme der Polyketomycinproduktion. Aus den Beobachtungen lässt sich ableiten, dass außer pok-KSα weitere Gene, bzw. deren Expression, durch die eingebrachte Redirect-Kassette beeinflusst werden. Die Auswirkungen bleiben aber auf Gene des Polyketomycinbiosynthesegenclusters begrenzt, wie durch Komplementierung mit dem Cosmid 30-6D20 gezeigt wurde. verändertes pok-Operon oriT spec FRT KSα' P1 FRT MT1 P2 tipAp 'KSα KSβ ACP Redirect-Kassette von pIJ786Spec Abb. 48: Schematische Darstellung des Chromosoms von S. diastatochromogenes Tü6028 ∆pok-KSα im Bereich der eingebrachten Redirect-Kassette. Gewinkelte Pfeile: Promotoren, Blockpfeile: Gene (lila: Gene des pokClusters, pok-MT1: Methyltransferasegen). P1 / P2: Priming-sites, FRT: FRT-sites, oriT: Transfer-Origin für die Konjugation, spec: Spectinomycinresistenzkassette, tipAp: tipA-Promotor. Ergebnisse 77 Sequenzspezifische Flp-Rekombination in Streptomyces spp. Als Ursache der transkriptionell negativen Beeinflussung weiterer Gene des pok-KSα enthaltenden Operons wurde der gegen die Leserichtung des Operons orientierte, starke Promotor von spec vermutet (vgl. Abb. 48). Über RNA-Interferenz könnte es zur Inaktivierung des pok-Promotors kommen. Zur Überprüfung der Hypothese sollte der specPromotor aus dem Genom von S. diastatochromogenes Tü6028 ∆pok-KSα entfernt werden, um anschließend erneut die Komplementierung mit pSET-P3,7kompl zu versuchen. Dieses Ziel kann mit der sequenzspezifischen Flp-Rekombination, einer Erweiterungsmöglichkeit der [safe-knock]-Strategie, erreicht werden (s. 5.9). Die Flp-Rekombination erlaubt die gezielte Exzision des Bereichs zwischen zwei FRT-sites. Im Genom zurück bleibt eine der 34 bp langen FRT-sites, flankiert von den Primerbindungsstellen P1 und P2 (schematisch gezeigt in Abb. 105). Für die Anwendung in bestimmen Actinomycetales-Arten konnte die Funktionalität eines speziell für den Codongebrauch von Organismen mit G+C-reichen Genomen umgeschriebenen, synthetischen Flp-Rekombinasegens (flp(a)) gezeigt werden [155]. Im Folgenden sollte das Gen erstmals zur Geninaktivierung in einem Sekundärstoffbiosynthesegencluster eingesetzt werden. Mittels intergenerischer Konjugation wurde das speziell für dieses Experiment erstellte flp(a)Expressionsplasmid pUWLhyg-FLP (s. 5.4.2.3) in S. diastatochromogenes Tü6028 ∆pok-KSα eingebracht. Einer der resultierenden Konjuganten wurde für drei Tage in HA-Flüssigmedium mit Hygromycin angezogen. In dieser Kultur sollte die Flp-Rekombination stattfinden. Der Zusatz von Hygromycin stellt dabei die Anwesenheit von pUWLhyg-FLP in den Zellen sicher. Auf den Zusatz von Spectinomycin wurde verzichtet, da die gewünschte Rekombination zum Verlust von spec führt. Eine Probe aus der Flüssigkultur wurde auf HA-Agar bis zur Sporenbildung inkubiert. Mit ausplattierten Verdünnungen einer Sporensuspension wurden ausgeeinzelte Klone gewonnen und auf gerasterte HA-Agarplatten je mit bzw. ohne Spectinomycin übertragen. 26 von 232 Klonen (11 %) wiesen keine Resistenz gegen Spectinomycin auf. Der Resistenzverlust ist auf den Einfluss der Flp-Rekombinase zurückzuführen, ein spontaner Resistenzverlust wurde nicht beobachtet. Vier zufällig gewählte, spectinomycinsensitive Klone (S. diastatochromogenes Tü6028 ∆pok-KSα FLP1 bis 4) sollten weiter untersucht werden. Durch Übertragung auf HA-Agar mit Hygromycin wurde festgestellt, dass die Klone bereits das Hygromycinresistenz vermittelnde, replikative Plasmid pUWLhyg-FLP verloren hatten. Mittels PCR auf genomischer DNA wurde versucht, den Bereich der Redirect-Kassette zu amplifizieren. Die angestrebte Exzision würde zu einer Verringerung der Produktgröße um etwa 1,3 kb führen. Das PCR-Temperaturprogramm und die Komposition des PCR-Mix wurden variiert (unterschiedliche Konzentrationen von DMSO und Glycerol, getestete Primerpaare: P3_7FLP-F / -R, P3_7FLP2-F / -R, P7,3-F / -R, s. 5.6.3.1). Mit genomischer DNA der Rekombinanten wurden nur unspezifische Produkte erhalten. Mit Matrizen vom 78 Ergebnisse Wildtyp oder S. diastatochromogenes Tü6028 ∆pok-KSα entstanden Produkte der erwarteten Größe. Auch vom Entwickler der Flp(a) vermittelten Rekombination wurden ähnliche Beobachtungen gemacht [156]. Trotz zahlreicher PCR-Ansätze gelang der Nachweis der erfolgreichen Rekombination in Vertretern der Gattung Streptomyces per sequenziertem PCRProdukt nur in einem Fall [155]. Möglicherweise kommt es in den rekombinierten DNABereichen zur Bildung von stabilen Sekundärstrukturen, die eine Amplifikation verhindern. Weshalb der Effekt jedoch über mehrere Generationen anhält, ist mit dem heutigen genetischen Wissen nicht zu erklären. pok-KSα-Komplementierung nach Flp-Rekombination Das Komplementierungsplasmid pSET-P3,7kompl (s. 5.4.2.2) wurde mittels intergenerischer Konjugation in eine der Flp-Rekombinanten von S. diastatochromogenes Tü6028 ∆pok-KSα eingebracht. Das Genom der entstandenen Konjuganten sollte eine intakte Kopie eines jeden pok-Gens enthalten. Abweichend vom ersten Komplementierungsversuch sollten oriT und spec mit Promotor nicht mehr im pok-Cluster vorliegen. Falls die zuvor festgestellte, ausbleibende Komplementierung des pok-KSα-Gendefekts auf die DNA-Sequenz zwischen den beiden FRT-sites zurückzuführen ist, sollte die Polyketomycinproduktion nun einsetzen. Wie durch eine Produktionskontrolle bestimmt wurde, war dies der Fall. Aus der Beobachtung lässt sich ableiten, dass eine insertierte Redirect-Kassette auch einen negativen Effekt auf die Transkription nachgeschalteter Gene haben kann. Dies gilt zumindest, wenn der Promotor des Resistenzgens gegen die Leserichtung des Operons orientiert ist. 3.2.3 Biosynthesestudie mit S. diastatochromogenes Tü6028 ∆pok-KSα Durch Fütterung des Polyketomycinderivats POK-IP3 (s. Abb. 50) an S. diastatochromogenes Tü6028 ∆pok-KSα sollte bestimmt werden, ob die Substanz ein Intermediat von Polyketomycin ist oder als Shuntprodukt in einem Seitenast des Biosynthesewegs liegt, der nicht zum Polyketomycin führt. POK-IP3 wird von S. diastatochromogenes Tü6028 ∆pokOI ∆pokOII produziert [157]. Durch die Inaktivierung von zwei FAD abhängigen Monooxygenasen hat diese Mutante die Befähigung zur Produktion von Polyketomycin verloren. Der POK-IP3 enthaltende Ethylacetatextrakt einer 100 mL Kultur der Doppelmutante wurde in 200 µL DMSO gelöst und an S. diastatochromogenes Tü6028 ∆pok-KSα gefüttert. Nach Kultivierung unter Standardbedingungen (s. 5.3.1.4) wurde der Kulturextrakt (s. 5.11.1.1) per LC/MS analysiert (s. Abb. 49). Sollte POK-IP3 ein Intermediat der Polyketomycinbiosynthese sein, so wäre in S. diastatochromogenes Tü6028 ∆pok-KSα die Vorläufer vermittelte Komplementierung des Biosynthesewegs zum Polyketomycin zu erwarten. 79 Ergebnisse mAU 60 mAU Tü6028 Wildtyp Polyketomycin 150 0 220 300 400 500 nm 30 0 0 mAU 60 10 20 30 min. 10 20 30 min. 20 30 min. 20 30 min. ∆pok-KSα 30 0 0 mAU 60 mAU 15 ∆pokOI ∆pokOII 30 0 0 mAU 60 POK-IP3 0 220 300 400 500 nm 10 ∆pok-KSα + Extrakt von ∆pokOI ∆pokOII 30 0 0 10 Abb. 49: Absorptionschromatogramme bei λ = 430 nm (LC/MS-Analyse, Methode: antqui, s. 5.11.6). Auch über die Extraktion von MS-Diagrammen bei entsprechenden m/z-Werten lässt sich Polyketomycin nur im Extrakt des Wildtyps, POK-IP3 nur im Extrakt von S. diastatochromogenes Tü6028 ∆pokOI ∆pokOII nachweisen. In S. diastatochromogenes Tü6028 ∆pok-KSα wurde das gefütterte Derivat POK-IP3 abgebaut. Die Bildung von Polyketomycin oder dessen unglykosyliertem Vorläufer Polyketomycinon konnte durch die LC/MS-Analyse nicht nachgewiesen werden (s. Abb. 49, Zeile 4). Auch weitere Inhaltsstoffe des Extrakts von S. diastatochromogenes Tü6028 ∆pokOI ∆pokOII mit einer Retentionszeit zwischen 23 min und 30 min wurden abgebaut. Das Ergebnis legt nahe, dass die Pok-Biosyntheseenzyme von S. diastatochromogenes Tü6028 ∆pok-KSα nicht in der Lage sind auf das Derivat POK-IP3 als Polyketomycinvorläufer zurückzugreifen. Für POK-IP3 wird deshalb eine Rolle als Shuntprodukt vorgeschlagen (s. Abb. 50). 80 Ergebnisse H OH O 10 Acetateinheiten HO OH OH O 10 11 12 1 7 6 5 4 13 14 -H+ CH3 + +H OH OH O OH OH O D B C HO SAM PokMT2 OH OH OH OH O OH OH O OH O OH O CH3 OH CH3 [O] OH HO CH3 POK-IM3 OH OH O O OH O O OH OH CH3 CH3 HO H3C OH POK-IP3 OH OH SAH CH3 HO CH3 A H3CO CH3 Polyketomycin O OH H OR O Abb. 50: Getrennte Biosynthesewege zum Polyketomycin und zum Shuntprodukt POK-IP3. R: s. Abb. 8. SAM: S-Adenosyl-L-methionin, SAH: S-Adenosyl-L-homocystein. Studien an der Biosynthese von Oxytetrazyklin deuten darauf hin, dass die Methylierung an C-6 als früher Schritt unmittelbar nach der Cyclisierung der Polyketidkette stattfindet [158]. Für die Gruppenübertragung von S-Adenosyl-L-methionin (SAM) bedarf es der Aktivierung von C-6 durch eine Erhöhung der negativen Landungsdichte. Über die basenkatalysierte Deprotonierung von C-11 entsteht zunächst ein C-6-Carbanion. Ein nukleophiler Angriff von C-6 auf das CH3+-Äquivalent von SAM knüpft die neue C-C-Bindung. Über Keto-EnolTautomerie kommt es zur Rearomatisierung von Ring C. Ein hier intermediär vorliegendes C-6-Carbanion begünstigt die Hydroxylierung zur Bildung von POK-IP3. Analog zu Zhang et al. (2007) [158] könnte es sich um eine spontane Reaktion mit Luftsauerstoff handeln. Wie auch aus dem Ergebnis des Fütterungsexperiments geschlossen ist POK-IP3 demnach kein Vorläufer von Polyketomycin, sondern ein Shuntprodukt. Interessanterweise konnte POK-IP3 bisher nur im Extrakt der Mutante mit Gendefekt in ∆pokOI und ∆pokOII nachgewiesen werden, nicht jedoch im Wildtyp. Dies zeigt die Effektivität des "Teamwork" der an der Synthese von PKS II-Metaboliten beteiligten Enzyme. Es ist anzunehmen, dass die hypothetische Vorstufe POK-IM3 im Wildtyp durch gezielte Übertragung auf PokOI und PokOII oder sogar durch direkte Beteiligung der Monooxygenasen am PKSMultienzymkomplex einer spontanen Oxidation zu POK-IP3 entzogen wird. Dies würde bedeuten, dass es sich bei PokOI und PokOII nicht um Post-PKS-Enzyme handelt. 81 Ergebnisse 3.2.4 S. diastatochromogenes Tü6028 ∆pok-KSα als Expressionswirt Mit S. diastatochromogenes Tü6028 ∆pok-KSα wurde eine Mutante generiert, in deren Kulturextrakten keine Pigmente enthalten sind, die chromatographisch mit PKS II-Metaboliten interferieren. Bei der Absorptionswellenlänge λ = 430 nm wird eine Nulllinie erhalten (s. Abb. 49), bei λ = 254 nm treten ausschließlich Peaks mit einer Höhe von wenigen mAU auf. Damit sind ideale Bedingungen zur Detektion neuer Substanzen bei der Expression stammfremder Gene geschaffen. Unter 3.3.5.1 wurde gezeigt, dass durch die Integration von Cos2 (msn-Cluster) in das Genom von S. albus die Produktion von Didesmethylmensacarcin ausgelöst wird. Cos2 erschien geeignet für einen ersten Test von S. diastatochromogenes Tü6028 ∆pok-KSα als heterologer Wirt. Dazu wurde analog zu 3.3.5.1 vorgegangen. Auch in S. diastatochromogenes Tü6028 ∆pok-KSα kam es mit Cos2 zur Produktion von Didesmethylmensacarcin, was die Eignung als Wirt zeigt. 3.2.5 Polymorphismus von S. diastatochromogenes Tü6028 Bei der intergenerischen Konjugation mit S. diastatochromogenes Tü6028 wurde das Auftreten unterschiedlich gefärbter Kolonien beobachtet. Daraufhin wurde auch der Wildtyp des Stammes, welcher üblicherweise mit grauen Sporen bedeckte Kolonien (Phänotyp GR) bildet, auf unterschiedliche Phänotypen hin untersucht. Abweichend von der typisch grauen Sporenfarbe zeigten etwa 10 % der ausgeeinzelten Wildtyp-Kolonien keine Sporenbildung (Phänotyp OS) und wiesen eine rot-braune Färbung auf. Kolonien mit weißen Sporen traten nur sehr selten auf (2 - 5 Kolonien/Agarplatte, ∅ = 9 cm). Zwei unterschiedliche Kolonien mit weißen Sporen wurden isoliert (WS-R, WS-L). A B Abb. 51: Phänotypen von S. diastatochromogenes Tü6028 auf HA-Agar. A: oben links: WS-L; oben rechts: OS; unten links: GR; unten rechts: WS-R. B: Von der anderen Seite der Agarplatte lässt sich durch die intensiv orange Färbung des WS-R-Myzels die starke Polyketomycinproduktion dieses Phänotyps erkennen. 82 Ergebnisse Um der Frage nachzugehen, ob es sich tatsächlich um unterschiedliche Erscheinungsbilder von S. diastatochromogenes Tü6028 oder eine Kontamination mit anderen ActinomycetalesArten handelt, und um gleichzeitig einen möglichen Zusammenhang mit der Polyketomycinproduktion aufzudecken, wurden einzelne Kolonien der unterschiedlichen Phänotypen zur Produktion angezogen. Die Kulturextrakte (s. 5.3.1.4 und 5.11.1.1) wurden per HPLC untersucht (Methode: pok, s. 5.11.4). Der Extrakt von S. diastatochromogenes Tü6028 OS wies eine nur gering vom häufigsten Phänotyp (GR) abweichende Polyketomycinkonzentration auf. Die Konzentrationen bei den zwei Phänotypen mit weißen Sporen (WS-R, WS-L) unterscheiden sich deutlich. Während WS-R eine 600 %ige Überproduktion zeigt, konnte Polyketomycin in Extrakten von WS-L nicht nachgewiesen werden. Die Beobachtung wird unter 4.4 diskutiert. % 700 600 500 400 300 200 100 0 GR WS-R WS-L OS Abb. 52: Relative Polyketomycinkonzentration (HPLC, AUC440nm) in Extrakten der S. diastatochromogenes Tü6028 Phänotypen im Vergleich, bezogen auf den Phänotyp mit grauen Sporen (GR). WS-R / WS-L: Phänotypen mit weißen Sporen, OS: Phänotyp ohne Sporen. Die Stabilität des Erscheinungsbildes und des Produktionsverhaltens wurde untersucht. Dazu wurden alle Phänotypen über drei Passagen nach dem Schema [Agarkultur mit Sporen→ Agarkultur mit Sporen→ Agarkultur mit Sporen] auf Beibehaltung ihres Erscheinungsbildes überprüft. Es konnte in keinem Fall eine Abweichung vom ursprünglichen Erscheinungsbild festgestellt werden, obwohl zwischen der ersten und zweiten Passage etwa zwei Jahre lagen. Der weiße Sporen bildende Überproduzent S. diastatochromogenes Tü6028 WS-R wurde zur Generierung von S. diastatochromogenes Tü6028 ∆pok-KSα eingesetzt (s. 3.2.2). Auch nach der Inaktivierung und den damit verbundenen Passagen bildete die aus dem WS-R Phänotyp entstandene Mutante stets nur weiße Sporen. Mit Agarkulturen der dritten Passage wurden Produktionskontrollen in HA-Flüssigmedium angesetzt und die Extrakte chromatographisch untersucht. Das AUC-Verhältnis des Polyketomycinpeaks von GR zu WS-R wurde mit 1:6 bestätigt, WS-L und OS glichen sich der Produktion von GR an. Damit konnte für WS-L die Identität als S. diastatochromogenes Tü6028 bestätigt werden. Mit dem Phänotyp WS-R konnte ein stabiler Polyketomycinüberproduzent gewonnen werden. Ergebnisse 3.3 83 Funktionelle Charakterisierung dreier PKS II-Biosynthesegencluster des Mensacarcinproduzenten S. sp. Gö C4/4 3.3.1 Anzucht und Sekundärstoffanalytik von S. sp. Gö C4/4 Parallel zu den Arbeiten von Dr. M. Arnold (AK Zeeck, Göttingen) wurde im Jahr 2002 von A. Prestel im Arbeitskreis Bechthold (Freiburg) die Suche nach dem Mensacarcinbiosynthesegencluster begonnen. Die in Göttingen mit S. sp. Gö C4/4 erreichte Mensacarcinproduktion ließ sich in Freiburg nicht reproduzieren [159]. Vor einer genetischen Charakterisierung des Stammes galt es deshalb die Produktion sicherzustellen und die Anzuchtbedingungen zu standardisieren. Ein Vergleich der verwendeten Hafermedien zur Mensacarcinproduktion zeigte, dass bei den fehlgeschlagenen Freiburger Versuchen Kobalt(II)- und Mangan(II)-Ionen fehlten [56;160]. Bezüglich des Hafers lagen von unserem Kooperationspartner Combinature Biopharm AG (Berlin) weitere Informationen vor. Dort wurde erfolgreich Holo Bio Hafergold, ein Vollkornhafermehl, eingesetzt (s. Tab. 30). Mit Holo Bio Hafergold und vorhandenen Salzen wurde das Hafermedium von Combinature möglichst genau nachgestellt (s. Tab. 27). 100 mL Kulturmedium wurden mit 1 cm2 einer an dieser Stelle vollständig bewachsenen HA-Agarplatte angeimpft, für sechs Tage bei 28 °C auf dem Rundschüttler (180 rpm) inkubiert und anschließend mit Ethylacetat extrahiert (s. 5.3.1.4 und 5.11.1.1). Bereits der erste Produktionsversuch war erfolgreich. Der Hauptpeak des 254 nm-Chromatogramms der LC/ESI-MS-Analyse (s. Abb. 53) konnte mit von Dr. M. Arnold erhaltener Referenzsubstanz über Vergleich von Retentionszeit, UV/VIS-Absorptions- und Massenspektrum der Substanz Mensacarcin (MSN) zugeordnet werden. Durch weitere Experimente wurde festgestellt, dass die für andere Stämme zur Sekundärstoffproduktion übliche Animpfmethode aus einer 25 % Saccharosedauerkultur (s. 5.3.1.4) nicht zur Mensacarcinproduktion führt. Kolonien von S. sp. Gö C4/4 zeigen auf HA-Agar einen dunklen Produktionshof. HA-Flüssigkulturen beginnen sich nach drei Tagen grau zu färben, nach sechs Tagen ist die Kulturbrühe schwarz. Diese Beobachtung lässt auf die Produktion eines Pigments schließen. Daraufhin wurde das Produktionsspektrum des Stammes in HA-Medium analysiert (Standardbedingungen, s. 5.3.1.4). Überraschenderweise kam es im HA-Medium zu einer Mensacarcinproduktion, vergleichbar mit der in Hafermedium. HA-Medium ist ein Standardmedium zur Kultivierung von Streptomyces spp., einfach in der Herstellung und unkompliziert bei der Extraktion, da es im Gegensatz zum Hafermedium nicht als Suspension, sondern als Lösung vorliegt. Alle weiteren Produktionskontrollen wurden folglich mit HA-Medium durchgeführt. 84 Ergebnisse Die Schwarzfärbung des Mediums durch S. sp. Gö C4/4 ist nicht auf Mensacarcin oder seine Vorläufer zurückzuführen, da sie auch bei Produktionskontrollen von Nullmutanten auftrat (s. 3.3.5.2). Vielmehr handelt es sich bei dem dunklen Pigment vermutlich um Melanin, das von den meisten Streptomyces spp. unter bestimmten Bedingungen produziert wird [161]. Das HPLC-Chromatogramm in Abb. 53 gibt das typische Produktionsprofil einer Standardanzucht (s. 5.3.1.4) von S. sp. Gö C4/4 in HA-Medium wieder. In der Dissertation von Dr. M. Arnold [56] werden drei natürliche Mensacarcinderivate beschrieben: Didesmethyldihydro-MSN, Didesmethyl-MSN, 10-O-Desmethyl-MSN. Nach einer Schüttelkultivierung mit einer Dauer von sechs Tagen lässt sich ein Monodesmethylderivat von Mensacarcin über sein UV/VIS-Absorptions- und Massenspektrum identifizieren (s. Abb. 53). Als typisches Addukt der Mensacarcinderivate tritt im positiven Detektionsmodus [2M+Na]+ als häufigstes Ion auf, auch [M+Na]+ und [M+K]+ sind meist detektierbar. Im negativen Modus dominieren die Signale [M−H]− oder [M+Cl]−. 16 mAU 17 OMe OMe OH O OH O 10 1 254 nm MSN 600 Desmethyl-MSN 400 200 20 10 14 15 O OH Mensacarcin (MSN) * 0 0 4 6 * 11 O 30 40 min. Abb. 53: HPLC-Chromatogramm eines Ethylacetatextrakts von S. sp. Gö C4/4 in HA-Medium. Peaks mit Mensacarcin ähnlichem UV/VIS-Absorptionsspektrum (vgl. Abb. 54), jedoch unbekannter Masse sind mit * gekennzeichnet (Methode: mens03, s. 5.11.6). int. [%] 100 mAU 231 1200 + [2M+Na] 863 80 266 800 60 int. [%] 100 80 60 - [M-H] 419 - [M+Cl] 455 + 40 328 400 20 0 250 300 350 400 nm 20,4 min: Mensacarcin (MSN) 0 + [M+Na] 443 420 450 [M+K] 459 40 20 840 870 m/z ESI-MS, pos. Modus 0 420 450 480 m/z ESI-MS, neg. Modus Abb. 54: UV/VIS-Absorptions- und ESI-Massenspektren von Mensacarcin (C21H24O9, Mr: 420,41). Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 53). 85 Ergebnisse int. [%] 100 mAU 228 120 [2M+Na] 835 80 80 60 0 + [M+K] 40 [M+Na] 445 429 20 326 250 300 350 400 nm 15,8 min: Desmethyl-MSN 0 437 60 + 40 - [M-H] 405 - 265 80 int. [%] 100 + 420 450 810 40 377 [M+Cl] 441 413 20 0 840 m/z ESI-MS, pos. Modus 390 420 450 m/z ESI-MS, neg. Modus Abb. 55: UV/VIS-Absorptions- und ESI-Massenspektren von Desmethylmensacarcin (C20H22O9, Mr: 406,38). Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 53). Im Massenspektrum des negativen Modus werden die Signale der Desmethylmensacarcin-Ionen durch eine im Chromatogramm nicht in Erscheinung tretende Substanz der Masse 378 überlagert: m/z = 377: [M−H]− ; m/z = 413: [M+Cl]− . Zusätzlich tritt m/z = 437 auf. Durch Variation der Zusammensetzung des Kulturmediums im Sinne des OSMAC (one strain - many compounds) Ansatzes [162] konnte Dr. M. Arnold zeigen, dass ein Zusatz von 2 - 5 % DMSO im Nährmedium zur Produktion von zwei neuen Metaboliten führt. Sie konnten als Mensalon [58] und Aloesol [59;60] identifiziert werden. Dies sollte in Freiburg reproduziert werden. Beide Substanzen besitzen die Summenformel C13H14O4 und eine exakte Masse von 234,09. In Einklang damit konnte in HA-Medium mit 2 % DMSO per LC/ESI-MS die Produktion zweier Substanzen mit korrespondierenden MS-Signalen festgestellt werden (s. Abb. 56). Die Maxima der korrespondierenden UV/VIS-Absorptionsspektren passen zu den Literaturwerten von Mensalon und Aloesol [56]. Die Zuordnung des UV-Peaks bei 12,8 min zu Mensalon konnte durch von Prof. Dr. A. Zeeck (Göttingen) erhaltene Referenzsubstanz bestätigt werden. mAU 254 nm Mensalon Aloesol MSN 600 400 200 0 0 10 20 30 40 min. Abb. 56: Chromatogramm aus der LC/ESI-MS-Analyse eines Ethylacetatextrakts von S. sp. Gö C4/4 in HAMedium mit 2 % DMSO (Methode: mens03, s. 5.11.6). 86 Ergebnisse int. [%] 100 mAU 276 800 80 600 int. [%] 100 + [M+H] 235 80 60 60 40 40 200 20 20 0 0 400 250 300 350 400 nm 12,8 min: Mensalon mAU 800 80 292 600 400 200 0 250 300 350 14,2 min: Aloesol 400 nm m/z ESI-MS, pos. Modus int. [%] 100 226 244 250 210 240 270 300 0 int. [%] 100 + [M+H] 235 80 60 40 40 20 20 210 240 270 300 - 210 240 270 300 m/z ESI-MS, neg. Modus 60 0 [M-H] 233 m/z ESI-MS, pos. Modus 0 - [M-H] 233 - [M+Cl] 269 210 240 270 300 m/z ESI-MS, neg. Modus Abb. 57: UV/VIS-Absorptions- und ESI-Massenspektren von Mensalon und Aloesol (je C13H14O4, Mr: 234,25). Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 56). Bestimmung von Selektionsmarkern für S. sp. Gö C4/4 Für die geplanten molekularbiologischen Arbeiten mit S. sp. Gö C4/4 waren geeignete Selektionsmarker (zum Beispiel Antibiotikaresistenzgene) notwendig. Analog zu 3.2.1.3 wurde der Stamm auf natürliche Resistenz gegen übliche Antibiotika unterschiedlicher Konzentrationen überprüft. Alle getesteten Antibiotika (Apramycin, Hygromycin, Spectinomycin) erwiesen sich in einer Konzentration von jeweils 100 µg/mL als geeignet. Hier war auch nach achttägiger Inkubation bei 28 °C kein Koloniewachstum auf HA-Agar feststellbar. Apramycin ist als sicheres Selektionsantibiotikum bekannt. Bei den meisten Streptomyces spp. führt es bereits in Konzentrationen von 25 - 50 µg/mL zum Absterben von Zellen ohne Apramycinphosphotransferasegen. S. sp. Gö C4/4 hingegen zeigte bei 50 µg/mL noch vereinzeltes Koloniewachstum. Aufgrund dieser Besonderheit des Stammes wurde zur Selektion stets 100 µg/mL Apramycin eingesetzt. Ergebnisse 87 3.3.2 Analyse des msc-Clusters (Synthese der Substanzen MSC-X) 3.3.2.1 Zusammenfassung vorangegangener Arbeiten, Analyse der Datenlage Ziel der molekularbiologischen Analyse des Stammes S. sp. Gö C4/4 war die Identifikation des Mensacarcinbiosynthesegenclusters. Fütterungen mit markierten Vorläufern hatten die biogenetische Herkunft des Grundgerüstes aus Acetateinheiten nahegelegt [56]. Als aromatisches Polyketid ist Mensacarcin vermutlich einer Polyketidsynthase vom Typ II (PKS II) zuzuordnen [23]. Eine Recherche in den bisher veröffentlichten vollständigen Genomsequenzen von Streptomyces spp. [69-71] zeigt, dass PKS II-Gencluster mit einer genomweiten Häufigkeit von 1 - 3 selten sind (vgl. 4.5.1). Es schien somit vielversprechend, das Mensacarcinbiosynthesegencluster über die Lokalisierung von PKS II-Genen im Genom des Produzenten ausfindig zu machen. In Zusammenarbeit mit Combinature Biopharm wurde hierzu mit dem Vektor pOJ436 eine Cosmidbank von S. sp. Gö C4/4 angelegt und mit stammspezifischen Gensonden gescreent [160]. Die Sonden wurden durch Amplifikation mit degenerierten Primern auf genomischer DNA des Stammes hergestellt. 20 Cosmide zeigten ein signifikantes Hybridisierungssignal und wurden deshalb für weitere Untersuchungen herangezogen. Über Restriktionskartierungen wurde von A. Prestel im Jahr 2002 eine erste Einteilung der Cosmide in drei Gruppen überlappender Sequenzen vorgenommen [160]. Die Ansequenzierung (s. 5.6.2.1) von Subklonen (s. 5.5.5.2) eines Cosmids jeder Gruppe diente 2002 als Entscheidungsgrundlage für die Auswahl eines Cosmids, auf dem das Mensacarcinbiosynthesegencluster vermutet wurde, zur vollständigen Sequenzierung. 18 Sequenzen von Cos4 (Gruppe 1), 4 Sequenzen von Cos12 (Gruppe 2) und 4 Sequenzen von Cos18 (Gruppe 3) konnten von A. Prestel gewonnen werden. Alle angenommenen Genprodukte von DNA-Sequenzen der Gruppe 1 können über Datenbankvergleiche dem Sekundärstoffwechsel zugeordnet werden. Die putativen Proteine der Gruppe 2 stammen aus dem Primärmetabolismus und in Gruppe 3 wurde nur ein Genprodukt mit Ähnlichkeit zu einem Protein aus dem Sekundärstoffwechsel gefunden: dabei handelt es sich um MmcR, eine O-Methyltransferase aus Streptomyces lavendulae [163] (vgl. 3.3.5.4). Im Jahr 2002 wurde von A. Prestel und Prof. Dr. A. Bechthold das Cosmid 4 (Gruppe 1) zur vollständigen Sequenzierung ausgewählt. Mit den Ergebnissen einer Cosmidsequenzierung mit 6,5-facher Abdeckung konnten sechs Bereiche kontinuierlicher DNA-Sequenz (Contigs) assembliert werden [160]. Zum Ringschluss der Cosmidsequenz waren noch sechs Lücken in der Sequenz zu schließen. Diese Arbeit wurde von Dr. U. von Mulert (AK Bechthold) begonnen und resultierte in einer vorläufigen Sequenz des msc-Clusters. Aufgrund von Ähnlichkeiten der abgeleiteten Genprodukte zu Enzymen aus der Biosynthese verwandter Naturstoffe, wie Enzymen der Nogalamycinbiosynthese, wurde das Cluster von Cos4 zunächst der Mensacarcinbiosynthese zugeordnet [160]. Die Zuordnung konnte nicht bewiesen werden. 88 Ergebnisse 3.3.2.2 Sequenzvervollständigung des msc-Contigs Vor Beginn der molekularbiologischen Arbeiten mit dem msc-Contigs sowie im Hinblick auf eine Veröffentlichung galt es, die DNA-Sequenz, bestehend aus sechs Contigs, zu vervollständigen. Um Fehler bei der nun fünf Jahre zurückliegenden Aufstellung der Contigs auszuschließen wurde die Assemblierung ausgehend von den Rohdaten [160] der Cos4-Sequenzierung wiederholt. Dazu wurde das Programm Seqman aus dem LasergenePaket der Firma DNASTAR verwendet (s. 5.14). Die so erhaltenen Subcontigs entsprachen denen aus der Diplomarbeit von A. Prestel. Es konnte begonnen werden, die Sequenzlücken zu schließen. Die Bestimmung der Lage der Subcontigs zueinander gelang über die Identifizierung von "mate-pairs" und dem Einsatz von Lückenprimern. *10KB - 2,7KB - 3,9KB - 1,2KB - 24KB - 3,2KB - Vektor Abb. 58: Lage der sechs Subcontigs des msc-Contigs auf Cos4 als Ergebnis der Identifizierung von "mate-pairs" und dem Einsatz von Lückenprimern. Die Namen der Contigs entsprechen dabei ihrer ungefähren Größe in kb. * Das Contig 10KB enthält den Übergang vom Insert zum Cosmidvektor pOJ436. Der Übergang von der rechten Seite des Inserts liegt in einer Lücke. Mate-pairs sind die beiden Sequenzen, die vom gleichen, bidirektional abgelesenen Subklon (s. 5.5.5.2) stammen. Durch die Analyse der Anordnung dieser mate-pairs zueinander können Sequenzabschnitte (Contigs) über Lücken miteinander verbunden werden. Mit mate-pairs konnten bereits die folgenden Contigs aneinandergereiht werden: Tab. 8: Contigverbindungen über mate-pairs. Contigverbindung 10KB - 2,7KB 2,7KB - 1,2KB 1,2KB - 24KB 24KB - 3,2KB Subklonname (s. Tab. 36) pBSK4.48 (BamHI, 9,1 kb) pBSK4.19 (BamHI, 6,6 kb) pBSK4.27 (BamHI, 7,1 kb) pBSK4.1 (BamHI, 1,7 kb) Insertgröße* 8842 bp 6106 bp 6565 bp 1723 bp 3,2KB - Vektor C4Sac6,1 (SacI, 6,1 kb) 6062 bp Lückengröße* 374 bp 4225 bp 25 bp −5 bp (Überlappung) 50 bp *Die exakten Größen ließen sich erst nach Erhalt der vollständigen msc-Clustersequenz ermitteln. Eine erste Größenabschätzung für das Insert und daraus folgend für die Lücke erfolgte aufgrund von Restriktionsanalysen (s. 5.5.4.1) der Subklone. Zur Einreihung des Contig 3,9KB standen keine direkten mate-pairs zur Verfügung. Als einzige Platzierung blieb nach obiger Tabelle die Einreihung zwischen den Contigs 2,7KB und 1,2KB. Eine Aussage über die Orientierung des Contigs 3,9KB war aber nicht möglich. So genannte Lückenprimer sollten im Folgenden die Orientierung der Contigs zueinander absichern. Lückenprimer wurden 50 - 200 bp vom Ende der Contigs entfernt von beiden Strängen abgeleitet. Gemäß der erwarteten relativen Lage der Contigs kombinierte man die 89 Ergebnisse Primer zu unterschiedlichen Paaren und setzte mit Cos4 als Matrize eine PCR an (s. 5.6.3.3). Der Erhalt eines PCR-Produkts war ein Hinweis darauf, dass die eingesetzten Primer auf komplementären Strängen des Cos4 in 5'→3'-Richtung zueinander hin orientiert binden. Erfolgreiche Primerkombinationen sind in Tab. 9 gelistet. Tab. 9: Contigverbindungen über PCR mit Lückenprimern. Lücke zwischen Contig 10KB 2,7KB 3,9KB 1,2KB 24KB - Primerpaar, das auf Cos4 zu einem PCR-Produkt führt Lcke4R / Lcke4aR Lcke5F / Lcke4F Lcke3R / Lcke2R Lcke1R / Lcke3F Lcke2F / Lcke1aF 2,7KB 3,9KB 1,2KB 24KB 3,2KB Größe des PCR-Produkts* 594 bp 179 bp 438 bp 192 bp 111 bp * Berechnete Größen auf Basis der vollständigen msc-Clustersequenz. Diese entsprechen, wie aus Abb. 59 hervorgeht, denen der tatsächlich erhaltenen PCR-Produkte. 10 kb 8 kb 6 kb 5 kb 4 kb 3 kb 2,5 kb 2,0 kb 1,5 kb 1,0 kb 0,75 kb Primer 1: Lcke4R / Lcke4aR 2: Lcke5F / Lcke4F 3: Lcke3R / Lcke2R 4: Lcke2F / Lcke1aF 5: Lcke1R / Lcke3F L: Promega 1kb Leiter 0,50 kb 1 L 0,25 kb 2 3 4 5 L Abb. 59: Ergebnis der PCR-Analyse von Cos4 (msc-Cluster) mit den Lückenprimern. Mit den abgebildeten fünf Primerkombinationen ließ sich die relative Lage der sechs Contigs zueinander bestimmen. Mit den über die Lückenprimer gewonnen Informationen wurde die Orientierung des Contigs 3,9KB festgelegt. Sie ist der von A. Prestel [160] vorgeschlagenen Orientierung umgekehrt komplementär. Die PCR-Produkte wurden über TA-Klonierung (s. 5.5.5.3) in den Vektor pGEM-T Easy eingebracht und mit Standardprimern ansequenziert (s. 5.6.2.1). Ein ergänzendes Primerwalking (s. 5.6.2.2) auf entsprechenden Subklonen oder Cos4 sicherte mehrere Sequenzbereiche des msc-Clusters ab. Die Verbindung des Contigs 3,2KB mit dem Cosmidvektor gelang über Primerwalking mit dem Primer L1F (s. 5.6.3.3) auf dem Subklon C4Sac6,1 (s. 5.4.2.4, Tab. 36). Das Resultat der Arbeiten war die vollständige DNA-Sequenz des Cos4-Inserts. 90 Ergebnisse 3.3.2.3 Sequenzanalyse des msc-Contigs Das Cos4-Insert umfasst 44,0 kb mit einem durchschnittlichen G+C-Gehalt von 72,6 mol %. Die Festlegung von offenen Leserahmen (ORFs) und deren Annotierung erfolgte mit der Frameplot-Funktion der Artemis Software (s. 5.14), der Identifizierung von Ribosomenbindungsstellen, Start- und Stoppcodons, sowie einem Sequenzabgleich mit der NCBIDatenbank (s. 5.14). Auf diese Weise wurden 39 ORFs definiert (s. Abb. 60, Tab. 10), die in zwei Bereiche geteilt werden können. Biosynthese eines Exopolysaccharids Der Bereich von msc1 bis msc10 ist eine fast perfekte Kopie aus dem ste-Cluster, das für die Biosynthese des Exopolysaccharids Ebosin in Streptomyces sp. 139 verantwortlich gemacht wird [164]. Interessanterweise befindet sich auch auf dem Chromosom des Modellstamms Streptomyces coelicolor A3(2) ein äquivalenter Abschnitt mit identischer Abfolge der Gene [70]. Biosynthese eines PKS II-Metaboliten Der Bereich von msc12 bis msc38, möglicherweise auch bis msc39, ist ein PKS IIBiosynthesegencluster. Die minimale PKS (KSα / KSβ / ACP) wird durch die in typischer Weise hintereinander geschalteten Gene msc14 / msc15 / msc16 codiert. Die Anwesenheit von msc13 und msc17 (AT, KS) ist ein Hinweis auf eine alternative Startereinheit der Polyketidbiosynthese [23]. Abgeleitete Genprodukte mit Ähnlichkeit zu 3-Ketoacyl-(ACP)Reduktasen (msc26, msc38) sowie mit Ähnlichkeit zu Cyclasen / Aromatasen (msc12, msc25, msc29) würden die PKS vervollständigen. Zahlreiche, aus dem msc-PKS II-Cluster abgeleitete Proteine mit Ähnlichkeit zu Oxidoreduktasen könnten zu Modifikationen des Polyketidgrundgerüsts führen. Msc21 / 22 weisen Parallelen zum Oxygenierungssystem der bakteriellen Luciferase auf. Auch die Sequenz von Msc32 lässt sich mit dem Konsensus der Proteinfamilie Luciferase ähnlicher Monooxygenasen Pfam00296 (Protein Family, s. 5.14) in Deckung bringen. Enzyme dieser Familie werden unter 3.3.5.4 analysiert. Ein Genprodukt (Msc27) mit Pfam03392-Domäne (antibiotic biosynthesis monooxygenases) kann aufgrund seiner Sequenzlänge von etwa 100 AS zu den Anthronoxygenase ähnlichen Enzymen gezählt werden [165]. Msc37 teilt unter anderem 37 % identische Aminosäuren mit der FAD abhängigen Oxygenase ElmG, die die Dreifachhydroxylierung von Tetracenomycin (TCM) A2 zu TCM C katalysiert [166]. Zwei Proteine (Msc35, Msc46) haben Ähnlichkeit zu NADPH:Chinonreduktasen und Enoylreduktasen wie beispielsweise ActVI-ORF2 [167], Med-ORF9 [168], GrhO7 [169]. Im msc-PKS II-Cluster liegen zwei Gene (msc24, msc30), die aufgrund von Sequenzvergleichen für Biosyntheseweg spezifische Regulatoren der SARP-Familie (s. 3.3.2.6) codieren könnten. Zusätzlich werden drei weitere mögliche Regulatoren codiert (Msc31, Msc33, Msc39). Msn34 hat Ähnlichkeit zu Exportproteinen und könnte eine Rolle in der Eigenresistenz von S. sp. Gö C4/4 gegen die 91 Ergebnisse MSC-Metaboliten spielen oder für deren Sekretion verantwortlich sein. Gleiches gilt für das von msc18 - 20 codierte ABC-Transportsystem. Die vom msc-PKS II-Cluster codierten Proteine lassen sich gut mit den für die Mensacarcinbiosynthese erwarteten Enzymen in Einklang bringen. Das Fehlen eines Methyltransferasegens zeigt an, dass es sich zumindest nicht um das vollständige Mensacarcinbiosynthesegencluster handeln kann. minimale PKS Das msc-Contig PKS Startereinheit Oxidoreduktasen 1 2 3 4 5 6 7 8 9 10 12 Cyclasen 12 16 15 14 13 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0kb 5kb 10kb 15kb 31 20kb Regulatoren Aminotransferase Transporter Membranprotein Zuckersynthese / Transfer unbekannt 32 33 34 35 36 37 25kb 38 40 39 30kb Abb. 60: Physikalische Karte des msc-Contigs. Suche nach Anschlusscosmiden, Begrenzung des msc-PKS II-Clusters Der linke (lt. Abb. 60) Rand des msc-PKS II-Clusters wird durch den Beginn des Exopolysaccharidbiosynthesegenclusters definiert. Die rechte Begrenzung des msc-Contigs stellen die beiden ORFs msc40 und msc39 dar. Ob diese auch den Rand des PKS II-Clusters festlegen, sollte bestimmt werden. Über PCR mit dem Primerpaar Ansch-F / -R (s. 5.6.3.3) wurde das Cosmid Cos9 (vgl. 3.3.3) als einziges Anschlusscosmid für den rechten Rand des Contigs identifiziert. Mit mehreren Primerwalkingschritten (s. 5.6.2.2) wurde die Sequenz von msc39 vervollständigt und die angrenzende Sequenz auf 2,4 kb Länge erschlossen. Auf einen vermutlich nicht codierenden 0,7 kb langen Bereich folgt ein ORF, der mit Msc39 58 % identische und 71 % ähnliche Aminosäuren teilt. Das abgeleitete Protein wurde Msc41 genannt und in Tab. 10 integriert. Auf Msc41 folgt noch 1 kb bekannte DNA-Sequenz. Mit der BLAST-Abfrage wurden abschnittsweise Ähnlichkeiten zu Proteinen aus unterschiedlichen Organismen aufgedeckt, unter anderem zu verschiedenen hypothetischen Proteinen von Streptomyces sp. Mg1 [170]. Das letzte Gen mit eindeutigem Bezug zum PKS II-Metabolismus (msc38) liegt 4,7 kb vom Rand des durch die Sequenzierung erschlossenen Bereichs entfernt. Es ist deshalb davon auszugehen, dass das msc-PKS II-Cluster vollständig sequenziert wurde. 92 Ergebnisse Tab. 10: Liste der auf dem msc-Contig identifizierten Gene unter Angabe der auf Ähnlichkeitsvergleichen basierenden vorgeschlagenen Proteinfunktionen. Die Nummerierung erfolgte in Anlehnung an die Diplomarbeit von A. Prestel [160]. Msc Größe [AS] vorgeschlagene Funktion Aminosäuresequenz-Ähnlichkeiten 1 411 Methyltransferase 2 264 3 214 Transferase, möglicherweise zur Zuckeraktivierung unbekanntes Protein 4 341 Zuckerepimerase / Dehydratase 5 423 unbekanntes Protein 6 429 Membranprotein 7 315 Glykosyltransferase 8 416 unbekanntes Protein 9 183 Zuckerepimerase 65 / 76 85 / 91 10 441 Aminotransferase 84 / 91 88 / 94 identisch / positiv [%] 90 / 95 89 / 94 92 / 94 90 / 94 86 / 93 84 / 92 89 / 94 91 / 95 86 / 94 85 / 93 81 / 86 81 / 88 91 / 94 91 / 94 77 / 85 88 / 92 (11) 12 315 54 / 67 89 Cyclase / Dehydratase ACP 16 15 408 KSβ 64 / 74 14 422 KSα 73 / 83 13 17 18 343 353 321 55 / 63 55 / 68 47 / 66 19 249 20 319 Acyltransferase KS für Starteinheit ABC-Transporter: Substratbindungsprotein ABC-Transporter: ATP-Bindungsprotein ABC-Transporter: Permease 58 / 72 angenommene Proteinfunktion (Herkunft), NCBI accession number, Referenz SCO0392 (Streptomyces coelicolor A3(2)), NP_624714, [70] Ste16 (Streptomyces sp. 139), AAN04241, [164] SCO0393 (Streptomyces coelicolor A3(2)), NP_624715, [70] Ste17 (Streptomyces sp. 139), AAN04242, [164] SCO0394 (Streptomyces coelicolor A3(2)), NP_624716, [70] Ste18 (Streptomyces sp. 139), AAN04243, [164] SCO0395 (Streptomyces coelicolor A3(2)), NP_624717, [70] Ste19 (Streptomyces sp. 139), AAN04244, [164] SCO0396 (Streptomyces coelicolor A3(2)), NP_624718, [70] Ste20 (Streptomyces sp. 139), AAN04245, [164] SCO0397 (Streptomyces coelicolor A3(2)), NP_624719, [70] Ste21 (Streptomyces sp. 139), AAN04246, [164] SCO0398 (Streptomyces coelicolor A3(2)), NP_624720, [70] Ste22 (Streptomyces sp. 139), AAN04247, [164] SCO0399 (Streptomyces coelicolor A3(2)), NP_624721, [70] Ste22b (Streptomyces sp. 139), BAD89170, [164] SCO0400 (Streptomyces coelicolor A3(2)), NP_624722, [70] Ste23 (Streptomyces sp. 139), BAD89171, [164] SCO0401 (Streptomyces coelicolor A3(2)), NP_624723, [70] Ste24 (Streptomyces sp. 139), BAD89172, [164] keine signifikanten Übereinstimmungen, ein ORF lässt sich nicht festlegen, der G+C-Frameplot weist jedoch auf einen codierenden Bereich hin Tfu_1222 (Thermobifida fusca YX), YP_289283, [171] CmmS (Streptomyces griseus subsp. griseus), CAE17520, [172] Ara-ORF10 (Streptomyces echinatus), ABL09958, [54] Ara-ORF11 (Streptomyces echinatus), ABL09959, [54] AknF (Streptomyces galilaeus), AAF70110, [173] CosE (Streptomyces olindensis), ABC00733, [174] SACE_3967 (Saccharopolyspora erythraea NRRL 2338), YP_001106163, [175] 60 / 75 SCO5258 (Streptomyces coelicolor A3(2)), NP_629404, [70] 62 / 74 SACE_3966 (Saccharopolyspora erythraea NRRL 2338), YP_001106162, [175] Ergebnisse Msc Größe [AS] vorgeschlagene Funktion 21 354 22 172 Luciferase ähnliche Oxidoreduktase Flavinreduktase 23 375 24 269 25 301 26 238 27 100 28 363 29 161 30 274 31 1112 32 342 33 153 34 512 35 298 36 325 37 533 38 271 40 432 39 241 41 243 Aminosäuresequenz-Ähnlichkeiten identisch / positiv [%] 53 / 69 47 / 57 möglicherweise Phosphotransferase Regulator, SARP-Familie Cyclase (2. Ring) 45 / 58 Ketoacyl-(ACP)Reduktase Monooxygenase, Anthronoxygenase ähnlich Oxidoreduktase, zinkbindend, NADPH:Chinonreduktase oder Enoylreduktase Cyclase 39 / 60 Regulator, SARP-Familie Regulator, SARP-Familie Luciferase ähnliche Oxidoreduktase Regulator 47 / 61 Resistenz vermittelnder Transporter, EmrB / QacA Unterfamilie Oxidoreduktase, zinkbindend, NADPH:Chinonreduktase oder Enoylreduktase Oxidoreduktase, zinkbindend, NADPH:Chinonreduktase oder Enoylreduktase FAD abhängige Oxygenase Ketoacyl-(ACP)Reduktase, C-9-Ketoreduktase unbekanntes Protein möglicherweise Regulator möglicherweise Regulator 93 46 / 59 55 / 66 45 / 56 angenommene Proteinfunktion (Herkunft), NCBI accession number, Referenz Francci3_4140 (Frankia sp. CcI3), YP_483217, [176] Rxyl_1781 (Rubrobacter xylanophilus DSM 9941), YP_644552, [177] FRAAL5329 (Frankia alni ACN14a), YP_715495, [176] AknI (Streptomyces galilaeus), AAF70113, [173] Med-ORF3 (Streptomyces sp. AM-7161), BAC79046, [168] Pnuc_0400 (Polynucleobacter sp. QLWP1DMWA-1), YP_001155184, [178] SnoaB (Streptomyces nogalater), CAA12015, [179] 47 / 57 SCO7586 (Streptomyces coelicolor A3(2)), NP_631629, [70] 49 / 60 CmmX (Streptomyces griseus subsp. griseus), CAE17525, [172] pSLA2-L_p075 (Streptomyces rochei), NP_851497, [180] Francci3_2122 (Frankia sp. CcI3), YP_481223, [176] MXAN_3632 (Myxococcus xanthus DK 1622), YP_631819, [181] SCO3914 (Streptomyces coelicolor A3(2)), NP_628100, [70] Franean1_3481 (Frankia sp. EAN1pec), YP_001507789, [182] ChlG (Streptomyces antibioticus), AAZ77686 [183] 32 / 48 44 / 55 34 / 56 48 / 63 39 / 56 44 / 57 Mlr3236 (Mesorhizobium loti MAFF303099), NP_104388, [184] 47 / 63 ActVI-ORF2 (Streptomyces coelicolor A3(2)), NP_629224, [70] 42 / 54 SACE_6561 (Saccharopolyspora erythraea NRRL 2338), YP_001108654, [175] AknA (Streptomyces galilaeus), BAB72043, [185] 74 / 82 46 / 60 77 / 85 60 / 71 CgR_2799 (Corynebacterium glutamicum R), YP_001139720, [186] SAMT0075 (Streptomyces ambofaciens ATCC 23877), CAI78004, [187] SAMT0075 (Streptomyces ambofaciens ATCC 23877), CAI78004, [187] 94 Ergebnisse 3.3.2.4 Inaktivierung zweier Monooxygenasegene Unter der Annahme, dass es sich beim msc-PKS II-Cluster um das Mensacarcinbiosynthesegencluster handelt, wurde angestrebt durch die gezielte Einführung von Gendefekten neue Mensacarcinderivate mit modifizierter biologischer Aktivität zu generieren. Eine Derivatisierung der beiden Epoxifunktionen war dabei von besonderem Interesse. Die Bedeutung des Oxiranrings für die biologische Aktivität von Zytostatika ist für Vertreter unterschiedlicher Strukturklassen bekannt [188;189]. Der in der PKS II-Biosynthese selten auftretenden Epoxidierung konnte bisher kein Enzym zugeordnet werden. Die Epoxidierung von PKS II-Metaboliten wird lediglich als hypothetische Zwischenstufe in der Reaktion bestimmter Oxygenasen angenommen. Dazu gehören die Dreifachhydroxylase ElmG [166] mit dem möglichen Homolog Msc37 sowie die Luciferase ähnliche Monooxygenase SnoA / B (= Pristinamycin PIIA-Synthase, vgl. 3.3.5.4), deren A-Untereinheit über eine Sequenzlänge von 140 AS 27 % identische, 44 % ähnliche Aminosäuren mit Msc21 teilt (BLASTVergleich, s. 5.14). Für eine erste Geninaktivierung im dem Genom von S. sp. Gö C4/4 wurden deshalb msc37 und msc21 ausgewählt. Inaktivierungsplasmid und Crossover Für die Inaktivierung der ausgewählten Monooxygenasen sollte nach der schon für pok-KSα (s. 3.2.2) erfolgreich eingesetzten [safe-knock]-Strategie (s. 5.8.2) vorgegangen werden. Dazu wurden zunächst die Inaktivierungsplasmide p∆msc21 und p∆msc37 erstellt (s. 5.4.2.5). Die zu inaktivierenden Gene sind auf diesen Konstrukten durch die Spectinomycinresistenz vermittelnde Redirect-Kassette des Plasmids pIJ778 (s. 5.5.5.5) ersetzt. Das Resistenzgen und dessen Promotor liegen dabei in Leserichtung des entsprechenden msc-Transkripts. Die Orientierung des eingebrachten Promotors ist wichtig, um die Transkription der umgebenden msc-Gene nicht negativ zu beeinflussen (vgl. 3.2.2). Wie unter 5.8.2.5 beschrieben, wurden zunächst mit beiden Inaktivierungskonstrukten Mutanten von S. sp. Gö C4/4 mit erstem Crossover erzeugt und nach vier Passagen durch Selektion auf Spectinomycinresistenz und Apramycinsensitivität Doppelcrossover-Mutanten identifiziert. Aus je 264 in das Selektionsraster übertragenen Kolonien konnten bezüglich msc21 zwei, für msc37 drei Doppelcrossover-Mutanten gewonnen werden. Eine Absicherung des Genotyps der passagierten Mutanten mit erstem Crossover sowie jeweils einer Doppelcrossover-Mutante erfolgte durch die Isolierung von genomischer DNA (s. 5.5.2.2) und anschließende PCR-Analyse. Mit dem Primerpaar Msc21-F / -R (s. 5.6.3.3) wurde bezogen auf msc21 für den Wildtyp ein 1369 bp Produkt, mit mutiertem Allel ein 1728 bp Produkt, erwartet. Analog führt das Primerpaar Msc37-F / -R beim msc37Wildtypallel zu einem 1818 bp Produkt, beim mutierten Allel zu 1658 bp. In der Mutante mit erstem Crossover liegen die Allele parallel vor (vgl. 5.8.1.2), was beide Produktgrößen erwarten ließ. Die Gelbilder bestätigen die zunächst durch das Resistenzverhalten bestimmten Genotypen (s. Abb. 61). Die Doppelcrossover-Mutanten wurden als S. sp. Gö C4/4 ∆msc21 bzw. ∆msc37 bezeichnet und konnten weiteren Untersuchungen zugeführt werden. 95 Ergebnisse 1818 bp 10 kb 8 kb 6 kb 5 kb 4 kb 3 kb 2,5 kb 2,0 kb 1658 bp 1,5 kb 1728 bp 1369 bp 1,0 kb 0,75 kb 0,50 kb 0,25 kb 1 2 3 L Primer Msc37-F / -R 1: Wildtyp 2: erster Crossover 3: ∆msc37 L 4 5 6 Primer Msc21-F / -R 4: Wildtyp 5: erster Crossover 6: ∆msc21 Abb. 61: Agarosegelelektrophorese der PCR mit genomischer DNA zur Kontrolle der Crossover-Ereignisse. Produktionsanalyse von S. sp. Gö C4/4 ∆msc21 bzw. ∆msc37 Bei den Doppelcrossover-Mutanten S. sp. Gö C4/4 ∆msc21 bzw. ∆msc37 hatte ein Allelaustausch stattgefunden, der aufgrund der eingebrachten mutierten Allele den Funktionsverlust der entsprechenden Proteine mit sich bringen sollte. Auswirkungen auf das Produktionsspektrum des Stammes wurden mit den Ethylacetatextrakten von Standardkulturen (s. 5.3.1.4 und 5.11.1.1) per LC/ESI-MS (Methode: mens03, s. 5.11.6) analysiert. Überraschenderweise zeigten die Mutanten eine nicht vom Wildtyp abweichende Mensacarcinproduktion (Daten nicht gezeigt, vgl. Abb. 53). Nach der Abwesenheit eines Methyltransferasegens (s. 3.3.2.3) ist dies ein weiterer Hinweis darauf, dass es sich beim msc-PKS II-Cluster nicht um das Mensacarcinbiosynthesegencluster handelt. Die Chromatogramme bei Absorptionswellenlängen von 254 nm, 330 nm und 400 nm wurden daraufhin im Detail verglichen. Nur bei 400 nm ließen sich Unterschiede im Peakmuster erkennen. Die den veränderten Peaks entsprechenden Substanzen wurden wegen des vermuteten Zusammenhangs mit den msc-Genen als MSC-X1, -X2 bezeichnet. Mit der "extract ions" Funktion der ChemStation Software (s. 5.14) war es möglich den UV/VIS-Absorptionspeaks korrespondierende Signale im ESI-MS-Diagramm zuzuordnen. Die Peaks des ESI-MS-Diagramms liegen dabei als gerätespezifische Konstante stets 0,08 min hinter den UV/VIS-Absorptionspeaks. MSC-X1 bildet negative Ionen mit dem m/z-Wert 339, für MSC-X2 werden im negativen Detektionsmodus Signale bei m/z = 369 festgestellt. Die relative Intensität der M+1 Isotopensatelliten mit 22 % für MSC-X1 liegt im 96 Ergebnisse erwarteten Bereich für einen C19 - C20 Körper, wenn nur Kohlenstoffatome signifikant zur Häufigkeit von M+1 beitragen (vgl. 3.3.7.2). Im MS-Peak von MSC-X2 haben die Signale von M+1 23 % der Intensität des Pseudomolekülions, was die Anwesenheit eines zusätzlichen C-Atoms im Molekül andeutet. Die UV/VIS-Absorptionsspektren von MSC-X1 und -X2 (s. Abb. 62) weisen ein Absorptionsmaximum im sichtbaren Bereich zwischen 400 und 500 nm auf. Der Kurvenverlauf bei MSC-X1 erinnert stark an Absorptionsspektren von Anthrachinonen (vgl. 3.1). In natürlich auftretenden Anthra- oder Naphthochinonen sind laut Thomson [97] Absorptionsbanden über 360 nm vor allem auf α-Hydroxylgruppen zurückzuführen. Einfach α-hydroxylierte Derivate absorbieren im Bereich von 400 - 420 nm, eine zusätzliche, benachbarte Hydroxylierung des aromatischen Rings führt zu einer bathochromen Verschiebung des Maximums. Eine Feinstruktur der Langwellenbande, wie im Spektrum von MSC-X1 sichtbar, kann durch mehrfache α-Hydroxylierung verursacht werden [97]. Fast alle bisher bekannten PKS II-Naturstoffe besitzen eine anthranoide oder vom Naphthochinon abgeleitete, α-hydroxylierte, Struktur [23]. So überrascht es nicht, dass auch die UV/VISAbsorptionsspektren von MSC-X1 und bedingt auch MSC-X2 Merkmale dieser Strukturklassen zeigen. Die Produktion der beiden Substanzen findet nur in äußerst geringem Maße statt, welches die Isolierung ausreichender Stoffmengen für die NMR-Analytik nicht zuließ. MSC-X1 (36,7 min) mAU 20 = 339 m/zm/z neg. 339 neg. 235 mAU 40 258 440 15 MSC-X2 (33,6 min) 20 5 10 0 0 400 274 30 10 300 m/zneg. = 369 m/z 369neg. 500 nm 238 300 420 400 500 nm Abb. 62: Charakterisierung der Substanzen MSC-X1, -X2 durch Elektrospray-Massenspektrometrie und UV/VIS-Absorptionsspektroskopie. Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 63). Die Konzentrationen an MSC-X1 in Kulturextrakten der ∆msc21-Mutante lagen deutlich unter denen des Wildtypextrakts (s. Abb. 63). Die Inaktivierung von msc37 beeinflusste die MSC-X1-Konzentration nicht. Nur in den Extrakten von S. sp. Gö C4/4 ∆msc37 konnte ein deutlicher Gehalt des Metaboliten MSC-X2 nachgewiesen werden (s. Abb. 64). 97 Ergebnisse S. sp. Gö C4/4 Wildtyp mAU 400 nm 10 0 0 10 MSC-X1 20 30 int. m/z = 339 neg. 400 0 0 10 S. sp. Gö C4/4 ∆msc21 40 min. MSC-X1 20 30 40 min. int. m/z = 369 neg. 400 0 0 10 mAU 400 nm 10 0 0 10 MSC-X1 20 30 int. m/z = 339 neg. 400 0 0 10 40 min. MSC-X1 20 30 40 min. 20 30 40 min. int. m/z = 369 neg. 400 20 30 40 min. 0 0 10 Abb. 63: LC/ESI-MS Analyse der Kulturextrakte von S. sp. Gö C4/4 und ∆msc21-Mutante. S. sp. Gö C4/4 Wildtyp mAU 400 nm 10 0 0 10 MSC-X1 20 30 int. m/z = 339 neg. 400 0 0 10 S. sp. Gö C4/4 ∆msc37 20 30 40 min. 10 0 0 10 20 int. m/z = 339 neg. 400 MSC-X1 0 40 min. 0 10 20 int. m/z = 369 neg. 400 0 0 MSC-X2 MSC-X1 mAU 400 nm 10 30 MSC-X1 30 int. m/z = 369 neg. 400 20 30 40 min. 0 0 10 40 min. 40 min. MSC-X2 int. max. 1871 20 30 40 min. Abb. 64: LC/ESI-MS Analyse der Kulturextrakte von S. sp. Gö C4/4 und ∆msc37-Mutante. 3.3.2.5 Inaktivierung des Gens der Ketosynthase Untereinheit β Die Inaktivierung zweier im msc-PKS II-Cluster codierten Monooxygenasen hatte keinen Einfluss auf die Mensacarcinproduktion (s. 3.3.2.4). Obwohl die Vermutung bereits nahe liegt, lässt sich das msc-PKS II-Cluster mit diesem Befund noch nicht als Mensacarcinbiosynthesegencluster ausschließen. So wurde nach Oxidoreduktasegeninaktivierungen in anderen PKS II-Clustern ohne Auswirkungen auf die Produktion des entsprechenden Metaboliten die Redundanz der entsprechenden Gene postuliert [190]. Auch eine gegenseitige Komplementierung der oft aus mehreren ähnlichen Untereinheiten aufgebauten Enzyme [191] ist denkbar [192]. Die im nächsten Schritt angestrebte Inaktivierung eines Gens der minimalen PKS sollte eine eindeutige Aussage darüber erlauben, ob die vom msc-PKS IICluster codierten Proteine für die Mensacarcinbiosynthese in S. sp. Gö C4/4 essentiell sind. 98 Ergebnisse Inaktivierungsplasmid und Crossover Von A. Prestel war bereits eine Inaktivierung von msc15, dem Gen der Ketosynthase Untereinheit β, versucht worden [160]. Das eingesetzte Inaktivierungsplasmid pBSKclf− (s. 5.4.2.5) trägt ein msc15-Allel mit Frameshift (vgl. 5.8.1.3) in der Mitte des Gens. Das erste Crossover-Ereignis mit Integration des Plasmids in das Genom vom S. sp. Gö C4/4 konnte nachgewiesen werden, eine Doppelcrossover-Mutante wurde selbst nach der 17. Passage nicht erhalten [160]. Auf die passagierte Mutante mit erstem Crossover konnte zurückgegriffen werden. Nach Herstellung und Ausplattieren von Myzeldilutionen (vgl. 5.8.2.5) wurden 264 der auf HA-Agar ohne Antibiotikazusatz gewachsenen Klone auf Apramycinsensitivität selektiert. Auf dem Chromosom von 35 sensitiven Klonen war es zu einem zweiten Crossover-Ereignis gekommen, das zum Verlust des Resistenz vermittelnden Vektoranteils führte. Da für diese Inaktivierung nicht die [safe-knock]-Strategie (s. 5.8.2) verwendet wurde, finden sich unter den sensitiven Klonen sowohl Genotypen mit einem zweiten Crossover zurück zum Wildtypallel als auch die angestrebten DoppelcrossoverMutanten, in deren Genom ein Allelaustausch stattgefunden hat. Über die Isolierung von genomischer DNA (s. 5.5.2.2), Amplifizierung des DNA-Bereiches von msc15 mit dem Primerpaar KS2_1 / 2 (s. 5.6.3.3) und Restriktionsanalyse (s. 5.5.4.1) des PCR-Produkts lassen sich die apramycinsensitiven Klone genotypisieren (s. Abb. 65). Durch das Blunting (vgl. 5.8.1.3) wurde die BglII-Erkennungssequenz durch eine ClaI-Schnittstelle ersetzt (s. Abb. 65), wodurch unterschiedliche Fragmentgrößen beim Restriktionsverdau von Wildtyp- und mutiertem Allel resultieren: Durch eine BglII-Restriktion wird das PCR-Produkt mit Wildtypallel in 884 bp und 694 bp große Fragmente gespalten, im mutierten Allel hingegen findet BglII keine Erkennungssequenz, es bleibt bei 1579 bp. Der ClaI-Verdau führt beim PCR-Produkt mit Wildtypallel zu Spaltprodukten von 1051 bp und 524 bp. Durch die zusätzliche ClaI-Erkennungssequenz des mutierten Allels wird das größere der beiden Produkte in 169 bp und 887 bp gespalten. Abb. 66 zeigt die Restriktionsanalyse der ersten zehn untersuchten apramycinsensitiven Klone. Zwei weitere Klone wurden parallel genotypisiert (Daten nicht gezeigt). Nur die Doppelcrossover-Klone 2 und 7 haben das für den Wildtyp erwartete Bandenmuster. Die anderen Klone entsprechen dem Genotyp einer ∆msc15 Doppelcrossover-Mutante. 99 Ergebnisse BglII-Schnittstelle msc15 Wildtypallel GGCCAGA----TCTCGAT msc15 mutiertes Allel GGCCAGATCGATCTCGAT ClaI-Schnittstelle PCR-Produkt mit Wildtypallel BglII 884 ClaI 1050 1575 bp 'msc14 msc16' msc15 PCR-Produkt mit mutiertem Allel ClaI 886 ClaI 1054 1579 bp 'msc14 msc 16' msc15 mutiert Abb. 65: Erwartete PCR-Produkte von genomischer DNA S. sp. Gö C4/4 Wildtyp und ∆msc15 mit dem Primerpaar KS2_1 / 2. Bgl II 1579 bp 1884 bp 1694 bp Cla I 1051 bp 1887 bp 1524 bp 1168 bp 1 2 3 4 5 6 7 8 9 10 L 1 - 10: Doppelcrossover L: Promega 1 kb Leiter Abb. 66: Restriktionsanalyse der PCR-Produkte von apramycinsensitiven Doppelcrossover-Klonen mit BglII und ClaI. Eine Bandenbeschriftung der 1 kb Leiter findet sich in Abb. 61. 100 Ergebnisse Produktionsanalyse von S. sp. Gö C4/4 ∆msc15 Ethylacetatextrakte aus Standardkulturen von 12, bezogen auf msc15 genotypisierten, Doppelcrossover-Klonen wurden per LC/MS analysiert. Obwohl es sich sowohl um Wildtypen als auch ∆msc15-Mutanten handelte, ließen sich keine Unterschiede der Mensacarcinproduktion feststellen. Letztendlich ist diese Beobachtung der Beweis dafür, dass die Gene des msc-PKS II-Clusters nicht essentiell für die Biosynthese von Mensacarcin in S. sp. Gö C4/4 sind. Die Schlussfolgerung ergibt sich aus der Tatsache, dass Gene für die Biosynthese von PKS II-Metaboliten in Streptomyces spp. geclustert vorliegen [193], d. h. zu einem abgegrenzten PKS II-Cluster gehörende Gene sind an der Biosynthese der gleichen Substanz beteiligt. Da Msc15, als KSβ ein essentieller Bestandteil der minimalen Polyketidsynthase ist und dessen Inaktivierung die Mensacarcinproduktion nicht beeinflusst, kann davon ausgegangen werden, dass sämtliche Gene des entsprechenden Clusters für die Mensacarcinbiosynthese nicht essentiell sind. Die schon bei der Inaktivierung der msc-Monooxygenasegene (s. 3.3.2.4) im 400 nm-Chromatogramm aufgefallenen Unterschiede sollten mit den ∆msc15-Mutanten weiter verfolgt werden. Die Substanz MSC-X2 wurde weder im Wildtyp, noch in S. sp. Gö C4/4 ∆msc15 detektiert. Dies spricht für eine Rolle von MSC-X2 als Vorläufer oder Shuntprodukt des MSC-Endprodukts. Der Peak von MSC-X1 im 400 nm Chromatogramm fehlt bei allen 10 Kulturextrakten der ∆msc15-Mutanten, tritt aber in den Extrakten der beiden Doppelcrossover-Klone mit Wildtyp-Genotyp in gleicher Intensität wie auch in zuvor analysierten Wildtyp-Kulturextrakten auf. Mit "extract ions" auf den m/z-Wert 339 im negativen Detektionsmodus waren bei den ∆msc15-Mutanten noch Spuren von MSC-X1 nachweisbar. Ein Ausschnitt der Ergebnisse findet sich in Abb. 91. Der angenommene Zusammenhang zwischen dem msc-Cluster und der Substanz MSC-X1 wird durch diese Ergebnisse bestätigt. Fraglich blieb zunächst, warum auch in den Knockout-Mutanten noch Spuren von MSC-X1 synthetisiert wurden. Durch Analyse einer Doppelmutante mit inaktivierter minimaler PKS des msc- sowie des msn-Clusters konnte diese Frage im weiteren Verlauf der Arbeit beantwortet werden (s. 3.3.5.2). Weitere von der msc15-Inaktivierung abhängige Peaks wurden nach genauem Abgleich der Chromatogramme bei Absorptionswellenlängen von 254 nm, 330 nm und 400 nm nicht festgestellt. In einer Produktionsanalyse unter Zusatz von 2 % DMSO wurden ∆msc15-Mutanten mit dem Wildtyp bezüglich ihres Potentials zur Mensalon- und Aloesolproduktion (vgl. Abb. 56) verglichen. Die Produktion dieser Metaboliten hängt nicht von Msc15 ab. Ergebnisse 101 3.3.2.6 Homologe, ektopische Überexpression zweier msc-Regulatorgene Mit der Gewissheit, dass das msc-PKS II-Cluster keine essentielle Rolle in der Mensacarcinbiosynthese spielt, erschienen die gentechnischen Experimente mit diesem Cluster in neuem Licht. Abweichend vom klassischen Weg der Biosyntheseforschung, der ausgehend vom charakterisierten Naturstoff nach dessen genetischem Ursprung sucht, liegt mit dem msc-PKS II-Cluster eine DNA-Sequenz vor, der ein Metabolit zugeordnet werden soll. Eine Situation, die auch als Ausgangspunkt der postgenomischen Annäherung des genome mining vorliegt [79;194]. Bei "stillen Clustern" kann initial eine Aktivierung der Sekundärstoffproduktion notwendig sein. Dies kann durch Variation der Kulturbedingungen, gentechnisch über Promotorenaustausch oder einen Eingriff in die Transkriptionsregulation erreicht werden. Mit msc24 und msc30 liegen zwei putative Regulatorgene im msc-Cluster vor, deren abgeleitete Produkte Sequenzähnlichkeiten zu Biosyntheseweg spezifischen Transkriptionsaktivatoren der SARP (Streptomyces antibiotic regulatory protein) Familie [195] haben. Zusätzlich ins Genom eingebrachte Kopien von SARP-Transkriptionsaktivatorgenen führen zur spezifischen Überproduktion der entsprechenden Antibiotika bzw. Zytostatika: actII-ORF4 bezüglich Actinorhodin und redD bezüglich Undecylprodigiosin in Streptomyces coelicolor A3(2) sowie dnrI bezüglich Daunorubicin in Streptomyces peuceticus [196]. Mit dem Ziel einer Produktionssteigerung der Biosyntheseprodukte der Msc-Proteine sollte die Kopienzahl der Gene msc24 und msc30 im Genom von S. sp. Gö C4/4 erhöht werden. Da sich beide Proteinprodukte den Biosyntheseweg spezifischen Regulatoren zuordnen lassen, sollte durch deren Überexpression die funktionelle Charakterisierung des msc-Clusters vervollständigt werden. Expressionsplasmide und Gentransfer Für die ektopische Expression von Genen stehen zwei Typen von Vektoren zur Verfügung: integrative Vektoren, basierend auf dem Integrationssystem des Phagen phiC31 [197] oder sich in Streptomyces spp. replizierende Vektoren als high-copy oder low-copy Varianten. Die Verwendung integrativer Vektoren hat den Vorteil des effizienten und stabilen Einbaus in das Wirtschromosom. Da der Einbau sequenzspezifisch an attb-sites erfolgt, ist mit dem Einbau von nur einem Plasmid pro Chromosom zu rechnen. Replikative Vektoren hingegen liegen in mehreren Kopien vor, wodurch die Expressionseffizienz des enthaltenen Gens erhöht wird. Sie sind jedoch selten über mehrere Passagen im Wirtsgenom stabil. Da die Anzahl zusätzlicher Kopien bei ähnlichen Versuchen [198] keine Rolle spielte, wurde für die Überexpression von msc24 und msc30 der integrative Vektor pSET152 (s. Tab. 35) gewählt und die Gene dem starken konstitutiven ermE-up-Promotor [199] nachgeschaltet. So entstanden die Expressionsplasmide pSETmsc24 und pSETmsc30 (s. 5.4.2.5), die jeweils über intergenerische Konjugation (s. 5.7.2) in S. sp. Gö C4/4 eingebracht wurden. 102 Ergebnisse Produktionsanalyse von S. sp. Gö C4/4 pSETmsc24 bzw. pSETmsc30 Es wurden drei unterschiedliche apramycinresistente Kolonien untersucht, die aus der Konjugation von S. sp. Gö C4/4 mit pSETmsc24 enthaltendem E. coli 12567 pUZ8002 hervorgingen. Die mit Ethylacetatextrakten von Standardkulturen (s. 5.3.1.4, 5.11.1.1) erhaltenen UV/VIS-Absorptionschromatogramme wurden mit denen einer parallelen Wildtypanzucht abgeglichen. Bei zwei pSETmsc24-Integrationsmutanten kam es erstaunlicherweise zu einer Mensacarcinüberproduktion. Diese ging einher mit einer leicht verringerten MSC-X1-Produktion. MSC-X2 wurde wie im Wildtyp nicht produziert. Bezogen auf den Wildtyp produzierte S. sp. Gö C4/4 pSETmsc24 4,5 Mal soviel Mensacarcin (berechnet aus Mittelwerten der AUC des Mensacarcinpeaks im 330 nm-Chromatogramm). Die dritte untersuchte pSETmsc24-Integrationsmutante zeigte im Gegensatz zu den ersten beiden keine signifikanten Abweichungen vom Produktionsprofil des Wildtyps. Von den pSETmsc30-Integrationsmutanten wurden vier verschiedene Klone in je einer Anzucht unter Standardbedingungen untersucht. Bei drei Klonen kam es zu einer fast vollständigen Repression der Produktion aller betrachteten Metaboliten (Mensacarcin und MSC-X1, -X2). Auch das Anwachsen dieser Klone in Flüssigkultur war gegenüber dem Wildtyp und allen anderen Integrationsmutanten deutlich verlangsamt. Zum Ende der Kultivierung war aber auch hier das Medium vollständig von Myzel durchsetzt und zeigte die für den Stamm typische schwarze Färbung (s. 3.3.1). Die vierte der pSETmsc30-Integrationsmutanten wich von den anderen ab und zeigte Wildtyp ähnliche Produktion. Die erwartete Überproduktion der dem msc-Cluster zugeordneten Substanz MSC-X1 wurde nicht erreicht. Stattdessen konnten interessante Informationen über die Regulatorgene msc24 und msc30 gewonnen werden. Obwohl beide Genprodukte Ähnlichkeit zu Biosyntheseweg spezifischen Regulatoren zeigen, blieben die Auswirkungen der zusätzlich eingebrachten Genkopien nicht auf das msc-Cluster beschränkt. Vor allem die auf das msn-Cluster (s. 3.3.5) zurückzuführende Mensacarcinbiosynthese wurde beeinflusst, was gleichzeitig zur Reduktion der MSC-X1-Produktion führte, wahrscheinlich aufgrund des entstandenen Mangels an Polyketidvorläufern. Die Wirkung auf ein anderes PKS II-Cluster verwundert eigentlich nicht, da auch für andere "Biosyntheseweg spezifische Regulatoren" eine gegenseitige Komplementierung in PKS II-Clustern bekannt ist [196]. Die Spezifität der "pathway specific" SARPs scheint sich nicht strikt auf die Biosynthese eines bestimmten Sekundärstoffs sondern eher auf den Typ des Biosynthesewegs (zum Beispiel PKS II) zu beziehen. Msc30, ähnlich zu SARP-Transkriptionsaktivatoren, überraschte durch Repression der Sekundärstoffproduktion und scheint deshalb eher eine Funktion in der negativen Regulation zu besitzen. Das Auftreten jeweils eines Klons mit Wildtypproduktion könnte auf mangelnde Expression der zusätzlichen Genkopien zurückzuführen sein. Ergebnisse 103 3.3.3 PCR-basiertes Screening auf weitere PKS II-Cluster Nach der Generierung von drei Mutanten mit unterschiedlichen Gendefekten im msc-Cluster sowie deren Produktionsanalyse war bewiesen, dass das msc-Cluster nicht für die Mensacarcinproduktion in S. sp. Gö C4/4 benötigt wird (s. 3.3.2). Mit hoher Wahrscheinlichkeit lag das Mensacarcinbiosynthesegencluster folglich auf einem der anderen PKS II positiven Cosmide des Sondenscreenings (s. 3.3.2.1). Die Cosmide waren in drei Gruppen überlappender Sequenzen eingeteilt worden [160]. Zunächst galt es, diese Zuordnung zu überprüfen (s. 3.3.3.1) und Sequenzinformationen über die bisher unbekannten PKS II-Cluster zu gewinnen (s. 3.3.3.2). 3.3.3.1 Einteilung der Cosmide in Gruppen überlappender Sequenzen Um Cosmide überlappender Sequenzen zu identifizieren, wurden zwei Strategien verfolgt. Zum einen wurde auf eine klassische Restriktionskartierung zurückgegriffen, zum anderen kam ein PCR-basiertes Screening auf PKS II-Gene, kombiniert mit der Ansequenzierung der PCR-Produkte, zum Einsatz. Zur Restriktionskartierung wurden alle Cosmide als erstes mit dem Enzym BamHI erschöpfend verdaut. Die entstandenen DNA-Fragmente wurden gemäß ihrer Größe in der Agarosegelelektrophorese aufgetrennt und mit Ethidiumbromid detektiert. Für Cosmide, deren Inserts sich in einem bestimmten Abschnitt überlappen, werden für diesen Bereich nach dem Verdau Fragmente gleicher Größe erwartet. Zwei Cosmide wurden einander zugeordnet, wenn diese mindestens vier identische Banden im Gel zeigten. Durch die BamHI-Restriktion war bereits eine Einteilung von 15 Cosmiden in drei Gruppen möglich (vgl. Tab. 11), was auf die Präsenz von mindestens drei PKS II-Clustern in S. sp. Gö C4/4 hindeutet. Das sequenzierte Cos4 (msc-Contig) gehört zur Gruppe 1. Ein weiteres Cosmid (Cos10) ließ sich durch das mit NotI und EcoRI erhaltene Bandenmuster der Gruppe 2 zuordnen. Die verbleibenden vier Cosmide wurden mit der folgend beschriebenen Strategie erfasst. Die zweite Strategie fokussiert sich direkt auf die Gene der Ketosynthase Untereinheit α. Das ksα-Gen war auch Ziel des Sondenscreenings [160] und sollte deshalb auf jedem der 20 ausgewählten Cosmide lokalisiert sein. Zwei hochkonservierte Sequenzbereiche bekannter ksα-Gene erlauben das Ableiten von degenerierten PCR-Primern. Es wurde auf ein von MetsäKetelä et al. (1999) [200] erfolgreich eingesetztes Primerpaar zurückgegriffen (Primerpaar KSa-F / -R, s. 5.6.3.3). Das zu erwartende Teilamplifikat des ksα-Gens hat eine Größe von etwa 0,6 kb. Ein Produkt erwarteter Größe trat bei allen untersuchten Cosmiden auf. Für die nicht zugeordneten sowie ausgewählte Cosmide der Gruppen 2 und 3 wurden die 0,6 kb-Fragmente nach präparativer Agarosegelelektrophorese (s. 5.5.4.2) isoliert und über TA-Klonierung (s. 5.5.5.3) in den Sequenziervektor pGEM-T Easy insertiert. Die Ansequenzierung mit einem Standardprimer (s. 5.6.2.1) reichte aus, um das Insert vollständig 104 Ergebnisse zu erfassen. Einerseits konnte die per Restriktionskartierung getroffene Gruppeneinteilung bestätigt werden sowie nicht eingeteilte Cosmide den Gruppen zugeordnet werden (vgl. Tab. 11), andererseits wurden auf diese Weise erste Sequenzinformationen über die bislang unbekannten Ketosynthasen der Gruppen 2 und 3 gewonnen. Metsä-Ketelä et al. (1999) [200] erstellten mit abgeleiteten Aminosäuresequenzen der per PCR amplifizierten Region des ksα-Gens einen phylogenetischen Stammbaum, der eine klare Abgrenzung von Sporenpigment- zu Antibiotika- / Zytostatikabiosynthesegenen aufzeigt. Komaki et al. (2006) [201] gingen noch weiter und ordneten die Äste in ihrem ebenfalls mit KSα-Fragmenten erstellten Stammbaum bestimmten Cyclisierungsmodi der β-Ketidkette zu. Über Ähnlichkeitsvergleiche auf Aminosäureebene (BLAST, s. 5.14) wurde die KSα der Gruppe 2 als Enzym der Sporenpigmentbiosynthese klassifiziert, das abgeleitete KSα-Fragment der Gruppe 3 hat Ähnlichkeit mit Anguzyklin-, Anthrazyklin- und Aureolsäureketosynthasen. Das Cluster der Gruppe 3 (ab jetzt msn-Cluster genannt) war somit der heißere Kandidat für die Gene der Mensacarcinbiosynthese. Das möglicherweise für die Sporenpigmentbiosynthese verantwortliche Cluster der Gruppe 2 (ab jetzt mec-Cluster genannt) sollte jedoch ebenfalls weiter untersucht werden. Cos13 konnte nicht eingruppiert werden. Sein Restriktionsmuster wich von dem der anderen Cosmide ab. Mit der ksα spezifischen PCR wurde eine sehr geringe Produktkonzentration erhalten, die einer Sequenzierung nicht zugänglich war. Mit BamHI-Fragmenten von Cos13 wurden vier Subklone erstellt, die fast das gesamte Cosmid abdecken. Die beidseitige Ansequenzierung erbrachte ausschließlich Ähnlichkeiten mit Primärstoffwechselgenen. Cos13 wurde deshalb als falsch-positiver Treffer des Sondenscreenings angesehen. Tab. 11: Einteilung der PKS II positiven Cosmide aus S. sp. Gö C4/4. Gruppe 1 (msc-Cluster) Cos1+, Cos4+*, Cos6+, Cos9+*, Cos14+, Cos15+, Cos16+ Gruppe 2 (mec-Cluster) Cos3+, Cos5*, Cos8+, Cos10++, Cos11+, Cos12+*, Cos19+* Gruppe 3 (msn-Cluster) Cos2*, Cos7+*, Cos17+*, Cos18+*, Cos20* Cos13 lässt sich keiner der drei Gruppen zuordnen. + Zuordnung über Restriktionskartierung mit BamHI. ++ Zuordnung über Restriktionskartierung mit NotI sowie EcoRI. * Zuordnung durch Ansequenzierung des mit dem Primerpaar KSa-F / -R entstandenen 0,6 kb PCR-Produkts oder Sequenzierung eines Abschnitts auf dem Cosmid. Abweichungen zu den 2002 von A. Prestel [160] getroffenen Zuordnungen ergaben sich für Cos2 (vormals keine Zuordnung), Cos13 (vormals Gruppe 2) und Cos20 (vormals Gruppe 1). Ergebnisse 105 3.3.3.2 Informationsgewinn durch Subklonansequenzierung Von Cosmiden der Gruppen 2 und 3 wurden 11 bzw. 29 unterschiedliche Subklone erstellt (s. 5.5.5.2). Die beidseitige Ansequenzierung der Inserts mit Standardprimern (s. 5.6.2.1) offenbarte erste Einblicke in die Organisation des mec- und msn-Clusters. Die Lage der Subklone in den später vollständig sequenzierten Clustern bzw. durch Datenbankabgleich (BLAST, s. 5.14) ermittelte Ähnlichkeiten der abgeleiteten Proteine sind unter 5.4.2.4 angegeben. Zuerst wurden BamHI-Subklone ausgewählter Cosmide beider Gruppen erstellt. Die Sequenzen von Subklonen der Gruppe 2 stammen fast ausschließlich von Genen des Primärmetabolismus. Einzig ein abgeleitetes Polyketidhydrolasefragment mit Ähnlichkeit zu entsprechenden Enzymen der Sporenpigmentsynthese (Subklon G2B4,2, s. 5.4.2.4) diente als Indiz für die Präsenz eines PKS II-Clusters auf den entsprechenden Cosmiden. Sollte es sich beim mec-Cluster wirklich um ein Sporenpigmentbiosynthesegencluster handeln, wäre dieser Befund erklärbar, denn diese Cluster bestehen nur aus wenigen Genen (s. 3.3.4.1). Für Gruppe 3 ergaben sich aus den BamHI-Subklonen keine Daten, die direkt auf einen Zusammenhang mit der Polyketidsynthese hindeuteten. Es wurden vor allem Gene der S-Adenosylmethioninregeneration gefunden. Sukzessive wurden weitere, mit anderen Enzymen gewonnene, Cosmidfragmente subkloniert und ansequenziert, was letztlich beide Cluster als PKS II-Cluster identifizierte. Bemerkenswert ist hier das Auftreten eines Methyltransferasegens sowohl im mec- als auch msn-Cluster, ein Gen, das eine essentielle Rolle in der Mensacarcinbiosynthese spielt und im msc-Cluster vergeblich gesucht wurde (s. 3.3.2.3). Vor der Entscheidung über eine Cosmidsequenzierung sollten noch mehr Information über die Kernbestandteile der Cluster erhalten werden. Es wurde angestrebt, sich ausgehend vom ksα-Gen per Primerwalking (s. 5.6.2.2) entlang der Clustersequenz voranzuarbeiten. Cosmide G+C-reicher Genome sind jedoch nur bedingt zum Primerwalking geeignet: im Bereich der ca. 40 kb großen Inserts bilden sich häufig DNA-Sekundärstrukturen, welche die Sequenzierung beeinträchtigen. Des Weiteren nimmt mit der Sequenzlänge die Wahrscheinlichkeit ähnlicher oder gar repetitiver Basenabfolgen zu, was die eingesetzten Sequenzierprimer auch an ungewollten Bereichen binden lässt. Es mussten deshalb Subklone identifiziert werden, die das ksα-Gen tragen. Alle 40 Subklone wurden mit den oben beschriebenen degenerierten Primern (KSa-F / -R, s. 5.6.3.3) überprüft. ksα positive Subklone der Gruppe 2 waren C12Pst-6, C12Not7 das ksα-Gen der Gruppe 3 trägt C7Nco5 (s. 5.4.2.4). Die Verfügbarkeit dieser Subklone war wegbestimmend für die weiteren Experimente, wie die vollständige Sequenzierung des mec-Clusters per Primerwalking (s. 3.3.4.1) oder Geninaktivierungen in den beiden neuen PKS II-Clustern (s. 3.3.4.2, 3.3.5.2). 106 Ergebnisse 3.3.4 Analyse des mec-Clusters (Sporenpigmentsynthese) Die phylogenetische Einordnung der Mec-Ketosynthase Untereinheit α und der Datenbankabgleich von Subklonsequenzdaten legten eine Funktion des mec-Clusters in der Sporenpigmentsynthese nahe (s. 3.3.3). Gleichzeitig konnte durch die Präsenz eines Methyltransferasegens (s. 3.3.3.2) eine Beteiligung an der Mensacarcinproduktion nicht ausgeschlossen werden. 3.3.4.1 Sequenzierung und Sequenzanalyse des mec-Clusters Sequenzierung und Annotierung Das längste publizierte Sporenpigmentbiosynthesegencluster ist mit einer Ausdehnung über 8,4 kb das spp-Cluster aus dem vollständig sequenzierten Genom des Stammes Streptomyces avermitilis MA-4680 [69;202]. Auch für das mec-Cluster auf den Cosmiden der Gruppe 2 wurde deshalb maximal eine ähnliche Länge angenommen. Solche recht kurzen DNA-Abschnitte lassen sich per Primerwalking (s. 5.6.2.2), basierend auf Ansequenzierungen mit dem Sanger-Verfahren, erfassen. Primerwalking ist jedoch, bedingt durch die nur sukzessive möglichen Walkingschritte, mit hohem personellen Aufwand und Zeitbedarf verbunden. Auch die Qualität des über große Bereiche nur durch eine Sequenz abgedeckten Contigs bleibt unter jener der alternativ möglichen vollständigen Cosmidsequenzierung mit Shotgunklonierung / Sanger-Verfahren (4 - 8-fach Abdeckung) oder Pyrosequenzierung (30 - 40-fach Abdeckung) [203]. Da das Primerwalking die geringsten Fremdkosten verursacht und geeignete Subklone zur Verfügung standen, wurde diese Strategie zur vollständigen Sequenzierung des mec-Clusters gewählt. 1 mec-Sequenzfragmente Subklone 2 3 4 5 6 ksα G2B4,2 (4,2 kb) Bam HI C12Not7 (7 kb) Not I Bam HI C12Pst-6 (3 kb) Pst I Pst I C12Not4 (4 kb) Not I Not I Abb. 67: Abdeckung des mec-Clusters durch benachbarte Subklone. Einige Sequenzfragmente lagen durch Subklonendsequenzierungen oder ksα-Screening (s. 3.3.3) bereits vor und dienten als Ausgangspunkt (1 - 6) für ein Primerwalking auf den Subklonen. Die von Cos12 stammenden Subklone C12Not7 und C12Pst-6 waren beide im PCRScreening ksα positiv. Sofern nur ein PKS II-Cluster auf Cos12 lokalisiert ist, tragen sie überlappende Insertsequenzen. Über eine PstI-Restriktionsanalyse (s. 5.5.4.1) von C12Not7 konnte die 3 kb große Insertsequenz von C12Pst-6 etwa in der Mitte des C12Not7-Inserts positioniert werden. Die damit verbundene ebenfalls mittige Lage des ksα-Gens auf C12Not7 war ein glücklicher Zufall, der für die spätere Inaktivierung des Gens ideale Ausgangsbedingungen schuf (s. 5.8.2.2). Mit C12Not4 stand auf der rechten Seite ein NotIAnschlusssubklon zur Verfügung, dessen Insert laut Datenbankabgleich (BLAST, s. 5.14) das 107 Ergebnisse in diesem Bereich liegende Gen nahtlos fortführt. Da C12Not7 und G2B4,2 je an einem Insertende ein WhiE VIII ähnliches Protein codieren (s. u.) wurde angenommen, dass sich das mec-Cluster auf G2B4,2 fortsetzt. Zwischen beiden Subklonen blieb jedoch ein nicht abgedeckter Bereich von ca. 0,5 kb Länge. Die jeweils für die äußeren Enden der C12Not4und G2B4,2-Inserts erhaltenen Sequenzdaten zeigten keine Ähnlichkeiten zu PKS II assoziierten Enzymen. Dies weist darauf hin, dass die gesamte Ausdehnung des mec-Clusters durch die vorhandenen Subklone erfasst wird. Ausgehend von sechs in Abb. 67 markierten DNA-Bereichen wurden Sequenzierprimer für die ersten Schritte des Primerwalkings abgeleitet. Der 0,5 kb-Bereich zwischen C12Not7 und G2B4,2 konnte auf Cos12 und Cos19 sequenziert werden. Alle von Ausgangspunkt 2 gestarteten Sequenzierläufe brachen immer genau nach der gleichen Base plötzlich ab (s. Abb. 69 A, Sequenz C12Not7/uni). Dieses Phänomen wird als "full stop" oder "hard stop" bezeichnet und deutet auf stabile DNA-Sekundärstrukturen hin. Auch Variationen in der Zusammensetzung des Sequenzieransatzes, wie der Zusatz von 5 % DMSO zur Destabilisierung der Sekundärstrukturen, brachten keine Verbesserung. Auch das Primerwalking von Ausgangspunkt 3 (s. Abb. 67) näherte sich der Stelle des Sequenzabbruchs, wobei ebenfalls stets ein full stop auftrat (s. Abb. 69 A, Sequenz C12Not7/G2L1-R4). Interessanterweise sind übliche für die PCR eingesetzte Polymerasen (vgl. 5.6.1.1) oft in der Lage auch über DNA-Sekundärstrukturen hinweg zu arbeiten [204]. Letztendlich war dies der entscheidende Hinweis zum Schließen der Sequenzlücke. Nach mehreren erfolglosen Sequenzierversuchen auf größeren PCR-Produkten (zum Beispiel L1, s. 5.6.3.3) ging ein Sequenzierlauf auf dem 0,3 kb Produkt L1a über die Lücke hinweg (Abb. 68 L1a/uni). Auch eine weitere Lücke (Abb. 68 und Abb. 69, im Bereich von H2) wurde erst durch Sequenzierung auf einem PCR-Produkt (L2, s. 5.6.3.3) geschlossen. Die lückenlose Clustersequenz wurde mit der Frameplot-Funktion der Artemis Software, durch die Identifizierung von Ribosomenbindungsstellen, Start- und Stoppcodons sowie einem Sequenzabgleich mit der NCBI-Datenbank annotiert (s. Abb. 72). Die rechte Begrenzung des Clusters lässt sich durch das Gen mecVIII definieren. Auf einer Sequenzlänge von 0,5 kb stromaufwärts von mecVIII wurden keine Genprodukte mit signifikanter Ähnlichkeit zu publizierten Proteinen festgestellt (NCBI-Datenbank). Auch die vollständig sequenzierten Sporenpigmentbiosynthesegencluster whiE, pksa, spp (s. Abb. 72) werden durch mecVIII-Analoga begrenzt. Auf der linken Seite ist das putative O-Methyltransferasegen mecIX das äußerste Gen mit direktem Bezug zur Polyketidbiosynthese. Die angrenzende Sequenz zeigt Ähnlichkeit zu Genen, die für sekretierte Proteine codieren. Tab. 12: Ermittelte open reading frames des mec-Sporenpigmentbiosynthesegenclusters auf dem mec-Contig. Angenommene Proteinfunktionen sind in Abb. 72 angegeben. AS: Größe des Genprodukts in Aminosäuren. ORF mecVIII mecI mecII mecIII mecIV Contigposition 488 - 2191 2787 - 3941 4067 - 4519 4516 - 5784 5781 - 7031 AS 567 384 150 422 416 ORF mecV mecVI mecVII mecIX Contigposition 7101 - 7358 7360 - 7839 7889 - 8221 9272C - 8277C AS 85 159 110 331 108 Ergebnisse P 0 [bp] N N B 1000 H1 2000 G2B4,2/G2B4,2-R2 G2B4,2/rev Cos12/G2Hyd-F1 Cos12/G2Hyd-R1 Cos19/G2Hyd-R1 Cos19/G2Hyd-F1 L1/G2L1-R5 C12Not7/uni L1a/uni C12Not7/G2L1-R4 L1pGem/G2L1-R4 C12Not7/KSaG2-R5 P B 2600 3600 4600 C12Not7/KSaG2-R5 L1pGem/G2L1-R3 L1pGem/G2L1-R2 C12Pst-6/rev L1pGem/G2L1-F2 C12Not7/KSaG2-R3 C12Pst-6/KSaG2-R1 Cos19/KSaG2-R2 C5KSa-pGem/uni P 5200 6200 Cos19/KSaG2-F2 Cos12/KSaG2-F1 7200 C5KSa-pGem/uni C12Pst-6/uni Cos12/KSaG2-F3 C12Not7/KSaG2-F5 7800 L2/C12Not7-R2 H2 8800 N C12Not7/KSaG2-F4 C12Not7/KSaG2-F6 P 9800 C12Not7/KSaG2-F6 L2/KSaG2-F7 C12Not7/C12Not7-R2 C12Not7/C12Not7-R1 C12Not7/rev C12Not4/rev C12Not4/C12Not4-R1 Abb. 68: Contigstrategie des mec-Clusters. Die durch Primerwalking oder durch Subklonansequenzierung erhaltenen Sequenzen sind als Pfeile dargestellt. Endonukleaseerkennungsstellen: B: BamHI, N: NotI, P: PstI. H1 / H2: hairpins (vgl. Abb. 69). Sequenzname: [Name des Subklons oder PCR-Produkts / Verwendeter Primer] (s. 5.6.3.3, 5.4.2.4). Die roten Sequenzen führten zur Sequenzierung von H1 / H2. Grüne Sequenzen stammen aus der zufälligen Subklonansequenzierung oder dem ksα-Screening mit degenerierten Primern (s. 3.3.3). 109 Ergebnisse Organisation der Transkription Die gewonnenen Sequenzdaten in den Bereichen von H1 und H2 (s. Abb. 69) offenbarten das Vorliegen von jeweils dicht beieinander liegenden invertierten Wiederholungen kurzer Basenfolgen (inverted repeats). Diese Konstellationen sind unter dem Begriff imperfekte Palindrome bekannt. Sie neigen zur Ausbildung von aus einem Einzelstrang bestehenden Haarnadelstrukturen (hairpins), die sich vom Beginn der ersten Sequenz bis zum Ende der Wiederholung erstrecken können. Die inverted repeats formen dabei den Stil, die zwischenliegende Sequenz eine Schleife. Die Stile von H1 / H2 weisen einen erstaunlich hohen G+C-Anteil auf. H1: 100 % G+C, H2: 94 % G+C. Da sich pro G-C-Paar drei Wasserstoffbrücken ausbilden können, widerstanden die hairpins den Sequenzierversuchen wohl derart hartnäckig. Innerhalb der imperfekten Palindrome, welche die postulierten hairpins H1 und H2 bilden, treten pro hairpin zwei echte Palindrome auf (s. Abb. 69, farbig gekennzeichnet). Bei H1 sind diese im Stil, bei H2 eher im Bereich der Schleife lokalisiert, ein weiteres Palindrom grenzt unmittelbar an H1. │ ACCACCCTGCTGGCGACGGCCTGACCCCACCTCACACGGCCGg Leserichtung B 2238 2209 A H1 C12Not7/uni ACA ACA G-C G-C G-C C-C C-G H1 C-G C-G G-C G-C C-G C-G G-C 2209 G-C C-G 2238 C-G G-C 2266 G-C C-G A C CTCAC GTCAT ....//.... GCGGTGCGCACCGC │ ccGGCCGCGTCATGCGGTGCCCGCCATCGTGCGGTGCGCAC C12Not7/G2L1-R4 AA G C C G G C T G G-C C-G A- T C-G H2 G-C G-C G-C C-G C-G G-C C-G C-G 8230 G-C G-C G-C C-G T T GCGGT CCCCG Abb. 69: A: Fluorenszenzchromatogramme der Sequenzierversuche von beiden Seiten des hairpins H1. (Bezeichnung der Sequenzen vgl. Abb. 68) B: H1 enthält zwei 12 nt lange palindromische Bereiche beidseitig des hairpin-Stils (violett bzw. blau). Eine weitere 14 nt lange palindromische Sequenz (grün) schließt sich in unmittelbarer Nähe an. Der Stil des postulierten hairpin H2 erstreckt sich über 16 nt. Auch hier wurden zwei Palindrome identifiziert (braun, beige); sie liegen im Kopfbereich von H2. Die Zahlen geben die Position auf dem mec-Contig wieder. 110 Ergebnisse Haarnadelstrukturen können zum Abbruch der DNA-Transkription führen [205]. In Einklang mit dieser Eigenschaft liegt H2 am Ende zweier Operons (s. Abb. 71). Auch für H1 kann eine Funktion als Transkriptionsterminator postuliert werden. Die Analoga der von H1 getrennten Gene mecVIII und mecI liegen meist in divergenter Orientierung vor (s. Abb. 72). Bei divergenter Orientierung können im intergenen Bereich zwischen VIII und I (bzw. deren Analoga) die Promotoren p2 und p1 identifiziert werden [206;207]. Interessanterweise befindet sich im nur wenige bp langen Bereich zwischen p2 und p1 eine hochkonservierte Basenfolge (vgl. Abb. 70). Was im DNA-Sequenzalignment der p2-Bereiche ebenfalls auffällt ist die geringe Ähnlichkeit der −35-Region. Es ist bekannt, dass bakterielle Promotoren mit geringem Konsensus der −35-Region von Transkriptionsaktivatoren abhängig sind. Diese binden an einer Sequenz stromaufwärts oder überlappend mit der −35-Region [208]. Wegen des geringen Abstands der divergenten p2 und p1 in den bisher untersuchten Clustern konnte der konservierte Bereich keinem Promotor exklusiv zugeordnet werden. Die Analyse der mecSequenz ergab, dass die konservierte Basenfolge nur einmal im Cluster vorliegt - unmittelbar stromaufwärts von p2, wodurch sich dieser Bereich nun dem p2-Promotor zuordnen lässt. konservierter Bereich p2-Promotor −35 Start whiEVIII Homolog −10 mec pksa CCTCTAAGCGGGTGA-AGCCTGCGCTCCGGTGGGTGGTGCGGGGCATGGATGAAGCCCC------47bp------ATG GCAGCAGGCGGGTGA-AGCCTGAGCCACTGTCACCTTCCCGGGGCATGCATGAGGATCT------50bp------ATG whiE whiESa sch GGGTTAAGCGGGTGA-AGCCTGCGCCGTGGCGGGCCCCGACGGGCCGTA-CGGGGCATGCATGAG----150bp-ATG GGATCAAGCGGGTGACAAGACGCGACTCGCCCGGGCAAGAACCCTGATCG-GGGGCATAAGGCGTCCA--34bp-ATG GGGTTAAGCGGGTGA-AGTGTGGTCCCCGGCGCACCGCGCTCCAGCCTCGCGGGGCATGCATGACCCC-169bp-ATG spp GGGTGAAGCGGGTGA-AACCGCACGGGTGAAGCGGGTGGAACAGAGGCTGAACCAGCCGGGTGAAT-----------------------------GGGGCGAGCGAACCCCTCCCGTCGGGGCATGGACTCCCT--108bp-GTG −35 −10 −35 TSP −10 Abb. 70: Bereiche des p2-Promotors in Sporenpigmentbiosynthesegenclustern. Der konservierte Bereich stromaufwärts der −35-Region, eine putative Regulatorbindestelle zwischen den divergent orientierten p1- und p2-Promotoren des whiE-, whiESa-, sch- und spp-Clusters, wird aufgrund einer vergleichenden Analyse mit dem mec- und pksa-Cluster dem p2-Promotor zugeordnet. TSP: Transkriptionsstartpunkt (unterstrichen, falls bekannt). Die Clusterkürzel werden bei Abb. 72 erläutert. p2 H1 p1 H2 mec VIII 1 kb Operon 2 I II III IV V VI VII IX Operon 1 Abb. 71: Hypothetische Operons des mec-Cluster. H1 / H2: hairpins; p2 / p1: Promotoren. Operon 3 111 Ergebnisse Bisherige Transkriptionsstudien offenbarten unterschiedliche Regulationsmechanismen für die von p2 und p1 kontrollierten Operons. So scheint nur p2 vom späten Sporulationssigmafaktor σF abhängig zu sein [206;207]. Von diesem Befund abgeleitet ist auch bezüglich des mec-Clusters von einer differenzierten Transkription der postulierten Operons 1 und 2 und damit von der Präsenz eines p1 analogen Promotors auszugehen (s. Abb. 71). Das dritte Operon des mec-Clusters enthält das putative Methyltransferasegen mecIX. Funktion der abgeleiteten Mec-Proteine Ein Abgleich der abgeleiteten Mec-Genprodukte mit der NCBI-Datenbank offenbarte eine herausragende Sequenzähnlichkeit mit Proteinen der Sporenpigmentbiosynthese in Arten der Gattung Streptomyces. Mit dem BLAST-Algorithmus (s. 5.14) wurden stets Werte zwischen 70 % und 90 % identischer Aminosäuren ermittelt, wobei das entsprechende Mec-Protein möglichst global mit dem analogen Sporenpigmentbiosyntheseprotein höchster Ähnlichkeit verglichen wurde. Darunter waren vor allem Enzyme die durch das spp oder pksa Cluster codiert werden. Wie aus Abb. 72 hervorgeht unterliegen alle Sporenpigmentbiosynthesegencluster einer konformen Organisation. Allein mecVIII und Analoga sind unterschiedlich orientiert. Die Methyltransferase (MecIX und Analoga) ist fakultativ. Hydroxylase KSα Monooxygenasen S. sp. Gö C4/4 mec S. collinus pksa S. avermitilis spp S. coelicolor whiE S. aureofaciens whiESa S. halstedii sch S. curacoi cur VIII KSβ ACP Methyltr. Aromatase Cyclase I II III IV V VI VII IX 7 8* 9 1 2 3 4 5 F G H A B C D E 2843** I II III IV V VI VII I II III A B 1 2 3 4' D C A B E FG VIII 'VIII 'C 1 kb 6 IV' Abb. 72: Clusteralignment bisher bekannter Sporenpigmentbiosynthesegencluster. S. sp. Gö C4/4 (diese Arbeit), Streptomyces collinus DSM2012 [209] *pksa8 ist ein Pseudogen mit internem Stoppcodon, vermutlich ein Sequenzfehler, Streptomyces avermitilis MA-4680 [69] ** das Gen SAV_2843 wurde nicht als Bestandteil des spp-Clusters definiert, Streptomyces coelicolor A3(2) [210], Streptomyces aureofaciens CCM3239 [207], Streptomyces halstedii [211], Streptomyces curacoi [212]. Methyltr. : Methyltransferase. 112 Ergebnisse Alle bisherigen Versuche, Sporenpigmente für die chemische Charakterisierung zu isolieren, schlugen fehl [213]. Deshalb ist die native Funktion der Biosyntheseenzyme nicht definitiv zu bestimmen. Die AS-Sequenzähnlichkeiten mit funktionell charakterisierten Proteinen der Biosynthese aromatischer Antibiotika / Zytostatika aus dem PKS II-Metabolismus lässt jedoch auch für Sporenpigmente von einer ähnlichen chemischen Grundstruktur ausgehen. Das Kernelement der Sporenpigmentbiosynthesegencluster stellen die Gene der minimalen Polyketidsynthase dar. Sie setzt sich aus mecIII (KSα), mecIV (KSβ) und mecV (ACP) zusammen und legt in erster Instanz die Länge der β-Ketidkette fest [24]. Die heterologe Expression der Gene der minimalen PKS des whiE-, sch- oder cur-Clusters führte zur Bildung aromatischer Dodecaketide (C24-Körper) im Wirtsbakterium. Daneben traten Decaketide auf, wenn nicht zusätzlich die mögliche Aromatase WhiE-ORFVI exprimiert wurde, weshalb diesem Enzym eine stabilisierende Wirkung auf die minimale PKS zugeschrieben wird [213]. Auch native Sporenpigmente scheinen sich aufgrund dieser Ergebnisse von Dodecaketiden abzuleiten. Das MecVI analoge Enzym WhiE-ORFVI wurde als Cyclase / Aromatase definiert, da es sowohl die Regioselektivität der ersten Cyclisierung beeinflusst, als auch die Aromatisierung des zweiten Rings katalysiert [214]. Die Funktion der Cyclase ähnlichen MecVII homologen Enzyme ist nicht bekannt. Auch für das MecII analoge WhiE-ORFII wurde zunächst eine Cyclaseaktivität postuliert [215], in vitro wurde dieses Enzym jedoch später als neuer Typ Chinon bildender Monooxygenasen charakterisiert [216]. Das zweite Enzym mit AS-Sequenzähnlichkeiten zu Monooxygenasen ist MecI; die Sequenz offenbart eine "antibiotic biosynthesis monooxygenase"-(Pfam03392)-Domäne [217], ist aber wie analoge Enzyme aus der Sporenpigmentbiosynthese mit 394 AS deutlich größer als ähnliche, meist Kofaktor unabhängige Enzyme mit Pfam03392-Domäne zu denen auch die Anthronoxygenasen zählen (vgl. 3.3.5.4). Wegen des Größenunterschieds wird über eine NAD(P) Bindungsstelle der MecI orthologen Sporenpigmentmonooxygenasen spekuliert [217]. WhiE-ORFI scheint außerdem eine Rolle beim Transport des Polyketids in die Sporen oder dessen dortige Verknüpfung zu spielen [210;213]. Das von mecVIII abgeleitete Protein ist einer Dichlorphenolhydroxylase aus Alcaligenes eutrophus ähnlich, Mutationen von whiEORFVIII führten zu einer Veränderung der Sporenfarbe [211;213]. Ein Zusammenhang der Hydroxylase mit der Sporenpigmentsynthese ist dadurch bestätigt. Unbekannt ist die Funktion der nur fakultativ auftretenden putativen Methyltransferase (MecIX und Analoga). Regulatorgene auf lokaler Ebene sucht man in allen Sporenpigmentbiosynthesegenclustern vergebens. Wie schon sehr frühe Experimente mit Streptomyces spp. zeigten unterliegt die Sporenpigmentation eher einer pleiotropen, als spezifischen Regulation [21]. Ergebnisse 113 3.3.4.2 Funktionsbeweis durch Geninaktivierung Wie die Erfahrung mit dem msc-Cluster zeigt (s. 3.3.2), können Sequenzanalysen keinen Funktionsbeweis erbringen. Dies ist einzig durch Geninaktivierung möglich. Akzeptiert wird allgemein auch ein Rückschluss auf die native Proteinfunktion ausgehend von Ergebnissen einer heterologen Expression oder eines In-vitro-Experiments. Die heterologe Expression von Cosmiden des mec-Clusters wird unter 3.3.5.1 beschrieben. Die Inaktivierung des Gens mecIII (ksα) als Nachweis einer Funktion des mec-Clusters in der Sporenpigmentbiosynthese von S. sp. Gö C4/4 ist Thema des folgenden Abschnitts. Erstellung des neuen Redirect-Plasmids pIJ774Spec Die bisher im Rahmen der [safe-knock]-Strategie (s. 5.8.2) eingesetzten Redirect-Kassetten können aufgrund flankierender FRT-sites optional per Flp-Rekombination (s. 5.9) entfernt werden. Im Verlauf der Arbeiten zeigte sich die auf loxP-sites basierende Cre-Rekombination jedoch als deutlich effektivere Methode [156]. Das analog zu pIJ785Spec erstellte Plasmid pIJ774Spec (Konstruktion s. 5.4.2.1) vereint die loxP-sites von pIJ774 mit der Spectinomycinresistenzkassette von pIJ778. Für alle folgenden Inaktivierungen wurde die Redirect-Kassette des neuen Plasmids pIJ774Spec verwendet. Inaktivierungsplasmid und Crossover Die Arbeiten zur Geninaktivierung wurden begonnen als erst Bruchstücke der mec-Clustersequenz vorlagen. Vom Subklon C12Not7 war bekannt, dass in der Mitte seines 7 kb großen Inserts das ksα-Gen mecIII liegt (s. 3.3.3.2). C12Not7 war damit ideal als Ausgangspunkt für eine Inaktivierung von mecIII nach der [safe-knock]-Strategie geeignet (s. 5.8.2.2). Bei der Konstruktion des Inaktivierungsplasmids p∆mecIII wurde ein 0,7 kb großer, interner Sequenzabschnitt von mecIII durch die Redirect-Kassette von pIJ774Spec ersetzt (s. 5.4.2.5). Die eingebrachte Resistenzkassette liegt auf p∆mecIII bewusst nicht in Leserichtung des Zielgens, um nach Integration ins Genom auch die Transkription mecIII nachgeschalteter Gene des gleichen Operons zu stören (vgl. 5.5.5.5). So sollte die schon häufig beobachtete Kreuzkomplementierung von PKS II-Genen [218] vermieden werden. Aus diesem Grund wurde die Mutation auch nicht in den Wildtyp S. sp. Gö C4/4, sondern in eine ∆msc15-Mutante (mit inaktiviertem ksβ-Gen des msc-Clusters, s. 3.3.2.5) eingeführt. Ziel der Inaktivierung war nicht die Aufklärung einer bestimmten Genfunktion (mecIII), sondern ein eindeutiger Funktionsnachweis für das mec-Cluster. Der Transfer des mutierten mecIII-Allels sowie die Selektion von Klonen nach erstem, bzw. zweitem Crossover erfolgte gemäß 5.8.2. Von 88, nach vier Passagen (flüssig→fest→flüssig→fest) in ein Selektionsraster übertragenen, spectinomycinresistenten Klonen wurden zwei Klone als apramycinsensitiv identifiziert. Für einen Klon wurde das mit Allelaustausch verbundene zweite CrossoverEreignis per PCR überprüft. Mit dem Primerpaar C12KSA-F / -R (s. 5.6.3.3) wurde vom Wildtypallel ein 1050 bp Produkt, vom mutierten Allel ein 1744 bp Amplifikat erwartet. Als 114 Ergebnisse Matrize für die PCR-Analyse diente genomische DNA der Stämme (s. 5.5.2.2) bzw. das Inaktivierungsplasmid p∆mecIII. Das Bild der Gelelektrophorese bestätigte über die detektierten Produktgrößen den Genotyp von Erst- und Doppelcrossover-Mutante bezüglich mecIII (s. Abb. 73). Die Doppelcrossover-Mutante wurde S. sp. Gö C4/4 ∆msc15 ∆mecIII genannt. 10 kb 8 kb 6 kb 5 kb 4 kb 3 kb 2,5 kb 2,0 kb 1,5 kb 1744 bp 1050 bp 1,0 kb 0,75 kb 0,50 kb 0,25 kb 1: S. sp. Gö C4/4 2: p∆mecIII 3: S. sp. Gö C4/4 ∆msc15 p∆mecIII erster Crossover 4: S. sp. Gö C4/4 ∆msc15 ∆mecIII Doppelcrossover L: 1 kb Leiter (Promega) 1 2 3 4 L Abb. 73: Agarosegelelektrophorese der PCR-Ansätze zur Genotypisierung bezüglich mecIII. Analyse der Mutante S. sp. Gö C4/4 ∆msc15 ∆mecIII Auf HA-Agar kultiviert beginnt S. sp. Gö C4/4 nach 4 - 5 Tagen mit dem Wachstum eines weißen Luftmyzels, das Fäden von unigenomischen, austrocknungsresistenten Sporen ausbildet. Die weiße Färbung der Kolonieoberfläche bleibt nur wenige Stunden bestehen. Eine durch Sporenpigmente bedingte Graufärbung setzt ein. Beim Passagieren der S. sp. Gö C4/4 ∆msc15 p∆mecIII Erstcrossover-Mutante konnte dieser Farbwechsel noch beobachtet werden. Nach dem zweiten Crossover-Ereignis hatte der Stamm S. sp. Gö C4/4 ∆msc15 ∆mecIII die Fähigkeit seine Sporen grau zu pigmentieren verloren. Die Kolonieoberfläche der Doppelcrossover-Mutante blieb weiß mit einem schwachen Gelbstich. Die Oberflächenmorphologie ähnelt der des Wildtyps, erscheint aber weniger regelmäßig. Der sich über der Agaroberfläche befindliche Teil der Kolonie ist im Gegensatz zum kissenartig, lockeren Wildtyp eher zusammengedrückt. Auch nach 14tägiger Inkubation (28 °C) von S. sp. Gö C4/4 ∆msc15 ∆mecIII kommt es nicht zur Graufärbung der Kolonie. Der angestrebte Funktionsbeweis des mec-Clusters ist damit erbracht. Den Genen kann eine Funktion bei der Sporenpigmentierung zugeordnet werden. Zu erklären gilt es noch, wieso die Erstcrossover-Mutante trotz des in das mec-Cluster integrierten Plasmids p∆mecIII noch in der Lage war, das graue Sporenpigment zu Ergebnisse 115 synthetisieren, denn bei den meisten Inaktivierungen ist das Zielgen bereits nach dem ersten Crossover nicht mehr funktionell. Da auf dem Plasmid p∆mecIII das gesamte mecIII enthaltende Operon vorliegt, ist ein Funktionsverlust beim ersten Crossover nicht obligat. Wenn das erste Crossover-Ereignis hinter (in Leserichtung des Operons) der eingeführten Mutation liegt - und das ist bei einer in der Insertmitte des Inaktivierungsplasmids liegenden Mutation mit einer Wahrscheinlichkeit von 50 % zu erwarten - so ist nach dem ersten Crossover noch eine intakte Kopie des Operons vorhanden (zur Veranschaulichung s. 5.8.1). Abb. 74: Sporenfarbe und Sporenmorphologie von S. sp. Gö C4/4 ∆msc15 ∆mecIII (oben) im Vergleich zu jener des Wildtyps (unten). Die LC/ESI-MS Analyse (Methode: mens03, s. 5.11.6) eines Ethylacetatextrakts von S. sp. Gö C4/4 ∆msc15 ∆mecIII nach Kultivierung in Flüssigkultur ließ beim Abgleich von Chromatogrammen der Absorptionswellenlängen 254 nm, 330 nm und 400 nm keine Unterschiede des Metabolitenspektrums im Vergleich zum Wildtyp erkennen. 116 Ergebnisse 3.3.5 Analyse des msn-Clusters (Mensacarcinsynthese) Durch Endsequenzierung von Subkloninserts waren DNA-Sequenzbruchstücke einzelner Gene des msn-Clusters bekannt (s. 3.3.3.2). Die Datenlage wurde durch Primerwalking ausgehend vom ksα-Gen verbessert (Daten nicht gezeigt). Zur funktionellen Charakterisierung wurden parallel die heterologe Expression von Cosmidinserts (s. 3.3.5.1) als auch die Inaktivierung grundlegender Gene des msn-Clusters (s. 3.3.5.2) begonnen. 3.3.5.1 Funktionsbeweis durch heterologe Expression Die heterologe Expression ist eine Möglichkeit, einzelne Gene oder größere DNA-Abschnitte funktionell zu charakterisieren. Der entsprechende DNA-Abschnitt wird dabei in einen heterologen Wirt eingebracht, der zuvor keinen derartigen Sequenzbereich in seinem Genom besaß. Von den durch die eingebrachte DNA hervorgerufenen Veränderungen beim Wirt wird auf die native Funktion des DNA-Bereichs im Donorstamm rückgeschlossen. Durch heterologe Expression sollten Cosmidinserts aller drei PKS II-Cluster untersucht werden. Besonderes Interesse galt dabei Cosmiden des msn-Clusters, dem bisher noch keine Funktion zugeordnet werden konnte. Die Cosmide 4 und 9 (Gruppe 1, msc-Cluster), 3 und 12 (Gruppe 2, mec-Cluster) sowie 2, 7, 17 und 18 (Gruppe 3, msn-Cluster) wurden nach Transformation von E. coli ET12567 pUZ8002 über intergenerische Konjugation in den heterologen Wirt Streptomyces albus (s. 5.3.1.4) eingebracht. Als Vertreter der gleichen Gattung wie S. sp. Gö C4/4 ist bei S. albus von einem ähnlichen Codongebrauch und vergleichbarer Bereitstellung von Vorläuferstoffen auszugehen. Gleichzeitig qualifiziert sich S. albus durch eine im HPLC-Chromatogramm nur diskret in Erscheinung tretende Sekundärstoffproduktion. Durch seine weiße Sporenfarbe (albus) eignet sich der Stamm eventuell zur Untersuchung des mec-Sporenpigmentbiosynthesegenclusters. Die Selektion der Konjuganten erfolgte entsprechend der Resistenzkassette des Cosmidvektors pOJ436 mit Apramycin (vgl. 5.4.1). Die Ethylacetatextrakte von Standardkulturen der Konjuganten in HA-Medium wurden per LC/ESI-MS analysiert. Einzig mit integriertem Cos2 konnte im Chromatogramm bei einer Absorptionswellenlänge von 254 nm ein neuer Peak detektiert werden. Die korrespondierenden Signale im MS-Diagramm des negativen Detektionsmodus haben m/z-Werte von 391 [M−H]− und 427 [M+Cl]−. Das Signal bei m/z = 427 zeigte das typische Intensitätsverhältnis der Isotopensatelliten für Ionen mit einem Chloratom (s. Abb. 75). Ein Abgleich mit dem Produktionsprofil von S. sp. Gö C4/4 sowie der Dissertation von Dr. M. Arnold [56] identifizierte die Substanz als Didesmethylmensacarcin, einen Biosynthesevorläufer von Mensacarcin. Die erzielte Menge an Didesmethylmensacarcin in S. albus ist mit der an Mensacarcin in S. sp. Gö C4/4 vergleichbar. Mit dieser erfolgreichen heterologen Expression von Cos2 war der Beweis erbracht, dass die auf dem Insert vorliegenden Gene an der Biosynthese von Mensacarcin beteiligt sind. Dieses Ergebnis gab den Ausschlag zur vollständigen Sequenzierung von Cos2 (s. 3.3.5.3). 117 Ergebnisse 80 400 40 [M−H] 0 100 250 350 nm 0 − − [M+Cl] O 400 430 m/z 0 0 10 20 30 OH OH OH O OH O 429 800 392 200 [%] 391 300 mAU 427 254 nm mAU 400 40 min O OH Didesmethylmensacarcin M: 392,11 Abb. 75: LC/ESI-MS-Analyse des Kulturextrakts von S. albus mit Cos2 von S. sp. Gö C4/4 (Methode: mens03). Außer auf ihr Produktspektrum wurden die Integrationsmutanten auf HA-Agarkulturen bezüglich ihrer Sporenfärbung betrachtet. Alle Mutanten zeigten die für S. albus typische weiße Oberfläche. Obwohl zumindest auf Cos12 das gesamte mec-Cluster vorliegt, kam es nicht zur Ausprägung des durch dieses Cluster vermittelten Merkmals (Graufärbung). Eine heterologe Expression von Genen der Sporenpigmentsynthese, die beim Wirt zu einer Farbänderung der Kulturoberfläche führt, wurde auch mit zuvor bekannten Sporenpigmentclustern nicht erreicht [213]. Dies wird auf die komplexe Regulation der Sporenpigmentbiosynthese oder das Sporentargeting der PKS II-Metaboliten zurückgeführt (vgl. 3.3.4). Heterologe Expression und Heptaketidproduktion Durch die heterologe Expression von Cos2 (Cosmidgruppe 3, msn-Cluster) konnte nun jedem PKS II-Cluster ein Sekundärmetabolit zugeordnet werden: msc-Cluster→Substanz MSC-X1, mec-Cluster→Sporenpigment, msn-Cluster→Mensacarcin. Nicht zuordnen ließen sich die beiden Heptaketide Mensalon und Aloesol, deren wenig reduziertes, aromatisches Gerüst einen biosynthetischen Ursprung aus einer PKS vom Typ II vermuten lässt. Daraus ergab sich die Hypothese, dass eines der drei identifizierten PKS II-Cluster neben seiner bekannten Funktion auch für die Biosynthese dieser beiden Strukturen verantwortlich ist. Zur Überprüfung der Hypothese wurden Konjuganten von S. albus mit Cosmiden aller drei Gruppen (Gruppe 1: Cos9, Gruppe 2: Cos12, Gruppe 3: Cos2) unter modifizierten Kulturbedingungen mit 2 % DMSO im Medium angezogen. Wie aus Abb. 76 hervorgeht führte nur Cos2 zur Produktion der Heptaketide (vgl. Abb. 56). Die Biosynthese von Mensalon und Aloesol kann damit den Msn-Enzymen zugeordnet werden. Bezeichnenderweise ging die Produktion der Heptaketide mit einer Repression der Didesmethylmensacarcinproduktion einher. 118 Ergebnisse (254 nm) mAU S. albus Cos2 + DMSO mAU 40 150 20 100 0 Mensalon mAU 40 Aloesol 20 300 400 nm 50 0 300 400 nm Didesmethyl-MSN 0 0 int. 400 10 m/z = 233 neg. 20 30 40 min. 30 40 min. 30 40 min. 30 40 min. S. albus Cos2 + DMSO 300 200 100 0 0 int. 400 10 m/z = 233 neg. 20 S. albus Cos9 + DMSO 300 200 100 0 0 int. 400 10 m/z = 233 neg. 20 S. albus Cos12 + DMSO 300 200 100 0 0 10 20 Abb. 76: Heterologe Expression von DNA des msn- (Cos2), msc- (Cos9) und mec- (Cos12) Clusters durch Cosmidinsertion in das Genom von S. albus. Kultivierung mit 2 % DMSO im Kulturmedium (LC/MS-Methode: mens03, s. 5.11.6). 3.3.5.2 Funktionsbeweis durch Geninaktivierung Die heterologe Expression hat gezeigt, dass auf Cos2 Proteine codiert werden, die im Wirt zur Produktion von Didesmethylmensacarcin führen. Daraus lässt sich eine Beteiligung des msnClusters an der Mensacarcinbiosynthese ableiten. Zu klären galt es, ob weitere Mensacarcinbiosynthesegencluster im Produzenten S. sp. Gö C4/4 vorliegen. Des Weiteren sollte durch Geninaktivierungen Einblick in eine mögliche Kreuzkomplementierung der drei PKS II-Cluster gewonnen werden. Ergebnisse 119 Zur Beantwortung dieser Fragen wurden drei Mutanten mit unterschiedlichen Gendefekten generiert: Eine Doppelmutante mit Defekt in den Genen der minimalen Msc- und Msn-PKS (S. sp. Gö C4/4 ∆msc15 ∆msnK1), eine Doppelmutante mit Defekt in den Genen der minimalen Msc-PKS sowie einer Mutation, die zur Inaktivierung von Teilen der erweiterten Msn-PKS führt (S. sp. Gö C4/4 ∆msc15 ∆msnO11C3) und drittens eine Einfachmutante mit Defekt in den Genen der minimalen Msn-PKS (S. sp. Gö C4/4 ∆msnK1). Inaktivierungsplasmide und Crossover Die Doppelmutanten sollten ausgehend von S. sp. Gö C4/4 ∆msc15, die Einfachmutante ausgehend vom Wildtyp jeweils über die [safe-knock]-Strategie (s. 5.8.2) erstellt werden. Dieses Vorhaben war eine Herausforderung, da die Sequenz des msn-Clusters noch nicht vorlag. Es wäre wünschenswert gewesen, analog zur ∆msc15-Inaktivierung (s. 3.3.2.5), auch im msn-Cluster das ksβ-Gen (msnK2) auszuschalten, um so eine mögliche Kreuzkomplementierung der minimalen Msc- und Msn-PKS zu vermeiden. Ein für die msnK2Inaktivierung geeigneter Subklon wurde bei der zufälligen Subklonerstellung jedoch nicht erhalten und die gezielte Subklonierung war ohne Clustersequenz nicht möglich. Anstelle von msnK2 wurde deshalb msnK1 (ksα-Gen) zur Inaktivierung ausgewählt, wobei die eingebrachte Resistenzkassette bewusst gegen die Leserichtung des Operons ausgerichtet wurde um auch einen inhibierenden Effekt auf die Transkription von msnK2 zu erreichen (vgl. Plasmidkarte von p∆msnK1 unter 5.4.2.5). Das aus dem Subklon C7Nco5 entstandene Inaktivierungsplasmid p∆msnK1 wurde zur Erstellung der Mutanten S. sp. Gö C4/4 ∆msc15 ∆msnK1 und S. sp. Gö C4/4 ∆msnK1 eingesetzt. Die dritte Mutante S. sp. Gö C4/4 ∆msc15 ∆msnO11C3 wurde zunächst nur als Sicherheit erstellt, falls es bei der anderen Doppelmutante zur Kreuzkomplementierung der minimalen PKS gekommen wäre, ergab aber später wertvolle Zusatzinformationen. Auf dem korrespondierenden Inaktivierungsplasmid p∆msnO11C3 (s. 5.4.2.5) liegt das Ketoreduktasegen msnO11 ohne Stoppcodon, das darauf folgende Cyclasegen msnC3 ohne Startcodon vor, was zur Inaktivierung beider Gene führen sollte. Bei der Selektion von S. sp. Gö C4/4 ∆msc15 ∆msnK1 wurden nach sechs Passagen sechs von 264 Klonen als spectinomycinresistent und apramycinsensitiv identifiziert. Für S. sp. Gö C4/4 ∆msnK1 waren dies nach vier Passagen zwölf von 264 Klonen, für S. sp. Gö C4/4 ∆msc15 ∆msnO11C2 zwei von 88 Klonen nach der vierten Passage. Von jeweils einem ausgewählten Klon wurde genomische DNA isoliert (s. 5.5.2.2) und per PCR (s. 5.6.1) genotypisiert. Eingesetzte Primer und erwartete Produktgrößen sind Tab. 13 zu entnehmen. 120 Ergebnisse Tab. 13: PCR zur Genotypisierung von Mutanten mit Defekt im msn-Cluster. Primerpaar C7KSA-F / -R C7KR-F / -R msnK1 msnO11C3 Wildtypallel 331 bp Produkt 974 bp Produkt mutiertes Allel 1486 bp Produkt 2258 bp Produkt 1: S. sp. Gö C4/4 10 kb 8 kb 6 kb 5 kb 4 kb 3 kb 2,5 kb 2,0 kb 1486 bp 1,5 kb 1,0 kb 0,75 kb 0,50 kb 1331 bp 0,25 kb 1 2 3 4 5 6 L 2: p∆msnK1 3: S. sp. Gö C4/4 ∆msc15 p∆msnK1 erster Crossover 4: S. sp. Gö C4/4 ∆msc15 ∆msnK1 Doppelcrossover 5: S. sp. Gö C4/4 p∆msnK1 erster Crossover 6: S. sp. Gö C4/4 ∆msnK1 Doppelcrossover L: 1 kb Leiter (Promega) Abb. 77: Agarosegelelektrophorese der PCR-Ansätze zur Genotypisierung bezüglich msnK1. 10 kb 8 kb 6 kb 5 kb 4 kb 3 kb 2,5 kb 2,0 kb 1,5 kb 2258 bp 2974 bp 1,0 kb 0,75 kb 0,50 kb 0,25 kb 1 2 3 4 1: S. sp. Gö C4/4 2: p∆msnO11C3 3: S. sp. Gö C4/4 ∆msc15 p∆msnO11C3 erster Crossover 4: S. sp. Gö C4/4 ∆msc15 ∆msnO11C3 Doppelcrossover L: 1 kb Leiter (Promega) L Abb. 78: Agarosegelelektrophorese der PCR-Ansätze zur Genotypisierung bezüglich msnO11 / C3. Wie aus Abb. 77 und Abb. 78 hervorgeht, zeigen die Mutanten den jeweils angestrebten Genotyp. 121 Ergebnisse Vergleichende Produktionsanalyse der Mutanten mit Gendefekt im msn-Cluster Die gewonnenen Mutanten sowie der Wildtyp von S. sp. Gö C4/4 wurden je in einer Standardkultur (s. 5.3.1.4) zur Mensacarcinproduktion angezogen. Die Ethylacetatextrakte wurden einer LC/ESI-MS Analyse unterzogen. Das Ergebnis ist in Abb. 79 dargestellt. Für keine der drei Mutanten lässt sich im UV-Absorptionschromatogramm ein Peak nachweisen, der auf Mensacarcin zurückzuführen ist. Mit der "extract ions" Funktion der ChemStation Software (s. 5.14) wurden MS-Diagramme für m/z = 419, den Wert des deprotonierten Molekülions von Mensacarcin, erstellt. In den MS-Diagrammen der Extrakte von S. sp. Gö C4/4 ∆msnK1 und S. sp. Gö C4/4 ∆msc15 ∆msnO11C3 traten bei der für Mensacarcin typischen Elutionszeit noch schwache Signale auf. Parallel zu Signalen bei m/z = 419 [M−H]− traten Ionen mit m/z = 455 [M+Cl]− sowie m/z = 863 [2M+Na]+ auf, was dem typischen Adduktspektrum von Mensacarcin entspricht. Keiner dieser m/z-Werte trat hingegen beim Extrakt der Doppelmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 auf. Dieses Ergebnis wird unter 4.5.2 diskutiert. 254 nm mAU 400 0 0 mAU 400 0 0 mAU 400 0 0 mAU 400 0 0 m/z = 419 negativ 10 20 30 40 min. 20 30 int. 1000 500 0 0 40 min. 10 20 30 40 min. 30 int. 1000 500 0 40 min. 0 10 20 30 40 min. 30 int. 1000 500 0 0 40 min. 10 20 30 40 min. ∆msnK1 10 ∆msc15 ∆msnO11C3 10 20 ∆msc15 ∆msnK1 10 int. max. > 8000 20 Wildtyp 10 Mensacarcin int. Mensacarcin 1000 500 0 30 40 min. 0 20 Abb. 79: LC/ESI-MS basierter Vergleich des Mensacarcingehalts in Ethylacetatextrakten von S. sp. Gö C4/4 Wildtyp und Mutanten mit Gendefekt im msn-Cluster. Links die Chromatogramme bei der Absorptionswellenlänge 254 nm, rechts die korrespondierenden MS-Diagramme für negative Ionen mit m/z = 419. (Methode: mens03, s. 5.11.6). Die Mutanten sollten auch auf ihr Potential zur Produktion der beiden Metaboliten Mensalon und Aloesol überprüft werden. Dazu wurde die Kultivierung unter Zugabe von 2 % DMSO wiederholt. Die für den m/z-Wert 234 (negativer Detektionsmodus) erstellten MS-Diagramme ergaben, dass sich die Produktion der Heptaketide parallel zur Mensacarcinproduktion verhält: S. sp. Gö C4/4 ∆msc15 produziert noch Spuren beider Substanzen, während im Extrakt der Doppelmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 kein Mensalon und Aloesol nachweisbar ist. Dieses Ergebnis unterstreicht die bei der heterologen Expression von Cos2 122 Ergebnisse postulierte Zuordnung der Heptaketide zum msn-Cluster und zeigt weiterhin, dass deren Produktion maßgeblich auf das msn-Cluster zurückzuführen ist. 3.3.5.3 Sequenzierung des msn-Clusters Nachdem durch die heterologe Expression und die Geninaktivierungen die Anwesenheit von Mensacarcinbiosynthesegenen auf Cos2 bewiesen war, konnte die Erschließung der gesamten msn-Clustersequenz angegangen werden. Der Auftrag zur Sequenzierung von Cos2 wurde an die Firma GATC (Konstanz) vergeben. Das gewählte Verfahren war eine ShotgunSubklonierung mit anschließender Endsequenzierung der Subklone per Sanger-Methode. Eine Probe der Cosmid-DNA wurde zunächst durch Scheren fragmentiert. Über eine präparative Agarosegelelektrophorese (vgl. 5.5.4.2) wurden Fragmente zwischen 2,0 kb und 2,5 kb isoliert und in den Sequenziervektor pSmart HC insertiert. 384 auf diese Weise entstandene Subklone wurden beidseitig auf einem ABI 3730xl-Sequenzierautomaten (Applied Biosystems) ansequenziert. Die von Vektorsequenzen befreiten Daten wurden mit der Software SeqMan aus dem Lasergene-Paket (s. 5.14) zu kontinuierlichen Sequenzabschnitten (Contigs) assembliert. Vier Contigs konnten aus insgesamt 593 Einzelsequenzen zusammengestellt werden. Es verblieben demnach vier Sequenzlücken auf der zirkulären Cosmid-DNA, von denen drei durch Primerwalking (s. 5.6.2.2) geschlossen werden konnten. Eine Lücke widerstand zunächst allen Bemühungen und wurde erst durch die Sequenzierung eines subklonierten PCR-Produkts mit Spezialprotokoll geschlossen. Imperfekte Palindrome, wie sie im mec-Cluster für DNA-Sekundärstrukturen verantwortlich gemacht wurden (vgl. 3.3.4.1), konnten in diesem Fall jedoch nicht festgestellt werden. Mit effektiv 6,4-facher Abdeckung wurden für Cos2 46333 bp durchgehende Sequenz gewonnen, von der 36742 bp auf das Insert entfallen. Sequenzierung der msn-Contigerweiterung Eine erste Analyse der Insertsequenz zeigte, dass Cos2 nicht die vollständige Sequenz des msn-Clusters beinhaltet. So fehlt zum Beispiel das bei der Ansequenzierung von Subklonen der Cosmide 7 und 18 identifizierte Methyltransferasegen (s. 3.3.3.2). Dieser Befund erklärt, warum die heterologe Expression von Cos2 nur zur Produktion des nicht methylierten Didesmethylmensacarcins führte (s. 3.3.5.1). Am linken Ende (bezogen auf Abb. 81) des Cos2-Inserts werden Transposasen und hypothetische Proteine codiert. Deshalb wurde von einer möglichen Fortsetzung des msn-Clusters jenseits vom rechten Ende ausgegangen. Dort liegt das Fragment eines Methioninsynthasegens. Eine identische Sequenz wurde mit dem uni-Primer (s. 5.6.2.1) für das Subkloninsert von C7Bgl6a (s. 5.4.2.4) erhalten. Auf C7Bgl6a und weiteren Subklonen von Cos7 oder Cos18 wurde per Primerwalking (s. 5.6.2.2) eine etwa 8 kb große Erweiterung des msn-Contigs erschlossen (s. Abb. 80). 123 Ergebnisse Position auf dem msn-Contig 36001 [bp] S 37001 38001 C7Bgl6a/uni Cos2/pOJ436-rev C7Bgl6a/Met-R1 C7Bgl6a/C7Bgl6a-F1 C7Bgl6a/Met-F1 C7Bgl6a/C7Bgl6a-F2 G3S2,7/rev C7Bgl6a/G3AK-F1 G3S2,7/G3S2,7-R1 B 38601 C7Bgl6a/G3AK-F1 G3S2,7/G3S2,7-R1 G3S2,7/uni E Bg Bg 41201 B S B 40601 G3S2,7/G3S2,7-R2 G3S2,0/uni C7Bgl6a/rev C7Eco6a/rev B 42201 C7Bgl6a/rev C7Eco6a/rev 43801 S 39601 43201 G3S2,0/rev C7Eco7-8-3/rev G3B2,0/rev G3S3,5/uni G3B2,0/uni G3S3,5/ G3S3,5-F1 G3S3,5/ G3S3,5-F2 44801 G3S3,5/ G3S3,5-F2 G3S3,5/ G3S3,5-F3 Abb. 80: Contigstrategie der msn-Erweiterung. Die durch Primerwalking oder durch Subklonansequenzierung erhaltenen Sequenzen sind als Pfeile in ihrer Leserichtung dargestellt. Endonukleaseerkennungsstellen: B: BamHI, Bg: BglII, E: EcoRI, S: SacI. Sequenzname: [Name des Subklons oder PCR-Produkts / verwendeter Primer] (s. 5.6.3.3 und 5.4.2.4). Die rote Sequenz wurde durch die Endsequenzierung von Cosmid 2 erhalten. Grüne Sequenzen stammen aus der zufälligen Subklonansequenzierung (s. 3.3.3). 124 Ergebnisse 3.3.5.4 Sequenzanalyse des msn-Clusters Vom Cos2-Insert zusammen mit der msn-Contigerweiterung wurde eine kontinuierliche Sequenz von 45562 bp zusammengestellt, deren G+C-Gehalt mit 68,1 mol % im typischen Bereich der G+C-reichen Genome von Streptomyces spp. liegt [144]. Die Degeneration des genetischen Codes lässt für die Codierung der gleichen Aminosäure unterschiedliche Basentripletts zu, wobei vor allem die dritte Triplettposition variabel ist. In G+C-reichen Genomen ist diese Position bevorzugt mit Guanidin und Cytidin besetzt, eine Besonderheit, welche die Bestimmung möglicher Leserahmen auf einem Sequenzabschnitt erlaubt [219]. Hierzu wurde die G+C-Frameplot-Funktion der Artemis-Software (s. 5.14) herangezogen. Das Programm nummeriert ausgehend von der ersten Sequenzposition alle Basen mit der Ziffernfolge 1-2-3 durch (wobei die 4. Base folglich wieder der Ziffer 1 zugeordnet wird). Im G+C-Frameplot wird der G+C-Gehalt auf jede Ziffer bezogen getrennt durch eine Kurve grafisch dargestellt. So ist zum Beispiel beim Anstieg der Kurve für die Ziffer 2 davon auszugehen, dass die Position 3 der eingegebenen Sequenz einer ersten Triplettposition entspricht, falls das Gen auf dem betrachteten Strang liegt. Bei Lage des Gens auf dem komplementären Strang bedeutet ein Anstieg der Kurve für die Ziffer 2, dass Position 4 auf dem komplementären Strang einer ersten Triplettposition entspricht. Durch den G+C-Frameplot wurden im ersten Analyseschritt auf jedem Strang ein mögliches Leseraster, sowie die ungefähre Lage der open reading frames (ORFs) bestimmt. Im zweiten Schritt wurde die Leserichtung definiert. Dazu wurden im Bereich der ORF-Grenzbereiche Startcodons (ATG, GTG) identifiziert und auf mögliche, stromaufwärts gelegene Ribosomenbindungsstellen [220;221] überprüft. Das nächste Stoppcodon im gewählten Leseraster bestimmt das Ende der ORFs. Wenn der durch Start- und Stoppcodon definierte Bereich mit der per G+C-Frameplot bestimmten Lage des ORFs übereinstimmte, konnte dieser vorläufig festgelegt werden. Die endgültige Annotierung erfolgte nach Abgleich mit ähnlichen Enzymen aus der NCBI-Datenbank (s. 5.14). Auf dem msn-Contig wurden 38 ORFs definiert. An beiden Contigenden werden Transposasen codiert, was die Spekulation erlaubt, dass das Mensacarcinbiosynthesegencluster über diese Insertionselemente im Genom von S. sp. Gö C4/4 verankert wurde. Das msn-Cluster liegt demnach zwischen Transposasegenen auf einem 38766 bp langen Abschnitt des msn-Contigs, der 33 ORFs (msnH1 - msnM6) beinhaltet (s. Abb. 81). Die minimale PKS vom Typ II wird von den Genen msnK1 - K3 codiert. Erweitert wird die PKS von Polyketid formenden Enzymen: den Cyclasen (MsnC1 - C3) sowie den Ketoreduktasen (MsnO1, MsnO10, MsnO11). Zahlreiche weitere Oxidoreduktasegene (msnO2, msnO4 - O9) können tailoring-Reaktionen zugeordnet werden. Erstaunlich ist dabei das Auftreten von drei ORFs mit Ähnlichkeiten zu Anthronoxygenasegenen (msnO5 - O7), bei nur einer Anthrachinol ähnlichen Konstellation im Mensacarcinmolekül. Einzigartig für PKS II-Cluster aus S. sp. Gö C4/4 ist die Präsenz von Genen, die für ein System ähnlich der bakteriellen Luciferase, nebst Kofaktorregenerierung codieren (msnO2 - O4, msnO8). Dem Aufbau des Methylgruppendonors S-Adenosylmethionin, sowie dem Methyltransfer wurden die Gene 125 Ergebnisse msnM1 - M6 zugeordnet. Zwei Gene (msnR1 - R2) konnten der Regulation der Mensacarcinbiosynthese zugeordnet werden. Außerdem finden sich noch acht ORFs unbekannter Funktion im Mensacarcinbiosynthesegencluster. In Tab. 14 werden für die msn-Genprodukte Funktionsvorschläge gemacht, die sich von bekannten Proteinen ähnlicher Aminosäuresequenz aus der NCBI-Datenbank ableiten (s. 5.14). Für die nachfolgende Besprechung wurden die msn-Gene gemäß ihrer Funktion zusammengefasst. -20 kb 0 kb 20 kb 40 kb Cosmid 7 Cosmid 17 Cosmid 18 Cosmid 2 Cosmid 20 B B B T1 H0 B B B H1 T2 H3 H2 O1 H4 0 kb B B B O3 K2 O2 H5 B B BamHI H6 O5 O6/7 O8 K3 C3 B H7 R2 K1 O4 C1 C2 O9/10 O11 R1 H8 10 kb 20 kb 30 kb minimale PKS Cyclasen Oxidoreduktasen Regulatoren Transposasen unbekannt M2 M1 M3 B B B M4 M6 M5 B T4 T3 40 kb SAM-Regeneration / Methyltransfer Abb. 81: Physikalische Karte des msn-Contigs. Die Positionierung des Contigs auf den Cosmiden der Gruppe 3 (s. 3.3.3.1) wurde durch Restriktionskartierung und Endsequenzierung der Cosmidinserts bestimmt (Sequenzierergebnisse unter 5.4.2.4). 126 Ergebnisse Tab. 14: Liste der auf dem msn-Contig identifizierten Gene unter Angabe der auf Ähnlichkeitsvergleichen basierenden vorgeschlagenen Proteinfunktionen. Msn Größe [AS] vorgeschlagene Funktion H0 231 T1 428 T2 (283) H1 411 H2 836 H3 217 H4 162 O1 248 O2 351 O3 173 unbekanntes Protein Transposase (Mutatorfamilie) Transposasefragmente, nicht funktionell unbekanntes Protein unbekanntes Protein unbekanntes Protein unbekanntes Protein Ketoacyl-(ACP)Reduktase, möglicherweise C-19-Ketoreduktase Luciferase ähnliche Oxidoreduktase Flavinreduktase H5 367 K2 Aminosäuresequenz-Ähnlichkeiten identisch / positiv [%] 67 / 77 66 / 81 70 / 78 33 / 44 25 / 37 44 / 54 25 / 41 38 / 53 VirN (Streptomyces virginiae), BAF50713, [226] 45 / 64 Gra-ORF34 (Streptomyces violaceoruber), CAA09661, [227;228] MAV_5060 (Mycobacterium avium 104), YP_884178, [229] Ara-ORF10 (Streptomyces echinatus), ABL09958, [54] Ara-ORF11 (Streptomyces echinatus), ABL09959, [54] SnoaW (Streptomyces nogalater), AAF01810, [230] Sare_0634 (Salinispora arenicola CNS-205), YP_001535548, [231] VirN (Streptomyces virginiae), BAF50713, [226] 35 / 56 401 K1 421 KSα 78 / 86 H6 281 unbekanntes Protein 49 / 58 70 / 80 44 / 54 359 O5 101 C1 415 O6 105 O7 104 C2 307 O8 334 Luciferase ähnliche Oxidoreduktase Monooxygenase, Anthronoxygenase ähnlich Cyclase / Dehydratase Monooxygenase, Anthronoxygenase ähnlich Monooxygenase, Anthronoxygenase ähnlich Cyclase (2. Ring) Luciferase ähnliche Oxidoreduktase, möglicherweise Methylen-H4MPT Reduktase SACE_0882 (Saccharopolyspora erythraea NRRL 2338), YP_001103141, [175] Nfa44340 (Nocardia farcinica IFM 10152), YP_120649, [223] SAMR0662 (Streptomyces ambofaciens ATCC 23877), CAJ88372, [187] RSp0695 (Ralstonia solanacearum), CAD17846, [224] BenL* (Streptomyces sp. A2991200), CAM58804, [225] 52 / 67 möglicherweise Phosphotransferase KSβ O4 angenommene Proteinfunktion (Herkunft), NCBI accession number, Referenz Strop_0640 (Salinispora tropica CNB-440), YP_001157497, [222] RHA1_ro08487 (Rhodococcus sp. RHA1), YP_707689, [132] SCO0083 (Streptomyces coelicolor A3(2)), NP_624431, [70] 53 / 67 32 / 48 27 / 42 33 / 47 30 / 51 31 / 52 34 / 48 36 / 50 52 / 66 41 / 56 AknX* (Streptomyces galilaeus), AAF70105, [185] ChaH (Streptomyces chartreusis), CAH10167, [232] RdmK (Streptomyces purpurascens), AAL24453, [233;234] AknX* (Streptomyces galilaeus), AAF70105, [185] ChaH (Streptomyces chartreusis), CAH10167, [232] AknX* (Streptomyces galilaeus), AAF70105, [185] ChaH (Streptomyces chartreusis), CAH10167, [232] ActIV* (Streptomyces coelicolor A3(2)), NP_629241, [235] MXAN_3632 (Myxococcus xanthus DK 1622), YP_631819, [181] Ergebnisse Msn Größe [AS] vorgeschlagene Funktion O9 323 O10 260 K3 98 Oxidoreduktase, zinkbindend, möglicherweise NADPH:Chinonreduktase Ketoacyl-(ACP)Reduktase ACP O11 261 C3 314 Ketoacyl-(ACP)Reduktase, C-9-Ketoreduktase, Cyclase / Dehydratase Aminosäuresequenz-Ähnlichkeiten identisch / positiv [%] 49 / 68 46 / 66 angenommene Proteinfunktion (Herkunft), NCBI accession number, Referenz GrhO7 (Streptomyces sp. JP95), AAM33674, [169] (Act) ORF2 (Streptomyces coelicolor A3(2)), CAA44234, [70] 43 / 60 3-oxoacyl-[ACP] reductase (Saccharopolyspora erythraea NRRL 2338), YP_001108352, [175] SimA3 (Streptomyces antibioticus), AAK06786, [236] ActIII* (Streptomyces coelicolor A3(2)), P16544, [237], Funktionsbeweis [238;239] 53 / 78 63 / 76 67 / 78 57 / 70 R1 283 H7 303 H8 111 R2 947 M1 487 M2 301 M3 1164 Regulator, SARP-Familie mögliche Hydrolase Fragment eines Transmembrantransporters Regulator, LuxR-Familie Adenosylhomocysteinase N5,N10-Methylentetrahydrofolatreduktase Methioninsynthase 90 / 94 M4 327 Adenosinkinase 69 / 80 M5 406 SAM-Synthetase 92 / 94 M6 T3 345 441 Methyltransferase Transposase 36 / 54 50 / 65 T4 199 Transposasefragment * Funktion experimentell belegt. 127 42 / 61 56 / 67 75 / 84 30 / 43 91 / 96 81 / 88 58 / 66 SimA5 (Streptomyces antibioticus), AAK06788, [236] Med-ORF19 (Streptomyces sp. AM-7161), BAC79027, [168] Lct15 (Streptomyces rishiriensis), ABX71098, [240] CvmH (Streptomyces clavuligerus), ABK96924, [241] KinJ (Streptomyces murayamaensis), AAO65354, [242] Franean1_4833 (Frankia sp. EAN1pec), ABW14199, [182] Fnq16 (Streptomyces cinnamonensis), CAL34094, [243] MetF (Streptomyces fradiae), AAK98793, [244] SCO1657 (Streptomyces coelicolor A3(2)), NP_625932, [70] SfmS4 (Streptomyces lavendulae), ABI22143, [245] SAV_6874 (Streptomyces avermitilis MA-4680), NP_828050, [69] OxyF*(Streptomyces rimosus), AAZ78330, [246] Franean1_2958 (Frankia sp. EAN1pec), YP_001507284, [182] SAV_115 (Streptomyces avermitilis MA-4680), NP_821289, [69] 128 Ergebnisse Enzyme der Polyketidsynthese Die minimale Polyketidsynthase vom Typ II setzt sich aus den Genprodukten von msnK1 - K3 zusammen. Die Anordnung der Gene weicht von der üblichen Architektur in PKS II-Clustern ab, nach der die minimale PKS auf einer zusammenhängenden Kassette in der Reihenfolge ksα-ksβ-acp codiert wird [247]. Im msn-Cluster sind die Gene für das KSα / KSβ-Heterodimer räumlich vom acp-Gen getrennt und gehören zu einem anderen Operon. Ähnliche Konstellationen sind aus der Fachliteratur bekannt (Resistomycin [247], R1128 [248], Griseorhodin [169], Doxorubicin [249], Medermycin [168]). Interessanterweise sind in jedem der PKS II-Cluster ksα und ksβ hintereinandergeschaltet, wonach dies als kleinster gemeinsamer Nenner der minimalen PKS-Architektur definiert werden kann. Die Elemente der minimalen Msn-PKS zeigen hohe AS-Sequenzähnlichkeit mit Analoga aus der Biosynthese aromatischer Polyketide in Streptomyces spp. . Insbesondere die phylogenetische Einordnung der KSα ist oft mit dem Cyclisierungsmodus des PKS IIMetaboliten verknüpfbar [201]. MsnK1 jedoch lässt sich keiner der bekannten Klassen eindeutig zuordnen. Ein Ergebnis, dass nicht überrascht, da Mensacarcin einen bisher einzigartigen Cyclisierungsmodus aufweist (s. 1.3.5). Die gemäß Datenbankabgleich per BLAST-Algorithmus (s. 5.14) nächsten Verwandten von MsnK1 stammen aus der Anthrazyklin-, Anguzyklin- und Aureolsäurebiosynthese. Gene, die auf ein alternatives PKS-Priming hinweisen, wie zum Beispiel ein weiteres Ketosynthase-, Acyltransferase- oder acp-Gen, sind im msn-Cluster nicht anzutreffen. Dieser Befund steht in Einklang mit den Ergebnissen der Fütterung Isotop markierter Vorstufen, wonach Acetat als formale Startereinheit der Mensacarcinbiosynthese bestimmt wurde (s. 4.5.3). Zum PKS II-Multienzymkomplex sind außer der minimalen PKS noch drei Ketoacyl-(ACP)Reduktasen (MsnO1, -O10, -O11) sowie drei Cyclasen / Aromatasen (MsnC1 - C3) zuzuordnen. Erst vor kurzem wurde von Lackner et al. (2007) [250] gezeigt, dass sich aus der AS-Sequenz von Ketoreduktasen eine Vorhersage treffen lässt, welche Position des PKSMetaboliten durch das Enzym reduziert wird. MsnO11 weist eine hohe Ähnlichkeit zu verschiedenen C-9-Ketoreduktasen auf, die in der Klasse der Anthrazykline, Tetrazykline und Benzoisochromanchinone entscheidenden Einfluss auf die regioselektive 7,12-Cyclisierung des ersten Rings haben [23]. Eine weniger deutliche Aussage ist für die putative Ketoreduktase MsnO1 möglich, deren Sequenz beim BLAST-Datenbankabgleich außer der C-19-Ketoreduktase BenL [250] ausschließlich 3-Ketoacyl-(ACP)-Reduktasen der bakteriellen Fettsäuresynthese als signifikante Treffer ergab. Die Struktur der dritten putativen Ketoacyl-(ACP)-Reduktase MsnO10 enthält, wie auch MsnO1 und MsnO11, eine für diese Enzymfamilie charakteristische FabG-Domäne. Zu MsnO10 verwandte Enzyme stammen aus der bakteriellen Fettsäuresynthese, ein ähnlicher Vertreter aus PKS II-Clustern wurde in der NCBI-Datenbank noch nicht publiziert. Ergebnisse 129 MsnC2 weist Sequenzähnlichkeit zu Cyclasen auf, die für die Cyclisierung des zweiten Rings von PKS II-Metaboliten verantwortlich gemacht werden. Die Funktion der mit 52 % identischen Aminosäuren ähnlichen Cyclase ActIV der Actinorhodinbiosynthese wurde experimentell bestätigt [235]. MsnC1 und MsnC3 zeigen Ähnlichkeiten zu bifunktionalen Cyclasen / Dehydratasen, MsnC3 unter anderem zum Enzym Med-ORF19, einer putativen Aromatase des ersten Rings in der Biosynthese des Benzoisochromanchinons Medermycin [168]. Mit 415 AS ist MsnC1 etwa 100 AS länger als die meisten Aromatasen. Nur RdmK (s. Tab. 14) und AknE1 aus Streptomyces galilaeus [173] zeigen über die gesamte Sequenz Ähnlichkeit zur MsnC1. Beide Enzyme sind auf Anthrazyklinbiosynthesegenclustern codiert und werden der Aromatisierung des ersten Rings zugeordnet. Ein Funktionsbeweis steht noch aus. Typisch für Cyclasen und Aromatasen ist ihr domänenartiger Aufbau und die damit verbundene Multifunktionalität [23]. Enzyme mit einer Domäne haben eine Größe von ca. 150 AS (zum Beispiel SnoO aus S. nogalater [251]), zwei Domänen führen zu einer Länge von ca. 310 AS (zum Beispiel ActIV, s. o. oder SnoE [179]), zu den seltenen Dreidomänen-Cyclasen mit einer Sequenzlänge von über 400 AS gehören bisher nur RdmK, AknE1 und MsnC1. Der N-Terminus (ca. 200 AS) dieser Enzyme gleicht den Zweidomänen-Cyclasen (ChaF [232], 34 % ID), der Carboxylterminus teilt 40 - 50 % identische Aminosäuren mit einer Reihe von Enzymen, die bisher nicht funktionell charakterisiert wurden (AknV [252], OxyI [246], SnoO [179]). Die noch kleine Familie der Dreidomänen-Cyclasen stellt sich somit als interessantes Target für Funktionalitätsstudien dar. 130 Ergebnisse Enzyme mit Ähnlichkeit zur bakteriellen Luciferase Die Genprodukte von msnO2, msnO4 und msnO8 haben Sequenzähnlichkeit zu Untereinheiten der bakteriellen Luciferase, die in Vibrio harveyi für die Entstehung von Biolumineszenz verantwortlich ist [253]. Über einen Abgleich mit der Pfam-Datenbank des Sanger-Instituts (s. 5.14) wurde für die drei Enzyme ein signifikanter Konsens mit der Domäne der Familie Pfam00296 (Luciferase ähnliche Monooxygenasen) festgestellt. Ein paarweiser Vergleich verschiedener Pfam00296-Proteine deckte auf, dass MsnO8 und Msc32 aus S. sp. Gö C4/4 eine eigene Untergruppe bilden, wie auch aus dem mit der MegAlign Software (s. 5.14) nach Clustal W-Alignment erstellten phylogenetischen Stammbaum (Abb. 82) hervorgeht. LuxA LuxB GdnG Msc32 MsnO8 MitH Y4wf Msc21 MsnO2 MsnO4 VirN SnaA SnaB LmbY 312.3 300 250 200 150 100 Nucleotide Substitutions (x100) 50 0 Abb. 82: Phylogenetischer Stammbaum der bakteriellen Luciferase aus V. harveyi Untereinheit A (LuxA), Untereinheit B (LuxB) und ähnlichen Proteinen aus S. sp. Gö C4/4 (MsnO2 - O4, Msc21, Msc32), Streptomyces virginiae (VirN, Virginiamycin [226]), Rhizobium sp. NGR234 (Y4wf, keiner Biosynthese zugeordnet [254]), Streptomyces lavendulae (MitH, Mitomycin [163]), Streptomyces hygroscopicus 17997 (GdnG, Geldanamycin [255;256]), Streptomyces lincolnensis 78-11 (LmbY, Lincomycin A [257;258]), Streptomyces pristinaespiralis (SnaA, SnaB Heterodimer, Pristinamycin (=Virginiamycin) [259], Gencluster unbekannt). Tatsächlich teilen MsnO2 / O4, Msc21 und VirN im paarweisen Vergleich über 50 % identische Aminosäuren, was auch innerhalb der Gruppe MsnO8 / Msc32 gilt. Proteine der ersten Gruppe haben jedoch nur ca. 20 % gemeinsame Aminosäuren mit denen der MsnO8 / Msc32-Gruppe. Auf der Suche (NCBI conserved domain search) nach Unterschieden wurde nur in den Sequenzen von MsnO8 / Msc32 ein Motiv (COG2141) identifiziert, das für Coenzym F420-abhängige N5,N10-Methylen-tetrahydromethanopterin (Methylen-H4MPT) Reduktasen charakteristisch ist. Im Gegensatz zur bakteriellen Luciferase verwenden diese Luciferase ähnlichen Oxidoreduktasen nicht FNM, sondern Coenzym F420 als Kofaktor. Die Bindungsstelle beider Flavinderivate sind jedoch sehr ähnlich [260] (vgl. Abb. 83). Im Mensacarcinbiosynthesegencluster grenzt sich msnO8 von msnO2 / O4 ab, was auf eine eigenständige Funktion des Genprodukts schließen lässt. Dies wird auch durch die Tatsache 131 Ergebnisse unterstützt, dass kristallisierte Methylen-H4MPT Reduktasen als Homodimer vorliegen [260;261]. MsnO2 / O4 hingegen könnten wie auch die bakterielle Luciferase als Heterodimer vorliegen [262]. Eine Hypothese, die mit einem Sequenzalignment im Bereich der Kofaktorbindungsstelle verfolgt wurde (s. Abb. 83). Histidin 44 LuxA MsnO2 MsnO4 MsnO8 Msc21 Msc32 VirN Y4wf MitH GdnG LmbY SnaA SnaB LuxB 37 38 40 37 38 37 75 44 37 40 29 63 35 37 DTVWLLEHHFTEFGLLG HHVKTVEHYFSAYGGYS FQVKLVEHYFFDYGGYS ERFWVAEHHAEIFNAVP HHVKTVEHYFHEYGGYS HRYWFAEHHATPSFAGP EHAQIVEHYGSPYGGYS YAYHLAEHHFSPHGRSP DYAFSVEHHCTPHESWM DHVWCPEHHFLEEYSHM DHAWTYDHVKWRWLSDR VWGTRLDSLCRTSRTEH DAVLIDDRAAAG-VQGR DTLAVYENHFSNNGVVG Arginin 107 96 98 100 96 98 96 135 103 97 102 91 122 93 96 MSKGRFRFGICRGLYDK LSHGRLDVGFGRGFLPE ISGGRLDVGFGRAFLPD LYPDRIDLGIGRAN-RV ISQGRLDVGFGRAFLPD LSPGRIDLGVGRGIGAG LSHGRLDVGFGRAFLPD LSGGRAELGIGRGSLPI LLGGRLEVGLASGVSRD LSDGRVDFGTGESTTPT ISGGRFLCGVGSGGPDR LSGGRAGWNVVTSAAPW LAHGRTGW--------MSEGRFAFGFSDCEKSA Abb. 83: Clustal W-Alignment der Aminosäuresequenzen im Bereich des aktiven Zentrums. Für die Funktionalität der bakteriellen Luciferase werden unter anderem Histidin 44 und Arginin 107 als essentiell angesehen (s. Text). Die Kurzbezeichnungen der Proteine sind bei Abb. 82 erläutert. Die Bindungsstellen für FMN und das aliphatische Aldehydsubstrat an der Struktur der bakteriellen Luciferase aus V. harveyi konnten noch nicht über Röntgenstrukturanalysen bestätigt werden. Mutageneseexperimente zeigten die essentielle Rolle von Histidin 44 für die Biolumineszenzaktivität [263;264]. Auch bei Arginin 107, das vermutlich über eine Wasserstoffbrücke mit dem Phosphatrest von FMN verbunden ist [262], führte ein durch Punktmutation herbeigeführter Aminosäurenaustausch zur deutlichen Reduzierung der Aktivität [265]. Beide Aminosäuren fehlen in der Untereinheit B des A / B-Heterodimers der bakteriellen Luciferase. B / B-Homodimere zeigen eine deutlich geringere Aktivität als A / A-Homodimere [266]. Durch ein Sequenzalignment nach dem Clustal W-Algorithmus (s. 5.14) wurden Äquivalente zu His 44 und Arg 107 in Luciferase ähnlichen Proteinen identifiziert (s. Abb. 83). Analog zu LuxA / B wären die katalytisch wichtigen Aminosäuren auch bei MsnO2 / O4 nur in einer Untereinheit zu erwarten. Erstaunlicherweise sind sie jedoch in allen Msn- und Msc-Proteinen zu finden. Dieses Ergebnis lässt die Frage offen, ob MsnO2 / O4 als Heterodimer für eine Oxygenierung verantwortlich sind oder jeweils als Homodimer unterschiedliche Funktionen erfüllen. Enzyme mit Ähnlichkeit zur bakteriellen Luciferase spielen eine Rolle in unterschiedlichen Sekundärstoffbiosynthesewegen: VirN, SnaA / B (Virginiamycin M, PKS I-NRPS-Hybrid), MitH (Mitomycin, Shikimisäure-Glucosamin-Hybrid), GdnG (Geldanamycin, ShikimisäurePKS I-Hybrid) und LmbY (Lincomycin A, L-Thyrosin+Ribose-5-Phosphat). Die durch diese Proteine katalysierten Reaktionen sind wenig erforscht. SnaA / B sind für die Einführung der Doppelbindung in den Prolylrest von Virginiamycin M1 132 Ergebnisse (= Pristinamycin PIIA) verantwortlich, wobei eine Hydroxylierung mit anschließender Dehydratisierung postuliert wird [259]. VirN katalysiert möglicherweise die gleiche Reaktion in S. virginiae [226]. LmbY ist essentiell für die Synthese des Lincomycinvorläufers Propylprolin, wie Mutageneseexperimente zeigten [258]. Für MitH wird eine Rolle bei der Reduktion der Carboxylgruppe von AHBA (3-Amino-5-hydroxybenzoesäure) vor Einführung der Methylgruppe angenommen. Die Inaktivierung des Gens mitH unterbindet die Produktion von Mitomycin C [163]. O OH N H O O O N O N NH Mitomycin A O H3CO CH3 HO H N OH H3C O OH Lincomycin A N O Virginiamycin M1 O OCH3 H3C O CH3 N C3H7 OCONH2 O H3CO OH SCH3 H3CO O N H O CH3 H3CO OH H3C CH3 OCOONH2 Geldanamycin Abb. 84: Strukturen von Sekundärmetaboliten in deren Biosynthesegencluster Luciferase ähnliche Oxidoreduktasen codiert werden. Der Vergleich mit ähnlichen Enzymen erlaubt wegen nur bedingt vorhandener Strukturhomologien der betrachteten Sekundärstoffe mit dem PKS II-Metaboliten Mensacarcin keinen Rückschluss für die Funktion von MsnO2 / O4 / O8 in der Mensacarcinbiosynthese, macht aber die essentielle Rolle von Luciferase ähnlichen Oxidoreduktasen im Sekundärstoffwechsel deutlich. Ergebnisse 133 Die FMN-Reduktase MsnO3 In Analogie zum Zwei-Komponentensystem der bakteriellen Luciferase aus V. harveyi [253] steht auch für die Mensacarcinbiosynthese neben drei Luciferase ähnlichen Oxidoreduktasen (MsnO2, MsnO4, MsnO8) mit dem Genprodukt von msnO3 eine Flavinreduktase zur Verfügung. Unter anderem teilt MsnO3 ca. 30 % identische Aminosäuren mit den als Homodimer vorliegenden Enzymen ActVB [267], SnaC [259], die FMN(ox) mit NADH reduzieren, was in vitro gezeigt wurde. Eine äquivalente Funktion kann auch für MsnO3 vorgeschlagen werden. Der Kofaktor des Enzyms lässt sich nicht über AS-Sequenzähnlichkeiten, sondern nur experimentell bestimmen. Drei Anthronoxygenasen in der Biosynthese eines Anthrachinonderivats Über die gesamte Sequenz der je nur etwa 100 AS großen Genprodukte von msnO5 - O7 erstreckt sich eine Domäne der Familie Pfam03392 (= antibiotic biosynthesis monooxygenases). Bei bisher funktionell charakterisierten Proteinen mit dieser Domäne und einer Sequenzlänge von unter 140 AS handelte es sich um Untereinheiten von als Homodimer [165] oder Homotrimer [268;269] vorliegenden Anthronoxygenasen. Dies sind kofaktorunabhängige Monooxygenasen, die Anthron- oder Anthranolderivate mit molekularem Sauerstoff zum Anthrachinon oxidieren. Aufgrund einer Kokristallisation wurde für ActVA-ORF6 ein Mechanismus, analog zur Autooxidation von Dithranol postuliert [165]. Der erste Schritt ist eine Deprotonierung der Hydroxylgruppe des mittleren Ringes des Anthranols. Die negative Ladung kann zwischen benachbarten α-Hydroxylgruppen auf der gleichen Seite stabilisiert werden. Bei Verlagerung der negativen Ladung auf das sekundäre Kohlenstoffatom auf der gegenüberliegenden Seite des mittleren Rings findet dort die Reaktion mit molekularem Sauerstoff statt. Aus einem angenommenen Peroxy-Intermediat geht nach Protonierung und Wasserabspaltung das Anthrachinon hervor [165]. Ein analoger Mechanismus ist für die C5-Oxygenierung von Mensacarcin denkbar. Für das Vorliegen von drei Anthronoxygenase ähnlichen msn-Genen bei nur einer Anthronoxygenierung der Mensacarcinbiosynthese gibt es verschiedene Erklärungsmöglichkeiten: 1. MsnO5 - O7 arbeiten als Multimer. 2. Teilweise handelt es sich um redundante Gene. 3. Msn O5 - O7 katalysieren eine von der Anthronoxygenierung abweichende Reaktion. Auch Kombinationen der drei Vorschläge sind möglich. Biosynthesegencluster mit mehreren Anthronoxygenase ähnlichen Genen sind aus der PKS IIGruppe des Pradimicintyps bekannt (vgl. Abb. 85). Die Funktion der Genprodukte wurde bisher noch nicht experimentell belegt [270]. 134 Ergebnisse DauG DnrG SnoaB StfOI AknX CosX Hed-Orf27 MtmOIII PokO3 OxyG Msc27 MsnO7 ChaH GrhU Prm-Orf8 FdmP FdmJ FdmQ Prm-Orf9 GrhV RubT FrnU ElmH TcmH ActVA-Orf6 Pyr21 MsnO5 MsnO6 198.8 180 160 140 120 100 80 60 40 Nucleotide Substitutions (x100) 20 Anthrazyklin Hedamycin Aureolsäuren Tetrazyklin MSC Mensacarcin Chartreusin Pradimicin Benzoisochromanchinon (BICQ) Tetracenomycin BICQ Pyrrolomycin Mensacarcin 0 Abb. 85: Phylogenetischer Stammbaum von Anthronoxygenase ähnlichen Proteinen. Das Alignment basiert auf dem Clustal W-Algorithmus (s. 5.14). DauG (NCBI: AAA87617): Daunorubicin [271], DnrG (AAA65205) Doxorubicin [249], SnoaB (CAA12015) Nogalamycin [179], StfOI (CAJ42321) Steffimycin [272], AknX (BAB72044) Aclacinomycin [185], CoxX (ABC00737) Cosmomycin [174], Hed-Orf27 (AAP85340) Hedamycin [273], MtmOIII (CAK50778) Mithramycin [274], PokO3 (nicht in Genbank) Polyketomycin [38], OxyG (AAZ78331) Oxytetrazyklin [246], ChaH (CAH10167) Chartreusin [232], GrhU (Q8KSW0) GrhV (Q8KSV9) Griseorhodin [169], Prm-Orf8 (O32458) Prm-Orf9 (O32459) Pradimicin [275], FdmJ (AAQ08920) FdmP (AAQ08927) FdmQ (AAQ08928) Fredericamycin [270], RubT (Q8KY33) β-Rubromycin [laut Genbank], FrnU (AAC18116) Frenolicin [276], ElmH (AAF73051) Elloramycin [277], TcmH (ABK70908) Tetracenomycin [268], ActVA-Orf6 (1LQ9_A) Actinorhodin [269], Pyr21 (ABO15857) Pyrrolomycin [278]. Für den phylogenetischen Stammbaum der Anthronoxygenase ähnlichen Proteine wurden aus der Datenbank des Sanger Instituts, die Einträge mit Pfam03392-Domäne und einer Sequenzlänge unter 140 AS ausgewählt und zusammen mit entsprechenden Genprodukten aus dem Polyketomycin-, msc- und msn-Cluster nach dem Clustal W-Algorithmus prozessiert. Die AS-Sequenzen der Enzyme korrelieren mit dem Cyclisierungsmodus ihrer Substrate. Besonders eindruckvoll ist dies für Enzyme der Pradimicintypbiosynthese, zu deren Endprodukten pentanguläre Systeme (zum Beispiel Pradimicin), als auch Spiroketale (zum Beispiel Griseorhodin) deutlich abweichender Struktur gehören. Dies lässt vermuten, dass es sich bei den Reaktionen von Anthronoxygenase ähnlichen Enzymen um frühe Modifikationen handelt, die im Fall der Pradimicintypmetaboliten noch vor der Umlagerung zum Spiroketal erfolgen. 135 Ergebnisse Der Stammbaum verdeutlicht erneut die Sonderstellung der Mensacarcinbiosynthese unter den bereits bekannten Cyclisierungstypen. Während MsnO7 in einem Seitenast der Aureolsäuren- / Tetrazyklinfamilie zu finden ist, bilden MsnO5 und O6 eigenständige Gruppen. Weitere Genprodukte mit Ähnlichkeit zu Oxidoreduktasen (MsnO9) Das Genprodukt von msnO9 teilt ca. 50 % identische Aminosäuren mit ActVI-ORF2 (Actinorhodinbiosynthese), Med-ORF9 (Medermycinbiosynthese) sowie GrhO7 (Griseorhodinbiosynthese). Die AS-Sequenz dieser Proteine und MsnO9 kann gut mit der Consensus-Sequenz der Familie COG0604 (NADPH:quinone reductase and related Zndependent oxidoreductases, NCBI conserved domain search, s. 5.14) zur Deckung gebracht werden. Diese Familie enthält sowohl NADPH:Chinonreduktasen, die im Allgemeinen Chinone durch die Übertragung eines Elektrons zu Semichinonradikalen reduzieren [279], als auch Enoylreduktasen, die im Rahmen der Fettsäurebiosynthese die Hydrierung von Enoyldoppelbindungen katalysieren [280]. Die Aktivität bestimmter Vertreter der Familie COG0604 wird durch xenobiotische Substrate induziert, weshalb den Enzymen eine Rolle in der Zelldetoxifikation zugeschrieben wird [281]. Über die Funktion in der Biosynthese von PKS-Metaboliten ist wenig bekannt. Einzig für die putative Enoylreduktase ActVI-ORF2 wurden Ergebnisse von Mutageneseexperimenten publiziert. Die Inaktivierung führte zur Unterbrechung der Actinorhodinbiosynthese auf der Stufe von S-DNPA (4-Dihydro-9hydroxy-1-methyl-10-oxo-3-H-naptho-[2,3-c]-pyran-3-S-Essigsäure). Aufgrund dieser Beobachtung wurde vorgeschlagen, dass ActVI-ORF2 die an C-15 stereospezifisch ablaufende 1,4-Reduktion von S-DNPA zu 5-DDHK (5-Desoxydihydrokalafungin) katalysiert (s. Abb. 86) [167]. Eine S-DNPA analoge Verbindung wird in der Mensacarcinbiosynthese nicht erwartet (vgl. 4.5.3). Die Funktion von MsnO9 lässt sich daher nicht direkt aus der Sequenzanalyse ableiten, sondern ist nur experimentell bestimmbar. OH O OH O O S-DNPA H ActVI-ORF2 ? COOH +2H 5-DDHK H O H COOH Abb. 86: Postulierte Reaktion des MsnO9 ähnlichen Enzyms ActVI-ORF2 aus der Actinorhodinbiosynthese in Streptomyces coelicolor A3(2). 136 Ergebnisse Methyltransfer und S-Adenosylmethionin -Regenerierung (MsnM1 - M6) Am 3'-Ende des msn-Clusters wird ein fast geschlossenes Enzymsystem zur Methylierung (MsnM6) und zur Regenerierung des Methylgruppendonors S-Adenosyl-L-methionin (SAM) (MsnM1 - M5) codiert. MsnM1 - M5 zeigen außergewöhnlich hohe AS-Sequenzübereinstimmung mit Enzymen des Aminosäure / C1-Stoffwechsels. MsnM1, wahrscheinlich eine Adenosylhomocysteinase, katalysiert die hydrolytische Spaltung des aus dem Methyltransfer hervorgegangenen S-Adenosyl-L-homocystein (SAH) in Adenosin und L-Homocystein (s. Abb. 87). Letzteres kann durch MsnM3, das Ähnlichkeiten zu Methioninsynthasen aufweist, mit dem Kosubstrat N5-Methyltetrahydrofolat (N5-MethylTHF) zu L-Methionin umgesetzt werden. Das Enzym MsnM5 hat signifikante Sequenzähnlichkeiten mit SAM-Synthetasen und ist deshalb wahrscheinlich für die Verknüpfung von L-Methionin mit dem Adenosylrest aus ATP verantwortlich. Dabei entsteht SAM, das als Kosubstrat für die mögliche Methyltransferase MsnM6 dient. Enzyme der SAM-Synthese und Regenerierung wurden vor kurzem erstmalig in Biosynthesewegen von methylierten Sekundärmetaboliten identifiziert [225;240;243;245]. Auch im zur Zeit noch nicht vollständig sequenzierten Polyketomycinbiosynthesegencluster lässt der am Rand des sequenzierten Bereichs liegende Genabschnitt einer SAM-Synthetase auf ein Enzymsystem zur SAM-Regenerierung schließen [38]. Der Vorteil, ein solches System auf dem Biosynthesegencluster eines SAM-abhängig methylierten Sekundärstoffs zu implementieren, ist offensichtlich. Dennoch scheinen zumindest in der Mensacarcinbiosynthese SAMSynthese oder Methyltransfer einen limitierenden Schritt darzustellen, da als Vorläufersubstanzen vorwiegend nicht methylierte Derivate isoliert wurden [56]. Interessanterweise werden im msn-Cluster durch msnM2 und msnM4 zwei weitere Enzyme codiert, die in Verbindung mit der SAM-Regenerierung stehen. Die mögliche N5,N10Methylen-THF-Reduktase MsnM2 stellt N5-Methyl-THF, das Kosubstrat von MsnM3 zur Verfügung. Die mögliche Adenosinkinase MsnM4 katalysiert den ersten Schritt zur Regenerierung von ATP aus Adenosin. Das Enzymsystem ist damit fast vollständig geschlossen. Nicht auf dem msn-Cluster codiert werden Enzyme zur Umwandlung von THF in N5,N10-Methylen-THF (s. Abb. 87, Reaktion A). Für die Reaktion A stehen in allen Streptomyces spp. mit vollständig sequenziertem Genom [69-71] mehrere Enzyme zur Verfügung, wie zum Beispiel Aminomethyltransferasen (EC 2.1.2.10) oder Glycinhydroxymethyltransferasen (EC 2.1.2.1). Auch für die Bereitstellung von ATP und NAD(P) (s. Abb. 87, Reaktion B) muss auf Enzyme des Primärstoffwechsels zurückgegriffen werden. Das abgeleitete Genprodukt von msnM6 enthält ein Methyltransferasemotiv (Pfam00891) und zeigt Sequenzähnlichkeiten zu mehreren O- und C-Methyltransferasen, die SAM als Methyldonor verwenden. MsnO6 hat 32 - 36 % identische Aminosäuren mit den beiden C-Methyltransferasen OxyF aus der Oxytetrazyklinbiosynthese in Streptomyces rimosus [158] und BenF aus der Benastatinbiosynthese in Streptomyces sp. A2991200 [282] sowie der O-Methyltransferase MmcR aus der Mitomycinbiosynthese in Streptomyces lavendulae [283]. Die Funktion der Enzyme ist experimentell belegt. Methyltransferasen zeichnen sich durch 137 Ergebnisse hohe Regioselektivität aus. So katalysiert OxyF ausschließlich die Methylierung des Rings C seines Substrats Pretetramid [158]. Umso überraschender ist, dass den zwei Methylierungen der Mensacarcinbiosynthese nur ein Methyltransferasegen im msn-Cluster gegenübersteht. Bemerkenswert ist, dass ein Teil des Genabschnitts dieses Schlüsselenzyms der Mensacarcinbiosynthese bereits 2002 von A. Prestel bei der Untersuchung von Subklonen sequenziert und als Homolog der O-Methyltransferase MmcR aus der Mitomycinbiosynthese [283] eingeordnet wurde [160]. N H2N H N H HN N O O N O OH A NAD(P) MsnM2 N OH N H N5,N10-Methylen-THF H2N O H N H HN N O O HN O N5-Methyl-THF H HN OH N H O O N H H N N H2N NAD(P)+ OH O HN THF O OH O SH HO NH2 L-Homocystein L-Methionin N O HO NH2 N HO MsnM1 S HO MsnM3 NH2 N N OH MsnM4 O HO P O OH N O HO Adenosin NH2 N OH N N ATP NH2 AMP PPi + Pi O S HO MsnM5 B H2O O OH N H O HO O N NH2 N OH N NH2 MsnM6 N O S O HO N NH2 N OH N N S-Adenosyl-L-methionin S-Adenosyl-L-homocystein Desmethylmensacarcin HO Mensacarcin Didesmethylmensacarcin Abb. 87: Vorgeschlagener Weg der O-Methylierungen in der Mensacarcinbiosynthese und S-Adenosylmethionin-Regenerierung durch Msn-Enzyme. A, B: Durch Enzyme des Primärstoffwechsels katalysierte Reaktionen (s. Text). 138 Ergebnisse Mögliche Regulatoren (MsnR1, MsnR2) Die Produktion von PKS II-Metaboliten wird in Abhängigkeit von Wachstum und Umweltbedingungen präzise durch ein umfangreiches Netzwerk regulativer Elemente koordiniert [193]. Über das Ausmaß der Produktion entscheiden Transkriptionsfaktoren, deren Gene im Cluster des entsprechenden Sekundärstoffbiosynthesewegs liegen. Dazu gehören Regulatoren der SARP-Familie (Streptomyces antibiotic regulatory protein). Sie besitzen im Bereich der DNA-Bindungsdomäne ein geflügeltes helix-turn-helix (HTH) Motiv, das dem des E. coli Regulators OmpR ähnlich ist [195]. Auf fast allen PKS II-Clustern mit Ausnahme der Sporenpigmentbiosynthesegencluster sind SARP-Gene zu finden. MsnR1 hat Ähnlichkeit zu Biosyntheseweg spezifischen (pathway specific) SARPs und teilt 38 % identische, 53 % ähnliche AS mit dem funktionell charakterisierten Aktivator DnrI der Daunorubicinbiosynthese in Streptomyces peuceticus [284]. Oft enthalten Regulatorgene für die Antibiotikabiosynthese in Streptomyces spp. das in G+C-reichen Genomen sonst sehr seltene Leucincodon TTA [285;286]. Für S. coelicolor A3(2) wurde gezeigt, dass TTA-Codons enthaltende Gene von der Expression von bldA, dem Gen, das für die seltene tRNA UUA codiert, abhängig sind [287]. Die für die Funktion als tRNA erforderliche Prozessierung des primären bldA-Transkripts setzt erst in späteren Wachstumsphasen ein und bestimmt damit den Beginn der Antibiotikaproduktion und die Ausbildung von Luftmyzel in S. coelicolor A3(2) [288]. Die beiden einzigen TTA-Codons des Mensacarcinbiosynthesegenclusters liegen im Bereich von msnR2, was die Translation des Gens vom BldA-Regulationsmechanismus abhängig macht. MsnR2 ist ein Multidomänenprotein, das Ähnlichkeiten zu Transkriptionsregulatoren der LuxR-Familie zeigt [289]. Die Suche nach konservierten Domänen (NCBI conserved domain search, s. 5.14) identifizierte von AS-Position 128 - 369 die ATPase Domäne COG3899. Am C-Terminus liegt eine AS-Sequenz, die sich gut mit dem HTH-Motiv vom LuxR-Typ (PF00196, smart00421) deckt (s. Abb. 88). Namensgeber der LuxR-Familie ist ein Regulator, der wie auch die bakterielle Luciferase vom lux-Cluster aus Vibrio harveyi / Vibrio fisheri codiert wird [253]. In Antibiotika- / Zytostatikabiosynthesegenclustern sind LuxR-Gene selten zu finden, können aber für die Expression der entsprechenden Enzyme essentiell sein. Die Mutagenese von luxR ähnlichen Genen des Geldanamycinbiosynthesegenclusters in Streptomyces hygroscopicus 17997 schaltete die Produktion des Ansamycins ab [256]. Konsensus ldsLspREreVLrllaqGksNkeIAdeLgiSekTVkvHrsnimrKLnvhsrvelirla #MATCH + Ls Er V+ l G sN e A +L+i TV+ H++ i+rKL+++ r +l+ + MsnR2 881 AALLSSAERRVAWLAGIGHSNREVATRLCITVSTVEQHLTKIYRKLGLKRREDLVTAV 938 Abb. 88: HTH-DNA-Bindungsdomäne vom LuxR-Typ (PF00196, smart00421) am C-Terminus des möglichen Regulators MsnR2. Der Konsensus stammt aus einem Alignment bekannter PF00196-Sequenzen [217]. Großbuchstaben bedeuten einen hohen Konsens an der entsprechenden Position. +: ähnliche AS. Ergebnisse 139 Hypothetische Proteine (MsnH0 - H8) Für einige der angenommenen Genprodukte des msn-Contigs ließen sich über einen BLASTAbgleich mit der NCBI Datenbank ausschließlich Ähnlichkeiten zu Proteinfamilien feststellen, deren funktionelle Charakterisierung noch aussteht. Der Genabschnitt von MsnH0 liegt außerhalb des durch Transposasen begrenzten msnClusters. Genprodukte mit ca. 60% identischen Aminosäuren lassen sich von Genomen verschiedener Actinobacteria und Proteobacteria-Arten ableiten. Es handelt sich bei MsnH0 um ein konserviertes, hypothetisches Protein mit unbekannter Funktion. Ähnlich stellt sich die Situation für MsnH1 dar. Dieses Protein besitzt eine Domäne der Pfam09964, deren Funktion unbekannt ist. Ein Protein, das über seine gesamte AS-Sequenzlänge mit MsnH2 in Deckung gebracht werden kann, ist in der NCBI-Datenbank noch nicht bekannt. In der Nähe des C-Terminus trägt MsnH2 ein Motiv, ähnlich der ATP-Bindedomäne eines ABC-Transporters (CD03278). MsnH3 ähnliche Genprodukte aus Streptomyces ambofaciens ATCC 23877 und Streptomyces coelicolor A3(2) sind als mögliche Regulatoren beschrieben, eine rein hypothetische Annotierung. MsnH4, ein aus nur 162 AS bestehendes Protein, zeigt am N-Terminus Sequenzähnlichkeiten mit Epoxidasen und Hydroxylasen. Die ersten 66 Aminosäuren von MsnH4 lassen sich per BLAST-Algorithmus (s. 5.14) gut mit dem 473 AS großen Protein AmbJ aus der Ambruticinbiosynthese in Sorangium cellulosum [290] zur Deckung bringen (36 % identische, 50 % ähnliche AS). AmbJ ähnelt Epoxidasen aus der Biosynthese von Polyethern wie Monensin [291] und Nanchangmycin [292], die Epoxidierungen von Doppelbindungen mit anschließender, etherbildender SN2-Substitution katalysieren [293]. Die Inaktivierung von AmbJ führte zur Akkumulation von Ambruticin J, weshalb auch für AmbJ eine analoge Funktion postuliert wurde [290] (s. Abb. 89). Der C-Terminus von MsnH4 deckt sich mit ca. 80 AS langen Abschnitten von postulierten Fettsäureoxygenasen (36 % identische AS). Da sich die festgestellten Sequenzähnlichkeiten von MsnH4 jeweils nur auf einen kurzen Bereich der verglichenen Enzyme beziehen, bleibt die Funktion des Proteins unklar. Die Gemeinsamkeiten mit Epoxidasen machen MsnH4 dennoch zu einem interessanten Target für Geninaktivierungen zur Aufklärung der Mensacarcinbiosynthese. 140 Ergebnisse Abb. 89: Ausschnitt aus dem hypothetischen Biosyntheseweg von Ambruticin in Sorangium cellulosum. Aus [290] übernommen. Die Suche nach konservierten Domänen in der Sequenz von MsnH5 führte zur Detektion eines für Phosphotransferasen (Familie PF01636 [217]) typischen Bereichs, der sich fast über die gesamte Sequenzlänge erstreckt. Zur Familie PF01636 gehören vor allem die resistenzvermittelnden Aminoglykosidphosphotransferasen, aber auch Kinasen des Aminosäurestoffwechsels wie die Homoserinkinase. Auch wenn sich die durch MsnH5 übertragene Gruppe vorhersagen lässt, bleibt ein möglicher Akzeptor unbestimmt. Diese Rolle könnte sowohl einem Msn-Enzym als auch Mensacarcin selbst zukommen. Am N-Terminus von MsnH6 konnte eine S-Adenosyl-L-homocysteinhydrolase-Domäne (cl00931) identifiziert werden. MsnH6 kann mit SnoaW aus der Nogalamycinbiosynthese [179], FrnS aus der Frenolicinbiosynthese [276] sowie Hed-OrfH10 aus der Hedamycinbiosynthese [273] zur Deckung gebracht werden. Die Funktion der Proteine ist nicht experimentell belegt. Für SnoaW und Hed-OrfH10 wurde Hydroxylaseaktivität vorgeschlagen [179;273]. MsnH7 zeigt hohe AS-Sequenzübereinstimmung mit möglichen Hydrolasen, wie zum Beispiel CvmH aus Streptomyces clavuligerus oder dem "LanU-like protein" KinU aus dem Kinamycinbiosynthesegencluster von Streptomyces murayamaensis [294]. Unter den MsnH7 ähnlichen Proteinen der NCBI-Datenbank finden sich auch mögliche Thioesterasen. Über den BLAST-Algorithmus wurden keine signifikanten Ähnlichkeiten zu möglichen Thioesterasen der PKS II-Biosynthese (GrhD: Griseorhodin, MtmZ: Mithramycin) detektiert. MsnH8 besitzt einen Teil der Pfam05977-Domäne, der als konservierter Bereich in verschiedenen Proteinen auftritt, die als mögliche Transmembrantransporter annotiert sind. Im BLAST-Abgleich fällt auf, dass alle ähnlichen Proteine aus der NCBI-Datenbank eine Länge von über 400 AS aufweisen. Es ist deshalb fraglich, ob es sich bei MsnH8 um ein funktionales Protein handelt. Der Frameplot-Graph bestätigt die vorgenommene Festlegung des ORFs. 141 Ergebnisse 3.3.6 Vergleich von msc- und msn-Cluster auf Proteinebene Bei den Sequenzanalysen von msc-Cluster und msn-Cluster stellte sich heraus, dass oft dasselbe schon publizierte Enzym gleichzeitig als nächster Verwandter von aus beiden Clustern abgeleiteter Proteine auftrat. Besonderes Interesse galt nun der Fragestellung in wie weit sich die Enzyme der beiden Cluster selbst ähneln. Im ersten Schritt des Vergleichs wurde mit Hilfe der Software CloneManager (s. 5.14) für jedes Msn-Protein zusammen mit allen abgeleiteten Genprodukten des msc-Clusters ein phylogenetischer Stammbaum nach dem BLOSUM 62-Algorithmus erstellt. Der zweite Schritt war ein paarweises BLAST-Alignment des Msn-Proteins mit seinem Msc-Analogon. Nur Sequenzpaare, die auch nach dem BLAST-Algorithmus signifikante Ähnlichkeit zeigen, sind in Tab. 15 gelistet. Vom linken Ende der Contigs ausgehend sind msnO1 bzw. msc12 die ersten Gene, deren abgeleitete Produkte Ähnlichkeiten zu Proteinen des jeweils anderen Biosynthesewegs aufweisen. Gene, deren abgeleitete Produkte mindestens 40 % identische Aminosäuren über die gesamte Sequenzlänge teilen sind in Abb. 90 miteinander verbunden. Tab. 15: Msn-Msc-Proteinpaare ähnlicher AS-Sequenz. In Reihenfolge des msn-Clusters. Msn % ID / % ähnl. Msc O1 51 / 63 26 O2 65 / 79 21 O3 46 / 63 22 H5 52 / 64 23 K2 61 / 73 15 K1 70 / 81 14 Msn % ID / % ähnl. Msc O7 36 / 47 27 C22 53/ 65 252 O8 51 / 62 32 O9 53 / 68 36 O10 33 / 33 / 50 45 26 N 38 C - O4 52 / 68 21 O5 33 / 57 27 N C13 30 / 47 / 45 58 122 291 K3 48 / 61 16 O11 69 / 79 38 C32 52 / 63 122 31 / 45 24 35 / 52 30 36 38 H6 - R1 1 Eindomänen-Cyclase, 2Zweidomänen-Cyclase, 3Dreidomänen-Cyclase. N: Ähnlichkeit des N-Terminus, C: Ähnlichkeit des C-Terminus O1 O2 O3 H5 K2 K1 12 16 15 0 kb 14 O4 C2 O8 O9 K3 O11 C3 21 22 23 10 kb 25 26 32 20 kb 30 kb Abb. 90: Organisation der msn- und msc-Genloki und deren funktionell verwandte Biosyntheseenzyme. O6 - 142 Ergebnisse Hervorzuheben ist, dass beide Biosynthesegencluster Gene enthalten, die für Luciferase ähnlichen Oxidoreduktasen codieren - Enzyme, die erstmals in S. sp. Gö C4/4 im Zusammenhang mit PKS II-Clustern auftreten. Dabei fällt vor allem die konservierte, transkriptionelle Verbindung der Gene msnH5-msnO3-msnO2 bzw. msc23-msc22-msc21 auf. Abgeleitete Genprodukte sind ein hypothetisches Protein, eine FMN-Reduktase und eine Luciferase ähnliche Oxidoreduktase. Der biochemische Zusammenhang von FMN-Reduktase und Luciferase ähnlicher Oxidoreduktase ist bekannt [253]. Zu untersuchen bleibt eine mögliche Involvierung des hypothetischen Proteins MsnH5 bzw. Msc23, das eine Phosphotransferasedomäne aufweist. Auch für weitere Proteine zeichnen sich deutliche Ähnlichkeiten ab. 3.3.7 Weiterführende Untersuchungen zur Biosynthese von Mensalon, Aloesol und der Substanz MSC-X1 3.3.7.1 Genetischer Ursprung und Identität der Substanz MSC-X1 Mit der Inaktivierung von msc15 (ksβ) kam die Produktion der Substanz MSC-X1 fast vollständig zum Erliegen (s. 3.3.2.5). Im Gegensatz dazu wird die MSC-X1-Produktion durch einen Gendefekt in der minimalen PKS des msn-Clusters (∆msnK1) gesteigert. Mutationen der minimalen PKS beider Cluster gehen mit einem vollständigen Stopp der MSC-X1Produktion einher (s. Abb. 91). Aus diesen Ergebnissen lässt sich ableiten, dass die Biosynthese der Substanz MSC-X1 dem msc-PKS II-Cluster zuzuordnen ist. Die schwache Produktion trotz Knockout des msc-ksβ-Gens könnte auf Komplementierung durch das entsprechende Gen aus dem msn-Cluster zurückgeführt werden. Da auch umgekehrt, bezogen auf die Mensacarcinproduktion, eine Komplementierung beobachtet wird (s. 3.3.5.2), kann von Kreuzkomplementierung gesprochen werden. Von Interesse war, ob sich die Doppelmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 durch Einführung eines intakten msc15-Allels bezüglich der MSC-X1-Produktion komplementieren lässt. Dazu wurde Cos4 über intergenerische Konjugation (s. 5.7.2) in die Doppelmutante eingebracht. Die MSC-X1-Produktion konnte jedoch nicht wiederhergestellt werden. Parallel wurden die Auswirkungen einer zusätzlichen Kopie des msc-Contigs durch Integration von Cos4 ins Genom des Wildtyps S. sp. Gö C4/4 untersucht. Erstaunlicherweise kam es zur vollständigen Repression der Mensacarcinproduktion bei dem Wildtyp entsprechender Produktion von MSC-X1 (Daten nicht gezeigt). Die heterologe Expression von Cos4 in S. albus führte nicht zur Produktion von MSC-X1. 143 Ergebnisse Mit einem hochauflösenden Hybrid-Massenspektrometer (LC/ESI-MS/MS Anordnung mit LTQ-Orbitrap, s. 5.11.7) wurde versucht, die exakte Masse von MSC-X1 zu bestimmen. In den Kulturextrakten sind weitere Substanzen mit der aus m/z-Werten abgeleiteten Molekülmasse von 340 vorhanden. Mit der Methode mens03 können sie vom MSC-X1 zugeordneten MS-Peak getrennt werden (s. Abb. 91). Bei der Bestimmung der exakten Masse überlagerten sich die Signale jedoch. Die unter 3.3.2.4 getroffene Zuordnung des MSC-X1-Absorptionsspektrums zum negativ geladenen Ion mit m/z 339 konnte durch die Verwendung eines alternativen Gradienten über LC/MS-Analysen abgesichert werden. Für die dem msc-Cluster zugeordnete Substanz wird eine Molekülmasse von 340 vorgeschlagen. int. [%] 80 mAU 339 neg. 40 40 20 0 0 300 mAU 10 0 0 mAU 10 0 0 mAU 10 0 0 mAU 10 0 0 400 500 nm 20 20 10 20 30 40 min. 30 int. 1000 500 0 40 min. 0 10 20 30 40 min. 30 int. 1000 500 0 40 min. 0 10 20 30 40 min. 30 int. 1000 500 0 40 min. 0 10 20 30 40 min. ∆msc15 10 20 ∆msnK1 ∆msc15 10 20 m/z 30 Wildtyp 10 360 int. 1000 500 0 40 min. 0 ∆msnK1 10 260 Abb. 91: LC/MS-Analytik der Substanz MSC-X1 von Kulturextrakten des S. sp. Gö C4/4 Wildtyps und Ketosynthase-Knockoutmutanten. In der rechten Spalte werden die Chromatogramme bei λ = 400 nm verglichen, links die MS-Spuren für m/z = 339 im negativen Detektionsmodus (Methode: mens03, s. 5.11.6). 144 Ergebnisse 3.3.7.2 Biogenese der Substanz MSC-X1 Polyketide mit biosynthetischem Ursprung aus der bakteriellen Polyketidsynthese entstehen durch enzymatische Verknüpfung einer Startereinheit (meist Acetyl-ACP) mit einer bestimmten Anzahl an Molekülen Malonyl-CoA, die nach Decarboxylierung je zur Kettenverlängerung um eine Acetateinheit führen (s. 1.2.1). Aufgrund von Geninaktivierungen und anschließender Produktionskontrolle konnte die Biosynthese der Substanz MSC-X1 dem msc-Cluster, einem PKS II-Cluster, zugeordnet werden. Die Herkunft von MSC-X1 aus dem Polyketidstoffwechsel kann auch durch Fütterung der isotopmarkierten Vorläufersubstanz [1,2-13C2]-Acetat überprüft werden. Aus Acetat wird durch das Enzym Acetyl-CoA-Synthetase (ACS) Acetyl-CoA und daraus mit dem Enzym Acetyl-CoACarboxylase (ACC) Malonyl-CoA gebildet [295]. Die nachträglich eingebrachte, nicht markierte Carboxylgruppe von Malonyl-CoA wird bei der Polyketidsynthese durch Decarboxylierung wieder entfernt (vgl. 1.2.1). Folglich ist eine Markierung aller Kohlenstoffatome anzunehmen, die aus der Kettenverlängerung des Polyketidstoffwechsels sowie Acetyl-CoA oder Malonyl-CoA als Startereinheit stammen. Für weniger übliche Startereinheiten [23] muss deren Biosynthese im Einzelfall betrachtet werden. Die Mutante S. sp. Gö C4/4 ∆msnK1 (s. 3.3.5.2) eignet sich besonders für ein Fütterungsexperiment mit [1,2-13C2]-Acetat, da in ihr die ebenfalls Malonyl-CoA verbrauchende minimale PKS der Mensacarcinbiosynthese blockiert ist. Dies äußerte sich in einer verstärkten Produktion der Substanz MSC-X1 (s. Abb. 91). Tab. 16: Für die Substanz MSC-X1 wurde im negativen Detektionsmodus mit Elektrosprayquelle folgendes Intensitätsverhältnis der Signale gemessen. Substanz MSC-X1 m/z Zuordnung (neg. Modus) 339 [M−H]− 340 [M+1−H]− 341 [M+2−H]− Mensacarcin (Vergleich) m/z Zuordnung (neg. Modus) 419 [M−H]− 420 [M+1−H]− 421 [M+2−H]− unter Zugabe von [1,2-13C]-Acetat 100 36,1 37,2 unter Zugabe von [1,2-13C]-Acetat 100 34,3 29,8 Intensität [%] ohne Zufütterung 100,0 22,2 3,5 Intensität [%] ohne Zufütterung 100,0 24,1 4,9 ohne Zufütterung, berechnet* 100,0 21,0 3,3 ohne Zufütterung, berechnet* 100,0 23,3 4,4 * Die Berechnung erfolgte mit ChemDraw 9 (s. 5.14) unter Berücksichtigung der natürlichen Isotopenverteilung der beteiligten Elemente und einer hypothetischen Summenformel C19H16O6 für MSC-X1 (Bei Annahme eines decarboxylierten Decaketids mit Mensacarcin ähnlichem Faltungsmodus). Zu 100 mL einer Standardkultur (s. 5.3.1.4) der Mutante wurden mit dem Animpfen 50 mg [1,2-13C2]-Acetat (suspendiert in 200 µL Methanol) gefüttert. Um eine Streuung der Ergebnisse 145 markierten Kohlenstoffatome zu vermeiden wurde die Kultivierung bereits nach drei Tagen abgebrochen. Der Ethylacetatextrakt (s. 5.11.1.1) wurde per LC/MS analysiert (s. 5.11.6, Methode: mens03). Die Signalintensität des M+2-Isotopensatelitten hat sich durch mit dem doppelt markierten [1,2-13C2]-Acetat vervielfacht. Parallel verhalten sich die Signale des in geringen Mengen im Extrakt vorhandenen Mensacarcins. Die Veränderung lässt darauf schließen, dass vor allem intakte Acetateinheiten eingebaut wurden. Die biogenetische Herkunft der Substanz MSC-X1 aus dem Polyketidstoffwechsel kann bestätigt werden. 3.3.7.3 Genetische Basis von Mensalon und Aloesol Unter Zusatz von 2 % DMSO zum Kulturmedium bildet der Stamm S. sp. Gö C4/4 verstärkt die beiden Metaboliten Mensalon und Aloesol (s. 3.3.1). Die Strukturen von Mensalon und Aloesol mit alternierend auftretenden Sauerstofffunktionen erlauben die Hypothese einer Herkunft der Substanzen aus dem Polyketidstoffwechsel. Die Kettenlänge von je 13 Kohlenstoffatomen deutet dabei auf das Vorliegen von Heptaketiden hin, deren Säurefunktion durch Decarboxylierung entfernt wurde. Da aromatische Polyketide gewöhnlich über eine Polyketidsynthase vom Typ II zusammengesetzt werden [23], wurde dieser Biosyntheseweg auch für Mensalon und Aloesol postuliert. Die heterologe Expression von Cos2 in S. albus zeigte, dass Gene des msn-Clusters die Produktion der beiden Metaboliten auslösen können (s. 3.3.5.1). Diese Beobachtung ist ein Hinweis darauf, dass Gene des msn-Clusters auch im Ursprungsstamm S. sp. Gö C4/4 an der Biosynthese von Mensalon und Aloesol beteiligt sind. Produktionsprofile von ks-Mutanten bei Zusatz von 2 % DMSO zum Kulturmedium sollten darüber Auskunft geben, ob die Produktion der beiden Heptaketide allein vom msn-Cluster abhängt. Wie aus Abb. 92 hervorgeht bleibt die Mensalon- / Aloesolproduktion von der Inaktivierung des ksβ-Gens (msc15) aus dem msc-Cluster unbeeinflusst. Im Gegensatz dazu sind nach der Inaktivierung eines Gens der Msn-KS nur noch Spuren der Sekundärstoffe detektierbar. Parallel vorliegende Gendefekte in ks-Genen beider Cluster verhindern die Produktion der Heptaketide vollständig. Die Analyse zeigt, dass sowohl die Msc- als auch Msn-KS zur Produktion von Mensalon / Aloesol beitragen können, wobei die Biosyntheseleistung der Msc-KS deutlich geringer ist. Kein weiteres PKS II-Cluster führt zur Produktion der Heptaketide, wie aus dem Produktionsspektrum der Doppelmutante hervorgeht. 146 Ergebnisse int. 2000 Mensalon Wildtyp 1000 0 0 int. 2000 m/z = 233 neg. Aloesol 10 20 30 40 min. 10 20 30 40 min. 40 min. 40 min. ∆msc15 1000 0 0 int. 2000 int. ∆msnK1 100 50 0 1000 0 0 int. 2000 10 ∆msc15 ∆msnK1 1000 0 0 10 12 14 20 min. 30 int. 100 50 0 12 20 14 min. 30 Abb. 92: LC/ESI-MS Diagramme von Kulturextrakten des S. sp. Gö C4/4 Wildtyps und Mutanten bei 2 % DMSO im Medium. Der m/z-Wert 233 im negativen Detektionsmodus entspricht dem [M−H]− Ion von Mensalon oder Aloesol (Methode: mens03, s. 5.11.6). Diskussion 4 Diskussion 4.1 Biokatalytische Verwendung des Xenobiotikametabolismus von Bodenbakterien 147 4.1.1 Glykokonjugate: spezifische Markenzeichen der Lebewesen Ausgehend von Rhamnosylierungen der Anthrachinonderivate Alizarin und Emodin wurde eine Bibliothek, bestehend aus 40 Naturstoffen und synthetischen Molekülen, auf Biotransformation im Bodenbakterium Saccharothrix espanaensis untersucht (s. 3.1). Im intensiv erforschten menschlichen Xenobiotikametabolismus sind es vor allem Phenole, Anthrachinone, Flavonoide, Opioide, Steroide und Coumarine, die als Phase II-Biotransformation eine Glykosylierung erfahren [296]. Entsprechend wurde auch die Substanzbibliothek für S. espanaensis zusammengestellt. Bei den sieben durch Massenspektrometrie, NMR-Spektroskopie und zum Teil durch Circulardichroismus charakterisierten glykosylierten Biotransformationsprodukten handelt es sich um α-L-Rhamnoside mit O-glykosidisch verknüpfter Zuckereinheit. Die LC/MS-analytische Auswertung der Biotransformation aller gefütterten Substanzen ergab keinen Hinweis darauf, dass von S. espanaensis weitere Zucker zur Konjugatbildung eingesetzt werden. Die hohe Donorspezifität der Glykosylierungsaktivität ist nicht überraschend. Eine Literaturrecherche (s. Tab. 17) zeigt, dass die Struktur der verknüpften Zuckereinheit ein spezifisches Markenzeichen des metabolisierenden Lebewesens ist. Nur in Ausnahmefällen beherrscht ein Organismus die Glykosylierung von Xenobiotika mit unterschiedlichen Donoren. Ein Beispiel ist der Pilz Coriolus versicolor (s. Tab. 17). Die Modellpflanze Arabidopsis thaliana besitzt einen Pool von über 100 Glykosyltransferasen zur Bildung von β-D-Glucosiden und α-L-Rhamnosiden kleiner, lipophiler Moleküle [297]. Die Enzyme aus A. thaliana sind jedoch vorrangig dem Sekundärstoffwechsel zuzuordnen, da unter natürlichen Bedingungen die Umsetzung endogener Substrate überwiegt. Bei den Wirbeltieren ist β-D-Glucuronsäure der typische Bestandteil der Glykokonjugate [296]. Für Bakterien, Pilze und Pflanzen wird vor allem D-Glucose, seltener L-Rhamnose, als Konjugationspartner beschrieben. Weitere Zucker bleiben die Ausnahme. Die Wahl des Zuckers hängt nicht von dessen Verbreitung im Konjugat bildenden Organismus ab, sondern ist präzise auf die Eigenschaften des Lebewesens abgestimmt. Im menschlichen Körper ist D-Glucose der häufigste Zucker [4]. Trotzdem ist D-Glucuronsäure der einzige Zucker, der in Phase II-Reaktionen konjugiert wird. Durch die dissoziierende Säuregruppe besitzen Glucuronide bereits im neutralen Milieu eine deutlich höhere Wasserlöslichkeit als Glucoside und können deshalb besser renal eliminiert werden. In der Literatur wird davon ausgegangen, dass alle Produkte des zytoplasmatischen Glykosyltransfers durch aktiven Transport aus der Zelle ausgeschleust werden [298]. Die lipophilen Aglyka können passiv durch Diffusion in die Zellen eindringen, der Transport der polaren Glykoside aus der 148 Diskussion Zelle hinaus ist an spezifische Transmembrantransporter gebunden. Eine effektive Eliminierung wird durch die Abstimmung des verknüpften Zuckers mit der Spezifität vorhandener Transporter erreicht. Xenobiotika und endogene Sekundärstoffe werden deshalb oft mit dem gleichen Zucker konjugiert. Der Menschen konjugiert endogenes Bilirubin wie auch exogenes Morphin mit D-Glucuronsäure [296]. Im Stoffwechsel von Streptomyces griseoviridis Tü3634 tritt α-L-Rhamnose sowohl als Bestandteil endogener Carbonsäureester [299], als auch in Biotransformationsprodukten von Emodin auf (s. 3.1.8). Tab. 17: Glykokonjugatbildner aus der Literatur. Vertreter der Ordnung Actinomycetales wurden möglichst vollständig erfasst. Erweitert wurde die Tabelle mit ausgewählten Lebewesen aller bekannten Reiche. Wenn nicht anders angegeben sind die Produkte O-Glykoside. Name Bakterien Bacillus cereus Zucker Aglyka Referenz β-D-Glucose [300;301] Saccharothrix australiensis Saccharothrix espanaensis Streptomyces sp. GöM1 Streptomyces sp. LS136 Streptomyces sp. Q53834 Streptomyces aureofaciens B96 Streptomyces coelicolor A3(2) Streptomyces griseoviridis Tü3634 Streptomyces lavendulae SANK 64687 Pilze Absidia coerulea Beauveria bassiana ATCC 7159 Coriolus versicolor α-L-Rhamnose diverse Flavonoide, GT identifiziert Emodin Cunninghamella elegans var. elegans 2 verschiedene Pilze diverse Pilze s. 3.1.8 α-L-Rhamnose Anthrachinone, Flavonoide, s. 3.1 Coumarine, Polyphenole 6-Desoxy-α-L-talose Benzoesäurederivate, Konjugate: [302] Ester und Glykoside α-L-Rhamnose Lignane [303] β-D-Glucose Brefeldin A [304] β-D-Glucose diverse Anthrachinone und Anthrazykline, Tetrazykline Emodin [305-307] s. 3.1.8 aromatische Carbonsäuren, Emodin, Konjugate: Ester und Glykoside japanische Patentschrift, u. a. 2,6-Dihydroxyanthrachinon und Thielavin A [299;308310], s. 3.1.8 JP,02211892,A (1990) Anthrachinone Anthrachinone, Flavonoide Konjugate: N- und O-Glykoside Lignine [311] [110;312] Hexose, evtl. β-D-Glucose α-L-Rhamnose α-L-Rhamnose β-D-Glucose β-D-Methylglucose β-D-Xylose, β-D-Glucose β-D-Glucose [313] Xanthohumol, Konjugate: auch Diglucosid [314] β-Ribose ein Xanthonderivat [315] β-D-Glucose Benzosampagin (polycyclisches Alkaloid) [316] 149 Diskussion Name Pflanzen diverse GTs aus Arabidopsis thaliana UGT78D1 aus Arabidopsis thaliana Tiere Wirbeltiere Zucker Aglyka Referenz β-D-Glucose Benzoate, Kaffeesäure, Flavonoide, Coumarine Quercetin: in vitro und heterolog in vivo [317;318] [296] Bombyx mori (Seidenspinner) β-D-Glucose Phenole, Anthrachinone, Flavonoide, Opioide, Steroide, Coumarine, weitere Quercetin α-L-Rhamnose β-D-Glucuronsäure [319] [320] Innerhalb eines Lebewesens entstehen oft Glykokonjugate, die sich in ihrer Verknüpfungsposition mit dem Aglykon unterscheiden (vgl. 3.1.1.1). Die einzelnen Enzyme hingegen zeichnen sich oft durch eine hohe Regioselektivität aus. In diesem Zusammenhang besonders erforscht ist die Glykosylierung von Quercetin durch unterschiedliche menschliche und pflanzliche Glykosyltransferasen, die jeweils in ihrer Gesamtheit zum typischen Spektrum an Quercetinmetaboliten in den Organismen beitragen [319;321;322]. Die menschliche UGT2B7 bildet bevorzugt das 3-O-Glucuronid des Arzneistoffs Morphin. Das stark analgetisch wirksame 6-O-Glucuronid entsteht nur in geringem Ausmaß [119;323]. Aus der begrenzten Regioselektivität von UGT2B7 ergibt sich ein Vorteil, da das Enzym auch für die 6-O-Glucuronidierung von Codein eingesetzt werden kann, in dessen Struktur sich an C-3 eine Methoxygruppe befindet. Auch bei der Biotransformation von Xenobiotika in S. espanaensis kommt es zur Bildung von Regioisomeren, was aus NMR- (s. 3.1.1.1) und LC/MS-Daten (s. Tab. 4, Tab. 5, Tab. 6) hervorgeht. Eine Aussage darüber, ob eine oder mehrere Glykosyltransferasen in die beobachteten Reaktionen einbezogen sind, kann nicht getroffen werden. Von bakteriellen Genomen werden jedoch meist nicht mehr als fünf unterschiedliche Glykosyltransferasen des Xenobiotikametabolismus codiert [301;324]. 4.1.2 Die Glykosylierung endo- und exogener Moleküle: ein überlebenswichtiges Prinzip 4.1.2.1 Im Menschen Das Crigler-Najjar Syndrom Typ I ist eine autosomal rezessiv übertragene Erbkrankheit des Menschen [325;326]. Sie ist charakterisiert durch die Unfähigkeit, den hydrophoben, endogenen Sekundärstoff Bilirubin in leicht zu eliminierende Glucuronide zu überführen [327]. Wegen der Akkumulation des unkonjugiert neurotoxischen Bilirubins sind Neugeborene mit dem Crigler-Najjar Syndrom Typ I nur mit sofortiger Lebertransplantation als Methode der chirurgischen Gentherapie überlebensfähig [296]. Ein Teilverlust der Glucuronidierungsaktivität tritt klinisch als Crigler-Najjar Syndrom Typ II oder als 150 Diskussion Meulengracht-Krankheit in Erscheinung. Die Ursache sind stets Mutationen des Glykosyltransferasegens UGT1A1 oder dessen Promotor, die zum vollständigen (C.-N. Typ I) oder anteiligen (C.-N. Typ II, Meulengracht-Krankheit) Verlust der Enzymaktivität führen. Die humane Glykosylierung von Fremdstoffen scheint auch eine wichtige Bedeutung in der Abwehr chemischer Carcinogenese zu haben. Hinweise darauf ergeben sich aus Experimenten mit Ratten, bei denen der gesamte UGT1A-Locus durch eine Mutation inaktiviert ist. Die Produktion von Benzo(a)pyrenglucuroniden ist stark reduziert und führt zur vermehrten Bildung von DNA-Addukten [296]. Durch Glykosylierung kann sowohl das mutagene Potential von Fremdstoffen reduziert, als auch deren Elimination beschleunigt werden. Ein interessantes Ergebnis liefern vergleichende Untersuchungen der UGT1A-Expressionsprofile in gastrointestinalen Tumoren und gesundem umgebenden Gewebe. Es ist eine deutliche Minderexpression der Glykosyltransferasegene in malignen Geweben, nicht jedoch bei benignen Wucherungen festzustellen [328]. Die Frage, ob die Tumore auf die durch UGTMangel verminderte Chemoprotektion zurückzuführen sind oder ob die Minderexpression durch den Tumor bedingt ist, bleibt offen. 4.1.2.2 In Pflanzen Im Gegensatz zu den 15 bisher identifizierten menschlichen UGT cDNAs können Kormophyten genetische Informationen für über 100 UDP-abhängige Glykosyltransferasen tragen [297], die für die bekannte Vielfalt der Glykosylierungsmuster pflanzlicher Sekundärstoffe verantwortlich sind. Eine relaxierte Akzeptorflexibilität, ähnlich jener der menschlichen UGTs, erlaubt auch die Glykosylierung exogener Substrate in Zellkulturen [329] oder mit isolierten Enzymen [330]. Die überlebenswichtige Bedeutung der mit dem Sekundärstoffwechsel verbundenen Glykosyltransferasen in planta wird erst durch aktuelle Studien deutlich [297]. Die Expression von Glykosyltransferasegenen ist in ein Regelwerk zur Aufrechterhaltung der hormonellen Homeostase eingebunden. UGT84B1 katalysiert in vitro die Glykosylierung des Pflanzenhormons Indol-3-essigsäure. Bei Überexpression in Arabidopsis thaliana resultierte ein Auxinmangelphänotyp [331]. In einem anderen Beispiel wurden Tabakpflanzen durch Herunterregulierung ihrer Glykosyltransferasegenexpression anfälliger für Infektionen mit dem Tabakmosaikvirus [332]. Die Befähigung von A. thaliana zur Glykosylierung des Mykotoxins Desoxynivalenol führt zur Resistenz. Durch heterologe Expression der UGT73C5 konnte diese Eigenschaft auf Hefezellen übertragen werden [333]. Wie auch beim Menschen löst der pflanzliche Glykosyltransfer logistische Probleme. Durch die Erhöhung der Wasserlöslichkeit werden zuvor hydrophobe Stoffe in der Vakuole deponierbar und können durch zuckerspezifische Transporter erkannt werden [334]. Diskussion 151 4.1.2.3 In Bakterien Bei den Glykosiden bakterieller Sekundärstoffe dominieren in der Natur ansonsten seltene Amino- und Desoxyzucker [335]. Bei bestimmten antibiotisch oder zytostatisch wirksamen Sekundärstoffen ist eine Aminozuckereinheit für die von Menschen angestrebte Wirkung unbedingte Vorraussetzung. Die Funktion und Spezifität von Sekundärstoffbiosynthese assoziierten Glykosyltransferasen wird intensiv erforscht [336]. Akzeptorflexible Enzyme wie AraGT [54], DesVII [337], UrdGT2 [338], VinC [339] bleiben hier die Ausnahme. Bakterielle Xenobiotika metabolisierende Glykosyltransferasen sind aufgrund ihrer Aminosäuresequenz oft deutlich von den entsprechenden Enzymen der Antibiotikabiosynthese abzugrenzen (vgl. Abb. 93), können jedoch auch eine Funktion im Sekundärstoffwechsel übernehmen. Ein klassisches Beispiel dafür sind OleD und OleI aus dem Oleandomycinproduzenten Streptomyces antibioticus [149;340]. Der von diesen Enzymen vermittelte Transfer von D-Glucose auf das endogene Makrolidantibiotikum führt im Sinne eines Resistenzmechanismus zu dessen Inaktivierung - eine überlebenswichtige Glykosylierung. Das Genprodukt des clusterassoziierten Gens oleI weist dabei eine höhere Spezifität auf als jenes von oleD auf. Durch die Akzeptorflexibilität von OleD ist der Stamm auch gegen weitere Makrolide resistent [341]. Hinweise darauf, dass die Glykosylierung exogener Moleküle, wie sie in der vorliegenden Arbeit in S. espanaensis beobachtet wurde, eine Schutzreaktion des Bakteriums darstellen, gibt eine vergleichende Untersuchung der antibiotischen Aktivität von Anthrachinonen sowie deren Glykosiden [342]. Aglyka und Glykoside wurden in Konzentrationen bis 1024 µg/mL auf wachstumshemmende Wirkung (MIC) gegen Escherichia coli K12, Pseudomonas aeroginosa PAO1 sowie verschiedene Methicillin sensitive und resistente Stämme von Staphylococcus aureus getestet. Bei keinem der Glykoside konnte eine Hemmung festgestellt werden, die Anthrachinonaglyka führten bereits in Konzentrationen ab 2 µg/mL zur Wachstumsinhibition. 4.1.3 Phase I- und Phase II-Reaktion versus Biodegradation Eine Alternative zur Funktionalisierung und Konjugation eines Xenobiotikums ist seine Degradation zu untoxischen Produkten oder sogar zu Metaboliten, die gewinnbringend in den Primärstoffwechsel eingebracht werden können. Aufbauende und abbauende Biotransformationsreaktionen laufen gleichzeitig ab. Bei der aufbauenden Biokatalyse in Ganzzellsystemen, wie der Rhamnosylierung durch Saccharothrix espanaensis, ist deshalb auch mit einem Eduktverlust durch Biodegradation zu rechnen. Die meisten Testsubstanzen stammen aus der Strukturklasse der 9,10-Anthrachinone, die als sehr stabile Verbindungen anzusehen sind und auch unter natürlichem mikrobiellen Kontakt Jahrtausende überdauern können. Ein Beispiel sind mit Krapp gefärbte Textilien aus der Zeit 152 Diskussion um 3200 vor Christus, die sich im trockenen Wüstenklima von Ägypten bis heute erhalten haben [343]. Allerdings sind auch 9,10-Anthrachinone mikrobiell abbaubar. Der Pilz Phanerochaete chrysosporum spaltet das Anthrachinongrundgerüst in Phthalat und weitere nicht charakterisierte Produkte [344]. Bestimmte Streptomyces spp. führen zur Entfärbung von Anthrachinonfarbstoffen [345]. Im Allgemeinen labiler als Anthrachinone sind Flavonoide. Eine Übersicht ihrer mikrobiellen Biotransformation wurde von Das & Rosazza [11] erstellt. In Analogie zur in S. espanaensis beobachteten 3-O-Rhamnosylierung von Quercetin unter Bildung von Quercitrin (s. 3.1.4.1) findet in Bacillus cereus eine 3-O-Glucosylierung unter Bildung von Isoquercitrin (3-O-β-D-Glucosylquercetin) statt [300]. Die Umwandlung zum Glucosid lag bei etwa 20 %, daneben ließ sich das Abbauprodukt 3,4-Dihydroxybenzoesäure isolieren. Das Ausmaß des Quercetinabbaus in S. espanaensis sollte durch eine möglichst quantitative Isolierung des entstandenen Quercitrins (QuercPro1) abgeschätzt werden (s. 3.1.4.1). Bei allen anderen Aufreinigungen wurde nur eine ausreichende Menge für die NMR-Spektroskopie angestrebt. Die Ausbeute an Quercitrin von 35 % lässt auf eine parallel abgelaufene Degradation oder deutliche Verluste während der Extraktion und Aufreinigung schließen. Sollte die Rhamnosylierungsaktivität von S. espanaensis für die industrielle Biokatalyse eingesetzt werden, sind weitere quantitative Betrachtungen der Biotransformationsreaktionen notwendig. Zunächst könnten die Kulturen gezielt auf die Bildung von Hydroxybenzoesäurederivaten untersucht werden. Insbesondere für Ganzzellbiotransformationssysteme ist, wie das Beispiel bestimmter Naphthochinone zeigt (s. Tab. 6), auch die chemische Stabilität von Edukt und Produkt unter Kulturbedingungen eine unbedingte Vorraussetzung. 4.1.4 Biokatalytische Verwendung der mikrobiellen Xenobiotikaglykosylierung Die Glykosidsynthese mit den Methoden der nicht-enzymatischen organischen Chemie ist oft sehr schwierig, insbesondere wenn eine regioselektive Glykosylierung erforderlich ist [346]. Ein klassisches Beispiel ist die Synthese von Glykosiden des pharmazeutisch wichtigen Naturstoffs Quercetin. Hier stehen fünf Hydroxylgruppen als Zuckerakzeptoren zur Verfügung [347]. Um ein bestimmtes Monoglykosid zu erhalten, müssen die anderen vier Hydroxylgruppen geschützt werden [348]. Im Gegensatz zur nicht-enzymatischen Synthese können durch die enzymatische Umsetzung kleiner, lipophiler Moleküle unmittelbar regiound enantioselektiv glykosylierte Produkte zugänglich gemacht werden. Durch den Einsatz von S. espanaensis als Ganzzellbiotransformationssystem wurde die regioselektive Umsetzung von Quercetin zu 3-O-α-L-Rhamnosylquercetin mit einer Ausbeute von 35 % erreicht (s. 3.1.4.1). Diskussion 153 4.1.4.1 Biokatalyse mit Xenobiotika metabolisierenden Glykosyltransferasen Die strukturelle Vielfalt der Glykoside, die durch Biokatalyse zugänglich sind, wird durch die oft hohe Substratspezifität der eingesetzten Glykosyltransferasen begrenzt [93]. In der Literatur sind wenige Glykosyltransferasen aus der bakteriellen Sekundärstoffbiosynthese bekannt, die außer einer (erzwungenen) In-vitro-Flexibilität [341;349] auch in vivo akzeptorflexibel arbeiten. Ein Beispiel ist UrdGT2, die neben der C-Glykosylierung in der Urdamycinbiosynthese auch die O-Glykosylierung von Alizarin katalysiert [338]. Glykosyltransferasen der bakteriellen Antibiotikabiosynthese setzen TDP-aktivierte Zucker ein [106]. Glykosyltransferasen mit einer breiten Akzeptorflexibilität gegenüber endogenen und exogenen lipophilen Molekülen lassen sich phylogenetisch oft der Familie der UDP abhängigen Glykosyltransferasen (UGTs) zuordnen (s. Abb. 93). Erstaunlicherweise stehen bakterielle UGTs ihren tierischen und pflanzlichen Analoga näher als den bakteriellen TDP-Zucker abhängigen Enzymen. Laut einer kontrovers diskutierten Hypothese soll es im Verlauf der Evolution zur Rekrutierung pflanzlicher Enzyme durch Bakterien gekommen sein [350]. Vor allem die Einordnung des Flavonoid glykosylierenden Enzyms BCE_2168 in einem Seitenast mit den pflanzlichen UGTs unterstützt diese Hypothese (s. Abb. 93). In der CAZy-Datenbank (s. 5.14) sind UGTs in der Familie 1 eingeordnet. Sie sind gemäß Mackenzie et al. (1997) [351] durch folgenden Aminosäurenconsensus am C-Terminus zu erkennen: [F/V/A]-[L/I/V/M/F]-[T/S]-[H/Q]-[S/G/A/C]-GXX-[S/T/G]-XX-[D/E]-XXXXXXP-[L/I/V/M/F/A]XX-P-[L/M/V/F/I/Q]-XX-[D/E]-Q. Die Xenobiotika metabolisierenden Glykosyltransferasen des Menschen und der Pflanzen sind UGTs. In Bakterien scheint es zwei Arten von Glykosyltransferasen zu geben, die in der Lage sind, exogene Moleküle umzusetzen. Einerseits zeigen einige Glykosyltransferasen im Rahmen der Vorläufer dirigierten Biosynthese oder kombinatorischen Biosynthese Glykosylierungsaktivität gegenüber Akzeptoren, die strukturelle Ähnlichkeiten mit dem natürlichen Substrat aufweisen, zum Beispiel AraGT, DesVII, VinC. Andererseits wird durch die Verfügbarkeit von bakteriellen Genomsequenzen deutlich, dass auch in Prokaryoten UGT homologe Enzyme auftreten, die eine Xenobiotika metabolisierende Aktivität, ähnlich der ihrer eukaryotischen Analoga aufweisen können. Im Gegensatz zu TDP-Zucker abhängigen Glykosyltransferasen, scheinen UGTs nicht an enge Akzeptormerkmale gebunden zu sein. Sie katalysieren allgemein die Glykosylierung von kleinen, lipophilen Molekülen [296]. Bezogen auf den einzelnen Akzeptor zeigen die Enzyme oft eine für den Einsatz in der Biokatalyse begehrte individuelle Regioselektivität [319]. Die erreichbaren Ausbeuten bei der Verwendung von bakteriellen UGTs zur In-vivoGlykosylierung von exogenen lipophilen Molekülen liegen über den Werten TDP-Zucker abhängiger Glykosyltransferasen. In Bacillus cereus konnten ~20 mg Isoquercitrin pro Liter Kulturvolumen erreicht werden [300], für die Gewinnung von Quercitrin in S. espanaensis liegt der Wert bei 120 mg/L. 154 Diskussion Bei In-vivo-Experimenten mit Wildtypstämmen wird durch eine UGT stets ein bestimmter Zucker angehängt. In-vitro-Versuche mit den Makrolidresistenz vermittelnden Enzymen OleD, OleI und MGT zeigen nicht nur die enorme Akzeptorflexibilität von bakteriellen UGTs, sondern auch den möglichen Einsatz unterschiedlicher Nukleotidzuckerdonoren [341]. Durch "metabolic engineering" sollte diese Donorflexibilität auch auf In-vivo-Systeme übertragbar sein. Bakterielle UGTs des Xenobiotikametabolismus stellen sich somit als potente Werkzeuge der Biokatalyse dar. Ob die Rhamnosylierungsaktivität von S. espanaensis von UGTs abhängt, kann derzeit noch nicht bestätigt werden. Das Substratspektrum deckt sich mit dem menschlicher und pflanzlicher UGTs. Polare Substanzen wie Mitoxantron werden nicht glykosyliert (s. 3.1.2). Die Beschränkung der Aktivität auf lipophile Moleküle bei hoher Akzeptor- und niedriger Donorflexibilität ist ein Markenzeichen Xenobiotika metabolisierender Glykosyltransferasen und lässt den Schluss zu, dass derartige Enzyme in S. espanaensis für dessen Rhamnosylierungsaktivität verantwortlich sind. Unterstützt wird diese Hypothese durch die Tatsache, dass auch für die Glucosylierung von Quercetin in Bacillus cereus eine UGT verantwortlich gemacht werden konnte [301]. Bisher sind nur Teile des Genoms von S. espanaensis sequenziert. Auf zwei Loci wurden insgesamt 17 Glykosyltransferasegene identifiziert: sam11 - 20, sam43, sam45 - 47 und sam49 - 51 [352;353]). Die phylogenetische Analyse (s. Abb. 93) zeigt, dass es sich nicht um UGTs handelt. Die meisten Mikroorganismen haben weniger als fünf UGTs [301] (vgl. auch [324]). Insgesamt machen Glykosyltransferasen jedoch etwa 1 % - 2 % aller Genprodukte aus [354]. Aufgrund der in dieser Arbeit aufgedeckten Rhamnosylierungsaktivität wurden von der Europäischen Union finanzielle Mittel zur vollständigen Sequenzierung des Genoms von Saccharothrix espanaensis zur Verfügung gestellt. Die Sequenzierung wird in einigen Monaten abgeschlossen sein. Durch eine phylogenetische Analyse der Glykosyltransferasegene sollten die UGTs des Stammes schnell zu identifizieren sein. Ob eines oder mehrere Enzyme für die Xenobiotikarhamnosylierung verantwortlich sind, kann mit molekularbiologischen und biochemischen Methoden bestimmt werden. 155 Diskussion UGT7 8D1 AAM61249 BCE_ 2168 CGT UGT2 B28 MGT SCO6 090 OleD OleI SCO0 040... UrdGT2 AraGT OleG1 OleG2 Sam1 2 Sam1 3 Sam1 1 Sam1 8 Sam1 9 Sam1 4 Sam1 7 Sam2 0 Sam1 6 Sam1 5 VinC Des VII Sam4 7 Sam4 9 Sam4 3 Sam4 5 Sam5 1 Sam4 6 Sam5 0 50 4.5 500 400 30 0 200 10 0 Nucleotide Substitutions (x100) UGTs 0 Abb. 93: Phylogenetische Gegenüberstellung von UGTs, akzeptorflexiblen Glykosyltransferasen der bakteriellen Antibiotikabiosynthese und den bisher bekannten (abgeleiteten) Glykosyltransferasen aus S. espanaensis (Sam-Enzyme) nach dem Clustal W-Algorithmus. Die menschliche Glucuronosyltransferase UGT2B28 und die pflanzliche Glucosyltranseferase AAM61249 wurden wegen ihrer Ähnlichkeit zur Quercetin glucosylierenden UGT BCE_2168 aus Bacillus cereus (s. Text) ausgewählt. Zusätzlich wurde die menschliche CGT (Ceramid Galactosyltransferase) und die pflanzliche Rhamnosyltransferase UGT78D1 (s. Tab. 17) mit einbezogen. Die Makrolidresistenz vermittelnden Glucosyltransferasen OleD, OleI, MGT (s. Text) bilden einen Ast mit zwei GTs (SCO6090, SCO0040) aus dem Modellorganismus Streptomyces coelicolor A3(2) und wurden deshalb mit einbezogen. Vermutlich sind SCO6090 und SCO0040 an der unter 3.1.8 beschriebenen Glykosylierungsaktivität beteiligt. Angegeben sind die NCBI-Zugangsnummern oder der in der NCBIDatenbank gelistete Name der Enzyme. 156 4.2 Diskussion Ursprung der Freiburger Glykosyltransferasen-Toolbox Das gemäß der CODEHOP-Strategie entworfene Primerpaar P1 / P2 eignet sich zur Amplifikation von Fragmenten unbekannter Glykosyltransferase- (GT) Gene per PCR. Die Effektivität der Reaktion wird durch den Aufbau der Primer aus zwei Domänen gewährleistet (s. 3.1.9.2). Die Spezifität der degenerierten Primer ist ein entscheidender Faktor. Einerseits sollen ausschließlich Fragmente von GT-Genen amplifiziert werden, andererseits wird erwartet, dass die Primer ein breites Spektrum unterschiedlicher GT-Gene erfassen. Beiden Anforderungen kommt das Primerpaar P1 / P2 nur bedingt nach. Genomische Gesamt-DNA stellte sich als ungeeignete Matrize dar. Es kam zur Bildung nicht gewünschter PCR-Produkte. Auf Cosmid 4L16 wurde dagegen keines der GT-Gene des sam-Locus 1 erfasst. Einen wesentlichen Einfluss auf die Spezifität haben die AS-Sequenzblöcke, die zum Primerdesign herangezogen wurden (s. Abb. 45). Für das Design des Primerpaars P1 / P2 wurden ausschließlich AS-Sequenzen von GTs aus der Biosynthese von Makrolidantibiotika (ohne Resistenz vermittelnde GTs, vgl. 4.1.2.3) herangezogen. Entsprechend eng wird auch das Akzeptorspektrum der GTs erwartet, deren Gene von diesen Primern amplifiziert werden. Sieben von acht der zuvor unbekannten Gene (hol-Gene) codieren GTs, die laut BLASTRecherche (s. 5.14) Ähnlichkeit mit Enzymen aufweisen, die makrozyklische oder anguzyklische Aglyka akzeptieren. Da GTs unterschiedlicher Substratspezifität selbst in konservierten Bereichen nur bedingt AS-Sequenzübereinstimmungen zeigen, scheint das Ziel universelle Primer für GT-Gene zu entwerfen, fraglich. Schon die recht spezialisierten P1 / P2-Primer führen teilweise zur Bildung unverwünschter PCR-Produkte. Eine Erhöhung des Degenerierungsgrades, bedingt durch die Erweiterung des GT-Spektrums, würde zum verstärkten Auftreten unerwünschter PCR-Produkte führen. Als Alternative zu einem universellen Primerpaar bietet sich die Verwendung mehrerer Paare verschiedener Spezifität an. Parallel zum Makrolid- und Anguzyklin-GT spezifischen Primerpaar P1 / P2 wurden von Provencher et al. (2003) [355] nach der CODEHOP-Strategie bereits Primer für Exopolysaccharid-GT-Gene entworfen. Cosmide, die durch Gensonden auf Zuckerbiosynthesegene vorselektiert wurden, sind im Allgemeinen nicht zur Identifikation von UGT-Genen geeignet, da diese nur selten clusterassoziiert vorliegen, wie zum Beispiel oleI [340]. Komfortabel wäre es, die Vorselektion der Cosmide direkt mit GT-Gensonden durchzuführen, mehrere Versuche in dieser Richtung scheiterten jedoch [356]. Diskussion 4.3 157 Die [safe-knock]-Strategie zur gezielten Geninaktivierung 4.3.1 Revertanten bei der Verwendung klassischer Strategien Bei einem Inaktivierungsversuch des Gens pok-KSα konnte das Auftreten des Wildtypallels in den Filialgenerationen einer Knockout-Mutante festgestellt werden (s. 3.2.1.2). Das zweite Crossover-Ereignis im Genom der Knockout-Mutante war zuvor durch Verlust der vektorvermittelten Apramycinresistenz sowie Amplifizierung und Sequenzierung des veränderten DNA-Abschnitts bewiesen worden (s. 3.2.1). Die kombinierte Bestimmung von Resistenzstatus und Sequenzierung von PCR-Produkten stellt eine sehr genaue Methode zur Genotypisierung dar und geht über den zur Zeit allgemein akzeptierten Nachweis durch Resistenzstatus und Größe von PCR-Produkten [338] hinaus. Als Alternative weist die Southern-Hybridisierung zwar höhere Empfindlichkeit zur Detektion unterschiedlicher Allele auf, liefert aber keine Sequenzinformationen. Die Reversion des zunächst festgestellten Geno- oder Phänotyps bei der Verwendung vergleichbarer Inaktivierungsstrategien in Streptomyces spp. wurde bereits mehrfach beobachtet. Im Falle des Simocyclinonproduzenten S. antibioticus Tü6040 [236] produzierten Knockout-Mutanten von Genen des sim-Clusters nach einigen Monaten wieder Simocyclinon D8 [357]. Auch beim Urdamycinproduzenten S. fradiae Tü2717 kam es trotz eines zuvor bewiesenen Allelaustauschs im urd-Cluster bei bestimmten Mutanten nach Lagerung wieder zur Produktion von Urdamycinderivaten, deren Biosynthese aufgrund des eingeführten Gendefekts eigentlich blockiert sein müsste [358]. Bei Untersuchungen von Blockmutanten des Oxytetrazyklinproduzenten Streptomyces rimosus wurde das Auftreten von Revertanten beschrieben, die trotz "Deletion" noch eine minimale Oxytetrazyklinproduktion zeigten. Per Realtime-PCR wurde das otcC-Gen in einer Kopienzahl von 0,1 %, relativ zur Konzentration der nicht deletierten Gene, nachgewiesen. Die Autoren stellten sich die Frage, wie das funktionale Allel in so geringem Ausmaß über mehrere Generationen hinweg erhalten werden konnte [359]. Eine besondere Art der Speicherung von genetischer Information wurde von Rassoulzadegan et al. (2006) [360] vorgeschlagen, um die nicht auf den Mendelschen Regeln beruhende Vererbung epigenetischer Veränderungen in Mäusen zu erklären. Dabei soll RNA die Rolle als transgenerationeller Informationsträger zukommen [361]. Ein vermehrtes Auftreten von Revertanten einer Punktmutation im Genom der Modellpflanze Arabidopsis thaliana wurde von Lolle et al. (2005) [362] beobachtet. Die Hypothese, dass das intakte Allel hier in Form von RNA gespeichert wird, unterliegt zur Zeit kontroverser Diskussion [363]. Falls es tatsächlich die transgenerationelle Speicherung genetischer Information in Form von RNA gibt, ist es unwahrscheinlich, dass ein so grundlegender Mechanismus nicht alle Lebewesen, also auch Bodenbakterien, betrifft [364]. 158 Diskussion Um auch unter diesen Vorraussetzungen stabile Mutanten zu schaffen, sollte bei den folgenden Geninaktivierungen das Wildtypallel durch einen Resistenzmarker ausgetauscht werden. Die Anwesenheit des Markers im "DNA-Genom" lässt sich jederzeit durch Kultivierung mit dem entsprechenden Antibiotikum erzwingen. Für diese Art der Inaktivierung werden zwei unterschiedliche Resistenzmarker benötigt: ein Marker des Vektors zur Selektion von Erstcrossover-Mutanten, ein weiterer zur dauerhaften Integration an Stelle des Zielgens (vgl. 5.8.1.2). Das Apramycinresistenzgen (apra) ist ein zuverlässiger Selektionsmarker in vielen Streptomyces spp. [156] und kommt deshalb auf Expressionsvektoren und Cosmiden (pSET152, pOJ436, s. 5.4.1) zum Einsatz. Um die eindeutige Selektion von Erstcrossover-Mutanten bei gleichzeitiger Kompatibilität der DoppelcrossoverMutante mit den Expressionskonstrukten zu ermöglichen, sollte apra auf dem Vektoranteil des Inaktivierungsplasmids liegen. Als weiterer Marker konnte für S. diastatochromogenes Tü6028 und S. sp. Gö C4/4 das Spectinomycinresistenzgen (spec) festgelegt werden. 4.3.2 λ-Red-Rekombination zur Konstruktion des Inaktivierungsplasmids Der klassische Weg zur Konstruktion eines Inaktivierungsplasmids beinhaltet die Subklonierung des entsprechenden DNA-Bereichs in einen per Konjugation transferierbaren Inaktivierungsvektor (zum Beispiel pKC1132, s. 5.4.1) und die Generierung eines mutierten Allels. Die Einführung der Mutation sollte durch λ-Red vermittelten DNA-Austausch gegen eine Redirect-Kassette (s. 5.5.5.5) vorgenommen werden. Die Rekombination der RedirectKassette mit dem pKC1132 basierten Subklon pKC-P7,3 schlug jedoch fehl. Als Grund dafür wurden unerwünscht sequenzidentische Bereiche der Rekombinationspartner verantwortlich gemacht (s. 3.2.1.3). Besonders problematisch schien der Bereich des Apramycinpromotors, da auch das Spectinomycinresistenzgen auf allen verfügbaren Redirect-Kassetten [151] hinter den Apramycinpromotor geschaltet ist. Da die gewählten Selektionsmarker beibehalten werden sollten, durfte die Apramycinresistenzkassette folglich erst nach der λ-Red vermittelten Rekombination in das Inaktivierungsplasmid eingebracht werden. Unter dieser Vorgabe entfällt bei der Erstellung des Inaktivierungsplasmids der Schritt der (Um-)Klonierung des Clusterfragments in einen Vektor mit in Streptomyces spp. selektierbarem Marker. Es entsteht die komfortable Situation, dass jeder Subklon auf Basis eines üblichen Sequenziervektors direkt verwendet werden kann. Diese Subklone liegen in der Regel schon aus vorangegangenen Schritten wie der Clusteridentifizierung vor (vgl. 3.3.3.2). Die Konstruktion des Inaktivierungsplasmids ist in Abb. 46 dargestellt. Auch wenn durch die neue Strategie nicht weniger Arbeitsschritte als mit klassischen Klonierungen notwendig sind, so laufen die einzelnen Schritte bei vorausschauender Planung mit deutlich höheren Erfolgschancen ab. Mit dem Verzicht auf eine Umklonierung des Clusterfragments wird die Gefahr von Klonierfehlern vermieden. Der Einsatz eines Diskussion 159 Sequenziervektors mit bekannter Nukleotidsequenz erlaubt im Gegensatz zu pKC1132 (Sequenz unbekannt) die Vermeidung unerwünschter Rekombinationen beim Einsatz der λ-Red vermittelten Rekombination. Mit drei verschiedenen Resistenzmarkern ist in E. coli jeder Bestandteil des Konstrukts per Selektionsdruck auf Anwesenheit überprüfbar. In der Streptomyces sp. ist die Anwesenheit des mutierten Allels jederzeit durch Selektion mit Spectinomycin sichergestellt. Revertanten zum Wildtyp sterben ab. In der vorliegenden Arbeit wurden nach diesem neu entwickelten Schema sechs Geninaktivierungen in zwei unterschiedlichen Streptomyces spp. vorgenommen (s. 3.2 und 3.3), wobei jeder Arbeitsschritt stets direkt erfolgreich war. Wegen seiner deutlich erhöhten Sicherheit im Vergleich zu klassischen Protokollen wird das Schema als [safe-knock]Strategie bezeichnet. 4.3.3 Neue Einsatzgebiete und Erweiterungen der [safe-knock]Strategie Beim Komplementierungsversuch der Mutante S. diastatochromogenes Tü6028 ∆pok-KSα mit dem Gen pok-KSα kam es zunächst nicht zur Wiederaufnahme der Polyketomycinproduktion. Dies konnte erst durch ein Cosmid mit dem vollständigen Operon des veränderten Gens erreicht werden (s. 3.2.2). Vermutlich kam es durch den Promotor der im Zuge der Inaktivierung insertierten Resistenzkassette zur transkriptionell negativen Beeinflussung nachgeschalteter Gene des betroffenen Operons. Gleich zwei Erweiterungsmöglichkeiten der [safe-knock]-Strategie standen zur Beseitigung der hier unerwünscht auftretenden polaren Effekte zur Verfügung: die Induktion des zusammen mit der pIJ785Spec-Kassette insertierten tipA-Promotors (tipAp) oder die kürzlich entwickelte FRT-site spezifische Rekombination mit Flp(a) (vgl. Abb. 48 und 5.9). Die Induktion von tipAp mit Thiostrepton erfordert die Präsenz eines entsprechenden Resistenzgens auf dem einzuschleusenden Plasmid und damit die Konstruktion eines neuen Komplementierungskonstrukts. Auch gegen die üblicherweise subinhibitorische Thiostreptonkonzentration von 5 µg/mL zeigte sich S. diastatochromogenes Tü6028 sensitiv. Es wurde die Flp(a)-Rekombination durchgeführt. Die erzielte Ausbeute an Rekombinanten von 11 % ist ausreichend. Im weiteren Verlauf der Arbeiten stellte sich die an loxP-sites angreifende Cre(a)-Rekombinase [365] mit 100 %iger Ausbeute und problemlosem Nachweis der Exzision per PCR [156] als interessante Option für die [safe-knock]-Strategie dar. Die loxP-sites und spec tragende pIJ774Spec-Kassette wurde erstellt und für weitere Inaktivierungen eingesetzt. Mit einer gegen die Leserichtung der Clustergene integrierten Resistenzkassette kam es zur transkriptionell negativen Beeinflussung der nachgeschalteten Gene des betroffenen Operons. Der bei S. diastatochromogenes Tü6028 ∆pok-KSα unerwünschte Effekt konnte im Rahmen 160 Diskussion der vorliegenden Arbeit bewusst eingesetzt werden. Für die Inaktivierung des Gens msnK2 stand kein geeigneter Subklon zur Verfügung, wohl aber für das im selben Operon vorgeschaltete msnK1 (vgl. 3.3.5.2). Die gegen die Leserichtung des msn-Operons orientierte Resistenzkassette führte offensichtlich auch zur Inaktivierung von msnK2, da in S. sp. Gö C4/4 ∆msc15 ∆msnK1 keine Kreuzkomplementierung der minimalen PKS-Gene mehr beobachtet wurde (vgl. 4.5.2). Die durch sequenzspezifische Rekombination erweiterte [safe-knock]-Strategie ermöglicht markerlose Inaktivierungen. Im Genom zurück bleibt eine FRT- bzw. loxP-site (vgl. 5.9). Die Anzahl der gleichzeitigen Inaktivierungen ist auf die Anzahl der verfügbaren Rekombinationssysteme limitiert. Neben dem Flp-FRT- und dem Cre-loxP-System wird derzeit ein weiteres System auf Basis der Dre-Rekombinase im AK Bechthold etabliert. Der gezielte Einsatz von zwei Redirect-Kassetten mit einem identischen Rekombinationssystem kann die Entfernung ganzer Biosynthesegencluster ermöglichen, wenn an den Clusterrändern FRT- bzw. loxP-sites als direct repeats insertiert werden. Dies lässt sich mit folgender Abfolge der Arbeitsschritte verwirklichen. 1. [safe-knock]-Inaktivierung inklusive einer sequenzspezifischen Rekombination für das äußerste Gen eines Clusterendes. 2. [safe-knock]-Inaktivierung für das äußerste Gen des anderen Clusterendes mit gleicher Orientierung der FRT- bzw. loxP-sites. 3. Sequenzspezifische Rekombination und Selektion auf Sensitivität bezüglich des Markers der Redirect-Kassette. Diskussion 4.4 161 Genetische Instabilität in S. diastatochromogenes Tü6028 Das Chromosom des Wildtyps von Streptomyces spp. ist linear [366] und sehr instabil [367]. Die Instabilität betrifft, oft pleiotropisch, verschiedene phänotypische Eigenschaften [72]. Dazu zählen sowohl die morphologische Differenzierung (zum Beispiel die Sporenbildung), die Produktion von Sekundärstoffen wie Pigmenten und Antibiotika, als auch Antibiotikaresistenzen. Die zugrunde liegenden Mutationen entstehen meist durch Umlagerungen an den Enden des Chromosoms [72], auf denen nur in Ausnahmefällen [368] lebenswichtige Enzyme codiert sind. Dabei können sich die Enden zu einem zirkulären Chromosom verbinden, was zur Deletion der Telomere und angrenzender chromosomaler Bereichen führen kann [369]. Das zirkuläre Chromosom wird repliziert, ist jedoch instabiler als die lineare Form [370]. Große Deletionen sind oft mit DNA-Amplifikationen verbunden. Bis zu mehrere Hundert Amplifikate werden tandemartig an instabilen Regionen des Chromosoms hintereinandergeschaltet [72]. Etwa 200 - 300 Kopien eines Spectinomycinresistenzgens führten in Streptomyces achromogenes subsp. rubradiris zu Klonen, die bei Konzentrationen von 1000 µg/mL Spectinomycin noch schnelles Wachstum zeigten [371]. Phänotypen von S. diastatochromogenes Tü6028 wurden nach Sporenbildung und Sporenfarbe selektiert (s. 3.2.5). Die Sporulation von Streptomyces spp. unterliegt einem komplexen Regulationsmechanismus und verläuft über mehrere Entwicklungsstufen [372]. Das Auftreten unterschiedlicher Sporulationstypen könnte folglich rein regulatorisch bedingt sein. Die Konstanz des vom Wildtyp abweichenden Erscheinungsbildes über mehrere Wachstumszyklen (s. 3.2.5) lässt das Vorliegen einer genetischen Veränderung vermuten. Wie nicht zuletzt das Beispiel der bldA-Mutanten von S. coelicolor A3(2) zeigt, können Veränderungen der Koloniemorphologie in Zusammenhang mit der Produktion von Antibiotika stehen [21]. Ein solcher Zusammenhang ist bei S. diastatochromogenes Tü6028 für die Kolonien mit weißen Sporen (WS-R u. WS-L) zu erkennen. WS-L produziert kein, bei wiederholter Anzucht nur geringe Mengen von Polyketomycin, wohingegen WS-R ein Überproduzent ist. Im Fall von WS-L scheint eine generalisierte Minderexpression von Genen der PKS II-Stoffwechselwege vorzuliegen. Beim Phänotyp WS-R profitiert der Polyketomycinbiosyntheseweg vom Wegfall der Sporenpigmentsynthese, möglicherweise durch den Minderverbrauch an Acetyl-CoA oder der gezielten Hochregulation der pokGenexpression. Für die industrielle Fermentation ist die genetische Instabilität in Streptomyces spp. eine Herausforderung [373], vor allem wenn bei durch Auslese gewonnen Überproduzenten das Phänomen der Hypervariabilität auftritt [374]. Durch semi-kontinuierliche Produktionsprozesse wird dieser Problematik begegnet. 162 4.5 Diskussion Endogene Kreuzkomplementierung und Kontrolle der Kettenlänge durch DMSO im PKS II-Metabolismus von Streptomyces sp. Gö C4/4 4.5.1 Identifikation des Mensacarcinbiosynthesegenclusters Schon im Jahr 2002 wurde im AK Bechthold mit der Suche nach dem Mensacarcinbiosynthesegencluster begonnen. Bisherige Arbeiten bezogen sich jedoch ausschließlich auf das msc-Cluster, das 2003 von A. Prestel als Gencluster der Biosynthese von Mensacarcin postuliert wurde [160]. Diese Zuordnung konnte nicht bewiesen werden und wird mit der vorliegenden Arbeit widerlegt (s. 3.3). Die Inaktivierung von drei msc-Genen, darunter der KSβ codierende DNA-Bereich, hat keinen negativen Effekt auf die Mensacarcinproduktion. Im genauen Vergleich der Kulturextrakte von Wildtyp und ∆msc-Mutanten per LC/MS stellte sich ein Zusammenhang zwischen dem msc-PKS II-Cluster und der unbekannten Substanz MSC-X1 heraus. Durch die Inaktivierung von msc15 (KSβ) und msc21 (Luciferase ähnliche Oxidoreduktase) wird die MSC-X1-Produktion nahezu vollständig unterbunden, während die Inaktivierung von msc37 (FAD-abhängige Oxygenase) nicht zur Veränderung der MSC-X1Produktion führt. Stattdessen kommt es in S. sp. Gö C4/4 ∆msc37 zur Akkumulation einer mit MSC-X2 bezeichneten Verbindung (s. 3.3.2). Aus dieser Beobachtung lässt sich die Hypothese ableiten, dass sowohl MSC-X1 als auch MSC-X2 durch Msc-Enzyme synthetisiert werden, es sich jedoch nicht um die Endprodukte der Biosynthese handelt. Msc15 und Msc21 sind folglich frühe Biosyntheseenzyme, deren Fehlen die Produktion des frühen Vorläufers oder Shuntprodukts MSC-X1 unterbindet. Msc37 arbeitet erst später, so dass die Produktion von MSC-X1 nicht beeinflusst wird. Durch die Unterbrechung des Biosyntheseweges akkumuliert jedoch die Subtanz MSC-X2, die ebenfalls einen Vorläufer oder ein Shuntprodukt darstellt. Die biogenetische Herkunft von MSC-X1 aus dem Polyketidstoffwechsel wurde durch den Einbau von Isotop markiertem Acetat bestätigt (s. 3.3.7.2). Eine heterologe Produktion der Metaboliten wurde nicht erreicht (s. 3.3.5.1). Weiterführende Experimente könnten darauf abzielen, die Produktion von MSC-X1 und MSC-X2 zu verbessern und die Struktur der Substanzen nach ihrer Isolierung aufzuklären. Nachdem ein Versuch zur Produktionsverbesserung durch homologe, ektopische Überexpression der clusterinternen Regulatoren nicht zum Erfolg führte (s. 3.3.2.6), sind Promotorenaustausch oder Medienoptimierung die nächsten Schritte. Die Einteilung der PKS II positiven Cosmide in drei Gruppen deutete die Präsenz von zwei weiteren PKS II-Clustern im Genom von S. sp. Gö C4/4 an (s. 3.3.3). Im Gegensatz zu PKS I-Clustern haben PKS II-Cluster nur eine geringe Verbreitung in Streptomyces spp.. Der Modellorganismus Streptomyces coelicolor A3(2) beherbergt wie auch Streptomyces avermitilis MA-4680 zwei PKS II-Cluster [69;70], im kürzlich sequenzierten Genom von Streptomyces griseus IFO 13350 findet sich ein PKS II-Cluster [71]. Drei PKS II-Cluster wurden erst in einem Stamm, Streptomyces aureofaciens, identifiziert [207;375;376]. Diskussion 163 Die beiden neuen Cluster (mec, msn) aus S. sp. Gö C4/4 wurden über die Ansequenzierung von Subklonen zunächst bruchstückhaft erschlossen (s. 3.3.3.2). In beiden Clustern konnte ein Methyltransferasegen identifiziert werden, eine für den Aufbau von Mensacarcin notwendige genetische Grundlage, die dem msc-Cluster fehlt. Beide Cluster kamen damit als Mensacarcinbiosynthesegencluster in Frage. Vor der vollständigen Sequenzierung eines Cosmids, die zurzeit etwa 3000 - 4000 € kostet, sollten die neuen Cluster funktional charakterisiert werden. Mit Hilfe der [safe-knock]-Strategie war die Geninaktivierungen auch ohne durchgehend bekannte DNA-Sequenz möglich. Durch Inaktivierungen und heterologe Expression von Cosmiden wurde eines der Cluster (msn-Cluster) als Mensacarcinbiosynthesegencluster identifiziert, das zweite neue Cluster (mec-Cluster) konnte der Sporenpigmentbiosynthese zugeordnet werden. Die mögliche Expression des msn-Clusters in einem heterologen Wirt stellt einen beträchtlichen Vorteil für die Erforschung der Mensacarcinbiosynthese dar. Für die Geninaktivierung ist kein Allelaustausch im Genom durch Erst- und Doppelcrossover notwendig. Es genügt die Erstellung eines nicht funktionalen Allels auf dem Cosmid und die anschließende Expression des veränderten Cosmids im heterologen Wirt. 4.5.2 Endogene PKS II-Kreuzkomplementierung Die minimale PKS und früh arbeitende Enzyme des PKS-Multienzymkomplexes, wie Cyclasen und Ketoreduktasen, aus unterschiedlichen PKS II-Clustern sind meist miteinander kompatibel und führen bei der heterologen Expression von Hybridgensets zur Bildung von Polyketiden [24]. Später arbeitende Enzyme des PKS II-Metabolismus, wie Methyl- und Glykosyltransferasen, sind weniger frei kombinierbar, da sich ihre natürlichen Substrate bereits deutlich voneinander unterscheiden und diese Enzyme im Allgemeinen durch eine hohe Substratspezifität gekennzeichnet sind [93]. Sofern Enzyme aus unterschiedlichen PKS II-Clustern exakt die gleiche Reaktion katalysieren, sind die entsprechenden Gene in der Regel gegenseitig austauschbar. Ein Gendefekt in einem der beiden Gene kann durch Einbringen des anderen Gens komplementiert werden. Gezeigt wurde dies unter anderem an verschiedenen Blockmutanten mit Defekten im ksα-, ksβ-, Ketoreduktase- und einem Cyclasegen des Actinorhodinbiosynthesegenclusters (act) in Streptomyces coelicolor. Die Expression des jeweils betroffenen Biosynthesegens aus dem Granaticinbiosynthesegencluster aus Streptomyces venezuelae konnte die Actinorhodinproduktion wiederherstellen [218]. Vermutlich teilen sich die beiden Benzoisochromanchinone Actinorhodin und Granaticin einen gemeinsamen Biosynthesevorläufer. Neben dem act-Cluster findet sich im Genom von Streptomyces coelicolor ein weiteres PKS II-Cluster, das whiE-Cluster, welches der Sporenpigmentbiosynthese zugeordnet wird. Blockmutanten mit Defekt in den Genen der minimalen Act-PKS können durch die kontrollierte Expression von ektopisch eingebrachten whiE-Genen komplementiert werden. whiE-Mutanten lassen sich durch entsprechende act-Gene komplementieren [210]. Die durch eine kontrollierte Expression erreichte Kreuzkomplementierung wird natürlicherweise nicht 164 Diskussion beobachtet [24]. Ein Grund könnte die räumlich differenzierte Expression beider Cluster unter natürlichen Bedingungen sein. Die Bildung der Act-PKS ist eher im vegetativen Myzel zu erwarten, die WhiE-PKS hingegen wird in den sich bildenden Sporen aufgebaut. PKS II-Cluster werden oft in Antibiotikabiosynthesegencluster und Sporenpigmentbiosynthesegencluster eingeteilt. Anhand der phylogenetischen Verwandschaftsgrade der ksα-Gene lässt sich diese Einteilung nachvollziehen [200]. Der Mensacarcinproduzent S. sp. Gö C4/4 verfügt demnach über zwei Antibiotikabiosynthesegencluster (msc und msn) und ein Sporenpigmentbiosynthesegencluster (mec). Die gleichzeitige Inaktivierung von Ketosynthase-(ks)-Genen beider Antibiotikabiosynthesegencluster verhindert die Produktion der zugehörigen Polyketide (S. sp. Gö C4/4 ∆msc15 ∆msnK1, s. 3.3.5.2). Das noch intakte Genset des mec-Sporenpigmentbiosynthesegenclusters kann die Gendefekte analog zu den oben erwähnten Beobachtungen bei S. coelicolor nicht komplementieren. Werden nur ks-Gene eines der beiden Antibiotikabiosynthesegencluster inaktiviert, nimmt die Produktion des entsprechenden Sekundärstoffs (∆msnK1: Mensacarcin, ∆msc15: MSC-X1) zwar sehr stark ab, bleibt aber auf niedrigem Niveau bestehen (s. 3.3.5.2). Die Ergebnisse belegen eine endogene Kreuzkomplementierung der ks-Gene aus msc- und msn-Cluster. Parallel zur Produktion von Mensacarcin verhält sich unter dem Einfluss von DMSO die ebenfalls auf msn-Gene zurückführbare Synthese der Heptaketide Mensalon und Aloesol (s. 3.3.7.3). Mit Ausnahme des Genoms von S. aureofaciens wurde in Genomen von Streptomyces spp. bisher maximal ein PKS II-Cluster identifiziert, das phylogenetisch der Antibiotikabiosynthese zugeordnet werden kann. S. aureofaciens verfügt wie S. sp. Gö C4/4 über zwei Antibiotikabiosynthesegencluster, von denen eines jedoch als "stilles Cluster" beschrieben wurde [376]. Damit überrascht es eigentlich nicht, dass eine endogene PKS II-Kreuzkomplementierung erstmalig in S. sp. Gö C4/4 zu beobachten ist. Das Ausmaß der Komplementierung ist gering, was auf unterschiedliche Substrate der beiden Ketosynthasedimere hinweist. Die Präsenz eines Acyltransferasegens (msc13) und eines zusätzlichen Ketosynthasegens für die Startereinheit (msc17) im msc-Cluster, nicht jedoch im msn-Cluster, bekräftigen diese Vermutung. Wegen endogener Kreuzkomplementierung ist die kontrollierte Genexpression mehrerer PKS II-Cluster der Antibiotikabiosynthese in einem Genom nur schwer zu realisieren. Eine räumliche Trennung der Expression, wie für Antibiotika- und Sporenpigmentbiosynthesegencluster postuliert, löst das Problem. Die Präsenz von drei PKS II-Clustern in S. sp. Gö C4/4 und S. aureofaciens wirft die Frage auf, ob es einen dritten Typ von PKS IIClustern gibt. Interessanterweise wurde eines der Cluster aus S. aureofaciens als "stilles Cluster" beschrieben, auch das Biosyntheseendprodukt des msc-Cluster wurde nicht identifiziert. Vielleicht ist die Expression des dritten Typs von PKS II-Clustern auch an spezielle Wachstumsbedingungen geknüpft, die unter Laborbedingungen nicht erreicht werden, oder die entsprechenden Polyketide treten, wie auch für Sporenpigmente vermutet, als Polymerisate oder fest gebunden an andere Zellbestandteile auf. 165 Diskussion 4.5.3 Die Biosynthese von Mensacarcin Polyketidsynthese Die Grundstruktur bildende Decaketidkette wird durch die minimale PKS, bestehend aus MsnK1 - 3, zusammengesetzt. Für die folgenden Reaktionen stehen dem PKS-Multienzymkomplex drei Cyclasen (MsnC1 - 3) sowie drei Ketoreduktasen (MsnO1, MsnO10 - 11) zur Verfügung. MsnC1 - 3 könnten für die zwischen C-7 / C-12, C-5 / C-14 bzw. C-3 / C-16 regioselektiv im Sinne von Aldolreaktionen ablaufenden Cyclisierungen verantwortlich sein, wobei MsnC2 aufgrund von Aminosäuresequenzähnlichkeiten als Cyclase des 2. Rings für die 5,14-Cyclisierung postuliert wird (s. 3.3.5.4). Sowohl MsnC1 als auch MsnC3 verfügen über eine Dehydratasedomäne und kommen deshalb als bifunktionelle Katalysatoren der 7,12-Cyclisierung und 8,9-Dehydratisierung in Frage, die zur Aromatisierung des ersten Ringes führt. Eine der Cyclasen (MsnC1 oder MsnC3) ist für die Bildung des dritten Rings verantwortlich. Ketoreduktionen an der ACP-gebundenen, eventuell bereits teilweise cyclisierten β-Ketidkette, könnten in Einklang mit der Präsenz dreier Ketoreduktasegene an drei Positionen stattfinden (C-9, C-15, C-19). Die Reduktion an C-9 (MsnO11) ist für die korrekte Faltung der Kette obligat [250]. Die Reduktion an C-19, wahrscheinlich durch MsnO1, s. 3.3.5.4, verhindert die in der Biosynthese der Anthrazykline ablaufende Ausbildung eines vierten Rings. Auch die Reduktion der Ketogruppe an C-13 könnte bereits durch eine Ketoacyl-(ACP)-Reduktase katalysiert werden. Mit dem postulierten Reaktionsmechanismus der Anthronoxygenasen [165] wäre die Reduktion an C-13 jedoch erst nach der Anthronoxygenierung möglich. Es ist deshalb anzunehmen, dass die Reduktion erst zu einem späteren Zeitpunkt der Biosynthese stattfindet. 10 Acetateinheiten Aromatisierung O Red. O O Cyc. Cyc. O O 15 Red. O O Cyc. O O Red. 9 O -H2O 1 Anthronoxygenierung Red. OH O OH O O Ox. OH 19 O Decarboxylierung SEnz OH Ox. Ox. OH OH OH O OH Red. (-H2O/Ox.) O Didesmethyldihydromensacarcin OH 2 Methylierungen OH OH OH O OH O O O OH Didesmethylmensacarcin OMe OMe OH O OH O O O OH Mensacarcin Abb. 94: Reaktionen auf dem Biosyntheseweg zum Mensacarcin (Cyc.: Cyclisierung und Dehydratisierung, Red.: Reduktion, Ox.: Oxygenierung). 166 Diskussion Decarboxylierung Alle bekannten Mensacarcinderivate [56] zeichnen sich durch den Verlust des ersten Kohlenstoffatoms der β-Ketidkette aus. Auch bei den von der Msn-PKS hervorgebrachten Heptaketiden Mensalon und Aloesol hat die Decarboxylierung bereits stattgefunden. Damit lässt sich die Reaktionsfolge von der Biosynthese der Anthrazykline Daunomycin und Doxorubicin abgrenzen, in der die Decarboxylierung nach dem Glykosyltransfer als einer der letzten Schritte abläuft [377]. Ein Methyltransferase homologes Enzym (DauP bzw. DnrP) wird in der Anthrazyklinbiosynthese als Esterase und Decarboxylase postuliert [378]. In der Biosynthese der Anguzykline hingegen findet die Decarboxylierung vor dem Glykosyltransfer statt [379]. Die Anguzyklinbiosynthesegencluster codieren häufig ein (De-)Carboxylase ähnliches Enzym, dessen Funktion noch nicht experimentell bestätigt wurde: zum Beispiel LanP [380], JadN [381], SimA12 [236]. Ein verwandtes Genprodukt kann aus dem msn-Cluster nicht abgeleitet werden. Als vinyloge β-Ketocarbonsäure ist die spontane Decarboxylierung des teilweise reduzierten Mensacarcinintermediats denkbar (s. Abb. 95). Aklanonsäure, der analoge Vorläufer von Doxorubicin, decarboxyliert spontan in DMSO oder Pyridin [382]. Die Isolierbarkeit von Aklanonsäure aus Fermentationen spricht aber gegen die effektive Decarboxylierung unter Kulturbedingungen. Viele Enzyme des PKS II-Metabolismus sind multifunktionell [23]. Möglicherweise ist es schon die Decarboxylaseaktivität der KS Untereinheit β [23], die bei der Trennung vom Multienzymkomplex den Verlust von C-1 herbeiführt. OH O OH OH OH O OH O H O O O O H O OH O OH O + O C OH O OH CO2 O Abb. 95: Mechanismus der spontanen Decarboxylierung eines teilweise reduzierten Mensacarcinderivats. Weitere Reduktionen und Oxygenierungen Der Chinonreduktion am zweiten und der Enoylreduktion am dritten Ring (s. Abb. 94) steht lediglich ein Enzym (MsnO9) mit signifikanter Ähnlichkeit zu NADPH:Chinonreduktasen und Enoylreduktasen gegenüber. Eine der Reduktionen könnte von einer weiteren als Reduktase arbeitenden Oxidoreduktase katalysiert werden oder findet im Rahmen einer Oxygenierung statt. 167 Diskussion OMe OMe OH ∗ O ∗ OH O 9 10 1 O∗ 6 4a 5 O 4 11 15 OH ∗ ∗ 18 ∗ [ O 2 ] Gas 13 L-[Methyl- 13 C] Methionin [1- 13 C] Acetat [1,2- 13 C 2 ] Acetat Einzelnes Kohlenstoffatom aus [1,2-13 C 2 ] Acetat Abb. 96: Einbau von isotopenmarkierten Biosynthesevorläufern gemäß M. Arnold, 2002 [56]. Durch die Kultivierung von S. sp. Gö C4/4 in einer [18O2]-Atmosphäre konnte von Dr. M. Arnold die biogenetische Herkunft von fünf Sauerstoffatomen des Mensacarcinmoleküls aus Luftsauerstoff gezeigt werden (s. Abb. 96). Der Einbau von 18O bewirkt bei den Signalen der benachbarten Kohlenstoffatome im 13C-NMR-Spektrum eine Hochfeldverschiebung. Sauerstoffeinführende Enzyme werden als Oxygenasen bezeichnet. Sie gehören zu den Oxidoreduktasen (EC 1). Die Einführung des Carbonylsauerstoffs an C-5 (Abb. 96) erfolgt durch eine Anthronoxygenase (vgl. 3.3.5.4). Welche der Gene msnO5 - 7 für die Anthronoxygenierung an C-6 essentiell sind, wird zurzeit von Katharina Probst (AK Bechthold) im Rahmen ihrer Doktorarbeit durch Inaktivierungsexperimente bestimmt. Die C-4 äquivalente Position wird in der Anthrazyklinbiosynthese durch FAD abhängige Monooxygenasen hydroxyliert. Ein Beispiel ist die Aklavinon-11-hydroxylase DnrF [383]. Ähnliche Genprodukte können vom msn-Cluster jedoch nicht abgeleitet werden. Die Hydroxylgruppe an C-2 von Mensacarcin erinnert an das 12a-OH der Tetrazykline [246;359] und des Mithramycinvorläufers Premithramycinon. Abdelfattah und Rohr (2006) [384] schlagen für die Einführung des Sauerstoffs beim Mithramycin eine von der FAD abhängigen Monooxygenase MtmOII katalysierte Oxiranbildung mit anschließender reduktiver Ringöffnung vor (s. Abb. 97). Die für die Epoxidierung notwendige Doppelbindung ist im postulierten Mensacarcinintermediat (s. Abb. 94, unten links) vorhanden. Ein MtmOII ähnliches Enzym wird vom msn-Cluster nicht codiert. Mtm-PKS OH OH OH O OH OH O O O O MtmOII ? OH OH O MtmOII ? O OH O O HO OH OH HO OH OH HO OH OH Desmethylpremithramycinon Abb. 97: Postulierter Mechanismus der 12a-Hydroxylierung in der Biosynthese von Mithramycin [384]. Besonderes Interesse gilt in der Biosyntheseforschung der Bildung von Epoxiden, die durch ihre Reaktion mit DNA-Basen oft maßgeblich an der Zytotoxizität niedermolekularer Arzneistoffe beteiligt sind [385]. Obwohl die Epoxidierung mehrfach für die mechanistische 168 Diskussion Erklärung von Oxygenierungen herangezogen wurde [384], konnte bisher kein Enzym des PKS II-Metabolismus identifiziert werden, das die Bildung von stabilen Epoxiden katalysiert. Die Bereitstellung der msn-Clustersequenz erlaubt nun auf molekularbiologischer Ebene Biosyntheseuntersuchungen an der modellhaften Struktur von Mensacarcin mit Ring- und Seitenkettenepoxidierung. Im PKS I-Metabolismus lassen sich Epoxidierungen vor allem Cytochrom P-450 Monooxygenasen zuordnen (Epothilone [386], Oleandomycin [387] sowie Pimacrin [388]). Das Fehlen entsprechender Gene im msn-Cluster, wie auch die Mensacarcinproduktion von S. sp. Gö C4/4 trotz des Zusatzes von Inhibitoren der Cytochrom P-450 Monooxygenasen [56], zeigen, dass diese Art von Enzymen in der Mensacarcinbiosynthese keine Rolle spielt. Alternativ kann der Epoxidsauerstoff durch flavinabhängige Monooxygenasen eingeführt werden [191]. Ein Beispiel ist das Enzym MonCI, eine FAD abhängige Epoxidase der Biosynthese des PKS I-Metaboliten Monensin [291]. Die vergleichende Betrachtung von Enzymen ähnlicher Funktionalität für die Oxygenierungen an C-1, C-2, C-4a / C-10a und C-12 / C-13 des Mensacarcingrundgerüsts lässt auf die Beteiligung flavinabhängiger Monooxygenasen schließen. Tatsächlich stehen der Mensacarcinbiosynthese mit den Genprodukten von msnO2, msnO4 und msnO8 putative Flavoproteine zur Verfügung, die zu den Luciferase ähnlichen Oxidoreduktasen zählen. Die Rekrutierung von Vertretern dieser Enzymfamilie für Reaktionen, die im PKS IIMetabolismus üblicherweise von FAD abhängigen Oxidoreduktasen katalysiert werden, wurde zuvor noch nicht beschrieben. Sie ist in der Mensacarcinbiosynthese jedoch sehr wahrscheinlich. An den genannten Oxygenierungen könnten auch die Anthronoxygenase ähnlichen Enzyme MsnO5 - 7 oder die hypothetischen Proteine MsnH4 und MsnH6 beteiligt sein. Da die genetischen Informationen des msn-Clusters deutlich von bisher charakterisierten PKS II-Clustern abweichen, ist ein experimenteller Funktionsbeweis der Enzyme obligat. Entsprechende Geninaktivierungen werden zurzeit im AK Bechthold durchgeführt. Die Isolierbarkeit von Didesmethyldihydromensacarcin (s. Abb. 94) zeigt an, dass die Dehydratisierung der Seitenkette nicht spontan sondern enzymkatalysiert abläuft. Sofern das Derivat ein Biosynthesevorläufer von Mensacarcin ist, wären die Dehydratisierung und die Seitenkettenepoxidierung vor der Methylierung die letzten Schritte der Mensacarcinbiosynthese. Die Fütterung von Didesmethyldihydromensacarcin an die Nullmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 stellt eine Möglichkeit dieses aufzuklären dar. Methylierungen Im von Transposasegenen klar umgrenzten msn-Cluster konnte nur ein Methyltransferasegen identifiziert werden. Obwohl Methyltransferasen im Allgemeinen regioselektiv arbeiten [389], scheint MsnO6 in der Mensacarcinbiosynthese für beide O-Methylierungen verantwortlich zu sein. Der Vorläufer 10-O-Desmethylmensacarcin [56] deutet darauf hin, dass zunächst in Position 9 methyliert wird. Diskussion 169 4.5.4 Der Einfluss von DMSO auf den Msn-Multienzymkomplex führt zum vorzeitigen Kettenabbruch Die Kultivierung von S. sp. Gö C4/4 unter Zusatz von 2 % DMSO zum Kulturmedium führt zur Produktion der beiden Heptaketide Mensalon und Aloesol (s. 3.3.1). Durch die Inaktivierung des Gens msnK1 (KSα der Mensacarcinbiosynthese) kommt die Heptaketid- und Mensacarcinproduktion fast vollständig zum Erliegen. Mit zusätzlicher Mutation eines ks-Gens des msc-Clusters (msc15) lässt sich keiner der drei Metaboliten mehr im Kulturextrakt nachweisen (s. 3.3.7.3). Heterolog in Streptomyces albus exprimiert, führt Cos2 mit einem Fragment des msn-Clusters zur Produktion von Mensalon, Aloesol und Didesmethylmensacarcin. Cosmide der beiden anderen PKS II-Cluster hingegen induzieren keine per LC/MS detektierbare Produktion der Sekundärstoffe (s. 3.3.5.1). Zusammenfassend legen die Ergebnisse dar, dass die Heptaketide Mensalon und Aloesol durch die vom Mensacarcinbiosynthesegencluster (msn-Cluster) codierte Polyketidsynthase aufgebaut werden. Ein Defekt in msnK1 (ksα) wird vom entsprechenden Gen des msc-Cluster komplementiert. Ohne die Gene des msn-Clusters führt das msc-Cluster jedoch heterolog nicht zur Bildung der Heptaketide. Sowohl die Kontrolle der Polyketidkettenlänge durch eine Chemikalie (hier DMSO) als auch die endogene Kreuzkomplementierung in der PKS II-Biosynthese sind in dieser Arbeit erstmalig beschrieben. Die Ergebnisse erlauben ein besseres Verständnis des PKS IIMetabolismus in Bodenbakterien. Der Multienzymkomplex Die heutige PKS II-Biosyntheseforschung schließt von der gezielten Mutation über die Akkumulation von möglichen Vorläufern oder Shuntprodukten auf Genfunktionen. Wie problematisch derartige Rückschlüsse sind, zeigen die oben erwähnten Untersuchungen von Abdelfattah und Rohr zur Funktion des Enzyms MtmOII in der Biosynthese von Mithramycin (vgl. 4.5.3). Der bei Geninaktivierung akkumulierende Metabolit Premithramycinon G scheint aus einem Dodecaketid hervorgegangen zu sein, wobei das Biosyntheseendprodukt Mithramycin sich von einem Decaketid ableitet. Die Autoren schlagen aufgrund dieser Beobachtung vor, dass die FAD abhängige Monooxygenase MtmOII für die Kontrolle der Polyketidkettenlänge verantwortlich ist. Vier Jahre zuvor ordnete Rohr das gleiche Enzym als post-PKS modifizierend ein [389]. Ein Widerspruch, der das rasch zunehmende Verständnis von PKS II-Metaboliten als Produkt eines Multienzymkomplexes offenlegt und gegen die frühere Vorstellung nacheinander arbeitender Einzelenzyme abgrenzt. Die heterologe Expression von Genen des Resistomycinbiosynthesegenclusters legt nahe, dass die konzertierte Katalyse aller drei Cyclasen zum Aufbau des Ringsystems notwendig ist [390]. In der Biosynthese von Enterocin scheint abweichend von früheren Vorstellungen die weitere Polyketidkettenverlängerung von einer zwischengeschalteten Cyclisierungsreaktion abhängig zu sein [391]. 170 Diskussion Dass es in PKS II-Biosynthesewegen überhaupt "post-PKS-Enzyme" gibt, erscheint vor dem Hintergrund aktueller Ergebnisse fraglich. Der Zeitpunkt der Trennung des Polyketids vom Multienzymkomplex in vivo ist unbekannt. Für einige der "post-PKS-Enzyme" wurde gezeigt, dass sie auf nicht ACP-gebundene Substrate wirken [23]. Aus dieser Beobachtung kann jedoch nicht abgeleitet werden, dass die Enzyme auch in vivo ohne Assoziation mit dem Multienzymkomplex arbeiten. Denn auch die als Bestandteil des Multienzymkomplexes vermuteten Ketoreduktasen setzen nicht ACP-gebundene Substrate um [392]. Als Begründung für die Einteilung in PKS-Multienzymkomplex und "post-PKS-Enzyme" könnte die Akkumulation früher Biosynthesevorläufer zu Beginn der Kultivierung, wie bei der Mensacarcinbildung zu beobachten [56], herangezogen werden. Sie zeigt aber lediglich die Lösung des Substrats vom ACP und impliziert die sich anschließende Modifizierung durch weitere Enzyme des PKS II-Metabolismus. Dass diese Enzyme in vivo nicht als Teil des PKSMultienzymkomplexes agieren, konnte bisher nicht gezeigt werden. Eine Einteilung der Enzyme des PKS II-Metabolismus in Enzyme des Multienzymkomplexes und "post-PKSEnzyme" ist deshalb bis auf weiteres nicht möglich. Die Wirkung von DMSO auf die PKS II-Biosynthese Neben einem möglichen Einfluss von DMSO auf die Regulation oder die Proteinbiosynthese könnte die Chemikalie auch die Arbeit eines Enzyms des Mensacarcinbiosynthese modifizieren oder unterbinden. Noch vor wenigen Jahren wäre als beeinflusstes Enzym direkt der "chain length factor" genannt worden. Der chain length factor wurde als allein verantwortlich für die Kettenlänge postuliert [24]. Später wurde das Enzym in Ketosynthase Untereinheit β (KSβ) umbenannt, da die Aussage getroffen werden konnte, dass KSα und KSβ die Kettenlänge gemeinsam bestimmen [23]. Inzwischen ist, mit Ausnahme der Methyl- und Glykosyltransferasen, für alle Arten von Enzymen, die an Aufbau und Modifikation des PKS II-Polyketids beteiligt sind, ein Einfluss auf die Kettenlänge gezeigt worden (s. o.). Die Frage nach dem durch DMSO beeinflussten Enzym lässt sich deshalb nicht direkt beantworten. Sofern ein einzelnes Enzym betroffen ist und es sich dabei nicht um einen Bestandteil der minimalen PKS handelt, könnte dieses mit einer Geninaktivierung, die zur Akkumulation der Heptaketide führt, identifiziert werden. Vorrangige Kandidaten sind die Ketoreduktase-, Cyclase- und Oxidoreduktasegene. Handelt es sich um eine Beeinflussung der minimalen PKS durch DMSO, kann ein alternativer Forschungsansatz verfolgt werden, der die heterologe Expression eines minimalen Gensets zur Bildung der Heptaketide zum Inhalt hat. Dieses minimale Genset enthält neben der minimalen PKS zwingend auch eine Oxidoreduktase. Verfolgt man die Metabolitenbildung aus der β-Ketidkette, so fällt auf, dass in beiden Molekülen eine Ketoreduktion stattgefunden hat (s. Abb. 98). Die Cyclisierungen und Dehydratisierungen könnten dagegen auch spontan stattfinden [23]. Es wird angenommen, dass Ketoreduktasen stets an einer für das jeweilige Enzym spezifischen Position, gezählt ab dem Carboxylterminus der vollständig aufgebauten Polyketidkette, die Reduktion der Carbonylfunktion zum Alkohol katalysieren. Eine entsprechende Konstanz der 171 Diskussion Regioselektivität lässt sich bei den phylogenetisch eine Familie bildenden C-9-Ketoreduktasen unabhängig von der Kettenlänge feststellen [250]. Kristallisations- und Modellingstudien untermauern die Hypothese, dass C-9-Ketoreduktasen auf die vollständig ausgebildete, möglicherweise zum Teil schon cyclisierte Polyketidkette wirken [392]. SEnz O O 1 O EnzS O O O 1 O O O 9 O O HO O 9 OO Mensalon O OH O 1 SEnz HO O 9 O OH O O O SEnz 1 O O O O O O O O 9 O OO Aloesol Abb. 98: Jeweils zwei Orientierungen der β-Ketidkette kommen für die Bildung der Heptaketide Mensalon und Aloesol in Frage [56]. Die bisherige Definition der Regioselektivität von Ketoreduktasen kann nur zur Erklärung von Mensalon herangezogen werden. Die bisher charakterisierten Ketoreduktasen des PKS II-Metabolismus grenzen sich mit ihrer Substratspezifität von Ketoreduktasen der bakteriellen Fettsäuresynthese (FabG) ab, welche als 3-Ketoacyl-(ACP)-Reduktasen arbeiten. Die in der Mensacarcinbiosynthese postulierten Reduktionspositionen (s. Abb. 94: C-9, C-15, C-19) können als Erklärung für die Reduktion im Mensalon durch eine C-9-Ketoreduktase, ausgehend von der links abgebildeten Kette, herangezogen werden (s. Abb. 98). Die Reduktion zur Aloesolbildung ist auf diese Weise nicht nachvollziehbar, ließe sich aber mit einer alternativen Definition der Regioselektivität erklären. Analog zu FabG könnte es auch im PKS II-Metabolismus bestimmte Ketoreduktasen geben, die nicht auf die vollständig aufgebauten β-Ketidketten wirken, sondern zu bestimmten Zeitpunkten als 3-Ketoacyl-(ACP)-Reduktasen auf die naszierende Polyketidkette wirken. Neben einer oder mehreren Msn-Ketoreduktasen könnte EncD aus der Enterocinbiosynthese ein weiteres Enzym dieses Typs darstellen. EncD wird eine sehr frühe Rolle in der Polyketidbiosynthese zugeordnet, da bei der heterologen Expression von Genen der minimalen Enc-PKS nur durch Koexpression von encD detektierbare Produkte generiert wurden [391]. Für die Untersuchung der Regioselektivität von Ketoreduktasen sind die drei aus der MsnPKS hervorgehenden Metabolite Mensacarcin, Mensalon und Aloesol ein geeignetes Modell. 172 Diskussion O O O O SEnz O O O O 19 EnzS 9 O O 15 O O HO Mensalon O O 15O O O OH OH O SEnz HO 9 O O SEnz O O 9 O 9 15 O O 19 O 19 O O O 15 O OO 19 Aloesol Heptaketid SEnz O O 9 SEnz O O O 9 SEnz O O O O O 9 O O O O O O O O O O 15 O O O 15 O 19 O O 15 O 19 O 1 O O O SEnz O Dekaketid 9 15 O 19 O 19 Abb. 99: Ein alternatives Modell zur Kontrolle der Regioselektivität von Ketoreduktasen. Als 3-Ketoacyl(ACP)-Reduktase arbeitende Enzyme würden unabhängig von der Gesamtkettenlänge stets die letzte (C-19), vom Ende dritte (C-15) und vom Ende sechste (C-9) Ketogruppe reduzieren. Mit diesem Modell ist die Bildung von Mensalon und Aloesol unter Beteiligung der Msn-Ketoreduktasen erklärbar. 173 Material und Methoden 5 Material und Methoden 5.1 Laborgeräte / Analyseinstrumente Tab. 18: Laborgeräte / Analyseinstrumente. Bezeichnung Elektroporationskammer GenePulser II French Pressure Cell Press Gefriertrocknungsanlage Christ Alpha 2-4 LSC HPLC, analytisch: 717 plus Autosampler, 2 Pumpen Waters 515, Säulenofen Jetstream 2, Waters 2996 Photodiode Array Detector HPLC, präparativ: Degasser AF, quaternäres Pumpsystem: Delta 600, Waters 2487 Dual λ Absorbance Detector, Fraction Collector III LC/MS, analytisch und präparativ: Agilent 1100 Series: Degasser G1322A, Autosampler G1313A, Säulenofen G1316A, quaternäre Pumpe G1311A, DAD G1315B, Quadrupol-Massendetektor G1946D, ESIoder APCI-Quelle Massenspektrometer, hochauflösend: LC-ESI-MS/MS-Kopplung mit LTQ-Orbitrap NMR-Spektrometer Bruker Avance DRX 400 NMR-Spektrometer JEOL Alpha Schüttelinkubator SDS-PAGE-Kammer Mini-PROTEAN 3 Spektralpolarimeter J-810 Spektrometer UVIKON 933 Spektrometer Ultrospec 2100 pro Thermocycler Gene Amp PCR System 9700 Thermocycler Mastercycler epgradient Zentrifuge 5415R bzw. 5417R: 1,5 mL / 2 mL vials Zentrifuge Avanti J-20XP: Falcontubes Zentrifuge Rotina 35 R: 500 mL Gefäße Hersteller BIO-RAD (Birmingham, UK) Thermo Spectronic (Rochester, USA) Christ (Osterode) Waters (Milford, USA) Waters (Milford, USA) Agilent (Santa Clara, USA) ThermoFisher Scientific (Bremen) Bruker (Karlsruhe) Jeol (Tokyo, Japan) Multitron Infors (Bottmingen, CH) Amersham (Little Chalfont, UK) Jasco (Easton, USA) Kontron Instruments (Neufahrn) Amersham (Little Chalfont, UK) Applied Biosystems (Foster City, USA) Eppendorf (Hamburg) Eppendorf (Hamburg) Beckman Coulter (Krefeld) Hettich (Tuttlingen) Sowie weitere Apparaturen der Grundausstattung chemischer und biologischer Laboratorien. 174 5.2 Material und Methoden Lösungen, Nährmedien, Chemikalien, Enzyme und Kits 5.2.1 Lösungen für biochemische und molekularbiologische Arbeiten Wenn nicht anders angegeben, handelt es sich um wässrige Lösungen, die mit H2Obidest hergestellt wurden. 5.2.1.1 Proteingelelektrophorese (SDS-PAGE) Tab. 19: Lösungen zur SDS-PAGE (s. 5.10.2). Lösung / Gel Sammelgel (4 %) Zusammensetzung H2Obidest 0,5 M Tris-HCl (pH 6,8) 10 % (m/V) SDS Rotiphorese Gel 30 10 % (m/V) APS TEMED Trenngel (12%) H2Obidest 1,5 M Tris-HCl (pH 8,8) 10 % (m/V) SDS Rotiphorese Gel 30 10 % (m/V) APS TEMED Probenpuffer H2Obidest 0,5 M Tris-HCl (pH 6,8) 10 % (m/V) SDS β-Mercaptoethanol 1 % (m/V) Glycerin Bromphenolblau Laufpuffer pH 8,3 Tris (5×Konzentrat) Glycerin SDS H2Obidest ad Färbelösung Coomassie Brillant Blue G250 H2Obidest Ethanol Essigsäure Fixier- und H2Obidest Entfärbelösung Ethanol Essigsäure 6,1 mL 2,5 mL 0,1 mL 1,33 mL 0,05 mL 0,01 mL 3,35 mL 2,5 mL 0,1 mL 4,0 mL 0,05 mL 0,005 mL 3,8 mL 1,0 mL 0,8 mL 1,6 mL 0,4 mL 0,4 mL 15,0 g 72,0 g 5,0 g 1000 mL 0,25 % 45 % 45 % 10 % 45 % 45 % 10 % Anmerkung In angegebener Reihenfolge mischen, direkt verwenden. In angegebener Reihenfolge mischen, direkt verwenden. Lagerung bei −20 °C. Lagerung bei 4 °C, vor Gebrauch mit H2Obidest verdünnen. (m/V) (V/V) (V/V) (V/V) (V/V) (V/V) (V/V) 175 Material und Methoden 5.2.1.2 DNA-Isolierung (Alkalische Lyse) Plasmidisolierung aus Escherichia coli Tab. 20: Puffer zur Plasmidisolierung aus E. coli (s. 5.5.2). Puffer P1 P2 P3 Zusammensetzung Tris-HCl EDTA NaOH SDS Kaliumacetat 25 mM 10 mM 0,2 M 1% 3,0 M Anmerkung pH 8,0 einstellen. Getrennt ansetzen. (m/V) Mit Eisessig auf pH 5,2 einstellen. Isolierung genomischer DNA aus Streptomyces spp. Tab. 21: Puffer zur Isolierung genomischer DNA aus Streptomyces spp. (s. 5.5.2). Puffer B1 Zusammensetzung Tris-HCl EDTA 1M 0,25 M Anmerkung pH 8,0 einstellen. 5.2.1.3 Agarosegelelektrophorese Tab. 22: Lösungen zur Agarosegelelektrophorese (s. 5.5.4). Lösung / Puffer 0,7 % Agarose (m/V) Zusammensetzung Agarose TAE-Puffer (s. u. ) Ladepuffer 6× 1 kb Leiter TAE (50×Konzentrat) gebrauchsfertige Lösung von Promega gebrauchsfertige Lösung von Promega Tris 2M EDTA 0,05 M Methylenblaufärbebad Ethidiumbromidfärbebad Methylenblau 0,2 % Ethidiumbromid 10 ad 7,0 g 1000 mL µg/ mL Anmerkung In der Mikrowelle bis zu einer klaren Lösung aufkochen, bei 55 °C lagern. Gemäß Herstellerangaben verwenden. Mit Eisessig auf pH 8,0 einstellen, vor Gebrauch mit H2Obidest verdünnen. (m/V) Schutzausrüstung verwenden. 176 Material und Methoden 5.2.1.4 Protoplastierung und Transformation von Streptomyces spp. Tab. 23: Puffer zur Protoplastierung und Transformation von Streptomyces spp. (s. 5.7.1) gemäß [393]. Lösung / Puffer P-Puffer T-Puffer Spurenelementelösung P Zusammensetzung Saccharoselösung (12 % m/V) Spurenelementelösung P (s. u.) TES (0,25 M, pH 7,2) MgCl2 (1 M) K2SO4 (140 mM) KH2PO4 (40 mM) CaCl2 (0,25 mM) Saccharoselösung (25 % m/V) PEG 1000 (50 % m/V) K2SO4 (140 mM) CaCl2 (1 M) MgCl2 (1 M) KH2PO4 (40 mM) Tris-Maleat (0,5 M, pH 8,0) Spurenelementlösung P (s. u.) H2Obidest FeCl3×6H2O ZnCl2 CuCl2×2H2O MnCl2×4H2O Na2B4O7×10H2O (NH4)6Mo7O24×4H2O H2Obidest ad 85,5 mL 0,2 mL 10,0 mL 1,0 mL 1,0 mL 1,0 mL 1,0 mL 1,0 mL 5,0 mL 0,1 mL 1,0 mL 0,1 mL 0,1 mL 1,0 mL 0,03 mL 2,0 mL 0,20 g 0,04 g 0,01 g 0,01 g 0,01 g 0,01 g 1000 mL Anmerkung Alle Lösungen getrennt autoklavieren. Lagerung bei −20 °C. Alle Lösungen getrennt autoklavieren. Lagerung bei −20 °C. Autoklavieren. 5.2.2 Nährmedien Alle Nährmedien wurden autoklaviert. Festmedien enthielten Agar als Gerüstbildner, soweit nicht anders angegeben in einer Konzentration von 18 g/L. Der pH-Wert wurde, wenn nicht anders angegeben, mit 1 M HCl- bzw. 1 M NaOH-Lösung eingestellt. Antibiotika und andere hitzeempfindliche Substanzen wurden nach dem Autoklavieren steril zugegeben. 177 Material und Methoden 5.2.2.1 Aspergillus nidulans TTRM1 Tab. 24: Medium zur Kultivierung von Aspergillus nidulans TTRM1 (s. 5.3). Medium GMM+Biotin Nitratsalzkonzentrat 20× Spurenelementelösung G Zusammensetzung Glucose-Monohydrat Nitratsalzkonzentrat 20× Spurenelementelösung G Biotinlösung (0,01 % (m/V)) ad H2Obidest NaNO3 KCl MgSO4×7H2O KH2PO4 H2Obidest ad ZnSO4×7H2O H3BO3 MnCl2×4H2O FeSO4×7H2O CoCl2×5H2O CuSO4×5H2O (NH4)6Mo7O24×4H2O Na4EDTA H2Obidest ad 10 g 50 mL 1 mL 0,25 mL 1000 mL 120,0 g 10,4 g 10,4 g 30,4 g 1000 mL 2,20 g 1,10 g 0,50 g 0,50 g 0,16 g 0,16 g 0,11 g 5,00 g 100 mL Anmerkung pH 6,5 einstellen. Autoklavieren, bei RT lagern. Mit 1M KOH-Lösung auf pH 6,5 einstellen, bei RT lagern, Anteile der Suspension unter Rühren entnehmen. 5.2.2.2 Bacillus subtilis Tab. 25: Medien zur Kultivierung von Bacillus subtilis (s. 5.3). Medium DM-Medium Sporulationsmedium Zusammensetzung K2HPO4 KH2PO4 (NH4)2SO4 NaCl MgSO4×7H2O H2Obidest Glucose (40 % (m/V)) FeCl3×6H2O MnCl2×4H2O NH4Cl Na2SO4 KH2PO4 CaCl2×2H2O NH4NO3 MgCl2×6H2O Glucose Na-L-Glutamat×H2O H2Obidest ad ad 7,0 g 3,0 g 1,0 g 0,1 g 0,1 g 990 mL 10 mL 1,0 mg 17,7 mg 540,0 mg 105,0 mg 87,0 mg 257,9 mg 96,0 mg 8,3 mg 2,0 g 1,9 g 1000 mL Anmerkung pH 7,0 einstellen, Glucoselösung getrennt autoklavieren. pH 7,1 einstellen. 178 Material und Methoden 5.2.2.3 Escherichia coli / Rhodococcus sp. RHA1 Tab. 26: Medien zur Kultivierung von E. coli / Rhodococcus sp. RHA1 (s. 5.3). Medium LB (modifiziert nach [394]) Zusammensetzung Trypton Hefeextrakt NaCl H2Obidest ad 10 g 5g 10 g 1000 mL Anmerkung pH 7,0 einstellen. 5.2.2.4 Streptomyces spp. / Saccharothrix spp. Tab. 27: Medien zur Kultivierung von Streptomyces spp. / Saccharothrix spp. (s. 5.3). Medium CDM [395] E1 [66] HA Zusammensetzung Lösung A: tri-Natriumcitrat×2H2O L-Prolin K2HPO2×3H2O (NH4)2SO4 NaCl H2Obidest ad 6 6 2 1,5 5 800 g g g g g mL Lösung B: MgSO4×7H2O CaCl2×2H2O FeSO4×7H2O ZnSO4×7H2O Lösung A H2Obidest 2,05 0,4 0,2 0,1 800 900 g g g g mL mL Lösung C: Glucose×H2O H2Obidest Glucose Stärke Pharmamedia Hefeextrakt CaCO3 NaCl MgSO4×7H2O K2HPO4×3H2O Leitungswasser Hefeextrakt Malzextrakt Glucose Leitungswasser ad ad ad ad 30 g 100 mL 20 g 20 g 5g 2,5 g 3,0 g 1,0 g 1,0 g 1,0 g 1000 mL 4,0 g 10,0 g 4,0 g 1000 mL Anmerkung Lösung A herstellen, pH 7,2 einstellen. Mit Lösung A Lösung B herstellen. Lösung B und Lösung C nach dem getrennten Autoklavieren mischen. pH 7,2 einstellen. pH 7,2 einstellen. 179 Material und Methoden Medium Hafermedium (modifiziert gemäß [56]) MS NB-Weichagar [66] NL5 [396] NL19 NL111 Zusammensetzung Holo Bio Hafergold Spurenelementlösung H H2Obidest ad 20 g 2,5 mL 1000 mL Spurenelementelösung H: CaCl2×2H2O FeCl3×6H2O Zitronensäure MnSO4 ZnCl2 CuSO4×5H2O Na2B4O7×10H2O MoNa2O4×2H2O CoCl2 H2Obidest ad Sojamehl, vollfett D-Mannitol Leitungswasser ad MgCl2 (1 M) Nutrient Broth Agar H2Obidest ad NaCl K2HPO4 MgSO4×7H2O Spurenelementlösung NL Glycerin L-Glutamin ad H2Obidest Anmerkung Spurenelementelösung autoklaviert bei RT lagern, pH-Wert des Mediums auf 7,2 einstellen. 3000 mg 660 mg 780 mg 200 mg 100 mg 25 mg 20 mg 10 mg 4 mg 1000 mL 20,0 g 20,0 g 990 mL 10 mL 8,0 g 5,0 g 1000 mL 1,0 g 1,0 g 0,5 g 2,0 mL 25,0 g 5,84 g 1000 mL pH 7,2 einstellen. MgCl2-Lösung nach dem Autoklavieren zugeben. Spurenelementlösung NL: FeCl3×6H2O ZnCl2 CuCl2×2H2O MnCl2×4H2O Na2B4O7×10H2O (NH4)6Mo7O24×4H2O H2Obidest ad Sojamehl, vollfett D-Mannitol Leitungswasser ad Lab Lemco Fleischextrakt Malzextrakt CaCO3 Leitungswasser ad 200 mg 40 mg 10 mg 10 mg 10 mg 10 mg 1000 mL 20,0 g 20,0 g 1000 mL 20,0 g 100,0 g 10,0 g 1000 mL Spurenelementelösung autoklaviert bei RT lagern, pH-Wert des Mediums auf 7,2 einstellen. pH 7,2 einstellen. pH 7,2 einstellen. 180 Medium R2YE [66] Material und Methoden Zusammensetzung Lösung A: Glucose L-Prolin Casaminosäuren MgCl2×6H2O CaCl2×2H2O K2SO4 Agar H2Obidest Lösung B: Hefeextrakt Saccharose TES-Puffer H2Obidest R3-Weichagar SG TSB [66] TSB+ Lösung C: KH2PO4 (0,5% (m/V)) Pepton Saccharose Glucose MgCl2×6H2O CaCl2×2H2O KCl Agar H2Obidest TES (250mM, pH 7,2) KH2PO4 (0,5% (m/V)) Sojapepton Glucose×H2O L-Valin CaCO3 CoCl2-Lösung 1mg/mL Leitungswasser Tryptic Soy Broth Leitungswasser Tryptic Soy Broth Glycin Saccharose Leitungswasser ad 10,0 g 3,0 g 0,1 g 10,12 g 2,95 g 0,25 g 22,0 g 500 mL ad 5,0 g 103,0 g 5,73 g 500 mL ad ad ad ad 10 mL 4,0 g 171,0 g 10,0 g 8,1 g 2,2 g 0,5 g 8,0 g 860 mL 100 mL 40 mL 10,0 g 20,0 g 2,34 g 2,0 g 1 mL 1000 mL 30 g 1000 mL 30,0 g 4,0 g 100,0 g 1000 mL Anmerkung Lösung A auf pH 7,4 einstellen. Lösungen A, B und C nach dem Autoklavieren mischen und 2 mL Spurenelementelösung NL (s. NL5) zugeben. TES- und KH2PO4Lösung nach dem Autoklavieren zugeben. pH 7,2 einstellen. pH 7,2 einstellen. pH 7,2 einstellen. 181 Material und Methoden 5.2.3 Selektionsantibiotika Stammlösungen der Antibiotika wurden in den angegebenen Konzentrationen hergestellt und bei −20 °C gelagert. Wässrige Lösungen wurden durch einen Membranfilter mit der Porengröße 0,2 µm steril filtriert. Die Antibiotika wurden den Medien nach Abkühlen auf eine Temperatur unter 50 °C steril zugesetzt. Tab. 28: Selektionsantibiotika. Antibiotikum Kürzel Apramycin Carbenicillin Chloramphenicol Hygromycin Kanamycin Phosphomycin Spectinomycin Tetrazyklin Thiostrepton Apra Carb Cam Hyg Kana Phos Spec Tet Tsr Endkonzentration im Medium [µg/mL] 50 oder 100 50 30 100 50 250 100 10 50 Stammlösung [mg/mL] 50 in H2Obidest 50 in H2Obidest 30 in Ethanol 50 in H2Obidest 50 in H2Obidest 50 in H2Obidest 50 in H2Obidest 5 in Ethanol 70% 50 in DMSO 5.2.4 Chemikalien und Medienbestandteile Chemikalien und organische Lösungsmittel wurden von den Firmen Carl Roth (Karlsruhe), Fluka (Taufkirchen), Sigma-Aldrich (Steinheim), USB (Cleveland, USA), Merck (Darmstadt), für die molekularbiologische Verwendung teilweise auch von Promega (Madison, USA) bezogen und ohne weitere Reinigung eingesetzt. [1,2-13C2]-Acetat (beide Atome 99 % 13C-Anreicherung) wurde von Isotec (Miamisburg, USA) bezogen. Die Bezugsquellen der zur Biotransformation an Saccharothrix espanaensis gefütterten Substanzen sind in Tab. 29 aufgelistet, jene komplexer Bestandteile von Nährmedien in Tab. 30. Tab. 29: Chemikalien zur Fütterung an Saccharothrix espanaensis (s. 3.1). Name (Nummer) Anthrachinon (1) 1,2-Dihydroxyanthrachinon (2) 1,4-Dihydroxyanthrachinon (3) 1,5-Dihydroxyanthrachinon (4) 1,8-Dihydroxyanthrachinon (5) 2,6- / 2,7-Dihydroxyanthrachinon (6) 1,8-Dihydroxy-3-methylanthrachinon (7) 1,8-Dihydroxy-3-(hydroxymethyl)-anthrachinon (8) 1,3,8-Trihydroxy-6-methylanthrachinon (9) 1,8-dihydroxy-3-methoxy-6-methylanthrachinon (10) 1,4,5,8-Tetrahydroxyanthrachinon (11) Hersteller / Bezugsquelle Sigma-Aldrich Fluka Sigma-Aldrich Sigma-Aldrich Sigma-Aldrich Prof. Dr. V. Novikov (Lviv, Ukraine) Roth Roth Roth Roth Prof. Dr. V. Novikov 182 Material und Methoden Name (Nummer) 1,2,5,8-Tetrahydroxyanthrachinon (12) 1-Aminoanthrachinon (13) 1-Amino-4-chloranthrachinon (14) 1-Amino-2-chloranthrachinon (15) 1-Amino-4-hydroxyanthrachinon (16) 1-Amino-2-phenoxy-4-hydroxyanthrachinon (17) 1,5-Diaminoanthrachinon (18) 1-Amino-4-[(2-hydroxyethyl)amino]-anthrachinon (19) 1-Amino-4-[(4-methylphenyl)amino]-anthrachinon (20) 1-Amino-2-carboxyanthrachinon (21) 1-Amino-4-brom-2-carboxyanthrachinon (22) 1-Amino-2-carboxy-4-(methylamino) / 1,4-Diamino-2carboxyanthrachinon (23) 1,8-Dihydroxy-4,5-dinitroanthrachinon (24) Mitoxantron (25) Norsolorinsäure (26) 3,3',4',5,7-Pentahydroxyflavone (27) (+)-(2R:3S)-5,7,3',4'-Tetrahydroxyflavan-3-ol (28) 9,10-Dihydro-9-oxoacridin (29) 9H-Fluoren-9-on (30) 1,8-Dihydroxyanthrone (31) Morphin (32) Phenytoin (33) Novobiocinsäure (34) Phenprocoumon (35) Chromon (36) Lawson (37) Juglon (38) Menadion (39) Resveratrol (40) Hersteller / Bezugsquelle Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Prof. Dr. V. Novikov Sigma-Aldrich Sigma-Aldrich Aspergillus nidulans TTRM1 Sigma-Aldrich Roth Sigma-Aldrich Fluka Sigma-Aldrich Institut für Pharmazeutische Wissenschaften (Freiburg) Inst. Pharm. Wiss. (Freiburg) s. 5.12 Inst. Pharm. Wiss. (Freiburg) Sigma-Aldrich Sigma-Aldrich Sigma-Aldrich Inst. Pharm. Wiss. (Freiburg) Axxora (Lörrach) Tab. 30: Komplexe Medienbestandteile. Name Agar Casaminosäuren Hefeextrakt Holo Bio Hafergold Lab Lemco-Fleischextrakt Malzextrakt Nutrient Broth Pepton Pharmamedia Sojamehl Tryptic Soy Broth Hersteller / Bezugsquelle Becton Dickinson (Heidelberg) Becton Dickinson (Heidelberg) Difco (Detroit, USA) Neuform International (Zarrentin) Roth (Karlsruhe) Difco (Detroit, USA) Becton Dickinson (Heidelberg) Becton Dickinson (Heidelberg) Southern Cotton Oil Company (Memphis, USA) Schoenenberger Pflanzensaftwerk (Magstadt) Becton Dickinson (Heidelberg) 183 Material und Methoden 5.2.5 Enzyme und molekularbiologische Kits Tab. 31: Enzyme und zugehörige Substratlösungen / Puffer. Name DNA Polymerase I Large (Klenow) Fragment dNTP-Mix (alle vier Nukleotide je 10 mM) GoTaq- / Taq-Polymerase Lysozym aus Hühnereiweis Pfu-Polymerase Restriktionsendonukleasen, Puffer, BSA RNAse A T4-DNA-Ligase Hersteller / Bezugsquelle Promega Promega Promega / Eigenherstellung Fluka Promega / Eigenherstellung Promega , NEB (Ipswich, USA) Qiagen (Hilden) Promega Tab. 32: Molekularbiologische Kits. Name Pure Yield Plasmid Midiprep System Wizard SV Minipreps DNA Purification System Wizard SV Gel and PCR Clean-up System 5.3 Hersteller / Bezugsquelle Promega Promega Promega Bakterienstämme und deren Kultivierung Die eingesetzten Medien sind unter 5.2.2 aufgeführt. 5.3.1.1 Escherichia coli Tab. 33: E. coli Laborstämme. Stamm E. coli XL1blue E. coli DH5α E. coli ET12567 Eigenschaften recA1, endA1, gyrA96, thi-1, hsdR17, supE44, relA1, lac[F´proAB, lacIqZDM15, Tn10 (tet)] F−, φ80dlacZ∆M15 (lacZYA-argF) U169, deoR, recA1, endA1, hsdR17(r k−, m k+), phoA, supE44, thi-1, gyrA96, relA1 λ− F−, dam-13::Tn9, dcm-6 hsdM, hsdR, zjj202::Tn10, recF143, galK2, galT22, ara-14, lacY1, xyl15, leuB6, thi1, tonA31, rpsL136, his64, tsx78, mtlI, glnV44 Referenz [397] [156] [398] Die Anzucht von E. coli erfolgte stets in LB-Medium. Flüssigkulturen mit einem Volumen bis 4 mL wurden im Reagenzglas mit Aluminiumkappe, Volumina bis 100 mL in 300 mLErlenmeyerkolben mit einer Schikane angesetzt und über Nacht bei 37 °C (mit pBADαβγ bei 30 °C, s. 5.5.5, λ-Red vermittelte Rekombination in E. coli) auf einem Rundschüttler mit 180 rpm inkubiert. Kulturen auf LB-Agarplatten wurden über Nacht bei 37 °C bzw. 30 °C im 184 Material und Methoden Brutschrank inkubiert. Die Verwendung von E. coli ET12567, der Zusatz mehrerer Antibiotika oder die Kultivierung bei 30 °C erfordern längere Inkubationszeiten. Auf bei 4 °C gelagerten LB-Agarplatten ist der Stammerhalt für einige Monate möglich, als Zellsuspension in 30 % Glycerin können die Stämme bei −86 °C mehrere Jahre überdauern. 5.3.1.2 Aspergillus nidulans TTRM1 Der Ascomycet Aspergillus nidulans TTRM1 ist eine Biotin auxotrophe Mutante mit Blockade der Aflatoxin- / Sterigmatocystinbiosynthese auf Stufe der Norsolorinsäure [399]. Zur Produktion von Norsolorinsäure wurden je 100 mL GMM+Biotin-Flüssigmedium in 300 mL-Erlenmeyerkolben mit Schikane und Spirale mit der Hälfte der von einer vollständig mit sporenbildenden Kolonien bewachsenen Agarplatte (GMM+Biotin, ∅ = 9 cm) gewonnen Sporensuspension inokuliert. Nach zweitägiger Inkubation bei 37 °C auf einem Rundschüttler mit 180 rpm entstanden weiße, flauschige Bällchen mit ca. 3 mm Durchmesser. Nach sieben Tagen war das Myzel abgestorben und Norsolorinsäure wurde bei pH 7,5 durch dreimaliges Ausschütteln der Kulturbrühe mit Ethylacetat extrahiert. GMM+Biotin-Agarplatten, die mit einer Sporensuspension inokuliert werden, sind bereits nach 24 h von sporenbedecktem Myzel überwachsen und können zum Animpfen von Flüssigkulturen oder zur Gewinnung einer Sporensuspension in 0,1 % Tweenlösung verwendet werden. Der Stammerhalt für einige Monate ist auf bei 4 °C gelagerten GMM+Biotin-Agarplatten, für mehrere Jahre als Sporensuspension bei −86 °C möglich. 5.3.1.3 Bacillus subtilis Bacillus subtilis (Ehrenberg) Cohn ATCC6051 [400] wurde für die Testung von Novobiocinderivaten auf antibiotische Aktivität verwendet. Die Testplatten wurden mit DM-Festmedium gegossen, das zuvor mit 24 mL B. subtilis-Sporensuspension/Liter Medium inokuliert wurde. Zur Gewinnung der Sporensuspension wurden 100 mL Sporulationsmedium (s. Tab. 25) mit 300 µl einer vorherigen Charge B. subtilis-Sporensuspension beimpft und für drei Tage bei 30 °C auf dem Rundschüttler (120 rpm) inkubiert. Wachstum und Sporenbildung wurden mikroskopisch verfolgt. Nach Auftreten der ersten Sporen wurde 1 mL der Kultur zum Animpfen von 100 mL frischem Sporulationsmedium eingesetzt. Dort waren nach drei- bis fünftägiger Inkubation bei der mikroskopischen Kontrolle neben einer geringen Menge vegetativer Zellen nur noch Sporen zu erkennen. Die Kulturen wurden dann durch Zentrifugation (4 °C, 5000 rpm, 10 min) sedimentiert. Nach dreimaligem Waschen der erhaltenen Pellets mit sterilem Leitungswasser wurden die Sporen in sterilem Leitungswasser aufgenommen und verdünnt bis zu einer OD546 von 1,5. Die fertige Sporensuspension wurde in 12 mL-Portionen aliquotiert, im Wasserbad bei 70 °C für 45 min erhitzt und anschließend bei −20 °C gelagert. 185 Material und Methoden 5.3.1.4 Actinomycetales: Streptomyces / Saccharothrix / Rhodococcus spp. Tab. 34: Stämme aus der Ordnung Actinomycetales. Stamm Rhodococcus sp. RHA1 Saccharothrix australiensis Saccharothrix espanaensis Saccharothrix tangerinus sp. nov. (= Umezawaea tangerina gen. nov., comb. nov.) Streptomyces albus Streptomyces coelicolor A3(2) Streptomyces diastatochromogenes Tü6028 Streptomyces griseoviridis Tü3634 Streptomyces sp. Gö C4/4 Streptomyces spheroides AM1T2 S. coelicolor M512 mit Cosmid nov-CA7 Eigenschaften, Besonderheiten der Anzucht Biodegradation von polychlorierten Biphenylen (PCBs), Genom sequenziert, Kultivierung in LB-Medium. Produzent verschiedener Aminoglykosidantibiotika, Metabolisierung lipophiler Moleküle ähnlich S. espanaensis. Saccharomicinproduzent, Metabolisierung lipophiler Moleküle durch Hydroxylierung und Rhamnosylierung, Kultivierung in TSB-Medium. Formamicinproduzent. Aktuelle phylogenetische Untersuchungen ordnen den Stamm nicht mehr dem Genus Saccharothrix sondern Umezawaea zu. Wirt für die heterologe Genexpression. Streptomyces-Modellorganismus, Genom sequenziert. Polyketomycinproduzent. Produzent von Acyl-α-L-Rhamnosiden, Metabolisierung lipophiler Moleküle ähnlich wie S. espanaensis. Mensacarcinproduzent, Flüssigkultur stets von einer Agarplatte animpfen. Novobiocinsäureproduzent, Mutante von Streptomyces spheroides NCIMB11891. Heterologer Wirt mit dem Novobiocinbiosynthesegencluster mit Defekt in Ring A- und Zuckersynthesegenen. Referenz [132] [131] [353] [401;402] [403] [70] [50] [299] [56] [126] [404] 186 Material und Methoden Standardkulturen von Actinomycetales-Stämmen Wenn nicht anders in Tab. 34 angegeben, wurden die Stämme in / auf HA-Medium kultiviert. Als Standardkultur der aufgelisteten Actinomycetales-Arten wurden 100 mL Flüssigmedium in einem 300 mL-Erlenmeyerkolben mit zwei Schikanen und einer Spirale mit 1 cm2 einer vollständig bewachsenen Agarplatte oder 5 mL einer Saccharosedauerkultur angeimpft. Nach einer Inkubationsdauer von sechs bis sieben Tagen bei 28 °C und 180 rpm auf einem Rundschüttler wurde die Kulturbrühe zur Sekundärstoffanalytik mit Ethylacetat extrahiert (s. 5.11.1). Vorkulturen wurden nur für Biotransformationsexperimente verwendet (s. u.). Für genetische Manipulationen und zum Stammerhalt wurden die Stämme auch auf Agarplatten kultiviert (28 °C, drei bis sieben Tage). Sporenbedeckte Agarkulturen, die mit Parafilm vor Verdunstung geschützt bei Raumtemperatur gelagert werden, sind mehrere Monate lang zum Animpfen frischer Kulturen geeignet. Für den Stammerhalt über Jahre wurden Dauerkulturen in 25 % wässriger Saccharoselösung angelegt und bei −20 °C gelagert. Zur Herstellung der Saccharosedauerkulturen wird eine nur drei Tage inkubierte Standardkultur durch Zentrifugation (RT, 5000 rpm, 10 min) pelletiert, das Pellet einmal im Kultur äquivalenten Volumen 25 % Saccharose gewaschen und schließlich im halben Volumen 25 % Saccharose aufgenommen. Biotransformation in Actinomycetales-Arten Die Biotransformationsexperimente wurden ausgehend von Vorkulturen im stammspezifischen Medium (s. Tab. 34) bzw. in HA-Medium durchgeführt. Dazu wurden 100 mL Flüssigmedium mit 5 mL einer Saccharosedauerkultur oder mit 1 cm2 einer vollständig bewachsenen Agarplatte angeimpft. Mit je 5 mL der zwei bis drei Tage gewachsenen Vorkultur wurden je Substanz 100 mL NL111-Flüssigmedium als Hauptkultur inokuliert. Je 5 mg der Testsubstanzen wurden in 200 µL DMSO gelöst bzw. suspendiert und innerhalb der ersten drei Tagen der Kultivierung zur Hauptkultur zugefüttert. Als Kontrolle diente eine parallel angesetzte, aber nicht gefütterte Kultur. Nach sieben Tagen Inkubation bei 28 °C (180 rpm) wurde die Kulturbrühe mit Ethylacetat extrahiert (s. 5.11.1). 187 Material und Methoden 5.4 Vektoren und Plasmide 5.4.1 Allgemeine Plasmidkonstrukte und Vektoren Tab. 35: Alphabetische Liste der allgemeinen Plasmidkonstrukte und Vektoren. Vektor pBluescript II SK(−) (= pBSK−) pBluescript II SK(+) (= pBSK+) pGEM-T Easy pHPΩ45aac pIJ774 Größe 3,0 kb 3,0 kb 4,1 kb 4,4 kb pIJ778 4,4 kb pIJ785 4,6 kb pKC1132 3,5 kb pKC1218 5,8 kb pMun2 pOJ436 2,7 kb 9,5 kb 3,0 kb pBADαβγ pSET-1cerm 7,0 kb pSET152 3,5 kb pUC19 2,7 kb pUWL201 6,6 kb pUWLoriT pUZ8002 7,4 kb Beschreibung Klonier- und Sequenziervektor für E. coli; bla (= carb), lacZ'α, f1(−)-origin, ColE1-origin wie pBSK−, jedoch mit f1(+)-origin, hier als Träger der Redirect-Kassetten eingesetzt Vektor für die TA-Klonierung (s. 5.5.5) bla (= carb), aac3C4 (= apra), pMB1-Replikon Redirect-Kassette mit aac(3)IV (= apra) und loxP-sites in pBSK+ Redirect-Kassette mit aadA (= spec) und FRT-sites in pBSK+ Redirect-Kassette mit aac(3)IV (= apra), tipAPromotor und FRT-sites in pBSK+ in Streptomyces nicht replikativer Vektor für die Geninaktivierung; aac(3)IV (= apra), lacZ'α , pMB1-Replikon, oriT RK2 in Streptomyces replikativer Vektor für die Genexpression; aac(3)IV (= apra), pMB1Replikon, SCP2*-Replikon, oriT, lacZ'α pBluescript II SK(−) mit modifizierter MCS integrativer Cosmidvektor; aac(3)IV (= apra), ColE1-origin, Integrationssystem des Phagen φC31, oriT RK2 codiert die Proteine für die λ-Red Rekombination; tet, red-exo, red-bet, red-gam des λ-Phagen, thermosensitives Replikon von pSC101 Genintegrationsvektor für Streptomyces auf Basis von pSET152; ermE-up-Promotor, mit urdGT1c Genintegrationsvektor für Streptomyces aac(3)IV (= apra), lacZ'α, pMB1-Replikon, Integrationssystem des Phagen φC31, oriT RK2 Klonier- und Sequenziervektor für E. coli mit bla (= carb), lacZ'α, pMB1-Replikon Expressionsvektor für Streptomyces bla (= carb), tsr, ermE-up-Promotor, pMB1Replikon, pIJ101 origin of replication pUWL201-Derivat mit oriT RK2 für Konjugation Fertilitätsplasmid für Konjugation mit oriT kana, RK2-Derivat (IncP-1α Gruppe), tra1 und tra2 Region Referenz [405;406] [406] [407] [408] [151] [151] [151] [409] [409] [410] [409] [411] [412] [409] [413;414] [415] [416] [66] 188 Material und Methoden 5.4.2 Spezielle Plasmidkonstrukte und Cosmide Nach Projekten gegliedert, in Reihenfolge des Ergebnisteils, finden sich im Folgenden Informationen zu Plasmiden, die speziell für diese Arbeit erstellt wurden. 5.4.2.1 Neue Redirect-Kassetten Plasmid pIJ785Spec (4620 bp), Träger einer Redirect-Kassette mit spec und tipA-Promotor (s. 5.5.5, λ-Red vermittelte Rekombination zur Geninaktivierung) Hin d III 4612 Xho I 4591 Xba I 36 Kpn I 4576 Sac I 71 Pvu I 4420 FRT 19 bp priming site Pvu I 512 spec 4000 1000 carb Pvu I 3375 pIJ785Spec 3000 2000 oriT FRT 20 bp priming site tipA-promotor Xba I 1367 Pst I 1389 Bam HI 1401 Sac II 1650 Eco RI 1663 Pst I 1669 Bam HI 1681 Xba I 1693 Not I 1699 Sac II 1709 Sac I 1717 Plasmidkonstruktion: Es sollte eine Redirect-Kassette (s. 5.5.5.5) gewonnen werden, die eine Spectinomycinresistenzkassette sowie den tipA-Promotor trägt. Über λ-Red vermittelte Rekombination (s. 5.5.5.5) wurde die ursprünglich im Plasmid pIJ785 (s. Tab. 35) enthaltene Apramycinresistenzkassette gegen die Spectinomycinresistenzkassette von pIJ778 ausgetauscht. Lineare Matrize der λ-Red Rekombination war das 1159 bp große PCR-Produkt der Primer aadA-F / -R (s. 5.6.3.1) von pIJ778 (s. Tab. 35) als Matrize. Das PCR-Produkt hatte beidseitig 189 Material und Methoden homologe Überhänge von 40 bp, an denen die Rekombination erwartet wurde. Die Ansequenzierung ergab, dass deutlich längere Bereiche identischer Sequenz von 187 bp (stromaufwärts bezüglich spec) und 100 bp (stromabwärts bezüglich spec) miteinander rekombinierten. Auch diese Rekombination führte zum gewünschten Markeraustausch. Das entstandene Plasmid wurde mit dem Namen pIJ785Spec bezeichnet. Plasmid pIJ774Spec (4374 bp), Träger einer Redirect-Kassette mit loxP-sites und spec (s. 5.5.5, λ-Red vermittelte Rekombination zur Geninaktivierung) Pvu I 500 Pvu I 3823 Kpn I 653 HindIII 689 Bam HI 709 carb 20 bp priming site loxP oriT 4000 pIJ774Spec 1000 3000 2000 spec Pvu I 1591 19 bp priming site loxP Sac I 2032 Eco RI 2111 Pst I 2117 Bam HI 2129 Xba I 2141 Not I 2147 Sac I 2165 Plasmidkonstruktion: Analog zur Konstruktion von pIJ785Spec (s. o.) wurde die Apramycinresistenzkassette des Plasmids pIJ774 (s. Tab. 35) per λ-Red Rekombination durch die Spectinomycinresistenzkassette des Plasmids pIJ778 ersetzt. Auch hier kam es zur Rekombination der flankierenden DNA-Bereiche beider Resistenzkassetten. Das so gewonnene Plasmid pIJ774Spec ermöglicht nach der Geninaktivierung per [safe-knock]-Strategie eine Exzision der Redirect-Kassette mit der sequenzspezifischen Cre-Rekombination (s. 5.9). 190 Material und Methoden 5.4.2.2 Inaktivierungs- und Expressionsplasmide für S. diastatochromogenes Tü6028 Plasmid pKC-P3,7 (6515 bp), pok-KSα-Inaktivierungskonstrukt (s. 3.2.1) Hind III 400 Pst I 412 Xba I 424 Bam HI 430 Kpn I 439 Sac I 445 'lacZ´ Sac I 5615 pok-M2' Xho I 5415 6000 pok-MT1 1000 apra Sac I 4915 5000 pKC-P3,7 Bam HI 1656 2000 Bam HI 1880 4000 3000 pok-KSα* lacZ´' Kpn I 2105 pok-KSβ' Bam HI 2576 Eco RI 3763 Sac I 3757 Bam HI 3548 Bam HI 3536 Plasmidkonstruktion: Durch Entfernung eines 390 bp großen EcoRV / NotI-Fragments sollte eine In-frame-Deletion innerhalb des pok-KSα-Leserahmens erreicht werden. Ausgehend vom Cosmid 30-6D20 [38] wurde zunächst ein SacI-Subklon erstellt (s. 5.5.5.2), der pok-KSα in der Mitte seines 3702 bp-Inserts trägt. Der mit EcoRV / NotI verdaute Subklon wurde zum Auffüllen der von NotI zurückgelassenen 5'-Überhänge mit Klenow-Fragment (s. 5.5.5.4) behandelt und religiert. Das künstlich erstellte, nicht funktionelle pok-KSα-Allel konnte über EcoRI / HindIII in den Inaktivierungsvektor pKC1132 umkloniert werden, um so das Inaktivierungskonstrukt pKC-P3,7 zu erhalten. 191 Material und Methoden Plasmid pKC-P7,3 (10473 bp), pok-KSα-Inaktivierungskonstrukt (s. 3.2.1) Hind III 400 Pst I 406 Sac I 604 Sac I 9573 Xho I 9373 oriT Sac I 8873 'lacZ´ pok-M2' pok-MT1 apra 10000 lacZ´' Eco RI 7721 Eco RV 7715 Bam HI 7697 Xba I 7691 Pst I 7679 Not I 7563 8000 pKC-P7,3 Bam HI 1815 Bam HI 2039 Eco RV 2051 Not I 2442 2000 pok-KSα* pok-AC2' 6000 pok-AC3 oriT Bam HI 3056 pok-KSβ pok-AC1 pok-ACP Sac I 6632 Bam HI 4016 Bam HI 4028 Sac I 4237 Sac I 4553 Die im ursprünglichen Subklon vorhandene KpnI-Schnittstelle lag dort bei Position 2654. Plasmidkonstruktion: Ziel war es, durch eine Leserahmenverschiebung ein nicht funktionelles Allel des Gens zu konstruieren. Zunächst wurde dazu ein pok-KSα tragendes 7342 bp PstI-Clusterfragment (von Cosmid 30-6D20) in den Vektor pKC1132 subkloniert (s. 5.5.5.2). An der singulär vorhandenen KpnI-Erkennungsstelle wurde das Plasmid geöffnet, die entstandenen klebrigen Enden mit Klenow-Fragment "geglättet" (s. 5.5.5.4) und religiert. Die durch KpnI entstandenen 3'-Überhänge können durch das Klenow-Fragment nicht aufgefüllt werden, stattdessen werden die 3'-Überhänge durch die 3'→5'-Exonukleaseaktivität des Enzyms abgetragen. Durch Ansequenzieren mit spezifischen Primern (s. 5.6.2) wurde gezeigt, das es zur weitergehenden Abtragung von Basen und damit nach Ligation zu einer 69 bp In-frameDeletion im Bereich der vormals vorhandenen KpnI-Erkennungsstelle gekommen war. Das Gen pok-KSα sollte folglich trotz der nicht erreichten Leserahmenverschiebung seine Funktion verloren haben. 192 Material und Methoden Plasmid pB-P3,7red (8552 bp), pok-KSα-Inaktivierungsplasmid (s. 3.2.2) Sac I 8548 Eco RI 8542 'lacZ´ pok-M2' Bam HI 1207 pok-MT1 Bam HI 1431 Xba I 1537 Sac I 1572 carb 8000 pB-P3,7red 2000 pIJ785Spec Kassette* 6000 Bst EII 2230 lacZ´'' 4000 Hind III 5907 pok-KSβ Pml I 5498 Sac I 5435 apra 'lacZ´' Bst EII 4712 Sac I 4683 Xba I 2868 Pst I 2890 Bam HI 2902 Pml I 3076 Bst EII 3474 Bst EII 3508 Bam HI 3920 Bam HI 3932 Sac I 4141 Bam HI 4156 *Richtung des Pfeils Xba I 4162 = Orientierung des tipA-Promotors Pst I 4174 Hind III Plasmidkonstruktion: Das Inaktivierungsplasmid pB-P3,7red ist über die [safe-knock]-Strategie (s. 5.8.2) entstanden. Als Ausgangspunkt konnte ein 3,7 kb SacI-Subklon in pUC19 verwendet werden, der als Zwischenprodukt der Konstruktion von pKC-P3,7 bereits vorlag. Die eingesetzten Redirect-Primer (p3,7red-F / -R, s. 5.6.3) wurden so abgeleitet, dass die anschließende λ-Red vermittelte Rekombination zum fast vollständigen Ersatz von pok-KSα durch die RedirectKassette von pIJ785Spec (s. 5.5.5.5) führte. Der tipA-Promotor der Kassette liegt in gleicher Richtung wie die nachgeschalteten Gene des pok-KSα enthaltenden Operons. Über die Ansequenzierung mit Standardprimern und spezifischen Primern (s. 5.6.2) konnte die Sequenz bestätigt werden. Die Orientierung der im letzten Klonierungsschritt eingebrachten apra-Kassette ist unbekannt. 193 Material und Methoden Plasmid pSET-P3,7kompl (7001 bp), pok-KSα-Komplementierungsplasmid (s. 3.2.2) Hind III 230 Hind III 6512 integrase PhiC31 lacZ´ 7000 pok-KSβ' Pst I 5551 5000 Bam HI 1450 1000 6000 oriT Hind III 1190 Pst I 1196 Xba I 1208 Bam HI 1214 pSETP3,7kompl pok-KSα 2000 Kpn I 1921 4000 3000 Pst I 4727 pok-MT1' apra Sac I 4481 oriR Xho I 4211 Not I 2131 Eco RV 2524 Bam HI 2536 Eco RI 2739 Sac I 3791 Plasmidkonstruktion: Das per Pfu-PCR mit den Primern P7,3-F / -R (s. 5.6.3) und Cosmid 30-6D20 als Matrize gewonnene 1501 bp Produkt wurde mit seinen glatten Enden direkt in den mit EcoRV geöffneten, integrativen Vektor pSET152 (s. Tab. 35) ligiert. Das insertierte Clusterfragment deckt außer dem Gen pok-KSα auch den gesamten Bereich zwischen diesem Gen und pok-MT1 ab. In diesem Bereich ist der native Promotor von pok-KSα lokalisiert. Die Lage des Inserts und dessen korrekte Sequenz wurden über eine Ansequenzierung mit zwei Standardprimern bestimmt (s. 5.6.2). 194 Material und Methoden 5.4.2.3 Expressionsplasmid für das synthetische Gen flp(a) Plasmid pUWLhyg-FLP (9039 bp), flp(a)-Expressionsplasmid (s. 5.9) Hind III 9039 Kpn I 8731 ermE-uppromotor Not I 7203 replicon flp(a) Sac I 969 Kpn I 1201 Bam HI 1278 Xba I 1290 Not I 1296 8000 Mun I 6879 2000 ori pIJ101 oriT pUWLhyg-FLP 6000 carb 4000 hyg ori ColE1 Eco RI 5679 Sac I 5643 'fd ter Xba I 4730 Plasmidkonstruktion: Das synthetische Rekombinasegen flp(a) (NCBI accession number EU170351) wurde als HindIII / BamHI-Fragment von pUWL-FLP [155] in den durch HindIII / BamHI-Restriktion vom Insert getrennten Vektor von pUWLhyg-Tn5 ligiert. Letzteres Plasmid basiert auf pUWLoriT (s. Tab. 35) und wurde von Lutz Petzke (AK Bechthold) zur Expression eines synthetischen Transposasegens erstellt. Material und Methoden 195 5.4.2.4 Subklone und Cosmide der DNA von S. sp. Gö C4/4 Das allgemeingültige Verfahren zur Subklonkonstruktion ist unter (s. 5.5.5) beschrieben. Sofern die Orientierung des Inserts im Vektor bekannt ist, wird diese durch das Ergebnis einer Ansequenzierung des Subklons mit Standardprimern (s. 5.6.2) angegeben. Falls die ansequenzierten Insertenden außerhalb der Contigs liegen, werden die Sequenzen durch eine BLAST-Recherche charakterisiert (s. Tab. 57). Subklonnamen folgen im Allgemeinen dem Schema: CxEy-z - Cx: Subklon von Cosmid x; alternativ Gx: Subklon von Cosmidgruppe x - E: Kürzel für verwendetes Enzym (zum Beispiel B: BamHI, Pst: PstI) - y oder y,y oder y-y: Aus dem Gel ausgeschnittene Fragmentgröße (y-y: Größenbereich) - z Subklonnummer Subklone vom Bereich des msc-Contigs (Cosmid 4) Tab. 36: Subklone vom Bereich des msc-Contigs (Cosmid 4). Name pBSK4.48 [160] pBSK4.19 [160] pBSK4.27 [160] pBSK4.1 [160] C4Sac3,4 C4Sac3,8 C4Sac4,1 C4Sac5,1 C4Sac6,1 C4Sac8,5 C4Pst6-1 C4Pst6-3 =pMO1 Vektor pBSK− Enzym BamHI Insertgröße 8842 bp Position auf dem msc-Contig uni: 2626; rev: 11467 pBSK− BamHI 6106 bp uni: 17628; rev: 11523 pBSK− BamHI 6565 bp uni: 17629; rev: 24193 pBSK− BamHI 1723 bp 38244 - 39966 pUC19 pUC19 pUC19 pUC19 pUC19 pUC19 pUC19 pUC19 SacI SacI SacI SacI SacI SacI PstI PstI 3434 bp 3816 bp 4153 bp 5195 bp 6062 bp 8517 bp 5676 bp 5759 bp uni: 38071; rev: 41504 24907 - 28723 uni: 28723; rev: 32875 uni: 38070; rev: 32876 uni: 42530; rev: pOJ436 uni: 14733; rev: 6217 6236 - 11911 uni: 35862; rev: 41620 Weitere BamHI-Subklone vom Bereich des msc-Contigs sind in der Diplomarbeit von A. Prestel beschrieben [160]. 196 Material und Methoden Subklone vom Bereich des mec-Contigs (Cosmide 12, 19) Tab. 37: Subklone vom Bereich des mec-Contigs (Cosmide 12, 19). Für die NcoI-Subklone wurde der Vektor pMun2, ansonsten stets pBSK− verwendet (s. Tab. 35). Name Enzym C12Pst-6 G2B1,2 PstI BamHI Insertgröße 2952 bp 1,2 kb G2B2,0 BamHI 2,0 kb G2B3,0 BamHI 3,0 kb G2B4,2 BamHI 4,2 kb G2B6-8-2 BamHI 8 kb C12Eco4,5 EcoRI 4,5 kb C12Eco6,0 EcoRI 6,0 kb C12Not4 NotI 4 kb C12Not7 C12Nco6 NotI NcoI 7100 bp 6 kb Position auf dem mec-Contig oder BLAST-Ergebnis uni: 6154; rev: 3203 uni: hypothetical protein MchlDRAFT_1719 (Methylobacterium chloromethanicum CM4) rev: hypothetical protein DSY0622 (Desulfitobacterium hafniense Y51) uni: beta-lactamase (Streptomyces avermitilis MA-4680) rev: membrane protein (Streptomyces avermitilis MA-4680) uni: protein phosphatase (Streptomyces avermitilis MA-4680) rev: protein phosphatase (Streptomyces avermitilis MA-4680) uni: hypothetical protein RHA1_ro01873 (Rhodococcus sp. RHA1) rev: ab Position 1491 stromaufwärts uni: transcriptional regulator, TetR family (Rhodococcus sp. RHA1) rev: cellulase (Stigmatella aurantiaca DW4/3-1) uni: auf pOJ436 rev: keine signifikante Ähnlichkeit, nicht auf pOJ436 uni: auf dem Cosmidinsert direkt vor tet auf pOJ436 rev: apra auf pOJ436 uni: beta-lactamase (Streptomyces avermitilis MA-4680) rev: ab Position 9153 aufsteigend uni: 2053; rev: 9152 uni: keine signifikante Ähnlichkeit rev: carboxypeptidase (Streptomyces coelicolor A3(2)) Cosmide des msn-Contigs Tab. 38: Cosmide des msn-Contigs. Alle Cosmide basieren auf dem Vektor pOJ436 (s. Tab. 35). Name Enzym* Cos2 Sau3AI Cos7 Sau3AI Insertgröße 36,7 kb ca. 40 kb Position auf dem msn-Contig oder BLAST-Ergebnis F: ab Position 1 aufsteigend (vor msnH0) R: ab Position 36742 absteigend (msnM3) F: regulator protein (Streptomyces rimosus subsp. paromomycinus), NCBI: CAF32368 R: ab Position 13882 aufsteigend (msnH5) Material und Methoden Name Enzym* Insertgröße ca. 40 kb Cos17 Sau3AI Cos18 Sau3AI ca. 40 kb Cos20 Sau3AI ca. 40 kb 197 Position auf dem msn-Contig oder BLAST-Ergebnis F: ab Position 12379 aufsteigend (msnO3) R: hypothetical protein YP_001103536 (Saccharopolyspora erythraea NRRL 2338) F: hypothetical protein XP_567129 (Cryptococcus neoformans var. neoformans JEC21) R: ab Position 13517 aufsteigend (msnH5) F: ab Position 16276 absteigend (mscK1) R: large secreted protein NP_821460 (Streptomyces avermitilis MA-4680) * Partialverdau Subklone vom Bereich des msn-Contigs (Cosmide 7, 18) Tab. 39: Subklone vom Bereich des msn-Contigs (Cosmide 7, 18). Für die NcoI-Subklone wurde der Vektor pMun2, ansonsten stets pBSK− verwendet (s. Tab. 35). Name Enzym G3B1,5a BamHI Insertgröße 1,5 kb G3B2,0 G3B2,2 G3S2,0 G3S2,7 G3S3,5 BamHI BamHI BamHI SacI SacI 1868 bp 2169 bp 1831 bp 2643 bp 3,5 kb G3S8a =G3S8b SacI 7 kb C7Eco2,7 C7Eco3,0 C7Eco3,8 C7Eco4,2 C7Eco6a C7Eco7-8-2 C7Eco7-8-3 EcoRI EcoRI EcoRI EcoRI EcoRI EcoRI EcoRI 2800 bp 3139 bp 4498 bp 7637 bp 6324 bp 7298 bp 7 - 8kb C7Eco7-8-4 EcoRI 7 - 8kb C7Bgl3,5 C7Bgl5a BglII BglII 2788 bp 4308 bp Position auf dem msn-Contig oder BLAST-Ergebnis uni: hypothetical protein (Streptomyces rimosus subsp. paromomycinus) rev: endonuclease / exonuclease / phosphatase (Frankia sp. EAN1pec) uni: 43347; rev: 41480 uni: 27028; rev: 29196 uni: 40314; rev: 42144 uni: 40313; rev: 37671 uni: ab Position 42145 aufsteigend rev: TRA4, transfer function (Streptomyces bambergiensis) uni: response regulator receiver (Nocardioides sp. JS614) rev: pOJ436 uni: 32141; rev: 34940 uni: 27642; rev: 24504 uni: 32140; rev: 27643 uni: 24504; rev: 32140 (Insert mit EcoRI-site) uni: 34941; rev: 41264 uni: 34940; rev: 27643 (Insert mit EcoRI-site) uni: putative regulator protein (Streptomyces rimosus subsp. paromomycinus) rev: ab Position 41265 aufsteigend uni: response regulator receiver (Nocardioides sp. JS614) rev: auf pOJ436 uni: 23471; rev: 20684 uni: 28666; rev: 24359 198 Material und Methoden Name Enzym C7Bgl6 BglII Insertgröße > 10 kb C7Bgl6a C7Bgl7 C7Nco5 C18Not5 BglII BglII NcoI NotI 5339 bp 6585 bp 4733 bp 5 kb C18Kpn3,3 KpnI 3,3 kb C7Pst2,5 C7Pst3,0 C7Pst4,1 C7Pst5,0-1 C7Pst5,5-1 C7Pst9-1 PstI PstI PstI PstI PstI PstI 2,5 kb 3,0 kb 4,1 kb 5,0 kb 5,5 kb 9 kb Position auf dem msn-Contig oder BLAST-Ergebnis uni: ab 41404 aufsteigend über pOJ436; rev: 14510 uni: 36001; rev: 41339 uni: 29416; rev: 36000 uni: 14361; rev: 19093 uni: monooxygenase (Thermobifida fusca YX) rev: ABC transporter ATP-binding protein (Streptomyces avermitilis MA-4680) uni: hypothetical protein (Streptomyces rimosus subsp. paromomycinus) rev: hypothetical protein (Nocardia farcinica IFM 10152) nicht sequenziert nicht sequenziert nicht sequenziert, vermutlich: 27684 - 31718 nicht sequenziert, vermutlich: 37986 - 42980 nicht sequenziert, vermutlich: 16308 - 21742 nicht sequenziert Subklone von Cosmid 13 Tab. 40: Subklone von Cosmid 13. Als Vektor wurde stets pBSK− (s. Tab. 35) verwendet. Name Enzym C13B4,5 BamHI Insertgröße 4,5 kb C13B7-8-1 BamHI 8 kb C13B7-8-3 BamHI 7 kb C13B9-10-1 BamHI 10 kb BLAST-Ergebnis uni: peptidylarginine deiminase (Streptomyces clavuligerus) rev: ammonium transporter (Streptomyces avermitilis MA-4680) uni: ABC transporter ATP-binding protein (Streptomyces avermitilis MA-4680) rev: hypothetical protein SAV_5597 (Streptomyces avermitilis MA-4680) uni: ammonium transporter (Streptomyces avermitilis MA-4680) rev: 5-dehydro-4-deoxyglucarate dehydratase (Streptomyces avermitilis MA-4680) uni: 5-dehydro-4-deoxyglucarate dehydratase (Streptomyces avermitilis MA-4680) dann pOJ436 rev: hypothetical protein SCO4591 (Streptomyces coelicolor A3(2)) 199 Material und Methoden 5.4.2.5 Inaktivierungs- und Expressionsplasmide für S. sp. Gö C4/4 In der Reihenfolge von Kapitel 3.3. Inaktivierung und Expression von Genen des msc-Clusters Plasmid p∆msc21 (11608 bp), msc21-Inaktivierungsplasmid (s. 3.3.2.4) PvuI 497 KpnI 653 HindIII 689 PvuI 11060 SacI 1186 f1-ori carb SacI 9402 XbaI 9378 BamHI 9366 EcoRI 9354 BglII 9215 PstI 9174 ''lacZ´ ColE1 ori lacZ´' apra 10000 msc24 PstI 8634 2000 p∆msc21 8000 SacI 8444 SacI 1938 HindIII 2410 EcoRV 2416 EcoRI 2422 PstI 2428 BamHI 2440 'lacZ´' 'msc17 PvuI 2891 msc18 4000 msc23 6000 KpnI 7744 PvuI 7376 KpnI 7003 BamHI 6790 PstI 6778 XbaI 6756 msc22 pIJ778 spec Kassette* msc19 msc20 PvuI 3934 PvuI 4159 KpnI 4476 PvuI 5901 PvuI 5034 XbaI 5425 SacI 5460 *Richtung des Pfeils = Orientierung von spec Plasmidkonstruktion: Der Subklon pBSK4.27 (s. Tab. 36) trägt in seiner Insertmitte das auszuschaltende Gen msc21. Über die [safe-knock]-Strategie (s. 5.8.2) wurde msc21 (Position 21626C - 20562C auf dem msc-Contig) fast vollständig durch die Redirect-Kassette von pIJ778 ersetzt. Die eingebrachte Kassette reicht von Contigposition 20577 bis 21629, wobei das Spectinomycinresistenzgen in Leserichtung des umgebenden Operons liegt. Durch eine Restriktionsanalyse (s. 5.5.4) wurde die erwartete Sequenz bestätigt. Die Orientierung der im nächsten Schritt insertierten apra-Kassette ist unbekannt. 200 Material und Methoden Plasmid p∆msc37 (10007 bp), msc37-Inaktivierungsplasmid (s. 3.3.2.4) PvuI 276 EcoRI 396 SacI 402 KpnI 408 BamHI 417 XbaI 423 PstI 435 BamHI 842 PvuI 964 PvuI 9387 'lacZ´ carb 'msc34 PvuI 1681 msc35 10000 HindIII 7768 PvuI 2250 lacZ´'' 8000 2000 p∆msc37 msc36 SacI 2645 SacI 7296 apra SacI 6544 HindIII 6047 PstI 6035 SacI 5919 6000 4000 BamHI 2822 BamHI 2932 PstI 2944 XbaI 2966 pIJ778 spec Kassette* 'lacZ´' msc40' msc38 PvuI 3821 SacI 4262 XbaI 4297 BamHI 4385 *Richtung des Pfeils = Orientierung von spec Plasmidkonstruktion: Ausgehend vom Subklon C4Pst6-3 (s. 5.4.2.4) wurde p∆msc37 mit der [safe-knock]-Strategie (s. 5.8.2) erstellt. Die Redirect-Kassette von pIJ778 ersetzt Position 38346 - 39917 des msc-Contigs und damit fast vollständig das zu inaktivierende Gen msc37 (Contigposition 38319 - 39920). Durch eine Restriktionsanalyse wurde die erwartete Sequenz bestätigt. Die Orientierung der im nächsten Schritt insertierten apra-Kassette ist unbekannt. Plasmid pBSKclf−, msc15-Inaktivierungsplasmid (s. 3.3.2.5) pBSKclf− wurde von A. Prestel im Rahmen seiner Diplomarbeit erstellt [160]. Das Plasmid basiert auf dem Subklon pBSK4.19 (s. Tab. 36). In der Mitte der Sequenz von msc15 wurde über Blunting (s. 5.5.5.4) an einer BglII Schnittstelle ein Frameshift eingeführt. 201 Material und Methoden Plasmid pSETmsc24 (6925 bp), msc24-Expressionsplasmid und Plasmid pSETmsc30 (6952 bp), msc30-Expressionsplasmid (s. 3.3.2.6) XbaI 6925 PstI 6913 HindIII 6904 PstI 122 PstI 662 EcoRI 842 BamHI 854 MfeI 936 MunI 936 HindIII 942 HindIII 6181 msc23' msc24 SacI 1235 EcoRI 1241 6000 integrase 1000 ermE-uppromotor pSETmsc24 HindIII 5212 5000 2000 4000 3000 attp site apra oriT SacI 2500 PstI 4342 PstI 3540 PstI 6940 XbaI 6952 pSETmsc30 SacI 536 msc30 SacI 3251 HindIII 969 SacI 1262 ermE-up-promotor Plasmidkonstruktionen: Mit den Primerpaaren Msc24EcoXba-F / -R bzw. Msc30EcoXba-F / -R (s. 5.6.3.3) wurden mit der Pfu-Polymerase und Cosmid 4 der S. sp. Gö C4/4 DNA als Matrize die Gene msc24 bzw. msc30 amplifiziert. Nach der Restriktion der PCR-Produkte an den eingeführten Schnittstellen (msc24: MunI, XbaI; msc30: EcoRI, XbaI) ligierte man die codierenden Abschnitte in den mit MunI und XbaI geöffneten pSET-1cerm (s. Tab. 35). In beiden Expressionskonstrukten liegt das eingebrachte Gen hinter dem ermE-up-Promotor [199] auf dem gleichen Strang. Durch Ansequenzierungen mit den Standardprimern uni und rev (s. 5.6.2.1) konnten die Insertsequenzen vollständig erfasst und als fehlerlos bestätigt werden. 202 Material und Methoden Inaktivierung von Genen des mec-Clusters Plasmid p∆mecIII (12476 bp), mecIII-Inaktivierungsplasmid (s. 3.3.4.2) PvuI 497 PvuII 527 KpnI 653 HindIII 689 PvuI 11928 SacI 1186 carb PvuII 10490 ColE1 ori apra SacI 10270 12000 lacZ´' 2000 'mecIX 10000 'lacZ´' 'mecVIII p∆mecIII mecVII BglII 9048 PvuI 8949 SacI 1938 HindIII 2410 EcoRV 2416 EcoRI 2422 PstI 2428 BamHI 2440 XbaI 2452 ''lacZ´ 4000 mecVI mecV 6000 mecIII' mecII mecIV SacI 8277 'mecIII pIJ774Spec Kassette* BglII 7333 PvuII 7257 PstI 7251 PvuII 3347 PvuII 3392 PstI 3605 BamHI 3693 mecI 8000 PvuII 4678 SacI 5215 PvuI 5656 PvuI 6674 PvuI 6665 BamHI 6538 *Richtung des Pfeils = Orientierung von spec Plasmidkonstruktion: Ausgangspunkt der Klonierungen war der Subklon C12Not7 (s. Tab. 37). Über die [safe-knock]-Strategie (s. 5.8.2) wurde ein internes Fragment (Position 4738 - 5449 auf dem mec-Contig) des Gens mecIII durch die Redirect-Kassette von pIJ774Spec (s. 5.5.5.5) ersetzt. Dabei wurde bewusst die Variante "spec gegen die Leserichtung des Zielgens" gewählt um auch die Transkription mecIII nachgeschalteter Gene des gleichen Operons negativ zu beeinflussen. 203 Material und Methoden Inaktivierung von Genen des msn-Clusters Plasmid p∆msnK1 (10576 bp), msnK1-Inaktivierungsplasmid (s. 3.3.5.2) PvuI 497 KpnI 653 XhoI 668 HindIII 689 PvuI 10028 SacI 1161 f1-ori carb SacI 8370 NotI 8352 XbaI 8346 EcoRI 8331 BglII 8325 NcoI 8310 'lacZ´ ColE1 ori SacI 1913 apra 10000 lacZ´'' HindIII 2410 MunI 2416 NcoI 2422 BglII 2571 2000 'msnC1 8000 msnO5 p∆msnK1 msnK2' BamHI 2735 KpnI 2849 4000 EcoRI 7545 msnO4 6000 msnH4 'msnK1 pIJ774Spec Kassette* PvuI 6525 BamHI 4131 KpnI 5769 KpnI 5636 SacI 5454 PvuI 5013 *Richtung des Pfeils = Orientierung von spec Plasmidkonstruktion: Die Plasmidkonstruktion erfolgte analog zu p∆mecIII (s. o.). Auf dem aus dem Subklon C7Nco5 (s. Tab. 38) entstandenem Plasmid p∆msnK1 ersetzt die Redirect-Kassette die Contigpositionen 16062 - 16312, was den ersten 233 bp von msnK1 inklusive Startcodon entspricht. 204 Material und Methoden Plasmid p∆msnO11C2 (10247 bp), msnO11C2-Inaktivierungsplasmid (s. 3.3.5.2) PvuI 497 KpnI 653 HindIII 689 PvuI 9726 SacI 1161 f1-ori carb ''lacZ´ ColE1 ori SacI 8068 XbaI 8044 EcoRI 7979 EcoRI 7887 SacI 1913 apra 10000 HindIII 2410 EcoRV 2416 EcoRI 2422 PstI 2428 lacZ´' 'msnO10 msnK3 2000 8000 p∆msnO11C2 msnO11' 6000 'lacZ´' msnO12' PvuI 2696 4000 msnR2 SacI 6732 pIJ774Spec Kassette* PstI 3427 EcoRI 3464 'msnC2 PvuI 3946 BamHI 4079 PvuI 6291 BamHI 5409 BamHI 5168 *Richtung des Pfeils = Orientierung von spec Plasmidkonstruktion: Die Plasmidkonstruktion erfolgte analog zu p∆mecIII (s. o.). Der zugrunde liegende Subklon C7Bgl5a (s. Tab. 38) ist durch Ligation des BglII-Clusterfragments in den mit BamHI geöffneten Vektor pBSK− entstanden. Auf p∆msnO11C2 ersetzt die Redirect-Kassette die Contigpositionen 25588 - 25709. Dies entspricht den letzten 72 bp von msnO11 und den ersten 12 bp von msnC2. Material und Methoden 5.5 205 Allgemeine Methoden der Molekularbiologie 5.5.1 Einbringen von DNA in E. coli Laborstämme Das Einschleusen von DNA in Zellen wird als (genetische) Transformation bezeichnet [417]. Zum einen wurde die Hitzeschocktransformation von CaCl2 kompetenten Zellen, zum anderen die hocheffektive Elektroporation von elektrokompetenten Zellen durchgeführt. 5.5.1.1 Hitzeschocktransformation von E. coli Herstellung CaCl2 kompetenter Zellen Ausgehend von bei −86 °C tiefgefrorenen Dauerkulturen des entsprechenden E. coli-Stammes in 30 % Glycerin wurde eine LB-Agarplatte zur Gewinnung von Einzelkolonien bestrichen. Mit einer Kolonie wurden 100 mL LB-Flüssigmedium angeimpft und über Nacht auf dem Rundschüttler (37 °C, 180 rpm) inkubiert. Je 5 mL dieser Vorkultur dienten als Inokulum für sechs Mal 100 mL LB-Flüssigmedium als Hauptkultur, die bis zu einer OD600 von 0,5 kultiviert wurde. Sofern der Stamm über Selektionsmarker verfügte (s. Tab. 33), wurde bei allen Schritten das entsprechende Antibiotikum zugesetzt (s. Tab. 28). Aus je 100 mL Hauptkultur wurde durch Zentrifugation (4 °C, 5000 rpm, 10 min) ein Zellpellet gewonnen. Nach Resuspendieren in je 30 mL eisgekühlter 0,1 M MgCl2-Lösung wurde erneut pelletiert, in je 30 mL eisgekühlter CaCl2-Lösung resuspendiert und für 20 min auf Eis inkubiert. Das durch anschließende Zentrifugation erhaltene Zellpellet wurde vorsichtig in 10 mL eisgekühlter 0,1 M CaCl2-Lösung mit 15 % Glycerin (m/V) resuspendiert und in Aliquots von 150 µL bei −86 °C gelagert. Aus dem beschriebenen Ansatz mit 600 mL Hauptkultur ließen sich so pro Charge etwa 400 Einheiten für die CaCl2 vermittelte Transformation herstellen. CaCl2 vermittelte Transformation Für die CaCl2 vermittelte Transformation von E. coli wurde jeweils eine Einheit (150 µL) kompetenter Zellen eingesetzt. Die tiefgefrorene Einheit wurde zunächst 10 min auf Eis aufgetaut, mit 5 - 20 µL Lösung der zu transferierenden DNA versetzt und weitere 30 min auf Eis gelassen. Nach einer Hitzeschockbehandlung (2 min im 41 °C Wasserbad) wurde der Transformationsansatz sofort mit 1 mL LB-Flüssigmedium versetzt und zur Regeneration 1 h bei 30 °C bzw. 37 °C inkubiert. Wegen dieses Schrittes spricht man auch von Hitzeschocktransformation. Nach der Regeneration ohne Antibiotikum wurde die Kultur pelletiert (20 °C, 5000 rpm, 5 min), die Zellen nach dem Abgießen des Überstands im letzten Tropfen (ca. 100 µL) resuspendiert und auf einer antibiotikahaltigen LB-Agarplatte ausplattiert. Das Wachstum von Transformanten konnte in Abhängigkeit vom verwendeten Stamm, Selektionsantibiotikum und Inkubationstemperatur (s. 5.3) nach einer Wachstumszeit von14 24 h festgestellt werden. 206 Material und Methoden 5.5.1.2 Elektroporation von E. coli Bei der Elektroporation wird DNA in elektrokompetente Zellen eingebracht [418]. Eine Mischung aus elektrokompetenten Zellen und DNA-Lösung wird dabei einem starken elektrischen Feld ausgesetzt. Durch einen starken elektrischen Puls bilden sich kurzzeitig Poren in der Zellmembran. Die DNA beschreibt während des Pulses eine Bewegung in Richtung Pluspol. Treffen beide Ereignisse so zusammen, dass die DNA die Pore einer Zelle trifft und ihre Vorwärtsbewegung innerhalb der Zelle beendet, ist das Ergebnis eine mit Fremd-DNA transformierte Zelle. Diese hocheffektive Methode wurde als Alternative zur Hitzeschocktransformation eingesetzt, wenn nur eine geringe Transformantenzahl zu erwarten war, wie zum Beispiel bei der Transformation von linearen DNA-Fragmenten und anschließender λ-Red-Rekombination (s. 5.5.5). Herstellung elektrokompetenter Zellen Mit einer Einzelkolonie des gewünschten Stammes wurden 100 mL LB-Flüssigmedium angeimpft und über Nacht auf dem Rundschüttler (37 °C, 180 rpm) unter Selektionsdruck mit dem entsprechenden Antibiotikum inkubiert (s. Tab. 33). 5 mL dieser Vorkultur dienten als Inokulum für 100 mL antibiotikahaltiges LB-Flüssigmedium als Hauptkultur, die bis zu einer OD600 von 0,5 kultiviert wurde. Durch Zentrifugation (4 °C, 5000 rpm, 5 min) wurde nach Abgießen des Überstandes ein Zellpellet gewonnen. Das Pellet wurde vorsichtig in 20 mL eiskaltem 10 % Glycerol resuspendiert und wiederholt zentrifugiert. Der Vorgang des Resuspendierens mit anschließender Zentrifugation wurde ein zweites Mal wiederholt. Das gewaschene Pellet wurde schließlich in 5 mL 10 % Glycerol resuspendiert. Die Suspension elektrokompetenter Zellen wurde in Aliquots von 50 µL bei −86 °C aufbewahrt. Elektroporation Die DNA wurde mit dem Elektroporator Gene Pulser II (s. Tab. 18) in die Bakterien eingebracht. Dazu wurden 50 µL Suspension elektrokompetenter Zellen auf Eis aufgetaut, mit maximal 6 µL DNA-Lösung versetzt und in eine vorgekühlte Elektroporationsküvette (0,1 cm Spaltbreite von BIO-RAD) transferiert. Der Elektroschock wurde mit folgenden Einstellungen gestartet: gene pulser: 25 µF / 2,5 kV, pulser controller: 200 Ω. Erfolgreiche Elektroporationen ließen sich erwarten, wenn die vom Gerät angezeigte Entladungszeit im Bereich von 3,0 - 5,0 ms lag. Nach erfolgter Elektroporation wurde die Bakteriensuspension mit 1 mL eiskaltem LB-Medium versetzt und für 1 h bei 30 °C bzw. 37 °C inkubiert. Nach der Regeneration ohne Antibiotikum wurde die Kultur pelletiert (20 °C, 5000 rpm, 5 min), die Zellen nach dem Abgießen des Überstands im letzten Tropfen (ca. 100 µL) resuspendiert, auf einer antibiotikahaltigen LB-Agarplatte ausplattiert und entsprechend bei 30 °C bzw. 37 °C inkubiert. Material und Methoden 207 5.5.1.3 Blau-Weiß-Selektion Die Blau-Weiß-Selektion erlaubt die direkte Detektion einer erfolgreichen Insert / VektorLigation (vgl. 5.5.5) auf der Agarplatte der Transformation. Vorraussetzung ist ein Vektor mit lacZ-Gen im Bereich der gewünschten Insertionsposition (s. Tab. 33). Das lacZ-Gen codiert die α-Untereinheit der β-Galactosidase. Nach der Ligation führen nur ungespaltene oder religierte Vektoren zur Proteinbiosynthese einer intakten α-Untereinheit, die zusammen mit der vom Chromosom des aufnehmenden Stammes codierten ω-Untereinheit eine funktionsfähige β-Galactosidase aufbauen kann. Die gewünschte Insertion von DNAFragmenten in den Leserahmen von lacZ hingegen verhindert die Produktion einer funktionellen β-Galactosidase. Zur praktischen Durchführung wurde gleichzeitig mit der regenerierten Kultur bei Transformationen (s. o.) 40 µL 0,2 M IPTG-Lösung und 40 µL X-Gal-Lösung (10 mg/mL in DMF) auf der antibiotikahaltigen LB-Agarplatte ausplattiert. X-Gal ist ein farbloses Galactosederivat, das von β-Galactosidase in einen blauen Farbstoff umgewandelt wird, IPTG (Isopropyl-β-D-1-thiogalactopyranosid) induziert das lac-Operon. Nur bei Transformanten, die den religierten Vektor tragen, kommt es zur Blaufärbung der Kolonie. Transformanten mit Insert bleiben klar (weiß). 5.5.2 Isolierung von DNA 5.5.2.1 Plasmidpräparation aus E. coli Die Isolierung von Plasmid-DNA aus E. coli erfolgte nach dem Prinzip der alkalischen Lyse [419]. Durch Detergentienzusatz wurde zunächst die Zellmembran von E. coli zerstört, worauf sowohl Plasmid-DNA als auch chromosomale DNA freigesetzt wurden. Sämtliche DNA wurde durch Zugabe von NaOH denaturiert. Bei der sich anschließenden Absenkung des pH-Wertes renaturiert im Wesentlichen die Plasmid-DNA. Die chromosomale DNA hingegen bildet ein Netzwerk und fällt aus der Lösung aus. Für die Trennung bediente man sich zusätzlich der Tatsache, dass das Bakterienchromosom, nicht aber das Plasmid, mit der Zellmembran verbunden ist. Das gebundene Bakterienchromosom konnte durch Zentrifugation sedimentiert werden. Die erhaltene Plasmidlösung wurde nach gewünschtem Reinheitsgrad unterschiedlich weiterbearbeitet. Isolierte DNA wurde bei −20 °C gelagert. 208 Material und Methoden Mini-Präparation Die verwendeten Puffer sind in Tab. 20 aufgeführt. E. coli-Einzelkolonien wurden als Reagenzglaskultur 14 - 16 h bei 37 °C und 180 rpm in 4 mL LB-Flüssigmedium mit dem entsprechenden Antibiotikum angezogen. Nach Abschluss der Kultivierung wurden die Zellen durch Zentrifugation pelletiert (4 °C, 14000 rpm, 5 min) und das Zellpellet in 200 µL Puffer P1 homogen resuspendiert. Anschließend wurden 200 µL Puffer P2 zugegeben, durch vorsichtiges Invertieren gemischt und 5 min bei Raumtemperatur inkubiert. Nach Zugabe von 200 µL Puffer P3 wurde die Mischung 10 min auf Eis inkubiert und anschließend zentrifugiert (4 °C, 14000 rpm, 20 min). Der Überstand wurde in ein neues Reaktionsgefäß überführt und die DNA wie unter 5.5.3 beschrieben gefällt und in 50 µL H2Obidest aufgenommen. Die erzielten Ausbeuten lagen bei 50 - 90 µg Plasmid-DNA pro Ansatz. Die mit dieser Methode isolierte DNA wurde für Restriktionsanalysen und Klonierungsexperimente verwendet. Für Auftragssequenzierungen wurde die Plasmid-DNA in kleinem Maßstab und hohem Reinheitsgrad mit Hilfe des "Wizard SV Minipreps DNA Purification System" (s. Tab. 32) isoliert. Das Prinzip der Aufreinigung ist hier eine Festphasenextraktion. Die Isolierung erfolgte entsprechend den Angaben im Handbuch des Herstellers Promega. Die Ausbeuten lagen bei 10 - 30 µg Plasmid-DNA pro Präparation. Midi-Präparation Die Midi-Präparation mit dem "Pure Yield Plasmid Midiprep System" (s. Tab. 32) wurde für die Gewinnung größerer Mengen DNA hohen Reinheitsgrades eingesetzt. Das Protokoll beruht auf einer alkalischen Lyse, gefolgt von einer Aufreinigung der DNA mittels Festphasenextraktion. Eine E. coli-Kolonie wurde 14 - 16 h in 100 mL LB-Flüssigmedium mit entsprechendem Antibiotikum bei 37 °C und 180 rpm kultiviert. Die Lyse der Zellen und die DNA-Isolierung erfolgten entsprechend den Angaben des Herstellers Promega. Die erhaltene DNA wurde in 600 µL H2Obidest gelöst. Die erzielten Ausbeuten lagen bei 300 800 µg Plasmid-DNA pro Ansatz. Per Midi-Präparation wurden Stocklösungen von häufig verwendeten Plasmiden und Cosmiden gewonnen. 5.5.2.2 Isolierung genomischer DNA aus Saccharothrix / Streptomyces Ziel dieser Methode ist es, die gesamte DNA, bestehend aus bakteriellem Chromosom sowie eventuell vorhandenen Plasmiden aus einem Stamm der Gattungen Saccharothrix oder Streptomyces zu isolieren. Zunächst wurde die Zellwand der Gram+ Bakterien enzymatisch abgebaut, die Protoplasten lysiert und die Proteine ausgefällt. Es folgte die Alkoholfällung der DNA. Aufgrund der Größe des Chromosoms kommt bei dem beschriebenen Protokoll zu einer gewissen Fragmentierung des DNA-Doppelstranges durch Schervorgänge. Dies ist durchaus akzeptabel, da die genomische DNA ausschließlich als Matrize für die PCR Material und Methoden 209 eingesetzt wurde. Zur Herstellung von Cosmidbänken ist ein schonenderes Verfahren zu wählen. Die verwendeten Puffer sind in Tab. 21 aufgeführt. Der Stamm wurde unter Standardbedingungen (s. 5.3) 1 - 3 Tage lang kultiviert bis sich feines, dichtes Myzel bildete. 2 mL der Kultur wurden bei 14000 rpm (RT, 10 min) pelletiert. Die Masse des Myzelpellets sollte bei 150 - 200 mg liegen. Zur Oberflächenvergrößerung wurde die in Fäden oder Kugeln verwachsene Zellmasse nach der Resuspension in 0,5 mL Puffer B1 durch eine Insulinspritze gepresst. Nach wiederholter Pelletierung durch Zentrifugation wurden die Zellen in 0,5 mL Puffer B1 mit 4 mg Lysozym/mL resuspendiert und für 60 min in den 37 °C Brutschrank gestellt. Bei der anschließenden Zugabe von 50 µL gesättigter NaCl-Lösung und vorsichtigem Mischen bildete sich eine klare Lösung. Mit 120 µL 10 % SDS-Lösung versetzt wurde die Mischung für 20 min bei 65 °C inkubiert. Nach Zusatz von 240 µL 5 M Kaliumacetatlösung und Mischen wurde 20 min auf Eis inkubiert. Der Niederschlag wurde durch Zentrifugation (RT, 14000 rpm, 10 min) abgetrennt, der Überstand in ein neues Reaktionsgefäß überführt. Die DNA wurde wie unter 5.5.3 beschrieben mit dem äquivalenten Volumen Isopropanol gefällt und mit Ethanol 70 % (V/V) gewaschen. Das DNA-Pellet wurde in 50 µL H2Obidest gelöst. 5.5.3 Reinigung und Aufkonzentrierung von DNA 5.5.3.1 DNA-Fällung Die Alkoholfällung ist eine Möglichkeit zur Aufkonzentrierung von in Lösung befindlicher DNA. Gleichzeitig wird eine Befreiung von niedermolekularen Substanzen erreicht. Hierzu wurde die DNA-haltige Lösung zunächst durch Zugabe von einem Drittel des Ausgangsvolumens 5 M Kaliumacetatlösung angesäuert, wenn dies nicht schon wie bei der DNAIsolierung (5.5.2) geschehen ist. Dann wurde ein der gesamten Lösung äquivalentes Volumen eiskalter Isopropanol zugegeben. Nach Invertieren wurde 20 min bei −20 °C inkubiert. Die gefällte DNA wurde anschließend durch Zentrifugation (4 °C, 14000 rpm, 20 min) pelletiert und mit 500 µL eiskaltem Ethanol 70 % (V/V) gewaschen. Um störende Reste von Ethanol zuverlässig zu entfernen, wurde das Pellet für 5 min im Wärmeschrank bei 60 °C getrocknet und anschließend in H2Obidest gelöst. 5.5.3.2 Festphasenextraktion Zur Gewinnung von DNA hohen Reinheitsgrades aus Lösungen oder präparativen Agarosegelen wurde das Kit "Wizard SV Gel and PCR Clean-up System" (s. Tab. 32) gemäß den Herstellerangaben verwendet. Das Prinzip dieses Kits beruht auf der selektiven und quantitativen Adsorption von DNA an Silicagelpartikel in Gegenwart eines chaotropen 210 Material und Methoden Salzes. Die DNA bleibt während des Waschvorgangs an die Silicagelpartikel gebunden und kann am Ende der Aufreinigung spezifisch abgelöst werden. 5.5.3.3 Reinigung mittels präparativer Agarosegelelektrophorese Die präparative Agarosegelelektrophorese ist eine weitere Methode der DNA-Aufreinigung. Zusätzlich zur Befreiung von Proteinen und Pufferbestandteilen können DNA-Fragmente selektiv nach Länge getrennt werden. Diese Methode ist unter 5.5.4 im Detail beschrieben. 5.5.4 Qualitative und quantitative DNA-Analytik 5.5.4.1 Restriktion mit Endonukleasen Restriktionsendonukleasen sind Enzyme, die den DNA-Doppelstrang an für die jeweilige Endonuklease spezifischen Basenabfolgen spalten [420]. Anhand der auftretenden Fragmentgrößen können die DNA-Moleküle charakterisiert werden. Zur Visualisierung der Spaltungsmuster diente die Agarosegelelektrophorese (s. u.) mit anschließender Gelfärbung. Für Klonierungsexperimente wurde die Restriktion im präparativen Maßstab angesetzt und die gewünschten Fragmente mit der präparativen Agarosegelelektrophorese isoliert. Die Aktivitätsdefinition für Restriktionsendonukleasen besagt, dass 1 unit (u) Enzym ausreicht, um 1 µg DNA in 1 h zu spalten. Die Konzentrationen der verwendeten DNALösungen lagen bei 0,2 - 1,2 µg/µL. Mit den in Tab. 41 angegebenen Restriktionsansätzen war folglich bei einer Inkubationsdauer von 2 h bei der vom Enzymhersteller vorgegebenen Temperatur ein vollständiger Verdau zu erwarten. Bei gleichzeitigem Einsatz von zwei Enzymen wurde der Anteil H2Obidest entsprechend vermindert. Tab. 41: Restriktionsansätze. H20bidest DNA-Lösung BSA (10-fach) Enzympuffer (10-fach) Enzym (5u/µL) Gesamtvolumen analytisch 13,5 µL 2,0 µL 2,0 µL 2,0 µL 0,5 µL 20,0 µL präparativ 30,0 µL 15,0 µL 6,0 µL 6,0 µL 3,0 µL 60 µL Material und Methoden 211 5.5.4.2 Agarosegelelektrophorese Das Ergebnis einer Restriktionsspaltung, DNA-Isolierung oder PCR kann mit Hilfe der analytischen Agarosegelelektrophorese analysiert werden. Die präparative Agarosegelelektrophorese hingegen dient der Isolierung von DNA-Fragmenten für Klonierungsexperimente. DNA ist aufgrund der Phosphatreste negativ geladen und kann deshalb elektrophoretisch aufgetrennt werden. Die Wanderungsgeschwindigkeit der DNA in der Agarosematrix ist von der Größe und Konformation sowie davon abhängig, ob es sich um lineare oder zirkuläre, einzel- oder doppelsträngige Formen handelt. Die Agarosegelelektrophorese wurde gemäß [394] durchgeführt. Verwendet wurden Gele mit einer Agarosekonzentration von 0,7 % (m/V). Als Längenstandard diente eine 1 kb Leiter. Verwendete Puffer und Lösungen sind in Tab. 22 aufgeführt. Analytisch Die Trennung der DNA erfolgte bei 100 V und einer Laufzeit von 35 min. Die Gele wurden in wässriger Ethidiumbromidlösung (1 µg/mL) für mindestens 20 min gefärbt und nachfolgend bei UV-Licht bei 312 nm detektiert und fotografiert (Image Master VDS, VideoDokumentationssystem, Amersham). Präparativ Die Trennung erfolgte bei 80 V und einer Laufzeit von 1 - 2 h. Anschließend wurden die Gele mit einer wässrigen 0,2 %igen Methylenblaulösung 30 min gefärbt. Die Hintergrundfärbung wurde durch 1 h Entfärben in H2Obidest wieder entfernt. Das gewünschte Fragment wurde mit einem Skalpell ausgeschnitten, die Elution der DNA aus dem Agarosegel erfolgte mit dem Kit "Wizard SV Gel and PCR Clean-up System" (s. Tab. 32). 5.5.4.3 Konzentrationsbestimmung von DNA Die Konzentration von DNA in Lösung wurde durch Messung der UV-Absorption bei 260 nm bestimmt. Die Lösungen wurden so weit verdünnt, dass die Absorption zwischen 0,1 AU und 0,5 AU lag. Das verwendete Photometer (Ultrospec 2100 pro, s. 5.1) verfügt über ein Programm, das die Konzentration für doppelsträngige DNA gemäß des LambertBeerschen-Gesetzes ausgehend von folgender Beziehung berechnet. A260 = 1,0 AU entspricht einer Konzentration von 50 µg/µL. 212 Material und Methoden 5.5.5 Klonierungstechniken 5.5.5.1 Ligation von DNA-Fragmenten durch T4-DNA-Ligase Durch T4-DNA-Polymerase können doppelsträngige DNA-Fragmente an glatten Enden oder klebrigen Enden mit komplementären Überhängen miteinander verknüpft werden [421]. Das Enzym katalysiert Phosphodiesterbindungen zwischen dem 3'-OH- und dem 5'-PhosphatEnde in Gegenwart von ATP. Hauptsächliche wurde die Ligation bei der Subklonierung von Genclusterfragmenten (Inserts) in Vektoren angewendet. Die Reaktion erfolgte in einem Volumen von 10 µL oder 20 µL in Ligasepuffer (enthält ATP) mit 0,5 u bzw. 1 u (Weiss unit) T4-DNA-Ligase. Das Insert wurde im Verhältnis zum Vektor in etwa 10-fach höherer Konzentration zugesetzt. Klebrige Enden wurden 3 h, glatte Enden über Nacht bei Raumtemperatur inkubiert. Die Ligationsansätze wurden anschließend bei −20 °C eingefroren oder direkt zur Hitzeschocktransformation von E. coli eingesetzt (s. 5.5.1). 5.5.5.2 Erstellung von Subklonen per Restriktion und Ligation In der Molekularbiologie versteht man unter Subklonieren den Transfer eines bestimmten Bereichs aus einem größeren DNA-Fragment, Plasmid oder Chromosom in einen Vektor. Der transferierte Bereich kann so gezielt auf seine Funktion untersucht werden, indem der Subklon ansequenziert wird (s. 5.6.2) oder für die heterologe Expression (vgl. 3.3.5.1) oder Geninaktivierung (s. 5.8) eingesetzt wird. Der gewünschte DNA-Bereich (Insert), der in einen Vektor kloniert werden sollte, wurde durch Restriktion (s. 5.5.4.1) aus der Ursprungs-DNA freigesetzt. Das gewünschte DNA-Fragment wurde aus einem präparativen Agarosegel isoliert (s. 5.5.4.2). Der aufnehmende Vektor wurde enzymatisch derart linearisiert, dass zum Insert komplementäre Ende entstanden und ebenfalls über ein Agarosegel aufgereinigt. Das Insert wurde durch Ligation in einen Vektor insertiert (s. 5.5.5.1) und nachfolgend in kompetente E. coli-Zellen transformiert (s. 5.5.1.1). 5.5.5.3 TA-Klonierung von PCR Produkten der Taq-Polymerase Im Gegensatz zu Amplifikaten der Pfu-Polymerase haben die Produkte der Taq-Polymerase keine glatten Enden, sondern tragen am 3'-Ende beider Stränge je ein ungepaartes Desoxyadenosin (A). Diese klebrigen Enden kann man sich für die effektive Ligation in linearisierte Vektoren mit beidseitig einfachen Desoxythymidin-(T)-Überhängen am 3'-Ende zu Nutze machen. So lassen sich PCR-Produkte für die kostengünstige Ansequenzierung mit Standardprimern (s. 5.6.2.1) verfügbar zu machen. Dem kommt besondere Bedeutung bei der Verwendung von degenerierten Primer zu (vgl. 3.1.9). Es wurde das molekularbiologische Kit "pGEM-T Easy Vector System" (s. Tab. 32) eingesetzt. Die Ligation wurde wie unter 5.5.5.1 mit anschließender Transformation von E. coli (s. 5.5.1.1) und Blau-Weiß-Selektion (s. 5.5.1.3) durchgeführt. Material und Methoden 213 5.5.5.4 Leserahmenverschiebung mit Hilfe des Klenow-Fragments Um ein nicht funktionelles Allel für die Geninaktivierung zu erhalten, kann der Leserahmen innerhalb des zu inaktivierenden Gens verschoben werden (vgl. 5.8.1). Nach einer Restriktionsspaltung (s. 5.5.4.1) innerhalb des Gens werden entstehende klebrige Enden mit dem Klenow-Fragment in glatten Enden umgewandelt. Wenn sich nach der Religation (s. 5.5.5.1) die Länge des DNA-Doppelstranges um eine nicht durch 3 teilbare Anzahl von Basenpaaren verändert hat, ist der Leserahmen des Gens verschoben und das entstandene Allel folglich nicht mehr funktionell. Das Klenow-Fragment ist die C-terminale große Untereinheit der DNA-Polymerase I aus E. coli. Die Bifunktionalität des Enzyms ermöglicht sowohl die Auffüllreaktion von 5´-Überhängen über die 5'→3'-Polymeraseaktivität, als auch den Abbau von 3´-Überhängen über die 3´→5´-Exonukleaseaktivität. Beides führt zum Entstehen glatter Enden. Dieser Vorgang wird Blunting genannt. Die Reaktion wurde gemäß Tab. 42 angesetzt. Nach einer Reaktionszeit von 10 min bei Raumtemperatur wurde das Enzym durch Hitzeeinwirkung bei 75 °C inaktiviert. Über Festphasenextraktion (s. 5.5.3.2) wurde die DNA aus dem Ansatz gewonnen und religiert (s. 5.5.5.1). Tab. 42: Reaktionsansatz Blunting. Blunting DNA-Lösung (0,2 µg/µL) dNTP-Mix (1 mM) Enzympuffer (10-fach) Klenow-Fragment (5 u/µL) Gesamtvolumen 16,0 µL 1,0 µL 2,0 µL 1,0 µL 20,0 µL 5.5.5.5 λ-Red vermittelte Rekombination in E. coli Das Red-System aus dem PL-Operon des λ-Phagen führt im Wirtsstamm zu einer deutlich erhöhten Effizienz homologer Rekombinationen zwischen linearen DNA-Fragmenten und zirkularen oder linearen Zielmolekülen. Die größte Effizienzsteigerung im Vergleich zum bereits zuvor verwendeten Rekombinationssystem von RecBCD-defizienten recBC sbcBC oder recD E. coli Stämmen wurde bei kurzen Bereichen (1 kb) homologer Sequenz beobachtet [422]. Später konnte gezeigt werden, dass die λ-Red vermittelte Rekombination sich auf identische Sequenzen ab 20 bp Länge anwenden lässt und die Effizienz bei Ausdehnung auf 40 bp sehr stark und bei größeren Bereichen nur noch schwächer steigt [423]. Das Red-System besteht aus drei Proteinen: Redγ (Gen gam), Redα (Gen exo), Redβ (Gen bet). Redγ inhibiert die RecBCD-Exonuklease von E. coli. Redα besitzt eine 5'→3'-Exonukleaseaktivität und erzeugt so lange 3'-Überhänge auf dem linearen DNA-Fragment. Das Protein Redβ ist die eigentliche Rekombinase. Sie bindet an die von Redα zurückgelassene Einzelstrang-DNA und verbindet sie mit der komplementären Sequenz auf dem Zielmolekül. 214 Material und Methoden λ-Red vermittelte Rekombination zur Geninaktivierung Ihre Hauptanwendung im Forschungsgebiet der Bodenbakteriengenetik findet die λ-Red vermittelte Rekombination bei der Erstellung von Inaktivierungsplasmiden (vgl. 5.8.2) oder Inaktivierungscosmiden [424]. In der vorliegenden Arbeit wurde eine Redirect-Kassette des John Innes Centre (Norwich, UK) [150] sowie speziell konstruierte Derivate (s. Abb. 100) eingesetzt, um auf Subklonen (s. 5.5.5.2) von Biosynthesegenclustern bestimmte Gene oder Teile von Genen gegen die Kassetten auszutauschen. Auf diese Weise wurden nicht funktionelle Allele der zu inaktivierenden Gene erstellt. Eingesetzte Redirect-Kassetten P2 P1 pIJ778 oriT spec loxP spec loxP oriT FRT FRT P1 P2 pIJ774Spec Legende oriT spec pIJ785Spec FRT FRT tipAp P1 P2 P1 / P2: Primerbindungsstellen FRT: Erkennungsstelle der Flp-Rekombinase loxP: Erkennungsstelle der Cre-Rekombinase oriT: origin of transfer von RK2 spec: Spectinomycinresistenzgen aadA tipAp: thiostreptoninduzierbarer Promotor Um auch tipAp zu amplifizieren wurde der Primer von den äußersten bp von tipAp abgeleitet. Abb. 100: Redirect-Kassetten. pIJ778 stammt aus der Sammlung des John Innes Centre (Norwich, UK), pIJ774Spec und pIJ785Spec wurden im Rahmen dieser Arbeit konstruiert (s. 5.4.2.1). Darstellung der RedirectKassetten gemäß [150]. Es wurde ein modifizierten Protokoll gemäß Gust et al. (2002) [150] angewendet. Die Redirect-Kassetten liegen als Insert des Vektors pBluescript II SK (+) (s. Tab. 35) vor, einligiert in dessen EcoRV-Erkennungsstelle der MCS. Der Bereich der Redirect-Kassette wurde mit EcoRI / HindIII aus dem Vektor ausgeschnitten (s. 5.5.4.1) und per präparativer Agarosegelelektrophorese (s. 5.5.4.2) isoliert. Das Fragment diente als Matrize für die sich anschließende PCR (s. 5.6.1). Für die Primer wurden je 39 nt von der Subklonsequenz beidseitig des auszutauschenden Bereichs abgeleitet. Am 3'-Ende wurden die vorläufigen Primersequenzen noch um die Sequenzen der Randbereiche der Redirect-Kassetten ergänzt (Primerbindungsstellen P1 und P2, bzw. P2 und ein Bereich des tipAp, vgl. Abb. 100). Die Kombination der beiden Primerbestandteile entscheidet darüber, ob das Spectinomycinresistenzgen in oder gegen die Leserichtung des inaktivierten Gens liegt. Die 58 nt oder 59 nt langen Primer wurden mit dem Programm Clone Manager Suite (s. Tab. 57) auf eine 215 Material und Methoden mögliche Bildung von hairpins und unerwünschte Bindungsstellen überprüft. Die Primer wurden vom Hersteller über HPLC gereinigt. Tab. 43: Primerdesign für die λ-Red vermittelte Rekombination. pIJ778, pIJ774Spec 1. Teil des Primers F-Primer 39 nt vor / am Anfang des Zielgens in Leserichtung auf dem codierenden Strang R-Primer 39 nt nach / am Ende des Gens gegen die Leserichtung auf dem nicht codierenden Strang pIJ785Spec 1. Teil des Primers F-Primer 39 nt vor / am Anfang des Zielgens in Leserichtung auf dem codierenden Strang R-Primer 39 nt nach / am Ende des Gens gegen die Leserichtung auf dem nicht codierenden Strang 2. Teil des Primers spec in Leserichtung des Zielgens die ersten 20 nt der RedirectKassette in Leserichtung von spec auf dem codierenden Strang (P1) spec gegen die Leserichtung des Zielgens die letzen 19 nt der RedirectKassette gegen die Leserichtung von spec auf dem nicht codierenden Strang (P2) 5'ATTCCGGGGATCCGTCGACC3' 5'TGTAGGCTGGAGCTGCTTC3' die letzen 19 nt der RedirectKassette gegen die Leserichtung von spec auf dem nicht codierenden Strang (P2) die ersten 20 nt der RedirectKassette in Leserichtung von spec auf dem codierenden Strang (P1) 5'TGTAGGCTGGAGCTGCTTC3' 5'ATTCCGGGGATCCGTCGACC3' 2. Teil des Primers spec in / tipAp gegen die Leserichtung des Zielgens die ersten 19 nt von tipAp in Leserichtung von spec auf dem codierenden Strang 5'TCCGCTCCCTTCTCTGACG3' tipAp in / spec gegen die Leserichtung des Zielgens die letzen 19 nt der pIJ785Spec Kassette gegen die Leserichtung von spec auf dem nicht codierenden Strang (P2) 5'TGTAGGCTGGAGCTGCTTC3' die letzen 19 nt der pIJ785Spec Kassette gegen die Leserichtung von spec auf dem nicht codierenden Strang (P2) die ersten 19 nt von tipAp in Leserichtung von spec auf dem codierenden Strang 5'TCCGCTCCCTTCTCTGACG3' 5'TGTAGGCTGGAGCTGCTTC3' Das PCR-Produkt wurde über präparative Agarosegelelektrophorese gereinigt und simultan dem zu modifizierenden Subklon per Elektroporation (s. 5.5.1.2) in E. coli DH5α pBADαβγ eingebracht (s. Tab. 33, Tab. 35). Es wurden dabei elektrokompetente Zellen eingesetzt, die durch vorherige Induktion mit L-Arabinose (10 mM) bereits die Red-Proteine gebildet hatten. Die λ-Red vermittelte Rekombination kann deshalb direkt während der Regeneration mit LB-Medium oder auf der Selektionsplatte stattfinden. pBADαβγ besitzt das thermosensitive Replikon des Plasmids pSC101 [425] und geht deshalb bei der sich anschließenden 216 Material und Methoden Inkubation bei 37 °C verloren. Auf der Selektionsplatte gewachsene Rekombinanten besitzen meist neben dem veränderten Plasmid noch Kopien des ursprünglichen Subklons. Durch Restriktion, Agarosegelelektrophorese und Religation (vgl. Abb. 46) oder nach Retransformation kann das modifizierte Plasmid rein gewonnen werden. Alternativ wurde zunächst der zu modifizierenden Subklon in E. coli DH5α pBADαβγ eingebracht. Ein Transformant wird unter Induktion mit L-Arabinose angezogen, elektrokompetente Zellen hergestellt und erst danach das PCR-Produkt per Elektroporation eingebracht. 5.6 Polymerasekettenreaktion (PCR) und DNA-Sequenzierung 5.6.1 PCR Die Polymerasekettenreaktion zur enzymatischen In-vitro-Vervielfältigung (Amplifizierung) eines DNA-Bereichs von einer Vorlage (Matrize) hat sich seit ihrer Veröffentlichung im Jahr 1985 [426] zu einer der wichtigsten Methoden der Molekularbiologie entwickelt und findet in vielen Variationen ihre Anwendung [427]. Durch die Hintereinanderschaltung mehrerer Polymerisationszyklen (in der Regel 20 - 40) wird eine exponentielle Vervielfältigung der PCR-Produkte erreicht. Der zu amplifizierende Bereich wird über die Bindungsstellen von zwei Oligonukleotidprimern bestimmt. In 5'→3'-Richtung zu einander hin orientiert binden die Primer dabei auf komplementären DNA-Strängen. Die entstehenden, doppelsträngigen PCR-Produkte reichen vom 5'-Ende des ersten Primers bis zum 5'-Ende des zweiten Primers. Als Enzyme wurden die Taq-Polymerase aus Thermus aquaticus sowie die Pfu-Polymerase aus Pyrococcus furiosus eingesetzt. Mit der Taq-Polymerase werden Produkte mit einem ungepaarten Desoxyadenosin als 3'-Überhang erhalten. Taq-Produkte sind deshalb der TA-Klonierung (s. 5.5.5.3) zugänglich. Die Pfu-Polymerase generiert Produkte ohne Überhang. Sie besitzt eine Korrekturfunktion, die zu einer erhöhten Synthesegenauigkeit führt. Für Gewinnung von PCR-Produkten zur Konstruktion von Expressionsplasmiden wurde deshalb die Pfu-Polymerase verwendet. 217 Material und Methoden 5.6.1.1 Primerdesign, PCR-Ansatz und allgemeines Temperaturprogramm Die Oligonukleotidprimer wurden mit dem PC-Programm Clone Manager Suite (s. Tab. 57) abgeleitet und von der Firma OPERON Biotechnologies (Köln) synthetisiert. Die eingesetzten Thermocycler sind in Tab. 18 angegeben. Ein PCR-Ansatz (Standardvolumen 50 µL) hatte eine Zusammensetzung laut Tab. 45. Tab. 44: Parameter zum Primerdesign mit der Clone Manager Suite. Parameter Optimale Länge [nt] G+C-Anteil [%] Schmelztemperatur [°C] Aufeinanderfolgende homologe Nukleotide Aufeinanderfolgende identische Nukleotide Wiederholungen von Dinukleotiden Anzahl G oder C am 3' Ende Wert 20 50 - 80 55 - 80 <7 <4 <3 ≥1 Tab. 45: PCR-Ansatz (Standardvolumen 50 µL). Abschnitt DNA-Matrize Taq- oder Pfu-Polymerasepuffer (5-fach oder 10-fach konzentriert) DMSO oder Glycerol dNTP-Mix, 10 mM F-Primer, 20 µM R- Primer, 20 µM H2Obidest Polymeraselösung* Volumen 1 µL 10 µL (5-fach) bzw. 5 µL (10-fach) 1 - 3 µL DMSO oder 10 µL Glycerol 50 % (V/V) 1 µL 1 µL 1 µL ad 49 µL 1 µL Bemerkung 10 µL bei genomischer DNA Endkonzentration: 1-fach Zur Schmelzpunktserniedrigung und Auflösung von Sekundärstrukturen 5 nmol pro Nukleotid 20 pmol 20 pmol Als "hotstart" nach initialer Denaturierung zupipettiert * Die Aktivität bei der eingesetzten Enzymlösungen betrug für die Taq-Polymerase 5 - 8 u/µL bei der Pfu-Polymerase 3 u/µL. 1 unit (u) polymerisiert innerhalb 30 min bei 74 °C 10 nmol Nukleotide. Zur Entwicklung von primer- und produktspezifischen PCR-Programmen wurde nach dem Schema in Tab. 46 vorgegangen. Die Annealingtemperatur (Kondensationstemperatur) wurde 5 Kelvin unter der niedrigsten Schmelztemperatur der beteiligten Primer gewählt. Die Schmelztemperaturen lassen sich auf Basis der Nukleotidsequenz mit dem Programm Clone Manager Suite berechnen. Die Elongationszeit ist abhängig vom eingesetzten Enzym und der Produktlänge. 218 Material und Methoden Tab. 46: Schema zur Entwicklung von primer- und produktspezifischen Temperaturprogrammen. Wenn nicht anders beschrieben wurde dieses Schema verwendet. Abschnitt Initiale Denaturierung Denaturierung Annealing Elongation Temperatur 94 °C 94 °C (Smp.[°C]−5) °C 72 °C Terminale Elongation 72 °C Ende 8° C Dauer 2 min 45 s 1 min Taq: (Amplifikatlänge [kb]×1) min Pfu: (Amplifikatlänge [kb]×2) min 7 min ∞ 30x Für die analytische Auswertung der PCR wurden 5 µL aus dem Ansatz für eine Agarosegelelektrophorese (s. 5.5.4.2) eingesetzt. 5.6.1.2 Redirect-PCR Auch die linearen DNA-Abschnitte für die λ-Red vermittelte Rekombination (s. 5.5.5.5) wurden per PCR gewonnen. Für die Bestimmung der Annealingtemperatur nach obigem Schema können die hohen Schmelztemperaturen der etwa 60 nt langen Primer nicht herangezogen werden. Es wurde deshalb ein spezielles Gradientenprogramm (RedirectTemperaturprogramm) gemäß [150] verwendet. Tab. 47: Redirect-Temperaturprogramm mit der Taq-Polymerase. Abschnitt Initiale Denaturierung Denaturierung Annealing Elongation Denaturierung Annealing Elongation Terminale Elongation Ende Temperatur 94 °C 94 °C 50 °C 72 °C 94 °C 55 °C 72 °C 72 °C 8 °C Dauer 2 min 45 s 45 s 90 s 45 s 45 s 90 s 5 min ∞ 10x 15x 5.6.2 DNA-Sequenzierung 5.6.2.1 Ansequenzierung von Plasmiden und Cosmiden DNA-Ansequenzierungen wurden bei der 4base lab GmbH (Reutlingen) in Auftrag gegeben. Grundlage ist das Sanger-Verfahren. Ausgehend von einem Oligonukleotidprimer werden mittels DNA-Polymerase Amplifikate des zu sequenzierenden DNA-Abschnitts synthetisiert. Als Substrate werden dem Enzym neben Desoxynukleotiden auch zum Kettenabbruch 219 Material und Methoden führende, fluoreszenzmarkierte Didesoxynukleotide zur Verfügung gestellt. Es entstehen Produkte unterschiedlicher Länge (bis ca. 900 nt Länge), die per Kapillarelektrophorese aufgetrennt werden. Die basenspezifische Fluoreszenzmarkierung wird vom Sequenzierautomaten detektiert. Das Fluoreszenzchromatogramm und die daraus abgeleitete DNASequenz wurden in digitaler Form erhalten. Die Daten wurden mit den PC-Programmen Clone Manager Suite, DNASTAR Lasergene und Chromas verarbeitet (s. 5.14). Die Qualität der Sequenz und Hinweise auf Problemquellen bei der Sequenzierung konnten aus den Fluoreszenzchromatogramm abgeleitet werden (ein Beispiel findet sich unter 3.3.4.1). Von in Sequenziervektoren subklonierten DNA-Fragmenten konnten durch die Endsequenzierung mit Standardprimern Sequenzlängen von bis zu 900 nt von beiden Enden des Inserts erhalten werden. Standardprimer binden an bekannt DNA-Sequenzen auf den Vektoren, nahe der multiple cloning site (MCS), in welche die Inserts einligiert werden. Eine Übersicht über alle zur Sequenzverarbeitung Internetservices findet sich in Tab. 57. eingesetzten Programme und Standardprimer zur Ansequenzierung Folgende Standardprimer wurden von der Firma 4base lab (Reutlingen) auf Lager gehalten. Im Gegensatz zu Primern eines Primerwalkings (s. 5.6.2.2) entfällt eine kosten- und zeitintensive Spezialsynthese der Oligonukleotide. Besonders häufig wurden die uni- und revPrimer eingesetzt, die auf einer Vielzahl von Sequenziervektoren binden und eine beidseitige Ansequenzierung des Inserts erlauben. Tab. 48: Standardprimer. Primername uni rev pOJ436-F pOJ436-R Nukleotidsequenz 5'-GTAAAACGACGGCCAG-3' 5'-GGCACCCCAGGCTTTACACTT-3' 5'-AGGAAGCAGCCCAGTAGTAG-3' 5'-GAAGATGCGTCGTGCTATCC-3' bindet auf pBSK−, pUC19, pGEM-T Easy, weitere pOJ436 (Cosmidvektor) 5.6.2.2 Primerwalking auf Plasmiden und Cosmiden Durch einen Sequenzierschritt werden jeweils nur Basenabfolgen begrenzter Länge bestimmt. Um größere Bereiche von Plasmiden oder Cosmiden zu sequenzieren sind mehrere Schritte notwendig. Das Aneinanderreihen von Schritten wird Primerwalking genannt. Ausgehend von einem bekannten Sequenzabschnitt etwa 100 bp vor Beginn des unbekannten Bereichs wurde mit dem Programm Clone Manager Suite ein Sequenzierprimer abgeleitet. Dazu wurden die auch für PCR-Primerpaare angegebenen Parameter (s. Tab. 44) gewählt. Das erhaltene Sequenzierergebnis vergrößert den Bereich an bekannter Sequenz. Auf diese Weise können in mehreren Schritten Subklone oder Cosmidabschnitte vollständig sequenziert werden. 220 Material und Methoden 5.6.3 Primerlisten geordnet nach Projekt 5.6.3.1 Amplifikationen S. diastatochromogenes Tü6028 Für PCR-Reaktionen im Rahmen des Projekts zur Inaktivierung von pok-KSα (s. 3.2) wurden folgende Primer verwendet. Resistenzgen Austausch zur Erstellung der Redirect-Kassetten pIJ785Spec / pIJ774Spec Primername aadA-F aadA-R Nukleotidsequenz Temperaturprogramm 5'-GTGCAATACGAATGGCGAAAAGCCGAGCTCAT CGGTCAGCCCGTATTTGCAGTACCAGCG-3' 5'-GCTCAGCCAATCGACTGGCGAGCGGCATCGCA TTCTTCGCTGTAGGCTGGAGCTGCTTC-3' Redirect, s. Tab. 47 Als Matrize der PCR diente die Redirect-Kassette von pIJ778 (s. Tab. 35). Mit dem 1159 bp Produkt lässt sich die Apramycinresistenzkassette anderer Redirect-Kassetten durch das Spectinomycinresistenzgen (aadA) mit Promotor über λ-Red vermittelte Rekombination austauschen. Auf diese Weise wurden die beiden neuen Redirect-Kassetten der Plasmide pIJ785Spec und pIJ774Spec (s. 5.4.2.1) gewonnen. Die unterstrichenen Bereiche zeigen die Bindungsstellen mit der Redirect-Kassette von pIJ778 an. Die Spectinomycinresistenzkassette konnte so in der gleichen Orientierung wie die ursprünglich vorhandene Apramycinresistenzkassette eingebaut werden. Konstruktion des Inaktivierungsplasmids pB-P3,7red per λ-Red-Rekombination Primername P7,3red-F P7,3red-R Nukleotidsequenz Temperaturprogramm 5'-ATGGCCCGAGACGTAGTGATAACGGGTGTCGG CGTCGTCTGTAGGCTGGAGCTGCTTC-3' 5'-GGGACGGGTGAGCACCATCGCGCTCTGGAAGC CGCCGAATCCGCTCCCTTCTCTGACG-3' Redirect, s. Tab. 47 Das Design der Primer erfolgte nach den Vorgaben aus 5.5.5.5, wobei die Variante "tipAp in Leserichtung des Zielgens, spec gegen die Leserichtung" gewählt wurde. Die Bindungsstellen mit der als Matrize dienenden Redirect-Kassette von pIJ785Spec sind unterstrichen. Über die λ-Red vermittelte Rekombination ersetzt das 1694 bp PCR-Produkt fast das komplette pok-KSα-Gen. Screening auf Crossover und Konstruktion des Komplementierungsplasmids Primername P7,3-F P7,3-R Nukleotidsequenz Temperaturprogramm 5'-TGATGGTGCCGCTGGCCATGG-3' 5'-AGCGTTCACTGTTCCGCCCGAC-3' Standard, s. Tab. 46 Für die Anwendung im Rahmen des pok-KSα-Inaktivierungsversuchs "Deletion auf einem 7,3 kb-Clusterfragment" (3.2.1.2) wurden die Primer P7,3-F / -R abgeleitet. Die Amplifikate von Wildtypallel und mutiertem Allel weisen nahezu identische Größen auf, sind aber durch Fehlen einer KpnI-Erkennungsstelle in der Sequenz der Mutante unterscheidbar. Auch für die Konstruktion des Komplementierungskonstrukts pSET-P3,7kompl (s. 5.4.2.2) konnte auf dieses Primerpaar zurückgegriffen werden. 221 Material und Methoden Primername P7,31-F P7,32-R Nukleotidsequenz Temperaturprogramm 5'-CATGGCCCGAGACGTAGTG-3' 5'-CCGGCTCGTACAGGTTGG-3' Standard, s. Tab. 46 Diese Primer wurden alternativ zu P7,3-F / -R eingesetzt. Sie besitzen leicht veränderte Bindungsstellen. Das Amplifikat deckt nur einen Teil von pok-KSα ab. Die Produkte (1133 bp für das Wildtypallel, 1064 bp für das mutierte Allel) unterscheiden sich durch Fehlen einer KpnI-Erkennungsstelle im Produkt der Mutante. Primername P3,7-F P3,7-R Nukleotidsequenz Temperaturprogramm 5'-GCGGTCGTGCCGTGAATG-3' 5'-GCGAGAGTGGCGTTCCAG-3' Standard, s. Tab. 46 Das Primerpaar P3,7-F / -R kam beim erfolgreichen pok-KSα-Inaktivierungsversuch mit der [safe-knock]Strategie zum Einsatz (s. 3.2.2). Die nach Amplifizierung erhaltenen Produkte von 1624 bp (pok-KSαWildtypallel) bzw. 2067 bp (mutiertes pok-KSα-Allel) erlauben die Unterscheidung von Wildtyp, Erst- und Doppelcrossover-Mutante. Überprüfung auf Markerexzision durch Flp-Rekombination Primername P3_7FLP-F P3_7FLP-R Nukleotidsequenz Temperaturprogramm 5'-CGGCAGGGCCTCGTAGCACTTG-3' 5'-GTGCCCGGTCTCGGGTCGAAC-3' Standard, s. Tab. 46 Die Primer P3_7FLP-F / -R dienen zur Überprüfung auf erfolgreiche Flp-Rekombination (s. 5.9). Mit genomischer DNA von S. diastatochromogenes Tü6028 ∆pok-KSα wird ein 3538 bp großes Produkt erwartet, nach Exzision ein 2207 kb großes Produkt. Primername P3_7FLP2-F P3_7FLP2-R Nukleotidsequenz Temperaturprogramm 5'-GTCGTGCCGTGAATGAGG-3' 5'-CGTACTCGGGCAGTTGTC-3' Standard, s. Tab. 46 Mit P3_7FLP2-F / -R wurde eine Alternative zu P3_7FLP-F / -R geschaffen. Die erwarteten Produktgrößen betragen 2273 bp vor und 942 bp nach Exzision. 5.6.3.2 Amplifikationen Glykosyltransferasen-Toolbox Der Code für degenerierte Primer ist im Abkürzungsverzeichnis (s. 7.1) erläutert. Primername genGT-F genGT-R Nukleotidsequenz 5'-CGSTWCGTSCCSTWCAACGG-3' 5'-GTSCCSSCSCCSSCGTGGTG-3' Temperaturprogramm Standard, s. Tab. 46, Annealing: 60 °C Das Primerpaar genGT-F / -R setzt sich aus zwei degenerierten Primern zusammen, die beim ersten Versuch, Abschnitte von Glykosyltransferasegenen auf vorselektierten Cosmiden zu amplifizieren, verwendet wurden (s. 3.1.9.2). 222 Primername P1 (= mGTB2F) P2 (= mGTF1R) Material und Methoden Nukleotidsequenz 5′-AGGTCTGCGGCGCCSCNCAYGCNMG-3′ 5′-GGTGCCGGCGCCNCCRTGRTG-3′ Temperaturprogramm Standard, s. Tab. 46, Annealing: 55 - 60 °C P1 und P2, die letztlich erfolgreichen Primer zur Amplifikation von Glykosyltransferasegenen, entstanden mit der CODEHOP-Strategie (s. 3.1.9.2). Die Degeneration beschränkt sich auf einen Bereich am 3'-Ende. 5.6.3.3 Amplifikationen und Sequenzierungen S. sp. Gö C4/4 Auflistung in Reihenfolge der Unterkapitel von 3.3. Sequenzierung des msc-Contigs Primername Lückenprimer Lcke4R Lcke4aR Lcke5F Lcke4F Lcke3R Lcke2R Lcke1R Lcke3F Lcke2F Lcke1aF Primerwalking L1F Nukleotidsequenz Contigposition 5'-GTGGGTGGCGGGTTCGAG-3' 5'-TCGCGGGCGGCCAACGAG-3' 5'-GCCCTCGGCAGGAACAGCAC-3' 5'-CGGGCCTTCGTCGACCTG-3' 5'-GTCCATGCGGGTCCGGAAAC-3' 5'-GTCCCGATGCCCTTTCACC-3' 5'-CAGCCCTGACCCGGCAAC-3' 5'-AGCTGCGCGATCGTGGAG-3' 5'-CACGGCTCAGGCCATGAAC-3' 5'-GAGACCGCGCCCAGGATG-3' 9666C 9073 12180 12358C 16158 16595C 17774C 17583 40751 40861C 5'-CCGGCGACCATCGCTCTG-3' 43857 Anschlusscosmidscreening 5'-CGGGACGGGAGTCCTGAGGAG-3' Ansch-F 5'-GGCGCGGGTCAGTTCCAGAG-3' Ansch-R 42457 43513C Mit den Lückenprimern wurde gemäß 3.3.2.2 über eine PCR die Lage der msc-Contigs zueinander überprüft. Nur die zur Produktbildung führenden Lückenprimer sind angegeben. Beim Primerwalking spielte der Primer L1F eine wichtige Rolle zur Verbindung des Subcontigs 3,2KB mit der Cosmidvektorsequenz. Für die Begrenzung des msc-Contigs auf der rechten Seite wurden die Cosmide des msc-Contigs über PCR mit den Primern Ansch-F / -R auf Bildung eines 1057 bp Produkts überprüft (s. 3.3.2.3). 223 Material und Methoden Inaktivierung und Expression von Genen des msc-Contigs Konstruktion des Inaktivierungsplasmids p∆msc21 Primername 21red-F 21red-R Nukleotidsequenz PCR-Programm / Pos. 5'-ACGCACACACCGTCCGTCCAGCCATCACATCG AGAGGACATTCCGGGGATCCGTCGACC-3' 5'-AGGAAACCATCGGCGGTCCGTCCCTCAGTCGT TCGCTGCTGTAGGCTGGAGCTGCTTC-3' 21668C Redirect, s. Tab. 47 20538 Das 1490 bp große PCR-Produkt der Primer 21red-F / -R der Redirect-Kassette von pIJ778 wurde für eine λ-Red vermittelte Rekombination zur Konstruktion des Plasmids p∆msc21 eingesetzt (s. 5.4.2.5). Zur Vermeidung negativ transkriptionsbeeinflussender Effekte (= negativer polarer Effekte) auf flankierende Gene wurden die Primer nach der Variante "spec in Leserichtung des Zielgens" (s. 5.5.5.5) zusammengesetzt. Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msc21 Primername Msc21-F Msc21-R Nukleotidsequenz 5'-GCCGGTTCCGTCCGAACGGAG-3' 5'-CTTCCTGGGCCGGATCGAGGG-3' Contigposition 20443 21811C Msc21-F / -R amplifizieren den Bereich von msc21 mit je 100 - 200 bp flankierender Sequenz beidseitig des Gens. Die Größe des entstandenen Produkts wurde zur Differenzierung von Wildtypallel (1369 bp) und mutiertem Allel (1728 bp) herangezogen (s. 3.3.2.4). Konstruktion des Inaktivierungsplasmids p∆msc37 Primername 37red-F 37red-R Nukleotidsequenz PCR-Programm / Pos. 5'-CCCGACGAAACCGTGCCCGTCCTCGTCGCCGG AGCCGGCATTCCGGGGATCCGTCGACC-3' 5'-GACGTTCGGGGAGGTGCGGGATGCCCTGCGGG CTGTTCATGTAGGCTGGAGCTGCTTC-3' 38307 Redirect, s. Tab. 47 39956C Die Primer 37red-F / -R wurden analog zu 21red-F / -R entworfen (s. o.). Das ebenfalls 1490 bp große PCRProdukt der gleichen Kassette diente zur Konstruktion des Plasmids p∆msc37 (s. 5.4.2.5). Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msc37 Primername Msc37-F Msc37-R Nukleotidsequenz 5'-GAGCCCGTCACCATGACCCAG-3' 5'-CTGTCCGGCCTTCGCGTTCTC-3' Contigposition 38208 40025C Die Msc37-F / -R-Amplifikatgröße des Bereichs von msc21 mit je etwa 100 bp flankierender Sequenz beidseitig des Gens ermöglichte die Unterscheidung zwischen Wildtypallel (1818 bp) und mutiertem Allel (1658 bp) (s. 3.3.2.4). 224 Material und Methoden Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msc15 (=∆mscKSβ) Primername KS2_1 KS2_2 Nukleotidsequenz 5'-AGTCGAGGATCCGGCACTCGC-3' 5'-TTGGCGCTCGAGAGTGGTTTC-3' Contigposition 14147C 12573 Mit den Primern KS2_1 und KS2_2 wird ein 1,6 kb großer, msc15 enthaltender, Sequenzabschnitt amplifiziert. Da sich die Produktgrößen von Wildtypallel und mutiertem Allel nur geringfügig von einander unterscheiden, wurde eine Restriktionsanalyse nachgeschaltet (s. 3.3.2.5). Überexpression der Regulatorgene msc24 und msc30 Primername Msc24EcoXba-F Msc24EcoXba-R Msc30EcoXba-F Msc30EcoXba-R Nukleotidsequenz 5'-ATTCTAGACGCGTTGCAGAGG-3' 5'-TAGCAATTGTTGGGCCGACAGC-3' 5'-GATCTAGAGTGGGCGCCTGTCG-3' 5'-GAGAATTCGCCCGTAGCCCATC-3' Contigposition 23345 24274C 28188 29144C Eine gezielte Amplifizierung der Gene msc24 und msc30 inklusive ihrer vorhergesagten Ribosomenbindungsstellen wurde durch die Primerpaare Msc24EcoXba-F / -R bzw. Msc30EcoXba-F / -R möglich. Für die Insertion in den Expressionsvektor pSET mit ermE-up-Promotor wurden am 5'-Ende Endonukleaseerkennungsstellen in die Sequenz integriert. Diese sind unterstrichen. XbaI: TCTAGA; MunI: CAATTG; EcoRI: GAATTC. PCR-basiertes Screening auf PKS II Cluster Primername KSa-F KSa-R Nukleotidsequenz Annealingtemperatur 5'-TSGCSTGCTTCGAYGCSATC-3' 5'-TGGAANCCGCCGAABCCGCT-3' 55 °C Die degenerierten Primer KSa-F / -R erlauben durch Bindung an hochkonservierte Sequenzabschnitte die Teilamplifizierung von (unbekannten) ksα-Genen (s. 3.3.3). Der Code für degenerierte Primer ist unter 7.1 erläutert. Sequenzierung des mec-Contigs Primername Primerwalking G2B4,2-R2 G2Hyd-F1 G2Hyd-R1 G2L1-R5 G2L1-R4 KSaG2-R5 G2L1-R3 G2L1-R2 G2L1-F2 KSaG2-R3 Nukleotidsequenz Contigposition 5'-GCTGCACAGACACCAGGAG-3' 5'-ACGTCCGGATCACCGGCAAG-3' 5'-GTCGCCAGCAGGGTGGTCAG-3' 5'-GATGGCGGGCACCGCATGAC-3' 5'-GAGGGTCCGCGCCGGTCCTC-3' 5'-GTGCGGGTGCGGGGACGG-3' 5'-TGTCGGCCGGATCGGCTG-3' 5'-CGGCACAGCCGGGTGGTGTC-3' 5'-ACATCGTGGTGCGGCTGGTC-3' 5'-TGGTCATGAGCGGACCTGAG-3' 877C 1356 2184C 2263C 2532C 2766C, 4021C 2747C 3346C 3724 4522C 225 Material und Methoden Primername Primerwalking KSaG2-R1 KSaG2-R2 KSaG2-F2 KSaG2-F1 KSaG2-F3 KSaG2-F4 KSaG2-F5 KSaG2-F6 KSaG2-F7 C12Not7-R2 C12Not7-R1 C12Not4-R1 Nukleotidsequenz Contigposition 5'-TGGGCCGGGTCGTCGTTGTC-3' 5'-CCCTCGCCCATGACGAACCC-3' 5'-TCCCGCCCACCGCGAACTAC-3' 5'-TCGCCCGTGAGCGGAAGCTG-3' 5'-ACCGACGCCGCGCCGTTCTC-3' 5'-CTCGGCTACGAGGAGCTGAG-3' 5'-CGACGTCTGCCACGACCTC-3' 5'-TCCTGTGGGAGTACGAGAAG-3' 5'-CCGGGCCATCAGCGAACG-3' 5'-AGCATGACCCGCAGGCTGAC-3' 5'-GCGACTGCCGCGAGGCCGTCC-3' 5'-ACCGAGGCCGGTCAGCACAG-3' 5183C 5234C 5618 5681 6075 6402 6893 7637 8101 8375C 8611C 9400 Die Primer sind in der Reihenfolge der Contigstrategie des mec-Cluster (s. Abb. 68) angegeben. Ebenfalls zum Einsatz kamen die Standardprimer uni und rev (s. 5.6.2.1). Ansequenzierte PCR-Produkte des mec-Contigs PCR-Produkt L1 L1a L2 eingesetzte Primer uni + aG2-R4 uni + G2L1-R5 KSaG2-F6 + C12Not7-R1 Produktgröße (laut Agarosegel) 2,1 kb 0,3 kb 1 kb Primername KSaG2-R4 Nukleotidsequenz Contigposition 4091C 5'-CGATGCCGGGATGGCGATTG-3' Für die Erstellung der ansequenzierten PCR-Produkte konnte auf die Sequenzierprimer des Primerwalkings zurückgegriffen werden. Bisher noch nicht erwähnt wurde der Primer KSaG2-R4. Inaktivierung von Genen des mec-Contigs Konstruktion des Inaktivierungsplasmids p∆mecIII Primername Nukleotidsequenz PCR-Programm / Pos. C12KSAred-F 5'-CTGGACGCGGAGCTGGTCGCCCGCTGCGACCG GTACATCTGTAGGCTGGAGCTGCTTC-3' 5'-TGACGGCGGCCGTCTCGTGCCGGTCGTTCTGC TTGGTGCATTCCGGGGATCCGTCGACC-3' 4699 Redirect, s. Tab. 47 5488C C12KSAred-R Das Primerpaar führt mit der Redirect-Kassette von pIJ774Spec als Matrize zu einem 1484 bp Produkt, das anschließend zur Erstellung des Inaktivierungsplasmids p∆mecIII (s. 5.4.2.5) per λ-Red vermittelter Rekombination eingesetzt wurde. Die Primer wurden nach der Variante "spec gegen die Leserichtung des Zielgens" (s. 5.5.5.5) abgeleitet. 226 Material und Methoden Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆mecIII (=∆mecKSα) Primername C12KSA-F C12KSA-R Nukleotidsequenz 5'-CTGGACGCGGAGCTGGTCGC-3' 5'-GCGGACTGGAACCCGCCGAAC-3' Contigposition 10183 11231C Es wird ein internes Fragment des Gens mecIII amplifiziert. Da die Primer außerhalb des in der Mutante ersetzten Sequenzbereichs binden, sind sowohl für Wildtypallel (1050 bp) als auch das mutierte Allel (1744 bp) PCR-Produkte zu erwarten. Inaktivierung von Genen des msn-Contigs Konstruktion des Inaktivierungsplasmids p∆msnK1 Primername C7KSAred-F C7KSAred-R Nukleotidsequenz PCR-Programm / Pos. 5'-CCAATCCACCGCAAGAAGGAAGCGAAGAC ATGCACATGATGTAGGCTGGAGCTGCTTC-3' 5'-CCAGGCCGCTCTCGGTGACCGCCTCGCGG GCGGCGACCAATTCCGGGGATCCGTCGACC-3' 16351C Redirect, s. Tab. 47 16023 Design und Funktion des Primerpaars sind analog zu C12KSAred-F / -R (s. o.), bezogen auf das Gen msnK1. Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msnK1 Primername C7KSA-F C7KSA-R Nukleotidsequenz 5'-GACCAATCCACCGCAAGAAGG-3' 5'-CCAGGCCGCTCTCGGTGACC-3' Contigposition 16353C 16023 Ein internes Fragment des Gens msnK1 wird amplifiziert. Die PCR-Produkte von Wildtypallel (331 bp) und mutiertem Allel (1486 bp) können anhand ihrer Größe differenziert werden (s. 3.3.5.2). Konstruktion des Inaktivierungsplasmids p∆msnO11C2 Primername C7KRred-F C7KRred-R Nukleotidsequenz PCR-Programm / Pos. 5'-TACTCGACGCCCGAGGAGGTGGCCGGCCTAG TGACCTATTGTAGGCTGGAGCTGCTTC-3' 5'-TCGACCTCGCGCGATGCCGATTCGCTCATCC GGTCGTCTATTCCGGGGATCCGTCGACC-3' 25549 Redirect, s. Tab. 47 25748C Design und Funktion des Primerpaars sind analog zu C12KSAred-F / -R (s. o.), bezogen auf einen Sequenzabschnitt der Teile der Gene msnO11 und msnC2 beinhaltet. 227 Material und Methoden Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msnO11C2 Primername C7KR-F C7KR-R Nukleotidsequenz 5'-CGAGGGCTACCGCGTCTAC-3' 5'-GCGGGAGGTCCAGGTCTTC-3' Contigposition 24957 25929C Das Primerpaar bindet außerhalb des durch die ∆msnO11C2-Mutation betroffenen Bereichs. Die PCR mit genomischer DNA der Mutante führt einem 2258 bp Produkt, wohingegen beim Wildtyp ein 974 bp großes Produkt erwartet wird. Primer zur Sequenzierung der msn-Contigerweiterung Primername Primerwalking Met-R1 C7Bgl6a-F1 Met-F1 C7Bgl6a-F2 G3AK-F1 G3S2,7-R1 G3S2,7-R2 G3S3,5-F1 G3S3,5-F2 G3S3,5-F3 Nukleotidsequenz Contigposition 5'-GAAGATGCGTCGTGCTATCC-3' 5'-ATGAGGTCGAGAGCGGTCTG-3' 5'-TGGAGCCGCTGGGCATCGAC-3' 5'-TGGCGGAACGGGACGGTCTG-3' 5'-GGAGGCCGTCGATCCCACAG-3' 5'-CGGGTGGCGAGGGCCTCACG-3' 5'-GTCGCTCGGTCCATCCAGTG-3' 5'-TGGACCTGCGTGGTGAGATG-3' 5'-ACCGTTCCGTCGGCGTGGTC-3' 5'-CCCAGCCGTGACCAGCAAC-3' 36861C 36686 37844C 37484 38727C 38444 38834 42734 43436 44020 Die Primer sind in der Reihenfolge von Abb. 80 angegeben. Durch eine große Anzahl von Subklonen in diesem Bereich konnten auch viele Sequenzdaten aus der Subklonansequenzierung mit den Standardprimern uni und rev (s. 5.6.2.1) verwendet werden. 5.7 Gentransfer in Saccharothrix spp. und Streptomyces spp. 5.7.1 Protoplastentransformation Die Zellwand von Vertretern der Gram+ Gattungen Saccharothrix und Streptomyces stellt eine Barriere für die Aufnahme von DNA dar. Bei der Protoplastentransformation wird diese Barriere vor dem DNA-Transfer abgebaut [66]. Der sukzessive Abbau der Zellwand erfolgt durch Inkubation mit Lysozym, was zur Freisetzung der Protoplasten aus dem Myzelverbund führt. Diese können PEG-vermittelt Fremd-DNA aufnehmen. Unmittelbar nach der DNATransformation müssen die Protoplasten auf Regenerationsmedium (R2YE) ausgebracht und durch Überdecken mit isotonischem Medium (R3-Weichagar) geschützt werden, damit der Wiederaufbau der Zellwand erfolgen kann. Schließlich erfolgt die Selektion durch Überschichten mit antibiotikahaltigem Medium (NB-Weichagar). Verwendete Lösungen und Nährmedien sind in Tab. 23 bzw. Tab. 27 beschrieben. 228 Material und Methoden Protoplastierung Als Vorkultur für die Protoplastierung wurden 100 mL HA-Flüssigmedium mit 1 cm2 einer Kulturplatte des Rezipientenstammes inokuliert und für 24 h unter Standardbedingungen (s. 5.3.1.4) kultiviert. 1 mL der Vorkultur dienten als Inokulum für 100 mL TSB+-Medium als Hauptkultur. Diese Kultur wurde geerntet, sobald ausreichend Biomasse von feingriesiger Beschaffenheit gewachsen war (in der Regel nach 18 - 24 h). Die Ernte erfolgte durch Aufteilen der Kultur auf zwei 50 mL Falcontubes und dem Pelletieren des Myzels durch Zentrifugation (4 °C, 5000 rpm, 5 min). Die Pellets wurden in je 20 mL eiskaltem P-Puffer durch kurzes Vortexen aufgeschwemmt, erneut pelletiert und dekantiert. Die Zellwandlyse wurde durch sanftes Resuspendieren der Pellets in je 10 mL lysozymhaltigem P-Puffer gestartet. Es wurden mehrere Ansätze parallel bearbeitet, die sich durch Lysozymkonzentration (2 - 3 mg/mL) und Inkubationstemperatur (29 - 35 °C) von einander unterschieden. Der Fortschritt der Protoplastierung wurde alle 10 min lichtmikroskopisch bei 500-facher Vergrößerung verfolgt. Als Idealsbedingung für S. diastatochromogenes Tü6028 stellten sich 2 mg/mL Lysozym bei 29 °C und 30 min Inkubation heraus. Nach der gelungenen Zellwandlyse sind im Mikroskop vor allem einzeln vorliegende, runde Protoplasten sichtbar. Mit 20 mL eiskaltem P-Puffer wurde die Lyse gestoppt und verbleibende Myzelreste durch Filtration durch sterile Watte entfernt. Die Protoplasten wurden durch vorsichtige Zentrifugation (4 °C, 3200 rpm, 5 min) aus dem Filtrat sedimentiert und in 0,8 bis 1,5 mL eiskaltem P-Puffer aufgenommen. In 200 µL Aliquots wurden die Protoplasten bei −86 °C gelagert. Die Qualität der Charge wurde durch Kontrollansätze parallel zur Protoplastentransformation (s. u.) überprüft. Als Negativkontrolle wurde ein Aliquot vor der Inkubation mit 1 mL H2Obidest gemischt. In der entstandenen hypotonen Umgebung kam es zum Platzen der Protoplasten, so dass keine oder nur sehr wenige Kolonien erwartet wurden. Vermehrtes Wachstum hingegen wäre ein Indikator für die Anwesenheit von Zellen mit intakter Zellwand. Ein weiteres Aliquot diente zur Überprüfung der Regenerationsfähigkeit der Protoplasten. Dieses wurde vor der Inkubation in 1 mL P-Puffer resuspendiert. Hier wurde Wachstum in Form eines dichten Rasens erwartet. Protoplastentransformation Methylierte Fremd-DNA wird von Actinomycetales-Arten durch Restriktion abgebaut. Für die Protoplastentransformation wurde deshalb ausschließlich DNA aus dem methylierungsdefizienten E. coli ET12567 (s. Tab. 33) eingesetzt. 10 - 20 µg in maximal 30 µL H2Obidest wurden mit 500 µL eiskaltem T-Puffer und 200 µL Protoplastenaliquot sanft durch einmaliges Auf- und Abpipettieren mit einer abgeschnittenen Pipettenspitze gemischt. Der Transformationsansatz wurde gleichmäßig auf zwei vorgewärmten R2YE-Platten verteilt und mit je 5 mL R3-Weichagar überschichtet. Material und Methoden 229 Selektion Nach einer Inkubationszeit von 12 - 16 h (28 °C) wurden die Agarplatten mit je 3 mL NBWeichagar überschichtet, der ein dem eingebrachten Konstrukt entsprechendes Antibiotikum enthielt. Das Antibiotikum im NB-Weichagar wurde so konzentriert eingesetzt, dass sich bezogen auf das Gesamtvolumen der Platte eine Standardkonzentration (s. Tab. 28) ergab. Nach fünf bis sieben Tage kam es in der Weichagarschicht zum Wachstum von weißen, kugelförmigen Kolonien mit etwa 1 mm Durchmesser (10 - 30 Kolonien pro Platte). Unter dem Lichtmikroskop ließ sich die Myzelstruktur der Transformanten erkennen. Einige Transformanten wurden zur Verifizierung der Resistenz auf antibiotikahaltige HA-Agar überimpft und anschließend weiter untersucht. 5.7.2 Intergenerische Konjugation DNA kann mittels intergenerischer Konjugation von einem E. coli Donorstamm in einen Actinomycetales Stamm als Rezipienten transferiert werden. Die Befähigung zum DNATransfer erhält der Donorstamm durch das Konjugationssystem des Plasmids RP4. Wegen geringer Rezipentienspezifität ermöglichen die Mobilisierungsfaktoren dieses Plasmids auch der DNA-Transfer von E. coli auf nur entfernt verwandte Spezies der Gattungen Saccharothrix und Streptomyces [428]. Das zu übertragende Plasmid muss das RP4 origin of transfer (oriT) enthalten. Als Donor wurde der methylierungsdefiziente Stamm E. coli ET12567 (s. Tab. 33) eingesetzt, der mit dem Plasmid pUZ8002 ein sich selbst nicht transferierendes RP4-Derivat enthält [429]. Vorbereitung des E. coli-Donorstamms Das zu übertragende Plasmid wurde mittels Hitzeschocktransformation (s. 5.5.1.1) in CaCl2kompetente E. coli ET12567 Zellen mit dem Plasmid pUZ8002 eingebracht. Die Selektion von Transformanten erfolgte mit Kanamycin auf Anwesenheit von pUZ8002, sowie einem dem zusätzlich eingebrachten Plasmid entsprechenden Antibiotikum. Ein einzelner Transformant wurde auf LB-Agar ausgestrichen und unter Selektionsdruck angezogen. Für einen dichten E. coli-Bewuchs wurde nach 24 h ein Abstrich der Platte flächig auf eine frische LB-Platte ausgestrichen und bis zur Konjugation 14 - 16 h bei 37 °C inkubiert. Je die Hälfte der E. coli-Biomasse einer dicht bewachsenen Platte (∅ = 9 cm) wurde pro Konjugationsansatz mit einer Impföse abgenommen. 230 Material und Methoden Vorbereitung des Actinomycetales Rezipienten-Stammes Rezipientenvorbereitung ausgehend von Myzel Mit 5 mL einer Saccharosedauerkultur (s. 5.3.1.4) oder 1 cm2 einer flächig bewachsenen Agarplatte wurden in einem 300 mL Erlenmeyerkolben mit zwei Schikanen und einer Edelstahlspiralfeder 100 mL HA-Flüssigmedium (nur für Saccharothrix espanaensis: TSBFlüssigmedium) angeimpft und bei 28 °C auf dem Rundschüttler (180 rpm) inkubiert. Die Edelstahlfeder zerkleinert während des Schüttelns die Myzelverbände und führte so einer vergrößerten, für die Konjugation zur Verfügung stehenden Oberfläche. Der richtige Zeitpunkt für die Konjugation war erreicht, wenn das feine Myzel so dicht gewachsen war, dass sich auch nach 30 s Stillstand der Kultur durch Sedimentation kein klarer Überstand bildete. Dieser Zeitpunkt war in der Regel nach 24 - 48 h erreicht. Je Konjugationsansatz wurden 1 - 2 mL Kultur durch Zentrifugieren (20 °C, 5000 rpm, 5 min) pelletiert. Die Zellen wurden in 1 mL frischem Kulturmedium resuspendiert und repelletiert. Dieser Waschvorgang dient der Abtrennung von Sekundärstoffen, die sich negativ auf die Konjugationseffizienz auswirken können. Nach dem Dekantieren wurde das Pellet mit 200 µL HA- bzw. TSBFlüssigmedium versetzt. Rezipientenvorbereitung ausgehend von Sporen Die Methode wurde nur bei einigen Konjugationsversuchen mit S. diastatochromogenes Tü6028 angewandt. Eine maximal zwei Wochen alte, dicht mit Sporen bedeckte Kultur des Stammes auf einer Agarplatte diente als Basis für die Sporensuspension. Durch Versetzen mit 4 mL HA-Flüssigmedium und anschließendem, vorsichtigen Schaben mit der Impföse gelang es, die hydrophoben Sporen in Suspension zu bringen. Alternativ kann dem Medium zur Verbesserung der Suspendierbarkeit auch eine geringe Menge an Detergenz zugesetzt werden. Die Sporensuspension wurde von der Platte abgesaugt, mit HA-Flüssigmedium auf 8 mL ergänzt und in einen sterilen 100 mL Erlenmeyerkolben überführt. Dieser wurde für 10 min bei 50 °C im Wasserbad und danach bei 28 °C für 3 - 4 h auf dem Rundschüttler (180 rpm) inkubiert. Die Suspension wurde verteilt auf zwei Reaktionsgefäße sukzessive pelletiert (20 °C, 14000 rpm, 10 min). Nach dem Abnehmen des Überstandes wurde das Pellet mit 200 µL HA-Medium versetzt. Konjugation und Selektion Für einen Konjugationsansatz wurden die in 200 µL Medium aufgenommen Rezipientenzellen mit den von der Kulturplatte abgenommen E. coli-Donorzellen mit Hilfe einer Impföse innig vermengt bis sich eine homogene Masse bildete. Weitere 200 µL des Flüssigmediums wurden ergänzt und der Ansatz auf eine zwei Tage bei 28 °C vorgewärmte und getrocknete MS-Agarplatte überführt. Unter dem laminaren Luftstrom der Sterilbank wurde die geöffnete Material und Methoden 231 Platte getrocknet bis keine Flüssigkeit mehr sichtbar war (5 - 10 min). Die auf der Agaroberfläche liegenden Zellen wurden nun mit einem Drigalski-Spatel intensiv auf der Platte verrieben bis diese eine homogene, trockene Oberfläche aufwies. Bis zum Überschichten der Platten mit antibiotikahaltigem Flüssigmedium wurde je nach Rezipient 9 - 20 h bei 28 °C inkubiert (s. Tab. 49). Überschichtet wurden die Platten (∅ = 9 cm, Agarvolumen ca. 25 mL) mit 1 mg - 2 mg Selektionsantibiotikum (Plasmidmarker) und 6,5 mg Phosphomycin gelöst in 1 mL Kulturmedium. Durch vorsichtiges Schwenken wurde die vollständige Benetzung der Plattenoberfäche sichergestellt. Es wurde weiter bei 28 °C inkubiert. Nach 5 - 10 Tagen konnte bei einer erfolgreichen Konjugation das Wachstum von Konjuganten festgestellt werden. Die Klone wurden zur Überprüfung ihres Resistenzverhaltens auf antibiotikahaltige HA-Platten (nur Saccharothrix espanaensis: TSB-Platten) überimpft. Tab. 49: Überschichtungszeiten und Besonderheiten der unterschiedlichen Rezipientenstämme. Rezipientenstamm Saccharothrix espanaensis Streptomyces albus Streptomyces diastatochromogenes Tü6028 Streptomyces sp. Gö C4/4 ÜberBesonderheit schichtung 12 - 14 h Sehr effektiver Transfer. Die Konjuganten sind gelb. 9 - 11 h Schon nach 2 Tagen sind Konjuganten als stecknadelgroße, weiße Punkte auf der Konjugationsplatte erkennbar. 20 h Auch das Konjugationsprotokoll ausgehend von Rezipientensporen war erfolgreich. 16 h Eine erfolgreiche Konjugation ist zu erwarten, wenn das beginnende Wachstums des Stammes zum Zeitpunkt des Überschichtens gerade so weit fortgeschritten ist, dass sich die Oberfläche der Platte gleichmäßig hellbraun gefärbt hat. Konjuganten sondern einen braunen Farbstoff ins Medium ab, der zu charakteristischen "Produktionshöfen" um die Kolonien führt (vgl. 3.3.1). Negativ und Positivkontrolle Negativ- und Positivkrontrollen wurden parallel zu den Konjugationsansätzen durchgeführt. Bei ansonsten identischen Bedingungen wurde für die Negativkontrolle kein Donorstamm eingesetzt, für die Positivkontrolle ein Donorstamm mit dem integrativen Plasmid pSET152 (s. 5.4.1). Nach dem Überschichten wurde bei der Negativkontrolle kein Wachstum erwartet. Eventuelle Koloniebildung wäre auf die Bildung von spontanen Resistenzen oder einer Kontamination zurückzuführen. Mit dem integrativen Plasmid der Positivkontrolle ist es möglich mit allen eingesetzten Rezipientenstämmen unter den gefundenen Idealbedingungen eine mit Konjuganten überwucherte Konjugationsplatte zu erhalten. 232 5.8 Material und Methoden Geninaktivierung in Streptomyces spp. 5.8.1 Klassische Strategien der gezielten Geninaktivierung Alle zurzeit etablierten Strategien für die gezielte Geninaktivierung in Streptomyces spp. basieren auf demselben Prinzip: Zunächst wird ein künstliches, nicht funktionelles Allel des zu inaktivierenden Gens erstellt. Dieses nicht funktionelle Allel wird in das Bakterium eingebracht. Die Rekombination der eingebrachten DNA mit der chromosomalen DNA des Bakteriums an homologen Bereichen führt zur Inaktivierung des entsprechenden Gens. Bei den Methoden 5.8.1.2 und 5.8.1.3 kommt es dabei zum Austausch des Wildtypallels gegen das künstliche Allel. Weitergehende Informationen zu den klassischen Inaktivierungsstrategien finden sich in [66;430]. 5.8.1.1 Insertionsmutagenese mit internem Fragment Bei der Insertionsmutagenese wird mittels PCR oder Restriktion ein internes Fragment des zu inaktivierenden Gens gewonnen, das weder Start- noch Stoppcodon besitzt. Auf einem im Zielorganismus nicht replikativen Vektor mit Resistenzkassette wird dieses nicht funktionelle Allel in das Bakterium eingebracht. Nach dem ersten CrossoverEreignis und Integration des Plasmids in das Chromosom liegen zwei nicht funktionelle Kopien des zu inaktivierenden Gens vor Abb. 101: Der blauen Kopie fehlt das Stoppcodon, der roten Kopie das Startcodon. Chromosom ATG TGA ATG TGA Plasmid apra Abb. 101: Erstes Crossover-Ereignis zwischen chromosomaler DNA (oben) und nicht funktionellem Allel des Plasmids (unten). ATG: Startcodon; TGA: Stoppcodon; apra: Apramycinresistenzkassette. Bereits mit dem ersten Crossover liegt die endgültige Mutante vor. Die entstandene Insertionsmutante hat den Inaktivierungsvektor in ihr Chromosom insertiert und hat damit auch dessen Resistenz erworben. Sie ist jedoch instabil: Während der Kultivierung entstehen durch eine zweite homologe Rekombination Doppelcrossover-Mutanten mit Wildtypallel. Diese müssen durch Antibiotikazugabe abgetötet werden. Da für die effiziente homologe Rekombination DNA-Bereiche von > 1 kb Länge vorliegen sollten, ist die Inaktivierung mittels internem Fragment nur bei längeren Genen anwendbar. 233 Material und Methoden 5.8.1.2 Integration einer Resistenzkassette Für die Erstellung des Inaktivierungskonstrukts wird eine Resistenzkassette (Abb. 102: spec) in oder anstelle des zu inaktivierenden Gens in einen größeren (ca. 3 - 7 kb großen) subklonierten Bereich aus dem Genom des Zielorganismus eingefügt. Auf einem im Zielorganismus nicht replikativen Vektor mit Resistenzkassette (Abb. 102: apra) wird das nicht funktionelle Allel in das Bakterium eingebracht. Nach dem ersten Crossover-Ereignis und der Integration des Plasmids in das Chromosom liegen eine nicht funktionelle Kopie (im blauen Bereich) sowie das Wildtypallel (im roten Bereich) des zu inaktivierenden Gens vor. Chromosom Xb Xa spec Plasmid apra Abb. 102: Erstes Crossover-Ereignis zwischen chromosomaler DNA (oben) und homologem Bereich auf dem Plasmid (unten). Xa, Xb: mögliche zweite Crossover; apra, spec: Apramycin bzw. Spectinomycinresistenzkassette. Für die Generierung einer Knockout-Mutante ist eine zweite homologe Rekombination (zweites Crossover) notwendig, bei der der Vektor wieder aus dem Bakterienchromosom entfernt wird und das nicht funktionelle Allel verbleibt. Das zweite Crossover-Ereignis kann entweder in den Bereichen von Xa oder Xb stattfinden. Nur bei Xb wird die gewünschte Mutante mit integrierter spec erhalten. Xa führt zurück zum Wildtyp, kann aber durch Selektion mit Spectinomycin ausgeschlossen werden. Durch Integration einer Resistenzkassette entstehen sehr stabile Mutanten. Eventuell kommt es durch polare Effekte bei nachgeschalteten Genen des gleichen Operons zu deren Minderexpression. 5.8.1.3 Frameshift-Mutation und Deletion Weitere Möglichkeiten für die Erstellung eines nicht funktionellen Allels sind die Frameshift-Mutation des Genleserahmens oder die Deletion eines internen Bereichs des Gens. Eine Leserahmenverschiebung kann herbeigeführt werden indem ein Subklon chromosomaler DNA an einer singulär, nur im Zielgen vorkommenden Schnittstelle geöffnet wird. Das verwendete Enzym muss zum Entstehen von "klebrigen Enden" führen, deren Nukleotidüberhänge anschließend aufgefüllt bzw. entfernt werden. Die entstehenden "glatten Enden" werden religiert. Chromosom Xa v Xb Plasmid apra Abb. 103: Erstes Crossover-Ereignis zwischen chromosomaler DNA (oben) und homologem Bereich auf dem Plasmid (unten). Xa, Xb: mögliche Bereiche des zweiten Crossovers; apra: Apramycinresistenzkassette; V: verändertes Gen. 234 Material und Methoden Zur Realisierung einer Deletion wird ein internes Fragment per Restriktion und Religation aus dem Zielgen entfernt. Wie auch bei 5.8.1.2 hat der verwendete Subklon ein Insertlänge von 3 - 7 kb, wobei das zu inaktivierende Gen in der Mitte liegt. Auf einem im Zielorganismus nicht replikativen Vektor wird das veränderte Insert in die Streptomyces sp. eingebracht. Die Erstcrossover-Mutante (s. Abb. 103) ist apramycinresistent und trägt noch das intakte Wildtypallel. Erst nach dem zweiten Crossover Xb wird die gewünschte Knockout-Mutante erhalten. Xa führt zurück zum Wildtyp. Die Doppelcrossover-Mutanten sind stabil. Polare Effekte sind nicht zu erwarten. Die Selektion zwischen Klonen dem zweiten Crossover-Ereignis zur Mutante (Xb) und zum Wildtyp (Xa) ist oft zeitintensiv und unsicher (vgl. 3.2.1.2). 5.8.2 Die [safe-knock]-Strategie 5.8.2.1 Strategie der [safe-knock]-Inaktivierung Die [safe-knock]-Strategie basiert auf der Methode zur Inaktivierung durch Integration einer Resistenzkassette (s. 5.8.1.2). Es wurden multifunktionelle Redirect-Kassetten [150] eingesetzt. Neben einem Resistenzgen tragen diese auch das für die intergenerische Konjugation (s. 5.7.2) notwendige oriT sowie zwei flankierende FRT- oder loxP-sites zur sequenzspezifischen Rekombination (s. 5.9). Ein Schema zur Konstruktion eines Inaktivierungsplasmids mit der [safe-knock]-Strategie ist unter 3.2.2 (Abb. 46) abgebildet. Ein detailliertes Protokoll zur Konstruktion des Inaktivierungsplasmids sowie die Schritte vom Inaktivierungsplasmid zur bestätigten Doppelcrossover-Mutante sind in den folgenden Kapiteln beschrieben. Als Ausgangspunkt dient ein Subklon auf Basis eines üblichen Sequenzier- oder Kloniervektors (mit Carbenicillinresistenzkassette), der den entsprechenden Clusterbereich abdeckt. Eine Redirect-Kassette ersetzt im ersten Schritt mittels λ-Red vermittelter Rekombination den ausgewählten Bereich des Clusterfragments (s. 5.8.2.3). Bei dem in die Clustersequenz eingebrachten Selektionsmarker handelte es sich in dieser Arbeit stets um ein Spectinomycinresistenzgen; die Vielfalt von Redirect-Kassetten [151] erlaubt auch die Wahl anderer Marker. Im zweiten und letzten Schritt der Plasmidkonstruktion wird über Ligation in die MCS ein weiterer für Streptomyces spp. geeigneter Selektionsmarker (in dieser Arbeit stets apra) eingebracht, der die Vektorresistenz vermittelt (s. 5.8.2.4). Das bereits auf dem Kloniervektor vorliegende Carbenicillinresistenzgen kann nicht zur Selektion herangezogen werden, da Bakterien der Gattung Streptomyces natürlicherweise schon über eine β-Lactamase verfügen [431]. Material und Methoden 235 5.8.2.2 Der geeignete Subklon Der geeignete Subklon (vgl. 5.5.5.2) bestand aus einem 3 kb bis 8 kb langen Fragment genomischer DNA, ligiert in einen üblichen Sequenzier- / Kloniervektor. Bewährt haben sich Vertreter der pBluescript II-Familie von Stratagene sowie pUC18 / pUC19 (s. Tab. 35). Die Nukleotidsequenz des Vektors muss bekannt sein, damit eine ungewollte λ-Red vermittelte Rekombination schon beim Primerdesign ausgeschlossen werden kann. Die MCS des Vektors muss über eine HindIII-Erkennungsstelle verfügen, die gleichzeitig die einzige HindIIIErkennungsstelle des gesamten Subklons ist (vgl. 5.8.2.4). In den bisherigen Anwendungen stellte dies kein Problem dar, da HindIII-Erkennungsstellen (Nukleotidsequenz: AAGCTT) in G+C-reichen Genomen selten sind. So ist in keinem der vier bearbeiteten Gencluster (pok, msc, mec, msn) eine HindIII-Schnittstelle vorhanden. Die gegen die Redirect-Kassette auszutauschende Sequenz sollte möglichst genau in der Mitte des Inserts liegen, da die homologe Rekombination mit größerer Wahrscheinlichkeit auf dem längeren der beiden die Redirect-Kassette flankierenden Genclusterabschnitten stattfindet. Bei einem zu großen Längenunterschied der beiden Abschnitte ist davon auszugehen, dass sowohl das erste als auch das zweite Crossover-Ereignis auf der bevorzugt gleichen Seite stattfinden und so die Bildung der Knockout-Mutante erschwert wird. 5.8.2.3 Primerdesign und λ-Red-Rekombination Beidseitig des gegen die Kassette auszutauschenden Bereichs wurden gemäß 5.5.5.5 Primer abgeleitet und eine PCR mit der einzubringenden Redirect-Kassette als Matrize durchgeführt. Bei der Auswahl der Primer wurde darauf geachtet, dass das modifizierte Plasmid nach dem Austausch eine andere Größe hat als das ursprüngliche. Dies ist für die Trennung per Gelelektrophorese (s. u.) von Bedeutung. Nach der λ-Red-Rekombination (s. 5.5.5.5) wurden 2 - 3 große Kolonien, die die von der eingebrachten Kassette vermittelte Resistenz erworben hatten, für die Plasmidisolierung (s. 5.5.2.1) ausgewählt und per Kontrollrestriktion (s. 5.5.4.1) überprüft. Lagen deutlich größere Mengen des ursprünglichen Subklons im Vergleich zum modifizierten Plasmid vor, wurde das Plasmidgemisch in E. coli XL1blue retransformiert (s. 5.5.1.1) und mit Spectinomycin (Redirect-Kassette) selektiert. Ausgehend von einer großen Kolonie wurde die Plasmidisolierung und Kontrollrestriktion wiederholt. Wenn das modifizierte Plasmid im Plasmidgemisch überwiegt wurde eine präparative KpnIRestriktion angesetzt und das Fragment mit der Größe des modifizierten Plasmids über eine präparative Gelelektrophorese (s. 5.5.4.2) isoliert. 5.8.2.4 Einfügen der Apramycinresistenzkassette Als Marker für die Vektorresistenz wurde dass Apramycinresistenzgen gewählt. Die Doppelcrossover-Mutante verliert den Marker des Vektors wieder und kann deshalb als Wirt für die heterologe Expression von pOJ436 (mit apra, s. Tab. 35) basierten Cosmiden eingesetzt werden. Das Resistenzgen mit vorgeschaltetem Promotor wurde durch HindIII- 236 Material und Methoden Restriktion als 1,7 kb großes Fragment aus dem Vektor pHPΩ45aac (s. Tab. 35) gewonnen. Das 1,7 kb-Fragment wurde mit dem durch λ-Red-Rekombination modifizierten, linearisierten Plasmid zum fertigen Inaktivierungskonstrukt ligiert. Es ist möglich, direkt mit dem Ligationsansatz CaCl2 kompetente E. coli 12567 pUZ8002 zu transformieren und als Donor für den Plasmidtransfer in die Streptomyces sp. per intergenerischer Konjugation einzusetzen. Die Selektion erfolgt mit Carbenicillin, Spectinomycin, Apramycin und Kanamycin gleichzeitig. Soll auch später noch auf das Inaktivierungsplasmid zugegriffen werden können, wird als Zwischenschritt eine Transformation von E. coli XL1blue mit anschließender Plasmidisolierung eingefügt. 5.8.2.5 Vom Inaktivierungsplasmid zur Doppelcrossover-Mutante Konjugation Das Inaktivierungsplasmid wurde per intergenerischer Konjugation in den Zielstamm eingebracht. Über homologe Rekombination im Bereich identischer Sequenzen zwischen Plasmid und Genom entsteht die Erstcrossover-Mutante. Sie wurde mit Apramycin (Marker des Vektors) selektiert und ihre Identität durch zusätzliche Spectinomycinresistenz (Marker der Redirect-Kassette) sowie spezifische PCR überprüft. Passagieren Ohne Selektionsdruck wurde die apramycin- und spectinomycinresistente ErstcrossoverMutante über mehrere Passagen kultiviert. Ohne Antibiotikazusatz sind auch Zellen, in deren Genom es spontan zu einem zweiten Crossover-Ereignis zur Doppelcrossover-Mutante oder zurück zum Wildtyp kommt, überlebensfähig. Besonders effektiv ist das Passagieren, wenn zwischen Flüssig- und Agarkultur alterniert wird. Die Flüssigkulturen wurden mit einer Sporensuspension (vgl. Kapitel Herstellung von Sporensuspension und -dilution) inokuliert. In der Flüssigkultur wird eine höhere Zellteilungsrate und damit eine höhere Frequenz an Crossover-Ereignissen erreicht. Die Zellen des Myzels enthalten jedoch mehrere Kopien des Chromosoms [432]. Zellen, die ausschließlich das veränderte Chromosom enthalten, treten erst nach mehreren Generation auf. Sporen hingegen sind unichromosomal [432] und führen zur direkten Trennung rekombinierter und nicht rekombinierter Chromosomen. Herstellung von Sporensuspension und -dilution Ausgehend von einer Agarkultur des Passagierens wurde die Sporensuspension hergestellt. Durch Versetzen mit 4 mL HA-Flüssigmedium und anschließendem vorsichtigen Schaben mit der Impföse gelang es, die hydrophoben Sporen in Suspension zu bringen. Zur Befreiung von Myzelresten wurde die Sporensuspension durch sterile Watte filtriert. 100 µL der Suspension mit 900 µL HA-Medium gemischt ergaben die ersten Dezimalverdünnung (D1). Um aus- Material und Methoden 237 geeinzelte Kolonien zu erhalten wurden nach dem gleichen Prinzip die Dilutionen D5 - D7 hergestellt. Je 100 µL von D5 - D7 wurden auf HA-Agarplatten mit Spectinomycin ausplattiert und drei bis vier Tage bei 28 °C inkubiert. Selektion auf zweites Crossover Auf den HA-Agarplatten mit Spectinomycin war nur das Wachstum von apramycin- und spectinomycinresistenten Erstcrossover-Mutanten sowie apramycinsensitiven und spectinomycinresistenten Doppelcrossover-Mutanten zu erwarten. Zellen mit dem Wildtypgenotyp sind unter der Einwirkung von Spectinomycin nicht vermehrungsfähig. Von einer Platte, auf der die Sporen in Einzelkolonien gewachsen waren, wurden 88 - 352 Klone auf Verlust der Apramycinresistenz gescreent. Dies gelang durch Überimpfen der Klone auf gerasterte, spectinomycinhaltige HA-Agarplatten mit Apramycin und ohne Apramycin. Klone, die auch bei wiederholter Anzucht nur auf Platten ohne Apramycin anwuchsen, sollten den Genotyp der gewünschten Doppelcrossover-Mutante besitzen. Dies wurde mit einer spezifischen PCR abgesichert. 5.8.2.6 Erweiterungsmöglichkeiten der [safe-knock]-Strategie Im Genom der mittels der [safe-knock]-Strategie entstandenen Doppelcrossover-Mutanten wird die eingebrachte Resistenzkassette von zwei FRT- oder loxP-sites flankiert. Über die seit kurzem auch in Bakterien mit G+C-reichen Genomen etablierte sequenzspezifische Rekombination (s. 5.9) kann der zwischenliegende Bereich nachträglich entfernt werden. Dies kann vor allem dann von Vorteil sein, wenn der Marker der Redirect-Kassette für ein weiteres Experiment mit der Mutante eingesetzt werden soll oder durch das eingebrachte Resistenzgen Wirkungen auf die Transkription benachbarter Gene befürchtet werden. 238 5.9 Material und Methoden Flp und Cre vermittelte Rekombination in Streptomyces spp. Die Enzyme Flp und Cre sind sequenzspezifische Rekombinasen (site specific recombinases). Sie vermitteln die DNA-Rekombination ausschließlich an einer für die jeweilige Rekombinase spezifischen Sequenz. Die Flp-Rekombinase aus Saccharomyces cerevisiae bewirkt die Rekombination zwischen zwei 34 bp FRT-sites und die Cre-Rekombinase aus dem Genom des Bakteriophagen P1 erkennt 34 bp loxP-sites [433]. Die ursprünglichen FRTsites haben eine Länge von 48 bp, bestehend aus drei 13 bp langen Symmetrieelementen getrennt von einen 8 bp Spacer bzw. einem einzelnen Basenpaar. Für ihre Funktion sind wie auch bei den loxP-sites zwei Symmetrieelemente (= Enzym-Bindungsstellen) mit Spacer ausreichend [434]. Die Orientierung von zwei identischen Erkennungsbereichen (2×FRT oder 2×loxP) bestimmt den ablaufenden Rekombinationstyp: zueinander hin orientiert, katalysiert die Rekombinase eine reversible Inversion, bei gleicher Orientierung (direct repeat) eine Exzision des zwischenliegenden Abschnitts [435]. Mit der Exzision einher geht die Bildung eines zirkulären DNA-Fragments. Diese zirkuläre DNA kann über den gleichen Mechanismus reintegriert werden. Es liegt demnach eine reversible Reaktion vor. Das Gleichgewicht ist wegen der geringeren Wahrscheinlichkeit des Zusammentreffens von zirkulärem Fragment und chromosomalem Erkennungsbereich jedoch zu Gunsten der Exzision verschoben (s. Abb. 104). Eine Flp-Erkennungsstelle : = FRT-site GAAGTTCCTATAC TTTCTAGA GAATAGGAACTTC Flp-Bindungsstelle Spacer Exzision Flp-Bindungsstelle Integration DNA + Abb. 104: Oben: Nukleotidsequenz der 34 bp FRT-site. Unten: Reaktionen bei Anordnung der Erkennungsstellen in gleicher Orientierung (direct repeat). Die Exzsionsreaktion zur Entfernung des zwischenliegenden Bereichs überwiegt im Vergleich mit der Reintegration des zirkulären Produkts. Material und Methoden 239 Sequenzspezifische Rekombinasen werden hauptsächlich zur Generierung markerloser Mutationen eingesetzt, ermöglichen aber auch die zeitlich kontrollierte Genexpression, den Rekombinase vermittelten Kassettenaustausch oder die In-vivo-Exzision von Bereichen genomischer DNA bzw. die Subklonierung dieser Bereiche [436]. Die Übertragung des Cre-loxP-Systems auf Streptomyces spp. wurde vor kurzem von Khodakaramian et al. (2006) [437] demonstriert. Die Expression des cre-Gens aus dem Bakteriophagen P1 in Streptomyces coelicolor mit hinreichender Effektivität gelang jedoch nur im Zustand einer transienten Phageninfektion, was die Anwendung kompliziert und unpraktikabel erscheinen lässt. Der hohe A+T-Anteil der Nukleotidsequenz wird für die nur geringe Expression des cre-Gens in Streptomyces spp. verantwortlich gemacht. Im Umfeld G+C-reicher Genome werden Codons, die nur aus A und T bestehen, aus Mangel an entsprechender t-RNA vermindert translatiert und führen zu einer Minderexpression des codierten Proteins [285;438]. Eine innovative Lösung fand Dr. A. Luzhetskyy (AK Bechthold), der die Nukleotidsequenz von Rekombinasegenen an den üblichen Codongebrauch von Streptomyces spp. [70] unter Beibehaltung der Aminosäuresequenz des ursprünglichen Gens anpasste [155]. Das so entstandene synthetische Gen der FlpRekombinase (flp(a)) wurde in der vorliegenden Arbeit eingesetzt. 5.9.1.1 Flp-Rekombination zur Exzision eines DNA-Bereichs Zur Exzision eines Sequenzbereiches verbunden mit dessen Zirkularisierung müssen beide FRT-sites diesen DNA-Abschnitt als direct repeats in gleicher Orientierung flankieren (s. Abb. 104). Die Redirect-Kassetten des John Innes Centre erfüllen diese Voraussetzungen (vgl. 5.5.5.5). Zur gezielten Geninaktivierung werden die Redirect-Kassetten anstelle des entsprechenden Gens in das Chromosom der Streptomyces sp. eingebracht (s. 5.8.2). Durch die Kassette im Genom kann es jedoch auch zur Beeinflussung der Transkription benachbarter Gene kommen. Eine sich an die [safe-knock]-Strategie anschließende Exzision der Kassette mittels Flp-Rekombination kann diese polaren Effekte verhindern. Nach der Rekombination bleiben von der Redirect-Kassette nur eine der FRT-sites, sowie die außerhalb der FRT-sites gelegenen Bereiche (P1, P2, bei pIJ785Spec zusätzlich tipAp) zurück (s. Abb. 105). Zur Expression des synthetischen Gens der Flp-Rekombinase flp(a) wurde das in Streptomyces spp. replikative Plasmid pUWLhyg-FLP konstruiert (s. 5.4.2.3). 240 Material und Methoden Flp-Rekombination einer Redirect-Kassette spec P2 P1 FRT oriT FRT FRT P2 P1 Legende P1/P2: Primerbindungsstellen FRT: Erkennungsstelle der Flp-Rekombinase oriT: spec: origin of transfer von RK2 Spectinomycinresistenzgen Abb. 105: Effekt der Flp-Rekombinase auf eine ins Genom integrierte Redirect-Kassette. 5.10 Methoden der Biochemie 5.10.1 Glykosylierungsassay Mit 10 mL einer 3-Tageskultur von Saccharothrix espanaensis in TSB-Flüssigmedium oder 10 mL einer Dauerkultur in 25 % Saccharose wurden 100 mL NL111- Flüssigmedium angeimpft und für 20 h inkubiert (28 °C, 180 rpm). 20 - 40 mL der Kultur wurden durch Zentrifugation pelletiert (4 °C, 5000rpm, 10 min), im gleichen Volumen Puffer (50 mM TrisHCl, pH 7,2) resuspendiert und wieder pelletiert. Der Waschvorgang in der Pufferlösung wurde ein zweites Mal wiederholt und das Pellet in 5 mL - 10 mL Puffer aufgenommen. Diese Suspensionen wurde zwei- bis dreimal bei einem Druck von ca. 14000 psi durch die French Pressure Cell Press (s. Tab. 18) geleitet und das entstandene Lysat durch Zentrifugation (4 °C, 12000 rpm, 10 min) von intakten Zellen und Zelltrümmern befreit. Je Ansatz wurde 1 mL des klaren Überstandes eingesetzt. Bei der Variante des Assays mit aufgeschlossenen Zellen wurde das Lysat ohne Zentrifugation verwendet. Die Testsubstanzen lagen als 12,5 mg/mL-Stammlösungen in DMSO vor. Pro Ansatz wurden 8 µL (= 100 µg) zupipettiert und invertiert. Nach 30minütiger Inkubation bei 28 °C im Brutschrank stoppte die Extraktion mit 1 mL Ethylacetat die Reaktion. Die Extrakte wurden per LC/MS analysiert. Zur Erfassung sehr hydrophiler Derivate wurden nach der Inkubationszeit 100 µL aus dem Reaktionsgemisch per LC/MS analysiert. Material und Methoden 241 5.10.2 Proteinanalytik mit SDS-PAGE Proteinhaltige Ganzzellextrakte aus Saccharothrix espanaensis wurden mit denaturierender, diskontinuierlicher Polyacrylamidgelelektrophorese (SDS-PAGE) analysiert. Die Proteinauftrennung erfolgte in einer "Mini-PROTEAN 3" Elektrophoresezelle (s. Tab. 18) über 45 min bei 200 V (Gelgröße: 73×80×0,5 mm) nach Angaben des Herstellers. Alle eingesetzten Lösungen sind unter 5.2.1.1 aufgelistet. Die Unterteilung des Gels in ein Sammel- und ein Trenngel diente einer erhöhten Bandenschärfe und damit einer verbesserten Auflösung [439]. Zunächst wurde ein Trenngel auf etwa 80 % der Gelhöhe gegossen und mit Isopropanol überschichtet. Nach der Polymerisation wurde die überstehende Flüssigkeit entfernt, das Sammelgel auf das Trenngel gegossen und ein Taschenformer eingesetzt. Vor dem Auftragen der Probelösungen wurden diese in Probenpuffer aufgenommen und 5 min bei 95 °C inkubiert. Als Molekulargewichtsstandard diente das „Low Molecular Weight Calibration Kit for SDS Electrophoresis“ von Amersham mit Phosphorylase b (97 kDa), Albumin (66 kDa), Ovalbumin (45 kDa), Carboanhydrase (30 kDa), Trypsininhibitor (20,1 kDa) und α-Lactalbumin (14,4 kDa). Das vom Sammelgel befreite Trenngel wurde nach der Elektrophorese 15 - 20 min in Coomassielösung gefärbt und anschließend in Entfärbelösung bis zum gewünschten Grad entfärbt. Vor dem Trocknen wurden die Gele in 10 %igem (V/V) Glycerol über Nacht aufbewahrt, dann zwischen zwei befeuchteten Cellophanfolien blasenfrei in einen Geltrocknungsrahmen eingespannt und bei Raumtemperatur getrocknet. 5.11 Analytik und Isolierung niedermolekularer Naturstoffe 5.11.1 Naturstoffextraktion aus Bakterienkulturen 5.11.1.1 Extraktion mit Ethylacetat Nach Abschluss der Inkubationszeit wurde für die Extraktion niedermolekularer Sekundärstoffe aus 100 mL-Standardkulturen oder Biotransformationskulturen mit zugefüttertem Fremdstoff (s. 5.3.1.4) der pH-Wert der Kulturbrühe mit 1 M HCl-Lösung auf 7 eingestellt. Auch wenn die Wasserlöslichkeit einiger der untersuchten Naturstoffe (zum Beispiel α-Hydroxyanthrachinone) mit der weiteren Absenkung des pH-Wertes abnimmt, was mit einer Effektivitätssteigerung der Extraktion mit Ethylacetat verbunden ist, wurde in Hinsicht auf die Stabilität entstandener Glykoside ein neutraler pH-Wert gewählt. Ausnahmen, wie die Extraktion der Novobiocinsäurederivate, sind im Ergebnisteil beschrieben. 242 Material und Methoden Durch Zentrifugation (RT, 5000 rpm, 10 min) wurden Myzel und Fermentationsüberstand getrennt. Der Überstand wurde dreimal mit 100 mL Ethylacetat ausgeschüttelt, das Myzel mit 40 mL Ethylacetat versetzt und über einen Zeitraum von 30 min je nach Gefäß regelmäßig gerührt oder gevortext. Bei den farbigen Anthrachinonen ließ sich der Aufschluss der Zellen gut durch die nach 5 - 10 min eintretende Färbung des Lösungsmittels nachvollziehen. Durch Dekantieren wurde der Extrakt vom Myzel getrennt und mit den Ethylacetatphasen der Extraktion des Überstandes vereinigt. Über wasserfreiem Na2SO4 wurde der Extrakt für mindestens 15 min getrocknet und das Lösungsmittel anschließend im Vakuum mit einem Rotationsverdampfer bei 40 °C entfernt. Der so gewonnene, trockene Rohextrakt wurde für die Analysen des Kapitels 3.3 in 4 mL Methanol aufgenommen, durch einen Filter mit einem Porendurchmesser von 0,22 µm filtriert und mit einem Injektionsvolumen von 60 µL per LC/MS analysiert. Für die anderen Analysen wurden die Volumina an die Löslichkeit und Absorptionskoeffizienten der Substanzen angepasst. Kulturvolumina über 100 mL wurden unter Berücksichtigung der angegebenen Verhältnisse extrahiert. 5.11.1.2 Anreicherung durch Festphasenextraktion Die Festphasenextraktion (SPE) erlaubt die Anreicherung von Substanzen mit definierten chemischen oder physikalischen Eigenschaften aus einer komplexen Matrix und findet hauptsächlich Verwendung bei der Untersuchung von Körperflüssigkeiten. In der vorliegenden Arbeit wurde die SPE mit einer 10g Sep-Pak C18-Kartusche (Waters) zur Fraktionierung eines Ethylacetatrohextrakts (s. 5.11.1.1) zur präparativen Isolierung eines Biotransformationsprodukts von Alizarin eingesetzt (s. 3.1.1.1). Vor der Aufgabe des in Wasser suspendierten Rohextrakts wurde die Kartusche ausgehend von 100 % Methanol stufenweise auf 20 % Methanol in Wasser konditioniert. Elution und Konditionierung erfolgten mit Unterdruck bei ca. 600 mbar. 5.11.2 Dünnschichtchromatographie (DC) Für die analytische Dünnschichtchromatographie wurden DC-Alufolien Kieselgel 60 F254 (Monitoring der Darstellung und Aufreinigung von Novobiocinsäure, s. 5.12) und Kieselgel 60 RP-18 F254s (Vorversuche für die RP-Säulenchromatographie) der Firma Merck eingesetzt. Die Visualisierung der Analyten erfolgte durch Fluoreszenzlöschung (254 nm) und Fluoreszenz (366 nm). 243 Material und Methoden 5.11.3 Säulenchromatographie Die Säulenchromatographie erfolgte in Glassäulen an LiChroprep RP-18 (25 µm - 40 µm) der Firma Merck mit einem Methanol-Wasser-Gradienten. Es wurde die Methode der FlashChromatographie [440] angewendet, wobei das Fließmittel durch den mit einen luftgefüllten Ballon aufgebauten Druck getrieben wurde. Die Gelfiltration an Sephadex LH-20 (Amersham) und dem Fließmittel Methanol erfolgte ohne Überdruck in Glassäulen. 5.11.4 Analytische HPLC Die Analytische HPLC-Anlage von Waters (s. Tab. 18), ausgestattet mit einer Waters XBridge C18-Säule (100 mm×4,6 mm, 3,5 µm) mit entsprechender Vorsäule (20 mm×4,6 mm, 3,5 µm), kam zur Aufreinigung der durch Biotransformation entstandenen Novobiocinsäurederivate (Tab. 51, s. 3.1.6), Quantifizierung der Polyketomycinproduktion (Tab. 50, s. 3.2.5) und zur Reinheitskontrolle säulenchromatographisch gewonnener Fraktionen zum Einsatz. Der Thermostat des Säulenofens wurde manuell auf 30 °C eingestellt, alle anderen Funktionen der Analage wurden mit dem PC-Programm Empower 2002 gesteuert. Anwendungsspezifische Fließmittelgradienten mit linearen Übergängen sind im Folgenden tabellarisch aufgelistet. Tab. 50: Fließmittelgradient der Methode pok, analytische HPLC Waters 515. Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril (0,5 % (V/V) Essigsäure), Flussrate 0,7 mL/min. Zeit [min] 0 5 20 23 27 30 32 Laufmittel A [%] 65 65 30 5 5 65 65 Laufmittel B [%] 35 35 70 95 95 35 35 Tab. 51: Fließmittelgradient der Methode novaprep, analytische HPLC Waters 515. Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril (0,5 % (V/V) Essigsäure), Flussrate 1,2 mL/min. Zeit [min] 0 22 29 29,1 32 32,1 35 Laufmittel A [%] 75 75 40 5 5 75 75 Laufmittel B [%] 25 25 60 95 95 25 25 244 Material und Methoden 5.11.5 Präparative HPLC Die Isolierung von AliPro1 erfolgte mit einer präparativen HPLC von Waters (s. Tab. 18) mit Waters XTerra Prep MS C18-Säule (150 mm×7,8 mm, 5 µm) und entsprechender Vorsäule (10 mm×7,8 mm, 5 µm). Die Probenaufgabe musste manuell vorgenommen werden; bei der Fraktionierung des Eluats half der zeitgesteuerter Fraktionssammler. Die quaternäre Pumpe und der UV/VIS-Detektor konnten über die Software Empower 2002 gesteuert werden. Tab. 52: Gradient der Methode alipro1, Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril (0,5 % (V/V) Essigsäure), Flussrate 2,5 mL/min, Gradient mit linearen Übergängen, Detektion bei 440 nm. Zeit [min] 0 3 26 30 32 35 Laufmittel A [%] 75 75 60 5 75 75 Laufmittel B [%] 25 25 40 95 25 25 5.11.6 HPLC/MS Analytik LC/MS-Messungen wurden mit einem Agilent 1100 System (s. Tab. 18) durchgeführt, das über eine LC-DAD-MSD-Kopplung verfügt. Der single quadrupol-Massendetektor (MSD) wurde wahlweise mit einer ESI- (electrospray ionization) oder APCI- (atmospheric pressure chemical ionization) Quelle bestückt. Die Anlage wurde mit dem PC-Programm ChemStation Rev. A.09.03 oder A.10.02 kontrolliert. Es konnte zwischen der analytischen Säule Zorbax Eclipse XDB-C8 (150 mm×4,6 mm, 5 µm) mit Vorsäule (12,5 mm×4,6 mm, 5 µm) und der präparativen Säule Zorbax SB-C18 (150 mm×9,6 mm, 5 µm) mit Vorsäule (50×9,4 mm, 5 µm) gewählt werden. Die präparative Säule kam nur zur Aufreinigung von Novobiocinsäurederivaten zum Einsatz (Methode: nova11prep, s. Tab. 55). Ein zwischen DAD und MSD geschalteter Splitter ermöglichte die MSD abhängige Steuerung des Fraktionssammlers bei nur minimalem Eluatverlust. Die typischen Parameter der Ionisierungsquellen waren: ESI und APCI: drying gas flow 12 L/min, drying gas temperature 350 °C, nebulizer pressure 35 psig, capillary voltage ± 3000 V; zusätzlich bei APCI: vaporizer temperature 350 °C, corona +4,0 µA / −15 µA. Methodenspezifische Parameter sind im Folgenden zusammen mit den Fließmittelgradienten aufgelistet. Alle verwendeten Gradienten hatten lineare Übergänge. 245 Material und Methoden Tab. 53: Gradient der Methode mens03 (Analytik von Sekundärstoffen aus S. sp. Gö C4/4), Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril, Flussrate 0,7 mL/min, Säulenofen: 30 °C, Plot von Chromatogrammen bei den Absorptionswellenlängen 230 nm (Ref. 400 nm), 254 nm (Ref. 400 nm), 330 nm (Ref. 500 nm), 400 nm (Ref. 600 nm), erfasster Bereich: 200 nm - 600 nm, bevorzugte Ionisierungsquelle: ESI, Massenbereich: 200 - 1000. Zeit [min] 0 25 31 35 38 45 Laufmittel A [%] 90 45 5 5 90 90 Laufmittel B [%] 10 55 95 95 10 10 Tab. 54: Gradient der Methode antqui (zur Analytik von Xenobiotikabiotransformationsprodukten aus Actinomycetales-Arten sowie mit den Parametern antqui04 zur Analytik von Polyketomycin und seinen Derivaten), Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril, Flussrate 0,7 mL/min, Säulenofen: 30 °C. Substanzabhängig wurde der DAD-Detektor auf unterschiedliche Absorptionswellenlängen eingestellt und der Massenbereich des MSD angepasst: antqui01: 254 nm (Ref. 360 nm), 254 nm (Ref. 580 nm), 360 nm (Ref. 580 nm), 430 nm (Ref. 600 nm), 400 nm (Ref. 600 nm), erfasster Bereich: 220 nm - 600 nm, bevorzugte Ionisierung: ESI, Massenbereich: 100 - 1100; antqui02: 254 nm (Ref. 360 nm), 254 nm (Ref. 750 nm), 360 nm (Ref. 750 nm), 550 nm (Ref. 750 nm), 600 nm (Ref. 800 nm), erfasster Bereich: 220 nm - 800 nm, bevorzugte Ionisierung: ESI, Massenbereich: 100 - 1100; antqui03: 254 nm (Ref. 360 nm), 300 nm (Ref. 580 nm), 330 nm (Ref. 580 nm), 360 nm (Ref. 600 nm), 400 nm (Ref. 600 nm), erfasster Bereich: 220 nm - 600 nm, bevorzugte Ionisierung: ESI, Massenbereich: 100 - 1100; antqui04: 254 nm (Ref. 400 nm), 320 nm (Ref. 500 nm), 430 nm (Ref. 600 nm), erfasster Bereich: 220 nm - 600 nm, bevorzugte Ionisierung: APCI, Massenbereich: 200 - 1000. Zeit [min] 0 9 16 20 24 29 30 35 Laufmittel A [%] 80 67 50 30 5 5 80 80 Laufmittel B [%] 20 33 50 70 95 95 20 20 Tab. 55: Gradient der Methode nova11 / nova11prep (Analytik von Novobiocin / -Derivaten), Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril, Flussrate 0,7 mL/min (nova11, analytische Säule) oder 2,5 mL/min (nova11prep, präparative Säule), Säulenofen: 30 °C, Plot von Chromatogrammen bei den Absorptionswellenlängen 254 nm (Ref. 500 nm), 327 nm (Ref. 600 nm), 330 nm (Ref. 600 nm), erfasster Bereich: 200 nm - 600 nm, bevorzugte Ionisierungsquelle: ESI, Massenbereich: 200 - 1000. Zeit [min] 0 30 33 35 38 45 Laufmittel A [%] 75 35 5 5 75 75 Laufmittel B [%] 25 65 95 95 25 25 246 Material und Methoden 5.11.7 Bestimmung der exakten Masse Aus der exakten Massenbestimmung mit einer Genauigkeit auf einige Nachkommastellen können Vorschläge für die Elementarzusammensetzung eines Ions abgeleitet werden. Die exakten Massen wurden im Rahmen einer Kooperation mit dem AK Bode (Universität des Saarlandes, Saarbrücken) von Eva Luxenburger mit einem ThermoScientific LTQ-OrbitrapSystem bestimmt. Die LTQ Orbitrap ist ein Hybrid-MS- und MSn-System, bestehend aus einer linearen Ionenfalle und einer elektrostatischen Ionenfalle, der Orbitrap, als MSAnalysator [441]. Das Hybrid-Massenspektrometer wurde in einer LC/MS-Anordnung mit ESI-Quelle eingesetzt. 5.11.8 NMR-Spektren NMR-Spektren wurden mit einem Bruker Avance DRX 400 Spektrometer aufgenommen (400 MHz für 1H, 100 MHz für 13C). Die Probe AliPro1 (s. 3.1.1.1) wurde zusätzlich mit einem JEOL Alpha Spektrometer gleicher Frequenz vermessen. Es wurden 1D und 2D NMR Experimente durchgeführt: 1H, 13C, 1H-1H-correlated spectroscopy (COSY), 1H-1H-total correlated spectroscopy (TOCSY), heteronuclear single-quantum coherence (HSQC), heteronuclear multiple-bond correlation (HMBC), nuclear Overhauser enhancement spectroscopy (NOESY) und rotating frame Overhauser enhancement spectroscopy (ROESY). Die Spektren wurden auf das Signal des Lösungsmittels kalibriert. Das 1H-Signal von DMSO wurde auf 2,50 ppm gesetzt. Für das 13C-Signal sind abweichende Werte zu finden. Das Programm MestreC 4.8.6 setzt das Signal bei 39,43 ppm, die Version MestreNova 5.2.2 bei 39,51 ppm, in der Literatur wird vor allem der Wert 39,50 ppm verwendet. Die Interpretation aller Spektren mit Ausnahme der Novobiocinsäurederivate wurde mit der Version MestreC 4.8.6 und einer Festlegung des Signals auf 39,43 ppm durchgeführt. Für die Spektren der Novobiocinsäurederivate wurde die Verschiebung auf 39,50 ppm gesetzt. Multiplizitäten: s (Singulett), t (Triplett), q (Quartett), m (Multiplett), br (breit). 5.11.9 Circulardichroismus Der Circulardichroismus (CD) quantifiziert das unterschiedliche Absorptionsvermögen chiraler Moleküle von rechts- und linkszirkular polarisiertem Licht. ∆A = AL - AR wird als Funktion der Wellenlänge im Diagramm aufgetragen. Vom CD-Spektrum kann nicht direkt auf die Struktur geschlossen werden. Durch den Vergleich mit dem CD-Spektrum einer bekannten Struktur oder mit berechneten CD-Spektren können Hinweise zur absoluten Konfiguration des Moleküls gewonnen werden. Zwei Enantiomere ergeben Messwerte unterschiedlichen Vorzeichens. Der Kurvenverlauf fällt spiegelbildlich aus. Material und Methoden 247 In Quarzglasküvetten einer Länge von 0,5 cm wurden die Untersuchungslösungen im Spektralpolarimeter J-810 (s. Tab. 18) mit folgenden Einstellungen vermessen: Empfindlichkeit: Standard, Messgeschwindigkeit: 100 nm/min, data pitch: 1 nm, Bandbreite: 2 nm, response: 2 s, Akkumulation: 3. 5.11.10 Gefriertrocknung Zur Gewinnung niedermolekularer Naturstoffe aus wasserhaltigen Fraktionen der Chromatographie wurde die Gefriertrocknung eingesetzt. Nach Entzug der bei 100 mbar und 40 °C am Rotationsverdampfer flüchtigen Lösungsmittel wurde die Probe bei −85 °C gefroren, mit durchlöcherter Alufolie verschlossen und 16 h - 48 h mit einem Gefriertrockner der Firma Christ (s. Tab. 18) getrocknet. Kondensatortemperatur −85 °C, Zieldruck 0,011 mbar. 5.12 Darstellung von Novobiocinsäure Gemäß Hinman et al. (1957) [125] wurde Novobiocinsäure durch Spaltung des kommerziell erhältlichen Antibiotikums Novobiocin-Na gewonnen. Chemikalien und Apparatur Tab. 56: Chemikalien für die Darstellung von Novobiocinsäure. 4g 0,8 mL 40 mL (6,3 mmol) (11,3 mmol)* Novobiocin-Natrium (Mr: 634,61) Acetylchlorid (ρ20 °C: 1,104 g/mL, Mr: 78,50) Ethanol (destilliert, über Molekularsieb 4 Å getrocknet) * Hinman et al. (1957) gehen von Novobiocin aus. Zur Freisetzung von Novobiocin aus seinem Mononatriumsalz wird ein äquimolarer Anteil an HCl nötig. Die Menge an Acetylchlorid wurde deshalb um 6,3 mmol erhöht. Die Reaktion (s. Abb. 38) wurde in einem 100 mL Dreihalskolben mit Rührfisch auf einem Magnetrührer mit Heizung, Thermostat und mobilem Thermometer durchgeführt. Ein DrySyn-Aufsatz (Heidolph) mit Thermometersteckplatz sorgte für die Wärmeübertragung. Der auf den Kolben aufgesteckte Rückflusskühler wurde über ein Gasverteilersystem wahlweise an Vakuum oder Stickstoff angeschlossen. Die beiden weiteren Anschlüsse des Kolbens wurden mit einem Kunststoffseptum bzw. einem Stopfen verschlossen. Trocknen der Apparatur Unter Vakuum wurde die Apparatur mit einer Heißluftpistole an allen Stellen aufgeheizt. Die Vakuumpumpe wurde daraufhin von der Apparatur getrennt und ein sanfter Stickstoffstrom über den Rückflusskühler zugeleitet. Nachdem die Apparatur mit Stickstoff gefüllt war, wurde der Trocknungsvorgang wiederholt. Insgesamt wurde drei Mal getrocknet. 248 Material und Methoden Reaktionsablauf Ethanol und Novobiocin-Na wurden über einen Pulvertrichter in das Reaktionsgefäß gegeben. Bei verschlossener Apparatur und leichtem N2-Überdruck wurde der Thermostat so eingestellt, dass sich ein leichter Rückfluss einstellte (85 °C). Tropfenweise wurden über einen Zeitraum von 15 min 0,8 mL Acetylchlorid mit einer Spritze über das Septum in die Reaktion gegeben. Beim Eintropfen kam es zur Schaumbildung an der Eintropfstelle und ein weißes Gas (HCl) war unterhalb der Kühlschlange zu bemerken. Nach 30 min wurden wenige µL aus dem Reaktionsansatz entnommen, mit Ethylacetat verdünnt und per Dünnschichtchromatographie (Kieselgel 60 F254, Ethylacetat:Cyclohexan 1:1) im Vergleich zu in 0,1 M HCl gelöstem Novobiocin-Na untersucht. Der Beginn einer Reaktion konnte durch Auftreten zusätzlicher Punkte bei der Probe aus der Reaktion festgestellt werden. Nach 2 h wurde die Reaktion beendet. Nach dem Abkühlen des Reaktionsgefäßes auf Eis konnte durch Zugabe von 120 mL Wasser ein weißer Niederschlag mit schwachem Gelbstich ausgefällt werden. Durch Vakuumfiltration über eine Glasfritte (Por. 4) wurde der Niederschlag abgetrennt. Aufreinigung und Analyse Durch Rekristallisation aus Aceton und anschließende 424-Transfer-Gegenstromchromatographie mit einem Lösungsmittelsystem aus Ethylacetat, Ethanol, Wasser und Cyclohexan konnten Hinman et al. (1957) Novobiocinsäure in 68 %iger Ausbeute gewinnen. 1.) Kristallisation aus Aceton Der Niederschlag wurde in einigen Milliliter Aceton suspendiert und unter Rückfluss auf 70 °C erhitzt. Schrittweise wurden insgesamt 50 mL Aceton hinzugefügt. Der Niederschlag löste sich jedoch nicht vollständig auf. Der Kolben wurde zunächst bei Raumtemperatur, dann über Nacht im Kühlschrank inkubiert. Über feinen weißen Kristallen stand am nächsten Morgen ein gelber Überstand, der über Vakuumfiltration abgetrennt wurde. Nach Trocknung im Vakuum wurden 1,64 g Präzipitat erhalten. Die vergleichende LC/MS-Analyse (Methode: nova11, s. Tab. 55) von Präzipitat und Filtrat zeigte die Effektivität der Rekristallisation zur Abtrennung der Verunreinigungen Novobiocin und Cyclonovobiocinsäure. 2.) Flash-Chromatographie über Silicagel Dünnschichtchromatographisch war zusätzlich zu Novobiocinsäure eine weitere Substanz durch Fluoreszenzlöschung bei 254 nm detektierbar. Als folgender Aufreinigungsschritt wurde deshalb eine Säulenchromatographie über Silicagel gewählt (Fließmittel: Cyclohexan Ethylacetat, 60:40). Die beiden Stoffe konnten nicht getrennt werden. Auf der Säule blieb jedoch eine gelbe Substanz zurück. 3.) Kristallisation aus Aceton Nach wiederholter Rekristallisation konnten 1,15 g Novobiocinsäure gewonnen werden, was einer Ausbeute von 46 % entspricht. Mit 1H- und COSY-NMR-Experimenten (in DMSO-d6) wurde die erhaltene Substanz als Novobiocinsäure identifiziert. Unter anderem über das Material und Methoden 249 charakteristische Triplett von 8-H, das Signal der Methylgruppenprotonen an C-10 / C-11 mit einem sechs Protonen entsprechenden Integral sowie die Präsenz von vier Protonensignalen, die von mit Heteroatomen verbundenen Atomen stammen (bei δH = 9 - 12 ppm), konnte die gewonnene Novobiocinsäure klar von ihrem Konstitutionsisomer Cyclonovobiocinsäure abgegrenzt werden. 5.13 Testung von Naturstoffen auf antimikrobielle Aktivität Zur Bestimmung der antimikrobiellen Aktivität der neuen Novobiocinsäurederivate wurden Hemmhoftests mit dem Gram+ Bakterium Bacillus subtilis (ATCC6051) durchgeführt. Herstellung der Test-Agarplatten 12 mL einer Bacillus subtilis-Sporensuspension (s. 5.3.1.3) wurden auf Eis aufgetaut, zu 500 mL 40 - 45 °C warmem DM-Festmedium (s. Tab. 25) gegeben und zu Platten gegossen. Die Lagerung erfolgte bei 8 °C. Die Platten waren so mehrere Monate haltbar. Hemmhoftest Je 10 µL einer methanolischen Lösung der Testsubstanzen wurden auf ein Filterrondell (MN 827 ATD, Ø = 6 mm, Macherey & Nagel, Düren) pipettiert. Als Negativkontrolle wurde ein Filter mit 10 µL Methanol, als Vergleich ein Filter mit methanolischer Lösung von Novobiocin-Na eingesetzt. Die im laminaren Luftstrom der Sterilwerkbank getrockneten Filter wurden mit einer sterilisierten Pinzette auf die Agaroberfläche der Testplatte gesetzt und diese bei 37 °C für 18 h inkubiert. Die Größe der um die Filter vom Wachstum ausgesparten Hemmhöfe erlaubt eine vergleichende Beurteilung der antimikrobiellen Aktivität der Testsubstanzen gegen den eingesetzten Stamm. 250 Material und Methoden 5.14 PC-Programme und Internetservices Tab. 57: PC-Programme und Internetservices. Name Artemis v9 BCM sequence utilities BioEdit BLAST (basic local alignment search tool) CAZy-Datenbank ChemStation Rev. A.09.03 / A.10.02 Chromas 2.3 Clustal W clusters of orthologous groups (COGs) conserved domain search (NCBI) DNASTAR Lasergene V7 Empower 2002 MestreC 4.8.6 MestreNova 5.2.2 Pfam (Protein Families) SciEd CloneManager Suite Version 7 SciFinder Scholar Spectral Database for Organic Compounds (SDBS) Beschreibung, Referenz ORF-Lokalisierung in Nukleotidsequenzen [442] Prozessierung von Nukleotidsequenzen, http://searchlauncher.bcm.tmc.edu/seq-util/seq-util.html Sequenzalignment und Editierung [443] Datenbankrecherchen nach Sequenzhomologien auf Nukleotid- oder Aminosäurenebene [444], http://www.ncbi.nlm.nih.gov/blast/index.html Datenbank von Enzymen, die Reaktionen von Kohlenhydraten katalysieren [324], http://www.cazy.org/ Steuerung der Agilent 1100 Series LC/MS-Anlage und Datenauswertung, Agilent Technologies, Santa Clara, USA Auswertung von Fluoreszenzchromatogrammen der DNASequenzierung, Technelysium Pty Ltd., Tewantin, Australien Multiples Sequenzalignment [445] Motivsuche nach konservierten Domänen in Proteinen [446], http://www.ncbi.nlm.nih.gov/COG/new/ Metasuchmaschine nach konservierten Domänen in Proteinen, die auf die Datenbanken SMART, Pfam und COGs zugreift [217], http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml Suite zur Bearbeitung von DNA-Sequenzen, enthält das Programm Seqman zur Aufstellung von Contigs, DNASTAR, Madison, USA Steuerung der HPLC-Systeme von Waters und Datenauswertung, Waters, Milford, USA Prozessieren und Auswertung von NMR-Daten, Mestrelab Research, Santiago de Compostela, Spanien Suche nach konservierten Domänen in Proteinen und Zuordnung zu Proteinfamilien, http://pfam.sanger.ac.uk In-silico-Klonierungen und weitere Funktionen, Scientific & Educational Software, Durham, NC, USA Recherche in der CAS-Datenbank, Chemical Abstracts Service, Columbus, USA Öffentliche Spektrendatenbank (NMR, MS, IR) des National Institute of Advanced Industrial Science and Technology (AIST), Japan, http://riodb01.ibase.aist.go.jp/sdbs/cgibin/direct_frame_top.cgi Literaturverzeichnis 6 251 Literaturverzeichnis 1. Klockgether-Radke AP: F. W. Sertürner und die Entdeckung des Morphins. 200 Jahre Schmerztherapie mit Alkaloiden. Anästhesiologie Intensivmedizin Notfallmedizin Schmerztherapie 2002, 37:244-249. 2. Floss HG: Klassische Methoden der Biosyntheseaufklärung. Seminar, AlbertLudwigs-Universität Freiburg im Breisgau 2008. 3. Zähner H, Anke T: Evolution and secondary pathways. In Differentiation and secondary metabolism in fungi. Edited by Bennet JW, Ciegler E. CRC Press, New York 1983:153-171. 4. Hunnius Pharmazeutisches Wörterbuch. Edited by Burger A, Wachter H. Walter de Gruyter, Berlin 1997. 5. Roche Medizin-Lexikon, 5. Auflage. Urban & Fischer, Hoffmann-La Roche S.A., Basel 2003. 6. Lewis' Dictionary of Toxicology. Edited by Lewis RA. CRC Press, New York 1998. 7. Koolmann J, Röhm K-H: Taschenatlas der Biochemie, 3. Auflage. Thieme-Verlag, Stuttgart 2002. 8. Bringmann G, Noll TF, Gulder TAM, Grune M, Dreyer M, Wilde C, Pankewitz F, Hilker M, Payne GD, Jones AL, Goodfellow M, Fiedler HP: Different polyketide folding modes converge to an identical molecular architecture. Nature Chemical Biology 2006, 2:429-433. 9. Müller R: Don't classify polyketide synthases. Chemistry & Biology 2004, 11:4-6. 10. Bokkenheuser VD, Shackleton CHL, Winter J: Hydrolysis of Dietary Flavonoid Glycosides by Strains of Intestinal Bacteroides from Humans. Biochemical Journal 1987, 248:953-956. 11. Das S, Rosazza JPN: Microbial and enzymatic transformations of flavonoids. Journal of Natural Products 2006, 69:499-508. 12. Baur JA, Sinclair DA: Therapeutic potential of resveratrol: the in vivo evidence. Nature Reviews Drug Discovery 2006, 5:493-506. 13. Web of Science, Datenbankabfrage. http://apps.isiknowledge.com 2008. 14. Harikumar KB, Aggarwal BB: Resveratrol - a multitargeted agent for age-associated chronic diseases. Cell Cycle 2008, 7:1020-1035. 15. Pecere T, Gazzola MV, Mucignat C, Parolin C, Dalla Vecchia F, Cavaggioni A, Basso G, Diaspro A, Salvato B, Carli M, Palu G: Aloe-emodin is a new type of anticancer agent with selective activity against neuroectodermal tumors. Cancer Research 2000, 60:2800-2804. 252 Literaturverzeichnis 16. Thomas R: A biosynthetic classification of fungal and streptomycete fused-ring aromatic polyketides. ChemBioChem 2001, 2:612-627. 17. Crawford JM, Thomas PM, Scheerer JR, Vagstad AL, Kelleher NL, Townsend CA: Deconstruction of iterative multidomain polyketide synthase function. Science 2008, 320:243-246. 18. Abe I, Oguro S, Utsumi Y, Sano Y, Noguchi H: Engineered biosynthesis of plant polyketides: chain length control in an octaketide-producing plant type III polyketide synthase. Journal of the American Chemical Society 2005, 127:1270912716. 19. Pankewitz F: Unusual natural products in insects: molecular and chemical analysis of anthraquinone origin in Galerucini leaf beetles. Dissertation Freie Universität Berlin 2006. 20. Staunton J, Weissman KJ: Polyketide biosynthesis: a millennium review. Natural Product Reports 2001, 18:380-416. 21. Chater KF, Bibb M: Regulation of bacterial antibiotic production. In Biotechnology, Volume 7: Products of secondary metabolism. Edited by Kleinkauf H, von Dören H. VCH, Weinheim 1997, 57-105. 22. Berdy J: Bioactive microbial metabolites - A personal view. Journal of Antibiotics 2005, 58:1-26. 23. Hertweck C, Luzhetskyy A, Rebets Y, Bechthold A: Type II polyketide synthases: gaining a deeper insight into enzymatic teamwork. Natural Product Reports 2007, 24:162-190. 24. Hopwood DA: Genetic contributions to understanding polyketide synthases. Chemical Reviews 1997, 97:2465-2497. 25. Austin MB, Noel AJP: The chalcone synthase superfamily of type III polyketide synthases. Natural Product Reports 2003, 20:79-110. 26. Kreuzaler F, Hahlbrock K: Enzymatic synthesis of aromatic compounds in higher plants - formation of naringenin (5,7,4'-trihydroxyflavanone) from para-coumaroyl coenzyme A and malonyl coenzyme A. FEBS Letters 1972, 28:69-72. 27. Funa N, Ohnishi Y, Fujii I, Shibuya M, Ebizuka Y, Horinouchi S: A new pathway for polyketide synthesis in microorganisms. Nature 1999, 400:897-899. 28. Joyce SA, Brachmann AO, Glazer I, Lango L, Schwär G, Clarke DJ, Bode HB: Bacterial biosynthesis of a multipotent stilbene. Angewandte Chemie-International Edition 2008, 47:1942-1945. 29. Han YS, Van der Heijden R, Verpoorte R: Biosynthesis of anthraquinones in cell cultures of the Rubiaceae. Plant Cell Tissue and Organ Culture 2001, 67:201-220. Literaturverzeichnis 30. 253 Eichinger D, Bacher A, Zenk MH, Eisenreich W: Quantitative assessment of metabolic flux by C-13 NMR analysis. Biosynthesis of anthraquinones in Rubia tinctorum. Journal of the American Chemical Society 1999, 121:7469-7475. 31. Leistner E, Zenk MH: Mevalonic acid a precursor of substituted benzenoid ring of Rubiaceae-anthraquinones. Tetrahedron Letters 1968, 1395-1396. 32. Han YS, Van der Heijden R, Lefeber AWM, Erkelens C, Verpoorte R: Biosynthesis of anthraquinones in cell cultures of Cinchona 'Robusta' proceeds via the methylerythritol 4-phosphate pathway. Phytochemistry 2002, 59:45-55. 33. Hardcast JD, Wilkins JL: Action of sennosides and related compounds on human colon and rectum. Gut 1970, 11:1038-1042. 34. Weitnauer G, Mühlenweg A, Trefzer A, Hoffmeister D, Süssmuth RD, Jung G, Welzel K, Vente A, Girreser U, Bechthold A: Biosynthesis of the orthosomycin antibiotic avilamycin A: deductions from the molecular analysis of the avi biosynthetic gene cluster of Streptomyces viridochromogenes Tü57 and production of new antibiotics. Chemistry & Biology 2001, 8:569-581. 35. Kren V, Rezanka T: Sweet antibiotics - the role of glycosidic residues in antibiotic and antitumor activity and their randomization. FEMS Microbiology Reviews 2008, 32:858-889. 36. Kampranis SC, Gormley NA, Tranter R, Orphanides G, Maxwell A: Probing the binding of coumarins and cyclothialidines to DNA gyrase. Biochemistry 1999, 38:1967-1976. 37. Walsh C, Meyers CLF, Losey HC: Antibiotic glycosyltransferases: antibiotic maturation and prospects for reprogramming. Journal of Medicinal Chemistry 2003, 46:3425-3436. 38. Frerich A: Molekularbiologische Untersuchungen zur Biosynthese glykosidierter Arzneistoffe. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2006. 39. Kong FM, Zhao N, Siegel MM, Janota K, Ashcroft JS, Koehn FE, Borders DB, Carter GT: Saccharomicins, novel heptadecaglycoside antibiotics effective against multidrug-resistant bacteria. Journal of the American Chemical Society 1998, 120:13301-13311. 40. Labeda DP, Kroppenstedt RM: Phylogenetic analysis of Saccharothrix and related taxa: proposal for Actinosynnemataceae fam. nov. International Journal of Systematic and Evolutionary Microbiology 2000, 50:331-336. 41. FDA application No 050339 (Albamycin) www.fda.gov 2008. 42. Maxwell A: The interaction between coumarin drugs and DNA gyrase. Molecular Microbiology 1993, 9:681-686. 43. Thornsberry C, Burton PJ, Yee YC, Watts JL, Yancey RJ: The activity of a combination of penicillin and novobiocin against bovine mastitis pathogens: development of a disk diffusion test. Journal of Dairy Science 1997, 80:413-421. 254 Literaturverzeichnis 44. Produktinformation Biodry. www.pfizerah.com 2008. 45. Anderle C: Molekularbiologische und biochemische Untersuchungen zur Biosynthese der Aminocoumarin-Antibiotika Novobiocin und Chlorobiocin. Dissertation, Eberhard-Karls-Universität Tübingen 2007. 46. Marcu MG, Schulte TW, Neckers L: Novobiocin and related coumarins and depletion of heat shock protein 90-dependent signaling proteins. Journal of the National Cancer Institute 2000, 92:242-248. 47. Burlison JA, Neckers L, Smith AB, Maxwell A, Blagg BSJ: Novobiocin: redesigning a DNA gyrase inhibitor for selective inhibition of Hsp90. Journal of the American Chemical Society 2006, 128:15529-15536. 48. Momose I, Chen W, Kinoshita N, Iinuma H, Hamada M, Takeuchi T: Polyketomycin, a new antibiotic from Streptomyces sp. MK277-AF1 - I. Taxonomy, production, isolation, physico-chemical properties and biological activities. Journal of Antibiotics 1998, 51:21-25. 49. Momose I, Chen W, Nakamura H, Naganawa H, Iinuma H, Takeuchi T: Polyketomycin, a new antibiotic from Streptomyces sp. MK277-AF1 - II. Structure determination. Journal of Antibiotics 1998, 51:26-32. 50. Paululat T, Zeeck A, Gutterer JM, Fiedler HP: Biosynthesis of polyketomycin produced by Streptomyces diastatochromogenes Tü6028. Journal of Antibiotics 1999, 52:96-101. 51. Herold K, Gollmick FA, Groth I, Roth M, Menzel KD, Möllmann U, Gräfe U, Hertweck C: Cervimycin A-D: a polyketide glycoside complex from a cave bacterium can defeat vancomycin resistance. Chemistry-A European Journal 2005, 11:5523-5530. 52. Xuan LJ, Xu SH, Zhang HL, Xu YM, Chen MQ: Dutomycin, A New Anthracycline Antibiotic from Streptomyces. Journal of Antibiotics 1992, 45:1974-1976. 53. Nagao K, Suzuki K, Tokunaga J, Miyazaki H, Katayama N, Mitsuyama R, Uyeda M: DMI-2 and DMI-3, DNA methyltransferase inhibitors produced by Streptomyces sp. strain No 560. Journal of Enzyme Inhibition 1996, 10:115-124. 54. Luzhetskyy A, Mayer A, Hoffmann J, Pelzer S, Holzenkämper M, Schmitt B, Wohlert SE, Vente A, Bechthold A: Cloning and heterologous expression of the aranciamycin biosynthetic gene cluster revealed a new flexible glycosyltransferase. ChemBioChem 2007, 8:599-602. 55. Luzhetskyy A, Hoffmann J, Pelzer S, Wohlert SE, Vente A, Bechthold A: Aranciamycin analogs generated by combinatorial biosynthesis show improved antitumor activity. Applied Microbiology and Biotechnology 2008, 80:15-19. 56. Arnold M: CD-aktive Metabolite aus Streptomyceten sowie Untersuchung der Biosyntheseleistungen des Mensacarcin-Bildners Streptomyces sp. Gö C4/4. Dissertation, Georg-August-Universität zu Göttingen 2002. Literaturverzeichnis 255 57. Marumo S, Suzuki S, Sasaki K: Stereochemistry of cervicarcin. Agricultural and Biological Chemistry 1971, 35:1931-1935. 58. Yeo WH, Yun BS, Kim SS, Park EK, Kim YH, Yoo ID, Yu SH: GTRI-02, a new lipid peroxidation inhibitor from Micromonospora sp. SA246. Journal of Antibiotics 1998, 51:952-953. 59. Okamura N, Hine N, Harada S, Fujioka T, Mihashi K, Yagi A: Three chromone components from Aloe vera leaves. Phytochemistry 1996, 43:495-498. 60. Okamura N, Hine N, Tateyama Y, Nakazawa M, Fujioka T, Mihashi K, Yagi A: Three chromones of Aloe vera leaves. Phytochemistry 1997, 45:1511-1513. 61. Polomska ME: Towards a total synthesis of mensacarcin. Dissertation, GeorgAugust-Universität zu Göttingen 2004. 62. Minotti G, Menna P, Salvatorelli E, Cairo G, Gianni L: Anthracyclines: molecular advances and pharmacologic developments in antitumor activity and cardiotoxicity. Pharmacological Reviews 2004, 56:185-229. 63. Lösgen S: Isolierung und Strukturaufklärung neuer Naturstoffe aus endophytischen Pilzen mariner Habitate sowie Arbeiten zum cytotoxischen Polyketid Mensacarcin. Dissertation, Georg-August-Universität zu Göttingen 2007. 64. Hung DT, Jamison TF, Schreiber SL: Understanding and controlling the cell cycle with natural products. Chemistry & Biology 1996, 3:623-639. 65. Avendano C, Menendez JC: Medicinal Chemisty of Anticancer Drugs. Elsevier Verlag 2008. Die aktive, alkylierende Form von Mitobronitol trägt zum Beispiel einen Oxiranring (S. 159). 66. Hopwood DA: Genetic manipulation of Streptomyces - a laboratory manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1985. 67. Hopwood DA: Genetic analysis and genome structure in Streptomyces coelicolor. Bacteriological Reviews 1967, 31:373-403. 68. Martin JF, Liras P: Organization and expression of genes involved in the biosynthesis of antibiotics and other secondary metabolites. Annual Review of Microbiology 1989, 43:173-206. 69. Omura S, Ikeda H, Ishikawa J, Hanamoto A, Takahashi C, Shinose M, Takahashi Y, Horikawa H, Nakazawa H, Osonoe T, Kikuchi H, Shiba T, Sakaki Y, Hattori M: Genome sequence of an industrial microorganism Streptomyces avermitilis: deducing the ability of producing secondary metabolites. Proceedings of the National Academy of Sciences of the United States of America 2001, 98:12215-12220. 256 70. Literaturverzeichnis Bentley SD, Chater KF, Cerdeno-Tarraga AM, Challis GL, Thomson NR, James KD, Harris DE, Quail MA, Kieser H, Harper D, Bateman A, Brown S, Chandra G, Chen CW, Collins M, Cronin A, Fraser A, Goble A, Hidalgo J, Hornsby T, Howarth S, Huang CH, Kieser T, Larke L, Murphy L, Oliver K, O'Neil S, Rabbinowitsch E, Rajandream MA, Rutherford K, Rutter S, Seeger K, Saunders D, Sharp S, Squares R, Squares S, Taylor K, Warren T, Wietzorrek A, Woodward J, Barrell BG, Parkhill J, Hopwood DA: Complete genome sequence of the model actinomycete Streptomyces coelicolor A3(2). Nature 2002, 417:141-147. 71. Ohnishi Y, Ishikawa J, Hara H, Suzuki H, Ikenoya M, Ikeda H, Yamashita A, Hattori M, Horinouchi S: Genome sequence of the streptomycin-producing microorganism Streptomyces griseus IFO 13350. Journal of Bacteriology 2008, 190:4050-4060. 72. Volff JN, Altenbuchner J: Genetic instability of the Streptomyces chromosome. Molecular Microbiology 1998, 27:239-246. 73. Chater KF, Bruton CJ: Mutational cloning in Streptomyces and the isolation of antibiotic production genes. Gene 1983, 26:67-78. 74. Malpartida F, Hopwood DA: Molecular cloning of the whole biosynthetic pathway of a Streptomyces antibiotic and its expression in a heterologous host. Nature 1984, 309:462-464. 75. Baltz RH: Genetic manipulation of antibioticproducing Streptomyces. Trends in Microbiology 1998, 6:76-83. 76. Fuchser J, Zeeck A: Secondary metabolites by chemical screening. 34. Aspinolides and aspinonene/aspyrone co-metabolites, new pentaketides produced by Aspergillus ochraceus. Liebigs Annalen-Recueil 1997,87-95. 77. Chen GH, Wang GYS, Li X, Waters B, Davies J: Enhanced production of microbial metabolites in the presence of dimethyl sulfoxide. Journal of Antibiotics 2000, 53:1145-1153. 78. Ueda K, Kawai S, Ogawa H, Kiyama A, Kubota T, Kawanobe H, Beppu T: Wide distribution of interspecific stimulatory events on antibiotic production and sporulation among Streptomyces species. Journal of Antibiotics 2000, 53:979-982. 79. Challis GL: Mining microbial genomes for new natural products and biosynthetic pathways. Microbiology-SGM 2008, 154:1555-1569. 80. McAlpine JB, Bachmann BO, Piraee M, Tremblay S, Alarco AM, Zazopoulos E, Farnet CM: Microbial genomics as a guide to drug discovery and structural elucidation: ECO-02301, a novel antifungal agent, as an example. Journal of Natural Products 2005, 68:493-496. 81. Hendersons's dictionary of Biology. Edited by Lawrence E. Pearson Education, Harlow 2005. 82. Oxford dictionary of Biochemistry and Molecular Biology. Edited by Cammack R, Smith AD, Attwood TK, Campbell P, Parish H. Oxford University Press, Oxford 2006. Literaturverzeichnis 83. Thiericke R: Biological variation of microbial metabolites by precursor-directed biosynthesis. Natural Product Reports 1993, 10:265-289. 84. Weist S, Süssmuth RD: Mutational biosynthesis - a tool for the generation of structural diversity in the biosynthesis of antibiotics. Applied Microbiology and Biotechnology 2005, 68:141-150. 85. Faber K: Biotransformations in Organic Chemistry: a textbook. Springer Verlag, www.springer.com 2004. 86. Ochman H, Lawrence JG, Groisman EA: Lateral gene transfer and the nature of bacterial innovation. Nature 2000, 405:299-304. 257 87. Hutchinson CR: Combinatorial biosynthesis for new drug discovery. Current Opinion in Microbiology 1998, 1:319-329. 88. Xue Q, Ashley G, Hutchinson CR, Santi DV: A multiplasmid approach to preparing large libraries of polyketides. Proceedings of the National Academy of Sciences of the United States of America 1999, 96:11740-11745. 89. Menzella HG, Reid R, Carney JR, Chandran SS, Reisinger SJ, Patel KG, Hopwood DA, Santi DV: Combinatorial polyketide biosynthesis by de novo design and rearrangement of modular polyketide synthase genes. Nature Biotechnology 2005, 23:1171-1176. 90. Moore BS, Piel J: Engineering biodiversity with type II polyketide synthase genes. Antonie Van Leeuwenhoek International Journal of General and Molecular Microbiology 2000, 78:391-398. 91. McDaniel R, Ebertkhosla S, Hopwood DA, Khosla C: Rational design of aromatic polyketide natural products by recombinant assembly of enzymatic subunits. Nature 1995, 375:549-554. 92. Madduri K, Kennedy J, Rivola G, Inventi-Solari A, Filippini S, Zanuso G, Colombo AL, Gewain KM, Occi JL, Macneil DJ, Hutchinson CR: Production of the antitumor drug epirubicin (4 '-epidoxorubicin) and its precursor by a genetically engineered strain of Streptomyces peucetius. Nature Biotechnology 1998, 16:69-74. 93. Luzhetskyy A, Bechthold A: It works: combinatorial biosynthesis for generating novel glycosylated compounds. Molecular Microbiology 2005, 58:3-5. 94. Krauth C: Spezifitätsuntersuchungen von Glykosyltransferasen am Beispiel der Landomycinbiosynthese. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2008. 95. Williams GJ, Goff RD, Zhang CS, Thorson JS: Optimizing glycosyltransferase specificity via "hot spot" saturation mutagenesis presents a catalyst for novobiocin glycorandomization. Chemistry & Biology 2008, 15:393-401. 96. Luzhetskyy A: persönliche Mitteilung 2005. 258 Literaturverzeichnis 97. Thomson RH: Naturally occuring quinones, second edition. Academic Press, London and New York 1971. 98. Neuhaus D, Williamson MP: The nuclear Overhauser effect in structural and conformational analysis, second edition. Wiley VCH, New York 2000. 99. Klyne W: The configuration of the anomeric carbon atoms in some cardiac glycosides. Biochemical Journal 1950, 47. 100. Omura S, Nakagawa A, Tanaka Y: Structure of a new anti-fungal antibiotic, irumamycin. Journal of Organic Chemistry 1982, 47:5413-5415. 101. Hesse M, Meier H, Zeeh B: Spektroskopische Methoden in der Organischen Chemie, 2. Auflage. Thieme-Verlag, Stuttgart 1984. 102. Taguchi T: persönliche Mitteilung 2006. 103. Francis CW, Aksnes DW, Holt O: Assignment of the H-1 and C-13 NMR spectra of anthraquinone glycosides from Rhamnus frangula. Magnetic Resonance in Chemistry 1998, 36:769-772. 104. Fujioka K, Furihata K, Shimazu A, Hayakawa Y, Seto H: Isolation and characterization of atramycin A and atramycin B, new isotetracenone type antitumor antibiotics. Journal of Antibiotics 1991, 44:1025-1028. 105. SciFinder Scholar. http://www.cas.org/SCIFINDER/SCHOLAR/ 2008. 106. Rupprath C, Schumacher T, Elling L: Nucleotide deoxysugars: essential tools for the glycosylation engineering of novel bioactive compounds. Current Medicinal Chemistry 2005, 12:1637-1675. 107. Esteve-Nunez A, Caballero A, Ramos JL: Biological degradation of 2,4,6trinitrotoluene. Microbiology and Molecular Biology Reviews 2001, 65:335-352. 108. Kieseier BC, Gold R, Neuhaus O, Hartung HP: Mitoxantron zur Therapie der Multiplen Sklerose. Nervenarzt 2003, 74:906-910. 109. Mewes K, Blanz J, Ehninger G, Gebhardt R, Zeller KP: Cytochrome P-450-induced cytotoxicity of mitoxantrone by formation of electrophilic intermediates. Cancer Research 1993, 53:5135-5142. 110. Zhan JX, Gunatilaka AAL: Microbial transformation of amino- and hydroxyanthraquinones by Beauveria bassiana ATCC 7159. Journal of Natural Products 2006, 69:1525-1527. 111. Hansen PE, Kolonicny A, Lycka A: Deuterium isotope effects on C-13 nuclear shielding of amino and acetamido compounds - tautomerism and intramolecular hydrogen-bonding. Magnetic Resonance in Chemistry 1992, 30:786-795. 112. Yu JJ, Chang PK, Ehrlich KC, Cary JW, Bhatnagar D, Cleveland TE, Payne GA, Linz JE, Woloshuk CP, Bennett JW: Clustered pathway genes in aflatoxin biosynthesis. Applied and Environmental Microbiology 2004, 70:1253-1262. Literaturverzeichnis 259 113. Wang CCC, Chiang YM, Kuo PL, Chang JK, Hsu YL: Norsolorinic acid from Aspergillus nidulans inhibits the proliferation of human breast adenocarcinoma MCF-7 cells via fas-mediated pathway. Basic & Clinical Pharmacology & Toxicology 2008, 102:491-497. 114. Marzouk MS, El Toumy SAA, Merfort I, Nawwar MAM: Polyphenolic metabolites of Rhamnus disperma. Phytochemistry 1999, 52:943-946. 115. Butterweck V, Jurgenliemk G, Nahrstedt A, Winterhoff H: Flavonoids from Hypericum perforatum show antidepressant activity in the forced swimming test. Planta Medica 2000, 66:3-6. 116. Fukunaga T, Nishiya K, Kajikawa I, Watanabe Y, Suzuki N, Takeya K, Itokawa H: Chemical studies on the constituents of hyphear-tanakae hosokawa from different host trees. Chemical & Pharmaceutical Bulletin 1988, 36:1180-1184. 117. Sicherheitsdatenblatt. Sigma-Aldrich Chemie GmbH, München 2008. 118. Casellas M, Grifoll M, Bayona JM, Solanas AM: New metabolites in the degradation of fluorene by Arthrobacter sp. strain F101. Applied and Environmental Microbiology 1997, 63:819-826. 119. Carrupt PA, Testa B, Bechalany A, Eltayar N, Descas P, Perrissoud D: Morphine 6glucuronide and morphine 3-glucuronide as molecular chameleons with unexpected lipophilicity. Journal of Medicinal Chemistry 1991, 34:1272-1275. 120. Yamanaka H, Nakajima M, Hara Y, Katoh M, Tachibana O, Yamashita J, Yokoi T: Urinary excretion of phenytoin metabolites, 5-(4'-hydroxyphenyl)-5phenylhydantoin and its O-glucuronide in humans and analysis of genetic polymorphisms of UDP-glucuronosyltransferases. Drug Metabolism and Pharmacokinetics 2005, 20:135-143. 121. Trela BC, Waterhouse AL: Resveratrol: isomeric molar absorptivities and stability. Journal of Agricultural and Food Chemistry 1996, 44:1253-1257. 122. Bernard E, Britz-McKibbin P, Gernigon N: Resveratrol photoisomerization: an integrative guided-inquiry experiment. Journal of Chemical Education 2007, 84:1159-1161. 123. Albermann C, Soriano A, Jiang JQ, Vollmer H, Biggins JB, Barton WA, Lesniak J, Nikolov DB, Thorson JS: Substrate specificity of NovM: Implications for novobiocin biosynthesis and glycorandomization. Organic Letters 2003, 5:933-936. 124. Meyers CLF, Oberthür M, Anderson JW, Kahne D, Walsh CT: Initial characterization of novobiocic acid noviosyl transferase activity of NovM in biosynthesis of the antibiotic novobiocin. Biochemistry 2003, 42:4179-4189. 125. Hinman JW, Caron EL, Hoeksema H: The structure of novobiocin. Journal of the American Chemical Society 1957, 79:3789-3800. 260 Literaturverzeichnis 126. Steffensky M, Mühlenweg A, Wang ZX, Li SM, Heide L: Identification of the novobiocin biosynthetic gene cluster of Streptomyces spheroides NCIB 11891. Antimicrobial Agents and Chemotherapy 2000, 44:1214-1222. 127. Sebek OK, Dolak LA: Microbial hydroxylation of novobiocin and related compounds. Journal of Antibiotics 1984, 37:136-142. 128. Reusser F, Dolak LA: Novenamine is the active moiety in novobiocin. Journal of Antibiotics 1986, 39:272-274. 129. Lewis RJ, Singh OMP, Smith CV, Skarzynski T, Maxwell A, Wonacott AJ, Wigley DB: The nature of inhibition of DNA gyrase by the coumarins and the cyclothialidines revealed by X-ray crystallography. EMBO Journal 1996, 15:1412-1420. 130. Eustaquio AS, Gust B, Galm U, Li SM, Chater KF, Heide L: Heterologous expression of novobiocin and clorobiocin biosynthetic gene clusters. Applied and Environmental Microbiology 2005, 71:2452-2459. 131. Labeda DP, Testa RT, Lechevalier MP, Lechevalier HA: Saccharothrix - a new genus of the Actinomycetales related to Nocardiopsis. International Journal of Systematic Bacteriology 1984, 34:426-431. 132. Mcleod MP, Warren RL, Hsiao WWL, Araki N, Myhre M, Fernandes C, Miyazawa D, Wong W, Lillquist AL, Wang D, Dosanjh M, Hara H, Petrescu A, Morin RD, Yang G, Stott JM, Schein JE, Shin H, Smailus D, Siddiqui AS, Marra MA, Jones SJM, Holt R, Brinkman FSL, Miyauchi K, Fukuda M, Davies JE, Mohn WW, Eltis LD: The complete genome of Rhodococcus sp. RHA1 provides insights into a catabolic powerhouse. Proceedings of the National Academy of Sciences of the United States of America 2006, 103:15582-15587. 133. Rodriguez L, Aguirrezabalaga I, Allende N, Brana AF, Mendez C, Salas JA: Engineering deoxysugar biosynthetic pathways from antibiotic-producing microorganisms: a tool to produce novel glycosylated bioactive compounds. Chemistry & Biology 2002, 9:721-729. 134. Perez M, Lombo F, Zhu LL, Gibson M, Brana AF, Rohr R, Salas JA, Mendez C: Combining sugar biosynthesis genes for the generation of L- and D-amicetose and formation of two novel antitumor tetracenomycins. Chemical Communications 2005,1604-1606. 135. Decker H, Gaisser S, Pelzer S, Schneider P, Westrich L, Wohlleben W, Bechthold A: A general approach for cloning and characterizing dNDP-glucose dehydratase genes from actinomycetes. FEMS Microbiology Letters 1996, 141:195-201. 136. Gaisser S, Bühm GA, Cortes J, Leadlay PF: Analysis of seven genes from the eryAl/eryK region of the erythromycin biosynthetic gene cluster in Saccharopolyspora erythraea. Molecular & General Genetics 1997, 256:239-251. 137. Summers RG, Donadio S, Staver MJ, WendtPienkowski E, Hutchinson CR, Katz L: Sequencing and mutagenesis of genes from the erythromycin biosynthetic gene cluster of Saccharopolyspora erythraea that are involved in L-mycarose and Ddesosamine production. Microbiology-UK 1997, 143:3251-3262. Literaturverzeichnis 261 138. Waldron C, Madduri K, Crawford K, Merlo DJ, Treadway P, Broughton MC, Baltz RH: A cluster of genes for the biosynthesis of spinosyns, novel macrolide insect control agents produced by Saccharopolyspora spinosa. Antonie Van Leeuwenhoek International Journal of General and Molecular Microbiology 2000, 78:385-390. 139. Ramos A, Lombo F, Brana AF, Rohr J, Mendez C, Salas JA: Biosynthesis of elloramycin in Streptomyces olivaceus requires glycosylation by enzymes encoded outside the aglycon cluster. Microbiology-SGM 2008, 154:781-788. 140. Blanco G, Patallo EP, Brana AF, Trefzer A, Bechthold A, Rohr J, Mendez C, Salas JA: Identification of a sugar flexible glycosyltransferase from Streptomyces olivaceus, the producer of the antitumor polyketide elloramycin. Chemistry & Biology 2001, 8:253-263. 141. Ahlert J, Shepard E, Lomovskaya N, Zazopoulos E, Staffa A, Bachmann BO, Huang KX, Fonstein L, Czisny A, Whitwam RE, Farnet CM, Thorson JS: The calicheamicin gene cluster and its iterative type I enediyne PKS. Science 2002, 297:1173-1176. 142. Miyamoto Y, Johdo O, Nagamatsu Y, Yoshimoto A: Cloning and characterization of a glycosyltransferase gene involved in the biosynthesis of anthracycline antibiotic beta-rhodomycin from Streptomyces violaceus. FEMS Microbiology Letters 2002, 206:163-168. 143. Rose TM, Schultz ER, Henikoff JG, Pietrokovski S, McCallum CM, Henikoff S: Consensus-degenerate hybrid oligonucleotide primers for amplification of distantly related sequences. Nucleic Acids Research 1998, 26:1628-1635. 144. Wright F, Bibb MJ: Codon usage in the G+C-rich Streptomyces genome. Gene 1992, 113:55-65. 145. Luzhetskyy A, Weiss H, Charge A, Welle E, Linnenbrink A, Vente A, Bechthold A: A strategy for cloning glycosyltransferase genes involved in natural product biosynthesis. Applied Microbiology and Biotechnology 2007, 75:1367-1375. 146. Xue YQ, Zhao LS, Liu HW, Sherman DH: A gene cluster for macrolide antibiotic biosynthesis in Streptomyces venezuelae: Architecture of metabolic diversity. Proceedings of the National Academy of Sciences of the United States of America 1998, 95:12111-12116. 147. Volchegursky Y, Hu ZH, Katz L, McDaniel R: Biosynthesis of the anti-parasitic agent megalomicin: transformation of erythromycin to megalomicin in Saccharopolyspora erythraea. Molecular Microbiology 2000, 37:752-762. 148. Berner M: Molekularbiologische Untersuchungen zur Biosynthese der Oligosaccharid-Antibiotika Saccharomicin A und B in Saccharothrix espanaensis. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2006. 149. Hernandez C, Olano C, Mendez C, Salas JA: Characterization of a Streptomyces antibioticus gene cluster encoding a glycosyltransferase involved in oleandomycin inactivation. Gene 1993, 134:139-140. 262 Literaturverzeichnis 150. Gust B, Kieser T, Chater KF: PCR targeting system in Streptomyces coelicolor A3(2). John Innes Centre, Norwich, UK 2002. 151. http://streptomyces.org.uk/redirect/index.html 2008. 152. Magalhaes MLB, Blanchard JS: The kinetic mechanism of AAC(3)-IV aminoglycoside acetyltransferase from Escherichia coli. Biochemistry 2005, 44:16275-16283. 153. Clark NC, Olsvik O, Swenson JM, Spiegel CA, Tenover FC: Detection of a streptomycin/spectinomycin adenylyltransferase gene (aadA) in Enterococcus faecalis. Antimicrobial Agents and Chemotherapy 1999, 43:157-160. 154. Murakami T, Holt TG, Thompson CJ: Thiostrepton-induced gene-expression in Streptomyces lividans. Journal of Bacteriology 1989, 171:1459-1466. 155. Fedoryshyn M, Petzke L, Welle E, Bechthold A, Luzhetskyy A: Marker removal from actinomycetes genome using Flp recombinase. Gene 2008, 419:43-47. 156. Luzhetskyy A: persönliche Mitteilung 2007. 157. Peintner I: Monooxygenasen als Post-PKS modifizierende Enzyme in der aromatischen Polyketid Biosynthese von Polyketomycin und Simocyclinon D8. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2008. 158. Zhang W, Watanabe K, Wang CCC, Tang Y: Investigation of early tailoring reactions in the oxytetracycline biosynthetic pathway. Journal of Biological Chemistry 2007, 282:25717-25725. 159. von Mulert U: persönliche Mitteilung 2007. 160. Prestel A: Charakterisierung des Mensacarcin Biosynthesegenclusters aus Streptomyces sp. Gö C4/4. Diplomarbeit, Fachhochschule für Technik und Gestaltung Mannheim 2003. 161. Funa N, Funabashi M, Ohnishi Y, Horinouchi S: Biosynthesis of hexahydroxyperylenequinone melanin via oxidative aryl coupling by cytochrome P-450 in Streptomyces griseus. Journal of Bacteriology 2005, 187:8149-8155. 162. Bode HB, Bethe B, Hofs R, Zeeck A: Big effects from small changes: possible ways to explore nature's chemical diversity. ChemBioChem 2002, 3:619-627. 163. Mao YQ, Varoglu M, Sherman DH: Molecular characterization and analysis of the biosynthetic gene cluster for the antitumor antibiotic mitomycin C from Streptomyces lavendulae NRRL 2564. Chemistry & Biology 1999, 6:251-263. 164. Wang LY, Li ST, Li YA: Identification and characterization of a new exopolysaccharide biosynthesis gene cluster from Streptomyces. FEMS Microbiology Letters 2003, 220:21-27. Literaturverzeichnis 263 165. Sciara G, Kendrew SG, Miele AE, Marsh NG, Federici L, Malatesta F, Schimperna G, Savino C, Vallone B: The structure of ActVA-Orf6, a novel type of monooxygenase involved in actinorhodin biosynthesis. EMBO Journal 2003, 22:205-215. 166. Rafanan ER, Hutchinson CR, Shen B: Triple hydroxylation of tetracenomycin A2 to tetracenomycin C involving two molecules of O2 and one molecule of H2O. Organic Letters 2000, 2:3225-3227. 167. Taguchi T, Itou K, Ebizuka Y, Malpartida F, Hopwood DA, Surti CM, Booker-Milburn KI, Stephenson GR, Ichinose K: Chemical characterisation of disruptants of the Streptomyces coelicolor A3(2) actVI genes involved in actinorhodin biosynthesis. Journal of Antibiotics 2000, 53:144-152. 168. Ichinose K, Ozawa M, Itou K, Kunieda K, Ebizuka Y: Cloning, sequencing and heterologous expression of the medermycin biosynthetic gene cluster of Streptomyces sp. AM-7161: towards comparative analysis of the benzoisochromanequinone gene clusters. Microbiology-SGM 2003, 149:1633-1645. 169. Li AY, Piel J: A gene cluster from a marine Streptomyces encoding the biosynthesis of the aromatic spiroketal polyketide griseorhodin A. Chemistry & Biology 2002, 9:1017-1026. 170. Fischbach M, Ward D, Young S, Jaffe D, Gnerre S, Berlin A, Heiman D, Hepburn T, Sykes S, Alvarado L, Kodira CD, Straight P, Clardy J, Hung D, Kolter R, Mekalanos J, Walker S, Walsh CT, Lander E, Galagan J, Nusbaum C, Birren B: Streptomyces sp. Mg1 - whole genome shotgun sequence. NCBI database, www.ncbi.nlm.nih.gov 2008. 171. Lykidis A, Mavromatis K, Ivanova N, Anderson I, Land M, DiBartolo G, Martinez M, Lapidus A, Lucas S, Copeland A, Richardson P, Wilson DB, Kyrpides N: Genome sequence and analysis of the soil cellulolytic actinomycete Thermobifida fusca YX. Journal of Bacteriology 2007, 189:2477-2486. 172. Menendez N, Nur-e-Alam, Brana AF, Rohr J, Salas AF, Mendez C: Biosynthesis of the antitumor chromomycin A(3) in Streptomyces griseus: analysis of the gene cluster and rational design of novel chromomycin analogs. Chemistry & Biology 2004, 11:21-32. 173. Räty K, Kantola J, Hautala A, Hakala J, Ylihonko K, Mäntsälä P: Cloning and characterization of Streptomyces galilaeus aclacinomycins polyketide synthase (PKS) cluster. Gene 2002, 293:115-122. 174. Garrido LM, Lombo F, Baig I, Nur-e-Alam, Furlan RLA, Borda CC, Brana A, Mendez C, Salas JA, Rohr J, Padilla G: Insights in the glycosylation steps during biosynthesis of the antitumor anthracycline cosmomycin: characterization of two glycosyltransferase genes. Applied Microbiology and Biotechnology 2006, 73:122-131. 175. Oliynyk M, Samborskyy M, Lester JB, Mironenko T, Scott N, Dickens S, Haydock SF, Leadlay PF: Complete genome sequence of the erythromycin-producing bacterium Saccharopolyspora erythraea NRRL23338. Nature Biotechnology 2007, 25:447-453. 264 Literaturverzeichnis 176. Normand P, Lapierre P, Tisa LS, Gogarten JP, Alloisio N, Bagnarol E, Bassi CA, Berry AM, Bickhart DM, Choisne N, Couloux A, Cournoyer B, Cruveiller S, Daubin V, Demange N, Francino MP, Goltsman E, Huang Y, Kopp OR, Labarre L, Lapidus A, Lavire C, Marechal J, Martinez M, Mastronunzio JE, Mullin BC, Niemann J, Pujic P, Rawnsley T, Rouy Z, Schenowitz C, Sellstedt A, Tavares F, Tomkins JP, Vallenet D, Valverde C, Wall LG, Wang Y, Medigue C, Benson DR: Genome characteristics of facultatively symbiotic Frankia sp. strains reflect host range and host plant biogeography. Genome Research 2007, 17:7-15. 177. Copeland A, Lucas S, Lapidus A, Barry K, Detter JC, Glavina del Rio T, Hammon N, Israni S, Dalin E, Tice H, Pitluck S, Munk AC, Brettin T, Bruce D, Han C, Tapia R, Gilna P, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Lykidis A, da Costa MS, Rainey FA, Empadinhas N, Jolivet E, Battista JR, Richardson P: Complete sequence of Rubrobacter xylanophilus DSM 9941. NCBI database, www.ncbi.nlm.nih.gov 2006. 178. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Dalin E, Tice H, Pitluck S, Mendez C, Brettin T, Bruce D, Detter JC, Han C, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Miller JF, Pozidis C, Xu H, Hakala J, Richardson P: Complete sequence of Polynucleobacter sp. QLW-P1DWA-1. NCBI database, www.ncbi.nlm.nih.gov 2007. 179. Ylihonko K, Tuikkanen J, Jussila S, Cong LN, Mäntsälä P: A gene cluster involved in nogalamycin biosynthesis from Streptomyces nogalater: Sequence analysis and complementation of early block mutations in the anthracycline pathway. Molecular & General Genetics 1996, 251:113-120. 180. Mochizuki S, Hiratsu K, Suwa M, Ishii T, Sugino F, Yamada K, Kinashi H: The large linear plasmid pSLA2-L of Streptomyces rochei has an unusually condensed gene organization for secondary metabolism. Molecular Microbiology 2003, 48:15011510. 181. Goldman BS, Nierman WC, Kaiser D, Slater SC, Durkin AS, Eisen J, Ronning CM, Barbazuk WB, Blanchard M, Field C, Halling C, Hinkle G, Iartchuk O, Kim HS, Mackenzie C, Madupu R, Miller N, Shvartsbeyn A, Sullivan SA, Vaudin M, Wiegand R, Kaplan HB: Evolution of sensory complexity recorded in a myxobacterial genome. Proceedings of the National Academy of Sciences of the United States of America 2006, 103:15200-15205. 182. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Hammon N, Israni S, Dalin E, Tice H, Pitluck S, Saunders E, Brettin T, Bruce D, Detter JC, Han C, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Kim E, Richardson P: Complete sequence of Frankia sp. EAN1pec. NCBI database, www.ncbi.nlm.nih.gov 2007. 183. Jia XY, Tian ZH, Shao L, Qu XD, Zhao QF, Tang J, Tang GL, Liu W: Genetic characterization of the chlorothricin gene cluster as a model for spirotetronate antibiotic biosynthesis. Chemistry & Biology 2006, 13:575-585. Literaturverzeichnis 265 184. Kaneko T, Nakamura Y, Sato S, Asamizu E, Kato T, Sasamoto S, Watanabe A, Idesawa K, Ishikawa A, Kawashima K, Kimura T, Kishida Y, Kiyokawa C, Kohara M, Matsumoto M, Matsuno A, Mochizuki Y, Nakayama S, Nakazaki N, Shimpo S, Sugimoto M, Takeuchi C, Yamada M, Tabata S: Complete genome structure of the nitrogen-fixing symbiotic bacterium Mesorhizobium loti. DNA Research 2000, 7:331338. 185. Chung JY, Fujii I, Harada S, Sankawa U, Ebizuka Y: Expression, purification, and characterization of AknX anthrone oxygenase, which is involved in aklavinone biosynthesis in Streptomyces galilaeus. Journal of Bacteriology 2002, 184:6115-6122. 186. Yukawa H, Omumasaba CA, Nonaka H, Kos P, Okai N, Suzuki N, Suda M, Tsuge Y, Watanabe J, Ikeda Y, Vertes AA, Inui M: Comparative analysis of the Corynebacterium glutamicum group and complete genome sequence of strain R. Microbiology-SGM 2007, 153:1042-1058. 187. Choulet F, Aigle B, Gallois A, Mangenot S, Gerbaud C, Truong C, Francou FX, Fourrier C, Guerineau M, Decaris B, Barbe V, Pernodet JL, Leblond P: Evolution of the terminal regions of the Streptomyces linear chromosome. Molecular Biology and Evolution 2006, 23:2361-2369. 188. Kern DL, Schaumberg JP, Hokanson GC, French JC: Pd-116,779, a new antitumor antibiotic of the benz[a]anthraquinone class. Journal of Antibiotics 1986, 39:469470. 189. Martinez R, Kesternich V, Carrasco H, Alvarez-Contreras C, Montenegro C, Ugarte R, Gutierrez E, Moreno J, Garcia C, Werner E, Carcamo J: Synthesis and conformational analysis of leptocarpin derivatives. Influence of modification of the oxirane ring on leptocarpin's cytotoxic activity. Journal of the Chilean Chemical Society 2006, 51:1010-1014. 190. Hertweck C: persönliche Mitteilung 2008. 191. van Berkel WJH, Kamerbeek NM, Fraaije MW: Flavoprotein monooxygenases, a diverse class of oxidative biocatalysts. Journal of Biotechnology 2006, 124:670-689. 192. Choi H, Tang CK, Tu SC: Catalytically active forms of the individual subunits of Vibrio harveyi luciferase and their kinetic and binding-properties. Journal of Biological Chemistry 1995, 270:16813-16819. 193. Bibb MJ: Regulation of secondary metabolism in streptomycetes. Current Opinion in Microbiology 2005, 8:208-215. 194. Challis GL: Genome mining for novel natural product discovery. Journal of Medicinal Chemistry 2008, 51:2618-2628. 195. Wietzorrek A, Bibb M: A novel family of proteins that regulates antibiotic production in streptomycetes appears to contain an OmpR-like DNA-binding fold. Molecular Microbiology 1997, 25:1181-1184. 266 Literaturverzeichnis 196. Stutzmanengwall KJ, Otten SL, Hutchinson CR: Regulation of secondary metabolism in Streptomyces spp. and overproduction of daunorubicin in Streptomyces peucetius. Journal of Bacteriology 1992, 174:144-154. 197. Lomovska ND, Danilenk VN, Gostimsk NL, Mkrtumia NM: Characterization of temperate actinophage phiC31 isolated from Streptomyces coelicolor A3(2). Journal of Virology 1972, 9:258-262. 198. Narva KE, Feitelson JS: Nucleotide-sequence and transcriptional analysis of the redD locus of Streptomyces coelicolor A3(2). Journal of Bacteriology 1990, 172:326333. 199. Schmittjohn T, Engels JW: Promoter constructions for efficient secretion expression in Streptomyces lividans. Applied Microbiology and Biotechnology 1992, 36:493-498. 200. Metsä-Ketelä M, Salo V, Halo L, Hautala A, Hakala J, Mäntsälä P, Ylihonko K: An efficient approach for screening minimal PKS genes from Streptomyces. FEMS Microbiology Letters 1999, 180:1-6. 201. Komaki H, Harper D: Sequence diversity of type-II polyketide synthase genes in Streptomyces. Actinomycetologica 2006, 20:42-48. 202. BLAST. http://www.ncbi.nlm.nih.gov/blast/index.html 2008. 203. Bonetta L: Genome sequencing in the fast lane. Nature Methods 2006, 3:141-147. 204. Maier T: persönliche Mitteilung 2008. 205. Lesnik EA, Sampath R, Levene HB, Henderson TJ, Mcneil JA, Ecker DJ: Prediction of rho-independent transcriptional terminators in Escherichia coli. Nucleic Acids Research 2001, 29:3583-3594. 206. Kelemen GH, Brian P, Flardh K, Chamberlin L, Chater KF, Buttner MJ: Developmental regulation of transcription of whiE, a locus specifying the polyketide spore pigment in Streptomyces coelicolor A3(2). Journal of Bacteriology 1998, 180:2515-2521. 207. Novakova R, Bistakova J, Kormanec J: Characterization of the polyketide spore pigment cluster whiESa in Streptomyces aureofaciens CCM3239. Archives of Microbiology 2004, 182:388-395. 208. Hochschild A, Dove SL: Protein-protein contacts that activate and repress prokaryotic transcription. Cell 1998, 92:597-600. 209. Martin R, Bailey JE, Minas W: Putative spore pigment polyketide synthase cluster from Streptomyces collinus DSM2012. NCBI database, www.ncbi.nlm.nih.gov 2000. 210. Davis NK, Chater KF: Spore color in Streptomyces coelicolor A3(2) involves the developmentally regulated synthesis of a compound biosynthetically related to polyketide antibiotics. Molecular Microbiology 1990, 4:1679-1691. Literaturverzeichnis 267 211. Blanco G, Pereda A, Brian P, Mendez C, Chater KF, Salas JA: A hydroxylase-like gene-product contributes to synthesis of a polyketide spore pigment in Streptomyces halstedii. Journal of Bacteriology 1993, 175:8043-8048. 212. Bergh S, Uhlen M: Analysis of a polyketide synthesis-encoding gene-cluster of Streptomyces curacoi. Gene 1992, 117:131-136. 213. Yu TW, Shen YM, McDaniel R, Floss HG, Khosla C, Hopwood DA, Moore BS: Engineered biosynthesis of novel polyketides from Streptomyces spore pigment polyketide synthases. Journal of the American Chemical Society 1998, 120:7749-7759. 214. Alvarez MA, Fu H, Khosla C, Hopwood DA, Bailey JE: Engineered biosynthesis of novel polyketides: Properties of the WhiE aromatase/cyclase. Nature Biotechnology 1996, 14:335-338. 215. Yu TW, Hopwood DA: Ectopic expression of the Streptomyces coelicolor whiE genes for polyketide spore pigment synthesis and their interaction with the act genes for actinorhodin biosynthesis. Microbiology-UK 1995, 141:2779-2791. 216. Funa N, Funabashi M, Yoshimura E, Horinouchi S: A novel quinone-forming monooxygenase family involved in modification of aromatic polyketides. Journal of Biological Chemistry 2005, 280:14514-14523. 217. Marchler-Bauer A, Anderson JB, Derbyshire MK, DeWeese-Scott C, Gonzales NR, Gwadz M, Hao LN, He SQ, Hurwitz DI, Jackson JD, Ke ZX, Krylov D, Lanczycki CJ, Liebert CA, Liu CL, Lu F, Lu SN, Marchler GH, Mullokandov M, Song JS, Thanki N, Yamashita RA, Yin JJ, Zhang DC, Bryant SH: CDD: a conserved domain database for interactive domain family analysis. Nucleic Acids Research 2007, 35:D237-D240. 218. Sherman DH, Kim ES, Bibb MJ, Hopwood DA: Functional replacement of genes for individual polyketide synthase components in Streptomyces coelicolor A3(2) by heterologous genes from a different polyketide pathway. Journal of Bacteriology 1992, 174:6184-6190. 219. Bibb MJ, Findlay PR, Johnson MW: The relationship between base composition and codon usage in bacterial genes and its use for the simple and reliable identification of protein-coding sequences. Gene 1984, 30:157-166. 220. Shine J, Dalgarno L: The 3-prime terminal sequence of Escherichia coli 16S ribosomal RNA complementarity to nonsense triplets and ribosome binding sites. Proceedings of the National Academy of Sciences of the United States of America 1974, 71:1342-1346. 221. Bibb MJ, Cohen SN: Gene-expression in Streptomyces - construction and application of promoter-probe plasmid vectors in Streptomyces lividans. Molecular & General Genetics 1982, 187:265-277. 222. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Tice H, Pitluck S, Sun H, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Kim E, Jensen P, Moore BS, Udwary D, Richardson P: Complete sequence of Salinispora tropica CNB-440. NCBI database, www.ncbi.nlm.nih.gov 2007. 268 Literaturverzeichnis 223. Ishikawa J, Yamashita A, Mikami Y, Hoshino Y, Kurita H, Hotta K, Shiba T, Hattori M: The complete genomic sequence of Nocardia farcinica IFM 10152. Proceedings of the National Academy of Sciences of the United States of America 2004, 101:1492514930. 224. Salanoubat M, Genin S, Artiguenave F, Gouzy J, Mangenot S, Arlat M, Billault A, Brottier P, Camus JC, Cattolico L, Chandler M, Choisne N, Claudel-Renard C, Cunnac S, Demange N, Gaspin C, Lavie M, Moisan A, Robert C, Saurin W, Schiex T, Siguier P, Thebault P, Whalen M, Wincker P, Levy M, Weissenbach J, Boucher CA: Genome sequence of the plant pathogen Ralstonia solanacearum. Nature 2002, 415:497-502. 225. Xu Z, Schenk A, Hertweck C: Molecular analysis of the benastatin biosynthetic pathway and genetic engineering of altered fatty acid-polyketide hybrids. Journal of the American Chemical Society 2007, 129:6022-6030. 226. Pulsawat N, Kitani S, Nihira T: Characterization of biosynthetic gene cluster for the production of virginiamycin M, a streptogramin type A antibiotic, in Streptomyces virginiae. Gene 2007, 393:31-42. 227. Bechthold A, Sohng JK, Smith TM, Chu X, Floss HG: Identification of Streptomyces violaceoruber Tü22 genes involved in the biosynthesis of granaticin. Molecular & General Genetics 1995, 248:610-620. 228. Ichinose K, Bedford DJ, Bibb MJ, Revill WP, Hopwood DA: The granaticin biosynthetic gene cluster of Streptomyces violaceoruber Tü22: sequence analysis and expression in a heterologous host. Chemistry & Biology 1998, 5:647-659. 229. Fleischmann RD, Dodson RJ, Haft DH, Merkel JS, Nelson WC, Fraser CM: Complete sequence of Mycobacterium avium 104. NCBI database, www.ncbi.nlm.nih.gov 2006. 230. Torkkell S, Ylihonko K, Hakala J, Skurnik M, Mäntsälä P: Characterization of Streptomyces nogalater genes encoding enzymes involved in glycosylation steps in nogalamycin biosynthesis. Molecular & General Genetics 1997, 256:203-209. 231. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Dalin E, Tice H, Pitluck S, Foster B, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Ivanova N, Jensen P, Moore BS, Penn K, Jenkins C, Udwary D, Xiang L, Gotang E, Richardson P: Complete sequence of Salinispora arenicola CNS-205. NCBI database, www.ncbi.nlm.nih.gov 2007. 232. Xu ZG, Jakobi K, Welzel K, Hertweck C: Biosynthesis of the antitumor agent chartreusin involves the oxidative rearrangement of an anthracyclic polyketide. Chemistry & Biology 2005, 12:579-588. 233. Halo L, Wang Y, Mäntsälä P, Hakala J, Ylihonko K: Characterization of the gene cluster involved in rhodomycin biosynthesis. NCBI database, www.ncbi.nlm.nih.gov 2001. 234. Jansson A, Niemi J, Lindqvist Y, Mäntsälä P, Schneider G: Crystal structure of aclacinomycin-10-hydroxylase, a S-adenosyl-L-methionine-dependent methyltransferase homolog involved in anthracycline biosynthesis in Streptomyces purpurascens. Journal of Molecular Biology 2003, 334:269-280. Literaturverzeichnis 269 235. McDaniel R, Ebertkhosla S, Hopwood DA, Khosla C: Engineered biosynthesis of novel polyketides - act(VII) and act(IV) genes encode aromatase and cyclase enzymes, respectively. Journal of the American Chemical Society 1994, 116:1085510859. 236. Trefzer A, Pelzer S, Schimana J, Stockert S, Bihlmaier C, Fiedler HP, Welzel K, Vente A, Bechthold A: Biosynthetic gene cluster of simocyclinone, a natural multihybrid antibiotic. Antimicrobial Agents and Chemotherapy 2002, 46:1174-1182. 237. Hallam SE, Malpartida F, Hopwood DA: Nucleotide-sequence, transcription and deduced function of a gene involved in polyketide antibiotic-synthesis in Streptomyces coelicolor. Gene 1988, 74:305-320. 238. Fu H, Ebertkhosla S, Hopwood DA, Khosla C: Engineered biosynthesis of novel polyketides - dissection of the catalytic specificity of the Act ketoreductase. Journal of the American Chemical Society 1994, 116:4166-4170. 239. Zawada RJX, Khosla C: Heterologous expression, purification, reconstitution and kinetic analysis of an extended type II polyketide synthase. Chemistry & Biology 1999, 6:607-615. 240. Zhang X, Alernany LB, Fiedler HP, Goodfellow M, Parry RJ: Biosynthetic investigations of lactonamycin and lactonamycin Z: Cloning of the biosynthetic gene clusters and discovery of an unusual starter unit. Antimicrobial Agents and Chemotherapy 2008, 52:574-585. 241. Mosher RH, Paradkar AS, Anders C, Barton B, Jensen SE: Genes specific for the biosynthesis of clavam metabolites antipodal to clavulanic acid are clustered with the gene for clavaminate synthase 1 in Streptomyces clavuligerus. Antimicrobial Agents and Chemotherapy 1999, 43:1215-1224. 242. Yin XH, Mahadevan B, Grochowski L, Proteau PJ: Molecular cloning and sequence of the kinamycin angucycline type II polyketide synthase gene cluster from Streptomyces murayamaensis. NCBI database, www.ncbi.nlm.nih.gov 2003. 243. Haagen Y, Glück K, Fay K, Kammerer B, Gust B, Heide L: A gene cluster for prenylated naphthoquinone and prenylated phenazine biosynthesis in Streptomyces cinnamonensis DSM 1042. ChemBioChem 2006, 7:2016-2027. 244. Butler AR, Gandecha AR, Cundliffe E: Influence of ancillary genes, encoding aspects of methionine metabolism, on tylosin biosynthesis in Streptomyces fradiae. Journal of Antibiotics 2001, 54:642-649. 245. Li L, Deng W, Song J, Ding W, Zhao QF, Peng C, Song WW, Tang GL, Liu W: Characterization of the saframycin A gene cluster from Streptomyces lavendulae NRRL 11002 revealing a nonribosomal peptide synthetase system for assembling the unusual tetrapeptidyl skeleton in an iterative manner. Journal of Bacteriology 2008, 190:251-263. 270 Literaturverzeichnis 246. Zhang WJ, Ames BD, Tsai SC, Tang Y: Engineered biosynthesis of a novel amidated polyketide, using the malonamyl-specific initiation module from the oxytetracycline polyketide synthase. Applied and Environmental Microbiology 2006, 72:2573-2580. 247. Jakobi K, Hertweck C: A gene cluster encoding resistomycin biosynthesis in Streptomyces resistomycificus; exploring polyketide cyclization beyond linear and angucyclic patterns. Journal of the American Chemical Society 2004, 126:2298-2299. 248. Marti T, Hu ZH, Pohl NL, Shah AN, Khosla C: Cloning, nucleotide sequence, and heterologous expression of the biosynthetic gene cluster for R1128, a non-steroidal estrogen receptor antagonist - insights into an unusual priming mechanism. Journal of Biological Chemistry 2000, 275:33443-33448. 249. Grimm A, Madduri K, Ali A, Hutchinson CR: Characterization of the Streptomyces peucetius ATCC-29050 genes encoding doxorubicin polyketide synthase. Gene 1994, 151:1-10. 250. Lackner G, Schenk A, Xu Z, Reinhardt K, Yunt ZS, Piel J, Hertweck C: Biosynthesis of pentangular polyphenols: Deductions from the benastatin and griseorhodin pathways. Journal of the American Chemical Society 2007, 129:9306-9312. 251. Torkkell S, Kunnari T, Palmu K, Mäntsälä P, Hakala J, Ylihonko K: The entire nogalamycin biosynthetic gene cluster of Streptomyces nogalater: characterization of a 20 kb DNA region and generation of hybrid structures. Molecular Genetics and Genomics 2001, 266:276-288. 252. Räty K, Kunnari T, Hakala J, Mäntsälä P, Ylihonko K: A gene cluster from Streptomyces galilaeus involved in glycosylation of aclarubicin. Molecular and General Genetics 2000, 264:164-172. 253. Wilson T, Hastings JW: Bioluminescence. Annual Review of Cell and Developmental Biology 1998, 14:197-230. 254. Freiberg C, Fellay R, Bairoch A, Broughton WJ, Rosenthal A, Perret X: Molecular basis of symbiosis between Rhizobium and legumes. Nature 1997, 387:394-401. 255. He WQ, Wang YG: [Cloning and analysis of geldanamycin partial biosynthetic gene cluster of Streptomyces hygroscopicus 17997]. Sheng Wu Gong Cheng Xue Bao 2006, 22:902-906. Sequenzdaten bei der NCBI-Datenbank, www.ncbi.nlm.nih.gov. 256. He WQ, Lei J, Liu YY, Wang YG: The LuxR family members GdmRI and GdmRII are positive regulators of geldanamycin biosynthesis in Streptomyces hygroscopicus 17997. Archives of Microbiology 2008, 189:501-510. 257. Peschke U, Schmidt H, Zhang HZ, Piepersberg W: Molecular characterization of the lincomycin production gene-cluster of Streptomyces lincolnensis 78-11. Molecular Microbiology 1995, 16:1137-1156. 258. Neußer D: Untersuchungen zur Biosynthese der Propylprolin-Untereinheit des Antibiotikums Lincomycin A aus Streptomyces lincolnensis. Dissertation, Bergische Universität Wuppertal 1999. Literaturverzeichnis 271 259. Blanc V, Lagneaux D, Didier P, Gil P, Lacroix P, Crouzet J: Cloning and analysis of structural genes from Streptomyces pristinaespiralis encoding enzymes involved in the conversion of pristinamycin-IIB to Pristinamycin-IIA (PIIA) - PIIA synthase and NADH-riboflavin 5'-phosphate oxidoreductase. Journal of Bacteriology 1995, 177:5206-5214. 260. Aufhammer SW, Warkentin E, Ermler U, Hagemeier CH, Thauer RK, Shima S: Crystal structure of methylenetetrahydromethanopterin reductase (Mer) in complex with coenzyme F420: Architecture of the F-420/FMN binding site of enzymes within the nonprolyl cis-peptide containing bacterial luciferase family. Protein Science 2005, 14:1840-1849. 261. Aufhammer SW, Warkentin E, Berk H, Shima S, Thauer RK, Ermler U: Coenzyme binding in F-420-dependent secondary alcohol dehydrogenase, a member of the bacterial luciferase family. Structure 2004, 12:361-370. 262. Fisher AJ, Raushel FM, Baldwin TO, Rayment I: 3-Dimensional structure of bacterial luciferase from Vibrio harveyi at 2.4 Angstrom resolution. Biochemistry 1995, 34:6581-6586. 263. Xin X, Xi L, Tu SC: Functional consequences of site-directed mutation of conserved histidyl residues of the bacterial luciferase alpha-subunit. Biochemistry 1991, 30:11255-11262. 264. Huang SQ, Tu SC: Identification and characterization of a catalytic base in bacterial luciferase by chemical rescue of a dark mutant. Biochemistry 1997, 36:14609-14615. 265. Moore C, Lei BF, Tu SC: Relationship between the conserved a subunit arginine 107 and effects of phosphate on the activity and stability of Vibrio harveyi luciferase. Archives of Biochemistry and Biophysics 1999, 370:45-50. 266. Meighen EA, Nicoli MZ, Hastings JW: Functional differences of nonidentical subunits of bacterial luciferase - properties of hybirds of native and chemically modified bacterial luciferase. Biochemistry 1971, 10:4069-4073. 267. Valton J, Fontecave M, Douki T, Kendrew SG, Niviere V: An aromatic hydroxylation reaction catalyzed by a two-component FMN-dependent monooxygenase - The ActVA-ActVB system from Streptomyces coelicolor. Journal of Biological Chemistry 2006, 281:27-35. 268. Shen B, Hutchinson CR: Tetracenomycin F1-monooxygenase - oxidation of a naphthacenone to a naphthacenequinone in the biosynthesis of tetracenomycin-C in Streptomyces glaucescens. Biochemistry 1993, 32:6656-6663. 269. Kendrew SG, Hopwood DA, Marsh ENG: Identification of a monooxygenase from Streptomyces coelicolor A3(2) involved in biosynthesis of actinorhodin: Purification and characterization of the recombinant enzyme. Journal of Bacteriology 1997, 179:4305-4310. 272 Literaturverzeichnis 270. Wendt-Pienkowski E, Huang Y, Zhang J, Li BS, Jiang H, Kwon HJ, Hutchinson CR, Shen B: Cloning, sequencing, analysis, and heterologous expression of the fredericamycin biosynthetic gene cluster from Streptomyces griseus. Journal of the American Chemical Society 2005, 127:16442-16452. 271. Ye JS, Dickens ML, Plater R, Li Y, Lawrence J, Strohl WR: Isolation and sequenceanalysis of polyketide synthase genes from the daunomycin-producing Streptomyces sp. strain C5. Journal of Bacteriology 1994, 176:6270-6280. 272. Gullon S, Olano C, Abdelfattah MS, Brana AF, Rohr J, Mendez C, Salas JA: Isolation, characterization, and heterologous expression of the biosynthesis gene cluster for the antitumor anthracycline steffimycin. Applied and Environmental Microbiology 2006, 72:4172-4183. 273. Bililign T, Hyun CG, Williams JS, Czisny AM, Thorson JS: The hedamycin locus implicates a novel aromatic PKS priming mechanism. Chemistry & Biology 2004, 11:959-969. 274. Lombo F, Blanco G, Fernandez E, Mendez C, Salas JA: Characterization of Streptomyces argillaceus genes encoding a polyketide synthase involved in the biosynthesis of the antitumor mithramycin. Gene 1996, 172:87-91. 275. Kim BC, Lee JM, Ahn JS, Kim BS: Cloning, sequencing, and characterization of the pradimicin biosynthetic gene cluster of Actinomadura hibisca P157-2. Journal of Microbiology and Biotechnology 2007, 17:830-839. 276. Bibb MJ, Sherman DH, Omura S, Hopwood DA: Cloning, sequencing and deduced functions of a cluster of Streptomyces genes probably encoding biosynthesis of the polyketide antibiotic frenolicin. Gene 1994, 142:31-39. 277. Rafanan ER, Le L, Zhao LL, Decker H, Shen B: Cloning, sequencing, and heterologous expression of the elmGHIJ genes involved in the biosynthesis of the polyketide antibiotic elloramycin from Streptomyces olivaceus Tu2353. Journal of Natural Products 2001, 64:444-449. 278. Zhang XJ, Parry RJ: Cloning and characterization of the pyrrolomycin biosynthetic gene clusters from Actinosporangium vitaminophilum ATCC 31673 and Streptomyces sp. strain UC 11065. Antimicrobial Agents and Chemotherapy 2007, 51:946-957. 279. Rao PV, Krishna CM, Zigler JS: Identification and characterization of the enzymatic-activity of zeta-crystallin from guinea-pig lens - a novel NADPHquinone oxidoreductase. Journal of Biological Chemistry 1992, 267:96-102. 280. Wakil SJ: Mechanism of fatty acid synthesis. Journal of Lipid Research 1961, 2:1-24. 281. Tumminia SJ, Rao PV, Zigler JS, Russell P: Xenobiotic induction of quinone oxidoreductase activity in lens epithelial cells. Biochimica et Biophysica Acta 1993, 1203:251-259. Literaturverzeichnis 273 282. Schenk A, Xu ZL, Pfeiffer C, Steinbeck C, Hertweck C: Geminal bismethylation prevents polyketide oxidation and dimerization in the benastatin pathway. Angewandte Chemie-International Edition 2007, 46:7035-7038. 283. Gruschow S, Chang LC, Mao YQ, Sherman DH: Hydroxyquinone O-methylation in mitomycin biosynthesis. Journal of the American Chemical Society 2007, 129:64706476. 284. Sheldon PJ, Busarow SB, Hutchinson CR: Mapping the DNA-binding domain and target sequences of the Streptomyces peucetius daunorubicin biosynthesis regulatory protein, DnrI. Molecular Microbiology 2002, 44:449-460. 285. Leskiw BK, Lawlor EJ, Fernandezabalos JM, Chater KF: TTA-codons in some genes prevent their expression in a class of developmental, antibiotic-negative, Streptomyces mutants. Proceedings of the National Academy of Sciences of the United States of America 1991, 88:2461-2465. 286. Chater KF: Streptomyces inside-out: a new perspective on the bacteria that provide us with antibiotics. Philosophical Transactions of the Royal Society B-Biological Sciences 2006, 361:761-768. 287. White J, Bibb M: BldA dependence of undecylprodigiosin production in Streptomyces coelicolor A3(2) involves a pathway-specific regulatory cascade. Journal of Bacteriology 1997, 179:627-633. 288. Leskiw BK, Mah R, Lawlor EJ, Chater KF: Accumulation of BldA-specified transferRNA is temporally regulated in Streptomyces coelicolor A3(2). Journal of Bacteriology 1993, 175:1995-2005. 289. Fuqua WC, Winans SC, Greenberg EP: Quorum sensing in bacteria - the LuxRLuxI-family of cell density-responsive transcriptional regulators. Journal of Bacteriology 1994, 176:269-275. 290. Julien B, Tian ZQ, Reid R, Reeves CD: Analysis of the ambruticin and jerangolid gene clusters of Sorangium cellulosum reveals unusual mechanisms of polyketide biosynthesis. Chemistry & Biology 2006, 13:1277-1286. 291. Oliynyk M, Stark CBW, Bhatt A, Jones MA, Hughes-Thomas ZA, Wilkinson C, Oliynyk Z, Demydchuk Y, Staunton J, Leadlay PF: Analysis of the biosynthetic gene cluster for the polyether antibiotic monensin in Streptomyces cinnamonensis and evidence for the role of monB and monC genes in oxidative cyclization. Molecular Microbiology 2003, 49:1179-1190. 292. Sun YH, Zhou XF, Dong H, Tu GQ, Wang M, Wang BF, Deng ZX: A complete gene cluster from Streptomyces nanchangensis NS3226 encoding biosynthesis of the polyether ionophore nanchangmycin. Chemistry & Biology 2003, 10:431-441. 293. Hughes-Thomas ZA, Stark CBW, Bohm IU, Staunton J, Leadlay PF: Intermediates released from a polyether-producing polyketide synthase provide insight into the mechanism of oxidative cyclization. Angewandte Chemie-International Edition 2003, 42:4475-4478. 274 Literaturverzeichnis 294. Gould SJ, Hong ST, Carney JR: Cloning and heterologous expression of genes from the kinamycin biosynthetic pathway of Streptomyces murayamaensis. Journal of Antibiotics 1998, 51:50-57. 295. Diacovich L, Peiru S, Kurth D, Rodriguez E, Podesta F, Khosla C, Gramajo H: Kinetic and structural analysis of a new group of acyl-CoA carboxylases found in Streptomyces coelicolor A3(2). Journal of Biological Chemistry 2002, 277:3122831236. 296. Tukey RH, Strassburg CP: Human UDP-glucuronosyltransferases: Metabolism, expression, and disease. Annual Review of Pharmacology and Toxicology 2000, 40:581-616. 297. Lim EK, Bowles DJ: A class of plant glycosyltransferases involved in cellular homeostasis. EMBO Journal 2004, 23:2915-2922. 298. Piepersberg W: Biosynthesis of secondary carbohydrate components in actinomycetes and other bacteria: Perspectives of pathway engineering. Bioengineering (Graefelfing) 1994, 10:27-34. 299. Grond S: Die Bildung von 1-O-Acyl-alpha-L-rhamnosiden und anderen Metaboliten durch dirigierte Biosynthese mit Streptomyces griseoviridis (Tü3634) und Untersuchung ihrer Biogenese. Dissertation, Georg-August-Universität zu Göttingen 1997. 300. Rao KV, Weisner NT: Microbial transformation of quercetin by Bacillus cereus. Applied and Environmental Microbiology 1981, 42:450-452. 301. Ko JH, Kim BG, Ahn JH: Glycosylation of flavonoids with a glycosyltransferase from Bacillus cereus. FEMS Microbiology Letters 2006, 258:263-268. 302. Bitzer J, Zeeck A: 6-Deoxy-alpha-L-talopyranosides from Streptomyces sp. European Journal of Organic Chemistry 2006,3661-3666. 303. Eklund P, Holmström T, Al Ubaydy L, Sjöholm R, Hakala J: Rhamnosylation of lignans by a Streptomyces strain. Tetrahedron Letters 2006, 47:1645-1648. 304. Shibazaki M, Yamaguchi H, Sugawara T, Suzuki K, Yamamoto T: Microbial glycosylation and acetylation of brefeldin A. Journal of Bioscience and Bioengineering 2003, 96:344-348. 305. Hovorkov N, Cudlin J, Mateju J, Blumauer M, Vanek Z: Microbial glucosidation of alizarin and anthraflavin. Collection of Czechoslovak Chemical Communications 1974, 39:662-667. 306. Hovorkov N, Cudlin J, Mateju J, Blumauer M, Vanek Z: Microbial glucosidation of monohydroxyanthraquinones. Collection of Czechoslovak Chemical Communications 1974, 39:3568-3572. 307. Mateju J, Cudlin J, Hovorkov N, Blumauer M, Vanek Z: Microbial glucosidation of dihydroxyanthraquinones - general properties of glucosidation system. Folia Microbiologica 1974, 19:307-316. Literaturverzeichnis 275 308. Grond S, Langer HJ, Henne P, Sattler I, Thiericke R, Grabley S, Zähner H, Zeeck A: Secondary metabolites by chemical screening, 39 - Acyl alpha-Lrhamnopyranosides, a novel family of secondary metabolites from Streptomyces sp.: Isolation and biosynthesis. European Journal of Organic Chemistry 2000, 929937. 309. Grond S, Papastavrou I, Zeeck A: Studies of precursor-directed biosynthesis with streptomyces, 3 - Structural diversity of 1-O-acyl alpha-L-rhamnopyranosides by precursor-directed biosynthesis with Streptomyces griseoviridis. European Journal of Organic Chemistry 2000,1875-1881. 310. Grond S, Papastavrou I, Zeeck A: Studies of precursor-directed biosynthesis with Streptomyces, 4 - Novel alpha-L-rhamnopyranosides from a single strain of Streptomyces by supplement-induced biosynthetic steps. European Journal of Organic Chemistry 2002,3237-3242. 311. Zhang W, Ye M, Zhan JX, Chen YJ, Guo D: Microbial glycosylation of four free anthraquinones by Absidia coerulea. Biotechnology Letters 2004, 26:127-131. 312. Zhan JX, Gunatilaka AAL: Selective 4 '-O-methylglycosylation of the pentahydroxyflavonoid quercetin by Beauveria bassiana ATCC 7159. Biocatalysis and Biotransformation 2006, 24:396-399. 313. Kondo R, Yamagami H, Sakai K: Xylosylation of phenolic hydroxyl-groups of the monomeric lignin model compounds 4-methylguaiacol and vanillyl alcohol by Coriolus versicolor. Applied and Environmental Microbiology 1993, 59:438-441. 314. Kim HJ, Lee IS: Microbial metabolism of the prenylated chalcone xanthohumol. Journal of Natural Products 2006, 69:1522-1524. 315. Yuan W, Zhang LP, Cheng KD, Zhu P, Wang Q, He HX, Zhu HX: Microbial Odemethylation, hydroxylation, sulfation, and ribosylation of a xanthone derivative from Halenia elliptica. Journal of Natural Products 2006, 69:811-814. 316. Orabi KY, Clark AM, Hufford CD: Microbial transformation of benzosampangine. Journal of Natural Products 2000, 63:396-398. 317. Lim EK, Doucet CJ, Li Y, Elias L, Worrall D, Spencer SP, Ross J, Bowles DJ: The activity of Arabidopsis glycosyltransferases toward salicylic acid, 4-hydroxybenzoic acid, and other benzoates. Journal of Biological Chemistry 2002, 277:586-592. 318. Lim EK, Higgins GS, Li Y, Bowles DJ: Regioselectivity of glucosylation of caffeic acid by a UDP-glucose: glucosyltransferase is maintained in planta. Biochemical Journal 2003, 373:987-992. 319. Lim EK, Ashford DA, Hou BK, Jackson RG, Bowles DJ: Arabidopsis glycosyltransferases as biocatalysts in fermentation for regioselective synthesis of diverse quercetin glucosides. Biotechnology and Bioengineering 2004, 87:623-631. 320. Hirayama C, Ono H, Tamura Y, Konno K, Nakamura M: Regioselective formation of quercetin 5-O-glucoside from orally administered quercetin in the silkworm, Bombyx mori. Phytochemistry 2008, 69:1141-1149. 276 Literaturverzeichnis 321. Chen YK, Chen SQ, Li X, Zeng S: Quantitative regioselectivity of glucuronidation of quercetin by recombinant UDP-glucuronosyltransferases 1A9 and 1A3 using enzymatic kinetic parameters. Xenobiotica 2005, 35:943-954. 322. He XZ, Li WS, Blount JW, Dixon RA: Regioselective synthesis of plant (iso)flavone glycosides in Escherichia coli. Applied Microbiology and Biotechnology 2008, 80:253260. 323. Coffman BL, Rios GR, King CD, Tephly TR: Human UGT2B7 catalyzes morphine glucuronidation. Drug Metabolism and Disposition 1997, 25:1-4. 324. Cantarel BL, Coutinho PM, Rancurel C, Bernard T, Lombard V, Henrissat B: The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nucleic Acids Research 2008. 325. Jansen PL, Bosma PJ, Chowdhury JR: Molecular biology of bilirubin metabolism. Progress in Liver Diseases 1995, 13:125-150. 326. Owens IS, Ritter JK: Gene structure at the human UGT1 locus creates diversity in isozyme structure, substrate-specificity, and regulation. Progress in Nucleic Acid Research and Molecular Biology, Vol 51 1995, 51:305-338. 327. Ciotti M, Yeatman MT, Sokol RJ, Owens IS: Altered coding for a strictly conserved di-glycine in the major bilirubin UDP-glucuronosyltransferase of a Crigler-Najjar type I patient. Journal of Biological Chemistry 1995, 270:3284-3291. 328. Strassburg CP, Manns MP, Tukey RH: Differential down-regulation of the UDPglucuronosyltransferase 1A locus is an early event in human liver and biliary cancer. Cancer Research 1997, 57:2979-2985. 329. Nadia M, Giancarlo LM, Marzia I, FrancoF V, Nicoletta CP, Anacleto M: Cell cultures of Ajuga reptans L. to bioconvert emodin and aloe-emodin: an HPLC/ESI/MS investigation. Enzyme and Microbial Technology 2005, 36:399-408. 330. Lim EK, Ashford DA, Bowles DJ: The synthesis of small-molecule rhamnosides through the rational design of a whole-cell biocatalysis system. ChemBioChem 2006, 7:1181-1185. 331. Jackson RG, Kowalczyk M, Li Y, Higgins G, Ross J, Sandberg G, Bowles DJ: Overexpression of an Arabidopsis gene encoding a glucosyltransferase of indole-3-acetic acid: phenotypic characterisation of transgenic lines. Plant Journal 2002, 32:573583. 332. Chong J, Baltz R, Schmitt C, Beffa R, Fritig B, Saindrenan P: Downregulation of a pathogen-responsive tobacco UDP-Glc : phenylpropanoid glucosyltransferase reduces scopoletin glucoside accumulation, enhances oxidative stress, and weakens virus resistance. Plant Cell 2002, 14:1093-1107. 333. Poppenberger B, Berthiller F, Lucyshyn D, Sieberer T, Schuhmacher R, Krska R, Kuchler K, Glossl J, Luschnig C, Adam G: Detoxification of the Fusarium mycotoxin deoxynivalenol by a UDP-glucosyltransferase from Arabidopsis thaliana. Journal of Biological Chemistry 2003, 278:47905-47914. Literaturverzeichnis 277 334. Martinoia E, Klein M, Geisler M, Bovet L, Forestier C, Kolukisaoglu U, Müller-Rober B, Schulz B: Multifunctionality of plant ABC transporters - more than just detoxifiers. Planta 2002, 214:345-355. 335. WeymouthWilson AC: The role of carbohydrates in biologically active natural products. Natural Product Reports 1997, 14:99-110. 336. Luzhetskyy A, Bechthold A: Features and applications of bacterial glycosyltransferases: current state and prospects. Applied Microbiology and Biotechnology 2008, 80:945-952. 337. Borisova SA, Kim HJ, Pu XT, Liu HW: Glycosylation of acyclic and cyclic aglycone substrates by macrolide glycosyltransferase DesVII/DesVIII: Analysis and implications. ChemBioChem 2008, 9:1554-1558. 338. Dürr C, Hoffmeister D, Wohlert SE, Ichinose K, Weber M, von Mulert U, Thorson JS, Bechthold A: The glycosyltransferase UrdGT2 catalyzes both C- and O-glycosidic sugar transfers. Angewandte Chemie-International Edition 2004, 43:2962-2965. 339. Minami A, Uchida R, Eguchi T, Kakinuma K: Enzymatic approach to unnatural glycosides with diverse aglycon scaffolds using glycosyltransferase VinC. Journal of the American Chemical Society 2005, 127:6148-6149. 340. Quiros LM, Aguirrezabalaga I, Olano C, Mendez C, Salas JA: Two glycosyltransferases and a glycosidase are involved in oleandomycin modification during its biosynthesis by Streptomyces antibioticus. Molecular Microbiology 1998, 28:1177-1185. 341. Yang M, Proctor MR, Bolam DN, Errey JC, Field RA, Gilbert HJ, Davis BG: Probing the breadth of macrolide glycosyltransferases: in vitro remodeling of a polyketide antibiotic creates active bacterial uptake and enhances potency. Journal of the American Chemical Society 2005, 127:9336-9337. 342. Hatano T, Uebayashi H, Ito H, Shiota S, Tsuchiya T, Yoshida T: Phenolic constituents of Cassia seeds and antibacterial effect of some naphthalenes and anthraquinones on methicillin-resistant Staphylococcus aureus. Chemical & Pharmaceutical Bulletin 1999, 47:1121-1127. 343. Struckmeier S: Naturfarbstoffe: Farben mit Geschichte. Chemie in unserer Zeit 2003, 37:402-409. 344. Hammel KE, Green B, Wen ZG: Ring fission of anthracene by a eukaryote. Proceedings of the National Academy of Sciences of the United States of America 1991, 88:10605-10608. 345. Pasti MB, Crawford DL: Relationships between the abilities of streptomycetes to decolorize 3 anthron-type dyes and to degrade lignocellulose. Canadian Journal of Microbiology 1991, 37:902-907. 346. Stachulski AV, Jenkins GN: The synthesis of O-glucuronides. Natural Product Reports 1998, 15:173-186. 278 Literaturverzeichnis 347. Aherne SA, O'Brien NM: Dietary flavonols: Chemistry, food content, and metabolism. Nutrition 2002, 18:75-81. 348. Bouktaib M, Atmani A, Rolando C: Regio- and stereoselective synthesis of the major metabolite of quercetin, quercetin-3-O-beta-D-glucuronide. Tetrahedron Letters 2002, 43:6263-6266. 349. Langenhan JM, Griffith BR, Thorson JS: Neoglycorandomization and chemoenzymatic glycorandomization: Two complementary tools for natural product diversification. Journal of Natural Products 2005, 68:1696-1711. 350. Bode HB, Müller R: Possibility of bacterial recruitment of plant genes associated with the biosynthesis of secondary metabolites. Plant Physiology 2003, 132:11531161. 351. Mackenzie PI, Owens IS, Burchell B, Bock KW, Bairoch A, Belanger A, FournelGigleux S, Green M, Hum DW, Iyanagi T, Lancet D, Louisot P, Magdalou J, Chowdhury JR, Ritter JK, Schachter H, Tephly TR, Tipton KF, Nebert DW: The UDP glycosyltransferase gene superfamily: recommended nomenclature update based on evolutionary divergence. Pharmacogenetics 1997, 7:255-269. 352. Boll R: Untersuchungen zur Biosynthese und Regulation von OligosaccharidAntibiotika. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2005. 353. Berner M, Krug D, Bihlmaier C, Vente A, Müller R, Bechthold A: Genes and enzymes involved in caffeic acid biosynthesis in the actinomycete Saccharothrix espanaensis. Journal of Bacteriology 2006, 188:2666-2673. 354. Lairson LL, Henrissat B, Davies GJ, Withers SG: Glycosyltransferases: structures, functions, and mechanisms. Annual Review of Biochemistry 2008, 77:521-555. 355. Provencher C, LaPointe G, Sirois S, Van Calsteren MR, Roy D: Consensus-degenerate hybrid oligonucleotide primers for amplification of priming glycosyltransferase genes of the exopolysaccharide locus in strains of the Lactobacillus casei group. Applied and Environmental Microbiology 2003, 69:3299-3307. 356. Bechthold A: persönliche Mitteilung 2005. 357. Peintner I: persönliche Mitteilung 2008. 358. Erb A: persönliche Mitteilung 2008. 359. Petkovic H, Cullum J, Hranueli D, Hunter IS, Peric-Concha N, Pigac J, Thamchaipenet A, Vujaklija D, Long PF: Genetics of Streptomyces rimosus, the oxytetracycline producer. Microbiology and Molecular Biology Reviews 2006, 70:704-728. 360. Rassoulzadegan M, Grandjean V, Gounon P, Vincent S, Gillot I, Cuzin F: RNAmediated non-mendelian inheritance of an epigenetic change in the mouse. Nature 2006, 441:469-474. 361. Ashe A, Whitelaw E: Another role for RNA: a messenger across generations. Trends in Genetics 2007, 23:8-10. Literaturverzeichnis 279 362. Lolle SJ, Victor JL, Young JM, Pruitt RE: Genome-wide non-mendelian inheritance of extra-genomic information in Arabidopsis. Nature 2005, 434:505-509. 363. Krishnaswamy L, Peterson T: An alternate hypothesis to explain the high frequency of "revertants" in hothead mutants in Arabidopsis. Plant Biology 2007, 9:30-31. 364. Minkel JR: RNA to the rescue: novel inheritance patterns violate Mendel's Laws, Artikel mit Zitat von Pruitt RE. Scientific American 2005, 292:20-22. 365. Fedoryshyn M, Welle E, Bechthold A, Luzhetskyy A: Functional expression of the Cre recombinase in actinomycetes. Applied Microbiology and Biotechnology 2008, 78:1065-1070. 366. Lin YS, Kieser HM, Hopwood DA, Chen CW: The chromosomal DNA of Streptomyces lividans 66 is linear. Molecular Microbiology 1993, 10:923-933. 367. Chen CW, Huang CH, Lee HH, Tsai HH, Kirby R: Once the circle has been broken: dynamics and evolution of Streptomyces chromosomes. Trends in Genetics 2002, 18:522-529. 368. Altenbuchner J, Cullum J: Structure of an amplifiable DNA-sequence in Streptomyces lividans 66. Molecular & General Genetics 1985, 201:192-197. 369. Redenbach M, Flett F, Piendl W, Glocker I, Rauland U, Wafzig O, Kliem R, Leblond P, Cullum J: The Streptomyces lividans 66 chromosome contains a 1 Mb deletogenic region flanked by 2 amplifiable regions. Molecular & General Genetics 1993, 241:255-262. 370. Fischer G, Decaris B, Leblond P: Occurrence of deletions, associated with genetic instability in Streptomyces ambofaciens, is independent of the linearity of the chromosomal DNA. Journal of Bacteriology 1997, 179:4553-4558. 371. Hornemann U, Otto CJ, Hoffman GG, Bertinuson AC: Spectinomycin resistance and associated DNA-amplification in Streptomyces achromogenes subsp. rubradiris. Journal of Bacteriology 1987, 169:2360-2366. 372. Chater KF: Regulation of sporulation in Streptomyces coelicolor A3(2): a checkpoint multiplex? Current Opinion in Microbiology 2001, 4:667-673. 373. Zelder O, Hauer B: Environmentally directed mutations and their impact on industrial biotransformation and fermentation processes. Current Opinion in Microbiology 2000, 3:248-251. 374. Leblond P, Demuyter P, Moutier L, Laakel M, Decaris B, Simonet JM: Hypervariability, a new phenomenon of genetic instability, related to DNAamplification in Streptomyces ambofaciens. Journal of Bacteriology 1989, 171:419423. 375. Novakova R, Bistakova J, Homerova D, Rezuchova B, Kormanec J: Cloning and characterization of a polyketide synthase gene cluster involved in biosynthesis of a proposed angucycline-like polyketide auricin in Streptomyces aureofaciens CCM 3239. Gene 2002, 297:197-208. 280 Literaturverzeichnis 376. Novakova R, Bistakova J, Homerova D, Rezuchova B, Feckova L, Kormanec J: Cloning and characterization of a new polyketide synthase gene cluster in Streptomyces aureofaciens CCM 3239. DNA Sequence 2004, 15:188-195. 377. Lomovskaya N, Otten SL, Doi-Katayama Y, Fonstein L, Liu XC, Takatsu T, InventiSolari A, Filippini S, Torti F, Colombo AL, Hutchinson CR: Doxorubicin overproduction in Streptomyces peucetius: Cloning and characterization of the dnrU ketoreductase and dnrV genes and the doxA cytochrome P-450 hydroxylase gene. Journal of Bacteriology 1999, 181:305-318. 378. Dickens ML, Priestley ND, Strohl WR: In vivo and in vitro bioconversion of epsilonrhodomycinone glycoside to doxorubicin: Functions of dauP, dauK, and doxA. Journal of Bacteriology 1997, 179:2641-2650. 379. Trefzer A, Hoffmeister D, Künzel E, Stockert S, Weitnauer G, Westrich L, Rix U, Fuchser J, Bindseil KU, Rohr J, Bechthold A: Function of glycosyltransferase genes involved in urdamycin A biosynthesis. Chemistry & Biology 2000, 7:133-142. 380. Westrich L, Domann S, Faust B, Bedford D, Hopwood DA, Bechthold A: Cloning and characterization of a gene cluster from Streptomyces cyanogenus S136 probably involved in landomycin biosynthesis. FEMS Microbiology Letters 1999, 170:381-387. 381. Wang LR, Mcvey J, Vining LC: Cloning and functional analysis of a phosphopantetheinyl transferase superfamily gene associated with jadomycin biosynthesis in Streptomyces venezuelae ISP5230. Microbiology-SGM 2001, 147:1535-1545. 382. Eckardt K, Tresselt D, Schumann G, Ihn W, Wagner C: Isolation and chemical structure of aklanonic acid, an early intermediate in the biosynthesis of anthracyclines. Journal of Antibiotics 1985, 38:1034-1039. 383. Filippini S, Solinas MM, Breme U, Schluter MB, Gabellini D, Biamonti G, Colombo AL, Garofano L: Streptomyces peucetius daunorubicin biosynthesis gene, dnrFsequence and heterologous expression. Microbiology-UK 1995, 141:1007-1016. 384. Abdelfattah MS, Rohr J: Premithramycinone G, an early shunt product of the mithramycin biosynthetic pathway accumulated upon inactivation of oxygenase MtmOII. Angewandte Chemie-International Edition 2006, 45:5685-5689. 385. Denissenko MF, Pao A, Tang MS, Pfeifer GP: Preferential formation of benzo[a]pyrene adducts at lung cancer mutational hotspots in P53. Science 1996, 274:430-432. 386. Tang L, Shah S, Chung L, Carney J, Katz L, Khosla C, Julien B: Cloning and heterologous expression of the epothilone gene cluster. Science 2000, 287:640-642. 387. Shah S, Xue Q, Tang L, Carney JR, Betlach M, McDaniel R: Cloning, characterization and heterologous expression of a polyketide synthase and P-450 oxidase involved in the biosynthesis of the antibiotic oleandomycin. Journal of Antibiotics 2000, 53:502-508. Literaturverzeichnis 281 388. Mendes MV, Recio E, Fouces R, Luiten R, Martin JF, Aparicio JF: Engineered biosynthesis of novel polyenes: a pimaricin derivative produced by targeted gene disruption in Streptomyces natalensis. Chemistry & Biology 2001, 8:635-644. 389. Rix U, Fischer C, Remsing LL, Rohr J: Modification of post-PKS tailoring steps through combinatorial biosynthesis. Natural Product Reports 2002, 19:542-580. 390. Fritzsche K, Ishida K, Hertweck C: Orchestration of discoid polyketide cyclization in the resistomycin pathway. Journal of the American Chemical Society 2008, 130:83078316. 391. Hertweck C, Xiang LK, Kalaitzis JA, Cheng Q, Palzer M, Moore BS: Contextdependent behavior of the enterocin iterative polyketide synthase: a new model for ketoreduction. Chemistry & Biology 2004, 11:461-468. 392. Hadfield AT, Limpkin C, Teartasin W, Simpson TJ, Crosby J, Crump MP: The crystal structure of the ActIII actinorhodin polyketide reductase: proposed mechanism for ACP and polyketide binding. Structure 2004, 12:1865-1875. 393. Thompson CJ, Ward JM, Hopwood DA: Cloning of antibiotic resistance and nutritional genes in streptomycetes. Journal of Bacteriology 1982, 151:668-677. 394. Sambrook J, Fritsch EF, Maniatis T: Molecular cloning a laboratory manual, second edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989. 395. Kominek LA: Biosynthesis of novobiocin by Streptomyces niveus. Antimicrobial Agents and Chemotherapy 1972, 1:123-134. 396. Schimana J, Fiedler HP, Groth I, Süssmuth R, Beil W, Walker M, Zeeck A: Simocyclinones, novel cytostatic angucyclinone antibiotics produced by Streptomyces antibioticus Tü 6040 I. Taxonomy, fermentation, isolation and biological activities. Journal of Antibiotics 2000, 53:779-787. 397. Raleigh EA, Benner J, Bloom F, Braymer HD, Decruz E, Dharmalingam K, Heitman J, Noyerweidner M, Piekarowicz A, Kretz PL, Short JM, Woodcock D: Nomenclature relating to restriction of modified DNA in Escherichia coli. Journal of Bacteriology 1991, 173:2707-2709. 398. Macneil DJ, Gewain KM, Ruby CL, Dezeny G, Gibbons PH, Macneil T: Analysis of Streptomyces avermitilis genes required for avermectin biosynthesis utilizing a novel integration vector. Gene 1992, 111:61-68. 399. Hoffmeister D: persönliche Mitteilung 2006. 400. www.lgcstandards-atcc.org 2008. 401. Kinoshita N, Igarashi M, Ikeno S, Hori M, Hamada M: Saccharothrix tangerinus sp. nov., the producer of the new antibiotic formamicin: taxonomic studies. Actinomycetologica 1999, 13:20-31. 282 Literaturverzeichnis 402. Labeda DP, Kroppenstedt RM: Proposal of Umezawaea gen. nov., a new genus of the Actinosynnemataceae related to Saccharothrix, and transfer of Saccharothrix tangerinus Kinoshita et al. 2000 as Umezawaea tangerina gen. nov., comb. nov. International Journal of Systematic and Evolutionary Microbiology 2007, 57:27582761. 403. Salas AP, Zhu L, Sanchez C, Brana AF, Rohr J, Mendez C, Salas JA: Deciphering the late steps in the biosynthesis of the anti-tumour indolocarbazole staurosporine: sugar donor substrate flexibility of the StaG glycosyltransferase. Molecular Microbiology 2005, 58:17-27. 404. Anderle C, Hennig S, Kammerer B, Li SM, Wessjohann L, Gust B, Heide L: Improved mutasynthetic approaches for the production of modified aminocoumarin antibiotics. Chemistry & Biology 2007, 14:955-967. 405. Short JM, Fernandez JM, Sorge JA, Huse WD: Lambda-Zap - a bacteriophage lambda-expression vector with in vivo excision properties. Nucleic Acids Research 1988, 16:7583-7600. 406. Produktkatalog. Stratagene, La Jolla 2008. 407. Produktkatalog. Promega, Madison 2008. 408. BlondeletRouault MH, Weiser J, Lebrihi A, Branny P, Pernodet JL: Antibiotic resistance gene cassettes derived from the Omega interposon for use in E. coli and Streptomyces. Gene 1997, 190:315-317. 409. Bierman M, Logan R, Obrien K, Seno ET, Rao RN, Schoner BE: Plasmid cloning vectors for the conjugal transfer of DNA from Escherichia coli to Streptomyces spp. Gene 1992, 116:43-49. 410. Trefzer A, Fischer C, Stockert S, Westrich L, Künzel E, Girreser U, Rohr J, Bechthold A: Elucidation of the function of two glycosyltransferase genes (lanGT1 and lanGT4) involved in landomycin biosynthesis and generation of new oligosaccharide antibiotics. Chemistry & Biology 2001, 8:1239-1252. 411. Zhang YM, Muyrers JPP, Rientjes J, Stewart F: Phage annealing proteins promote oligonucleotide-directed mutagenesis in Escherichia coli and mouse ES cells. BMC Molecular Biology 2003, 4. 412. Hoffmeister D, Ichinose K, Bechthold A: Two sequence elements of glycosyltransferases involved in urdamycin biosynthesis are responsible for substrate specificity and enzymatic activity. Chemistry & Biology 2001, 8:557-567. 413. Yanischperron C, Vieira J, Messing J: Improved M13 phage cloning vectors and host strains - nucleotide-sequences of the M13 MP18 and PUC19 Vectors. Gene 1985, 33:103-119. 414. Produktkatalog. New England Biolabs, Ipswich 2008. Literaturverzeichnis 283 415. Doumith M, Weingarten P, Wehmeier UF, Salah-Bey K, Benhamou B, Capdevila C, Michel JM, Piepersberg W, Raynal MC: Analysis of genes involved in 6-deoxyhexose biosynthesis and transfer in Saccharopolyspora erythraea. Molecular and General Genetics 2000, 264:477-485. 416. Luzhetskyy A, Zhu LL, Gibson M, Fedoryshyn M, Durr C, Hofmann C, Hoffmeister D, Ostash B, Mattingly C, Adams V, Fedorenko V, Rohr J, Bechthold A: Generation of novel landomycins M and O through targeted gene disruption. ChemBioChem 2005, 6:675-678. 417. Cohen SN, Chang ACY, Hsu L: Nonchromosomal antibiotic resistance in bacteria genetic transformation of Escherichia coli by R-factor DNA. Proceedings of the National Academy of Sciences of the United States of America 1972, 69:2110-2114. 418. Dower WJ, Miller JF, Ragsdale CW: High-efficiency transformation of Escherichia coli by high-voltage electroporation. Nucleic Acids Research 1988, 16:6127-6145. 419. Birnboim HC, Doly J: Rapid alkaline extraction procedure for screening recombinant plasmid DNA. Nucleic Acids Research 1979, 7:1513-1523. 420. Nathans D, Smith HO: Restriction endonucleases in analysis and restructuring of DNA-molecules. Annual Review of Biochemistry 1975, 44:273-293. 421. Weiss B, Jacquemi A, Live TR, Fareed GC, Richards CC: Enzymatic breakage and joining of deoxyribonucleic acid. 6. Further purification and properties of polynucleotide ligase from Escherichia coli infected with bacteriophage T4. Journal of Biological Chemistry 1968, 243:4543-4555. 422. Murphy KC: Use of bacteriophage lambda recombination functions to promote gene replacement in Escherichia coli. Journal of Bacteriology 1998, 180:2063-2071. 423. Yu DG, Ellis HM, Lee EC, Jenkins NA, Copeland NG, Court D: An efficient recombination system for chromosome engineering in Escherichia coli. Proceedings of the National Academy of Sciences of the United States of America 2000, 97:59785983. 424. Gust B, Challis GL, Fowler K, Kieser T, Chater KF: PCR-targeted Streptomyces gene replacement identifies a protein domain needed for biosynthesis of the sesquiterpene soil odor geosmin. Proceedings of the National Academy of Sciences of the United States of America 2003, 100:1541-1546. 425. Hamilton CM, Aldea M, Washburn BK, Babitzke P, Kushner SR: New method for generating deletions and gene replacements in Escherichia coli. Journal of Bacteriology 1989, 171:4617-4622. 426. Saiki RK, Scharf S, Faloona F, Mullis KB, Horn GT, Erlich HA, Arnheim N: Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle-cell anemia. Science 1985, 230:1350-1354. 427. Müller H-J: PCR - Polymerase-Kettenreaktion. Spektrum Akademischer Verlag, Heidelberg 2001. 284 Literaturverzeichnis 428. Mazodier P, Davies J: Gene-transfer between distantly related bacteria. Annual Review of Genetics 1991, 25:147-171. 429. Blaesing F, Mühlenweg A, Vierling S, Ziegelin G, Pelzer S, Lanka E: Introduction of DNA into actinomycetes by bacterial conjugation from E. coli - an evaluation of various transfer systems. Journal of Biotechnology 2005, 120:146-161. 430. Hillemann D, Pühler A, Wohlleben W: Gene disruption and gene replacement in Streptomyces via single-stranded DNA transformation of integration vectors. Nucleic Acids Research 1991, 19:727-731. 431. Ogawara H: Production and property of beta-lactamases in Streptomyces. Antimicrobial Agents and Chemotherapy 1975, 8:402-408. 432. Chater KF, Losick R: In Bacteria as Multicellular Organisms. Edited by Shapiro JA, Dworkin M. Oxford University Press, New York 1997:149-182. 433. Branda CS, Dymecki SM: Talking about a revolution: the impact of site-specific recombinases on genetic analyses in mice. Developmental Cell 2004, 6:7-28. 434. Senecoff JF, Bruckner RC, Cox MM: The Flp-recombinase of the yeast 2-micro-m plasmid - characterization of its recombination site. Proceedings of the National Academy of Sciences of the United States of America 1985, 82:7270-7274. 435. Stark WM, Boocock MR, Sherratt DJ: Catalysis by site-specific recombinases. Trends in Genetics 1992, 8:432-439. 436. Schweizer HP: Applications of the Saccharomyces cerevisiae Flp-FRT system in bacterial genetics. Journal of Molecular Microbiology and Biotechnology 2003, 5:6777. 437. Khodakaramian G, Lissenden S, Gust B, Moir L, Hoskisson PA, Chater KF, Smith MCM: Expression of Cre recombinase during transient phage infection permits efficient marker removal in Streptomyces. Nucleic Acids Research 2006, 34:e20. 438. Gustafsson C, Govindarajan S, Minshull J: Codon bias and heterologous protein expression. Trends in Biotechnology 2004, 22:346-353. 439. Laemmli UK: Cleavage of structural proteins during assembly of head of bacteriophage T4. Nature 1970, 227:680-685. 440. Still WC, Kahn M, Mitra A: Rapid chromatographic technique for preparative separations with moderate resolution. Journal of Organic Chemistry 1978, 43:29232925. 441. Makarov A, Denisov E, Kholomeev A, Baischun W, Lange O, Strupat K, Horning S: Performance evaluation of a hybrid linear ion trap/orbitrap mass spectrometer. Analytical Chemistry 2006, 78:2113-2120. 442. Rutherford K, Parkhill J, Crook J, Horsnell T, Rice P, Rajandream MA, Barrell B: Artemis: sequence visualization and annotation. Bioinformatics. 2000, 16:944-945. Literaturverzeichnis 285 443. Tippmann HF: Analysis for free: comparing programs for sequence analysis. Briefings in Bioinformatics 2004, 5:82-87. 444. Altschul SF, Madden TL, Schaffer AA, Zhang JH, Zhang Z, Miller W, Lipman DJ: Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research 1997, 25:3389-3402. 445. Thompson JD, Higgins DG, Gibson TJ: CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positionspecific gap penalties and weight matrix choice. Nucleic Acids Research 1994, 22:4673-4680. 446. Tatusov RL, Koonin EV, Lipman DJ: A genomic perspective on protein families. Science 1997, 278:631-637. 286 Anhang 7 Anhang 7.1 Abkürzungsverzeichnis Abkürzungen für Nukleotide Tab. 58: Abkürzungen für Nukleotide inklusive Wobbles. A Adenin M A+C W A+T B T+C+G R A+G Y C+T C S Cytosin C+G G Guanin T Thymin D H M R W Asparaginsäure Histidin Methionin Arginin Tryptophan E I N S Y Abkürzungen für Aminosäuren Tab. 59: Abkürzungen für Aminosäuren. A F K P T Alanin Phenylalanin Lysin Prolin Threonin C G L Q V Cystein Glycin Leucin Glutamin Valin Glutaminsäure Isoleucin Asparagin Serin Tyrosin Allgemeines Abkürzungsverzeichnis Tab. 60: Allgemeines Abkürzungsverzeichnis und Glossar. Enthalten sind die Kurzbezeichnungen für Gene und DNA-Bereiche. Gene und DNA-Bereiche werden kursiv, mit kleinem Anfangsbuchstaben geschrieben (zum Beispiel msc15), davon abgeleitete Proteine mit großem Anfangsbuchstaben (zum Beispiel Msc14) und zugeordnete Sekundärstoffe in Großbuchstaben (zum Beispiel MSC-X1). Abkürzung aac(3)IV aadA Abb. acp AK APCI apra AS attP ATP bidest. bla bp BSA bzw. carb CD Erklärung (3’)-N-Aminoglykosidacetyltransferasegen Aminoglykosid-3''-adenyltransferasegen Abbildung Gen für das Acyl-Carrier-Protein Arbeitskreis atmospheric pressure chemical ionization Apramycinresistenzgen, zum Beispiel aac(3)IV Aminosäure(n) phage attachment site, Phagenanlagerungssequenz Adenosintriphosphat bidestilliert β-Lactamasegen Basenpaar(e) Bovines Serumalbumin beziehungsweise Carbenicillinresistenzgen (hier: β-Lactamasegen) Circulardichroismus Anhang Abkürzung Cluster CoA Contig ca. ∆ δ DAD DB DC d. h. DMF DMSO DNA DSMZ E. EDTA ermE-up-Promotor ESI et al. FAD FRT dNTP glatte Enden GT h HOAc HPLC In-frame-Deletion IPTG J kana klebrige Enden kb ks ksα ksβ (= clf) L λ lacZα LC loxP M M: Mr: Mberechnet: 287 Erklärung hier stets ein Sekundärstoffbiosynthesegencluster Coenzym A DNA-Bereich durchgehend bekannter Sequenz circa, ungefähr Mutante Chemische Verschiebung [ppm] Dioden-Array-Detektor Doppelbindung Dünnschichtchromatographie das heißt Dimethylformamid Dimethylsulfoxid Desoxyribonukleinsäure Deutsche Sammlung von Mikroorganismen und Zellkulturen Escherichia Ethylendiamintetraessigsäure Derivat des Promotors des ermE-Gens electrospray ionization und andere Flavin-Adenin-Dinukleotid FRT-site, Rekombinationssequenz der Flp-Rekombinase Nukleotide, DNA-Bausteine glatte Enden liegen vor, wenn am Ende des DNADoppelstranges beide Einzelstränge die gleiche Länge haben Glykosyltransferase Stunde(n) Essigsäure Hochdruckflüssigchromatographie Deletion ohne Verschiebung des Leserahmens Isopropyl-β-D-thiogalaktopyranosid Kopplungskonstante [Hz] Kanamycinresistenzgen nach bestimmten DNA-Restriktionsspaltungen vorliegende Enden mit Nukleotidüberhängen eines Einzelstranges Kilobasenpaar(e) Gen einer Ketosynthase(untereinheit) Gen der Ketosynthase Untereinheit α Gen der Ketosynthase Untereinheit β (chain length factor) Liter Wellenlänge Gen des lac-Operons, s. 5.5.1.3 liquid chromatography, Flüssigchromatographie loxP-site, Rekombinationssequenz der Cre-Rekombinase als Größe: Molmasse [g/mol], als Einheit: Molar [mol/L] Nominalmasse relative Molekülmasse monoisotopische Masse (häufigste Isotope) 288 Abkürzung m/z mec MeOH MHK min MS msc MSD msn MCS NaOH NCBI n. d. NMR nov nt OD ORF oriR oriT PAGE PCR PEG pok Ref. RNA RT s s. S. SAM SDS sp. / spp. spec Tab. Template THF tipA-promotor tsr u UV rpm WT vgl. VIS X-Gal Anhang Erklärung Masse / Ladung-Verhältnis Gene des mec-Clusters aus S. sp. Gö C4/4 Methanol Minimale Hemmkonzentration Minute(n) Massenspektrometrie Gene des msc-Contigs aus S. sp. Gö C4/4 Massendetektor Gene des msn-Clusters aus S. sp. Gö C4/4 multiple cloning site, DNA-Bereich eines Vektors mit mehreren Endonukleaseerkennungsstellen. Natriumhydroxid National Center for Biotechnology Information nicht detektiert Kernmagnetische Resonanzspektroskopie Gene des nov-Clusters aus S. spheroides NCIMB 11891 Nukleotid(e) optische Dichte open reading frame, ein mögliches Gen origin of replication, Replikationsursprung origin of transfer, Transferursprung Polyacrylamidgelelektrophorese Polymerasekettenreaktion Polyethylenglykol Gene des pok-Clusters aus S. diastatochromogenes Tü6028 Referenz Ribonukleinsäure Raumtemperatur Sekunde(n) siehe Streptomyces oder Saccharothrix S-Adenosyl-L-methionin Natriumdodecylsulfat species, Art / Arten Spectinomycinresistenzgen, zum Beispiel aadA Tabelle Matrize, Vorlage Tetrahydrofolat / Tetrahydrofolsäure Thiostrepton induzierbarer Promotor Thiostreptonresistenzgen unit(s), Einheit(en) Ultraviolett Umdrehungen pro Minute Wildtyp vergleiche sichtbares Licht (Wellenlängenbereich 400 nm - 800 nm) 5-Brom-4-chlor-3-indoyl-β-D-galaktopyranosid 289 Anhang 7.2 NMR-Tabellen und -Spektren Übersicht EmoPro1 (8-O-α-L-Rhamnosylemodin) S. 290 EmoPro2 (1-O-α-L-Rhamnosylemodin) S. 292 EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin) S. 294 AliPro1 (2-O-α-L-Rhamnosylalizarin) S. 296 Ant14Pro1 (1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon) S. 298 QuercPro1 (3-O-α-L-Rhamnosylquercetin = Quercitrin) S. 300 Novobiocinsäure S. 302 NovPro1 (11-Hydroxynovobiocinsäure) S. 304 NovPro3 (10-Hydroxynovobiocinsäure) S. 306 NovPro5 (4'-O-α-L-Rhamnosylnovobiocinsäure) S. 307 290 Anhang EmoPro1 (8-O-α-L-Rhamnosylemodin) oranger Feststoff C21H20O9 O Mr: 416.38 1' 2' O + HR-ESI-MS: berechnet 417.11801 [M+H] gefunden 417.11808 [M+H]+ Abweichung 0.17 ppm 8 7 O 12 6 HO NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C OH 11 5 9 10 6' 3' 13 4' OH OH OH 1 2 3 14 O 4 1 H δ/ppm (m, J/Hz) 13 C δ/ppm 161.81 C δ/ppm 14.31 (s) 2a 3 3-CH3 7.04 (dd, 1.8, 0.7) 123.62 144.96 2.36 (s) 21.20 4a 5 6 7 8 9 10 11 12 13 14 1’ 3’ 7.36 (dd, 1.8, 0.5) 118.17 6.89 (d, 2.3) 113.36 161.81 6.42 (d, 2.3) 109.66 160.49 183.65b 183.72b 136.21c 107.6* 114.97 132.24c 5.38 (d, 1.2) 98.36 70.07 or 3.95 (m)x 70.16 70.07 or 70.16 3.94 (m)x 4’ 3.30 (t, 9.2) 71.78 17.78; 69.72/70.07/70.16 5’ 6’ 2’/3’/4’OH 3.57 (qd, 6.2, 9.2) 69.72 1.12 (d, 6.2) 17.78 69.72/70.07/70.16; 71.78 2’ HMBC 13 position 1 1-OH 21.20; 114.97; 118.17; 161.81 H-H-COSY ROESY 2.36; 7.36 2.36 118.17; 123.62; 144.96 21.20; 114.97; 123.62; 183.65/183.72 107.6; 183.65/183.72 7.04 7.04; 7.36 7.04 6.42 2.36 107.6 6.89 5.38 69.72/70.07/70.16; 160.49 3.94/3.95 3.94/3.95; 6.42 71.78 3.30; 5.38 3.30; 3.57; 5.38 71.78 3.30; 5.38 4.5-5.1 (3 br s) a, b, c: Zuordnung der Signale gegenseitig austauschbar *: schwaches 13C-Signal, indirekt über HMBC detektiert x: Signale überlappen sich gegenseitig 3.30; 3.57; 5.38 1.12; 3.57; 3.94/3.95; 3.57 3.94/3.95 1.12; 3.30; 1.12; 3.30 3.94/3.95 3.57 3.30; 3.57 291 Anhang EmoPro1: 1H-Spektrum s. 3.1.1.1, Abb. 21 EmoPro1: 13C-Spektrum 200 ppm 150 100 50 0 292 Anhang EmoPro2 (1-O-α-L-Rhamnosylemodin) hellgelbe Kristalle HO C21H20O9 Mr: 416.38 HO HR-ESI-MS: berechnet 417.11801 [M+H] gefunden 417.11809 [M+H]+ Abweichung 0.19 ppm position 1 1 2 3 3-CH3 7.52 (m) 4 5a 6 7a 8 8-OH 9b 10b 11c 12 13 14c 1’ 7.68 (dd, 0.6, 1.6) 7.06 (d, 2.4) H δ/ppm (m, J/Hz) 8 7 2.46 (s) 6.58 (d, 2.4) 13.40 5.64 (m, <2.0 ) HO 13 C δ/ppm HMBC 13C δ/ppm 156.77 21.50; 118.69; 121.42; 123.31 156.77 146.34 21.50 121.42/123.31; 146.34 21.50; 118.69; 123.31; 182.04 121.42 107.05 108.08; 110.06; 182.04 164.52 108.08 107.05; 110.06; 164.52 164.52 108.08/110.06; 164.52 186.25 182.04 136.60 110.06 118.69 134.05 98.52 70; 156.77 2’ 2'-OH 3.96 (m)x 5.09 (d, 4.0) 69.93d 3’ 3'-OH 4’ 4'-OH 5’ 6’ 3.96 (m)x 4.80 (d, 5.6) 3.3# 4.92 (d, 5.6) 3.52 (qd, 6.2, 9.3) 1.09 (d, 6.2) 70.05d 70 70 70 70; 71.62 71.62 70.08 17.83 d 70; 71.62 a, b, c, d: Zuordnung der Signale gegenseitig austauschbar x: Signale überlappen sich gegenseitig #: vom Wassersignal überlappt 1' OH O 12 6 NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C 2' 3' O 6' + OH 11 5 9 10 O 13 1 2 3 14 O 4 H-H-COSY NOESY 2.46 2.46; 3.52; 5.64 7.52; 7.68 7.52, 7.68 2.46 6.58 2.46 7.06 3.96 3.3; 4.80; 5.09; 5.64 3.96 3.3; 4.80; 5.09; 5.64 3.96 3.52; 3.96; 4.92 3.3 1.09; 3.3 3.52 3.96; 7.52 3.52; 4.80; 5.09; 5.64 3.96 3.52; 4.80; 5.09; 5.64 3.96 1.09 1.09; 3.96; 7.52 3.52; 4.92 293 Anhang EmoPro2: 1H-Spektrum s. 3.1.1.1, Abb. 21 EmoPro2: 13C-Spektrum ppm 175 150 125 100 75 50 25 0 294 Anhang EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin) O gelbe Kristalle 1'' C27H30O13 Mr: 562.52 8 HR-ESI-MS: berechnet 563.17592 [M+H] gefunden 563.17590 [M+H]+ Abweichung 0,03ppm 7 12 NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C 1' O HO 4' O 5' HO 3' 11 5 9 10 4'' OH OH 3'' O 6 6' 6'' 2'' O + OH 13 OH 1 2 3 14 O 4 2' OH 1 position H δ/ppm (m, J/Hz) 1 1-OH 13.11 (s) 13 C δ/ppm 161.28 or 161.67 2 3 3-CH3 7.15 (m) 2.39 (s) 124.05 147.10 21.34 4 7.44 (d, 1.3) 119.33 5 6a 7.46 (d, 2.4) 108.24 158.88 7 7.22 (d, 2.4) 109.98 161.28 or 161.67 186.57 181.55 136.56 115.78 114.32 131.92 98.65 or 99.01 69.72 8a 9 10 11b 12 13 14b 1’ 2’ 2’-OH 3’ 3’-OH 5.58 (d, 1.6) 3.89 (m) 5.17 (d, 4.4) 3.67 (ddd, 3.3, 5.9, 9.2) 4.80 (d, 6.1) 5’ 3.34# 4.92 (d, 5.9) 3.45 (qd, 6.2, 9.3) 6’ 1.13 (d, 6.2) 4’ 4’-OH 70.17 71.52 or 71.57 70.17 17.82 or 17.86 HMBC 13 C δ/ppm 124.05; 161.4; 114.32 21.34; 114.32; 119.33; 161.4 H-H-COSY ROESY 2.39, 7.44 2.39 119.33; 124.05; 147.10 7.15, 7.44 21.34; 114.32; 124.05; 181.55; 186.57 2.39, 7.15 109.98; 115.78; 136.56; 161.4; 181.55 7.22 7.15; 7.44 2.39 5.58 108.24; 115.78; 158.88; 161.4 7.46 5.58 70; 158.88; 161.4 69.72-71.57 70; 98.8 3.89, 4.00 3.67, 5.17, 5.58 3.89 3.89; 4.00; 5.105.17; 7.22; 7.46 3.67R; 5.17; 5.58 3.89; 5.58 69.72-71.57 70 3.34, 3.89, 4.79 3.67, 3.95 3.89R, 3.45R 17.84; 70 69.72-71.57 3.45, 3.67, 4.915 3.34 1.125 1.125 17.84; 71.55 1.125, 3.34 1.13; 3.67R 69.72-71.57 3.49 3.34; 3.45; 4.915 295 Anhang Fortsetzung der NMR-Tabelle für EmoPro3 position 1’’ 2’’ 2’’-OH 3’’ 3’’-OH 4’’ 4’’-OH 5’’ 6’’ 1H δ/ppm (m, J/Hz) 5.58 (d, 1.6) 4.00 (m) 5.10 (d, 4.4) 3.95 (ddd, 3.3, 5.9, 9.2) 4.78 (d, 6.1) 3.34# 4.91 (d, 5.4) 3.52 (qd, 6.2, 9.3) 1.12 (d, 6.2) 13C δ/ppm HMBC 13C δ/ppm H-H-COSY 98.65 or 99.01 69.97 70; 158.88; 161.4 69.72-71.57 70; 98.8 3.89, 4.00 3.95, 5.10, 5.58 4.00 69.97 69.72-71.57 70 17.84; 70 69.72-71.57 3.34, 4.00, 4.79 3.67, 3.95 3.52, 3.95, 4.915 3.34 4.00R, 3.52R 17.84 69.72-71.57 1.125, 3.34 3.49 1.12; 3.95R 3.34; 3.52; 4.915 71.52 or 71.57 70.17 17.82 or 17.86 ROESY 3.89; 4.00; 5.105.17; 7.22; 7.46 3.95R; 5.10; 5.58 4.00; 5.58 1.125 1.125 Die Zuordnung der Zuckerprotonen erfolgte über TOCSY-Experimente. a, b: Zuordnung der Signale gegenseitig austauschbar #: vom Wassersignal überlappt R: nuklearer Overhauser Effekt, der mit 1-D ROESY detektiert wurde EmoPro3: 1H-Spektrum s. 3.1.1.1, Abb. 15 EmoPro3: 13C-Spektrum ppm 150 100 50 0 296 Anhang AliPro1 (2-O-α-L-Rhamnosylalizarin) roter Feststoff C20H18O8 O Mr: 386.36 + HR-ESI-MS: berechnet 387.10744 [M+H] gefunden 387.10752 [M+H]+ Abweichung 0.20 ppm O 8 12 7 6 11 5 NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C 9 10 O OH 13 1' 1 OH 2' O 6' 3' 4' OH OH 2 3 14 4 1 position 1 1-OH 2 3 4 5a 6 H δ/ppm (m, J/Hz) a 8 9 10 C δ/ppm 153.3 HMBC 13 C δ/ppm H-H-COSY NOESY 126.2-126.6;153.3 116.5; 133.1-134.8; 150.3 7.71 7.58 5.60 12.68 (broad s) 7.58 (d, 8.3) 7.71 (d, 8.3) 150.3 121.2 119.4 8.19 (m) 126.6 133.1-134.8 7.94 134.8 b 126.2-126.6 8.19; 8.25 7.94 (m) 134.1 b 126.2-126.6 8.19; 8.25 8.25 (m) 126.5 187.9 180.9 133.1-134.8; 187.9 7.94 70 3.92 3.72; 5.18; 5.60 3.92 3.3; 3.92; 4.86 3.72 3.72; 4.95 3.3 7.94 (m) 7 13 11 133.3b 12 13 133.1b 116.5 14a 1' 5.60 (d, 6.2) 126.2 98.8 2' 2'-OH 3' 3'-OH 4' 4'-OH 3.92 (m) 69.9c 5.18 (broad s) 3.72 (dd, 3.2; 9.2) 70.2 4.86 (broad s) 3.3# 71.4 4.95 (broad s) 5' 6' 3.49 (qd, 6.2; 9.0) 70.0c 1.11 (d, 6.2) 17.7 70 70/71.4 a, b, c: Zuordnung der Signale gegenseitig austauschbar #: vom Wassersignal überlappt 1.11 3.49 7.58 297 Anhang AliPro1: 1H-Spektrum ppm 3.90 3.80 3.70 3.60 3.50 3.30 3.20 8.0 7.0 6.0 5.0 4.0 3.0 2.94 9.0 6.30 10.0 18.93 1.18 1.01 1.00 11.0 0.83 0.98 0.85 12.0 1.00 0.94 1.00 2.02 1.00 1.11 1.13 13.0 ppm 3.40 2.0 1.0 AliPro1: 13C-Spektrum 190 180 170 160 150 140 130 120 110 100 ppm 90 80 70 60 50 40 30 20 10 0 298 Anhang Ant14Pro1 (1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon) rote Kristalle O C20H18ClNO7 Mr: 419.81 + HR-ESI-MS: berechnet 420.08446 [M+H] gefunden 420.08330 [M+H]+ Abweichung 2.75 ppm O 8 12 7 6 11 5 NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C 9 10 O NH2 1' 1 13 O OH 6' 2' 4' 3' OH OH 2 14 3 4 Cl 1 position 1 2 3 4 5 6 7 8 9 10 11 12 13 14 H δ/ppm (m, J/Hz) 7.30 (s) 8.11 (m) 7.86 (m) 7.86 (m) 8.18 (m) 13 C δ/ppm 142.8 147.8 119.5 121.9a 126.3 133.3b 133.5b 125.9 183.5 180.8 133.6b 133.7b 112.2 122.2a 1' 5.65 (d, 1.6) 99.1 2' 2'-OH 3' 3'-OH 4' 4'-OH 5' 6' 4.01 (m) 5.21 (d, 4.5) 3.86 (m) 4.70 (d, 5.9) 3.3# 4.96 (d, 5.5) 3.41 (m) 1.14 (d, 6.0) 69.4 HMBC 13 C δ/ppm 121.9/122.2; 142.8; 147.8; 180.8 7.86 8.11/8.18 8.11/8.18 7.86 69/70; 147.8 4.01 3.86; 5.21; 5.65 4.01 3.3; 4.01; 4.70 3.86 3.86; 4.96 3.3 1.14 3.41 70.1c 17.8 69/70 69/70 69/70; 71.7 a, b, c: Zuordnung der Signale gegenseitig austauschbar #: vom Wassersignal überlappt ROESY 5.65 133/134; 180.8 125.9/126.3; 133/134 125.9/126.3; 133/134 133/134; 183.5 70.0c 71.7 H-H-COSY 7.86 8.11/8.18 8.11/8.18 7.86 4.01; 5.21; 7.30 3.3; 5.21; 5.65 4.01; 5.65 3.41 1.14; 4.01 1.14; 3.86 3.3; 3.41 299 Anhang Ant14Pro1: 1H-Spektrum water ppm 8.150 8.100 DMSO 4.000 3.950 3.900 3.850 ppm 3.450 3.400 3.350 3.300 ppm ppm 7.850 3.0 3.00 4.0 7.33 17.82 1.14 5.0 1.06 1.05 0.96 6.0 1.01 7.0 1.01 1.00 8.0 1.04 9.0 2.17 1.09 1.05 ppm 2.0 1.0 0.0 Ant14Pro1: 13C-Spektrum 133.70 133.60 133.50 133.40 133.30 ppm 71.50 71.00 70.50 70.00 69.50 ppm 180 170 160 150 140 130 120 110 100 ppm 90 80 70 60 50 40 30 20 10 0 300 Anhang QuercPro1 (3-O-α-L-Rhamnosylquercetin = Quercitrin) gelber Feststoff C21H20O11 OH 3' Mr: 448.38 2' + HR-ESI-MS: berechnet 449.10784 [M+H] gefunden 449.10665 [M+H]+ Abweichung 2.65 ppm 8 HO 7 1 H δ/ppm (m, J/Hz) 13 C δ/ppm 156.9 134.1 177.5 161.1 O 2 1' 5' 6' 6 5 10 4 OH O NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C position 2 3 4 5 5-OH 9 OH 4' 3 O 2'' 1'' O HMBC 13 C δ/ppm OH 3'' OH OH 6'' 4'' H-H-COSY ROESY 7.25 7.25 6.89 3.99 3.54; 5.25 3.99; 3.15 3.54; 3.26 0.82; 3.15 3.26 6.89 3.99 5.25 12.64 (broad s) 6 7 6.22 (d, 2.0) 98.9 165.2 8 9 10 1' 6.43 (d, 2.0) 93.7 156.3 103.5 120.5a 2' 3' 4' 5' 7,33 (d, 2.1) 6.89 (d, 8.4) 115.6b 145.2 148.5 115.5b 6' 1'' 2'' 3'' 4'' 5'' 6'' 7.25 (dd, 2.1; 8.4) 5.25 (d, 1.3) 3.99 (m) 3.54 (dd, 3.2; 9.3) 3.15 (t, 9.4) 3.26 (qd, 6.1; 9.6) 0.82 (d, 6.1) 120.9a 101.7 70.0 70.3c 71.2 70.4c 17.4 a, b, c: Zuordnung der Signale gegenseitig austauschbar 93.7; 103.5; 161.1; 165.2 98.9; 103.5; 156.3; 165.2 120.9; 145.2; 148.5; 156.9 120.5; 145.2; 148.5 115.5/115.6; 148.5; 156.9 70; 134.1 70; 71.2 71.2 17.4; 70 71.2 70; 71.2 0.82 0.82 3.15; 3.26 301 Anhang QuercPro1: 1H-Spektrum ppm 4.000 3.950 ppm 3.550 3.300 ppm 3.500 3.250 3.200 3.150 DMSO 7.350 ppm 7.300 3.14 5.0 0.74 1.09 1.09 1.18 7.5 1.10 1.00 0.94 0.97 10.0 0.96 12.5 0.96 1.01 0.86 ppm 7.250 2.5 0.0 QuercPro1: 13C-Spektrum ppm 180 170 160 150 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0 302 Anhang Novobiocinsäure weißer Feststoff 5 C22H21NO6 6 OH Mr: 395.41 5' 6' HO 7' 4'a 8'a 8' H N 4' 12 3' O O 7 8 9 10 11 12 12-NH 2' 3' 4' 4'-OH 4'a 5' 6' 7' 7'-OH 8' 8'-CH3 8'a 1 H δ/ppm (m, J/Hz) 7.75 (d, ~2) 10.06 (s) 6.87 (d, 8.9) 7.72 (dd, 8.6; 2) 3.27 (d, 7.2) 5.31 (t, 7.2) 1.70 (s) 1.70 (s) 13 C δ/ppm 124.2 129.9 127.3/127.5 158.4 114.3 127.3/127.5 28.1 122.6 131.6 17.8 25.6 166.7 9.18 (s) HMBC 13 C δ/ppm 28.1; 127.3/127.5; 158.4; 166.7 H-H-COSY b 3.27; 6.87 114.3; 127.3/127.5; 158.4 124.2; 127.3/127.5 129.9; 158.4; 166.7 122.6; 127.3/127.5; 129.9; 131.6; 158.4 17.8; 25.6; 28.1 1.70; 5.31; 7.72/7.75 1.70; 3.27 17.8; 25.6; 122.6; 131.6 17.8; 25.6; 122.6; 131.6 3.27; 5.31 3.27; 5.31 7.72/7.75 3.27; 6.87 b 100.5; 159.7; 166.7 11.85 (broad s) 108.1 121.6 111.9 159.1 10.44 (s) 2.17 (s) 151.3; 159.1; 159.7 108.1; 110.5; 159.1; 159.7 2.17; 6.89 2.17; 7.58 110.5; 151.3; 159.1 110.5 8.1 151.3 b: Signale überlappen sich gegenseitig 10 8 11 161.0 100.5 159.7 7.58 (d, 8.7) 6.89 (d, 8.9) 7 9 NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C position 1 2 3 4 4-OH 5 6 OH 3 1 2 2' O 4 110.5; 151.5; 159.1 6.88; 7.58 303 Anhang Novobiocinsäure: 1H-Spektrum Novobiocinsäure: 13C-Spektrum 170 165 160 155 150 145 140 135 130 ppm 125 120 115 110 105 100 95 90 304 Anhang NovPro1 (11-Hydroxynovobiocinsäure) weißer Feststoff C22H21NO7 Mr: 411.40 5 OH + HR-ESI-MS: berechnet 412.13908 [M+H] gefunden 412.13888 [M+H]+ Abweichung 0.48 ppm 6 5' 6' HO 7' 12 2 2' O O OH 3 1 3' 4'a 8'a 8' H N 4' 4 7 O 10 8 9 NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C 11 OH 1 position 1 2 3 4 4-OH H δ/ppm (m, J/Hz) 7.74 (d, 1.7) 13 C δ/ppm 124.5 129.9 127.0 158.2 HMBC 13 C δ/ppm 27.7; 127.4; 158.2; 166.4 H-H-COSY ROESY b a 3.30; 6.85 10.05 (s) 3.30; 5.52; 6.85; 9.04 6.85 7.55; 7.70/7.74; 10.05; 10.34 b 3.30; 5.52; 6.85; 9.04 c 5 c 114.2 c 6 7.70 (dd, 8.4; 1.9) 127.4 7 8 9 3.30 (d, 7.3) 5.52 (t, 7.3) 27.7 121.6/121.7 135.9 129.9; 158.2 121.6/121.7; 127.0/127.4; 129.9; 135.9; 158.2 13.7; 27.7; 66.3 10 11 11-OH 12 2' 3' 3'-NH 4' 4'-OH 4'a 5' 1.67 (s) 3.81 (broad s) 4.70 (broad s) 13.7 66.3 6' 7' 7'-OH 8' 8'-CH3 8'a c 6.85 (d, 8.3) d 10.34 (s) 6.85 (d, 8.3) 110.2; 124.5; 127.0 66.3; 121.6/121.7; 135.9 121.6/121.7; 135.9 c 7.55; 7.70 a 3.30; 6.85 1.67; 3.81; 5.52; 7.70/7.74 1.67; 5.52; 7.74 1.67; 3.30; 3.81 3.30; 3.81; 7.74 3.30; 5.52 3.30; 3.81 3.30; 4.70; 5.52 1.67; 5.52 3.81 166.4 not observed 99.9 9.04 (s) 7.70/7.74 161.1 d not observed e 7.55 (d, 8.6) not observed 121.6/121.7 151.5; 158.7; 161.1 c 111.6 158.7 c 110.2; 124.5; 127.0 e 2.16 (s) 110.2 8.2 151.5 110.2; 151.5; 158.7 a, b, c: Signale überlappen sich gegenseitig d, e: Zuordnung der Signale gegenseitig austauschbar c 7.55; 7.70 7.55; 7.70/7.74; 10.05; 10.34 Anhang NovPro1: 1H-Spektrum NovPro1: 13C-Spektrum 305 306 Anhang NovPro3 (10-Hydroxynovobiocinsäure) weißer Feststoff C22H21NO7 Mr: 411.40 5 HR-ESI-MS: berechnet 412.13908 [M+H] gefunden 412.13890 [M+H]+ Abweichung 0.43 ppm NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C position 2 4-OH 5b 6 7 8 10 10-OH 11 12-NH 4'-OH 5' 6' b 7'-OH 8'-CH3 1 H δ/ppm (m, J/Hz) 7.74 (m, < 2) 10.03 (s) 6.83 (m) 7.69 (dd, 8.5; 2.0) # 3.3 5.35 (t, 7.4) 4.06 (broad s) 4.64 (broad s) 1.73 (s) 8.96 (s) not observed c 7.54 (d, 8.7) 6.83 (m) 10.26 (s) c 2.15 (s) a, b: Signale überlappen sich gegenseitig c: Zuordnung der Signale gegenseitig austauschbar #: vom Wassersignal überlappt NovPro3: 1H-Spektrum HO 6 OH + 5' 6' 7' H N 4' 4'a 8'a 8' O 12 3' O OH 3 1 2 2' 4 O 7 10 8 9 11 H-H-COSY 3.3 (2.15); 7.54; 7.69 6.83 1.73; 5.35; 7.74 1.73; 3.3; 4.06 4.64; 5.35 4.06 3.3; 5.35 2.15; 6.83 (2.15); 7.54; 7.69 (6.83); 7.54 ROESY a 3.3; 5.35; 6.83; 8.96 6.83 7.54; 7.69/7.74; 10.03 a 3.3; 5.35; 6.83; 8.96 4.06; 5.35; 7.74 1.73; 3.3; 7.74 1.73; 3.3 4.06; 5.35 7.74 6.83 7.54; 7.69/7.74; 10.03 OH 307 Anhang NovPro5 (4'-O-α-L-Rhamnosylnovobiocinsäure) weißer Feststoff C28H31NO10 HO Mr: 541.55 HO OH 2'' 3'' O 6'' 1'' + HR-ESI-MS: berechnet 542.20207 [M+H] gefunden 542.20201 [M+H]+ Abweichung 0.12 ppm 5 6 O 5' 6' NMR: in DMSO-d6 400 MHz für 1H, 100 MHz für 13C HO 7' H N 4' 4'a 8'a 3' O OH 3 1 2 2' O 8' 12 4 7 O 10 8 11 9 1 H δ/ppm position (m, J/Hz) 1 2 3 4 4-OH 5 6 a 7.68 (m) 10.01 (s) 6.84 (d, 8.1) a 7.67 (m) 13 C δ/ppm 125.6 (by HMBC) 129.7 b 127.1 158.2 114.2 127.3 b 7 8 9 c# 3.26 (d, 6.9) 5.30 (t, 7.0) 28.1 122.5 131.5 10 d 1.69 (s) e 11 12 12-NH 2' 3' 4' 4'a 5' 6' 7' 7-OH 8' 8'-CH3 8'a d 1.69 (s) 25.6 166.1 1'' 2'' 2''-OH 3'' 3''-OH 17.7 9.33 (s) HMBC a 13 C δ/ppm 28.1 125.6 a 28.1 c 122.5; 127.1/127.3; 129.7; 158.2 17.7; 25.6; 122.5; 131.5 17.7; 25.6; 122.5; 131.5 H-H-COSY ROESY a a 6.84 3.26; 5.30; 6.84: 9.33 7.67 a 6.84 c 1.69; 3.68; 4.92; 5.30 1.69; 3.26 6.84 7.67/7.68; 10.01 a 3.26; 5.30; 6.84: 9.33 c 1.05; 1.69; 4.92; 5.03; 5.30; 7.67/7.68 1.69; 3.26; 7.67/7.68 3.26; 5.30 3.26; 5.30 3.26; 5.30 3.26; 5.30 166.1 5.70; 7.67/7.68 r 7.49 (d, 8.7) 6.94 (d, 8.8) not observed 94.1 r 161.1 108.8 121.3 112.3 159.2 150.9; 159.2 108.8 6.94 7.49 3.56; 3.68; 5.70; 6.94 7.49 10.58 (broad s) 2.18 (s) 5.70 (m, < 2) 3.86 (m) 5.05 (d, 4.6) 3.68 (m) 4.79 (d, 5.8) 110.8 8.1 150.9 101.4 70.1 70.3 110.8; 150.9; 159.2 71.1/71.4 3.86; 5.05; 7.49; 7.67/7.68; 9.33 3.68; 5.05 3.68; 4.79; 5.05; 5.70 3.86 3.26; 3.86; 5.70 3.26; 3.86; 4.79 3.86; 4.79; 4.92; 7.49 3.68 3.68; 3.86 308 Anhang Fortsetzung der NMR-Tabelle für NovPro5 1 H δ/ppm position (m, J/Hz) 4'' 4''-OH 5'' 6'' c# 3.26 4.92 (d, 5.8) 3.56 (dq, 5.9; 9.2) 1.05 (d, 6.1) 13 f 71.1 f 71.4 17.7 e HMBC 13C δ/ppm c 122.5; 127.1/127.3; 129.7; 158.2 C δ/ppm 71.1/71.4 H-H-COSY c 1.69; 3.68; 4.92; 5.30 3.26 ROESY c 1.05; 1.69; 4.92; 5.03; 5.30; 7.67/7.68 1.05; 3.26; 3.68 1.05 3.56 1.05; 7.49 3.26; 3.56; 4.92 a, b, c, d, e, f: Signale überlappen sich gegenseitig r: Zuordnung der Signale gegenseitig austauschbar #: vom Wassersignal überlappt NovPro5: 13C-Spektrum 3.0 6.8 3.1 1.0 2.4 3.0 1.1 1.0 2.2 3.6 0.9 0.8 0.2 NovPro5: 1H-Spektrum Anhang 7.3 309 DNA-Sequenzen der PKS II-Cluster aus S. sp. Gö C4/4 Die erste Zeile eines Datenblocks gibt die Nukleotidsequenz des Contigs in der Betrachtungsrichtung des entsprechenden Clusters wieder (s. Abb. 60, Abb. 71, Abb. 81). In der zweiten Zeile ist die Basenabfolge des komplementären DNA-Stranges zu finden. In codierenden Abschnitten sind in weiteren Zeilen der Name des Gens und die abgeleitete Aminosäuresequenz angegeben. Einfache Pfeile (>, <) geben die Leserichtung des Gens an, Doppelpfeile (>>, <<) indizieren die Position von Start- und Stoppcodon. 7.3.1 Sequenz des msc-Contigs 1 gatcgcgggg cggacggaat cattgggggg cagtagatga ccggatgccg actctgcggc ctagcgcccc gcctgcctta gtaacccccc gtcatctact ggcctacggc tgagacgccg >>.........msc1..........> m t g c r l c g 61 tcgtcggcgc tggagagcgt cgtcgacctg ggggcgaccc cgccgtgcga gagcttcctc agcagccgcg acctctcgca gcagctggac ccccgctggg gcggcacgct ctcgaaggag >.............................msc1..............................> s s a l e s v v d l g a t p p c e s f l 121 gccgcgggac aactggacct gccggaaccg gcgtacccgc tgcacctgcg ggtctgcacc cggcgccctg ttgacctgga cggccttggc cgcatgggcg acgtggacgc ccagacgtgg >.............................msc1..............................> a a g q l d l p e p a y p l h l r v c t 181 gactgctggc tcgcgcagat ccctccgctg atcacaccgg aggagacgtt cgaggagtac ctgacgaccg agcgcgtcta gggaggcgac tagtgtggcc tcctctgcaa gctcctcatg >.............................msc1..............................> d c w l a q i p p l i t p e e t f e e y 241 gcgtacttct cctccttctc gacctcctgg gtggagcacg cgcgcgcctt cgtcgcgggc cgcatgaaga ggaggaagag ctggaggacc cacctcgtgc gcgcgcggaa gcagcgcccg >.............................msc1..............................> a y f s s f s t s w v e h a r a f v a g 301 gccgtggagc gggtgggcct cggccccgac gccttcgtgg tcgaggtcgc gagcaacgac cggcacctcg cccacccgga gccggggctg cggaagcacc agctccagcg ctcgttgctg >.............................msc1..............................> a v e r v g l g p d a f v v e v a s n d 361 gggtatctgc tgaggcatgt ggtggaccgg gggatccgct gcctcggcgt cgaaccgtcg cccatagacg actccgtaca ccacctggcc ccctaggcga cggagccgca gcttggcagc >.............................msc1..............................> g y l l r h v v d r g i r c l g v e p s 421 gtgaacgtcg gggcggcggc gcgggaggcg ggggtgccca cgctcacggc gttcctgggc cacttgcagc cccgccgccg cgccctccgc ccccacgggt gcgagtgccg caaggacccg >.............................msc1..............................> v n v g a a a r e a g v p t l t a f l g 481 ccggacaccg gcgccggcgt ccgcgccgag cacggcccgg cggacctggt cgtggccaac ggcctgtggc cgcggccgca ggcgcggctc gtgccgggcc gcctggacca gcaccggttg >.............................msc1..............................> p d t g a g v r a e h g p a d l v v a n 310 Anhang 541 aacgtgtacg cgcacatccc cgacgtggtc gggttcaccc aggggctgcg ggcgctggtc ttgcacatgc gcgtgtaggg gctgcaccag cccaagtggg tccccgacgc ccgcgaccag >.............................msc1..............................> n v y a h i p d v v g f t q g l r a l v 601 gccgacgacg gctgggtctg cgtcgaggtg cagcacctgc tgaccctgat cgagaagaac cggctgctgc cgacccagac gcagctccac gtcgtggacg actgggacta gctcttcttg >.............................msc1..............................> a d d g w v c v e v q h l l t l i e k n 661 cagtacgaca cgatctacca cgagcacttc cagtactaca cggtcgcggc cgcgatccgg gtcatgctgt gctagatggt gctcgtgaag gtcatgatgt gccagcgccg gcgctaggcc >.............................msc1..............................> q y d t i y h e h f q y y t v a a a i r 721 gcgctggcga gcggcggact cacgctcgtg gacgtcgagc tgctgcccac gcacggcggg cgcgaccgct cgccgcctga gtgcgagcac ctgcagctcg acgacgggtg cgtgccgccc >.............................msc1..............................> a l a s g g l t l v d v e l l p t h g g 781 tcgatccggc tgtgggcccg cccgtgcgag gtggccggcg agcccaccgc gcgggtggcg agctaggccg acacccgggc gggcacgctc caccggccgc tcgggtggcg cgcccaccgc >.............................msc1..............................> s i r l w a r p c e v a g e p t a r v a 841 gacgtactgg cccgggagaa ggccgccggg ctgcaggagc tgtccgggta caccgagttc ctgcatgacc gggccctctt ccggcggccc gacgtcctcg acaggcccat gtggctcaag >.............................msc1..............................> d v l a r e k a a g l q e l s g y t e f 901 tccgcccggg tggccaaggt gcgccgggac ctgctgcggt tcctcatcga cgcggccgag aggcgggccc accggttcca cgcggccctg gacgacgcca aggagtagct gcgccggctc >.............................msc1..............................> s a r v a k v r r d l l r f l i d a a e 961 cgcggcgaga cggtcgtcgg ctacggcgcc ccgggcaagg gcaacaccct gctcaaccac gcgccgctct gccagcagcc gatgccgcgg ggcccgttcc cgttgtggga cgagttggtg >.............................msc1..............................> r g e t v v g y g a p g k g n t l l n h 1021 tgcggcatcc ggcccgacct gctggcgtac accgtcgacc gcaaccccta caagcacggc acgccgtagg ccgggctgga cgaccgcatg tggcagctgg cgttggggat gttcgtgccg >.............................msc1..............................> c g i r p d l l a y t v d r n p y k h g 1081 aggttcaccc cgggcacccg catcccgatc ctgccgcccg agcggatcgc cgccgaccgg tccaagtggg gcccgtgggc gtagggctag gacggcgggc tcgcctagcg gcggctggcc >.............................msc1..............................> r f t p g t r i p i l p p e r i a a d r 1141 ccggactacg tcctggtgct gccgtggaac ctgcgggccg agctggtcga gcagctggcg ggcctgatgc aggaccacga cggcaccttg gacgcccggc tcgaccagct cgtcgaccgc >.............................msc1..............................> p d y v l v l p w n l r a e l v e q l a Anhang 311 1201 tacgtgcacg agtggggcgg ccggctggtc ttcccgatac cggaactgag cattgtcgag atgcacgtgc tcaccccgcc ggccgaccag aagggctatg gccttgactc gtaacagctc >.............................msc1..............................> y v h e w g g r l v f p i p e l s i v e 1261 gtcaaggcat gaaggtcgtc ctgttctgcg gcggttacgg catgcggatg cgcaacggaa cagttccgta cttccagcag gacaagacgc cgccaatgcc gtacgcctac gcgttgcctt >...msc1...>> v k a >>........................msc2..........................> m k v v l f c g g y g m r m r n g 1321 cctccgacga cgtgcccaag ccgatggcga tggtcggccc gcgcccgctg atctggcatg ggaggctgct gcacgggttc ggctaccgct accagccggg cgcgggcgac tagaccgtac >.............................msc2..............................> t s d d v p k p m a m v g p r p l i w h 1381 tcatgcgcta ctacgcgcac ttcgggcaca cggagttcat cctctgcctc ggctacgggg agtacgcgat gatgcgcgtg aagcccgtgt gcctcaagta ggagacggag ccgatgcccc >.............................msc2..............................> v m r y y a h f g h t e f i l c l g y g 1441 cccaccacat caagaacttc ttcctcacct acgaggagac gacgtccaac gacttcgtgc gggtggtgta gttcttgaag aaggagtgga tgctcctctg ctgcaggttg ctgaagcacg >.............................msc2..............................> a h h i k n f f l t y e e t t s n d f v 1501 tgcgcggcgg gcggaccgaa ctgctgtcca ccgacatcgc cgactggacg atcacgttcg acgcgccgcc cgcctggctt gacgacaggt ggctgtagcg gctgacctgc tagtgcaagc >.............................msc2..............................> l r g g r t e l l s t d i a d w t i t f 1561 cgcagaccgg cgtcgagtcg ccgatcgggg aacggctgcg ccgggtgcgc caccacctcg gcgtctggcc gcagctcagc ggctagcccc ttgccgacgc ggcccacgcg gtggtggagc >.............................msc2..............................> a q t g v e s p i g e r l r r v r h h l 1621 acggcgacga gatgttcctc gccaactacg ccgacgtgct caccgacgcg ccgctgccga tgccgctgct ctacaaggag cggttgatgc ggctgcacga gtggctgcgc ggcgacggct >.............................msc2..............................> d g d e m f l a n y a d v l t d a p l p 1681 cgatgatcga ctccttcgcc cggcgtgacg ccggcgcgtc gatgatggtg gtaccgccgc gctactagct gaggaagcgg gccgcactgc ggccgcgcag ctactaccac catggcggcg >.............................msc2..............................> t m i d s f a r r d a g a s m m v v p p 1741 agtcctcgtt ccactgcgtg gacctgggcg aggacggcct ggtggggggc atcaccgcgg tcaggagcaa ggtgacgcac ctggacccgc tcctgccgga ccaccccccg tagtggcgcc >.............................msc2..............................> q s s f h c v d l g e d g l v g g i t a 1801 tcagcgacat gccgctgtgg gagaacggcg gctacttcgt gctccgccag gagatcttcg agtcgctgta cggcgacacc ctcttgccgc cgatgaagca cgaggcggtc ctctagaagc >.............................msc2..............................> v s d m p l w e n g g y f v l r q e i f 1861 accacatccc gcagggcggg gacctggtcg ccgacggctg cggccaactg gccaagcagg tggtgtaggg cgtcccgccc ctggaccagc ggctgccgac gccggttgac cggttcgtcc >.............................msc2..............................> d h i p q g g d l v a d g c g q l a k q 312 Anhang 1921 gccgcctggt ggcgcaccag caccgcggct tctggaagcc gaccgacacc gtcaaggagc cggcggacca ccgcgtggtc gtggcgccga agaccttcgg ctggctgtgg cagttcctcg >.............................msc2..............................> g r l v a h q h r g f w k p t d t v k e 1981 gggccgcgct cgacgacgcc tacgcccggg gcgaccgtcc gtgggccgtg tgggaacggg cccggcgcga gctgctgcgg atgcgggccc cgctggcagg cacccggcac acccttgccc >.............................msc2..............................> r a a l d d a y a r g d r p w a v w e r 2041 acgccaccgg ggtgggcgcg tgatccggct cggcgccggg cgcccggacc gggtcgtcgc tgcggtggcc ccacccgcgc actaggccga gccgcggccc gcgggcctgg cccagcagcg >.........msc2.........>> d a t g v g a >>..................msc3....................> v i r l g a g r p d r v v 2101 ggtgggcgcg cactgcgacg acatcgccat cggcgccggt ggcacgctgc tgacgatgtg ccacccgcgc gtgacgctgc tgtagcggta gccgcggcca ccgtgcgacg actgctacac >.............................msc3..............................> a v g a h c d d i a i g a g g t l l t m 2161 cctggcgcgc ccgggcctgc gcgtcgacgc gctggtgctg tccggcggcg gcgaccggga ggaccgcgcg ggcccggacg cgcagctgcg cgaccacgac aggccgccgc cgctggccct >.............................msc3..............................> c l a r p g l r v d a l v l s g g g d r 2221 gcaggaggag cgggccgcgc tcgccgcctt ctgtccggga gccgacctgc ggctgaccgt cgtcctcctc gcccggcgcg agcggcggaa gacaggccct cggctggacg ccgactggca >.............................msc3..............................> e q e e r a a l a a f c p g a d l r l t 2281 gcacaagctg ccggacgggc ggctgcccgc gcactgggag gaggccaagg ccgcggtcga cgtgttcgac ggcctgcccg ccgacgggcg cgtgaccctc ctccggttcc ggcgccagct >.............................msc3..............................> v h k l p d g r l p a h w e e a k a a v 2341 ggagctgcgc gcggcgacgg acccggacct cgtgcttgcc ccgcgcaccg acgacgccca cctcgacgcg cgccgctgcc tgggcctgga gcacgaacgg ggcgcgtggc tgctgcgggt >.............................msc3..............................> e e l r a a t d p d l v l a p r t d d a 2401 ccaggaccac cgcggcctgg cgaagctgat ccccaccgcg ttccgcgacc acctggtgct ggtcctggtg gcgccggacc gcttcgacta ggggtggcgc aaggcgctgg tggaccacga >.............................msc3..............................> h q d h r g l a k l i p t a f r d h l v 2461 cggctacgag atcgtcaagt gggacggcga tctcggccgt ccggcggcgt accagccgct gccgatgctc tagcagttca ccctgccgct agagccggca ggccgccgca tggtcggcga >.............................msc3..............................> l g y e i v k w d g d l g r p a a y q p 2521 ctcgccggag accgccgagc gcaaggtggg gctgctgcag gagcactacc cctcgcagcg gagcggcctc tggcggctcg cgttccaccc cgacgacgtc ctcgtgatgg ggagcgtcgc >.............................msc3..............................> l s p e t a e r k v g l l q e h y p s q 2581 ccaccggccc tggtacgacc gggaggcctt cctcggtctc gcccggatcc gcggtatcga ggtggccggg accatgctgg ccctccggaa ggagccagag cgggcctagg cgccatagct >.............................msc3..............................> r h r p w y d r e a f l g l a r i r g i Anhang 313 2641 atgccacgag cgctacgccg aggcgttcgc cgtcaccaaa ctcacgctca acctgggggg tacggtgctc gcgatgcggc tccgcaagcg gcagtggttt gagtgcgagt tggacccccc >.............................msc3..............................> e c h e r y a e a f a v t k l t l n l g 2701 ttgaaccatg cgcgtactcc tgaccggaca ccagggctac ctgggcaccg tgatggcccc aacttggtac gcgcatgagg actggcctgt ggtcccgatg gacccgtggc actaccgggg >.>> msc3 g >>.........................msc4..........................> m r v l l t g h q g y l g t v m a 2761 ggtcctcgcc gaggccgggc acgaggtcgt cggcctcgac gccggcctgt tcgccgactg ccaggagcgg ctccggcccg tgctccagca gccggagctg cggccggaca agcggctgac >.............................msc4..............................> p v l a e a g h e v v g l d a g l f a d 2821 cgtgctgggg ccgaagccgg cggacccgcc gggtgcacgg gtggacctgc gcgacctcac gcacgacccc ggcttcggcc gcctgggcgg cccacgtgcc cacctggacg cgctggagtg >.............................msc4..............................> c v l g p k p a d p p g a r v d l r d l 2881 ggccgcacac gtggccgggg tcgacgcggt gatccacctg gcggccctgt ccaacgaccc ccggcgtgtg caccggcccc agctgcgcca ctaggtggac cgccgggaca ggttgctggg >.............................msc4..............................> t a a h v a g v d a v i h l a a l s n d 2941 gctgggctca ctggcgccgc agctcaccta cgacatcaac caccacgcgt ccgtgacgct cgacccgagt gaccgcggcg tcgagtggat gctgtagttg gtggtgcgca ggcactgcga >.............................msc4..............................> p l g s l a p q l t y d i n h h a s v t 3001 ggcccggctg gcccgcgacg ccggggtgcg gcgcttcctg tacgcgtcga cgtgctcggt ccgggccgac cgggcgctgc ggccccacgc cgcgaaggac atgcgcagct gcacgagcca >.............................msc4..............................> l a r l a r d a g v r r f l y a s t c s 3061 gtacggcgcc gccggcggtg acgaactggt ggccgaggac gccccgctgc gcccggtgac catgccgcgg cggccgccac tgcttgacca ccggctcctg cggggcgacg cgggccactg >.............................msc4..............................> v y g a a g g d e l v a e d a p l r p v 3121 cccgtacgcg gagtccaagg tgcgggtcga ggacgacctg cacgcgctgg ccgacgccga gggcatgcgc ctcaggttcc acgcccagct cctgctggac gtgcgcgacc ggctgcggct >.............................msc4..............................> t p y a e s k v r v e d d l h a l a d a 3181 cttcagcccg gtgtacatgc gcaacgccac cgccttcggc tactcccccc ggctgcgcgc gaagtcgggc cacatgtacg cgttgcggtg gcggaagccg atgagggggg ccgacgcgcg >.............................msc4..............................> d f s p v y m r n a t a f g y s p r l r 3241 cgacatcgtg ctgaacaacc tggtgggcca cgcgctgctg tccggcgagg tgctggtgct gctgtagcac gacttgttgg accacccggt gcgcgacgac aggccgctcc acgaccacga >.............................msc4..............................> a d i v l n n l v g h a l l s g e v l v 3301 ctccgacggc accccctggc gcccgctggt gcacgccgcc gacatcgcgc gggccttcac gaggctgccg tgggggaccg cgggcgacca cgtgcggcgg ctgtagcgcg cccggaagtg >.............................msc4..............................> l s d g t p w r p l v h a a d i a r a f 314 Anhang 3361 ggccgcgctg gacgcgccgc gcgaggcggt gcacgaccgg gcgttcaaca tcggcaccga ccggcgcgac ctgcgcggcg cgctccgcca cgtgctggcc cgcaagttgt agccgtggct >.............................msc4..............................> t a a l d a p r e a v h d r a f n i g t 3421 gaccaacaac gtgacggtcg ccgagatcgc cgagcaggtc gccgaggcgg tgtccggcgc ctggttgttg cactgccagc ggctctagcg gctcgtccag cggctccgcc acaggccgcg >.............................msc4..............................> e t n n v t v a e i a e q v a e a v s g 3481 gaaggtggtg atcaccggcg agaacggggc cgatccccgg tcgtaccggg tggacttctc cttccaccac tagtggccgc tcttgccccg gctaggggcc agcatggccc acctgaagag >.............................msc4..............................> a k v v i t g e n g a d p r s y r v d f 3541 ccggttccgg gccgcgatcc ccggcttcga ctgtgagtgg tcggtgaagc ggggcgcact ggccaaggcc cggcgctagg ggccgaagct gacactcacc agccacttcg ccccgcgtga >.............................msc4..............................> s r f r a a i p g f d c e w s v k r g a 3601 cgaactcgcc gacgcctacc ggaagttcgg gctgacccag gaggccttcg agcgccgctt gcttgagcgg ctgcggatgg ccttcaagcc cgactgggtc ctccggaagc tcgcggcgaa >.............................msc4..............................> l e l a d a y r k f g l t q e a f e r r 3661 cacccggctg gccgtgctgc gggcggcgtc taaggccggc accgtcgacg acaccctgcg gtgggccgac cggcacgacg cccgccgcag attccggccg tggcagctgc tgtgggacgc >.............................msc4..............................> f t r l a v l r a a s k a g t v d d t l 3721 gtggcgcgga tgaccgtcgg cgaggagatg cacgcgctgg tggagcggtt gtacccgctg caccgcgcct actggcagcc gctcctctac gtgcgcgacc acctcgccaa catgggcgac >....msc4...>> r w r g >>........................msc5.........................> m t v g e e m h a l v e r l y p l 3781 tgccggagca tcaccggcga cggggtgcgc gccaccctgg acatcgtcgg cgagtacatc acggcctcgt agtggccgct gccccacgcg cggtgggacc tgtagcagcc gctcatgtag >.............................msc5..............................> c r s i t g d g v r a t l d i v g e y i 3841 ccgctccagg tgcacgaggt gccgaccggg acccaggtgc tcgactggac ggtgccgcag ggcgaggtcc acgtgctcca cggctggccc tgggtccacg agctgacctg ccacggcgtc >.............................msc5..............................> p l q v h e v p t g t q v l d w t v p q 3901 gagtggaaca tccgggacgc ctacatcgcc gacgccgcgg gcaaccgggt cgtcgacttc ctcaccttgt aggccctgcg gatgtagcgg ctgcggcgcc cgttggccca gcagctgaag >.............................msc5..............................> e w n i r d a y i a d a a g n r v v d f 3961 gccgcgtcca gcctgcacgt gctcggctac agcgtgccgg tgtcggcgac gatgccgctg cggcgcaggt cggacgtgca cgagccgatg tcgcacggcc acagccgctg ctacggcgac >.............................msc5..............................> a a s s l h v l g y s v p v s a t m p l 4021 gccgagctgc gcgagcatct gtacacgctg ccggagcggc cgagctgggt gccgtaccgc cggctcgacg cgctcgtaga catgtgcgac ggcctcgccg gctcgaccca cggcatggcg >.............................msc5..............................> a e l r e h l y t l p e r p s w v p y r Anhang 315 4081 accagctact acaagccgca gtgggggttc tgtctctccc aggacatcct ggacgcgatg tggtcgatga tgttcggcgt cacccccaag acagagaggg tcctgtagga cctgcgctac >.............................msc5..............................> t s y y k p q w g f c l s q d i l d a m 4141 ccggacggcg agtacgaggt gcgcgtggac tccacgctcg ccgacggcca cctcacctac ggcctgccgc tcatgctcca cgcgcacctg aggtgcgagc ggctgccggt ggagtggatg >.............................msc5..............................> p d g e y e v r v d s t l a d g h l t y 4201 gccgagcacg tggtccccgg gcagatcgcc gacgaggtga tcgtctcctg ccacgtctgc cggctcgtgc accaggggcc cgtctagcgg ctgctccact agcagaggac ggtgcagacg >.............................msc5..............................> a e h v v p g q i a d e v i v s c h v c 4261 cacccgtcgc tggccaacga caacctggcc ggtgtcgcgg tggcgacgtt cctggcccgg gtgggcagcg accggttgct gttggaccgg ccacagcgcc accgctgcaa ggaccgggcc >.............................msc5..............................> h p s l a n d n l a g v a v a t f l a r 4321 gcgctggcgg agcggacccc gtactacacc taccggttca tcttcgcgcc cggcaccatc cgcgaccgcc tcgcctgggg catgatgtgg atggccaagt agaagcgcgg gccgtggtag >.............................msc5..............................> a l a e r t p y y t y r f i f a p g t i 4381 ggggcgatca cctggctggc ccgcaacgcg gagaggatcg agcgagtcaa gcacggcctg ccccgctagt ggaccgaccg ggcgttgcgc ctctcctagc tcgctcagtt cgtgccggac >.............................msc5..............................> g a i t w l a r n a e r i e r v k h g l 4441 gtgctggcct gcgcgggcga ccggggccgg ctgacgtaca agcggagccg gcgcggtgac cacgaccgga cgcgcccgct ggccccggcc gactgcatgt tcgcctcggc cgcgccactg >.............................msc5..............................> v l a c a g d r g r l t y k r s r r g d 4501 gccgagatcg accgggtgat gcggcatgtg ctgaccgcct ccgaacgccc gcaccacatc cggctctagc tggcccacta cgccgtacac gactggcgga ggcttgcggg cgtggtgtag >.............................msc5..............................> a e i d r v m r h v l t a s e r p h h i 4561 gccgagttca ccccgtacgg ctacgacgag cggcagtact gctcaccggg cttcgatctc cggctcaagt ggggcatgcc gatgctgctc gccgtcatga cgagtggccc gaagctagag >.............................msc5..............................> a e f t p y g y d e r q y c s p g f d l 4621 ggcgtgggct cgctcagccg gaccccgtac gccggttacc cggaatatca cacctcggcg ccgcacccga gcgagtcggc ctggggcatg cggccaatgg gccttatagt gtggagccgc >.............................msc5..............................> g v g s l s r t p y a g y p e y h t s a 4681 gacaacccgg acttcgtcac cccggaggcg atgacggaca cgctcaccct gtgccgcgag ctgttgggcc tgaagcagtg gggcctccgc tactgcctgt gcgagtggga cacggcgctc >.............................msc5..............................> d n p d f v t p e a m t d t l t l c r e 4741 gcgttcgccg tgctcgacgg caaccggcgg tacgtcaatc tcagccccta cggcgagccc cgcaagcggc acgagctgcc gttggccgcc atgcagttag agtcggggat gccgctcggg >.............................msc5..............................> a f a v l d g n r r y v n l s p y g e p 316 Anhang 4801 cagctgggcc ggcggggcct gtacgactcg ctcggcggcc gcagcgacgc caaagaggcc gtcgacccgg ccgccccgga catgctgagc gagccgccgg cgtcgctgcg gtttctccgg >.............................msc5..............................> q l g r r g l y d s l g g r s d a k e a 4861 cagatggcga tgctgtgggt gctcagcctc tccgacggcg agcacgcgct gctggacgtg gtctaccgct acgacaccca cgagtcggag aggctgccgc tcgtgcgcga cgacctgcac >.............................msc5..............................> q m a m l w v l s l s d g e h a l l d v 4921 gccgagcggg ccgggctgcc cttcgacacc gtcgccgccg cggccggcgc cctgcacggc cggctcgccc ggcccgacgg gaagctgtgg cagcggcggc gccggccgcg ggacgtgccg >.............................msc5..............................> a e r a g l p f d t v a a a a g a l h g 4981 gccgggctga tcaaggcatg acgccgatga ccaccgagga ggggaaggcg acggcacggg cggcccgact agttccgtac tgcggctact ggtggctcct ccccttccgc tgccgtgccc >........msc5........>> a g l i k a >>..............msc6................> m t t e e g k a t a r 5041 ccgggcccgc ccggcgggcc ctgctcggcc ggctgtcctg ggggctggcc gaccaggccg ggcccgggcg ggccgcccgg gacgagccgg ccgacaggac ccccgaccgg ctggtccggc >.............................msc6..............................> a g p a r r a l l g r l s w g l a d q a 5101 cctccagcat gaccaacttc gcggtgggga tctacgtcgc gcgctcgctc gggctcaccg ggaggtcgta ctggttgaag cgccacccct agatgcagcg cgcgagcgag cccgagtggc >.............................msc6..............................> a s s m t n f a v g i y v a r s l g l t 5161 cgttcggcgt gttcagcctg gcctgggtga cgtacggcgt ggtgctcagc gtctcccggg gcaagccgca caagtcggac cggacccact gcatgccgca ccacgagtcg cagagggccc >.............................msc6..............................> a f g v f s l a w v t y g v v l s v s r 5221 ggctggccac cgacccgctc gtggtgcgct tcagcggggt gccggaggcc tcctggcgcg ccgaccggtg gctgggcgag caccacgcga agtcgcccca cggcctccgg aggaccgcgc >.............................msc6..............................> g l a t d p l v v r f s g v p e a s w r 5281 gggcagtggc ccgttcgtcg ggtaccgccc tcggcgtcgg cggcgtcatc ggcgcggcct cccgtcaccg ggcaagcagc ccatggcggg agccgcagcc gccgcagtag ccgcgccgga >.............................msc6..............................> g a v a r s s g t a l g v g g v i g a a 5341 gcctgggggc gggactggcc gtcggcggtc cggtggggcc cgccttcgcc tgcctgggcg cggacccccg ccctgaccgg cagccgccag gccaccccgg gcggaagcgg acggacccgc >.............................msc6..............................> c l g a g l a v g g p v g p a f a c l g 5401 tcctgctgcc ggggctgctg ctgcaggacg cctggcggta ctcgttcttc gccgccggca aggacgacgg ccccgacgac gacgtcctgc ggaccgccat gagcaagaag cggcggccgt >.............................msc6..............................> v l l p g l l l q d a w r y s f f a a g 5461 ccgggcggaa ggcgttcgtc aacgacctgg tgtggggcgt cgcgctcgtc ccggccatgg ggcccgcctt ccgcaagcag ttgctggacc acaccccgca gcgcgagcag ggccggtacc >.............................msc6..............................> t g r k a f v n d l v w g v a l v p a m Anhang 317 5521 tcgtggcggc ccgcgtgggc acggtggccg cgttcgtcct ggcctggggt gcgtccgccg agcaccgccg ggcgcacccg tgccaccggc gcaagcagga ccggacccca cgcaggcggc >.............................msc6..............................> v v a a r v g t v a a f v l a w g a s a 5581 cggtcgccgc ggtgtacggc tgcctccagt ccggcatccg gccgcggctg accggagcgc gccagcggcg ccacatgccg acggaggtca ggccgtaggc cggcgccgac tggcctcgcg >.............................msc6..............................> a v a a v y g c l q s g i r p r l t g a 5641 gcgcctggct gcgcgagcac cgcgacctcg gctaccggta cctggtcgag aacacctgcc cgcggaccga cgcgctcgtg gcgctggagc cgatggccat ggaccagctc ttgtggacgg >.............................msc6..............................> r a w l r e h r d l g y r y l v e n t c 5701 tcagcggcgc ggcccagctg cgggcgtacg gactcggcgc gatcgtcggg gtcggcgcgg agtcgccgcg ccgggtcgac gcccgcatgc ctgagccgcg ctagcagccc cagccgcgcc >.............................msc6..............................> l s g a a q l r a y g l g a i v g v g a 5761 tgggtgtggt ccggggcgcc gagctgctgc tcggcccgtt cctcgccgtg ctgatggggc acccacacca ggccccgcgg ctcgacgacg agccgggcaa ggagcggcac gactaccccg >.............................msc6..............................> v g v v r g a e l l l g p f l a v l m g 5821 tgtcgctggt caccgtcgcg gaggcggcgc gggtgctgcg gcgggccccg caccggctcg acagcgacca gtggcagcgc ctccgccgcg cccacgacgc cgcccggggc gtggccgagc >.............................msc6..............................> l s l v t v a e a a r v l r r a p h r l 5881 gaaagttctg cctcctcctg ggcggcgccc aggccgtcgc cgcgctgctc tggggtgcgg ctttcaagac ggaggaggac ccgccgcggg tccggcagcg gcgcgacgag accccacgcc >.............................msc6..............................> g k f c l l l g g a q a v a a l l w g a 5941 ccctgctgct ggtgccggac cacgccggcg aactcgtgct cggcgacgtc tggcaggccg gggacgacga ccacggcctg gtgcggccgc ttgagcacga gccgctgcag accgtccggc >.............................msc6..............................> a l l l v p d h a g e l v l g d v w q a 6001 cctcggagct gatcgtgccg gccacgctcg gtgtcgcggg cgccggtctc ggcaccggcg ggagcctcga ctagcacggc cggtgcgagc cacagcgccc gcggccagag ccgtggccgc >.............................msc6..............................> a s e l i v p a t l g v a g a g l g t g 6061 cggcggccgg gctgcgcgcg ctcggcgcgg cccgccgctc tctgcgctgc cagctgttcg gccgccggcc cgacgcgcgc gagccgcgcc gggcggcgag agacgcgacg gtcgacaagc >.............................msc6..............................> a a a g l r a l g a a r r s l r c q l f 6121 cctccgcctg ctacgtcggc ggcggcctcg gcggggccgt cgcggccggc acggtcggct ggaggcggac gatgcagccg ccgccggagc cgccccggca gcgccggccg tgccagccga >.............................msc6..............................> a s a c y v g g g l g g a v a a g t v g 6181 cggcctgggg cgtcgccgcc gcgaccctcg cgagctccgc cgtgtggtgg ctgcagctgc gccggacccc gcagcggcgg cgctgggagc gctcgaggcg gcacaccacc gacgtcgacg >.............................msc6..............................> s a w g v a a a t l a s s a v w w l q l 318 Anhang 6241 gctccgccct gcgcgagcac caccaggact ccatccgcga agtgaggacc ccatgaccgc cgaggcggga cgcgctcgtg gtggtcctga ggtaggcgct tcactcctgg ggtactggcg >...........................msc6...........................>> r s a l r e h h q d s i r e v r t p >>msc7.> m t 6301 ccaccccagg ctgagcatcg gcctgcccgt ctacaacggc gaggagtacc tcgccgagtc ggtggggtcc gactcgtagc cggacgggca gatgttgccg ctcctcatgg agcggctcag >.............................msc7..............................> a h p r l s i g l p v y n g e e y l a e 6361 gttcgacgcc ctgctcggcc agacctacga ggacttcgag ctggtcgtct ccgacaacgc caagctgcgg gacgagccgg tctggatgct cctgaagctc gaccagcaga ggctgttgcg >.............................msc7..............................> s f d a l l g q t y e d f e l v v s d n 6421 ctcgaccgac gggaccgagg acatctgccg ccggtacgcg gcgaaggact cccgcatccg gagctggctg ccctggctcc tgtagacggc ggccatgcgc cgcttcctga gggcgtaggc >.............................msc7..............................> a s t d g t e d i c r r y a a k d s r i 6481 ctacatccgg ctgccccgca acatcggcgc cgcgcccaac cacaacttcg tgttcacgga gatgtaggcc gacggggcgt tgtagccgcg gcgcgggttg gtgttgaagc acaagtgcct >.............................msc7..............................> r y i r l p r n i g a a p n h n f v f t 6541 gtgccgcggc gagctgttca agtgggcctc gcacgacgac ctgtacgccc gggacctgct cacggcgccg ctcgacaagt tcacccggag cgtgctgctg gacatgcggg ccctggacga >.............................msc7..............................> e c r g e l f k w a s h d d l y a r d l 6601 gctgcgctgc gtcgaggcgc tcgacgaacg gccggacgtg gtcctcgcgc acagcgacca cgacgcgacg cagctccgcg agctgcttgc cggcctgcac caggagcgcg tgtcgctggt >.............................msc7..............................> l l r c v e a l d e r p d v v l a h s d 6661 ggcggtcatc gacgaggacg gcaaggtgaa ggtcccctac gcgtacgggc tcgccaccga ccgccagtag ctgctcctgc cgttccactt ccaggggatg cgcatgcccg agcggtggct >.............................msc7..............................> q a v i d e d g k v k v p y a y g l a t 6721 ctcgccgcac gccccggagc gcttccgcag cctgctgttc gagcccggcg gcgacgactt gagcggcgtg cggggcctcg cgaaggcgtc ggacgacaag ctcgggccgc cgctgctgaa >.............................msc7..............................> d s p h a p e r f r s l l f e p g g d d 6781 ctacggggtg atgcgggccg acatgctgcg ccgggtgaag ccgcacgaca gctaccacca gatgccccac tacgcccggc tgtacgacgc ggcccacttc ggcgtgctgt cgatggtggt >.............................msc7..............................> f y g v m r a d m l r r v k p h d s y h 6841 cgcggaccgc acgttcgtcg ccgagatcac cctgcacggc cccttccacc aggtgcccga gcgcctggcg tgcaagcagc ggctctagtg ggacgtgccg gggaaggtgg tccacgggct >.............................msc7..............................> h a d r t f v a e i t l h g p f h q v p 6901 gctgctgtac ttccgccgcg accaccccac ccgcgccgag cgggccaacc cctccaagcg cgacgacatg aaggcggcgc tggtggggtg ggcgcggctc gcccggttgg ggaggttcgc >.............................msc7..............................> e l l y f r r d h p t r a e r a n p s k Anhang 319 6961 ctcccggtgc gtcaacctgg acccgcgccg ggcgggcccg ctgcacccga cgccccggct gagggccacg cagttggacc tgggcgcggc ccgcccgggc gacgtgggct gcggggccga >.............................msc7..............................> r s r c v n l d p r r a g p l h p t p r 7021 gctcgccgag tacgtgtggg gtttcgtctc ggcgatccgg cgggcgccgc tgtccccggc cgagcggctc atgcacaccc caaagcagag ccgctaggcc gcccgcggcg acaggggccg >.............................msc7..............................> l l a e y v w g f v s a i r r a p l s p 7081 cgaccggcgc gcctgccacc gccatctggc cgcgtggatg accagccggg tccggccggg gctggccgcg cggacggtgg cggtagaccg gcgcacctac tggtcggccc aggccggccc >.............................msc7..............................> a d r r a c h r h l a a w m t s r v r p 7141 cgcgggcgag cgggtcgagg accgcgcccc cgtcgacccg gacctgccga ccgtccgcgt gcgcccgctc gcccagctcc tggcgcgggg gcagctgggc ctggacggct ggcaggcgca >.............................msc7..............................> g a g e r v e d r a p v d p d l p t v r 7201 cgacgatctc gtcgccggcc gtgaaggcag gcaggcatga cgtccgcgcc cggcaggccg gctgctagag cagcggccgg cacttccgtc cgtccgtact gcaggcgcgg gccgtccggc >..................msc7..................>> v d d l v a g r e g r q a >>.........msc8..........> m t s a p g r p 7261 gtacgcgtcg gggtgttcgg cctgctcggc tccggcaacc tcggcaacga cgggtccctg catgcgcagc cccacaagcc ggacgagccg aggccgttgg agccgttgct gcccagggac >.............................msc8..............................> v r v g v f g l l g s g n l g n d g s l 7321 gaggccgtgc tcggccacct tcgcgccgcg catccggagg cggtcgtgga cgcgctgtgc ctccggcacg agccggtgga agcgcggcgc gtaggcctcc gccagcacct gcgcgacacg >.............................msc8..............................> e a v l g h l r a a h p e a v v d a l c 7381 ggcggccccg aggtcgtcac ggcccggtac ggcatccccg cgacgcggct gcactggtat ccgccggggc tccagcagtg ccgggccatg ccgtaggggc gctgcgccga cgtgaccata >.............................msc8..............................> g g p e v v t a r y g i p a t r l h w y 7441 cgcggggagt accggaccgc ctcccgagcg ggcgcgatcg cggggaaggg gctgggcaaa gcgcccctca tggcctggcg gagggctcgc ccgcgctagc gccccttccc cgacccgttt >.............................msc8..............................> r g e y r t a s r a g a i a g k g l g k 7501 ctcgtcgacg ccttccgcac cgccgcctgg gtgcgccggc acgacgtggt gatcgtgccg gagcagctgc ggaaggcgtg gcggcggacc cacgcggccg tgctgcacca ctagcacggc >.............................msc8..............................> l v d a f r t a a w v r r h d v v i v p 7561 ggcatgggcg tgctggaggc cacgctgccg ctgcggccgt gggggttccc gtacgcgctg ccgtacccgc acgacctccg gtgcgacggc gacgccggca cccccaaggg catgcgcgac >.............................msc8..............................> g m g v l e a t l p l r p w g f p y a l 7621 ttcctgctgt gcgcgagcgg ccggctgtcc ggcacccggg tcgcgctggt cggcgtgggg aaggacgaca cgcgctcgcc ggccgacagg ccgtgggccc agcgcgacca gccgcacccc >.............................msc8..............................> f l l c a s g r l s g t r v a l v g v g 320 Anhang 7681 gccggcccga tcggcaaccg ggcgacccgg accctggtgc gctggtcggc gcggctggcc cggccgggct agccgttggc ccgctgggcc tgggaccacg cgaccagccg cgccgaccgg >.............................msc8..............................> a g p i g n r a t r t l v r w s a r l a 7741 gcccaccggt cgtaccggga cgagctgtcc cgtgacgcgc tgcgggcgat gggcgtggac cgggtggcca gcatggccct gctcgacagg gcactgcgcg acgcccgcta cccgcacctg >.............................msc8..............................> a h r s y r d e l s r d a l r a m g v d 7801 acctcgcgcg acgaggtcca tccggacctc gccttcgccc tgccggtgcc gccggtgagc tggagcgcgc tgctccaggt aggcctggag cggaagcggg acggccacgg cggccactcg >.............................msc8..............................> t s r d e v h p d l a f a l p v p p v s 7861 gcggccggcg acccgccggg cctcgtgtgc gtcggcgtca tggacttcca cggcggcgac cgccggccgc tgggcggccc ggagcacacg cagccgcagt acctgaaggt gccgccgctg >.............................msc8..............................> a a g d p p g l v c v g v m d f h g g d 7921 gacgaccgcg accgcgccga ggagatccac cggcgctacc tggacgggac cacccgcttc ctgctggcgc tggcgcggct cctctaggtg gccgcgatgg acctgccctg gtgggcgaag >.............................msc8..............................> d d r d r a e e i h r r y l d g t t r f 7981 gtccgcgcgc tggccgagga gggcagaccc gtccggctgc tcaccggcga cgcgtgcgac caggcgcgcg accggctcct cccgtctggg caggccgacg agtggccgct gcgcacgctg >.............................msc8..............................> v r a l a e e g r p v r l l t g d a c d 8041 gcgccggtgg tcgccgcgat cctcgacgcg gtggactcgc cgctggtcac cgccgccgag cgcggccacc agcggcgcta ggagctgcgc cacctgagcg gcgaccagtg gcggcggctc >.............................msc8..............................> a p v v a a i l d a v d s p l v t a a e 8101 gcgacctcgc tggccgacct gctgaaggag acggcggccg ccgacaccgt ggtggcgacc cgctggagcg accggctgga cgacttcctc tgccgccggc ggctgtggca ccaccgctgg >.............................msc8..............................> a t s l a d l l k e t a a a d t v v a t 8161 cgctaccaca acctggtctg cgcgctgagg gccggcaccc cgacgctcgc cctcggctac gcgatggtgt tggaccagac gcgcgactcc cggccgtggg gctgcgagcg ggagccgatg >.............................msc8..............................> r y h n l v c a l r a g t p t l a l g y 8221 gcggccaaga gtgacgcgct catggcgagg atggggctgg acacgtactg ccatccggct cgccggttct cactgcgcga gtaccgctcc taccccgacc tgtgcatgac ggtaggccga >.............................msc8..............................> a a k s d a l m a r m g l d t y c h p a 8281 cgcgaggtcg acgccgaccg gctgctcgaa cagttccggg agctggagaa gaacgcggcg gcgctccagc tgcggctggc cgacgagctt gtcaaggccc tcgacctctt cttgcgccgc >.............................msc8..............................> r e v d a d r l l e q f r e l e k n a a 8341 gacgtacggc ggaccctcgc cgagcggaac ctgaccgtcg cccggcagct cgaccggcag ctgcatgccg cctgggagcg gctcgccttg gactggcagc gggccgtcga gctggccgtc >.............................msc8..............................> d v r r t l a e r n l t v a r q l d r q Anhang 321 8401 ttcacggctc tgacagcggc cctgttcccg gcggccggcc gcacccgcac cccctccccc aagtgccgag actgtcgccg ggacaagggc cgccggccgg cgtgggcgtg ggggaggggg >.............................msc8..............................> f t a l t a a l f p a a g r t r t p s p 8461 gcgcccaccc ggcaggagac accatgaaag cgaccgccgt cccggagatc ttcggcgcct cgcgggtggg ccgtcctctg tggtactttc gctggcggca gggcctctag aagccgcgga >...........msc8...........>> a p t r q e t p >>................msc9.................> m k a t a v p e i f g a 8521 acctgttcga gccgacgccg tacgccgacg aacgcggctt cttctgccgt accttcgacg tggacaagct cggctgcggc atgcggctgc ttgcgccgaa gaagacggca tggaagctgc >.............................msc9..............................> y l f e p t p y a d e r g f f c r t f d 8581 ccgacgtggt ccgctcggtg gggctcgacc cggacgcctt catccaggac agcctgtccc ggctgcacca ggcgagccac cccgagctgg gcctgcggaa gtaggtcctg tcggacaggg >.............................msc9..............................> a d v v r s v g l d p d a f i q d s l s 8641 gctcggtcgg aggtgtgctg cgcggcctgc acctgcgctc cggcgccggc gaggccaagc cgagccagcc tccacacgac gcgccggacg tggacgcgag gccgcggccg ctccggttcg >.............................msc9..............................> r s v g g v l r g l h l r s g a g e a k 8701 tggtgcggtg ctcgtccggg aagatcttcg acgtcgtcgt ggacctgcgg ccccactcgc accacgccac gagcaggccc ttctagaagc tgcagcagca cctggacgcc ggggtgagcg >.............................msc9..............................> l v r c s s g k i f d v v v d l r p h s 8761 cgacctacct gggccgtgcc ttcttcgagc tgtccggcga gacccagacg accctgtaca gctggatgga cccggcacgg aagaagctcg acaggccgct ctgggtctgc tgggacatgt >.............................msc9..............................> p t y l g r a f f e l s g e t q t t l y 8821 tcccggcggg ctgcgcgcac ggcttccagg cgctgaccgc gaccgccgac acctcgtacc agggccgccc gacgcgcgtg ccgaaggtcc gcgactggcg ctggcggctg tggagcatgg >.............................msc9..............................> i p a g c a h g f q a l t a t a d t s y 8881 ggatcgaccg cccgcacgac ccggccgagg acgtgacgat cgccttcgac gacccggaac cctagctggc gggcgtgctg ggccggctcc tgcactgcta gcggaagctg ctgggccttg >.............................msc9..............................> r i d r p h d p a e d v t i a f d d p e 8941 tggccattcc ctggccgctg ccggtcacgt cgatgtccga gcgggaccgg aaggcgccga accggtaagg gaccggcgac ggccagtgca gctacaggct cgccctggcc ttccgcggct >.............................msc9..............................> l a i p w p l p v t s m s e r d r k a p 9001 gcctcgccga cgtcctgaag cacagggaga gttgaggtcg ccgtggacac cgaagagtac cggagcggct gcaggacttc gtgtccctct caactccagc ggcacctgtg gcttctcatg >................msc9...............>> s l a d v l k h r e s >>.....msc10......> v d t e e y 322 Anhang 9061 gaactgcccc ggtcgcgggc ggccaacgag cggctgcacg ccctcgtgcc cggcggcgcg cttgacgggg ccagcgcccg ccggttgctc gccgacgtgc gggagcacgg gccgccgcgc >.............................msc10.............................> e l p r s r a a n e r l h a l v p g g a 9121 cacacctacg ccaagggcga cgaccagtac ccggagcacc tggccccggt catcagccac gtgtggatgc ggttcccgct gctggtcatg ggcctcgtgg accggggcca gtagtcggtg >.............................msc10.............................> h t y a k g d d q y p e h l a p v i s h 9181 ggcagcggcg cccatgtgtg ggacgtcgac ggcaaccgct acatcgagta cggctccggc ccgtcgccgc gggtacacac cctgcagctg ccgttggcga tgtagctcat gccgaggccg >.............................msc10.............................> g s g a h v w d v d g n r y i e y g s g 9241 ctgcggtcgg tcagcctcgg gcacgcccac ccgcgcgtga gcgaggctgt gcgtcgggaa gacgccagcc agtcggagcc cgtgcgggtg ggcgcgcact cgctccgaca cgcagccctt >.............................msc10.............................> l r s v s l g h a h p r v s e a v r r e 9301 ctcgaccgcg gcagcaactt cgtacggccg tccatcgtgg aggtcgaggc cgcggaacgc gagctggcgc cgtcgttgaa gcatgccggc aggtagcacc tccagctccg gcgccttgcg >.............................msc10.............................> l d r g s n f v r p s i v e v e a a e r 9361 ttcctggcga cggtgcccac cgccgacatg gtgaagttcg cgaagaacgg ctccgacgcc aaggaccgct gccacgggtg gcggctgtac cacttcaagc gcttcttgcc gaggctgcgg >.............................msc10.............................> f l a t v p t a d m v k f a k n g s d a 9421 accaccgccg cggtgcgcct cgcgcgtgcc gccaccgggc gccggcgggt ggccctctgc tggtggcggc gccacgcgga gcgcgcacgg cggtggcccg cggccgccca ccgggagacg >.............................msc10.............................> t t a a v r l a r a a t g r r r v a l c 9481 gccgaccatc cgttcttctc caccgacgac tggttcatcg gcaccacggc gatgtccgcc cggctggtag gcaagaagag gtggctgctg accaagtagc cgtggtgccg ctacaggcgg >.............................msc10.............................> a d h p f f s t d d w f i g t t a m s a 9541 ggcatcccgt cggccaccaa cgacctcacc gtgacgttcc cctacgcgga cctggccgcc ccgtagggca gccggtggtt gctggagtgg cactgcaagg ggatgcgcct ggaccggcgg >.............................msc10.............................> g i p s a t n d l t v t f p y a d l a a 9601 accgaggaac tgctcacccg gtacccggac gacatcgtct gcctgatcct cgaacccgcc tggctccttg acgagtgggc catgggcctg ctgtagcaga cggactagga gcttgggcgg >.............................msc10.............................> t e e l l t r y p d d i v c l i l e p a 9661 acccacagcg aaccgccgcc cggttacctg gccggcctgc gcgaactggc cgaccggcac tgggtgtcgc ttggcggcgg gccaatggac cggccggacg cgcttgaccg gctggccgtg >.............................msc10.............................> t h s e p p p g y l a g l r e l a d r h 9721 ggctgcgtcc tcgtcttcga cgagatgatc accgggttcc gctggtccga ggcgggcgcc ccgacgcagg agcagaagct gctctactag tggcccaagg cgaccaggct ccgcccgcgg >.............................msc10.............................> g c v l v f d e m i t g f r w s e a g a Anhang 323 9781 cagggcctgt acggcgtcgt ccccgacctc tccacgttcg gcaaggcgct gggcaacggc gtcccggaca tgccgcagca ggggctggag aggtgcaagc cgttccgcga cccgttgccg >.............................msc10.............................> q g l y g v v p d l s t f g k a l g n g 9841 ttcgccgtct ccgcgctggc cggccgccgc gccctgatgg agctgggcgg gctgcgccac aagcggcaga ggcgcgaccg gccggcggcg cgggactacc tcgacccgcc cgacgcggtg >.............................msc10.............................> f a v s a l a g r r a l m e l g g l r h 9901 tccggcgacc gggtgttcct gctgtccacc acgcacggtg cggagacgca ctccctggcg aggccgctgg cccacaagga cgacaggtgg tgcgtgccac gcctctgcgt gagggaccgc >.............................msc10.............................> s g d r v f l l s t t h g a e t h s l a 9961 gccgcgatgg ccgtgcagag cacctacgtc gaggagggcg tcaccgcgcg gctgcacgcc cggcgctacc ggcacgtctc gtggatgcag ctcctcccgc agtggcgcgc cgacgtgcgg >.............................msc10.............................> a a m a v q s t y v e e g v t a r l h a 10021 ctcggcgagc ggctggccac cggcgtccgt gaagtcgccg ccgccatggg cgtcggcgac gagccgctcg ccgaccggtg gccgcaggca cttcagcggc ggcggtaccc gcagccgctg >.............................msc10.............................> l g e r l a t g v r e v a a a m g v g d 10081 cacgtcctcg tcaagggccg gcccagcaac ctggtcttcg ccaccctcga cgagcacggg gtgcaggagc agttcccggc cgggtcgttg gaccagaagc ggtgggagct gctcgtgccc >.............................msc10.............................> h v l v k g r p s n l v f a t l d e h g 10141 cggccgtcgc aggagtaccg caccctgttc ctgcgccggc tcctcgcggg cggggtgctg gccggcagcg tcctcatggc gtgggacaag gacgcggccg aggagcgccc gccccacgac >.............................msc10.............................> r p s q e y r t l f l r r l l a g g v l 10201 gccccgtcgt tcgtggtgag cgccgcgctc gacgacgccg acatcgatcg gaccgtcgac cggggcagca agcaccactc gcggcgcgag ctgctgcggc tgtagctagc ctggcagctg >.............................msc10.............................> a p s f v v s a a l d d a d i d r t v d 10261 gtggtcgccc aggcgtgcgc ggtgtaccgg aaggcgctgg acgccggcga ccccacgccc caccagcggg tccgcacgcg ccacatggcc ttccgcgacc tgcggccgct ggggtgcggg >.............................msc10.............................> v v a q a c a v y r k a l d a g d p t p 10321 tggctgtccg gacggccggt gaaaccggtg ttccgccgtc tggcgtgagg gaacgtcagc accgacaggc ctgccggcca ctttggccac aaggcggcag accgcactcc cttgcagtcg >......................msc10......................>> w l s g r p v k p v f r r l a - 10381 gaggccctgc ccgtccgccc gtccggtcga ccagccacgc ggtggccggt gtcaccgcca ctccgggacg ggcaggcggg caggccagct ggtcggtgcg ccaccggcca cagtggcggt 10441 gcgcggtgca ccagccgccg aggacgtcgg tcgggtagtg cgcgcccagc gcgacctgcg cgcgccacgt ggtcggcggc tcctgcagcc agcccatcac gcgcgggtcg cgctggacgc 10501 cccagcccat gacggccccg gcggccggcg cggcggcgag cacgagggtg aggccggccg gggtcgggta ctgccggggc cgccggccgc gccgccgctc gtgctcccac tccggccggc 10561 ttctgccgag gcggagccgc ccggccgcga gcagcgccac cgcgagggcg agcgcggtga aagacggctc cgcctcggcg ggccggcgct cgtcgcggtg gcgctcccgc tcgcgccact 324 Anhang 10621 ggaaggcggt gtgcccgctc gggtacgaca ggttgtcgtc gccgtggatg gtgcgtccga ccttccgcca cacgggcgag cccatgctgt ccaacagcag cggcacctac cacgcaggct 10681 ccaggggctt gagcagcgtg gtcgccccca cggctccgcc gaccgaggcg aggacgaaca ggtccccgaa ctcgtcgcac cagcgggggt gccgaggcgg ctggctccgc tcctgcttgt 10741 ccgcggcccg aggacgccgc agcagcagga gacagcccgc cacgacggcc acgaccagcg ggcgccgggc tcctgcggcg tcgtcgtcct ctgtcgggcg gtgctgccgg tgctggtcgc 10801 ccgccgcccc ggcgggctcc cccagaaagt ccgtgccgag agcgacccgc cgccacgagg ggcggcgggg ccgcccgagg gggtctttca ggcacggctc tcgctgggcg gcggtgctcc 10861 gccccacccc gtcgaccacc gccgagaccc gcacgtccac cgcaccgggc tccccgtccc cggggtgggg cagctggtgg cggctctggg cgtgcaggtg gcgtggcccg aggggcaggg 10921 cggcgaacac gaccccaccg acggccaccc ccagcgcggc gagaacggcc accgtcccga gccgcttgtg ctggggtggc tgccggtggg ggtcgcgccg ctcttgccgg tggcagggct 10981 gccacgcacg caacaccgcc ggcagcacgg gcggcgcgga cagcacgggc ggcgcggccc cggtgcgtgc gttgtggcgg ccgtcgtgcc cgccgcgcct gtcgtgcccg ccgcgccggg 11041 gccgcccacc aggtccgccg ggcccgaccc cgacatggtc ctcgacctcc gccaccaacg cggcgggtgg tccaggcggc ccgggctggg gctgtaccag gagctggagg cggtggttgc 11101 accccccgtc gtgtccctgc gcgccaccct aaccccccac ttttcatgga cggcaggtcg tggggggcag cacagggacg cgcggtggga ttggggggtg aaaagtacct gccgtccagc 11161 cccgcaccgg gccgccggcg tcgcaggtgt ctccccggtg ccggacctgg ggcccttgac gggcgtggcc cggcggccgc agcgtccaca gaggggccac ggcctggacc ccgggaactg 11221 gcggccggcc gtccagtcgc tctccactga cgctggagcg gcggccccga gactcgctgt cgccggccgg caggtcagcg agaggtgact gcgacctcgc cgccggggct ctgagcgaca 11281 gacatctcgg gaaggggtac ttcatgccgg actcaggcgt cgtcaggacg cgtcatgcga ctgtagagcc cttccccatg aagtacggcc tgagtccgca gcagtcctgc gcagtacgct >>...............msc12.................> m p d s g v v r t r h a 11341 tccatgtggc ggccgagccc aaggccgtgt acgagctgat cgcggcggcg gaggactggc aggtacaccg ccggctcggg ttccggcaca tgctcgacta gcgccgccgc ctcctgaccg >.............................msc12.............................> i h v a a e p k a v y e l i a a a e d w 11401 cgcacatttt tcctcccacc gtgcatgtgg agaagttcga ccgggacggc cggtcggaac gcgtgtaaaa aggagggtgg cacgtacacc tcttcaagct ggccctgccg gccagccttg >.............................msc12.............................> p h i f p p t v h v e k f d r d g r s e 11461 ggctgcggat ccgggcgttc gcgaacgggg aggtgcggtc gtggacctcc cgccgggaac ccgacgccta ggcccgcaag cgcttgcccc tccacgccag cacctggagg gcggcccttg >.............................msc12.............................> r l r i r a f a n g e v r s w t s r r e 11521 tggatccggg cgcgctgcgg gtgacgttcc gccaggaggt gtcgtccgcg ccggtcgcgt acctaggccc gcgcgacgcc cactgcaagg cggtcctcca cagcaggcgc ggccagcgca >.............................msc12.............................> l d p g a l r v t f r q e v s s a p v a Anhang 325 11581 cgatgggcgg cgaatggatc atcgaggccg cgccgggcgg cagtagcgtc gtcctgctgc gctacccgcc gcttacctag tagctccggc gcggcccgcc gtcatcgcag caggacgacg >.............................msc12.............................> s m g g e w i i e a a p g g s s v v l l 11641 acgacttcac cgtcgtcgac gacgacccgg cggaccgtga gtgggtgggg cgcgccgtcg tgctgaagtg gcagcagctg ctgctgggcc gcctggcact cacccacccc gcgcggcagc >.............................msc12.............................> h d f t v v d d d p a d r e w v g r a v 11701 acaccaacag cgaatccgag ctggccgcgc tgaagacggc cgcggagtcc ctggcggcgg tgtggttgtc gcttaggctc gaccggcgcg acttctgccg gcgcctcagg gaccgccgcc >.............................msc12.............................> d t n s e s e l a a l k t a a e s l a a 11761 agccgggggc cttgctgtcg ttctccgatc acgtcgacat ctcgggcgcg cggcaggagg tcggcccccg gaacgacagc aagaggctag tgcagctgta gagcccgcgc gccgtcctcc >.............................msc12.............................> e p g a l l s f s d h v d i s g a r q e 11821 tgtacgactt cctgtggcgg gccgacctgt gggaggagcg gcttccgcat gtgagcaggc acatgctgaa ggacaccgcc cggctggaca ccctcctcgc cgaaggcgta cactcgtccg >.............................msc12.............................> v y d f l w r a d l w e e r l p h v s r 11881 tcgtgctgac cgagccgggc gacgacctgc agacggtgga gatggatacc cgcgccgccg agcacgactg gctcggcccg ctgctggacg tctgccacct ctacctatgg gcgcggcggc >.............................msc12.............................> l v l t e p g d d l q t v e m d t r a a 11941 acggttcggt acacacgacc aagtcggtac gcgtcgggtt cgcgccggac cggctcgtgt tgccaagcca tgtgtgctgg ttcagccatg cgcagcccaa gcgcggcctg gccgagcaca >.............................msc12.............................> d g s v h t t k s v r v g f a p d r l v 12001 acaagcagat ccaggtgccc ccgctgatgg ccgcgcacac gggccgctgg accgtcgaga tgttcgtcta ggtccacggg ggcgactacc ggcgcgtgtg cccggcgacc tggcagctct >.............................msc12.............................> y k q i q v p p l m a a h t g r w t v e 12061 ccaccgaggg cggggtacgc gccacctcgc accacacggt cgtcctgcgc ccggatcggg ggtggctccc gccccatgcg cggtggagcg tggtgtgcca gcaggacgcg ggcctagccc >.............................msc12.............................> t t e g g v r a t s h h t v v l r p d r 12121 tgcgcgaact gctgggcccc gaagccacgc tcgccgcggc ccgcgacctc gtacgcgagg acgcgcttga cgacccgggg cttcggtgcg agcggcgccg ggcgctggag catgcgctcc >.............................msc12.............................> v r e l l g p e a t l a a a r d l v r e 12181 ccctcggcag gaacagcacg gccaccctca ccctggccaa ggaggccgcg gaacgcaccg gggagccgtc cttgtcgtgc cggtgggagt gggaccggtt cctccggcgc cttgcgtggc >.............................msc12.............................> a l g r n s t a t l t l a k e a a e r t 12241 cgtcccgctg acgccgggcg aacggaagcg ggcggggcmc cggacaaccg gggccccgcc gcagggcgac tgcggcccgc ttgccttcgc ccgccccgkg gcctgttggc cccggggcgg >..msc12..>> a s r - 326 Anhang 12301 tccgtgttcc ggttcagctt cccgacaggg acgagttgac caggtcgacg aaggcccggg aggcacaagg ccaagtcgaa gggctgtccc tgctcaactg gtccagctgc ttccgggccc <<.....................msc16......................< - s g s l s s n v l d v f a r 12361 gggtctcggc gccgtcgagg tcctcgtcgg gaagggtcac gccgtaggcg cgggtgatac cccagagccg cggcagctcc aggagcagcc cttcccagtg cggcatccgc gcccactatg <.............................msc16.............................< p t e a g d l d e d p l t v g y a r t i 12421 ggccggccac ctccagcagg gcgagggagt cgtagccgag gtccgtgaag gacacgtcgg ccggccggtg gaggtcgtcc cgctccctca gcatcggctc caggcacttc ctgtgcagcc <.............................msc16.............................< r g a v e l l a l s d y g l d t f s v d 12481 cgatgtctcc gctcaggtcg acgccctcgt cctggccggc cgactcgcgc aggatgcggg gctacagagg cgagtccagc tgcgggagca ggaccggccg gctgagcgcg tcctacgccc <.............................msc16.............................< a i d g s l d v g e d q g a s e r l i r 12541 tgaagtcgtc gatgctcagt gccgtgaccc cgttggcgct catgagtggt ttccttccgt acttcagcag ctacgagtca cggcactggg gcaaccgcga gtactcacca aaggaaggca <....................msc16...................<< t f d d i s l a t v g n a s m 12601 cggatgcgtg ctcgggtggg ttcaccgggg gtgccggtgg tctgtgcggg cgctggttct gcctacgcac gagcccaccc aagtggcccc cacggccacc agacacgccc gcgaccaaga 12661 tcggtgcggt ggtggttcag ttcgcgcgcg tgaccaccgc ggccgcgttg aagccgccct agccacgcca ccaccaagtc aagcgcgcgc actggtggcg ccggcgcaac ttcggcggga <<...................msc15.....................< n a r t v v a a a n f g g 12721 cgccgcgggc caggaccagc gccgcgtcgc cggtgagcgt gcgcgcctcg cccgtcacca gcggcgcccg gtcctggtcg cggcgcagcg gccactcgca cgcgcggagc gggcagtggt <.............................msc15.............................< e g r a l v l a a d g t l t r a e g t v 12781 ggtccacggg gcagtccgcg gcgaccgagg tgacgtgcgc ggtcggggga acgctcccgt ccaggtgccc cgtcaggcgc cgctggctcc actgcacgcg ccagccccct tgcgagggca <.............................msc15.............................< l d v p c d a a v s t v h a t p p v s g 12841 cacgcaggac cagcagcgcg gaggccaggt cgagggcccc gccgcccgcg tacaggcggc gtgcgtcctg gtcgtcgcgc ctccggtcca gctcccgggg cggcgggcgc atgtccgccg <.............................msc15.............................< d r l v l l a s a l d l a g g g a y l r 12901 cggtctgcgc cttcggtacc gcgacccgta ccccgcgggg gccgaacacc gctgcgagcg gccagacgcg gaagccatgg cgctgggcat ggggcgcccc cggcttgtgg cgacgctcgc <.............................msc15.............................< g t q a k p v a v r v g r p g f v a a l 12961 cggccgcttc ggcccggtcc gcctcgggta cgccggccgc gtccgcgaag acgacggcga gccggcgaag ccgggccagg cggagcccat gcggccggcg caggcgcttc tgctgccgct <.............................msc15.............................< a a a e a r d a e p v g a a d a f v v a Anhang 327 13021 tggtgtcggg cgtacggtcc gcgtccgcga gggcggcacg gatcgcgcgc tccagaccgt accacagccc gcatgccagg cgcaggcgct cccgccgtgc ctagcgcgcg aggtctggca <.............................msc15.............................< i t d p t r d a d a l a a r i a r e l g 13081 cggccccggg gtcgcgcgga tcggggtcga aggtggccgc gtatccggcg agttcgccgt gccggggccc cagcgcgcct agccccagct tccaccggcg cataggccgc tcaagcggca <.............................msc15.............................< d a g p d r p d p d f t a a y g a l e g 13141 ggacacgggc gccgcgttcc tcggcggaca ccgggtcctc cagcaccagg tacgcgccgc cctgtgcccg cggcgcaagg agccgcctgt ggcccaggag gtcgtggtcc atgcgcggcg <.............................msc15.............................< h v r a g r e e a s v p d e l v l y a g 13201 cctcgcccgg gacatggccc gacgccgcct cgtcgaaggg caggtaagcg cggtcggggc ggagcgggcc ctgtaccggg ctgcggcgga gcagcttccc gtccattcgc gccagccccg <.............................msc15.............................< g e g p v h g s a a e d f p l y a r d p 13261 ggttctcggt gctgagccga ccggacgcga gctgtcccgc gaggcccagt gggcacaggg ccaagagcca cgactcggct ggcctgcgct cgacagggcg ctccgggtca cccgtgtccc <.............................msc15.............................< r n e t s l r g s a l q g a l g l p c l 13321 cgccgtcgac gcctcccgcg agcatcacct tcgtaccctt gcggatctgc cgccgcgcgt gcggcagctg cggagggcgc tcgtagtgga agcatgggaa cgcctagacg gcggcgcgca <.............................msc15.............................< a g d v g g a l m v k t g k r i q r r a 13381 gcccgatggc gtcgagtccg cccgcctggt cggtgacgac ggcgctgctc gggcccttca cgggctaccg cagctcaggc gggcggacca gccactgctg ccgcgacgag cccgggaagt <.............................msc15.............................< h g i a d l g g a q d t v v a s s p g k 13441 gcccgtgccg gatcgagatc tggccggtgt tgacggcgta gaaccaggcg aaggactggt cgggcacggc ctagctctag accggccaca actgccgcat cttggtccgc ttcctgacca <.............................msc15.............................< l g h r i s i q g t n v a y f w a f s q 13501 acgcgctgac gaactggccg cccttgctcc acaggttctg cagttcgcgc tggccgaact tgcgcgactg cttgaccggc gggaacgagg tgtccaagac gtcaagcgcg accggcttga <.............................msc15.............................< y a s v f q g g k s w l n q l e r q g f 13561 cgaagccgcc catcgacgag gccgaggaga cgcctgcctc gtagggggcc agggcggcga gcttcggcgg gtagctgctc cggctcctct gcggacggag catcccccgg tcccgccgct <.............................msc15.............................< e f g g m s s a s s v g a e y p a l a a 13621 gatcgatacc gctgtccttc agtgcctcgt cggccgcgta cagggcgagg cgggtcatgt ctagctatgg cgacaggaag tcacggagca gccggcgcat gtcccgctcc gcccagtaca <.............................msc15.............................< l d i g s d k l a e d a a y l a l r t m 13681 ggtcggtctg gggcagcagc cggctcggga tgtgcgcgga ggcctcgaag ccgggtacct ccagccagac cccgtcgtcg gccgagccct acacgcgcct ccggagcttc ggcccatgga <.............................msc15.............................< h d t q p l l r s p i h a s a e f g p v 328 Anhang 13741 cgccggcgag ccgcacccgg taaccggagg cgtcgaaacg ggtgatctcc gcgatgccgt gcggccgctc ggcgtgggcc attggcctcc gcagctttgc ccactagagg cgctacggca <.............................msc15.............................< e g a l r v r y g s a d f r t i e a i g 13801 tcgtgccctc gacgacggcc gaccagtgtg cgtcggtgcc gaggccggtg ggggcggcga agcacgggag ctgctgccgg ctggtcacac gcagccacgg ctccggccac ccccgccgct <.............................msc15.............................< n t g e v v a s w h a d t g l g t p a a 13861 caccgagacc ggtgatcacg ggtcgggtgg cggtggccgt cacgcggcac tcctttcggg gtggctctgg ccactagtgc ccagcccacc gccaccggca gtgcgccgtg aggaaagccc <....................msc15...................<< v g l g t i v p r t a t a t v <<.......msc14........< - a a s r e p 13921 acgggcgagg acgacggcgc tctggaaacc gccgaagccg ctgccgacgc tgagcacgga tgcccgctcc tgctgccgcg agacctttgg cggcttcggc gacggctgcg actcgtgcct <.............................msc14.............................< r a l v v a s q f g g f g s g v s l v s 13981 gtcgacccgg gcctcccgcg cgatgttggg gacgtagtcg aggtcgcaca gcggatcggg cagctgggcc cggagggcgc gctacaaccc ctgcatcagc tccagcgtgt cgcctagccc <.............................msc14.............................< d v r a e r a i n p v y d l d c l p d p 14041 ttcgtgcagg ttcgcggtgg gcgggatcag gccgttctcc atggcgagca cgcatgcgac aagcacgtcc aagcgccacc cgccctagtc cggcaagagg taccgctcgt gcgtacgctg <.............................msc14.............................< e h l n a t p p i l g n e m a l v c a v 14101 gagttcgagc gcgccgatcg cgccgagcga gtgcccgatc atcgacttga tggagctgac ctcaagctcg cgcggctagc gcggctcgct cacgggctag tagctgaact acctcgactg <.............................msc14.............................< l e l a g i a g l s h g i m s k i s s v 14161 gggcacccgg tgggcgtgct cgccgagcga ggtcttgaac gcggcggtct cgtgccggtc cccgtgggcc acccgcacga gcggctcgct ccagaacttg cgccgccaga gcacggccag <.............................msc14.............................< p v r h a h e g l s t k f a a t e h r d 14221 gttctgcttg gtgctggagc cgtgcgcgtt gacgtagtcg atctcccccg gtgcgagccg caagacgaac cacgacctcg gcacgcgcaa ctgcatcagc tagagggggc cacgctcggc <.............................msc14.............................< n q k t s s g h a n v y d i e g p a l r 14281 cgcctccgcg agcgccaccc ggatcgcctc ggccatctcc gcgccgtccg agcgcagtcc gcggaggcgc tcgcggtggg cctagcggag ccggtagagg cgcggcaggc tcgcgtcagg <.............................msc14.............................< a e a l a v r i a e a m e a g d s r l g 14341 ggtcatgtgg tacgcgttgc tgcgcgtgcc gaatccggcg acctcggcgt agatccgtgc ccagtacacc atgcgcaacg acgcgcacgg cttaggccgc tggagccgca tctaggcacg <.............................msc14.............................< t m h y a n s r t g f g a v e a y i r a 14401 gccacgcttc cgcgcgtgct ggagttcctc caggatcagc accgccgcgc cttcgccgag cggtgcgaag gcgcgcacga cctcaaggag gtcctagtcg tggcggcgcg gaagcggctc <.............................msc14.............................< g r k r a h q l e e l i l v a a g e g l Anhang 329 14461 gacgagcccg ttgcgggagt tgtcgaaggg gcgggaggcg tgttcggggt cgtcgttgcg ctgctcgggc aacgccctca acagcttccc cgccctccgc acaagcccca gcagcaacgc <.............................msc14.............................< v l g n r s n d f p r s a h e p d d n r 14521 gggcgtggtc gccttgatgg cgtcgaagca ggcgagggtg atgggtgaga tcggcgcgtc cccgcaccag cggaactacc gcagcttcgt ccgctcccac tacccactct agccgcgcag <.............................msc14.............................< p t t a k i a d f c a l t i p s i p a d 14581 ggtgcccccc gcgacgatga cgtcggcgct gccctcgcgg atgagatcgg ccccgtgacc ccacgggggg cgctgctact gcagccgcga cgggagcgcc tactctagcc ggggcactgg <.............................msc14.............................< t g g a v i v d a s g e r i l d a g h g 14641 gacggcgtcg aggccggagg tgcagccgtc ggagaccagc gacaccggac ccttggcccc ctgccgcagc tccggcctcc acgtcggcag cctctggtcg ctgtggcctg ggaaccgggg <.............................msc14.............................< v a d l g s t c g d s v l s v p g k a g 14701 gacctcgcgg gccagctcgg cggccagcga gctcggcacg aagtggtcgt agagccgggg ctggagcgcc cggtcgagcc gccggtcgct cgagccgtgc ttcaccagca tctcggcccc <.............................msc14.............................< v e r a l e a a l s s p v f h d y l r p 14761 caccgcgtac gcggggtcga cgagccagtg ggcgccgccg tcgctcagga cgacgtactc gtggcgcatg cgccccagct gctcggtcac ccgcggcggc agcgagtcct gctgcatgag <.............................msc14.............................< v a y a p d v l w h a g g d s l v v y e 14821 gtcctccatc gacgtggtgc agcccaccgc gcagccgagc gacacacccg tgcgcgccgc caggaggtag ctgcaccacg tcgggtggcg cgtcggctcg ctgtgtgggc acgcgcggcg <.............................msc14.............................< d e m s t t c g v a c g l s v g t r a a 14881 ctgtgaggtc gtgaggtcga ggccggagtc ggccaccgcc tcccgggcgg cgatcagcgc gacactccag cactccagct ccggcctcag ccggtggcgg agggcccgcc gctagtcgcg <.............................msc14.............................< q s t t l d l g s d a v a e r a a i l a 14941 gaactggccc gcgcggtcga gcctgcgctc ctcctgcggg gacagccccg ccgcggcggg cttgaccggg cgcgccagct cggacgcgag gaggacgccc ctgtcggggc ggcgccgccc <.............................msc14.............................< f q g a r d l r r e e q p s l g a a a p 15001 ccggaggtcg acctcggccg cgacctggga gcggtacggg gaggcatcga agagggagat ggcctccagc tggagccggc gctggaccct cgccatgccc ctccgtagct tctccctcta <.............................msc14.............................< r l d v e a a v q s r y p s a d f l s i 15061 ggtgcgggtg gccgtccgcc cggtcgacag cagatcccag tacctcttga tccctgttcc ccacgcccac cggcaggcgg gccagctgtc gtctagggtc atggagaact agggacaagg <.............................msc14.............................< t r t a t r g t s l l d w y r k i g t g 15121 cccgggcgcc accgcaccga ttccggttat gacgacgcgt cgttccatgg gcatcctcac gggcccgcgg tggcgtggct aaggccaata ctgctgcgca gcaaggtacc cgtaggagtg <......................msc14......................<< g p a v a g i g t i v v r r e m msc13 <<.< - 330 Anhang 15181 tcgctgtcgg cgggaaccgg cgctccggtc ccgggtcgca aacgtgtcaa tccggcctgg agcgacagcc gcccttggcc gcgaggccag ggcccagcgt ttgcacagtt aggccggacc <.............................msc13.............................< e s d a p v p a g t g p r l r t l g a q 15241 agacccgctc gaaccggcct ggacgcctgt gccgtcgcgt cggcggccgg ttctgcgggt tctgggcgag cttggccgga cctgcggaca cggcagcgca gccgccggcc aagacgccca <.............................msc13.............................< l g a r v p r s a q a t a d a a p e a p 15301 gcgtcggaga gttcggcgag ggccctgtcg aaggcctcgc gctcggcttc gggtgtgccg cgcagcctct caagccgctc ccgggacagc ttccggagcg cgagccgaag cccacacggc <.............................msc13.............................< a d s l e a l a r d f a e r e a e p t g 15361 gggcgcgcga gcagcagacc gaccgcccgg gagcctcctc tcgcgacccg cggatggcgg cccgcgcgct cgtcgtctgg ctggcgggcc ctcggaggag agcgctgggc gcctaccgcc <.............................msc13.............................< p r a l l l g v a r s g g r a v r p h r 15421 cgcgcgagca cggtgagccc ctgtcccgga cccgcctcgg cgagcaccac ctcccgctcg gcgcgctcgt gccactcggg gacagggcct gggcggagcc gctcgtggtg gagggcgagc <.............................msc13.............................< r a l v t l g q g p g a e a l v v e r e 15481 gcgagcagga ggtcgagcgc cggcccgaac agcacgggac gcgcgggctg gagcgcccag cgctcgtcct ccagctcgcg gccgggcttg tcgtgccctg cgcgcccgac ctcgcgggtc <.............................msc13.............................< a l l l d l a p g f l v p r a p q l a w 15541 aacctcgggt cccgggcccg ttcgtaggtc aggggcccgg gctcgtacgc cgagtgcagt ttggagccca gggcccgggc aagcatccag tccccgggcc cgagcatgcg gctcacgtca <.............................msc13.............................< f r p d r a r e y t l p g p e y a s h l 15601 accaaccggg gccgacggac gggcaccgag gccagcagcg gcagcgcgcg cagggccgct tggttggccc cggctgcctg cccgtggctc cggtcgtcgc cgtcgcgcgc gtcccggcga <.............................msc13.............................< v l r p r r v p v s a l l p l a r l a a 15661 tcggtgagca ccgggctgtg gaacgggttg agcgcgcgag ccctgcggca ggtgaagccg agccactcgt ggcccgacac cttgcccaac tcgcgcgctc gggacgccgt ccacttcggc <.............................msc13.............................< e t l v p s h f p n l a r a r r c t f g 15721 tcggcgcgca gtttctgctg cgcggtgcgc aggccctcct cggggccggc gagcagcacc agccgcgcgt caaagacgac gcgccacgcg tccgggagga gccccggccg ctcgtcgtgg <.............................msc13.............................< d a r l k q q a t r l g e e p g a l l v 15781 tggcggggcg cgttgacggc gcccacgacg acctcgtcgg tggtgtacgg ggcgacctcg accgccccgc gcaactgccg cgggtgctgc tggagcagcc accacatgcc ccgctggagc <.............................msc13.............................< q r p a n v a g v v v e d t t y p a v e 15841 tcggggctcg cctgcacggc gagcatgccg cccggcgggg tgccgtcgag ctggctgatg agccccgagc ggacgtgccg ctcgtacggc gggccgcccc acggcagctc gaccgactac <.............................msc13.............................< d p s a q v a l m g g p p t g d l q s i Anhang 331 15901 cggtccgcca tcagggccac ggagtcggtc aggtcgaaga ggccggcgag ggtggccgcg gccaggcggt agtcccggtg cctcagccag tccagcttct ccggccgctc ccaccggcgc <.............................msc13.............................< r d a m l a v s d t l d f l g a l t a a 15961 gcgacctctc cgacgctgtg cccgagcagg gccgcgggcc gcaccccggc gtcgaggacc cgctggagag gctgcgacac gggctcgtcc cggcgcccgg cgtggggccg cagctcctgg <.............................msc13.............................< a v e g v s h g l l a a p r v g a d l v 16021 gtgcggccga cggcccagtc gagtgcgaac agcagcggct gggcggtgcg cggaccgtcg cacgccggct gccgggtcag ctcacgcttg tcgtcgccga cccgccacgc gcctggcagc <.............................msc13.............................< t r g v a w d l a f l l p q a t r p g d 16081 gtctccgggc cggtgcgggc ggcgagccag tcggcgcgca gatcgaaccc gtgcgcgcgc cagaggcccg gccacgcccg ccgctcggtc agccgcgcgt ctagcttggg cacgcgcgcg <.............................msc13.............................< t e p g t r a a l w d a r l d f g h a r 16141 cacagtccga ggacctcgtc catgcgggtc cggaaacccg gatgggcgcg gtacaggccg gtgtcaggct cctggagcag gtacgcccag gcctttgggc ctacccgcgc catgtccggc <.............................msc13.............................< w l g l v e d m r t r f g p h a r y l g 16201 acgcccatac cgggttgttg cgcgccctgc ccggggaaca gcagtacggc cggccgcggt tgcgggtatg gcccaacaac gcgcgggacg ggccccttgt cgtcatgccg gccggcgcca <.....<< msc13 v g m 16261 gcggtcacga cgggtctcct ctcctcgctg tcccgccatg ctggaggcgt cggctggagc cgccagtgct gcccagagga gaggagcgac agggcggtac gacctccgca gccgacctcg 16321 ctcggtcgac cccgggcaca acgtccgtgg ccgggcggcg cggcaccgca cggacgccgt gagccagctg gggcccgtgt tgcaggcacc ggcccgccgc gccgtggcgt gcctgcggca 16381 ccgcctcgca gcggccccga ccgagccgct ccagccgttc tggaccgctc gtccaccggc ggcggagcgt cgccggggct ggctcggcga ggtcggcaag acctggcgag caggtggccg 16441 cggccggagt gttgtcccca gccggaggca cgcgacccgt cgccccggtg cgccgcgggc gccggcctca caacaggggt cggcctccgt gcgctgggca gcggggccac gcggcgcccg 16501 ggaacgaagg ccgccgggcc gggtaccacc cggcccggcg gccgtcggtg tcccgaccgt ccttgcttcc ggcggcccgg cccatggtgg gccgggccgc cggcagccac agggctggca 16561 ggttcccctg acggccggtg aaagggcatc gggacatgag gttcgaggac ctgtacatcg ccaaggggac tgccggccac tttcccgtag ccctgtactc caagctcctg gacatgtagc >>...................msc17....................> v k g h r d m r f e d l y i 16621 ccggggccgc cgtgcacctg gagggcacga ccaccgtggc ggaggcgctg cgggacgggc ggccccggcg gcacgtggac ctcccgtgct ggtggcaccg cctccgcgac gccctgcccg >.............................msc17.............................> a g a a v h l e g t t t v a e a l r d g 16681 ggtgcgacga gcgcaccgcg acgcgcagcg ggatcgcctc cgtggcggtg tcgacgggct ccacgctgct cgcgtggcgc tgcgcgtcgc cctagcggag gcaccgccac agctgcccga >.............................msc17.............................> r c d e r t a t r s g i a s v a v s t g 332 Anhang 16741 cgtccgcgcc cgaactcgcg gtgggcgcgg cgcggcaggt gctggagcgt accggcacgc gcaggcgcgg gcttgagcgc cacccgcgcc gcgccgtcca cgacctcgca tggccgtgcg >.............................msc17.............................> s s a p e l a v g a a r q v l e r t g t 16801 atcccaccga catcgatctg gtgctgcacg cgaccgtgca gcaccagggg cacgatctgt tagggtggct gtagctagac cacgacgtgc gctggcacgt cgtggtcccc gtgctagaca >.............................msc17.............................> h p t d i d l v l h a t v q h q g h d l 16861 gggcccccgc ctcgtacatc cagcgatacg cgctcggcaa ccgatgcccc gcgatcgaga cccgggggcg gagcatgtag gtcgctatgc gcgagccgtt ggctacgggg cgctagctct >.............................msc17.............................> w a p a s y i q r y a l g n r c p a i e 16921 tcaagcagct ctccaacggg ggcatggccg cgctggaact cgcgtccgcc tacctcgccg agttcgtcga gaggttgccc ccgtaccggc gcgaccttga gcgcaggcgg atggagcggc >.............................msc17.............................> i k q l s n g g m a a l e l a s a y l a 16981 gcgcgcccgg ccccacggcc gggctgctga ccacgggcga cgtgttcaca gatcccggct cgcgcgggcc ggggtgccgg cccgacgact ggtgcccgct gcacaagtgt ctagggccga >.............................msc17.............................> g a p g p t a g l l t t g d v f t d p g 17041 tcgaccgctg gcgcagtgac cccggcaccg tgtacgggga cgctggtacc gcgctcgtcc agctggcgac cgcgtcactg gggccgtggc acatgcccct gcgaccatgg cgcgagcagg >.............................msc17.............................> f d r w r s d p g t v y g d a g t a l v 17101 tggcccgggg acgcgggggt ttcgcgcggc tgcgcagcct ggtgaccgtg tcggacgccg accgggcccc tgcgccccca aagcgcgccg acgcgtcgga ccactggcac agcctgcggc >.............................msc17.............................> l a r g r g g f a r l r s l v t v s d a 17161 atctcgaaca gatgcacagg gggcgggacc cgttctcgcc ggtgccgttc gccgtccggc tagagcttgt ctacgtgtcc cccgccctgg gcaagagcgg ccacggcaag cggcaggccg >.............................msc17.............................> d l e q m h r g r d p f s p v p f a v r 17221 agcccatcga tctggggctg ctgcagaggg cgttcatcga ggacacgggg cggtcgtaca tcgggtagct agaccccgac gacgtctccc gcaagtagct cctgtgcccc gccagcatgt >.............................msc17.............................> q p i d l g l l q r a f i e d t g r s y 17281 gcgtcgcccg gatcacggcc gggcaggacg agacgctgaa gcgggcgctc gccgaggcgg cgcagcgggc ctagtgccgg cccgtcctgc tctgcgactt cgcccgcgag cggctccgcc >.............................msc17.............................> s v a r i t a g q d e t l k r a l a e a 17341 actgcacgct cgccgacctc tcctggttcg tgctcccgaa cttcggacgc ggccggctga tgacgtgcga gcggctggag aggaccaagc acgagggctt gaagcctgcg ccggccgact >.............................msc17.............................> d c t l a d l s w f v l p n f g r g r l 17401 actccacgtt cctgcgtcgc tggagcatcg aggaggagcg gaccacctgg cggtggggcc tgaggtgcaa ggacgcagcg acctcgtagc tcctcctcgc ctggtggacc gccaccccgg >.............................msc17.............................> n s t f l r r w s i e e e r t t w r w g Anhang 333 17461 gttcggtcgg tcacctcggg gccggtgacc agttcgcggg tctcgcgttc ctcgccgagt caagccagcc agtggagccc cggccactgg tcaagcgccc agagcgcaag gagcggctca >.............................msc17.............................> r s v g h l g a g d q f a g l a f l a e 17521 cgggccgggc gcgcgccggt gaactggggc tgctgttcgg ggtcggtgcg ggtttcacct gcccggcccg cgcgcggcca cttgaccccg acgacaagcc ccagccacgc ccaaagtgga >.............................msc17.............................> s g r a r a g e l g l l f g v g a g f t 17581 ggagctgcgc gatcgtggag ttcacgggta cgggcgcggg agagacggga tccggatgac cctcgacgcg ctagcacctc aagtgcccat gcccgcgccc tctctgccct aggcctactg >............................msc17............................>> w s c a i v e f t g t g a g e t g s g - 17641 cgcgccgcgc cggtggcgca tgcgcgccga gcgggtcggg gcgggccgcc ggtccgcggc gcgcggcgcg gccaccgcgt acgcgcggct cgcccagccc cgcccggcgg ccaggcgccg 17701 ggcccgcccc ttgcctcttt ctgtcctctt gtcccttttt ctgtctattt gtccctgttg ccgggcgggg aacggagaaa gacaggagaa cagggaaaaa gacagataaa cagggacaac 17761 ccgggtcagg gctgcgccgg cgggttgacg accgacttct cgacggccgc cggctccagc ggcccagtcc cgacgcggcc gcccaactgc tggctgaaga gctgccggcg gccgaggtcg <<.........................msc18...........................< p q a p p n v v s k e v a a p e l 17821 tgccacttct tgaggatctt cgcgtacgtg ccgtcctcga tgagctggtt caccgcctcc acggtgaaga actcctagaa gcgcatgcac ggcaggagct actcgaccaa gtggcggagg <.............................msc18.............................< q w k k l i k a y t g d e i l q n v a e 17881 ttcaggggtt cggcgagcgg ggagcccttc ttgacggcga gaccgatgtt cttgcgttcg aagtccccaa gccgctcgcc cctcgggaag aactgccgct ctggctacaa gaacgcaagc <.............................msc18.............................< k l p e a l p s g k k v a l g i n k r e 17941 atctcgttga ggtagcgcag gtccggctgc tgggtggccg cgtagcgcag cacgctggcc tagagcaact ccatcgcgtc caggccgacg acccaccggc gcatcgcgtc gtgcgaccgg <.............................msc18.............................< i e n l y r l d p q q t a a y r l v s a 18001 gtcgtcatca ggacgtccac ccggccctgg cgcagcgcga ggaagtgcgc ggccgcgtcc cagcagtagt cctgcaggtg ggccgggacc gcgtcgcgct ccttcacgcg ccggcgcagg <.............................msc18.............................< t t m l v d v r g q r l a l f h a a a d 18061 gggtaggtac tgatctcgat cggctccttg tcgtcggccg cgcattcctt gctcgccgcc cccatccatg actagagcta gccgaggaac agcagccggc gcgtaaggaa cgagcggcgg <.............................msc18.............................< p y t s i e i p e k d d a a c e k s a a 18121 tcaagatccg cctcgaacgt cgtgcccgta ccggtgccga cgcgcagtcc gcagagctga agttctaggc ggagcttgca gcacgggcat ggccacggct gcgcgtcagg cgtctcgact <.............................msc18.............................< e l d a e f t t g t g t g v r l g c l q 18181 ccgaggtcgt cgaccttctt cagcgcgctg ccgtcccgca cggcgaagcc ggtgccgtcg ggctccagca gctggaagaa gtcgcgcgac ggcagggcgt gccgcttcgg ccacggcagc <.............................msc18.............................< g l d d v k k l a s g d r v a f g t g d 334 Anhang 18241 gtgacgtaga ggacgaagtc gagcacctgc ttgcgttcct cggtcacggc gaggttcgcg cactgcatct cctgcttcag ctcgtggacg aacgcaagga gccagtgccg ctccaagcgc <.............................msc18.............................< t v y l v f d l v q k r e e t v a l n a 18301 gtgccgagtt cgtaccggcc ggcgctcagg ccggtgatga gggaggcgcc gctgacgtgc cacggctcaa gcatggccgg ccgcgagtcc ggccactact ccctccgcgg cgactgcacg <.............................msc18.............................< t g l e y r g a s l g t i l s a g s v h 18361 ttgcgctcca ccttgagtcc gaggacgcgg gccacggcct cggagacatc gatgtcgatg aacgcgaggt ggaactcagg ctcctgcgcc cggtgccgga gcctctgtag ctacagctac <.............................msc18.............................< k r e v k l g l v r a v a e s v d i d i 18421 ccgcgcggcg ggccgccgtc ctcggggctg aacgcgacgg ggggcacacc gatgccggaa ggcgcgccgc ccggcggcag gagccccgac ttgcgctgcc ccccgtgtgg ctacggcctt <.............................msc18.............................< g r p p g g d e p s f a v p p v g i g s 18481 ccgatgcgca gcacccccga ctcgcgcagc ttcgcgggca gggccgcgga gatggcggat ggctacgcgt cgtgggggct gagcgcgtcg aagcgcccgt cccggcgcct ctaccgccta <.............................msc18.............................< g i r l v g s e r l k a p l a a s i a s 18541 tcctcgtgga ccgcggagac gacgtcctcg cgccccaggt cggcggcccg ggtgtcctcg aggagcacct ggcgcctctg ctgcaggagc gcggggtcca gccgccgggc ccacaggagc <.............................msc18.............................< e e h v a s v v d e r g l d a a r t d e 18601 gggatctcct ccttgccgga gccacaggcc gcgaggagca gggtgaacag ggttgccgtg ccctagagga ggaacggcct cggtgtccgg cgctcctcgt cccacttgtc ccaacggcac <.............................msc18.............................< p i e e k g s g c a a l l l t f l t a t 18661 gtgagcgccc gagtggtgcg cgggcgacgt ccgcgcccgc ccgtggggcg cgcggccgga cactcgcggg ctcaccacgc gcccgctgca ggcgcgggcg ggcaccccgc gcgccggcct <.............................msc18.............................< t l a r t t r p r r g r g g t p r a a p 18721 gttcgggaca tggggtctcc tcgacggtac ggggctctgt tctgggacgg gtggggcacg caagccctgt accccagagg agctgccatg ccccgagaca agaccctgcc caccccgtgc <..msc18..<< t r s m 18781 gtgaggggcg gggaccgggc acggcctccc gtcgagcgcg ggcggcggcg cggcctccgc cactccccgc ccctggcccg tgccggaggg cagctcgcgc ccgccgccgc gccggaggcg 18841 gtcagccacg ggccaggaag cggaccaggc ggtcgttgtg cggggcgtcg aagacctcgt cagtcggtgc ccggtccttc gcctggtccg ccagcaacac gccccgcagc ttctggagca <<...........................msc19.............................< - g r a l f r v l r d n h p a d f v e 18901 ccggcgggcc cgtctcgacc accctgccgt tgtccatgaa gaggacctgg tcggcgatct ggccgcccgg gcagagctgg tgggacggca acaggtactt ctcctggacc agccgctaga <.............................msc19.............................< d p p g t e v v r g n d m f l v q d a i Anhang 335 18961 cccgggcgaa ccgcatctcg tgcgtgacga cgatcatcgt catcccgccg tcggcgagtt gggcccgctt ggcgtagagc acgcactgct gctagtagca gtagggcggc agccgctcaa <.............................msc19.............................< e r a f r m e h t v v i m t m g g d a l 19021 cccggatcac ggtcagcacc tcctgggtga gttcggggtc gagcgcgctg gtcggctcgt gggcctagtg ccagtcgtgg aggacccact caagccccag ctcgcgcgac cagccgagca <.............................msc19.............................< e r i v t l v e q t l e p d l a s t p e 19081 cgaagagcat cgccctcggt tccatggcga gggcccgggc gatcgcggcc cgctgctgct gcttctcgta gcgggagcca aggtaccgct cccgggcccg ctagcgccgg gcgacgacga <.............................msc19.............................< d f l m a r p e m a l a r a i a a r q q 19141 cgcccccgga gagctgatgc ggacgggagg tctccttccc cgcgaggccg accctggcga gcgggggcct ctcgactacg cctgccctcc agaggaaggg gcgctccggc tgggaccgct <.............................msc19.............................< e g g s l q h p r s t e k g a l g v r a 19201 gcaggtcgcg ggcccgttcc tcggccgggg cacgcctcag cccgagcagg gcacgcggtg cgtccagcgc ccgggcaagg agccggcccc gtgcggagtc gggctcgtcc cgtgcgccac <.............................msc19.............................< l l d r a r e e a p a r r l g l l a r p 19261 cctcggtgac attgccgagc accgtcatgt gcgggaagag ccggaagttc tggaagacca ggagccactg taacggctcg tggcagtaca cgcccttctc ggccttcaag accttctggt <.............................msc19.............................< a e t v n g l v t m h p f l r f n q f v 19321 tgccggtacg ggtccgctgc cgggcgatcg cgcggcgggg gcgctcgtag agccggtcgc acggccatgc ccaggcgacg gcccgctagc gcgccgcccc cgcgagcatc tcggccagcg <.............................msc19.............................< m g t r t r q r a i a r r p r e y l r d 19381 ctcgccactc gtggccgacg agttcgccgt cgacgacgat gcgtccggcg tcgatgcgct gagcggtgag caccggctgc tcaagcggca gctgctgcta cgcaggccgc agctacgcga <.............................msc19.............................< g r w e h g v l e g d v v i r g a d i r 19441 ccagccggtt gacgcaccgc agcagggtac tcttgcccga tcccgagggg ccgatgacac ggtcggccaa ctgcgtggcg tcgtcccatg agaacgggct agggctcccc ggctactgtg <.............................msc19.............................< e l r n v c r l l t s k g s g s p g i v 19501 aggtgacggt ggactcgggg acggtgagcg agacgtcgtc cagtacggtc agcccgccga tccactgcca cctgagcccc tgccactcgc tctgcagcag gtcatgccag tcgggcggct <.............................msc19.............................< c t v t s e p v t l s v d d l v t l g g 19561 acgacttgtg gacaccgact gcctcgatca tcctcggtcc cccgtcgcgt agcgccgttc tgctgaacac ctgtggctga cggagctagt aggagccagg gggcagcgca tcgcggcaag <.............msc19.............<< f s k h v g v a e i m <<.............msc20...............< g r d g t a y r r e 19621 gacgaagtgc tggacgacgc tgagcagcgt ggtcagcagc aggtaccaga gcgtggccac ctgcttcacg acctgctgcg actcgtcgca ccagtcgtcg tccatggtct cgcaccggtg <.............................msc20.............................< v f h q v v s l l t t l l l y w l t a v 336 Anhang 19681 cagaagcagc gggatgacca ggtagttgcg gttgtagatc agctgggtcg cgtagagcag gtcttcgtcg ccctactggt ccatcaacgc caacatctag tcgacccagc gcatctcgtc <.............................msc20.............................< l l l p i v l y n r n y i l q t a y l l 19741 gtcctgcacg gcgatgacgc tgacgatgga cgtgcctttc agcaggccga tgatctgact caggacgtgc cgctactgcg actgctacct gcacggaaag tcgtccggct actagactga <.............................msc20.............................< d q v a i v s v i s t g k l l g i i q s 19801 gccggcgggc ggcaggatcg cgggcatggc ctgcggcagc acgatgcggc ggaaggtccg cggccgcccg ccgtcctagc gcccgtaccg gacgccgtcg tgctacgccg ccttccaggc <.............................msc20.............................< g a p p l i a p m a q p l v i r r f t r 19861 ccagccgccg aggccgaggg cctccgcggc ctcggtctgg tcgcgtccga cggagaggat ggtcggcggc tccggctccc ggaggcgccg gagccagacc agcgcaggct gcctctccta <.............................msc20.............................< w g g l g l a e a a e t q d r g v s l i 19921 gcccgcccgg acgatctcgg cgagctgccc ggcttcgtgg aggaccagcc cgatgacggc cgggcgggcc tgctagagcc gctcgacggg ccgaagcacc tcctggtcgg gctactgccg <.............................msc20.............................< g a r v i e a l q g a e h l v l g i v a 19981 ggccgtgagg ccgctgatca tccgctcggt ggagaactcg gtgaacgcgg gcccgaacgg ccggcactcc ggcgactagt aggcgagcca cctcttgagc cacttgcgcc cgggcttgcc <.............................msc20.............................< a t l g s i m r e t s f e t f a p g f p 20041 gatgccgagg gacagctcgg ggtacagcag cgagatgttg taccagaaca gcagttgcac ctacggctcc ctgtcgagcc ccatgtcgtc gctctacaac atggtcttgt cgtcaacgtg <.............................msc20.............................< i g l s l e p y l l s i n y w f l l q v 20101 gagcatcgga acggaccgga acaaccaggt gtagccgaag ctcagcgtca cgaggatcgg ctcgtagcct tgcctggcct tgttggtcca catcggcttc gagtcgcagt gctcctagcc <.............................msc20.............................< l m p v s r f l w t y g f s l t v l i p 20161 gttgcgggac agccgcatca cggcgagcgc ggtgccgagg acgaagccgc cggtgaaggc caacgccctg tcggcgtagt gccgctcgcg ccacggctcc tgcttcggcg gccacttccg <.............................msc20.............................< n r s l r m v a l a t g l v f g g t f a 20221 gatcgccgtc agccacagcg tggtgccgag tccggcgagc accgtctccg cggagaggta ctagcggcag tcggtgtcgc accacggctc aggccgctcg tggcagaggc gcctctccat <.............................msc20.............................< i a t l w l t t g l g a l v t e a s l y 20281 cttggcgacg acgtcccagc ggaacgcgtc gttggtgatc agggcgttga gggccatcgc gaaccgctgc tgcagggtcg ccttgcgcag caaccactag tcccgcaact cccggtagcg <.............................msc20.............................< k a v v d w r f a d n t i l a n l a m a 20341 caacaggacc aggcccgccg ccgcggccac ccagcgaagc gggcgggggc gcggccgtgc gttgtcctgg tccgggcggc ggcgccggtg ggtcgcttcg cccgcccccg cgccggcacg <.............................msc20.............................< l l v l g a a a a v w r l p r p r p r a Anhang 337 20401 gaacgccgcg tccgccccgt ccgccgcctt ccggcccggc ccgccggttc cgtccgaacg cttgcggcgc aggcggggca ggcggcggaa ggccgggccg ggcggccaag gcaggcttgc <.............................msc20.............................< f a a d a g d a a k r g p g g t g d s r 20461 gagcctgcgg gcccgggacg tacggtcctc gccgccggtg ccgtcgcccg ggcccgtgcg ctcggacgcc cgggccctgc atgccaggag cggcggccac ggcagcgggc ccgggcacgc <.............................msc20.............................< l r r a r s t r d e g g t g d g p g t r 20521 gccgtgctcg gtgcgcaagg aaaccatcgg cggtccgtcc ctcagtcgtt cgctgcgtag cggcacgagc cacgcgttcc tttggtagcc gccaggcagg gagtcagcaa gcgacgcatc <...........msc20..........<< g h e t r l s v m <<.....msc21.......< - d n a a y 20581 tgcggcagaa ggtgctcggc gaacaggcgc atggtgcggg ccgattcctc gaacggcatg acgccgtctt ccacgagccg cttgtccgcg taccacgccc ggctaaggag cttgccgtac <.............................msc21.............................< h p l l h e a f l r m t r a s e e f p m 20641 gcgccggaga tgacctggag gctgatggtg aagtccccga accagccgcg gatgtcgtcg cgcggcctct actggacctc cgactaccac ttcaggggct tggtcggcgc ctacagcagc <.............................msc21.............................< a g s i v q l s i t f d g f w g r i d d 20701 atcgcggccc gcacttcgtc gggggtgccg accagcgcct tgcgttcggc gaccgcgcgg tagcgccggg cgtgaagcag cccccacggc tggtcgcgga acgcaagccg ctggcgcgcc <.............................msc21.............................< i a a r v e d p t g v l a k r e a v a r 20761 tcgaagtcgc cgcggcccgc cttctcgacg atcttctcgt atccggggta gtcggcgctg agcttcagcg gcgccgggcg gaagagctgc tagaagagca taggccccat cagccgcgac <.............................msc21.............................< d f d g r g a k e v i k e y g p y d a s 20821 cgggtctcgc gccacgcgga caccgcggac gcgagcgccc ggttggcccg ctcggaggcc gcccagagcg cggtgcgcct gtggcgcctg cgctcgcggg ccaaccgggc gagcctccgg <.............................msc21.............................< r t e r w a s v a s a l a r n a r e s a 20881 tgtccgccct tctgccgggc ttcctggccg tcctcggcga ggtagcagtt gtagctcatg acaggcggga agacggcccg aaggaccggc aggagccgct ccatcgtcaa catcgagtac <.............................msc21.............................< q g g k q r a e q g d e a l y c n y s m 20941 tggatgtcct cctcggtggg cttgaagccc gcggcggagg cggcgtcgcg gtacagggag acctacagga ggagccaccc gaacttcggg cgccgcctcc gccgcagcgc catgtccctc <.............................msc21.............................< h i d e e t p k f g a a s a a d r y l s 21001 agcgtcttct gcacctgttc gcgggggttg atggaaggga cgagcatgac gccgtgcccg tcgcagaaga cgtggacaag cgcccccaac taccttccct gctcgtactg cggcacgggc <.............................msc21.............................< l t k q v q e r p n i s p v l m v g h g 21061 gcgcgggccg ccgcctccgc ggacgcgggc gtcttcgcgg tggcgacgag gatgcgcgga cgcgcccggc ggcggaggcg cctgcgcccg cagaagcgcc accgctgctc ctacgcgcct <.............................msc21.............................< a r a a a e a s a p t k a t a v l i r p 338 Anhang 21121 tgcgggcgct gccaggtgcg cggaagcatg gtgaccgggc cgaagcggtg gaaggtgccc acgcccgcga cggtccacgc gccttcgtac cactggcccg gcttcgccac cttccacggg <.............................msc21.............................< h p r q w t r p l m t v p g f r h f t g 21181 tcccagacga cgtcctcctc cgcccagagc cggcggaccg cctcgacgcc ctcgtcgaag agggtctgct gcaggaggag gcgggtctcg gccgcctggc ggagctgcgg gagcagcttc <.............................msc21.............................< e w v v d e e a w l r r v a e v g e d f 21241 cgggcccggc tctcgtccat cgagatctcg aacgcggtga actcgtcggg cagaaacgcc gcccgggccg agagcaggta gctctagagc ttgcgccact tgagcagccc gtctttgcgg <.............................msc21.............................< r a r s e d m s i e f a t f e d p l f a 21301 cgtccgaagc cgacgtccag gcggccctgg gagatgttgt cgagcatggc gagcttgccg gcaggcttcg gctgcaggtc cgccgggacc ctctacaaca gctcgtaccg ctcgaacggc <.............................msc21.............................< r g f g v d l r g q s i n d l m a l k g 21361 gccagcttca gcgggtgcgt gaagacgggc agtacggcgc cggtgacgag gcgtacccgg cggtcgaagt cgcccacgca cttctgcccg tcatgccgcg gccactgctc cgcatgggcc <.............................msc21.............................< a l k l p h t f v p l v a g t v l r v r 21421 cgggtgcggg ccgcggcggc ggcgaggaag gtcaccgggt ccgggctgta gccgccgtac gcccacgccc ggcgccgccg ccgctccttc cagtggccca ggcccgacat cggcggcatg <.............................msc21.............................< r t r a a a a a l f t v p d p s y g g y 21481 tcgtggaagt agtgctcgac ggtcttgaca tggtggaagc ccagttcgtc ggcgagttcg agcaccttca tcacgagctg ccagaactgt accaccttcg ggtcaagcag ccgctcaagc <.............................msc21.............................< e h f y h e v t k v h h f g l e d a l e 21541 gccagccgaa gcgactcctc gaagtgctgt ccggcggatt tctccgcagg tcccacggtg cggtcggctt cgctgaggag cttcacgaca ggccgcctaa agaggcgtcc agggtgccac <.............................msc21.............................< a l r l s e e f h q g a s k e a p g v t 21601 gggaagaggt tgatgccgaa cttcatgggg tcctctcgat gtgatggctg gacggacggt cccttctcca actacggctt gaagtacccc aggagagcta cactaccgac ctgcctgcca <..........msc21..........<< p f l n i g f k m 21661 gtgtgcgtcg cggccggggg ccgcggctgc cggctagtcg gccgtcacgg tcccggacag cacacgcagc gccggccccc ggcgccgacg gccgatcagc cggcagtgcc agggcctgtc <<..........msc22...........< - d a t v t g s l 21721 ggccggtacg ggcagatgga tgtagtcgcg ttcgtggtag agcatcggcg cgcggccgtg ccggccatgc ccgtctacct acatcagcgc aagcaccatc tcgtagccgc gcgccggcac <.............................msc22.............................< a p v p l h i y d r e h y l m p a r g h 21781 cacgacggcg ccctcgatcc ggcccaggaa gacgctgtgg tcgccggccg gtacctcctg gtgctgccgc gggagctagg ccgggtcctt ctgcgacacc agcggccggc catggaggac <.............................msc22.............................< v v a g e i r g l f v s h d g a p v e q Anhang 339 21841 gtgcacgagg cactcggcga cggcgctgag gtggtgcgcg ggcaggagtg gggcctgcgc cacgtgctcc gtgagccgct gccgcgactc caccacgcgc ccgtcctcac cccggacgcg <.............................msc22.............................< h v l c e a v a s l h h a p l l p a q a 21901 ggcccgcccc gagggccgcc agtcgaggcc gtcgaacttc tgggtgctct tgccggcgaa ccgggcgggg ctcccggcgg tcagctccgg cagcttgaag acccacgaga acggccgctt <.............................msc22.............................< a r g s p r w d l g d f k q t s k g a f 21961 gcgctccgag agccgttcgt tgtgcacggc gaggaagttg accgcgaagc cgcccgagtg cgcgaggctc tcggcaagca acacgtgccg ctccttcaac tggcgcttcg gcgggctcac <.............................msc22.............................< r e s l r e n h v a l f n v a f g g s h 22021 ccggatggcg gcgagggtcc gcgacccggt gcccacacac acgagcagca acggcgggtc ggcctaccgc cgctcccagg cgctgggcca cgggtgtgtg tgctcgtcgt tgccgcccag <.............................msc22.............................< r i a a l t r s g t g v c v l l l p p d 22081 catcgacacg gaggtgacgg cgctggtcgt cagaccgctc ggccggccgt cggggcccgc gtagctgtgc ctccactgcc gcgaccagca gtctggcgag ccggccggca gccccgggcg <.............................msc22.............................< m s v s t v a s t t l g s p r g d p g a 22141 ggcggtgacg acacagaccg cggccgggtg cgcgctgaac atcgcgcgga acagttcgtc ccgccactgc tgtgtctggc gccggcccac gcgcgacttg tagcgcgcct tgtcaagcag <.............................msc22.............................< a t v v c v a a p h a s f m a r f l e d 22201 atcgatcgcc atgggtctgt agctcctccc ttgcccgctc aggctttcga agggcggtgg tagctagcgg tacccagaca tcgaggaggg aacgggcgag tccgaaagct tcccgccacc <...msc22..<< d i a m <<.......msc23.........< - a k s p r h 22261 agggcgggtc cataacctct ggagggggag ttccggcggt gctcgtccag caccttcgcc tcccgcccag gtattggaga cctccccctc aaggccgcca cgagcaggtc gtggaagcgg <.............................msc23.............................< l a p g y g r s p s n r r h e d l v k a 22321 agcagcgccg tcgcgttgcg gtgcaggggg aagtcggtgc cggggggcag gatgccgctc tcgtcgcggc agcgcaacgc cacgtccccc ttcagccacg gccccccgtc ctacggcgag <.............................msc23.............................< l l a t a n r h l p f d t g p p l i g s 22381 tcgtcgagca gccgggccac acgcgcggtg acgacgcaga accggtacgc cgcgaacagc agcagctcgt cggcccggtg tgcgcgccac tgctgcgtct tggccatgcg gcgcttgtcg <.............................msc23.............................< e d l l r a v r a t v v c f r y a a f l 22441 tcgtagtacg gaaggtcgcg cgcggtgcgc ccgacgccct cctcccagcg ggccacggtc agcatcatgc cttccagcgc gcgccacgcg ggctgcggga ggagggtcgc ccggtgccag <.............................msc23.............................< e y y p l d r a t r g v g e e w r a v t 22501 tcggcccggc cgggcagccc ggcgagccgg ggcacgccga cgccctcgct gaggtgccgg agccgggccg gcccgtcggg ccgctcggcc ccgtgcggct gcgggagcga ctccacggcc <.............................msc23.............................< e a r g p l g a l r p v g v g e s l h r 340 Anhang 22561 tccatgtgca ggtaccaggc aaggtcgctc tcggcgggcc ccaacgcggc catctcccag aggtacacgt ccatggtccg ttccagcgag agccgcccgg ggttgcgccg gtagagggtc <.............................msc23.............................< d m h l y w a l d s e a p g l a a m e w 22621 tcgagcagcg cggcgggccg cgtcccggcg tagatgatgt tgccgatccg ggcgtcgccc agctcgtcgc gccgcccggc gcagggccgc atctactaca acggctaggc ccgcagcggg <.............................msc23.............................< d l l a a p r t g a y i i n g i r a d g 22681 cagagcagcg acgccggtcc ctggtcgtcg ggcacgtggg cgcgcagccg gtcgagagcg gtctcgtcgc tgcggccagg gaccagcagc ccgtgcaccc gcgcgtcggc cagctctcgc <.............................msc23.............................< w l l s a p g q d d p v h a r l r d l a 22741 tcggccgcgg tcgtgttgtc gtcggcgacc ccgtagaagt ccaggtgatg cgtgaagtgc agccggcgcc agcacaacag cagccgctgg ggcatcttca ggtccactac gcacttcacg <.............................msc23.............................< d a a t t n d d a v g y f d l h h t f h 22801 cgcagcagtt gcgccggacc ggtggggccg aactcgggcc ggtcgaggaa gtcggccccc gcgtcgtcaa cgcggcctgg ccaccccggc ttgagcccgg ccagctcctt cagccggggg <.............................msc23.............................< r l l q a p g t p g f e p r d l f d a g 22861 gcctccttcg ggtcgaggcg gtggacggcg gcgagcgcgt ccactccccc gttccacacg cggaggaagc ccagctccgc cacctgccgc cgctcgcgca ggtgaggggg caaggtgtgc <.............................msc23.............................< a e k p d l r h v a a l a d v g g n w v 22921 gcggcccggt cggcgggcgg cagccgggtc agccagccct gccggtggta ggagggcaga cgccgggcca gccgcccgcc gtcggcccag tcggtcggga cggccaccat cctcccgtct <.............................msc23.............................< a a r d a p p l r t l w g q r h y s p l 22981 tcggcgggca cctggccgtc gacgcgttcc atgacgagga acggcgcgcc caggtactcg agccgcccgt ggaccggcag ctgcgcaagg tactgctcct tgccgcgcgg gtccatgagc <.............................msc23.............................< d a p v q g d v r e m v l f p a g l y e 23041 gcggagggct cgtcccacag caccggcggt acgggcaggc cggtgtcgcc gagcagcttc cgcctcccga gcagggtgtc gtggccgcca tgcccgtccg gccacagcgg ctcgtcgaag <.............................msc23.............................< a s p e d w l v p p v p l g t d g l l k 23101 agcagccgta cctggtcgcc ccagaagtcc tcgggaaaga cccggtgccc ggtcggggcg tcgtcggcat ggaccagcgg ggtcttcagg agccctttct gggccacggg ccagccccgc <.............................msc23.............................< l l r v q d g w f d e p f v r h g t p a 23161 acgcggaccg cgagcggccg ccgccgggag gtgccgccct cggtccactc ggcgtcgaac tgcgcctggc gctcgccggc ggcggccctc cacggcggga gccaggtgag ccgcagcttg <.............................msc23.............................< v r v a l p r r r s t g g e t w e a d f 23221 agcaggatct ctccggagaa tcccgcctcc ttcggcacgg tgacgggtcc gagctcgacc tcgtcctaga gaggcctctt agggcggagg aagccgtgcc actgcccagg ctcgagctgg <.............................msc23.............................< l l i e g s f g a e k p v t v p g l e v Anhang 341 23281 gcaccgatct cggcggaacg ggtgccgaac cagtgggtga ggacggcacg ggtcaggtcg cgtggctaga gccgccttgc ccacggcttg gtcacccact cctgccgtgc ccagtccagc <.............................msc23.............................< a g i e a s r t g f w h t l v a r t l d 23341 gggtcgcgtt gcagaggtac gggcacggga ggggtctcct tacggccggc gccggccggg cccagcgcaa cgtctccatg cccgtgccct ccccagagga atgccggccg cggccggccc <..........msc23..........<< p d r q l p v p v <<.......msc24........< - p r r r g p 23401 cacggacggt gggacgagcg gaaaggggac gacgacgctg ccgccgcgcc ggatcgcggc gtgcctgcca ccctgctcgc ctttcccctg ctgctgcgac ggcggcgcgg cctagcgccg <.............................msc24.............................< v s p p v l p f p v v v s g g r r i a a 23461 ctgcagccgc ccgatcacgg ggcccggcac gacgcccagg tcgcgggcga gccggctggt gacgtcggcg ggctagtgcc ccgggccgtg ctgcgggtcc agcgcccgct cggccgacca <.............................msc24.............................< q l r g i v p g p v v g l d r a l r s t 23521 gagccgggac gcgacatcga gcgcgtcacc ggcccggccg gtctggtgga gcgcggtcat ctcggccctg cgctgtagct cgcgcagtgg ccgggccggc cagaccacct cgcgccagta <.............................msc24.............................< l r s a v d l a d g a r g t q h l a t m 23581 gtaccgggcg tgcagggctt cgtgggtggg gtggctgcgg gtgaggacgg ccagttcggc catggcccgc acgtcccgaa gcacccaccc caccgacgcc cactcctgcc ggtcaagccg <.............................msc24.............................< y r a h l a e h t p h s r t l v a l e a 23641 gagcacgtca cgcgggcgtc cgagccggag ccgcacatcg agatacatct cgtggacctc ctcgtgcagt gcgcccgcag gctcggcctc ggcgtgtagc tctatgtaga gcacctggag <.............................msc24.............................< l v d r p r g l r l r v d l y m e h v e 23701 cagacggcgc cgctcccagt gggtgacggc ggaccggagc accggtccgg tccgcacatc gtctgccgcg gcgagggtca cccactgccg cctggcctcg tggccaggcc aggcgtgtag <.............................msc24.............................< l r r r e w h t v a s r l v p g t r v d 23761 ggcgaggacg ggccgactcc acagagcgag cgcgccgcgc agcagccgct ccacggtggc ccgctcctgc ccggctgagg tgtctcgctc gcgcggcgcg tcgtcggcga ggtgccaccg <.............................msc24.............................< a l v p r s w l a l a g r l l r e v t a 23821 gtcgtcgccg gcccggcccg cctgctcgac gagccgctcg aacctgagca ggtccagctc cagcagcggc cgggccgggc ggacgagctg ctcggcgagc ttggactcgt ccaggtcgag <.............................msc24.............................< d d g a r g a q e v l r e f r l l d l e 23881 ctcgggctcg acgaccatga gatagccctg tccggtcgtc ctgagccggt cacgggcggc gagcccgagc tgctggtact ctatcgggac aggccagcag gactcggcca gtgcccgccg <.............................msc24.............................< e p e v v m l y g q g t t r l r d r a a 23941 ctcacgggag ccgacggacg gcatgcgggc cagcagtcgg cgcaggtgca tcacatacgt gagtgccctc ggctgcctgc cgtacgcccg gtcgtcagcc gcgtccacgt agtgtatgca <.............................msc24.............................< e r s g v s p m r a l l r r l h m v y t 342 Anhang 24001 ctgcagggtg gtggccgcgc tgggcggcgg atgctcgccc cagatctcgc tcacacaggt gacgtcccac caccggcgcg acccgccgcc tacgagcggg gtctagagcg agtgtgtcca <.............................msc24.............................< q l t t a a s p p p h e g w i e s v c t 24061 gtgggcgggc atgacctcgc ccgcgtggag cagcaacagt ccgagcagct ggcgctgctt cacccgcccg tactggagcg ggcgcacctc gtcgttgtca ggctcgtcga ccgcgacgaa <.............................msc24.............................< h a p m v e g a h l l l l g l l q r q k 24121 gggcgcggtg ggcagatggc ggccatcgct gtcctcgacg gacagccccc cgagcacgcc cccgcgccac ccgtctaccg ccggtagcga caggagctgc ctgtcggggg gctcgtgcgg <.............................msc24.............................< p a t p l h r g d s d e v s l g g l v g 24181 gaattccatg gtggatcctc tcttcgcctg gggcggtggt tcaggtgcgg cttccgtggt cttaaggtac cacctaggag agaagcggac cccgccacca agtccacgcc gaaggcacca <.msc24<< f e m 24241 ccttccagcg gcgctccacc ggctgtcggc ccaatggacg ggcagggaac cgaggttgcg ggaaggtcgc cgcgaggtgg ccgacagccg ggttacctgc ccgtcccttg gctccaacgc 24301 cggaacaggt ggaggggtca tgccggggac tgtggtgacg gtggccgacg gggtgcacgc gccttgtcca cctccccagt acggcccctg acaccactgc caccggctgc cccacgtgcg >>..................msc25...................> m p g t v v t v a d g v h 24361 gtatgtacag gaaccggtcg gctggtgtgt gaacaacgcc gggatcgtcg tgggcggaga catacatgtc cttggccagc cgaccacaca cttgttgcgg ccctagcagc acccgcctct >.............................msc25.............................> a y v q e p v g w c v n n a g i v v g g 24421 cacggtcctc gtcgtggaca cggcggccac cgagaagcgg gcactcgcgc tgcgggaggc gtgccaggag cagcacctgt gccgccggtg gctcttcgcc cgtgagcgcg acgccctccg >.............................msc25.............................> d t v l v v d t a a t e k r a l a l r e 24481 tgtggacgcg ttggcgccgg gcccgcgccg gatcgtggtg agcacccacc accacggcga acacctgcgc aaccgcggcc cgggcgcggc ctagcaccac tcgtgggtgg tggtgccgct >.............................msc25.............................> a v d a l a p g p r r i v v s t h h h g 24541 ccacaccttc ggcaaccatg tgttctccgg cccccacacg ctgctggtca gccatgaggc ggtgtggaag ccgttggtac acaagaggcc gggggtgtgc gacgaccagt cggtactccg >.............................msc25.............................> d h t f g n h v f s g p h t l l v s h e 24601 gggtcctgcc gaactggtgc gcaagggcac ggcgttgcag tcgatgtggc cgggggtcga cccaggacgg cttgaccacg cgttcccgtg ccgcaacgtc agctacaccg gcccccagct >.............................msc25.............................> a g p a e l v r k g t a l q s m w p g v 24661 gtggggtcac accccgaccg tgctgccgac gctgaccgtg cgcgagggtg tcggcctgcg caccccagtg tggggctggc acgacggctg cgactggcac gcgctcccac agccggacgc >.............................msc25.............................> e w g h t p t v l p t l t v r e g v g l Anhang 343 24721 cctcggcggc atcaccgcgc agctgatcca tcccggtgtg gcgcacacct cggacgacct ggagccgccg tagtggcgcg tcgactaggt agggccacac cgcgtgtgga gcctgctgga >.............................msc25.............................> r l g g i t a q l i h p g v a h t s d d 24781 ggtggtgtgg ttgcccgagc ggcgggtgct gttcgcgggc gacctggtgt tctccggggc ccaccacacc aacgggctcg ccgcccacga caagcgcccg ctggaccaca agaggccccg >.............................msc25.............................> l v v w l p e r r v l f a g d l v f s g 24841 cgcgccgttc gtgctgatgg gttcgctggc cgggtccctc gcggcgctcg cgcggctgcg gcgcggcaag cacgactacc caagcgaccg gcccagggag cgccgcgagc gcgccgacgc >.............................msc25.............................> a a p f v l m g s l a g s l a a l a r l 24901 ggagctcgat cccctggtcg tcgtcgcggg gcacgggccc gtcggcgggc ccgagttgct cctcgagcta ggggaccagc agcagcgccc cgtgcccggg cagccgcccg ggctcaacga >.............................msc25.............................> r e l d p l v v v a g h g p v g g p e l 24961 cacgttcacc gaggactacc tgcgctgggt cgcgaagctc gccgagcggg gtctcgcgga gtgcaagtgg ctcctgatgg acgcgaccca gcgcttcgag cggctcgccc cagagcgcct >.............................msc25.............................> l t f t e d y l r w v a k l a e r g l a 25021 cgggctgagc cccctggaga cggcgacgcg cgccgacgag ggcgcgttcg ccaccctgct gcccgactcg ggggacctct gccgctgcgc gcggctgctc ccgcgcaagc ggtgggacga >.............................msc25.............................> d g l s p l e t a t r a d e g a f a t l 25081 ggaccgcgag cgactggtcg gcaacctcca ccgcgcctac cacgaggcgt gcggcggtgc cctggcgctc gctgaccagc cgttggaggt ggcgcggatg gtgctccgca cgccgccacg >.............................msc25.............................> l d r e r l v g n l h r a y h e a c g g 25141 gcccggcgcc cgtatcgagt cggcgccggc gatgcgcgag atggtcgcct tcaacggcgg cgggccgcgg gcatagctca gccgcggccg ctacgcgctc taccagcgga agttgccgcc >.............................msc25.............................> a p g a r i e s a p a m r e m v a f n g 25201 ccgtcccctg cgcagcccgg cctgacggac ggcagggctg cgggctccgc ggtacggagg ggcaggggac gcgtcgggcc ggactgcctg ccgtcccgac gcccgaggcg ccatgcctcc >..........msc25.........>> g r p l r s p a - 25261 cgtccatgcc ccgcagcgtt ccggcgcccg gtggagcggg actccaggtg cgctggacga gcaggtacgg ggcgtcgcaa ggccgcgggc cacctcgccc tgaggtccac gcgacctgct 25321 ctttcccggg cgtgcccccg cgtcggaggc tctccagttc tcctccgtcg aggcgcgagc gaaagggccc gcacgggggc gcagcctccg agaggtcaag aggaggcagc tccgcgctcg 25381 cgtgccgcgc acgctcggcg aagttgcgaa gccgatgctg tggaggagag atggatctgc gcacggcgcg tgcgagccgc ttcaacgctt cggctacgac acctcctctc tacctagacg >>msc26..> m d l 25441 gtggcaggac cgccgtcgtc accgggggga cccgggggct cggccgggac gtggcgctcg caccgtcctg gcggcagcag tggcccccct gggcccccga gccggccctg caccgcgagc >.............................msc26.............................> r g r t a v v t g g t r g l g r d v a l 344 Anhang 25501 cgctcaccgg tgcgggagcc accgtcgtgg tggccgcacg ggaggtcccg gacgaccccg gcgagtggcc acgccctcgg tggcagcacc accggcgtgc cctccagggc ctgctggggc >.............................msc26.............................> a l t g a g a t v v v a a r e v p d d p 25561 gtgacgggct gatcgccctg aaggcggacg tgaccgcccc cgactcgatg gcggcgctga cactgcccga ctagcgggac ttccgcctgc actggcgggg gctgagctac cgccgcgact >.............................msc26.............................> g d g l i a l k a d v t a p d s m a a l 25621 tggacacggt ccacgagcgg tacgggggtc cgcacatcgt ggtggcgaac gcgggtctga acctgtgcca ggtgctcgcc atgcccccag gcgtgtagca ccaccgcttg cgcccagact >.............................msc26.............................> m d t v h e r y g g p h i v v a n a g l 25681 gccgcccggg cccggtcgcc gcgctgtccg tgcagcactg gaacgaggtg gtcgacacga cggcgggccc gggccagcgg cgcgacaggc acgtcgtgac cttgctccac cagctgtgct >.............................msc26.............................> s r p g p v a a l s v q h w n e v v d t 25741 atctgcacgg cgtgttccac accgtgcggg cggcggtgcc gtatgtgcgt gagaccccgg tagacgtgcc gcacaaggtg tggcacgccc gccgccacgg catacacgca ctctggggcc >.............................msc26.............................> n l h g v f h t v r a a v p y v r e t p 25801 gcggccggat cgtcaccatg tcctccctcc tgggttcgcg cgccatgccg ggcgccgcgg cgccggccta gcagtggtac aggagggagg acccaagcgc gcggtacggc ccgcggcgcc >.............................msc26.............................> g g r i v t m s s l l g s r a m p g a a 25861 cgtactgcgc gtcgaaggct gcggtcgagg cgttcaccgc cgtcgccgcg ctggagctgg gcatgacgcg cagcttccga cgccagctcc gcaagtggcg gcagcggcgc gacctcgacc >.............................msc26.............................> a y c a s k a a v e a f t a v a a l e l 25921 ccgcggacgg ggtgaccgtg aactgcgtgg cgccgggcta catcgattcc ggcatgggca ggcgcctgcc ccactggcac ttgacgcacc gcggcccgat gtagctaagg ccgtacccgt >.............................msc26.............................> a a d g v t v n c v a p g y i d s g m g 25981 aggccctcat cggcaacgag acgctgtggc cgaagctcgc cccgtcgctc gcggccggac tccgggagta gccgttgctc tgcgacaccg gcttcgagcg gggcagcgag cgccggcctg >.............................msc26.............................> k a l i g n e t l w p k l a p s l a a g 26041 gtcccggtac gggcgacgag gtggcccggg cggtgctctt cctggcctcg ccggagagca cagggccatg cccgctgctc caccgggccc gccacgagaa ggaccggagc ggcctctcgt >.............................msc26.............................> r p g t g d e v a r a v l f l a s p e s 26101 gttacatcaa tggtcaggtg ctgcgtgtcg acggtggcgt gcgctgagcg cgtcccctcg caatgtagtt accagtccac gacgcacagc tgccaccgca cgcgactcgc gcaggggagc >......................msc26.....................>> s y i n g q v l r v d g g v r - 26161 ggcgatcgcg ggccggcgcg tggtgtacgt gccggcccgc ggtccgctcc ggctcagacc ccgctagcgc ccggccgcgc accacatgca cggccgggcg ccaggcgagg ccgagtctgg msc27 <<....< - v Anhang 345 26221 tgggcggccc ggccctgtcg caccggcagg ctcaggtgcg gttcgccctt gatgagcccg acccgccggg ccgggacagc gtggccgtcc gagtccacgc caagcgggaa ctactcgggc <.............................msc27.............................< q a a r g q r v p l s l h p e g k i l g 26281 gtgagcgcgt cgagccgacg gcggaactcc ggctccgcga gagccttgcg gaaggtgtcc cactcgcgca gctcggctgc cgccttgagg ccgaggcgct ctcggaacgc cttccacagg <.............................msc27.............................< t l a d l r r r f e p e a l a k r f t d 26341 tcgtcatccc actcggcgat gttgaagtac acggagtcgt ccttggtgga ccgtacgagg agcagtaggg tgagccgcta caacttcatg tgcctcagca ggaaccacct ggcatgctcc <.............................msc27.............................< e d d w e a i n f y v s d d k t s r v l 26401 gagtaacgga cgaggcccgg ctgggtctcc atgaaggctc cgacggcctc gtagcggctc ctcattgcct gctccgggcc gacccagagg tacttccgag gctgccggag catcgccgag <.............................msc27.............................< s y r v l g p q t e m f a g v a e y r s 26461 tcgaactcct cggcgtcgcc gatcagggtg agcttgttga cgaacacgac ggccatggtg agcttgagga gccgcagcgg ctagtcccac tcgaacaact gcttgtgctg ccggtaccac <...........................msc27..........................<< e f e e a d g i l t l k n v f v v a m 26521 gtctcctcgg gtggatgttc gtacgcgggt ggtcgtgcgt gctgggcggc gcgggtacgt cagaggagcc cacctacaag catgcgccca ccagcacgca cgacccgccg cgcccatgca 26581 ggggcggact tcggtcagcc cgcggtgccc gccgcgccgg cggcggcgag gaccgggtag ccccgcctga agccagtcgg gcgccacggg cggcgcggcc gccgccgctc ctggcccatc <<....................msc28......................< - g a t g a a g a a a l v p y 26641 tcggtgtagc cctgggcgcc gccctcgtag aagaaccgcg ggttccaggc gttgagcggg agccacatcg ggacccgcgg cgggagcatc ttcttggcgc ccaaggtccg caactcgccc <.............................msc28.............................< d t y g q a g g e y f f r p n w a n l p 26701 gcgcgggtgc gcaaccgctc gggcaggtcg gggttggcga ggaactggcg gccgaaggac cgcgcccacg cgttggcgag cccgtccagc cccaaccgct ccttgaccgc cggcttcctg <.............................msc28.............................< a r t r l r e p l d p n a l f q r g f s 26761 aggaggccgg cgccgtgggc gagggcttcg tcggcggcgg cgagtgtgcc gtcggtgtcg tcctccggcc gcggcacccg ctcccgaagc agccgccgcc gctcacacgg cagccacagc <.............................msc28.............................< l l g a g h a l a e d a a a l t g d t d 26821 agcggtccgg tgccgaggtt gacgacggcg gtacgtggcc accgtcggct cagctcgtgg tcgccaggcc acggctccaa ctgctgccgc catgcaccgg tggcagccga gtcgagcacc <.............................msc28.............................< l p g t g l n v v a t r p w r r s l e h 26881 acgagggccg gatcactgcc cgcgacgaag tggagatggc cgaggccgag tgcggcgagc tgctcccggc ctagtgacgg gcgctgcttc acctctaccg gctccggctc acgccgctcg <.............................msc28.............................< v l a p d s g a v f h l h g l g l a a l 346 Anhang 26941 gcatccacga gcaccggata cacctcggtc cggtccggct cggacatgtc gttgagcgcg cgtaggtgct cgtggcctat gtggagccag gccaggccga gcctgtacag caactcgcgc <.............................msc28.............................< a d v l v p y v e t r d p e s m d n l a 27001 aaccccgggg agagccggat gccggtgcgt tccgccccga tctccgcggc gacggcccgg ttggggcccc tctcggccta cggccacgca aggcggggct agaggcgccg ctgccgggcc <.............................msc28.............................< f g p s l r i g t r e a g i e a a v a r 27061 gcgacctcga cggggaaccg gatgcggccc tcggtgtcgc cgccgtactc gtcctcgcgc cgctggagct gccccttggc ctacgccggg agccacagcg gcggcatgag caggagcgcg <.............................msc28.............................< a v e v p f r i r g e t d g g y e d e r 27121 gtgttggtca ccggcgacag gaactggtgc agcagatagc cgttggcgcc gtggatctcg cacaaccagt ggccgctgtc cttgaccacg tcgtctatcg gcaaccgcgg cacctagagc <.............................msc28.............................< t n t v p s l f q h l l y g n a g h i e 27181 acgccgtcga agccgatgtc ggtggcggtg cgggcgcagc gcacgaagtc ctggatcgtg tgcggcagct tcggctacag ccaccgccac gcccgcgtcg cgtgcttcag gacctagcac <.............................msc28.............................< v g d f g i d t a t r a c r v f d q i t 27241 gcggcgatct cgtcccggtg caggggtcgc ggtgtcgggt gggccggctt gccggcaaag cgccgctaga gcagggccac gtccccagcg ccacagccca cccggccgaa cggccgtttc <.............................msc28.............................< a a i e d r h l p r p t p h a p k g a f 27301 acccgggcgg tcccctcggc ccggacggcg gacggcgcca cgggagtctc gccgtgcagg tgggcccgcc aggggagccg ggcctgccgc ctgccgcggt gccctcagag cggcacgtcc <.............................msc28.............................< v r a t g e a r v a s p a v p t e g h l 27361 tcggggtggc tgacccggcc cgcgtgcatg atctggaggt acatccgccc gcccgcctcg agccccaccg actgggccgg gcgcacgtac tagacctcca tgtaggcggg cgggcggagc <.............................msc28.............................< d p h s v r g a h m i q l y m r g g a e 27421 tgcacggcgt cgacgatccg ggcccaggcg cgggcctgtt cggcggtgtg cagccggacg acgtgccgca gctgctaggc ccgggtccgc gcccggacaa gccgccacac gtcggcctgc <.............................msc28.............................< h v a d v i r a w a r a q e a t h l r v 27481 ctgtgggcgt ggccgacggc cagggggctc ggatgggtgg cctcgctgat gatgagtccg gacacccgca ccggctgccg gtcccccgag cctacccacc ggagcgacta ctactcaggc <.............................msc28.............................< s h a h g v a l p s p h t a e s i i l g 27541 gcgctggcgc gctgcgcgta gtactcggcc atgaccggca gcggcgttcc gtcggctgtg cgcgaccgcg cgacgcgcat catgagccgg tactggccgt cgccgcaagg cagccgacac <.............................msc28.............................< a s a r q a y y e a m v p l p t g d a t 27601 gtccggccgc ggcccatcgg ggacatgacg atcctgttcg gcagggtgag gccaccgaac caggccggcg ccgggtagcc cctgtactgc taggacaagc cgtcccactc cggtggcttg <.............................msc28.............................< t r g r g m p s m v i r n p l t l g g f Anhang 347 27661 ggggtcgagc cgaacaggcc gctcatgccc cggccccggc gacggcttcg cgtccggtga ccccagctcg gcttgtccgg cgagtacggg gccggggccg ctgccgaagc gcaggccact <..........msc28..........<< p t s g f l g s m <<................msc29.................< - a g a g a v a e r g t 27721 tcgtctcggc gccgtcgtgg ctgatgtagc ggctgcggac ggaccatgtc ccggcacggc agcagagccg cggcagcacc gactacatcg ccgacgcctg cctggtacag ggccgtgccg <.............................msc29.............................< i t e a g d h s i y r s r v s w t g a r 27781 gctccaggac gtcctcggcg gtcgtgctca ggtacagccg gggttcgccg cccttcgggg cgaggtcctg caggagccgc cagcacgagt ccatgtcggc cccaagcggc gggaagcccc <.............................msc29.............................< r e l v d e a t t s l y l r p e g g k p 27841 tctcgaacac gacggcgtag taacgggtgc gcacgacgcc gggctcgacg ggctcggcgg agagcttgtg ctgccgcatc attgcccacg cgtgctgcgg cccgagctgc ccgagccgcc <.............................msc29.............................< t e f v v a y y r t r v v g p e v p e a 27901 cgatcatgcc gaaccagtgg cggcgggtca gaccgcgagc ggcgagcgcg tcgatgccct gctagtacgg cttggtcacc gccgcccagt ctggcgctcg ccgctcgcgc agctacggga <.............................msc29.............................< a i m g f w h r r t l g r a a l a d i g 27961 tgcgcatgcc ggcggcgatg tccgcgcggc cgcgcttgac gccgggtttg acgttctggg acgcgtacgg ccgccgctac aggcgcgccg gcgcgaactg cggcccaaac tgcaagaccc <.............................msc29.............................< k r m g a a i d a r g r k v g p k v n q 28021 cgaacgtgcc gtcctcggtg aactgctcgg cccattcctc cgcccggccg gcgtccagca gcttgcacgg caggagccac ttgacgagcc gggtaaggag gcgggccggc cgcaggtcgt <.............................msc29.............................< a f t g d e t f q e a w e e a r g a d l 28081 gttgcgcgtg tccggcgtag aaccgggtga tggccgcgta gtccaggtcg gacacggtgt caacgcgcac aggccgcatc ttggcccact accggcgcat caggtccagc ctgtgccaca <.............................msc29.............................< l q a h g a y f r t i a a y d l d s v t 28141 gggtgtccgg aggtgcggtc cgtgtcacgg tcttcctcct gtgcttcgtg ggcgcctgtc cccacaggcc tccacgccag gcacagtgcc agaaggagga cacgaagcac ccgcggacag <...........msc29...........<< h t d p p a t r t v 28201 gggcgccggg gtccgggcca ccttcgccgg ttccggtgga gcaggcgtgg agtccggctc cccgcggccc caggcccggt ggaagcggcc aaggccacct cgtccgcacc tcaggccgag 28261 cacgcgtacg ggccgggcgc gggggtcagc cggccgtgcg cagcggtacg ggtgtgctgt gtgcgcatgc ccggcccgcg cccccagtcg gccggcacgc gtcgccatgc ccacacgaca <<..............msc30................< g a t r l p v p t s 28321 ccggccccgg caggtacacg gactccctca ccggcacgga gttgagcaga tcggcgtgca ggccggggcc gtccatgtgc ctgagggagt ggccgtgcct caactcgtct agccgcacgt <.............................msc30.............................< d p g p l y v s e r v p v s n l l d a h 348 Anhang 28381 ggtcccggac ccgggccgag ggctccaggc cgagttcggt gctgaaggtg cggcggagcc ccagggcctg ggcccggctc ccgaggtccg gctcaagcca cgacttccac gccgcctcgg <.............................msc30.............................< l d r v r a s p e l g l e t s f t r r l 28441 cggcgaacac ctcaagggcg tcggcggtgc gcccggaccg ggagagggcg atcatcagct gccgcttgtg gagttcccgc agccgccacg cgggcctggc cctctcccgc tagtagtcga <.............................msc30.............................< g a f v e l a d a t r g s r s l a i m l 28501 gggcgtggag attctcgtac gtggggtact gacgggtgag cacacggagt tcgccgatga cccgcacctc taagagcatg caccccatga ctgcccactc gtgtgcctca agcggctact <.............................msc30.............................< q a h l n e y t p y q r t l v r l e g i 28561 gccggtggtg gcggccgatc ctcaggtcgg cgtcgatgcg ctgttcgagg gcgcccagcc cggccaccac cgccggctag gagtccagcc gcagctacgc gacaagctcc cgcgggtcgg <.............................msc30.............................< l r h h r g i r l d a d i r q e l a g l 28621 gtgtctcacg caatccactg agccgggtgc gcagcagcgg tccgcaggtc acgtcggcga cacagagtgc gttaggtgac tcggcccacg cgtcgtcgcc aggcgtccag tgcagccgct <.............................msc30.............................< r t e r l g s l r t r l l p g c t v d a 28681 gcgccttgcc cgaccacagt ccgagggccc ggtgcaggag ctccgactcg cgggtgtggt cgcggaacgg gctggtgtca ggctcccggg ccacgtcctc gaggctgagc gcccacacca <.............................msc30.............................< l a k g s w l g l a r h l l e s e r t h 28741 cgccgacgat gcgggcgagg gaggcctgct cgacgagctt ctcgaactgg tgcaggtcca gcggctgcta cgcccgctcc ctccggacga gctgctcgaa gagcttgacc acgtccaggt <.............................msc30.............................< d g v i r a l s a q e v l k e f q h l d 28801 gttgaccggc gccgacggcg aggaggtagc cgcggtcacg ggtctccagg tacatctccg caactggccg cggctgccgc tcctccatcg gcgccagtgc ccagaggtcc atgtagaggc <.............................msc30.............................< l q g a g v a l l y g r d r t e l y m e 28861 caggggtgcc ggtggcggtg gcggcgcttc tgagggtctt gcgtatctgc atcacgtacg gtccccacgg ccaccgccac cgccgcgaag actcccagaa cgcatagacg tagtgcatgc <.............................msc30.............................< a p t g t a t a a s r l t k r i q m v y 28921 tctggagtgt ggagtgggcg ctgtgcgggg gcgagtccgc ccacagttcg tccacgcatt agacctcaca cctcacccgc gacacgcccc cgctcaggcg ggtgtcaagc aggtgcgtaa <.............................msc30.............................< t q l t s h a s h p p s d a w l e d v c 28981 cgtccacggt gacgacctgc ccggcgtgca gcagcagcag actcaggagc tggcgctgct gcaggtgcca ctgctggacg ggccgcacgt cgtcgtcgtc tgagtcctcg accgcgacga <.............................msc30.............................< e d v t v v q g a h l l l l s l l q r q 29041 tcggggcccg cggggtgacg gtgcgcgggc cgtcggagag ggtgagcgtg ccgaggattc agccccgggc gccccactgc cacgcgcccg gcagcctctc ccactcgcac ggctcctaag <.............................msc30.............................< k p a r p t v t r p g d s l t l t g l i Anhang 349 29101 gtgcgtacat ctcgcctcca gggctggctt gatgggctac gggcaccatc gtggccgctg cacgcatgta gagcggaggt cccgaccgaa ctacccgatg cccgtggtag caccggcgac <.msc30.<< r a y m 29161 gatcttgcac ctcactttcg gcggcctttc agcccggcgg gatcctcctc gcacgcggcg ctagaacgtg gagtgaaagc cgccggaaag tcgggccgcc ctaggaggag cgtgcgccgc 29221 tcgcggggca gggccgtcat acggccgcaa cacggcgtcg acgaagccgc cctgaatgct agcgccccgt cccggcagta tgccggcgtt gtgccgcagc tgcttcggcg ggacttacga 29281 ctggggcgcc cttgcccgaa ggcgcccctg tcactgctcc cgccaccgtc atgcactgca gaccccgcgg gaacgggctt ccgcggggac agtgacgagg gcggtggcag tacgtgacgt <<..msc31...< - a s c 29341 ttccgggaac agtgcgtgga ggctgccgga cgcctcgggc aggaccgtgc cgctgtcgtc aaggcccttg tcacgcacct ccgacggcct gcggagcccg tcctggcacg gcgacagcag <.............................msc31.............................< e p f l a h l s g s a e p l v t g s d d 29401 cgcgcgcctt ccggcggact ccgggtgttc ccggccgggc gtgttgccgg tgcgtcggca gcgcgcggaa ggccgcctga ggcccacaag ggccggcccg cacaacggcc acgcagccgt <.............................msc31.............................< a r r g a s e p h e r g p t n g t r r c 29461 cagctcctcg gcctgggcgc gaaggaggag cagcccggat ccgtcggcga cggtgaccgc gtcgaggagc cggacccgcg cttcctcctc gtcgggccta ggcagccgct gccactggcg <.............................msc31.............................< l e e a q a r l l l l g s g d a v t v a 29521 gcgcgcgccg agctggtagg cctcggcagg ccggcccccc gccagttcga gccgtccgag cgcgcgcggc tcgaccatcc ggagccgtcc ggccgggggg cggtcaagct cggcaggctc <.............................msc31.............................< r a g l q y a e a p r g g a l e l r g l 29581 gccgatgagg gcgtgggcct ccgactgggg atgaccgatg cgttcggcga tggccagagt cggctactcc cgcacccgga ggctgacccc tactggctac gcaagccgct accggtctca <.............................msc31.............................< g i l a h a e s q p h g i r e a i a l t 29641 gcgggtgaac tcctcgcggg cgtcggcgga tctgccccgg atgaggtgca gcccgcccag cgcccacttg aggagcgccc gcagccgcct agacggggcc tactccacgt cgggcgggtc <.............................msc31.............................< r t f e e r a d a s r g r i l h l g g l 29701 ggtgttgcgg gcgttggcct ccagggcgac atagccgtgg tcgcgggcga tgacgacggc ccacaacgcc cgcaaccgga ggtcccgctg tatcggcacc agcgcccgct actgctgccg <.............................msc31.............................< t n r a n a e l a v y g h d r a i v v a 29761 gctctcggcg tgctggtacg cgaggtcgac atagctgttg caggcgtaga cctgggcgag cgagagccgc acgaccatgc gctccagctg tatcgacaac gtccgcatct ggacccgctc <.............................msc31.............................< s e a h q y a l d v y s n c a y v q a l 29821 cccgtaggag gcgagaacag tcgagtgagg ggcgttgaac tccttgctga gcgacagcgc gggcatcctc cgctcttgtc agctcactcc ccgcaacttg aggaacgact cgctgtcgcg <.............................msc31.............................< g y s a l v t s h p a n f e k s l s l a 350 Anhang 29881 gaggctgaga ttggccatgg ccgcgtccca ttcgcgcagg tcggcgtgga cggcaccgag ctccgactct aaccggtacc ggcgcagggt aagcgcgtcc agccgcacct gccgtggctc <.............................msc31.............................< l s l n a m a a d w e r l d a h v a g l 29941 ccgggccagc acctcggggc gggagcgctg gacaccgtcc tcgtcgagga tcgcggcggc ggcccggtcg tggagccccg ccctcgcgac ctgtggcagg agcagctcct agcgccgccg <.............................msc31.............................< r a l v e p r s r q v g d e d l i a a a 30001 gcggctgaaa tgggcctcgg ccacgtgcag ccgcccctgg ctgtgccggg ccatgcccag cgccgacttt acccggagcc ggtgcacgtc ggcggggacc gacacggccc ggtacgggtc <.............................msc31.............................< r s f h a e a v h l r g q s h r a m g l 30061 gtacatcagc ccgcgggcct cgacatgccg cagttccaga tgccggctga tctccaagcc catgtagtcg ggcgcccgga gctgtacggc gtcaaggtct acggccgact agaggttcgg <.............................msc31.............................< y m l g r a e v h r l e l h r s i e l g 30121 gcgttccagc agggtgacgg cgctgtcgat gtgcttggtg ggtcgctgaa gctggttcat cgcaaggtcg tcccactgcc gcgacagcta cacgaaccac ccagcgactt cgaccaagta <.............................msc31.............................< r e l l t v a s d i h k t p r q l q n m 30181 cgcgatggcg ttgacggtga cggcctcgaa gtcgcgcacg cccagtcgga tgaactcccg gcgctaccgc aactgccact gccggagctt cagcgcgtgc gggtcagcct acttgagggc <.............................msc31.............................< a i a n v t v a e f d r v g l r i f e r 30241 gtgggctagg cgcagttcgc gggccgcgtc cgggagccgg ttgagaccct gcagcgcgag cacccgatcc gcgtcaagcg cccggcgcag gccctcggcc aactctggga cgtcgcgctc <.............................msc31.............................< h a l r l e r a a d p l r n l g q l a l 30301 tccgacgctg agccgcatca ccgcagtggc ccgttggtcg ccgagcgagc gcgcggcgcg aggctgcgac tcggcgtagt ggcgtcaccg ggcaaccagc ggctcgctcg cgcgccgcgc <.............................msc31.............................< g v s l r m v a t a r q d g l s r a a r 30361 caacccggcc tgggcgatgg tgagccagtc ggtctggagc cggccgaggg tgaagtagcc gttgggccgg acccgctacc actcggtcag ccagacctcg gccggctccc acttcatcgg <.............................msc31.............................< l g a q a i t l w d t q l r g l t f y g 30421 gcggagcatg tccaccaggc ggacgcagac ctcgtccagg tgctcgtcgg cggcgcggac cgcctcgtac aggtggtccg cctgcgtctg gagcaggtcc acgagcagcc gccgcgcctg <.............................msc31.............................< r l m d v l r v c v e d l h e d a a r v 30481 gaccagggcc acgaggttgg actgctcgac gcgcagccac tcctgcgcgg cccggggttc ctggtcccgg tgctccaacc tgacgagctg cgcgtcggtg aggacgcgcc gggccccaag <.............................msc31.............................< v l a v l n s q e v r l w e q a a r p e 30541 gacctcgatg tccgggccgt gggggtcggg ccggaacacc cgcaggaagc ccgggtagca ctggagctac aggcccggca cccccagccc ggccttgtgg gcgtccttcg ggcccatcgt <.............................msc31.............................< v e i d p g h p d p r f v r l f g p y c Anhang 351 30601 ggaccgcacg gcctcgtcgg tgcggcgcag gtaccagcgg cacagccggt tcagggcctg cctggcgtgc cggagcagcc acgccgcgtc catggtcgcc gtgtcggcca agtcccggac <.............................msc31.............................< s r v a e d t r r l y w r c l r n l a q 30661 ccgccggtcg gcgggaccgt cctcctcgat gctgcgctcg gccgcgtaca gggcgatgag ggcggccagc cgccctggca ggaggagcta cgacgcgagc cggcgcatgt cccgctactc <.............................msc31.............................< r r d a p g d e e i s r e a a y l a i l 30721 gctgtggaag cggtaggtgt cctgggacga gacctcgatg agctgggccg cggcgagctt cgacaccttc gccatccaca ggaccctgct ctggagctac tcgacccggc gccgctcgaa <.............................msc31.............................< s h f r y t d q s s v e i l q a a a l k 30781 gtcgaggagc tggtcggcca cctggggctc gcagtcggcg agttgggcgg cggtaagggc cagctcctcg accagccggt ggaccccgag cgtcagccgc tcaacccgcc gccattcccg <.............................msc31.............................< d l l q d a v q p e c d a l q a a t l a 30841 ggtgaaggcc atgtcgccga cgacgccgag caatcggaag aaccgtcggg acagtgcggg ccacttccgg tacagcggct gctgcggctc gttagccttc ttggcagccc tgtcacgccc <.............................msc31.............................< t f a m d g v v g l l r f f r r s l a p 30901 caacgactcg taggcgacgc cgaacgcggc ccgtacggcg gtcgacgggc tgtcgccgag gttgctgagc atccgctgcg gcttgcgccg ggcatgccgc cagctgcccg acagcggctc <.............................msc31.............................< l s e y a v g f a a r v a t s p s d g l 30961 ggcgaggagt tccagcgggt cgccctcgcg cagcgcctcg gcgaaggact cgacggagcg ccgctcctca aggtcgccca gcgggagcgc gtcgcggagc cgcttcctga gctgcctcgc <.............................msc31.............................< a l l e l p d g e r l a e a f s e v s r 31021 ccagggccgt ccggccaggt gtccggcggc gatgcgcagg gcgagcggaa gccggccgca ggtcccggca ggccggtcca caggccgccg ctacgcgtcc cgctcgcctt cggccggcgt <.............................msc31.............................< w p r g a l h g a a i r l a l p l r g c 31081 cagttcgacg agttcggtga cggccgtggc gcacagggtc tccggggccc tgccgagaac gtcaagctgc tcaagccact gccggcaccg cgtgtcccag aggccccggg acggctcttg <.............................msc31.............................< l e v l e t v a t a c l t e p a r g l v 31141 ggcggtgagt acctgttcac cctccttctg cgacaacagg tcgagggtga agctgcgtgc ccgccactca tggacaagtg ggaggaagac gctgttgtcc agctcccact tcgacgcacg <.............................msc31.............................< a t l v q e g e k q s l l d l t f s r a 31201 gccgtagacg gcgacgaggt cgggccggta ttcgcggtgc agggcgagca cggcgcagct cggcatctgc cgctgctcca gcccggccat aagcgccacg tcccgctcgt gccgcgtcga <.............................msc31.............................< g y v a v l d p r y e r h l a l v a c s 31261 cggagaaccc ggcagcaggt cggggacctg ctcactgttg ttgacgtcgt cgatgacgat gcctcttggg ccgtcgtcca gcccctggac gagtgacaac aactgcagca gctactgcta <.............................msc31.............................< p s g p l l d p v q e s n n v d d i v i 352 Anhang 31321 gaggacgcgc cggtcggcga gcctgctgcg gagcacgccg gtgagctggt gccgttcggt ctcctgcgcg gccagccgct cggacgacgc ctcgtgcggc cactcgacca cggcaagcca <.............................msc31.............................< l v r r d a l r s r l v g t l q h r e t 31381 gggcagtacg gagacgtcgg cgccggaggc gtgcagcagc tcggcgatga tgtcgtgcac cccgtcatgc ctctgcagcc gcggcctccg cacgtcgtcg agccgctact acagcacgtg <.............................msc31.............................< p l v s v d a g s a h l l e a i i d h v 31441 gggccgggct ccgccgcagg cgtcgtggag gcggatgtac cactgcccgt cggggtaggc cccggcccga ggcggcgtcc gcagcacctc cgcctacatg gtgacgggca gccccatccg <.............................msc31.............................< p r a g g c a d h l r i y w q g d p y a 31501 cgggctgagc cggtgcgcgg cccgcaacgc gagcgcggtc ttgccgacgc cgggtgggcc gcccgactcg gccacgcgcc gggcgttgcg ctcgcgccag aacggctgcg gcccacccgg <.............................msc31.............................< p s l r h a a r l a l a t k g v g p p g 31561 gacgaggctg accagcggta cggccgcgcg ctggcgtggc gtgagcgcgg cgacgacttc ctgctccgac tggtcgccat gccggcgcgc gaccgcaccg cactcgcgcc gctgctgaag <.............................msc31.............................< v l s v l p v a a r q r p t l a a v v e 31621 ctccagcagt tcctcccggc cgacgaagtg ggttgcctct ggcgggagtt ggcgctgcac gaggtcgtca aggagggccg gctgcttcac ccaacggaga ccgccctcaa ccgcgacgtg <.............................msc31.............................< e l l e e r g v f h t a e p p l q r q v 31681 cacccagggc gcgctggggt tggtgggctg caccccggcg gtccggtgca cctcacggac gtgggtcccg cgcgacccca accacccgac gtggggccgc caggccacgt ggagtgcctg <.............................msc31.............................< v w p a s p n t p q v g a t r h v e r v 31741 cgcgtacgcg cggcggcccg aggggccggc ctggggggtg tggagttcac cggtctcggc gcgcatgcgc gccgccgggc tccccggccg gaccccccac acctcaagtg gccagagccg <.............................msc31.............................< a y a r r g s p g a q p t h l e g t e a 31801 gagcagttgc cggtgcagct cctggagttc ctgccccggg gggagtccga gttcacggtc ctcgtcaacg gccacgtcga ggacctcaag gacggggccc ccctcaggct caagtgccag <.............................msc31.............................< l l q r h l e q l e q g p p l g l e r d 31861 gagcatccgg tagtagtcgc ggtactcctc cagcgccgcg gcgacctgcc cggtgcggtg ctcgtaggcc atcatcagcg ccatgaggag gtcgcggcgc cgctggacgg gccacgccac <.............................msc31.............................< l m r y y d r y e e l a a a v q g t r h 31921 cagagcccgc atcaggtact cgcgaagccg ttcccgtacc gggtgttcgg ctgcgagtgc gtctcgggcg tagtccatga gcgcttcggc aagggcatgg cccacaagcc gacgctcacg <.............................msc31.............................< l a r m l y e r l r e r v p h e a a l a 31981 gcgcagctgc ggaatgatgt cggcgctgcc gccgaggtcg aggaggagcg cgaagcgccg cgcgtcgacg ccttactaca gccgcgacgg cggctccagc tcctcctcgc gcttcgcggc <.............................msc31.............................< r l q p i i d a s g g l d l l l a f r r Anhang 353 32041 ttcgacgagg gtgaggcgtt cctccgcgag ctgcggtacg gcctcggtct gcagcgaggc aagctgctcc cactccgcaa ggaggcgctc gacgccatgc cggagccaga cgtcgctccg <.............................msc31.............................< e v l t l r e e a l q p v a e t q l s a 32101 ggagggcacg gtctcgaagg gatccccgcg ccattcggcg agcgctcgtt ccagggcggc cctcccgtgc cagagcttcc ctaggggcgc ggtaagccgc tcgcgagcaa ggtcccgccg <.............................msc31.............................< s p v t e f p d g r w e a l a r e l a a 32161 cagttcccgg gcggtgtccc cccggccccg ggcgaggcgg gcctcgtcgg ccgccttccg gtcaagggcc cgccacaggg gggccggggc ccgctccgcc cggagcagcc ggcggaaggc <.............................msc31.............................< l e r a t d g r g r a l r a e d a a k r 32221 gtagcgggtg aggtcgaggg ccgccgaatc catcgcgagc cggtagccgc ccgggtgggt catcgcccac tccagctccc ggcggcttag gtagcgctcg gccatcggcg ggcccaccca <.............................msc31.............................< y r t l d l a a s d m a l r y g g p h t 32281 ctcgatgacc ggagggtcgc cgacgtccag tgattcgcgc agcagcgccc tcagccgggt gagctactgg cctcccagcg gctgcaggtc actaagcgcg tcgtcgcggg agtcggccca <.............................msc31.............................< e i v p p d g v d l s e r l l a r l r t 32341 ggtatggacg tgcagcgcgg cgcgggtgtc tcgtggcggc tggtcgtccc agagccttcg ccatacctgc acgtcgcgcc gcgcccacag agcaccgccg accagcaggg tctcggaagc <.............................msc31.............................< t h v h l a a r t d r p p q d d w l r r 32401 gatgagttcg tcggacgtga ccacccggtc ggcccgcagc agcagggacg cgagaagcac ctactcaagc agcctgcact ggtgggccag ccgggcgtcg tcgtccctgc gctcttcgtg <.............................msc31.............................< i l e d s t v v r d a r l l l s a l l v 32461 ccgctgcttg ggggacgaga cggtcagttc tcttccccct gtgaggaccg ccaggggtcc ggcgacgaac cccctgctct gccagtcaag agaaggggga cactcctggc ggtccccagg <.............................msc31.............................< r q k p s s v t l e r g g t l v a l p g 32521 gagtattcgg aagtcgtaga tcgaagcgtg ttccccattc acgtgcacac ctgccccgtc ctcataagcc ttcagcatct agcttcgcac aaggggtaag tgcacgtgtg gacggggcag <.............................msc31.............................< l i r f d y i s a h e g n v h v g a g d 32581 ggtccccctg cgcacggtca gccgtgccca gcgccacagt agaacgtgct tgcgcagggg ccagggggac gcgtgccagt cggcacgggt cgcggtgtca tcttgcacga acgcgtcccc <.............................msc31.............................< t g r r v t l r a w r w l l v h k r l p 32641 gccgccgcca tgtgatccag gccacattcg gcgagccggt gtgtcatatg gttccggaca cggcggcggt acactaggtc cggtgtaagc cgctcggcca cacagtatac caaggcctgt <...........msc31..........<< g g g h s g p w m 32701 ttcttcggca ggccgtccgc tccgcttcac gcggcactgt cgccgccgcc ctccccggtc aagaagccgt ccggcaggcg aggcgaagtg cgccgtgaca gcggcggcgg gaggggccag <<..............msc32...............< a a s d g g g e g t 354 Anhang 32761 agcccgaagc gccgcgcgag cagttcatag gaacgcatgc gatctcgggg ggcgtggatc tcgggcttcg cggcgcgctc gtcaagtatc cttgcgtacg ctagagcccc ccgcacctag <.............................msc32.............................< l g f r r a l l e y s r m r d r p a h i 32821 gtggagagca ccatgaactc gtcgatctcc agcgcctcgg tcatggacgt gagctccttg cacctctcgt ggtacttgag cagctagagg tcgcggagcc agtacctgca ctcgaggaac <.............................msc32.............................< t s l v m f e d i e l a e t m s t l e k 32881 tgcacatggt cggggtcgcc gaccacgcac ctcggccatt cggccacctc gtccgcgagc acgtgtacca gccccagcgg ctggtgcgtg gagccggtaa gccggtggag caggcgctcg <.............................msc32.............................< h v h d p d g v v c r p w e a v e d a l 32941 ggttccacct cgccgcgcag cccgtcgaga gcggcctccg gcgacggcag cggcagcagc ccaaggtgga gcggcgcgtc gggcagctct cgccggaggc cgctgccgtc gccgtcgtcg <.............................msc32.............................< p e v e g r l g d l a a e p s p l p l l 33001 agcccgcggc ccatgcgcag ccggaagagc cgctggctgg cgaagacccg ccgggcctcc tcgggcgccg ggtacgcgtc ggccttctcg gcgaccgacc gcttctgggc ggcccggagg <.............................msc32.............................< l g r g m r l r f l r q s a f v r r a e 33061 tcctccgtgg gcccgcagta caccccgata ccgatctgca cgcgcggccg cgagccgtcg aggaggcacc cgggcgtcat gtggggctat ggctagacgt gcgcgccggc gctcggcagc <.............................msc32.............................< e e t p g c y v g i g i q v r p r s g d 33121 tgactgtcga aggcgccgcg gtaggcctcg acgacggagc gggtgacctg gggccggccg actgacagct tccgcggcgc catccggagc tgctgcctcg cccactggac cccggccggc <.............................msc32.............................< h s d f a g r y a e v v s r t v q p r g 33181 aagtgggcta tggacaccgg cagccctagc cgggcggcca gttcggcgct ctgcgggctg ttcacccgat acctgtggcc gtcgggatcg gcccgccggt caagccgcga gacgcccgac <.............................msc32.............................< f h a i s v p l g l r a a l e a s q p s 33241 gccaccagga gccacacctc gggcgcgccc gcggtgggca tgagctggat gcggccatag cggtggtcct cggtgtggag cccgcgcggg cgccacccgt actcgaccta cgccggtatc <.............................msc32.............................< a v l l w v e p a g a t p m l q i r g y 33301 gggtgcccgt cggggaagcc gccgtgcagg aaggcgagga gttcggcgag ttttccggga cccacgggca gccccttcgg cggcacgtcc ttccgctcct caagccgctc aaaaggccct <.............................msc32.............................< p h g d p f g g h l f a l l e a l k g p 33361 aagtccccgt cgtccccgcc cccggaggta cccggggcga gcgcgtgcgc ctcgatgctc ttcaggggca gcaggggcgg gggcctccat gggccccgct cgcgcacgcg gagctacgag <.............................msc32.............................< f d g d d g g g s t g p a l a h a e i s 33421 ccggcgccga taccgcggcc gacaccgaga tcgatccggc cgggcgagag cgcgccgagc ggccgcggct atggcgccgg ctgtggctct agctaggccg gcccgctctc gcgcggctcg <.............................msc32.............................< g a g i g r g v g l d i r g p s l a g l Anhang 355 33481 acccggaaca cctcggcgac cttcagcggg ctgtagtgcg gcagcagcac cccgccggag tgggccttgt ggagccgctg gaagtcgccc gacatcacgc cgtcgtcgtg gggcggcctc <.............................msc32.............................< v r f v e a v k l p s y h p l l v g g s 33541 ccgacccgga tgcgacgggt ctcggcggcg accctggcgg ccatgatctc cggcgcgggg ggctgggcct acgctgccca gagccgccgc tgggaccgcc ggtactagag gccgcgcccc <.............................msc32.............................< g v r i r r t e a a v r a a m i e p a p 33601 cccgcgaagg agggcgtggc gtgatgctcg gcgaaccagt agcggtggta accgagccgg gggcgcttcc tcccgcaccg cactacgagc cgcttggtca tcgccaccat tggctcggcc <.............................msc32.............................< g a f s p t a h h e a f w y r h y g l r 33661 tccgcgagac gtgccaggtt cagggagttg tgcagggcgg tggccggggt gcttccctcc aggcgctctg cacggtccaa gtccctcaac acgtcccgcc accggcccca cgaagggagg <.............................msc32.............................< d a l r a l n l s n h l a t a p t s g e 33721 ggcacgacgg actggtccag gacggacagt ttcacgctgg tctccttcac ggacagggcc ccgtgctgcc tgaccaggtc ctgcctgtca aagtgcgacc agaggaagtg cctgtcccgg <...............msc32...............<< p v v s q d l v s l k v 33781 gaaaggaggg ggtgacgcgc ttaaggggtg gcggctccgg ccgcgctgtg ccggaagcgg ctttcctccc ccactgcgcg aattccccac cgccgaggcc ggcgcgacac ggccttcgcc <<.................msc33..................< - p t a a g a a s h r f r 33841 gagacgagcg atgcccaacg gtcgtcgaac gaggcgacat cgagcagtcc ggtcagctcc ctctgctcgc tacgggttgc cagcagcttg ctccgctgta gctcgtcagg ccagtcgagg <.............................msc33.............................< s v l s a w r d d f s a v d l l g t l e 33901 tcacggcagc gggcctcggc ccgctcaccg cgctcggcgc ccgcgggcgt cagcatgcag agtgccgtcg cccggagccg ggcgagtggc gcgagccgcg ggcgcccgca gtcgtacgtc <.............................msc33.............................< e r c r a e a r e g r e a g a p t l m c 33961 tagacgccgc ggcggtcgtg ctcgcaggag acgcgggtcg tgaggccctt gttctccagg atctgcggcg ccgccagcac gagcgtcctc tgcgcccagc actccgggaa caagaggtcc <.............................msc33.............................< y v g r r d h e c s v r t t l g k n e l 34021 cgggtgacga gccggctcat ggacgactgg tcgagcccga ccgcggtgga cagctcctgc gcccactgct cggccgagta cctgctgacc agctcgggct ggcgccacct gtcgaggacg <.............................msc33.............................< r t v l r s m s s q d l g v a t s l e q 34081 acccgggtgc cgcgttcgtg accgtgccgc agctcgatca gcaccatcag ctcgggcagg tgggcccacg gcgcaagcac tggcacggcg tcgagctagt cgtggtagtc gagcccgtcc <.............................msc33.............................< v r t g r e h g h r l e i l v m l e p l 34141 gagatctgat gctcgctcgc gagcgtcttc tccagcgact ggttgagctg accgaccatc ctctagacta cgagcgagcg ctcgcagaag aggtcgctga ccaactcgac tggctggtag <.............................msc33.............................< s i q h e s a l t k e l s q n l q g v m 356 Anhang 34201 agcgtcatcc gacgccacag gtcgaactca ccgggacgcc ctccacggtc atcggccgcc tcgcagtagg ctgcggtgtc cagcttgagt ggccctgcgg gaggtgccag tagccggcgg <.............................msc33.............................< l t m r r w l d f e g p r g g r d d a a 34261 atgtccgcct ccccttcgct cactccccct ccactataac caactccatg cataaaccat tacaggcgga ggggaagcga gtgaggggga ggtgatattg gttgaggtac gtatttggta << msc33 m 34321 gtctatgcat gcatttttca agcgctttcc ctcacagcct gccccattgg accggccatc cagatacgta cgtaaaaagt tcgcgaaagg gagtgtcgga cggggtaacc tggccggtag 34381 agcaaggcag acagagatct gtccgaaaat tagatgcagg cgcctgcatt tactcgtagg tcgttccgtc tgtctctaga caggctttta atctacgtcc gcggacgtaa atgagcatcc 34441 gtgagggacg cacagagcgc ggcgtcgttc cgcgcccgtc cccgactgca tcgaccccag cactccctgc gtgtctcgcg ccgcagcaag gcgcgggcag gggctgacgt agctggggtc 34501 gcggtacgca tgacacgcgg aactcccgaa tcgtccacgg cacccgatac gacacccgac cgccatgcgt actgtgcgcc ttgagggctt agcaggtgcc gtgggctatg ctgtgggctg >>.......................msc34.........................> m t r g t p e s s t a p d t t p d 34561 ccctcgcaga ccgctccagc ggcggcggag agcgccgccg aggtgaacga caaactcgac gggagcgtct ggcgaggtcg ccgccgcctc tcgcggcggc tccacttgct gtttgagctg >.............................msc34.............................> p s q t a p a a a e s a a e v n d k l d 34621 ccggccttca tgcgcatggc gggtgtcctg ctgctcgcgc tgctgatggc actgctcgac ggccggaagt acgcgtaccg cccacaggac gacgagcgcg acgactaccg tgacgagctg >.............................msc34.............................> p a f m r m a g v l l l a l l m a l l d 34681 gagacgatcg tcaacgtcgg cgtgaagacg ctcagcggcg agttcggctc gccgctcgcg ctctgctagc agttgcagcc gcacttctgc gagtcgccgc tcaagccgag cggcgagcgc >.............................msc34.............................> e t i v n v g v k t l s g e f g s p l a 34741 accgtccagt gggtgaccgc cggctatctg ctcgccgtcg ccgtcgccac accgttcgcg tggcaggtca cccactggcg gccgatagac gagcggcagc ggcagcggtg tggcaagcgc >.............................msc34.............................> t v q w v t a g y l l a v a v a t p f a 34801 ggctgggccg tcgaccgctt cggcggccgc acgatgtggc tcgccgccgt ctccctgttc ccgacccggc agctggcgaa gccgccggcg tgctacaccg agcggcggca gagggacaag >.............................msc34.............................> g w a v d r f g g r t m w l a a v s l f 34861 gtactcggct cggtactgtc gggcttcgcc tggtccatcg agtcgctgat cgcgttccgg catgagccga gccatgacag cccgaagcgg accaggtagc tcagcgacta gcgcaaggcc >.............................msc34.............................> v l g s v l s g f a w s i e s l i a f r 34921 gtgctccagg gcctcggtgg cggcatgatc gtccccgtcg tgcagagcgt cctcgccacg cacgaggtcc cggagccacc gccgtactag caggggcagc acgtctcgca ggagcggtgc >.............................msc34.............................> v l q g l g g g m i v p v v q s v l a t Anhang 357 34981 accgcgggcc ccgcgcgcgt cgccaaggcc atggcactga tctcgctgcc cctcaccctc tggcgcccgg ggcgcgcgca gcggttccgg taccgtgact agagcgacgg ggagtgggag >.............................msc34.............................> t a g p a r v a k a m a l i s l p l t l 35041 ggcccgatcc tcggccccgt cctcggcggt gtcctcgtgg acgccgtgag ctggcgctgg ccgggctagg agccggggca ggagccgcca caggagcacc tgcggcactc gaccgcgacc >.............................msc34.............................> g p i l g p v l g g v l v d a v s w r w 35101 atgttcctga tcaacctgcc catcggtctg gtcgccctgc tgctcgcact gcgcaccctg tacaaggact agttggacgg gtagccagac cagcgggacg acgagcgtga cgcgtgggac >.............................msc34.............................> m f l i n l p i g l v a l l l a l r t l 35161 cccgccgacc agcacgccgg ccgccccgag gagcgtctgg acgtcctcgg cctggcgctg gggcggctgg tcgtgcggcc ggcggggctc ctcgcagacc tgcaggagcc ggaccgcgac >.............................msc34.............................> p a d q h a g r p e e r l d v l g l a l 35221 ctctcccccg ggttcgcggc cttggtctac ggcttcacga cggccgcgca ctccggtgac gagagggggc ccaagcgccg gaaccagatg ccgaagtgct gccggcgcgt gaggccactg >.............................msc34.............................> l s p g f a a l v y g f t t a a h s g d 35281 gcgtcgtcac cgaaggtgct cgtcgccttc ggcgccggtg tgctcctgct cgtcggatac cgcagcagtg gcttccacga gcagcggaag ccgcggccac acgaggacga gcagcctatg >.............................msc34.............................> a s s p k v l v a f g a g v l l l v g y 35341 gcggtgcacg ccctgcgcac ctcggtcaca ccgctcatcg acctgcgcat gttcggcaag cgccacgtgc gggacgcgtg gagccagtgt ggcgagtagc tggacgcgta caagccgttc >.............................msc34.............................> a v h a l r t s v t p l i d l r m f g k 35401 cgcggcttca ccatggccgt cgtcacgatg ttcttcgtgg gcgccgtcgc caacgccctg gcgccgaagt ggtaccggca gcagtgctac aagaagcacc cgcggcagcg gttgcgggac >.............................msc34.............................> r g f t m a v v t m f f v g a v a n a l 35461 ctgctcctga ccccgctgta ctaccagcag tcccgcgggt tcggcgccct gcacgccggt gacgaggact ggggcgacat gatggtcgtc agggcgccca agccgcggga cgtgcggcca >.............................msc34.............................> l l l t p l y y q q s r g f g a l h a g 35521 ctgctgctga tcccctccgg catcctcggc gccgccggcg cgatcacctc cggcaagacg gacgacgact aggggaggcc gtaggagccg cggcggccgc gctagtggag gccgttctgc >.............................msc34.............................> l l l i p s g i l g a a g a i t s g k t 35581 gcgagcaagg tcaccgcgcg gctcacctcc acggtcggca tgctcgtcac cgcactcggc cgctcgttcc agtggcgcgc cgagtggagg tgccagccgt acgagcagtg gcgtgagccg >.............................msc34.............................> a s k v t a r l t s t v g m l v t a l g 35641 gcgctcgcct tctcccagat cggctcgggc acgaacaccg cgttgctctc cgtcgccttc cgcgagcgga agagggtcta gccgagcccg tgcttgtggc gcaacgagag gcagcggaag >.............................msc34.............................> a l a f s q i g s g t n t a l l s v a f 358 Anhang 35701 ggcctcaccg gctacggcat cgggctgacc gcgcccggca ccatggcctt catgtacagg ccggagtggc cgatgccgta gcccgactgg cgcgggccgt ggtaccggaa gtacatgtcc >.............................msc34.............................> g l t g y g i g l t a p g t m a f m y r 35761 gcggtcggcg aggccgccgc ggcgcgggcc accagcgcgc tgttcatctt caaccagatc cgccagccgc tccggcggcg ccgcgcccgg tggtcgcgcg acaagtagaa gttggtctag >.............................msc34.............................> a v g e a a a a r a t s a l f i f n q i 35821 ggcggcgcgc tcggcatcgc ggtcatcgcg atcaccctgc aggagcggct cggcacatcc ccgccgcgcg agccgtagcg ccagtagcgc tagtgggacg tcctcgccga gccgtgtagg >.............................msc34.............................> g g a l g i a v i a i t l q e r l g t s 35881 ggcgagcacc ccgcgggggc gtacggcggc tcgtactggg tcatcatcgc cttcagtctg ccgctcgtgg ggcgcccccg catgccgccg agcatgaccc agtagtagcg gaagtcagac >.............................msc34.............................> g e h p a g a y g g s y w v i i a f s l 35941 atcgctgccc tcgcggccct cgccctcccc ggctccttcc gcgcggaagc acccccggag tagcgacggg agcgccggga gcgggagggg ccgaggaagg cgcgccttcg tgggggcctc >.............................msc34.............................> i a a l a a l a l p g s f r a e a p p e 36001 cagcccacgg gggacaaggg cgccctcccg caatccaccc cggcctgacc gccgcgcccc gtcgggtgcc ccctgttccc gcgggagggc gttaggtggg gccggactgg cggcgcgggg >......................msc34......................>> q p t g d k g a l p q s t p a - 36061 cggcaccggc ccgcccctca tcgccccggg gggcgggccg acgtctttcc gtccgccggg gccgtggccg ggcggggagt agcggggccc cccgcccggc tgcagaaagg caggcggccc 36121 ccgacggcgg cacccggcat ccgctcggcc cgccccatgg ccgctggacc aggaatccag ggctgccgcc gtgggccgta ggcgagccgg gcggggtacc ggcgacctgg tccttaggtc 36181 cgctccctcc tatacctggg agaacccacc gcacccgtct gcccgcgagg aaaacgttga gcgagggagg atatggaccc tcttgggtgg cgtgggcaga cgggcgctcc ttttgcaact 36241 aggctctggt caccaccgcc gtggatccgc tcaccgtcga gctgcggtcc gtactcgacc tccgagacca gtggtggcgg cacctaggcg agtggcagct cgacgccagg catgagctgg >>.................msc35..................> v d p l t v e l r s v l d 36301 cccgcccccg tccggacgag gcactggtcg aggtccatgc gacggccctg aacagggccg gggcgggggc aggcctgctc cgtgaccagc tccaggtacg ctgccgggac ttgtcccggc >.............................msc35.............................> p r p r p d e a l v e v h a t a l n r a 36361 atctcctcct cgcggttcgc cgtccgatcg gttcctccct ggggctggac gtcgtcggca tagaggagga gcgccaagcg gcaggctagc caaggaggga ccccgacctg cagcagccgt >.............................msc35.............................> d l l l a v r r p i g s s l g l d v v g 36421 cggtcctgcg ccccgcgtcc gacggcagcg gcccacccgc gggcgcccgt gtgacgggcc gccaggacgc ggggcgcagg ctgccgtcgc cgggtgggcg cccgcgggca cactgcccgg >.............................msc35.............................> t v l r p a s d g s g p p a g a r v t g Anhang 359 36481 tggcggagaa cagcgcctgg gcggagctgg ccgcggtgcg caccgaccgc ctggcggtca accgcctctt gtcgcggacc cgcctcgacc ggcgccacgc gtggctggcg gaccgccagt >.............................msc35.............................> l a e n s a w a e l a a v r t d r l a v 36541 tcccggacgg cgtcaccgac accgacgcgg ccaccctccc cgtcgccggc ctcaccgccc agggcctgcc gcagtggctg tggctgcgcc ggtgggaggg gcagcggccg gagtggcggg >.............................msc35.............................> i p d g v t d t d a a t l p v a g l t a 36601 tctacgcact gaggaaggcc ggctggctcc tgggcaggcg caccctcgtc accggggcca agatgcgtga ctccttccgg ccgaccgagg acccgtccgc gtgggagcag tggccccggt >.............................msc35.............................> l y a l r k a g w l l g r r t l v t g a 36661 gcggcggcgt cggccgtgtg gccgtacaac tggcccgcgc gggcggcagc gaggtgatcg cgccgccgca gccggcacac cggcatgttg accgggcgcg cccgccgtcg ctccactagc >.............................msc35.............................> s g g v g r v a v q l a r a g g s e v i 36721 cctgggtcgg ttccccggcc cgcggcaagg ggctcgccga cttcggcgcc gacgtcgtcg ggacccagcc aaggggccgg gcgccgttcc ccgagcggct gaagccgcgg ctgcagcagc >.............................msc35.............................> a w v g s p a r g k g l a d f g a d v v 36781 ccggctacga cgagcctccc accacccccg tcgacatcct cgtcgacagt gtcggcggcg ggccgatgct gctcggaggg tggtgggggc agctgtagga gcagctgtca cagccgccgc >.............................msc35.............................> a g y d e p p t t p v d i l v d s v g g 36841 aggtgttcag caccggctac cggctcctgc gccgcggcgg cgtggcgacc gtcttcggca tccacaagtc gtggccgatg gccgaggacg cggcgccgcc gcaccgctgg cagaagccgt >.............................msc35.............................> e v f s t g y r l l r r g g v a t v f g 36901 acacggtccg cgccgagctg cgcctgcccg ccgactgggg ccacgcacgc ccgggcgtgc tgtgccaggc gcggctcgac gcggacgggc ggctgacccc ggtgcgtgcg ggcccgcacg >.............................msc35.............................> n t v r a e l r l p a d w g h a r p g v 36961 gcatcgagta cctgttcctg ctcgatgagg tcacccggcg cgacgtaccg gcggacctgt cgtagctcat ggacaaggac gagctactcc agtgggccgc gctgcatggc cgcctggaca >.............................msc35.............................> r i e y l f l l d e v t r r d v p a d l 37021 ctctcctgct cgcgctggtc gccgccggaa ggctggtggc ggagcccggc ctgctgatgc gagaggacga gcgcgaccag cggcggcctt ccgaccaccg cctcgggccg gacgactacg >.............................msc35.............................> s l l l a l v a a g r l v a e p g l l m 37081 cctggaccag cccgcagcgc gcgatcgacg ccctgtactc ccgcgagatc aacggcaagg ggacctggtc gggcgtcgcg cgctagctgc gggacatgag ggcgctctag ttgccgttcc >.............................msc35.............................> p w t s p q r a i d a l y s r e i n g k 37141 tcgtcctgtc catgtgaccc cgggcgcccg tagtgcgccg tacccgcgaa gcccacttcc agcaggacag gtacactggg gcccgcgggc atcacgcggc atgggcgctt cgggtgaagg >.....msc35.....>> v v l s m - 360 Anhang 37201 ctcaccgcac cgcgaggttc ccatgcgact gatcagctat gacgagcacg gctcccccga gagtggcgtg gcgctccaag ggtacgctga ctagtcgata ctgctcgtgc cgagggggct >>................msc36.................> m r l i s y d e h g s p 37261 cgtcctgcgc gtcgaggacg tccccgtgcc cacccccggc cccggtcagc tgttgctgcg gcaggacgcg cagctcctgc aggggcacgg gtgggggccg gggccagtcg acaacgacgc >.............................msc36.............................> d v l r v e d v p v p t p g p g q l l l 37321 caccgaggcc gtcggtgtca atttcatcga gacacaactg cgcggcggca ccgccccgtt gtggctccgg cagccacagt taaagtagct ctgtgttgac gcgccgccgt ggcggggcaa >.............................msc36.............................> r t e a v g v n f i e t q l r g g t a p 37381 cccctccccg ctgcccggcc gccccggtgg cgacgtggtg ggccgggtcg aggcgctcgg ggggaggggc gacgggccgg cggggccacc gctgcaccac ccggcccagc tccgcgagcc >.............................msc36.............................> f p s p l p g r p g g d v v g r v e a l 37441 tccggacacc gagggccccg cgcccggcac ccgggtcgtg gcgtacggcg tgcccgccgc aggcctgtgg ctcccggggc gcgggccgtg ggcccagcac cgcatgccgc acgggcggcg >.............................msc36.............................> g p d t e g p a p g t r v v a y g v p a 37501 gtacgcggac gaggtcgtcg tcgacgccga gcgcctcgtc gtcgtccccg cggacctcga catgcgcctg ctccagcagc agctgcggct cgcggagcag cagcaggggc gcctggagct >.............................msc36.............................> a y a d e v v v d a e r l v v v p a d l 37561 cgcggccacc gcgaccgcgc tcggttccac cgcgcagacc gcctggagcg tcctcgacgc gcgccggtgg cgctggcgcg agccaaggtg gcgcgtctgg cggacctcgc aggagctgcg >.............................msc36.............................> d a a t a t a l g s t a q t a w s v l d 37621 ggcccgggtc gtgaagggcg acacggtgct cgtgcacgcc gcggccggcg cgatcggcca ccgggcccag cacttcccgc tgtgccacga gcacgtgcgg cgccggccgc gctagccggt >.............................msc36.............................> a a r v v k g d t v l v h a a a g a i g 37681 tctcgtcacc cagctcgcga aggcgcgagg cgcgggccgg gtgatcggca cggtcggctc agagcagtgg gtcgagcgct tccgcgctcc gcgcccggcc cactagccgt gccagccgag >.............................msc36.............................> h l v t q l a k a r g a g r v i g t v g 37741 gcccgccaag gcggacttcg tccgcgcgca cggcgccgac gacgtcgtcg actaccggca cgggcggttc cgcctgaagc aggcgcgcgt gccgcggctg ctgcagcagc tgatggccgt >.............................msc36.............................> s p a k a d f v r a h g a d d v v d y r 37801 gcccgactgg gcggacaagg tccgccgact caccggcggg cagggcgtcg acgtggtcct cgggctgacc cgcctgttcc aggcggctga gtggccgccc gtcccgcagc tgcaccagga >.............................msc36.............................> q p d w a d k v r r l t g g q g v d v v 37861 cgacagcgtc gagggcgcgg tgttcaagga cgggctgaag ctgctcaggc cgtacgggag gctgtcgcag ctcccgcgcc acaagttcct gcccgacttc gacgagtccg gcatgccctc >.............................msc36.............................> l d s v e g a v f k d g l k l l r p y g Anhang 361 37921 actcgtctac tacggcttcg cgggcgccga cggcgaggtc gcgaaagtgg cgatgaccga tgagcagatg atgccgaagc gcccgcggct gccgctccag cgctttcacc gctactggct >.............................msc36.............................> r l v y y g f a g a d g e v a k v a m t 37981 actcctcggt ctcacgtacg tggtgggcac ctcgctcgac gcctgggcga aggcggaccc tgaggagcca gagtgcatgc accacccgtg gagcgagctg cggacccgct tccgcctggg >.............................msc36.............................> e l l g l t y v v g t s l d a w a k a d 38041 ggtccgggtg acggaggcac gcgcggagct cgtccggctg gtcacgtcgg gcggactgcg ccaggcccac tgcctccgtg cgcgcctcga gcaggccgac cagtgcagcc cgcctgacgc >.............................msc36.............................> p v r v t e a r a e l v r l v t s g g l 38101 ggtcgccgtg cacaccacgc tgccgctgac cgaggcggcc gaggcccacc gggtcatcga ccagcggcac gtgtggtgcg acggcgactg gctccgccgg ctccgggtgg cccagtagct >.............................msc36.............................> r v a v h t t l p l t e a a e a h r v i 38161 gagccgtacc cagctgggcc gtgtcgtcct cgtcccctga tccgcgggag cccgtcacca ctcggcatgg gtcgacccgg cacagcagga gcaggggact aggcgccctc gggcagtggt >..................msc36.................>> e s r t q l g r v v l v p - 38221 tgacccagag agcgcgacgg ccggatccgg ccgccccacc gacacccgta cccgcacccg actgggtctc tcgcgctgcc ggcctaggcc ggcggggtgg ctgtgggcat gggcgtgggc 38281 cacccgcgcc cgcgcccgcg cccgcgcccg acgaaaccgt gcccgtcctc gtcgccggag gtgggcgcgg gcgcgggcgc gggcgcgggc tgctttggca cgggcaggag cagcggcctc >>.......msc37.........> v p v l v a g 38341 ccggccccgg cggcctcagc acggccgtct tcctcggcct gcacggcgta cccgcgctgg ggccggggcc gccggagtcg tgccggcaga aggagccgga cgtgccgcat gggcgcgacc >.............................msc37.............................> a g p g g l s t a v f l g l h g v p a l 38401 tggtcgagcg ccacccgggc acctcgaccg cggtgaaggc caccggccag tacccgcaca accagctcgc ggtgggcccg tggagctggc gccacttccg gtggccggtc atgggcgtgt >.............................msc37.............................> v v e r h p g t s t a v k a t g q y p h 38461 cgatggaggc gctggccatc gccggcgccg ccgggaccgt gcgggagcgc ggtcgcgcgt gctacctccg cgaccggtag cggccgcggc ggccctggca cgccctcgcg ccagcgcgca >.............................msc37.............................> t m e a l a i a g a a g t v r e r g r a 38521 accgcagcga cttccacatg gtcgtcgcga agaccctcgc gggtccggtg ctgcgcacgc tggcgtcgct gaaggtgtac cagcagcgct tctgggagcg cccaggccac gacgcgtgcg >.............................msc37.............................> y r s d f h m v v a k t l a g p v l r t 38581 tgatgagcgg cgaccagctg agcatgcgcc atgtgtcccc ggaggactgg ggcaccgcga actactcgcc gctggtcgac tcgtacgcgg tacacagggg cctcctgacc ccgtggcgct >.............................msc37.............................> l m s g d q l s m r h v s p e d w g t a 362 Anhang 38641 gccagtccgc cgtggagagc gtgctcgccg accgggcggc ggaactcggc tcgcggctgc cggtcaggcg gcacctctcg cacgagcggc tggcccgccg ccttgagccg agcgccgacg >.............................msc37.............................> s q s a v e s v l a d r a a e l g s r l 38701 gcttctcgac ccggctgaca tcgctcaccc aggacgccga cggggtcacc gcggtcaccc cgaagagctg ggccgactgt agcgagtggg tcctgcggct gccccagtgg cgccagtggg >.............................msc37.............................> r f s t r l t s l t q d a d g v t a v t 38761 agcacaccgg gaccggcgag cgacgggtga tccgggcgcg gtacctggtg gtggcggacg tcgtgtggcc ctggccgctc gctgcccact aggcccgcgc catggaccac caccgcctgc >.............................msc37.............................> q h t g t g e r r v i r a r y l v v a d 38821 gctggcgcag cggcatccgc cagtccctcg gcatcgagat gcgcggccgt ggcacggtcg cgaccgcgtc gccgtaggcg gtcagggagc cgtagctcta cgcgccggca ccgtgccagc >.............................msc37.............................> g w r s g i r q s l g i e m r g r g t v 38881 ggaaggtgct gcgcgtcctg ttcgaggccg atctgagcga gcccctgtcg cacacggacg ccttccacga cgcgcaggac aagctccggc tagactcgct cggggacagc gtgtgcctgc >.............................msc37.............................> g k v l r v l f e a d l s e p l s h t d 38941 gcgcggcgga cggccgccgg ttcaccgcgc tgcatgtggg ccgcgcggtc ctgttcaaca cgcgccgcct gccggcggcc aagtggcgcg acgtacaccc ggcgcgccag gacaagttgt >.............................msc37.............................> g a a d g r r f t a l h v g r a v l f n 39001 ccgagatccc agggctgtac gggtacttcc gcaacctcac gcccgaactg ccggacggct ggctctaggg tcccgacatg cccatgaagg cgttggagtg cgggcttgac ggcctgccga >.............................msc37.............................> t e i p g l y g y f r n l t p e l p d g 39061 ggtggacgaa cgaggacacc gtcgccgcgc agatccgctc cgacctcggc atcccggaca ccacctgctt gctcctgtgg cagcggcgcg tctaggcgag gctggagccg tagggcctgt >.............................msc37.............................> w w t n e d t v a a q i r s d l g i p d 39121 tcccgctgaa gatcgaggag atcagcgaga cggagatctc ctgcggggtc gccgaacgct agggcgactt ctagctcctc tagtcgctct gcctctagag gacgccccag cggcttgcga >.............................msc37.............................> i p l k i e e i s e t e i s c g v a e r 39181 tccgcgaggg ccgtgcgctg ctcgtgggcg acgccgcgca cgtgatgccg ccgaccggcg aggcgctccc ggcacgcgac gagcacccgc tgcggcgcgt gcactacggc ggctggccgc >.............................msc37.............................> f r e g r a l l v g d a a h v m p p t g 39241 gtatgggcgg caacaccgcc tatctggacg ggctgtacct gggctggaag ctcgcggccg catacccgcc gttgtggcgg atagacctgc ccgacatgga cccgaccttc gagcgccggc >.............................msc37.............................> g m g g n t a y l d g l y l g w k l a a 39301 tgctgcgggg gacggcgggc gaggctctgc tcgacagtca cgacgccgaa cgccgtccgt acgacgcccc ctgccgcccg ctccgagacg agctgtcagt gctgcggctt gcggcaggca >.............................msc37.............................> v l r g t a g e a l l d s h d a e r r p Anhang 363 39361 acgccgagga gttggtggag cagcagttcg cgaacctggt ggaccgcatc tcgcccgaac tgcggctcct caaccacctc gtcgtcaagc gcttggacca cctggcgtag agcgggcttg >.............................msc37.............................> y a e e l v e q q f a n l v d r i s p e 39421 tcgcggacga gtcgctggcc gtggcgctgc cgccaccggt cgtcgcgttc ggctaccgct agcgcctgct cagcgaccgg caccgcgacg gcggtggcca gcagcgcaag ccgatggcga >.............................msc37.............................> l a d e s l a v a l p p p v v a f g y r 39481 ttcccaaggg ggccgtactc ctcgaacctg acgacgacgg cgaactgttc gaggacccgt aagggttccc ccggcatgag gagcttggac tgctgctgcc gcttgacaag ctcctgggca >.............................msc37.............................> f p k g a v l l e p d d d g e l f e d p 39541 cccggcccac cggccggccc ggctcccacg ccccgtacgt ccctctcacc cggagggacg gggccgggtg gccggccggg ccgagggtgc ggggcatgca gggagagtgg gcctccctgc >.............................msc37.............................> s r p t g r p g s h a p y v p l t r r d 39601 gctccgccac ctcgacgacc gccctcttcg gtcacgcgtt cgtgctgctc accggaccgg cgaggcggtg gagctgctgg cgggagaagc cagtgcgcaa gcacgacgag tggcctggcc >.............................msc37.............................> g s a t s t t a l f g h a f v l l t g p 39661 acggcgccgc gtgggccgag ggcgcactcg cctcggcgga cgcgctcggc gtcgccgtcc tgccgcggcg cacccggctc ccgcgtgagc ggagccgcct gcgcgagccg cagcggcagg >.............................msc37.............................> d g a a w a e g a l a s a d a l g v a v 39721 aggtgcaccg ggtcggtccc ggctccgaac tgctcgatgc ggaaggagcg ttctccaccg tccacgtggc ccagccaggg ccgaggcttg acgagctacg ccttcctcgc aagaggtggc >.............................msc37.............................> q v h r v g p g s e l l d a e g a f s t 39781 cgtacggcat cggtgccgac ggggccgcgc tggtgcggcc cgaccggttc gtggcgtggc gcatgccgta gccacggctg ccccggcgcg accacgccgg gctggccaag caccgcaccg >.............................msc37.............................> a y g i g a d g a a l v r p d r f v a w 39841 ggtgcaccgg gacgcatccg gacccggccg ccgagatcga acgcgccctg cggcacgtgc ccacgtggcc ctgcgtaggc ctgggccggc ggctctagct tgcgcgggac gccgtgcacg >.............................msc37.............................> r c t g t h p d p a a e i e r a l r h v 39901 tgcaccggcc cgcgcactga acagcccgca gggcatcccg cacctccccg aacgtcatgg acgtggccgg gcgcgtgact tgtcgggcgt cccgtagggc gtggaggggc ttgcagtacc >.......msc37......>> l h r p a h - 39961 cgaaaggatc cgcaatggca gtggcacaag cagccgctca gcaggagaac gcgaaggccg gctttcctag gcgttaccgt caccgtgttc gtcggcgagt cgtcctcttg cgcttccggc >>.................msc38..................> v a q a a a q q e n a k a 40021 gacagcggcg ggtggccctg gtcaccggga gcacgagcgg catcggcctc gccgtcgccg ctgtcgccgc ccaccgggac cagtggccct cgtgctcgcc gtagccggag cggcagcggc >.............................msc38.............................> g q r r v a l v t g s t s g i g l a v a 364 Anhang 40081 aactgctcgc cgagcggggg catgcggtgt tcctgtgcgg ccgggacggt gagacggtcg ttgacgagcg gctcgccccc gtacgccaca aggacacgcc ggccctgcca ctctgccagc >.............................msc38.............................> e l l a e r g h a v f l c g r d g e t v 40141 ccaccgtcgt ggacaagctg cgcggccgcg gcttcgaggc ggacggagtc gccgccgacg ggtggcagca cctgttcgac gcgccggcgc cgaagctccg cctgcctcag cggcggctgc >.............................msc38.............................> a t v v d k l r g r g f e a d g v a a d 40201 tcacgtcgaa gccggacgtc cagcgcctgg tccgctccgc ggtggaccgc ttcggacccc agtgcagctt cggcctgcag gtcgcggacc aggcgaggcg ccacctggcg aagcctgggg >.............................msc38.............................> v t s k p d v q r l v r s a v d r f g p 40261 tccacgtcct tgtcaacaac gcggggcgcg gcgggggcgg ggtgaccgcc gaactccccg aggtgcagga acagttgttg cgccccgcgc cgcccccgcc ccactggcgg cttgaggggc >.............................msc38.............................> l h v l v n n a g r g g g g v t a e l p 40321 acgagctgtg ggaggcggtc atcgagacca atctcaacag cgtcttccgc atcacccgcg tgctcgacac cctccgccag tagctctggt tagagttgtc gcagaaggcg tagtgggcgc >.............................msc38.............................> d e l w e a v i e t n l n s v f r i t r 40381 aggtgctgtc gcagggtggc atgctggcac gcggccacgg ccgcatcatc aacatcgcct tccacgacag cgtcccaccg tacgaccgtg cgccggtgcc ggcgtagtag ttgtagcgga >.............................msc38.............................> e v l s q g g m l a r g h g r i i n i a 40441 ccaccggcgg caagcagggc gtcgaactgg ccgccccgta ctccgcgtcg aagcacggcg ggtggccgcc gttcgtcccg cagcttgacc ggcggggcat gaggcgcagc ttcgtgccgc >.............................msc38.............................> s t g g k q g v e l a a p y s a s k h g 40501 tcatcggctt cacgaaggcg ctcggcaagg aactcgccca gtccggcatc accgtgaacg agtagccgaa gtgcttccgc gagccgttcc ttgagcgggt caggccgtag tggcacttgc >.............................msc38.............................> v i g f t k a l g k e l a q s g i t v n 40561 ccgtgtgccc cggctatgtg gagacgccga tggcggcccg ggtacgtcag ggctacgcgg ggcacacggg gccgatacac ctctgcggct accgccgggc ccatgcagtc ccgatgcgcc >.............................msc38.............................> a v c p g y v e t p m a a r v r q g y a 40621 cgcactgggg caccacggag gacgaggtgc tgacgaagtt ccaggcgaag atccctctcg gcgtgacccc gtggtgcctc ctgctccacg actgcttcaa ggtccgcttc tagggagagc >.............................msc38.............................> a h w g t t e d e v l t k f q a k i p l 40681 gccgttactc gaccccggag gaggtcgcgg gcctcgtcgg ctacctcgcc gacgacctcg cggcaatgag ctggggcctc ctccagcgcc cggagcagcc gatggagcgg ctgctggagc >.............................msc38.............................> g r y s t p e e v a g l v g y l a d d l 40741 ccgcctccat cacggctcag gccatgaacg tgtgcggtgg tctgggcaac tactgacggt ggcggaggta gtgccgagtc cggtacttgc acacgccacc agacccgttg atgactgcca >...........................msc38..........................>> a a s i t a q a m n v c g g l g n y - Anhang 365 40801 ggccggccca tgaggccccc agtccaggag cgcccgcccc cgacatcctg ggcgcggtct ccggccgggt actccggggg tcaggtcctc gcgggcgggg gctgtaggac ccgcgccaga >>.......................msc40.........................> m r p p v q e r p p p t s w a r s 40861 ccggatgccg gtgcgcgccc ccggcagaga cgagaatcca tgatcaggta ctacacggcg ggcctacggc cacgcgcggg ggccgtctct gctcttaggt actagtccat gatgtgccgc >.............................msc40.............................> p d a g a r p r q r r e s m i r y y t a 40921 gaccggctga tcaccggtga tcgcggcaga tgcatccggt acggcggagt gctcgtggac ctggccgact agtggccact agcgccgtct acgtaggcca tgccgcctca cgagcacctg >.............................msc40.............................> d r l i t g d r g r c i r y g g v l v d 40981 ggggagctga tccgctgggt ggggccctcc cacgaggtgc cgtggcggct gcgtcggcgg cccctcgact aggcgaccca ccccgggagg gtgctccacg gcaccgccga cgcagccgcc >.............................msc40.............................> g e l i r w v g p s h e v p w r l r r r 41041 agtgagcatg tggatctcgg tccgctcacg ctgctgcccg ggctcatcga cagccatgtc tcactcgtac acctagagcc aggcgagtgc gacgacgggc ccgagtagct gtcggtacag >.............................msc40.............................> s e h v d l g p l t l l p g l i d s h v 41101 catctggcac tggacggcgc gcccggcgcc atggaccgga tgcggtcggc ctcacccgcg gtagaccgtg acctgccgcg cgggccgcgg tacctggcct acgccagccg gagtgggcgc >.............................msc40.............................> h l a l d g a p g a m d r m r s a s p a 41161 gagctgtacg cgctgatgct gcgcaacgcg ggcgcgttgc tgtccgcggg cgtgaccacc ctcgacatgc gcgactacga cgcgttgcgc ccgcgcaacg acaggcgccc gcactggtgg >.............................msc40.............................> e l y a l m l r n a g a l l s a g v t t 41221 gcccgggacc tcggcgcacc cgggagtctc ggtgtacgcg tccgcgacgc cgtccgctcg cgggccctgg agccgcgtgg gccctcagag ccacatgcgc aggcgctgcg gcaggcgagc >.............................msc40.............................> a r d l g a p g s l g v r v r d a v r s 41281 ggcctcgctc ccgggccggc actggtcgtg tcgggagcgc cgctgaccgt accggacgga ccggagcgag ggcccggccg tgaccagcac agccctcgcg gcgactggca tggcctgcct >.............................msc40.............................> g l a p g p a l v v s g a p l t v p d g 41341 cactgctggt tcatgggcgg tgcccacgtc ggtgaacagg cgctgcggca ggcggtacgg gtgacgacca agtacccgcc acgggtgcag ccacttgtcc gcgacgccgt ccgccatgcc >.............................msc40.............................> h c w f m g g a h v g e q a l r q a v r 41401 gaacagaccg gagccggtgt cgacctcatc aaggtcatgg ccaccggcgg agcactcacg cttgtctggc ctcggccaca gctggagtag ttccagtacc ggtggccgcc tcgtgagtgc >.............................msc40.............................> e q t g a g v d l i k v m a t g g a l t 41461 cggggttcgg ccttgtccga ggggcagttc acggaccggg agctcgcggc cgtcgtcgac gccccaagcc ggaacaggct ccccgtcaag tgcctggccc tcgagcgccg gcagcagctg >.............................msc40.............................> r g s a l s e g q f t d r e l a a v v d 366 Anhang 41521 gaggcggcgc gggcgggtgt ccccgtcgcc gcgcacgcgc acggcacggc gggaatagcg ctccgccgcg cccgcccaca ggggcagcgg cgcgtgcgcg tgccgtgccg cccttatcgc >.............................msc40.............................> e a a r a g v p v a a h a h g t a g i a 41581 gcgtccttga gggccggggt gcacaccatc gaacactgca gcttcctcga cccgtccggc cgcaggaact cccggcccca cgtgtggtag cttgtgacgt cgaaggagct gggcaggccg >.............................msc40.............................> a s l r a g v h t i e h c s f l d p s g 41641 gcgatcgccc cggatcccgc cctcgtacgc cggctcgccg ccagcggtgt tcacgtgtgt cgctagcggg gcctagggcg ggagcatgcg gccgagcggc ggtcgccaca agtgcacaca >.............................msc40.............................> a i a p d p a l v r r l a a s g v h v c 41701 cccaccatca gcgagcgctt caccgaacgc tgggaccggc tcgcccccgg cccgctgccc gggtggtagt cgctcgcgaa gtggcttgcg accctggccg agcgggggcc gggcgacggg >.............................msc40.............................> p t i s e r f t e r w d r l a p g p l p 41761 gccctgccga cgctgtaccg gcagggcgtc cccatcgtcg cgggcaccga cgcgggcacc cgggacggct gcgacatggc cgtcccgcag gggtagcagc gcccgtggct gcgcccgtgg >.............................msc40.............................> a l p t l y r q g v p i v a g t d a g t 41821 gacggcgcac cgcaccacgc ctacgtccag ggcctgatag ggatggcccg gctcggtctg ctgccgcgtg gcgtggtgcg gatgcaggtc ccggactatc cctaccgggc cgagccagac >.............................msc40.............................> d g a p h h a y v q g l i g m a r l g l 41881 ccgcccgcgg agatactgga ggccgccacg tcccgtgcgg cccgcgccct gcgggtcgag ggcgggcgcc tctatgacct ccggcggtgc agggcacgcc gggcgcggga cgcccagctc >.............................msc40.............................> p p a e i l e a a t s r a a r a l r v e 41941 accctgaccg gcaggatcgc actcggcctg cgggccgacc tcatcgcggt cgagggcgac tgggactggc cgtcctagcg tgagccggac gcccggctgg agtagcgcca gctcccgctg >.............................msc40.............................> t l t g r i a l g l r a d l i a v e g d 42001 ccgctgcacg acgtgtcggc cctacgggac cttcgcctcg tcgtcgccag ggggcaggcc ggcgacgtgc tgcacagccg ggatgccctg gaagcggagc agcagcggtc ccccgtccgg >.............................msc40.............................> p l h d v s a l r d l r l v v a r g q a 42061 atccgctcac cgtcccggcc accctgcccc gacgagtcgg tgcagtgagc gagggcggcc taggcgagtg gcagggccgg tgggacgggg ctgctcagcc acgtcactcg ctcccgccgg >......................msc40......................>> i r s p s r p p c p d e s v q - 42121 ctcgaacatc gtgagaggcc cgagccgtgc cgtgccgtac ccgagcctgg agccgctctc gagcttgtag cactctccgg gctcggcacg gcacggcatg ggctcggacc tcggcgagag 42181 cggcgcctct ccaccgccac cggcgacgct tcccccatgc atggtgaacc cgaacgactc gccgcggaga ggtggcggtg gccgctgcga agggggtacg taccacttgg gcttgctgag 42241 acgccccgga catcaccggc cccttcccgg gagcacctcg ccctccggct ggcctgcgcc tgcggggcct gtagtggccg gggaagggcc ctcgtggagc gggaggccga ccggacgcgg 42301 ctgttcgccc aggacgccgc gtcggccgcc gcccgcctca tggggctgcc cccggatccc gacaagcggg tcctgcggcg cagccggcgg cgggcggagt accccgacgg gggcctaggg Anhang 367 42361 gggccgtccc cgtccccgcc ccatgactcc tcgccgtacg cccgtgcgct cggcatcgga cccggcaggg gcaggggcgg ggtactgagg agcggcatgc gggcacgcga gccgtagcct 42421 gcgcgacgag tcgcctcccg cggttgaccc gcgctccggg acgggagtcc tgaggagcgt cgcgctgctc agcggagggc gccaactggg cgcgaggccc tgccctcagg actcctcgca 42481 caaacgggcg tcaccacctg ccgaagcggc agccgaccga actggagctc gtcagcgagg gtttgcccgc agtggtggac ggcttcgccg tcggctggct tgacctcgag cagtcgctcc 42541 accccggccg tagcggcgtg cctcggggcc gtaaggggct ccgttgagcg cggccggccg tggggccggc atcgccgcac ggagccccgg cattccccga ggcaactcgc gccggccggc 42601 cgaacgtgac gtcatacgtg agcattccgt ccgccgggtg cccgtggtcg acgaaggccg gcttgcactg cagtatgcac tcgtaaggca ggcggcccac gggcaccagc tgcttccggc 42661 gcaccccgtg ggcatcgtct ccatcggtga cctggccatg gagcgtgact cggagtccgc cgtggggcac ccgtagcaga ggtagccact ggaccggtac ctcgcactga gcctcaggcg 42721 tctcggcgac atcagcgtcg cgcggcccaa ccggtgacgc tcagggcccg caagctccga agagccgctg tagtcgcagc gcgccgggtt ggccactgcg agtcccgggc gttcgaggct 42781 cgagccggga cggatctccc ggtcggggac ggcgccgggc gccgtcgggc aggtggctgc gctcggccct gcctagaggg ccagcccctg ccgcggcccg cggcagcccg tccaccgacg 42841 cggctggcgg gcccaagcgc agcatgcccc cgtcgaccgc tcaggaggcg cccgtgactc gccgaccgcc cgggttcgcg tcgtacgggg gcagctggcg agtcctccgc gggcactgag 42901 aaggaggcgt cggcccccgc gaggaacgcg atgacagccg cgacctggcg ggcgtccccg ttcctccgca gccgggggcg ctccttgcgc tactgtcggc gctggaccgc ccgcaggggc 42961 ggccgtccca ctggtgtgcc gggacgccgc tcggtgtcgg cgtcgccgtc cccctggccc ccggcagggt gaccacacgg ccctgcggcg agccacagcc gcagcggcag ggggaccggg 43021 gtcatcggcg gggtgatctc cccgggggcg acggcgctga cggtgatccc gtgttcggcc cagtagccgc cccactagag gggcccccgc tgccgcgact gccactaggg cacaagccgg 43081 ggtcgagccc catgactggg tgaccagccc gaggccgccc ctggccgcgc agtacggcgc ccagctcggg gtactgaccc actggtcggg ctccggcggg gaccggcgcg tcatgccgcg 43141 cgcgcccacg cgcggctggt gttcgtggac gctcgtgaac gatccggcca ccgtcaccct gcgcgggtgc gcgccgacca caagcacctg cgagcacttg ctaggccggt ggcagtggga 43201 gagcgatcat gcggcgggcg gcacgccggg acctggtctg tagggtggat cgggagaggc ctcgctagta cgccgcccgc cgtgcggccc tggaccagac atcccaccta gccctctccg 43261 cctgccgcgt cggctgatgt gccggcgatg agatggtggc cgcccgcgct ggagatgttc ggacggcgca gccgactaca cggccgctac tctaccaccg gcgggcgcga cctctacaag 43321 cttcggagac tgggctccgt cgccccggtg atcatggcac ctaacacggg gccgacggcc gaagcctctg acccgaggca gcggggccac tagtaccgtg gattgtgccc cggctgccgg 43381 tcacgaagga ttaccggtga gttccgacga cacgcacgac agtgcttccg tcatgcagtg agtgcttcct aatggccact caaggctgct gtgcgtgctg tcacgaaggc agtacgtcac >>...................msc39.....................> v s s d d t h d s a s v m q 43441 gctgctggag accgagtcac tggagggctt cctgcagtct ctggccgacg cggctctgga cgacgacctc tggctcagtg acctcccgaa ggacgtcaga gaccggctgc gccgagacct >.............................msc39.............................> w l l e t e s l e g f l q s l a d a a l 368 Anhang 43501 actgacccgc gccgagggcg ccggggtcac gatcgaacgc gatcaccggc ctctgaccgt tgactgggcg cggctcccgc ggccccagtg ctagcttgcg ctagtggccg gagactggca >.............................msc39.............................> e l t r a e g a g v t i e r d h r p l t 43561 ggccagcgcg ggtccgccgg cgctgaagct ggacgagaaa cagtacggcc aggacgacgg ccggtcgcgc ccaggcggcc gcgacttcga cctgctcttt gtcatgccgg tcctgctgcc >.............................msc39.............................> v a s a g p p a l k l d e k q y g q d d 43621 cccgtgcctt cggtccgccc gcaccggcga agaggtcgtc gtcgaggaca tgctcaggga gggcacggaa gccaggcggg cgtggccgct tctccagcag cagctcctgt acgagtccct >.............................msc39.............................> g p c l r s a r t g e e v v v e d m l r 43681 gacccgctgg ggcaattacc cggcctacgc cgcggcctgc gggatccgct cctcgttctc ctgggcgacc ccgttaatgg gccggatgcg gcgccggacg ccctaggcga ggagcaagag >.............................msc39.............................> e t r w g n y p a y a a a c g i r s s f 43741 cctgccgatc tccgcccgca cccacaccac cggcgccctg aacctctacg cgggcccgcc ggacggctag aggcgggcgt gggtgtggtg gccgcgggac ttggagatgc gcccgggcgg >.............................msc39.............................> s l p i s a r t h t t g a l n l y a g p 43801 ccacgccttc aaggacgccg atctcagcgc gctgcgctca ctggccgcgc aggccaccgg ggtgcggaag ttcctgcggc tagagtcgcg cgacgcgagt gaccggcgcg tccggtggcc >.............................msc39.............................> p h a f k d a d l s a l r s l a a q a t 43861 cgccatcgct ctggctcagc gcatcgccga cgcgcaggag ttcgccgagc agatgcagac gcggtagcga gaccgagtcg cgtagcggct gcgcgtcctc aagcggctcg tctacgtctg >.............................msc39.............................> g a i a l a q r i a d a q e f a e q m q 43921 ggcgatgcac tcccgtggcg tcattgacca ggccctcggg gtgatcatgg gccaacggcg ccgctacgtg agggcaccgc agtaactggt ccgggagccc cactagtacc cggttgccgc >.............................msc39.............................> t a m h s r g v i d q a l g v i m g q r 43981 ctgcaccgcc gacgaggcct tcgacatcct gcgctccgct tcccagcacc gcaacatcaa gacgtggcgg ctgctccgga agctgtagga cgcgaggcga agggtcgtgg cgttgtagtt >.............................msc39.............................> r c t a d e a f d i l r s a s q h r n i 44041 actccgcgac ctgtgcgccg aactgatcac caacctcacc gggcaacccc ccgccggccc tgaggcgctg gacacgcggc ttgactagtg gttggagtgg cccgttgggg ggcggccggg >.............................msc39.............................> k l r d l c a e l i t n l t g q p p a g 44101 tgacctgcgc ccccggccgt gaactccccg tatgacaccg cctcgatcac ccttcccgcc actggacgcg ggggccggca cttgaggggc atactgtggc ggagctagtg ggaagggcgg >........msc39........>> p d l r p r p - 44161 accgtgccga acgccccggc acctaccggc cgagccgggg agtaccggcc actgaacgca tggcacggct tgcggggccg tggatggccg gctcggcccc tcatggccgg tgacttgcgt 44221 tgcatggacc ccaccggctc aacggcttcc gcgccacctg cccacctgcc tctcagcagc acgtacctgg ggtggccgag ttgccgaagg cgcggtggac gggtggacgg agagtcgtcg Anhang 369 44281 agcgagcacg gtggcacaac cctcccgagt cgggggactt ggcgatcgct cggcgctgcc tcgctcgtgc caccgtgttg ggagggctca gccccctgaa ccgctagcga gccgcgacgg 44341 cggtggtcag ccggggcgtc gcacgacctg cgtggcactc ctccagaagc cacttgaggt gccaccagtc ggccccgcag cgtgctggac gcaccgtgag gaggtcttcg gtgaactcca 44401 caccgagggc gcctggcaga tcggcctcga cacgacgcgc gtgcctctcc tggtcgccgg gtggctcccg cggaccgtct agccggagct gtgctgcgcg cacggagagg accagcggcc 44461 gatcgcccgt ttctcatccc cgtgcagaca gccccgtggg ccctcgaagg gcggcgcacg ctagcgggca aagagtaggg gcacgtctgt cggggcaccc gggagcttcc cgccgcgtgc 44521 gttcagaggc ggatgatgac gaggggatgt catcggggcc tccgccggcg acgccgagag caagtctccg cctactactg ctcccctaca gtagccccgg aggcggccgc tgcggctctc 44581 acggcgcggc agcgcgtcgg ccggctgctc gggggcgagg gtggggggcc agggccgtaa tgccgcgccg tcgcgcagcc ggccgacgag cccccgctcc caccccccgg tcccggcatt 44641 tcatgcgtgc gaggccgatg tcgaggtcct cgcctcggcg ctcgaccaga ccgtcggtgt agtacgcacg ctccggctac agctccagga gcggagccgc gagctggtct ggcagccaca 44701 acagcacagg ggggtgtcag gaagccgggt gcagtgggta tccgtgcgag tggagcggaa tgtcgtgtcc ccccacagtc cttcggccca cgtcacccat aggcacgctc acctcgcctt 44761 acggctgtgc gagtggaacg gaaacggctg tcacaacaat gggaggtggc gggcggtgga tgccgacacg ctcaccttgc ctttgccgac agtgttgtta ccctccaccg cccgccacct msc41 >>..> v 44821 ccggcccgat cgcgatcgac acgtactcga catgatcgac tggctcatgg agaccacttc ggccgggcta gcgctagctg tgcatgagct gtactagctg accgagtacc tctggtgaag >.............................msc41.............................> d r p d r d r h v l d m i d w l m e t t 44881 ccttcgggag ttcctgcagc acttggtgga cgacgccgtc agcgcctcgg ccgcagacgg ggaagccctc aaggacgtcg tgaaccacct gctgcggcag tcgcggagcc ggcgtctgcc >.............................msc41.............................> s l r e f l q h l v d d a v s a s a a d 44941 ctgcggcgtg accgtgcaac ggcggcaccg gccgctgacc gtggtcagca ccggtggggt gacgccgcac tggcacgttg ccgccgtggc cggcgactgg caccagtcgt ggccacccca >.............................msc41.............................> g c g v t v q r r h r p l t v v s t g g 45001 ggcggaaaag ctggacgaga aacagtacgg actggacgac ggcccgtgcc ttcactgtct ccgccttttc gacctgctct ttgtcatgcc tgacctgctg ccgggcacgg aagtgacaga >.............................msc41.............................> v a e k l d e k q y g l d d g p c l h c 45061 gcgcagcggg ggcagcgtgt atgtgccgga catgctgggt gaggcccgat gggagtcctt cgcgtcgccc ccgtcgcaca tacacggcct gtacgaccca ctccgggcta ccctcaggaa >.............................msc41.............................> l r s g g s v y v p d m l g e a r w e s 45121 cccagggttc gcggccgaca tgggtatccg ctcctcgctg tccctgccga tacccgcccg gggtcccaag cgccggctgt acccataggc gaggagcgac agggacggct atgggcgggc >.............................msc41.............................> f p g f a a d m g i r s s l s l p i p a 370 Anhang 45181 cacccatacc gcaggggccc tcaatttcta tgccgccggc caggacgcgt tcacggagga gtgggtatgg cgtccccggg agttaaagat acggcggccg gtcctgcgca agtgcctcct >.............................msc41.............................> r t h t a g a l n f y a a g q d a f t e 45241 cgaccgaggc aggctcgcgc tgctcgccgc gcaggcaggt ggtgggatcg cgctggcgca gctggctccg tccgagcgcg acgagcggcg cgtccgtcca ccaccctagc gcgaccgcgt >.............................msc41.............................> d d r g r l a l l a a q a g g g i a l a 45301 gcggctggcc gacgcggagg acttcagccg cgacctgcag acggcgctcg cctcgcgcag cgccgaccgg ctgcgcctcc tgaagtcggc gctggacgtc tgccgcgagc ggagcgcgtc >.............................msc41.............................> q r l a d a e d f s r d l q t a l a s r 45361 cgtcatcgac caggccatcg gcagcgtgat gcaacggcgg cactgcaccg cggaagaggc gcagtagctg gtccggtagc cgtcgcacta cgttgccgcc gtgacgtggc gccttctccg >.............................msc41.............................> s v i d q a i g s v m q r r h c t a e e 45421 tttcgacctg ctccgccggc tctcccagga aaccaatctc aagctccggg acgtctgcac aaagctggac gaggcggccg agagggtcct ttggttagag ttcgaggccc tgcagacgtg >.............................msc41.............................> a f d l l r r l s q e t n l k l r d v c 45481 gcgtctggtc accggtcttg ccggcgggcc tcccgctccc cggccgccgc tgcgaccccg cgcagaccag tggccagaac ggccgcccgg agggcgaggg gccggcggcg acgctggggc >.............................msc41.............................> t r l v t g l a g g p p a p r p p l r p 45541 gccgtgacgt tcgcagccgg aaagtccctg ctgtcccgcc ctgtacgggc ggtgattgtg cggcactgca agcgtcggcc tttcagggac gacagggcgg gacatgcccg ccactaacac >....>> msc41 r p - 45601 gtgagaccgt ggaagtacgt gagacgcaac cgtgacggca cgccgacaca gcttctgcct cactctggca ccttcatgca ctctgcgttg gcactgccgt gcggctgtgt cgaagacgga 45661 cgcgaggggt cgcttaggaa gccaggcgat ggccgtccgc gctcgcgaga gcatggctgc gcgctcccca gcgaatcctt cggtccgcta ccggcaggcg cgagcgctct cgtaccgacg 45721 agtgcatccg cccgcccggg gcccccggcc ggacgggtgc atccccggcc tgtacgtccc tcacgtaggc gggcgggccc cgggggccgg cctgcccacg taggggccgg acatgcaggg 45781 tcagtgccag ggcgatcgtc tcccccggcg gtacgggcgt cgagcacctg gctgacttgc agtcacggtc ccgctagcag agggggccgc catgcccgca gctcgtggac cgactgaacg 45841 ggaccctcac gccccgttcc cttcctggtc gccggtccgg cgtccgcgcc ctatggccgg cctgggagtg cggggcaagg gaaggaccag cggccaggcc gcaggcgcgg gataccggcc 45901 ccgatcggac atccacggct ctgtgcccac ccagctcgtg gcagcgtcga cggctccgct ggctagcctg taggtgccga gacacgggtg ggtcgagcac cgtcgcagct gccgaggcga 45961 gtccgaggcc gagcggtcgc gtgccacgtc ctcgaagggc tggcggagta gggcggcacc caggctccgg ctcgccagcg cacggtgcag gagcttcccg accgcctcat cccgccgtgg 46021 ggtgtcagta aggtgaggtg aggaagcgag ggaggagcag tgagagcgcc gcgcactctg ccacagtcat tccactccac tccttcgctc cctcctcgtc actctcgcgg cgcgtgagac 46081 acaaccctgg acgaggtcga caccggtgac cacgtctgcc aggtgctgga ccgcatggac tgttgggacc tgctccagct gtggccactg gtgcagacgg tccacgacct ggcgtacctg Anhang 371 46141 gacgtcatcg accgcagccg ggccttcgtc gccgacggcg cgttgcacgg tgacaaggtg ctgcagtagc tggcgtcggc ccggaagcag cggctgccgc gcaacgtgcc actgttccac 46201 gtgatcgtcg gggccgcttt ccaggcgggg accgagttcg ctcagctcgt actcgaccct cactagcagc cccggcgaaa ggtccgcccc tggctcaagc gagtcgagca tgagctggga 46261 ggccgactgg acggctctct tctcgccgcg gtgcgtcgcg aggcggccta tgccgaccgt ccggctgacc tgccgagaga agagcggcgc cacgcagcgc tccgccggat acggctggca 46321 gagggattcc gctcgcttcg ggtgctgcac catgtccggc ccagctgcca tgcggagcag ctccctaagg cgagcgaagc ccacgacgtg gtacaggccg ggtcgacggt acgcctcgtc 46381 gcgagggaac tgttgcgcag cgaactcgat ctcgaggagt tcgcggccga taccggcgcc cgctcccttg acaacgcgtc gcttgagcta gagctcctca agcgccggct atggccgcgg 46441 ctggtggtct gtgcctacag cggtgtcggc tgggacctgt ccacgctgcg gcagctcggt gaccaccaga cacggatgtc gccacagccg accctggaca ggtgcgacgc cgtcgagcca 46501 tgcgtgcatc cgcatcatct gggcagccgt gcagcctc acgcacgtag gcgtagtaga cccgtcggca cgtcggag 372 Anhang 7.3.2 Sequenz des mec-Contigs 1 agaggccgct ggcgtcgtcg accagtcgta gaaggaggcc gaggtcagcc cggccgtggt tctccggcga ccgcagcagc tggtcagcat cttcctccgg ctccagtcgg gccggcacca 61 gctgacgacg gcgctcgcga tgtgtccccg ggacgcggcc cagaccaccg gggacgagca cgactgctgc cgcgagcgct acacaggggc cctgcgccgg gtctggtggc ccctgctcgt 121 gcgtcagcac caggccgatc acctgccacg gctcgtacgg gccggtcgac gagccgtcgg cgcagtcgtg gtccggctag tggacggtgc cgagcatgcc cggccagctg ctcggcagcc 181 ggtgcaggtc gcgccgctgg tcccagccca gccaggcggc ccacatcgtc agggaggcca ccacgtccag cgcggcgacc agggtcgggt cggtccgccg ggtgtagcag tccctccggt 241 ccgccgtcac cagggccggc agcggtgcgg gaacggatct caggagtcgt tggctcatga ggcggcagtg gtcccggccg tcgccacgcc cttgcctaga gtcctcagca accgagtact 301 cctcagcctg ccgtcgcgcc cttcggccgg acagagcgcg ggtactcatc cgcacccgag ggagtcggac ggcagcgcgg gaagccggcc tgtctcgcgc ccatgagtag gcgtgggctc 361 tacccgagcg gacgggacct gccctctaag cgggtgaagc ctgcgctccg gtgggtggtg atgggctcgc ctgccctgga cgggagattc gcccacttcg gacgcgaggc cacccaccac 421 cggggcatgg atgaagcccc ggccgcatcc ggccgagtcg gcggacacga cgcgctggag gccccgtacc tacttcgggg ccggcgtagg ccggctcagc cgcctgtgct gcgcgacctc 481 ttgagcgatg aacgcgaaga aacagagccc cgagcggacc ggtcccaccg gcgccgcgac aactcgctac ttgcgcttct ttgtctcggg gctcgcctgg ccagggtggc cgcggcgctg >>.......................mecVIII.........................> m n a k k q s p e r t g p t g a a 541 ccacgaagtc ccggtcctga tcgtcggggg gtctctcgtc ggcctgtcgg cctcggtgtt ggtgcttcag ggccaggact agcagccccc cagagagcag ccggacagcc ggagccacaa >............................mecVIII............................> t h e v p v l i v g g s l v g l s a s v 601 cctgggccgg ctcggggtgc cgcacacgct ggtggagcgg cacacgggca cctccatcca ggacccggcc gagccccacg gcgtgtgcga ccacctcgcc gtgtgcccgt ggaggtaggt >............................mecVIII............................> f l g r l g v p h t l v e r h t g t s i 661 tccgcgcggc cggggcaaca acgtccgcac gatggaggtg ttccgggcgg ccggcgtcga aggcgcgccg gccccgttgt tgcaggcgtg ctacctccac aaggcccgcc ggccgcagct >............................mecVIII............................> h p r g r g n n v r t m e v f r a a g v 721 gtccggcatc cggcgggccg ccgccacgct ggccggcaac cacggcatcc tgcagacgcc caggccgtag gccgcccggc ggcggtgcga ccggccgttg gtgccgtagg acgtctgcgg >............................mecVIII............................> e s g i r r a a a t l a g n h g i l q t 781 caccctggtc ggggacgcgg gcgagtggct gttcaaggag atcgacgcgg gcggcggact gtgggaccag cccctgcgcc cgctcaccga caagttcctc tagctgcgcc cgccgcctga >............................mecVIII............................> p t l v g d a g e w l f k e i d a g g g Anhang 373 841 cgcccgattc agccccagct cctggtgtct gtgcagccag aacgacctgg agccggtgct gcgggctaag tcggggtcga ggaccacaga cacgtcggtc ttgctggacc tcggccacga >............................mecVIII............................> l a r f s p s s w c l c s q n d l e p v 901 gttcgagcac gccgagcggc tcggcggcga tctgcggtac gccaccgaga tgatgtcgtt caagctcgtg cggctcgccg agccgccgct agacgccatg cggtggctct actacagcaa >............................mecVIII............................> l f e h a e r l g g d l r y a t e m m s 961 cgacagcgac ccctccggtg tcaccgcgat cgtcaagagc cgggagacgg gcgagcacac gctgtcgctg gggaggccac agtggcgcta gcagttctcg gccctctgcc cgctcgtgtg >............................mecVIII............................> f d s d p s g v t a i v k s r e t g e h 1021 caccatccgc gcgcagtacc tcatcgccgc cgacggcccc cgcagtcccg tccgcgaaca gtggtaggcg cgcgtcatgg agtagcggcg gctgccgggg gcgtcagggc aggcgcttgt >............................mecVIII............................> t t i r a q y l i a a d g p r s p v r e 1081 gctcggcatc ggccagagcg gccccggcga cctgttccac aacgtgagcg tcaccttccg cgagccgtag ccggtctcgc cggggccgct ggacaaggtg ttgcactcgc agtggaaggc >............................mecVIII............................> q l g i g q s g p g d l f h n v s v t f 1141 ctcccgcgac ctcgccgagg tcgtgggcga gcgccgcttc atcgtctgct acctgacgaa gagggcgctg gagcggctcc agcacccgct cgcggcgaag tagcagacga tggactgctt >............................mecVIII............................> r s r d l a e v v g e r r f i v c y l t 1201 cccggacgcc gacggggcgc tgctgcccgt ggacaaccgg gagaactggg tcttccacct gggcctgcgg ctgccccgcg acgacgggca cctgttggcc ctcttgaccc agaaggtgga >............................mecVIII............................> n p d a d g a l l p v d n r e n w v f h 1261 gccctggcac cccgaacacg gcgaaacgct ggaggagttc accgaggagc ggtgtgccga cgggaccgtg gggcttgtgc cgctttgcga cctcctcaag tggctcctcg ccacacggct >............................mecVIII............................> l p w h p e h g e t l e e f t e e r c a 1321 acacatccgc cgcgcggtcg gggtcgccga cctcgacgtc cggatcaccg gcaaggcacc tgtgtaggcg gcgcgccagc cccagcggct ggagctgcag gcctagtggc cgttccgtgg >............................mecVIII............................> e h i r r a v g v a d l d v r i t g k a 1381 ctggcacgcg gcccagcgcg tcgcccgcgg ctaccggtcg gggcgggtct tcctggccgg gaccgtgcgc cgggtcgcgc agcgggcgcc gatggccagc cccgcccaga aggaccggcc >............................mecVIII............................> p w h a a q r v a r g y r s g r v f l a 1441 cgactccgcc cacgagatgt ccccgaccgg ggccttcggc tccaacaccg ggatccagga gctgaggcgg gtgctctaca ggggctggcc ccggaagccg aggttgtggc cctaggtcct >............................mecVIII............................> g d s a h e m s p t g a f g s n t g i q 1501 cgcgcacaac ctcgcctgga agctcgcggc ggtcctcggc ggctgggccg gcgaggggct gcgcgtgttg gagcggacct tcgagcgccg ccaggagccg ccgacccggc cgctccccga >............................mecVIII............................> d a h n l a w k l a a v l g g w a g e g 374 Anhang 1561 gctggcctcg tacgacgccg agcgccgccc ggtcgcggag gccaccagcg cccgcgccgc cgaccggagc atgctgcggc tcgcggcggg ccagcgcctc cggtggtcgc gggcgcggcg >............................mecVIII............................> l l a s y d a e r r p v a e a t s a r a 1621 cgcccggtcg gtcgaacaca gccaccccgg tttcgccccg gcccccggcg tcggcggcgg gcgggccagc cagcttgtgt cggtggggcc aaagcggggc cgggggccgc agccgccgcc >............................mecVIII............................> a a r s v e h s h p g f a p a p g v g g 1681 cgggggcccg cagcgcggca tcctcaacgt ggcgctcggc taccgctatc cgcagggagc gcccccgggc gtcgcgccgt aggagttgca ccgcgagccg atggcgatag gcgtccctcg >............................mecVIII............................> g g g p q r g i l n v a l g y r y p q g 1741 cgtcctcggc accgacccca ccgcgccggt cgtccccgaa cgcctcgacc tgaccggcga gcaggagccg tggctggggt ggcgcggcca gcaggggctt gcggagctgg actggccgct >............................mecVIII............................> a v l g t d p t a p v v p e r l d l t g 1801 acccggcagc cgggcccccc atctggcggt acggcaccag ggcgagagca tctcgaccct tgggccgtcg gcccgggggg tagaccgcca tgccgtggtc ccgctctcgt agagctggga >............................mecVIII............................> e p g s r a p h l a v r h q g e s i s t 1861 ggacctctac gaacgctccc tcgtcctgct gagcgacgcg gacgccacgg ccggcggacc cctggagatg cttgcgaggg agcaggacga ctcgctgcgc ctgcggtgcc ggccgcctgg >............................mecVIII............................> l d l y e r s l v l l s d a d a t a g g 1921 ggccggcgga ccgggcagct ggcacgcggc cgcgctccgc ctcgccgagg ccatgtccgt ccggccgcct ggcccgtcga ccgtgcgccg gcgcgaggcg gagcggctcc ggtacaggca >............................mecVIII............................> p a g g p g s w h a a a l r l a e a m s 1981 ccccctggcc tcgtaccgtt tcggcacggg gcccgacgcc gagctggccc cggagggcga gggggaccgg agcatggcaa agccgtgccc cgggctgcgg ctcgaccggg gcctcccgct >............................mecVIII............................> v p l a s y r f g t g p d a e l a p e g 2041 cacggactgg gcggccgcgc acgggacgac ggccgcgggc gccgtactcg tacggcccga gtgcctgacc cgccggcgcg tgccctgctg ccggcgcccg cggcatgagc atgccgggct >............................mecVIII............................> d t d w a a a h g t t a a g a v l v r p 2101 cgggttcgtg gcgtggcgtt cgccgggggc ggtcccggac gccgagtccg ccctgcgcga gcccaagcac cgcaccgcaa gcggcccccg ccagggcctg cggctcaggc gggacgcgct >............................mecVIII............................> d g f v a w r s p g a v p d a e s a l r 2161 ggccctgacc accctgctgg cgacggcctg accccacctc acacggccgg ccggccccgg ccgggactgg tgggacgacc gctgccggac tggggtggag tgtgccggcc ggccggggcc >............mecVIII............>> e a l t t l l a t a - 2221 gacaccccgg gccggccggc cgcgtcatgc ggtgcccgcc atcgtgcggt gcgcaccgcc ctgtggggcc cggccggccg gcgcagtacg ccacgggcgg tagcacgcca cgcgtggcgg 2281 gtacgccgtc gcggctccgg gccgaactcg cgcgcccggt cgccggattc acccactgac catgcggcag cgccgaggcc cggcttgagc gcgcgggcca gcggcctaag tgggtgactg Anhang 375 2341 ggtctcgcgt ggcggccggg acactccgag ctgacgggac atcacatcct gtgctcctca ccagagcgca ccgccggccc tgtgaggctc gactgccctg tagtgtagga cacgaggagt 2401 acccggctga cgaggcgtcg gcagtgccga cggtgccggc agcgggacga ggggtcctgg tgggccgact gctccgcagc cgtcacggct gccacggccg tcgccctgct ccccaggacc 2461 gcgacggtca cgagaagccc ggggggcgac ggccctgcgc ggtgcgccgc gggaggaccg cgctgccagt gctcttcggg ccccccgctg ccgggacgcg ccacgcggcg ccctcctggc 2521 gcgcggaccc tcccgcgagc gcggcccgcc ccctgccggg cgccggcagc cgccgtgacc cgcgcctggg agggcgctcg cgccgggcgg gggacggccc gcggccgtcg gcggcactgg 2581 ggcccccgtg accggccgcg cggtgtggtg gcccggccgg gcaccgggcg gcacaccgcc ccgggggcac tggccggcgc gccacaccac cgggccggcc cgtggcccgc cgtgtggcgg 2641 cttcacccga gtggcgcacc ggtcacccgc gcagtgcata cgagtcgcgc gccggatggg gaagtgggct caccgcgtgg ccagtgggcg cgtcacgtat gctcagcgcg cggcctaccc 2701 gcgggcccag gatcgaggca cgccgacgtc agccgatccg gccgacatac gtccgtcccc cgcccgggtc ctagctccgt gcggctgcag tcggctaggc cggctgtatg caggcagggg 2761 gccccccacc aggagatgtg cgcaggatga ccaccacgtc cgaacgtctt acggagacgc cggggggtgg tcctctacac gcgtcctact ggtggtgcag gcttgcagaa tgcctctgcg >>..............mecI................> m t t t s e r l t e t 2821 tgaagcgaca ggtgtcgcag cgggtctccc agtccgtctt cgacggctcc cggctccgtg acttcgctgt ccacagcgtc gcccagaggg tcaggcagaa gctgccgagg gccgaggcac >.............................mecI..............................> l k r q v s q r v s q s v f d g s r l r 2881 tcgtcctcct cgtggacgtc tacgacggtg cccagcagca gttcctggag gcgtacgagc agcaggagga gcacctgcag atgctgccac gggtcgtcgt caaggacctc cgcatgctcg >.............................mecI..............................> v v l l v d v y d g a q q q f l e a y e 2941 agctgtgcaa ccaggtcgcc tccgtgcccg gacatgtcag cgaccagctg tgccagtcca tcgacacgtt ggtccagcgg aggcacgggc ctgtacagtc gctggtcgac acggtcaggt >.............................mecI..............................> q l c n q v a s v p g h v s d q l c q s 3001 tcgagaaccc ctcccagtgg ctcatcacca gtgagtggga gagtgccccg ccgttcctca agctcttggg gagggtcacc gagtagtggt cactcaccct ctcacggggc ggcaaggagt >.............................mecI..............................> i e n p s q w l i t s e w e s a p p f l 3061 cctgggtgaa cagcgaggaa cacgtggaca tggtcaagcc gctgcacaac tgcgtccggg ggacccactt gtcgctcctt gtgcacctgt accagttcgg cgacgtgttg acgcaggccc >.............................mecI..............................> t w v n s e e h v d m v k p l h n c v r 3121 acacccgctc gctgcgcttc cacatcgtcc gcgagaccgg cggcccggcc gtcgacgcag tgtgggcgag cgacgcgaag gtgtagcagg cgctctggcc gccgggccgg cagctgcgtc >.............................mecI..............................> d t r s l r f h i v r e t g g p a v d a 3181 acgccggcaa gcgccgcctg cagacctccc cccgcatcgg cgacggtctg atccggcacg tgcggccgtt cgcggcggac gtctggaggg gggcgtagcc gctgccagac taggccgtgc >.............................mecI..............................> d a g k r r l q t s p r i g d g l i r h 376 Anhang 3241 cgctcacctt cacggtcaag ccgggcagcg aggagaaggt cgccaggatc ctcgccgact gcgagtggaa gtgccagttc ggcccgtcgc tcctcttcca gcggtcctag gagcggctga >.............................mecI..............................> a l t f t v k p g s e e k v a r i l a d 3301 acgccgcgcc ggagccgaag gtcgacgaca ccacccggct gtgccgcacg tccctgttca tgcggcgcgg cctcggcttc cagctgctgt ggtgggccga cacggcgtgc agggacaagt >.............................mecI..............................> y a a p e p k v d d t t r l c r t s l f 3361 tgcacggcaa ccgggtggtc cgggccgtcg aggtccgggg cgacctgctc gccgcgctgc acgtgccgtt ggcccaccag gcccggcagc tccaggcccc gctggacgag cggcgcgacg >.............................mecI..............................> m h g n r v v r a v e v r g d l l a a l 3421 ggcatgtcgc ccggcagccc gaggtgcggg ccgtcgagga ggccatcaac ccctatctgg ccgtacagcg ggccgtcggg ctccacgccc ggcagctcct ccggtagttg gggatagacc >.............................mecI..............................> r h v a r q p e v r a v e e a i n p y l 3481 agcaggaccg ggacctcgac gaccccgact ccgcccgggt cttcttcacc cgcgcggcgc tcgtcctggc cctggagctg ctggggctga ggcgggccca gaagaagtgg gcgcgccgcg >.............................mecI..............................> e q d r d l d d p d s a r v f f t r a a 3541 tccccgccgt ccaccacgtg acggccggcc aggagagccc ggacgcggta cggcacgcgc aggggcggca ggtggtgcac tgccggccgg tcctctcggg cctgcgccat gccgtgcgcg >.............................mecI..............................> l p a v h h v t a g q e s p d a v r h a 3601 tgtactaccc ggcccgcgag ggctgcggtc tgcggctggc cgagctgctc gcccggcagg acatgatggg ccgggcgctc ccgacgccag acgccgaccg gctcgacgag cgggccgtcc >.............................mecI..............................> l y y p a r e g c g l r l a e l l a r q 3661 acgaggcggc ggcggacgac ccgcaggggc cggtgctgcg cagcacgatc ttccagcgcg tgctccgccg ccgcctgctg ggcgtccccg gccacgacgc gtcgtgctag aaggtcgcgc >.............................mecI..............................> d e a a a d d p q g p v l r s t i f q r 3721 acgacatcgt ggtgcggctg gtcgacgtgc gcggcggcat cgacaacgac cccggccccg tgctgtagca ccacgccgac cagctgcacg cgccgccgta gctgttgctg gggccggggc >.............................mecI..............................> d d i v v r l v d v r g g i d n d p g p 3781 tgctcggtct cgccgaccgc gcccgcgcgg ccgaactgac cgcgctgctg gacggcggcg acgagccaga gcggctggcg cgggcgcgcc ggcttgactg gcgcgacgac ctgccgccgc >.............................mecI..............................> v l g l a d r a r a a e l t a l l d g g 3841 ccctcggcgc ggacggcacg ccgaggggcg gcgcctccgc ccgcctgctc acggtcgccc gggagccgcg cctgccgtgc ggctccccgc cgcggaggcg ggcggacgag tgccagcggg >.............................mecI..............................> a l g a d g t p r g g a s a r l l t v a 3901 gcatggaact cgtcaccgac cgccgggcgc ccgacgcctg atccccctca acccggggcc cgtaccttga gcagtggctg gcggcccgcg ggctgcggac tagggggagt tgggccccgg >...................mecI...................>> r m e l v t d r r a p d a - Anhang 377 3961 gtgcggcagc gccgcacgcc cccgccccgc cccgtccccg tccccgtccc cgcacccgca cacgccgtcg cggcgtgcgg gggcggggcg gggcaggggc aggggcaggg gcgtgggcgt 4021 cccgcacccg cacccgttcg actcagctca tgttcggagg aacgtcgtga tcaatcgcca gggcgtgggc gtgggcaagc tgagtcgagt acaagcctcc ttgcagcact agttagcggt >>...mecII....> v i n r 4081 tcccggcatc gtggatgtca gcgaggtcga gcccaacacc cggcgcggcg gcgatctgcg agggccgtag cacctacagt cgctccagct cgggttgtgg gccgcgccgc cgctagacgc >.............................mecII.............................> h p g i v d v s e v e p n t r r g g d l 4141 cgccatgttg accccctcca cggtcggctc caccagcggt ttcatgggcg tggccatcgt gcggtacaac tgggggaggt gccagccgag gtggtcgcca aagtacccgc accggtagca >.............................mecII.............................> r a m l t p s t v g s t s g f m g v a i 4201 ggcgcccggc gaccgcatcg ccgagcacta ccacccgtac tccgaggagt tcatctacgt ccgcgggccg ctggcgtagc ggctcgtgat ggtgggcatg aggctcctca agtagatgca >.............................mecII.............................> v a p g d r i a e h y h p y s e e f i y 4261 catctgcgga cagctggagg tggacctcga cggcgagccc caccgactcc ggccggagca gtagacgcct gtcgacctcc acctggagct gccgctcggg gtggctgagg ccggcctcgt >.............................mecII.............................> v i c g q l e v d l d g e p h r l r p e 4321 ggggctgttg atccccgccc acatgcggca ccggttccgc aacgtcggca aggtggaggc ccccgacaac taggggcggg tgtacgccgt ggccaaggcg ttgcagccgt tccacctccg >.............................mecII.............................> q g l l i p a h m r h r f r n v g k v e 4381 ccgcatggtc ttccacctcg gcccgctggc cccgagcccg ccgctcggcc acgtcgacac ggcgtaccag aaggtggagc cgggcgaccg gggctcgggc ggcgagccgg tgcagctgtg >.............................mecII.............................> a r m v f h l g p l a p s p p l g h v d 4441 cgaggacgcg aacggcgtac cgatcccggt ggaggcggcc cacgccggac gggccgagcg gctcctgcgc ttgccgcatg gctagggcca cctccgccgg gtgcggcctg cccggctcgc >.............................mecII.............................> t e d a n g v p i p v e a a h a g r a e 4501 gcctcaggtc cgctcatgac caggcgcgtg gcggtcaccg gcataggcat cgtcgctccg cggagtccag gcgagtactg gtccgcgcac cgccagtggc cgtatccgta gcagcgaggc >......mecII......>> r p q v r s >>...................mecIII.....................> m t r r v a v t g i g i v a p 4561 ggcggcatcg gtgtcccggc gttctgggac ctgctggccg acggtcgcac ggcgacacgt ccgccgtagc cacagggccg caagaccctg gacgaccggc tgccagcgtg ccgctgtgca >............................mecIII.............................> g g i g v p a f w d l l a d g r t a t r 4621 ggcatcacct tcttcgaccc gtccgggctg cgttcgcgga tcgccgccga gtgcgacttc ccgtagtgga agaagctggg caggcccgac gcaagcgcct agcggcggct cacgctgaag >............................mecIII.............................> g i t f f d p s g l r s r i a a e c d f 378 Anhang 4681 gacccggcgg cccacggact ggacgcggag ctggtcgccc gctgcgaccg gtacatccag ctgggccgcc gggtgcctga cctgcgcctc gaccagcggg cgacgctggc catgtaggtc >............................mecIII.............................> d p a a h g l d a e l v a r c d r y i q 4741 ttcgccctgg tggccggtga ggaggcgatc cgggactccg gcctcgacct cgccgcggag aagcgggacc accggccact cctccgctag gccctgaggc cggagctgga gcggcgcctc >............................mecIII.............................> f a l v a g e e a i r d s g l d l a a e 4801 aacccctggc gggtcggggt ctccctcggc accgcggtcg gcggcaccac ccgtctggag ttggggaccg cccagcccca gagggagccg tggcgccagc cgccgtggtg ggcagacctc >............................mecIII.............................> n p w r v g v s l g t a v g g t t r l e 4861 cacgactacg tgctggtcag ccatcgcggt cagcgctggg acgtggacca ccgggaggcc gtgctgatgc acgaccagtc ggtagcgcca gtcgcgaccc tgcacctggt ggccctccgg >............................mecIII.............................> h d y v l v s h r g q r w d v d h r e a 4921 gggccgcatc tgcaccgggc gttcgcgccc agcaccctcg cctcgacggt ggcggaacgc cccggcgtag acgtggcccg caagcgcggg tcgtgggagc ggagctgcca ccgccttgcg >............................mecIII.............................> g p h l h r a f a p s t l a s t v a e r 4981 ttcgaggccc gggggccggt gcagaccgtc tccaccggct gcacctcggg gctcgacgcg aagctccggg cccccggcca cgtctggcag aggtggccga cgtggagccc cgagctgcgc >............................mecIII.............................> f e a r g p v q t v s t g c t s g l d a 5041 gtcgggtacg ccttccacac gatcgaggag ggccgggccg acatctgcat agccggtgcc cagcccatgc ggaaggtgtg ctagctcctc ccggcccggc tgtagacgta tcggccacgg >............................mecIII.............................> v g y a f h t i e e g r a d i c i a g a 5101 tcggactcgc cgatctcccc gatcaccatg gcctgcttcg acgcgatcaa ggccacctcc agcctgagcg gctagagggg ctagtggtac cggacgaagc tgcgctagtt ccggtggagg >............................mecIII.............................> s d s p i s p i t m a c f d a i k a t s 5161 cccgacaacg acgacccggc ccacgcctcg cgtcccttcg acgccgaccg caacgggttc gggctgttgc tgctgggccg ggtgcggagc gcagggaagc tgcggctggc gttgcccaag >............................mecIII.............................> p d n d d p a h a s r p f d a d r n g f 5221 gtcatgggcg agggcggcgc cgtactggtc ctggaggagc tggcacacgc acgggcccgc cagtacccgc tcccgccgcg gcatgaccag gacctcctcg accgtgtgcg tgcccgggcg >............................mecIII.............................> v m g e g g a v l v l e e l a h a r a r 5281 ggcgcgcacg tgtactgcga gatcgggggc tacgccacct tcggcaacgc ctaccacatg ccgcgcgtgc acatgacgct ctagcccccg atgcggtgga agccgttgcg gatggtgtac >............................mecIII.............................> g a h v y c e i g g y a t f g n a y h m 5341 accggcctga ccagcgaggg cctggagatg gcgcgggcca tcgaggacgc cctcgaccat tggccggact ggtcgctccc ggacctctac cgcgcccggt agctcctgcg ggagctggta >............................mecIII.............................> t g l t s e g l e m a r a i e d a l d h Anhang 379 5401 gcccggatcg accgtacggc cgtcgactac gtcaacgccc acggctcggg caccaagcag cgggcctagc tggcatgccg gcagctgatg cagttgcggg tgccgagccc gtggttcgtc >............................mecIII.............................> a r i d r t a v d y v n a h g s g t k q 5461 aacgaccggc acgagacggc cgccgtcaaa cggacgctcg gcgcgcacgc ctacgacacg ttgctggccg tgctctgccg gcggcagttt gcctgcgagc cgcgcgtgcg gatgctgtgc >............................mecIII.............................> n d r h e t a a v k r t l g a h a y d t 5521 cccatgagtt ccatcaagtc catggtgggc cactcgctgg gcgcgatcgg cgcgatcgag gggtactcaa ggtagttcag gtaccacccg gtgagcgacc cgcgctagcc gcgctagctc >............................mecIII.............................> p m s s i k s m v g h s l g a i g a i e 5581 gtcgtcgcct gtgcgctggc cctggcccac caggtcgtcc cgcccaccgc gaactaccag cagcagcgga cacgcgaccg ggaccgggtg gtccagcagg gcgggtggcg cttgatggtc >............................mecIII.............................> v v a c a l a l a h q v v p p t a n y q 5641 accccggacc ccgagtgcga cctggactac gtgccgcgcg tcgcccgtga gcggaagctg tggggcctgg ggctcacgct ggacctgatg cacggcgcgc agcgggcact cgccttcgac >............................mecIII.............................> t p d p e c d l d y v p r v a r e r k l 5701 accaacgtgc tctccgtggg cagcgggttc ggcgggttcc agtccgcggt ggtcatgagc tggttgcacg agaggcaccc gtcgcccaag ccgcccaagg tcaggcgcca ccagtactcg >............................mecIII.............................> t n v l s v g s g f g g f q s a v v m s 5761 ctgccgaggg agaagacacg atgagcgaac ggcgtcctcg gcgcgcggcc gtcaccggaa gacggctccc tcttctgtgc tactcgcttg ccgcaggagc cgcgcgccgg cagtggcctt >.........mecIII........>> l p r e k t r >>.................mecIV..................> m s e r r p r r a a v t g 5821 tcggcgtggt cgcgcccaac ggaacgagca ccgagacgtt ctggaagtcc accagggagg agccgcacca gcgcgggttg ccttgctcgt ggctctgcaa gaccttcagg tggtccctcc >.............................mecIV.............................> i g v v a p n g t s t e t f w k s t r e 5881 gcatcagcgt cctggaccgg gtcacccgcg agggctgcga gcatctgccg ctgcgggtgg cgtagtcgca ggacctggcc cagtgggcgc tcccgacgct cgtagacggc gacgcccacc >.............................mecIV.............................> g i s v l d r v t r e g c e h l p l r v 5941 cgggcgaggt ccgcaacttc gatccgccgt cggcggtcga ggagcgctac ctcgtccaga gcccgctcca ggcgttgaag ctaggcggca gccgccagct cctcgcgatg gagcaggtct >.............................mecIV.............................> a g e v r n f d p p s a v e e r y l v q 6001 ccgaccgctt cacgcacttc gcgatggccg ccgccgacca ggcgctcgac gacgcccgcc ggctggcgaa gtgcgtgaag cgctaccggc ggcggctggt ccgcgagctg ctgcgggcgg >.............................mecIV.............................> t d r f t h f a m a a a d q a l d d a r 6061 tggaccggcc cgagaccgac gccgcgccgt tctcggtggg cgtggtcacc gcggccggct acctggccgg gctctggctg cggcgcggca agagccaccc gcaccagtgg cgccggccga >.............................mecIV.............................> l d r p e t d a a p f s v g v v t a a g 380 Anhang 6121 ccggcggcgg cgagttcggg cagcgggaac tgcagcagct gtggtccaag ggcagccgtt ggccgccgcc gctcaagccc gtcgcccttg acgtcgtcga caccaggttc ccgtcggcaa >.............................mecIV.............................> s g g g e f g q r e l q q l w s k g s r 6181 tcgtgggccc gtaccagtcc atcgcctggt tctacgcggc gagcaccggc cagatctcca agcacccggg catggtcagg tagcggacca agatgcgccg ctcgtggccg gtctagaggt >.............................mecIV.............................> f v g p y q s i a w f y a a s t g q i s 6241 tccgccgcgg tttcaagggc ccctgcgggg tcatcgcctc cgacgaggcc ggcgggctgg aggcggcgcc aaagttcccg gggacgcccc agtagcggag gctgctccgg ccgcccgacc >.............................mecIV.............................> i r r g f k g p c g v i a s d e a g g l 6301 acgccgtggc gcacgcggca cgggccgtgc ggcgcggcac ggacgtgatg gtggccggcg tgcggcaccg cgtgcgccgt gcccggcacg ccgcgccgtg cctgcactac caccggccgc >.............................mecIV.............................> d a v a h a a r a v r r g t d v m v a g 6361 cgaccgaggc gccgctcgcc ccctactcgg tggtctgcca gctcggctac gaggagctga gctggctccg cggcgagcgg gggatgagcc accagacggt cgagccgatg ctcctcgact >.............................mecIV.............................> a t e a p l a p y s v v c q l g y e e l 6421 gcaccgtcga cgacccggcc cgcgcctacc gcccgttcac cgccgcggcc tgcgggttcg cgtggcagct gctgggccgg gcgcggatgg cgggcaagtg gcggcgccgg acgcccaagc >.............................mecIV.............................> s t v d d p a r a y r p f t a a a c g f 6481 tccccgccga gggcggcgcg atgctcgtcg tggaggccga ggacacggcc cgggaacggg aggggcggct cccgccgcgc tacgagcagc acctccggct cctgtgccgg gcccttgccc >.............................mecIV.............................> v p a e g g a m l v v e a e d t a r e r 6541 gcgcgcccgt gcgggccctc ctcgcgggcc acgcggccac cttcaccggc gcctcccgct cgcgcgggca cgcccgggag gagcgcccgg tgcgccggtg gaagtggccg cggagggcga >.............................mecIV.............................> g a p v r a l l a g h a a t f t g a s r 6601 gggaggagtc ccgggcgggc ctcgccgagg ccgtccgggt cgccctggag gaggccggct ccctcctcag ggcccgcccg gagcggctcc ggcaggccca gcgggacctc ctccggccga >.............................mecIV.............................> w e e s r a g l a e a v r v a l e e a g 6661 gcgccccgga ggagatcgac gtggtcttcg ccgacgccct cggcgtaccg gcggcggacc cgcggggcct cctctagctg caccagaagc ggctgcggga gccgcatggc cgccgcctgg >.............................mecIV.............................> c a p e e i d v v f a d a l g v p a a d 6721 gtgcggaggc gctggcgatc acggacgccc tcggcgcgca cggcacccgc gtccccgtca cacgcctccg cgaccgctag tgcctgcggg agccgcgcgt gccgtgggcg caggggcagt >.............................mecIV.............................> r a e a l a i t d a l g a h g t r v p v 6781 cggcgccgaa gaccgccatc ggccggggca acggcgcggc ggccgtgctg gacgtcgcgg gccgcggctt ctggcggtag ccggccccgt tgccgcgccg ccggcacgac ctgcagcgcc >.............................mecIV.............................> t a p k t a i g r g n g a a a v l d v a Anhang 381 6841 cggccgtgct cgcgatggag caccgcgtga tcccgcccac ccccaacgtc ttcgacgtct gccggcacga gcgctacctc gtggcgcact agggcgggtg ggggttgcag aagctgcaga >.............................mecIV.............................> a a v l a m e h r v i p p t p n v f d v 6901 gccacgacct cgacctcgtc accggcaccg cccgcgccgc cgagccgcgc acggccctgg cggtgctgga gctggagcag tggccgtggc gggcgcggcg gctcggcgcg tgccgggacc >.............................mecIV.............................> c h d l d l v t g t a r a a e p r t a l 6961 tcctcagccg gggcctcatg gggtcgaacg cggcgctggt gctgcggctc ggccccggcg aggagtcggc cccggagtac cccagcttgc gccgcgacca cgacgccgag ccggggccgc >.............................mecIV.............................> v l s r g l m g s n a a l v l r l g p g 7021 gcgcctcctg accgcccctc accgcacccc cgcgccacac ccccctcacc acgcaccacc cgcggaggac tggcggggag tggcgtgggg gcgcggtgtg gggggagtgg tgcgtggtgg >..mecIV..>> g a s - 7081 gacgcaccaa ggagaaccgc atgagtgacc gcatcaccgt ggaagagctg tccgagctga ctgcgtggtt cctcttggcg tactcactgg cgtagtggca ccttctcgac aggctcgact >>.................mecV...................> m s d r i t v e e l s e l 7141 tgaagaaggc cgccggggtc accgtcaccc cggaggagct ccagcgtcgt atggagtccg acttcttccg gcggccccag tggcagtggg gcctcctcga ggtcgcagca tacctcaggc >.............................mecV..............................> m k k a a g v t v t p e e l q r r m e s 7201 gcttcgacgt catcggcatc gactcgctcg gtctgctcgg catcgtgggc gagctggaga cgaagctgca gtagccgtag ctgagcgagc cagacgagcc gtagcacccg ctcgacctct >.............................mecV..............................> g f d v i g i d s l g l l g i v g e l e 7261 accgctacgg cacgccgatg ccgccggacg cggagaagag ccgcagcccc aagcagttcc tggcgatgcc gtgcggctac ggcggcctgc gcctcttctc ggcgtcgggg ttcgtcaagg >.............................mecV..............................> n r y g t p m p p d a e k s r s p k q f 7321 tcgaccaggt caacaccgcg ctgatggcgg gtgcctgaca tgaccggaca cacgcagaac agctggtcca gttgtggcgc gactaccgcc cacggactgt actggcctgt gtgcgtcttg >.................mecV.................>> l d q v n t a l m a g a >>.......mecVI........> m t g h t q n 7381 gagatcacca tcgccgctcc ggtcgacctg gtctgggaca tgaccaacga cgtcgcgaac ctctagtggt agcggcgagg ccagctggac cagaccctgt actggttgct gcagcgcttg >.............................mecVI.............................> e i t i a a p v d l v w d m t n d v a n 7441 tggccccggc tgttcagcga gtacgccacc gccgagatcc tctccgagga ggggaaccgg accggggccg acaagtcgct catgcggtgg cggctctagg agaggctcct ccccttggcc >.............................mecVI.............................> w p r l f s e y a t a e i l s e e g n r 7501 gtgacgttcc ggctgaccat gcacccggac gagaacggca aggtctggag ctgggtctcg cactgcaagg ccgactggta cgtgggcctg ctcttgccgt tccagacctc gacccagagc >.............................mecVI.............................> v t f r l t m h p d e n g k v w s w v s 382 Anhang 7561 gagcgggaga cggaccgcga gacgctcagc gtggaggccc gccgcgtcga gaccgggccc ctcgccctct gcctggcgct ctgcgagtcg cacctccggg cggcgcagct ctggcccggg >.............................mecVI.............................> e r e t d r e t l s v e a r r v e t g p 7621 ttcgcctaca tgaacatcct gtgggagtac gagaaggtcc ccaccggcac ccggatgacg aagcggatgt acttgtagga caccctcatg ctcttccagg ggtggccgtg ggcctactgc >.............................mecVI.............................> f a y m n i l w e y e k v p t g t r m t 7681 tggacgcagg acttcgcgat gaagcccgac gcgccggtcg acgacgactg gatgacggac acctgcgtcc tgaagcgcta cttcgggctg cgcggccagc tgctgctgac ctactgcctg >.............................mecVI.............................> w t q d f a m k p d a p v d d d w m t d 7741 aacatcaacc gcaactccaa ggtccagatg gccctgatcc gggaccgcat cgagaaggcc ttgtagttgg cgttgaggtt ccaggtctac cgggactagg ccctggcgta gctcttccgg >.............................mecVI.............................> n i n r n s k v q m a l i r d r i e k a 7801 gccgccgagc agggcgccgc gccgggactg accgactgag cgccgagcga tcgcgcgccg cggcggctcg tcccgcggcg cggccctgac tggctgactc gcggctcgct agcgcgcggc >.................mecVI.................>> a a e q g a a p g l t d - 7861 accgaacgaa ccggacggag aacaccgtat gcaccagtcc ctgatcgtcg cccggatggc tggcttgctt ggcctgcctc ttgtggcata cgtggtcagg gactagcagc gggcctaccg >>............mecVII..............> m h q s l i v a r m 7921 cccggggtcg gccccggaca tcgccaagat cttcgaggag tccgaccggg gtgagctgcc gggccccagc cggggcctgt agcggttcta gaagctcctc aggctggccc cactcgacgg >............................mecVII.............................> a p g s a p d i a k i f e e s d r g e l 7981 gcacctcatc ggggtctccc ggcgcagcct cttccagttc gacgacgtgt acatccacct cgtggagtag ccccagaggg ccgcgtcgga gaaggtcaag ctgctgcaca tgtaggtgga >............................mecVII.............................> p h l i g v s r r s l f q f d d v y i h 8041 cgtcgagtcc gagcgggacc ccacacccgt catcaccgag atggccggac accccgagtt gcagctcagg ctcgccctgg ggtgtgggca gtagtggctc taccggcctg tggggctcaa >............................mecVII.............................> l v e s e r d p t p v i t e m a g h p e 8101 ccgggccatc agcgaacggc tgtcgtcgta cgtcaccgcc tacgacccgg ccacctggcg ggcccggtag tcgcttgccg acagcagcat gcagtggcgg atgctgggcc ggtggaccgc >............................mecVII.............................> f r a i s e r l s s y v t a y d p a t w 8161 ttcgccgaag gacgcgatgg cgaaccgctt ctaccggtgg gagcgggaca gccgctcctg aagcggcttc ctgcgctacc gcttggcgaa gatggccacc ctcgccctgt cggcgaggac >............................mecVII.............................> r s p k d a m a n r f y r w e r d s r s 8221 aacccccgtc gggccgccgg gcacgtgcga acgcgcgtgc ccggcggccc gtgcggtcat ttgggggcag cccggcggcc cgtgcacgct tgcgcgcacg ggccgccggg cacgccagta > mecVII mecIX <<.< - Anhang 383 8281 ccgggcacgt ggcagtcgaa ggcgtgcaga tacgcgttga ccgggcgcac gtcgtcgatc ggcccgtgca ccgtcagctt ccgcacgtct atgcgcaact ggcccgcgtg cagcagctag <.............................mecIX.............................< g p v h c d f a h l y a n v p r v d d i 8341 accagccccg cgtccgtcag cctgcgggtc atgctctcgg tggtgtgctt ggccccgccg tggtcggggc gcaggcagtc ggacgcccag tacgagagcc accacacgaa ccggggcggc <.............................mecIX.............................< v l g a d t l r r t m s e t t h k a g g 8401 acgttgagga gcagcagcag gtccatggcg gtgctgaacc gcatcgaggg cgagtcgtcg tgcaactcct cgtcgtcgtc caggtaccgc cacgacttgg cgtagctccc gctcagcagc <.............................mecIX.............................< v n l l l l l d m a t s f r m s p s d d 8461 acgaggttct cgatgaccac gacgcgtgtg ccggggccgc ccgccccgat gacgttgcgc tgctccaaga gctactggtg ctgcgcacac ggccccggcg ggcggggcta ctgcaacgcg <.............................mecIX.............................< v l n e i v v v r t g p g g a g i v n r 8521 agcagccgga ccgtgctgtc gtcgtcccac tccaggatgt tcttgatgac gtagacgtcg tcgtcggcct ggcacgacag cagcagggtg aggtcctaca agaactactg catctgcagc <.............................mecIX.............................< l l r v t s d d d w e l i n k i v y v d 8581 gcccggaccg ggacggcctc gcggcagtcg ccggggacga cgcgcgtccg ctccgcgagc cgggcctggc cctgccggag cgccgtcagc ggcccctgct gcgcgcaggc gaggcgctcg <.............................mecIX.............................< a r v p v a e r c d g p v v r t r e a l 8641 gcgccgcccg gtcgcagccg gggatcggcg ttctccacca cgcgcggcag gtcgagcagg cgcggcgggc cagcgtcggc ccctagccgc aagaggtggt gcgcgccgtc cagctcgtcc <.............................mecIX.............................< a g g p r l r p d a n e v v r p l d l l 8701 gtgccgtgca gcgccgggta cttctccagc aggctcgcca ccacgtgccc ctgtcccccg cacggcacgt cgcggcccat gaagaggtcg tccgagcggt ggtgcacggg gacagggggc <.............................mecIX.............................< t g h l a p y k e l l s a v v h g q g g 8761 ccgatgtcgg cgacggacga actccccgac aggtcgagga actcggcgac gtcccgcgcg ggctacagcc gctgcctgct tgaggggctg tccagctcct tgagccgctg cagggcgcgc <.............................mecIX.............................< g i d a v s s s g s l d l f e a v d r a 8821 gactgcacgc tggaggtcgt catggcgcgg ttgaagacgt cggccgactc gggggcgtcc ctgacgtgcg acctccagca gtaccgcgcc aacttctgca gccggctgag cccccgcagg <.............................mecIX.............................< s q v s s t t m a r n f v d a s e p a d 8881 tcgttgaggt agacgaagaa ctccttgccg tacagctcct cgacgacgtt gtggccggag agcaactcca tctgcttctt gaggaacggc atgtcgagga gctgctgcaa caccggcctc <.............................mecIX.............................< e n l y v f f e k g y l e e v v n h g s 8941 cgcaccgcct cgtccagttt cggccaggcg tcccaggtcc acggctcggt gcaccacagg gcgtggcgga gcaggtcaaa gccggtccgc agggtccagg tgccgagcca cgtggtgtcc <.............................mecIX.............................< r v a e d l k p w a d w t w p e t c w l 384 Anhang 9001 gcgatggcgc gcaggctgtg cgggtcgtcc tcgcgcagca gccgggacat gtcggtgtgg cgctaccgcg cgtccgacac gcccagcagg agcgcgtcgt cggccctgta cagccacacc <.............................mecIX.............................< a i a r l s h p d d e r l l r s m d t h 9061 gcgaacgtcc cgtccggccg ttcggtgaag acgccgtagc aggacagggc ccgcaacagc cgcttgcagg gcaggccggc aagccacttc tgcggcatcg tcctgtcccg ggcgttgtcg <.............................mecIX.............................< a f t g d p r e t f v g y c s l a r l l 9121 cgtcgcagcg gcttcggttc ggccttcacc gcggccgcga ggtcctccgc ggacgacggg gcagcgtcgc cgaagccaag ccggaagtgg cgccggcgct ccaggaggcg cctgctgccc <.............................mecIX.............................< r r l p k p e a k v a a a l d e a s s p 9181 gtgtcgccga ggacgtcggc gacccccagc cgggcggcgg cgcgcagggc cgcggcacag cacagcggct cctgcagccg ctgggggtcg gcccgccgcc gcgcgtcccg gcgccgtgtc <.............................mecIX.............................< t d g l v d a v g l r a a a r l a a a c 9241 gcggcgccga acaccagttc cctgaaccgc atggggggcg ggggcgccgg ggcgtcctgc cgccgcggct tgtggtcaag ggacttggcg taccccccgc ccccgcggcc ccgcaggacg <..............mecIX.............<< a a g f v l e r f r m 9301 gcggtgtgcg gggccttggc cggtgagatg ggcgtggtgg tggtctgtct ggtctgagcg cgccacacgc cccggaaccg gccactctac ccgcaccacc accagacaga ccagactcgc 9361 gtcgtcatgc gacggcctcc ttcttcgagt tcatgagcga ccgaggccgg tcagcacagt cagcagtacg ctgccggagg aagaagctca agtactcgct ggctccggcc agtcgtgtca putative secreted protein <<.......< - c l 9421 cccgcgggcc gggacgcccc gcaggtgttg cccgtgaagg tgttgccctt gccggcggtg gggcgcccgg ccctgcgggg cgtccacaac gggcacttcc acaacgggaa cggccgccac <...................putative secreted protein...................< g a p r s a g c t n g t f t n g k g a t 9481 tcggtgttga cgatgtccgc cggggagttg ccctccagca cgttgtcggt gatccggttc agccacaact gctacaggcg gcccctcaac gggaggtcgt gcaacagcca ctaggccaag <...................putative secreted protein...................< d t n v i d a p s n g e l v n d t i r n 9541 cgctcgctgg tggtgcccac gaagctcttc cagacgacga tgccgcccga cagcggggag gcgagcgacc accacgggtg cttcgagaag gtctgctgct acggcgggct gtcgcccctc <...................putative secreted protein...................< r e s t t g v f s k w v v i g g s l p s 9601 gcgccgacgt tctccgtgac gcggttgcgg gtcaccaggg tgtcctcggc gccggtcagc cgcggctgca agaggcactg cgccaacgcc cagtggtccc acaggagccg cggccagtcg <...................putative secreted protein...................< a g v n e t v r n r t v l t d e a g t l 9661 acgatgccgg tgccctgcag cgcgtccagc cgcgcggtct tcgggcagga cttgttgttc tgctacggcc acgggacgtc gcgcaggtcg gcgcgccaga agcccgtcct gaacaacaag <...................putative secreted protein...................< v i g t g q l a d l r a t k p c s k n n Anhang 385 9721 cgctcgatga ggttgtcgcg cacggtgagc gcgccggccc tcggcatgtt ctcgtcgccc gcgagctact ccaacagcgc gtgccactcg cgcggccggg agccgtacaa gagcagcggg <...................putative secreted protein...................< r e i l n d r v t l a g a r p m n e d g 9781 acgacgaaga cgcccacgca gttgccggtg aggtggttgt ccgcgaccgt gaggttgcgc tgctgcttct gcgggtgcgt caacggccac tccaccaaca ggcgctggca ctccaacgcg <...................putative secreted protein...................< v v f v g v c n g t l h n d a v t l n r 9841 aggcgccgga cggtgaggcc gatccggttg ccctccagcc ggttgtgcgc gacgagggtc tccgcggcct gccactccgg ctaggccaac gggaggtcgg ccaacacgcg ctgctcccag <...................putative secreted protein...................< l r r v t l g i r n g e l r n h a v l t 9901 gcgccgctgt ccgtggcgcc ctgctcggcc ttgacggtgt tcgcgaggaa caggcccgcg cgcggcgaca ggcaccgcgg gacgagccgg aactgccaca agcgctcctt gtccgggcgc <...................putative secreted protein...................< a g s d t a g q e a k v t n a l f l g a 9961 tcgccgttgt cccgggcggt gttcttccgg aacaccccgc gtaccgaacg ctcctgggcg agcggcaaca gggcccgcca caagaaggcc ttgtggggcg catggcttgc gaggacccgc <...................putative secreted protein...................< d g n d r a t n k r f v g r v s r e q a 10021 atgccccaca cgccgttctt ctcggcggtc acgtgccgca cggtcagccc gtcggtgtcc tacggggtgt gcggcaagaa gagccgccag tgcacggcgt gccagtcggg cagccacagg <...................putative secreted protein...................< i g w v g n k e a t v h r v t l g d t d 10081 tgggcgaaca ccccggaccc ggtgaagccg gtcacggtca gggcggcgag ggtcacgtcc acccgcttgt ggggcctggg ccacttcggc cagtgccagt cccgccgctc ccagtgcagg <...................putative secreted protein...................< q a f v g s g t f g t v t l a a l t v d 10141 tcgaccttgc ggtccttggt cccgatcaca cagatgccgt tgccgtcggc gcagccgccg agctggaacg ccaggaacca gggctagtgt gtctacggca acggcagccg cgtcggcggc <..putative secreted protein.<< e v k r d k t g i v 10201 gcggcttcgc cgcggccggg acgacgacgt gccgcggccc atgctgagaa ggtgaatcc cgccgaagcg gcgccggccc tgctgctgca cggcgccggg tacgactctt ccacttagg 386 Anhang 7.3.3 Sequenz des msn-Contigs 1 gttccgcggg gggccgtctg gtcctgaccc agatggtgga cgacggtgtg taccggtcgc caaggcgccc cccggcagac caggactggg tctaccacct gctgccacac atggccagcg >>..........msnH0............> m v d d g v y r s 61 agtttgtgac aggcacgagc aacggtggtc tgaccgctca tcctggcgga gaccggtggc tcaaacactg tccgtgctcg ttgccaccag actggcgagt aggaccgcct ctggccaccg >.............................msnH0.............................> q f v t g t s n g g l t a h p g g d r w 121 gctgggagag ccgtatcttc ggcggcgcgt acgacgacgc atcagctgac cagcgccccg cgaccctctc ggcatagaag ccgccgcgca tgctgctgcg tagtcgactg gtcgcggggc >.............................msnH0.............................> r w e s r i f g g a y d d a s a d q r p 181 tatatggcgc gttgaattac cgccgtgatc cggtcggtgg tgcaccgcgg ttcggctcct atataccgcg caacttaatg gcggcactag gccagccacc acgtggcgcc aagccgagga >.............................msnH0.............................> v y g a l n y r r d p v g g a p r f g s 241 cgtacttcag actcggcatc gagaccctca gtcgcaccac gctctgctac cccgacagtt gcatgaagtc tgagccgtag ctctgggagt cagcgtggtg cgagacgatg gggctgtcaa >.............................msnH0.............................> s y f r l g i e t l s r t t l c y p d s 301 ccaccgagcc ttccgacttc ggcacagccg accgctgctc gctcatcgag ctcgctgagg ggtggctcgg aaggctgaag ccgtgtcggc tggcgacgag cgagtagctc gagcgactcc >.............................msnH0.............................> s t e p s d f g t a d r c s l i e l a e 361 cggacaagtt ggatgccctg gacggtcaca tcgaggcaca gattcacgga ccggtcaggt gcctgttcaa cctacgggac ctgccagtgt agctccgtgt ctaagtgcct ggccagtcca >.............................msnH0.............................> a d k l d a l d g h i e a q i h g p v r 421 tcgactgtga cgtagaggcg ctggtgttgg atcccagcta tcgcggcaca gaggtcgaat agctgacact gcatctccgc gaccacaacc tagggtcgat agcgccgtgt ctccagctta >.............................msnH0.............................> f d c d v e a l v l d p s y r g t e v e 481 ccgcagctca ccgcctcccg tgcccgctcg aatggcatcc aggttttcgg ctcagcgtgg ggcgtcgagt ggcggagggc acgggcgagc ttaccgtagg tccaaaagcc gagtcgcacc >.............................msnH0.............................> s a a h r l p c p l e w h p g f r l s v 541 ctgaactgcg acgtcactca agctatcggg gacgggaata cgttgacctg ggtgctgaga gacttgacgc tgcagtgagt tcgatagccc ctgcccttat gcaactggac ccacgactct >.............................msnH0.............................> a e l r r h s s y r g r e y v d l g a e 601 tcgccgttga cgacctgctc acccccaaga tcatcgggga tgccgcccgc actggccgat agcggcaact gctggacgag tgggggttct agtagcccct acggcgggcg tgaccggcta >.............................msnH0.............................> i a v d d l l t p k i i g d a a r t g r Anhang 387 661 acggccttca ggacctcaag aaggtctggc actgcctggc ccgcttcgga gaacgcacca tgccggaagt cctggagttc ttccagaccg tgacggaccg ggcgaagcct cttgcgtggt >.............................msnH0.............................> y g l q d l k k v w h c l a r f g e r t 721 cctgctgatc agtagtacca cctcgagccg gactggacgc tggccaaggg attacctgat ggacgactag tcatcatggt ggagctcggc ctgacctgcg accggttccc taatggacta >.....>> msnH0 t c - 781 agggcgtcac tcggtagctc tgagggccgc gaggtagccg gcccagctgt cctgagccgg tcccgcagtg agccatcgag actcccggcg ctccatcggc cgggtcgaca ggactcggcc 841 gtctgtgtag cgaacggtgg aactcagtcg gttttgttca gcgtcgtccg gcggtgagcc cagacacatc gcttgccacc ttgagtcagc caaaacaagt cgcagcaggc cgccactcgg <<........msnT1.........< r r g a t l 901 ggccgtcgaa ggtgatgtcg aaggcttgga gtgcggcctt ccagcgcatg gtccagcgtt ccggcagctt ccactacagc ttccgaacct cacgccggaa ggtcgcgtac caggtcgcaa <.............................msnT1.............................< r g d f t i d f a q l a a k w r m t w r 961 tgcgtccggt gccggtcggg tccaggctca tgacggccag gtagacgcac ttgtgagcgg acgcaggcca cggccagccc aggtccgagt actgccggtc catctgcgtg aacactcgcc <.............................msnT1.............................< k r g t g t p d l s m v a l y v c k h a 1021 cctggtcggt gggaaagtgt ccccgggccc ggacggcctt gcggatccgc gcgttgatgc ggaccagcca ccctttcaca ggggcccggg cctgccggaa cgcctaggcg cgcaactacg <.............................msnT1.............................< a q d t p f h g r a r v a k r i r a n i 1081 tctcgatcgc gttcgtggtg cagacgatct tgcggatctc cacgtcgaac cggaggaaag agagctagcg caagcaccac gtctgctaga acgcctagag gtgcagcttg gcctcctttc <.............................msnT1.............................< s e i a n t t c v i k r i e v d f r l f 1141 gcacgaactc cgcccaggcc gcctcccaga gccggacgat cgccggatac ttcccgcccc cgtgcttgag gcgggtccgg cggagggtct cggcctgcta gcggcctatg aagggcgggg <.............................msnT1.............................< p v f e a w a a e w l r v i a p y k g g 1201 aggcgtcggt gaactccacg aaccgctcca gcgcggcctc ctcggtcggc gcggtgtaga tccgcagcca cttgaggtgc ttggcgaggt cgcgccggag gagccagccg cgccacatct <.............................msnT1.............................< w a d t f e v f r e l a a e e t p a t y 1261 cgggcctgag cgccttcgcg atcttctccc agtcctggcg cgccgcgtaa cggaagctgt gcccggactc gcggaagcgc tagaagaggg tcaggaccgc gcggcgcatt gccttcgaca <.............................msnT1.............................< v p r l a k a i k e w d q r a a y r f s 1321 tcctcagcag gtgaacgaca caggtctgga cgatcgtcgc aggccagacc gtattcacgg aggagtcgtc cacttgctgt gtccagacct gctagcagcg tccggtctgg cataagtgcc <.............................msnT1.............................< n r l l h v v c t q v i t a p w v t n v 388 Anhang 1381 cgtccgggag gccggtcagg ccgtcgcaga ccagcatcag gacatcggcc gcgccgcggt gcaggccctc cggccagtcc ggcagcgtct ggtcgtagtc ctgtagccgg cgcggcgcca <.............................msnT1.............................< a d p l g t l g d c v l m l v d a a g r 1441 tcttgacctc ggtcaggacc tggagccagt acttcgcgcc ctccccgccg tcgccgatcc agaactggag ccagtcctgg acctcggtca tgaagcgcgg gaggggcggc agcggctagg <.............................msnT1.............................< n k v e t l v q l w y k a g e g g d g i 1501 acaggcccag gatgtcccgg tgaccctcgg cggtgaccgc caccgccatg tagacaggcc tgtccgggtc ctacagggcc actgggagcc gccactggcg gtggcggtac atctgtccgg <.............................msnT1.............................< w l g l i d r h g e a t v a v a m y v p 1561 ggttggcaac ctgaccgtcc ctgaccttca cgttcacgca gtcgatgaag acgaccgggt ccaaccgttg gactggcagg gactggaagt gcaagtgcgt cagctacttc tgctggccca <.............................msnT1.............................< r n a v q g d r v k v n v c d i f v v p 1621 agacgctgtc caggggacgg ttctgccatt ccgtcatgcc ggccatcacg ctgtcggtga tctgcgacag gtcccctgcc aagacggtaa ggcagtacgg ccggtagtgc gacagccact <.............................msnT1.............................< y v s d l p r n q w e t m g a m v s d t 1681 tcgtggagat ggtggacttg gagatctccg cgccgtacac ctcggcgaga tgcgcggaga agcacctcta ccacctgaac ctctagaggc gcggcatgtg gagccgctct acgcgcctct <.............................msnT1.............................< i t s i t s k s i e a g y v e a l h a s 1741 tctccccgtg cgtcagccct ttcgccgaca gcgacaggac catctcgtcc accccgccca agaggggcac gcagtcggga aagcggctgt cgctgtcctg gtagagcagg tggggcgggt <.............................msnT1.............................< i e g h t l g k a s l s l v m e d v g g 1801 gacgccgctg ccgcttcttg accagctgcg gctcgaacga ccccgcccgg tcccgcggca ctgcggcgac ggcgaagaac tggtcgacgc cgagcttgct ggggcgggcc agggcgccgt <.............................msnT1.............................< l r r q r k k v l q p e f s g a r d r p 1861 ccgcgatctc gaccggcccc gactcggtga tcaccgtctt ggaccggtgc ccgttgcggt ggcgctagag ctggccgggg ctgagccact agtggcagaa cctggccacg ggcaacgcca <.............................msnT1.............................< v a i e v p g s e t i v t k s r h g n r 1921 agttctccct gccgccctcg gcccgctcac cgggctcgtg ccccagatga tccgtgagct tcaagaggga cggcgggagc cgggcgagtg gcccgagcac ggggtctact aggcactcga <.............................msnT1.............................< y n e r g g e a r e g p e h g l h d t l 1981 cgccctccag cgccgactcc agcacccgct tcgtcagctg ctgcagcagg ccgccctccc gcgggaggtc gcggctgagg tcgtgggcga agcagtcgac gacgtcgtcc ggcgggaggg <.............................msnT1.............................< e g e l a s e l v r k t l q q l l g g e 2041 cggtgagctt caccccaccg gcctgagccc gggcaaccaa ctcggcgacc agcccgtcat gccactcgaa gtggggtggc cggactcggg cccgttggtt gagccgctgg tcgggcagta <.............................msnT1.............................< g t l k v g g a q a r a v l e a v l g d Anhang 389 2101 ccacggcacc cgccccactc acaacggcct ccccggcccc gatatcactc gccacgtcag ggtgccgtgg gcggggtgag tgttgccgga ggggccgggg ctatagtgag cggtgcagtc <.............................msnT1.............................< d v a g a g s v v a e g a g i d s a v d 2161 tcatcaactg tcgcttccag ctcgggagtt acaccactca ccgtacagac cccccgtacc agtagttgac agcgaaggtc gagccctcaa tgtggtgagt ggcatgtctg gggggcatgg <.<< msnT1 t m 2221 tgcgtggctg gagcccgtac gagcccaaac gggcatgaca gaggggtgtg tttgaaggat acgcaccgac ctcgggcatg ctcgggtttg cccgtactgt ctccccacac aaacttccta 2281 cgtgtaagtc catgacgcga caggttggcc gggggctcgt cgatcaggtc ggtgttcggc gcacattcag gtactgcgct gtccaaccgg cccccgagca gctagtccag ccacaagccg 2341 ggcagcgctg ttggctgtcc aacaccgcct tcaccacacc cgagcacctc atccagacca ccgtcgcgac aaccgacagg ttgtggcgga agtggtgtgg gctcgtggag taggtctggt 2401 tctggcacgg tatgagaaag atccagtacc gtttccacct catcgacgga tgcctcaccg agaccgtgcc atactctttc taggtcatgg caaaggtgga gtagctgcct acggagtggc 2461 ggaccggact gtccctcgcc ccaacgactt agaggtccta acagaagttg ttgatcaagt cctggcctga cagggagcgg ggttgctgaa tctccaggat tgtcttcaac aactagttca 2521 gactttcggc ttgggtggtc gttggtcggg gcgtggggaa gcgtcagtcg cggccgtgga ctgaaagccg aacccaccag caaccagccc cgcacccctt cgcagtcagc gccggcacct >>....................msnT2......................> v v v g r g v g k r q s r p w 2581 tcgtgtcgga cgaactgtgg tcgctcatcg agccgttact gcccgagccg gggccgaagc agcacagcct gcttgacacc agcgagtagc tcggcaatga cgggctcggc cccggcttcg >.............................msnT2.............................> i v s d e l w s l i e p l l p e p g p k 2641 tggtggcggg ccggccgcgg gtgccggacc gacaggccct gtgcgggatc ctgtttgtgc accaccgccc ggccggcgcc cacggcctgg ctgtccggga cacgccctag gacaaacacg >.............................msnT2.............................> l v a g r p r v p d r q a l c g i l f v 2701 tgcacacggg catccagtgg gagtacctgc cccaggagct gggcttcggc tcgggcatga acgtgtgccc gtaggtcacc ctcatggacg gggtcctcga cccgaagccg agcccgtact >.............................msnT2.............................> l h t g i q w e y l p q e l g f g s g m 2761 cctgctggcg gcgcctggcc gcctggaacg aggccggtgt gtgggagaag ctgcacctgg ggacgaccgc cgcggaccgg cggaccttgc tccggccaca caccctcttc gacgtggacc >.............................msnT2.............................> t c w r r l a a w n e a g v w e k l h l 2821 tgctgctgaa gaagagcggt cggcgaagca gctggactgg tcgagggcgg tgatcgactc acgacgactt cttctcgcca gccgcttcgt cgacctgacc agctcccgcc actagctgag >.............................msnT2.............................> v l l k k s g r r s s w t g r g r - s t 2881 ctcccacgtg cgggcggccc gacggggccc aaaagcggtc ccagcccggt cgaccgcgca gagggtgcac gcccgccggg ctgccccggg ttttcgccag ggtcgggcca gctggcgcgt >.............................msnT2.............................> p p t c g r p d g a q k r s q p g r p r 390 Anhang 2941 cggccgggca gcaagcacca cgtccttgtc gacgggcagg gcatcccgct cgcggtgtcg gccggcccgt cgttcgtggt gcaggaacag ctgcccgtcc cgtagggcga gcgccacagc >.............................msnT2.............................> t a g q q a p r p c r r a g h p a r g v 3001 ctgaccggcg gcaatcgcaa tgacgtcact cagctgatcc cgctgctgga caagattcca gactggccgc cgttagcgtt actgcagtga gtcgactagg gcgacgacct gttctaaggt >.............................msnT2.............................> a d r r q s q - r h s a d p a a g q d s 3061 cccgtggccg gcacggtcgg gcggccgcgg agacggccgg acatgctctt cgcggaccgc gggcaccggc cgtgccagcc cgccggcgcc tctgccggcc tgtacgagaa gcgcctggcg >.............................msnT2.............................> t r g r h g r a a a e t a g h a l r g p 3121 ggctacgacc atgacaagta ccggcgacta ttgcggaaac gcggcatccg gcccgcgatc ccgatgctgg tactgttcat ggccgctgat aacgcctttg cgccgtaggc cgggcgctag >.............................msnT2.............................> r l r p - q v p a t i a e t r h p a r d 3181 gccgaacgga gccagccaca cggctccggc ctgggcatct tccgctgggt cgtcgagcgc cggcttgcct cggtcggtgt gccgaggccg gacccgtaga aggcgaccca gcagctcgcg >.............................msnT2.............................> r r t e p a t r l r p g h l p l g r r a 3241 accctctcct ggctccacgg cttccgccgc ctgcggcatc cgctgggaac gacgcgacga tgggagagga ccgaggtgcc gaaggcggcg gacgccgtag gcgacccttg ctgcgctgct >.............................msnT2.............................> h p l l a p r l p p p a a s a g n d a t 3301 catccatgaa gccttcctcg gcctcgccac ctgtctcatc acccaccgac acgtccaacg gtaggtactt cggaaggagc cggagcggtg gacagagtag tgggtggctg tgcaggttgc >.............................msnT2.............................> t s m k p s s a s p p v s s p t d t s n 3361 cctttgttag gacctcttaa tgagtcaagc tcaggaggtg gaggcgggtg ggaggaggcg ggaaacaatc ctggagaatt actcagttcg agtcctccac ctccgcccac cctcctccgc >.........msnT2........>> a f v r t s <<...........msnH1.............< - s t s a p p l l r 3421 gtccagaacg gcgtcgtgtt cttggaacac tacccgtccc acgttgcgca gttcgcgggc caggtcttgc cgcagcacaa gaaccttgtg atgggcaggg tgcaacgcgt caagcgcccg <.............................msnH1.............................< d l v a d h e q f v v r g v n r l e r a 3481 gagctgcagg tcgatgtttt cggcggggag cgggcccagt agcactgcgg acgggtgggt ctcgacgtcc agctacaaaa gccgcccctc gcccgggtca tcgtgacgcc tgcccaccca <.............................msnH1.............................< l q l d i n e a p l p g l l v a s p h t 3541 tccggcgtcg tggagtgtgg ccaggtccat ggcgacgagt ctggcgccgt acaggcgggc aggccgcagc acctcacacc ggtccaggta ccgctgctca gaccgcggca tgtccgcccg <.............................msnH1.............................< g a d h l t a l d m a v l r a g y l r a 3601 gacggtgtgt gcgatgccga gccctgggcc gtccatgtcg cctgcgtact gcagtgctac ctgccacaca cgctacggct cgggacccgg caggtacagc ggacgcatga cgtcacgatg <.............................msnH1.............................< v t h a i g l g p g d m d g a y q l a v Anhang 391 3661 gccctggtcg acggcgagtt ggagcagggc gtggtcgacg gcgcgcaact gtccgctggt cgggaccagc tgccgctcaa cctcgtcccg caccagctgc cgcgcgttga caggcgacca <.............................msnH1.............................< g q d v a l q l l a h d v a r l q g s t 3721 gcacgccagt ggagcggggt ggccgcgggc gagggcggct tcgaggacgg atggattctc cgtgcggtca cctcgcccca ccggcgcccg ctcccgccga agctcctgcc tacctaagag <.............................msnH1.............................< c a l p a p h g r a l a a e l v s p n e 3781 caccacggtg aggacctggg tcgggtccag atgcggggga gtgcgggtca ggtcgaacag gtggtgccac tcctggaccc agcccaggtc tacgccccct cacgcccagt ccagcttgtc <.............................msnH1.............................< v v t l v q t p d l h p p t r t l d f l 3841 gtgcagtgcg acgggcgcgg cggcgtcgcg taggcgccgg tcgaccggtc cgtcgccgat cacgtcacgc tgcccgcgcc gccgcagcgc atccgcggcc agctggccag gcagcggcta <.............................msnH1.............................< h l a v p a a a d r l r r d v p g d g i 3901 ggcctggacg tggtggagca gcacggtggc ggtgagccgg tcaggtatca ctccggtctg ccggacctgc accacctcgt cgtgccaccg ccactcggcc agtccatagt gaggccagac <.............................msnH1.............................< a q v h h l l v t a t l r d p i v g t q 3961 ctcgagcagg gctcggatcc ggtccggtcg tgtcggctct gcctgtccgg tcagttcggc gagctcgtcc cgagcctagg ccaggccagc acagccgaga cggacaggcc agtcaagccg <.............................msnH1.............................< e l l a r i r d p r t p e a q g t l e a 4021 gaccagtgtg acgagtcggc tgccggcgag ggtgtcgagg tcgaagaagt gggggtcgtc ctggtcacac tgctcagccg acggccgctc ccacagctcc agcttcttca cccccagcag <.............................msnH1.............................< v l t v l r s g a l t d l d f f h p d d 4081 ggcggtatcg tgggcgagtt tgggcagtga gaccggcggg tcggccggca gccgggtggc ccgccatagc acccgctcaa acccgtcact ctggccgccc agccggccgt cggcccaccg <.............................msnH1.............................< a t d h a l k p l s v p p d a p l r t a 4141 cacggcggtg agggcgtcga tcagcttgcg cacctctgtg ccttcgtcga cgccgatccc gtgccgccac tcccgcagct agtcgaacgc gtggagacac ggaagcagct gcggctaggg <.............................msnH1.............................< v a t l a d i l k r v e t g e d v g i g 4201 ggcggcgcgc atccgcgtga ccagccccgg atacgccggc agctgtgcgg ccgcgtactg ccgccgcgcg taggcgcact ggtcggggcc tatgcggccg tcgacacgcc ggcgcatgac <.............................msnH1.............................< a a r m r t v l g p y a p l q a a a y q 4261 ccacacatcc tggcgtagcg ccgtgtcgct cgtgcgctgc cgcgcgcggt tgaccaccgg ggtgtgtagg accgcatcgc ggcacagcga gcacgcgacg gcgcgcgcca actggtggcc <.............................msnH1.............................< w v d q r l a t d s t r q r a r n v v p 4321 ccgtcccaca gcctgttcca ccagtgccac caagtcctgc ggttccagcc gcagtacctc ggcagggtgt cggacaaggt ggtcacggtg gttcaggacg ccaaggtcgg cgtcatggag <.............................msnH1.............................< r g v a q e v l a v l d q p e l r l v e 392 Anhang 4381 gcgtagcgcg cgcaccggta ctcgcgcccc gcgggcgtct acgaccactg cggaggtgcc cgcatcgcgc gcgtggccat gagcgcgggg cgcccgcaga tgctggtgac gcctccacgg <.............................msnH1.............................< r l a r v p v r a g r a d v v v a s t g 4441 gcgccgcagc cgccccgcgt cgtccagcca cgcccgcaac gccgctaccc ccgccgacgg cgcggcgtcg gcggggcgca gcaggtcggt gcgggcgttg cggcgatggg ggcggctgcc <.............................msnH1.............................< r r l r g a d d l w a r l a a v g a s p 4501 cagaccggtc acccgcacac tcgccattgc tgccggatcc gtcccagcgc aaagccggtt gtctggccag tgggcgtgtg agcggtaacg acggcctagg cagggtcgcg tttcggccaa <.............................msnH1.............................< l g t v r v s a m a a p d t g a c l r n 4561 gtgcacggcg gcccacagcg gggctagtgc ctcatcggcc gcgacccatt cccatgccgt cacgtgccgc cgggtgtcgc cccgatcacg gagtagccgg cgctgggtaa gggtacggca <.............................msnH1.............................< h v a a w l p a l a e d a a v w e w a t 4621 gtccatcagc cggccgtccc gccgtcgaag cccaggccga ggtctagcgt cagtggctgt caggtagtcg gccggcaggg cggcagcttc gggtccggct ccagatcgca gtcaccgaca <...<< msnH1 d m <<.........................msnH2...........................< g a t g g d f g l g l d l t l p q 4681 gcttccccgt ggccctgcca cagccacggc accgtcacgc ggtgcttccc gctggtgatg cgaaggggca ccgggacggt gtcggtgccg tggcagtgcg ccacgaaggg cgaccactac <.............................msnH2.............................< a e g h g q w l w p v t v r h k g s t i 4741 acctggtgga tgacgacctg cccggcctct ttcttgatca ccggcgtcat cgagggagcg tggaccacct actgctggac gggccggaga aagaactagt ggccgcagta gctccctcgc <.............................msnH2.............................< v q h i v v q g a e k k i v p t m s p a 4801 gtcgccagca catcgaactc ccaccggcgc agcagtccca gcatctgccg aaggttcgcg cagcggtcgt gtagcttgag ggtggccgcg tcgtcagggt cgtagacggc ttccaagcgc <.............................msnH2.............................< t a l v d f e w r r l l g l m q r l n a 4861 tcgtcgaacg ccgcgtccag ttcgtcgatc gacagcagcc gcggcccgcg gtactccccg agcagcttgc ggcgcaggtc aagcagctag ctgtcgtcgg cgccgggcgc catgaggggc <.............................msnH2.............................< d d f a a d l e d i s l l r p g r y e g 4921 ctgtacatcg accacgcggc cgccaggagg ggcagcatcg tggccaggcg tcgttccccg gacatgtagc tggtgcgccg gcggtcctcc ccgtcgtagc accggtccgc agcaaggggc <.............................msnH2.............................< s y m s w a a a l l p l m t a l r r e g 4981 gtcgacagcg tctccagcgg gttcatgccg cgcggcttga cctccttgaa gcggtcaccg cagctgtcgc agaggtcgcc caagtacggc gcgccgaact ggaggaactt cgccagtggc <.............................msnH2.............................< t s l t e l p n m g r p k v e k f r d g 5041 tccccgtcgc tgaacgagga gtgggtcacc gagatcttcc actcgtgcca ggcccggtag aggggcagcg acttgctcct cacccagtgg ctctagaagg tgagcacggt ccgggccatc <.............................msnH2.............................< d g d s f s s h t v s i k w e h w a r y Anhang 393 5101 tcgaaggtgt gcgcgaccct gtccgcccac gtgtctccga cggactcgtc cattcgctgc agcttccaca cgcgctggga caggcgggtg cacagaggct gcctgagcag gtaagcgacg <.............................msnH2.............................< d f t h a v r d a w t d g v s e d m r q 5161 cgtagcacgt catacatccg ctcgaacatc tcgtccgagg ggggactttt caccagttcc gcatcgtgca gtatgtaggc gagcttgtag agcaggctcc cccctgaaaa gtggtcaagg <.............................msnH2.............................< r l v d y m r e f m e d s p p s k v l e 5221 accatggcct tcgcgtccgc gtccgtgcgc accgcccact cgaccttcac gcccacccgg tggtaccgga agcgcaggcg caggcacgcg tggcgggtga gctggaagtg cgggtgggcc <.............................msnH2.............................< v m a k a d a d t r v a w e v k v g v r 5281 gccaccccgg tacgcacgtc cttcaaggtc tggccgatct gccggaccag ttgttgcgcg cggtggggcc atgcgtgcag gaagttccag accggctaga cggcctggtc aacaacgcgc <.............................msnH2.............................< a v g t r v d k l t q g i q r v l q q a 5341 agatcctggc ggacctgaac gtcgcgctgt agttgggcga acatgctggt cttgatggct tctaggaccg cctggacttg cagcgcgaca tcaacccgct tgtacgacca gaactaccga <.............................msnH2.............................< l d q r v q v d r q l q a f m s t k i a 5401 ttcttgatgt cggcgcgcag gtcttgctcc agctgggcga ctgccgcgcg cagcgcctcc aagaactaca gccgcgcgtc cagaacgagg tcgacccgct gacggcgcgc gtcgcggagg <.............................msnH2.............................< k k i d a r l d q e l q a v a a r l a e 5461 actgctgtgc gcaggtcctg gccgcgggcg gcggccgggt cggcgacctc ggcacgctgc tgacgacacg cgtccaggac cggcgcccgc cgccggccca gccgctggag ccgtgcgacg <.............................msnH2.............................< v a t r l d q g r a a a p d a v e a r q 5521 caaccggtgc ccgatatgtt ggtgaggatg acctggcggt tgaaccgggc cagtgcgctg gttggccacg ggctatacaa ccactcctac tggaccgcca acttggcccg gtcacgcgac <.............................msnH2.............................< w g t g s i n t l i v q r n f r a l a s 5581 ttggcggtgc gggcggcgcc ttcgagggtc ttcagcgcag cgtcccgggc ccgggacgct aaccgccacg cccgccgcgg aagctcccag aagtcgcgtc gcagggcccg ggccctgcga <.............................msnH2.............................< n a t r a a g e l t k l a a d r a r s a 5641 gcggcgagcc ggtccgcccc cactcccgtg cctggcccgg tgtggcggtc ggccagcagg cgccgctcgg ccaggcgggg gtgagggcac ggaccgggcc acaccgccag ccggtcgtcc <.............................msnH2.............................< a a l r d a g v g t g p g t h r d a l l 5701 tgcctggccc aggccagtcc cgcggtcagg ttcgcgggcc ggccctccgg cccggtggag acggaccggg tccggtcagg gcgccagtcc aagcgcccgg ccgggaggcc gggccacctc <.............................msnH2.............................< h r a w a l g a t l n a p r g e p g t s 5761 atgccctcgt cgaccagggc caggccctcg tcgacgagtc ggcccaaccg ggtaaggcag tacgggagca gctggtcccg gtccgggagc agctgctcag ccgggttggc ccattccgtc <.............................msnH2.............................< i g e d v l a l g e d v l r g l r t l c 394 Anhang 5821 gcatcgcggt gctcctcggc cgcctggcgc agcggcgcga cctcatccag ccgcgcccgg cgtagcgcca cgaggagccg gcggaccgcg tcgccgcgct ggagtaggtc ggcgcgggcc <.............................msnH2.............................< a d r h e e a a q r l p a v e d l r a r 5881 gccgacgctg cgtcagcagc ggcctcttcc ttggcgcgtt gcagctcctc cacccgtgcc cggctgcgac gcagtcgtcg ccggagaagg aaccgcgcaa cgtcgaggag gtgggcacgg <.............................msnH2.............................< a s a a d a a a e e k a r q l e e v r a 5941 cgggcgcggt tgagcgcacc ggtgacctcc tgcagcgagg cgcgcagctc ctcgtactcg gcccgcgcca actcgcgtgg ccactggagg acgtcgctcc gcgcgtcgag gagcatgagc <.............................msnH2.............................< r a r n l a g t v e q l s a r l e e y e 6001 gcgccgtgca ggcgccgcat ctcctcgaca gccgccttct cgcgccccgc gtccacggcg cgcggcacgt ccgcggcgta gaggagctgt cggcggaaga gcgcggggcg caggtgccgc <.............................msnH2.............................< a g h l r r m e e v a a k e r g a d v a 6061 gtttgctctg cctcccgggc ggcgtcggcc gccagggtcc gccagcgttc ggcggttgcc caaacgagac ggagggcccg ccgcagccgg cggtcccagg cggtcgcaag ccgccaacgg <.............................msnH2.............................< t q e a e r a a d a a l t r w r e a t a 6121 gcgtcctggc gtgcccgtcc cgcgaggtcg atcacccgcc ctgcggcgcc ccgccaggcc cgcaggaccg cacgggcagg gcgctccagc tagtgggcgg gacgccgcgg ggcggtccgg <.............................msnH2.............................< a d q r a r g a l d i v r g a a g r w a 6181 tcgacctgcc ggaacatcaa ggtggtgtcc tcgcggtggg cgtcggccgc cttcggatcc agctggacgg ccttgtagtt ccaccacagg agcgccaccc gcagccggcg gaagcctagg <.............................msnH2.............................< e v q r f m l t t d e r h a d a a k p d 6241 gtgggcaaca cggtgccgcc gcccgcgtcg gctgcccggt tcaacgcccg cagcgcctga cacccgttgt gccacggcgg cgggcgcagc cgacgggcca agttgcgggc gtcgcggact <.............................msnH2.............................< t p l v t g g g a d a a r n l a r l a q 6301 cgcacggcct cgccggcccg gcggtgccgc tcgcgtgcat cggccgtgcg cctgatggag gcgtgccgga gcggccgggc cgccacggcg agcgcacgta gccggcacgc ggactacctc <.............................msnH2.............................< r v a e g a r r h r e r a d a t r r i s 6361 tgctgcagct gctcgctcgc gtcgtcctcc tgctgctggg ccgagaagac ctgatccagc acgacgtcga cgagcgagcg cagcaggagg acgacgaccc ggctcttctg gactaggtcg <.............................msnH2.............................< h q l q e s a d d e q q q a s f v q d l 6421 ggcgggaaac cggcctgctc ggcatcggcg tgggcctggg cgtccttcgc ctgctcccac ccgccctttg gccggacgag ccgtagccgc acccggaccc gcaggaagcg gacgagggtg <.............................msnH2.............................< p p f g a q e a d a h a q a d k a q e w 6481 acggcgtggc tggcggctgc ggtcccggcc gtctcgcgcg ccgtgccttc agccgttcgg tgccgcaccg accgccgacg ccagggccgg cagagcgcgc ggcacggaag tcggcaagcc <.............................msnH2.............................< v a h s a a a t g a t e r a t g e a t r Anhang 395 6541 gctgcggcca gtgccgtggc cgccacctgt tcagtgtgcc gtgcctcctg ggccagcagc cgacgccggt cacggcaccg gcggtggaca agtcacacgg cacggaggac ccggtcgtcg <.............................msnH2.............................< a a a l a t a a v q e t h r a e q a l l 6601 tccagcgcgg tgcggcgccg cgcggcagcc gcgtccaggg cgtgtagtgc ctgcgccagc aggtcgcgcc acgccgcggc gcgccgtcgg cgcaggtccc gcacatcacg gacgcggtcg <.............................msnH2.............................< e l a t r r r a a a a d l a h l a q a l 6661 ccgcgttcgg ccaggcggat gtcctgagcg gaccggttgc gggtctcctg cagcgtcttg ggcgcaagcc ggtccgccta caggactcgc ctggccaacg cccagaggac gtcgcagaac <.............................msnH2.............................< g r e a l r i d q a s r n r t e q l t k 6721 agaaggccct gccacctctc gcgggcctgc tcccacccgg tgggggaggg gaaccggtcc tcttccggga cggtggagag cgcccggacg agggtgggcc accccctccc cttggccagg <.............................msnH2.............................< l l g q w r e r a q e w g t p s p f r d 6781 cgctccatcg cggcggcgtt cacccgggcg cgagagtgcg cagtctcctc gcgagcccgg gcgaggtagc gccgccgcaa gtgggcccgc gctctcacgc gtcagaggag cgctcgggcc <.............................msnH2.............................< r e m a a a n v r a r s h a t e e r a r 6841 tgcaatgtcc cctgcgcctg gtcgagttgc tgctccaggt cggctacgtg ccggagccgg acgttacagg ggacgcggac cagctcaacg acgaggtcca gccgatgcac ggcctcggcc <.............................msnH2.............................< h l t g q a q d l q q e l d a v h r l r 6901 gcgcgttcgc gggcacttcg cccgatgaac cgcgcctggt agccggccgg tgcgaccgcg cgcgcaagcg cccgtgaagc gggctacttg gcgcggacca tcggccggcc acgctggcgc <.............................msnH2.............................< a r e r a s r g i f r a q y g a p a v a 6961 gtcgccaccg cgatcgtgac ctgatcgccc gccgacgggt ccaggggaat cgaccgcagc cagcggtggc gctagcactg gactagcggg cggctgccca ggtcccctta gctggcgtcg <.............................msnH2.............................< t a v a i t v q d g a s p d l p i s r l 7021 agctggtgga cccgctcggg ggcgatccgg ccctgcgcgt cgggccgaag tacgtccgcc tcgaccacct gggcgagccc ccgctaggcc gggacgcgca gcccggcttc atgcaggcgg <.............................msnH2.............................< l q h v r e p a i r g q a d p r l v d a 7081 agactcgccc ccgacgccgc cgcagctcca gggcgcaggg tcacatcccc tgccaccgcc tctgagcggg ggctgcggcg gcgtcgaggt cccgcgtccc agtgtagggg acggtggcgg <...........................msnH2..........................<< l s a g s a a a a g p r l t v d g a v 7141 tgtccgtcgg cacggaccag tgcgtccagc aggccactga ccagcagagc accctcgagg acaggcagcc gtgcctggtc acgcaggtcg tccggtgact ggtcgtctcg tgggagctcc 7201 cgatccgccg ggtgaaattc ggcaggccga agacagacca gaggtgcact tcgcccacgc gctaggcggc ccactttaag ccgtccggct tctgtctggt ctccacgtga agcgggtgcg 7261 ccgcaatccc gtcggccgtt accagcgcga gaacggcaac agtcatgtgg agatccgctc ggcgttaggg cagccggcaa tggtcgcgct cttgccgttg tcagtacacc tctaggcgag 7321 ggtgggggag tggttcgacg ccgacagcga cgttcggcac tggccctttt tggctcagct ccaccccctc accaagctgc ggctgtcgct gcaagccgtg accgggaaaa accgagtcga 396 Anhang 7381 ggacgagagt caggtgtgcc gctggtcgac ggctgaggcg agccagtcca tggcctgcat cctgctctca gtccacacgg cgaccagctg ccgactccgc tcggtcaggt accggacgta 7441 cgcggtgacg acaagtcggc ttgcgttgaa atgtgttggt gtcttgagcc ggtgagccat gcgccactgc tgttcagccg aacgcaactt tacacaacca cagaactcgg ccactcggta 7501 tctgttgcgc gcggcgaagt gcggtgttgg ctgcgccgct tcaaccgtgc cggactggag agacaacgcg cgccgcttca cgccacaacc gacgcggcga agttggcacg gcctgacctc 7561 ggtttggagg atctgggcgg gcagggccgt aagcgccgga tcgccgaggc cgagcggttt ccaaacctcc tagacccgcc cgtcccggca ttcgcggcct agcggctccg gctcgccaaa 7621 tggccattga cctggtcaaa caggtgccgc cgggcaggct gtaggtgcag cccggcgggg accggtaact ggaccagttt gtccacggcg gcccgtccga catccacgtc gggccgcccc 7681 atctgtgggc ggccgagtgg acctgactgc ctggccgccc aggccgggca gttgggtatc tagacacccg ccggctcacc tggactgacg gaccggcggg tccggcccgt caacccatag 7741 gaggtcggcc gctcccaggt gtgcaggatg ctgatcgccg aggatggggg ctggcggtgt ctccagccgg cgagggtcca cacgtcctac gactagcggc tcctaccccc gaccgccaca 7801 acccagatcg ccaacgacag gggaatgctc cgtcggtcag ttcgtctcgg gctgaacggc tgggtctagc ggttgctgtc cccttacgag gcagccagtc aagcagagcc cgacttgccg <<........msnH3..........< n t e p q v a 7861 ggccggggtc gttgcgggtg tggtcggttc cgggctgttg ctggtgtagt agacggagtt ccggccccag caacgcccac accagccaag gcccgacaac gaccacatca tctgcctcaa <.............................msnH3.............................< a p t t a p t t p e p s n s t y y v s n 7921 gccttgcttg gtgcgctggg catggctctt ggcgacgagt ccttcgactg tggtgcgtac cggaacgaac cacgcgaccc gtaccgagaa ccgctgctca ggaagctgac accacgcatg <.............................msnH3.............................< g q k t r q a h s k a v l g e v t t r v 7981 gacggtggtc ttgatggtgc ggtcggggtg ggcctggccg agtgcggtgg cgatttccgc ctgccaccag aactaccacg ccagccccac ccggaccggc tcacgccacc gctaaaggcg <.............................msnH3.............................< v t t k i t r d p h a q g l a t a i e a 8041 tgcggagcgg ggttcgctct gatcggcgag gtggcggcgg atcaaatcga cgagggtggg acgcctcgcc ccaagcgaga ctagccgctc caccgccgcc tagtttagct gctcccaccc <.............................msnH3.............................< a s r p e s q d a l h r r i l d v l t p 8101 ctgggccgcc ttcgcggccg tcgtcttggc tgtggcctcg ggcttcttgg cggccggctt gacccggcgg aagcgccggc agcagaaccg acaccggagc ccgaagaacc gccggccgaa <.............................msnH3.............................< q a a k a a t t k a t a e p k k a a p k 8161 cttgaccgcc tcgccgcctt gcgcggcggc agtcttcttg gcccgtaccc gcttgcttgc gaactggcgg agcggcggaa cgcgccgccg tcagaagaac cgggcatggg cgaacgaacg <.............................msnH3.............................< k v a e g g q a a a t k k a r v r k s a 8221 accgggctgc ggggtggtct tctgtcgcgg taccgagggc gttgccgcgg cttcgggggc tggcccgacg ccccaccaga agacagcgcc atggctcccg caacggcgcc gaagcccccg <.............................msnH3.............................< g p q p t t k q r p v s p t a a a e p a Anhang 397 8281 aggctgcgcg gcggtgtctg tggcgccaag tgccttttgc atgctcgtca gcacggtgtg tccgacgcgc cgccacagac accgcggttc acggaaaacg tacgagcagt cgtgccacac <.............................msnH3.............................< p q a a t d t a g l a k q m s t l v t h 8341 gtcgtgttgc agggcgagca gttgttcctg cagcgcgttg atttccgcgc cgatgcggtc cagcacaacg tcccgctcgt caacaaggac gtcgcgcaac taaaggcgcg gctacgccag <.............................msnH3.............................< d h q l a l l q e q l a n i e a g i r d 8401 ctgctccttg gcattgcgtt caaggtcgct tgccacctgg gccgtgtatt gcgatgtcag gacgaggaac cgtaacgcaa gttccagcga acggtggacc cggcacataa cgctacagtc <.............................msnH3.............................< q e k a n r e l d s a v q a t y q s t l 8461 ttcggtagtg gcggtctggg tgtcaggcat gatgctggtg tcggttattc gtacagttga aagccatcac cgccagaccc acagtccgta ctacgaccac agccaataag catgtcaact <............msnH3............<< e t t a t q t d p m 8521 gacacattta tcgcaatgac ctgcaacatc tcgactgtgc tcatagaaac tgaggttgag ctgtgtaaat agcgttactg gacgttgtag agctgacacg agtatctttg actccaactc 8581 tcggctgtgt gactgaactg ctctgatgag gtgcagaggc tcctgaggct ctcggcggca agccgacaca ctgacttgac gagactactc cacgtctccg aggactccga gagccgccgt 8641 ggcctgtgac ctggagtgcc tcatgtctat caagaatgtc tcaactttac ggataatttc ccggacactg gacctcacgg agtacagata gttcttacag agttgaaatg cctattaaag 8701 ttgagattag ggtcctgggg gtgcggagaa gtcgatcttg gtttggggat ggtgagccgt aactctaatc ccaggacccc cacgcctctt cagctagaac caaaccccta ccactcggca 8761 cgaagaagag ggacgagctg gcgttcgtca aagtgcaccg cagtgggtgc ctctgcgcct gcttcttctc cctgctcgac cgcaagcagt ttcacgtggc gtcacccacg gagacgcgga 8821 ccgtaaccga gggtggcgtc ccagatttgg tggcggccat gcacgaccgt cctgctggcg ggcattggct cccaccgcag ggtctaaacc accgccggta cgtgctggca ggacgaccgc 8881 ctgtcagttc tagggtggct gcggcagttg gccccgtgcc agggagagca cgatggtcta gacagtcaag atcccaccga cgccgtcaac cggggcacgg tccctctcgt gctaccagat 8941 tgccggatgg gtcatcgcgg cgtcggctgc atgcgcaggg ccgaaggtgt gaggcgaccg acggcctacc cagtagcgcc gcagccgacg tacgcgtccc ggcttccaca ctccgctggc 9001 atgggcagca cggcgacgac gaccagtcgg ggcacctcgg tggtgctgcg cgcatgggta tacccgtcgt gccgctgctg ctggtcagcc ccgtggagcc accacgacgc gcgtacccat 9061 gtgatccaga tgcggtcatc gaagtcggag tagccgccct ggtcgttgct gtggtcgccg cactaggtct acgccagtag cttcagcctc atcggcggga ccagcaacga caccagcggc 9121 atgaccagca tgccgaacgg cggtccggtg gcggtgtagt tggcggcctg cgcgaggtcg tactggtcgt acggcttgcc gccaggccac cgccacatca accgccggac gcgctccagc 9181 gggctggtgc cggtgggcga tgcctgggcc accaccaacc ccctgttcgg cctgggcatg cccgaccacg gccacccgct acggacccgg tggtggttgg gggacaagcc ggacccgtac >>.........................msnH4..........................> v p v g d a w a t t n p l f g l g m 398 Anhang 9241 acgacggggt ttcagcaggg cgtactcctc cgcgatcagc tgcgcaagac gggcacggac tgctgcccca aagtcgtccc gcatgaggag gcgctagtcg acgcgttctg cccgtgcctg >.............................msnH4.............................> t t g f q q g v l l r d q l r k t g t d 9301 gaccctgccg agttctcgct ctcgtacggc cgggcgaccg aggagaactt cgggccgatg ctgggacggc tcaagagcga gagcatgccg gcccgctggc tcctcttgaa gcccggctac >.............................msnH4.............................> d p a e f s l s y g r a t e e n f g p m 9361 tgggacaacg cggaggcctg ggaccgacac cggctcgccg agatcgacga ggagatgcgg accctgttgc gcctccggac cctggctgtg gccgagcggc tctagctgct cctctacgcc >.............................msnH4.............................> w d n a e a w d r h r l a e i d e e m r 9421 ggccgaacgt acaccacgga cgacgagagc tggcagctgg gtattaccct ggacgccgtc ccggcttgca tgtggtgcct gctgctctcg accgtcgacc cataatggga cctgcggcag >.............................msnH4.............................> g r t y t t d d e s w q l g i t l d a v 9481 cggctgcgcg acccccgagt cctgcgcgcc gtgtgggacg tcgcctgcac ctacctcacc gccgacgcgc tgggggctca ggacgcgcgg cacaccctgc agcggacgtg gatggagtgg >.............................msnH4.............................> r l r d p r v l r a v w d v a c t y l t 9541 gccgacgagg tgttcgtccg gtccggcctg atcgaacgcg tcgtacaact gggagcaggc cggctgctcc acaagcaggc caggccggac tagcttgcgc agcatgttga ccctcgtccg >.............................msnH4.............................> a d e v f v r s g l i e r v v q l g a g 9601 ctcccgcgct acaccgcacc cggcccgcac cgcaccgaac tgctgacggc gctgggtgtg gagggcgcga tgtggcgtgg gccgggcgtg gcgtggcttg acgactgccg cgacccacac >.............................msnH4.............................> l p r y t a p g p h r t e l l t a l g v 9661 tccaagaagc gctgaaccgc cgcctcgcgg acgccggtgt cgaacgggac gcdmmgskcs aggttcttcg cgacttggcg gcggagcgcc tgcggccaca gcttgccctg cghkkcsmgs >....msnH4....>> s k k r - 9721 gscbgdcgcg ctccggtgaa cagagcggcg ctcttggtct ccagccacgg gccgtcgggc csgvchgcgc gaggccactt gtctcgccgc gagaaccaga ggtcggtgcc cggcagcccg 9781 ttcacgcgcc ggtcgcggcg ccgctccccg gtgttcgccg cgccgcagcg gcccgtgcga aagtgcgcgg ccagcgccgc ggcgaggggc cacaagcggc gcggcgtcgc cgggcacgct 9841 gcggccgtgt tcccaggccg ccgggacgac atgatcgacg ccgacgccct cgggccaggg cgccggcaca agggtccggc ggccctgctg tactagctgc ggctgcggga gcccggtccc 9901 tcagtcggag ccggacggag aacgcccgcc acggcaggtc gatccgtcct cctcgccatg agtcagcctc ggcctgcctc ttgcgggcgg tgccgtccag ctaggcagga ggagcggtac 9961 ggttgcccct cacccggccg gtacaccact ccgcggacgt gacagaccct gcggcggacc ccaacgggga gtgggccggc catgtggtga ggcgcctgca ctgtctggga cgccgcctgg 10021 cgtctccggg gcgtttcacc tcaccaccgc aaacccccgc tcacctccag cacatgcccg gcagaggccc cgcaaagtgg agtggtggcg tttgggggcg agtggaggtc gtgtacgggc <<.................msnO1..................< - w r l g g s v e l v h g Anhang 399 10081 ttgacgtacc ggctgtcgga gctggccagg aacaccgccg cgtccgccac ctcctccggc aactgcatgg ccgacagcct cgaccggtcc ttgtggcggc gcaggcggtg gaggaggccg <.............................msnO1.............................< n v y r s d s s a l f v a a d a v e e p 10141 ttccccatgc gccccatggc gagcttggcc gcgtagtggg gccagatctt cttgttgcgg aaggggtacg cggggtaccg ctcgaaccgg cgcatcaccc cggtctagaa gaacaacgcc <.............................msnO1.............................< k g m r g m a l k a a y h p w i k k n r 10201 ggcagcaggc tgcccatgcc ggagtcgatg aggcccgggg agagacagtt gacggtgatg ccgtcgtccg acgggtacgg cctcagctac tccgggcccc tctctgtcaa ctgccactac <.............................msnO1.............................< p l l s g m g s d i l g p s l c n v t i 10261 ttgcgggggg cgagttcggc ggcgcagacg cgggtgaacg cctcgacggc ggccttcgag aacgcccccc gctcaagccg ccgcgtctgc gcccacttgc ggagctgccg ccggaagctc <.............................msnO1.............................< n r p a l e a a c v r t f a e v a a k s 10321 gaactgtaga ccgatgcccc gggcgtcacc tgcccggcca ggacggagga catggtgatg cttgacatct ggctacgggg cccgcagtgg acgggccggt cctgcctcct gtaccactac <.............................msnO1.............................< s s y v s a g p t v q g a l v s s m t i 10381 agccgggcgt gctcgctgcg ctccaggtag ggcacggcgg cctggacgca gcggaagaca tcggcccgca cgagcgacgc gaggtccatc ccgtgccgcc ggacctgcgt cgccttctgt <.............................msnO1.............................< l r a h e s r e l y p v a a q v c r f v 10441 ccggtgaggt tggtgccgat cacctcgtcc cacgcctcct ccggcagagt ggcggcgggg ggccactcca accacggcta gtggagcagg gtgcggagga ggccgtctca ccgccgcccc <.............................msnO1.............................< g t l n t g i v e d w a e e p l t a a p 10501 cccgggcggc tgaccccggc gttggccacg acgatgtcga cgccgcccag gtggaggtcg gggcccgccg actggggccg caaccggtgc tgctacagct gcggcgggtc cacctccagc <.............................msnO1.............................< g p r s v g a n a v v i d v g g l h l d 10561 gcgtactcca tgagggcgtc gacggaggca cggtcctgga cgtcgacgga gtggaagagg cgcatgaggt actcccgcag ctgcctccgt gccaggacct gcagctgcct caccttctcc <.............................msnO1.............................< a y e m l a d v s a r d q v d v s h f l 10621 tatttgcccg gcccgatgga catctcccac tccgcgtgat cggcgttgcg ggccgccgcg ataaacgggc cgggctacct gtagagggtg aggcgcacta gccgcaacgc ccggcggcgc <.............................msnO1.............................< y k g p g i s m e w e a h d a n r a a a 10681 accacgtcgc agccctcccg gatgaacgcc tgggtgatgg cccggccgag ccccttcgtc tggtgcagcg tcgggagggc ctacttgcgg acccactacc gggccggctc ggggaagcag <.............................msnO1.............................< v v d c g e r i f a q t i a r g l g k t 10741 ccgccggtca ctacggcctt gcggccggcc agcctcgttg tgggcacgcc gcccccttct ggcggccagt gatgccggaa cgccggccgg tcggagcaac acccgtgcgg cgggggaaga <......................msnO1.....................<< g g t v v a k r g a l r t t p v 400 Anhang 10801 tcgtcgtagg cgaatccgat tcccggttcc ggtgcgggct cgtacagcag gccccgctcg agcagcatcc gcttaggcta agggccaagg ccacgcccga gcatgtcgtc cggggcgagc 10861 acgaggccct gcaccaggcc ccagtggacg aggtcgccca gtccgagtgc tctcatgacg tgctccggga cgtggtccgg ggtcacctgc tccagcgggt caggctcacg agagtactgc 10921 gcctcctggt tagaactcgc gagaacccgc gagaggccgt gctcatgcga agcggggcag cggaggacca atcttgagcg ctcttgggcg ctctccggca cgagtacgct tcgccccgtc <<.....msnO2......< - a f r p l 10981 cacgtgctcc gcgaagagtt cgagggtgcg gacggactcc tcgaacggca tgttcccgga gtgcacgagg cgcttctcaa gctcccacgc ctgcctgagg agcttgccgt acaagggcct <.............................msnO2.............................< v h e a f l e l t r v s e e f p m n g s 11041 gacgatctgg agactgatgg tggtctcgcc gtagaggtcg cggatgagtt ccacgcggtc ctgctagacc tctgactacc accagagcgg catctccagc gcctactcaa ggtgcgccag <.............................msnO2.............................< v i q l s i t t e g y l d r i l e v r d 11101 cgcgacctcc tgcggatcgc ccacgagcac cttgttgtcc cgcagctgct tgccgaagtc gcgctggagg acgcctagcg ggtgctcgtg gaacaacagg gcgtcgacga acggcttcag <.............................msnO2.............................< a v e q p d g v l v k n d r l q k g f d 11161 gccgctgttg acccgggcca cgatccgctc gtagcccgcg tagtcggcgc tgcggttgtg cggcgacaac tgggcccggt gctaggcgag catcgggcgc atcagccgcg acgccaacac <.............................msnO2.............................< g s n v r a v i r e y g a y d a s r n h 11221 ctgccaggag gacacggccg cggcgagcag ccggttggtg cgctccgagt agacctggcc gacggtcctc ctgtgccggc gccgctcgtc ggccaaccac gcgaggctca tctggaccgg <.............................msnO2.............................< q w s s v a a a l l r n t r e s y v q g 11281 gaggcggtgc gccttatcac ggtcctcggc gaggtagcag ttgtagctga agtggatgtc ctccgccacg cggaatagtg ccaggagccg ctccatcgtc aacatcgact tcacctacag <.............................msnO2.............................< l r h a k d r d e a l y c n y s f h i d 11341 ctcgtcggtc gacgcgaggc cggccgccgt ccgggtgtcc cggtagcggg cgagcatctc gagcagccag ctgcgctccg gccggcggca ggcccacagg gccatcgccc gctcgtagag <.............................msnO2.............................< e d t s a l g a a t r t d r y r a l m e 11401 ctggagcttc tcctgcttgt tgatcgacgg gaccatcatc acgccgtgac cggccgcgcc gacctcgaag aggacgaaca actagctgcc ctggtagtag tgcggcactg gccggcgcgg <.............................msnO2.............................< q l k e q k n i s p v m m v g h g a a g 11461 cgccgcctcg ccggactcgg gggtgatggc cgtcgccacc aggacccggg ggtgcgggga gcggcggagc ggcctgagcc cccactaccg gcagcggtgg tcctgggccc ccacgcccct <.............................msnO2.............................< a a e g s e p t i a t a v l v r p h p s 11521 ctggaacggg cggggcagca gggtcaacgg gccgaaggag tggaagcggc cctcgaacgt gaccttgccc gccccgtcgt cccagttgcc cggcttcctc accttcgccg ggagcttgca <.............................msnO2.............................< q f p r p l l t l p g f s h f r g e f t Anhang 401 11581 ggtctcctcc tcggtccaca gccgcaggca ggactccacg ccctcgttaa agcgagcccg ccagaggagg agccaggtgt cggcgtccgt cctgaggtgc gggagcaatt tcgctcgggc <.............................msnO2.............................< t e e e t w l r l c s e v g e n f r a r 11641 gctctcgtcc atcgggatct ggtacgccca gaactcctcg ggcagaaaac cccggccgaa cgagagcagg tagccctaga ccatgcgggt cttgaggagc ccgtcttttg gggccggctt <.............................msnO2.............................< s e d m p i q y a w f e e p l f g r g f 11701 gccgacatcg aggcggccgt gcgacaggtg gtccagcatg gcgagcttgc cggccagttt cggctgtagc tccgccggca cgctgtccac caggtcgtac cgctcgaacg gccggtcaaa <.............................msnO2.............................< g v d l r g h s l h d l m a l k g a l k 11761 gaccgggtgg ctgaacgcgg gaagcgccgc gccggtgatc agccgcaccc ggctggtgcg ctggcccacc gacttgcgcc cttcgcggcg cggccactag tcggcgtggg ccgaccacgc <.............................msnO2.............................< v p h s f a p l a a g t i l r v r s t r 11821 ggcggccgcc gccgcgagga aggtgaccgg gtcggggctg tagccgccgt acgcggagaa ccgccggcgg cggcgctcct tccactggcc cagccccgac atcggcggca tgcgcctctt <.............................msnO2.............................< a a a a a l f t v p d p s y g g y a s f 11881 atagtgctcg acggttttga catggtggaa gccgagctgc tcggcgcgtt cggcgagcgc tatcacgagc tgccaaaact gtaccacctt cggctcgacg agccgcgcaa gccgctcgcg <.............................msnO2.............................< y h e v t k v h h f g l q e a r e a l a 11941 caggcagtcg tcgaagaact ggaccccgct cttgtcctcg gggccgacgg tggggaagag gtccgtcagc agcttcttga cctggggcga gaacaggagc cccggctgcc accccttctc <.............................msnO2.............................< l c d d f f q v g s k d e p g v t p f l 12001 attgatgccg aatttcacga cgcgttcctc tcgggaagga gcttcaggta cgaacggcgg taactacggc ttaaagtgct gcgcaaggag agcccttcct cgaagtccat gcttgccgcc <......msnO2.....<< n i g f k v <<....................msnO3......................< - s a n r e p l l k l y s r r 12061 tggtagagca gggcgccctt gtcgtggacc tcgccgccga ggacgcggcc gagcaggatc accatctcgt cccgcgggaa cagcacctgg agcggcggct cctgcgccgg ctcgtcctag <.............................msnO3.............................< h y l l a g k d h v e g g l v r g l l i 12121 cagtggtccc ccgcctcgat ccgggactcg gcggcgcact ccagataggc gacggagtcg gtcaccaggg ggcggagcta ggccctgagc cgccgcgtga ggtctatccg ctgcctcagc <.............................msnO3.............................< w h d g a e i r s e a a c e l y a v s d 12181 gcgaacagga tcggcgaacc cgccgcccgc gacgacgtgc ggtgctggac ccccgcgaac cgcttgtcct agccgcttgg gcggcgggcg ctgctgcacg ccacgacctg ggggcgcttg <.............................msnO3.............................< a f l i p s g a a r s s t r h q v g a f 12241 ttgtccgcgc tcttcgtcgc gaactgccgg gagacctgct cggagcccgc ggagaggaag aacaggcgcg agaagcagcg cttgacggcc ctctggacga gcctcgggcg cctctccttc <.............................msnO3.............................< k d a s k t a f q r s v q e s g a s l f 402 Anhang 12301 ttgacgacga atccgttcgc ctgctggagc gccggaaggg tctgggagga cttgtcgacg aactgctgct taggcaagcg gacgacctcg cggccttccc agaccctcct gaacagctgc <.............................msnO3.............................< n v v f g n a q q l a p l t q s s k d v 12361 cagatcagca gcagcggcgg atccatggac accgcgcaga cggcgctgct ggtcagtccc gtctagtcgt cgtcgccgcc taggtacctg tggcgcgtct gccgcgacga ccagtcaggg <.............................msnO3.............................< c i l l l p p d m s v a c v a s s t l g 12421 ttgggcatgc cctgggcgtc ggtggtggtg atgacggcga cagaggtggg gagggaggcg aacccgtacg ggacccgcag ccaccaccac tactgccgct gtctccaccc ctccctccgc <.............................msnO3.............................< k p m g q a d t t t i v a v s t p l s a 12481 aaggcgtcgc ggaagaggga agcgtcgaca gtgccggtgg tggtgccggt gggcatggcg ttccgcagcg ccttctccct tcgcagctgt cacggccacc accacggcca cccgtaccgc <...........................msnO3..........................<< f a d r f l s a d v t g t t t g t p m 12541 ccctccttcg gtctggtacg gggtcagcgg tccgatgatg tggtggacgg ggtcggggac gggaggaagc cagaccatgc cccagtcgcc aggctactac accacctgcc ccagcccctg <<...............msnH5.................< - r d s s t t s p t p s 12601 cgttccgcca gcaccgtctc cagcagccgg gtcgcgttgc ggtgcagggg aatctccggg gcaaggcggt cgtggcagag gtcgtcggcc cagcgcaacg ccacgtcccc ttagaggccc <.............................msnH5.............................< r e a l v t e l l r t a n r h l p i e p 12661 ccgggcggga gacggccgtg ggtgctgagc agtgcggtca cccgggcggt gatcaggcag ggcccgccct ctgccggcac ccacgactcg tcacgccagt gggcccgcca ctagtccgtc <.............................msnH5.............................< g p p l r g h t s l l a t v r a t i l c 12721 aaccggaacg ccgcgaacac ctcgtagtac tccaggtgcc gcagccgcgt gccggtgagc ttggccttgc ggcgcttgtg gagcatcatg aggtccacgg cgtcggcgca cggccactcg <.............................msnH5.............................< f r f a a f v e y y e l h r l r t g t l 12781 cgctcgtagc ggcggaccgt ctccgcgcgg ccgggcagtc ccgtgagccg ggggaccccg gcgagcatcg ccgcctggca gaggcgcgcc ggcccgtcag ggcactcggc cccctggggc <.............................msnH5.............................< r e y r r v t e a r g p l g t l r p v g 12841 atgccttcgc tgaggtgccg gtcgaggtgg aggaaccagg cgaggtcgct ctcggccggg tacggaagcg actccacggc cagctccacc tccttggtcc gctccagcga gagccggccc <.............................msnH5.............................< i g e s l h r d l h l f w a l d s e a p 12901 cccgtctcgg ccatgtccca gtccagcacc gcgaccgggg acagaccctg gaagatgagg gggcagagcc ggtacagggt caggtcgtgg cgctggcccc tgtctgggac cttctactcc <.............................msnH5.............................< g t e a m d w d l v a v p s l g q f i l 12961 ttgcccagcc gggcgtcccc ccacagcagc cgcgcgggtc cggactccgg tggccggtgg aacgggtcgg cccgcagggg ggtgtcgtcg gcgcgcccag gcctgaggcc accggccacc <.............................msnH5.............................< n g l r a d g w l l r a p g s e p p r h Anhang 403 13021 gcgcgcagcc aggccagggc gcggcgggcg gcgggcggct cgtggggagt gtagaaggtg cgcgcgtcgg tccggtcccg cgccgcccgc cgcccgccga gcacccctca catcttccac <.............................msnH5.............................< a r l w a l a r r a a p p e h p t y f t 13081 aagtggctct cgtagtggtt gagttgtctg agcaggtacg gccgtgagtc gcccgcggtg ttcaccgaga gcatcaccaa ctcaacagac tcgtccatgc cggcactcag cgggcgccac <.............................msnH5.............................< f h s e y h n l q r l l y p r s d g a t 13141 aggaagtcca ggccgagcgc gaccgggtcc agggcgtgca gccgggccag gacgccgagg tccttcaggt ccggctcgcg ctggcccagg tcccgcacgt cggcccggtc ctgcggctcc <.............................msnH5.............................< l f d l g l a v p d l a h l r a l v g l 13201 ccggcggacc agagggcacg gcgctccgtc ggggcgagat ccgcgatcca gcccgaccgg ggccgcctgg tctcccgtgc cgcgaggcag ccccgctcta ggcgctaggt cgggctggcc <.............................msnH5.............................< g a s w l a r r e t p a l d a i w g s r 13261 tggtaggagg gcacgtcggc ggggacccgc ccgtccactc tctccatgat catgaacggc accatcctcc cgtgcagccg cccctgggcg ggcaggtgag agaggtacta gtacttgccg <.............................msnH5.............................< h y s p v d a p v r g d v r e m i m f p 13321 gcgccgagaa ccgccgggtc cttttcgtgc cagagtacgg gcggcaccgg gaggtccgtg cgcggctctt ggcggcccag gaaaagcacg gtctcatgcc cgccgtggcc ctccaggcac <.............................msnH5.............................< a g l v a p d k e h w l v p p v p l d t 13381 tcggcggcca ggatgcgctg gaggcctacc tgggcggcga agcggctgtc ggggtgcacc agccgccggt cctacgcgac ctccggatgg acccgccgct tcgccgacag ccccacgtgg <.............................msnH5.............................< d a a l i r q l g v q a a f r s d p h v 13441 tggtggcggg tgggcgccac gcgcaggatc gccacatggg tgcgagcggc cccctgcgcg accaccgccc acccgcggtg cgcgtcctag cggtgtaccc acgctcgccg ggggacgcgc <.............................msnH5.............................< q h r t p a v r l i a v h t r a a g q a 13501 tcccgccagg tcagctggat cgtcagcgtc tcgttggtga agccggaacc ggtggggacg agggcggtcc agtcgaccta gcagtcgcag agcaaccact tcggccttgg ccacccctgc <.............................msnH5.............................< d r w t l q i t l t e n t f g s g t p v 13561 tccaggccgg acacggcgac gtcggtggcg tcggggaggc gtgcggcgaa ccagaccgcg aggtccggcc tgtgccgctg cagccaccgc agcccctccg cacgccgctt ggtctggcgc <.............................msnH5.............................< d l g s v a v d t a d p l r a a f w v a 13621 agtcgttccg aagtggtccc cgcgtcgcgt tgaaggggga caggcatgtg gactcccgtc tcagcaaggc ttcaccaggg gcgcagcgca acttccccct gtccgtacac ctgagggcag <......................msnH5.....................<< l r e s t t g a d r q l p v p m 13681 ggaggaaaaa aggggggtgg tggtgagggg agcggaagcg gtcctctcag tccgctggcc cctccttttt tccccccacc accactcccc tcgccttcgc caggagagtc aggcgaccgg <<...msnK2....< d a p 404 Anhang 13741 cgcgcagcac catcgccgag ttgaagcccc cgtacccgcg tgccagcacc agcgcggtcc gcgcgtcgtg gtagcggctc aacttcgggg gcatgggcgc acggtcgtgg tcgcgccagg <.............................msnK2.............................< g r l v m a s n f g g y g r a l v l a t 13801 gcaggggcgc ccgccgtggt tgtgcgacga ccaggtcgag ctgatagggc gcggggacgt cgtccccgcg ggcggcacca acacgctgct ggtccagctc gactatcccg cgcccctgca <.............................msnK2.............................< r l p a r r p q a v v l d l q y p a p v 13861 cggcggtgtg cacggtcggg gggatcacac cctcgcgcag cgccatgaac gcccacgcga gccgccacac gtgccagccc ccctagtgtg ggagcgcgtc gcggtacttg cgggtgcgct <.............................msnK2.............................< d a t h v t p p i v g e r l a m f a w a 13921 ggtcgaggga gccaccgccg gcgtacaggc gtccggtcat ggtcttcggc acggtgacgg ccagctccct cggtggcggc cgcatgtccg caggccagta ccagaagccg tgccactgcc <.............................msnK2.............................< l d l s g g g a y l r g t m t k p v t v 13981 gcaccccgta cggtccgaag agcgttcgca gggcctcggc ctcaacccgg tccagttcgg cgtggggcat gccaggcttc tcgcaagcgt cccggagccg gagttgggcc aggtcaagcc <.............................msnK2.............................< p v g y p g f l t r l a e a e v r d l e 14041 gtacgccggc cccgtcggcg aagacgacgt cgacgtcccc ggcggacagg cccgcctcgg catgcggccg gggcagccgc ttctgctgca gctgcagggg ccgcctgtcc gggcggagcc <.............................msnK2.............................< p v g a g d a f v v d v d g a s l g a e 14101 ccagggcgtt ctcggcggcg cggcgcaacc cgggttcccc tccggtgccg ggccgggggt ggtcccgcaa gagccgccgc gccgcgttgg gcccaagggg aggccacggc ccggccccca <.............................msnK2.............................< a l a n e a a r r l g p e g g t g p r p 14161 cgaaggtggc ggcgtatccg ctgaccgtgc cgtagggcgt ggcgccccgg gcgcgggccg gcttccaccg ccgcataggc gactggcacg gcatcccgca ccgcggggcc cgcgcccggc <.............................msnK2.............................< d f t a a y g s v t g y p t a g r a r a 14221 cgcaggcgtc ctccaggatc agcagggcac cgccctcgcc ggggacatag ccggtggcgt gcgtccgcag gaggtcctag tcgtcccgtg gcgggagcgg cccctgtatc ggccaccgca <.............................msnK2.............................< a c a d e l i l l a g g e g p v y g t a 14281 cccggtcgaa gggcagatac gcgcgccggg ggtcactgcg gacggtgatc cgccgcgtgg gggccagctt cccgtctatg cgcgcggccc ccagtgacgc ctgccactag gcggcgcacc <.............................msnK2.............................< d r d f p l y a r r p d s r v t i r r t 14341 cgagctggcc cgtccagccc catgggcaca gtgagccgtc caccccgccg gagaccagga gctcgaccgg gcaggtcggg gtacccgtgt cactcggcag gtggggcggc ctctggtcct <.............................msnK2.............................< a l q g t w g w p c l s g d v g g s v l 14401 gggtgacgcc ggaccgcagt tgacggcggg cctgggccac ggcgtcgatg ccgccggcct cccactgcgg cctggcgtca actgccgccc ggacccggtg ccgcagctac ggcggccgga <.............................msnK2.............................< l t v g s r l q r r a q a v a d i g g a Anhang 405 14461 gttcggagac gaggacgccg ctggggccgc gaaggccgtg ccggatggag atctggccgg caagcctctg ctcctgcggc gaccccggcg cttccggcac ggcctacctc tagaccggcc <.............................msnK2.............................< q e s v l v g s p g r l g h r i s i q g 14521 tgttgacggc gtagaaccag gcgaaggact ggtaggcgct gacgtgagaa ccgccgtcgc acaactgccg catcttggtc cgcttcctga ccatccgcga ctgcactctt ggcggcagcg <.............................msnK2.............................< t n v a y f w a f s q y a s v h s g g d 14581 gccatagcgc ctggagttcg cgctggccga actcgaagcc gccggcggaa ctggcggtga cggtatcgcg gacctcaagc gcgaccggct tgagcttcgg cggccgcctt gaccgccact <.............................msnK2.............................< r w l a q l e r q g f e f g g a s s a t 14641 tcaccccggc cgcgtactcg gccagtgcgg ccggatccac tccgctgtcg gccagcgcct agtggggccg gcgcatgagc cggtcacgcc ggcctaggtg aggcgacagc cggtcgcgga <.............................msnK2.............................< i v g a a y e a l a a p d v g s d a l a 14701 cctcggcggc gaccagggcg agccgggtca tgtggtcggt ctgcggcatc agccggctcg ggagccgccg ctggtcccgc tcggcccagt acaccagcca gacgccgtag tcggccgagc <.............................msnK2.............................< e e a a v l a l r t m h d t q p m l r s 14761 ggatgtgctc ggcggcttcg aagtccggta cctccccggc gagttgggcg gggtatccgg cctacacgag ccgccgaagc ttcaggccat ggaggggccg ctcaacccgc cccataggcc <.............................msnK2.............................< p i h e a a e f d p v e g a l q a p y g 14821 ccggggcgaa ccgccggacg ggggcgatcc cgctgagggc gccgagactg gcctgccacc ggccccgctt ggcggcctgc ccccgctagg gcgactcccg cggctctgac cggacggtgg <.............................msnK2.............................< a p a f r r v p a i g s l a g l s a q w 14881 agcgttcacg gccgaggccg ttgggcgcgg cgacaccgag gccggtgacc acggcctcgg tcgcaagtgc cggctccggc aacccgcgcc gctgtggctc cggccactgg tgccggagcc <.........................msnK2........................<< w r e r g l g n p a a v g l g t v v 14941 ccgcgaccgg gcggggggtg gtcggggacg tgccggtctc cgtacccgga cgggaagccg ggcgctggcc cgccccccac cagcccctgc acggccagag gcatgggcct gcccttcggc 15001 tccgccgggt gccggccgtt gttctggtca cgccgcctcc ttgggccggg ccaggaccat aggcggccca cggccggcaa caagaccagt gcggcggagg aacccggccc ggtcctggta <<.............msnK1...............< a a e k p r a l v m 15061 cgcgctctgg aagcccccga atccgctccc caccgtgagg acggtgtcga tgcggcgctc gcgcgagacc ttcgggggct taggcgaggg gtggcactcc tgccacagct acgccgcgag <.............................msnK1.............................< a s q f g g f g s g v t l v t d i r r e 15121 gcgaggcgtc agcggcgtgt agtcgaggtc gcactccgga tcgggctcgt gcaggttcgc cgctccgcag tcgccgcaca tcagctccag cgtgaggcct agcccgagca cgtccaagcg <.............................msnK1.............................< r p t l p t y d l d c e p d p e h l n a 406 Anhang 15181 ggtgggaggc accaggccgt tctcgatggc caggacggag gccgcgatct ccagggagcc ccaccctccg tggtccggca agagctaccg gtcctgcctc cggcgctaga ggtccctcgg <.............................msnK1.............................< t p p v l g n e i a l v s a a i e l s g 15241 gatggcaccc agggagtggc cgatcatcga cttgatggag ctgaccgggg tggcgtaggc ctaccgtggg tccctcaccg gctagtagct gaactacctc gactggcccc accgcatccg <.............................msnK1.............................< i a g l s h g i m s k i s s v p t a y a 15301 gtgtgtgccg agggcgcgtt tgaaggcggc ggtctcgtgg cggtcgttct gtttggtgcc cacacacggc tcccgcgcaa acttccgccg ccagagcacc gccagcaaga caaaccacgg <.............................msnK1.............................< h t g l a r k f a a t e h r d n q k t g 15361 ggacccgtgg gcgttgatgt agtcgacggc cgtcggggcg gtgcgggcct cgtccagggc cctgggcacc cgcaactaca tcagctgccg gcagccccgc cacgcccgga gcaggtcccg <.............................msnK1.............................< s g h a n i y d v a t p a t r a e d l a 15421 cagtcgtatc gcctcagcca tctccttgcc gtcgggccgc aatccggtca tgtggtaggc gtcagcatag cggagtcggt agaggaacgg cagcccggcg ttaggccagt acaccatccg <.............................msnK1.............................< l r i a e a m e k g d p r l g t m h y a 15481 gttgcagcgg gaggcgaagc cggtgatctc ggcgtggatg tgcgcgccgc gggccagcgc caacgtcgcc ctccgcttcg gccactagag ccgcacctac acgcgcggcg cccggtcgcg <.............................msnK1.............................< n c r s a f g t i e a h i h a g r a l a 15541 gtgctccagg gactcgatga cgaagaaggc gcagccctcg cccaggacga agccgttgcg cacgaggtcc ctgagctact gcttcttccg cgtcgggagc gggtcctgct tcggcaacgc <.............................msnK1.............................< h e l s e i v f f a c g e g l v f g n r 15601 gctgcggtcg aagggacgag aggcgtgctc ggggtcgtcg ttgcgggccg aggtcgcctt cgacgccagc ttccctgctc tccgcacgag ccccagcagc aacgcccggc tccagcggaa <.............................msnK1.............................< s r d f p r s a h e p d d n r a s t a k 15661 gatcgcgtcg aagcaggcca cggtgatggg ggagatgggc gcctcggtgg agccggcgac ctagcgcagc ttcgtccggt gccactaccc cctctacccg cggagccacc tcggccgctg <.............................msnK1.............................< i a d f c a v t i p s i p a e t s g a v 15721 catgacatcg gccgagcctt cgcggatcag ggagacggcg tgtcccaccg agtccaggcc gtactgtagc cggctcggaa gcgcctagtc cctctgccgc acagggtggc tcaggtccgg <.............................msnK1.............................< m v d a s g e r i l s v a h g v s d l g 15781 ggaggtgcag ccggtggaga cgacggtgac cgggccctgc gccccgacgt cccacgcgac cctccacgtc ggccacctct gctgccactg gcccgggacg cggggctgca gggtgcgctg <.............................msnK1.............................< s t c g t s v v t v p g q a g v d w a v 15841 ctcggcggag atggagctgg ggaccatgtg gtcgtagaga tgggggacgg cataggtgtg gagccgcctc tacctcgacc cctggtacac cagcatctct accccctgcc gtatccacac <.............................msnK1.............................< e a s i s s p v m h d y l h p v a y t h Anhang 407 15901 gtcgacgttc caccgctcgc cgccgttgct gaccacgctg tactcggtgt cgagactcat cagctgcaag gtggcgagcg gcggcaacga ctggtgcgac atgagccaca gctctgagta <.............................msnK1.............................< d v n w r e g g n s v v s y e t d l s m 15961 ggtgcagccg acggcggtgc cgacggtcac cccggtgcgg caggggtcga gccggtcgct ccacgtcggc tgccgccacg gctgccagtg gggccacgcc gtccccagct cggccagcga <.............................msnK1.............................< t c g v a t g v t v g t r c p d l r d s 16021 ctccaggccg ctctcggtga ccgcctcgcg ggcggcgacc agggcgaact gggtggcgcg gaggtccggc gagagccact ggcggagcgc ccgccgctgg tcccgcttga cccaccgcgc <.............................msnK1.............................< e l g s e t v a e r a a v l a f q t a r 16081 gtcgaggcgc ctgacctcct gcggagtgag tccgtgggcc gacgcgtcga agtcgcactc cagctccgcg gactggagga cgcctcactc aggcacccgg ctgcgcagct tcagcgtgag <.............................msnK1.............................< d l r r v e q p t l g h a s a d f d c e 16141 ggccgcgatg cgggagcgga aggccgacgc gtcgaacagc gagatggtcc gagtggcggt ccggcgctac gccctcgcct tccggctgcg cagcttgtcg ctctaccagg ctcaccgcca <.............................msnK1.............................< a a i r s r f a s a d f l s i t r t a t 16201 gcgcccttcg gagatgagct gccagaagga cttggaaccg atgccccgcg gggccacgac cgcgggaagc ctctactcga cggtcttcct gaaccttggc tacggggcgc cccggtgctg <.............................msnK1.............................< r g e s i l q w f s k s g i g r p a v v 16261 tccgatgccg gtgatcaccg cgcggtggct catccgatgc tcctgcagta tgtcatgtgc aggctacggc cactagtggc gcgccaccga gtaggctacg aggacgtcat acagtacacg <..............msnK1..............<< g i g t i v a r h s m 16321 atgtcttcgc ttccttcttg cggtggattg gtcgcccgga ggagtcagcg gaagtcggcc tacagaagcg aaggaagaac gccacctaac cagcgggcct cctcagtcgc cttcagccgg <<....msnH6.....< - r f d a 16381 gagtgctcgg cggcccactg ggcgaaggtg cgggcggggg taccggtgac acggagcacg ctcacgagcc gccgggtgac ccgcttccac gcccgccccc atggccactg tgcctcgtgc <.............................msnH6.............................< s h e a a w q a f t r a p t g t v r l v 16441 gtgtcctcga cgggggccgg gcggtccacg ccggcggcga gataggccaa gacggtgtcc cacaggagct gcccccggcc cgccaggtgc ggccgccgct ctatccggtt ctgccacagg <.............................msnH6.............................< t d e v p a p r d v g a a l y a l v t d 16501 gcgaactccg gcggcatggc ggagagcagt gactcgcgcg ccgcgtcggg cggtacctcc cgcttgaggc cgccgtaccg cctctcgtca ctgagcgcgc ggcgcagccc gccatggagg <.............................msnH6.............................< a f e p p m a s l l s e r a a d p p v e 16561 ttgtaccgta cggactgccc cacggccgcc ccgacgattt ccgcctgccg gcgctgggtg aacatggcat gcctgacggg gtgccggcgg ggctgctaaa ggcggacggc cgcgacccac <.............................msnH6.............................< k y r v s q g v a a g v i e a q r r q t 408 Anhang 16621 agcgactcgg gacccgtgac cacgtacctc cggccggtgt gaccggagcc ggtcagggcc tcgctgagcc ctgggcactg gtgcatggag gccggccaca ctggcctcgg ccagtcccgg <.............................msnH6.............................< l s e p g t v v y r r g t h g s g t l a 16681 gctgccgcca ccgccgccac gtcggcctcg tgcgcgggcg cggcctcgga gcgggcgtag cgacggcggt ggcggcggtg cagccggagc acgcgcccgc gccggagcct cgcccgcatc <.............................msnH6.............................< a a a v a a v d a e h a p a a e s r a y 16741 ggaccgcgca cgacgccggt gcggacctgt gcggcccagt tcagcgcgct ggtggccagg cctggcgcgt gctgcggcca cgcctggaca cgccgggtca agtcgcgcga ccaccggtcc <.............................msnH6.............................< p g r v v g t r v q a a w n l a s t a l 16801 ctgcccaccc ggacgaaggt ccagggcacg cccgaggcgg cgaccacctc ctcgacccgg gacgggtggg cctgcttcca ggtcccgtgc gggctccgcc gctggtggag gagctgggcc <.............................msnH6.............................< s g v r v f t w p v g s a a v v e e v r 16861 gcgtggtgcg cggcgatggg attggtgggc gggcgcccgt cgatgaccga cgccgaggac cgcaccacgc gccgctaccc taaccacccg cccgcgggca gctactggct gcggctcctg <.............................msnH6.............................< a h h a a i p n t p p r g d i v s a s s 16921 agcacggtca gatggctgac acccgcgtcc cgcgcggcgg cggtgaacgc ctcgatgccg tcgtgccagt ctaccgactg tgggcgcagg gcgcgccgcc gccacttgcg gagctacggc <.............................msnH6.............................< l v t l h s v g a d r a a a t f a e i g 16981 cggggttcgc agtacaggaa gaccttgtcg acgccttcca gggcgggcgc gaaggtgtgc gccccaagcg tcatgtcctt ctggaacagc tgcggaaggt cccgcccgcg cttccacacg <.............................msnH6.............................< r p e c y l f v k d v g e l a p a f t h 17041 ggcccggcga ggtcgagcgg caccacctcc gttccgtccg gcaggccctt gaccgccgcc ccgggccgct ccagctcgcc gtggtggagg caaggcaggc cgtccgggaa ctggcggcgg <.............................msnH6.............................< p g a l d l p v v e t g d p l g k v a a 17101 ggggtccggc tgcccgctcg tacccgggca ccgcgctccg tcagcgcgcg gacgacgtgc ccccaggccg acgggcgagc atgggcccgt ggcgcgaggc agtcgcgcgc ctgctgcacg <.............................msnH6.............................< p t r s g a r v r a g r e t l a r v v h 17161 cgggcgaggg tgccgccggc cccggtgacc aggatcggca cagcgctcac cggccgtccg gcccgctccc acggcggccg gggccactgg tcctagccgt gtcgcgagtg gccggcaggc <.......................msnH6.......................<< r a l t g g a g t v l i p v a s v <<...msnO4....< r g d 17221 tgaactcggg cgcgacacgc tcggcgaaga gccggaggcc gcgctcgacg tccacccggg acttgagccc gcgctgtgcg agccgcttct cggcctccgg cgcgagctgc aggtgggccc <.............................msnO4.............................< t f e p a v r e a f l r l g r e v d v r 17281 gcacgtgccc ggagtgcacg gacagcccga tcgcgatgtc gtcgccgtac cagtcggcga cgtgcacggg cctcacgtgc ctgtcgggct agcgctacag cagcggcatg gtcagccgct <.............................msnO4.............................< p v h g s h v s l g i a i d d g y w d a Anhang 409 17341 tctcggcgag ctggccgcgg acgtcgtccg gagtaccggc gagaaccttg ttctccttca agagccgctc gaccggcgcc tgcagcaggc ctcatggccg ctcttggaac aagaggaagt <.............................msnO4.............................< i e a l q g r v d d p t g a l v k n e k 17401 ccctctcgtc gaaggcggcg ccgttgccga ccgcggcggc ggccatccgg tcgtagcccg gggagagcag cttccgccgc ggcaacggct ggcgccgccg ccggtaggcc agcatcgggc <.............................msnO4.............................< v r e d f a a g n g v a a a a m r d y g 17461 ggtactggtc gctcttgacg gtggcccagg cactgactgc ggcggccatc ttctcgctca ccatgaccag cgagaactgc caccgggtcc gtgactgacg ccgccggtag aagagcgagt <.............................msnO4.............................< p y q d s k v t a w a s v a a a m k e s 17521 tcctccgctc cacgtactcg ccctgccggt acgcggcctc ccggtcctcg tcgacgaaac aggaggcgag gtgcatgagc gggacggcca tgcgccggag ggccaggagc agctgctttg <.............................msnO4.............................< m r r e v y e g q r y a a e r d e d v f 17581 acgggaaggt gaggtcgatg cgctcagtgc cggcgcggtg tccggcgtcg gcccaggccc tgcccttcca ctccagctac gcgagtcacg gccgcgccac aggccgcagc cgggtccggg <.............................msnO4.............................< c p f t l d i r e t g a r h g a d a w a 17641 ggcggtagac gctcagggct tcctggacct tctcccgggt ggcgaccgag gcgatgagct ccgccatctg cgagtcccga aggacctgga agagggccca ccgctggctc cgctactcga <.............................msnO4.............................< r r y v s l a e q v k e r t a v s a i l 17701 ggaggtggtg gcccagttca ccggccgtgc ggcaggagtc gaggttgccg gtgctggcca cctccaccac cgggtcaagt ggccggcacg ccgtcctcag ctccaacggc cacgaccggt <.............................msnO4.............................< q l h h g l e g a t r c s d l n g t s a 17761 cgaagaccgg gggatggggc tgctgggcgg gcttcggcag catggtgacc gggccgaact gcttctggcc ccctaccccg acgacccgcc cgaagccgtc gtaccactgg cccggcttga <.............................msnO4.............................< v f v p p h p q q a p k p l m t v p g f 17821 ggtggaacgt accgttccat tccaggtcgt cctcggtcca cagccggacg caggcctcga ccaccttgca tggcaaggta aggtccagca ggagccaggt gtcggcctgc gtccggagct <.............................msnO4.............................< q h f t g n w e l d d e t w l r v c a e 17881 cgccctcctc gaagcgggcc cggctctcgt tgaggggaat gccgaaagcg gtgaactcgt gcgggaggag cttcgcccgg gccgagagca actcccctta cggctttcgc cacttgagca <.............................msnO4.............................< v g e e f r a r s e n l p i g f a t f e 17941 cgggcaggaa ggcccggccg aagcccacgt cgagccggcc gccggagatg ttgtccagca gcccgtcctt ccgggccggc ttcgggtgca gctcggccgg cggcctctac aacaggtcgt <.............................msnO4.............................< d p l f a r g f g v d l r g g s i n d l 18001 tggccaactg gccggacagc ttgacggggt gggtgaaggc gggaatgacg gctccggtcg accggttgac cggcctgtcg aactgcccca cccacttccg cccttactgc cgaggccagc <.............................msnO4.............................< m a l q g s l k v p h t f a p i v a g t 410 Anhang 18061 cgatccgcag ccggctggtg cgggcggcga ccgccgcgag gaaggtggtc gggtcggggc gctaggcgtc ggccgaccac gcccgccgct ggcggcgctc cttccaccag cccagccccg <.............................msnO4.............................< a i r l r s t r a a v a a l f t t p d p 18121 tgtagccgcc gtagtcgaag aagtagtgct cgaccagttt gacctggaag tagccgagtt acatcggcgg catcagcttc ttcatcacga gctggtcaaa ctggaccttc atcggctcaa <.............................msnO4.............................< s y g g y d f f y h e v l k v q f y g l 18181 cgtcggcgag ttcggcgatg tgcaggccgt cgtcgtagta ctgggtgggc gtgacctcgc gcagccgctc aagccgctac acgtccggca gcagcatcat gacccacccg cactggagcg <.............................msnO4.............................< e d a l e a i h l g d d y y q t p t v e 18241 cgttcgctcc gcccacggtc gggaagaaca cgatgccgaa tttcatggga ttgctgccct gcaagcgagg cgggtgccag cccttcttgt gctacggctt aaagtaccct aacgacggga <.....................msnO4.....................<< g n a g g v t p f f v i g f k m 18301 cccggcggtt caggccgccg actcgtcgaa ttccagctcg acctcgtaca gggccgggcg gggccgccaa gtccggcggc tgagcagctt aaggtcgagc tggagcatgt cccggcccgc <<.......................msnO5.........................< - a a s e d f e l e v e y l a p r 18361 cacctcggtg atggcgatga cctcggggaa gaaggcggtg tgcgcgtcca tcttcatgaa gtggagccac taccgctact ggagcccctt cttccgccac acgcgcaggt agaagtactt <.............................msnO5.............................< v e t i a i v e p f f a t h a d m k m f 18421 gttttggtat tcttcgccgt tctcccagcg ggccacgttg aagtagcggg tggggtcgcc caaaaccata agaagcggca agagggtcgc ccggtgcaac ttcatcgccc accccagcgg <.............................msnO5.............................< n q y e e g n e w r a v n f y r t p d g 18481 ctggtcgcgg acgaaggtgt ggtcgatgta gccgggatgg tccagggcca ggtcggacac gaccagcgcc tgcttccaca ccagctacat cggccctacc aggtcccggt ccagcctgtg <.............................msnO5.............................< q d r v f t h d i y g p h d l a l d s v 18541 cttgtcgaag agggcctcga actgctcggc cgtggtatcg ggacgcagcg tgaacgtgtt gaacagcttc tcccggagct tgacgagccg gcaccatagc cctgcgtcgc acttgcacaa <.............................msnO5.............................< k d f l a e f q e a t t d p r l t f t n 18601 gaccatgacg atcatggggg ggtgcctccg gtcgggggtg gtgtcagcgg acgttgtcgt ctggtactgc tagtaccccc ccacggaggc cagcccccac cacagtcgcc tgcaacagca <....msnO5....<< v m v i m <<....msnC1......< - r v n d 18661 gggagaccag gcggtggcgc accttcagcc cctggggggt gcggaccagg acgtcgtcga ccctctggtc cgccaccgcg tggaagtcgg ggacccccca cgcctggtcc tgcagcagct <.............................msnC1.............................< h s v l r h r v k l g q p t r v l v d d 18721 cggcggtgct cagatagagc tggggggcgc cgtccttgac cgtggagtag atcgccgcgt gccgccacga gtctatctcg accccccgcg gcaggaactg gcacctcatc tagcggcgca <.............................msnC1.............................< v a t s l y l q p a g d k v t s y i a a Anhang 411 18781 agtagtgggt ggtcacggtc ttgtcgtcgg acgacaccac gtccaccatg cccagccagt tcatcaccca ccagtgccag aacagcagcc tgctgtggtg caggtggtac gggtcggtca <.............................msnC1.............................< y y h t t v t k d d s s v v d v m g l w 18841 gccggcgctg aaggccctcg ccgaagatgc ggtcgaggcc ggtgcgcatc cgctcgcgga cggccgcgac ttccgggagc ggcttctacg ccagctccgg ccacgcgtag gcgagcgcct <.............................msnC1.............................< h r r q l g e g f i r d l g t r m r e r 18901 tctggtcgcg gccgatccag ggctcgggcc gggcgttctg gacgaactgg ccgtcctcgg agaccagcgc cggctaggtc ccgagcccgg cccgcaagac ctgcttgacc ggcaggagcc <.............................msnC1.............................< i q d r g i w p e p r a n q v f q g d e 18961 tgaacgtgtc ggcccagcgt tcggcctcgc cggagtcgag caggtgtgcc tggcgggcgt acttgcacag ccgggtcgca agccggagcg gcctcagctc gtccacacgg accgcccgca <.............................msnC1.............................< t f t d a w r e a e g s d l l h a q r a 19021 agaactgcac gacctcggtg tagagcaccg ggtccgtgcc atcgccgacc tgttgtgcga tcttgacgtg ctggagccac atctcgtggc ccaggcacgg tagcggctgg acaacacgct <.............................msnC1.............................< y f q v v e t y l v p d t g d g v q q a 19081 cgtgctgaac cgccatggtg gcctccgcct ccagagtcgt acgaaccttg tccttgacgc gcacgacttg gcggtaccac cggaggcgga ggtctcagca tgcttggaac aggaactgcg <.............................msnC1.............................< v h q v a m t a e a e l t t r v k d k v 19141 tgtcgatcga ggtgccctcg tccgtgtggg cggcgaggac cgcgtgccga cgggcggtca acagctagct ccacgggagc aggcacaccc gccgctcctg gcgcacggct gcccgccagt <.............................msnC1.............................< s d i s t g e d t h a a l v a h r r a t 19201 gcctgacgcc cgcggcggtg ggtacgagtt ccaggaccga ggtgctgacg gccagcgacg cggactgcgg gcgccgccac ccatgctcaa ggtcctggct ccacgactgc cggtcgctgc <.............................msnC1.............................< l r v g a a t p v l e l v s t s v a l s 19261 ggtcggcggc gaaatgccgt tcgacgatgc gtcggccggg gacgccgacc cgcaccgtcg ccagccgccg ctttacggca agctgctacg cagccggccc ctgcggctgg gcgtggcagc <.............................msnC1.............................< p d a a f h r e v i r r g p v g v r v t 19321 tgtcgcccgg gtccgtcgag acgaggcgct tgtacaagtc ctcggcagac agcggtagtt acagcgggcc caggcagctc tgctccgcga acatgttcag gagccgtctg tcgccatcaa <.............................msnC1.............................< t d g p d t s v l r k y l d e a s l p l 19381 cggcggaact gccggccgtc accacgagtc cgccggtgag atggtcctgt tcggccgcgt gccgccttga cggccggcag tggtgctcag gcggccactc taccaggaca agccggcgca <.............................msnC1.............................< e a s s g a t v v l g g t l h d q e a a 19441 cccgcagatg gccgagttcg agatcgctgt tgcggtcgat cagcgcgtcg aggccggcct gggcgtctac cggctcaagc tctagcgaca acgccagcta gtcgcgcagc tccggccgga <.............................msnC1.............................< d r l h g l e l d s n r d i l a d l g a 412 Anhang 19501 ggaaggactc gtcgacgagc tgataggcgt gggtgaggac gatccgtgag cggtccgcgt ccttcctgag cagctgctcg actatccgca cccactcctg ctaggcactc gccaggcgca <.............................msnC1.............................< q f s e d v l q y a h t l v i r s r d a 19561 cgagcggttc gatgttccac tcgccgctca acgaggccat ggggggcgcg gacctctcct gctcgccaag ctacaaggtg agcggcgagt tgctccggta ccccccgcgc ctggagagga <.............................msnC1.............................< d l p e i n w e g s l s a m p p a s r e 19621 gacggaaggt cattgaccgg gttttcgggt ccagttcgac cagcgacacc caggtcttca ctgccttcca gtaactggcc caaaagccca ggtcaagctg gtcgctgtgg gtccagaagt <.............................msnC1.............................< q r f t m s r t k p d l e v l s v w t k 19681 cctcgccgtc ggcgccctcg ggcgcgcgcc agatctggac gcgcagttcg tcgccgtccg ggagcggcag ccgcgggagc ccgcgcgcgg tctagacctg cgcgtcaagc agcggcaggc <.............................msnC1.............................< v e g d a g e p a r w i q v r l e d g d 19741 tgccgagcag ttcgatgtgc acggtctcgg gaaagaaacg ggaccactgg gcgaagtcgc acggctcgtc aagctacacg tgccagagcc ctttctttgc cctggtgacc cgcttcagcg <.............................msnC1.............................< t g l l e i h v t e p f f r s w q a f d 19801 tcacgatgcc gaagacgacg tccgcgggag cccgtacgac gacatcgtgc tcggcgcgat agtgctacgg cttctgctgc aggcgccctc gggcatgctg ctgtagcacg agccgcgcta <.............................msnC1.............................< s v i g f v v d a p a r v v v d h e a r 19861 ggaccggcgg tcctcccggc tcaaccggca tgggagtccg ccagggtgga gtgcttgacc cctggccgcc aggagggccg agttggccgt accctcaggc ggtcccacct cacgaactgg <.............msnC1.............<< h v p p g g p e v p m <<.................msnO6..................< - g a h s d a l t s h k v 19921 gacaggacgg tggtgctggt gtcggagatg tgccgggcgg cctcgcccag cttgccgatc ctgtcctgcc accacgacca cagcctctac acggcccgcc ggagcgggtc gaacggctag <.............................msnO6.............................< s l v t t s t d s i h r a a e g l k g i 19981 acgtcctgga actccggctg ggcccccatg cgctggaccg actcgttgtt ctcccagtaa tgcaggacct tgaggccgac ccgggggtac gcgacctggc tgagcaacaa gagggtcatt <.............................msnO6.............................< v d q f e p q a g m r q v s e n n e w y 20041 ctgacggcga cctgggtgag cgggtcgtcg agcgagcgcg ccagcaggtg cttcaggtat gactgccgct ggacccactc gcccagcagc tcgctcgcgc ggtcgtccac gaagtccata <.............................msnO6.............................< s v a v q t l p d d l s r a l l h k l y 20101 ccgggctgag cacggaagaa ttccgaggtc ttctcgaaga cgtcccgaaa tccgtcggac ggcccgactc gtgccttctt aaggctccag aagagcttct gcagggcttt aggcagcctg <.............................msnO6.............................< g p q a r f f e s t k e f v d r f g d s 20161 tccgattcca gtcggaactc gctgatcagg acaaccattt tctgcacctc tcgacagagt aggctaaggt cagccttgag cgactagtcc tgttggtaaa agacgtggag agctgtctca <.................msnO6................<< e s e l r f e s i l v v m Anhang 413 20221 ggaattcgag tgcggccaac actaaaagcc gcagcctcga agcatgctcg gagagtgctc ccttaagctc acgccggttg tgattttcgg cgtcggagct tcgtacgagc ctctcacgag 20281 ggaaggcggt cgcgagagtt atccggggat atctccgagc gggttccgag tgtgagccga ccttccgcca gcgctctcaa taggccccta tagaggctcg cccaaggctc acactcggct 20341 ggagcgggat tccatacttt ccgcagtgca tcgcaccgaa ttcaaatcgc cagacaagga cctcgcccta aggtatgaaa ggcgtcacgt agcgtggctt aagtttagcg gtctgttcct 20401 cggttggcat gactgcgatc ttcgcgaaca ccctcacgct gaaggacccg gagaaccagg gccaaccgta ctgacgctag aagcgcttgt gggagtgcga cttcctgggc ctcttggtcc >>........................msnO7.........................> m t a i f a n t l t l k d p e n q 20461 aggccgccaa ggacctggaa gagaccatca ccgaggccgg cgccttcatg cagcgccagc tccggcggtt cctggacctt ctctggtagt ggctccggcc gcggaagtac gtcgcggtcg >.............................msnO7.............................> e a a k d l e e t i t e a g a f m q r q 20521 ccggcttccg ttccttccgg ctggtccgct ccccgaagac cccggagagc tacctgatct ggccgaaggc aaggaaggcc gaccaggcga ggggcttctg gggcctctcg atggactaga >.............................msnO7.............................> p g f r s f r l v r s p k t p e s y l i 20581 acgccgaatg ggacgacgtc caggtgctgg aggccgccat cgcccagccg gacgtacgga tgcggcttac cctgctgcag gtccacgacc tccggcggta gcgggtcggc ctgcatgcct >.............................msnO7.............................> y a e w d d v q v l e a a i a q p d v r 20641 cccgggccgc ccacgtccgt gagctgacgc agggcgcgcc gaagatctac gaggtggtcg gggcccggcg ggtgcaggca ctcgactgcg tcccgcgcgg cttctagatg ctccaccagc >.............................msnO7.............................> t r a a h v r e l t q g a p k i y e v v 20701 cccaggcgga cctgcccgcg tgaccgcacc cggcacatcc ctgcgaccgc gggtgacgga gggtccgcct ggacgggcgc actggcgtgg gccgtgtagg gacgctggcg cccactgcct >.........msnO7........>> a q a d l p a >>..................msnC2...................> v t a p g t s l r p r v t 20761 ggtcgccgac cgggtcttcg ccttcgtcca gcccaacggc ggttggtgcc tgagcaacgc ccagcggctg gcccagaagc ggaagcaggt cgggttgccg ccaaccacgg actcgttgcg >.............................msnC2.............................> e v a d r v f a f v q p n g g w c l s n 20821 cggcatcgtc gtgggcggcg accgggtctg tgtggtcgac acggccgcga ccgaggcccg gccgtagcag cacccgccgc tggcccagac acaccagctg tgccggcgct ggctccgggc >.............................msnC2.............................> a g i v v g g d r v c v v d t a a t e a 20881 aacccgcgca ctgcacaccg aggtcggccg gctgagcccc gtgccgccga gtttcctcgt ttgggcgcgt gacgtgtggc tccagccggc cgactcgggg cacggcggct caaaggagca >.............................msnC2.............................> r t r a l h t e v g r l s p v p p s f l 20941 gaacacgcat caccacgggg accacacctt cggcaactcc ttcttccccg cgcggacaac cttgtgcgta gtggtgcccc tggtgtggaa gccgttgagg aagaaggggc gcgcctgttg >.............................msnC2.............................> v n t h h h g d h t f g n s f f p a r t 414 Anhang 21001 cgtcgtctcc cacgacctcg cacggaccga gatggcggag aagcagctct cgatgtgcca gcagcagagg gtgctggagc gtgcctggct ctaccgcctc ttcgtcgaga gctacacggt >.............................msnC2.............................> t v v s h d l a r t e m a e k q l s m c 21061 ggtgtggccg gaggtcgact gggggaacct cgaactgcgc ctccccgacc tcacgttctc ccacaccggc ctccagctga cccccttgga gcttgacgcg gaggggctgg agtgcaagag >.............................msnC2.............................> q v w p e v d w g n l e l r l p d l t f 21121 cgaccggctc agcctgtatt tcggcgaaca gaccgccgaa ctgctgtacg tgggaccggc gctggccgag tcggacataa agccgcttgt ctggcggctt gacgacatgc accctggccg >.............................msnC2.............................> s d r l s l y f g e q t a e l l y v g p 21181 gcactcgacc aacgacgtcg tggtctggct tccggaccgc aagtgcctgt tcgccggcga cgtgagctgg ttgctgcagc accagaccga aggcctggcg ttcacggaca agcggccgct >.............................msnC2.............................> a h s t n d v v v w l p d r k c l f a g 21241 cgtcctgctg tccggctgca ctccgttcat cctcatggga tcgctggcgg gcagcctgcg gcaggacgac aggccgacgt gaggcaagta ggagtaccct agcgaccgcc cgtcggacgc >.............................msnC2.............................> d v l l s g c t p f i l m g s l a g s l 21301 ggcggtggcc aggctgcgca ccctcggcgc cgagaccatc gtgtgcgggc acggcccggt ccgccaccgg tccgacgcgt gggagccgcg gctctggtag cacacgcccg tgccgggcca >.............................msnC2.............................> r a v a r l r t l g a e t i v c g h g p 21361 gtgcgggccc gaggtcttcg acgccaccga acggtatctg ctgtggatac ggcggctggc cacgcccggg ctccagaagc tgcggtggct tgccatagac gacacctatg ccgccgaccg >.............................msnC2.............................> v c g p e v f d a t e r y l l w i r r l 21421 ccgggacggc attgcggccg gcctcgatcc gctgaccgtg gcgcgggaga ccccgctcgg ggccctgccg taacgccggc cggagctagg cgactggcac cgcgccctct ggggcgagcc >.............................msnC2.............................> a r d g i a a g l d p l t v a r e t p l 21481 ggaacacgcc gcactcgtcg acccggaacg actggtcgcc aatctgcacc gggcctacgc ccttgtgcgg cgtgagcagc tgggccttgc tgaccagcgg ttagacgtgg cccggatgcg >.............................msnC2.............................> g e h a a l v d p e r l v a n l h r a y 21541 ggaggaacgc ggcgccgggc ccggcgaaca catcgcctcg gggccggtgt tccgcgagat cctccttgcg ccgcggcccg ggccgcttgt gtagcggagc cccggccaca aggcgctcta >.............................msnC2.............................> a e e r g a g p g e h i a s g p v f r e 21601 gaccgcctac aacggcggcc gtccactgcg ctgcctggcc tgaacccctg ctcaccgagc ctggcggatg ttgccgccgg caggtgacgc gacggaccgg acttggggac gagtggctcg >.............................msnC2.............................> m t a y n g g r p l r c l a - t p a h r 21661 aatgagagga acacgttgtg aaactgtcgg tggtcgagca ggcccccgtg gtggaaggac ttactctcct tgtgcaacac tttgacagcc accagctcgt ccgggggcac caccttcctg >........msnC2.......>> a m r g t r c >>...................msnO8....................> v k l s v v e q a p v v e g Anhang 415 21721 tcaccccggc ccactcgctg cagcacagca tagaactggc ccgactggcg gaccggctgg agtggggccg ggtgagcgac gtcgtgtcgt atcttgaccg ggctgaccgc ctggccgacc >.............................msnO8.............................> l t p a h s l q h s i e l a r l a d r l 21781 ggtacgagcg cttttgggtc gccgaacacc atgctgagat tttcaacgcc gtacccgccc ccatgctcgc gaaaacccag cggcttgtgg tacgactcta aaagttgcgg catgggcggg >.............................msnO8.............................> g y e r f w v a e h h a e i f n a v p a 21841 cggagatcct catcgcacgg atcgcggcgg agacctccgg gatacgggtc ggctcgggcg gcctctagga gtagcgtgcc tagcgccgcc tctggaggcc ctatgcccag ccgagcccgc >.............................msnO8.............................> p e i l i a r i a a e t s g i r v g s g 21901 gggtgctgct gtcgctgtac agcccgctga aggtggccga ggtgttccgc accctgcacg cccacgacga cagcgacatg tcgggcgact tccaccggct ccacaaggcg tgggacgtgc >.............................msnO8.............................> g v l l s l y s p l k v a e v f r t l h 21961 ccctctatcc ggaccggatc gacctgggca tcggccgcgc caaccgcgtc aaactgccgg gggagatagg cctggcctag ctggacccgt agccggcgcg gttggcgcag tttgacggcc >.............................msnO8.............................> a l y p d r i d l g i g r a n r v k l p 22021 tgttcgcggc gctgcgggac gacacggccg gcaaggagcc gtcctcggac gacctgtggc acaagcgccg cgacgccctg ctgtgccggc cgttcctcgg caggagcctg ctggacaccg >.............................msnO8.............................> v f a a l r d d t a g k e p s s d d l w 22081 gtcggctgga gcagctgcgc gcctatctgg acccggacag cgggctcccg ttcaccgtct cagccgacct cgtcgacgcg cggatagacc tgggcctgtc gcccgagggc aagtggcaga >.............................msnO8.............................> r r l e q l r a y l d p d s g l p f t v 22141 cgccccggat gcccggcggg ccggcgctgt ggctgctcgg ggcgagcgtg tccagcgccg gcggggccta cgggccgccc ggccgcgaca ccgacgagcc ccgctcgcac aggtcgcggc >.............................msnO8.............................> s p r m p g g p a l w l l g a s v s s a 22201 aggcggcggc ccggctcgga ctgccctacg cgtacgcgca cttcatcacg ccccagttca tccgccgccg ggccgagcct gacgggatgc gcatgcgcgt gaagtagtgc ggggtcaagt >.............................msnO8.............................> e a a a r l g l p y a y a h f i t p q f 22261 cccgggaagc gatggacacc taccgggccg ccttcgtacc gggaccggac accccctcgc gggcccttcg ctacctgtgg atggcccggc ggaagcatgg ccctggcctg tgggggagcg >.............................msnO8.............................> t r e a m d t y r a a f v p g p d t p s 22321 cccggcccat cctgtcggtg gtcgtgtgct gcgcggagac cgacgccgag gcccaacggg gggccgggta ggacagccac cagcacacga cgcgcctctg gctgcggctc cgggttgccc >.............................msnO8.............................> p r p i l s v v v c c a e t d a e a q r 22381 tgtacgccac ccaccggttg ttccaccgcc gcatgtccca gggggacgta cggctgctgc acatgcggtg ggtggccaac aaggtggcgg cgtacagggt ccccctgcat gccgacgacg >.............................msnO8.............................> v y a t h r l f h r r m s q g d v r l l 416 Anhang 22441 cgccggccga tctcgccgtg gcggagatgg acaagccggg ccccgacccg ctggcggagg gcggccggct agagcggcac cgcctctacc tgttcggccc ggggctgggc gaccgcctcc >.............................msnO8.............................> p p a d l a v a e m d k p g p d p l a e 22501 aatccttcga gtggccgcgc tatgtcgtcg gttcaccgga ccgggtccgc gaccagctga ttaggaagct caccggcgcg atacagcagc caagtggcct ggcccaggcg ctggtcgact >.............................msnO8.............................> e s f e w p r y v v g s p d r v r d q l 22561 ccaagatggc cgacgccacg ggcgccgagg agctgggcgt cgtgtcgatg atccacgatc ggttctaccg gctgcggtgc ccgcggctcc tcgacccgca gcacagctac taggtgctag >.............................msnO8.............................> t k m a d a t g a e e l g v v s m i h d 22621 agcgcgaccg gctgcgctcg taccggctgc tcgccgaggc gttcgagctg accccccggt tcgcgctggc cgacgcgagc atggccgacg agcggctccg caagctcgac tggggggcca >.............................msnO8.............................> q r d r l r s y r l l a e a f e l t p r 22681 gacccctgac gtccagggca gggcgccacg tcctccccac agaaaggaaa ccccgtgcgt ctggggactg caggtcccgt cccgcggtgc aggaggggtg tctttccttt ggggcacgca >> msnO8 msnO9 >>...> v r 22741 gtcatccggt accactccta cggcgccccc gacgtactga cgatcgagga tgccgaagtc cagtaggcca tggtgaggat gccgcggggg ctgcatgact gctagctcct acggcttcag >.............................msnO9.............................> v i r y h s y g a p d v l t i e d a e v 22801 cccgaaccag gaccggccga ggtgctcatc aaggccgagg cgatcggggt gaacttcgtc gggcttggtc ctggccggct ccacgagtag ttccggctcc gctagcccca cttgaagcag >.............................msnO9.............................> p e p g p a e v l i k a e a i g v n f v 22861 gagacacagc ggcggcgcgg cacggcgccg ttccccaccc cgcttcccaa cgccccgcac ctctgtgtcg ccgccgcgcc gtgccgcggc aaggggtggg gcgaagggtt gcggggcgtg >.............................msnO9.............................> e t q r r r g t a p f p t p l p n a p h 22921 ggcgatgtcg tgggcagggt ggtggcggcc ggagccgagg tgaccagcgt cgcggtcggc ccgctacagc acccgtccca ccaccgccgg cctcggctcc actggtcgca gcgccagccg >.............................msnO9.............................> g d v v g r v v a a g a e v t s v a v g 22981 gaccgggtgg ccgcgcccgt cgccggagag gcgtacgccg actacgccgt cagcgacgcc ctggcccacc ggcgcgggca gcggcctctc cgcatgcggc tgatgcggca gtcgctgcgg >.............................msnO9.............................> d r v a a p v a g e a y a d y a v s d a 23041 accttcctct ttccgatccc ggaggacctc ggcctcgccg aggcgagcgt cctggcctcg tggaaggaga aaggctaggg cctcctggag ccggagcggc tccgctcgca ggaccggagc >.............................msnO9.............................> t f l f p i p e d l g l a e a s v l a s 23101 cccgcacaga ccgcgctgtg cagcctcaag accgggcaga tcaagcccgg cgacacggtg gggcgtgtct ggcgcgacac gtcggagttc tggcccgtct agttcgggcc gctgtgccac >.............................msnO9.............................> p a q t a l c s l k t g q i k p g d t v Anhang 417 23161 ctggtgcacg ccgcgtccgg ctccatcggc catctgtcgc tgcaactggc caaggtcctg gaccacgtgc ggcgcaggcc gaggtagccg gtagacagcg acgttgaccg gttccaggac >.............................msnO9.............................> l v h a a s g s i g h l s l q l a k v l 23221 ggcgcgggaa cggtcatcgg cacggcgggc tcggcgcgca agctcgactt cgcccgtgag ccgcgccctt gccagtagcc gtgccgcccg agccgcgcgt tcgagctgaa gcgggcactc >.............................msnO9.............................> g a g t v i g t a g s a r k l d f a r e 23281 tacggggccg acgtggcggt cgactactcg gcccccgact gggacgacca ggtgcgcgcg atgccccggc tgcaccgcca gctgatgagc cgggggctga ccctgctggt ccacgcgcgc >.............................msnO9.............................> y g a d v a v d y s a p d w d d q v r a 23341 gccaccgagg ggcgcggcgt cgacgtgatc gtcgacagcg tcggcggcga cgtcctgcgc cggtggctcc ccgcgccgca gctgcactag cagctgtcgc agccgccgct gcaggacgcg >.............................msnO9.............................> a t e g r g v d v i v d s v g g d v l r 23401 cagggcatcg gactgctggc gcccttcggc cgactggtgt tctacggcgc ggccagcggc gtcccgtagc ctgacgaccg cgggaagccg gctgaccaca agatgccgcg ccggtcgccg >.............................msnO9.............................> q g i g l l a p f g r l v f y g a a s g 23461 gacataccga agatctcccc catggagctg atcggcctcc agttcgtgac cgggtccagc ctgtatggct tctagagggg gtacctcgac tagccggagg tcaagcactg gcccaggtcg >.............................msnO9.............................> d i p k i s p m e l i g l q f v t g s s 23521 ctctgggcat ggtggcagca ccggcccgac gaagtcaggg cgggcctcga ccagatggcc gagacccgta ccaccgtcgt ggccgggctg cttcagtccc gcccggagct ggtctaccgg >.............................msnO9.............................> l w a w w q h r p d e v r a g l d q m a 23581 ggactgctcg tctctggcgg actgcgggtc tccctcggca ccacgctgcc gttcaccgag cctgacgagc agagaccgcc tgacgcccag agggagccgt ggtgcgacgg caagtggctc >.............................msnO9.............................> g l l v s g g l r v s l g t t l p f t e 23641 gcggcaaagg cgcaccagct gatcgaggaa cgcggtcacg tcgggcgcat cctgctcatc cgccgtttcc gcgtggtcga ctagctcctt gcgccagtgc agcccgcgta ggacgagtag >.............................msnO9.............................> a a k a h q l i e e r g h v g r i l l i 23701 ccatgaccct gccccgccgg acgacggggg agccgacaca tgtccgagga gtcatcgcac ggtactggga cggggcggcc tgctgccccc tcggctgtgt acaggctcct cagtagcgtg >...>> msnO9 p - 23761 catggatctg cacctgacag gaaagaccgc cgtcgtgacc ggcggaagcc ggggcatcgg gtacctagac gtggactgtc ctttctggcg gcagcactgg ccgccttcgg ccccgtagcc >>...........................msnO10............................> m d l h l t g k t a v v t g g s r g i 23821 actggccatc gcacgtgggc tggccggtga gggcgtacgc gtggtctgcg gggccagcag tgaccggtag cgtgcacccg accggccact cccgcatgcg caccagacgc cccggtcgtc >............................msnO10.............................> g l a i a r g l a g e g v r v v c g a s 418 Anhang 23881 tcccgccccc gcaccggagg acagctctat cctcacgttg aaggtggacc tgtcgacccc agggcggggg cgtggcctcc tgtcgagata ggagtgcaac ttccacctgg acagctgggg >............................msnO10.............................> s p a p a p e d s s i l t l k v d l s t 23941 ggaagggccg cagcagctcg ccgactacgc cctggaacag ctcggcggcg tcgacgtgct ccttcccggc gtcgtcgagc ggctgatgcg ggaccttgtc gagccgccgc agctgcacga >............................msnO10.............................> p e g p q q l a d y a l e q l g g v d v 24001 ggtcaacaac gtcggtggcg gcctcatccc ggaccggccc ttcccggaga tcgacgacaa ccagttgttg cagccaccgc cggagtaggg cctggccggg aagggcctct agctgctgtt >............................msnO10.............................> l v n n v g g g l i p d r p f p e i d d 24061 gttctggtac gacgcgctca aggtcacttt cctcagcacg gtgcggacga cacgggcgat caagaccatg ctgcgcgagt tccagtgaaa ggagtcgtgc cacgcctgct gtgcccgcta >............................msnO10.............................> k f w y d a l k v t f l s t v r t t r a 24121 gctgccggga ctgctggaac gccgcggcag catcatccac atcgggtcga tcgccgccca cgacggccct gacgaccttg cggcgccgtc gtagtaggtg tagcccagct agcggcgggt >............................msnO10.............................> m l p g l l e r r g s i i h i g s i a a 24181 caccccggac cccgggcacc tgccgtacag cgcggcgaag agcgcggcgc gcaacttcac gtggggcctg gggcccgtgg acggcatgtc gcgccgcttc tcgcgccgcg cgttgaagtg >............................msnO10.............................> h t p d p g h l p y s a a k s a a r n f 24241 ggccggcctg gcgaagcagt atgcgagcca ggggctgcgg gtcaacacca tcgcgcccgg ccggccggac cgcttcgtca tacgctcggt ccccgacgcc cagttgtggt agcgcgggcc >............................msnO10.............................> t a g l a k q y a s q g l r v n t i a p 24301 tgtcgtcaac accggtctgt ggagctcgcc gggcggggcc ggggagcggc tggcgaaaga acagcagttg tggccagaca cctcgagcgg cccgccccgg cccctcgccg accgctttct >............................msnO10.............................> g v v n t g l w s s p g g a g e r l a k 24361 tctgggcatt ccactggagg atgtcatcaa ggaaatgccg aagctggccg gaattcccac agacccgtaa ggtgacctcc tacagtagtt cctttacggc ttcgaccggc cttaagggtg >............................msnO10.............................> d l g i p l e d v i k e m p k l a g i p 24421 cggacgggtc acggagcagg aggagatcgc cgcgctcgcg ctgctgctcg cctccgatct gcctgcccag tgcctcgtcc tcctctagcg gcgcgagcgc gacgacgagc ggaggctaga >............................msnO10.............................> t g r v t e q e e i a a l a l l l a s d 24481 ggtgcccaac atcaccggcg cggaattcgt tgtggacggt gccctgacgt ccgctcgcac ccacgggttg tagtggccgc gccttaagca acacctgcca cgggactgca ggcgagcgtg >............................msnO10.............................> l v p n i t g a e f v v d g a l t s a r 24541 atgacggacg gagtaatcga agagatggcc aaggagggaa cagaatgggc aagcaagtgt tactgcctgc ctcattagct tctctaccgg ttcctccctt gtcttacccg ttcgttcaca >.>> msnO10 t >>....msnK3.....> m g k q v Anhang 419 24601 tcaatatcga cgacctgaag cggattattc tcgaaggggc cggagaaccg gaaggcccag agttatagct gctggacttc gcctaataag agcttccccg gcctcttggc cttccgggtc >.............................msnK3.............................> f n i d d l k r i i l e g a g e p e g p 24661 gggtggaggc gacgacggtc gatctcgagt tccaggaact cggctacgac tcgctggcgg cccacctccg ctgctgccag ctagagctca aggtccttga gccgatgctg agcgaccgcc >.............................msnK3.............................> g v e a t t v d l e f q e l g y d s l a 24721 tcctggagac ctgcacccgg atcgagcgcg agttcggcgt ctccctggac gaggaggtgc aggacctctg gacgtgggcc tagctcgcgc tcaagccgca gagggacctg ctcctccacg >.............................msnK3.............................> v l e t c t r i e r e f g v s l d e e v 24781 tgggccaggc ccgcaccccg cgtgtgctgg tcgacatcgt caacaggcat ttgtccatag acccggtccg ggcgtggggc gcacacgacc agctgtagca gttgtccgta aacaggtatc >.............................msnK3.............................> l g q a r t p r v l v d i v n r h l s i 24841 gcgaatctgg catgagcgag ccgggagtac accatggctg atcaggacag gcgggtggcc cgcttagacc gtactcgctc ggccctcatg tggtaccgac tagtcctgtc cgcccaccgg >...................msnK3..................>> g e s g m s e p g v h h g >>.........msnO11...........> m a d q d r r v a 24901 gtcgtcaccg gagcgacgag cggtatcggg ctcgccgtca ccaggagtct cgcgcgcgag cagcagtggc ctcgctgctc gccatagccc gagcggcagt ggtcctcaga gcgcgcgctc >............................msnO11.............................> v v t g a t s g i g l a v t r s l a r e 24961 ggctaccgcg tctacttctg cgcgcgcacc gaagactccg tgaccaccac ggtcaagagc ccgatggcgc agatgaagac gcgcgcgtgg cttctgaggc actggtggtg ccagttctcg >............................msnO11.............................> g y r v y f c a r t e d s v t t t v k s 25021 ctgcgtgagg aagggctgga ggtcgacggc agcgcgtgcg acgtgcggtc cggcgcggac gacgcactcc ttcccgacct ccagctgccg tcgcgcacgc tgcacgccag gccgcgcctg >............................msnO11.............................> l r e e g l e v d g s a c d v r s g a d 25081 gtacgcgcgt tcgtggccgg cgccgtcgag cggttcggtg cggtggacac gctggtgaac catgcgcgca agcaccggcc gcggcagctc gccaagccac gccacctgtg cgaccacttg >............................msnO11.............................> v r a f v a g a v e r f g a v d t l v n 25141 aacgccggac gcagcggcgg aggggtgacc gcggggatct ccgacgagtt gtgggccgat ttgcggcctg cgtcgccgcc tccccactgg cgcccctaga ggctgctcaa cacccggcta >............................msnO11.............................> n a g r s g g g v t a g i s d e l w a d 25201 gtgatggaca ccaacctgaa cagcgtgttc cggatgacgc gggaggtgct gaccgtcggc cactacctgt ggttggactt gtcgcacaag gcctactgcg ccctccacga ctggcagccg >............................msnO11.............................> v m d t n l n s v f r m t r e v l t v g 25261 ggcatgttgg accgggcgcg ggggcgagtg gtcaacgtcg cttccaccgc agggaaacag ccgtacaacc tggcccgcgc ccccgctcac cagttgcagc gaaggtggcg tccctttgtc >............................msnO11.............................> g m l d r a r g r v v n v a s t a g k q 420 Anhang 25321 ggggtcgtcc tcggcgcccc ctactccgcc tccaagcacg gcgtcgtggg tttcaccaag ccccagcagg agccgcgggg gatgaggcgg aggttcgtgc cgcagcaccc aaagtggttc >............................msnO11.............................> g v v l g a p y s a s k h g v v g f t k 25381 gcactcggca acgagctggc ccctaccggc atcaccgtca acgcggtctg cccgggctat cgtgagccgt tgctcgaccg gggatggccg tagtggcagt tgcgccagac gggcccgata >............................msnO11.............................> a l g n e l a p t g i t v n a v c p g y 25441 gtcgagacac ccatggcgga gcgggtccgt cggggatacg cggacgcgtg gaacacctcg cagctctgtg ggtaccgcct cgcccaggca gcccctatgc gcctgcgcac cttgtggagc >............................msnO11.............................> v e t p m a e r v r r g y a d a w n t s 25501 gaggagacga tcctggagaa gttccaggcc aagatcccgc tgggccgcta ctcgacgccc ctcctctgct aggacctctt caaggtccgg ttctagggcg acccggcgat gagctgcggg >............................msnO11.............................> e e t i l e k f q a k i p l g r y s t p 25561 gaggaggtgg ccggcctagt gacctatctg agttccgaca ccgccgcctc gatcacggcc ctcctccacc ggccggatca ctggatagac tcaaggctgt ggcggcggag ctagtgccgg >............................msnO11.............................> e e v a g l v t y l s s d t a a s i t a 25621 caggccatca acgtctgcgg cggcctgggc aacttctgag ccgaccgcgt cgcagaggaa gtccggtagt tgcagacgcc gccggacccg ttgaagactc ggctggcgca gcgtctcctt >.................msnO11................>> q a i n v c g g l g n f - 25681 cgccgtacag agatgtcgta caggaatgga gacgaccgga tgagcgaatc ggcatcgcgc gcggcatgtc tctacagcat gtccttacct ctgctggcct actcgcttag ccgtagcgcg >>.......msnC3........> m s e s a s r 25741 gaggtcgagc acgagatcac gatcatggct ccggcgaaca cggtgtacgg gctgatcgag ctccagctcg tgctctagtg ctagtaccga ggccgcttgt gccacatgcc cgactagctc >.............................msnC3.............................> e v e h e i t i m a p a n t v y g l i e 25801 gacgtgacga actggcctca tgtcttcccg cccaccatcc acgtggaacg gctcgaatcc ctgcactgct tgaccggagt acagaagggc gggtggtagg tgcaccttgc cgagcttagg >.............................msnC3.............................> d v t n w p h v f p p t i h v e r l e s 25861 gaggggcggt cggagcggat acggatctgg gccaccgccc gtggcgaggc gaagacctgg ctccccgcca gcctcgccta tgcctagacc cggtggcggg caccgctccg cttctggacc >.............................msnC3.............................> e g r s e r i r i w a t a r g e a k t w 25921 acctcccgcc gggaactgga tccggaggcc ctgcgcatca ccttccgcca ggagcagtcc tggagggcgg cccttgacct aggcctccgg gacgcgtagt ggaaggcggt cctcgtcagg >.............................msnC3.............................> t s r r e l d p e a l r i t f r q e q s 25981 gcgccgccgg tcgcctcgat ggggggcacc tggatcatcg agccgcagtc cgcggacacc cgcggcggcc agcggagcta ccccccgtgg acctagtagc tcggcgtcag gcgcctgtgg >.............................msnC3.............................> a p p v a s m g g t w i i e p q s a d t Anhang 421 26041 tgccgggtcc gtctgctgca cgactaccgc gcactcggcg actccgccga aggactggcc acggcccagg cagacgacgt gctgatggcg cgtgagccgc tgaggcggct tcctgaccgg >.............................msnC3.............................> c r v r l l h d y r a l g d s a e g l a 26101 tggattgacg aagcggtcga cctcaacagc cgttccgagc tggccgccct gcgcgacagc acctaactgc ttcgccagct ggagttgtcg gcaaggctcg accggcggga cgcgctgtcg >.............................msnC3.............................> w i d e a v d l n s r s e l a a l r d s 26161 gcggaacggg ccggccactc cggtgagctg ctcctgagct tcgacgacac cgtgtatatc cgccttgccc ggccggtgag gccactcgac gaggactcga agctgctgtg gcacatatag >.............................msnC3.............................> a e r a g h s g e l l l s f d d t v y i 26221 gacggttcgg ccgaggacgt ctacgacttc ctcaacgcgg cggaccgctg gcgggagcgg ctgccaagcc ggctcctgca gatgctgaag gagttgcgcc gcctggcgac cgccctcgcc >.............................msnC3.............................> d g s a e d v y d f l n a a d r w r e r 26281 ttgccgcacg tcgaccgcgt ggaactgcgt gaggacgacc ccggacttca agtgctcacc aacggcgtgc agctggcgca ccttgacgca ctcctgctgg ggcctgaagt tcacgagtgg >.............................msnC3.............................> l p h v d r v e l r e d d p g l q v l t 26341 atggacacac tgaccaagga cggttccaaa cacacgacgg agtcggtccg cgtctgtttc tacctgtgtg actggttcct gccaaggttt gtgtgctgcc tcagccaggc gcagacaaag >.............................msnC3.............................> m d t l t k d g s k h t t e s v r v c f 26401 ccgcactcaa ggatcgtcta caagcagacc cgggtgcccg cgctgatgac cgtgcacacg ggcgtgagtt cctagcagat gttcgtctgg gcccacgggc gcgactactg gcacgtgtgc >.............................msnC3.............................> p h s r i v y k q t r v p a l m t v h t 26461 ggccagtggc gcctggtgga gggagccggc gcgctggccg tgacctcgcg gcacaccgtg ccggtcaccg cggaccacct ccctcggccg cgcgaccggc actggagcgc cgtgtggcac >.............................msnC3.............................> g q w r l v e g a g a l a v t s r h t v 26521 gtgctcaatc cggaaacgat ccgtcaggtg ctcggcgaga cggcaggagt ggcggacgcc cacgagttag gcctttgcta ggcagtccac gagccgctct gccgtcctca ccgcctgcgg >.............................msnC3.............................> v l n p e t i r q v l g e t a g v a d a 26581 aggaaatatg ttcgtagcgc tttgagcgca aacagcctgg ccacgctcgg acacgccaag tcctttatac aagcatcgcg aaactcgcgt ttgtcggacc ggtgcgagcc tgtgcggttc >.............................msnC3.............................> r k y v r s a l s a n s l a t l g h a k 26641 gaatatgccg aaggcaaagc ctgaaagggg cgccccgtaa tacgcacctg ttacggggcg cttatacggc ttccgtttcg gactttcccc gcggggcatt atgcgtggac aatgccccgc >.........msnC3.........>> e y a e g k a - 26701 cgtcggcgta cagatttacg ctccagattc ggccactcga cctaaagttg cagccaaggt gcagccgcat gtctaaatgc gaggtctaag ccggtgagct ggatttcaac gtcggttcca 26761 agctgtccgc tctggagtgc atagtggaaa gagctggaaa tcaacggcaa agaagggtgc tcgacaggcg agacctcacg tatcaccttt ctcgaccttt agttgccgtt tcttcccacg 422 Anhang 26821 aagtaaattg cacccttcgc ccattttgtt gtgatagttg accgatttgc cccctgcccg ttcatttaac gtgggaagcg ggtaaaacaa cactatcaac tggctaaacg ggggacgggc 26881 gcgcctatcg aacccctccc actgtcgtgt gacgaattac gtgcgaatta ttcaccatga cgcggatagc ttggggaggg tgacagcaca ctgcttaatg cacgcttaat aagtggtact 26941 tcgatgtagg ggttggctgc ccgcccggtc acccctaatg tcactgtcac agcttgcccg agctacatcc ccaaccgacg ggcgggccag tggggattac agtgacagtg tcgaacgggc 27001 ttgaatgaca gagaaggcgg ctatgcggat cctgccgtct gaaaggtgtt ggcgctggtg aacttactgt ctcttccgcc gatacgccta ggacggcaga ctttccacaa ccgcgaccac msnR1 >>> v 27061 cacgtgaaaa tactcgggtc gttcgaaatc agtgtgcagg gaaactccat cgttccatcc gtgcactttt atgagcccag caagctttag tcacacgtcc ctttgaggta gcaaggtagg >.............................msnR1.............................> h v k i l g s f e i s v q g n s i v p s 27121 gcaccaaaac tccggcaaat acttgccctg ctggcaatac gatcgaactc cgtagtggcc cgtggttttg aggccgttta tgaacgggac gaccgttatg ctagcttgag gcatcaccgg >.............................msnR1.............................> a p k l r q i l a l l a i r s n s v v a 27181 gtctccgact tcgtcgacga ggtatggggg tgtgcaccgc cccgaagtct ttccaccacc cagaggctga agcagctgct ccataccccc acacgtggcg gggcttcaga aaggtggtgg >.............................msnR1.............................> v s d f v d e v w g c a p p r s l s t t 27241 cttcagacct acattcttca gatccggaag atccttaaga gcgagggtga ggccgagggc gaagtctgga tgtaagaagt ctaggccttc taggaattct cgctcccact ccggctcccg >.............................msnR1.............................> l q t y i l q i r k i l k s e g e a e g 27301 tatggggaag ccggggaaaa cgggctgcca agctcgataa tcacccatcc gggaggctat ataccccttc ggcccctttt gcccgacggt tcgagctatt agtgggtagg ccctccgata >.............................msnR1.............................> y g e a g e n g l p s s i i t h p g g y 27361 cttctccaga ctccggagtc gaccaagaaa gacttcgaag atttcaatga atccgttgaa gaagaggtct gaggcctcag ctggttcttt ctgaagcttc taaagttact taggcaactt >.............................msnR1.............................> l l q t p e s t k k d f e d f n e s v e 27421 aaaggtcatc gggagatgct gttcggccac tacgcggaag cggtgcgcat actctccgac tttccagtag ccctctacga caagccggtg atgcgccttc gccacgcgta tgagaggctg >.............................msnR1.............................> k g h r e m l f g h y a e a v r i l s d 27481 gcgctctccc tgtggcgtgg ctcggccctg gtcgacgtcc accgcggctc cctgctcgac cgcgagaggg acaccgcacc gagccgggac cagctgcagg tggcgccgag ggacgagctg >.............................msnR1.............................> a l s l w r g s a l v d v h r g s l l d 27541 agttacgccg tgcggctgga agaggcccgg ctgtccgcgc agatcctgcg cacggacgcc tcaatgcggc acgccgacct tctccgggcc gacaggcgcg tctaggacgc gtgcctgcgg >.............................msnR1.............................> s y a v r l e e a r l s a q i l r t d a Anhang 423 27601 tgcctcggac agggctgcga ccttcagctt ctccccgaac tgaattccct ggtcgggctg acggagcctg tcccgacgct ggaagtcgaa gaggggcttg acttaaggga ccagcccgac >.............................msnR1.............................> c l g q g c d l q l l p e l n s l v g l 27661 catccgctca acgagaaact gcagtaccag cggatgctgg cgctgtaccg gtccgggcag gtaggcgagt tgctctttga cgtcatggtc gcctacgacc gcgacatggc caggcccgtc >.............................msnR1.............................> h p l n e k l q y q r m l a l y r s g q 27721 gtggccgaat cgctccagag ttaccggaat ttctactccg tcgtgaagga gcaggtcggc caccggctta gcgaggtctc aatggcctta aagatgaggc agcacttcct cgtccagccg >.............................msnR1.............................> v a e s l q s y r n f y s v v k e q v g 27781 atcgagccgt ccccccagct ccaggagctt cagagagcca tcttcgactc cttgccggcc tagctcggca ggggggtcga ggtcctcgaa gtctctcggt agaagctgag gaacggccgg >.............................msnR1.............................> i e p s p q l q e l q r a i f d s l p a 27841 ctgtcggagc cgtccccttc cgcggagaca cacaaggtca tctcagggag cgtccgacgc gacagcctcg gcaggggaag gcgcctctgt gtgttccagt agagtccctc gcaggctgcg >.............................msnR1.............................> l s e p s p s a e t h k v i s g s v r r 27901 agcccgtgac ctcctgacgg cacgccacac gaggagaatc cccatggcct caccggctcg tcgggcactg gaggactgcc gtgcggtgtg ctcctcttag gggtaccgga gtggccgagc >.msnR1>> s p >>....msnH7......> m a s p a 27961 tgagtcggcc accgacgtgc ggcggatcac gctcgacgcc gacggcatca ctctgtccgc actcagccgg tggctgcacg ccgcctagtg cgagctgcgg ctgccgtagt gagacaggcg >.............................msnH7.............................> r e s a t d v r r i t l d a d g i t l s 28021 cctgctgagc gagcccgtcg aagcgccgcc ccgcgccgtc gtcgtagcac tgcacggcgg ggacgactcg ctcgggcagc ttcgcggcgg ggcgcggcag cagcatcgtg acgtgccgcc >.............................msnH7.............................> a l l s e p v e a p p r a v v v a l h g 28081 cggcatgaac gccaactact tcaccggccc ggcccacccg tcgctgtcgc tgctgtcgct gccgtacttg cggttgatga agtggccggg ccgggtgggc agcgacagcg acgacagcga >.............................msnH7.............................> g g m n a n y f t g p a h p s l s l l s 28141 gggggccgct ctcgggctca ccgtgctcgc cgtggaccgg cccggctacc gggcctccgc cccccggcga gagcccgagt ggcacgagcg gcacctggcc gggccgatgg cccggaggcg >.............................msnH7.............................> l g a a l g l t v l a v d r p g y r a s 28201 ggcccgactg ccggccggcc tgggcgtaag cgaacaggcc gggctcctgc gggcgacgct ccgggctgac ggccggccgg acccgcattc gcttgtccgg cccgaggacg cccgctgcga >.............................msnH7.............................> a a r l p a g l g v s e q a g l l r a t 28261 ggacgacttc gcagcccggt acgagaccgg ggccggattc tttctcctgg cacactccta cctgctgaag cgtcgggcca tgctctggcc ccggcctaag aaagaggacc gtgtgaggat >.............................msnH7.............................> l d d f a a r y e t g a g f f l l a h s 424 Anhang 28321 cggtggcaag gtcgcgctcg tcgccgccgc cgagcacccg ccgcagcggc tgatcggcct gccaccgttc cagcgcgagc agcggcggcg gctcgtgggc ggcgtcgccg actagccgga >.............................msnH7.............................> y g g k v a l v a a a e h p p q r l i g 28381 ggacatctcg ggctgcgggt acgcctacgc gatcgacccc ggccaggtgt cgaaagcgct cctgtagagc ccgacgccca tgcggatgcg ctagctgggg ccggtccaca gctttcgcga >.............................msnH7.............................> l d i s g c g y a y a i d p g q v s k a 28441 ggaacgcggc tgggtcccga aaagctgggg cccactgcgc ctctacccgc ccgggacgtt ccttgcgccg acccagggct tttcgacccc gggtgacgcg gagatgggcg ggccctgcaa >.............................msnH7.............................> l e r g w v p k s w g p l r l y p p g t 28501 cggcgccggg cgcgggctcg tcgaacccat gccccacgcc gaacgcgcgg agctgacgcg gccgcggccc gcgcccgagc agcttgggta cggggtgcgg cttgcgcgcc tcgactgcgc >.............................msnH7.............................> f g a g r g l v e p m p h a e r a e l t 28561 gtggcccgga ctcttccggg ccaccgcgcc cggcgtcgag gcgccggtgc gactgacctt caccgggcct gagaaggccc ggtggcgcgg gccgcagctc cgcggccacg ctgactggaa >.............................msnH7.............................> r w p g l f r a t a p g v e a p v r l t 28621 cgccgaacac gaggcgttct ggcggcatga cgacgtggcg ctggcagatc tgaccgcccg gcggcttgtg ctccgcaaga ccgccgtact gctgcaccgc gaccgtctag actggcgggc >.............................msnH7.............................> f a e h e a f w r h d d v a l a d l t a 28681 gttcaccgcc gcccggcaca tcaccgtcga ccggcagccg ggtgctggcc acaacatcag caagtggcgg cgggccgtgt agtggcagct ggccgtcggc ccacgaccgg tgttgtagtc >.............................msnH7.............................> r f t a a r h i t v d r q p g a g h n i 28741 cctgggctgg gcggcccgtt cgtaccatct gcgggccatc gccttcctgg agagctgcct ggacccgacc cgccgggcaa gcatggtaga cgcccggtag cggaaggacc tctcgacgga >.............................msnH7.............................> s l g w a a r s y h l r a i a f l e s c 28801 cgtcccgcac gaggcggtgc ccgcggccca cgccgccccg gaccctcggc catgagcggc gcagggcgtg ctccgccacg ggcgccgggt gcggcggggc ctgggagccg gtactcgccg >..........................msnH7..........................>> l v p h e a v p a a h a a p d p r p >>msnH8.> m s g 28861 ggccggccgc gccggaacat cgaccggggc atcttccggt ccctggccgt caggaacttc ccggccggcg cggccttgta gctggccccg tagaaggcca gggaccggca gtccttgaag >.............................msnH8.............................> g r p r r n i d r g i f r s l a v r n f 28921 cggttgttcg tgaccgggca ggcgctgtcg gtgtccgcca cctggatgat ggtcgtcgcc gccaacaagc actggcccgt ccgcgacagc cacaggcggt ggacctacta ccagcagcgg >.............................msnH8.............................> r l f v t g q a l s v s a t w m m v v a 28981 caggactggc tcgtcctctc gctgaccgga gactccggcc tggccctggg gttcgtcacc gtcctgaccg agcaggagag cgactggcct ctgaggccgg accgggaccc caagcagtgg >.............................msnH8.............................> q d w l v l s l t g d s g l a l g f v t Anhang 425 29041 gcggcccagt tcggcccgct gctgctgttc acacttcacg gcggaaagct cgcggaccgg cgccgggtca agccgggcga cgacgacaag tgtgaagtgc cgcctttcga gcgcctggcc >.............................msnH8.............................> a a q f g p l l l f t l h g g k l a d r 29101 tatgacaaac gcaggccgcc aaccattgcg tccagttggg tacggagccg ggctaccggg atactgtttg cgtccggcgg ttggtaacgc aggtcaaccc atgcctcggc ccgatggccc >.............................msnH8.............................> y d k r r p p t i a s s w v r s r a t g 29161 gtcgggtgct cgccctctac acgctgatca tgcagggatc caccaccgtg ggcgcagtga cagcccacga gcgggagatg tgcgactagt acgtccctag gtggtggcac ccgcgtcact >...........msnH8..........>> v g c s p s t r - 29221 tcacggggtg gatcatcgca tccctcggcg tgcgggcgag cctgtgcctg ggcggtcttg agtgccccac ctagtagcgt agggagccgc acgcccgctc ggacacggac ccgccagaac 29281 tcgctctgct cgcggctgtg tcggcgagtg cccgggaacc ctcccgggtg gcgggtgtca agcgagacga gcgccgacac agccgctcac gggcccttgg gagggcccac cgcccacagt msnR2 <<< - 29341 ccgaagaagc ccgtccgacg gaatcgggac cgccgtcacc agatcttccc tgcgcttcag ggcttcttcg ggcaggctgc cttagccctg gcggcagtgg tctagaaggg acgcgaagtc <.............................msnR2.............................< r l l g d s p i p v a t v l d e r r k l 29401 accgagcttc cggtagatct tcgtaaggtg ctgctcgacg gtgctcaccg tgatgcagag tggctcgaag gccatctaga agcattccac gacgagctgc cacgagtggc actacgtctc <.............................msnR2.............................< g l k r y i k t l h q e v t s v t i c l 29461 ccgggtcgcc acctctcggt tgctgtgccc gatgccggcc agccatgcca cccgccgttc ggcccagcgg tggagagcca acgacacggg ctacggccgg tcggtacggt gggcggcaag <.............................msnR2.............................< r t a v e r n s h g i g a l w a v r r e 29521 ggccgagctg agcagggcgg caccgctgac ggagggcttg gccgacgtgg cgggccgctg ccggctcgac tcgtcccgcc gtggcgactg cctcccgaac cggctgcacc gcccggcgac <.............................msnR2.............................< a s s l l a a g s v s p k a s t a p r q 29581 ccggcgatcg tccggcgcct cgcccgggtc gtcgtcgtcg gcggcgaggt ccgccggaga ggccgctagc aggccgcgga gcgggcccag cagcagcagc cgccgctcca ggcggcctct <.............................msnR2.............................< r r d d p a e g p d d d d a a l d a p s 29641 cgaggccatg accgcgtcag ccggtccgct ggccaccacg gcccgcagga gtggttcgga gctccggtac tggcgcagtc ggccaggcga ccggtggtgc cgggcgtcct caccaagcct <.............................msnR2.............................< s a m v a d a p g s a v v a r l l p e s 29701 cccggcgaac ccggcgatgc tccaggcccg gcgaatgagc acccggcccg ccttcggaag gggccgcttg ggccgctacg aggtccgggc cgcttactcg tgggccgggc ggaagccttc <.............................msnR2.............................< g a f g a i s w a r r i l v r g a k p l 426 Anhang 29761 gtcgagggcg tagtgggtac gccccaactc gtacagacag atggcgaggt cgacccgatg cagctcccgc atcacccatg cggggttgag catgtctgtc taccgctcca gctgggctac <.............................msnR2.............................< d l a y h t r g l e y l c i a l d v r h 29821 cacgccccct tccagcagac cgaccgcgtc gcgaaggagg tccgcccggg actcgaccgg gtgcggggga aggtcgtctg gctggcgcag cgcttcctcc aggcgggccc tgagctggcc <.............................msnR2.............................< v g g e l l g v a d r l l d a r s e v p 29881 gcgggcgagc gcgagcaccc gcagggctat cgccttcgcc ccggtgtcgc ccgaggtggc cgcccgctcg cgctcgtggg cgtcccgata gcggaagcgg ggccacagcg ggctccaccg <.............................msnR2.............................< r a l a l v r l a i a k a g t d g s t a 29941 gacgacctct ttcgcggtac gtgtcgcctc cttctcccgg cccaggagga gatacgcctg ctgctggaga aagcgccatg cacagcggag gaagagggcc gggtcctcct ctatgcggac <.............................msnR2.............................< v v e k a t r t a e k e r g l l l y a q 30001 cgcggacctg gaccgccagg ggcaggtggg cacggaagga atcgccaggc gcttttcgat gcgcctggac ctggcggtcc ccgtccaccc gtgccttcct tagcggtccg cgaaaagcta <.............................msnR2.............................< a s r s r w p c t p v s p i a l r k e i 30061 ctcaccgcac gcgagaaaat cccccagcgc ggaataaggc atcctgatgg tcagtcgata gagtggcgtg cgctctttta gggggtcgcg ccttattccg taggactacc agtcagctat <.............................msnR2.............................< e g c a l f d g l a s y p m r i t l r y 30121 cattccgcga gcatataagt acatgcggcc cagctccgat tcgtagaact tcgcgggcac gtaaggcgct cgtatattca tgtacgccgg gtcgaggcta agcatcttga agcgcccgtg <.............................msnR2.............................< m g r a y l y m r g l e s e y f k a p v 30181 gggtatgcgc agggtcgatt tcgcttcttc gaacttgccc tgttggacct gggaaaggat cccatacgcg tcccagctaa agcgaagaag cttgaacggg acaacctgga ccctttccta <.............................msnR2.............................< p i r l t s k a e e f k g q q v q s l i 30241 cagaacactc agtggaagac ccacgtagat gccccaactg gagggctggg agagcgcgct gtcttgtgag tcaccttctg ggtgcatcta cggggttgac ctcccgaccc tctcgcgcga <.............................msnR2.............................< l v s l p l g v y i g w s s p q s l a s 30301 gagggcatcc ttttcggcct tggccggatt tccgccggtc agtgcgctga ccgcctgtaa ctcccgtagg aaaagccgga accggcctaa aggcggccag tcacgcgact ggcggacatt <.............................msnR2.............................< l a d k e a k a p n g g t l a s v a q l 30361 gcagtgcagc atcatgcgcc ggaacgggct catacgtgcg gaggtgtctt tctccaggcc cgtcacgtcg tagtacgcgg ccttgcccga gtatgcacgc ctccacagaa agaggtccgg <.............................msnR2.............................< c h l m m r r f p s m r a s t d k e l g 30421 gtcgaggaag ggcatttccg gtagcacaag gcagatgtgg ttcaaaagcc tcgtggtgaa cagctccttc ccgtaaaggc catcgtgttc cgtctacacc aagttttcgg agcaccactt <.............................msnR2.............................< d l f p m e p l v l c i h n l l r t t f Anhang 427 30481 gaacccgata tcggtgatcc agttcgcctg gtcggcgtcc aggaagtagg agcggaccgt cttgggctat agccactagg tcaagcggac cagccgcagg tccttcatcc tcgcctggca <.............................msnR2.............................< f g i d t i w n a q d a d l f y s r v t 30541 ctgcttccgc actttgcaag cccatggcgt tctgcccagg ccggcatcga cgaccgccgc gacgaaggcg tgaaacgttc gggtaccgca agacgggtcc ggccgtagct gctggcggcg <.............................msnR2.............................< q k r v k c a w p t r g l g a d v v a a 30601 cgtcgcatcg cccaaccaca gagcggcgga tgtggtggcg tgctccgggc cggccgggga gcagcgtagc gggttggtgt ctcgccgcct acaccaccgc acgaggcccg gccggcccct <.............................msnR2.............................< t a d g l w l a a s t t a h e p g a p s 30661 agggtccggc gctgtcgcct gcccgggtgc cgcttgcggc ctccccacca ggctgaggtg tcccaggccg cgacagcgga cgggcccacg gcgaacgccg gaggggtggt ccgactccac <.............................msnR2.............................< p d p a t a q g p a a q p r g v l s l h 30721 cctgtccagt tccccgcggt ccgggtcgct caacaggccc agcagctggt cggcctccgt ggacaggtca aggggcgcca ggcccagcga gttgtccggg tcgtcgacca gccggaggca <.............................msnR2.............................< r d l e g r d p d s l l g l l q d a e t 30781 ctgccgcccg gtccaggcga gcatcgcaga gaccgatatg acactgcggc cgggcagtcg gacggcgggc caggtccgct cgtagcgtct ctggctatac tgtgacgccg gcccgtcagc <.............................msnR2.............................< q r g t w a l m a s v s i v s r g p l r 30841 cccgcgctgg gcgagcgaga ccagttcggg gaggtagctc agggccgcat gggcgtccac gggcgcgacc cgctcgctct ggtcaagccc ctccatcgag tcccggcgta cccgcaggtg <.............................msnR2.............................< g r q a l s v l e p l y s l a a h a d v 30901 ccgccacttg gcgcagacgg tttccatcag gacctccggc tgttcgccgg ggtcgcacgg ggcggtgaac cgcgtctgcc aaaggtagtc ctggaggccg acaagcggcc ccagcgtgcc <.............................msnR2.............................< r w k a c v t e m l v e p q e g p d c p 30961 agatgtgcgc gccaggtcca gacagttcac cgcctcatgc cactcgccat ggacctgtgc tctacacgcg cggtccaggt ctgtcaagtg gcggagtacg gtgagcggta cctggacacg <.............................msnR2.............................< s t r a l d l c n v a e h w e g h v q a 31021 ctgtcgcgcg gcctcccgca gtacggccgt ctcccaggac tccgtcgcga ctccggcggc gacagcgcgc cggagggcgt catgccggca gagggtcctg aggcagcgct gaggccgccg <.............................msnR2.............................< q r a a e r l v a t e w s e t a v g a a 31081 gagaatgtac tcggctacct tgcgttcgga cgcgcctcgt tgatgcagca gccgcgccgc ctcttacatg agccgatgga acgcaagcct gcgcggagca actacgtcgt cggcgcggcg <.............................msnR2.............................< l i y e a v k r e s a g r q h l l r a a 31141 cgaccgatgg aagtccacgc gctccctgaa agcggggtcc tccaagatca cggcacggat gctggctacc ttcaggtgcg cgagggactt tcgccccagg aggttctagt gccgtgccta <.............................msnR2.............................< s r h f d v r e r f a p d e l i v a r i 428 Anhang 31201 cgccgggtgc ctgaaagcac cgtccgaggc cagcccgatc gcctcgatca gctcaacggc gcggcccacg gactttcgtg gcaggctccg gtcgggctag cggagctagt cgagttgccg <.............................msnR2.............................< a p h r f a g d s a l g i a e i l e v a 31261 gtccgctgtc tcggtcggct cgaccccgct cagggcgctc aacagcgcga ccggcacacc caggcgacag agccagccga gctggggcga gtcccgcgag ttgtcgcgct ggccgtgtgg <.............................msnR2.............................< d a t e t p e v g s l a s l l a v p v g 31321 accgccgagg accgccatgg ctcgggcgac cccttcgaga ttggccacat agctgttgca tggcggctcc tggcggtacc gagcccgctg gggaagctct aaccggtgta tcgacaacgt <.............................msnR2.............................< g g l v a m a r a v g e l n a v y s n c 31381 gaccaacagc ttcaccacct cccggaagcc cggtccctgg tccagcccct gctccggcga ctggttgtcg aagtggtgga gggccttcgg gccagggacc aggtcgggga cgaggccgct <.............................msnR2.............................< v l l k v v e r f g p g q d l g q e p s 31441 atgtcccgac cccggcagag ccttcatgcc ctgggcgaca gtcgccagca ggcgcgcgtt tacagggctg gggccgtctc ggaagtacgg gacccgctgt cagcggtcgt ccgcgcgcaa <.............................msnR2.............................< h g s g p l a k m g q a v t a l l r a n 31501 ccccccggtc agctccatgg ctttcttcac atgggccggc gtggggcgac tccccgtcac ggggggccag tcgaggtacc gaaagaagtg tacccggccg caccccgctg aggggcagtg <.............................msnR2.............................< g g t l e m a k k v h a p t p r s g t v 31561 cttccggatc agcttggccg cttcgcgcga cgtgaaaagc gacagttcca gaaccagcag gaaggcctag tcgaaccggc gaagcgcgct gcacttttcg ctgtcaaggt cttggtcgtc <.............................msnR2.............................< k r i l k a a e r s t f l s l e l v l l 31621 ggaggggttc ttcatgaggt cgaaccgaaa gtcccgaagc tgcctcgaat cggcgggata cctccccaag aagtactcca gcttggcttt cagggcttcg acggagctta gccgccctat <.............................msnR2.............................< s p n k m l d f r f d r l q r s d a p y 31681 acagccggag agaatcagga agacgggaag tcgctgcagt cggtacagca gagaacgcag tgtcggcctc tcttagtcct tctgcccttc agcgacgtca gccatgtcgt ctcttgcgtc <.............................msnR2.............................< c g s l i l f v p l r q l r y l l s r l 31741 cacccagagt gagggtgcgt cggcgaggtg caggtcgtcc acgatgagga cggtgggaga gtgggtctca ctcccacgca gccgctccac gtccagcagg tgctactcct gccaccctct <.............................msnR2.............................< v w l s p a d a l h l d d v i l v t p s 31801 cgttccgtcg agccgccgga gcgactcctc tatctgggcg tacatcctgg atgccaggga gcaaggcagc tcggcggcct cgctgaggag atagacccgc atgtaggacc tacggtccct <.............................msnR2.............................< t g d l r r l s e e i q a y m r s a l s 31861 acggcacggc ccgcagagct gtgccacctc tccgccgcag cagtgcgtgg tctccaacag tgccgtgccg ggcgtctcga cacggtggag aggcggcgtc gtcacgcacc agaggttgtc <.............................msnR2.............................< r c p g c l q a v e g g c c h t t e l l Anhang 429 31921 gcattccgcg tccgcgttcc gcacgatctc gtcgtcgaac agtcttttga tcagtcccag cgtaaggcgc aggcgcaagg cgtgctagag cagcagcttg tcagaaaact agtcagggtc <.............................msnR2.............................< c e a d a n r v i e d d f l r k i l g l 31981 cggtacatcc cgctccgtca gcaccccggc gacttcgcga accactgttc cggcgtcacg gccatgtagg gcgaggcagt cgtggggccg ctgaagcgct tggtgacaag gccgcagtgc <.............................msnR2.............................< p v d r e t l v g a v e r v v t g a d r 32041 cgcttcccgg gcgaaccgtt cgagcgagac ggtctttccc accccgaatg caccgtgtac gcgaagggcc cgcttggcaa gctcgctctg ccagaaaggg tggggcttac gtggcacatg <.............................msnR2.............................< a e r a f r e l s v t k g v g f a g h v 32101 caccgccact cctccaccgt cttcgagcga cgtccgcatg aattcccaaa gcgtggatgt gtggcggtga ggaggtggca gaagctcgct gcaggcgtac ttaagggttt cgcacctaca <.............................msnR2.............................< v a v g g g d e l s t r m f e w l t s t 32161 cacttcactc tgacttgcca ccgaagtgct ccggtttctt caccgttccg aacaggtcag gtgaagtgag actgaacggt ggcttcacga ggccaaagaa gtggcaaggc ttgtccagtc <........msnR2.......<< v e s q s a v 32221 gaaacgccca cagttcaccg tgttcgtttc ctgaccacct cctacccacc gccccaagtg ctttgcgggt gtcaagtggc acaagcaaag gactggtgga ggatgggtgg cggggttcac 32281 cttgaactct taagagttgt gtaagcggac gatgccggac atgacgtggt ggttgcgcat gaacttgaga attctcaaca cattcgcctg ctacggcctg tactgcacca ccaacgcgta 32341 ggggaaaggt gcacaagcga gccgtcttcg cgcttgcccg gcgccgcccg acgttctgtc cccctttcca cgtgttcgct cggcagaagc gcgaacgggc cgcggcgggc tgcaagacag 32401 aatcaatgcc gcgtattata tgcgattcgg ccgaattttc ctcctcgtcg gccagacgga ttagttacgg cgcataatat acgctaagcc ggcttaaaag gaggagcagc cggtctgcct 32461 gcggcggcgt gagggggtcg gtcgtggaac gagcgacatg tcgatgggcg aagggatgct cgccgccgca ctcccccagc cagcaccttg ctcgctgtac agctacccgc ttccctacga 32521 cgcggtattg cttctcggcc tcgtgcgagg tgtcgtgcac cctgtcctcc ttgtacgggt gcgccataac gaagagccgg agcacgctcc acagcacgtg ggacaggagg aacatgccca 32581 cagcgcaacg cgggactcaa gagagaccgt gccgagggct cgcgtacgcg agccatggcg gtcgcgttgc gccctgagtt ctctctggca cggctcccga gcgcatgcgc tcggtaccgc 32641 tcgtgcggct cagtagcggt agtggtcggg cttgtacggg ccctcgacct ggacaccgat agcacgccga gtcatcgcca tcaccagccc gaacatgccc gggagctgga cctgtggcta <<.......................msnM1.........................< - y r y h d p k y p g e v q v g i 32701 gtacgaggcc tgctcggggc ggagcgtggt cagtttgacg ccgagggcgt cgaggtggag catgctccgg acgagccccg cctcgcacca gtcaaactgc ggctcccgca gctccacctc <.............................msnM1.............................< y s a q e p r l t t l k v g l a d l h l 32761 gcgggcgacc ttctcgtcga ggtgcttggg cagcgtgtag acgccggtgg ggtactcgtc cgcccgctgg aagagcagct ccacgaaccc gtcgcacatc tgcggccacc ccatgagcag <.............................msnM1.............................< r a v k e d l h k p l t y v g t p y e d 430 Anhang 32821 gggcttggtg aacagctcga tctgggccag ggtctggtcc gcgaaggagt tggacatcac cccgaaccac ttgtcgagct agacccggtc ccagaccagg cgcttcctca acctgtagtg <.............................msnM1.............................< p k t f l e i q a l t q d a f s n s m v 32881 gaacgacggg tgaccggtgg cgttgcccag gttcagcagg cggccctcgg acaggacgat cttgctgccc actggccacc gcaacgggtc caagtcgtcc gccgggagcc tgtcctgcta <.............................msnM1.............................< f s p h g t a n g l n l l r g e s l v i 32941 gaggaccttg ccgtcgcgga acttccacgt gtggacctgc ggcttgacct cgtccttgac ctcctggaac ggcagcgcct tgaaggtgca cacctggacg ccgaactgga gcaggaactg <.............................msnM1.............................< l v k g d r f k w t h v q p k v e d k v 33001 gatgcccggc atcttggcca gtccggccat gtcgatctcg ttgtcgaagt ggccgatgtt ctacgggccg tagaaccggt caggccggta cagctagagc aacagcttca ccggctacaa <.............................msnM1.............................< i g p m k a l g a m d i e n d f h g i n 33061 gcccacgatc gcctggtgct tcatcttggc catgtcgccg gccatgatga tgtccttgtt cgggtgctag cggaccacga agtagaaccg gtacagcggc cggtactact acaggaacaa <.............................msnM1.............................< g v i a q h k m k a m d g a m i i d k n 33121 gccggtcgtc gtgatgaaga tgtccgcatg gtccacgacg tcgtcgaggg tcgcgacctg cggccagcag cactacttct acaggcgtac caggtgctgc agcagctccc agcgctggac <.............................msnM1.............................< g t t t i f i d a h d v v d d l t a v q 33181 gtagccgtcc atcgccgcct gcagagcgca gatcgggtcg atctccgtga cgatgacacg catcggcagg tagcggcgga cgtctcgcgt ctagcccagc tagaggcact gctactgtgc <.............................msnM1.............................< y g d m a a q l a c i p d i e t v i v r 33241 ggcgccctgg ccgcgcagcg actccgcaca gcccttgccc acatcgccgt agccgaacac ccgcgggacc ggcgcgtcgc tgaggcgtgt cgggaacggg tgtagcggca tcggcttgtg <.............................msnM1.............................< a g q g r l s e a c g k g v d g y g f v 33301 gaccgcggtc ttgccgccga tgaggacgtc ggtggcgcgg ttgatgccgt cgatcaggga ctggcgccag aacggcggct actcctgcag ccaccgcgcc aactacggca gctagtccct <.............................msnM1.............................< v a t k g g i l v d t a r n i g d i l s 33361 gtggcggcag ccgtacttgt tgtcgaactt cgacttggtg acggcgtcgt tcacgttgat caccgccgtc ggcatgaaca acagcttgaa gctgaaccac tgccgcagca agtgcaacta <.............................msnM1.............................< h r c g y k n d f k s k t v a d n v n i 33421 cgcggggaac aggaggtcgc cgtcgcgctg catctcgtac aggcggtgga cgccggtggt gcgccccttg tcctccagcg gcagcgcgac gtagagcatg tccgccacct gcggccacca <.............................msnM1.............................< a p f l l d g d r q m e y l r h v g t t 33481 ggtctcctcg gtcacgccgc ggatctccga ggcgagctgg gtccacttct gcgagccctc ccagaggagc cagtgcggcg cctagaggct ccgctcgacc caggtgaaga cgctcgggag <.............................msnM1.............................< t e e t v g r i e s a l q t w k q s g e Anhang 431 33541 ggtgatggtc cggtcgagga gtccgaggac gacacggtgc tcgtcggact cggcggtgtc ccactaccag gccagctcct caggctcctg ctgtgccacg agcagcctga gccgccacag <.............................msnM1.............................< t i t r d l l g l v v r h e d s e a t d 33601 ggcggagggg accttgccct ccttctcgta ctggacgccc ttgtggacga gcatggtggc ccgcctcccc tggaacggga ggaagagcat gacctgcggg aacacctgct cgtaccaccg <.............................msnM1.............................< a s p v k g e k e y q v g k h v l m t a 33661 gtcgccgccg tcgtccagga tcatattcgg gccgccgttg ggggtgttcg gccaggtcag cagcggcggc agcaggtcct agtataagcc cggcggcaac ccccacaagc cggtccagtc <.............................msnM1.............................< d g g d d l i m n p g g n p t n p w t l 33721 cgcctgctcc gtgcaccacc agtactcctc cagggtctcg cccttccagg cgaagaccgg gcggacgagg cacgtggtgg tcatgaggag gtcccagagc gggaaggtcc gcttctggcc <.............................msnM1.............................< a q e t c w w y e e l t e g k w a f v p 33781 gacgccctgc gggttctcgg gcgtaccgtt cggaccgacc gcgatcgcgg cggcggcgtg ctgcgggacg cccaagagcc cgcatggcaa gcctggctgg cgctagcgcc gccgccgcac <.............................msnM1.............................< v g q p n e p t g n p g v a i a a a a h 33841 gtcctgggtg gagaagatgt tgcaggacac ccagcggacc tcggcgccca gggcgaccag caggacccac ctcttctaca acgtcctgtg ggtcgcctgg agccgcgggt cccgctggtc <.............................msnM1.............................< d q t s f i n c s v w r v e a g l a v l 33901 ggtctcgatc aggacggcgg tctgcacggt catgtgcagc gagcccatga tccgggcgcc ccagagctag tcctgccgcc agacgtgcca gtacacgtcg ctcgggtact aggcccgcgg <.............................msnM1.............................< t e i l v a t q v t m h l s g m i r a g 33961 gaccagcggc tgagtggcgg cgaactcctt gcggatcgcc atcaggccgg gcatctcgtg ctggtcgccg actcaccgcc gcttgaggaa cgcctagcgg tagtccggcc cgtagagcac <.............................msnM1.............................< v l p q t a a f e k r i a m l g p m e h 34021 ctcggcgaga gtgatctcct tgcggccgaa cgcggccagg gagagatcgg cgaccttgaa gagccgctct cactagagga acgccggctt gcgccggtcc ctctctagcc gctggaactt <.............................msnM1.............................< e a l t i e k r g f a a l s l d a v k f 34081 gtccgtgaag tcagctgact gctgagagga catgcgtgct cctgagtcgg ttgtaaatgt caggcacttc agtcgactga cgactctcct gtacgcacga ggactcagcc aacatttaca <..............msnM1..............<< d t f d a s q q s s m <<......................msnM2........................< - s v a s l v h t s r l r n y i 34141 tcttgtgaat ctcaagggcg gcggtggacc ggttgagggt gatgtagtgc agacccggcg agaacactta gagttcccgc cgccacctgg ccaactccca ctacatcacg tctgggccgc <.............................msnM2.............................< n k h i e l a a t s r n l t i y h l g p 34201 caccctccgc tagcagccgg tccgccatgg tggtcgcgta ctccacgccg atgcggtggc gtgggaggcg atcgtcggcc aggcggtacc accagcgcat gaggtgcggc tacgccaccg <.............................msnM2.............................< a g e a l l r d a m t t a y e v g i r h 432 Anhang 34261 cgtccgccgg atcggcccgt gccgcctcca gacggagggc gaggcctacg gggaacgccg gcaggcggcc tagccgggca cggcggaggt ctgcctcccg ctccggatgc cccttgcggc <.............................msnM2.............................< g d a p d a r a a e l r l a l g v p f a 34321 cgtgggacag ttcggcgaat cgggtgatct gccgtacgtc ggtggcgggc atgattcccg gcaccctgtc aagccgctta gcccactaga cggcatgcag ccaccgcccg tactaagggc <.............................msnM2.............................< a h s l e a f r t i q r v d t a p m i g 34381 gaatgaccgg agtgggacac ccggccgccg ctacgcggtc acgtagccgc aaatagtcct cttactggcc tcaccctgtg ggccggcggc gatgcgccag tgcatcggcg tttatcagga <.............................msnM2.............................< p i v p t p c g a a a v r d r l r l y d 34441 ccacatggaa gaacatctgg gtgacggcgt aatcggcgcc tgcccggcac ttggccacga ggtgtacctt cttgtagacc cactgccgca ttagccgcgg acgggccgtg aaccggtgct <.............................msnM2.............................< e v h f f m q t v a y d a g a r c k a v 34501 aatgccgaat gtcgctctcc cagtcgggtg agcgtggatg cttctccggg aacgccgcca ttacggctta cagcgagagg gtcagcccac tcgcacctac gaagaggccc ttgcggcggt <.............................msnM2.............................< f h r i d s e w d p s r p h k e p f a a 34561 cacccacact gaaagcaccc gaccgccgta ccaggcggac gagttcccag gcgtacgcaa gtgggtgtga ctttcgtggg ctggcggcat ggtccgcctg ctcaagggtc cgcatgcgtt <.............................msnM2.............................< v g v s f a g s r r v l r v l e w a y a 34621 agcccttcgg atgcggcagc cattccctgt tggggtcacc gggcggatca ccccgcagag tcgggaagcc tacgccgtcg gtaagggaca accccagtgg cccgcctagt ggggcgtctc <.............................msnM2.............................< f g k p h p l w e r n p d g p p d g r l 34681 ccagtacgtc ccgtaccccg gcgtccgcgt attggccgat gacctggcgc agttcctcga ggtcatgcag ggcatggggc cgcaggcgca taaccggcta ctggaccgcg tcaaggagct <.............................msnM2.............................< a l v d r v g a d a y q g i v q r l e e 34741 cggagtgtcc gaccgcggtc aggtgtacga caggccgcag agtcgtctcc gcggcgatgc gcctcacagg ctggcgccag tccacatgct gtccggcgtc tcagcagagg cgccgctacg <.............................msnM2.............................< v s h g v a t l h v v p r l t t e a a i 34801 gcctggagac ctccagcgtg cgatcgcggg tggaaccccc cgcgccatag gtgacagaga cggacctctg gaggtcgcac gctagcgccc accttggggg gcgcggtatc cactgtctct <.............................msnM2.............................< r r s v e l t r d r t s g g a g y t v s 34861 cgaaagccgg agccaagggc tcgatacggc ggatcgtctt ccacagggtt cgagtccctg gctttcggcc tcggttcccg agctatgccg cctagcagaa ggtgtcccaa gctcagggac <.............................msnM2.............................< v f a p a l p e i r r i t k w l t r t g 34921 cctcggtttt gggagggaag aattcgaagg aaatggagtg attgccgctc gcaaggattt ggagccaaaa ccctcccttc ttaagcttcc tttacctcac taacggcgag cgttcctaaa <.............................msnM2.............................< a e t k p p f f e f s i s h n g s a l i Anhang 433 34981 cgtgcagggc gctcatgcac gtgctcccgt attgaagtac ttggcttcgg ggtgatggat gcacgtcccg cgagtacgtg cacgagggca taacttcatg aaccgaagcc ccactaccta <.....msnM2....<< e h l a s m <<.....................msnM3.......................< - a r a g t n f y k a e p h h i 35041 cacgatcgcg tcggtggact gctcggggtg gagctggaac tcctccgaga gctgtacgcc gtgctagcgc agccacctga cgagccccac ctcgaccttg aggaggctct cgacatgcgg <.............................msnM3.............................< v i a d t s q e p h l q f e e s l q v g 35101 gatccgctcg ggctccagca gttccgcgat cttggcgcgg tcctccaggt cgggacaggc ctaggcgagc ccgaggtcgt caaggcgcta gaaccgcgcc aggaggtcca gccctgtccg <.............................msnM3.............................< i r e p e l l e a i k a r d e l d p c a 35161 gccgtagccg agggagaatc gggcaccccg gtacttgagg tcgaacatgt cttcgatcac cggcatcggc tccctcttag cccgtggggc catgaactcc agcttgtaca gaagctagtg <.............................msnM3.............................< g y g l s f r a g r y k l d f m d e i v 35221 ggtcgggtcc tcccctgcga atcccagctc cgagcggacg cgggcgtgcc agtactcggc ccagcccagg aggggacgct tagggtcgag gctcgcctgc gcccgcacgg tcatgagccg <.............................msnM3.............................< t p d e g a f g l e s r v r a h w y e a 35281 gagggcctcg gccagctgca cggacaggcc gtggagttcg aggtagtcgc ggtaggagtt ctcccggagc cggtcgacgt gcctgtccgg cacctcaagc tccatcagcg ccatcctcaa <.............................msnM3.............................< l a e a l q v s l g h l e l y d r y s n 35341 ggactcgaag agcttggcgg tctcctcgcc gatgcgggag ccgacggtga cgacctgaag cctgagcttc tcgaaccgcc agaggagcgg ctacgccctc ggctgccact gctggacttc <.............................msnM3.............................< s e f l k a t e e g i r s g v t v v q l 35401 gccgaccacg tcggtctcgc cggactcctc cgggcggaag aagtcggcca ggcacagccg cggctggtgc agccagagcg gcctgaggag gcccgccttc ttcagccggt ccgtgtcggc <.............................msnM3.............................< g v v d t e g s e e p r f f d a l c l r 35461 gcggccccgt cgctgccgcg ggaaggagaa ccgggtcctt tcgttgccgt cgtcgtccag cgccggggca gcgacggcgc ccttcctctt ggcccaggaa agcaacggca gcagcaggtc <.............................msnM3.............................< r g r r q r p f s f r t r e n g d d d l 35521 gatgatcagg tcgtcgtcct tggagacgca ggggaagtag ccgtagacga cggccgcttc ctactagtcc agcagcagga acctctgcgt ccccttcatc ggcatctgct gccggcgaag <.............................msnM3.............................< i i l d d d k s v c p f y g y v v a a e 35581 gaggaggttg tcggtctgca gcttgtccag caggccgcgc agccggggcc ggccctcggt ctcctccaac agccagacgt cgaacaggtc gtccggcgcg tcggccccgg ccgggagcca <.............................msnM3.............................< l l n d t q l k d l l g r l r p r g e t 35641 ctcgacgagt tcctcgtagg tcggcccgtc gccggtgcgg gcctgcttca gcccccactg gagctgctca aggagcatcc agccgggcag cggccacgcc cggacgaagt cgggggtgac <.............................msnM3.............................< e v l e e y t p g d g t r a q k l g w q 434 Anhang 35701 ccccttgaag agggcgccct cgtccagcca ggtcgcgtac tccttgagct ggatgccctt ggggaacttc tcccgcggga gcaggtcggt ccagcgcatg aggaactcga cctacgggaa <.............................msnM3.............................< g k f l a g e d l w t a y e k l q i g k 35761 gatgacgcgg gtgccccgga acgggggcgt ggggacgggg ttgtcggtgg cgacgtcgga ctactgcgcc cacggggcct tgcccccgca cccctgcccc aacagccacc gctgcagcct <.............................msnM3.............................< i v r t g r f p p t p v p n d t a v d s 35821 gcggacgtgg ccctcctcgg ggcgctcctc gaccgccgtg gcggtggccg tcgcccgtac cgcctgcacc gggaggagcc ccgcgaggag ctggcggcac cgccaccggc agcgggcatg <.............................msnM3.............................< r v h g e e p r e e v a t a t a t a r v 35881 gcggcgctgc ctcagctcgg gcagggtcgc ccccggcacg ccgcgcttga cgccgatgag cgccgcgacg gagtcgagcc cgtcccagcg ggggccgtgc ggcgcgaact gcggctactc <.............................msnM3.............................< r r q r l e p l t a g p v g r k v g i l 35941 ggcgtccatc aggcgcaggc cctcgaaggc gtcgcgggcg tagcggacct cgccgccgta ccgcaggtag tccgcgtccg ggagcttccg cagcgcccgc atcgcctgga gcggcggcat <.............................msnM3.............................< a d m l r l g e f a d r a y r v e g g y 36001 gatctcgtac aggtcctgct cgacgtaggc gcgggtgagg gcggcgccgc cgaggatgac ctagagcatg tccaggacga gctgcatccg cgcccactcc cgccgcggcg gctcctactg <.............................msnM3.............................< i e y l d q e v y a r t l a a g g l i v 36061 cgggtagtcg gcggccaggc cgcgctggtt cagctcctcc aggttctcct tcatgatcac gcccatcagc cgccggtccg gcgcgaccaa gtcgaggagg tccaagagga agtactagtg <.............................msnM3.............................< p y d a a l g r q n l e e l n e k m i v 36121 tgtggacttg accaggaggc cggacatgcc gatgacgtcg gcccggtgct ccttggccgc acacctgaac tggtcctccg gcctgtacgg ctactgcagc cgggccacga ggaaccggcg <.............................msnM3.............................< t s k v l l g s m g i v d a r h e k a a 36181 gtcgaggatc gcggagaccg gctgtttgat gccgaggttg acgacgttgt agccgttgtt cagctcctag cgcctctggc cgacaaacta cggctccaac tgctgcaaca tcggcaacaa <.............................msnM3.............................< d l i a s v p q k i g l n v v n y g n n 36241 ggacaggatg atgtcgacga ggttcttgcc gatgtcgtgg acgtcgccgc gcacggtcgc cctgtcctac tacagctgct ccaagaacgg ctacagcacc tgcagcggcg cgtgccagcg <.............................msnM3.............................< s l i i d v l n k g i d h v d g r v t a 36301 caggacgatg gtgcccttgc cctcggcgtc ggacttctcc atgtgcggtt cgaggtgggc gtcctgctac cacgggaacg ggagccgcag cctgaagagg tacacgccaa gctccacccg <.............................msnM3.............................< l v i t g k g e a d s k e m h p e l h a 36361 gacggcggtc ttcatgacct cggcggactg gagcacgaac ggcagctgca tctgtccgga ctgccgccag aagtactgga gccgcctgac ctcgtgcttg ccgtcgacgt agacaggcct <.............................msnM3.............................< v a t k m v e a s q l v f p l q m q g s Anhang 435 36421 gccgaacagc tcgccgacga ccttcatgcc gtccaggagg gtgtcgttga cgatgtcgag cggcttgtcg agcggctgct ggaagtacgg caggtcctcc cacagcaact gctacagctc <.............................msnM3.............................< g f l e g v v k m g d l l t d n v i d l 36481 ggcgggacgg gtccgcaggg cctcgtcgag gtccgcttcg aggccgttct tctcgccgtc ccgccctgcc caggcgtccc ggagcagctc caggcgaagc tccggcaaga agagcggcag <.............................msnM3.............................< a p r t r l a e d l d a e l g n k e g d 36541 gatgatgcgg cgcttgaggc gttcctccag cgggagggcg gccagttcct cggccttgcc ctactacgcc gcgaactccg caaggaggtc gccctcccgc cggtcaagga gccggaacgg <.............................msnM3.............................< i i r r k l r e e l p l a a l e e a k g 36601 ggccttcagg gacttggcgg tggcgccctc gaagagcgcc atgagcttct ggagggggtc ccggaagtcc ctgaaccgcc accgcgggag cttctcgcgg tactcgaaga cctcccccag <.............................msnM3.............................< a k l s k a t a g e f l a m l k q l p d 36661 gtagccctcg gcgcggcggt cgtggatgag gtcgagagcg gtctgcacct cctcctcgct catcgggagc cgcgccgcca gcacctactc cagctctcgc cagacgtgga ggaggagcga <.............................msnM3.............................< y g e a r r d h i l d l a t q v e e e s 36721 gaagcgggcg atcggcagga tcttcgaggc gtgcacgatc gccgagtcca ggcccgcctt cttcgcccgc tagccgtcct agaagctccg cacgtgctag cggctcaggt ccgggcggaa <.............................msnM3.............................< f r a i p l i k s a h v i a s d l g a k 36781 cacgcactcg tcgaggaaga cggagttgag gaggatgcgg gcggccggat tgaggccgaa gtgcgtgagc agctccttct gcctcaactc ctcctacgcc cgccggccta actccggctt <.............................msnM3.............................< v c e d l f v s n l l i r a a p n l g f 36841 ggagatgttc gacagaccca gcgtcgtctg cacctcgggg tggcggcgct tgagttcgcg cctctacaag ctgtctgggt cgcagcagac gtggagcccc accgccgcga actcaagcgc <.............................msnM3.............................< s i n s l g l t t q v e p h r r k l e r 36901 gatcgcctcg atggtggcga tgccgtcctt gcgggactcc tcctggccgg tgcagatggt ctagcggagc taccaccgct acggcaggaa cgccctgagg aggaccggcc acgtctacca <.............................msnM3.............................< i a e i t a i g d k r s e e q g t c i t 36961 gaaggtcagg gtgtcgatga ggatgtccga ctcgtggatg ccccagttgc cggtgaggtc cttccagtcc cacagctact cctacaggct gagcacctac ggggtcaacg gccactccag <.............................msnM3.............................< f t l t d i l i d s e h i g w n g t l d 37021 gtcgatgagg cgttcggcga tcgcgacctt cgtctccggc gtgcgggcct gcccctcctc cagctactcc gcaagccgct agcgctggaa gcagaggccg cacgcccgga cggggaggag <.............................msnM3.............................< d i l r e a i a v k t e p t r a q g e e 37081 gtcgatggtc agcgcgatca gcgcggcgcc gtgctcctgg gcgagcgcgg tgaccttggc cagctaccag tcgcgctagt cgcgccgcgg cacgaggacc cgctcgcgcc actggaaccg <.............................msnM3.............................< d i t l a i l a a g h e q a l a t v k a 436 Anhang 37141 gaagcgggac tcggggccgt cgccgtcctc gtagttgacg gagttgatga ccgcacggcc cttcgccctg agccccggca gcggcaggag catcaactgc ctcaactact ggcgtgccgg <.............................msnM3.............................< f r s e p g d g d e y n v s n i v a r g 37201 gccgagcttc tccagcccgg cccggatgac gggcacttcg gtggagtcca gcacgatcgg cggctcgaag aggtcgggcc gggcctactg cccgtgaagc cacctcaggt cgtgctagcc <.............................msnM3.............................< g l k e l g a r i v p v e t s d l v i p 37261 gagggtggag gcggtggcga agcgaccggc gagttcggcc atgtcggcga cgccgtcgcg ctcccacctc cgccaccgct tcgctggccg ctcaagccgg tacagccgct gcggcagcgc <.............................msnM3.............................< l t s a t a f r g a l e a m d a v g d r 37321 gcccacgtag tcgacacaca ggtcgagcat gtgggcgccc tcgcggatct ggtcgcgggc cgggtgcatc agctgtgtgt ccagctcgta cacccgcggg agcgcctaga ccagcgcccg <.............................msnM3.............................< g v y d v c l d l m h a g e r i q d r a 37381 catctccaca cagtcgtccc agcgggcctc cagcatggcc tcacggaact tcttcgaccc gtagaggtgt gtcagcaggg tcgcccggag gtcgtaccgg agtgccttga agaagctggg <.............................msnM3.............................< m e v c d d w r a e l m a e r f k k s g 37441 gttggcgttc gtccgctcgc cgatcgccat gtacgcggtg tcctggcgga acgggacggt caaccgcaag caggcgagcg gctagcggta catgcgccac aggaccgcct tgccctgcca <.............................msnM3.............................< n a n t r e g i a m y a t d q r f p v t 37501 ctggtagagc gaggcggcgc ccggctcggg gcgcgggtcg cgtgcgccgg gcgtgaggtc gaccatctcg ctccgccgcg ggccgagccc cgcgcccagc gcacgcggcc cgcactccag <.............................msnM3.............................< q y l s a a g p e p r p d r a g p t l d 37561 ccgcacgcgc tcgacgacct gccgcagatg ctcgggcgtc gtaccgcagc agccgccgac ggcgtgcgcg agctgctgga cggcgtctac gagcccgcag catggcgtcg tcggcggctg <.............................msnM3.............................< r v r e v v q r l h e p t t g c c g g v 37621 gagggagagg ccgtagtcgc ggacgaagtt ctcctgggcg tcggcgagct cgggggccgt ctccctctcc ggcatcagcg cctgcttcaa gaggacccgc agccgctcga gcccccggca <.............................msnM3.............................< l s l g y d r v f n e q a d a l e p a t 37