ZIP - FreiDok plus

Werbung
Gewinnung glykosylierter Naturstoffe durch
Biotransformation in Saccharothrix espanaensis
sowie
funktionelle Charakterisierung dreier
Polyketidbiosynthesegencluster aus dem
Mensacarcinproduzenten Streptomyces sp. Gö C4/4
INAUGURALDISSERTATION
zur Erlangung des Doktorgrades
der Fakultät für Chemie, Pharmazie und Geowissenschaften
der Albert-Ludwigs-Universität Freiburg im Breisgau
vorgelegt von
Anton Linnenbrink
aus Filderstadt-Bonlanden
2009
Dekan:
Prof. Dr. Harald Hillebrecht
Vorsitzender des Promotionsausschusses:
Prof. Dr. Rolf Schubert
Referent:
Prof. Dr. Andreas Bechthold
Korreferent:
Prof. Dr. Michael Müller
Datum der Promotion:
05.02.2009
V
Publikationen
1.
Mayer A, Taguchi T, Linnenbrink A, Hofmann C, Luzhetskyy A, Bechthold A: LanV, a
bifunctional enzyme involved in aromatization and dehydration during
landomycin A synthesis. ChemBioChem 2005, 6: 2312-2315.
2.
Luzhetskyy A, Weiss H, Chargé A, Welle E, Linnenbrink A, Vente A, Bechthold A:
A strategy for cloning glycosyltransferase genes involved in natural product
biosynthesis. Applied Microbiology and Biotechnology 2007, 6: 1367-1375.
3.
Daum M*, Peintner I*, Linnenbrink A, Frerich A, Weber M, Paululat T, Bechthold A:
Organization of the biosynthetic gene cluster and tailoring enzymes in the
biosynthesis of the tetracyclic quinone glycoside antibiotic polyketomycin. Vorläufig
akzeptiert zur Publikation in ChemBioChem.
4.
Linnenbrink A, Bechthold A: Polyketide biosynthesis in the mensacarcin producer
Streptomyces sp. Gö C4/4: endogenous ketosynthase cross-complementation and
chain-length control by dimethyl sulfoxide. In Vorbereitung.
5.
Linnenbrink A, Luzhetskyy A, Taguchi T, Müller M, Novikov V, Bechthold A:
Exploiting the xenobiotic metabolism of soil bacteria for biocatalytic glycosylation.
In Vorbereitung.
Vorträge
1.
Neue Naturstoffe durch Biotransformation. Vogesen-Seminar der Arbeitsgruppe
Bechthold, La Schildmatt 2006.
2.
Fighting cancer with colours. Workshop Presentation Skills for Scientists, Zentrum für
Schlüsselqualifikationen der Albert-Ludwigs-Universität, Freiburg 2006.
3.
Biokatalytische Verwendung des Fremdstoffmetabolismus von Bodenbakterien.
Doktorandenseminar des Instituts für Pharmazie der Albert-Ludwigs-Universität,
Freiburg 2007.
4.
Glycosylated new molecular entities and prodrugs by biotransformation. European
BioPerspectives, Köln 2007.
5.
Kontrollierte Gen-Inaktivierung in Actinomycetales - Entwicklung und
Anwendung der [safe-knock]-Strategie. Vogesen-Seminar der Arbeitsgruppe
Bechthold, La Schildmatt 2007.
6.
Vom Naturstoff zum Gen. Gastvortrag in der Biotechnologie-Ringvorlesung für
Pharmaziestudierende des Hauptstudiums, Freiburg 2008.
VI
Poster
1.
Luzhetskyy A, Linnenbrink A, Welle E, Bechthold A: Freiburger glycosyltransferase
collection and its use in combinatorial biosynthesis of natural products. 10th
International Symposium on the Genetics of Industrial Microorganisms, Prag 2006.
2.
Linnenbrink A, Luzhetskyy A, Taguchi T, Novikov V, Bechthold A: A powerful tool
for deoxysugar glycosylation. VAAM-Fachgruppentagung: Biology of Bacteria
Producing Natural Products, Tübingen 2006. Gewinner des Posterpreises.
3.
Luzhetskyy A, Chargé A, Krauth C, Linnenbrink A, Weiß H, Welle E, Bechthold A:
Using of Freiburger glycosyltransferase collection in combinatorial biosynthesis of
natural products. VAAM-Fachgruppentagung: Biology of Bacteria Producing Natural
Products, Tübingen 2006.
4.
Bechthold A, Luzhetskyy A, Krauth C, Linnenbrink A, Mittler M, Schulz GE:
Functions and specificity of glycosyltransferases. DFG-Symposium, Halle 2007.
5.
Chargé A*, Hardter U*, Linnenbrink A*, Bechthold A: The impact of
glycosyltransferases on natural product research. Tag der Forschung der Fakultät
für Chemie, Pharmazie und Geowissenschaften, Freiburg 2007.
6.
Linnenbrink A, Bechthold A: Three PKS II biosynthetic gene clusters in the
mensacarcin producer S. sp. Gö C4/4. New Directions in Molecular Genetics and
Genomics, Freiburg 2008.
Erfindungsmeldung
1.
Linnenbrink A, Luzhetskyy A, Bechthold A: Verwendung von Saccharothrix
espanaensis zur Glykosylierung von Stoffen. Zentrum für Technologietransfer der
Albert-Ludwigs-Universität, Aktenzeichen: ZEE20051124, Freiburg 2005.
VII
Zusammenfassung
Bei den im Bereich der Biotechnologie, Molekularbiologie und Naturstoffanalytik durchgeführten Arbeiten lag der Schwerpunkt auf zwei Projekten: der biokatalytischen Gewinnung
von Glykosiden und der Charakterisierung der Biosynthesegene des Zytostatikums
Mensacarcin.
Das Glykosylierungsmuster hat einen wesentlichen Einfluss auf die Pharmakokinetik und
Pharmakodynamik bioaktiver Moleküle und entscheidet damit über ihre Eignung als
Arzneistoffe. In einer Biotransformationsstudie konnte das Bodenbakterium Saccharothrix
espanaensis als geeigneter Stamm für die Glykosylierung aromatischer Moleküle identifiziert
werden. Eine Bibliothek von 40 Naturstoffen und synthetisch gewonnenen Substanzen wurde
in Kulturen von S. espanaensis auf Biotransformation zu glykosylierten Derivaten überprüft.
Die Auswertung erfolgte durch die LC/MS-Analytik von Kulturextrakten. Mit der Isolierung
und
chemischen
Charakterisierung
von
neun
Transformationsprodukten
per
NMR-Spektroskopie und HR-MS-Spektrometrie konnten die Biotransformationsreaktionen
von S. espanaensis als Hydroxylierungen und O-Glykosylierungen mit dem Zucker
α-L-Rhamnose identifiziert werden. Die absolute Konfiguration des Zuckers wurde durch die
Aufnahme von Circulardichroismen bestimmt. Die eingesetzte Substanzbibliothek enthielt
vor allem Strukturen aus der Klasse der Anthrachinone. Auch Flavonoide, Coumarine und
Stilbene wurden von der Glykosylierungsaktivität erfasst. Ein durch regioselektive
Rhamnosylierung entstandenes Derivat des Flavonoids Quercetin konnte mit einer Ausbeute
von 35 % isoliert werden. Durch die Rhamnosylierung des Coumarins Novobiocinsäure
konnte der ohne Zucker nicht antibiotisch wirksame Naturstoff in ein Antibiotikum
transformiert werden.
Streptomyces sp. Gö C4/4 ist der Produzent des aromatischen Decaketids Mensacarcin, das
ein ähnliches zytostatisches Potential wie das klinisch eingesetzte Anthrazyklin Doxorubicin
zeigt. Mensacarcin ist jedoch auch gegen Doxorubicin resistente Tumorzellen aktiv. Es wurde
angenommen, dass die Biosynthese von Mensacarcin an einer Polyketidsynthase vom Typ II
(PKS II) abläuft. Ein entsprechendes PKS II-Gencluster aus S. sp. Gö C4/4 ist seit dem Jahr
2002 bekannt und ein Ziel intensiver Forschung geworden. Durch drei Geninaktivierungen
konnte in der vorliegenden Arbeit gezeigt werden, dass es sich bei dem bekannten Gencluster
nicht wie angenommen um das Mensacarcinbiosynthesegencluster handelt. Molekularbiologische Experimente identifizierten zwei zusätzliche PKS II-Gencluster im Genom von
S. sp. Gö C4/4. Die Expression von Genen eines der neuen Gencluster löste in einem anderen
Bodenbakterium die Produktion von Mensacarcinbiosynthesevorläufern aus. Die Gene der
Mensacarcinbiosynthese waren damit identifiziert. Weiterführende Untersuchungen zeigten,
dass es sich um das einzige aktive Mensacarcinbiosynthesegencluster in S. sp. Gö C4/4
handelt und deckten die endogene Kreuzkomplementierung von Ketosynthasegenen
unterschiedlicher Gencluster auf. Eine weitere Besonderheit ist die Beobachtung, dass die
Mensacarcin-PKS durch den Einfluss von Dimethylsulfoxid ihre Spezifität zur Synthese von
Decaketiden verliert. Die Identifizierung des Genclusters schafft die notwendige Grundlage
zur biotechnologischen Gewinnung von Derivaten des Zytostatikums Mensacarcin.
VIII
Inhaltsverzeichnis
1
EINLEITUNG ............................................................................................................................... 1
1.1
PRIMÄRSTOFF, SEKUNDÄRSTOFF, XENOBIOTIKUM ................................................................ 1
1.2
AROMATISCHE POLYKETIDE ................................................................................................... 2
1.2.1 Die Biosynthese aromatischer Polyketide .............................................................. 3
1.3
ARZNEISTOFFE AUS BODENBAKTERIEN .................................................................................. 7
1.3.1 Die Bedeutung der Zuckereinheit glykosylierter Arzneistoffe ............................... 7
1.3.2 Saccharomicine aus Saccharothrix espanaensis..................................................... 8
1.3.3 Novobiocin aus Streptomyces spheroides NCIMB11891....................................... 9
1.3.4 Polyketomycin aus Streptomyces diastatochromogenes Tü6028 ............................. 10
1.3.5 Mensacarcin aus Streptomyces sp. Gö C4/4 ......................................................... 11
1.4
DAS ERBGUT VON STREPTOMYCES SPP. ................................................................................. 14
1.5
ERHÖHUNG DER DIVERSITÄT BAKTERIELLER SEKUNDÄRSTOFFE ........................................ 15
1.5.1 Geninaktivierung .................................................................................................. 15
1.5.2 OSMAC und genome mining ............................................................................... 15
1.5.3 Biotransformation ................................................................................................. 16
1.5.4 Kombinatorische Biosynthese .............................................................................. 16
2
ZIELSETZUNG DER ARBEIT ..................................................................................................... 18
3
ERGEBNISSE ............................................................................................................................. 19
3.1
GLYKOSYLIERTE NATURSTOFFE DURCH BIOTRANSFORMATION IN SACCHAROTHRIX
ESPANAENSIS .......................................................................................................................... 19
3.1.1
3.1.2
3.1.3
3.1.4
3.1.5
3.1.6
3.1.7
3.1.8
3.1.9
3.2
Biotransformation von Alizarin und Emodin ....................................................... 19
Screening einer Bibliothek von Anthrachinonderivaten....................................... 32
Gewinnung und Biotransformation von Norsolorinsäure..................................... 45
Biotransformation von Flavonoiden ..................................................................... 47
Evaluierung des Substratspektrums der Rhamnosylierungsaktivität .................... 51
Gewinnung neuer Derivate des Antibiotikums Novobiocin ................................. 55
In-vitro-Glykosylierungsassay.............................................................................. 62
Untersuchung weiterer Stämme............................................................................ 63
Identifizierung von Glykosyltransferasegenen mit degenerierten
Oligonukleotidprimern.......................................................................................... 65
ERSTELLUNG EINER NULLMUTANTE UND SELEKTION EINES POLYKETOMYCINÜBERPRODUZENTEN DES STAMMES STREPTOMYCES DIASTATOCHROMOGENES TÜ6028........ 68
3.2.1 Fehlgeschlagene pok-KSα-Inaktivierungsstrategien.............................................. 68
3.2.2 Erfolgreiche Inaktivierung mit der [safe-knock]-Strategie................................... 73
3.2.3 Biosynthesestudie mit S. diastatochromogenes Tü6028 ∆pok-KSα .............................. 78
3.2.4 S. diastatochromogenes Tü6028 ∆pok-KSα als Expressionswirt ............................ 81
3.2.5 Polymorphismus von S. diastatochromogenes Tü6028........................................ 81
IX
3.3
4
FUNKTIONELLE CHARAKTERISIERUNG DREIER PKS II-BIOSYNTHESEGENCLUSTER DES
MENSACARCINPRODUZENTEN S. SP. GÖ C4/4....................................................................... 83
3.3.1 Anzucht und Sekundärstoffanalytik von S. sp. Gö C4/4 ...................................... 83
3.3.2 Analyse des msc-Clusters (Synthese der Substanzen MSC-X) ............................ 87
3.3.3 PCR-basiertes Screening auf weitere PKS II-Cluster ......................................... 103
3.3.4 Analyse des mec-Clusters (Sporenpigmentsynthese) ......................................... 106
3.3.5 Analyse des msn-Clusters (Mensacarcinsynthese) ............................................. 116
3.3.6 Vergleich von msc- und msn-Cluster auf Proteinebene ...................................... 141
3.3.7 Weiterführende Untersuchungen zur Biosynthese von Mensalon, Aloesol und
der Substanz MSC-X1 ........................................................................................ 142
DISKUSSION ............................................................................................................................ 147
4.1
BIOKATALYTISCHE VERWENDUNG DES XENOBIOTIKAMETABOLISMUS VON
BODENBAKTERIEN .............................................................................................................. 147
4.1.1 Glykokonjugate: spezifische Markenzeichen der Lebewesen ............................ 147
4.1.2 Die Glykosylierung endo- und exogener Moleküle: ein überlebenswichtiges
Prinzip................................................................................................................. 149
4.1.3 Phase I- und Phase II-Reaktion versus Biodegradation ...................................... 151
4.1.4 Biokatalytische Verwendung der mikrobiellen Xenobiotikaglykosylierung...... 152
4.2
URSPRUNG DER FREIBURGER GLYKOSYLTRANSFERASEN-TOOLBOX ................................ 156
4.3
DIE [SAFE-KNOCK]-STRATEGIE ZUR GEZIELTEN GENINAKTIVIERUNG ............................... 157
4.3.1 Revertanten bei der Verwendung klassischer Strategien.................................... 157
4.3.2 λ-Red-Rekombination zur Konstruktion des Inaktivierungsplasmids ................ 158
4.3.3 Neue Einsatzgebiete und Erweiterungen der [safe-knock]-Strategie ................. 159
4.4
GENETISCHE INSTABILITÄT IN S. DIASTATOCHROMOGENES TÜ6028 ................................... 161
4.5
ENDOGENE KREUZKOMPLEMENTIERUNG UND KONTROLLE DER KETTENLÄNGE DURCH
DMSO IM PKS II-METABOLISMUS VON STREPTOMYCES SP. GÖ C4/4 ................................ 162
4.5.1 Identifikation des Mensacarcinbiosynthesegenclusters ...................................... 162
4.5.2 Endogene PKS II-Kreuzkomplementierung ....................................................... 163
4.5.3 Die Biosynthese von Mensacarcin...................................................................... 165
4.5.4 Der Einfluss von DMSO auf den Msn-Multienzymkomplex führt zum
vorzeitigen Kettenabbruch.................................................................................. 169
5
MATERIAL UND METHODEN ................................................................................................. 173
5.1
LABORGERÄTE / ANALYSEINSTRUMENTE ........................................................................... 173
5.2
LÖSUNGEN, NÄHRMEDIEN, CHEMIKALIEN, ENZYME UND KITS ......................................... 174
5.2.1 Lösungen für biochemische und molekularbiologische Arbeiten....................... 174
5.2.2 Nährmedien......................................................................................................... 176
5.2.3 Selektionsantibiotika........................................................................................... 181
5.2.4 Chemikalien und Medienbestandteile................................................................. 181
5.2.5 Enzyme und molekularbiologische Kits ............................................................. 183
5.3
BAKTERIENSTÄMME UND DEREN KULTIVIERUNG .............................................................. 183
5.4
VEKTOREN UND PLASMIDE ................................................................................................. 187
5.4.1 Allgemeine Plasmidkonstrukte und Vektoren .................................................... 187
5.4.2 Spezielle Plasmidkonstrukte und Cosmide......................................................... 188
X
5.5
ALLGEMEINE METHODEN DER MOLEKULARBIOLOGIE ....................................................... 205
5.5.1 Einbringen von DNA in E. coli Laborstämme.................................................... 205
5.5.2 Isolierung von DNA ........................................................................................... 207
5.5.3 Reinigung und Aufkonzentrierung von DNA..................................................... 209
5.5.4 Qualitative und quantitative DNA-Analytik....................................................... 210
5.5.5 Klonierungstechniken ......................................................................................... 212
5.6
POLYMERASEKETTENREAKTION (PCR) UND DNA-SEQUENZIERUNG ................................ 216
5.6.1 PCR..................................................................................................................... 216
5.6.2 DNA-Sequenzierung........................................................................................... 218
5.6.3 Primerlisten geordnet nach Projekt..................................................................... 220
5.7
GENTRANSFER IN SACCHAROTHRIX SPP. UND STREPTOMYCES SPP....................................... 227
5.7.1 Protoplastentransformation................................................................................. 227
5.7.2 Intergenerische Konjugation............................................................................... 229
5.8
GENINAKTIVIERUNG IN STREPTOMYCES SPP........................................................................ 232
5.8.1 Klassische Strategien der gezielten Geninaktivierung........................................ 232
5.8.2 Die [safe-knock]-Strategie.................................................................................. 234
5.9
FLP UND CRE VERMITTELTE REKOMBINATION IN STREPTOMYCES SPP. .............................. 238
5.10 METHODEN DER BIOCHEMIE ............................................................................................... 240
5.10.1 Glykosylierungsassay ......................................................................................... 240
5.10.2 Proteinanalytik mit SDS-PAGE.......................................................................... 241
5.11 ANALYTIK UND ISOLIERUNG NIEDERMOLEKULARER NATURSTOFFE ................................. 241
5.11.1 Naturstoffextraktion aus Bakterienkulturen........................................................ 241
5.11.2 Dünnschichtchromatographie (DC) .................................................................... 242
5.11.3 Säulenchromatographie ...................................................................................... 243
5.11.4 Analytische HPLC .............................................................................................. 243
5.11.5 Präparative HPLC ............................................................................................... 244
5.11.6 HPLC/MS Analytik ............................................................................................ 244
5.11.7 Bestimmung der exakten Masse ......................................................................... 246
5.11.8 NMR-Spektren.................................................................................................... 246
5.11.9 Circulardichroismus............................................................................................ 246
5.11.10 Gefriertrocknung................................................................................................. 247
5.12 DARSTELLUNG VON NOVOBIOCINSÄURE ............................................................................ 247
5.13 TESTUNG VON NATURSTOFFEN AUF ANTIMIKROBIELLE AKTIVITÄT .................................. 249
5.14 PC-PROGRAMME UND INTERNETSERVICES ......................................................................... 250
6
LITERATURVERZEICHNIS ...................................................................................................... 251
7
ANHANG ................................................................................................................................. 286
7.1
ABKÜRZUNGSVERZEICHNIS ................................................................................................ 286
7.2
NMR-TABELLEN UND -SPEKTREN ...................................................................................... 289
7.3
DNA-SEQUENZEN DER PKS II-CLUSTER AUS S. SP. GÖ C4/4............................................. 309
7.3.1 Sequenz des msc-Contigs.................................................................................... 309
7.3.2 Sequenz des mec-Contigs ................................................................................... 372
7.3.3 Sequenz des msn-Contigs ................................................................................... 386
7.4
DANKSAGUNG ..................................................................................................................... 447
Einleitung
1
Einleitung
1.1
Primärstoff, Sekundärstoff, Xenobiotikum
1
Neben dem für Wachstum und Entwicklung aller Organismen essentiellen Primärstoffwechsel
bilden viele Arten Sekundärstoffe, die in dieser Hinsicht entbehrlich sind. Charakteristisch für
den Primärstoffwechsel sind Reaktionen der Energieumwandlung, des Zellaufbaus und der
Reproduktion. Aus einer begrenzten Zahl von Primärstoffen wie Shikimisäure, Aminosäuren,
Zuckern und Acyl-CoA-Verbindungen geht eine große Vielfalt von Sekundärstoffen hervor,
deren chemische Strukturen typische Kennzeichen bestimmter Lebewesen sind und eine
taxonomische Einteilung ermöglichen.
Zahlreiche pflanzliche, tierische und mikrobielle Sekundärstoffe wirken auf Rezeptoren
im menschlichen Körper und werden deshalb als Arzneistoffe eingesetzt. Hierzu zählt das
pflanzliche Analgetikum Morphin, das in den Jahren 1803 - 1805 durch den Apotheker
F. Sertürner aus Opium isoliert wurde [1]. Vom Bodenbakterium Streptomyces peuceticus
wird das Anthrazyklinzytostatikum Doxorubicin produziert, das Antibiotikum Penicillin ist
ein Sekundärmetabolit des Pilzes Penicillium notatum.
Die Funktion der Sekundärstoffe im produzierenden Organismus ist weitgehend unbekannt.
Der Sekundärmetabolismus wurde deshalb als "luxurierender Metabolismus" angesehen [2].
H. Zähner bezeichnete ihn als eine "biochemische Spielwiese", auf der sich das Biosynthesepotential eines Organismus durch nicht letale Mutationen zufällig verändert, bis ein positiver
Effekt für den Produzenten erreicht wird [3]. Sekundärstoffe spielen eine wichtige Rolle in
der chemischen Kommunikation, darin eingeschlossen der Verteidigung [2]. Sie tragen zum
Erhalt der Position eines Organismus in seinem ökologischen Umfeld bei. Die in bestimmten
Wachstumsphasen gebildeten Sekundärmetaboliten sind nicht immer als Endpunkte von
Stoffwechselwegen zu verstehen. Sie können oft wieder abgebaut werden und als
Reservestoffe für den Primärmetabolismus dienen. Die Grenze zwischen Primär- und
Sekundärmetabolismus ist nicht eindeutig zu ziehen.
Xenobiotika (aus dem griechischem: ξεύος = fremd, βιος = Leben) sind fremde Stoffe in
Bezug auf ein bestimmtes Lebewesen [4;5]. Die Umwandlung und Verteilung von
Fremdstoffen in einem Organismus wird als Xenobiotikametabolismus bezeichnet [6].
Nach Art der ablaufenden Reaktion wird dieser in verschiedene Phasen eingeteilt.
In der Phase I findet eine Funktionalisierung von meist unpolaren Molekülen statt. Typische
Phase I-Reaktionen sind hydrolytische Spaltungen, Oxidationen und Reduktionen. In der
Phase II erfolgt die Bildung polarer Konjugate, zum Beispiel die Glucuronidierung oder
Sulfatierung [7]. Weitere Biotransformationsreaktionen können sich anschließen. Die
Produkte werden teilweise von aktiven Transporten erkannt und in andere Kompartimente
oder aus der Zelle heraus verlagert.
2
Einleitung
1.2
Aromatische Polyketide
Polyketide werden in einer Reaktionsfolge, ähnlich der Fettsäuresynthese aus Acyl-CoAVerbindungen zusammengesetzt. Sie bilden eine vielfältige Klasse von Sekundärstoffen,
deren Vertreter bisher in Pflanzen, Mikroorganismen, Protisten und Insekten identifiziert
wurden [8;9]. Strukturelle Merkmale erlauben eine Unterscheidung von aliphatischen und
aromatischen Polyketiden. Aliphatische Polyketide gliedern sich in Makrolide wie das
Antibiotikum Erythromycin, Polyether wie das Algengift Brevetoxin A und Polyene wie das
Immunsuppressivum Rapamycin.
Durch Ringschluss, Dehydratisierung und Keto-Enol-Tautomerie können aus der Ketidkette
aromatische Strukturen hervorgehen (s. Abb. 1). Flavonoide und Stilbene wurden bisher fast
ausschließlich aus Pflanzen isoliert. Anthranoide leiten sich von der tricyclischen Verbindung
Anthracen ab. Unterschiedlich oxidierte, reduzierte und substituierte Anthranoide treten in
Pflanzen, Pilzen und Bakterien auf. In der Pflanze werden Flavonoide, Stilbene und
Anthranoide als Glykoside gespeichert.
Flavonoide
Stilbene
OH
OH
HO
A
O
C
B
OH O
Quercetin
A
OH
OH
Anthranoide
B
OH
HO
OH O
OH
A
C
B
O
trans-Resveratrol
Chrysophanol
Kohlenstoff aus einer Acetateinheit
Abb. 1: Aromatische Produkte des Polyketidbiosynthesewegs. Flavonoide und Stilbene werden aus einer
Phenylpropanstartereinheit und drei Acetateinheiten gebildet. Das Grundgerüst des polyketidischen
Anthrachinons Chrysophanol setzt sich aus acht Acetateinheiten zusammen.
Über den Verzehr von Obst und Gemüse nimmt ein Mensch mit den Ernährungsgewohnheiten der westlichen Industrieländer durchschnittlich 1 - 2 g Flavonoidglykoside pro
Tag auf [10]. Den Verbindungen wird antitumorale, antimikrobielle, antiallergische,
antiinflammatorische und östrogene Wirkung zugeschrieben. Die biologische Wirksamkeit ist
zum Teil auf Radikalfängereigenschaften zurückzuführen [11].
Ein Liter Rotwein enthält etwa 0,1 - 14,3 mg des Stilbens Resveratrol [12].
In den letzten Jahren zog Resveratrol große Aufmerksamkeit auf sich: 2008 wurden über 200
Originalarbeiten und 14 Übersichtsartikel veröffentlicht, deren Titel den Namen der Substanz
enthält [13]. Resveratrol wird für das "Französische Paradox" verantwortlich gemacht [14].
Der Begriff beschreibt die Beobachtung, dass der regelmäßige Konsum von Rotwein mit
einem verminderten Auftreten kardiovasculärer Krankheiten korreliert. Studien an Tieren
zeigen das Potential des Stilbens als Wirkstoff gegen altersbedingte Krankheiten wie Krebs,
3
Einleitung
Diabetes, Alzheimer, Herz- und Lungenkrankheiten. Etwa 20 molekulare Bindungspartner
von Resveratrol wurden bisher in der menschlichen Zelle identifiziert [14].
Glykosylierte Anthranoide (Anthraglykoside) sind das aktive Prinzip pflanzlicher Laxantien
wie Aloeextrakt, Faulbaumrinde und Sennesblättern. Das freie Anthrachinon Aloe-Emodin
zeigt in vitro und in vivo selektive Aktivität gegen neuroectodermale Tumorzellen [15].
Eine anthranoide Substruktur ist auch in bioaktiven aromatischen Polyketiden aus Bakterien
zu finden (s. 1.3.4 - 6). Der Anthrachinongrundkörper ist Bestandteil der Anthrazyklinzytostatika (s. Abb. 5, Doxorubicin).
1.2.1 Die Biosynthese aromatischer Polyketide
Aromatische Polyketide können durch die unterschiedliche Lage der Acetateinheiten
voneinander abgegrenzt werden (s. Abb. 2). Die Biosynthese annelierter Ringsysteme folgt in
Pilzen dem F-Cyclisierungsmodus (F: fungal), in Bodenbakterien der Gattung Streptomyces
werden die Verbindungen über den S-Modus cyclisiert [16]. Die Klassifizierung beruht auf
der Regiospezifität der Aldolreaktion zur Ausbildung des initialen Rings. Beim F-Modus trägt
dieser zwei, beim S-Modus drei intakte Acetateinheiten (s. Abb. 2).
O
O
O
O
O
O
OH OH O
S-Enz
O
F-Modus
O
OH O
OH
S-Enz
O
O
O
O
O
O
O
O
OH OH O
O
OH
S-Modus
O
O
O
OH O
S-Enz
intakte Acetateinheit
O
O
S-Enz
einzelner Kohlenstoff aus einer Acetateinheit
Decarboxylierung
Abb. 2: Zwei unterschiedliche Cyclisierungsmodi der Octaketidkette führen in der Natur zur Biosynthese des
Anthrachinons Chrysophanol. Die Abgrenzung ist nach der Fütterung des Vorläufers [1,2-13C2]-Acetat durch
2D INADEQUAT-NMR-Experimente möglich. Zwei weitere Cyclisierungsmodi sind bei einem nukleophilen
Angriff durch den Kohlenstoff der terminalen Methylgruppe denkbar. Diese chemisch weniger wahrscheinlichen
Modi, als F' und S' bezeichnet, wurden noch nicht beobachtet. Sie sind jedoch nicht grundsätzlich
auszuschließen. Das einzelne, mit einem Quadrat gekennzeichnete Kohlenstoffatom aus der Acetateinheit am
Carboxylterminus ist nach einer F'- oder S'-Cyclisierung in der Methylgruppe von Chrysophanol zu erwarten [8].
Verschiedene Cyclisierungsmodi können zum gleichen Produkt führen (s. Abb. 2). In einer
Vergleichsstudie zur Biosynthese des Anthrachinons Chrysophanol konnte in einem Pilz,
einer Pflanze und einem Insekt jeweils der F-Modus nachgewiesen werden. Im eingesetzten
Bakterium folgte die Cyclisierung dem S-Modus [8]. Die Rekrutierung von
4
Einleitung
Polyketidsynthasen (PKS) unterschiedlichen Typs könnte für abweichende Cyclisierungsmodi
in der Biosynthese von Chrysophanol verantwortlich sein.
Eine stark vereinfachte Klassifizierung unterscheidet drei Typen von Polyketidsynthasen [9]:
Die Mono- oder Polymodulare PKS I leitet sich von der Fettsäuresynthase der Säugetiere ab,
die als Enzymkomplex arbeitende PKS II zeigt Ähnlichkeit zur bakteriellen
Fettsäuresynthase, kein Homolog im Primärstoffwechsel hat die homodimäre PKS III.
Anthranoide (wie zum Beispiel Chrysophanol) werden in Bakterien von einer PKS II, in
Pilzen hingegen von einer PKS I aufgebaut [17]. Für ihre Biosynthese in Pflanzen wird eine
PKS III postuliert [18]. In Insekten konnten bisher keine entsprechenden Enzyme identifiziert
werden [19].
In Bakterien der intensiv beforschten Gattung Streptomyces sind alle drei Typen von
Polyketidsynthasen (PKS I, PKS II, PKS III) anzutreffen [20]. Streptomyces spp. sind
terrestrische oder marine Gram+ Eubakterien der Ordnung Actinomycetales mit einem
komplexen Lebenszyklus [21]. Sie stellen die reichste bisher erschlossene Quelle bioaktiver
mikrobieller Sekundärstoffe dar [22]. Aromatische Polyketide aus Streptomyces spp. werden
vorwiegend durch Polyketidsynthasen vom Typ II aufgebaut. Im Hinblick auf die Zielsetzung
der vorliegenden Arbeit wird dieser Typ der Polyketidsynthasen detailliert vorgestellt.
Die Polyketidsynthase vom Typ II
Die PKS II setzt sich aus separaten Enzymen zusammen, die jeweils eine bestimmte Funktion
übernehmen [23]. Eine Gemeinsamkeit aller PKS II ist die sogenannte "minimale PKS".
Sie besteht aus zwei Ketosynthaseuntereinheiten (KSα / KSβ) und dem Acyl-Carrier-Protein
(ACP) (s. Abb. 3). KSα und KSβ bilden ein Heterodimer, wobei das aktive Zentrum zur
Katalyse der C-C-Verknüpfung auf der α-Untereinheit lokalisiert ist. Die KSβ ist an der
Festlegung der finalen Kettenlänge beteiligt und kann eine Rolle bei der Generierung von
Acetyl-KSα durch Decarboxylierung von Malonyl-ACP spielen. Das ACP dient als Anker für
die wachsende Ketidkette.
Vor dem Beginn der Kettenverlängerung wird die KSα mit einer Acyl-CoA-Starterverbindung
(Primer) versehen. Das Priming der KSα kann von Malonyl-ACP ausgehen (s. o.).
Als Mechanismus zur Generierung von Malonyl-ACP werden sowohl die Selbst-Acylierung
des ACP, als auch eine Beteiligung des Enzyms Malonyl-CoA:ACP-Transferase (MCAT)
diskutiert [23]. Mit einem KSα-Priming ausgehend von Malonyl-ACP steht am Anfang der
Ketidkette eine Acetateinheit. Alternativ kann die KSα direkt mittels einer Acyltransferase
(AT) beladen werden. Auf diese Weise sind abweichende Startereinheiten möglich.
Für die Verlängerungsschritte wird das ACP stets erneut malonyliert. Durch eine Claisen
ähnliche Kondensationsreaktion wird die C-C-Bindung geknüpft. Der entstandene ACPKetoester wird zurück auf die KSα transferiert und der nächste Verlängerungsschritt kann sich
anschließen. Zusätzliche PKS-Untereinheiten, wie Ketoreduktasen, Cyclasen und Aromatasen
5
Einleitung
bestimmen den Cyclisierungsmodus der Poly-β-Ketidkette. Die Cyclisierung läuft im Sinne
einer Aldolreaktion ab. Modifizierende Enzyme wie Oxygenasen, Methyltransferasen und
Glykosyltransferasen verleihen dem Polyketid individuelle Strukturmerkmale [23].
PKS II-Produkte sind meist aromatisch und polycyclisch. Wertvolle Einblicke in das
Zusammenspiel der PKS II-Komponenten lieferten Pionierarbeiten zu Genen und Enzymen
der Actinorhodinbiosynthese von Streptomyces coelicolor [24].
O
NaO
S
O
O
ACS
CoA-S
SH
S
S
O
R
O
ACC
O
CoA-S
OH
SH
S
O
O
R
O
HO
+ CO 2
O
R
Abb. 3: Integration von 13C markiertem Acetat (fett) in die β-Ketidkette über die Enzyme der minimalen
Polyketidsynthase vom Typ II (s. Text). ACS: Acetyl-CoA-Synthetase, ACC: Acetyl-CoA-Carboxylase.
Abb. 3 zeigt den Verbleib von 13C markiertem Acetat in der Polyketidkette. Obwohl der
Biosynthesevorläufer mit unmarkiertem Kohlenstoff erweitert wird, führt die
Decarboxylierung während der Kettenverlängerung dazu, dass im Endprodukt alle aus
Acetyl- oder Malonyl-CoA hervorgegangenen C-Atome markiert sind.
Die Polyketidsynthase vom Typ I
Die PKS I ist modular aufgebaut. Ein Modul besitzt mehrere katalytische Domänen, wobei
für pro Verlängerungsschritt zumindest eine Acyltransferase, ein Acyl-Carrier-Protein und
eine Ketosynthase vorliegen müssen. In Analogie zur Fettsäuresynthese können zusätzlich in
den Modulen vorhandene Ketoreduktase-, Dehydratase-, und Enoylreduktase-Domänen zur
schrittweisen Reduktion der ACP gebundenen Ketidkette führen. Mono- und Polymodulare
PKS I sind bekannt. Der polymodularen PKS I oder "modularen PKS I" steht typischerweise
für jeden Verlängerungsschritt ein neues Modul zur Verfügung. Module der polymodularen
PKS I können jedoch auch mehrfach eingesetzt werden [9]. Bei der monomodularen oder
"iterativen PKS I" ist dies die Regel. Wie bei der PKS II können beim Typ I einzelne
Domänen auf externe Enzyme ausgelagert werden [9]. Eine Thioesterasedomäne des letzten
Moduls setzt das Produkt frei.
6
Einleitung
Die Metaboliten der bakteriellen PKS I sind fast ausschließlich aliphatische Polyketide. Das
Aglykon des Antibiotikums Avilamycin aus Streptomyces viridochromogenes Tü57 ist eine
der wenigen Ausnahmen (s. Abb. 5). In Pilzen hingegen gelten aromatische Polyketide, wie
Aflatoxin B als typische Produkte der dort vorkommenden iterativen PKS I [17].
Die Polyketidsynthase vom Typ III
Zu den Polyketidsynthasen vom Typ III gehören die Chalconsynthasen (CHS) und die
Stilbensynthasen (STS) der Pflanzen. Ihre Architektur ist einfach. Sie bestehen aus einem
Dimer identischer Ketosynthasedomänen. Die Reaktionsfolge von Decarboxylierung,
Kondensation, Cyclisierung und Aromatisierung erfolgt an nur einem aktiven Zentrum [25].
Als erste PKS überhaupt wurde die CHS aus der Petersilie von F. Kreuzaler und
K. Hahlbrock am Biologischen Institut II der Universität Freiburg charakterisiert [26].
Quercetin (s. Abb. 1) wird von einer CHS aus p-Coumaroyl-CoA und drei Acetateinheiten
aus Malonyl-CoA zusammengesetzt, der C-Ring wird durch eine Chalconisomerase
stereospezifisch geschlossen. Sich anschließende Oxidationen und Reduktionen geben dem
Flavonol seine endgültige Struktur [25]. Resveratrol (s. Abb. 1) ist das unmittelbare Produkt
einer STS von p-Coumaroyl-CoA und drei Acetateinheiten aus Malonyl-CoA [25].
Im Jahr 1999 wurde mit dem Enzym RppA aus Streptomyces griseus die erste PKS III aus
einem Bakterium beschrieben [27].
Die Vielfalt der Polyketidsynthasen geht über die drei genannten Typen hinaus [9], wie der
vor kurzem veröffentlichte Mechanismus der Stilbensynthese im Gram− Enterobakterium
Photorhabdus luminescens zeigt [28].
Ein alternativer Biosyntheseweg zu Anthrachinonen
Nicht immer handelt es sich bei natürlich vorkommenden Anthrachinonen um Polyketide. In
Rubiaceae werden Anthrachinone durch eine Kombination von Shikimisäureweg und
Methylerythritolphosphat-(MEP)-Weg gebildet [29]. Ring A und B der Anthrachinone vom
Rubiatyp stammen aus der Isochorisminsäure und α-Ketoglutarsäure, Ring C aus Isopentenyldiphosphat, das über den MEP-Weg aufgebaut wird [30]. Anthrachinone vom Rubiatyp sind
meist nur am Ring C substituiert, wie zum Beispiel Alizarin aus Rubia tinctorum [31]. Allein
aus dem Substitutionsmuster lässt sich die biogenetische Herkunft des Anthrachinons jedoch
nicht ableiten. Erst Experimente mit Isotop markierten Vorläufern konnten die Zugehörigkeit
von Robustachinon B aus Cinchona "Robusta" (s. Abb. 4) zum Rubiatyp festlegen [32].
7
Einleitung
Shikimisäure
Isochorismin+ α-Ketoglutarsäure
säure
Pyruvat + Glyceraldehyd-3-P
OH
COOH
A
B
O
OH
B
C
MeO
A
+
MeO
OP P
OH
O
Abb. 4: Biosyntheseweg des Anthrachinons Robustachinon B in Cinchona "Robusta" [32].
1.3
Arzneistoffe aus Bodenbakterien
1.3.1 Die Bedeutung der Zuckereinheit glykosylierter Arzneistoffe
Der Zuckeranteil ist oft ausschlaggebend für die pharmakokinetischen und pharmakodynamischen Eigenschaften glykosylierter Arzneistoffe.
Die höhere Wasserlöslichkeit der Anthraglykoside im Vergleich zu den Anthrachinonaglyka
verhindert eine Adsorption im oberen Magen-Darmtrakt und verleiht den Glykosiden, die im
Dickdarm durch bakterielle Glykosidasen hydrolysiert werden, Prodrug-Eigenschaften [33].
O
O
OH
OH
O
OH
OH
OH
OH
O HO O
O
O
O
HN
OH O
HN
H
N
OH
N
OMe O
OH O
OMe
O
NH2
OH
OH
O
OH O
Erythromycin
OH
N
H
Mitoxantron
Doxorubicin
O
O
OMe O
Cl
O
HO
HO
O
O HO
O
MeO
O
O
O
O
O
OH
Cl
O
HO
OMe
OMe
O
O
O
O
O
O
O
O
O
OH
Avilamycin A
Abb. 5: Zuckereinheiten bestimmen die Pharmakokinetik und die Pharmakodynamik von Arzneistoffen. Das
nicht glykosylierte Anthrazyklinanalogon Mitoxantron ist synthetischen Ursprungs.
8
Einleitung
Eine durch den Zuckeranteil erhöhte Lipophilie zeigt das Orthosomycinantibiotikum
Avilamycin A [34]. Die Heptasaccharidkette ist vorwiegend aus Desoxyzuckern aufgebaut.
Verbleibende Hydroxylgruppen sind zu einem großen Teil an Etherbindungen beteiligt.
Die Wirksamkeit zahlreicher Antibiotika und Zytostatika ist an die Präsenz von Zuckern im
Molekül gebunden [35]. Ein Verlust der Zuckereinheit geht bei Erythromycin, Doxorubicin
(s. Abb. 5), Novobiocin (s. Abb. 7) und Polyketomycin (s. Abb. 8) mit dem Verlust der
Wirksamkeit einher. Es wird angenommen, dass der Zucker an Wechselwirkungen mit dem
Zielmolekül beteiligt ist [36-38]. Für diese Funktion werden beim nicht glykosylierten
Anthrazyklinanalogon Mitoxantron die Seitenketten postuliert.
1.3.2 Saccharomicine aus Saccharothrix espanaensis
Zwei von Saccharothrix espanaensis produzierte Heptadecaglykosidantibiotika zeigen
einzigartige Strukturmerkmale (s. Abb. 6). Die Saccharomicine bestehen aus einer einfach
verzweigten Kette von 17 Zuckern, die O-glykosidisch mit dem aus Kaffeesäure und Taurin
aufgebauten Aglykon verknüpft ist. Alle 17 Zucker sind Desoxyhexosen. Der Aminozucker
Saccharosamin wurde in den Saccharomicinen zum ersten Mal entdeckt [39]. S. espanaensis
ist ein filamentöses Bodenbakterium der Ordnung Actinomycetales und wird der Familie
Actinosynnematacae zugeschrieben [40]. In dieser Arbeit wird das Potential des Stammes zur
biokatalytischen Glykosylierung kleiner, aromatischer Moleküle evaluiert (s. 3.1).
OH
+
H3N
O
HO
Eva-9
O
Sac-7
Fuc-8
O
O
O
OH
R2
O
R1
R3 O
A: Rha-10
B: Dig-10
O
O
HO
O
NH2
O
O
O
NH2 HO
Fuc-5
OH
OH
O
Fuc-12
O
O
Sac-4
O
O
OH
HO
NH2
Fuc-3
OH
OH
O
H
N
OSO3-
Sac-2
Fuc-1
SO3-
O
OH
Sac-11
A: R1 = R3 = OH; R2 = H
B: R1 = R3 = H; R2 = OH
O
O
OH
O
NH2
O
O
Rha-6 O
O
Dig-13
O
O
Eva-14
NH2
O
OH
O
Dig-15
O
O
Eva-16
NH2
O
O
NH3+
OH
Eva-17
Abb. 6: Die Heptadecaglykosidantibiotika Saccharomicin A und Saccharomicin B. Fuc: D-Fucose; Sac:
D-Saccharosamin; Rha: L-Rhamnose; Eva: L-4-epi-Vancosamin; Dig: L-Digitoxose. Die absolute Konfiguration
wurde nicht bestimmt, sondern aufgrund natürlicher Häufigkeiten vorgeschlagen [39].
9
Einleitung
1.3.3 Novobiocin aus Streptomyces spheroides NCIMB11891
Das Aminocoumarinantibiotikum Novobiocin wurde 1964 unter dem Handelsnamen
Albamycin in den USA zur Therapie von Infektionen mit multiresistenten, Gram+ Bakterien
zugelassen [41]. Wegen starker Nebenwirkungen und der geringen Wasserlöslichkeit von
Novobiocin wurde die Anwendung beim Menschen ausgesetzt [41;42]. Zur Zeit ist
Novobiocin noch zur Behandlung boviner Mastitis im Einsatz [43;44]. Die Struktur setzt sich
aus einer prenylierten 4-Hydroxybenzoesäureeinheit (Ring A), einer substituierten
3-Aminocoumarineinheit (Ring B) und einem Desoxyzucker (Ring C) zusammen (s. Abb. 7).
Ring B und Ring C sind an der Bindung mit dem Zielmolekül, der bakteriellen Gyrase,
beteiligt [42]. Eine Variation von Ring A kann ohne Verlust der antibiotischen Aktivität
vorgenommen werden, was bereits die Entwicklung zahlreicher Strukturanaloga erlaubte [45].
Über seine Anti-Hsp90-Aktivität interferiert Novobiocin auch mit metabolischen Prozessen in
eukaryotischen Zellen [46]. Das Hitzeschockprotein 90 (Hsp90) stabilisiert onkogene
Kinasen. Hsp90-Inhibitoren können deshalb in der Krebstherapie eingesetzt werden [47].
In der vorliegenden Arbeit wird durch Biotransformation in Saccharothrix espanaensis ein
rhamnosyliertes Novobiocinderivat gewonnen (s. 3.1.6).
OH
5'
Ring C
H3C
H3CO
O
O
NH2
O
O
CH3
1''
O
2''
OH
4'
OH
6
H
N
O
12
O
7
CH3
11
Ring A
3-O-Carbamoyl-4-O-methyl-α-L-noviose
Abb. 7: Das Aminocoumarinantibiotikum Novobiocin.
CH3
8
CH3
Ring B
10
2
10
Einleitung
1.3.4 Polyketomycin aus Streptomyces diastatochromogenes Tü6028
Polyketomycin (s. Abb. 8) wurde aus Streptomyces sp. MK277-AF1 [48;49] und Streptomyces
diastatochromogenes Tü6028 [50] isoliert. Eine Bioaktivitätsstudie identifizierte Polyketomycin
als Antibiotikum mit starker Wirksamkeit (MHK < 0,2 µg/mL) gegen Gram+ Keime unter
denen sich auch ein Methicillin resistenter Staphylococcus aureus befand [48]. Die von einer
PKS II initiierte Biosynthese folgt einem Cyclisierungsmodus, ähnlich dem der Aureolsäuren
Mithramycin und Chromomycin [16]. Wie beim Aufbau von Cervimycin [51],
Dutomycin [52] und DMI-2 [53] bleibt der vierte Ring (Ring A) erhalten. Die beiden seltenen
Desoxyzucker D-Amicetose und L-Axenose bilden zusammen mit 3,6-Dimethylsalicylsäure
die Seitenkette von Polyketomycin.
O
OH O
D
C
O
OH 1
OH
9
H3CO
H3C
O
HO
H3C
2'''
O
O
O
OH
O
CH3
CH3
H3C
A
5
OH H
O
2'
1''
2''
B
O
CH3
O
β-D-Amicetose
1'
α-L-Axenose
1'''
CH3
Abb. 8: Das tetrazyklische Chinonglykosid Polyketomycin.
Aufgrund seiner Fähigkeit zur Bereitstellung nukleotidaktivierter Zuckerbausteine konnte
S. diastatochromogenes Tü6028 zur Generierung neuer Derivate des Anthrazyklins Aranciamycin
eingesetzt werden. Dazu wurde das Aranciamycinbiosynthesegencluster heterolog in
S. diastatochromogenes Tü6028 unter der Bildung von Desmethoxyaranciamycinon (s. Abb. 9,
R1 = H, R2 = H) exprimiert. Die Gene der Zuckerbiosynthese liegen außerhalb des Clusters. Die
Aranciamycinglykosyltransferase AraGT zeigt eine außergewöhnliche Donorflexibilität und
verknüpft das Anthrazyklinaglykon im Sinne der kombinatorischen Biosynthese mit
D-Amicetose oder L-Axenose (s. Abb. 9) [54;55].
S. diastatochromogenes Tü6028 ist ein interessanter Wirt für die Expression von PKS IIGenclustern. Die endogene Polyketomycinproduktion des Stammes beschränkt die Biosynthese
weiterer Polyketide jedoch durch Vorläuferentzug und erschwert die Detektion neu
auftretender Metabolite. Durch gezielte Inaktivierung von pok-KSα, dem Gen der
Ketosynthase Untereinheit α, wird in dieser Arbeit eine Mutante erstellt, die kein
Polyketomycin und keine Polyketomycinvorläufer produziert (s. 3.2).
11
Einleitung
O
O
OH
CH3
R2
OH O
R1:
H3C
HO
O
OH
R2:
OCH3
H3C
HO
OH OR1
OH
O
HO
H3C
O
CH3
OCH3
H
H
Aranciamycin
Aranciamycin C
Aranciamycin D
Abb. 9: S. diastatochromogenes Tü6028 als Wirt für das Aranciamycinbiosynthesegencluster. Durch
kombinatorische Biosynthese werden die Hybridzytostatika Aranciamycin C und D sowie weitere Derivate
gebildet [54;55].
1.3.5 Mensacarcin aus Streptomyces sp. Gö C4/4
Der einprägsame Name Mensacarcin verbindet die Antitumorwirkung der Substanz mit dem
Fundort ihres Produzenten Streptomyces sp. Gö C4/4, dem Erdboden in der Nähe der
Göttinger Nordmensa [56]. Die Substanz fiel in einem Screening auf Circulardichroismus
aktive Metabolite auf und ließ sich in Ausbeuten von 60 mg/L aus Fermenterkulturen
isolieren [56]. Strukturell verwandt ist Cervicarcin aus Streptomyces ogaensis, das im
Gegensatz zu Mensacarcin keine Methoxygruppen trägt und eine deutlich abweichende
Stereochemie besitzt [57]. Cervicarcin ist ein Diastereomer des Mensacarcinvorläufers
Didesmethylmensacarcin.
Als Nährmediumvariation im Sinne des OSMAC-Ansatzes (s. 1.5.2) führte der Zusatz von
2 % DMSO zur Produktion der Heptaketide Mensalon und Aloesol, die in Ausbeuten von
2 mg/L, respektive 2,3 mg/L isoliert wurden [56].
Mensalon wird auch von einer Micromonospora sp. produziert und fiel bei einem Screening
auf Radikalfänger auf, wo die Substanz mit dem Kürzel GTRI-02 bezeichnet wurde [58].
Der Drehwert von Mensalon und GTRI-02 ist identisch, die Stereochemie an C-3 bisher nicht
geklärt [56].
Glykosylierte Derivate von Aloesol sind aus Pflanzen bekannt [59;60]. Aus S. sp. Gö C4/4
wurde vermutlich ein ungleiches Gemisch von Enantiomeren der Konstitution von Aloesol
isoliert [56].
12
Einleitung
16
17
OMe OMe OH O
OH O
1
10
11
O
6
4
O
14
O
9
5
4
OH
1
9
10
*
HO
15
O
OH
Mensacarcin
O
11
8
5
4
OH
HO
O
8
Mensalon
*
1'
1
3'
Aloesol
Abb. 10: Polyketide aus S. sp. Gö C4/4.
Die Biosynthese von Mensacarcin
Aufgrund des spezifischen Einbaus von Isotop markiertem Acetat und des aromatischen
Charakters wurde Mensacarcin als ein Produkt des PKS II-Metabolismus postuliert [56]. Die
Biosynthese des Decaketids folgt einem Cyclisierungsmodus, ähnlich dem der Anthrazykline
und Tetrazykline (s. Abb. 11), wobei jedoch unterschiedliche Startereinheiten eingesetzt
werden. Ein vierter Ring fehlt in der Struktur von Mensacarcin.
Der hohe Oxygenierungsgrad, insbesondere die Ausbildung zweier Oxiranringe macht
Mensacarcin zu einem interessanten Ziel der Biosyntheseforschung. Die genetischen
Grundlagen der Epoxidierung im PKS II-Metabolismus sind bisher noch nicht bekannt.
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
S-Enz
O
NH2
O
S-Enz
S-Enz
OH
NH2
O
OMe O
OH O
OMe OMe OH O
OH O
OH O
OH
OH
Doxorubicin
O
O
OH
Mensacarcin
O
NH2
O
OH
O
OH O
OH
HO
H
OH
H
OH N(Me)2
Oxytetrazyklin
Abb. 11: Mit dem Einsatz unterschiedlicher Startereinheiten führen ähnliche Cyclisierungsmodi zur Bildung der
ersten drei Ringe von Anthrazyklinen (Doxorubicin), Tetrazyklinen (Oxytetrazyklin) und Mensacarcin.
Einleitung
13
Das Zytostatikum Mensacarcin
Die In-vitro-Aktivität von Mensacarcin auf verschiedene humane Krebszellen wurde gemäß
[61] von Beil et al. bestimmt. Neben HMO2-Magenkrebszellen, HEP G2-Leberkrebszellen
und MCF 7-Brustkrebszellen wurde auch die multiresistente Magenkrebszelllinie KATO III
in die Versuche einbezogen.
Tab. 1: Vergleich der zytostatischen (TGI = 100 % Inhibition des Zellwachstums) und zytotoxischen
(LC50 = letale Dosis für 50 % der Zellen) Wirkung von Mensacarcin, Doxorubicin und Cisplatin [61].
Substanz
Mensacarcin
Doxorubicin
Cisplatin
Wert
TGI
LC50
TGI
LC50
TGI
LC50
Wirkung auf Tumorzellen (Konzentration in µmol/L)
HMO 2
HEP G2
MCF 7
Kato III
0,6
5,0
0,2
< 0,5
2,4
> 50
0,4
1,6
0,1
1,0
0,2
> 50
0,4
> 50
> 10
> 50
1,5
5,0
10
> 50
36
> 50
> 50
> 50
Mensacarcin zeigt eine hohe zytostatische und zytotoxische Aktivität, vergleichbar mit jener
der klinisch eingesetzten Krebstherapeutika Doxorubicin und Cisplatin. Mensacarcin ist
jedoch auch gegen die multiresistente Zelllinie Kato III wirksam. Ein gemeinsamer
biogenetischer Ursprung verbindet Doxorubicin und Mensacarcin (s. Abb. 11). Durch die in
der Struktur von Mensacarcin fehlende Zuckereinheit lassen sich die beiden Polyketide
voneinander abgrenzen. Der Zucker stabilisiert die Interkalation der Anthrazykline durch
Wechselwirkungen mit dem zweiten DNA-Strang und ist essentiell für ihre Wirksamkeit [62].
Untersuchungen mit dem Verfahren Durchflusszytometrie geben Hinweise auf einen
neuartigen Mechanismus für die Aktivität von Mensacarcin [63]. Es werden bevorzugt Zellen
in der S-Phase arretiert - eine Spezifität die bisher nur von Antimetaboliten bekannt ist [64].
Die Oxiranringe von Mensacarcin sind typische Strukturmerkmale von Zytostatika, die als
Alkylantien kovalente DNA-Addukte bilden [65]. Mensacarcinderivate ohne Epoxidierung
der Seitenkette zeigen eine deutlich verringerte Aktivität, was auf die Alkylierung als
Wirkkomponente hinweist. Die Spezifität für die S-Phase des Zellzyklus kann jedoch nicht
auf die phasenunabhängige Alkylierungsaktivität zurückgeführt werden.
Ein Problem des therapeutischen Einsatzes der Anthrazykline ist die kumulative
Kardiotoxizität der Wirkstoffe. Zahlreiche Mechanismen werden für die besondere
Empfindlichkeit von Kardiomyozyten verantwortlich gemacht [62]. Durch einen Redoxzyklus
zwischen Chinon und Hydrochinon entstehen im menschlichen Körper vermehrt
Superoxidanionradikale und Wasserstoffperoxid [62]. Der dadurch hervorgerufene oxidative
Stress wirkt zellschädigend. In Kardiomyozyten stehen nur geringe Konzentrationen der H2O2
detoxifizierenden Katalase zur Verfügung. Der zweite Weg zur H2O2-Umwandlung über die
Selen abhängige GSH-Peroxidase 1 wird durch Anthrazyklin bedingte Inaktivierung des
Enzyms blockiert [62]. Im Gegensatz zu den Anthrazyklinen weist Mensacarcin keine
14
Einleitung
Chinonstruktur auf. Der Unterschied weckt die Hoffnung, dass Mensacarcin nicht über die
Dosis limitierende, kumulative Kardiotoxizität der Anthrazykline verfügt. Entsprechende
Untersuchungen liegen noch nicht vor.
Die in dieser Arbeit angestrebte Identifikation des Mensacarcinbiosynthesegenclusters sollte
Einblick in die Biosynthese des Zytostatikums geben und die notwendige Grundlage zur
biotechnologischen Gewinnung von Derivaten schaffen.
1.4
Das Erbgut von Streptomyces spp.
Das lineare Chromosom von Streptomyces spp. hat eine Größe von etwa neun Millionen
Basenpaaren und liegt in den vegetativen Zellen in mehreren Kopien vor [66]. Die erste
zusammenhängende Karte verschiedener Gene des Chromosoms von S. coelicolor wurde
1967 veröffentlicht [67]. Zur Gesamtheit der Erbinformation können lineare Plasmide mit
einer Größe bis zu einigen Hundert Kilobasenpaaren beitragen [68]. Genomsequenzierungen
von Streptomyces spp. [69-71] offenbaren das Potential der Stämme viele, derzeit noch nicht
identifizierte Sekundärstoffe zu produzieren. Gene eines Sekundärstoffbiosynthesewegs sind
oft direkt hintereinandergeschaltet. Der zusammenhängende DNA-Bereich wird als
Biosynthesegencluster bezeichnet [68]. Durch die natürliche genetische Instabilität des
Streptomyces-Genoms kann sich die Kopienzahl von Sekundärstoffbiosynthese-, Resistenzund Regulatorgenen erhöhen [72]. Die Selektion von natürlich oder forciert entstandenen
Zufallsmutanten ermöglicht die Gewinnung von Antibiotikaüberproduzenten zum
industriellen Einsatz. Der Einsatz gezielter Mutationen im Genom von Streptomyces spp.
wurde 1983 erstmals publiziert. Durch Phagen vermittelten Genaustausch gelang es,
den funktionellen Zusammenhang eines bestimmten DNA-Bereichs des Riesenplasmids SCP1
aus Streptomyces coelicolor mit der Methylenomycin A-Biosynthese in Verbindung zu
bringen [73]. Im folgenden Jahr konnte das Actinorhodinbiosynthesegencluster des Stammes,
als erstes Sekundärstoffbiosynthesegencluster einer Streptomyces sp. vollständig subkloniert
werden. In Streptomyces parvulus eingebracht, initiierte der Subklon die Produktion von
Actinorhodin [74].
Das Ziel der genetischen Experimente mit Streptomyces spp. ist ein besseres Verständnis der
metabolischen und regulatorischen Prozesse dieser für den Menschen wichtigsten
Antibiotikalieferanten [75]. Die Produktivität und Diversität der Antibiotika kann gezielt
erhöht werden, um im Kampf gegen Resistenz erwerbende pathogene Bakterien mitzuhalten.
Einleitung
1.5
15
Erhöhung der Diversität bakterieller Sekundärstoffe
1.5.1 Geninaktivierung
Die Inaktivierung negativer Regulatorgene und die Blockade von Biosynthesewegen, die auf
die gleichen Vorläufermoleküle zurückgreifen, können neben der Erhöhung der Kopienzahl
von Biosynthesegenen zur Überproduktion eines Sekundärstoffs führen. Mutationen in
Genen, deren Translationsprodukte frühe Schritte einer Biosynthese katalysieren, können zum
vollständigen Abbruch der Produktion des Sekundärmetaboliten führen. Betrifft die Mutation
Gene, die zum Aufbau des Grundgerüsts nicht essentiell sind, treten meist neue Metaboliten
im Produktionsprofil des Stammes auf: dabei kann es sich um Biosynthesevorläufer oder
Shuntprodukte handeln, die aus einem Nebenast des Biosynthesewegs hervorgehen [24].
Die ungezielte Geninaktivierung ist durch energiereiche Strahlung und Chemikalien sowie
enzymatisch durch Integrasen und Transposasen realisierbar [66]. Eine detaillierte Übersicht
zu Methoden der gezielten Geninaktivierung findet sich unter 5.8.1.
1.5.2 OSMAC und genome mining
Schon vor Verfügbarkeit der ersten Genomsequenzen von Streptomyces spp. konnte das große
Potential einzelner Bakterien dieser Gattung zur Produktion unterschiedlicher Sekundärstoffe
mit dem OSMAC-(one strain - many compounds)-Ansatz teilweise aufgedeckt werden [76].
Beim OSMAC-Ansatz wird das Metabolitenprofil eines Stammes in verschiedenen
Nährmedien unter variierten Fermentationsbedingungen analysiert. Auch der Zusatz von
organischen Lösungsmitteln oder Signalstoffen kann zur Erhöhung der chemischen Diversität
bestimmter Stämme führen [77;78]. Nicht immer ist die unter veränderten Kulturbedingungen
auftretende Biosynthese neuer Sekundärstoffe auf ein separates Gencluster zurückzuführen.
Der postgenomische Ansatz des "genome mining" bringt den OSMAC-Gedanken auf
genetische Ebene. Bakterielle Genome beherbergen in der Regel viel mehr Sekundärstoffbiosynthesegencluster, als entsprechende Metaboliten des Stammes bekannt sind. Eine
Aktivierung der "stillen Cluster" kann die Produktion neuer Sekundärstoffe auslösen [79].
Insbesondere für Produkte der modularen PKS I lässt sich bereits aus der DNA-Sequenz des
Clusters ein Strukturvorschlag ableiten [80].
16
Einleitung
1.5.3 Biotransformation
In der Biochemie versteht man unter Biotransformation die in zwei Phasen unterteilbare
Umwandlung von Xenobiotika innerhalb eines Lebewesens (vgl. 1.1).
Als Methode der organischen Chemie wird mit den Begriffen Biotransformation und
Biokatalyse die Umwandlung von chemischen Stoffen durch isolierte Enzyme, lebende oder
permeabilisierte Zellen bezeichnet. Weiterführend ist unter Biokonversion die Umwandlung
von Xenobiotika in ganzen Organismen zu verstehen [81;82]. Haben die zugefütterten
Substrate Ähnlichkeit mit den Vorläufern endogener Metaboliten spricht man von Vorläufer
dirigierter Biosynthese, wenn es sich um Wildtyp-Stämme handelt [83], von Mutasynthese,
wenn mit Mutanten mit Defekt im entsprechenden Biosyntheseweg gearbeitet wird [84].
Die Verwendung lebender Zellen hat gegenüber dem Einsatz isolierter Enzyme den Vorteil,
dass Kofaktoren der Reaktion kontinuierlich bereitgestellt werden. Innerhalb der Zellen liegt
eine Umgebung vor, die die Effektivität der Katalyse und die Stabilität der Enzyme
begünstigen kann. Vom Enzymsystem der Zellen katalysierte Nebenreaktionen können die
Ausbeute jedoch verringern. Bei intakten Zellen stellt die Zellmembran eine Barriere
zwischen dem Akzeptormolekül im Kulturmedium und dem Enzym im Zytoplasma dar. Die
Zellmembran ist semipermeabel. Frei diffundieren können nur kleine, ungeladene Moleküle.
Durch den Einsatz mechanisch oder chemisch permeabilisierter Zellen kann diese
Einschränkung umgangen werden.
Die Biotransformation ist ein wichtiges Werkzeug zur Erhöhung der chemischen Diversität.
Industriell wird sie vor allem eingesetzt, um strukturelle Modifikationen durchzuführen, die
mit den klassischen Methoden der organischen Chemie schwerer zu realisieren sind. Dazu
gehört zum Beispiel die regio- und stereoselektive Hydroxylierung von Steroiden in der
Arzneistoffsynthese [85].
1.5.4 Kombinatorische Biosynthese
Durch die Hintereinanderschaltung enzymkatalysierter Reaktionen entsteht in Bakterien aus
einer begrenzten Anzahl von Biosynthesevorläufern eine große strukturelle Vielfalt von
Sekundärstoffen. Der zwischen Bakterien mögliche horizontale Gentransfer könnte mit der
Bildung neuer Kombinationen auf natürliche Weise zu dieser Vielfalt beigetragen haben [86].
Mit dem Begriff "kombinatorische Biosynthese" wird ein Ansatz bezeichnet, der mit
molekularbiologischen Methoden Gene oder Teile von Genen aus unterschiedlichen
Biosynthesewegen vereint. Ein Hauptziel der kombinatorischen Biosynthese ist die
Gewinnung neuer bioaktiver Moleküle mit optimierten Eigenschaften für den Einsatz als
Arzneistoffe [87].
Einleitung
17
Ein klassisches Beispiel ist die Kombinatorik mit Bestandteilen der modularen PKS I. Durch
den Einsatz von Hybridmodulen, aufgebaut aus Domänen der Erythromycin- und der
Rapamycin-PKS, konnten neue Analoga des Erythromycinvorläufers 6-Desoxyerythronolid B
gewonnen werden [88]. Bei einem Ansatz mit 14 synthetischen Modulen, zusammengestellt
aus acht unterschiedlichen PKS, führte die Hälfte der überprüften Dreierkombinationen zur
Produktion von Triketidlactonen [89].
Auch die Kombination von Ketosynthase-, Acyl-Carrier-Protein-, Ketoreduktase- und
Cyclasegenen aus verschiedenen PKS II-Biosynthesewegen führte zum Auftreten neuartiger
Polyketide [90]. Die gezielte Synthese von PKS II-Metaboliten ist jedoch nur schwer
zu realisieren [91].
Das Glykosylierungsmuster bakterieller Sekundärstoffe kann durch kombinatorische
Biosynthese verändert werden. Der Austausch eines Ketoreduktasegens der
Zuckerbiosynthese im Doxorubicinproduzenten Streptomyces peuceticus führte zur
Produktion des klinisch relevanten Anthrazyklinzytostatikums Epirubicin [92]. Die
Gewinnung von Aranciamycinderivaten mit alternativer Zuckereinheit ist ein weiteres
Beispiel (s. 1.3.4). Oft limitiert die hohe Substratspezifität von Glykosyltransferasen jedoch
ihre Anwendung in der kombinatorischen Biosynthese [93]. Durch den Einsatz von
Hybridgenen [94] oder Sättigungsmutagenese [95] kann die Spezifität der Enzyme für
alternative Substrate optimiert werden.
18
2
Zielsetzung der Arbeit
In Biokonversionsversuchen mit dem Bakterium Saccharothrix espanaensis war eine
Derivatisierung von zum Kulturmedium hinzugefügten, stammfremden Naturstoffen
beobachtet worden. Die Art der Derivatisierung sollte bestimmt werden (s. 3.1).
Aus einer Bibliothek von vorselektierten Cosmiden sollten Glykosyltransferasegene isoliert
werden und damit der Grundstein für den Aufbau der Freiburger GlykosyltransferasenToolbox gelegt werden (s. 3.1.9).
Die Produktion des Antibiotikums und Zytostatikums Polyketomycin in Streptomyces
diastatochromogenes Tü6028 sollte durch gezielte Mutation ausgeschaltet werden, um einen
Stamm für die Genexpression, Biotransformation und kombinatorische Biosynthese zu
gewinnen (s. 3.2).
Teile eines PKS II-Biosynthesegenclusters aus dem Mensacarcinproduzenten Streptomyces
sp. Gö C4/4 lagen vor. Ein Zusammenhang des Genclusters mit der Biosynthese des
Zytostatikums Mensacarcin sollte überprüft werden (s. 3.3).
19
Ergebnisse
3
Ergebnisse
3.1
Glykosylierte Naturstoffe durch Biotransformation in
Saccharothrix espanaensis
3.1.1 Biotransformation von Alizarin und Emodin
Nach einer Kultivierung von Saccharothrix espanaensis unter Zusatz der Anthrachinone
Alizarin oder Emodin (s. Abb. 12) konnten in den Kulturextrakten per HPLC neue
Substanzen detektiert werden, deren UV/VIS-Absorptionsspektren Ähnlichkeit zu denen der
zugefütterten Anthrachinone zeigten. Diese Beobachtung führte zur Annahme, dass in den
Kulturen eine Derivatisierung stattgefunden hatte [96].
O
OH
8
12
7
6
11
13
9
10
5
1
OH
OH
2
3
14
4
8
7
12
6
HO
11
Mr: 240,21
OH
13
9
1
2
3
10
14
5
O
Alizarin
O
4
CH3
O
Emodin
Mr: 270,24
Abb. 12: Strukturformeln von Alizarin und Emodin.
Zunächst galt es, die Reproduzierbarkeit der Transformation zu überprüfen und
standardisierte Kulturbedingungen zu etablieren (s. 5.3.1.4). Die Umsetzung von Alizarin
oder Emodin wurde in allen getesteten Medien (NL111, E1, SG, NL5, s. 5.2.2.4) erreicht,
wobei das aus Fleisch- und Malzextrakt zusammengesetzte NL111-Medium laut HPLCAnalyse die höchsten Ausbeuten erwarten ließ. Unter identischen Bedingungen angesetzte
Kontrollen mit sterilem Nährmedium zeigten keine Derivatisierung. Es handelt sich folglich
um Biotransformationsreaktionen.
Nach der Umsetzung von Alizarin tritt die Substanz AliPro1 als Hauptprodukt mit Alizarin
ähnlichem UV/VIS-Absorptionsspektrum im Chromatogramm des Kulturextrakts auf
(s. Abb. 13). In den Massenspektren von AliPro1 liegen die Signale höchster Intensität bei
m/z = 425 [M+K]+ bzw. m/z = 385 [M−H]−. Die Fragmentionen mit m/z = 241 (positiv
geladen) bzw. m/z = 239 (negativ geladen) identifizieren Alizarin (Mberechnet: 240,04) als
Grundkörper von AliPro1. Der Massengewinn deutet auf eine Konjugatbildung hin. Aufgrund
der erhöhten Hydrophilie und einer Massendifferenz von 146 u könnte es sich bei AliPro1 um
ein Glykokonjugat mit einer O- oder C-verknüpften Monodesoxyhexose handeln. Das
Isotopenmuster des Metaboliten steht im Einklang mit dieser Hypothese.
20
Ergebnisse
Die α-Hydroxylgruppe von Alizarin (1-OH) ist ein wesentlicher Bestandteil des chromophoren Systems mit λmax = 430 nm. Der benachbarten Hydroxylgruppe (2-OH) wird ein
bathochromer Effekt zugeschrieben [97].
Das Absorptionsmaximum von AliPro1 (λmax = 417 nm) ist im Vergleich zu dem der
Ausgangsverbindung um 13 nm hypsochrom verschoben (s. Abb. 13). Eine Verschiebung in
dieser Größenordnung wird bei der Substitution eines Hydroxylgruppenwasserstoffatoms
erwartet. Beispielsweise weichen die Werte von 1-Hydroxyanthrachinon (λmax = 402 nm)
und 1-Methoxyanthrachinon (λmax = 378 nm) um 24 nm voneinander ab. Bei
2-Hydroxyanthrachinon (λmax = 378 nm) und 2-Methoxyanthrachinon (λmax = 363 nm) beträgt
die Differenz 15 nm (gemessen in Ethanol) [97].
mAU int. [%]
(430 nm) 80 [M-146+H]+
241
40
200
+
+
[M+Na]
409
240
400
int. [%]
[M-H]
80
385
40 [M-146-H]
239
100
240
400
[M+K]
425
420
rel. Abs.
1000
Alizarin (19.5 min)
AliPro1 (15.7 min)
m/z
500
-
[M+Cl]
421
420
AliPro1
Alizarin
m/z
0
300
400
500 nm
0
0
10
20
30
min.
Abb. 13: LC/ESI-MS Analyse des Ethylacetatextrakts einer Kultur von S. espanaensis nach Zufütterung von
Alizarin (Methode: antqui, s. 5.11.6).
Die Biotransformation von Emodin in Kulturen von S. espanaensis führt zu drei
Hauptmetaboliten: EmoPro1, EmoPro2 und EmoPro3 (s. Abb. 14).
Die Massenspektren der Metaboliten signalisieren, wie bei der Umsetzung von Alizarin, eine
Konjugatbildung mit Molekülmassenzunahme um 146 u (EmoPro1, EmoPro2) bzw. 2×146 u
(EmoPro3). Die Absorptionsbande mit Maximum bei 440 nm ist bei allen Derivaten
hypsochrom verschoben und hat relativ zu den Banden zwischen 248 nm und 288 nm deutlich
an Ausprägung verloren. Zur Intensität dieser Absorptionsbande tragen alle drei Hydroxylgruppen von Emodin gemeinsam bei [97]. Die beobachtete Verringerung der Intensität zeigt
eine Substitution von Hydroxylgruppenprotonen an.
Die UV-Absorptionsbande zwischen 248 nm und 288 nm weist eine Feinstruktur mit drei
Maxima auf:
1. 251 nm ± 3 nm
2. 270 nm ± 3 nm
3. 285 nm ± 3 nm
Die Ausprägung der Maxima hängt vom Substitutionsmuster von Emodin ab.
21
Ergebnisse
mAU
(430 nm)
300
Emodin
24,1 min
EmoPro2
13,4 min
200
100
EmoPro3
12,3 min
EmoPro1
15,3 min
10
20
0
0
EmoPro3 (M: 562)
mAU
EmoPro2 (M: 416)
mAU
268nm
80
160
418nm
80
220 300
40
0
300
400
500
int.[%]
m/z
-
-
300
400
500 nm
+
[2M+Na]
855
500
0
300
220 300
m/z
400
+
80
40
840 m/z
0
300
220 300
+
[2M+Na]
855
int.[%]
40
0
0
m/z
400
400
500 nm
CI-Quelle,
keine pos. Ionisierung durch ES
+
80
[M+H]
271
40
840 m/z
0
int.[%]
-
[M-H]
415
80
40
400
500 nm
[M-146+K]
+
[M+K]
293
455
int.[%]
-
300
400
440nm
400
+
[M-H]
415
80
254nm
267nm
288nm
800
mAU
423nm
[M-146+H]
int.[%] 271
[M-146+K]
+
[M+K]
293
455
int.[%]
[M-146-H]
415
40
0
40
[M+Cl]
597
80
40
+
80
+
[M+K]
601
Emodin (M: 270)
mAU 248nm
272nm
282nm
80
400
+
417
80
220 300
[M-146+H]
int.[%] 271
+
[M-2*146+K]
293 [M-146+H]+
int.[%]
EmoPro1 (M: 416)
424nm
40
500 nm
400
254nm
268nm
284nm
min.
30
80
400 m/z
300
-
[M-H]
269
40
300
400
m/z
0
300
400 m/z
Abb. 14: LC/ESI-MS Analyse des Ethylacetatextrakts einer Kultur von S. espanaensis nach Zufütterung von
Emodin (Methode: antqui, s. 5.11.6).
3.1.1.1 Isolierung und Strukturaufklärung der Biotransformationsprodukte
Um für die Strukturaufklärung per NMR-Spektroskopie ausreichende Mengen der
Reinsubstanzen isolieren zu können, wurde unter Beibehaltung der etablierten Kultur- und
Zufütterungsbedingungen (s. 5.3.1.4) die Anzahl der Schüttelkolben erhöht.
Isolierung von AliPro1
In insgesamt 1 L NL111-Flüssigmedium wurde S. espanaensis unter Zufütterung von insgesamt 50 mg Alizarin kultiviert (s. 5.3.1.4). Nach Abschluss der Inkubationszeit wurde die
Kultur mit Ethylacetat extrahiert (s. 5.11.1.1). Der in Wasser suspendierte Rohextrakt wurde
22
Ergebnisse
zur Festphasenextraktion auf eine 10 g Sep-Pak-C18-Kartusche aufgebracht und stufenweise
mit 80 % bis 0 % Wasser in Methanol eluiert (s. 5.11.1.2). AliPro1 lag fast ausschließlich in
der Fraktion mit 40 % Wasseranteil vor und wurde nach Gefriertrocknung dieser Fraktion
(s. 5.11.10) mit der präparativen HPLC isoliert (Methode: alipro1, s. 5.11.5). Nach
Gefriertrocknung der AliPro1 führenden HPLC-Fraktionen wurden 5,1 mg eines roten
Pulvers erhalten und für die NMR-Analyse in DMSO-d6 gelöst.
Isolierung von EmoPro1, EmoPro2 und EmoPro3
Über wiederholte Flash-Chromatographie (s. 5.11.3) mit Methanol-Wasser-Gradienten und
LiChroprep RP 18 als stationärer Phase bzw. Gelfiltrationen über Sephadex LH-20 und
Methanol als Fließmittel wurden aus dem Ethylacetatextrakt einer mit 200 mg Emodin
gefütterten 4 L-Kultur von S. espanaensis in NL111-Medium 3,5 mg EmoPro1 als oranges
Pulver erhalten. Die Abtrennung von EmoPro2 von den anderen Metaboliten gestaltete sich
schwierig, gelang aber letztlich durch Kristallisation aus Methanol / H2O, wobei 2,0 mg
EmoPro2 als hellgelbe Nadeln ausfielen.
In einem Versuch zur Medienoptimierung zeichnete sich die Biotransformation in
E1-Medium durch eine verstärkte Bildung von EmoPro2 aus. S. espanaensis wurde zur
Gewinnung von weiterem EmoPro2 in 2 L E1-Medium unter Zufütterung von 100 mg
Emodin angezogen. Überraschenderweise hatte sich bei dieser Kultivierung fast ausschließlich EmoPro3 gebildet. Über wiederholte Flash-Chromatographie an LiChroprep RP 18 und
Sephadex LH-20 konnten 24,6 mg EmoPro3 als gelbes Pulver gewonnen werden. Bezogen
auf die im weiteren Verlauf der Experimente bestimmte relative Molekülmasse von EmoPro3
entspricht dies einer Ausbeute von 12 %. Durch Kristallisation aus Methanol / H2O wurden
gelbe Nadeln erhalten.
9,5 mg des kristallisierten EmoPro3 sowie die gesamte zur Verfügung stehende Substanz von
EmoPro1 und EmoPro2 wurden für NMR-Analysen in DMSO-d6 gelöst.
NMR-Interpretation von EmoPro3
Die NMR-Interpretation lässt sich durch den Vergleich der 1H-Spektren von EmoPro3 und
der Vorläufersubstanz Emodin veranschaulichen (s. Abb. 15).
Die Protonensignale der drei Hydroxylgruppen von Emodin sind bei δH = 11 - 12 ppm zu
finden. Die Wasserstoffatome der α-Hydroxylgruppen (1-OH, 8-OH) werden vom
benachbarten Sauerstoffatom an C-9 koordiniert. Die entsprechenden 1H-Signale lassen sich
durch ihre scharfe Form identifizieren. Im Gegensatz dazu erscheint das Signal des 6-OHProtons verbreitert bei etwas höherem Feld. Das 1H-Spektrum von EmoPro3 lässt nur noch
ein scharfes Signal bei δH = 13,12 ppm erkennen. Eine HMBC-Korrelation mit C-2
identifiziert es als Protonensignal der 1-OH-Gruppe (s. Abb. 19 A). Die durch die Biotrans-
23
Ergebnisse
formation eingeführten Konjugationspartner könnten demnach über die Sauerstoffatome an
C-8 und C-6 verknüpft vorliegen. Die bei δH = 6,5 ppm bis 7,5 ppm auftretenden Signale der
aromatischen Protonen von Emodin finden sich vollständig im 1H-Spektrum von EmoPro3
wieder. Bei identischen Kopplungsmustern weisen sie jedoch deutlich abweichende
chemische Verschiebungen auf. Zahlreiche zusätzliche Signale ergibt EmoPro3 bei
δH = 1 - 6 ppm. Zwei Dubletts (jeweils J = 1,7 Hz) mit dem Integral von je einem Proton
erscheinen bei einer charakteristischen Verschiebung (δH = 5,58 ppm) für anomere Protonen
O-glykosidisch verknüpfter Zucker. Im HSQC-Spektrum korrelieren die Dubletts mit
Signalen bei δC = 98,65 ppm bzw. 99,01 ppm (C-1', C-1''), was ebenfalls für eine
O-glykosidische Verknüpfung spricht. Die chemische Verschiebung des C-1-Signals einer
C-glykosidischen Bindung betrüge etwa 75 ppm. Der Massengewinn von 2×146 u durch die
Biotransformation lässt auf zwei Monodesoxyzucker schließen. Den häufigsten natürlich
vorkommenden Monodesoxyzuckern fehlt die Hydroxylgruppe am sechsten Kohlenstoffatom.
In diesem Fall sind bei δH = 1 - 2 ppm bzw. δC = 15 - 18 ppm die Signale der CH3-Gruppe zu
erwarten. In den Spektren von EmoPro3 lassen sich entsprechende, im HSQC-Spektrum
korrelierende Signale, bei δH = 1,12 ppm und δH = 1,13 ppm (J = 6,2 Hz, 6H, 2 Dubletts)
sowie δC = 17.82 ppm und 17.86 ppm detektieren.
DMSO
H2O
Emodin
14
13
12
11
10
9
8
.
.
EmoPro3
7
ppm
6
5
4
Abb. 15: 1H-NMR-Spektren (DMSO-d6, 400 MHz) von Emodin und EmoPro3.
3
2
1
0
24
Ergebnisse
Um weitere Informationen zur Identität der verknüpften Zucker zu sammeln, mussten die sich
im 1H-Spektrum überlagernden Signale beider Zucker getrennt werden. Eine Zuordnung aller
Signale zu jeweils einer der Zuckereinheiten gelang mit 1D-TOCSY-Experimenten
(s. Abb. 16). Dabei wird selektiv auf ein Signal eingestrahlt. Die Intensität der Signale des
resultierenden Subspektrums hängt vom Grad der Beteiligung der entsprechenden Protonen
am getroffenen Spinsystem ab.
Über COSY-Konnektivitäten lässt sich ausgehend von den Signalen der anomeren Protonen
die Zuordnung der Zuckerprotonen vornehmen. Die sich entsprechenden Signale beider
Zuckereinheiten weisen identische Kopplungskonstanten auf. Mit Ausnahme des 3'-H- / 3''-HSignals sind auch die chemischen Verschiebungen sehr ähnlich. Das 4'-H- / 4''-H-Signal wird
vom H2O-Signal überlagert. Die Bestimmung der Kopplungskonstanten letzterer Signale
wurde durch 1D-ROESY-Experimente erreicht.
Die Kopplungskonstanten hängen gemäß der Karplus-Beziehung vom Torsionswinkel der
C-H-Bindungen an der C-C-Achse ab (s. Abb. 17). Für beide Zuckereinheiten von EmoPro3
werden Torsionswinkel bestimmt (s. Tab. 2), die gut mit den berechneten Werten von
Rhamnose übereinstimmen, wobei sich die Torsionswinkel von anomerer α- und βKonfiguration nur wenig unterscheiden. Wertvolle Hinweise zur relativen Konfiguration der
Zuckereinheit erhält man durch die per NOESY detektierten nuklearen Overhauser Effekte
(NOEs). Sie signalisieren räumliche Nähe von Protonen mit Abständen < 4 Å. Im
NOESY-Spektrum auftretende NOEs sind für kleine Moleküle (M < 600) positiv, haben bei
mittelgroßen Molekülen (M = 700 - 1200) einen Nulldurchgang und sind negativ für große
Moleküle (M > 1200) [98]. Da die Molekülmasse von EmoPro3 (M: 562) in der Nähe des
Nulldurchgangs des NOESY-Spektrums liegt, wurde auf das hier besser geeignete, aber
vergleichbare Spektren ergebende ROESY-Pulsprogramm ausgewichen. Es wurde zunächst
ein 2D-ROESY-Spektrum aufgenommen. ROESY-Kreuzpeaks erscheinen hier immer in der
entgegengesetzten Phase zu den Diagonalpeaks. Peaks in der Phase der Diagonale sind
Artefakte, die auf TOCSY-Transfer oder chemischen Austausch zurückzuführen sind. Im
2D-Spektrum überlagerten Artefakte einige der ROESY-Kreuzpeaks der Zuckereinheiten.
Durch selektive Einstrahlung konnten durch 1D-ROESY-Experimente wichtige räumliche
Nachbarschaften abgesichert werden.
Beide Zuckereinheiten zeigen alle für Rhamnoside mit anomerer α-Konfiguration (s. Abb. 18)
erwarteten NOEs (s. Tab. 2). Eine anomere β-Konfiguration ließe zusätzlich charakteristische
Kreuzpeaks zwischen 1-H und 5-H sowie 1-H und 3-H erwarten. Diese NOEs treten jedoch
nicht auf. Für beide Zuckereinheiten wird deshalb die α-Konfiguration vorgeschlagen. Die
Zugehörigkeit von Zuckern zur D- oder L-Reihe lässt sich indirekt über die Klyne-Regel
bestimmen [99]. Diese empirisch gefundene Regel besagt, dass Desoxyzucker in Naturstoffen
entweder der β-D- oder der α-L-Reihe zuzuordnen sind. Demnach würde es sich bei den
Zuckern von EmoPro3 um α-L-Rhamnose handeln. Eine Ausnahme der Klyne-Regel ist die
α-verknüpfte 3-O-Carbamoyl-2-desoxy-D-rhamnose als Bestandteil von Irumamycin aus
Streptomyces subflavus subsp. irumaensis AM-3603 [100]. Unter 3.1.4.1 konnte die absolute
25
Ergebnisse
Konfiguration der Zuckereinheit des Biotransformationsprodukts QuercPro1 aus
S. espanaensis als α-L-Rhamnose bestimmt werden. Die unter 4.1.1 präsentierte
Literaturrecherche zeigt, dass Lebewesen zum Glykosyltransfer auf kleine, lipophile
Moleküle meist nur einen, für den jeweiligen Organismus spezifischen Zuckerbaustein
einsetzen. Es kann deshalb davon ausgegangen werden, dass es sich bei EmoPro3 um
6,8-Di-O-α-L-rhamnosylemodin handelt.
4'-OH
3'-OH
2'-OH
3'-H
5'-H
2'-H
1D-TOCSY
1'-H
1''-H
4'-H
2''-OH
3''-OH
2''-H
4''-H
4''-OH
3''-H
5''-H
1D-TOCSY
1
H
Abb. 16: 1D-TOCSY-Subspektren erlauben die Zuordnung der 1H-Signale zu jeweils einer der beiden
Zuckereinheiten. Das Signal der selektiven Einstrahlung ist gekennzeichnet ( ). Das Signal von 6'-H tritt bei
δH = 1,13 ppm (J = 6,2 Hz), das Signal von 6''-H bei δH = 1,12 ppm (J = 6,2 Hz) auf.
H
H
H3C
HO
5'
6'
3'
51° OR
O
4'
174°
Karplus-Beziehung
HO
H 168°
1'
H
H
68°
2'
OH
O-α-L-Rhamnosid
Abb. 17: Abhängigkeit der Kopplungskonstanten vom Torsionswinkel: Karplus-Beziehung (Abb. aus [101]) und
Modelling der Torsionswinkel für O-α-L-Rhamnoside [102].
26
Ergebnisse
Tab. 2: Kopplungskonstanten und NOEs zur Bestimmung der Konfiguration der Zuckereinheiten (identisch für
beide Zucker).
1
H
1'-H
2'-H
3'-H
4'-H
5'-H
6'-H
m, J (Hz)
d 1,6
m<5
ddd 3,3; 5,9; 9,2
t 9,2 (1D-ROESY)
qd 6,2; 9,3
d 6,2
H
2,47Å
HO
5'
6'
3'
4'
2,5-3,1Å
H
HO
erwartete Torsionswinkel
1'-H / 2'-H : ca. 60°
2'-H / 3'-H : ca. 60°
3'-H / 4'-H : ca. 180°
4'-H / 5'-H : ca. 180°
H
2,68Å
H
H3C
NOEs
2'-H
1'-H, 3'-H
2'-H, 5'-H
6'-H
3'-H, 6'-H
4'-H, 5'-H
2,44Å
O
OR
1'
2'
OH
O-α-L-Rhamnosid
H
H
4'
2,54Å
2,5-3,1Å
2,50Å
H3C
OH O
6'
HO
HO
5'
2'
3'
2,67Å
H
1'
H
H 2,47Å
2,40Å
H
OR
2,49Å
2,57Å
O-β-D-Rhamnosid
Abb. 18: Aufgrund kurzer Protonenabstände erwartete NOEs für Rhamnoside mit α- und β-Konfiguration.
Zu klären blieb hingegen noch die Frage, warum die chemischen Verschiebungen der Signale
von 3'-H (δH = 3,67 ppm) und 3''-H (δH = 3,95 ppm) deutlich stärker voneinander abweichen,
als alle anderen sich entsprechenden Signale beider Zuckereinheiten. Aus der Literatur sind
die NMR-Spektren von 6-O-α-L-Rhamnosylemodin (= Frangulin A) und von Frangulin ADerivaten bekannt, bei denen das 3'-H-Signal in DMSO-d6 eine Verschiebung von
δH = 3,64 ppm aufweist [103]. Die O-glykosidische Verknüpfung von α-L-Rhamnose mit der
α-Hydroxylgruppe eines Anguzyklins findet sich in der Struktur der Atramycine aus
Streptomyces atratus BY90. Die chemische Verschiebung des 3'-H-Signals beträgt 4,22 ppm,
die weiteren 1H-Signalverschiebungen der Zuckereinheit entsprechen den Literaturwerten von
Frangulin A (jeweils gemessen in CD3OD) [104]. Somit wird die Abhängigkeit der
3'-H-Verschiebung von der Verknüpfungsposition der α-L-Rhamnose am Anthrachinongrundgerüst deutlich, wobei das Signal bei Glykosylierung in α-Position zu tieferem Feld
verschoben ist.
Eine Erklärung für die Verschiebung des 3''-H-Signal von EmoPro3 zu tieferem Feld könnte
die räumliche Nähe zum Carbonylsauerstoff an C-9 sein. Dieser signifikante Unterschied
erlaubt die Zuordnung des ersten Zuckers (eingestrichen) zur C-6-Verknüpfung und des
zweiten Zuckers (zweigestrichen) zu C-8-Verknüpfung mit dem Aglykon.
Die postulierten Glykosylierungspositionen lassen sich durch das aufmerksame Studium der
zweidimensionalen Spektren absichern. Abb. 19 A zeigt die bereits oben erwähnte HMBCKorrelation zwischen dem einzigem 1H-Signal einer aromatischen Hydroxylgruppe und dem
27
Ergebnisse
13
C-Signal von C-2. Damit kann C-1 als Glykosylierungsposition ausgeschlossen werden.
Eine differenzierte Zuordnung des Signals der anomeren Protonen (dd, δH = 5,58 ppm) wird
durch leicht gegeneinander verschobenen NOEs (Abb. 19 C, D) ermöglicht. Das bei höherem
Feld erscheinende Dublett korreliert mit 5''-H des zweiten Zuckers und 7-H des Aglykons.
Das bei tieferem Feld erscheinende Dublett korreliert mit 5'-H des ersten Zuckers und 5-H des
Aglykons. Die Zuordnung der beiden Zuckereinheiten zu ihren Verknüpfungspunkten wird
damit bestätigt. Zusätzlich lassen sich mit diesem Ergebnis über das HMBC-Spektrum auch
die 13C-Signale von C-1 / C-6 / C-8 zuordnen (Abb. 19 B).
1-OH
1''-H
1''-H
ppm
ppm
C-4
155
120
C-2
125
C-8
C-6
C-1
160
165
130
C-11 /
C-14
13.15
13.10
ppm
5.6
A) HMBC-Korrelation von
1-OH und C-2
5''-H
5.5
ppm
B) HMBC-Korrelation der
anomeren Protonen und C-8 / C-6
5-H 4-H
5'-H
7-H 2-H
ppm
ppm
5.5
5.55
1''-H
1''-H
1''-H
5.60
5.6
1''-H
5.7
5.65
3.55
3.50
3.45
3.40 ppm
C) ROESY-Kreuzpeaks der
anomeren Protonen und 5'-H / 5''-H
7.4
7.2 ppm
D) ROESY-Kreuzpeaks der
anomeren Protonen und 5-H / 7-H
Abb. 19: Bestimmung der Glykosylierungspositionen durch ausgewählte HMBC-Korrelationen und ROESYKreuzpeaks. Die vollständigen Spektren sind im Anhang abgebildet.
28
Ergebnisse
Bestimmung der exakten Masse von EmoPro3
Aus der LC/MS-Analyse konnte die Nominalmasse von EmoPro3 abgeleitet werden.
Mit dieser in Einklang steht das Ergebnis der NMR-Interpretation. Nur bedingt kann mit den
eingesetzten 1H- und 13C-Techniken jedoch auf weitere an der Molekülstruktur beteiligte
Atome geschlossen werden. Die Bestimmung der exakten Masse kann den Strukturvorschlag
absichern. Mit einem hochauflösenden Hybrid-Massenspektrometer (LTQ-Orbitrap, s. 5.11.7)
wurde dazu die exakte Masse des intensivsten monoisotopischen Peaks des positiv geladenen
Pseudomolekülions ermittelt. Für den für EmoPro3 bestimmten m/z-Wert wurden
Summenformelvorschläge mit den Elementen C, H, N, O und bis zu zwei S in einem
Toleranzfenster von ± 5 ppm berücksichtigt (s. Tab. 3). Aus der atomaren Zusammensetzung
wird für jeden Vorschlag die Anzahl an Ring-/ Doppelbindungsäquivalenten (RDB equiv.)
berechnet.
Über die vorausgegangene LC/ESI-MS-Analyse (s. Abb. 14) konnte für EmoPro3 eine
Molekülmasse von 562 vorgeschlagen werden. Der über die Orbitrap-Analyse ermittelte
m/z-Wert für [M+H]+ ist 563,17590. Die Anzahl der RDB-Äquivalente des ungeladenen
Moleküls liegt stets um 0,5 Zähler höher als der für [M+H]+ Ionen berechnete Wert. Damit
scheiden die Summenformelvorschläge (1, 3, 6, 9) mit gerader Zahl der RDB-Äquivalente
aus. Diese Vorschläge entsprechen auch nicht der "Stickstoffregel" die besagt, dass bei
geradzahliger Molekülmasse kein N oder eine gerade Zahl an Stickstoffatomen in der
Summerformel zu erwarten ist. Durch die relative Intensität der Isotopensatelliten im
Massenspektrum kann kein weiterer Vorschlag ausgeschlossen werden. Nur Vorschlag 2 mit
der Summenformel C27H30O13 (ungeladenes Molekül) und 13 RDB-Äquivalenten lässt sich
mit der NMR-Interpretation von EmoPro3 in Einklang bringen.
Tab. 3: LTQ-Orbitrap-Analyse von EmoPro3.
m/z
563.17590
Theo. Mass
1.
2.
3.
4.
5.
6.
7.
8.
9.
563.17591
563.17592
563.17458
563.17457
563.17726
563.17776
563.17323
563.17859
563.17860
Delta (ppm)
-0.02
-0.03
2.35
2.36
-2.41
-3.31
4.74
-4.78
-4.79
RDB equiv.
Composition
18.0
12.5
13.0
18.5
17.5
5.0
13.5
22.5
17.0
C26H25O8N7
C27H31O13
C25H29O12N3
C24H23O7N10
C28H27O9N4
C14H29O15N9
C23H27O11N6
C29H23O5N8
C30H29O10N
Durch die Betrachtung aller von EmoPro3 aufgenommen NMR-Spektren (1H, 13C, COSY,
HSQC, HMBC, 2D-ROESY, verschiedene 1D-ROESY und 1D-TOCSY) und die
Bestimmung der exakten Masse lässt sich die Struktur von EmoPro3 als
6,8-Di-O-α-L-rhamnosylemodin (s. Abb. 20) beschreiben. Eine CAS-Datenbankabfrage mit
29
Ergebnisse
SciFinder Scholar (s. 5.14) ergab für diese Struktur keinen Treffer [105], weshalb
6,8-Di-O-α-L-rhamnosylemodin als neuer Naturstoff angesehen werden kann.
H
6''
OH
O
EmoPro3
(6,8-Di-O-α-L-rhamnosylemodin)
CH3
4''
5''
OH
H
OH
2''
1''
3''
H
H
O
O
H
8
H
OH
1
9
7
12
6'
Mr: 562,52
5'
H
H3C
HO
5
1'
O
3'
4'
HO
H
3
10
O
H
2
11
6
H
H
13
14
4
O
CH3
H
H
H
2'
OH
ROESY-Kreuzpeak
HMBC-Korrelation
Abb. 20: Struktur von EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin).
Strukturen von EmoPro1 und EmoPro2
Die 1H-NMR-Spektren von EmoPro1 und EmoPro2 (s. Abb. 21) offenbaren jeweils den
einfachen Signalsatz O-glykosidisch verknüpfter α-L-Rhamnose. In Analogie zur EmoPro3NMR-Interpretation konnte für EmoPro1 und EmoPro2 durch die Auswertung weiterer
Spektren (13C, COSY, HSQC, HMBC, 1D- / 2D-ROESY (nur EmoPro1), 2D-NOESY (nur
EmoPro2)) eine Zuordnung der 1H-Signale vorgenommenen werden (s. Abb. 21) und die in
Abb. 22 gezeigten Strukturen vorgeschlagen werden. In beiden Fällen fand die Rhamnosylierung einer α-Hydroxylgruppe (1-OH bzw. 8-OH) statt. Wie beim ebenfalls mit
einer α-Hydroxylgruppe (8-OH) verknüpften zweigestrichenen Zucker von EmoPro3
liegt die chemische Verschiebung des 3'-H-Signals von EmoPro1 und EmoPro2 bei
δH = 3,95 ppm ± 0,01 ppm.
Trotz ähnlicher chemischer Strukturen von EmoPro1 und EmoPro2 unterscheiden sich die
1
H-NMR-Spektren der Stoffe grundsätzlich (s. Abb. 21). Während im Spektrum von
EmoPro2 scharfe Signale der Protonen der Zuckerhydroxylgruppen und der verbleibenden
α-Hydroxylgruppe erscheinen, sind die entsprechenden Signale von EmoPro1 deutlich breiter
und erlauben keine Bestimmung der Multiplizität. Das 6-OH-Signal fehlt bei EmoPro1. Der
deutlichste Unterschied besteht hinsichtlich des H2O-Signals. Das flache, breite H2O-Signal
im Spektrum von EmoPro1 gewährt erstmalig einen Blick auf das 4'-H-Signal. Das Dublettvon-Dublett mit transdiaxialer 9,2 Hz-Kopplung erscheint als Pseudotriplett.
30
Ergebnisse
Eine Erklärung der Unterschiede im 1H-Spektrum ist beim Isolierungsverfahren der
Metaboliten zu suchen. EmoPro1 wurde als Pulver nach dem Abziehen des Lösungsmittels
aus einer Fraktion der Flash-Chromatographie gewonnen und nach Gefriertrocknung direkt
zur Herstellung der NMR-Probe verwendet. Im Gegensatz dazu wurden die NMR-Proben von
EmoPro2 und EmoPro3 erst nach der Kristallisation aus Methanol / H2O und anschließender
Gefriertrocknung hergestellt. Eingeschlossenes Kristallwasser, das durch Gefriertrocknung
nicht entfernt wird, könnte zur Koordinierung der Hydroxylgruppenprotonen und damit zur
festgestellten, scharfen Signalform führen.
~
H2O
(4'-H)
EmoPro2 (1-O-α-L-Rhamnosylemodin)
5-H / 7-H
8-OH
2-H
4-H
6-OH
DMSO
4'-H
7-H
5-H
4-H / 2-H
1-OH
H2O
2'-OH /
3'-OH /
4'-OH 2'-H /
3'-H
DMSO
3-CH3
5'-CH3
3'-OH
5'-H
4'-OH
2'-H
2'-OH
3'-H
1'-H
EmoPro1 (8-O-α-L-Rhamnosylemodin)
5'-H
~
~
3-CH3
5'-CH3
1'-H
ppm
Abb. 21: 1H-NMR-Spektren (DMSO-d6, 400 MHz) von EmoPro2 und EmoPro1.
Die exakte Masse von EmoPro1 und EmoPro2 wurde mit dem LTQ-Orbitrap-Hybridmassenspektrometer (s. 5.11.7) bestimmt. Mit den für [M+H]+ gemessenen m/z-Werten
417,11808 (EmoPro1) und 417,11809 (EmoPro2) kommt als einziger Summenformelvorschlag C21H21O9 (Mberechnet: 417,11801, 11,5 RDB-Äquivalente) in Betracht. Die für das
ungeladene Molekül abgeleitete Formel C21H20O9 entspricht den Strukturvorschlägen der
NMR-Interpretation. Bei EmoPro1 handelt es sich demnach um 8-O-α-L-Rhamnosylemodin,
bei EmoPro2 um 1-O-α-L-Rhamnosylemodin (s. Abb. 22).
31
Ergebnisse
EmoPro1
Mr: 416,38
H
6'
O
CH3
OH
EmoPro2
H
4'
4'
5'
O
H
12
9
5'
H
13
6
HO
10
H
3
6
CH3
O
H
O
1
9
12
7
4
5
O
8
H
2
14
H
1'
H
OH H
OH
7
11
O
H3C
1
8
H
H
6'
3'
H
H
O
HO
OH
2'
1'
2'
3'
OH
H
OH
HO
H
13
2
3
11
HO
14
10
H
ROESY / NOESY-Kreuzpeak
HMBC-Korrelation
CH3
4
5
H
O
Abb. 22: Strukturen von EmoPro1 (8-O-α-L-Rhamnosylemodin) und EmoPro2 (1-O-α-L-Rhamnosylemodin).
Struktur von AliPro1
Die Interpretation der NMR-Spektren von AliPro1 (1H, 13C, COSY, HSQC, HMBC, 2DNOESY) wurde in Kooperation mit Dr. T. Taguchi (AK Ichinose, Musashino University,
Tokyo) durchgeführt. Die Struktur von AliPro1 ließ sich als 2-O-α-L-Rhamnosylalizarin
beschreiben. Die Bestimmung von 2-OH als Glykosylierungsposition gelingt über einen NOE
zwischen 3-H und 1'-H. Hinweis auf die Verknüpfungsposition ist des Weiteren die Präsenz
eines 1H-Singuletts mit der typischen chemischen Verschiebung eines α-Hydroxylgruppenprotons (δH = 12,68 ppm). Das 1H-Signal von 3'-H liegt bei δH = 3,72 ppm und
erscheint damit bei ähnlicher chemischer Verschiebung wie das äquivalente Protonensignal
des 6-O-verknüpften Zuckers von Emodin (δH = 3,67 ppm). Die Abhängigkeit der chemischen
Verschiebung des 3'-H-Signals von der Glykosylierungsposition wird mit diesem weiteren
Beispiel bestätigt.
AliPro1
(2-O-α-L-Rhamnosylalizarin)
H
6'
O
CH3
OH
5'
4'
OH
H
O
OH
H
1'
H
Mr: 386,35
H
1
8
H
12
9
O
13
7
2
6
3
11
10
14
4
5
H
O
Abb. 23: Struktur von AliPro1 (2-O-α-L-Rhamnosylalizarin).
H
OH
2'
3'
H
H
NOESY-Kreuzpeak
H
32
Ergebnisse
Aus dem gemessenen m/z-Wert 387,10752 für [M+H]+ lässt sich für das ungeladene Molekül
die Summenformel C20H18O8 (12 RDB-Äquivalente) ableiten, die sich mit dem Strukturvorschlag 2-O-α-L-Rhamnosylalizarin deckt. Die Substanz ist noch nicht in der CASDatenbank gelistet [105].
3.1.2 Screening einer Bibliothek von Anthrachinonderivaten
Alizarin und Emodin wurden in Kulturen von S. espanaensis rhamnosyliert. Diese
Biotransformation mit der Konjugation eines Desoxyzuckers weckte das Interesse einer
biokatalytischen Verwendung in der organischen Synthese. Speziell die Glykosylierung mit
Desoxyzuckern erfordert mit klassischen Synthesemethoden zahlreiche Schritte bei oft
geringen Ausbeuten [106]. Die festgestellte Spezifität für aktivierte Rhamnose als Donor des
Glykosyltransfers ermöglicht dabei die gezielte Anwendung von S. espanaensis.
Mit einer Bibliothek verschiedener Anthrachinone natürlichen oder synthetischen Ursprungs
sollte die Akzeptorflexibilität der Glykosylierungsaktivität gestestet werden. Die eingesetzten
Substanzen wurden ursprünglich für die Verwendung als Farbstoffe von Prof. Dr. V. Novikov
(National University „Lvivs'ka Politechnika”, Lviv, Ukraine) synthetisiert oder wurden
speziell für dieses Experiment erworben (s. 5.2.4, Tab. 29).
Die Fütterung von je 5 mg der entsprechenden Substanz an 100 mL Kulturen erfolgte wie
auch die Extraktion nach sechstägiger Inkubationszeit gemäß eines standardisierten Protokolls
(s. 5.3.1.4). Zur Detektion der Transformationsprodukte wurde der Rohextrakt einer
LC/ESI-MS-Analyse unterzogen (Methode: antqui, s. 5.11.6). Die Chromatogramme wurden
auf neu auftretende Derivate mit Aglykon ähnlichen UV/VIS-Absorptionsspektren untersucht.
Bisherige Ergebnisse zeigten, dass aufgrund von Rhamnosylierungen von Anthrachinonen
keine grundsätzlichen Abweichungen vom UV/VIS-Absorptionsspektrum des Aglykons zu
erwarten sind (s. 3.1.1). Für entsprechende Peaks des Chromatogramms wurde aus
korrespondierenden MS-Signalen ein Massenvorschlag abgeleitet. Parallel wurden mit der
"extract ions" Funktion MS-Diagramme für m/z-Werte der Ionen von rhamnosylierten
(+146 u) und hydroxylierten (+16 u) Derivaten erstellt. Beim Zusammentreffen von
charakteristischen Absorptionsspektren und MS-Signalen bei korrespondierenden Retentionszeiten wurde der entsprechende Peak durch Abgleich mit einer Probe aus der gefütterten
Lösung, sowie einer Negativkontrolle (Rohextrakt einer parallel durchgeführten
Anthrachinonfütterung) auf Signifikanz überprüft. Peaks, deren Präsenz sich eindeutig auf das
gefütterte Aglykon zurückführen ließ, flossen in die Auswertung (s. Tab. 4) ein.
33
Ergebnisse
Tab. 4: Biotransformation von Anthrachinonen in Kulturen von S. espanaensis. Die Detektion von Metaboliten
in Ethylacetatextrakten der gefütterten Kulturen erfolgte per LC/MS (Methode: antqui, s. 5.11.6). Berücksichtigt
wurden nur Metaboliten mit einem UV/VIS-Absorptionsspektrum, ähnlich dem der gefütterten Substanz, oder
offensichtliche Transformationsprodukte. Die Produkte wurden in drei Klassen eingeteilt:
A: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines hydroxylierten Derivats.
B: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines rhamnosylierten Derivats oder eines
rhamnosylierten und hydroxylierten Derivats.
C: Weitere Transformationsprodukte, liegen Zusatzinformationen vor, sind diese unter der Tabelle gelistet.
Im Chromatogramm der angegebenen Wellenlänge (λ) wurde die Gesamt-AUC der Peaks einer Produktklasse
bestimmt und als prozentualer Anteil an der Gesamt-AUC des Eduktpeaks und aller Produktpeaks von
Substanzen mit ähnlichem Absorptionsspektrum angegeben.
-anthrachinon
Struktur
O
unsubstituiert
(1)
Metabolitendetektion
λ
A
B
C
330 nm 0
0
0
430 nm 0
4 Peaks 0
(87 %)
O
O
1,2-Dihydroxy(Alizarin)
(2)
OH
OH
AliPro1
(55 %)
O
1,4-Dihydroxy(Chinizarin)
(3)
1,5-Dihydroxy(4)
1,8-Dihydroxy(Danthron)
(5)
O
OH
O
OH
O
OH
O
OH
O
480 nm 0
1 Peak
(5 %)
0
OH
430 nm 0
1 Peak
(14 %)
0
OH
430 nm 0
1 Peak
(19 %)
0
360 nm 0
7 Peaks 0
(91 %)
O
2,6- / 2,7-Dihydroxy(Anthraflavin /
Isoanthraflavin)
(6)
O
OH
HO
O
34
-anthrachinon
Ergebnisse
Struktur
OH
1,8-Dihydroxy3-methyl(Chrysophanol)
(7)
Metabolitendetektion
λ
A
B
O
OH
C
430 nm 0
3 Peaks 0
(49 %)
430 nm 0
1 Peak
(92 %)
430 nm 0
7 Peaks 1 Peak
(37 %) (< 1 %)
CH3
O
OH
1,8-Dihydroxy3-(hydroxymethyl)(Aloe-Emodin)
(8)
O
OH
0
OH
O
1,3,8-Trihydroxy6-methyl(Emodin)
(9)
1,8-dihydroxy3-methoxy-6-methyl(Physcion)
(10)
1,4,5,8-Tetrahydroxy(11)
1,2,5,8-Tetrahydroxy(Quinalizarin)
(12)
OH
OH
HO
CH3
EmoPro3
(13 %),
EmoPro2
(7 %),
EmoPro1
(5 %)
O
OH
O
OH
400 nm 0
3 Peaks 0
(85 %) s. *10
s. *10
550 nm 0
0
s. *11
480 nm 0
7 Peaks 0
(73 %)
NH2
480 nm 0
2 Peaks 0
(1 %)
NH2
480 nm 0
4 Peaks 3 Peaks
(18 %) (8 %)
H3C
OMe
O
OH
O
OH
OH
O
OH
OH
O
OH
OH
OH
1-Amino(Smoke Orange G)
(13)
O
0
s. *11
O
O
O
1-Amino-4-chlor(14)
O
Ant14Pro1
O
Cl
(17 %)
35
Ergebnisse
-anthrachinon
Struktur
Metabolitendetektion
λ
A
B
O
1-Amino-2-chlor(15)
NH2
C
480 nm 0
1 Peak 0
(< 1 %)
480 nm 0
3 Peaks 0
(93 %)
550 nm 1 Peak
(1 %)
4 Peaks 0
(6 %)
NH2
480 nm 0
1 Peaks 0
(2 %)
NH2
600 nm 0
3 Peaks 0
(4 %)
600 nm 1 Peak
(18 %)
1 Peak
(2 %)
0
480 nm 0
0
2 Peaks
(48 %)
480 nm 0
0
2 Peaks
(11 %)
Cl
O
O
1-Amino-4-hydroxy(Duranol)
(16)
NH2
O
1-Amino-2-phenoxy4-hydroxy(Disperse Red 60)
(17)
1,5-Diamino(Smoke Red F)
(18)
O
OH
NH2
O
O
OH
O
NH2
O
O
1-Amino-4-[(2-hydroxyethyl)amino](19)
O
HN
OH
1-Amino-4-[(4-methylphenyl)amino](Fat Soluble Pure Sky
Blue)
(20)
1-Amino-2-carboxy(21)
O
NH2
O
N
H
O
CH3
NH2
COOH
O
1-Amino-4-brom2-carboxy(22)
O
NH2
COOH
O
Br
36
-anthrachinon
Ergebnisse
Struktur
O
1-Amino-2-carboxy4-(methylamino) /
1,4-Diamino-2-carboxy(23)
OH
O
R = H, CH3
N R
H
O
OH
NO2 O
O
HN
OH
O
HN
O
HO
H
N
N
H
OH
O
OH
O
550 nm 0
0
360 nm 0
600 nm
4 Peaks s. *24
(48 %)
Metabolitendetektion
λ
A
B
OH
OH
C
2 Peaks
(18 %)
NO2
Struktur
Mitoxantron
(25)
Norsolorinsäure
(26)
NH2
COOH
1,8-Dihydroxy-4,5dinitro(4,5-Dinitrochrysazin)
(24)
Name
Metabolitendetektion
λ
A
B
OH
C
600 nm 0
0
3 Peaks
(18 %)
480 nm 0
4 Peaks 3 Peaks
(90 %) (10 %)
s. *26
OH
Pro1:
+2 Rha
(50 %)
*10: Von Roth bezogenes 10 war mit 7 verunreinigt. Eine weitere Charge des Herstellers zeigte sich ebenfalls
als Stoffgemisch. In die Auswertung flossen auch die Transformationsprodukte von 7 ein.
*11: Die gefütterte Substanz enthält neben 11 ein laut MS-Signalen um 1 u leichteres Molekül mit ähnlichem
UV/VIS-Absorptionsspektrum. Nur dieses Derivat wurde wahrscheinlich rhamnosyliert.
*24: Aufgrund einer stark bathochromen Verschiebung des VIS-Absorptionsmaximums ist von einer Reduktion
der Nitrogruppen zu Aminogruppen auszugehen, was auch von den gemessenen MS-Signalen bestätigt wird.
Angegeben sind die Transformationsprodukte von 1,8-Diaminino-4,5-dihydroxyanthrachion (24rr) (s. Abb. 26).
*26: Nur über MS-Signale konnten Spuren von verbliebenem Aglykon detektiert werden.
Abb. 24: Biotransformation in Saccharothrix espanaensis: Mit Anthrachinonaglyka gefütterte Kulturen vor dem
Schüttelinkubator (links) und eine Farbpalette verschiedener Anthrachinonglykoside nach der Extraktion mit
Ethylacetat (rechts).
Ergebnisse
37
Das Ausmaß der Konversion wird bei Biotransformationsreaktionen häufig über das
Verhältnis der AUC des Produktpeaks zur Summe der AUC von Produkt- und Eduktpeaks bei
einer bestimmten Wellenlänge abgeschätzt. Dieses Vorgehen ist nur bedingt zulässig.
Relative Aussagen zu Konzentrationsverhältnissen in einem Substanzgemisch auf Basis von
AUCs können nur durch die Anwendung von Korrekturfaktoren innerhalb eines validierten
Verfahrens gemacht werden. Laut Pharmacopoeia Europaea 4.0 werden auf diese Weise
Obergrenzen für Verunreinigungen in Arzneistoffen festgelegt. Die Bestimmung von
Korrekturfaktoren ist nur mit Referenzsubstanzen möglich. Das Verhältnis von AUCs ohne
Anwendung von Korrekturfaktoren führt nur in Ausnahmefällen zu den tatsächlichen
Konzentrationsverhältnissen. Nämlich dann, wenn alle Peak spezifischen Korrekturfaktoren
den Wert 1 haben.
Vor diesem Hintergrund sind die in Tab. 4, Tab. 5 und Tab. 6 angegebenen AUC-Verhältnisse
nur als Anhaltspunkt für die Konzentrationsverhältnisse im Rohextrakt zu verstehen. Die
AUCs wurden im Allgemeinen bei einer Wellenlänge im Bereich des langwelligsten
Absorptionsmaximums der Ausgangsverbindung bestimmt, das für alle Amino- und
Hydroxyanthrachinone im VIS-Bereich liegt. Im Vergleich zu den Absorptionsmaxima der
Anthrachinone bei 250 nm - 300 nm verläuft die Kurvenform im VIS-Bereich relativ flach, so
dass leicht abweichende Maxima der verschiedenen Derivate nur einen geringeren Einfluss
auf die AUC haben. Durch Glykosylierung an Positionen, die am Aufbau des Chromophors
mit Absorption im VIS-Bereich beteiligt sind ändern sich jedoch die molaren Extinktionskoeffizienten im VIS-Bereich.
Es konnte keine Biotransformation von unsubstituiertem Anthrachinon (1) festgestellt werden.
Bei fast allen Hydroxyanthrachinonen lässt die Auswertung der LC/MS-Läufe auf eine
Rhamnosylierung schließen. Nur im Rohextrakt von 11 (vier α-Hydroxylgruppen) konnte ein
um 146 u (+Rha) schwereres Derivat der gefütterten Verbindung nicht nachgewiesen werden
(vgl. Tab. 4, Anmerkung *11). Der Vergleich des AUC-Anteils glykosylierter Derivate von
Anthrachinonen mit α-Hydroxylgruppen als einzigen Substituenten (3, 4, 5, 11 mit 0 - 19 %)
und von Vertretern mit weiteren aromatischen Hydroxylgruppen (2, 6, 12 mit 73 - 91 %) zeigt
die deutliche Präferenz der verantwortlichen Glykosyltransferase(n) für β-Hydroxylgruppen,
was auch durch die Rhamnosylierung von Alizarin (2) mit hoher Regioselektivität an 2-O
(s. 3.1.1) bestätigt wird. Weitere Substituenten wie Methyl-, Methoxy- und Aminogruppen
scheinen zu einer Aktivierung von α-Hydroxylgruppen zu führen wie die deutliche
Umsetzung von 7, 8, 9, 10, 16 (37 - 93 %) zeigt. Die drei bekannten Hauptprodukte der
Biotransformation von Emodin (9) tragen alle eine α-ständige, O-glykosidisch verknüpfte
Rhamnose (s. 3.1.1).
Mit Spannung wurde die Biotransformation der Aminoanthrachinone (13 - 23) verfolgt.
Während davon auszugehen ist, dass das Bodenbakterium S. espanaensis auch in seinem
natürlichen Umfeld mit Hydroxyanthrachinonen in Berührung kommt, scheint dies für die
synthetisch gewonnenen Aminoanthrachinone unwahrscheinlich. Erstaunlicherweise erfuhr
38
Ergebnisse
jedes der zugesetzten Aminoanthrachinone eine Transformation, die S. espanaensis offensichtlich der hohen Flexibilität seiner für den (Xenobiotika-)Metabolismus zur Verfügung
stehenden Enzyme zu verdanken hat. Die Hauptprodukte der Transformation von 13 - 20
zeichnen sich durch einen Massengewinn von 162 u aus, was entweder einer Hydroxylierung
und Rhamnosylierung (+16 u+146 u) oder der Konjugation einer Hexopyranose (+162 u)
entspricht. Durch die Isolierung und Strukturaufklärung von Ant14Pro1, einem
Transformationsprodukt von (14) wurde dieser Frage nachgegangen (s. 3.1.2.1).
Die carboxylierten Aminoanthrachinone (21 - 23) erfuhren eine Transformation zu später
eluierenden (= im leicht sauren Milieu lipophileren) Derivaten. Der Gedanke an eine
Veresterung liegt nahe, MS-Signale konnten den Substanzen vermutlich aufgrund mangelnder
Ionisierung nicht zugeordnet werden.
Zu einer Überraschung führte die Fütterung von 1,8-Dihydroxy-4,5-dinitroanthrachinon (24).
Lösungen von 24 in Wasser (pH 7), Ethylacetat oder DMSO weisen eine gelbe Färbung auf.
Der Ethylacetatextrakt der mit 24 gefütterten Kulturen war intensiv violett gefärbt. Die aus
MS-Signalen abgeleiteten Massen der violetten Stoffe deuten auf die Reduktion einer
Nitrogruppe (Derivat 24r) bzw. beider Nitrogruppen (Derivat 24rr) zu Aminogruppen hin.
Diese Derivatisierung würde auch die stark bathochrome Verschiebung des
VIS-Absorptionsmaximums erklären. Beim Derivat 24rrPro1 mit der aus MS-Signalen
abgeleiteten Masse 416 könnte es sich um ein rhamnosyliertes Derivat von 24rr handeln. Ein
entsprechendes Derivat von 24r wurde nicht detektiert.
Extrakt nach Biotransformation
Gefütterte Lösung
254 nm
mAU
1600
24
M: 330
mAU
mAU
400
1000
mAU
600
500
800
0
220
0
550 nm
mAU
24
400
600 nm
10
20
30
0
220
min.
24r
M: 300
240
12
600 nm
24rrPro1
M: 416
120
0
400
0
220
400
600 nm
mAU
20
0
200
550 nm
mAU
40
0
220
400
200
400
10
24rr
M: 270
24r
600 nm
20
30
min.
0
0
10
20
30
min.
Abb. 25: Biotransformation von 1,8-Dihydroxy-4,5-dinitroanthrachinon (24). Links: Nachweis von 24r mit
einer reduzierten Nitrogruppe in der gefütterten Lösung. Rechts: 24rr mit zwei reduzierten Nitrogruppen sowie
das glykosylierte Derivat 24rrPro1 entstehen durch Biotransformation in Kulturen von S. espanaensis (LC/MSMethode: antqui, s. 5.11.6).
39
Ergebnisse
Gefütterte Lösung
OH O
OH O
OH
Biotransformationsprodukte
OH
HO
OH O
OH
NH2 O
NH2
+
NO2 O
24
NO2
NO2 O
24r
NH2
24rr
OH
HO
O
OH O
O
NH2 O
NH2
24rrPro1
Abb. 26: Hypothetischer Weg der Biotransformation von (24) in Kulturen von S. espanaensis.
Das Chromatogramm der gefütterten Lösung bei 550 nm (s. Abb. 25) zeigt, dass schon die
gefütterte Lösung mit Spuren von 24r verunreinigt war. Es schien somit fraglich, ob die
Nitroreduktion tatsächlich eine Biotransformation ist oder ohne enzymatische Katalyse
abläuft. In sterilem Kulturmedium konnte unter identischen Bedingungen kein 24rr
nachgewiesen werden. Folglich handelt es sich bei der Umsetzung von 24 in Kulturen von
S. espanaensis um eine zweistufige Biotransformation: Nitroreduktion und Glykosylierung
(s. Abb. 26). Die Reduktion aromatischer Nitrogruppen ist eine seltene und wertvolle
Biotransformationsleistung von Bodenbakterien, die ihre gezielte Anwendung in der
Altlastenentsorgung auf Industriegeländen ehemaliger Sprengstofffabriken findet
(Metabolisierung von Trinitrotuluol (TNT)) [107].
Das klinisch gegen Multiple Sklerose [108] oder als Zytostatikum [109] eingesetzte Aminoanthrachinon Mitoxantron (25) liegt bei physiologischem pH-Wert vorwiegend in protonierter
Form vor. Ein passives Eindringen in die Zellen durch Membrandiffusion, wie bei den
anderen gefütterten Anthrachinonen, kann für 25 deshalb nicht erwartet werden. Die
Extraktionsbedingungen wurden speziell auf 25 angepasst. Da die Wasserlöslichkeit laut
Berechnungen mit der Software von Advanced Chemistry Development (über SciFinder
Scholar, s. 5.14) bei pH 8 - 9 am geringsten ist, wurde der pH-Wert vor der Extraktion
entsprechend eingestellt. Beim Standardextraktionsverfahren werden Myzel und
Kulturüberstand getrennt voneinander mit Ethylacetat extrahiert (s. 5.11.1.1). Bei anderen
Anthrachinonen signalisiert eine deutliche Färbung des Myzelextrakts die erfolgreiche
Extraktion des Anthrachinonderivats aus den Zellen. Der Myzelextrakt der mit 25 gefütterten
Kultur blieb jedoch weitgehend farblos. Im Gegensatz dazu war die erfolgreiche Extraktion
von 25 aus dem Kulturüberstand durch die intensiv türkis gefärbte Ethylacetatphase gut
nachvollziehbar. Rhamnokonjugate konnten per LC/MS-Analyse nicht nachgewiesen werden.
Korrespondierende MS-Signale von neu entstandenen Peaks mit dem charakteristischen
Absorptionsmaximum von 25 bei ca. 600 nm ließen auf die Bildung oxidierter Formen
schließen, wie sie auch als Produkte des menschlichen Mitoxantronmetabolismus bekannt
sind [109].
40
Ergebnisse
Außer nur geringer Permeation von 25 in die Zellen könnten auch sterische Effekte der
Seitenketten den Kontakt mit der Rhamnosyltransferase verhindern. Beide Faktoren sollten
weiter untersucht werden: die sterische Behinderung durch Fütterung der ebenfalls
Seitenketten tragenden Norsolorinsäure 26, die eigens für dieses Experiment aus dem Pilz
Aspergillus nidulans TTRM1 gewonnen wurde (s. 3.1.3). Die geringe Membranpermeation
sollte durch den Einsatz aufgeschlossener Zellen umgangen werden (s. 3.1.7).
3.1.2.1 Biotransformation von 1-Amino-4-chloranthrachinon
Besonderes Interesse galt den Transformationsprodukten nicht hydroxylierter Aminoanthrachinone, deren Moleküle im Vergleich zum Aglykon 162 u und deutlich an Hydrophilie
gewonnen hatten. Nur durch N-Rhamnosylierung (+146 u) lässt sich der Massengewinn nicht
erklären. Sollte es sich um N-Glykoside handeln, könnte alternativ eine Hexopyranose
verknüpft sein. Falls es sich um O-Glykoside handelt, müsste der Glykosylierung mit einem
Monodesoxyzucker eine Hydroxylierung des Aglykons vorausgehen. Die Isolierung und
Strukturaufklärung des Hauptmetaboliten von 14 sollte Klarheit bringen.
Isolierung von Ant14Pro1
Zur Gewinnung von Ant14Pro1 wurden S. espanaensis-Kulturen in NL111-Medium mit
einem Gesamtvolumen von 2 L angesetzt. Die Kultivierung, Zufütterung von insgesamt
100 mg 1-Amino-4-chloranthrachinon (14) sowie die Extraktion mit Ethylacetat folgte
standardisierten Protokollen (s. 5.3.1.4, 5.11.1.1). Über wiederholte Flash-Chromatographie
(s. 5.11.3) mit Methanol-Wasser-Gradienten und LiChroprep RP 18 als stationärer Phase bzw.
Gelfiltrationen über Sephadex LH-20 und Methanol als Fließmittel sowie anschließender
Kristallisation aus Methanol / H2O wurden 4,0 mg Ant14Pro1 als rote Nadeln erhalten. Für
die NMR-Analyse wurden die Kristalle in DMSO-d6 gelöst.
Struktur von Ant14Pro1
Das UV/VIS-Absorptionsspektrum von Ant14Pro1 (s. Abb. 27) zeigt wie auch das Spektrum
der Ausgangsverbindung ein Maximum bei 476 nm. Die entsprechende Absorptionsbande ist
auf ein chromophores System mit maßgeblicher Beteiligung der α-ständigen Aminogruppe
zurückzuführen [97]. Die exakte Beibehaltung von λmax = 476 nm im Spektrum des Transformationsprodukts Ant14Pro1 spricht gegen die in Erwägung gezogene N-Glykosylierung.
Die korrespondierenden Massenspektren zeigen das typische Isotopenmuster von Ionen mit
einem Chloratom und deuten auf eine Molekülmasse von 419 hin (s. Abb. 27).
41
Ergebnisse
mAU
400
252 nm
int.
+
[M+H]
420
80
285 nm
200
314 nm
40
476 nm
0
0
250
500
nm
+
[M-146+H]
274
300
[M+Cl]
454
[M-146-H]
272
int.
+
[M+K]
458
+
[M+K+CH3CN]
499
400
80
40
[M+Na+2K-4H]
516
0
260 400 450
m/z
[M+2Na+CH3CN-3H]
503
m/z
Abb. 27: Daten aus der LC/ESI-MS-Analyse von Ant14Pro1 (Methode: antqui, s. 5.11.6).
Im 1H-NMR-Spektrum von Ant14Pro1 finden sich nur fünf der sechs Signale aromatischer
Protonen des parallel analysierten 14 wieder. Die Interpretation der 13C-, HMBC- und HSQCSpektren ergibt, dass bei sonst unveränderter Struktur des Anthrachinons eine zusätzliche
Substitution an C-2 oder C-3 stattgefunden hat. Weiterhin treten Signale einer Zuckereinheit
auf. Über die chemische Verschiebung des 13C-Signals des anomeren Kohlenstoffkerns (C-1')
kann die Natur der Verknüpfung eindeutig als O-glykosidisch bestimmt werden. Das Signal
erscheint bei δC = 99,1 ppm und entspricht damit den Literaturwerten bei O-glykosidischer
Verknüpfung [103]. Das Signal des anomeren Kohlenstoffkerns liegt für N-Glykoside bei
ca. 85 ppm [110], für C-Glykoside bei ca. 75 ppm. Über Kopplungskonstanten und NOEs
gelingt die Identifizierung der Zuckereinheit. Wie bei den zuvor isolierten
Biotransformationsprodukten von S. espanaensis deuten die Daten darauf hin, dass es sich bei
Ant14Pro1 um ein α-L-Rhamnosid handelt.
Über die NMR-Daten sollte die Glykosylierungsposition bestimmt werden: Position 2
(Möglichkeit A) oder Position 3 (Möglichkeit B). Hilfreich für die Zuordnung könnte die
HMBC-Korrelation des am substituierten, aromatischen Ring verbleibenden Protons mit
einem der beiden Carbonyl-13C-Signale sein (s. Abb. 28, fett). Es war jedoch nicht möglich,
die Signale von C-9 und C-10 differenziert zuzuordnen. Die weiteren Korrelationen leiten
sich von der Festlegung der fett markierten Korrelation. Entsprechende Korrelationen sind
jedoch auch für Möglichkeit B (Glykosylierungsposition C-3, Festlegung der fett markierten
Korrelation auf C-9) zu erwarten.
Zucker 1'-H
RO
NH2
O
H
1
9
8
2
Möglichkeit
A
3
H
4
Cl
12
13
11
14
10
5
O
H
H
7
HMBC-Korrelationen
mit 5-H / 6-H / 7-H / 8-H
6
H
Abb. 28: HMBC-Korrelationen des Aglykons von Ant14Pro1, falls es sich um eine Rhamnosylierung an C-2
handelt (Möglichkeit A).
42
Ergebnisse
Mit bedingter Genauigkeit lassen sich chemische Verschiebungen über Inkrementsysteme
berechnen und aus den Spektren ähnlicher Moleküle ableiten. Gute Vorhersagen lassen sich
für 13C-Verschiebungen aufstellen, da diese weniger als 1H-Verschiebungen vom verwendeten Lösungsmittel oder vorhandenen Verunreinigungen abhängen. Mit den Programmen
ChemNMR aus dem ChemOffice-Paket und NMR-Predict von Mestrelab (s. 5.14) wurden
unabhängig voneinander Spektren für die Möglichkeiten A und B berechnet (s. Abb. 29). Das
Programm ChemNMR greift für die Vorhersage des 13C-Spektrums auf ca. 4000 Parameter
zu. Das Programm NMR-Predict bedient sich einer fortlaufend aktualisierten OnlineSpektrendatenbank und verwendet bei mangelnder Verfügbarkeit korrespondierender Daten
Inkrementsysteme. Durch den Abgleich der berechneten mit den gemessenen Werten sollte
ein Hinweis auf die Glykosylierungsposition gewonnen werden.
Im 13C-Spektrum von 14 erscheint das Signal von C-1 bei δC = 151,5 ppm. Durch eine
O-Glykosylierung an C-2 (Möglichkeit A) ist durch den resultierenden +M-Effekt eine
Erhöhung der negativen Ladungsdichte an C-1 und damit eine Verschiebung des C-1-Signals
zu höherem Feld zu erwarten, während die Verschiebung bei Möglichkeit B weitgehend
unverändert bliebe. Der für das C-1-Signal ermittelte Wert von δC = 142,8 ppm spricht für
eine Substitution an C-2.
Die für Möglichkeit A nur um 0,1 ppm bzw. 0,6 ppm vom gemessenen Wert
(δC = 119,5 ppm) abweichenden Berechnungen für die chemische Verschiebung des
C-3-Signals bestärken die Annahme einer O-Glykosylierung an C-2. Für Möglichkeit B
wären für das Signal von C-2 Werte bei δC = 105 ppm zu erwarten, da bei äquivalentem
+M-Effekt des Zuckersubstituenten der -I-Effekt der Aminogruppe geringer als der des
Chlorsubstituenten ausfällt.
Die Auswertung der Spektrenberechnung lässt eine klare Tendenz zu Möglichkeit A
erkennen. Für die differenzierte Zuordnung der beiden Carbonyl-13C-Signale liefert die
Vorhersage von NMR-Predict einen Hinweis darauf, dass C-9 mit stärkerer Tieffeldverschiebung als C-10 erscheint. Mit SciFinder Scholar (s. 5.14) wurden 13C-Referenzdaten
von 14 in DMSO-d6 gefunden. Die Autoren geben δC-9 mit 183,1 ppm, δC-10 mit 181,7 ppm an
[111]. Wird diese Zuordnung auf Ant14Pro1 übertragen, lässt sich über HMBC-Korrelationen
C-2 als Glykosylierungsposition (Möglichkeit A) bestimmen.
Durch Zusammenfassung aller Ergebnisse der NMR-Interpretation wird davon ausgegangen,
das AntPro1 als 1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon beschrieben werden kann.
Der Strukturvorschlag entspricht der von der exakten Masse m/z = 420.08446 [M+H]+ für das
ungeladene Molekül abgeleiteten Summenformel C20H19O7NCl. Die Substanz ist noch nicht
in der CAS-Datenbank gelistet [105].
43
Ergebnisse
ChemOffice ChemNMR
130.0
O
H2N
A
137.9
114.6
149.0
16.9
H3C
HO
77.7
70.5
119.4
101.5
O
73.1
73.4
HO
149.6
O
105.6
104.3
130.0
155.6
182.1
O
O
125.3
H
H
132.2
133.6
121.7
O
6.20
133.6
182.1
NH2
132.2
16.9
H3C
HO
Cl
6.82
77.7
OH
70.5
101.0
O
73.1
130.7
110.8
Cl
133.6
182.1
182.1
133.6
130.0
132.2
132.2
130.0
O
B
73.4
HO
OH
Mestrelab NMR-Predict
126.8
O
H2N
A
139.8
143.7
118.3
127.4
O
17.7
H3C
HO
72.6
72.5
103.3
72.1
O
118.9
H
71.9
HO
126.2
NH2
6.92
128.8
188.4
134.4
H
134.4
128.8
160.3
O
O
17.7
H3C
HO
7.65
111.7
106.5
126.8
181.8
Cl
149.6
O
72.6
OH
72.5
72.1
103.3
O
134.4
126.2
Cl
128.8
187.0
183.1
128.8
126.8
134.4
134.4
126.8
O
B
71.9
HO
OH
Abb. 29: NMR-Vorhersagen von 13C-Verschiebungen und 1H-Verschiebungen (eingerahmt) der beiden
Strukturvorschläge für Ant14Pro1 (Angaben in ppm). Die für jede Position am besten mit den gemessenen
Verschiebungen übereinstimmenden Werte sind rot markiert.
70.1
17.8
1.14
4.96
H3.41
H3.86
H3C
O
OR
99.1
H 5.65
H4.01
HO
71.7
3.3
H HO
4.70
70.0
69.4
OH 5.21
NH2
142.8
RO
147.8
119.5
7.30
H
112.2
2
1
O
183.5
H8.18
125.9
9
H7.86
133.3/133.5/
133.6/133.7
10
126.3
Cl 121.9/
122.2 O
180.8
H7.86
H 8.11
Abb. 30: Zuordnung der NMR-Signale (chemische Verschiebung in ppm) zur Struktur von Ant14Pro1
(1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon, Mr: 419,81, Mberechnet: 419,08)
44
Ergebnisse
Zweistufige Biotransformation von 1-Amino-4-chloranthrachinon
Die O-Rhamnosylierung von 14 impliziert eine vorausgehende Hydroxylierung. Weder nach
steriler Inkubation von 14 mit Nährmedium als Negativkontrolle noch im Kulturextrakt des
mit 14 gefütterten S. espanaensis konnte ein hydroxyliertes Derivat von 14 nachgewiesen
werden. Die Hydroxylierung stellt sich folglich als limitierender Schritt der zweistufigen
Biotransformation dar.
NH2 O
NH2 O
I.
O
HO
H2N
II.
III.
O
Cl
O
Cl
O
H3C
HO
O
O
HO
Cl
OH
Saccharothrix espanaensis
NH2 O
Cl
O
1-Amino-4-chloranthrachinon (Ant14)
O
H2N
I. Funktionalisierung
II. Konjugation
III. Export
O
H3C
HO
O
O
HO
Cl
OH
2-O-α-L-Rhamnosyl-Ant14
Abb. 31: Metabolismus von 1-Amino-4-chloranthrachinon in Saccharothrix espanaensis.
Die Umsetzung von 14 zeigt Parallelen zum menschlichen Xenobiotikametabolismus, der
sich in drei Phasen gliedert (s. Abb. 31). Phase I-Reaktionen funktionalisieren das Zielmolekül durch Einführung polarer oder reaktiver Substituenten wie Hydroxyl- oder
Sulfatgruppen. In Phase II wird das funktionalisierte Molekül mit einem Konjugationspartner
verknüpft (zum Beispiel Glucuronsäure) um anschließend aktiv aus der metabolisierenden
Zelle exportiert zu werden (1.5.3).
Die LC/MS-Analyse des Kulturextrakts nach 14-Fütterung lässt auf die parallele Bildung
eines Isomers von Ant14Pro1 mit alternativer Glykosylierungsposition schließen. Die
geringere Konzentration des Isomers (5 % der Gesamt-AUC480nm aller 14-Derivate) im
Vergleich zu Ant14Pro1 (17 % der Gesamt-AUC480nm aller 14-Derivate) deutet auf eine
bevorzugte Hydroxylierung von C-2 hin. Im Einklang damit steht die Beobachtung, dass von
15, einem 2-Chlor-Regioisomer von 14, nur Spuren hydroxyliert und glykosyliert werden
(s. Tab. 4)
45
Ergebnisse
3.1.3 Gewinnung und Biotransformation von Norsolorinsäure
Als Ursache der fehlenden Rhamnosylierungsaktivität von S. espanaensis auf den Arzneistoff
Mitoxantron (25) kommt eine sterische Behinderung des Enzymkontakts durch die
Seitenketten in Betracht. Am Beispiel der Norsolorinsäure (26) sollte der Einfluss sterisch
anspruchsvoller Seitenketten auf den Rhamnosyltransfer untersucht werden. Norsolorinsäure
ist ein stabiles Zwischenprodukt der Aflatoxin- / Sterigmatocystinbiosynthese im Pilz
Aspergillus nidulans [112]. Erst vor kurzem konnte für 26 eine zytostatische Wirkung auf
MCF 7-Brustkrebszellen nachgewiesen werden [113].
Produktion von Norsolorinsäure durch Aspergillus nidulans TTRM1
Aspergillus nidulans TTRM1 ist eine Biotin auxotrophe Mutante mit Blockade der
Aflatoxin- / Sterigmatocystinbiosynthese auf Stufe von 26. Der Stamm wurde im Labor von
Prof. Dr. N. Keller (University of Wisconsin, Madison, USA) gewonnen und mir von
Prof. Dr. D. Hoffmeister (University of Minnesota, St. Paul, USA) überstellt.
mAU
(480 nm)
26
int. [%]
80
+
[M+H]
371
26
235 nm
mAU
283 nm
309 nm
120
40
40
int. [%]
80
20
250
500 m/z
80
-
[M-H]
369
40
250
364 nm
40
500 m/z
26 (28,1 min)
0
300
400
463 nm
500
nm
0
0
10
20
30
min
Abb. 32: LC/CI-MS-Analyse des Kulturextrakts von Aspergillus nidulans TTRM1 (Methode: antqui, s. 5.11.6).
Norsolorinsäure (26): Mr: 370,35.
Aus Kulturen von A. nidulans TTRM1 sollten mindestens 5 mg 26 zur Fütterung an
S. espanaensis gewonnen werden. Die Produktion von 26 lässt sich gut über die Lilafärbung
des Kulturmediums nachvollziehen. Die lila Farbe ist auf deprotonierte Norsolorinsäure
zurückzuführen. Nach Abschluss der siebentägigen Inkubationszeit hatte der Kulturüberstand
einen pH-Wert von 8,7. Mit der Einstellung auf pH 7,5 zur Extraktion mit Ethylacetat
schwenkte die Farbe auf rotbraun über. Der Peak von 26 dominiert das Chromatogramm des
Rohextrakts bei 480 nm (s. Abb. 32) und 254 nm (nicht gezeigt). Durch Gelelution aus
Sephadex LH-20 mit Methanol als Fließmittel wurden aus 1 L Kulturvolumen 28,4 mg 26 als
orange-rotes Pulver gewonnen.
46
Ergebnisse
Biotransformation von Norsolorinsäure
Mit den auch unter 3.1.2 verwendeten Bedingungen wurde 26 auf Biotransformation in
S. espanaensis überprüft. Sieben neu auftretende Peaks konnten über ihr charakteristisches
UV/VIS-Absorptionsspektrum als Derivate von 26 identifiziert werden (s. Abb. 33). Die
korrespondierenden MS-Signale sprechen dabei für Rhamnosylierungen (+146 u) und
Hydroxylierungen (+16 u) von Norsolorinsäure. Vom Aglykon lassen sich nur noch Spuren
über die MS-Signale nachweisen.
Die Umsetzung von Norsolorinsäure zeigt, dass grundsätzlich auch Anthrachinonderivate mit
längeren Seitenketten von S. espanaensis glykosyliert werden können.
M: 370+2x146
mAU
(480 nm)
M: 370+16+146
-
m/z = 661: [M-H]
-
m/z = 531: [M-H]
-
m/z = 515: [M-146-H]
-
-
m/z = 369: [M-2x146-H]
40
m/z = 421: [M-146+Cl]
-
m/z = 385: [M-146-H]
-
m/z = 515: [M-H]
M: 370+2x146
-
m/z = 369: [M-146-H]
-
m/z = 661: [M-H]
20
M: 370+146
-
m/z = 515: [M-146-H]
-
m/z = 369: [M-2x146-H]
26 (M: 370)
* *
0
0
10
20
30
min
Abb. 33: Detektion der Biotransformationsprodukte von 26 mittels LC/CI-MS-Analytik (Methode: antqui,
s. 5.11.6). Für einige Derivate mit 26 ähnlichem UV/VIS-Absorptionsspektrum konnte aus m/z-Werten ein
Massenvorschlag abgeleitet werden. Bei 12,6 min und 12,7 min überlagern sich zwei Peaks. * Derivate ohne
Massenvorschlag aber 26 ähnlichem UV/VIS-Absorptionsspektrum.
47
Ergebnisse
3.1.4 Biotransformation von Flavonoiden
Mit den bisherigen Versuchen wurde das Potential des Bodenbakteriums Saccharothrix
espanaensis zur Glykosylierung, teilweise auch Hydroxylierung, zahlreicher Anthrachinonderivate aufgedeckt. Anthrachinone treten im natürlichen Lebensraum von S. espanaensis als
Sekundärstoffe von Pflanzen, Pilzen oder Mikroorganismen auf. Die beobachtete Funktionalisierung und Konjugation stammfremder Moleküle ist eine typische Reaktionsfolge des
Xenobiotikametabolismus (vgl. Abb. 31) und kann als Anpassung von S. espanaensis an sein
chemisches Umfeld interpretiert werden.
Flavonoide, eine weitere, pharmazeutisch interessante Naturstoffklasse, erreichen den
natürlichen Lebensraum von Bodenbakterien wie auch die Anthrachinone vor allem aus dem
Pflanzenreich. Anhand der zwei Beispielsubstanzen Quercetin (27) und Catechin (28) sollte
der Flavonoidmetabolismus in S. espanaensis untersucht werden. Die Fütterungsexperimente
und deren Auswertung folgten der auch unter 3.1.2 eingesetzten Methodik.
Tab. 5: Biotransformation von Flavonoiden in Kulturen von S. espanaensis. Auswertung: s. Tab. 4.
A: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines hydroxylierten Derivats.
B: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines rhamnosylierten Derivats oder eines
rhamnosylierten und hydroxylierten Derivats.
C: Weitere Transformationsprodukte.
Name
3,3',4',5,7-Pentahydroxyflavon
(Quercetin)
(27)
(+)-(2R:3S)-5,7,3',4'Tetrahydroxyflavan-3-ol
(Catechin)
(28)
Struktur
OH
O
HO
Metabolitendetektion
λ
A
B
C
360 nm 0
0
OH
QuercPro1
(100 %)
OH
OH
O
OH
O
HO
1
(100 %)
254 nm 0
0
0
OH
OH
OH
Das Ergebnis der Flavonoidfütterungen könnte unterschiedlicher nicht ausfallen. Vom stark
hydrophilen 28 wurden keine Biotransformationsprodukte detektiert. 28 wurde unverändert
aus dem Kulturextrakt zurückgewonnen. Der Peak von 27 ist im Chromatogramm des Kulturextraktes nicht mehr vorhanden, der Nachweis verbliebener Spuren von 27 gelingt erst über
die Auswertung der MS-Diagramme. Nur ein Metabolit (QuercPro1) mit Aglykon ähnlichem
UV/VIS-Absorptionsspektrum tritt im Chromatogramm auf. Über MS-Signale lässt sich
QuercPro1 die Molekülmasse 448 zuordnen. Sie entspricht der Masse von Rhamnosyl-27.
48
Ergebnisse
3.1.4.1 Biokatalytische Darstellung von Quercitrin
Die LC/MS-Auswertung der Biotransformation von Quercetin (27) zu QuercPro1 legt nahe,
dass in den Zellen von S. espanaensis die vollständige Umsetzung von 27 zu genau einem
Produkt erfolgte. Derart spezifische Reaktionen in Verbindung mit hohen Umsätzen
(Stoffmenge pro Kulturvolumen) sind ein heiß begehrtes Werkzeug der organischen Chemie.
Zunächst galt es aber zu prüfen, ob der Metabolit QuercPro1 tatsächlich das Hauptprodukt der
Biotransformation darstellt oder ob vorwiegend ein Abbau von 27 zu Produkten stattfindet,
die bei der LC/MS-Auswertung nicht auffallen. Mit einer deutlich höheren Konzentration der
Ausgangssubstanz als zuvor üblich sollte S. espanaensis gleichzeitig seine Leistungsfähigkeit
unter Beweis stellen.
Isolierung von QuercPro1
Mit 250 mg Quercetin×2H2O (in 1 mL DMSO) pro Liter Mediumvolumen wurde
S. espanaensis für sieben Tage unter Standardbedingungen (s. 5.3.1.4) inkubiert. Um trotz der
hohen Wasserlöslichkeit des putativen Rhamnosids QuercPro1 optimale Ausbeuten zu
erzielen, wurde das Extraktionsprotokoll an Methoden der Phytochemie [114] angeglichen.
1333 mL Kultur (mit 333,3 mg bzw. 0,9853 mMol zugefüttertem Quercetin×2H2O,
Mr: 338,27) wurden gefriergetrocknet (s. 5.11.10) und zweimal mit 500 mL Methanol
extrahiert. Über Flash-Chromatographie mit einem Methanol-Wasser-Gradienten (50 % 80 % Methanol) an LiChroprep RP 18 und anschließende Gelfiltrationen über Sephadex
LH-20 und Methanol als Fließmittel (s. 5.11.3) gelang die Isolierung von 159,6 mg
QuercPro1 als gelbes Pulver in einer Reinheit von > 98 % (HPLC, 254 nm). 30 mg davon
wurden zur NMR-Analyse in DMSO-d6 gelöst.
Mit der relativen Molekülmasse Mr: 448,38 von QuercPro1 (= Quercitrin, s. nächstes Kapitel)
errechnet sich bei einer Reinheit von 98 % eine Ausbeute von 35 %. Aufgrund der hohen
Ausbeute ist davon auszugehen, dass mit QuercPro1 das Transformationshauptprodukt von
Quercetin isoliert wurde. Verluste können durch Degradation oder während der Aufreinigung
entstanden sein.
Die Kapazität der Biotransformation von 27 in S. espanaensis wurde mit 250 mg Edukt / Liter
Kultur noch nicht ausgereizt, da kein verlangsamtes Wachstum des Stammes festgestellt
wurde. Für die industrielle Biokatalyse werden Konzentrationen im Grammbereich
angestrebt. Speziell für die Herstellung von QuercPro1 (= Quercitrin) erscheint dieses Ziel
nicht unrealistisch.
49
Ergebnisse
Struktur von QuercPro1
Der hohen Substanzkonzentration, dem Verzicht auf Rekristallisation aus Methanol / Wasser
und einer effektiven Gefriertrocknung ist es zu verdanken, dass das sonst dominierende
Protonensignal von H2O nur als kleine Zacke im Pseudotriplett von 4''-H der Zuckereinheit
auftritt. Die Abwesenheit aller Hydroxylgruppensignale außer des von über 4-O koordinierten
5-OH gestaltet das 1H-Spektrum von QuercPro1 übersichtlich. Über die HMBC-Korrelation
von C-3 und 1''-H kann die Verknüpfungsposition der Rhamnose zugeordnet werden. Als
Charakteristikum der Glykosylierung an C-3 erscheint das 13C-Signal von C-2 bei deutlich
tieferem Feld (δC-2 = 156,9 ppm) als das entsprechende Signal von Quercetin
(δC-2 = 146,7 ppm). Alle anderen δC-Differenzen liegen < 2 ppm. Durch die Interpretation der
aufgenommenen Spektren (1H, 13C, COSY, HSQC, HMBC, 2D-ROESY, verschiedene
1D-ROESY) konnte das Produkt als 3-O-α-L-Rhamnosylquercetin (= Quercitrin) identifiziert
werden.
Quercitrin ist ein verbreiteter, pflanzlicher Naturstoff, der auch in Extrakten der Arzneipflanze
Hypericum perforatum enthalten ist [115]. NMR-Vergleichspektren von kommerziell
erhältlichem Quercitrin (Roth) zeigten identische Verschiebungen und Multiplizitäten. Die
NMR-Daten waren in Einklang mit Werten aus der Literatur [116] und der Spectral Database
for Organic Compounds (s. 5.14).
OH
3'
H
H
HO
8
O
7
9
H
4
5
OH
QuercPro1 (= Quercitrin)
1
1'
5'
2
H
3
O
1''
O
2''
H
HMBC-Korrelation
O
OH
H
5''
4''-H
2''-H
H
H
H-NMR-Spektrum
H
6'
10
6
OH
4'
2'
3''-H
5''-H
3''
OH
OH
CH3
6''
4''
4.0
H
Mr: 448,38
2'-H
3.8
ppm
3.6
3.4
6'-H 8-H
5'-H
6-H
3.2
DMSO
5''-CH3
1''-H
5-OH
13
12
11
10
9
8
7
ppm
6
5
4
Abb. 34: Strukturaufklärung der Substanz QuercPro1 mittels NMR-Spektroskopie.
3
2
1
0
50
Ergebnisse
Aus der exakten Masse des Ions [M+H]+: m/z = 449,10665 lässt sich für QuercPro1 die mit
der NMR-Interpretation konforme Summenformel C21H20O11 (12 RDB-Äquivalente) ableiten.
Die absolute Konfiguration der Zuckereinheit der durch Biotransformation in S. espanaensis
entstandenen Glykoside konnte bisher nur indirekt über die Klyne-Regel vorhergesagt werden
(s. 3.1.1.1 NMR-Interpretation von EmoPro3). Es kann nicht ausgeschlossen werden, dass es
sich um α-D-Rhamnoside handelt. Der Vergleich von QuerPro1 und dem kommerziell
erhältlichem α-L-Rhamnosid Quercitrin sollte eine Aussage zur absoluten Konfiguration der
von S. espanaensis mit Quercetin verknüpften Rhamnopyranose zulassen. In der
Struktur von 3-O-α-Rhamnosylquercetin sind außerhalb der Zuckereinheit keine chiralen
Kohlenstoffatome lokalisiert. Das heißt, die beiden möglichen Strukturen
3-O-α-D-Rhamnosylquercetin und 3-O-α-L-Rhamnosylquercetin sind Enantiomere, die sich
mit Ausnahme der chiroptischen Eigenschaften nicht in ihren physikalischen Eigenschaften
unterscheiden. Die Abgrenzung von Enantiomeren ist mit dem Circulardichroismus (CD)
möglich (s. 5.11.9). Rechtsdrehende und linksdrehende Form lassen einen spiegelbildlichen
Kurvenverlauf erwarten.
—— QuercPro1
- - - - Quercitrin der Firma Roth
Abb. 35: Molarer Circulardichroismus von QuercPro1 und einer authentischen Probe Quercitrin (Firma Roth).
Beide Substanzen wurden als 0,26 mM Lösungen in Methanol vermessen.
Maxima / Minima (Mol. CD):
QuercPro1: 1: 229 nm (−2,08), 2: 252 nm (2,27), 3: 268 nm (0,71), 4: 300 nm (−0,84), 5: 343 nm (−2,37).
Quercitrin: 1: 229 nm (−2,68), 2: 253 nm (2,15), 3: 268 nm (0,41), 4: 300 nm (−1,00) 5: 346 nm (−2,64).
Der Kurvenverlauf des CD von QuercPro1 deckt sich mit dem der Vergleichssubstanz
Quercitrin. Es handelt sich um das gleiche Enantiomer. Die mit der Klyne-Regel
vorgeschlagene absolute Konfiguration kann bestätigt werden. Bei QuercPro1 handelt es sich
um 3-O-α-L-Rhamnosylquercetin.
51
Ergebnisse
3.1.5 Evaluierung des Substratspektrums der
Rhamnosylierungsaktivität
Das Ziel der folgenden Experimente war, mit der Rhamnosylierung durch Saccharothrix
espanaensis weitere Strukturklassen zu erschließen. Besonderes Interesse galt dabei klinisch
eingesetzten Arzneistoffen und Naturstoffen, deren Struktur Ähnlichkeit mit den erfolgreich
glykosylierten Anthrachinonen und Flavonoiden hat. Durch die Glykokonjugatbildung kann
die Pharmakokinetik und Pharmakodynamik der eingesetzten Arzneistoffe modifiziert werden
(s. 1.3.1). Es wurden grundsätzlich nur Stoffe ausgewählt, die mindestens einen aromatischen
Ring besitzen, vorzugsweise ein System aus annelierten Ringen aufweisen und eine
phenolische Hydroxylgruppe haben.
Tab. 6: Biotransformation unterschiedlicher Moleküle in Kulturen von S. espanaensis. Auswertung: s. Tab. 4.
A: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines hydroxylierten Derivats.
B: Die aus MS-Signalen abgeleitete Masse entspricht der Masse eines rhamnosylierten Derivats oder eines
rhamnosylierten und hydroxylierten Derivats.
C: Weitere Transformationsprodukte, liegen Zusatzinformationen vor, sind diese unter der Tabelle gelistet.
Name
Struktur
9,10-Dihydro9-oxoacridin
(Acridon)
(29)
O
9H-Fluoren-9-on
(Fluorenon)
(30)
O
C
400 nm
1 Peak
(< 1 %)
1 Peak
(< 1 %)
0
254 nm
1 Peak
(66 %)
1 Peak
(2 %)
0
254 nm /
400 nm
-
-
s. *31
254 nm
0
0
0
s. *32
254 nm
0
0
0
N
H
1,8-Dihydroxyanthrone (Dithranol)
(31)
Morphin
(32)
Metabolitendetektion
λ
A
B
OH
O
OH
OH
OH
OH
HO
O
N CH3
HO
Phenytoin
(33)
H
N
HO
N
O
52
Name
Ergebnisse
Struktur
Novobiocinsäure
(34)
Metabolitendetektion
λ
A
B
OH
HO
O
OH
H
N
O
330 nm
3 Peaks
(64 %)
4 Peaks
(19 %)
NovPro1
(37 %)
NovPro3
(20 %)
NovPro5
(13 %)
254 nm
-
-
s. *35
300 nm
0
0
0
360 nm
0
0
0
s. *37
360 nm
-
-
s. *38
254 nm
-
-
s. *39
300 nm
0
9 Peaks
(76 %)
2 Peaks
(4 %)
O
CH3
O
Phenprocoumon
(35)
O
C
Cyclo-34
(1 %)
s. *34
OH
O
Chromon
(36)
O
O
Lawson
(37)
OH
O
O
Juglon
(38)
OH
O
O
Menadion
(Vitamin K3)
(39)
CH3
O
trans-Resveratrol
(40)
OH
HO
OH
*31: Spontane Oxidation zu 5 mit Luft-O2, h·ν.
*32: Kultur mit Alufolie umwickelt, lyophilisiert, mit MeOH extrahiert, zusätzlich DC.
*34: Gefütterte 34 war mit geringen Mengen (< 1 %) Cyclonovobiocinsäure und Novobiocin verunreinigt.
*35: Nur Spuren von 35 wurden im Ethylacetatextrakt detektiert. In der Wasserphase konnte kein 35 nachgewiesen werden.
*37: Das gewählte Extraktionsverfahren des auf pH 7 eingestellten Kulturüberstands mit Ethylacetat erwies sich
als ungeeignet. Nur im Myzelextrakt (Ethylacetat) waren Spuren von 37 nachweisbar. Nach wiederholtem
Fütterungsexperiment wurde die Kultur lyophilisiert und mit Methanol extrahiert. 37 konnte nachgewiesen
werden, Derivate wurden nicht detektiert.
53
Ergebnisse
*38: 38 ist in wässriger Lösung instabil. Weder 38 noch hydroxylierte oder rhamnosylierte Derivate konnten in
den Kulturextrakten detektiert werden.
*39: In Kulturen von S. espanaensis wird 39 in mehrere hydrophile Derivate unbekannter Molekülmasse
transformiert. Es handelt sich jedoch nicht oder nicht ausschließlich um eine Biotransformation, da die Derivate
auch bei der sterilen Inkubation von 39 mit Nährmedium auftreten.
Acridon (29) ist chemisch stabil [117]. Derivate, deren MS-Signale und UV/VISAbsorptionsspektren auf hydroxylierte und rhamnosylierte Derivate hindeuten, lassen sich nur
in äußerst geringer Konzentration nachweisen. Fluorenon (30) ist ein chemisch stabiles [117]
Oxidationsprodukt des Umweltgiftes Fluoren. Als ein Zwischenprodukt des Metabolismus
von Fluoren entsteht 30 in Arthrobacter sp. strain F101. Endpunkt der Umsetzung ist
4-Hydroxyfluorenon [118]. In Analogie zu diesen Ergebnissen lässt sich nach der
Transformation in S. espanaensis ein mit einem Sauerstoffatom funktionalisiertes Derivat von
30 als dominanter Metabolit per LC/MS-Analyse detektieren.
Morphin (32) wird im Rahmen des menschlichen Arzneistoffmetabolismus glucuronidiert
[119]; Phenytoin (33) hydroxyliert und glucuronidiert [120]. In S. espanaensis hingegen
konnte keine Biotransformation der beiden Substanzen festgestellt werden.
Novobiocinsäure (34), das Aglykon des Aminocoumarinantibiotikums Novobiocin, wurde zu
hydroxylierten und zu rhamnosylierten Derivaten umgesetzt. Isolierung und Strukturaufklärung sind im folgenden Kapitel 3.1.6 beschrieben. Die Struktur von Novobiocinsäure
enthält wie auch Quercetin (27) ein Chromen. Mit Phenprocoumon (35) und Chromon (36)
wurden weitere Chromenderivate auf ihre Biotransformation in S. espanaensis überprüft. In
beiden Fällen wurden jedoch keine Transformationsprodukte detektiert.
Bei der Analyse der Kulturextrakte zeigte sich, wie instabil viele der Verbindungen unter
Kulturbedingungen sind. 32 und 37 - 40 sind lichtempfindlich [117]. Die Kulturgefäße
wurden deshalb mit Alufolie abgeschirmt. Als besonders instabil zeigte sich Juglon (38).
Auch mit Lichtschutz wurde in wässriger Lösung bereits nach wenigen Stunden eine fast
vollständige Derivatisierung von 38 festgestellt (vermutlich sind Polymerisationsprodukte
entstanden). Lawson (37), ein Konfigurationsisomer von 38, ist deutlich stabiler.
Transformationsprodukte wurden hier nicht detektiert. Menadion (39) wurde auch ohne
S. espanaensis im Kulturmedium zu hydrophilen Substanzen umgewandelt.
OH
OH
HO
OH
h·ν
im Sauren
OH
trans-Resveratrol (40)
HO
cis-Resveratrol
Abb. 36: Photoisomerisierung von trans-Resveratrol in cis-Resveratrol durch UV-Strahlung sowie die inverse
Reaktion bei niedrigen pH-Werten [121;122].
54
Ergebnisse
In wässriger Lösung bei neutralem pH isomerisiert das gefütterte trans-Resveratrol (40) unter
dem Einfluss von UV-Strahlung zum sterisch gehinderten cis-Resveratrol (s. Abb. 36). Die
LC/MS-Analyse lässt auf eine geringe Konzentration von cis-Resveratrol im Extrakt des
gefütterten Stammes schließen (s. Abb. 37, Peak bei 14,6 min). Das Absorptionsspektrum von
der bei 14,6 min eluierenden Substanz hat ein Maximum bei 268 nm. Der Kurvenverlauf
deckt sich mit für cis-Resveratrol publizierten Daten [121].
Das UV/VIS-Absorptionsspektrum von trans-Resveratrol (40) weist eine charakteristische
Feinstruktur der Absorptionsbande mit Maxima bei 306 nm und 320 nm auf (s. Abb. 37, Peak
bei 11,7 min). Durch Biotransformation in S. espanaensis sind zahlreiche neue Derivate von
40 entstanden, deren MS-Signale auf die Hydroxylierung und zum Teil mehrfache
Rhamnosylierung von 40 hindeuten. Die Absorptionsspektren der Peaks bei 7,6 min und
9,4 min entsprechen dem Kurvenverlauf von trans-Resveratrol. Überraschenderweise treten
vier Subtanzen auf, deren aus MS-Signalen abgeleitete Molekülmasse der Konjugation einer
Rhamnoseeinheit (+146 u) an die Ausgangsverbindung entspricht. Drei Substanzen lassen die
Addition zweier Rhamnoseeinheiten (+2×146) vermuten (s. Abb. 37).
Unter Beibehaltung der freien Drehbarkeit um die Achse von Einfachbindungen sind nur zwei
verschiedene Monoglykoside und zwei verschiedene Diglykoside von 40 denkbar.
Möglicherweise entstehen sterisch gehinderte Isomere und Konformere, die ein unterschiedliches Elutionsverhalten zeigen.
rel. Abs.
M:
+16
+2×146
+2×146
+16
+146
2×146
3,0 min
5,3
5,6
6,1
230 300
300
?
300
300
Wellenlänge / nm
6,7
2×146
+146
+146
+146
+146
7,1
7,6
8,1
9,1
9,4
300
300
300
mAU
(300 nm)
300
300
300
11,7
14,6
300
300
9,4
40
11,7
400
7,6
3,0
200
5,3 5,6 6,7
6,1 7,1
0
0
2
4
6
8,1 9,1
8
transcisResveratrol
14,6
10
12
14 min.
Abb. 37: Ausschnitt aus dem Chromatogramm des Kulturextrakts nach Zufütterung von trans-Resveratrol (40)
und Analyse der Peaks mit Aglykon ähnlichem UV/VIS-Absorptionsspektrum per CI-MS-Kopplung (LC/MS,
Methode: antqui, s. 5.11.6).
55
Ergebnisse
3.1.6 Gewinnung neuer Derivate des Antibiotikums Novobiocin
Wegen ihrer hohen Donorspezifität für den Zucker L-Noviose ist die Glykosyltransferase der
Novobiocinbiosynthese (NovM) nicht für die Generierung von rhamnosylierten Derivaten des
Antibiotikums geeignet [123;124]. Dies sollte durch Biotransformation von Novobiocinsäure
(34) in Kulturen von S. espanaensis erreicht werden.
3.1.6.1 Darstellung von Novobiocinsäure
Novobiocinsäure (34) ließ sich aus kommerziell erhältlichem Novobiocin-Natrium darstellen.
Die säurekatalysierte Abspaltung der Zuckereinheit muss schonend im wasserfreien Milieu
durchgeführt werden (s. Abb. 38). Durch Hydrolyse in HCl saurer, wässriger Lösung würde
Cyclonovobiocinsäure, ein Konstitutionsisomer von 34, entstehen [125]. Versuchsaufbau und
Durchführung des Experiments sind unter 5.12 beschrieben. Aus 4,00 g Novobiocin-Na
konnten 1,15 g Novobiocinsäure gewonnen werden, was einer Ausbeute von 46 % entspricht.
Alternativ wurde Novobiocinsäure aus der Blockmutante Streptomyces spheroides AM1T2
des Novobiocinproduzenten Streptomyces spheroides NCIMB11891 extrahiert [126].
O
O
Cl +
OH
ONa
5'
B
H3C C
H3CO
O
O
1''
O
OH
CH3
H
N
O
OH
HO
A
12
O
HCl
OH
6
+
7
2
B
O
O
CH3
4'
+
O
HCl
10
CH3 +
8
CH3
11
O
OH
H
N
O
CH3
HCl
O
CH3
34
CH3
+
CH3
OH
H3C
H3CO
O
O
NH2
O
O
OH
+
NaCl
NH2
Abb. 38: Darstellung von Novobiocinsäure aus Novobiocin-Na in ethanolischer Lösung unter Katalyse von aus
Acetylchlorid freigesetztem Chlorwasserstoff nach Hinman et al. (1957) [125].
3.1.6.2 Biotransformation in Saccharothrix espanaensis
Die Biotransformation von 34 in Kulturen von S. espanaensis wurde wie unter 3.1.2
angegeben überprüft. Vor der Extraktion mit Ethylacetat wurde der pH-Wert der Kulturbrühe
auf pH 3 eingestellt, um die sauer reagierenden Aminocoumarine in die lipophile, protonierte
Form zu überführen.
56
Ergebnisse
Im Chromatogramm des Kulturextrakts lassen sich außer 34 und Cyclonovobiocinsäure
sieben neue Peaks mit dem charakteristischem UV/VIS-Absorptionsspektrum der
Aminocoumarine detektieren (s. Abb. 39). Korrespondierende MS-Signale lassen auf drei
Novobiocinsäuremetaboliten mit einem zusätzlichen Sauerstoffatom schließen (M: 411).
Dazu gehören NovPro1, NovPro3 und eine weitere Substanz, die bei 16,1 min eluiert.
Beim Screening auf die Masse eines rhamnosylierten Metaboliten (M: 541) fällt nur ein
Derivat mit deutlich hervortretendem Peak im Chromatogramm auf (NovPro5). Zwei weitere
möglicherweise rhamnosylierte Novobiocinsäuremetaboliten eluieren bei 16,4 min
bzw. 18,2 min.
mAU
(330nm)
80
NovPro1
NovPro3
34
NovPro5
40
**
*
0
0
5
int.
[%] m/z =410 neg.
80
Cyclonovobiocinsäure
*
10
15
20
25
min.
10
15
20
25
min.
10
15
20
25
min.
10
15
20
25
min.
40
0
0
5
int.
[%] m/z = 540 neg.
80
40
0
0
5
int.
[%] m/z = 394 neg.
80
40
0
0
NovPro5
mAU
40
323nm
20
220 300 400 nm
5
NovPro1
mAU
60
NovPro3
mAU
328nm
30
220 300 400 nm
100
328nm
50
220 300 400 nm
34
mAU
60
Cyclonovobiocinsäure
mAU
335nm
30
220 300 400 nm
334nm
2
1
220 300 400 nm
Abb. 39: Analyse der Metabolisierung von Novobiocinsäure (34) in S. espanaensis per LC/ESI-MS (Ausschnitt
aus einem Lauf mit Methode nova11, s. 5.11.6). Signale bei m/z = 410 im negativen Detektionsmodus werden
von Pseudomolekülionen hydroxylierter 34 erwartet, Signale bei m/z = 540 für rhamnosylierte 34, bei m/z = 394
für 34. Alle markierten Peaks weisen das charakteristische UV/VIS-Absorptionsspektrum von Novobiocinderivaten auf. *: Derivate unbekannter Struktur.
Ergebnisse
57
Im Vergleich zu 34 deutlich an Hydrophilie gewonnen hat ein Metabolit mit einer
Retentionszeit von 9,4 min. Korrespondierende MS-Signale deuten auf eine Molekülmasse
von 556 hin, was der Masse von hydroxylierter und rhamnosylierter Novobiocinsäure
entspricht (detektierte Signale: pos. Modus: m/z = 558 [M+H]+, m/z = 580 [M+Na]+,
m/z =596 [M+K]+; neg. Modus: m/z = 556 [M-H]−).
Zur Isolierung der Biotransformationsprodukte wurde der Ethylacetatextrakt (s. 5.11.1.1)
zunächst per Gelelution an Sephadex LH-20 mit Methanol als Fließmittel fraktioniert
(s. 5.11.3). Um an Umkehrphasen eine ausreichende Retention zu erreichen, musste
angesäuertes Fließmittel eingesetzt werden. Für die Isolierung des hydrolyseempfindlichen
Glykosids NovPro5 mittels präparativer LC/MS (Methode: nova11prep s. 5.11.6) stellte dies
eine besondere Herausforderung dar. Die Trennung von NovPro1 und NovPro3 gelang mit
einer analytischen Xbridge-Säule an einer HPLC-Anlage der Firma Waters (Methode:
novaprep, s. 5.11.4). Für die Charakterisierung per NMR-Spektroskopie (in DMSO-d6)
konnten 4,9 mg NovPro1, 2,1 mg NovPro3 und 10,2 mg NovPro5 jeweils als beige-weißes
Pulver erhalten werden.
Strukturen von NovPro1, NovPro3
Mit dem hochauflösenden LTQ-Orbitrap Hybrid-Massenspektrometer (s. 5.11.7) wurde das
Signal des einfach positiv geladenen Pseudomolekülions [M+H]+ von NovPro1 bei
m/z = 412.13888, von NovPro3 bei m/z = 412.13890 gemessen. Die daraus abgeleitete
Summenformel des ungeladenen Moleküls C22H21O7N (Mr: 411,40) entspricht einfach
hydroxylierter 34.
Die 1H-NMR-Spektren von NovPro1 und NovPro3 sind fast identisch. Vom Spektrum des
Vorläufers Novobiocinsäure unterscheiden sie sich durch je zwei zusätzliche, breite
Singuletts bei δH = 3,81 ppm (2H) / δH = 4,70 ppm (1H) (NovPro1) bzw. δH = 4,06 ppm (2H) /
δH = 4,64 ppm (1H) (NovPro3). Gleichzeitig ist das Integral des 1H-Signals der Methylgruppen an C-9 um drei Protonenäquivalente kleiner (3H statt 6H). Es war demnach jeweils
zur Hydroxylierung einer der beiden Methylgruppen an C-9 gekommen. 13C-, COSY-,
HSQC-, HMBC-Spektren lassen die ansonsten unveränderte Struktur von 34 erkennen. Durch
die Hydroxylierung entstehen E/Z-Isomere, die sich in ihren chemischen und physikalischen
Eigenschaften unterscheiden. Die Retentionszeiten der Derivate (s. Abb. 39) sowie δH der neu
entstandenen -CH2-Gruppe weichen leicht voneinander ab. Die Bestimmung der
Konfiguration an der Doppelbindung der Prenylseitenkette gelingt über ROESY-Kreuzpeaks
(s. Abb. 40 und Abb. 41). In der Struktur von NovPro1 befindet sich 7-H in der Nähe der
Protonen der Methylgruppe (10-H), 8-H in der Nähe der kohlenstoffgebundenen Protonen der
Hydroxymethylgruppe (11-H). Die entsprechenden Kreuzpeaks im Spektrum von NovPro3
sind genau umgekehrt. Damit lässt sich NovPro1 als E-Isomer identifizieren und als
11-Hydroxynovobiocinsäure bezeichnen. NovPro3, das Z-Isomer (10-Hydroxynovobiocinsäure), wurde auch als Produkt des Novobiocinsäuremetabolismus im ActinomycetalesStamm UC5762 NRRL11111 identifiziert [127].
58
Ergebnisse
H2O
NovPro1 ROESYsym.
DMSO
8'-CH3
10-H
CH3CN
8-H
11-OH
7-H
11-H
ppm
2
3
5
5'
4'
6'
HO
O
7
5.0
4.5
4.0
10
8
O
11
CH3
ppm 5.5
4
3
1
2
2'
O
8'
12
3'
4'a
8'a
7'
H
N
OH
4
6
OH
9
CH3
5
CH2OH
3.5
3.0
2.5
2.0
1.5
Abb. 40: Auszug aus dem symmetrisierten ROESY-Spektrum zur Bestimmung der E/Z-Isomerie von NovPro1.
Nur ROESY-Kreuzpeaks in Antiphase (hier rot) sind auf nukleare Overhauser-Effekte zurückzuführen.
H2O
NovPro3 ROESYsym.
DMSO
8'-CH3
CH3CN
8-H
10-OH
11-H
7-H
10-H
ppm
2
3
5
6
OH
5'
6'
HO
7'
H
N
4'
4'a
8'a
O
8'
12
3'
4
O
O
5.5
5.0
4.5
4.0
3.5
7
10
8
11
CH3
ppm
4
3
1
2
2'
OH
9
CH2OH
CH3
3.0
2.5
5
2.0
Abb. 41: Auszug aus dem symmetrisierten ROESY-Spektrum zur Bestimmung der E/Z-Isomerie von NovPro3.
Nur ROESY-Kreuzpeaks in Antiphase (hier rot) sind auf nukleare Overhauser-Effekte zurückzuführen.
59
Ergebnisse
Struktur von NovPro5 (Novalbiocin E)
Die aus der exakten Masse (m/z = 542.20201) des [M+H]+-Ions abgeleitete Summenformel
lautet C28H31O10N und entspricht einfach rhamnosylierter Novobiocinsäure. Wie aus
Abb. 39, Zeile 4 hervorgeht, kommt es unter ESI-Bedingungen (s. 5.11.6) zur Spaltung der
glykosidischen Bindung. Das deprotonierte Molekülion von Novobiocinsäure entsteht als
Fragment.
Zusätzlich zu den Signalen von Novobiocinsäure treten im 1H-NMR-Spektrum von NovPro5
die charakteristischen Signale einer O-glykosidisch verknüpften L-Rhamnose auf.
13
C-, HSQC- und HMBC-Spektren geben keinen Hinweis auf strukturelle Modifikationen der
Aglykoneinheit Novobiocinsäure. Eindrucksvoll offenbaren mit ROESY detektierte nukleare
Overhauser-Effekte die Glykosylierungsposition (s. Abb. 42).
Der Abgleich der Struktur von NovPro5 mit der CAS-Datenbank über das Interface SciFinder
Scholar ergab keinen Treffer [105]. Die erweiterte Suche zeigt, dass bisher noch kein
Novobiocinderivat mit O-Glykosylierung an C-4' beschrieben wurde. Neue Strukturen werden
durch Silbenwechsel im Namen der Referenzverbindung Novobiocin gekennzeichnet: zum
Beispiel Clorobiocin, Novclobiocin. Für C-4' glykosylierte Novobiocinderivate wird die
Bezeichnung Novalbiocin vorgeschlagen. Das mit "5" indizierte Produkt der Novobiocinsäurebiotransformation wird als Novalbiocin mit dem fünften Buchstaben des Alphabets
indiziert.
NovPro5 (Novalbiocin E)
H
OH
HO
ROESY-Kreuzpeak mit 2-H/6-H
H
HO
H3C
O
1''
H
H
H
H
H
H
H
O
H
N
4'
12
2'
HO
O
7'
OH
O
O
2
3
7
H
10
H H
H
CH3
CH3
CH3
11
ROESY-Kreuzpeaks
Mr: 541,55
Abb. 42: Struktur von NovPro5 (Novalbiocin E) mit allen per ROESY detektierten nuklearen Overhauser
Effekten.
60
Ergebnisse
3.1.6.3 Antibiotische Aktivität gegen Bacillus subtilis
Die drei Derivate NovPro1, NovPro3 und NovPro5 wurden auf ihre wachstumshemmende
Aktivität gegenüber Bacillus subtilis mit einem Agardiffusionsassay im Vergleich zu
Novobiocin-Na untersucht. Durch einen Vergleich der Hemmhofdurchmesser kann die
relative Aktivität der Substanzen abgeschätzt werden.
Mit 200 nmol NovPro5 wird ein vergleichbarer Hemmhofdurchmesser wie mit 2 nmol
Novobiocin-Na erreicht (s. Abb. 43). NovPro5 ist folglich antibiotisch aktiv, hat jedoch nur
etwa 1 % der Aktivität von Novobiocin gegenüber dem Testkeim B. subtilis. Für die nicht
glykosylierten Novobiocinsäurederivate NovPro1 und NovPro3 ist auch mit einer Stoffmenge
von 200 nmol keine Wachstumshemmung feststellbar. Die Produkte sind inaktiv gegenüber
B. subtilis. Novobiocinsäure, die Ausgangsverbindung der Biotransformation, wird ebenfalls
als antibiotisch inaktiv beschrieben [128]. Das Ergebnis unterstreicht die Bedeutung der
Zuckereinheit als essentiellen Bestandteil des Pharmakophors.
Das rhamnosylierte Aminocoumarinantibiotikum Novalbiocin E unterscheidet sich von der
Leitstruktur Novobiocin in der Art des Zuckers, der Glykosylierungsposition und durch
fehlende Carbamoylierung der Zuckereinheit. Die Carbamoylgruppe ist an der Bindung mit
der bakteriellen Gyrase beteiligt und ein wichtiges Strukturmerkmal für die antibiotische
Aktivität von Novobiocin [129]. 4'-Desoxynovobiocin zeigt nur 0,5 % der gyrasehemmenden
Aktivität von Novobiocin, 3''-Descarbamoyl-4'-desoxynovobiocin ist inaktiv [47]. In der
Struktur von Novalbiocin E ist die Hydroxylgruppe an C-4' durch die Zuckereinheit besetzt.
Eigentlich wäre nach den aufgestellten Struktur-Wirkungsbeziehungen keine gyrasehemmende Aktivität von Novalbiocin E zu erwarten. Die Wachstumshemmung von B. subtilis
könnte auf einen alternativen Wirkungsmechanismus zurückzuführen sein. Aktuelle
Untersuchungen zeigen, dass 3''-Descarbamoyl- und 4'-Desoxyderivate im Vergleich zu
Novobiocin eine deutlich erhöhte Hsp90-Inhibition zeigen und deshalb möglicherweise in der
Krebstherapie einzusetzen sind [47].
3
1
5
N
—
Abb. 43: Bestimmung der antibiotischen Aktivität
gegenüber B. subtilis im Hemmhoftest (s. 5.13).
1: 200 nmol NovPro1
3: 200 nmol NovPro3
5: 200 nmol Novalbiocin E (NovPro5)
—: Methanol
N: 2 nmol Novobiocin-Na
Ergebnisse
61
3.1.6.4 Carbamoylierung des Glykosids NovPro5
Die gyrasehemmende Wirkung der Novobiocinderivate lässt sich im Allgemeinen durch
Carbamoylierung der Zuckereinheit erhöhen (vgl. 3.1.6.3). Zunächst rhamnosylierte
Novobiocinsäure (Novalbiocin E) sollte in einem weiteren Biotransformationsschritt mit einer
Carbamoylgruppe an 3''-O des Zuckers versehen werden. Die Carbamoylierung sollte in
S. coelicolor M512 [130] mit integriertem Cosmid nov-CA7 [45] erfolgen. Das Cosmid trägt
das Novobiocinbiosynthesegencluster auf dem das Prenyltransferasegen novQ durch eine
Kanamycinresistenzkassette ersetzt wurde. Durch die Inaktivierung wird die vom Ring A
ausgehende Biosynthese des Aglykons verhindert. Durch polare Effekte auf nachgeschaltete
Gene des novQ enthaltenden Operons (novR, S, T, U, V, W) wird die Biosynthese von
nukleotidaktivierter L-Noviose unterbunden. Das Carbamoyltransferasegen novN bleibt
funktionell [45].
Zur Gewinnung von Novalbiocin E wurden 100 mg Novobiocinsäure zu einer 2 Liter-Kultur
von S. espanaensis in NL111-Medium zugesetzt. Nach siebentägiger Inkubation unter
Standardbedingungen (s. 5.3.1.4) wurde die mit HCl auf pH 3 eingestellte Kulturbrühe mit
Ethylacetat extrahiert (s. 5.11.1.1). Durch eine Gelfiltration über Sephadex LH-20 mit
Methanol wurde der Rohextrakt von Verunreinigungen befreit. Die Novobiocinderivate lassen
sich während der Elution mit UV-Licht mit einer Wellenlänge von 366 nm sichtbar machen.
Sie fluoreszieren weißlich. Novalbiocin E haltige Fraktionen wurden vereinigt und die
Lösung bis zur Trockene eingeengt.
Für den zweiten Biotransformationsschritt, die Fütterung an S. coelicolor M512 [130] mit
integriertem Cosmid nov-CA7 [45], wurde das gewonnene Novalbiocin E in 3 mL Ethanol
gelöst und zu einer 0,75 L-Kultur des Stammes (15 Kolben à 50 mL) zugesetzt. Als Kontrolle
wurde eine nicht gefütterte Kultur angesetzt. Die Extraktion der auf pH 3 eingestellten (HCl)
Kulturbrühe mit Ethylacetat erfolgte nach siebentägiger Inkubation bei 30 °C. Per LC/ESIMS konnten zahlreiche neue Novobiocinderivate anhand eines Aminocoumarin typischen
UV-Absorptionsspektrums identifiziert werden. Für eine der Substanzen korreliert der
Absorptionspeak mit MS-Signalen, die auf die Masse von carbamoyliertem Novalbiocin E
(Mberechnet: 584,20) hinweisen: negativer Detektionsmodus: m/z = 583 [M−H]−, m/z = 540
[M−43(Carbamoyl)−H]−, positiver Detektionsmodus: m/z = 585 [M+H]+. In der Negativkontrolle fehlen die Signale.
Die präparative Aufreinigung der Substanz wurde wegen der geringen Konzentration in
Relation zu bei ähnlichen Retentionszeiten eluierenden Novobiocinderivaten nicht angestrebt.
Stattdessen sollte über die Bestimmung der exakten Masse eine Summenformel abgeleitet und
über Fragmentionen ein Strukturvorschlag erarbeitet werden. Dazu wurde der Extrakt mit
einem
hochauflösenden
Hybrid-Massenspektrometer
(LC/ESI-MS/MS-Anordnung
mit LTQ-Orbitrap, s. 5.11.7) analysiert (s. Abb. 44). Das im positiven Detektionsmodus bei
m/z = 585,20754 gemessene Signal lässt sich der Summenformel C29H33O11N2+
(m/z = 585,20789) zuordnen. Die atomare Zusammensetzung entspricht dem [M+H]+-Ion von
62
Ergebnisse
carbamoyliertem NovPro5. Für zwei der gemessenen Fragmentionen (s. Abb. 44 unten) kann
über die aus der exakten Masse abgeleitete Summenformel ein Strukturvorschlag gemacht
werden. Das bei m/z = 189,09084 auftretende Fragmention ist durch eine Amidspaltung
entstanden. Das Signal bei m/z = 396,14411 ist auf ein Fragmention zurückzuführen, das aus
der Spaltung der glykosidischen Bindung hervorgegangen ist. Die Daten zeigen, dass durch
die kombinierte Biotransformation in einem zweistufigen Prozess zunächst rhamnosylierte
Novobiocinsäure entstanden ist, die anschließend mit einer Carbamoylgruppe versehen
wurde.
5.96
Relative Abundance
100
m/z: 585.20754
60
40
0
0.15
1.17
1.54
2.08
1
4
5
6
8.12
8.82
9.33
8
9.63
9
10.68
10.85
10
11
11.56
min
AnLi_13_fragmente # 795-807 RT:5.93-5.99 AV: 6 NL:4.61E6
F:FTMS + c NSI Full ms2 [email protected] [160.00-2000.00]
O
OH
CH3
189.09084
317.13835
CH3
HO
O
CH3
30
20
0
7.33
7
189.09101
40
10
6.88
7.83
OH
80
50
3
5.52
6.27
6.67
5.63
396.14411
90
60
4.23
3.27
2.42
2
100
70
2.32
6.22
5.79
3.55
20
0
Relative Abundance
NL: 2.90E7
m/z= 585.09-586.09
F: FTMS + c NSI Full ms
[200.00-2000.00]
80
378.15475
286.56158
299.12776 328.79001
363.22110
195.02489
233.08096 257.11727
200
250
300
350
405.23145
440.20685
400
450
OH
H
N
O H
O
396.14416
506.18075
500
CH3
CH3
567.19675 597.53021
550
600 m/z
Abb. 44: LC/ESI-MS/MS-Analyse des Ethylacetatextrakts nach kombinierter Biotransformation. Die berechnete
Masse der Fragmentionen ist in dunkelgrün neben den Strukturformeln angegeben.
3.1.7 In-vitro-Glykosylierungsassay
Bei der Untersuchung einer Bibliothek von Anthrachinonderivaten auf ihre Biotransformation
in S. espanaensis konnte keine Rhamnosylierung des Arzneistoffs Mitoxantron (25) erreicht
werden (s. 3.1.2). In-vitro-Experimente sollten zeigen, ob eine unzureichende Aufnahme von
25 in die Bakterienzellen für die ausbleibende Biotransformation verantwortlich ist.
In Ganzzellbiotransformationssystemen bildet die Zytoplasmamembran eine Barriere
zwischen dem Akzeptormolekül im Kulturmedium und dem Enzym im Zytoplasma. Die
Zellmembran ist semipermeabel. Frei diffundieren können nur kleine, ungeladene Moleküle.
Ohne aktiven Transport kann das polare 25 möglicherweise nicht mit der Rhamnosyltransferase in Kontakt treten.
Ergebnisse
63
Mit aufgeschlossenen Zellen oder zellfreiem Lysat kann der direkte Kontakt von Substrat und
Enzym unabhängig von aktiven Transportvorgängen hergestellt werden. Zunächst wurde mit
zellfreien Lysaten des Myzels von S. espanaensis gearbeitet. Diese wurden durch Zerstörung
der Bakterienzellen mit einer French Pressure Cell Press (s. 5.1) und anschließende
Abtrennung von Zelltrümmern durch Zentrifugation gewonnen (s. 5.10.1). Das Lysat wurde
mit Substratlösung versetzt und 30 min bei 28 °C inkubiert (s. 5.10.1). Getestet wurden
zunächst die beiden Substanzen Emodin (9) und Quercetin×H2O (27), deren Metaboliten
bereits charakterisiert sind. Über die LC/MS-Analyse konnte keine Derivatisierung von
Emodin festgestellt werden, im Assay mit Quercetin hingegen kam es zur Bildung des
Rhamnokonjugats Quercitrin. Die AUC360nm des Produktpeaks macht etwa 1 % der GesamtAUC360nm von Edukt und Produkt aus. Wird auf die Zentrifugation zur Abtrennung von
Zelltrümmern verzichtet und direkt mit den physikalisch durch die French Pressure Cell
aufgeschlossenen Zellen gearbeitet, kann der Umsatz von 27 verdoppelt werden. Mit
aufgeschlossenen Zellen wurde die Biotransformation von Mitoxantron (25) überprüft. Die
LC/MS-Analyse des Ansatzes ergab keinen Hinweis auf rhamnosylierte Derivate von 25.
Die Präsenz eines Xenobiotikums führt in vielen Fällen zur Transkriptionsinduktion und
damit zur Konzentrationserhöhung des metabolisierenden Enzyms. Für eine Versuchsreihe
wurde das Lysat aus Zellen gewonnen, die unter Zusatz von 9 oder 27 in einer Konzentration
von 2,5 mg/100 mL NL111-Flüssigmedium kultiviert wurden. Per SDS-PAGE (s. 5.10.2)
wurden die Lysate auf Proteinbanden gesteigerter Intensität untersucht. Ein Unterschied zu
Lysaten nicht induzierter Kulturen war nicht zu erkennen. Geringe Abweichungen lassen sich
per SDS-PAGE jedoch nicht detektieren. Das Lysat der induzierten Kulturen wurde im
Glykosylierungsassay mit der jeweils anderen Substanz versetzt. Weder 9 noch 27 wurden
umgesetzt. Möglicherweise wird durch den vorausgegangenen Kontakt mit einem
Zuckerakzeptor mehr NDP-Rhamnose verbraucht, als nachgebildet werden kann.
3.1.8 Untersuchung weiterer Stämme
3.1.8.1 Stammauswahl
In der Literatur sind bereits einige Beispiele mikrobieller Glykosylierung bekannt (s. 4.1.1).
Die Art der verknüpften Zuckereinheit ist ein charakteristisches Merkmal unterschiedlicher
Stämme. S. espanaensis wird in die Familie Actinosynnematacae eingeordnet [131]. Unter der
Hypothese, dass sich die Rhamnosylierungsaktivität auch auf weitere Familienmitglieder
erstreckt wurden die Stämme Saccharothrix australiensis (DSM43800) und Saccharothrix
tangerinus (DSM44720) aus der Deutschen Sammlung von Mikroorganismen und
Zellkulturen (Braunschweig) bestellt. Von besonderem Interesse war auch der Stamm
Streptomyces griseoviridis Tü3634, dessen Potential, aromatische Carbonsäuren mit
L-Rhamnose zu verestern, aus der Literatur bekannt ist (s. 4.1.1). S. griseoviridis Tü3634
wurde freundlicherweise von Prof. Dr. A. Zeeck und PD Dr. S. Grond (Göttingen) zur
64
Ergebnisse
Verfügung gestellt. In Stämmen, deren Genomsequenz bereits erschlossen ist, gestaltet sich
die Identifizierung der verantwortlichen Glykosyltransferasegene deutlich einfacher (s. 4.1.4).
Aus diesem Grund wurde der Stamm Rhodococcus sp. RHA1 ausgewählt, der seine
Eigenschaft als "metabolic powerhouse" bereits bei der Biodegradation von polychlorierten
Biphenylen (PCBs) unter Beweis gestellt hat [132]. Der Stamm wurde freundlicherweise von
Prof. Dr. L. Eltis (Vancouver, Canada) überstellt. Der Modellorganismus Streptomyces
coelicolor A3(2) [70] wurde über L. Petzke von Prof. Dr. M. Redenbach (Kaiserslautern)
erhalten.
3.1.8.2 Ergebnis der Kultivierung unter Zusatz von Emodin
Die Biotransformation von Emodin in Kulturen der fünf neuen Stämme wurde mit dem für
S. espanaensis etablierten Protokoll überprüft (s. 3.1.2). In allen Stämmen, bis auf
Rhodococcus sp. RHA1, ließ sich die Metabolisierung von Emodin feststellen. Im Extrakt
von Saccharothrix tangerinus war kein Derivat mit Emodin ähnlichem
UV/VIS-Absorptionsspektrum zu detektieren, was auf die Degradation der gefütterten
Substanz schließen lässt. Spuren von Emodin waren noch über MS-Signale nachweisbar.
Das Metabolitenprofil in den Extrakten von S. espanaensis (vgl. Abb. 14),
Saccharothrix australiensis und Streptomyces griseoviridis ist sehr ähnlich. In jedem der drei
Stämme kam es zur Bildung von EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin). Im Extrakt von
Saccharothrix australiensis trat außerdem das aus S. espanaensis bekannte Produkt
EmoPro1 (8-O-α-L-Rhamnosylemodin), im Extrakt von Streptomyces griseoviridis EmoPro2
(1-O-α-L-Rhamnosylemodin) auf. Mit diesen Experimenten konnte ein weiterer
Rhamnosylierungsstamm (Saccharothrix australiensis) entdeckt werden und bekannte
Fähigkeit von Streptomyces griseoviridis zur Rhamnokonjugatbildung auf eine weitere Klasse
von Substraten erweitert werden.
Die Analyse der Fütterung an Streptomyces coelicolor A3(2) zeigte eine Variation des
Emodinmetabolismus. Als Hauptmetabolit konnte ein Derivat der Masse 286 detektiert
werden. Die Masse entspricht der von Emodin mit zusätzlichem Sauerstoffatom (270+16 u),
vermutlich ein hydroxyliertes Derivat. Für ein weiteres, deutlich hydrophileres Derivat lässt
sich eine Masse von 448 abgleiten. Der Massengewinn von 178 u entspricht einem
Sauerstoffatom und einer konjugierten Hexopyranose (16 u+162 u) oder der Konjugation
eines Desoxyzuckers und entsprechend vielen Sauerstoffatomen an anderer Stelle im
Molekül. Als Erklärung wird aufgrund vergleichbarer Ergebnisse mit anderen Streptomyces
spp. (s. 4.1.1) eine Funktionalisierung von Emodin durch Hydroxylierung und anschließende
Konjugation mit einer Hexopyranose (zum Beispiel Glucose) vorgeschlagen. Mit der
Umsetzung von Emodin durch Streptomyces coelicolor A3(2) gelang erstmalig die
Xenobiotikaglykosylierung in einer Streptomyces sp. mit vollständig sequenziertem Genom.
Die Identifikation des Glykosyltransferasegens, das eine wertvolle Bereicherung der
Freiburger Glykosyltransferasen-Toolbox (s. 3.1.9) darstellen wird, sollte durch Analyse des
Genoms möglich sein (s. 4.1.4).
Ergebnisse
65
3.1.9 Identifizierung von Glykosyltransferasegenen mit
degenerierten Oligonukleotidprimern
Neben der Bereitstellung von Nukleotidzuckern als Donoren ist die Verfügbarkeit geeigneter
Glykosyltransferasen (GTs) eine Herausforderung bei der Durchführung enzymatischer
Glykosylierungsreaktionen. Ein Werkzeugkasten (Toolbox) mit Plasmiden, auf denen die
Biosyntheseenzyme unterschiedlicher Nukleotidzucker codiert werden, liegt im Arbeitskreis
unseres Kooperationspartners Prof. Dr. J. A. Salas (Oviedo, Spanien) vor und wird ständig
erweitert [133;134]. Eine entsprechende Bibliothek mit Glykosyltransferasegenen
aufzubauen, ist das Ziel des Arbeitskreises Bechthold. Die Koexpression von Enzymen der
NDP-Zuckerbiosynthese zusammen mit einer geeigneten Glykosyltransferase soll es
ermöglichen, im Sinne der kombinatorischen Biosynthese (s. 1.5.4), den gewünschten Zucker
in vivo mit einem ausgewählten Akzeptor zu verknüpfen. Das Akzeptormolekül wird dabei
entweder vom Wirt produziert oder der Reaktion über das Kulturmedium zugeführt. Die
folgend beschriebenen Experimente waren der erste Schritt zum Aufbau einer Toolbox von
Glykosyltransferasegenen aus einer vorselektierten Cosmidbank der Firma Combinature
Biopharm AG (Berlin). Die Strategie zur Identifizierung von Glykosyltransferasegenen wurde
auch auf genomische DNA von S. espanaensis angewandt.
3.1.9.1 Cosmidisolierung
Die Cosmidbank enthielt 246 E. coli DH5α-Stabkulturen. Die in den Bakterien vorliegenden
Cosmide stammten aus unterschiedlichen Actinomycetales-Arten und waren durch
Hybridisierungssignale im Sondenscreening auf Desoxyzuckerbiosynthesegene aufgefallen.
Decker et al. (1996) [135] stellten fest, dass die Biosynthesegene für im Primärstoffwechsel
unübliche Zucker oft im Gencluster des entsprechenden Sekundärstoffs und damit auch
assoziiert mit Glykosyltransferase-(GT)-Genen vorliegen. Obwohl heute einige
Sekundärstoffbiosynthesegencluster bekannt sind, deren GT-Gene nicht mit den
Zuckerbiosynthesegenen assoziiert sind [136-139], kann der Nachweis von Biosynthesegenen
für den Aufbau seltener Desoxyzucker auf einem Cosmid im Allgemeinen als Indikator für
dort ebenfalls codierte Glykosyltransferasen angesehen werden. Die 246 vorselektierten
Cosmide der Combinature Biopharm AG sind demnach potentielle Träger von
Glykosyltransferasegenen, die dem Aufbau der Freiburger GT-Toolbox dienen können.
Der erste Arbeitsschritt war die Kultivierung der Cosmid tragenden E. coli zur Vervielfältigung der Cosmid-DNA. Für jede der 246 Kulturen wurden zwei Cosmidpräparationen mit
dem Kit "Wizard Minipreps DNA Purification System" durchgeführt (s. 5.5.2.1). Durch
BamHI-Restriktion und anschließende Gelelektrophorese (s. 5.5.4.1; 5.5.4.2) wurden die
DNA-Lösungen stichprobenartig überprüft.
66
Ergebnisse
3.1.9.2 Degenerierte Oligonukleotidprimer
Um GT-Gene auf den Cosmiden zu identifizieren, sollten PCRs (s. 5.6.1) mit degenerierten,
GT-Gen spezifischen Primern durchgeführt werden. Diese Strategie wurde bereits in anderen
Arbeitsgruppen erfolgreich zur Identifikation von GT-Genen oder auch vollständigen
Sekundärstoffbiosynthesegenclustern eingesetzt [140-142]. Ein degenerierter Primer ist eine
Mischung von unterschiedlichen Oligonukleotiden, die sich an bestimmten Positionen
unterscheiden. Die degenerierten Positionen (= Wobbles) sind in der Primersequenz durch
Buchstaben ≠ GATC zu erkennen und symbolisieren das Auftreten unterschiedlicher Basen
an dieser Position (s. 7.1). Die GT-Primer wurden von konservierten Bereichen
unterschiedlicher GT-Gene abgeleitet. Das erste Primerpaar, genGT-F / -R, trug über die
gesamte Nukleotidsequenz verteilt Wobbles. In 18 PCRs mit je einem zufällig ausgewählten
Cosmid als Matrize wurden dieses Primerpaar auf seine Eignung überprüft, spezifisch
GT-Genfragmente zu amplifizieren (s. 5.6.3.2). Die beiden konservierten Bindungsregionen
liegen auf den GT-Genen etwa 900 bp von einander entfernt. In fünf Fällen kam es zur
Bildung von PCR-Produkten entsprechender Größe. Diese wurden mittels präparativer
Agarosegelelektrophorese (s. 5.5.4.2) isoliert, über TA-Klonierung in den Vektor pGEM-T
Easy insertiert (s. 5.5.5.3) und mit einem Standardprimer ansequenziert (s. 5.6.2.1). Bei den
PCR-Produkten handelte es sich jedoch nicht um GT-Genfragmente sondern um
unspezifische Amplifikate.
Die CODEHOP-Strategie
Als Ursache der mangelnden Spezifität wurde vor allem der hohe Degenerierungsgrad des
Primerpaars genGT-F / -R angesehen (25 % bzw. 30 % Wobbles). Der hohe Degenerierungsgrad geht mit einer geringen Konzentration der einzelnen Oligonukleotide im Mix einher.
Selbst wenn nun ein bestimmtes Oligonukleotidpaar zur Amplifikation eines
GT-Genfragments führt, kommt die Reaktion mit dem Abbau dieses Paars nach wenigen
Zyklen zum Erliegen. Eine Lösung bot das Primerdesign nach der CODEHOP- (consensusdegenerate hybrid oligonucleotide primer) Strategie [143]. Die von Dr. A. Luzhetskyy nach
der CODEHOP-Strategie abgeleiteten Primer P1 / P2 (20 % bzw. 14 % Wobbles, s. 5.6.3.2)
haben nur eine kurze, degenerierte Domäne am 3'-Ende (= degenerate core). Der Rest des
Primers ist nicht degeneriert (= consensus clamp). Als Basis der Nukleotidsequenzen dienten
AS-Sequenzblöcke konservierter Bereiche von sechs Makrolid-GTs (s. Abb. 45). Die
Bindungsregion des "degenerate core" ist grau hinterlegt. Im "degenerate core" bildet der
Primer gemäß des Streptomyces typischen Codongebrauchs [144] einige der häufigsten
Tripletts nach; im "consensus clamp" enthalten die Primersequenzen nur das häufigste
Triplett, das für die im AS-Consensus häufigste Aminosäure codiert.
In den ersten Zyklen der PCR binden die sich am 3'-Ende unterscheidenden Oligonukleotide
spezifisch an komplementären Basenfolgen der GT-Gene. Unabhängig vom amplifizierten
Bereich besitzen alle entstehenden PCR-Produkte identische Randbereiche mit der Sequenz
des "consensus clamp". In den folgenden Zyklen tragen deshalb alle Primer zur
67
Ergebnisse
Vervielfältigung der Primärprodukte bei. Durch PCRs von H. Weiß wurde die Eignung des
Primerpaars P1 / P2 zur Amplifikation von GT-Genfragmenten gezeigt. Die vorselektierten
Cosmide dienten als Matrize [145].
P1
DesVII
EryBV
EryCIII
MegBV
MegCIII
MegDI
48
47
48
48
48
48
VLWEPTTYAGAVAAQVTGAAHARVLWG
WSSGPQTFAASIAATVTGVAHARLLWG
VIWEPLTFAAPIAAAVTGTPHARLLWG
IVWEPLTFAAPIAARVTGTPHARMLWG
VLWEPFTFAGAVAAKACGAAHARLLWG
VLWEPFTFAGAVAARACGAAHARLLWG
P2
222
223
222
225
218
218
RFTDFVPMHALLPSCSAIIHHGGAGTYATAVI
RTVGFVPMHALLPTCAATVHHGGPGSWHTAAI
RTVGFVPMHALLPTCAATVHHGGPGSWHTAAI
RTAGFVPMNVLLPTCAATVHHGGTGSWLTAAI
RLVDFVPMNILLPGCAAVIHHGGAGSWATALH
RLVDFVPMGVLLQNCAAIIHHGGAGTWATALH
Abb. 45: AS-Sequenzblöcke konservierter Bereiche der Glykosyltransferasen DesVII (Biosynthese von
Methymycin, Neomethymycin, Narbomycin, Pikromycin [146]), EryBV / EryBV (Erythromycinbiosynthese
[137]), MegBV / MegCIII / MegDI (Megalomicinbiosynthese [147]). Design der Primer P1 / P2 s. Text.
Anwendung auf genomische DNA von Saccharothrix espanaensis
Xenobiotikaglykosylierungen, wie unter 3.1 für Saccharothrix espanaensis beschrieben,
werden im Allgemeinen von UGTs (UDP abhängige Glykosyltransferasen) katalysiert
(vgl. 4.1). Enzyme dieser Familie werden deshalb auch für die Glykosylierungsaktivität von
S. espanaensis verantwortlich gemacht (s. 4.1). Von den bisher bekannten 17 GT-Genen des
Stammes lässt sich phylogenetisch keines einer UGT zuordnen (s. 4.1.4.1, Abb. 93). Eine
Möglichkeit zur Identifizierung weiterer GT-Gene des Stammes könnte das CODEHOPPrimerpaar P1 / P2 bieten.
Die ersten PCRs wurden mit vorselektierten Cosmiden aus der Bibliothek des S. espanaensisGenoms angesetzt, die im Sondenscreening auf Zuckerbiosynthesegene Hybridisierungssignale zeigten. Mit keinem der Cosmide noch unbekannter Sequenz kam es zur Bildung
detektierbarer PCR-Produkte. Überraschenderweise führte auch das Cosmid 4L16 (Locus 1)
nicht zur Amplifizierung von GT-Genfragmenten, obwohl darauf sieben GT-Gene des samClusters liegen [148]. Im Gegensatz dazu kam es mit Cosmid 2L12 (Locus 2, 10 GT-Gene)
zur Produktbildung.
Das Primerpaar P1 / P2 ist folglich nicht für alle GT-Gene gleichermaßen geeignet. Auch galt
es die gewählte Strategie mit vorselektierten Cosmiden zu überdenken, da bakterielle
UGT-Gene nicht obligat in Assoziation mit Zuckerbiosynthesegenen vorliegen [149]. Als
Matrize der folgenden PCRs wurde deshalb genomische DNA (s. 5.5.2.2) aus S. espanaensis
eingesetzt. Zwei Hauptprodukte mit einer Größe von 0,8 kb und 1,2 kb wurden in pGEM-T
Easy insertiert und mit einem Standardprimer ansequenziert. Es handelte sich jedoch nicht um
GT-Genfragmente. Die Spezifität der CODEHOP-Primer ist demnach ausreichend für die
Anwendung auf vorselektierte Cosmide, jedoch unzureichend für gezielte Amplifikationen
ausgehend von genomischer Gesamt-DNA.
68
3.2
Ergebnisse
Erstellung einer Nullmutante und Selektion eines
Polyketomycinüberproduzenten des Stammes
Streptomyces diastatochromogenes Tü6028
Mit dem Polyketomycinbiosynthesegencluster besitzt Streptomyces diastatochromogenes
Tü6028 die genetische Grundlage zur Bereitstellung der seltenen Zuckerbausteine L-Axenose
und D-Amicetose in nukleotidaktivierter Form. Im Rahmen der kombinatorischen Biosynthese
zur Bildung neuer Glykoside konnte der Stamm seine Eignung als Wirt für die heterologe
Expression von PKS II-Biosynthesegenclustern unter Beweis stellen [54]. Die Produktion des
endogenen Polyketids Polyketomycin beschränkt die Biosynthese weiterer Polyketide jedoch
durch Entzug des Vorläufers Malonyl-CoA. Gleichzeitig erschwert die Anwesenheit von
Polyketomycin und seinen Derivaten im Kulturextrakt die Detektion neu auftretender
Metaboliten.
Durch gezielte Inaktivierung von pok-KSα, dem Gen der Ketosynthase Untereinheit α, sollte
die Polyketomycinproduktion zum Erliegen gebracht werden (s. 3.2.1, 3.2.2). Die gewonnene
∆pok-KSα-Mutante sollte für Biosyntheseuntersuchungen (s. 3.2.3) und als Expressionswirt
(s. 3.2.4) eingesetzt werden.
3.2.1 Fehlgeschlagene pok-KSα-Inaktivierungsstrategien
Der schließlich innerhalb kürzester Zeit erfolgreichen, in dieser Arbeit erstmalig
beschriebenen, [safe-knock]-Strategie (s. 3.2.2), gingen drei erfolglose Versuche zur
Inaktivierung von pok-KSα voraus, die im Folgenden kurz beschrieben werden.
3.2.1.1 In-frame-Deletion auf einem 3,7 kb Clusterfragment
Inaktivierungsplasmid
Das im ersten Versuch eingesetzte Inaktivierungsplasmid pKC-P3,7 (s. 5.4.2.2) trägt ein pokKSα-Allel mit 390 bp In-frame-Deletion (vgl. 5.8.1.3) in der Mitte eines 3,7 kb großen
Clusterfragments. Mittels intergenerischer Konjugation sollte pKC-P3,7 in S. diastatochromogenes Tü6028 eingebracht werden und über homologe Rekombination zu einem ersten
Crossover-Ereignis mit dem Chromosom des Stammes führen. Das Plasmid wird durch den
ersten Crossover in das Chromosom integriert und vermittelt der entstehenden Mutante
Resistenz gegen das Selektionsantibiotikum Apramycin.
Ergebnisse
69
Intergenerische Konjugation
Die intergenerische Konjugation wurde nach dem unter 5.7.2 beschriebenen Protokoll
durchgeführt. Wie sich erst in späteren Experimenten feststellen ließ, zeichnet sich
S. diastatochromogenes Tü6028 durch das Bedürfnis eines außergewöhnlich langen Intervalls
(20 h) zwischen dem Aufbringen auf die Konjugationsplatte und dem Überschichten mit
Antibiotikalösung aus. Für die Versuche mit pKC-P3,7 variierte das Intervall zwischen 12 h
und 14 h Stunden. Retrospektiv war es deshalb nicht überraschend, dass auch mehr als
30 Konjugationsversuche bei Einsatz von Donor- und Rezipientenkulturen verschiedener
Kulturdauer ausgehend von Myzel oder Sporen nicht zum Erhalt einer Mutante mit erstem
Crossover führten. Positivkontrollen mit dem Vektor pSET152 (s. 5.4.1) zeigten stets das
Wachstum einiger Konjuganten; bei den später gefundenen Idealbedingungen (s. 5.7.2)
wuchsen mit pSET152 jedoch mehrere Hundert Kolonien pro Konjugationsplatte (∅ = 9 cm).
3.2.1.2 In-frame-Deletion auf einem 7,3 kb Clusterfragment
Inaktivierungsplasmid
Die Wahrscheinlichkeit der homologen Rekombination zweier DNA-Doppelstränge erhöht
sich mit der Länge des homologen Bereichs. Mit 7,3 kb Länge wurde für den zweiten
Versuch der pok-KSα-Inaktivierung ein etwa doppelt so großes, subkloniertes Clusterfragment
eingesetzt. Zur Konstruktion des Inaktivierungsplasmids pKC-P7,3 mit funktionslosem
pok-KSα-Allel war ursprünglich die Einführung eines Frameshifts durch Blunting und
Religation geplant (s. 5.4.2.2). Es kam jedoch nicht wie erwartet nur zur Abtragung der an der
Schnittstelle zurückgelassenen 3'-Überhänge, sondern zum Verlust von insgesamt 69 bp
(Sequenzierergebnis). Es war ein Allel mit In-frame-Deletion entstanden. Das Konstrukt war
dennoch verwendbar, da der Verlust von 69 bp an genetischer Information (entsprechend
23 AS) zum Funktionsverlust des Gens führen sollte.
Intergenerische Konjugation und Protoplastentransformation
Per intergenerischer Konjugation (s. 5.7.2) konnte pKC-P7,3 erfolgreich in S. diastatochromogenes Tü6028 eingebracht werden. Auch die parallel durchgeführte Protoplastentransformation (s. 5.7.1) führte zur Bildung von Transformanten. Für den Nachweis der
Integration von pKC-P7,3 in das Genom von S. diastatochromogenes Tü6028 wurde
genomische DNA eines Konjuganten (P7,3Ex1) isoliert (s. 5.5.2.2). Per PCR (Primer
P7,3-F / -R, s. 5.6.3.1) wurde der Bereich von pok-KSα amplifiziert. Nach dem ersten
Crossover-Ereignis befinden sich sowohl Wildtypallel als auch das mutierte Allel auf dem
Chromosom. Da die erwarteten Produktgrößen (Wildtypallel: 1501 bp; mutiertes Allel:
1432 bp) nur gering von einander abweichen, wurde die DNA aus dem PCR-Ansatz isoliert
(Kit "Wizard SV Gel and PCR Clean-up System" s. 5.2.5) und mit KpnI restringiert. Die
70
Ergebnisse
KpnI-Erkennungsstelle liegt auf dem 69 bp-Bereich, der dem mutierten Allel fehlt. Da nur
PCR-Produkte des Wildtypallels in 687 bp und 814 bp große Fragmente gespalten werden,
konnten sie von Produkten des mutierten Allels durch eine anschließende Gelelektrophorese
unterschieden werden. Cosmid 30-6D20 (Wildtypallel, [38]) und pKC-P7,3 (mutiertes Allel)
dienten als Matrize in parallel durchgeführten Kontrollansätzen. Ansätze mit DNA des
Konjuganten P7,3Ex1 zeigten nach KpnI-Restriktion in der Gelelektrophorese sowohl die
Fragmente des Produkts mit Wildtypallel als auch das unverdaute PCR-Produkt mit
mutiertem Allel. Im Kulturextrakt des Konjuganten P7,3Ex1 konnte Polyketomycin per
LC/MS-Analytik (Methode: antqui, s. 5.11.6) nicht nachgewiesen werden.
Selektion auf zweites Crossover
Der apramycinresistente Konjugant P7,3Ex1 wurde zur Herbeiführung des zweiten
Crossovers (vgl. 5.8.1.3) ohne Selektionsdruck abwechselnd durch HA-Medium und HAAgar passagiert (vgl. 5.8.2.5). Zur Gewinnung von 58 apramycinsensitiven Klonen wurden
sukzessive nach 6, 8 und 10 Passagen insgesamt 1232 Kolonien je auf HA-Agar mit
Apramycin und HA-Agar überpickt. Durch Isolierung von genomischer DNA (s. 5.5.2.2),
PCR (Primer P7,3-F / -R sowie P7,31-F / P7,32-R, s. 5.6.3.1) und KpnI-Restriktion konnten
die Klone bezüglich pok-KSα genotypisiert werden. Nur einer der Doppelcrossover-Klone
ergab das für die Knockout-Mutante erwartete, nicht von KpnI restringierbare PCR-Produkt.
Zur weiteren Überprüfung wurde das Produkt aus dem PCR-Ansatz isoliert und per
TA-Klonierung (s. 5.5.5.3) in den Vektor pGEM-T Easy kloniert und mit einem
Standardprimer ansequenziert (s. 5.6.2.1). Die Sequenz entsprach dem mutierten Allel. Damit
schien das Vorliegen der gewünschten ∆pok-KSα-Mutante bewiesen zu sein. Wie erwartet,
ließ sich in Extrakten der Doppelcrossover-Mutante kein Polyketomycin nachweisen.
Bei wiederholten PCRs mit genomischer DNA des gleichen Klons als Matrize wurde
überraschenderweise das PCR-Produkt des Wildtypallels erhalten. Dies wurde per
Sequenzierung bestätigt. Die zunächst über Apramycinsensitivität und Sequenzierung
identifizierte Knockout-Mutante besaß nun wieder das pok-KSα-Wildtypallel. Das Ergebnis
wird unter 4.3 diskutiert.
Aus der Mutante nach erstem Crossover (P7,3Ex1) konnte folglich keine stabile ∆pok-KSαMutante gewonnen werden.
3.2.1.3 Einbringen einer Redirect-Kassette in das 7,3 kb Clusterfragment
Im vorangegangenen pok-KSα-Inaktivierungsversuch (s. 3.2.1.2) konnte ein erstes CrossoverEreignis herbeigeführt werden; es entstand jedoch keine stabile Doppelcrossover-Mutante. Im
folgenden Ansatz sollte das Wildtypallel durch eine Antibiotikaresistenzkassette ausgetauscht
werden (vgl. 5.8.1.2). Der ins Genom integrierte Marker vereinfacht nach stattgefundenem
zweiten Crossover die Unterscheidung zwischen Mutante (resistent) und Wildtyp (sensitiv).
71
Ergebnisse
Das Selektionsantibiotikum kann eingesetzt werden, um bei den Filialgenerationen das
Wachstum von Revertanten zum Wildtyp (s. 4.3) zu verhindern.
Es sollten die multifunktionellen Redirect-Kassetten des John Innes Centre (Norwich, UK)
eingesetzt werden [150] (s. 5.5.5.5). Neben einem Resistenzgen tragen diese auch das für die
intergenerische Konjugation notwendige origin of transfer (oriT) sowie zwei flankierende
FRT- oder loxP-sites zur sequenzspezifischen Rekombination (s. 5.9). Die Kassette sollte über
λ-Red vermittelte Rekombination (s. 5.5.5.5) den Bereich des Gens pok-KSα auf pKC-P7,3
(s. 5.4.2.2) ersetzen.
Auswahl eines weiteren Selektionsmarkers für S. diastatochromogenes Tü6028
Zusätzlich zu der vom Vektor vermittelten Resistenz (gegen Apramycin) wurde für die
geplante Inaktivierung ein weiterer geeigneter Marker für den Stamm S. diastatochromogenes
Tü6028 benötigt. In einem Antibiotikum basierten Selektionssystem sollte das Antibiotikum
das Wachstum des Wildtyps hemmen, das Wachstum von Klonen mit Resistenzgen hingegen
möglichst wenig beeinflussen. Auf HA-Agar mit gebräuchlichen Konzentrationen der
getesteten Antibiotika wurden je 0,2 mL Saccharosedauerkultur des Wildtyps (s. 5.3.1.4)
ausplattiert und bei 28 °C inkubiert. Nach 4 und 8 Tagen wurden die Platten (∅ = 9 cm) auf
Koloniewachstum überprüft.
Tab. 7: Wachstum von S. diastatochromogenes Tü6028 unter Einfluss von Antibiotika.
Antibiotikum
Hygromycin
Lincomycin
Spectinomycin
Spectinomycin
Streptomycin
ohne (Kontrolle)
[µg/mL]
100
50
50
100
50
-
nach 4 Tagen
kein Wachstum
7 Kolonien
10 Kolonien
kein Wachstum
kein Wachstum
überwuchert
nach 8 Tagen
kein Wachstum
7 Kolonien
30 Kolonien
kein Wachstum
kein Wachstum
überwuchert
Mit vollständiger Wachstumshemmung reagierte der Wildtyp auf die Antibiotika Hygromycin
(100 µg/mL), Spectinomycin (100 µg/mL) und Streptomycin (50 µg/mL). Da es sich um
Konzentrationen handelt, die das Wachstum von Stämmen mit entsprechender Resistenzkassette nicht wesentlich beeinflussen, sind die drei Antibiotika in den angegebenen
Konzentrationen zur Selektion geeignet.
Die verfügbaren Redirect-Kassetten [151] tragen bevorzugt das aac(3)IV-Gen der Apramycinresistenz vermittelnden Aminoglykosid 3-N-Acetyltransferase [152] oder aadA-Gen der
Spectinomycin- und Streptomycinresistenz vermittelnden Aminoglykosid-3''-adenyltransferase [153]. Das aadA-Gen wurde deshalb neben aac(3)IV als zweiter Marker gewählt.
Auch in Flüssigmedium wurde die Sensitivität von S. diastatochromogenes Tü6028
gegenüber Spectinomycin überprüft, wozu je 10 µL Saccharosedauerkultur als Inokulum für
1 mL HA-Medium unterschiedlicher Konzentration des Antibiotikums dienten. Nach 7 Tagen
72
Ergebnisse
bei 28 °C war nur bei Konzentrationen von ≤ 50 µg/mL Myzelwachstum zu beobachten. Die
Konzentration von 100 µg/mL konnte damit als geeignet bestätigt werden.
λ-Red vermittelte Rekombination mit der pIJ785Spec Redirect-Kassette
Eigens für dieses Projekt wurde das Plasmid pIJ785Spec mit einer neuen Redirect-Kassette
erstellt (s. 5.4.2.1). Eine Besonderheit der Kassette ist der zusätzlich zum Spectinomycinresistenzgen vorliegende thiostreptoninduzierbare tipA-Promotor [154]. Mit dem
eingebrachten tipA-Promotor wurde die steuerbare Überexpression nachgeschalteter Gene der
Desoxyzuckerbiosynthese [38] angestrebt.
Analog zum Protokoll von Gust et al. (2002) [150] sollte pok-KSα in dem subklonierten,
7,3 kb großen Clusterfragment von pKC7,3 durch die Redirect-Kassette von pIJ785Spec pokKSα ersetzt werden. Die Redirect-Kassette diente als Matrize einer PCR mit dem Primerpaar
P7,3red-F / -R (s. 5.6.3.1). Um die erhaltene lineare DNA für die λ-Red vermittelte
Rekombination zu qualifizieren, trug diese, durch Primerüberhänge bedingt, beidseitig einen
40 bp-Sequenzabschnitt, der Bereichen am Anfang bzw. Ende von pok-KSα entsprach. An den
identischen Bereichen des PCR-Produkts und pKC-P7,3 wurde nach Induktion der red-Gene
(s. 5.5.5.5) die homologe Rekombination erwartet. Die gewünschte Rekombination fand
jedoch nicht statt. Als Grund wurden weitere, unerwünschte Sequenzähnlichkeiten zwischen
pKC-P7,3 und dem PCR-Produkt verantwortlich gemacht. Die Nukleotidsequenz des
pKC-P7,3 zugrunde liegenden Vektors pKC1132 (s. 5.4.1) ist unbekannt. Der Vektor trägt
das origin of transfer (oriT) aus RK2, sowie ein Apramycinresistenzgen. Da auch in der
pIJ785Spec-Kassette das oriT sowie ein vom Promotor des Apramycinresistenzgens
kontrolliertes Spectinomycinresistenzgen liegt, scheint eine homologe Rekombination in
diesen deutlich über 40 bp langen, identischen Sequenzbereichen wahrscheinlicher als die
gewünschte Rekombination zum Austausch von pok-KSα.
Zur Umgehung aller unerwünschten Rekombinationen unter Beibehaltung der gewählten
Selektionsmarker wurde die im nächsten Kapitel beschriebene [safe-knock]-Strategie
entwickelt.
Ergebnisse
73
3.2.2 Erfolgreiche Inaktivierung mit der [safe-knock]-Strategie
Mit Erkenntnissen aus den fehlgeschlagenen Inaktivierungsversuchen wurde eine Strategie
entwickelt, bei der jeder Schritt der Inaktivierung mit hoher Sicherheit beim ersten Versuch
erfolgreich ist (s. 4.3). Die [safe-knock]-Strategie wurde zur Methode der Wahl für alle
folgenden Inaktivierungen und ist deshalb im Methodenteil beschrieben (s. 5.8.2). Das
allgemein gültige Schema zur Erstellung von Inaktivierungsplasmiden, ausgehend von einem
Subklon und dem spezifischen PCR-Produkt einer Redirect-Kassette, ist in Abb. 46
dargestellt.
Inaktivierungsplasmid
Für die Inaktivierung von pok-KSα wurde gemäß der [safe-knock]-Strategie das
Inaktivierungsplasmid pB-P3,7red erstellt (s. 5.4.2.2). Wie schon beim vorangegangenen
Versuch (s. 3.2.1.3) sollte pok-KSα zur Konstruktion des Inaktivierungsplasmids durch die
Redirect-Kassette von pIJ785Spec ersetzt werden. Der entscheidende Unterschied zu vorangegangenen Klonierversuchen liegt darin, dass der Resistenzmarker des Vektors (apra) erst
nach der λ-Red vermittelten Rekombination in das Konstrukt integriert wird (vgl. Abb. 46).
Da ein Clustersubklon in einem Kloniervektor bekannter Sequenz eingesetzt wird, können
unerwünschte Rekombinationen vermieden werden.
Das Einbringen in S. diastatochromogenes Tü6028 (Phänotyp WS-R, s. 3.2.5) erfolgte über
intergenerische Konjugation (s. 5.5.2.2).
Nachweis der Rekombinationsereignisse
Auf der nach 20 h mit Apramycin und Phosphomycin (s. 5.2.3) überschichteten
Konjugationsplatte (∅ = 9 cm) waren 12 Streptomyces-Kolonien gewachsen. Die Klone
wurden zur Überprüfung ihrer Resistenz auf HA-Agar mit Apramycin, Spectinomycin und
Phosphomycin übertragen. Alle Klone wuchsen an. Die Anwesenheit beider Marker (Vektor:
apra, in pok-KSα integriert: spec) lässt mit hoher Sicherheit auf das Vorliegen eines ersten
Crossovers schließen. Per PCR mit genomischer DNA wurde dies bestätigt (s. Abb. 47).
Einer der Konjuganten, bezeichnet als P3,7redEx1, wurde ohne Selektionsdruck abwechselnd
durch HA-Flüssigmedium und HA-Agar passagiert (s. 5.8.2.5). Das effektive Passagieren
wurde dadurch begünstigt, das sich auf dem Festmedium schnell Sporen bildeten (s. 5.8.2.5).
Während des Passagierens wurde die Stabilität des Phänotypen WS-R deutlich. Es traten
ausschließlich die für den Phänotyp WS-R charakteristischen, weißen Sporen auf.
74
Ergebnisse
PCR der Redirect-Kassette
Subklon mit Clusterfragment
auszutauschender Bereich
angrenzende Clusterbereiche
Primer mit 40nt angrenzender Clustersequenz als Überhang
P1 / P2: priming site; FRT: FRT-site; spec: Spectinomycinresistenzgen; oriT: origin of transfer
5'
3'
P1
4000
5'
oriT
s pec
FRT
1000
FRT
carb
P2
3'
HindIII
Simultane Elektroporation mit
Subklon und PCR-Produkt
E. coli DH5α mit vorinduzierten red-Genen
Selektion auf LB-Agar mit Carbenicillin
und Spectinomycin
α
β
γ
Red-Proteine
+
HindIII
HindIII
Plasmidisolation und
Restriktion mit HindIII
Apramycinresistenzkassette
aus pHPΩ45aac über HindIII
Präparative Gelelektrophorese
Leiter Probe
apra
Ligation
mit Apramycinresistenzkassette
Transformation
von E. coli mit
pUZ8002 für die
Konjugation
carb
2000
6000
HindIII
apra
spec
Selektion mit
Carbenicillin,
Spectinomycin,
Apramycin,
Kanamycin
HindIII
Abb. 46: Konstruktion eines Inaktivierungsplasmids mittels [safe-knock]-Strategie. Darstellung der RedirectKassette gemäß [150].
75
Ergebnisse
Die Sporensuspension der zweiten Agarkultur (= vierten Passage) wurden in
unterschiedlichen Verdünnungen auf HA-Agar mit Spectinomycin kultiviert. Alle
anwachsenden Klone haben entweder den Genotyp nach erstem Crossover (wie P3,7redEx1)
oder den der gewünschten Doppelcrossover-Mutante (= Knockout-Mutante).
Von 352 auf gerasterte HA-Agarplatten übertragenen Klonen waren zwei spectinomycinresistent und apramycinsensitiv. Diese Eigenschaft charakterisiert die gewünschte
Doppelcrossover-Mutante mit integrierter Spectinomycinresistenzkassette.
Die beiden Klone wurden auf HA-Agar mit Spectinomycin ausgestrichen. Von einigen
Klonen, bezeichnet als P3,7redDCOx (x = Nummer des Klons) wurde genomische DNA
isoliert und per PCR-Analyse (Primer P3,7-F / -R, s. 5.6.3.1) genotypisiert.
Das erwartete Produkt des Wildtypallels (auf Cosmid 30-6D20 [38]) hat eine Größe von 1,6
kb, für das mutierte Allel (auf pB-P3,7red) wurden 2,1 kb erwartet. Das Gelbild der Agarosegelelektrophorese (s. Abb. 47) weist für die Mutante nach erstem Crossover wie erwartet
beide Amplifikate auf. Mit genomischer DNA des Doppelcrossovers zur Mutante bildete sich
nur noch das 2,1 kb große Produkt. Der über das Resistenzverhalten der Klone bestimmte
Genotyp bezüglich pok-KSα konnte damit bestätigt werden.
Für anschließende Experimente wurde der Klon P3,7redDCO14 ausgewählt und forthin als
S. diastatochromogenes Tü6028 ∆pok-KSα bezeichnet. Im Extrakt von Standardkulturen
(s. 5.3.1.4) des Stammes konnte Polyketomycin nicht nachgewiesen werden.
S. diastatochromogenes Tü6028 ∆pok-KSα ist bezogen auf Polyketomycin, wie angestrebt,
eine Nullmutante.
10 kb
8 kb
6 kb
5 kb
4 kb
3 kb
2,5 kb
2,0 kb
2067bp
1624bp
1,5 kb
1,0 kb
0,75 kb
0,50 kb
0,25 kb
1
2
3
4
L
1: P3,7redEx1
nach erstem Crossover
2: P3,7redDCO14
mit Doppelcrossover
3: Cosmid 30-6D20
mit Wildtypallel
4: Plasmid pB-P3,7red
mit mutiertem Allel
L: 1 kb Leiter (Promega)
Abb. 47: Agarosegelelektrophorese von PCR-Ansätzen zur Genotypisierung bezüglich pok-KSα (Ausschnitt).
76
Ergebnisse
Komplementierung des pok-KSα-Gendefekts
Das Gen pok-KSα markiert den Beginn eines Operons des Polyketomycinbiosynthesegenclusters. Die Expression der nachgeschalteten Gene wird durch den Promotor vor pok-KSα
kontrolliert. Diese Gene codieren unter anderem die weiteren essentiellen Komponenten der
minimalen PKS: KSβ und ACP (s. Abb. 48). Um zu überprüfen, ob durch die eingebrachte
Redirect-Kassette auch die Expression von pok-KSβ oder pok-ACP inhibiert wird, sollte der
pok-KSα-Gendefekt mit einer intakten Kopie des Gens komplementiert werden. Wenn es
dadurch zu einer Wiederaufnahme der Polyketomycinproduktion kommt, ist davon
auszugehen, dass nur pok-KSα von dem generierten Gendefekt betroffen ist.
Zur Erstellung des Komplementierungskonstrukts pSET-P3,7kompl wurde pok-KSα mit
seinem nativen Promotor in den integrativen Vektor pSET152 insertiert (s. 5.4.1). Nach dem
Einbringen des Plasmids pSET-P3,7kompl in S. diastatochromogenes Tü6028 ∆pok-KSα über
intergenerische Konjugation wurden sechs der Konjuganten per LC/MS auf die Produktion
von Polyketomycin überprüft (Methode: antqui, s. 5.11.6). Polyketomycin oder bekannte
Derivate des Antibiotikums konnten in keinem der Extrakte nachgewiesen werden. Parallel
wurde ein Cosmid (30-6D20), dessen Insert das betroffene Operon vollständig abdeckt, in
S. diastatochromogenes Tü6028 ∆pok-KSα eingebracht. Es kam zur Wiederaufnahme der
Polyketomycinproduktion.
Aus den Beobachtungen lässt sich ableiten, dass außer pok-KSα weitere Gene, bzw. deren
Expression, durch die eingebrachte Redirect-Kassette beeinflusst werden. Die Auswirkungen
bleiben aber auf Gene des Polyketomycinbiosynthesegenclusters begrenzt, wie durch
Komplementierung mit dem Cosmid 30-6D20 gezeigt wurde.
verändertes pok-Operon
oriT
spec
FRT
KSα' P1
FRT
MT1
P2 tipAp 'KSα
KSβ
ACP
Redirect-Kassette von pIJ786Spec
Abb. 48: Schematische Darstellung des Chromosoms von S. diastatochromogenes Tü6028 ∆pok-KSα im Bereich
der eingebrachten Redirect-Kassette. Gewinkelte Pfeile: Promotoren, Blockpfeile: Gene (lila: Gene des pokClusters, pok-MT1: Methyltransferasegen). P1 / P2: Priming-sites, FRT: FRT-sites, oriT: Transfer-Origin für die
Konjugation, spec: Spectinomycinresistenzkassette, tipAp: tipA-Promotor.
Ergebnisse
77
Sequenzspezifische Flp-Rekombination in Streptomyces spp.
Als Ursache der transkriptionell negativen Beeinflussung weiterer Gene des pok-KSα
enthaltenden Operons wurde der gegen die Leserichtung des Operons orientierte, starke
Promotor von spec vermutet (vgl. Abb. 48). Über RNA-Interferenz könnte es zur
Inaktivierung des pok-Promotors kommen. Zur Überprüfung der Hypothese sollte der specPromotor aus dem Genom von S. diastatochromogenes Tü6028 ∆pok-KSα entfernt werden,
um anschließend erneut die Komplementierung mit pSET-P3,7kompl zu versuchen.
Dieses Ziel kann mit der sequenzspezifischen Flp-Rekombination, einer Erweiterungsmöglichkeit der [safe-knock]-Strategie, erreicht werden (s. 5.9). Die Flp-Rekombination
erlaubt die gezielte Exzision des Bereichs zwischen zwei FRT-sites. Im Genom zurück bleibt
eine der 34 bp langen FRT-sites, flankiert von den Primerbindungsstellen P1 und P2 (schematisch gezeigt in Abb. 105). Für die Anwendung in bestimmen Actinomycetales-Arten konnte
die Funktionalität eines speziell für den Codongebrauch von Organismen mit G+C-reichen
Genomen umgeschriebenen, synthetischen Flp-Rekombinasegens (flp(a)) gezeigt werden
[155]. Im Folgenden sollte das Gen erstmals zur Geninaktivierung in einem Sekundärstoffbiosynthesegencluster eingesetzt werden.
Mittels intergenerischer Konjugation wurde das speziell für dieses Experiment erstellte flp(a)Expressionsplasmid pUWLhyg-FLP (s. 5.4.2.3) in S. diastatochromogenes Tü6028 ∆pok-KSα
eingebracht. Einer der resultierenden Konjuganten wurde für drei Tage in HA-Flüssigmedium
mit Hygromycin angezogen. In dieser Kultur sollte die Flp-Rekombination stattfinden. Der
Zusatz von Hygromycin stellt dabei die Anwesenheit von pUWLhyg-FLP in den Zellen
sicher. Auf den Zusatz von Spectinomycin wurde verzichtet, da die gewünschte
Rekombination zum Verlust von spec führt.
Eine Probe aus der Flüssigkultur wurde auf HA-Agar bis zur Sporenbildung inkubiert. Mit
ausplattierten Verdünnungen einer Sporensuspension wurden ausgeeinzelte Klone gewonnen
und auf gerasterte HA-Agarplatten je mit bzw. ohne Spectinomycin übertragen. 26 von 232
Klonen (11 %) wiesen keine Resistenz gegen Spectinomycin auf. Der Resistenzverlust ist auf
den Einfluss der Flp-Rekombinase zurückzuführen, ein spontaner Resistenzverlust wurde
nicht
beobachtet.
Vier
zufällig
gewählte,
spectinomycinsensitive
Klone
(S. diastatochromogenes Tü6028 ∆pok-KSα FLP1 bis 4) sollten weiter untersucht werden.
Durch Übertragung auf HA-Agar mit Hygromycin wurde festgestellt, dass die Klone bereits
das Hygromycinresistenz vermittelnde, replikative Plasmid pUWLhyg-FLP verloren hatten.
Mittels PCR auf genomischer DNA wurde versucht, den Bereich der Redirect-Kassette zu
amplifizieren. Die angestrebte Exzision würde zu einer Verringerung der Produktgröße um
etwa 1,3 kb führen. Das PCR-Temperaturprogramm und die Komposition des PCR-Mix
wurden variiert (unterschiedliche Konzentrationen von DMSO und Glycerol, getestete
Primerpaare: P3_7FLP-F / -R, P3_7FLP2-F / -R, P7,3-F / -R, s. 5.6.3.1). Mit genomischer
DNA der Rekombinanten wurden nur unspezifische Produkte erhalten. Mit Matrizen vom
78
Ergebnisse
Wildtyp oder S. diastatochromogenes Tü6028 ∆pok-KSα entstanden Produkte der erwarteten
Größe. Auch vom Entwickler der Flp(a) vermittelten Rekombination wurden ähnliche
Beobachtungen gemacht [156]. Trotz zahlreicher PCR-Ansätze gelang der Nachweis der
erfolgreichen Rekombination in Vertretern der Gattung Streptomyces per sequenziertem PCRProdukt nur in einem Fall [155]. Möglicherweise kommt es in den rekombinierten DNABereichen zur Bildung von stabilen Sekundärstrukturen, die eine Amplifikation verhindern.
Weshalb der Effekt jedoch über mehrere Generationen anhält, ist mit dem heutigen
genetischen Wissen nicht zu erklären.
pok-KSα-Komplementierung nach Flp-Rekombination
Das Komplementierungsplasmid pSET-P3,7kompl (s. 5.4.2.2) wurde mittels intergenerischer
Konjugation in eine der Flp-Rekombinanten von S. diastatochromogenes Tü6028 ∆pok-KSα
eingebracht. Das Genom der entstandenen Konjuganten sollte eine intakte Kopie eines jeden
pok-Gens enthalten. Abweichend vom ersten Komplementierungsversuch sollten oriT und
spec mit Promotor nicht mehr im pok-Cluster vorliegen. Falls die zuvor festgestellte,
ausbleibende Komplementierung des pok-KSα-Gendefekts auf die DNA-Sequenz zwischen
den beiden FRT-sites zurückzuführen ist, sollte die Polyketomycinproduktion nun einsetzen.
Wie durch eine Produktionskontrolle bestimmt wurde, war dies der Fall. Aus der
Beobachtung lässt sich ableiten, dass eine insertierte Redirect-Kassette auch einen negativen
Effekt auf die Transkription nachgeschalteter Gene haben kann. Dies gilt zumindest, wenn der
Promotor des Resistenzgens gegen die Leserichtung des Operons orientiert ist.
3.2.3 Biosynthesestudie mit S. diastatochromogenes Tü6028 ∆pok-KSα
Durch Fütterung des Polyketomycinderivats POK-IP3 (s. Abb. 50) an S. diastatochromogenes
Tü6028 ∆pok-KSα sollte bestimmt werden, ob die Substanz ein Intermediat von
Polyketomycin ist oder als Shuntprodukt in einem Seitenast des Biosynthesewegs liegt, der
nicht zum Polyketomycin führt. POK-IP3 wird von S. diastatochromogenes Tü6028 ∆pokOI
∆pokOII produziert [157]. Durch die Inaktivierung von zwei FAD abhängigen
Monooxygenasen hat diese Mutante die Befähigung zur Produktion von Polyketomycin
verloren.
Der POK-IP3 enthaltende Ethylacetatextrakt einer 100 mL Kultur der Doppelmutante wurde
in 200 µL DMSO gelöst und an S. diastatochromogenes Tü6028 ∆pok-KSα gefüttert. Nach
Kultivierung unter Standardbedingungen (s. 5.3.1.4) wurde der Kulturextrakt (s. 5.11.1.1) per
LC/MS analysiert (s. Abb. 49). Sollte POK-IP3 ein Intermediat der Polyketomycinbiosynthese sein, so wäre in S. diastatochromogenes Tü6028 ∆pok-KSα die Vorläufer
vermittelte Komplementierung des Biosynthesewegs zum Polyketomycin zu erwarten.
79
Ergebnisse
mAU
60
mAU
Tü6028 Wildtyp
Polyketomycin
150
0
220 300 400 500 nm
30
0
0
mAU
60
10
20
30
min.
10
20
30
min.
20
30
min.
20
30
min.
∆pok-KSα
30
0
0
mAU
60
mAU
15
∆pokOI ∆pokOII
30
0
0
mAU
60
POK-IP3
0
220 300 400 500 nm
10
∆pok-KSα + Extrakt von ∆pokOI ∆pokOII
30
0
0
10
Abb. 49: Absorptionschromatogramme bei λ = 430 nm (LC/MS-Analyse, Methode: antqui, s. 5.11.6). Auch über
die Extraktion von MS-Diagrammen bei entsprechenden m/z-Werten lässt sich Polyketomycin nur im Extrakt
des Wildtyps, POK-IP3 nur im Extrakt von S. diastatochromogenes Tü6028 ∆pokOI ∆pokOII nachweisen.
In S. diastatochromogenes Tü6028 ∆pok-KSα wurde das gefütterte Derivat POK-IP3
abgebaut. Die Bildung von Polyketomycin oder dessen unglykosyliertem Vorläufer
Polyketomycinon konnte durch die LC/MS-Analyse nicht nachgewiesen werden
(s. Abb. 49, Zeile 4). Auch weitere Inhaltsstoffe des Extrakts von S. diastatochromogenes
Tü6028 ∆pokOI ∆pokOII mit einer Retentionszeit zwischen 23 min und 30 min wurden
abgebaut.
Das Ergebnis legt nahe, dass die Pok-Biosyntheseenzyme von S. diastatochromogenes
Tü6028 ∆pok-KSα nicht in der Lage sind auf das Derivat POK-IP3 als Polyketomycinvorläufer zurückzugreifen. Für POK-IP3 wird deshalb eine Rolle als Shuntprodukt
vorgeschlagen (s. Abb. 50).
80
Ergebnisse
H
OH O
10 Acetateinheiten
HO
OH OH O
10
11
12
1
7
6
5
4
13
14
-H+
CH3
+
+H
OH
OH O
OH OH O
D
B
C
HO
SAM
PokMT2
OH OH OH OH O
OH OH O
OH O
OH O
CH3
OH
CH3
[O]
OH
HO
CH3
POK-IM3
OH OH O
O
OH O
O
OH
OH
CH3
CH3
HO
H3C
OH
POK-IP3
OH
OH
SAH
CH3
HO
CH3
A
H3CO
CH3
Polyketomycin
O
OH H
OR
O
Abb. 50: Getrennte Biosynthesewege zum Polyketomycin und zum Shuntprodukt POK-IP3. R: s. Abb. 8.
SAM: S-Adenosyl-L-methionin, SAH: S-Adenosyl-L-homocystein.
Studien an der Biosynthese von Oxytetrazyklin deuten darauf hin, dass die Methylierung an
C-6 als früher Schritt unmittelbar nach der Cyclisierung der Polyketidkette stattfindet [158].
Für die Gruppenübertragung von S-Adenosyl-L-methionin (SAM) bedarf es der Aktivierung
von C-6 durch eine Erhöhung der negativen Landungsdichte. Über die basenkatalysierte
Deprotonierung von C-11 entsteht zunächst ein C-6-Carbanion. Ein nukleophiler Angriff von
C-6 auf das CH3+-Äquivalent von SAM knüpft die neue C-C-Bindung. Über Keto-EnolTautomerie kommt es zur Rearomatisierung von Ring C. Ein hier intermediär vorliegendes
C-6-Carbanion begünstigt die Hydroxylierung zur Bildung von POK-IP3. Analog zu Zhang et
al. (2007) [158] könnte es sich um eine spontane Reaktion mit Luftsauerstoff handeln. Wie
auch aus dem Ergebnis des Fütterungsexperiments geschlossen ist POK-IP3 demnach kein
Vorläufer von Polyketomycin, sondern ein Shuntprodukt. Interessanterweise konnte POK-IP3
bisher nur im Extrakt der Mutante mit Gendefekt in ∆pokOI und ∆pokOII nachgewiesen
werden, nicht jedoch im Wildtyp. Dies zeigt die Effektivität des "Teamwork" der an der
Synthese von PKS II-Metaboliten beteiligten Enzyme. Es ist anzunehmen, dass die
hypothetische Vorstufe POK-IM3 im Wildtyp durch gezielte Übertragung auf PokOI und
PokOII oder sogar durch direkte Beteiligung der Monooxygenasen am PKSMultienzymkomplex einer spontanen Oxidation zu POK-IP3 entzogen wird. Dies würde
bedeuten, dass es sich bei PokOI und PokOII nicht um Post-PKS-Enzyme handelt.
81
Ergebnisse
3.2.4 S. diastatochromogenes Tü6028 ∆pok-KSα als Expressionswirt
Mit S. diastatochromogenes Tü6028 ∆pok-KSα wurde eine Mutante generiert, in deren
Kulturextrakten keine Pigmente enthalten sind, die chromatographisch mit PKS II-Metaboliten interferieren. Bei der Absorptionswellenlänge λ = 430 nm wird eine Nulllinie erhalten
(s. Abb. 49), bei λ = 254 nm treten ausschließlich Peaks mit einer Höhe von wenigen mAU
auf. Damit sind ideale Bedingungen zur Detektion neuer Substanzen bei der Expression
stammfremder Gene geschaffen.
Unter 3.3.5.1 wurde gezeigt, dass durch die Integration von Cos2 (msn-Cluster) in das Genom
von S. albus die Produktion von Didesmethylmensacarcin ausgelöst wird. Cos2 erschien
geeignet für einen ersten Test von S. diastatochromogenes Tü6028 ∆pok-KSα
als heterologer Wirt. Dazu wurde analog zu 3.3.5.1 vorgegangen. Auch in
S. diastatochromogenes Tü6028 ∆pok-KSα kam es mit Cos2 zur Produktion von Didesmethylmensacarcin, was die Eignung als Wirt zeigt.
3.2.5 Polymorphismus von S. diastatochromogenes Tü6028
Bei der intergenerischen Konjugation mit S. diastatochromogenes Tü6028 wurde das
Auftreten unterschiedlich gefärbter Kolonien beobachtet. Daraufhin wurde auch der Wildtyp
des Stammes, welcher üblicherweise mit grauen Sporen bedeckte Kolonien (Phänotyp GR)
bildet, auf unterschiedliche Phänotypen hin untersucht. Abweichend von der typisch grauen
Sporenfarbe zeigten etwa 10 % der ausgeeinzelten Wildtyp-Kolonien keine Sporenbildung
(Phänotyp OS) und wiesen eine rot-braune Färbung auf. Kolonien mit weißen Sporen traten
nur sehr selten auf (2 - 5 Kolonien/Agarplatte, ∅ = 9 cm). Zwei unterschiedliche Kolonien mit
weißen Sporen wurden isoliert (WS-R, WS-L).
A
B
Abb. 51: Phänotypen von S. diastatochromogenes Tü6028 auf HA-Agar. A: oben links: WS-L; oben rechts:
OS; unten links: GR; unten rechts: WS-R. B: Von der anderen Seite der Agarplatte lässt sich durch die intensiv
orange Färbung des WS-R-Myzels die starke Polyketomycinproduktion dieses Phänotyps erkennen.
82
Ergebnisse
Um der Frage nachzugehen, ob es sich tatsächlich um unterschiedliche Erscheinungsbilder
von S. diastatochromogenes Tü6028 oder eine Kontamination mit anderen ActinomycetalesArten handelt, und um gleichzeitig einen möglichen Zusammenhang mit der Polyketomycinproduktion aufzudecken, wurden einzelne Kolonien der unterschiedlichen Phänotypen zur
Produktion angezogen. Die Kulturextrakte (s. 5.3.1.4 und 5.11.1.1) wurden per HPLC
untersucht (Methode: pok, s. 5.11.4).
Der Extrakt von S. diastatochromogenes Tü6028 OS wies eine nur gering vom häufigsten
Phänotyp (GR) abweichende Polyketomycinkonzentration auf. Die Konzentrationen bei den
zwei Phänotypen mit weißen Sporen (WS-R, WS-L) unterscheiden sich deutlich. Während
WS-R eine 600 %ige Überproduktion zeigt, konnte Polyketomycin in Extrakten von WS-L
nicht nachgewiesen werden. Die Beobachtung wird unter 4.4 diskutiert.
%
700
600
500
400
300
200
100
0
GR
WS-R
WS-L
OS
Abb. 52: Relative Polyketomycinkonzentration (HPLC, AUC440nm) in Extrakten der S. diastatochromogenes
Tü6028 Phänotypen im Vergleich, bezogen auf den Phänotyp mit grauen Sporen (GR). WS-R / WS-L:
Phänotypen mit weißen Sporen, OS: Phänotyp ohne Sporen.
Die Stabilität des Erscheinungsbildes und des Produktionsverhaltens wurde untersucht. Dazu
wurden alle Phänotypen über drei Passagen nach dem Schema [Agarkultur mit Sporen→
Agarkultur mit Sporen→ Agarkultur mit Sporen] auf Beibehaltung ihres Erscheinungsbildes
überprüft. Es konnte in keinem Fall eine Abweichung vom ursprünglichen Erscheinungsbild
festgestellt werden, obwohl zwischen der ersten und zweiten Passage etwa zwei Jahre lagen.
Der weiße Sporen bildende Überproduzent S. diastatochromogenes Tü6028 WS-R wurde zur
Generierung von S. diastatochromogenes Tü6028 ∆pok-KSα eingesetzt (s. 3.2.2). Auch nach
der Inaktivierung und den damit verbundenen Passagen bildete die aus dem WS-R Phänotyp
entstandene Mutante stets nur weiße Sporen. Mit Agarkulturen der dritten Passage wurden
Produktionskontrollen in HA-Flüssigmedium angesetzt und die Extrakte chromatographisch
untersucht. Das AUC-Verhältnis des Polyketomycinpeaks von GR zu WS-R wurde mit 1:6
bestätigt, WS-L und OS glichen sich der Produktion von GR an. Damit konnte für WS-L die
Identität als S. diastatochromogenes Tü6028 bestätigt werden. Mit dem Phänotyp WS-R
konnte ein stabiler Polyketomycinüberproduzent gewonnen werden.
Ergebnisse
3.3
83
Funktionelle Charakterisierung dreier PKS II-Biosynthesegencluster des Mensacarcinproduzenten S. sp. Gö C4/4
3.3.1 Anzucht und Sekundärstoffanalytik von S. sp. Gö C4/4
Parallel zu den Arbeiten von Dr. M. Arnold (AK Zeeck, Göttingen) wurde im Jahr 2002 von
A. Prestel im Arbeitskreis Bechthold (Freiburg) die Suche nach dem
Mensacarcinbiosynthesegencluster begonnen. Die in Göttingen mit S. sp. Gö C4/4 erreichte
Mensacarcinproduktion ließ sich in Freiburg nicht reproduzieren [159]. Vor einer genetischen
Charakterisierung des Stammes galt es deshalb die Produktion sicherzustellen und die
Anzuchtbedingungen zu standardisieren.
Ein Vergleich der verwendeten Hafermedien zur Mensacarcinproduktion zeigte, dass bei den
fehlgeschlagenen Freiburger Versuchen Kobalt(II)- und Mangan(II)-Ionen fehlten [56;160].
Bezüglich des Hafers lagen von unserem Kooperationspartner Combinature Biopharm AG
(Berlin) weitere Informationen vor. Dort wurde erfolgreich Holo Bio Hafergold, ein
Vollkornhafermehl, eingesetzt (s. Tab. 30). Mit Holo Bio Hafergold und vorhandenen Salzen
wurde das Hafermedium von Combinature möglichst genau nachgestellt (s. Tab. 27).
100 mL Kulturmedium wurden mit 1 cm2 einer an dieser Stelle vollständig bewachsenen
HA-Agarplatte angeimpft, für sechs Tage bei 28 °C auf dem Rundschüttler (180 rpm)
inkubiert und anschließend mit Ethylacetat extrahiert (s. 5.3.1.4 und 5.11.1.1). Bereits der
erste Produktionsversuch war erfolgreich. Der Hauptpeak des 254 nm-Chromatogramms der
LC/ESI-MS-Analyse (s. Abb. 53) konnte mit von Dr. M. Arnold erhaltener Referenzsubstanz
über Vergleich von Retentionszeit, UV/VIS-Absorptions- und Massenspektrum der Substanz
Mensacarcin (MSN) zugeordnet werden. Durch weitere Experimente wurde festgestellt, dass
die für andere Stämme zur Sekundärstoffproduktion übliche Animpfmethode aus einer
25 % Saccharosedauerkultur (s. 5.3.1.4) nicht zur Mensacarcinproduktion führt.
Kolonien von S. sp. Gö C4/4 zeigen auf HA-Agar einen dunklen Produktionshof.
HA-Flüssigkulturen beginnen sich nach drei Tagen grau zu färben, nach sechs Tagen ist die
Kulturbrühe schwarz. Diese Beobachtung lässt auf die Produktion eines Pigments schließen.
Daraufhin wurde das Produktionsspektrum des Stammes in HA-Medium analysiert
(Standardbedingungen, s. 5.3.1.4). Überraschenderweise kam es im HA-Medium zu einer
Mensacarcinproduktion, vergleichbar mit der in Hafermedium. HA-Medium ist ein
Standardmedium zur Kultivierung von Streptomyces spp., einfach in der Herstellung und
unkompliziert bei der Extraktion, da es im Gegensatz zum Hafermedium nicht als Suspension,
sondern als Lösung vorliegt. Alle weiteren Produktionskontrollen wurden folglich mit
HA-Medium durchgeführt.
84
Ergebnisse
Die Schwarzfärbung des Mediums durch S. sp. Gö C4/4 ist nicht auf Mensacarcin oder seine
Vorläufer zurückzuführen, da sie auch bei Produktionskontrollen von Nullmutanten auftrat
(s. 3.3.5.2). Vielmehr handelt es sich bei dem dunklen Pigment vermutlich um Melanin, das
von den meisten Streptomyces spp. unter bestimmten Bedingungen produziert wird [161].
Das HPLC-Chromatogramm in Abb. 53 gibt das typische Produktionsprofil einer Standardanzucht (s. 5.3.1.4) von S. sp. Gö C4/4 in HA-Medium wieder. In der Dissertation von
Dr. M. Arnold [56] werden drei natürliche Mensacarcinderivate beschrieben:
Didesmethyldihydro-MSN, Didesmethyl-MSN, 10-O-Desmethyl-MSN. Nach einer Schüttelkultivierung mit einer Dauer von sechs Tagen lässt sich ein Monodesmethylderivat von
Mensacarcin über sein UV/VIS-Absorptions- und Massenspektrum identifizieren (s. Abb. 53).
Als typisches Addukt der Mensacarcinderivate tritt im positiven Detektionsmodus [2M+Na]+
als häufigstes Ion auf, auch [M+Na]+ und [M+K]+ sind meist detektierbar. Im negativen
Modus dominieren die Signale [M−H]− oder [M+Cl]−.
16
mAU
17
OMe OMe OH O
OH O
10
1
254 nm
MSN
600
Desmethyl-MSN
400
200
20
10
14
15
O
OH
Mensacarcin (MSN)
*
0
0
4
6
*
11
O
30
40
min.
Abb. 53: HPLC-Chromatogramm eines Ethylacetatextrakts von S. sp. Gö C4/4 in HA-Medium. Peaks mit
Mensacarcin ähnlichem UV/VIS-Absorptionsspektrum (vgl. Abb. 54), jedoch unbekannter Masse sind mit *
gekennzeichnet (Methode: mens03, s. 5.11.6).
int. [%]
100
mAU
231
1200
+
[2M+Na]
863
80
266
800
60
int. [%]
100
80
60
-
[M-H]
419
-
[M+Cl]
455
+
40
328
400
20
0
250
300
350
400 nm
20,4 min: Mensacarcin (MSN)
0
+
[M+Na]
443
420 450
[M+K]
459
40
20
840
870 m/z
ESI-MS, pos. Modus
0
420
450
480 m/z
ESI-MS, neg. Modus
Abb. 54: UV/VIS-Absorptions- und ESI-Massenspektren von Mensacarcin (C21H24O9, Mr: 420,41). Entnommen
aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 53).
85
Ergebnisse
int. [%]
100
mAU
228
120
[2M+Na]
835
80
80
60
0
+ [M+K]
40 [M+Na]
445
429
20
326
250
300
350
400 nm
15,8 min: Desmethyl-MSN
0
437
60
+
40
-
[M-H]
405
-
265
80
int. [%]
100
+
420 450
810
40 377
[M+Cl]
441
413
20
0
840 m/z
ESI-MS, pos. Modus
390
420
450
m/z
ESI-MS, neg. Modus
Abb. 55: UV/VIS-Absorptions- und ESI-Massenspektren von Desmethylmensacarcin (C20H22O9, Mr: 406,38).
Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 53). Im Massenspektrum des negativen
Modus werden die Signale der Desmethylmensacarcin-Ionen durch eine im Chromatogramm nicht in
Erscheinung tretende Substanz der Masse 378 überlagert: m/z = 377: [M−H]− ; m/z = 413: [M+Cl]− . Zusätzlich
tritt m/z = 437 auf.
Durch Variation der Zusammensetzung des Kulturmediums im Sinne des OSMAC (one strain
- many compounds) Ansatzes [162] konnte Dr. M. Arnold zeigen, dass ein Zusatz von 2 - 5 %
DMSO im Nährmedium zur Produktion von zwei neuen Metaboliten führt. Sie konnten als
Mensalon [58] und Aloesol [59;60] identifiziert werden. Dies sollte in Freiburg reproduziert
werden.
Beide Substanzen besitzen die Summenformel C13H14O4 und eine exakte Masse von 234,09.
In Einklang damit konnte in HA-Medium mit 2 % DMSO per LC/ESI-MS die Produktion
zweier Substanzen mit korrespondierenden MS-Signalen festgestellt werden (s. Abb. 56).
Die Maxima der korrespondierenden UV/VIS-Absorptionsspektren passen zu den
Literaturwerten von Mensalon und Aloesol [56]. Die Zuordnung des UV-Peaks bei 12,8 min
zu Mensalon konnte durch von Prof. Dr. A. Zeeck (Göttingen) erhaltene Referenzsubstanz
bestätigt werden.
mAU 254 nm
Mensalon
Aloesol
MSN
600
400
200
0
0
10
20
30
40
min.
Abb. 56: Chromatogramm aus der LC/ESI-MS-Analyse eines Ethylacetatextrakts von S. sp. Gö C4/4 in HAMedium mit 2 % DMSO (Methode: mens03, s. 5.11.6).
86
Ergebnisse
int. [%]
100
mAU
276
800
80
600
int. [%]
100
+
[M+H]
235
80
60
60
40
40
200
20
20
0
0
400
250
300
350
400 nm
12,8 min: Mensalon
mAU
800
80
292
600
400
200
0
250
300
350
14,2 min: Aloesol
400 nm
m/z
ESI-MS, pos. Modus
int. [%]
100
226
244
250
210 240 270 300
0
int. [%]
100
+
[M+H]
235
80
60
40
40
20
20
210 240 270 300
-
210 240 270 300
m/z
ESI-MS, neg. Modus
60
0
[M-H]
233
m/z
ESI-MS, pos. Modus
0
-
[M-H]
233
-
[M+Cl]
269
210 240 270 300
m/z
ESI-MS, neg. Modus
Abb. 57: UV/VIS-Absorptions- und ESI-Massenspektren von Mensalon und Aloesol (je C13H14O4, Mr: 234,25).
Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 56).
Bestimmung von Selektionsmarkern für S. sp. Gö C4/4
Für die geplanten molekularbiologischen Arbeiten mit S. sp. Gö C4/4 waren geeignete
Selektionsmarker (zum Beispiel Antibiotikaresistenzgene) notwendig. Analog zu 3.2.1.3
wurde der Stamm auf natürliche Resistenz gegen übliche Antibiotika unterschiedlicher
Konzentrationen überprüft. Alle getesteten Antibiotika (Apramycin, Hygromycin,
Spectinomycin) erwiesen sich in einer Konzentration von jeweils 100 µg/mL als geeignet.
Hier war auch nach achttägiger Inkubation bei 28 °C kein Koloniewachstum auf HA-Agar
feststellbar. Apramycin ist als sicheres Selektionsantibiotikum bekannt. Bei den meisten
Streptomyces spp. führt es bereits in Konzentrationen von 25 - 50 µg/mL zum Absterben von
Zellen ohne Apramycinphosphotransferasegen. S. sp. Gö C4/4 hingegen zeigte bei 50 µg/mL
noch vereinzeltes Koloniewachstum. Aufgrund dieser Besonderheit des Stammes wurde zur
Selektion stets 100 µg/mL Apramycin eingesetzt.
Ergebnisse
87
3.3.2 Analyse des msc-Clusters (Synthese der Substanzen MSC-X)
3.3.2.1 Zusammenfassung vorangegangener Arbeiten, Analyse der Datenlage
Ziel der molekularbiologischen Analyse des Stammes S. sp. Gö C4/4 war die Identifikation
des Mensacarcinbiosynthesegenclusters. Fütterungen mit markierten Vorläufern hatten die
biogenetische Herkunft des Grundgerüstes aus Acetateinheiten nahegelegt [56].
Als aromatisches Polyketid ist Mensacarcin vermutlich einer Polyketidsynthase vom Typ II
(PKS II) zuzuordnen [23]. Eine Recherche in den bisher veröffentlichten vollständigen
Genomsequenzen von Streptomyces spp. [69-71] zeigt, dass PKS II-Gencluster mit einer
genomweiten Häufigkeit von 1 - 3 selten sind (vgl. 4.5.1). Es schien somit vielversprechend,
das Mensacarcinbiosynthesegencluster über die Lokalisierung von PKS II-Genen im Genom
des Produzenten ausfindig zu machen. In Zusammenarbeit mit Combinature Biopharm wurde
hierzu mit dem Vektor pOJ436 eine Cosmidbank von S. sp. Gö C4/4 angelegt und mit stammspezifischen Gensonden gescreent [160]. Die Sonden wurden durch Amplifikation mit
degenerierten Primern auf genomischer DNA des Stammes hergestellt. 20 Cosmide zeigten
ein signifikantes Hybridisierungssignal und wurden deshalb für weitere Untersuchungen
herangezogen. Über Restriktionskartierungen wurde von A. Prestel im Jahr 2002 eine erste
Einteilung der Cosmide in drei Gruppen überlappender Sequenzen vorgenommen [160].
Die Ansequenzierung (s. 5.6.2.1) von Subklonen (s. 5.5.5.2) eines Cosmids jeder Gruppe
diente 2002 als Entscheidungsgrundlage für die Auswahl eines Cosmids, auf dem das
Mensacarcinbiosynthesegencluster vermutet wurde, zur vollständigen Sequenzierung.
18 Sequenzen von Cos4 (Gruppe 1), 4 Sequenzen von Cos12 (Gruppe 2) und 4 Sequenzen
von Cos18 (Gruppe 3) konnten von A. Prestel gewonnen werden. Alle angenommenen
Genprodukte von DNA-Sequenzen der Gruppe 1 können über Datenbankvergleiche dem
Sekundärstoffwechsel zugeordnet werden. Die putativen Proteine der Gruppe 2 stammen aus
dem Primärmetabolismus und in Gruppe 3 wurde nur ein Genprodukt mit Ähnlichkeit zu
einem Protein aus dem Sekundärstoffwechsel gefunden: dabei handelt es sich um MmcR, eine
O-Methyltransferase aus Streptomyces lavendulae [163] (vgl. 3.3.5.4).
Im Jahr 2002 wurde von A. Prestel und Prof. Dr. A. Bechthold das Cosmid 4 (Gruppe 1) zur
vollständigen Sequenzierung ausgewählt. Mit den Ergebnissen einer Cosmidsequenzierung
mit 6,5-facher Abdeckung konnten sechs Bereiche kontinuierlicher DNA-Sequenz (Contigs)
assembliert werden [160]. Zum Ringschluss der Cosmidsequenz waren noch sechs Lücken in
der Sequenz zu schließen. Diese Arbeit wurde von Dr. U. von Mulert (AK Bechthold)
begonnen und resultierte in einer vorläufigen Sequenz des msc-Clusters. Aufgrund von
Ähnlichkeiten der abgeleiteten Genprodukte zu Enzymen aus der Biosynthese verwandter
Naturstoffe, wie Enzymen der Nogalamycinbiosynthese, wurde das Cluster von Cos4
zunächst der Mensacarcinbiosynthese zugeordnet [160]. Die Zuordnung konnte nicht
bewiesen werden.
88
Ergebnisse
3.3.2.2 Sequenzvervollständigung des msc-Contigs
Vor Beginn der molekularbiologischen Arbeiten mit dem msc-Contigs sowie im Hinblick auf
eine Veröffentlichung galt es, die DNA-Sequenz, bestehend aus sechs Contigs, zu
vervollständigen. Um Fehler bei der nun fünf Jahre zurückliegenden Aufstellung der Contigs
auszuschließen wurde die Assemblierung ausgehend von den Rohdaten [160] der
Cos4-Sequenzierung wiederholt. Dazu wurde das Programm Seqman aus dem LasergenePaket der Firma DNASTAR verwendet (s. 5.14). Die so erhaltenen Subcontigs entsprachen
denen aus der Diplomarbeit von A. Prestel. Es konnte begonnen werden, die Sequenzlücken
zu schließen.
Die Bestimmung der Lage der Subcontigs zueinander gelang über die Identifizierung von
"mate-pairs" und dem Einsatz von Lückenprimern.
*10KB - 2,7KB - 3,9KB - 1,2KB - 24KB - 3,2KB - Vektor
Abb. 58: Lage der sechs Subcontigs des msc-Contigs auf Cos4 als Ergebnis der Identifizierung von "mate-pairs"
und dem Einsatz von Lückenprimern. Die Namen der Contigs entsprechen dabei ihrer ungefähren Größe in kb.
* Das Contig 10KB enthält den Übergang vom Insert zum Cosmidvektor pOJ436. Der Übergang von der
rechten Seite des Inserts liegt in einer Lücke.
Mate-pairs sind die beiden Sequenzen, die vom gleichen, bidirektional abgelesenen Subklon
(s. 5.5.5.2) stammen. Durch die Analyse der Anordnung dieser mate-pairs zueinander können
Sequenzabschnitte (Contigs) über Lücken miteinander verbunden werden. Mit mate-pairs
konnten bereits die folgenden Contigs aneinandergereiht werden:
Tab. 8: Contigverbindungen über mate-pairs.
Contigverbindung
10KB - 2,7KB
2,7KB - 1,2KB
1,2KB - 24KB
24KB - 3,2KB
Subklonname (s. Tab. 36)
pBSK4.48 (BamHI, 9,1 kb)
pBSK4.19 (BamHI, 6,6 kb)
pBSK4.27 (BamHI, 7,1 kb)
pBSK4.1 (BamHI, 1,7 kb)
Insertgröße*
8842 bp
6106 bp
6565 bp
1723 bp
3,2KB - Vektor
C4Sac6,1 (SacI, 6,1 kb)
6062 bp
Lückengröße*
374 bp
4225 bp
25 bp
−5 bp
(Überlappung)
50 bp
*Die exakten Größen ließen sich erst nach Erhalt der vollständigen msc-Clustersequenz ermitteln. Eine erste
Größenabschätzung für das Insert und daraus folgend für die Lücke erfolgte aufgrund von Restriktionsanalysen
(s. 5.5.4.1) der Subklone.
Zur Einreihung des Contig 3,9KB standen keine direkten mate-pairs zur Verfügung. Als
einzige Platzierung blieb nach obiger Tabelle die Einreihung zwischen den Contigs 2,7KB
und 1,2KB. Eine Aussage über die Orientierung des Contigs 3,9KB war aber nicht möglich.
So genannte Lückenprimer sollten im Folgenden die Orientierung der Contigs zueinander
absichern. Lückenprimer wurden 50 - 200 bp vom Ende der Contigs entfernt von beiden
Strängen abgeleitet. Gemäß der erwarteten relativen Lage der Contigs kombinierte man die
89
Ergebnisse
Primer zu unterschiedlichen Paaren und setzte mit Cos4 als Matrize eine PCR an (s. 5.6.3.3).
Der Erhalt eines PCR-Produkts war ein Hinweis darauf, dass die eingesetzten Primer auf
komplementären Strängen des Cos4 in 5'→3'-Richtung zueinander hin orientiert binden.
Erfolgreiche Primerkombinationen sind in Tab. 9 gelistet.
Tab. 9: Contigverbindungen über PCR mit Lückenprimern.
Lücke zwischen Contig
10KB
2,7KB
3,9KB
1,2KB
24KB
-
Primerpaar, das auf Cos4
zu einem PCR-Produkt führt
Lcke4R / Lcke4aR
Lcke5F / Lcke4F
Lcke3R / Lcke2R
Lcke1R / Lcke3F
Lcke2F / Lcke1aF
2,7KB
3,9KB
1,2KB
24KB
3,2KB
Größe des PCR-Produkts*
594 bp
179 bp
438 bp
192 bp
111 bp
* Berechnete Größen auf Basis der vollständigen msc-Clustersequenz. Diese entsprechen, wie aus Abb. 59
hervorgeht, denen der tatsächlich erhaltenen PCR-Produkte.
10 kb
8 kb
6 kb
5 kb
4 kb
3 kb
2,5 kb
2,0 kb
1,5 kb
1,0 kb
0,75 kb
Primer
1: Lcke4R / Lcke4aR
2: Lcke5F / Lcke4F
3: Lcke3R / Lcke2R
4: Lcke2F / Lcke1aF
5: Lcke1R / Lcke3F
L: Promega 1kb Leiter
0,50 kb
1
L
0,25 kb
2
3
4
5
L
Abb. 59: Ergebnis der PCR-Analyse von Cos4 (msc-Cluster) mit den Lückenprimern. Mit den abgebildeten fünf
Primerkombinationen ließ sich die relative Lage der sechs Contigs zueinander bestimmen.
Mit den über die Lückenprimer gewonnen Informationen wurde die Orientierung des
Contigs 3,9KB festgelegt. Sie ist der von A. Prestel [160] vorgeschlagenen Orientierung
umgekehrt komplementär.
Die PCR-Produkte wurden über TA-Klonierung (s. 5.5.5.3) in den Vektor pGEM-T Easy
eingebracht und mit Standardprimern ansequenziert (s. 5.6.2.1). Ein ergänzendes
Primerwalking (s. 5.6.2.2) auf entsprechenden Subklonen oder Cos4 sicherte mehrere
Sequenzbereiche des msc-Clusters ab. Die Verbindung des Contigs 3,2KB mit dem
Cosmidvektor gelang über Primerwalking mit dem Primer L1F (s. 5.6.3.3) auf dem Subklon
C4Sac6,1 (s. 5.4.2.4, Tab. 36). Das Resultat der Arbeiten war die vollständige DNA-Sequenz
des Cos4-Inserts.
90
Ergebnisse
3.3.2.3 Sequenzanalyse des msc-Contigs
Das Cos4-Insert umfasst 44,0 kb mit einem durchschnittlichen G+C-Gehalt von 72,6 mol %.
Die Festlegung von offenen Leserahmen (ORFs) und deren Annotierung erfolgte mit der
Frameplot-Funktion der Artemis Software (s. 5.14), der Identifizierung von Ribosomenbindungsstellen, Start- und Stoppcodons, sowie einem Sequenzabgleich mit der NCBIDatenbank (s. 5.14). Auf diese Weise wurden 39 ORFs definiert (s. Abb. 60, Tab. 10), die in
zwei Bereiche geteilt werden können.
Biosynthese eines Exopolysaccharids
Der Bereich von msc1 bis msc10 ist eine fast perfekte Kopie aus dem ste-Cluster, das für die
Biosynthese des Exopolysaccharids Ebosin in Streptomyces sp. 139 verantwortlich
gemacht wird [164]. Interessanterweise befindet sich auch auf dem Chromosom des
Modellstamms Streptomyces coelicolor A3(2) ein äquivalenter Abschnitt mit identischer
Abfolge der Gene [70].
Biosynthese eines PKS II-Metaboliten
Der Bereich von msc12 bis msc38, möglicherweise auch bis msc39, ist ein PKS IIBiosynthesegencluster. Die minimale PKS (KSα / KSβ / ACP) wird durch die in typischer
Weise hintereinander geschalteten Gene msc14 / msc15 / msc16 codiert. Die Anwesenheit von
msc13 und msc17 (AT, KS) ist ein Hinweis auf eine alternative Startereinheit der
Polyketidbiosynthese [23]. Abgeleitete Genprodukte mit Ähnlichkeit zu 3-Ketoacyl-(ACP)Reduktasen (msc26, msc38) sowie mit Ähnlichkeit zu Cyclasen / Aromatasen (msc12, msc25,
msc29) würden die PKS vervollständigen. Zahlreiche, aus dem msc-PKS II-Cluster
abgeleitete Proteine mit Ähnlichkeit zu Oxidoreduktasen könnten zu Modifikationen des
Polyketidgrundgerüsts führen. Msc21 / 22 weisen Parallelen zum Oxygenierungssystem der
bakteriellen Luciferase auf. Auch die Sequenz von Msc32 lässt sich mit dem Konsensus der
Proteinfamilie Luciferase ähnlicher Monooxygenasen Pfam00296 (Protein Family, s. 5.14) in
Deckung bringen. Enzyme dieser Familie werden unter 3.3.5.4 analysiert. Ein Genprodukt
(Msc27) mit Pfam03392-Domäne (antibiotic biosynthesis monooxygenases) kann aufgrund
seiner Sequenzlänge von etwa 100 AS zu den Anthronoxygenase ähnlichen Enzymen
gezählt werden [165]. Msc37 teilt unter anderem 37 % identische Aminosäuren
mit der FAD abhängigen Oxygenase ElmG, die die Dreifachhydroxylierung von
Tetracenomycin (TCM) A2 zu TCM C katalysiert [166]. Zwei Proteine (Msc35, Msc46)
haben Ähnlichkeit zu NADPH:Chinonreduktasen und Enoylreduktasen wie beispielsweise
ActVI-ORF2 [167], Med-ORF9 [168], GrhO7 [169]. Im msc-PKS II-Cluster liegen zwei
Gene (msc24, msc30), die aufgrund von Sequenzvergleichen für Biosyntheseweg spezifische
Regulatoren der SARP-Familie (s. 3.3.2.6) codieren könnten. Zusätzlich werden drei weitere
mögliche Regulatoren codiert (Msc31, Msc33, Msc39). Msn34 hat Ähnlichkeit zu
Exportproteinen und könnte eine Rolle in der Eigenresistenz von S. sp. Gö C4/4 gegen die
91
Ergebnisse
MSC-Metaboliten spielen oder für deren Sekretion verantwortlich sein. Gleiches gilt für das
von msc18 - 20 codierte ABC-Transportsystem.
Die vom msc-PKS II-Cluster codierten Proteine lassen sich gut mit den für die Mensacarcinbiosynthese erwarteten Enzymen in Einklang bringen. Das Fehlen eines
Methyltransferasegens zeigt an, dass es sich zumindest nicht um das vollständige
Mensacarcinbiosynthesegencluster handeln kann.
minimale PKS
Das msc-Contig
PKS Startereinheit
Oxidoreduktasen
1
2 3 4
5
6
7
8
9 10
12
Cyclasen
12 16 15 14 13 17 18 19 20 21 22 23 24 25 26 27 28 29 30
0kb
5kb
10kb
15kb
31
20kb
Regulatoren
Aminotransferase
Transporter
Membranprotein
Zuckersynthese /
Transfer
unbekannt
32 33 34
35 36 37
25kb
38 40
39
30kb
Abb. 60: Physikalische Karte des msc-Contigs.
Suche nach Anschlusscosmiden, Begrenzung des msc-PKS II-Clusters
Der linke (lt. Abb. 60) Rand des msc-PKS II-Clusters wird durch den Beginn des
Exopolysaccharidbiosynthesegenclusters definiert. Die rechte Begrenzung des msc-Contigs
stellen die beiden ORFs msc40 und msc39 dar. Ob diese auch den Rand des PKS II-Clusters
festlegen, sollte bestimmt werden.
Über PCR mit dem Primerpaar Ansch-F / -R (s. 5.6.3.3) wurde das Cosmid Cos9 (vgl. 3.3.3)
als einziges Anschlusscosmid für den rechten Rand des Contigs identifiziert. Mit mehreren
Primerwalkingschritten (s. 5.6.2.2) wurde die Sequenz von msc39 vervollständigt und die
angrenzende Sequenz auf 2,4 kb Länge erschlossen. Auf einen vermutlich nicht codierenden
0,7 kb langen Bereich folgt ein ORF, der mit Msc39 58 % identische und 71 % ähnliche
Aminosäuren teilt. Das abgeleitete Protein wurde Msc41 genannt und in Tab. 10 integriert.
Auf Msc41 folgt noch 1 kb bekannte DNA-Sequenz. Mit der BLAST-Abfrage wurden
abschnittsweise Ähnlichkeiten zu Proteinen aus unterschiedlichen Organismen aufgedeckt,
unter anderem zu verschiedenen hypothetischen Proteinen von Streptomyces sp. Mg1 [170].
Das letzte Gen mit eindeutigem Bezug zum PKS II-Metabolismus (msc38) liegt 4,7 kb vom
Rand des durch die Sequenzierung erschlossenen Bereichs entfernt. Es ist deshalb davon
auszugehen, dass das msc-PKS II-Cluster vollständig sequenziert wurde.
92
Ergebnisse
Tab. 10: Liste der auf dem msc-Contig identifizierten Gene unter Angabe der auf Ähnlichkeitsvergleichen
basierenden vorgeschlagenen Proteinfunktionen. Die Nummerierung erfolgte in Anlehnung an die Diplomarbeit
von A. Prestel [160].
Msc
Größe
[AS]
vorgeschlagene
Funktion
Aminosäuresequenz-Ähnlichkeiten
1
411
Methyltransferase
2
264
3
214
Transferase,
möglicherweise zur
Zuckeraktivierung
unbekanntes
Protein
4
341
Zuckerepimerase /
Dehydratase
5
423
unbekanntes
Protein
6
429
Membranprotein
7
315
Glykosyltransferase
8
416
unbekanntes
Protein
9
183
Zuckerepimerase
65 / 76
85 / 91
10
441
Aminotransferase
84 / 91
88 / 94
identisch /
positiv [%]
90 / 95
89 / 94
92 / 94
90 / 94
86 / 93
84 / 92
89 / 94
91 / 95
86 / 94
85 / 93
81 / 86
81 / 88
91 / 94
91 / 94
77 / 85
88 / 92
(11)
12
315
54 / 67
89
Cyclase /
Dehydratase
ACP
16
15
408
KSβ
64 / 74
14
422
KSα
73 / 83
13
17
18
343
353
321
55 / 63
55 / 68
47 / 66
19
249
20
319
Acyltransferase
KS für Starteinheit
ABC-Transporter:
Substratbindungsprotein
ABC-Transporter:
ATP-Bindungsprotein
ABC-Transporter:
Permease
58 / 72
angenommene Proteinfunktion (Herkunft),
NCBI accession number, Referenz
SCO0392 (Streptomyces coelicolor A3(2)),
NP_624714, [70]
Ste16 (Streptomyces sp. 139), AAN04241, [164]
SCO0393 (Streptomyces coelicolor A3(2)),
NP_624715, [70]
Ste17 (Streptomyces sp. 139), AAN04242, [164]
SCO0394 (Streptomyces coelicolor A3(2)),
NP_624716, [70]
Ste18 (Streptomyces sp. 139), AAN04243, [164]
SCO0395 (Streptomyces coelicolor A3(2)),
NP_624717, [70]
Ste19 (Streptomyces sp. 139), AAN04244, [164]
SCO0396 (Streptomyces coelicolor A3(2)),
NP_624718, [70]
Ste20 (Streptomyces sp. 139), AAN04245, [164]
SCO0397 (Streptomyces coelicolor A3(2)),
NP_624719, [70]
Ste21 (Streptomyces sp. 139), AAN04246, [164]
SCO0398 (Streptomyces coelicolor A3(2)),
NP_624720, [70]
Ste22 (Streptomyces sp. 139), AAN04247, [164]
SCO0399 (Streptomyces coelicolor A3(2)),
NP_624721, [70]
Ste22b (Streptomyces sp. 139), BAD89170, [164]
SCO0400 (Streptomyces coelicolor A3(2)),
NP_624722, [70]
Ste23 (Streptomyces sp. 139), BAD89171, [164]
SCO0401 (Streptomyces coelicolor A3(2)),
NP_624723, [70]
Ste24 (Streptomyces sp. 139), BAD89172, [164]
keine signifikanten Übereinstimmungen, ein ORF
lässt sich nicht festlegen, der G+C-Frameplot weist
jedoch auf einen codierenden Bereich hin
Tfu_1222 (Thermobifida fusca YX), YP_289283,
[171]
CmmS (Streptomyces griseus subsp. griseus),
CAE17520, [172]
Ara-ORF10 (Streptomyces echinatus), ABL09958,
[54]
Ara-ORF11 (Streptomyces echinatus), ABL09959,
[54]
AknF (Streptomyces galilaeus), AAF70110, [173]
CosE (Streptomyces olindensis), ABC00733, [174]
SACE_3967 (Saccharopolyspora erythraea NRRL
2338), YP_001106163, [175]
60 / 75
SCO5258 (Streptomyces coelicolor A3(2)),
NP_629404, [70]
62 / 74
SACE_3966 (Saccharopolyspora erythraea NRRL
2338), YP_001106162, [175]
Ergebnisse
Msc
Größe
[AS]
vorgeschlagene
Funktion
21
354
22
172
Luciferase ähnliche
Oxidoreduktase
Flavinreduktase
23
375
24
269
25
301
26
238
27
100
28
363
29
161
30
274
31
1112
32
342
33
153
34
512
35
298
36
325
37
533
38
271
40
432
39
241
41
243
Aminosäuresequenz-Ähnlichkeiten
identisch /
positiv [%]
53 / 69
47 / 57
möglicherweise
Phosphotransferase
Regulator,
SARP-Familie
Cyclase (2. Ring)
45 / 58
Ketoacyl-(ACP)Reduktase
Monooxygenase,
Anthronoxygenase
ähnlich
Oxidoreduktase,
zinkbindend,
NADPH:Chinonreduktase oder
Enoylreduktase
Cyclase
39 / 60
Regulator,
SARP-Familie
Regulator,
SARP-Familie
Luciferase ähnliche
Oxidoreduktase
Regulator
47 / 61
Resistenz
vermittelnder
Transporter,
EmrB / QacA
Unterfamilie
Oxidoreduktase,
zinkbindend,
NADPH:Chinonreduktase oder
Enoylreduktase
Oxidoreduktase,
zinkbindend,
NADPH:Chinonreduktase oder
Enoylreduktase
FAD abhängige
Oxygenase
Ketoacyl-(ACP)Reduktase,
C-9-Ketoreduktase
unbekanntes
Protein
möglicherweise
Regulator
möglicherweise
Regulator
93
46 / 59
55 / 66
45 / 56
angenommene Proteinfunktion (Herkunft),
NCBI accession number, Referenz
Francci3_4140 (Frankia sp. CcI3), YP_483217,
[176]
Rxyl_1781 (Rubrobacter xylanophilus DSM 9941),
YP_644552, [177]
FRAAL5329 (Frankia alni ACN14a), YP_715495,
[176]
AknI (Streptomyces galilaeus), AAF70113, [173]
Med-ORF3 (Streptomyces sp. AM-7161),
BAC79046, [168]
Pnuc_0400 (Polynucleobacter sp. QLWP1DMWA-1), YP_001155184, [178]
SnoaB (Streptomyces nogalater), CAA12015, [179]
47 / 57
SCO7586 (Streptomyces coelicolor A3(2)),
NP_631629, [70]
49 / 60
CmmX (Streptomyces griseus subsp. griseus),
CAE17525, [172]
pSLA2-L_p075 (Streptomyces rochei),
NP_851497, [180]
Francci3_2122 (Frankia sp. CcI3), YP_481223,
[176]
MXAN_3632 (Myxococcus xanthus DK 1622),
YP_631819, [181]
SCO3914 (Streptomyces coelicolor A3(2)),
NP_628100, [70]
Franean1_3481 (Frankia sp. EAN1pec),
YP_001507789, [182]
ChlG (Streptomyces antibioticus), AAZ77686
[183]
32 / 48
44 / 55
34 / 56
48 / 63
39 / 56
44 / 57
Mlr3236 (Mesorhizobium loti MAFF303099),
NP_104388, [184]
47 / 63
ActVI-ORF2 (Streptomyces coelicolor A3(2)),
NP_629224, [70]
42 / 54
SACE_6561 (Saccharopolyspora erythraea NRRL
2338), YP_001108654, [175]
AknA (Streptomyces galilaeus), BAB72043, [185]
74 / 82
46 / 60
77 / 85
60 / 71
CgR_2799 (Corynebacterium glutamicum R),
YP_001139720, [186]
SAMT0075 (Streptomyces ambofaciens ATCC
23877), CAI78004, [187]
SAMT0075 (Streptomyces ambofaciens ATCC
23877), CAI78004, [187]
94
Ergebnisse
3.3.2.4 Inaktivierung zweier Monooxygenasegene
Unter der Annahme, dass es sich beim msc-PKS II-Cluster um das Mensacarcinbiosynthesegencluster handelt, wurde angestrebt durch die gezielte Einführung von Gendefekten neue
Mensacarcinderivate mit modifizierter biologischer Aktivität zu generieren. Eine
Derivatisierung der beiden Epoxifunktionen war dabei von besonderem Interesse. Die
Bedeutung des Oxiranrings für die biologische Aktivität von Zytostatika ist für Vertreter
unterschiedlicher Strukturklassen bekannt [188;189]. Der in der PKS II-Biosynthese selten
auftretenden Epoxidierung konnte bisher kein Enzym zugeordnet werden. Die Epoxidierung
von PKS II-Metaboliten wird lediglich als hypothetische Zwischenstufe in der Reaktion
bestimmter Oxygenasen angenommen. Dazu gehören die Dreifachhydroxylase ElmG [166]
mit dem möglichen Homolog Msc37 sowie die Luciferase ähnliche Monooxygenase SnoA / B
(= Pristinamycin PIIA-Synthase, vgl. 3.3.5.4), deren A-Untereinheit über eine Sequenzlänge
von 140 AS 27 % identische, 44 % ähnliche Aminosäuren mit Msc21 teilt (BLASTVergleich, s. 5.14). Für eine erste Geninaktivierung im dem Genom von S. sp. Gö C4/4
wurden deshalb msc37 und msc21 ausgewählt.
Inaktivierungsplasmid und Crossover
Für die Inaktivierung der ausgewählten Monooxygenasen sollte nach der schon für pok-KSα
(s. 3.2.2) erfolgreich eingesetzten [safe-knock]-Strategie (s. 5.8.2) vorgegangen werden. Dazu
wurden zunächst die Inaktivierungsplasmide p∆msc21 und p∆msc37 erstellt (s. 5.4.2.5). Die
zu inaktivierenden Gene sind auf diesen Konstrukten durch die Spectinomycinresistenz
vermittelnde Redirect-Kassette des Plasmids pIJ778 (s. 5.5.5.5) ersetzt. Das Resistenzgen und
dessen Promotor liegen dabei in Leserichtung des entsprechenden msc-Transkripts. Die
Orientierung des eingebrachten Promotors ist wichtig, um die Transkription der umgebenden
msc-Gene nicht negativ zu beeinflussen (vgl. 3.2.2). Wie unter 5.8.2.5 beschrieben, wurden
zunächst mit beiden Inaktivierungskonstrukten Mutanten von S. sp. Gö C4/4 mit erstem
Crossover erzeugt und nach vier Passagen durch Selektion auf Spectinomycinresistenz und
Apramycinsensitivität Doppelcrossover-Mutanten identifiziert. Aus je 264 in das
Selektionsraster übertragenen Kolonien konnten bezüglich msc21 zwei, für msc37 drei
Doppelcrossover-Mutanten gewonnen werden.
Eine Absicherung des Genotyps der passagierten Mutanten mit erstem Crossover sowie
jeweils einer Doppelcrossover-Mutante erfolgte durch die Isolierung von genomischer DNA
(s. 5.5.2.2) und anschließende PCR-Analyse. Mit dem Primerpaar Msc21-F / -R (s. 5.6.3.3)
wurde bezogen auf msc21 für den Wildtyp ein 1369 bp Produkt, mit mutiertem Allel ein
1728 bp Produkt, erwartet. Analog führt das Primerpaar Msc37-F / -R beim msc37Wildtypallel zu einem 1818 bp Produkt, beim mutierten Allel zu 1658 bp. In der Mutante mit
erstem Crossover liegen die Allele parallel vor (vgl. 5.8.1.2), was beide Produktgrößen
erwarten ließ. Die Gelbilder bestätigen die zunächst durch das Resistenzverhalten bestimmten
Genotypen (s. Abb. 61). Die Doppelcrossover-Mutanten wurden als S. sp. Gö C4/4 ∆msc21
bzw. ∆msc37 bezeichnet und konnten weiteren Untersuchungen zugeführt werden.
95
Ergebnisse
1818 bp
10 kb
8 kb
6 kb
5 kb
4 kb
3 kb
2,5 kb
2,0 kb
1658 bp
1,5 kb
1728 bp
1369 bp
1,0 kb
0,75 kb
0,50 kb
0,25 kb
1
2
3
L
Primer Msc37-F / -R
1: Wildtyp
2: erster Crossover
3: ∆msc37
L
4
5
6
Primer Msc21-F / -R
4: Wildtyp
5: erster Crossover
6: ∆msc21
Abb. 61: Agarosegelelektrophorese der PCR mit genomischer DNA zur Kontrolle der Crossover-Ereignisse.
Produktionsanalyse von S. sp. Gö C4/4 ∆msc21 bzw. ∆msc37
Bei den Doppelcrossover-Mutanten S. sp. Gö C4/4 ∆msc21 bzw. ∆msc37 hatte ein
Allelaustausch stattgefunden, der aufgrund der eingebrachten mutierten Allele den
Funktionsverlust der entsprechenden Proteine mit sich bringen sollte. Auswirkungen auf das
Produktionsspektrum des Stammes wurden mit den Ethylacetatextrakten von Standardkulturen (s. 5.3.1.4 und 5.11.1.1) per LC/ESI-MS (Methode: mens03, s. 5.11.6) analysiert.
Überraschenderweise zeigten die Mutanten eine nicht vom Wildtyp abweichende
Mensacarcinproduktion (Daten nicht gezeigt, vgl. Abb. 53). Nach der Abwesenheit eines
Methyltransferasegens (s. 3.3.2.3) ist dies ein weiterer Hinweis darauf, dass es sich beim
msc-PKS II-Cluster nicht um das Mensacarcinbiosynthesegencluster handelt. Die
Chromatogramme bei Absorptionswellenlängen von 254 nm, 330 nm und 400 nm wurden
daraufhin im Detail verglichen. Nur bei 400 nm ließen sich Unterschiede im Peakmuster
erkennen. Die den veränderten Peaks entsprechenden Substanzen wurden wegen des
vermuteten Zusammenhangs mit den msc-Genen als MSC-X1, -X2 bezeichnet.
Mit der "extract ions" Funktion der ChemStation Software (s. 5.14) war es möglich den
UV/VIS-Absorptionspeaks korrespondierende Signale im ESI-MS-Diagramm zuzuordnen.
Die Peaks des ESI-MS-Diagramms liegen dabei als gerätespezifische Konstante stets
0,08 min hinter den UV/VIS-Absorptionspeaks. MSC-X1 bildet negative Ionen mit dem
m/z-Wert 339, für MSC-X2 werden im negativen Detektionsmodus Signale bei m/z = 369
festgestellt. Die relative Intensität der M+1 Isotopensatelliten mit 22 % für MSC-X1 liegt im
96
Ergebnisse
erwarteten Bereich für einen C19 - C20 Körper, wenn nur Kohlenstoffatome signifikant zur
Häufigkeit von M+1 beitragen (vgl. 3.3.7.2). Im MS-Peak von MSC-X2 haben die Signale
von M+1 23 % der Intensität des Pseudomolekülions, was die Anwesenheit eines zusätzlichen
C-Atoms im Molekül andeutet.
Die UV/VIS-Absorptionsspektren von MSC-X1 und -X2 (s. Abb. 62) weisen ein
Absorptionsmaximum im sichtbaren Bereich zwischen 400 und 500 nm auf. Der Kurvenverlauf bei MSC-X1 erinnert stark an Absorptionsspektren von Anthrachinonen (vgl. 3.1).
In natürlich auftretenden Anthra- oder Naphthochinonen sind laut Thomson [97]
Absorptionsbanden über 360 nm vor allem auf α-Hydroxylgruppen zurückzuführen. Einfach
α-hydroxylierte Derivate absorbieren im Bereich von 400 - 420 nm, eine zusätzliche,
benachbarte Hydroxylierung des aromatischen Rings führt zu einer bathochromen
Verschiebung des Maximums. Eine Feinstruktur der Langwellenbande, wie im Spektrum von
MSC-X1 sichtbar, kann durch mehrfache α-Hydroxylierung verursacht werden [97]. Fast alle
bisher bekannten PKS II-Naturstoffe besitzen eine anthranoide oder vom Naphthochinon
abgeleitete, α-hydroxylierte, Struktur [23]. So überrascht es nicht, dass auch die UV/VISAbsorptionsspektren von MSC-X1 und bedingt auch MSC-X2 Merkmale dieser
Strukturklassen zeigen.
Die Produktion der beiden Substanzen findet nur in äußerst geringem Maße statt, welches die
Isolierung ausreichender Stoffmengen für die NMR-Analytik nicht zuließ.
MSC-X1 (36,7 min)
mAU
20
= 339
m/zm/z
neg.
339 neg.
235
mAU
40
258
440
15
MSC-X2 (33,6 min)
20
5
10
0
0
400
274
30
10
300
m/zneg.
= 369
m/z
369neg.
500
nm
238
300
420
400
500
nm
Abb. 62: Charakterisierung der Substanzen MSC-X1, -X2 durch Elektrospray-Massenspektrometrie und
UV/VIS-Absorptionsspektroskopie. Entnommen aus LC/MS-Läufen mit der Methode mens03 (s. Abb. 63).
Die Konzentrationen an MSC-X1 in Kulturextrakten der ∆msc21-Mutante lagen deutlich
unter denen des Wildtypextrakts (s. Abb. 63). Die Inaktivierung von msc37 beeinflusste die
MSC-X1-Konzentration nicht. Nur in den Extrakten von S. sp. Gö C4/4 ∆msc37 konnte ein
deutlicher Gehalt des Metaboliten MSC-X2 nachgewiesen werden (s. Abb. 64).
97
Ergebnisse
S. sp. Gö C4/4 Wildtyp
mAU
400 nm
10
0
0
10
MSC-X1
20
30
int.
m/z = 339 neg.
400
0
0
10
S. sp. Gö C4/4 ∆msc21
40 min.
MSC-X1
20
30
40 min.
int.
m/z = 369 neg.
400
0
0
10
mAU
400 nm
10
0
0
10
MSC-X1
20
30
int.
m/z = 339 neg.
400
0
0
10
40 min.
MSC-X1
20
30
40 min.
20
30
40 min.
int.
m/z = 369 neg.
400
20
30
40 min.
0
0
10
Abb. 63: LC/ESI-MS Analyse der Kulturextrakte von S. sp. Gö C4/4 und ∆msc21-Mutante.
S. sp. Gö C4/4 Wildtyp
mAU
400 nm
10
0
0
10
MSC-X1
20
30
int.
m/z = 339 neg.
400
0
0
10
S. sp. Gö C4/4 ∆msc37
20
30
40 min.
10
0
0
10
20
int.
m/z = 339 neg.
400
MSC-X1
0
40 min.
0
10
20
int.
m/z = 369 neg.
400
0
0
MSC-X2
MSC-X1
mAU
400 nm
10
30
MSC-X1
30
int.
m/z = 369 neg.
400
20
30
40 min.
0
0
10
40 min.
40 min.
MSC-X2
int. max.
1871
20
30
40 min.
Abb. 64: LC/ESI-MS Analyse der Kulturextrakte von S. sp. Gö C4/4 und ∆msc37-Mutante.
3.3.2.5 Inaktivierung des Gens der Ketosynthase Untereinheit β
Die Inaktivierung zweier im msc-PKS II-Cluster codierten Monooxygenasen hatte keinen
Einfluss auf die Mensacarcinproduktion (s. 3.3.2.4). Obwohl die Vermutung bereits nahe
liegt, lässt sich das msc-PKS II-Cluster mit diesem Befund noch nicht als Mensacarcinbiosynthesegencluster ausschließen. So wurde nach Oxidoreduktasegeninaktivierungen in
anderen PKS II-Clustern ohne Auswirkungen auf die Produktion des entsprechenden
Metaboliten die Redundanz der entsprechenden Gene postuliert [190]. Auch eine gegenseitige
Komplementierung der oft aus mehreren ähnlichen Untereinheiten aufgebauten Enzyme [191]
ist denkbar [192]. Die im nächsten Schritt angestrebte Inaktivierung eines Gens der
minimalen PKS sollte eine eindeutige Aussage darüber erlauben, ob die vom msc-PKS IICluster codierten Proteine für die Mensacarcinbiosynthese in S. sp. Gö C4/4 essentiell sind.
98
Ergebnisse
Inaktivierungsplasmid und Crossover
Von A. Prestel war bereits eine Inaktivierung von msc15, dem Gen der Ketosynthase
Untereinheit β, versucht worden [160]. Das eingesetzte Inaktivierungsplasmid pBSKclf−
(s. 5.4.2.5) trägt ein msc15-Allel mit Frameshift (vgl. 5.8.1.3) in der Mitte des Gens. Das erste
Crossover-Ereignis mit Integration des Plasmids in das Genom vom S. sp. Gö C4/4 konnte
nachgewiesen werden, eine Doppelcrossover-Mutante wurde selbst nach der 17. Passage
nicht erhalten [160]. Auf die passagierte Mutante mit erstem Crossover konnte zurückgegriffen werden. Nach Herstellung und Ausplattieren von Myzeldilutionen (vgl. 5.8.2.5)
wurden 264 der auf HA-Agar ohne Antibiotikazusatz gewachsenen Klone auf Apramycinsensitivität selektiert. Auf dem Chromosom von 35 sensitiven Klonen war es zu einem
zweiten Crossover-Ereignis gekommen, das zum Verlust des Resistenz vermittelnden
Vektoranteils führte. Da für diese Inaktivierung nicht die [safe-knock]-Strategie (s. 5.8.2)
verwendet wurde, finden sich unter den sensitiven Klonen sowohl Genotypen mit einem
zweiten Crossover zurück zum Wildtypallel als auch die angestrebten DoppelcrossoverMutanten, in deren Genom ein Allelaustausch stattgefunden hat. Über die Isolierung von
genomischer DNA (s. 5.5.2.2), Amplifizierung des DNA-Bereiches von msc15 mit dem
Primerpaar KS2_1 / 2 (s. 5.6.3.3) und Restriktionsanalyse (s. 5.5.4.1) des PCR-Produkts
lassen sich die apramycinsensitiven Klone genotypisieren (s. Abb. 65). Durch das Blunting
(vgl. 5.8.1.3) wurde die BglII-Erkennungssequenz durch eine ClaI-Schnittstelle ersetzt
(s. Abb. 65), wodurch unterschiedliche Fragmentgrößen beim Restriktionsverdau von
Wildtyp- und mutiertem Allel resultieren: Durch eine BglII-Restriktion wird das PCR-Produkt
mit Wildtypallel in 884 bp und 694 bp große Fragmente gespalten, im mutierten Allel
hingegen findet BglII keine Erkennungssequenz, es bleibt bei 1579 bp. Der ClaI-Verdau führt
beim PCR-Produkt mit Wildtypallel zu Spaltprodukten von 1051 bp und 524 bp. Durch die
zusätzliche ClaI-Erkennungssequenz des mutierten Allels wird das größere der beiden
Produkte in 169 bp und 887 bp gespalten. Abb. 66 zeigt die Restriktionsanalyse der ersten
zehn untersuchten apramycinsensitiven Klone. Zwei weitere Klone wurden parallel
genotypisiert (Daten nicht gezeigt). Nur die Doppelcrossover-Klone 2 und 7 haben das für
den Wildtyp erwartete Bandenmuster. Die anderen Klone entsprechen dem Genotyp einer
∆msc15 Doppelcrossover-Mutante.
99
Ergebnisse
BglII-Schnittstelle
msc15 Wildtypallel
GGCCAGA----TCTCGAT
msc15 mutiertes Allel
GGCCAGATCGATCTCGAT
ClaI-Schnittstelle
PCR-Produkt mit Wildtypallel
BglII 884
ClaI 1050
1575 bp
'msc14
msc16'
msc15
PCR-Produkt mit mutiertem Allel
ClaI 886
ClaI 1054
1579 bp
'msc14
msc 16'
msc15 mutiert
Abb. 65: Erwartete PCR-Produkte von genomischer DNA S. sp. Gö C4/4 Wildtyp und ∆msc15 mit dem
Primerpaar KS2_1 / 2.
Bgl II
1579 bp
1884 bp
1694 bp
Cla I
1051 bp
1887 bp
1524 bp
1168 bp
1 2 3 4 5 6 7 8 9 10 L
1 - 10: Doppelcrossover
L: Promega 1 kb Leiter
Abb. 66: Restriktionsanalyse der PCR-Produkte von apramycinsensitiven Doppelcrossover-Klonen mit BglII und ClaI. Eine
Bandenbeschriftung der 1 kb Leiter findet sich in Abb. 61.
100
Ergebnisse
Produktionsanalyse von S. sp. Gö C4/4 ∆msc15
Ethylacetatextrakte aus Standardkulturen von 12, bezogen auf msc15 genotypisierten,
Doppelcrossover-Klonen wurden per LC/MS analysiert. Obwohl es sich sowohl um
Wildtypen als auch ∆msc15-Mutanten handelte, ließen sich keine Unterschiede der
Mensacarcinproduktion feststellen. Letztendlich ist diese Beobachtung der Beweis dafür, dass
die Gene des msc-PKS II-Clusters nicht essentiell für die Biosynthese von Mensacarcin in
S. sp. Gö C4/4 sind. Die Schlussfolgerung ergibt sich aus der Tatsache, dass Gene für die
Biosynthese von PKS II-Metaboliten in Streptomyces spp. geclustert vorliegen [193], d. h. zu
einem abgegrenzten PKS II-Cluster gehörende Gene sind an der Biosynthese der gleichen
Substanz beteiligt. Da Msc15, als KSβ ein essentieller Bestandteil der minimalen Polyketidsynthase ist und dessen Inaktivierung die Mensacarcinproduktion nicht beeinflusst, kann
davon ausgegangen werden, dass sämtliche Gene des entsprechenden Clusters für die
Mensacarcinbiosynthese nicht essentiell sind.
Die schon bei der Inaktivierung der msc-Monooxygenasegene (s. 3.3.2.4) im
400 nm-Chromatogramm aufgefallenen Unterschiede sollten mit den ∆msc15-Mutanten
weiter verfolgt werden. Die Substanz MSC-X2 wurde weder im Wildtyp, noch in
S. sp. Gö C4/4 ∆msc15 detektiert. Dies spricht für eine Rolle von MSC-X2 als Vorläufer oder
Shuntprodukt des MSC-Endprodukts. Der Peak von MSC-X1 im 400 nm Chromatogramm
fehlt bei allen 10 Kulturextrakten der ∆msc15-Mutanten, tritt aber in den Extrakten der beiden
Doppelcrossover-Klone mit Wildtyp-Genotyp in gleicher Intensität wie auch in zuvor
analysierten Wildtyp-Kulturextrakten auf. Mit "extract ions" auf den m/z-Wert 339 im
negativen Detektionsmodus waren bei den ∆msc15-Mutanten noch Spuren von MSC-X1
nachweisbar. Ein Ausschnitt der Ergebnisse findet sich in Abb. 91. Der angenommene
Zusammenhang zwischen dem msc-Cluster und der Substanz MSC-X1 wird durch diese
Ergebnisse bestätigt. Fraglich blieb zunächst, warum auch in den Knockout-Mutanten noch
Spuren von MSC-X1 synthetisiert wurden. Durch Analyse einer Doppelmutante mit
inaktivierter minimaler PKS des msc- sowie des msn-Clusters konnte diese Frage im weiteren
Verlauf der Arbeit beantwortet werden (s. 3.3.5.2).
Weitere von der msc15-Inaktivierung abhängige Peaks wurden nach genauem Abgleich der
Chromatogramme bei Absorptionswellenlängen von 254 nm, 330 nm und 400 nm nicht
festgestellt.
In einer Produktionsanalyse unter Zusatz von 2 % DMSO wurden ∆msc15-Mutanten mit dem
Wildtyp bezüglich ihres Potentials zur Mensalon- und Aloesolproduktion (vgl. Abb. 56)
verglichen. Die Produktion dieser Metaboliten hängt nicht von Msc15 ab.
Ergebnisse
101
3.3.2.6 Homologe, ektopische Überexpression zweier msc-Regulatorgene
Mit der Gewissheit, dass das msc-PKS II-Cluster keine essentielle Rolle in der Mensacarcinbiosynthese spielt, erschienen die gentechnischen Experimente mit diesem Cluster in neuem
Licht. Abweichend vom klassischen Weg der Biosyntheseforschung, der ausgehend vom
charakterisierten Naturstoff nach dessen genetischem Ursprung sucht, liegt mit dem
msc-PKS II-Cluster eine DNA-Sequenz vor, der ein Metabolit zugeordnet werden soll. Eine
Situation, die auch als Ausgangspunkt der postgenomischen Annäherung des genome mining
vorliegt [79;194]. Bei "stillen Clustern" kann initial eine Aktivierung der Sekundärstoffproduktion notwendig sein. Dies kann durch Variation der Kulturbedingungen, gentechnisch
über Promotorenaustausch oder einen Eingriff in die Transkriptionsregulation erreicht
werden.
Mit msc24 und msc30 liegen zwei putative Regulatorgene im msc-Cluster vor, deren
abgeleitete Produkte Sequenzähnlichkeiten zu Biosyntheseweg spezifischen Transkriptionsaktivatoren der SARP (Streptomyces antibiotic regulatory protein) Familie [195] haben.
Zusätzlich ins Genom eingebrachte Kopien von SARP-Transkriptionsaktivatorgenen führen
zur spezifischen Überproduktion der entsprechenden Antibiotika bzw. Zytostatika:
actII-ORF4 bezüglich Actinorhodin und redD bezüglich Undecylprodigiosin in Streptomyces
coelicolor A3(2) sowie dnrI bezüglich Daunorubicin in Streptomyces peuceticus [196].
Mit dem Ziel einer Produktionssteigerung der Biosyntheseprodukte der Msc-Proteine sollte
die Kopienzahl der Gene msc24 und msc30 im Genom von S. sp. Gö C4/4 erhöht werden. Da
sich beide Proteinprodukte den Biosyntheseweg spezifischen Regulatoren zuordnen lassen,
sollte durch deren Überexpression die funktionelle Charakterisierung des msc-Clusters
vervollständigt werden.
Expressionsplasmide und Gentransfer
Für die ektopische Expression von Genen stehen zwei Typen von Vektoren zur Verfügung:
integrative Vektoren, basierend auf dem Integrationssystem des Phagen phiC31 [197] oder
sich in Streptomyces spp. replizierende Vektoren als high-copy oder low-copy Varianten. Die
Verwendung integrativer Vektoren hat den Vorteil des effizienten und stabilen Einbaus in das
Wirtschromosom. Da der Einbau sequenzspezifisch an attb-sites erfolgt, ist mit dem Einbau
von nur einem Plasmid pro Chromosom zu rechnen. Replikative Vektoren hingegen liegen in
mehreren Kopien vor, wodurch die Expressionseffizienz des enthaltenen Gens erhöht wird.
Sie sind jedoch selten über mehrere Passagen im Wirtsgenom stabil.
Da die Anzahl zusätzlicher Kopien bei ähnlichen Versuchen [198] keine Rolle spielte, wurde
für die Überexpression von msc24 und msc30 der integrative Vektor pSET152 (s. Tab. 35)
gewählt und die Gene dem starken konstitutiven ermE-up-Promotor [199] nachgeschaltet. So
entstanden die Expressionsplasmide pSETmsc24 und pSETmsc30 (s. 5.4.2.5), die jeweils über
intergenerische Konjugation (s. 5.7.2) in S. sp. Gö C4/4 eingebracht wurden.
102
Ergebnisse
Produktionsanalyse von S. sp. Gö C4/4 pSETmsc24 bzw. pSETmsc30
Es wurden drei unterschiedliche apramycinresistente Kolonien untersucht, die aus der
Konjugation von S. sp. Gö C4/4 mit pSETmsc24 enthaltendem E. coli 12567 pUZ8002
hervorgingen. Die mit Ethylacetatextrakten von Standardkulturen (s. 5.3.1.4, 5.11.1.1)
erhaltenen UV/VIS-Absorptionschromatogramme wurden mit denen einer parallelen
Wildtypanzucht abgeglichen. Bei zwei pSETmsc24-Integrationsmutanten kam es
erstaunlicherweise zu einer Mensacarcinüberproduktion. Diese ging einher mit einer leicht
verringerten MSC-X1-Produktion. MSC-X2 wurde wie im Wildtyp nicht produziert. Bezogen
auf den Wildtyp produzierte S. sp. Gö C4/4 pSETmsc24 4,5 Mal soviel Mensacarcin
(berechnet aus Mittelwerten der AUC des Mensacarcinpeaks im 330 nm-Chromatogramm).
Die dritte untersuchte pSETmsc24-Integrationsmutante zeigte im Gegensatz zu den ersten
beiden keine signifikanten Abweichungen vom Produktionsprofil des Wildtyps.
Von den pSETmsc30-Integrationsmutanten wurden vier verschiedene Klone in je einer
Anzucht unter Standardbedingungen untersucht. Bei drei Klonen kam es zu einer fast
vollständigen Repression der Produktion aller betrachteten Metaboliten (Mensacarcin und
MSC-X1, -X2). Auch das Anwachsen dieser Klone in Flüssigkultur war gegenüber dem
Wildtyp und allen anderen Integrationsmutanten deutlich verlangsamt. Zum Ende der
Kultivierung war aber auch hier das Medium vollständig von Myzel durchsetzt und zeigte die
für den Stamm typische schwarze Färbung (s. 3.3.1). Die vierte der pSETmsc30-Integrationsmutanten wich von den anderen ab und zeigte Wildtyp ähnliche Produktion.
Die erwartete Überproduktion der dem msc-Cluster zugeordneten Substanz MSC-X1 wurde
nicht erreicht. Stattdessen konnten interessante Informationen über die Regulatorgene msc24
und msc30 gewonnen werden. Obwohl beide Genprodukte Ähnlichkeit zu Biosyntheseweg
spezifischen Regulatoren zeigen, blieben die Auswirkungen der zusätzlich eingebrachten
Genkopien nicht auf das msc-Cluster beschränkt. Vor allem die auf das msn-Cluster (s. 3.3.5)
zurückzuführende Mensacarcinbiosynthese wurde beeinflusst, was gleichzeitig zur Reduktion
der MSC-X1-Produktion führte, wahrscheinlich aufgrund des entstandenen Mangels an
Polyketidvorläufern. Die Wirkung auf ein anderes PKS II-Cluster verwundert eigentlich nicht,
da auch für andere "Biosyntheseweg spezifische Regulatoren" eine gegenseitige Komplementierung in PKS II-Clustern bekannt ist [196]. Die Spezifität der "pathway specific"
SARPs scheint sich nicht strikt auf die Biosynthese eines bestimmten Sekundärstoffs sondern
eher auf den Typ des Biosynthesewegs (zum Beispiel PKS II) zu beziehen. Msc30, ähnlich zu
SARP-Transkriptionsaktivatoren, überraschte durch Repression der Sekundärstoffproduktion
und scheint deshalb eher eine Funktion in der negativen Regulation zu besitzen. Das
Auftreten jeweils eines Klons mit Wildtypproduktion könnte auf mangelnde Expression der
zusätzlichen Genkopien zurückzuführen sein.
Ergebnisse
103
3.3.3 PCR-basiertes Screening auf weitere PKS II-Cluster
Nach der Generierung von drei Mutanten mit unterschiedlichen Gendefekten im msc-Cluster
sowie deren Produktionsanalyse war bewiesen, dass das msc-Cluster nicht für die
Mensacarcinproduktion in S. sp. Gö C4/4 benötigt wird (s. 3.3.2). Mit hoher Wahrscheinlichkeit lag das Mensacarcinbiosynthesegencluster folglich auf einem der anderen
PKS II positiven Cosmide des Sondenscreenings (s. 3.3.2.1). Die Cosmide waren in drei
Gruppen überlappender Sequenzen eingeteilt worden [160]. Zunächst galt es, diese
Zuordnung zu überprüfen (s. 3.3.3.1) und Sequenzinformationen über die bisher unbekannten
PKS II-Cluster zu gewinnen (s. 3.3.3.2).
3.3.3.1 Einteilung der Cosmide in Gruppen überlappender Sequenzen
Um Cosmide überlappender Sequenzen zu identifizieren, wurden zwei Strategien verfolgt.
Zum einen wurde auf eine klassische Restriktionskartierung zurückgegriffen, zum anderen
kam ein PCR-basiertes Screening auf PKS II-Gene, kombiniert mit der Ansequenzierung der
PCR-Produkte, zum Einsatz.
Zur Restriktionskartierung wurden alle Cosmide als erstes mit dem Enzym BamHI
erschöpfend verdaut. Die entstandenen DNA-Fragmente wurden gemäß ihrer Größe in der
Agarosegelelektrophorese aufgetrennt und mit Ethidiumbromid detektiert. Für Cosmide,
deren Inserts sich in einem bestimmten Abschnitt überlappen, werden für diesen Bereich nach
dem Verdau Fragmente gleicher Größe erwartet. Zwei Cosmide wurden einander zugeordnet,
wenn diese mindestens vier identische Banden im Gel zeigten. Durch die BamHI-Restriktion
war bereits eine Einteilung von 15 Cosmiden in drei Gruppen möglich (vgl. Tab. 11), was auf
die Präsenz von mindestens drei PKS II-Clustern in S. sp. Gö C4/4 hindeutet. Das
sequenzierte Cos4 (msc-Contig) gehört zur Gruppe 1.
Ein weiteres Cosmid (Cos10) ließ sich durch das mit NotI und EcoRI erhaltene Bandenmuster
der Gruppe 2 zuordnen. Die verbleibenden vier Cosmide wurden mit der folgend
beschriebenen Strategie erfasst.
Die zweite Strategie fokussiert sich direkt auf die Gene der Ketosynthase Untereinheit α.
Das ksα-Gen war auch Ziel des Sondenscreenings [160] und sollte deshalb auf jedem der
20 ausgewählten Cosmide lokalisiert sein. Zwei hochkonservierte Sequenzbereiche bekannter
ksα-Gene erlauben das Ableiten von degenerierten PCR-Primern. Es wurde auf ein von MetsäKetelä et al. (1999) [200] erfolgreich eingesetztes Primerpaar zurückgegriffen (Primerpaar
KSa-F / -R, s. 5.6.3.3). Das zu erwartende Teilamplifikat des ksα-Gens hat eine Größe von
etwa 0,6 kb. Ein Produkt erwarteter Größe trat bei allen untersuchten Cosmiden auf. Für die
nicht zugeordneten sowie ausgewählte Cosmide der Gruppen 2 und 3 wurden die
0,6 kb-Fragmente nach präparativer Agarosegelelektrophorese (s. 5.5.4.2) isoliert und über
TA-Klonierung (s. 5.5.5.3) in den Sequenziervektor pGEM-T Easy insertiert. Die
Ansequenzierung mit einem Standardprimer (s. 5.6.2.1) reichte aus, um das Insert vollständig
104
Ergebnisse
zu erfassen. Einerseits konnte die per Restriktionskartierung getroffene Gruppeneinteilung
bestätigt werden sowie nicht eingeteilte Cosmide den Gruppen zugeordnet werden
(vgl. Tab. 11), andererseits wurden auf diese Weise erste Sequenzinformationen über die
bislang unbekannten Ketosynthasen der Gruppen 2 und 3 gewonnen.
Metsä-Ketelä et al. (1999) [200] erstellten mit abgeleiteten Aminosäuresequenzen der per
PCR amplifizierten Region des ksα-Gens einen phylogenetischen Stammbaum, der eine klare
Abgrenzung von Sporenpigment- zu Antibiotika- / Zytostatikabiosynthesegenen aufzeigt.
Komaki et al. (2006) [201] gingen noch weiter und ordneten die Äste in ihrem ebenfalls mit
KSα-Fragmenten erstellten Stammbaum bestimmten Cyclisierungsmodi der β-Ketidkette zu.
Über Ähnlichkeitsvergleiche auf Aminosäureebene (BLAST, s. 5.14) wurde die KSα der
Gruppe 2 als Enzym der Sporenpigmentbiosynthese klassifiziert, das abgeleitete
KSα-Fragment der Gruppe 3 hat Ähnlichkeit mit Anguzyklin-, Anthrazyklin- und
Aureolsäureketosynthasen. Das Cluster der Gruppe 3 (ab jetzt msn-Cluster genannt) war
somit der heißere Kandidat für die Gene der Mensacarcinbiosynthese. Das möglicherweise für
die Sporenpigmentbiosynthese verantwortliche Cluster der Gruppe 2 (ab jetzt mec-Cluster
genannt) sollte jedoch ebenfalls weiter untersucht werden.
Cos13 konnte nicht eingruppiert werden. Sein Restriktionsmuster wich von dem der anderen
Cosmide ab. Mit der ksα spezifischen PCR wurde eine sehr geringe Produktkonzentration
erhalten, die einer Sequenzierung nicht zugänglich war. Mit BamHI-Fragmenten von Cos13
wurden vier Subklone erstellt, die fast das gesamte Cosmid abdecken. Die beidseitige
Ansequenzierung erbrachte ausschließlich Ähnlichkeiten mit Primärstoffwechselgenen.
Cos13 wurde deshalb als falsch-positiver Treffer des Sondenscreenings angesehen.
Tab. 11: Einteilung der PKS II positiven Cosmide aus S. sp. Gö C4/4.
Gruppe 1 (msc-Cluster)
Cos1+, Cos4+*, Cos6+,
Cos9+*, Cos14+, Cos15+,
Cos16+
Gruppe 2 (mec-Cluster)
Cos3+, Cos5*, Cos8+,
Cos10++, Cos11+, Cos12+*,
Cos19+*
Gruppe 3 (msn-Cluster)
Cos2*, Cos7+*, Cos17+*,
Cos18+*, Cos20*
Cos13 lässt sich keiner der drei Gruppen zuordnen.
+
Zuordnung über Restriktionskartierung mit BamHI.
++
Zuordnung über Restriktionskartierung mit NotI sowie EcoRI.
* Zuordnung durch Ansequenzierung des mit dem Primerpaar KSa-F / -R entstandenen 0,6 kb PCR-Produkts
oder Sequenzierung eines Abschnitts auf dem Cosmid.
Abweichungen zu den 2002 von A. Prestel [160] getroffenen Zuordnungen ergaben sich für
Cos2 (vormals keine Zuordnung), Cos13 (vormals Gruppe 2) und Cos20 (vormals Gruppe 1).
Ergebnisse
105
3.3.3.2 Informationsgewinn durch Subklonansequenzierung
Von Cosmiden der Gruppen 2 und 3 wurden 11 bzw. 29 unterschiedliche Subklone erstellt
(s. 5.5.5.2). Die beidseitige Ansequenzierung der Inserts mit Standardprimern (s. 5.6.2.1)
offenbarte erste Einblicke in die Organisation des mec- und msn-Clusters. Die Lage der
Subklone in den später vollständig sequenzierten Clustern bzw. durch Datenbankabgleich
(BLAST, s. 5.14) ermittelte Ähnlichkeiten der abgeleiteten Proteine sind unter 5.4.2.4
angegeben.
Zuerst wurden BamHI-Subklone ausgewählter Cosmide beider Gruppen erstellt. Die
Sequenzen von Subklonen der Gruppe 2 stammen fast ausschließlich von Genen des
Primärmetabolismus. Einzig ein abgeleitetes Polyketidhydrolasefragment mit Ähnlichkeit zu
entsprechenden Enzymen der Sporenpigmentsynthese (Subklon G2B4,2, s. 5.4.2.4) diente als
Indiz für die Präsenz eines PKS II-Clusters auf den entsprechenden Cosmiden. Sollte es sich
beim mec-Cluster wirklich um ein Sporenpigmentbiosynthesegencluster handeln, wäre dieser
Befund erklärbar, denn diese Cluster bestehen nur aus wenigen Genen (s. 3.3.4.1).
Für Gruppe 3 ergaben sich aus den BamHI-Subklonen keine Daten, die direkt auf einen
Zusammenhang mit der Polyketidsynthese hindeuteten. Es wurden vor allem Gene der
S-Adenosylmethioninregeneration gefunden. Sukzessive wurden weitere, mit anderen
Enzymen gewonnene, Cosmidfragmente subkloniert und ansequenziert, was letztlich beide
Cluster als PKS II-Cluster identifizierte. Bemerkenswert ist hier das Auftreten eines Methyltransferasegens sowohl im mec- als auch msn-Cluster, ein Gen, das eine essentielle Rolle in
der Mensacarcinbiosynthese spielt und im msc-Cluster vergeblich gesucht wurde (s. 3.3.2.3).
Vor der Entscheidung über eine Cosmidsequenzierung sollten noch mehr Information über
die Kernbestandteile der Cluster erhalten werden. Es wurde angestrebt, sich ausgehend vom
ksα-Gen per Primerwalking (s. 5.6.2.2) entlang der Clustersequenz voranzuarbeiten. Cosmide
G+C-reicher Genome sind jedoch nur bedingt zum Primerwalking geeignet: im Bereich der
ca. 40 kb großen Inserts bilden sich häufig DNA-Sekundärstrukturen, welche die
Sequenzierung beeinträchtigen. Des Weiteren nimmt mit der Sequenzlänge die
Wahrscheinlichkeit ähnlicher oder gar repetitiver Basenabfolgen zu, was die eingesetzten
Sequenzierprimer auch an ungewollten Bereichen binden lässt. Es mussten deshalb Subklone
identifiziert werden, die das ksα-Gen tragen. Alle 40 Subklone wurden mit den oben
beschriebenen degenerierten Primern (KSa-F / -R, s. 5.6.3.3) überprüft. ksα positive Subklone
der Gruppe 2 waren C12Pst-6, C12Not7 das ksα-Gen der Gruppe 3 trägt C7Nco5 (s. 5.4.2.4).
Die Verfügbarkeit dieser Subklone war wegbestimmend für die weiteren Experimente, wie
die vollständige Sequenzierung des mec-Clusters per Primerwalking (s. 3.3.4.1) oder Geninaktivierungen in den beiden neuen PKS II-Clustern (s. 3.3.4.2, 3.3.5.2).
106
Ergebnisse
3.3.4 Analyse des mec-Clusters (Sporenpigmentsynthese)
Die phylogenetische Einordnung der Mec-Ketosynthase Untereinheit α und der Datenbankabgleich von Subklonsequenzdaten legten eine Funktion des mec-Clusters in der
Sporenpigmentsynthese nahe (s. 3.3.3). Gleichzeitig konnte durch die Präsenz eines
Methyltransferasegens (s. 3.3.3.2) eine Beteiligung an der Mensacarcinproduktion nicht
ausgeschlossen werden.
3.3.4.1 Sequenzierung und Sequenzanalyse des mec-Clusters
Sequenzierung und Annotierung
Das längste publizierte Sporenpigmentbiosynthesegencluster ist mit einer Ausdehnung
über 8,4 kb das spp-Cluster aus dem vollständig sequenzierten Genom des Stammes
Streptomyces avermitilis MA-4680 [69;202]. Auch für das mec-Cluster auf den Cosmiden der
Gruppe 2 wurde deshalb maximal eine ähnliche Länge angenommen. Solche recht kurzen
DNA-Abschnitte lassen sich per Primerwalking (s. 5.6.2.2), basierend auf Ansequenzierungen
mit dem Sanger-Verfahren, erfassen. Primerwalking ist jedoch, bedingt durch die nur
sukzessive möglichen Walkingschritte, mit hohem personellen Aufwand und Zeitbedarf
verbunden. Auch die Qualität des über große Bereiche nur durch eine Sequenz abgedeckten
Contigs bleibt unter jener der alternativ möglichen vollständigen Cosmidsequenzierung mit
Shotgunklonierung / Sanger-Verfahren (4 - 8-fach Abdeckung) oder Pyrosequenzierung
(30 - 40-fach Abdeckung) [203]. Da das Primerwalking die geringsten Fremdkosten
verursacht und geeignete Subklone zur Verfügung standen, wurde diese Strategie zur
vollständigen Sequenzierung des mec-Clusters gewählt.
1
mec-Sequenzfragmente
Subklone
2
3
4
5
6
ksα
G2B4,2 (4,2 kb)
Bam HI
C12Not7 (7 kb)
Not I
Bam HI
C12Pst-6 (3 kb)
Pst I
Pst I
C12Not4 (4 kb)
Not I
Not I
Abb. 67: Abdeckung des mec-Clusters durch benachbarte Subklone. Einige Sequenzfragmente lagen durch
Subklonendsequenzierungen oder ksα-Screening (s. 3.3.3) bereits vor und dienten als Ausgangspunkt (1 - 6) für
ein Primerwalking auf den Subklonen.
Die von Cos12 stammenden Subklone C12Not7 und C12Pst-6 waren beide im PCRScreening ksα positiv. Sofern nur ein PKS II-Cluster auf Cos12 lokalisiert ist, tragen sie
überlappende Insertsequenzen. Über eine PstI-Restriktionsanalyse (s. 5.5.4.1) von C12Not7
konnte die 3 kb große Insertsequenz von C12Pst-6 etwa in der Mitte des C12Not7-Inserts
positioniert werden. Die damit verbundene ebenfalls mittige Lage des ksα-Gens auf C12Not7
war ein glücklicher Zufall, der für die spätere Inaktivierung des Gens ideale
Ausgangsbedingungen schuf (s. 5.8.2.2). Mit C12Not4 stand auf der rechten Seite ein NotIAnschlusssubklon zur Verfügung, dessen Insert laut Datenbankabgleich (BLAST, s. 5.14) das
107
Ergebnisse
in diesem Bereich liegende Gen nahtlos fortführt. Da C12Not7 und G2B4,2 je an einem
Insertende ein WhiE VIII ähnliches Protein codieren (s. u.) wurde angenommen, dass sich das
mec-Cluster auf G2B4,2 fortsetzt. Zwischen beiden Subklonen blieb jedoch ein nicht
abgedeckter Bereich von ca. 0,5 kb Länge. Die jeweils für die äußeren Enden der C12Not4und G2B4,2-Inserts erhaltenen Sequenzdaten zeigten keine Ähnlichkeiten zu PKS II
assoziierten Enzymen. Dies weist darauf hin, dass die gesamte Ausdehnung des mec-Clusters
durch die vorhandenen Subklone erfasst wird.
Ausgehend von sechs in Abb. 67 markierten DNA-Bereichen wurden Sequenzierprimer für
die ersten Schritte des Primerwalkings abgeleitet. Der 0,5 kb-Bereich zwischen C12Not7 und
G2B4,2 konnte auf Cos12 und Cos19 sequenziert werden. Alle von Ausgangspunkt 2
gestarteten Sequenzierläufe brachen immer genau nach der gleichen Base plötzlich ab
(s. Abb. 69 A, Sequenz C12Not7/uni). Dieses Phänomen wird als "full stop" oder "hard stop"
bezeichnet und deutet auf stabile DNA-Sekundärstrukturen hin. Auch Variationen in der
Zusammensetzung des Sequenzieransatzes, wie der Zusatz von 5 % DMSO zur
Destabilisierung der Sekundärstrukturen, brachten keine Verbesserung. Auch das
Primerwalking von Ausgangspunkt 3 (s. Abb. 67) näherte sich der Stelle des Sequenzabbruchs, wobei ebenfalls stets ein full stop auftrat (s. Abb. 69 A, Sequenz C12Not7/G2L1-R4).
Interessanterweise sind übliche für die PCR eingesetzte Polymerasen (vgl. 5.6.1.1) oft in der
Lage auch über DNA-Sekundärstrukturen hinweg zu arbeiten [204]. Letztendlich war dies der
entscheidende Hinweis zum Schließen der Sequenzlücke. Nach mehreren erfolglosen
Sequenzierversuchen
auf
größeren
PCR-Produkten
(zum
Beispiel
L1,
s. 5.6.3.3) ging ein Sequenzierlauf auf dem 0,3 kb Produkt L1a über die Lücke hinweg
(Abb. 68 L1a/uni). Auch eine weitere Lücke (Abb. 68 und Abb. 69, im Bereich von H2)
wurde erst durch Sequenzierung auf einem PCR-Produkt (L2, s. 5.6.3.3) geschlossen.
Die lückenlose Clustersequenz wurde mit der Frameplot-Funktion der Artemis Software,
durch die Identifizierung von Ribosomenbindungsstellen, Start- und Stoppcodons sowie
einem Sequenzabgleich mit der NCBI-Datenbank annotiert (s. Abb. 72). Die rechte
Begrenzung des Clusters lässt sich durch das Gen mecVIII definieren. Auf einer Sequenzlänge
von 0,5 kb stromaufwärts von mecVIII wurden keine Genprodukte mit signifikanter
Ähnlichkeit zu publizierten Proteinen festgestellt (NCBI-Datenbank). Auch die vollständig
sequenzierten Sporenpigmentbiosynthesegencluster whiE, pksa, spp (s. Abb. 72) werden
durch mecVIII-Analoga begrenzt. Auf der linken Seite ist das putative O-Methyltransferasegen mecIX das äußerste Gen mit direktem Bezug zur Polyketidbiosynthese. Die angrenzende
Sequenz zeigt Ähnlichkeit zu Genen, die für sekretierte Proteine codieren.
Tab. 12: Ermittelte open reading frames des mec-Sporenpigmentbiosynthesegenclusters auf dem mec-Contig.
Angenommene Proteinfunktionen sind in Abb. 72 angegeben. AS: Größe des Genprodukts in Aminosäuren.
ORF
mecVIII
mecI
mecII
mecIII
mecIV
Contigposition
488 - 2191
2787 - 3941
4067 - 4519
4516 - 5784
5781 - 7031
AS
567
384
150
422
416
ORF
mecV
mecVI
mecVII
mecIX
Contigposition
7101 - 7358
7360 - 7839
7889 - 8221
9272C - 8277C
AS
85
159
110
331
108
Ergebnisse
P
0 [bp]
N N
B
1000
H1
2000
G2B4,2/G2B4,2-R2
G2B4,2/rev
Cos12/G2Hyd-F1
Cos12/G2Hyd-R1
Cos19/G2Hyd-R1
Cos19/G2Hyd-F1
L1/G2L1-R5
C12Not7/uni
L1a/uni
C12Not7/G2L1-R4
L1pGem/G2L1-R4
C12Not7/KSaG2-R5
P B
2600
3600
4600
C12Not7/KSaG2-R5
L1pGem/G2L1-R3
L1pGem/G2L1-R2
C12Pst-6/rev
L1pGem/G2L1-F2
C12Not7/KSaG2-R3
C12Pst-6/KSaG2-R1
Cos19/KSaG2-R2
C5KSa-pGem/uni
P
5200
6200
Cos19/KSaG2-F2
Cos12/KSaG2-F1
7200
C5KSa-pGem/uni
C12Pst-6/uni
Cos12/KSaG2-F3
C12Not7/KSaG2-F5
7800
L2/C12Not7-R2
H2
8800
N
C12Not7/KSaG2-F4
C12Not7/KSaG2-F6
P
9800
C12Not7/KSaG2-F6
L2/KSaG2-F7
C12Not7/C12Not7-R2
C12Not7/C12Not7-R1
C12Not7/rev
C12Not4/rev
C12Not4/C12Not4-R1
Abb. 68: Contigstrategie des mec-Clusters. Die durch Primerwalking oder durch Subklonansequenzierung
erhaltenen Sequenzen sind als Pfeile dargestellt. Endonukleaseerkennungsstellen: B: BamHI, N: NotI, P: PstI.
H1 / H2: hairpins (vgl. Abb. 69). Sequenzname: [Name des Subklons oder PCR-Produkts / Verwendeter Primer]
(s. 5.6.3.3, 5.4.2.4). Die roten Sequenzen führten zur Sequenzierung von H1 / H2. Grüne Sequenzen stammen
aus der zufälligen Subklonansequenzierung oder dem ksα-Screening mit degenerierten Primern (s. 3.3.3).
109
Ergebnisse
Organisation der Transkription
Die gewonnenen Sequenzdaten in den Bereichen von H1 und H2 (s. Abb. 69) offenbarten das
Vorliegen von jeweils dicht beieinander liegenden invertierten Wiederholungen kurzer
Basenfolgen (inverted repeats). Diese Konstellationen sind unter dem Begriff imperfekte
Palindrome bekannt. Sie neigen zur Ausbildung von aus einem Einzelstrang bestehenden
Haarnadelstrukturen (hairpins), die sich vom Beginn der ersten Sequenz bis zum Ende der
Wiederholung erstrecken können. Die inverted repeats formen dabei den Stil, die
zwischenliegende Sequenz eine Schleife. Die Stile von H1 / H2 weisen einen erstaunlich
hohen G+C-Anteil auf. H1: 100 % G+C, H2: 94 % G+C. Da sich pro G-C-Paar drei Wasserstoffbrücken ausbilden können, widerstanden die hairpins den Sequenzierversuchen wohl
derart hartnäckig.
Innerhalb der imperfekten Palindrome, welche die postulierten hairpins H1 und H2 bilden,
treten pro hairpin zwei echte Palindrome auf (s. Abb. 69, farbig gekennzeichnet). Bei H1 sind
diese im Stil, bei H2 eher im Bereich der Schleife lokalisiert, ein weiteres Palindrom grenzt
unmittelbar an H1.
│
ACCACCCTGCTGGCGACGGCCTGACCCCACCTCACACGGCCGg
Leserichtung
B
2238
2209
A
H1
C12Not7/uni
ACA
ACA
G-C
G-C
G-C
C-C
C-G
H1 C-G
C-G
G-C
G-C
C-G
C-G
G-C
2209 G-C
C-G
2238
C-G
G-C
2266
G-C
C-G
A
C
CTCAC
GTCAT ....//.... GCGGTGCGCACCGC
│
ccGGCCGCGTCATGCGGTGCCCGCCATCGTGCGGTGCGCAC
C12Not7/G2L1-R4
AA
G
C
C
G
G
C
T
G
G-C
C-G
A- T
C-G
H2 G-C
G-C
G-C
C-G
C-G
G-C
C-G
C-G
8230 G-C
G-C
G-C
C-G
T
T
GCGGT
CCCCG
Abb. 69: A: Fluorenszenzchromatogramme der Sequenzierversuche von beiden Seiten des hairpins H1.
(Bezeichnung der Sequenzen vgl. Abb. 68) B: H1 enthält zwei 12 nt lange palindromische Bereiche beidseitig
des hairpin-Stils (violett bzw. blau). Eine weitere 14 nt lange palindromische Sequenz (grün) schließt sich in
unmittelbarer Nähe an. Der Stil des postulierten hairpin H2 erstreckt sich über 16 nt. Auch hier wurden zwei
Palindrome identifiziert (braun, beige); sie liegen im Kopfbereich von H2. Die Zahlen geben die Position auf
dem mec-Contig wieder.
110
Ergebnisse
Haarnadelstrukturen können zum Abbruch der DNA-Transkription führen [205]. In Einklang
mit dieser Eigenschaft liegt H2 am Ende zweier Operons (s. Abb. 71). Auch für H1 kann eine
Funktion als Transkriptionsterminator postuliert werden. Die Analoga der von H1 getrennten
Gene mecVIII und mecI liegen meist in divergenter Orientierung vor (s. Abb. 72).
Bei divergenter Orientierung können im intergenen Bereich zwischen VIII und I (bzw. deren
Analoga) die Promotoren p2 und p1 identifiziert werden [206;207]. Interessanterweise
befindet sich im nur wenige bp langen Bereich zwischen p2 und p1 eine hochkonservierte
Basenfolge (vgl. Abb. 70). Was im DNA-Sequenzalignment der p2-Bereiche ebenfalls auffällt ist die geringe Ähnlichkeit der −35-Region. Es ist bekannt, dass bakterielle Promotoren
mit geringem Konsensus der −35-Region von Transkriptionsaktivatoren abhängig sind. Diese
binden an einer Sequenz stromaufwärts oder überlappend mit der −35-Region [208]. Wegen
des geringen Abstands der divergenten p2 und p1 in den bisher untersuchten Clustern konnte
der konservierte Bereich keinem Promotor exklusiv zugeordnet werden. Die Analyse der mecSequenz ergab, dass die konservierte Basenfolge nur einmal im Cluster vorliegt - unmittelbar
stromaufwärts von p2, wodurch sich dieser Bereich nun dem p2-Promotor zuordnen lässt.
konservierter
Bereich
p2-Promotor
−35
Start whiEVIII
Homolog
−10
mec
pksa
CCTCTAAGCGGGTGA-AGCCTGCGCTCCGGTGGGTGGTGCGGGGCATGGATGAAGCCCC------47bp------ATG
GCAGCAGGCGGGTGA-AGCCTGAGCCACTGTCACCTTCCCGGGGCATGCATGAGGATCT------50bp------ATG
whiE
whiESa
sch
GGGTTAAGCGGGTGA-AGCCTGCGCCGTGGCGGGCCCCGACGGGCCGTA-CGGGGCATGCATGAG----150bp-ATG
GGATCAAGCGGGTGACAAGACGCGACTCGCCCGGGCAAGAACCCTGATCG-GGGGCATAAGGCGTCCA--34bp-ATG
GGGTTAAGCGGGTGA-AGTGTGGTCCCCGGCGCACCGCGCTCCAGCCTCGCGGGGCATGCATGACCCC-169bp-ATG
spp
GGGTGAAGCGGGTGA-AACCGCACGGGTGAAGCGGGTGGAACAGAGGCTGAACCAGCCGGGTGAAT-----------------------------GGGGCGAGCGAACCCCTCCCGTCGGGGCATGGACTCCCT--108bp-GTG
−35
−10
−35
TSP
−10
Abb. 70: Bereiche des p2-Promotors in Sporenpigmentbiosynthesegenclustern. Der konservierte Bereich
stromaufwärts der −35-Region, eine putative Regulatorbindestelle zwischen den divergent orientierten p1- und
p2-Promotoren des whiE-, whiESa-, sch- und spp-Clusters, wird aufgrund einer vergleichenden Analyse mit dem
mec- und pksa-Cluster dem p2-Promotor zugeordnet. TSP: Transkriptionsstartpunkt (unterstrichen, falls
bekannt). Die Clusterkürzel werden bei Abb. 72 erläutert.
p2
H1
p1
H2
mec
VIII
1 kb
Operon 2
I
II
III
IV
V VI VII IX
Operon 1
Abb. 71: Hypothetische Operons des mec-Cluster. H1 / H2: hairpins; p2 / p1: Promotoren.
Operon 3
111
Ergebnisse
Bisherige Transkriptionsstudien offenbarten unterschiedliche Regulationsmechanismen für
die von p2 und p1 kontrollierten Operons. So scheint nur p2 vom späten Sporulationssigmafaktor σF abhängig zu sein [206;207]. Von diesem Befund abgeleitet ist auch bezüglich
des mec-Clusters von einer differenzierten Transkription der postulierten Operons 1 und 2 und
damit von der Präsenz eines p1 analogen Promotors auszugehen (s. Abb. 71).
Das dritte Operon des mec-Clusters enthält das putative Methyltransferasegen mecIX.
Funktion der abgeleiteten Mec-Proteine
Ein Abgleich der abgeleiteten Mec-Genprodukte mit der NCBI-Datenbank offenbarte eine
herausragende Sequenzähnlichkeit mit Proteinen der Sporenpigmentbiosynthese in Arten der
Gattung Streptomyces. Mit dem BLAST-Algorithmus (s. 5.14) wurden stets Werte zwischen
70 % und 90 % identischer Aminosäuren ermittelt, wobei das entsprechende Mec-Protein
möglichst global mit dem analogen Sporenpigmentbiosyntheseprotein höchster Ähnlichkeit
verglichen wurde. Darunter waren vor allem Enzyme die durch das spp oder pksa Cluster
codiert werden. Wie aus Abb. 72 hervorgeht unterliegen alle Sporenpigmentbiosynthesegencluster einer konformen Organisation. Allein mecVIII und Analoga sind unterschiedlich
orientiert. Die Methyltransferase (MecIX und Analoga) ist fakultativ.
Hydroxylase
KSα
Monooxygenasen
S. sp. Gö C4/4
mec
S. collinus
pksa
S. avermitilis
spp
S. coelicolor
whiE
S. aureofaciens
whiESa
S. halstedii
sch
S. curacoi
cur
VIII
KSβ ACP
Methyltr.
Aromatase Cyclase
I
II
III
IV
V VI VII IX
7
8*
9
1
2
3 4 5
F
G
H
A
B
C D E 2843**
I
II
III
IV
V VI VII
I
II
III
A
B
1
2
3 4'
D
C
A
B
E FG
VIII
'VIII
'C
1 kb
6
IV'
Abb. 72: Clusteralignment bisher bekannter Sporenpigmentbiosynthesegencluster. S. sp. Gö C4/4 (diese Arbeit),
Streptomyces collinus DSM2012 [209] *pksa8 ist ein Pseudogen mit internem Stoppcodon, vermutlich ein
Sequenzfehler, Streptomyces avermitilis MA-4680 [69] ** das Gen SAV_2843 wurde nicht als Bestandteil des
spp-Clusters definiert, Streptomyces coelicolor A3(2) [210], Streptomyces aureofaciens CCM3239 [207],
Streptomyces halstedii [211], Streptomyces curacoi [212]. Methyltr. : Methyltransferase.
112
Ergebnisse
Alle bisherigen Versuche, Sporenpigmente für die chemische Charakterisierung zu isolieren,
schlugen fehl [213]. Deshalb ist die native Funktion der Biosyntheseenzyme nicht definitiv zu
bestimmen. Die AS-Sequenzähnlichkeiten mit funktionell charakterisierten Proteinen der
Biosynthese aromatischer Antibiotika / Zytostatika aus dem PKS II-Metabolismus lässt
jedoch auch für Sporenpigmente von einer ähnlichen chemischen Grundstruktur ausgehen.
Das Kernelement der Sporenpigmentbiosynthesegencluster stellen die Gene der minimalen
Polyketidsynthase dar. Sie setzt sich aus mecIII (KSα), mecIV (KSβ) und mecV (ACP)
zusammen und legt in erster Instanz die Länge der β-Ketidkette fest [24]. Die heterologe
Expression der Gene der minimalen PKS des whiE-, sch- oder cur-Clusters führte zur Bildung
aromatischer Dodecaketide (C24-Körper) im Wirtsbakterium. Daneben traten Decaketide auf,
wenn nicht zusätzlich die mögliche Aromatase WhiE-ORFVI exprimiert wurde, weshalb
diesem Enzym eine stabilisierende Wirkung auf die minimale PKS zugeschrieben wird [213].
Auch native Sporenpigmente scheinen sich aufgrund dieser Ergebnisse von Dodecaketiden
abzuleiten. Das MecVI analoge Enzym WhiE-ORFVI wurde als Cyclase / Aromatase
definiert, da es sowohl die Regioselektivität der ersten Cyclisierung beeinflusst, als auch die
Aromatisierung des zweiten Rings katalysiert [214]. Die Funktion der Cyclase ähnlichen
MecVII homologen Enzyme ist nicht bekannt. Auch für das MecII analoge WhiE-ORFII
wurde zunächst eine Cyclaseaktivität postuliert [215], in vitro wurde dieses Enzym jedoch
später als neuer Typ Chinon bildender Monooxygenasen charakterisiert [216]. Das zweite
Enzym mit AS-Sequenzähnlichkeiten zu Monooxygenasen ist MecI; die Sequenz offenbart
eine "antibiotic biosynthesis monooxygenase"-(Pfam03392)-Domäne [217], ist aber wie
analoge Enzyme aus der Sporenpigmentbiosynthese mit 394 AS deutlich größer als ähnliche,
meist Kofaktor unabhängige Enzyme mit Pfam03392-Domäne zu denen auch die
Anthronoxygenasen zählen (vgl. 3.3.5.4). Wegen des Größenunterschieds wird über eine
NAD(P) Bindungsstelle der MecI orthologen Sporenpigmentmonooxygenasen spekuliert
[217]. WhiE-ORFI scheint außerdem eine Rolle beim Transport des Polyketids in die Sporen
oder dessen dortige Verknüpfung zu spielen [210;213]. Das von mecVIII abgeleitete Protein
ist einer Dichlorphenolhydroxylase aus Alcaligenes eutrophus ähnlich, Mutationen von whiEORFVIII führten zu einer Veränderung der Sporenfarbe [211;213]. Ein Zusammenhang der
Hydroxylase mit der Sporenpigmentsynthese ist dadurch bestätigt. Unbekannt ist die Funktion
der nur fakultativ auftretenden putativen Methyltransferase (MecIX und Analoga).
Regulatorgene auf lokaler Ebene sucht man in allen Sporenpigmentbiosynthesegenclustern
vergebens. Wie schon sehr frühe Experimente mit Streptomyces spp. zeigten unterliegt die
Sporenpigmentation eher einer pleiotropen, als spezifischen Regulation [21].
Ergebnisse
113
3.3.4.2 Funktionsbeweis durch Geninaktivierung
Wie die Erfahrung mit dem msc-Cluster zeigt (s. 3.3.2), können Sequenzanalysen keinen
Funktionsbeweis erbringen. Dies ist einzig durch Geninaktivierung möglich. Akzeptiert wird
allgemein auch ein Rückschluss auf die native Proteinfunktion ausgehend von Ergebnissen
einer heterologen Expression oder eines In-vitro-Experiments. Die heterologe Expression von
Cosmiden des mec-Clusters wird unter 3.3.5.1 beschrieben. Die Inaktivierung des Gens
mecIII (ksα) als Nachweis einer Funktion des mec-Clusters in der Sporenpigmentbiosynthese
von S. sp. Gö C4/4 ist Thema des folgenden Abschnitts.
Erstellung des neuen Redirect-Plasmids pIJ774Spec
Die bisher im Rahmen der [safe-knock]-Strategie (s. 5.8.2) eingesetzten Redirect-Kassetten
können aufgrund flankierender FRT-sites optional per Flp-Rekombination (s. 5.9) entfernt
werden. Im Verlauf der Arbeiten zeigte sich die auf loxP-sites basierende Cre-Rekombination
jedoch als deutlich effektivere Methode [156]. Das analog zu pIJ785Spec erstellte
Plasmid pIJ774Spec (Konstruktion s. 5.4.2.1) vereint die loxP-sites von pIJ774 mit der
Spectinomycinresistenzkassette von pIJ778. Für alle folgenden Inaktivierungen wurde die
Redirect-Kassette des neuen Plasmids pIJ774Spec verwendet.
Inaktivierungsplasmid und Crossover
Die Arbeiten zur Geninaktivierung wurden begonnen als erst Bruchstücke der
mec-Clustersequenz vorlagen. Vom Subklon C12Not7 war bekannt, dass in der Mitte seines
7 kb großen Inserts das ksα-Gen mecIII liegt (s. 3.3.3.2). C12Not7 war damit ideal als
Ausgangspunkt für eine Inaktivierung von mecIII nach der [safe-knock]-Strategie geeignet
(s. 5.8.2.2). Bei der Konstruktion des Inaktivierungsplasmids p∆mecIII wurde ein 0,7 kb
großer, interner Sequenzabschnitt von mecIII durch die Redirect-Kassette von pIJ774Spec
ersetzt (s. 5.4.2.5). Die eingebrachte Resistenzkassette liegt auf p∆mecIII bewusst nicht in
Leserichtung des Zielgens, um nach Integration ins Genom auch die Transkription mecIII
nachgeschalteter Gene des gleichen Operons zu stören (vgl. 5.5.5.5). So sollte die schon
häufig beobachtete Kreuzkomplementierung von PKS II-Genen [218] vermieden werden.
Aus diesem Grund wurde die Mutation auch nicht in den Wildtyp S. sp. Gö C4/4, sondern in
eine ∆msc15-Mutante (mit inaktiviertem ksβ-Gen des msc-Clusters, s. 3.3.2.5) eingeführt. Ziel
der Inaktivierung war nicht die Aufklärung einer bestimmten Genfunktion (mecIII), sondern
ein eindeutiger Funktionsnachweis für das mec-Cluster. Der Transfer des mutierten
mecIII-Allels sowie die Selektion von Klonen nach erstem, bzw. zweitem Crossover erfolgte
gemäß 5.8.2. Von 88, nach vier Passagen (flüssig→fest→flüssig→fest) in ein Selektionsraster
übertragenen, spectinomycinresistenten Klonen wurden zwei Klone als apramycinsensitiv
identifiziert. Für einen Klon wurde das mit Allelaustausch verbundene zweite CrossoverEreignis per PCR überprüft. Mit dem Primerpaar C12KSA-F / -R (s. 5.6.3.3) wurde vom
Wildtypallel ein 1050 bp Produkt, vom mutierten Allel ein 1744 bp Amplifikat erwartet. Als
114
Ergebnisse
Matrize für die PCR-Analyse diente genomische DNA der Stämme (s. 5.5.2.2) bzw. das
Inaktivierungsplasmid p∆mecIII. Das Bild der Gelelektrophorese bestätigte über die
detektierten Produktgrößen den Genotyp von Erst- und Doppelcrossover-Mutante bezüglich
mecIII (s. Abb. 73). Die Doppelcrossover-Mutante wurde S. sp. Gö C4/4 ∆msc15 ∆mecIII
genannt.
10 kb
8 kb
6 kb
5 kb
4 kb
3 kb
2,5 kb
2,0 kb
1,5 kb
1744 bp
1050 bp
1,0 kb
0,75 kb
0,50 kb
0,25 kb
1: S. sp. Gö C4/4
2: p∆mecIII
3: S. sp. Gö C4/4 ∆msc15
p∆mecIII erster Crossover
4: S. sp. Gö C4/4 ∆msc15
∆mecIII Doppelcrossover
L: 1 kb Leiter (Promega)
1
2
3
4
L
Abb. 73: Agarosegelelektrophorese der PCR-Ansätze zur Genotypisierung bezüglich mecIII.
Analyse der Mutante S. sp. Gö C4/4 ∆msc15 ∆mecIII
Auf HA-Agar kultiviert beginnt S. sp. Gö C4/4 nach 4 - 5 Tagen mit dem Wachstum eines
weißen Luftmyzels, das Fäden von unigenomischen, austrocknungsresistenten Sporen
ausbildet. Die weiße Färbung der Kolonieoberfläche bleibt nur wenige Stunden bestehen.
Eine durch Sporenpigmente bedingte Graufärbung setzt ein.
Beim Passagieren der S. sp. Gö C4/4 ∆msc15 p∆mecIII Erstcrossover-Mutante konnte dieser
Farbwechsel noch beobachtet werden. Nach dem zweiten Crossover-Ereignis hatte der Stamm
S. sp. Gö C4/4 ∆msc15 ∆mecIII die Fähigkeit seine Sporen grau zu pigmentieren verloren.
Die Kolonieoberfläche der Doppelcrossover-Mutante blieb weiß mit einem schwachen
Gelbstich. Die Oberflächenmorphologie ähnelt der des Wildtyps, erscheint aber weniger
regelmäßig. Der sich über der Agaroberfläche befindliche Teil der Kolonie ist im Gegensatz
zum kissenartig, lockeren Wildtyp eher zusammengedrückt. Auch nach 14tägiger Inkubation
(28 °C) von S. sp. Gö C4/4 ∆msc15 ∆mecIII kommt es nicht zur Graufärbung der Kolonie.
Der angestrebte Funktionsbeweis des mec-Clusters ist damit erbracht. Den Genen kann eine
Funktion bei der Sporenpigmentierung zugeordnet werden.
Zu erklären gilt es noch, wieso die Erstcrossover-Mutante trotz des in das mec-Cluster
integrierten Plasmids p∆mecIII noch in der Lage war, das graue Sporenpigment zu
Ergebnisse
115
synthetisieren, denn bei den meisten Inaktivierungen ist das Zielgen bereits nach dem ersten
Crossover nicht mehr funktionell. Da auf dem Plasmid p∆mecIII das gesamte mecIII
enthaltende Operon vorliegt, ist ein Funktionsverlust beim ersten Crossover nicht obligat.
Wenn das erste Crossover-Ereignis hinter (in Leserichtung des Operons) der eingeführten
Mutation liegt - und das ist bei einer in der Insertmitte des Inaktivierungsplasmids liegenden
Mutation mit einer Wahrscheinlichkeit von 50 % zu erwarten - so ist nach dem ersten
Crossover noch eine intakte Kopie des Operons vorhanden (zur Veranschaulichung s. 5.8.1).
Abb. 74: Sporenfarbe und Sporenmorphologie
von S. sp. Gö C4/4 ∆msc15 ∆mecIII (oben) im
Vergleich zu jener des Wildtyps (unten).
Die LC/ESI-MS Analyse (Methode: mens03, s. 5.11.6) eines Ethylacetatextrakts von
S. sp. Gö C4/4 ∆msc15 ∆mecIII nach Kultivierung in Flüssigkultur ließ beim Abgleich von
Chromatogrammen der Absorptionswellenlängen 254 nm, 330 nm und 400 nm keine
Unterschiede des Metabolitenspektrums im Vergleich zum Wildtyp erkennen.
116
Ergebnisse
3.3.5 Analyse des msn-Clusters (Mensacarcinsynthese)
Durch Endsequenzierung von Subkloninserts waren DNA-Sequenzbruchstücke einzelner
Gene des msn-Clusters bekannt (s. 3.3.3.2). Die Datenlage wurde durch Primerwalking
ausgehend vom ksα-Gen verbessert (Daten nicht gezeigt). Zur funktionellen Charakterisierung
wurden parallel die heterologe Expression von Cosmidinserts (s. 3.3.5.1) als auch die
Inaktivierung grundlegender Gene des msn-Clusters (s. 3.3.5.2) begonnen.
3.3.5.1 Funktionsbeweis durch heterologe Expression
Die heterologe Expression ist eine Möglichkeit, einzelne Gene oder größere DNA-Abschnitte
funktionell zu charakterisieren. Der entsprechende DNA-Abschnitt wird dabei in einen
heterologen Wirt eingebracht, der zuvor keinen derartigen Sequenzbereich in seinem Genom
besaß. Von den durch die eingebrachte DNA hervorgerufenen Veränderungen beim Wirt wird
auf die native Funktion des DNA-Bereichs im Donorstamm rückgeschlossen.
Durch heterologe Expression sollten Cosmidinserts aller drei PKS II-Cluster untersucht
werden. Besonderes Interesse galt dabei Cosmiden des msn-Clusters, dem bisher noch keine
Funktion zugeordnet werden konnte. Die Cosmide 4 und 9 (Gruppe 1, msc-Cluster),
3 und 12 (Gruppe 2, mec-Cluster) sowie 2, 7, 17 und 18 (Gruppe 3, msn-Cluster) wurden nach
Transformation von E. coli ET12567 pUZ8002 über intergenerische Konjugation in den
heterologen Wirt Streptomyces albus (s. 5.3.1.4) eingebracht. Als Vertreter der gleichen
Gattung wie S. sp. Gö C4/4 ist bei S. albus von einem ähnlichen Codongebrauch und
vergleichbarer Bereitstellung von Vorläuferstoffen auszugehen. Gleichzeitig qualifiziert sich
S. albus durch eine im HPLC-Chromatogramm nur diskret in Erscheinung tretende
Sekundärstoffproduktion. Durch seine weiße Sporenfarbe (albus) eignet sich der Stamm
eventuell zur Untersuchung des mec-Sporenpigmentbiosynthesegenclusters. Die Selektion der
Konjuganten erfolgte entsprechend der Resistenzkassette des Cosmidvektors pOJ436 mit
Apramycin (vgl. 5.4.1). Die Ethylacetatextrakte von Standardkulturen der Konjuganten in
HA-Medium wurden per LC/ESI-MS analysiert. Einzig mit integriertem Cos2 konnte
im Chromatogramm bei einer Absorptionswellenlänge von 254 nm ein neuer Peak
detektiert werden. Die korrespondierenden Signale im MS-Diagramm des negativen
Detektionsmodus haben m/z-Werte von 391 [M−H]− und 427 [M+Cl]−. Das Signal bei
m/z = 427 zeigte das typische Intensitätsverhältnis der Isotopensatelliten für Ionen mit einem
Chloratom (s. Abb. 75). Ein Abgleich mit dem Produktionsprofil von S. sp. Gö C4/4 sowie
der Dissertation von Dr. M. Arnold [56] identifizierte die Substanz als Didesmethylmensacarcin, einen Biosynthesevorläufer von Mensacarcin. Die erzielte Menge an
Didesmethylmensacarcin in S. albus ist mit der an Mensacarcin in S. sp. Gö C4/4
vergleichbar. Mit dieser erfolgreichen heterologen Expression von Cos2 war der
Beweis erbracht, dass die auf dem Insert vorliegenden Gene an der Biosynthese von
Mensacarcin beteiligt sind. Dieses Ergebnis gab den Ausschlag zur vollständigen
Sequenzierung von Cos2 (s. 3.3.5.3).
117
Ergebnisse
80
400
40
[M−H]
0
100
250
350 nm
0
−
−
[M+Cl]
O
400
430 m/z
0
0
10
20
30
OH OH OH O
OH O
429
800
392
200
[%]
391
300
mAU
427
254 nm
mAU
400
40
min
O
OH
Didesmethylmensacarcin
M: 392,11
Abb. 75: LC/ESI-MS-Analyse des Kulturextrakts von S. albus mit Cos2 von S. sp. Gö C4/4 (Methode: mens03).
Außer auf ihr Produktspektrum wurden die Integrationsmutanten auf HA-Agarkulturen
bezüglich ihrer Sporenfärbung betrachtet. Alle Mutanten zeigten die für S. albus typische
weiße Oberfläche. Obwohl zumindest auf Cos12 das gesamte mec-Cluster vorliegt, kam es
nicht zur Ausprägung des durch dieses Cluster vermittelten Merkmals (Graufärbung). Eine
heterologe Expression von Genen der Sporenpigmentsynthese, die beim Wirt zu einer
Farbänderung der Kulturoberfläche führt, wurde auch mit zuvor bekannten Sporenpigmentclustern nicht erreicht [213]. Dies wird auf die komplexe Regulation der
Sporenpigmentbiosynthese oder das Sporentargeting der PKS II-Metaboliten zurückgeführt
(vgl. 3.3.4).
Heterologe Expression und Heptaketidproduktion
Durch die heterologe Expression von Cos2 (Cosmidgruppe 3, msn-Cluster) konnte nun jedem
PKS II-Cluster ein Sekundärmetabolit zugeordnet werden: msc-Cluster→Substanz MSC-X1,
mec-Cluster→Sporenpigment, msn-Cluster→Mensacarcin. Nicht zuordnen ließen sich die
beiden Heptaketide Mensalon und Aloesol, deren wenig reduziertes, aromatisches Gerüst
einen biosynthetischen Ursprung aus einer PKS vom Typ II vermuten lässt. Daraus ergab sich
die Hypothese, dass eines der drei identifizierten PKS II-Cluster neben seiner bekannten
Funktion auch für die Biosynthese dieser beiden Strukturen verantwortlich ist. Zur
Überprüfung der Hypothese wurden Konjuganten von S. albus mit Cosmiden aller drei
Gruppen (Gruppe 1: Cos9, Gruppe 2: Cos12, Gruppe 3: Cos2) unter modifizierten
Kulturbedingungen mit 2 % DMSO im Medium angezogen. Wie aus Abb. 76 hervorgeht
führte nur Cos2 zur Produktion der Heptaketide (vgl. Abb. 56). Die Biosynthese von
Mensalon und Aloesol kann damit den Msn-Enzymen zugeordnet werden.
Bezeichnenderweise ging die Produktion der Heptaketide mit einer Repression der
Didesmethylmensacarcinproduktion einher.
118
Ergebnisse
(254 nm)
mAU
S. albus Cos2
+ DMSO
mAU
40
150
20
100
0
Mensalon
mAU
40
Aloesol
20
300
400 nm
50
0
300
400 nm
Didesmethyl-MSN
0
0
int.
400
10
m/z = 233 neg.
20
30
40
min.
30
40
min.
30
40
min.
30
40
min.
S. albus Cos2 + DMSO
300
200
100
0
0
int.
400
10
m/z = 233 neg.
20
S. albus Cos9 + DMSO
300
200
100
0
0
int.
400
10
m/z = 233 neg.
20
S. albus Cos12 + DMSO
300
200
100
0
0
10
20
Abb. 76: Heterologe Expression von DNA des msn- (Cos2), msc- (Cos9) und mec- (Cos12) Clusters durch
Cosmidinsertion in das Genom von S. albus. Kultivierung mit 2 % DMSO im Kulturmedium (LC/MS-Methode:
mens03, s. 5.11.6).
3.3.5.2 Funktionsbeweis durch Geninaktivierung
Die heterologe Expression hat gezeigt, dass auf Cos2 Proteine codiert werden, die im Wirt zur
Produktion von Didesmethylmensacarcin führen. Daraus lässt sich eine Beteiligung des msnClusters an der Mensacarcinbiosynthese ableiten. Zu klären galt es, ob weitere
Mensacarcinbiosynthesegencluster im Produzenten S. sp. Gö C4/4 vorliegen. Des Weiteren
sollte durch Geninaktivierungen Einblick in eine mögliche Kreuzkomplementierung der drei
PKS II-Cluster gewonnen werden.
Ergebnisse
119
Zur Beantwortung dieser Fragen wurden drei Mutanten mit unterschiedlichen Gendefekten
generiert: Eine Doppelmutante mit Defekt in den Genen der minimalen Msc- und Msn-PKS
(S. sp. Gö C4/4 ∆msc15 ∆msnK1), eine Doppelmutante mit Defekt in den Genen der
minimalen Msc-PKS sowie einer Mutation, die zur Inaktivierung von Teilen der erweiterten
Msn-PKS führt (S. sp. Gö C4/4 ∆msc15 ∆msnO11C3) und drittens eine Einfachmutante mit
Defekt in den Genen der minimalen Msn-PKS (S. sp. Gö C4/4 ∆msnK1).
Inaktivierungsplasmide und Crossover
Die Doppelmutanten sollten ausgehend von S. sp. Gö C4/4 ∆msc15, die Einfachmutante
ausgehend vom Wildtyp jeweils über die [safe-knock]-Strategie (s. 5.8.2) erstellt werden.
Dieses Vorhaben war eine Herausforderung, da die Sequenz des msn-Clusters noch nicht
vorlag. Es wäre wünschenswert gewesen, analog zur ∆msc15-Inaktivierung (s. 3.3.2.5), auch
im msn-Cluster das ksβ-Gen (msnK2) auszuschalten, um so eine mögliche Kreuzkomplementierung der minimalen Msc- und Msn-PKS zu vermeiden. Ein für die msnK2Inaktivierung geeigneter Subklon wurde bei der zufälligen Subklonerstellung jedoch nicht
erhalten und die gezielte Subklonierung war ohne Clustersequenz nicht möglich. Anstelle von
msnK2 wurde deshalb msnK1 (ksα-Gen) zur Inaktivierung ausgewählt, wobei die eingebrachte
Resistenzkassette bewusst gegen die Leserichtung des Operons ausgerichtet wurde um auch
einen inhibierenden Effekt auf die Transkription von msnK2 zu erreichen (vgl. Plasmidkarte
von p∆msnK1 unter 5.4.2.5). Das aus dem Subklon C7Nco5 entstandene Inaktivierungsplasmid p∆msnK1 wurde zur Erstellung der Mutanten S. sp. Gö C4/4 ∆msc15 ∆msnK1 und
S. sp. Gö C4/4 ∆msnK1 eingesetzt. Die dritte Mutante S. sp. Gö C4/4 ∆msc15 ∆msnO11C3
wurde zunächst nur als Sicherheit erstellt, falls es bei der anderen Doppelmutante zur
Kreuzkomplementierung der minimalen PKS gekommen wäre, ergab aber später wertvolle
Zusatzinformationen. Auf dem korrespondierenden Inaktivierungsplasmid p∆msnO11C3
(s. 5.4.2.5) liegt das Ketoreduktasegen msnO11 ohne Stoppcodon, das darauf folgende
Cyclasegen msnC3 ohne Startcodon vor, was zur Inaktivierung beider Gene führen sollte.
Bei der Selektion von S. sp. Gö C4/4 ∆msc15 ∆msnK1 wurden nach sechs Passagen
sechs von 264 Klonen als spectinomycinresistent und apramycinsensitiv identifiziert.
Für S. sp. Gö C4/4 ∆msnK1 waren dies nach vier Passagen zwölf von 264 Klonen,
für S. sp. Gö C4/4 ∆msc15 ∆msnO11C2 zwei von 88 Klonen nach der vierten Passage.
Von jeweils einem ausgewählten Klon wurde genomische DNA isoliert (s. 5.5.2.2) und per
PCR (s. 5.6.1) genotypisiert. Eingesetzte Primer und erwartete Produktgrößen sind Tab. 13 zu
entnehmen.
120
Ergebnisse
Tab. 13: PCR zur Genotypisierung von Mutanten mit Defekt im msn-Cluster.
Primerpaar
C7KSA-F / -R
C7KR-F / -R
msnK1
msnO11C3
Wildtypallel
331 bp Produkt
974 bp Produkt
mutiertes Allel
1486 bp Produkt
2258 bp Produkt
1: S. sp. Gö C4/4
10 kb
8 kb
6 kb
5 kb
4 kb
3 kb
2,5 kb
2,0 kb
1486 bp
1,5 kb
1,0 kb
0,75 kb
0,50 kb
1331 bp
0,25 kb
1
2
3
4
5
6
L
2: p∆msnK1
3: S. sp. Gö C4/4 ∆msc15
p∆msnK1 erster Crossover
4: S. sp. Gö C4/4 ∆msc15
∆msnK1 Doppelcrossover
5: S. sp. Gö C4/4 p∆msnK1
erster Crossover
6: S. sp. Gö C4/4 ∆msnK1
Doppelcrossover
L: 1 kb Leiter (Promega)
Abb. 77: Agarosegelelektrophorese der PCR-Ansätze zur Genotypisierung bezüglich msnK1.
10 kb
8 kb
6 kb
5 kb
4 kb
3 kb
2,5 kb
2,0 kb
1,5 kb
2258 bp
2974 bp
1,0 kb
0,75 kb
0,50 kb
0,25 kb
1
2
3
4
1: S. sp. Gö C4/4
2: p∆msnO11C3
3: S. sp. Gö C4/4 ∆msc15
p∆msnO11C3 erster Crossover
4: S. sp. Gö C4/4 ∆msc15
∆msnO11C3 Doppelcrossover
L: 1 kb Leiter (Promega)
L
Abb. 78: Agarosegelelektrophorese der PCR-Ansätze zur Genotypisierung bezüglich msnO11 / C3.
Wie aus Abb. 77 und Abb. 78 hervorgeht, zeigen die Mutanten den jeweils angestrebten
Genotyp.
121
Ergebnisse
Vergleichende Produktionsanalyse der Mutanten mit Gendefekt im msn-Cluster
Die gewonnenen Mutanten sowie der Wildtyp von S. sp. Gö C4/4 wurden je in einer
Standardkultur (s. 5.3.1.4) zur Mensacarcinproduktion angezogen. Die Ethylacetatextrakte
wurden einer LC/ESI-MS Analyse unterzogen. Das Ergebnis ist in Abb. 79 dargestellt. Für
keine der drei Mutanten lässt sich im UV-Absorptionschromatogramm ein Peak nachweisen,
der auf Mensacarcin zurückzuführen ist. Mit der "extract ions" Funktion der ChemStation
Software (s. 5.14) wurden MS-Diagramme für m/z = 419, den Wert des deprotonierten
Molekülions von Mensacarcin, erstellt. In den MS-Diagrammen der Extrakte von
S. sp. Gö C4/4 ∆msnK1 und S. sp. Gö C4/4 ∆msc15 ∆msnO11C3 traten bei der für
Mensacarcin typischen Elutionszeit noch schwache Signale auf. Parallel zu Signalen bei
m/z = 419 [M−H]− traten Ionen mit m/z = 455 [M+Cl]− sowie m/z = 863 [2M+Na]+ auf, was
dem typischen Adduktspektrum von Mensacarcin entspricht. Keiner dieser m/z-Werte trat
hingegen beim Extrakt der Doppelmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 auf. Dieses
Ergebnis wird unter 4.5.2 diskutiert.
254 nm
mAU
400
0
0
mAU
400
0
0
mAU
400
0
0
mAU
400
0
0
m/z = 419 negativ
10
20
30
40 min.
20
30
int.
1000
500
0
0
40 min.
10
20
30
40 min.
30
int.
1000
500
0
40 min.
0
10
20
30
40 min.
30
int.
1000
500
0
0
40 min.
10
20
30
40 min.
∆msnK1
10
∆msc15 ∆msnO11C3
10
20
∆msc15 ∆msnK1
10
int. max. > 8000
20
Wildtyp
10
Mensacarcin
int.
Mensacarcin
1000
500
0
30
40 min.
0
20
Abb. 79: LC/ESI-MS basierter Vergleich des Mensacarcingehalts in Ethylacetatextrakten von S. sp. Gö C4/4
Wildtyp und Mutanten mit Gendefekt im msn-Cluster. Links die Chromatogramme bei der Absorptionswellenlänge 254 nm, rechts die korrespondierenden MS-Diagramme für negative Ionen mit m/z = 419.
(Methode: mens03, s. 5.11.6).
Die Mutanten sollten auch auf ihr Potential zur Produktion der beiden Metaboliten Mensalon
und Aloesol überprüft werden. Dazu wurde die Kultivierung unter Zugabe von 2 % DMSO
wiederholt. Die für den m/z-Wert 234 (negativer Detektionsmodus) erstellten MS-Diagramme
ergaben, dass sich die Produktion der Heptaketide parallel zur Mensacarcinproduktion
verhält: S. sp. Gö C4/4 ∆msc15 produziert noch Spuren beider Substanzen, während im
Extrakt der Doppelmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 kein Mensalon und Aloesol
nachweisbar ist. Dieses Ergebnis unterstreicht die bei der heterologen Expression von Cos2
122
Ergebnisse
postulierte Zuordnung der Heptaketide zum msn-Cluster und zeigt weiterhin, dass deren
Produktion maßgeblich auf das msn-Cluster zurückzuführen ist.
3.3.5.3 Sequenzierung des msn-Clusters
Nachdem durch die heterologe Expression und die Geninaktivierungen die Anwesenheit von
Mensacarcinbiosynthesegenen auf Cos2 bewiesen war, konnte die Erschließung der gesamten
msn-Clustersequenz angegangen werden. Der Auftrag zur Sequenzierung von Cos2 wurde an
die Firma GATC (Konstanz) vergeben. Das gewählte Verfahren war eine ShotgunSubklonierung mit anschließender Endsequenzierung der Subklone per Sanger-Methode. Eine
Probe der Cosmid-DNA wurde zunächst durch Scheren fragmentiert. Über eine präparative
Agarosegelelektrophorese (vgl. 5.5.4.2) wurden Fragmente zwischen 2,0 kb und 2,5 kb
isoliert und in den Sequenziervektor pSmart HC insertiert. 384 auf diese Weise entstandene
Subklone wurden beidseitig auf einem ABI 3730xl-Sequenzierautomaten (Applied
Biosystems) ansequenziert. Die von Vektorsequenzen befreiten Daten wurden mit der
Software SeqMan aus dem Lasergene-Paket (s. 5.14) zu kontinuierlichen Sequenzabschnitten
(Contigs) assembliert. Vier Contigs konnten aus insgesamt 593 Einzelsequenzen
zusammengestellt werden. Es verblieben demnach vier Sequenzlücken auf der zirkulären
Cosmid-DNA, von denen drei durch Primerwalking (s. 5.6.2.2) geschlossen werden konnten.
Eine Lücke widerstand zunächst allen Bemühungen und wurde erst durch die Sequenzierung
eines subklonierten PCR-Produkts mit Spezialprotokoll geschlossen. Imperfekte Palindrome,
wie sie im mec-Cluster für DNA-Sekundärstrukturen verantwortlich gemacht wurden
(vgl. 3.3.4.1), konnten in diesem Fall jedoch nicht festgestellt werden.
Mit effektiv 6,4-facher Abdeckung wurden für Cos2 46333 bp durchgehende Sequenz
gewonnen, von der 36742 bp auf das Insert entfallen.
Sequenzierung der msn-Contigerweiterung
Eine erste Analyse der Insertsequenz zeigte, dass Cos2 nicht die vollständige Sequenz des
msn-Clusters beinhaltet. So fehlt zum Beispiel das bei der Ansequenzierung von Subklonen
der Cosmide 7 und 18 identifizierte Methyltransferasegen (s. 3.3.3.2). Dieser Befund erklärt,
warum die heterologe Expression von Cos2 nur zur Produktion des nicht methylierten
Didesmethylmensacarcins führte (s. 3.3.5.1). Am linken Ende (bezogen auf Abb. 81) des
Cos2-Inserts werden Transposasen und hypothetische Proteine codiert. Deshalb wurde von
einer möglichen Fortsetzung des msn-Clusters jenseits vom rechten Ende ausgegangen. Dort
liegt das Fragment eines Methioninsynthasegens. Eine identische Sequenz wurde mit dem
uni-Primer (s. 5.6.2.1) für das Subkloninsert von C7Bgl6a (s. 5.4.2.4) erhalten. Auf C7Bgl6a
und weiteren Subklonen von Cos7 oder Cos18 wurde per Primerwalking (s. 5.6.2.2) eine etwa
8 kb große Erweiterung des msn-Contigs erschlossen (s. Abb. 80).
123
Ergebnisse
Position auf dem msn-Contig
36001 [bp]
S
37001
38001
C7Bgl6a/uni
Cos2/pOJ436-rev
C7Bgl6a/Met-R1
C7Bgl6a/C7Bgl6a-F1
C7Bgl6a/Met-F1
C7Bgl6a/C7Bgl6a-F2
G3S2,7/rev
C7Bgl6a/G3AK-F1
G3S2,7/G3S2,7-R1
B
38601
C7Bgl6a/G3AK-F1
G3S2,7/G3S2,7-R1
G3S2,7/uni
E Bg
Bg
41201
B
S
B
40601
G3S2,7/G3S2,7-R2
G3S2,0/uni
C7Bgl6a/rev
C7Eco6a/rev
B
42201
C7Bgl6a/rev
C7Eco6a/rev
43801
S
39601
43201
G3S2,0/rev
C7Eco7-8-3/rev
G3B2,0/rev
G3S3,5/uni
G3B2,0/uni
G3S3,5/ G3S3,5-F1
G3S3,5/ G3S3,5-F2
44801
G3S3,5/ G3S3,5-F2
G3S3,5/ G3S3,5-F3
Abb. 80: Contigstrategie der msn-Erweiterung. Die durch Primerwalking oder durch Subklonansequenzierung
erhaltenen Sequenzen sind als Pfeile in ihrer Leserichtung dargestellt. Endonukleaseerkennungsstellen:
B: BamHI, Bg: BglII, E: EcoRI, S: SacI. Sequenzname: [Name des Subklons oder PCR-Produkts / verwendeter
Primer] (s. 5.6.3.3 und 5.4.2.4). Die rote Sequenz wurde durch die Endsequenzierung von Cosmid 2 erhalten.
Grüne Sequenzen stammen aus der zufälligen Subklonansequenzierung (s. 3.3.3).
124
Ergebnisse
3.3.5.4 Sequenzanalyse des msn-Clusters
Vom Cos2-Insert zusammen mit der msn-Contigerweiterung wurde eine kontinuierliche
Sequenz von 45562 bp zusammengestellt, deren G+C-Gehalt mit 68,1 mol % im typischen
Bereich der G+C-reichen Genome von Streptomyces spp. liegt [144]. Die Degeneration des
genetischen Codes lässt für die Codierung der gleichen Aminosäure unterschiedliche
Basentripletts zu, wobei vor allem die dritte Triplettposition variabel ist. In G+C-reichen
Genomen ist diese Position bevorzugt mit Guanidin und Cytidin besetzt, eine Besonderheit,
welche die Bestimmung möglicher Leserahmen auf einem Sequenzabschnitt erlaubt [219].
Hierzu wurde die G+C-Frameplot-Funktion der Artemis-Software (s. 5.14) herangezogen.
Das Programm nummeriert ausgehend von der ersten Sequenzposition alle Basen mit der
Ziffernfolge 1-2-3 durch (wobei die 4. Base folglich wieder der Ziffer 1 zugeordnet wird). Im
G+C-Frameplot wird der G+C-Gehalt auf jede Ziffer bezogen getrennt durch eine Kurve
grafisch dargestellt. So ist zum Beispiel beim Anstieg der Kurve für die Ziffer 2 davon
auszugehen, dass die Position 3 der eingegebenen Sequenz einer ersten Triplettposition
entspricht, falls das Gen auf dem betrachteten Strang liegt. Bei Lage des Gens auf dem
komplementären Strang bedeutet ein Anstieg der Kurve für die Ziffer 2, dass Position 4 auf
dem komplementären Strang einer ersten Triplettposition entspricht.
Durch den G+C-Frameplot wurden im ersten Analyseschritt auf jedem Strang ein mögliches
Leseraster, sowie die ungefähre Lage der open reading frames (ORFs) bestimmt. Im zweiten
Schritt wurde die Leserichtung definiert. Dazu wurden im Bereich der ORF-Grenzbereiche
Startcodons (ATG, GTG) identifiziert und auf mögliche, stromaufwärts gelegene
Ribosomenbindungsstellen [220;221] überprüft. Das nächste Stoppcodon im gewählten
Leseraster bestimmt das Ende der ORFs. Wenn der durch Start- und Stoppcodon definierte
Bereich mit der per G+C-Frameplot bestimmten Lage des ORFs übereinstimmte, konnte
dieser vorläufig festgelegt werden. Die endgültige Annotierung erfolgte nach Abgleich mit
ähnlichen Enzymen aus der NCBI-Datenbank (s. 5.14).
Auf dem msn-Contig wurden 38 ORFs definiert. An beiden Contigenden werden Transposasen codiert, was die Spekulation erlaubt, dass das Mensacarcinbiosynthesegencluster
über diese Insertionselemente im Genom von S. sp. Gö C4/4 verankert wurde. Das
msn-Cluster liegt demnach zwischen Transposasegenen auf einem 38766 bp langen Abschnitt
des msn-Contigs, der 33 ORFs (msnH1 - msnM6) beinhaltet (s. Abb. 81). Die minimale
PKS vom Typ II wird von den Genen msnK1 - K3 codiert. Erweitert wird die PKS von
Polyketid formenden Enzymen: den Cyclasen (MsnC1 - C3) sowie den Ketoreduktasen
(MsnO1, MsnO10, MsnO11). Zahlreiche weitere Oxidoreduktasegene (msnO2, msnO4 - O9)
können tailoring-Reaktionen zugeordnet werden. Erstaunlich ist dabei das Auftreten von drei
ORFs mit Ähnlichkeiten zu Anthronoxygenasegenen (msnO5 - O7), bei nur einer
Anthrachinol ähnlichen Konstellation im Mensacarcinmolekül. Einzigartig für PKS II-Cluster
aus S. sp. Gö C4/4 ist die Präsenz von Genen, die für ein System ähnlich der bakteriellen
Luciferase, nebst Kofaktorregenerierung codieren (msnO2 - O4, msnO8). Dem Aufbau des
Methylgruppendonors S-Adenosylmethionin, sowie dem Methyltransfer wurden die Gene
125
Ergebnisse
msnM1 - M6 zugeordnet. Zwei Gene (msnR1 - R2) konnten der Regulation der
Mensacarcinbiosynthese zugeordnet werden. Außerdem finden sich noch acht ORFs
unbekannter Funktion im Mensacarcinbiosynthesegencluster.
In Tab. 14 werden für die msn-Genprodukte Funktionsvorschläge gemacht, die sich von
bekannten Proteinen ähnlicher Aminosäuresequenz aus der NCBI-Datenbank ableiten
(s. 5.14). Für die nachfolgende Besprechung wurden die msn-Gene gemäß ihrer Funktion
zusammengefasst.
-20 kb
0 kb
20 kb
40 kb
Cosmid 7
Cosmid 17
Cosmid 18
Cosmid 2
Cosmid 20
B
B
B
T1
H0
B
B
B
H1
T2
H3
H2
O1
H4
0 kb
B
B
B
O3
K2
O2 H5
B B
BamHI
H6 O5 O6/7 O8
K3 C3
B
H7
R2
K1 O4 C1 C2 O9/10 O11 R1 H8
10 kb
20 kb
30 kb
minimale PKS
Cyclasen
Oxidoreduktasen
Regulatoren
Transposasen
unbekannt
M2
M1
M3
B
B
B
M4
M6
M5
B
T4
T3
40 kb
SAM-Regeneration
/ Methyltransfer
Abb. 81: Physikalische Karte des msn-Contigs. Die Positionierung des Contigs auf den Cosmiden der Gruppe 3
(s. 3.3.3.1) wurde durch Restriktionskartierung und Endsequenzierung der Cosmidinserts bestimmt
(Sequenzierergebnisse unter 5.4.2.4).
126
Ergebnisse
Tab. 14: Liste der auf dem msn-Contig identifizierten Gene unter Angabe der auf Ähnlichkeitsvergleichen
basierenden vorgeschlagenen Proteinfunktionen.
Msn
Größe
[AS]
vorgeschlagene
Funktion
H0
231
T1
428
T2
(283)
H1
411
H2
836
H3
217
H4
162
O1
248
O2
351
O3
173
unbekanntes
Protein
Transposase
(Mutatorfamilie)
Transposasefragmente, nicht
funktionell
unbekanntes
Protein
unbekanntes
Protein
unbekanntes
Protein
unbekanntes
Protein
Ketoacyl-(ACP)Reduktase,
möglicherweise
C-19-Ketoreduktase
Luciferase ähnliche
Oxidoreduktase
Flavinreduktase
H5
367
K2
Aminosäuresequenz-Ähnlichkeiten
identisch /
positiv [%]
67 / 77
66 / 81
70 / 78
33 / 44
25 / 37
44 / 54
25 / 41
38 / 53
VirN (Streptomyces virginiae), BAF50713, [226]
45 / 64
Gra-ORF34 (Streptomyces violaceoruber),
CAA09661, [227;228]
MAV_5060 (Mycobacterium avium 104),
YP_884178, [229]
Ara-ORF10 (Streptomyces echinatus), ABL09958,
[54]
Ara-ORF11 (Streptomyces echinatus), ABL09959,
[54]
SnoaW (Streptomyces nogalater), AAF01810,
[230]
Sare_0634 (Salinispora arenicola CNS-205),
YP_001535548, [231]
VirN (Streptomyces virginiae), BAF50713, [226]
35 / 56
401
K1
421
KSα
78 / 86
H6
281
unbekanntes
Protein
49 / 58
70 / 80
44 / 54
359
O5
101
C1
415
O6
105
O7
104
C2
307
O8
334
Luciferase ähnliche
Oxidoreduktase
Monooxygenase,
Anthronoxygenase
ähnlich
Cyclase /
Dehydratase
Monooxygenase,
Anthronoxygenase
ähnlich
Monooxygenase,
Anthronoxygenase
ähnlich
Cyclase
(2. Ring)
Luciferase ähnliche
Oxidoreduktase,
möglicherweise
Methylen-H4MPT
Reduktase
SACE_0882 (Saccharopolyspora erythraea NRRL
2338), YP_001103141, [175]
Nfa44340 (Nocardia farcinica IFM 10152),
YP_120649, [223]
SAMR0662 (Streptomyces ambofaciens ATCC
23877), CAJ88372, [187]
RSp0695 (Ralstonia solanacearum), CAD17846,
[224]
BenL* (Streptomyces sp. A2991200), CAM58804,
[225]
52 / 67
möglicherweise
Phosphotransferase
KSβ
O4
angenommene Proteinfunktion (Herkunft),
NCBI accession number, Referenz
Strop_0640 (Salinispora tropica CNB-440),
YP_001157497, [222]
RHA1_ro08487 (Rhodococcus sp. RHA1),
YP_707689, [132]
SCO0083 (Streptomyces coelicolor A3(2)),
NP_624431, [70]
53 / 67
32 / 48
27 / 42
33 / 47
30 / 51
31 / 52
34 / 48
36 / 50
52 / 66
41 / 56
AknX* (Streptomyces galilaeus), AAF70105, [185]
ChaH (Streptomyces chartreusis), CAH10167,
[232]
RdmK (Streptomyces purpurascens), AAL24453,
[233;234]
AknX* (Streptomyces galilaeus), AAF70105, [185]
ChaH (Streptomyces chartreusis), CAH10167,
[232]
AknX* (Streptomyces galilaeus), AAF70105, [185]
ChaH (Streptomyces chartreusis), CAH10167,
[232]
ActIV* (Streptomyces coelicolor A3(2)),
NP_629241, [235]
MXAN_3632 (Myxococcus xanthus DK 1622),
YP_631819, [181]
Ergebnisse
Msn
Größe
[AS]
vorgeschlagene
Funktion
O9
323
O10
260
K3
98
Oxidoreduktase,
zinkbindend,
möglicherweise
NADPH:Chinonreduktase
Ketoacyl-(ACP)Reduktase
ACP
O11
261
C3
314
Ketoacyl-(ACP)Reduktase,
C-9-Ketoreduktase,
Cyclase /
Dehydratase
Aminosäuresequenz-Ähnlichkeiten
identisch /
positiv [%]
49 / 68
46 / 66
angenommene Proteinfunktion (Herkunft),
NCBI accession number, Referenz
GrhO7 (Streptomyces sp. JP95), AAM33674, [169]
(Act) ORF2 (Streptomyces coelicolor A3(2)),
CAA44234, [70]
43 / 60
3-oxoacyl-[ACP] reductase (Saccharopolyspora
erythraea NRRL 2338), YP_001108352, [175]
SimA3 (Streptomyces antibioticus), AAK06786,
[236]
ActIII* (Streptomyces coelicolor A3(2)), P16544,
[237], Funktionsbeweis [238;239]
53 / 78
63 / 76
67 / 78
57 / 70
R1
283
H7
303
H8
111
R2
947
M1
487
M2
301
M3
1164
Regulator,
SARP-Familie
mögliche
Hydrolase
Fragment eines
Transmembrantransporters
Regulator,
LuxR-Familie
Adenosylhomocysteinase
N5,N10-Methylentetrahydrofolatreduktase
Methioninsynthase
90 / 94
M4
327
Adenosinkinase
69 / 80
M5
406
SAM-Synthetase
92 / 94
M6
T3
345
441
Methyltransferase
Transposase
36 / 54
50 / 65
T4
199
Transposasefragment
* Funktion experimentell belegt.
127
42 / 61
56 / 67
75 / 84
30 / 43
91 / 96
81 / 88
58 / 66
SimA5 (Streptomyces antibioticus), AAK06788,
[236]
Med-ORF19 (Streptomyces sp. AM-7161),
BAC79027, [168]
Lct15 (Streptomyces rishiriensis), ABX71098,
[240]
CvmH (Streptomyces clavuligerus), ABK96924,
[241]
KinJ (Streptomyces murayamaensis), AAO65354,
[242]
Franean1_4833 (Frankia sp. EAN1pec),
ABW14199, [182]
Fnq16 (Streptomyces cinnamonensis), CAL34094,
[243]
MetF (Streptomyces fradiae), AAK98793, [244]
SCO1657 (Streptomyces coelicolor A3(2)),
NP_625932, [70]
SfmS4 (Streptomyces lavendulae), ABI22143,
[245]
SAV_6874 (Streptomyces avermitilis MA-4680),
NP_828050, [69]
OxyF*(Streptomyces rimosus), AAZ78330, [246]
Franean1_2958 (Frankia sp. EAN1pec),
YP_001507284, [182]
SAV_115 (Streptomyces avermitilis MA-4680),
NP_821289, [69]
128
Ergebnisse
Enzyme der Polyketidsynthese
Die minimale Polyketidsynthase vom Typ II setzt sich aus den Genprodukten von msnK1 - K3
zusammen. Die Anordnung der Gene weicht von der üblichen Architektur in PKS II-Clustern
ab, nach der die minimale PKS auf einer zusammenhängenden Kassette in der Reihenfolge
ksα-ksβ-acp codiert wird [247]. Im msn-Cluster sind die Gene für das KSα / KSβ-Heterodimer
räumlich vom acp-Gen getrennt und gehören zu einem anderen Operon. Ähnliche
Konstellationen sind aus der Fachliteratur bekannt (Resistomycin [247], R1128 [248],
Griseorhodin [169], Doxorubicin [249], Medermycin [168]). Interessanterweise sind in jedem
der PKS II-Cluster ksα und ksβ hintereinandergeschaltet, wonach dies als kleinster
gemeinsamer Nenner der minimalen PKS-Architektur definiert werden kann.
Die Elemente der minimalen Msn-PKS zeigen hohe AS-Sequenzähnlichkeit mit Analoga aus
der Biosynthese aromatischer Polyketide in Streptomyces spp. . Insbesondere die
phylogenetische Einordnung der KSα ist oft mit dem Cyclisierungsmodus des PKS IIMetaboliten verknüpfbar [201]. MsnK1 jedoch lässt sich keiner der bekannten Klassen
eindeutig zuordnen. Ein Ergebnis, dass nicht überrascht, da Mensacarcin einen bisher
einzigartigen Cyclisierungsmodus aufweist (s. 1.3.5). Die gemäß Datenbankabgleich per
BLAST-Algorithmus (s. 5.14) nächsten Verwandten von MsnK1 stammen aus der
Anthrazyklin-, Anguzyklin- und Aureolsäurebiosynthese.
Gene, die auf ein alternatives PKS-Priming hinweisen, wie zum Beispiel ein weiteres
Ketosynthase-, Acyltransferase- oder acp-Gen, sind im msn-Cluster nicht anzutreffen. Dieser
Befund steht in Einklang mit den Ergebnissen der Fütterung Isotop markierter Vorstufen,
wonach Acetat als formale Startereinheit der Mensacarcinbiosynthese bestimmt wurde
(s. 4.5.3).
Zum PKS II-Multienzymkomplex sind außer der minimalen PKS noch drei Ketoacyl-(ACP)Reduktasen (MsnO1, -O10, -O11) sowie drei Cyclasen / Aromatasen (MsnC1 - C3)
zuzuordnen. Erst vor kurzem wurde von Lackner et al. (2007) [250] gezeigt, dass sich aus der
AS-Sequenz von Ketoreduktasen eine Vorhersage treffen lässt, welche Position des PKSMetaboliten durch das Enzym reduziert wird. MsnO11 weist eine hohe Ähnlichkeit zu
verschiedenen C-9-Ketoreduktasen auf, die in der Klasse der Anthrazykline, Tetrazykline und
Benzoisochromanchinone entscheidenden Einfluss auf die regioselektive 7,12-Cyclisierung
des ersten Rings haben [23]. Eine weniger deutliche Aussage ist für die putative
Ketoreduktase MsnO1 möglich, deren Sequenz beim BLAST-Datenbankabgleich außer der
C-19-Ketoreduktase BenL [250] ausschließlich 3-Ketoacyl-(ACP)-Reduktasen der
bakteriellen Fettsäuresynthese als signifikante Treffer ergab. Die Struktur der dritten
putativen Ketoacyl-(ACP)-Reduktase MsnO10 enthält, wie auch MsnO1 und MsnO11, eine
für diese Enzymfamilie charakteristische FabG-Domäne. Zu MsnO10 verwandte Enzyme
stammen aus der bakteriellen Fettsäuresynthese, ein ähnlicher Vertreter aus PKS II-Clustern
wurde in der NCBI-Datenbank noch nicht publiziert.
Ergebnisse
129
MsnC2 weist Sequenzähnlichkeit zu Cyclasen auf, die für die Cyclisierung des zweiten Rings
von PKS II-Metaboliten verantwortlich gemacht werden. Die Funktion der mit 52 %
identischen Aminosäuren ähnlichen Cyclase ActIV der Actinorhodinbiosynthese wurde
experimentell bestätigt [235]. MsnC1 und MsnC3 zeigen Ähnlichkeiten zu bifunktionalen
Cyclasen / Dehydratasen, MsnC3 unter anderem zum Enzym Med-ORF19, einer putativen
Aromatase des ersten Rings in der Biosynthese des Benzoisochromanchinons Medermycin
[168]. Mit 415 AS ist MsnC1 etwa 100 AS länger als die meisten Aromatasen. Nur RdmK
(s. Tab. 14) und AknE1 aus Streptomyces galilaeus [173] zeigen über die gesamte Sequenz
Ähnlichkeit zur MsnC1. Beide Enzyme sind auf Anthrazyklinbiosynthesegenclustern codiert
und werden der Aromatisierung des ersten Rings zugeordnet. Ein Funktionsbeweis steht noch
aus.
Typisch für Cyclasen und Aromatasen ist ihr domänenartiger Aufbau und die damit
verbundene Multifunktionalität [23]. Enzyme mit einer Domäne haben eine Größe von
ca. 150 AS (zum Beispiel SnoO aus S. nogalater [251]), zwei Domänen führen zu einer
Länge von ca. 310 AS (zum Beispiel ActIV, s. o. oder SnoE [179]), zu den seltenen
Dreidomänen-Cyclasen mit einer Sequenzlänge von über 400 AS gehören bisher nur RdmK,
AknE1 und MsnC1.
Der N-Terminus (ca. 200 AS) dieser Enzyme gleicht den Zweidomänen-Cyclasen
(ChaF [232], 34 % ID), der Carboxylterminus teilt 40 - 50 % identische Aminosäuren mit
einer Reihe von Enzymen, die bisher nicht funktionell charakterisiert wurden (AknV [252],
OxyI [246], SnoO [179]). Die noch kleine Familie der Dreidomänen-Cyclasen stellt sich
somit als interessantes Target für Funktionalitätsstudien dar.
130
Ergebnisse
Enzyme mit Ähnlichkeit zur bakteriellen Luciferase
Die Genprodukte von msnO2, msnO4 und msnO8 haben Sequenzähnlichkeit zu
Untereinheiten der bakteriellen Luciferase, die in Vibrio harveyi für die Entstehung von
Biolumineszenz verantwortlich ist [253]. Über einen Abgleich mit der Pfam-Datenbank des
Sanger-Instituts (s. 5.14) wurde für die drei Enzyme ein signifikanter Konsens mit der
Domäne der Familie Pfam00296 (Luciferase ähnliche Monooxygenasen) festgestellt. Ein
paarweiser Vergleich verschiedener Pfam00296-Proteine deckte auf, dass MsnO8 und Msc32
aus S. sp. Gö C4/4 eine eigene Untergruppe bilden, wie auch aus dem mit der MegAlign
Software (s. 5.14) nach Clustal W-Alignment erstellten phylogenetischen Stammbaum
(Abb. 82) hervorgeht.
LuxA
LuxB
GdnG
Msc32
MsnO8
MitH
Y4wf
Msc21
MsnO2
MsnO4
VirN
SnaA
SnaB
LmbY
312.3
300
250
200
150
100
Nucleotide Substitutions (x100)
50
0
Abb. 82: Phylogenetischer Stammbaum der bakteriellen Luciferase aus V. harveyi Untereinheit A (LuxA),
Untereinheit B (LuxB) und ähnlichen Proteinen aus S. sp. Gö C4/4 (MsnO2 - O4, Msc21, Msc32),
Streptomyces virginiae (VirN, Virginiamycin [226]), Rhizobium sp. NGR234 (Y4wf, keiner Biosynthese
zugeordnet [254]), Streptomyces lavendulae (MitH, Mitomycin [163]), Streptomyces hygroscopicus 17997
(GdnG, Geldanamycin [255;256]), Streptomyces lincolnensis 78-11 (LmbY, Lincomycin A [257;258]),
Streptomyces pristinaespiralis (SnaA, SnaB Heterodimer, Pristinamycin (=Virginiamycin) [259], Gencluster
unbekannt).
Tatsächlich teilen MsnO2 / O4, Msc21 und VirN im paarweisen Vergleich über 50 %
identische Aminosäuren, was auch innerhalb der Gruppe MsnO8 / Msc32 gilt. Proteine der
ersten Gruppe haben jedoch nur ca. 20 % gemeinsame Aminosäuren mit denen der MsnO8 /
Msc32-Gruppe. Auf der Suche (NCBI conserved domain search) nach Unterschieden wurde
nur in den Sequenzen von MsnO8 / Msc32 ein Motiv (COG2141) identifiziert, das für
Coenzym F420-abhängige N5,N10-Methylen-tetrahydromethanopterin (Methylen-H4MPT)
Reduktasen charakteristisch ist. Im Gegensatz zur bakteriellen Luciferase verwenden diese
Luciferase ähnlichen Oxidoreduktasen nicht FNM, sondern Coenzym F420 als Kofaktor.
Die Bindungsstelle beider Flavinderivate sind jedoch sehr ähnlich [260] (vgl. Abb. 83).
Im Mensacarcinbiosynthesegencluster grenzt sich msnO8 von msnO2 / O4 ab, was auf eine
eigenständige Funktion des Genprodukts schließen lässt. Dies wird auch durch die Tatsache
131
Ergebnisse
unterstützt, dass kristallisierte Methylen-H4MPT Reduktasen als Homodimer vorliegen
[260;261]. MsnO2 / O4 hingegen könnten wie auch die bakterielle Luciferase als Heterodimer
vorliegen [262]. Eine Hypothese, die mit einem Sequenzalignment im Bereich der
Kofaktorbindungsstelle verfolgt wurde (s. Abb. 83).
Histidin 44
LuxA
MsnO2
MsnO4
MsnO8
Msc21
Msc32
VirN
Y4wf
MitH
GdnG
LmbY
SnaA
SnaB
LuxB
37
38
40
37
38
37
75
44
37
40
29
63
35
37
DTVWLLEHHFTEFGLLG
HHVKTVEHYFSAYGGYS
FQVKLVEHYFFDYGGYS
ERFWVAEHHAEIFNAVP
HHVKTVEHYFHEYGGYS
HRYWFAEHHATPSFAGP
EHAQIVEHYGSPYGGYS
YAYHLAEHHFSPHGRSP
DYAFSVEHHCTPHESWM
DHVWCPEHHFLEEYSHM
DHAWTYDHVKWRWLSDR
VWGTRLDSLCRTSRTEH
DAVLIDDRAAAG-VQGR
DTLAVYENHFSNNGVVG
Arginin 107
96
98
100
96
98
96
135
103
97
102
91
122
93
96
MSKGRFRFGICRGLYDK
LSHGRLDVGFGRGFLPE
ISGGRLDVGFGRAFLPD
LYPDRIDLGIGRAN-RV
ISQGRLDVGFGRAFLPD
LSPGRIDLGVGRGIGAG
LSHGRLDVGFGRAFLPD
LSGGRAELGIGRGSLPI
LLGGRLEVGLASGVSRD
LSDGRVDFGTGESTTPT
ISGGRFLCGVGSGGPDR
LSGGRAGWNVVTSAAPW
LAHGRTGW--------MSEGRFAFGFSDCEKSA
Abb. 83: Clustal W-Alignment der Aminosäuresequenzen im Bereich des aktiven Zentrums. Für die
Funktionalität der bakteriellen Luciferase werden unter anderem Histidin 44 und Arginin 107 als essentiell
angesehen (s. Text). Die Kurzbezeichnungen der Proteine sind bei Abb. 82 erläutert.
Die Bindungsstellen für FMN und das aliphatische Aldehydsubstrat an der Struktur der
bakteriellen Luciferase aus V. harveyi konnten noch nicht über Röntgenstrukturanalysen
bestätigt werden. Mutageneseexperimente zeigten die essentielle Rolle von Histidin 44 für die
Biolumineszenzaktivität [263;264]. Auch bei Arginin 107, das vermutlich über eine
Wasserstoffbrücke mit dem Phosphatrest von FMN verbunden ist [262], führte ein durch
Punktmutation herbeigeführter Aminosäurenaustausch zur deutlichen Reduzierung der
Aktivität [265]. Beide Aminosäuren fehlen in der Untereinheit B des A / B-Heterodimers der
bakteriellen Luciferase. B / B-Homodimere zeigen eine deutlich geringere Aktivität als
A / A-Homodimere [266]. Durch ein Sequenzalignment nach dem Clustal W-Algorithmus
(s. 5.14) wurden Äquivalente zu His 44 und Arg 107 in Luciferase ähnlichen Proteinen
identifiziert (s. Abb. 83). Analog zu LuxA / B wären die katalytisch wichtigen Aminosäuren
auch bei MsnO2 / O4 nur in einer Untereinheit zu erwarten. Erstaunlicherweise sind sie
jedoch in allen Msn- und Msc-Proteinen zu finden. Dieses Ergebnis lässt die Frage offen, ob
MsnO2 / O4 als Heterodimer für eine Oxygenierung verantwortlich sind oder jeweils als
Homodimer unterschiedliche Funktionen erfüllen.
Enzyme mit Ähnlichkeit zur bakteriellen Luciferase spielen eine Rolle in unterschiedlichen
Sekundärstoffbiosynthesewegen: VirN, SnaA / B (Virginiamycin M, PKS I-NRPS-Hybrid),
MitH (Mitomycin, Shikimisäure-Glucosamin-Hybrid), GdnG (Geldanamycin, ShikimisäurePKS I-Hybrid) und LmbY (Lincomycin A, L-Thyrosin+Ribose-5-Phosphat).
Die durch diese Proteine katalysierten Reaktionen sind wenig erforscht. SnaA / B sind
für die Einführung der Doppelbindung in den Prolylrest von Virginiamycin M1
132
Ergebnisse
(= Pristinamycin PIIA) verantwortlich, wobei eine Hydroxylierung mit anschließender
Dehydratisierung postuliert wird [259]. VirN katalysiert möglicherweise die gleiche Reaktion
in S. virginiae [226]. LmbY ist essentiell für die Synthese des Lincomycinvorläufers
Propylprolin, wie Mutageneseexperimente zeigten [258]. Für MitH wird eine Rolle bei der
Reduktion der Carboxylgruppe von AHBA (3-Amino-5-hydroxybenzoesäure) vor Einführung
der Methylgruppe angenommen. Die Inaktivierung des Gens mitH unterbindet die Produktion
von Mitomycin C [163].
O
OH
N
H
O
O
O
N
O
N
NH
Mitomycin A
O
H3CO
CH3
HO
H
N
OH
H3C
O
OH
Lincomycin A
N
O
Virginiamycin M1
O
OCH3
H3C
O
CH3
N
C3H7
OCONH2
O
H3CO
OH
SCH3
H3CO
O
N
H
O
CH3
H3CO
OH
H3C
CH3
OCOONH2
Geldanamycin
Abb. 84: Strukturen von Sekundärmetaboliten in deren Biosynthesegencluster Luciferase ähnliche Oxidoreduktasen codiert werden.
Der Vergleich mit ähnlichen Enzymen erlaubt wegen nur bedingt vorhandener Strukturhomologien der betrachteten Sekundärstoffe mit dem PKS II-Metaboliten Mensacarcin keinen
Rückschluss für die Funktion von MsnO2 / O4 / O8 in der Mensacarcinbiosynthese, macht
aber die essentielle Rolle von Luciferase ähnlichen Oxidoreduktasen im Sekundärstoffwechsel deutlich.
Ergebnisse
133
Die FMN-Reduktase MsnO3
In Analogie zum Zwei-Komponentensystem der bakteriellen Luciferase aus V. harveyi
[253] steht auch für die Mensacarcinbiosynthese neben drei Luciferase ähnlichen
Oxidoreduktasen (MsnO2, MsnO4, MsnO8) mit dem Genprodukt von msnO3 eine
Flavinreduktase zur Verfügung. Unter anderem teilt MsnO3 ca. 30 % identische Aminosäuren
mit den als Homodimer vorliegenden Enzymen ActVB [267], SnaC [259], die FMN(ox) mit
NADH reduzieren, was in vitro gezeigt wurde. Eine äquivalente Funktion kann auch für
MsnO3 vorgeschlagen werden. Der Kofaktor des Enzyms lässt sich nicht über
AS-Sequenzähnlichkeiten, sondern nur experimentell bestimmen.
Drei Anthronoxygenasen in der Biosynthese eines Anthrachinonderivats
Über die gesamte Sequenz der je nur etwa 100 AS großen Genprodukte von msnO5 - O7
erstreckt sich eine Domäne der Familie Pfam03392 (= antibiotic biosynthesis monooxygenases). Bei bisher funktionell charakterisierten Proteinen mit dieser Domäne und einer
Sequenzlänge von unter 140 AS handelte es sich um Untereinheiten von als Homodimer
[165] oder Homotrimer [268;269] vorliegenden Anthronoxygenasen. Dies sind kofaktorunabhängige Monooxygenasen, die Anthron- oder Anthranolderivate mit molekularem
Sauerstoff zum Anthrachinon oxidieren. Aufgrund einer Kokristallisation wurde für
ActVA-ORF6 ein Mechanismus, analog zur Autooxidation von Dithranol postuliert [165].
Der erste Schritt ist eine Deprotonierung der Hydroxylgruppe des mittleren Ringes des
Anthranols. Die negative Ladung kann zwischen benachbarten α-Hydroxylgruppen auf der
gleichen Seite stabilisiert werden. Bei Verlagerung der negativen Ladung auf das sekundäre
Kohlenstoffatom auf der gegenüberliegenden Seite des mittleren Rings findet dort die
Reaktion mit molekularem Sauerstoff statt. Aus einem angenommenen Peroxy-Intermediat
geht nach Protonierung und Wasserabspaltung das Anthrachinon hervor [165]. Ein analoger
Mechanismus ist für die C5-Oxygenierung von Mensacarcin denkbar.
Für das Vorliegen von drei Anthronoxygenase ähnlichen msn-Genen bei nur einer Anthronoxygenierung der Mensacarcinbiosynthese gibt es verschiedene Erklärungsmöglichkeiten:
1. MsnO5 - O7 arbeiten als Multimer.
2. Teilweise handelt es sich um redundante Gene.
3. Msn O5 - O7 katalysieren eine von der Anthronoxygenierung abweichende Reaktion.
Auch Kombinationen der drei Vorschläge sind möglich.
Biosynthesegencluster mit mehreren Anthronoxygenase ähnlichen Genen sind aus der PKS IIGruppe des Pradimicintyps bekannt (vgl. Abb. 85). Die Funktion der Genprodukte wurde
bisher noch nicht experimentell belegt [270].
134
Ergebnisse
DauG
DnrG
SnoaB
StfOI
AknX
CosX
Hed-Orf27
MtmOIII
PokO3
OxyG
Msc27
MsnO7
ChaH
GrhU
Prm-Orf8
FdmP
FdmJ
FdmQ
Prm-Orf9
GrhV
RubT
FrnU
ElmH
TcmH
ActVA-Orf6
Pyr21
MsnO5
MsnO6
198.8
180
160 140 120 100 80
60
40
Nucleotide Substitutions (x100)
20
Anthrazyklin
Hedamycin
Aureolsäuren
Tetrazyklin
MSC
Mensacarcin
Chartreusin
Pradimicin
Benzoisochromanchinon (BICQ)
Tetracenomycin
BICQ
Pyrrolomycin
Mensacarcin
0
Abb. 85: Phylogenetischer Stammbaum von Anthronoxygenase ähnlichen Proteinen. Das Alignment basiert auf
dem Clustal W-Algorithmus (s. 5.14). DauG (NCBI: AAA87617): Daunorubicin [271], DnrG (AAA65205)
Doxorubicin [249], SnoaB (CAA12015) Nogalamycin [179], StfOI (CAJ42321) Steffimycin [272], AknX
(BAB72044) Aclacinomycin [185], CoxX (ABC00737) Cosmomycin [174], Hed-Orf27 (AAP85340)
Hedamycin [273], MtmOIII (CAK50778) Mithramycin [274], PokO3 (nicht in Genbank) Polyketomycin [38],
OxyG (AAZ78331) Oxytetrazyklin [246], ChaH (CAH10167) Chartreusin [232], GrhU (Q8KSW0) GrhV
(Q8KSV9) Griseorhodin [169], Prm-Orf8 (O32458) Prm-Orf9 (O32459) Pradimicin [275], FdmJ (AAQ08920)
FdmP (AAQ08927) FdmQ (AAQ08928) Fredericamycin [270], RubT (Q8KY33) β-Rubromycin [laut Genbank],
FrnU (AAC18116) Frenolicin [276], ElmH (AAF73051) Elloramycin [277], TcmH (ABK70908)
Tetracenomycin [268], ActVA-Orf6 (1LQ9_A) Actinorhodin [269], Pyr21 (ABO15857) Pyrrolomycin [278].
Für den phylogenetischen Stammbaum der Anthronoxygenase ähnlichen Proteine wurden aus
der Datenbank des Sanger Instituts, die Einträge mit Pfam03392-Domäne und einer
Sequenzlänge unter 140 AS ausgewählt und zusammen mit entsprechenden Genprodukten aus
dem Polyketomycin-, msc- und msn-Cluster nach dem Clustal W-Algorithmus prozessiert.
Die AS-Sequenzen der Enzyme korrelieren mit dem Cyclisierungsmodus ihrer Substrate.
Besonders eindruckvoll ist dies für Enzyme der Pradimicintypbiosynthese, zu deren
Endprodukten pentanguläre Systeme (zum Beispiel Pradimicin), als auch Spiroketale (zum
Beispiel Griseorhodin) deutlich abweichender Struktur gehören. Dies lässt vermuten, dass es
sich bei den Reaktionen von Anthronoxygenase ähnlichen Enzymen um frühe Modifikationen
handelt, die im Fall der Pradimicintypmetaboliten noch vor der Umlagerung zum Spiroketal
erfolgen.
135
Ergebnisse
Der Stammbaum verdeutlicht erneut die Sonderstellung der Mensacarcinbiosynthese unter
den bereits bekannten Cyclisierungstypen. Während MsnO7 in einem Seitenast der
Aureolsäuren- / Tetrazyklinfamilie zu finden ist, bilden MsnO5 und O6 eigenständige
Gruppen.
Weitere Genprodukte mit Ähnlichkeit zu Oxidoreduktasen (MsnO9)
Das Genprodukt von msnO9 teilt ca. 50 % identische Aminosäuren mit ActVI-ORF2
(Actinorhodinbiosynthese),
Med-ORF9
(Medermycinbiosynthese)
sowie
GrhO7
(Griseorhodinbiosynthese). Die AS-Sequenz dieser Proteine und MsnO9 kann gut mit der
Consensus-Sequenz der Familie COG0604 (NADPH:quinone reductase and related Zndependent oxidoreductases, NCBI conserved domain search, s. 5.14) zur Deckung gebracht
werden. Diese Familie enthält sowohl NADPH:Chinonreduktasen, die im Allgemeinen
Chinone durch die Übertragung eines Elektrons zu Semichinonradikalen reduzieren [279], als
auch Enoylreduktasen, die im Rahmen der Fettsäurebiosynthese die Hydrierung von
Enoyldoppelbindungen katalysieren [280]. Die Aktivität bestimmter Vertreter der Familie
COG0604 wird durch xenobiotische Substrate induziert, weshalb den Enzymen eine Rolle in
der Zelldetoxifikation zugeschrieben wird [281]. Über die Funktion in der Biosynthese von
PKS-Metaboliten ist wenig bekannt. Einzig für die putative Enoylreduktase ActVI-ORF2
wurden Ergebnisse von Mutageneseexperimenten publiziert. Die Inaktivierung führte zur
Unterbrechung der Actinorhodinbiosynthese auf der Stufe von S-DNPA (4-Dihydro-9hydroxy-1-methyl-10-oxo-3-H-naptho-[2,3-c]-pyran-3-S-Essigsäure).
Aufgrund
dieser
Beobachtung wurde vorgeschlagen, dass ActVI-ORF2 die an C-15 stereospezifisch
ablaufende 1,4-Reduktion von S-DNPA zu 5-DDHK (5-Desoxydihydrokalafungin) katalysiert
(s. Abb. 86) [167]. Eine S-DNPA analoge Verbindung wird in der Mensacarcinbiosynthese
nicht erwartet (vgl. 4.5.3). Die Funktion von MsnO9 lässt sich daher nicht direkt aus der
Sequenzanalyse ableiten, sondern ist nur experimentell bestimmbar.
OH O
OH O
O
S-DNPA
H
ActVI-ORF2 ?
COOH
+2H
5-DDHK
H
O
H
COOH
Abb. 86: Postulierte Reaktion des MsnO9 ähnlichen Enzyms ActVI-ORF2 aus der Actinorhodinbiosynthese in
Streptomyces coelicolor A3(2).
136
Ergebnisse
Methyltransfer und S-Adenosylmethionin -Regenerierung (MsnM1 - M6)
Am 3'-Ende des msn-Clusters wird ein fast geschlossenes Enzymsystem zur Methylierung
(MsnM6) und zur Regenerierung des Methylgruppendonors S-Adenosyl-L-methionin (SAM)
(MsnM1 - M5) codiert. MsnM1 - M5 zeigen außergewöhnlich hohe AS-Sequenzübereinstimmung mit Enzymen des Aminosäure / C1-Stoffwechsels. MsnM1, wahrscheinlich
eine Adenosylhomocysteinase, katalysiert die hydrolytische Spaltung des aus dem
Methyltransfer hervorgegangenen S-Adenosyl-L-homocystein (SAH) in Adenosin und
L-Homocystein (s. Abb. 87). Letzteres kann durch MsnM3, das Ähnlichkeiten zu
Methioninsynthasen aufweist, mit dem Kosubstrat N5-Methyltetrahydrofolat (N5-MethylTHF) zu L-Methionin umgesetzt werden. Das Enzym MsnM5 hat signifikante
Sequenzähnlichkeiten mit SAM-Synthetasen und ist deshalb wahrscheinlich für die
Verknüpfung von L-Methionin mit dem Adenosylrest aus ATP verantwortlich. Dabei entsteht
SAM, das als Kosubstrat für die mögliche Methyltransferase MsnM6 dient. Enzyme der
SAM-Synthese und Regenerierung wurden vor kurzem erstmalig in Biosynthesewegen von
methylierten Sekundärmetaboliten identifiziert [225;240;243;245]. Auch im zur Zeit noch
nicht vollständig sequenzierten Polyketomycinbiosynthesegencluster lässt der am Rand des
sequenzierten Bereichs liegende Genabschnitt einer SAM-Synthetase auf ein Enzymsystem
zur SAM-Regenerierung schließen [38]. Der Vorteil, ein solches System auf dem
Biosynthesegencluster eines SAM-abhängig methylierten Sekundärstoffs zu implementieren,
ist offensichtlich. Dennoch scheinen zumindest in der Mensacarcinbiosynthese SAMSynthese oder Methyltransfer einen limitierenden Schritt darzustellen, da als
Vorläufersubstanzen vorwiegend nicht methylierte Derivate isoliert wurden [56].
Interessanterweise werden im msn-Cluster durch msnM2 und msnM4 zwei weitere Enzyme
codiert, die in Verbindung mit der SAM-Regenerierung stehen. Die mögliche N5,N10Methylen-THF-Reduktase MsnM2 stellt N5-Methyl-THF, das Kosubstrat von MsnM3 zur
Verfügung. Die mögliche Adenosinkinase MsnM4 katalysiert den ersten Schritt zur
Regenerierung von ATP aus Adenosin. Das Enzymsystem ist damit fast vollständig
geschlossen. Nicht auf dem msn-Cluster codiert werden Enzyme zur Umwandlung von THF
in N5,N10-Methylen-THF (s. Abb. 87, Reaktion A). Für die Reaktion A stehen in allen
Streptomyces spp. mit vollständig sequenziertem Genom [69-71] mehrere Enzyme zur
Verfügung, wie zum Beispiel Aminomethyltransferasen (EC 2.1.2.10) oder Glycinhydroxymethyltransferasen (EC 2.1.2.1). Auch für die Bereitstellung von ATP und NAD(P)
(s. Abb. 87, Reaktion B) muss auf Enzyme des Primärstoffwechsels zurückgegriffen werden.
Das abgeleitete Genprodukt von msnM6 enthält ein Methyltransferasemotiv (Pfam00891) und
zeigt Sequenzähnlichkeiten zu mehreren O- und C-Methyltransferasen, die SAM als Methyldonor verwenden. MsnO6 hat 32 - 36 % identische Aminosäuren mit den beiden C-Methyltransferasen OxyF aus der Oxytetrazyklinbiosynthese in Streptomyces rimosus [158] und
BenF aus der Benastatinbiosynthese in Streptomyces sp. A2991200 [282] sowie der
O-Methyltransferase MmcR aus der Mitomycinbiosynthese in Streptomyces lavendulae [283].
Die Funktion der Enzyme ist experimentell belegt. Methyltransferasen zeichnen sich durch
137
Ergebnisse
hohe Regioselektivität aus. So katalysiert OxyF ausschließlich die Methylierung des Rings C
seines Substrats Pretetramid [158]. Umso überraschender ist, dass den zwei Methylierungen
der Mensacarcinbiosynthese nur ein Methyltransferasegen im msn-Cluster gegenübersteht.
Bemerkenswert ist, dass ein Teil des Genabschnitts dieses Schlüsselenzyms der Mensacarcinbiosynthese bereits 2002 von A. Prestel bei der Untersuchung von Subklonen sequenziert und
als Homolog der O-Methyltransferase MmcR aus der Mitomycinbiosynthese [283]
eingeordnet wurde [160].
N
H2N
H
N
H
HN
N
O
O
N
O
OH
A
NAD(P)
MsnM2
N
OH
N
H
N5,N10-Methylen-THF
H2N
O
H
N
H
HN
N
O
O
HN
O
N5-Methyl-THF
H
HN
OH
N
H
O
O
N
H
H
N
N
H2N
NAD(P)+
OH
O
HN
THF
O
OH
O
SH
HO
NH2
L-Homocystein
L-Methionin
N
O
HO
NH2
N
HO
MsnM1
S
HO
MsnM3
NH2
N
N
OH
MsnM4
O
HO P O
OH
N
O
HO
Adenosin
NH2
N
OH
N
N
ATP
NH2
AMP
PPi + Pi
O
S
HO
MsnM5
B
H2O
O
OH
N
H
O
HO
O
N
NH2
N
OH
N
NH2
MsnM6
N
O
S
O
HO
N
NH2
N
OH
N
N
S-Adenosyl-L-methionin
S-Adenosyl-L-homocystein
Desmethylmensacarcin
HO
Mensacarcin
Didesmethylmensacarcin
Abb. 87: Vorgeschlagener Weg der O-Methylierungen in der Mensacarcinbiosynthese und
S-Adenosylmethionin-Regenerierung durch Msn-Enzyme. A, B: Durch Enzyme des Primärstoffwechsels
katalysierte Reaktionen (s. Text).
138
Ergebnisse
Mögliche Regulatoren (MsnR1, MsnR2)
Die Produktion von PKS II-Metaboliten wird in Abhängigkeit von Wachstum und
Umweltbedingungen präzise durch ein umfangreiches Netzwerk regulativer Elemente
koordiniert [193]. Über das Ausmaß der Produktion entscheiden Transkriptionsfaktoren,
deren Gene im Cluster des entsprechenden Sekundärstoffbiosynthesewegs liegen. Dazu
gehören Regulatoren der SARP-Familie (Streptomyces antibiotic regulatory protein). Sie
besitzen im Bereich der DNA-Bindungsdomäne ein geflügeltes helix-turn-helix (HTH) Motiv,
das dem des E. coli Regulators OmpR ähnlich ist [195]. Auf fast allen PKS II-Clustern mit
Ausnahme der Sporenpigmentbiosynthesegencluster sind SARP-Gene zu finden. MsnR1 hat
Ähnlichkeit zu Biosyntheseweg spezifischen (pathway specific) SARPs und teilt 38 %
identische, 53 % ähnliche AS mit dem funktionell charakterisierten Aktivator DnrI der
Daunorubicinbiosynthese in Streptomyces peuceticus [284].
Oft enthalten Regulatorgene für die Antibiotikabiosynthese in Streptomyces spp.
das in G+C-reichen Genomen sonst sehr seltene Leucincodon TTA [285;286]. Für
S. coelicolor A3(2) wurde gezeigt, dass TTA-Codons enthaltende Gene von der Expression
von bldA, dem Gen, das für die seltene tRNA UUA codiert, abhängig sind [287]. Die für die
Funktion als tRNA erforderliche Prozessierung des primären bldA-Transkripts setzt erst in
späteren Wachstumsphasen ein und bestimmt damit den Beginn der Antibiotikaproduktion
und die Ausbildung von Luftmyzel in S. coelicolor A3(2) [288].
Die beiden einzigen TTA-Codons des Mensacarcinbiosynthesegenclusters liegen im Bereich
von msnR2, was die Translation des Gens vom BldA-Regulationsmechanismus abhängig
macht.
MsnR2 ist ein Multidomänenprotein, das Ähnlichkeiten zu Transkriptionsregulatoren der
LuxR-Familie zeigt [289]. Die Suche nach konservierten Domänen (NCBI conserved domain
search, s. 5.14) identifizierte von AS-Position 128 - 369 die ATPase Domäne COG3899. Am
C-Terminus liegt eine AS-Sequenz, die sich gut mit dem HTH-Motiv vom LuxR-Typ
(PF00196, smart00421) deckt (s. Abb. 88). Namensgeber der LuxR-Familie ist ein Regulator,
der wie auch die bakterielle Luciferase vom lux-Cluster aus Vibrio harveyi / Vibrio fisheri
codiert wird [253]. In Antibiotika- / Zytostatikabiosynthesegenclustern sind LuxR-Gene
selten zu finden, können aber für die Expression der entsprechenden Enzyme essentiell sein.
Die Mutagenese von luxR ähnlichen Genen des Geldanamycinbiosynthesegenclusters in
Streptomyces hygroscopicus 17997 schaltete die Produktion des Ansamycins ab [256].
Konsensus ldsLspREreVLrllaqGksNkeIAdeLgiSekTVkvHrsnimrKLnvhsrvelirla
#MATCH
+ Ls Er V+ l
G sN e A +L+i
TV+ H++ i+rKL+++ r +l+ +
MsnR2 881 AALLSSAERRVAWLAGIGHSNREVATRLCITVSTVEQHLTKIYRKLGLKRREDLVTAV 938
Abb. 88: HTH-DNA-Bindungsdomäne vom LuxR-Typ (PF00196, smart00421) am C-Terminus des möglichen
Regulators MsnR2. Der Konsensus stammt aus einem Alignment bekannter PF00196-Sequenzen [217].
Großbuchstaben bedeuten einen hohen Konsens an der entsprechenden Position. +: ähnliche AS.
Ergebnisse
139
Hypothetische Proteine (MsnH0 - H8)
Für einige der angenommenen Genprodukte des msn-Contigs ließen sich über einen BLASTAbgleich mit der NCBI Datenbank ausschließlich Ähnlichkeiten zu Proteinfamilien
feststellen, deren funktionelle Charakterisierung noch aussteht.
Der Genabschnitt von MsnH0 liegt außerhalb des durch Transposasen begrenzten msnClusters. Genprodukte mit ca. 60% identischen Aminosäuren lassen sich von Genomen
verschiedener Actinobacteria und Proteobacteria-Arten ableiten. Es handelt sich bei MsnH0
um ein konserviertes, hypothetisches Protein mit unbekannter Funktion.
Ähnlich stellt sich die Situation für MsnH1 dar. Dieses Protein besitzt eine Domäne der
Pfam09964, deren Funktion unbekannt ist.
Ein Protein, das über seine gesamte AS-Sequenzlänge mit MsnH2 in Deckung gebracht
werden kann, ist in der NCBI-Datenbank noch nicht bekannt. In der Nähe des C-Terminus
trägt MsnH2 ein Motiv, ähnlich der ATP-Bindedomäne eines ABC-Transporters (CD03278).
MsnH3 ähnliche Genprodukte aus Streptomyces ambofaciens ATCC 23877 und Streptomyces
coelicolor A3(2) sind als mögliche Regulatoren beschrieben, eine rein hypothetische
Annotierung.
MsnH4, ein aus nur 162 AS bestehendes Protein, zeigt am N-Terminus Sequenzähnlichkeiten
mit Epoxidasen und Hydroxylasen. Die ersten 66 Aminosäuren von MsnH4 lassen sich per
BLAST-Algorithmus (s. 5.14) gut mit dem 473 AS großen Protein AmbJ aus der
Ambruticinbiosynthese in Sorangium cellulosum [290] zur Deckung bringen (36 %
identische, 50 % ähnliche AS). AmbJ ähnelt Epoxidasen aus der Biosynthese von Polyethern
wie Monensin [291] und Nanchangmycin [292], die Epoxidierungen von Doppelbindungen
mit anschließender, etherbildender SN2-Substitution katalysieren [293]. Die Inaktivierung von
AmbJ führte zur Akkumulation von Ambruticin J, weshalb auch für AmbJ eine analoge
Funktion postuliert wurde [290] (s. Abb. 89).
Der C-Terminus von MsnH4 deckt sich mit ca. 80 AS langen Abschnitten von postulierten
Fettsäureoxygenasen (36 % identische AS).
Da sich die festgestellten Sequenzähnlichkeiten von MsnH4 jeweils nur auf einen kurzen
Bereich der verglichenen Enzyme beziehen, bleibt die Funktion des Proteins unklar. Die
Gemeinsamkeiten mit Epoxidasen machen MsnH4 dennoch zu einem interessanten Target für
Geninaktivierungen zur Aufklärung der Mensacarcinbiosynthese.
140
Ergebnisse
Abb. 89: Ausschnitt aus dem
hypothetischen Biosyntheseweg von
Ambruticin in Sorangium cellulosum.
Aus [290] übernommen.
Die Suche nach konservierten Domänen in der Sequenz von MsnH5 führte zur Detektion
eines für Phosphotransferasen (Familie PF01636 [217]) typischen Bereichs, der sich fast über
die gesamte Sequenzlänge erstreckt. Zur Familie PF01636 gehören vor allem die
resistenzvermittelnden Aminoglykosidphosphotransferasen, aber auch Kinasen des
Aminosäurestoffwechsels wie die Homoserinkinase. Auch wenn sich die durch MsnH5
übertragene Gruppe vorhersagen lässt, bleibt ein möglicher Akzeptor unbestimmt. Diese
Rolle könnte sowohl einem Msn-Enzym als auch Mensacarcin selbst zukommen.
Am N-Terminus von MsnH6 konnte eine S-Adenosyl-L-homocysteinhydrolase-Domäne
(cl00931) identifiziert werden. MsnH6 kann mit SnoaW aus der Nogalamycinbiosynthese
[179], FrnS aus der Frenolicinbiosynthese [276] sowie Hed-OrfH10 aus der Hedamycinbiosynthese [273] zur Deckung gebracht werden. Die Funktion der Proteine ist nicht
experimentell belegt. Für SnoaW und Hed-OrfH10 wurde Hydroxylaseaktivität
vorgeschlagen [179;273].
MsnH7 zeigt hohe AS-Sequenzübereinstimmung mit möglichen Hydrolasen, wie zum
Beispiel CvmH aus Streptomyces clavuligerus oder dem "LanU-like protein" KinU aus dem
Kinamycinbiosynthesegencluster von Streptomyces murayamaensis [294]. Unter den MsnH7
ähnlichen Proteinen der NCBI-Datenbank finden sich auch mögliche Thioesterasen. Über den
BLAST-Algorithmus wurden keine signifikanten Ähnlichkeiten zu möglichen Thioesterasen
der PKS II-Biosynthese (GrhD: Griseorhodin, MtmZ: Mithramycin) detektiert.
MsnH8 besitzt einen Teil der Pfam05977-Domäne, der als konservierter Bereich in
verschiedenen Proteinen auftritt, die als mögliche Transmembrantransporter annotiert sind.
Im BLAST-Abgleich fällt auf, dass alle ähnlichen Proteine aus der NCBI-Datenbank eine
Länge von über 400 AS aufweisen. Es ist deshalb fraglich, ob es sich bei MsnH8 um ein
funktionales Protein handelt. Der Frameplot-Graph bestätigt die vorgenommene Festlegung
des ORFs.
141
Ergebnisse
3.3.6 Vergleich von msc- und msn-Cluster auf Proteinebene
Bei den Sequenzanalysen von msc-Cluster und msn-Cluster stellte sich heraus, dass oft
dasselbe schon publizierte Enzym gleichzeitig als nächster Verwandter von aus beiden
Clustern abgeleiteter Proteine auftrat. Besonderes Interesse galt nun der Fragestellung in wie
weit sich die Enzyme der beiden Cluster selbst ähneln.
Im ersten Schritt des Vergleichs wurde mit Hilfe der Software CloneManager (s. 5.14) für
jedes Msn-Protein zusammen mit allen abgeleiteten Genprodukten des msc-Clusters ein
phylogenetischer Stammbaum nach dem BLOSUM 62-Algorithmus erstellt. Der zweite
Schritt war ein paarweises BLAST-Alignment des Msn-Proteins mit seinem Msc-Analogon.
Nur Sequenzpaare, die auch nach dem BLAST-Algorithmus signifikante Ähnlichkeit zeigen,
sind in Tab. 15 gelistet. Vom linken Ende der Contigs ausgehend sind msnO1 bzw. msc12 die
ersten Gene, deren abgeleitete Produkte Ähnlichkeiten zu Proteinen des jeweils anderen
Biosynthesewegs aufweisen. Gene, deren abgeleitete Produkte mindestens 40 % identische
Aminosäuren über die gesamte Sequenzlänge teilen sind in Abb. 90 miteinander verbunden.
Tab. 15: Msn-Msc-Proteinpaare ähnlicher AS-Sequenz. In Reihenfolge des msn-Clusters.
Msn
% ID /
% ähnl.
Msc
O1
51 /
63
26
O2
65 /
79
21
O3
46 /
63
22
H5
52 /
64
23
K2
61 /
73
15
K1
70 /
81
14
Msn
% ID /
% ähnl.
Msc
O7
36 /
47
27
C22
53/
65
252
O8
51 /
62
32
O9
53 /
68
36
O10
33 /
33 /
50
45
26 N 38 C
-
O4
52 /
68
21
O5
33 /
57
27 N
C13
30 /
47 /
45
58
122
291
K3
48 /
61
16
O11
69 /
79
38
C32
52 /
63
122
31 /
45
24
35 /
52
30
36
38
H6
-
R1
1
Eindomänen-Cyclase, 2Zweidomänen-Cyclase, 3Dreidomänen-Cyclase.
N: Ähnlichkeit des N-Terminus, C: Ähnlichkeit des C-Terminus
O1 O2 O3 H5 K2 K1
12 16 15
0 kb
14
O4
C2 O8 O9 K3 O11 C3
21 22 23
10 kb
25 26
32
20 kb
30 kb
Abb. 90: Organisation der msn- und msc-Genloki und deren funktionell verwandte Biosyntheseenzyme.
O6
-
142
Ergebnisse
Hervorzuheben ist, dass beide Biosynthesegencluster Gene enthalten, die für Luciferase
ähnlichen Oxidoreduktasen codieren - Enzyme, die erstmals in S. sp. Gö C4/4 im Zusammenhang mit PKS II-Clustern auftreten. Dabei fällt vor allem die konservierte, transkriptionelle
Verbindung der Gene msnH5-msnO3-msnO2 bzw. msc23-msc22-msc21 auf. Abgeleitete
Genprodukte sind ein hypothetisches Protein, eine FMN-Reduktase und eine Luciferase
ähnliche Oxidoreduktase. Der biochemische Zusammenhang von FMN-Reduktase und
Luciferase ähnlicher Oxidoreduktase ist bekannt [253]. Zu untersuchen bleibt eine mögliche
Involvierung des hypothetischen Proteins MsnH5 bzw. Msc23, das eine Phosphotransferasedomäne aufweist. Auch für weitere Proteine zeichnen sich deutliche Ähnlichkeiten ab.
3.3.7 Weiterführende Untersuchungen zur Biosynthese von
Mensalon, Aloesol und der Substanz MSC-X1
3.3.7.1 Genetischer Ursprung und Identität der Substanz MSC-X1
Mit der Inaktivierung von msc15 (ksβ) kam die Produktion der Substanz MSC-X1 fast
vollständig zum Erliegen (s. 3.3.2.5). Im Gegensatz dazu wird die MSC-X1-Produktion durch
einen Gendefekt in der minimalen PKS des msn-Clusters (∆msnK1) gesteigert. Mutationen
der minimalen PKS beider Cluster gehen mit einem vollständigen Stopp der MSC-X1Produktion einher (s. Abb. 91). Aus diesen Ergebnissen lässt sich ableiten, dass die
Biosynthese der Substanz MSC-X1 dem msc-PKS II-Cluster zuzuordnen ist. Die schwache
Produktion trotz Knockout des msc-ksβ-Gens könnte auf Komplementierung durch das
entsprechende Gen aus dem msn-Cluster zurückgeführt werden. Da auch umgekehrt, bezogen
auf die Mensacarcinproduktion, eine Komplementierung beobachtet wird (s. 3.3.5.2), kann
von Kreuzkomplementierung gesprochen werden.
Von Interesse war, ob sich die Doppelmutante S. sp. Gö C4/4 ∆msc15 ∆msnK1 durch
Einführung eines intakten msc15-Allels bezüglich der MSC-X1-Produktion komplementieren
lässt. Dazu wurde Cos4 über intergenerische Konjugation (s. 5.7.2) in die Doppelmutante
eingebracht. Die MSC-X1-Produktion konnte jedoch nicht wiederhergestellt werden. Parallel
wurden die Auswirkungen einer zusätzlichen Kopie des msc-Contigs durch Integration von
Cos4 ins Genom des Wildtyps S. sp. Gö C4/4 untersucht. Erstaunlicherweise kam es zur
vollständigen Repression der Mensacarcinproduktion bei dem Wildtyp entsprechender
Produktion von MSC-X1 (Daten nicht gezeigt). Die heterologe Expression von Cos4 in
S. albus führte nicht zur Produktion von MSC-X1.
143
Ergebnisse
Mit einem hochauflösenden Hybrid-Massenspektrometer (LC/ESI-MS/MS Anordnung mit
LTQ-Orbitrap, s. 5.11.7) wurde versucht, die exakte Masse von MSC-X1 zu bestimmen.
In den Kulturextrakten sind weitere Substanzen mit der aus m/z-Werten abgeleiteten
Molekülmasse von 340 vorhanden. Mit der Methode mens03 können sie vom MSC-X1
zugeordneten MS-Peak getrennt werden (s. Abb. 91). Bei der Bestimmung der exakten Masse
überlagerten sich die Signale jedoch.
Die unter 3.3.2.4 getroffene Zuordnung des MSC-X1-Absorptionsspektrums zum negativ
geladenen Ion mit m/z 339 konnte durch die Verwendung eines alternativen Gradienten über
LC/MS-Analysen abgesichert werden. Für die dem msc-Cluster zugeordnete Substanz wird
eine Molekülmasse von 340 vorgeschlagen.
int.
[%]
80
mAU
339 neg.
40
40
20
0
0
300
mAU
10
0
0
mAU
10
0
0
mAU
10
0
0
mAU
10
0
0
400
500 nm
20
20
10
20
30
40 min.
30
int.
1000
500
0
40 min.
0
10
20
30
40 min.
30
int.
1000
500
0
40 min.
0
10
20
30
40 min.
30
int.
1000
500
0
40 min.
0
10
20
30
40 min.
∆msc15
10
20
∆msnK1 ∆msc15
10
20
m/z
30
Wildtyp
10
360
int.
1000
500
0
40 min.
0
∆msnK1
10
260
Abb. 91: LC/MS-Analytik der Substanz MSC-X1 von Kulturextrakten des S. sp. Gö C4/4 Wildtyps und
Ketosynthase-Knockoutmutanten. In der rechten Spalte werden die Chromatogramme bei λ = 400 nm
verglichen, links die MS-Spuren für m/z = 339 im negativen Detektionsmodus (Methode: mens03, s. 5.11.6).
144
Ergebnisse
3.3.7.2 Biogenese der Substanz MSC-X1
Polyketide mit biosynthetischem Ursprung aus der bakteriellen Polyketidsynthese entstehen
durch enzymatische Verknüpfung einer Startereinheit (meist Acetyl-ACP) mit einer
bestimmten Anzahl an Molekülen Malonyl-CoA, die nach Decarboxylierung je zur
Kettenverlängerung um eine Acetateinheit führen (s. 1.2.1). Aufgrund von Geninaktivierungen und anschließender Produktionskontrolle konnte die Biosynthese der
Substanz MSC-X1 dem msc-Cluster, einem PKS II-Cluster, zugeordnet werden. Die Herkunft
von MSC-X1 aus dem Polyketidstoffwechsel kann auch durch Fütterung der isotopmarkierten
Vorläufersubstanz [1,2-13C2]-Acetat überprüft werden. Aus Acetat wird durch das Enzym
Acetyl-CoA-Synthetase (ACS) Acetyl-CoA und daraus mit dem Enzym Acetyl-CoACarboxylase (ACC) Malonyl-CoA gebildet [295]. Die nachträglich eingebrachte, nicht
markierte Carboxylgruppe von Malonyl-CoA wird bei der Polyketidsynthese durch
Decarboxylierung wieder entfernt (vgl. 1.2.1). Folglich ist eine Markierung aller
Kohlenstoffatome anzunehmen, die aus der Kettenverlängerung des Polyketidstoffwechsels
sowie Acetyl-CoA oder Malonyl-CoA als Startereinheit stammen. Für weniger übliche
Startereinheiten [23] muss deren Biosynthese im Einzelfall betrachtet werden.
Die Mutante S. sp. Gö C4/4 ∆msnK1 (s. 3.3.5.2) eignet sich besonders für ein Fütterungsexperiment mit [1,2-13C2]-Acetat, da in ihr die ebenfalls Malonyl-CoA verbrauchende
minimale PKS der Mensacarcinbiosynthese blockiert ist. Dies äußerte sich in einer
verstärkten Produktion der Substanz MSC-X1 (s. Abb. 91).
Tab. 16: Für die Substanz MSC-X1 wurde im negativen Detektionsmodus mit Elektrosprayquelle folgendes
Intensitätsverhältnis der Signale gemessen.
Substanz MSC-X1
m/z
Zuordnung
(neg. Modus)
339
[M−H]−
340
[M+1−H]−
341
[M+2−H]−
Mensacarcin (Vergleich)
m/z
Zuordnung
(neg. Modus)
419
[M−H]−
420
[M+1−H]−
421
[M+2−H]−
unter Zugabe von
[1,2-13C]-Acetat
100
36,1
37,2
unter Zugabe von
[1,2-13C]-Acetat
100
34,3
29,8
Intensität [%]
ohne Zufütterung
100,0
22,2
3,5
Intensität [%]
ohne Zufütterung
100,0
24,1
4,9
ohne Zufütterung,
berechnet*
100,0
21,0
3,3
ohne Zufütterung,
berechnet*
100,0
23,3
4,4
* Die Berechnung erfolgte mit ChemDraw 9 (s. 5.14) unter Berücksichtigung der natürlichen Isotopenverteilung
der beteiligten Elemente und einer hypothetischen Summenformel C19H16O6 für MSC-X1 (Bei Annahme eines
decarboxylierten Decaketids mit Mensacarcin ähnlichem Faltungsmodus).
Zu 100 mL einer Standardkultur (s. 5.3.1.4) der Mutante wurden mit dem Animpfen 50 mg
[1,2-13C2]-Acetat (suspendiert in 200 µL Methanol) gefüttert. Um eine Streuung der
Ergebnisse
145
markierten Kohlenstoffatome zu vermeiden wurde die Kultivierung bereits nach drei Tagen
abgebrochen. Der Ethylacetatextrakt (s. 5.11.1.1) wurde per LC/MS analysiert (s. 5.11.6,
Methode: mens03).
Die Signalintensität des M+2-Isotopensatelitten hat sich durch mit dem doppelt markierten
[1,2-13C2]-Acetat vervielfacht. Parallel verhalten sich die Signale des in geringen Mengen im
Extrakt vorhandenen Mensacarcins. Die Veränderung lässt darauf schließen, dass vor allem
intakte Acetateinheiten eingebaut wurden. Die biogenetische Herkunft der Substanz MSC-X1
aus dem Polyketidstoffwechsel kann bestätigt werden.
3.3.7.3 Genetische Basis von Mensalon und Aloesol
Unter Zusatz von 2 % DMSO zum Kulturmedium bildet der Stamm S. sp. Gö C4/4 verstärkt
die beiden Metaboliten Mensalon und Aloesol (s. 3.3.1). Die Strukturen von Mensalon und
Aloesol mit alternierend auftretenden Sauerstofffunktionen erlauben die Hypothese einer
Herkunft der Substanzen aus dem Polyketidstoffwechsel. Die Kettenlänge von je
13 Kohlenstoffatomen deutet dabei auf das Vorliegen von Heptaketiden hin, deren
Säurefunktion durch Decarboxylierung entfernt wurde. Da aromatische Polyketide
gewöhnlich über eine Polyketidsynthase vom Typ II zusammengesetzt werden [23], wurde
dieser Biosyntheseweg auch für Mensalon und Aloesol postuliert.
Die heterologe Expression von Cos2 in S. albus zeigte, dass Gene des msn-Clusters die
Produktion der beiden Metaboliten auslösen können (s. 3.3.5.1). Diese Beobachtung ist ein
Hinweis darauf, dass Gene des msn-Clusters auch im Ursprungsstamm S. sp. Gö C4/4 an der
Biosynthese von Mensalon und Aloesol beteiligt sind. Produktionsprofile von ks-Mutanten
bei Zusatz von 2 % DMSO zum Kulturmedium sollten darüber Auskunft geben, ob die
Produktion der beiden Heptaketide allein vom msn-Cluster abhängt.
Wie aus Abb. 92 hervorgeht bleibt die Mensalon- / Aloesolproduktion von der Inaktivierung
des ksβ-Gens (msc15) aus dem msc-Cluster unbeeinflusst. Im Gegensatz dazu sind nach der
Inaktivierung eines Gens der Msn-KS nur noch Spuren der Sekundärstoffe detektierbar.
Parallel vorliegende Gendefekte in ks-Genen beider Cluster verhindern die Produktion der
Heptaketide vollständig.
Die Analyse zeigt, dass sowohl die Msc- als auch Msn-KS zur Produktion von Mensalon /
Aloesol beitragen können, wobei die Biosyntheseleistung der Msc-KS deutlich geringer ist.
Kein weiteres PKS II-Cluster führt zur Produktion der Heptaketide, wie aus dem Produktionsspektrum der Doppelmutante hervorgeht.
146
Ergebnisse
int.
2000
Mensalon
Wildtyp
1000
0
0
int.
2000
m/z = 233 neg.
Aloesol
10
20
30
40
min.
10
20
30
40
min.
40
min.
40
min.
∆msc15
1000
0
0
int.
2000
int.
∆msnK1
100
50
0
1000
0
0
int.
2000
10
∆msc15 ∆msnK1
1000
0
0
10
12
14
20
min.
30
int.
100
50
0
12
20
14
min.
30
Abb. 92: LC/ESI-MS Diagramme von Kulturextrakten des S. sp. Gö C4/4 Wildtyps und Mutanten bei 2 %
DMSO im Medium. Der m/z-Wert 233 im negativen Detektionsmodus entspricht dem [M−H]− Ion von
Mensalon oder Aloesol (Methode: mens03, s. 5.11.6).
Diskussion
4
Diskussion
4.1
Biokatalytische Verwendung des Xenobiotikametabolismus
von Bodenbakterien
147
4.1.1 Glykokonjugate: spezifische Markenzeichen der Lebewesen
Ausgehend von Rhamnosylierungen der Anthrachinonderivate Alizarin und Emodin wurde
eine Bibliothek, bestehend aus 40 Naturstoffen und synthetischen Molekülen, auf Biotransformation im Bodenbakterium Saccharothrix espanaensis untersucht (s. 3.1). Im intensiv
erforschten menschlichen Xenobiotikametabolismus sind es vor allem Phenole,
Anthrachinone, Flavonoide, Opioide, Steroide und Coumarine, die als Phase II-Biotransformation eine Glykosylierung erfahren [296]. Entsprechend wurde auch die
Substanzbibliothek für S. espanaensis zusammengestellt. Bei den sieben durch Massenspektrometrie, NMR-Spektroskopie und zum Teil durch Circulardichroismus charakterisierten
glykosylierten Biotransformationsprodukten handelt es sich um α-L-Rhamnoside mit
O-glykosidisch verknüpfter Zuckereinheit. Die LC/MS-analytische Auswertung der Biotransformation aller gefütterten Substanzen ergab keinen Hinweis darauf, dass von S. espanaensis
weitere Zucker zur Konjugatbildung eingesetzt werden.
Die hohe Donorspezifität der Glykosylierungsaktivität ist nicht überraschend. Eine Literaturrecherche (s. Tab. 17) zeigt, dass die Struktur der verknüpften Zuckereinheit ein spezifisches
Markenzeichen des metabolisierenden Lebewesens ist. Nur in Ausnahmefällen beherrscht ein
Organismus die Glykosylierung von Xenobiotika mit unterschiedlichen Donoren. Ein Beispiel
ist der Pilz Coriolus versicolor (s. Tab. 17). Die Modellpflanze Arabidopsis thaliana besitzt
einen Pool von über 100 Glykosyltransferasen zur Bildung von β-D-Glucosiden und
α-L-Rhamnosiden kleiner, lipophiler Moleküle [297]. Die Enzyme aus A. thaliana sind jedoch
vorrangig dem Sekundärstoffwechsel zuzuordnen, da unter natürlichen Bedingungen die
Umsetzung endogener Substrate überwiegt. Bei den Wirbeltieren ist β-D-Glucuronsäure der
typische Bestandteil der Glykokonjugate [296]. Für Bakterien, Pilze und Pflanzen wird vor
allem D-Glucose, seltener L-Rhamnose, als Konjugationspartner beschrieben. Weitere Zucker
bleiben die Ausnahme.
Die Wahl des Zuckers hängt nicht von dessen Verbreitung im Konjugat bildenden
Organismus ab, sondern ist präzise auf die Eigenschaften des Lebewesens abgestimmt. Im
menschlichen Körper ist D-Glucose der häufigste Zucker [4]. Trotzdem ist D-Glucuronsäure
der einzige Zucker, der in Phase II-Reaktionen konjugiert wird. Durch die dissoziierende
Säuregruppe besitzen Glucuronide bereits im neutralen Milieu eine deutlich höhere Wasserlöslichkeit als Glucoside und können deshalb besser renal eliminiert werden. In der Literatur
wird davon ausgegangen, dass alle Produkte des zytoplasmatischen Glykosyltransfers durch
aktiven Transport aus der Zelle ausgeschleust werden [298]. Die lipophilen Aglyka können
passiv durch Diffusion in die Zellen eindringen, der Transport der polaren Glykoside aus der
148
Diskussion
Zelle hinaus ist an spezifische Transmembrantransporter gebunden. Eine effektive
Eliminierung wird durch die Abstimmung des verknüpften Zuckers mit der Spezifität
vorhandener Transporter erreicht. Xenobiotika und endogene Sekundärstoffe werden deshalb
oft mit dem gleichen Zucker konjugiert. Der Menschen konjugiert endogenes Bilirubin wie
auch exogenes Morphin mit D-Glucuronsäure [296]. Im Stoffwechsel von Streptomyces
griseoviridis Tü3634 tritt α-L-Rhamnose sowohl als Bestandteil endogener Carbonsäureester
[299], als auch in Biotransformationsprodukten von Emodin auf (s. 3.1.8).
Tab. 17: Glykokonjugatbildner aus der Literatur. Vertreter der Ordnung Actinomycetales wurden möglichst
vollständig erfasst. Erweitert wurde die Tabelle mit ausgewählten Lebewesen aller bekannten Reiche. Wenn
nicht anders angegeben sind die Produkte O-Glykoside.
Name
Bakterien
Bacillus cereus
Zucker
Aglyka
Referenz
β-D-Glucose
[300;301]
Saccharothrix
australiensis
Saccharothrix
espanaensis
Streptomyces sp.
GöM1
Streptomyces sp.
LS136
Streptomyces sp.
Q53834
Streptomyces
aureofaciens B96
Streptomyces
coelicolor A3(2)
Streptomyces
griseoviridis
Tü3634
Streptomyces
lavendulae
SANK 64687
Pilze
Absidia coerulea
Beauveria bassiana
ATCC 7159
Coriolus versicolor
α-L-Rhamnose
diverse Flavonoide, GT
identifiziert
Emodin
Cunninghamella
elegans var.
elegans
2 verschiedene
Pilze
diverse Pilze
s. 3.1.8
α-L-Rhamnose
Anthrachinone, Flavonoide,
s. 3.1
Coumarine, Polyphenole
6-Desoxy-α-L-talose Benzoesäurederivate, Konjugate: [302]
Ester und Glykoside
α-L-Rhamnose
Lignane
[303]
β-D-Glucose
Brefeldin A
[304]
β-D-Glucose
diverse Anthrachinone und
Anthrazykline, Tetrazykline
Emodin
[305-307]
s. 3.1.8
aromatische Carbonsäuren,
Emodin, Konjugate: Ester und
Glykoside
japanische Patentschrift, u. a.
2,6-Dihydroxyanthrachinon und
Thielavin A
[299;308310],
s. 3.1.8
JP,02211892,A
(1990)
Anthrachinone
Anthrachinone, Flavonoide
Konjugate: N- und O-Glykoside
Lignine
[311]
[110;312]
Hexose, evtl.
β-D-Glucose
α-L-Rhamnose
α-L-Rhamnose
β-D-Glucose
β-D-Methylglucose
β-D-Xylose,
β-D-Glucose
β-D-Glucose
[313]
Xanthohumol, Konjugate: auch
Diglucosid
[314]
β-Ribose
ein Xanthonderivat
[315]
β-D-Glucose
Benzosampagin (polycyclisches
Alkaloid)
[316]
149
Diskussion
Name
Pflanzen
diverse GTs aus
Arabidopsis thaliana
UGT78D1 aus
Arabidopsis thaliana
Tiere
Wirbeltiere
Zucker
Aglyka
Referenz
β-D-Glucose
Benzoate, Kaffeesäure,
Flavonoide, Coumarine
Quercetin: in vitro und
heterolog in vivo
[317;318]
[296]
Bombyx mori
(Seidenspinner)
β-D-Glucose
Phenole, Anthrachinone,
Flavonoide, Opioide, Steroide,
Coumarine, weitere
Quercetin
α-L-Rhamnose
β-D-Glucuronsäure
[319]
[320]
Innerhalb eines Lebewesens entstehen oft Glykokonjugate, die sich in ihrer
Verknüpfungsposition mit dem Aglykon unterscheiden (vgl. 3.1.1.1). Die einzelnen Enzyme
hingegen zeichnen sich oft durch eine hohe Regioselektivität aus. In diesem Zusammenhang
besonders erforscht ist die Glykosylierung von Quercetin durch unterschiedliche menschliche
und pflanzliche Glykosyltransferasen, die jeweils in ihrer Gesamtheit zum typischen
Spektrum an Quercetinmetaboliten in den Organismen beitragen [319;321;322]. Die
menschliche UGT2B7 bildet bevorzugt das 3-O-Glucuronid des Arzneistoffs Morphin. Das
stark analgetisch wirksame 6-O-Glucuronid entsteht nur in geringem Ausmaß [119;323]. Aus
der begrenzten Regioselektivität von UGT2B7 ergibt sich ein Vorteil, da das Enzym auch für
die 6-O-Glucuronidierung von Codein eingesetzt werden kann, in dessen Struktur sich an C-3
eine Methoxygruppe befindet. Auch bei der Biotransformation von Xenobiotika in
S. espanaensis kommt es zur Bildung von Regioisomeren, was aus NMR- (s. 3.1.1.1) und
LC/MS-Daten (s. Tab. 4, Tab. 5, Tab. 6) hervorgeht. Eine Aussage darüber, ob eine oder
mehrere Glykosyltransferasen in die beobachteten Reaktionen einbezogen sind, kann nicht
getroffen werden. Von bakteriellen Genomen werden jedoch meist nicht mehr als fünf
unterschiedliche Glykosyltransferasen des Xenobiotikametabolismus codiert [301;324].
4.1.2 Die Glykosylierung endo- und exogener Moleküle:
ein überlebenswichtiges Prinzip
4.1.2.1 Im Menschen
Das Crigler-Najjar Syndrom Typ I ist eine autosomal rezessiv übertragene Erbkrankheit des
Menschen [325;326]. Sie ist charakterisiert durch die Unfähigkeit, den hydrophoben,
endogenen Sekundärstoff Bilirubin in leicht zu eliminierende Glucuronide zu überführen
[327]. Wegen der Akkumulation des unkonjugiert neurotoxischen Bilirubins sind
Neugeborene mit dem Crigler-Najjar Syndrom Typ I nur mit sofortiger Lebertransplantation
als Methode der chirurgischen Gentherapie überlebensfähig [296]. Ein Teilverlust der
Glucuronidierungsaktivität tritt klinisch als Crigler-Najjar Syndrom Typ II oder als
150
Diskussion
Meulengracht-Krankheit in Erscheinung. Die Ursache sind stets Mutationen des
Glykosyltransferasegens UGT1A1 oder dessen Promotor, die zum vollständigen (C.-N. Typ I)
oder anteiligen (C.-N. Typ II, Meulengracht-Krankheit) Verlust der Enzymaktivität führen.
Die humane Glykosylierung von Fremdstoffen scheint auch eine wichtige Bedeutung in der
Abwehr chemischer Carcinogenese zu haben. Hinweise darauf ergeben sich aus Experimenten
mit Ratten, bei denen der gesamte UGT1A-Locus durch eine Mutation inaktiviert ist. Die
Produktion von Benzo(a)pyrenglucuroniden ist stark reduziert und führt zur vermehrten
Bildung von DNA-Addukten [296]. Durch Glykosylierung kann sowohl das mutagene
Potential von Fremdstoffen reduziert, als auch deren Elimination beschleunigt werden. Ein
interessantes Ergebnis liefern vergleichende Untersuchungen der UGT1A-Expressionsprofile
in gastrointestinalen Tumoren und gesundem umgebenden Gewebe. Es ist eine deutliche
Minderexpression der Glykosyltransferasegene in malignen Geweben, nicht jedoch bei
benignen Wucherungen festzustellen [328]. Die Frage, ob die Tumore auf die durch UGTMangel verminderte Chemoprotektion zurückzuführen sind oder ob die Minderexpression
durch den Tumor bedingt ist, bleibt offen.
4.1.2.2 In Pflanzen
Im Gegensatz zu den 15 bisher identifizierten menschlichen UGT cDNAs können
Kormophyten genetische Informationen für über 100 UDP-abhängige Glykosyltransferasen
tragen [297], die für die bekannte Vielfalt der Glykosylierungsmuster pflanzlicher
Sekundärstoffe verantwortlich sind. Eine relaxierte Akzeptorflexibilität, ähnlich jener der
menschlichen UGTs, erlaubt auch die Glykosylierung exogener Substrate in Zellkulturen
[329] oder mit isolierten Enzymen [330].
Die überlebenswichtige Bedeutung der mit dem Sekundärstoffwechsel verbundenen
Glykosyltransferasen in planta wird erst durch aktuelle Studien deutlich [297]. Die
Expression von Glykosyltransferasegenen ist in ein Regelwerk zur Aufrechterhaltung der
hormonellen Homeostase eingebunden. UGT84B1 katalysiert in vitro die Glykosylierung des
Pflanzenhormons Indol-3-essigsäure. Bei Überexpression in Arabidopsis thaliana resultierte
ein Auxinmangelphänotyp [331]. In einem anderen Beispiel wurden Tabakpflanzen durch
Herunterregulierung ihrer Glykosyltransferasegenexpression anfälliger für Infektionen mit
dem Tabakmosaikvirus [332]. Die Befähigung von A. thaliana zur Glykosylierung des
Mykotoxins Desoxynivalenol führt zur Resistenz. Durch heterologe Expression der
UGT73C5 konnte diese Eigenschaft auf Hefezellen übertragen werden [333].
Wie auch beim Menschen löst der pflanzliche Glykosyltransfer logistische Probleme. Durch
die Erhöhung der Wasserlöslichkeit werden zuvor hydrophobe Stoffe in der Vakuole
deponierbar und können durch zuckerspezifische Transporter erkannt werden [334].
Diskussion
151
4.1.2.3 In Bakterien
Bei den Glykosiden bakterieller Sekundärstoffe dominieren in der Natur ansonsten seltene
Amino- und Desoxyzucker [335]. Bei bestimmten antibiotisch oder zytostatisch wirksamen
Sekundärstoffen ist eine Aminozuckereinheit für die von Menschen angestrebte Wirkung
unbedingte Vorraussetzung. Die Funktion und Spezifität von Sekundärstoffbiosynthese
assoziierten Glykosyltransferasen wird intensiv erforscht [336]. Akzeptorflexible Enzyme wie
AraGT [54], DesVII [337], UrdGT2 [338], VinC [339] bleiben hier die Ausnahme.
Bakterielle Xenobiotika metabolisierende Glykosyltransferasen sind aufgrund ihrer Aminosäuresequenz oft deutlich von den entsprechenden Enzymen der Antibiotikabiosynthese
abzugrenzen (vgl. Abb. 93), können jedoch auch eine Funktion im Sekundärstoffwechsel
übernehmen. Ein klassisches Beispiel dafür sind OleD und OleI aus dem Oleandomycinproduzenten Streptomyces antibioticus [149;340]. Der von diesen Enzymen vermittelte
Transfer von D-Glucose auf das endogene Makrolidantibiotikum führt im Sinne eines
Resistenzmechanismus zu dessen Inaktivierung - eine überlebenswichtige Glykosylierung.
Das Genprodukt des clusterassoziierten Gens oleI weist dabei eine höhere Spezifität auf als
jenes von oleD auf. Durch die Akzeptorflexibilität von OleD ist der Stamm auch gegen
weitere Makrolide resistent [341].
Hinweise darauf, dass die Glykosylierung exogener Moleküle, wie sie in der vorliegenden
Arbeit in S. espanaensis beobachtet wurde, eine Schutzreaktion des Bakteriums darstellen,
gibt eine vergleichende Untersuchung der antibiotischen Aktivität von Anthrachinonen sowie
deren Glykosiden [342]. Aglyka und Glykoside wurden in Konzentrationen bis 1024 µg/mL
auf wachstumshemmende Wirkung (MIC) gegen Escherichia coli K12, Pseudomonas
aeroginosa PAO1 sowie verschiedene Methicillin sensitive und resistente Stämme von
Staphylococcus aureus getestet. Bei keinem der Glykoside konnte eine Hemmung festgestellt
werden, die Anthrachinonaglyka führten bereits in Konzentrationen ab 2 µg/mL zur
Wachstumsinhibition.
4.1.3 Phase I- und Phase II-Reaktion versus Biodegradation
Eine Alternative zur Funktionalisierung und Konjugation eines Xenobiotikums ist seine
Degradation zu untoxischen Produkten oder sogar zu Metaboliten, die gewinnbringend in den
Primärstoffwechsel eingebracht werden können. Aufbauende und abbauende Biotransformationsreaktionen laufen gleichzeitig ab. Bei der aufbauenden Biokatalyse in
Ganzzellsystemen, wie der Rhamnosylierung durch Saccharothrix espanaensis, ist deshalb
auch mit einem Eduktverlust durch Biodegradation zu rechnen.
Die meisten Testsubstanzen stammen aus der Strukturklasse der 9,10-Anthrachinone, die als
sehr stabile Verbindungen anzusehen sind und auch unter natürlichem mikrobiellen Kontakt
Jahrtausende überdauern können. Ein Beispiel sind mit Krapp gefärbte Textilien aus der Zeit
152
Diskussion
um 3200 vor Christus, die sich im trockenen Wüstenklima von Ägypten bis heute erhalten
haben [343]. Allerdings sind auch 9,10-Anthrachinone mikrobiell abbaubar. Der Pilz
Phanerochaete chrysosporum spaltet das Anthrachinongrundgerüst in Phthalat und weitere
nicht charakterisierte Produkte [344]. Bestimmte Streptomyces spp. führen zur Entfärbung
von Anthrachinonfarbstoffen [345].
Im Allgemeinen labiler als Anthrachinone sind Flavonoide. Eine Übersicht ihrer mikrobiellen
Biotransformation wurde von Das & Rosazza [11] erstellt. In Analogie zur in S. espanaensis
beobachteten 3-O-Rhamnosylierung von Quercetin unter Bildung von Quercitrin (s. 3.1.4.1)
findet in Bacillus cereus eine 3-O-Glucosylierung unter Bildung von Isoquercitrin
(3-O-β-D-Glucosylquercetin) statt [300]. Die Umwandlung zum Glucosid lag bei etwa 20 %,
daneben ließ sich das Abbauprodukt 3,4-Dihydroxybenzoesäure isolieren.
Das Ausmaß des Quercetinabbaus in S. espanaensis sollte durch eine möglichst quantitative
Isolierung des entstandenen Quercitrins (QuercPro1) abgeschätzt werden (s. 3.1.4.1). Bei
allen anderen Aufreinigungen wurde nur eine ausreichende Menge für die NMR-Spektroskopie angestrebt. Die Ausbeute an Quercitrin von 35 % lässt auf eine parallel abgelaufene
Degradation oder deutliche Verluste während der Extraktion und Aufreinigung schließen.
Sollte die Rhamnosylierungsaktivität von S. espanaensis für die industrielle Biokatalyse
eingesetzt werden, sind weitere quantitative Betrachtungen der Biotransformationsreaktionen
notwendig. Zunächst könnten die Kulturen gezielt auf die Bildung von Hydroxybenzoesäurederivaten untersucht werden.
Insbesondere für Ganzzellbiotransformationssysteme ist, wie das Beispiel bestimmter
Naphthochinone zeigt (s. Tab. 6), auch die chemische Stabilität von Edukt und Produkt unter
Kulturbedingungen eine unbedingte Vorraussetzung.
4.1.4 Biokatalytische Verwendung der mikrobiellen Xenobiotikaglykosylierung
Die Glykosidsynthese mit den Methoden der nicht-enzymatischen organischen Chemie ist oft
sehr schwierig, insbesondere wenn eine regioselektive Glykosylierung erforderlich ist [346].
Ein klassisches Beispiel ist die Synthese von Glykosiden des pharmazeutisch wichtigen
Naturstoffs Quercetin. Hier stehen fünf Hydroxylgruppen als Zuckerakzeptoren zur
Verfügung [347]. Um ein bestimmtes Monoglykosid zu erhalten, müssen die anderen vier
Hydroxylgruppen geschützt werden [348]. Im Gegensatz zur nicht-enzymatischen Synthese
können durch die enzymatische Umsetzung kleiner, lipophiler Moleküle unmittelbar regiound enantioselektiv glykosylierte Produkte zugänglich gemacht werden. Durch den Einsatz
von S. espanaensis als Ganzzellbiotransformationssystem wurde die regioselektive
Umsetzung von Quercetin zu 3-O-α-L-Rhamnosylquercetin mit einer Ausbeute von 35 %
erreicht (s. 3.1.4.1).
Diskussion
153
4.1.4.1 Biokatalyse mit Xenobiotika metabolisierenden Glykosyltransferasen
Die strukturelle Vielfalt der Glykoside, die durch Biokatalyse zugänglich sind, wird durch die
oft hohe Substratspezifität der eingesetzten Glykosyltransferasen begrenzt [93]. In der
Literatur sind wenige Glykosyltransferasen aus der bakteriellen Sekundärstoffbiosynthese
bekannt, die außer einer (erzwungenen) In-vitro-Flexibilität [341;349] auch in vivo
akzeptorflexibel arbeiten. Ein Beispiel ist UrdGT2, die neben der C-Glykosylierung in der
Urdamycinbiosynthese auch die O-Glykosylierung von Alizarin katalysiert [338].
Glykosyltransferasen der bakteriellen Antibiotikabiosynthese setzen TDP-aktivierte Zucker
ein [106]. Glykosyltransferasen mit einer breiten Akzeptorflexibilität gegenüber endogenen
und exogenen lipophilen Molekülen lassen sich phylogenetisch oft der Familie der
UDP abhängigen Glykosyltransferasen (UGTs) zuordnen (s. Abb. 93). Erstaunlicherweise
stehen bakterielle UGTs ihren tierischen und pflanzlichen Analoga näher als den bakteriellen
TDP-Zucker abhängigen Enzymen. Laut einer kontrovers diskutierten Hypothese soll es im
Verlauf der Evolution zur Rekrutierung pflanzlicher Enzyme durch Bakterien gekommen sein
[350]. Vor allem die Einordnung des Flavonoid glykosylierenden Enzyms BCE_2168 in
einem Seitenast mit den pflanzlichen UGTs unterstützt diese Hypothese (s. Abb. 93). In der
CAZy-Datenbank (s. 5.14) sind UGTs in der Familie 1 eingeordnet. Sie sind gemäß
Mackenzie et al. (1997) [351] durch folgenden Aminosäurenconsensus am C-Terminus zu
erkennen: [F/V/A]-[L/I/V/M/F]-[T/S]-[H/Q]-[S/G/A/C]-GXX-[S/T/G]-XX-[D/E]-XXXXXXP-[L/I/V/M/F/A]XX-P-[L/M/V/F/I/Q]-XX-[D/E]-Q.
Die Xenobiotika metabolisierenden Glykosyltransferasen des Menschen und der Pflanzen
sind UGTs. In Bakterien scheint es zwei Arten von Glykosyltransferasen zu geben, die in der
Lage sind, exogene Moleküle umzusetzen. Einerseits zeigen einige Glykosyltransferasen im
Rahmen der Vorläufer dirigierten Biosynthese oder kombinatorischen Biosynthese
Glykosylierungsaktivität gegenüber Akzeptoren, die strukturelle Ähnlichkeiten mit dem
natürlichen Substrat aufweisen, zum Beispiel AraGT, DesVII, VinC. Andererseits wird durch
die Verfügbarkeit von bakteriellen Genomsequenzen deutlich, dass auch in Prokaryoten UGT
homologe Enzyme auftreten, die eine Xenobiotika metabolisierende Aktivität, ähnlich der
ihrer eukaryotischen Analoga aufweisen können.
Im Gegensatz zu TDP-Zucker abhängigen Glykosyltransferasen, scheinen UGTs nicht an
enge Akzeptormerkmale gebunden zu sein. Sie katalysieren allgemein die Glykosylierung
von kleinen, lipophilen Molekülen [296]. Bezogen auf den einzelnen Akzeptor zeigen die
Enzyme oft eine für den Einsatz in der Biokatalyse begehrte individuelle Regioselektivität
[319]. Die erreichbaren Ausbeuten bei der Verwendung von bakteriellen UGTs zur In-vivoGlykosylierung von exogenen lipophilen Molekülen liegen über den Werten TDP-Zucker
abhängiger Glykosyltransferasen. In Bacillus cereus konnten ~20 mg Isoquercitrin pro Liter
Kulturvolumen erreicht werden [300], für die Gewinnung von Quercitrin in S. espanaensis
liegt der Wert bei 120 mg/L.
154
Diskussion
Bei In-vivo-Experimenten mit Wildtypstämmen wird durch eine UGT stets ein bestimmter
Zucker angehängt. In-vitro-Versuche mit den Makrolidresistenz vermittelnden Enzymen
OleD, OleI und MGT zeigen nicht nur die enorme Akzeptorflexibilität von bakteriellen
UGTs, sondern auch den möglichen Einsatz unterschiedlicher Nukleotidzuckerdonoren [341].
Durch "metabolic engineering" sollte diese Donorflexibilität auch auf In-vivo-Systeme
übertragbar sein. Bakterielle UGTs des Xenobiotikametabolismus stellen sich somit als
potente Werkzeuge der Biokatalyse dar.
Ob die Rhamnosylierungsaktivität von S. espanaensis von UGTs abhängt, kann derzeit noch
nicht bestätigt werden. Das Substratspektrum deckt sich mit dem menschlicher und
pflanzlicher UGTs. Polare Substanzen wie Mitoxantron werden nicht glykosyliert (s. 3.1.2).
Die Beschränkung der Aktivität auf lipophile Moleküle bei hoher Akzeptor- und niedriger
Donorflexibilität ist ein Markenzeichen Xenobiotika metabolisierender Glykosyltransferasen
und lässt den Schluss zu, dass derartige Enzyme in S. espanaensis für dessen
Rhamnosylierungsaktivität verantwortlich sind. Unterstützt wird diese Hypothese durch die
Tatsache, dass auch für die Glucosylierung von Quercetin in Bacillus cereus eine UGT
verantwortlich gemacht werden konnte [301].
Bisher sind nur Teile des Genoms von S. espanaensis sequenziert. Auf zwei Loci wurden
insgesamt 17 Glykosyltransferasegene identifiziert: sam11 - 20, sam43, sam45 - 47 und
sam49 - 51 [352;353]). Die phylogenetische Analyse (s. Abb. 93) zeigt, dass es sich nicht um
UGTs handelt.
Die meisten Mikroorganismen haben weniger als fünf UGTs [301] (vgl. auch [324]).
Insgesamt machen Glykosyltransferasen jedoch etwa 1 % - 2 % aller Genprodukte aus [354].
Aufgrund der in dieser Arbeit aufgedeckten Rhamnosylierungsaktivität wurden von der
Europäischen Union finanzielle Mittel zur vollständigen Sequenzierung des Genoms von
Saccharothrix espanaensis zur Verfügung gestellt. Die Sequenzierung wird in einigen
Monaten abgeschlossen sein. Durch eine phylogenetische Analyse der Glykosyltransferasegene sollten die UGTs des Stammes schnell zu identifizieren sein. Ob eines oder mehrere
Enzyme für die Xenobiotikarhamnosylierung verantwortlich sind, kann mit molekularbiologischen und biochemischen Methoden bestimmt werden.
155
Diskussion
UGT7 8D1
AAM61249
BCE_ 2168
CGT
UGT2 B28
MGT
SCO6 090
OleD
OleI
SCO0 040...
UrdGT2
AraGT
OleG1
OleG2
Sam1 2
Sam1 3
Sam1 1
Sam1 8
Sam1 9
Sam1 4
Sam1 7
Sam2 0
Sam1 6
Sam1 5
VinC
Des VII
Sam4 7
Sam4 9
Sam4 3
Sam4 5
Sam5 1
Sam4 6
Sam5 0
50 4.5
500
400
30 0
200
10 0
Nucleotide Substitutions (x100)
UGTs
0
Abb. 93: Phylogenetische Gegenüberstellung von UGTs, akzeptorflexiblen Glykosyltransferasen der
bakteriellen Antibiotikabiosynthese und den bisher bekannten (abgeleiteten) Glykosyltransferasen aus
S. espanaensis (Sam-Enzyme) nach dem Clustal W-Algorithmus. Die menschliche Glucuronosyltransferase
UGT2B28 und die pflanzliche Glucosyltranseferase AAM61249 wurden wegen ihrer Ähnlichkeit zur Quercetin
glucosylierenden UGT BCE_2168 aus Bacillus cereus (s. Text) ausgewählt. Zusätzlich wurde die menschliche
CGT (Ceramid Galactosyltransferase) und die pflanzliche Rhamnosyltransferase UGT78D1 (s. Tab. 17) mit
einbezogen. Die Makrolidresistenz vermittelnden Glucosyltransferasen OleD, OleI, MGT (s. Text) bilden einen
Ast mit zwei GTs (SCO6090, SCO0040) aus dem Modellorganismus Streptomyces coelicolor A3(2) und wurden
deshalb mit einbezogen. Vermutlich sind SCO6090 und SCO0040 an der unter 3.1.8 beschriebenen
Glykosylierungsaktivität beteiligt. Angegeben sind die NCBI-Zugangsnummern oder der in der NCBIDatenbank gelistete Name der Enzyme.
156
4.2
Diskussion
Ursprung der Freiburger Glykosyltransferasen-Toolbox
Das gemäß der CODEHOP-Strategie entworfene Primerpaar P1 / P2 eignet sich zur
Amplifikation von Fragmenten unbekannter Glykosyltransferase- (GT) Gene per PCR.
Die Effektivität der Reaktion wird durch den Aufbau der Primer aus zwei Domänen
gewährleistet (s. 3.1.9.2).
Die Spezifität der degenerierten Primer ist ein entscheidender Faktor. Einerseits sollen
ausschließlich Fragmente von GT-Genen amplifiziert werden, andererseits wird erwartet, dass
die Primer ein breites Spektrum unterschiedlicher GT-Gene erfassen. Beiden Anforderungen
kommt das Primerpaar P1 / P2 nur bedingt nach. Genomische Gesamt-DNA stellte sich als
ungeeignete Matrize dar. Es kam zur Bildung nicht gewünschter PCR-Produkte. Auf Cosmid
4L16 wurde dagegen keines der GT-Gene des sam-Locus 1 erfasst.
Einen wesentlichen Einfluss auf die Spezifität haben die AS-Sequenzblöcke, die zum
Primerdesign herangezogen wurden (s. Abb. 45). Für das Design des Primerpaars P1 / P2
wurden ausschließlich AS-Sequenzen von GTs aus der Biosynthese von Makrolidantibiotika
(ohne Resistenz vermittelnde GTs, vgl. 4.1.2.3) herangezogen. Entsprechend eng wird auch
das Akzeptorspektrum der GTs erwartet, deren Gene von diesen Primern amplifiziert werden.
Sieben von acht der zuvor unbekannten Gene (hol-Gene) codieren GTs, die laut BLASTRecherche (s. 5.14) Ähnlichkeit mit Enzymen aufweisen, die makrozyklische oder
anguzyklische Aglyka akzeptieren.
Da GTs unterschiedlicher Substratspezifität selbst in konservierten Bereichen nur bedingt
AS-Sequenzübereinstimmungen zeigen, scheint das Ziel universelle Primer für GT-Gene zu
entwerfen, fraglich. Schon die recht spezialisierten P1 / P2-Primer führen teilweise zur
Bildung unverwünschter PCR-Produkte. Eine Erhöhung des Degenerierungsgrades, bedingt
durch die Erweiterung des GT-Spektrums, würde zum verstärkten Auftreten unerwünschter
PCR-Produkte führen. Als Alternative zu einem universellen Primerpaar bietet sich die
Verwendung mehrerer Paare verschiedener Spezifität an. Parallel zum Makrolid- und
Anguzyklin-GT spezifischen Primerpaar P1 / P2 wurden von Provencher et al. (2003) [355]
nach der CODEHOP-Strategie bereits Primer für Exopolysaccharid-GT-Gene entworfen.
Cosmide, die durch Gensonden auf Zuckerbiosynthesegene vorselektiert wurden, sind im
Allgemeinen nicht zur Identifikation von UGT-Genen geeignet, da diese nur selten
clusterassoziiert vorliegen, wie zum Beispiel oleI [340]. Komfortabel wäre es, die
Vorselektion der Cosmide direkt mit GT-Gensonden durchzuführen, mehrere Versuche in
dieser Richtung scheiterten jedoch [356].
Diskussion
4.3
157
Die [safe-knock]-Strategie zur gezielten Geninaktivierung
4.3.1 Revertanten bei der Verwendung klassischer Strategien
Bei einem Inaktivierungsversuch des Gens pok-KSα konnte das Auftreten des Wildtypallels in
den Filialgenerationen einer Knockout-Mutante festgestellt werden (s. 3.2.1.2). Das zweite
Crossover-Ereignis im Genom der Knockout-Mutante war zuvor durch Verlust der
vektorvermittelten Apramycinresistenz sowie Amplifizierung und Sequenzierung des
veränderten DNA-Abschnitts bewiesen worden (s. 3.2.1). Die kombinierte Bestimmung von
Resistenzstatus und Sequenzierung von PCR-Produkten stellt eine sehr genaue Methode zur
Genotypisierung dar und geht über den zur Zeit allgemein akzeptierten Nachweis durch
Resistenzstatus und Größe von PCR-Produkten [338] hinaus. Als Alternative weist die
Southern-Hybridisierung zwar höhere Empfindlichkeit zur Detektion unterschiedlicher Allele
auf, liefert aber keine Sequenzinformationen.
Die Reversion des zunächst festgestellten Geno- oder Phänotyps bei der Verwendung
vergleichbarer Inaktivierungsstrategien in Streptomyces spp. wurde bereits mehrfach
beobachtet. Im Falle des Simocyclinonproduzenten S. antibioticus Tü6040 [236] produzierten
Knockout-Mutanten von Genen des sim-Clusters nach einigen Monaten wieder
Simocyclinon D8 [357]. Auch beim Urdamycinproduzenten S. fradiae Tü2717 kam es trotz
eines zuvor bewiesenen Allelaustauschs im urd-Cluster bei bestimmten Mutanten nach
Lagerung wieder zur Produktion von Urdamycinderivaten, deren Biosynthese aufgrund des
eingeführten Gendefekts eigentlich blockiert sein müsste [358].
Bei Untersuchungen von Blockmutanten des Oxytetrazyklinproduzenten Streptomyces
rimosus wurde das Auftreten von Revertanten beschrieben, die trotz "Deletion" noch eine
minimale Oxytetrazyklinproduktion zeigten. Per Realtime-PCR wurde das otcC-Gen in einer
Kopienzahl von 0,1 %, relativ zur Konzentration der nicht deletierten Gene, nachgewiesen.
Die Autoren stellten sich die Frage, wie das funktionale Allel in so geringem Ausmaß über
mehrere Generationen hinweg erhalten werden konnte [359].
Eine besondere Art der Speicherung von genetischer Information wurde von Rassoulzadegan
et al. (2006) [360] vorgeschlagen, um die nicht auf den Mendelschen Regeln beruhende
Vererbung epigenetischer Veränderungen in Mäusen zu erklären. Dabei soll RNA die Rolle
als transgenerationeller Informationsträger zukommen [361]. Ein vermehrtes Auftreten von
Revertanten einer Punktmutation im Genom der Modellpflanze Arabidopsis thaliana wurde
von Lolle et al. (2005) [362] beobachtet. Die Hypothese, dass das intakte Allel hier in Form
von RNA gespeichert wird, unterliegt zur Zeit kontroverser Diskussion [363]. Falls es
tatsächlich die transgenerationelle Speicherung genetischer Information in Form von RNA
gibt, ist es unwahrscheinlich, dass ein so grundlegender Mechanismus nicht alle Lebewesen,
also auch Bodenbakterien, betrifft [364].
158
Diskussion
Um auch unter diesen Vorraussetzungen stabile Mutanten zu schaffen, sollte bei den
folgenden Geninaktivierungen das Wildtypallel durch einen Resistenzmarker ausgetauscht
werden. Die Anwesenheit des Markers im "DNA-Genom" lässt sich jederzeit durch
Kultivierung mit dem entsprechenden Antibiotikum erzwingen. Für diese Art der
Inaktivierung werden zwei unterschiedliche Resistenzmarker benötigt: ein Marker des
Vektors zur Selektion von Erstcrossover-Mutanten, ein weiterer zur dauerhaften Integration
an Stelle des Zielgens (vgl. 5.8.1.2). Das Apramycinresistenzgen (apra) ist ein zuverlässiger
Selektionsmarker in vielen Streptomyces spp. [156] und kommt deshalb auf Expressionsvektoren und Cosmiden (pSET152, pOJ436, s. 5.4.1) zum Einsatz. Um die eindeutige
Selektion von Erstcrossover-Mutanten bei gleichzeitiger Kompatibilität der DoppelcrossoverMutante mit den Expressionskonstrukten zu ermöglichen, sollte apra auf dem Vektoranteil
des Inaktivierungsplasmids liegen. Als weiterer Marker konnte für S. diastatochromogenes
Tü6028 und S. sp. Gö C4/4 das Spectinomycinresistenzgen (spec) festgelegt werden.
4.3.2 λ-Red-Rekombination zur Konstruktion des
Inaktivierungsplasmids
Der klassische Weg zur Konstruktion eines Inaktivierungsplasmids beinhaltet die
Subklonierung des entsprechenden DNA-Bereichs in einen per Konjugation transferierbaren
Inaktivierungsvektor (zum Beispiel pKC1132, s. 5.4.1) und die Generierung eines mutierten
Allels.
Die Einführung der Mutation sollte durch λ-Red vermittelten DNA-Austausch gegen eine
Redirect-Kassette (s. 5.5.5.5) vorgenommen werden. Die Rekombination der RedirectKassette mit dem pKC1132 basierten Subklon pKC-P7,3 schlug jedoch fehl. Als Grund dafür
wurden unerwünscht sequenzidentische Bereiche der Rekombinationspartner verantwortlich
gemacht (s. 3.2.1.3). Besonders problematisch schien der Bereich des Apramycinpromotors,
da auch das Spectinomycinresistenzgen auf allen verfügbaren Redirect-Kassetten [151] hinter
den Apramycinpromotor geschaltet ist. Da die gewählten Selektionsmarker beibehalten
werden sollten, durfte die Apramycinresistenzkassette folglich erst nach der λ-Red
vermittelten Rekombination in das Inaktivierungsplasmid eingebracht werden. Unter dieser
Vorgabe entfällt bei der Erstellung des Inaktivierungsplasmids der Schritt der
(Um-)Klonierung des Clusterfragments in einen Vektor mit in Streptomyces spp.
selektierbarem Marker. Es entsteht die komfortable Situation, dass jeder Subklon auf Basis
eines üblichen Sequenziervektors direkt verwendet werden kann. Diese Subklone liegen in
der Regel schon aus vorangegangenen Schritten wie der Clusteridentifizierung vor
(vgl. 3.3.3.2). Die Konstruktion des Inaktivierungsplasmids ist in Abb. 46 dargestellt.
Auch wenn durch die neue Strategie nicht weniger Arbeitsschritte als mit klassischen
Klonierungen notwendig sind, so laufen die einzelnen Schritte bei vorausschauender Planung
mit deutlich höheren Erfolgschancen ab. Mit dem Verzicht auf eine Umklonierung des
Clusterfragments wird die Gefahr von Klonierfehlern vermieden. Der Einsatz eines
Diskussion
159
Sequenziervektors mit bekannter Nukleotidsequenz erlaubt im Gegensatz zu pKC1132
(Sequenz unbekannt) die Vermeidung unerwünschter Rekombinationen beim Einsatz der
λ-Red vermittelten Rekombination. Mit drei verschiedenen Resistenzmarkern ist in E. coli
jeder Bestandteil des Konstrukts per Selektionsdruck auf Anwesenheit überprüfbar. In der
Streptomyces sp. ist die Anwesenheit des mutierten Allels jederzeit durch Selektion mit
Spectinomycin sichergestellt. Revertanten zum Wildtyp sterben ab.
In der vorliegenden Arbeit wurden nach diesem neu entwickelten Schema sechs Geninaktivierungen in zwei unterschiedlichen Streptomyces spp. vorgenommen (s. 3.2 und 3.3),
wobei jeder Arbeitsschritt stets direkt erfolgreich war. Wegen seiner deutlich erhöhten
Sicherheit im Vergleich zu klassischen Protokollen wird das Schema als [safe-knock]Strategie bezeichnet.
4.3.3 Neue Einsatzgebiete und Erweiterungen der [safe-knock]Strategie
Beim Komplementierungsversuch der Mutante S. diastatochromogenes Tü6028 ∆pok-KSα mit
dem Gen pok-KSα kam es zunächst nicht zur Wiederaufnahme der Polyketomycinproduktion.
Dies konnte erst durch ein Cosmid mit dem vollständigen Operon des veränderten Gens
erreicht werden (s. 3.2.2). Vermutlich kam es durch den Promotor der im Zuge der
Inaktivierung insertierten Resistenzkassette zur transkriptionell negativen Beeinflussung
nachgeschalteter Gene des betroffenen Operons.
Gleich zwei Erweiterungsmöglichkeiten der [safe-knock]-Strategie standen zur Beseitigung
der hier unerwünscht auftretenden polaren Effekte zur Verfügung: die Induktion des
zusammen mit der pIJ785Spec-Kassette insertierten tipA-Promotors (tipAp) oder die kürzlich
entwickelte FRT-site spezifische Rekombination mit Flp(a) (vgl. Abb. 48 und 5.9). Die
Induktion von tipAp mit Thiostrepton erfordert die Präsenz eines entsprechenden
Resistenzgens auf dem einzuschleusenden Plasmid und damit die Konstruktion eines neuen
Komplementierungskonstrukts. Auch gegen die üblicherweise subinhibitorische Thiostreptonkonzentration von 5 µg/mL zeigte sich S. diastatochromogenes Tü6028 sensitiv.
Es wurde die Flp(a)-Rekombination durchgeführt. Die erzielte Ausbeute an Rekombinanten
von 11 % ist ausreichend. Im weiteren Verlauf der Arbeiten stellte sich die an loxP-sites
angreifende Cre(a)-Rekombinase [365] mit 100 %iger Ausbeute und problemlosem Nachweis
der Exzision per PCR [156] als interessante Option für die [safe-knock]-Strategie dar. Die
loxP-sites und spec tragende pIJ774Spec-Kassette wurde erstellt und für weitere
Inaktivierungen eingesetzt.
Mit einer gegen die Leserichtung der Clustergene integrierten Resistenzkassette kam es zur
transkriptionell negativen Beeinflussung der nachgeschalteten Gene des betroffenen Operons.
Der bei S. diastatochromogenes Tü6028 ∆pok-KSα unerwünschte Effekt konnte im Rahmen
160
Diskussion
der vorliegenden Arbeit bewusst eingesetzt werden. Für die Inaktivierung des Gens msnK2
stand kein geeigneter Subklon zur Verfügung, wohl aber für das im selben Operon
vorgeschaltete msnK1 (vgl. 3.3.5.2). Die gegen die Leserichtung des msn-Operons orientierte
Resistenzkassette führte offensichtlich auch zur Inaktivierung von msnK2, da in
S. sp. Gö C4/4 ∆msc15 ∆msnK1 keine Kreuzkomplementierung der minimalen PKS-Gene
mehr beobachtet wurde (vgl. 4.5.2).
Die durch sequenzspezifische Rekombination erweiterte [safe-knock]-Strategie ermöglicht
markerlose Inaktivierungen. Im Genom zurück bleibt eine FRT- bzw. loxP-site (vgl. 5.9). Die
Anzahl der gleichzeitigen Inaktivierungen ist auf die Anzahl der verfügbaren
Rekombinationssysteme limitiert. Neben dem Flp-FRT- und dem Cre-loxP-System wird
derzeit ein weiteres System auf Basis der Dre-Rekombinase im AK Bechthold etabliert.
Der gezielte Einsatz von zwei Redirect-Kassetten mit einem identischen Rekombinationssystem kann die Entfernung ganzer Biosynthesegencluster ermöglichen, wenn an den
Clusterrändern FRT- bzw. loxP-sites als direct repeats insertiert werden. Dies lässt sich mit
folgender Abfolge der Arbeitsschritte verwirklichen.
1. [safe-knock]-Inaktivierung inklusive einer sequenzspezifischen Rekombination für das
äußerste Gen eines Clusterendes.
2. [safe-knock]-Inaktivierung für das äußerste Gen des anderen Clusterendes mit gleicher
Orientierung der FRT- bzw. loxP-sites.
3. Sequenzspezifische Rekombination und Selektion auf Sensitivität bezüglich des Markers
der Redirect-Kassette.
Diskussion
4.4
161
Genetische Instabilität in S. diastatochromogenes Tü6028
Das Chromosom des Wildtyps von Streptomyces spp. ist linear [366] und sehr instabil [367].
Die Instabilität betrifft, oft pleiotropisch, verschiedene phänotypische Eigenschaften [72].
Dazu zählen sowohl die morphologische Differenzierung (zum Beispiel die Sporenbildung),
die Produktion von Sekundärstoffen wie Pigmenten und Antibiotika, als auch Antibiotikaresistenzen. Die zugrunde liegenden Mutationen entstehen meist durch Umlagerungen an den
Enden des Chromosoms [72], auf denen nur in Ausnahmefällen [368] lebenswichtige Enzyme
codiert sind. Dabei können sich die Enden zu einem zirkulären Chromosom verbinden, was
zur Deletion der Telomere und angrenzender chromosomaler Bereichen führen kann [369].
Das zirkuläre Chromosom wird repliziert, ist jedoch instabiler als die lineare Form [370].
Große Deletionen sind oft mit DNA-Amplifikationen verbunden. Bis zu mehrere Hundert
Amplifikate werden tandemartig an instabilen Regionen des Chromosoms
hintereinandergeschaltet [72]. Etwa 200 - 300 Kopien eines Spectinomycinresistenzgens
führten in Streptomyces achromogenes subsp. rubradiris zu Klonen, die bei Konzentrationen
von 1000 µg/mL Spectinomycin noch schnelles Wachstum zeigten [371].
Phänotypen von S. diastatochromogenes Tü6028 wurden nach Sporenbildung und
Sporenfarbe selektiert (s. 3.2.5). Die Sporulation von Streptomyces spp. unterliegt einem
komplexen Regulationsmechanismus und verläuft über mehrere Entwicklungsstufen [372].
Das Auftreten unterschiedlicher Sporulationstypen könnte folglich rein regulatorisch bedingt
sein. Die Konstanz des vom Wildtyp abweichenden Erscheinungsbildes über mehrere
Wachstumszyklen (s. 3.2.5) lässt das Vorliegen einer genetischen Veränderung vermuten.
Wie nicht zuletzt das Beispiel der bldA-Mutanten von S. coelicolor A3(2) zeigt, können
Veränderungen der Koloniemorphologie in Zusammenhang mit der Produktion von
Antibiotika stehen [21]. Ein solcher Zusammenhang ist bei S. diastatochromogenes Tü6028
für die Kolonien mit weißen Sporen (WS-R u. WS-L) zu erkennen. WS-L produziert kein, bei
wiederholter Anzucht nur geringe Mengen von Polyketomycin, wohingegen WS-R ein
Überproduzent ist. Im Fall von WS-L scheint eine generalisierte Minderexpression von Genen
der PKS II-Stoffwechselwege vorzuliegen. Beim Phänotyp WS-R profitiert der
Polyketomycinbiosyntheseweg vom Wegfall der Sporenpigmentsynthese, möglicherweise
durch den Minderverbrauch an Acetyl-CoA oder der gezielten Hochregulation der pokGenexpression.
Für die industrielle Fermentation ist die genetische Instabilität in Streptomyces spp. eine
Herausforderung [373], vor allem wenn bei durch Auslese gewonnen Überproduzenten das
Phänomen
der
Hypervariabilität
auftritt
[374].
Durch
semi-kontinuierliche
Produktionsprozesse wird dieser Problematik begegnet.
162
4.5
Diskussion
Endogene Kreuzkomplementierung und Kontrolle der
Kettenlänge durch DMSO im PKS II-Metabolismus von
Streptomyces sp. Gö C4/4
4.5.1 Identifikation des Mensacarcinbiosynthesegenclusters
Schon im Jahr 2002 wurde im AK Bechthold mit der Suche nach dem Mensacarcinbiosynthesegencluster begonnen. Bisherige Arbeiten bezogen sich jedoch ausschließlich auf
das msc-Cluster, das 2003 von A. Prestel als Gencluster der Biosynthese von Mensacarcin
postuliert wurde [160]. Diese Zuordnung konnte nicht bewiesen werden und wird mit der
vorliegenden Arbeit widerlegt (s. 3.3). Die Inaktivierung von drei msc-Genen, darunter der
KSβ codierende DNA-Bereich, hat keinen negativen Effekt auf die Mensacarcinproduktion.
Im genauen Vergleich der Kulturextrakte von Wildtyp und ∆msc-Mutanten per LC/MS stellte
sich ein Zusammenhang zwischen dem msc-PKS II-Cluster und der unbekannten Substanz
MSC-X1 heraus. Durch die Inaktivierung von msc15 (KSβ) und msc21 (Luciferase ähnliche
Oxidoreduktase) wird die MSC-X1-Produktion nahezu vollständig unterbunden, während die
Inaktivierung von msc37 (FAD-abhängige Oxygenase) nicht zur Veränderung der MSC-X1Produktion führt. Stattdessen kommt es in S. sp. Gö C4/4 ∆msc37 zur Akkumulation einer mit
MSC-X2 bezeichneten Verbindung (s. 3.3.2). Aus dieser Beobachtung lässt sich die
Hypothese ableiten, dass sowohl MSC-X1 als auch MSC-X2 durch Msc-Enzyme synthetisiert
werden, es sich jedoch nicht um die Endprodukte der Biosynthese handelt. Msc15 und Msc21
sind folglich frühe Biosyntheseenzyme, deren Fehlen die Produktion des frühen Vorläufers
oder Shuntprodukts MSC-X1 unterbindet. Msc37 arbeitet erst später, so dass die Produktion
von MSC-X1 nicht beeinflusst wird. Durch die Unterbrechung des Biosyntheseweges
akkumuliert jedoch die Subtanz MSC-X2, die ebenfalls einen Vorläufer oder ein
Shuntprodukt darstellt. Die biogenetische Herkunft von MSC-X1 aus dem
Polyketidstoffwechsel wurde durch den Einbau von Isotop markiertem Acetat bestätigt
(s. 3.3.7.2). Eine heterologe Produktion der Metaboliten wurde nicht erreicht (s. 3.3.5.1).
Weiterführende Experimente könnten darauf abzielen, die Produktion von MSC-X1 und
MSC-X2 zu verbessern und die Struktur der Substanzen nach ihrer Isolierung aufzuklären.
Nachdem ein Versuch zur Produktionsverbesserung durch homologe, ektopische
Überexpression der clusterinternen Regulatoren nicht zum Erfolg führte (s. 3.3.2.6), sind
Promotorenaustausch oder Medienoptimierung die nächsten Schritte.
Die Einteilung der PKS II positiven Cosmide in drei Gruppen deutete die Präsenz von zwei
weiteren PKS II-Clustern im Genom von S. sp. Gö C4/4 an (s. 3.3.3). Im Gegensatz zu
PKS I-Clustern haben PKS II-Cluster nur eine geringe Verbreitung in Streptomyces spp..
Der Modellorganismus Streptomyces coelicolor A3(2) beherbergt wie auch Streptomyces
avermitilis MA-4680 zwei PKS II-Cluster [69;70], im kürzlich sequenzierten Genom von
Streptomyces griseus IFO 13350 findet sich ein PKS II-Cluster [71]. Drei PKS II-Cluster
wurden erst in einem Stamm, Streptomyces aureofaciens, identifiziert [207;375;376].
Diskussion
163
Die beiden neuen Cluster (mec, msn) aus S. sp. Gö C4/4 wurden über die Ansequenzierung
von Subklonen zunächst bruchstückhaft erschlossen (s. 3.3.3.2). In beiden Clustern konnte ein
Methyltransferasegen identifiziert werden, eine für den Aufbau von Mensacarcin notwendige
genetische Grundlage, die dem msc-Cluster fehlt. Beide Cluster kamen damit als
Mensacarcinbiosynthesegencluster in Frage. Vor der vollständigen Sequenzierung eines
Cosmids, die zurzeit etwa 3000 - 4000 € kostet, sollten die neuen Cluster funktional
charakterisiert werden. Mit Hilfe der [safe-knock]-Strategie war die Geninaktivierungen auch
ohne durchgehend bekannte DNA-Sequenz möglich. Durch Inaktivierungen und heterologe
Expression von Cosmiden wurde eines der Cluster (msn-Cluster) als Mensacarcinbiosynthesegencluster identifiziert, das zweite neue Cluster (mec-Cluster) konnte der Sporenpigmentbiosynthese zugeordnet werden. Die mögliche Expression des msn-Clusters in einem
heterologen Wirt stellt einen beträchtlichen Vorteil für die Erforschung der Mensacarcinbiosynthese dar. Für die Geninaktivierung ist kein Allelaustausch im Genom durch Erst- und
Doppelcrossover notwendig. Es genügt die Erstellung eines nicht funktionalen Allels auf dem
Cosmid und die anschließende Expression des veränderten Cosmids im heterologen Wirt.
4.5.2 Endogene PKS II-Kreuzkomplementierung
Die minimale PKS und früh arbeitende Enzyme des PKS-Multienzymkomplexes, wie
Cyclasen und Ketoreduktasen, aus unterschiedlichen PKS II-Clustern sind meist miteinander
kompatibel und führen bei der heterologen Expression von Hybridgensets zur Bildung von
Polyketiden [24]. Später arbeitende Enzyme des PKS II-Metabolismus, wie Methyl- und
Glykosyltransferasen, sind weniger frei kombinierbar, da sich ihre natürlichen Substrate
bereits deutlich voneinander unterscheiden und diese Enzyme im Allgemeinen durch eine
hohe Substratspezifität gekennzeichnet sind [93].
Sofern Enzyme aus unterschiedlichen PKS II-Clustern exakt die gleiche Reaktion
katalysieren, sind die entsprechenden Gene in der Regel gegenseitig austauschbar. Ein
Gendefekt in einem der beiden Gene kann durch Einbringen des anderen Gens
komplementiert werden. Gezeigt wurde dies unter anderem an verschiedenen Blockmutanten
mit Defekten im ksα-, ksβ-, Ketoreduktase- und einem Cyclasegen des Actinorhodinbiosynthesegenclusters (act) in Streptomyces coelicolor. Die Expression des jeweils
betroffenen Biosynthesegens aus dem Granaticinbiosynthesegencluster aus Streptomyces
venezuelae konnte die Actinorhodinproduktion wiederherstellen [218]. Vermutlich teilen sich
die beiden Benzoisochromanchinone Actinorhodin und Granaticin einen gemeinsamen
Biosynthesevorläufer.
Neben dem act-Cluster findet sich im Genom von Streptomyces coelicolor ein weiteres
PKS II-Cluster, das whiE-Cluster, welches der Sporenpigmentbiosynthese zugeordnet wird.
Blockmutanten mit Defekt in den Genen der minimalen Act-PKS können durch die
kontrollierte Expression von ektopisch eingebrachten whiE-Genen komplementiert werden.
whiE-Mutanten lassen sich durch entsprechende act-Gene komplementieren [210]. Die durch
eine kontrollierte Expression erreichte Kreuzkomplementierung wird natürlicherweise nicht
164
Diskussion
beobachtet [24]. Ein Grund könnte die räumlich differenzierte Expression beider Cluster unter
natürlichen Bedingungen sein. Die Bildung der Act-PKS ist eher im vegetativen Myzel zu
erwarten, die WhiE-PKS hingegen wird in den sich bildenden Sporen aufgebaut.
PKS II-Cluster werden oft in Antibiotikabiosynthesegencluster und Sporenpigmentbiosynthesegencluster eingeteilt. Anhand der phylogenetischen Verwandschaftsgrade
der ksα-Gene lässt sich diese Einteilung nachvollziehen [200]. Der Mensacarcinproduzent
S. sp. Gö C4/4 verfügt demnach über zwei Antibiotikabiosynthesegencluster (msc und msn)
und ein Sporenpigmentbiosynthesegencluster (mec). Die gleichzeitige Inaktivierung von
Ketosynthase-(ks)-Genen beider Antibiotikabiosynthesegencluster verhindert die Produktion
der zugehörigen Polyketide (S. sp. Gö C4/4 ∆msc15 ∆msnK1, s. 3.3.5.2). Das noch intakte
Genset des mec-Sporenpigmentbiosynthesegenclusters kann die Gendefekte analog zu den
oben erwähnten Beobachtungen bei S. coelicolor nicht komplementieren. Werden nur
ks-Gene eines der beiden Antibiotikabiosynthesegencluster inaktiviert, nimmt die Produktion
des entsprechenden Sekundärstoffs (∆msnK1: Mensacarcin, ∆msc15: MSC-X1) zwar sehr
stark ab, bleibt aber auf niedrigem Niveau bestehen (s. 3.3.5.2). Die Ergebnisse belegen eine
endogene Kreuzkomplementierung der ks-Gene aus msc- und msn-Cluster. Parallel zur
Produktion von Mensacarcin verhält sich unter dem Einfluss von DMSO die ebenfalls auf
msn-Gene zurückführbare Synthese der Heptaketide Mensalon und Aloesol (s. 3.3.7.3). Mit
Ausnahme des Genoms von S. aureofaciens wurde in Genomen von Streptomyces spp. bisher
maximal ein PKS II-Cluster identifiziert, das phylogenetisch der Antibiotikabiosynthese
zugeordnet werden kann. S. aureofaciens verfügt wie S. sp. Gö C4/4 über zwei
Antibiotikabiosynthesegencluster, von denen eines jedoch als "stilles Cluster" beschrieben
wurde [376]. Damit überrascht es eigentlich nicht, dass eine endogene
PKS II-Kreuzkomplementierung erstmalig in S. sp. Gö C4/4 zu beobachten ist.
Das Ausmaß der Komplementierung ist gering, was auf unterschiedliche Substrate der beiden
Ketosynthasedimere hinweist. Die Präsenz eines Acyltransferasegens (msc13) und eines
zusätzlichen Ketosynthasegens für die Startereinheit (msc17) im msc-Cluster, nicht jedoch im
msn-Cluster, bekräftigen diese Vermutung.
Wegen endogener Kreuzkomplementierung ist die kontrollierte Genexpression mehrerer
PKS II-Cluster der Antibiotikabiosynthese in einem Genom nur schwer zu realisieren. Eine
räumliche Trennung der Expression, wie für Antibiotika- und Sporenpigmentbiosynthesegencluster postuliert, löst das Problem. Die Präsenz von drei PKS II-Clustern in
S. sp. Gö C4/4 und S. aureofaciens wirft die Frage auf, ob es einen dritten Typ von PKS IIClustern gibt. Interessanterweise wurde eines der Cluster aus S. aureofaciens als "stilles
Cluster" beschrieben, auch das Biosyntheseendprodukt des msc-Cluster wurde nicht
identifiziert. Vielleicht ist die Expression des dritten Typs von PKS II-Clustern auch an
spezielle Wachstumsbedingungen geknüpft, die unter Laborbedingungen nicht erreicht
werden, oder die entsprechenden Polyketide treten, wie auch für Sporenpigmente vermutet,
als Polymerisate oder fest gebunden an andere Zellbestandteile auf.
165
Diskussion
4.5.3 Die Biosynthese von Mensacarcin
Polyketidsynthese
Die Grundstruktur bildende Decaketidkette wird durch die minimale PKS, bestehend aus
MsnK1 - 3, zusammengesetzt. Für die folgenden Reaktionen stehen dem PKS-Multienzymkomplex drei Cyclasen (MsnC1 - 3) sowie drei Ketoreduktasen (MsnO1, MsnO10 - 11) zur
Verfügung. MsnC1 - 3 könnten für die zwischen C-7 / C-12, C-5 / C-14 bzw. C-3 / C-16
regioselektiv im Sinne von Aldolreaktionen ablaufenden Cyclisierungen verantwortlich sein,
wobei MsnC2 aufgrund von Aminosäuresequenzähnlichkeiten als Cyclase des 2. Rings für
die 5,14-Cyclisierung postuliert wird (s. 3.3.5.4). Sowohl MsnC1 als auch MsnC3 verfügen
über eine Dehydratasedomäne und kommen deshalb als bifunktionelle Katalysatoren der
7,12-Cyclisierung und 8,9-Dehydratisierung in Frage, die zur Aromatisierung des ersten
Ringes führt. Eine der Cyclasen (MsnC1 oder MsnC3) ist für die Bildung des dritten Rings
verantwortlich. Ketoreduktionen an der ACP-gebundenen, eventuell bereits teilweise
cyclisierten β-Ketidkette, könnten in Einklang mit der Präsenz dreier Ketoreduktasegene an
drei Positionen stattfinden (C-9, C-15, C-19). Die Reduktion an C-9 (MsnO11) ist für die
korrekte Faltung der Kette obligat [250]. Die Reduktion an C-19, wahrscheinlich durch
MsnO1, s. 3.3.5.4, verhindert die in der Biosynthese der Anthrazykline ablaufende
Ausbildung eines vierten Rings. Auch die Reduktion der Ketogruppe an C-13 könnte bereits
durch eine Ketoacyl-(ACP)-Reduktase katalysiert werden. Mit dem postulierten Reaktionsmechanismus der Anthronoxygenasen [165] wäre die Reduktion an C-13 jedoch erst nach der
Anthronoxygenierung möglich. Es ist deshalb anzunehmen, dass die Reduktion erst zu einem
späteren Zeitpunkt der Biosynthese stattfindet.
10 Acetateinheiten
Aromatisierung
O
Red.
O
O
Cyc.
Cyc.
O
O
15
Red.
O
O
Cyc.
O
O
Red. 9
O -H2O
1
Anthronoxygenierung
Red.
OH O
OH O
O
Ox.
OH
19
O
Decarboxylierung
SEnz
OH
Ox.
Ox.
OH OH OH O
OH
Red. (-H2O/Ox.)
O
Didesmethyldihydromensacarcin
OH
2 Methylierungen
OH OH OH O
OH O
O
O
OH
Didesmethylmensacarcin
OMe OMe OH O
OH O
O
O
OH
Mensacarcin
Abb. 94: Reaktionen auf dem Biosyntheseweg zum Mensacarcin (Cyc.: Cyclisierung und Dehydratisierung,
Red.: Reduktion, Ox.: Oxygenierung).
166
Diskussion
Decarboxylierung
Alle bekannten Mensacarcinderivate [56] zeichnen sich durch den Verlust des ersten
Kohlenstoffatoms der β-Ketidkette aus. Auch bei den von der Msn-PKS hervorgebrachten
Heptaketiden Mensalon und Aloesol hat die Decarboxylierung bereits stattgefunden. Damit
lässt sich die Reaktionsfolge von der Biosynthese der Anthrazykline Daunomycin und
Doxorubicin abgrenzen, in der die Decarboxylierung nach dem Glykosyltransfer als einer der
letzten Schritte abläuft [377]. Ein Methyltransferase homologes Enzym (DauP bzw. DnrP)
wird in der Anthrazyklinbiosynthese als Esterase und Decarboxylase postuliert [378]. In der
Biosynthese der Anguzykline hingegen findet die Decarboxylierung vor dem
Glykosyltransfer statt [379]. Die Anguzyklinbiosynthesegencluster codieren häufig ein
(De-)Carboxylase ähnliches Enzym, dessen Funktion noch nicht experimentell bestätigt
wurde: zum Beispiel LanP [380], JadN [381], SimA12 [236]. Ein verwandtes Genprodukt
kann aus dem msn-Cluster nicht abgeleitet werden. Als vinyloge β-Ketocarbonsäure ist die
spontane Decarboxylierung des teilweise reduzierten Mensacarcinintermediats denkbar
(s. Abb. 95). Aklanonsäure, der analoge Vorläufer von Doxorubicin, decarboxyliert spontan
in DMSO oder Pyridin [382]. Die Isolierbarkeit von Aklanonsäure aus Fermentationen spricht
aber gegen die effektive Decarboxylierung unter Kulturbedingungen. Viele Enzyme des
PKS II-Metabolismus sind multifunktionell [23]. Möglicherweise ist es schon die
Decarboxylaseaktivität der KS Untereinheit β [23], die bei der Trennung vom
Multienzymkomplex den Verlust von C-1 herbeiführt.
OH O
OH
OH
OH O
OH
O H
O
O
O
O
H
O
OH O
OH
O
+ O
C
OH O
OH
CO2
O
Abb. 95: Mechanismus der spontanen Decarboxylierung eines teilweise reduzierten Mensacarcinderivats.
Weitere Reduktionen und Oxygenierungen
Der Chinonreduktion am zweiten und der Enoylreduktion am dritten Ring (s. Abb. 94) steht
lediglich ein Enzym (MsnO9) mit signifikanter Ähnlichkeit zu NADPH:Chinonreduktasen
und Enoylreduktasen gegenüber. Eine der Reduktionen könnte von einer weiteren als
Reduktase arbeitenden Oxidoreduktase katalysiert werden oder findet im Rahmen einer
Oxygenierung statt.
167
Diskussion
Š
Š
OMe OMe OH ∗ O ∗
OH O
9
10
1
O∗
6
4a
5
O
4
11
15
OH
∗
∗
18
∗ [ O 2 ] Gas
13
Š
L-[Methyl- 13 C] Methionin
[1- 13 C] Acetat
[1,2- 13 C 2 ] Acetat
Einzelnes Kohlenstoffatom
aus [1,2-13 C 2 ] Acetat
Abb. 96: Einbau von isotopenmarkierten Biosynthesevorläufern gemäß M. Arnold, 2002 [56].
Durch die Kultivierung von S. sp. Gö C4/4 in einer [18O2]-Atmosphäre konnte von
Dr. M. Arnold die biogenetische Herkunft von fünf Sauerstoffatomen des Mensacarcinmoleküls aus Luftsauerstoff gezeigt werden (s. Abb. 96). Der Einbau von 18O bewirkt bei den
Signalen der benachbarten Kohlenstoffatome im 13C-NMR-Spektrum eine Hochfeldverschiebung. Sauerstoffeinführende Enzyme werden als Oxygenasen bezeichnet. Sie gehören
zu den Oxidoreduktasen (EC 1). Die Einführung des Carbonylsauerstoffs an C-5 (Abb. 96)
erfolgt durch eine Anthronoxygenase (vgl. 3.3.5.4). Welche der Gene msnO5 - 7 für die
Anthronoxygenierung an C-6 essentiell sind, wird zurzeit von Katharina Probst
(AK Bechthold) im Rahmen ihrer Doktorarbeit durch Inaktivierungsexperimente bestimmt.
Die C-4 äquivalente Position wird in der Anthrazyklinbiosynthese durch FAD abhängige
Monooxygenasen hydroxyliert. Ein Beispiel ist die Aklavinon-11-hydroxylase DnrF [383].
Ähnliche Genprodukte können vom msn-Cluster jedoch nicht abgeleitet werden.
Die Hydroxylgruppe an C-2 von Mensacarcin erinnert an das 12a-OH der
Tetrazykline [246;359] und des Mithramycinvorläufers Premithramycinon. Abdelfattah und
Rohr (2006) [384] schlagen für die Einführung des Sauerstoffs beim Mithramycin eine von
der FAD abhängigen Monooxygenase MtmOII katalysierte Oxiranbildung mit anschließender
reduktiver Ringöffnung vor (s. Abb. 97). Die für die Epoxidierung notwendige Doppelbindung ist im postulierten Mensacarcinintermediat (s. Abb. 94, unten links) vorhanden. Ein
MtmOII ähnliches Enzym wird vom msn-Cluster nicht codiert.
Mtm-PKS
OH OH OH O
OH OH O
O
O
O
MtmOII ?
OH OH O
MtmOII ?
O
OH
O
O
HO
OH
OH
HO
OH
OH
HO
OH
OH
Desmethylpremithramycinon
Abb. 97: Postulierter Mechanismus der 12a-Hydroxylierung in der Biosynthese von Mithramycin [384].
Besonderes Interesse gilt in der Biosyntheseforschung der Bildung von Epoxiden, die durch
ihre Reaktion mit DNA-Basen oft maßgeblich an der Zytotoxizität niedermolekularer
Arzneistoffe beteiligt sind [385]. Obwohl die Epoxidierung mehrfach für die mechanistische
168
Diskussion
Erklärung von Oxygenierungen herangezogen wurde [384], konnte bisher kein Enzym des
PKS II-Metabolismus identifiziert werden, das die Bildung von stabilen Epoxiden katalysiert.
Die Bereitstellung der msn-Clustersequenz erlaubt nun auf molekularbiologischer Ebene
Biosyntheseuntersuchungen an der modellhaften Struktur von Mensacarcin mit Ring- und
Seitenkettenepoxidierung.
Im PKS I-Metabolismus lassen sich Epoxidierungen vor allem Cytochrom P-450
Monooxygenasen zuordnen (Epothilone [386], Oleandomycin [387] sowie Pimacrin [388]).
Das Fehlen entsprechender Gene im msn-Cluster, wie auch die Mensacarcinproduktion von
S. sp. Gö C4/4 trotz des Zusatzes von Inhibitoren der Cytochrom P-450 Monooxygenasen
[56], zeigen, dass diese Art von Enzymen in der Mensacarcinbiosynthese keine Rolle spielt.
Alternativ kann der Epoxidsauerstoff durch flavinabhängige Monooxygenasen eingeführt
werden [191]. Ein Beispiel ist das Enzym MonCI, eine FAD abhängige Epoxidase der
Biosynthese des PKS I-Metaboliten Monensin [291].
Die vergleichende Betrachtung von Enzymen ähnlicher Funktionalität für die
Oxygenierungen an C-1, C-2, C-4a / C-10a und C-12 / C-13 des Mensacarcingrundgerüsts
lässt auf die Beteiligung flavinabhängiger Monooxygenasen schließen. Tatsächlich stehen der
Mensacarcinbiosynthese mit den Genprodukten von msnO2, msnO4 und msnO8 putative
Flavoproteine zur Verfügung, die zu den Luciferase ähnlichen Oxidoreduktasen zählen. Die
Rekrutierung von Vertretern dieser Enzymfamilie für Reaktionen, die im PKS IIMetabolismus üblicherweise von FAD abhängigen Oxidoreduktasen katalysiert werden,
wurde zuvor noch nicht beschrieben. Sie ist in der Mensacarcinbiosynthese jedoch sehr
wahrscheinlich. An den genannten Oxygenierungen könnten auch die Anthronoxygenase
ähnlichen Enzyme MsnO5 - 7 oder die hypothetischen Proteine MsnH4 und MsnH6 beteiligt
sein. Da die genetischen Informationen des msn-Clusters deutlich von bisher charakterisierten
PKS II-Clustern abweichen, ist ein experimenteller Funktionsbeweis der Enzyme obligat.
Entsprechende Geninaktivierungen werden zurzeit im AK Bechthold durchgeführt.
Die Isolierbarkeit von Didesmethyldihydromensacarcin (s. Abb. 94) zeigt an, dass die
Dehydratisierung der Seitenkette nicht spontan sondern enzymkatalysiert abläuft. Sofern das
Derivat ein Biosynthesevorläufer von Mensacarcin ist, wären die Dehydratisierung und die
Seitenkettenepoxidierung vor der Methylierung die letzten Schritte der Mensacarcinbiosynthese. Die Fütterung von Didesmethyldihydromensacarcin an die Nullmutante
S. sp. Gö C4/4 ∆msc15 ∆msnK1 stellt eine Möglichkeit dieses aufzuklären dar.
Methylierungen
Im von Transposasegenen klar umgrenzten msn-Cluster konnte nur ein Methyltransferasegen
identifiziert werden. Obwohl Methyltransferasen im Allgemeinen regioselektiv arbeiten
[389], scheint MsnO6 in der Mensacarcinbiosynthese für beide O-Methylierungen
verantwortlich zu sein. Der Vorläufer 10-O-Desmethylmensacarcin [56] deutet darauf hin,
dass zunächst in Position 9 methyliert wird.
Diskussion
169
4.5.4 Der Einfluss von DMSO auf den Msn-Multienzymkomplex führt
zum vorzeitigen Kettenabbruch
Die Kultivierung von S. sp. Gö C4/4 unter Zusatz von 2 % DMSO zum Kulturmedium führt
zur Produktion der beiden Heptaketide Mensalon und Aloesol (s. 3.3.1). Durch die
Inaktivierung des Gens msnK1 (KSα der Mensacarcinbiosynthese) kommt die Heptaketid- und
Mensacarcinproduktion fast vollständig zum Erliegen. Mit zusätzlicher Mutation eines
ks-Gens des msc-Clusters (msc15) lässt sich keiner der drei Metaboliten mehr im
Kulturextrakt nachweisen (s. 3.3.7.3). Heterolog in Streptomyces albus exprimiert, führt Cos2
mit einem Fragment des msn-Clusters zur Produktion von Mensalon, Aloesol und
Didesmethylmensacarcin. Cosmide der beiden anderen PKS II-Cluster hingegen induzieren
keine per LC/MS detektierbare Produktion der Sekundärstoffe (s. 3.3.5.1).
Zusammenfassend legen die Ergebnisse dar, dass die Heptaketide Mensalon und Aloesol
durch die vom Mensacarcinbiosynthesegencluster (msn-Cluster) codierte Polyketidsynthase
aufgebaut werden. Ein Defekt in msnK1 (ksα) wird vom entsprechenden Gen des msc-Cluster
komplementiert. Ohne die Gene des msn-Clusters führt das msc-Cluster jedoch heterolog
nicht zur Bildung der Heptaketide.
Sowohl die Kontrolle der Polyketidkettenlänge durch eine Chemikalie (hier DMSO) als auch
die endogene Kreuzkomplementierung in der PKS II-Biosynthese sind in dieser Arbeit
erstmalig beschrieben. Die Ergebnisse erlauben ein besseres Verständnis des PKS IIMetabolismus in Bodenbakterien.
Der Multienzymkomplex
Die heutige PKS II-Biosyntheseforschung schließt von der gezielten Mutation über die
Akkumulation von möglichen Vorläufern oder Shuntprodukten auf Genfunktionen. Wie
problematisch derartige Rückschlüsse sind, zeigen die oben erwähnten Untersuchungen von
Abdelfattah und Rohr zur Funktion des Enzyms MtmOII in der Biosynthese von Mithramycin
(vgl. 4.5.3). Der bei Geninaktivierung akkumulierende Metabolit Premithramycinon G scheint
aus einem Dodecaketid hervorgegangen zu sein, wobei das Biosyntheseendprodukt
Mithramycin sich von einem Decaketid ableitet. Die Autoren schlagen aufgrund dieser
Beobachtung vor, dass die FAD abhängige Monooxygenase MtmOII für die Kontrolle der
Polyketidkettenlänge verantwortlich ist. Vier Jahre zuvor ordnete Rohr das gleiche Enzym als
post-PKS modifizierend ein [389]. Ein Widerspruch, der das rasch zunehmende Verständnis
von PKS II-Metaboliten als Produkt eines Multienzymkomplexes offenlegt und gegen die
frühere Vorstellung nacheinander arbeitender Einzelenzyme abgrenzt. Die heterologe
Expression von Genen des Resistomycinbiosynthesegenclusters legt nahe, dass die
konzertierte Katalyse aller drei Cyclasen zum Aufbau des Ringsystems notwendig ist [390].
In der Biosynthese von Enterocin scheint abweichend von früheren Vorstellungen die weitere
Polyketidkettenverlängerung von einer zwischengeschalteten Cyclisierungsreaktion abhängig
zu sein [391].
170
Diskussion
Dass es in PKS II-Biosynthesewegen überhaupt "post-PKS-Enzyme" gibt, erscheint vor dem
Hintergrund aktueller Ergebnisse fraglich. Der Zeitpunkt der Trennung des Polyketids vom
Multienzymkomplex in vivo ist unbekannt. Für einige der "post-PKS-Enzyme" wurde gezeigt,
dass sie auf nicht ACP-gebundene Substrate wirken [23]. Aus dieser Beobachtung kann
jedoch nicht abgeleitet werden, dass die Enzyme auch in vivo ohne Assoziation mit dem
Multienzymkomplex arbeiten. Denn auch die als Bestandteil des Multienzymkomplexes
vermuteten Ketoreduktasen setzen nicht ACP-gebundene Substrate um [392]. Als
Begründung für die Einteilung in PKS-Multienzymkomplex und "post-PKS-Enzyme" könnte
die Akkumulation früher Biosynthesevorläufer zu Beginn der Kultivierung, wie bei der
Mensacarcinbildung zu beobachten [56], herangezogen werden. Sie zeigt aber lediglich die
Lösung des Substrats vom ACP und impliziert die sich anschließende Modifizierung durch
weitere Enzyme des PKS II-Metabolismus. Dass diese Enzyme in vivo nicht als Teil des PKSMultienzymkomplexes agieren, konnte bisher nicht gezeigt werden. Eine Einteilung der
Enzyme des PKS II-Metabolismus in Enzyme des Multienzymkomplexes und "post-PKSEnzyme" ist deshalb bis auf weiteres nicht möglich.
Die Wirkung von DMSO auf die PKS II-Biosynthese
Neben einem möglichen Einfluss von DMSO auf die Regulation oder die Proteinbiosynthese
könnte die Chemikalie auch die Arbeit eines Enzyms des Mensacarcinbiosynthese
modifizieren oder unterbinden. Noch vor wenigen Jahren wäre als beeinflusstes Enzym direkt
der "chain length factor" genannt worden. Der chain length factor wurde als allein
verantwortlich für die Kettenlänge postuliert [24]. Später wurde das Enzym in Ketosynthase
Untereinheit β (KSβ) umbenannt, da die Aussage getroffen werden konnte, dass KSα und KSβ
die Kettenlänge gemeinsam bestimmen [23]. Inzwischen ist, mit Ausnahme der Methyl- und
Glykosyltransferasen, für alle Arten von Enzymen, die an Aufbau und Modifikation des
PKS II-Polyketids beteiligt sind, ein Einfluss auf die Kettenlänge gezeigt worden (s. o.). Die
Frage nach dem durch DMSO beeinflussten Enzym lässt sich deshalb nicht direkt
beantworten. Sofern ein einzelnes Enzym betroffen ist und es sich dabei nicht um einen
Bestandteil der minimalen PKS handelt, könnte dieses mit einer Geninaktivierung, die zur
Akkumulation der Heptaketide führt, identifiziert werden. Vorrangige Kandidaten sind die
Ketoreduktase-, Cyclase- und Oxidoreduktasegene. Handelt es sich um eine Beeinflussung
der minimalen PKS durch DMSO, kann ein alternativer Forschungsansatz verfolgt werden,
der die heterologe Expression eines minimalen Gensets zur Bildung der Heptaketide zum
Inhalt hat.
Dieses minimale Genset enthält neben der minimalen PKS zwingend auch eine
Oxidoreduktase. Verfolgt man die Metabolitenbildung aus der β-Ketidkette, so fällt auf, dass
in beiden Molekülen eine Ketoreduktion stattgefunden hat (s. Abb. 98). Die Cyclisierungen
und Dehydratisierungen könnten dagegen auch spontan stattfinden [23]. Es wird
angenommen, dass Ketoreduktasen stets an einer für das jeweilige Enzym spezifischen
Position, gezählt ab dem Carboxylterminus der vollständig aufgebauten Polyketidkette, die
Reduktion der Carbonylfunktion zum Alkohol katalysieren. Eine entsprechende Konstanz der
171
Diskussion
Regioselektivität lässt sich bei den phylogenetisch eine Familie bildenden C-9-Ketoreduktasen unabhängig von der Kettenlänge feststellen [250]. Kristallisations- und
Modellingstudien untermauern die Hypothese, dass C-9-Ketoreduktasen auf die vollständig
ausgebildete, möglicherweise zum Teil schon cyclisierte Polyketidkette wirken [392].
SEnz
O
O
1
O
EnzS
O
O
O
1
O
O
O
9
O
O
HO
O
9 OO
Mensalon
O
OH
O
1
SEnz HO
O
9
O
OH
O
O
O
SEnz
1
O
O
O
O
O
O
O
O
9
O
OO
Aloesol
Abb. 98: Jeweils zwei Orientierungen der β-Ketidkette kommen für die Bildung der Heptaketide Mensalon und
Aloesol in Frage [56]. Die bisherige Definition der Regioselektivität von Ketoreduktasen kann nur zur Erklärung
von Mensalon herangezogen werden.
Die bisher charakterisierten Ketoreduktasen des PKS II-Metabolismus grenzen sich mit ihrer
Substratspezifität von Ketoreduktasen der bakteriellen Fettsäuresynthese (FabG) ab, welche
als 3-Ketoacyl-(ACP)-Reduktasen arbeiten. Die in der Mensacarcinbiosynthese postulierten
Reduktionspositionen (s. Abb. 94: C-9, C-15, C-19) können als Erklärung für die Reduktion
im Mensalon durch eine C-9-Ketoreduktase, ausgehend von der links abgebildeten Kette,
herangezogen werden (s. Abb. 98). Die Reduktion zur Aloesolbildung ist auf diese Weise
nicht nachvollziehbar, ließe sich aber mit einer alternativen Definition der Regioselektivität
erklären. Analog zu FabG könnte es auch im PKS II-Metabolismus bestimmte
Ketoreduktasen geben, die nicht auf die vollständig aufgebauten β-Ketidketten wirken,
sondern zu bestimmten Zeitpunkten als 3-Ketoacyl-(ACP)-Reduktasen auf die naszierende
Polyketidkette wirken. Neben einer oder mehreren Msn-Ketoreduktasen könnte EncD aus der
Enterocinbiosynthese ein weiteres Enzym dieses Typs darstellen. EncD wird eine sehr frühe
Rolle in der Polyketidbiosynthese zugeordnet, da bei der heterologen Expression von Genen
der minimalen Enc-PKS nur durch Koexpression von encD detektierbare Produkte generiert
wurden [391].
Für die Untersuchung der Regioselektivität von Ketoreduktasen sind die drei aus der MsnPKS hervorgehenden Metabolite Mensacarcin, Mensalon und Aloesol ein geeignetes Modell.
172
Diskussion
O
O
O
O
SEnz
O
O
O
O
19
EnzS
9
O
O
15
O
O
HO
Mensalon
O
O
15O O
O
OH
OH
O
SEnz HO
9
O
O
SEnz
O
O
9
O
9
15
O
O
19
O
19
O
O
O
15
O
OO
19
Aloesol
Heptaketid
SEnz
O
O
9
SEnz
O
O
O
9
SEnz
O
O
O
O
O
9
O
O
O
O
O
O
O
O
O
O
15
O
O
O
15
O
19
O
O
15
O
19
O
1
O
O
O
SEnz
O
Dekaketid
9
15
O
19
O
19
Abb. 99: Ein alternatives Modell zur Kontrolle der Regioselektivität von Ketoreduktasen. Als 3-Ketoacyl(ACP)-Reduktase arbeitende Enzyme würden unabhängig von der Gesamtkettenlänge stets die letzte (C-19),
vom Ende dritte (C-15) und vom Ende sechste (C-9) Ketogruppe reduzieren. Mit diesem Modell ist die Bildung
von Mensalon und Aloesol unter Beteiligung der Msn-Ketoreduktasen erklärbar.
173
Material und Methoden
5
Material und Methoden
5.1
Laborgeräte / Analyseinstrumente
Tab. 18: Laborgeräte / Analyseinstrumente.
Bezeichnung
Elektroporationskammer GenePulser II
French Pressure Cell Press
Gefriertrocknungsanlage Christ Alpha 2-4 LSC
HPLC, analytisch:
717 plus Autosampler, 2 Pumpen Waters 515, Säulenofen
Jetstream 2, Waters 2996 Photodiode Array Detector
HPLC, präparativ:
Degasser AF, quaternäres Pumpsystem: Delta 600, Waters
2487 Dual λ Absorbance Detector, Fraction Collector III
LC/MS, analytisch und präparativ:
Agilent 1100 Series: Degasser G1322A, Autosampler
G1313A, Säulenofen G1316A, quaternäre Pumpe G1311A,
DAD G1315B, Quadrupol-Massendetektor G1946D, ESIoder APCI-Quelle
Massenspektrometer, hochauflösend:
LC-ESI-MS/MS-Kopplung mit LTQ-Orbitrap
NMR-Spektrometer Bruker Avance DRX 400
NMR-Spektrometer JEOL Alpha
Schüttelinkubator
SDS-PAGE-Kammer Mini-PROTEAN 3
Spektralpolarimeter J-810
Spektrometer UVIKON 933
Spektrometer Ultrospec 2100 pro
Thermocycler Gene Amp PCR System 9700
Thermocycler Mastercycler epgradient
Zentrifuge 5415R bzw. 5417R: 1,5 mL / 2 mL vials
Zentrifuge Avanti J-20XP: Falcontubes
Zentrifuge Rotina 35 R: 500 mL Gefäße
Hersteller
BIO-RAD
(Birmingham, UK)
Thermo Spectronic
(Rochester, USA)
Christ (Osterode)
Waters (Milford, USA)
Waters (Milford, USA)
Agilent
(Santa Clara, USA)
ThermoFisher Scientific
(Bremen)
Bruker (Karlsruhe)
Jeol (Tokyo, Japan)
Multitron Infors
(Bottmingen, CH)
Amersham
(Little Chalfont, UK)
Jasco (Easton, USA)
Kontron Instruments
(Neufahrn)
Amersham
(Little Chalfont, UK)
Applied Biosystems
(Foster City, USA)
Eppendorf (Hamburg)
Eppendorf (Hamburg)
Beckman Coulter
(Krefeld)
Hettich (Tuttlingen)
Sowie weitere Apparaturen der Grundausstattung chemischer und biologischer Laboratorien.
174
5.2
Material und Methoden
Lösungen, Nährmedien, Chemikalien, Enzyme und Kits
5.2.1 Lösungen für biochemische und molekularbiologische
Arbeiten
Wenn nicht anders angegeben, handelt es sich um wässrige Lösungen, die mit H2Obidest
hergestellt wurden.
5.2.1.1 Proteingelelektrophorese (SDS-PAGE)
Tab. 19: Lösungen zur SDS-PAGE (s. 5.10.2).
Lösung / Gel
Sammelgel (4 %)
Zusammensetzung
H2Obidest
0,5 M Tris-HCl (pH 6,8)
10 % (m/V) SDS
Rotiphorese Gel 30
10 % (m/V) APS
TEMED
Trenngel (12%)
H2Obidest
1,5 M Tris-HCl (pH 8,8)
10 % (m/V) SDS
Rotiphorese Gel 30
10 % (m/V) APS
TEMED
Probenpuffer
H2Obidest
0,5 M Tris-HCl (pH 6,8)
10 % (m/V) SDS
β-Mercaptoethanol 1 % (m/V)
Glycerin
Bromphenolblau
Laufpuffer pH 8,3 Tris
(5×Konzentrat)
Glycerin
SDS
H2Obidest
ad
Färbelösung
Coomassie Brillant Blue G250
H2Obidest
Ethanol
Essigsäure
Fixier- und
H2Obidest
Entfärbelösung
Ethanol
Essigsäure
6,1 mL
2,5 mL
0,1 mL
1,33 mL
0,05 mL
0,01 mL
3,35 mL
2,5 mL
0,1 mL
4,0 mL
0,05 mL
0,005 mL
3,8 mL
1,0 mL
0,8 mL
1,6 mL
0,4 mL
0,4 mL
15,0 g
72,0 g
5,0 g
1000 mL
0,25 %
45 %
45 %
10 %
45 %
45 %
10 %
Anmerkung
In angegebener
Reihenfolge mischen,
direkt verwenden.
In angegebener
Reihenfolge mischen,
direkt verwenden.
Lagerung bei −20 °C.
Lagerung bei 4 °C, vor
Gebrauch mit H2Obidest
verdünnen.
(m/V)
(V/V)
(V/V)
(V/V)
(V/V)
(V/V)
(V/V)
175
Material und Methoden
5.2.1.2 DNA-Isolierung (Alkalische Lyse)
Plasmidisolierung aus Escherichia coli
Tab. 20: Puffer zur Plasmidisolierung aus E. coli (s. 5.5.2).
Puffer
P1
P2
P3
Zusammensetzung
Tris-HCl
EDTA
NaOH
SDS
Kaliumacetat
25 mM
10 mM
0,2 M
1%
3,0 M
Anmerkung
pH 8,0 einstellen.
Getrennt ansetzen.
(m/V)
Mit Eisessig auf pH 5,2
einstellen.
Isolierung genomischer DNA aus Streptomyces spp.
Tab. 21: Puffer zur Isolierung genomischer DNA aus Streptomyces spp. (s. 5.5.2).
Puffer
B1
Zusammensetzung
Tris-HCl
EDTA
1M
0,25 M
Anmerkung
pH 8,0 einstellen.
5.2.1.3 Agarosegelelektrophorese
Tab. 22: Lösungen zur Agarosegelelektrophorese (s. 5.5.4).
Lösung / Puffer
0,7 % Agarose
(m/V)
Zusammensetzung
Agarose
TAE-Puffer (s. u. )
Ladepuffer 6×
1 kb Leiter
TAE
(50×Konzentrat)
gebrauchsfertige Lösung von Promega
gebrauchsfertige Lösung von Promega
Tris
2M
EDTA
0,05 M
Methylenblaufärbebad
Ethidiumbromidfärbebad
Methylenblau
0,2 %
Ethidiumbromid
10
ad
7,0 g
1000 mL
µg/
mL
Anmerkung
In der Mikrowelle bis zu
einer klaren Lösung
aufkochen, bei 55 °C
lagern.
Gemäß Herstellerangaben verwenden.
Mit Eisessig auf pH 8,0
einstellen, vor Gebrauch
mit H2Obidest verdünnen.
(m/V)
Schutzausrüstung
verwenden.
176
Material und Methoden
5.2.1.4 Protoplastierung und Transformation von Streptomyces spp.
Tab. 23: Puffer zur Protoplastierung und Transformation von Streptomyces spp. (s. 5.7.1) gemäß [393].
Lösung / Puffer
P-Puffer
T-Puffer
Spurenelementelösung P
Zusammensetzung
Saccharoselösung (12 % m/V)
Spurenelementelösung P (s. u.)
TES (0,25 M, pH 7,2)
MgCl2 (1 M)
K2SO4 (140 mM)
KH2PO4 (40 mM)
CaCl2 (0,25 mM)
Saccharoselösung (25 % m/V)
PEG 1000 (50 % m/V)
K2SO4 (140 mM)
CaCl2 (1 M)
MgCl2 (1 M)
KH2PO4 (40 mM)
Tris-Maleat (0,5 M, pH 8,0)
Spurenelementlösung P (s. u.)
H2Obidest
FeCl3×6H2O
ZnCl2
CuCl2×2H2O
MnCl2×4H2O
Na2B4O7×10H2O
(NH4)6Mo7O24×4H2O
H2Obidest
ad
85,5 mL
0,2 mL
10,0 mL
1,0 mL
1,0 mL
1,0 mL
1,0 mL
1,0 mL
5,0 mL
0,1 mL
1,0 mL
0,1 mL
0,1 mL
1,0 mL
0,03 mL
2,0 mL
0,20 g
0,04 g
0,01 g
0,01 g
0,01 g
0,01 g
1000 mL
Anmerkung
Alle Lösungen getrennt
autoklavieren. Lagerung
bei −20 °C.
Alle Lösungen getrennt
autoklavieren. Lagerung
bei −20 °C.
Autoklavieren.
5.2.2 Nährmedien
Alle Nährmedien wurden autoklaviert. Festmedien enthielten Agar als Gerüstbildner, soweit
nicht anders angegeben in einer Konzentration von 18 g/L. Der pH-Wert wurde, wenn nicht
anders angegeben, mit 1 M HCl- bzw. 1 M NaOH-Lösung eingestellt. Antibiotika und andere
hitzeempfindliche Substanzen wurden nach dem Autoklavieren steril zugegeben.
177
Material und Methoden
5.2.2.1 Aspergillus nidulans TTRM1
Tab. 24: Medium zur Kultivierung von Aspergillus nidulans TTRM1 (s. 5.3).
Medium
GMM+Biotin
Nitratsalzkonzentrat 20×
Spurenelementelösung G
Zusammensetzung
Glucose-Monohydrat
Nitratsalzkonzentrat 20×
Spurenelementelösung G
Biotinlösung (0,01 % (m/V))
ad
H2Obidest
NaNO3
KCl
MgSO4×7H2O
KH2PO4
H2Obidest
ad
ZnSO4×7H2O
H3BO3
MnCl2×4H2O
FeSO4×7H2O
CoCl2×5H2O
CuSO4×5H2O
(NH4)6Mo7O24×4H2O
Na4EDTA
H2Obidest
ad
10 g
50 mL
1 mL
0,25 mL
1000 mL
120,0 g
10,4 g
10,4 g
30,4 g
1000 mL
2,20 g
1,10 g
0,50 g
0,50 g
0,16 g
0,16 g
0,11 g
5,00 g
100 mL
Anmerkung
pH 6,5 einstellen.
Autoklavieren, bei RT
lagern.
Mit 1M KOH-Lösung
auf pH 6,5 einstellen,
bei RT lagern, Anteile
der Suspension unter
Rühren entnehmen.
5.2.2.2 Bacillus subtilis
Tab. 25: Medien zur Kultivierung von Bacillus subtilis (s. 5.3).
Medium
DM-Medium
Sporulationsmedium
Zusammensetzung
K2HPO4
KH2PO4
(NH4)2SO4
NaCl
MgSO4×7H2O
H2Obidest
Glucose (40 % (m/V))
FeCl3×6H2O
MnCl2×4H2O
NH4Cl
Na2SO4
KH2PO4
CaCl2×2H2O
NH4NO3
MgCl2×6H2O
Glucose
Na-L-Glutamat×H2O
H2Obidest
ad
ad
7,0 g
3,0 g
1,0 g
0,1 g
0,1 g
990 mL
10 mL
1,0 mg
17,7 mg
540,0 mg
105,0 mg
87,0 mg
257,9 mg
96,0 mg
8,3 mg
2,0 g
1,9 g
1000 mL
Anmerkung
pH 7,0 einstellen,
Glucoselösung getrennt
autoklavieren.
pH 7,1 einstellen.
178
Material und Methoden
5.2.2.3 Escherichia coli / Rhodococcus sp. RHA1
Tab. 26: Medien zur Kultivierung von E. coli / Rhodococcus sp. RHA1 (s. 5.3).
Medium
LB (modifiziert
nach [394])
Zusammensetzung
Trypton
Hefeextrakt
NaCl
H2Obidest
ad
10 g
5g
10 g
1000 mL
Anmerkung
pH 7,0 einstellen.
5.2.2.4 Streptomyces spp. / Saccharothrix spp.
Tab. 27: Medien zur Kultivierung von Streptomyces spp. / Saccharothrix spp. (s. 5.3).
Medium
CDM [395]
E1 [66]
HA
Zusammensetzung
Lösung A:
tri-Natriumcitrat×2H2O
L-Prolin
K2HPO2×3H2O
(NH4)2SO4
NaCl
H2Obidest
ad
6
6
2
1,5
5
800
g
g
g
g
g
mL
Lösung B:
MgSO4×7H2O
CaCl2×2H2O
FeSO4×7H2O
ZnSO4×7H2O
Lösung A
H2Obidest
2,05
0,4
0,2
0,1
800
900
g
g
g
g
mL
mL
Lösung C:
Glucose×H2O
H2Obidest
Glucose
Stärke
Pharmamedia
Hefeextrakt
CaCO3
NaCl
MgSO4×7H2O
K2HPO4×3H2O
Leitungswasser
Hefeextrakt
Malzextrakt
Glucose
Leitungswasser
ad
ad
ad
ad
30 g
100 mL
20 g
20 g
5g
2,5 g
3,0 g
1,0 g
1,0 g
1,0 g
1000 mL
4,0 g
10,0 g
4,0 g
1000 mL
Anmerkung
Lösung A herstellen,
pH 7,2 einstellen. Mit
Lösung A Lösung B
herstellen. Lösung B
und Lösung C nach dem
getrennten Autoklavieren mischen.
pH 7,2 einstellen.
pH 7,2 einstellen.
179
Material und Methoden
Medium
Hafermedium
(modifiziert
gemäß [56])
MS
NB-Weichagar
[66]
NL5 [396]
NL19
NL111
Zusammensetzung
Holo Bio Hafergold
Spurenelementlösung H
H2Obidest
ad
20 g
2,5 mL
1000 mL
Spurenelementelösung H:
CaCl2×2H2O
FeCl3×6H2O
Zitronensäure
MnSO4
ZnCl2
CuSO4×5H2O
Na2B4O7×10H2O
MoNa2O4×2H2O
CoCl2
H2Obidest
ad
Sojamehl, vollfett
D-Mannitol
Leitungswasser
ad
MgCl2 (1 M)
Nutrient Broth
Agar
H2Obidest
ad
NaCl
K2HPO4
MgSO4×7H2O
Spurenelementlösung NL
Glycerin
L-Glutamin
ad
H2Obidest
Anmerkung
Spurenelementelösung
autoklaviert bei RT
lagern, pH-Wert des
Mediums auf 7,2
einstellen.
3000 mg
660 mg
780 mg
200 mg
100 mg
25 mg
20 mg
10 mg
4 mg
1000 mL
20,0 g
20,0 g
990 mL
10 mL
8,0 g
5,0 g
1000 mL
1,0 g
1,0 g
0,5 g
2,0 mL
25,0 g
5,84 g
1000 mL
pH 7,2 einstellen.
MgCl2-Lösung nach
dem Autoklavieren
zugeben.
Spurenelementlösung NL:
FeCl3×6H2O
ZnCl2
CuCl2×2H2O
MnCl2×4H2O
Na2B4O7×10H2O
(NH4)6Mo7O24×4H2O
H2Obidest
ad
Sojamehl, vollfett
D-Mannitol
Leitungswasser
ad
Lab Lemco Fleischextrakt
Malzextrakt
CaCO3
Leitungswasser
ad
200 mg
40 mg
10 mg
10 mg
10 mg
10 mg
1000 mL
20,0 g
20,0 g
1000 mL
20,0 g
100,0 g
10,0 g
1000 mL
Spurenelementelösung
autoklaviert bei RT
lagern, pH-Wert des
Mediums auf 7,2
einstellen.
pH 7,2 einstellen.
pH 7,2 einstellen.
180
Medium
R2YE [66]
Material und Methoden
Zusammensetzung
Lösung A:
Glucose
L-Prolin
Casaminosäuren
MgCl2×6H2O
CaCl2×2H2O
K2SO4
Agar
H2Obidest
Lösung B:
Hefeextrakt
Saccharose
TES-Puffer
H2Obidest
R3-Weichagar
SG
TSB [66]
TSB+
Lösung C:
KH2PO4 (0,5% (m/V))
Pepton
Saccharose
Glucose
MgCl2×6H2O
CaCl2×2H2O
KCl
Agar
H2Obidest
TES (250mM, pH 7,2)
KH2PO4 (0,5% (m/V))
Sojapepton
Glucose×H2O
L-Valin
CaCO3
CoCl2-Lösung 1mg/mL
Leitungswasser
Tryptic Soy Broth
Leitungswasser
Tryptic Soy Broth
Glycin
Saccharose
Leitungswasser
ad
10,0 g
3,0 g
0,1 g
10,12 g
2,95 g
0,25 g
22,0 g
500 mL
ad
5,0 g
103,0 g
5,73 g
500 mL
ad
ad
ad
ad
10 mL
4,0 g
171,0 g
10,0 g
8,1 g
2,2 g
0,5 g
8,0 g
860 mL
100 mL
40 mL
10,0 g
20,0 g
2,34 g
2,0 g
1 mL
1000 mL
30 g
1000 mL
30,0 g
4,0 g
100,0 g
1000 mL
Anmerkung
Lösung A auf pH 7,4
einstellen. Lösungen A,
B und C nach dem
Autoklavieren mischen
und 2 mL Spurenelementelösung NL
(s. NL5) zugeben.
TES- und KH2PO4Lösung nach dem
Autoklavieren zugeben.
pH 7,2 einstellen.
pH 7,2 einstellen.
pH 7,2 einstellen.
181
Material und Methoden
5.2.3 Selektionsantibiotika
Stammlösungen der Antibiotika wurden in den angegebenen Konzentrationen hergestellt und
bei −20 °C gelagert. Wässrige Lösungen wurden durch einen Membranfilter mit der
Porengröße 0,2 µm steril filtriert. Die Antibiotika wurden den Medien nach Abkühlen auf
eine Temperatur unter 50 °C steril zugesetzt.
Tab. 28: Selektionsantibiotika.
Antibiotikum
Kürzel
Apramycin
Carbenicillin
Chloramphenicol
Hygromycin
Kanamycin
Phosphomycin
Spectinomycin
Tetrazyklin
Thiostrepton
Apra
Carb
Cam
Hyg
Kana
Phos
Spec
Tet
Tsr
Endkonzentration im
Medium [µg/mL]
50 oder 100
50
30
100
50
250
100
10
50
Stammlösung
[mg/mL]
50
in H2Obidest
50
in H2Obidest
30
in Ethanol
50
in H2Obidest
50
in H2Obidest
50
in H2Obidest
50
in H2Obidest
5
in Ethanol 70%
50
in DMSO
5.2.4 Chemikalien und Medienbestandteile
Chemikalien und organische Lösungsmittel wurden von den Firmen Carl Roth (Karlsruhe),
Fluka (Taufkirchen), Sigma-Aldrich (Steinheim), USB (Cleveland, USA), Merck
(Darmstadt), für die molekularbiologische Verwendung teilweise auch von Promega
(Madison, USA) bezogen und ohne weitere Reinigung eingesetzt. [1,2-13C2]-Acetat (beide
Atome 99 % 13C-Anreicherung) wurde von Isotec (Miamisburg, USA) bezogen. Die Bezugsquellen der zur Biotransformation an Saccharothrix espanaensis gefütterten Substanzen sind
in Tab. 29 aufgelistet, jene komplexer Bestandteile von Nährmedien in Tab. 30.
Tab. 29: Chemikalien zur Fütterung an Saccharothrix espanaensis (s. 3.1).
Name (Nummer)
Anthrachinon (1)
1,2-Dihydroxyanthrachinon (2)
1,4-Dihydroxyanthrachinon (3)
1,5-Dihydroxyanthrachinon (4)
1,8-Dihydroxyanthrachinon (5)
2,6- / 2,7-Dihydroxyanthrachinon (6)
1,8-Dihydroxy-3-methylanthrachinon (7)
1,8-Dihydroxy-3-(hydroxymethyl)-anthrachinon (8)
1,3,8-Trihydroxy-6-methylanthrachinon (9)
1,8-dihydroxy-3-methoxy-6-methylanthrachinon (10)
1,4,5,8-Tetrahydroxyanthrachinon (11)
Hersteller / Bezugsquelle
Sigma-Aldrich
Fluka
Sigma-Aldrich
Sigma-Aldrich
Sigma-Aldrich
Prof. Dr. V. Novikov
(Lviv, Ukraine)
Roth
Roth
Roth
Roth
Prof. Dr. V. Novikov
182
Material und Methoden
Name (Nummer)
1,2,5,8-Tetrahydroxyanthrachinon (12)
1-Aminoanthrachinon (13)
1-Amino-4-chloranthrachinon (14)
1-Amino-2-chloranthrachinon (15)
1-Amino-4-hydroxyanthrachinon (16)
1-Amino-2-phenoxy-4-hydroxyanthrachinon (17)
1,5-Diaminoanthrachinon (18)
1-Amino-4-[(2-hydroxyethyl)amino]-anthrachinon (19)
1-Amino-4-[(4-methylphenyl)amino]-anthrachinon (20)
1-Amino-2-carboxyanthrachinon (21)
1-Amino-4-brom-2-carboxyanthrachinon (22)
1-Amino-2-carboxy-4-(methylamino) / 1,4-Diamino-2carboxyanthrachinon (23)
1,8-Dihydroxy-4,5-dinitroanthrachinon (24)
Mitoxantron (25)
Norsolorinsäure (26)
3,3',4',5,7-Pentahydroxyflavone (27)
(+)-(2R:3S)-5,7,3',4'-Tetrahydroxyflavan-3-ol (28)
9,10-Dihydro-9-oxoacridin (29)
9H-Fluoren-9-on (30)
1,8-Dihydroxyanthrone (31)
Morphin (32)
Phenytoin (33)
Novobiocinsäure (34)
Phenprocoumon (35)
Chromon (36)
Lawson (37)
Juglon (38)
Menadion (39)
Resveratrol (40)
Hersteller / Bezugsquelle
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Prof. Dr. V. Novikov
Sigma-Aldrich
Sigma-Aldrich
Aspergillus nidulans TTRM1
Sigma-Aldrich
Roth
Sigma-Aldrich
Fluka
Sigma-Aldrich
Institut für Pharmazeutische
Wissenschaften (Freiburg)
Inst. Pharm. Wiss. (Freiburg)
s. 5.12
Inst. Pharm. Wiss. (Freiburg)
Sigma-Aldrich
Sigma-Aldrich
Sigma-Aldrich
Inst. Pharm. Wiss. (Freiburg)
Axxora (Lörrach)
Tab. 30: Komplexe Medienbestandteile.
Name
Agar
Casaminosäuren
Hefeextrakt
Holo Bio Hafergold
Lab Lemco-Fleischextrakt
Malzextrakt
Nutrient Broth
Pepton
Pharmamedia
Sojamehl
Tryptic Soy Broth
Hersteller / Bezugsquelle
Becton Dickinson (Heidelberg)
Becton Dickinson (Heidelberg)
Difco (Detroit, USA)
Neuform International (Zarrentin)
Roth (Karlsruhe)
Difco (Detroit, USA)
Becton Dickinson (Heidelberg)
Becton Dickinson (Heidelberg)
Southern Cotton Oil Company (Memphis, USA)
Schoenenberger Pflanzensaftwerk (Magstadt)
Becton Dickinson (Heidelberg)
183
Material und Methoden
5.2.5 Enzyme und molekularbiologische Kits
Tab. 31: Enzyme und zugehörige Substratlösungen / Puffer.
Name
DNA Polymerase I Large (Klenow) Fragment
dNTP-Mix (alle vier Nukleotide je 10 mM)
GoTaq- / Taq-Polymerase
Lysozym aus Hühnereiweis
Pfu-Polymerase
Restriktionsendonukleasen, Puffer, BSA
RNAse A
T4-DNA-Ligase
Hersteller / Bezugsquelle
Promega
Promega
Promega / Eigenherstellung
Fluka
Promega / Eigenherstellung
Promega , NEB (Ipswich, USA)
Qiagen (Hilden)
Promega
Tab. 32: Molekularbiologische Kits.
Name
Pure Yield Plasmid Midiprep System
Wizard SV Minipreps DNA Purification System
Wizard SV Gel and PCR Clean-up System
5.3
Hersteller / Bezugsquelle
Promega
Promega
Promega
Bakterienstämme und deren Kultivierung
Die eingesetzten Medien sind unter 5.2.2 aufgeführt.
5.3.1.1 Escherichia coli
Tab. 33: E. coli Laborstämme.
Stamm
E. coli XL1blue
E. coli DH5α
E. coli ET12567
Eigenschaften
recA1, endA1, gyrA96, thi-1, hsdR17,
supE44, relA1, lac[F´proAB, lacIqZDM15,
Tn10 (tet)]
F−, φ80dlacZ∆M15 (lacZYA-argF) U169,
deoR, recA1, endA1, hsdR17(r k−, m k+),
phoA, supE44, thi-1, gyrA96, relA1 λ−
F−, dam-13::Tn9, dcm-6 hsdM, hsdR, zjj202::Tn10, recF143, galK2, galT22, ara-14,
lacY1, xyl15, leuB6, thi1, tonA31, rpsL136,
his64, tsx78, mtlI, glnV44
Referenz
[397]
[156]
[398]
Die Anzucht von E. coli erfolgte stets in LB-Medium. Flüssigkulturen mit einem Volumen bis
4 mL wurden im Reagenzglas mit Aluminiumkappe, Volumina bis 100 mL in 300 mLErlenmeyerkolben mit einer Schikane angesetzt und über Nacht bei 37 °C (mit pBADαβγ bei
30 °C, s. 5.5.5, λ-Red vermittelte Rekombination in E. coli) auf einem Rundschüttler mit
180 rpm inkubiert. Kulturen auf LB-Agarplatten wurden über Nacht bei 37 °C bzw. 30 °C im
184
Material und Methoden
Brutschrank inkubiert. Die Verwendung von E. coli ET12567, der Zusatz mehrerer
Antibiotika oder die Kultivierung bei 30 °C erfordern längere Inkubationszeiten. Auf bei 4 °C
gelagerten LB-Agarplatten ist der Stammerhalt für einige Monate möglich, als Zellsuspension
in 30 % Glycerin können die Stämme bei −86 °C mehrere Jahre überdauern.
5.3.1.2 Aspergillus nidulans TTRM1
Der Ascomycet Aspergillus nidulans TTRM1 ist eine Biotin auxotrophe Mutante mit
Blockade der Aflatoxin- / Sterigmatocystinbiosynthese auf Stufe der Norsolorinsäure [399].
Zur Produktion von Norsolorinsäure wurden je 100 mL GMM+Biotin-Flüssigmedium in
300 mL-Erlenmeyerkolben mit Schikane und Spirale mit der Hälfte der von einer vollständig
mit sporenbildenden Kolonien bewachsenen Agarplatte (GMM+Biotin, ∅ = 9 cm) gewonnen
Sporensuspension inokuliert. Nach zweitägiger Inkubation bei 37 °C auf einem Rundschüttler
mit 180 rpm entstanden weiße, flauschige Bällchen mit ca. 3 mm Durchmesser. Nach sieben
Tagen war das Myzel abgestorben und Norsolorinsäure wurde bei pH 7,5 durch dreimaliges
Ausschütteln der Kulturbrühe mit Ethylacetat extrahiert. GMM+Biotin-Agarplatten, die mit
einer Sporensuspension inokuliert werden, sind bereits nach 24 h von sporenbedecktem
Myzel überwachsen und können zum Animpfen von Flüssigkulturen oder zur Gewinnung
einer Sporensuspension in 0,1 % Tweenlösung verwendet werden. Der Stammerhalt für einige
Monate ist auf bei 4 °C gelagerten GMM+Biotin-Agarplatten, für mehrere Jahre als Sporensuspension bei −86 °C möglich.
5.3.1.3 Bacillus subtilis
Bacillus subtilis (Ehrenberg) Cohn ATCC6051 [400] wurde für die Testung von Novobiocinderivaten auf antibiotische Aktivität verwendet. Die Testplatten wurden mit DM-Festmedium
gegossen, das zuvor mit 24 mL B. subtilis-Sporensuspension/Liter Medium inokuliert wurde.
Zur Gewinnung der Sporensuspension wurden 100 mL Sporulationsmedium (s. Tab. 25)
mit 300 µl einer vorherigen Charge B. subtilis-Sporensuspension beimpft und für drei Tage
bei 30 °C auf dem Rundschüttler (120 rpm) inkubiert. Wachstum und Sporenbildung wurden
mikroskopisch verfolgt. Nach Auftreten der ersten Sporen wurde 1 mL der Kultur zum
Animpfen von 100 mL frischem Sporulationsmedium eingesetzt. Dort waren nach drei- bis
fünftägiger Inkubation bei der mikroskopischen Kontrolle neben einer geringen Menge
vegetativer Zellen nur noch Sporen zu erkennen. Die Kulturen wurden dann durch
Zentrifugation (4 °C, 5000 rpm, 10 min) sedimentiert. Nach dreimaligem Waschen der
erhaltenen Pellets mit sterilem Leitungswasser wurden die Sporen in sterilem Leitungswasser
aufgenommen und verdünnt bis zu einer OD546 von 1,5. Die fertige Sporensuspension wurde
in 12 mL-Portionen aliquotiert, im Wasserbad bei 70 °C für 45 min erhitzt und anschließend
bei −20 °C gelagert.
185
Material und Methoden
5.3.1.4 Actinomycetales: Streptomyces / Saccharothrix / Rhodococcus spp.
Tab. 34: Stämme aus der Ordnung Actinomycetales.
Stamm
Rhodococcus sp. RHA1
Saccharothrix australiensis
Saccharothrix espanaensis
Saccharothrix tangerinus sp.
nov. (= Umezawaea tangerina
gen. nov., comb. nov.)
Streptomyces albus
Streptomyces coelicolor A3(2)
Streptomyces
diastatochromogenes Tü6028
Streptomyces griseoviridis
Tü3634
Streptomyces sp. Gö C4/4
Streptomyces spheroides
AM1T2
S. coelicolor M512 mit Cosmid
nov-CA7
Eigenschaften, Besonderheiten der Anzucht
Biodegradation von polychlorierten
Biphenylen (PCBs), Genom sequenziert,
Kultivierung in LB-Medium.
Produzent verschiedener Aminoglykosidantibiotika, Metabolisierung lipophiler Moleküle ähnlich S. espanaensis.
Saccharomicinproduzent, Metabolisierung
lipophiler Moleküle durch Hydroxylierung
und Rhamnosylierung, Kultivierung in
TSB-Medium.
Formamicinproduzent. Aktuelle
phylogenetische Untersuchungen ordnen
den Stamm nicht mehr dem Genus
Saccharothrix sondern Umezawaea zu.
Wirt für die heterologe Genexpression.
Streptomyces-Modellorganismus, Genom
sequenziert.
Polyketomycinproduzent.
Produzent von Acyl-α-L-Rhamnosiden,
Metabolisierung lipophiler Moleküle
ähnlich wie S. espanaensis.
Mensacarcinproduzent, Flüssigkultur stets
von einer Agarplatte animpfen.
Novobiocinsäureproduzent, Mutante von
Streptomyces spheroides NCIMB11891.
Heterologer Wirt mit dem Novobiocinbiosynthesegencluster mit Defekt in
Ring A- und Zuckersynthesegenen.
Referenz
[132]
[131]
[353]
[401;402]
[403]
[70]
[50]
[299]
[56]
[126]
[404]
186
Material und Methoden
Standardkulturen von Actinomycetales-Stämmen
Wenn nicht anders in Tab. 34 angegeben, wurden die Stämme in / auf HA-Medium kultiviert.
Als Standardkultur der aufgelisteten Actinomycetales-Arten wurden 100 mL Flüssigmedium
in einem 300 mL-Erlenmeyerkolben mit zwei Schikanen und einer Spirale mit 1 cm2 einer
vollständig bewachsenen Agarplatte oder 5 mL einer Saccharosedauerkultur angeimpft. Nach
einer Inkubationsdauer von sechs bis sieben Tagen bei 28 °C und 180 rpm auf einem Rundschüttler wurde die Kulturbrühe zur Sekundärstoffanalytik mit Ethylacetat extrahiert
(s. 5.11.1). Vorkulturen wurden nur für Biotransformationsexperimente verwendet (s. u.).
Für genetische Manipulationen und zum Stammerhalt wurden die Stämme auch auf
Agarplatten kultiviert (28 °C, drei bis sieben Tage). Sporenbedeckte Agarkulturen, die mit
Parafilm vor Verdunstung geschützt bei Raumtemperatur gelagert werden, sind mehrere
Monate lang zum Animpfen frischer Kulturen geeignet. Für den Stammerhalt über Jahre
wurden Dauerkulturen in 25 % wässriger Saccharoselösung angelegt und bei −20 °C gelagert.
Zur Herstellung der Saccharosedauerkulturen wird eine nur drei Tage inkubierte
Standardkultur durch Zentrifugation (RT, 5000 rpm, 10 min) pelletiert, das Pellet einmal im
Kultur äquivalenten Volumen 25 % Saccharose gewaschen und schließlich im halben
Volumen 25 % Saccharose aufgenommen.
Biotransformation in Actinomycetales-Arten
Die Biotransformationsexperimente wurden ausgehend von Vorkulturen im stammspezifischen Medium (s. Tab. 34) bzw. in HA-Medium durchgeführt. Dazu wurden 100 mL
Flüssigmedium mit 5 mL einer Saccharosedauerkultur oder mit 1 cm2 einer vollständig
bewachsenen Agarplatte angeimpft. Mit je 5 mL der zwei bis drei Tage gewachsenen
Vorkultur wurden je Substanz 100 mL NL111-Flüssigmedium als Hauptkultur inokuliert.
Je 5 mg der Testsubstanzen wurden in 200 µL DMSO gelöst bzw. suspendiert und innerhalb
der ersten drei Tagen der Kultivierung zur Hauptkultur zugefüttert. Als Kontrolle diente eine
parallel angesetzte, aber nicht gefütterte Kultur. Nach sieben Tagen Inkubation bei 28 °C
(180 rpm) wurde die Kulturbrühe mit Ethylacetat extrahiert (s. 5.11.1).
187
Material und Methoden
5.4
Vektoren und Plasmide
5.4.1 Allgemeine Plasmidkonstrukte und Vektoren
Tab. 35: Alphabetische Liste der allgemeinen Plasmidkonstrukte und Vektoren.
Vektor
pBluescript II
SK(−) (= pBSK−)
pBluescript II
SK(+) (= pBSK+)
pGEM-T Easy
pHPΩ45aac
pIJ774
Größe
3,0 kb
3,0 kb
4,1 kb
4,4 kb
pIJ778
4,4 kb
pIJ785
4,6 kb
pKC1132
3,5 kb
pKC1218
5,8 kb
pMun2
pOJ436
2,7 kb
9,5 kb
3,0 kb
pBADαβγ
pSET-1cerm
7,0 kb
pSET152
3,5 kb
pUC19
2,7 kb
pUWL201
6,6 kb
pUWLoriT
pUZ8002
7,4 kb
Beschreibung
Klonier- und Sequenziervektor für E. coli; bla
(= carb), lacZ'α, f1(−)-origin, ColE1-origin
wie pBSK−, jedoch mit f1(+)-origin, hier als
Träger der Redirect-Kassetten eingesetzt
Vektor für die TA-Klonierung (s. 5.5.5)
bla (= carb), aac3C4 (= apra), pMB1-Replikon
Redirect-Kassette mit aac(3)IV (= apra) und
loxP-sites in pBSK+
Redirect-Kassette mit aadA (= spec) und
FRT-sites in pBSK+
Redirect-Kassette mit aac(3)IV (= apra), tipAPromotor und FRT-sites in pBSK+
in Streptomyces nicht replikativer Vektor für die
Geninaktivierung; aac(3)IV (= apra), lacZ'α ,
pMB1-Replikon, oriT RK2
in Streptomyces replikativer Vektor für die
Genexpression; aac(3)IV (= apra), pMB1Replikon, SCP2*-Replikon, oriT, lacZ'α
pBluescript II SK(−) mit modifizierter MCS
integrativer Cosmidvektor; aac(3)IV (= apra),
ColE1-origin, Integrationssystem des Phagen
φC31, oriT RK2
codiert die Proteine für die λ-Red Rekombination;
tet, red-exo, red-bet, red-gam des λ-Phagen,
thermosensitives Replikon von pSC101
Genintegrationsvektor für Streptomyces auf Basis
von pSET152; ermE-up-Promotor, mit urdGT1c
Genintegrationsvektor für Streptomyces
aac(3)IV (= apra), lacZ'α, pMB1-Replikon,
Integrationssystem des Phagen φC31, oriT RK2
Klonier- und Sequenziervektor für E. coli mit bla
(= carb), lacZ'α, pMB1-Replikon
Expressionsvektor für Streptomyces
bla (= carb), tsr, ermE-up-Promotor, pMB1Replikon, pIJ101 origin of replication
pUWL201-Derivat mit oriT RK2 für Konjugation
Fertilitätsplasmid für Konjugation mit oriT
kana, RK2-Derivat (IncP-1α Gruppe), tra1 und
tra2 Region
Referenz
[405;406]
[406]
[407]
[408]
[151]
[151]
[151]
[409]
[409]
[410]
[409]
[411]
[412]
[409]
[413;414]
[415]
[416]
[66]
188
Material und Methoden
5.4.2 Spezielle Plasmidkonstrukte und Cosmide
Nach Projekten gegliedert, in Reihenfolge des Ergebnisteils, finden sich im Folgenden
Informationen zu Plasmiden, die speziell für diese Arbeit erstellt wurden.
5.4.2.1 Neue Redirect-Kassetten
Plasmid pIJ785Spec (4620 bp), Träger einer Redirect-Kassette mit spec und tipA-Promotor
(s. 5.5.5, λ-Red vermittelte Rekombination zur Geninaktivierung)
Hin d III 4612
Xho I 4591
Xba I 36
Kpn I 4576
Sac I 71
Pvu I 4420
FRT
19 bp priming site
Pvu I 512
spec
4000
1000
carb
Pvu I 3375
pIJ785Spec
3000
2000
oriT
FRT
20 bp priming site
tipA-promotor
Xba I 1367
Pst I 1389
Bam HI 1401
Sac II 1650
Eco RI 1663
Pst I 1669
Bam HI 1681
Xba I 1693
Not I 1699
Sac II 1709
Sac I 1717
Plasmidkonstruktion:
Es sollte eine Redirect-Kassette (s. 5.5.5.5) gewonnen werden, die eine Spectinomycinresistenzkassette sowie den tipA-Promotor trägt. Über λ-Red vermittelte Rekombination
(s. 5.5.5.5) wurde die ursprünglich im Plasmid pIJ785 (s. Tab. 35) enthaltene Apramycinresistenzkassette gegen die Spectinomycinresistenzkassette von pIJ778 ausgetauscht. Lineare
Matrize der λ-Red Rekombination war das 1159 bp große PCR-Produkt der Primer
aadA-F / -R (s. 5.6.3.1) von pIJ778 (s. Tab. 35) als Matrize. Das PCR-Produkt hatte beidseitig
189
Material und Methoden
homologe Überhänge von 40 bp, an denen die Rekombination erwartet wurde. Die
Ansequenzierung ergab, dass deutlich längere Bereiche identischer Sequenz von 187 bp
(stromaufwärts bezüglich spec) und 100 bp (stromabwärts bezüglich spec) miteinander
rekombinierten. Auch diese Rekombination führte zum gewünschten Markeraustausch. Das
entstandene Plasmid wurde mit dem Namen pIJ785Spec bezeichnet.
Plasmid pIJ774Spec (4374 bp), Träger einer Redirect-Kassette mit loxP-sites und spec
(s. 5.5.5, λ-Red vermittelte Rekombination zur Geninaktivierung)
Pvu I 500
Pvu I 3823
Kpn I 653
HindIII 689
Bam HI 709
carb
20 bp priming site
loxP
oriT
4000
pIJ774Spec
1000
3000
2000
spec
Pvu I 1591
19 bp priming site loxP
Sac I 2032
Eco RI 2111
Pst I 2117
Bam HI 2129
Xba I 2141
Not I 2147
Sac I 2165
Plasmidkonstruktion:
Analog zur Konstruktion von pIJ785Spec (s. o.) wurde die Apramycinresistenzkassette des
Plasmids pIJ774 (s. Tab. 35) per λ-Red Rekombination durch die Spectinomycinresistenzkassette des Plasmids pIJ778 ersetzt. Auch hier kam es zur Rekombination der flankierenden
DNA-Bereiche beider Resistenzkassetten. Das so gewonnene Plasmid pIJ774Spec ermöglicht
nach der Geninaktivierung per [safe-knock]-Strategie eine Exzision der Redirect-Kassette mit
der sequenzspezifischen Cre-Rekombination (s. 5.9).
190
Material und Methoden
5.4.2.2 Inaktivierungs- und Expressionsplasmide für S. diastatochromogenes
Tü6028
Plasmid pKC-P3,7 (6515 bp), pok-KSα-Inaktivierungskonstrukt (s. 3.2.1)
Hind III 400
Pst I 412
Xba I 424
Bam HI 430
Kpn I 439
Sac I 445
'lacZ´
Sac I 5615
pok-M2'
Xho I 5415
6000
pok-MT1
1000
apra
Sac I 4915
5000
pKC-P3,7
Bam HI 1656
2000
Bam HI 1880
4000
3000
pok-KSα*
lacZ´'
Kpn I 2105
pok-KSβ'
Bam HI 2576
Eco RI 3763
Sac I 3757
Bam HI 3548
Bam HI 3536
Plasmidkonstruktion:
Durch Entfernung eines 390 bp großen EcoRV / NotI-Fragments sollte eine In-frame-Deletion
innerhalb des pok-KSα-Leserahmens erreicht werden. Ausgehend vom Cosmid
30-6D20 [38] wurde zunächst ein SacI-Subklon erstellt (s. 5.5.5.2), der pok-KSα in der Mitte
seines 3702 bp-Inserts trägt. Der mit EcoRV / NotI verdaute Subklon wurde zum Auffüllen
der von NotI zurückgelassenen 5'-Überhänge mit Klenow-Fragment (s. 5.5.5.4) behandelt und
religiert. Das künstlich erstellte, nicht funktionelle pok-KSα-Allel konnte über EcoRI / HindIII
in den Inaktivierungsvektor pKC1132 umkloniert werden, um so das Inaktivierungskonstrukt
pKC-P3,7 zu erhalten.
191
Material und Methoden
Plasmid pKC-P7,3 (10473 bp), pok-KSα-Inaktivierungskonstrukt (s. 3.2.1)
Hind III 400
Pst I 406
Sac I 604
Sac I 9573
Xho I 9373
oriT
Sac I 8873
'lacZ´
pok-M2'
pok-MT1
apra
10000
lacZ´'
Eco RI 7721
Eco RV 7715
Bam HI 7697
Xba I 7691
Pst I 7679
Not I 7563
8000
pKC-P7,3
Bam HI 1815
Bam HI 2039
Eco RV 2051
Not I 2442
2000
pok-KSα*
pok-AC2'
6000
pok-AC3
oriT
Bam HI 3056
pok-KSβ
pok-AC1
pok-ACP
Sac I 6632
Bam HI 4016
Bam HI 4028
Sac I 4237
Sac I 4553
Die im ursprünglichen Subklon vorhandene KpnI-Schnittstelle lag dort bei Position 2654.
Plasmidkonstruktion:
Ziel war es, durch eine Leserahmenverschiebung ein nicht funktionelles Allel des Gens zu
konstruieren. Zunächst wurde dazu ein pok-KSα tragendes 7342 bp PstI-Clusterfragment (von
Cosmid 30-6D20) in den Vektor pKC1132 subkloniert (s. 5.5.5.2). An der singulär vorhandenen KpnI-Erkennungsstelle wurde das Plasmid geöffnet, die entstandenen klebrigen Enden
mit Klenow-Fragment "geglättet" (s. 5.5.5.4) und religiert. Die durch KpnI entstandenen
3'-Überhänge können durch das Klenow-Fragment nicht aufgefüllt werden, stattdessen
werden die 3'-Überhänge durch die 3'→5'-Exonukleaseaktivität des Enzyms abgetragen.
Durch Ansequenzieren mit spezifischen Primern (s. 5.6.2) wurde gezeigt, das es zur
weitergehenden Abtragung von Basen und damit nach Ligation zu einer 69 bp In-frameDeletion im Bereich der vormals vorhandenen KpnI-Erkennungsstelle gekommen war. Das
Gen pok-KSα sollte folglich trotz der nicht erreichten Leserahmenverschiebung seine Funktion
verloren haben.
192
Material und Methoden
Plasmid pB-P3,7red (8552 bp), pok-KSα-Inaktivierungsplasmid (s. 3.2.2)
Sac I 8548
Eco RI 8542
'lacZ´
pok-M2'
Bam HI 1207
pok-MT1
Bam HI 1431
Xba I 1537
Sac I 1572
carb
8000
pB-P3,7red
2000
pIJ785Spec
Kassette*
6000
Bst EII 2230
lacZ´''
4000
Hind III 5907
pok-KSβ
Pml I 5498
Sac I 5435
apra
'lacZ´'
Bst EII 4712
Sac I 4683
Xba I 2868
Pst I 2890
Bam HI 2902
Pml I 3076
Bst EII 3474
Bst EII 3508
Bam HI 3920
Bam HI 3932
Sac I 4141
Bam HI 4156
*Richtung des Pfeils
Xba I 4162
= Orientierung des tipA-Promotors
Pst I 4174
Hind III
Plasmidkonstruktion:
Das Inaktivierungsplasmid pB-P3,7red ist über die [safe-knock]-Strategie (s. 5.8.2)
entstanden. Als Ausgangspunkt konnte ein 3,7 kb SacI-Subklon in pUC19 verwendet werden,
der als Zwischenprodukt der Konstruktion von pKC-P3,7 bereits vorlag. Die eingesetzten
Redirect-Primer (p3,7red-F / -R, s. 5.6.3) wurden so abgeleitet, dass die anschließende λ-Red
vermittelte Rekombination zum fast vollständigen Ersatz von pok-KSα durch die RedirectKassette von pIJ785Spec (s. 5.5.5.5) führte. Der tipA-Promotor der Kassette liegt in gleicher
Richtung wie die nachgeschalteten Gene des pok-KSα enthaltenden Operons. Über die
Ansequenzierung mit Standardprimern und spezifischen Primern (s. 5.6.2) konnte die
Sequenz bestätigt werden. Die Orientierung der im letzten Klonierungsschritt eingebrachten
apra-Kassette ist unbekannt.
193
Material und Methoden
Plasmid pSET-P3,7kompl (7001 bp), pok-KSα-Komplementierungsplasmid (s. 3.2.2)
Hind III 230
Hind III 6512
integrase PhiC31
lacZ´
7000
pok-KSβ'
Pst I 5551
5000
Bam HI 1450
1000
6000
oriT
Hind III 1190
Pst I 1196
Xba I 1208
Bam HI 1214
pSETP3,7kompl
pok-KSα
2000
Kpn I 1921
4000
3000
Pst I 4727
pok-MT1'
apra
Sac I 4481
oriR
Xho I 4211
Not I 2131
Eco RV 2524
Bam HI 2536
Eco RI 2739
Sac I 3791
Plasmidkonstruktion:
Das per Pfu-PCR mit den Primern P7,3-F / -R (s. 5.6.3) und Cosmid 30-6D20 als Matrize
gewonnene 1501 bp Produkt wurde mit seinen glatten Enden direkt in den mit EcoRV
geöffneten, integrativen Vektor pSET152 (s. Tab. 35) ligiert. Das insertierte Clusterfragment
deckt außer dem Gen pok-KSα auch den gesamten Bereich zwischen diesem Gen und
pok-MT1 ab. In diesem Bereich ist der native Promotor von pok-KSα lokalisiert. Die Lage des
Inserts und dessen korrekte Sequenz wurden über eine Ansequenzierung mit zwei Standardprimern bestimmt (s. 5.6.2).
194
Material und Methoden
5.4.2.3 Expressionsplasmid für das synthetische Gen flp(a)
Plasmid pUWLhyg-FLP (9039 bp), flp(a)-Expressionsplasmid (s. 5.9)
Hind III 9039
Kpn I 8731
ermE-uppromotor
Not I 7203
replicon
flp(a)
Sac I 969
Kpn I 1201
Bam HI 1278
Xba I 1290
Not I 1296
8000
Mun I 6879
2000
ori pIJ101
oriT
pUWLhyg-FLP
6000
carb
4000
hyg
ori ColE1
Eco RI 5679
Sac I 5643
'fd ter
Xba I 4730
Plasmidkonstruktion:
Das synthetische Rekombinasegen flp(a) (NCBI accession number EU170351) wurde als
HindIII / BamHI-Fragment von pUWL-FLP [155] in den durch HindIII / BamHI-Restriktion
vom Insert getrennten Vektor von pUWLhyg-Tn5 ligiert. Letzteres Plasmid basiert auf
pUWLoriT (s. Tab. 35) und wurde von Lutz Petzke (AK Bechthold) zur Expression eines
synthetischen Transposasegens erstellt.
Material und Methoden
195
5.4.2.4 Subklone und Cosmide der DNA von S. sp. Gö C4/4
Das allgemeingültige Verfahren zur Subklonkonstruktion ist unter (s. 5.5.5) beschrieben.
Sofern die Orientierung des Inserts im Vektor bekannt ist, wird diese durch das Ergebnis einer
Ansequenzierung des Subklons mit Standardprimern (s. 5.6.2) angegeben. Falls die
ansequenzierten Insertenden außerhalb der Contigs liegen, werden die Sequenzen durch eine
BLAST-Recherche charakterisiert (s. Tab. 57).
Subklonnamen folgen im Allgemeinen dem Schema: CxEy-z
- Cx: Subklon von Cosmid x; alternativ Gx: Subklon von Cosmidgruppe x
- E: Kürzel für verwendetes Enzym (zum Beispiel B: BamHI, Pst: PstI)
- y oder y,y oder y-y: Aus dem Gel ausgeschnittene Fragmentgröße (y-y: Größenbereich)
- z Subklonnummer
Subklone vom Bereich des msc-Contigs (Cosmid 4)
Tab. 36: Subklone vom Bereich des msc-Contigs (Cosmid 4).
Name
pBSK4.48
[160]
pBSK4.19
[160]
pBSK4.27
[160]
pBSK4.1
[160]
C4Sac3,4
C4Sac3,8
C4Sac4,1
C4Sac5,1
C4Sac6,1
C4Sac8,5
C4Pst6-1
C4Pst6-3
=pMO1
Vektor
pBSK−
Enzym
BamHI
Insertgröße
8842 bp
Position auf dem msc-Contig
uni: 2626; rev: 11467
pBSK−
BamHI
6106 bp
uni: 17628; rev: 11523
pBSK−
BamHI
6565 bp
uni: 17629; rev: 24193
pBSK−
BamHI
1723 bp
38244 - 39966
pUC19
pUC19
pUC19
pUC19
pUC19
pUC19
pUC19
pUC19
SacI
SacI
SacI
SacI
SacI
SacI
PstI
PstI
3434 bp
3816 bp
4153 bp
5195 bp
6062 bp
8517 bp
5676 bp
5759 bp
uni: 38071; rev: 41504
24907 - 28723
uni: 28723; rev: 32875
uni: 38070; rev: 32876
uni: 42530; rev: pOJ436
uni: 14733; rev: 6217
6236 - 11911
uni: 35862; rev: 41620
Weitere BamHI-Subklone vom Bereich des msc-Contigs sind in der Diplomarbeit von
A. Prestel beschrieben [160].
196
Material und Methoden
Subklone vom Bereich des mec-Contigs (Cosmide 12, 19)
Tab. 37: Subklone vom Bereich des mec-Contigs (Cosmide 12, 19). Für die NcoI-Subklone wurde der Vektor
pMun2, ansonsten stets pBSK− verwendet (s. Tab. 35).
Name
Enzym
C12Pst-6
G2B1,2
PstI
BamHI
Insertgröße
2952 bp
1,2 kb
G2B2,0
BamHI
2,0 kb
G2B3,0
BamHI
3,0 kb
G2B4,2
BamHI
4,2 kb
G2B6-8-2
BamHI
8 kb
C12Eco4,5
EcoRI
4,5 kb
C12Eco6,0
EcoRI
6,0 kb
C12Not4
NotI
4 kb
C12Not7
C12Nco6
NotI
NcoI
7100 bp
6 kb
Position auf dem mec-Contig oder BLAST-Ergebnis
uni: 6154; rev: 3203
uni: hypothetical protein MchlDRAFT_1719
(Methylobacterium chloromethanicum CM4)
rev: hypothetical protein DSY0622
(Desulfitobacterium hafniense Y51)
uni: beta-lactamase
(Streptomyces avermitilis MA-4680)
rev: membrane protein
(Streptomyces avermitilis MA-4680)
uni: protein phosphatase
(Streptomyces avermitilis MA-4680)
rev: protein phosphatase
(Streptomyces avermitilis MA-4680)
uni: hypothetical protein RHA1_ro01873
(Rhodococcus sp. RHA1)
rev: ab Position 1491 stromaufwärts
uni: transcriptional regulator, TetR family
(Rhodococcus sp. RHA1)
rev: cellulase (Stigmatella aurantiaca DW4/3-1)
uni: auf pOJ436
rev: keine signifikante Ähnlichkeit, nicht auf pOJ436
uni: auf dem Cosmidinsert direkt vor tet auf pOJ436
rev: apra auf pOJ436
uni: beta-lactamase
(Streptomyces avermitilis MA-4680)
rev: ab Position 9153 aufsteigend
uni: 2053; rev: 9152
uni: keine signifikante Ähnlichkeit
rev: carboxypeptidase
(Streptomyces coelicolor A3(2))
Cosmide des msn-Contigs
Tab. 38: Cosmide des msn-Contigs. Alle Cosmide basieren auf dem Vektor pOJ436 (s. Tab. 35).
Name
Enzym*
Cos2
Sau3AI
Cos7
Sau3AI
Insertgröße
36,7 kb
ca.
40 kb
Position auf dem msn-Contig oder BLAST-Ergebnis
F: ab Position 1 aufsteigend (vor msnH0)
R: ab Position 36742 absteigend (msnM3)
F: regulator protein (Streptomyces rimosus subsp.
paromomycinus), NCBI: CAF32368
R: ab Position 13882 aufsteigend (msnH5)
Material und Methoden
Name
Enzym*
Insertgröße
ca.
40 kb
Cos17
Sau3AI
Cos18
Sau3AI
ca.
40 kb
Cos20
Sau3AI
ca.
40 kb
197
Position auf dem msn-Contig oder BLAST-Ergebnis
F: ab Position 12379 aufsteigend (msnO3)
R: hypothetical protein YP_001103536
(Saccharopolyspora erythraea NRRL 2338)
F: hypothetical protein XP_567129
(Cryptococcus neoformans var. neoformans JEC21)
R: ab Position 13517 aufsteigend (msnH5)
F: ab Position 16276 absteigend (mscK1)
R: large secreted protein NP_821460
(Streptomyces avermitilis MA-4680)
* Partialverdau
Subklone vom Bereich des msn-Contigs (Cosmide 7, 18)
Tab. 39: Subklone vom Bereich des msn-Contigs (Cosmide 7, 18). Für die NcoI-Subklone wurde der Vektor
pMun2, ansonsten stets pBSK− verwendet (s. Tab. 35).
Name
Enzym
G3B1,5a
BamHI
Insertgröße
1,5 kb
G3B2,0
G3B2,2
G3S2,0
G3S2,7
G3S3,5
BamHI
BamHI
BamHI
SacI
SacI
1868 bp
2169 bp
1831 bp
2643 bp
3,5 kb
G3S8a
=G3S8b
SacI
7 kb
C7Eco2,7
C7Eco3,0
C7Eco3,8
C7Eco4,2
C7Eco6a
C7Eco7-8-2
C7Eco7-8-3
EcoRI
EcoRI
EcoRI
EcoRI
EcoRI
EcoRI
EcoRI
2800 bp
3139 bp
4498 bp
7637 bp
6324 bp
7298 bp
7 - 8kb
C7Eco7-8-4
EcoRI
7 - 8kb
C7Bgl3,5
C7Bgl5a
BglII
BglII
2788 bp
4308 bp
Position auf dem msn-Contig oder BLAST-Ergebnis
uni: hypothetical protein
(Streptomyces rimosus subsp. paromomycinus)
rev: endonuclease / exonuclease / phosphatase
(Frankia sp. EAN1pec)
uni: 43347; rev: 41480
uni: 27028; rev: 29196
uni: 40314; rev: 42144
uni: 40313; rev: 37671
uni: ab Position 42145 aufsteigend
rev: TRA4, transfer function
(Streptomyces bambergiensis)
uni: response regulator receiver
(Nocardioides sp. JS614)
rev: pOJ436
uni: 32141; rev: 34940
uni: 27642; rev: 24504
uni: 32140; rev: 27643
uni: 24504; rev: 32140 (Insert mit EcoRI-site)
uni: 34941; rev: 41264
uni: 34940; rev: 27643 (Insert mit EcoRI-site)
uni: putative regulator protein
(Streptomyces rimosus subsp. paromomycinus)
rev: ab Position 41265 aufsteigend
uni: response regulator receiver
(Nocardioides sp. JS614)
rev: auf pOJ436
uni: 23471; rev: 20684
uni: 28666; rev: 24359
198
Material und Methoden
Name
Enzym
C7Bgl6
BglII
Insertgröße
> 10 kb
C7Bgl6a
C7Bgl7
C7Nco5
C18Not5
BglII
BglII
NcoI
NotI
5339 bp
6585 bp
4733 bp
5 kb
C18Kpn3,3
KpnI
3,3 kb
C7Pst2,5
C7Pst3,0
C7Pst4,1
C7Pst5,0-1
C7Pst5,5-1
C7Pst9-1
PstI
PstI
PstI
PstI
PstI
PstI
2,5 kb
3,0 kb
4,1 kb
5,0 kb
5,5 kb
9 kb
Position auf dem msn-Contig oder BLAST-Ergebnis
uni: ab 41404 aufsteigend über pOJ436;
rev: 14510
uni: 36001; rev: 41339
uni: 29416; rev: 36000
uni: 14361; rev: 19093
uni: monooxygenase (Thermobifida fusca YX)
rev: ABC transporter ATP-binding protein
(Streptomyces avermitilis MA-4680)
uni: hypothetical protein
(Streptomyces rimosus subsp. paromomycinus)
rev: hypothetical protein
(Nocardia farcinica IFM 10152)
nicht sequenziert
nicht sequenziert
nicht sequenziert, vermutlich: 27684 - 31718
nicht sequenziert, vermutlich: 37986 - 42980
nicht sequenziert, vermutlich: 16308 - 21742
nicht sequenziert
Subklone von Cosmid 13
Tab. 40: Subklone von Cosmid 13. Als Vektor wurde stets pBSK− (s. Tab. 35) verwendet.
Name
Enzym
C13B4,5
BamHI
Insertgröße
4,5 kb
C13B7-8-1
BamHI
8 kb
C13B7-8-3
BamHI
7 kb
C13B9-10-1 BamHI
10 kb
BLAST-Ergebnis
uni: peptidylarginine deiminase
(Streptomyces clavuligerus)
rev: ammonium transporter
(Streptomyces avermitilis MA-4680)
uni: ABC transporter ATP-binding protein
(Streptomyces avermitilis MA-4680)
rev: hypothetical protein SAV_5597 (Streptomyces
avermitilis MA-4680)
uni: ammonium transporter
(Streptomyces avermitilis MA-4680)
rev: 5-dehydro-4-deoxyglucarate dehydratase
(Streptomyces avermitilis MA-4680)
uni: 5-dehydro-4-deoxyglucarate dehydratase
(Streptomyces avermitilis MA-4680) dann pOJ436
rev: hypothetical protein SCO4591
(Streptomyces coelicolor A3(2))
199
Material und Methoden
5.4.2.5 Inaktivierungs- und Expressionsplasmide für S. sp. Gö C4/4
In der Reihenfolge von Kapitel 3.3.
Inaktivierung und Expression von Genen des msc-Clusters
Plasmid p∆msc21 (11608 bp), msc21-Inaktivierungsplasmid (s. 3.3.2.4)
PvuI 497
KpnI 653
HindIII 689
PvuI 11060
SacI 1186
f1-ori
carb
SacI 9402
XbaI 9378
BamHI 9366
EcoRI 9354
BglII 9215
PstI 9174
''lacZ´
ColE1 ori
lacZ´'
apra
10000
msc24
PstI 8634
2000
p∆msc21
8000
SacI 8444
SacI 1938
HindIII 2410
EcoRV 2416
EcoRI 2422
PstI 2428
BamHI 2440
'lacZ´'
'msc17
PvuI 2891
msc18
4000
msc23
6000
KpnI 7744
PvuI 7376
KpnI 7003
BamHI 6790
PstI 6778
XbaI 6756
msc22
pIJ778 spec
Kassette*
msc19
msc20
PvuI 3934
PvuI 4159
KpnI 4476
PvuI 5901
PvuI 5034
XbaI 5425
SacI 5460
*Richtung des Pfeils
= Orientierung von spec
Plasmidkonstruktion:
Der Subklon pBSK4.27 (s. Tab. 36) trägt in seiner Insertmitte das auszuschaltende Gen
msc21. Über die [safe-knock]-Strategie (s. 5.8.2) wurde msc21 (Position 21626C - 20562C
auf dem msc-Contig) fast vollständig durch die Redirect-Kassette von pIJ778 ersetzt. Die
eingebrachte Kassette reicht von Contigposition 20577 bis 21629, wobei das Spectinomycinresistenzgen in Leserichtung des umgebenden Operons liegt. Durch eine Restriktionsanalyse
(s. 5.5.4) wurde die erwartete Sequenz bestätigt. Die Orientierung der im nächsten Schritt
insertierten apra-Kassette ist unbekannt.
200
Material und Methoden
Plasmid p∆msc37 (10007 bp), msc37-Inaktivierungsplasmid (s. 3.3.2.4)
PvuI 276
EcoRI 396
SacI 402
KpnI 408
BamHI 417
XbaI 423
PstI 435
BamHI 842
PvuI 964
PvuI 9387
'lacZ´
carb
'msc34
PvuI 1681
msc35
10000
HindIII 7768
PvuI 2250
lacZ´''
8000
2000
p∆msc37
msc36
SacI 2645
SacI 7296
apra
SacI 6544
HindIII 6047
PstI 6035
SacI 5919
6000
4000
BamHI 2822
BamHI 2932
PstI 2944
XbaI 2966
pIJ778 spec
Kassette*
'lacZ´'
msc40'
msc38
PvuI 3821
SacI 4262
XbaI 4297
BamHI 4385
*Richtung des Pfeils
= Orientierung von spec
Plasmidkonstruktion:
Ausgehend vom Subklon C4Pst6-3 (s. 5.4.2.4) wurde p∆msc37 mit der [safe-knock]-Strategie
(s. 5.8.2) erstellt. Die Redirect-Kassette von pIJ778 ersetzt Position 38346 - 39917 des
msc-Contigs und damit fast vollständig das zu inaktivierende Gen msc37 (Contigposition
38319 - 39920). Durch eine Restriktionsanalyse wurde die erwartete Sequenz bestätigt. Die
Orientierung der im nächsten Schritt insertierten apra-Kassette ist unbekannt.
Plasmid pBSKclf−, msc15-Inaktivierungsplasmid (s. 3.3.2.5)
pBSKclf− wurde von A. Prestel im Rahmen seiner Diplomarbeit erstellt [160]. Das Plasmid
basiert auf dem Subklon pBSK4.19 (s. Tab. 36). In der Mitte der Sequenz von msc15 wurde
über Blunting (s. 5.5.5.4) an einer BglII Schnittstelle ein Frameshift eingeführt.
201
Material und Methoden
Plasmid pSETmsc24 (6925 bp), msc24-Expressionsplasmid und
Plasmid pSETmsc30 (6952 bp), msc30-Expressionsplasmid (s. 3.3.2.6)
XbaI 6925
PstI 6913
HindIII 6904
PstI 122
PstI 662
EcoRI 842
BamHI 854
MfeI 936
MunI 936
HindIII 942
HindIII 6181
msc23'
msc24
SacI 1235
EcoRI 1241
6000
integrase
1000
ermE-uppromotor
pSETmsc24
HindIII 5212
5000
2000
4000
3000
attp site
apra
oriT
SacI 2500
PstI 4342
PstI 3540
PstI 6940
XbaI 6952
pSETmsc30
SacI 536
msc30
SacI 3251
HindIII 969
SacI 1262
ermE-up-promotor
Plasmidkonstruktionen:
Mit den Primerpaaren Msc24EcoXba-F / -R bzw. Msc30EcoXba-F / -R (s. 5.6.3.3) wurden
mit der Pfu-Polymerase und Cosmid 4 der S. sp. Gö C4/4 DNA als Matrize die Gene msc24
bzw. msc30 amplifiziert. Nach der Restriktion der PCR-Produkte an den eingeführten
Schnittstellen (msc24: MunI, XbaI; msc30: EcoRI, XbaI) ligierte man die codierenden
Abschnitte in den mit MunI und XbaI geöffneten pSET-1cerm (s. Tab. 35). In beiden
Expressionskonstrukten liegt das eingebrachte Gen hinter dem ermE-up-Promotor [199] auf
dem gleichen Strang. Durch Ansequenzierungen mit den Standardprimern uni und rev
(s. 5.6.2.1) konnten die Insertsequenzen vollständig erfasst und als fehlerlos bestätigt werden.
202
Material und Methoden
Inaktivierung von Genen des mec-Clusters
Plasmid p∆mecIII (12476 bp), mecIII-Inaktivierungsplasmid (s. 3.3.4.2)
PvuI 497
PvuII 527
KpnI 653
HindIII 689
PvuI 11928
SacI 1186
carb
PvuII 10490
ColE1 ori
apra
SacI 10270
12000
lacZ´'
2000
'mecIX
10000
'lacZ´'
'mecVIII
p∆mecIII
mecVII
BglII 9048
PvuI 8949
SacI 1938
HindIII 2410
EcoRV 2416
EcoRI 2422
PstI 2428
BamHI 2440
XbaI 2452
''lacZ´
4000
mecVI
mecV
6000
mecIII' mecII
mecIV
SacI 8277
'mecIII pIJ774Spec
Kassette*
BglII 7333
PvuII 7257
PstI 7251
PvuII 3347
PvuII 3392
PstI 3605
BamHI 3693
mecI
8000
PvuII 4678
SacI 5215
PvuI 5656
PvuI 6674
PvuI 6665
BamHI 6538
*Richtung des Pfeils
= Orientierung von spec
Plasmidkonstruktion:
Ausgangspunkt der Klonierungen war der Subklon C12Not7 (s. Tab. 37). Über die
[safe-knock]-Strategie (s. 5.8.2) wurde ein internes Fragment (Position 4738 - 5449 auf dem
mec-Contig) des Gens mecIII durch die Redirect-Kassette von pIJ774Spec (s. 5.5.5.5) ersetzt.
Dabei wurde bewusst die Variante "spec gegen die Leserichtung des Zielgens" gewählt um
auch die Transkription mecIII nachgeschalteter Gene des gleichen Operons negativ zu
beeinflussen.
203
Material und Methoden
Inaktivierung von Genen des msn-Clusters
Plasmid p∆msnK1 (10576 bp), msnK1-Inaktivierungsplasmid (s. 3.3.5.2)
PvuI 497
KpnI 653
XhoI 668
HindIII 689
PvuI 10028
SacI 1161
f1-ori
carb
SacI 8370
NotI 8352
XbaI 8346
EcoRI 8331
BglII 8325
NcoI 8310
'lacZ´
ColE1 ori
SacI 1913
apra
10000
lacZ´''
HindIII 2410
MunI 2416
NcoI 2422
BglII 2571
2000
'msnC1
8000
msnO5
p∆msnK1
msnK2'
BamHI 2735
KpnI 2849
4000
EcoRI 7545
msnO4
6000
msnH4
'msnK1
pIJ774Spec
Kassette*
PvuI 6525
BamHI 4131
KpnI 5769
KpnI 5636
SacI 5454
PvuI 5013
*Richtung des Pfeils
= Orientierung von spec
Plasmidkonstruktion:
Die Plasmidkonstruktion erfolgte analog zu p∆mecIII (s. o.). Auf dem aus dem Subklon
C7Nco5 (s. Tab. 38) entstandenem Plasmid p∆msnK1 ersetzt die Redirect-Kassette die
Contigpositionen 16062 - 16312, was den ersten 233 bp von msnK1 inklusive Startcodon
entspricht.
204
Material und Methoden
Plasmid p∆msnO11C2 (10247 bp), msnO11C2-Inaktivierungsplasmid (s. 3.3.5.2)
PvuI 497
KpnI 653
HindIII 689
PvuI 9726
SacI 1161
f1-ori
carb
''lacZ´
ColE1 ori
SacI 8068
XbaI 8044
EcoRI 7979
EcoRI 7887
SacI 1913
apra
10000
HindIII 2410
EcoRV 2416
EcoRI 2422
PstI 2428
lacZ´'
'msnO10
msnK3
2000
8000
p∆msnO11C2
msnO11'
6000
'lacZ´'
msnO12'
PvuI 2696
4000
msnR2
SacI 6732
pIJ774Spec
Kassette*
PstI 3427
EcoRI 3464
'msnC2
PvuI 3946
BamHI 4079
PvuI 6291
BamHI 5409
BamHI 5168
*Richtung des Pfeils
= Orientierung von spec
Plasmidkonstruktion:
Die Plasmidkonstruktion erfolgte analog zu p∆mecIII (s. o.). Der zugrunde liegende Subklon
C7Bgl5a (s. Tab. 38) ist durch Ligation des BglII-Clusterfragments in den mit BamHI
geöffneten Vektor pBSK− entstanden. Auf p∆msnO11C2 ersetzt die Redirect-Kassette die
Contigpositionen 25588 - 25709. Dies entspricht den letzten 72 bp von msnO11 und den
ersten 12 bp von msnC2.
Material und Methoden
5.5
205
Allgemeine Methoden der Molekularbiologie
5.5.1 Einbringen von DNA in E. coli Laborstämme
Das Einschleusen von DNA in Zellen wird als (genetische) Transformation bezeichnet [417].
Zum einen wurde die Hitzeschocktransformation von CaCl2 kompetenten Zellen, zum
anderen die hocheffektive Elektroporation von elektrokompetenten Zellen durchgeführt.
5.5.1.1 Hitzeschocktransformation von E. coli
Herstellung CaCl2 kompetenter Zellen
Ausgehend von bei −86 °C tiefgefrorenen Dauerkulturen des entsprechenden E. coli-Stammes
in 30 % Glycerin wurde eine LB-Agarplatte zur Gewinnung von Einzelkolonien bestrichen.
Mit einer Kolonie wurden 100 mL LB-Flüssigmedium angeimpft und über Nacht auf dem
Rundschüttler (37 °C, 180 rpm) inkubiert. Je 5 mL dieser Vorkultur dienten als Inokulum für
sechs Mal 100 mL LB-Flüssigmedium als Hauptkultur, die bis zu einer OD600 von 0,5
kultiviert wurde. Sofern der Stamm über Selektionsmarker verfügte (s. Tab. 33), wurde bei
allen Schritten das entsprechende Antibiotikum zugesetzt (s. Tab. 28). Aus je 100 mL
Hauptkultur wurde durch Zentrifugation (4 °C, 5000 rpm, 10 min) ein Zellpellet gewonnen.
Nach Resuspendieren in je 30 mL eisgekühlter 0,1 M MgCl2-Lösung wurde erneut pelletiert,
in je 30 mL eisgekühlter CaCl2-Lösung resuspendiert und für 20 min auf Eis inkubiert. Das
durch anschließende Zentrifugation erhaltene Zellpellet wurde vorsichtig in 10 mL eisgekühlter 0,1 M CaCl2-Lösung mit 15 % Glycerin (m/V) resuspendiert und in Aliquots von
150 µL bei −86 °C gelagert. Aus dem beschriebenen Ansatz mit 600 mL Hauptkultur ließen
sich so pro Charge etwa 400 Einheiten für die CaCl2 vermittelte Transformation herstellen.
CaCl2 vermittelte Transformation
Für die CaCl2 vermittelte Transformation von E. coli wurde jeweils eine Einheit (150 µL)
kompetenter Zellen eingesetzt. Die tiefgefrorene Einheit wurde zunächst 10 min auf Eis
aufgetaut, mit 5 - 20 µL Lösung der zu transferierenden DNA versetzt und weitere 30 min auf
Eis gelassen. Nach einer Hitzeschockbehandlung (2 min im 41 °C Wasserbad) wurde der
Transformationsansatz sofort mit 1 mL LB-Flüssigmedium versetzt und zur Regeneration 1 h
bei 30 °C bzw. 37 °C inkubiert. Wegen dieses Schrittes spricht man auch von Hitzeschocktransformation. Nach der Regeneration ohne Antibiotikum wurde die Kultur pelletiert
(20 °C, 5000 rpm, 5 min), die Zellen nach dem Abgießen des Überstands im letzten Tropfen
(ca. 100 µL) resuspendiert und auf einer antibiotikahaltigen LB-Agarplatte ausplattiert. Das
Wachstum von Transformanten konnte in Abhängigkeit vom verwendeten Stamm,
Selektionsantibiotikum und Inkubationstemperatur (s. 5.3) nach einer Wachstumszeit von14 24 h festgestellt werden.
206
Material und Methoden
5.5.1.2 Elektroporation von E. coli
Bei der Elektroporation wird DNA in elektrokompetente Zellen eingebracht [418]. Eine
Mischung aus elektrokompetenten Zellen und DNA-Lösung wird dabei einem starken
elektrischen Feld ausgesetzt. Durch einen starken elektrischen Puls bilden sich kurzzeitig
Poren in der Zellmembran. Die DNA beschreibt während des Pulses eine Bewegung in
Richtung Pluspol. Treffen beide Ereignisse so zusammen, dass die DNA die Pore einer Zelle
trifft und ihre Vorwärtsbewegung innerhalb der Zelle beendet, ist das Ergebnis eine mit
Fremd-DNA transformierte Zelle. Diese hocheffektive Methode wurde als Alternative zur
Hitzeschocktransformation eingesetzt, wenn nur eine geringe Transformantenzahl zu erwarten
war, wie zum Beispiel bei der Transformation von linearen DNA-Fragmenten und
anschließender λ-Red-Rekombination (s. 5.5.5).
Herstellung elektrokompetenter Zellen
Mit einer Einzelkolonie des gewünschten Stammes wurden 100 mL LB-Flüssigmedium
angeimpft und über Nacht auf dem Rundschüttler (37 °C, 180 rpm) unter Selektionsdruck mit
dem entsprechenden Antibiotikum inkubiert (s. Tab. 33). 5 mL dieser Vorkultur dienten als
Inokulum für 100 mL antibiotikahaltiges LB-Flüssigmedium als Hauptkultur, die bis zu einer
OD600 von 0,5 kultiviert wurde. Durch Zentrifugation (4 °C, 5000 rpm, 5 min) wurde nach
Abgießen des Überstandes ein Zellpellet gewonnen. Das Pellet wurde vorsichtig in 20 mL
eiskaltem 10 % Glycerol resuspendiert und wiederholt zentrifugiert. Der Vorgang des
Resuspendierens mit anschließender Zentrifugation wurde ein zweites Mal wiederholt. Das
gewaschene Pellet wurde schließlich in 5 mL 10 % Glycerol resuspendiert. Die Suspension
elektrokompetenter Zellen wurde in Aliquots von 50 µL bei −86 °C aufbewahrt.
Elektroporation
Die DNA wurde mit dem Elektroporator Gene Pulser II (s. Tab. 18) in die Bakterien
eingebracht. Dazu wurden 50 µL Suspension elektrokompetenter Zellen auf Eis aufgetaut, mit
maximal 6 µL DNA-Lösung versetzt und in eine vorgekühlte Elektroporationsküvette (0,1 cm
Spaltbreite von BIO-RAD) transferiert. Der Elektroschock wurde mit folgenden Einstellungen
gestartet: gene pulser: 25 µF / 2,5 kV, pulser controller: 200 Ω.
Erfolgreiche Elektroporationen ließen sich erwarten, wenn die vom Gerät angezeigte
Entladungszeit im Bereich von 3,0 - 5,0 ms lag. Nach erfolgter Elektroporation wurde die
Bakteriensuspension mit 1 mL eiskaltem LB-Medium versetzt und für 1 h bei 30 °C bzw.
37 °C inkubiert. Nach der Regeneration ohne Antibiotikum wurde die Kultur pelletiert
(20 °C, 5000 rpm, 5 min), die Zellen nach dem Abgießen des Überstands im letzten Tropfen
(ca. 100 µL) resuspendiert, auf einer antibiotikahaltigen LB-Agarplatte ausplattiert und
entsprechend bei 30 °C bzw. 37 °C inkubiert.
Material und Methoden
207
5.5.1.3 Blau-Weiß-Selektion
Die Blau-Weiß-Selektion erlaubt die direkte Detektion einer erfolgreichen Insert / VektorLigation (vgl. 5.5.5) auf der Agarplatte der Transformation. Vorraussetzung ist ein Vektor mit
lacZ-Gen im Bereich der gewünschten Insertionsposition (s. Tab. 33). Das lacZ-Gen codiert
die α-Untereinheit der β-Galactosidase. Nach der Ligation führen nur ungespaltene oder
religierte Vektoren zur Proteinbiosynthese einer intakten α-Untereinheit, die zusammen mit
der vom Chromosom des aufnehmenden Stammes codierten ω-Untereinheit eine
funktionsfähige β-Galactosidase aufbauen kann. Die gewünschte Insertion von DNAFragmenten in den Leserahmen von lacZ hingegen verhindert die Produktion einer
funktionellen β-Galactosidase. Zur praktischen Durchführung wurde gleichzeitig mit der
regenerierten Kultur bei Transformationen (s. o.) 40 µL 0,2 M IPTG-Lösung und 40 µL
X-Gal-Lösung (10 mg/mL in DMF) auf der antibiotikahaltigen LB-Agarplatte ausplattiert.
X-Gal ist ein farbloses Galactosederivat, das von β-Galactosidase in einen blauen Farbstoff
umgewandelt wird, IPTG (Isopropyl-β-D-1-thiogalactopyranosid) induziert das lac-Operon.
Nur bei Transformanten, die den religierten Vektor tragen, kommt es zur Blaufärbung der
Kolonie. Transformanten mit Insert bleiben klar (weiß).
5.5.2 Isolierung von DNA
5.5.2.1 Plasmidpräparation aus E. coli
Die Isolierung von Plasmid-DNA aus E. coli erfolgte nach dem Prinzip der alkalischen Lyse
[419]. Durch Detergentienzusatz wurde zunächst die Zellmembran von E. coli zerstört,
worauf sowohl Plasmid-DNA als auch chromosomale DNA freigesetzt wurden. Sämtliche
DNA wurde durch Zugabe von NaOH denaturiert. Bei der sich anschließenden Absenkung
des pH-Wertes renaturiert im Wesentlichen die Plasmid-DNA. Die chromosomale DNA
hingegen bildet ein Netzwerk und fällt aus der Lösung aus. Für die Trennung bediente man
sich zusätzlich der Tatsache, dass das Bakterienchromosom, nicht aber das Plasmid, mit der
Zellmembran verbunden ist. Das gebundene Bakterienchromosom konnte durch Zentrifugation sedimentiert werden. Die erhaltene Plasmidlösung wurde nach gewünschtem
Reinheitsgrad unterschiedlich weiterbearbeitet. Isolierte DNA wurde bei −20 °C gelagert.
208
Material und Methoden
Mini-Präparation
Die verwendeten Puffer sind in Tab. 20 aufgeführt. E. coli-Einzelkolonien wurden als
Reagenzglaskultur 14 - 16 h bei 37 °C und 180 rpm in 4 mL LB-Flüssigmedium mit dem
entsprechenden Antibiotikum angezogen. Nach Abschluss der Kultivierung wurden die Zellen
durch Zentrifugation pelletiert (4 °C, 14000 rpm, 5 min) und das Zellpellet in 200 µL Puffer
P1 homogen resuspendiert. Anschließend wurden 200 µL Puffer P2 zugegeben, durch
vorsichtiges Invertieren gemischt und 5 min bei Raumtemperatur inkubiert. Nach Zugabe von
200 µL Puffer P3 wurde die Mischung 10 min auf Eis inkubiert und anschließend
zentrifugiert (4 °C, 14000 rpm, 20 min). Der Überstand wurde in ein neues Reaktionsgefäß
überführt und die DNA wie unter 5.5.3 beschrieben gefällt und in 50 µL H2Obidest
aufgenommen. Die erzielten Ausbeuten lagen bei 50 - 90 µg Plasmid-DNA pro Ansatz. Die
mit dieser Methode isolierte DNA wurde für Restriktionsanalysen und Klonierungsexperimente verwendet.
Für Auftragssequenzierungen wurde die Plasmid-DNA in kleinem Maßstab und hohem
Reinheitsgrad mit Hilfe des "Wizard SV Minipreps DNA Purification System" (s. Tab. 32)
isoliert. Das Prinzip der Aufreinigung ist hier eine Festphasenextraktion. Die Isolierung
erfolgte entsprechend den Angaben im Handbuch des Herstellers Promega. Die Ausbeuten
lagen bei 10 - 30 µg Plasmid-DNA pro Präparation.
Midi-Präparation
Die Midi-Präparation mit dem "Pure Yield Plasmid Midiprep System" (s. Tab. 32) wurde für
die Gewinnung größerer Mengen DNA hohen Reinheitsgrades eingesetzt. Das Protokoll
beruht auf einer alkalischen Lyse, gefolgt von einer Aufreinigung der DNA mittels
Festphasenextraktion. Eine E. coli-Kolonie wurde 14 - 16 h in 100 mL LB-Flüssigmedium
mit entsprechendem Antibiotikum bei 37 °C und 180 rpm kultiviert. Die Lyse der Zellen und
die DNA-Isolierung erfolgten entsprechend den Angaben des Herstellers Promega. Die
erhaltene DNA wurde in 600 µL H2Obidest gelöst. Die erzielten Ausbeuten lagen bei 300 800 µg Plasmid-DNA pro Ansatz. Per Midi-Präparation wurden Stocklösungen von häufig
verwendeten Plasmiden und Cosmiden gewonnen.
5.5.2.2 Isolierung genomischer DNA aus Saccharothrix / Streptomyces
Ziel dieser Methode ist es, die gesamte DNA, bestehend aus bakteriellem Chromosom sowie
eventuell vorhandenen Plasmiden aus einem Stamm der Gattungen Saccharothrix oder
Streptomyces zu isolieren. Zunächst wurde die Zellwand der Gram+ Bakterien enzymatisch
abgebaut, die Protoplasten lysiert und die Proteine ausgefällt. Es folgte die Alkoholfällung der
DNA. Aufgrund der Größe des Chromosoms kommt bei dem beschriebenen Protokoll zu
einer gewissen Fragmentierung des DNA-Doppelstranges durch Schervorgänge. Dies ist
durchaus akzeptabel, da die genomische DNA ausschließlich als Matrize für die PCR
Material und Methoden
209
eingesetzt wurde. Zur Herstellung von Cosmidbänken ist ein schonenderes Verfahren zu
wählen.
Die verwendeten Puffer sind in Tab. 21 aufgeführt.
Der Stamm wurde unter Standardbedingungen (s. 5.3) 1 - 3 Tage lang kultiviert bis sich
feines, dichtes Myzel bildete. 2 mL der Kultur wurden bei 14000 rpm (RT, 10 min) pelletiert.
Die Masse des Myzelpellets sollte bei 150 - 200 mg liegen. Zur Oberflächenvergrößerung
wurde die in Fäden oder Kugeln verwachsene Zellmasse nach der Resuspension in 0,5 mL
Puffer B1 durch eine Insulinspritze gepresst. Nach wiederholter Pelletierung durch
Zentrifugation wurden die Zellen in 0,5 mL Puffer B1 mit 4 mg Lysozym/mL resuspendiert
und für 60 min in den 37 °C Brutschrank gestellt. Bei der anschließenden Zugabe von 50 µL
gesättigter NaCl-Lösung und vorsichtigem Mischen bildete sich eine klare Lösung. Mit
120 µL 10 % SDS-Lösung versetzt wurde die Mischung für 20 min bei 65 °C inkubiert. Nach
Zusatz von 240 µL 5 M Kaliumacetatlösung und Mischen wurde 20 min auf Eis inkubiert.
Der Niederschlag wurde durch Zentrifugation (RT, 14000 rpm, 10 min) abgetrennt, der
Überstand in ein neues Reaktionsgefäß überführt. Die DNA wurde wie unter 5.5.3
beschrieben mit dem äquivalenten Volumen Isopropanol gefällt und mit Ethanol 70 % (V/V)
gewaschen. Das DNA-Pellet wurde in 50 µL H2Obidest gelöst.
5.5.3 Reinigung und Aufkonzentrierung von DNA
5.5.3.1 DNA-Fällung
Die Alkoholfällung ist eine Möglichkeit zur Aufkonzentrierung von in Lösung befindlicher
DNA. Gleichzeitig wird eine Befreiung von niedermolekularen Substanzen erreicht. Hierzu
wurde die DNA-haltige Lösung zunächst durch Zugabe von einem Drittel des Ausgangsvolumens 5 M Kaliumacetatlösung angesäuert, wenn dies nicht schon wie bei der DNAIsolierung (5.5.2) geschehen ist. Dann wurde ein der gesamten Lösung äquivalentes Volumen
eiskalter Isopropanol zugegeben. Nach Invertieren wurde 20 min bei −20 °C inkubiert. Die
gefällte DNA wurde anschließend durch Zentrifugation (4 °C, 14000 rpm, 20 min) pelletiert
und mit 500 µL eiskaltem Ethanol 70 % (V/V) gewaschen. Um störende Reste von Ethanol
zuverlässig zu entfernen, wurde das Pellet für 5 min im Wärmeschrank bei 60 °C getrocknet
und anschließend in H2Obidest gelöst.
5.5.3.2 Festphasenextraktion
Zur Gewinnung von DNA hohen Reinheitsgrades aus Lösungen oder präparativen
Agarosegelen wurde das Kit "Wizard SV Gel and PCR Clean-up System" (s. Tab. 32) gemäß
den Herstellerangaben verwendet. Das Prinzip dieses Kits beruht auf der selektiven und
quantitativen Adsorption von DNA an Silicagelpartikel in Gegenwart eines chaotropen
210
Material und Methoden
Salzes. Die DNA bleibt während des Waschvorgangs an die Silicagelpartikel gebunden und
kann am Ende der Aufreinigung spezifisch abgelöst werden.
5.5.3.3 Reinigung mittels präparativer Agarosegelelektrophorese
Die präparative Agarosegelelektrophorese ist eine weitere Methode der DNA-Aufreinigung.
Zusätzlich zur Befreiung von Proteinen und Pufferbestandteilen können DNA-Fragmente
selektiv nach Länge getrennt werden. Diese Methode ist unter 5.5.4 im Detail beschrieben.
5.5.4 Qualitative und quantitative DNA-Analytik
5.5.4.1 Restriktion mit Endonukleasen
Restriktionsendonukleasen sind Enzyme, die den DNA-Doppelstrang an für die jeweilige
Endonuklease spezifischen Basenabfolgen spalten [420]. Anhand der auftretenden Fragmentgrößen können die DNA-Moleküle charakterisiert werden. Zur Visualisierung der Spaltungsmuster diente die Agarosegelelektrophorese (s. u.) mit anschließender Gelfärbung. Für
Klonierungsexperimente wurde die Restriktion im präparativen Maßstab angesetzt und die
gewünschten Fragmente mit der präparativen Agarosegelelektrophorese isoliert.
Die Aktivitätsdefinition für Restriktionsendonukleasen besagt, dass 1 unit (u) Enzym
ausreicht, um 1 µg DNA in 1 h zu spalten. Die Konzentrationen der verwendeten DNALösungen lagen bei 0,2 - 1,2 µg/µL. Mit den in Tab. 41 angegebenen Restriktionsansätzen
war folglich bei einer Inkubationsdauer von 2 h bei der vom Enzymhersteller vorgegebenen
Temperatur ein vollständiger Verdau zu erwarten. Bei gleichzeitigem Einsatz von zwei
Enzymen wurde der Anteil H2Obidest entsprechend vermindert.
Tab. 41: Restriktionsansätze.
H20bidest
DNA-Lösung
BSA (10-fach)
Enzympuffer (10-fach)
Enzym (5u/µL)
Gesamtvolumen
analytisch
13,5 µL
2,0 µL
2,0 µL
2,0 µL
0,5 µL
20,0 µL
präparativ
30,0 µL
15,0 µL
6,0 µL
6,0 µL
3,0 µL
60 µL
Material und Methoden
211
5.5.4.2 Agarosegelelektrophorese
Das Ergebnis einer Restriktionsspaltung, DNA-Isolierung oder PCR kann mit Hilfe der
analytischen Agarosegelelektrophorese analysiert werden. Die präparative Agarosegelelektrophorese hingegen dient der Isolierung von DNA-Fragmenten für Klonierungsexperimente. DNA ist aufgrund der Phosphatreste negativ geladen und kann deshalb
elektrophoretisch aufgetrennt werden. Die Wanderungsgeschwindigkeit der DNA in der
Agarosematrix ist von der Größe und Konformation sowie davon abhängig, ob es sich um
lineare oder zirkuläre, einzel- oder doppelsträngige Formen handelt.
Die Agarosegelelektrophorese wurde gemäß [394] durchgeführt. Verwendet wurden Gele
mit einer Agarosekonzentration von 0,7 % (m/V). Als Längenstandard diente eine
1 kb Leiter. Verwendete Puffer und Lösungen sind in Tab. 22 aufgeführt.
Analytisch
Die Trennung der DNA erfolgte bei 100 V und einer Laufzeit von 35 min. Die Gele wurden
in wässriger Ethidiumbromidlösung (1 µg/mL) für mindestens 20 min gefärbt und nachfolgend bei UV-Licht bei 312 nm detektiert und fotografiert (Image Master VDS, VideoDokumentationssystem, Amersham).
Präparativ
Die Trennung erfolgte bei 80 V und einer Laufzeit von 1 - 2 h. Anschließend wurden die Gele
mit einer wässrigen 0,2 %igen Methylenblaulösung 30 min gefärbt. Die Hintergrundfärbung
wurde durch 1 h Entfärben in H2Obidest wieder entfernt. Das gewünschte Fragment wurde mit
einem Skalpell ausgeschnitten, die Elution der DNA aus dem Agarosegel erfolgte mit dem Kit
"Wizard SV Gel and PCR Clean-up System" (s. Tab. 32).
5.5.4.3 Konzentrationsbestimmung von DNA
Die Konzentration von DNA in Lösung wurde durch Messung der UV-Absorption bei
260 nm bestimmt. Die Lösungen wurden so weit verdünnt, dass die Absorption zwischen
0,1 AU und 0,5 AU lag. Das verwendete Photometer (Ultrospec 2100 pro, s. 5.1) verfügt über
ein Programm, das die Konzentration für doppelsträngige DNA gemäß des LambertBeerschen-Gesetzes ausgehend von folgender Beziehung berechnet. A260 = 1,0 AU entspricht
einer Konzentration von 50 µg/µL.
212
Material und Methoden
5.5.5 Klonierungstechniken
5.5.5.1 Ligation von DNA-Fragmenten durch T4-DNA-Ligase
Durch T4-DNA-Polymerase können doppelsträngige DNA-Fragmente an glatten Enden oder
klebrigen Enden mit komplementären Überhängen miteinander verknüpft werden [421]. Das
Enzym katalysiert Phosphodiesterbindungen zwischen dem 3'-OH- und dem 5'-PhosphatEnde in Gegenwart von ATP. Hauptsächliche wurde die Ligation bei der Subklonierung von
Genclusterfragmenten (Inserts) in Vektoren angewendet. Die Reaktion erfolgte in einem
Volumen von 10 µL oder 20 µL in Ligasepuffer (enthält ATP) mit 0,5 u bzw. 1 u (Weiss unit)
T4-DNA-Ligase. Das Insert wurde im Verhältnis zum Vektor in etwa 10-fach höherer
Konzentration zugesetzt. Klebrige Enden wurden 3 h, glatte Enden über Nacht bei Raumtemperatur inkubiert. Die Ligationsansätze wurden anschließend bei −20 °C eingefroren oder
direkt zur Hitzeschocktransformation von E. coli eingesetzt (s. 5.5.1).
5.5.5.2 Erstellung von Subklonen per Restriktion und Ligation
In der Molekularbiologie versteht man unter Subklonieren den Transfer eines bestimmten
Bereichs aus einem größeren DNA-Fragment, Plasmid oder Chromosom in einen Vektor. Der
transferierte Bereich kann so gezielt auf seine Funktion untersucht werden, indem der
Subklon ansequenziert wird (s. 5.6.2) oder für die heterologe Expression (vgl. 3.3.5.1) oder
Geninaktivierung (s. 5.8) eingesetzt wird. Der gewünschte DNA-Bereich (Insert), der in einen
Vektor kloniert werden sollte, wurde durch Restriktion (s. 5.5.4.1) aus der Ursprungs-DNA
freigesetzt. Das gewünschte DNA-Fragment wurde aus einem präparativen Agarosegel
isoliert (s. 5.5.4.2). Der aufnehmende Vektor wurde enzymatisch derart linearisiert, dass zum
Insert komplementäre Ende entstanden und ebenfalls über ein Agarosegel aufgereinigt. Das
Insert wurde durch Ligation in einen Vektor insertiert (s. 5.5.5.1) und nachfolgend in
kompetente E. coli-Zellen transformiert (s. 5.5.1.1).
5.5.5.3 TA-Klonierung von PCR Produkten der Taq-Polymerase
Im Gegensatz zu Amplifikaten der Pfu-Polymerase haben die Produkte der Taq-Polymerase
keine glatten Enden, sondern tragen am 3'-Ende beider Stränge je ein ungepaartes Desoxyadenosin (A). Diese klebrigen Enden kann man sich für die effektive Ligation in linearisierte
Vektoren mit beidseitig einfachen Desoxythymidin-(T)-Überhängen am 3'-Ende zu Nutze
machen. So lassen sich PCR-Produkte für die kostengünstige Ansequenzierung mit Standardprimern (s. 5.6.2.1) verfügbar zu machen. Dem kommt besondere Bedeutung bei der
Verwendung von degenerierten Primer zu (vgl. 3.1.9). Es wurde das molekularbiologische Kit
"pGEM-T Easy Vector System" (s. Tab. 32) eingesetzt. Die Ligation wurde wie unter 5.5.5.1
mit anschließender Transformation von E. coli (s. 5.5.1.1) und Blau-Weiß-Selektion
(s. 5.5.1.3) durchgeführt.
Material und Methoden
213
5.5.5.4 Leserahmenverschiebung mit Hilfe des Klenow-Fragments
Um ein nicht funktionelles Allel für die Geninaktivierung zu erhalten, kann der Leserahmen
innerhalb des zu inaktivierenden Gens verschoben werden (vgl. 5.8.1). Nach einer
Restriktionsspaltung (s. 5.5.4.1) innerhalb des Gens werden entstehende klebrige Enden mit
dem Klenow-Fragment in glatten Enden umgewandelt. Wenn sich nach der Religation
(s. 5.5.5.1) die Länge des DNA-Doppelstranges um eine nicht durch 3 teilbare Anzahl von
Basenpaaren verändert hat, ist der Leserahmen des Gens verschoben und das entstandene
Allel folglich nicht mehr funktionell. Das Klenow-Fragment ist die C-terminale große
Untereinheit der DNA-Polymerase I aus E. coli. Die Bifunktionalität des Enzyms ermöglicht
sowohl die Auffüllreaktion von 5´-Überhängen über die 5'→3'-Polymeraseaktivität, als auch
den Abbau von 3´-Überhängen über die 3´→5´-Exonukleaseaktivität. Beides führt zum
Entstehen glatter Enden. Dieser Vorgang wird Blunting genannt. Die Reaktion wurde gemäß
Tab. 42 angesetzt. Nach einer Reaktionszeit von 10 min bei Raumtemperatur wurde das
Enzym durch Hitzeeinwirkung bei 75 °C inaktiviert. Über Festphasenextraktion (s. 5.5.3.2)
wurde die DNA aus dem Ansatz gewonnen und religiert (s. 5.5.5.1).
Tab. 42: Reaktionsansatz Blunting.
Blunting
DNA-Lösung (0,2 µg/µL)
dNTP-Mix (1 mM)
Enzympuffer (10-fach)
Klenow-Fragment (5 u/µL)
Gesamtvolumen
16,0 µL
1,0 µL
2,0 µL
1,0 µL
20,0 µL
5.5.5.5 λ-Red vermittelte Rekombination in E. coli
Das Red-System aus dem PL-Operon des λ-Phagen führt im Wirtsstamm zu einer deutlich
erhöhten Effizienz homologer Rekombinationen zwischen linearen DNA-Fragmenten und
zirkularen oder linearen Zielmolekülen. Die größte Effizienzsteigerung im Vergleich zum
bereits zuvor verwendeten Rekombinationssystem von RecBCD-defizienten recBC sbcBC
oder recD E. coli Stämmen wurde bei kurzen Bereichen (1 kb) homologer Sequenz
beobachtet [422]. Später konnte gezeigt werden, dass die λ-Red vermittelte Rekombination
sich auf identische Sequenzen ab 20 bp Länge anwenden lässt und die Effizienz bei
Ausdehnung auf 40 bp sehr stark und bei größeren Bereichen nur noch schwächer steigt
[423]. Das Red-System besteht aus drei Proteinen: Redγ (Gen gam), Redα (Gen exo),
Redβ (Gen bet). Redγ inhibiert die RecBCD-Exonuklease von E. coli. Redα besitzt eine
5'→3'-Exonukleaseaktivität und erzeugt so lange 3'-Überhänge auf dem linearen
DNA-Fragment. Das Protein Redβ ist die eigentliche Rekombinase. Sie bindet an die von
Redα zurückgelassene Einzelstrang-DNA und verbindet sie mit der komplementären Sequenz
auf dem Zielmolekül.
214
Material und Methoden
λ-Red vermittelte Rekombination zur Geninaktivierung
Ihre Hauptanwendung im Forschungsgebiet der Bodenbakteriengenetik findet die λ-Red
vermittelte Rekombination bei der Erstellung von Inaktivierungsplasmiden (vgl. 5.8.2) oder
Inaktivierungscosmiden [424]. In der vorliegenden Arbeit wurde eine Redirect-Kassette des
John Innes Centre (Norwich, UK) [150] sowie speziell konstruierte Derivate (s. Abb. 100)
eingesetzt, um auf Subklonen (s. 5.5.5.2) von Biosynthesegenclustern bestimmte Gene oder
Teile von Genen gegen die Kassetten auszutauschen. Auf diese Weise wurden nicht
funktionelle Allele der zu inaktivierenden Gene erstellt.
Eingesetzte Redirect-Kassetten
P2
P1
pIJ778
oriT
spec
loxP
spec
loxP
oriT
FRT
FRT
P1
P2
pIJ774Spec
Legende
oriT
spec
pIJ785Spec
FRT
FRT
tipAp P1
P2
P1 / P2: Primerbindungsstellen
FRT: Erkennungsstelle der Flp-Rekombinase
loxP: Erkennungsstelle der Cre-Rekombinase
oriT:
origin of transfer von RK2
spec: Spectinomycinresistenzgen aadA
tipAp: thiostreptoninduzierbarer Promotor
Um auch tipAp zu amplifizieren wurde der Primer
von den äußersten bp von tipAp abgeleitet.
Abb. 100: Redirect-Kassetten. pIJ778 stammt aus der Sammlung des John Innes Centre (Norwich, UK),
pIJ774Spec und pIJ785Spec wurden im Rahmen dieser Arbeit konstruiert (s. 5.4.2.1). Darstellung der RedirectKassetten gemäß [150].
Es wurde ein modifizierten Protokoll gemäß Gust et al. (2002) [150] angewendet. Die
Redirect-Kassetten liegen als Insert des Vektors pBluescript II SK (+) (s. Tab. 35) vor,
einligiert in dessen EcoRV-Erkennungsstelle der MCS. Der Bereich der Redirect-Kassette
wurde mit EcoRI / HindIII aus dem Vektor ausgeschnitten (s. 5.5.4.1) und per präparativer
Agarosegelelektrophorese (s. 5.5.4.2) isoliert. Das Fragment diente als Matrize für die sich
anschließende PCR (s. 5.6.1). Für die Primer wurden je 39 nt von der Subklonsequenz
beidseitig des auszutauschenden Bereichs abgeleitet. Am 3'-Ende wurden die vorläufigen
Primersequenzen noch um die Sequenzen der Randbereiche der Redirect-Kassetten ergänzt
(Primerbindungsstellen P1 und P2, bzw. P2 und ein Bereich des tipAp, vgl. Abb. 100). Die
Kombination der beiden Primerbestandteile entscheidet darüber, ob das Spectinomycinresistenzgen in oder gegen die Leserichtung des inaktivierten Gens liegt. Die 58 nt oder 59 nt
langen Primer wurden mit dem Programm Clone Manager Suite (s. Tab. 57) auf eine
215
Material und Methoden
mögliche Bildung von hairpins und unerwünschte Bindungsstellen überprüft. Die Primer
wurden vom Hersteller über HPLC gereinigt.
Tab. 43: Primerdesign für die λ-Red vermittelte Rekombination.
pIJ778,
pIJ774Spec
1. Teil des
Primers
F-Primer 39 nt vor / am
Anfang des
Zielgens in
Leserichtung
auf dem
codierenden
Strang
R-Primer 39 nt nach / am
Ende des Gens
gegen die Leserichtung auf
dem nicht
codierenden
Strang
pIJ785Spec
1. Teil des
Primers
F-Primer 39 nt vor / am
Anfang des
Zielgens in
Leserichtung
auf dem
codierenden
Strang
R-Primer 39 nt nach / am
Ende des Gens
gegen die Leserichtung auf
dem nicht
codierenden
Strang
2. Teil des Primers
spec in Leserichtung
des Zielgens
die ersten 20 nt der RedirectKassette in Leserichtung von
spec auf dem codierenden
Strang (P1)
spec gegen die Leserichtung
des Zielgens
die letzen 19 nt der RedirectKassette gegen die Leserichtung von spec auf dem
nicht codierenden Strang (P2)
5'ATTCCGGGGATCCGTCGACC3' 5'TGTAGGCTGGAGCTGCTTC3'
die letzen 19 nt der RedirectKassette gegen die Leserichtung von spec auf dem
nicht codierenden Strang (P2)
die ersten 20 nt der RedirectKassette in Leserichtung von
spec auf dem codierenden
Strang (P1)
5'TGTAGGCTGGAGCTGCTTC3'
5'ATTCCGGGGATCCGTCGACC3'
2. Teil des Primers
spec in / tipAp gegen die
Leserichtung des Zielgens
die ersten 19 nt von tipAp in
Leserichtung von spec auf dem
codierenden Strang
5'TCCGCTCCCTTCTCTGACG3'
tipAp in / spec gegen die
Leserichtung des Zielgens
die letzen 19 nt der pIJ785Spec
Kassette gegen die
Leserichtung von spec auf dem
nicht codierenden Strang (P2)
5'TGTAGGCTGGAGCTGCTTC3'
die letzen 19 nt der pIJ785Spec
Kassette gegen die
Leserichtung von spec auf dem
nicht codierenden Strang (P2)
die ersten 19 nt von tipAp in
Leserichtung von spec auf dem
codierenden Strang
5'TCCGCTCCCTTCTCTGACG3'
5'TGTAGGCTGGAGCTGCTTC3'
Das PCR-Produkt wurde über präparative Agarosegelelektrophorese gereinigt und simultan
dem zu modifizierenden Subklon per Elektroporation (s. 5.5.1.2) in E. coli DH5α pBADαβγ
eingebracht (s. Tab. 33, Tab. 35). Es wurden dabei elektrokompetente Zellen eingesetzt, die
durch vorherige Induktion mit L-Arabinose (10 mM) bereits die Red-Proteine gebildet hatten.
Die λ-Red vermittelte Rekombination kann deshalb direkt während der Regeneration mit
LB-Medium oder auf der Selektionsplatte stattfinden. pBADαβγ besitzt das thermosensitive
Replikon des Plasmids pSC101 [425] und geht deshalb bei der sich anschließenden
216
Material und Methoden
Inkubation bei 37 °C verloren. Auf der Selektionsplatte gewachsene Rekombinanten besitzen
meist neben dem veränderten Plasmid noch Kopien des ursprünglichen Subklons. Durch
Restriktion, Agarosegelelektrophorese und Religation (vgl. Abb. 46) oder nach Retransformation kann das modifizierte Plasmid rein gewonnen werden.
Alternativ wurde zunächst der zu modifizierenden Subklon in E. coli DH5α pBADαβγ
eingebracht. Ein Transformant wird unter Induktion mit L-Arabinose angezogen,
elektrokompetente Zellen hergestellt und erst danach das PCR-Produkt per Elektroporation
eingebracht.
5.6
Polymerasekettenreaktion (PCR) und DNA-Sequenzierung
5.6.1 PCR
Die Polymerasekettenreaktion zur enzymatischen In-vitro-Vervielfältigung (Amplifizierung)
eines DNA-Bereichs von einer Vorlage (Matrize) hat sich seit ihrer Veröffentlichung im Jahr
1985 [426] zu einer der wichtigsten Methoden der Molekularbiologie entwickelt und findet in
vielen Variationen ihre Anwendung [427]. Durch die Hintereinanderschaltung mehrerer
Polymerisationszyklen (in der Regel 20 - 40) wird eine exponentielle Vervielfältigung der
PCR-Produkte erreicht. Der zu amplifizierende Bereich wird über die Bindungsstellen von
zwei Oligonukleotidprimern bestimmt. In 5'→3'-Richtung zu einander hin orientiert binden
die Primer dabei auf komplementären DNA-Strängen. Die entstehenden, doppelsträngigen
PCR-Produkte reichen vom 5'-Ende des ersten Primers bis zum 5'-Ende des zweiten Primers.
Als Enzyme wurden die Taq-Polymerase aus Thermus aquaticus sowie die Pfu-Polymerase
aus Pyrococcus furiosus eingesetzt. Mit der Taq-Polymerase werden Produkte mit einem
ungepaarten Desoxyadenosin als 3'-Überhang erhalten. Taq-Produkte sind deshalb der
TA-Klonierung (s. 5.5.5.3) zugänglich. Die Pfu-Polymerase generiert Produkte ohne
Überhang. Sie besitzt eine Korrekturfunktion, die zu einer erhöhten Synthesegenauigkeit
führt. Für Gewinnung von PCR-Produkten zur Konstruktion von Expressionsplasmiden
wurde deshalb die Pfu-Polymerase verwendet.
217
Material und Methoden
5.6.1.1 Primerdesign, PCR-Ansatz und allgemeines Temperaturprogramm
Die Oligonukleotidprimer wurden mit dem PC-Programm Clone Manager Suite (s. Tab. 57)
abgeleitet und von der Firma OPERON Biotechnologies (Köln) synthetisiert. Die eingesetzten
Thermocycler sind in Tab. 18 angegeben. Ein PCR-Ansatz (Standardvolumen 50 µL) hatte
eine Zusammensetzung laut Tab. 45.
Tab. 44: Parameter zum Primerdesign mit der Clone Manager Suite.
Parameter
Optimale Länge [nt]
G+C-Anteil [%]
Schmelztemperatur [°C]
Aufeinanderfolgende homologe Nukleotide
Aufeinanderfolgende identische Nukleotide
Wiederholungen von Dinukleotiden
Anzahl G oder C am 3' Ende
Wert
20
50 - 80
55 - 80
<7
<4
<3
≥1
Tab. 45: PCR-Ansatz (Standardvolumen 50 µL).
Abschnitt
DNA-Matrize
Taq- oder Pfu-Polymerasepuffer (5-fach oder 10-fach
konzentriert)
DMSO oder Glycerol
dNTP-Mix, 10 mM
F-Primer, 20 µM
R- Primer, 20 µM
H2Obidest
Polymeraselösung*
Volumen
1 µL
10 µL (5-fach)
bzw.
5 µL (10-fach)
1 - 3 µL DMSO
oder
10 µL Glycerol
50 % (V/V)
1 µL
1 µL
1 µL
ad 49 µL
1 µL
Bemerkung
10 µL bei genomischer DNA
Endkonzentration: 1-fach
Zur Schmelzpunktserniedrigung und Auflösung von
Sekundärstrukturen
5 nmol pro Nukleotid
20 pmol
20 pmol
Als "hotstart" nach initialer
Denaturierung zupipettiert
* Die Aktivität bei der eingesetzten Enzymlösungen betrug für die Taq-Polymerase 5 - 8 u/µL bei
der Pfu-Polymerase 3 u/µL. 1 unit (u) polymerisiert innerhalb 30 min bei 74 °C 10 nmol
Nukleotide.
Zur Entwicklung von primer- und produktspezifischen PCR-Programmen wurde nach dem
Schema in Tab. 46 vorgegangen. Die Annealingtemperatur (Kondensationstemperatur) wurde
5 Kelvin unter der niedrigsten Schmelztemperatur der beteiligten Primer gewählt. Die
Schmelztemperaturen lassen sich auf Basis der Nukleotidsequenz mit dem Programm Clone
Manager Suite berechnen. Die Elongationszeit ist abhängig vom eingesetzten Enzym und der
Produktlänge.
218
Material und Methoden
Tab. 46: Schema zur Entwicklung von primer- und produktspezifischen Temperaturprogrammen. Wenn nicht
anders beschrieben wurde dieses Schema verwendet.
Abschnitt
Initiale Denaturierung
Denaturierung
Annealing
Elongation
Temperatur
94 °C
94 °C
(Smp.[°C]−5) °C
72 °C
Terminale Elongation 72 °C
Ende
8° C
Dauer
2 min
45 s
1 min
Taq: (Amplifikatlänge [kb]×1) min
Pfu: (Amplifikatlänge [kb]×2) min
7 min
∞
30x
Für die analytische Auswertung der PCR wurden 5 µL aus dem Ansatz für eine Agarosegelelektrophorese (s. 5.5.4.2) eingesetzt.
5.6.1.2 Redirect-PCR
Auch die linearen DNA-Abschnitte für die λ-Red vermittelte Rekombination (s. 5.5.5.5)
wurden per PCR gewonnen. Für die Bestimmung der Annealingtemperatur nach obigem
Schema können die hohen Schmelztemperaturen der etwa 60 nt langen Primer nicht
herangezogen werden. Es wurde deshalb ein spezielles Gradientenprogramm (RedirectTemperaturprogramm) gemäß [150] verwendet.
Tab. 47: Redirect-Temperaturprogramm mit der Taq-Polymerase.
Abschnitt
Initiale Denaturierung
Denaturierung
Annealing
Elongation
Denaturierung
Annealing
Elongation
Terminale Elongation
Ende
Temperatur
94 °C
94 °C
50 °C
72 °C
94 °C
55 °C
72 °C
72 °C
8 °C
Dauer
2 min
45 s
45 s
90 s
45 s
45 s
90 s
5 min
∞
10x
15x
5.6.2 DNA-Sequenzierung
5.6.2.1 Ansequenzierung von Plasmiden und Cosmiden
DNA-Ansequenzierungen wurden bei der 4base lab GmbH (Reutlingen) in Auftrag gegeben.
Grundlage ist das Sanger-Verfahren. Ausgehend von einem Oligonukleotidprimer werden
mittels DNA-Polymerase Amplifikate des zu sequenzierenden DNA-Abschnitts synthetisiert.
Als Substrate werden dem Enzym neben Desoxynukleotiden auch zum Kettenabbruch
219
Material und Methoden
führende, fluoreszenzmarkierte Didesoxynukleotide zur Verfügung gestellt. Es entstehen
Produkte unterschiedlicher Länge (bis ca. 900 nt Länge), die per Kapillarelektrophorese
aufgetrennt werden. Die basenspezifische Fluoreszenzmarkierung wird vom Sequenzierautomaten detektiert. Das Fluoreszenzchromatogramm und die daraus abgeleitete DNASequenz wurden in digitaler Form erhalten. Die Daten wurden mit den PC-Programmen
Clone Manager Suite, DNASTAR Lasergene und Chromas verarbeitet (s. 5.14). Die Qualität
der Sequenz und Hinweise auf Problemquellen bei der Sequenzierung konnten aus den
Fluoreszenzchromatogramm abgeleitet werden (ein Beispiel findet sich unter 3.3.4.1). Von in
Sequenziervektoren subklonierten DNA-Fragmenten konnten durch die Endsequenzierung
mit Standardprimern Sequenzlängen von bis zu 900 nt von beiden Enden des Inserts erhalten
werden. Standardprimer binden an bekannt DNA-Sequenzen auf den Vektoren, nahe der
multiple cloning site (MCS), in welche die Inserts einligiert werden.
Eine Übersicht über alle zur Sequenzverarbeitung
Internetservices findet sich in Tab. 57.
eingesetzten
Programme
und
Standardprimer zur Ansequenzierung
Folgende Standardprimer wurden von der Firma 4base lab (Reutlingen) auf Lager gehalten.
Im Gegensatz zu Primern eines Primerwalkings (s. 5.6.2.2) entfällt eine kosten- und
zeitintensive Spezialsynthese der Oligonukleotide. Besonders häufig wurden die uni- und revPrimer eingesetzt, die auf einer Vielzahl von Sequenziervektoren binden und eine beidseitige
Ansequenzierung des Inserts erlauben.
Tab. 48: Standardprimer.
Primername
uni
rev
pOJ436-F
pOJ436-R
Nukleotidsequenz
5'-GTAAAACGACGGCCAG-3'
5'-GGCACCCCAGGCTTTACACTT-3'
5'-AGGAAGCAGCCCAGTAGTAG-3'
5'-GAAGATGCGTCGTGCTATCC-3'
bindet auf
pBSK−, pUC19,
pGEM-T Easy, weitere
pOJ436 (Cosmidvektor)
5.6.2.2 Primerwalking auf Plasmiden und Cosmiden
Durch einen Sequenzierschritt werden jeweils nur Basenabfolgen begrenzter Länge bestimmt.
Um größere Bereiche von Plasmiden oder Cosmiden zu sequenzieren sind mehrere Schritte
notwendig. Das Aneinanderreihen von Schritten wird Primerwalking genannt. Ausgehend von
einem bekannten Sequenzabschnitt etwa 100 bp vor Beginn des unbekannten Bereichs wurde
mit dem Programm Clone Manager Suite ein Sequenzierprimer abgeleitet. Dazu wurden die
auch für PCR-Primerpaare angegebenen Parameter (s. Tab. 44) gewählt. Das erhaltene
Sequenzierergebnis vergrößert den Bereich an bekannter Sequenz. Auf diese Weise können in
mehreren Schritten Subklone oder Cosmidabschnitte vollständig sequenziert werden.
220
Material und Methoden
5.6.3 Primerlisten geordnet nach Projekt
5.6.3.1 Amplifikationen S. diastatochromogenes Tü6028
Für PCR-Reaktionen im Rahmen des Projekts zur Inaktivierung von pok-KSα (s. 3.2) wurden
folgende Primer verwendet.
Resistenzgen Austausch zur Erstellung der Redirect-Kassetten pIJ785Spec / pIJ774Spec
Primername
aadA-F
aadA-R
Nukleotidsequenz
Temperaturprogramm
5'-GTGCAATACGAATGGCGAAAAGCCGAGCTCAT
CGGTCAGCCCGTATTTGCAGTACCAGCG-3'
5'-GCTCAGCCAATCGACTGGCGAGCGGCATCGCA
TTCTTCGCTGTAGGCTGGAGCTGCTTC-3'
Redirect, s. Tab. 47
Als Matrize der PCR diente die Redirect-Kassette von pIJ778 (s. Tab. 35). Mit dem 1159 bp Produkt lässt sich
die Apramycinresistenzkassette anderer Redirect-Kassetten durch das Spectinomycinresistenzgen (aadA) mit
Promotor über λ-Red vermittelte Rekombination austauschen. Auf diese Weise wurden die beiden neuen
Redirect-Kassetten der Plasmide pIJ785Spec und pIJ774Spec (s. 5.4.2.1) gewonnen. Die unterstrichenen
Bereiche zeigen die Bindungsstellen mit der Redirect-Kassette von pIJ778 an. Die Spectinomycinresistenzkassette konnte so in der gleichen Orientierung wie die ursprünglich vorhandene Apramycinresistenzkassette
eingebaut werden.
Konstruktion des Inaktivierungsplasmids pB-P3,7red per λ-Red-Rekombination
Primername
P7,3red-F
P7,3red-R
Nukleotidsequenz
Temperaturprogramm
5'-ATGGCCCGAGACGTAGTGATAACGGGTGTCGG
CGTCGTCTGTAGGCTGGAGCTGCTTC-3'
5'-GGGACGGGTGAGCACCATCGCGCTCTGGAAGC
CGCCGAATCCGCTCCCTTCTCTGACG-3'
Redirect, s. Tab. 47
Das Design der Primer erfolgte nach den Vorgaben aus 5.5.5.5, wobei die Variante "tipAp in Leserichtung des
Zielgens, spec gegen die Leserichtung" gewählt wurde. Die Bindungsstellen mit der als Matrize dienenden
Redirect-Kassette von pIJ785Spec sind unterstrichen. Über die λ-Red vermittelte Rekombination ersetzt das
1694 bp PCR-Produkt fast das komplette pok-KSα-Gen.
Screening auf Crossover und Konstruktion des Komplementierungsplasmids
Primername
P7,3-F
P7,3-R
Nukleotidsequenz
Temperaturprogramm
5'-TGATGGTGCCGCTGGCCATGG-3'
5'-AGCGTTCACTGTTCCGCCCGAC-3'
Standard, s. Tab. 46
Für die Anwendung im Rahmen des pok-KSα-Inaktivierungsversuchs "Deletion auf einem 7,3 kb-Clusterfragment" (3.2.1.2) wurden die Primer P7,3-F / -R abgeleitet. Die Amplifikate von Wildtypallel und mutiertem
Allel weisen nahezu identische Größen auf, sind aber durch Fehlen einer KpnI-Erkennungsstelle in der Sequenz
der Mutante unterscheidbar. Auch für die Konstruktion des Komplementierungskonstrukts pSET-P3,7kompl
(s. 5.4.2.2) konnte auf dieses Primerpaar zurückgegriffen werden.
221
Material und Methoden
Primername
P7,31-F
P7,32-R
Nukleotidsequenz
Temperaturprogramm
5'-CATGGCCCGAGACGTAGTG-3'
5'-CCGGCTCGTACAGGTTGG-3'
Standard, s. Tab. 46
Diese Primer wurden alternativ zu P7,3-F / -R eingesetzt. Sie besitzen leicht veränderte Bindungsstellen. Das
Amplifikat deckt nur einen Teil von pok-KSα ab. Die Produkte (1133 bp für das Wildtypallel, 1064 bp für das
mutierte Allel) unterscheiden sich durch Fehlen einer KpnI-Erkennungsstelle im Produkt der Mutante.
Primername
P3,7-F
P3,7-R
Nukleotidsequenz
Temperaturprogramm
5'-GCGGTCGTGCCGTGAATG-3'
5'-GCGAGAGTGGCGTTCCAG-3'
Standard, s. Tab. 46
Das Primerpaar P3,7-F / -R kam beim erfolgreichen pok-KSα-Inaktivierungsversuch mit der [safe-knock]Strategie zum Einsatz (s. 3.2.2). Die nach Amplifizierung erhaltenen Produkte von 1624 bp (pok-KSαWildtypallel) bzw. 2067 bp (mutiertes pok-KSα-Allel) erlauben die Unterscheidung von Wildtyp, Erst- und
Doppelcrossover-Mutante.
Überprüfung auf Markerexzision durch Flp-Rekombination
Primername
P3_7FLP-F
P3_7FLP-R
Nukleotidsequenz
Temperaturprogramm
5'-CGGCAGGGCCTCGTAGCACTTG-3'
5'-GTGCCCGGTCTCGGGTCGAAC-3'
Standard, s. Tab. 46
Die Primer P3_7FLP-F / -R dienen zur Überprüfung auf erfolgreiche Flp-Rekombination (s. 5.9). Mit
genomischer DNA von S. diastatochromogenes Tü6028 ∆pok-KSα wird ein 3538 bp großes Produkt erwartet,
nach Exzision ein 2207 kb großes Produkt.
Primername
P3_7FLP2-F
P3_7FLP2-R
Nukleotidsequenz
Temperaturprogramm
5'-GTCGTGCCGTGAATGAGG-3'
5'-CGTACTCGGGCAGTTGTC-3'
Standard, s. Tab. 46
Mit P3_7FLP2-F / -R wurde eine Alternative zu P3_7FLP-F / -R geschaffen. Die erwarteten Produktgrößen
betragen 2273 bp vor und 942 bp nach Exzision.
5.6.3.2 Amplifikationen Glykosyltransferasen-Toolbox
Der Code für degenerierte Primer ist im Abkürzungsverzeichnis (s. 7.1) erläutert.
Primername
genGT-F
genGT-R
Nukleotidsequenz
5'-CGSTWCGTSCCSTWCAACGG-3'
5'-GTSCCSSCSCCSSCGTGGTG-3'
Temperaturprogramm
Standard, s. Tab. 46,
Annealing: 60 °C
Das Primerpaar genGT-F / -R setzt sich aus zwei degenerierten Primern zusammen, die beim ersten Versuch,
Abschnitte von Glykosyltransferasegenen auf vorselektierten Cosmiden zu amplifizieren, verwendet wurden
(s. 3.1.9.2).
222
Primername
P1 (= mGTB2F)
P2 (= mGTF1R)
Material und Methoden
Nukleotidsequenz
5′-AGGTCTGCGGCGCCSCNCAYGCNMG-3′
5′-GGTGCCGGCGCCNCCRTGRTG-3′
Temperaturprogramm
Standard, s. Tab. 46,
Annealing: 55 - 60 °C
P1 und P2, die letztlich erfolgreichen Primer zur Amplifikation von Glykosyltransferasegenen, entstanden mit
der CODEHOP-Strategie (s. 3.1.9.2). Die Degeneration beschränkt sich auf einen Bereich am 3'-Ende.
5.6.3.3 Amplifikationen und Sequenzierungen S. sp. Gö C4/4
Auflistung in Reihenfolge der Unterkapitel von 3.3.
Sequenzierung des msc-Contigs
Primername
Lückenprimer
Lcke4R
Lcke4aR
Lcke5F
Lcke4F
Lcke3R
Lcke2R
Lcke1R
Lcke3F
Lcke2F
Lcke1aF
Primerwalking
L1F
Nukleotidsequenz
Contigposition
5'-GTGGGTGGCGGGTTCGAG-3'
5'-TCGCGGGCGGCCAACGAG-3'
5'-GCCCTCGGCAGGAACAGCAC-3'
5'-CGGGCCTTCGTCGACCTG-3'
5'-GTCCATGCGGGTCCGGAAAC-3'
5'-GTCCCGATGCCCTTTCACC-3'
5'-CAGCCCTGACCCGGCAAC-3'
5'-AGCTGCGCGATCGTGGAG-3'
5'-CACGGCTCAGGCCATGAAC-3'
5'-GAGACCGCGCCCAGGATG-3'
9666C
9073
12180
12358C
16158
16595C
17774C
17583
40751
40861C
5'-CCGGCGACCATCGCTCTG-3'
43857
Anschlusscosmidscreening
5'-CGGGACGGGAGTCCTGAGGAG-3'
Ansch-F
5'-GGCGCGGGTCAGTTCCAGAG-3'
Ansch-R
42457
43513C
Mit den Lückenprimern wurde gemäß 3.3.2.2 über eine PCR die Lage der msc-Contigs zueinander überprüft.
Nur die zur Produktbildung führenden Lückenprimer sind angegeben. Beim Primerwalking spielte der Primer
L1F eine wichtige Rolle zur Verbindung des Subcontigs 3,2KB mit der Cosmidvektorsequenz. Für die
Begrenzung des msc-Contigs auf der rechten Seite wurden die Cosmide des msc-Contigs über PCR mit den
Primern Ansch-F / -R auf Bildung eines 1057 bp Produkts überprüft (s. 3.3.2.3).
223
Material und Methoden
Inaktivierung und Expression von Genen des msc-Contigs
Konstruktion des Inaktivierungsplasmids p∆msc21
Primername
21red-F
21red-R
Nukleotidsequenz
PCR-Programm / Pos.
5'-ACGCACACACCGTCCGTCCAGCCATCACATCG
AGAGGACATTCCGGGGATCCGTCGACC-3'
5'-AGGAAACCATCGGCGGTCCGTCCCTCAGTCGT
TCGCTGCTGTAGGCTGGAGCTGCTTC-3'
21668C
Redirect, s. Tab. 47
20538
Das 1490 bp große PCR-Produkt der Primer 21red-F / -R der Redirect-Kassette von pIJ778 wurde für eine λ-Red
vermittelte Rekombination zur Konstruktion des Plasmids p∆msc21 eingesetzt (s. 5.4.2.5). Zur Vermeidung
negativ transkriptionsbeeinflussender Effekte (= negativer polarer Effekte) auf flankierende Gene wurden die
Primer nach der Variante "spec in Leserichtung des Zielgens" (s. 5.5.5.5) zusammengesetzt.
Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msc21
Primername
Msc21-F
Msc21-R
Nukleotidsequenz
5'-GCCGGTTCCGTCCGAACGGAG-3'
5'-CTTCCTGGGCCGGATCGAGGG-3'
Contigposition
20443
21811C
Msc21-F / -R amplifizieren den Bereich von msc21 mit je 100 - 200 bp flankierender Sequenz beidseitig des
Gens. Die Größe des entstandenen Produkts wurde zur Differenzierung von Wildtypallel (1369 bp) und
mutiertem Allel (1728 bp) herangezogen (s. 3.3.2.4).
Konstruktion des Inaktivierungsplasmids p∆msc37
Primername
37red-F
37red-R
Nukleotidsequenz
PCR-Programm / Pos.
5'-CCCGACGAAACCGTGCCCGTCCTCGTCGCCGG
AGCCGGCATTCCGGGGATCCGTCGACC-3'
5'-GACGTTCGGGGAGGTGCGGGATGCCCTGCGGG
CTGTTCATGTAGGCTGGAGCTGCTTC-3'
38307
Redirect, s. Tab. 47
39956C
Die Primer 37red-F / -R wurden analog zu 21red-F / -R entworfen (s. o.). Das ebenfalls 1490 bp große PCRProdukt der gleichen Kassette diente zur Konstruktion des Plasmids p∆msc37 (s. 5.4.2.5).
Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msc37
Primername
Msc37-F
Msc37-R
Nukleotidsequenz
5'-GAGCCCGTCACCATGACCCAG-3'
5'-CTGTCCGGCCTTCGCGTTCTC-3'
Contigposition
38208
40025C
Die Msc37-F / -R-Amplifikatgröße des Bereichs von msc21 mit je etwa 100 bp flankierender Sequenz beidseitig
des Gens ermöglichte die Unterscheidung zwischen Wildtypallel (1818 bp) und mutiertem Allel (1658 bp)
(s. 3.3.2.4).
224
Material und Methoden
Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msc15 (=∆mscKSβ)
Primername
KS2_1
KS2_2
Nukleotidsequenz
5'-AGTCGAGGATCCGGCACTCGC-3'
5'-TTGGCGCTCGAGAGTGGTTTC-3'
Contigposition
14147C
12573
Mit den Primern KS2_1 und KS2_2 wird ein 1,6 kb großer, msc15 enthaltender, Sequenzabschnitt amplifiziert.
Da sich die Produktgrößen von Wildtypallel und mutiertem Allel nur geringfügig von einander unterscheiden,
wurde eine Restriktionsanalyse nachgeschaltet (s. 3.3.2.5).
Überexpression der Regulatorgene msc24 und msc30
Primername
Msc24EcoXba-F
Msc24EcoXba-R
Msc30EcoXba-F
Msc30EcoXba-R
Nukleotidsequenz
5'-ATTCTAGACGCGTTGCAGAGG-3'
5'-TAGCAATTGTTGGGCCGACAGC-3'
5'-GATCTAGAGTGGGCGCCTGTCG-3'
5'-GAGAATTCGCCCGTAGCCCATC-3'
Contigposition
23345
24274C
28188
29144C
Eine gezielte Amplifizierung der Gene msc24 und msc30 inklusive ihrer vorhergesagten Ribosomenbindungsstellen wurde durch die Primerpaare Msc24EcoXba-F / -R bzw. Msc30EcoXba-F / -R möglich. Für die
Insertion in den Expressionsvektor pSET mit ermE-up-Promotor wurden am 5'-Ende Endonukleaseerkennungsstellen in die Sequenz integriert. Diese sind unterstrichen. XbaI: TCTAGA; MunI: CAATTG; EcoRI:
GAATTC.
PCR-basiertes Screening auf PKS II Cluster
Primername
KSa-F
KSa-R
Nukleotidsequenz
Annealingtemperatur
5'-TSGCSTGCTTCGAYGCSATC-3'
5'-TGGAANCCGCCGAABCCGCT-3'
55 °C
Die degenerierten Primer KSa-F / -R erlauben durch Bindung an hochkonservierte Sequenzabschnitte die Teilamplifizierung von (unbekannten) ksα-Genen (s. 3.3.3). Der Code für degenerierte Primer ist unter 7.1 erläutert.
Sequenzierung des mec-Contigs
Primername
Primerwalking
G2B4,2-R2
G2Hyd-F1
G2Hyd-R1
G2L1-R5
G2L1-R4
KSaG2-R5
G2L1-R3
G2L1-R2
G2L1-F2
KSaG2-R3
Nukleotidsequenz
Contigposition
5'-GCTGCACAGACACCAGGAG-3'
5'-ACGTCCGGATCACCGGCAAG-3'
5'-GTCGCCAGCAGGGTGGTCAG-3'
5'-GATGGCGGGCACCGCATGAC-3'
5'-GAGGGTCCGCGCCGGTCCTC-3'
5'-GTGCGGGTGCGGGGACGG-3'
5'-TGTCGGCCGGATCGGCTG-3'
5'-CGGCACAGCCGGGTGGTGTC-3'
5'-ACATCGTGGTGCGGCTGGTC-3'
5'-TGGTCATGAGCGGACCTGAG-3'
877C
1356
2184C
2263C
2532C
2766C, 4021C
2747C
3346C
3724
4522C
225
Material und Methoden
Primername
Primerwalking
KSaG2-R1
KSaG2-R2
KSaG2-F2
KSaG2-F1
KSaG2-F3
KSaG2-F4
KSaG2-F5
KSaG2-F6
KSaG2-F7
C12Not7-R2
C12Not7-R1
C12Not4-R1
Nukleotidsequenz
Contigposition
5'-TGGGCCGGGTCGTCGTTGTC-3'
5'-CCCTCGCCCATGACGAACCC-3'
5'-TCCCGCCCACCGCGAACTAC-3'
5'-TCGCCCGTGAGCGGAAGCTG-3'
5'-ACCGACGCCGCGCCGTTCTC-3'
5'-CTCGGCTACGAGGAGCTGAG-3'
5'-CGACGTCTGCCACGACCTC-3'
5'-TCCTGTGGGAGTACGAGAAG-3'
5'-CCGGGCCATCAGCGAACG-3'
5'-AGCATGACCCGCAGGCTGAC-3'
5'-GCGACTGCCGCGAGGCCGTCC-3'
5'-ACCGAGGCCGGTCAGCACAG-3'
5183C
5234C
5618
5681
6075
6402
6893
7637
8101
8375C
8611C
9400
Die Primer sind in der Reihenfolge der Contigstrategie des mec-Cluster (s. Abb. 68) angegeben. Ebenfalls zum
Einsatz kamen die Standardprimer uni und rev (s. 5.6.2.1).
Ansequenzierte PCR-Produkte des mec-Contigs
PCR-Produkt
L1
L1a
L2
eingesetzte Primer
uni + aG2-R4
uni + G2L1-R5
KSaG2-F6 + C12Not7-R1
Produktgröße (laut Agarosegel)
2,1 kb
0,3 kb
1 kb
Primername
KSaG2-R4
Nukleotidsequenz
Contigposition
4091C
5'-CGATGCCGGGATGGCGATTG-3'
Für die Erstellung der ansequenzierten PCR-Produkte konnte auf die Sequenzierprimer des Primerwalkings
zurückgegriffen werden. Bisher noch nicht erwähnt wurde der Primer KSaG2-R4.
Inaktivierung von Genen des mec-Contigs
Konstruktion des Inaktivierungsplasmids p∆mecIII
Primername
Nukleotidsequenz
PCR-Programm /
Pos.
C12KSAred-F
5'-CTGGACGCGGAGCTGGTCGCCCGCTGCGACCG
GTACATCTGTAGGCTGGAGCTGCTTC-3'
5'-TGACGGCGGCCGTCTCGTGCCGGTCGTTCTGC
TTGGTGCATTCCGGGGATCCGTCGACC-3'
4699
Redirect, s. Tab. 47
5488C
C12KSAred-R
Das Primerpaar führt mit der Redirect-Kassette von pIJ774Spec als Matrize zu einem 1484 bp Produkt, das
anschließend zur Erstellung des Inaktivierungsplasmids p∆mecIII (s. 5.4.2.5) per λ-Red vermittelter Rekombination eingesetzt wurde. Die Primer wurden nach der Variante "spec gegen die Leserichtung des Zielgens"
(s. 5.5.5.5) abgeleitet.
226
Material und Methoden
Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆mecIII (=∆mecKSα)
Primername
C12KSA-F
C12KSA-R
Nukleotidsequenz
5'-CTGGACGCGGAGCTGGTCGC-3'
5'-GCGGACTGGAACCCGCCGAAC-3'
Contigposition
10183
11231C
Es wird ein internes Fragment des Gens mecIII amplifiziert. Da die Primer außerhalb des in der Mutante
ersetzten Sequenzbereichs binden, sind sowohl für Wildtypallel (1050 bp) als auch das mutierte Allel (1744 bp)
PCR-Produkte zu erwarten.
Inaktivierung von Genen des msn-Contigs
Konstruktion des Inaktivierungsplasmids p∆msnK1
Primername
C7KSAred-F
C7KSAred-R
Nukleotidsequenz
PCR-Programm / Pos.
5'-CCAATCCACCGCAAGAAGGAAGCGAAGAC
ATGCACATGATGTAGGCTGGAGCTGCTTC-3'
5'-CCAGGCCGCTCTCGGTGACCGCCTCGCGG
GCGGCGACCAATTCCGGGGATCCGTCGACC-3'
16351C
Redirect, s. Tab. 47
16023
Design und Funktion des Primerpaars sind analog zu C12KSAred-F / -R (s. o.), bezogen auf das Gen msnK1.
Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msnK1
Primername
C7KSA-F
C7KSA-R
Nukleotidsequenz
5'-GACCAATCCACCGCAAGAAGG-3'
5'-CCAGGCCGCTCTCGGTGACC-3'
Contigposition
16353C
16023
Ein internes Fragment des Gens msnK1 wird amplifiziert. Die PCR-Produkte von Wildtypallel (331 bp) und
mutiertem Allel (1486 bp) können anhand ihrer Größe differenziert werden (s. 3.3.5.2).
Konstruktion des Inaktivierungsplasmids p∆msnO11C2
Primername
C7KRred-F
C7KRred-R
Nukleotidsequenz
PCR-Programm / Pos.
5'-TACTCGACGCCCGAGGAGGTGGCCGGCCTAG
TGACCTATTGTAGGCTGGAGCTGCTTC-3'
5'-TCGACCTCGCGCGATGCCGATTCGCTCATCC
GGTCGTCTATTCCGGGGATCCGTCGACC-3'
25549
Redirect, s. Tab. 47
25748C
Design und Funktion des Primerpaars sind analog zu C12KSAred-F / -R (s. o.), bezogen auf einen Sequenzabschnitt der Teile der Gene msnO11 und msnC2 beinhaltet.
227
Material und Methoden
Screening auf Crossover für die Mutante S. sp. Gö C4/4 ∆msnO11C2
Primername
C7KR-F
C7KR-R
Nukleotidsequenz
5'-CGAGGGCTACCGCGTCTAC-3'
5'-GCGGGAGGTCCAGGTCTTC-3'
Contigposition
24957
25929C
Das Primerpaar bindet außerhalb des durch die ∆msnO11C2-Mutation betroffenen Bereichs. Die PCR mit
genomischer DNA der Mutante führt einem 2258 bp Produkt, wohingegen beim Wildtyp ein 974 bp großes
Produkt erwartet wird.
Primer zur Sequenzierung der msn-Contigerweiterung
Primername
Primerwalking
Met-R1
C7Bgl6a-F1
Met-F1
C7Bgl6a-F2
G3AK-F1
G3S2,7-R1
G3S2,7-R2
G3S3,5-F1
G3S3,5-F2
G3S3,5-F3
Nukleotidsequenz
Contigposition
5'-GAAGATGCGTCGTGCTATCC-3'
5'-ATGAGGTCGAGAGCGGTCTG-3'
5'-TGGAGCCGCTGGGCATCGAC-3'
5'-TGGCGGAACGGGACGGTCTG-3'
5'-GGAGGCCGTCGATCCCACAG-3'
5'-CGGGTGGCGAGGGCCTCACG-3'
5'-GTCGCTCGGTCCATCCAGTG-3'
5'-TGGACCTGCGTGGTGAGATG-3'
5'-ACCGTTCCGTCGGCGTGGTC-3'
5'-CCCAGCCGTGACCAGCAAC-3'
36861C
36686
37844C
37484
38727C
38444
38834
42734
43436
44020
Die Primer sind in der Reihenfolge von Abb. 80 angegeben. Durch eine große Anzahl von Subklonen in diesem
Bereich konnten auch viele Sequenzdaten aus der Subklonansequenzierung mit den Standardprimern uni und rev
(s. 5.6.2.1) verwendet werden.
5.7
Gentransfer in Saccharothrix spp. und Streptomyces spp.
5.7.1 Protoplastentransformation
Die Zellwand von Vertretern der Gram+ Gattungen Saccharothrix und Streptomyces stellt eine
Barriere für die Aufnahme von DNA dar. Bei der Protoplastentransformation wird diese
Barriere vor dem DNA-Transfer abgebaut [66]. Der sukzessive Abbau der Zellwand erfolgt
durch Inkubation mit Lysozym, was zur Freisetzung der Protoplasten aus dem Myzelverbund
führt. Diese können PEG-vermittelt Fremd-DNA aufnehmen. Unmittelbar nach der DNATransformation müssen die Protoplasten auf Regenerationsmedium (R2YE) ausgebracht und
durch Überdecken mit isotonischem Medium (R3-Weichagar) geschützt werden, damit der
Wiederaufbau der Zellwand erfolgen kann. Schließlich erfolgt die Selektion durch
Überschichten mit antibiotikahaltigem Medium (NB-Weichagar). Verwendete Lösungen und
Nährmedien sind in Tab. 23 bzw. Tab. 27 beschrieben.
228
Material und Methoden
Protoplastierung
Als Vorkultur für die Protoplastierung wurden 100 mL HA-Flüssigmedium mit 1 cm2 einer
Kulturplatte des Rezipientenstammes inokuliert und für 24 h unter Standardbedingungen
(s. 5.3.1.4) kultiviert. 1 mL der Vorkultur dienten als Inokulum für 100 mL TSB+-Medium als
Hauptkultur. Diese Kultur wurde geerntet, sobald ausreichend Biomasse von feingriesiger
Beschaffenheit gewachsen war (in der Regel nach 18 - 24 h). Die Ernte erfolgte durch
Aufteilen der Kultur auf zwei 50 mL Falcontubes und dem Pelletieren des Myzels durch
Zentrifugation (4 °C, 5000 rpm, 5 min). Die Pellets wurden in je 20 mL eiskaltem P-Puffer
durch kurzes Vortexen aufgeschwemmt, erneut pelletiert und dekantiert. Die Zellwandlyse
wurde durch sanftes Resuspendieren der Pellets in je 10 mL lysozymhaltigem P-Puffer
gestartet. Es wurden mehrere Ansätze parallel bearbeitet, die sich durch Lysozymkonzentration (2 - 3 mg/mL) und Inkubationstemperatur (29 - 35 °C) von einander unterschieden. Der Fortschritt der Protoplastierung wurde alle 10 min lichtmikroskopisch bei
500-facher Vergrößerung verfolgt. Als Idealsbedingung für S. diastatochromogenes Tü6028
stellten sich 2 mg/mL Lysozym bei 29 °C und 30 min Inkubation heraus. Nach der
gelungenen Zellwandlyse sind im Mikroskop vor allem einzeln vorliegende, runde
Protoplasten sichtbar. Mit 20 mL eiskaltem P-Puffer wurde die Lyse gestoppt und
verbleibende Myzelreste durch Filtration durch sterile Watte entfernt. Die Protoplasten
wurden durch vorsichtige Zentrifugation (4 °C, 3200 rpm, 5 min) aus dem Filtrat sedimentiert
und in 0,8 bis 1,5 mL eiskaltem P-Puffer aufgenommen. In 200 µL Aliquots wurden die
Protoplasten bei −86 °C gelagert.
Die Qualität der Charge wurde durch Kontrollansätze parallel zur Protoplastentransformation
(s. u.) überprüft. Als Negativkontrolle wurde ein Aliquot vor der Inkubation mit 1 mL
H2Obidest gemischt. In der entstandenen hypotonen Umgebung kam es zum Platzen der
Protoplasten, so dass keine oder nur sehr wenige Kolonien erwartet wurden. Vermehrtes
Wachstum hingegen wäre ein Indikator für die Anwesenheit von Zellen mit intakter
Zellwand. Ein weiteres Aliquot diente zur Überprüfung der Regenerationsfähigkeit der
Protoplasten. Dieses wurde vor der Inkubation in 1 mL P-Puffer resuspendiert. Hier wurde
Wachstum in Form eines dichten Rasens erwartet.
Protoplastentransformation
Methylierte Fremd-DNA wird von Actinomycetales-Arten durch Restriktion abgebaut. Für
die Protoplastentransformation wurde deshalb ausschließlich DNA aus dem methylierungsdefizienten E. coli ET12567 (s. Tab. 33) eingesetzt. 10 - 20 µg in maximal 30 µL H2Obidest
wurden mit 500 µL eiskaltem T-Puffer und 200 µL Protoplastenaliquot sanft durch
einmaliges Auf- und Abpipettieren mit einer abgeschnittenen Pipettenspitze gemischt. Der
Transformationsansatz wurde gleichmäßig auf zwei vorgewärmten R2YE-Platten verteilt und
mit je 5 mL R3-Weichagar überschichtet.
Material und Methoden
229
Selektion
Nach einer Inkubationszeit von 12 - 16 h (28 °C) wurden die Agarplatten mit je 3 mL NBWeichagar überschichtet, der ein dem eingebrachten Konstrukt entsprechendes Antibiotikum
enthielt. Das Antibiotikum im NB-Weichagar wurde so konzentriert eingesetzt, dass sich
bezogen auf das Gesamtvolumen der Platte eine Standardkonzentration (s. Tab. 28) ergab.
Nach fünf bis sieben Tage kam es in der Weichagarschicht zum Wachstum von weißen,
kugelförmigen Kolonien mit etwa 1 mm Durchmesser (10 - 30 Kolonien pro Platte). Unter
dem Lichtmikroskop ließ sich die Myzelstruktur der Transformanten erkennen. Einige
Transformanten wurden zur Verifizierung der Resistenz auf antibiotikahaltige HA-Agar
überimpft und anschließend weiter untersucht.
5.7.2 Intergenerische Konjugation
DNA kann mittels intergenerischer Konjugation von einem E. coli Donorstamm in einen
Actinomycetales Stamm als Rezipienten transferiert werden. Die Befähigung zum DNATransfer erhält der Donorstamm durch das Konjugationssystem des Plasmids RP4. Wegen
geringer Rezipentienspezifität ermöglichen die Mobilisierungsfaktoren dieses Plasmids auch
der DNA-Transfer von E. coli auf nur entfernt verwandte Spezies der Gattungen
Saccharothrix und Streptomyces [428]. Das zu übertragende Plasmid muss das RP4 origin of
transfer (oriT) enthalten. Als Donor wurde der methylierungsdefiziente Stamm E. coli
ET12567 (s. Tab. 33) eingesetzt, der mit dem Plasmid pUZ8002 ein sich selbst nicht
transferierendes RP4-Derivat enthält [429].
Vorbereitung des E. coli-Donorstamms
Das zu übertragende Plasmid wurde mittels Hitzeschocktransformation (s. 5.5.1.1) in CaCl2kompetente E. coli ET12567 Zellen mit dem Plasmid pUZ8002 eingebracht. Die Selektion
von Transformanten erfolgte mit Kanamycin auf Anwesenheit von pUZ8002, sowie einem
dem zusätzlich eingebrachten Plasmid entsprechenden Antibiotikum. Ein einzelner
Transformant wurde auf LB-Agar ausgestrichen und unter Selektionsdruck angezogen. Für
einen dichten E. coli-Bewuchs wurde nach 24 h ein Abstrich der Platte flächig auf eine frische
LB-Platte ausgestrichen und bis zur Konjugation 14 - 16 h bei 37 °C inkubiert. Je die Hälfte
der E. coli-Biomasse einer dicht bewachsenen Platte (∅ = 9 cm) wurde pro Konjugationsansatz mit einer Impföse abgenommen.
230
Material und Methoden
Vorbereitung des Actinomycetales Rezipienten-Stammes
Rezipientenvorbereitung ausgehend von Myzel
Mit 5 mL einer Saccharosedauerkultur (s. 5.3.1.4) oder 1 cm2 einer flächig bewachsenen
Agarplatte wurden in einem 300 mL Erlenmeyerkolben mit zwei Schikanen und einer
Edelstahlspiralfeder 100 mL HA-Flüssigmedium (nur für Saccharothrix espanaensis: TSBFlüssigmedium) angeimpft und bei 28 °C auf dem Rundschüttler (180 rpm) inkubiert. Die
Edelstahlfeder zerkleinert während des Schüttelns die Myzelverbände und führte so einer
vergrößerten, für die Konjugation zur Verfügung stehenden Oberfläche. Der richtige
Zeitpunkt für die Konjugation war erreicht, wenn das feine Myzel so dicht gewachsen war,
dass sich auch nach 30 s Stillstand der Kultur durch Sedimentation kein klarer Überstand
bildete. Dieser Zeitpunkt war in der Regel nach 24 - 48 h erreicht. Je Konjugationsansatz
wurden 1 - 2 mL Kultur durch Zentrifugieren (20 °C, 5000 rpm, 5 min) pelletiert. Die Zellen
wurden in 1 mL frischem Kulturmedium resuspendiert und repelletiert. Dieser Waschvorgang
dient der Abtrennung von Sekundärstoffen, die sich negativ auf die Konjugationseffizienz
auswirken können. Nach dem Dekantieren wurde das Pellet mit 200 µL HA- bzw. TSBFlüssigmedium versetzt.
Rezipientenvorbereitung ausgehend von Sporen
Die Methode wurde nur bei einigen Konjugationsversuchen mit S. diastatochromogenes
Tü6028 angewandt. Eine maximal zwei Wochen alte, dicht mit Sporen bedeckte Kultur des
Stammes auf einer Agarplatte diente als Basis für die Sporensuspension. Durch Versetzen mit
4 mL HA-Flüssigmedium und anschließendem, vorsichtigen Schaben mit der Impföse gelang
es, die hydrophoben Sporen in Suspension zu bringen. Alternativ kann dem Medium zur
Verbesserung der Suspendierbarkeit auch eine geringe Menge an Detergenz zugesetzt werden.
Die Sporensuspension wurde von der Platte abgesaugt, mit HA-Flüssigmedium auf 8 mL
ergänzt und in einen sterilen 100 mL Erlenmeyerkolben überführt. Dieser wurde für 10 min
bei 50 °C im Wasserbad und danach bei 28 °C für 3 - 4 h auf dem Rundschüttler (180 rpm)
inkubiert. Die Suspension wurde verteilt auf zwei Reaktionsgefäße sukzessive pelletiert
(20 °C, 14000 rpm, 10 min). Nach dem Abnehmen des Überstandes wurde das Pellet mit
200 µL HA-Medium versetzt.
Konjugation und Selektion
Für einen Konjugationsansatz wurden die in 200 µL Medium aufgenommen Rezipientenzellen mit den von der Kulturplatte abgenommen E. coli-Donorzellen mit Hilfe einer Impföse
innig vermengt bis sich eine homogene Masse bildete. Weitere 200 µL des Flüssigmediums
wurden ergänzt und der Ansatz auf eine zwei Tage bei 28 °C vorgewärmte und getrocknete
MS-Agarplatte überführt. Unter dem laminaren Luftstrom der Sterilbank wurde die geöffnete
Material und Methoden
231
Platte getrocknet bis keine Flüssigkeit mehr sichtbar war (5 - 10 min). Die auf der Agaroberfläche liegenden Zellen wurden nun mit einem Drigalski-Spatel intensiv auf der Platte
verrieben bis diese eine homogene, trockene Oberfläche aufwies. Bis zum Überschichten der
Platten mit antibiotikahaltigem Flüssigmedium wurde je nach Rezipient 9 - 20 h bei 28 °C
inkubiert (s. Tab. 49). Überschichtet wurden die Platten (∅ = 9 cm, Agarvolumen ca. 25 mL)
mit 1 mg - 2 mg Selektionsantibiotikum (Plasmidmarker) und 6,5 mg Phosphomycin gelöst in
1 mL Kulturmedium. Durch vorsichtiges Schwenken wurde die vollständige Benetzung der
Plattenoberfäche sichergestellt. Es wurde weiter bei 28 °C inkubiert. Nach 5 - 10 Tagen
konnte bei einer erfolgreichen Konjugation das Wachstum von Konjuganten festgestellt
werden. Die Klone wurden zur Überprüfung ihres Resistenzverhaltens auf antibiotikahaltige
HA-Platten (nur Saccharothrix espanaensis: TSB-Platten) überimpft.
Tab. 49: Überschichtungszeiten und Besonderheiten der unterschiedlichen Rezipientenstämme.
Rezipientenstamm
Saccharothrix espanaensis
Streptomyces albus
Streptomyces
diastatochromogenes Tü6028
Streptomyces sp. Gö C4/4
ÜberBesonderheit
schichtung
12 - 14 h
Sehr effektiver Transfer. Die Konjuganten
sind gelb.
9 - 11 h
Schon nach 2 Tagen sind Konjuganten als
stecknadelgroße, weiße Punkte auf der
Konjugationsplatte erkennbar.
20 h
Auch das Konjugationsprotokoll ausgehend
von Rezipientensporen war erfolgreich.
16 h
Eine erfolgreiche Konjugation ist zu
erwarten, wenn das beginnende Wachstums
des Stammes zum Zeitpunkt des
Überschichtens gerade so weit fortgeschritten ist, dass sich die Oberfläche der
Platte gleichmäßig hellbraun gefärbt hat.
Konjuganten sondern einen braunen
Farbstoff ins Medium ab, der zu
charakteristischen "Produktionshöfen" um
die Kolonien führt (vgl. 3.3.1).
Negativ und Positivkontrolle
Negativ- und Positivkrontrollen wurden parallel zu den Konjugationsansätzen durchgeführt.
Bei ansonsten identischen Bedingungen wurde für die Negativkontrolle kein Donorstamm
eingesetzt, für die Positivkontrolle ein Donorstamm mit dem integrativen Plasmid pSET152
(s. 5.4.1). Nach dem Überschichten wurde bei der Negativkontrolle kein Wachstum erwartet.
Eventuelle Koloniebildung wäre auf die Bildung von spontanen Resistenzen oder einer
Kontamination zurückzuführen. Mit dem integrativen Plasmid der Positivkontrolle ist es
möglich mit allen eingesetzten Rezipientenstämmen unter den gefundenen Idealbedingungen
eine mit Konjuganten überwucherte Konjugationsplatte zu erhalten.
232
5.8
Material und Methoden
Geninaktivierung in Streptomyces spp.
5.8.1 Klassische Strategien der gezielten Geninaktivierung
Alle zurzeit etablierten Strategien für die gezielte Geninaktivierung in Streptomyces spp.
basieren auf demselben Prinzip: Zunächst wird ein künstliches, nicht funktionelles Allel des
zu inaktivierenden Gens erstellt. Dieses nicht funktionelle Allel wird in das Bakterium
eingebracht. Die Rekombination der eingebrachten DNA mit der chromosomalen DNA des
Bakteriums an homologen Bereichen führt zur Inaktivierung des entsprechenden Gens. Bei
den Methoden 5.8.1.2 und 5.8.1.3 kommt es dabei zum Austausch des Wildtypallels gegen
das künstliche Allel. Weitergehende Informationen zu den klassischen Inaktivierungsstrategien finden sich in [66;430].
5.8.1.1 Insertionsmutagenese mit internem Fragment
Bei der Insertionsmutagenese wird mittels
PCR oder Restriktion ein internes Fragment
des zu inaktivierenden Gens gewonnen, das
weder Start- noch Stoppcodon besitzt. Auf
einem im Zielorganismus nicht replikativen
Vektor mit Resistenzkassette wird dieses
nicht funktionelle Allel in das Bakterium
eingebracht. Nach dem ersten CrossoverEreignis und Integration des Plasmids in das
Chromosom liegen zwei nicht funktionelle
Kopien des zu inaktivierenden Gens vor
Abb. 101: Der blauen Kopie fehlt das Stoppcodon, der roten Kopie das Startcodon.
Chromosom
ATG
TGA
ATG
TGA
Plasmid
apra
Abb. 101: Erstes Crossover-Ereignis zwischen
chromosomaler DNA (oben) und nicht
funktionellem Allel des Plasmids (unten). ATG:
Startcodon; TGA: Stoppcodon; apra: Apramycinresistenzkassette.
Bereits mit dem ersten Crossover liegt die endgültige Mutante vor. Die entstandene
Insertionsmutante hat den Inaktivierungsvektor in ihr Chromosom insertiert und hat damit
auch dessen Resistenz erworben. Sie ist jedoch instabil: Während der Kultivierung entstehen
durch eine zweite homologe Rekombination Doppelcrossover-Mutanten mit Wildtypallel.
Diese müssen durch Antibiotikazugabe abgetötet werden.
Da für die effiziente homologe Rekombination DNA-Bereiche von > 1 kb Länge vorliegen
sollten, ist die Inaktivierung mittels internem Fragment nur bei längeren Genen anwendbar.
233
Material und Methoden
5.8.1.2 Integration einer Resistenzkassette
Für die Erstellung des Inaktivierungskonstrukts wird eine Resistenzkassette
(Abb. 102: spec) in oder anstelle des zu
inaktivierenden Gens in einen größeren
(ca. 3 - 7 kb großen) subklonierten Bereich
aus dem Genom des Zielorganismus
eingefügt. Auf einem im Zielorganismus nicht
replikativen Vektor mit Resistenzkassette
(Abb. 102: apra) wird das nicht funktionelle
Allel in das Bakterium eingebracht. Nach dem
ersten Crossover-Ereignis und der Integration
des Plasmids in das Chromosom liegen eine
nicht funktionelle Kopie (im blauen Bereich)
sowie das Wildtypallel (im roten Bereich) des
zu inaktivierenden Gens vor.
Chromosom
Xb
Xa
spec
Plasmid
apra
Abb. 102: Erstes Crossover-Ereignis zwischen
chromosomaler DNA (oben) und homologem
Bereich auf dem Plasmid (unten). Xa, Xb:
mögliche zweite Crossover; apra, spec:
Apramycin bzw. Spectinomycinresistenzkassette.
Für die Generierung einer Knockout-Mutante ist eine zweite homologe Rekombination
(zweites Crossover) notwendig, bei der der Vektor wieder aus dem Bakterienchromosom
entfernt wird und das nicht funktionelle Allel verbleibt. Das zweite Crossover-Ereignis kann
entweder in den Bereichen von Xa oder Xb stattfinden. Nur bei Xb wird die gewünschte
Mutante mit integrierter spec erhalten. Xa führt zurück zum Wildtyp, kann aber durch
Selektion mit Spectinomycin ausgeschlossen werden. Durch Integration einer
Resistenzkassette entstehen sehr stabile Mutanten. Eventuell kommt es durch polare Effekte
bei nachgeschalteten Genen des gleichen Operons zu deren Minderexpression.
5.8.1.3 Frameshift-Mutation und Deletion
Weitere Möglichkeiten für die Erstellung
eines nicht funktionellen Allels sind die
Frameshift-Mutation des Genleserahmens
oder die Deletion eines internen Bereichs des
Gens. Eine Leserahmenverschiebung kann
herbeigeführt werden indem ein Subklon
chromosomaler DNA an einer singulär, nur im
Zielgen vorkommenden Schnittstelle geöffnet
wird. Das verwendete Enzym muss zum
Entstehen von "klebrigen Enden" führen,
deren
Nukleotidüberhänge
anschließend
aufgefüllt bzw. entfernt werden. Die
entstehenden "glatten Enden" werden religiert.
Chromosom
Xa
v
Xb
Plasmid
apra
Abb. 103: Erstes Crossover-Ereignis zwischen
chromosomaler DNA (oben) und homologem
Bereich auf dem Plasmid (unten). Xa, Xb:
mögliche Bereiche des zweiten Crossovers; apra:
Apramycinresistenzkassette; V: verändertes Gen.
234
Material und Methoden
Zur Realisierung einer Deletion wird ein internes Fragment per Restriktion und Religation aus
dem Zielgen entfernt. Wie auch bei 5.8.1.2 hat der verwendete Subklon ein Insertlänge von
3 - 7 kb, wobei das zu inaktivierende Gen in der Mitte liegt. Auf einem im Zielorganismus
nicht replikativen Vektor wird das veränderte Insert in die Streptomyces sp. eingebracht. Die
Erstcrossover-Mutante (s. Abb. 103) ist apramycinresistent und trägt noch das intakte
Wildtypallel. Erst nach dem zweiten Crossover Xb wird die gewünschte Knockout-Mutante
erhalten. Xa führt zurück zum Wildtyp.
Die Doppelcrossover-Mutanten sind stabil. Polare Effekte sind nicht zu erwarten. Die
Selektion zwischen Klonen dem zweiten Crossover-Ereignis zur Mutante (Xb) und zum
Wildtyp (Xa) ist oft zeitintensiv und unsicher (vgl. 3.2.1.2).
5.8.2 Die [safe-knock]-Strategie
5.8.2.1 Strategie der [safe-knock]-Inaktivierung
Die [safe-knock]-Strategie basiert auf der Methode zur Inaktivierung durch Integration einer
Resistenzkassette (s. 5.8.1.2). Es wurden multifunktionelle Redirect-Kassetten [150]
eingesetzt. Neben einem Resistenzgen tragen diese auch das für die intergenerische
Konjugation (s. 5.7.2) notwendige oriT sowie zwei flankierende FRT- oder loxP-sites zur
sequenzspezifischen Rekombination (s. 5.9).
Ein Schema zur Konstruktion eines Inaktivierungsplasmids mit der [safe-knock]-Strategie ist
unter 3.2.2 (Abb. 46) abgebildet. Ein detailliertes Protokoll zur Konstruktion des
Inaktivierungsplasmids sowie die Schritte vom Inaktivierungsplasmid zur bestätigten
Doppelcrossover-Mutante sind in den folgenden Kapiteln beschrieben.
Als Ausgangspunkt dient ein Subklon auf Basis eines üblichen Sequenzier- oder
Kloniervektors (mit Carbenicillinresistenzkassette), der den entsprechenden Clusterbereich
abdeckt. Eine Redirect-Kassette ersetzt im ersten Schritt mittels λ-Red vermittelter
Rekombination den ausgewählten Bereich des Clusterfragments (s. 5.8.2.3). Bei dem in die
Clustersequenz eingebrachten Selektionsmarker handelte es sich in dieser Arbeit stets um ein
Spectinomycinresistenzgen; die Vielfalt von Redirect-Kassetten [151] erlaubt auch die Wahl
anderer Marker. Im zweiten und letzten Schritt der Plasmidkonstruktion wird über Ligation in
die MCS ein weiterer für Streptomyces spp. geeigneter Selektionsmarker (in dieser Arbeit
stets apra) eingebracht, der die Vektorresistenz vermittelt (s. 5.8.2.4). Das bereits auf dem
Kloniervektor vorliegende Carbenicillinresistenzgen kann nicht zur Selektion herangezogen
werden, da Bakterien der Gattung Streptomyces natürlicherweise schon über eine
β-Lactamase verfügen [431].
Material und Methoden
235
5.8.2.2 Der geeignete Subklon
Der geeignete Subklon (vgl. 5.5.5.2) bestand aus einem 3 kb bis 8 kb langen Fragment genomischer DNA, ligiert in einen üblichen Sequenzier- / Kloniervektor. Bewährt haben sich
Vertreter der pBluescript II-Familie von Stratagene sowie pUC18 / pUC19 (s. Tab. 35). Die
Nukleotidsequenz des Vektors muss bekannt sein, damit eine ungewollte λ-Red vermittelte
Rekombination schon beim Primerdesign ausgeschlossen werden kann. Die MCS des Vektors
muss über eine HindIII-Erkennungsstelle verfügen, die gleichzeitig die einzige HindIIIErkennungsstelle des gesamten Subklons ist (vgl. 5.8.2.4). In den bisherigen Anwendungen
stellte dies kein Problem dar, da HindIII-Erkennungsstellen (Nukleotidsequenz: AAGCTT) in
G+C-reichen Genomen selten sind. So ist in keinem der vier bearbeiteten Gencluster (pok,
msc, mec, msn) eine HindIII-Schnittstelle vorhanden. Die gegen die Redirect-Kassette
auszutauschende Sequenz sollte möglichst genau in der Mitte des Inserts liegen, da die
homologe Rekombination mit größerer Wahrscheinlichkeit auf dem längeren der beiden die
Redirect-Kassette flankierenden Genclusterabschnitten stattfindet. Bei einem zu großen
Längenunterschied der beiden Abschnitte ist davon auszugehen, dass sowohl das erste als
auch das zweite Crossover-Ereignis auf der bevorzugt gleichen Seite stattfinden und so die
Bildung der Knockout-Mutante erschwert wird.
5.8.2.3 Primerdesign und λ-Red-Rekombination
Beidseitig des gegen die Kassette auszutauschenden Bereichs wurden gemäß 5.5.5.5 Primer
abgeleitet und eine PCR mit der einzubringenden Redirect-Kassette als Matrize durchgeführt.
Bei der Auswahl der Primer wurde darauf geachtet, dass das modifizierte Plasmid nach dem
Austausch eine andere Größe hat als das ursprüngliche. Dies ist für die Trennung per
Gelelektrophorese (s. u.) von Bedeutung. Nach der λ-Red-Rekombination (s. 5.5.5.5) wurden
2 - 3 große Kolonien, die die von der eingebrachten Kassette vermittelte Resistenz erworben
hatten, für die Plasmidisolierung (s. 5.5.2.1) ausgewählt und per Kontrollrestriktion
(s. 5.5.4.1) überprüft. Lagen deutlich größere Mengen des ursprünglichen Subklons im
Vergleich zum modifizierten Plasmid vor, wurde das Plasmidgemisch in E. coli XL1blue
retransformiert (s. 5.5.1.1) und mit Spectinomycin (Redirect-Kassette) selektiert. Ausgehend
von einer großen Kolonie wurde die Plasmidisolierung und Kontrollrestriktion wiederholt.
Wenn das modifizierte Plasmid im Plasmidgemisch überwiegt wurde eine präparative KpnIRestriktion angesetzt und das Fragment mit der Größe des modifizierten Plasmids über eine
präparative Gelelektrophorese (s. 5.5.4.2) isoliert.
5.8.2.4 Einfügen der Apramycinresistenzkassette
Als Marker für die Vektorresistenz wurde dass Apramycinresistenzgen gewählt. Die
Doppelcrossover-Mutante verliert den Marker des Vektors wieder und kann deshalb als Wirt
für die heterologe Expression von pOJ436 (mit apra, s. Tab. 35) basierten Cosmiden
eingesetzt werden. Das Resistenzgen mit vorgeschaltetem Promotor wurde durch HindIII-
236
Material und Methoden
Restriktion als 1,7 kb großes Fragment aus dem Vektor pHPΩ45aac (s. Tab. 35) gewonnen.
Das 1,7 kb-Fragment wurde mit dem durch λ-Red-Rekombination modifizierten,
linearisierten Plasmid zum fertigen Inaktivierungskonstrukt ligiert. Es ist möglich, direkt mit
dem Ligationsansatz CaCl2 kompetente E. coli 12567 pUZ8002 zu transformieren und als
Donor für den Plasmidtransfer in die Streptomyces sp. per intergenerischer Konjugation
einzusetzen. Die Selektion erfolgt mit Carbenicillin, Spectinomycin, Apramycin und
Kanamycin gleichzeitig. Soll auch später noch auf das Inaktivierungsplasmid zugegriffen
werden können, wird als Zwischenschritt eine Transformation von E. coli XL1blue mit
anschließender Plasmidisolierung eingefügt.
5.8.2.5 Vom Inaktivierungsplasmid zur Doppelcrossover-Mutante
Konjugation
Das Inaktivierungsplasmid wurde per intergenerischer Konjugation in den Zielstamm
eingebracht. Über homologe Rekombination im Bereich identischer Sequenzen zwischen
Plasmid und Genom entsteht die Erstcrossover-Mutante. Sie wurde mit Apramycin
(Marker des Vektors) selektiert und ihre Identität durch zusätzliche Spectinomycinresistenz
(Marker der Redirect-Kassette) sowie spezifische PCR überprüft.
Passagieren
Ohne Selektionsdruck wurde die apramycin- und spectinomycinresistente ErstcrossoverMutante über mehrere Passagen kultiviert. Ohne Antibiotikazusatz sind auch Zellen, in deren
Genom es spontan zu einem zweiten Crossover-Ereignis zur Doppelcrossover-Mutante oder
zurück zum Wildtyp kommt, überlebensfähig. Besonders effektiv ist das Passagieren, wenn
zwischen Flüssig- und Agarkultur alterniert wird. Die Flüssigkulturen wurden mit einer
Sporensuspension (vgl. Kapitel Herstellung von Sporensuspension und -dilution) inokuliert.
In der Flüssigkultur wird eine höhere Zellteilungsrate und damit eine höhere Frequenz an
Crossover-Ereignissen erreicht. Die Zellen des Myzels enthalten jedoch mehrere Kopien des
Chromosoms [432]. Zellen, die ausschließlich das veränderte Chromosom enthalten, treten
erst nach mehreren Generation auf. Sporen hingegen sind unichromosomal [432] und führen
zur direkten Trennung rekombinierter und nicht rekombinierter Chromosomen.
Herstellung von Sporensuspension und -dilution
Ausgehend von einer Agarkultur des Passagierens wurde die Sporensuspension hergestellt.
Durch Versetzen mit 4 mL HA-Flüssigmedium und anschließendem vorsichtigen Schaben mit
der Impföse gelang es, die hydrophoben Sporen in Suspension zu bringen. Zur Befreiung von
Myzelresten wurde die Sporensuspension durch sterile Watte filtriert. 100 µL der Suspension
mit 900 µL HA-Medium gemischt ergaben die ersten Dezimalverdünnung (D1). Um aus-
Material und Methoden
237
geeinzelte Kolonien zu erhalten wurden nach dem gleichen Prinzip die Dilutionen D5 - D7
hergestellt. Je 100 µL von D5 - D7 wurden auf HA-Agarplatten mit Spectinomycin
ausplattiert und drei bis vier Tage bei 28 °C inkubiert.
Selektion auf zweites Crossover
Auf den HA-Agarplatten mit Spectinomycin war nur das Wachstum von apramycin- und
spectinomycinresistenten
Erstcrossover-Mutanten
sowie
apramycinsensitiven
und
spectinomycinresistenten Doppelcrossover-Mutanten zu erwarten. Zellen mit dem Wildtypgenotyp sind unter der Einwirkung von Spectinomycin nicht vermehrungsfähig. Von einer
Platte, auf der die Sporen in Einzelkolonien gewachsen waren, wurden 88 - 352 Klone auf
Verlust der Apramycinresistenz gescreent. Dies gelang durch Überimpfen der Klone auf
gerasterte, spectinomycinhaltige HA-Agarplatten mit Apramycin und ohne Apramycin.
Klone, die auch bei wiederholter Anzucht nur auf Platten ohne Apramycin anwuchsen, sollten
den Genotyp der gewünschten Doppelcrossover-Mutante besitzen. Dies wurde mit einer
spezifischen PCR abgesichert.
5.8.2.6 Erweiterungsmöglichkeiten der [safe-knock]-Strategie
Im Genom der mittels der [safe-knock]-Strategie entstandenen Doppelcrossover-Mutanten
wird die eingebrachte Resistenzkassette von zwei FRT- oder loxP-sites flankiert. Über die seit
kurzem auch in Bakterien mit G+C-reichen Genomen etablierte sequenzspezifische
Rekombination (s. 5.9) kann der zwischenliegende Bereich nachträglich entfernt werden. Dies
kann vor allem dann von Vorteil sein, wenn der Marker der Redirect-Kassette für ein weiteres
Experiment mit der Mutante eingesetzt werden soll oder durch das eingebrachte Resistenzgen
Wirkungen auf die Transkription benachbarter Gene befürchtet werden.
238
5.9
Material und Methoden
Flp und Cre vermittelte Rekombination in Streptomyces spp.
Die Enzyme Flp und Cre sind sequenzspezifische Rekombinasen (site specific recombinases).
Sie vermitteln die DNA-Rekombination ausschließlich an einer für die jeweilige
Rekombinase spezifischen Sequenz. Die Flp-Rekombinase aus Saccharomyces cerevisiae
bewirkt die Rekombination zwischen zwei 34 bp FRT-sites und die Cre-Rekombinase aus
dem Genom des Bakteriophagen P1 erkennt 34 bp loxP-sites [433]. Die ursprünglichen FRTsites haben eine Länge von 48 bp, bestehend aus drei 13 bp langen Symmetrieelementen
getrennt von einen 8 bp Spacer bzw. einem einzelnen Basenpaar. Für ihre Funktion sind wie
auch bei den loxP-sites zwei Symmetrieelemente (= Enzym-Bindungsstellen) mit Spacer
ausreichend [434]. Die Orientierung von zwei identischen Erkennungsbereichen (2×FRT oder
2×loxP) bestimmt den ablaufenden Rekombinationstyp: zueinander hin orientiert, katalysiert
die Rekombinase eine reversible Inversion, bei gleicher Orientierung (direct repeat) eine
Exzision des zwischenliegenden Abschnitts [435]. Mit der Exzision einher geht die Bildung
eines zirkulären DNA-Fragments. Diese zirkuläre DNA kann über den gleichen Mechanismus
reintegriert werden. Es liegt demnach eine reversible Reaktion vor. Das Gleichgewicht ist
wegen der geringeren Wahrscheinlichkeit des Zusammentreffens von zirkulärem Fragment
und chromosomalem Erkennungsbereich jedoch zu Gunsten der Exzision verschoben
(s. Abb. 104).
Eine Flp-Erkennungsstelle
:
=
FRT-site
GAAGTTCCTATAC TTTCTAGA GAATAGGAACTTC
Flp-Bindungsstelle
Spacer
Exzision
Flp-Bindungsstelle
Integration
DNA
+
Abb. 104: Oben: Nukleotidsequenz der 34 bp FRT-site. Unten: Reaktionen bei Anordnung der
Erkennungsstellen in gleicher Orientierung (direct repeat). Die Exzsionsreaktion zur Entfernung des
zwischenliegenden Bereichs überwiegt im Vergleich mit der Reintegration des zirkulären Produkts.
Material und Methoden
239
Sequenzspezifische Rekombinasen werden hauptsächlich zur Generierung markerloser
Mutationen eingesetzt, ermöglichen aber auch die zeitlich kontrollierte Genexpression, den
Rekombinase vermittelten Kassettenaustausch oder die In-vivo-Exzision von Bereichen
genomischer DNA bzw. die Subklonierung dieser Bereiche [436].
Die Übertragung des Cre-loxP-Systems auf Streptomyces spp. wurde vor kurzem von
Khodakaramian et al. (2006) [437] demonstriert. Die Expression des cre-Gens aus dem
Bakteriophagen P1 in Streptomyces coelicolor mit hinreichender Effektivität gelang jedoch
nur im Zustand einer transienten Phageninfektion, was die Anwendung kompliziert und
unpraktikabel erscheinen lässt. Der hohe A+T-Anteil der Nukleotidsequenz wird für die nur
geringe Expression des cre-Gens in Streptomyces spp. verantwortlich gemacht. Im Umfeld
G+C-reicher Genome werden Codons, die nur aus A und T bestehen, aus Mangel an
entsprechender t-RNA vermindert translatiert und führen zu einer Minderexpression des
codierten Proteins [285;438]. Eine innovative Lösung fand Dr. A. Luzhetskyy (AK
Bechthold), der die Nukleotidsequenz von Rekombinasegenen an den üblichen Codongebrauch von Streptomyces spp. [70] unter Beibehaltung der Aminosäuresequenz des
ursprünglichen Gens anpasste [155]. Das so entstandene synthetische Gen der FlpRekombinase (flp(a)) wurde in der vorliegenden Arbeit eingesetzt.
5.9.1.1 Flp-Rekombination zur Exzision eines DNA-Bereichs
Zur Exzision eines Sequenzbereiches verbunden mit dessen Zirkularisierung müssen beide
FRT-sites diesen DNA-Abschnitt als direct repeats in gleicher Orientierung flankieren
(s. Abb. 104). Die Redirect-Kassetten des John Innes Centre erfüllen diese Voraussetzungen
(vgl. 5.5.5.5). Zur gezielten Geninaktivierung werden die Redirect-Kassetten anstelle des entsprechenden Gens in das Chromosom der Streptomyces sp. eingebracht (s. 5.8.2). Durch die
Kassette im Genom kann es jedoch auch zur Beeinflussung der Transkription benachbarter
Gene kommen. Eine sich an die [safe-knock]-Strategie anschließende Exzision der Kassette
mittels Flp-Rekombination kann diese polaren Effekte verhindern. Nach der Rekombination
bleiben von der Redirect-Kassette nur eine der FRT-sites, sowie die außerhalb der FRT-sites
gelegenen
Bereiche
(P1,
P2,
bei
pIJ785Spec
zusätzlich
tipAp)
zurück
(s. Abb. 105). Zur Expression des synthetischen Gens der Flp-Rekombinase flp(a) wurde das
in Streptomyces spp. replikative Plasmid pUWLhyg-FLP konstruiert (s. 5.4.2.3).
240
Material und Methoden
Flp-Rekombination einer Redirect-Kassette
spec
P2
P1
FRT
oriT
FRT
FRT
P2
P1
Legende
P1/P2: Primerbindungsstellen
FRT: Erkennungsstelle der Flp-Rekombinase
oriT:
spec:
origin of transfer von RK2
Spectinomycinresistenzgen
Abb. 105: Effekt der Flp-Rekombinase auf eine ins Genom integrierte Redirect-Kassette.
5.10 Methoden der Biochemie
5.10.1 Glykosylierungsassay
Mit 10 mL einer 3-Tageskultur von Saccharothrix espanaensis in TSB-Flüssigmedium oder
10 mL einer Dauerkultur in 25 % Saccharose wurden 100 mL NL111- Flüssigmedium
angeimpft und für 20 h inkubiert (28 °C, 180 rpm). 20 - 40 mL der Kultur wurden durch
Zentrifugation pelletiert (4 °C, 5000rpm, 10 min), im gleichen Volumen Puffer (50 mM TrisHCl, pH 7,2) resuspendiert und wieder pelletiert. Der Waschvorgang in der Pufferlösung
wurde ein zweites Mal wiederholt und das Pellet in 5 mL - 10 mL Puffer aufgenommen.
Diese Suspensionen wurde zwei- bis dreimal bei einem Druck von ca. 14000 psi durch die
French Pressure Cell Press (s. Tab. 18) geleitet und das entstandene Lysat durch
Zentrifugation (4 °C, 12000 rpm, 10 min) von intakten Zellen und Zelltrümmern befreit. Je
Ansatz wurde 1 mL des klaren Überstandes eingesetzt. Bei der Variante des Assays mit
aufgeschlossenen Zellen wurde das Lysat ohne Zentrifugation verwendet. Die Testsubstanzen
lagen als 12,5 mg/mL-Stammlösungen in DMSO vor. Pro Ansatz wurden 8 µL (= 100 µg)
zupipettiert und invertiert. Nach 30minütiger Inkubation bei 28 °C im Brutschrank stoppte die
Extraktion mit 1 mL Ethylacetat die Reaktion. Die Extrakte wurden per LC/MS analysiert.
Zur Erfassung sehr hydrophiler Derivate wurden nach der Inkubationszeit 100 µL aus dem
Reaktionsgemisch per LC/MS analysiert.
Material und Methoden
241
5.10.2 Proteinanalytik mit SDS-PAGE
Proteinhaltige Ganzzellextrakte aus Saccharothrix espanaensis wurden mit denaturierender,
diskontinuierlicher Polyacrylamidgelelektrophorese (SDS-PAGE) analysiert. Die Proteinauftrennung erfolgte in einer "Mini-PROTEAN 3" Elektrophoresezelle (s. Tab. 18) über
45 min bei 200 V (Gelgröße: 73×80×0,5 mm) nach Angaben des Herstellers. Alle
eingesetzten Lösungen sind unter 5.2.1.1 aufgelistet. Die Unterteilung des Gels in ein
Sammel- und ein Trenngel diente einer erhöhten Bandenschärfe und damit einer verbesserten
Auflösung [439]. Zunächst wurde ein Trenngel auf etwa 80 % der Gelhöhe gegossen und mit
Isopropanol überschichtet. Nach der Polymerisation wurde die überstehende Flüssigkeit
entfernt, das Sammelgel auf das Trenngel gegossen und ein Taschenformer eingesetzt. Vor
dem Auftragen der Probelösungen wurden diese in Probenpuffer aufgenommen und 5 min bei
95 °C inkubiert. Als Molekulargewichtsstandard diente das „Low Molecular Weight
Calibration Kit for SDS Electrophoresis“ von Amersham mit Phosphorylase b (97 kDa),
Albumin (66 kDa), Ovalbumin (45 kDa), Carboanhydrase (30 kDa), Trypsininhibitor
(20,1 kDa) und α-Lactalbumin (14,4 kDa). Das vom Sammelgel befreite Trenngel wurde nach
der Elektrophorese 15 - 20 min in Coomassielösung gefärbt und anschließend in
Entfärbelösung bis zum gewünschten Grad entfärbt. Vor dem Trocknen wurden die Gele in
10 %igem (V/V) Glycerol über Nacht aufbewahrt, dann zwischen zwei befeuchteten
Cellophanfolien blasenfrei in einen Geltrocknungsrahmen eingespannt und bei
Raumtemperatur getrocknet.
5.11 Analytik und Isolierung niedermolekularer Naturstoffe
5.11.1
Naturstoffextraktion aus Bakterienkulturen
5.11.1.1 Extraktion mit Ethylacetat
Nach Abschluss der Inkubationszeit wurde für die Extraktion niedermolekularer Sekundärstoffe aus 100 mL-Standardkulturen oder Biotransformationskulturen mit zugefüttertem
Fremdstoff (s. 5.3.1.4) der pH-Wert der Kulturbrühe mit 1 M HCl-Lösung auf 7 eingestellt.
Auch wenn die Wasserlöslichkeit einiger der untersuchten Naturstoffe (zum Beispiel
α-Hydroxyanthrachinone) mit der weiteren Absenkung des pH-Wertes abnimmt, was mit
einer Effektivitätssteigerung der Extraktion mit Ethylacetat verbunden ist, wurde in Hinsicht
auf die Stabilität entstandener Glykoside ein neutraler pH-Wert gewählt. Ausnahmen, wie die
Extraktion der Novobiocinsäurederivate, sind im Ergebnisteil beschrieben.
242
Material und Methoden
Durch Zentrifugation (RT, 5000 rpm, 10 min) wurden Myzel und Fermentationsüberstand
getrennt. Der Überstand wurde dreimal mit 100 mL Ethylacetat ausgeschüttelt, das Myzel mit
40 mL Ethylacetat versetzt und über einen Zeitraum von 30 min je nach Gefäß regelmäßig
gerührt oder gevortext. Bei den farbigen Anthrachinonen ließ sich der Aufschluss der Zellen
gut durch die nach 5 - 10 min eintretende Färbung des Lösungsmittels nachvollziehen. Durch
Dekantieren wurde der Extrakt vom Myzel getrennt und mit den Ethylacetatphasen der
Extraktion des Überstandes vereinigt. Über wasserfreiem Na2SO4 wurde der Extrakt für
mindestens 15 min getrocknet und das Lösungsmittel anschließend im Vakuum mit einem
Rotationsverdampfer bei 40 °C entfernt.
Der so gewonnene, trockene Rohextrakt wurde für die Analysen des Kapitels 3.3 in 4 mL
Methanol aufgenommen, durch einen Filter mit einem Porendurchmesser von 0,22 µm filtriert
und mit einem Injektionsvolumen von 60 µL per LC/MS analysiert. Für die anderen Analysen
wurden die Volumina an die Löslichkeit und Absorptionskoeffizienten der Substanzen
angepasst. Kulturvolumina über 100 mL wurden unter Berücksichtigung der angegebenen
Verhältnisse extrahiert.
5.11.1.2 Anreicherung durch Festphasenextraktion
Die Festphasenextraktion (SPE) erlaubt die Anreicherung von Substanzen mit definierten
chemischen oder physikalischen Eigenschaften aus einer komplexen Matrix und findet
hauptsächlich Verwendung bei der Untersuchung von Körperflüssigkeiten.
In der vorliegenden Arbeit wurde die SPE mit einer 10g Sep-Pak C18-Kartusche (Waters) zur
Fraktionierung eines Ethylacetatrohextrakts (s. 5.11.1.1) zur präparativen Isolierung eines
Biotransformationsprodukts von Alizarin eingesetzt (s. 3.1.1.1). Vor der Aufgabe des in
Wasser suspendierten Rohextrakts wurde die Kartusche ausgehend von 100 % Methanol
stufenweise auf 20 % Methanol in Wasser konditioniert. Elution und Konditionierung
erfolgten mit Unterdruck bei ca. 600 mbar.
5.11.2
Dünnschichtchromatographie (DC)
Für die analytische Dünnschichtchromatographie wurden DC-Alufolien Kieselgel 60 F254
(Monitoring der Darstellung und Aufreinigung von Novobiocinsäure, s. 5.12) und Kieselgel
60 RP-18 F254s (Vorversuche für die RP-Säulenchromatographie) der Firma Merck eingesetzt.
Die Visualisierung der Analyten erfolgte durch Fluoreszenzlöschung (254 nm) und
Fluoreszenz (366 nm).
243
Material und Methoden
5.11.3 Säulenchromatographie
Die Säulenchromatographie erfolgte in Glassäulen an LiChroprep RP-18 (25 µm - 40 µm) der
Firma Merck mit einem Methanol-Wasser-Gradienten. Es wurde die Methode der FlashChromatographie [440] angewendet, wobei das Fließmittel durch den mit einen luftgefüllten
Ballon aufgebauten Druck getrieben wurde.
Die Gelfiltration an Sephadex LH-20 (Amersham) und dem Fließmittel Methanol erfolgte
ohne Überdruck in Glassäulen.
5.11.4 Analytische HPLC
Die Analytische HPLC-Anlage von Waters (s. Tab. 18), ausgestattet mit einer Waters
XBridge C18-Säule (100 mm×4,6 mm, 3,5 µm) mit entsprechender Vorsäule (20 mm×4,6 mm,
3,5 µm), kam zur Aufreinigung der durch Biotransformation entstandenen Novobiocinsäurederivate (Tab. 51, s. 3.1.6), Quantifizierung der Polyketomycinproduktion (Tab. 50, s. 3.2.5)
und zur Reinheitskontrolle säulenchromatographisch gewonnener Fraktionen zum Einsatz.
Der Thermostat des Säulenofens wurde manuell auf 30 °C eingestellt, alle anderen
Funktionen der Analage wurden mit dem PC-Programm Empower 2002 gesteuert.
Anwendungsspezifische Fließmittelgradienten mit linearen Übergängen sind im Folgenden
tabellarisch aufgelistet.
Tab. 50: Fließmittelgradient der Methode pok, analytische HPLC Waters 515. Laufmittel A: H2O (0,5 % (V/V)
Essigsäure), Laufmittel B: Acetonitril (0,5 % (V/V) Essigsäure), Flussrate 0,7 mL/min.
Zeit [min]
0
5
20
23
27
30
32
Laufmittel A [%]
65
65
30
5
5
65
65
Laufmittel B [%]
35
35
70
95
95
35
35
Tab. 51: Fließmittelgradient der Methode novaprep, analytische HPLC Waters 515. Laufmittel A: H2O
(0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril (0,5 % (V/V) Essigsäure), Flussrate 1,2 mL/min.
Zeit [min]
0
22
29
29,1
32
32,1
35
Laufmittel A [%]
75
75
40
5
5
75
75
Laufmittel B [%]
25
25
60
95
95
25
25
244
Material und Methoden
5.11.5 Präparative HPLC
Die Isolierung von AliPro1 erfolgte mit einer präparativen HPLC von Waters (s. Tab. 18) mit
Waters XTerra Prep MS C18-Säule (150 mm×7,8 mm, 5 µm) und entsprechender Vorsäule
(10 mm×7,8 mm, 5 µm). Die Probenaufgabe musste manuell vorgenommen werden; bei der
Fraktionierung des Eluats half der zeitgesteuerter Fraktionssammler. Die quaternäre Pumpe
und der UV/VIS-Detektor konnten über die Software Empower 2002 gesteuert werden.
Tab. 52: Gradient der Methode alipro1, Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril
(0,5 % (V/V) Essigsäure), Flussrate 2,5 mL/min, Gradient mit linearen Übergängen, Detektion bei 440 nm.
Zeit [min]
0
3
26
30
32
35
Laufmittel A [%]
75
75
60
5
75
75
Laufmittel B [%]
25
25
40
95
25
25
5.11.6 HPLC/MS Analytik
LC/MS-Messungen wurden mit einem Agilent 1100 System (s. Tab. 18) durchgeführt, das
über eine LC-DAD-MSD-Kopplung verfügt. Der single quadrupol-Massendetektor (MSD)
wurde wahlweise mit einer ESI- (electrospray ionization) oder APCI- (atmospheric pressure
chemical ionization) Quelle bestückt. Die Anlage wurde mit dem PC-Programm ChemStation
Rev. A.09.03 oder A.10.02 kontrolliert. Es konnte zwischen der analytischen Säule Zorbax
Eclipse XDB-C8 (150 mm×4,6 mm, 5 µm) mit Vorsäule (12,5 mm×4,6 mm, 5 µm) und der
präparativen Säule Zorbax SB-C18 (150 mm×9,6 mm, 5 µm) mit Vorsäule (50×9,4 mm, 5 µm)
gewählt werden. Die präparative Säule kam nur zur Aufreinigung von Novobiocinsäurederivaten zum Einsatz (Methode: nova11prep, s. Tab. 55). Ein zwischen DAD und MSD
geschalteter Splitter ermöglichte die MSD abhängige Steuerung des Fraktionssammlers bei
nur minimalem Eluatverlust. Die typischen Parameter der Ionisierungsquellen waren:
ESI und APCI: drying gas flow 12 L/min, drying gas temperature 350 °C, nebulizer pressure
35 psig, capillary voltage ± 3000 V; zusätzlich bei APCI: vaporizer temperature 350 °C,
corona +4,0 µA / −15 µA. Methodenspezifische Parameter sind im Folgenden zusammen mit
den Fließmittelgradienten aufgelistet. Alle verwendeten Gradienten hatten lineare Übergänge.
245
Material und Methoden
Tab. 53: Gradient der Methode mens03 (Analytik von Sekundärstoffen aus S. sp. Gö C4/4), Laufmittel A: H2O
(0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril, Flussrate 0,7 mL/min, Säulenofen: 30 °C, Plot von
Chromatogrammen bei den Absorptionswellenlängen 230 nm (Ref. 400 nm), 254 nm (Ref. 400 nm), 330 nm
(Ref. 500 nm), 400 nm (Ref. 600 nm), erfasster Bereich: 200 nm - 600 nm, bevorzugte Ionisierungsquelle: ESI,
Massenbereich: 200 - 1000.
Zeit [min]
0
25
31
35
38
45
Laufmittel A [%]
90
45
5
5
90
90
Laufmittel B [%]
10
55
95
95
10
10
Tab. 54: Gradient der Methode antqui (zur Analytik von Xenobiotikabiotransformationsprodukten aus Actinomycetales-Arten sowie mit den Parametern antqui04 zur Analytik von Polyketomycin und seinen Derivaten),
Laufmittel A: H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril, Flussrate 0,7 mL/min, Säulenofen:
30 °C. Substanzabhängig wurde der DAD-Detektor auf unterschiedliche Absorptionswellenlängen eingestellt
und der Massenbereich des MSD angepasst:
antqui01: 254 nm (Ref. 360 nm), 254 nm (Ref. 580 nm), 360 nm (Ref. 580 nm), 430 nm (Ref. 600 nm), 400 nm
(Ref. 600 nm), erfasster Bereich: 220 nm - 600 nm, bevorzugte Ionisierung: ESI, Massenbereich: 100 - 1100;
antqui02: 254 nm (Ref. 360 nm), 254 nm (Ref. 750 nm), 360 nm (Ref. 750 nm), 550 nm (Ref. 750 nm), 600 nm
(Ref. 800 nm), erfasster Bereich: 220 nm - 800 nm, bevorzugte Ionisierung: ESI, Massenbereich: 100 - 1100;
antqui03: 254 nm (Ref. 360 nm), 300 nm (Ref. 580 nm), 330 nm (Ref. 580 nm), 360 nm (Ref. 600 nm), 400 nm
(Ref. 600 nm), erfasster Bereich: 220 nm - 600 nm, bevorzugte Ionisierung: ESI, Massenbereich: 100 - 1100;
antqui04: 254 nm (Ref. 400 nm), 320 nm (Ref. 500 nm), 430 nm (Ref. 600 nm), erfasster Bereich: 220 nm
- 600 nm, bevorzugte Ionisierung: APCI, Massenbereich: 200 - 1000.
Zeit [min]
0
9
16
20
24
29
30
35
Laufmittel A [%]
80
67
50
30
5
5
80
80
Laufmittel B [%]
20
33
50
70
95
95
20
20
Tab. 55: Gradient der Methode nova11 / nova11prep (Analytik von Novobiocin / -Derivaten), Laufmittel A:
H2O (0,5 % (V/V) Essigsäure), Laufmittel B: Acetonitril, Flussrate 0,7 mL/min (nova11, analytische Säule) oder
2,5 mL/min (nova11prep, präparative Säule), Säulenofen: 30 °C, Plot von Chromatogrammen bei
den Absorptionswellenlängen 254 nm (Ref. 500 nm), 327 nm (Ref. 600 nm), 330 nm (Ref. 600 nm), erfasster
Bereich: 200 nm - 600 nm, bevorzugte Ionisierungsquelle: ESI, Massenbereich: 200 - 1000.
Zeit [min]
0
30
33
35
38
45
Laufmittel A [%]
75
35
5
5
75
75
Laufmittel B [%]
25
65
95
95
25
25
246
Material und Methoden
5.11.7 Bestimmung der exakten Masse
Aus der exakten Massenbestimmung mit einer Genauigkeit auf einige Nachkommastellen
können Vorschläge für die Elementarzusammensetzung eines Ions abgeleitet werden. Die
exakten Massen wurden im Rahmen einer Kooperation mit dem AK Bode (Universität des
Saarlandes, Saarbrücken) von Eva Luxenburger mit einem ThermoScientific LTQ-OrbitrapSystem bestimmt. Die LTQ Orbitrap ist ein Hybrid-MS- und MSn-System, bestehend aus
einer linearen Ionenfalle und einer elektrostatischen Ionenfalle, der Orbitrap, als MSAnalysator [441]. Das Hybrid-Massenspektrometer wurde in einer LC/MS-Anordnung mit
ESI-Quelle eingesetzt.
5.11.8 NMR-Spektren
NMR-Spektren wurden mit einem Bruker Avance DRX 400 Spektrometer aufgenommen
(400 MHz für 1H, 100 MHz für 13C). Die Probe AliPro1 (s. 3.1.1.1) wurde zusätzlich mit
einem JEOL Alpha Spektrometer gleicher Frequenz vermessen. Es wurden 1D und 2D NMR
Experimente durchgeführt: 1H, 13C, 1H-1H-correlated spectroscopy (COSY), 1H-1H-total
correlated spectroscopy (TOCSY), heteronuclear single-quantum coherence (HSQC),
heteronuclear multiple-bond correlation (HMBC), nuclear Overhauser enhancement
spectroscopy (NOESY) und rotating frame Overhauser enhancement spectroscopy (ROESY).
Die Spektren wurden auf das Signal des Lösungsmittels kalibriert. Das 1H-Signal von DMSO
wurde auf 2,50 ppm gesetzt. Für das 13C-Signal sind abweichende Werte zu finden. Das
Programm MestreC 4.8.6 setzt das Signal bei 39,43 ppm, die Version MestreNova 5.2.2 bei
39,51 ppm, in der Literatur wird vor allem der Wert 39,50 ppm verwendet. Die Interpretation
aller Spektren mit Ausnahme der Novobiocinsäurederivate wurde mit der Version MestreC
4.8.6 und einer Festlegung des Signals auf 39,43 ppm durchgeführt. Für die Spektren der
Novobiocinsäurederivate wurde die Verschiebung auf 39,50 ppm gesetzt. Multiplizitäten:
s (Singulett), t (Triplett), q (Quartett), m (Multiplett), br (breit).
5.11.9 Circulardichroismus
Der Circulardichroismus (CD) quantifiziert das unterschiedliche Absorptionsvermögen
chiraler Moleküle von rechts- und linkszirkular polarisiertem Licht. ∆A = AL - AR wird als
Funktion der Wellenlänge im Diagramm aufgetragen. Vom CD-Spektrum kann nicht direkt
auf die Struktur geschlossen werden. Durch den Vergleich mit dem CD-Spektrum einer
bekannten Struktur oder mit berechneten CD-Spektren können Hinweise zur absoluten
Konfiguration des Moleküls gewonnen werden. Zwei Enantiomere ergeben Messwerte
unterschiedlichen Vorzeichens. Der Kurvenverlauf fällt spiegelbildlich aus.
Material und Methoden
247
In Quarzglasküvetten einer Länge von 0,5 cm wurden die Untersuchungslösungen im
Spektralpolarimeter J-810 (s. Tab. 18) mit folgenden Einstellungen vermessen: Empfindlichkeit: Standard, Messgeschwindigkeit: 100 nm/min, data pitch: 1 nm, Bandbreite: 2 nm,
response: 2 s, Akkumulation: 3.
5.11.10 Gefriertrocknung
Zur Gewinnung niedermolekularer Naturstoffe aus wasserhaltigen Fraktionen der Chromatographie wurde die Gefriertrocknung eingesetzt. Nach Entzug der bei 100 mbar und 40 °C am
Rotationsverdampfer flüchtigen Lösungsmittel wurde die Probe bei −85 °C gefroren, mit
durchlöcherter Alufolie verschlossen und 16 h - 48 h mit einem Gefriertrockner der Firma
Christ (s. Tab. 18) getrocknet. Kondensatortemperatur −85 °C, Zieldruck 0,011 mbar.
5.12 Darstellung von Novobiocinsäure
Gemäß Hinman et al. (1957) [125] wurde Novobiocinsäure durch Spaltung des kommerziell
erhältlichen Antibiotikums Novobiocin-Na gewonnen.
Chemikalien und Apparatur
Tab. 56: Chemikalien für die Darstellung von Novobiocinsäure.
4g
0,8 mL
40 mL
(6,3 mmol)
(11,3 mmol)*
Novobiocin-Natrium (Mr: 634,61)
Acetylchlorid (ρ20 °C: 1,104 g/mL, Mr: 78,50)
Ethanol (destilliert, über Molekularsieb 4 Å getrocknet)
* Hinman et al. (1957) gehen von Novobiocin aus. Zur Freisetzung von Novobiocin aus seinem Mononatriumsalz wird ein äquimolarer Anteil an HCl nötig. Die Menge an Acetylchlorid wurde deshalb um 6,3 mmol erhöht.
Die Reaktion (s. Abb. 38) wurde in einem 100 mL Dreihalskolben mit Rührfisch auf einem
Magnetrührer mit Heizung, Thermostat und mobilem Thermometer durchgeführt. Ein
DrySyn-Aufsatz (Heidolph) mit Thermometersteckplatz sorgte für die Wärmeübertragung.
Der auf den Kolben aufgesteckte Rückflusskühler wurde über ein Gasverteilersystem
wahlweise an Vakuum oder Stickstoff angeschlossen. Die beiden weiteren Anschlüsse des
Kolbens wurden mit einem Kunststoffseptum bzw. einem Stopfen verschlossen.
Trocknen der Apparatur
Unter Vakuum wurde die Apparatur mit einer Heißluftpistole an allen Stellen aufgeheizt. Die
Vakuumpumpe wurde daraufhin von der Apparatur getrennt und ein sanfter Stickstoffstrom
über den Rückflusskühler zugeleitet. Nachdem die Apparatur mit Stickstoff gefüllt war,
wurde der Trocknungsvorgang wiederholt. Insgesamt wurde drei Mal getrocknet.
248
Material und Methoden
Reaktionsablauf
Ethanol und Novobiocin-Na wurden über einen Pulvertrichter in das Reaktionsgefäß gegeben.
Bei verschlossener Apparatur und leichtem N2-Überdruck wurde der Thermostat so
eingestellt, dass sich ein leichter Rückfluss einstellte (85 °C). Tropfenweise wurden über
einen Zeitraum von 15 min 0,8 mL Acetylchlorid mit einer Spritze über das Septum in die
Reaktion gegeben. Beim Eintropfen kam es zur Schaumbildung an der Eintropfstelle und ein
weißes Gas (HCl) war unterhalb der Kühlschlange zu bemerken. Nach 30 min wurden wenige
µL aus dem Reaktionsansatz entnommen, mit Ethylacetat verdünnt und per Dünnschichtchromatographie (Kieselgel 60 F254, Ethylacetat:Cyclohexan 1:1) im Vergleich zu in 0,1 M
HCl gelöstem Novobiocin-Na untersucht. Der Beginn einer Reaktion konnte durch Auftreten
zusätzlicher Punkte bei der Probe aus der Reaktion festgestellt werden. Nach 2 h wurde die
Reaktion beendet. Nach dem Abkühlen des Reaktionsgefäßes auf Eis konnte durch Zugabe
von 120 mL Wasser ein weißer Niederschlag mit schwachem Gelbstich ausgefällt werden.
Durch Vakuumfiltration über eine Glasfritte (Por. 4) wurde der Niederschlag abgetrennt.
Aufreinigung und Analyse
Durch Rekristallisation aus Aceton und anschließende 424-Transfer-Gegenstromchromatographie mit einem Lösungsmittelsystem aus Ethylacetat, Ethanol, Wasser und
Cyclohexan konnten Hinman et al. (1957) Novobiocinsäure in 68 %iger Ausbeute gewinnen.
1.) Kristallisation aus Aceton
Der Niederschlag wurde in einigen Milliliter Aceton suspendiert und unter Rückfluss auf
70 °C erhitzt. Schrittweise wurden insgesamt 50 mL Aceton hinzugefügt. Der Niederschlag
löste sich jedoch nicht vollständig auf. Der Kolben wurde zunächst bei Raumtemperatur, dann
über Nacht im Kühlschrank inkubiert. Über feinen weißen Kristallen stand am nächsten
Morgen ein gelber Überstand, der über Vakuumfiltration abgetrennt wurde. Nach Trocknung
im Vakuum wurden 1,64 g Präzipitat erhalten. Die vergleichende LC/MS-Analyse (Methode:
nova11, s. Tab. 55) von Präzipitat und Filtrat zeigte die Effektivität der Rekristallisation zur
Abtrennung der Verunreinigungen Novobiocin und Cyclonovobiocinsäure.
2.) Flash-Chromatographie über Silicagel
Dünnschichtchromatographisch war zusätzlich zu Novobiocinsäure eine weitere Substanz
durch Fluoreszenzlöschung bei 254 nm detektierbar. Als folgender Aufreinigungsschritt
wurde deshalb eine Säulenchromatographie über Silicagel gewählt (Fließmittel: Cyclohexan
Ethylacetat, 60:40). Die beiden Stoffe konnten nicht getrennt werden. Auf der Säule blieb
jedoch eine gelbe Substanz zurück.
3.) Kristallisation aus Aceton
Nach wiederholter Rekristallisation konnten 1,15 g Novobiocinsäure gewonnen werden, was
einer Ausbeute von 46 % entspricht. Mit 1H- und COSY-NMR-Experimenten (in DMSO-d6)
wurde die erhaltene Substanz als Novobiocinsäure identifiziert. Unter anderem über das
Material und Methoden
249
charakteristische Triplett von 8-H, das Signal der Methylgruppenprotonen an C-10 / C-11 mit
einem sechs Protonen entsprechenden Integral sowie die Präsenz von vier Protonensignalen,
die von mit Heteroatomen verbundenen Atomen stammen (bei δH = 9 - 12 ppm), konnte die
gewonnene Novobiocinsäure klar von ihrem Konstitutionsisomer Cyclonovobiocinsäure
abgegrenzt werden.
5.13 Testung von Naturstoffen auf antimikrobielle Aktivität
Zur Bestimmung der antimikrobiellen Aktivität der neuen Novobiocinsäurederivate wurden
Hemmhoftests mit dem Gram+ Bakterium Bacillus subtilis (ATCC6051) durchgeführt.
Herstellung der Test-Agarplatten
12 mL einer Bacillus subtilis-Sporensuspension (s. 5.3.1.3) wurden auf Eis aufgetaut, zu
500 mL 40 - 45 °C warmem DM-Festmedium (s. Tab. 25) gegeben und zu Platten gegossen.
Die Lagerung erfolgte bei 8 °C. Die Platten waren so mehrere Monate haltbar.
Hemmhoftest
Je 10 µL einer methanolischen Lösung der Testsubstanzen wurden auf ein Filterrondell
(MN 827 ATD, Ø = 6 mm, Macherey & Nagel, Düren) pipettiert. Als Negativkontrolle wurde
ein Filter mit 10 µL Methanol, als Vergleich ein Filter mit methanolischer Lösung von
Novobiocin-Na eingesetzt. Die im laminaren Luftstrom der Sterilwerkbank getrockneten
Filter wurden mit einer sterilisierten Pinzette auf die Agaroberfläche der Testplatte gesetzt
und diese bei 37 °C für 18 h inkubiert. Die Größe der um die Filter vom Wachstum
ausgesparten Hemmhöfe erlaubt eine vergleichende Beurteilung der antimikrobiellen
Aktivität der Testsubstanzen gegen den eingesetzten Stamm.
250
Material und Methoden
5.14 PC-Programme und Internetservices
Tab. 57: PC-Programme und Internetservices.
Name
Artemis v9
BCM sequence utilities
BioEdit
BLAST (basic local
alignment search tool)
CAZy-Datenbank
ChemStation
Rev. A.09.03 / A.10.02
Chromas 2.3
Clustal W
clusters of orthologous
groups (COGs)
conserved domain search
(NCBI)
DNASTAR Lasergene V7
Empower 2002
MestreC 4.8.6
MestreNova 5.2.2
Pfam (Protein Families)
SciEd CloneManager Suite
Version 7
SciFinder Scholar
Spectral Database for
Organic Compounds
(SDBS)
Beschreibung, Referenz
ORF-Lokalisierung in Nukleotidsequenzen [442]
Prozessierung von Nukleotidsequenzen,
http://searchlauncher.bcm.tmc.edu/seq-util/seq-util.html
Sequenzalignment und Editierung [443]
Datenbankrecherchen nach Sequenzhomologien auf
Nukleotid- oder Aminosäurenebene [444],
http://www.ncbi.nlm.nih.gov/blast/index.html
Datenbank von Enzymen, die Reaktionen von
Kohlenhydraten katalysieren [324], http://www.cazy.org/
Steuerung der Agilent 1100 Series LC/MS-Anlage und
Datenauswertung, Agilent Technologies, Santa Clara, USA
Auswertung von Fluoreszenzchromatogrammen der DNASequenzierung, Technelysium Pty Ltd., Tewantin, Australien
Multiples Sequenzalignment [445]
Motivsuche nach konservierten Domänen in Proteinen [446],
http://www.ncbi.nlm.nih.gov/COG/new/
Metasuchmaschine nach konservierten Domänen in
Proteinen, die auf die Datenbanken SMART, Pfam und COGs
zugreift [217],
http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml
Suite zur Bearbeitung von DNA-Sequenzen, enthält das
Programm Seqman zur Aufstellung von Contigs, DNASTAR,
Madison, USA
Steuerung der HPLC-Systeme von Waters und
Datenauswertung, Waters, Milford, USA
Prozessieren und Auswertung von NMR-Daten, Mestrelab
Research, Santiago de Compostela, Spanien
Suche nach konservierten Domänen in Proteinen und
Zuordnung zu Proteinfamilien, http://pfam.sanger.ac.uk
In-silico-Klonierungen und weitere Funktionen,
Scientific & Educational Software, Durham, NC, USA
Recherche in der CAS-Datenbank, Chemical Abstracts
Service, Columbus, USA
Öffentliche Spektrendatenbank (NMR, MS, IR)
des National Institute of Advanced Industrial Science and
Technology (AIST), Japan,
http://riodb01.ibase.aist.go.jp/sdbs/cgibin/direct_frame_top.cgi
Literaturverzeichnis
6
251
Literaturverzeichnis
1.
Klockgether-Radke AP: F. W. Sertürner und die Entdeckung des Morphins. 200
Jahre Schmerztherapie mit Alkaloiden. Anästhesiologie Intensivmedizin
Notfallmedizin Schmerztherapie 2002, 37:244-249.
2.
Floss HG: Klassische Methoden der Biosyntheseaufklärung. Seminar, AlbertLudwigs-Universität Freiburg im Breisgau 2008.
3.
Zähner H, Anke T: Evolution and secondary pathways. In Differentiation and
secondary metabolism in fungi. Edited by Bennet JW, Ciegler E. CRC Press, New York
1983:153-171.
4.
Hunnius Pharmazeutisches Wörterbuch. Edited by Burger A, Wachter H. Walter de
Gruyter, Berlin 1997.
5.
Roche Medizin-Lexikon, 5. Auflage. Urban & Fischer, Hoffmann-La Roche S.A.,
Basel 2003.
6.
Lewis' Dictionary of Toxicology. Edited by Lewis RA. CRC Press, New York 1998.
7.
Koolmann J, Röhm K-H: Taschenatlas der Biochemie, 3. Auflage. Thieme-Verlag,
Stuttgart 2002.
8.
Bringmann G, Noll TF, Gulder TAM, Grune M, Dreyer M, Wilde C, Pankewitz F,
Hilker M, Payne GD, Jones AL, Goodfellow M, Fiedler HP: Different polyketide
folding modes converge to an identical molecular architecture. Nature Chemical
Biology 2006, 2:429-433.
9.
Müller R: Don't classify polyketide synthases. Chemistry & Biology 2004, 11:4-6.
10.
Bokkenheuser VD, Shackleton CHL, Winter J: Hydrolysis of Dietary Flavonoid
Glycosides by Strains of Intestinal Bacteroides from Humans. Biochemical Journal
1987, 248:953-956.
11.
Das S, Rosazza JPN: Microbial and enzymatic transformations of flavonoids.
Journal of Natural Products 2006, 69:499-508.
12.
Baur JA, Sinclair DA: Therapeutic potential of resveratrol: the in vivo evidence.
Nature Reviews Drug Discovery 2006, 5:493-506.
13.
Web of Science, Datenbankabfrage. http://apps.isiknowledge.com 2008.
14.
Harikumar KB, Aggarwal BB: Resveratrol - a multitargeted agent for age-associated
chronic diseases. Cell Cycle 2008, 7:1020-1035.
15. Pecere T, Gazzola MV, Mucignat C, Parolin C, Dalla Vecchia F, Cavaggioni A, Basso
G, Diaspro A, Salvato B, Carli M, Palu G: Aloe-emodin is a new type of anticancer
agent with selective activity against neuroectodermal tumors. Cancer Research
2000, 60:2800-2804.
252
Literaturverzeichnis
16.
Thomas R: A biosynthetic classification of fungal and streptomycete fused-ring
aromatic polyketides. ChemBioChem 2001, 2:612-627.
17.
Crawford JM, Thomas PM, Scheerer JR, Vagstad AL, Kelleher NL, Townsend CA:
Deconstruction of iterative multidomain polyketide synthase function. Science
2008, 320:243-246.
18.
Abe I, Oguro S, Utsumi Y, Sano Y, Noguchi H: Engineered biosynthesis of plant
polyketides: chain length control in an octaketide-producing plant type III
polyketide synthase. Journal of the American Chemical Society 2005, 127:1270912716.
19.
Pankewitz F: Unusual natural products in insects: molecular and chemical analysis
of anthraquinone origin in Galerucini leaf beetles. Dissertation Freie Universität
Berlin 2006.
20.
Staunton J, Weissman KJ: Polyketide biosynthesis: a millennium review. Natural
Product Reports 2001, 18:380-416.
21.
Chater KF, Bibb M: Regulation of bacterial antibiotic production. In Biotechnology,
Volume 7: Products of secondary metabolism. Edited by Kleinkauf H, von Dören H.
VCH, Weinheim 1997, 57-105.
22.
Berdy J: Bioactive microbial metabolites - A personal view. Journal of Antibiotics
2005, 58:1-26.
23.
Hertweck C, Luzhetskyy A, Rebets Y, Bechthold A: Type II polyketide synthases:
gaining a deeper insight into enzymatic teamwork. Natural Product Reports 2007,
24:162-190.
24.
Hopwood DA: Genetic contributions to understanding polyketide synthases.
Chemical Reviews 1997, 97:2465-2497.
25.
Austin MB, Noel AJP: The chalcone synthase superfamily of type III polyketide
synthases. Natural Product Reports 2003, 20:79-110.
26. Kreuzaler F, Hahlbrock K: Enzymatic synthesis of aromatic compounds in higher
plants - formation of naringenin (5,7,4'-trihydroxyflavanone) from para-coumaroyl
coenzyme A and malonyl coenzyme A. FEBS Letters 1972, 28:69-72.
27.
Funa N, Ohnishi Y, Fujii I, Shibuya M, Ebizuka Y, Horinouchi S: A new pathway for
polyketide synthesis in microorganisms. Nature 1999, 400:897-899.
28. Joyce SA, Brachmann AO, Glazer I, Lango L, Schwär G, Clarke DJ, Bode HB:
Bacterial biosynthesis of a multipotent stilbene. Angewandte Chemie-International
Edition 2008, 47:1942-1945.
29.
Han YS, Van der Heijden R, Verpoorte R: Biosynthesis of anthraquinones in cell
cultures of the Rubiaceae. Plant Cell Tissue and Organ Culture 2001, 67:201-220.
Literaturverzeichnis
30.
253
Eichinger D, Bacher A, Zenk MH, Eisenreich W: Quantitative assessment of
metabolic flux by C-13 NMR analysis. Biosynthesis of anthraquinones in Rubia
tinctorum. Journal of the American Chemical Society 1999, 121:7469-7475.
31. Leistner E, Zenk MH: Mevalonic acid a precursor of substituted benzenoid ring of
Rubiaceae-anthraquinones. Tetrahedron Letters 1968, 1395-1396.
32.
Han YS, Van der Heijden R, Lefeber AWM, Erkelens C, Verpoorte R: Biosynthesis of
anthraquinones in cell cultures of Cinchona 'Robusta' proceeds via the
methylerythritol 4-phosphate pathway. Phytochemistry 2002, 59:45-55.
33.
Hardcast JD, Wilkins JL: Action of sennosides and related compounds on human
colon and rectum. Gut 1970, 11:1038-1042.
34. Weitnauer G, Mühlenweg A, Trefzer A, Hoffmeister D, Süssmuth RD, Jung G, Welzel
K, Vente A, Girreser U, Bechthold A: Biosynthesis of the orthosomycin antibiotic
avilamycin A: deductions from the molecular analysis of the avi biosynthetic gene
cluster of Streptomyces viridochromogenes Tü57 and production of new antibiotics.
Chemistry & Biology 2001, 8:569-581.
35.
Kren V, Rezanka T: Sweet antibiotics - the role of glycosidic residues in antibiotic
and antitumor activity and their randomization. FEMS Microbiology Reviews 2008,
32:858-889.
36.
Kampranis SC, Gormley NA, Tranter R, Orphanides G, Maxwell A: Probing the
binding of coumarins and cyclothialidines to DNA gyrase. Biochemistry 1999,
38:1967-1976.
37.
Walsh C, Meyers CLF, Losey HC: Antibiotic glycosyltransferases: antibiotic
maturation and prospects for reprogramming. Journal of Medicinal Chemistry 2003,
46:3425-3436.
38.
Frerich A: Molekularbiologische Untersuchungen zur Biosynthese glykosidierter
Arzneistoffe. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2006.
39.
Kong FM, Zhao N, Siegel MM, Janota K, Ashcroft JS, Koehn FE, Borders DB, Carter
GT: Saccharomicins, novel heptadecaglycoside antibiotics effective against
multidrug-resistant bacteria. Journal of the American Chemical Society 1998,
120:13301-13311.
40.
Labeda DP, Kroppenstedt RM: Phylogenetic analysis of Saccharothrix and related
taxa: proposal for Actinosynnemataceae fam. nov. International Journal of
Systematic and Evolutionary Microbiology 2000, 50:331-336.
41.
FDA application No 050339 (Albamycin) www.fda.gov 2008.
42.
Maxwell A: The interaction between coumarin drugs and DNA gyrase. Molecular
Microbiology 1993, 9:681-686.
43.
Thornsberry C, Burton PJ, Yee YC, Watts JL, Yancey RJ: The activity of a
combination of penicillin and novobiocin against bovine mastitis pathogens:
development of a disk diffusion test. Journal of Dairy Science 1997, 80:413-421.
254
Literaturverzeichnis
44.
Produktinformation Biodry. www.pfizerah.com 2008.
45.
Anderle C: Molekularbiologische und biochemische Untersuchungen zur
Biosynthese der Aminocoumarin-Antibiotika Novobiocin und Chlorobiocin.
Dissertation, Eberhard-Karls-Universität Tübingen 2007.
46. Marcu MG, Schulte TW, Neckers L: Novobiocin and related coumarins and
depletion of heat shock protein 90-dependent signaling proteins. Journal of the
National Cancer Institute 2000, 92:242-248.
47. Burlison JA, Neckers L, Smith AB, Maxwell A, Blagg BSJ: Novobiocin: redesigning a
DNA gyrase inhibitor for selective inhibition of Hsp90. Journal of the American
Chemical Society 2006, 128:15529-15536.
48.
Momose I, Chen W, Kinoshita N, Iinuma H, Hamada M, Takeuchi T: Polyketomycin, a
new antibiotic from Streptomyces sp. MK277-AF1 - I. Taxonomy, production,
isolation, physico-chemical properties and biological activities. Journal of
Antibiotics 1998, 51:21-25.
49.
Momose I, Chen W, Nakamura H, Naganawa H, Iinuma H, Takeuchi T:
Polyketomycin, a new antibiotic from Streptomyces sp. MK277-AF1 - II. Structure
determination. Journal of Antibiotics 1998, 51:26-32.
50. Paululat T, Zeeck A, Gutterer JM, Fiedler HP: Biosynthesis of polyketomycin
produced by Streptomyces diastatochromogenes Tü6028. Journal of Antibiotics 1999,
52:96-101.
51.
Herold K, Gollmick FA, Groth I, Roth M, Menzel KD, Möllmann U, Gräfe U, Hertweck
C: Cervimycin A-D: a polyketide glycoside complex from a cave bacterium can
defeat vancomycin resistance. Chemistry-A European Journal 2005, 11:5523-5530.
52.
Xuan LJ, Xu SH, Zhang HL, Xu YM, Chen MQ: Dutomycin, A New Anthracycline
Antibiotic from Streptomyces. Journal of Antibiotics 1992, 45:1974-1976.
53.
Nagao K, Suzuki K, Tokunaga J, Miyazaki H, Katayama N, Mitsuyama R, Uyeda M:
DMI-2 and DMI-3, DNA methyltransferase inhibitors produced by Streptomyces
sp. strain No 560. Journal of Enzyme Inhibition 1996, 10:115-124.
54.
Luzhetskyy A, Mayer A, Hoffmann J, Pelzer S, Holzenkämper M, Schmitt B, Wohlert
SE, Vente A, Bechthold A: Cloning and heterologous expression of the
aranciamycin biosynthetic gene cluster revealed a new flexible glycosyltransferase.
ChemBioChem 2007, 8:599-602.
55. Luzhetskyy A, Hoffmann J, Pelzer S, Wohlert SE, Vente A, Bechthold A:
Aranciamycin analogs generated by combinatorial biosynthesis show improved
antitumor activity. Applied Microbiology and Biotechnology 2008, 80:15-19.
56.
Arnold M: CD-aktive Metabolite aus Streptomyceten sowie Untersuchung der
Biosyntheseleistungen des Mensacarcin-Bildners Streptomyces sp. Gö C4/4.
Dissertation, Georg-August-Universität zu Göttingen 2002.
Literaturverzeichnis
255
57.
Marumo S, Suzuki S, Sasaki K: Stereochemistry of cervicarcin. Agricultural and
Biological Chemistry 1971, 35:1931-1935.
58.
Yeo WH, Yun BS, Kim SS, Park EK, Kim YH, Yoo ID, Yu SH: GTRI-02, a new lipid
peroxidation inhibitor from Micromonospora sp. SA246. Journal of Antibiotics 1998,
51:952-953.
59.
Okamura N, Hine N, Harada S, Fujioka T, Mihashi K, Yagi A: Three chromone
components from Aloe vera leaves. Phytochemistry 1996, 43:495-498.
60.
Okamura N, Hine N, Tateyama Y, Nakazawa M, Fujioka T, Mihashi K, Yagi A: Three
chromones of Aloe vera leaves. Phytochemistry 1997, 45:1511-1513.
61.
Polomska ME: Towards a total synthesis of mensacarcin. Dissertation, GeorgAugust-Universität zu Göttingen 2004.
62. Minotti G, Menna P, Salvatorelli E, Cairo G, Gianni L: Anthracyclines: molecular
advances and pharmacologic developments in antitumor activity and
cardiotoxicity. Pharmacological Reviews 2004, 56:185-229.
63.
Lösgen S: Isolierung und Strukturaufklärung neuer Naturstoffe aus
endophytischen Pilzen mariner Habitate sowie Arbeiten zum cytotoxischen
Polyketid Mensacarcin. Dissertation, Georg-August-Universität zu Göttingen 2007.
64.
Hung DT, Jamison TF, Schreiber SL: Understanding and controlling the cell cycle
with natural products. Chemistry & Biology 1996, 3:623-639.
65. Avendano C, Menendez JC: Medicinal Chemisty of Anticancer Drugs. Elsevier
Verlag 2008. Die aktive, alkylierende Form von Mitobronitol trägt zum Beispiel einen
Oxiranring (S. 159).
66.
Hopwood DA: Genetic manipulation of Streptomyces - a laboratory manual. Cold
Spring Harbor Laboratory Press, Cold Spring Harbor 1985.
67.
Hopwood DA: Genetic analysis and genome structure in Streptomyces coelicolor.
Bacteriological Reviews 1967, 31:373-403.
68.
Martin JF, Liras P: Organization and expression of genes involved in the
biosynthesis of antibiotics and other secondary metabolites. Annual Review of
Microbiology 1989, 43:173-206.
69.
Omura S, Ikeda H, Ishikawa J, Hanamoto A, Takahashi C, Shinose M, Takahashi Y,
Horikawa H, Nakazawa H, Osonoe T, Kikuchi H, Shiba T, Sakaki Y, Hattori M:
Genome sequence of an industrial microorganism Streptomyces avermitilis:
deducing the ability of producing secondary metabolites. Proceedings of the
National Academy of Sciences of the United States of America 2001, 98:12215-12220.
256
70.
Literaturverzeichnis
Bentley SD, Chater KF, Cerdeno-Tarraga AM, Challis GL, Thomson NR, James KD,
Harris DE, Quail MA, Kieser H, Harper D, Bateman A, Brown S, Chandra G, Chen
CW, Collins M, Cronin A, Fraser A, Goble A, Hidalgo J, Hornsby T, Howarth S, Huang
CH, Kieser T, Larke L, Murphy L, Oliver K, O'Neil S, Rabbinowitsch E, Rajandream
MA, Rutherford K, Rutter S, Seeger K, Saunders D, Sharp S, Squares R, Squares S,
Taylor K, Warren T, Wietzorrek A, Woodward J, Barrell BG, Parkhill J, Hopwood DA:
Complete genome sequence of the model actinomycete Streptomyces coelicolor
A3(2). Nature 2002, 417:141-147.
71. Ohnishi Y, Ishikawa J, Hara H, Suzuki H, Ikenoya M, Ikeda H, Yamashita A, Hattori
M, Horinouchi S: Genome sequence of the streptomycin-producing microorganism
Streptomyces griseus IFO 13350. Journal of Bacteriology 2008, 190:4050-4060.
72.
Volff JN, Altenbuchner J: Genetic instability of the Streptomyces chromosome.
Molecular Microbiology 1998, 27:239-246.
73.
Chater KF, Bruton CJ: Mutational cloning in Streptomyces and the isolation of
antibiotic production genes. Gene 1983, 26:67-78.
74. Malpartida F, Hopwood DA: Molecular cloning of the whole biosynthetic pathway of
a Streptomyces antibiotic and its expression in a heterologous host. Nature 1984,
309:462-464.
75.
Baltz RH: Genetic manipulation of antibioticproducing Streptomyces. Trends in
Microbiology 1998, 6:76-83.
76.
Fuchser J, Zeeck A: Secondary metabolites by chemical screening. 34. Aspinolides
and aspinonene/aspyrone co-metabolites, new pentaketides produced by
Aspergillus ochraceus. Liebigs Annalen-Recueil 1997,87-95.
77.
Chen GH, Wang GYS, Li X, Waters B, Davies J: Enhanced production of microbial
metabolites in the presence of dimethyl sulfoxide. Journal of Antibiotics 2000,
53:1145-1153.
78. Ueda K, Kawai S, Ogawa H, Kiyama A, Kubota T, Kawanobe H, Beppu T: Wide
distribution of interspecific stimulatory events on antibiotic production and
sporulation among Streptomyces species. Journal of Antibiotics 2000, 53:979-982.
79.
Challis GL: Mining microbial genomes for new natural products and biosynthetic
pathways. Microbiology-SGM 2008, 154:1555-1569.
80.
McAlpine JB, Bachmann BO, Piraee M, Tremblay S, Alarco AM, Zazopoulos E, Farnet
CM: Microbial genomics as a guide to drug discovery and structural elucidation:
ECO-02301, a novel antifungal agent, as an example. Journal of Natural Products
2005, 68:493-496.
81.
Hendersons's dictionary of Biology. Edited by Lawrence E. Pearson Education,
Harlow 2005.
82.
Oxford dictionary of Biochemistry and Molecular Biology. Edited by Cammack R,
Smith AD, Attwood TK, Campbell P, Parish H. Oxford University Press, Oxford 2006.
Literaturverzeichnis
83.
Thiericke R: Biological variation of microbial metabolites by precursor-directed
biosynthesis. Natural Product Reports 1993, 10:265-289.
84.
Weist S, Süssmuth RD: Mutational biosynthesis - a tool for the generation of
structural diversity in the biosynthesis of antibiotics. Applied Microbiology and
Biotechnology 2005, 68:141-150.
85.
Faber K: Biotransformations in Organic Chemistry: a textbook. Springer Verlag,
www.springer.com 2004.
86.
Ochman H, Lawrence JG, Groisman EA: Lateral gene transfer and the nature of
bacterial innovation. Nature 2000, 405:299-304.
257
87. Hutchinson CR: Combinatorial biosynthesis for new drug discovery. Current
Opinion in Microbiology 1998, 1:319-329.
88.
Xue Q, Ashley G, Hutchinson CR, Santi DV: A multiplasmid approach to preparing
large libraries of polyketides. Proceedings of the National Academy of Sciences of the
United States of America 1999, 96:11740-11745.
89.
Menzella HG, Reid R, Carney JR, Chandran SS, Reisinger SJ, Patel KG, Hopwood DA,
Santi DV: Combinatorial polyketide biosynthesis by de novo design and
rearrangement of modular polyketide synthase genes. Nature Biotechnology 2005,
23:1171-1176.
90.
Moore BS, Piel J: Engineering biodiversity with type II polyketide synthase genes.
Antonie Van Leeuwenhoek International Journal of General and Molecular
Microbiology 2000, 78:391-398.
91.
McDaniel R, Ebertkhosla S, Hopwood DA, Khosla C: Rational design of aromatic
polyketide natural products by recombinant assembly of enzymatic subunits.
Nature 1995, 375:549-554.
92. Madduri K, Kennedy J, Rivola G, Inventi-Solari A, Filippini S, Zanuso G, Colombo
AL, Gewain KM, Occi JL, Macneil DJ, Hutchinson CR: Production of the antitumor
drug epirubicin (4 '-epidoxorubicin) and its precursor by a genetically engineered
strain of Streptomyces peucetius. Nature Biotechnology 1998, 16:69-74.
93. Luzhetskyy A, Bechthold A: It works: combinatorial biosynthesis for generating
novel glycosylated compounds. Molecular Microbiology 2005, 58:3-5.
94.
Krauth C: Spezifitätsuntersuchungen von Glykosyltransferasen am Beispiel der
Landomycinbiosynthese. Dissertation, Albert-Ludwigs-Universität Freiburg im
Breisgau 2008.
95.
Williams GJ, Goff RD, Zhang CS, Thorson JS: Optimizing glycosyltransferase
specificity via "hot spot" saturation mutagenesis presents a catalyst for novobiocin
glycorandomization. Chemistry & Biology 2008, 15:393-401.
96. Luzhetskyy A: persönliche Mitteilung 2005.
258
Literaturverzeichnis
97.
Thomson RH: Naturally occuring quinones, second edition. Academic Press, London
and New York 1971.
98.
Neuhaus D, Williamson MP: The nuclear Overhauser effect in structural and
conformational analysis, second edition. Wiley VCH, New York 2000.
99.
Klyne W: The configuration of the anomeric carbon atoms in some cardiac
glycosides. Biochemical Journal 1950, 47.
100. Omura S, Nakagawa A, Tanaka Y: Structure of a new anti-fungal antibiotic,
irumamycin. Journal of Organic Chemistry 1982, 47:5413-5415.
101. Hesse M, Meier H, Zeeh B: Spektroskopische Methoden in der Organischen
Chemie, 2. Auflage. Thieme-Verlag, Stuttgart 1984.
102. Taguchi T: persönliche Mitteilung 2006.
103. Francis CW, Aksnes DW, Holt O: Assignment of the H-1 and C-13 NMR spectra of
anthraquinone glycosides from Rhamnus frangula. Magnetic Resonance in
Chemistry 1998, 36:769-772.
104. Fujioka K, Furihata K, Shimazu A, Hayakawa Y, Seto H: Isolation and
characterization of atramycin A and atramycin B, new isotetracenone type
antitumor antibiotics. Journal of Antibiotics 1991, 44:1025-1028.
105. SciFinder Scholar. http://www.cas.org/SCIFINDER/SCHOLAR/ 2008.
106. Rupprath C, Schumacher T, Elling L: Nucleotide deoxysugars: essential tools for the
glycosylation engineering of novel bioactive compounds. Current Medicinal
Chemistry 2005, 12:1637-1675.
107. Esteve-Nunez A, Caballero A, Ramos JL: Biological degradation of 2,4,6trinitrotoluene. Microbiology and Molecular Biology Reviews 2001, 65:335-352.
108. Kieseier BC, Gold R, Neuhaus O, Hartung HP: Mitoxantron zur Therapie der
Multiplen Sklerose. Nervenarzt 2003, 74:906-910.
109. Mewes K, Blanz J, Ehninger G, Gebhardt R, Zeller KP: Cytochrome P-450-induced
cytotoxicity of mitoxantrone by formation of electrophilic intermediates. Cancer
Research 1993, 53:5135-5142.
110. Zhan JX, Gunatilaka AAL: Microbial transformation of amino- and
hydroxyanthraquinones by Beauveria bassiana ATCC 7159. Journal of Natural
Products 2006, 69:1525-1527.
111. Hansen PE, Kolonicny A, Lycka A: Deuterium isotope effects on C-13 nuclear
shielding of amino and acetamido compounds - tautomerism and intramolecular
hydrogen-bonding. Magnetic Resonance in Chemistry 1992, 30:786-795.
112. Yu JJ, Chang PK, Ehrlich KC, Cary JW, Bhatnagar D, Cleveland TE, Payne GA, Linz
JE, Woloshuk CP, Bennett JW: Clustered pathway genes in aflatoxin biosynthesis.
Applied and Environmental Microbiology 2004, 70:1253-1262.
Literaturverzeichnis
259
113. Wang CCC, Chiang YM, Kuo PL, Chang JK, Hsu YL: Norsolorinic acid from
Aspergillus nidulans inhibits the proliferation of human breast adenocarcinoma
MCF-7 cells via fas-mediated pathway. Basic & Clinical Pharmacology & Toxicology
2008, 102:491-497.
114. Marzouk MS, El Toumy SAA, Merfort I, Nawwar MAM: Polyphenolic metabolites of
Rhamnus disperma. Phytochemistry 1999, 52:943-946.
115. Butterweck V, Jurgenliemk G, Nahrstedt A, Winterhoff H: Flavonoids from
Hypericum perforatum show antidepressant activity in the forced swimming test.
Planta Medica 2000, 66:3-6.
116. Fukunaga T, Nishiya K, Kajikawa I, Watanabe Y, Suzuki N, Takeya K, Itokawa H:
Chemical studies on the constituents of hyphear-tanakae hosokawa from different
host trees. Chemical & Pharmaceutical Bulletin 1988, 36:1180-1184.
117. Sicherheitsdatenblatt. Sigma-Aldrich Chemie GmbH, München 2008.
118. Casellas M, Grifoll M, Bayona JM, Solanas AM: New metabolites in the degradation
of fluorene by Arthrobacter sp. strain F101. Applied and Environmental Microbiology
1997, 63:819-826.
119. Carrupt PA, Testa B, Bechalany A, Eltayar N, Descas P, Perrissoud D: Morphine 6glucuronide and morphine 3-glucuronide as molecular chameleons with
unexpected lipophilicity. Journal of Medicinal Chemistry 1991, 34:1272-1275.
120. Yamanaka H, Nakajima M, Hara Y, Katoh M, Tachibana O, Yamashita J, Yokoi T:
Urinary excretion of phenytoin metabolites, 5-(4'-hydroxyphenyl)-5phenylhydantoin and its O-glucuronide in humans and analysis of genetic
polymorphisms of UDP-glucuronosyltransferases. Drug Metabolism and
Pharmacokinetics 2005, 20:135-143.
121. Trela BC, Waterhouse AL: Resveratrol: isomeric molar absorptivities and stability.
Journal of Agricultural and Food Chemistry 1996, 44:1253-1257.
122. Bernard E, Britz-McKibbin P, Gernigon N: Resveratrol photoisomerization: an
integrative guided-inquiry experiment. Journal of Chemical Education 2007,
84:1159-1161.
123. Albermann C, Soriano A, Jiang JQ, Vollmer H, Biggins JB, Barton WA, Lesniak J,
Nikolov DB, Thorson JS: Substrate specificity of NovM: Implications for novobiocin
biosynthesis and glycorandomization. Organic Letters 2003, 5:933-936.
124. Meyers CLF, Oberthür M, Anderson JW, Kahne D, Walsh CT: Initial characterization
of novobiocic acid noviosyl transferase activity of NovM in biosynthesis of the
antibiotic novobiocin. Biochemistry 2003, 42:4179-4189.
125. Hinman JW, Caron EL, Hoeksema H: The structure of novobiocin. Journal of the
American Chemical Society 1957, 79:3789-3800.
260
Literaturverzeichnis
126. Steffensky M, Mühlenweg A, Wang ZX, Li SM, Heide L: Identification of the
novobiocin biosynthetic gene cluster of Streptomyces spheroides NCIB 11891.
Antimicrobial Agents and Chemotherapy 2000, 44:1214-1222.
127. Sebek OK, Dolak LA: Microbial hydroxylation of novobiocin and related
compounds. Journal of Antibiotics 1984, 37:136-142.
128. Reusser F, Dolak LA: Novenamine is the active moiety in novobiocin. Journal of
Antibiotics 1986, 39:272-274.
129. Lewis RJ, Singh OMP, Smith CV, Skarzynski T, Maxwell A, Wonacott AJ, Wigley DB:
The nature of inhibition of DNA gyrase by the coumarins and the cyclothialidines
revealed by X-ray crystallography. EMBO Journal 1996, 15:1412-1420.
130. Eustaquio AS, Gust B, Galm U, Li SM, Chater KF, Heide L: Heterologous expression
of novobiocin and clorobiocin biosynthetic gene clusters. Applied and Environmental
Microbiology 2005, 71:2452-2459.
131. Labeda DP, Testa RT, Lechevalier MP, Lechevalier HA: Saccharothrix - a new genus
of the Actinomycetales related to Nocardiopsis. International Journal of Systematic
Bacteriology 1984, 34:426-431.
132. Mcleod MP, Warren RL, Hsiao WWL, Araki N, Myhre M, Fernandes C, Miyazawa D,
Wong W, Lillquist AL, Wang D, Dosanjh M, Hara H, Petrescu A, Morin RD, Yang G,
Stott JM, Schein JE, Shin H, Smailus D, Siddiqui AS, Marra MA, Jones SJM, Holt R,
Brinkman FSL, Miyauchi K, Fukuda M, Davies JE, Mohn WW, Eltis LD: The
complete genome of Rhodococcus sp. RHA1 provides insights into a catabolic
powerhouse. Proceedings of the National Academy of Sciences of the United States of
America 2006, 103:15582-15587.
133. Rodriguez L, Aguirrezabalaga I, Allende N, Brana AF, Mendez C, Salas JA:
Engineering deoxysugar biosynthetic pathways from antibiotic-producing
microorganisms: a tool to produce novel glycosylated bioactive compounds.
Chemistry & Biology 2002, 9:721-729.
134. Perez M, Lombo F, Zhu LL, Gibson M, Brana AF, Rohr R, Salas JA, Mendez C:
Combining sugar biosynthesis genes for the generation of L- and D-amicetose and
formation of two novel antitumor tetracenomycins. Chemical Communications
2005,1604-1606.
135. Decker H, Gaisser S, Pelzer S, Schneider P, Westrich L, Wohlleben W, Bechthold A: A
general approach for cloning and characterizing dNDP-glucose dehydratase genes
from actinomycetes. FEMS Microbiology Letters 1996, 141:195-201.
136. Gaisser S, Bühm GA, Cortes J, Leadlay PF: Analysis of seven genes from the eryAl/eryK region of the erythromycin biosynthetic gene cluster in Saccharopolyspora
erythraea. Molecular & General Genetics 1997, 256:239-251.
137. Summers RG, Donadio S, Staver MJ, WendtPienkowski E, Hutchinson CR, Katz L:
Sequencing and mutagenesis of genes from the erythromycin biosynthetic gene
cluster of Saccharopolyspora erythraea that are involved in L-mycarose and Ddesosamine production. Microbiology-UK 1997, 143:3251-3262.
Literaturverzeichnis
261
138. Waldron C, Madduri K, Crawford K, Merlo DJ, Treadway P, Broughton MC, Baltz RH:
A cluster of genes for the biosynthesis of spinosyns, novel macrolide insect control
agents produced by Saccharopolyspora spinosa. Antonie Van Leeuwenhoek
International Journal of General and Molecular Microbiology 2000, 78:385-390.
139. Ramos A, Lombo F, Brana AF, Rohr J, Mendez C, Salas JA: Biosynthesis of
elloramycin in Streptomyces olivaceus requires glycosylation by enzymes encoded
outside the aglycon cluster. Microbiology-SGM 2008, 154:781-788.
140. Blanco G, Patallo EP, Brana AF, Trefzer A, Bechthold A, Rohr J, Mendez C, Salas JA:
Identification of a sugar flexible glycosyltransferase from Streptomyces olivaceus,
the producer of the antitumor polyketide elloramycin. Chemistry & Biology 2001,
8:253-263.
141. Ahlert J, Shepard E, Lomovskaya N, Zazopoulos E, Staffa A, Bachmann BO, Huang
KX, Fonstein L, Czisny A, Whitwam RE, Farnet CM, Thorson JS: The calicheamicin
gene cluster and its iterative type I enediyne PKS. Science 2002, 297:1173-1176.
142. Miyamoto Y, Johdo O, Nagamatsu Y, Yoshimoto A: Cloning and characterization of
a glycosyltransferase gene involved in the biosynthesis of anthracycline antibiotic
beta-rhodomycin from Streptomyces violaceus. FEMS Microbiology Letters 2002,
206:163-168.
143. Rose TM, Schultz ER, Henikoff JG, Pietrokovski S, McCallum CM, Henikoff S:
Consensus-degenerate hybrid oligonucleotide primers for amplification of distantly
related sequences. Nucleic Acids Research 1998, 26:1628-1635.
144. Wright F, Bibb MJ: Codon usage in the G+C-rich Streptomyces genome. Gene 1992,
113:55-65.
145. Luzhetskyy A, Weiss H, Charge A, Welle E, Linnenbrink A, Vente A, Bechthold A:
A strategy for cloning glycosyltransferase genes involved in natural product
biosynthesis. Applied Microbiology and Biotechnology 2007, 75:1367-1375.
146. Xue YQ, Zhao LS, Liu HW, Sherman DH: A gene cluster for macrolide antibiotic
biosynthesis in Streptomyces venezuelae: Architecture of metabolic diversity.
Proceedings of the National Academy of Sciences of the United States of America 1998,
95:12111-12116.
147. Volchegursky Y, Hu ZH, Katz L, McDaniel R: Biosynthesis of the anti-parasitic
agent megalomicin: transformation of erythromycin to megalomicin in
Saccharopolyspora erythraea. Molecular Microbiology 2000, 37:752-762.
148. Berner M: Molekularbiologische Untersuchungen zur Biosynthese der
Oligosaccharid-Antibiotika Saccharomicin A und B in Saccharothrix espanaensis.
Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2006.
149. Hernandez C, Olano C, Mendez C, Salas JA: Characterization of a Streptomyces
antibioticus gene cluster encoding a glycosyltransferase involved in oleandomycin
inactivation. Gene 1993, 134:139-140.
262
Literaturverzeichnis
150. Gust B, Kieser T, Chater KF: PCR targeting system in Streptomyces coelicolor A3(2).
John Innes Centre, Norwich, UK 2002.
151. http://streptomyces.org.uk/redirect/index.html 2008.
152. Magalhaes MLB, Blanchard JS: The kinetic mechanism of AAC(3)-IV
aminoglycoside acetyltransferase from Escherichia coli. Biochemistry 2005,
44:16275-16283.
153. Clark NC, Olsvik O, Swenson JM, Spiegel CA, Tenover FC: Detection of a
streptomycin/spectinomycin adenylyltransferase gene (aadA) in Enterococcus
faecalis. Antimicrobial Agents and Chemotherapy 1999, 43:157-160.
154. Murakami T, Holt TG, Thompson CJ: Thiostrepton-induced gene-expression in
Streptomyces lividans. Journal of Bacteriology 1989, 171:1459-1466.
155. Fedoryshyn M, Petzke L, Welle E, Bechthold A, Luzhetskyy A: Marker removal from
actinomycetes genome using Flp recombinase. Gene 2008, 419:43-47.
156. Luzhetskyy A: persönliche Mitteilung 2007.
157. Peintner I: Monooxygenasen als Post-PKS modifizierende Enzyme in der
aromatischen Polyketid Biosynthese von Polyketomycin und Simocyclinon D8.
Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2008.
158. Zhang W, Watanabe K, Wang CCC, Tang Y: Investigation of early tailoring reactions
in the oxytetracycline biosynthetic pathway. Journal of Biological Chemistry 2007,
282:25717-25725.
159. von Mulert U: persönliche Mitteilung 2007.
160. Prestel A: Charakterisierung des Mensacarcin Biosynthesegenclusters aus
Streptomyces sp. Gö C4/4. Diplomarbeit, Fachhochschule für Technik und Gestaltung
Mannheim 2003.
161. Funa N, Funabashi M, Ohnishi Y, Horinouchi S: Biosynthesis of
hexahydroxyperylenequinone melanin via oxidative aryl coupling by cytochrome
P-450 in Streptomyces griseus. Journal of Bacteriology 2005, 187:8149-8155.
162. Bode HB, Bethe B, Hofs R, Zeeck A: Big effects from small changes: possible ways
to explore nature's chemical diversity. ChemBioChem 2002, 3:619-627.
163. Mao YQ, Varoglu M, Sherman DH: Molecular characterization and analysis of the
biosynthetic gene cluster for the antitumor antibiotic mitomycin C from
Streptomyces lavendulae NRRL 2564. Chemistry & Biology 1999, 6:251-263.
164. Wang LY, Li ST, Li YA: Identification and characterization of a new
exopolysaccharide biosynthesis gene cluster from Streptomyces. FEMS Microbiology
Letters 2003, 220:21-27.
Literaturverzeichnis
263
165. Sciara G, Kendrew SG, Miele AE, Marsh NG, Federici L, Malatesta F, Schimperna G,
Savino C, Vallone B: The structure of ActVA-Orf6, a novel type of monooxygenase
involved in actinorhodin biosynthesis. EMBO Journal 2003, 22:205-215.
166. Rafanan ER, Hutchinson CR, Shen B: Triple hydroxylation of tetracenomycin A2 to
tetracenomycin C involving two molecules of O2 and one molecule of H2O. Organic
Letters 2000, 2:3225-3227.
167. Taguchi T, Itou K, Ebizuka Y, Malpartida F, Hopwood DA, Surti CM, Booker-Milburn
KI, Stephenson GR, Ichinose K: Chemical characterisation of disruptants of the
Streptomyces coelicolor A3(2) actVI genes involved in actinorhodin biosynthesis.
Journal of Antibiotics 2000, 53:144-152.
168. Ichinose K, Ozawa M, Itou K, Kunieda K, Ebizuka Y: Cloning, sequencing and
heterologous expression of the medermycin biosynthetic gene cluster of
Streptomyces sp. AM-7161: towards comparative analysis of the
benzoisochromanequinone gene clusters. Microbiology-SGM 2003, 149:1633-1645.
169. Li AY, Piel J: A gene cluster from a marine Streptomyces encoding the biosynthesis
of the aromatic spiroketal polyketide griseorhodin A. Chemistry & Biology 2002,
9:1017-1026.
170. Fischbach M, Ward D, Young S, Jaffe D, Gnerre S, Berlin A, Heiman D, Hepburn T,
Sykes S, Alvarado L, Kodira CD, Straight P, Clardy J, Hung D, Kolter R, Mekalanos J,
Walker S, Walsh CT, Lander E, Galagan J, Nusbaum C, Birren B: Streptomyces sp.
Mg1 - whole genome shotgun sequence. NCBI database, www.ncbi.nlm.nih.gov 2008.
171. Lykidis A, Mavromatis K, Ivanova N, Anderson I, Land M, DiBartolo G, Martinez M,
Lapidus A, Lucas S, Copeland A, Richardson P, Wilson DB, Kyrpides N: Genome
sequence and analysis of the soil cellulolytic actinomycete Thermobifida fusca YX.
Journal of Bacteriology 2007, 189:2477-2486.
172. Menendez N, Nur-e-Alam, Brana AF, Rohr J, Salas AF, Mendez C: Biosynthesis of the
antitumor chromomycin A(3) in Streptomyces griseus: analysis of the gene cluster
and rational design of novel chromomycin analogs. Chemistry & Biology 2004,
11:21-32.
173. Räty K, Kantola J, Hautala A, Hakala J, Ylihonko K, Mäntsälä P: Cloning and
characterization of Streptomyces galilaeus aclacinomycins polyketide synthase
(PKS) cluster. Gene 2002, 293:115-122.
174. Garrido LM, Lombo F, Baig I, Nur-e-Alam, Furlan RLA, Borda CC, Brana A, Mendez
C, Salas JA, Rohr J, Padilla G: Insights in the glycosylation steps during biosynthesis
of the antitumor anthracycline cosmomycin: characterization of two
glycosyltransferase genes. Applied Microbiology and Biotechnology 2006, 73:122-131.
175. Oliynyk M, Samborskyy M, Lester JB, Mironenko T, Scott N, Dickens S, Haydock SF,
Leadlay PF: Complete genome sequence of the erythromycin-producing bacterium
Saccharopolyspora erythraea NRRL23338. Nature Biotechnology 2007, 25:447-453.
264
Literaturverzeichnis
176. Normand P, Lapierre P, Tisa LS, Gogarten JP, Alloisio N, Bagnarol E, Bassi CA, Berry
AM, Bickhart DM, Choisne N, Couloux A, Cournoyer B, Cruveiller S, Daubin V,
Demange N, Francino MP, Goltsman E, Huang Y, Kopp OR, Labarre L, Lapidus A,
Lavire C, Marechal J, Martinez M, Mastronunzio JE, Mullin BC, Niemann J, Pujic P,
Rawnsley T, Rouy Z, Schenowitz C, Sellstedt A, Tavares F, Tomkins JP, Vallenet D,
Valverde C, Wall LG, Wang Y, Medigue C, Benson DR: Genome characteristics of
facultatively symbiotic Frankia sp. strains reflect host range and host plant
biogeography. Genome Research 2007, 17:7-15.
177. Copeland A, Lucas S, Lapidus A, Barry K, Detter JC, Glavina del Rio T, Hammon N,
Israni S, Dalin E, Tice H, Pitluck S, Munk AC, Brettin T, Bruce D, Han C, Tapia R,
Gilna P, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Lykidis A, da Costa
MS, Rainey FA, Empadinhas N, Jolivet E, Battista JR, Richardson P: Complete
sequence of Rubrobacter xylanophilus DSM 9941. NCBI database,
www.ncbi.nlm.nih.gov 2006.
178. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Dalin E, Tice H, Pitluck
S, Mendez C, Brettin T, Bruce D, Detter JC, Han C, Schmutz J, Larimer F, Land M,
Hauser L, Kyripides N, Miller JF, Pozidis C, Xu H, Hakala J, Richardson P: Complete
sequence of Polynucleobacter sp. QLW-P1DWA-1. NCBI database,
www.ncbi.nlm.nih.gov 2007.
179. Ylihonko K, Tuikkanen J, Jussila S, Cong LN, Mäntsälä P: A gene cluster involved in
nogalamycin biosynthesis from Streptomyces nogalater: Sequence analysis and
complementation of early block mutations in the anthracycline pathway. Molecular
& General Genetics 1996, 251:113-120.
180. Mochizuki S, Hiratsu K, Suwa M, Ishii T, Sugino F, Yamada K, Kinashi H: The large
linear plasmid pSLA2-L of Streptomyces rochei has an unusually condensed gene
organization for secondary metabolism. Molecular Microbiology 2003, 48:15011510.
181. Goldman BS, Nierman WC, Kaiser D, Slater SC, Durkin AS, Eisen J, Ronning CM,
Barbazuk WB, Blanchard M, Field C, Halling C, Hinkle G, Iartchuk O, Kim HS,
Mackenzie C, Madupu R, Miller N, Shvartsbeyn A, Sullivan SA, Vaudin M, Wiegand
R, Kaplan HB: Evolution of sensory complexity recorded in a myxobacterial
genome. Proceedings of the National Academy of Sciences of the United States of
America 2006, 103:15200-15205.
182. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Hammon N, Israni S,
Dalin E, Tice H, Pitluck S, Saunders E, Brettin T, Bruce D, Detter JC, Han C, Schmutz
J, Larimer F, Land M, Hauser L, Kyripides N, Kim E, Richardson P: Complete
sequence of Frankia sp. EAN1pec. NCBI database, www.ncbi.nlm.nih.gov 2007.
183. Jia XY, Tian ZH, Shao L, Qu XD, Zhao QF, Tang J, Tang GL, Liu W: Genetic
characterization of the chlorothricin gene cluster as a model for spirotetronate
antibiotic biosynthesis. Chemistry & Biology 2006, 13:575-585.
Literaturverzeichnis
265
184. Kaneko T, Nakamura Y, Sato S, Asamizu E, Kato T, Sasamoto S, Watanabe A, Idesawa
K, Ishikawa A, Kawashima K, Kimura T, Kishida Y, Kiyokawa C, Kohara M,
Matsumoto M, Matsuno A, Mochizuki Y, Nakayama S, Nakazaki N, Shimpo S,
Sugimoto M, Takeuchi C, Yamada M, Tabata S: Complete genome structure of the
nitrogen-fixing symbiotic bacterium Mesorhizobium loti. DNA Research 2000, 7:331338.
185. Chung JY, Fujii I, Harada S, Sankawa U, Ebizuka Y: Expression, purification, and
characterization of AknX anthrone oxygenase, which is involved in aklavinone
biosynthesis in Streptomyces galilaeus. Journal of Bacteriology 2002, 184:6115-6122.
186. Yukawa H, Omumasaba CA, Nonaka H, Kos P, Okai N, Suzuki N, Suda M, Tsuge Y,
Watanabe J, Ikeda Y, Vertes AA, Inui M: Comparative analysis of the
Corynebacterium glutamicum group and complete genome sequence of strain R.
Microbiology-SGM 2007, 153:1042-1058.
187. Choulet F, Aigle B, Gallois A, Mangenot S, Gerbaud C, Truong C, Francou FX,
Fourrier C, Guerineau M, Decaris B, Barbe V, Pernodet JL, Leblond P: Evolution of
the terminal regions of the Streptomyces linear chromosome. Molecular Biology and
Evolution 2006, 23:2361-2369.
188. Kern DL, Schaumberg JP, Hokanson GC, French JC: Pd-116,779, a new antitumor
antibiotic of the benz[a]anthraquinone class. Journal of Antibiotics 1986, 39:469470.
189. Martinez R, Kesternich V, Carrasco H, Alvarez-Contreras C, Montenegro C, Ugarte R,
Gutierrez E, Moreno J, Garcia C, Werner E, Carcamo J: Synthesis and conformational
analysis of leptocarpin derivatives. Influence of modification of the oxirane ring on
leptocarpin's cytotoxic activity. Journal of the Chilean Chemical Society 2006,
51:1010-1014.
190. Hertweck C: persönliche Mitteilung 2008.
191. van Berkel WJH, Kamerbeek NM, Fraaije MW: Flavoprotein monooxygenases, a
diverse class of oxidative biocatalysts. Journal of Biotechnology 2006, 124:670-689.
192. Choi H, Tang CK, Tu SC: Catalytically active forms of the individual subunits of
Vibrio harveyi luciferase and their kinetic and binding-properties. Journal of
Biological Chemistry 1995, 270:16813-16819.
193. Bibb MJ: Regulation of secondary metabolism in streptomycetes. Current Opinion in
Microbiology 2005, 8:208-215.
194. Challis GL: Genome mining for novel natural product discovery. Journal of
Medicinal Chemistry 2008, 51:2618-2628.
195. Wietzorrek A, Bibb M: A novel family of proteins that regulates antibiotic
production in streptomycetes appears to contain an OmpR-like DNA-binding fold.
Molecular Microbiology 1997, 25:1181-1184.
266
Literaturverzeichnis
196. Stutzmanengwall KJ, Otten SL, Hutchinson CR: Regulation of secondary metabolism
in Streptomyces spp. and overproduction of daunorubicin in Streptomyces peucetius.
Journal of Bacteriology 1992, 174:144-154.
197. Lomovska ND, Danilenk VN, Gostimsk NL, Mkrtumia NM: Characterization of
temperate actinophage phiC31 isolated from Streptomyces coelicolor A3(2). Journal
of Virology 1972, 9:258-262.
198. Narva KE, Feitelson JS: Nucleotide-sequence and transcriptional analysis of the
redD locus of Streptomyces coelicolor A3(2). Journal of Bacteriology 1990, 172:326333.
199. Schmittjohn T, Engels JW: Promoter constructions for efficient secretion expression
in Streptomyces lividans. Applied Microbiology and Biotechnology 1992, 36:493-498.
200. Metsä-Ketelä M, Salo V, Halo L, Hautala A, Hakala J, Mäntsälä P, Ylihonko K: An
efficient approach for screening minimal PKS genes from Streptomyces. FEMS
Microbiology Letters 1999, 180:1-6.
201. Komaki H, Harper D: Sequence diversity of type-II polyketide synthase genes in
Streptomyces. Actinomycetologica 2006, 20:42-48.
202. BLAST. http://www.ncbi.nlm.nih.gov/blast/index.html 2008.
203. Bonetta L: Genome sequencing in the fast lane. Nature Methods 2006, 3:141-147.
204. Maier T: persönliche Mitteilung 2008.
205. Lesnik EA, Sampath R, Levene HB, Henderson TJ, Mcneil JA, Ecker DJ: Prediction of
rho-independent transcriptional terminators in Escherichia coli. Nucleic Acids
Research 2001, 29:3583-3594.
206. Kelemen GH, Brian P, Flardh K, Chamberlin L, Chater KF, Buttner MJ:
Developmental regulation of transcription of whiE, a locus specifying the
polyketide spore pigment in Streptomyces coelicolor A3(2). Journal of Bacteriology
1998, 180:2515-2521.
207. Novakova R, Bistakova J, Kormanec J: Characterization of the polyketide spore
pigment cluster whiESa in Streptomyces aureofaciens CCM3239. Archives of
Microbiology 2004, 182:388-395.
208. Hochschild A, Dove SL: Protein-protein contacts that activate and repress
prokaryotic transcription. Cell 1998, 92:597-600.
209. Martin R, Bailey JE, Minas W: Putative spore pigment polyketide synthase cluster
from Streptomyces collinus DSM2012. NCBI database, www.ncbi.nlm.nih.gov 2000.
210. Davis NK, Chater KF: Spore color in Streptomyces coelicolor A3(2) involves the
developmentally regulated synthesis of a compound biosynthetically related to
polyketide antibiotics. Molecular Microbiology 1990, 4:1679-1691.
Literaturverzeichnis
267
211. Blanco G, Pereda A, Brian P, Mendez C, Chater KF, Salas JA: A hydroxylase-like
gene-product contributes to synthesis of a polyketide spore pigment in
Streptomyces halstedii. Journal of Bacteriology 1993, 175:8043-8048.
212. Bergh S, Uhlen M: Analysis of a polyketide synthesis-encoding gene-cluster of
Streptomyces curacoi. Gene 1992, 117:131-136.
213. Yu TW, Shen YM, McDaniel R, Floss HG, Khosla C, Hopwood DA, Moore BS:
Engineered biosynthesis of novel polyketides from Streptomyces spore pigment
polyketide synthases. Journal of the American Chemical Society 1998, 120:7749-7759.
214. Alvarez MA, Fu H, Khosla C, Hopwood DA, Bailey JE: Engineered biosynthesis of
novel polyketides: Properties of the WhiE aromatase/cyclase. Nature Biotechnology
1996, 14:335-338.
215. Yu TW, Hopwood DA: Ectopic expression of the Streptomyces coelicolor whiE genes
for polyketide spore pigment synthesis and their interaction with the act genes for
actinorhodin biosynthesis. Microbiology-UK 1995, 141:2779-2791.
216. Funa N, Funabashi M, Yoshimura E, Horinouchi S: A novel quinone-forming
monooxygenase family involved in modification of aromatic polyketides. Journal of
Biological Chemistry 2005, 280:14514-14523.
217. Marchler-Bauer A, Anderson JB, Derbyshire MK, DeWeese-Scott C, Gonzales NR,
Gwadz M, Hao LN, He SQ, Hurwitz DI, Jackson JD, Ke ZX, Krylov D, Lanczycki CJ,
Liebert CA, Liu CL, Lu F, Lu SN, Marchler GH, Mullokandov M, Song JS, Thanki N,
Yamashita RA, Yin JJ, Zhang DC, Bryant SH: CDD: a conserved domain database
for interactive domain family analysis. Nucleic Acids Research 2007, 35:D237-D240.
218. Sherman DH, Kim ES, Bibb MJ, Hopwood DA: Functional replacement of genes for
individual polyketide synthase components in Streptomyces coelicolor A3(2) by
heterologous genes from a different polyketide pathway. Journal of Bacteriology
1992, 174:6184-6190.
219. Bibb MJ, Findlay PR, Johnson MW: The relationship between base composition and
codon usage in bacterial genes and its use for the simple and reliable identification
of protein-coding sequences. Gene 1984, 30:157-166.
220. Shine J, Dalgarno L: The 3-prime terminal sequence of Escherichia coli 16S
ribosomal RNA complementarity to nonsense triplets and ribosome binding sites.
Proceedings of the National Academy of Sciences of the United States of America 1974,
71:1342-1346.
221. Bibb MJ, Cohen SN: Gene-expression in Streptomyces - construction and application
of promoter-probe plasmid vectors in Streptomyces lividans. Molecular & General
Genetics 1982, 187:265-277.
222. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Tice H, Pitluck S, Sun H,
Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Kim E, Jensen P, Moore BS,
Udwary D, Richardson P: Complete sequence of Salinispora tropica CNB-440. NCBI
database, www.ncbi.nlm.nih.gov 2007.
268
Literaturverzeichnis
223. Ishikawa J, Yamashita A, Mikami Y, Hoshino Y, Kurita H, Hotta K, Shiba T, Hattori
M: The complete genomic sequence of Nocardia farcinica IFM 10152. Proceedings
of the National Academy of Sciences of the United States of America 2004, 101:1492514930.
224. Salanoubat M, Genin S, Artiguenave F, Gouzy J, Mangenot S, Arlat M, Billault A,
Brottier P, Camus JC, Cattolico L, Chandler M, Choisne N, Claudel-Renard C, Cunnac
S, Demange N, Gaspin C, Lavie M, Moisan A, Robert C, Saurin W, Schiex T, Siguier P,
Thebault P, Whalen M, Wincker P, Levy M, Weissenbach J, Boucher CA: Genome
sequence of the plant pathogen Ralstonia solanacearum. Nature 2002, 415:497-502.
225. Xu Z, Schenk A, Hertweck C: Molecular analysis of the benastatin biosynthetic
pathway and genetic engineering of altered fatty acid-polyketide hybrids. Journal
of the American Chemical Society 2007, 129:6022-6030.
226. Pulsawat N, Kitani S, Nihira T: Characterization of biosynthetic gene cluster for the
production of virginiamycin M, a streptogramin type A antibiotic, in Streptomyces
virginiae. Gene 2007, 393:31-42.
227. Bechthold A, Sohng JK, Smith TM, Chu X, Floss HG: Identification of Streptomyces
violaceoruber Tü22 genes involved in the biosynthesis of granaticin. Molecular &
General Genetics 1995, 248:610-620.
228. Ichinose K, Bedford DJ, Bibb MJ, Revill WP, Hopwood DA: The granaticin
biosynthetic gene cluster of Streptomyces violaceoruber Tü22: sequence analysis
and expression in a heterologous host. Chemistry & Biology 1998, 5:647-659.
229. Fleischmann RD, Dodson RJ, Haft DH, Merkel JS, Nelson WC, Fraser CM: Complete
sequence of Mycobacterium avium 104. NCBI database, www.ncbi.nlm.nih.gov 2006.
230. Torkkell S, Ylihonko K, Hakala J, Skurnik M, Mäntsälä P: Characterization of
Streptomyces nogalater genes encoding enzymes involved in glycosylation steps in
nogalamycin biosynthesis. Molecular & General Genetics 1997, 256:203-209.
231. Copeland A, Lucas S, Lapidus A, Barry K, Glavina del Rio T, Dalin E, Tice H, Pitluck
S, Foster B, Schmutz J, Larimer F, Land M, Hauser L, Kyripides N, Ivanova N, Jensen
P, Moore BS, Penn K, Jenkins C, Udwary D, Xiang L, Gotang E, Richardson P:
Complete sequence of Salinispora arenicola CNS-205. NCBI database,
www.ncbi.nlm.nih.gov 2007.
232. Xu ZG, Jakobi K, Welzel K, Hertweck C: Biosynthesis of the antitumor agent
chartreusin involves the oxidative rearrangement of an anthracyclic polyketide.
Chemistry & Biology 2005, 12:579-588.
233. Halo L, Wang Y, Mäntsälä P, Hakala J, Ylihonko K: Characterization of the gene
cluster involved in rhodomycin biosynthesis. NCBI database, www.ncbi.nlm.nih.gov
2001.
234. Jansson A, Niemi J, Lindqvist Y, Mäntsälä P, Schneider G: Crystal structure of
aclacinomycin-10-hydroxylase, a S-adenosyl-L-methionine-dependent
methyltransferase homolog involved in anthracycline biosynthesis in Streptomyces
purpurascens. Journal of Molecular Biology 2003, 334:269-280.
Literaturverzeichnis
269
235. McDaniel R, Ebertkhosla S, Hopwood DA, Khosla C: Engineered biosynthesis of
novel polyketides - act(VII) and act(IV) genes encode aromatase and cyclase
enzymes, respectively. Journal of the American Chemical Society 1994, 116:1085510859.
236. Trefzer A, Pelzer S, Schimana J, Stockert S, Bihlmaier C, Fiedler HP, Welzel K, Vente
A, Bechthold A: Biosynthetic gene cluster of simocyclinone, a natural multihybrid
antibiotic. Antimicrobial Agents and Chemotherapy 2002, 46:1174-1182.
237. Hallam SE, Malpartida F, Hopwood DA: Nucleotide-sequence, transcription and
deduced function of a gene involved in polyketide antibiotic-synthesis in
Streptomyces coelicolor. Gene 1988, 74:305-320.
238. Fu H, Ebertkhosla S, Hopwood DA, Khosla C: Engineered biosynthesis of novel
polyketides - dissection of the catalytic specificity of the Act ketoreductase. Journal
of the American Chemical Society 1994, 116:4166-4170.
239. Zawada RJX, Khosla C: Heterologous expression, purification, reconstitution and
kinetic analysis of an extended type II polyketide synthase. Chemistry & Biology
1999, 6:607-615.
240. Zhang X, Alernany LB, Fiedler HP, Goodfellow M, Parry RJ: Biosynthetic
investigations of lactonamycin and lactonamycin Z: Cloning of the biosynthetic
gene clusters and discovery of an unusual starter unit. Antimicrobial Agents and
Chemotherapy 2008, 52:574-585.
241. Mosher RH, Paradkar AS, Anders C, Barton B, Jensen SE: Genes specific for the
biosynthesis of clavam metabolites antipodal to clavulanic acid are clustered with
the gene for clavaminate synthase 1 in Streptomyces clavuligerus. Antimicrobial
Agents and Chemotherapy 1999, 43:1215-1224.
242. Yin XH, Mahadevan B, Grochowski L, Proteau PJ: Molecular cloning and sequence
of the kinamycin angucycline type II polyketide synthase gene cluster from
Streptomyces murayamaensis. NCBI database, www.ncbi.nlm.nih.gov 2003.
243. Haagen Y, Glück K, Fay K, Kammerer B, Gust B, Heide L: A gene cluster for
prenylated naphthoquinone and prenylated phenazine biosynthesis in Streptomyces
cinnamonensis DSM 1042. ChemBioChem 2006, 7:2016-2027.
244. Butler AR, Gandecha AR, Cundliffe E: Influence of ancillary genes, encoding aspects
of methionine metabolism, on tylosin biosynthesis in Streptomyces fradiae. Journal
of Antibiotics 2001, 54:642-649.
245. Li L, Deng W, Song J, Ding W, Zhao QF, Peng C, Song WW, Tang GL, Liu W:
Characterization of the saframycin A gene cluster from Streptomyces lavendulae
NRRL 11002 revealing a nonribosomal peptide synthetase system for assembling
the unusual tetrapeptidyl skeleton in an iterative manner. Journal of Bacteriology
2008, 190:251-263.
270
Literaturverzeichnis
246. Zhang WJ, Ames BD, Tsai SC, Tang Y: Engineered biosynthesis of a novel amidated
polyketide, using the malonamyl-specific initiation module from the
oxytetracycline polyketide synthase. Applied and Environmental Microbiology 2006,
72:2573-2580.
247. Jakobi K, Hertweck C: A gene cluster encoding resistomycin biosynthesis in
Streptomyces resistomycificus; exploring polyketide cyclization beyond linear and
angucyclic patterns. Journal of the American Chemical Society 2004, 126:2298-2299.
248. Marti T, Hu ZH, Pohl NL, Shah AN, Khosla C: Cloning, nucleotide sequence, and
heterologous expression of the biosynthetic gene cluster for R1128, a non-steroidal
estrogen receptor antagonist - insights into an unusual priming mechanism. Journal
of Biological Chemistry 2000, 275:33443-33448.
249. Grimm A, Madduri K, Ali A, Hutchinson CR: Characterization of the Streptomyces
peucetius ATCC-29050 genes encoding doxorubicin polyketide synthase. Gene
1994, 151:1-10.
250. Lackner G, Schenk A, Xu Z, Reinhardt K, Yunt ZS, Piel J, Hertweck C: Biosynthesis of
pentangular polyphenols: Deductions from the benastatin and griseorhodin
pathways. Journal of the American Chemical Society 2007, 129:9306-9312.
251. Torkkell S, Kunnari T, Palmu K, Mäntsälä P, Hakala J, Ylihonko K: The entire
nogalamycin biosynthetic gene cluster of Streptomyces nogalater: characterization
of a 20 kb DNA region and generation of hybrid structures. Molecular Genetics and
Genomics 2001, 266:276-288.
252. Räty K, Kunnari T, Hakala J, Mäntsälä P, Ylihonko K: A gene cluster from
Streptomyces galilaeus involved in glycosylation of aclarubicin. Molecular and
General Genetics 2000, 264:164-172.
253. Wilson T, Hastings JW: Bioluminescence. Annual Review of Cell and Developmental
Biology 1998, 14:197-230.
254. Freiberg C, Fellay R, Bairoch A, Broughton WJ, Rosenthal A, Perret X: Molecular
basis of symbiosis between Rhizobium and legumes. Nature 1997, 387:394-401.
255. He WQ, Wang YG: [Cloning and analysis of geldanamycin partial biosynthetic gene
cluster of Streptomyces hygroscopicus 17997]. Sheng Wu Gong Cheng Xue Bao 2006,
22:902-906. Sequenzdaten bei der NCBI-Datenbank, www.ncbi.nlm.nih.gov.
256. He WQ, Lei J, Liu YY, Wang YG: The LuxR family members GdmRI and GdmRII
are positive regulators of geldanamycin biosynthesis in Streptomyces hygroscopicus
17997. Archives of Microbiology 2008, 189:501-510.
257. Peschke U, Schmidt H, Zhang HZ, Piepersberg W: Molecular characterization of the
lincomycin production gene-cluster of Streptomyces lincolnensis 78-11. Molecular
Microbiology 1995, 16:1137-1156.
258. Neußer D: Untersuchungen zur Biosynthese der Propylprolin-Untereinheit des
Antibiotikums Lincomycin A aus Streptomyces lincolnensis. Dissertation, Bergische
Universität Wuppertal 1999.
Literaturverzeichnis
271
259. Blanc V, Lagneaux D, Didier P, Gil P, Lacroix P, Crouzet J: Cloning and analysis of
structural genes from Streptomyces pristinaespiralis encoding enzymes involved in
the conversion of pristinamycin-IIB to Pristinamycin-IIA (PIIA) - PIIA synthase
and NADH-riboflavin 5'-phosphate oxidoreductase. Journal of Bacteriology 1995,
177:5206-5214.
260. Aufhammer SW, Warkentin E, Ermler U, Hagemeier CH, Thauer RK, Shima S: Crystal
structure of methylenetetrahydromethanopterin reductase (Mer) in complex with
coenzyme F420: Architecture of the F-420/FMN binding site of enzymes within the
nonprolyl cis-peptide containing bacterial luciferase family. Protein Science 2005,
14:1840-1849.
261. Aufhammer SW, Warkentin E, Berk H, Shima S, Thauer RK, Ermler U: Coenzyme
binding in F-420-dependent secondary alcohol dehydrogenase, a member of the
bacterial luciferase family. Structure 2004, 12:361-370.
262. Fisher AJ, Raushel FM, Baldwin TO, Rayment I: 3-Dimensional structure of bacterial
luciferase from Vibrio harveyi at 2.4 Angstrom resolution. Biochemistry 1995,
34:6581-6586.
263. Xin X, Xi L, Tu SC: Functional consequences of site-directed mutation of conserved
histidyl residues of the bacterial luciferase alpha-subunit. Biochemistry 1991,
30:11255-11262.
264. Huang SQ, Tu SC: Identification and characterization of a catalytic base in
bacterial luciferase by chemical rescue of a dark mutant. Biochemistry 1997,
36:14609-14615.
265. Moore C, Lei BF, Tu SC: Relationship between the conserved a subunit arginine 107
and effects of phosphate on the activity and stability of Vibrio harveyi luciferase.
Archives of Biochemistry and Biophysics 1999, 370:45-50.
266. Meighen EA, Nicoli MZ, Hastings JW: Functional differences of nonidentical
subunits of bacterial luciferase - properties of hybirds of native and chemically
modified bacterial luciferase. Biochemistry 1971, 10:4069-4073.
267. Valton J, Fontecave M, Douki T, Kendrew SG, Niviere V: An aromatic hydroxylation
reaction catalyzed by a two-component FMN-dependent monooxygenase - The
ActVA-ActVB system from Streptomyces coelicolor. Journal of Biological Chemistry
2006, 281:27-35.
268. Shen B, Hutchinson CR: Tetracenomycin F1-monooxygenase - oxidation of a
naphthacenone to a naphthacenequinone in the biosynthesis of tetracenomycin-C
in Streptomyces glaucescens. Biochemistry 1993, 32:6656-6663.
269. Kendrew SG, Hopwood DA, Marsh ENG: Identification of a monooxygenase from
Streptomyces coelicolor A3(2) involved in biosynthesis of actinorhodin: Purification
and characterization of the recombinant enzyme. Journal of Bacteriology 1997,
179:4305-4310.
272
Literaturverzeichnis
270. Wendt-Pienkowski E, Huang Y, Zhang J, Li BS, Jiang H, Kwon HJ, Hutchinson CR,
Shen B: Cloning, sequencing, analysis, and heterologous expression of the
fredericamycin biosynthetic gene cluster from Streptomyces griseus. Journal of the
American Chemical Society 2005, 127:16442-16452.
271. Ye JS, Dickens ML, Plater R, Li Y, Lawrence J, Strohl WR: Isolation and sequenceanalysis of polyketide synthase genes from the daunomycin-producing
Streptomyces sp. strain C5. Journal of Bacteriology 1994, 176:6270-6280.
272. Gullon S, Olano C, Abdelfattah MS, Brana AF, Rohr J, Mendez C, Salas JA: Isolation,
characterization, and heterologous expression of the biosynthesis gene cluster for
the antitumor anthracycline steffimycin. Applied and Environmental Microbiology
2006, 72:4172-4183.
273. Bililign T, Hyun CG, Williams JS, Czisny AM, Thorson JS: The hedamycin locus
implicates a novel aromatic PKS priming mechanism. Chemistry & Biology 2004,
11:959-969.
274. Lombo F, Blanco G, Fernandez E, Mendez C, Salas JA: Characterization of
Streptomyces argillaceus genes encoding a polyketide synthase involved in the
biosynthesis of the antitumor mithramycin. Gene 1996, 172:87-91.
275. Kim BC, Lee JM, Ahn JS, Kim BS: Cloning, sequencing, and characterization of the
pradimicin biosynthetic gene cluster of Actinomadura hibisca P157-2. Journal of
Microbiology and Biotechnology 2007, 17:830-839.
276. Bibb MJ, Sherman DH, Omura S, Hopwood DA: Cloning, sequencing and deduced
functions of a cluster of Streptomyces genes probably encoding biosynthesis of the
polyketide antibiotic frenolicin. Gene 1994, 142:31-39.
277. Rafanan ER, Le L, Zhao LL, Decker H, Shen B: Cloning, sequencing, and
heterologous expression of the elmGHIJ genes involved in the biosynthesis of the
polyketide antibiotic elloramycin from Streptomyces olivaceus Tu2353. Journal of
Natural Products 2001, 64:444-449.
278. Zhang XJ, Parry RJ: Cloning and characterization of the pyrrolomycin biosynthetic
gene clusters from Actinosporangium vitaminophilum ATCC 31673 and
Streptomyces sp. strain UC 11065. Antimicrobial Agents and Chemotherapy 2007,
51:946-957.
279. Rao PV, Krishna CM, Zigler JS: Identification and characterization of the
enzymatic-activity of zeta-crystallin from guinea-pig lens - a novel NADPHquinone oxidoreductase. Journal of Biological Chemistry 1992, 267:96-102.
280. Wakil SJ: Mechanism of fatty acid synthesis. Journal of Lipid Research 1961, 2:1-24.
281. Tumminia SJ, Rao PV, Zigler JS, Russell P: Xenobiotic induction of quinone
oxidoreductase activity in lens epithelial cells. Biochimica et Biophysica Acta 1993,
1203:251-259.
Literaturverzeichnis
273
282. Schenk A, Xu ZL, Pfeiffer C, Steinbeck C, Hertweck C: Geminal bismethylation
prevents polyketide oxidation and dimerization in the benastatin pathway.
Angewandte Chemie-International Edition 2007, 46:7035-7038.
283. Gruschow S, Chang LC, Mao YQ, Sherman DH: Hydroxyquinone O-methylation in
mitomycin biosynthesis. Journal of the American Chemical Society 2007, 129:64706476.
284. Sheldon PJ, Busarow SB, Hutchinson CR: Mapping the DNA-binding domain and
target sequences of the Streptomyces peucetius daunorubicin biosynthesis
regulatory protein, DnrI. Molecular Microbiology 2002, 44:449-460.
285. Leskiw BK, Lawlor EJ, Fernandezabalos JM, Chater KF: TTA-codons in some genes
prevent their expression in a class of developmental, antibiotic-negative,
Streptomyces mutants. Proceedings of the National Academy of Sciences of the United
States of America 1991, 88:2461-2465.
286. Chater KF: Streptomyces inside-out: a new perspective on the bacteria that provide
us with antibiotics. Philosophical Transactions of the Royal Society B-Biological
Sciences 2006, 361:761-768.
287. White J, Bibb M: BldA dependence of undecylprodigiosin production in
Streptomyces coelicolor A3(2) involves a pathway-specific regulatory cascade.
Journal of Bacteriology 1997, 179:627-633.
288. Leskiw BK, Mah R, Lawlor EJ, Chater KF: Accumulation of BldA-specified transferRNA is temporally regulated in Streptomyces coelicolor A3(2). Journal of
Bacteriology 1993, 175:1995-2005.
289. Fuqua WC, Winans SC, Greenberg EP: Quorum sensing in bacteria - the LuxRLuxI-family of cell density-responsive transcriptional regulators. Journal of
Bacteriology 1994, 176:269-275.
290. Julien B, Tian ZQ, Reid R, Reeves CD: Analysis of the ambruticin and jerangolid
gene clusters of Sorangium cellulosum reveals unusual mechanisms of polyketide
biosynthesis. Chemistry & Biology 2006, 13:1277-1286.
291. Oliynyk M, Stark CBW, Bhatt A, Jones MA, Hughes-Thomas ZA, Wilkinson C,
Oliynyk Z, Demydchuk Y, Staunton J, Leadlay PF: Analysis of the biosynthetic gene
cluster for the polyether antibiotic monensin in Streptomyces cinnamonensis and
evidence for the role of monB and monC genes in oxidative cyclization. Molecular
Microbiology 2003, 49:1179-1190.
292. Sun YH, Zhou XF, Dong H, Tu GQ, Wang M, Wang BF, Deng ZX: A complete gene
cluster from Streptomyces nanchangensis NS3226 encoding biosynthesis of the
polyether ionophore nanchangmycin. Chemistry & Biology 2003, 10:431-441.
293. Hughes-Thomas ZA, Stark CBW, Bohm IU, Staunton J, Leadlay PF: Intermediates
released from a polyether-producing polyketide synthase provide insight into the
mechanism of oxidative cyclization. Angewandte Chemie-International Edition 2003,
42:4475-4478.
274
Literaturverzeichnis
294. Gould SJ, Hong ST, Carney JR: Cloning and heterologous expression of genes from
the kinamycin biosynthetic pathway of Streptomyces murayamaensis. Journal of
Antibiotics 1998, 51:50-57.
295. Diacovich L, Peiru S, Kurth D, Rodriguez E, Podesta F, Khosla C, Gramajo H: Kinetic
and structural analysis of a new group of acyl-CoA carboxylases found in
Streptomyces coelicolor A3(2). Journal of Biological Chemistry 2002, 277:3122831236.
296. Tukey RH, Strassburg CP: Human UDP-glucuronosyltransferases: Metabolism,
expression, and disease. Annual Review of Pharmacology and Toxicology 2000,
40:581-616.
297. Lim EK, Bowles DJ: A class of plant glycosyltransferases involved in cellular
homeostasis. EMBO Journal 2004, 23:2915-2922.
298. Piepersberg W: Biosynthesis of secondary carbohydrate components in
actinomycetes and other bacteria: Perspectives of pathway engineering.
Bioengineering (Graefelfing) 1994, 10:27-34.
299. Grond S: Die Bildung von 1-O-Acyl-alpha-L-rhamnosiden und anderen
Metaboliten durch dirigierte Biosynthese mit Streptomyces griseoviridis (Tü3634)
und Untersuchung ihrer Biogenese. Dissertation, Georg-August-Universität zu
Göttingen 1997.
300. Rao KV, Weisner NT: Microbial transformation of quercetin by Bacillus cereus.
Applied and Environmental Microbiology 1981, 42:450-452.
301. Ko JH, Kim BG, Ahn JH: Glycosylation of flavonoids with a glycosyltransferase
from Bacillus cereus. FEMS Microbiology Letters 2006, 258:263-268.
302. Bitzer J, Zeeck A: 6-Deoxy-alpha-L-talopyranosides from Streptomyces sp. European
Journal of Organic Chemistry 2006,3661-3666.
303. Eklund P, Holmström T, Al Ubaydy L, Sjöholm R, Hakala J: Rhamnosylation of
lignans by a Streptomyces strain. Tetrahedron Letters 2006, 47:1645-1648.
304. Shibazaki M, Yamaguchi H, Sugawara T, Suzuki K, Yamamoto T: Microbial
glycosylation and acetylation of brefeldin A. Journal of Bioscience and
Bioengineering 2003, 96:344-348.
305. Hovorkov N, Cudlin J, Mateju J, Blumauer M, Vanek Z: Microbial glucosidation of
alizarin and anthraflavin. Collection of Czechoslovak Chemical Communications
1974, 39:662-667.
306. Hovorkov N, Cudlin J, Mateju J, Blumauer M, Vanek Z: Microbial glucosidation of
monohydroxyanthraquinones. Collection of Czechoslovak Chemical Communications
1974, 39:3568-3572.
307. Mateju J, Cudlin J, Hovorkov N, Blumauer M, Vanek Z: Microbial glucosidation of
dihydroxyanthraquinones - general properties of glucosidation system. Folia
Microbiologica 1974, 19:307-316.
Literaturverzeichnis
275
308. Grond S, Langer HJ, Henne P, Sattler I, Thiericke R, Grabley S, Zähner H, Zeeck A:
Secondary metabolites by chemical screening, 39 - Acyl alpha-Lrhamnopyranosides, a novel family of secondary metabolites from Streptomyces
sp.: Isolation and biosynthesis. European Journal of Organic Chemistry 2000, 929937.
309. Grond S, Papastavrou I, Zeeck A: Studies of precursor-directed biosynthesis with
streptomyces, 3 - Structural diversity of 1-O-acyl alpha-L-rhamnopyranosides by
precursor-directed biosynthesis with Streptomyces griseoviridis. European Journal of
Organic Chemistry 2000,1875-1881.
310. Grond S, Papastavrou I, Zeeck A: Studies of precursor-directed biosynthesis with
Streptomyces, 4 - Novel alpha-L-rhamnopyranosides from a single strain of
Streptomyces by supplement-induced biosynthetic steps. European Journal of
Organic Chemistry 2002,3237-3242.
311. Zhang W, Ye M, Zhan JX, Chen YJ, Guo D: Microbial glycosylation of four free
anthraquinones by Absidia coerulea. Biotechnology Letters 2004, 26:127-131.
312. Zhan JX, Gunatilaka AAL: Selective 4 '-O-methylglycosylation of the pentahydroxyflavonoid quercetin by Beauveria bassiana ATCC 7159. Biocatalysis and
Biotransformation 2006, 24:396-399.
313. Kondo R, Yamagami H, Sakai K: Xylosylation of phenolic hydroxyl-groups of the
monomeric lignin model compounds 4-methylguaiacol and vanillyl alcohol by
Coriolus versicolor. Applied and Environmental Microbiology 1993, 59:438-441.
314. Kim HJ, Lee IS: Microbial metabolism of the prenylated chalcone xanthohumol.
Journal of Natural Products 2006, 69:1522-1524.
315. Yuan W, Zhang LP, Cheng KD, Zhu P, Wang Q, He HX, Zhu HX: Microbial Odemethylation, hydroxylation, sulfation, and ribosylation of a xanthone derivative
from Halenia elliptica. Journal of Natural Products 2006, 69:811-814.
316. Orabi KY, Clark AM, Hufford CD: Microbial transformation of benzosampangine.
Journal of Natural Products 2000, 63:396-398.
317. Lim EK, Doucet CJ, Li Y, Elias L, Worrall D, Spencer SP, Ross J, Bowles DJ: The
activity of Arabidopsis glycosyltransferases toward salicylic acid, 4-hydroxybenzoic
acid, and other benzoates. Journal of Biological Chemistry 2002, 277:586-592.
318. Lim EK, Higgins GS, Li Y, Bowles DJ: Regioselectivity of glucosylation of caffeic
acid by a UDP-glucose: glucosyltransferase is maintained in planta. Biochemical
Journal 2003, 373:987-992.
319. Lim EK, Ashford DA, Hou BK, Jackson RG, Bowles DJ: Arabidopsis
glycosyltransferases as biocatalysts in fermentation for regioselective synthesis of
diverse quercetin glucosides. Biotechnology and Bioengineering 2004, 87:623-631.
320. Hirayama C, Ono H, Tamura Y, Konno K, Nakamura M: Regioselective formation of
quercetin 5-O-glucoside from orally administered quercetin in the silkworm,
Bombyx mori. Phytochemistry 2008, 69:1141-1149.
276
Literaturverzeichnis
321. Chen YK, Chen SQ, Li X, Zeng S: Quantitative regioselectivity of glucuronidation of
quercetin by recombinant UDP-glucuronosyltransferases 1A9 and 1A3 using
enzymatic kinetic parameters. Xenobiotica 2005, 35:943-954.
322. He XZ, Li WS, Blount JW, Dixon RA: Regioselective synthesis of plant (iso)flavone
glycosides in Escherichia coli. Applied Microbiology and Biotechnology 2008, 80:253260.
323. Coffman BL, Rios GR, King CD, Tephly TR: Human UGT2B7 catalyzes morphine
glucuronidation. Drug Metabolism and Disposition 1997, 25:1-4.
324. Cantarel BL, Coutinho PM, Rancurel C, Bernard T, Lombard V, Henrissat B: The
Carbohydrate-Active EnZymes database (CAZy): an expert resource for
Glycogenomics. Nucleic Acids Research 2008.
325. Jansen PL, Bosma PJ, Chowdhury JR: Molecular biology of bilirubin metabolism.
Progress in Liver Diseases 1995, 13:125-150.
326. Owens IS, Ritter JK: Gene structure at the human UGT1 locus creates diversity in
isozyme structure, substrate-specificity, and regulation. Progress in Nucleic Acid
Research and Molecular Biology, Vol 51 1995, 51:305-338.
327. Ciotti M, Yeatman MT, Sokol RJ, Owens IS: Altered coding for a strictly conserved
di-glycine in the major bilirubin UDP-glucuronosyltransferase of a Crigler-Najjar
type I patient. Journal of Biological Chemistry 1995, 270:3284-3291.
328. Strassburg CP, Manns MP, Tukey RH: Differential down-regulation of the UDPglucuronosyltransferase 1A locus is an early event in human liver and biliary
cancer. Cancer Research 1997, 57:2979-2985.
329. Nadia M, Giancarlo LM, Marzia I, FrancoF V, Nicoletta CP, Anacleto M: Cell cultures
of Ajuga reptans L. to bioconvert emodin and aloe-emodin: an HPLC/ESI/MS
investigation. Enzyme and Microbial Technology 2005, 36:399-408.
330. Lim EK, Ashford DA, Bowles DJ: The synthesis of small-molecule rhamnosides
through the rational design of a whole-cell biocatalysis system. ChemBioChem 2006,
7:1181-1185.
331. Jackson RG, Kowalczyk M, Li Y, Higgins G, Ross J, Sandberg G, Bowles DJ: Overexpression of an Arabidopsis gene encoding a glucosyltransferase of indole-3-acetic
acid: phenotypic characterisation of transgenic lines. Plant Journal 2002, 32:573583.
332. Chong J, Baltz R, Schmitt C, Beffa R, Fritig B, Saindrenan P: Downregulation of a
pathogen-responsive tobacco UDP-Glc : phenylpropanoid glucosyltransferase
reduces scopoletin glucoside accumulation, enhances oxidative stress, and weakens
virus resistance. Plant Cell 2002, 14:1093-1107.
333. Poppenberger B, Berthiller F, Lucyshyn D, Sieberer T, Schuhmacher R, Krska R,
Kuchler K, Glossl J, Luschnig C, Adam G: Detoxification of the Fusarium mycotoxin
deoxynivalenol by a UDP-glucosyltransferase from Arabidopsis thaliana. Journal of
Biological Chemistry 2003, 278:47905-47914.
Literaturverzeichnis
277
334. Martinoia E, Klein M, Geisler M, Bovet L, Forestier C, Kolukisaoglu U, Müller-Rober
B, Schulz B: Multifunctionality of plant ABC transporters - more than just
detoxifiers. Planta 2002, 214:345-355.
335. WeymouthWilson AC: The role of carbohydrates in biologically active natural
products. Natural Product Reports 1997, 14:99-110.
336. Luzhetskyy A, Bechthold A: Features and applications of bacterial
glycosyltransferases: current state and prospects. Applied Microbiology and
Biotechnology 2008, 80:945-952.
337. Borisova SA, Kim HJ, Pu XT, Liu HW: Glycosylation of acyclic and cyclic aglycone
substrates by macrolide glycosyltransferase DesVII/DesVIII: Analysis and
implications. ChemBioChem 2008, 9:1554-1558.
338. Dürr C, Hoffmeister D, Wohlert SE, Ichinose K, Weber M, von Mulert U, Thorson JS,
Bechthold A: The glycosyltransferase UrdGT2 catalyzes both C- and O-glycosidic
sugar transfers. Angewandte Chemie-International Edition 2004, 43:2962-2965.
339. Minami A, Uchida R, Eguchi T, Kakinuma K: Enzymatic approach to unnatural
glycosides with diverse aglycon scaffolds using glycosyltransferase VinC. Journal of
the American Chemical Society 2005, 127:6148-6149.
340. Quiros LM, Aguirrezabalaga I, Olano C, Mendez C, Salas JA: Two
glycosyltransferases and a glycosidase are involved in oleandomycin modification
during its biosynthesis by Streptomyces antibioticus. Molecular Microbiology 1998,
28:1177-1185.
341. Yang M, Proctor MR, Bolam DN, Errey JC, Field RA, Gilbert HJ, Davis BG: Probing
the breadth of macrolide glycosyltransferases: in vitro remodeling of a polyketide
antibiotic creates active bacterial uptake and enhances potency. Journal of the
American Chemical Society 2005, 127:9336-9337.
342. Hatano T, Uebayashi H, Ito H, Shiota S, Tsuchiya T, Yoshida T: Phenolic constituents
of Cassia seeds and antibacterial effect of some naphthalenes and anthraquinones
on methicillin-resistant Staphylococcus aureus. Chemical & Pharmaceutical Bulletin
1999, 47:1121-1127.
343. Struckmeier S: Naturfarbstoffe: Farben mit Geschichte. Chemie in unserer Zeit 2003,
37:402-409.
344. Hammel KE, Green B, Wen ZG: Ring fission of anthracene by a eukaryote.
Proceedings of the National Academy of Sciences of the United States of America 1991,
88:10605-10608.
345. Pasti MB, Crawford DL: Relationships between the abilities of streptomycetes to
decolorize 3 anthron-type dyes and to degrade lignocellulose. Canadian Journal of
Microbiology 1991, 37:902-907.
346. Stachulski AV, Jenkins GN: The synthesis of O-glucuronides. Natural Product
Reports 1998, 15:173-186.
278
Literaturverzeichnis
347. Aherne SA, O'Brien NM: Dietary flavonols: Chemistry, food content, and
metabolism. Nutrition 2002, 18:75-81.
348. Bouktaib M, Atmani A, Rolando C: Regio- and stereoselective synthesis of the major
metabolite of quercetin, quercetin-3-O-beta-D-glucuronide. Tetrahedron Letters
2002, 43:6263-6266.
349. Langenhan JM, Griffith BR, Thorson JS: Neoglycorandomization and
chemoenzymatic glycorandomization: Two complementary tools for natural
product diversification. Journal of Natural Products 2005, 68:1696-1711.
350. Bode HB, Müller R: Possibility of bacterial recruitment of plant genes associated
with the biosynthesis of secondary metabolites. Plant Physiology 2003, 132:11531161.
351. Mackenzie PI, Owens IS, Burchell B, Bock KW, Bairoch A, Belanger A,
FournelGigleux S, Green M, Hum DW, Iyanagi T, Lancet D, Louisot P, Magdalou J,
Chowdhury JR, Ritter JK, Schachter H, Tephly TR, Tipton KF, Nebert DW: The UDP
glycosyltransferase gene superfamily: recommended nomenclature update based
on evolutionary divergence. Pharmacogenetics 1997, 7:255-269.
352. Boll R: Untersuchungen zur Biosynthese und Regulation von OligosaccharidAntibiotika. Dissertation, Albert-Ludwigs-Universität Freiburg im Breisgau 2005.
353. Berner M, Krug D, Bihlmaier C, Vente A, Müller R, Bechthold A: Genes and enzymes
involved in caffeic acid biosynthesis in the actinomycete Saccharothrix espanaensis.
Journal of Bacteriology 2006, 188:2666-2673.
354. Lairson LL, Henrissat B, Davies GJ, Withers SG: Glycosyltransferases: structures,
functions, and mechanisms. Annual Review of Biochemistry 2008, 77:521-555.
355. Provencher C, LaPointe G, Sirois S, Van Calsteren MR, Roy D: Consensus-degenerate
hybrid oligonucleotide primers for amplification of priming glycosyltransferase
genes of the exopolysaccharide locus in strains of the Lactobacillus casei group.
Applied and Environmental Microbiology 2003, 69:3299-3307.
356. Bechthold A: persönliche Mitteilung 2005.
357. Peintner I: persönliche Mitteilung 2008.
358. Erb A: persönliche Mitteilung 2008.
359. Petkovic H, Cullum J, Hranueli D, Hunter IS, Peric-Concha N, Pigac J, Thamchaipenet
A, Vujaklija D, Long PF: Genetics of Streptomyces rimosus, the oxytetracycline
producer. Microbiology and Molecular Biology Reviews 2006, 70:704-728.
360. Rassoulzadegan M, Grandjean V, Gounon P, Vincent S, Gillot I, Cuzin F: RNAmediated non-mendelian inheritance of an epigenetic change in the mouse. Nature
2006, 441:469-474.
361. Ashe A, Whitelaw E: Another role for RNA: a messenger across generations. Trends
in Genetics 2007, 23:8-10.
Literaturverzeichnis
279
362. Lolle SJ, Victor JL, Young JM, Pruitt RE: Genome-wide non-mendelian inheritance
of extra-genomic information in Arabidopsis. Nature 2005, 434:505-509.
363. Krishnaswamy L, Peterson T: An alternate hypothesis to explain the high frequency
of "revertants" in hothead mutants in Arabidopsis. Plant Biology 2007, 9:30-31.
364. Minkel JR: RNA to the rescue: novel inheritance patterns violate Mendel's Laws,
Artikel mit Zitat von Pruitt RE. Scientific American 2005, 292:20-22.
365. Fedoryshyn M, Welle E, Bechthold A, Luzhetskyy A: Functional expression of the
Cre recombinase in actinomycetes. Applied Microbiology and Biotechnology 2008,
78:1065-1070.
366. Lin YS, Kieser HM, Hopwood DA, Chen CW: The chromosomal DNA of
Streptomyces lividans 66 is linear. Molecular Microbiology 1993, 10:923-933.
367. Chen CW, Huang CH, Lee HH, Tsai HH, Kirby R: Once the circle has been broken:
dynamics and evolution of Streptomyces chromosomes. Trends in Genetics 2002,
18:522-529.
368. Altenbuchner J, Cullum J: Structure of an amplifiable DNA-sequence in
Streptomyces lividans 66. Molecular & General Genetics 1985, 201:192-197.
369. Redenbach M, Flett F, Piendl W, Glocker I, Rauland U, Wafzig O, Kliem R, Leblond P,
Cullum J: The Streptomyces lividans 66 chromosome contains a 1 Mb deletogenic
region flanked by 2 amplifiable regions. Molecular & General Genetics 1993,
241:255-262.
370. Fischer G, Decaris B, Leblond P: Occurrence of deletions, associated with genetic
instability in Streptomyces ambofaciens, is independent of the linearity of the
chromosomal DNA. Journal of Bacteriology 1997, 179:4553-4558.
371. Hornemann U, Otto CJ, Hoffman GG, Bertinuson AC: Spectinomycin resistance and
associated DNA-amplification in Streptomyces achromogenes subsp. rubradiris.
Journal of Bacteriology 1987, 169:2360-2366.
372. Chater KF: Regulation of sporulation in Streptomyces coelicolor A3(2): a checkpoint
multiplex? Current Opinion in Microbiology 2001, 4:667-673.
373. Zelder O, Hauer B: Environmentally directed mutations and their impact on
industrial biotransformation and fermentation processes. Current Opinion in
Microbiology 2000, 3:248-251.
374. Leblond P, Demuyter P, Moutier L, Laakel M, Decaris B, Simonet JM:
Hypervariability, a new phenomenon of genetic instability, related to DNAamplification in Streptomyces ambofaciens. Journal of Bacteriology 1989, 171:419423.
375. Novakova R, Bistakova J, Homerova D, Rezuchova B, Kormanec J: Cloning and
characterization of a polyketide synthase gene cluster involved in biosynthesis of a
proposed angucycline-like polyketide auricin in Streptomyces aureofaciens CCM
3239. Gene 2002, 297:197-208.
280
Literaturverzeichnis
376. Novakova R, Bistakova J, Homerova D, Rezuchova B, Feckova L, Kormanec J:
Cloning and characterization of a new polyketide synthase gene cluster in
Streptomyces aureofaciens CCM 3239. DNA Sequence 2004, 15:188-195.
377. Lomovskaya N, Otten SL, Doi-Katayama Y, Fonstein L, Liu XC, Takatsu T, InventiSolari A, Filippini S, Torti F, Colombo AL, Hutchinson CR: Doxorubicin
overproduction in Streptomyces peucetius: Cloning and characterization of the
dnrU ketoreductase and dnrV genes and the doxA cytochrome P-450 hydroxylase
gene. Journal of Bacteriology 1999, 181:305-318.
378. Dickens ML, Priestley ND, Strohl WR: In vivo and in vitro bioconversion of epsilonrhodomycinone glycoside to doxorubicin: Functions of dauP, dauK, and doxA.
Journal of Bacteriology 1997, 179:2641-2650.
379. Trefzer A, Hoffmeister D, Künzel E, Stockert S, Weitnauer G, Westrich L, Rix U,
Fuchser J, Bindseil KU, Rohr J, Bechthold A: Function of glycosyltransferase genes
involved in urdamycin A biosynthesis. Chemistry & Biology 2000, 7:133-142.
380. Westrich L, Domann S, Faust B, Bedford D, Hopwood DA, Bechthold A: Cloning and
characterization of a gene cluster from Streptomyces cyanogenus S136 probably
involved in landomycin biosynthesis. FEMS Microbiology Letters 1999, 170:381-387.
381. Wang LR, Mcvey J, Vining LC: Cloning and functional analysis of a
phosphopantetheinyl transferase superfamily gene associated with jadomycin
biosynthesis in Streptomyces venezuelae ISP5230. Microbiology-SGM 2001,
147:1535-1545.
382. Eckardt K, Tresselt D, Schumann G, Ihn W, Wagner C: Isolation and chemical
structure of aklanonic acid, an early intermediate in the biosynthesis of
anthracyclines. Journal of Antibiotics 1985, 38:1034-1039.
383. Filippini S, Solinas MM, Breme U, Schluter MB, Gabellini D, Biamonti G, Colombo
AL, Garofano L: Streptomyces peucetius daunorubicin biosynthesis gene, dnrFsequence and heterologous expression. Microbiology-UK 1995, 141:1007-1016.
384. Abdelfattah MS, Rohr J: Premithramycinone G, an early shunt product of the
mithramycin biosynthetic pathway accumulated upon inactivation of oxygenase
MtmOII. Angewandte Chemie-International Edition 2006, 45:5685-5689.
385. Denissenko MF, Pao A, Tang MS, Pfeifer GP: Preferential formation of
benzo[a]pyrene adducts at lung cancer mutational hotspots in P53. Science 1996,
274:430-432.
386. Tang L, Shah S, Chung L, Carney J, Katz L, Khosla C, Julien B: Cloning and
heterologous expression of the epothilone gene cluster. Science 2000, 287:640-642.
387. Shah S, Xue Q, Tang L, Carney JR, Betlach M, McDaniel R: Cloning,
characterization and heterologous expression of a polyketide synthase and P-450
oxidase involved in the biosynthesis of the antibiotic oleandomycin. Journal of
Antibiotics 2000, 53:502-508.
Literaturverzeichnis
281
388. Mendes MV, Recio E, Fouces R, Luiten R, Martin JF, Aparicio JF: Engineered
biosynthesis of novel polyenes: a pimaricin derivative produced by targeted gene
disruption in Streptomyces natalensis. Chemistry & Biology 2001, 8:635-644.
389. Rix U, Fischer C, Remsing LL, Rohr J: Modification of post-PKS tailoring steps
through combinatorial biosynthesis. Natural Product Reports 2002, 19:542-580.
390. Fritzsche K, Ishida K, Hertweck C: Orchestration of discoid polyketide cyclization in
the resistomycin pathway. Journal of the American Chemical Society 2008, 130:83078316.
391. Hertweck C, Xiang LK, Kalaitzis JA, Cheng Q, Palzer M, Moore BS: Contextdependent behavior of the enterocin iterative polyketide synthase: a new model for
ketoreduction. Chemistry & Biology 2004, 11:461-468.
392. Hadfield AT, Limpkin C, Teartasin W, Simpson TJ, Crosby J, Crump MP: The crystal
structure of the ActIII actinorhodin polyketide reductase: proposed mechanism for
ACP and polyketide binding. Structure 2004, 12:1865-1875.
393. Thompson CJ, Ward JM, Hopwood DA: Cloning of antibiotic resistance and
nutritional genes in streptomycetes. Journal of Bacteriology 1982, 151:668-677.
394. Sambrook J, Fritsch EF, Maniatis T: Molecular cloning a laboratory manual, second
edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989.
395. Kominek LA: Biosynthesis of novobiocin by Streptomyces niveus. Antimicrobial
Agents and Chemotherapy 1972, 1:123-134.
396. Schimana J, Fiedler HP, Groth I, Süssmuth R, Beil W, Walker M, Zeeck A:
Simocyclinones, novel cytostatic angucyclinone antibiotics produced by
Streptomyces antibioticus Tü 6040 I. Taxonomy, fermentation, isolation and
biological activities. Journal of Antibiotics 2000, 53:779-787.
397. Raleigh EA, Benner J, Bloom F, Braymer HD, Decruz E, Dharmalingam K, Heitman J,
Noyerweidner M, Piekarowicz A, Kretz PL, Short JM, Woodcock D: Nomenclature
relating to restriction of modified DNA in Escherichia coli. Journal of Bacteriology
1991, 173:2707-2709.
398. Macneil DJ, Gewain KM, Ruby CL, Dezeny G, Gibbons PH, Macneil T: Analysis of
Streptomyces avermitilis genes required for avermectin biosynthesis utilizing a
novel integration vector. Gene 1992, 111:61-68.
399. Hoffmeister D: persönliche Mitteilung 2006.
400. www.lgcstandards-atcc.org 2008.
401. Kinoshita N, Igarashi M, Ikeno S, Hori M, Hamada M: Saccharothrix tangerinus sp.
nov., the producer of the new antibiotic formamicin: taxonomic studies.
Actinomycetologica 1999, 13:20-31.
282
Literaturverzeichnis
402. Labeda DP, Kroppenstedt RM: Proposal of Umezawaea gen. nov., a new genus of the
Actinosynnemataceae related to Saccharothrix, and transfer of Saccharothrix
tangerinus Kinoshita et al. 2000 as Umezawaea tangerina gen. nov., comb. nov.
International Journal of Systematic and Evolutionary Microbiology 2007, 57:27582761.
403. Salas AP, Zhu L, Sanchez C, Brana AF, Rohr J, Mendez C, Salas JA: Deciphering the
late steps in the biosynthesis of the anti-tumour indolocarbazole staurosporine:
sugar donor substrate flexibility of the StaG glycosyltransferase. Molecular
Microbiology 2005, 58:17-27.
404. Anderle C, Hennig S, Kammerer B, Li SM, Wessjohann L, Gust B, Heide L: Improved
mutasynthetic approaches for the production of modified aminocoumarin
antibiotics. Chemistry & Biology 2007, 14:955-967.
405. Short JM, Fernandez JM, Sorge JA, Huse WD: Lambda-Zap - a bacteriophage
lambda-expression vector with in vivo excision properties. Nucleic Acids Research
1988, 16:7583-7600.
406. Produktkatalog. Stratagene, La Jolla 2008.
407. Produktkatalog. Promega, Madison 2008.
408. BlondeletRouault MH, Weiser J, Lebrihi A, Branny P, Pernodet JL: Antibiotic
resistance gene cassettes derived from the Omega interposon for use in E. coli and
Streptomyces. Gene 1997, 190:315-317.
409. Bierman M, Logan R, Obrien K, Seno ET, Rao RN, Schoner BE: Plasmid cloning
vectors for the conjugal transfer of DNA from Escherichia coli to Streptomyces spp.
Gene 1992, 116:43-49.
410. Trefzer A, Fischer C, Stockert S, Westrich L, Künzel E, Girreser U, Rohr J, Bechthold
A: Elucidation of the function of two glycosyltransferase genes (lanGT1 and
lanGT4) involved in landomycin biosynthesis and generation of new
oligosaccharide antibiotics. Chemistry & Biology 2001, 8:1239-1252.
411. Zhang YM, Muyrers JPP, Rientjes J, Stewart F: Phage annealing proteins promote
oligonucleotide-directed mutagenesis in Escherichia coli and mouse ES cells. BMC
Molecular Biology 2003, 4.
412. Hoffmeister D, Ichinose K, Bechthold A: Two sequence elements of
glycosyltransferases involved in urdamycin biosynthesis are responsible for
substrate specificity and enzymatic activity. Chemistry & Biology 2001, 8:557-567.
413. Yanischperron C, Vieira J, Messing J: Improved M13 phage cloning vectors and host
strains - nucleotide-sequences of the M13 MP18 and PUC19 Vectors. Gene 1985,
33:103-119.
414. Produktkatalog. New England Biolabs, Ipswich 2008.
Literaturverzeichnis
283
415. Doumith M, Weingarten P, Wehmeier UF, Salah-Bey K, Benhamou B, Capdevila C,
Michel JM, Piepersberg W, Raynal MC: Analysis of genes involved in 6-deoxyhexose
biosynthesis and transfer in Saccharopolyspora erythraea. Molecular and General
Genetics 2000, 264:477-485.
416. Luzhetskyy A, Zhu LL, Gibson M, Fedoryshyn M, Durr C, Hofmann C, Hoffmeister D,
Ostash B, Mattingly C, Adams V, Fedorenko V, Rohr J, Bechthold A: Generation of
novel landomycins M and O through targeted gene disruption. ChemBioChem 2005,
6:675-678.
417. Cohen SN, Chang ACY, Hsu L: Nonchromosomal antibiotic resistance in bacteria genetic transformation of Escherichia coli by R-factor DNA. Proceedings of the
National Academy of Sciences of the United States of America 1972, 69:2110-2114.
418. Dower WJ, Miller JF, Ragsdale CW: High-efficiency transformation of Escherichia
coli by high-voltage electroporation. Nucleic Acids Research 1988, 16:6127-6145.
419. Birnboim HC, Doly J: Rapid alkaline extraction procedure for screening
recombinant plasmid DNA. Nucleic Acids Research 1979, 7:1513-1523.
420. Nathans D, Smith HO: Restriction endonucleases in analysis and restructuring of
DNA-molecules. Annual Review of Biochemistry 1975, 44:273-293.
421. Weiss B, Jacquemi A, Live TR, Fareed GC, Richards CC: Enzymatic breakage and
joining of deoxyribonucleic acid. 6. Further purification and properties of
polynucleotide ligase from Escherichia coli infected with bacteriophage T4. Journal
of Biological Chemistry 1968, 243:4543-4555.
422. Murphy KC: Use of bacteriophage lambda recombination functions to promote
gene replacement in Escherichia coli. Journal of Bacteriology 1998, 180:2063-2071.
423. Yu DG, Ellis HM, Lee EC, Jenkins NA, Copeland NG, Court D: An efficient
recombination system for chromosome engineering in Escherichia coli. Proceedings
of the National Academy of Sciences of the United States of America 2000, 97:59785983.
424. Gust B, Challis GL, Fowler K, Kieser T, Chater KF: PCR-targeted Streptomyces gene
replacement identifies a protein domain needed for biosynthesis of the
sesquiterpene soil odor geosmin. Proceedings of the National Academy of Sciences of
the United States of America 2003, 100:1541-1546.
425. Hamilton CM, Aldea M, Washburn BK, Babitzke P, Kushner SR: New method for
generating deletions and gene replacements in Escherichia coli. Journal of
Bacteriology 1989, 171:4617-4622.
426. Saiki RK, Scharf S, Faloona F, Mullis KB, Horn GT, Erlich HA, Arnheim N:
Enzymatic amplification of beta-globin genomic sequences and restriction site
analysis for diagnosis of sickle-cell anemia. Science 1985, 230:1350-1354.
427. Müller H-J: PCR - Polymerase-Kettenreaktion. Spektrum Akademischer Verlag,
Heidelberg 2001.
284
Literaturverzeichnis
428. Mazodier P, Davies J: Gene-transfer between distantly related bacteria. Annual
Review of Genetics 1991, 25:147-171.
429. Blaesing F, Mühlenweg A, Vierling S, Ziegelin G, Pelzer S, Lanka E: Introduction of
DNA into actinomycetes by bacterial conjugation from E. coli - an evaluation of
various transfer systems. Journal of Biotechnology 2005, 120:146-161.
430. Hillemann D, Pühler A, Wohlleben W: Gene disruption and gene replacement in
Streptomyces via single-stranded DNA transformation of integration vectors.
Nucleic Acids Research 1991, 19:727-731.
431. Ogawara H: Production and property of beta-lactamases in Streptomyces.
Antimicrobial Agents and Chemotherapy 1975, 8:402-408.
432. Chater KF, Losick R: In Bacteria as Multicellular Organisms. Edited by Shapiro JA,
Dworkin M. Oxford University Press, New York 1997:149-182.
433. Branda CS, Dymecki SM: Talking about a revolution: the impact of site-specific
recombinases on genetic analyses in mice. Developmental Cell 2004, 6:7-28.
434. Senecoff JF, Bruckner RC, Cox MM: The Flp-recombinase of the yeast 2-micro-m
plasmid - characterization of its recombination site. Proceedings of the National
Academy of Sciences of the United States of America 1985, 82:7270-7274.
435. Stark WM, Boocock MR, Sherratt DJ: Catalysis by site-specific recombinases. Trends
in Genetics 1992, 8:432-439.
436. Schweizer HP: Applications of the Saccharomyces cerevisiae Flp-FRT system in
bacterial genetics. Journal of Molecular Microbiology and Biotechnology 2003, 5:6777.
437. Khodakaramian G, Lissenden S, Gust B, Moir L, Hoskisson PA, Chater KF, Smith
MCM: Expression of Cre recombinase during transient phage infection permits
efficient marker removal in Streptomyces. Nucleic Acids Research 2006, 34:e20.
438. Gustafsson C, Govindarajan S, Minshull J: Codon bias and heterologous protein
expression. Trends in Biotechnology 2004, 22:346-353.
439. Laemmli UK: Cleavage of structural proteins during assembly of head of
bacteriophage T4. Nature 1970, 227:680-685.
440. Still WC, Kahn M, Mitra A: Rapid chromatographic technique for preparative
separations with moderate resolution. Journal of Organic Chemistry 1978, 43:29232925.
441. Makarov A, Denisov E, Kholomeev A, Baischun W, Lange O, Strupat K, Horning S:
Performance evaluation of a hybrid linear ion trap/orbitrap mass spectrometer.
Analytical Chemistry 2006, 78:2113-2120.
442. Rutherford K, Parkhill J, Crook J, Horsnell T, Rice P, Rajandream MA, Barrell B:
Artemis: sequence visualization and annotation. Bioinformatics. 2000, 16:944-945.
Literaturverzeichnis
285
443. Tippmann HF: Analysis for free: comparing programs for sequence analysis.
Briefings in Bioinformatics 2004, 5:82-87.
444. Altschul SF, Madden TL, Schaffer AA, Zhang JH, Zhang Z, Miller W, Lipman DJ:
Gapped BLAST and PSI-BLAST: a new generation of protein database search
programs. Nucleic Acids Research 1997, 25:3389-3402.
445. Thompson JD, Higgins DG, Gibson TJ: CLUSTAL W: improving the sensitivity of
progressive multiple sequence alignment through sequence weighting, positionspecific gap penalties and weight matrix choice. Nucleic Acids Research 1994,
22:4673-4680.
446. Tatusov RL, Koonin EV, Lipman DJ: A genomic perspective on protein families.
Science 1997, 278:631-637.
286
Anhang
7
Anhang
7.1
Abkürzungsverzeichnis
Abkürzungen für Nukleotide
Tab. 58: Abkürzungen für Nukleotide inklusive Wobbles.
A Adenin
M A+C
W A+T
B T+C+G
R A+G
Y C+T
C
S
Cytosin
C+G
G Guanin
T Thymin
D
H
M
R
W
Asparaginsäure
Histidin
Methionin
Arginin
Tryptophan
E
I
N
S
Y
Abkürzungen für Aminosäuren
Tab. 59: Abkürzungen für Aminosäuren.
A
F
K
P
T
Alanin
Phenylalanin
Lysin
Prolin
Threonin
C
G
L
Q
V
Cystein
Glycin
Leucin
Glutamin
Valin
Glutaminsäure
Isoleucin
Asparagin
Serin
Tyrosin
Allgemeines Abkürzungsverzeichnis
Tab. 60: Allgemeines Abkürzungsverzeichnis und Glossar. Enthalten sind die Kurzbezeichnungen für Gene und
DNA-Bereiche. Gene und DNA-Bereiche werden kursiv, mit kleinem Anfangsbuchstaben geschrieben (zum
Beispiel msc15), davon abgeleitete Proteine mit großem Anfangsbuchstaben (zum Beispiel Msc14) und
zugeordnete Sekundärstoffe in Großbuchstaben (zum Beispiel MSC-X1).
Abkürzung
aac(3)IV
aadA
Abb.
acp
AK
APCI
apra
AS
attP
ATP
bidest.
bla
bp
BSA
bzw.
carb
CD
Erklärung
(3’)-N-Aminoglykosidacetyltransferasegen
Aminoglykosid-3''-adenyltransferasegen
Abbildung
Gen für das Acyl-Carrier-Protein
Arbeitskreis
atmospheric pressure chemical ionization
Apramycinresistenzgen, zum Beispiel aac(3)IV
Aminosäure(n)
phage attachment site, Phagenanlagerungssequenz
Adenosintriphosphat
bidestilliert
β-Lactamasegen
Basenpaar(e)
Bovines Serumalbumin
beziehungsweise
Carbenicillinresistenzgen (hier: β-Lactamasegen)
Circulardichroismus
Anhang
Abkürzung
Cluster
CoA
Contig
ca.
∆
δ
DAD
DB
DC
d. h.
DMF
DMSO
DNA
DSMZ
E.
EDTA
ermE-up-Promotor
ESI
et al.
FAD
FRT
dNTP
glatte Enden
GT
h
HOAc
HPLC
In-frame-Deletion
IPTG
J
kana
klebrige Enden
kb
ks
ksα
ksβ (= clf)
L
λ
lacZα
LC
loxP
M
M:
Mr:
Mberechnet:
287
Erklärung
hier stets ein Sekundärstoffbiosynthesegencluster
Coenzym A
DNA-Bereich durchgehend bekannter Sequenz
circa, ungefähr
Mutante
Chemische Verschiebung [ppm]
Dioden-Array-Detektor
Doppelbindung
Dünnschichtchromatographie
das heißt
Dimethylformamid
Dimethylsulfoxid
Desoxyribonukleinsäure
Deutsche Sammlung von Mikroorganismen und Zellkulturen
Escherichia
Ethylendiamintetraessigsäure
Derivat des Promotors des ermE-Gens
electrospray ionization
und andere
Flavin-Adenin-Dinukleotid
FRT-site, Rekombinationssequenz der Flp-Rekombinase
Nukleotide, DNA-Bausteine
glatte Enden liegen vor, wenn am Ende des DNADoppelstranges beide Einzelstränge die gleiche Länge haben
Glykosyltransferase
Stunde(n)
Essigsäure
Hochdruckflüssigchromatographie
Deletion ohne Verschiebung des Leserahmens
Isopropyl-β-D-thiogalaktopyranosid
Kopplungskonstante [Hz]
Kanamycinresistenzgen
nach bestimmten DNA-Restriktionsspaltungen vorliegende
Enden mit Nukleotidüberhängen eines Einzelstranges
Kilobasenpaar(e)
Gen einer Ketosynthase(untereinheit)
Gen der Ketosynthase Untereinheit α
Gen der Ketosynthase Untereinheit β (chain length factor)
Liter
Wellenlänge
Gen des lac-Operons, s. 5.5.1.3
liquid chromatography, Flüssigchromatographie
loxP-site, Rekombinationssequenz der Cre-Rekombinase
als Größe: Molmasse [g/mol], als Einheit: Molar [mol/L]
Nominalmasse
relative Molekülmasse
monoisotopische Masse (häufigste Isotope)
288
Abkürzung
m/z
mec
MeOH
MHK
min
MS
msc
MSD
msn
MCS
NaOH
NCBI
n. d.
NMR
nov
nt
OD
ORF
oriR
oriT
PAGE
PCR
PEG
pok
Ref.
RNA
RT
s
s.
S.
SAM
SDS
sp. / spp.
spec
Tab.
Template
THF
tipA-promotor
tsr
u
UV
rpm
WT
vgl.
VIS
X-Gal
Anhang
Erklärung
Masse / Ladung-Verhältnis
Gene des mec-Clusters aus S. sp. Gö C4/4
Methanol
Minimale Hemmkonzentration
Minute(n)
Massenspektrometrie
Gene des msc-Contigs aus S. sp. Gö C4/4
Massendetektor
Gene des msn-Clusters aus S. sp. Gö C4/4
multiple cloning site, DNA-Bereich eines Vektors mit
mehreren Endonukleaseerkennungsstellen.
Natriumhydroxid
National Center for Biotechnology Information
nicht detektiert
Kernmagnetische Resonanzspektroskopie
Gene des nov-Clusters aus S. spheroides NCIMB 11891
Nukleotid(e)
optische Dichte
open reading frame, ein mögliches Gen
origin of replication, Replikationsursprung
origin of transfer, Transferursprung
Polyacrylamidgelelektrophorese
Polymerasekettenreaktion
Polyethylenglykol
Gene des pok-Clusters aus S. diastatochromogenes Tü6028
Referenz
Ribonukleinsäure
Raumtemperatur
Sekunde(n)
siehe
Streptomyces oder Saccharothrix
S-Adenosyl-L-methionin
Natriumdodecylsulfat
species, Art / Arten
Spectinomycinresistenzgen, zum Beispiel aadA
Tabelle
Matrize, Vorlage
Tetrahydrofolat / Tetrahydrofolsäure
Thiostrepton induzierbarer Promotor
Thiostreptonresistenzgen
unit(s), Einheit(en)
Ultraviolett
Umdrehungen pro Minute
Wildtyp
vergleiche
sichtbares Licht (Wellenlängenbereich 400 nm - 800 nm)
5-Brom-4-chlor-3-indoyl-β-D-galaktopyranosid
289
Anhang
7.2
NMR-Tabellen und -Spektren
Übersicht
EmoPro1 (8-O-α-L-Rhamnosylemodin)
S. 290
EmoPro2 (1-O-α-L-Rhamnosylemodin)
S. 292
EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin)
S. 294
AliPro1 (2-O-α-L-Rhamnosylalizarin)
S. 296
Ant14Pro1 (1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon)
S. 298
QuercPro1 (3-O-α-L-Rhamnosylquercetin = Quercitrin)
S. 300
Novobiocinsäure
S. 302
NovPro1 (11-Hydroxynovobiocinsäure)
S. 304
NovPro3 (10-Hydroxynovobiocinsäure)
S. 306
NovPro5 (4'-O-α-L-Rhamnosylnovobiocinsäure)
S. 307
290
Anhang
EmoPro1 (8-O-α-L-Rhamnosylemodin)
oranger Feststoff
C21H20O9
O
Mr: 416.38
1'
2'
O
+
HR-ESI-MS: berechnet 417.11801 [M+H]
gefunden 417.11808 [M+H]+
Abweichung 0.17 ppm
8
7
O
12
6
HO
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
OH
11
5
9
10
6'
3'
13
4'
OH
OH
OH
1
2
3
14
O
4
1
H δ/ppm
(m, J/Hz)
13
C δ/ppm
161.81
C δ/ppm
14.31 (s)
2a
3
3-CH3
7.04 (dd, 1.8, 0.7) 123.62
144.96
2.36 (s)
21.20
4a
5
6
7
8
9
10
11
12
13
14
1’
3’
7.36 (dd, 1.8, 0.5) 118.17
6.89 (d, 2.3)
113.36
161.81
6.42 (d, 2.3)
109.66
160.49
183.65b
183.72b
136.21c
107.6*
114.97
132.24c
5.38 (d, 1.2)
98.36
70.07 or
3.95 (m)x
70.16
70.07 or
70.16
3.94 (m)x
4’
3.30 (t, 9.2)
71.78
17.78; 69.72/70.07/70.16
5’
6’
2’/3’/4’OH
3.57 (qd, 6.2, 9.2) 69.72
1.12 (d, 6.2)
17.78
69.72/70.07/70.16; 71.78
2’
HMBC
13
position
1
1-OH
21.20; 114.97; 118.17;
161.81
H-H-COSY
ROESY
2.36; 7.36
2.36
118.17; 123.62; 144.96
21.20; 114.97; 123.62;
183.65/183.72
107.6; 183.65/183.72
7.04
7.04; 7.36
7.04
6.42
2.36
107.6
6.89
5.38
69.72/70.07/70.16; 160.49 3.94/3.95
3.94/3.95; 6.42
71.78
3.30; 5.38
3.30; 3.57; 5.38
71.78
3.30; 5.38
4.5-5.1 (3 br s)
a, b, c: Zuordnung der Signale gegenseitig austauschbar
*: schwaches 13C-Signal, indirekt über HMBC detektiert
x: Signale überlappen sich gegenseitig
3.30; 3.57; 5.38
1.12; 3.57;
3.94/3.95; 3.57 3.94/3.95
1.12; 3.30;
1.12; 3.30
3.94/3.95
3.57
3.30; 3.57
291
Anhang
EmoPro1: 1H-Spektrum s. 3.1.1.1, Abb. 21
EmoPro1: 13C-Spektrum
200
ppm
150
100
50
0
292
Anhang
EmoPro2 (1-O-α-L-Rhamnosylemodin)
hellgelbe Kristalle
HO
C21H20O9
Mr: 416.38
HO
HR-ESI-MS: berechnet 417.11801 [M+H]
gefunden 417.11809 [M+H]+
Abweichung 0.19 ppm
position
1
1
2
3
3-CH3
7.52 (m)
4
5a
6
7a
8
8-OH
9b
10b
11c
12
13
14c
1’
7.68 (dd, 0.6, 1.6)
7.06 (d, 2.4)
H δ/ppm (m, J/Hz)
8
7
2.46 (s)
6.58 (d, 2.4)
13.40
5.64 (m, <2.0 )
HO
13
C δ/ppm HMBC 13C δ/ppm
156.77
21.50; 118.69; 121.42;
123.31
156.77
146.34
21.50
121.42/123.31; 146.34
21.50; 118.69; 123.31;
182.04
121.42
107.05
108.08; 110.06; 182.04
164.52
108.08
107.05; 110.06; 164.52
164.52
108.08/110.06; 164.52
186.25
182.04
136.60
110.06
118.69
134.05
98.52
70; 156.77
2’
2'-OH
3.96 (m)x
5.09 (d, 4.0)
69.93d
3’
3'-OH
4’
4'-OH
5’
6’
3.96 (m)x
4.80 (d, 5.6)
3.3#
4.92 (d, 5.6)
3.52 (qd, 6.2, 9.3)
1.09 (d, 6.2)
70.05d
70
70
70
70; 71.62
71.62
70.08
17.83
d
70; 71.62
a, b, c, d: Zuordnung der Signale gegenseitig austauschbar
x: Signale überlappen sich gegenseitig
#: vom Wassersignal überlappt
1'
OH O
12
6
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
2'
3'
O
6'
+
OH
11
5
9
10
O
13
1
2
3
14
O
4
H-H-COSY
NOESY
2.46
2.46; 3.52; 5.64
7.52; 7.68
7.52, 7.68
2.46
6.58
2.46
7.06
3.96
3.3; 4.80; 5.09;
5.64
3.96
3.3; 4.80; 5.09;
5.64
3.96
3.52; 3.96; 4.92
3.3
1.09; 3.3
3.52
3.96; 7.52
3.52; 4.80; 5.09; 5.64
3.96
3.52; 4.80; 5.09; 5.64
3.96
1.09
1.09; 3.96; 7.52
3.52; 4.92
293
Anhang
EmoPro2: 1H-Spektrum s. 3.1.1.1, Abb. 21
EmoPro2: 13C-Spektrum
ppm
175
150
125
100
75
50
25
0
294
Anhang
EmoPro3 (6,8-Di-O-α-L-rhamnosylemodin)
O
gelbe Kristalle
1''
C27H30O13
Mr: 562.52
8
HR-ESI-MS: berechnet 563.17592 [M+H]
gefunden 563.17590 [M+H]+
Abweichung 0,03ppm
7
12
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
1'
O
HO
4'
O
5'
HO
3'
11
5
9
10
4''
OH
OH
3''
O
6
6'
6''
2''
O
+
OH
13
OH
1
2
3
14
O
4
2'
OH
1
position
H δ/ppm
(m, J/Hz)
1
1-OH
13.11 (s)
13
C δ/ppm
161.28 or
161.67
2
3
3-CH3
7.15 (m)
2.39 (s)
124.05
147.10
21.34
4
7.44 (d, 1.3)
119.33
5
6a
7.46 (d, 2.4)
108.24
158.88
7
7.22 (d, 2.4)
109.98
161.28 or
161.67
186.57
181.55
136.56
115.78
114.32
131.92
98.65 or
99.01
69.72
8a
9
10
11b
12
13
14b
1’
2’
2’-OH
3’
3’-OH
5.58 (d, 1.6)
3.89 (m)
5.17 (d, 4.4)
3.67 (ddd, 3.3,
5.9, 9.2)
4.80 (d, 6.1)
5’
3.34#
4.92 (d, 5.9)
3.45 (qd, 6.2,
9.3)
6’
1.13 (d, 6.2)
4’
4’-OH
70.17
71.52 or
71.57
70.17
17.82 or
17.86
HMBC
13
C δ/ppm
124.05; 161.4; 114.32
21.34; 114.32; 119.33;
161.4
H-H-COSY
ROESY
2.39, 7.44
2.39
119.33; 124.05; 147.10 7.15, 7.44
21.34; 114.32; 124.05;
181.55; 186.57
2.39, 7.15
109.98; 115.78; 136.56;
161.4; 181.55
7.22
7.15; 7.44
2.39
5.58
108.24; 115.78; 158.88;
161.4
7.46
5.58
70; 158.88; 161.4
69.72-71.57
70; 98.8
3.89, 4.00
3.67, 5.17, 5.58
3.89
3.89; 4.00; 5.105.17; 7.22; 7.46
3.67R; 5.17; 5.58
3.89; 5.58
69.72-71.57
70
3.34, 3.89, 4.79
3.67, 3.95
3.89R, 3.45R
17.84; 70
69.72-71.57
3.45, 3.67, 4.915
3.34
1.125
1.125
17.84; 71.55
1.125, 3.34
1.13; 3.67R
69.72-71.57
3.49
3.34; 3.45; 4.915
295
Anhang
Fortsetzung der NMR-Tabelle für EmoPro3
position
1’’
2’’
2’’-OH
3’’
3’’-OH
4’’
4’’-OH
5’’
6’’
1H δ/ppm
(m, J/Hz)
5.58 (d, 1.6)
4.00 (m)
5.10 (d, 4.4)
3.95 (ddd,
3.3, 5.9, 9.2)
4.78 (d, 6.1)
3.34#
4.91 (d, 5.4)
3.52 (qd, 6.2,
9.3)
1.12 (d, 6.2)
13C δ/ppm
HMBC 13C δ/ppm
H-H-COSY
98.65 or 99.01
69.97
70; 158.88; 161.4
69.72-71.57
70; 98.8
3.89, 4.00
3.95, 5.10, 5.58
4.00
69.97
69.72-71.57
70
17.84; 70
69.72-71.57
3.34, 4.00, 4.79
3.67, 3.95
3.52, 3.95, 4.915
3.34
4.00R, 3.52R
17.84
69.72-71.57
1.125, 3.34
3.49
1.12; 3.95R
3.34; 3.52; 4.915
71.52 or 71.57
70.17
17.82 or 17.86
ROESY
3.89; 4.00; 5.105.17; 7.22; 7.46
3.95R; 5.10; 5.58
4.00; 5.58
1.125
1.125
Die Zuordnung der Zuckerprotonen erfolgte über TOCSY-Experimente.
a, b: Zuordnung der Signale gegenseitig austauschbar
#: vom Wassersignal überlappt
R: nuklearer Overhauser Effekt, der mit 1-D ROESY detektiert wurde
EmoPro3: 1H-Spektrum s. 3.1.1.1, Abb. 15
EmoPro3: 13C-Spektrum
ppm
150
100
50
0
296
Anhang
AliPro1 (2-O-α-L-Rhamnosylalizarin)
roter Feststoff
C20H18O8
O
Mr: 386.36
+
HR-ESI-MS: berechnet 387.10744 [M+H]
gefunden 387.10752 [M+H]+
Abweichung 0.20 ppm
O
8
12
7
6
11
5
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
9
10
O
OH
13
1'
1
OH
2'
O
6'
3'
4'
OH
OH
2
3
14
4
1
position
1
1-OH
2
3
4
5a
6
H δ/ppm
(m, J/Hz)
a
8
9
10
C δ/ppm
153.3
HMBC
13
C δ/ppm
H-H-COSY
NOESY
126.2-126.6;153.3
116.5; 133.1-134.8; 150.3
7.71
7.58
5.60
12.68 (broad s)
7.58 (d, 8.3)
7.71 (d, 8.3)
150.3
121.2
119.4
8.19 (m)
126.6
133.1-134.8
7.94
134.8
b
126.2-126.6
8.19; 8.25
7.94 (m)
134.1
b
126.2-126.6
8.19; 8.25
8.25 (m)
126.5
187.9
180.9
133.1-134.8; 187.9
7.94
70
3.92
3.72; 5.18;
5.60
3.92
3.3; 3.92; 4.86
3.72
3.72; 4.95
3.3
7.94 (m)
7
13
11
133.3b
12
13
133.1b
116.5
14a
1'
5.60 (d, 6.2)
126.2
98.8
2'
2'-OH
3'
3'-OH
4'
4'-OH
3.92 (m)
69.9c
5.18 (broad s)
3.72 (dd, 3.2; 9.2) 70.2
4.86 (broad s)
3.3#
71.4
4.95 (broad s)
5'
6'
3.49 (qd, 6.2; 9.0) 70.0c
1.11 (d, 6.2)
17.7
70
70/71.4
a, b, c: Zuordnung der Signale gegenseitig austauschbar
#: vom Wassersignal überlappt
1.11
3.49
7.58
297
Anhang
AliPro1: 1H-Spektrum
ppm
3.90
3.80
3.70
3.60
3.50
3.30
3.20
8.0
7.0
6.0
5.0
4.0
3.0
2.94
9.0
6.30
10.0
18.93
1.18
1.01
1.00
11.0
0.83
0.98
0.85
12.0
1.00
0.94
1.00
2.02
1.00
1.11
1.13
13.0
ppm
3.40
2.0
1.0
AliPro1: 13C-Spektrum
190 180 170 160 150 140 130 120 110 100
ppm
90
80
70
60
50
40
30
20
10
0
298
Anhang
Ant14Pro1 (1-Amino-4-chlor-2-O-α-L-rhamnosylanthrachinon)
rote Kristalle
O
C20H18ClNO7 Mr: 419.81
+
HR-ESI-MS: berechnet 420.08446 [M+H]
gefunden 420.08330 [M+H]+
Abweichung 2.75 ppm
O
8
12
7
6
11
5
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
9
10
O
NH2 1'
1
13
O
OH
6'
2'
4'
3'
OH
OH
2
14
3
4
Cl
1
position
1
2
3
4
5
6
7
8
9
10
11
12
13
14
H δ/ppm
(m, J/Hz)
7.30 (s)
8.11 (m)
7.86 (m)
7.86 (m)
8.18 (m)
13
C δ/ppm
142.8
147.8
119.5
121.9a
126.3
133.3b
133.5b
125.9
183.5
180.8
133.6b
133.7b
112.2
122.2a
1'
5.65 (d, 1.6)
99.1
2'
2'-OH
3'
3'-OH
4'
4'-OH
5'
6'
4.01 (m)
5.21 (d, 4.5)
3.86 (m)
4.70 (d, 5.9)
3.3#
4.96 (d, 5.5)
3.41 (m)
1.14 (d, 6.0)
69.4
HMBC
13
C δ/ppm
121.9/122.2; 142.8; 147.8; 180.8
7.86
8.11/8.18
8.11/8.18
7.86
69/70; 147.8
4.01
3.86; 5.21;
5.65
4.01
3.3; 4.01; 4.70
3.86
3.86; 4.96
3.3
1.14
3.41
70.1c
17.8
69/70
69/70
69/70; 71.7
a, b, c: Zuordnung der Signale gegenseitig austauschbar
#: vom Wassersignal überlappt
ROESY
5.65
133/134; 180.8
125.9/126.3; 133/134
125.9/126.3; 133/134
133/134; 183.5
70.0c
71.7
H-H-COSY
7.86
8.11/8.18
8.11/8.18
7.86
4.01; 5.21;
7.30
3.3; 5.21; 5.65
4.01; 5.65
3.41
1.14; 4.01
1.14; 3.86
3.3; 3.41
299
Anhang
Ant14Pro1: 1H-Spektrum
water
ppm
8.150
8.100
DMSO
4.000 3.950 3.900 3.850
ppm
3.450 3.400 3.350 3.300
ppm
ppm
7.850
3.0
3.00
4.0
7.33
17.82
1.14
5.0
1.06
1.05
0.96
6.0
1.01
7.0
1.01
1.00
8.0
1.04
9.0
2.17
1.09
1.05
ppm
2.0
1.0
0.0
Ant14Pro1: 13C-Spektrum
133.70 133.60 133.50 133.40 133.30
ppm
71.50 71.00 70.50 70.00 69.50
ppm
180 170 160 150 140 130 120 110 100
ppm
90
80
70
60
50
40
30
20
10
0
300
Anhang
QuercPro1 (3-O-α-L-Rhamnosylquercetin = Quercitrin)
gelber Feststoff
C21H20O11
OH
3'
Mr: 448.38
2'
+
HR-ESI-MS: berechnet 449.10784 [M+H]
gefunden 449.10665 [M+H]+
Abweichung 2.65 ppm
8
HO
7
1
H δ/ppm (m, J/Hz)
13
C δ/ppm
156.9
134.1
177.5
161.1
O
2
1'
5'
6'
6
5
10
4
OH O
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
position
2
3
4
5
5-OH
9
OH
4'
3
O
2''
1''
O
HMBC
13
C δ/ppm
OH
3''
OH
OH
6''
4''
H-H-COSY
ROESY
7.25
7.25
6.89
3.99
3.54; 5.25
3.99; 3.15
3.54; 3.26
0.82; 3.15
3.26
6.89
3.99
5.25
12.64 (broad s)
6
7
6.22 (d, 2.0)
98.9
165.2
8
9
10
1'
6.43 (d, 2.0)
93.7
156.3
103.5
120.5a
2'
3'
4'
5'
7,33 (d, 2.1)
6.89 (d, 8.4)
115.6b
145.2
148.5
115.5b
6'
1''
2''
3''
4''
5''
6''
7.25 (dd, 2.1; 8.4)
5.25 (d, 1.3)
3.99 (m)
3.54 (dd, 3.2; 9.3)
3.15 (t, 9.4)
3.26 (qd, 6.1; 9.6)
0.82 (d, 6.1)
120.9a
101.7
70.0
70.3c
71.2
70.4c
17.4
a, b, c: Zuordnung der Signale gegenseitig austauschbar
93.7; 103.5; 161.1;
165.2
98.9; 103.5; 156.3;
165.2
120.9; 145.2; 148.5;
156.9
120.5; 145.2; 148.5
115.5/115.6; 148.5;
156.9
70; 134.1
70; 71.2
71.2
17.4; 70
71.2
70; 71.2
0.82
0.82
3.15; 3.26
301
Anhang
QuercPro1: 1H-Spektrum
ppm
4.000
3.950
ppm
3.550
3.300
ppm
3.500
3.250
3.200
3.150
DMSO
7.350
ppm
7.300
3.14
5.0
0.74
1.09
1.09
1.18
7.5
1.10
1.00
0.94
0.97
10.0
0.96
12.5
0.96
1.01
0.86
ppm
7.250
2.5
0.0
QuercPro1: 13C-Spektrum
ppm
180 170 160 150 140 130 120 110 100
90
80
70
60
50
40
30
20
10
0
302
Anhang
Novobiocinsäure
weißer Feststoff
5
C22H21NO6
6
OH
Mr: 395.41
5'
6'
HO
7'
4'a
8'a
8'
H
N
4'
12
3'
O
O
7
8
9
10
11
12
12-NH
2'
3'
4'
4'-OH
4'a
5'
6'
7'
7'-OH
8'
8'-CH3
8'a
1
H δ/ppm (m, J/Hz)
7.75 (d, ~2)
10.06 (s)
6.87 (d, 8.9)
7.72 (dd, 8.6; 2)
3.27 (d, 7.2)
5.31 (t, 7.2)
1.70 (s)
1.70 (s)
13
C δ/ppm
124.2
129.9
127.3/127.5
158.4
114.3
127.3/127.5
28.1
122.6
131.6
17.8
25.6
166.7
9.18 (s)
HMBC
13
C δ/ppm
28.1; 127.3/127.5; 158.4; 166.7
H-H-COSY
b
3.27; 6.87
114.3; 127.3/127.5; 158.4
124.2; 127.3/127.5
129.9; 158.4; 166.7
122.6; 127.3/127.5; 129.9;
131.6; 158.4
17.8; 25.6; 28.1
1.70; 5.31; 7.72/7.75
1.70; 3.27
17.8; 25.6; 122.6; 131.6
17.8; 25.6; 122.6; 131.6
3.27; 5.31
3.27; 5.31
7.72/7.75
3.27; 6.87
b
100.5; 159.7; 166.7
11.85 (broad s)
108.1
121.6
111.9
159.1
10.44 (s)
2.17 (s)
151.3; 159.1; 159.7
108.1; 110.5; 159.1; 159.7
2.17; 6.89
2.17; 7.58
110.5; 151.3; 159.1
110.5
8.1
151.3
b: Signale überlappen sich gegenseitig
10
8
11
161.0
100.5
159.7
7.58 (d, 8.7)
6.89 (d, 8.9)
7
9
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
position
1
2
3
4
4-OH
5
6
OH
3
1
2
2'
O
4
110.5; 151.5; 159.1
6.88; 7.58
303
Anhang
Novobiocinsäure: 1H-Spektrum
Novobiocinsäure: 13C-Spektrum
170
165
160
155
150
145
140
135
130
ppm
125
120
115
110
105
100
95
90
304
Anhang
NovPro1 (11-Hydroxynovobiocinsäure)
weißer Feststoff
C22H21NO7
Mr: 411.40
5
OH
+
HR-ESI-MS: berechnet 412.13908 [M+H]
gefunden 412.13888 [M+H]+
Abweichung 0.48 ppm
6
5'
6'
HO
7'
12
2
2'
O
O
OH
3
1
3'
4'a
8'a
8'
H
N
4'
4
7
O
10
8
9
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
11
OH
1
position
1
2
3
4
4-OH
H δ/ppm
(m, J/Hz)
7.74 (d, 1.7)
13
C δ/ppm
124.5
129.9
127.0
158.2
HMBC
13
C δ/ppm
27.7; 127.4; 158.2;
166.4
H-H-COSY
ROESY
b
a
3.30; 6.85
10.05 (s)
3.30; 5.52; 6.85;
9.04
6.85
7.55; 7.70/7.74;
10.05; 10.34
b
3.30; 5.52; 6.85;
9.04
c
5
c
114.2
c
6
7.70 (dd, 8.4; 1.9)
127.4
7
8
9
3.30 (d, 7.3)
5.52 (t, 7.3)
27.7
121.6/121.7
135.9
129.9; 158.2
121.6/121.7;
127.0/127.4; 129.9;
135.9; 158.2
13.7; 27.7; 66.3
10
11
11-OH
12
2'
3'
3'-NH
4'
4'-OH
4'a
5'
1.67 (s)
3.81 (broad s)
4.70 (broad s)
13.7
66.3
6'
7'
7'-OH
8'
8'-CH3
8'a
c
6.85 (d, 8.3)
d
10.34 (s)
6.85 (d, 8.3)
110.2; 124.5; 127.0
66.3; 121.6/121.7;
135.9
121.6/121.7; 135.9
c
7.55; 7.70
a
3.30; 6.85
1.67; 3.81; 5.52;
7.70/7.74
1.67; 5.52; 7.74
1.67; 3.30; 3.81 3.30; 3.81; 7.74
3.30; 5.52
3.30; 3.81
3.30; 4.70; 5.52 1.67; 5.52
3.81
166.4
not observed
99.9
9.04 (s)
7.70/7.74
161.1
d
not observed
e
7.55 (d, 8.6)
not observed
121.6/121.7
151.5; 158.7; 161.1
c
111.6
158.7
c
110.2; 124.5; 127.0
e
2.16 (s)
110.2
8.2
151.5
110.2; 151.5; 158.7
a, b, c: Signale überlappen sich gegenseitig
d, e: Zuordnung der Signale gegenseitig austauschbar
c
7.55; 7.70
7.55; 7.70/7.74;
10.05; 10.34
Anhang
NovPro1: 1H-Spektrum
NovPro1: 13C-Spektrum
305
306
Anhang
NovPro3 (10-Hydroxynovobiocinsäure)
weißer Feststoff
C22H21NO7
Mr: 411.40
5
HR-ESI-MS: berechnet 412.13908 [M+H]
gefunden 412.13890 [M+H]+
Abweichung 0.43 ppm
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
position
2
4-OH
5b
6
7
8
10
10-OH
11
12-NH
4'-OH
5'
6' b
7'-OH
8'-CH3
1
H δ/ppm (m, J/Hz)
7.74 (m, < 2)
10.03 (s)
6.83 (m)
7.69 (dd, 8.5; 2.0)
#
3.3
5.35 (t, 7.4)
4.06 (broad s)
4.64 (broad s)
1.73 (s)
8.96 (s)
not observed c
7.54 (d, 8.7)
6.83 (m)
10.26 (s) c
2.15 (s)
a, b: Signale überlappen sich gegenseitig
c: Zuordnung der Signale gegenseitig austauschbar
#: vom Wassersignal überlappt
NovPro3: 1H-Spektrum
HO
6
OH
+
5'
6'
7'
H
N
4'
4'a
8'a
8'
O
12
3'
O
OH
3
1
2
2'
4
O
7
10
8
9
11
H-H-COSY
3.3
(2.15); 7.54; 7.69
6.83
1.73; 5.35; 7.74
1.73; 3.3; 4.06
4.64; 5.35
4.06
3.3; 5.35
2.15; 6.83
(2.15); 7.54; 7.69
(6.83); 7.54
ROESY
a
3.3; 5.35; 6.83; 8.96
6.83
7.54; 7.69/7.74; 10.03
a
3.3; 5.35; 6.83; 8.96
4.06; 5.35; 7.74
1.73; 3.3; 7.74
1.73; 3.3
4.06; 5.35
7.74
6.83
7.54; 7.69/7.74; 10.03
OH
307
Anhang
NovPro5 (4'-O-α-L-Rhamnosylnovobiocinsäure)
weißer Feststoff
C28H31NO10
HO
Mr: 541.55
HO
OH
2''
3''
O
6''
1''
+
HR-ESI-MS: berechnet 542.20207 [M+H]
gefunden 542.20201 [M+H]+
Abweichung 0.12 ppm
5
6
O
5'
6'
NMR: in DMSO-d6
400 MHz für 1H, 100 MHz für 13C
HO
7'
H
N
4'
4'a
8'a
3'
O
OH
3
1
2
2'
O
8'
12
4
7
O
10
8
11
9
1
H δ/ppm
position (m, J/Hz)
1
2
3
4
4-OH
5
6
a
7.68 (m)
10.01 (s)
6.84 (d, 8.1)
a
7.67 (m)
13
C δ/ppm
125.6
(by HMBC)
129.7
b
127.1
158.2
114.2
127.3
b
7
8
9
c#
3.26 (d, 6.9)
5.30 (t, 7.0)
28.1
122.5
131.5
10
d
1.69 (s)
e
11
12
12-NH
2'
3'
4'
4'a
5'
6'
7'
7-OH
8'
8'-CH3
8'a
d
1.69 (s)
25.6
166.1
1''
2''
2''-OH
3''
3''-OH
17.7
9.33 (s)
HMBC
a
13
C δ/ppm
28.1
125.6
a
28.1
c
122.5; 127.1/127.3;
129.7; 158.2
17.7; 25.6; 122.5;
131.5
17.7; 25.6; 122.5;
131.5
H-H-COSY
ROESY
a
a
6.84
3.26; 5.30; 6.84: 9.33
7.67
a
6.84
c
1.69; 3.68;
4.92; 5.30
1.69; 3.26
6.84
7.67/7.68; 10.01
a
3.26; 5.30; 6.84: 9.33
c
1.05; 1.69; 4.92; 5.03;
5.30; 7.67/7.68
1.69; 3.26; 7.67/7.68
3.26; 5.30
3.26; 5.30
3.26; 5.30
3.26; 5.30
166.1
5.70; 7.67/7.68
r
7.49 (d, 8.7)
6.94 (d, 8.8)
not observed
94.1
r
161.1
108.8
121.3
112.3
159.2
150.9; 159.2
108.8
6.94
7.49
3.56; 3.68; 5.70; 6.94
7.49
10.58 (broad s)
2.18 (s)
5.70 (m, < 2)
3.86 (m)
5.05 (d, 4.6)
3.68 (m)
4.79 (d, 5.8)
110.8
8.1
150.9
101.4
70.1
70.3
110.8; 150.9; 159.2
71.1/71.4
3.86; 5.05; 7.49;
7.67/7.68; 9.33
3.68; 5.05
3.68; 4.79; 5.05; 5.70
3.86
3.26; 3.86; 5.70
3.26; 3.86; 4.79 3.86; 4.79; 4.92; 7.49
3.68
3.68; 3.86
308
Anhang
Fortsetzung der NMR-Tabelle für NovPro5
1
H δ/ppm
position (m, J/Hz)
4''
4''-OH
5''
6''
c#
3.26
4.92 (d, 5.8)
3.56 (dq, 5.9;
9.2)
1.05 (d, 6.1)
13
f
71.1
f
71.4
17.7
e
HMBC 13C δ/ppm
c
122.5; 127.1/127.3;
129.7; 158.2
C δ/ppm
71.1/71.4
H-H-COSY
c
1.69; 3.68;
4.92; 5.30
3.26
ROESY
c
1.05; 1.69; 4.92; 5.03;
5.30; 7.67/7.68
1.05; 3.26; 3.68
1.05
3.56
1.05; 7.49
3.26; 3.56; 4.92
a, b, c, d, e, f: Signale überlappen sich gegenseitig
r: Zuordnung der Signale gegenseitig austauschbar
#: vom Wassersignal überlappt
NovPro5: 13C-Spektrum
3.0
6.8
3.1
1.0
2.4
3.0
1.1
1.0
2.2
3.6
0.9
0.8
0.2
NovPro5: 1H-Spektrum
Anhang
7.3
309
DNA-Sequenzen der PKS II-Cluster aus S. sp. Gö C4/4
Die erste Zeile eines Datenblocks gibt die Nukleotidsequenz des Contigs in der
Betrachtungsrichtung des entsprechenden Clusters wieder (s. Abb. 60, Abb. 71, Abb. 81).
In der zweiten Zeile ist die Basenabfolge des komplementären DNA-Stranges zu finden.
In codierenden Abschnitten sind in weiteren Zeilen der Name des Gens und die abgeleitete
Aminosäuresequenz angegeben. Einfache Pfeile (>, <) geben die Leserichtung des Gens an,
Doppelpfeile (>>, <<) indizieren die Position von Start- und Stoppcodon.
7.3.1 Sequenz des msc-Contigs
1
gatcgcgggg cggacggaat cattgggggg cagtagatga ccggatgccg actctgcggc
ctagcgcccc gcctgcctta gtaacccccc gtcatctact ggcctacggc tgagacgccg
>>.........msc1..........>
m
t g c
r l c g
61
tcgtcggcgc tggagagcgt cgtcgacctg ggggcgaccc cgccgtgcga gagcttcctc
agcagccgcg acctctcgca gcagctggac ccccgctggg gcggcacgct ctcgaaggag
>.............................msc1..............................>
s s a
l e s
v v d l
g a t
p p c
e s f l
121
gccgcgggac aactggacct gccggaaccg gcgtacccgc tgcacctgcg ggtctgcacc
cggcgccctg ttgacctgga cggccttggc cgcatgggcg acgtggacgc ccagacgtgg
>.............................msc1..............................>
a a g
q l d
l p e p
a y p
l h l
r v c t
181
gactgctggc tcgcgcagat ccctccgctg atcacaccgg aggagacgtt cgaggagtac
ctgacgaccg agcgcgtcta gggaggcgac tagtgtggcc tcctctgcaa gctcctcatg
>.............................msc1..............................>
d c w
l a q
i p p l
i t p
e e t
f e e y
241
gcgtacttct cctccttctc gacctcctgg gtggagcacg cgcgcgcctt cgtcgcgggc
cgcatgaaga ggaggaagag ctggaggacc cacctcgtgc gcgcgcggaa gcagcgcccg
>.............................msc1..............................>
a y f
s s f
s t s w
v e h
a r a
f v a g
301
gccgtggagc gggtgggcct cggccccgac gccttcgtgg tcgaggtcgc gagcaacgac
cggcacctcg cccacccgga gccggggctg cggaagcacc agctccagcg ctcgttgctg
>.............................msc1..............................>
a v e
r v g
l g p d
a f v
v e v
a s n d
361
gggtatctgc tgaggcatgt ggtggaccgg gggatccgct gcctcggcgt cgaaccgtcg
cccatagacg actccgtaca ccacctggcc ccctaggcga cggagccgca gcttggcagc
>.............................msc1..............................>
g y l
l r h
v v d r
g i r
c l g
v e p s
421
gtgaacgtcg gggcggcggc gcgggaggcg ggggtgccca cgctcacggc gttcctgggc
cacttgcagc cccgccgccg cgccctccgc ccccacgggt gcgagtgccg caaggacccg
>.............................msc1..............................>
v n v
g a a
a r e a
g v p
t l t
a f l g
481
ccggacaccg gcgccggcgt ccgcgccgag cacggcccgg cggacctggt cgtggccaac
ggcctgtggc cgcggccgca ggcgcggctc gtgccgggcc gcctggacca gcaccggttg
>.............................msc1..............................>
p d t
g a g
v r a e
h g p
a d l
v v a n
310
Anhang
541
aacgtgtacg cgcacatccc cgacgtggtc gggttcaccc aggggctgcg ggcgctggtc
ttgcacatgc gcgtgtaggg gctgcaccag cccaagtggg tccccgacgc ccgcgaccag
>.............................msc1..............................>
n v y
a h i
p d v v
g f t
q g l
r a l v
601
gccgacgacg gctgggtctg cgtcgaggtg cagcacctgc tgaccctgat cgagaagaac
cggctgctgc cgacccagac gcagctccac gtcgtggacg actgggacta gctcttcttg
>.............................msc1..............................>
a d d
g w v
c v e v
q h l
l t l
i e k n
661
cagtacgaca cgatctacca cgagcacttc cagtactaca cggtcgcggc cgcgatccgg
gtcatgctgt gctagatggt gctcgtgaag gtcatgatgt gccagcgccg gcgctaggcc
>.............................msc1..............................>
q y d
t i y
h e h f
q y y
t v a
a a i r
721
gcgctggcga gcggcggact cacgctcgtg gacgtcgagc tgctgcccac gcacggcggg
cgcgaccgct cgccgcctga gtgcgagcac ctgcagctcg acgacgggtg cgtgccgccc
>.............................msc1..............................>
a l a
s g g
l t l v
d v e
l l p
t h g g
781
tcgatccggc tgtgggcccg cccgtgcgag gtggccggcg agcccaccgc gcgggtggcg
agctaggccg acacccgggc gggcacgctc caccggccgc tcgggtggcg cgcccaccgc
>.............................msc1..............................>
s i r
l w a
r p c e
v a g
e p t
a r v a
841
gacgtactgg cccgggagaa ggccgccggg ctgcaggagc tgtccgggta caccgagttc
ctgcatgacc gggccctctt ccggcggccc gacgtcctcg acaggcccat gtggctcaag
>.............................msc1..............................>
d v l
a r e
k a a g
l q e
l s g
y t e f
901
tccgcccggg tggccaaggt gcgccgggac ctgctgcggt tcctcatcga cgcggccgag
aggcgggccc accggttcca cgcggccctg gacgacgcca aggagtagct gcgccggctc
>.............................msc1..............................>
s a r
v a k
v r r d
l l r
f l i
d a a e
961
cgcggcgaga cggtcgtcgg ctacggcgcc ccgggcaagg gcaacaccct gctcaaccac
gcgccgctct gccagcagcc gatgccgcgg ggcccgttcc cgttgtggga cgagttggtg
>.............................msc1..............................>
r g e
t v v
g y g a
p g k
g n t
l l n h
1021
tgcggcatcc ggcccgacct gctggcgtac accgtcgacc gcaaccccta caagcacggc
acgccgtagg ccgggctgga cgaccgcatg tggcagctgg cgttggggat gttcgtgccg
>.............................msc1..............................>
c g i
r p d
l l a y
t v d
r n p
y k h g
1081
aggttcaccc cgggcacccg catcccgatc ctgccgcccg agcggatcgc cgccgaccgg
tccaagtggg gcccgtgggc gtagggctag gacggcgggc tcgcctagcg gcggctggcc
>.............................msc1..............................>
r f t
p g t
r i p i
l p p
e r i
a a d r
1141
ccggactacg tcctggtgct gccgtggaac ctgcgggccg agctggtcga gcagctggcg
ggcctgatgc aggaccacga cggcaccttg gacgcccggc tcgaccagct cgtcgaccgc
>.............................msc1..............................>
p d y
v l v
l p w n
l r a
e l v
e q l a
Anhang
311
1201
tacgtgcacg agtggggcgg ccggctggtc ttcccgatac cggaactgag cattgtcgag
atgcacgtgc tcaccccgcc ggccgaccag aagggctatg gccttgactc gtaacagctc
>.............................msc1..............................>
y v h
e w g
g r l v
f p i
p e l
s i v e
1261
gtcaaggcat gaaggtcgtc ctgttctgcg gcggttacgg catgcggatg cgcaacggaa
cagttccgta cttccagcag gacaagacgc cgccaatgcc gtacgcctac gcgttgcctt
>...msc1...>>
v k a
>>........................msc2..........................>
m k v v
l f c
g g y
g m r m
r n g
1321
cctccgacga cgtgcccaag ccgatggcga tggtcggccc gcgcccgctg atctggcatg
ggaggctgct gcacgggttc ggctaccgct accagccggg cgcgggcgac tagaccgtac
>.............................msc2..............................>
t s d
d v p k
p m a
m v g
p r p l
i w h
1381
tcatgcgcta ctacgcgcac ttcgggcaca cggagttcat cctctgcctc ggctacgggg
agtacgcgat gatgcgcgtg aagcccgtgt gcctcaagta ggagacggag ccgatgcccc
>.............................msc2..............................>
v m r
y y a h
f g h
t e f
i l c l
g y g
1441
cccaccacat caagaacttc ttcctcacct acgaggagac gacgtccaac gacttcgtgc
gggtggtgta gttcttgaag aaggagtgga tgctcctctg ctgcaggttg ctgaagcacg
>.............................msc2..............................>
a h h
i k n f
f l t
y e e
t t s n
d f v
1501
tgcgcggcgg gcggaccgaa ctgctgtcca ccgacatcgc cgactggacg atcacgttcg
acgcgccgcc cgcctggctt gacgacaggt ggctgtagcg gctgacctgc tagtgcaagc
>.............................msc2..............................>
l r g
g r t e
l l s
t d i
a d w t
i t f
1561
cgcagaccgg cgtcgagtcg ccgatcgggg aacggctgcg ccgggtgcgc caccacctcg
gcgtctggcc gcagctcagc ggctagcccc ttgccgacgc ggcccacgcg gtggtggagc
>.............................msc2..............................>
a q t
g v e s
p i g
e r l
r r v r
h h l
1621
acggcgacga gatgttcctc gccaactacg ccgacgtgct caccgacgcg ccgctgccga
tgccgctgct ctacaaggag cggttgatgc ggctgcacga gtggctgcgc ggcgacggct
>.............................msc2..............................>
d g d
e m f l
a n y
a d v
l t d a
p l p
1681
cgatgatcga ctccttcgcc cggcgtgacg ccggcgcgtc gatgatggtg gtaccgccgc
gctactagct gaggaagcgg gccgcactgc ggccgcgcag ctactaccac catggcggcg
>.............................msc2..............................>
t m i
d s f a
r r d
a g a
s m m v
v p p
1741
agtcctcgtt ccactgcgtg gacctgggcg aggacggcct ggtggggggc atcaccgcgg
tcaggagcaa ggtgacgcac ctggacccgc tcctgccgga ccaccccccg tagtggcgcc
>.............................msc2..............................>
q s s
f h c v
d l g
e d g
l v g g
i t a
1801
tcagcgacat gccgctgtgg gagaacggcg gctacttcgt gctccgccag gagatcttcg
agtcgctgta cggcgacacc ctcttgccgc cgatgaagca cgaggcggtc ctctagaagc
>.............................msc2..............................>
v s d
m p l w
e n g
g y f
v l r q
e i f
1861
accacatccc gcagggcggg gacctggtcg ccgacggctg cggccaactg gccaagcagg
tggtgtaggg cgtcccgccc ctggaccagc ggctgccgac gccggttgac cggttcgtcc
>.............................msc2..............................>
d h i
p q g g
d l v
a d g
c g q l
a k q
312
Anhang
1921
gccgcctggt ggcgcaccag caccgcggct tctggaagcc gaccgacacc gtcaaggagc
cggcggacca ccgcgtggtc gtggcgccga agaccttcgg ctggctgtgg cagttcctcg
>.............................msc2..............................>
g r l
v a h q
h r g
f w k
p t d t
v k e
1981
gggccgcgct cgacgacgcc tacgcccggg gcgaccgtcc gtgggccgtg tgggaacggg
cccggcgcga gctgctgcgg atgcgggccc cgctggcagg cacccggcac acccttgccc
>.............................msc2..............................>
r a a
l d d a
y a r
g d r
p w a v
w e r
2041
acgccaccgg ggtgggcgcg tgatccggct cggcgccggg cgcccggacc gggtcgtcgc
tgcggtggcc ccacccgcgc actaggccga gccgcggccc gcgggcctgg cccagcagcg
>.........msc2.........>>
d a t
g v g a
>>..................msc3....................>
v i r
l g a g
r p d
r v v
2101
ggtgggcgcg cactgcgacg acatcgccat cggcgccggt ggcacgctgc tgacgatgtg
ccacccgcgc gtgacgctgc tgtagcggta gccgcggcca ccgtgcgacg actgctacac
>.............................msc3..............................>
a v g a
h c d
d i a
i g a g
g t l
l t m
2161
cctggcgcgc ccgggcctgc gcgtcgacgc gctggtgctg tccggcggcg gcgaccggga
ggaccgcgcg ggcccggacg cgcagctgcg cgaccacgac aggccgccgc cgctggccct
>.............................msc3..............................>
c l a r
p g l
r v d
a l v l
s g g
g d r
2221
gcaggaggag cgggccgcgc tcgccgcctt ctgtccggga gccgacctgc ggctgaccgt
cgtcctcctc gcccggcgcg agcggcggaa gacaggccct cggctggacg ccgactggca
>.............................msc3..............................>
e q e e
r a a
l a a
f c p g
a d l
r l t
2281
gcacaagctg ccggacgggc ggctgcccgc gcactgggag gaggccaagg ccgcggtcga
cgtgttcgac ggcctgcccg ccgacgggcg cgtgaccctc ctccggttcc ggcgccagct
>.............................msc3..............................>
v h k l
p d g
r l p
a h w e
e a k
a a v
2341
ggagctgcgc gcggcgacgg acccggacct cgtgcttgcc ccgcgcaccg acgacgccca
cctcgacgcg cgccgctgcc tgggcctgga gcacgaacgg ggcgcgtggc tgctgcgggt
>.............................msc3..............................>
e e l r
a a t
d p d
l v l a
p r t
d d a
2401
ccaggaccac cgcggcctgg cgaagctgat ccccaccgcg ttccgcgacc acctggtgct
ggtcctggtg gcgccggacc gcttcgacta ggggtggcgc aaggcgctgg tggaccacga
>.............................msc3..............................>
h q d h
r g l
a k l
i p t a
f r d
h l v
2461
cggctacgag atcgtcaagt gggacggcga tctcggccgt ccggcggcgt accagccgct
gccgatgctc tagcagttca ccctgccgct agagccggca ggccgccgca tggtcggcga
>.............................msc3..............................>
l g y e
i v k
w d g
d l g r
p a a
y q p
2521
ctcgccggag accgccgagc gcaaggtggg gctgctgcag gagcactacc cctcgcagcg
gagcggcctc tggcggctcg cgttccaccc cgacgacgtc ctcgtgatgg ggagcgtcgc
>.............................msc3..............................>
l s p e
t a e
r k v
g l l q
e h y
p s q
2581
ccaccggccc tggtacgacc gggaggcctt cctcggtctc gcccggatcc gcggtatcga
ggtggccggg accatgctgg ccctccggaa ggagccagag cgggcctagg cgccatagct
>.............................msc3..............................>
r h r p
w y d
r e a
f l g l
a r i
r g i
Anhang
313
2641
atgccacgag cgctacgccg aggcgttcgc cgtcaccaaa ctcacgctca acctgggggg
tacggtgctc gcgatgcggc tccgcaagcg gcagtggttt gagtgcgagt tggacccccc
>.............................msc3..............................>
e c h e
r y a
e a f
a v t k
l t l
n l g
2701
ttgaaccatg cgcgtactcc tgaccggaca ccagggctac ctgggcaccg tgatggcccc
aacttggtac gcgcatgagg actggcctgt ggtcccgatg gacccgtggc actaccgggg
>.>> msc3
g >>.........................msc4..........................>
m
r v l
l t g
h q g y
l g t
v m a
2761
ggtcctcgcc gaggccgggc acgaggtcgt cggcctcgac gccggcctgt tcgccgactg
ccaggagcgg ctccggcccg tgctccagca gccggagctg cggccggaca agcggctgac
>.............................msc4..............................>
p v l a
e a g
h e v
v g l d
a g l
f a d
2821
cgtgctgggg ccgaagccgg cggacccgcc gggtgcacgg gtggacctgc gcgacctcac
gcacgacccc ggcttcggcc gcctgggcgg cccacgtgcc cacctggacg cgctggagtg
>.............................msc4..............................>
c v l g
p k p
a d p
p g a r
v d l
r d l
2881
ggccgcacac gtggccgggg tcgacgcggt gatccacctg gcggccctgt ccaacgaccc
ccggcgtgtg caccggcccc agctgcgcca ctaggtggac cgccgggaca ggttgctggg
>.............................msc4..............................>
t a a h
v a g
v d a
v i h l
a a l
s n d
2941
gctgggctca ctggcgccgc agctcaccta cgacatcaac caccacgcgt ccgtgacgct
cgacccgagt gaccgcggcg tcgagtggat gctgtagttg gtggtgcgca ggcactgcga
>.............................msc4..............................>
p l g s
l a p
q l t
y d i n
h h a
s v t
3001
ggcccggctg gcccgcgacg ccggggtgcg gcgcttcctg tacgcgtcga cgtgctcggt
ccgggccgac cgggcgctgc ggccccacgc cgcgaaggac atgcgcagct gcacgagcca
>.............................msc4..............................>
l a r l
a r d
a g v
r r f l
y a s
t c s
3061
gtacggcgcc gccggcggtg acgaactggt ggccgaggac gccccgctgc gcccggtgac
catgccgcgg cggccgccac tgcttgacca ccggctcctg cggggcgacg cgggccactg
>.............................msc4..............................>
v y g a
a g g
d e l
v a e d
a p l
r p v
3121
cccgtacgcg gagtccaagg tgcgggtcga ggacgacctg cacgcgctgg ccgacgccga
gggcatgcgc ctcaggttcc acgcccagct cctgctggac gtgcgcgacc ggctgcggct
>.............................msc4..............................>
t p y a
e s k
v r v
e d d l
h a l
a d a
3181
cttcagcccg gtgtacatgc gcaacgccac cgccttcggc tactcccccc ggctgcgcgc
gaagtcgggc cacatgtacg cgttgcggtg gcggaagccg atgagggggg ccgacgcgcg
>.............................msc4..............................>
d f s p
v y m
r n a
t a f g
y s p
r l r
3241
cgacatcgtg ctgaacaacc tggtgggcca cgcgctgctg tccggcgagg tgctggtgct
gctgtagcac gacttgttgg accacccggt gcgcgacgac aggccgctcc acgaccacga
>.............................msc4..............................>
a d i v
l n n
l v g
h a l l
s g e
v l v
3301
ctccgacggc accccctggc gcccgctggt gcacgccgcc gacatcgcgc gggccttcac
gaggctgccg tgggggaccg cgggcgacca cgtgcggcgg ctgtagcgcg cccggaagtg
>.............................msc4..............................>
l s d g
t p w
r p l
v h a a
d i a
r a f
314
Anhang
3361
ggccgcgctg gacgcgccgc gcgaggcggt gcacgaccgg gcgttcaaca tcggcaccga
ccggcgcgac ctgcgcggcg cgctccgcca cgtgctggcc cgcaagttgt agccgtggct
>.............................msc4..............................>
t a a l
d a p
r e a
v h d r
a f n
i g t
3421
gaccaacaac gtgacggtcg ccgagatcgc cgagcaggtc gccgaggcgg tgtccggcgc
ctggttgttg cactgccagc ggctctagcg gctcgtccag cggctccgcc acaggccgcg
>.............................msc4..............................>
e t n n
v t v
a e i
a e q v
a e a
v s g
3481
gaaggtggtg atcaccggcg agaacggggc cgatccccgg tcgtaccggg tggacttctc
cttccaccac tagtggccgc tcttgccccg gctaggggcc agcatggccc acctgaagag
>.............................msc4..............................>
a k v v
i t g
e n g
a d p r
s y r
v d f
3541
ccggttccgg gccgcgatcc ccggcttcga ctgtgagtgg tcggtgaagc ggggcgcact
ggccaaggcc cggcgctagg ggccgaagct gacactcacc agccacttcg ccccgcgtga
>.............................msc4..............................>
s r f r
a a i
p g f
d c e w
s v k
r g a
3601
cgaactcgcc gacgcctacc ggaagttcgg gctgacccag gaggccttcg agcgccgctt
gcttgagcgg ctgcggatgg ccttcaagcc cgactgggtc ctccggaagc tcgcggcgaa
>.............................msc4..............................>
l e l a
d a y
r k f
g l t q
e a f
e r r
3661
cacccggctg gccgtgctgc gggcggcgtc taaggccggc accgtcgacg acaccctgcg
gtgggccgac cggcacgacg cccgccgcag attccggccg tggcagctgc tgtgggacgc
>.............................msc4..............................>
f t r l
a v l
r a a
s k a g
t v d
d t l
3721
gtggcgcgga tgaccgtcgg cgaggagatg cacgcgctgg tggagcggtt gtacccgctg
caccgcgcct actggcagcc gctcctctac gtgcgcgacc acctcgccaa catgggcgac
>....msc4...>>
r w r g
>>........................msc5.........................>
m t v
g e e m
h a l
v e r
l y p l
3781
tgccggagca tcaccggcga cggggtgcgc gccaccctgg acatcgtcgg cgagtacatc
acggcctcgt agtggccgct gccccacgcg cggtgggacc tgtagcagcc gctcatgtag
>.............................msc5..............................>
c r s
i t g
d g v r
a t l
d i v
g e y i
3841
ccgctccagg tgcacgaggt gccgaccggg acccaggtgc tcgactggac ggtgccgcag
ggcgaggtcc acgtgctcca cggctggccc tgggtccacg agctgacctg ccacggcgtc
>.............................msc5..............................>
p l q
v h e
v p t g
t q v
l d w
t v p q
3901
gagtggaaca tccgggacgc ctacatcgcc gacgccgcgg gcaaccgggt cgtcgacttc
ctcaccttgt aggccctgcg gatgtagcgg ctgcggcgcc cgttggccca gcagctgaag
>.............................msc5..............................>
e w n
i r d
a y i a
d a a
g n r
v v d f
3961
gccgcgtcca gcctgcacgt gctcggctac agcgtgccgg tgtcggcgac gatgccgctg
cggcgcaggt cggacgtgca cgagccgatg tcgcacggcc acagccgctg ctacggcgac
>.............................msc5..............................>
a a s
s l h
v l g y
s v p
v s a
t m p l
4021
gccgagctgc gcgagcatct gtacacgctg ccggagcggc cgagctgggt gccgtaccgc
cggctcgacg cgctcgtaga catgtgcgac ggcctcgccg gctcgaccca cggcatggcg
>.............................msc5..............................>
a e l
r e h
l y t l
p e r
p s w
v p y r
Anhang
315
4081
accagctact acaagccgca gtgggggttc tgtctctccc aggacatcct ggacgcgatg
tggtcgatga tgttcggcgt cacccccaag acagagaggg tcctgtagga cctgcgctac
>.............................msc5..............................>
t s y
y k p
q w g f
c l s
q d i
l d a m
4141
ccggacggcg agtacgaggt gcgcgtggac tccacgctcg ccgacggcca cctcacctac
ggcctgccgc tcatgctcca cgcgcacctg aggtgcgagc ggctgccggt ggagtggatg
>.............................msc5..............................>
p d g
e y e
v r v d
s t l
a d g
h l t y
4201
gccgagcacg tggtccccgg gcagatcgcc gacgaggtga tcgtctcctg ccacgtctgc
cggctcgtgc accaggggcc cgtctagcgg ctgctccact agcagaggac ggtgcagacg
>.............................msc5..............................>
a e h
v v p
g q i a
d e v
i v s
c h v c
4261
cacccgtcgc tggccaacga caacctggcc ggtgtcgcgg tggcgacgtt cctggcccgg
gtgggcagcg accggttgct gttggaccgg ccacagcgcc accgctgcaa ggaccgggcc
>.............................msc5..............................>
h p s
l a n
d n l a
g v a
v a t
f l a r
4321
gcgctggcgg agcggacccc gtactacacc taccggttca tcttcgcgcc cggcaccatc
cgcgaccgcc tcgcctgggg catgatgtgg atggccaagt agaagcgcgg gccgtggtag
>.............................msc5..............................>
a l a
e r t
p y y t
y r f
i f a
p g t i
4381
ggggcgatca cctggctggc ccgcaacgcg gagaggatcg agcgagtcaa gcacggcctg
ccccgctagt ggaccgaccg ggcgttgcgc ctctcctagc tcgctcagtt cgtgccggac
>.............................msc5..............................>
g a i
t w l
a r n a
e r i
e r v
k h g l
4441
gtgctggcct gcgcgggcga ccggggccgg ctgacgtaca agcggagccg gcgcggtgac
cacgaccgga cgcgcccgct ggccccggcc gactgcatgt tcgcctcggc cgcgccactg
>.............................msc5..............................>
v l a
c a g
d r g r
l t y
k r s
r r g d
4501
gccgagatcg accgggtgat gcggcatgtg ctgaccgcct ccgaacgccc gcaccacatc
cggctctagc tggcccacta cgccgtacac gactggcgga ggcttgcggg cgtggtgtag
>.............................msc5..............................>
a e i
d r v
m r h v
l t a
s e r
p h h i
4561
gccgagttca ccccgtacgg ctacgacgag cggcagtact gctcaccggg cttcgatctc
cggctcaagt ggggcatgcc gatgctgctc gccgtcatga cgagtggccc gaagctagag
>.............................msc5..............................>
a e f
t p y
g y d e
r q y
c s p
g f d l
4621
ggcgtgggct cgctcagccg gaccccgtac gccggttacc cggaatatca cacctcggcg
ccgcacccga gcgagtcggc ctggggcatg cggccaatgg gccttatagt gtggagccgc
>.............................msc5..............................>
g v g
s l s
r t p y
a g y
p e y
h t s a
4681
gacaacccgg acttcgtcac cccggaggcg atgacggaca cgctcaccct gtgccgcgag
ctgttgggcc tgaagcagtg gggcctccgc tactgcctgt gcgagtggga cacggcgctc
>.............................msc5..............................>
d n p
d f v
t p e a
m t d
t l t
l c r e
4741
gcgttcgccg tgctcgacgg caaccggcgg tacgtcaatc tcagccccta cggcgagccc
cgcaagcggc acgagctgcc gttggccgcc atgcagttag agtcggggat gccgctcggg
>.............................msc5..............................>
a f a
v l d
g n r r
y v n
l s p
y g e p
316
Anhang
4801
cagctgggcc ggcggggcct gtacgactcg ctcggcggcc gcagcgacgc caaagaggcc
gtcgacccgg ccgccccgga catgctgagc gagccgccgg cgtcgctgcg gtttctccgg
>.............................msc5..............................>
q l g
r r g
l y d s
l g g
r s d
a k e a
4861
cagatggcga tgctgtgggt gctcagcctc tccgacggcg agcacgcgct gctggacgtg
gtctaccgct acgacaccca cgagtcggag aggctgccgc tcgtgcgcga cgacctgcac
>.............................msc5..............................>
q m a
m l w
v l s l
s d g
e h a
l l d v
4921
gccgagcggg ccgggctgcc cttcgacacc gtcgccgccg cggccggcgc cctgcacggc
cggctcgccc ggcccgacgg gaagctgtgg cagcggcggc gccggccgcg ggacgtgccg
>.............................msc5..............................>
a e r
a g l
p f d t
v a a
a a g
a l h g
4981
gccgggctga tcaaggcatg acgccgatga ccaccgagga ggggaaggcg acggcacggg
cggcccgact agttccgtac tgcggctact ggtggctcct ccccttccgc tgccgtgccc
>........msc5........>>
a g l
i k a
>>..............msc6................>
m
t t e
e g k a
t a r
5041
ccgggcccgc ccggcgggcc ctgctcggcc ggctgtcctg ggggctggcc gaccaggccg
ggcccgggcg ggccgcccgg gacgagccgg ccgacaggac ccccgaccgg ctggtccggc
>.............................msc6..............................>
a g p
a r r a
l l g
r l s
w g l a
d q a
5101
cctccagcat gaccaacttc gcggtgggga tctacgtcgc gcgctcgctc gggctcaccg
ggaggtcgta ctggttgaag cgccacccct agatgcagcg cgcgagcgag cccgagtggc
>.............................msc6..............................>
a s s
m t n f
a v g
i y v
a r s l
g l t
5161
cgttcggcgt gttcagcctg gcctgggtga cgtacggcgt ggtgctcagc gtctcccggg
gcaagccgca caagtcggac cggacccact gcatgccgca ccacgagtcg cagagggccc
>.............................msc6..............................>
a f g
v f s l
a w v
t y g
v v l s
v s r
5221
ggctggccac cgacccgctc gtggtgcgct tcagcggggt gccggaggcc tcctggcgcg
ccgaccggtg gctgggcgag caccacgcga agtcgcccca cggcctccgg aggaccgcgc
>.............................msc6..............................>
g l a
t d p l
v v r
f s g
v p e a
s w r
5281
gggcagtggc ccgttcgtcg ggtaccgccc tcggcgtcgg cggcgtcatc ggcgcggcct
cccgtcaccg ggcaagcagc ccatggcggg agccgcagcc gccgcagtag ccgcgccgga
>.............................msc6..............................>
g a v
a r s s
g t a
l g v
g g v i
g a a
5341
gcctgggggc gggactggcc gtcggcggtc cggtggggcc cgccttcgcc tgcctgggcg
cggacccccg ccctgaccgg cagccgccag gccaccccgg gcggaagcgg acggacccgc
>.............................msc6..............................>
c l g
a g l a
v g g
p v g
p a f a
c l g
5401
tcctgctgcc ggggctgctg ctgcaggacg cctggcggta ctcgttcttc gccgccggca
aggacgacgg ccccgacgac gacgtcctgc ggaccgccat gagcaagaag cggcggccgt
>.............................msc6..............................>
v l l
p g l l
l q d
a w r
y s f f
a a g
5461
ccgggcggaa ggcgttcgtc aacgacctgg tgtggggcgt cgcgctcgtc ccggccatgg
ggcccgcctt ccgcaagcag ttgctggacc acaccccgca gcgcgagcag ggccggtacc
>.............................msc6..............................>
t g r
k a f v
n d l
v w g
v a l v
p a m
Anhang
317
5521
tcgtggcggc ccgcgtgggc acggtggccg cgttcgtcct ggcctggggt gcgtccgccg
agcaccgccg ggcgcacccg tgccaccggc gcaagcagga ccggacccca cgcaggcggc
>.............................msc6..............................>
v v a
a r v g
t v a
a f v
l a w g
a s a
5581
cggtcgccgc ggtgtacggc tgcctccagt ccggcatccg gccgcggctg accggagcgc
gccagcggcg ccacatgccg acggaggtca ggccgtaggc cggcgccgac tggcctcgcg
>.............................msc6..............................>
a v a
a v y g
c l q
s g i
r p r l
t g a
5641
gcgcctggct gcgcgagcac cgcgacctcg gctaccggta cctggtcgag aacacctgcc
cgcggaccga cgcgctcgtg gcgctggagc cgatggccat ggaccagctc ttgtggacgg
>.............................msc6..............................>
r a w
l r e h
r d l
g y r
y l v e
n t c
5701
tcagcggcgc ggcccagctg cgggcgtacg gactcggcgc gatcgtcggg gtcggcgcgg
agtcgccgcg ccgggtcgac gcccgcatgc ctgagccgcg ctagcagccc cagccgcgcc
>.............................msc6..............................>
l s g
a a q l
r a y
g l g
a i v g
v g a
5761
tgggtgtggt ccggggcgcc gagctgctgc tcggcccgtt cctcgccgtg ctgatggggc
acccacacca ggccccgcgg ctcgacgacg agccgggcaa ggagcggcac gactaccccg
>.............................msc6..............................>
v g v
v r g a
e l l
l g p
f l a v
l m g
5821
tgtcgctggt caccgtcgcg gaggcggcgc gggtgctgcg gcgggccccg caccggctcg
acagcgacca gtggcagcgc ctccgccgcg cccacgacgc cgcccggggc gtggccgagc
>.............................msc6..............................>
l s l
v t v a
e a a
r v l
r r a p
h r l
5881
gaaagttctg cctcctcctg ggcggcgccc aggccgtcgc cgcgctgctc tggggtgcgg
ctttcaagac ggaggaggac ccgccgcggg tccggcagcg gcgcgacgag accccacgcc
>.............................msc6..............................>
g k f
c l l l
g g a
q a v
a a l l
w g a
5941
ccctgctgct ggtgccggac cacgccggcg aactcgtgct cggcgacgtc tggcaggccg
gggacgacga ccacggcctg gtgcggccgc ttgagcacga gccgctgcag accgtccggc
>.............................msc6..............................>
a l l
l v p d
h a g
e l v
l g d v
w q a
6001
cctcggagct gatcgtgccg gccacgctcg gtgtcgcggg cgccggtctc ggcaccggcg
ggagcctcga ctagcacggc cggtgcgagc cacagcgccc gcggccagag ccgtggccgc
>.............................msc6..............................>
a s e
l i v p
a t l
g v a
g a g l
g t g
6061
cggcggccgg gctgcgcgcg ctcggcgcgg cccgccgctc tctgcgctgc cagctgttcg
gccgccggcc cgacgcgcgc gagccgcgcc gggcggcgag agacgcgacg gtcgacaagc
>.............................msc6..............................>
a a a
g l r a
l g a
a r r
s l r c
q l f
6121
cctccgcctg ctacgtcggc ggcggcctcg gcggggccgt cgcggccggc acggtcggct
ggaggcggac gatgcagccg ccgccggagc cgccccggca gcgccggccg tgccagccga
>.............................msc6..............................>
a s a
c y v g
g g l
g g a
v a a g
t v g
6181
cggcctgggg cgtcgccgcc gcgaccctcg cgagctccgc cgtgtggtgg ctgcagctgc
gccggacccc gcagcggcgg cgctgggagc gctcgaggcg gcacaccacc gacgtcgacg
>.............................msc6..............................>
s a w
g v a a
a t l
a s s
a v w w
l q l
318
Anhang
6241
gctccgccct gcgcgagcac caccaggact ccatccgcga agtgaggacc ccatgaccgc
cgaggcggga cgcgctcgtg gtggtcctga ggtaggcgct tcactcctgg ggtactggcg
>...........................msc6...........................>>
r s a
l r e h
h q d
s i r
e v r t
p >>msc7.>
m t
6301
ccaccccagg ctgagcatcg gcctgcccgt ctacaacggc gaggagtacc tcgccgagtc
ggtggggtcc gactcgtagc cggacgggca gatgttgccg ctcctcatgg agcggctcag
>.............................msc7..............................>
a h p r
l s i
g l p
v y n g
e e y
l a e
6361
gttcgacgcc ctgctcggcc agacctacga ggacttcgag ctggtcgtct ccgacaacgc
caagctgcgg gacgagccgg tctggatgct cctgaagctc gaccagcaga ggctgttgcg
>.............................msc7..............................>
s f d a
l l g
q t y
e d f e
l v v
s d n
6421
ctcgaccgac gggaccgagg acatctgccg ccggtacgcg gcgaaggact cccgcatccg
gagctggctg ccctggctcc tgtagacggc ggccatgcgc cgcttcctga gggcgtaggc
>.............................msc7..............................>
a s t d
g t e
d i c
r r y a
a k d
s r i
6481
ctacatccgg ctgccccgca acatcggcgc cgcgcccaac cacaacttcg tgttcacgga
gatgtaggcc gacggggcgt tgtagccgcg gcgcgggttg gtgttgaagc acaagtgcct
>.............................msc7..............................>
r y i r
l p r
n i g
a a p n
h n f
v f t
6541
gtgccgcggc gagctgttca agtgggcctc gcacgacgac ctgtacgccc gggacctgct
cacggcgccg ctcgacaagt tcacccggag cgtgctgctg gacatgcggg ccctggacga
>.............................msc7..............................>
e c r g
e l f
k w a
s h d d
l y a
r d l
6601
gctgcgctgc gtcgaggcgc tcgacgaacg gccggacgtg gtcctcgcgc acagcgacca
cgacgcgacg cagctccgcg agctgcttgc cggcctgcac caggagcgcg tgtcgctggt
>.............................msc7..............................>
l l r c
v e a
l d e
r p d v
v l a
h s d
6661
ggcggtcatc gacgaggacg gcaaggtgaa ggtcccctac gcgtacgggc tcgccaccga
ccgccagtag ctgctcctgc cgttccactt ccaggggatg cgcatgcccg agcggtggct
>.............................msc7..............................>
q a v i
d e d
g k v
k v p y
a y g
l a t
6721
ctcgccgcac gccccggagc gcttccgcag cctgctgttc gagcccggcg gcgacgactt
gagcggcgtg cggggcctcg cgaaggcgtc ggacgacaag ctcgggccgc cgctgctgaa
>.............................msc7..............................>
d s p h
a p e
r f r
s l l f
e p g
g d d
6781
ctacggggtg atgcgggccg acatgctgcg ccgggtgaag ccgcacgaca gctaccacca
gatgccccac tacgcccggc tgtacgacgc ggcccacttc ggcgtgctgt cgatggtggt
>.............................msc7..............................>
f y g v
m r a
d m l
r r v k
p h d
s y h
6841
cgcggaccgc acgttcgtcg ccgagatcac cctgcacggc cccttccacc aggtgcccga
gcgcctggcg tgcaagcagc ggctctagtg ggacgtgccg gggaaggtgg tccacgggct
>.............................msc7..............................>
h a d r
t f v
a e i
t l h g
p f h
q v p
6901
gctgctgtac ttccgccgcg accaccccac ccgcgccgag cgggccaacc cctccaagcg
cgacgacatg aaggcggcgc tggtggggtg ggcgcggctc gcccggttgg ggaggttcgc
>.............................msc7..............................>
e l l y
f r r
d h p
t r a e
r a n
p s k
Anhang
319
6961
ctcccggtgc gtcaacctgg acccgcgccg ggcgggcccg ctgcacccga cgccccggct
gagggccacg cagttggacc tgggcgcggc ccgcccgggc gacgtgggct gcggggccga
>.............................msc7..............................>
r s r c
v n l
d p r
r a g p
l h p
t p r
7021
gctcgccgag tacgtgtggg gtttcgtctc ggcgatccgg cgggcgccgc tgtccccggc
cgagcggctc atgcacaccc caaagcagag ccgctaggcc gcccgcggcg acaggggccg
>.............................msc7..............................>
l l a e
y v w
g f v
s a i r
r a p
l s p
7081
cgaccggcgc gcctgccacc gccatctggc cgcgtggatg accagccggg tccggccggg
gctggccgcg cggacggtgg cggtagaccg gcgcacctac tggtcggccc aggccggccc
>.............................msc7..............................>
a d r r
a c h
r h l
a a w m
t s r
v r p
7141
cgcgggcgag cgggtcgagg accgcgcccc cgtcgacccg gacctgccga ccgtccgcgt
gcgcccgctc gcccagctcc tggcgcgggg gcagctgggc ctggacggct ggcaggcgca
>.............................msc7..............................>
g a g e
r v e
d r a
p v d p
d l p
t v r
7201
cgacgatctc gtcgccggcc gtgaaggcag gcaggcatga cgtccgcgcc cggcaggccg
gctgctagag cagcggccgg cacttccgtc cgtccgtact gcaggcgcgg gccgtccggc
>..................msc7..................>>
v d d l
v a g
r e g
r q a >>.........msc8..........>
m
t s a
p g r p
7261
gtacgcgtcg gggtgttcgg cctgctcggc tccggcaacc tcggcaacga cgggtccctg
catgcgcagc cccacaagcc ggacgagccg aggccgttgg agccgttgct gcccagggac
>.............................msc8..............................>
v r v
g v f
g l l g
s g n
l g n
d g s l
7321
gaggccgtgc tcggccacct tcgcgccgcg catccggagg cggtcgtgga cgcgctgtgc
ctccggcacg agccggtgga agcgcggcgc gtaggcctcc gccagcacct gcgcgacacg
>.............................msc8..............................>
e a v
l g h
l r a a
h p e
a v v
d a l c
7381
ggcggccccg aggtcgtcac ggcccggtac ggcatccccg cgacgcggct gcactggtat
ccgccggggc tccagcagtg ccgggccatg ccgtaggggc gctgcgccga cgtgaccata
>.............................msc8..............................>
g g p
e v v
t a r y
g i p
a t r
l h w y
7441
cgcggggagt accggaccgc ctcccgagcg ggcgcgatcg cggggaaggg gctgggcaaa
gcgcccctca tggcctggcg gagggctcgc ccgcgctagc gccccttccc cgacccgttt
>.............................msc8..............................>
r g e
y r t
a s r a
g a i
a g k
g l g k
7501
ctcgtcgacg ccttccgcac cgccgcctgg gtgcgccggc acgacgtggt gatcgtgccg
gagcagctgc ggaaggcgtg gcggcggacc cacgcggccg tgctgcacca ctagcacggc
>.............................msc8..............................>
l v d
a f r
t a a w
v r r
h d v
v i v p
7561
ggcatgggcg tgctggaggc cacgctgccg ctgcggccgt gggggttccc gtacgcgctg
ccgtacccgc acgacctccg gtgcgacggc gacgccggca cccccaaggg catgcgcgac
>.............................msc8..............................>
g m g
v l e
a t l p
l r p
w g f
p y a l
7621
ttcctgctgt gcgcgagcgg ccggctgtcc ggcacccggg tcgcgctggt cggcgtgggg
aaggacgaca cgcgctcgcc ggccgacagg ccgtgggccc agcgcgacca gccgcacccc
>.............................msc8..............................>
f l l
c a s
g r l s
g t r
v a l
v g v g
320
Anhang
7681
gccggcccga tcggcaaccg ggcgacccgg accctggtgc gctggtcggc gcggctggcc
cggccgggct agccgttggc ccgctgggcc tgggaccacg cgaccagccg cgccgaccgg
>.............................msc8..............................>
a g p
i g n
r a t r
t l v
r w s
a r l a
7741
gcccaccggt cgtaccggga cgagctgtcc cgtgacgcgc tgcgggcgat gggcgtggac
cgggtggcca gcatggccct gctcgacagg gcactgcgcg acgcccgcta cccgcacctg
>.............................msc8..............................>
a h r
s y r
d e l s
r d a
l r a
m g v d
7801
acctcgcgcg acgaggtcca tccggacctc gccttcgccc tgccggtgcc gccggtgagc
tggagcgcgc tgctccaggt aggcctggag cggaagcggg acggccacgg cggccactcg
>.............................msc8..............................>
t s r
d e v
h p d l
a f a
l p v
p p v s
7861
gcggccggcg acccgccggg cctcgtgtgc gtcggcgtca tggacttcca cggcggcgac
cgccggccgc tgggcggccc ggagcacacg cagccgcagt acctgaaggt gccgccgctg
>.............................msc8..............................>
a a g
d p p
g l v c
v g v
m d f
h g g d
7921
gacgaccgcg accgcgccga ggagatccac cggcgctacc tggacgggac cacccgcttc
ctgctggcgc tggcgcggct cctctaggtg gccgcgatgg acctgccctg gtgggcgaag
>.............................msc8..............................>
d d r
d r a
e e i h
r r y
l d g
t t r f
7981
gtccgcgcgc tggccgagga gggcagaccc gtccggctgc tcaccggcga cgcgtgcgac
caggcgcgcg accggctcct cccgtctggg caggccgacg agtggccgct gcgcacgctg
>.............................msc8..............................>
v r a
l a e
e g r p
v r l
l t g
d a c d
8041
gcgccggtgg tcgccgcgat cctcgacgcg gtggactcgc cgctggtcac cgccgccgag
cgcggccacc agcggcgcta ggagctgcgc cacctgagcg gcgaccagtg gcggcggctc
>.............................msc8..............................>
a p v
v a a
i l d a
v d s
p l v
t a a e
8101
gcgacctcgc tggccgacct gctgaaggag acggcggccg ccgacaccgt ggtggcgacc
cgctggagcg accggctgga cgacttcctc tgccgccggc ggctgtggca ccaccgctgg
>.............................msc8..............................>
a t s
l a d
l l k e
t a a
a d t
v v a t
8161
cgctaccaca acctggtctg cgcgctgagg gccggcaccc cgacgctcgc cctcggctac
gcgatggtgt tggaccagac gcgcgactcc cggccgtggg gctgcgagcg ggagccgatg
>.............................msc8..............................>
r y h
n l v
c a l r
a g t
p t l
a l g y
8221
gcggccaaga gtgacgcgct catggcgagg atggggctgg acacgtactg ccatccggct
cgccggttct cactgcgcga gtaccgctcc taccccgacc tgtgcatgac ggtaggccga
>.............................msc8..............................>
a a k
s d a
l m a r
m g l
d t y
c h p a
8281
cgcgaggtcg acgccgaccg gctgctcgaa cagttccggg agctggagaa gaacgcggcg
gcgctccagc tgcggctggc cgacgagctt gtcaaggccc tcgacctctt cttgcgccgc
>.............................msc8..............................>
r e v
d a d
r l l e
q f r
e l e
k n a a
8341
gacgtacggc ggaccctcgc cgagcggaac ctgaccgtcg cccggcagct cgaccggcag
ctgcatgccg cctgggagcg gctcgccttg gactggcagc gggccgtcga gctggccgtc
>.............................msc8..............................>
d v r
r t l
a e r n
l t v
a r q
l d r q
Anhang
321
8401
ttcacggctc tgacagcggc cctgttcccg gcggccggcc gcacccgcac cccctccccc
aagtgccgag actgtcgccg ggacaagggc cgccggccgg cgtgggcgtg ggggaggggg
>.............................msc8..............................>
f t a
l t a
a l f p
a a g
r t r
t p s p
8461
gcgcccaccc ggcaggagac accatgaaag cgaccgccgt cccggagatc ttcggcgcct
cgcgggtggg ccgtcctctg tggtactttc gctggcggca gggcctctag aagccgcgga
>...........msc8...........>>
a p t
r q e
t p >>................msc9.................>
m k
a t a
v p e i
f g a
8521
acctgttcga gccgacgccg tacgccgacg aacgcggctt cttctgccgt accttcgacg
tggacaagct cggctgcggc atgcggctgc ttgcgccgaa gaagacggca tggaagctgc
>.............................msc9..............................>
y l f
e p t p
y a d
e r g
f f c r
t f d
8581
ccgacgtggt ccgctcggtg gggctcgacc cggacgcctt catccaggac agcctgtccc
ggctgcacca ggcgagccac cccgagctgg gcctgcggaa gtaggtcctg tcggacaggg
>.............................msc9..............................>
a d v
v r s v
g l d
p d a
f i q d
s l s
8641
gctcggtcgg aggtgtgctg cgcggcctgc acctgcgctc cggcgccggc gaggccaagc
cgagccagcc tccacacgac gcgccggacg tggacgcgag gccgcggccg ctccggttcg
>.............................msc9..............................>
r s v
g g v l
r g l
h l r
s g a g
e a k
8701
tggtgcggtg ctcgtccggg aagatcttcg acgtcgtcgt ggacctgcgg ccccactcgc
accacgccac gagcaggccc ttctagaagc tgcagcagca cctggacgcc ggggtgagcg
>.............................msc9..............................>
l v r
c s s g
k i f
d v v
v d l r
p h s
8761
cgacctacct gggccgtgcc ttcttcgagc tgtccggcga gacccagacg accctgtaca
gctggatgga cccggcacgg aagaagctcg acaggccgct ctgggtctgc tgggacatgt
>.............................msc9..............................>
p t y
l g r a
f f e
l s g
e t q t
t l y
8821
tcccggcggg ctgcgcgcac ggcttccagg cgctgaccgc gaccgccgac acctcgtacc
agggccgccc gacgcgcgtg ccgaaggtcc gcgactggcg ctggcggctg tggagcatgg
>.............................msc9..............................>
i p a
g c a h
g f q
a l t
a t a d
t s y
8881
ggatcgaccg cccgcacgac ccggccgagg acgtgacgat cgccttcgac gacccggaac
cctagctggc gggcgtgctg ggccggctcc tgcactgcta gcggaagctg ctgggccttg
>.............................msc9..............................>
r i d
r p h d
p a e
d v t
i a f d
d p e
8941
tggccattcc ctggccgctg ccggtcacgt cgatgtccga gcgggaccgg aaggcgccga
accggtaagg gaccggcgac ggccagtgca gctacaggct cgccctggcc ttccgcggct
>.............................msc9..............................>
l a i
p w p l
p v t
s m s
e r d r
k a p
9001
gcctcgccga cgtcctgaag cacagggaga gttgaggtcg ccgtggacac cgaagagtac
cggagcggct gcaggacttc gtgtccctct caactccagc ggcacctgtg gcttctcatg
>................msc9...............>>
s l a
d v l k
h r e
s >>.....msc10......>
v d
t e e y
322
Anhang
9061
gaactgcccc ggtcgcgggc ggccaacgag cggctgcacg ccctcgtgcc cggcggcgcg
cttgacgggg ccagcgcccg ccggttgctc gccgacgtgc gggagcacgg gccgccgcgc
>.............................msc10.............................>
e l p
r s r
a a n e
r l h
a l v
p g g a
9121
cacacctacg ccaagggcga cgaccagtac ccggagcacc tggccccggt catcagccac
gtgtggatgc ggttcccgct gctggtcatg ggcctcgtgg accggggcca gtagtcggtg
>.............................msc10.............................>
h t y
a k g
d d q y
p e h
l a p
v i s h
9181
ggcagcggcg cccatgtgtg ggacgtcgac ggcaaccgct acatcgagta cggctccggc
ccgtcgccgc gggtacacac cctgcagctg ccgttggcga tgtagctcat gccgaggccg
>.............................msc10.............................>
g s g
a h v
w d v d
g n r
y i e
y g s g
9241
ctgcggtcgg tcagcctcgg gcacgcccac ccgcgcgtga gcgaggctgt gcgtcgggaa
gacgccagcc agtcggagcc cgtgcgggtg ggcgcgcact cgctccgaca cgcagccctt
>.............................msc10.............................>
l r s
v s l
g h a h
p r v
s e a
v r r e
9301
ctcgaccgcg gcagcaactt cgtacggccg tccatcgtgg aggtcgaggc cgcggaacgc
gagctggcgc cgtcgttgaa gcatgccggc aggtagcacc tccagctccg gcgccttgcg
>.............................msc10.............................>
l d r
g s n
f v r p
s i v
e v e
a a e r
9361
ttcctggcga cggtgcccac cgccgacatg gtgaagttcg cgaagaacgg ctccgacgcc
aaggaccgct gccacgggtg gcggctgtac cacttcaagc gcttcttgcc gaggctgcgg
>.............................msc10.............................>
f l a
t v p
t a d m
v k f
a k n
g s d a
9421
accaccgccg cggtgcgcct cgcgcgtgcc gccaccgggc gccggcgggt ggccctctgc
tggtggcggc gccacgcgga gcgcgcacgg cggtggcccg cggccgccca ccgggagacg
>.............................msc10.............................>
t t a
a v r
l a r a
a t g
r r r
v a l c
9481
gccgaccatc cgttcttctc caccgacgac tggttcatcg gcaccacggc gatgtccgcc
cggctggtag gcaagaagag gtggctgctg accaagtagc cgtggtgccg ctacaggcgg
>.............................msc10.............................>
a d h
p f f
s t d d
w f i
g t t
a m s a
9541
ggcatcccgt cggccaccaa cgacctcacc gtgacgttcc cctacgcgga cctggccgcc
ccgtagggca gccggtggtt gctggagtgg cactgcaagg ggatgcgcct ggaccggcgg
>.............................msc10.............................>
g i p
s a t
n d l t
v t f
p y a
d l a a
9601
accgaggaac tgctcacccg gtacccggac gacatcgtct gcctgatcct cgaacccgcc
tggctccttg acgagtgggc catgggcctg ctgtagcaga cggactagga gcttgggcgg
>.............................msc10.............................>
t e e
l l t
r y p d
d i v
c l i
l e p a
9661
acccacagcg aaccgccgcc cggttacctg gccggcctgc gcgaactggc cgaccggcac
tgggtgtcgc ttggcggcgg gccaatggac cggccggacg cgcttgaccg gctggccgtg
>.............................msc10.............................>
t h s
e p p
p g y l
a g l
r e l
a d r h
9721
ggctgcgtcc tcgtcttcga cgagatgatc accgggttcc gctggtccga ggcgggcgcc
ccgacgcagg agcagaagct gctctactag tggcccaagg cgaccaggct ccgcccgcgg
>.............................msc10.............................>
g c v
l v f
d e m i
t g f
r w s
e a g a
Anhang
323
9781
cagggcctgt acggcgtcgt ccccgacctc tccacgttcg gcaaggcgct gggcaacggc
gtcccggaca tgccgcagca ggggctggag aggtgcaagc cgttccgcga cccgttgccg
>.............................msc10.............................>
q g l
y g v
v p d l
s t f
g k a
l g n g
9841
ttcgccgtct ccgcgctggc cggccgccgc gccctgatgg agctgggcgg gctgcgccac
aagcggcaga ggcgcgaccg gccggcggcg cgggactacc tcgacccgcc cgacgcggtg
>.............................msc10.............................>
f a v
s a l
a g r r
a l m
e l g
g l r h
9901
tccggcgacc gggtgttcct gctgtccacc acgcacggtg cggagacgca ctccctggcg
aggccgctgg cccacaagga cgacaggtgg tgcgtgccac gcctctgcgt gagggaccgc
>.............................msc10.............................>
s g d
r v f
l l s t
t h g
a e t
h s l a
9961
gccgcgatgg ccgtgcagag cacctacgtc gaggagggcg tcaccgcgcg gctgcacgcc
cggcgctacc ggcacgtctc gtggatgcag ctcctcccgc agtggcgcgc cgacgtgcgg
>.............................msc10.............................>
a a m
a v q
s t y v
e e g
v t a
r l h a
10021
ctcggcgagc ggctggccac cggcgtccgt gaagtcgccg ccgccatggg cgtcggcgac
gagccgctcg ccgaccggtg gccgcaggca cttcagcggc ggcggtaccc gcagccgctg
>.............................msc10.............................>
l g e
r l a
t g v r
e v a
a a m
g v g d
10081
cacgtcctcg tcaagggccg gcccagcaac ctggtcttcg ccaccctcga cgagcacggg
gtgcaggagc agttcccggc cgggtcgttg gaccagaagc ggtgggagct gctcgtgccc
>.............................msc10.............................>
h v l
v k g
r p s n
l v f
a t l
d e h g
10141
cggccgtcgc aggagtaccg caccctgttc ctgcgccggc tcctcgcggg cggggtgctg
gccggcagcg tcctcatggc gtgggacaag gacgcggccg aggagcgccc gccccacgac
>.............................msc10.............................>
r p s
q e y
r t l f
l r r
l l a
g g v l
10201
gccccgtcgt tcgtggtgag cgccgcgctc gacgacgccg acatcgatcg gaccgtcgac
cggggcagca agcaccactc gcggcgcgag ctgctgcggc tgtagctagc ctggcagctg
>.............................msc10.............................>
a p s
f v v
s a a l
d d a
d i d
r t v d
10261
gtggtcgccc aggcgtgcgc ggtgtaccgg aaggcgctgg acgccggcga ccccacgccc
caccagcggg tccgcacgcg ccacatggcc ttccgcgacc tgcggccgct ggggtgcggg
>.............................msc10.............................>
v v a
q a c
a v y r
k a l
d a g
d p t p
10321
tggctgtccg gacggccggt gaaaccggtg ttccgccgtc tggcgtgagg gaacgtcagc
accgacaggc ctgccggcca ctttggccac aaggcggcag accgcactcc cttgcagtcg
>......................msc10......................>>
w l s
g r p
v k p v
f r r
l a -
10381
gaggccctgc ccgtccgccc gtccggtcga ccagccacgc ggtggccggt gtcaccgcca
ctccgggacg ggcaggcggg caggccagct ggtcggtgcg ccaccggcca cagtggcggt
10441
gcgcggtgca ccagccgccg aggacgtcgg tcgggtagtg cgcgcccagc gcgacctgcg
cgcgccacgt ggtcggcggc tcctgcagcc agcccatcac gcgcgggtcg cgctggacgc
10501
cccagcccat gacggccccg gcggccggcg cggcggcgag cacgagggtg aggccggccg
gggtcgggta ctgccggggc cgccggccgc gccgccgctc gtgctcccac tccggccggc
10561
ttctgccgag gcggagccgc ccggccgcga gcagcgccac cgcgagggcg agcgcggtga
aagacggctc cgcctcggcg ggccggcgct cgtcgcggtg gcgctcccgc tcgcgccact
324
Anhang
10621
ggaaggcggt gtgcccgctc gggtacgaca ggttgtcgtc gccgtggatg gtgcgtccga
ccttccgcca cacgggcgag cccatgctgt ccaacagcag cggcacctac cacgcaggct
10681
ccaggggctt gagcagcgtg gtcgccccca cggctccgcc gaccgaggcg aggacgaaca
ggtccccgaa ctcgtcgcac cagcgggggt gccgaggcgg ctggctccgc tcctgcttgt
10741
ccgcggcccg aggacgccgc agcagcagga gacagcccgc cacgacggcc acgaccagcg
ggcgccgggc tcctgcggcg tcgtcgtcct ctgtcgggcg gtgctgccgg tgctggtcgc
10801
ccgccgcccc ggcgggctcc cccagaaagt ccgtgccgag agcgacccgc cgccacgagg
ggcggcgggg ccgcccgagg gggtctttca ggcacggctc tcgctgggcg gcggtgctcc
10861
gccccacccc gtcgaccacc gccgagaccc gcacgtccac cgcaccgggc tccccgtccc
cggggtgggg cagctggtgg cggctctggg cgtgcaggtg gcgtggcccg aggggcaggg
10921
cggcgaacac gaccccaccg acggccaccc ccagcgcggc gagaacggcc accgtcccga
gccgcttgtg ctggggtggc tgccggtggg ggtcgcgccg ctcttgccgg tggcagggct
10981
gccacgcacg caacaccgcc ggcagcacgg gcggcgcgga cagcacgggc ggcgcggccc
cggtgcgtgc gttgtggcgg ccgtcgtgcc cgccgcgcct gtcgtgcccg ccgcgccggg
11041
gccgcccacc aggtccgccg ggcccgaccc cgacatggtc ctcgacctcc gccaccaacg
cggcgggtgg tccaggcggc ccgggctggg gctgtaccag gagctggagg cggtggttgc
11101
accccccgtc gtgtccctgc gcgccaccct aaccccccac ttttcatgga cggcaggtcg
tggggggcag cacagggacg cgcggtggga ttggggggtg aaaagtacct gccgtccagc
11161
cccgcaccgg gccgccggcg tcgcaggtgt ctccccggtg ccggacctgg ggcccttgac
gggcgtggcc cggcggccgc agcgtccaca gaggggccac ggcctggacc ccgggaactg
11221
gcggccggcc gtccagtcgc tctccactga cgctggagcg gcggccccga gactcgctgt
cgccggccgg caggtcagcg agaggtgact gcgacctcgc cgccggggct ctgagcgaca
11281
gacatctcgg gaaggggtac ttcatgccgg actcaggcgt cgtcaggacg cgtcatgcga
ctgtagagcc cttccccatg aagtacggcc tgagtccgca gcagtcctgc gcagtacgct
>>...............msc12.................>
m p
d s g
v v r t
r h a
11341
tccatgtggc ggccgagccc aaggccgtgt acgagctgat cgcggcggcg gaggactggc
aggtacaccg ccggctcggg ttccggcaca tgctcgacta gcgccgccgc ctcctgaccg
>.............................msc12.............................>
i h v
a a e p
k a v
y e l
i a a a
e d w
11401
cgcacatttt tcctcccacc gtgcatgtgg agaagttcga ccgggacggc cggtcggaac
gcgtgtaaaa aggagggtgg cacgtacacc tcttcaagct ggccctgccg gccagccttg
>.............................msc12.............................>
p h i
f p p t
v h v
e k f
d r d g
r s e
11461
ggctgcggat ccgggcgttc gcgaacgggg aggtgcggtc gtggacctcc cgccgggaac
ccgacgccta ggcccgcaag cgcttgcccc tccacgccag cacctggagg gcggcccttg
>.............................msc12.............................>
r l r
i r a f
a n g
e v r
s w t s
r r e
11521
tggatccggg cgcgctgcgg gtgacgttcc gccaggaggt gtcgtccgcg ccggtcgcgt
acctaggccc gcgcgacgcc cactgcaagg cggtcctcca cagcaggcgc ggccagcgca
>.............................msc12.............................>
l d p
g a l r
v t f
r q e
v s s a
p v a
Anhang
325
11581
cgatgggcgg cgaatggatc atcgaggccg cgccgggcgg cagtagcgtc gtcctgctgc
gctacccgcc gcttacctag tagctccggc gcggcccgcc gtcatcgcag caggacgacg
>.............................msc12.............................>
s m g
g e w i
i e a
a p g
g s s v
v l l
11641
acgacttcac cgtcgtcgac gacgacccgg cggaccgtga gtgggtgggg cgcgccgtcg
tgctgaagtg gcagcagctg ctgctgggcc gcctggcact cacccacccc gcgcggcagc
>.............................msc12.............................>
h d f
t v v d
d d p
a d r
e w v g
r a v
11701
acaccaacag cgaatccgag ctggccgcgc tgaagacggc cgcggagtcc ctggcggcgg
tgtggttgtc gcttaggctc gaccggcgcg acttctgccg gcgcctcagg gaccgccgcc
>.............................msc12.............................>
d t n
s e s e
l a a
l k t
a a e s
l a a
11761
agccgggggc cttgctgtcg ttctccgatc acgtcgacat ctcgggcgcg cggcaggagg
tcggcccccg gaacgacagc aagaggctag tgcagctgta gagcccgcgc gccgtcctcc
>.............................msc12.............................>
e p g
a l l s
f s d
h v d
i s g a
r q e
11821
tgtacgactt cctgtggcgg gccgacctgt gggaggagcg gcttccgcat gtgagcaggc
acatgctgaa ggacaccgcc cggctggaca ccctcctcgc cgaaggcgta cactcgtccg
>.............................msc12.............................>
v y d
f l w r
a d l
w e e
r l p h
v s r
11881
tcgtgctgac cgagccgggc gacgacctgc agacggtgga gatggatacc cgcgccgccg
agcacgactg gctcggcccg ctgctggacg tctgccacct ctacctatgg gcgcggcggc
>.............................msc12.............................>
l v l
t e p g
d d l
q t v
e m d t
r a a
11941
acggttcggt acacacgacc aagtcggtac gcgtcgggtt cgcgccggac cggctcgtgt
tgccaagcca tgtgtgctgg ttcagccatg cgcagcccaa gcgcggcctg gccgagcaca
>.............................msc12.............................>
d g s
v h t t
k s v
r v g
f a p d
r l v
12001
acaagcagat ccaggtgccc ccgctgatgg ccgcgcacac gggccgctgg accgtcgaga
tgttcgtcta ggtccacggg ggcgactacc ggcgcgtgtg cccggcgacc tggcagctct
>.............................msc12.............................>
y k q
i q v p
p l m
a a h
t g r w
t v e
12061
ccaccgaggg cggggtacgc gccacctcgc accacacggt cgtcctgcgc ccggatcggg
ggtggctccc gccccatgcg cggtggagcg tggtgtgcca gcaggacgcg ggcctagccc
>.............................msc12.............................>
t t e
g g v r
a t s
h h t
v v l r
p d r
12121
tgcgcgaact gctgggcccc gaagccacgc tcgccgcggc ccgcgacctc gtacgcgagg
acgcgcttga cgacccgggg cttcggtgcg agcggcgccg ggcgctggag catgcgctcc
>.............................msc12.............................>
v r e
l l g p
e a t
l a a
a r d l
v r e
12181
ccctcggcag gaacagcacg gccaccctca ccctggccaa ggaggccgcg gaacgcaccg
gggagccgtc cttgtcgtgc cggtgggagt gggaccggtt cctccggcgc cttgcgtggc
>.............................msc12.............................>
a l g
r n s t
a t l
t l a
k e a a
e r t
12241
cgtcccgctg acgccgggcg aacggaagcg ggcggggcmc cggacaaccg gggccccgcc
gcagggcgac tgcggcccgc ttgccttcgc ccgccccgkg gcctgttggc cccggggcgg
>..msc12..>>
a s r
-
326
Anhang
12301
tccgtgttcc ggttcagctt cccgacaggg acgagttgac caggtcgacg aaggcccggg
aggcacaagg ccaagtcgaa gggctgtccc tgctcaactg gtccagctgc ttccgggccc
<<.....................msc16......................<
- s
g s l
s s n v
l d v
f a r
12361
gggtctcggc gccgtcgagg tcctcgtcgg gaagggtcac gccgtaggcg cgggtgatac
cccagagccg cggcagctcc aggagcagcc cttcccagtg cggcatccgc gcccactatg
<.............................msc16.............................<
p t e a
g d l
d e d
p l t v
g y a
r t i
12421
ggccggccac ctccagcagg gcgagggagt cgtagccgag gtccgtgaag gacacgtcgg
ccggccggtg gaggtcgtcc cgctccctca gcatcggctc caggcacttc ctgtgcagcc
<.............................msc16.............................<
r g a v
e l l
a l s
d y g l
d t f
s v d
12481
cgatgtctcc gctcaggtcg acgccctcgt cctggccggc cgactcgcgc aggatgcggg
gctacagagg cgagtccagc tgcgggagca ggaccggccg gctgagcgcg tcctacgccc
<.............................msc16.............................<
a i d g
s l d
v g e
d q g a
s e r
l i r
12541
tgaagtcgtc gatgctcagt gccgtgaccc cgttggcgct catgagtggt ttccttccgt
acttcagcag ctacgagtca cggcactggg gcaaccgcga gtactcacca aaggaaggca
<....................msc16...................<<
t f d d
i s l
a t v
g n a s
m
12601
cggatgcgtg ctcgggtggg ttcaccgggg gtgccggtgg tctgtgcggg cgctggttct
gcctacgcac gagcccaccc aagtggcccc cacggccacc agacacgccc gcgaccaaga
12661
tcggtgcggt ggtggttcag ttcgcgcgcg tgaccaccgc ggccgcgttg aagccgccct
agccacgcca ccaccaagtc aagcgcgcgc actggtggcg ccggcgcaac ttcggcggga
<<...................msc15.....................<
n a r
t v v a
a a n
f g g
12721
cgccgcgggc caggaccagc gccgcgtcgc cggtgagcgt gcgcgcctcg cccgtcacca
gcggcgcccg gtcctggtcg cggcgcagcg gccactcgca cgcgcggagc gggcagtggt
<.............................msc15.............................<
e g r a
l v l
a a d
g t l t
r a e
g t v
12781
ggtccacggg gcagtccgcg gcgaccgagg tgacgtgcgc ggtcggggga acgctcccgt
ccaggtgccc cgtcaggcgc cgctggctcc actgcacgcg ccagccccct tgcgagggca
<.............................msc15.............................<
l d v p
c d a
a v s
t v h a
t p p
v s g
12841
cacgcaggac cagcagcgcg gaggccaggt cgagggcccc gccgcccgcg tacaggcggc
gtgcgtcctg gtcgtcgcgc ctccggtcca gctcccgggg cggcgggcgc atgtccgccg
<.............................msc15.............................<
d r l v
l l a
s a l
d l a g
g g a
y l r
12901
cggtctgcgc cttcggtacc gcgacccgta ccccgcgggg gccgaacacc gctgcgagcg
gccagacgcg gaagccatgg cgctgggcat ggggcgcccc cggcttgtgg cgacgctcgc
<.............................msc15.............................<
g t q a
k p v
a v r
v g r p
g f v
a a l
12961
cggccgcttc ggcccggtcc gcctcgggta cgccggccgc gtccgcgaag acgacggcga
gccggcgaag ccgggccagg cggagcccat gcggccggcg caggcgcttc tgctgccgct
<.............................msc15.............................<
a a a e
a r d
a e p
v g a a
d a f
v v a
Anhang
327
13021
tggtgtcggg cgtacggtcc gcgtccgcga gggcggcacg gatcgcgcgc tccagaccgt
accacagccc gcatgccagg cgcaggcgct cccgccgtgc ctagcgcgcg aggtctggca
<.............................msc15.............................<
i t d p
t r d
a d a
l a a r
i a r
e l g
13081
cggccccggg gtcgcgcgga tcggggtcga aggtggccgc gtatccggcg agttcgccgt
gccggggccc cagcgcgcct agccccagct tccaccggcg cataggccgc tcaagcggca
<.............................msc15.............................<
d a g p
d r p
d p d
f t a a
y g a
l e g
13141
ggacacgggc gccgcgttcc tcggcggaca ccgggtcctc cagcaccagg tacgcgccgc
cctgtgcccg cggcgcaagg agccgcctgt ggcccaggag gtcgtggtcc atgcgcggcg
<.............................msc15.............................<
h v r a
g r e
e a s
v p d e
l v l
y a g
13201
cctcgcccgg gacatggccc gacgccgcct cgtcgaaggg caggtaagcg cggtcggggc
ggagcgggcc ctgtaccggg ctgcggcgga gcagcttccc gtccattcgc gccagccccg
<.............................msc15.............................<
g e g p
v h g
s a a
e d f p
l y a
r d p
13261
ggttctcggt gctgagccga ccggacgcga gctgtcccgc gaggcccagt gggcacaggg
ccaagagcca cgactcggct ggcctgcgct cgacagggcg ctccgggtca cccgtgtccc
<.............................msc15.............................<
r n e t
s l r
g s a
l q g a
l g l
p c l
13321
cgccgtcgac gcctcccgcg agcatcacct tcgtaccctt gcggatctgc cgccgcgcgt
gcggcagctg cggagggcgc tcgtagtgga agcatgggaa cgcctagacg gcggcgcgca
<.............................msc15.............................<
a g d v
g g a
l m v
k t g k
r i q
r r a
13381
gcccgatggc gtcgagtccg cccgcctggt cggtgacgac ggcgctgctc gggcccttca
cgggctaccg cagctcaggc gggcggacca gccactgctg ccgcgacgag cccgggaagt
<.............................msc15.............................<
h g i a
d l g
g a q
d t v v
a s s
p g k
13441
gcccgtgccg gatcgagatc tggccggtgt tgacggcgta gaaccaggcg aaggactggt
cgggcacggc ctagctctag accggccaca actgccgcat cttggtccgc ttcctgacca
<.............................msc15.............................<
l g h r
i s i
q g t
n v a y
f w a
f s q
13501
acgcgctgac gaactggccg cccttgctcc acaggttctg cagttcgcgc tggccgaact
tgcgcgactg cttgaccggc gggaacgagg tgtccaagac gtcaagcgcg accggcttga
<.............................msc15.............................<
y a s v
f q g
g k s
w l n q
l e r
q g f
13561
cgaagccgcc catcgacgag gccgaggaga cgcctgcctc gtagggggcc agggcggcga
gcttcggcgg gtagctgctc cggctcctct gcggacggag catcccccgg tcccgccgct
<.............................msc15.............................<
e f g g
m s s
a s s
v g a e
y p a
l a a
13621
gatcgatacc gctgtccttc agtgcctcgt cggccgcgta cagggcgagg cgggtcatgt
ctagctatgg cgacaggaag tcacggagca gccggcgcat gtcccgctcc gcccagtaca
<.............................msc15.............................<
l d i g
s d k
l a e
d a a y
l a l
r t m
13681
ggtcggtctg gggcagcagc cggctcggga tgtgcgcgga ggcctcgaag ccgggtacct
ccagccagac cccgtcgtcg gccgagccct acacgcgcct ccggagcttc ggcccatgga
<.............................msc15.............................<
h d t q
p l l
r s p
i h a s
a e f
g p v
328
Anhang
13741
cgccggcgag ccgcacccgg taaccggagg cgtcgaaacg ggtgatctcc gcgatgccgt
gcggccgctc ggcgtgggcc attggcctcc gcagctttgc ccactagagg cgctacggca
<.............................msc15.............................<
e g a l
r v r
y g s
a d f r
t i e
a i g
13801
tcgtgccctc gacgacggcc gaccagtgtg cgtcggtgcc gaggccggtg ggggcggcga
agcacgggag ctgctgccgg ctggtcacac gcagccacgg ctccggccac ccccgccgct
<.............................msc15.............................<
n t g e
v v a
s w h
a d t g
l g t
p a a
13861
caccgagacc ggtgatcacg ggtcgggtgg cggtggccgt cacgcggcac tcctttcggg
gtggctctgg ccactagtgc ccagcccacc gccaccggca gtgcgccgtg aggaaagccc
<....................msc15...................<<
v g l g
t i v
p r t
a t a t
v
<<.......msc14........<
- a a
s r e p
13921
acgggcgagg acgacggcgc tctggaaacc gccgaagccg ctgccgacgc tgagcacgga
tgcccgctcc tgctgccgcg agacctttgg cggcttcggc gacggctgcg actcgtgcct
<.............................msc14.............................<
r a l
v v a
s q f g
g f g
s g v
s l v s
13981
gtcgacccgg gcctcccgcg cgatgttggg gacgtagtcg aggtcgcaca gcggatcggg
cagctgggcc cggagggcgc gctacaaccc ctgcatcagc tccagcgtgt cgcctagccc
<.............................msc14.............................<
d v r
a e r
a i n p
v y d
l d c
l p d p
14041
ttcgtgcagg ttcgcggtgg gcgggatcag gccgttctcc atggcgagca cgcatgcgac
aagcacgtcc aagcgccacc cgccctagtc cggcaagagg taccgctcgt gcgtacgctg
<.............................msc14.............................<
e h l
n a t
p p i l
g n e
m a l
v c a v
14101
gagttcgagc gcgccgatcg cgccgagcga gtgcccgatc atcgacttga tggagctgac
ctcaagctcg cgcggctagc gcggctcgct cacgggctag tagctgaact acctcgactg
<.............................msc14.............................<
l e l
a g i
a g l s
h g i
m s k
i s s v
14161
gggcacccgg tgggcgtgct cgccgagcga ggtcttgaac gcggcggtct cgtgccggtc
cccgtgggcc acccgcacga gcggctcgct ccagaacttg cgccgccaga gcacggccag
<.............................msc14.............................<
p v r
h a h
e g l s
t k f
a a t
e h r d
14221
gttctgcttg gtgctggagc cgtgcgcgtt gacgtagtcg atctcccccg gtgcgagccg
caagacgaac cacgacctcg gcacgcgcaa ctgcatcagc tagagggggc cacgctcggc
<.............................msc14.............................<
n q k
t s s
g h a n
v y d
i e g
p a l r
14281
cgcctccgcg agcgccaccc ggatcgcctc ggccatctcc gcgccgtccg agcgcagtcc
gcggaggcgc tcgcggtggg cctagcggag ccggtagagg cgcggcaggc tcgcgtcagg
<.............................msc14.............................<
a e a
l a v
r i a e
a m e
a g d
s r l g
14341
ggtcatgtgg tacgcgttgc tgcgcgtgcc gaatccggcg acctcggcgt agatccgtgc
ccagtacacc atgcgcaacg acgcgcacgg cttaggccgc tggagccgca tctaggcacg
<.............................msc14.............................<
t m h
y a n
s r t g
f g a
v e a
y i r a
14401
gccacgcttc cgcgcgtgct ggagttcctc caggatcagc accgccgcgc cttcgccgag
cggtgcgaag gcgcgcacga cctcaaggag gtcctagtcg tggcggcgcg gaagcggctc
<.............................msc14.............................<
g r k
r a h
q l e e
l i l
v a a
g e g l
Anhang
329
14461
gacgagcccg ttgcgggagt tgtcgaaggg gcgggaggcg tgttcggggt cgtcgttgcg
ctgctcgggc aacgccctca acagcttccc cgccctccgc acaagcccca gcagcaacgc
<.............................msc14.............................<
v l g
n r s
n d f p
r s a
h e p
d d n r
14521
gggcgtggtc gccttgatgg cgtcgaagca ggcgagggtg atgggtgaga tcggcgcgtc
cccgcaccag cggaactacc gcagcttcgt ccgctcccac tacccactct agccgcgcag
<.............................msc14.............................<
p t t
a k i
a d f c
a l t
i p s
i p a d
14581
ggtgcccccc gcgacgatga cgtcggcgct gccctcgcgg atgagatcgg ccccgtgacc
ccacgggggg cgctgctact gcagccgcga cgggagcgcc tactctagcc ggggcactgg
<.............................msc14.............................<
t g g
a v i
v d a s
g e r
i l d
a g h g
14641
gacggcgtcg aggccggagg tgcagccgtc ggagaccagc gacaccggac ccttggcccc
ctgccgcagc tccggcctcc acgtcggcag cctctggtcg ctgtggcctg ggaaccgggg
<.............................msc14.............................<
v a d
l g s
t c g d
s v l
s v p
g k a g
14701
gacctcgcgg gccagctcgg cggccagcga gctcggcacg aagtggtcgt agagccgggg
ctggagcgcc cggtcgagcc gccggtcgct cgagccgtgc ttcaccagca tctcggcccc
<.............................msc14.............................<
v e r
a l e
a a l s
s p v
f h d
y l r p
14761
caccgcgtac gcggggtcga cgagccagtg ggcgccgccg tcgctcagga cgacgtactc
gtggcgcatg cgccccagct gctcggtcac ccgcggcggc agcgagtcct gctgcatgag
<.............................msc14.............................<
v a y
a p d
v l w h
a g g
d s l
v v y e
14821
gtcctccatc gacgtggtgc agcccaccgc gcagccgagc gacacacccg tgcgcgccgc
caggaggtag ctgcaccacg tcgggtggcg cgtcggctcg ctgtgtgggc acgcgcggcg
<.............................msc14.............................<
d e m
s t t
c g v a
c g l
s v g
t r a a
14881
ctgtgaggtc gtgaggtcga ggccggagtc ggccaccgcc tcccgggcgg cgatcagcgc
gacactccag cactccagct ccggcctcag ccggtggcgg agggcccgcc gctagtcgcg
<.............................msc14.............................<
q s t
t l d
l g s d
a v a
e r a
a i l a
14941
gaactggccc gcgcggtcga gcctgcgctc ctcctgcggg gacagccccg ccgcggcggg
cttgaccggg cgcgccagct cggacgcgag gaggacgccc ctgtcggggc ggcgccgccc
<.............................msc14.............................<
f q g
a r d
l r r e
e q p
s l g
a a a p
15001
ccggaggtcg acctcggccg cgacctggga gcggtacggg gaggcatcga agagggagat
ggcctccagc tggagccggc gctggaccct cgccatgccc ctccgtagct tctccctcta
<.............................msc14.............................<
r l d
v e a
a v q s
r y p
s a d
f l s i
15061
ggtgcgggtg gccgtccgcc cggtcgacag cagatcccag tacctcttga tccctgttcc
ccacgcccac cggcaggcgg gccagctgtc gtctagggtc atggagaact agggacaagg
<.............................msc14.............................<
t r t
a t r
g t s l
l d w
y r k
i g t g
15121
cccgggcgcc accgcaccga ttccggttat gacgacgcgt cgttccatgg gcatcctcac
gggcccgcgg tggcgtggct aaggccaata ctgctgcgca gcaaggtacc cgtaggagtg
<......................msc14......................<<
g p a
v a g
i g t i
v v r
r e m
msc13 <<.<
-
330
Anhang
15181
tcgctgtcgg cgggaaccgg cgctccggtc ccgggtcgca aacgtgtcaa tccggcctgg
agcgacagcc gcccttggcc gcgaggccag ggcccagcgt ttgcacagtt aggccggacc
<.............................msc13.............................<
e s d
a p v p
a g t
g p r
l r t l
g a q
15241
agacccgctc gaaccggcct ggacgcctgt gccgtcgcgt cggcggccgg ttctgcgggt
tctgggcgag cttggccgga cctgcggaca cggcagcgca gccgccggcc aagacgccca
<.............................msc13.............................<
l g a
r v p r
s a q
a t a
d a a p
e a p
15301
gcgtcggaga gttcggcgag ggccctgtcg aaggcctcgc gctcggcttc gggtgtgccg
cgcagcctct caagccgctc ccgggacagc ttccggagcg cgagccgaag cccacacggc
<.............................msc13.............................<
a d s
l e a l
a r d
f a e
r e a e
p t g
15361
gggcgcgcga gcagcagacc gaccgcccgg gagcctcctc tcgcgacccg cggatggcgg
cccgcgcgct cgtcgtctgg ctggcgggcc ctcggaggag agcgctgggc gcctaccgcc
<.............................msc13.............................<
p r a
l l l g
v a r
s g g
r a v r
p h r
15421
cgcgcgagca cggtgagccc ctgtcccgga cccgcctcgg cgagcaccac ctcccgctcg
gcgcgctcgt gccactcggg gacagggcct gggcggagcc gctcgtggtg gagggcgagc
<.............................msc13.............................<
r a l
v t l g
q g p
g a e
a l v v
e r e
15481
gcgagcagga ggtcgagcgc cggcccgaac agcacgggac gcgcgggctg gagcgcccag
cgctcgtcct ccagctcgcg gccgggcttg tcgtgccctg cgcgcccgac ctcgcgggtc
<.............................msc13.............................<
a l l
l d l a
p g f
l v p
r a p q
l a w
15541
aacctcgggt cccgggcccg ttcgtaggtc aggggcccgg gctcgtacgc cgagtgcagt
ttggagccca gggcccgggc aagcatccag tccccgggcc cgagcatgcg gctcacgtca
<.............................msc13.............................<
f r p
d r a r
e y t
l p g
p e y a
s h l
15601
accaaccggg gccgacggac gggcaccgag gccagcagcg gcagcgcgcg cagggccgct
tggttggccc cggctgcctg cccgtggctc cggtcgtcgc cgtcgcgcgc gtcccggcga
<.............................msc13.............................<
v l r
p r r v
p v s
a l l
p l a r
l a a
15661
tcggtgagca ccgggctgtg gaacgggttg agcgcgcgag ccctgcggca ggtgaagccg
agccactcgt ggcccgacac cttgcccaac tcgcgcgctc gggacgccgt ccacttcggc
<.............................msc13.............................<
e t l
v p s h
f p n
l a r
a r r c
t f g
15721
tcggcgcgca gtttctgctg cgcggtgcgc aggccctcct cggggccggc gagcagcacc
agccgcgcgt caaagacgac gcgccacgcg tccgggagga gccccggccg ctcgtcgtgg
<.............................msc13.............................<
d a r
l k q q
a t r
l g e
e p g a
l l v
15781
tggcggggcg cgttgacggc gcccacgacg acctcgtcgg tggtgtacgg ggcgacctcg
accgccccgc gcaactgccg cgggtgctgc tggagcagcc accacatgcc ccgctggagc
<.............................msc13.............................<
q r p
a n v a
g v v
v e d
t t y p
a v e
15841
tcggggctcg cctgcacggc gagcatgccg cccggcgggg tgccgtcgag ctggctgatg
agccccgagc ggacgtgccg ctcgtacggc gggccgcccc acggcagctc gaccgactac
<.............................msc13.............................<
d p s
a q v a
l m g
g p p
t g d l
q s i
Anhang
331
15901
cggtccgcca tcagggccac ggagtcggtc aggtcgaaga ggccggcgag ggtggccgcg
gccaggcggt agtcccggtg cctcagccag tccagcttct ccggccgctc ccaccggcgc
<.............................msc13.............................<
r d a
m l a v
s d t
l d f
l g a l
t a a
15961
gcgacctctc cgacgctgtg cccgagcagg gccgcgggcc gcaccccggc gtcgaggacc
cgctggagag gctgcgacac gggctcgtcc cggcgcccgg cgtggggccg cagctcctgg
<.............................msc13.............................<
a v e
g v s h
g l l
a a p
r v g a
d l v
16021
gtgcggccga cggcccagtc gagtgcgaac agcagcggct gggcggtgcg cggaccgtcg
cacgccggct gccgggtcag ctcacgcttg tcgtcgccga cccgccacgc gcctggcagc
<.............................msc13.............................<
t r g
v a w d
l a f
l l p
q a t r
p g d
16081
gtctccgggc cggtgcgggc ggcgagccag tcggcgcgca gatcgaaccc gtgcgcgcgc
cagaggcccg gccacgcccg ccgctcggtc agccgcgcgt ctagcttggg cacgcgcgcg
<.............................msc13.............................<
t e p
g t r a
a l w
d a r
l d f g
h a r
16141
cacagtccga ggacctcgtc catgcgggtc cggaaacccg gatgggcgcg gtacaggccg
gtgtcaggct cctggagcag gtacgcccag gcctttgggc ctacccgcgc catgtccggc
<.............................msc13.............................<
w l g
l v e d
m r t
r f g
p h a r
y l g
16201
acgcccatac cgggttgttg cgcgccctgc ccggggaaca gcagtacggc cggccgcggt
tgcgggtatg gcccaacaac gcgcgggacg ggccccttgt cgtcatgccg gccggcgcca
<.....<< msc13
v g m
16261
gcggtcacga cgggtctcct ctcctcgctg tcccgccatg ctggaggcgt cggctggagc
cgccagtgct gcccagagga gaggagcgac agggcggtac gacctccgca gccgacctcg
16321
ctcggtcgac cccgggcaca acgtccgtgg ccgggcggcg cggcaccgca cggacgccgt
gagccagctg gggcccgtgt tgcaggcacc ggcccgccgc gccgtggcgt gcctgcggca
16381
ccgcctcgca gcggccccga ccgagccgct ccagccgttc tggaccgctc gtccaccggc
ggcggagcgt cgccggggct ggctcggcga ggtcggcaag acctggcgag caggtggccg
16441
cggccggagt gttgtcccca gccggaggca cgcgacccgt cgccccggtg cgccgcgggc
gccggcctca caacaggggt cggcctccgt gcgctgggca gcggggccac gcggcgcccg
16501
ggaacgaagg ccgccgggcc gggtaccacc cggcccggcg gccgtcggtg tcccgaccgt
ccttgcttcc ggcggcccgg cccatggtgg gccgggccgc cggcagccac agggctggca
16561
ggttcccctg acggccggtg aaagggcatc gggacatgag gttcgaggac ctgtacatcg
ccaaggggac tgccggccac tttcccgtag ccctgtactc caagctcctg gacatgtagc
>>...................msc17....................>
v
k g h
r d m
r f e d
l y i
16621
ccggggccgc cgtgcacctg gagggcacga ccaccgtggc ggaggcgctg cgggacgggc
ggccccggcg gcacgtggac ctcccgtgct ggtggcaccg cctccgcgac gccctgcccg
>.............................msc17.............................>
a g a
a v h l
e g t
t t v
a e a l
r d g
16681
ggtgcgacga gcgcaccgcg acgcgcagcg ggatcgcctc cgtggcggtg tcgacgggct
ccacgctgct cgcgtggcgc tgcgcgtcgc cctagcggag gcaccgccac agctgcccga
>.............................msc17.............................>
r c d
e r t a
t r s
g i a
s v a v
s t g
332
Anhang
16741
cgtccgcgcc cgaactcgcg gtgggcgcgg cgcggcaggt gctggagcgt accggcacgc
gcaggcgcgg gcttgagcgc cacccgcgcc gcgccgtcca cgacctcgca tggccgtgcg
>.............................msc17.............................>
s s a
p e l a
v g a
a r q
v l e r
t g t
16801
atcccaccga catcgatctg gtgctgcacg cgaccgtgca gcaccagggg cacgatctgt
tagggtggct gtagctagac cacgacgtgc gctggcacgt cgtggtcccc gtgctagaca
>.............................msc17.............................>
h p t
d i d l
v l h
a t v
q h q g
h d l
16861
gggcccccgc ctcgtacatc cagcgatacg cgctcggcaa ccgatgcccc gcgatcgaga
cccgggggcg gagcatgtag gtcgctatgc gcgagccgtt ggctacgggg cgctagctct
>.............................msc17.............................>
w a p
a s y i
q r y
a l g
n r c p
a i e
16921
tcaagcagct ctccaacggg ggcatggccg cgctggaact cgcgtccgcc tacctcgccg
agttcgtcga gaggttgccc ccgtaccggc gcgaccttga gcgcaggcgg atggagcggc
>.............................msc17.............................>
i k q
l s n g
g m a
a l e
l a s a
y l a
16981
gcgcgcccgg ccccacggcc gggctgctga ccacgggcga cgtgttcaca gatcccggct
cgcgcgggcc ggggtgccgg cccgacgact ggtgcccgct gcacaagtgt ctagggccga
>.............................msc17.............................>
g a p
g p t a
g l l
t t g
d v f t
d p g
17041
tcgaccgctg gcgcagtgac cccggcaccg tgtacgggga cgctggtacc gcgctcgtcc
agctggcgac cgcgtcactg gggccgtggc acatgcccct gcgaccatgg cgcgagcagg
>.............................msc17.............................>
f d r
w r s d
p g t
v y g
d a g t
a l v
17101
tggcccgggg acgcgggggt ttcgcgcggc tgcgcagcct ggtgaccgtg tcggacgccg
accgggcccc tgcgccccca aagcgcgccg acgcgtcgga ccactggcac agcctgcggc
>.............................msc17.............................>
l a r
g r g g
f a r
l r s
l v t v
s d a
17161
atctcgaaca gatgcacagg gggcgggacc cgttctcgcc ggtgccgttc gccgtccggc
tagagcttgt ctacgtgtcc cccgccctgg gcaagagcgg ccacggcaag cggcaggccg
>.............................msc17.............................>
d l e
q m h r
g r d
p f s
p v p f
a v r
17221
agcccatcga tctggggctg ctgcagaggg cgttcatcga ggacacgggg cggtcgtaca
tcgggtagct agaccccgac gacgtctccc gcaagtagct cctgtgcccc gccagcatgt
>.............................msc17.............................>
q p i
d l g l
l q r
a f i
e d t g
r s y
17281
gcgtcgcccg gatcacggcc gggcaggacg agacgctgaa gcgggcgctc gccgaggcgg
cgcagcgggc ctagtgccgg cccgtcctgc tctgcgactt cgcccgcgag cggctccgcc
>.............................msc17.............................>
s v a
r i t a
g q d
e t l
k r a l
a e a
17341
actgcacgct cgccgacctc tcctggttcg tgctcccgaa cttcggacgc ggccggctga
tgacgtgcga gcggctggag aggaccaagc acgagggctt gaagcctgcg ccggccgact
>.............................msc17.............................>
d c t
l a d l
s w f
v l p
n f g r
g r l
17401
actccacgtt cctgcgtcgc tggagcatcg aggaggagcg gaccacctgg cggtggggcc
tgaggtgcaa ggacgcagcg acctcgtagc tcctcctcgc ctggtggacc gccaccccgg
>.............................msc17.............................>
n s t
f l r r
w s i
e e e
r t t w
r w g
Anhang
333
17461
gttcggtcgg tcacctcggg gccggtgacc agttcgcggg tctcgcgttc ctcgccgagt
caagccagcc agtggagccc cggccactgg tcaagcgccc agagcgcaag gagcggctca
>.............................msc17.............................>
r s v
g h l g
a g d
q f a
g l a f
l a e
17521
cgggccgggc gcgcgccggt gaactggggc tgctgttcgg ggtcggtgcg ggtttcacct
gcccggcccg cgcgcggcca cttgaccccg acgacaagcc ccagccacgc ccaaagtgga
>.............................msc17.............................>
s g r
a r a g
e l g
l l f
g v g a
g f t
17581
ggagctgcgc gatcgtggag ttcacgggta cgggcgcggg agagacggga tccggatgac
cctcgacgcg ctagcacctc aagtgcccat gcccgcgccc tctctgccct aggcctactg
>............................msc17............................>>
w s c
a i v e
f t g
t g a
g e t g
s g -
17641
cgcgccgcgc cggtggcgca tgcgcgccga gcgggtcggg gcgggccgcc ggtccgcggc
gcgcggcgcg gccaccgcgt acgcgcggct cgcccagccc cgcccggcgg ccaggcgccg
17701
ggcccgcccc ttgcctcttt ctgtcctctt gtcccttttt ctgtctattt gtccctgttg
ccgggcgggg aacggagaaa gacaggagaa cagggaaaaa gacagataaa cagggacaac
17761
ccgggtcagg gctgcgccgg cgggttgacg accgacttct cgacggccgc cggctccagc
ggcccagtcc cgacgcggcc gcccaactgc tggctgaaga gctgccggcg gccgaggtcg
<<.........................msc18...........................<
p q a p
p n v
v s k
e v a a
p e l
17821
tgccacttct tgaggatctt cgcgtacgtg ccgtcctcga tgagctggtt caccgcctcc
acggtgaaga actcctagaa gcgcatgcac ggcaggagct actcgaccaa gtggcggagg
<.............................msc18.............................<
q w k
k l i k
a y t
g d e
i l q n
v a e
17881
ttcaggggtt cggcgagcgg ggagcccttc ttgacggcga gaccgatgtt cttgcgttcg
aagtccccaa gccgctcgcc cctcgggaag aactgccgct ctggctacaa gaacgcaagc
<.............................msc18.............................<
k l p
e a l p
s g k
k v a
l g i n
k r e
17941
atctcgttga ggtagcgcag gtccggctgc tgggtggccg cgtagcgcag cacgctggcc
tagagcaact ccatcgcgtc caggccgacg acccaccggc gcatcgcgtc gtgcgaccgg
<.............................msc18.............................<
i e n
l y r l
d p q
q t a
a y r l
v s a
18001
gtcgtcatca ggacgtccac ccggccctgg cgcagcgcga ggaagtgcgc ggccgcgtcc
cagcagtagt cctgcaggtg ggccgggacc gcgtcgcgct ccttcacgcg ccggcgcagg
<.............................msc18.............................<
t t m
l v d v
r g q
r l a
l f h a
a a d
18061
gggtaggtac tgatctcgat cggctccttg tcgtcggccg cgcattcctt gctcgccgcc
cccatccatg actagagcta gccgaggaac agcagccggc gcgtaaggaa cgagcggcgg
<.............................msc18.............................<
p y t
s i e i
p e k
d d a
a c e k
s a a
18121
tcaagatccg cctcgaacgt cgtgcccgta ccggtgccga cgcgcagtcc gcagagctga
agttctaggc ggagcttgca gcacgggcat ggccacggct gcgcgtcagg cgtctcgact
<.............................msc18.............................<
e l d
a e f t
t g t
g t g
v r l g
c l q
18181
ccgaggtcgt cgaccttctt cagcgcgctg ccgtcccgca cggcgaagcc ggtgccgtcg
ggctccagca gctggaagaa gtcgcgcgac ggcagggcgt gccgcttcgg ccacggcagc
<.............................msc18.............................<
g l d
d v k k
l a s
g d r
v a f g
t g d
334
Anhang
18241
gtgacgtaga ggacgaagtc gagcacctgc ttgcgttcct cggtcacggc gaggttcgcg
cactgcatct cctgcttcag ctcgtggacg aacgcaagga gccagtgccg ctccaagcgc
<.............................msc18.............................<
t v y
l v f d
l v q
k r e
e t v a
l n a
18301
gtgccgagtt cgtaccggcc ggcgctcagg ccggtgatga gggaggcgcc gctgacgtgc
cacggctcaa gcatggccgg ccgcgagtcc ggccactact ccctccgcgg cgactgcacg
<.............................msc18.............................<
t g l
e y r g
a s l
g t i
l s a g
s v h
18361
ttgcgctcca ccttgagtcc gaggacgcgg gccacggcct cggagacatc gatgtcgatg
aacgcgaggt ggaactcagg ctcctgcgcc cggtgccgga gcctctgtag ctacagctac
<.............................msc18.............................<
k r e
v k l g
l v r
a v a
e s v d
i d i
18421
ccgcgcggcg ggccgccgtc ctcggggctg aacgcgacgg ggggcacacc gatgccggaa
ggcgcgccgc ccggcggcag gagccccgac ttgcgctgcc ccccgtgtgg ctacggcctt
<.............................msc18.............................<
g r p
p g g d
e p s
f a v
p p v g
i g s
18481
ccgatgcgca gcacccccga ctcgcgcagc ttcgcgggca gggccgcgga gatggcggat
ggctacgcgt cgtgggggct gagcgcgtcg aagcgcccgt cccggcgcct ctaccgccta
<.............................msc18.............................<
g i r
l v g s
e r l
k a p
l a a s
i a s
18541
tcctcgtgga ccgcggagac gacgtcctcg cgccccaggt cggcggcccg ggtgtcctcg
aggagcacct ggcgcctctg ctgcaggagc gcggggtcca gccgccgggc ccacaggagc
<.............................msc18.............................<
e e h
v a s v
v d e
r g l
d a a r
t d e
18601
gggatctcct ccttgccgga gccacaggcc gcgaggagca gggtgaacag ggttgccgtg
ccctagagga ggaacggcct cggtgtccgg cgctcctcgt cccacttgtc ccaacggcac
<.............................msc18.............................<
p i e
e k g s
g c a
a l l
l t f l
t a t
18661
gtgagcgccc gagtggtgcg cgggcgacgt ccgcgcccgc ccgtggggcg cgcggccgga
cactcgcggg ctcaccacgc gcccgctgca ggcgcgggcg ggcaccccgc gcgccggcct
<.............................msc18.............................<
t l a
r t t r
p r r
g r g
g t p r
a a p
18721
gttcgggaca tggggtctcc tcgacggtac ggggctctgt tctgggacgg gtggggcacg
caagccctgt accccagagg agctgccatg ccccgagaca agaccctgcc caccccgtgc
<..msc18..<<
t r s
m
18781
gtgaggggcg gggaccgggc acggcctccc gtcgagcgcg ggcggcggcg cggcctccgc
cactccccgc ccctggcccg tgccggaggg cagctcgcgc ccgccgccgc gccggaggcg
18841
gtcagccacg ggccaggaag cggaccaggc ggtcgttgtg cggggcgtcg aagacctcgt
cagtcggtgc ccggtccttc gcctggtccg ccagcaacac gccccgcagc ttctggagca
<<...........................msc19.............................<
- g r
a l f
r v l
r d n h
p a d
f v e
18901
ccggcgggcc cgtctcgacc accctgccgt tgtccatgaa gaggacctgg tcggcgatct
ggccgcccgg gcagagctgg tgggacggca acaggtactt ctcctggacc agccgctaga
<.............................msc19.............................<
d p p g
t e v
v r g
n d m f
l v q
d a i
Anhang
335
18961
cccgggcgaa ccgcatctcg tgcgtgacga cgatcatcgt catcccgccg tcggcgagtt
gggcccgctt ggcgtagagc acgcactgct gctagtagca gtagggcggc agccgctcaa
<.............................msc19.............................<
e r a f
r m e
h t v
v i m t
m g g
d a l
19021
cccggatcac ggtcagcacc tcctgggtga gttcggggtc gagcgcgctg gtcggctcgt
gggcctagtg ccagtcgtgg aggacccact caagccccag ctcgcgcgac cagccgagca
<.............................msc19.............................<
e r i v
t l v
e q t
l e p d
l a s
t p e
19081
cgaagagcat cgccctcggt tccatggcga gggcccgggc gatcgcggcc cgctgctgct
gcttctcgta gcgggagcca aggtaccgct cccgggcccg ctagcgccgg gcgacgacga
<.............................msc19.............................<
d f l m
a r p
e m a
l a r a
i a a
r q q
19141
cgcccccgga gagctgatgc ggacgggagg tctccttccc cgcgaggccg accctggcga
gcgggggcct ctcgactacg cctgccctcc agaggaaggg gcgctccggc tgggaccgct
<.............................msc19.............................<
e g g s
l q h
p r s
t e k g
a l g
v r a
19201
gcaggtcgcg ggcccgttcc tcggccgggg cacgcctcag cccgagcagg gcacgcggtg
cgtccagcgc ccgggcaagg agccggcccc gtgcggagtc gggctcgtcc cgtgcgccac
<.............................msc19.............................<
l l d r
a r e
e a p
a r r l
g l l
a r p
19261
cctcggtgac attgccgagc accgtcatgt gcgggaagag ccggaagttc tggaagacca
ggagccactg taacggctcg tggcagtaca cgcccttctc ggccttcaag accttctggt
<.............................msc19.............................<
a e t v
n g l
v t m
h p f l
r f n
q f v
19321
tgccggtacg ggtccgctgc cgggcgatcg cgcggcgggg gcgctcgtag agccggtcgc
acggccatgc ccaggcgacg gcccgctagc gcgccgcccc cgcgagcatc tcggccagcg
<.............................msc19.............................<
m g t r
t r q
r a i
a r r p
r e y
l r d
19381
ctcgccactc gtggccgacg agttcgccgt cgacgacgat gcgtccggcg tcgatgcgct
gagcggtgag caccggctgc tcaagcggca gctgctgcta cgcaggccgc agctacgcga
<.............................msc19.............................<
g r w e
h g v
l e g
d v v i
r g a
d i r
19441
ccagccggtt gacgcaccgc agcagggtac tcttgcccga tcccgagggg ccgatgacac
ggtcggccaa ctgcgtggcg tcgtcccatg agaacgggct agggctcccc ggctactgtg
<.............................msc19.............................<
e l r n
v c r
l l t
s k g s
g s p
g i v
19501
aggtgacggt ggactcgggg acggtgagcg agacgtcgtc cagtacggtc agcccgccga
tccactgcca cctgagcccc tgccactcgc tctgcagcag gtcatgccag tcgggcggct
<.............................msc19.............................<
c t v t
s e p
v t l
s v d d
l v t
l g g
19561
acgacttgtg gacaccgact gcctcgatca tcctcggtcc cccgtcgcgt agcgccgttc
tgctgaacac ctgtggctga cggagctagt aggagccagg gggcagcgca tcgcggcaag
<.............msc19.............<<
f s k h
v g v
a e i
m
<<.............msc20...............<
g r d
g t a
y r r e
19621
gacgaagtgc tggacgacgc tgagcagcgt ggtcagcagc aggtaccaga gcgtggccac
ctgcttcacg acctgctgcg actcgtcgca ccagtcgtcg tccatggtct cgcaccggtg
<.............................msc20.............................<
v f h
q v v
s l l t
t l l
l y w
l t a v
336
Anhang
19681
cagaagcagc gggatgacca ggtagttgcg gttgtagatc agctgggtcg cgtagagcag
gtcttcgtcg ccctactggt ccatcaacgc caacatctag tcgacccagc gcatctcgtc
<.............................msc20.............................<
l l l
p i v
l y n r
n y i
l q t
a y l l
19741
gtcctgcacg gcgatgacgc tgacgatgga cgtgcctttc agcaggccga tgatctgact
caggacgtgc cgctactgcg actgctacct gcacggaaag tcgtccggct actagactga
<.............................msc20.............................<
d q v
a i v
s v i s
t g k
l l g
i i q s
19801
gccggcgggc ggcaggatcg cgggcatggc ctgcggcagc acgatgcggc ggaaggtccg
cggccgcccg ccgtcctagc gcccgtaccg gacgccgtcg tgctacgccg ccttccaggc
<.............................msc20.............................<
g a p
p l i
a p m a
q p l
v i r
r f t r
19861
ccagccgccg aggccgaggg cctccgcggc ctcggtctgg tcgcgtccga cggagaggat
ggtcggcggc tccggctccc ggaggcgccg gagccagacc agcgcaggct gcctctccta
<.............................msc20.............................<
w g g
l g l
a e a a
e t q
d r g
v s l i
19921
gcccgcccgg acgatctcgg cgagctgccc ggcttcgtgg aggaccagcc cgatgacggc
cgggcgggcc tgctagagcc gctcgacggg ccgaagcacc tcctggtcgg gctactgccg
<.............................msc20.............................<
g a r
v i e
a l q g
a e h
l v l
g i v a
19981
ggccgtgagg ccgctgatca tccgctcggt ggagaactcg gtgaacgcgg gcccgaacgg
ccggcactcc ggcgactagt aggcgagcca cctcttgagc cacttgcgcc cgggcttgcc
<.............................msc20.............................<
a t l
g s i
m r e t
s f e
t f a
p g f p
20041
gatgccgagg gacagctcgg ggtacagcag cgagatgttg taccagaaca gcagttgcac
ctacggctcc ctgtcgagcc ccatgtcgtc gctctacaac atggtcttgt cgtcaacgtg
<.............................msc20.............................<
i g l
s l e
p y l l
s i n
y w f
l l q v
20101
gagcatcgga acggaccgga acaaccaggt gtagccgaag ctcagcgtca cgaggatcgg
ctcgtagcct tgcctggcct tgttggtcca catcggcttc gagtcgcagt gctcctagcc
<.............................msc20.............................<
l m p
v s r
f l w t
y g f
s l t
v l i p
20161
gttgcgggac agccgcatca cggcgagcgc ggtgccgagg acgaagccgc cggtgaaggc
caacgccctg tcggcgtagt gccgctcgcg ccacggctcc tgcttcggcg gccacttccg
<.............................msc20.............................<
n r s
l r m
v a l a
t g l
v f g
g t f a
20221
gatcgccgtc agccacagcg tggtgccgag tccggcgagc accgtctccg cggagaggta
ctagcggcag tcggtgtcgc accacggctc aggccgctcg tggcagaggc gcctctccat
<.............................msc20.............................<
i a t
l w l
t t g l
g a l
v t e
a s l y
20281
cttggcgacg acgtcccagc ggaacgcgtc gttggtgatc agggcgttga gggccatcgc
gaaccgctgc tgcagggtcg ccttgcgcag caaccactag tcccgcaact cccggtagcg
<.............................msc20.............................<
k a v
v d w
r f a d
n t i
l a n
l a m a
20341
caacaggacc aggcccgccg ccgcggccac ccagcgaagc gggcgggggc gcggccgtgc
gttgtcctgg tccgggcggc ggcgccggtg ggtcgcttcg cccgcccccg cgccggcacg
<.............................msc20.............................<
l l v
l g a
a a a v
w r l
p r p
r p r a
Anhang
337
20401
gaacgccgcg tccgccccgt ccgccgcctt ccggcccggc ccgccggttc cgtccgaacg
cttgcggcgc aggcggggca ggcggcggaa ggccgggccg ggcggccaag gcaggcttgc
<.............................msc20.............................<
f a a
d a g
d a a k
r g p
g g t
g d s r
20461
gagcctgcgg gcccgggacg tacggtcctc gccgccggtg ccgtcgcccg ggcccgtgcg
ctcggacgcc cgggccctgc atgccaggag cggcggccac ggcagcgggc ccgggcacgc
<.............................msc20.............................<
l r r
a r s
t r d e
g g t
g d g
p g t r
20521
gccgtgctcg gtgcgcaagg aaaccatcgg cggtccgtcc ctcagtcgtt cgctgcgtag
cggcacgagc cacgcgttcc tttggtagcc gccaggcagg gagtcagcaa gcgacgcatc
<...........msc20..........<<
g h e
t r l
s v m
<<.....msc21.......<
- d n
a a y
20581
tgcggcagaa ggtgctcggc gaacaggcgc atggtgcggg ccgattcctc gaacggcatg
acgccgtctt ccacgagccg cttgtccgcg taccacgccc ggctaaggag cttgccgtac
<.............................msc21.............................<
h p l
l h e a
f l r
m t r
a s e e
f p m
20641
gcgccggaga tgacctggag gctgatggtg aagtccccga accagccgcg gatgtcgtcg
cgcggcctct actggacctc cgactaccac ttcaggggct tggtcggcgc ctacagcagc
<.............................msc21.............................<
a g s
i v q l
s i t
f d g
f w g r
i d d
20701
atcgcggccc gcacttcgtc gggggtgccg accagcgcct tgcgttcggc gaccgcgcgg
tagcgccggg cgtgaagcag cccccacggc tggtcgcgga acgcaagccg ctggcgcgcc
<.............................msc21.............................<
i a a
r v e d
p t g
v l a
k r e a
v a r
20761
tcgaagtcgc cgcggcccgc cttctcgacg atcttctcgt atccggggta gtcggcgctg
agcttcagcg gcgccgggcg gaagagctgc tagaagagca taggccccat cagccgcgac
<.............................msc21.............................<
d f d
g r g a
k e v
i k e
y g p y
d a s
20821
cgggtctcgc gccacgcgga caccgcggac gcgagcgccc ggttggcccg ctcggaggcc
gcccagagcg cggtgcgcct gtggcgcctg cgctcgcggg ccaaccgggc gagcctccgg
<.............................msc21.............................<
r t e
r w a s
v a s
a l a
r n a r
e s a
20881
tgtccgccct tctgccgggc ttcctggccg tcctcggcga ggtagcagtt gtagctcatg
acaggcggga agacggcccg aaggaccggc aggagccgct ccatcgtcaa catcgagtac
<.............................msc21.............................<
q g g
k q r a
e q g
d e a
l y c n
y s m
20941
tggatgtcct cctcggtggg cttgaagccc gcggcggagg cggcgtcgcg gtacagggag
acctacagga ggagccaccc gaacttcggg cgccgcctcc gccgcagcgc catgtccctc
<.............................msc21.............................<
h i d
e e t p
k f g
a a s
a a d r
y l s
21001
agcgtcttct gcacctgttc gcgggggttg atggaaggga cgagcatgac gccgtgcccg
tcgcagaaga cgtggacaag cgcccccaac taccttccct gctcgtactg cggcacgggc
<.............................msc21.............................<
l t k
q v q e
r p n
i s p
v l m v
g h g
21061
gcgcgggccg ccgcctccgc ggacgcgggc gtcttcgcgg tggcgacgag gatgcgcgga
cgcgcccggc ggcggaggcg cctgcgcccg cagaagcgcc accgctgctc ctacgcgcct
<.............................msc21.............................<
a r a
a a e a
s a p
t k a
t a v l
i r p
338
Anhang
21121
tgcgggcgct gccaggtgcg cggaagcatg gtgaccgggc cgaagcggtg gaaggtgccc
acgcccgcga cggtccacgc gccttcgtac cactggcccg gcttcgccac cttccacggg
<.............................msc21.............................<
h p r
q w t r
p l m
t v p
g f r h
f t g
21181
tcccagacga cgtcctcctc cgcccagagc cggcggaccg cctcgacgcc ctcgtcgaag
agggtctgct gcaggaggag gcgggtctcg gccgcctggc ggagctgcgg gagcagcttc
<.............................msc21.............................<
e w v
v d e e
a w l
r r v
a e v g
e d f
21241
cgggcccggc tctcgtccat cgagatctcg aacgcggtga actcgtcggg cagaaacgcc
gcccgggccg agagcaggta gctctagagc ttgcgccact tgagcagccc gtctttgcgg
<.............................msc21.............................<
r a r
s e d m
s i e
f a t
f e d p
l f a
21301
cgtccgaagc cgacgtccag gcggccctgg gagatgttgt cgagcatggc gagcttgccg
gcaggcttcg gctgcaggtc cgccgggacc ctctacaaca gctcgtaccg ctcgaacggc
<.............................msc21.............................<
r g f
g v d l
r g q
s i n
d l m a
l k g
21361
gccagcttca gcgggtgcgt gaagacgggc agtacggcgc cggtgacgag gcgtacccgg
cggtcgaagt cgcccacgca cttctgcccg tcatgccgcg gccactgctc cgcatgggcc
<.............................msc21.............................<
a l k
l p h t
f v p
l v a
g t v l
r v r
21421
cgggtgcggg ccgcggcggc ggcgaggaag gtcaccgggt ccgggctgta gccgccgtac
gcccacgccc ggcgccgccg ccgctccttc cagtggccca ggcccgacat cggcggcatg
<.............................msc21.............................<
r t r
a a a a
a l f
t v p
d p s y
g g y
21481
tcgtggaagt agtgctcgac ggtcttgaca tggtggaagc ccagttcgtc ggcgagttcg
agcaccttca tcacgagctg ccagaactgt accaccttcg ggtcaagcag ccgctcaagc
<.............................msc21.............................<
e h f
y h e v
t k v
h h f
g l e d
a l e
21541
gccagccgaa gcgactcctc gaagtgctgt ccggcggatt tctccgcagg tcccacggtg
cggtcggctt cgctgaggag cttcacgaca ggccgcctaa agaggcgtcc agggtgccac
<.............................msc21.............................<
a l r
l s e e
f h q
g a s
k e a p
g v t
21601
gggaagaggt tgatgccgaa cttcatgggg tcctctcgat gtgatggctg gacggacggt
cccttctcca actacggctt gaagtacccc aggagagcta cactaccgac ctgcctgcca
<..........msc21..........<<
p f l
n i g f
k m
21661
gtgtgcgtcg cggccggggg ccgcggctgc cggctagtcg gccgtcacgg tcccggacag
cacacgcagc gccggccccc ggcgccgacg gccgatcagc cggcagtgcc agggcctgtc
<<..........msc22...........<
- d
a t v
t g s l
21721
ggccggtacg ggcagatgga tgtagtcgcg ttcgtggtag agcatcggcg cgcggccgtg
ccggccatgc ccgtctacct acatcagcgc aagcaccatc tcgtagccgc gcgccggcac
<.............................msc22.............................<
a p v
p l h
i y d r
e h y
l m p
a r g h
21781
cacgacggcg ccctcgatcc ggcccaggaa gacgctgtgg tcgccggccg gtacctcctg
gtgctgccgc gggagctagg ccgggtcctt ctgcgacacc agcggccggc catggaggac
<.............................msc22.............................<
v v a
g e i
r g l f
v s h
d g a
p v e q
Anhang
339
21841
gtgcacgagg cactcggcga cggcgctgag gtggtgcgcg ggcaggagtg gggcctgcgc
cacgtgctcc gtgagccgct gccgcgactc caccacgcgc ccgtcctcac cccggacgcg
<.............................msc22.............................<
h v l
c e a
v a s l
h h a
p l l
p a q a
21901
ggcccgcccc gagggccgcc agtcgaggcc gtcgaacttc tgggtgctct tgccggcgaa
ccgggcgggg ctcccggcgg tcagctccgg cagcttgaag acccacgaga acggccgctt
<.............................msc22.............................<
a r g
s p r
w d l g
d f k
q t s
k g a f
21961
gcgctccgag agccgttcgt tgtgcacggc gaggaagttg accgcgaagc cgcccgagtg
cgcgaggctc tcggcaagca acacgtgccg ctccttcaac tggcgcttcg gcgggctcac
<.............................msc22.............................<
r e s
l r e
n h v a
l f n
v a f
g g s h
22021
ccggatggcg gcgagggtcc gcgacccggt gcccacacac acgagcagca acggcgggtc
ggcctaccgc cgctcccagg cgctgggcca cgggtgtgtg tgctcgtcgt tgccgcccag
<.............................msc22.............................<
r i a
a l t
r s g t
g v c
v l l
l p p d
22081
catcgacacg gaggtgacgg cgctggtcgt cagaccgctc ggccggccgt cggggcccgc
gtagctgtgc ctccactgcc gcgaccagca gtctggcgag ccggccggca gccccgggcg
<.............................msc22.............................<
m s v
s t v
a s t t
l g s
p r g
d p g a
22141
ggcggtgacg acacagaccg cggccgggtg cgcgctgaac atcgcgcgga acagttcgtc
ccgccactgc tgtgtctggc gccggcccac gcgcgacttg tagcgcgcct tgtcaagcag
<.............................msc22.............................<
a t v
v c v
a a p h
a s f
m a r
f l e d
22201
atcgatcgcc atgggtctgt agctcctccc ttgcccgctc aggctttcga agggcggtgg
tagctagcgg tacccagaca tcgaggaggg aacgggcgag tccgaaagct tcccgccacc
<...msc22..<<
d i a
m
<<.......msc23.........<
- a k s
p r h
22261
agggcgggtc cataacctct ggagggggag ttccggcggt gctcgtccag caccttcgcc
tcccgcccag gtattggaga cctccccctc aaggccgcca cgagcaggtc gtggaagcgg
<.............................msc23.............................<
l a p
g y g r
s p s
n r r
h e d l
v k a
22321
agcagcgccg tcgcgttgcg gtgcaggggg aagtcggtgc cggggggcag gatgccgctc
tcgtcgcggc agcgcaacgc cacgtccccc ttcagccacg gccccccgtc ctacggcgag
<.............................msc23.............................<
l l a
t a n r
h l p
f d t
g p p l
i g s
22381
tcgtcgagca gccgggccac acgcgcggtg acgacgcaga accggtacgc cgcgaacagc
agcagctcgt cggcccggtg tgcgcgccac tgctgcgtct tggccatgcg gcgcttgtcg
<.............................msc23.............................<
e d l
l r a v
r a t
v v c
f r y a
a f l
22441
tcgtagtacg gaaggtcgcg cgcggtgcgc ccgacgccct cctcccagcg ggccacggtc
agcatcatgc cttccagcgc gcgccacgcg ggctgcggga ggagggtcgc ccggtgccag
<.............................msc23.............................<
e y y
p l d r
a t r
g v g
e e w r
a v t
22501
tcggcccggc cgggcagccc ggcgagccgg ggcacgccga cgccctcgct gaggtgccgg
agccgggccg gcccgtcggg ccgctcggcc ccgtgcggct gcgggagcga ctccacggcc
<.............................msc23.............................<
e a r
g p l g
a l r
p v g
v g e s
l h r
340
Anhang
22561
tccatgtgca ggtaccaggc aaggtcgctc tcggcgggcc ccaacgcggc catctcccag
aggtacacgt ccatggtccg ttccagcgag agccgcccgg ggttgcgccg gtagagggtc
<.............................msc23.............................<
d m h
l y w a
l d s
e a p
g l a a
m e w
22621
tcgagcagcg cggcgggccg cgtcccggcg tagatgatgt tgccgatccg ggcgtcgccc
agctcgtcgc gccgcccggc gcagggccgc atctactaca acggctaggc ccgcagcggg
<.............................msc23.............................<
d l l
a a p r
t g a
y i i
n g i r
a d g
22681
cagagcagcg acgccggtcc ctggtcgtcg ggcacgtggg cgcgcagccg gtcgagagcg
gtctcgtcgc tgcggccagg gaccagcagc ccgtgcaccc gcgcgtcggc cagctctcgc
<.............................msc23.............................<
w l l
s a p g
q d d
p v h
a r l r
d l a
22741
tcggccgcgg tcgtgttgtc gtcggcgacc ccgtagaagt ccaggtgatg cgtgaagtgc
agccggcgcc agcacaacag cagccgctgg ggcatcttca ggtccactac gcacttcacg
<.............................msc23.............................<
d a a
t t n d
d a v
g y f
d l h h
t f h
22801
cgcagcagtt gcgccggacc ggtggggccg aactcgggcc ggtcgaggaa gtcggccccc
gcgtcgtcaa cgcggcctgg ccaccccggc ttgagcccgg ccagctcctt cagccggggg
<.............................msc23.............................<
r l l
q a p g
t p g
f e p
r d l f
d a g
22861
gcctccttcg ggtcgaggcg gtggacggcg gcgagcgcgt ccactccccc gttccacacg
cggaggaagc ccagctccgc cacctgccgc cgctcgcgca ggtgaggggg caaggtgtgc
<.............................msc23.............................<
a e k
p d l r
h v a
a l a
d v g g
n w v
22921
gcggcccggt cggcgggcgg cagccgggtc agccagccct gccggtggta ggagggcaga
cgccgggcca gccgcccgcc gtcggcccag tcggtcggga cggccaccat cctcccgtct
<.............................msc23.............................<
a a r
d a p p
l r t
l w g
q r h y
s p l
22981
tcggcgggca cctggccgtc gacgcgttcc atgacgagga acggcgcgcc caggtactcg
agccgcccgt ggaccggcag ctgcgcaagg tactgctcct tgccgcgcgg gtccatgagc
<.............................msc23.............................<
d a p
v q g d
v r e
m v l
f p a g
l y e
23041
gcggagggct cgtcccacag caccggcggt acgggcaggc cggtgtcgcc gagcagcttc
cgcctcccga gcagggtgtc gtggccgcca tgcccgtccg gccacagcgg ctcgtcgaag
<.............................msc23.............................<
a s p
e d w l
v p p
v p l
g t d g
l l k
23101
agcagccgta cctggtcgcc ccagaagtcc tcgggaaaga cccggtgccc ggtcggggcg
tcgtcggcat ggaccagcgg ggtcttcagg agccctttct gggccacggg ccagccccgc
<.............................msc23.............................<
l l r
v q d g
w f d
e p f
v r h g
t p a
23161
acgcggaccg cgagcggccg ccgccgggag gtgccgccct cggtccactc ggcgtcgaac
tgcgcctggc gctcgccggc ggcggccctc cacggcggga gccaggtgag ccgcagcttg
<.............................msc23.............................<
v r v
a l p r
r r s
t g g
e t w e
a d f
23221
agcaggatct ctccggagaa tcccgcctcc ttcggcacgg tgacgggtcc gagctcgacc
tcgtcctaga gaggcctctt agggcggagg aagccgtgcc actgcccagg ctcgagctgg
<.............................msc23.............................<
l l i
e g s f
g a e
k p v
t v p g
l e v
Anhang
341
23281
gcaccgatct cggcggaacg ggtgccgaac cagtgggtga ggacggcacg ggtcaggtcg
cgtggctaga gccgccttgc ccacggcttg gtcacccact cctgccgtgc ccagtccagc
<.............................msc23.............................<
a g i
e a s r
t g f
w h t
l v a r
t l d
23341
gggtcgcgtt gcagaggtac gggcacggga ggggtctcct tacggccggc gccggccggg
cccagcgcaa cgtctccatg cccgtgccct ccccagagga atgccggccg cggccggccc
<..........msc23..........<<
p d r
q l p v
p v
<<.......msc24........<
- p r
r r g p
23401
cacggacggt gggacgagcg gaaaggggac gacgacgctg ccgccgcgcc ggatcgcggc
gtgcctgcca ccctgctcgc ctttcccctg ctgctgcgac ggcggcgcgg cctagcgccg
<.............................msc24.............................<
v s p
p v l
p f p v
v v s
g g r
r i a a
23461
ctgcagccgc ccgatcacgg ggcccggcac gacgcccagg tcgcgggcga gccggctggt
gacgtcggcg ggctagtgcc ccgggccgtg ctgcgggtcc agcgcccgct cggccgacca
<.............................msc24.............................<
q l r
g i v
p g p v
v g l
d r a
l r s t
23521
gagccgggac gcgacatcga gcgcgtcacc ggcccggccg gtctggtgga gcgcggtcat
ctcggccctg cgctgtagct cgcgcagtgg ccgggccggc cagaccacct cgcgccagta
<.............................msc24.............................<
l r s
a v d
l a d g
a r g
t q h
l a t m
23581
gtaccgggcg tgcagggctt cgtgggtggg gtggctgcgg gtgaggacgg ccagttcggc
catggcccgc acgtcccgaa gcacccaccc caccgacgcc cactcctgcc ggtcaagccg
<.............................msc24.............................<
y r a
h l a
e h t p
h s r
t l v
a l e a
23641
gagcacgtca cgcgggcgtc cgagccggag ccgcacatcg agatacatct cgtggacctc
ctcgtgcagt gcgcccgcag gctcggcctc ggcgtgtagc tctatgtaga gcacctggag
<.............................msc24.............................<
l v d
r p r
g l r l
r v d
l y m
e h v e
23701
cagacggcgc cgctcccagt gggtgacggc ggaccggagc accggtccgg tccgcacatc
gtctgccgcg gcgagggtca cccactgccg cctggcctcg tggccaggcc aggcgtgtag
<.............................msc24.............................<
l r r
r e w
h t v a
s r l
v p g
t r v d
23761
ggcgaggacg ggccgactcc acagagcgag cgcgccgcgc agcagccgct ccacggtggc
ccgctcctgc ccggctgagg tgtctcgctc gcgcggcgcg tcgtcggcga ggtgccaccg
<.............................msc24.............................<
a l v
p r s
w l a l
a g r
l l r
e v t a
23821
gtcgtcgccg gcccggcccg cctgctcgac gagccgctcg aacctgagca ggtccagctc
cagcagcggc cgggccgggc ggacgagctg ctcggcgagc ttggactcgt ccaggtcgag
<.............................msc24.............................<
d d g
a r g
a q e v
l r e
f r l
l d l e
23881
ctcgggctcg acgaccatga gatagccctg tccggtcgtc ctgagccggt cacgggcggc
gagcccgagc tgctggtact ctatcgggac aggccagcag gactcggcca gtgcccgccg
<.............................msc24.............................<
e p e
v v m
l y g q
g t t
r l r
d r a a
23941
ctcacgggag ccgacggacg gcatgcgggc cagcagtcgg cgcaggtgca tcacatacgt
gagtgccctc ggctgcctgc cgtacgcccg gtcgtcagcc gcgtccacgt agtgtatgca
<.............................msc24.............................<
e r s
g v s
p m r a
l l r
r l h
m v y t
342
Anhang
24001
ctgcagggtg gtggccgcgc tgggcggcgg atgctcgccc cagatctcgc tcacacaggt
gacgtcccac caccggcgcg acccgccgcc tacgagcggg gtctagagcg agtgtgtcca
<.............................msc24.............................<
q l t
t a a
s p p p
h e g
w i e
s v c t
24061
gtgggcgggc atgacctcgc ccgcgtggag cagcaacagt ccgagcagct ggcgctgctt
cacccgcccg tactggagcg ggcgcacctc gtcgttgtca ggctcgtcga ccgcgacgaa
<.............................msc24.............................<
h a p
m v e
g a h l
l l l
g l l
q r q k
24121
gggcgcggtg ggcagatggc ggccatcgct gtcctcgacg gacagccccc cgagcacgcc
cccgcgccac ccgtctaccg ccggtagcga caggagctgc ctgtcggggg gctcgtgcgg
<.............................msc24.............................<
p a t
p l h
r g d s
d e v
s l g
g l v g
24181
gaattccatg gtggatcctc tcttcgcctg gggcggtggt tcaggtgcgg cttccgtggt
cttaaggtac cacctaggag agaagcggac cccgccacca agtccacgcc gaaggcacca
<.msc24<<
f e m
24241
ccttccagcg gcgctccacc ggctgtcggc ccaatggacg ggcagggaac cgaggttgcg
ggaaggtcgc cgcgaggtgg ccgacagccg ggttacctgc ccgtcccttg gctccaacgc
24301
cggaacaggt ggaggggtca tgccggggac tgtggtgacg gtggccgacg gggtgcacgc
gccttgtcca cctccccagt acggcccctg acaccactgc caccggctgc cccacgtgcg
>>..................msc25...................>
m p g
t v v t
v a d
g v h
24361
gtatgtacag gaaccggtcg gctggtgtgt gaacaacgcc gggatcgtcg tgggcggaga
catacatgtc cttggccagc cgaccacaca cttgttgcgg ccctagcagc acccgcctct
>.............................msc25.............................>
a y v q
e p v
g w c
v n n a
g i v
v g g
24421
cacggtcctc gtcgtggaca cggcggccac cgagaagcgg gcactcgcgc tgcgggaggc
gtgccaggag cagcacctgt gccgccggtg gctcttcgcc cgtgagcgcg acgccctccg
>.............................msc25.............................>
d t v l
v v d
t a a
t e k r
a l a
l r e
24481
tgtggacgcg ttggcgccgg gcccgcgccg gatcgtggtg agcacccacc accacggcga
acacctgcgc aaccgcggcc cgggcgcggc ctagcaccac tcgtgggtgg tggtgccgct
>.............................msc25.............................>
a v d a
l a p
g p r
r i v v
s t h
h h g
24541
ccacaccttc ggcaaccatg tgttctccgg cccccacacg ctgctggtca gccatgaggc
ggtgtggaag ccgttggtac acaagaggcc gggggtgtgc gacgaccagt cggtactccg
>.............................msc25.............................>
d h t f
g n h
v f s
g p h t
l l v
s h e
24601
gggtcctgcc gaactggtgc gcaagggcac ggcgttgcag tcgatgtggc cgggggtcga
cccaggacgg cttgaccacg cgttcccgtg ccgcaacgtc agctacaccg gcccccagct
>.............................msc25.............................>
a g p a
e l v
r k g
t a l q
s m w
p g v
24661
gtggggtcac accccgaccg tgctgccgac gctgaccgtg cgcgagggtg tcggcctgcg
caccccagtg tggggctggc acgacggctg cgactggcac gcgctcccac agccggacgc
>.............................msc25.............................>
e w g h
t p t
v l p
t l t v
r e g
v g l
Anhang
343
24721
cctcggcggc atcaccgcgc agctgatcca tcccggtgtg gcgcacacct cggacgacct
ggagccgccg tagtggcgcg tcgactaggt agggccacac cgcgtgtgga gcctgctgga
>.............................msc25.............................>
r l g g
i t a
q l i
h p g v
a h t
s d d
24781
ggtggtgtgg ttgcccgagc ggcgggtgct gttcgcgggc gacctggtgt tctccggggc
ccaccacacc aacgggctcg ccgcccacga caagcgcccg ctggaccaca agaggccccg
>.............................msc25.............................>
l v v w
l p e
r r v
l f a g
d l v
f s g
24841
cgcgccgttc gtgctgatgg gttcgctggc cgggtccctc gcggcgctcg cgcggctgcg
gcgcggcaag cacgactacc caagcgaccg gcccagggag cgccgcgagc gcgccgacgc
>.............................msc25.............................>
a a p f
v l m
g s l
a g s l
a a l
a r l
24901
ggagctcgat cccctggtcg tcgtcgcggg gcacgggccc gtcggcgggc ccgagttgct
cctcgagcta ggggaccagc agcagcgccc cgtgcccggg cagccgcccg ggctcaacga
>.............................msc25.............................>
r e l d
p l v
v v a
g h g p
v g g
p e l
24961
cacgttcacc gaggactacc tgcgctgggt cgcgaagctc gccgagcggg gtctcgcgga
gtgcaagtgg ctcctgatgg acgcgaccca gcgcttcgag cggctcgccc cagagcgcct
>.............................msc25.............................>
l t f t
e d y
l r w
v a k l
a e r
g l a
25021
cgggctgagc cccctggaga cggcgacgcg cgccgacgag ggcgcgttcg ccaccctgct
gcccgactcg ggggacctct gccgctgcgc gcggctgctc ccgcgcaagc ggtgggacga
>.............................msc25.............................>
d g l s
p l e
t a t
r a d e
g a f
a t l
25081
ggaccgcgag cgactggtcg gcaacctcca ccgcgcctac cacgaggcgt gcggcggtgc
cctggcgctc gctgaccagc cgttggaggt ggcgcggatg gtgctccgca cgccgccacg
>.............................msc25.............................>
l d r e
r l v
g n l
h r a y
h e a
c g g
25141
gcccggcgcc cgtatcgagt cggcgccggc gatgcgcgag atggtcgcct tcaacggcgg
cgggccgcgg gcatagctca gccgcggccg ctacgcgctc taccagcgga agttgccgcc
>.............................msc25.............................>
a p g a
r i e
s a p
a m r e
m v a
f n g
25201
ccgtcccctg cgcagcccgg cctgacggac ggcagggctg cgggctccgc ggtacggagg
ggcaggggac gcgtcgggcc ggactgcctg ccgtcccgac gcccgaggcg ccatgcctcc
>..........msc25.........>>
g r p l
r s p
a -
25261
cgtccatgcc ccgcagcgtt ccggcgcccg gtggagcggg actccaggtg cgctggacga
gcaggtacgg ggcgtcgcaa ggccgcgggc cacctcgccc tgaggtccac gcgacctgct
25321
ctttcccggg cgtgcccccg cgtcggaggc tctccagttc tcctccgtcg aggcgcgagc
gaaagggccc gcacgggggc gcagcctccg agaggtcaag aggaggcagc tccgcgctcg
25381
cgtgccgcgc acgctcggcg aagttgcgaa gccgatgctg tggaggagag atggatctgc
gcacggcgcg tgcgagccgc ttcaacgctt cggctacgac acctcctctc tacctagacg
>>msc26..>
m d l
25441
gtggcaggac cgccgtcgtc accgggggga cccgggggct cggccgggac gtggcgctcg
caccgtcctg gcggcagcag tggcccccct gggcccccga gccggccctg caccgcgagc
>.............................msc26.............................>
r g r
t a v v
t g g
t r g
l g r d
v a l
344
Anhang
25501
cgctcaccgg tgcgggagcc accgtcgtgg tggccgcacg ggaggtcccg gacgaccccg
gcgagtggcc acgccctcgg tggcagcacc accggcgtgc cctccagggc ctgctggggc
>.............................msc26.............................>
a l t
g a g a
t v v
v a a
r e v p
d d p
25561
gtgacgggct gatcgccctg aaggcggacg tgaccgcccc cgactcgatg gcggcgctga
cactgcccga ctagcgggac ttccgcctgc actggcgggg gctgagctac cgccgcgact
>.............................msc26.............................>
g d g
l i a l
k a d
v t a
p d s m
a a l
25621
tggacacggt ccacgagcgg tacgggggtc cgcacatcgt ggtggcgaac gcgggtctga
acctgtgcca ggtgctcgcc atgcccccag gcgtgtagca ccaccgcttg cgcccagact
>.............................msc26.............................>
m d t
v h e r
y g g
p h i
v v a n
a g l
25681
gccgcccggg cccggtcgcc gcgctgtccg tgcagcactg gaacgaggtg gtcgacacga
cggcgggccc gggccagcgg cgcgacaggc acgtcgtgac cttgctccac cagctgtgct
>.............................msc26.............................>
s r p
g p v a
a l s
v q h
w n e v
v d t
25741
atctgcacgg cgtgttccac accgtgcggg cggcggtgcc gtatgtgcgt gagaccccgg
tagacgtgcc gcacaaggtg tggcacgccc gccgccacgg catacacgca ctctggggcc
>.............................msc26.............................>
n l h
g v f h
t v r
a a v
p y v r
e t p
25801
gcggccggat cgtcaccatg tcctccctcc tgggttcgcg cgccatgccg ggcgccgcgg
cgccggccta gcagtggtac aggagggagg acccaagcgc gcggtacggc ccgcggcgcc
>.............................msc26.............................>
g g r
i v t m
s s l
l g s
r a m p
g a a
25861
cgtactgcgc gtcgaaggct gcggtcgagg cgttcaccgc cgtcgccgcg ctggagctgg
gcatgacgcg cagcttccga cgccagctcc gcaagtggcg gcagcggcgc gacctcgacc
>.............................msc26.............................>
a y c
a s k a
a v e
a f t
a v a a
l e l
25921
ccgcggacgg ggtgaccgtg aactgcgtgg cgccgggcta catcgattcc ggcatgggca
ggcgcctgcc ccactggcac ttgacgcacc gcggcccgat gtagctaagg ccgtacccgt
>.............................msc26.............................>
a a d
g v t v
n c v
a p g
y i d s
g m g
25981
aggccctcat cggcaacgag acgctgtggc cgaagctcgc cccgtcgctc gcggccggac
tccgggagta gccgttgctc tgcgacaccg gcttcgagcg gggcagcgag cgccggcctg
>.............................msc26.............................>
k a l
i g n e
t l w
p k l
a p s l
a a g
26041
gtcccggtac gggcgacgag gtggcccggg cggtgctctt cctggcctcg ccggagagca
cagggccatg cccgctgctc caccgggccc gccacgagaa ggaccggagc ggcctctcgt
>.............................msc26.............................>
r p g
t g d e
v a r
a v l
f l a s
p e s
26101
gttacatcaa tggtcaggtg ctgcgtgtcg acggtggcgt gcgctgagcg cgtcccctcg
caatgtagtt accagtccac gacgcacagc tgccaccgca cgcgactcgc gcaggggagc
>......................msc26.....................>>
s y i
n g q v
l r v
d g g
v r -
26161
ggcgatcgcg ggccggcgcg tggtgtacgt gccggcccgc ggtccgctcc ggctcagacc
ccgctagcgc ccggccgcgc accacatgca cggccgggcg ccaggcgagg ccgagtctgg
msc27 <<....<
- v
Anhang
345
26221
tgggcggccc ggccctgtcg caccggcagg ctcaggtgcg gttcgccctt gatgagcccg
acccgccggg ccgggacagc gtggccgtcc gagtccacgc caagcgggaa ctactcgggc
<.............................msc27.............................<
q a a
r g q r
v p l
s l h
p e g k
i l g
26281
gtgagcgcgt cgagccgacg gcggaactcc ggctccgcga gagccttgcg gaaggtgtcc
cactcgcgca gctcggctgc cgccttgagg ccgaggcgct ctcggaacgc cttccacagg
<.............................msc27.............................<
t l a
d l r r
r f e
p e a
l a k r
f t d
26341
tcgtcatccc actcggcgat gttgaagtac acggagtcgt ccttggtgga ccgtacgagg
agcagtaggg tgagccgcta caacttcatg tgcctcagca ggaaccacct ggcatgctcc
<.............................msc27.............................<
e d d
w e a i
n f y
v s d
d k t s
r v l
26401
gagtaacgga cgaggcccgg ctgggtctcc atgaaggctc cgacggcctc gtagcggctc
ctcattgcct gctccgggcc gacccagagg tacttccgag gctgccggag catcgccgag
<.............................msc27.............................<
s y r
v l g p
q t e
m f a
g v a e
y r s
26461
tcgaactcct cggcgtcgcc gatcagggtg agcttgttga cgaacacgac ggccatggtg
agcttgagga gccgcagcgg ctagtcccac tcgaacaact gcttgtgctg ccggtaccac
<...........................msc27..........................<<
e f e
e a d g
i l t
l k n
v f v v
a m
26521
gtctcctcgg gtggatgttc gtacgcgggt ggtcgtgcgt gctgggcggc gcgggtacgt
cagaggagcc cacctacaag catgcgccca ccagcacgca cgacccgccg cgcccatgca
26581
ggggcggact tcggtcagcc cgcggtgccc gccgcgccgg cggcggcgag gaccgggtag
ccccgcctga agccagtcgg gcgccacggg cggcgcggcc gccgccgctc ctggcccatc
<<....................msc28......................<
- g
a t g
a a g
a a a l
v p y
26641
tcggtgtagc cctgggcgcc gccctcgtag aagaaccgcg ggttccaggc gttgagcggg
agccacatcg ggacccgcgg cgggagcatc ttcttggcgc ccaaggtccg caactcgccc
<.............................msc28.............................<
d t y
g q a g
g e y
f f r
p n w a
n l p
26701
gcgcgggtgc gcaaccgctc gggcaggtcg gggttggcga ggaactggcg gccgaaggac
cgcgcccacg cgttggcgag cccgtccagc cccaaccgct ccttgaccgc cggcttcctg
<.............................msc28.............................<
a r t
r l r e
p l d
p n a
l f q r
g f s
26761
aggaggccgg cgccgtgggc gagggcttcg tcggcggcgg cgagtgtgcc gtcggtgtcg
tcctccggcc gcggcacccg ctcccgaagc agccgccgcc gctcacacgg cagccacagc
<.............................msc28.............................<
l l g
a g h a
l a e
d a a
a l t g
d t d
26821
agcggtccgg tgccgaggtt gacgacggcg gtacgtggcc accgtcggct cagctcgtgg
tcgccaggcc acggctccaa ctgctgccgc catgcaccgg tggcagccga gtcgagcacc
<.............................msc28.............................<
l p g
t g l n
v v a
t r p
w r r s
l e h
26881
acgagggccg gatcactgcc cgcgacgaag tggagatggc cgaggccgag tgcggcgagc
tgctcccggc ctagtgacgg gcgctgcttc acctctaccg gctccggctc acgccgctcg
<.............................msc28.............................<
v l a
p d s g
a v f
h l h
g l g l
a a l
346
Anhang
26941
gcatccacga gcaccggata cacctcggtc cggtccggct cggacatgtc gttgagcgcg
cgtaggtgct cgtggcctat gtggagccag gccaggccga gcctgtacag caactcgcgc
<.............................msc28.............................<
a d v
l v p y
v e t
r d p
e s m d
n l a
27001
aaccccgggg agagccggat gccggtgcgt tccgccccga tctccgcggc gacggcccgg
ttggggcccc tctcggccta cggccacgca aggcggggct agaggcgccg ctgccgggcc
<.............................msc28.............................<
f g p
s l r i
g t r
e a g
i e a a
v a r
27061
gcgacctcga cggggaaccg gatgcggccc tcggtgtcgc cgccgtactc gtcctcgcgc
cgctggagct gccccttggc ctacgccggg agccacagcg gcggcatgag caggagcgcg
<.............................msc28.............................<
a v e
v p f r
i r g
e t d
g g y e
d e r
27121
gtgttggtca ccggcgacag gaactggtgc agcagatagc cgttggcgcc gtggatctcg
cacaaccagt ggccgctgtc cttgaccacg tcgtctatcg gcaaccgcgg cacctagagc
<.............................msc28.............................<
t n t
v p s l
f q h
l l y
g n a g
h i e
27181
acgccgtcga agccgatgtc ggtggcggtg cgggcgcagc gcacgaagtc ctggatcgtg
tgcggcagct tcggctacag ccaccgccac gcccgcgtcg cgtgcttcag gacctagcac
<.............................msc28.............................<
v g d
f g i d
t a t
r a c
r v f d
q i t
27241
gcggcgatct cgtcccggtg caggggtcgc ggtgtcgggt gggccggctt gccggcaaag
cgccgctaga gcagggccac gtccccagcg ccacagccca cccggccgaa cggccgtttc
<.............................msc28.............................<
a a i
e d r h
l p r
p t p
h a p k
g a f
27301
acccgggcgg tcccctcggc ccggacggcg gacggcgcca cgggagtctc gccgtgcagg
tgggcccgcc aggggagccg ggcctgccgc ctgccgcggt gccctcagag cggcacgtcc
<.............................msc28.............................<
v r a
t g e a
r v a
s p a
v p t e
g h l
27361
tcggggtggc tgacccggcc cgcgtgcatg atctggaggt acatccgccc gcccgcctcg
agccccaccg actgggccgg gcgcacgtac tagacctcca tgtaggcggg cgggcggagc
<.............................msc28.............................<
d p h
s v r g
a h m
i q l
y m r g
g a e
27421
tgcacggcgt cgacgatccg ggcccaggcg cgggcctgtt cggcggtgtg cagccggacg
acgtgccgca gctgctaggc ccgggtccgc gcccggacaa gccgccacac gtcggcctgc
<.............................msc28.............................<
h v a
d v i r
a w a
r a q
e a t h
l r v
27481
ctgtgggcgt ggccgacggc cagggggctc ggatgggtgg cctcgctgat gatgagtccg
gacacccgca ccggctgccg gtcccccgag cctacccacc ggagcgacta ctactcaggc
<.............................msc28.............................<
s h a
h g v a
l p s
p h t
a e s i
i l g
27541
gcgctggcgc gctgcgcgta gtactcggcc atgaccggca gcggcgttcc gtcggctgtg
cgcgaccgcg cgacgcgcat catgagccgg tactggccgt cgccgcaagg cagccgacac
<.............................msc28.............................<
a s a
r q a y
y e a
m v p
l p t g
d a t
27601
gtccggccgc ggcccatcgg ggacatgacg atcctgttcg gcagggtgag gccaccgaac
caggccggcg ccgggtagcc cctgtactgc taggacaagc cgtcccactc cggtggcttg
<.............................msc28.............................<
t r g
r g m p
s m v
i r n
p l t l
g g f
Anhang
347
27661
ggggtcgagc cgaacaggcc gctcatgccc cggccccggc gacggcttcg cgtccggtga
ccccagctcg gcttgtccgg cgagtacggg gccggggccg ctgccgaagc gcaggccact
<..........msc28..........<<
p t s
g f l g
s m
<<................msc29.................<
- a
g a g a
v a e
r g t
27721
tcgtctcggc gccgtcgtgg ctgatgtagc ggctgcggac ggaccatgtc ccggcacggc
agcagagccg cggcagcacc gactacatcg ccgacgcctg cctggtacag ggccgtgccg
<.............................msc29.............................<
i t e a
g d h
s i y
r s r v
s w t
g a r
27781
gctccaggac gtcctcggcg gtcgtgctca ggtacagccg gggttcgccg cccttcgggg
cgaggtcctg caggagccgc cagcacgagt ccatgtcggc cccaagcggc gggaagcccc
<.............................msc29.............................<
r e l v
d e a
t t s
l y l r
p e g
g k p
27841
tctcgaacac gacggcgtag taacgggtgc gcacgacgcc gggctcgacg ggctcggcgg
agagcttgtg ctgccgcatc attgcccacg cgtgctgcgg cccgagctgc ccgagccgcc
<.............................msc29.............................<
t e f v
v a y
y r t
r v v g
p e v
p e a
27901
cgatcatgcc gaaccagtgg cggcgggtca gaccgcgagc ggcgagcgcg tcgatgccct
gctagtacgg cttggtcacc gccgcccagt ctggcgctcg ccgctcgcgc agctacggga
<.............................msc29.............................<
a i m g
f w h
r r t
l g r a
a l a
d i g
27961
tgcgcatgcc ggcggcgatg tccgcgcggc cgcgcttgac gccgggtttg acgttctggg
acgcgtacgg ccgccgctac aggcgcgccg gcgcgaactg cggcccaaac tgcaagaccc
<.............................msc29.............................<
k r m g
a a i
d a r
g r k v
g p k
v n q
28021
cgaacgtgcc gtcctcggtg aactgctcgg cccattcctc cgcccggccg gcgtccagca
gcttgcacgg caggagccac ttgacgagcc gggtaaggag gcgggccggc cgcaggtcgt
<.............................msc29.............................<
a f t g
d e t
f q e
a w e e
a r g
a d l
28081
gttgcgcgtg tccggcgtag aaccgggtga tggccgcgta gtccaggtcg gacacggtgt
caacgcgcac aggccgcatc ttggcccact accggcgcat caggtccagc ctgtgccaca
<.............................msc29.............................<
l q a h
g a y
f r t
i a a y
d l d
s v t
28141
gggtgtccgg aggtgcggtc cgtgtcacgg tcttcctcct gtgcttcgtg ggcgcctgtc
cccacaggcc tccacgccag gcacagtgcc agaaggagga cacgaagcac ccgcggacag
<...........msc29...........<<
h t d p
p a t
r t v
28201
gggcgccggg gtccgggcca ccttcgccgg ttccggtgga gcaggcgtgg agtccggctc
cccgcggccc caggcccggt ggaagcggcc aaggccacct cgtccgcacc tcaggccgag
28261
cacgcgtacg ggccgggcgc gggggtcagc cggccgtgcg cagcggtacg ggtgtgctgt
gtgcgcatgc ccggcccgcg cccccagtcg gccggcacgc gtcgccatgc ccacacgaca
<<..............msc30................<
g a t r
l p v
p t s
28321
ccggccccgg caggtacacg gactccctca ccggcacgga gttgagcaga tcggcgtgca
ggccggggcc gtccatgtgc ctgagggagt ggccgtgcct caactcgtct agccgcacgt
<.............................msc30.............................<
d p g p
l y v
s e r
v p v s
n l l
d a h
348
Anhang
28381
ggtcccggac ccgggccgag ggctccaggc cgagttcggt gctgaaggtg cggcggagcc
ccagggcctg ggcccggctc ccgaggtccg gctcaagcca cgacttccac gccgcctcgg
<.............................msc30.............................<
l d r v
r a s
p e l
g l e t
s f t
r r l
28441
cggcgaacac ctcaagggcg tcggcggtgc gcccggaccg ggagagggcg atcatcagct
gccgcttgtg gagttcccgc agccgccacg cgggcctggc cctctcccgc tagtagtcga
<.............................msc30.............................<
g a f v
e l a
d a t
r g s r
s l a
i m l
28501
gggcgtggag attctcgtac gtggggtact gacgggtgag cacacggagt tcgccgatga
cccgcacctc taagagcatg caccccatga ctgcccactc gtgtgcctca agcggctact
<.............................msc30.............................<
q a h l
n e y
t p y
q r t l
v r l
e g i
28561
gccggtggtg gcggccgatc ctcaggtcgg cgtcgatgcg ctgttcgagg gcgcccagcc
cggccaccac cgccggctag gagtccagcc gcagctacgc gacaagctcc cgcgggtcgg
<.............................msc30.............................<
l r h h
r g i
r l d
a d i r
q e l
a g l
28621
gtgtctcacg caatccactg agccgggtgc gcagcagcgg tccgcaggtc acgtcggcga
cacagagtgc gttaggtgac tcggcccacg cgtcgtcgcc aggcgtccag tgcagccgct
<.............................msc30.............................<
r t e r
l g s
l r t
r l l p
g c t
v d a
28681
gcgccttgcc cgaccacagt ccgagggccc ggtgcaggag ctccgactcg cgggtgtggt
cgcggaacgg gctggtgtca ggctcccggg ccacgtcctc gaggctgagc gcccacacca
<.............................msc30.............................<
l a k g
s w l
g l a
r h l l
e s e
r t h
28741
cgccgacgat gcgggcgagg gaggcctgct cgacgagctt ctcgaactgg tgcaggtcca
gcggctgcta cgcccgctcc ctccggacga gctgctcgaa gagcttgacc acgtccaggt
<.............................msc30.............................<
d g v i
r a l
s a q
e v l k
e f q
h l d
28801
gttgaccggc gccgacggcg aggaggtagc cgcggtcacg ggtctccagg tacatctccg
caactggccg cggctgccgc tcctccatcg gcgccagtgc ccagaggtcc atgtagaggc
<.............................msc30.............................<
l q g a
g v a
l l y
g r d r
t e l
y m e
28861
caggggtgcc ggtggcggtg gcggcgcttc tgagggtctt gcgtatctgc atcacgtacg
gtccccacgg ccaccgccac cgccgcgaag actcccagaa cgcatagacg tagtgcatgc
<.............................msc30.............................<
a p t g
t a t
a a s
r l t k
r i q
m v y
28921
tctggagtgt ggagtgggcg ctgtgcgggg gcgagtccgc ccacagttcg tccacgcatt
agacctcaca cctcacccgc gacacgcccc cgctcaggcg ggtgtcaagc aggtgcgtaa
<.............................msc30.............................<
t q l t
s h a
s h p
p s d a
w l e
d v c
28981
cgtccacggt gacgacctgc ccggcgtgca gcagcagcag actcaggagc tggcgctgct
gcaggtgcca ctgctggacg ggccgcacgt cgtcgtcgtc tgagtcctcg accgcgacga
<.............................msc30.............................<
e d v t
v v q
g a h
l l l l
s l l
q r q
29041
tcggggcccg cggggtgacg gtgcgcgggc cgtcggagag ggtgagcgtg ccgaggattc
agccccgggc gccccactgc cacgcgcccg gcagcctctc ccactcgcac ggctcctaag
<.............................msc30.............................<
k p a r
p t v
t r p
g d s l
t l t
g l i
Anhang
349
29101
gtgcgtacat ctcgcctcca gggctggctt gatgggctac gggcaccatc gtggccgctg
cacgcatgta gagcggaggt cccgaccgaa ctacccgatg cccgtggtag caccggcgac
<.msc30.<<
r a y m
29161
gatcttgcac ctcactttcg gcggcctttc agcccggcgg gatcctcctc gcacgcggcg
ctagaacgtg gagtgaaagc cgccggaaag tcgggccgcc ctaggaggag cgtgcgccgc
29221
tcgcggggca gggccgtcat acggccgcaa cacggcgtcg acgaagccgc cctgaatgct
agcgccccgt cccggcagta tgccggcgtt gtgccgcagc tgcttcggcg ggacttacga
29281
ctggggcgcc cttgcccgaa ggcgcccctg tcactgctcc cgccaccgtc atgcactgca
gaccccgcgg gaacgggctt ccgcggggac agtgacgagg gcggtggcag tacgtgacgt
<<..msc31...<
- a s c
29341
ttccgggaac agtgcgtgga ggctgccgga cgcctcgggc aggaccgtgc cgctgtcgtc
aaggcccttg tcacgcacct ccgacggcct gcggagcccg tcctggcacg gcgacagcag
<.............................msc31.............................<
e p f
l a h
l s g s
a e p
l v t
g s d d
29401
cgcgcgcctt ccggcggact ccgggtgttc ccggccgggc gtgttgccgg tgcgtcggca
gcgcgcggaa ggccgcctga ggcccacaag ggccggcccg cacaacggcc acgcagccgt
<.............................msc31.............................<
a r r
g a s
e p h e
r g p
t n g
t r r c
29461
cagctcctcg gcctgggcgc gaaggaggag cagcccggat ccgtcggcga cggtgaccgc
gtcgaggagc cggacccgcg cttcctcctc gtcgggccta ggcagccgct gccactggcg
<.............................msc31.............................<
l e e
a q a
r l l l
l g s
g d a
v t v a
29521
gcgcgcgccg agctggtagg cctcggcagg ccggcccccc gccagttcga gccgtccgag
cgcgcgcggc tcgaccatcc ggagccgtcc ggccgggggg cggtcaagct cggcaggctc
<.............................msc31.............................<
r a g
l q y
a e a p
r g g
a l e
l r g l
29581
gccgatgagg gcgtgggcct ccgactgggg atgaccgatg cgttcggcga tggccagagt
cggctactcc cgcacccgga ggctgacccc tactggctac gcaagccgct accggtctca
<.............................msc31.............................<
g i l
a h a
e s q p
h g i
r e a
i a l t
29641
gcgggtgaac tcctcgcggg cgtcggcgga tctgccccgg atgaggtgca gcccgcccag
cgcccacttg aggagcgccc gcagccgcct agacggggcc tactccacgt cgggcgggtc
<.............................msc31.............................<
r t f
e e r
a d a s
r g r
i l h
l g g l
29701
ggtgttgcgg gcgttggcct ccagggcgac atagccgtgg tcgcgggcga tgacgacggc
ccacaacgcc cgcaaccgga ggtcccgctg tatcggcacc agcgcccgct actgctgccg
<.............................msc31.............................<
t n r
a n a
e l a v
y g h
d r a
i v v a
29761
gctctcggcg tgctggtacg cgaggtcgac atagctgttg caggcgtaga cctgggcgag
cgagagccgc acgaccatgc gctccagctg tatcgacaac gtccgcatct ggacccgctc
<.............................msc31.............................<
s e a
h q y
a l d v
y s n
c a y
v q a l
29821
cccgtaggag gcgagaacag tcgagtgagg ggcgttgaac tccttgctga gcgacagcgc
gggcatcctc cgctcttgtc agctcactcc ccgcaacttg aggaacgact cgctgtcgcg
<.............................msc31.............................<
g y s
a l v
t s h p
a n f
e k s
l s l a
350
Anhang
29881
gaggctgaga ttggccatgg ccgcgtccca ttcgcgcagg tcggcgtgga cggcaccgag
ctccgactct aaccggtacc ggcgcagggt aagcgcgtcc agccgcacct gccgtggctc
<.............................msc31.............................<
l s l
n a m
a a d w
e r l
d a h
v a g l
29941
ccgggccagc acctcggggc gggagcgctg gacaccgtcc tcgtcgagga tcgcggcggc
ggcccggtcg tggagccccg ccctcgcgac ctgtggcagg agcagctcct agcgccgccg
<.............................msc31.............................<
r a l
v e p
r s r q
v g d
e d l
i a a a
30001
gcggctgaaa tgggcctcgg ccacgtgcag ccgcccctgg ctgtgccggg ccatgcccag
cgccgacttt acccggagcc ggtgcacgtc ggcggggacc gacacggccc ggtacgggtc
<.............................msc31.............................<
r s f
h a e
a v h l
r g q
s h r
a m g l
30061
gtacatcagc ccgcgggcct cgacatgccg cagttccaga tgccggctga tctccaagcc
catgtagtcg ggcgcccgga gctgtacggc gtcaaggtct acggccgact agaggttcgg
<.............................msc31.............................<
y m l
g r a
e v h r
l e l
h r s
i e l g
30121
gcgttccagc agggtgacgg cgctgtcgat gtgcttggtg ggtcgctgaa gctggttcat
cgcaaggtcg tcccactgcc gcgacagcta cacgaaccac ccagcgactt cgaccaagta
<.............................msc31.............................<
r e l
l t v
a s d i
h k t
p r q
l q n m
30181
cgcgatggcg ttgacggtga cggcctcgaa gtcgcgcacg cccagtcgga tgaactcccg
gcgctaccgc aactgccact gccggagctt cagcgcgtgc gggtcagcct acttgagggc
<.............................msc31.............................<
a i a
n v t
v a e f
d r v
g l r
i f e r
30241
gtgggctagg cgcagttcgc gggccgcgtc cgggagccgg ttgagaccct gcagcgcgag
cacccgatcc gcgtcaagcg cccggcgcag gccctcggcc aactctggga cgtcgcgctc
<.............................msc31.............................<
h a l
r l e
r a a d
p l r
n l g
q l a l
30301
tccgacgctg agccgcatca ccgcagtggc ccgttggtcg ccgagcgagc gcgcggcgcg
aggctgcgac tcggcgtagt ggcgtcaccg ggcaaccagc ggctcgctcg cgcgccgcgc
<.............................msc31.............................<
g v s
l r m
v a t a
r q d
g l s
r a a r
30361
caacccggcc tgggcgatgg tgagccagtc ggtctggagc cggccgaggg tgaagtagcc
gttgggccgg acccgctacc actcggtcag ccagacctcg gccggctccc acttcatcgg
<.............................msc31.............................<
l g a
q a i
t l w d
t q l
r g l
t f y g
30421
gcggagcatg tccaccaggc ggacgcagac ctcgtccagg tgctcgtcgg cggcgcggac
cgcctcgtac aggtggtccg cctgcgtctg gagcaggtcc acgagcagcc gccgcgcctg
<.............................msc31.............................<
r l m
d v l
r v c v
e d l
h e d
a a r v
30481
gaccagggcc acgaggttgg actgctcgac gcgcagccac tcctgcgcgg cccggggttc
ctggtcccgg tgctccaacc tgacgagctg cgcgtcggtg aggacgcgcc gggccccaag
<.............................msc31.............................<
v l a
v l n
s q e v
r l w
e q a
a r p e
30541
gacctcgatg tccgggccgt gggggtcggg ccggaacacc cgcaggaagc ccgggtagca
ctggagctac aggcccggca cccccagccc ggccttgtgg gcgtccttcg ggcccatcgt
<.............................msc31.............................<
v e i
d p g
h p d p
r f v
r l f
g p y c
Anhang
351
30601
ggaccgcacg gcctcgtcgg tgcggcgcag gtaccagcgg cacagccggt tcagggcctg
cctggcgtgc cggagcagcc acgccgcgtc catggtcgcc gtgtcggcca agtcccggac
<.............................msc31.............................<
s r v
a e d
t r r l
y w r
c l r
n l a q
30661
ccgccggtcg gcgggaccgt cctcctcgat gctgcgctcg gccgcgtaca gggcgatgag
ggcggccagc cgccctggca ggaggagcta cgacgcgagc cggcgcatgt cccgctactc
<.............................msc31.............................<
r r d
a p g
d e e i
s r e
a a y
l a i l
30721
gctgtggaag cggtaggtgt cctgggacga gacctcgatg agctgggccg cggcgagctt
cgacaccttc gccatccaca ggaccctgct ctggagctac tcgacccggc gccgctcgaa
<.............................msc31.............................<
s h f
r y t
d q s s
v e i
l q a
a a l k
30781
gtcgaggagc tggtcggcca cctggggctc gcagtcggcg agttgggcgg cggtaagggc
cagctcctcg accagccggt ggaccccgag cgtcagccgc tcaacccgcc gccattcccg
<.............................msc31.............................<
d l l
q d a
v q p e
c d a
l q a
a t l a
30841
ggtgaaggcc atgtcgccga cgacgccgag caatcggaag aaccgtcggg acagtgcggg
ccacttccgg tacagcggct gctgcggctc gttagccttc ttggcagccc tgtcacgccc
<.............................msc31.............................<
t f a
m d g
v v g l
l r f
f r r
s l a p
30901
caacgactcg taggcgacgc cgaacgcggc ccgtacggcg gtcgacgggc tgtcgccgag
gttgctgagc atccgctgcg gcttgcgccg ggcatgccgc cagctgcccg acagcggctc
<.............................msc31.............................<
l s e
y a v
g f a a
r v a
t s p
s d g l
30961
ggcgaggagt tccagcgggt cgccctcgcg cagcgcctcg gcgaaggact cgacggagcg
ccgctcctca aggtcgccca gcgggagcgc gtcgcggagc cgcttcctga gctgcctcgc
<.............................msc31.............................<
a l l
e l p
d g e r
l a e
a f s
e v s r
31021
ccagggccgt ccggccaggt gtccggcggc gatgcgcagg gcgagcggaa gccggccgca
ggtcccggca ggccggtcca caggccgccg ctacgcgtcc cgctcgcctt cggccggcgt
<.............................msc31.............................<
w p r
g a l
h g a a
i r l
a l p
l r g c
31081
cagttcgacg agttcggtga cggccgtggc gcacagggtc tccggggccc tgccgagaac
gtcaagctgc tcaagccact gccggcaccg cgtgtcccag aggccccggg acggctcttg
<.............................msc31.............................<
l e v
l e t
v a t a
c l t
e p a
r g l v
31141
ggcggtgagt acctgttcac cctccttctg cgacaacagg tcgagggtga agctgcgtgc
ccgccactca tggacaagtg ggaggaagac gctgttgtcc agctcccact tcgacgcacg
<.............................msc31.............................<
a t l
v q e
g e k q
s l l
d l t
f s r a
31201
gccgtagacg gcgacgaggt cgggccggta ttcgcggtgc agggcgagca cggcgcagct
cggcatctgc cgctgctcca gcccggccat aagcgccacg tcccgctcgt gccgcgtcga
<.............................msc31.............................<
g y v
a v l
d p r y
e r h
l a l
v a c s
31261
cggagaaccc ggcagcaggt cggggacctg ctcactgttg ttgacgtcgt cgatgacgat
gcctcttggg ccgtcgtcca gcccctggac gagtgacaac aactgcagca gctactgcta
<.............................msc31.............................<
p s g
p l l
d p v q
e s n
n v d
d i v i
352
Anhang
31321
gaggacgcgc cggtcggcga gcctgctgcg gagcacgccg gtgagctggt gccgttcggt
ctcctgcgcg gccagccgct cggacgacgc ctcgtgcggc cactcgacca cggcaagcca
<.............................msc31.............................<
l v r
r d a
l r s r
l v g
t l q
h r e t
31381
gggcagtacg gagacgtcgg cgccggaggc gtgcagcagc tcggcgatga tgtcgtgcac
cccgtcatgc ctctgcagcc gcggcctccg cacgtcgtcg agccgctact acagcacgtg
<.............................msc31.............................<
p l v
s v d
a g s a
h l l
e a i
i d h v
31441
gggccgggct ccgccgcagg cgtcgtggag gcggatgtac cactgcccgt cggggtaggc
cccggcccga ggcggcgtcc gcagcacctc cgcctacatg gtgacgggca gccccatccg
<.............................msc31.............................<
p r a
g g c
a d h l
r i y
w q g
d p y a
31501
cgggctgagc cggtgcgcgg cccgcaacgc gagcgcggtc ttgccgacgc cgggtgggcc
gcccgactcg gccacgcgcc gggcgttgcg ctcgcgccag aacggctgcg gcccacccgg
<.............................msc31.............................<
p s l
r h a
a r l a
l a t
k g v
g p p g
31561
gacgaggctg accagcggta cggccgcgcg ctggcgtggc gtgagcgcgg cgacgacttc
ctgctccgac tggtcgccat gccggcgcgc gaccgcaccg cactcgcgcc gctgctgaag
<.............................msc31.............................<
v l s
v l p
v a a r
q r p
t l a
a v v e
31621
ctccagcagt tcctcccggc cgacgaagtg ggttgcctct ggcgggagtt ggcgctgcac
gaggtcgtca aggagggccg gctgcttcac ccaacggaga ccgccctcaa ccgcgacgtg
<.............................msc31.............................<
e l l
e e r
g v f h
t a e
p p l
q r q v
31681
cacccagggc gcgctggggt tggtgggctg caccccggcg gtccggtgca cctcacggac
gtgggtcccg cgcgacccca accacccgac gtggggccgc caggccacgt ggagtgcctg
<.............................msc31.............................<
v w p
a s p
n t p q
v g a
t r h
v e r v
31741
cgcgtacgcg cggcggcccg aggggccggc ctggggggtg tggagttcac cggtctcggc
gcgcatgcgc gccgccgggc tccccggccg gaccccccac acctcaagtg gccagagccg
<.............................msc31.............................<
a y a
r r g
s p g a
q p t
h l e
g t e a
31801
gagcagttgc cggtgcagct cctggagttc ctgccccggg gggagtccga gttcacggtc
ctcgtcaacg gccacgtcga ggacctcaag gacggggccc ccctcaggct caagtgccag
<.............................msc31.............................<
l l q
r h l
e q l e
q g p
p l g
l e r d
31861
gagcatccgg tagtagtcgc ggtactcctc cagcgccgcg gcgacctgcc cggtgcggtg
ctcgtaggcc atcatcagcg ccatgaggag gtcgcggcgc cgctggacgg gccacgccac
<.............................msc31.............................<
l m r
y y d
r y e e
l a a
a v q
g t r h
31921
cagagcccgc atcaggtact cgcgaagccg ttcccgtacc gggtgttcgg ctgcgagtgc
gtctcgggcg tagtccatga gcgcttcggc aagggcatgg cccacaagcc gacgctcacg
<.............................msc31.............................<
l a r
m l y
e r l r
e r v
p h e
a a l a
31981
gcgcagctgc ggaatgatgt cggcgctgcc gccgaggtcg aggaggagcg cgaagcgccg
cgcgtcgacg ccttactaca gccgcgacgg cggctccagc tcctcctcgc gcttcgcggc
<.............................msc31.............................<
r l q
p i i
d a s g
g l d
l l l
a f r r
Anhang
353
32041
ttcgacgagg gtgaggcgtt cctccgcgag ctgcggtacg gcctcggtct gcagcgaggc
aagctgctcc cactccgcaa ggaggcgctc gacgccatgc cggagccaga cgtcgctccg
<.............................msc31.............................<
e v l
t l r
e e a l
q p v
a e t
q l s a
32101
ggagggcacg gtctcgaagg gatccccgcg ccattcggcg agcgctcgtt ccagggcggc
cctcccgtgc cagagcttcc ctaggggcgc ggtaagccgc tcgcgagcaa ggtcccgccg
<.............................msc31.............................<
s p v
t e f
p d g r
w e a
l a r
e l a a
32161
cagttcccgg gcggtgtccc cccggccccg ggcgaggcgg gcctcgtcgg ccgccttccg
gtcaagggcc cgccacaggg gggccggggc ccgctccgcc cggagcagcc ggcggaaggc
<.............................msc31.............................<
l e r
a t d
g r g r
a l r
a e d
a a k r
32221
gtagcgggtg aggtcgaggg ccgccgaatc catcgcgagc cggtagccgc ccgggtgggt
catcgcccac tccagctccc ggcggcttag gtagcgctcg gccatcggcg ggcccaccca
<.............................msc31.............................<
y r t
l d l
a a s d
m a l
r y g
g p h t
32281
ctcgatgacc ggagggtcgc cgacgtccag tgattcgcgc agcagcgccc tcagccgggt
gagctactgg cctcccagcg gctgcaggtc actaagcgcg tcgtcgcggg agtcggccca
<.............................msc31.............................<
e i v
p p d
g v d l
s e r
l l a
r l r t
32341
ggtatggacg tgcagcgcgg cgcgggtgtc tcgtggcggc tggtcgtccc agagccttcg
ccatacctgc acgtcgcgcc gcgcccacag agcaccgccg accagcaggg tctcggaagc
<.............................msc31.............................<
t h v
h l a
a r t d
r p p
q d d
w l r r
32401
gatgagttcg tcggacgtga ccacccggtc ggcccgcagc agcagggacg cgagaagcac
ctactcaagc agcctgcact ggtgggccag ccgggcgtcg tcgtccctgc gctcttcgtg
<.............................msc31.............................<
i l e
d s t
v v r d
a r l
l l s
a l l v
32461
ccgctgcttg ggggacgaga cggtcagttc tcttccccct gtgaggaccg ccaggggtcc
ggcgacgaac cccctgctct gccagtcaag agaaggggga cactcctggc ggtccccagg
<.............................msc31.............................<
r q k
p s s
v t l e
r g g
t l v
a l p g
32521
gagtattcgg aagtcgtaga tcgaagcgtg ttccccattc acgtgcacac ctgccccgtc
ctcataagcc ttcagcatct agcttcgcac aaggggtaag tgcacgtgtg gacggggcag
<.............................msc31.............................<
l i r
f d y
i s a h
e g n
v h v
g a g d
32581
ggtccccctg cgcacggtca gccgtgccca gcgccacagt agaacgtgct tgcgcagggg
ccagggggac gcgtgccagt cggcacgggt cgcggtgtca tcttgcacga acgcgtcccc
<.............................msc31.............................<
t g r
r v t
l r a w
r w l
l v h
k r l p
32641
gccgccgcca tgtgatccag gccacattcg gcgagccggt gtgtcatatg gttccggaca
cggcggcggt acactaggtc cggtgtaagc cgctcggcca cacagtatac caaggcctgt
<...........msc31..........<<
g g g
h s g
p w m
32701
ttcttcggca ggccgtccgc tccgcttcac gcggcactgt cgccgccgcc ctccccggtc
aagaagccgt ccggcaggcg aggcgaagtg cgccgtgaca gcggcggcgg gaggggccag
<<..............msc32...............<
a a s
d g g g
e g t
354
Anhang
32761
agcccgaagc gccgcgcgag cagttcatag gaacgcatgc gatctcgggg ggcgtggatc
tcgggcttcg cggcgcgctc gtcaagtatc cttgcgtacg ctagagcccc ccgcacctag
<.............................msc32.............................<
l g f
r r a l
l e y
s r m
r d r p
a h i
32821
gtggagagca ccatgaactc gtcgatctcc agcgcctcgg tcatggacgt gagctccttg
cacctctcgt ggtacttgag cagctagagg tcgcggagcc agtacctgca ctcgaggaac
<.............................msc32.............................<
t s l
v m f e
d i e
l a e
t m s t
l e k
32881
tgcacatggt cggggtcgcc gaccacgcac ctcggccatt cggccacctc gtccgcgagc
acgtgtacca gccccagcgg ctggtgcgtg gagccggtaa gccggtggag caggcgctcg
<.............................msc32.............................<
h v h
d p d g
v v c
r p w
e a v e
d a l
32941
ggttccacct cgccgcgcag cccgtcgaga gcggcctccg gcgacggcag cggcagcagc
ccaaggtgga gcggcgcgtc gggcagctct cgccggaggc cgctgccgtc gccgtcgtcg
<.............................msc32.............................<
p e v
e g r l
g d l
a a e
p s p l
p l l
33001
agcccgcggc ccatgcgcag ccggaagagc cgctggctgg cgaagacccg ccgggcctcc
tcgggcgccg ggtacgcgtc ggccttctcg gcgaccgacc gcttctgggc ggcccggagg
<.............................msc32.............................<
l g r
g m r l
r f l
r q s
a f v r
r a e
33061
tcctccgtgg gcccgcagta caccccgata ccgatctgca cgcgcggccg cgagccgtcg
aggaggcacc cgggcgtcat gtggggctat ggctagacgt gcgcgccggc gctcggcagc
<.............................msc32.............................<
e e t
p g c y
v g i
g i q
v r p r
s g d
33121
tgactgtcga aggcgccgcg gtaggcctcg acgacggagc gggtgacctg gggccggccg
actgacagct tccgcggcgc catccggagc tgctgcctcg cccactggac cccggccggc
<.............................msc32.............................<
h s d
f a g r
y a e
v v s
r t v q
p r g
33181
aagtgggcta tggacaccgg cagccctagc cgggcggcca gttcggcgct ctgcgggctg
ttcacccgat acctgtggcc gtcgggatcg gcccgccggt caagccgcga gacgcccgac
<.............................msc32.............................<
f h a
i s v p
l g l
r a a
l e a s
q p s
33241
gccaccagga gccacacctc gggcgcgccc gcggtgggca tgagctggat gcggccatag
cggtggtcct cggtgtggag cccgcgcggg cgccacccgt actcgaccta cgccggtatc
<.............................msc32.............................<
a v l
l w v e
p a g
a t p
m l q i
r g y
33301
gggtgcccgt cggggaagcc gccgtgcagg aaggcgagga gttcggcgag ttttccggga
cccacgggca gccccttcgg cggcacgtcc ttccgctcct caagccgctc aaaaggccct
<.............................msc32.............................<
p h g
d p f g
g h l
f a l
l e a l
k g p
33361
aagtccccgt cgtccccgcc cccggaggta cccggggcga gcgcgtgcgc ctcgatgctc
ttcaggggca gcaggggcgg gggcctccat gggccccgct cgcgcacgcg gagctacgag
<.............................msc32.............................<
f d g
d d g g
g s t
g p a
l a h a
e i s
33421
ccggcgccga taccgcggcc gacaccgaga tcgatccggc cgggcgagag cgcgccgagc
ggccgcggct atggcgccgg ctgtggctct agctaggccg gcccgctctc gcgcggctcg
<.............................msc32.............................<
g a g
i g r g
v g l
d i r
g p s l
a g l
Anhang
355
33481
acccggaaca cctcggcgac cttcagcggg ctgtagtgcg gcagcagcac cccgccggag
tgggccttgt ggagccgctg gaagtcgccc gacatcacgc cgtcgtcgtg gggcggcctc
<.............................msc32.............................<
v r f
v e a v
k l p
s y h
p l l v
g g s
33541
ccgacccgga tgcgacgggt ctcggcggcg accctggcgg ccatgatctc cggcgcgggg
ggctgggcct acgctgccca gagccgccgc tgggaccgcc ggtactagag gccgcgcccc
<.............................msc32.............................<
g v r
i r r t
e a a
v r a
a m i e
p a p
33601
cccgcgaagg agggcgtggc gtgatgctcg gcgaaccagt agcggtggta accgagccgg
gggcgcttcc tcccgcaccg cactacgagc cgcttggtca tcgccaccat tggctcggcc
<.............................msc32.............................<
g a f
s p t a
h h e
a f w
y r h y
g l r
33661
tccgcgagac gtgccaggtt cagggagttg tgcagggcgg tggccggggt gcttccctcc
aggcgctctg cacggtccaa gtccctcaac acgtcccgcc accggcccca cgaagggagg
<.............................msc32.............................<
d a l
r a l n
l s n
h l a
t a p t
s g e
33721
ggcacgacgg actggtccag gacggacagt ttcacgctgg tctccttcac ggacagggcc
ccgtgctgcc tgaccaggtc ctgcctgtca aagtgcgacc agaggaagtg cctgtcccgg
<...............msc32...............<<
p v v
s q d l
v s l
k v
33781
gaaaggaggg ggtgacgcgc ttaaggggtg gcggctccgg ccgcgctgtg ccggaagcgg
ctttcctccc ccactgcgcg aattccccac cgccgaggcc ggcgcgacac ggccttcgcc
<<.................msc33..................<
- p t
a a g
a a s h
r f r
33841
gagacgagcg atgcccaacg gtcgtcgaac gaggcgacat cgagcagtcc ggtcagctcc
ctctgctcgc tacgggttgc cagcagcttg ctccgctgta gctcgtcagg ccagtcgagg
<.............................msc33.............................<
s v l
s a w r
d d f
s a v
d l l g
t l e
33901
tcacggcagc gggcctcggc ccgctcaccg cgctcggcgc ccgcgggcgt cagcatgcag
agtgccgtcg cccggagccg ggcgagtggc gcgagccgcg ggcgcccgca gtcgtacgtc
<.............................msc33.............................<
e r c
r a e a
r e g
r e a
g a p t
l m c
33961
tagacgccgc ggcggtcgtg ctcgcaggag acgcgggtcg tgaggccctt gttctccagg
atctgcggcg ccgccagcac gagcgtcctc tgcgcccagc actccgggaa caagaggtcc
<.............................msc33.............................<
y v g
r r d h
e c s
v r t
t l g k
n e l
34021
cgggtgacga gccggctcat ggacgactgg tcgagcccga ccgcggtgga cagctcctgc
gcccactgct cggccgagta cctgctgacc agctcgggct ggcgccacct gtcgaggacg
<.............................msc33.............................<
r t v
l r s m
s s q
d l g
v a t s
l e q
34081
acccgggtgc cgcgttcgtg accgtgccgc agctcgatca gcaccatcag ctcgggcagg
tgggcccacg gcgcaagcac tggcacggcg tcgagctagt cgtggtagtc gagcccgtcc
<.............................msc33.............................<
v r t
g r e h
g h r
l e i
l v m l
e p l
34141
gagatctgat gctcgctcgc gagcgtcttc tccagcgact ggttgagctg accgaccatc
ctctagacta cgagcgagcg ctcgcagaag aggtcgctga ccaactcgac tggctggtag
<.............................msc33.............................<
s i q
h e s a
l t k
e l s
q n l q
g v m
356
Anhang
34201
agcgtcatcc gacgccacag gtcgaactca ccgggacgcc ctccacggtc atcggccgcc
tcgcagtagg ctgcggtgtc cagcttgagt ggccctgcgg gaggtgccag tagccggcgg
<.............................msc33.............................<
l t m
r r w l
d f e
g p r
g g r d
d a a
34261
atgtccgcct ccccttcgct cactccccct ccactataac caactccatg cataaaccat
tacaggcgga ggggaagcga gtgaggggga ggtgatattg gttgaggtac gtatttggta
<< msc33
m
34321
gtctatgcat gcatttttca agcgctttcc ctcacagcct gccccattgg accggccatc
cagatacgta cgtaaaaagt tcgcgaaagg gagtgtcgga cggggtaacc tggccggtag
34381
agcaaggcag acagagatct gtccgaaaat tagatgcagg cgcctgcatt tactcgtagg
tcgttccgtc tgtctctaga caggctttta atctacgtcc gcggacgtaa atgagcatcc
34441
gtgagggacg cacagagcgc ggcgtcgttc cgcgcccgtc cccgactgca tcgaccccag
cactccctgc gtgtctcgcg ccgcagcaag gcgcgggcag gggctgacgt agctggggtc
34501
gcggtacgca tgacacgcgg aactcccgaa tcgtccacgg cacccgatac gacacccgac
cgccatgcgt actgtgcgcc ttgagggctt agcaggtgcc gtgggctatg ctgtgggctg
>>.......................msc34.........................>
m t r
g t p e
s s t
a p d
t t p d
34561
ccctcgcaga ccgctccagc ggcggcggag agcgccgccg aggtgaacga caaactcgac
gggagcgtct ggcgaggtcg ccgccgcctc tcgcggcggc tccacttgct gtttgagctg
>.............................msc34.............................>
p s q
t a p
a a a e
s a a
e v n
d k l d
34621
ccggccttca tgcgcatggc gggtgtcctg ctgctcgcgc tgctgatggc actgctcgac
ggccggaagt acgcgtaccg cccacaggac gacgagcgcg acgactaccg tgacgagctg
>.............................msc34.............................>
p a f
m r m
a g v l
l l a
l l m
a l l d
34681
gagacgatcg tcaacgtcgg cgtgaagacg ctcagcggcg agttcggctc gccgctcgcg
ctctgctagc agttgcagcc gcacttctgc gagtcgccgc tcaagccgag cggcgagcgc
>.............................msc34.............................>
e t i
v n v
g v k t
l s g
e f g
s p l a
34741
accgtccagt gggtgaccgc cggctatctg ctcgccgtcg ccgtcgccac accgttcgcg
tggcaggtca cccactggcg gccgatagac gagcggcagc ggcagcggtg tggcaagcgc
>.............................msc34.............................>
t v q
w v t
a g y l
l a v
a v a
t p f a
34801
ggctgggccg tcgaccgctt cggcggccgc acgatgtggc tcgccgccgt ctccctgttc
ccgacccggc agctggcgaa gccgccggcg tgctacaccg agcggcggca gagggacaag
>.............................msc34.............................>
g w a
v d r
f g g r
t m w
l a a
v s l f
34861
gtactcggct cggtactgtc gggcttcgcc tggtccatcg agtcgctgat cgcgttccgg
catgagccga gccatgacag cccgaagcgg accaggtagc tcagcgacta gcgcaaggcc
>.............................msc34.............................>
v l g
s v l
s g f a
w s i
e s l
i a f r
34921
gtgctccagg gcctcggtgg cggcatgatc gtccccgtcg tgcagagcgt cctcgccacg
cacgaggtcc cggagccacc gccgtactag caggggcagc acgtctcgca ggagcggtgc
>.............................msc34.............................>
v l q
g l g
g g m i
v p v
v q s
v l a t
Anhang
357
34981
accgcgggcc ccgcgcgcgt cgccaaggcc atggcactga tctcgctgcc cctcaccctc
tggcgcccgg ggcgcgcgca gcggttccgg taccgtgact agagcgacgg ggagtgggag
>.............................msc34.............................>
t a g
p a r
v a k a
m a l
i s l
p l t l
35041
ggcccgatcc tcggccccgt cctcggcggt gtcctcgtgg acgccgtgag ctggcgctgg
ccgggctagg agccggggca ggagccgcca caggagcacc tgcggcactc gaccgcgacc
>.............................msc34.............................>
g p i
l g p
v l g g
v l v
d a v
s w r w
35101
atgttcctga tcaacctgcc catcggtctg gtcgccctgc tgctcgcact gcgcaccctg
tacaaggact agttggacgg gtagccagac cagcgggacg acgagcgtga cgcgtgggac
>.............................msc34.............................>
m f l
i n l
p i g l
v a l
l l a
l r t l
35161
cccgccgacc agcacgccgg ccgccccgag gagcgtctgg acgtcctcgg cctggcgctg
gggcggctgg tcgtgcggcc ggcggggctc ctcgcagacc tgcaggagcc ggaccgcgac
>.............................msc34.............................>
p a d
q h a
g r p e
e r l
d v l
g l a l
35221
ctctcccccg ggttcgcggc cttggtctac ggcttcacga cggccgcgca ctccggtgac
gagagggggc ccaagcgccg gaaccagatg ccgaagtgct gccggcgcgt gaggccactg
>.............................msc34.............................>
l s p
g f a
a l v y
g f t
t a a
h s g d
35281
gcgtcgtcac cgaaggtgct cgtcgccttc ggcgccggtg tgctcctgct cgtcggatac
cgcagcagtg gcttccacga gcagcggaag ccgcggccac acgaggacga gcagcctatg
>.............................msc34.............................>
a s s
p k v
l v a f
g a g
v l l
l v g y
35341
gcggtgcacg ccctgcgcac ctcggtcaca ccgctcatcg acctgcgcat gttcggcaag
cgccacgtgc gggacgcgtg gagccagtgt ggcgagtagc tggacgcgta caagccgttc
>.............................msc34.............................>
a v h
a l r
t s v t
p l i
d l r
m f g k
35401
cgcggcttca ccatggccgt cgtcacgatg ttcttcgtgg gcgccgtcgc caacgccctg
gcgccgaagt ggtaccggca gcagtgctac aagaagcacc cgcggcagcg gttgcgggac
>.............................msc34.............................>
r g f
t m a
v v t m
f f v
g a v
a n a l
35461
ctgctcctga ccccgctgta ctaccagcag tcccgcgggt tcggcgccct gcacgccggt
gacgaggact ggggcgacat gatggtcgtc agggcgccca agccgcggga cgtgcggcca
>.............................msc34.............................>
l l l
t p l
y y q q
s r g
f g a
l h a g
35521
ctgctgctga tcccctccgg catcctcggc gccgccggcg cgatcacctc cggcaagacg
gacgacgact aggggaggcc gtaggagccg cggcggccgc gctagtggag gccgttctgc
>.............................msc34.............................>
l l l
i p s
g i l g
a a g
a i t
s g k t
35581
gcgagcaagg tcaccgcgcg gctcacctcc acggtcggca tgctcgtcac cgcactcggc
cgctcgttcc agtggcgcgc cgagtggagg tgccagccgt acgagcagtg gcgtgagccg
>.............................msc34.............................>
a s k
v t a
r l t s
t v g
m l v
t a l g
35641
gcgctcgcct tctcccagat cggctcgggc acgaacaccg cgttgctctc cgtcgccttc
cgcgagcgga agagggtcta gccgagcccg tgcttgtggc gcaacgagag gcagcggaag
>.............................msc34.............................>
a l a
f s q
i g s g
t n t
a l l
s v a f
358
Anhang
35701
ggcctcaccg gctacggcat cgggctgacc gcgcccggca ccatggcctt catgtacagg
ccggagtggc cgatgccgta gcccgactgg cgcgggccgt ggtaccggaa gtacatgtcc
>.............................msc34.............................>
g l t
g y g
i g l t
a p g
t m a
f m y r
35761
gcggtcggcg aggccgccgc ggcgcgggcc accagcgcgc tgttcatctt caaccagatc
cgccagccgc tccggcggcg ccgcgcccgg tggtcgcgcg acaagtagaa gttggtctag
>.............................msc34.............................>
a v g
e a a
a a r a
t s a
l f i
f n q i
35821
ggcggcgcgc tcggcatcgc ggtcatcgcg atcaccctgc aggagcggct cggcacatcc
ccgccgcgcg agccgtagcg ccagtagcgc tagtgggacg tcctcgccga gccgtgtagg
>.............................msc34.............................>
g g a
l g i
a v i a
i t l
q e r
l g t s
35881
ggcgagcacc ccgcgggggc gtacggcggc tcgtactggg tcatcatcgc cttcagtctg
ccgctcgtgg ggcgcccccg catgccgccg agcatgaccc agtagtagcg gaagtcagac
>.............................msc34.............................>
g e h
p a g
a y g g
s y w
v i i
a f s l
35941
atcgctgccc tcgcggccct cgccctcccc ggctccttcc gcgcggaagc acccccggag
tagcgacggg agcgccggga gcgggagggg ccgaggaagg cgcgccttcg tgggggcctc
>.............................msc34.............................>
i a a
l a a
l a l p
g s f
r a e
a p p e
36001
cagcccacgg gggacaaggg cgccctcccg caatccaccc cggcctgacc gccgcgcccc
gtcgggtgcc ccctgttccc gcgggagggc gttaggtggg gccggactgg cggcgcgggg
>......................msc34......................>>
q p t
g d k
g a l p
q s t
p a -
36061
cggcaccggc ccgcccctca tcgccccggg gggcgggccg acgtctttcc gtccgccggg
gccgtggccg ggcggggagt agcggggccc cccgcccggc tgcagaaagg caggcggccc
36121
ccgacggcgg cacccggcat ccgctcggcc cgccccatgg ccgctggacc aggaatccag
ggctgccgcc gtgggccgta ggcgagccgg gcggggtacc ggcgacctgg tccttaggtc
36181
cgctccctcc tatacctggg agaacccacc gcacccgtct gcccgcgagg aaaacgttga
gcgagggagg atatggaccc tcttgggtgg cgtgggcaga cgggcgctcc ttttgcaact
36241
aggctctggt caccaccgcc gtggatccgc tcaccgtcga gctgcggtcc gtactcgacc
tccgagacca gtggtggcgg cacctaggcg agtggcagct cgacgccagg catgagctgg
>>.................msc35..................>
v d p
l t v
e l r s
v l d
36301
cccgcccccg tccggacgag gcactggtcg aggtccatgc gacggccctg aacagggccg
gggcgggggc aggcctgctc cgtgaccagc tccaggtacg ctgccgggac ttgtcccggc
>.............................msc35.............................>
p r p
r p d e
a l v
e v h
a t a l
n r a
36361
atctcctcct cgcggttcgc cgtccgatcg gttcctccct ggggctggac gtcgtcggca
tagaggagga gcgccaagcg gcaggctagc caaggaggga ccccgacctg cagcagccgt
>.............................msc35.............................>
d l l
l a v r
r p i
g s s
l g l d
v v g
36421
cggtcctgcg ccccgcgtcc gacggcagcg gcccacccgc gggcgcccgt gtgacgggcc
gccaggacgc ggggcgcagg ctgccgtcgc cgggtgggcg cccgcgggca cactgcccgg
>.............................msc35.............................>
t v l
r p a s
d g s
g p p
a g a r
v t g
Anhang
359
36481
tggcggagaa cagcgcctgg gcggagctgg ccgcggtgcg caccgaccgc ctggcggtca
accgcctctt gtcgcggacc cgcctcgacc ggcgccacgc gtggctggcg gaccgccagt
>.............................msc35.............................>
l a e
n s a w
a e l
a a v
r t d r
l a v
36541
tcccggacgg cgtcaccgac accgacgcgg ccaccctccc cgtcgccggc ctcaccgccc
agggcctgcc gcagtggctg tggctgcgcc ggtgggaggg gcagcggccg gagtggcggg
>.............................msc35.............................>
i p d
g v t d
t d a
a t l
p v a g
l t a
36601
tctacgcact gaggaaggcc ggctggctcc tgggcaggcg caccctcgtc accggggcca
agatgcgtga ctccttccgg ccgaccgagg acccgtccgc gtgggagcag tggccccggt
>.............................msc35.............................>
l y a
l r k a
g w l
l g r
r t l v
t g a
36661
gcggcggcgt cggccgtgtg gccgtacaac tggcccgcgc gggcggcagc gaggtgatcg
cgccgccgca gccggcacac cggcatgttg accgggcgcg cccgccgtcg ctccactagc
>.............................msc35.............................>
s g g
v g r v
a v q
l a r
a g g s
e v i
36721
cctgggtcgg ttccccggcc cgcggcaagg ggctcgccga cttcggcgcc gacgtcgtcg
ggacccagcc aaggggccgg gcgccgttcc ccgagcggct gaagccgcgg ctgcagcagc
>.............................msc35.............................>
a w v
g s p a
r g k
g l a
d f g a
d v v
36781
ccggctacga cgagcctccc accacccccg tcgacatcct cgtcgacagt gtcggcggcg
ggccgatgct gctcggaggg tggtgggggc agctgtagga gcagctgtca cagccgccgc
>.............................msc35.............................>
a g y
d e p p
t t p
v d i
l v d s
v g g
36841
aggtgttcag caccggctac cggctcctgc gccgcggcgg cgtggcgacc gtcttcggca
tccacaagtc gtggccgatg gccgaggacg cggcgccgcc gcaccgctgg cagaagccgt
>.............................msc35.............................>
e v f
s t g y
r l l
r r g
g v a t
v f g
36901
acacggtccg cgccgagctg cgcctgcccg ccgactgggg ccacgcacgc ccgggcgtgc
tgtgccaggc gcggctcgac gcggacgggc ggctgacccc ggtgcgtgcg ggcccgcacg
>.............................msc35.............................>
n t v
r a e l
r l p
a d w
g h a r
p g v
36961
gcatcgagta cctgttcctg ctcgatgagg tcacccggcg cgacgtaccg gcggacctgt
cgtagctcat ggacaaggac gagctactcc agtgggccgc gctgcatggc cgcctggaca
>.............................msc35.............................>
r i e
y l f l
l d e
v t r
r d v p
a d l
37021
ctctcctgct cgcgctggtc gccgccggaa ggctggtggc ggagcccggc ctgctgatgc
gagaggacga gcgcgaccag cggcggcctt ccgaccaccg cctcgggccg gacgactacg
>.............................msc35.............................>
s l l
l a l v
a a g
r l v
a e p g
l l m
37081
cctggaccag cccgcagcgc gcgatcgacg ccctgtactc ccgcgagatc aacggcaagg
ggacctggtc gggcgtcgcg cgctagctgc gggacatgag ggcgctctag ttgccgttcc
>.............................msc35.............................>
p w t
s p q r
a i d
a l y
s r e i
n g k
37141
tcgtcctgtc catgtgaccc cgggcgcccg tagtgcgccg tacccgcgaa gcccacttcc
agcaggacag gtacactggg gcccgcgggc atcacgcggc atgggcgctt cgggtgaagg
>.....msc35.....>>
v v l
s m -
360
Anhang
37201
ctcaccgcac cgcgaggttc ccatgcgact gatcagctat gacgagcacg gctcccccga
gagtggcgtg gcgctccaag ggtacgctga ctagtcgata ctgctcgtgc cgagggggct
>>................msc36.................>
m r
l i s y
d e h
g s p
37261
cgtcctgcgc gtcgaggacg tccccgtgcc cacccccggc cccggtcagc tgttgctgcg
gcaggacgcg cagctcctgc aggggcacgg gtgggggccg gggccagtcg acaacgacgc
>.............................msc36.............................>
d v l r
v e d
v p v
p t p g
p g q
l l l
37321
caccgaggcc gtcggtgtca atttcatcga gacacaactg cgcggcggca ccgccccgtt
gtggctccgg cagccacagt taaagtagct ctgtgttgac gcgccgccgt ggcggggcaa
>.............................msc36.............................>
r t e a
v g v
n f i
e t q l
r g g
t a p
37381
cccctccccg ctgcccggcc gccccggtgg cgacgtggtg ggccgggtcg aggcgctcgg
ggggaggggc gacgggccgg cggggccacc gctgcaccac ccggcccagc tccgcgagcc
>.............................msc36.............................>
f p s p
l p g
r p g
g d v v
g r v
e a l
37441
tccggacacc gagggccccg cgcccggcac ccgggtcgtg gcgtacggcg tgcccgccgc
aggcctgtgg ctcccggggc gcgggccgtg ggcccagcac cgcatgccgc acgggcggcg
>.............................msc36.............................>
g p d t
e g p
a p g
t r v v
a y g
v p a
37501
gtacgcggac gaggtcgtcg tcgacgccga gcgcctcgtc gtcgtccccg cggacctcga
catgcgcctg ctccagcagc agctgcggct cgcggagcag cagcaggggc gcctggagct
>.............................msc36.............................>
a y a d
e v v
v d a
e r l v
v v p
a d l
37561
cgcggccacc gcgaccgcgc tcggttccac cgcgcagacc gcctggagcg tcctcgacgc
gcgccggtgg cgctggcgcg agccaaggtg gcgcgtctgg cggacctcgc aggagctgcg
>.............................msc36.............................>
d a a t
a t a
l g s
t a q t
a w s
v l d
37621
ggcccgggtc gtgaagggcg acacggtgct cgtgcacgcc gcggccggcg cgatcggcca
ccgggcccag cacttcccgc tgtgccacga gcacgtgcgg cgccggccgc gctagccggt
>.............................msc36.............................>
a a r v
v k g
d t v
l v h a
a a g
a i g
37681
tctcgtcacc cagctcgcga aggcgcgagg cgcgggccgg gtgatcggca cggtcggctc
agagcagtgg gtcgagcgct tccgcgctcc gcgcccggcc cactagccgt gccagccgag
>.............................msc36.............................>
h l v t
q l a
k a r
g a g r
v i g
t v g
37741
gcccgccaag gcggacttcg tccgcgcgca cggcgccgac gacgtcgtcg actaccggca
cgggcggttc cgcctgaagc aggcgcgcgt gccgcggctg ctgcagcagc tgatggccgt
>.............................msc36.............................>
s p a k
a d f
v r a
h g a d
d v v
d y r
37801
gcccgactgg gcggacaagg tccgccgact caccggcggg cagggcgtcg acgtggtcct
cgggctgacc cgcctgttcc aggcggctga gtggccgccc gtcccgcagc tgcaccagga
>.............................msc36.............................>
q p d w
a d k
v r r
l t g g
q g v
d v v
37861
cgacagcgtc gagggcgcgg tgttcaagga cgggctgaag ctgctcaggc cgtacgggag
gctgtcgcag ctcccgcgcc acaagttcct gcccgacttc gacgagtccg gcatgccctc
>.............................msc36.............................>
l d s v
e g a
v f k
d g l k
l l r
p y g
Anhang
361
37921
actcgtctac tacggcttcg cgggcgccga cggcgaggtc gcgaaagtgg cgatgaccga
tgagcagatg atgccgaagc gcccgcggct gccgctccag cgctttcacc gctactggct
>.............................msc36.............................>
r l v y
y g f
a g a
d g e v
a k v
a m t
37981
actcctcggt ctcacgtacg tggtgggcac ctcgctcgac gcctgggcga aggcggaccc
tgaggagcca gagtgcatgc accacccgtg gagcgagctg cggacccgct tccgcctggg
>.............................msc36.............................>
e l l g
l t y
v v g
t s l d
a w a
k a d
38041
ggtccgggtg acggaggcac gcgcggagct cgtccggctg gtcacgtcgg gcggactgcg
ccaggcccac tgcctccgtg cgcgcctcga gcaggccgac cagtgcagcc cgcctgacgc
>.............................msc36.............................>
p v r v
t e a
r a e
l v r l
v t s
g g l
38101
ggtcgccgtg cacaccacgc tgccgctgac cgaggcggcc gaggcccacc gggtcatcga
ccagcggcac gtgtggtgcg acggcgactg gctccgccgg ctccgggtgg cccagtagct
>.............................msc36.............................>
r v a v
h t t
l p l
t e a a
e a h
r v i
38161
gagccgtacc cagctgggcc gtgtcgtcct cgtcccctga tccgcgggag cccgtcacca
ctcggcatgg gtcgacccgg cacagcagga gcaggggact aggcgccctc gggcagtggt
>..................msc36.................>>
e s r t
q l g
r v v
l v p -
38221
tgacccagag agcgcgacgg ccggatccgg ccgccccacc gacacccgta cccgcacccg
actgggtctc tcgcgctgcc ggcctaggcc ggcggggtgg ctgtgggcat gggcgtgggc
38281
cacccgcgcc cgcgcccgcg cccgcgcccg acgaaaccgt gcccgtcctc gtcgccggag
gtgggcgcgg gcgcgggcgc gggcgcgggc tgctttggca cgggcaggag cagcggcctc
>>.......msc37.........>
v p v l
v a g
38341
ccggccccgg cggcctcagc acggccgtct tcctcggcct gcacggcgta cccgcgctgg
ggccggggcc gccggagtcg tgccggcaga aggagccgga cgtgccgcat gggcgcgacc
>.............................msc37.............................>
a g p
g g l s
t a v
f l g
l h g v
p a l
38401
tggtcgagcg ccacccgggc acctcgaccg cggtgaaggc caccggccag tacccgcaca
accagctcgc ggtgggcccg tggagctggc gccacttccg gtggccggtc atgggcgtgt
>.............................msc37.............................>
v v e
r h p g
t s t
a v k
a t g q
y p h
38461
cgatggaggc gctggccatc gccggcgccg ccgggaccgt gcgggagcgc ggtcgcgcgt
gctacctccg cgaccggtag cggccgcggc ggccctggca cgccctcgcg ccagcgcgca
>.............................msc37.............................>
t m e
a l a i
a g a
a g t
v r e r
g r a
38521
accgcagcga cttccacatg gtcgtcgcga agaccctcgc gggtccggtg ctgcgcacgc
tggcgtcgct gaaggtgtac cagcagcgct tctgggagcg cccaggccac gacgcgtgcg
>.............................msc37.............................>
y r s
d f h m
v v a
k t l
a g p v
l r t
38581
tgatgagcgg cgaccagctg agcatgcgcc atgtgtcccc ggaggactgg ggcaccgcga
actactcgcc gctggtcgac tcgtacgcgg tacacagggg cctcctgacc ccgtggcgct
>.............................msc37.............................>
l m s
g d q l
s m r
h v s
p e d w
g t a
362
Anhang
38641
gccagtccgc cgtggagagc gtgctcgccg accgggcggc ggaactcggc tcgcggctgc
cggtcaggcg gcacctctcg cacgagcggc tggcccgccg ccttgagccg agcgccgacg
>.............................msc37.............................>
s q s
a v e s
v l a
d r a
a e l g
s r l
38701
gcttctcgac ccggctgaca tcgctcaccc aggacgccga cggggtcacc gcggtcaccc
cgaagagctg ggccgactgt agcgagtggg tcctgcggct gccccagtgg cgccagtggg
>.............................msc37.............................>
r f s
t r l t
s l t
q d a
d g v t
a v t
38761
agcacaccgg gaccggcgag cgacgggtga tccgggcgcg gtacctggtg gtggcggacg
tcgtgtggcc ctggccgctc gctgcccact aggcccgcgc catggaccac caccgcctgc
>.............................msc37.............................>
q h t
g t g e
r r v
i r a
r y l v
v a d
38821
gctggcgcag cggcatccgc cagtccctcg gcatcgagat gcgcggccgt ggcacggtcg
cgaccgcgtc gccgtaggcg gtcagggagc cgtagctcta cgcgccggca ccgtgccagc
>.............................msc37.............................>
g w r
s g i r
q s l
g i e
m r g r
g t v
38881
ggaaggtgct gcgcgtcctg ttcgaggccg atctgagcga gcccctgtcg cacacggacg
ccttccacga cgcgcaggac aagctccggc tagactcgct cggggacagc gtgtgcctgc
>.............................msc37.............................>
g k v
l r v l
f e a
d l s
e p l s
h t d
38941
gcgcggcgga cggccgccgg ttcaccgcgc tgcatgtggg ccgcgcggtc ctgttcaaca
cgcgccgcct gccggcggcc aagtggcgcg acgtacaccc ggcgcgccag gacaagttgt
>.............................msc37.............................>
g a a
d g r r
f t a
l h v
g r a v
l f n
39001
ccgagatccc agggctgtac gggtacttcc gcaacctcac gcccgaactg ccggacggct
ggctctaggg tcccgacatg cccatgaagg cgttggagtg cgggcttgac ggcctgccga
>.............................msc37.............................>
t e i
p g l y
g y f
r n l
t p e l
p d g
39061
ggtggacgaa cgaggacacc gtcgccgcgc agatccgctc cgacctcggc atcccggaca
ccacctgctt gctcctgtgg cagcggcgcg tctaggcgag gctggagccg tagggcctgt
>.............................msc37.............................>
w w t
n e d t
v a a
q i r
s d l g
i p d
39121
tcccgctgaa gatcgaggag atcagcgaga cggagatctc ctgcggggtc gccgaacgct
agggcgactt ctagctcctc tagtcgctct gcctctagag gacgccccag cggcttgcga
>.............................msc37.............................>
i p l
k i e e
i s e
t e i
s c g v
a e r
39181
tccgcgaggg ccgtgcgctg ctcgtgggcg acgccgcgca cgtgatgccg ccgaccggcg
aggcgctccc ggcacgcgac gagcacccgc tgcggcgcgt gcactacggc ggctggccgc
>.............................msc37.............................>
f r e
g r a l
l v g
d a a
h v m p
p t g
39241
gtatgggcgg caacaccgcc tatctggacg ggctgtacct gggctggaag ctcgcggccg
catacccgcc gttgtggcgg atagacctgc ccgacatgga cccgaccttc gagcgccggc
>.............................msc37.............................>
g m g
g n t a
y l d
g l y
l g w k
l a a
39301
tgctgcgggg gacggcgggc gaggctctgc tcgacagtca cgacgccgaa cgccgtccgt
acgacgcccc ctgccgcccg ctccgagacg agctgtcagt gctgcggctt gcggcaggca
>.............................msc37.............................>
v l r
g t a g
e a l
l d s
h d a e
r r p
Anhang
363
39361
acgccgagga gttggtggag cagcagttcg cgaacctggt ggaccgcatc tcgcccgaac
tgcggctcct caaccacctc gtcgtcaagc gcttggacca cctggcgtag agcgggcttg
>.............................msc37.............................>
y a e
e l v e
q q f
a n l
v d r i
s p e
39421
tcgcggacga gtcgctggcc gtggcgctgc cgccaccggt cgtcgcgttc ggctaccgct
agcgcctgct cagcgaccgg caccgcgacg gcggtggcca gcagcgcaag ccgatggcga
>.............................msc37.............................>
l a d
e s l a
v a l
p p p
v v a f
g y r
39481
ttcccaaggg ggccgtactc ctcgaacctg acgacgacgg cgaactgttc gaggacccgt
aagggttccc ccggcatgag gagcttggac tgctgctgcc gcttgacaag ctcctgggca
>.............................msc37.............................>
f p k
g a v l
l e p
d d d
g e l f
e d p
39541
cccggcccac cggccggccc ggctcccacg ccccgtacgt ccctctcacc cggagggacg
gggccgggtg gccggccggg ccgagggtgc ggggcatgca gggagagtgg gcctccctgc
>.............................msc37.............................>
s r p
t g r p
g s h
a p y
v p l t
r r d
39601
gctccgccac ctcgacgacc gccctcttcg gtcacgcgtt cgtgctgctc accggaccgg
cgaggcggtg gagctgctgg cgggagaagc cagtgcgcaa gcacgacgag tggcctggcc
>.............................msc37.............................>
g s a
t s t t
a l f
g h a
f v l l
t g p
39661
acggcgccgc gtgggccgag ggcgcactcg cctcggcgga cgcgctcggc gtcgccgtcc
tgccgcggcg cacccggctc ccgcgtgagc ggagccgcct gcgcgagccg cagcggcagg
>.............................msc37.............................>
d g a
a w a e
g a l
a s a
d a l g
v a v
39721
aggtgcaccg ggtcggtccc ggctccgaac tgctcgatgc ggaaggagcg ttctccaccg
tccacgtggc ccagccaggg ccgaggcttg acgagctacg ccttcctcgc aagaggtggc
>.............................msc37.............................>
q v h
r v g p
g s e
l l d
a e g a
f s t
39781
cgtacggcat cggtgccgac ggggccgcgc tggtgcggcc cgaccggttc gtggcgtggc
gcatgccgta gccacggctg ccccggcgcg accacgccgg gctggccaag caccgcaccg
>.............................msc37.............................>
a y g
i g a d
g a a
l v r
p d r f
v a w
39841
ggtgcaccgg gacgcatccg gacccggccg ccgagatcga acgcgccctg cggcacgtgc
ccacgtggcc ctgcgtaggc ctgggccggc ggctctagct tgcgcgggac gccgtgcacg
>.............................msc37.............................>
r c t
g t h p
d p a
a e i
e r a l
r h v
39901
tgcaccggcc cgcgcactga acagcccgca gggcatcccg cacctccccg aacgtcatgg
acgtggccgg gcgcgtgact tgtcgggcgt cccgtagggc gtggaggggc ttgcagtacc
>.......msc37......>>
l h r
p a h -
39961
cgaaaggatc cgcaatggca gtggcacaag cagccgctca gcaggagaac gcgaaggccg
gctttcctag gcgttaccgt caccgtgttc gtcggcgagt cgtcctcttg cgcttccggc
>>.................msc38..................>
v a q
a a a
q q e n
a k a
40021
gacagcggcg ggtggccctg gtcaccggga gcacgagcgg catcggcctc gccgtcgccg
ctgtcgccgc ccaccgggac cagtggccct cgtgctcgcc gtagccggag cggcagcggc
>.............................msc38.............................>
g q r
r v a l
v t g
s t s
g i g l
a v a
364
Anhang
40081
aactgctcgc cgagcggggg catgcggtgt tcctgtgcgg ccgggacggt gagacggtcg
ttgacgagcg gctcgccccc gtacgccaca aggacacgcc ggccctgcca ctctgccagc
>.............................msc38.............................>
e l l
a e r g
h a v
f l c
g r d g
e t v
40141
ccaccgtcgt ggacaagctg cgcggccgcg gcttcgaggc ggacggagtc gccgccgacg
ggtggcagca cctgttcgac gcgccggcgc cgaagctccg cctgcctcag cggcggctgc
>.............................msc38.............................>
a t v
v d k l
r g r
g f e
a d g v
a a d
40201
tcacgtcgaa gccggacgtc cagcgcctgg tccgctccgc ggtggaccgc ttcggacccc
agtgcagctt cggcctgcag gtcgcggacc aggcgaggcg ccacctggcg aagcctgggg
>.............................msc38.............................>
v t s
k p d v
q r l
v r s
a v d r
f g p
40261
tccacgtcct tgtcaacaac gcggggcgcg gcgggggcgg ggtgaccgcc gaactccccg
aggtgcagga acagttgttg cgccccgcgc cgcccccgcc ccactggcgg cttgaggggc
>.............................msc38.............................>
l h v
l v n n
a g r
g g g
g v t a
e l p
40321
acgagctgtg ggaggcggtc atcgagacca atctcaacag cgtcttccgc atcacccgcg
tgctcgacac cctccgccag tagctctggt tagagttgtc gcagaaggcg tagtgggcgc
>.............................msc38.............................>
d e l
w e a v
i e t
n l n
s v f r
i t r
40381
aggtgctgtc gcagggtggc atgctggcac gcggccacgg ccgcatcatc aacatcgcct
tccacgacag cgtcccaccg tacgaccgtg cgccggtgcc ggcgtagtag ttgtagcgga
>.............................msc38.............................>
e v l
s q g g
m l a
r g h
g r i i
n i a
40441
ccaccggcgg caagcagggc gtcgaactgg ccgccccgta ctccgcgtcg aagcacggcg
ggtggccgcc gttcgtcccg cagcttgacc ggcggggcat gaggcgcagc ttcgtgccgc
>.............................msc38.............................>
s t g
g k q g
v e l
a a p
y s a s
k h g
40501
tcatcggctt cacgaaggcg ctcggcaagg aactcgccca gtccggcatc accgtgaacg
agtagccgaa gtgcttccgc gagccgttcc ttgagcgggt caggccgtag tggcacttgc
>.............................msc38.............................>
v i g
f t k a
l g k
e l a
q s g i
t v n
40561
ccgtgtgccc cggctatgtg gagacgccga tggcggcccg ggtacgtcag ggctacgcgg
ggcacacggg gccgatacac ctctgcggct accgccgggc ccatgcagtc ccgatgcgcc
>.............................msc38.............................>
a v c
p g y v
e t p
m a a
r v r q
g y a
40621
cgcactgggg caccacggag gacgaggtgc tgacgaagtt ccaggcgaag atccctctcg
gcgtgacccc gtggtgcctc ctgctccacg actgcttcaa ggtccgcttc tagggagagc
>.............................msc38.............................>
a h w
g t t e
d e v
l t k
f q a k
i p l
40681
gccgttactc gaccccggag gaggtcgcgg gcctcgtcgg ctacctcgcc gacgacctcg
cggcaatgag ctggggcctc ctccagcgcc cggagcagcc gatggagcgg ctgctggagc
>.............................msc38.............................>
g r y
s t p e
e v a
g l v
g y l a
d d l
40741
ccgcctccat cacggctcag gccatgaacg tgtgcggtgg tctgggcaac tactgacggt
ggcggaggta gtgccgagtc cggtacttgc acacgccacc agacccgttg atgactgcca
>...........................msc38..........................>>
a a s
i t a q
a m n
v c g
g l g n
y -
Anhang
365
40801
ggccggccca tgaggccccc agtccaggag cgcccgcccc cgacatcctg ggcgcggtct
ccggccgggt actccggggg tcaggtcctc gcgggcgggg gctgtaggac ccgcgccaga
>>.......................msc40.........................>
m r p
p v q e
r p p
p t s
w a r s
40861
ccggatgccg gtgcgcgccc ccggcagaga cgagaatcca tgatcaggta ctacacggcg
ggcctacggc cacgcgcggg ggccgtctct gctcttaggt actagtccat gatgtgccgc
>.............................msc40.............................>
p d a
g a r
p r q r
r e s
m i r
y y t a
40921
gaccggctga tcaccggtga tcgcggcaga tgcatccggt acggcggagt gctcgtggac
ctggccgact agtggccact agcgccgtct acgtaggcca tgccgcctca cgagcacctg
>.............................msc40.............................>
d r l
i t g
d r g r
c i r
y g g
v l v d
40981
ggggagctga tccgctgggt ggggccctcc cacgaggtgc cgtggcggct gcgtcggcgg
cccctcgact aggcgaccca ccccgggagg gtgctccacg gcaccgccga cgcagccgcc
>.............................msc40.............................>
g e l
i r w
v g p s
h e v
p w r
l r r r
41041
agtgagcatg tggatctcgg tccgctcacg ctgctgcccg ggctcatcga cagccatgtc
tcactcgtac acctagagcc aggcgagtgc gacgacgggc ccgagtagct gtcggtacag
>.............................msc40.............................>
s e h
v d l
g p l t
l l p
g l i
d s h v
41101
catctggcac tggacggcgc gcccggcgcc atggaccgga tgcggtcggc ctcacccgcg
gtagaccgtg acctgccgcg cgggccgcgg tacctggcct acgccagccg gagtgggcgc
>.............................msc40.............................>
h l a
l d g
a p g a
m d r
m r s
a s p a
41161
gagctgtacg cgctgatgct gcgcaacgcg ggcgcgttgc tgtccgcggg cgtgaccacc
ctcgacatgc gcgactacga cgcgttgcgc ccgcgcaacg acaggcgccc gcactggtgg
>.............................msc40.............................>
e l y
a l m
l r n a
g a l
l s a
g v t t
41221
gcccgggacc tcggcgcacc cgggagtctc ggtgtacgcg tccgcgacgc cgtccgctcg
cgggccctgg agccgcgtgg gccctcagag ccacatgcgc aggcgctgcg gcaggcgagc
>.............................msc40.............................>
a r d
l g a
p g s l
g v r
v r d
a v r s
41281
ggcctcgctc ccgggccggc actggtcgtg tcgggagcgc cgctgaccgt accggacgga
ccggagcgag ggcccggccg tgaccagcac agccctcgcg gcgactggca tggcctgcct
>.............................msc40.............................>
g l a
p g p
a l v v
s g a
p l t
v p d g
41341
cactgctggt tcatgggcgg tgcccacgtc ggtgaacagg cgctgcggca ggcggtacgg
gtgacgacca agtacccgcc acgggtgcag ccacttgtcc gcgacgccgt ccgccatgcc
>.............................msc40.............................>
h c w
f m g
g a h v
g e q
a l r
q a v r
41401
gaacagaccg gagccggtgt cgacctcatc aaggtcatgg ccaccggcgg agcactcacg
cttgtctggc ctcggccaca gctggagtag ttccagtacc ggtggccgcc tcgtgagtgc
>.............................msc40.............................>
e q t
g a g
v d l i
k v m
a t g
g a l t
41461
cggggttcgg ccttgtccga ggggcagttc acggaccggg agctcgcggc cgtcgtcgac
gccccaagcc ggaacaggct ccccgtcaag tgcctggccc tcgagcgccg gcagcagctg
>.............................msc40.............................>
r g s
a l s
e g q f
t d r
e l a
a v v d
366
Anhang
41521
gaggcggcgc gggcgggtgt ccccgtcgcc gcgcacgcgc acggcacggc gggaatagcg
ctccgccgcg cccgcccaca ggggcagcgg cgcgtgcgcg tgccgtgccg cccttatcgc
>.............................msc40.............................>
e a a
r a g
v p v a
a h a
h g t
a g i a
41581
gcgtccttga gggccggggt gcacaccatc gaacactgca gcttcctcga cccgtccggc
cgcaggaact cccggcccca cgtgtggtag cttgtgacgt cgaaggagct gggcaggccg
>.............................msc40.............................>
a s l
r a g
v h t i
e h c
s f l
d p s g
41641
gcgatcgccc cggatcccgc cctcgtacgc cggctcgccg ccagcggtgt tcacgtgtgt
cgctagcggg gcctagggcg ggagcatgcg gccgagcggc ggtcgccaca agtgcacaca
>.............................msc40.............................>
a i a
p d p
a l v r
r l a
a s g
v h v c
41701
cccaccatca gcgagcgctt caccgaacgc tgggaccggc tcgcccccgg cccgctgccc
gggtggtagt cgctcgcgaa gtggcttgcg accctggccg agcgggggcc gggcgacggg
>.............................msc40.............................>
p t i
s e r
f t e r
w d r
l a p
g p l p
41761
gccctgccga cgctgtaccg gcagggcgtc cccatcgtcg cgggcaccga cgcgggcacc
cgggacggct gcgacatggc cgtcccgcag gggtagcagc gcccgtggct gcgcccgtgg
>.............................msc40.............................>
a l p
t l y
r q g v
p i v
a g t
d a g t
41821
gacggcgcac cgcaccacgc ctacgtccag ggcctgatag ggatggcccg gctcggtctg
ctgccgcgtg gcgtggtgcg gatgcaggtc ccggactatc cctaccgggc cgagccagac
>.............................msc40.............................>
d g a
p h h
a y v q
g l i
g m a
r l g l
41881
ccgcccgcgg agatactgga ggccgccacg tcccgtgcgg cccgcgccct gcgggtcgag
ggcgggcgcc tctatgacct ccggcggtgc agggcacgcc gggcgcggga cgcccagctc
>.............................msc40.............................>
p p a
e i l
e a a t
s r a
a r a
l r v e
41941
accctgaccg gcaggatcgc actcggcctg cgggccgacc tcatcgcggt cgagggcgac
tgggactggc cgtcctagcg tgagccggac gcccggctgg agtagcgcca gctcccgctg
>.............................msc40.............................>
t l t
g r i
a l g l
r a d
l i a
v e g d
42001
ccgctgcacg acgtgtcggc cctacgggac cttcgcctcg tcgtcgccag ggggcaggcc
ggcgacgtgc tgcacagccg ggatgccctg gaagcggagc agcagcggtc ccccgtccgg
>.............................msc40.............................>
p l h
d v s
a l r d
l r l
v v a
r g q a
42061
atccgctcac cgtcccggcc accctgcccc gacgagtcgg tgcagtgagc gagggcggcc
taggcgagtg gcagggccgg tgggacgggg ctgctcagcc acgtcactcg ctcccgccgg
>......................msc40......................>>
i r s
p s r
p p c p
d e s
v q -
42121
ctcgaacatc gtgagaggcc cgagccgtgc cgtgccgtac ccgagcctgg agccgctctc
gagcttgtag cactctccgg gctcggcacg gcacggcatg ggctcggacc tcggcgagag
42181
cggcgcctct ccaccgccac cggcgacgct tcccccatgc atggtgaacc cgaacgactc
gccgcggaga ggtggcggtg gccgctgcga agggggtacg taccacttgg gcttgctgag
42241
acgccccgga catcaccggc cccttcccgg gagcacctcg ccctccggct ggcctgcgcc
tgcggggcct gtagtggccg gggaagggcc ctcgtggagc gggaggccga ccggacgcgg
42301
ctgttcgccc aggacgccgc gtcggccgcc gcccgcctca tggggctgcc cccggatccc
gacaagcggg tcctgcggcg cagccggcgg cgggcggagt accccgacgg gggcctaggg
Anhang
367
42361
gggccgtccc cgtccccgcc ccatgactcc tcgccgtacg cccgtgcgct cggcatcgga
cccggcaggg gcaggggcgg ggtactgagg agcggcatgc gggcacgcga gccgtagcct
42421
gcgcgacgag tcgcctcccg cggttgaccc gcgctccggg acgggagtcc tgaggagcgt
cgcgctgctc agcggagggc gccaactggg cgcgaggccc tgccctcagg actcctcgca
42481
caaacgggcg tcaccacctg ccgaagcggc agccgaccga actggagctc gtcagcgagg
gtttgcccgc agtggtggac ggcttcgccg tcggctggct tgacctcgag cagtcgctcc
42541
accccggccg tagcggcgtg cctcggggcc gtaaggggct ccgttgagcg cggccggccg
tggggccggc atcgccgcac ggagccccgg cattccccga ggcaactcgc gccggccggc
42601
cgaacgtgac gtcatacgtg agcattccgt ccgccgggtg cccgtggtcg acgaaggccg
gcttgcactg cagtatgcac tcgtaaggca ggcggcccac gggcaccagc tgcttccggc
42661
gcaccccgtg ggcatcgtct ccatcggtga cctggccatg gagcgtgact cggagtccgc
cgtggggcac ccgtagcaga ggtagccact ggaccggtac ctcgcactga gcctcaggcg
42721
tctcggcgac atcagcgtcg cgcggcccaa ccggtgacgc tcagggcccg caagctccga
agagccgctg tagtcgcagc gcgccgggtt ggccactgcg agtcccgggc gttcgaggct
42781
cgagccggga cggatctccc ggtcggggac ggcgccgggc gccgtcgggc aggtggctgc
gctcggccct gcctagaggg ccagcccctg ccgcggcccg cggcagcccg tccaccgacg
42841
cggctggcgg gcccaagcgc agcatgcccc cgtcgaccgc tcaggaggcg cccgtgactc
gccgaccgcc cgggttcgcg tcgtacgggg gcagctggcg agtcctccgc gggcactgag
42901
aaggaggcgt cggcccccgc gaggaacgcg atgacagccg cgacctggcg ggcgtccccg
ttcctccgca gccgggggcg ctccttgcgc tactgtcggc gctggaccgc ccgcaggggc
42961
ggccgtccca ctggtgtgcc gggacgccgc tcggtgtcgg cgtcgccgtc cccctggccc
ccggcagggt gaccacacgg ccctgcggcg agccacagcc gcagcggcag ggggaccggg
43021
gtcatcggcg gggtgatctc cccgggggcg acggcgctga cggtgatccc gtgttcggcc
cagtagccgc cccactagag gggcccccgc tgccgcgact gccactaggg cacaagccgg
43081
ggtcgagccc catgactggg tgaccagccc gaggccgccc ctggccgcgc agtacggcgc
ccagctcggg gtactgaccc actggtcggg ctccggcggg gaccggcgcg tcatgccgcg
43141
cgcgcccacg cgcggctggt gttcgtggac gctcgtgaac gatccggcca ccgtcaccct
gcgcgggtgc gcgccgacca caagcacctg cgagcacttg ctaggccggt ggcagtggga
43201
gagcgatcat gcggcgggcg gcacgccggg acctggtctg tagggtggat cgggagaggc
ctcgctagta cgccgcccgc cgtgcggccc tggaccagac atcccaccta gccctctccg
43261
cctgccgcgt cggctgatgt gccggcgatg agatggtggc cgcccgcgct ggagatgttc
ggacggcgca gccgactaca cggccgctac tctaccaccg gcgggcgcga cctctacaag
43321
cttcggagac tgggctccgt cgccccggtg atcatggcac ctaacacggg gccgacggcc
gaagcctctg acccgaggca gcggggccac tagtaccgtg gattgtgccc cggctgccgg
43381
tcacgaagga ttaccggtga gttccgacga cacgcacgac agtgcttccg tcatgcagtg
agtgcttcct aatggccact caaggctgct gtgcgtgctg tcacgaaggc agtacgtcac
>>...................msc39.....................>
v
s s d
d t h d
s a s
v m q
43441
gctgctggag accgagtcac tggagggctt cctgcagtct ctggccgacg cggctctgga
cgacgacctc tggctcagtg acctcccgaa ggacgtcaga gaccggctgc gccgagacct
>.............................msc39.............................>
w l l e
t e s
l e g
f l q s
l a d
a a l
368
Anhang
43501
actgacccgc gccgagggcg ccggggtcac gatcgaacgc gatcaccggc ctctgaccgt
tgactgggcg cggctcccgc ggccccagtg ctagcttgcg ctagtggccg gagactggca
>.............................msc39.............................>
e l t r
a e g
a g v
t i e r
d h r
p l t
43561
ggccagcgcg ggtccgccgg cgctgaagct ggacgagaaa cagtacggcc aggacgacgg
ccggtcgcgc ccaggcggcc gcgacttcga cctgctcttt gtcatgccgg tcctgctgcc
>.............................msc39.............................>
v a s a
g p p
a l k
l d e k
q y g
q d d
43621
cccgtgcctt cggtccgccc gcaccggcga agaggtcgtc gtcgaggaca tgctcaggga
gggcacggaa gccaggcggg cgtggccgct tctccagcag cagctcctgt acgagtccct
>.............................msc39.............................>
g p c l
r s a
r t g
e e v v
v e d
m l r
43681
gacccgctgg ggcaattacc cggcctacgc cgcggcctgc gggatccgct cctcgttctc
ctgggcgacc ccgttaatgg gccggatgcg gcgccggacg ccctaggcga ggagcaagag
>.............................msc39.............................>
e t r w
g n y
p a y
a a a c
g i r
s s f
43741
cctgccgatc tccgcccgca cccacaccac cggcgccctg aacctctacg cgggcccgcc
ggacggctag aggcgggcgt gggtgtggtg gccgcgggac ttggagatgc gcccgggcgg
>.............................msc39.............................>
s l p i
s a r
t h t
t g a l
n l y
a g p
43801
ccacgccttc aaggacgccg atctcagcgc gctgcgctca ctggccgcgc aggccaccgg
ggtgcggaag ttcctgcggc tagagtcgcg cgacgcgagt gaccggcgcg tccggtggcc
>.............................msc39.............................>
p h a f
k d a
d l s
a l r s
l a a
q a t
43861
cgccatcgct ctggctcagc gcatcgccga cgcgcaggag ttcgccgagc agatgcagac
gcggtagcga gaccgagtcg cgtagcggct gcgcgtcctc aagcggctcg tctacgtctg
>.............................msc39.............................>
g a i a
l a q
r i a
d a q e
f a e
q m q
43921
ggcgatgcac tcccgtggcg tcattgacca ggccctcggg gtgatcatgg gccaacggcg
ccgctacgtg agggcaccgc agtaactggt ccgggagccc cactagtacc cggttgccgc
>.............................msc39.............................>
t a m h
s r g
v i d
q a l g
v i m
g q r
43981
ctgcaccgcc gacgaggcct tcgacatcct gcgctccgct tcccagcacc gcaacatcaa
gacgtggcgg ctgctccgga agctgtagga cgcgaggcga agggtcgtgg cgttgtagtt
>.............................msc39.............................>
r c t a
d e a
f d i
l r s a
s q h
r n i
44041
actccgcgac ctgtgcgccg aactgatcac caacctcacc gggcaacccc ccgccggccc
tgaggcgctg gacacgcggc ttgactagtg gttggagtgg cccgttgggg ggcggccggg
>.............................msc39.............................>
k l r d
l c a
e l i
t n l t
g q p
p a g
44101
tgacctgcgc ccccggccgt gaactccccg tatgacaccg cctcgatcac ccttcccgcc
actggacgcg ggggccggca cttgaggggc atactgtggc ggagctagtg ggaagggcgg
>........msc39........>>
p d l r
p r p
-
44161
accgtgccga acgccccggc acctaccggc cgagccgggg agtaccggcc actgaacgca
tggcacggct tgcggggccg tggatggccg gctcggcccc tcatggccgg tgacttgcgt
44221
tgcatggacc ccaccggctc aacggcttcc gcgccacctg cccacctgcc tctcagcagc
acgtacctgg ggtggccgag ttgccgaagg cgcggtggac gggtggacgg agagtcgtcg
Anhang
369
44281
agcgagcacg gtggcacaac cctcccgagt cgggggactt ggcgatcgct cggcgctgcc
tcgctcgtgc caccgtgttg ggagggctca gccccctgaa ccgctagcga gccgcgacgg
44341
cggtggtcag ccggggcgtc gcacgacctg cgtggcactc ctccagaagc cacttgaggt
gccaccagtc ggccccgcag cgtgctggac gcaccgtgag gaggtcttcg gtgaactcca
44401
caccgagggc gcctggcaga tcggcctcga cacgacgcgc gtgcctctcc tggtcgccgg
gtggctcccg cggaccgtct agccggagct gtgctgcgcg cacggagagg accagcggcc
44461
gatcgcccgt ttctcatccc cgtgcagaca gccccgtggg ccctcgaagg gcggcgcacg
ctagcgggca aagagtaggg gcacgtctgt cggggcaccc gggagcttcc cgccgcgtgc
44521
gttcagaggc ggatgatgac gaggggatgt catcggggcc tccgccggcg acgccgagag
caagtctccg cctactactg ctcccctaca gtagccccgg aggcggccgc tgcggctctc
44581
acggcgcggc agcgcgtcgg ccggctgctc gggggcgagg gtggggggcc agggccgtaa
tgccgcgccg tcgcgcagcc ggccgacgag cccccgctcc caccccccgg tcccggcatt
44641
tcatgcgtgc gaggccgatg tcgaggtcct cgcctcggcg ctcgaccaga ccgtcggtgt
agtacgcacg ctccggctac agctccagga gcggagccgc gagctggtct ggcagccaca
44701
acagcacagg ggggtgtcag gaagccgggt gcagtgggta tccgtgcgag tggagcggaa
tgtcgtgtcc ccccacagtc cttcggccca cgtcacccat aggcacgctc acctcgcctt
44761
acggctgtgc gagtggaacg gaaacggctg tcacaacaat gggaggtggc gggcggtgga
tgccgacacg ctcaccttgc ctttgccgac agtgttgtta ccctccaccg cccgccacct
msc41 >>..>
v
44821
ccggcccgat cgcgatcgac acgtactcga catgatcgac tggctcatgg agaccacttc
ggccgggcta gcgctagctg tgcatgagct gtactagctg accgagtacc tctggtgaag
>.............................msc41.............................>
d r p d
r d r
h v l
d m i d
w l m
e t t
44881
ccttcgggag ttcctgcagc acttggtgga cgacgccgtc agcgcctcgg ccgcagacgg
ggaagccctc aaggacgtcg tgaaccacct gctgcggcag tcgcggagcc ggcgtctgcc
>.............................msc41.............................>
s l r e
f l q
h l v
d d a v
s a s
a a d
44941
ctgcggcgtg accgtgcaac ggcggcaccg gccgctgacc gtggtcagca ccggtggggt
gacgccgcac tggcacgttg ccgccgtggc cggcgactgg caccagtcgt ggccacccca
>.............................msc41.............................>
g c g v
t v q
r r h
r p l t
v v s
t g g
45001
ggcggaaaag ctggacgaga aacagtacgg actggacgac ggcccgtgcc ttcactgtct
ccgccttttc gacctgctct ttgtcatgcc tgacctgctg ccgggcacgg aagtgacaga
>.............................msc41.............................>
v a e k
l d e
k q y
g l d d
g p c
l h c
45061
gcgcagcggg ggcagcgtgt atgtgccgga catgctgggt gaggcccgat gggagtcctt
cgcgtcgccc ccgtcgcaca tacacggcct gtacgaccca ctccgggcta ccctcaggaa
>.............................msc41.............................>
l r s g
g s v
y v p
d m l g
e a r
w e s
45121
cccagggttc gcggccgaca tgggtatccg ctcctcgctg tccctgccga tacccgcccg
gggtcccaag cgccggctgt acccataggc gaggagcgac agggacggct atgggcgggc
>.............................msc41.............................>
f p g f
a a d
m g i
r s s l
s l p
i p a
370
Anhang
45181
cacccatacc gcaggggccc tcaatttcta tgccgccggc caggacgcgt tcacggagga
gtgggtatgg cgtccccggg agttaaagat acggcggccg gtcctgcgca agtgcctcct
>.............................msc41.............................>
r t h t
a g a
l n f
y a a g
q d a
f t e
45241
cgaccgaggc aggctcgcgc tgctcgccgc gcaggcaggt ggtgggatcg cgctggcgca
gctggctccg tccgagcgcg acgagcggcg cgtccgtcca ccaccctagc gcgaccgcgt
>.............................msc41.............................>
d d r g
r l a
l l a
a q a g
g g i
a l a
45301
gcggctggcc gacgcggagg acttcagccg cgacctgcag acggcgctcg cctcgcgcag
cgccgaccgg ctgcgcctcc tgaagtcggc gctggacgtc tgccgcgagc ggagcgcgtc
>.............................msc41.............................>
q r l a
d a e
d f s
r d l q
t a l
a s r
45361
cgtcatcgac caggccatcg gcagcgtgat gcaacggcgg cactgcaccg cggaagaggc
gcagtagctg gtccggtagc cgtcgcacta cgttgccgcc gtgacgtggc gccttctccg
>.............................msc41.............................>
s v i d
q a i
g s v
m q r r
h c t
a e e
45421
tttcgacctg ctccgccggc tctcccagga aaccaatctc aagctccggg acgtctgcac
aaagctggac gaggcggccg agagggtcct ttggttagag ttcgaggccc tgcagacgtg
>.............................msc41.............................>
a f d l
l r r
l s q
e t n l
k l r
d v c
45481
gcgtctggtc accggtcttg ccggcgggcc tcccgctccc cggccgccgc tgcgaccccg
cgcagaccag tggccagaac ggccgcccgg agggcgaggg gccggcggcg acgctggggc
>.............................msc41.............................>
t r l v
t g l
a g g
p p a p
r p p
l r p
45541
gccgtgacgt tcgcagccgg aaagtccctg ctgtcccgcc ctgtacgggc ggtgattgtg
cggcactgca agcgtcggcc tttcagggac gacagggcgg gacatgcccg ccactaacac
>....>> msc41
r p -
45601
gtgagaccgt ggaagtacgt gagacgcaac cgtgacggca cgccgacaca gcttctgcct
cactctggca ccttcatgca ctctgcgttg gcactgccgt gcggctgtgt cgaagacgga
45661
cgcgaggggt cgcttaggaa gccaggcgat ggccgtccgc gctcgcgaga gcatggctgc
gcgctcccca gcgaatcctt cggtccgcta ccggcaggcg cgagcgctct cgtaccgacg
45721
agtgcatccg cccgcccggg gcccccggcc ggacgggtgc atccccggcc tgtacgtccc
tcacgtaggc gggcgggccc cgggggccgg cctgcccacg taggggccgg acatgcaggg
45781
tcagtgccag ggcgatcgtc tcccccggcg gtacgggcgt cgagcacctg gctgacttgc
agtcacggtc ccgctagcag agggggccgc catgcccgca gctcgtggac cgactgaacg
45841
ggaccctcac gccccgttcc cttcctggtc gccggtccgg cgtccgcgcc ctatggccgg
cctgggagtg cggggcaagg gaaggaccag cggccaggcc gcaggcgcgg gataccggcc
45901
ccgatcggac atccacggct ctgtgcccac ccagctcgtg gcagcgtcga cggctccgct
ggctagcctg taggtgccga gacacgggtg ggtcgagcac cgtcgcagct gccgaggcga
45961
gtccgaggcc gagcggtcgc gtgccacgtc ctcgaagggc tggcggagta gggcggcacc
caggctccgg ctcgccagcg cacggtgcag gagcttcccg accgcctcat cccgccgtgg
46021
ggtgtcagta aggtgaggtg aggaagcgag ggaggagcag tgagagcgcc gcgcactctg
ccacagtcat tccactccac tccttcgctc cctcctcgtc actctcgcgg cgcgtgagac
46081
acaaccctgg acgaggtcga caccggtgac cacgtctgcc aggtgctgga ccgcatggac
tgttgggacc tgctccagct gtggccactg gtgcagacgg tccacgacct ggcgtacctg
Anhang
371
46141
gacgtcatcg accgcagccg ggccttcgtc gccgacggcg cgttgcacgg tgacaaggtg
ctgcagtagc tggcgtcggc ccggaagcag cggctgccgc gcaacgtgcc actgttccac
46201
gtgatcgtcg gggccgcttt ccaggcgggg accgagttcg ctcagctcgt actcgaccct
cactagcagc cccggcgaaa ggtccgcccc tggctcaagc gagtcgagca tgagctggga
46261
ggccgactgg acggctctct tctcgccgcg gtgcgtcgcg aggcggccta tgccgaccgt
ccggctgacc tgccgagaga agagcggcgc cacgcagcgc tccgccggat acggctggca
46321
gagggattcc gctcgcttcg ggtgctgcac catgtccggc ccagctgcca tgcggagcag
ctccctaagg cgagcgaagc ccacgacgtg gtacaggccg ggtcgacggt acgcctcgtc
46381
gcgagggaac tgttgcgcag cgaactcgat ctcgaggagt tcgcggccga taccggcgcc
cgctcccttg acaacgcgtc gcttgagcta gagctcctca agcgccggct atggccgcgg
46441
ctggtggtct gtgcctacag cggtgtcggc tgggacctgt ccacgctgcg gcagctcggt
gaccaccaga cacggatgtc gccacagccg accctggaca ggtgcgacgc cgtcgagcca
46501
tgcgtgcatc cgcatcatct gggcagccgt gcagcctc
acgcacgtag gcgtagtaga cccgtcggca cgtcggag
372
Anhang
7.3.2 Sequenz des mec-Contigs
1
agaggccgct ggcgtcgtcg accagtcgta gaaggaggcc gaggtcagcc cggccgtggt
tctccggcga ccgcagcagc tggtcagcat cttcctccgg ctccagtcgg gccggcacca
61
gctgacgacg gcgctcgcga tgtgtccccg ggacgcggcc cagaccaccg gggacgagca
cgactgctgc cgcgagcgct acacaggggc cctgcgccgg gtctggtggc ccctgctcgt
121
gcgtcagcac caggccgatc acctgccacg gctcgtacgg gccggtcgac gagccgtcgg
cgcagtcgtg gtccggctag tggacggtgc cgagcatgcc cggccagctg ctcggcagcc
181
ggtgcaggtc gcgccgctgg tcccagccca gccaggcggc ccacatcgtc agggaggcca
ccacgtccag cgcggcgacc agggtcgggt cggtccgccg ggtgtagcag tccctccggt
241
ccgccgtcac cagggccggc agcggtgcgg gaacggatct caggagtcgt tggctcatga
ggcggcagtg gtcccggccg tcgccacgcc cttgcctaga gtcctcagca accgagtact
301
cctcagcctg ccgtcgcgcc cttcggccgg acagagcgcg ggtactcatc cgcacccgag
ggagtcggac ggcagcgcgg gaagccggcc tgtctcgcgc ccatgagtag gcgtgggctc
361
tacccgagcg gacgggacct gccctctaag cgggtgaagc ctgcgctccg gtgggtggtg
atgggctcgc ctgccctgga cgggagattc gcccacttcg gacgcgaggc cacccaccac
421
cggggcatgg atgaagcccc ggccgcatcc ggccgagtcg gcggacacga cgcgctggag
gccccgtacc tacttcgggg ccggcgtagg ccggctcagc cgcctgtgct gcgcgacctc
481
ttgagcgatg aacgcgaaga aacagagccc cgagcggacc ggtcccaccg gcgccgcgac
aactcgctac ttgcgcttct ttgtctcggg gctcgcctgg ccagggtggc cgcggcgctg
>>.......................mecVIII.........................>
m
n a k
k q s
p e r t
g p t
g a a
541
ccacgaagtc ccggtcctga tcgtcggggg gtctctcgtc ggcctgtcgg cctcggtgtt
ggtgcttcag ggccaggact agcagccccc cagagagcag ccggacagcc ggagccacaa
>............................mecVIII............................>
t h e v
p v l
i v g
g s l v
g l s
a s v
601
cctgggccgg ctcggggtgc cgcacacgct ggtggagcgg cacacgggca cctccatcca
ggacccggcc gagccccacg gcgtgtgcga ccacctcgcc gtgtgcccgt ggaggtaggt
>............................mecVIII............................>
f l g r
l g v
p h t
l v e r
h t g
t s i
661
tccgcgcggc cggggcaaca acgtccgcac gatggaggtg ttccgggcgg ccggcgtcga
aggcgcgccg gccccgttgt tgcaggcgtg ctacctccac aaggcccgcc ggccgcagct
>............................mecVIII............................>
h p r g
r g n
n v r
t m e v
f r a
a g v
721
gtccggcatc cggcgggccg ccgccacgct ggccggcaac cacggcatcc tgcagacgcc
caggccgtag gccgcccggc ggcggtgcga ccggccgttg gtgccgtagg acgtctgcgg
>............................mecVIII............................>
e s g i
r r a
a a t
l a g n
h g i
l q t
781
caccctggtc ggggacgcgg gcgagtggct gttcaaggag atcgacgcgg gcggcggact
gtgggaccag cccctgcgcc cgctcaccga caagttcctc tagctgcgcc cgccgcctga
>............................mecVIII............................>
p t l v
g d a
g e w
l f k e
i d a
g g g
Anhang
373
841
cgcccgattc agccccagct cctggtgtct gtgcagccag aacgacctgg agccggtgct
gcgggctaag tcggggtcga ggaccacaga cacgtcggtc ttgctggacc tcggccacga
>............................mecVIII............................>
l a r f
s p s
s w c
l c s q
n d l
e p v
901
gttcgagcac gccgagcggc tcggcggcga tctgcggtac gccaccgaga tgatgtcgtt
caagctcgtg cggctcgccg agccgccgct agacgccatg cggtggctct actacagcaa
>............................mecVIII............................>
l f e h
a e r
l g g
d l r y
a t e
m m s
961
cgacagcgac ccctccggtg tcaccgcgat cgtcaagagc cgggagacgg gcgagcacac
gctgtcgctg gggaggccac agtggcgcta gcagttctcg gccctctgcc cgctcgtgtg
>............................mecVIII............................>
f d s d
p s g
v t a
i v k s
r e t
g e h
1021
caccatccgc gcgcagtacc tcatcgccgc cgacggcccc cgcagtcccg tccgcgaaca
gtggtaggcg cgcgtcatgg agtagcggcg gctgccgggg gcgtcagggc aggcgcttgt
>............................mecVIII............................>
t t i r
a q y
l i a
a d g p
r s p
v r e
1081
gctcggcatc ggccagagcg gccccggcga cctgttccac aacgtgagcg tcaccttccg
cgagccgtag ccggtctcgc cggggccgct ggacaaggtg ttgcactcgc agtggaaggc
>............................mecVIII............................>
q l g i
g q s
g p g
d l f h
n v s
v t f
1141
ctcccgcgac ctcgccgagg tcgtgggcga gcgccgcttc atcgtctgct acctgacgaa
gagggcgctg gagcggctcc agcacccgct cgcggcgaag tagcagacga tggactgctt
>............................mecVIII............................>
r s r d
l a e
v v g
e r r f
i v c
y l t
1201
cccggacgcc gacggggcgc tgctgcccgt ggacaaccgg gagaactggg tcttccacct
gggcctgcgg ctgccccgcg acgacgggca cctgttggcc ctcttgaccc agaaggtgga
>............................mecVIII............................>
n p d a
d g a
l l p
v d n r
e n w
v f h
1261
gccctggcac cccgaacacg gcgaaacgct ggaggagttc accgaggagc ggtgtgccga
cgggaccgtg gggcttgtgc cgctttgcga cctcctcaag tggctcctcg ccacacggct
>............................mecVIII............................>
l p w h
p e h
g e t
l e e f
t e e
r c a
1321
acacatccgc cgcgcggtcg gggtcgccga cctcgacgtc cggatcaccg gcaaggcacc
tgtgtaggcg gcgcgccagc cccagcggct ggagctgcag gcctagtggc cgttccgtgg
>............................mecVIII............................>
e h i r
r a v
g v a
d l d v
r i t
g k a
1381
ctggcacgcg gcccagcgcg tcgcccgcgg ctaccggtcg gggcgggtct tcctggccgg
gaccgtgcgc cgggtcgcgc agcgggcgcc gatggccagc cccgcccaga aggaccggcc
>............................mecVIII............................>
p w h a
a q r
v a r
g y r s
g r v
f l a
1441
cgactccgcc cacgagatgt ccccgaccgg ggccttcggc tccaacaccg ggatccagga
gctgaggcgg gtgctctaca ggggctggcc ccggaagccg aggttgtggc cctaggtcct
>............................mecVIII............................>
g d s a
h e m
s p t
g a f g
s n t
g i q
1501
cgcgcacaac ctcgcctgga agctcgcggc ggtcctcggc ggctgggccg gcgaggggct
gcgcgtgttg gagcggacct tcgagcgccg ccaggagccg ccgacccggc cgctccccga
>............................mecVIII............................>
d a h n
l a w
k l a
a v l g
g w a
g e g
374
Anhang
1561
gctggcctcg tacgacgccg agcgccgccc ggtcgcggag gccaccagcg cccgcgccgc
cgaccggagc atgctgcggc tcgcggcggg ccagcgcctc cggtggtcgc gggcgcggcg
>............................mecVIII............................>
l l a s
y d a
e r r
p v a e
a t s
a r a
1621
cgcccggtcg gtcgaacaca gccaccccgg tttcgccccg gcccccggcg tcggcggcgg
gcgggccagc cagcttgtgt cggtggggcc aaagcggggc cgggggccgc agccgccgcc
>............................mecVIII............................>
a a r s
v e h
s h p
g f a p
a p g
v g g
1681
cgggggcccg cagcgcggca tcctcaacgt ggcgctcggc taccgctatc cgcagggagc
gcccccgggc gtcgcgccgt aggagttgca ccgcgagccg atggcgatag gcgtccctcg
>............................mecVIII............................>
g g g p
q r g
i l n
v a l g
y r y
p q g
1741
cgtcctcggc accgacccca ccgcgccggt cgtccccgaa cgcctcgacc tgaccggcga
gcaggagccg tggctggggt ggcgcggcca gcaggggctt gcggagctgg actggccgct
>............................mecVIII............................>
a v l g
t d p
t a p
v v p e
r l d
l t g
1801
acccggcagc cgggcccccc atctggcggt acggcaccag ggcgagagca tctcgaccct
tgggccgtcg gcccgggggg tagaccgcca tgccgtggtc ccgctctcgt agagctggga
>............................mecVIII............................>
e p g s
r a p
h l a
v r h q
g e s
i s t
1861
ggacctctac gaacgctccc tcgtcctgct gagcgacgcg gacgccacgg ccggcggacc
cctggagatg cttgcgaggg agcaggacga ctcgctgcgc ctgcggtgcc ggccgcctgg
>............................mecVIII............................>
l d l y
e r s
l v l
l s d a
d a t
a g g
1921
ggccggcgga ccgggcagct ggcacgcggc cgcgctccgc ctcgccgagg ccatgtccgt
ccggccgcct ggcccgtcga ccgtgcgccg gcgcgaggcg gagcggctcc ggtacaggca
>............................mecVIII............................>
p a g g
p g s
w h a
a a l r
l a e
a m s
1981
ccccctggcc tcgtaccgtt tcggcacggg gcccgacgcc gagctggccc cggagggcga
gggggaccgg agcatggcaa agccgtgccc cgggctgcgg ctcgaccggg gcctcccgct
>............................mecVIII............................>
v p l a
s y r
f g t
g p d a
e l a
p e g
2041
cacggactgg gcggccgcgc acgggacgac ggccgcgggc gccgtactcg tacggcccga
gtgcctgacc cgccggcgcg tgccctgctg ccggcgcccg cggcatgagc atgccgggct
>............................mecVIII............................>
d t d w
a a a
h g t
t a a g
a v l
v r p
2101
cgggttcgtg gcgtggcgtt cgccgggggc ggtcccggac gccgagtccg ccctgcgcga
gcccaagcac cgcaccgcaa gcggcccccg ccagggcctg cggctcaggc gggacgcgct
>............................mecVIII............................>
d g f v
a w r
s p g
a v p d
a e s
a l r
2161
ggccctgacc accctgctgg cgacggcctg accccacctc acacggccgg ccggccccgg
ccgggactgg tgggacgacc gctgccggac tggggtggag tgtgccggcc ggccggggcc
>............mecVIII............>>
e a l t
t l l
a t a
-
2221
gacaccccgg gccggccggc cgcgtcatgc ggtgcccgcc atcgtgcggt gcgcaccgcc
ctgtggggcc cggccggccg gcgcagtacg ccacgggcgg tagcacgcca cgcgtggcgg
2281
gtacgccgtc gcggctccgg gccgaactcg cgcgcccggt cgccggattc acccactgac
catgcggcag cgccgaggcc cggcttgagc gcgcgggcca gcggcctaag tgggtgactg
Anhang
375
2341
ggtctcgcgt ggcggccggg acactccgag ctgacgggac atcacatcct gtgctcctca
ccagagcgca ccgccggccc tgtgaggctc gactgccctg tagtgtagga cacgaggagt
2401
acccggctga cgaggcgtcg gcagtgccga cggtgccggc agcgggacga ggggtcctgg
tgggccgact gctccgcagc cgtcacggct gccacggccg tcgccctgct ccccaggacc
2461
gcgacggtca cgagaagccc ggggggcgac ggccctgcgc ggtgcgccgc gggaggaccg
cgctgccagt gctcttcggg ccccccgctg ccgggacgcg ccacgcggcg ccctcctggc
2521
gcgcggaccc tcccgcgagc gcggcccgcc ccctgccggg cgccggcagc cgccgtgacc
cgcgcctggg agggcgctcg cgccgggcgg gggacggccc gcggccgtcg gcggcactgg
2581
ggcccccgtg accggccgcg cggtgtggtg gcccggccgg gcaccgggcg gcacaccgcc
ccgggggcac tggccggcgc gccacaccac cgggccggcc cgtggcccgc cgtgtggcgg
2641
cttcacccga gtggcgcacc ggtcacccgc gcagtgcata cgagtcgcgc gccggatggg
gaagtgggct caccgcgtgg ccagtgggcg cgtcacgtat gctcagcgcg cggcctaccc
2701
gcgggcccag gatcgaggca cgccgacgtc agccgatccg gccgacatac gtccgtcccc
cgcccgggtc ctagctccgt gcggctgcag tcggctaggc cggctgtatg caggcagggg
2761
gccccccacc aggagatgtg cgcaggatga ccaccacgtc cgaacgtctt acggagacgc
cggggggtgg tcctctacac gcgtcctact ggtggtgcag gcttgcagaa tgcctctgcg
>>..............mecI................>
m
t t t
s e r l
t e t
2821
tgaagcgaca ggtgtcgcag cgggtctccc agtccgtctt cgacggctcc cggctccgtg
acttcgctgt ccacagcgtc gcccagaggg tcaggcagaa gctgccgagg gccgaggcac
>.............................mecI..............................>
l k r
q v s q
r v s
q s v
f d g s
r l r
2881
tcgtcctcct cgtggacgtc tacgacggtg cccagcagca gttcctggag gcgtacgagc
agcaggagga gcacctgcag atgctgccac gggtcgtcgt caaggacctc cgcatgctcg
>.............................mecI..............................>
v v l
l v d v
y d g
a q q
q f l e
a y e
2941
agctgtgcaa ccaggtcgcc tccgtgcccg gacatgtcag cgaccagctg tgccagtcca
tcgacacgtt ggtccagcgg aggcacgggc ctgtacagtc gctggtcgac acggtcaggt
>.............................mecI..............................>
q l c
n q v a
s v p
g h v
s d q l
c q s
3001
tcgagaaccc ctcccagtgg ctcatcacca gtgagtggga gagtgccccg ccgttcctca
agctcttggg gagggtcacc gagtagtggt cactcaccct ctcacggggc ggcaaggagt
>.............................mecI..............................>
i e n
p s q w
l i t
s e w
e s a p
p f l
3061
cctgggtgaa cagcgaggaa cacgtggaca tggtcaagcc gctgcacaac tgcgtccggg
ggacccactt gtcgctcctt gtgcacctgt accagttcgg cgacgtgttg acgcaggccc
>.............................mecI..............................>
t w v
n s e e
h v d
m v k
p l h n
c v r
3121
acacccgctc gctgcgcttc cacatcgtcc gcgagaccgg cggcccggcc gtcgacgcag
tgtgggcgag cgacgcgaag gtgtagcagg cgctctggcc gccgggccgg cagctgcgtc
>.............................mecI..............................>
d t r
s l r f
h i v
r e t
g g p a
v d a
3181
acgccggcaa gcgccgcctg cagacctccc cccgcatcgg cgacggtctg atccggcacg
tgcggccgtt cgcggcggac gtctggaggg gggcgtagcc gctgccagac taggccgtgc
>.............................mecI..............................>
d a g
k r r l
q t s
p r i
g d g l
i r h
376
Anhang
3241
cgctcacctt cacggtcaag ccgggcagcg aggagaaggt cgccaggatc ctcgccgact
gcgagtggaa gtgccagttc ggcccgtcgc tcctcttcca gcggtcctag gagcggctga
>.............................mecI..............................>
a l t
f t v k
p g s
e e k
v a r i
l a d
3301
acgccgcgcc ggagccgaag gtcgacgaca ccacccggct gtgccgcacg tccctgttca
tgcggcgcgg cctcggcttc cagctgctgt ggtgggccga cacggcgtgc agggacaagt
>.............................mecI..............................>
y a a
p e p k
v d d
t t r
l c r t
s l f
3361
tgcacggcaa ccgggtggtc cgggccgtcg aggtccgggg cgacctgctc gccgcgctgc
acgtgccgtt ggcccaccag gcccggcagc tccaggcccc gctggacgag cggcgcgacg
>.............................mecI..............................>
m h g
n r v v
r a v
e v r
g d l l
a a l
3421
ggcatgtcgc ccggcagccc gaggtgcggg ccgtcgagga ggccatcaac ccctatctgg
ccgtacagcg ggccgtcggg ctccacgccc ggcagctcct ccggtagttg gggatagacc
>.............................mecI..............................>
r h v
a r q p
e v r
a v e
e a i n
p y l
3481
agcaggaccg ggacctcgac gaccccgact ccgcccgggt cttcttcacc cgcgcggcgc
tcgtcctggc cctggagctg ctggggctga ggcgggccca gaagaagtgg gcgcgccgcg
>.............................mecI..............................>
e q d
r d l d
d p d
s a r
v f f t
r a a
3541
tccccgccgt ccaccacgtg acggccggcc aggagagccc ggacgcggta cggcacgcgc
aggggcggca ggtggtgcac tgccggccgg tcctctcggg cctgcgccat gccgtgcgcg
>.............................mecI..............................>
l p a
v h h v
t a g
q e s
p d a v
r h a
3601
tgtactaccc ggcccgcgag ggctgcggtc tgcggctggc cgagctgctc gcccggcagg
acatgatggg ccgggcgctc ccgacgccag acgccgaccg gctcgacgag cgggccgtcc
>.............................mecI..............................>
l y y
p a r e
g c g
l r l
a e l l
a r q
3661
acgaggcggc ggcggacgac ccgcaggggc cggtgctgcg cagcacgatc ttccagcgcg
tgctccgccg ccgcctgctg ggcgtccccg gccacgacgc gtcgtgctag aaggtcgcgc
>.............................mecI..............................>
d e a
a a d d
p q g
p v l
r s t i
f q r
3721
acgacatcgt ggtgcggctg gtcgacgtgc gcggcggcat cgacaacgac cccggccccg
tgctgtagca ccacgccgac cagctgcacg cgccgccgta gctgttgctg gggccggggc
>.............................mecI..............................>
d d i
v v r l
v d v
r g g
i d n d
p g p
3781
tgctcggtct cgccgaccgc gcccgcgcgg ccgaactgac cgcgctgctg gacggcggcg
acgagccaga gcggctggcg cgggcgcgcc ggcttgactg gcgcgacgac ctgccgccgc
>.............................mecI..............................>
v l g
l a d r
a r a
a e l
t a l l
d g g
3841
ccctcggcgc ggacggcacg ccgaggggcg gcgcctccgc ccgcctgctc acggtcgccc
gggagccgcg cctgccgtgc ggctccccgc cgcggaggcg ggcggacgag tgccagcggg
>.............................mecI..............................>
a l g
a d g t
p r g
g a s
a r l l
t v a
3901
gcatggaact cgtcaccgac cgccgggcgc ccgacgcctg atccccctca acccggggcc
cgtaccttga gcagtggctg gcggcccgcg ggctgcggac tagggggagt tgggccccgg
>...................mecI...................>>
r m e
l v t d
r r a
p d a
-
Anhang
377
3961
gtgcggcagc gccgcacgcc cccgccccgc cccgtccccg tccccgtccc cgcacccgca
cacgccgtcg cggcgtgcgg gggcggggcg gggcaggggc aggggcaggg gcgtgggcgt
4021
cccgcacccg cacccgttcg actcagctca tgttcggagg aacgtcgtga tcaatcgcca
gggcgtgggc gtgggcaagc tgagtcgagt acaagcctcc ttgcagcact agttagcggt
>>...mecII....>
v
i n r
4081
tcccggcatc gtggatgtca gcgaggtcga gcccaacacc cggcgcggcg gcgatctgcg
agggccgtag cacctacagt cgctccagct cgggttgtgg gccgcgccgc cgctagacgc
>.............................mecII.............................>
h p g i
v d v
s e v
e p n t
r r g
g d l
4141
cgccatgttg accccctcca cggtcggctc caccagcggt ttcatgggcg tggccatcgt
gcggtacaac tgggggaggt gccagccgag gtggtcgcca aagtacccgc accggtagca
>.............................mecII.............................>
r a m l
t p s
t v g
s t s g
f m g
v a i
4201
ggcgcccggc gaccgcatcg ccgagcacta ccacccgtac tccgaggagt tcatctacgt
ccgcgggccg ctggcgtagc ggctcgtgat ggtgggcatg aggctcctca agtagatgca
>.............................mecII.............................>
v a p g
d r i
a e h
y h p y
s e e
f i y
4261
catctgcgga cagctggagg tggacctcga cggcgagccc caccgactcc ggccggagca
gtagacgcct gtcgacctcc acctggagct gccgctcggg gtggctgagg ccggcctcgt
>.............................mecII.............................>
v i c g
q l e
v d l
d g e p
h r l
r p e
4321
ggggctgttg atccccgccc acatgcggca ccggttccgc aacgtcggca aggtggaggc
ccccgacaac taggggcggg tgtacgccgt ggccaaggcg ttgcagccgt tccacctccg
>.............................mecII.............................>
q g l l
i p a
h m r
h r f r
n v g
k v e
4381
ccgcatggtc ttccacctcg gcccgctggc cccgagcccg ccgctcggcc acgtcgacac
ggcgtaccag aaggtggagc cgggcgaccg gggctcgggc ggcgagccgg tgcagctgtg
>.............................mecII.............................>
a r m v
f h l
g p l
a p s p
p l g
h v d
4441
cgaggacgcg aacggcgtac cgatcccggt ggaggcggcc cacgccggac gggccgagcg
gctcctgcgc ttgccgcatg gctagggcca cctccgccgg gtgcggcctg cccggctcgc
>.............................mecII.............................>
t e d a
n g v
p i p
v e a a
h a g
r a e
4501
gcctcaggtc cgctcatgac caggcgcgtg gcggtcaccg gcataggcat cgtcgctccg
cggagtccag gcgagtactg gtccgcgcac cgccagtggc cgtatccgta gcagcgaggc
>......mecII......>>
r p q v
r s >>...................mecIII.....................>
m
t r r v
a v t
g i g
i v a p
4561
ggcggcatcg gtgtcccggc gttctgggac ctgctggccg acggtcgcac ggcgacacgt
ccgccgtagc cacagggccg caagaccctg gacgaccggc tgccagcgtg ccgctgtgca
>............................mecIII.............................>
g g i
g v p
a f w d
l l a
d g r
t a t r
4621
ggcatcacct tcttcgaccc gtccgggctg cgttcgcgga tcgccgccga gtgcgacttc
ccgtagtgga agaagctggg caggcccgac gcaagcgcct agcggcggct cacgctgaag
>............................mecIII.............................>
g i t
f f d
p s g l
r s r
i a a
e c d f
378
Anhang
4681
gacccggcgg cccacggact ggacgcggag ctggtcgccc gctgcgaccg gtacatccag
ctgggccgcc gggtgcctga cctgcgcctc gaccagcggg cgacgctggc catgtaggtc
>............................mecIII.............................>
d p a
a h g
l d a e
l v a
r c d
r y i q
4741
ttcgccctgg tggccggtga ggaggcgatc cgggactccg gcctcgacct cgccgcggag
aagcgggacc accggccact cctccgctag gccctgaggc cggagctgga gcggcgcctc
>............................mecIII.............................>
f a l
v a g
e e a i
r d s
g l d
l a a e
4801
aacccctggc gggtcggggt ctccctcggc accgcggtcg gcggcaccac ccgtctggag
ttggggaccg cccagcccca gagggagccg tggcgccagc cgccgtggtg ggcagacctc
>............................mecIII.............................>
n p w
r v g
v s l g
t a v
g g t
t r l e
4861
cacgactacg tgctggtcag ccatcgcggt cagcgctggg acgtggacca ccgggaggcc
gtgctgatgc acgaccagtc ggtagcgcca gtcgcgaccc tgcacctggt ggccctccgg
>............................mecIII.............................>
h d y
v l v
s h r g
q r w
d v d
h r e a
4921
gggccgcatc tgcaccgggc gttcgcgccc agcaccctcg cctcgacggt ggcggaacgc
cccggcgtag acgtggcccg caagcgcggg tcgtgggagc ggagctgcca ccgccttgcg
>............................mecIII.............................>
g p h
l h r
a f a p
s t l
a s t
v a e r
4981
ttcgaggccc gggggccggt gcagaccgtc tccaccggct gcacctcggg gctcgacgcg
aagctccggg cccccggcca cgtctggcag aggtggccga cgtggagccc cgagctgcgc
>............................mecIII.............................>
f e a
r g p
v q t v
s t g
c t s
g l d a
5041
gtcgggtacg ccttccacac gatcgaggag ggccgggccg acatctgcat agccggtgcc
cagcccatgc ggaaggtgtg ctagctcctc ccggcccggc tgtagacgta tcggccacgg
>............................mecIII.............................>
v g y
a f h
t i e e
g r a
d i c
i a g a
5101
tcggactcgc cgatctcccc gatcaccatg gcctgcttcg acgcgatcaa ggccacctcc
agcctgagcg gctagagggg ctagtggtac cggacgaagc tgcgctagtt ccggtggagg
>............................mecIII.............................>
s d s
p i s
p i t m
a c f
d a i
k a t s
5161
cccgacaacg acgacccggc ccacgcctcg cgtcccttcg acgccgaccg caacgggttc
gggctgttgc tgctgggccg ggtgcggagc gcagggaagc tgcggctggc gttgcccaag
>............................mecIII.............................>
p d n
d d p
a h a s
r p f
d a d
r n g f
5221
gtcatgggcg agggcggcgc cgtactggtc ctggaggagc tggcacacgc acgggcccgc
cagtacccgc tcccgccgcg gcatgaccag gacctcctcg accgtgtgcg tgcccgggcg
>............................mecIII.............................>
v m g
e g g
a v l v
l e e
l a h
a r a r
5281
ggcgcgcacg tgtactgcga gatcgggggc tacgccacct tcggcaacgc ctaccacatg
ccgcgcgtgc acatgacgct ctagcccccg atgcggtgga agccgttgcg gatggtgtac
>............................mecIII.............................>
g a h
v y c
e i g g
y a t
f g n
a y h m
5341
accggcctga ccagcgaggg cctggagatg gcgcgggcca tcgaggacgc cctcgaccat
tggccggact ggtcgctccc ggacctctac cgcgcccggt agctcctgcg ggagctggta
>............................mecIII.............................>
t g l
t s e
g l e m
a r a
i e d
a l d h
Anhang
379
5401
gcccggatcg accgtacggc cgtcgactac gtcaacgccc acggctcggg caccaagcag
cgggcctagc tggcatgccg gcagctgatg cagttgcggg tgccgagccc gtggttcgtc
>............................mecIII.............................>
a r i
d r t
a v d y
v n a
h g s
g t k q
5461
aacgaccggc acgagacggc cgccgtcaaa cggacgctcg gcgcgcacgc ctacgacacg
ttgctggccg tgctctgccg gcggcagttt gcctgcgagc cgcgcgtgcg gatgctgtgc
>............................mecIII.............................>
n d r
h e t
a a v k
r t l
g a h
a y d t
5521
cccatgagtt ccatcaagtc catggtgggc cactcgctgg gcgcgatcgg cgcgatcgag
gggtactcaa ggtagttcag gtaccacccg gtgagcgacc cgcgctagcc gcgctagctc
>............................mecIII.............................>
p m s
s i k
s m v g
h s l
g a i
g a i e
5581
gtcgtcgcct gtgcgctggc cctggcccac caggtcgtcc cgcccaccgc gaactaccag
cagcagcgga cacgcgaccg ggaccgggtg gtccagcagg gcgggtggcg cttgatggtc
>............................mecIII.............................>
v v a
c a l
a l a h
q v v
p p t
a n y q
5641
accccggacc ccgagtgcga cctggactac gtgccgcgcg tcgcccgtga gcggaagctg
tggggcctgg ggctcacgct ggacctgatg cacggcgcgc agcgggcact cgccttcgac
>............................mecIII.............................>
t p d
p e c
d l d y
v p r
v a r
e r k l
5701
accaacgtgc tctccgtggg cagcgggttc ggcgggttcc agtccgcggt ggtcatgagc
tggttgcacg agaggcaccc gtcgcccaag ccgcccaagg tcaggcgcca ccagtactcg
>............................mecIII.............................>
t n v
l s v
g s g f
g g f
q s a
v v m s
5761
ctgccgaggg agaagacacg atgagcgaac ggcgtcctcg gcgcgcggcc gtcaccggaa
gacggctccc tcttctgtgc tactcgcttg ccgcaggagc cgcgcgccgg cagtggcctt
>.........mecIII........>>
l p r
e k t
r >>.................mecIV..................>
m s e
r r p
r r a a
v t g
5821
tcggcgtggt cgcgcccaac ggaacgagca ccgagacgtt ctggaagtcc accagggagg
agccgcacca gcgcgggttg ccttgctcgt ggctctgcaa gaccttcagg tggtccctcc
>.............................mecIV.............................>
i g v
v a p n
g t s
t e t
f w k s
t r e
5881
gcatcagcgt cctggaccgg gtcacccgcg agggctgcga gcatctgccg ctgcgggtgg
cgtagtcgca ggacctggcc cagtgggcgc tcccgacgct cgtagacggc gacgcccacc
>.............................mecIV.............................>
g i s
v l d r
v t r
e g c
e h l p
l r v
5941
cgggcgaggt ccgcaacttc gatccgccgt cggcggtcga ggagcgctac ctcgtccaga
gcccgctcca ggcgttgaag ctaggcggca gccgccagct cctcgcgatg gagcaggtct
>.............................mecIV.............................>
a g e
v r n f
d p p
s a v
e e r y
l v q
6001
ccgaccgctt cacgcacttc gcgatggccg ccgccgacca ggcgctcgac gacgcccgcc
ggctggcgaa gtgcgtgaag cgctaccggc ggcggctggt ccgcgagctg ctgcgggcgg
>.............................mecIV.............................>
t d r
f t h f
a m a
a a d
q a l d
d a r
6061
tggaccggcc cgagaccgac gccgcgccgt tctcggtggg cgtggtcacc gcggccggct
acctggccgg gctctggctg cggcgcggca agagccaccc gcaccagtgg cgccggccga
>.............................mecIV.............................>
l d r
p e t d
a a p
f s v
g v v t
a a g
380
Anhang
6121
ccggcggcgg cgagttcggg cagcgggaac tgcagcagct gtggtccaag ggcagccgtt
ggccgccgcc gctcaagccc gtcgcccttg acgtcgtcga caccaggttc ccgtcggcaa
>.............................mecIV.............................>
s g g
g e f g
q r e
l q q
l w s k
g s r
6181
tcgtgggccc gtaccagtcc atcgcctggt tctacgcggc gagcaccggc cagatctcca
agcacccggg catggtcagg tagcggacca agatgcgccg ctcgtggccg gtctagaggt
>.............................mecIV.............................>
f v g
p y q s
i a w
f y a
a s t g
q i s
6241
tccgccgcgg tttcaagggc ccctgcgggg tcatcgcctc cgacgaggcc ggcgggctgg
aggcggcgcc aaagttcccg gggacgcccc agtagcggag gctgctccgg ccgcccgacc
>.............................mecIV.............................>
i r r
g f k g
p c g
v i a
s d e a
g g l
6301
acgccgtggc gcacgcggca cgggccgtgc ggcgcggcac ggacgtgatg gtggccggcg
tgcggcaccg cgtgcgccgt gcccggcacg ccgcgccgtg cctgcactac caccggccgc
>.............................mecIV.............................>
d a v
a h a a
r a v
r r g
t d v m
v a g
6361
cgaccgaggc gccgctcgcc ccctactcgg tggtctgcca gctcggctac gaggagctga
gctggctccg cggcgagcgg gggatgagcc accagacggt cgagccgatg ctcctcgact
>.............................mecIV.............................>
a t e
a p l a
p y s
v v c
q l g y
e e l
6421
gcaccgtcga cgacccggcc cgcgcctacc gcccgttcac cgccgcggcc tgcgggttcg
cgtggcagct gctgggccgg gcgcggatgg cgggcaagtg gcggcgccgg acgcccaagc
>.............................mecIV.............................>
s t v
d d p a
r a y
r p f
t a a a
c g f
6481
tccccgccga gggcggcgcg atgctcgtcg tggaggccga ggacacggcc cgggaacggg
aggggcggct cccgccgcgc tacgagcagc acctccggct cctgtgccgg gcccttgccc
>.............................mecIV.............................>
v p a
e g g a
m l v
v e a
e d t a
r e r
6541
gcgcgcccgt gcgggccctc ctcgcgggcc acgcggccac cttcaccggc gcctcccgct
cgcgcgggca cgcccgggag gagcgcccgg tgcgccggtg gaagtggccg cggagggcga
>.............................mecIV.............................>
g a p
v r a l
l a g
h a a
t f t g
a s r
6601
gggaggagtc ccgggcgggc ctcgccgagg ccgtccgggt cgccctggag gaggccggct
ccctcctcag ggcccgcccg gagcggctcc ggcaggccca gcgggacctc ctccggccga
>.............................mecIV.............................>
w e e
s r a g
l a e
a v r
v a l e
e a g
6661
gcgccccgga ggagatcgac gtggtcttcg ccgacgccct cggcgtaccg gcggcggacc
cgcggggcct cctctagctg caccagaagc ggctgcggga gccgcatggc cgccgcctgg
>.............................mecIV.............................>
c a p
e e i d
v v f
a d a
l g v p
a a d
6721
gtgcggaggc gctggcgatc acggacgccc tcggcgcgca cggcacccgc gtccccgtca
cacgcctccg cgaccgctag tgcctgcggg agccgcgcgt gccgtgggcg caggggcagt
>.............................mecIV.............................>
r a e
a l a i
t d a
l g a
h g t r
v p v
6781
cggcgccgaa gaccgccatc ggccggggca acggcgcggc ggccgtgctg gacgtcgcgg
gccgcggctt ctggcggtag ccggccccgt tgccgcgccg ccggcacgac ctgcagcgcc
>.............................mecIV.............................>
t a p
k t a i
g r g
n g a
a a v l
d v a
Anhang
381
6841
cggccgtgct cgcgatggag caccgcgtga tcccgcccac ccccaacgtc ttcgacgtct
gccggcacga gcgctacctc gtggcgcact agggcgggtg ggggttgcag aagctgcaga
>.............................mecIV.............................>
a a v
l a m e
h r v
i p p
t p n v
f d v
6901
gccacgacct cgacctcgtc accggcaccg cccgcgccgc cgagccgcgc acggccctgg
cggtgctgga gctggagcag tggccgtggc gggcgcggcg gctcggcgcg tgccgggacc
>.............................mecIV.............................>
c h d
l d l v
t g t
a r a
a e p r
t a l
6961
tcctcagccg gggcctcatg gggtcgaacg cggcgctggt gctgcggctc ggccccggcg
aggagtcggc cccggagtac cccagcttgc gccgcgacca cgacgccgag ccggggccgc
>.............................mecIV.............................>
v l s
r g l m
g s n
a a l
v l r l
g p g
7021
gcgcctcctg accgcccctc accgcacccc cgcgccacac ccccctcacc acgcaccacc
cgcggaggac tggcggggag tggcgtgggg gcgcggtgtg gggggagtgg tgcgtggtgg
>..mecIV..>>
g a s
-
7081
gacgcaccaa ggagaaccgc atgagtgacc gcatcaccgt ggaagagctg tccgagctga
ctgcgtggtt cctcttggcg tactcactgg cgtagtggca ccttctcgac aggctcgact
>>.................mecV...................>
m s d
r i t
v e e l
s e l
7141
tgaagaaggc cgccggggtc accgtcaccc cggaggagct ccagcgtcgt atggagtccg
acttcttccg gcggccccag tggcagtggg gcctcctcga ggtcgcagca tacctcaggc
>.............................mecV..............................>
m k k
a a g v
t v t
p e e
l q r r
m e s
7201
gcttcgacgt catcggcatc gactcgctcg gtctgctcgg catcgtgggc gagctggaga
cgaagctgca gtagccgtag ctgagcgagc cagacgagcc gtagcacccg ctcgacctct
>.............................mecV..............................>
g f d
v i g i
d s l
g l l
g i v g
e l e
7261
accgctacgg cacgccgatg ccgccggacg cggagaagag ccgcagcccc aagcagttcc
tggcgatgcc gtgcggctac ggcggcctgc gcctcttctc ggcgtcgggg ttcgtcaagg
>.............................mecV..............................>
n r y
g t p m
p p d
a e k
s r s p
k q f
7321
tcgaccaggt caacaccgcg ctgatggcgg gtgcctgaca tgaccggaca cacgcagaac
agctggtcca gttgtggcgc gactaccgcc cacggactgt actggcctgt gtgcgtcttg
>.................mecV.................>>
l d q
v n t a
l m a
g a >>.......mecVI........>
m t g
h t q n
7381
gagatcacca tcgccgctcc ggtcgacctg gtctgggaca tgaccaacga cgtcgcgaac
ctctagtggt agcggcgagg ccagctggac cagaccctgt actggttgct gcagcgcttg
>.............................mecVI.............................>
e i t
i a a
p v d l
v w d
m t n
d v a n
7441
tggccccggc tgttcagcga gtacgccacc gccgagatcc tctccgagga ggggaaccgg
accggggccg acaagtcgct catgcggtgg cggctctagg agaggctcct ccccttggcc
>.............................mecVI.............................>
w p r
l f s
e y a t
a e i
l s e
e g n r
7501
gtgacgttcc ggctgaccat gcacccggac gagaacggca aggtctggag ctgggtctcg
cactgcaagg ccgactggta cgtgggcctg ctcttgccgt tccagacctc gacccagagc
>.............................mecVI.............................>
v t f
r l t
m h p d
e n g
k v w
s w v s
382
Anhang
7561
gagcgggaga cggaccgcga gacgctcagc gtggaggccc gccgcgtcga gaccgggccc
ctcgccctct gcctggcgct ctgcgagtcg cacctccggg cggcgcagct ctggcccggg
>.............................mecVI.............................>
e r e
t d r
e t l s
v e a
r r v
e t g p
7621
ttcgcctaca tgaacatcct gtgggagtac gagaaggtcc ccaccggcac ccggatgacg
aagcggatgt acttgtagga caccctcatg ctcttccagg ggtggccgtg ggcctactgc
>.............................mecVI.............................>
f a y
m n i
l w e y
e k v
p t g
t r m t
7681
tggacgcagg acttcgcgat gaagcccgac gcgccggtcg acgacgactg gatgacggac
acctgcgtcc tgaagcgcta cttcgggctg cgcggccagc tgctgctgac ctactgcctg
>.............................mecVI.............................>
w t q
d f a
m k p d
a p v
d d d
w m t d
7741
aacatcaacc gcaactccaa ggtccagatg gccctgatcc gggaccgcat cgagaaggcc
ttgtagttgg cgttgaggtt ccaggtctac cgggactagg ccctggcgta gctcttccgg
>.............................mecVI.............................>
n i n
r n s
k v q m
a l i
r d r
i e k a
7801
gccgccgagc agggcgccgc gccgggactg accgactgag cgccgagcga tcgcgcgccg
cggcggctcg tcccgcggcg cggccctgac tggctgactc gcggctcgct agcgcgcggc
>.................mecVI.................>>
a a e
q g a
a p g l
t d -
7861
accgaacgaa ccggacggag aacaccgtat gcaccagtcc ctgatcgtcg cccggatggc
tggcttgctt ggcctgcctc ttgtggcata cgtggtcagg gactagcagc gggcctaccg
>>............mecVII..............>
m h q s
l i v
a r m
7921
cccggggtcg gccccggaca tcgccaagat cttcgaggag tccgaccggg gtgagctgcc
gggccccagc cggggcctgt agcggttcta gaagctcctc aggctggccc cactcgacgg
>............................mecVII.............................>
a p g s
a p d
i a k
i f e e
s d r
g e l
7981
gcacctcatc ggggtctccc ggcgcagcct cttccagttc gacgacgtgt acatccacct
cgtggagtag ccccagaggg ccgcgtcgga gaaggtcaag ctgctgcaca tgtaggtgga
>............................mecVII.............................>
p h l i
g v s
r r s
l f q f
d d v
y i h
8041
cgtcgagtcc gagcgggacc ccacacccgt catcaccgag atggccggac accccgagtt
gcagctcagg ctcgccctgg ggtgtgggca gtagtggctc taccggcctg tggggctcaa
>............................mecVII.............................>
l v e s
e r d
p t p
v i t e
m a g
h p e
8101
ccgggccatc agcgaacggc tgtcgtcgta cgtcaccgcc tacgacccgg ccacctggcg
ggcccggtag tcgcttgccg acagcagcat gcagtggcgg atgctgggcc ggtggaccgc
>............................mecVII.............................>
f r a i
s e r
l s s
y v t a
y d p
a t w
8161
ttcgccgaag gacgcgatgg cgaaccgctt ctaccggtgg gagcgggaca gccgctcctg
aagcggcttc ctgcgctacc gcttggcgaa gatggccacc ctcgccctgt cggcgaggac
>............................mecVII.............................>
r s p k
d a m
a n r
f y r w
e r d
s r s
8221
aacccccgtc gggccgccgg gcacgtgcga acgcgcgtgc ccggcggccc gtgcggtcat
ttgggggcag cccggcggcc cgtgcacgct tgcgcgcacg ggccgccggg cacgccagta
> mecVII
mecIX <<.<
-
Anhang
383
8281
ccgggcacgt ggcagtcgaa ggcgtgcaga tacgcgttga ccgggcgcac gtcgtcgatc
ggcccgtgca ccgtcagctt ccgcacgtct atgcgcaact ggcccgcgtg cagcagctag
<.............................mecIX.............................<
g p v
h c d f
a h l
y a n
v p r v
d d i
8341
accagccccg cgtccgtcag cctgcgggtc atgctctcgg tggtgtgctt ggccccgccg
tggtcggggc gcaggcagtc ggacgcccag tacgagagcc accacacgaa ccggggcggc
<.............................mecIX.............................<
v l g
a d t l
r r t
m s e
t t h k
a g g
8401
acgttgagga gcagcagcag gtccatggcg gtgctgaacc gcatcgaggg cgagtcgtcg
tgcaactcct cgtcgtcgtc caggtaccgc cacgacttgg cgtagctccc gctcagcagc
<.............................mecIX.............................<
v n l
l l l l
d m a
t s f
r m s p
s d d
8461
acgaggttct cgatgaccac gacgcgtgtg ccggggccgc ccgccccgat gacgttgcgc
tgctccaaga gctactggtg ctgcgcacac ggccccggcg ggcggggcta ctgcaacgcg
<.............................mecIX.............................<
v l n
e i v v
v r t
g p g
g a g i
v n r
8521
agcagccgga ccgtgctgtc gtcgtcccac tccaggatgt tcttgatgac gtagacgtcg
tcgtcggcct ggcacgacag cagcagggtg aggtcctaca agaactactg catctgcagc
<.............................mecIX.............................<
l l r
v t s d
d d w
e l i
n k i v
y v d
8581
gcccggaccg ggacggcctc gcggcagtcg ccggggacga cgcgcgtccg ctccgcgagc
cgggcctggc cctgccggag cgccgtcagc ggcccctgct gcgcgcaggc gaggcgctcg
<.............................mecIX.............................<
a r v
p v a e
r c d
g p v
v r t r
e a l
8641
gcgccgcccg gtcgcagccg gggatcggcg ttctccacca cgcgcggcag gtcgagcagg
cgcggcgggc cagcgtcggc ccctagccgc aagaggtggt gcgcgccgtc cagctcgtcc
<.............................mecIX.............................<
a g g
p r l r
p d a
n e v
v r p l
d l l
8701
gtgccgtgca gcgccgggta cttctccagc aggctcgcca ccacgtgccc ctgtcccccg
cacggcacgt cgcggcccat gaagaggtcg tccgagcggt ggtgcacggg gacagggggc
<.............................mecIX.............................<
t g h
l a p y
k e l
l s a
v v h g
q g g
8761
ccgatgtcgg cgacggacga actccccgac aggtcgagga actcggcgac gtcccgcgcg
ggctacagcc gctgcctgct tgaggggctg tccagctcct tgagccgctg cagggcgcgc
<.............................mecIX.............................<
g i d
a v s s
s g s
l d l
f e a v
d r a
8821
gactgcacgc tggaggtcgt catggcgcgg ttgaagacgt cggccgactc gggggcgtcc
ctgacgtgcg acctccagca gtaccgcgcc aacttctgca gccggctgag cccccgcagg
<.............................mecIX.............................<
s q v
s s t t
m a r
n f v
d a s e
p a d
8881
tcgttgaggt agacgaagaa ctccttgccg tacagctcct cgacgacgtt gtggccggag
agcaactcca tctgcttctt gaggaacggc atgtcgagga gctgctgcaa caccggcctc
<.............................mecIX.............................<
e n l
y v f f
e k g
y l e
e v v n
h g s
8941
cgcaccgcct cgtccagttt cggccaggcg tcccaggtcc acggctcggt gcaccacagg
gcgtggcgga gcaggtcaaa gccggtccgc agggtccagg tgccgagcca cgtggtgtcc
<.............................mecIX.............................<
r v a
e d l k
p w a
d w t
w p e t
c w l
384
Anhang
9001
gcgatggcgc gcaggctgtg cgggtcgtcc tcgcgcagca gccgggacat gtcggtgtgg
cgctaccgcg cgtccgacac gcccagcagg agcgcgtcgt cggccctgta cagccacacc
<.............................mecIX.............................<
a i a
r l s h
p d d
e r l
l r s m
d t h
9061
gcgaacgtcc cgtccggccg ttcggtgaag acgccgtagc aggacagggc ccgcaacagc
cgcttgcagg gcaggccggc aagccacttc tgcggcatcg tcctgtcccg ggcgttgtcg
<.............................mecIX.............................<
a f t
g d p r
e t f
v g y
c s l a
r l l
9121
cgtcgcagcg gcttcggttc ggccttcacc gcggccgcga ggtcctccgc ggacgacggg
gcagcgtcgc cgaagccaag ccggaagtgg cgccggcgct ccaggaggcg cctgctgccc
<.............................mecIX.............................<
r r l
p k p e
a k v
a a a
l d e a
s s p
9181
gtgtcgccga ggacgtcggc gacccccagc cgggcggcgg cgcgcagggc cgcggcacag
cacagcggct cctgcagccg ctgggggtcg gcccgccgcc gcgcgtcccg gcgccgtgtc
<.............................mecIX.............................<
t d g
l v d a
v g l
r a a
a r l a
a a c
9241
gcggcgccga acaccagttc cctgaaccgc atggggggcg ggggcgccgg ggcgtcctgc
cgccgcggct tgtggtcaag ggacttggcg taccccccgc ccccgcggcc ccgcaggacg
<..............mecIX.............<<
a a g
f v l e
r f r
m
9301
gcggtgtgcg gggccttggc cggtgagatg ggcgtggtgg tggtctgtct ggtctgagcg
cgccacacgc cccggaaccg gccactctac ccgcaccacc accagacaga ccagactcgc
9361
gtcgtcatgc gacggcctcc ttcttcgagt tcatgagcga ccgaggccgg tcagcacagt
cagcagtacg ctgccggagg aagaagctca agtactcgct ggctccggcc agtcgtgtca
putative secreted protein <<.......<
- c l
9421
cccgcgggcc gggacgcccc gcaggtgttg cccgtgaagg tgttgccctt gccggcggtg
gggcgcccgg ccctgcgggg cgtccacaac gggcacttcc acaacgggaa cggccgccac
<...................putative secreted protein...................<
g a p
r s a g
c t n
g t f
t n g k
g a t
9481
tcggtgttga cgatgtccgc cggggagttg ccctccagca cgttgtcggt gatccggttc
agccacaact gctacaggcg gcccctcaac gggaggtcgt gcaacagcca ctaggccaag
<...................putative secreted protein...................<
d t n
v i d a
p s n
g e l
v n d t
i r n
9541
cgctcgctgg tggtgcccac gaagctcttc cagacgacga tgccgcccga cagcggggag
gcgagcgacc accacgggtg cttcgagaag gtctgctgct acggcgggct gtcgcccctc
<...................putative secreted protein...................<
r e s
t t g v
f s k
w v v
i g g s
l p s
9601
gcgccgacgt tctccgtgac gcggttgcgg gtcaccaggg tgtcctcggc gccggtcagc
cgcggctgca agaggcactg cgccaacgcc cagtggtccc acaggagccg cggccagtcg
<...................putative secreted protein...................<
a g v
n e t v
r n r
t v l
t d e a
g t l
9661
acgatgccgg tgccctgcag cgcgtccagc cgcgcggtct tcgggcagga cttgttgttc
tgctacggcc acgggacgtc gcgcaggtcg gcgcgccaga agcccgtcct gaacaacaag
<...................putative secreted protein...................<
v i g
t g q l
a d l
r a t
k p c s
k n n
Anhang
385
9721
cgctcgatga ggttgtcgcg cacggtgagc gcgccggccc tcggcatgtt ctcgtcgccc
gcgagctact ccaacagcgc gtgccactcg cgcggccggg agccgtacaa gagcagcggg
<...................putative secreted protein...................<
r e i
l n d r
v t l
a g a
r p m n
e d g
9781
acgacgaaga cgcccacgca gttgccggtg aggtggttgt ccgcgaccgt gaggttgcgc
tgctgcttct gcgggtgcgt caacggccac tccaccaaca ggcgctggca ctccaacgcg
<...................putative secreted protein...................<
v v f
v g v c
n g t
l h n
d a v t
l n r
9841
aggcgccgga cggtgaggcc gatccggttg ccctccagcc ggttgtgcgc gacgagggtc
tccgcggcct gccactccgg ctaggccaac gggaggtcgg ccaacacgcg ctgctcccag
<...................putative secreted protein...................<
l r r
v t l g
i r n
g e l
r n h a
v l t
9901
gcgccgctgt ccgtggcgcc ctgctcggcc ttgacggtgt tcgcgaggaa caggcccgcg
cgcggcgaca ggcaccgcgg gacgagccgg aactgccaca agcgctcctt gtccgggcgc
<...................putative secreted protein...................<
a g s
d t a g
q e a
k v t
n a l f
l g a
9961
tcgccgttgt cccgggcggt gttcttccgg aacaccccgc gtaccgaacg ctcctgggcg
agcggcaaca gggcccgcca caagaaggcc ttgtggggcg catggcttgc gaggacccgc
<...................putative secreted protein...................<
d g n
d r a t
n k r
f v g
r v s r
e q a
10021
atgccccaca cgccgttctt ctcggcggtc acgtgccgca cggtcagccc gtcggtgtcc
tacggggtgt gcggcaagaa gagccgccag tgcacggcgt gccagtcggg cagccacagg
<...................putative secreted protein...................<
i g w
v g n k
e a t
v h r
v t l g
d t d
10081
tgggcgaaca ccccggaccc ggtgaagccg gtcacggtca gggcggcgag ggtcacgtcc
acccgcttgt ggggcctggg ccacttcggc cagtgccagt cccgccgctc ccagtgcagg
<...................putative secreted protein...................<
q a f
v g s g
t f g
t v t
l a a l
t v d
10141
tcgaccttgc ggtccttggt cccgatcaca cagatgccgt tgccgtcggc gcagccgccg
agctggaacg ccaggaacca gggctagtgt gtctacggca acggcagccg cgtcggcggc
<..putative secreted protein.<<
e v k
r d k t
g i v
10201
gcggcttcgc cgcggccggg acgacgacgt gccgcggccc atgctgagaa ggtgaatcc
cgccgaagcg gcgccggccc tgctgctgca cggcgccggg tacgactctt ccacttagg
386
Anhang
7.3.3 Sequenz des msn-Contigs
1
gttccgcggg gggccgtctg gtcctgaccc agatggtgga cgacggtgtg taccggtcgc
caaggcgccc cccggcagac caggactggg tctaccacct gctgccacac atggccagcg
>>..........msnH0............>
m v
d d g v
y r s
61
agtttgtgac aggcacgagc aacggtggtc tgaccgctca tcctggcgga gaccggtggc
tcaaacactg tccgtgctcg ttgccaccag actggcgagt aggaccgcct ctggccaccg
>.............................msnH0.............................>
q f v
t g t s
n g g
l t a
h p g g
d r w
121
gctgggagag ccgtatcttc ggcggcgcgt acgacgacgc atcagctgac cagcgccccg
cgaccctctc ggcatagaag ccgccgcgca tgctgctgcg tagtcgactg gtcgcggggc
>.............................msnH0.............................>
r w e
s r i f
g g a
y d d
a s a d
q r p
181
tatatggcgc gttgaattac cgccgtgatc cggtcggtgg tgcaccgcgg ttcggctcct
atataccgcg caacttaatg gcggcactag gccagccacc acgtggcgcc aagccgagga
>.............................msnH0.............................>
v y g
a l n y
r r d
p v g
g a p r
f g s
241
cgtacttcag actcggcatc gagaccctca gtcgcaccac gctctgctac cccgacagtt
gcatgaagtc tgagccgtag ctctgggagt cagcgtggtg cgagacgatg gggctgtcaa
>.............................msnH0.............................>
s y f
r l g i
e t l
s r t
t l c y
p d s
301
ccaccgagcc ttccgacttc ggcacagccg accgctgctc gctcatcgag ctcgctgagg
ggtggctcgg aaggctgaag ccgtgtcggc tggcgacgag cgagtagctc gagcgactcc
>.............................msnH0.............................>
s t e
p s d f
g t a
d r c
s l i e
l a e
361
cggacaagtt ggatgccctg gacggtcaca tcgaggcaca gattcacgga ccggtcaggt
gcctgttcaa cctacgggac ctgccagtgt agctccgtgt ctaagtgcct ggccagtcca
>.............................msnH0.............................>
a d k
l d a l
d g h
i e a
q i h g
p v r
421
tcgactgtga cgtagaggcg ctggtgttgg atcccagcta tcgcggcaca gaggtcgaat
agctgacact gcatctccgc gaccacaacc tagggtcgat agcgccgtgt ctccagctta
>.............................msnH0.............................>
f d c
d v e a
l v l
d p s
y r g t
e v e
481
ccgcagctca ccgcctcccg tgcccgctcg aatggcatcc aggttttcgg ctcagcgtgg
ggcgtcgagt ggcggagggc acgggcgagc ttaccgtagg tccaaaagcc gagtcgcacc
>.............................msnH0.............................>
s a a
h r l p
c p l
e w h
p g f r
l s v
541
ctgaactgcg acgtcactca agctatcggg gacgggaata cgttgacctg ggtgctgaga
gacttgacgc tgcagtgagt tcgatagccc ctgcccttat gcaactggac ccacgactct
>.............................msnH0.............................>
a e l
r r h s
s y r
g r e
y v d l
g a e
601
tcgccgttga cgacctgctc acccccaaga tcatcgggga tgccgcccgc actggccgat
agcggcaact gctggacgag tgggggttct agtagcccct acggcgggcg tgaccggcta
>.............................msnH0.............................>
i a v
d d l l
t p k
i i g
d a a r
t g r
Anhang
387
661
acggccttca ggacctcaag aaggtctggc actgcctggc ccgcttcgga gaacgcacca
tgccggaagt cctggagttc ttccagaccg tgacggaccg ggcgaagcct cttgcgtggt
>.............................msnH0.............................>
y g l
q d l k
k v w
h c l
a r f g
e r t
721
cctgctgatc agtagtacca cctcgagccg gactggacgc tggccaaggg attacctgat
ggacgactag tcatcatggt ggagctcggc ctgacctgcg accggttccc taatggacta
>.....>> msnH0
t c -
781
agggcgtcac tcggtagctc tgagggccgc gaggtagccg gcccagctgt cctgagccgg
tcccgcagtg agccatcgag actcccggcg ctccatcggc cgggtcgaca ggactcggcc
841
gtctgtgtag cgaacggtgg aactcagtcg gttttgttca gcgtcgtccg gcggtgagcc
cagacacatc gcttgccacc ttgagtcagc caaaacaagt cgcagcaggc cgccactcgg
<<........msnT1.........<
r r g
a t l
901
ggccgtcgaa ggtgatgtcg aaggcttgga gtgcggcctt ccagcgcatg gtccagcgtt
ccggcagctt ccactacagc ttccgaacct cacgccggaa ggtcgcgtac caggtcgcaa
<.............................msnT1.............................<
r g d f
t i d
f a q
l a a k
w r m
t w r
961
tgcgtccggt gccggtcggg tccaggctca tgacggccag gtagacgcac ttgtgagcgg
acgcaggcca cggccagccc aggtccgagt actgccggtc catctgcgtg aacactcgcc
<.............................msnT1.............................<
k r g t
g t p
d l s
m v a l
y v c
k h a
1021
cctggtcggt gggaaagtgt ccccgggccc ggacggcctt gcggatccgc gcgttgatgc
ggaccagcca ccctttcaca ggggcccggg cctgccggaa cgcctaggcg cgcaactacg
<.............................msnT1.............................<
a q d t
p f h
g r a
r v a k
r i r
a n i
1081
tctcgatcgc gttcgtggtg cagacgatct tgcggatctc cacgtcgaac cggaggaaag
agagctagcg caagcaccac gtctgctaga acgcctagag gtgcagcttg gcctcctttc
<.............................msnT1.............................<
s e i a
n t t
c v i
k r i e
v d f
r l f
1141
gcacgaactc cgcccaggcc gcctcccaga gccggacgat cgccggatac ttcccgcccc
cgtgcttgag gcgggtccgg cggagggtct cggcctgcta gcggcctatg aagggcgggg
<.............................msnT1.............................<
p v f e
a w a
a e w
l r v i
a p y
k g g
1201
aggcgtcggt gaactccacg aaccgctcca gcgcggcctc ctcggtcggc gcggtgtaga
tccgcagcca cttgaggtgc ttggcgaggt cgcgccggag gagccagccg cgccacatct
<.............................msnT1.............................<
w a d t
f e v
f r e
l a a e
e t p
a t y
1261
cgggcctgag cgccttcgcg atcttctccc agtcctggcg cgccgcgtaa cggaagctgt
gcccggactc gcggaagcgc tagaagaggg tcaggaccgc gcggcgcatt gccttcgaca
<.............................msnT1.............................<
v p r l
a k a
i k e
w d q r
a a y
r f s
1321
tcctcagcag gtgaacgaca caggtctgga cgatcgtcgc aggccagacc gtattcacgg
aggagtcgtc cacttgctgt gtccagacct gctagcagcg tccggtctgg cataagtgcc
<.............................msnT1.............................<
n r l l
h v v
c t q
v i t a
p w v
t n v
388
Anhang
1381
cgtccgggag gccggtcagg ccgtcgcaga ccagcatcag gacatcggcc gcgccgcggt
gcaggccctc cggccagtcc ggcagcgtct ggtcgtagtc ctgtagccgg cgcggcgcca
<.............................msnT1.............................<
a d p l
g t l
g d c
v l m l
v d a
a g r
1441
tcttgacctc ggtcaggacc tggagccagt acttcgcgcc ctccccgccg tcgccgatcc
agaactggag ccagtcctgg acctcggtca tgaagcgcgg gaggggcggc agcggctagg
<.............................msnT1.............................<
n k v e
t l v
q l w
y k a g
e g g
d g i
1501
acaggcccag gatgtcccgg tgaccctcgg cggtgaccgc caccgccatg tagacaggcc
tgtccgggtc ctacagggcc actgggagcc gccactggcg gtggcggtac atctgtccgg
<.............................msnT1.............................<
w l g l
i d r
h g e
a t v a
v a m
y v p
1561
ggttggcaac ctgaccgtcc ctgaccttca cgttcacgca gtcgatgaag acgaccgggt
ccaaccgttg gactggcagg gactggaagt gcaagtgcgt cagctacttc tgctggccca
<.............................msnT1.............................<
r n a v
q g d
r v k
v n v c
d i f
v v p
1621
agacgctgtc caggggacgg ttctgccatt ccgtcatgcc ggccatcacg ctgtcggtga
tctgcgacag gtcccctgcc aagacggtaa ggcagtacgg ccggtagtgc gacagccact
<.............................msnT1.............................<
y v s d
l p r
n q w
e t m g
a m v
s d t
1681
tcgtggagat ggtggacttg gagatctccg cgccgtacac ctcggcgaga tgcgcggaga
agcacctcta ccacctgaac ctctagaggc gcggcatgtg gagccgctct acgcgcctct
<.............................msnT1.............................<
i t s i
t s k
s i e
a g y v
e a l
h a s
1741
tctccccgtg cgtcagccct ttcgccgaca gcgacaggac catctcgtcc accccgccca
agaggggcac gcagtcggga aagcggctgt cgctgtcctg gtagagcagg tggggcgggt
<.............................msnT1.............................<
i e g h
t l g
k a s
l s l v
m e d
v g g
1801
gacgccgctg ccgcttcttg accagctgcg gctcgaacga ccccgcccgg tcccgcggca
ctgcggcgac ggcgaagaac tggtcgacgc cgagcttgct ggggcgggcc agggcgccgt
<.............................msnT1.............................<
l r r q
r k k
v l q
p e f s
g a r
d r p
1861
ccgcgatctc gaccggcccc gactcggtga tcaccgtctt ggaccggtgc ccgttgcggt
ggcgctagag ctggccgggg ctgagccact agtggcagaa cctggccacg ggcaacgcca
<.............................msnT1.............................<
v a i e
v p g
s e t
i v t k
s r h
g n r
1921
agttctccct gccgccctcg gcccgctcac cgggctcgtg ccccagatga tccgtgagct
tcaagaggga cggcgggagc cgggcgagtg gcccgagcac ggggtctact aggcactcga
<.............................msnT1.............................<
y n e r
g g e
a r e
g p e h
g l h
d t l
1981
cgccctccag cgccgactcc agcacccgct tcgtcagctg ctgcagcagg ccgccctccc
gcgggaggtc gcggctgagg tcgtgggcga agcagtcgac gacgtcgtcc ggcgggaggg
<.............................msnT1.............................<
e g e l
a s e
l v r
k t l q
q l l
g g e
2041
cggtgagctt caccccaccg gcctgagccc gggcaaccaa ctcggcgacc agcccgtcat
gccactcgaa gtggggtggc cggactcggg cccgttggtt gagccgctgg tcgggcagta
<.............................msnT1.............................<
g t l k
v g g
a q a
r a v l
e a v
l g d
Anhang
389
2101
ccacggcacc cgccccactc acaacggcct ccccggcccc gatatcactc gccacgtcag
ggtgccgtgg gcggggtgag tgttgccgga ggggccgggg ctatagtgag cggtgcagtc
<.............................msnT1.............................<
d v a g
a g s
v v a
e g a g
i d s
a v d
2161
tcatcaactg tcgcttccag ctcgggagtt acaccactca ccgtacagac cccccgtacc
agtagttgac agcgaaggtc gagccctcaa tgtggtgagt ggcatgtctg gggggcatgg
<.<< msnT1
t m
2221
tgcgtggctg gagcccgtac gagcccaaac gggcatgaca gaggggtgtg tttgaaggat
acgcaccgac ctcgggcatg ctcgggtttg cccgtactgt ctccccacac aaacttccta
2281
cgtgtaagtc catgacgcga caggttggcc gggggctcgt cgatcaggtc ggtgttcggc
gcacattcag gtactgcgct gtccaaccgg cccccgagca gctagtccag ccacaagccg
2341
ggcagcgctg ttggctgtcc aacaccgcct tcaccacacc cgagcacctc atccagacca
ccgtcgcgac aaccgacagg ttgtggcgga agtggtgtgg gctcgtggag taggtctggt
2401
tctggcacgg tatgagaaag atccagtacc gtttccacct catcgacgga tgcctcaccg
agaccgtgcc atactctttc taggtcatgg caaaggtgga gtagctgcct acggagtggc
2461
ggaccggact gtccctcgcc ccaacgactt agaggtccta acagaagttg ttgatcaagt
cctggcctga cagggagcgg ggttgctgaa tctccaggat tgtcttcaac aactagttca
2521
gactttcggc ttgggtggtc gttggtcggg gcgtggggaa gcgtcagtcg cggccgtgga
ctgaaagccg aacccaccag caaccagccc cgcacccctt cgcagtcagc gccggcacct
>>....................msnT2......................>
v v
v g r
g v g
k r q s
r p w
2581
tcgtgtcgga cgaactgtgg tcgctcatcg agccgttact gcccgagccg gggccgaagc
agcacagcct gcttgacacc agcgagtagc tcggcaatga cgggctcggc cccggcttcg
>.............................msnT2.............................>
i v s
d e l w
s l i
e p l
l p e p
g p k
2641
tggtggcggg ccggccgcgg gtgccggacc gacaggccct gtgcgggatc ctgtttgtgc
accaccgccc ggccggcgcc cacggcctgg ctgtccggga cacgccctag gacaaacacg
>.............................msnT2.............................>
l v a
g r p r
v p d
r q a
l c g i
l f v
2701
tgcacacggg catccagtgg gagtacctgc cccaggagct gggcttcggc tcgggcatga
acgtgtgccc gtaggtcacc ctcatggacg gggtcctcga cccgaagccg agcccgtact
>.............................msnT2.............................>
l h t
g i q w
e y l
p q e
l g f g
s g m
2761
cctgctggcg gcgcctggcc gcctggaacg aggccggtgt gtgggagaag ctgcacctgg
ggacgaccgc cgcggaccgg cggaccttgc tccggccaca caccctcttc gacgtggacc
>.............................msnT2.............................>
t c w
r r l a
a w n
e a g
v w e k
l h l
2821
tgctgctgaa gaagagcggt cggcgaagca gctggactgg tcgagggcgg tgatcgactc
acgacgactt cttctcgcca gccgcttcgt cgacctgacc agctcccgcc actagctgag
>.............................msnT2.............................>
v l l
k k s g
r r s
s w t
g r g r
- s t
2881
ctcccacgtg cgggcggccc gacggggccc aaaagcggtc ccagcccggt cgaccgcgca
gagggtgcac gcccgccggg ctgccccggg ttttcgccag ggtcgggcca gctggcgcgt
>.............................msnT2.............................>
p p t
c g r p
d g a
q k r
s q p g
r p r
390
Anhang
2941
cggccgggca gcaagcacca cgtccttgtc gacgggcagg gcatcccgct cgcggtgtcg
gccggcccgt cgttcgtggt gcaggaacag ctgcccgtcc cgtagggcga gcgccacagc
>.............................msnT2.............................>
t a g
q q a p
r p c
r r a
g h p a
r g v
3001
ctgaccggcg gcaatcgcaa tgacgtcact cagctgatcc cgctgctgga caagattcca
gactggccgc cgttagcgtt actgcagtga gtcgactagg gcgacgacct gttctaaggt
>.............................msnT2.............................>
a d r
r q s q
- r h
s a d
p a a g
q d s
3061
cccgtggccg gcacggtcgg gcggccgcgg agacggccgg acatgctctt cgcggaccgc
gggcaccggc cgtgccagcc cgccggcgcc tctgccggcc tgtacgagaa gcgcctggcg
>.............................msnT2.............................>
t r g
r h g r
a a a
e t a
g h a l
r g p
3121
ggctacgacc atgacaagta ccggcgacta ttgcggaaac gcggcatccg gcccgcgatc
ccgatgctgg tactgttcat ggccgctgat aacgcctttg cgccgtaggc cgggcgctag
>.............................msnT2.............................>
r l r
p - q v
p a t
i a e
t r h p
a r d
3181
gccgaacgga gccagccaca cggctccggc ctgggcatct tccgctgggt cgtcgagcgc
cggcttgcct cggtcggtgt gccgaggccg gacccgtaga aggcgaccca gcagctcgcg
>.............................msnT2.............................>
r r t
e p a t
r l r
p g h
l p l g
r r a
3241
accctctcct ggctccacgg cttccgccgc ctgcggcatc cgctgggaac gacgcgacga
tgggagagga ccgaggtgcc gaaggcggcg gacgccgtag gcgacccttg ctgcgctgct
>.............................msnT2.............................>
h p l
l a p r
l p p
p a a
s a g n
d a t
3301
catccatgaa gccttcctcg gcctcgccac ctgtctcatc acccaccgac acgtccaacg
gtaggtactt cggaaggagc cggagcggtg gacagagtag tgggtggctg tgcaggttgc
>.............................msnT2.............................>
t s m
k p s s
a s p
p v s
s p t d
t s n
3361
cctttgttag gacctcttaa tgagtcaagc tcaggaggtg gaggcgggtg ggaggaggcg
ggaaacaatc ctggagaatt actcagttcg agtcctccac ctccgcccac cctcctccgc
>.........msnT2........>>
a f v
r t s <<...........msnH1.............<
- s t
s a p
p l l r
3421
gtccagaacg gcgtcgtgtt cttggaacac tacccgtccc acgttgcgca gttcgcgggc
caggtcttgc cgcagcacaa gaaccttgtg atgggcaggg tgcaacgcgt caagcgcccg
<.............................msnH1.............................<
d l v
a d h
e q f v
v r g
v n r
l e r a
3481
gagctgcagg tcgatgtttt cggcggggag cgggcccagt agcactgcgg acgggtgggt
ctcgacgtcc agctacaaaa gccgcccctc gcccgggtca tcgtgacgcc tgcccaccca
<.............................msnH1.............................<
l q l
d i n
e a p l
p g l
l v a
s p h t
3541
tccggcgtcg tggagtgtgg ccaggtccat ggcgacgagt ctggcgccgt acaggcgggc
aggccgcagc acctcacacc ggtccaggta ccgctgctca gaccgcggca tgtccgcccg
<.............................msnH1.............................<
g a d
h l t
a l d m
a v l
r a g
y l r a
3601
gacggtgtgt gcgatgccga gccctgggcc gtccatgtcg cctgcgtact gcagtgctac
ctgccacaca cgctacggct cgggacccgg caggtacagc ggacgcatga cgtcacgatg
<.............................msnH1.............................<
v t h
a i g
l g p g
d m d
g a y
q l a v
Anhang
391
3661
gccctggtcg acggcgagtt ggagcagggc gtggtcgacg gcgcgcaact gtccgctggt
cgggaccagc tgccgctcaa cctcgtcccg caccagctgc cgcgcgttga caggcgacca
<.............................msnH1.............................<
g q d
v a l
q l l a
h d v
a r l
q g s t
3721
gcacgccagt ggagcggggt ggccgcgggc gagggcggct tcgaggacgg atggattctc
cgtgcggtca cctcgcccca ccggcgcccg ctcccgccga agctcctgcc tacctaagag
<.............................msnH1.............................<
c a l
p a p
h g r a
l a a
e l v
s p n e
3781
caccacggtg aggacctggg tcgggtccag atgcggggga gtgcgggtca ggtcgaacag
gtggtgccac tcctggaccc agcccaggtc tacgccccct cacgcccagt ccagcttgtc
<.............................msnH1.............................<
v v t
l v q
t p d l
h p p
t r t
l d f l
3841
gtgcagtgcg acgggcgcgg cggcgtcgcg taggcgccgg tcgaccggtc cgtcgccgat
cacgtcacgc tgcccgcgcc gccgcagcgc atccgcggcc agctggccag gcagcggcta
<.............................msnH1.............................<
h l a
v p a
a a d r
l r r
d v p
g d g i
3901
ggcctggacg tggtggagca gcacggtggc ggtgagccgg tcaggtatca ctccggtctg
ccggacctgc accacctcgt cgtgccaccg ccactcggcc agtccatagt gaggccagac
<.............................msnH1.............................<
a q v
h h l
l v t a
t l r
d p i
v g t q
3961
ctcgagcagg gctcggatcc ggtccggtcg tgtcggctct gcctgtccgg tcagttcggc
gagctcgtcc cgagcctagg ccaggccagc acagccgaga cggacaggcc agtcaagccg
<.............................msnH1.............................<
e l l
a r i
r d p r
t p e
a q g
t l e a
4021
gaccagtgtg acgagtcggc tgccggcgag ggtgtcgagg tcgaagaagt gggggtcgtc
ctggtcacac tgctcagccg acggccgctc ccacagctcc agcttcttca cccccagcag
<.............................msnH1.............................<
v l t
v l r
s g a l
t d l
d f f
h p d d
4081
ggcggtatcg tgggcgagtt tgggcagtga gaccggcggg tcggccggca gccgggtggc
ccgccatagc acccgctcaa acccgtcact ctggccgccc agccggccgt cggcccaccg
<.............................msnH1.............................<
a t d
h a l
k p l s
v p p
d a p
l r t a
4141
cacggcggtg agggcgtcga tcagcttgcg cacctctgtg ccttcgtcga cgccgatccc
gtgccgccac tcccgcagct agtcgaacgc gtggagacac ggaagcagct gcggctaggg
<.............................msnH1.............................<
v a t
l a d
i l k r
v e t
g e d
v g i g
4201
ggcggcgcgc atccgcgtga ccagccccgg atacgccggc agctgtgcgg ccgcgtactg
ccgccgcgcg taggcgcact ggtcggggcc tatgcggccg tcgacacgcc ggcgcatgac
<.............................msnH1.............................<
a a r
m r t
v l g p
y a p
l q a
a a y q
4261
ccacacatcc tggcgtagcg ccgtgtcgct cgtgcgctgc cgcgcgcggt tgaccaccgg
ggtgtgtagg accgcatcgc ggcacagcga gcacgcgacg gcgcgcgcca actggtggcc
<.............................msnH1.............................<
w v d
q r l
a t d s
t r q
r a r
n v v p
4321
ccgtcccaca gcctgttcca ccagtgccac caagtcctgc ggttccagcc gcagtacctc
ggcagggtgt cggacaaggt ggtcacggtg gttcaggacg ccaaggtcgg cgtcatggag
<.............................msnH1.............................<
r g v
a q e
v l a v
l d q
p e l
r l v e
392
Anhang
4381
gcgtagcgcg cgcaccggta ctcgcgcccc gcgggcgtct acgaccactg cggaggtgcc
cgcatcgcgc gcgtggccat gagcgcgggg cgcccgcaga tgctggtgac gcctccacgg
<.............................msnH1.............................<
r l a
r v p
v r a g
r a d
v v v
a s t g
4441
gcgccgcagc cgccccgcgt cgtccagcca cgcccgcaac gccgctaccc ccgccgacgg
cgcggcgtcg gcggggcgca gcaggtcggt gcgggcgttg cggcgatggg ggcggctgcc
<.............................msnH1.............................<
r r l
r g a
d d l w
a r l
a a v
g a s p
4501
cagaccggtc acccgcacac tcgccattgc tgccggatcc gtcccagcgc aaagccggtt
gtctggccag tgggcgtgtg agcggtaacg acggcctagg cagggtcgcg tttcggccaa
<.............................msnH1.............................<
l g t
v r v
s a m a
a p d
t g a
c l r n
4561
gtgcacggcg gcccacagcg gggctagtgc ctcatcggcc gcgacccatt cccatgccgt
cacgtgccgc cgggtgtcgc cccgatcacg gagtagccgg cgctgggtaa gggtacggca
<.............................msnH1.............................<
h v a
a w l
p a l a
e d a
a v w
e w a t
4621
gtccatcagc cggccgtccc gccgtcgaag cccaggccga ggtctagcgt cagtggctgt
caggtagtcg gccggcaggg cggcagcttc gggtccggct ccagatcgca gtcaccgaca
<...<< msnH1
d m
<<.........................msnH2...........................<
g a t g
g d f
g l g
l d l t
l p q
4681
gcttccccgt ggccctgcca cagccacggc accgtcacgc ggtgcttccc gctggtgatg
cgaaggggca ccgggacggt gtcggtgccg tggcagtgcg ccacgaaggg cgaccactac
<.............................msnH2.............................<
a e g
h g q w
l w p
v t v
r h k g
s t i
4741
acctggtgga tgacgacctg cccggcctct ttcttgatca ccggcgtcat cgagggagcg
tggaccacct actgctggac gggccggaga aagaactagt ggccgcagta gctccctcgc
<.............................msnH2.............................<
v q h
i v v q
g a e
k k i
v p t m
s p a
4801
gtcgccagca catcgaactc ccaccggcgc agcagtccca gcatctgccg aaggttcgcg
cagcggtcgt gtagcttgag ggtggccgcg tcgtcagggt cgtagacggc ttccaagcgc
<.............................msnH2.............................<
t a l
v d f e
w r r
l l g
l m q r
l n a
4861
tcgtcgaacg ccgcgtccag ttcgtcgatc gacagcagcc gcggcccgcg gtactccccg
agcagcttgc ggcgcaggtc aagcagctag ctgtcgtcgg cgccgggcgc catgaggggc
<.............................msnH2.............................<
d d f
a a d l
e d i
s l l
r p g r
y e g
4921
ctgtacatcg accacgcggc cgccaggagg ggcagcatcg tggccaggcg tcgttccccg
gacatgtagc tggtgcgccg gcggtcctcc ccgtcgtagc accggtccgc agcaaggggc
<.............................msnH2.............................<
s y m
s w a a
a l l
p l m
t a l r
r e g
4981
gtcgacagcg tctccagcgg gttcatgccg cgcggcttga cctccttgaa gcggtcaccg
cagctgtcgc agaggtcgcc caagtacggc gcgccgaact ggaggaactt cgccagtggc
<.............................msnH2.............................<
t s l
t e l p
n m g
r p k
v e k f
r d g
5041
tccccgtcgc tgaacgagga gtgggtcacc gagatcttcc actcgtgcca ggcccggtag
aggggcagcg acttgctcct cacccagtgg ctctagaagg tgagcacggt ccgggccatc
<.............................msnH2.............................<
d g d
s f s s
h t v
s i k
w e h w
a r y
Anhang
393
5101
tcgaaggtgt gcgcgaccct gtccgcccac gtgtctccga cggactcgtc cattcgctgc
agcttccaca cgcgctggga caggcgggtg cacagaggct gcctgagcag gtaagcgacg
<.............................msnH2.............................<
d f t
h a v r
d a w
t d g
v s e d
m r q
5161
cgtagcacgt catacatccg ctcgaacatc tcgtccgagg ggggactttt caccagttcc
gcatcgtgca gtatgtaggc gagcttgtag agcaggctcc cccctgaaaa gtggtcaagg
<.............................msnH2.............................<
r l v
d y m r
e f m
e d s
p p s k
v l e
5221
accatggcct tcgcgtccgc gtccgtgcgc accgcccact cgaccttcac gcccacccgg
tggtaccgga agcgcaggcg caggcacgcg tggcgggtga gctggaagtg cgggtgggcc
<.............................msnH2.............................<
v m a
k a d a
d t r
v a w
e v k v
g v r
5281
gccaccccgg tacgcacgtc cttcaaggtc tggccgatct gccggaccag ttgttgcgcg
cggtggggcc atgcgtgcag gaagttccag accggctaga cggcctggtc aacaacgcgc
<.............................msnH2.............................<
a v g
t r v d
k l t
q g i
q r v l
q q a
5341
agatcctggc ggacctgaac gtcgcgctgt agttgggcga acatgctggt cttgatggct
tctaggaccg cctggacttg cagcgcgaca tcaacccgct tgtacgacca gaactaccga
<.............................msnH2.............................<
l d q
r v q v
d r q
l q a
f m s t
k i a
5401
ttcttgatgt cggcgcgcag gtcttgctcc agctgggcga ctgccgcgcg cagcgcctcc
aagaactaca gccgcgcgtc cagaacgagg tcgacccgct gacggcgcgc gtcgcggagg
<.............................msnH2.............................<
k k i
d a r l
d q e
l q a
v a a r
l a e
5461
actgctgtgc gcaggtcctg gccgcgggcg gcggccgggt cggcgacctc ggcacgctgc
tgacgacacg cgtccaggac cggcgcccgc cgccggccca gccgctggag ccgtgcgacg
<.............................msnH2.............................<
v a t
r l d q
g r a
a a p
d a v e
a r q
5521
caaccggtgc ccgatatgtt ggtgaggatg acctggcggt tgaaccgggc cagtgcgctg
gttggccacg ggctatacaa ccactcctac tggaccgcca acttggcccg gtcacgcgac
<.............................msnH2.............................<
w g t
g s i n
t l i
v q r
n f r a
l a s
5581
ttggcggtgc gggcggcgcc ttcgagggtc ttcagcgcag cgtcccgggc ccgggacgct
aaccgccacg cccgccgcgg aagctcccag aagtcgcgtc gcagggcccg ggccctgcga
<.............................msnH2.............................<
n a t
r a a g
e l t
k l a
a d r a
r s a
5641
gcggcgagcc ggtccgcccc cactcccgtg cctggcccgg tgtggcggtc ggccagcagg
cgccgctcgg ccaggcgggg gtgagggcac ggaccgggcc acaccgccag ccggtcgtcc
<.............................msnH2.............................<
a a l
r d a g
v g t
g p g
t h r d
a l l
5701
tgcctggccc aggccagtcc cgcggtcagg ttcgcgggcc ggccctccgg cccggtggag
acggaccggg tccggtcagg gcgccagtcc aagcgcccgg ccgggaggcc gggccacctc
<.............................msnH2.............................<
h r a
w a l g
a t l
n a p
r g e p
g t s
5761
atgccctcgt cgaccagggc caggccctcg tcgacgagtc ggcccaaccg ggtaaggcag
tacgggagca gctggtcccg gtccgggagc agctgctcag ccgggttggc ccattccgtc
<.............................msnH2.............................<
i g e
d v l a
l g e
d v l
r g l r
t l c
394
Anhang
5821
gcatcgcggt gctcctcggc cgcctggcgc agcggcgcga cctcatccag ccgcgcccgg
cgtagcgcca cgaggagccg gcggaccgcg tcgccgcgct ggagtaggtc ggcgcgggcc
<.............................msnH2.............................<
a d r
h e e a
a q r
l p a
v e d l
r a r
5881
gccgacgctg cgtcagcagc ggcctcttcc ttggcgcgtt gcagctcctc cacccgtgcc
cggctgcgac gcagtcgtcg ccggagaagg aaccgcgcaa cgtcgaggag gtgggcacgg
<.............................msnH2.............................<
a s a
a d a a
a e e
k a r
q l e e
v r a
5941
cgggcgcggt tgagcgcacc ggtgacctcc tgcagcgagg cgcgcagctc ctcgtactcg
gcccgcgcca actcgcgtgg ccactggagg acgtcgctcc gcgcgtcgag gagcatgagc
<.............................msnH2.............................<
r a r
n l a g
t v e
q l s
a r l e
e y e
6001
gcgccgtgca ggcgccgcat ctcctcgaca gccgccttct cgcgccccgc gtccacggcg
cgcggcacgt ccgcggcgta gaggagctgt cggcggaaga gcgcggggcg caggtgccgc
<.............................msnH2.............................<
a g h
l r r m
e e v
a a k
e r g a
d v a
6061
gtttgctctg cctcccgggc ggcgtcggcc gccagggtcc gccagcgttc ggcggttgcc
caaacgagac ggagggcccg ccgcagccgg cggtcccagg cggtcgcaag ccgccaacgg
<.............................msnH2.............................<
t q e
a e r a
a d a
a l t
r w r e
a t a
6121
gcgtcctggc gtgcccgtcc cgcgaggtcg atcacccgcc ctgcggcgcc ccgccaggcc
cgcaggaccg cacgggcagg gcgctccagc tagtgggcgg gacgccgcgg ggcggtccgg
<.............................msnH2.............................<
a d q
r a r g
a l d
i v r
g a a g
r w a
6181
tcgacctgcc ggaacatcaa ggtggtgtcc tcgcggtggg cgtcggccgc cttcggatcc
agctggacgg ccttgtagtt ccaccacagg agcgccaccc gcagccggcg gaagcctagg
<.............................msnH2.............................<
e v q
r f m l
t t d
e r h
a d a a
k p d
6241
gtgggcaaca cggtgccgcc gcccgcgtcg gctgcccggt tcaacgcccg cagcgcctga
cacccgttgt gccacggcgg cgggcgcagc cgacgggcca agttgcgggc gtcgcggact
<.............................msnH2.............................<
t p l
v t g g
g a d
a a r
n l a r
l a q
6301
cgcacggcct cgccggcccg gcggtgccgc tcgcgtgcat cggccgtgcg cctgatggag
gcgtgccgga gcggccgggc cgccacggcg agcgcacgta gccggcacgc ggactacctc
<.............................msnH2.............................<
r v a
e g a r
r h r
e r a
d a t r
r i s
6361
tgctgcagct gctcgctcgc gtcgtcctcc tgctgctggg ccgagaagac ctgatccagc
acgacgtcga cgagcgagcg cagcaggagg acgacgaccc ggctcttctg gactaggtcg
<.............................msnH2.............................<
h q l
q e s a
d d e
q q q
a s f v
q d l
6421
ggcgggaaac cggcctgctc ggcatcggcg tgggcctggg cgtccttcgc ctgctcccac
ccgccctttg gccggacgag ccgtagccgc acccggaccc gcaggaagcg gacgagggtg
<.............................msnH2.............................<
p p f
g a q e
a d a
h a q
a d k a
q e w
6481
acggcgtggc tggcggctgc ggtcccggcc gtctcgcgcg ccgtgccttc agccgttcgg
tgccgcaccg accgccgacg ccagggccgg cagagcgcgc ggcacggaag tcggcaagcc
<.............................msnH2.............................<
v a h
s a a a
t g a
t e r
a t g e
a t r
Anhang
395
6541
gctgcggcca gtgccgtggc cgccacctgt tcagtgtgcc gtgcctcctg ggccagcagc
cgacgccggt cacggcaccg gcggtggaca agtcacacgg cacggaggac ccggtcgtcg
<.............................msnH2.............................<
a a a
l a t a
a v q
e t h
r a e q
a l l
6601
tccagcgcgg tgcggcgccg cgcggcagcc gcgtccaggg cgtgtagtgc ctgcgccagc
aggtcgcgcc acgccgcggc gcgccgtcgg cgcaggtccc gcacatcacg gacgcggtcg
<.............................msnH2.............................<
e l a
t r r r
a a a
a d l
a h l a
q a l
6661
ccgcgttcgg ccaggcggat gtcctgagcg gaccggttgc gggtctcctg cagcgtcttg
ggcgcaagcc ggtccgccta caggactcgc ctggccaacg cccagaggac gtcgcagaac
<.............................msnH2.............................<
g r e
a l r i
d q a
s r n
r t e q
l t k
6721
agaaggccct gccacctctc gcgggcctgc tcccacccgg tgggggaggg gaaccggtcc
tcttccggga cggtggagag cgcccggacg agggtgggcc accccctccc cttggccagg
<.............................msnH2.............................<
l l g
q w r e
r a q
e w g
t p s p
f r d
6781
cgctccatcg cggcggcgtt cacccgggcg cgagagtgcg cagtctcctc gcgagcccgg
gcgaggtagc gccgccgcaa gtgggcccgc gctctcacgc gtcagaggag cgctcgggcc
<.............................msnH2.............................<
r e m
a a a n
v r a
r s h
a t e e
r a r
6841
tgcaatgtcc cctgcgcctg gtcgagttgc tgctccaggt cggctacgtg ccggagccgg
acgttacagg ggacgcggac cagctcaacg acgaggtcca gccgatgcac ggcctcggcc
<.............................msnH2.............................<
h l t
g q a q
d l q
q e l
d a v h
r l r
6901
gcgcgttcgc gggcacttcg cccgatgaac cgcgcctggt agccggccgg tgcgaccgcg
cgcgcaagcg cccgtgaagc gggctacttg gcgcggacca tcggccggcc acgctggcgc
<.............................msnH2.............................<
a r e
r a s r
g i f
r a q
y g a p
a v a
6961
gtcgccaccg cgatcgtgac ctgatcgccc gccgacgggt ccaggggaat cgaccgcagc
cagcggtggc gctagcactg gactagcggg cggctgccca ggtcccctta gctggcgtcg
<.............................msnH2.............................<
t a v
a i t v
q d g
a s p
d l p i
s r l
7021
agctggtgga cccgctcggg ggcgatccgg ccctgcgcgt cgggccgaag tacgtccgcc
tcgaccacct gggcgagccc ccgctaggcc gggacgcgca gcccggcttc atgcaggcgg
<.............................msnH2.............................<
l q h
v r e p
a i r
g q a
d p r l
v d a
7081
agactcgccc ccgacgccgc cgcagctcca gggcgcaggg tcacatcccc tgccaccgcc
tctgagcggg ggctgcggcg gcgtcgaggt cccgcgtccc agtgtagggg acggtggcgg
<...........................msnH2..........................<<
l s a
g s a a
a a g
p r l
t v d g
a v
7141
tgtccgtcgg cacggaccag tgcgtccagc aggccactga ccagcagagc accctcgagg
acaggcagcc gtgcctggtc acgcaggtcg tccggtgact ggtcgtctcg tgggagctcc
7201
cgatccgccg ggtgaaattc ggcaggccga agacagacca gaggtgcact tcgcccacgc
gctaggcggc ccactttaag ccgtccggct tctgtctggt ctccacgtga agcgggtgcg
7261
ccgcaatccc gtcggccgtt accagcgcga gaacggcaac agtcatgtgg agatccgctc
ggcgttaggg cagccggcaa tggtcgcgct cttgccgttg tcagtacacc tctaggcgag
7321
ggtgggggag tggttcgacg ccgacagcga cgttcggcac tggccctttt tggctcagct
ccaccccctc accaagctgc ggctgtcgct gcaagccgtg accgggaaaa accgagtcga
396
Anhang
7381
ggacgagagt caggtgtgcc gctggtcgac ggctgaggcg agccagtcca tggcctgcat
cctgctctca gtccacacgg cgaccagctg ccgactccgc tcggtcaggt accggacgta
7441
cgcggtgacg acaagtcggc ttgcgttgaa atgtgttggt gtcttgagcc ggtgagccat
gcgccactgc tgttcagccg aacgcaactt tacacaacca cagaactcgg ccactcggta
7501
tctgttgcgc gcggcgaagt gcggtgttgg ctgcgccgct tcaaccgtgc cggactggag
agacaacgcg cgccgcttca cgccacaacc gacgcggcga agttggcacg gcctgacctc
7561
ggtttggagg atctgggcgg gcagggccgt aagcgccgga tcgccgaggc cgagcggttt
ccaaacctcc tagacccgcc cgtcccggca ttcgcggcct agcggctccg gctcgccaaa
7621
tggccattga cctggtcaaa caggtgccgc cgggcaggct gtaggtgcag cccggcgggg
accggtaact ggaccagttt gtccacggcg gcccgtccga catccacgtc gggccgcccc
7681
atctgtgggc ggccgagtgg acctgactgc ctggccgccc aggccgggca gttgggtatc
tagacacccg ccggctcacc tggactgacg gaccggcggg tccggcccgt caacccatag
7741
gaggtcggcc gctcccaggt gtgcaggatg ctgatcgccg aggatggggg ctggcggtgt
ctccagccgg cgagggtcca cacgtcctac gactagcggc tcctaccccc gaccgccaca
7801
acccagatcg ccaacgacag gggaatgctc cgtcggtcag ttcgtctcgg gctgaacggc
tgggtctagc ggttgctgtc cccttacgag gcagccagtc aagcagagcc cgacttgccg
<<........msnH3..........<
n t e
p q v a
7861
ggccggggtc gttgcgggtg tggtcggttc cgggctgttg ctggtgtagt agacggagtt
ccggccccag caacgcccac accagccaag gcccgacaac gaccacatca tctgcctcaa
<.............................msnH3.............................<
a p t
t a p
t t p e
p s n
s t y
y v s n
7921
gccttgcttg gtgcgctggg catggctctt ggcgacgagt ccttcgactg tggtgcgtac
cggaacgaac cacgcgaccc gtaccgagaa ccgctgctca ggaagctgac accacgcatg
<.............................msnH3.............................<
g q k
t r q
a h s k
a v l
g e v
t t r v
7981
gacggtggtc ttgatggtgc ggtcggggtg ggcctggccg agtgcggtgg cgatttccgc
ctgccaccag aactaccacg ccagccccac ccggaccggc tcacgccacc gctaaaggcg
<.............................msnH3.............................<
v t t
k i t
r d p h
a q g
l a t
a i e a
8041
tgcggagcgg ggttcgctct gatcggcgag gtggcggcgg atcaaatcga cgagggtggg
acgcctcgcc ccaagcgaga ctagccgctc caccgccgcc tagtttagct gctcccaccc
<.............................msnH3.............................<
a s r
p e s
q d a l
h r r
i l d
v l t p
8101
ctgggccgcc ttcgcggccg tcgtcttggc tgtggcctcg ggcttcttgg cggccggctt
gacccggcgg aagcgccggc agcagaaccg acaccggagc ccgaagaacc gccggccgaa
<.............................msnH3.............................<
q a a
k a a
t t k a
t a e
p k k
a a p k
8161
cttgaccgcc tcgccgcctt gcgcggcggc agtcttcttg gcccgtaccc gcttgcttgc
gaactggcgg agcggcggaa cgcgccgccg tcagaagaac cgggcatggg cgaacgaacg
<.............................msnH3.............................<
k v a
e g g
q a a a
t k k
a r v
r k s a
8221
accgggctgc ggggtggtct tctgtcgcgg taccgagggc gttgccgcgg cttcgggggc
tggcccgacg ccccaccaga agacagcgcc atggctcccg caacggcgcc gaagcccccg
<.............................msnH3.............................<
g p q
p t t
k q r p
v s p
t a a
a e p a
Anhang
397
8281
aggctgcgcg gcggtgtctg tggcgccaag tgccttttgc atgctcgtca gcacggtgtg
tccgacgcgc cgccacagac accgcggttc acggaaaacg tacgagcagt cgtgccacac
<.............................msnH3.............................<
p q a
a t d
t a g l
a k q
m s t
l v t h
8341
gtcgtgttgc agggcgagca gttgttcctg cagcgcgttg atttccgcgc cgatgcggtc
cagcacaacg tcccgctcgt caacaaggac gtcgcgcaac taaaggcgcg gctacgccag
<.............................msnH3.............................<
d h q
l a l
l q e q
l a n
i e a
g i r d
8401
ctgctccttg gcattgcgtt caaggtcgct tgccacctgg gccgtgtatt gcgatgtcag
gacgaggaac cgtaacgcaa gttccagcga acggtggacc cggcacataa cgctacagtc
<.............................msnH3.............................<
q e k
a n r
e l d s
a v q
a t y
q s t l
8461
ttcggtagtg gcggtctggg tgtcaggcat gatgctggtg tcggttattc gtacagttga
aagccatcac cgccagaccc acagtccgta ctacgaccac agccaataag catgtcaact
<............msnH3............<<
e t t
a t q
t d p m
8521
gacacattta tcgcaatgac ctgcaacatc tcgactgtgc tcatagaaac tgaggttgag
ctgtgtaaat agcgttactg gacgttgtag agctgacacg agtatctttg actccaactc
8581
tcggctgtgt gactgaactg ctctgatgag gtgcagaggc tcctgaggct ctcggcggca
agccgacaca ctgacttgac gagactactc cacgtctccg aggactccga gagccgccgt
8641
ggcctgtgac ctggagtgcc tcatgtctat caagaatgtc tcaactttac ggataatttc
ccggacactg gacctcacgg agtacagata gttcttacag agttgaaatg cctattaaag
8701
ttgagattag ggtcctgggg gtgcggagaa gtcgatcttg gtttggggat ggtgagccgt
aactctaatc ccaggacccc cacgcctctt cagctagaac caaaccccta ccactcggca
8761
cgaagaagag ggacgagctg gcgttcgtca aagtgcaccg cagtgggtgc ctctgcgcct
gcttcttctc cctgctcgac cgcaagcagt ttcacgtggc gtcacccacg gagacgcgga
8821
ccgtaaccga gggtggcgtc ccagatttgg tggcggccat gcacgaccgt cctgctggcg
ggcattggct cccaccgcag ggtctaaacc accgccggta cgtgctggca ggacgaccgc
8881
ctgtcagttc tagggtggct gcggcagttg gccccgtgcc agggagagca cgatggtcta
gacagtcaag atcccaccga cgccgtcaac cggggcacgg tccctctcgt gctaccagat
8941
tgccggatgg gtcatcgcgg cgtcggctgc atgcgcaggg ccgaaggtgt gaggcgaccg
acggcctacc cagtagcgcc gcagccgacg tacgcgtccc ggcttccaca ctccgctggc
9001
atgggcagca cggcgacgac gaccagtcgg ggcacctcgg tggtgctgcg cgcatgggta
tacccgtcgt gccgctgctg ctggtcagcc ccgtggagcc accacgacgc gcgtacccat
9061
gtgatccaga tgcggtcatc gaagtcggag tagccgccct ggtcgttgct gtggtcgccg
cactaggtct acgccagtag cttcagcctc atcggcggga ccagcaacga caccagcggc
9121
atgaccagca tgccgaacgg cggtccggtg gcggtgtagt tggcggcctg cgcgaggtcg
tactggtcgt acggcttgcc gccaggccac cgccacatca accgccggac gcgctccagc
9181
gggctggtgc cggtgggcga tgcctgggcc accaccaacc ccctgttcgg cctgggcatg
cccgaccacg gccacccgct acggacccgg tggtggttgg gggacaagcc ggacccgtac
>>.........................msnH4..........................>
v
p v g
d a w a
t t n
p l f
g l g m
398
Anhang
9241
acgacggggt ttcagcaggg cgtactcctc cgcgatcagc tgcgcaagac gggcacggac
tgctgcccca aagtcgtccc gcatgaggag gcgctagtcg acgcgttctg cccgtgcctg
>.............................msnH4.............................>
t t g
f q q
g v l l
r d q
l r k
t g t d
9301
gaccctgccg agttctcgct ctcgtacggc cgggcgaccg aggagaactt cgggccgatg
ctgggacggc tcaagagcga gagcatgccg gcccgctggc tcctcttgaa gcccggctac
>.............................msnH4.............................>
d p a
e f s
l s y g
r a t
e e n
f g p m
9361
tgggacaacg cggaggcctg ggaccgacac cggctcgccg agatcgacga ggagatgcgg
accctgttgc gcctccggac cctggctgtg gccgagcggc tctagctgct cctctacgcc
>.............................msnH4.............................>
w d n
a e a
w d r h
r l a
e i d
e e m r
9421
ggccgaacgt acaccacgga cgacgagagc tggcagctgg gtattaccct ggacgccgtc
ccggcttgca tgtggtgcct gctgctctcg accgtcgacc cataatggga cctgcggcag
>.............................msnH4.............................>
g r t
y t t
d d e s
w q l
g i t
l d a v
9481
cggctgcgcg acccccgagt cctgcgcgcc gtgtgggacg tcgcctgcac ctacctcacc
gccgacgcgc tgggggctca ggacgcgcgg cacaccctgc agcggacgtg gatggagtgg
>.............................msnH4.............................>
r l r
d p r
v l r a
v w d
v a c
t y l t
9541
gccgacgagg tgttcgtccg gtccggcctg atcgaacgcg tcgtacaact gggagcaggc
cggctgctcc acaagcaggc caggccggac tagcttgcgc agcatgttga ccctcgtccg
>.............................msnH4.............................>
a d e
v f v
r s g l
i e r
v v q
l g a g
9601
ctcccgcgct acaccgcacc cggcccgcac cgcaccgaac tgctgacggc gctgggtgtg
gagggcgcga tgtggcgtgg gccgggcgtg gcgtggcttg acgactgccg cgacccacac
>.............................msnH4.............................>
l p r
y t a
p g p h
r t e
l l t
a l g v
9661
tccaagaagc gctgaaccgc cgcctcgcgg acgccggtgt cgaacgggac gcdmmgskcs
aggttcttcg cgacttggcg gcggagcgcc tgcggccaca gcttgccctg cghkkcsmgs
>....msnH4....>>
s k k
r -
9721
gscbgdcgcg ctccggtgaa cagagcggcg ctcttggtct ccagccacgg gccgtcgggc
csgvchgcgc gaggccactt gtctcgccgc gagaaccaga ggtcggtgcc cggcagcccg
9781
ttcacgcgcc ggtcgcggcg ccgctccccg gtgttcgccg cgccgcagcg gcccgtgcga
aagtgcgcgg ccagcgccgc ggcgaggggc cacaagcggc gcggcgtcgc cgggcacgct
9841
gcggccgtgt tcccaggccg ccgggacgac atgatcgacg ccgacgccct cgggccaggg
cgccggcaca agggtccggc ggccctgctg tactagctgc ggctgcggga gcccggtccc
9901
tcagtcggag ccggacggag aacgcccgcc acggcaggtc gatccgtcct cctcgccatg
agtcagcctc ggcctgcctc ttgcgggcgg tgccgtccag ctaggcagga ggagcggtac
9961
ggttgcccct cacccggccg gtacaccact ccgcggacgt gacagaccct gcggcggacc
ccaacgggga gtgggccggc catgtggtga ggcgcctgca ctgtctggga cgccgcctgg
10021
cgtctccggg gcgtttcacc tcaccaccgc aaacccccgc tcacctccag cacatgcccg
gcagaggccc cgcaaagtgg agtggtggcg tttgggggcg agtggaggtc gtgtacgggc
<<.................msnO1..................<
- w r
l g g
s v e l
v h g
Anhang
399
10081
ttgacgtacc ggctgtcgga gctggccagg aacaccgccg cgtccgccac ctcctccggc
aactgcatgg ccgacagcct cgaccggtcc ttgtggcggc gcaggcggtg gaggaggccg
<.............................msnO1.............................<
n v y
r s d s
s a l
f v a
a d a v
e e p
10141
ttccccatgc gccccatggc gagcttggcc gcgtagtggg gccagatctt cttgttgcgg
aaggggtacg cggggtaccg ctcgaaccgg cgcatcaccc cggtctagaa gaacaacgcc
<.............................msnO1.............................<
k g m
r g m a
l k a
a y h
p w i k
k n r
10201
ggcagcaggc tgcccatgcc ggagtcgatg aggcccgggg agagacagtt gacggtgatg
ccgtcgtccg acgggtacgg cctcagctac tccgggcccc tctctgtcaa ctgccactac
<.............................msnO1.............................<
p l l
s g m g
s d i
l g p
s l c n
v t i
10261
ttgcgggggg cgagttcggc ggcgcagacg cgggtgaacg cctcgacggc ggccttcgag
aacgcccccc gctcaagccg ccgcgtctgc gcccacttgc ggagctgccg ccggaagctc
<.............................msnO1.............................<
n r p
a l e a
a c v
r t f
a e v a
a k s
10321
gaactgtaga ccgatgcccc gggcgtcacc tgcccggcca ggacggagga catggtgatg
cttgacatct ggctacgggg cccgcagtgg acgggccggt cctgcctcct gtaccactac
<.............................msnO1.............................<
s s y
v s a g
p t v
q g a
l v s s
m t i
10381
agccgggcgt gctcgctgcg ctccaggtag ggcacggcgg cctggacgca gcggaagaca
tcggcccgca cgagcgacgc gaggtccatc ccgtgccgcc ggacctgcgt cgccttctgt
<.............................msnO1.............................<
l r a
h e s r
e l y
p v a
a q v c
r f v
10441
ccggtgaggt tggtgccgat cacctcgtcc cacgcctcct ccggcagagt ggcggcgggg
ggccactcca accacggcta gtggagcagg gtgcggagga ggccgtctca ccgccgcccc
<.............................msnO1.............................<
g t l
n t g i
v e d
w a e
e p l t
a a p
10501
cccgggcggc tgaccccggc gttggccacg acgatgtcga cgccgcccag gtggaggtcg
gggcccgccg actggggccg caaccggtgc tgctacagct gcggcgggtc cacctccagc
<.............................msnO1.............................<
g p r
s v g a
n a v
v i d
v g g l
h l d
10561
gcgtactcca tgagggcgtc gacggaggca cggtcctgga cgtcgacgga gtggaagagg
cgcatgaggt actcccgcag ctgcctccgt gccaggacct gcagctgcct caccttctcc
<.............................msnO1.............................<
a y e
m l a d
v s a
r d q
v d v s
h f l
10621
tatttgcccg gcccgatgga catctcccac tccgcgtgat cggcgttgcg ggccgccgcg
ataaacgggc cgggctacct gtagagggtg aggcgcacta gccgcaacgc ccggcggcgc
<.............................msnO1.............................<
y k g
p g i s
m e w
e a h
d a n r
a a a
10681
accacgtcgc agccctcccg gatgaacgcc tgggtgatgg cccggccgag ccccttcgtc
tggtgcagcg tcgggagggc ctacttgcgg acccactacc gggccggctc ggggaagcag
<.............................msnO1.............................<
v v d
c g e r
i f a
q t i
a r g l
g k t
10741
ccgccggtca ctacggcctt gcggccggcc agcctcgttg tgggcacgcc gcccccttct
ggcggccagt gatgccggaa cgccggccgg tcggagcaac acccgtgcgg cgggggaaga
<......................msnO1.....................<<
g g t
v v a k
r g a
l r t
t p v
400
Anhang
10801
tcgtcgtagg cgaatccgat tcccggttcc ggtgcgggct cgtacagcag gccccgctcg
agcagcatcc gcttaggcta agggccaagg ccacgcccga gcatgtcgtc cggggcgagc
10861
acgaggccct gcaccaggcc ccagtggacg aggtcgccca gtccgagtgc tctcatgacg
tgctccggga cgtggtccgg ggtcacctgc tccagcgggt caggctcacg agagtactgc
10921
gcctcctggt tagaactcgc gagaacccgc gagaggccgt gctcatgcga agcggggcag
cggaggacca atcttgagcg ctcttgggcg ctctccggca cgagtacgct tcgccccgtc
<<.....msnO2......<
- a
f r p l
10981
cacgtgctcc gcgaagagtt cgagggtgcg gacggactcc tcgaacggca tgttcccgga
gtgcacgagg cgcttctcaa gctcccacgc ctgcctgagg agcttgccgt acaagggcct
<.............................msnO2.............................<
v h e
a f l
e l t r
v s e
e f p
m n g s
11041
gacgatctgg agactgatgg tggtctcgcc gtagaggtcg cggatgagtt ccacgcggtc
ctgctagacc tctgactacc accagagcgg catctccagc gcctactcaa ggtgcgccag
<.............................msnO2.............................<
v i q
l s i
t t e g
y l d
r i l
e v r d
11101
cgcgacctcc tgcggatcgc ccacgagcac cttgttgtcc cgcagctgct tgccgaagtc
gcgctggagg acgcctagcg ggtgctcgtg gaacaacagg gcgtcgacga acggcttcag
<.............................msnO2.............................<
a v e
q p d
g v l v
k n d
r l q
k g f d
11161
gccgctgttg acccgggcca cgatccgctc gtagcccgcg tagtcggcgc tgcggttgtg
cggcgacaac tgggcccggt gctaggcgag catcgggcgc atcagccgcg acgccaacac
<.............................msnO2.............................<
g s n
v r a
v i r e
y g a
y d a
s r n h
11221
ctgccaggag gacacggccg cggcgagcag ccggttggtg cgctccgagt agacctggcc
gacggtcctc ctgtgccggc gccgctcgtc ggccaaccac gcgaggctca tctggaccgg
<.............................msnO2.............................<
q w s
s v a
a a l l
r n t
r e s
y v q g
11281
gaggcggtgc gccttatcac ggtcctcggc gaggtagcag ttgtagctga agtggatgtc
ctccgccacg cggaatagtg ccaggagccg ctccatcgtc aacatcgact tcacctacag
<.............................msnO2.............................<
l r h
a k d
r d e a
l y c
n y s
f h i d
11341
ctcgtcggtc gacgcgaggc cggccgccgt ccgggtgtcc cggtagcggg cgagcatctc
gagcagccag ctgcgctccg gccggcggca ggcccacagg gccatcgccc gctcgtagag
<.............................msnO2.............................<
e d t
s a l
g a a t
r t d
r y r
a l m e
11401
ctggagcttc tcctgcttgt tgatcgacgg gaccatcatc acgccgtgac cggccgcgcc
gacctcgaag aggacgaaca actagctgcc ctggtagtag tgcggcactg gccggcgcgg
<.............................msnO2.............................<
q l k
e q k
n i s p
v m m
v g h
g a a g
11461
cgccgcctcg ccggactcgg gggtgatggc cgtcgccacc aggacccggg ggtgcgggga
gcggcggagc ggcctgagcc cccactaccg gcagcggtgg tcctgggccc ccacgcccct
<.............................msnO2.............................<
a a e
g s e
p t i a
t a v
l v r
p h p s
11521
ctggaacggg cggggcagca gggtcaacgg gccgaaggag tggaagcggc cctcgaacgt
gaccttgccc gccccgtcgt cccagttgcc cggcttcctc accttcgccg ggagcttgca
<.............................msnO2.............................<
q f p
r p l
l t l p
g f s
h f r
g e f t
Anhang
401
11581
ggtctcctcc tcggtccaca gccgcaggca ggactccacg ccctcgttaa agcgagcccg
ccagaggagg agccaggtgt cggcgtccgt cctgaggtgc gggagcaatt tcgctcgggc
<.............................msnO2.............................<
t e e
e t w
l r l c
s e v
g e n
f r a r
11641
gctctcgtcc atcgggatct ggtacgccca gaactcctcg ggcagaaaac cccggccgaa
cgagagcagg tagccctaga ccatgcgggt cttgaggagc ccgtcttttg gggccggctt
<.............................msnO2.............................<
s e d
m p i
q y a w
f e e
p l f
g r g f
11701
gccgacatcg aggcggccgt gcgacaggtg gtccagcatg gcgagcttgc cggccagttt
cggctgtagc tccgccggca cgctgtccac caggtcgtac cgctcgaacg gccggtcaaa
<.............................msnO2.............................<
g v d
l r g
h s l h
d l m
a l k
g a l k
11761
gaccgggtgg ctgaacgcgg gaagcgccgc gccggtgatc agccgcaccc ggctggtgcg
ctggcccacc gacttgcgcc cttcgcggcg cggccactag tcggcgtggg ccgaccacgc
<.............................msnO2.............................<
v p h
s f a
p l a a
g t i
l r v
r s t r
11821
ggcggccgcc gccgcgagga aggtgaccgg gtcggggctg tagccgccgt acgcggagaa
ccgccggcgg cggcgctcct tccactggcc cagccccgac atcggcggca tgcgcctctt
<.............................msnO2.............................<
a a a
a a l
f t v p
d p s
y g g
y a s f
11881
atagtgctcg acggttttga catggtggaa gccgagctgc tcggcgcgtt cggcgagcgc
tatcacgagc tgccaaaact gtaccacctt cggctcgacg agccgcgcaa gccgctcgcg
<.............................msnO2.............................<
y h e
v t k
v h h f
g l q
e a r
e a l a
11941
caggcagtcg tcgaagaact ggaccccgct cttgtcctcg gggccgacgg tggggaagag
gtccgtcagc agcttcttga cctggggcga gaacaggagc cccggctgcc accccttctc
<.............................msnO2.............................<
l c d
d f f
q v g s
k d e
p g v
t p f l
12001
attgatgccg aatttcacga cgcgttcctc tcgggaagga gcttcaggta cgaacggcgg
taactacggc ttaaagtgct gcgcaaggag agcccttcct cgaagtccat gcttgccgcc
<......msnO2.....<<
n i g
f k v
<<....................msnO3......................<
- s
a n r
e p l
l k l y
s r r
12061
tggtagagca gggcgccctt gtcgtggacc tcgccgccga ggacgcggcc gagcaggatc
accatctcgt cccgcgggaa cagcacctgg agcggcggct cctgcgccgg ctcgtcctag
<.............................msnO3.............................<
h y l
l a g k
d h v
e g g
l v r g
l l i
12121
cagtggtccc ccgcctcgat ccgggactcg gcggcgcact ccagataggc gacggagtcg
gtcaccaggg ggcggagcta ggccctgagc cgccgcgtga ggtctatccg ctgcctcagc
<.............................msnO3.............................<
w h d
g a e i
r s e
a a c
e l y a
v s d
12181
gcgaacagga tcggcgaacc cgccgcccgc gacgacgtgc ggtgctggac ccccgcgaac
cgcttgtcct agccgcttgg gcggcgggcg ctgctgcacg ccacgacctg ggggcgcttg
<.............................msnO3.............................<
a f l
i p s g
a a r
s s t
r h q v
g a f
12241
ttgtccgcgc tcttcgtcgc gaactgccgg gagacctgct cggagcccgc ggagaggaag
aacaggcgcg agaagcagcg cttgacggcc ctctggacga gcctcgggcg cctctccttc
<.............................msnO3.............................<
k d a
s k t a
f q r
s v q
e s g a
s l f
402
Anhang
12301
ttgacgacga atccgttcgc ctgctggagc gccggaaggg tctgggagga cttgtcgacg
aactgctgct taggcaagcg gacgacctcg cggccttccc agaccctcct gaacagctgc
<.............................msnO3.............................<
n v v
f g n a
q q l
a p l
t q s s
k d v
12361
cagatcagca gcagcggcgg atccatggac accgcgcaga cggcgctgct ggtcagtccc
gtctagtcgt cgtcgccgcc taggtacctg tggcgcgtct gccgcgacga ccagtcaggg
<.............................msnO3.............................<
c i l
l l p p
d m s
v a c
v a s s
t l g
12421
ttgggcatgc cctgggcgtc ggtggtggtg atgacggcga cagaggtggg gagggaggcg
aacccgtacg ggacccgcag ccaccaccac tactgccgct gtctccaccc ctccctccgc
<.............................msnO3.............................<
k p m
g q a d
t t t
i v a
v s t p
l s a
12481
aaggcgtcgc ggaagaggga agcgtcgaca gtgccggtgg tggtgccggt gggcatggcg
ttccgcagcg ccttctccct tcgcagctgt cacggccacc accacggcca cccgtaccgc
<...........................msnO3..........................<<
f a d
r f l s
a d v
t g t
t t g t
p m
12541
ccctccttcg gtctggtacg gggtcagcgg tccgatgatg tggtggacgg ggtcggggac
gggaggaagc cagaccatgc cccagtcgcc aggctactac accacctgcc ccagcccctg
<<...............msnH5.................<
- r
d s s
t t s p
t p s
12601
cgttccgcca gcaccgtctc cagcagccgg gtcgcgttgc ggtgcagggg aatctccggg
gcaaggcggt cgtggcagag gtcgtcggcc cagcgcaacg ccacgtcccc ttagaggccc
<.............................msnH5.............................<
r e a
l v t e
l l r
t a n
r h l p
i e p
12661
ccgggcggga gacggccgtg ggtgctgagc agtgcggtca cccgggcggt gatcaggcag
ggcccgccct ctgccggcac ccacgactcg tcacgccagt gggcccgcca ctagtccgtc
<.............................msnH5.............................<
g p p
l r g h
t s l
l a t
v r a t
i l c
12721
aaccggaacg ccgcgaacac ctcgtagtac tccaggtgcc gcagccgcgt gccggtgagc
ttggccttgc ggcgcttgtg gagcatcatg aggtccacgg cgtcggcgca cggccactcg
<.............................msnH5.............................<
f r f
a a f v
e y y
e l h
r l r t
g t l
12781
cgctcgtagc ggcggaccgt ctccgcgcgg ccgggcagtc ccgtgagccg ggggaccccg
gcgagcatcg ccgcctggca gaggcgcgcc ggcccgtcag ggcactcggc cccctggggc
<.............................msnH5.............................<
r e y
r r v t
e a r
g p l
g t l r
p v g
12841
atgccttcgc tgaggtgccg gtcgaggtgg aggaaccagg cgaggtcgct ctcggccggg
tacggaagcg actccacggc cagctccacc tccttggtcc gctccagcga gagccggccc
<.............................msnH5.............................<
i g e
s l h r
d l h
l f w
a l d s
e a p
12901
cccgtctcgg ccatgtccca gtccagcacc gcgaccgggg acagaccctg gaagatgagg
gggcagagcc ggtacagggt caggtcgtgg cgctggcccc tgtctgggac cttctactcc
<.............................msnH5.............................<
g t e
a m d w
d l v
a v p
s l g q
f i l
12961
ttgcccagcc gggcgtcccc ccacagcagc cgcgcgggtc cggactccgg tggccggtgg
aacgggtcgg cccgcagggg ggtgtcgtcg gcgcgcccag gcctgaggcc accggccacc
<.............................msnH5.............................<
n g l
r a d g
w l l
r a p
g s e p
p r h
Anhang
403
13021
gcgcgcagcc aggccagggc gcggcgggcg gcgggcggct cgtggggagt gtagaaggtg
cgcgcgtcgg tccggtcccg cgccgcccgc cgcccgccga gcacccctca catcttccac
<.............................msnH5.............................<
a r l
w a l a
r r a
a p p
e h p t
y f t
13081
aagtggctct cgtagtggtt gagttgtctg agcaggtacg gccgtgagtc gcccgcggtg
ttcaccgaga gcatcaccaa ctcaacagac tcgtccatgc cggcactcag cgggcgccac
<.............................msnH5.............................<
f h s
e y h n
l q r
l l y
p r s d
g a t
13141
aggaagtcca ggccgagcgc gaccgggtcc agggcgtgca gccgggccag gacgccgagg
tccttcaggt ccggctcgcg ctggcccagg tcccgcacgt cggcccggtc ctgcggctcc
<.............................msnH5.............................<
l f d
l g l a
v p d
l a h
l r a l
v g l
13201
ccggcggacc agagggcacg gcgctccgtc ggggcgagat ccgcgatcca gcccgaccgg
ggccgcctgg tctcccgtgc cgcgaggcag ccccgctcta ggcgctaggt cgggctggcc
<.............................msnH5.............................<
g a s
w l a r
r e t
p a l
d a i w
g s r
13261
tggtaggagg gcacgtcggc ggggacccgc ccgtccactc tctccatgat catgaacggc
accatcctcc cgtgcagccg cccctgggcg ggcaggtgag agaggtacta gtacttgccg
<.............................msnH5.............................<
h y s
p v d a
p v r
g d v
r e m i
m f p
13321
gcgccgagaa ccgccgggtc cttttcgtgc cagagtacgg gcggcaccgg gaggtccgtg
cgcggctctt ggcggcccag gaaaagcacg gtctcatgcc cgccgtggcc ctccaggcac
<.............................msnH5.............................<
a g l
v a p d
k e h
w l v
p p v p
l d t
13381
tcggcggcca ggatgcgctg gaggcctacc tgggcggcga agcggctgtc ggggtgcacc
agccgccggt cctacgcgac ctccggatgg acccgccgct tcgccgacag ccccacgtgg
<.............................msnH5.............................<
d a a
l i r q
l g v
q a a
f r s d
p h v
13441
tggtggcggg tgggcgccac gcgcaggatc gccacatggg tgcgagcggc cccctgcgcg
accaccgccc acccgcggtg cgcgtcctag cggtgtaccc acgctcgccg ggggacgcgc
<.............................msnH5.............................<
q h r
t p a v
r l i
a v h
t r a a
g q a
13501
tcccgccagg tcagctggat cgtcagcgtc tcgttggtga agccggaacc ggtggggacg
agggcggtcc agtcgaccta gcagtcgcag agcaaccact tcggccttgg ccacccctgc
<.............................msnH5.............................<
d r w
t l q i
t l t
e n t
f g s g
t p v
13561
tccaggccgg acacggcgac gtcggtggcg tcggggaggc gtgcggcgaa ccagaccgcg
aggtccggcc tgtgccgctg cagccaccgc agcccctccg cacgccgctt ggtctggcgc
<.............................msnH5.............................<
d l g
s v a v
d t a
d p l
r a a f
w v a
13621
agtcgttccg aagtggtccc cgcgtcgcgt tgaaggggga caggcatgtg gactcccgtc
tcagcaaggc ttcaccaggg gcgcagcgca acttccccct gtccgtacac ctgagggcag
<......................msnH5.....................<<
l r e
s t t g
a d r
q l p
v p m
13681
ggaggaaaaa aggggggtgg tggtgagggg agcggaagcg gtcctctcag tccgctggcc
cctccttttt tccccccacc accactcccc tcgccttcgc caggagagtc aggcgaccgg
<<...msnK2....<
d a p
404
Anhang
13741
cgcgcagcac catcgccgag ttgaagcccc cgtacccgcg tgccagcacc agcgcggtcc
gcgcgtcgtg gtagcggctc aacttcgggg gcatgggcgc acggtcgtgg tcgcgccagg
<.............................msnK2.............................<
g r l v
m a s
n f g
g y g r
a l v
l a t
13801
gcaggggcgc ccgccgtggt tgtgcgacga ccaggtcgag ctgatagggc gcggggacgt
cgtccccgcg ggcggcacca acacgctgct ggtccagctc gactatcccg cgcccctgca
<.............................msnK2.............................<
r l p a
r r p
q a v
v l d l
q y p
a p v
13861
cggcggtgtg cacggtcggg gggatcacac cctcgcgcag cgccatgaac gcccacgcga
gccgccacac gtgccagccc ccctagtgtg ggagcgcgtc gcggtacttg cgggtgcgct
<.............................msnK2.............................<
d a t h
v t p
p i v
g e r l
a m f
a w a
13921
ggtcgaggga gccaccgccg gcgtacaggc gtccggtcat ggtcttcggc acggtgacgg
ccagctccct cggtggcggc cgcatgtccg caggccagta ccagaagccg tgccactgcc
<.............................msnK2.............................<
l d l s
g g g
a y l
r g t m
t k p
v t v
13981
gcaccccgta cggtccgaag agcgttcgca gggcctcggc ctcaacccgg tccagttcgg
cgtggggcat gccaggcttc tcgcaagcgt cccggagccg gagttgggcc aggtcaagcc
<.............................msnK2.............................<
p v g y
p g f
l t r
l a e a
e v r
d l e
14041
gtacgccggc cccgtcggcg aagacgacgt cgacgtcccc ggcggacagg cccgcctcgg
catgcggccg gggcagccgc ttctgctgca gctgcagggg ccgcctgtcc gggcggagcc
<.............................msnK2.............................<
p v g a
g d a
f v v
d v d g
a s l
g a e
14101
ccagggcgtt ctcggcggcg cggcgcaacc cgggttcccc tccggtgccg ggccgggggt
ggtcccgcaa gagccgccgc gccgcgttgg gcccaagggg aggccacggc ccggccccca
<.............................msnK2.............................<
a l a n
e a a
r r l
g p e g
g t g
p r p
14161
cgaaggtggc ggcgtatccg ctgaccgtgc cgtagggcgt ggcgccccgg gcgcgggccg
gcttccaccg ccgcataggc gactggcacg gcatcccgca ccgcggggcc cgcgcccggc
<.............................msnK2.............................<
d f t a
a y g
s v t
g y p t
a g r
a r a
14221
cgcaggcgtc ctccaggatc agcagggcac cgccctcgcc ggggacatag ccggtggcgt
gcgtccgcag gaggtcctag tcgtcccgtg gcgggagcgg cccctgtatc ggccaccgca
<.............................msnK2.............................<
a c a d
e l i
l l a
g g e g
p v y
g t a
14281
cccggtcgaa gggcagatac gcgcgccggg ggtcactgcg gacggtgatc cgccgcgtgg
gggccagctt cccgtctatg cgcgcggccc ccagtgacgc ctgccactag gcggcgcacc
<.............................msnK2.............................<
d r d f
p l y
a r r
p d s r
v t i
r r t
14341
cgagctggcc cgtccagccc catgggcaca gtgagccgtc caccccgccg gagaccagga
gctcgaccgg gcaggtcggg gtacccgtgt cactcggcag gtggggcggc ctctggtcct
<.............................msnK2.............................<
a l q g
t w g
w p c
l s g d
v g g
s v l
14401
gggtgacgcc ggaccgcagt tgacggcggg cctgggccac ggcgtcgatg ccgccggcct
cccactgcgg cctggcgtca actgccgccc ggacccggtg ccgcagctac ggcggccgga
<.............................msnK2.............................<
l t v g
s r l
q r r
a q a v
a d i
g g a
Anhang
405
14461
gttcggagac gaggacgccg ctggggccgc gaaggccgtg ccggatggag atctggccgg
caagcctctg ctcctgcggc gaccccggcg cttccggcac ggcctacctc tagaccggcc
<.............................msnK2.............................<
q e s v
l v g
s p g
r l g h
r i s
i q g
14521
tgttgacggc gtagaaccag gcgaaggact ggtaggcgct gacgtgagaa ccgccgtcgc
acaactgccg catcttggtc cgcttcctga ccatccgcga ctgcactctt ggcggcagcg
<.............................msnK2.............................<
t n v a
y f w
a f s
q y a s
v h s
g g d
14581
gccatagcgc ctggagttcg cgctggccga actcgaagcc gccggcggaa ctggcggtga
cggtatcgcg gacctcaagc gcgaccggct tgagcttcgg cggccgcctt gaccgccact
<.............................msnK2.............................<
r w l a
q l e
r q g
f e f g
g a s
s a t
14641
tcaccccggc cgcgtactcg gccagtgcgg ccggatccac tccgctgtcg gccagcgcct
agtggggccg gcgcatgagc cggtcacgcc ggcctaggtg aggcgacagc cggtcgcgga
<.............................msnK2.............................<
i v g a
a y e
a l a
a p d v
g s d
a l a
14701
cctcggcggc gaccagggcg agccgggtca tgtggtcggt ctgcggcatc agccggctcg
ggagccgccg ctggtcccgc tcggcccagt acaccagcca gacgccgtag tcggccgagc
<.............................msnK2.............................<
e e a a
v l a
l r t
m h d t
q p m
l r s
14761
ggatgtgctc ggcggcttcg aagtccggta cctccccggc gagttgggcg gggtatccgg
cctacacgag ccgccgaagc ttcaggccat ggaggggccg ctcaacccgc cccataggcc
<.............................msnK2.............................<
p i h e
a a e
f d p
v e g a
l q a
p y g
14821
ccggggcgaa ccgccggacg ggggcgatcc cgctgagggc gccgagactg gcctgccacc
ggccccgctt ggcggcctgc ccccgctagg gcgactcccg cggctctgac cggacggtgg
<.............................msnK2.............................<
a p a f
r r v
p a i
g s l a
g l s
a q w
14881
agcgttcacg gccgaggccg ttgggcgcgg cgacaccgag gccggtgacc acggcctcgg
tcgcaagtgc cggctccggc aacccgcgcc gctgtggctc cggccactgg tgccggagcc
<.........................msnK2........................<<
w r e r
g l g
n p a
a v g l
g t v
v
14941
ccgcgaccgg gcggggggtg gtcggggacg tgccggtctc cgtacccgga cgggaagccg
ggcgctggcc cgccccccac cagcccctgc acggccagag gcatgggcct gcccttcggc
15001
tccgccgggt gccggccgtt gttctggtca cgccgcctcc ttgggccggg ccaggaccat
aggcggccca cggccggcaa caagaccagt gcggcggagg aacccggccc ggtcctggta
<<.............msnK1...............<
a a e
k p r
a l v m
15061
cgcgctctgg aagcccccga atccgctccc caccgtgagg acggtgtcga tgcggcgctc
gcgcgagacc ttcgggggct taggcgaggg gtggcactcc tgccacagct acgccgcgag
<.............................msnK1.............................<
a s q
f g g
f g s g
v t l
v t d
i r r e
15121
gcgaggcgtc agcggcgtgt agtcgaggtc gcactccgga tcgggctcgt gcaggttcgc
cgctccgcag tcgccgcaca tcagctccag cgtgaggcct agcccgagca cgtccaagcg
<.............................msnK1.............................<
r p t
l p t
y d l d
c e p
d p e
h l n a
406
Anhang
15181
ggtgggaggc accaggccgt tctcgatggc caggacggag gccgcgatct ccagggagcc
ccaccctccg tggtccggca agagctaccg gtcctgcctc cggcgctaga ggtccctcgg
<.............................msnK1.............................<
t p p
v l g
n e i a
l v s
a a i
e l s g
15241
gatggcaccc agggagtggc cgatcatcga cttgatggag ctgaccgggg tggcgtaggc
ctaccgtggg tccctcaccg gctagtagct gaactacctc gactggcccc accgcatccg
<.............................msnK1.............................<
i a g
l s h
g i m s
k i s
s v p
t a y a
15301
gtgtgtgccg agggcgcgtt tgaaggcggc ggtctcgtgg cggtcgttct gtttggtgcc
cacacacggc tcccgcgcaa acttccgccg ccagagcacc gccagcaaga caaaccacgg
<.............................msnK1.............................<
h t g
l a r
k f a a
t e h
r d n
q k t g
15361
ggacccgtgg gcgttgatgt agtcgacggc cgtcggggcg gtgcgggcct cgtccagggc
cctgggcacc cgcaactaca tcagctgccg gcagccccgc cacgcccgga gcaggtcccg
<.............................msnK1.............................<
s g h
a n i
y d v a
t p a
t r a
e d l a
15421
cagtcgtatc gcctcagcca tctccttgcc gtcgggccgc aatccggtca tgtggtaggc
gtcagcatag cggagtcggt agaggaacgg cagcccggcg ttaggccagt acaccatccg
<.............................msnK1.............................<
l r i
a e a
m e k g
d p r
l g t
m h y a
15481
gttgcagcgg gaggcgaagc cggtgatctc ggcgtggatg tgcgcgccgc gggccagcgc
caacgtcgcc ctccgcttcg gccactagag ccgcacctac acgcgcggcg cccggtcgcg
<.............................msnK1.............................<
n c r
s a f
g t i e
a h i
h a g
r a l a
15541
gtgctccagg gactcgatga cgaagaaggc gcagccctcg cccaggacga agccgttgcg
cacgaggtcc ctgagctact gcttcttccg cgtcgggagc gggtcctgct tcggcaacgc
<.............................msnK1.............................<
h e l
s e i
v f f a
c g e
g l v
f g n r
15601
gctgcggtcg aagggacgag aggcgtgctc ggggtcgtcg ttgcgggccg aggtcgcctt
cgacgccagc ttccctgctc tccgcacgag ccccagcagc aacgcccggc tccagcggaa
<.............................msnK1.............................<
s r d
f p r
s a h e
p d d
n r a
s t a k
15661
gatcgcgtcg aagcaggcca cggtgatggg ggagatgggc gcctcggtgg agccggcgac
ctagcgcagc ttcgtccggt gccactaccc cctctacccg cggagccacc tcggccgctg
<.............................msnK1.............................<
i a d
f c a
v t i p
s i p
a e t
s g a v
15721
catgacatcg gccgagcctt cgcggatcag ggagacggcg tgtcccaccg agtccaggcc
gtactgtagc cggctcggaa gcgcctagtc cctctgccgc acagggtggc tcaggtccgg
<.............................msnK1.............................<
m v d
a s g
e r i l
s v a
h g v
s d l g
15781
ggaggtgcag ccggtggaga cgacggtgac cgggccctgc gccccgacgt cccacgcgac
cctccacgtc ggccacctct gctgccactg gcccgggacg cggggctgca gggtgcgctg
<.............................msnK1.............................<
s t c
g t s
v v t v
p g q
a g v
d w a v
15841
ctcggcggag atggagctgg ggaccatgtg gtcgtagaga tgggggacgg cataggtgtg
gagccgcctc tacctcgacc cctggtacac cagcatctct accccctgcc gtatccacac
<.............................msnK1.............................<
e a s
i s s
p v m h
d y l
h p v
a y t h
Anhang
407
15901
gtcgacgttc caccgctcgc cgccgttgct gaccacgctg tactcggtgt cgagactcat
cagctgcaag gtggcgagcg gcggcaacga ctggtgcgac atgagccaca gctctgagta
<.............................msnK1.............................<
d v n
w r e
g g n s
v v s
y e t
d l s m
15961
ggtgcagccg acggcggtgc cgacggtcac cccggtgcgg caggggtcga gccggtcgct
ccacgtcggc tgccgccacg gctgccagtg gggccacgcc gtccccagct cggccagcga
<.............................msnK1.............................<
t c g
v a t
g v t v
g t r
c p d
l r d s
16021
ctccaggccg ctctcggtga ccgcctcgcg ggcggcgacc agggcgaact gggtggcgcg
gaggtccggc gagagccact ggcggagcgc ccgccgctgg tcccgcttga cccaccgcgc
<.............................msnK1.............................<
e l g
s e t
v a e r
a a v
l a f
q t a r
16081
gtcgaggcgc ctgacctcct gcggagtgag tccgtgggcc gacgcgtcga agtcgcactc
cagctccgcg gactggagga cgcctcactc aggcacccgg ctgcgcagct tcagcgtgag
<.............................msnK1.............................<
d l r
r v e
q p t l
g h a
s a d
f d c e
16141
ggccgcgatg cgggagcgga aggccgacgc gtcgaacagc gagatggtcc gagtggcggt
ccggcgctac gccctcgcct tccggctgcg cagcttgtcg ctctaccagg ctcaccgcca
<.............................msnK1.............................<
a a i
r s r
f a s a
d f l
s i t
r t a t
16201
gcgcccttcg gagatgagct gccagaagga cttggaaccg atgccccgcg gggccacgac
cgcgggaagc ctctactcga cggtcttcct gaaccttggc tacggggcgc cccggtgctg
<.............................msnK1.............................<
r g e
s i l
q w f s
k s g
i g r
p a v v
16261
tccgatgccg gtgatcaccg cgcggtggct catccgatgc tcctgcagta tgtcatgtgc
aggctacggc cactagtggc gcgccaccga gtaggctacg aggacgtcat acagtacacg
<..............msnK1..............<<
g i g
t i v
a r h s
m
16321
atgtcttcgc ttccttcttg cggtggattg gtcgcccgga ggagtcagcg gaagtcggcc
tacagaagcg aaggaagaac gccacctaac cagcgggcct cctcagtcgc cttcagccgg
<<....msnH6.....<
- r
f d a
16381
gagtgctcgg cggcccactg ggcgaaggtg cgggcggggg taccggtgac acggagcacg
ctcacgagcc gccgggtgac ccgcttccac gcccgccccc atggccactg tgcctcgtgc
<.............................msnH6.............................<
s h e
a a w q
a f t
r a p
t g t v
r l v
16441
gtgtcctcga cgggggccgg gcggtccacg ccggcggcga gataggccaa gacggtgtcc
cacaggagct gcccccggcc cgccaggtgc ggccgccgct ctatccggtt ctgccacagg
<.............................msnH6.............................<
t d e
v p a p
r d v
g a a
l y a l
v t d
16501
gcgaactccg gcggcatggc ggagagcagt gactcgcgcg ccgcgtcggg cggtacctcc
cgcttgaggc cgccgtaccg cctctcgtca ctgagcgcgc ggcgcagccc gccatggagg
<.............................msnH6.............................<
a f e
p p m a
s l l
s e r
a a d p
p v e
16561
ttgtaccgta cggactgccc cacggccgcc ccgacgattt ccgcctgccg gcgctgggtg
aacatggcat gcctgacggg gtgccggcgg ggctgctaaa ggcggacggc cgcgacccac
<.............................msnH6.............................<
k y r
v s q g
v a a
g v i
e a q r
r q t
408
Anhang
16621
agcgactcgg gacccgtgac cacgtacctc cggccggtgt gaccggagcc ggtcagggcc
tcgctgagcc ctgggcactg gtgcatggag gccggccaca ctggcctcgg ccagtcccgg
<.............................msnH6.............................<
l s e
p g t v
v y r
r g t
h g s g
t l a
16681
gctgccgcca ccgccgccac gtcggcctcg tgcgcgggcg cggcctcgga gcgggcgtag
cgacggcggt ggcggcggtg cagccggagc acgcgcccgc gccggagcct cgcccgcatc
<.............................msnH6.............................<
a a a
v a a v
d a e
h a p
a a e s
r a y
16741
ggaccgcgca cgacgccggt gcggacctgt gcggcccagt tcagcgcgct ggtggccagg
cctggcgcgt gctgcggcca cgcctggaca cgccgggtca agtcgcgcga ccaccggtcc
<.............................msnH6.............................<
p g r
v v g t
r v q
a a w
n l a s
t a l
16801
ctgcccaccc ggacgaaggt ccagggcacg cccgaggcgg cgaccacctc ctcgacccgg
gacgggtggg cctgcttcca ggtcccgtgc gggctccgcc gctggtggag gagctgggcc
<.............................msnH6.............................<
s g v
r v f t
w p v
g s a
a v v e
e v r
16861
gcgtggtgcg cggcgatggg attggtgggc gggcgcccgt cgatgaccga cgccgaggac
cgcaccacgc gccgctaccc taaccacccg cccgcgggca gctactggct gcggctcctg
<.............................msnH6.............................<
a h h
a a i p
n t p
p r g
d i v s
a s s
16921
agcacggtca gatggctgac acccgcgtcc cgcgcggcgg cggtgaacgc ctcgatgccg
tcgtgccagt ctaccgactg tgggcgcagg gcgcgccgcc gccacttgcg gagctacggc
<.............................msnH6.............................<
l v t
l h s v
g a d
r a a
a t f a
e i g
16981
cggggttcgc agtacaggaa gaccttgtcg acgccttcca gggcgggcgc gaaggtgtgc
gccccaagcg tcatgtcctt ctggaacagc tgcggaaggt cccgcccgcg cttccacacg
<.............................msnH6.............................<
r p e
c y l f
v k d
v g e
l a p a
f t h
17041
ggcccggcga ggtcgagcgg caccacctcc gttccgtccg gcaggccctt gaccgccgcc
ccgggccgct ccagctcgcc gtggtggagg caaggcaggc cgtccgggaa ctggcggcgg
<.............................msnH6.............................<
p g a
l d l p
v v e
t g d
p l g k
v a a
17101
ggggtccggc tgcccgctcg tacccgggca ccgcgctccg tcagcgcgcg gacgacgtgc
ccccaggccg acgggcgagc atgggcccgt ggcgcgaggc agtcgcgcgc ctgctgcacg
<.............................msnH6.............................<
p t r
s g a r
v r a
g r e
t l a r
v v h
17161
cgggcgaggg tgccgccggc cccggtgacc aggatcggca cagcgctcac cggccgtccg
gcccgctccc acggcggccg gggccactgg tcctagccgt gtcgcgagtg gccggcaggc
<.......................msnH6.......................<<
r a l
t g g a
g t v
l i p
v a s v
<<...msnO4....<
r g d
17221
tgaactcggg cgcgacacgc tcggcgaaga gccggaggcc gcgctcgacg tccacccggg
acttgagccc gcgctgtgcg agccgcttct cggcctccgg cgcgagctgc aggtgggccc
<.............................msnO4.............................<
t f e p
a v r
e a f
l r l g
r e v
d v r
17281
gcacgtgccc ggagtgcacg gacagcccga tcgcgatgtc gtcgccgtac cagtcggcga
cgtgcacggg cctcacgtgc ctgtcgggct agcgctacag cagcggcatg gtcagccgct
<.............................msnO4.............................<
p v h g
s h v
s l g
i a i d
d g y
w d a
Anhang
409
17341
tctcggcgag ctggccgcgg acgtcgtccg gagtaccggc gagaaccttg ttctccttca
agagccgctc gaccggcgcc tgcagcaggc ctcatggccg ctcttggaac aagaggaagt
<.............................msnO4.............................<
i e a l
q g r
v d d
p t g a
l v k
n e k
17401
ccctctcgtc gaaggcggcg ccgttgccga ccgcggcggc ggccatccgg tcgtagcccg
gggagagcag cttccgccgc ggcaacggct ggcgccgccg ccggtaggcc agcatcgggc
<.............................msnO4.............................<
v r e d
f a a
g n g
v a a a
a m r
d y g
17461
ggtactggtc gctcttgacg gtggcccagg cactgactgc ggcggccatc ttctcgctca
ccatgaccag cgagaactgc caccgggtcc gtgactgacg ccgccggtag aagagcgagt
<.............................msnO4.............................<
p y q d
s k v
t a w
a s v a
a a m
k e s
17521
tcctccgctc cacgtactcg ccctgccggt acgcggcctc ccggtcctcg tcgacgaaac
aggaggcgag gtgcatgagc gggacggcca tgcgccggag ggccaggagc agctgctttg
<.............................msnO4.............................<
m r r e
v y e
g q r
y a a e
r d e
d v f
17581
acgggaaggt gaggtcgatg cgctcagtgc cggcgcggtg tccggcgtcg gcccaggccc
tgcccttcca ctccagctac gcgagtcacg gccgcgccac aggccgcagc cgggtccggg
<.............................msnO4.............................<
c p f t
l d i
r e t
g a r h
g a d
a w a
17641
ggcggtagac gctcagggct tcctggacct tctcccgggt ggcgaccgag gcgatgagct
ccgccatctg cgagtcccga aggacctgga agagggccca ccgctggctc cgctactcga
<.............................msnO4.............................<
r r y v
s l a
e q v
k e r t
a v s
a i l
17701
ggaggtggtg gcccagttca ccggccgtgc ggcaggagtc gaggttgccg gtgctggcca
cctccaccac cgggtcaagt ggccggcacg ccgtcctcag ctccaacggc cacgaccggt
<.............................msnO4.............................<
q l h h
g l e
g a t
r c s d
l n g
t s a
17761
cgaagaccgg gggatggggc tgctgggcgg gcttcggcag catggtgacc gggccgaact
gcttctggcc ccctaccccg acgacccgcc cgaagccgtc gtaccactgg cccggcttga
<.............................msnO4.............................<
v f v p
p h p
q q a
p k p l
m t v
p g f
17821
ggtggaacgt accgttccat tccaggtcgt cctcggtcca cagccggacg caggcctcga
ccaccttgca tggcaaggta aggtccagca ggagccaggt gtcggcctgc gtccggagct
<.............................msnO4.............................<
q h f t
g n w
e l d
d e t w
l r v
c a e
17881
cgccctcctc gaagcgggcc cggctctcgt tgaggggaat gccgaaagcg gtgaactcgt
gcgggaggag cttcgcccgg gccgagagca actcccctta cggctttcgc cacttgagca
<.............................msnO4.............................<
v g e e
f r a
r s e
n l p i
g f a
t f e
17941
cgggcaggaa ggcccggccg aagcccacgt cgagccggcc gccggagatg ttgtccagca
gcccgtcctt ccgggccggc ttcgggtgca gctcggccgg cggcctctac aacaggtcgt
<.............................msnO4.............................<
d p l f
a r g
f g v
d l r g
g s i
n d l
18001
tggccaactg gccggacagc ttgacggggt gggtgaaggc gggaatgacg gctccggtcg
accggttgac cggcctgtcg aactgcccca cccacttccg cccttactgc cgaggccagc
<.............................msnO4.............................<
m a l q
g s l
k v p
h t f a
p i v
a g t
410
Anhang
18061
cgatccgcag ccggctggtg cgggcggcga ccgccgcgag gaaggtggtc gggtcggggc
gctaggcgtc ggccgaccac gcccgccgct ggcggcgctc cttccaccag cccagccccg
<.............................msnO4.............................<
a i r l
r s t
r a a
v a a l
f t t
p d p
18121
tgtagccgcc gtagtcgaag aagtagtgct cgaccagttt gacctggaag tagccgagtt
acatcggcgg catcagcttc ttcatcacga gctggtcaaa ctggaccttc atcggctcaa
<.............................msnO4.............................<
s y g g
y d f
f y h
e v l k
v q f
y g l
18181
cgtcggcgag ttcggcgatg tgcaggccgt cgtcgtagta ctgggtgggc gtgacctcgc
gcagccgctc aagccgctac acgtccggca gcagcatcat gacccacccg cactggagcg
<.............................msnO4.............................<
e d a l
e a i
h l g
d d y y
q t p
t v e
18241
cgttcgctcc gcccacggtc gggaagaaca cgatgccgaa tttcatggga ttgctgccct
gcaagcgagg cgggtgccag cccttcttgt gctacggctt aaagtaccct aacgacggga
<.....................msnO4.....................<<
g n a g
g v t
p f f
v i g f
k m
18301
cccggcggtt caggccgccg actcgtcgaa ttccagctcg acctcgtaca gggccgggcg
gggccgccaa gtccggcggc tgagcagctt aaggtcgagc tggagcatgt cccggcccgc
<<.......................msnO5.........................<
- a a
s e d f
e l e
v e y
l a p r
18361
cacctcggtg atggcgatga cctcggggaa gaaggcggtg tgcgcgtcca tcttcatgaa
gtggagccac taccgctact ggagcccctt cttccgccac acgcgcaggt agaagtactt
<.............................msnO5.............................<
v e t
i a i
v e p f
f a t
h a d
m k m f
18421
gttttggtat tcttcgccgt tctcccagcg ggccacgttg aagtagcggg tggggtcgcc
caaaaccata agaagcggca agagggtcgc ccggtgcaac ttcatcgccc accccagcgg
<.............................msnO5.............................<
n q y
e e g
n e w r
a v n
f y r
t p d g
18481
ctggtcgcgg acgaaggtgt ggtcgatgta gccgggatgg tccagggcca ggtcggacac
gaccagcgcc tgcttccaca ccagctacat cggccctacc aggtcccggt ccagcctgtg
<.............................msnO5.............................<
q d r
v f t
h d i y
g p h
d l a
l d s v
18541
cttgtcgaag agggcctcga actgctcggc cgtggtatcg ggacgcagcg tgaacgtgtt
gaacagcttc tcccggagct tgacgagccg gcaccatagc cctgcgtcgc acttgcacaa
<.............................msnO5.............................<
k d f
l a e
f q e a
t t d
p r l
t f t n
18601
gaccatgacg atcatggggg ggtgcctccg gtcgggggtg gtgtcagcgg acgttgtcgt
ctggtactgc tagtaccccc ccacggaggc cagcccccac cacagtcgcc tgcaacagca
<....msnO5....<<
v m v
i m
<<....msnC1......<
- r
v n d
18661
gggagaccag gcggtggcgc accttcagcc cctggggggt gcggaccagg acgtcgtcga
ccctctggtc cgccaccgcg tggaagtcgg ggacccccca cgcctggtcc tgcagcagct
<.............................msnC1.............................<
h s v l
r h r
v k l
g q p t
r v l
v d d
18721
cggcggtgct cagatagagc tggggggcgc cgtccttgac cgtggagtag atcgccgcgt
gccgccacga gtctatctcg accccccgcg gcaggaactg gcacctcatc tagcggcgca
<.............................msnC1.............................<
v a t s
l y l
q p a
g d k v
t s y
i a a
Anhang
411
18781
agtagtgggt ggtcacggtc ttgtcgtcgg acgacaccac gtccaccatg cccagccagt
tcatcaccca ccagtgccag aacagcagcc tgctgtggtg caggtggtac gggtcggtca
<.............................msnC1.............................<
y y h t
t v t
k d d
s s v v
d v m
g l w
18841
gccggcgctg aaggccctcg ccgaagatgc ggtcgaggcc ggtgcgcatc cgctcgcgga
cggccgcgac ttccgggagc ggcttctacg ccagctccgg ccacgcgtag gcgagcgcct
<.............................msnC1.............................<
h r r q
l g e
g f i
r d l g
t r m
r e r
18901
tctggtcgcg gccgatccag ggctcgggcc gggcgttctg gacgaactgg ccgtcctcgg
agaccagcgc cggctaggtc ccgagcccgg cccgcaagac ctgcttgacc ggcaggagcc
<.............................msnC1.............................<
i q d r
g i w
p e p
r a n q
v f q
g d e
18961
tgaacgtgtc ggcccagcgt tcggcctcgc cggagtcgag caggtgtgcc tggcgggcgt
acttgcacag ccgggtcgca agccggagcg gcctcagctc gtccacacgg accgcccgca
<.............................msnC1.............................<
t f t d
a w r
e a e
g s d l
l h a
q r a
19021
agaactgcac gacctcggtg tagagcaccg ggtccgtgcc atcgccgacc tgttgtgcga
tcttgacgtg ctggagccac atctcgtggc ccaggcacgg tagcggctgg acaacacgct
<.............................msnC1.............................<
y f q v
v e t
y l v
p d t g
d g v
q q a
19081
cgtgctgaac cgccatggtg gcctccgcct ccagagtcgt acgaaccttg tccttgacgc
gcacgacttg gcggtaccac cggaggcgga ggtctcagca tgcttggaac aggaactgcg
<.............................msnC1.............................<
v h q v
a m t
a e a
e l t t
r v k
d k v
19141
tgtcgatcga ggtgccctcg tccgtgtggg cggcgaggac cgcgtgccga cgggcggtca
acagctagct ccacgggagc aggcacaccc gccgctcctg gcgcacggct gcccgccagt
<.............................msnC1.............................<
s d i s
t g e
d t h
a a l v
a h r
r a t
19201
gcctgacgcc cgcggcggtg ggtacgagtt ccaggaccga ggtgctgacg gccagcgacg
cggactgcgg gcgccgccac ccatgctcaa ggtcctggct ccacgactgc cggtcgctgc
<.............................msnC1.............................<
l r v g
a a t
p v l
e l v s
t s v
a l s
19261
ggtcggcggc gaaatgccgt tcgacgatgc gtcggccggg gacgccgacc cgcaccgtcg
ccagccgccg ctttacggca agctgctacg cagccggccc ctgcggctgg gcgtggcagc
<.............................msnC1.............................<
p d a a
f h r
e v i
r r g p
v g v
r v t
19321
tgtcgcccgg gtccgtcgag acgaggcgct tgtacaagtc ctcggcagac agcggtagtt
acagcgggcc caggcagctc tgctccgcga acatgttcag gagccgtctg tcgccatcaa
<.............................msnC1.............................<
t d g p
d t s
v l r
k y l d
e a s
l p l
19381
cggcggaact gccggccgtc accacgagtc cgccggtgag atggtcctgt tcggccgcgt
gccgccttga cggccggcag tggtgctcag gcggccactc taccaggaca agccggcgca
<.............................msnC1.............................<
e a s s
g a t
v v l
g g t l
h d q
e a a
19441
cccgcagatg gccgagttcg agatcgctgt tgcggtcgat cagcgcgtcg aggccggcct
gggcgtctac cggctcaagc tctagcgaca acgccagcta gtcgcgcagc tccggccgga
<.............................msnC1.............................<
d r l h
g l e
l d s
n r d i
l a d
l g a
412
Anhang
19501
ggaaggactc gtcgacgagc tgataggcgt gggtgaggac gatccgtgag cggtccgcgt
ccttcctgag cagctgctcg actatccgca cccactcctg ctaggcactc gccaggcgca
<.............................msnC1.............................<
q f s e
d v l
q y a
h t l v
i r s
r d a
19561
cgagcggttc gatgttccac tcgccgctca acgaggccat ggggggcgcg gacctctcct
gctcgccaag ctacaaggtg agcggcgagt tgctccggta ccccccgcgc ctggagagga
<.............................msnC1.............................<
d l p e
i n w
e g s
l s a m
p p a
s r e
19621
gacggaaggt cattgaccgg gttttcgggt ccagttcgac cagcgacacc caggtcttca
ctgccttcca gtaactggcc caaaagccca ggtcaagctg gtcgctgtgg gtccagaagt
<.............................msnC1.............................<
q r f t
m s r
t k p
d l e v
l s v
w t k
19681
cctcgccgtc ggcgccctcg ggcgcgcgcc agatctggac gcgcagttcg tcgccgtccg
ggagcggcag ccgcgggagc ccgcgcgcgg tctagacctg cgcgtcaagc agcggcaggc
<.............................msnC1.............................<
v e g d
a g e
p a r
w i q v
r l e
d g d
19741
tgccgagcag ttcgatgtgc acggtctcgg gaaagaaacg ggaccactgg gcgaagtcgc
acggctcgtc aagctacacg tgccagagcc ctttctttgc cctggtgacc cgcttcagcg
<.............................msnC1.............................<
t g l l
e i h
v t e
p f f r
s w q
a f d
19801
tcacgatgcc gaagacgacg tccgcgggag cccgtacgac gacatcgtgc tcggcgcgat
agtgctacgg cttctgctgc aggcgccctc gggcatgctg ctgtagcacg agccgcgcta
<.............................msnC1.............................<
s v i g
f v v
d a p
a r v v
v d h
e a r
19861
ggaccggcgg tcctcccggc tcaaccggca tgggagtccg ccagggtgga gtgcttgacc
cctggccgcc aggagggccg agttggccgt accctcaggc ggtcccacct cacgaactgg
<.............msnC1.............<<
h v p p
g g p
e v p
m
<<.................msnO6..................<
- g a
h s d
a l t s
h k v
19921
gacaggacgg tggtgctggt gtcggagatg tgccgggcgg cctcgcccag cttgccgatc
ctgtcctgcc accacgacca cagcctctac acggcccgcc ggagcgggtc gaacggctag
<.............................msnO6.............................<
s l v
t t s t
d s i
h r a
a e g l
k g i
19981
acgtcctgga actccggctg ggcccccatg cgctggaccg actcgttgtt ctcccagtaa
tgcaggacct tgaggccgac ccgggggtac gcgacctggc tgagcaacaa gagggtcatt
<.............................msnO6.............................<
v d q
f e p q
a g m
r q v
s e n n
e w y
20041
ctgacggcga cctgggtgag cgggtcgtcg agcgagcgcg ccagcaggtg cttcaggtat
gactgccgct ggacccactc gcccagcagc tcgctcgcgc ggtcgtccac gaagtccata
<.............................msnO6.............................<
s v a
v q t l
p d d
l s r
a l l h
k l y
20101
ccgggctgag cacggaagaa ttccgaggtc ttctcgaaga cgtcccgaaa tccgtcggac
ggcccgactc gtgccttctt aaggctccag aagagcttct gcagggcttt aggcagcctg
<.............................msnO6.............................<
g p q
a r f f
e s t
k e f
v d r f
g d s
20161
tccgattcca gtcggaactc gctgatcagg acaaccattt tctgcacctc tcgacagagt
aggctaaggt cagccttgag cgactagtcc tgttggtaaa agacgtggag agctgtctca
<.................msnO6................<<
e s e
l r f e
s i l
v v m
Anhang
413
20221
ggaattcgag tgcggccaac actaaaagcc gcagcctcga agcatgctcg gagagtgctc
ccttaagctc acgccggttg tgattttcgg cgtcggagct tcgtacgagc ctctcacgag
20281
ggaaggcggt cgcgagagtt atccggggat atctccgagc gggttccgag tgtgagccga
ccttccgcca gcgctctcaa taggccccta tagaggctcg cccaaggctc acactcggct
20341
ggagcgggat tccatacttt ccgcagtgca tcgcaccgaa ttcaaatcgc cagacaagga
cctcgcccta aggtatgaaa ggcgtcacgt agcgtggctt aagtttagcg gtctgttcct
20401
cggttggcat gactgcgatc ttcgcgaaca ccctcacgct gaaggacccg gagaaccagg
gccaaccgta ctgacgctag aagcgcttgt gggagtgcga cttcctgggc ctcttggtcc
>>........................msnO7.........................>
m t a i
f a n
t l t
l k d p
e n q
20461
aggccgccaa ggacctggaa gagaccatca ccgaggccgg cgccttcatg cagcgccagc
tccggcggtt cctggacctt ctctggtagt ggctccggcc gcggaagtac gtcgcggtcg
>.............................msnO7.............................>
e a a
k d l e
e t i
t e a
g a f m
q r q
20521
ccggcttccg ttccttccgg ctggtccgct ccccgaagac cccggagagc tacctgatct
ggccgaaggc aaggaaggcc gaccaggcga ggggcttctg gggcctctcg atggactaga
>.............................msnO7.............................>
p g f
r s f r
l v r
s p k
t p e s
y l i
20581
acgccgaatg ggacgacgtc caggtgctgg aggccgccat cgcccagccg gacgtacgga
tgcggcttac cctgctgcag gtccacgacc tccggcggta gcgggtcggc ctgcatgcct
>.............................msnO7.............................>
y a e
w d d v
q v l
e a a
i a q p
d v r
20641
cccgggccgc ccacgtccgt gagctgacgc agggcgcgcc gaagatctac gaggtggtcg
gggcccggcg ggtgcaggca ctcgactgcg tcccgcgcgg cttctagatg ctccaccagc
>.............................msnO7.............................>
t r a
a h v r
e l t
q g a
p k i y
e v v
20701
cccaggcgga cctgcccgcg tgaccgcacc cggcacatcc ctgcgaccgc gggtgacgga
gggtccgcct ggacgggcgc actggcgtgg gccgtgtagg gacgctggcg cccactgcct
>.........msnO7........>>
a q a
d l p a
>>..................msnC2...................>
v t a
p g t s
l r p
r v t
20761
ggtcgccgac cgggtcttcg ccttcgtcca gcccaacggc ggttggtgcc tgagcaacgc
ccagcggctg gcccagaagc ggaagcaggt cgggttgccg ccaaccacgg actcgttgcg
>.............................msnC2.............................>
e v a d
r v f
a f v
q p n g
g w c
l s n
20821
cggcatcgtc gtgggcggcg accgggtctg tgtggtcgac acggccgcga ccgaggcccg
gccgtagcag cacccgccgc tggcccagac acaccagctg tgccggcgct ggctccgggc
>.............................msnC2.............................>
a g i v
v g g
d r v
c v v d
t a a
t e a
20881
aacccgcgca ctgcacaccg aggtcggccg gctgagcccc gtgccgccga gtttcctcgt
ttgggcgcgt gacgtgtggc tccagccggc cgactcgggg cacggcggct caaaggagca
>.............................msnC2.............................>
r t r a
l h t
e v g
r l s p
v p p
s f l
20941
gaacacgcat caccacgggg accacacctt cggcaactcc ttcttccccg cgcggacaac
cttgtgcgta gtggtgcccc tggtgtggaa gccgttgagg aagaaggggc gcgcctgttg
>.............................msnC2.............................>
v n t h
h h g
d h t
f g n s
f f p
a r t
414
Anhang
21001
cgtcgtctcc cacgacctcg cacggaccga gatggcggag aagcagctct cgatgtgcca
gcagcagagg gtgctggagc gtgcctggct ctaccgcctc ttcgtcgaga gctacacggt
>.............................msnC2.............................>
t v v s
h d l
a r t
e m a e
k q l
s m c
21061
ggtgtggccg gaggtcgact gggggaacct cgaactgcgc ctccccgacc tcacgttctc
ccacaccggc ctccagctga cccccttgga gcttgacgcg gaggggctgg agtgcaagag
>.............................msnC2.............................>
q v w p
e v d
w g n
l e l r
l p d
l t f
21121
cgaccggctc agcctgtatt tcggcgaaca gaccgccgaa ctgctgtacg tgggaccggc
gctggccgag tcggacataa agccgcttgt ctggcggctt gacgacatgc accctggccg
>.............................msnC2.............................>
s d r l
s l y
f g e
q t a e
l l y
v g p
21181
gcactcgacc aacgacgtcg tggtctggct tccggaccgc aagtgcctgt tcgccggcga
cgtgagctgg ttgctgcagc accagaccga aggcctggcg ttcacggaca agcggccgct
>.............................msnC2.............................>
a h s t
n d v
v v w
l p d r
k c l
f a g
21241
cgtcctgctg tccggctgca ctccgttcat cctcatggga tcgctggcgg gcagcctgcg
gcaggacgac aggccgacgt gaggcaagta ggagtaccct agcgaccgcc cgtcggacgc
>.............................msnC2.............................>
d v l l
s g c
t p f
i l m g
s l a
g s l
21301
ggcggtggcc aggctgcgca ccctcggcgc cgagaccatc gtgtgcgggc acggcccggt
ccgccaccgg tccgacgcgt gggagccgcg gctctggtag cacacgcccg tgccgggcca
>.............................msnC2.............................>
r a v a
r l r
t l g
a e t i
v c g
h g p
21361
gtgcgggccc gaggtcttcg acgccaccga acggtatctg ctgtggatac ggcggctggc
cacgcccggg ctccagaagc tgcggtggct tgccatagac gacacctatg ccgccgaccg
>.............................msnC2.............................>
v c g p
e v f
d a t
e r y l
l w i
r r l
21421
ccgggacggc attgcggccg gcctcgatcc gctgaccgtg gcgcgggaga ccccgctcgg
ggccctgccg taacgccggc cggagctagg cgactggcac cgcgccctct ggggcgagcc
>.............................msnC2.............................>
a r d g
i a a
g l d
p l t v
a r e
t p l
21481
ggaacacgcc gcactcgtcg acccggaacg actggtcgcc aatctgcacc gggcctacgc
ccttgtgcgg cgtgagcagc tgggccttgc tgaccagcgg ttagacgtgg cccggatgcg
>.............................msnC2.............................>
g e h a
a l v
d p e
r l v a
n l h
r a y
21541
ggaggaacgc ggcgccgggc ccggcgaaca catcgcctcg gggccggtgt tccgcgagat
cctccttgcg ccgcggcccg ggccgcttgt gtagcggagc cccggccaca aggcgctcta
>.............................msnC2.............................>
a e e r
g a g
p g e
h i a s
g p v
f r e
21601
gaccgcctac aacggcggcc gtccactgcg ctgcctggcc tgaacccctg ctcaccgagc
ctggcggatg ttgccgccgg caggtgacgc gacggaccgg acttggggac gagtggctcg
>.............................msnC2.............................>
m t a y
n g g
r p l
r c l a
- t p
a h r
21661
aatgagagga acacgttgtg aaactgtcgg tggtcgagca ggcccccgtg gtggaaggac
ttactctcct tgtgcaacac tttgacagcc accagctcgt ccgggggcac caccttcctg
>........msnC2.......>>
a m r g
t r c
>>...................msnO8....................>
v
k l s
v v e
q a p v
v e g
Anhang
415
21721
tcaccccggc ccactcgctg cagcacagca tagaactggc ccgactggcg gaccggctgg
agtggggccg ggtgagcgac gtcgtgtcgt atcttgaccg ggctgaccgc ctggccgacc
>.............................msnO8.............................>
l t p
a h s l
q h s
i e l
a r l a
d r l
21781
ggtacgagcg cttttgggtc gccgaacacc atgctgagat tttcaacgcc gtacccgccc
ccatgctcgc gaaaacccag cggcttgtgg tacgactcta aaagttgcgg catgggcggg
>.............................msnO8.............................>
g y e
r f w v
a e h
h a e
i f n a
v p a
21841
cggagatcct catcgcacgg atcgcggcgg agacctccgg gatacgggtc ggctcgggcg
gcctctagga gtagcgtgcc tagcgccgcc tctggaggcc ctatgcccag ccgagcccgc
>.............................msnO8.............................>
p e i
l i a r
i a a
e t s
g i r v
g s g
21901
gggtgctgct gtcgctgtac agcccgctga aggtggccga ggtgttccgc accctgcacg
cccacgacga cagcgacatg tcgggcgact tccaccggct ccacaaggcg tgggacgtgc
>.............................msnO8.............................>
g v l
l s l y
s p l
k v a
e v f r
t l h
21961
ccctctatcc ggaccggatc gacctgggca tcggccgcgc caaccgcgtc aaactgccgg
gggagatagg cctggcctag ctggacccgt agccggcgcg gttggcgcag tttgacggcc
>.............................msnO8.............................>
a l y
p d r i
d l g
i g r
a n r v
k l p
22021
tgttcgcggc gctgcgggac gacacggccg gcaaggagcc gtcctcggac gacctgtggc
acaagcgccg cgacgccctg ctgtgccggc cgttcctcgg caggagcctg ctggacaccg
>.............................msnO8.............................>
v f a
a l r d
d t a
g k e
p s s d
d l w
22081
gtcggctgga gcagctgcgc gcctatctgg acccggacag cgggctcccg ttcaccgtct
cagccgacct cgtcgacgcg cggatagacc tgggcctgtc gcccgagggc aagtggcaga
>.............................msnO8.............................>
r r l
e q l r
a y l
d p d
s g l p
f t v
22141
cgccccggat gcccggcggg ccggcgctgt ggctgctcgg ggcgagcgtg tccagcgccg
gcggggccta cgggccgccc ggccgcgaca ccgacgagcc ccgctcgcac aggtcgcggc
>.............................msnO8.............................>
s p r
m p g g
p a l
w l l
g a s v
s s a
22201
aggcggcggc ccggctcgga ctgccctacg cgtacgcgca cttcatcacg ccccagttca
tccgccgccg ggccgagcct gacgggatgc gcatgcgcgt gaagtagtgc ggggtcaagt
>.............................msnO8.............................>
e a a
a r l g
l p y
a y a
h f i t
p q f
22261
cccgggaagc gatggacacc taccgggccg ccttcgtacc gggaccggac accccctcgc
gggcccttcg ctacctgtgg atggcccggc ggaagcatgg ccctggcctg tgggggagcg
>.............................msnO8.............................>
t r e
a m d t
y r a
a f v
p g p d
t p s
22321
cccggcccat cctgtcggtg gtcgtgtgct gcgcggagac cgacgccgag gcccaacggg
gggccgggta ggacagccac cagcacacga cgcgcctctg gctgcggctc cgggttgccc
>.............................msnO8.............................>
p r p
i l s v
v v c
c a e
t d a e
a q r
22381
tgtacgccac ccaccggttg ttccaccgcc gcatgtccca gggggacgta cggctgctgc
acatgcggtg ggtggccaac aaggtggcgg cgtacagggt ccccctgcat gccgacgacg
>.............................msnO8.............................>
v y a
t h r l
f h r
r m s
q g d v
r l l
416
Anhang
22441
cgccggccga tctcgccgtg gcggagatgg acaagccggg ccccgacccg ctggcggagg
gcggccggct agagcggcac cgcctctacc tgttcggccc ggggctgggc gaccgcctcc
>.............................msnO8.............................>
p p a
d l a v
a e m
d k p
g p d p
l a e
22501
aatccttcga gtggccgcgc tatgtcgtcg gttcaccgga ccgggtccgc gaccagctga
ttaggaagct caccggcgcg atacagcagc caagtggcct ggcccaggcg ctggtcgact
>.............................msnO8.............................>
e s f
e w p r
y v v
g s p
d r v r
d q l
22561
ccaagatggc cgacgccacg ggcgccgagg agctgggcgt cgtgtcgatg atccacgatc
ggttctaccg gctgcggtgc ccgcggctcc tcgacccgca gcacagctac taggtgctag
>.............................msnO8.............................>
t k m
a d a t
g a e
e l g
v v s m
i h d
22621
agcgcgaccg gctgcgctcg taccggctgc tcgccgaggc gttcgagctg accccccggt
tcgcgctggc cgacgcgagc atggccgacg agcggctccg caagctcgac tggggggcca
>.............................msnO8.............................>
q r d
r l r s
y r l
l a e
a f e l
t p r
22681
gacccctgac gtccagggca gggcgccacg tcctccccac agaaaggaaa ccccgtgcgt
ctggggactg caggtcccgt cccgcggtgc aggaggggtg tctttccttt ggggcacgca
>> msnO8
msnO9 >>...>
v r
22741
gtcatccggt accactccta cggcgccccc gacgtactga cgatcgagga tgccgaagtc
cagtaggcca tggtgaggat gccgcggggg ctgcatgact gctagctcct acggcttcag
>.............................msnO9.............................>
v i r
y h s
y g a p
d v l
t i e
d a e v
22801
cccgaaccag gaccggccga ggtgctcatc aaggccgagg cgatcggggt gaacttcgtc
gggcttggtc ctggccggct ccacgagtag ttccggctcc gctagcccca cttgaagcag
>.............................msnO9.............................>
p e p
g p a
e v l i
k a e
a i g
v n f v
22861
gagacacagc ggcggcgcgg cacggcgccg ttccccaccc cgcttcccaa cgccccgcac
ctctgtgtcg ccgccgcgcc gtgccgcggc aaggggtggg gcgaagggtt gcggggcgtg
>.............................msnO9.............................>
e t q
r r r
g t a p
f p t
p l p
n a p h
22921
ggcgatgtcg tgggcagggt ggtggcggcc ggagccgagg tgaccagcgt cgcggtcggc
ccgctacagc acccgtccca ccaccgccgg cctcggctcc actggtcgca gcgccagccg
>.............................msnO9.............................>
g d v
v g r
v v a a
g a e
v t s
v a v g
22981
gaccgggtgg ccgcgcccgt cgccggagag gcgtacgccg actacgccgt cagcgacgcc
ctggcccacc ggcgcgggca gcggcctctc cgcatgcggc tgatgcggca gtcgctgcgg
>.............................msnO9.............................>
d r v
a a p
v a g e
a y a
d y a
v s d a
23041
accttcctct ttccgatccc ggaggacctc ggcctcgccg aggcgagcgt cctggcctcg
tggaaggaga aaggctaggg cctcctggag ccggagcggc tccgctcgca ggaccggagc
>.............................msnO9.............................>
t f l
f p i
p e d l
g l a
e a s
v l a s
23101
cccgcacaga ccgcgctgtg cagcctcaag accgggcaga tcaagcccgg cgacacggtg
gggcgtgtct ggcgcgacac gtcggagttc tggcccgtct agttcgggcc gctgtgccac
>.............................msnO9.............................>
p a q
t a l
c s l k
t g q
i k p
g d t v
Anhang
417
23161
ctggtgcacg ccgcgtccgg ctccatcggc catctgtcgc tgcaactggc caaggtcctg
gaccacgtgc ggcgcaggcc gaggtagccg gtagacagcg acgttgaccg gttccaggac
>.............................msnO9.............................>
l v h
a a s
g s i g
h l s
l q l
a k v l
23221
ggcgcgggaa cggtcatcgg cacggcgggc tcggcgcgca agctcgactt cgcccgtgag
ccgcgccctt gccagtagcc gtgccgcccg agccgcgcgt tcgagctgaa gcgggcactc
>.............................msnO9.............................>
g a g
t v i
g t a g
s a r
k l d
f a r e
23281
tacggggccg acgtggcggt cgactactcg gcccccgact gggacgacca ggtgcgcgcg
atgccccggc tgcaccgcca gctgatgagc cgggggctga ccctgctggt ccacgcgcgc
>.............................msnO9.............................>
y g a
d v a
v d y s
a p d
w d d
q v r a
23341
gccaccgagg ggcgcggcgt cgacgtgatc gtcgacagcg tcggcggcga cgtcctgcgc
cggtggctcc ccgcgccgca gctgcactag cagctgtcgc agccgccgct gcaggacgcg
>.............................msnO9.............................>
a t e
g r g
v d v i
v d s
v g g
d v l r
23401
cagggcatcg gactgctggc gcccttcggc cgactggtgt tctacggcgc ggccagcggc
gtcccgtagc ctgacgaccg cgggaagccg gctgaccaca agatgccgcg ccggtcgccg
>.............................msnO9.............................>
q g i
g l l
a p f g
r l v
f y g
a a s g
23461
gacataccga agatctcccc catggagctg atcggcctcc agttcgtgac cgggtccagc
ctgtatggct tctagagggg gtacctcgac tagccggagg tcaagcactg gcccaggtcg
>.............................msnO9.............................>
d i p
k i s
p m e l
i g l
q f v
t g s s
23521
ctctgggcat ggtggcagca ccggcccgac gaagtcaggg cgggcctcga ccagatggcc
gagacccgta ccaccgtcgt ggccgggctg cttcagtccc gcccggagct ggtctaccgg
>.............................msnO9.............................>
l w a
w w q
h r p d
e v r
a g l
d q m a
23581
ggactgctcg tctctggcgg actgcgggtc tccctcggca ccacgctgcc gttcaccgag
cctgacgagc agagaccgcc tgacgcccag agggagccgt ggtgcgacgg caagtggctc
>.............................msnO9.............................>
g l l
v s g
g l r v
s l g
t t l
p f t e
23641
gcggcaaagg cgcaccagct gatcgaggaa cgcggtcacg tcgggcgcat cctgctcatc
cgccgtttcc gcgtggtcga ctagctcctt gcgccagtgc agcccgcgta ggacgagtag
>.............................msnO9.............................>
a a k
a h q
l i e e
r g h
v g r
i l l i
23701
ccatgaccct gccccgccgg acgacggggg agccgacaca tgtccgagga gtcatcgcac
ggtactggga cggggcggcc tgctgccccc tcggctgtgt acaggctcct cagtagcgtg
>...>> msnO9
p -
23761
catggatctg cacctgacag gaaagaccgc cgtcgtgacc ggcggaagcc ggggcatcgg
gtacctagac gtggactgtc ctttctggcg gcagcactgg ccgccttcgg ccccgtagcc
>>...........................msnO10............................>
m d l
h l t
g k t
a v v t
g g s
r g i
23821
actggccatc gcacgtgggc tggccggtga gggcgtacgc gtggtctgcg gggccagcag
tgaccggtag cgtgcacccg accggccact cccgcatgcg caccagacgc cccggtcgtc
>............................msnO10.............................>
g l a i
a r g
l a g
e g v r
v v c
g a s
418
Anhang
23881
tcccgccccc gcaccggagg acagctctat cctcacgttg aaggtggacc tgtcgacccc
agggcggggg cgtggcctcc tgtcgagata ggagtgcaac ttccacctgg acagctgggg
>............................msnO10.............................>
s p a p
a p e
d s s
i l t l
k v d
l s t
23941
ggaagggccg cagcagctcg ccgactacgc cctggaacag ctcggcggcg tcgacgtgct
ccttcccggc gtcgtcgagc ggctgatgcg ggaccttgtc gagccgccgc agctgcacga
>............................msnO10.............................>
p e g p
q q l
a d y
a l e q
l g g
v d v
24001
ggtcaacaac gtcggtggcg gcctcatccc ggaccggccc ttcccggaga tcgacgacaa
ccagttgttg cagccaccgc cggagtaggg cctggccggg aagggcctct agctgctgtt
>............................msnO10.............................>
l v n n
v g g
g l i
p d r p
f p e
i d d
24061
gttctggtac gacgcgctca aggtcacttt cctcagcacg gtgcggacga cacgggcgat
caagaccatg ctgcgcgagt tccagtgaaa ggagtcgtgc cacgcctgct gtgcccgcta
>............................msnO10.............................>
k f w y
d a l
k v t
f l s t
v r t
t r a
24121
gctgccggga ctgctggaac gccgcggcag catcatccac atcgggtcga tcgccgccca
cgacggccct gacgaccttg cggcgccgtc gtagtaggtg tagcccagct agcggcgggt
>............................msnO10.............................>
m l p g
l l e
r r g
s i i h
i g s
i a a
24181
caccccggac cccgggcacc tgccgtacag cgcggcgaag agcgcggcgc gcaacttcac
gtggggcctg gggcccgtgg acggcatgtc gcgccgcttc tcgcgccgcg cgttgaagtg
>............................msnO10.............................>
h t p d
p g h
l p y
s a a k
s a a
r n f
24241
ggccggcctg gcgaagcagt atgcgagcca ggggctgcgg gtcaacacca tcgcgcccgg
ccggccggac cgcttcgtca tacgctcggt ccccgacgcc cagttgtggt agcgcgggcc
>............................msnO10.............................>
t a g l
a k q
y a s
q g l r
v n t
i a p
24301
tgtcgtcaac accggtctgt ggagctcgcc gggcggggcc ggggagcggc tggcgaaaga
acagcagttg tggccagaca cctcgagcgg cccgccccgg cccctcgccg accgctttct
>............................msnO10.............................>
g v v n
t g l
w s s
p g g a
g e r
l a k
24361
tctgggcatt ccactggagg atgtcatcaa ggaaatgccg aagctggccg gaattcccac
agacccgtaa ggtgacctcc tacagtagtt cctttacggc ttcgaccggc cttaagggtg
>............................msnO10.............................>
d l g i
p l e
d v i
k e m p
k l a
g i p
24421
cggacgggtc acggagcagg aggagatcgc cgcgctcgcg ctgctgctcg cctccgatct
gcctgcccag tgcctcgtcc tcctctagcg gcgcgagcgc gacgacgagc ggaggctaga
>............................msnO10.............................>
t g r v
t e q
e e i
a a l a
l l l
a s d
24481
ggtgcccaac atcaccggcg cggaattcgt tgtggacggt gccctgacgt ccgctcgcac
ccacgggttg tagtggccgc gccttaagca acacctgcca cgggactgca ggcgagcgtg
>............................msnO10.............................>
l v p n
i t g
a e f
v v d g
a l t
s a r
24541
atgacggacg gagtaatcga agagatggcc aaggagggaa cagaatgggc aagcaagtgt
tactgcctgc ctcattagct tctctaccgg ttcctccctt gtcttacccg ttcgttcaca
>.>> msnO10
t >>....msnK3.....>
m g
k q v
Anhang
419
24601
tcaatatcga cgacctgaag cggattattc tcgaaggggc cggagaaccg gaaggcccag
agttatagct gctggacttc gcctaataag agcttccccg gcctcttggc cttccgggtc
>.............................msnK3.............................>
f n i
d d l k
r i i
l e g
a g e p
e g p
24661
gggtggaggc gacgacggtc gatctcgagt tccaggaact cggctacgac tcgctggcgg
cccacctccg ctgctgccag ctagagctca aggtccttga gccgatgctg agcgaccgcc
>.............................msnK3.............................>
g v e
a t t v
d l e
f q e
l g y d
s l a
24721
tcctggagac ctgcacccgg atcgagcgcg agttcggcgt ctccctggac gaggaggtgc
aggacctctg gacgtgggcc tagctcgcgc tcaagccgca gagggacctg ctcctccacg
>.............................msnK3.............................>
v l e
t c t r
i e r
e f g
v s l d
e e v
24781
tgggccaggc ccgcaccccg cgtgtgctgg tcgacatcgt caacaggcat ttgtccatag
acccggtccg ggcgtggggc gcacacgacc agctgtagca gttgtccgta aacaggtatc
>.............................msnK3.............................>
l g q
a r t p
r v l
v d i
v n r h
l s i
24841
gcgaatctgg catgagcgag ccgggagtac accatggctg atcaggacag gcgggtggcc
cgcttagacc gtactcgctc ggccctcatg tggtaccgac tagtcctgtc cgcccaccgg
>...................msnK3..................>>
g e s
g m s e
p g v
h h g
>>.........msnO11...........>
m a
d q d
r r v a
24901
gtcgtcaccg gagcgacgag cggtatcggg ctcgccgtca ccaggagtct cgcgcgcgag
cagcagtggc ctcgctgctc gccatagccc gagcggcagt ggtcctcaga gcgcgcgctc
>............................msnO11.............................>
v v t
g a t
s g i g
l a v
t r s
l a r e
24961
ggctaccgcg tctacttctg cgcgcgcacc gaagactccg tgaccaccac ggtcaagagc
ccgatggcgc agatgaagac gcgcgcgtgg cttctgaggc actggtggtg ccagttctcg
>............................msnO11.............................>
g y r
v y f
c a r t
e d s
v t t
t v k s
25021
ctgcgtgagg aagggctgga ggtcgacggc agcgcgtgcg acgtgcggtc cggcgcggac
gacgcactcc ttcccgacct ccagctgccg tcgcgcacgc tgcacgccag gccgcgcctg
>............................msnO11.............................>
l r e
e g l
e v d g
s a c
d v r
s g a d
25081
gtacgcgcgt tcgtggccgg cgccgtcgag cggttcggtg cggtggacac gctggtgaac
catgcgcgca agcaccggcc gcggcagctc gccaagccac gccacctgtg cgaccacttg
>............................msnO11.............................>
v r a
f v a
g a v e
r f g
a v d
t l v n
25141
aacgccggac gcagcggcgg aggggtgacc gcggggatct ccgacgagtt gtgggccgat
ttgcggcctg cgtcgccgcc tccccactgg cgcccctaga ggctgctcaa cacccggcta
>............................msnO11.............................>
n a g
r s g
g g v t
a g i
s d e
l w a d
25201
gtgatggaca ccaacctgaa cagcgtgttc cggatgacgc gggaggtgct gaccgtcggc
cactacctgt ggttggactt gtcgcacaag gcctactgcg ccctccacga ctggcagccg
>............................msnO11.............................>
v m d
t n l
n s v f
r m t
r e v
l t v g
25261
ggcatgttgg accgggcgcg ggggcgagtg gtcaacgtcg cttccaccgc agggaaacag
ccgtacaacc tggcccgcgc ccccgctcac cagttgcagc gaaggtggcg tccctttgtc
>............................msnO11.............................>
g m l
d r a
r g r v
v n v
a s t
a g k q
420
Anhang
25321
ggggtcgtcc tcggcgcccc ctactccgcc tccaagcacg gcgtcgtggg tttcaccaag
ccccagcagg agccgcgggg gatgaggcgg aggttcgtgc cgcagcaccc aaagtggttc
>............................msnO11.............................>
g v v
l g a
p y s a
s k h
g v v
g f t k
25381
gcactcggca acgagctggc ccctaccggc atcaccgtca acgcggtctg cccgggctat
cgtgagccgt tgctcgaccg gggatggccg tagtggcagt tgcgccagac gggcccgata
>............................msnO11.............................>
a l g
n e l
a p t g
i t v
n a v
c p g y
25441
gtcgagacac ccatggcgga gcgggtccgt cggggatacg cggacgcgtg gaacacctcg
cagctctgtg ggtaccgcct cgcccaggca gcccctatgc gcctgcgcac cttgtggagc
>............................msnO11.............................>
v e t
p m a
e r v r
r g y
a d a
w n t s
25501
gaggagacga tcctggagaa gttccaggcc aagatcccgc tgggccgcta ctcgacgccc
ctcctctgct aggacctctt caaggtccgg ttctagggcg acccggcgat gagctgcggg
>............................msnO11.............................>
e e t
i l e
k f q a
k i p
l g r
y s t p
25561
gaggaggtgg ccggcctagt gacctatctg agttccgaca ccgccgcctc gatcacggcc
ctcctccacc ggccggatca ctggatagac tcaaggctgt ggcggcggag ctagtgccgg
>............................msnO11.............................>
e e v
a g l
v t y l
s s d
t a a
s i t a
25621
caggccatca acgtctgcgg cggcctgggc aacttctgag ccgaccgcgt cgcagaggaa
gtccggtagt tgcagacgcc gccggacccg ttgaagactc ggctggcgca gcgtctcctt
>.................msnO11................>>
q a i
n v c
g g l g
n f -
25681
cgccgtacag agatgtcgta caggaatgga gacgaccgga tgagcgaatc ggcatcgcgc
gcggcatgtc tctacagcat gtccttacct ctgctggcct actcgcttag ccgtagcgcg
>>.......msnC3........>
m s e
s a s r
25741
gaggtcgagc acgagatcac gatcatggct ccggcgaaca cggtgtacgg gctgatcgag
ctccagctcg tgctctagtg ctagtaccga ggccgcttgt gccacatgcc cgactagctc
>.............................msnC3.............................>
e v e
h e i
t i m a
p a n
t v y
g l i e
25801
gacgtgacga actggcctca tgtcttcccg cccaccatcc acgtggaacg gctcgaatcc
ctgcactgct tgaccggagt acagaagggc gggtggtagg tgcaccttgc cgagcttagg
>.............................msnC3.............................>
d v t
n w p
h v f p
p t i
h v e
r l e s
25861
gaggggcggt cggagcggat acggatctgg gccaccgccc gtggcgaggc gaagacctgg
ctccccgcca gcctcgccta tgcctagacc cggtggcggg caccgctccg cttctggacc
>.............................msnC3.............................>
e g r
s e r
i r i w
a t a
r g e
a k t w
25921
acctcccgcc gggaactgga tccggaggcc ctgcgcatca ccttccgcca ggagcagtcc
tggagggcgg cccttgacct aggcctccgg gacgcgtagt ggaaggcggt cctcgtcagg
>.............................msnC3.............................>
t s r
r e l
d p e a
l r i
t f r
q e q s
25981
gcgccgccgg tcgcctcgat ggggggcacc tggatcatcg agccgcagtc cgcggacacc
cgcggcggcc agcggagcta ccccccgtgg acctagtagc tcggcgtcag gcgcctgtgg
>.............................msnC3.............................>
a p p
v a s
m g g t
w i i
e p q
s a d t
Anhang
421
26041
tgccgggtcc gtctgctgca cgactaccgc gcactcggcg actccgccga aggactggcc
acggcccagg cagacgacgt gctgatggcg cgtgagccgc tgaggcggct tcctgaccgg
>.............................msnC3.............................>
c r v
r l l
h d y r
a l g
d s a
e g l a
26101
tggattgacg aagcggtcga cctcaacagc cgttccgagc tggccgccct gcgcgacagc
acctaactgc ttcgccagct ggagttgtcg gcaaggctcg accggcggga cgcgctgtcg
>.............................msnC3.............................>
w i d
e a v
d l n s
r s e
l a a
l r d s
26161
gcggaacggg ccggccactc cggtgagctg ctcctgagct tcgacgacac cgtgtatatc
cgccttgccc ggccggtgag gccactcgac gaggactcga agctgctgtg gcacatatag
>.............................msnC3.............................>
a e r
a g h
s g e l
l l s
f d d
t v y i
26221
gacggttcgg ccgaggacgt ctacgacttc ctcaacgcgg cggaccgctg gcgggagcgg
ctgccaagcc ggctcctgca gatgctgaag gagttgcgcc gcctggcgac cgccctcgcc
>.............................msnC3.............................>
d g s
a e d
v y d f
l n a
a d r
w r e r
26281
ttgccgcacg tcgaccgcgt ggaactgcgt gaggacgacc ccggacttca agtgctcacc
aacggcgtgc agctggcgca ccttgacgca ctcctgctgg ggcctgaagt tcacgagtgg
>.............................msnC3.............................>
l p h
v d r
v e l r
e d d
p g l
q v l t
26341
atggacacac tgaccaagga cggttccaaa cacacgacgg agtcggtccg cgtctgtttc
tacctgtgtg actggttcct gccaaggttt gtgtgctgcc tcagccaggc gcagacaaag
>.............................msnC3.............................>
m d t
l t k
d g s k
h t t
e s v
r v c f
26401
ccgcactcaa ggatcgtcta caagcagacc cgggtgcccg cgctgatgac cgtgcacacg
ggcgtgagtt cctagcagat gttcgtctgg gcccacgggc gcgactactg gcacgtgtgc
>.............................msnC3.............................>
p h s
r i v
y k q t
r v p
a l m
t v h t
26461
ggccagtggc gcctggtgga gggagccggc gcgctggccg tgacctcgcg gcacaccgtg
ccggtcaccg cggaccacct ccctcggccg cgcgaccggc actggagcgc cgtgtggcac
>.............................msnC3.............................>
g q w
r l v
e g a g
a l a
v t s
r h t v
26521
gtgctcaatc cggaaacgat ccgtcaggtg ctcggcgaga cggcaggagt ggcggacgcc
cacgagttag gcctttgcta ggcagtccac gagccgctct gccgtcctca ccgcctgcgg
>.............................msnC3.............................>
v l n
p e t
i r q v
l g e
t a g
v a d a
26581
aggaaatatg ttcgtagcgc tttgagcgca aacagcctgg ccacgctcgg acacgccaag
tcctttatac aagcatcgcg aaactcgcgt ttgtcggacc ggtgcgagcc tgtgcggttc
>.............................msnC3.............................>
r k y
v r s
a l s a
n s l
a t l
g h a k
26641
gaatatgccg aaggcaaagc ctgaaagggg cgccccgtaa tacgcacctg ttacggggcg
cttatacggc ttccgtttcg gactttcccc gcggggcatt atgcgtggac aatgccccgc
>.........msnC3.........>>
e y a
e g k
a -
26701
cgtcggcgta cagatttacg ctccagattc ggccactcga cctaaagttg cagccaaggt
gcagccgcat gtctaaatgc gaggtctaag ccggtgagct ggatttcaac gtcggttcca
26761
agctgtccgc tctggagtgc atagtggaaa gagctggaaa tcaacggcaa agaagggtgc
tcgacaggcg agacctcacg tatcaccttt ctcgaccttt agttgccgtt tcttcccacg
422
Anhang
26821
aagtaaattg cacccttcgc ccattttgtt gtgatagttg accgatttgc cccctgcccg
ttcatttaac gtgggaagcg ggtaaaacaa cactatcaac tggctaaacg ggggacgggc
26881
gcgcctatcg aacccctccc actgtcgtgt gacgaattac gtgcgaatta ttcaccatga
cgcggatagc ttggggaggg tgacagcaca ctgcttaatg cacgcttaat aagtggtact
26941
tcgatgtagg ggttggctgc ccgcccggtc acccctaatg tcactgtcac agcttgcccg
agctacatcc ccaaccgacg ggcgggccag tggggattac agtgacagtg tcgaacgggc
27001
ttgaatgaca gagaaggcgg ctatgcggat cctgccgtct gaaaggtgtt ggcgctggtg
aacttactgt ctcttccgcc gatacgccta ggacggcaga ctttccacaa ccgcgaccac
msnR1 >>>
v
27061
cacgtgaaaa tactcgggtc gttcgaaatc agtgtgcagg gaaactccat cgttccatcc
gtgcactttt atgagcccag caagctttag tcacacgtcc ctttgaggta gcaaggtagg
>.............................msnR1.............................>
h v k
i l g
s f e i
s v q
g n s
i v p s
27121
gcaccaaaac tccggcaaat acttgccctg ctggcaatac gatcgaactc cgtagtggcc
cgtggttttg aggccgttta tgaacgggac gaccgttatg ctagcttgag gcatcaccgg
>.............................msnR1.............................>
a p k
l r q
i l a l
l a i
r s n
s v v a
27181
gtctccgact tcgtcgacga ggtatggggg tgtgcaccgc cccgaagtct ttccaccacc
cagaggctga agcagctgct ccataccccc acacgtggcg gggcttcaga aaggtggtgg
>.............................msnR1.............................>
v s d
f v d
e v w g
c a p
p r s
l s t t
27241
cttcagacct acattcttca gatccggaag atccttaaga gcgagggtga ggccgagggc
gaagtctgga tgtaagaagt ctaggccttc taggaattct cgctcccact ccggctcccg
>.............................msnR1.............................>
l q t
y i l
q i r k
i l k
s e g
e a e g
27301
tatggggaag ccggggaaaa cgggctgcca agctcgataa tcacccatcc gggaggctat
ataccccttc ggcccctttt gcccgacggt tcgagctatt agtgggtagg ccctccgata
>.............................msnR1.............................>
y g e
a g e
n g l p
s s i
i t h
p g g y
27361
cttctccaga ctccggagtc gaccaagaaa gacttcgaag atttcaatga atccgttgaa
gaagaggtct gaggcctcag ctggttcttt ctgaagcttc taaagttact taggcaactt
>.............................msnR1.............................>
l l q
t p e
s t k k
d f e
d f n
e s v e
27421
aaaggtcatc gggagatgct gttcggccac tacgcggaag cggtgcgcat actctccgac
tttccagtag ccctctacga caagccggtg atgcgccttc gccacgcgta tgagaggctg
>.............................msnR1.............................>
k g h
r e m
l f g h
y a e
a v r
i l s d
27481
gcgctctccc tgtggcgtgg ctcggccctg gtcgacgtcc accgcggctc cctgctcgac
cgcgagaggg acaccgcacc gagccgggac cagctgcagg tggcgccgag ggacgagctg
>.............................msnR1.............................>
a l s
l w r
g s a l
v d v
h r g
s l l d
27541
agttacgccg tgcggctgga agaggcccgg ctgtccgcgc agatcctgcg cacggacgcc
tcaatgcggc acgccgacct tctccgggcc gacaggcgcg tctaggacgc gtgcctgcgg
>.............................msnR1.............................>
s y a
v r l
e e a r
l s a
q i l
r t d a
Anhang
423
27601
tgcctcggac agggctgcga ccttcagctt ctccccgaac tgaattccct ggtcgggctg
acggagcctg tcccgacgct ggaagtcgaa gaggggcttg acttaaggga ccagcccgac
>.............................msnR1.............................>
c l g
q g c
d l q l
l p e
l n s
l v g l
27661
catccgctca acgagaaact gcagtaccag cggatgctgg cgctgtaccg gtccgggcag
gtaggcgagt tgctctttga cgtcatggtc gcctacgacc gcgacatggc caggcccgtc
>.............................msnR1.............................>
h p l
n e k
l q y q
r m l
a l y
r s g q
27721
gtggccgaat cgctccagag ttaccggaat ttctactccg tcgtgaagga gcaggtcggc
caccggctta gcgaggtctc aatggcctta aagatgaggc agcacttcct cgtccagccg
>.............................msnR1.............................>
v a e
s l q
s y r n
f y s
v v k
e q v g
27781
atcgagccgt ccccccagct ccaggagctt cagagagcca tcttcgactc cttgccggcc
tagctcggca ggggggtcga ggtcctcgaa gtctctcggt agaagctgag gaacggccgg
>.............................msnR1.............................>
i e p
s p q
l q e l
q r a
i f d
s l p a
27841
ctgtcggagc cgtccccttc cgcggagaca cacaaggtca tctcagggag cgtccgacgc
gacagcctcg gcaggggaag gcgcctctgt gtgttccagt agagtccctc gcaggctgcg
>.............................msnR1.............................>
l s e
p s p
s a e t
h k v
i s g
s v r r
27901
agcccgtgac ctcctgacgg cacgccacac gaggagaatc cccatggcct caccggctcg
tcgggcactg gaggactgcc gtgcggtgtg ctcctcttag gggtaccgga gtggccgagc
>.msnR1>>
s p >>....msnH7......>
m a
s p a
27961
tgagtcggcc accgacgtgc ggcggatcac gctcgacgcc gacggcatca ctctgtccgc
actcagccgg tggctgcacg ccgcctagtg cgagctgcgg ctgccgtagt gagacaggcg
>.............................msnH7.............................>
r e s a
t d v
r r i
t l d a
d g i
t l s
28021
cctgctgagc gagcccgtcg aagcgccgcc ccgcgccgtc gtcgtagcac tgcacggcgg
ggacgactcg ctcgggcagc ttcgcggcgg ggcgcggcag cagcatcgtg acgtgccgcc
>.............................msnH7.............................>
a l l s
e p v
e a p
p r a v
v v a
l h g
28081
cggcatgaac gccaactact tcaccggccc ggcccacccg tcgctgtcgc tgctgtcgct
gccgtacttg cggttgatga agtggccggg ccgggtgggc agcgacagcg acgacagcga
>.............................msnH7.............................>
g g m n
a n y
f t g
p a h p
s l s
l l s
28141
gggggccgct ctcgggctca ccgtgctcgc cgtggaccgg cccggctacc gggcctccgc
cccccggcga gagcccgagt ggcacgagcg gcacctggcc gggccgatgg cccggaggcg
>.............................msnH7.............................>
l g a a
l g l
t v l
a v d r
p g y
r a s
28201
ggcccgactg ccggccggcc tgggcgtaag cgaacaggcc gggctcctgc gggcgacgct
ccgggctgac ggccggccgg acccgcattc gcttgtccgg cccgaggacg cccgctgcga
>.............................msnH7.............................>
a a r l
p a g
l g v
s e q a
g l l
r a t
28261
ggacgacttc gcagcccggt acgagaccgg ggccggattc tttctcctgg cacactccta
cctgctgaag cgtcgggcca tgctctggcc ccggcctaag aaagaggacc gtgtgaggat
>.............................msnH7.............................>
l d d f
a a r
y e t
g a g f
f l l
a h s
424
Anhang
28321
cggtggcaag gtcgcgctcg tcgccgccgc cgagcacccg ccgcagcggc tgatcggcct
gccaccgttc cagcgcgagc agcggcggcg gctcgtgggc ggcgtcgccg actagccgga
>.............................msnH7.............................>
y g g k
v a l
v a a
a e h p
p q r
l i g
28381
ggacatctcg ggctgcgggt acgcctacgc gatcgacccc ggccaggtgt cgaaagcgct
cctgtagagc ccgacgccca tgcggatgcg ctagctgggg ccggtccaca gctttcgcga
>.............................msnH7.............................>
l d i s
g c g
y a y
a i d p
g q v
s k a
28441
ggaacgcggc tgggtcccga aaagctgggg cccactgcgc ctctacccgc ccgggacgtt
ccttgcgccg acccagggct tttcgacccc gggtgacgcg gagatgggcg ggccctgcaa
>.............................msnH7.............................>
l e r g
w v p
k s w
g p l r
l y p
p g t
28501
cggcgccggg cgcgggctcg tcgaacccat gccccacgcc gaacgcgcgg agctgacgcg
gccgcggccc gcgcccgagc agcttgggta cggggtgcgg cttgcgcgcc tcgactgcgc
>.............................msnH7.............................>
f g a g
r g l
v e p
m p h a
e r a
e l t
28561
gtggcccgga ctcttccggg ccaccgcgcc cggcgtcgag gcgccggtgc gactgacctt
caccgggcct gagaaggccc ggtggcgcgg gccgcagctc cgcggccacg ctgactggaa
>.............................msnH7.............................>
r w p g
l f r
a t a
p g v e
a p v
r l t
28621
cgccgaacac gaggcgttct ggcggcatga cgacgtggcg ctggcagatc tgaccgcccg
gcggcttgtg ctccgcaaga ccgccgtact gctgcaccgc gaccgtctag actggcgggc
>.............................msnH7.............................>
f a e h
e a f
w r h
d d v a
l a d
l t a
28681
gttcaccgcc gcccggcaca tcaccgtcga ccggcagccg ggtgctggcc acaacatcag
caagtggcgg cgggccgtgt agtggcagct ggccgtcggc ccacgaccgg tgttgtagtc
>.............................msnH7.............................>
r f t a
a r h
i t v
d r q p
g a g
h n i
28741
cctgggctgg gcggcccgtt cgtaccatct gcgggccatc gccttcctgg agagctgcct
ggacccgacc cgccgggcaa gcatggtaga cgcccggtag cggaaggacc tctcgacgga
>.............................msnH7.............................>
s l g w
a a r
s y h
l r a i
a f l
e s c
28801
cgtcccgcac gaggcggtgc ccgcggccca cgccgccccg gaccctcggc catgagcggc
gcagggcgtg ctccgccacg ggcgccgggt gcggcggggc ctgggagccg gtactcgccg
>..........................msnH7..........................>>
l v p h
e a v
p a a
h a a p
d p r
p >>msnH8.>
m s g
28861
ggccggccgc gccggaacat cgaccggggc atcttccggt ccctggccgt caggaacttc
ccggccggcg cggccttgta gctggccccg tagaaggcca gggaccggca gtccttgaag
>.............................msnH8.............................>
g r p
r r n
i d r g
i f r
s l a
v r n f
28921
cggttgttcg tgaccgggca ggcgctgtcg gtgtccgcca cctggatgat ggtcgtcgcc
gccaacaagc actggcccgt ccgcgacagc cacaggcggt ggacctacta ccagcagcgg
>.............................msnH8.............................>
r l f
v t g
q a l s
v s a
t w m
m v v a
28981
caggactggc tcgtcctctc gctgaccgga gactccggcc tggccctggg gttcgtcacc
gtcctgaccg agcaggagag cgactggcct ctgaggccgg accgggaccc caagcagtgg
>.............................msnH8.............................>
q d w
l v l
s l t g
d s g
l a l
g f v t
Anhang
425
29041
gcggcccagt tcggcccgct gctgctgttc acacttcacg gcggaaagct cgcggaccgg
cgccgggtca agccgggcga cgacgacaag tgtgaagtgc cgcctttcga gcgcctggcc
>.............................msnH8.............................>
a a q
f g p
l l l f
t l h
g g k
l a d r
29101
tatgacaaac gcaggccgcc aaccattgcg tccagttggg tacggagccg ggctaccggg
atactgtttg cgtccggcgg ttggtaacgc aggtcaaccc atgcctcggc ccgatggccc
>.............................msnH8.............................>
y d k
r r p
p t i a
s s w
v r s
r a t g
29161
gtcgggtgct cgccctctac acgctgatca tgcagggatc caccaccgtg ggcgcagtga
cagcccacga gcgggagatg tgcgactagt acgtccctag gtggtggcac ccgcgtcact
>...........msnH8..........>>
v g c
s p s
t r -
29221
tcacggggtg gatcatcgca tccctcggcg tgcgggcgag cctgtgcctg ggcggtcttg
agtgccccac ctagtagcgt agggagccgc acgcccgctc ggacacggac ccgccagaac
29281
tcgctctgct cgcggctgtg tcggcgagtg cccgggaacc ctcccgggtg gcgggtgtca
agcgagacga gcgccgacac agccgctcac gggcccttgg gagggcccac cgcccacagt
msnR2 <<<
-
29341
ccgaagaagc ccgtccgacg gaatcgggac cgccgtcacc agatcttccc tgcgcttcag
ggcttcttcg ggcaggctgc cttagccctg gcggcagtgg tctagaaggg acgcgaagtc
<.............................msnR2.............................<
r l l
g d s
p i p v
a t v
l d e
r r k l
29401
accgagcttc cggtagatct tcgtaaggtg ctgctcgacg gtgctcaccg tgatgcagag
tggctcgaag gccatctaga agcattccac gacgagctgc cacgagtggc actacgtctc
<.............................msnR2.............................<
g l k
r y i
k t l h
q e v
t s v
t i c l
29461
ccgggtcgcc acctctcggt tgctgtgccc gatgccggcc agccatgcca cccgccgttc
ggcccagcgg tggagagcca acgacacggg ctacggccgg tcggtacggt gggcggcaag
<.............................msnR2.............................<
r t a
v e r
n s h g
i g a
l w a
v r r e
29521
ggccgagctg agcagggcgg caccgctgac ggagggcttg gccgacgtgg cgggccgctg
ccggctcgac tcgtcccgcc gtggcgactg cctcccgaac cggctgcacc gcccggcgac
<.............................msnR2.............................<
a s s
l l a
a g s v
s p k
a s t
a p r q
29581
ccggcgatcg tccggcgcct cgcccgggtc gtcgtcgtcg gcggcgaggt ccgccggaga
ggccgctagc aggccgcgga gcgggcccag cagcagcagc cgccgctcca ggcggcctct
<.............................msnR2.............................<
r r d
d p a
e g p d
d d d
a a l
d a p s
29641
cgaggccatg accgcgtcag ccggtccgct ggccaccacg gcccgcagga gtggttcgga
gctccggtac tggcgcagtc ggccaggcga ccggtggtgc cgggcgtcct caccaagcct
<.............................msnR2.............................<
s a m
v a d
a p g s
a v v
a r l
l p e s
29701
cccggcgaac ccggcgatgc tccaggcccg gcgaatgagc acccggcccg ccttcggaag
gggccgcttg ggccgctacg aggtccgggc cgcttactcg tgggccgggc ggaagccttc
<.............................msnR2.............................<
g a f
g a i
s w a r
r i l
v r g
a k p l
426
Anhang
29761
gtcgagggcg tagtgggtac gccccaactc gtacagacag atggcgaggt cgacccgatg
cagctcccgc atcacccatg cggggttgag catgtctgtc taccgctcca gctgggctac
<.............................msnR2.............................<
d l a
y h t
r g l e
y l c
i a l
d v r h
29821
cacgccccct tccagcagac cgaccgcgtc gcgaaggagg tccgcccggg actcgaccgg
gtgcggggga aggtcgtctg gctggcgcag cgcttcctcc aggcgggccc tgagctggcc
<.............................msnR2.............................<
v g g
e l l
g v a d
r l l
d a r
s e v p
29881
gcgggcgagc gcgagcaccc gcagggctat cgccttcgcc ccggtgtcgc ccgaggtggc
cgcccgctcg cgctcgtggg cgtcccgata gcggaagcgg ggccacagcg ggctccaccg
<.............................msnR2.............................<
r a l
a l v
r l a i
a k a
g t d
g s t a
29941
gacgacctct ttcgcggtac gtgtcgcctc cttctcccgg cccaggagga gatacgcctg
ctgctggaga aagcgccatg cacagcggag gaagagggcc gggtcctcct ctatgcggac
<.............................msnR2.............................<
v v e
k a t
r t a e
k e r
g l l
l y a q
30001
cgcggacctg gaccgccagg ggcaggtggg cacggaagga atcgccaggc gcttttcgat
gcgcctggac ctggcggtcc ccgtccaccc gtgccttcct tagcggtccg cgaaaagcta
<.............................msnR2.............................<
a s r
s r w
p c t p
v s p
i a l
r k e i
30061
ctcaccgcac gcgagaaaat cccccagcgc ggaataaggc atcctgatgg tcagtcgata
gagtggcgtg cgctctttta gggggtcgcg ccttattccg taggactacc agtcagctat
<.............................msnR2.............................<
e g c
a l f
d g l a
s y p
m r i
t l r y
30121
cattccgcga gcatataagt acatgcggcc cagctccgat tcgtagaact tcgcgggcac
gtaaggcgct cgtatattca tgtacgccgg gtcgaggcta agcatcttga agcgcccgtg
<.............................msnR2.............................<
m g r
a y l
y m r g
l e s
e y f
k a p v
30181
gggtatgcgc agggtcgatt tcgcttcttc gaacttgccc tgttggacct gggaaaggat
cccatacgcg tcccagctaa agcgaagaag cttgaacggg acaacctgga ccctttccta
<.............................msnR2.............................<
p i r
l t s
k a e e
f k g
q q v
q s l i
30241
cagaacactc agtggaagac ccacgtagat gccccaactg gagggctggg agagcgcgct
gtcttgtgag tcaccttctg ggtgcatcta cggggttgac ctcccgaccc tctcgcgcga
<.............................msnR2.............................<
l v s
l p l
g v y i
g w s
s p q
s l a s
30301
gagggcatcc ttttcggcct tggccggatt tccgccggtc agtgcgctga ccgcctgtaa
ctcccgtagg aaaagccgga accggcctaa aggcggccag tcacgcgact ggcggacatt
<.............................msnR2.............................<
l a d
k e a
k a p n
g g t
l a s
v a q l
30361
gcagtgcagc atcatgcgcc ggaacgggct catacgtgcg gaggtgtctt tctccaggcc
cgtcacgtcg tagtacgcgg ccttgcccga gtatgcacgc ctccacagaa agaggtccgg
<.............................msnR2.............................<
c h l
m m r
r f p s
m r a
s t d
k e l g
30421
gtcgaggaag ggcatttccg gtagcacaag gcagatgtgg ttcaaaagcc tcgtggtgaa
cagctccttc ccgtaaaggc catcgtgttc cgtctacacc aagttttcgg agcaccactt
<.............................msnR2.............................<
d l f
p m e
p l v l
c i h
n l l
r t t f
Anhang
427
30481
gaacccgata tcggtgatcc agttcgcctg gtcggcgtcc aggaagtagg agcggaccgt
cttgggctat agccactagg tcaagcggac cagccgcagg tccttcatcc tcgcctggca
<.............................msnR2.............................<
f g i
d t i
w n a q
d a d
l f y
s r v t
30541
ctgcttccgc actttgcaag cccatggcgt tctgcccagg ccggcatcga cgaccgccgc
gacgaaggcg tgaaacgttc gggtaccgca agacgggtcc ggccgtagct gctggcggcg
<.............................msnR2.............................<
q k r
v k c
a w p t
r g l
g a d
v v a a
30601
cgtcgcatcg cccaaccaca gagcggcgga tgtggtggcg tgctccgggc cggccgggga
gcagcgtagc gggttggtgt ctcgccgcct acaccaccgc acgaggcccg gccggcccct
<.............................msnR2.............................<
t a d
g l w
l a a s
t t a
h e p
g a p s
30661
agggtccggc gctgtcgcct gcccgggtgc cgcttgcggc ctccccacca ggctgaggtg
tcccaggccg cgacagcgga cgggcccacg gcgaacgccg gaggggtggt ccgactccac
<.............................msnR2.............................<
p d p
a t a
q g p a
a q p
r g v
l s l h
30721
cctgtccagt tccccgcggt ccgggtcgct caacaggccc agcagctggt cggcctccgt
ggacaggtca aggggcgcca ggcccagcga gttgtccggg tcgtcgacca gccggaggca
<.............................msnR2.............................<
r d l
e g r
d p d s
l l g
l l q
d a e t
30781
ctgccgcccg gtccaggcga gcatcgcaga gaccgatatg acactgcggc cgggcagtcg
gacggcgggc caggtccgct cgtagcgtct ctggctatac tgtgacgccg gcccgtcagc
<.............................msnR2.............................<
q r g
t w a
l m a s
v s i
v s r
g p l r
30841
cccgcgctgg gcgagcgaga ccagttcggg gaggtagctc agggccgcat gggcgtccac
gggcgcgacc cgctcgctct ggtcaagccc ctccatcgag tcccggcgta cccgcaggtg
<.............................msnR2.............................<
g r q
a l s
v l e p
l y s
l a a
h a d v
30901
ccgccacttg gcgcagacgg tttccatcag gacctccggc tgttcgccgg ggtcgcacgg
ggcggtgaac cgcgtctgcc aaaggtagtc ctggaggccg acaagcggcc ccagcgtgcc
<.............................msnR2.............................<
r w k
a c v
t e m l
v e p
q e g
p d c p
30961
agatgtgcgc gccaggtcca gacagttcac cgcctcatgc cactcgccat ggacctgtgc
tctacacgcg cggtccaggt ctgtcaagtg gcggagtacg gtgagcggta cctggacacg
<.............................msnR2.............................<
s t r
a l d
l c n v
a e h
w e g
h v q a
31021
ctgtcgcgcg gcctcccgca gtacggccgt ctcccaggac tccgtcgcga ctccggcggc
gacagcgcgc cggagggcgt catgccggca gagggtcctg aggcagcgct gaggccgccg
<.............................msnR2.............................<
q r a
a e r
l v a t
e w s
e t a
v g a a
31081
gagaatgtac tcggctacct tgcgttcgga cgcgcctcgt tgatgcagca gccgcgccgc
ctcttacatg agccgatgga acgcaagcct gcgcggagca actacgtcgt cggcgcggcg
<.............................msnR2.............................<
l i y
e a v
k r e s
a g r
q h l
l r a a
31141
cgaccgatgg aagtccacgc gctccctgaa agcggggtcc tccaagatca cggcacggat
gctggctacc ttcaggtgcg cgagggactt tcgccccagg aggttctagt gccgtgccta
<.............................msnR2.............................<
s r h
f d v
r e r f
a p d
e l i
v a r i
428
Anhang
31201
cgccgggtgc ctgaaagcac cgtccgaggc cagcccgatc gcctcgatca gctcaacggc
gcggcccacg gactttcgtg gcaggctccg gtcgggctag cggagctagt cgagttgccg
<.............................msnR2.............................<
a p h
r f a
g d s a
l g i
a e i
l e v a
31261
gtccgctgtc tcggtcggct cgaccccgct cagggcgctc aacagcgcga ccggcacacc
caggcgacag agccagccga gctggggcga gtcccgcgag ttgtcgcgct ggccgtgtgg
<.............................msnR2.............................<
d a t
e t p
e v g s
l a s
l l a
v p v g
31321
accgccgagg accgccatgg ctcgggcgac cccttcgaga ttggccacat agctgttgca
tggcggctcc tggcggtacc gagcccgctg gggaagctct aaccggtgta tcgacaacgt
<.............................msnR2.............................<
g g l
v a m
a r a v
g e l
n a v
y s n c
31381
gaccaacagc ttcaccacct cccggaagcc cggtccctgg tccagcccct gctccggcga
ctggttgtcg aagtggtgga gggccttcgg gccagggacc aggtcgggga cgaggccgct
<.............................msnR2.............................<
v l l
k v v
e r f g
p g q
d l g
q e p s
31441
atgtcccgac cccggcagag ccttcatgcc ctgggcgaca gtcgccagca ggcgcgcgtt
tacagggctg gggccgtctc ggaagtacgg gacccgctgt cagcggtcgt ccgcgcgcaa
<.............................msnR2.............................<
h g s
g p l
a k m g
q a v
t a l
l r a n
31501
ccccccggtc agctccatgg ctttcttcac atgggccggc gtggggcgac tccccgtcac
ggggggccag tcgaggtacc gaaagaagtg tacccggccg caccccgctg aggggcagtg
<.............................msnR2.............................<
g g t
l e m
a k k v
h a p
t p r
s g t v
31561
cttccggatc agcttggccg cttcgcgcga cgtgaaaagc gacagttcca gaaccagcag
gaaggcctag tcgaaccggc gaagcgcgct gcacttttcg ctgtcaaggt cttggtcgtc
<.............................msnR2.............................<
k r i
l k a
a e r s
t f l
s l e
l v l l
31621
ggaggggttc ttcatgaggt cgaaccgaaa gtcccgaagc tgcctcgaat cggcgggata
cctccccaag aagtactcca gcttggcttt cagggcttcg acggagctta gccgccctat
<.............................msnR2.............................<
s p n
k m l
d f r f
d r l
q r s
d a p y
31681
acagccggag agaatcagga agacgggaag tcgctgcagt cggtacagca gagaacgcag
tgtcggcctc tcttagtcct tctgcccttc agcgacgtca gccatgtcgt ctcttgcgtc
<.............................msnR2.............................<
c g s
l i l
f v p l
r q l
r y l
l s r l
31741
cacccagagt gagggtgcgt cggcgaggtg caggtcgtcc acgatgagga cggtgggaga
gtgggtctca ctcccacgca gccgctccac gtccagcagg tgctactcct gccaccctct
<.............................msnR2.............................<
v w l
s p a
d a l h
l d d
v i l
v t p s
31801
cgttccgtcg agccgccgga gcgactcctc tatctgggcg tacatcctgg atgccaggga
gcaaggcagc tcggcggcct cgctgaggag atagacccgc atgtaggacc tacggtccct
<.............................msnR2.............................<
t g d
l r r
l s e e
i q a
y m r
s a l s
31861
acggcacggc ccgcagagct gtgccacctc tccgccgcag cagtgcgtgg tctccaacag
tgccgtgccg ggcgtctcga cacggtggag aggcggcgtc gtcacgcacc agaggttgtc
<.............................msnR2.............................<
r c p
g c l
q a v e
g g c
c h t
t e l l
Anhang
429
31921
gcattccgcg tccgcgttcc gcacgatctc gtcgtcgaac agtcttttga tcagtcccag
cgtaaggcgc aggcgcaagg cgtgctagag cagcagcttg tcagaaaact agtcagggtc
<.............................msnR2.............................<
c e a
d a n
r v i e
d d f
l r k
i l g l
31981
cggtacatcc cgctccgtca gcaccccggc gacttcgcga accactgttc cggcgtcacg
gccatgtagg gcgaggcagt cgtggggccg ctgaagcgct tggtgacaag gccgcagtgc
<.............................msnR2.............................<
p v d
r e t
l v g a
v e r
v v t
g a d r
32041
cgcttcccgg gcgaaccgtt cgagcgagac ggtctttccc accccgaatg caccgtgtac
gcgaagggcc cgcttggcaa gctcgctctg ccagaaaggg tggggcttac gtggcacatg
<.............................msnR2.............................<
a e r
a f r
e l s v
t k g
v g f
a g h v
32101
caccgccact cctccaccgt cttcgagcga cgtccgcatg aattcccaaa gcgtggatgt
gtggcggtga ggaggtggca gaagctcgct gcaggcgtac ttaagggttt cgcacctaca
<.............................msnR2.............................<
v a v
g g g
d e l s
t r m
f e w
l t s t
32161
cacttcactc tgacttgcca ccgaagtgct ccggtttctt caccgttccg aacaggtcag
gtgaagtgag actgaacggt ggcttcacga ggccaaagaa gtggcaaggc ttgtccagtc
<........msnR2.......<<
v e s
q s a
v
32221
gaaacgccca cagttcaccg tgttcgtttc ctgaccacct cctacccacc gccccaagtg
ctttgcgggt gtcaagtggc acaagcaaag gactggtgga ggatgggtgg cggggttcac
32281
cttgaactct taagagttgt gtaagcggac gatgccggac atgacgtggt ggttgcgcat
gaacttgaga attctcaaca cattcgcctg ctacggcctg tactgcacca ccaacgcgta
32341
ggggaaaggt gcacaagcga gccgtcttcg cgcttgcccg gcgccgcccg acgttctgtc
cccctttcca cgtgttcgct cggcagaagc gcgaacgggc cgcggcgggc tgcaagacag
32401
aatcaatgcc gcgtattata tgcgattcgg ccgaattttc ctcctcgtcg gccagacgga
ttagttacgg cgcataatat acgctaagcc ggcttaaaag gaggagcagc cggtctgcct
32461
gcggcggcgt gagggggtcg gtcgtggaac gagcgacatg tcgatgggcg aagggatgct
cgccgccgca ctcccccagc cagcaccttg ctcgctgtac agctacccgc ttccctacga
32521
cgcggtattg cttctcggcc tcgtgcgagg tgtcgtgcac cctgtcctcc ttgtacgggt
gcgccataac gaagagccgg agcacgctcc acagcacgtg ggacaggagg aacatgccca
32581
cagcgcaacg cgggactcaa gagagaccgt gccgagggct cgcgtacgcg agccatggcg
gtcgcgttgc gccctgagtt ctctctggca cggctcccga gcgcatgcgc tcggtaccgc
32641
tcgtgcggct cagtagcggt agtggtcggg cttgtacggg ccctcgacct ggacaccgat
agcacgccga gtcatcgcca tcaccagccc gaacatgccc gggagctgga cctgtggcta
<<.......................msnM1.........................<
- y r
y h d p
k y p
g e v
q v g i
32701
gtacgaggcc tgctcggggc ggagcgtggt cagtttgacg ccgagggcgt cgaggtggag
catgctccgg acgagccccg cctcgcacca gtcaaactgc ggctcccgca gctccacctc
<.............................msnM1.............................<
y s a
q e p
r l t t
l k v
g l a
d l h l
32761
gcgggcgacc ttctcgtcga ggtgcttggg cagcgtgtag acgccggtgg ggtactcgtc
cgcccgctgg aagagcagct ccacgaaccc gtcgcacatc tgcggccacc ccatgagcag
<.............................msnM1.............................<
r a v
k e d
l h k p
l t y
v g t
p y e d
430
Anhang
32821
gggcttggtg aacagctcga tctgggccag ggtctggtcc gcgaaggagt tggacatcac
cccgaaccac ttgtcgagct agacccggtc ccagaccagg cgcttcctca acctgtagtg
<.............................msnM1.............................<
p k t
f l e
i q a l
t q d
a f s
n s m v
32881
gaacgacggg tgaccggtgg cgttgcccag gttcagcagg cggccctcgg acaggacgat
cttgctgccc actggccacc gcaacgggtc caagtcgtcc gccgggagcc tgtcctgcta
<.............................msnM1.............................<
f s p
h g t
a n g l
n l l
r g e
s l v i
32941
gaggaccttg ccgtcgcgga acttccacgt gtggacctgc ggcttgacct cgtccttgac
ctcctggaac ggcagcgcct tgaaggtgca cacctggacg ccgaactgga gcaggaactg
<.............................msnM1.............................<
l v k
g d r
f k w t
h v q
p k v
e d k v
33001
gatgcccggc atcttggcca gtccggccat gtcgatctcg ttgtcgaagt ggccgatgtt
ctacgggccg tagaaccggt caggccggta cagctagagc aacagcttca ccggctacaa
<.............................msnM1.............................<
i g p
m k a
l g a m
d i e
n d f
h g i n
33061
gcccacgatc gcctggtgct tcatcttggc catgtcgccg gccatgatga tgtccttgtt
cgggtgctag cggaccacga agtagaaccg gtacagcggc cggtactact acaggaacaa
<.............................msnM1.............................<
g v i
a q h
k m k a
m d g
a m i
i d k n
33121
gccggtcgtc gtgatgaaga tgtccgcatg gtccacgacg tcgtcgaggg tcgcgacctg
cggccagcag cactacttct acaggcgtac caggtgctgc agcagctccc agcgctggac
<.............................msnM1.............................<
g t t
t i f
i d a h
d v v
d d l
t a v q
33181
gtagccgtcc atcgccgcct gcagagcgca gatcgggtcg atctccgtga cgatgacacg
catcggcagg tagcggcgga cgtctcgcgt ctagcccagc tagaggcact gctactgtgc
<.............................msnM1.............................<
y g d
m a a
q l a c
i p d
i e t
v i v r
33241
ggcgccctgg ccgcgcagcg actccgcaca gcccttgccc acatcgccgt agccgaacac
ccgcgggacc ggcgcgtcgc tgaggcgtgt cgggaacggg tgtagcggca tcggcttgtg
<.............................msnM1.............................<
a g q
g r l
s e a c
g k g
v d g
y g f v
33301
gaccgcggtc ttgccgccga tgaggacgtc ggtggcgcgg ttgatgccgt cgatcaggga
ctggcgccag aacggcggct actcctgcag ccaccgcgcc aactacggca gctagtccct
<.............................msnM1.............................<
v a t
k g g
i l v d
t a r
n i g
d i l s
33361
gtggcggcag ccgtacttgt tgtcgaactt cgacttggtg acggcgtcgt tcacgttgat
caccgccgtc ggcatgaaca acagcttgaa gctgaaccac tgccgcagca agtgcaacta
<.............................msnM1.............................<
h r c
g y k
n d f k
s k t
v a d
n v n i
33421
cgcggggaac aggaggtcgc cgtcgcgctg catctcgtac aggcggtgga cgccggtggt
gcgccccttg tcctccagcg gcagcgcgac gtagagcatg tccgccacct gcggccacca
<.............................msnM1.............................<
a p f
l l d
g d r q
m e y
l r h
v g t t
33481
ggtctcctcg gtcacgccgc ggatctccga ggcgagctgg gtccacttct gcgagccctc
ccagaggagc cagtgcggcg cctagaggct ccgctcgacc caggtgaaga cgctcgggag
<.............................msnM1.............................<
t e e
t v g
r i e s
a l q
t w k
q s g e
Anhang
431
33541
ggtgatggtc cggtcgagga gtccgaggac gacacggtgc tcgtcggact cggcggtgtc
ccactaccag gccagctcct caggctcctg ctgtgccacg agcagcctga gccgccacag
<.............................msnM1.............................<
t i t
r d l
l g l v
v r h
e d s
e a t d
33601
ggcggagggg accttgccct ccttctcgta ctggacgccc ttgtggacga gcatggtggc
ccgcctcccc tggaacggga ggaagagcat gacctgcggg aacacctgct cgtaccaccg
<.............................msnM1.............................<
a s p
v k g
e k e y
q v g
k h v
l m t a
33661
gtcgccgccg tcgtccagga tcatattcgg gccgccgttg ggggtgttcg gccaggtcag
cagcggcggc agcaggtcct agtataagcc cggcggcaac ccccacaagc cggtccagtc
<.............................msnM1.............................<
d g g
d d l
i m n p
g g n
p t n
p w t l
33721
cgcctgctcc gtgcaccacc agtactcctc cagggtctcg cccttccagg cgaagaccgg
gcggacgagg cacgtggtgg tcatgaggag gtcccagagc gggaaggtcc gcttctggcc
<.............................msnM1.............................<
a q e
t c w
w y e e
l t e
g k w
a f v p
33781
gacgccctgc gggttctcgg gcgtaccgtt cggaccgacc gcgatcgcgg cggcggcgtg
ctgcgggacg cccaagagcc cgcatggcaa gcctggctgg cgctagcgcc gccgccgcac
<.............................msnM1.............................<
v g q
p n e
p t g n
p g v
a i a
a a a h
33841
gtcctgggtg gagaagatgt tgcaggacac ccagcggacc tcggcgccca gggcgaccag
caggacccac ctcttctaca acgtcctgtg ggtcgcctgg agccgcgggt cccgctggtc
<.............................msnM1.............................<
d q t
s f i
n c s v
w r v
e a g
l a v l
33901
ggtctcgatc aggacggcgg tctgcacggt catgtgcagc gagcccatga tccgggcgcc
ccagagctag tcctgccgcc agacgtgcca gtacacgtcg ctcgggtact aggcccgcgg
<.............................msnM1.............................<
t e i
l v a
t q v t
m h l
s g m
i r a g
33961
gaccagcggc tgagtggcgg cgaactcctt gcggatcgcc atcaggccgg gcatctcgtg
ctggtcgccg actcaccgcc gcttgaggaa cgcctagcgg tagtccggcc cgtagagcac
<.............................msnM1.............................<
v l p
q t a
a f e k
r i a
m l g
p m e h
34021
ctcggcgaga gtgatctcct tgcggccgaa cgcggccagg gagagatcgg cgaccttgaa
gagccgctct cactagagga acgccggctt gcgccggtcc ctctctagcc gctggaactt
<.............................msnM1.............................<
e a l
t i e
k r g f
a a l
s l d
a v k f
34081
gtccgtgaag tcagctgact gctgagagga catgcgtgct cctgagtcgg ttgtaaatgt
caggcacttc agtcgactga cgactctcct gtacgcacga ggactcagcc aacatttaca
<..............msnM1..............<<
d t f
d a s
q q s s
m
<<......................msnM2........................<
- s v
a s l
v h t s
r l r
n y i
34141
tcttgtgaat ctcaagggcg gcggtggacc ggttgagggt gatgtagtgc agacccggcg
agaacactta gagttcccgc cgccacctgg ccaactccca ctacatcacg tctgggccgc
<.............................msnM2.............................<
n k h i
e l a
a t s
r n l t
i y h
l g p
34201
caccctccgc tagcagccgg tccgccatgg tggtcgcgta ctccacgccg atgcggtggc
gtgggaggcg atcgtcggcc aggcggtacc accagcgcat gaggtgcggc tacgccaccg
<.............................msnM2.............................<
a g e a
l l r
d a m
t t a y
e v g
i r h
432
Anhang
34261
cgtccgccgg atcggcccgt gccgcctcca gacggagggc gaggcctacg gggaacgccg
gcaggcggcc tagccgggca cggcggaggt ctgcctcccg ctccggatgc cccttgcggc
<.............................msnM2.............................<
g d a p
d a r
a a e
l r l a
l g v
p f a
34321
cgtgggacag ttcggcgaat cgggtgatct gccgtacgtc ggtggcgggc atgattcccg
gcaccctgtc aagccgctta gcccactaga cggcatgcag ccaccgcccg tactaagggc
<.............................msnM2.............................<
a h s l
e a f
r t i
q r v d
t a p
m i g
34381
gaatgaccgg agtgggacac ccggccgccg ctacgcggtc acgtagccgc aaatagtcct
cttactggcc tcaccctgtg ggccggcggc gatgcgccag tgcatcggcg tttatcagga
<.............................msnM2.............................<
p i v p
t p c
g a a
a v r d
r l r
l y d
34441
ccacatggaa gaacatctgg gtgacggcgt aatcggcgcc tgcccggcac ttggccacga
ggtgtacctt cttgtagacc cactgccgca ttagccgcgg acgggccgtg aaccggtgct
<.............................msnM2.............................<
e v h f
f m q
t v a
y d a g
a r c
k a v
34501
aatgccgaat gtcgctctcc cagtcgggtg agcgtggatg cttctccggg aacgccgcca
ttacggctta cagcgagagg gtcagcccac tcgcacctac gaagaggccc ttgcggcggt
<.............................msnM2.............................<
f h r i
d s e
w d p
s r p h
k e p
f a a
34561
cacccacact gaaagcaccc gaccgccgta ccaggcggac gagttcccag gcgtacgcaa
gtgggtgtga ctttcgtggg ctggcggcat ggtccgcctg ctcaagggtc cgcatgcgtt
<.............................msnM2.............................<
v g v s
f a g
s r r
v l r v
l e w
a y a
34621
agcccttcgg atgcggcagc cattccctgt tggggtcacc gggcggatca ccccgcagag
tcgggaagcc tacgccgtcg gtaagggaca accccagtgg cccgcctagt ggggcgtctc
<.............................msnM2.............................<
f g k p
h p l
w e r
n p d g
p p d
g r l
34681
ccagtacgtc ccgtaccccg gcgtccgcgt attggccgat gacctggcgc agttcctcga
ggtcatgcag ggcatggggc cgcaggcgca taaccggcta ctggaccgcg tcaaggagct
<.............................msnM2.............................<
a l v d
r v g
a d a
y q g i
v q r
l e e
34741
cggagtgtcc gaccgcggtc aggtgtacga caggccgcag agtcgtctcc gcggcgatgc
gcctcacagg ctggcgccag tccacatgct gtccggcgtc tcagcagagg cgccgctacg
<.............................msnM2.............................<
v s h g
v a t
l h v
v p r l
t t e
a a i
34801
gcctggagac ctccagcgtg cgatcgcggg tggaaccccc cgcgccatag gtgacagaga
cggacctctg gaggtcgcac gctagcgccc accttggggg gcgcggtatc cactgtctct
<.............................msnM2.............................<
r r s v
e l t
r d r
t s g g
a g y
t v s
34861
cgaaagccgg agccaagggc tcgatacggc ggatcgtctt ccacagggtt cgagtccctg
gctttcggcc tcggttcccg agctatgccg cctagcagaa ggtgtcccaa gctcagggac
<.............................msnM2.............................<
v f a p
a l p
e i r
r i t k
w l t
r t g
34921
cctcggtttt gggagggaag aattcgaagg aaatggagtg attgccgctc gcaaggattt
ggagccaaaa ccctcccttc ttaagcttcc tttacctcac taacggcgag cgttcctaaa
<.............................msnM2.............................<
a e t k
p p f
f e f
s i s h
n g s
a l i
Anhang
433
34981
cgtgcagggc gctcatgcac gtgctcccgt attgaagtac ttggcttcgg ggtgatggat
gcacgtcccg cgagtacgtg cacgagggca taacttcatg aaccgaagcc ccactaccta
<.....msnM2....<<
e h l a
s m
<<.....................msnM3.......................<
- a
r a g t
n f y
k a e
p h h i
35041
cacgatcgcg tcggtggact gctcggggtg gagctggaac tcctccgaga gctgtacgcc
gtgctagcgc agccacctga cgagccccac ctcgaccttg aggaggctct cgacatgcgg
<.............................msnM3.............................<
v i a
d t s
q e p h
l q f
e e s
l q v g
35101
gatccgctcg ggctccagca gttccgcgat cttggcgcgg tcctccaggt cgggacaggc
ctaggcgagc ccgaggtcgt caaggcgcta gaaccgcgcc aggaggtcca gccctgtccg
<.............................msnM3.............................<
i r e
p e l
l e a i
k a r
d e l
d p c a
35161
gccgtagccg agggagaatc gggcaccccg gtacttgagg tcgaacatgt cttcgatcac
cggcatcggc tccctcttag cccgtggggc catgaactcc agcttgtaca gaagctagtg
<.............................msnM3.............................<
g y g
l s f
r a g r
y k l
d f m
d e i v
35221
ggtcgggtcc tcccctgcga atcccagctc cgagcggacg cgggcgtgcc agtactcggc
ccagcccagg aggggacgct tagggtcgag gctcgcctgc gcccgcacgg tcatgagccg
<.............................msnM3.............................<
t p d
e g a
f g l e
s r v
r a h
w y e a
35281
gagggcctcg gccagctgca cggacaggcc gtggagttcg aggtagtcgc ggtaggagtt
ctcccggagc cggtcgacgt gcctgtccgg cacctcaagc tccatcagcg ccatcctcaa
<.............................msnM3.............................<
l a e
a l q
v s l g
h l e
l y d
r y s n
35341
ggactcgaag agcttggcgg tctcctcgcc gatgcgggag ccgacggtga cgacctgaag
cctgagcttc tcgaaccgcc agaggagcgg ctacgccctc ggctgccact gctggacttc
<.............................msnM3.............................<
s e f
l k a
t e e g
i r s
g v t
v v q l
35401
gccgaccacg tcggtctcgc cggactcctc cgggcggaag aagtcggcca ggcacagccg
cggctggtgc agccagagcg gcctgaggag gcccgccttc ttcagccggt ccgtgtcggc
<.............................msnM3.............................<
g v v
d t e
g s e e
p r f
f d a
l c l r
35461
gcggccccgt cgctgccgcg ggaaggagaa ccgggtcctt tcgttgccgt cgtcgtccag
cgccggggca gcgacggcgc ccttcctctt ggcccaggaa agcaacggca gcagcaggtc
<.............................msnM3.............................<
r g r
r q r
p f s f
r t r
e n g
d d d l
35521
gatgatcagg tcgtcgtcct tggagacgca ggggaagtag ccgtagacga cggccgcttc
ctactagtcc agcagcagga acctctgcgt ccccttcatc ggcatctgct gccggcgaag
<.............................msnM3.............................<
i i l
d d d
k s v c
p f y
g y v
v a a e
35581
gaggaggttg tcggtctgca gcttgtccag caggccgcgc agccggggcc ggccctcggt
ctcctccaac agccagacgt cgaacaggtc gtccggcgcg tcggccccgg ccgggagcca
<.............................msnM3.............................<
l l n
d t q
l k d l
l g r
l r p
r g e t
35641
ctcgacgagt tcctcgtagg tcggcccgtc gccggtgcgg gcctgcttca gcccccactg
gagctgctca aggagcatcc agccgggcag cggccacgcc cggacgaagt cgggggtgac
<.............................msnM3.............................<
e v l
e e y
t p g d
g t r
a q k
l g w q
434
Anhang
35701
ccccttgaag agggcgccct cgtccagcca ggtcgcgtac tccttgagct ggatgccctt
ggggaacttc tcccgcggga gcaggtcggt ccagcgcatg aggaactcga cctacgggaa
<.............................msnM3.............................<
g k f
l a g
e d l w
t a y
e k l
q i g k
35761
gatgacgcgg gtgccccgga acgggggcgt ggggacgggg ttgtcggtgg cgacgtcgga
ctactgcgcc cacggggcct tgcccccgca cccctgcccc aacagccacc gctgcagcct
<.............................msnM3.............................<
i v r
t g r
f p p t
p v p
n d t
a v d s
35821
gcggacgtgg ccctcctcgg ggcgctcctc gaccgccgtg gcggtggccg tcgcccgtac
cgcctgcacc gggaggagcc ccgcgaggag ctggcggcac cgccaccggc agcgggcatg
<.............................msnM3.............................<
r v h
g e e
p r e e
v a t
a t a
t a r v
35881
gcggcgctgc ctcagctcgg gcagggtcgc ccccggcacg ccgcgcttga cgccgatgag
cgccgcgacg gagtcgagcc cgtcccagcg ggggccgtgc ggcgcgaact gcggctactc
<.............................msnM3.............................<
r r q
r l e
p l t a
g p v
g r k
v g i l
35941
ggcgtccatc aggcgcaggc cctcgaaggc gtcgcgggcg tagcggacct cgccgccgta
ccgcaggtag tccgcgtccg ggagcttccg cagcgcccgc atcgcctgga gcggcggcat
<.............................msnM3.............................<
a d m
l r l
g e f a
d r a
y r v
e g g y
36001
gatctcgtac aggtcctgct cgacgtaggc gcgggtgagg gcggcgccgc cgaggatgac
ctagagcatg tccaggacga gctgcatccg cgcccactcc cgccgcggcg gctcctactg
<.............................msnM3.............................<
i e y
l d q
e v y a
r t l
a a g
g l i v
36061
cgggtagtcg gcggccaggc cgcgctggtt cagctcctcc aggttctcct tcatgatcac
gcccatcagc cgccggtccg gcgcgaccaa gtcgaggagg tccaagagga agtactagtg
<.............................msnM3.............................<
p y d
a a l
g r q n
l e e
l n e
k m i v
36121
tgtggacttg accaggaggc cggacatgcc gatgacgtcg gcccggtgct ccttggccgc
acacctgaac tggtcctccg gcctgtacgg ctactgcagc cgggccacga ggaaccggcg
<.............................msnM3.............................<
t s k
v l l
g s m g
i v d
a r h
e k a a
36181
gtcgaggatc gcggagaccg gctgtttgat gccgaggttg acgacgttgt agccgttgtt
cagctcctag cgcctctggc cgacaaacta cggctccaac tgctgcaaca tcggcaacaa
<.............................msnM3.............................<
d l i
a s v
p q k i
g l n
v v n
y g n n
36241
ggacaggatg atgtcgacga ggttcttgcc gatgtcgtgg acgtcgccgc gcacggtcgc
cctgtcctac tacagctgct ccaagaacgg ctacagcacc tgcagcggcg cgtgccagcg
<.............................msnM3.............................<
s l i
i d v
l n k g
i d h
v d g
r v t a
36301
caggacgatg gtgcccttgc cctcggcgtc ggacttctcc atgtgcggtt cgaggtgggc
gtcctgctac cacgggaacg ggagccgcag cctgaagagg tacacgccaa gctccacccg
<.............................msnM3.............................<
l v i
t g k
g e a d
s k e
m h p
e l h a
36361
gacggcggtc ttcatgacct cggcggactg gagcacgaac ggcagctgca tctgtccgga
ctgccgccag aagtactgga gccgcctgac ctcgtgcttg ccgtcgacgt agacaggcct
<.............................msnM3.............................<
v a t
k m v
e a s q
l v f
p l q
m q g s
Anhang
435
36421
gccgaacagc tcgccgacga ccttcatgcc gtccaggagg gtgtcgttga cgatgtcgag
cggcttgtcg agcggctgct ggaagtacgg caggtcctcc cacagcaact gctacagctc
<.............................msnM3.............................<
g f l
e g v
v k m g
d l l
t d n
v i d l
36481
ggcgggacgg gtccgcaggg cctcgtcgag gtccgcttcg aggccgttct tctcgccgtc
ccgccctgcc caggcgtccc ggagcagctc caggcgaagc tccggcaaga agagcggcag
<.............................msnM3.............................<
a p r
t r l
a e d l
d a e
l g n
k e g d
36541
gatgatgcgg cgcttgaggc gttcctccag cgggagggcg gccagttcct cggccttgcc
ctactacgcc gcgaactccg caaggaggtc gccctcccgc cggtcaagga gccggaacgg
<.............................msnM3.............................<
i i r
r k l
r e e l
p l a
a l e
e a k g
36601
ggccttcagg gacttggcgg tggcgccctc gaagagcgcc atgagcttct ggagggggtc
ccggaagtcc ctgaaccgcc accgcgggag cttctcgcgg tactcgaaga cctcccccag
<.............................msnM3.............................<
a k l
s k a
t a g e
f l a
m l k
q l p d
36661
gtagccctcg gcgcggcggt cgtggatgag gtcgagagcg gtctgcacct cctcctcgct
catcgggagc cgcgccgcca gcacctactc cagctctcgc cagacgtgga ggaggagcga
<.............................msnM3.............................<
y g e
a r r
d h i l
d l a
t q v
e e e s
36721
gaagcgggcg atcggcagga tcttcgaggc gtgcacgatc gccgagtcca ggcccgcctt
cttcgcccgc tagccgtcct agaagctccg cacgtgctag cggctcaggt ccgggcggaa
<.............................msnM3.............................<
f r a
i p l
i k s a
h v i
a s d
l g a k
36781
cacgcactcg tcgaggaaga cggagttgag gaggatgcgg gcggccggat tgaggccgaa
gtgcgtgagc agctccttct gcctcaactc ctcctacgcc cgccggccta actccggctt
<.............................msnM3.............................<
v c e
d l f
v s n l
l i r
a a p
n l g f
36841
ggagatgttc gacagaccca gcgtcgtctg cacctcgggg tggcggcgct tgagttcgcg
cctctacaag ctgtctgggt cgcagcagac gtggagcccc accgccgcga actcaagcgc
<.............................msnM3.............................<
s i n
s l g
l t t q
v e p
h r r
k l e r
36901
gatcgcctcg atggtggcga tgccgtcctt gcgggactcc tcctggccgg tgcagatggt
ctagcggagc taccaccgct acggcaggaa cgccctgagg aggaccggcc acgtctacca
<.............................msnM3.............................<
i a e
i t a
i g d k
r s e
e q g
t c i t
36961
gaaggtcagg gtgtcgatga ggatgtccga ctcgtggatg ccccagttgc cggtgaggtc
cttccagtcc cacagctact cctacaggct gagcacctac ggggtcaacg gccactccag
<.............................msnM3.............................<
f t l
t d i
l i d s
e h i
g w n
g t l d
37021
gtcgatgagg cgttcggcga tcgcgacctt cgtctccggc gtgcgggcct gcccctcctc
cagctactcc gcaagccgct agcgctggaa gcagaggccg cacgcccgga cggggaggag
<.............................msnM3.............................<
d i l
r e a
i a v k
t e p
t r a
q g e e
37081
gtcgatggtc agcgcgatca gcgcggcgcc gtgctcctgg gcgagcgcgg tgaccttggc
cagctaccag tcgcgctagt cgcgccgcgg cacgaggacc cgctcgcgcc actggaaccg
<.............................msnM3.............................<
d i t
l a i
l a a g
h e q
a l a
t v k a
436
Anhang
37141
gaagcgggac tcggggccgt cgccgtcctc gtagttgacg gagttgatga ccgcacggcc
cttcgccctg agccccggca gcggcaggag catcaactgc ctcaactact ggcgtgccgg
<.............................msnM3.............................<
f r s
e p g
d g d e
y n v
s n i
v a r g
37201
gccgagcttc tccagcccgg cccggatgac gggcacttcg gtggagtcca gcacgatcgg
cggctcgaag aggtcgggcc gggcctactg cccgtgaagc cacctcaggt cgtgctagcc
<.............................msnM3.............................<
g l k
e l g
a r i v
p v e
t s d
l v i p
37261
gagggtggag gcggtggcga agcgaccggc gagttcggcc atgtcggcga cgccgtcgcg
ctcccacctc cgccaccgct tcgctggccg ctcaagccgg tacagccgct gcggcagcgc
<.............................msnM3.............................<
l t s
a t a
f r g a
l e a
m d a
v g d r
37321
gcccacgtag tcgacacaca ggtcgagcat gtgggcgccc tcgcggatct ggtcgcgggc
cgggtgcatc agctgtgtgt ccagctcgta cacccgcggg agcgcctaga ccagcgcccg
<.............................msnM3.............................<
g v y
d v c
l d l m
h a g
e r i
q d r a
37381
catctccaca cagtcgtccc agcgggcctc cagcatggcc tcacggaact tcttcgaccc
gtagaggtgt gtcagcaggg tcgcccggag gtcgtaccgg agtgccttga agaagctggg
<.............................msnM3.............................<
m e v
c d d
w r a e
l m a
e r f
k k s g
37441
gttggcgttc gtccgctcgc cgatcgccat gtacgcggtg tcctggcgga acgggacggt
caaccgcaag caggcgagcg gctagcggta catgcgccac aggaccgcct tgccctgcca
<.............................msnM3.............................<
n a n
t r e
g i a m
y a t
d q r
f p v t
37501
ctggtagagc gaggcggcgc ccggctcggg gcgcgggtcg cgtgcgccgg gcgtgaggtc
gaccatctcg ctccgccgcg ggccgagccc cgcgcccagc gcacgcggcc cgcactccag
<.............................msnM3.............................<
q y l
s a a
g p e p
r p d
r a g
p t l d
37561
ccgcacgcgc tcgacgacct gccgcagatg ctcgggcgtc gtaccgcagc agccgccgac
ggcgtgcgcg agctgctgga cggcgtctac gagcccgcag catggcgtcg tcggcggctg
<.............................msnM3.............................<
r v r
e v v
q r l h
e p t
t g c
c g g v
37621
gagggagagg ccgtagtcgc ggacgaagtt ctcctgggcg tcggcgagct cgggggccgt
ctccctctcc ggcatcagcg cctgcttcaa gaggacccgc agccgctcga gcccccggca
<.............................msnM3.............................<
l s l
g y d
r v f n
e q a
d a l
e p a t
37
Herunterladen