Why clone `full length` cDNAs? - Heidelberger Life

Werbung
Funktionelle Genomik
Stefan Wiemann
Molekulare Genomanalyse
DKFZ Heidelberg
Arbeitsprogramm des Genomprojektes
• Sequenzierung der kompletten genomischen DNA
• Gen-Identifizierung
• Funktionsanalyse und Erforschung von
Krankheitsassoziationen
Das humane Genom
23 Chromosomenpaare
3,2 x109 Basenpaare (3,200,000,000)
< 5% mRNA („Gene“)
< 3% in Protein übersetzt
> 90% unbekannte Funktion
Gen
...
regulatorischer
Exon 1
Abschnitt
Exon 2
... ...
reg. Abs.
...
Protein-kodierende Region
Exon n
reg. Abs.
...
Das Rennen um die Genomsequenzierung...
fertig ! ☺
Source: Jane Rogers, Sanger Centre
Fachübergreifende Presse...
International Consortium Completes Human Genome Project
All Goals Achieved; New Vision for Genome Research Unveiled
fertig !!
fertig !!!!!!
Arbeitsprogramm des Genomprojektes
• Sequenzierung der kompletten genomischen DNA
• Gen-Identifizierung
• Funktionsanalyse und Erforschung von
Krankheitsassoziationen
aaatcatagataggagcccagtcctagacctgggttgatatggcaacagaacagagaaggaactttcagaacaatttgttaactgaacgaattaagtcactgaagagcttagagtcagaaaacataagcaacccagggactcttagaactctggctgggacactggactttctgcaggatgtggaatggaagttcaaccctgtattatctggatattcaagggcagaatgactccagatgatgtcacaagctattaaatgtgttagatgggatcaggtggcttttaaatactataca
cccagcattttgctagtcaggatacagaactaagtatagcaatggcttgtaggatcttggaatatcttgaactatggaatcatctttccaaagtgtgaatatgaccatgtcactccctatctaagatgacttcttgatgcctacagaatgaaggccaaggtccctagattcaggctcaagatcaccatggcctgaccctggagcctgctgctcagccccgctatgccctgcagttccccagcccaactcagtaatgcccaactctttgcaaccactcccctctccccttctccttta
ctgctgtttcctgtacaaggctgtgcctttgctcctcctcttccctctgcctgaagtgcccttctggcctttacttacccggctcttattcttccaggtctgggctcagatgtctcttcttccaggaagccattcctgttgtcccagtttgggtcatgagtctcttgtatatccagcatataattctacaataacatgtataacatcaggttgagattatgtatatgtatataacttcttgactgaatgaaacacaagcttcttttatataagaatttagtctttgcaatctttgtg
ccttgagtacgtagcacaaagttgaatgctttttaagtgctcaaatactggattgtaaaactaaattgatcccatgattgcaaaccatagattattttgtaaataagcatcccagtatttaggcctccaagtaaccactgtctcttgaaagaagttttcgtaagaggttgtttgcctatcccggtgatttcctactcagcacacaagttacaggtcctattgtggatttatattcagggagcacaaagctgatttttgcatacatattgttataaaaaaaaaaaacccttacatctt
tgaaggtagacttaagattttgaaacagcaaaatcgttgcactttccatcagggaacatagtaattgtcatgctggttaatgcccttttgagaccctccatagctgtcctaatgaggaagtcctacagatcgtatgtagagctaataacattgatatggtttggctgtttctctacccaaatctcatcttgtagctcccataattcccatgtgttgtgggagggaccaggtggaagataattgaatcacgagggtgggtctttcccatgctgttctcccgattgtgaataagtctca
cgagatctgatagttttaaaaacaggagtttccatgcacaatctctttttgcttgccaccatctgtgtaagatgtgacttgctccttcttgcctcccggcataattgtgaggcctccccagccatgtggagctgtaagtcaattaaacctctttttcttcccagtcttgagtatgtatttatcagcagcatgaaaacagactaatagagcaaattggtaccagtagagtgaggtgctgctgaaaaaataccagaaaatgtggaagtgaatttggagctgggtagcaggcagagtttg
gaaccatttggagggctcagaagaagataggaaaatgtgggagagtttggaacttcctagagacttgttgaatggctttgaccaaaatgttgatagtgatacggacagtgaaatccaggttgaggtggtctcagacagagatgaggaacttcttgggaactagagtaaaggtgactcttgccatatttcagcaaatacactggtggcattttgccctgcccaagagatttgtggaactttgaacttgtttcttgaggaatcattactctgatagacacaaaaacaattcctcctatc
ccccaccaaagcagcccacaaagatatctccatctcctgagctttcagagagtgtgctgtctggcaagagagatgatttagagtatctggtagaaaaaatttctaagcagcaaagcgttcaaagaggtgacttgggtgctgttaaaggcattcagatttaaaggggaaacaaagcataaaagttccaaaaatttgctgcctgacaatgcaacagaaaggaaaattccattttctgaggagaaattcaagctgcctgcagaaatctgcctaagtaacaaggagccaaatgttagtcat
caatccaatggggtaaatgtttccagggcatgtcagagacctttgcagcagccgcccccaccccgcccccggccgctgccatcacaggcccagaggcttagagggagaaaatgattttgtggcccaggcccagggtccctctgctgtatgcagtctaggaacttggtcccctgcaacccagctgctccaactatgactaaaaggagtcaaggtacaccttgggcttttgcttcagaggatggaagccccaagccttggcagcttctacatggtgttgagcctgcacatgcatagaag
tcaataactggggtttggaaacctctgcctaaattttgagcatgtatgcaaatgcctggatgtccaggcagaagtttgctgcaagggtggggagctcatggagaacctctgctagggaagtgcggaagggaaatgtagggtcagagcccccacacagagtccctactggggcatcacctactggagctgtgagaagagggccaccatcctccagacgctagaatggtagatcttccaacaacttgcactgtgtgcctggaaaagccacagacatgcaacaccagcccacgaaagcag
tcaggaatggagctataccctgcaaagccacaggggcagagctgctcaaggctgtgggagcctgcctcttgcatcagcgtgacctagatgtgaaacaccgagttaaaggagatcattttggagctttaagatttgactgcccactggattttggatttgcatggagcctgtagcccctttgttttggtcaatttctcccatttgggatggctgtatttacctaatgcctgtacccccattgtatgtaggaagtaactaacttgcttttattttacagagtcataggcagaagggact
tgctttgtctcagatgagactttggactatggacttttgagttaatgatgaaatgacttaagactttgggggacttttgggaaggcatgattggttttgaaatgtgaagacatgaaatttgggaggggccaggggtggaatgatatggtttggctctgtgtcaccacccaaatctcatcttgtagctcccataattcccacatgttgtggaagggacctggtgggagataatttaatcatggggataggtctttctcatgctgttctcatgatagtgaataagtctcacaagatctg
atggtttcaaaaatgggagcacatgctctctttttgcctactgccatccatgtaagacaagacttgcttctccttaccttctgatatgattgtgaggcctccccagccacgtggaactgtaagtccattaaacctccttttcttcccagtctcgggtatgccttcatcagcagtgtgaaaatggactaatacaagcaacatcttcgaaaaaacacataaccagggaaaggaattacattgaaatggtaacagtcatctaggttactatacactggtggggttatttttaaagttatc
ctatagcttgataatcacacctgttacttagtttttgtgtgtttagaattgatgtgccaactaagtaccttaattaagcattgcttgatcccacagtcctcatgggttcttaccctagttatcagagagtttaaagtcaacatttaagcctatgatttattaagcatctactacaggcacaaaagggttctgtgtactctgaaacagattattgagatgaagtccctcttatgtataacagtttaatggcaaagcaaagctcagtgggtcccaaataaacatgccagacagatagca
cactctctgaaagctcaggagatagagatatctttgtgggctgctttggtggaggacaggaggaattattttttgtgtctatcagagtaattgtttttcaagaaacaaaccccactttaaaagcccaatgaaaccaaaagatcctcccagaaaacatttaaactcataaaattttacatttaatttcaggaattcctgtatctcctggtgtctatgtatatggggattctaaaaaggtctatatcagaagttagaaacctctgttttatatacatttaaataaattcacattatcta
tgcctgttctctttttttttctaaaatcccacacgtaagttctctgagataccatcaaaacagagtattaatgggtggaaaaaatatcttatttaaaagtaaaacatagacatttctttatggaattgtaacatttggaaacttatcgacaaaatattcaactccaggagtgtaatattggcttacgctatgaatataccaagtgtgtatattttgaatcttgcaaactaggaatcacttcatcaccatctccgtattgtccctctggagaggcagtatgccatatgtagaagcatg
aaagccagagttaagagatttgagttctgatcttagttttgccacttacttattatagtcgtggtcaattatcttccatctccatgcctccatttctgcatccgtacaatgagtgaatgataaaatttgacttagttgcttcacacagttgttatggggaccagacgggatgacagatgtatacgatccaaatgtgagcttttttgttttgttttgtttttaaggcacttgaataaaagacatttgccatgggtgcattttgcaggttcaatttccagaaagaaattttattgaggt
ttgacatcacagactttacaatgaaaatcactgtgcagaatgttctgtgtttaaaataccaccacccctggtgacaatgccaagtcattcaaactaatgccaagtgaaagccattccctaacagtgttttttcccaacaacactttattatattagaaatgtgcttaggcattgtttgggttgcagttcagaaggaaatgctgaaagatgctttcataaaacttatatttggggaaatattttcataagtgaaaagggcttataaaatatgatggtttcatattattatttttagtt
taacttactaaacttttaagttggcactggcctggcctatcctaccctgagagccaatgcaataaagtgaaactcattgagattggccattgcaatctgataaatcgaatttcaatattgtttaataaaaataataaacagtgtggaatgaaatatgttggatatcatgcccagaacaggagaccatgtttattcaaaaggacaaatctctggtatcgaaggaaggtggcaatattacagagttgtattatgaataggtccttcagatttgttttggtttttttttgagatggagtc
ttgctctgtcgcccaggctggagtcagtggcacgatctcagctcactgcaacctccgtctcctgggttcaagcaattctcctgcctcagcctcctgagtagctgggactacaggtgcatgccaccacatctggctaatttttttgtatttttattagagatggggtttcaccatactggtcaggctggtcttgaactcctggcctagtgatccacctgcctcagcctcccaaagtgctgggattacagtcgtgagccaccacgcctggccccagttttctttcatgactctttaaac
ctagaaagaaaagaaaatctaaaatcgtctttaaaaaattctagtcacttaaaaatgctgcagtctaactctggtcttggcacttcataaagtaagtgtcaagccaggttggatttatttagctgaattagaaacctgagggagcagaattaatttttcagtgacaatggttgcagcccactcattgcctccccatatagaaaaatctttcagactattcacagttttcatcaaatggggtcactttcccttctatgtaggaaattccttccagcctgtgaaagattaaacaaaagc
tttttctgcaggaactttggaaattagaatataatgttttcctgggtgtttatattgccctcgctgccaacatatttcctgcccatggctgccaggttcatctctccaaaacccactttgcaaacatcatctttttaccatagaaactatctcaggtttctgagcaaagtcgaagctcttgagcctggcattcaaggccttccaaatggctttgctggtaaattcgaccaaatatttaagaaagaaataataccactatgacctaatctctccagaaaattgaagagaatagaatct
ttcccaactcattttaagagatcaacgttatgctgataccaaaaccagatgaagacattacaagaaaatagatcaatattcctcatgagcacagacgaaaaaattcttaacaaaatattatattagcaaatgaaatccagcaacacagaaaatggataatacaacatgaccatatggggtttatcttaaggatgcagggctagtgtaacaactgaaacccaattaatgtaatttgtgatattaatagattacaaaagaaaccaagtgatcatctcagtaggtacagaaatagcattt
gacaaaatacagcatctattcctaataaaaaaatctcagcaaactagaaatcgaagggtacctcctcaacctcacaaaaagcgtttacaaaatgtttatagctaacatcacacttaatagcagaagactgactgactgctctcaccctaagatcaggaataaggcaaaggtcttttctttcaccacttcaattcactattgtattagggattctagtcaattcaataatacaagaaaaaagaaataaaatgcatccagattgaaaggaagaagtaaactttctttattcacaaatga
cattatcaactgtcccgataatgttacaaaatctataaaaaaaggtcctaaacttaatatgtgtttagcagttgcaggatataaatgcagtgcacaaatatcaattgtctttctataaactaacaacaatcagaacatgaaacttaacaatacatttgacatcatcaaaatataaaaactttaggtataaagctgacaaaagacctgaagacctgaacttaagaatgtagcctattttgataaatgctacatatgaattgtaagagaatatgaactctgctgttgttgggtggagtg
ttctgcaaatgtcaattaggtcaaattagttgatagtgctgttcaaattgtatatattctcacagattttctgttttttcagttattgagaaaggtattgaaatctctaactataaatatgcatgtctattgattcttgcagttccatcagtttttgtccacatatttaacactctactcagaaaagtcctgttctgtttggagacttctcaaagaatttaaaatagaattaccgtttgacccagcaattccatttacccacagaaatataagtcgttctaccctgaagacacatgc
acacctatgttcactgcagcactattcacaatagcaaagacgtggaatcaacccaggtggccaccaaaagtggactggataaagaaaatgcagtatgtatacactaaagaatactacgcaactataaaaaaaattgagatcatagtctttgcagcaacgtggatggagccggaggccacaatcctaagcaaattaacgcaggaacagaaaaccaaatgccgcatattctcacttatatgtgggagttaaacattgagtacacatgaacacaaagaagggaacaatagacgtcggggc
ctaactgagggtgaaggatgggagaagggtgaggactgaaaaacaacctatcggatattattctgcttacctgagtgtcaaaattatctgtataccaaatccctgcaacacacaatttccccgtgtaacaaacctgcacaggtaccccttgaacgtaaaataaaagttggaaagaaaaaaaaaaaagaaaaatcctggtccgtgcctgacaataatagcttgtgtgaaagcgcatgcgcacactcacacacacgcatgtgagggcacctatcaatcgttgtcacttataaatgcaaa
tgaaaatattccaaataaaatgctagcaaattaaattcaaagataccataaagggcataatccaccataaccaagtcataattattgtgctatgctagaaaaatttaatattaagaaatctaatatggcacatcaatggatcaaataagacaaaccttataatataaaacgtccaaaaggcattctgtaaaatggaataagcaattttaaataaaagctctctgaaaaccaggattacaaagacacttctttaaaatgataaaaatatacagcacttttaaatcaatagccactttc
atacttaatgataaaatacaccagaagcatttcttctgagagcctcaataaaacaaaaacgctgggtttggctgggcatggtggctcatgtctgtaatcccagcactttgggaggctgaggccagtagatcacaaggtcgggagatcgagaccatcctggcaaaccagtgaaatcccgtctctactaaaaatacaaaaaattagctgggtgtggtggtgggcacctgtagtcccagctacttgggaggctgaggcaggagaatcgcttgaacccgggaggcagaggttgcagtgagc
tgagatcacaccactgcactccagcctgggtaacagagcaagactctgtctcaaaaagaaaaaaaaaaatggtttttttcccaaagatatttgcaacttgctcgcttccattcttcatgttacatgtccccactggccccagggctcttgaatttcctcagttcatgccagaggcagttgttgcaggttactcaatagggcttggtgtcatagggtttatacctcagggtcatagggcttatacttcacatctaatttggccaaataattatggcaaaagcttctgtgagccacata
gattaaatgatgtagaaaataaaaagtcaaaattattgggaaaataatttccttatagctgcatcaaatgggacaaacttttcttataactgtttggtcttattttcagagttctatttcctggcctgtcttattaacacatcctttgtcgtacaactgaaatatctatagcaataggaattatacagtgagaatattttttgttttaataaaatactattatattatgcatattttatagcctgcattttttcacttagccatacattgtgaccatttttctacataatgtatgtt
tggctaaattattattgtataggttacataatatgtcatgatatagccctcccaccatctacttaaccttgtccctatttataagcatttgattttgcctcagatttttctaaagttgggtttttaaagcatattcccacctcctccacccacacagcaaatagaaaactcattagattttcctcataacccagattactctctctcttatcttaataaccaagtttacactctgcaagaaataaaccagaactttggatgaaaacagggtggagcacgctgggagtaaacattgtc
tattttcagagccccagtcttcttaactcccagaatatttcagccagatttatacgtgcttctatgcacacacacgacagggaactaagggttttgatatgaccaaggaaaaggatctgtaggtgccgacggtcagaattccctctaaaaatggcaaggtactgaacaaaaccatgtatagagaaaatcaccagtcagcaagccctactcgtgcacatggttttaatcaacattttagttcctcactcttaagtacaaacagccaaaagatcacccaaatttttaaaaagccttcca
acatgcaagacagactaaattgaacaagaaaaaatagcttcagaagaattcatgtcaatgaagaaaacagaagaaaatgtttaaaaaaatctctataattcatagctttgaaacataaaatactgcgtatataagaatcggattttataaaaaagtaatattccaaaaataaggaaaatttttgaaagttaaaaatagtataaccaaaaataaaccagtcagcaaaataattctaaaataaaatggataaaaaaaattccaaaaagtagaacagaagtcaaagaaagagaaaataag
agacaaaatacgtgataactagaggatcagtctaggaggcccaatactcgaagacaaagttccaggaagagtttggagaaaatgagataaagaatatcattgaagtaataacatgagaatttactggaagagaaaaaaaatgagttttcagactgaaaggacctctcccgccacctgactgtccagcacaataaaacacatataccccaagatacatcaccacaacatttcagacaactgagaacaaagtggagatcataaatatttccagaaataaaaaacaggccacaaatagat
cagacaaccatatgtcactagacttctcaacaacaccagacaccagaagaaaatggaatggctttaatatgctgaagaaagattagtttaacctagaattctatatccaatcaaactattaatcaaatgagagaggggtgaaataaacacattttcagccatgcatcctctcagaaagatttaccaaaccaagttaggtgattattttcaagaaaataaaaagtaattgtacaagaaaaattaaaatacacacgattcgtatttacattgttatgaaaaacaagaataagatttaca
ttgttataaaaatataaatacaactattaataatagtaatctacaactcgattactataatcaaacattgtgtaatagaaggatagagaagaagaacatggaggcagagctgtgaggagttttaagtgagtaaaattctcacgtttgatagtaacaagtcaattgataatctctaactcaataaaaaataagatttagtagtaaaattttatcatttagaaaatgaagtgaaatactagcattaagggtagtaaaagttaacagtacttgtctctgggtagctgggatcaagggtgg
gaaagaggtgagagaagggaccacaggttttcattataatcattgtagaactttttaatttttaaaacagtgcctacattttgtttcttaaataacttcaaaaagagcatgaagcaagggctttgatggcatgaacacatagggttgaggaagttcctttatgctttggtgtaaggaagataaaatgatattccaagaaacagggtgacctctgaattccacgatgcattgaggaacgtgtaggctgtgccagcaatgccagaggcacatagaaaggaatatgcactctagtttaaa
taactacacagaaagtttttaaaacattcacctggatcagaaactgctttctctgccagaactcttgcctgagtccagccagggaataccatctgtcagatatctaggcctgtggtatggctttgctgtgtccccacccaagactcatcttgaattgtagctcccataattcccacatgttgtgggagggacctggtgggaggtaattgaatcataggggcaggtctttcctgtgttgttcttctgatagtgaataaatctcacgacatctgatggttttataaaggggagttcccc
tgcacactctctctttgcctgccagcatgtgagatgtaactttactcctcattcatcttccaccatgattctgaggccttcccagccatgtggaattgtgagtccattaaacctcttttctttataaattactcaggctccagtatgtctttattagtaccatgagaacagactaatacaacctggatcagagaaccaaattttgcaaaatggaagaaaaaataattgaagagatggaagaggatgcagggaagacataggcatagggaaaagagtgggagagatcatgaattgatc
atttattgcttgcctgccatgtttcaggtcactgtacttaagcatactacctccacgataacgtatattctcacatcacaataattaggcatttctattatctccattttaccaacaagaaagctggaattctgaggagtgaacttgcctgaccaaagccacaccattaacaaacggtggggcttggatttgagccaagtctgacagatgccaaagtctcctgtgccatgacagagaaaaagaaacccaaacaaacaagtttcccgtgcttcctgggcatattaaaatgtcaggttt
gttgtgtgtttgctttttaaaattgtaggaaaatatgcttaacataaaattgaccattttaaccatttcagtgtatacaattcagcagcactaagtacattcacaatatttgcaattgtcattactatttccagaacttatttatcatcccaaacagaaactctgtacattaaacaataacaactccctattccccacttccccagcttctgctaaattctattttactttctgactcattgaatttgtctagtctacttacctaatataagtggaattgtataatatttatccttt
tgtgccctgcttttgtgtttggcttaatttgcatgtggcttgttaagtataatgttttcaagattcatccttgtaacatgcatcagaatgtcattcctttcaaaggctaaataatattccattgtatgtatgtaatacagtttttttatccatgcatctgttgatggacatttgggttatttttattttttggctatcgtgaataatgctgctatgaacattggtgtacaaataaccattcaaatacttgctttcaattctatagtatttatttttaagcctcttgttctcctttga
cattattctctaaaagttacactttttctcaaactttttcccaaacccattcttctacccccactccatgcttcaaacatcttcagcccatgaggaaaaaacagtggaaaagtctacttttccagtagctccttgtactctctggacctacttaattaatgatcaacacacttactcctttatttattcatctgacaaatattttgagcactgctgttatgcctgacactgttcctagagcatggatacttcaattaacaaaacaaagatttctgcaaagatcattaagtttacaaa
tgaagatcgttaagtttacattctacctgttgatttttctgactcaagtttatcagaacattttcaaatcacagggatgttttcacaggacagaagaaaaggagtcttagtcattcaagaatacaagtttcaagtttgagtgcactgatggaagagaaaacatgaaccttctgaaaagatttggattccttcagaaggatgtgagtgattgacccttacttccctgtcctagagaagagatgaaagcaggaaagcaacaggaggagaaagaagcaagaagatgaagcaagagtcttg
gttccagcattagcataacttgctttgataagtcccatttccaggagcaagatataaggtgcctgtatcctttcatcatgatgtttgaaagttgagatttcccagtggtttcactggatgacttagtagaatgcaggcactacatttttgctgaactcaaagtccactgaggattctaaaggaagttttgagtctctaacaagttggaaaagacttttgcaactttgctccatataaaggcacagcctcctacatttttttaagattaaaaaaaaaaaaagaagtcctgccacagca
gatacactgctgaatctgcaaacgattttataaagagccatgtctttcttggctctgaagccacttaaaaagcatcaatgccattgcaaactggagcattagattttccccaaaaggcatcgatttggggccagtaactgacatcaactcaaaagcgaatcttggatgactacagacccagctggcctgctggtaacacagtgcaggggttgcttgacatatttagggcaccagttagaatttggcgagaaccaaaccagtatactttcattttttccaggtcaaaatcaagattac
aaactgacactgaaaagtgatcttgaagaagtgtgcttccttagtctggacaggaagagtcagaatacaaagaactggttacattcagtgacacataccaacattaatccctctaccaaagcaaaccagggctgccagagtcagcacattatgttctaatacccaaacaacttgactggaaatcaacccccagcaaaacaaacggaaacaggtttaccaacatgacactacctgaatacatgtattagatttgctcttgagcccaggaagcagctggaacagggtttccttgggtcc
cttttttttttcttctgccatctaacatctctaaatgtaaattctatctaacctgatatttctgggacagtggtgttctttaggtttccaagttagcataatgtcctcaggcaaggaagtttcaataaatgataattgaaattaattttaaagcctgggttatccccaagaaaattttataatgaaaatgttcaacggacaccttccctttggagggccttaggacataagaaggaaaaacacaagctaagatatgaaggaaggaagtagaaagcttcctcaatgaggtacaaacat
ggtatactgcaaggtgatctcagttacactggaggagccaagtatgacttgctctttgggccaacctagggtgactaacccacgcacaccctctgcaaccagcacctaataaataacaagaggctcccagcctctgagccctggttatgtagaggatcctgaaccctctttccctccttgcaatccttattcctaacttcctcctctgttcttgtgtttacttgctgcctgacccatgggtatcatcctctattccaccctcactcacttttggaggagctttactccttctattgg
tccttttggtacctaagctcagactctccctgctttagaacctatagcctatttttcccaggcaagccactgacttataggtgggtgcctctcagctccatggggaaacttaggctacacatccaacgttcttcactccagattatactattataggtgacctccacaggcactgacattaggatcactgtgctaacgtaccacattaaaggaagtagagagctacatgggagaatacattctgaccttggatttagataacttgagttccacccttagctacctatcttttacagg
ctatgtgaccatattacttggtaaattcaaacttcacttcttagcacacaaggtcctttactgtggcattcctgacttttttttttttttctttttttttaaactgagtctcgctctgttgccaggctggagtgcagtggtgcaatcttggctcactgcaacctccacctcccggtttcaagtgattctcctgcctcagcctcccaagtagctgggactacaggcgcacgccaccacacccagctaatttttgtatttttagtagagacggggtttcaccatgttggccaggatggt
ctcaatcttttgacctcatgatccacccacctcagcctcccaaaatgctggcattacaggcataagccaccgtgcccagccctgacaattttttttatttcaccaccacctatcactgcctccatcacttcattcaattcagccacacagccccagtgataattgctcatgctctggtaaaccctagtagcttttgtggatgttttttcttcagccttaactgcacttcccctcacttctccttgtcctactcgtcctttgaaacacatctcagatgccatcagtagaaaaccttct
ccatcactatgccatcatcatcatcactatctctcgcctcctcctctgggtttcttttctggaatcattgatgtacacatctgctttccccaatggactgtaaactcttcagagtcaggcactgtgctgtatttttttttttcttttttttagacagagtcccattctgtcacccaggctggagtacagtggagcaatctcagctcactgcaaactccacctcctgggttcaagcagttctcatatctcagcctcctgagtagatgggattacaagcatgagccaaaacacatggct
aatttttgtattttttaatagagacgaggttttaccatgctgcccatgctggtctcaaattcctggcctcaagtgatcctcctgcctcagcctcccaaagtgctgggattacaggcttgagccactgtgtccagcccatatttgattttaacgtcctgtcctgaaatatgcctggaacagagcagtactcaataaatgtctgtagaatgagtaagtgctcacctgcatcccatgcctgctcttaatcctcacaaggtctgtattagtatctcagttggcaaatgaagaaactaaggc
ttatcttgtactggctaattatgtgatttcagtcacacaattaaagaatgacagagatgatttgtgaactcaggctggcttgaccctaaaccctgttctcttttcactacatcagccttcttctactgcatggaaccaagctcaatattgaatctgaagtatgcgattaacctcatgtggacttatccttcctatgaagacttctagaccttaacagaatagagtacgccatgtatcactacctccaaccagtagctttaccattgagataggccttctatttgtgaaaagatataa
gcccacttttgtactctggtaatataaaatttccatcccatcaaacctataagaaagagagaggaagggcaaatgagtggggaagaaaacacaacagggagaaaagaaagaaaggatttacttatttaagatcaagaaagttaagtcagtccatgactaagaatgtcatgagcacataactcaatggaaagcctccttcgctgcaactggtagaacttgtcaatcaaggttccaaagacccttcctttcaatacaatcacccagttgctctgtttttcttttctttttttgttgaga
cagagtttctctctgtcgcccaggctagagtgcggtggctccatctcggctcactgcaagctccgcctcccaggttcacgccattctcctgcctcagcctccccagtagctgggactacaggtgcccaccactgcgcctggctaattttttgtatttttagtagaaacggggtttcaccgtgttagccaggatggtctcgatctcctgacctcgtgatccacccacctcggcctcccaaagtgctgggattagaggcttgagccactgtgcccagcctctgtttttctataacacct
tcctttgtgtggctttggacgtctattcttagagttctatggtgccttccataagcaaagattgctttaaaataaaagcatctgagcagagttttggacacctgtcaccagaatcttgggaaaattccatgtaactaagaattaagtttgcagtgtcttttagatgagtgcttaccatgatccactgccaaagtccaaaatgtgtgtgtgtttatgtgtgtttgggattgaaatagagagagatactgtttcatacatctcatctctgtctcaccacagtattatccagcaattaac
aaatattgacaagtctaataatagtttatccttggctaatcctataatttgctcccataatactataggctaatcatgtacaggcctgaacttctagcaagcttgcctcagcacccagcttcctgctgtgggtgggacactgagtaaatactgaattgacatttctctattttgaagatactgacacagatgtgagtgctttgcctgtattttattgatttggttattgatgtcaatatcttgttcttgccgtggatttcacaaaaaaaaaattggaatagattccttttgtctgca
accataagaaaaataaaagtaaagaaacttcttaaccaaatacagtgttactttgtttcaaagtggaaatattctactacaactatcctcataaatcatttttaaaacagcctggatctgtaatatttcttcacggtttataaaatttgcaatgggaatgccttttcttaaaaaaaaaatactagactcttccccattttagtaaagtttttgcttcttaaaattttccatagcaggagaaaggacaagaaaaatgcctccttattttctacccatgaagctccatgttacagccaa
tgagggctctttaattttcaacagccatctgcataaatcctataaaggtaatatattattaggattattttggctacaagtaacaaaacaataaacttatctaaaccataaagaatttaccatttcacttaacaaaaaattttagaagacaagctgcttcggttttgttatctcagaacttctacatgtcaccatgtcaccatggactcagatcctttccatatttctggcccatcactctggtcttagctttcctcaaactgactctctaatgattgcaagatggctgaatagctt
caggagtgaagtagacgtgctttctttcaagcaatgggaaggctgctttcttcaaggggtcctatcttatcagtgaggaaacttttctagagccccagtagcactttttccctaattggccagagttcctcattggccagaattaaatcatgtgaccatgctcacaacaatcataagcaagagaaatcaagccactgtaattggttagtgccaccttttagcactaggtctgaagaccatgtcctctgaaacttatggcaaggtggaggagggtagacataatttagacagtaacag
agttctgatacaaaggaggaaagaggaatgacttttgaatcagacaagagtctacagcaaatgcaaaaaggaaagtttctgcaatctggtcattttttcatctatttaaccaatgtttcctgtgctttctatgtgccatacactatttgtttttgagatggggtctcacgctgttgctcaggctggagtgcagtggtgagatcatggctcactgcagccccaaactcctgggctcaagctatccagccaactcagcctcctgggtagctgggactataggtgcatgccataatgcct
ggctttttttaaaaaacgtttttttagagatgggagtctcactatattgcccaggctggtcttgagctcctaggctaatgtgatcctcccatctcaacctcccatagtgctgggattataggcatgagctaccatgcccaacctgccatactctattctaagtagcaggtgacaccataacaagaaaaagtagatactgcctctgctgtcatggacttcagtctactgagcatttcttgactgtccacattgtgcatagtcccaaagctgcaagggggcttagagagcaaatatcct
aaccctctcatttttgaggtaaagaaacaagcctggagtgactaagtcatttgctggacctggatacacctgattttggattatcttcagtttgtgctttttggggcacctgttatcctgggtacaaaagctttttatacatgcaaacagaaattgtcacatgccaactcaaaatatgacttattgtaaaacatttaatgcttcaagagaactatttgctctatgaaatgattcataagattcatttagacagtacctctatgccattaaaatacattttcatttataaaaatagtt
catcatctttttggacgtaatcttggtgaatcacaaaaattcaaactgtatacttgtatcctacctcaaaccccatcactctgtcctctccagatctgtgcagtgcaatcaacccctgtgggtagtaagagaaactctgtacccctgatgggtcatttggagccttcagagtcctacaagggatgggtccattgtctactcttttcctctccattctgcacactggtagtaaagacatgcctgtacctacaaattttgtccacatcctctaggatccctattaataggtgattgctt
aaaagattcaaaatcacccagagttctgctgtgatctggacattaaaatgtaacagaagtagccaagtctctggttagaaactttacttatatttgtgctgaattgttagttctgattacacttttttgaatttattctacaaacagaatcacagaggtgcacaaatgcaaatgtacaaggatatatgttgcagcattacttacagaaggtagacatcagaaacaatcttaggccagccgcatggtggctcacacctgtaatcccagcactttgggaggctgatgcaggcagatcac
ttgaggccaggagatggagaccagcctggccaacatggcaaaaccttttctctactaaaatatgaaaaaattacccaggtgtggtggcatgtgcctgtagtcccagctactagggaggccgaggcaggggaatcacttgaacccgggagccagaggttgcagtgagctgagatcgcgccactgcactccagcttggtgacagagcaaggctcggtctaaaacaaaaaaaaaaaaattagctgggtgtggtggcatgcacctgtggttccagctacttgagaggctaaggtgtaagga
tcgcttgagccctggatgtggaggctgcagtgaactgagactgcacaactgcactccaacctgggcaacagtggaaaactctgtctcaaaaaagaaagagatttttttaaaaaagagaaaacaacaacaaaaaagaaacagccttaattctcctcaatgtatcatgacacatgcctgaacatcacatgaccaataaaacaaaagaagtaattctatgaacccacgtggaatgatcaccaagaaaccttaatagaaaaagctcagtgcaggacaatacatatgacatggagcctgttt
gcagacaaattaacaaagaaacagaagaaaaatatagtatatctacatgtgcttgaatatgcagggaatgcctgtagaacagcagtcagcaaactggcccaaaggccaacaccagcccactacctgtttttttatttttaaaatatttttaatggttgaaaaaaataaatagaagaataaattcaaaagatgaatataatggcatgaaatatatgaaattcaaatgtcaatgtccatgaaactttcctggaacacagacacactcttttttttttttttttagtggcaagtgccact
ctgccctgctaatttttatattcttagtagagacagggtttcaccatgttggtacaggcgccagccaccatgtccggccgacacactcttcatactatccacaaaataatggtagaattgaatagttgtgatgaaaacttcatgacccactaagggtaaaacatttattacctggggctttacagaaaaagtttgtccacccccggtcgaaaggaatttatagcaactaacagctatagtttcctctggggaagggcactggcatttaaaaacaagagcaggaagaagacttaggtt
ttactttctacccttttgtgtgtgtgtgtgtgtgtgtgtgtgtgcgtgtatacatatatgtgcgtatatatacatatatacgcacatatatatacacacatatacatatatatatatattttttttttttttttttttttgagacagagtctccctttgtctcccaggagtgcagtggcgcgatcttggctcactgcaacctctgcttcctgggttcaagcgattctcccttcagccttccaagtagctgggattacaggtgcacactgccaggcatggctaatttttgtaatttta
gtggagatgggttttcaccatgttgttcacgctggtctctaactgctgaccccaagtgatctgcccacctcggcctcccaaagtgctaggattacaggtgtgagccaccacacccggcctgcatcttgaaattaatatgaacatacttaaaaagaaaatataatgagaaaaataaaagaaatacgattcataccaagtatctgaaaaaaccttaatgagaaaagtgtgtgactttatacataaaaaataatgaaacttataataaagaaggcttgaattaatatagagccatatctt
ccatgagtaaatatttgaaagatgctaatttacctccttcccccaccccaagaaaaattcacagaatgatttcttctaaagttataggaaagaataactgagctgaaatatttaaaataattctagaaagcatggcagcaggagaatctagaaagatagtgcattggtgtctcctgcctttcctagacacacagctcctcctcagctttctctcactcccctcagcctagcatccactcaggcagtgaattggcaaaactgcacacacacgttacacacattgcacaccagtgtggt
gtgtccaccctctgggccaagtgggagcctgggaggcagaggcagcagaaggtagttccaaagcaaggatctgaagcagccagctcctgggaatagcttgatctcctgagatcgctgaacctctgtagggaaagttgacaaagttgacattggccagtctcgccaggcccagagaagctcatgaggagctgtgagggtggacggagagctccccctgaggctgggaaagccacggagaacctccctcctcctccacccttcctcatgccatgatagggagttgatgacttctcactg
cagcccagccagttctcagggtcagatcaccacaccttctgtttctcagacaatctcaccccaccctcaatcccagttaaggtatcctagccactgaactccaatgatcagcaaagaaaaataaccagatgctaagggggctcaacaatcagagacaggaaaaataaacaaggattagctggtccctcatgaaataaaactgactggaacaggcagagggcaatgtactaaaaaaaaaaaaaaaaaaatgaaaaagtaaatgataaaaagagtatttaaagggattcaaattcagca
cataacaaaagacttcttagaaaacatgcattcatttttttttaagtcactagatgaatttaaggaaacgatgatcactgatgatattcaaattcaatggcctggaagatcaaaaggataaaataagtatatcctcaaggaaaaaaatacaaaggtctagtaatcttgaggaaaaacataagcagacccaggaaaccagcacgagaagaaaaagaaaagaaaaaagtgaagagatggagaagaagcagaagttaaaaaaaaccttcccttaaaaaaaaaaactgagtttttaaattg
aaaatgcctaataaacttcaggcactattatagaaagaagggagacatttatccatattttggcaaaactcccaaacttcaagcatgaagagaaaaccttgaaaagttctgggttgaaaagacccagaaattatcttttttaaagaaaaagataattctataaacttggaaaatcttcattctaatgctagtaaaacagaaataaaagaaaataattacatatttctatcagaaatataagtaagaaaatggtaaatttatgtgaaattttatgcagccaatataaacagtcattaa
aatgattccatagttacatggaaaagcacagatgtaaggaaaaacaacacattataaagtaaaatagcaaattatagaatgttatgcagtataattaaaactatttttaaatgttcatgaaaaagatagaataaacaaagattacagtagttgggttagagtcgttagaggaataagcaagataactatagttgggttagtgttgctaatggaattacaggttttattccctgtttcatactttctataatgtaatattttagtaataattttttgagttaatagtttatataaagt
tcggcttttgtaaacaaaaaaggagttacatttttaataagtaacacgaagaagtcacagctataatctgtaaacgctaaagggaagttcatacatagcacatgccctgcagctaagccagatgatccaaggctccaggatctatatgccaagagcaaaatcaaagtttaagcttgatattgcttgggggaggggtttgccctaagacttagatgattaaattatttattagaagaaataagagaggtctcaatttccttatttgcctgtatgtttacaccgattcaaaccaaagtt
ttagggtaaaatcttgtctctctgaaggcatttccttcgtttcatccatacttactcattaggctcctcagtctatagagtgggagaaagaaacacagcccctgatagttgggagctggctggcactagcagttaggtcttggtattgctactatggaaaacaatgctagacaaggccgttctatcactgagataaagtgagacagaaatacattcaccccatagtcatgtctgagcacagacaaaaataaggccactgtgaaaactaccaaaatatttctctcagcttatgagaga
gactatagcttcttaataatcacagctttaatcacactttattcttcctgccttcttgataaaaattcagatacccagtcagaattggcccaattcctgacagcaccgtatccagagcaaactcatgtttccttgaactctctccaaaatcatctaccaccacctcagatcccatcatgtaaacctctcacaccttctctctgtgccttccacctatgtgtccccttgacatgcagcctccctcagtgcaacaggccaagaaaaacccaactcagtttgacttcaggtgcatccctg
gtggtctttggctttagagcactgtcaaatggaatcgtatctttattcctggttcttttttttttttttcttttgagacagagtttcactctttcgcccaggctggagtgcaatggtatgatctcagctcaccacaacctccaccccccaggttcaagtggttctcctgcttcagcctcccaagtagctgggattacaggcatgaaccaccatgcctagctaatttttgtattattagtagagacagggttttgccatgttggtcaggctggtcttgaactcctgacctcaggggat
ccacccgcctcggcctcccaaagtgctgggattacatgcatgagccaccatggctggcctattcctggcttttgtcgcctttaacacaagcaatcaaaacttacttggcaagccagaattctatttgtaggcttttgccattgctaaattcattgctcattgttatccagtactgatcgatgctcatttaaaagaagcaatatgatgaactgcctgcagcatacgtaatccctttcttcctctaagaccttgaaaatctaaggccttggattaactgaggacttactgtagcctaac
tgaattaaactttggtataatgctgtgacagcattcaaaaaacctcatcacttggccactgtgaagatgctgaaaatgccattcttacataaagcagttttagaactctcaggagaaatatacttctttcgataatatcaggaacagttttacttctgagcaatcagtttgtttccattttatatacagtgtgaattgtgtaactgtaaagtttccatttttaagttggtttcttgaaaagtgagccaaatctgtagcaagatgagcgtgctctccgatgtttgcttcattcctggc
tccctttaatttatctctgaccttgttttcctttttcaccattgccaaatgtatgttatcttgcttcattttatgtacctgtgtaagcctaaatataccttttaaaaaaaattggaaaggctgtgaagaaagacaattcaagcctgaaatggtgtcataccaattacaaagcagggtacctgtctagcagaaggtgagaacagtggaggagcaattgaaatctgggctttgggggctgggtggagaagggaccacatcaggacactggaggagtggaacttagcaatgtatacggga
ggtgcagtgagcaagacaggaaggaaccttgtctgatggtcctgtaaagttcatgccagagagataagccttggaatgcagaagaggagaggaagattggagagaacctagaaaacaaggagcaggagtctaggcttgatgtagatcacatctgtcctttctgtgtgtctaacaaacacaattgcctatgtccccacattcaggagtcagcaatgcaggcggcagaaaggataccgtattagtataatacggggctgttataaccaagtaccacagactgagtggcttacacagcag
aaatgtatttcttcacagttctgcaggctagaaatccagaatcaaggtatcagcagagtttatttcttttcaggtctctctcctttgtttgtagattgccaccttctccctatgttttcatatgttcttccttctctgtgtgtctgtatcctaatctcttcttataaggataccagtcatagattggatttgggttcacccaaatgacctcatttaccttaatgacttctttaaagactatctctccaaatatagccacattctgagggattagggattacgacttcagcacatgaa
ttttgaaggtacacagttcatcccatgacagggacctgtagtagtttctggagagggcacaaagcagatggcagctaatatccaacgagagtccacatggaaaatgcaatttgtttctgtgagatgcagcacctcctgatggaaggaagttgggaaaaatgagcattttgaagacgcactttccacttaccttggcacctgaaaatcaactagggctcatcttttccaaatacctctaatcaacggcagcaagggagaagggtgaactttgggcataatgaagatgacaaaagaatt
ttactgacaatgactatgatgaaaactgtgaacaatttatgattttatcctcagtacaatgagtgataaaggacaggcacacagtgactcacaatagctatgtaattccatcatcactaaggcagaggtaagaacacacacagtgggactgggaatagtcttctgaccttaccttcactctcttccataggagccacattttctggctgacatgtccaaatctctcctctctgttctagttacttaacagaagaagttcatagactttgctaacataccatctcaatatctttaact
gggaatgcatcagttgaattctgtaaaagcaggctttgcttactctcaatattccctgtttaaaaaaaaaagttgctggctgcttctgacatgttcccagttaaactcatgctatcctgtatgccgctgagcctctcttcctctctaacctgtttcagattggtttcagcagctgtatgtgcttcatagaaacagaattctctccaaggaaaaaaaacatcatttccagtaaaatcaccaaactccagcctgctatgtgaatggaaggaaatgttacattctttataacaggatgaa
ttacttcctgttgtaagtccagtgaaaaacgaatcattggttaggaagaaacatagggcccatgacattttcagtgctacctattatcttctttccaataataactcctgatgttatagtcacttcaacattgagtttgctatattatcaagtaaattcccctcttgcctttactgcaatcctttcaagttgacttttgcttttctgtgctaccccatccatgcaatgtttcatgattggctgctatccctgaaggttatactcattccaagttcagttgactgaggttgccccaat
tattattctaaatggatctctttttttcataagataaaaacattatttgaataaaagtggatgtcagatccaatttgagaaggcttaagcttgagaaggagaaaataattggaaactattgagtaaaaggttgaaagtaagaaaattctggttgttgcattcaaggcagatgagtttaggaaaggactgaggagaggaggatgggttgggaggcattcagggcaacccaatcctgaggtgacacttcaagggcttgaattccccaaagctatgagaaatgaaggaccctagaaacaa
ggaatcttagagagtggccacagtaaaaggagaaaagaaaataggtcagccaaaaggacaagacaagcgccactgggaaagacggcatcaccaaagttttgaggcacaaaacttttaagaccttatagtccaaactgctttaatgtgatttaatttcgtttatttatttttgagatggagtctcactctatcactcaggctgcagtgcagtggtgcaatctcagctcactgcaacctctgcctcccaggtacaagcgattctcctgcctcagcctcccaagtagctgggattacaag
tgtgactcatcactcccagctaatttttgtatttttagtagacatggggtttcaccatgttggccaggctggcctcaaactcctgacctcaagtgatttgccctcctcagcctcctaaagtgctgggattacaggcatgagccaccacacctagccccaaactgcttttattttaaatgcgaattcatgcttcagagttgaattaaatgttacaaaatctatggtcccaaactccacacccctctgctaggagggacaccggaatacaccagcaaggtcatggaggataagatagtc
tccacagaaactatttgcctccaaatatctttctttgaacaaccctgtaacccgattagctctctagcctatccccattttgatactgatggggtgaacagctgtgatttatgttgtcactgaaactgttcagcatcaccacctgtctccctccactgagttggtggcactgatgtagtgacactgccctccttggtgggaacaaacaactgccaaaagtctgaagaaataagtccataactttgcccatccagaggagaataggtaaagccaggacacatcctcaagtattttccc
ccgatattctcccctcatcccttactaacaaataaatatctggcttctgggttgactttattttttagagcccactatgtaaggtcagattgggcagtgagtgttgaaagatgaaagcaggctggtgagcaggccgactgaggaagcccacacggcctgccttaaattctagtcccaccactttccagctcgcctcgggccattatttaacttctctgagattgagtttcctcatctgtacacacacacacacacacacacacacacacacacacaaaacaaaaagccaagatgata
atgcttcctttgcaagacgtaaagaagaaaaatatataattttgacaacataggaaatgctttagaaacagcagcttctactgccattaagagaaatcgtatttcttgaccgttttctttgtgccaggcaatggccgagcactgttgacataaatttcctcatttaatgcccagatctgctttatgcaatagatactattaacctggttcagacaggtacagctattagaccaaaattaattggctcatatgggctggcctcagctgtcacccctagacctgtttttctccaaggtt
tcttctagcagatgacaagtgtgtccatctttcaaagacccaggctgggacacttctcaaggaacactgtgatttccctagacttgtatgactttgctgtgaacttgctgggtcgtgtaaagttgttactttggagatagtttggttgctacacttattcagctgcacctcaaagggaactggatgtgtgtttacctcaggtacagttatcctcgctctctgacaagtgaaatgctactttcaagttgttttgttgagaactctgagagctctttaccctcggatcaaggcagaatg
ggtaccaatattttaagctacacattggtccatagatagataggtacatagataattagtcaggcttgtccagataaaaaggatcaattgtgcgtgcgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtctctgttgctagttaagatttttctttttgaaggctgggcgctgtggcttatgcctgtaattctaacactttgggaggccgaggcgggcggatcacttgggctcaggagtttgagaccagcctgggcaacatggtgaaaccccatctgtaccaaaaacacaaaaatta
tctgggcatggtggtgtatgcctgtggtccgagctacttgggaggctgaggtgaggtggaaggatcacttgagcctgggaggcagaggttgcagtgagccgagacactccagcctgggcgacagagtgaaaccccatctaaaaaaaaaaaaaagaagatttttctttttcagcaccagacttataacctacactttgggatccttccacaaatcagaaggttccctggcccctcataacttctttgcaccactattttttttttttttttttttgagacggagtctggctctgtcgc
ccaggctggagggcagtggcatgatcttggctcactgcaagctctgcctcccgggttcacgccattctcctgcctcagcctcccgagtagctgggactacaggcgcccgccaccacgcccggctaactttttgtatttttagtagagacggggtttcaccgtgttagccaggatggtctcgatctcctgacctcgtgatccgcccgcctcggcctcccaaagtgctgggattacaggcgtgagccaccgcgcccggactgcaccactattaatatatccttgtaatttccatcagaa
atgtcttcctgagttctatattctgaagccaactagtcatttcctatgtatgaagttatctagcttttctgaccaaaatacagctgagaccttgcctcttctgcttgaaatggaaaaagaaattgcaattagtgtgctagatttacaaaaataaattttaggcctaaagaagtcaagttttgaactttggcttctggtgttagagccgtcattcacatcaccacattctgctgcttcccagtaatgccagctaagtatcattagaaacaatagtgaccagaaagtagaatagaggct
accaaggtgggtgaggtgggagtagtgggaaattattgtttaatgggtatagagtttctgtgtaggataatttaaaattttggaaatagtagtaatgattatactacatcatggatatatttcatgtcactgcattgtacagttaaaaatggttaaatgttacatttgttgttgttgttcaaaaggttcaagcaattctcctgcctcagtctcctgactagctgggattacaagcacgtaccatcacgccgcctaatttttgtatttttagtagagacggagtttcaccgtgttggc
caggctggtctctgactcctaacctcaaggggtccacctgcctcgacctcccaaagtgctgggattacaggcatgagccaccgcacgtggccaaatgttatgttaggttatatattatgcttacattatacgtattttaccacaataaaaaaatacaccaaaaaataaacagtaattacgacttgttttgcaattcatttaacttattaaagcctccgtttctccatcagtaaaaagggtgacaataacacctaagctcaaaaattgttgtgataattaaactctaatacaccaaaa
gcacctagcttggtattttgggggtggttatacagcctatcaccccttcatctgatggcttccatcggctcaacccaccggccaggggtgggctttcagcagctgtgttttaatttgcctaatatggcctgtatgactgtactgtttggcacagagcccactgtggtgctcagcctacgttcattaactttcctttgcccaatgctaatacaacttgagtaccccaaattcaaaaatcaaaactccaaaatgttccaaaatctgaaactgtttgagcactgacatgatgctccaagg
aaatactcatttcacatttgggatttgcagatttgggatgctcaacctgtaagtataatgtaaatattccaaaatctgaaaaaaattcaaaactcaaaatacttctgcttctaagcatttcagataagggatactcaacctgtatctccatttatttatactcaccaggctcagctagcggagttgggcaatgtgtgcgctaatgggaagcttctctgttatttaaaagtggtagcacactatctgaaaatccctaacacttaataggtgcataatgaatgtttgttcaactaaatt
ggattgaatagatgatagaccaccagggaaccagagaagaatgaggatgtactactcagagacggttcctgatgcacgtatcagggactctcaatccataggggatataaacagtatttgttgttgatgaggcaactatgtttgtggtacacttgattacattccagatttaggctattttttaaaagctcttttatgtgcagttttactaccttgaacaactggagccaatgggaaattggtgtttgggggatcatctgtaatgaagaaaactgcagtaataggtataaaaagcag
attcaaaggccacaagttacttaatccccagtttaggtgatgttaattaaaatctgaaaaatggaaataggcattgattgggctcaccttttatttttaaggttgcatagattctattataggaatgatcattacaattatgtaatttaagttacactgcttttaaattcagagcaaggaacataaaactttattccataaatatacaacttctagaggtatacaataatttcattttatattttcataggctaaatgaagaagacagggttgagtgaaagcagaaaagggaataat
aaggcaagagagagagacaagagaaaaa
33.000 bp ( ≅ 0,0001% des Genoms) von Chromosom 9
Problem: Wo sind die Gene ?
Ist die Komplexität eines Organismus
eine Funktion der Zahl der Gene ?
# der Gene
ΦX174
11
5,700
6,300
S.cerevisiae
C.elegans
ca.
D.melanogaster
> 13,000
human
19,000
60,000
20,000 - 100,000
35,000 ???
Wir sind nicht allein
vergleichende Genomanalyse
~ 98,5 % der Genome des Menschen und des Schimpansen
sind identisch.
Wir sind nicht identisch
•
Alle 500 – 1.000 Basenpaare gibt es Unterschiede
-> Variabilität -> Evolution
•
Unsere Gene werden verschieden stark exprimiert
Wir sind nicht identisch
(somatische Mutationen)
•
☺
Immunglobulin-Gene in den Antikörperproduzierenden Zellen
•
Mutation –> klonale Selektion in der
Krebsentstehung und Entwicklung
Gen-Identifizierung
(humane) cDNASequenz
humane
genomische
Sequenz
genomische
Sequenz
der Maus,…
regulatorische Elemente ? zusätzliches Exon ?
Exon 1
DNA
(gene)Promotor
Exon 2
...
Exon n
Transkription
hn-RNA
spleißen
mRNA
AAAAAAAAA
Protein-kodierende Region
poly A tail
AA
AA
A
AA
AA
Zellkern
Cytoplasma
AAAAAAAAA
Protein
Translation
Mit einer vergleichsweise geringen Zahl von Genen kann
eine große Zahl von Proteinen und eine noch größere Zahl
von Interaktionen/Funktionen erreicht werden
Beispiel: alternatives Spleißen
Arbeitsprogramm des Genomprojektes
• Sequenzierung der kompletten genomischen DNA
• Gen-Identifizierung
• Funktionsanalyse und Erforschung von
Krankheitsassoziationen
ABER: Was ist „Funktion“ ?
Beispiel: Enzym Reaktion (Katalyse)
Enzym
A+B
C+D
Edukte
Produkte
OH
O
Glukose
Hexokinase
+ ATP
OPO32O
+
Glukose-6-phosphat
ADP
Wie viele Dimensionen sind nötig,
ein Gen/Protein zu beschreiben ?
Hexokinase
1. katalytische Funktion
2. Stoffwechselweg
3. direktes Zusammenspiel
mit anderen Wegen
(z.B. Glykolyse - Glukoneogenese)
4. Varianten eines Gens
(auf RNA Ebene)
5. Varianten eines Proteins
(Modifikationen)
6. Wo in der Zelle / im Gewebe
/ im Organismus ist das
Protein lokalisiert
(mögliche Interaktionspartner)
7. Wann ist das Protein
vorhanden
(Entwicklung / Differenzierung)
8. ...
http://www.genome.ad.jp/kegg/
cDNA-Synthese
AAAAAAAAA
TTTTTTTTT
cDNA (einzelsträngig)
Reverse Transkriptase
ATG
TAA
AAAAAAAAA
TTTTTTTTTT
Protein-kodierende Region
„open reading frame“ = ORF
cDNA (doppelsträngig)
Klonierung von „Open Reading Frames“
Full coding cDNA clone
PCR amplification
ORF
attB1
attB1
ORF
ORF
attB1
attB2
attB2
attL1
entry
clone
ORF
attL2
attB2
P
PP
tag
expression
clone
ORF
Mammalian cell culture
sub-cellular localisation
and functional assays
• protein localisation
• protein activity
P
tag
tag
expression
clone
ORF
ORF
E.coli & baculovirus
expression
purification
• Ab production
• protein arrays
• protein assays
tag
tag
expression
clone
ORF
Yeast 2-Hybrid &
pull-down
Mass spec.
• protein-protein interaction
• protein networks
• protein modifications
Stephanie Bechtel
„unbekanntes“ Gen
in vivo
Gen für das
grün-fluoreszierende Protein
„verknüpfen“
in vitro
grün-fluoreszierendes Protein
sub-zelluläre Lokalisation
peroxisomes
mitochondria
Golgi
microtubules
ER
actin
plasma membrane
cytoplasm
nuclear envelope
nucleolus
nuclear speckles
Zell-Assays zur Analyse des Zell-Zyklus
X
Bibliothek
von Expressionsklonen
Zelluläre Assays
FACS
DAPI: Cell
?
identification
CFP: ORF
automated
Microscope
Analyse der
Gen-Expression
Modulatoren des Zellzyklus
expression
Biological
effect
Data analysis
Automatische Bildanalyse
DAPI
CFP-ORF
Cy5 Anti-BrdU
DAPI
CFP
Cy5
channel channel channel
...
...
...
536
621
258
264
2101
144
694
1732
401
399
1183
120
845
493
219
610
66
297
500
232
421
428
182
120
563
286
332
......
...
domain structure
gene expression profiling
gene structure
in situ hybridization
genomischeSequenz
genomic
sequence
in vivo
„known“
gene
„bekannte“
Gene
DKFZp 586P1422
cDNAs
DKFZp 586P1422
DKFZp586P1422
DKFZp564D116
in vitro
immuno-histochemistry
protein function
and
disease relation
2000 µm
2000 µm
post-translational
modification
protein localization
functional assays
protein/antibody arrays
protein-protein interaction
6
d o t6
4
A
B
2
C
0
D
-2
E
F
-4
G
-6
H
1
2
3
4
5
6
7
8
9
10
11
12
X Results
FL-cDNA
Gene
expression
(microarrays)
Cellular
Cellular Protein
Cellular
effects
effects localization
effects
DKFZpxxx
kidney tumor
prolif.
ER
DKFZp434P097
recurrent
breast tumor
cytoplasm,
nucleus
DKFZpxxx
DKFZpxxx
kidney tumor
and GIST
GIST
prolif.
mitosis
apoptosis
prolif.
DKFZpxxx
prolif.
cytoplasm,
nucleus
ER
GIST
prolif.
nucleus
DKFZpx
kidney tumor
prolif.
Golgi
DKFZpxxx
kidney tumor
prolif.
ER
DKFZpxxx
kidney tumor
prolif.
Nucleus
DKFZpxxx
kidney tumor
prolif.
Mitoch.
DKFZpxxx
kidney tumor
prolif.
DKFZpxxx
kidney tumor
prolif.
Plasma
membrane
ER
Functional
annotation
S. pombe hypothetical
GTP-binding protein
M.musculus coiled-coil
transcriptional coactivator
Protein
assays
p42 MAPK
CDK2/cyclin E
H. sapiens kinase
H. sapiens NADH:ubiquinone
oxidoreductase
H. sapiens testis-specific
Y-encoded-like protein
H. sapiens
intracellular chloride channel
M. musculus
hypothetical exopeptidase
H. sapiens
serine protease
G. gallus
acyltransferase
H. sapiens
GTPase-activation protein
H. sapiens
transmembrane protein
PKA
p42 MAPK
Und jetzt können wir alle
nach Hause gehen !?
Interaktionskarte
der Hefe
Jeder Kreis symbolisiert einen
Proteinkomplex,
der sich aus vielen
Proteinen
zusammensetzt
Viele Proteine
wirken nicht
nur in einem
Komplex,
sondern in
mehreren
Gavin, A. -. C. et al. Nature 415 (2002) 141-147
Die Scharzarbeiter unter den Proteinen
Moonlighting proteins
Phosphoglucose-Isomerase (PGI), ein oft im Cytosol anzutreffendes Enzym.
Es katalysiert dort den zweiten Schritt der Glycolyse, die Umwandlung von
Glucose-6-phosphat zu Fructose-6-phosphat.
"Neuroleukin" ... Cytokin unreife B-Zellen zu Antikörper-produzierenden Zellen
heranwachsen. Und Wachstumsfaktor für embryonale Rückenmarksneurone
und sensorische Nervenfasern.
AMF (autocrine motility factor) ist ... Cytokin bei der Migration von Zellen.
DMM (differentiation and maturation mediator) ... Differenzierung von
humanen myeloiden Leukämiezellen
Dasselbe Protein – viele Namen, weil viele Funktionen
Machen alle Gene ein Protein?
oder: die „Ignoranz“ der Genomiker
RNP
Ribozym
snoRNA
z.B. XIST, roX
rRNA
tRNA
snRNA
DNA
RNA
hnRNA
mRNA
Protein
miRNA
lin-4
Diese miRNA steht am Beginn der
Entwicklung von der Larve zum
erwachsenen C.elegans. Ist
zumindest bis zur Maus konserviert.
lin-14/lin-28
Larve
lin-29
“L/A-switch”
Adultus
Es gibt noch viel zu tun – aber wir haben die Zeit
dazu (oder auch nicht)
Süddeutsche Zeitung, 19. Juli 2000
Herunterladen