Funktionelle Genomik Stefan Wiemann Molekulare Genomanalyse DKFZ Heidelberg Arbeitsprogramm des Genomprojektes • Sequenzierung der kompletten genomischen DNA • Gen-Identifizierung • Funktionsanalyse und Erforschung von Krankheitsassoziationen Das humane Genom 23 Chromosomenpaare 3,2 x109 Basenpaare (3,200,000,000) < 5% mRNA („Gene“) < 3% in Protein übersetzt > 90% unbekannte Funktion Gen ... regulatorischer Exon 1 Abschnitt Exon 2 ... ... reg. Abs. ... Protein-kodierende Region Exon n reg. Abs. ... Das Rennen um die Genomsequenzierung... fertig ! ☺ Source: Jane Rogers, Sanger Centre Fachübergreifende Presse... International Consortium Completes Human Genome Project All Goals Achieved; New Vision for Genome Research Unveiled fertig !! fertig !!!!!! Arbeitsprogramm des Genomprojektes • Sequenzierung der kompletten genomischen DNA • Gen-Identifizierung • Funktionsanalyse und Erforschung von Krankheitsassoziationen aaatcatagataggagcccagtcctagacctgggttgatatggcaacagaacagagaaggaactttcagaacaatttgttaactgaacgaattaagtcactgaagagcttagagtcagaaaacataagcaacccagggactcttagaactctggctgggacactggactttctgcaggatgtggaatggaagttcaaccctgtattatctggatattcaagggcagaatgactccagatgatgtcacaagctattaaatgtgttagatgggatcaggtggcttttaaatactataca cccagcattttgctagtcaggatacagaactaagtatagcaatggcttgtaggatcttggaatatcttgaactatggaatcatctttccaaagtgtgaatatgaccatgtcactccctatctaagatgacttcttgatgcctacagaatgaaggccaaggtccctagattcaggctcaagatcaccatggcctgaccctggagcctgctgctcagccccgctatgccctgcagttccccagcccaactcagtaatgcccaactctttgcaaccactcccctctccccttctccttta ctgctgtttcctgtacaaggctgtgcctttgctcctcctcttccctctgcctgaagtgcccttctggcctttacttacccggctcttattcttccaggtctgggctcagatgtctcttcttccaggaagccattcctgttgtcccagtttgggtcatgagtctcttgtatatccagcatataattctacaataacatgtataacatcaggttgagattatgtatatgtatataacttcttgactgaatgaaacacaagcttcttttatataagaatttagtctttgcaatctttgtg ccttgagtacgtagcacaaagttgaatgctttttaagtgctcaaatactggattgtaaaactaaattgatcccatgattgcaaaccatagattattttgtaaataagcatcccagtatttaggcctccaagtaaccactgtctcttgaaagaagttttcgtaagaggttgtttgcctatcccggtgatttcctactcagcacacaagttacaggtcctattgtggatttatattcagggagcacaaagctgatttttgcatacatattgttataaaaaaaaaaaacccttacatctt tgaaggtagacttaagattttgaaacagcaaaatcgttgcactttccatcagggaacatagtaattgtcatgctggttaatgcccttttgagaccctccatagctgtcctaatgaggaagtcctacagatcgtatgtagagctaataacattgatatggtttggctgtttctctacccaaatctcatcttgtagctcccataattcccatgtgttgtgggagggaccaggtggaagataattgaatcacgagggtgggtctttcccatgctgttctcccgattgtgaataagtctca cgagatctgatagttttaaaaacaggagtttccatgcacaatctctttttgcttgccaccatctgtgtaagatgtgacttgctccttcttgcctcccggcataattgtgaggcctccccagccatgtggagctgtaagtcaattaaacctctttttcttcccagtcttgagtatgtatttatcagcagcatgaaaacagactaatagagcaaattggtaccagtagagtgaggtgctgctgaaaaaataccagaaaatgtggaagtgaatttggagctgggtagcaggcagagtttg gaaccatttggagggctcagaagaagataggaaaatgtgggagagtttggaacttcctagagacttgttgaatggctttgaccaaaatgttgatagtgatacggacagtgaaatccaggttgaggtggtctcagacagagatgaggaacttcttgggaactagagtaaaggtgactcttgccatatttcagcaaatacactggtggcattttgccctgcccaagagatttgtggaactttgaacttgtttcttgaggaatcattactctgatagacacaaaaacaattcctcctatc ccccaccaaagcagcccacaaagatatctccatctcctgagctttcagagagtgtgctgtctggcaagagagatgatttagagtatctggtagaaaaaatttctaagcagcaaagcgttcaaagaggtgacttgggtgctgttaaaggcattcagatttaaaggggaaacaaagcataaaagttccaaaaatttgctgcctgacaatgcaacagaaaggaaaattccattttctgaggagaaattcaagctgcctgcagaaatctgcctaagtaacaaggagccaaatgttagtcat caatccaatggggtaaatgtttccagggcatgtcagagacctttgcagcagccgcccccaccccgcccccggccgctgccatcacaggcccagaggcttagagggagaaaatgattttgtggcccaggcccagggtccctctgctgtatgcagtctaggaacttggtcccctgcaacccagctgctccaactatgactaaaaggagtcaaggtacaccttgggcttttgcttcagaggatggaagccccaagccttggcagcttctacatggtgttgagcctgcacatgcatagaag tcaataactggggtttggaaacctctgcctaaattttgagcatgtatgcaaatgcctggatgtccaggcagaagtttgctgcaagggtggggagctcatggagaacctctgctagggaagtgcggaagggaaatgtagggtcagagcccccacacagagtccctactggggcatcacctactggagctgtgagaagagggccaccatcctccagacgctagaatggtagatcttccaacaacttgcactgtgtgcctggaaaagccacagacatgcaacaccagcccacgaaagcag tcaggaatggagctataccctgcaaagccacaggggcagagctgctcaaggctgtgggagcctgcctcttgcatcagcgtgacctagatgtgaaacaccgagttaaaggagatcattttggagctttaagatttgactgcccactggattttggatttgcatggagcctgtagcccctttgttttggtcaatttctcccatttgggatggctgtatttacctaatgcctgtacccccattgtatgtaggaagtaactaacttgcttttattttacagagtcataggcagaagggact tgctttgtctcagatgagactttggactatggacttttgagttaatgatgaaatgacttaagactttgggggacttttgggaaggcatgattggttttgaaatgtgaagacatgaaatttgggaggggccaggggtggaatgatatggtttggctctgtgtcaccacccaaatctcatcttgtagctcccataattcccacatgttgtggaagggacctggtgggagataatttaatcatggggataggtctttctcatgctgttctcatgatagtgaataagtctcacaagatctg atggtttcaaaaatgggagcacatgctctctttttgcctactgccatccatgtaagacaagacttgcttctccttaccttctgatatgattgtgaggcctccccagccacgtggaactgtaagtccattaaacctccttttcttcccagtctcgggtatgccttcatcagcagtgtgaaaatggactaatacaagcaacatcttcgaaaaaacacataaccagggaaaggaattacattgaaatggtaacagtcatctaggttactatacactggtggggttatttttaaagttatc ctatagcttgataatcacacctgttacttagtttttgtgtgtttagaattgatgtgccaactaagtaccttaattaagcattgcttgatcccacagtcctcatgggttcttaccctagttatcagagagtttaaagtcaacatttaagcctatgatttattaagcatctactacaggcacaaaagggttctgtgtactctgaaacagattattgagatgaagtccctcttatgtataacagtttaatggcaaagcaaagctcagtgggtcccaaataaacatgccagacagatagca cactctctgaaagctcaggagatagagatatctttgtgggctgctttggtggaggacaggaggaattattttttgtgtctatcagagtaattgtttttcaagaaacaaaccccactttaaaagcccaatgaaaccaaaagatcctcccagaaaacatttaaactcataaaattttacatttaatttcaggaattcctgtatctcctggtgtctatgtatatggggattctaaaaaggtctatatcagaagttagaaacctctgttttatatacatttaaataaattcacattatcta tgcctgttctctttttttttctaaaatcccacacgtaagttctctgagataccatcaaaacagagtattaatgggtggaaaaaatatcttatttaaaagtaaaacatagacatttctttatggaattgtaacatttggaaacttatcgacaaaatattcaactccaggagtgtaatattggcttacgctatgaatataccaagtgtgtatattttgaatcttgcaaactaggaatcacttcatcaccatctccgtattgtccctctggagaggcagtatgccatatgtagaagcatg aaagccagagttaagagatttgagttctgatcttagttttgccacttacttattatagtcgtggtcaattatcttccatctccatgcctccatttctgcatccgtacaatgagtgaatgataaaatttgacttagttgcttcacacagttgttatggggaccagacgggatgacagatgtatacgatccaaatgtgagcttttttgttttgttttgtttttaaggcacttgaataaaagacatttgccatgggtgcattttgcaggttcaatttccagaaagaaattttattgaggt ttgacatcacagactttacaatgaaaatcactgtgcagaatgttctgtgtttaaaataccaccacccctggtgacaatgccaagtcattcaaactaatgccaagtgaaagccattccctaacagtgttttttcccaacaacactttattatattagaaatgtgcttaggcattgtttgggttgcagttcagaaggaaatgctgaaagatgctttcataaaacttatatttggggaaatattttcataagtgaaaagggcttataaaatatgatggtttcatattattatttttagtt taacttactaaacttttaagttggcactggcctggcctatcctaccctgagagccaatgcaataaagtgaaactcattgagattggccattgcaatctgataaatcgaatttcaatattgtttaataaaaataataaacagtgtggaatgaaatatgttggatatcatgcccagaacaggagaccatgtttattcaaaaggacaaatctctggtatcgaaggaaggtggcaatattacagagttgtattatgaataggtccttcagatttgttttggtttttttttgagatggagtc ttgctctgtcgcccaggctggagtcagtggcacgatctcagctcactgcaacctccgtctcctgggttcaagcaattctcctgcctcagcctcctgagtagctgggactacaggtgcatgccaccacatctggctaatttttttgtatttttattagagatggggtttcaccatactggtcaggctggtcttgaactcctggcctagtgatccacctgcctcagcctcccaaagtgctgggattacagtcgtgagccaccacgcctggccccagttttctttcatgactctttaaac ctagaaagaaaagaaaatctaaaatcgtctttaaaaaattctagtcacttaaaaatgctgcagtctaactctggtcttggcacttcataaagtaagtgtcaagccaggttggatttatttagctgaattagaaacctgagggagcagaattaatttttcagtgacaatggttgcagcccactcattgcctccccatatagaaaaatctttcagactattcacagttttcatcaaatggggtcactttcccttctatgtaggaaattccttccagcctgtgaaagattaaacaaaagc tttttctgcaggaactttggaaattagaatataatgttttcctgggtgtttatattgccctcgctgccaacatatttcctgcccatggctgccaggttcatctctccaaaacccactttgcaaacatcatctttttaccatagaaactatctcaggtttctgagcaaagtcgaagctcttgagcctggcattcaaggccttccaaatggctttgctggtaaattcgaccaaatatttaagaaagaaataataccactatgacctaatctctccagaaaattgaagagaatagaatct ttcccaactcattttaagagatcaacgttatgctgataccaaaaccagatgaagacattacaagaaaatagatcaatattcctcatgagcacagacgaaaaaattcttaacaaaatattatattagcaaatgaaatccagcaacacagaaaatggataatacaacatgaccatatggggtttatcttaaggatgcagggctagtgtaacaactgaaacccaattaatgtaatttgtgatattaatagattacaaaagaaaccaagtgatcatctcagtaggtacagaaatagcattt gacaaaatacagcatctattcctaataaaaaaatctcagcaaactagaaatcgaagggtacctcctcaacctcacaaaaagcgtttacaaaatgtttatagctaacatcacacttaatagcagaagactgactgactgctctcaccctaagatcaggaataaggcaaaggtcttttctttcaccacttcaattcactattgtattagggattctagtcaattcaataatacaagaaaaaagaaataaaatgcatccagattgaaaggaagaagtaaactttctttattcacaaatga cattatcaactgtcccgataatgttacaaaatctataaaaaaaggtcctaaacttaatatgtgtttagcagttgcaggatataaatgcagtgcacaaatatcaattgtctttctataaactaacaacaatcagaacatgaaacttaacaatacatttgacatcatcaaaatataaaaactttaggtataaagctgacaaaagacctgaagacctgaacttaagaatgtagcctattttgataaatgctacatatgaattgtaagagaatatgaactctgctgttgttgggtggagtg ttctgcaaatgtcaattaggtcaaattagttgatagtgctgttcaaattgtatatattctcacagattttctgttttttcagttattgagaaaggtattgaaatctctaactataaatatgcatgtctattgattcttgcagttccatcagtttttgtccacatatttaacactctactcagaaaagtcctgttctgtttggagacttctcaaagaatttaaaatagaattaccgtttgacccagcaattccatttacccacagaaatataagtcgttctaccctgaagacacatgc acacctatgttcactgcagcactattcacaatagcaaagacgtggaatcaacccaggtggccaccaaaagtggactggataaagaaaatgcagtatgtatacactaaagaatactacgcaactataaaaaaaattgagatcatagtctttgcagcaacgtggatggagccggaggccacaatcctaagcaaattaacgcaggaacagaaaaccaaatgccgcatattctcacttatatgtgggagttaaacattgagtacacatgaacacaaagaagggaacaatagacgtcggggc ctaactgagggtgaaggatgggagaagggtgaggactgaaaaacaacctatcggatattattctgcttacctgagtgtcaaaattatctgtataccaaatccctgcaacacacaatttccccgtgtaacaaacctgcacaggtaccccttgaacgtaaaataaaagttggaaagaaaaaaaaaaaagaaaaatcctggtccgtgcctgacaataatagcttgtgtgaaagcgcatgcgcacactcacacacacgcatgtgagggcacctatcaatcgttgtcacttataaatgcaaa tgaaaatattccaaataaaatgctagcaaattaaattcaaagataccataaagggcataatccaccataaccaagtcataattattgtgctatgctagaaaaatttaatattaagaaatctaatatggcacatcaatggatcaaataagacaaaccttataatataaaacgtccaaaaggcattctgtaaaatggaataagcaattttaaataaaagctctctgaaaaccaggattacaaagacacttctttaaaatgataaaaatatacagcacttttaaatcaatagccactttc atacttaatgataaaatacaccagaagcatttcttctgagagcctcaataaaacaaaaacgctgggtttggctgggcatggtggctcatgtctgtaatcccagcactttgggaggctgaggccagtagatcacaaggtcgggagatcgagaccatcctggcaaaccagtgaaatcccgtctctactaaaaatacaaaaaattagctgggtgtggtggtgggcacctgtagtcccagctacttgggaggctgaggcaggagaatcgcttgaacccgggaggcagaggttgcagtgagc tgagatcacaccactgcactccagcctgggtaacagagcaagactctgtctcaaaaagaaaaaaaaaaatggtttttttcccaaagatatttgcaacttgctcgcttccattcttcatgttacatgtccccactggccccagggctcttgaatttcctcagttcatgccagaggcagttgttgcaggttactcaatagggcttggtgtcatagggtttatacctcagggtcatagggcttatacttcacatctaatttggccaaataattatggcaaaagcttctgtgagccacata gattaaatgatgtagaaaataaaaagtcaaaattattgggaaaataatttccttatagctgcatcaaatgggacaaacttttcttataactgtttggtcttattttcagagttctatttcctggcctgtcttattaacacatcctttgtcgtacaactgaaatatctatagcaataggaattatacagtgagaatattttttgttttaataaaatactattatattatgcatattttatagcctgcattttttcacttagccatacattgtgaccatttttctacataatgtatgtt tggctaaattattattgtataggttacataatatgtcatgatatagccctcccaccatctacttaaccttgtccctatttataagcatttgattttgcctcagatttttctaaagttgggtttttaaagcatattcccacctcctccacccacacagcaaatagaaaactcattagattttcctcataacccagattactctctctcttatcttaataaccaagtttacactctgcaagaaataaaccagaactttggatgaaaacagggtggagcacgctgggagtaaacattgtc tattttcagagccccagtcttcttaactcccagaatatttcagccagatttatacgtgcttctatgcacacacacgacagggaactaagggttttgatatgaccaaggaaaaggatctgtaggtgccgacggtcagaattccctctaaaaatggcaaggtactgaacaaaaccatgtatagagaaaatcaccagtcagcaagccctactcgtgcacatggttttaatcaacattttagttcctcactcttaagtacaaacagccaaaagatcacccaaatttttaaaaagccttcca acatgcaagacagactaaattgaacaagaaaaaatagcttcagaagaattcatgtcaatgaagaaaacagaagaaaatgtttaaaaaaatctctataattcatagctttgaaacataaaatactgcgtatataagaatcggattttataaaaaagtaatattccaaaaataaggaaaatttttgaaagttaaaaatagtataaccaaaaataaaccagtcagcaaaataattctaaaataaaatggataaaaaaaattccaaaaagtagaacagaagtcaaagaaagagaaaataag agacaaaatacgtgataactagaggatcagtctaggaggcccaatactcgaagacaaagttccaggaagagtttggagaaaatgagataaagaatatcattgaagtaataacatgagaatttactggaagagaaaaaaaatgagttttcagactgaaaggacctctcccgccacctgactgtccagcacaataaaacacatataccccaagatacatcaccacaacatttcagacaactgagaacaaagtggagatcataaatatttccagaaataaaaaacaggccacaaatagat cagacaaccatatgtcactagacttctcaacaacaccagacaccagaagaaaatggaatggctttaatatgctgaagaaagattagtttaacctagaattctatatccaatcaaactattaatcaaatgagagaggggtgaaataaacacattttcagccatgcatcctctcagaaagatttaccaaaccaagttaggtgattattttcaagaaaataaaaagtaattgtacaagaaaaattaaaatacacacgattcgtatttacattgttatgaaaaacaagaataagatttaca ttgttataaaaatataaatacaactattaataatagtaatctacaactcgattactataatcaaacattgtgtaatagaaggatagagaagaagaacatggaggcagagctgtgaggagttttaagtgagtaaaattctcacgtttgatagtaacaagtcaattgataatctctaactcaataaaaaataagatttagtagtaaaattttatcatttagaaaatgaagtgaaatactagcattaagggtagtaaaagttaacagtacttgtctctgggtagctgggatcaagggtgg gaaagaggtgagagaagggaccacaggttttcattataatcattgtagaactttttaatttttaaaacagtgcctacattttgtttcttaaataacttcaaaaagagcatgaagcaagggctttgatggcatgaacacatagggttgaggaagttcctttatgctttggtgtaaggaagataaaatgatattccaagaaacagggtgacctctgaattccacgatgcattgaggaacgtgtaggctgtgccagcaatgccagaggcacatagaaaggaatatgcactctagtttaaa taactacacagaaagtttttaaaacattcacctggatcagaaactgctttctctgccagaactcttgcctgagtccagccagggaataccatctgtcagatatctaggcctgtggtatggctttgctgtgtccccacccaagactcatcttgaattgtagctcccataattcccacatgttgtgggagggacctggtgggaggtaattgaatcataggggcaggtctttcctgtgttgttcttctgatagtgaataaatctcacgacatctgatggttttataaaggggagttcccc tgcacactctctctttgcctgccagcatgtgagatgtaactttactcctcattcatcttccaccatgattctgaggccttcccagccatgtggaattgtgagtccattaaacctcttttctttataaattactcaggctccagtatgtctttattagtaccatgagaacagactaatacaacctggatcagagaaccaaattttgcaaaatggaagaaaaaataattgaagagatggaagaggatgcagggaagacataggcatagggaaaagagtgggagagatcatgaattgatc atttattgcttgcctgccatgtttcaggtcactgtacttaagcatactacctccacgataacgtatattctcacatcacaataattaggcatttctattatctccattttaccaacaagaaagctggaattctgaggagtgaacttgcctgaccaaagccacaccattaacaaacggtggggcttggatttgagccaagtctgacagatgccaaagtctcctgtgccatgacagagaaaaagaaacccaaacaaacaagtttcccgtgcttcctgggcatattaaaatgtcaggttt gttgtgtgtttgctttttaaaattgtaggaaaatatgcttaacataaaattgaccattttaaccatttcagtgtatacaattcagcagcactaagtacattcacaatatttgcaattgtcattactatttccagaacttatttatcatcccaaacagaaactctgtacattaaacaataacaactccctattccccacttccccagcttctgctaaattctattttactttctgactcattgaatttgtctagtctacttacctaatataagtggaattgtataatatttatccttt tgtgccctgcttttgtgtttggcttaatttgcatgtggcttgttaagtataatgttttcaagattcatccttgtaacatgcatcagaatgtcattcctttcaaaggctaaataatattccattgtatgtatgtaatacagtttttttatccatgcatctgttgatggacatttgggttatttttattttttggctatcgtgaataatgctgctatgaacattggtgtacaaataaccattcaaatacttgctttcaattctatagtatttatttttaagcctcttgttctcctttga cattattctctaaaagttacactttttctcaaactttttcccaaacccattcttctacccccactccatgcttcaaacatcttcagcccatgaggaaaaaacagtggaaaagtctacttttccagtagctccttgtactctctggacctacttaattaatgatcaacacacttactcctttatttattcatctgacaaatattttgagcactgctgttatgcctgacactgttcctagagcatggatacttcaattaacaaaacaaagatttctgcaaagatcattaagtttacaaa tgaagatcgttaagtttacattctacctgttgatttttctgactcaagtttatcagaacattttcaaatcacagggatgttttcacaggacagaagaaaaggagtcttagtcattcaagaatacaagtttcaagtttgagtgcactgatggaagagaaaacatgaaccttctgaaaagatttggattccttcagaaggatgtgagtgattgacccttacttccctgtcctagagaagagatgaaagcaggaaagcaacaggaggagaaagaagcaagaagatgaagcaagagtcttg gttccagcattagcataacttgctttgataagtcccatttccaggagcaagatataaggtgcctgtatcctttcatcatgatgtttgaaagttgagatttcccagtggtttcactggatgacttagtagaatgcaggcactacatttttgctgaactcaaagtccactgaggattctaaaggaagttttgagtctctaacaagttggaaaagacttttgcaactttgctccatataaaggcacagcctcctacatttttttaagattaaaaaaaaaaaaagaagtcctgccacagca gatacactgctgaatctgcaaacgattttataaagagccatgtctttcttggctctgaagccacttaaaaagcatcaatgccattgcaaactggagcattagattttccccaaaaggcatcgatttggggccagtaactgacatcaactcaaaagcgaatcttggatgactacagacccagctggcctgctggtaacacagtgcaggggttgcttgacatatttagggcaccagttagaatttggcgagaaccaaaccagtatactttcattttttccaggtcaaaatcaagattac aaactgacactgaaaagtgatcttgaagaagtgtgcttccttagtctggacaggaagagtcagaatacaaagaactggttacattcagtgacacataccaacattaatccctctaccaaagcaaaccagggctgccagagtcagcacattatgttctaatacccaaacaacttgactggaaatcaacccccagcaaaacaaacggaaacaggtttaccaacatgacactacctgaatacatgtattagatttgctcttgagcccaggaagcagctggaacagggtttccttgggtcc cttttttttttcttctgccatctaacatctctaaatgtaaattctatctaacctgatatttctgggacagtggtgttctttaggtttccaagttagcataatgtcctcaggcaaggaagtttcaataaatgataattgaaattaattttaaagcctgggttatccccaagaaaattttataatgaaaatgttcaacggacaccttccctttggagggccttaggacataagaaggaaaaacacaagctaagatatgaaggaaggaagtagaaagcttcctcaatgaggtacaaacat ggtatactgcaaggtgatctcagttacactggaggagccaagtatgacttgctctttgggccaacctagggtgactaacccacgcacaccctctgcaaccagcacctaataaataacaagaggctcccagcctctgagccctggttatgtagaggatcctgaaccctctttccctccttgcaatccttattcctaacttcctcctctgttcttgtgtttacttgctgcctgacccatgggtatcatcctctattccaccctcactcacttttggaggagctttactccttctattgg tccttttggtacctaagctcagactctccctgctttagaacctatagcctatttttcccaggcaagccactgacttataggtgggtgcctctcagctccatggggaaacttaggctacacatccaacgttcttcactccagattatactattataggtgacctccacaggcactgacattaggatcactgtgctaacgtaccacattaaaggaagtagagagctacatgggagaatacattctgaccttggatttagataacttgagttccacccttagctacctatcttttacagg ctatgtgaccatattacttggtaaattcaaacttcacttcttagcacacaaggtcctttactgtggcattcctgacttttttttttttttctttttttttaaactgagtctcgctctgttgccaggctggagtgcagtggtgcaatcttggctcactgcaacctccacctcccggtttcaagtgattctcctgcctcagcctcccaagtagctgggactacaggcgcacgccaccacacccagctaatttttgtatttttagtagagacggggtttcaccatgttggccaggatggt ctcaatcttttgacctcatgatccacccacctcagcctcccaaaatgctggcattacaggcataagccaccgtgcccagccctgacaattttttttatttcaccaccacctatcactgcctccatcacttcattcaattcagccacacagccccagtgataattgctcatgctctggtaaaccctagtagcttttgtggatgttttttcttcagccttaactgcacttcccctcacttctccttgtcctactcgtcctttgaaacacatctcagatgccatcagtagaaaaccttct ccatcactatgccatcatcatcatcactatctctcgcctcctcctctgggtttcttttctggaatcattgatgtacacatctgctttccccaatggactgtaaactcttcagagtcaggcactgtgctgtatttttttttttcttttttttagacagagtcccattctgtcacccaggctggagtacagtggagcaatctcagctcactgcaaactccacctcctgggttcaagcagttctcatatctcagcctcctgagtagatgggattacaagcatgagccaaaacacatggct aatttttgtattttttaatagagacgaggttttaccatgctgcccatgctggtctcaaattcctggcctcaagtgatcctcctgcctcagcctcccaaagtgctgggattacaggcttgagccactgtgtccagcccatatttgattttaacgtcctgtcctgaaatatgcctggaacagagcagtactcaataaatgtctgtagaatgagtaagtgctcacctgcatcccatgcctgctcttaatcctcacaaggtctgtattagtatctcagttggcaaatgaagaaactaaggc ttatcttgtactggctaattatgtgatttcagtcacacaattaaagaatgacagagatgatttgtgaactcaggctggcttgaccctaaaccctgttctcttttcactacatcagccttcttctactgcatggaaccaagctcaatattgaatctgaagtatgcgattaacctcatgtggacttatccttcctatgaagacttctagaccttaacagaatagagtacgccatgtatcactacctccaaccagtagctttaccattgagataggccttctatttgtgaaaagatataa gcccacttttgtactctggtaatataaaatttccatcccatcaaacctataagaaagagagaggaagggcaaatgagtggggaagaaaacacaacagggagaaaagaaagaaaggatttacttatttaagatcaagaaagttaagtcagtccatgactaagaatgtcatgagcacataactcaatggaaagcctccttcgctgcaactggtagaacttgtcaatcaaggttccaaagacccttcctttcaatacaatcacccagttgctctgtttttcttttctttttttgttgaga cagagtttctctctgtcgcccaggctagagtgcggtggctccatctcggctcactgcaagctccgcctcccaggttcacgccattctcctgcctcagcctccccagtagctgggactacaggtgcccaccactgcgcctggctaattttttgtatttttagtagaaacggggtttcaccgtgttagccaggatggtctcgatctcctgacctcgtgatccacccacctcggcctcccaaagtgctgggattagaggcttgagccactgtgcccagcctctgtttttctataacacct tcctttgtgtggctttggacgtctattcttagagttctatggtgccttccataagcaaagattgctttaaaataaaagcatctgagcagagttttggacacctgtcaccagaatcttgggaaaattccatgtaactaagaattaagtttgcagtgtcttttagatgagtgcttaccatgatccactgccaaagtccaaaatgtgtgtgtgtttatgtgtgtttgggattgaaatagagagagatactgtttcatacatctcatctctgtctcaccacagtattatccagcaattaac aaatattgacaagtctaataatagtttatccttggctaatcctataatttgctcccataatactataggctaatcatgtacaggcctgaacttctagcaagcttgcctcagcacccagcttcctgctgtgggtgggacactgagtaaatactgaattgacatttctctattttgaagatactgacacagatgtgagtgctttgcctgtattttattgatttggttattgatgtcaatatcttgttcttgccgtggatttcacaaaaaaaaaattggaatagattccttttgtctgca accataagaaaaataaaagtaaagaaacttcttaaccaaatacagtgttactttgtttcaaagtggaaatattctactacaactatcctcataaatcatttttaaaacagcctggatctgtaatatttcttcacggtttataaaatttgcaatgggaatgccttttcttaaaaaaaaaatactagactcttccccattttagtaaagtttttgcttcttaaaattttccatagcaggagaaaggacaagaaaaatgcctccttattttctacccatgaagctccatgttacagccaa tgagggctctttaattttcaacagccatctgcataaatcctataaaggtaatatattattaggattattttggctacaagtaacaaaacaataaacttatctaaaccataaagaatttaccatttcacttaacaaaaaattttagaagacaagctgcttcggttttgttatctcagaacttctacatgtcaccatgtcaccatggactcagatcctttccatatttctggcccatcactctggtcttagctttcctcaaactgactctctaatgattgcaagatggctgaatagctt caggagtgaagtagacgtgctttctttcaagcaatgggaaggctgctttcttcaaggggtcctatcttatcagtgaggaaacttttctagagccccagtagcactttttccctaattggccagagttcctcattggccagaattaaatcatgtgaccatgctcacaacaatcataagcaagagaaatcaagccactgtaattggttagtgccaccttttagcactaggtctgaagaccatgtcctctgaaacttatggcaaggtggaggagggtagacataatttagacagtaacag agttctgatacaaaggaggaaagaggaatgacttttgaatcagacaagagtctacagcaaatgcaaaaaggaaagtttctgcaatctggtcattttttcatctatttaaccaatgtttcctgtgctttctatgtgccatacactatttgtttttgagatggggtctcacgctgttgctcaggctggagtgcagtggtgagatcatggctcactgcagccccaaactcctgggctcaagctatccagccaactcagcctcctgggtagctgggactataggtgcatgccataatgcct ggctttttttaaaaaacgtttttttagagatgggagtctcactatattgcccaggctggtcttgagctcctaggctaatgtgatcctcccatctcaacctcccatagtgctgggattataggcatgagctaccatgcccaacctgccatactctattctaagtagcaggtgacaccataacaagaaaaagtagatactgcctctgctgtcatggacttcagtctactgagcatttcttgactgtccacattgtgcatagtcccaaagctgcaagggggcttagagagcaaatatcct aaccctctcatttttgaggtaaagaaacaagcctggagtgactaagtcatttgctggacctggatacacctgattttggattatcttcagtttgtgctttttggggcacctgttatcctgggtacaaaagctttttatacatgcaaacagaaattgtcacatgccaactcaaaatatgacttattgtaaaacatttaatgcttcaagagaactatttgctctatgaaatgattcataagattcatttagacagtacctctatgccattaaaatacattttcatttataaaaatagtt catcatctttttggacgtaatcttggtgaatcacaaaaattcaaactgtatacttgtatcctacctcaaaccccatcactctgtcctctccagatctgtgcagtgcaatcaacccctgtgggtagtaagagaaactctgtacccctgatgggtcatttggagccttcagagtcctacaagggatgggtccattgtctactcttttcctctccattctgcacactggtagtaaagacatgcctgtacctacaaattttgtccacatcctctaggatccctattaataggtgattgctt aaaagattcaaaatcacccagagttctgctgtgatctggacattaaaatgtaacagaagtagccaagtctctggttagaaactttacttatatttgtgctgaattgttagttctgattacacttttttgaatttattctacaaacagaatcacagaggtgcacaaatgcaaatgtacaaggatatatgttgcagcattacttacagaaggtagacatcagaaacaatcttaggccagccgcatggtggctcacacctgtaatcccagcactttgggaggctgatgcaggcagatcac ttgaggccaggagatggagaccagcctggccaacatggcaaaaccttttctctactaaaatatgaaaaaattacccaggtgtggtggcatgtgcctgtagtcccagctactagggaggccgaggcaggggaatcacttgaacccgggagccagaggttgcagtgagctgagatcgcgccactgcactccagcttggtgacagagcaaggctcggtctaaaacaaaaaaaaaaaaattagctgggtgtggtggcatgcacctgtggttccagctacttgagaggctaaggtgtaagga tcgcttgagccctggatgtggaggctgcagtgaactgagactgcacaactgcactccaacctgggcaacagtggaaaactctgtctcaaaaaagaaagagatttttttaaaaaagagaaaacaacaacaaaaaagaaacagccttaattctcctcaatgtatcatgacacatgcctgaacatcacatgaccaataaaacaaaagaagtaattctatgaacccacgtggaatgatcaccaagaaaccttaatagaaaaagctcagtgcaggacaatacatatgacatggagcctgttt gcagacaaattaacaaagaaacagaagaaaaatatagtatatctacatgtgcttgaatatgcagggaatgcctgtagaacagcagtcagcaaactggcccaaaggccaacaccagcccactacctgtttttttatttttaaaatatttttaatggttgaaaaaaataaatagaagaataaattcaaaagatgaatataatggcatgaaatatatgaaattcaaatgtcaatgtccatgaaactttcctggaacacagacacactcttttttttttttttttagtggcaagtgccact ctgccctgctaatttttatattcttagtagagacagggtttcaccatgttggtacaggcgccagccaccatgtccggccgacacactcttcatactatccacaaaataatggtagaattgaatagttgtgatgaaaacttcatgacccactaagggtaaaacatttattacctggggctttacagaaaaagtttgtccacccccggtcgaaaggaatttatagcaactaacagctatagtttcctctggggaagggcactggcatttaaaaacaagagcaggaagaagacttaggtt ttactttctacccttttgtgtgtgtgtgtgtgtgtgtgtgtgtgcgtgtatacatatatgtgcgtatatatacatatatacgcacatatatatacacacatatacatatatatatatattttttttttttttttttttttgagacagagtctccctttgtctcccaggagtgcagtggcgcgatcttggctcactgcaacctctgcttcctgggttcaagcgattctcccttcagccttccaagtagctgggattacaggtgcacactgccaggcatggctaatttttgtaatttta gtggagatgggttttcaccatgttgttcacgctggtctctaactgctgaccccaagtgatctgcccacctcggcctcccaaagtgctaggattacaggtgtgagccaccacacccggcctgcatcttgaaattaatatgaacatacttaaaaagaaaatataatgagaaaaataaaagaaatacgattcataccaagtatctgaaaaaaccttaatgagaaaagtgtgtgactttatacataaaaaataatgaaacttataataaagaaggcttgaattaatatagagccatatctt ccatgagtaaatatttgaaagatgctaatttacctccttcccccaccccaagaaaaattcacagaatgatttcttctaaagttataggaaagaataactgagctgaaatatttaaaataattctagaaagcatggcagcaggagaatctagaaagatagtgcattggtgtctcctgcctttcctagacacacagctcctcctcagctttctctcactcccctcagcctagcatccactcaggcagtgaattggcaaaactgcacacacacgttacacacattgcacaccagtgtggt gtgtccaccctctgggccaagtgggagcctgggaggcagaggcagcagaaggtagttccaaagcaaggatctgaagcagccagctcctgggaatagcttgatctcctgagatcgctgaacctctgtagggaaagttgacaaagttgacattggccagtctcgccaggcccagagaagctcatgaggagctgtgagggtggacggagagctccccctgaggctgggaaagccacggagaacctccctcctcctccacccttcctcatgccatgatagggagttgatgacttctcactg cagcccagccagttctcagggtcagatcaccacaccttctgtttctcagacaatctcaccccaccctcaatcccagttaaggtatcctagccactgaactccaatgatcagcaaagaaaaataaccagatgctaagggggctcaacaatcagagacaggaaaaataaacaaggattagctggtccctcatgaaataaaactgactggaacaggcagagggcaatgtactaaaaaaaaaaaaaaaaaaatgaaaaagtaaatgataaaaagagtatttaaagggattcaaattcagca cataacaaaagacttcttagaaaacatgcattcatttttttttaagtcactagatgaatttaaggaaacgatgatcactgatgatattcaaattcaatggcctggaagatcaaaaggataaaataagtatatcctcaaggaaaaaaatacaaaggtctagtaatcttgaggaaaaacataagcagacccaggaaaccagcacgagaagaaaaagaaaagaaaaaagtgaagagatggagaagaagcagaagttaaaaaaaaccttcccttaaaaaaaaaaactgagtttttaaattg aaaatgcctaataaacttcaggcactattatagaaagaagggagacatttatccatattttggcaaaactcccaaacttcaagcatgaagagaaaaccttgaaaagttctgggttgaaaagacccagaaattatcttttttaaagaaaaagataattctataaacttggaaaatcttcattctaatgctagtaaaacagaaataaaagaaaataattacatatttctatcagaaatataagtaagaaaatggtaaatttatgtgaaattttatgcagccaatataaacagtcattaa aatgattccatagttacatggaaaagcacagatgtaaggaaaaacaacacattataaagtaaaatagcaaattatagaatgttatgcagtataattaaaactatttttaaatgttcatgaaaaagatagaataaacaaagattacagtagttgggttagagtcgttagaggaataagcaagataactatagttgggttagtgttgctaatggaattacaggttttattccctgtttcatactttctataatgtaatattttagtaataattttttgagttaatagtttatataaagt tcggcttttgtaaacaaaaaaggagttacatttttaataagtaacacgaagaagtcacagctataatctgtaaacgctaaagggaagttcatacatagcacatgccctgcagctaagccagatgatccaaggctccaggatctatatgccaagagcaaaatcaaagtttaagcttgatattgcttgggggaggggtttgccctaagacttagatgattaaattatttattagaagaaataagagaggtctcaatttccttatttgcctgtatgtttacaccgattcaaaccaaagtt ttagggtaaaatcttgtctctctgaaggcatttccttcgtttcatccatacttactcattaggctcctcagtctatagagtgggagaaagaaacacagcccctgatagttgggagctggctggcactagcagttaggtcttggtattgctactatggaaaacaatgctagacaaggccgttctatcactgagataaagtgagacagaaatacattcaccccatagtcatgtctgagcacagacaaaaataaggccactgtgaaaactaccaaaatatttctctcagcttatgagaga gactatagcttcttaataatcacagctttaatcacactttattcttcctgccttcttgataaaaattcagatacccagtcagaattggcccaattcctgacagcaccgtatccagagcaaactcatgtttccttgaactctctccaaaatcatctaccaccacctcagatcccatcatgtaaacctctcacaccttctctctgtgccttccacctatgtgtccccttgacatgcagcctccctcagtgcaacaggccaagaaaaacccaactcagtttgacttcaggtgcatccctg gtggtctttggctttagagcactgtcaaatggaatcgtatctttattcctggttcttttttttttttttcttttgagacagagtttcactctttcgcccaggctggagtgcaatggtatgatctcagctcaccacaacctccaccccccaggttcaagtggttctcctgcttcagcctcccaagtagctgggattacaggcatgaaccaccatgcctagctaatttttgtattattagtagagacagggttttgccatgttggtcaggctggtcttgaactcctgacctcaggggat ccacccgcctcggcctcccaaagtgctgggattacatgcatgagccaccatggctggcctattcctggcttttgtcgcctttaacacaagcaatcaaaacttacttggcaagccagaattctatttgtaggcttttgccattgctaaattcattgctcattgttatccagtactgatcgatgctcatttaaaagaagcaatatgatgaactgcctgcagcatacgtaatccctttcttcctctaagaccttgaaaatctaaggccttggattaactgaggacttactgtagcctaac tgaattaaactttggtataatgctgtgacagcattcaaaaaacctcatcacttggccactgtgaagatgctgaaaatgccattcttacataaagcagttttagaactctcaggagaaatatacttctttcgataatatcaggaacagttttacttctgagcaatcagtttgtttccattttatatacagtgtgaattgtgtaactgtaaagtttccatttttaagttggtttcttgaaaagtgagccaaatctgtagcaagatgagcgtgctctccgatgtttgcttcattcctggc tccctttaatttatctctgaccttgttttcctttttcaccattgccaaatgtatgttatcttgcttcattttatgtacctgtgtaagcctaaatataccttttaaaaaaaattggaaaggctgtgaagaaagacaattcaagcctgaaatggtgtcataccaattacaaagcagggtacctgtctagcagaaggtgagaacagtggaggagcaattgaaatctgggctttgggggctgggtggagaagggaccacatcaggacactggaggagtggaacttagcaatgtatacggga ggtgcagtgagcaagacaggaaggaaccttgtctgatggtcctgtaaagttcatgccagagagataagccttggaatgcagaagaggagaggaagattggagagaacctagaaaacaaggagcaggagtctaggcttgatgtagatcacatctgtcctttctgtgtgtctaacaaacacaattgcctatgtccccacattcaggagtcagcaatgcaggcggcagaaaggataccgtattagtataatacggggctgttataaccaagtaccacagactgagtggcttacacagcag aaatgtatttcttcacagttctgcaggctagaaatccagaatcaaggtatcagcagagtttatttcttttcaggtctctctcctttgtttgtagattgccaccttctccctatgttttcatatgttcttccttctctgtgtgtctgtatcctaatctcttcttataaggataccagtcatagattggatttgggttcacccaaatgacctcatttaccttaatgacttctttaaagactatctctccaaatatagccacattctgagggattagggattacgacttcagcacatgaa ttttgaaggtacacagttcatcccatgacagggacctgtagtagtttctggagagggcacaaagcagatggcagctaatatccaacgagagtccacatggaaaatgcaatttgtttctgtgagatgcagcacctcctgatggaaggaagttgggaaaaatgagcattttgaagacgcactttccacttaccttggcacctgaaaatcaactagggctcatcttttccaaatacctctaatcaacggcagcaagggagaagggtgaactttgggcataatgaagatgacaaaagaatt ttactgacaatgactatgatgaaaactgtgaacaatttatgattttatcctcagtacaatgagtgataaaggacaggcacacagtgactcacaatagctatgtaattccatcatcactaaggcagaggtaagaacacacacagtgggactgggaatagtcttctgaccttaccttcactctcttccataggagccacattttctggctgacatgtccaaatctctcctctctgttctagttacttaacagaagaagttcatagactttgctaacataccatctcaatatctttaact gggaatgcatcagttgaattctgtaaaagcaggctttgcttactctcaatattccctgtttaaaaaaaaaagttgctggctgcttctgacatgttcccagttaaactcatgctatcctgtatgccgctgagcctctcttcctctctaacctgtttcagattggtttcagcagctgtatgtgcttcatagaaacagaattctctccaaggaaaaaaaacatcatttccagtaaaatcaccaaactccagcctgctatgtgaatggaaggaaatgttacattctttataacaggatgaa ttacttcctgttgtaagtccagtgaaaaacgaatcattggttaggaagaaacatagggcccatgacattttcagtgctacctattatcttctttccaataataactcctgatgttatagtcacttcaacattgagtttgctatattatcaagtaaattcccctcttgcctttactgcaatcctttcaagttgacttttgcttttctgtgctaccccatccatgcaatgtttcatgattggctgctatccctgaaggttatactcattccaagttcagttgactgaggttgccccaat tattattctaaatggatctctttttttcataagataaaaacattatttgaataaaagtggatgtcagatccaatttgagaaggcttaagcttgagaaggagaaaataattggaaactattgagtaaaaggttgaaagtaagaaaattctggttgttgcattcaaggcagatgagtttaggaaaggactgaggagaggaggatgggttgggaggcattcagggcaacccaatcctgaggtgacacttcaagggcttgaattccccaaagctatgagaaatgaaggaccctagaaacaa ggaatcttagagagtggccacagtaaaaggagaaaagaaaataggtcagccaaaaggacaagacaagcgccactgggaaagacggcatcaccaaagttttgaggcacaaaacttttaagaccttatagtccaaactgctttaatgtgatttaatttcgtttatttatttttgagatggagtctcactctatcactcaggctgcagtgcagtggtgcaatctcagctcactgcaacctctgcctcccaggtacaagcgattctcctgcctcagcctcccaagtagctgggattacaag tgtgactcatcactcccagctaatttttgtatttttagtagacatggggtttcaccatgttggccaggctggcctcaaactcctgacctcaagtgatttgccctcctcagcctcctaaagtgctgggattacaggcatgagccaccacacctagccccaaactgcttttattttaaatgcgaattcatgcttcagagttgaattaaatgttacaaaatctatggtcccaaactccacacccctctgctaggagggacaccggaatacaccagcaaggtcatggaggataagatagtc tccacagaaactatttgcctccaaatatctttctttgaacaaccctgtaacccgattagctctctagcctatccccattttgatactgatggggtgaacagctgtgatttatgttgtcactgaaactgttcagcatcaccacctgtctccctccactgagttggtggcactgatgtagtgacactgccctccttggtgggaacaaacaactgccaaaagtctgaagaaataagtccataactttgcccatccagaggagaataggtaaagccaggacacatcctcaagtattttccc ccgatattctcccctcatcccttactaacaaataaatatctggcttctgggttgactttattttttagagcccactatgtaaggtcagattgggcagtgagtgttgaaagatgaaagcaggctggtgagcaggccgactgaggaagcccacacggcctgccttaaattctagtcccaccactttccagctcgcctcgggccattatttaacttctctgagattgagtttcctcatctgtacacacacacacacacacacacacacacacacacacaaaacaaaaagccaagatgata atgcttcctttgcaagacgtaaagaagaaaaatatataattttgacaacataggaaatgctttagaaacagcagcttctactgccattaagagaaatcgtatttcttgaccgttttctttgtgccaggcaatggccgagcactgttgacataaatttcctcatttaatgcccagatctgctttatgcaatagatactattaacctggttcagacaggtacagctattagaccaaaattaattggctcatatgggctggcctcagctgtcacccctagacctgtttttctccaaggtt tcttctagcagatgacaagtgtgtccatctttcaaagacccaggctgggacacttctcaaggaacactgtgatttccctagacttgtatgactttgctgtgaacttgctgggtcgtgtaaagttgttactttggagatagtttggttgctacacttattcagctgcacctcaaagggaactggatgtgtgtttacctcaggtacagttatcctcgctctctgacaagtgaaatgctactttcaagttgttttgttgagaactctgagagctctttaccctcggatcaaggcagaatg ggtaccaatattttaagctacacattggtccatagatagataggtacatagataattagtcaggcttgtccagataaaaaggatcaattgtgcgtgcgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtctctgttgctagttaagatttttctttttgaaggctgggcgctgtggcttatgcctgtaattctaacactttgggaggccgaggcgggcggatcacttgggctcaggagtttgagaccagcctgggcaacatggtgaaaccccatctgtaccaaaaacacaaaaatta tctgggcatggtggtgtatgcctgtggtccgagctacttgggaggctgaggtgaggtggaaggatcacttgagcctgggaggcagaggttgcagtgagccgagacactccagcctgggcgacagagtgaaaccccatctaaaaaaaaaaaaaagaagatttttctttttcagcaccagacttataacctacactttgggatccttccacaaatcagaaggttccctggcccctcataacttctttgcaccactattttttttttttttttttttgagacggagtctggctctgtcgc ccaggctggagggcagtggcatgatcttggctcactgcaagctctgcctcccgggttcacgccattctcctgcctcagcctcccgagtagctgggactacaggcgcccgccaccacgcccggctaactttttgtatttttagtagagacggggtttcaccgtgttagccaggatggtctcgatctcctgacctcgtgatccgcccgcctcggcctcccaaagtgctgggattacaggcgtgagccaccgcgcccggactgcaccactattaatatatccttgtaatttccatcagaa atgtcttcctgagttctatattctgaagccaactagtcatttcctatgtatgaagttatctagcttttctgaccaaaatacagctgagaccttgcctcttctgcttgaaatggaaaaagaaattgcaattagtgtgctagatttacaaaaataaattttaggcctaaagaagtcaagttttgaactttggcttctggtgttagagccgtcattcacatcaccacattctgctgcttcccagtaatgccagctaagtatcattagaaacaatagtgaccagaaagtagaatagaggct accaaggtgggtgaggtgggagtagtgggaaattattgtttaatgggtatagagtttctgtgtaggataatttaaaattttggaaatagtagtaatgattatactacatcatggatatatttcatgtcactgcattgtacagttaaaaatggttaaatgttacatttgttgttgttgttcaaaaggttcaagcaattctcctgcctcagtctcctgactagctgggattacaagcacgtaccatcacgccgcctaatttttgtatttttagtagagacggagtttcaccgtgttggc caggctggtctctgactcctaacctcaaggggtccacctgcctcgacctcccaaagtgctgggattacaggcatgagccaccgcacgtggccaaatgttatgttaggttatatattatgcttacattatacgtattttaccacaataaaaaaatacaccaaaaaataaacagtaattacgacttgttttgcaattcatttaacttattaaagcctccgtttctccatcagtaaaaagggtgacaataacacctaagctcaaaaattgttgtgataattaaactctaatacaccaaaa gcacctagcttggtattttgggggtggttatacagcctatcaccccttcatctgatggcttccatcggctcaacccaccggccaggggtgggctttcagcagctgtgttttaatttgcctaatatggcctgtatgactgtactgtttggcacagagcccactgtggtgctcagcctacgttcattaactttcctttgcccaatgctaatacaacttgagtaccccaaattcaaaaatcaaaactccaaaatgttccaaaatctgaaactgtttgagcactgacatgatgctccaagg aaatactcatttcacatttgggatttgcagatttgggatgctcaacctgtaagtataatgtaaatattccaaaatctgaaaaaaattcaaaactcaaaatacttctgcttctaagcatttcagataagggatactcaacctgtatctccatttatttatactcaccaggctcagctagcggagttgggcaatgtgtgcgctaatgggaagcttctctgttatttaaaagtggtagcacactatctgaaaatccctaacacttaataggtgcataatgaatgtttgttcaactaaatt ggattgaatagatgatagaccaccagggaaccagagaagaatgaggatgtactactcagagacggttcctgatgcacgtatcagggactctcaatccataggggatataaacagtatttgttgttgatgaggcaactatgtttgtggtacacttgattacattccagatttaggctattttttaaaagctcttttatgtgcagttttactaccttgaacaactggagccaatgggaaattggtgtttgggggatcatctgtaatgaagaaaactgcagtaataggtataaaaagcag attcaaaggccacaagttacttaatccccagtttaggtgatgttaattaaaatctgaaaaatggaaataggcattgattgggctcaccttttatttttaaggttgcatagattctattataggaatgatcattacaattatgtaatttaagttacactgcttttaaattcagagcaaggaacataaaactttattccataaatatacaacttctagaggtatacaataatttcattttatattttcataggctaaatgaagaagacagggttgagtgaaagcagaaaagggaataat aaggcaagagagagagacaagagaaaaa 33.000 bp ( ≅ 0,0001% des Genoms) von Chromosom 9 Problem: Wo sind die Gene ? Ist die Komplexität eines Organismus eine Funktion der Zahl der Gene ? # der Gene ΦX174 11 5,700 6,300 S.cerevisiae C.elegans ca. D.melanogaster > 13,000 human 19,000 60,000 20,000 - 100,000 35,000 ??? Wir sind nicht allein vergleichende Genomanalyse ~ 98,5 % der Genome des Menschen und des Schimpansen sind identisch. Wir sind nicht identisch • Alle 500 – 1.000 Basenpaare gibt es Unterschiede -> Variabilität -> Evolution • Unsere Gene werden verschieden stark exprimiert Wir sind nicht identisch (somatische Mutationen) • ☺ Immunglobulin-Gene in den Antikörperproduzierenden Zellen • Mutation –> klonale Selektion in der Krebsentstehung und Entwicklung Gen-Identifizierung (humane) cDNASequenz humane genomische Sequenz genomische Sequenz der Maus,… regulatorische Elemente ? zusätzliches Exon ? Exon 1 DNA (gene)Promotor Exon 2 ... Exon n Transkription hn-RNA spleißen mRNA AAAAAAAAA Protein-kodierende Region poly A tail AA AA A AA AA Zellkern Cytoplasma AAAAAAAAA Protein Translation Mit einer vergleichsweise geringen Zahl von Genen kann eine große Zahl von Proteinen und eine noch größere Zahl von Interaktionen/Funktionen erreicht werden Beispiel: alternatives Spleißen Arbeitsprogramm des Genomprojektes • Sequenzierung der kompletten genomischen DNA • Gen-Identifizierung • Funktionsanalyse und Erforschung von Krankheitsassoziationen ABER: Was ist „Funktion“ ? Beispiel: Enzym Reaktion (Katalyse) Enzym A+B C+D Edukte Produkte OH O Glukose Hexokinase + ATP OPO32O + Glukose-6-phosphat ADP Wie viele Dimensionen sind nötig, ein Gen/Protein zu beschreiben ? Hexokinase 1. katalytische Funktion 2. Stoffwechselweg 3. direktes Zusammenspiel mit anderen Wegen (z.B. Glykolyse - Glukoneogenese) 4. Varianten eines Gens (auf RNA Ebene) 5. Varianten eines Proteins (Modifikationen) 6. Wo in der Zelle / im Gewebe / im Organismus ist das Protein lokalisiert (mögliche Interaktionspartner) 7. Wann ist das Protein vorhanden (Entwicklung / Differenzierung) 8. ... http://www.genome.ad.jp/kegg/ cDNA-Synthese AAAAAAAAA TTTTTTTTT cDNA (einzelsträngig) Reverse Transkriptase ATG TAA AAAAAAAAA TTTTTTTTTT Protein-kodierende Region „open reading frame“ = ORF cDNA (doppelsträngig) Klonierung von „Open Reading Frames“ Full coding cDNA clone PCR amplification ORF attB1 attB1 ORF ORF attB1 attB2 attB2 attL1 entry clone ORF attL2 attB2 P PP tag expression clone ORF Mammalian cell culture sub-cellular localisation and functional assays • protein localisation • protein activity P tag tag expression clone ORF ORF E.coli & baculovirus expression purification • Ab production • protein arrays • protein assays tag tag expression clone ORF Yeast 2-Hybrid & pull-down Mass spec. • protein-protein interaction • protein networks • protein modifications Stephanie Bechtel „unbekanntes“ Gen in vivo Gen für das grün-fluoreszierende Protein „verknüpfen“ in vitro grün-fluoreszierendes Protein sub-zelluläre Lokalisation peroxisomes mitochondria Golgi microtubules ER actin plasma membrane cytoplasm nuclear envelope nucleolus nuclear speckles Zell-Assays zur Analyse des Zell-Zyklus X Bibliothek von Expressionsklonen Zelluläre Assays FACS DAPI: Cell ? identification CFP: ORF automated Microscope Analyse der Gen-Expression Modulatoren des Zellzyklus expression Biological effect Data analysis Automatische Bildanalyse DAPI CFP-ORF Cy5 Anti-BrdU DAPI CFP Cy5 channel channel channel ... ... ... 536 621 258 264 2101 144 694 1732 401 399 1183 120 845 493 219 610 66 297 500 232 421 428 182 120 563 286 332 ...... ... domain structure gene expression profiling gene structure in situ hybridization genomischeSequenz genomic sequence in vivo „known“ gene „bekannte“ Gene DKFZp 586P1422 cDNAs DKFZp 586P1422 DKFZp586P1422 DKFZp564D116 in vitro immuno-histochemistry protein function and disease relation 2000 µm 2000 µm post-translational modification protein localization functional assays protein/antibody arrays protein-protein interaction 6 d o t6 4 A B 2 C 0 D -2 E F -4 G -6 H 1 2 3 4 5 6 7 8 9 10 11 12 X Results FL-cDNA Gene expression (microarrays) Cellular Cellular Protein Cellular effects effects localization effects DKFZpxxx kidney tumor prolif. ER DKFZp434P097 recurrent breast tumor cytoplasm, nucleus DKFZpxxx DKFZpxxx kidney tumor and GIST GIST prolif. mitosis apoptosis prolif. DKFZpxxx prolif. cytoplasm, nucleus ER GIST prolif. nucleus DKFZpx kidney tumor prolif. Golgi DKFZpxxx kidney tumor prolif. ER DKFZpxxx kidney tumor prolif. Nucleus DKFZpxxx kidney tumor prolif. Mitoch. DKFZpxxx kidney tumor prolif. DKFZpxxx kidney tumor prolif. Plasma membrane ER Functional annotation S. pombe hypothetical GTP-binding protein M.musculus coiled-coil transcriptional coactivator Protein assays p42 MAPK CDK2/cyclin E H. sapiens kinase H. sapiens NADH:ubiquinone oxidoreductase H. sapiens testis-specific Y-encoded-like protein H. sapiens intracellular chloride channel M. musculus hypothetical exopeptidase H. sapiens serine protease G. gallus acyltransferase H. sapiens GTPase-activation protein H. sapiens transmembrane protein PKA p42 MAPK Und jetzt können wir alle nach Hause gehen !? Interaktionskarte der Hefe Jeder Kreis symbolisiert einen Proteinkomplex, der sich aus vielen Proteinen zusammensetzt Viele Proteine wirken nicht nur in einem Komplex, sondern in mehreren Gavin, A. -. C. et al. Nature 415 (2002) 141-147 Die Scharzarbeiter unter den Proteinen Moonlighting proteins Phosphoglucose-Isomerase (PGI), ein oft im Cytosol anzutreffendes Enzym. Es katalysiert dort den zweiten Schritt der Glycolyse, die Umwandlung von Glucose-6-phosphat zu Fructose-6-phosphat. "Neuroleukin" ... Cytokin unreife B-Zellen zu Antikörper-produzierenden Zellen heranwachsen. Und Wachstumsfaktor für embryonale Rückenmarksneurone und sensorische Nervenfasern. AMF (autocrine motility factor) ist ... Cytokin bei der Migration von Zellen. DMM (differentiation and maturation mediator) ... Differenzierung von humanen myeloiden Leukämiezellen Dasselbe Protein – viele Namen, weil viele Funktionen Machen alle Gene ein Protein? oder: die „Ignoranz“ der Genomiker RNP Ribozym snoRNA z.B. XIST, roX rRNA tRNA snRNA DNA RNA hnRNA mRNA Protein miRNA lin-4 Diese miRNA steht am Beginn der Entwicklung von der Larve zum erwachsenen C.elegans. Ist zumindest bis zur Maus konserviert. lin-14/lin-28 Larve lin-29 “L/A-switch” Adultus Es gibt noch viel zu tun – aber wir haben die Zeit dazu (oder auch nicht) Süddeutsche Zeitung, 19. Juli 2000