V12 Bioinformatik-Tools für HT Proteinanalyse traditionelle Ansätze: reduktionistisch; finde einzelne Gene und die kodierten Proteinprodukte, die einen beobachteten Phänotyp definieren. Oft werden hierdurch komplexe Systeme zu stark vereinfacht. Hoch-Durchsatzmethoden: parallele Untersuchung vieler gleichzeitiger Vorgänge omics-Welt: Genomics, Proteomics, Metabolomics, Transcriptomics ... 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 1 Wie soll man das Proteom untersuchen? Proteomics zerfällt derzeit in 2 Bereiche Expression Proteomics - katalogisiere alle Proteine in einer Probe - differentielle Expression: Unterschied zwischen mehreren Proben 12. Vorlesung WS 2004/05 Cell-map Proteomics - Protein-Protein Wechselwirkung - Protein-Liganden Wechselwirkung - zelluläre Lokalisation Softwarewerkzeuge der Bioinformatik 2 Expressions-Proteomik Das zelluläre Proteom enthält 10.000ende von Proteinen, deren Konzentrationen mehr als 106 fach verschieden sind. Prof. Walter (UdS) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 3 Technologien in Proteomics Separation von Proteinen - 2-D gel Elektrophorese - Flüssig-Chromatographie - Affinitäts-Chromatographie Annotation einzelner Proteine - Massenspektroskopie - kombinierte HPLC und MS - Protein-Quantifizierung mit MS Protein-Chips 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 4 Proteinanalyse auf einer proteomischen Skala Phizicky et al. Nature 422, 208 (200) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 5 Analytische versus funktionelle Protein-Microarrays (a) analytische Microarrays: beobachte Proteinexpression und klinische Diagnostik. Vergleiche Proteinproben zweier biologischer Zustände, wobei die Protein entweder mit einem grünen oder mit einem roten Farbstoff gelabelt werden. Wenn eine Farbe überwiegt, liegt das Protein vornehmlich in dem entsprechenden Zustand vor. (b) funktionelle Microarrays: visualisieren Proteinaktivität, -bindung oder posttranslationelle Modifikationen. Auch geeignet um Substrat- oder Inhibitorbindung an Enzyme zu messen und zur Konstruktion biologischer Netzwerke. Phizicky et al. Nature 422, 208 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 6 Yeast Two-Hybrid Methoden (a) die DNA-bindende und die Aktivierungsdomänen (Kreise) sind an die Protein X und Y fusioniert. Genexpression des Reporters beginnt. (b) Standard-2YH-Suche von X gegen eine komplexe Bibliothek von zufälligen, mit Y fusionierten PeptidSchnipseln. (c) 2YH-Array. Screene X gegen komplette Satz von ORFs. Phizicky et al. Nature 422, 208 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 7 Fluoreszenz entdeckt posttranslationelle Modifikationen (c) Fluoreszenz-Resonanz-Energietransfer (FRET) zwischen grünem GFP und Farbstoffmolekül nur wenn gelbes Protein – ein Antikörper gegen phosphorylierte Tyrosin-reste an rotes Protein gebunden ist. FRET ist stark distanzabhängig, Detektion bis 6 nm Abstand. Bindung (rechts) führt zu schnellerem Abfall der Fluoreszenz (unten). (b) In vivo Beispiel. Farbkodierung des Gewebes gemäss Fluoreszenzdauer des GFP-Signals wieviel phosphoryliertes Tyrosin besitzt rotes Protein? (a) cDNA-Scan. Jeder Punkt enthält Zellen, bei denen GFP an unterschiedliche (rote) Proteine fusioniert ist. 12. Vorlesung WS 2004/05 Phizicky et al. Nature 422, 208 (2003) Softwarewerkzeuge der Bioinformatik 8 Disease Proteomics Hanash, Nature 422, 226 - entdecke veränderte Proteinexpression nicht nur in Zellen bzw. Geweben, sondern auch in Subzellulären Strukturen, in Proteinkomplexen und in biologischen Flüssigkeiten - entwickle neue Biomarker für Diagnose und Früherkennung von Krankheiten - identifiziere neue Targets für Therapieansätze - beschleunige die Entwicklung von Medikamenten 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 9 Zweidimensionale Gelelektrophorese (2D PAGE) 2D Polyacrylamid-Gel für ein BiopsieProbe mit menschlicher Leber. In x-Richtung – nichtlinearer pHGradient - geschieht eine Auftrennung nach dem isoelektrischen Punkt (bei welchem pH ist die Ladung des Proteins neutral?). In y-Richtung geschieht durch Variation des Anteils an Polyacrylamid eine Trennung nach der molekularen Masse. Problem: man kann nur Proteine visualisieren, die relativ häufig vorkommen. 12. Vorlesung WS 2004/05 Banks et al. Lancet 356, 1749 (2000) Softwarewerkzeuge der Bioinformatik 10 Annotation von 2D-Gelen: mühsam Banks et al. Lancet 356, 1749 (2000) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 11 Fallstudie: Expressions-Proteomik Proteine des Rinderherzen: welche Proteine sind im Herzen von Rindern mit einer vererbten Kardiomyopathie reduziert? Die Balken 1-6 stammen von Kardiomyopathie-diagnostizierten Rindern, 7-12 von gesunden Rindern. 13-16 sind Rinder, die selbst klinisch normal sind, aber von kranken Rindern abstammen (nur SPP 943 ist deutlich abgesenkt). Banks et al. Lancet 356, 1749 (2000) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 12 (Bio)informatische Aufgaben bei Analyse von 2D-Gelen Zwei Gele stimmen oft in Grösse, Kontrast, Auftrennung in x- und y-Richtung nicht überein. Darüberhinaus treten Unterschied als Folge der experimentellen Bedingungen auf. Der Vergleich zweier Gele erfordert daher oft Methoden der Bildbearbeitung, z.B. mit dem Programm Flicker http://www-lecb.ncifcrf.gov/flicker/ Eine Laplace-Transformation verbessert die Übereinstimmung zwischen dem linken und rechten Gel erheblich in (b) gegenüber (a). 12. Vorlesung WS 2004/05 Lemkin PF, Electrophoresis, 18, 461-470 (1997) Softwarewerkzeuge der Bioinformatik 13 Fraktionierung der Probe vor 2D PAGE-Analyse Oft gibt es das Problem, dass die Proteineigenschaften über einen sehr grossen Bereich variieren. Lösung: konzentriere auf Teil der Proteine. z.B. (a) versehe die ansonsten schwer detektierbaren Proteine an der Membranoberfläche mit einem Biotin ‚Anker‘ (tag). Auftrennung in 2D-Gel. Erkenne die markierten Proteine mit Avidin. Identifikation mit MS. (b) Getrennte Visualisierung der markierten Proteine (oben) gegenüber der Darstellung des gesamten Zell-Lysats (unten). Dies erlaubte die Identifikation neuer Proteine auf der Oberfläche von Krebszellen. 12. Vorlesung WS 2004/05 Hanash, Nature 422, 226 (2003) Softwarewerkzeuge der Bioinformatik 14 Einsatz von 2D PAGE-Analyse in medizinischer Diagnose Die Probleme von 2D Gelen sind, dass die Methode nicht für grosse Mengen an Proben (HTS) geeignet ist und relative grosse Probenmengen benötigt. Die Analyse von klinischen Proben wird durch die Heterogenität des Gewebes kompliziert. Hanash, Nature 422, 226 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 15 Direkte Visualisierung der Protein-Verteilung mit MS Ein gefrorener Schnitt durch ein Rattengehirn wird mit einem MALDI MS-Gerät abgetastet. Hier: je 15 Spektren für 74 75 Punkte, gleichzeitige Aufnahme aller Massen. Visualisiere den Schnitt getrennt für verschiedene Verhältnisse von Masse und Ladung (jeweils oben rechts gezeigt). z.B. ist die Proteindichte für m/z=6844 recht gering. Ziel: vergleiche gesundes und krankes Gewebe. Hanash, Nature 422, 226 (2003) Aufgabe: Bildverarbeitung 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 16 Functional Proteomics Konstruktion eines fluoreszenten Liganden für Serin-Hydrolasen. (b) Messe die Fluoreszenz in gesunden und Krebszellen. Identifiziere einen Cluster von Protease-Lipasen und Esterasen, deren Anteil in Krebslinien aus verschiedenen Geweben unterschiedlich ist. Hanash, Nature 422, 226 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 17 Proteomik mit MS Aebersold, Mann, Nature 422, 198 (200) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 18 Proteomics mit Massenspektroskopie (MS) (1) Aufreinigung (SDS-PAGE). Banden ausschneiden. (2) Problem: Gesamtmasse eines Proteins ist nicht aussagekräftig. Daher Trypsin (Protease)-Verdau Peptidschnipsel unterschiedlicher Länge, diese sind charakteristisch für Protein. (3) MS-Analyse in Vakuum (4) Detektion der Massenintensität bei vorgegebenem Verhältnis von Masse m und Ladung z. (5) Weitere Auftrennung der einzelnen Peptidschnipsel in zweitem MS-Schritt. Teilweise Sequenzierung möglich. Aufgabe: Annotation des Proteins aus Sequenz-Datenbank. 12. Vorlesung WS 2004/05 Tyers, Mann, Nature 422, 193 (2003) Softwarewerkzeuge der Bioinformatik 19 Sequenzdiversität in der Zelle: Analyse mit MS Organismus kodiert über das Genom viele Isoformen. Identifikation der Proteine durch Datenbanksuche um die Lücken der exp. Daten zu füllen. Sequenz-Datenbanken enthalten jedoch keine komplette Information über die natürlich auftretende Sequenzdiversität. Rappsilber, Mann, TIBS, 27, 74 (2002) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 20 Iterativer Zyklus in Systems Biology Tyers, Mann, Nature 422, 193 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 21 Structural Proteomics Sali, Glaeser, Earnest, Baumeister, Nature 422, 216 (2003) Ungerichtete Diffusion aller Proteine ist keine geeignete Organisationsform von biologischen Zellen. Stattdessen übernehmen stabile oder transient gebildete Proteinkomplexe viele wichtige zelluläre Funktionen. 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 22 bekannte Proteinstrukturen Grosse Proteine und Proteinkomplexe sind in der PDB-Datenbank unterrepräsentiert. Es wird geschätzt, dass jeder Proteinkomplex für Hefe ca. 7.5 Proteine enthält. 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik Sali et al. Nature 422, 216 (2003) 23 Struktur grosser Komplexe: Kombination von EM + X-ray Bioinformatik: docke atomare X-ray Struktur von Tubulin (3.5 Å Auflösung) in 8Å-EM-Struktur eines Microtubulis. Sali et al. Nature 422, 216 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 24 Einzel-Partikel-Analyse mit EM (a) Komplexe von ca. 44 Tripeptidyl-Peptidase II Molekülen auf einer Oberfläche. Das Bild zeigt verschiedene gemittelte Ansichten von Komplexen, die jeweils die gleiche Orientierung haben ( Bildverarbeitung). (b) 3D-Rekonstruktion des TPP II-Komplexes bei 3.3 nm Auflösung. Verschiedene Blickrichtungen. Sali et al. Nature 422, 216 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 25 Information über Makromolekülkomplexe ‚Subunit structure‘ : atomare Auflösung < 3 Å ‘Subunit shape’ : mittlere Auflösung > 3 Å ‘Subunit contact’: Kenntnis über direkte Kontakte zwischen Untereinheiten ‘Subunit proximity’: Untereinheiten müssen nicht in direktem Kontakt stehen. graue Boxen kennzeichnet grosse experimentelle Schwierigkeiten. Sali et al. Nature 422, 216 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 26 Hybrid-Methoden für Makromolekulare Komplexe Structural Bioinformatics (a) Integration verschiedener ProteinElemente zu einem Komplex. (b) Teilweise atomares Modell des gesamten Hefe-Ribosoms durch Fits von atomaren Modellen für rRNA und Proteinmodellen in eine EM-Elektronen-dichteMappe des 80S Ribosoms. Sali et al. Nature 422, 216 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 27 Elektronen-Tomographie (a) Vom Objekt (Mitte) gestreute Elektronen werden in einem Halbkreis aufgefangen. Ausserdem wird das Objekt in kleinen Schritten gedreht. (b) Rekonstruktion (Mathematik): Rück-Projektion der bei verschiedenen Drehwinkeln aufgenommenen Streuinformationen. Die Überlagerung ergibt ein Tomogramm. Sali et al. Nature 422, 216 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 28 Science Fiction: “Interaktom” einer Zelle links: ein Tomogramm einer Zelle stellt im Prinzip ein räumliches Bild des gesamten Proteoms einer Zelle dar. Allerdings ist die Auflösung begrenzt. Versuche dann, die „Templates“ einzelner Proteine so anzuordnen, dass sich eine optimale Übereinstimmung mit dem linken Bild ergibt. Sali et al. Nature 422, 216 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 29 Software-Tools der Systems Biology: werden natürlich derzeit intensiv entwickelt 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 30 GeneMAPP Fettsäure-Abbau-Pfad. Jede Box stellt ein Gen dar. Farbkodierung analog zu Genexpressionsdaten. Rot bedeutet > 1.2 fach grössere Expression in Mäusen mit Kardiomyopathie. Blau bedeutet > 1.2 fach geringere Expression. 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 31 Visualisierung von Protein-Wechselwirkungen Darstellung von 14.000 Wechselwirkungen. Stark vernetzte Komplexe sind am Rand gezeigt. Tyers, Mann, Nature 422, 193 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 32 Fazit: Bioinformatik verbindet Genomics und Proteomics Bioinformatik bzw. Computational Biology wird ultimativ ein integriertes Bild des biologischen Systems erlauben. Tyers, Mann, Nature 422, 193 (2003) 12. Vorlesung WS 2004/05 Softwarewerkzeuge der Bioinformatik 33