SW-V12-Proteomics - Chair of Computational Biology

Werbung
V12 Bioinformatik-Tools für HT Proteinanalyse
traditionelle Ansätze: reduktionistisch; finde einzelne Gene und die kodierten
Proteinprodukte, die einen beobachteten Phänotyp definieren.
Oft werden hierdurch komplexe Systeme zu stark vereinfacht.
Hoch-Durchsatzmethoden: parallele Untersuchung vieler gleichzeitiger Vorgänge
omics-Welt: Genomics, Proteomics, Metabolomics, Transcriptomics ...
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
1
Wie soll man das Proteom untersuchen?
Proteomics zerfällt
derzeit in 2 Bereiche
Expression Proteomics
- katalogisiere alle Proteine in
einer Probe
- differentielle Expression:
Unterschied zwischen mehreren Proben
12. Vorlesung WS 2004/05
Cell-map Proteomics
- Protein-Protein Wechselwirkung
- Protein-Liganden Wechselwirkung
- zelluläre Lokalisation
Softwarewerkzeuge der Bioinformatik
2
Expressions-Proteomik
Das zelluläre Proteom enthält 10.000ende von Proteinen,
deren Konzentrationen mehr als 106 fach verschieden sind.
Prof. Walter (UdS)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
3
Technologien in Proteomics
Separation von Proteinen
- 2-D gel Elektrophorese
- Flüssig-Chromatographie
- Affinitäts-Chromatographie
Annotation einzelner Proteine
- Massenspektroskopie
- kombinierte HPLC und MS
- Protein-Quantifizierung mit MS
Protein-Chips
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
4
Proteinanalyse auf einer proteomischen Skala
Phizicky et al. Nature 422, 208 (200)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
5
Analytische versus funktionelle Protein-Microarrays
(a) analytische Microarrays:
beobachte Proteinexpression und
klinische Diagnostik. Vergleiche
Proteinproben zweier biologischer
Zustände, wobei die Protein
entweder mit einem grünen oder
mit einem roten Farbstoff gelabelt
werden. Wenn eine Farbe
überwiegt, liegt das Protein
vornehmlich in dem
entsprechenden Zustand vor.
(b) funktionelle Microarrays: visualisieren Proteinaktivität, -bindung oder
posttranslationelle Modifikationen. Auch geeignet um Substrat- oder Inhibitorbindung an Enzyme zu messen und zur Konstruktion biologischer Netzwerke.
Phizicky et al. Nature 422, 208 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
6
Yeast Two-Hybrid Methoden
(a) die DNA-bindende und die
Aktivierungsdomänen (Kreise)
sind an die Protein X und Y
fusioniert. Genexpression des
Reporters beginnt.
(b) Standard-2YH-Suche von X
gegen eine komplexe Bibliothek von
zufälligen, mit Y fusionierten PeptidSchnipseln.
(c) 2YH-Array. Screene X gegen
komplette Satz von ORFs.
Phizicky et al. Nature 422, 208 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
7
Fluoreszenz entdeckt posttranslationelle Modifikationen
(c) Fluoreszenz-Resonanz-Energietransfer
(FRET) zwischen grünem GFP und Farbstoffmolekül nur wenn gelbes Protein – ein
Antikörper gegen phosphorylierte Tyrosin-reste an rotes Protein gebunden ist. FRET ist stark
distanzabhängig, Detektion bis 6 nm Abstand.
Bindung (rechts) führt zu schnellerem Abfall der
Fluoreszenz (unten).
(b) In vivo Beispiel. Farbkodierung des Gewebes
gemäss Fluoreszenzdauer des GFP-Signals 
wieviel phosphoryliertes Tyrosin besitzt rotes
Protein?
(a) cDNA-Scan. Jeder Punkt enthält Zellen, bei
denen GFP an unterschiedliche (rote) Proteine
fusioniert ist.
12. Vorlesung WS 2004/05
Phizicky et al. Nature 422, 208 (2003)
Softwarewerkzeuge der Bioinformatik
8
Disease Proteomics
Hanash, Nature 422, 226
- entdecke veränderte Proteinexpression nicht nur in Zellen bzw. Geweben,
sondern auch in Subzellulären Strukturen, in Proteinkomplexen und in
biologischen Flüssigkeiten
- entwickle neue Biomarker für Diagnose und Früherkennung von Krankheiten
- identifiziere neue Targets für Therapieansätze
- beschleunige die Entwicklung von Medikamenten
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
9
Zweidimensionale Gelelektrophorese (2D PAGE)
2D Polyacrylamid-Gel für ein BiopsieProbe mit menschlicher Leber.
In x-Richtung – nichtlinearer pHGradient - geschieht eine Auftrennung
nach dem isoelektrischen Punkt
(bei welchem pH ist die Ladung des
Proteins neutral?).
In y-Richtung geschieht durch Variation
des Anteils an Polyacrylamid eine
Trennung nach der molekularen Masse.
Problem: man kann nur Proteine
visualisieren, die relativ häufig
vorkommen.
12. Vorlesung WS 2004/05
Banks et al. Lancet 356, 1749 (2000)
Softwarewerkzeuge der Bioinformatik
10
Annotation von 2D-Gelen: mühsam
Banks et al. Lancet 356, 1749 (2000)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
11
Fallstudie: Expressions-Proteomik
Proteine des
Rinderherzen:
welche Proteine sind
im Herzen von
Rindern mit einer
vererbten
Kardiomyopathie
reduziert?
Die Balken 1-6 stammen von Kardiomyopathie-diagnostizierten Rindern, 7-12
von gesunden Rindern. 13-16 sind Rinder, die selbst klinisch normal sind, aber
von kranken Rindern abstammen (nur SPP 943 ist deutlich abgesenkt).
Banks et al. Lancet 356, 1749 (2000)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
12
(Bio)informatische Aufgaben bei Analyse von 2D-Gelen
Zwei Gele stimmen oft in Grösse,
Kontrast, Auftrennung in x- und
y-Richtung nicht überein.
Darüberhinaus treten Unterschied
als Folge der experimentellen
Bedingungen auf.
Der Vergleich zweier Gele erfordert
daher oft Methoden der Bildbearbeitung,
z.B. mit dem Programm Flicker
http://www-lecb.ncifcrf.gov/flicker/
Eine Laplace-Transformation
verbessert die Übereinstimmung
zwischen dem linken und rechten
Gel erheblich in (b) gegenüber (a).
12. Vorlesung WS 2004/05
Lemkin PF, Electrophoresis, 18, 461-470 (1997)
Softwarewerkzeuge der Bioinformatik
13
Fraktionierung der Probe vor 2D PAGE-Analyse
Oft gibt es das Problem, dass die Proteineigenschaften über einen sehr grossen Bereich
variieren.
Lösung: konzentriere auf Teil der Proteine.
z.B. (a) versehe die ansonsten schwer detektierbaren Proteine an der Membranoberfläche
mit einem Biotin ‚Anker‘ (tag).
Auftrennung in 2D-Gel. Erkenne die markierten
Proteine mit Avidin. Identifikation mit MS.
(b) Getrennte Visualisierung der markierten
Proteine (oben) gegenüber der Darstellung
des gesamten Zell-Lysats (unten).
Dies erlaubte die Identifikation neuer Proteine
auf der Oberfläche von Krebszellen.
12. Vorlesung WS 2004/05
Hanash, Nature 422, 226 (2003)
Softwarewerkzeuge der Bioinformatik
14
Einsatz von 2D PAGE-Analyse in medizinischer Diagnose
Die Probleme von 2D Gelen sind,
dass die Methode nicht für grosse Mengen an Proben (HTS) geeignet ist
und relative grosse Probenmengen benötigt.
Die Analyse von klinischen Proben wird durch die Heterogenität des Gewebes
kompliziert.
Hanash, Nature 422, 226 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
15
Direkte Visualisierung der Protein-Verteilung mit MS
Ein gefrorener Schnitt durch
ein Rattengehirn wird mit
einem MALDI MS-Gerät
abgetastet.
Hier: je 15 Spektren für 74 
75 Punkte, gleichzeitige
Aufnahme aller Massen.
Visualisiere den Schnitt
getrennt für verschiedene
Verhältnisse von Masse und
Ladung (jeweils oben rechts
gezeigt).
z.B. ist die Proteindichte für
m/z=6844 recht gering.
Ziel: vergleiche gesundes und krankes Gewebe.
Hanash, Nature 422, 226 (2003)
Aufgabe: Bildverarbeitung
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
16
Functional Proteomics
Konstruktion eines fluoreszenten Liganden für Serin-Hydrolasen.
(b) Messe die Fluoreszenz in gesunden und Krebszellen.
Identifiziere einen Cluster von Protease-Lipasen und Esterasen, deren
Anteil in Krebslinien aus verschiedenen Geweben unterschiedlich ist.
Hanash, Nature 422, 226 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
17
Proteomik mit MS
Aebersold, Mann, Nature 422, 198 (200)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
18
Proteomics mit Massenspektroskopie (MS)
(1) Aufreinigung (SDS-PAGE).
Banden ausschneiden.
(2) Problem: Gesamtmasse eines
Proteins ist nicht aussagekräftig.
Daher Trypsin (Protease)-Verdau 
Peptidschnipsel unterschiedlicher Länge,
diese sind charakteristisch für Protein.
(3) MS-Analyse in Vakuum
(4) Detektion der Massenintensität bei
vorgegebenem Verhältnis von Masse m
und Ladung z.
(5) Weitere Auftrennung der einzelnen
Peptidschnipsel in zweitem MS-Schritt.
Teilweise Sequenzierung möglich.
Aufgabe: Annotation des Proteins aus
Sequenz-Datenbank.
12. Vorlesung WS 2004/05
Tyers, Mann, Nature 422, 193 (2003)
Softwarewerkzeuge der Bioinformatik
19
Sequenzdiversität in der Zelle: Analyse mit MS
Organismus kodiert über das
Genom viele Isoformen.
Identifikation der Proteine durch
Datenbanksuche um die Lücken
der exp. Daten zu füllen.
Sequenz-Datenbanken enthalten
jedoch keine komplette
Information über die natürlich
auftretende Sequenzdiversität.
Rappsilber, Mann, TIBS, 27, 74 (2002)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
20
Iterativer Zyklus in Systems Biology
Tyers, Mann, Nature 422, 193 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
21
Structural Proteomics
Sali, Glaeser, Earnest, Baumeister, Nature 422, 216 (2003)
Ungerichtete Diffusion aller Proteine ist keine geeignete Organisationsform
von biologischen Zellen.
Stattdessen übernehmen stabile oder transient gebildete Proteinkomplexe
viele wichtige zelluläre Funktionen.
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
22
bekannte Proteinstrukturen
Grosse Proteine und Proteinkomplexe sind
in der PDB-Datenbank unterrepräsentiert.
Es wird geschätzt, dass jeder Proteinkomplex
für Hefe ca. 7.5 Proteine enthält.
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
Sali et al. Nature 422, 216 (2003)
23
Struktur grosser Komplexe: Kombination von EM + X-ray
Bioinformatik: docke atomare X-ray Struktur von Tubulin (3.5 Å Auflösung)
in 8Å-EM-Struktur eines Microtubulis.
Sali et al. Nature 422, 216 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
24
Einzel-Partikel-Analyse mit EM
(a) Komplexe von ca. 44 Tripeptidyl-Peptidase II Molekülen auf einer
Oberfläche. Das Bild zeigt verschiedene gemittelte Ansichten von Komplexen,
die jeweils die gleiche Orientierung haben ( Bildverarbeitung).
(b) 3D-Rekonstruktion des TPP II-Komplexes bei 3.3 nm Auflösung.
Verschiedene Blickrichtungen.
Sali et al. Nature 422, 216 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
25
Information über Makromolekülkomplexe
‚Subunit structure‘ : atomare
Auflösung < 3 Å
‘Subunit shape’ : mittlere
Auflösung > 3 Å
‘Subunit contact’: Kenntnis über
direkte Kontakte zwischen Untereinheiten
‘Subunit proximity’: Untereinheiten
müssen nicht in direktem Kontakt
stehen.
graue Boxen kennzeichnet grosse
experimentelle Schwierigkeiten.
Sali et al. Nature 422, 216 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
26
Hybrid-Methoden für Makromolekulare Komplexe
Structural Bioinformatics
(a) Integration
verschiedener ProteinElemente zu einem
Komplex.
(b) Teilweise atomares
Modell des gesamten
Hefe-Ribosoms durch
Fits von atomaren
Modellen für rRNA und
Proteinmodellen in eine
EM-Elektronen-dichteMappe des 80S
Ribosoms.
Sali et al. Nature 422, 216 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
27
Elektronen-Tomographie
(a) Vom Objekt (Mitte) gestreute
Elektronen werden in einem Halbkreis
aufgefangen. Ausserdem wird das Objekt
in kleinen Schritten gedreht.
(b) Rekonstruktion (Mathematik):
Rück-Projektion der bei verschiedenen
Drehwinkeln aufgenommenen Streuinformationen.
Die Überlagerung ergibt ein Tomogramm.
Sali et al. Nature 422, 216 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
28
Science Fiction: “Interaktom” einer Zelle
links: ein Tomogramm einer Zelle stellt im Prinzip ein räumliches Bild des
gesamten Proteoms einer Zelle dar. Allerdings ist die Auflösung begrenzt.
Versuche dann, die „Templates“ einzelner Proteine so anzuordnen, dass
sich eine optimale Übereinstimmung mit dem linken Bild ergibt.
Sali et al. Nature 422, 216 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
29
Software-Tools der Systems Biology:
werden natürlich derzeit intensiv entwickelt
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
30
GeneMAPP
Fettsäure-Abbau-Pfad.
Jede Box stellt ein Gen dar.
Farbkodierung analog zu
Genexpressionsdaten.
Rot bedeutet > 1.2 fach
grössere Expression in
Mäusen mit Kardiomyopathie.
Blau bedeutet > 1.2 fach
geringere Expression.
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
31
Visualisierung von Protein-Wechselwirkungen
Darstellung von 14.000
Wechselwirkungen.
Stark vernetzte Komplexe
sind am Rand gezeigt.
Tyers, Mann, Nature 422, 193 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
32
Fazit: Bioinformatik verbindet Genomics und Proteomics
Bioinformatik bzw. Computational Biology wird ultimativ ein integriertes Bild
des biologischen Systems erlauben.
Tyers, Mann, Nature 422, 193 (2003)
12. Vorlesung WS 2004/05
Softwarewerkzeuge der Bioinformatik
33
Herunterladen