Structural Genomics: Ein CASP/CAFASP Server für Struktur

Werbung
Structural Genomics:
Ein CASP/CAFASP Server
für
Struktur- und Funktionsannotation
Introduction
Protein Structure Prediction and Threading Methods
Applications
Data and Resources
Bioinformatics Practical Course
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
1
Course Objectives
Im Praktikum werden Methoden zur Sequenzanalyse- und Proteinstrukturverhersage
und zur Funktionsannotation theoretisch eingeführt, in praktischen Übungen
behandelt und implementiert.
In der Projektarbeit soll ein vollständiges System entworfen und implementiert werden,
das für gegebene Proteinsequenzen bzw. die open reading frames eines mikrobiellen
Genoms oder einer genomischen Region eines höheren Organismus mögliche Strukturund Funktionsannotationen berechnet und visualisiert.
Dabei sind etablierte Verfahren zu integrieren bzw. zu implementieren und
gegebenenfalls neue Verfahren zu entwickeln.
Letztlich soll das System einer Evaluierung und die verwendeten Methoden
einer kritischen quantitativen Bewertung unterzogen werden, ähnlich wie bei den
weltweit durchgeführten Bioinformatik Experimenten
CASP (http://predictioncenter.llnl.gov/) CAFASP (http://bioinfo.pl/cafasp/)
oder LiveBench (http://bioinfo.pl/LiveBench/).
Ziel ist es, möglichst effizient eine möglichst gute Annotation für möglichst
viele Sequenzen zu bestimmen. Dabei sind der kreativen und innovativen
Anwendung und Kombination aller möglichen Bioinformatikmethoden keine
Grenzen gesetzt.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
3
Kurs-Organisation und Gliederung
Das Praktikum gliedert sich in drei Teile, die jeweils in Projektteams
bearbeitet werden: Vorlesungsteil, Übungsteil, Projektarbeit.
Im Vorlesungsteil werden die wesentliche Bioinformatikansätze zur
Sequenzanalyse und Alignment, zur Proteinstrukturanalyse und
Homologiemodellierung, Ab-initio Strukturvorhersage, zu Threading und
Fold Erkennung, zur Funktionsannotation und zur Proteinklassifikation
sowie entsprechende Tools und Datenbanken vorgestellt und geübt.
Im zweiten Teil des Praktikums werden in einem Seminar-/Übungsteil die
wichtigsten Methoden, Programme, Datenbanken erarbeitet, die sich in den
vergangenen CASP und CAFASP Assessments bewährt haben. Ziel ist hier einen
Überblick über gängige Methoden zu bekommen sowie erfolgreiche Verfahren
zu verstehen und für die Projektarbeit nutzbar zu machen.
In der dritten Phase dient die Projektarbeit dazu, einen funktionsfähigen und
effizienten CASP/CAFASP Server inklusive der Bewertungs- und
Visualisierungskomponenten zu implementieren und anhand realistischer
Beispiele genomischer Regionen und Proteinsequenzen zu evaluieren.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
4
Course Plan and Organization
Di
Do
Di
Do
Di
Do
Di
Do
Di
Do
Di
Do
Di
Do
Di
Do
Di
Do
Di
Do
Di
…
Do
Mo-Fr
Mo+Di
16.10.
18.10.
23.10.
25.10.
30.10.
1.11.
6.11.
8.11.
13.11.
15.11.
20.11.
22.11.
27.11.
29.11.
4.12.
6.12.
11.12.
13.12.
18.12.
20.12.
Vorlesung: Einführung/Softwareentwicklung
Programmieren
Vorlesung: Structure Prediction/Softwareentwicklung
Programmieren
Programmieren
Allerheiligen
Programmieren
Vorlesung: Evaluation
Programmieren
Vorlesung: Datenbanken, Sequenzmethoden und Tools
Vortrag: Gruppe 1 (Protein Domains (Assignment and Prediction...))
Vortrag: Gruppe 2 (Template selection (PSI-BLAST, Profile-Profile-Alignment, Threadin
Vortrag: Gruppe 3 (Alignment optimization (Multi-Template Methods, Background Know
Vortrag: Gruppe 4 (Structure modelling (Side-Chain placement, Loop-Modelling, Modelle
Vortrag: Gruppe 5 (Ab initio structure prediction (Rosetta, TOP7...))
Programmieren
Abnahme Übungs-/Seminarteil
Programmieren
Programmieren
Programmieren
Zwischenabnahme / Zwischenberichte
Weihnachtsferien
8.1.
Programmieren
Programmieren
7.2.
Programmieren
11.2.-15.2. Blockteil
18.2.-19.2. Abhnahmen
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
7
Course Schedule (Today)
12
Donnerstag
14
12
Dienstag
14
Seminar:
Organisation
15:30
15:45
16
17:15
17:30
18
18:15
15:30
15:45
Seminar:
Software
Developm. I
Homework
assignment
16
Gruppenarbeit
CIP-Pool
17:15
17:30
18
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
13
Course Schedule (Next Week)
12
Donnerstag
14
12
Dienstag
14
Softw. Dev. II
Protein
Struc. Pred.
15:30
15:45
16
17:15
17:30
18
18:15
15:30
15:45
Threading
Applications
Data sources
Homework
assignment
16
Gruppenarbeit
CIP-Pool
17:15
17:30
18
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
14
Course Schedule
12
Donnerstag
14
12
Dienstag
14
Seminar:
Sequence
Analysis I
15:30
15:45
16
15:30
15:45
Seminar:
Sequence
Analysis II
17:15
17:30
18
16
Gruppenarbeit
CIP-Pool
17:15
17:30
Übung (-2W)
18
18:15
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
16
Course Schedule
12
Donnerstag
14
12
Dienstag
14
Seminar:
Model
Assessment
15:30
15:45
16
15:30
15:45
Seminar:
Model
Evaluation
17:15
17:30
18
16
Gruppenarbeit
CIP-Pool
17:15
17:30
Übung (-2W)
18
18:15
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
17
Course Schedule
12
Donnerstag
•
14
Seminar:
Organisation
15:30
15:45
16
Seminar:
Software
Developm. I
17:15
17:30
18
Groups present papers in two sessions +
homework assignment/exercises:
1. Seminar-like paper discussion
2. Discussion of methods of use for
the prediction server
3. Define assignments: methods, tools,
modules to be integrated in the
server
4. Discussion of homework in Übung
1. Sample Solutions
2. Discussion
(usefulness, extensions,
improvements, comparison,
evaluation, benchmarking, …)
Übung
18:15
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
18
Course Plan and Organization
•
•
•
Group Building
Teamwork
Group account / CIP Pool (Amalienstr. 17)
•
Teamwork
– concept
– workplan
– cvs
– Make, ant
– jbuilder, eclipse, etc
– BioKit
•
Konzept !
Groups work on
– Seminar part
– Exercises and Example Implementations
– "their" CASP and CAFASP Server
– Group presentation
– Group documentation with individual worksheets
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
21
Groups
•
5 groups with 4(or 5) group members
•
Supervisors:
– Group 1: Lukas Windhager/Ralf Zimmer
– Group 2: Fabian Birzele/Robert Küffner
– Group 3: Robert Küffner/Tobias Petri
– Group 4: Tobias Petri/Fabian Birzele
– Group 5: Fabian Birzele/Lukas Windhager
•
Assistents (Software and programming support)
– NN
– NN
– NN
– Gergely Csaba (Web Services, Infrastructure)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
23
Individual Group Worksheets
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
24
Specification
A Petri Net specification
Protein Sequence
Prediction System/Server
Protein Structure
Model
Protein Annotation
Function
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
25
Praktikumsseite
•
Info von Fabian Birzele:
•
•
User: gobi07
Passwort (bitte verzeiht mir): cool
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
26
Specification
Fasta Format
Protein Sequence
Prediction System/Server
CASP/CAFASP
Format
Protein Structure
Model
Functional Classification /
Pathway /
Cellular Role /
Structure-Function
Relationship
Protein Annotation
Function
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
27
Bioinformatics Workbench – CASP Server
Web page/Browser (HTML/Javascript)
Web Services
CGI scripts (Perl/DBI)
HTTP/(X)HTML/XML
Web Service
Client
Database:
mysql / SQL queries
HTTP
WWW
Unix:
cvs / make
gnutools
Server
CGI scripts (Perl)
HTTP Server
HTTP/(X)HTML/XML
Web page/Browser (HTML/Javascript)
Bioinformatics applications:
Java / Perl / C/C++ / ...
Perl/DBI, Java JDBC/URL
Bioinformatics tools: blast, ...
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
28
Biokit: Überblick
biokit.property
biokit.model
biokit.parser biokit.algorithms
biokit.util
biokit.project
Biokit
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
29
Specification
Fasta Format
Protein Sequence
Prediction System/Server
CASP/CAFASP
Format
Protein Structure
Model
Functional Classification /
Pathway /
Cellular Role /
Structure-Function
Relationship
Protein Annotation
Function
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
30
Specification
Complete Genome
Eukaryotic
genomic region
EST/mRNA
sequences
DNA chip
expression
experiment
Gene/Sequence Identification
Protein Sequence
Prediction System/Server
Protein Structure
Model
Protein Annotation
Function
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
31
Accuracies and Applications of Structural Models
D. Baker and A. Sali.
Protein structure prediction
and structural genomics.
Science, 294(5540):93–96,
Oct 2001.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
32
Protein Structure Prediction: Applications
•
•
•
Single targets of disease relevant proteins
Annotation of genomes or genomic regions
(structural genomics)
Proteins from large scale screening experiments
•
CASP Participation
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
33
Protein Structure Prediction: Applications
•
Large-Scale application of structure prediction (i.e. ToPLign/123D)
– Analysis of Yeast, MJ, MG, MT, ... Genomes
– 6 Frame translated genome sequences
– systematic structure prediction / functional annotation
– goal: several thousand ORFs in a couple of hours CPU time
(Parallelizing)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
34
Comparison of different Structure Prediction Methods: Benchmarking
Thiele, Zimmer, Lengauer:
Protein Threading by Recursive Dynamic Programming
Journal of Molecular Biology, 290, 3, 757-779, 1999.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
35
Structure Prediction for Structural Genomics
•
•
•
•
•
•
•
•
•
•
•
Brenner, S. E. and M. Levitt (2000). "Expectations from structural genomics."
Protein Sci 9(1): 197-200.
Eisenstein, E., G. L. Gilliland, et al. (2000). "Biological function made crystal
clear - annotation of hypothetical proteins via structural genomics." Curr
Opin Biotechnol 11(1): 25-30.
Fischer, D. and D. Eisenberg (1997). "Assigning folds to the proteins
encoded by the genome of Mycoplasma genitalium." Proc Natl Acad Sci U S
A 94(22): 11929-34.
Fischer, D. and D. Eisenberg (1999). "Predicting structures for genome
proteins." Curr Opin Struct Biol 9(2): 208-11.
Huynen, M., T. Doerks, et al. (1998). "Homology-based fold predictions for
Mycoplasma genitalium proteins." J Mol Biol 280(3): 323-6.
Kim, S. H. (1998). "Shining a light on structural genomics." Nat Struct Biol 5
Suppl: 643-5.
Kim, S. H., D. H. Shin, et al. (2003). "Structure-based functional inference in
structural genomics." J Struct Funct Genomics 4(2-3): 129-35.
Montelione, G. T. and S. Anderson (1999). "Structural genomics: keystone
for a Human Proteome Project." Nat Struct Biol 6(1): 11-2.
Sanchez, R. and A. Sali (1998). "Large-scale protein structure modeling of
the Saccharomyces cerevisiae genome." Proc Natl Acad Sci U S A 95(23):
13597-602.
Sanchez, R., U. Pieper, et al. (2000). "Protein structure modeling for
structural genomics." Nat Struct Biol 7 Suppl: 986-90.
Zhang, C. and S. H. Kim (2003). "Overview of structural genomics: from
structure to function." Curr Opin Chem Biol 7(1): 28-32.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
36
Structure Prediction for Structural and Functional Genomics
•
•
•
•
•
•
•
•
Balasubramanian S, Harrison P, Hegyi H, Bertone P, Luscombe N, Echols N,
McGarvey P, Zhang Z, Gerstein M. SNPs on human chromosomes 21 and 22 -analysis in terms of protein features and pseudogenes. Pharmacogenomics.
2002 May;3(3):393-402.
Hegyi H, Lin J, Greenbaum D, Gerstein M. Structural genomics analysis:
characteristics of atypical, common, and horizontally transferred folds.
Proteins. 2002 May 1;47(2):126-41.
Harrison PM, Hegyi H, Balasubramanian S, Luscombe NM, Bertone P, Echols
N, Johnson T, Gerstein M. Molecular fossils in the human genome:
identification and analysis of the pseudogenes in chromosomes 21 and 22.
Genome Res. 2002 Feb;12(2):272-80.
Hegyi H, Gerstein M. Annotation transfer for genomics: measuring functional
divergence in multi-domain proteins. Genome Res. 2001 Oct;11(10):1632-40.
Das R, Hegyi H, Gerstein M. Genome analyses of spirochetes: a study of the
protein structures, functions and metabolic pathways in Treponema pallidum
and Borrelia burgdorferi. J Mol Microbiol Biotechnol. 2000 Oct;2(4):387-92.
Gerstein M, Lin J, Hegyi H. Protein folds in the worm genome. Pac Symp
Biocomput. 2000:30-41.
Gerstein M, Hegyi H. Comparing genomes in terms of protein structure:
surveys of a finite parts list. FEMS Microbiol Rev. 1998 Oct;22(4):277-304.
Review.
Hegyi H, Gerstein M. The relationship between protein structure and
function: a comprehensive survey with application to the yeast genome. J
Mol Biol. 1999 Apr 23;288(1):147-64.
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
37
Structural Genomics Analysis: Fold distribution
Hegyi et al, Proteins (2002), Volume 47, Issue 2 (p 126-141)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
38
Structural Templates
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
39
Structure Function Relationships
Top Multifold Functions
The most
versatile
functions
The most
versatile
folds
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
40
Course Plan and Organization: Idea
•
•
•
•
Groups build a "competitive" CASP+CAFASP Server
Learn about
– Protein Sequence Analysis
– Protein Structure Prediction Methods
– Protein Function Annotation
Learn how to use
– sequence analysis tools
– alignment and multiple alignment programs
– threading software
– HMMs
– protein families and fold classes
– homology modeling packages
– side-chain modeling and structure refinement
– model quality check
– evaluation criteria and software
System integration
– software
– groupware
– performance tuning
– handling of data and results
– presentation, formatting
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
41
Bioinformatics Workbench – CASP Server
Web page/Browser (HTML/Javascript)
Web Services
CGI scripts (Perl/DBI)
HTTP/(X)HTML/XML
Web Service
Client
Database:
mysql / SQL queries
HTTP
WWW
Unix:
cvs / make
gnutools
Server
CGI scripts (Perl)
HTTP Server
HTTP/(X)HTML/XML
Web page/Browser (HTML/Javascript)
Bioinformatics applications:
Java / Perl / C/C++ / ...
Perl/DBI, Java JDBC/URL
Bioinformatics tools: blast, ...
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
42
Module and Workflow Specification via Petri Nets
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
43
Petri Net based Workflow and Make System (WFS)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
44
Petri Net based Workflow System (WFS)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
45
Organization, Modules and Interface Specification
CIP Pool
Amalienstr.
BIM Cluster
~ 30 dual processor/
dual core (4-32GB)
Weihenstephan
Parallelization with BioGrid / Workload Distribution
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
46
Course Plan and Organization: Idea
•
•
•
•
•
•
•
Groups build a "competitive" CASP+CAFASP Server
Learn about
– …
Learn how to use
– …
System integration
– …
What are the goals ?
What is the state of the art ?
=> Look at previous CASP competitions !!
– What are the methods used
– which are successful ? Why ?
– which can be readily used ?
– which can easily be implemented ?
– … improved ?
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
48
CASP/CAFASP Publications
Volume 23, Issue 3, 1995
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
49
CASP/CAFASP Information
Current CASP: CASP7
Summer 2006
Issue: ~October 2007
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
50
CASP/CAFASP Publications
Current Issue: CASP6
October 15, 2005
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
51
CASP/CAFASP Publications
Casp5 Issue:
October 15, 2003
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
52
CASP/CAFASP Publications
Volume 23, Issue 3, 1995
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
53
… just published (ahead of print)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
54
… just published (ahead of print)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
55
CASP/CAFASP
Moult, Fidelis, Zemla, Hubbard: Proteins, 2001
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
56
CASP Procedure
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
57
CASP Organisation
•
Organizers
•
Consultancy Groups: Selection of assessors and numerical
evaluation methods
•
Assessors: Judgement of results based on numerical evaluation
•
Asilomar Meeting: Presentation and discussion of results
Usually in Asilomar, Monterey (south of San Francisco), CA,
except for 2004: Meeting in Gaeta (near Rome, Italy)
•
Protein Structure Prediction Center (Lawrence Livermore National
Lab): Target collection+distribution, Data handling, Numerical
evaluation, Website
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
58
CASP Prediction Categories
Categories of target predictions are defined based on
how much knowledge on already known structures can be used
•
Comparative or Homology based modeling
– very close (sequence) relatives to target sequence available
– alignment easy
– construct and refine model
•
Fold Recognition
– no obvious sequence relationship between related sequences of
known structure
– similar folds are known => find it/them
– test similarity of sequence to known structure/fold (Threading)
– build high quality alignment and model
– empirical scoring potentials
•
New Fold Methods (ab initio prediction)
–
–
–
–
–
–
no similarity to known structure/fold
secondary strcuture prediction
fragment assembly
minithreading
ab initio folding and energetics
numerical folding simulations
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
59
CASP: Ressources and Future Developments
•
LLNL Prediction Center Web site
– http://PredictionCenter.llnl.gov/
– http://predictioncenter.llnl.gov/info/ACE_program.html
•
EVA (secondary structure prediction evaluation)
– http://cubic.bioc.columbia.edu/eva
•
LiveBench
– http://bioinfo.pl/LiveBench
•
MaxBench
– Leplae&Hubbard, Bioinformatics, 2001
•
Structural Genomics targets
– http://targetdb.pdb.org
– http://www.nigms.nih.gov/news/reports/airlie_tasks.html
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
60
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
61
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
62
CASP5 in numbers
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
63
CASP6 in numbers
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
64
CASP7 in numbers
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
65
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
66
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
67
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
68
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
69
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
70
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
71
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
72
Today ….
•
Part I
– Introduction and Organisation of the course
– CASP + CAFASP Intro
•
Part II
– Software Development I (Fabian Birzele)
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
73
Next Week …
•
•
Server Organisation
CASP + CAFASP
•
•
CASP categories: Ab initio, threading, homology modelling
Programming: Perl, Java, SQL, Webservices
•
TK Motivating example, Yeast Screening, CASP Results
•
Infrastructure: Genomes, Sequence + Structure Databases,
Structure and Fold Classification (SCOP+CATH)
•
Tools:
– Secstruc prediction, HMM, Threaders …
– Scoring Potentials
– Threading
Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum
74
Herunterladen