Structural Genomics: Ein CASP/CAFASP Server für Struktur- und Funktionsannotation Introduction Protein Structure Prediction and Threading Methods Applications Data and Resources Bioinformatics Practical Course Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 1 Course Objectives Im Praktikum werden Methoden zur Sequenzanalyse- und Proteinstrukturverhersage und zur Funktionsannotation theoretisch eingeführt, in praktischen Übungen behandelt und implementiert. In der Projektarbeit soll ein vollständiges System entworfen und implementiert werden, das für gegebene Proteinsequenzen bzw. die open reading frames eines mikrobiellen Genoms oder einer genomischen Region eines höheren Organismus mögliche Strukturund Funktionsannotationen berechnet und visualisiert. Dabei sind etablierte Verfahren zu integrieren bzw. zu implementieren und gegebenenfalls neue Verfahren zu entwickeln. Letztlich soll das System einer Evaluierung und die verwendeten Methoden einer kritischen quantitativen Bewertung unterzogen werden, ähnlich wie bei den weltweit durchgeführten Bioinformatik Experimenten CASP (http://predictioncenter.llnl.gov/) CAFASP (http://bioinfo.pl/cafasp/) oder LiveBench (http://bioinfo.pl/LiveBench/). Ziel ist es, möglichst effizient eine möglichst gute Annotation für möglichst viele Sequenzen zu bestimmen. Dabei sind der kreativen und innovativen Anwendung und Kombination aller möglichen Bioinformatikmethoden keine Grenzen gesetzt. Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 3 Kurs-Organisation und Gliederung Das Praktikum gliedert sich in drei Teile, die jeweils in Projektteams bearbeitet werden: Vorlesungsteil, Übungsteil, Projektarbeit. Im Vorlesungsteil werden die wesentliche Bioinformatikansätze zur Sequenzanalyse und Alignment, zur Proteinstrukturanalyse und Homologiemodellierung, Ab-initio Strukturvorhersage, zu Threading und Fold Erkennung, zur Funktionsannotation und zur Proteinklassifikation sowie entsprechende Tools und Datenbanken vorgestellt und geübt. Im zweiten Teil des Praktikums werden in einem Seminar-/Übungsteil die wichtigsten Methoden, Programme, Datenbanken erarbeitet, die sich in den vergangenen CASP und CAFASP Assessments bewährt haben. Ziel ist hier einen Überblick über gängige Methoden zu bekommen sowie erfolgreiche Verfahren zu verstehen und für die Projektarbeit nutzbar zu machen. In der dritten Phase dient die Projektarbeit dazu, einen funktionsfähigen und effizienten CASP/CAFASP Server inklusive der Bewertungs- und Visualisierungskomponenten zu implementieren und anhand realistischer Beispiele genomischer Regionen und Proteinsequenzen zu evaluieren. Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 4 Course Plan and Organization Di Do Di Do Di Do Di Do Di Do Di Do Di Do Di Do Di Do Di Do Di … Do Mo-Fr Mo+Di 16.10. 18.10. 23.10. 25.10. 30.10. 1.11. 6.11. 8.11. 13.11. 15.11. 20.11. 22.11. 27.11. 29.11. 4.12. 6.12. 11.12. 13.12. 18.12. 20.12. Vorlesung: Einführung/Softwareentwicklung Programmieren Vorlesung: Structure Prediction/Softwareentwicklung Programmieren Programmieren Allerheiligen Programmieren Vorlesung: Evaluation Programmieren Vorlesung: Datenbanken, Sequenzmethoden und Tools Vortrag: Gruppe 1 (Protein Domains (Assignment and Prediction...)) Vortrag: Gruppe 2 (Template selection (PSI-BLAST, Profile-Profile-Alignment, Threadin Vortrag: Gruppe 3 (Alignment optimization (Multi-Template Methods, Background Know Vortrag: Gruppe 4 (Structure modelling (Side-Chain placement, Loop-Modelling, Modelle Vortrag: Gruppe 5 (Ab initio structure prediction (Rosetta, TOP7...)) Programmieren Abnahme Übungs-/Seminarteil Programmieren Programmieren Programmieren Zwischenabnahme / Zwischenberichte Weihnachtsferien 8.1. Programmieren Programmieren 7.2. Programmieren 11.2.-15.2. Blockteil 18.2.-19.2. Abhnahmen Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 7 Course Schedule (Today) 12 Donnerstag 14 12 Dienstag 14 Seminar: Organisation 15:30 15:45 16 17:15 17:30 18 18:15 15:30 15:45 Seminar: Software Developm. I Homework assignment 16 Gruppenarbeit CIP-Pool 17:15 17:30 18 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 13 Course Schedule (Next Week) 12 Donnerstag 14 12 Dienstag 14 Softw. Dev. II Protein Struc. Pred. 15:30 15:45 16 17:15 17:30 18 18:15 15:30 15:45 Threading Applications Data sources Homework assignment 16 Gruppenarbeit CIP-Pool 17:15 17:30 18 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 14 Course Schedule 12 Donnerstag 14 12 Dienstag 14 Seminar: Sequence Analysis I 15:30 15:45 16 15:30 15:45 Seminar: Sequence Analysis II 17:15 17:30 18 16 Gruppenarbeit CIP-Pool 17:15 17:30 Übung (-2W) 18 18:15 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 16 Course Schedule 12 Donnerstag 14 12 Dienstag 14 Seminar: Model Assessment 15:30 15:45 16 15:30 15:45 Seminar: Model Evaluation 17:15 17:30 18 16 Gruppenarbeit CIP-Pool 17:15 17:30 Übung (-2W) 18 18:15 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 17 Course Schedule 12 Donnerstag • 14 Seminar: Organisation 15:30 15:45 16 Seminar: Software Developm. I 17:15 17:30 18 Groups present papers in two sessions + homework assignment/exercises: 1. Seminar-like paper discussion 2. Discussion of methods of use for the prediction server 3. Define assignments: methods, tools, modules to be integrated in the server 4. Discussion of homework in Übung 1. Sample Solutions 2. Discussion (usefulness, extensions, improvements, comparison, evaluation, benchmarking, …) Übung 18:15 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 18 Course Plan and Organization • • • Group Building Teamwork Group account / CIP Pool (Amalienstr. 17) • Teamwork – concept – workplan – cvs – Make, ant – jbuilder, eclipse, etc – BioKit • Konzept ! Groups work on – Seminar part – Exercises and Example Implementations – "their" CASP and CAFASP Server – Group presentation – Group documentation with individual worksheets Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 21 Groups • 5 groups with 4(or 5) group members • Supervisors: – Group 1: Lukas Windhager/Ralf Zimmer – Group 2: Fabian Birzele/Robert Küffner – Group 3: Robert Küffner/Tobias Petri – Group 4: Tobias Petri/Fabian Birzele – Group 5: Fabian Birzele/Lukas Windhager • Assistents (Software and programming support) – NN – NN – NN – Gergely Csaba (Web Services, Infrastructure) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 23 Individual Group Worksheets Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 24 Specification A Petri Net specification Protein Sequence Prediction System/Server Protein Structure Model Protein Annotation Function Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 25 Praktikumsseite • Info von Fabian Birzele: • • User: gobi07 Passwort (bitte verzeiht mir): cool Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 26 Specification Fasta Format Protein Sequence Prediction System/Server CASP/CAFASP Format Protein Structure Model Functional Classification / Pathway / Cellular Role / Structure-Function Relationship Protein Annotation Function Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 27 Bioinformatics Workbench – CASP Server Web page/Browser (HTML/Javascript) Web Services CGI scripts (Perl/DBI) HTTP/(X)HTML/XML Web Service Client Database: mysql / SQL queries HTTP WWW Unix: cvs / make gnutools Server CGI scripts (Perl) HTTP Server HTTP/(X)HTML/XML Web page/Browser (HTML/Javascript) Bioinformatics applications: Java / Perl / C/C++ / ... Perl/DBI, Java JDBC/URL Bioinformatics tools: blast, ... Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 28 Biokit: Überblick biokit.property biokit.model biokit.parser biokit.algorithms biokit.util biokit.project Biokit Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 29 Specification Fasta Format Protein Sequence Prediction System/Server CASP/CAFASP Format Protein Structure Model Functional Classification / Pathway / Cellular Role / Structure-Function Relationship Protein Annotation Function Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 30 Specification Complete Genome Eukaryotic genomic region EST/mRNA sequences DNA chip expression experiment Gene/Sequence Identification Protein Sequence Prediction System/Server Protein Structure Model Protein Annotation Function Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 31 Accuracies and Applications of Structural Models D. Baker and A. Sali. Protein structure prediction and structural genomics. Science, 294(5540):93–96, Oct 2001. Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 32 Protein Structure Prediction: Applications • • • Single targets of disease relevant proteins Annotation of genomes or genomic regions (structural genomics) Proteins from large scale screening experiments • CASP Participation Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 33 Protein Structure Prediction: Applications • Large-Scale application of structure prediction (i.e. ToPLign/123D) – Analysis of Yeast, MJ, MG, MT, ... Genomes – 6 Frame translated genome sequences – systematic structure prediction / functional annotation – goal: several thousand ORFs in a couple of hours CPU time (Parallelizing) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 34 Comparison of different Structure Prediction Methods: Benchmarking Thiele, Zimmer, Lengauer: Protein Threading by Recursive Dynamic Programming Journal of Molecular Biology, 290, 3, 757-779, 1999. Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 35 Structure Prediction for Structural Genomics • • • • • • • • • • • Brenner, S. E. and M. Levitt (2000). "Expectations from structural genomics." Protein Sci 9(1): 197-200. Eisenstein, E., G. L. Gilliland, et al. (2000). "Biological function made crystal clear - annotation of hypothetical proteins via structural genomics." Curr Opin Biotechnol 11(1): 25-30. Fischer, D. and D. Eisenberg (1997). "Assigning folds to the proteins encoded by the genome of Mycoplasma genitalium." Proc Natl Acad Sci U S A 94(22): 11929-34. Fischer, D. and D. Eisenberg (1999). "Predicting structures for genome proteins." Curr Opin Struct Biol 9(2): 208-11. Huynen, M., T. Doerks, et al. (1998). "Homology-based fold predictions for Mycoplasma genitalium proteins." J Mol Biol 280(3): 323-6. Kim, S. H. (1998). "Shining a light on structural genomics." Nat Struct Biol 5 Suppl: 643-5. Kim, S. H., D. H. Shin, et al. (2003). "Structure-based functional inference in structural genomics." J Struct Funct Genomics 4(2-3): 129-35. Montelione, G. T. and S. Anderson (1999). "Structural genomics: keystone for a Human Proteome Project." Nat Struct Biol 6(1): 11-2. Sanchez, R. and A. Sali (1998). "Large-scale protein structure modeling of the Saccharomyces cerevisiae genome." Proc Natl Acad Sci U S A 95(23): 13597-602. Sanchez, R., U. Pieper, et al. (2000). "Protein structure modeling for structural genomics." Nat Struct Biol 7 Suppl: 986-90. Zhang, C. and S. H. Kim (2003). "Overview of structural genomics: from structure to function." Curr Opin Chem Biol 7(1): 28-32. Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 36 Structure Prediction for Structural and Functional Genomics • • • • • • • • Balasubramanian S, Harrison P, Hegyi H, Bertone P, Luscombe N, Echols N, McGarvey P, Zhang Z, Gerstein M. SNPs on human chromosomes 21 and 22 -analysis in terms of protein features and pseudogenes. Pharmacogenomics. 2002 May;3(3):393-402. Hegyi H, Lin J, Greenbaum D, Gerstein M. Structural genomics analysis: characteristics of atypical, common, and horizontally transferred folds. Proteins. 2002 May 1;47(2):126-41. Harrison PM, Hegyi H, Balasubramanian S, Luscombe NM, Bertone P, Echols N, Johnson T, Gerstein M. Molecular fossils in the human genome: identification and analysis of the pseudogenes in chromosomes 21 and 22. Genome Res. 2002 Feb;12(2):272-80. Hegyi H, Gerstein M. Annotation transfer for genomics: measuring functional divergence in multi-domain proteins. Genome Res. 2001 Oct;11(10):1632-40. Das R, Hegyi H, Gerstein M. Genome analyses of spirochetes: a study of the protein structures, functions and metabolic pathways in Treponema pallidum and Borrelia burgdorferi. J Mol Microbiol Biotechnol. 2000 Oct;2(4):387-92. Gerstein M, Lin J, Hegyi H. Protein folds in the worm genome. Pac Symp Biocomput. 2000:30-41. Gerstein M, Hegyi H. Comparing genomes in terms of protein structure: surveys of a finite parts list. FEMS Microbiol Rev. 1998 Oct;22(4):277-304. Review. Hegyi H, Gerstein M. The relationship between protein structure and function: a comprehensive survey with application to the yeast genome. J Mol Biol. 1999 Apr 23;288(1):147-64. Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 37 Structural Genomics Analysis: Fold distribution Hegyi et al, Proteins (2002), Volume 47, Issue 2 (p 126-141) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 38 Structural Templates Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 39 Structure Function Relationships Top Multifold Functions The most versatile functions The most versatile folds Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 40 Course Plan and Organization: Idea • • • • Groups build a "competitive" CASP+CAFASP Server Learn about – Protein Sequence Analysis – Protein Structure Prediction Methods – Protein Function Annotation Learn how to use – sequence analysis tools – alignment and multiple alignment programs – threading software – HMMs – protein families and fold classes – homology modeling packages – side-chain modeling and structure refinement – model quality check – evaluation criteria and software System integration – software – groupware – performance tuning – handling of data and results – presentation, formatting Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 41 Bioinformatics Workbench – CASP Server Web page/Browser (HTML/Javascript) Web Services CGI scripts (Perl/DBI) HTTP/(X)HTML/XML Web Service Client Database: mysql / SQL queries HTTP WWW Unix: cvs / make gnutools Server CGI scripts (Perl) HTTP Server HTTP/(X)HTML/XML Web page/Browser (HTML/Javascript) Bioinformatics applications: Java / Perl / C/C++ / ... Perl/DBI, Java JDBC/URL Bioinformatics tools: blast, ... Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 42 Module and Workflow Specification via Petri Nets Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 43 Petri Net based Workflow and Make System (WFS) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 44 Petri Net based Workflow System (WFS) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 45 Organization, Modules and Interface Specification CIP Pool Amalienstr. BIM Cluster ~ 30 dual processor/ dual core (4-32GB) Weihenstephan Parallelization with BioGrid / Workload Distribution Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 46 Course Plan and Organization: Idea • • • • • • • Groups build a "competitive" CASP+CAFASP Server Learn about – … Learn how to use – … System integration – … What are the goals ? What is the state of the art ? => Look at previous CASP competitions !! – What are the methods used – which are successful ? Why ? – which can be readily used ? – which can easily be implemented ? – … improved ? Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 48 CASP/CAFASP Publications Volume 23, Issue 3, 1995 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 49 CASP/CAFASP Information Current CASP: CASP7 Summer 2006 Issue: ~October 2007 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 50 CASP/CAFASP Publications Current Issue: CASP6 October 15, 2005 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 51 CASP/CAFASP Publications Casp5 Issue: October 15, 2003 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 52 CASP/CAFASP Publications Volume 23, Issue 3, 1995 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 53 … just published (ahead of print) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 54 … just published (ahead of print) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 55 CASP/CAFASP Moult, Fidelis, Zemla, Hubbard: Proteins, 2001 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 56 CASP Procedure Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 57 CASP Organisation • Organizers • Consultancy Groups: Selection of assessors and numerical evaluation methods • Assessors: Judgement of results based on numerical evaluation • Asilomar Meeting: Presentation and discussion of results Usually in Asilomar, Monterey (south of San Francisco), CA, except for 2004: Meeting in Gaeta (near Rome, Italy) • Protein Structure Prediction Center (Lawrence Livermore National Lab): Target collection+distribution, Data handling, Numerical evaluation, Website Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 58 CASP Prediction Categories Categories of target predictions are defined based on how much knowledge on already known structures can be used • Comparative or Homology based modeling – very close (sequence) relatives to target sequence available – alignment easy – construct and refine model • Fold Recognition – no obvious sequence relationship between related sequences of known structure – similar folds are known => find it/them – test similarity of sequence to known structure/fold (Threading) – build high quality alignment and model – empirical scoring potentials • New Fold Methods (ab initio prediction) – – – – – – no similarity to known structure/fold secondary strcuture prediction fragment assembly minithreading ab initio folding and energetics numerical folding simulations Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 59 CASP: Ressources and Future Developments • LLNL Prediction Center Web site – http://PredictionCenter.llnl.gov/ – http://predictioncenter.llnl.gov/info/ACE_program.html • EVA (secondary structure prediction evaluation) – http://cubic.bioc.columbia.edu/eva • LiveBench – http://bioinfo.pl/LiveBench • MaxBench – Leplae&Hubbard, Bioinformatics, 2001 • Structural Genomics targets – http://targetdb.pdb.org – http://www.nigms.nih.gov/news/reports/airlie_tasks.html Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 60 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 61 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 62 CASP5 in numbers Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 63 CASP6 in numbers Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 64 CASP7 in numbers Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 65 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 66 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 67 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 68 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 69 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 70 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 71 Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 72 Today …. • Part I – Introduction and Organisation of the course – CASP + CAFASP Intro • Part II – Software Development I (Fabian Birzele) Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 73 Next Week … • • Server Organisation CASP + CAFASP • • CASP categories: Ab initio, threading, homology modelling Programming: Perl, Java, SQL, Webservices • TK Motivating example, Yeast Screening, CASP Results • Infrastructure: Genomes, Sequence + Structure Databases, Structure and Fold Classification (SCOP+CATH) • Tools: – Secstruc prediction, HMM, Threaders … – Scoring Potentials – Threading Ralf Zimmer, LMU Institut für Informatik, Lehrstuhl für Praktische Informatik und Bioinformatik, WS 2007/2008: GoBi Praktikum 74