Eingebetteten Systemen Definition und Eigenschaften Klassifizierung und Anwendungen Moore's Gesetz Evolvable Hardware Biologie Bioinformatik Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 1 Christian Igel: Evolutionäre Algorithmen: Optimierung nach den Prinzipien der biologischen Evolution Bernd und Lisa Kleinjohann: Eingebettete Systeme Einleitung Prof. Dr. Andy Schürr: Echtzeitsysteme / Real-Time Systems Dr. Gang Quan: Introduction of Real-Time Embedded System Design Prof. Dr.-Ing. Heinz Linnemann: Digitaltechnik und Rechnerarchitektur II Cohoon, Karro, Liening: Evolutionary Algorithms for Phyical Design of VLSI Circuits Dr. Ursula Rost: Biologie + Informatik =Bioinformatik??? Bioinformatics and Computational Biochemistry European Media Laboratory Heidelberg Benjamin Lewin Molekularbiologie der Gene Spektrum Lehrbuch Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Ein Computer, der nicht wie ein Computer aussieht der mit seiner (technischen) Umgebung zusammenarbeitet der eine einfache oder gar keine Benutzeroberfläche besitzt der Teil eines anderen Systems ist Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 2 Kopetz: Kopetz: A real-time computer is a computer system in which the correctness of the system behaviour depends not only on the logical results of the computation, but also on the physical instant at which these results are produced. Broy: Broy: Ein eingebettetes System ist eine HW/SW-Einheit, die über Sensoren und Aktoren mit einem Gesamtsystem verbunden ist und darin Überwachungs-, Steuerungs- bzw. Regelungsaufgaben übernimmt. In der Regel handelt es sich um reaktive, häufig auch um hybride verteilte Systeme mit Echtzeitanforderungen. Typischerweise sind solche Systeme dem menschlichen Benutzer nicht direkt sichtbar, er interagiert unbewusst mit dem eingebetteten System. Hansen: A computer that does not look like a computer. Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 technisches System, in das ein von Software gesteuertes Rechensystem eingebettet ist Rechensystem steuert, regelt oder überwacht meist einen technischen Prozess. Das Rechensystem ist meist nicht von außen sichtbar (kein PC mit Tastatur, Bildschirm, ... ) eingebettete Systeme sind oft (glücklicherweise) nicht frei programmierbar Benutzungsschnittstellen sind oft sehr speziell oder fehlen ganz Entwicklungsplattform (development platform) und Zielplattform (target platform) für Software sind eigentlich immer verschieden zur Verfügung stehende Hardware-Ressourcen oft sehr beschränkt (Gründe: Kosten, Energieverbrauch, Gewicht, Platzbeschränkungen, ...) Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 3 Eingebettete Systeme lassen sich grob in 2 Klassen unterscheiden: reaktive Systeme: Steuerung (Controller) transformierende Systeme: digitale Signalverarbeitung in vielen Geräten finden sich beide Klassen Digitale Signalverarbeitung: (einfache) mathematische Berechnungen auf einem Datenstrom, der ein analoges/digitales Signal repräsentiert Kontrollbasierte Steuerung technischer Geräte/Anlagen Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 …. Aufwachen … …. Frühstücken… … Mit dem Auto fahren…. …. Unterwegs zum Büro…. Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 4 … im Büro…. …. wieder zu Hause… Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 "Die Leistung von Computerchips verdoppelt sich etwa alle 18-24 Monate" Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 5 Bedeutung eingebetteter Systeme für Wirtschaft: Wettbewerbsvorteile durch Kombination von Soft- und Hardware (schnellere Realisierung komplexer Funktionen, ... ) Kosten der eingebetteten Elektronik eines modernen Flugzeuges mit bis zu 500 Prozessoren größer 30%, davon 80% für Software Kostenverteilung im Automotive-Umfeld ähnlich (inzwischen bis zu 100 Prozessoren) Nahezu 90% aller elektronischen Bauelemente werden in eingebetteten Systemen eingesetzt Prozessormarkt 2003: 200 Mio Prozessoren in PCs und Server 8.000 Mio Prozessoren in eingebetteten Systeme Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Zerlegt einen großen Schaltkreis in Unterschaltkreise (Blöcke genannt). Faktoren wie Blockanzahl Verbindungen zwischen Blöcken, … werden berücksichtigt. Floorplanning: Erstelle einen Plan für ein gutes Layout. Platziere die Blöcke frühzeitig, wenn Details wie Umriss, Fläche, Position der I/OPins, … noch nicht festgelegt sind. Platzierung – Exakte Platzierung der Module (Module sind z.B. Gatter, Standardzellen, …). Details des Designs sind bekannt und es ist das Vervollständige die Verbindungen Ziel, dieden gesamten Flächenund zwischen Modulen. Hierbei Verbindungskosten zu minimieren. werden Faktoren wie kritische Pfade, Leitungsabstände, … berücksichtigt. Schließt globales und Fein-Routing Komprimiere das Layout in allen ein. Richtungen, um die Chipfläche zu minimieren. Wie können Computer bei der Planung von Schaltkreisen, dem Floorplanning, der Platzierung etc. helfen? Dies alles sind Optimierungsprobleme. Die meisten sind NP-vollständige Probleme. Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 6 Vorteile: Design Automation Innovation für Erweiterung der Einsatzbereiche Gebiete, in denen EH angewendet werden kann: Automatisierter Entwurf preiswerter Hardware Bewältigung ungenau spezifizierter Probleme Erzeugung adaptiver Systeme Erzeugung fehlertoleranter Systeme Innovation in kaum verstandenen Designgebieten Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 7 Biologie Vererbung Mendels Vererbungslehre Chromosomen als Träger der genetischen Information Mikrobiologie Nukleinsäuren als Speicher der genetischen Information Semikonservative Replikation der DNA Proteine Proteinbiosynthese Genmutationen Bioinformatik Definition Aufgabengebiete Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Gregor Johann Mendel (1822 – 1884) - 1843 tritt er im Augustinerkloster ein - 1844 beginnt er sein Theologiestudium - er erhält seine Priesterweihe 1847 - bildete sich in Landwirtschaft, Obst- und Weinanbau - 1848 übernimmt er den Klostergarten - 1851 – 1853 studiert er Naturwissenschaft - 1855 beginnt er seine Kreuzungsversuche an Erbsen - 1865 erscheint sein Werk „Versuche über Pflanzenhybriden“ - 1900 werden die Ergebnisse anerkannt und er zum Begründer der Vererbungslehre Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 8 Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Bei der Zellteilung strukturiert sich das genetische Erbmaterial in Chromosomen. Der Mensch besitzt 23 Chromosomenpaare. Mann und Frau unterscheiden sich nur im 23. Chromosomenpaar. Frauen besitzen zwei X-Chromosomen, Männer ein X- und ein Y-Chromosom. Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 9 Zwei Schwesterchromatiden Zentromer Proteingerüst, um das sich ein Chromatinfaden wickelt evtl. Satelliten Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 DNA ist der Träger der Gene. Diese machen nur einen Bruchteil der DNA aus. Ein Gen besteht aus mehreren Einzelteilen (Exons) Bei der Transkription der DNA in die mRNA werden die Introns herausgeschnitten Eine Teilsequenz aus 3 Nukleotiden heißt Kodon Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 10 DNA besteht aus einer Abfolge von Nukleotiden, die jeweils ein Zuckerbaustein, ein Phosphatbaustein und eine der 4 Basen enthalten: Guanin, Adenin, Thymin, Cytosin Paare werden durch Wasserstoffbrückenbindungen zusammengehalten. Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Ein Produkt eines Gens ist ein Protein Im menschlichen Körper gibt es über eine Million verschiedener Proteine Primärstruktur: Sequenz von Aminosäuren Es gibt 20 verschiedene Aminosäuren ACDEFGHIKLMNPQRSTVWY Jede Aminosäure wird durch 1 bis 6 der 64 Kodons kodiert Aminosäuren werden durch Peptidbindungen verbunden Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 11 Proteinstrukturen Primärstruktur = Aminosäuresequenz Sekundärstruktur = ergibt sich aus der regelmäßigen Wasserstoffbrücken-Wechselwirkungen zwischen Peptidbindungen (α-Helix, β-Faltblatt, coil) Tertiärstruktur = vollständige dreidimensionale Anordnung (Konformation) der Proteinuntereinheiten Quartärstruktur = Anordnung von Proteinuntereinheiten räumlich zueinander Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Experimente liefern enorme Datenmengen Das menschliche Genom enthält » 2 900 000 000 Basenpaare, die ca. 100 000 Gene bilden (momentane Schätzung) Die EMBL Sequenz-Datenbank enthält z.Z mehr als 10.2 Millionen GensequenzEinträge mit mehr als 11.1 Mrd. Basenpaaren (Stand 9.1.2001) Die SWISS-PROT Datenbank enthält z.Z. über 91 000 Protein-Einträge Trotzdem sind die Datenbank unvollständig: bisher publizierte vollständig sequenzierte Genome: 31 Bakterien, 8 Achaea, 3 Eukaryoten Daten sind sehr komplex Proteine enthalten Teilstrukturen mit unterschiedlicher Bedeutung, die für ihre Funktion wesentlich sind Aktivitäten in der Zelle sind durch vielfältige Abhängigkeiten geprägt, die z.Z. nur in sehr geringem Umfang bekannt sind Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 12 Anormaler Entwicklungsweg Normal: Zuerst die akademische Disziplin später wirtschaftliche Relevanz Jedoch war die Bioinformatik schon ein wirtschaftlicher Faktor bevor Sie gelehrt wurde Entstehung aus wirtschaftlicher Notwendigkeit: „altertümliche“ Biologie hatte nur geringe Datenmengen durch neue Forschungsgebiete (hauptsächlich im mikrobiologischen Bereich) entstand ein exorbitantes Datenwachstum durch moderne Hochleistungsrechner können nun auch derartige Datenmengen verarbeitet werden Erkenntnis das nur noch automatisierte Verfahren die Datenmengen effektiv verarbeiten könnten Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Wissenschaft vom Lebendigen Erscheinungsformen lebender Systeme, ihre Beziehungen untereinander Vorgänge, die sich in ihnen abspielen + Informatik Bioinformatik Molekularbiologie Biochemie Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 13 Systematisches Studium von informationsbeschreibenden und -transformierenden Prozessen in Bezug auf deren Theorie, Analyse, Entwurf, Implementierung und Anwendung - (ACM) Biologie + Datenstrukturen, Algorithmen, Rechnerarchitektur, Rechnernetze, Kryptographie, Betriebssysteme, … Bioinformatik Algorithmen Datenbanken KI Gabriella Kókai: Computational Intelligence Bildverarbeitung Lehrstuhl für Informatik 2 ! " # # $ # % & ' ( Biologie + Informatik „ In der Bioinformatik werden mit Hilfe von Methoden aus der Mathematik und Informatik biochemische (und hierbei insbesondere genetische) Abläufe in der Zelle untersucht“ ( Prof . H. W. Mewes Institut für Bioinformatik der GSF) ) Vorgehensweise: Bioinformatik erfordert interdisziplinäre Zusammenarbeit zwischen * * Naturwissenschaften (Biologie, Biochemie und Biophysik) anderen Wissenschaften (Informatik und Mathematik) Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Biologische Experimente Hypothesen Daten Datenanalyseund Verarbeitung 14 Verständnis über die Abläufe in der Zelle erhöhen Informationen bereitstellen, mit denen Genetic Engineering ermöglicht wird ) ) Entwicklung von Medikamenten (z.B. um bestimmte Reaktionen in der Zelle zu ermöglichen oder zu verhindern) heilen von genetischen Defekten (bis jetzt noch nicht gelungen) Fragen beantworten wie z.B. ) Welche funktionale Bedeutung hat eine bestimmte Gensequenz? Welche Moleküle können an ein gegebenes Protein binden? Wie wird ein metabolisches Netzwerk reguliert? Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 ) Teilgebiete der Bioinformatik Sequenzanalyse (DNA, Proteine) * * * * * Strukturanalyse, Molecular Modelling und Molecular Dynamics * * Assembling Primer-Design Genefinding Sequenzvergleich Phylogenie 3D-Struktur von Proteinen Molekülbewegungen Expressionsdatenanalyse Simulation Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 15 * * * * Sequenz-Alignments sind eines der ältesten Forschungsgebiete der Bioinformatik. „ ... the wholy grail of Bioinformatics... “ (Stan Burt) Ziel: Die Bereiche der DNA zu finden, die ein Protein kodieren Sequenz, Struktur, Funktion: Die Struktur eines Proteins bestimmt seine Funktion Die Aminosäuresequenz eines Proteins bestimmt seine Struktur Proteine (oder Teile von Proteinen) mit ähnlicher Aminosäuresequenz haben auch eine ähnliche Struktur und eine ähnliche Funktion Probleme: es gibt viele nichtkodierende Bereiche in Basensequenzen die Anfänge von kodierenden und nichtkodierenden Bereichen sind schwer zu erkennen die kodierenden Bereiche sind nicht notwendigerweise verbunden Lösung: Kombination von Informatikmethoden mit biomechanischen Laboruntersuchungen * Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 Sequenz/Struktur-Defizit Anzahl nicht-redundanter Datenbank-Einträge (x1000) Sehr große und schnell wachsende Datenmenge 300 Sequenzen 200 100 Strukturen 0 1988 1993 1998 Entwicklung der bekannten Sequenz- und Strukturdaten Entwicklung des Datenbestandes der DNA-Datenbank GenBank Gabriella Kókai: Computational Intelligence Quelle: NCBI Lehrstuhl für Informatik 2 nach: Attwood, Perry-Smith: Introduction to bioinformatics (1999) 16 Sequenzierung des menschlichen Genoms Aufschlüsselung der Basen einzelner Chromosomenabschnitte Suchen von Methoden der Aneinanderreihung einzelner Sequenzen Erkennen und Schließen der noch unentschlüsselten Bereiche Vervielfältigung der DNA durch eine PCR (Poplymerase Chain Reaction) Methoden zur Entschlüsselung von DNA-Information DNA-Hybridisierungs-Methode Southern-Blot-Methode DNA-Fingerprint-Methode DNA-Sequenzierungs-Methode Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 In Zuge des HGP wurden viele sog. Gen-Datenbanken eingerichtet Sammlung der Sequenzierungsergebnisse Hochladen von Ergebnissen durch verschiedene Forschungsgruppen Probleme der Speicherung: Finden eines geeigneten Speicherprinzips Sequenzierung liefert keine 100% richtigen Ergebnisse Keine Garantie auf Richtigkeit der hochgeladenen Sequenzen Keine Ordnung in den Sequenzfragmenten Mehrfachhochladung der gleichen Abschnitte Mangelnde Absprache zwischen den Forschungsgruppen Zufällige Auswahl der bei der Sequenzierung Finden der Lücken im Gesamtgenom Gewaltige Redundanz Sequenzierung an verschiedenen „DNA-Arten“ (z.B. c-DNA, transscripierte RNA, …) Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 17 Entwicklung von Such-/Vergleichs- Algorithmen Mit Hilfe relativer Ähnlichkeit Problem: Es gibt sehr ähnliche richtige Sequenzen Trainingssequenzen sind den Testsequenzen teilweise zu ähnlich Löschen von irrtümlich als doppelt angesehenen Codes Durch Gewichtung der Sequenzen Je verschiedener die Sequenzen desto höher die Gewichtung Problem: Fehlerhafte Daten werden meist sehr stark gewichtet Fehlerhafte Daten bekommen für die weiteren Vorhersagen mehr Bedeutung Richtige Daten können auf Grund dieser Entwicklung dann als falsch angesehen werden Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 ) ) ) ) ) Suche nach den Gründen des Wann und Wo eine Transkription einsetzt Genaue Modelle für das Splitten den RNA Suche nach genauen Aufschlüsselung der Verhältnisse von DNA zu Protein, RNA zu Protein … Verstehen der genauen Proteinfunktionen Überlegungen über das Aussehen von Proteininhibitoren Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 18 Entwicklung eingebetteter Systeme und/oder RT-Systeme ist wichtigstes Anwendungsgebiet an der Schnittstelle von Elektrotechnik/Informationstechnik und Informatik ... mit herausragender Bedeutung für die wichtigsten deutschen Industriezweige: Automatisierungstechnik, Automobilindustrie, Maschinenbau, Medizintechnik, Telekommunikation, ... Mendels Vererbungslehre Mikrobiologie Die Bioinformatik untersucht biochemische Prozesse in der Zelle mit Hilfe von Methoden aus der Mathematik und Informatik. Teilgebiete der Bioinformatik Gabriella Kókai: Computational Intelligence Lehrstuhl für Informatik 2 19