1 Eingebetteten Systemen Biologie Bioinformatik

Werbung
Eingebetteten Systemen
Definition und Eigenschaften
Klassifizierung und Anwendungen
Moore's Gesetz
Evolvable Hardware
Biologie
Bioinformatik
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
1
Christian Igel: Evolutionäre Algorithmen: Optimierung nach den Prinzipien
der biologischen Evolution
Bernd und Lisa Kleinjohann: Eingebettete Systeme Einleitung
Prof. Dr. Andy Schürr: Echtzeitsysteme / Real-Time Systems
Dr. Gang Quan: Introduction of Real-Time Embedded System Design
Prof. Dr.-Ing. Heinz Linnemann: Digitaltechnik und Rechnerarchitektur II
Cohoon, Karro, Liening: Evolutionary Algorithms for Phyical Design of
VLSI Circuits
Dr. Ursula Rost: Biologie + Informatik =Bioinformatik??? Bioinformatics
and Computational Biochemistry European Media Laboratory Heidelberg
Benjamin Lewin Molekularbiologie der Gene Spektrum Lehrbuch
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Ein Computer,
der nicht wie ein Computer aussieht
der mit seiner (technischen) Umgebung zusammenarbeitet
der eine einfache oder gar keine Benutzeroberfläche besitzt
der Teil eines anderen Systems ist
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
2
Kopetz:
Kopetz:
A real-time computer is a computer system in which the correctness of
the system behaviour depends not only on the logical results of the
computation, but also on the physical instant at which these results are
produced.
Broy:
Broy:
Ein eingebettetes System ist eine HW/SW-Einheit, die über Sensoren
und Aktoren mit einem Gesamtsystem verbunden ist und darin
Überwachungs-, Steuerungs- bzw. Regelungsaufgaben übernimmt.
In der Regel handelt es sich um reaktive, häufig auch um hybride
verteilte Systeme mit Echtzeitanforderungen.
Typischerweise sind solche Systeme dem menschlichen Benutzer nicht
direkt sichtbar, er interagiert unbewusst mit dem eingebetteten System.
Hansen:
A computer that does not look like a computer.
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
technisches System, in das ein von Software gesteuertes Rechensystem
eingebettet ist
Rechensystem steuert, regelt oder überwacht meist einen technischen
Prozess. Das Rechensystem ist meist nicht von außen sichtbar
(kein PC mit Tastatur, Bildschirm, ... )
eingebettete Systeme sind oft (glücklicherweise) nicht frei
programmierbar
Benutzungsschnittstellen sind oft sehr speziell oder fehlen ganz
Entwicklungsplattform (development platform) und Zielplattform
(target platform) für Software sind eigentlich immer verschieden
zur Verfügung stehende Hardware-Ressourcen oft sehr beschränkt
(Gründe: Kosten, Energieverbrauch, Gewicht, Platzbeschränkungen, ...)
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
3
Eingebettete Systeme lassen sich grob in 2 Klassen unterscheiden:
reaktive Systeme: Steuerung (Controller)
transformierende Systeme: digitale Signalverarbeitung
in vielen Geräten finden sich beide Klassen
Digitale Signalverarbeitung:
(einfache) mathematische Berechnungen auf einem
Datenstrom, der ein analoges/digitales Signal repräsentiert
Kontrollbasierte
Steuerung technischer Geräte/Anlagen
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
…. Aufwachen …
…. Frühstücken…
… Mit dem Auto fahren….
…. Unterwegs zum Büro….
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
4
… im Büro….
…. wieder zu Hause…
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
"Die Leistung von Computerchips
verdoppelt sich etwa alle 18-24 Monate"
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
5
Bedeutung eingebetteter Systeme für Wirtschaft:
Wettbewerbsvorteile durch Kombination von
Soft- und Hardware (schnellere Realisierung
komplexer Funktionen, ... )
Kosten der eingebetteten Elektronik eines
modernen Flugzeuges mit bis zu 500 Prozessoren
größer 30%, davon 80% für Software
Kostenverteilung im Automotive-Umfeld
ähnlich (inzwischen bis zu 100 Prozessoren)
Nahezu 90% aller elektronischen Bauelemente
werden in eingebetteten Systemen eingesetzt
Prozessormarkt 2003:
200 Mio Prozessoren in PCs und Server
8.000 Mio Prozessoren in eingebetteten Systeme
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Zerlegt einen großen Schaltkreis
in Unterschaltkreise (Blöcke
genannt). Faktoren wie
Blockanzahl Verbindungen
zwischen Blöcken, … werden
berücksichtigt.
Floorplanning: Erstelle einen
Plan für ein gutes Layout.
Platziere die Blöcke frühzeitig,
wenn Details wie Umriss,
Fläche, Position der I/OPins, … noch nicht festgelegt
sind.
Platzierung – Exakte Platzierung der
Module (Module sind z.B. Gatter,
Standardzellen, …). Details des
Designs sind bekannt
und es ist das
Vervollständige
die Verbindungen
Ziel, dieden
gesamten
Flächenund
zwischen
Modulen.
Hierbei
Verbindungskosten
zu minimieren.
werden
Faktoren wie kritische
Pfade,
Leitungsabstände, … berücksichtigt.
Schließt globales und Fein-Routing
Komprimiere das Layout in allen
ein.
Richtungen, um die Chipfläche zu
minimieren.
Wie können Computer bei der Planung von Schaltkreisen, dem Floorplanning, der Platzierung etc. helfen?
Dies alles sind Optimierungsprobleme. Die meisten sind NP-vollständige Probleme.
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
6
Vorteile:
Design Automation
Innovation für Erweiterung der Einsatzbereiche
Gebiete, in denen EH angewendet werden kann:
Automatisierter Entwurf preiswerter Hardware
Bewältigung ungenau spezifizierter Probleme
Erzeugung adaptiver Systeme
Erzeugung fehlertoleranter Systeme
Innovation in kaum verstandenen Designgebieten
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
7
Biologie
Vererbung
Mendels Vererbungslehre
Chromosomen als Träger der genetischen Information
Mikrobiologie
Nukleinsäuren als Speicher der genetischen Information
Semikonservative Replikation der DNA
Proteine
Proteinbiosynthese
Genmutationen
Bioinformatik
Definition
Aufgabengebiete
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Gregor Johann Mendel (1822 – 1884)
- 1843 tritt er im Augustinerkloster ein
- 1844 beginnt er sein Theologiestudium
- er erhält seine Priesterweihe 1847
- bildete sich in Landwirtschaft, Obst- und Weinanbau
- 1848 übernimmt er den Klostergarten
- 1851 – 1853 studiert er Naturwissenschaft
- 1855 beginnt er seine Kreuzungsversuche an Erbsen
- 1865 erscheint sein Werk
„Versuche über Pflanzenhybriden“
- 1900 werden die Ergebnisse anerkannt und er zum
Begründer der Vererbungslehre
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
8
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Bei der Zellteilung strukturiert sich das
genetische Erbmaterial in Chromosomen.
Der Mensch besitzt 23 Chromosomenpaare.
Mann und Frau unterscheiden sich nur im
23. Chromosomenpaar.
Frauen besitzen zwei X-Chromosomen,
Männer ein X- und ein Y-Chromosom.
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
9
Zwei Schwesterchromatiden
Zentromer
Proteingerüst, um das sich ein
Chromatinfaden wickelt
evtl. Satelliten
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
DNA ist der Träger der Gene. Diese
machen nur einen Bruchteil der DNA
aus.
Ein Gen besteht aus mehreren
Einzelteilen (Exons)
Bei der Transkription der DNA in die
mRNA werden die Introns
herausgeschnitten
Eine Teilsequenz aus 3 Nukleotiden
heißt Kodon
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
10
DNA besteht aus einer Abfolge von Nukleotiden,
die jeweils ein Zuckerbaustein, ein
Phosphatbaustein und eine der 4 Basen enthalten:
Guanin, Adenin, Thymin, Cytosin
Paare werden durch Wasserstoffbrückenbindungen
zusammengehalten.
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Ein Produkt eines Gens ist ein Protein
Im menschlichen Körper gibt es über eine Million
verschiedener Proteine
Primärstruktur: Sequenz von Aminosäuren
Es gibt 20 verschiedene Aminosäuren
ACDEFGHIKLMNPQRSTVWY
Jede Aminosäure wird durch 1 bis 6 der 64
Kodons kodiert
Aminosäuren werden durch Peptidbindungen
verbunden
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
11
Proteinstrukturen
Primärstruktur = Aminosäuresequenz
Sekundärstruktur = ergibt sich aus der regelmäßigen
Wasserstoffbrücken-Wechselwirkungen zwischen
Peptidbindungen (α-Helix, β-Faltblatt, coil)
Tertiärstruktur = vollständige dreidimensionale
Anordnung (Konformation) der
Proteinuntereinheiten
Quartärstruktur = Anordnung von
Proteinuntereinheiten räumlich zueinander
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Experimente liefern enorme Datenmengen
Das menschliche Genom enthält » 2 900 000 000 Basenpaare, die ca. 100 000 Gene
bilden (momentane Schätzung)
Die EMBL Sequenz-Datenbank enthält z.Z mehr als 10.2 Millionen GensequenzEinträge mit mehr als
11.1 Mrd. Basenpaaren (Stand 9.1.2001)
Die SWISS-PROT Datenbank enthält z.Z. über 91 000 Protein-Einträge
Trotzdem sind die Datenbank unvollständig: bisher publizierte vollständig sequenzierte
Genome:
31 Bakterien, 8 Achaea, 3 Eukaryoten
Daten sind sehr komplex
Proteine enthalten Teilstrukturen mit unterschiedlicher Bedeutung, die für
ihre Funktion wesentlich sind
Aktivitäten in der Zelle sind durch vielfältige Abhängigkeiten geprägt, die
z.Z. nur in sehr geringem Umfang bekannt sind
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
12
Anormaler Entwicklungsweg
Normal: Zuerst die akademische Disziplin später wirtschaftliche Relevanz
Jedoch war die Bioinformatik schon ein wirtschaftlicher Faktor bevor Sie
gelehrt wurde
Entstehung aus wirtschaftlicher Notwendigkeit:
„altertümliche“ Biologie hatte nur geringe Datenmengen
durch neue Forschungsgebiete (hauptsächlich im mikrobiologischen
Bereich) entstand ein exorbitantes Datenwachstum
durch moderne Hochleistungsrechner können nun auch derartige
Datenmengen verarbeitet werden
Erkenntnis das nur noch automatisierte Verfahren die Datenmengen effektiv
verarbeiten könnten
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Wissenschaft vom Lebendigen
Erscheinungsformen lebender
Systeme,
ihre Beziehungen untereinander
Vorgänge, die sich in ihnen abspielen
+ Informatik
Bioinformatik
Molekularbiologie
Biochemie
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
13
Systematisches Studium von informationsbeschreibenden
und -transformierenden Prozessen in Bezug auf deren
Theorie, Analyse, Entwurf, Implementierung und
Anwendung - (ACM)
Biologie +
Datenstrukturen, Algorithmen, Rechnerarchitektur,
Rechnernetze, Kryptographie, Betriebssysteme, …
Bioinformatik
Algorithmen
Datenbanken
KI
Gabriella Kókai: Computational Intelligence
Bildverarbeitung
Lehrstuhl für Informatik 2
!
"
#
#
$
#
%
& '
(
Biologie + Informatik
„ In der Bioinformatik werden mit Hilfe von Methoden aus der Mathematik und
Informatik biochemische (und hierbei insbesondere genetische) Abläufe in der Zelle
untersucht“
( Prof . H. W. Mewes Institut für Bioinformatik der GSF)
)
Vorgehensweise: Bioinformatik erfordert
interdisziplinäre Zusammenarbeit zwischen
*
*
Naturwissenschaften
(Biologie, Biochemie und Biophysik)
anderen Wissenschaften
(Informatik und Mathematik)
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Biologische
Experimente
Hypothesen
Daten
Datenanalyseund
Verarbeitung
14
Verständnis über die Abläufe in der Zelle erhöhen
Informationen bereitstellen, mit denen Genetic Engineering
ermöglicht wird
)
)
Entwicklung von Medikamenten (z.B. um bestimmte Reaktionen
in der Zelle zu ermöglichen oder zu verhindern)
heilen von genetischen Defekten (bis jetzt noch nicht gelungen)
Fragen beantworten wie z.B.
)
Welche funktionale Bedeutung hat eine bestimmte Gensequenz?
Welche Moleküle können an ein gegebenes Protein binden?
Wie wird ein metabolisches Netzwerk reguliert?
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
)
Teilgebiete der Bioinformatik
Sequenzanalyse (DNA, Proteine)
*
*
*
*
*
Strukturanalyse, Molecular Modelling und Molecular Dynamics
*
*
Assembling
Primer-Design
Genefinding
Sequenzvergleich
Phylogenie
3D-Struktur von Proteinen
Molekülbewegungen
Expressionsdatenanalyse
Simulation
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
15
*
*
*
*
Sequenz-Alignments sind eines der ältesten Forschungsgebiete der Bioinformatik.
„ ... the wholy grail of Bioinformatics... “ (Stan Burt)
Ziel: Die Bereiche der DNA zu finden, die ein Protein kodieren
Sequenz, Struktur, Funktion:
Die Struktur eines Proteins bestimmt seine Funktion
Die Aminosäuresequenz eines Proteins bestimmt seine Struktur
Proteine (oder Teile von Proteinen) mit ähnlicher Aminosäuresequenz haben auch eine ähnliche
Struktur und eine ähnliche Funktion
Probleme:
es gibt viele nichtkodierende Bereiche in Basensequenzen
die Anfänge von kodierenden und nichtkodierenden Bereichen sind schwer zu erkennen
die kodierenden Bereiche sind nicht notwendigerweise verbunden
Lösung: Kombination von Informatikmethoden mit biomechanischen Laboruntersuchungen
*
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
Sequenz/Struktur-Defizit
Anzahl nicht-redundanter
Datenbank-Einträge (x1000)
Sehr große und schnell wachsende Datenmenge
300
Sequenzen
200
100
Strukturen
0
1988
1993
1998
Entwicklung der bekannten
Sequenz- und Strukturdaten
Entwicklung des Datenbestandes
der DNA-Datenbank GenBank
Gabriella Kókai: Computational Intelligence
Quelle: NCBI
Lehrstuhl für Informatik 2
nach: Attwood, Perry-Smith:
Introduction to bioinformatics (1999)
16
Sequenzierung des menschlichen Genoms
Aufschlüsselung der Basen einzelner Chromosomenabschnitte
Suchen von Methoden der Aneinanderreihung einzelner Sequenzen
Erkennen und Schließen der noch unentschlüsselten Bereiche
Vervielfältigung der DNA durch eine PCR (Poplymerase Chain Reaction)
Methoden zur Entschlüsselung von DNA-Information
DNA-Hybridisierungs-Methode
Southern-Blot-Methode
DNA-Fingerprint-Methode
DNA-Sequenzierungs-Methode
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
In Zuge des HGP wurden viele sog. Gen-Datenbanken eingerichtet
Sammlung der Sequenzierungsergebnisse
Hochladen von Ergebnissen durch verschiedene Forschungsgruppen
Probleme der Speicherung:
Finden eines geeigneten Speicherprinzips
Sequenzierung liefert keine 100% richtigen Ergebnisse
Keine Garantie auf Richtigkeit der hochgeladenen Sequenzen
Keine Ordnung in den Sequenzfragmenten
Mehrfachhochladung der gleichen Abschnitte
Mangelnde Absprache zwischen den Forschungsgruppen
Zufällige Auswahl der bei der Sequenzierung
Finden der Lücken im Gesamtgenom
Gewaltige Redundanz
Sequenzierung an verschiedenen „DNA-Arten“ (z.B. c-DNA, transscripierte RNA, …)
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
17
Entwicklung von Such-/Vergleichs- Algorithmen
Mit Hilfe relativer Ähnlichkeit
Problem:
Es gibt sehr ähnliche richtige Sequenzen
Trainingssequenzen sind den Testsequenzen teilweise zu ähnlich
Löschen von irrtümlich als doppelt angesehenen Codes
Durch Gewichtung der Sequenzen
Je verschiedener die Sequenzen desto höher die Gewichtung
Problem:
Fehlerhafte Daten werden meist sehr stark gewichtet
Fehlerhafte Daten bekommen für die weiteren Vorhersagen mehr Bedeutung
Richtige Daten können auf Grund dieser Entwicklung dann als falsch angesehen
werden
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
)
)
)
)
)
Suche nach den Gründen des Wann und Wo eine Transkription
einsetzt
Genaue Modelle für das Splitten den RNA
Suche nach genauen Aufschlüsselung der Verhältnisse von DNA
zu Protein, RNA zu Protein …
Verstehen der genauen Proteinfunktionen
Überlegungen über das Aussehen von Proteininhibitoren
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
18
Entwicklung eingebetteter Systeme und/oder RT-Systeme ist
wichtigstes Anwendungsgebiet an der Schnittstelle von
Elektrotechnik/Informationstechnik und Informatik
... mit herausragender Bedeutung für die wichtigsten deutschen
Industriezweige:
Automatisierungstechnik, Automobilindustrie, Maschinenbau,
Medizintechnik, Telekommunikation, ...
Mendels Vererbungslehre
Mikrobiologie
Die Bioinformatik untersucht biochemische Prozesse in der Zelle mit
Hilfe von Methoden aus der Mathematik und Informatik.
Teilgebiete der Bioinformatik
Gabriella Kókai: Computational Intelligence
Lehrstuhl für Informatik 2
19
Herunterladen