9RUWUDJ]XU'LSORPDUEHLW 9LVXDOLVLHUXQJLQGHU%LRLQIRUPDWLN DP%HLVSLHOYRQ0LFURDUUD\V bearbeitet von Jan Walburg Einleitung • Abgrenzung der Bereiche • Bioinformatik • Visualisierung • Beschreibung des Aufgabengebietes • Gencode des Menschen 2001 komplett entschlüsselt • Messung von Genexpression mit Microarrays • Möglichkeiten durch Visualisierung von Microarray-Daten 1 Grundlagen • Molekularbiologie • Die DNA als Träger des Erbgutes • Genexpression • Hybridisierung • Microarrays Grundlagen-Molekularbiologie • DNA als Träger des Genoms 2 Grundlagen-Molekularbiologie • Genexpression Der Prozess, bei dem die im Gen codierte Information (Eigenschaft) in die, in der Zelle präsenten und operierenden Strukturen (Enzyme, Proteine, Organellen) übersetzt wird. Transkription *HQRP Translation 7UDQVNULSWRP 3URWHRP Grundlagen-Molekularbiologie • Hybridisierung Jeder Nucleinsäurestrang trägt in sich die Information und Kapazität komplementäre Sequenzen über Bassenpaarung zu erkennen. 3 Grundlagen-Microarrays • Was sind eigentlich Microarrays ? • Wozu benötigt man Microarrays ? Grundlagen-Microarrays • Microarray-Verfahren 4 Visualisierung bei Microarrays • Datenerfassung • Fehlerquellen • Spotterkennung • Vorverarbeitung der Daten • Konstruktion einer Genexpressionsmatrix • Clustern der Daten • Visualisierungstechnik Visualisierung-Datenerfassung • Fehlerquellen • Variation in Lage, Größe und Form • Hintergrundrauschen • Artefakte (mit unterschiedlichen Ursachen) 5 Visualisierung-Datenerfassung • Spoterkennung • Segmentierung des Bildes Einteilung des Bildes mit Hilfe eines regelmäßigen Gitters in Gitterzellen (Rasterquadrate), wobei jeweils ein potentieller Spot in einer Zelle liegen soll. Visualisierung-Datenerfassung • Spotidentifikation Typischer Intensitätsverlauf eines Spots im Querschnitt Anwendung eines Laplace-Filters zur Detektion von Rändern 6 Visualisierung-Datenerfassung • Spotklassifikation • • • Spot kein Spot Unklar Die genaue Klassifikation nach der Spotidentifikation ist notwendig, da bis zu diesem Zeitpunkt noch von einem hypothetischen Spot ausgegangen werden muss. Mit dem Zusammenwirken aller Informationen der Identifikation kann nun eine Aussage (Klassifikation) getroffen werden. Visualisierung-Vorverarbeitung • Konstruktion einer Genexpressionsmatrix Probe Y Ι 11 Ι 1m Ι xy Gen X Ι n1 Ι nm 7 Visualisierung-Vorverarbeitung • Clustern der Daten • Hierbei werden diverse Gruppierungsalgorithmen verwandt, um die Gene entweder anhand ähnlicher oder sogar gleicher Intensitätswerte in der Genexpressionsmatrix zu verbinden. • Oder die Gruppierung erfolgt anhand bekanntermaßen funktional abhängiger Gene. Visualisierung-Technik • Abbildung der Genexpressionsmatrix • Exakte Abbildung der Gitterzellenstruktur der Genexpressionsmatrix • Abbildung von positiver und negativer Genexpression in zwei unterschiedlichen Farben • Abbildung der Fluoreszenzintensität, und somit der Genexpression auf die jeweilige Farbintensität HLJHQWOLFKH9LVXDOLVLHUXQJ(3&/867 8 Schlusswort • Sowohl Microarrays, als auch die vorgestellte Visualisierungstechnik sind mächtige „Werkzeuge“ zur Analyse genetischer und biochemischer Daten. • In Kombination bergen sie ein noch größeres Potential für zukünftige Forschungen. Visualisierung Vielen Dank für Ihre Aufmerksamkeit ! 9