Vortrag zur Diplomarbeit: Einleitung

Werbung
9RUWUDJ]XU'LSORPDUEHLW
9LVXDOLVLHUXQJLQGHU%LRLQIRUPDWLN
DP%HLVSLHOYRQ0LFURDUUD\V
bearbeitet von Jan Walburg
Einleitung
• Abgrenzung der Bereiche
• Bioinformatik
• Visualisierung
• Beschreibung des Aufgabengebietes
• Gencode des Menschen 2001 komplett
entschlüsselt
• Messung von Genexpression mit Microarrays
• Möglichkeiten durch Visualisierung von
Microarray-Daten
1
Grundlagen
• Molekularbiologie
• Die DNA als Träger des Erbgutes
• Genexpression
• Hybridisierung
• Microarrays
Grundlagen-Molekularbiologie
• DNA als Träger des Genoms
2
Grundlagen-Molekularbiologie
• Genexpression
Der Prozess, bei dem die im Gen codierte Information
(Eigenschaft) in die, in der Zelle präsenten und operierenden
Strukturen (Enzyme, Proteine, Organellen) übersetzt wird.
Transkription
*HQRP
Translation
7UDQVNULSWRP
3URWHRP
Grundlagen-Molekularbiologie
• Hybridisierung
Jeder Nucleinsäurestrang trägt
in sich die Information und
Kapazität komplementäre
Sequenzen über Bassenpaarung zu erkennen.
3
Grundlagen-Microarrays
• Was sind eigentlich Microarrays ?
• Wozu benötigt man Microarrays ?
Grundlagen-Microarrays
• Microarray-Verfahren
4
Visualisierung bei Microarrays
• Datenerfassung
• Fehlerquellen
• Spotterkennung
• Vorverarbeitung der Daten
• Konstruktion einer Genexpressionsmatrix
• Clustern der Daten
• Visualisierungstechnik
Visualisierung-Datenerfassung
• Fehlerquellen
• Variation in Lage, Größe und Form
• Hintergrundrauschen
• Artefakte (mit unterschiedlichen Ursachen)
5
Visualisierung-Datenerfassung
•
Spoterkennung
•
Segmentierung des Bildes
Einteilung des Bildes mit Hilfe eines regelmäßigen Gitters
in Gitterzellen (Rasterquadrate), wobei jeweils ein
potentieller Spot in einer Zelle liegen soll.
Visualisierung-Datenerfassung
•
Spotidentifikation
Typischer Intensitätsverlauf
eines Spots im Querschnitt
Anwendung eines Laplace-Filters
zur Detektion von Rändern
6
Visualisierung-Datenerfassung
•
Spotklassifikation
•
•
•
Spot
kein Spot
Unklar
Die genaue Klassifikation nach der Spotidentifikation ist
notwendig, da bis zu diesem Zeitpunkt noch von einem
hypothetischen Spot ausgegangen werden muss.
Mit dem Zusammenwirken aller Informationen der Identifikation
kann nun eine Aussage (Klassifikation) getroffen werden.
Visualisierung-Vorverarbeitung
• Konstruktion einer Genexpressionsmatrix
Probe Y
Ι 11
Ι 1m
Ι xy
Gen X
Ι n1
Ι nm
7
Visualisierung-Vorverarbeitung
• Clustern der Daten
•
Hierbei werden diverse Gruppierungsalgorithmen verwandt, um die
Gene entweder anhand ähnlicher oder sogar gleicher
Intensitätswerte in der Genexpressionsmatrix zu verbinden.
•
Oder die Gruppierung erfolgt anhand bekanntermaßen funktional
abhängiger Gene.
Visualisierung-Technik
• Abbildung der Genexpressionsmatrix
• Exakte Abbildung der Gitterzellenstruktur der
Genexpressionsmatrix
• Abbildung von positiver und negativer
Genexpression in zwei unterschiedlichen Farben
• Abbildung der Fluoreszenzintensität, und somit der
Genexpression auf die jeweilige Farbintensität
HLJHQWOLFKH9LVXDOLVLHUXQJ(3&/867
8
Schlusswort
• Sowohl Microarrays, als auch die vorgestellte
Visualisierungstechnik sind mächtige
„Werkzeuge“ zur Analyse genetischer und
biochemischer Daten.
• In Kombination bergen sie ein noch größeres
Potential für zukünftige Forschungen.
Visualisierung
Vielen Dank für Ihre Aufmerksamkeit !
9
Herunterladen