Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Biometrie, Informatik und Epidemiologie Quade Moderne EDV Server mit mehreren Prozessoren und Raid 6 Plattensystem DOM 0 mit Virtualisierungsmöglichkeit für virtuelle Rechner (Linux, Vmware) DRBD zur Echtzeitspiegelung von Platteninhalten auf einen Ersatzserver Virtuelle Server mit Kryptofilesystem Quade Anwendungsprogramme Anwendungsprogramme lassen sich in der Regel in 3 Ebenen einteilen: 1: Daten 2: Anwendung 3: Präsentation Diese Ebenen lassen sich auf verschiedenen Rechnern unterbringen (Client - Server). Quade Erfassungssysteme Erfassungssysteme können typische Anwendungsprogramme sein. Über Masken werden Daten eingegeben, vom Programm geprüft und dann in einer Datei oder Datenbank gespeichert. Schon gespeicherte Daten lassen sich jederzeit ändern oder ergänzen. Änderungen werden gegebenenfalls dokumentiert. Beispiel: Patientenaufnahme, Erfassung von Untersuchungsbefunden. Quade Erfassungssysteme In der Medizin gibt es besondere Anforderungen an Erfassungssysteme. So muß z.B. bei der Patientenaufnahme der Patient re-identifiziert werden. Erfaßte Daten eines Patienten müssen diesem eineindeutig zugeordnet werden können. Quade Erfassungssysteme Wichtig ist die vollständige, vollzählige und fehlerfreie Erfassung. Ein Erfassungsbogen wird häufig in der primären Datenerfassung eingesetzt. Geeignete Formulare (Markierungsbelege) können auch online eingelesen werden (Markierungsbeleg mit Barcode oder OCR-Schrift). Quade Datei, Datenbank Die einfachste Form, Daten zu speichern, ist die Ablage in einer Datei (File). Dateien werden in Verzeichnissen (Directories) abgelegt. Die Dateinamen werden in Abhängigkeit vom Betriebssystem gewählt. Daten werden in Dateien in ein oder mehreren Zeilen (Records) mit fester (fixed) oder variabler Länge abgelegt. Die Reihenfolge der Daten, die Form ihrer digitalen Repräsentation und ihre Position in der Datei müssen vereinbart sein. Quade Datei, Datenbank Auch Datenbanken speichern Daten in Dateien. Sie führen zusätzlich Informationen über die gespeicherten Daten (Bezeichnung, Format, Länge) mit. Bei echten Datenbanken verwaltet ein Datenbankmanager die Daten und organisiert den Zugriff. Damit werden Datenzugriff und Datenintegrität besser gewährleistet als durch Record locking bei Dateien. Quade Datei, Datenbank hierarchisch relational Dateibasiert: dBase, Clipper Access Datenbank: Oracle Mysql Informix Sybase SQL objektorientiert Quade Structured Query Language Select name, vname from studenten.stammdaten where matrnr = 1234567; Testmann Robertoß Quade Gesellschaften 60000-10000 AC Gesellschaft der Jäger und Sammler - 18. Jahrhundert Ackerbau und Viehzucht - heute Industriegesellschaft heute - ? Informationsgesellschaft zukünftig ? Freizeitgesellschaft? Oncology Meeting Curitiba Information Society Alle Produkte müssen produziert werden. Das „Produkt“ “Information / Wissen” kann leicht kopiert werden! Unser Problem ist nicht so sehr “producing knowledge”, sondern der Zugang zu vorhandenem Wissen Quade Geschichte des Internet 1957 Sputnik 1958 Advanced Research Projects Agency 1969 Arpanet(Network Control Protocol) erster Request For Comments 1972 ftp e-mail Oncology Meeting Curitiba Geschichte des Internet 1972 5 verschiedene Netzwerke (inkompatibel) RFC #318 telnet (Jon Postel) 1973 Name „Internet“ and Definition von TCP/IP 1982 TCP/IP wird „Standard“ 1983 TCP/IP als Source-Code frei zugänglich (Berkeley System Distribution) Oncology Meeting Curitiba Geschichte des Internet 1983 Arpanet wechselt von NCP zu TCP Domain Name Service 1986 Perl von Larry Wall 1988 Internet Wurm von R. Morris Jr. 1989 Clifford Stoll und die Hacker Web Vorschlag von Tim BernersLee Oncology Meeting Curitiba Geschichte des Internet 1989 Tim Berners-Lee erstellt die erste WWW Software 1991 WAIS wird erfunden Gopher wird freigegeben Pretty Good Privacy von Philip Zimmerman wird freigegeben Linux wird von Linus Torvald vorgestellt Oncology Meeting Curitiba Tim Berners-Lee (1990) Geschichte des Internet 1991 Veronica 1993 Mosaic (Browser) WWW Verkehr steigert sich von 0.1% auf 1%. Es gibt 500 WWW Server 1994 WWW wächst um 341,634% WWW wechselt von CERN zur INRIA Oncology Meeting Curitiba Quade World Wide Web Oncology Meeting Curitiba Geschichte des Internet 1994 Lycos startet eine Suchmaschine im Internet. Die deutsche Bundestagswahl wird im Internet übertragen. 1995 HTTP Pakete bilden das größte Kontingent im Internet Verkehr. Apache Web Server Projekt. Java wird eingeführt. Oncology Meeting Curitiba Geschichte des Internet 1996 Blue Ribbon Campain als Antwort auf den Communications Decency Act 1998 Clinton Oncology Meeting Curitiba Einige Fakten • Der Bereich Medizin ist der zweitgrößte im Internet • Es gibt mehrere Milliarden Dokumente • Maximal 10% bis 20% des Internet werden von einer Suchmaschine indexiert. • Es gibt Listserver und Suchmaschinen Drei Fragen (1993): Wie kann die Qualität der Patientenversorgung verbessert werden? Kann das Internet als Transportmedium für Informationen genutzt werden (Funktionalität)? Welche Informationsquelle ist geeignet? Drei Antworten (1994): Durch Zugang zu aktuellen Leitlinien für Ärzte und darauf abgestimmte Patienteninformationen in Laiensprache. Kann das Internet als Transportmedium für Informationen genutzt werden (Funktionalität)? Welche Informationsquelle ist geeignet? Drei Antworten (1994): Durch Zugang zu aktuellen Leitlinien für Ärzte und darauf abgestimmte Patienteninformationen in Laiensprache. WWW Welche Informationsquelle ist geeignet? Drei Antworten (1994): Durch Zugang zu aktuellen Leitlinien für Ärzte und darauf abgestimmte Patienteninformationen in Laiensprache. WWW CancerNet vom National Cancer Institute (NCI) der USA. CancerNet Übersichtliche Leitlinien für Ärzte bezüglich Prognose, Staging und Behandlung von mehr als 80 Tumorarten. Entsprechende Informationen in Laiensprache für Patienten. Übersichtsarbeiten zu unterstützenden Therapien. Quade CancerNet Übersichten bezüglich Vorsorgeuntersuchungen und Vorbeugung. Datenbank mit Informationen über aktive und abgeschlossene klinische Studien. Literaturdatenbank (Cancerlit). Monatlich aktualisiert. Quade Cancernet Die Leitlinien für Ärzte enthalten über 8000 Links zu Abstrakts. Die Evidenz wird angegeben. Fast alle Abstrakts haben einen Link zu MEDLINE. Für einige Journals werden Links zur Originalarbeit generiert. Quade Cancernet 2001 Seit 1994 ca. 2,5 Million Kunden darunter ca. 250000 Ärzte Jeden Monat werden 90000 bis über 100000 Dokumente von ca. 60000 Nutzern abgerufen. Die abgerufene Informationsmenge entspricht über 2 Millionen Seiten Text (1998 Platz 48 in Deutschland). Quade Quade Universität Bonn Vermittlung zu CancerNet Host=WebCrawler 30 25 20 15 10 5 0 Januar März Mai 1997 Link zu CancerNet Universität Bonn Vermittlung zu CancerNet Host=CNN 30 25 20 15 10 5 0 Januar März Mai 1997 Vermittler, 1997 n=794 Suchmaschine .................. 59.6% Liste ............................. 9.9% Kollege ........................... 5.0% Freund ........................... 4.7% Arzt ............................. 3.5% Zeitung .......................... 2.5% Familie ........................... 3.0% Pflegekraft ...................... 0.9% TV ................................0.6% CancerNet Statistik (1998) Altersverteilung n=1,268 14 Prozent 13 12 11 10 9 8 7 6 5 4 3 2 1 0 männlich weiblich 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 Alter Ärztinnen 1996 Deutschland 12% (n=8) USA 1997 5% (n=39) 16% (n=32) 14% (n=29) 1998 2.3%(n=43) 12% (n=25) Warum nutzen Ärzte Cancernet? 1997 (n=163) Forschung 27.0 Weiterbildung 22.1 Informationssuche 3.7 Rest 0.6 Präsentation 9.2 Patienteninformation 12.9 Krebs 1.8 Literatur 19.6 Allg.Interesse 2.5 Grund für die Nutzung, 1997 Arbeitnehmer Hausfrau Angestellter ~70% Krebs Wissenschaftler ~70% Literatur