Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/18 Informatik Technische Informatik • NeumannRechner Praktische Informatik • Programmiersprachen Datenbanken • Abfragesprachen • SQL Theoretische Informatik • Computermodelle Angewandte Informatik • Computergrafik • Datenbanken • Dokumentensuche • Dateiverarbeitung • Multimedia • künstliche Intelligenz Information Retrieval • Anfragesprachen • Boolesches Retrieval Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Aktion Erkennen / Ableiten Wissen Informationen Daten / Dateien Zeichen / Signale 2/18 Handeln Anwendung Vernetzen / Erkennen Bedeutung Syntax Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 3/18 Anfrage oder Abfrage In der Literatur gibt es keine eindeutigen Aussagen. Zehnder (Autor) benutzt die Bezeichnung Abfrage in Bezug auf Datenbanken und Anfrage in Bezug auf Suchsysteme bzw. Information Retrieval. Eine Abfrage (query) erlaubt einem bestimmten Ausschnitt einer Datenbank abzugrenzen und aufzufinden, sowie dessen Inhalt in geeigneter Form darzustellen. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 4/18 Beziehung zwischen Informationssystem, Datenbank und Information Retrieval Informationssystem Datenbanksysteme Anfrage einer Person (Ist Artikel X verfügbar Oder gibt es Alternativen?) Information Retrieval Abfrage der Datenbank nach Artikel X Antwort Information Recherche nach Alternativen im Internet Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 5/18 Information Retrieval Im Information Retrieval (IR) werden Informationssysteme in Bezug auf ihre Rolle im Prozess des Wissenstransfers vom menschlichen Wissensproduzenten zum Informations-Nachfragenden betrachtet. Die Fachgruppe „Information Retrieval“ in der Gesellschaft für Informatik beschäftigt sich dabei schwerpunktmäßig mit jenen Fragestellungen, die im Zusammenhang mit vagen Anfragen und unsicherem Wissen entstehen. Vage Anfragen sind dadurch gekennzeichnet, dass die Antwort a priori nicht eindeutig definiert ist. Hierzu zählen neben Fragen mit unscharfen Kriterien insbesondere auch solche, die nur im Dialog iterativ durch Reformulierung (in Abhängigkeit von den bisherigen Systemantworten) beantwortet werden können. Häufig müssen zudem mehrere Datenbasen zur Beantwortung einer einzelnen Anfrage durchsucht werden. Die Darstellungsform des in einem IR-Systems gespeicherten Wissens ist im Prinzip nicht beschränkt (z.B. Texte, multimediale Dokumente, Fakten, Regeln, semantische Netze). Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 6/18 Die Unsicherheit (oder die Unvollständigkeit) dieses Wissens resultiert aus der begrenzten Repräsentation von dessen Semantik (z.B. bei Texten oder multimedialen Dokumenten). Darüber hinaus werden auch solche Anwendungen betrachtet, bei denen die gespeicherten Daten selbst unsicher oder unvollständig sind (z.B. bei vielen technisch-wissenschaftlichen Datensammlungen). Aus dieser Problematik ergibt sich die Notwendigkeit zur Bewertung der Qualität der Antworten eines Informationssystems, wobei in einem weiteren Sinne die Effektivität des Systems in Bezug auf die Unterstützung des Benutzers bei der Lösung seines Anwendungsproblems beurteilt werden sollte. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 7/18 Information Retrieval System Ein Nutzer, dessen Status online ist und Datenbanken abfragt, führt eine Recherche in einer Online-Datenbank aus. Dies tut er mit einer Retrievalsprache (Retrievalsystem) bei einem Host (Datenbankanbieter). Dokumentarische Bezugseinheiten Beschreiben Objekte in einem Dokumentationssystem. Die über eine dokumentarische Bezugseinheit gewonnenen Informationen werden Dokumentationseinheiten genannt. Dokumentationseinheiten bestehen aus formalen und inhaltsbeschreibenden Angaben. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 8/18 Definition Information Retrieval System Unter Information Retrieval (Informationsrecherchesystem), versteht man Systeme zum Speichern und Wiederauffinden von Informationen in Form von Nachweisen über Dokumente oder Angaben über Fakten und andere Sachverhalte. Informationsbedarf Interesse (z.B. aus Sicht zur Bewältigung einer bestimmten Aufgabe) erforderlich Informationsbereitstellung Informationsbedarf, welchem das objektive Informationsangebot gegenübersteht. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 9/18 Probleme der Informationsbereitstellung • Halbwertszeit der Informationen (das Alter der nutzbaren Informationen sinkt) • Informationsbarrieren Informationsbarrieren Barriere der Unkenntnis: Der Onliner kennt den relevanten Nutzanteil seiner ihm angebotenen Daten. Barriere der mangelhaften Dokumentenbereitstellung: Der Onliner hat inhaltliche (oberflächliche) Kenntnisse über die Daten. Diese können ihm aus irgendwelchen Gründen (Sicherheitsgründe) nicht bereitgestellt werden. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 10/18 Intersprachbarriere: Der Onliner hat die vollständigen relevanten Daten, kann sie aber nicht nutzen, weil die Informationen in einer ihm unbekannten Sprache vorliegen. Intrasprachbarriere: Der Onliner hat alle relevanten Daten, kann sie erfassen, aber nicht sinngemäß. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Informationsbedarf Alle zur Verfügung stehenden Informationen Zur Erfüllung der Aufgabe benötigten Informationen Individuell vorhandene Informationen Informationsbedarf 11/18 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 12/18 Signale: Physikalische Darstellung einer Nachricht, gekennzeichnet durch Werte oder Werteverlauf von einem oder mehreren Signalparametern. Signale können gespeichert, übertragen und verarbeitet werden. Nachricht: Zusammenstellung von Zeichen oder Zuständen, die zur Übermittlung von Informationen dienen Zeichen: Elemente aus einer zur Darstellung von Informationen vereinbarter Menge verschiedener Elemente Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 13/18 Daten: Zeichen oder kontinuierliche Funktionen, die zum Zweck der Verarbeitung von Informationen aufgrund bekannter oder unterstellter Abmachungen darstellen. Es besteht die Möglichkeit der symbolischen Beschreibung realer Sachverhalte, z.B. Tomate hat das Attribut Farbe mit dem Wert Grün (Die Tomate ist grün.). Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Klassifikation • Facettenklassifikation (Kombination der Merkmale) • Dezimalklassifikation (Nutzung der Ziffern 0-9) Dezimalklassifikation • Vereinfachung der Informationsverarbeitung • erhöht die Sicherheit bei Kommunikation • verbessert das Ordnungswesen 14/18 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 15/18 Datei Die Datei in der Datenbanktechnik beruht auf einen Dateikonzept. Die Datei besteht aus einer Anzahl strukturell identischer Datensätze. Beschrieben werden Datensätze durch Beschreibung der Felder Adressfeld, Inhalt 1-x und Adressen. Datei ist eine Sammlung von Datensätzen. Liegen mehrere Dateien vor, die inhaltlich zusammengehörig sind und auf einer Weise verknüpft sind, wird von einer Datenbank gesprochen. Systeme, die dazu dienen, Dateien zu verwalten und einzurichten, sind Dateisysteme. Solche, die entsprechend weiterführende Dienste anbieten, sind Datenbanksysteme. Schwachpunkte der Dateisysteme sind Programm und Dateiaufbau. Ziel ist es, eine physische Dateiunabhängigkeit zu schaffen. Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Dateitypen • Stapeldateien •chronologische Reihenfolge • variable Datensätze „Attribut = Attributnummer“ • Mehrfacheinträge möglich „Auto = VW, Opel, Ford“ • Vorteil: Speicherersparnis • Nachteil: unübersichtlich • Sequentielle Datei • Felder haben gleich lange Fixstruktur • Feldnamen müssen nur einmal erfasst werden • Abfrage ist besser • Verarbeitung aufgrund der Struktur besser • Verlust der Flexibilität bei Neueinträgen 16/18 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 17/18 • Indexsequentielle Dateien • enthält im einfachsten Fall einen Zeiger, der auf sequentielle Dateien verweist Indexdatei 1 Rot 2 Blau 3 Grün • muss keiner Hierarchie folgen • Direktzugriffsdatei Sequentielle Datei 1 Rot Auto 2 Blau Flugzeug 3 Grün Pferd Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg Faktendatenbank • klassische Form • Modellierung ist datensatzorientiert (record-oriented) • Ziel ist es, eine einfache Beschreibung durch unten genannten Informationstypen • Die Beschreibungen (kurze Sätze) sind faktenbezogen • Diese Datenbank beschreibt einen Weltausschnitt mit • Attributen • Merkmalen • Nomenklaturen • und kurzen Texten. 18/18