Anragesprachen

Werbung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
1/18
Informatik
Technische
Informatik
• NeumannRechner
Praktische
Informatik
• Programmiersprachen
Datenbanken
• Abfragesprachen
• SQL
Theoretische
Informatik
• Computermodelle
Angewandte
Informatik
• Computergrafik
• Datenbanken
• Dokumentensuche
• Dateiverarbeitung
• Multimedia
• künstliche Intelligenz
Information
Retrieval
• Anfragesprachen
• Boolesches Retrieval
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Aktion
Erkennen /
Ableiten
Wissen
Informationen
Daten / Dateien
Zeichen / Signale
2/18
Handeln
Anwendung
Vernetzen / Erkennen
Bedeutung
Syntax
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
3/18
Anfrage oder Abfrage
In der Literatur gibt es keine eindeutigen Aussagen. Zehnder (Autor) benutzt die
Bezeichnung Abfrage in Bezug auf Datenbanken und Anfrage in Bezug auf
Suchsysteme bzw. Information Retrieval.
Eine Abfrage (query) erlaubt einem bestimmten Ausschnitt einer Datenbank
abzugrenzen und aufzufinden, sowie dessen Inhalt in geeigneter Form
darzustellen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
4/18
Beziehung zwischen Informationssystem, Datenbank und
Information Retrieval
Informationssystem
Datenbanksysteme
Anfrage einer Person
(Ist Artikel X verfügbar
Oder gibt es Alternativen?)
Information
Retrieval
Abfrage der Datenbank
nach Artikel X
Antwort
Information
Recherche nach Alternativen
im Internet
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
5/18
Information Retrieval
Im Information Retrieval (IR) werden Informationssysteme in Bezug auf ihre Rolle
im Prozess des Wissenstransfers vom menschlichen Wissensproduzenten zum
Informations-Nachfragenden betrachtet.
Die Fachgruppe „Information Retrieval“ in der Gesellschaft für Informatik
beschäftigt sich dabei schwerpunktmäßig mit jenen Fragestellungen, die im
Zusammenhang mit vagen Anfragen und unsicherem Wissen entstehen. Vage
Anfragen sind dadurch gekennzeichnet, dass die Antwort a priori nicht eindeutig
definiert ist. Hierzu zählen neben Fragen mit unscharfen Kriterien insbesondere
auch solche, die nur im Dialog iterativ durch Reformulierung (in Abhängigkeit von
den bisherigen Systemantworten) beantwortet werden können. Häufig müssen
zudem mehrere Datenbasen zur Beantwortung einer einzelnen Anfrage
durchsucht werden. Die Darstellungsform des in einem IR-Systems
gespeicherten Wissens ist im Prinzip nicht beschränkt (z.B. Texte, multimediale
Dokumente, Fakten, Regeln, semantische Netze).
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
6/18
Die Unsicherheit (oder die Unvollständigkeit) dieses Wissens resultiert aus der
begrenzten Repräsentation von dessen Semantik (z.B. bei Texten oder
multimedialen Dokumenten). Darüber hinaus werden auch solche Anwendungen
betrachtet, bei denen die gespeicherten Daten selbst unsicher oder unvollständig
sind (z.B. bei vielen technisch-wissenschaftlichen Datensammlungen). Aus dieser
Problematik ergibt sich die Notwendigkeit zur Bewertung der Qualität der
Antworten eines Informationssystems, wobei in einem weiteren Sinne die
Effektivität des Systems in Bezug auf die Unterstützung des Benutzers bei der
Lösung seines Anwendungsproblems beurteilt werden sollte.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
7/18
Information Retrieval System
Ein Nutzer, dessen Status online ist und Datenbanken abfragt, führt eine
Recherche in einer Online-Datenbank aus. Dies tut er mit einer Retrievalsprache
(Retrievalsystem) bei einem Host (Datenbankanbieter).
Dokumentarische Bezugseinheiten
Beschreiben Objekte in einem Dokumentationssystem. Die über eine
dokumentarische Bezugseinheit gewonnenen Informationen werden
Dokumentationseinheiten genannt.
Dokumentationseinheiten bestehen aus formalen und inhaltsbeschreibenden
Angaben.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
8/18
Definition Information Retrieval System
Unter Information Retrieval (Informationsrecherchesystem), versteht man
Systeme zum Speichern und Wiederauffinden von Informationen in Form von
Nachweisen über Dokumente oder Angaben über Fakten und andere
Sachverhalte.
Informationsbedarf
Interesse (z.B. aus Sicht zur Bewältigung einer bestimmten Aufgabe) erforderlich
Informationsbereitstellung
Informationsbedarf, welchem das objektive Informationsangebot gegenübersteht.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
9/18
Probleme der Informationsbereitstellung
• Halbwertszeit der Informationen (das Alter der nutzbaren Informationen sinkt)
• Informationsbarrieren
Informationsbarrieren
Barriere der Unkenntnis:
Der Onliner kennt den relevanten Nutzanteil seiner ihm angebotenen Daten.
Barriere der mangelhaften Dokumentenbereitstellung:
Der Onliner hat inhaltliche (oberflächliche) Kenntnisse über die Daten. Diese
können ihm aus irgendwelchen Gründen (Sicherheitsgründe) nicht bereitgestellt
werden.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
10/18
Intersprachbarriere:
Der Onliner hat die vollständigen relevanten Daten, kann sie aber nicht nutzen,
weil die Informationen in einer ihm unbekannten Sprache vorliegen.
Intrasprachbarriere:
Der Onliner hat alle relevanten Daten, kann sie erfassen, aber nicht sinngemäß.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Informationsbedarf
Alle zur Verfügung stehenden Informationen
Zur Erfüllung der Aufgabe benötigten Informationen
Individuell vorhandene
Informationen
Informationsbedarf
11/18
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
12/18
Signale:
Physikalische Darstellung einer Nachricht, gekennzeichnet durch Werte oder
Werteverlauf von einem oder mehreren Signalparametern. Signale können
gespeichert, übertragen und verarbeitet werden.
Nachricht:
Zusammenstellung von Zeichen oder Zuständen, die zur Übermittlung von
Informationen dienen
Zeichen:
Elemente aus einer zur Darstellung von Informationen vereinbarter Menge
verschiedener Elemente
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
13/18
Daten:
Zeichen oder kontinuierliche Funktionen, die zum Zweck der Verarbeitung von
Informationen aufgrund bekannter oder unterstellter Abmachungen darstellen.
Es besteht die Möglichkeit der symbolischen Beschreibung realer Sachverhalte,
z.B. Tomate hat das Attribut Farbe mit dem Wert Grün (Die Tomate ist grün.).
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Klassifikation
• Facettenklassifikation (Kombination der Merkmale)
• Dezimalklassifikation (Nutzung der Ziffern 0-9)
Dezimalklassifikation
• Vereinfachung der Informationsverarbeitung
• erhöht die Sicherheit bei Kommunikation
• verbessert das Ordnungswesen
14/18
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
15/18
Datei
Die Datei in der Datenbanktechnik beruht auf einen Dateikonzept. Die Datei
besteht aus einer Anzahl strukturell identischer Datensätze. Beschrieben werden
Datensätze durch Beschreibung der Felder Adressfeld, Inhalt 1-x und Adressen.
Datei ist eine Sammlung von Datensätzen. Liegen mehrere Dateien vor, die
inhaltlich zusammengehörig sind und auf einer Weise verknüpft sind, wird von
einer Datenbank gesprochen. Systeme, die dazu dienen, Dateien zu verwalten
und einzurichten, sind Dateisysteme. Solche, die entsprechend weiterführende
Dienste anbieten, sind Datenbanksysteme.
Schwachpunkte der Dateisysteme sind Programm und Dateiaufbau. Ziel ist es,
eine physische Dateiunabhängigkeit zu schaffen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Dateitypen
• Stapeldateien
•chronologische Reihenfolge
• variable Datensätze „Attribut = Attributnummer“
• Mehrfacheinträge möglich „Auto = VW, Opel, Ford“
• Vorteil: Speicherersparnis
• Nachteil: unübersichtlich
• Sequentielle Datei
• Felder haben gleich lange Fixstruktur
• Feldnamen müssen nur einmal erfasst werden
• Abfrage ist besser
• Verarbeitung aufgrund der Struktur besser
• Verlust der Flexibilität bei Neueinträgen
16/18
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
17/18
• Indexsequentielle Dateien
• enthält im einfachsten Fall einen Zeiger, der auf sequentielle Dateien
verweist
Indexdatei
1 Rot
2 Blau
3 Grün
• muss keiner Hierarchie folgen
• Direktzugriffsdatei
Sequentielle Datei
1 Rot Auto
2 Blau Flugzeug
3 Grün Pferd
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg
Faktendatenbank
• klassische Form
• Modellierung ist datensatzorientiert (record-oriented)
• Ziel ist es, eine einfache Beschreibung durch unten genannten
Informationstypen
• Die Beschreibungen (kurze Sätze) sind faktenbezogen
• Diese Datenbank beschreibt einen Weltausschnitt mit
• Attributen
• Merkmalen
• Nomenklaturen
• und kurzen Texten.
18/18
Herunterladen