Assoziative lexikalische Ketten

Werbung
Assoziative lexikalische Ketten
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
 Psycholinguistischer Ansatz – mentales
Lexikon
 Realisierung in WordNet
 Kollokationen – Kollokationsgraphen
 Lexical Chainer [Brunn01]
 Prototyp – Entwurf einer Implementierung
 Mögliche Ergänzungen - Kritik
28.05.2002
1
Psycholinguistischer Ansatz – mentales Lexikon 1
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung

psycholinguistische Erkenntnisse (Hypothesen)
über die Strukturierung des „mentalen Lexikons“

Assoziationsexperimente zeigen:
 association: noun – noun: 79 %
 association: adjective – adjective 65 %
 association: verb – verb: 43 %
Folgerung: vermutlich stärkere Zusammenhänge
innerhalb einer syntaktischen Kategorie (=> WordNet)
 Alternative Erklärung: assoziationspsychologische
Experimente mit isolierten Wortformen

28.05.2002
2
Psycholinguistischer Ansatz – mentales Lexikon 2
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
28.05.2002
[Aitch97], S. 109
3
Realisierung in WordNet
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
Verschiedene Relationen:
Antonymie
Synonymie
Meronymie etc.
Topical hierarchies bei Substantiven
Entailment Relations (?) bei Verben
N-dimensional hyperspaces (?) bei
Adjektiven
[Fellb]
28.05.2002
4
Kollokationen – Kollokationsgraphen 1
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
 „Als Kollokationen wollen wir hier Paare von Wortformen bezeichnen,
die signifikant häufig gemeinsam in einem Satz auftreten, bezogen auf
die Menge der vorliegenden Beispielsätze.“
http://wortschatz.uni-leipzig.de/html/faq/koloka.html
 Die Kollokationen eines Wortes lassen sich auch graphisch
darstellen in Kollokationsgraphen
28.05.2002
5
Kollokationen – Kollokationsgraphen 2
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung

dog – Detailstufe 1
28.05.2002
6
Kollokationen – Kollokationsgraphen 3
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung

dog – Detailstufe 2
28.05.2002
7
Kollokationen – Kollokationsgraphen 4
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung

dog – Detailstufe 3
28.05.2002
8
Lexical Chainer [Brunn01]
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
Brunn, Meru et.al.: Text Summarization using lexical Chains.
2001. (DUG)
- Lexikalische Ketten werden zur Zusammenfassung von Texten
eingesetzt:
- Schritte (siehe Prototyp):
- Besonderheit:
- - noun filtering [Brunn01]:
Trenung von „Information“ und „Rauschen“: nouns, die zum
Text/Inhalt gehören
- Substantive, die Teil des Themas (subjects) sind, sind wichtiger
- andere Substantive verdecken oft den Zusammenhang, werden
gefiltert
- probeweise einfache Heuristiken: NPs in Nebensätzen seien
unwichtiger
-
28.05.2002
9
Prototyp
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung

Segmentation
 einzelne Sätze
 Satzzeichen bearbeiten
 Vorgaben des jeweilige Taggers beachten ...

Part-of-Speech-Tagging
 Brill-Tagger (Einschränkung: englisch, UNIX/LINUX)


pyWordNet -> WordNet
Lexical Relations – Ausgabe als html-Datei
(xml-Datei ?)
28.05.2002
10
Beispiel 1:
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
High Bone Density Due to a Mutation in LDL-Receptor–Related Protein 5
Osteoporosis is a major public health problem of largely unknown cause.
Loss-of-function mutations in the gene for low-density lipoprotein receptor–
related protein 5 (LRP5), which acts in the Wnt signaling pathway, have been
shown to cause osteoporosis–pseudoglioma. Methods We performed
genetic and biochemical analyses of a kindred with an autosomal dominant
syndrome characterized by high bone density, a wide and deep mandible,
and torus palatinus. Results Genetic analysis revealed linkage of the
syndrome to chromosome 11q12–13 (odds of linkage, >1 million to 1), an
interval that contains LRP5. Affected members of the kindred had a mutation
in this gene, with valine substituted for glycine at codon 171 (LRP5V171).
This mutation segregated with the trait in the family and was absent in
control subjects. The normal glycine lies in a so-called propeller motif that is
highly conserved from fruit flies to humans. Markers of bone resorption
were normal in the affected subjects, whereas markers of bone formation
such as osteocalcin were markedly elevated. Levels of fibronectin, a known
target of signaling by Wnt, a developmental protein, were also elevated...
28.05.2002
11
Beispiel 2:
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
Number
Word
Form
Sentence
1
'High'
1
2
'Bone'
1
[18, 42, 45, 56, 64,
19]
3
'Density'
1
[57]
4
'Mutation'
1
28.05.2002
Hypernym
Hyponym
Member
Meronym
Part Holonym
Substance
Holonym
[18, 42, 45, 56,
64]
[18, 42, 45, 56,
64]
12
Mögliche Ergänzungen – Kritik 1
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung


Mengen ohne Oberbegriffe (außerhalb der
Hierarchien) fehlen
fehlende syntagmatische Relationen:
inhaltlich ähnliche Begriffe, sog. Kohyponyme
(Schafe und Rinder zu Schweine – Bauerhof)
 Kombinationen von Namen (Bill zu Clinton, Romeo
zu Julia)
 Verb-Nomen-Kombinationen (beißen - Hund Herrchen)

28.05.2002
13
Mögliche Ergänzungen – Kritik 2
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung


Folge: fehlende Bezüge zwischen verschiedenen
Wortklassen
Vernetzung innerhalb bestimmter Domänen, Beispiele:





Sport
Wirtschaft
Einkaufen
...
Möglichkeit ausloten, vorhandene Domänen/Sachgebiets-Klassifikationen zu nutzen, z.B.
Klassifikation der Schlagwort-Norm-Datei (SWD) der
Deutschen Bibliothek, Frankfurt (???)
28.05.2002
14
Mögliche Ergänzungen – Kritik 3
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung

weitere semantische Relationen,
z.B. [STE90]

???
28.05.2002
15
Literatur
Kai Jung, 28.05.2002,
HS Maschinelle Textzusammenfassung
[Aitch97]
Aitchison, Jean: Wörter im Kopf. Eine Einführung in das mentale Lexikon. Max
Niemeyer: Tübingen 1997.
[Brunn01] Brunn, Meru; Chali, Yllias; Pichak, Christopher J.: Text Summarization using
lexical Chains. 2001.
http://www-nlpir.nist.gov/projects/duc/duc2001/final_duc_papers/lethbridge.pdf
[Fellbaum] Fellbaum, Christiane: Ein semantisches Netz als Bedeutungstheorie. In: Herrmann/Grabowski:
Bedeutung,...???, S. 211-230
[Gar96]
Garman, Michael: Accessing the mental lexicon. In: Psycholinguistics. University Press:
Cambridge 1996. S. 239-298
[Mill93]
Miller, George; Fellbaum, Christiane et. al.: Introduction to WordNet. An online lexical
database. 1993. (5papers.pdf) http://www.cogsci.princeton.edu/~wn/.
[Quast98a] Quasthoff, Uwe: Projekt Deutscher Wortschatz. In: Heyer / Wolff (Hrsg.): Linguistik und neue
Medien, DUV 1998.
http://wortschatz.uni-leipzig.de/Papers/Projekt_Wortschatz_97.pdf
[Quast98b] Quasthoff, Uwe:Deutscher Wortschatz im Internet. LDV-Forum 2/1998
http://wortschatz.uni-leipzig.de/Papers/DeutscherWortschatzimInternet.doc
[STE90]
Steele, J.: Meaning-text theory: linguistics, lexicography and implications, University of Ottawa
Press; Ottawa, London, Paris, 1990
28.05.2002
16
Herunterladen