Mathematische Grundlagen der Computerlinguistik

Werbung
Das 1. Semester
Zentrale Grundlagenveranstaltungen:
ˆ
ˆ
ˆ
ˆ
Mathematische Grundlagen der Computerlinguistik
Organisatorisches
Informatik
Logik
math. Grundlagen
Grundkurs Linguistik
Tipps:
Dozentin: Wiebke Petersen
ˆ
stellen Sie sich den Prüfungen
ˆ
überprüfen Sie am Ende des 1. Semesters Ihre Studienfachwahl:
ˆ wenn Ihnen die Prüfungen schwergefallen sind, Sie sich aber
für das Fach begeistern können, machen Sie weiter
ˆ wenn Sie bereits am Ende des 1. Semesters Ihr Studium nur als
0. Foliensatz
Picht betrachten, erwägen Sie einen Fachwechsel
ˆ wenn Sie Informationswiss. und Sprachtech. studieren, müssen
Sie sich für beide Fachbereiche begeistern können
ˆ
beteiligen Sie sich aktiv an Ihrem Studiengang (Mitarbeit in
Veranstaltungen, Fachschaft, Institutsfeiern, Fachvorträge, . . . )
ˆ
Wiebke Petersen
math. Grundlagen
1
Spezielles Hilfsangebot für Sie
math. Grundlagen
1
Mengen und Mengenoperationen
(fachliche und organisatorische), Hausaufgabenhilfe
2
Relationen und Funktionen
und Klausurvorbereitung
3
formale Sprachen
4
Ordnungsrelationen
5
Graphen und Bäume
6
Beweise
7
Kombinatorik
8
Wahrscheinlichkeitstheorie
9
(Statistik)
Oliver: Do., 14:30 Uhr in 23.21.00.91
([email protected])
Patrick: Di., 12:30 Uhr in 23.21.04.87
([email protected])
durch wen: Studierende höherer Fachsemester
für wen: alle Studierende der Studiengänge BA
Informationswissenschaft und Sprachtechnologieund
math. Grundlagen
2
http://user.phil-fak.uni-duesseldorf.de/~petersen/
WiSe1112_mathGrundl/WiSe1112_mathGrundl_Petersen.html
Kurshomepage:
BA Linguistik mit Schwerpunkt Computerlinguistik
Wiebke Petersen
Wiebke Petersen
Semesterplan (math. Grundlagen)
was: Sprechstunden für Fragen zur Computerlinguistik
wann:
blicken Sie über den Tellerrand (Veranstaltungen anderer Fachbereiche)
3
Wiebke Petersen
math. Grundlagen
4
Voraussetzung für Beteiligungsnachweis (BN)
ˆ
Mathematische Grundlagen der Computerlinguistik
Wöchentliche Hausaufgaben
Anmelden: https://app.phil-fak.uni-
Mengen und Mengenoperationen
duesseldorf.de/moodle/login/signup.php
Einschreiben: Mathematische Grundlagen der
Computerlinguistik
Dozentin: Wiebke Petersen
Passwort: mathgrundl
Mindestpunktzahl: 50%
Abgabe: bis Do. 12:00 Uhr
ˆ
1. Foliensatz
Bei Problemen: Email an [email protected]
Wiebke Petersen
math. Grundlagen
5
Mengen
Wiebke Petersen
math. Grundlagen
6
Notation und Terminologie
Georg Cantor (1845-1918)
ˆ
Variablen für Mengen:
ˆ
Variablen für Elemente:
A, B , C , . . . , M , N , . . .
a, b , c , . . . , x , y , z
ˆ
Ist
m ein Element von M so schreibt man m
Eine Menge ist eine Zusammenfassung
ˆ
Ist
m kein Element von M so schreibt man m
von bestimmten wohlunterschiedenen
ˆ
Zwei Mengen
Objekten unserer Anschauung oder
Element von
unseres Denkens (welche die
ˆ
Ganzen.
ˆ
Mengen werden über ihre
Elemente bestimmt.
ˆ
A ist.
∅).
Mengen mit genau einem Element werden Einermengen (singleton)
genannt.
ˆ N= {1, 2, 3, . . .} ist die Menge der natürlichen Zahlen
ˆ N = {0, 1, 2, 3, . . .} ist die Menge der natürlichen Zahlen
Elemente von Mengen können
selber Mengen sein.
ˆ
A auch Element von B ist und wenn jedes Element von B
Es gibt genau eine Menge, die keine Elemente enthält, die leere Menge
(Symbol:
ˆ
6∈ M .
A und B sind genau dann identisch oder gleich, wenn jedes
auch Element von
Elemente`genannt werden) zu einem
∈ M.
0
Mengen können endlich oder
ˆ Z= {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} ist die Menge der ganzen
ˆ Q ist die Menge der rationalen Zahlen (alle Bruchzahlen`).
unendlich sein.
ˆ R
Wiebke Petersen
mit 0
math. Grundlagen
8
Wiebke Petersen
Zahlen
ist die Menge der reellen Zahlen (alle Kommazahlen`).
math. Grundlagen
9
Bertrand Russell (1872-1970)
Grellings Paradoxie
Ein Adjektiv heiÿe
autologisch,
Russels Antinomie (1901)
ˆ
Paradoxien der
Selbstbezüglichkeit
haplogistisch, kurz, xenonymisch,
Sei
M die Menge aller Mengen,
adjektivisch, verbal,
die sich nicht selbst als Element
vokalenthaltend, exquisit, . . . )
enthalten.
ˆ
wenn es sich selbst
beschreibt (Bsp.: dreisilbig,
Gilt
M
heterologisch,
∈M
oder
M
6∈ M ?
wenn es sich nicht selbst
beschreibt (Bsp.: zweisilbig,
essbar, grün, . . . )
Ausweg: Theorie der Typen`
(Principia Mathematica, Russel &
Ist heterologisch` heterologisch?
Whitehead 1910-13)
(nach D.R. Hofstadter:
Gödel, Escher,
Bach)
Mengen werden stufenweise aufgebaut
und sind immer von einem höheren Typ
In diesem Kurs werden Mengen so
als ihre Elemente.
zeichnende Hände von M.C. Escher
beschrieben, dass keine Paradoxien
auftreten.
Wiebke Petersen
math. Grundlagen
10
Mengenbeschreibungen
Wiebke Petersen
math. Grundlagen
11
Hinweise zur expliziten Mengendarstellung
Explizite Mengendarstellung
{a1 , a2 , . . . , an }
ist die Menge, die
genau die Elemente
a1 , a2 , . . . , an
enthält.
Beispiel:
ˆ
Beschreibung durch Aufzählung oder -listung
ˆ
nur für endliche Mengen möglich
ˆ
Die Klammern
Implizite Mengendarstellung
{x |A}
ist die Menge, die genau die
Objekte
{
und
}
heiÿen Mengenklammern oder
geschweifte Klammern.
{2, 3, 4, 5, 6, 7}
x enthält, auf die die Aussage
A zutrit.
ˆ
Reihenfolge der Elemente spielt keine Rolle:
ˆ
Elemente können in der Klammernotation mehrfach auftreten:
{a, b, c } = {c , a, b}
{a, b, c } = {a, b, a, b, a, b, c }
Beispiel:
{x ∈ R|x ∈ N
Wiebke Petersen
und 1
<x
und
x
< 8},
math. Grundlagen
12
Wiebke Petersen
math. Grundlagen
13
Hinweise zur impliziten Mengendarstellung
Hinweise zur impliziten Mengendarstellung
Beschreibung mittels rekursiver Denition
Beispiel: Menge der Nachkommen von Georg Cantor
Beschreibung mittels charakteristischer Eigenschaft
ˆ {
∈
Element
Grundbereich
|
1
Eigenschaft von Element
}
Die Kinder von Cantor sind Nachkommen von Cantor
ˆ {x ∈
ˆ
G |E (x )} (Menge aller x in G mit der Eigenschaft E )
Bsp.: {x ∈ N|x ist eine gerade Zahl}
ˆ
Wenn der Grundbereich aus dem Kontext bekannt ist oder sich
2
3
aus der Eigenschaft ergibt, kann er weggelassen werden.
ˆ
{x |x
Bsp.:
Festlegung endlich vieler Startelemente:
Konstruktionsvorschrift für zusätzliche Elemente:
Wenn
x
von
ein Nachkomme von Cantor.
x
ein Nachkomme von Cantor ist, dann ist jedes Kind
Einschränkung:
Nichts sonst ist ein Nachkomme von Cantor.
ist eine Primzahl}
ˆ
Was ist, wenn Cantor keine Kinder hatte?
ˆ
Lässt sich so auch die Menge der Nachkommen von Aristoteles
denieren? oder die von Merlin?
Wiebke Petersen
math. Grundlagen
14
Teilmengen
math. Grundlagen
15
Teilmengen
N ist eine Teilmenge der Menge M (in Zeichen: N
Eine Menge
dann, wenn alle Elemente von
ˆ
Wenn
x
∈ N,
ˆ
Wenn
y
∈ M,
dann
x
⊆ M)
x∈M
genau
dann muss
y
∈N
nicht unbedingt gelten, es kann aber
N
⊆
⊂ M)
M
:
N
ˆ
Es gibt ein
⊆M
und
N eine Teilmenge von M ist und wenn M und N ungleich
y
N
6= M
∈M
N
⊆ M,
Wenn
M
⊇ N und
M ⊃ N ).
y
Zeichen:
dann ist
M
}
N ist eine Teilmenge der Menge M
(Die leere Menge ist eine Teilmenge jeder Menge!)
mit
6∈ N .
N
Wenn
Die Menge
ist eine Einermenge
ˆ {2, 3} ⊆ {1, 2, 3, 4}
ˆ {2, 3} ⊆ {2, 3}
ˆ ∅ ⊆ {1, 2, 3, 4}
sind.
ˆ
x ist ein Element der Menge M
ˆ 2 ∈ {1, 2, 3}
ˆ 2 6∈ {1, 3, 5}
ˆ {3} ∈ {M |M
ˆ {3} 6∈ {3}
∈M
N ist eine echte Teilmenge der Menge M (in Zeichen: N
genau dann, wenn
:
N auch Elemente von M sind.
gelten.
Eine Menge
Wiebke Petersen
M eine Übermenge von N (in Zeichen: M
6= N
dann ist
⊇ N ).
M eine echte Übermenge von N (in
⊂
M
ˆ {3} 6⊆ {M |M
:
Die Menge
ist eine Einermenge
}
N ist eine echte Teilmenge der Menge M
ˆ {1} ⊂ {1, 2}
ˆ {1, 2} 6⊂ {1, 2}
Vorsicht: Die Element-von- und die Teilmengenrelation müssen streng
unterschieden werden!
Wiebke Petersen
math. Grundlagen
16
Wiebke Petersen
math. Grundlagen
17
Mächtigkeit von Mengen
Mengenoperationen
(unäre Potenzmengenoperation)
Zwei Mengen
(in Zeichen:
von
M und N haben dieselbe Mächtigkeit oder heiÿen gleichmächtig
|M | = |N |),
Mengenoperationen sind Abbildungen, die einer oder mehreren Mengen
wenn es eine eineindeutige Zuordnung der Elemente
eindeutig eine Menge zuordnen. Einstellige Operationen werden auch unäre und
M auf N gibt (d.h., die Zuordnung ordnet jedem Element aus M genau ein
Element aus
zweistellige auch binäre Operationen genannt.
N und jedem Element aus N genau ein Element aus M zu.)
Die Potenzmengenoperation ist eine unäre Operation, die jeder Menge ihre
endliche Mengen
Potenzmenge zuordnet.
|M |)
Die Mächtigkeit einer endlichen Menge (in Zeichen:
ist die Anzahl ihrer
Die Potenzmenge einer Menge
Elemente.
von
M , also
M ist die Menge aller möglichen Teilmengen
POT (M ) = {N |N ⊆ M }.
Beispiele:

{



{1




{



{
POT ({1, 2, 3}) =
 { 1,



 { 1,




 {
{ 1,
ˆ |∅| = 0
ˆ |{1, 2}| = 2
ˆ |{{1, 2}}| = 1
Vorsicht: nicht alle unendlichen Mengen sind gleichmächtig!
Wiebke Petersen
math. Grundlagen
18
Mächtigkeit der Potenzmenge
Für endliche Mengen gilt: ist
|POT (M )| = 2n .
Wiebke Petersen
},
},
},
3 },
},
3 },
3 },
3 },
2
2
2,
2,










math. Grundlagen
19
Mengenoperationen (binäre Operationen)
M eine n-elementige Menge, so ist
Schnitt:
A
Dierenz:
∩B
1
2
3
...
n
−
+
−
−
−
−
+
−
−
−
−
+
...
−
−
−
−
...
...
...
.
.
.
A
∩ B = { x |x ∈ A
und
x
A
∈ B}
\ B = {x |x ∈ A
.
.
.
−
+
+
−
+
−
−
−
+
...
...
...
.
.
.
Komplement (in
+
−
−
Vereinigung:
+
×
+
×
2
2
n
+
×
2
...
+
...
2
∪ B = {x |x ∈ A
Möglichkeiten
math. Grundlagen
∪B
oder
x
C U (A )
∈ B}
Wenn
20
Wiebke Petersen
\B
und
x
6∈ B }
U ): CU (A)
Komplement von A in U
A vereinigt mit B
A
.
.
.
2
A
A
A ohne B
A geschnitten mit B
Wiebke Petersen











math. Grundlagen
U
=U \A
feststeht, schreibt man auch
A
21
Mengenoperationen
Eigenschaften der Mengeoperationen (Schnitt und
Vereinigung)
Beispiele
A
= {1, 2, 3, 4},
B
= {3, 4, 5},
ˆ
A
∪ B = {1, 2, 3, 4, 5},
ˆ
A
\ B = {1, 2},
A
A
U
= {1, 2, 3, 4, 5, 6, 7},
∩ B = {3, 4}
= {5, 6, 7}
Kommutativgesetze:
Assoziativgesetze:
Distributivgesetze:
Idempotenzgesetze:
A∩B =B ∩A
A∪B =B ∪A
Notation
ˆ
Zwei Mengen
ˆ
Wenn
A und B mit leerem Schnitt heiÿen disjunkt (A
A eine Menge von Mengen ist, schreiben wir
Vereinigung aller Elemente von
ˆ
Wenn
A (Bsp.:
T
∩ B = ∅).
A für die
(A ∩ B ) ∪ C = (A ∪ C ) ∩ (B ∪ C )
(A ∪ B ) ∩ C = (A ∩ C ) ∪ (B ∩ C )
S
{B , C , D } = B ∪ C ∪ D )
T
A eine Menge von Mengen ist, schreiben wir
aller Elemente von
ˆ
A (Bsp.:
S
A für den Schnitt
{B , C , D } = B ∩ C ∩ D )
∅
Häug werden auch Indizes und Indexmengen zur Notation verwendet.
Bsp.: Sei
Ai
= {x ∈ N0 |x ≤ i }, dann
[
Ai = {0, 1, 2, 3, 4, 5} und
i ≤5
3≤
Wiebke Petersen
\
i ≤5
Ai
(A ∩ B ) ∩ C = A ∩ (B ∩ C )
(A ∪ B ) ∪ C = A ∪ (B ∪ C )
ist neutrales Element der Vereinigung:
A∩A=A
A∪A=A
A∪∅=∅∪A=A
Gibt es auch ein neutrales Element des Schnitts?
= {0, 1, 2, 3}
3≤
math. Grundlagen
22
Wiebke Petersen
math. Grundlagen
23
Gesetze der Komplementoperation
Mathematische Grundlagen der Computerlinguistik
de Morgan:
Relationen und Funktionen
weitere Gesetze:
A∩B =A∪B
A∪B =A∩B
A=A
A∩A=∅
Dozentin: Wiebke Petersen
2. Foliensatz
Wiebke Petersen
math. Grundlagen
24
Wiebke Petersen
math. Grundlagen
25
n-Tupel
und Cartesisches Produkt
Relationen
Denition
Mengen sind ungeordnet, häug werden jedoch geordnete Listen benötigt:
n-Tupel
Ein
n-Tupel ist eine Liste mit n
Eine Teilmenge des Cartesischen Produktes von n Mengen R
≥1
Eine Relation R ist also eine Menge von n-Tupeln.
die Reihenfolge festgelegt und jedes Element kann beliebig oft vorkommen.
Beispiel:
⊆ M1 × · · · × Mn
heiÿt n-stellige Relation.
Elementen. Im Gegensatz zu Mengen ist
h2, 3, 1i, hb , e , e , s , i , i , p , l i
Hinweis: Relationen werden extensional deniert. Es ist unerheblich, wie die
2-Tupel werden auch (geordnete) Paare genannt.
Relation charakterisiert (oder benannt) wird. Wichtig ist allein, welche Objekte
Cartesisches Produkt
zueinander in der Relation stehen.
Das Cartesische Produkt (oder Kreuzprodukt) von n Mengen
Menge aller n-Tupel deren i-tes Element aus
M1
× . . . × Mn := {hx1 , . . . , xn i|xi ∈ Mi
für
i
Mi stammt.
M1
. . . Mn
Für Relationen werden häug die Buchstaben
ist die
Beispiele
= 1, . . . , n }
Beispiel
= {a, b , c }, M2 = {a, d }
M1 × M2 = {ha, ai, ha, d i, hb , ai, hb , d i, hc , ai, hc , d i}
M1 × ∅ = ∅
M1
Wiebke Petersen
math. Grundlagen
R , S , T verwendet.
26
ˆ
Schwester von
ˆ
Mutter von
ˆ
weibliches Elternteil von
ˆ
bilden ein Quartet
ˆ
Teilmenge von
Wiebke Petersen
math. Grundlagen
27
Herunterladen