Das 1. Semester Zentrale Grundlagenveranstaltungen: Mathematische Grundlagen der Computerlinguistik Organisatorisches Informatik Logik math. Grundlagen Grundkurs Linguistik Tipps: Dozentin: Wiebke Petersen stellen Sie sich den Prüfungen überprüfen Sie am Ende des 1. Semesters Ihre Studienfachwahl: wenn Ihnen die Prüfungen schwergefallen sind, Sie sich aber für das Fach begeistern können, machen Sie weiter wenn Sie bereits am Ende des 1. Semesters Ihr Studium nur als 0. Foliensatz Picht betrachten, erwägen Sie einen Fachwechsel wenn Sie Informationswiss. und Sprachtech. studieren, müssen Sie sich für beide Fachbereiche begeistern können beteiligen Sie sich aktiv an Ihrem Studiengang (Mitarbeit in Veranstaltungen, Fachschaft, Institutsfeiern, Fachvorträge, . . . ) Wiebke Petersen math. Grundlagen 1 Spezielles Hilfsangebot für Sie math. Grundlagen 1 Mengen und Mengenoperationen (fachliche und organisatorische), Hausaufgabenhilfe 2 Relationen und Funktionen und Klausurvorbereitung 3 formale Sprachen 4 Ordnungsrelationen 5 Graphen und Bäume 6 Beweise 7 Kombinatorik 8 Wahrscheinlichkeitstheorie 9 (Statistik) Oliver: Do., 14:30 Uhr in 23.21.00.91 ([email protected]) Patrick: Di., 12:30 Uhr in 23.21.04.87 ([email protected]) durch wen: Studierende höherer Fachsemester für wen: alle Studierende der Studiengänge BA Informationswissenschaft und Sprachtechnologieund math. Grundlagen 2 http://user.phil-fak.uni-duesseldorf.de/~petersen/ WiSe1112_mathGrundl/WiSe1112_mathGrundl_Petersen.html Kurshomepage: BA Linguistik mit Schwerpunkt Computerlinguistik Wiebke Petersen Wiebke Petersen Semesterplan (math. Grundlagen) was: Sprechstunden für Fragen zur Computerlinguistik wann: blicken Sie über den Tellerrand (Veranstaltungen anderer Fachbereiche) 3 Wiebke Petersen math. Grundlagen 4 Voraussetzung für Beteiligungsnachweis (BN) Mathematische Grundlagen der Computerlinguistik Wöchentliche Hausaufgaben Anmelden: https://app.phil-fak.uni- Mengen und Mengenoperationen duesseldorf.de/moodle/login/signup.php Einschreiben: Mathematische Grundlagen der Computerlinguistik Dozentin: Wiebke Petersen Passwort: mathgrundl Mindestpunktzahl: 50% Abgabe: bis Do. 12:00 Uhr 1. Foliensatz Bei Problemen: Email an [email protected] Wiebke Petersen math. Grundlagen 5 Mengen Wiebke Petersen math. Grundlagen 6 Notation und Terminologie Georg Cantor (1845-1918) Variablen für Mengen: Variablen für Elemente: A, B , C , . . . , M , N , . . . a, b , c , . . . , x , y , z Ist m ein Element von M so schreibt man m Eine Menge ist eine Zusammenfassung Ist m kein Element von M so schreibt man m von bestimmten wohlunterschiedenen Zwei Mengen Objekten unserer Anschauung oder Element von unseres Denkens (welche die Ganzen. Mengen werden über ihre Elemente bestimmt. A ist. ∅). Mengen mit genau einem Element werden Einermengen (singleton) genannt. N= {1, 2, 3, . . .} ist die Menge der natürlichen Zahlen N = {0, 1, 2, 3, . . .} ist die Menge der natürlichen Zahlen Elemente von Mengen können selber Mengen sein. A auch Element von B ist und wenn jedes Element von B Es gibt genau eine Menge, die keine Elemente enthält, die leere Menge (Symbol: 6∈ M . A und B sind genau dann identisch oder gleich, wenn jedes auch Element von Elemente`genannt werden) zu einem ∈ M. 0 Mengen können endlich oder Z= {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} ist die Menge der ganzen Q ist die Menge der rationalen Zahlen (alle Bruchzahlen`). unendlich sein. R Wiebke Petersen mit 0 math. Grundlagen 8 Wiebke Petersen Zahlen ist die Menge der reellen Zahlen (alle Kommazahlen`). math. Grundlagen 9 Bertrand Russell (1872-1970) Grellings Paradoxie Ein Adjektiv heiÿe autologisch, Russels Antinomie (1901) Paradoxien der Selbstbezüglichkeit haplogistisch, kurz, xenonymisch, Sei M die Menge aller Mengen, adjektivisch, verbal, die sich nicht selbst als Element vokalenthaltend, exquisit, . . . ) enthalten. wenn es sich selbst beschreibt (Bsp.: dreisilbig, Gilt M heterologisch, ∈M oder M 6∈ M ? wenn es sich nicht selbst beschreibt (Bsp.: zweisilbig, essbar, grün, . . . ) Ausweg: Theorie der Typen` (Principia Mathematica, Russel & Ist heterologisch` heterologisch? Whitehead 1910-13) (nach D.R. Hofstadter: Gödel, Escher, Bach) Mengen werden stufenweise aufgebaut und sind immer von einem höheren Typ In diesem Kurs werden Mengen so als ihre Elemente. zeichnende Hände von M.C. Escher beschrieben, dass keine Paradoxien auftreten. Wiebke Petersen math. Grundlagen 10 Mengenbeschreibungen Wiebke Petersen math. Grundlagen 11 Hinweise zur expliziten Mengendarstellung Explizite Mengendarstellung {a1 , a2 , . . . , an } ist die Menge, die genau die Elemente a1 , a2 , . . . , an enthält. Beispiel: Beschreibung durch Aufzählung oder -listung nur für endliche Mengen möglich Die Klammern Implizite Mengendarstellung {x |A} ist die Menge, die genau die Objekte { und } heiÿen Mengenklammern oder geschweifte Klammern. {2, 3, 4, 5, 6, 7} x enthält, auf die die Aussage A zutrit. Reihenfolge der Elemente spielt keine Rolle: Elemente können in der Klammernotation mehrfach auftreten: {a, b, c } = {c , a, b} {a, b, c } = {a, b, a, b, a, b, c } Beispiel: {x ∈ R|x ∈ N Wiebke Petersen und 1 <x und x < 8}, math. Grundlagen 12 Wiebke Petersen math. Grundlagen 13 Hinweise zur impliziten Mengendarstellung Hinweise zur impliziten Mengendarstellung Beschreibung mittels rekursiver Denition Beispiel: Menge der Nachkommen von Georg Cantor Beschreibung mittels charakteristischer Eigenschaft { ∈ Element Grundbereich | 1 Eigenschaft von Element } Die Kinder von Cantor sind Nachkommen von Cantor {x ∈ G |E (x )} (Menge aller x in G mit der Eigenschaft E ) Bsp.: {x ∈ N|x ist eine gerade Zahl} Wenn der Grundbereich aus dem Kontext bekannt ist oder sich 2 3 aus der Eigenschaft ergibt, kann er weggelassen werden. {x |x Bsp.: Festlegung endlich vieler Startelemente: Konstruktionsvorschrift für zusätzliche Elemente: Wenn x von ein Nachkomme von Cantor. x ein Nachkomme von Cantor ist, dann ist jedes Kind Einschränkung: Nichts sonst ist ein Nachkomme von Cantor. ist eine Primzahl} Was ist, wenn Cantor keine Kinder hatte? Lässt sich so auch die Menge der Nachkommen von Aristoteles denieren? oder die von Merlin? Wiebke Petersen math. Grundlagen 14 Teilmengen math. Grundlagen 15 Teilmengen N ist eine Teilmenge der Menge M (in Zeichen: N Eine Menge dann, wenn alle Elemente von Wenn x ∈ N, Wenn y ∈ M, dann x ⊆ M) x∈M genau dann muss y ∈N nicht unbedingt gelten, es kann aber N ⊆ ⊂ M) M : N Es gibt ein ⊆M und N eine Teilmenge von M ist und wenn M und N ungleich y N 6= M ∈M N ⊆ M, Wenn M ⊇ N und M ⊃ N ). y Zeichen: dann ist M } N ist eine Teilmenge der Menge M (Die leere Menge ist eine Teilmenge jeder Menge!) mit 6∈ N . N Wenn Die Menge ist eine Einermenge {2, 3} ⊆ {1, 2, 3, 4} {2, 3} ⊆ {2, 3} ∅ ⊆ {1, 2, 3, 4} sind. x ist ein Element der Menge M 2 ∈ {1, 2, 3} 2 6∈ {1, 3, 5} {3} ∈ {M |M {3} 6∈ {3} ∈M N ist eine echte Teilmenge der Menge M (in Zeichen: N genau dann, wenn : N auch Elemente von M sind. gelten. Eine Menge Wiebke Petersen M eine Übermenge von N (in Zeichen: M 6= N dann ist ⊇ N ). M eine echte Übermenge von N (in ⊂ M {3} 6⊆ {M |M : Die Menge ist eine Einermenge } N ist eine echte Teilmenge der Menge M {1} ⊂ {1, 2} {1, 2} 6⊂ {1, 2} Vorsicht: Die Element-von- und die Teilmengenrelation müssen streng unterschieden werden! Wiebke Petersen math. Grundlagen 16 Wiebke Petersen math. Grundlagen 17 Mächtigkeit von Mengen Mengenoperationen (unäre Potenzmengenoperation) Zwei Mengen (in Zeichen: von M und N haben dieselbe Mächtigkeit oder heiÿen gleichmächtig |M | = |N |), Mengenoperationen sind Abbildungen, die einer oder mehreren Mengen wenn es eine eineindeutige Zuordnung der Elemente eindeutig eine Menge zuordnen. Einstellige Operationen werden auch unäre und M auf N gibt (d.h., die Zuordnung ordnet jedem Element aus M genau ein Element aus zweistellige auch binäre Operationen genannt. N und jedem Element aus N genau ein Element aus M zu.) Die Potenzmengenoperation ist eine unäre Operation, die jeder Menge ihre endliche Mengen Potenzmenge zuordnet. |M |) Die Mächtigkeit einer endlichen Menge (in Zeichen: ist die Anzahl ihrer Die Potenzmenge einer Menge Elemente. von M , also M ist die Menge aller möglichen Teilmengen POT (M ) = {N |N ⊆ M }. Beispiele: { {1 { { POT ({1, 2, 3}) = { 1, { 1, { { 1, |∅| = 0 |{1, 2}| = 2 |{{1, 2}}| = 1 Vorsicht: nicht alle unendlichen Mengen sind gleichmächtig! Wiebke Petersen math. Grundlagen 18 Mächtigkeit der Potenzmenge Für endliche Mengen gilt: ist |POT (M )| = 2n . Wiebke Petersen }, }, }, 3 }, }, 3 }, 3 }, 3 }, 2 2 2, 2, math. Grundlagen 19 Mengenoperationen (binäre Operationen) M eine n-elementige Menge, so ist Schnitt: A Dierenz: ∩B 1 2 3 ... n − + − − − − + − − − − + ... − − − − ... ... ... . . . A ∩ B = { x |x ∈ A und x A ∈ B} \ B = {x |x ∈ A . . . − + + − + − − − + ... ... ... . . . Komplement (in + − − Vereinigung: + × + × 2 2 n + × 2 ... + ... 2 ∪ B = {x |x ∈ A Möglichkeiten math. Grundlagen ∪B oder x C U (A ) ∈ B} Wenn 20 Wiebke Petersen \B und x 6∈ B } U ): CU (A) Komplement von A in U A vereinigt mit B A . . . 2 A A A ohne B A geschnitten mit B Wiebke Petersen math. Grundlagen U =U \A feststeht, schreibt man auch A 21 Mengenoperationen Eigenschaften der Mengeoperationen (Schnitt und Vereinigung) Beispiele A = {1, 2, 3, 4}, B = {3, 4, 5}, A ∪ B = {1, 2, 3, 4, 5}, A \ B = {1, 2}, A A U = {1, 2, 3, 4, 5, 6, 7}, ∩ B = {3, 4} = {5, 6, 7} Kommutativgesetze: Assoziativgesetze: Distributivgesetze: Idempotenzgesetze: A∩B =B ∩A A∪B =B ∪A Notation Zwei Mengen Wenn A und B mit leerem Schnitt heiÿen disjunkt (A A eine Menge von Mengen ist, schreiben wir Vereinigung aller Elemente von Wenn A (Bsp.: T ∩ B = ∅). A für die (A ∩ B ) ∪ C = (A ∪ C ) ∩ (B ∪ C ) (A ∪ B ) ∩ C = (A ∩ C ) ∪ (B ∩ C ) S {B , C , D } = B ∪ C ∪ D ) T A eine Menge von Mengen ist, schreiben wir aller Elemente von A (Bsp.: S A für den Schnitt {B , C , D } = B ∩ C ∩ D ) ∅ Häug werden auch Indizes und Indexmengen zur Notation verwendet. Bsp.: Sei Ai = {x ∈ N0 |x ≤ i }, dann [ Ai = {0, 1, 2, 3, 4, 5} und i ≤5 3≤ Wiebke Petersen \ i ≤5 Ai (A ∩ B ) ∩ C = A ∩ (B ∩ C ) (A ∪ B ) ∪ C = A ∪ (B ∪ C ) ist neutrales Element der Vereinigung: A∩A=A A∪A=A A∪∅=∅∪A=A Gibt es auch ein neutrales Element des Schnitts? = {0, 1, 2, 3} 3≤ math. Grundlagen 22 Wiebke Petersen math. Grundlagen 23 Gesetze der Komplementoperation Mathematische Grundlagen der Computerlinguistik de Morgan: Relationen und Funktionen weitere Gesetze: A∩B =A∪B A∪B =A∩B A=A A∩A=∅ Dozentin: Wiebke Petersen 2. Foliensatz Wiebke Petersen math. Grundlagen 24 Wiebke Petersen math. Grundlagen 25 n-Tupel und Cartesisches Produkt Relationen Denition Mengen sind ungeordnet, häug werden jedoch geordnete Listen benötigt: n-Tupel Ein n-Tupel ist eine Liste mit n Eine Teilmenge des Cartesischen Produktes von n Mengen R ≥1 Eine Relation R ist also eine Menge von n-Tupeln. die Reihenfolge festgelegt und jedes Element kann beliebig oft vorkommen. Beispiel: ⊆ M1 × · · · × Mn heiÿt n-stellige Relation. Elementen. Im Gegensatz zu Mengen ist h2, 3, 1i, hb , e , e , s , i , i , p , l i Hinweis: Relationen werden extensional deniert. Es ist unerheblich, wie die 2-Tupel werden auch (geordnete) Paare genannt. Relation charakterisiert (oder benannt) wird. Wichtig ist allein, welche Objekte Cartesisches Produkt zueinander in der Relation stehen. Das Cartesische Produkt (oder Kreuzprodukt) von n Mengen Menge aller n-Tupel deren i-tes Element aus M1 × . . . × Mn := {hx1 , . . . , xn i|xi ∈ Mi für i Mi stammt. M1 . . . Mn Für Relationen werden häug die Buchstaben ist die Beispiele = 1, . . . , n } Beispiel = {a, b , c }, M2 = {a, d } M1 × M2 = {ha, ai, ha, d i, hb , ai, hb , d i, hc , ai, hc , d i} M1 × ∅ = ∅ M1 Wiebke Petersen math. Grundlagen R , S , T verwendet. 26 Schwester von Mutter von weibliches Elternteil von bilden ein Quartet Teilmenge von Wiebke Petersen math. Grundlagen 27