1 ALBasis-SE Logik II (Schurz) Ss 2016 Mi 14:30-16, 23.21/3 F Übung zu Logik II: Mi 10:30-12:00 23.21/02.26 Beginn 1 Woche später Tutorium: Ken Schimanski Di 14:30-16:00, 26.21/01.33 Zeitplan: 1) 13. 04. Wiederholung: Einführung und PL ohne Identität 2) 20. 04. PL ohne Identität: Deduktive Methode und Kalkülarten 3) 04. 05. PL-Semantik 4) 11. 05. AL Äquivalenzkalkül 18. 05 entfällt 5) 25. 05. PL Äquivalenzkalkül 6) 01. 06. PL mit Identität und Funktionszeichen 7) 08. 06. Äquivalenz- und Ordnungsrelationen 8) 15. 06. Zahlquantoren (Frege) und definite Deskriptionen (Russell) 9) 22. 06. Informelle Mengenlehre Metalogik der PL (Russell Antinomie) 10) 29. 06. Metatheoreme der PL (induktive Beweise) 11) 06.07. Metatheoreme, Korrektheit der PL 12) 13.07. Vollständigkeit der PL (Wiederholung, evtl. Unvollständigkeit) 13) 20.07. Klausur 2 Literatur: Einführungen in die Logik: Barwise, J. und Etchemendy, J.: Sprache, Beweis und Logik, Mentis, Paderborn, Band I 2005, Band II 2006. Bergmann, M. et al. (1998): The Logic Book, McGraw Hill, New York, 3. Aufl. Beckermann, A. (1997): Einführung in die Logik, W. de Gruyter, Berlin (2. Aufl. 2003). Bühler, A. (2000): Einführung in die Logik, Alber, Freiburg i. Breisgau, 3. Aufl. Essler, W., und Martinez, R. (1991): Grundzüge der Logik Bd. I, Vittorio Klostermann, Frankfurt/M. Hardy, J., Schamberger, C.: Logik in der Philosophie, Vandenhoeck und Ruprecht, UTB Göttingen 2012. Klenk, Virginia (1989): Understanding Symbolic Logic, Prentice Hall, Englewood Cliffs, NJ. Grundkurse in Logik für Fortgeschrittene: Ebbinghaus, H.D. et al. (1996): Einführung in die mathematische Logik, Spektrum, Heidelberg (4. Aufl.). Essler, W., Brendel, E., und Martinez, R. (1987): Grundzüge der Logik Bd. II, Vittorio Klostermann, Frankfurt/M. Machover, M. (1996): Set Theory, Logic and their Limitations, Cambridge Univ. Press. Rautenberg, W. (2002): Einführung in die mathematische Logik, Vieweg, Braunschweig. Hunter, G. (1971): Metalogic , Univ. of California Press, Berkeley, 6. Aufl. 1996. Einführung in die Mengenlehre: Van Dalen, D., et al. (1978): Sets. Naive, Axiomatic and Applied, Pergamon Press, Oxford. Ebbinghaus, H.-D. (2003): Einführung in die Mengenlehre, Spektrum Akad. Verlag, Heidelberg (4. Aufl.). O. Deiser, Einführung in die Mengenlehre, Springer, 3. korr. Aufl. 2010. Hoffstatter, Douglas: Gödel, Escher, Bach 3 1. Widerholung: Einleitung und PL ohne Identität 1.1 Einleitung 1.1.1 (Philosophische) Logik im weiten Sinne = Theorie des korrekten Schließens Das grundlegende Muster des Schließens: Ein Argument (ein Schluss) Präm 1 Präm1, …, Prämn / Konkl (semantische Gültigkeit, auch ) | (syntaktische Beweisbarkeit) Präm n Konkl Gültigkeitskriterium = Wahrheitserhaltung: wenn alle Prämissen wahr sind, ist auch die Konklusion wahr Klassifikation von Arten logischer Systeme: Deduktive Logik Nichtdeduktive Logik (Logik im engen Sinne) (Logik im weiten Sinne) Ein deduktiv korrektes Argument induktive (probabilistische) Logik = ein gültiges Argument nichtmonotone Logik, unsicheres Schließen Wahrheitserhaltung Wahrheitserhaltung mit hoher Wahrschein- mit Sicherheit lichkeit, Plausibilität, Unsicherheit Klassische Logik(en): Nichtklassische Logik(en): (Wahrheitsfunktionale) Aussagenlogik intuitionistische Logik Prädikatenlogik 1. Ordnung mehrwertige Logik modale (Aussagen-, Prädikaten-) Logik Relevanzlogik (alethische ML, deontische L, epistemische L, Quantenlogik konditionale L., ) (...) Prädikatenlogik 2. Ordnung … 4 Generelle Charakterisierung eines deduktiv gültigen Arguments: Präsupponiert ist eine Unterteilung der Menge aller Symbole der Sprache in: Nichtlogische Symbole Logische Symbole elementare Sätze p, q,… Satzoperatoren ,,,,… Individuenkonstanten a, b,… Quantoren x, x, (Identität) Prädikate F, G,…, R,… Modal-Operatoren , , Funktionssymbole f, g, … variierende (welt-referierende) Interpret. fixierte (logische) Interpretation Ein Argument ist gültig gdw. (genau dann, wenn) es wahrheitserhaltend ist (d.h. die Konklusion wahr ist, sofern alle Prämissen wahr sind) - unter allen Interpretationen seiner nichtlogischen Symbole (semantische Charakterisierung) - alleine aufgrund seiner logischen Form (syntaktische Charakterisierung) (Jedes Argument der gegebenen Form ist gültig) Beispiel für logische Form: pq, p | q (Modus Ponens) Übersetzung in natürliche Sprache: z.B. p es regnet, q die Straße ist nass Ergibt: Wenn es regnet, ist die Straße nass, es regnet / die Straße ist nass. Hauptziel eines Argumentes: Positiver Nutzen: --> Wahrheitstransfer (Voraussage, Erklärung). Ein zutreffendes ("sound") Argument: Ein gültiges Argument mit wahren Prämissen. Negativer Nutzen: --> Falschheits-Rücktransfer (Falsifikation). Unterdeterminiertheit der Falsifikation: Man kann lediglich schließen, dass einige der Prämissen falsch sind (welche?) (Duhem-Problem der Theorienfalsifikation) 5 Hauptziel der Logik: Zu wissen welche Argumente gültig sind und welche Sätze logisch wahr sind. Logisch wahre (L-wahre) Sätze: Ein Satz ist logisch wahr/falsch, gdw. er wahr/falsch ist ... - in allen Interpretationen seiner nichtlogischen Symbole (semantische Charakterisierung) - einzig aufgrund seiner logischen Form/Struktur (syntaktische Charakterisierung) (Jeder Satz dieser Form ist logisch wahr/falsch ) Zu jedem gültigen Argument gibt es einen korrespondierenden, logisch wahren Satz. Logisch wahr: ((pq)p) q Gültig: (pq), p / q Es gibt auch noch andere L-wahre Sätze, z.B. pp Logisch wahr Sätze sind Konklusionen eines gültigen Argumentes mit leerer Prämissenmenge: z.B. / pp, / (pp), etc. (Ein logisch wahrer Satz wird auch gültig genannt.) Ein Satz, der logisch falsch ist, wird kontradiktorisch genannt. Ein Satz, der nicht logisch falsch ist, wird logisch konsistent genannt. Ein Satz, der logisch wahr, oder logisch falsch ist, wird logisch determiniert genannt. Andernfalls ist ein Satz kontingent (logisch indeterminiert). konsistent L-falsch L-wahr L-determiniert kontingent L-indeterminiert 6 Logische vs. extralogisch-analytische Wahrheiten: Ein Kreis hat Ecken, oder er hat keine Ecken Ein Kreis hat keine Ecken x(Kx (Ex Ex)) x(Kx x) Ein Satz ist extralogisch-analytisch wahr, gdw seine Wahrheit durch die Bedeutung seiner nichtlogischen Symbole determiniert ist, unabhängig von Fakten der Welt. Im Gegensatz zu logischen Wahrheiten ist seine Wahrheit nicht alleine durch die Bedeutung seiner logischen Symbole determiniert. Analoges gilt für die Gültigkeit von extralogisch-analytischen Argumenten. Übungen 1.1: Welches der folgenden Argumente ist logisch gültig: (i) Alle Tiere sind Instinktwesen. Keine Pflanze ist ein Tier. Also ist keine Pflanze ein Instinktwesen. (ii) Alle Tiere sind Instinktwesen. Kein Mensch ist ein Instinktwesen. Also ist kein Mensch ein Tier. (iii) Alle guten Menschen sind vernünftig. Alle Menschen sind gut. Also sind alle Menschen vernünftig. (iv) Alle schlechten Menschen sind unvernünftig. Alle unvernünftigen Menschen sind schlecht. Also sind alle Menschen unvernünftig. 1.2: Welche der folgenden Argumente sind (a) logisch (deduktiv) gültig, (b) extralogisch-analytisch gültig, (c) induktiv oder probabilistisch 'gültig', (d) nichts dergleichen: (i) Alle Menschen sind sterblich. Aristoteles ist ein Mensch. Also ist auch Aristoteles sterblich. (ii) Die meisten Lichtschalter funktionieren. Ich drücke den Lichtschalter. Also geht das Licht an. (iii) Alle verheirateten Personen genießen eine Steuerbegünstigung. Paul und Maria sind ein Ehepaar. Also genießen Paul und Maria eine Steuerbegünstigung. (iv) Bisher hat mein Kühlschrank gut funktioniert. Also kann ich mich auch in Zukunft auf ihn verlassen. (v) Immer wenn Gregor von seinem Bruder spricht, nimmt sein Gesicht gespannte Züge an. Also nimmt Gregors Gesicht auch jetzt, wo er gerade von seinem Bruder spricht, gespannte Züge an. (vi) Immer wenn Gregor von seinem Bruder spricht, nimmt sein Gesicht gespannte Züge an. Al- 7 so hat Gregor gegenüber seinem Bruder einen Minderwertigkeitskomplex. (vii) Alle Raben sind schwarz. Dieser Vogel ist kein Rabe. Also ist er auch nicht schwarz. (viii) Abtreibung ist vorsätzliche Tötung eines Embryos. Ein Embryo ist ein menschliches Lebewesen. Also ist Abtreibung Mord. 1.3 Welcher der folgenden wahren Sätze ist logisch wahr, extralogisch-analytisch wahr, oder synthetisch (d.h. nicht-analytisch) wahr: (a) Kein unzerlegbarer Gegenstand ist zerlegbar, (b) Jeder unzerlegbare Gegenstand ist atomar, (c) Jedes Atom besteht aus Protonen, Neutronen und Elektronen, (d) stabile Demokratien sind nicht krisenanfällig, (e) Demokratien können krisenanfällig oder nicht krisenanfällig sein, (f) Demokratien können nur stabil sein, wenn sie eine stabile Wirtschaft besitzen. 1.4 Welcher der folgenden Behauptungen ist wahr: Ein Argument ist deduktiv gültig g.d.w 1) es keine Interpretation (seiner nichtlogischen Symbole) gibt, welche alle Prämissen falsch macht und die Konklusion wahr macht. 2) jede Interpretation (seiner nichtlogischen Symbole), welche die Prämissen falsch macht, auch die Konklusion falsch macht. 3) jede Interpretation (seiner nichtlogischen Symbole), welche die Konklusion falsch macht, alle Prämissen falsch macht. 4) es keine Interpretation (seiner nichtlogischen Symbole) gibt, welche alle Prämissen wahr macht und die Konklusion falsch macht. 5) jede Interpretation (seiner nichtlogischen Symbole), welche die Konklusion falsch macht, mindestens eine Prämisse falsch macht. 6) es keine Interpretation (seiner nichtlogischen Symbole) gibt, welche die Konklusion falsch macht und mindestens eine Prämisse wahr macht. 7) es keine Interpretation (seiner nichtlogischen Symbole) gibt, welche die Konklusion wahr macht und alle Prämissen wahr macht. 8 Übersprungen: 1.1.1 Syntax - Semantik ( - Pragmatik) (Charles Morris) Zwei Aspekte von Bedeutung: Intension (Bedeutung, Extension (Referenz, Freges Sinn) Freges Bedeutung) Satz: Proposition, Weltzustand Wahrheitswert ------- AL Prädikats: Eigenschaft Klasse PL Individuen-Term: Charakteristisches Cluster Objekt von Eigenschaften Für die Semantik der formalen Logik werden nur die Extensionen gebraucht. Ein logisches System besteht aus: 1. ener logischen Grammatik: Definition des formalen Gebrauchs SYNTAX seiner Sprache und seine Formregeln (logische Grammatik) 2. einer Semantik: Definitionen und Regeln von semantischer Interpreta- SEMANTIK tion. Semantische Definition von Logischer Wahrheit und Gültigkeit (s.o.) || steht für die semantische Gültigkeit eines Argumentes Semantische Beweismethoden (z.B. über Entscheidungsverfahren etc.) 3. einer Beweistheorie: Ein deduktiver Kalkül: eine Menge von Axiomen, Regeln und /oder Meta-Regeln der Deduktion plus einer SYNTAX Definition von Beweisbarkeit und Ableitbarkeit. | steht für syntaktische Beweisbarkeit (Ableitbarkeit) eines Argumentes Syntaktische Theoreme (z.B. über Entscheidungsverfahren etc.) 4. Ein Beweis der Korrektheit und (wenn möglich) Vollständigkeit. SYNTAX+SEMANTIK 9 Warum haben wir die Aufteilung der Logik in Semantik || und Beweistheorie | ? Das ist eine lange Geschichte. Es ist ein grundlegendes Charakteristikum der modernen Logik. Die meta-mathematische Motivation: Beweistheorie befasst sich mit konkreten/finiten Entitäten: syntaktische Regeln (Algorithmen) Die Semantik befasst sich mit abstrakten Entitäten: (potentiell infinite) mengentheoretische Modelle. Problem der Antinomien! Russells Antinomie der naiven Mengenlehre: Naives Komprehensionsaxiom: P(x)y: y = {x: P(x)} Sei y = {x: xx}. yy? Um widersprüchliche Intuitionen auszuschließen, braucht man deduktive Logik. Sind mathematische Intuitionen algorithmisch korrekt und damit widerspruchsfrei? Kann mathematisches Schließen komplett computerisiert werden? (KI) Die philosophische und psychochologische Motivation: Regelbasiertes Denken und modellbasiertes Denken sind zwei grundlegende Arten des Denkens, die manchmal miteinander konkurrieren; doch sie sind eigentlich komplementär. Definitionen von fundamentalen meta-theoretischen Konzepten: Korrektheit: Beweisbarkeit Gültigkeit/L-Wahrheit schwach: für Sätze stark: für Argumente Vollständigkeit: Gültigkeit/L-Wahrheit schwach: für Sätze mechanisch - algorithmische Verfahren Beweisbarkeit stark: für Argumente Entscheidbarkeit 10 Übersprungen: 1.1.3 Objektsprache vs. Metasprache, formale Logik vs. informelle Mengenlehre Die Objektsprache ist die Sprache, die untersucht wird. Die Metasprache ist die Sprache, in der wir die Eigenschaften unserer Objektsprache, und ihre Relation zur Welt-wie-in-Metasprache-beschrieben, ausdrücken. Tarski, Gödel … Gebrauch (nicht zitiert) vs. Erwähnung (zitiert): Objektsprache Metasprache Schnee ist weiß "Schnee ist weiß" ist wahr gdw. Schnee weiß ist. "Schnee ist weiß, oder Schnee ist nicht weiß" ist ein logisch wahrer Satz. Die Theorie der formalen Objektsprachen, ausgedrückt mit den Mitteln der informellen Mengenlehre nennt man auch Metalogik. Vereinbarung: Wir sprechen immer in der Metasprache. Alle objektsprachlichen Ausdrücke werden implizit als zitiert gebraucht. Wir vermeiden so alle Anführungszeichen. Formale Objektspr. Natürliche Metasprache Mathemat. Metaspr. pq "pq" ist wahr v(pq) (pq), p / q "(pq), p / q" ist ein gültiger Schluss (pq), p || q Anmerkung: Unsere Konvention, keine Zitate zu verwenden, bedeutet, dass wir objektsprachliche Ausdrücke in unserer Metasprache als Namen für selbige verwenden. In der Metasprache sind unsere terminologischen Konventionen relativ frei. Wir benutzen in der Metasprache oft dieselben logischen Symbole, wie in der Objektsprache - sofern der Kontext klarstellt, was objekt- und was metasprachlich ist. 11 Ausnahmen sind: Objektsprache Metasprache wenn-dann Identität = Übersprungen: 1.1.4 Extensionale und intensionale klassische Logik: Semantische Grundlagen der klassischen Logik Jeder Satz ist entweder wahr, oder falsch (Zweiwertigkeit) 1a: Prinzip des ausgeschlossenen Dritten: p p (Aristoteles: 1c Identität: a=a) 1b: Prinzip des ausgeschlossenen Widerspruchs: (pp) Arten von Satzoperatoren: extensional (wahrheitswertfunktional) intensional (nicht-wahrheitswertfunkt.) nicht p (es ist nicht der Fall, dass p) es ist notwendig, dass p p und q es ist geboten, dass p Ein Satzoperator ist extensional (wahrheitsfunktional) gdw der Wahrheitswert des gesamten Satzes, in dem er vorkommt, vollständig durch die Wahrheitswerte seiner Argumente bestimmt ist. Ansonsten ist er intensional (nicht-wahrheitsfunktional). Klassische Aussagenlogik = die Logik der extensionalen Satzoperatoren. Interpretationen/Modelle sind beschränkt auf die Zuordnungen der Wahrheitswerte. Klassische Prädikatenlogik 1. Ordnung ist extensional im mengentheoret. Sinne: Der Wahrheitswert eines Satzes ist vollständig determiniert durch: - die Extension von Individuentermen (Objekte) - die Extension von Prädikatensymbolen (Klassen) - die Extension des Individuenbereichs "D" (Domain) der Quantoren 12 Modale Aussagenlogik - berücksichtigt auch intensionale Satzoperatoren p für notwendig p, p p für möglich p Interpretationen werden in Bezug gesetzt zu möglichen Welten. A ist wahr gdw A in allen möglichen Welten wahr ist. Formale Modallogik behandelt mögliche Welten als 'Individuen' ('Punkte'); in diesem Sinne reduziert sie die Intension auf Extensionen über mögliche Welten. Klassische Logik: AL und PL AL = wahrheitswertfunktionale AL Erweiterte klassische Logik: M-AL and M-PL (lässt intensionale Operatoren zu) Übung 1.5 - optional! Welche der folgenden natursprachlichen Verknüpfungsausdrücke sind extensional, und welche intensional: p nachdem q es ist falsch, daß p p nur wenn q es ist schön, daß p es ist bezweckt, daß p es ist wahrscheinlich, daß p p damit q p es sei denn dass q p weil q p außer wenn q weder p noch q p eher als q 1.1.5 Geschichte der Logik und nicht-klassischer (deduktive) Logiken Einige wichtige Namen in der Geschichte der Logik: Aristoteles: um 350 v.Chr. Syllogistik 300 v.Chr. Stoische Logiker um 1200 n.Chr. Scholastische Logik (kaum Fortschritte...) AL: um 1850 George Boole Mengenlehre: um 1880 Georg Cantor PL: ab 1880 Gottlob Frege, Charles S. Peirce um 1900-20 Bertrand Russell, Ludwig Wittgenstein um 1930 Kurt Gödel, Alfred Tarski, …. (Metalogische Resultate, Semantik) Modallogik: um 1920 Clarence Irving Lewis, 1945 Rudolf Carnap, 1960 Saul Kripke, Jakkoo Hintikka 13 Nichtklassische Logiken: - Nehmen nicht das Prinzip der Zweiwertigkeit an. Mehrwertige Logiken ( Quantenlogik): Ein Satz kann einen dritten “unbestimmten” Wahrheitswert haben {w, u, f} Beispiel: Intuitionistische Logik: "p ist intuitionistisch wahr" steht für: "p hat einen konstruktiven Beweis" "p wird behauptet" steht für: es gibt einen konstruktiven Beweis, dass aus der Annahme p ein Widerspruch folgt intuitionist. gültig: (pp), p p intuitionist. ungültig: pp, p p Übungen: 1.6 Diskutieren Sie das Zweiwertigkeitsprinzip der klassischen Logik. Was bedeutet die Annahme eines Wahrheitswertes "unbestimmt" für unsere ontologische Auffassung der Welt? 1.7 Wie könnten vernünftige Wahrheitstafeln mit drei Wahrheitswerten {w,u,f} für die Negation, Konjunktion, Disjunktion und materiale Implikation aussehen? 1.8 Überlegen Sie sich eine Methode, die dreiwertige Logik auf die zweiwertige Logik innerhalb einer erweiterten Sprache zurückzuführen, aufgrund der folgenden Beobachtung: p kann wahr, unbestimmt oder falsch sein; aber "p ist unbestimmt", "p ist wahr", "p ist falsch" ist immer entweder wahr oder falsch. 14 1.2. Prädikatenlogik ohne Identität Sprache und Repräsentierung 1.2.1 Prädikatenlogischen Sprache Definition Alphabet: Nichtlogische Zeichen: - Individuenkonstanten a, b, ..., auch indiziert bezeichnen EInzeldinge - n-stellige Prädikate für n = 1, 2, 3 ... Stellenzahl F1, G1, P2, R3, ... (evtl. auch mit unterem Index) man dart Stellenzahl weglassen: Fa, Rab, Mehrstellige Prädikate heissen auch Relationszeichen (Aussagenlogik: p, q, für Aussagevariablen ) Logische Zeichen: - Aussagenlogische Junktoren , , , ( definiert als ) - Individuenvariablen x, y, ..., auch indiziert - Quantoren , Hilfszeichen: - Klammern (, ) Terme: Individuenvariablen und Individuenkonstanten heissen (singuläre) Terme. Schemabuchstaben: t1, t2, 15 Formregeln: Formel = wohlgeformte Formel, sonst nur "Zeichenreihe" 1. Für atomare Formeln: Ist R ein n-stelliges Prädikat und sind t1, ..., tn Terme (nicht notwendigerweise verschieden), so ist Rt1 ..tn eine Formel. Rt1 ...tn heißt dann atomar. Hinweis: Für R kann auch Q etc. gesetzt werden, d.h. wir haben hier "R" als Schemabuchstaben für beliebige n-stellige Prädikate und t1, ..., tn als Schemabuchstaben für beliebige singuläre Terme verwendet. 2. Aussagenlogische Formregeln: Sind A und B beliebige Formeln, so sind auch a) A b) (A B) c) (A B) d) (A B) Formeln. (AB) =def (AB) (BA) 3. Formregeln für quantifizierte Aussagen: Ist A eine Formel, dann sind auch a) xA b) xA Formeln. (Für x kann AUCH y, z ... gesetzt werden, d.h. x fungiert als Schemabuchstaben für beliebige Individuenvariablen.) 4. Sonst ist nichts eine Aussage. 16 Erläuterung: Die gebundenen Variablen x, y, ... etc. tragen keine eigenständige Bedeutung, sondern geben lediglich an, auf welche Argumentstelle welchen Prädikates sich der entsprechende Quantor bezieht. Die Menge aller Individuen, auf die sich ein Quantor zusammen mit der gebundenen Individuenvariable bezieht, nennt man den zugrundeliegenden Individuenbereich (domain) D. Ohne Zusatz ist D der universale Bereich. Jener Teil einer quantifizierten Aussage, auf den sich ein Quantor zusammen mit seiner gebundenen Variablen bezieht, heißt Bereich des Quantors. Der Bereich eines Quantors ist einfach jene Teilformel, die unmittelbar auf den Quantor folgt. In folgenden Beispielen ist der Quantorenbereich eingezeichnet: xFx x(Fx Gx) xFx x(Fx Gx) x(Fx Gx) Teilformeln sind dabei wie Teilaussagen zu verstehen - bloß mit dem Unterschied, daß sie "gebundene" bzw. "zu bindende" Indivdiduenvariablen x, y, … besitzen, statt Individuenkonstanten a, b, … x, x bindet diejenigen Variablen in seinem Bereich, die frei darin sind (siehe unten). Beispiele: x (MxEx) Alle Metalle leiten Strom 17 Bei Aussagen mit mehreren hintereinanderstehenden Quantoren sind die Bereiche ineinander verschachtelt. Z.B. xy(Fx Ryx) Hier ist es wichtig, die gebundenen Bereich von y Bereich von x Variablen x und y streng auseinanderzuhalten. Definition: Eine Vorkommnis einer Individuenvariablen x in einer Formel heißt frei, wenn es nicht im Bereich eines Quantors der Form x oder x auftritt; ansonsten heißt dieses Vorkommnis gebunden. Eine Formel heißt geschlossene Formel, oder Satz oder Aussage, wenn in ihr keine freien Individuenvariable vorkommt. Sonst heißt sie offene Formel. Rekapituliere: Freie Individuenvariablen haben keine Bedeutung, und Formeln keinen Wahrheitswert. Nur Sätze/Aussagen haben einen Wahrheitswert. Beispiele: x(FxGy) x durch "x" gebunden, y frei xy(RxzQy) x, y sind gebunden z ist frei xFx Gx x links gebunden, rechts frei (s. Übungsbeispiele 10.2) Verschachtelte Quantoren: Bei gleichen Quantoren ist die Reihenfolge bedeutungsmäßig belanglos, denn xyRxy besagt dasselbe wie yxRxy und xyRxy dasselbe wie yxRxy. Bei verschiedenen Quantoren aber macht die Reihenfolge einen Unterschied: xyRxy ist eine stärkere Behauptung als yxRxy. Bedeutet etwa Rxy - x ist Ursache von y, so besagt xyRxy, daß alles ein und dieselbe gemeinsame Ursache hat, während yxRxy besagt, daß jedes Ding irgendeine (aber nicht notwendigerweise dieselbe) Ursache hat. 18 Hinweis: Unser System lässt auch redundante Quantoren zu. Ein Quantor der Form x oder x heißt (ist einer Formel)überflüssig wenn die Individuenvariable x in seinem Bereich nicht frei vorkommt. Beispiel: Da Fa wohlgeformt ist, dürfen wir auch die pseudo-quantifizierten Formeln xFa und xFa bilden, z.B. für mindestens ein x gilt: Schnee ist weiß, obwohl der Quantor hier nichts bindet und daher überflüssig ist. Gemäß der PL-Semantik gilt xFa und xFa sind einfach gleichbedeutend mit Fa. Ebenso ist xyFy gleichbedeutend mit yFy usw. Ab hier Kap. 1.2.1 übersprungen: Strukturbäume: Mithilfe dieser Formregeln können wir für jede Zeichenreihe bestimmen, ob sie eine (wohlgeformte) prädikatenlogische Formel oder Aussage ist, und im positiven Fall ihren Strukturbaum zeichnen. Z.B. ist x(Fx Gx) wohlgeformt, und der Konstruktionsbaum lautet: x(Fx Gx): (1) (1) Fx Gx (2d) (Fx Gx) (3b) x(Fx Gx) Konvention: wird bei Prädikaten keine Stellenzahl als oberer Index angegeben, so nehmen wir an, daß die Stellenzahl des Prädikats mit der Anzahl seiner Argumente in der Formel übereinstimmt - daß also alle atomaren Aussagen korrekt gebildet wurden. 19 xFx xGx: (1) (1) Fx Gx (3b) (3a) xFx xGx (2a) xGx (2d) xFx xGx Übungen: 1.9. Welche Individuenvariablen in folgenden Formeln sind frei, welche gebunden. Zeichnen Sie den Bereich der Quantoren ein. 1.10. Wo gibt es darin Quantoren, die nichts in der Formel binden? Welche der Formeln sind geschlossen (sind Sätze)? xy(Fxy Gxy) Rab xFxyzHzx xyRxy yxRxy yPy (xRxy zRxz) x(FxyGxy) xHxx x1x2(y2(RaQzb)y2(Rbx5Qy1x3)) xxRx xFa xxRx FxGx) xy(Ty xy Mxa))Rxb xy(FaFyGx)z(Fx23Gy). 20 1.11: Welche der folgenden Zeichenreihen sind Sätze der prädikatenlogischen Sprache, und welche offene Formeln? Man zeichne im positiven Fall den Strukturbaum. Im negativen Fall unterstreiche man die Fehler. 1) F1a R2ab 2) x(F2xya x(G3xz yF 3) x(Fx xGx) 4) y(Fy Gyz) 5) xFx xGx 6) zyx(Fx Ryz) 7) x(Fx yRxy) 8) (x1R2x1a Qa1b) Fc 9) xyFz 10) yR2xa P1xb 21 1.2.2 Repräsentierung in der Prädikatenlogik Kurzwiederholung Alles, was aus Holz ist, ist brennbar x(HxBx) mit Hx - x ist aus Holz, Bx - x ist brennbar Wenn Peter krank ist, dann wohnt er bei Mama Ka Wab Übersetzung: Kx - x ist krank Wxy - x wohnt bei y Es gibt schwarze Schwäne: x(FxGx) Peter ist immer freundlich Fxt - x ist freundlich zu t a - Peter b - Mama Fx x ist schwarz Gx x ist ein Schwan tFat a - Peter Kein Eisbär ist schwarz x(Fx Gx) Fx - x ist ein Eisbär Gx - x ist schwarz Übersetzungsbeispiele für Relationen und mehreren Quantoren: a - Mars b - Venus Mxy - x ist Mond von y Px - x ist ein Planet Der Mars hat Monde xMxa Alle Planeten habe Monde x(Px yMyx) Alle Planeten haben einen gemeinsamen Mond Einige Planeten haben keinen Mond usw. yx(Px Myx) x(Px yMyx) 22 Übungen: 1.12: Man repräsentiere die folgenden Aussagen der natürlichen Sprache durch prädikatenlogische Aussagen. 1) a) Gotische Kathedralen haben Türme. b) Es gibt keine gotische Kathedrale ohne Turm. c) Keine gotische Kathedrale ist ohne Turm. d) Kathedralen mit Türmen sind gotisch. e) Alle Kathedralen ohne Türme sind nicht gotisch. f) Nur gotische Kathedralen haben Türme. g) Nur Kathedralen mit Türmen sind gotisch. h) Gotische Kathedralen ohne Turm gibt es nicht. 2) a) Alles hat eine Ursache. b) Es gibt etwas, das alles verursacht hat. c) Alles hat eine gemeinsame Ursache. d) Gott ist die Ursache von allem. e) Wenn eines die Ursache eines zweiten ist, ist das zweite die Wirkung des ersten. f) Alles wirkt sich auf alles aus. g) Es gibt etwas, das mit nichts in einer Kausalbeziehung steht. h) Nichts verursacht sich selbst. i) Nichts verursacht nichts. j) Nichts verursacht etwas. k) Nichts verursacht alles. l) Was alles verursacht, verursacht sich selbst. m) Physische Entitäten haben physische und psychische Entitäten haben psychische Ursachen. n) Gott ist überall jederzeit vorhanden. o) Irgendwann und irgendwo gibt es ein Wunder 23 2. PL ohne Identität: Duktiver Methode und Kalkülarten 2.1 Deduktive Kalküle für die Aussagenlogik Wiederholung und Erweiterung ! Es gibt verschiedene mögliche Axiomatisierungen einer Logik, definiert durch eine Semantik ! Haben jeweils Vor- und Nachteile. Axiome & Regeln 1. Stufe - Kalküle (Hilbert) Zwei Arten deduktiver Kalküle Kalküle natürlichen Schließens Zwei Wege der Repräsentation von Kalkülen natürlichen Schließens: Sequezenrepresentation – meta-logisch Satzrepresentation natürlich z.B. Gentzen Style z.B. Fitch-Style Einheiten des Beweises sind Schlüsse Einheiten des Beweises sind Sätze. Logik I+II = Sequenzen. Sie sind Teil der Objektsprache: Sequenzaxiome Basisregeln: Regeln 1. Stufe z.B. A, AB | B (MP) z.B.: A, AB / B (MP) "A, AB" wird als Prämissenmenge gelesen Die Schnittregel wird explizit angewendet Die Schnittregel wird implizit in der oder implizit durch Sequenzenregeln Beweisverkettung verwendet; z.B. MP: mit vereinigter Prämissenmenge wenn /A, und /AB herleitbar, P: | A, | AB / | B dann /B herleitbar Sequenzregeln mit veränderter Prämissenmenge: | A, / | B. Annahmebeweisregeln: Regeln 2. Stufe ..... A Unterbeweis B 24 Der Kalkül S (Approximation Logik I) P1 Alle Formelmengen in Beweisen werden als P2 finit angenommen (Beweise sind konkrete zwischen Präm./Ann. Entitäten.) und Abgeleitetem Bereichsindikator erlaubt Trennlinie C (Bereich der Prämissen) (Unterbeweis) verboten Neben Fitch-Style gibt es (z.B.): Copi-Style ; Quine-Stern-Style *; AndersonBelnap explizite Abhängigkeitsaufzeichnung [Hinweis: in der VL kann man Copi-Pfeile beibehalten, anstatt die neuen FitchStriche zu verwenden] Wiederholung Aussagenlogik: Satz-Präsentation: Sequenzen-Präsentation: A Sequenz-Axiome: Reiteration REIT:A | A (erweitert: , A | A) A A (Reit hier überflüssig) A Basisregeln: A AB B Sequenzregeln: Modus Ponens, -Beseitigung: MP: | A und | AB / , | B Anmerkung: Da als Regeln "2. Stufe" formuliert, kann die Trennlinie irgendwo über A, AB liegen Simplifikation , -Beseitigung: SIMP: | AB / | A | | AB / | B Konjunktion, -Einführung: KON: | A and | B / , | AB A B AB AB A AB B 25 Addition, -Einführung: ADD: | A / | AB , | A / | BA Disjunktiver Syllogismus -Beseitigung: DS: | AB und | A / , | B | AB und | B / , | A A AB A BA AB A B AB B A Klassische Doppelte Negation -Beseitigung: kDN: | A / | A Annahmebeweisregeln: Konditionalbeweis - -Einführung: KB: , A | B / | AB (hier verschwinden Prämisse in Konk.sequenz) intuitionistischer indirekter Beweis - -Einf.: iIB: , A | BB / | A A A A A B AB B B A 26 Definition Beweisbarkeit in S: Sequenzen-Präsentation:| A ist beweisbar in S, kurz |S A, gdw ein Beweis für | A existiert, d.h. eine endliche Folge von Sequenzen <1|A1,…,n|An> sodass die Schlusssequenz die zu beweisende Sequenz ist (n=, An=A), und jede Sequenz i | Ai entweder ein Axiom ist, oder aus ein oder zwei voriger Sequenzen nach einer der Regeln folgt. Satz-Präsentation: | A ist beweisbar in S gdw eine endliche Sequenz <A1,…,An> existiert, zusammen mit einer Indikation von Prämissen-und Annahmebereichen, sodass An = A und jedes Ai entweder ein Element vonoder eine Annahme eines geschlossenen Unterbeweises ist, oder aus früheren Elementen gemäß einer der Basisregeln folgt oder aus einem geschlossenen Unterbeweis gemäß einer der Annahmebeweisregeln folgt. Im System S sind folgende Desiderata erfüllt: 1) Für jeden AL-Operator gibt es genau eine Einführungs- und eine Ausführungsregel. Daher: Alle Regeln sind voneinander unabhängig (keine Redundanz). 2) Durch Weglassung der Regel kDN entsteht genau der intuitionistische Kalkül. 3) Im System S lernt man die Parallelität von Sequenzenkalkül und Satzkalkül auf einfache Weise kennen. Weitere Definitionen deduktiver Begriffe: | S A, oder A ist ein Theorem von S, gdw |S A. Wir dehnen das Konzept |S wie folgt auf unendliche Prämissenmengen aus: |S A gdw f |S A für irgendeine endliches Teilmenge f . Ab jetzt schreiben wir | A als Abkürzung für |S A, wenn der Kontext klar ist. 27 Beispiel einer Überführung von Satzpräsentation in Sequenzenpräsentation: für den beweis einer einfachen Herleitung (Regel): Beweis von: (A (B C)) | (A B C) Satzpräsentation: 1) A (BC) Präm 2) AB KB-Ann 3) A Simp 2 4) BC MP 1,3 5) B Simp 2 6) C MP 4,5 7) AB C KB 2-6 Sequenzenpräsentation: für Prämissen und KB-Annahmen nehme man zunächst ReitSequenten der Form A | A an: 1) A (BC) | A (BC) Reit 2) AB | AB Reit Simp 2 3) AB | A 4) A (BC), AB | BC MP 1, 3 5) AB | B Simp 2 A (BC), AB | C MP 5,4 7) A (BC) | AB C KB 6 Allgemeine Technik für den Beweis von Schlüssen im Sequenzenkalkül: Man schreibt für jede Prämisse oder offene Annahme ein Reiterationsaxiom, und führt anschließend dieselben Schritte durch. Regeln im Satzbeweis entsprechen denselben Schritten im Sequenzenbeweis,, wobei die Prämissenmengen der Sequenzen vereinigt werden da hier bei die Prämissenmengen nicht verändert werden. Metaregeln im Satzbeweis entsprechen Regelschritten im Sequenzenbeweis, in denen die Prämissen der jeweiligen Sequenzen (bei Übergang von eijner zur anderen Sequenz) verändert werden. 28 Abgeleitete Regeln im System S von Logik I weitere Grundregeln: Modus Tollens: AB MT: | B, | AB / , | A B A intuitionistische DN: A (iDN): | A / | A A BB klassischer indirekter Beweis: kIB (Logik I: IB): , A | BB / | A A A spezielle Fallunterscheidung: sFU: , A | B und , A | B / , | B B A B B AB A Allgemeine Fallunterscheidung: aFU: , A | C und , B | C / , , AB| C C B C C 29 Beispiel: Beweis der Metaregel klassischer indirekter Beweis, -Beseitigung, aus S: kIB: , A | BB / | A In Satzpräsentation umständlicher metalogischer Beweis von einem Satzbeweis auf den an deren: 1 Prämisse(n) 2 A iIB-Ann. i BB n.V. 1-i (Regelprämisse) (i+1) A iIB 2-i (i+2) A kDN (i+1) In Sequenzenpräsentation ein einfacher Sequenzenbeweis mit einer Sequenz als Prämisse (hier wir also eine allgemeine Herleitung /Satzbeweis als Prämisse vorausgesetzt und einer neuen Sequenz als Konklusion: 1) , A | BB Prämisse 2) | A iIB aus 1 3) | A kDN aus 2 Folgende Metaregeln sind implizit in die Satzpräsentationeingebaut und in der Sequenzenrepräsentation (mit Sequenzenregeln "2. Stufe") herleitbar: Schnitt bzw. Cut | A, A | B / , | B Monotonie Mon: | A / , | A Vertauschung: , P1, P2 | A P2, P1 | A Kürzung: , P1, P1 | A P1 | A 30 Um kurze und intuitiv transparente Beweise zu gewährleisten, sind Satz-Kalküle des natürlichen Schließens (Fitch-Kalküle) zu bevorzugen, für metalogische Einfachheit sind Sequenzen-kalküle vorzuziehen. Hinweis: In Kalkülen natürlichen Schliessen kann man mit KB als einziger Annahmebeweisregel auskommen, indem man alle anderen Annahmebeweisregeln in Pfeilform schreibt: Statt sFU: , A | B, , A | B / , | B setzt man sFU: | AB, | AB / , | B Einer weitere Art von Kalkülen sind Axiom-Regel-Kalküle (Hilbert-Kalküle); Sie bestehen nur aus Axiomen, z.B. A(BA), AA, usw., haben als einzige Regel den MP, und haben keine Metaregeln (Annahmeregeln). Übungen 2.1 Wiederholung Aussagenlogik (sofern Zeit bleibt): (a) Beweise in Satz- und Sequenzenpräsentation: AB | BC AB, B | A (MT als Regel 1. Stufe) AB, AC | A BC A C, B C | (A B) C (b) Herleitung in S herleitbaren Meta-Regeln (Regeln 2. Stufe) iDN, MIT, aFU, sFU, aus den Basisregeln. (MT , iDN als Regel 2. Stufe formuliert). Einmal in Satzrepräsentation, dann in Sequenzenrepräsentation. (c) optional: Beweise die Geltung der strukturellen Regeln Schnitt, Mon, Vertauschung, Kürzung 31 2.2 Kalkül S für PL ohne Identität (PL) Sequenzen-Präsentation Satz-Präsentation AL-Regeln: Jedes Axiom und jede Regel von S0 i1 A1 in An Als 'Abkürzung' in fortgeschrittenen PL-Beweisen: (Taut): 1 | A1, …, n | An / {i:1in} | B sofern A1,…,An | B "offensichtlich" tautologisch gültig ist B Taut i1,...,in Aber besser: benötigte AL-Schritte in Klammern hinzufügen, z.B.: (Simp, MP, Kon). Auch einfache ebgeleitete AL-Regeln dürfen verwendet werden. Notation: Substitution im Gegensatz zu Logik I nun erweitert auf Formeln A[t/x] steht für das Resultat der uniformen Ersetzung der freien Individuenvariable x durch den Term t (lies "A, t für x"), vorausgesetzt der Term t ist keine Individuenvariable, die im Bereich eines Quantors in A liegt, der sie bindet (zB t=y, und t liegt im Bereich von y oder y). Wir sagen dann auch: die Termsubstitution ist konfusionsfrei (oder t ist frei für x in A). Ansonsten entsteht eine sogenannte Variablenkonfusion! Im letzteren Fall muss der xQuantor zuerst in einen anderen Quantor (z.B. z-Quantor) gebunden umbenannt werden, d.h durch eine neue (noch nicht vorkommende) gebundene Individuenvariable uniform ersetzt werden (genaue Def. später). Übungsaufgabe 2.1* (Wiederholung Logik I): Führe folgende Substitutionen mit Ik's durch: (Fxy Gxz)[a/x] xyRxy)[a/x,b/y] yPy xRxy)[c/y] x(FxyGxy) Px)[a/x] yRxy)[a/x] xFx Fx[a/x] Übung 2.1** Führen Sie folgende Variablensubstitutionen mit Iv's durch; wo entsteht Variablenkonfusion bzw. muss gebunden umbenannt werden? y(RxyQxy)[z/x] y(RxyQxy)[y/x] yRxy[z/y] y(RxyxQxz)[x/y] y(RxyxQxz)[y/z] y(RxyxQxz)[x/z] yRxy xQxz)[y/z] xy(FxzGyu)[x/z, z/u] Rxy[y/x,a/y] diskutiere: simultane versus sukzessive Substitution 32 Unkritische Quantor-Regeln: Universelle Instantiierung - -Beseitigung: xA UI: | xA / | A[t/x] A[t/x] für jede Iv x und Term t Gilt auch für variable Terme wie y und funktionale Terme wie "f(a)" (später) Durch Reit gewinnt man in Sequenzenpräsentation Regel 1. Stufe: xA | A[t/x] Durch KB gewinnt man Theorem: | xA A[t/x] Beispiel von Instanzen der Regel: "->" ist die Instanziierungsfunktion" | xyRxy / | yRay x->x, t->a, A->yRxy, A[t/x]->yRay | yRay / | Rab x->y, t->b, A-> Ray, A[t/x] -> Rab Beispiel für Ungültigkeit aufgrund Variablenkonfusion: A = yRxy A A[z/x] yRxy[z/x] = yRzy xyRxy | yRzy ist gültig A A[y/x] Konfusion yRxy[y/x] = yRyy Variablenkonfusion. xyRxy | yRyy ungültig ! Gebundene Umbenennung von y in u: aus yRxy wird uRxu xuRxu | uRyu gültig Existenzeinführung in der Konklusion EK: auch genannt: existenzielle Generalisierung A[t/x] EK: | A[t/x] / | xA (für jede Iv x und Term t) xA Regel 1. Stufe: A[t/x] | xA Theorem | A[t/x] xA Beispiel: Fc | xFx 33 Übungen 2.2: Welches sind korrekte Instanzen von UI bzw. EK ( evtl. in mehreren Schritten?) Bilde die Instanziierungsfunktion. UI: xRxx / Raa xy(RxyGxx) / y(RzyGzc) xRxy /Ray xy(RxyGxx) / y(RayGxa) xRxx /Rxa xyRxy / yRya xyRxy / yRay xyRxy / yRyy xyRxy / Rxy xyRxy / Rba yxRxy / Raa EK: Raa / xRxx yRzyxyRxy Rxa / xRxx yRyyxyRxy Raa/xRxa Rab / xRxx yRya / xyRxy y(GxzHyz) / xy(GxzHyz) Fa GaxFxxGx Kritische Quantor-Regeln: (haben Restriktionen R; Logik I: "Variablenbedingung", betrifft aber auch Konstanten) Universelle Generalisierung - -Einführung: A[a/x] (UG): | A[a/x] / | xA xA R: a nicht in xA R: a kommt nicht in oder xA vor oder Prämisse oder offene Annahme Intuition: Wenn wir A(a) für irgendein Individuum a beweisen können, ohne irgendetwas darüber anzunehmen, dann können wir dieselbe Behauptung für jedes andere Individuum beweisen. Beispiele von UI-Instanzen: für a, c nicht in ! | Rac / | xRxc Instanz: x->x, a->a, A->Rxc, A[a/x]->Rac | xRxc / | yxRxy Gegenbeispiel zu "a nicht in A" | FaFa Instanz: x->y, a->c, A->xRxy, A[a/x]->xRxc Sei A = FaFx, A[a/x] = FaFa. aber|-/- x(FaFx) | | Fa xFx (s. u.). Für funktionale Terme wie f(a) ist UG (wie auch EP unten) ungültig. (s. später) 34 Wir dürfen aber über Variablen generalisieren: (UGv): | A / | xA wobei x nicht frei in (Ugv ist abgeleitete Regel; folgt aus restlichen Regeln). Existenzeinführung in der Prämisse EP - als Annahmebeweis: xA Auch genannt: Existentielle Instanziierung A[a/x] (EP): A[a/x] | B / , xA | B Vorausgesetzt R: a nicht in oder B oder xA B B KB-Version: | A[a/x] B / | xAB Für Variablen: (EPv): A | B / , xA | B R wie oben (R wie oben) R: sofern x nicht frei in oder B Übung 2.3: Welches sind korrekte Instanzen von UG, bzw. EP (einfachheitshalber als Sequenzenregeln geschrieben). Bilde die Instanziierungsfunktion: UG: x(FxGx) | Fa / x(FxGx) | xFx x(FxGx)Fa | Ga / x(FxGx), Fa | xGx xRxb | Rab / xRxb | yRay Wie sehen die analogen UGv-Instanzen aus? EG: Fa | x(FxGx) / xFx | x(FxGx) x(FxGx), Fa | Ga / x(FxGx), xFx | Ga x(RxaQxa), Rba | xQbx / x(RxaQxa), xRbx | xQbx xRxa | Rba / yxRxy | Rba Wie sehen die analogen EPv-Instanzen aus? Wiederholung Beweisführung 1. zuerst Quantoren beseitigen, mitteils UI und EK 2. dann aussagenlogischer Beweisteil 3. dann Quantoren wieder einführen mittels UG und EP 35 Wir instanziierten bisher die Individuenvariablen durch Individuenkonstanten, können aber auch direkt für Individuenvariablen instanziieren. Semantisch funktioniert freie Individuenvariable wie eine Individuenkonstante. Z.B. x(A B) / xA (1) x(AB) (2) A[a/x] B[a/x] Präm UI aus (1), a komme in (1) nicht vor (d.h., a wird so gewählt) SIMP (2) UG (3), R: a nicht in (1), (4) (3) A[a/x] (4) xA Würden wir, statt UG, Ugv benutzen, wäre der Beweis etwas einfacher, aber 'abstrakter' --- siehe Übung Mit Iv-Einsetzung: x(A B) / xA (1) x(AB) (2) A B (3) A (4) xA Präm UI aus (1) SIMP (2) UG (3), R: x (garantiert) nicht frei in nicht in (1), (4) Davon die Sequenzenversion: 1) x(AB) x(AB) 2) x(AB) | AB 3) x(AB) | A 4) x(AB) | xA Reit UI aus 1 (für "[x/x]") Simp 2 UG 3, R: x nicht frei in "x(AB)" oder in "xA" 36 Weiteres Beispiel: xFx, x(Fx Gx) // xGx (1) xFx (2) x(Fx Gx) (3) Fa (4) Fa Ga (5) Ga (6) xGx (7) xGx Präm Präm EP-Ann. für (1) UI (2) MP (3), (4) EK (5) EP (3) - (6) R: a kommt in (6), (1), (2) nicht vor In der Sequenzenversion: 1) xFx | xFx 2) x(FxGx) | x(FxGx) 3) Fa | Fa 4) x(FxGx) | FaGa 5) x(FxGx), Fa | Ga 6) x(FxGx), Fa | xGx 7) x(FxGx), xFx | xGx Reit Reit Reit UI 3 MP 3,4 EK 5 EP 6, R: a nicht in x(FxGx), xFx, xGx Übung 2.4 Beweise folgende PL-Theoreme bzw. Schlüsse abwechselnd mit Ik oder Iv Einsetzung, und in Satz - und/oder Sequenzenversion: 0) xyRxy / yxRxy xFx / x(Fx Gx) "Gebundene Umnbenennung": xA yA[y/x] sofern y nicht in A, weder gebunden noch frei. In zwei Richtungen , zerlegen: Äquivalenz bilden: x(Fx Gx) / x(FxHx Gx Hx) ( bindet vor ) x(Fx Gx) , x(Gx Hx) / x(Fx Hx) x(y(Fxy Gxy) y(Hxy Gxy)) / xy(Fxy Hxy Gxy) 7) xFx / xFx xFx / xFx ) x(Fx Gx) // xFx xGx 11) xFx xGx // x(FxGx) 12) A xB // x(A B) wenn x nicht in A 37 3. Semantik der PL ohne Identität Die logische Semantik der PL befaßt sich nur mit extensionaler Interpretation. So wie in der AL den Aussagevariablen Wahrheitswerte (w, f) zugeordnet werden, so werden in der PL nun den Prädikaten Klassen von Indiviuen zugeordnet und den Individuenkonstanten Individuen. 2-stelligen Relationszeichen werden Klassen von Paaren von Individuen zugeordent, 3stelligen Relationszeichen Klassen von 3er-Folgen von Individuen, usw. Die PL-Semantik ordnet den PL-Aussagen also abstrakte, rein mengentheoretisch formulierte Strukturen zu, sogenannte Modelle. Ein wenig mengentheoretische Grundlagen (1.) {a, b, c} bezeichnet die Menge bestehend aus a, b und c. {x: Fx} bezeichnet die Menge aller x, die F sind. (2.) "" ist die Elementrelation. D.h. "aA" besagt "a ist ein Element der Menge A". Z.B. gilt a {a, b, c, ...}, und a {x: Fx} g.d.w. (genau dann, wenn) Fa. "xD" steht für "alle x in der Menge D gilt " Analog "xD" steht für "es gibt ein x in der Menge D für das gilt " (3.) Mehrstellige Relationen ordnet man geordnete Folgen von Individuen zu. Z.B. ordnet man der 2-stelligen Relation "... ist größer als ..." die Menge aller Paare <x, y> zu sodass x größer ist als y. Wenn I die "Interpretationsfunktion" ist, die dem Prädikat R2 seine Extension zuordnet, so gilt also: I(R2) = {<x,y>: R2xy}. Für ein geordnetes Paar ist die Reihenfolge ausschlaggebend ist, d.h. <x, y> ist ein anderes Paar als <y, x>. Bemerkung: Dies ist ein wichtiger Unterschied zwischen Folgen und Mengen: bei Mengen kommt es nämlich nicht auf die Reihenfolge der Elemente an, d.h. {a, b} = {b, a}. Dagegen gilt: <a, b> <b, a>. Die dreistellige Relation "x geht von y nach z" hat als Extension die Menge aller Tripel - i.e. geordnete Folgen von drei Elementen - <x, y, z>, sodass x von y nach z geht. Oder etwas formaler: I(R3) = {<x, y, z>: R3xyz}. 38 Sei D eine Menge, so bezeichnet Dn die Menge aller geordneten Folgen von n Individuen, die aus Elementen von D gebildet werden können. Eine solche geordnete Folge heißt auch n-Tupel. Dn ist also die Menge aller n-Tupel aus D. Beispiel: Ist D = {1, 2, 3}, so ist D2 = {<1, 1>, <1, 2>, <1, 3>, <2, 1>, <2, 2>, <2, 3>, <3, 1>, <3, 2>, <3, 3>} (4.) Extensionalität: Zwei Mengen sind identisch (=) g.d.w. sie dieselben Elemente enthalten. " " ist das Zeichen für die Teilmengenbeziehung, dabei steht " für "unechte oder echte" Teilmenge und "" für "echte Teilmenge". Angenommen, D1 und D2 sind zwei Mengen, so ist D1 Teilmenge von D2, wenn alle Elemente von D1 auch in D2 enthalten sind. Ist zudem D1 "kleiner", also nicht identisch mit D2, so ist D1 echte Teilmenge von D2. Ist zudem D1 identisch mit D2, so ist D1 unechte Teilmenge von D2. Z.B. für D1 = {a, b} und D2 = {a, b, c} gilt D1 D2, d.h. {a, b} {a, b, c} aber D1 D2, d.h. {a, b} {a, b, c} daher auch D1 D2, also {a, b} {a, b, c}. Jedoch: nicht D2 D1, denn cD2 aber c D1, d.h. nicht cD1. (Ein durchgestrichenes Zeichen, ≠, , steht kurz für die Negation der korrespondierenden "undurchgestrichenen" Aussage.) Mit diesen Grundbegriffen definieren wir nun den zentralen semantischen Begriff der PL nämlich den der Bewertung für eine gegebene PL-Sprache. Generell: v() = die semantische Bewertung des objektsprachlichen Ausdrucks . Eine Bewertung für eine gegebene PL-Sprache ist ein Paar <D, v> wobei D eine nichtleere Menge von Individuen ist der Individuenbereich - und v ist die Bewertungsfunktion, für die folgendes gilt: Für alle Individuenterme t (Individuenkonstanten a und Individuenvariablen x) gilt: v(t)D Für alle n-stelligen Pädikate Rn (mit n ≥ 1) (der gegebenen PL-Sprache) gilt: v(Rn) Dn d.h. ist irgendeine Menge von n-Tupeln von Individuen aus d. Speziell: v(F1) D , d.h. = eine Teilmenge aus D. 39 Falls die Sprache auch Aussagevariablen (p,) enthält, gilt: v(p) {w,f} (technische Konvention z.B. w = D, f = ) Bewertungsfunktionen von freien Individuenvariablen heissen auch Variablenbelegungen. Sie haben wichtige technische Funktion, für die Definition der Erfüllung von offenen Formeln, Wahrheitswertes von quantifizierten Formeln, und Folgerungsrelation zwischen Formeln. Bewertungsfunktionen eingeschränkt auf Individuenkonstanten und Prädikate bzw. Relationszeichen heissen auch Interpretationsfunktionen, man schreibt dafür I bzw. Iv. Ein Paar (D,I) nennt man eine Interpretation. Eine Interpretation definiert den Wahrheitswert für jeden Satz (geschlossene Formel) der Sprache. Eine Interpretation einer Sprache nennt man auch Struktur oder ein Modell (oder mögliche Welt) für eine Sprache. Wir definieren die Wahrheit von beliebigen PL-Aussagen in einer gegebenen Interpretation/Bewertung wieder rekursiv - d.h. wir definieren die Wahrheit in einer Bewertung zunächst für atomare Aussagen, dann für beliebige aussagenlogische Verknüpfungen, und dann für quantifizierte Aussagen. Für "Satz A ist wahr in Interpretation <D, I>" schreiben wir kurz: <D,I> A, oder vI(A) = w, oder I(A) = w (wobei D implizit vorausgesetzt ist), bzw. <D,I> A, oder vI(A) = f , oder I(A) = f. Der Wahrheitswert von A hängt dabei nur von <D,I> ab. Handelt es sich bei A um eine offene Formel, so steht "<D,v> A" für die Bewertung <D,v> erfüllt A. "Erfüllung" für offene Formeln funktioniert wie "Wahrheit" für Sätze Die Unterscheidung offene Formeln versus Sätze ist nicht für den logischen Folgerungsbegriff wichtig , aber philosophisch und linguistisch wichtig. 40 Wahrheit von Aussagen/Erfüllung von Formeln in gegebenen Bewertung <D, v>: (1) Atomare Formeln: Ist R eine n-stellige Relation, und sind t1,…,tn Terme dann <D,v> Rt1…tn gdw <v(t1),…,v(tn)> v(R) (bzw. gdw ). Somit: (D,v) Fa gdw v(a) v(F) Beispiel: D = {1,2,3,4,5} v(R²) intuitiv für ("<") = {<1,2>, <1,3>, <1,4>, <1,5>,<2,3>, <2,4>, <2,5>, <3,4>, <3,5>, <4,5>} v(a) = 1, v(b) = 3 <D,v> Rab <D,v> Rba <D,v> Rab Raa <D,v> Raa <D,v> Rbb, <D,v> Rab Rba. Für Aussagevariablen: <D,v> p g.d.w. v(p) = w. (2) AL-Verknüpfungen: entsprechen den Wahrheitstafeln und werden kurz so wiedergegeben: (2a) <D,v> A g.d.w. nicht <D,v> A (2b) <D,v> A B g.d.w. <D,v> A und <D,v> (2c) <D,v> A B g.d.w. <D,v> A oder <D,v> B (oder beides) (2d) <D,v> A B g.d.w. <D,v> A oder <D,v> B (oder beides) (3) Quantifizierte Formeln: Referentielle Semantik nach Tarski: Es darf viel mehr Individuen in D geben als Individuenkonstanten in L. Historisch zuvor: substitutionelle Semantik nach Bolzano; sie macht die Annahme: für jedes d D gibt es einen Namen n in der Sprache L mit v(n) = d. Für gewisse Zwecke sinnvoll; aber generell zu eng. Notation: Für eine gegebene Bewertungsfunktion v ist die Bewertungsfunktion v[x:d] gleich v außer dass sie der Variable x das Individuum d zuordnet. Ebenso ist v[x1:d1,…,xn:dn] gleich v, außer dass diese Funktion allen xi di zuordnet (1≤i≤n). (3a): <D,v> xA g.d.w. für mindestens ein dD, (D,v[x:d]) A. (3b): <D,v> xA g.d.w. für alle dD, (D,v[x:d]) A. 41 Z.B.: <D,v> xFx gdw dD, <D,v[x:d]> Fx g.dw. dD, d v(F). Z.B. <D,v> yxRxy gdw (Umformungen) es gibt ein dD sodass für alle d*D gilt: <d,d*> v(R ) Die Bestimmung des Wahrheitswertes von Formeln erfolgt auch in der PL immer von innen nach außen (wir fangen bei Atomformeln an) Beispiel - Forsetzung: Beispiel: D = {1,2,3,4,5} (R für "<") v(R) = {<1,2>, <1,3>, <1,4>, <1,5>,<2,3>, <2,4>, <2,5>, <3,4>, <3,5>, <4,5>} 'Informeller' metalogischer Beweis von <D,v> x Rxx: (1) dD: <d,d> v(R) (2) dD: <D,v[x:d]> Rxx (3) d D: <D,v[x:d]> Rxx (4) <D,v> xRxx gemäss Festlegung von v(R) und D oben aus (1) semantischer Regel 1 aus (2) gemäß semant. Regel 2a aus (3) gemäß semant. Regel 3b Metalogischer Beweis von <D,v> xyRxy: (1) eD: <5,e> v(R) gemäss Festlegung von v(R) und D oben (2) dDeD: <d,e> v(R) aus (1) gemäß PL-Schlussregel EK metalogisch (2a) dDeD : <D,v[x:d, y:e]> Rxy aus (2) gemäß sR1 (3) dD :eD : <D,v[x:d, y:e]> Rxy aus (2a) gemäß sR2a (4) dD: <D,v[x:d]> yRxy aus (3) gemäß sR3b (5) <D,v> xyRxy aus (4) gemäß sR3a Vereinheitlichung der Notation: wir dürfen auch schreiben v(A) = w/f statt <D,v> / A sowie v[x:d](A) = w/f statt <D,v[x:a]> / A 42 Hinweis 1: Dies ist die ausführliche Version metalogischer Beweise. Es fehlt hier die genau Angabe von AL-Regeln (wie z.B. AL-Ersetzungsregel); „folgt“ heißt einfach folgt "tautologisch"). Metalogische Beweise können auch noch viel abgekürzter bzw. "stark informell" sein (wie in der Mathematik üblich). Hinweis 2: In metalogischen Beweisen der Gültigkeit von objektsprachlichen PLSchlüssen werden wiederum PL-Schlüsse benötigt. Zirkularität! Deshalb ist in der PL nicht unbedingt die Semantik primär; mit mindestens gleichem Recht die deduktive Methode. Hinweis 3: es folgt speziell für "redundante Quantoren": (D,v) xp g.d.w. dD: (D,v[x:d]) p g.d.w. (D,v) p (weil p "x" nicht enthält). Hinweis 4: In der substitutionellen Semantik definiert man: <D,v> xA g.d.w. für mindestens eine Individuenkonstante aA[a/x]. <D,v> xA g.d.w. für alle Individuenkonstanten aA[a/x]. Objekt- vs. Metasprache: Manche Lehrbücher unterscheiden durchgängig syntaktisch zwischen sprachlichen Entitäten als Gegenstück zu mengentheoretischen Entitäten wie folgt: a, b sind Konstanten in L; kursiv a, b, … sind (zugeordnete) Individuen in D; gleichermaßen R, QRelationssymbole; R, Q,… (zugeordnete) Relationen über D, etc. Wir tun das nicht durchgängig. Wir schreiben d1,d2, für Individuen in D; a, b, für Individuenkonstanten; bzw. machen im jeweiligen Kontext klar, was gemeint ist (also ob R für ein Relationszeichen oder für eine Relation steht. (Nur bei Identität unterscheiden wir später zwischen objektsprachlichem und metasprachlichem =). 43 Übungsaufgabe 3.1: Bestimme den Wahrheitswert von PL-Formeln: Unsere PL-Sprache enthalte das zweistellige Prädikat R, das einstellige P, und die freien Individuenvariablen a, b, c - plus natürlich alle logischen Zeichen. Als Bewertung für unsere Sprache wählen wir: D = {Sokrates, Plato, Cäsar}. Für I bzw. v legen wir fest: v(a) = Sokrates, v(b) = Plato, v(c) = Cäsar v(P) = {Sokrates, Plato}. Intensional ist P die Eigenschaft, ein Philosoph zu sein v(R) = {<Plato, Sokrates>, < Cäsar, Sokrates>, < Cäsar, Plato>}. Intensional ist Rxy die Relation "x hat später gelebt als y" Bestimme den Wahrheitswert folgender Aussagen: (a) Pa (a)' Rca (a)'' Pa Rab (b) x(Px Rxb) (c) xPx (d) x(Px yRyx) Wir sind nun in der Lage, zu definieren, wann eine PL-Satz logisch wahr ist. Anstelle der Wahrheitswertbelegungen der AL stehen nun Interpretationen der PL. 1. Ein PL-Satz A ist logisch wahr g.d.w. ihn jede Interpretation <D, I> wahr macht. Wir erweitern die Begriffe L-Wahrheit / Gültigkeit auf (offene) Formeln. Eine Formel A ist logisch wahr g.d.w. sie jede Bewertung <D, v> wahr macht bzw. erfüllt. Gültigkeit von Schlüssen: 2. Ein PL-Schluß / A ist gültig g.d.w. jede Bewertung <D,v>, die alle Prämissen in wahr macht, auch die Konklusion A wahr macht. Notation: Wir schreiben || A (oder A) für "A folgt logisch aus " und nennen dies auch eine Folgerungsbehauptung. Der Schluss / A ist gültig genau dann wenn die Folgerungsbehauptung || A wahr ist. Erinnerung: L-wahre Sätze A entsprechen gültigen Schlüsse mit leerer Prämissenmenge A ist L-wahr gd.w. || A g.d.w. "/ A" ist gültig. 44 Semantische Beweis- und Widerlegungsverfahren in der PL: Die volle PL ist unentscheidbar. Es gibt kein allgemeines mechanisches Standardverfahren, um herauszufinden, ob eine gegebene Aussage logisch wahr ist (... usw.). Denn: während es in der AL für eine Aussage immer nur endlich viele w-Belegungen gibt (nämlich 2n - für n Aussagevariablen), gibt es in der PL für einen gegebene Aussage immer unendlich viele mögliche Interpretationen. Es ist unmöglich, alle möglichen Interpretationen einzeln zu prüfen (analog zur Wahrheitstafelmethode). Die einzige generelle Möglichkeit, die Allgemeingültigkeit von PL-Aussagen semantisch zu entscheiden, ist die über allgemeine metalogische Beweise (dies führt zur Modelltheorie und Metalogik und geht über unseren Rahmen hinaus). Solche Beweise beruhen ihrerseits auf PL-Schlüssen, die "intuitiv" bzw. "informell" angenommen werden. Es gibt einen "Zirkel der Logik": die Metalogik der PL-Semantik (Mengenlehre) enthält die Regeln des des deduktiven PL-Kalküls in "informeller Gestalt". Aus diesem Grund kommt der syntaktisch-deduktiven Beweismethode in der PL weit größere Bedeutung zu als in der AL: viele Beweise lassen sich in der PL syntaktisch einfacher formulieren als semantisch. Allerdings kann man deduktiv nur L-wahre Sätze beweisen; nicht aber kontingente Sätze durch Gegenmodelle als nicht L-wahr widerlegen! ("semi-entscheidbar") Für Widerlegungen braucht man auch in der PL die Semantik: in Form der Konstruktion von Gegenmodellen. (D,v) A Insgesamt arbeiten deduktive Methode und Semantik der PL so zusammen: vermutet man einen Satz als PL-logisch wahr, so versucht man zunächst, ihn deduktiv zu beweisen. Gelingt das nicht, so muß man versuchen, ihn semantisch zu widerlegen, indem man versucht, ein Gegenmodell zu konstruieren - also ein Model, welches den Satz falsch macht. 45 Beispiel: Wir wollen zeigen, daß (xFx xGx) x(Fx Gx) nicht logisch wahr ist Unsere Interpretation lautet D = {1,2}, v(F) = {1}, v(G) = {2}. Wir zeigen, dass (D,v) ein Gegenmodell ist. Beweis: Abkürzung: "v(A) = w" steht für <D,v> A" (D vorausgesetzt) (1) 1v(F) gemäß Festlegung von v(F) und D (2) v[x:1](Fx) = w Aus (1) gemäß semantischer Regel 1 (3) v(xFx) = w aus (2) gemäß semantischer Regel 3a (4) 2v(G) gemäß Festlegung von v(G) und D (5) v[x:2](Gx) = w aus (4) gemäß semantischer Regel 1 (6) v(xGx) = w aus (5) gemäß semantischer Regel 3a (7) v(xFx xGx) = w aus (3), (6) gemäß sR2b und AL-Schluss. Die Prämisse bzw. das Wenn-Glied ist in der Interpretation also wahr. Andererseits ist das Dann-Glied falsch. Beweis: (1) 1v(G) gemäß Festlegung von v(G) und D (2) v[x:1](Gx) = f aus (1) gemäß sR1 (3) v[x:1](FxGx) = f aus (2) gemäss sR2b und AL-Schluß (4) 2v(F) gemäß Festlegung von v(F) und D (5) v[x:2](Fx) = f aus (4) gemäß sR1 (6) v[x:2](FxGx) = f aus (5) gemäss sR2b und AL-Schluß (7)v(x(FxGx)) = f aus (3), (6), Festlegung von D und sR3a. Daher (D,v) (xFx xGx) x(Fx Gx) (gemäß sR2sd) Dies ist wieder ein metalogisches Beweisen. Einige Schritte darin sind "Abkürzungen" mehrere Schritte, deshalb nennt man diese Beweise 'informell'. Letztlich ist ein metalogischer Beweis ein PL-Beweis in der Sprache der Metalogik und unter Benutzung von Definitionen (mengentheoretischen Axiomen) der Metalogik. Zwischen Logik und Metalogik besteht eine unentrinnbare Zirkularität. 46 Methode des finiten Universums: Es gibt ein begrenzt anwendbares Verfahren, um für eine gegebene PL-Aussage systematisch herauszufinden, ob sie logisch wahr ist oder nicht, bzw. einen PL-Schluß, ob er gültig ist oder nicht): die sogenannte Methode des finiten Universums (ausführlich z.B. im Buch von Virginia Klenk). Diese Methode beruht darauf, daß ein Allquantor einer (evtl. unendlichen) Konjunktion entspricht, ein Existenzquantor einer (evtl. unendlichen) Disjunktion. Wir nehmen ein endliches, kleines Modell. Dieses sollte zumindest für jede in der Aussage bzw. im Schluß enthaltene Individuenkonstante ein Individuum enthalten (das wir mit einem Standardnamen benennen). Darüberhinaus nehme man soviele Individuen an, wie es unterschiedliche Quantoren gibt, die in der Aussagen vorkommen oder im Fall eines Schlusses, die in den Prämissen vorkommen, oder die in der Konklusion vorkommen (die höhere Zahl von beiden zählt) (Faustregel) Sei N die Menge der Namen für unsere Individuen. Dann ersetzen Allquantoren durch Konjunktionen, und Existenzquantoren durch Disjunktionen. Beispiel: Mit N = {a,b} wird aus xFx wird Fa Fb aus xFx wird Fa Fb Diese Übersetzungsregel wird auf jede elementare quantifizierte Teilformel angewandt. bei verschachtelten Quantoren von innen nach außen (oder von außen nach innen, es muß dasselbe herauskommen) aus xyRxy wird zunächst x(Rxa Rxb) und daraus die AL-Aussage (Raa Rab) (Rba Rbb) Generell gilt: Jeder PL-Satz impliziert seine AL-Übersetzung, aber nicht umgekehrt. Ist die Aussage nicht AL-wahr (bzw. der Schluß AL-ungültig), so ist auch der entsprechend PL-Aussage nicht PL-wahr (bzw. der PL-Schluß nicht PL-gültig). Falls die übersetzte PL-Aussage sich aber als AL-wahr herausstellt, so können wir nicht immer, sondern nur für Sätze der monadischen PL daraus schließen, dass er PL-wahr ist hier gilt die "Faustregel" aufgrund des sog. 'Herbrand-Theorems' immer. 47 (Für gewisse relationalem Sätze gilt die Faustregel ebenso, z.B. für alle relationalen Sätze der Form 1n1mA n,m0; bzw. allgemein, nach dem "Herbrand-Theorem", für alle Sätze deren duale Skolem-Matrix keine Funktionszeichen enthält. (Es sind sogar alle Formeln der Form x1-ny1,2zm finit entscheidbar.) Generell: Diese Widerlegungsmethode ist in der monadischen Prädikatenlogik korrekt und vollständig. Die monadische PL ist daher entscheidbar. Methode ist ein Speziellfall des erwähnten Herbrand-Theorems für mehrstellige Relationen benötigt man oft unendlich viele Namen, was wiederum die Unentscheidbarkeit der vollen PL zeigt. Übungsaufgabe 3.2: Finde für folgende PL-Schlüsse mithilfe der Methode des finiten Universums heraus, ob sie gültig oder ungültig sind. (AL-Teil: z.B. mit semantischer reductio ad absurdum) Bei relationalen Aussagen: wann ist eine konklusive Antwort möglich, wann nicht? Monadische PL, einlagige Quantoren: sowie umgekehrt 1) xFx xGx / x(FxGx) wird in VL gelöst: N = {a,b} (Fa Fb) (Ga Gb) / (Fa Ga) (Fb Gb) 1 1 1 1 1 1 1 1 1 1 0 1 1 1 (Fa Ga) (Fb Gb) / (Fa Fb) (Ga Gb) 1 1 1 1 1 1 1 1 1 1 0 1 1 1 Widerspr. Gültig Widerspr. Gültig 2) xFx xGx // x(FxGx) sowie umgekehrt sowie umgekehrt 3) xFx xGx // x(FxGx) 4) xFx xGx // x(FxGx) sowie umgekehrt „ 5) xFxa xGxb // x(FxaGxb) 6) xFx xGx // x(FxGx) sowie umgekehrt sowie umgekehrt 7) xFx xGx // x(FxGx) 8) xFx xGx // x(FxGx) sowie umgekehrt [8*) schwer: Beweise: In Formeln der Form xAxB führt es zum selben Ergebnis, ob die beiden nichtverschachtelten elementaren quantifizierten Teilformeln gleichzeitig oder subzessive umgewandelt werden.] Monadische PL, Verschachtelte Quantoren, 9) xFxyFy // xy(FxFy) wird in VL gelöst 48 N = {a,b} Erste Quantorlage; (Fa Fb) (Fa Fb) // x (FxFa) x (FxFn) (Fa Fb) (Fa Fb) // (Fa Fa) (Fa Fb) (Fb Fb) (Fa Fb)) 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Gültig 10) xy(FxFy) / xFx 11) x(FxyGy) / xFx yGy sowie umgekehrt 12) x(FxyGy) xFx yGy " 13) xFx yGy x(FxyGy) 14) xFx yGy / x(FxyGy) 15) x(FxyGy) / xFx yGy 16) x(FxyGy) / xFx yGy 17) xFx yGy / x(FxyGy) Relationale PL 18) xyRxy yxRxy in VL gelöst: x(Rxa Rxb) / y(Ray Rby) (von innen nach außen) (Raa Rab) (Rba Rbb) / (Raa Rba) (Rab Rbb) 1 1 0 1 1 1 1 1 0 1 b 0 0 0 1a 1 1 1 0 0 0 0 0a 1 1 0 1 0 1 1 1 0 0b 0 0 0 1 Ungültig 19) xyRxy // yxRxy was kann man in diesem Fall schließen ? (Siehe oben.) 20) xyRxy // xRxx " 21) xyRxy // xRxx " 22) xyRxy // xRxx " 23) xyRxy // xyRxy " 24) xRxx // xRxa " 25) xyzRxyz // xyyRxyz mit N={a,b,c} würde Prämisse und Konklusion 27 Literale haben, kann man nicht mehr aufschreiben. Übung 3.3 für Fortgeschrittene: Warum versagt die Methode des finiten Universums, um ein Modell für folgende Vierer-Konjunktion von PL-Formeln zu finden. Die Konjunktion besagt, dass die zweistellige Relation R "kleiner als" irreflexiv, aymmetrisch und transitiv ist also eine partielle Ordnungsrelation, visuell dargestellt als azyklischer Graph welche keine Endelemente bzw. grössten Elemente hat. xRxx xy(RxyRyx) xyz(RxyRyzRxz) xyRxy Ist die Aussage erfüllbar? (unerfüllbar gdw Negation gültig) Ist sie gemäß der Methode des finiten Universums erfüllbar? (unerfüllbar gdw Negation AL-gültig) 49 Einige semantische Theoreme (und Metatheoreme) der PL: (1.) Alle Theoreme, Schlüsse und Metatheoreme der AL gelten auch in der PL. Der Unterschied ist nur, daß wir für Aussagevariablen bzw. Schemabuchstaben in AL-Theoremen nun beliebige PL-Aussagen einsetzen dürfen Z.B. sind Fa, Fa Ga / Ga / xFx (xFx xGx ) / xFx xFx aussagenlogisch gültig bzw. L-wahr. Instanz von A, A B / B / A (A B) / A A bzw. p, pq / q Hinweis: jede nicht AL-zerlegbare Teilformel eines PL-Satzes/Schlusses (eine sogenannte elementare Teilformel) wird wie ein AL-Schemabuchstabe behandelt. Ein elementarer Teilsatz steht niemals im Bereich eines Quantors. Übungsaufgabe 3.4: Was ist die aussagenlogische Form der folgenden Formeln und/oder Schlüsse: a) x(FxGx) xFxQy, (b) Fa z(xRxz y(FyGyz)), (c) (FaGa) / (Fa Ga), (d) (FaxGx) xRxx(FxGx)), (e) xFx xGx) xFx, (f) x(Fx Gx) xFx, (g) (xyFxy xyFxy). 3.5 Welche der folgenden gültigen Schlüssen der PL sind aussagenlogisch gültig? Ermitteln Sie hierfür die jeweilige aussagenlogische Form? xFx xGx) || xFx, x(Fx Gx) || xFx, xFx, xFx xGxHx), xGx Qa || Qa xFx , xFx xGxHb), xGx Ha || Ha Hb (Frage: geht es auch mit HaHb als Konklusion?) 50 (2.) Semantische Formulierung und Gültigkeit der Grundregeln unseres deduktiven Kalküls S Unkritische Regeln: (UI) xA || A[t/x] für beliebige A, x und t Universelle Instanziierung Beispiel: xFx || Fa Gültigkeitsbeweis für UI in PL schwierig: nur möglich mittels Metalogik Z.B.: Beweis der Gültigkeit von (UI) xA || A[t/x] 1) (D,v) xA 2) (D,v[x:d]) A für alle dD Präm aufgrund Regel sR3b (und AL) 3) (D,v[x:v(t)]) A aus 2 mittels UI in Metalogik 4) (D,v) A[t/x] aus 3 mittels Koinzidenzlemma das man durch Induktion nach dem Formelaufbau von A metalogisch beweist; siehe später. (zirkulär!) Ähnlich schwierig zu beweisen sind die sematische Versionen weiterer Regln: (EK) A[t/x] || xA Existenz-Einführung in der Konklusion Beispiel: Fa || xFx (UG) Universelle Generalisierung: Wenn A1, ..., An || B[a/x], und die Individuenkonstante a kommt weder in A1, ..., An noch inB vor, dann auch A1, ..., An || xB. (EP) Existenzeinführung in der Prämisse Wenn A[a/x], B1, ..., Bn || C, und die I.k. a kommt weder in C noch in B1, ..., Bn noch in vor, dann auch xA, B1, ..., Bn || C. 51 4. AL-Äquivalenzkalkül Zwei Formeln A, B sind logisch äquivalent gdw || A B. Zwei L-äquivalente Formeln haben dieselbe Konsequenzenmenge, oder den selben logischen Gehalt: || A B gdw Cn(A) = Cn(B). Sie drücken dieselbe Proposition aus. (Klammerung:""bindet nachgereiht) Basis-Äquivalenzgesetze des Äquivalenzkalküls Ä: (DN) A A doppelte Negation (Komm) (A B) (B A) Kommutativität von (Komm) (A B) (B A) Kommutativität von (Ass) (A (B C)) ((A B) C) Assoziativität von (Ass) (A (B C)) ((A B) C) Assoziativität von (Idem) A (A A) Idempotenz von (Idem) A (A A) Idempotenz von (Distr) (A (B C)) ((A B) (A C)) --Distributivität 1 (Distr) (A (B C)) ((A B) (A C)) --Distributivität 2 (DM) (A B) (A B) deMorgan (DM) (A B) (A B) deMorgan (Def) (A B) (A B) Bedeutung von (Def) (A B) ((A B) (B A)) Definition von (ÜbTaut) A (B B) A überflüssige Tautologie (ÜbKont) A (B B) A überflüssige Kontradiktion (Taut) A (B B) (B B) Tautologie (Kont) A (B B) (B B) Kontradiktion (Abs) A (A B) A -Absorption (Abs) A (A B) A -Absorption 52 n-stellige Operationen: Kommutativität, Assoziativität und Idempotenz von und erlauben uns n-stellige Konjunktionen und Disjunktionen über Mengen von Formeln ohne Klammern geschrieben, einzuführen. {A1,…,An} A1 … An bzw. {A1,…,An} Speziell {A} =df {A} =df A, =df pp, =df pp. A1 … An bzw. Generalisierte Äquivalenztheoreme (GAss) (A n [beliebige 2er-Klammerung) A1 An (GÜbTaut) A (CBEB) A (GÜbKont) A (CBEB) A " (GTaut) (CBEB) BB " (GKont) (CBEB) BB " [(GAbs) AB(AC) AB " [(GAbs) AB(AC) AB " (GDistr) [2 Schritte herleitbar über Assoz] (hier nur durch nm Schritte herleitbar; wichtig) (A1…Am) (B1…Bn) (A1B1) B … (AmBn) (mn Disjunkte) (GDistr.) (A1…Am) (B1…Bn) (A1B1)2) … (AmBn) (mn Konjunkte) (GDM) ZB: (A1An) = (A1An) (nur durch viele Schritte herleitbar) (A1An) = (A1An) Notation: Wenn B eine Teilformel von A ist, dann bezeichnet A[C/B] eine Formel, die aus der Ersetzung von einigen Vorkommnisse von B durch C in A resultiert (variable Referenz) Ersetzungsregel (ER): ("Regel der Ersetzung von Äquivalenten") Ist nachweislich korekt: Semantische Version: Wenn || B C, dann || A A[C/B]. Syntaktische Version: | anstelle von ||. 53 Der Kalkül Ä: Basis-Äquivalenzen, plus Ersetzungsregel Der Kalkül Ä ist nachweislich korrekt und vollständig in Bezug auf Herleitung aller Äquivalenzen Beispiel: Beweis von | ((pq) (qr)) (pqr) (pq) (qr) | --------------DeM (pq) (q r) | -------------Def (pq) (q r) |-------------DeM (pq) (q r) |-------------DN (pq) qr) | ------------Ass (Wegfall von Klammern) pqq r |------------Idem pqr Übung 4.1: Beweisen Sie die folgenden Äquvalenzen in Ä: (A B) (B A) Kontraposition (A B) (A B) Falsifikation (AB)(AB) (A B) ((pq) (qr)) (pq) (p p) p (p (q r)) (p q r) (p (q r)) (q (p r)) (A B) (A C) (A B C)) in Ä: 54 (A B) (C B) (A CB) ("" bindet nach ",) (A B) (C B) (A C B) A (A B) A B A (A B) AB p (q r)) (r (p q)) Normalformen: Eine Aussagevariable oder deren Negation wird Literal (auch: Basissatz) genannt wir schreiben ±pi für "pi" oder "pi". Definition (Normalformen): 1. Eine konjunktive Normalform KNF ist eine Konjunktion von (distinkten) Disjunktionen von (distinkten) Literalen. (± p1,1 …±p1,n1) … (pm,1 … ±pm,nm) ein elementares Konjunkt(ionsglied) Beispiel: (p q) (r p q), aber nicht (pq), p (q (rp)), usw. 2. Eine disjunktive Normalform DNF ist eine Disjunktion von (distinkten) Konjunktionen von (distinkten) Literalen. (± p1,1 …±p1,n1) … (pm,1 … ±pm,nm) Beispiel: (p q) (r p q), aber nicht (pq), p (q (rp)), usw. 3. B ist eine KNF von A gdw B eine KNF ist, ||BA und P(B) P(A) gilt (wobei P(A) = Menge der in A vorkommenden Aussagevariablen) 4. B ist eine DNF von A gdw B eine DNF ist, || BA und P(B) P(A). Eine Formel A kann mehrere verschiedene KNFs oder DNFs haben (nicht ineinander überfahrbar durch Permutation von Konjunkten und Disjunkten): Z.B.: pq: KNFs: nur pq DNFs: pq, (pq) p q, (pq) (pq) (pq) pq: DNFs: nur pq KNFs: pq, (pq)p q, (pq) (pq)(pq) 55 Definition: Eine KNF (DNF) einer Formel A wird irreduzibel genannt, wenn sie durch weitere Äquivalenzumformungen nicht weiter gekürzt werden kann. Kurz: IKNF, IDNF Beispiele: (pq) p q ist keine irreduzible DNF von pq, nur pq. (pq) (pq)(pq) ist keine irreduzible KNF von pq, nur pq. Mithilfe der folgenden Prozedur können wir jede Formel A in eine DNF oder KNF von ihr umwandeln: (1) Wir eliminieren und via Def und Def (2) Wir bringen 's vor Aussagevariablen via GDM und GDM, DN. die sog. Negations-Normalform. (3) Wir produzieren eine kurze KNF oder DNF via GAss, GAbs, GAbs, GTaut, GKont, IdemIdem. Sowie: für KNF führen wir GDistr durch für DNF führen wir GDistr durch. 4. Durch die Anwendung weiterer Äquivalenzumformungen können wir immer eine irreduzible KNF oder DNF produzieren. 56 Beispiel: (p q) (q (rp)) |------------------------------ Def (p q) (q (rp)) |------------------------------ 2 x DM (p q) (q (r p)) |------------------------------ 3 x DN (p q) (q (r p)) (= Negationsnormalform) |------------------------------ 2 x Ass p q (q rp) ist eine DNF, aber keine IDNF |------------------------------ Absorp p q Ist eine IDNF und eine IKNF Wenn wir nicht die Abkürzung der Absorption benutzt hätten, sondern mit genereller Distribution fortgefahren wären, wäre die Umformung wie folgt weitergegangen: p q (q rp) |------------------------------ GDistr. (pqq) (pqr) (pqp) |----------------------------1xIdem, 1xGTaut (pq) (pqr) |----------------------------Absorp pq Übung 4.2: Produzieren Sie kurze irreduzible KNFs und DNFs der folgenden Formeln: (Klammern ergänzen) (s t) (p q) (p (p q)) ((pr)p) (p1 (p2 p3)) ((p1 p2) p3) (s r) (p q) r (p (q (rq))) p ((rq) s) (pr s (qr))) r (s t)) r) s(st)) 57 (p q) (q (rp)) Normalformen sind wichtig für automatisiertes Theorem-Beweisen durch Resolutions-Widerlegung! 1. Wir wandeln einen Schluss | A in ,A um und versuchen daraus ("Falsum", Widerspruch) zu beweisen. 2. Wir wandeln , A in eine Menge ("Konjunktion") von elementaren Disjunktionen (sog. Klauseln) um: 3. Wir wenden nur die (einzige) Regel der Resolution an: Spezialfall: A, A / pp ( = pp = Widerspruch) AB, AC / BC solange bis wirpp produziert haben. Der Resolutions-Widerlegung ist ein vollständiger Kalkül. Beispiel: Beweis von pq, qr, rs || ps durch Resolutions-Widerlegung: pq, qr, T rs || ps T (ps) T T ps pq, p q, r , rs, T : Transformation in Klauseln Umwandlung in Sätze (Umwandlungsschritte) ps s p pp Resolutionsschritte (Widerlegungsbeweis erfolgreich!) 58 Definition ausgezeichnete Normalform: 1. A ist eine ADNF (eine ausgezeichnete DNF) von B gdw A eine DNF von B ist, deren elementare Konjunktionsglieder jedes pP(B) genau einmal enthalten, entweder unnegiert oder negiert. 2. Analoges gilt für eine AKNF (ausgezeichnete KNF). Wir können eine DNF von B zu einer ADNF von B durch den folgenden Trick erweitern: wenn die DNF ein Disjunkt D enthält, welches eine Variable pP(B) nicht enthält, dann ersetzen wir es durch (Dp) Dp) nach Distr. gleiches für KNFs. Beispiel: pq ist eine ADNF von sich selbst, aber keine AKNF. Die AKNF ist (pq) (pq) (pq) Theorem (ausgezeichente Normalform): 1. Jedes Proposition A d.h. alle mit A L-äquivalenten Formeln A' besitzen eine einzige ADNF und eine einzige AKNF (abgesehen von - bzw. -Permutationen. 2. Jedes elementare Disjunkt von ADNF von A entspricht einer Zeile von A's Wahrheitstafel, welche A wahr macht. Sprachliches Pendant zu möglichen Welten. 3. Es gibt genau 2(2n) (verschiedene) Propositionen ausdrückbar in L({p1,…,pn}), die jeweils mit einer eindeutigen ADNF, und AKNF, in p1,,pn korrespondieren. Übung 4.3: Wie lauten die ausgezeichneten disjunktiven Normalformen von 1. p q 2. p q 3. (pq) p 4. (pr) (qr) 59 5. Der PL-Äquivalenzkalkül PL-Basisregeln von Ä: Man benötigt folgenden Äquivalenztheoreme für Umformungen in pränexe Normalform: (Umb) xA yA[y/x] Gebundene wobei y nicht frei in A, xA yA[y/x] Umbenennung und kein freies x in A im Bereich eines y-Quantors ist sichere Strategie: y neu () xA xA Zusammenhang xA xA Allquantor-Existenzquantor (ÜQ) Überflüssige Quantoren: Wenn x nicht frei in A: xA A, xA A (HDist) Unter der Annahme: x nicht frei in A: A xB x(A B) Distribution durch A xB x(A B) Herausziehen/Hereinziehen von A xB x(A B) Quantoren für und A xB x(A B) (ÄDist) x(A B) xA xB Äquivalenzdistribution x(A B) xA xB für , Weitere Äquivalenztheoreme (herleitbar, keine Basisregeln) (HDist Distrib. durch Heraus/Hereinziehen für (A xB) x(A B) wenn x nicht frei in A (xA B) x(A B) wenn x nicht frei in B (A xB) x(A B) wenn x nicht frei in A (xA B) x(A B) wenn x nicht frei in B (ÄDist): x(A B) (xA xB) Übung 5.0 Beweise HDist und ÄDist für aus den Basisregeln Herleitbare Hilfsregel, für schnelle Äquivalenzumformungen nützlich: (Komm) --Vertauschung bei nichtüberlappender Bindung: Wenn x nicht frei in A und y nicht frei in B: xy(A B) yx(A B) xy(A B) yx(A B) (QVert) Quantorenvertauschung, nur bei gleichen Quantoren: xyA yxA xyA yxA 60 Zur Information: Einseitige Implikationstheoreme: Einseitige Distributionen: xA xB x(A B) x(A B ) xA xB x(A B ) (xA xB) x(A B) xA xB x(A B) (xA xB) x(A B) (xA xB) Einseitige Quantorenvertauschung: xyA yxA Variablen-Identifizierung: setze "()" zur besseren Veranschaulichung xA(x,x) xyA(x,y) xyA(x,y) xA(x,x) Definition der pränexen Normalform: Eine pränexe DNF ist eine Formel beginnend mit Quantoren gefolgt von einer quantorenfreien DNF. Schematische Struktur: x1… xn ( (Fx1Rx1x2) (Gx1x3 Fx2) … ) analog für PKNF Beispiel von Ä-Umformung (Äquivalenzkalkül der PL): x(yRxy (z(Qxz tFxat) zGxz) ) |----------------------------------------------- Def x(yRxy (z(Qxz tFxat) zGxz) ) |----------------------------------------------- Def x(yRxy (z(Qxz tFxat) zGxz) ) |----------------------------------------------- Def DN x(yRxy (z(Qxz tFxat) zGxz) ) |----------------------------------------------- ÄDist x(yRxy z( (Qxz tFxat) Gxz) ) |----------------------------------------------- GAss x(yRxy z( Qxz tFxat Gxz) ) |----------------------------------------------- HDist xy(Rxy z( Qxz tFxat Gxz) ) |----------------------------------------------- HDist xyz(Rxy (Qxz tFxat Gxz) ) |----------------------------------------------- GAss xyz(Rxy Qxz tFxat Gxz) |------------------------------------------------HDist xyzt(Rxy Qxz Fxat Gxz) (eine PDNF und PKNF) 61 Hinweis: hätte x(yRxy (z(Qxz yFxay) zGxz) ) dagestanden, hätten wir zu erst „yFxay“ gebunden in „tFxat“ umbenennen müssen, um den -Quantor herausziehen zu können. x(yRxy (z(Qxz yFxay) zGxz) ) |----------------------------------------------- Def x(yRxy (z(Qxz yFxay) zGxz) ) |----------------------------------------------- Def x(yRxy (z(Qxz yFxay) zGxz) ) |----------------------------------------------- Def DN x(yRxy (z(Qxz yFxay) zGxz) ) |----------------------------------------------- ÄDist x(yRxy z( (Qxz yFxay) Gxz) ) |----------------------------------------------- GAss x(yRxy z( Qxz yFxay Gxz) ) |----------------------------------------------- HDist xy(Rxy z( Qxz yFxay Gxz) ) |----------------------------------------------- HDist xyz(Rxy (Qxz yFxay Gxz) ) |----------------------------------------------- GAss xyz(Rxy Qxz yFxay Gxz) |------------------------------------------------gebUmb y: t xyz(Rxy Qxz tFxat Gxz) |------------------------------------------------HDist xyzt(Rxy Qxz Fxat Gxz) (eine PDNF und PKNF) . 62 Algorithmus der Umformung: 1) Elim. Von , ; Umformung der ganzen Formel in Negationsnormalform ( vor Atomformeln bringen durch aussagenlogische Äquivalenzumform. und ) 2) Quantoren vorziehen durch ÄDist, HDist, evtl. nach gebundener Umbenennung) 3) -Distributionen in der Matrix zum Schluss Übungen 5.1: Formen Sie die folgenden Formeln in eine PDNF, oder PKNF um: Führen Sie dabei möglichst wenig neue Quantoren ein. x(FxyRxyzQxz)) x(Fx yRxy zQxaz)) x((yRxy zQxz) (z(Rxz Fz)) x((yTxya zSxz) (yTxy Rxxx)) (was wenn ohne a?) xy(Fxy Gxy) xy(Hxy Gxy) xy(Rxy z(Qyz Szx)) xy(Rxy y(Qyy Sx)) x(y(Fxy Gxy) z(Hxz Gxz) ) xFx xGa) (xQxaxRx) xFxxGx) (xHxxKx) x(Fxy(GyHy)) Hinweis zur Aufgabe xy(Rxy y(Qyy Sx)): Wie komme ich von xy(Rxy y(Qyy Sx)) zu xy(Rxy (Qyy Sx)) ? Antwort: Zum Beispiel über H-Dist invertiert zu: x(yRxy y(Qyy Sx)) Dann mit Ä-Dist. zu xy(Rxy (Qyy Sx)) Vorgriff auf Identitätskalkül: xy(Fy xy) ) x(Fx y(Fy xy)). 63 6. PL mit Identität und Funktionszeichen Das Alphabet enthält zusätzliche nichtlogische Symbole: Für jedes n>0: eine abzählbare Menge Fn von n-stelligen Funktionssymbolen f, g, f1, f2, (Individuenkonstanten a als 'nullstellige Funktionen', Aussagevariablen als 'nullstellige Prädikate' auffassbar) Zusätzliches logische Symbol: die (objektsprachliche) Identität. Semantik: Bewertungen (D,v). Neu ist nur Interpretation von Funktionszeichen: Für f Fn, v(f) ist eine n-stellige Funktion über D. f ordnet jedem n-Tupel von Individuen in D genau ein weiteres Individuum in D zu. Man schreibt v(f): DnD. Erläuterung zu Funktionen: (Vorgriff auf Mengenlehre): Im folgenden verwenden wir = für die Identität der mengentheoretischen Metasprache, und für die Identität der Objektsprache, sowie für die Implikation der mengentheoretischen Metasprache, und für die Implikation der Objektsprache. Eine einstellige Funktion (Abbildung) von D nach D, geschrieben als f: DD, ist eine binäre Relation f DD, also eine Menge von Paaren <x,y> aus DD, welche zwei Bedingungen erfüllt (jetzt steht "f" statt "v(f)"; Metasprache): (1) Funktionalität oder Rechtseindeutigkeit: x,y,z: <x,y> f und <x,z> f y=z. schreib : y = f(x) f(x) heisst Wert von f an (der Stelle) x -- i.e. das einzige y so dass <x,y>f gilt. (2) Der Argumentbereich (domain) von f, dom(f) := {x: y(<x,y> f)}, deckt alle Objekte in D ab. Der Wertebereich (range) von f, ran(f) := {y: <x,y>f für irgendein x} kann eine echte Teilmenge von D sein. 64 Hinweis. in "f:DD" steht "" nicht für eine Implikation, sondern eine Zuordnung. (Beispiel: x N: y = 2x; x N: y = x2) Analog für n-stellige Funktionen: Dn = DD (n-mal), also eine Menge von n-Tupeln <x1,,xn> aus D. Eine n-stellige Funktion von Dn nach D, geschrieben als f: DnD, ist eine n+1stellige Relation f DnD, also eine Menge von n+1-Tupeln aus Dn+1, welche folgende Bedingungen erfüllt: (1) Funktionalität oder Rechtseindeutigkeit: x1,,xn Dn, y,zD: <x1,,xn,y> f und <x1,,xn,z> f y=z. (2) Der Argumentbereich dom(f) := {<x1,,xn>: y(<x1,,xn,y> f)} = Dn , d.h. er deckt alle n-Tupeln in Dn ab. Zurück zur Sprache: Z.B. stehe "m(x)" für "die Mutter von x", D ist der Bereich der Wirbeltiere. "a" für "Peter. Dann bezeichnet "m(a)" die Mutter von Peter. Mit "b" für "Anna" steht „m(a) b“ für "die Mutter von Peter ist identisch mit Anna". Mit "f(x,y)" für Addition "x+y". Dann steht "f(3,4) 7" für 3+4 = 7 Man kann beliebig komplexe Terme bilden, z.B. m(m(m(a))) = die (mütter-mütterliche) Urgroßmutter von a. m(v(m(a))) = die (mütter-väterliche) Urgroßmutter von a. m(x(x(a))) mit x ist „m“ oder „v“ = eine Urgroßmutter von a. Oder: f(1,f(2,f(3,f(4,5))))) = 1 + (2 + (3 + (4 + 5))))) = 1+2+3+4+5. Oder: f(g(x,y),h(g(x,y),z)). (1+2)3 +4(5+6) Usw. Rekursive Definition von "(singulären) Termen von L " : T bezeichnet die Menge aller Terme Fn = Menge n stelliger Funktionszeichen V Menge der Individuenvariablen, C Menge der Individuenkonstanten 1. s V C s T 2. f Fn (für n>0), und t1,…,tn T ft1…tn T 65 Klammerkonvention: Wir dürfen auch f(t1,…,tn) statt ft1…tn schreiben. Nur dann kann man obere Indizes bei Funktionszeichen ohne Konfusionsgefahr weglassen. Wir dürfen auch (ab) statt ab schreiben. Weitere Formregeln: Rn Menge der n-stelligen Relationssymbole Fo(L) auch für Menge aller Formeln von L 1. RRn, t1,…,tn T t1, t2 T Rt1…tn Fo(L ) atomare Formeln t1t2 Fo(L) Restlichen Formregeln wie zuvor Wiederholung Terminologie: Eine Formel ohne Quantoren wird singulär genannt. Eine atomare Formel oder ihre Negation nennt man Literal, oder Basis-Satz (Carnap). Eine Formel der Form x1…xnA für singuläres A wird rein universell genannt Eine Formel der Form x1…xnA für singuläres A wird rein existentiell genannt Rekursive Extension der Bewertungsfunktion v auf beliebige komplexe Terme: 1. Bewertung von Termen: (D,v) (i) Für t VC: v(t) D. (ii) Für n>0, f Fn, t1,…,tn T: v( f(t1,…,tn) ) = v(f)(v(t1),…,v(tn)) Beispiel: +: NN N D = {1, 2, 3, 4, ...} , v(a) = 1, v(b) = 2, v(c) = 3, v(f) = + v(f(a, b)) = v(f)(v(a), v(b)) = +(1, 2) = 1 + 2 = 3 = v(c). Daher: <D,v> f(a,b) c. v(f(c, f(a, b)) = v(f)(v(c), v(f(a,b))) = +(3, 1+ 2) = (1 + 2) + 3 = 1 + 2 + 3 = 6 66 2. Bewertung von Formeln: Wir bisher Also für atomare Formeln: Für n0, RRn, t1,…,tn T: (D,v) Rt1…tn g.d.w. <v(t1),…,v(tn)> v(R) auch: v(Rt1tn) = w/f Neu ist: (D,v) t1t2 g.d.w. v(t1) = v(t2). Termsubstitution A[t/x]: Definition wie zuvor. Koinzidenztheorem Koinzidenz von Substitution und Bewertungswechsel v(A[t/x]) = v[x:v(t)](A) (vorausgesetzt A[t/x] ist konfusionsfrei) Metalogischer Beweis durch Induktion: später UI-Theorem: || xA A[t/x] vorausgesetzt A[t/x] ist konfusionsfrei, d.h. der Term t enthält keine I.v., die im Bereich eines Quantors in A liegt, der sie bindet. Semantischer Beweis mittels Koinzidenztheorem. ("informeller Beweis in Metasprache) Durch Kontraposition: wir zeigen || A[t/x] xA. Wir müssen zeigen: für alle <D,v> : wenn <D,v> A[t/x], dann <D,v> xA Gemäß UG genügt es, dies für beliebiges <D,v> zu zeigen. 1) Angenommen für beliebiges <D,v> gilt <D,v> A[t/x], also v(A[t/x]) = f. 2) Dann folgt gemäß Koinzidenztheorem, v[x:v(t)](A) = f, aus 1) 3) Also gibt es dD (nämlich v(t)), sodass v[x:d](A)=f. (EG in Metalogik, aus 2) 4) Daher v(xA) = f (semant. Regel 3b +AL, aus 3) 5) Daher <D,v> xA (semant. Regel 2a, aus 4). 6) Wir haben damit gezeigt, für beliebiges und damit (UG!) für alle <D,v>, wenn <D,v> A[t/x], dann <D,v> xA, somit || A[t/x] xA. Q.E.D. 67 Erinnerung: UG: | A[a/x] / | xA (sofern a nicht in , A) gilt nur für Individuenkonstanten (und -variablen), nicht für komplexe Terme (Funktionsausdrücke): Gegenbeispiel: A = Fx, t = f(a). x(FxFf(x)), Fa | Ff(a) der Term f(a) taucht nicht in der Prämissenmenge auf. Aber x(FxFf(x)), Fa |-/- xFx ! Zusätzliche Regeln und Axiome für S= (S mit Identität): tt Identität - -Einführung: (Id):| tt für jedes tT (Anm.: äquivalent mit | x(xx) ) Extensionaliät (Substitution von Identischem, Gleichheit) bzw. -Beseitigung: (Ext): | t1t2 / | A[t1/x] A[t2/x] für alle xV, tiT t1t2 (sofern die Substitution konfusionsfrei ist) Sequenzenpräsentation A[t1/x]A[t2/x] Regelschreibweise (Satzpräsentation): t1t2 / A[t1/x] A[t2/x] Einige Instanzen von (Ext): ab / Fa Fb t1->a, t2b, A Fx, A[t1/x] Fa, A[t2/x] -> Fb ab / xRxa xRxb A -> xRxy, x -> y , t1 -> a, t2 -> b A[a/y] -> xRxy[a/y] = xRxa, A[b/y] -> xRxb . Übung 6.1 Bilden Sie die Instanzen von (Ext) für die Prämisse af(b), wobei A folgende Formel ist (und x ersetzt wird): (i) FxGx, (ii) yFxy, (iii) RaxyRyf(x), (iv) Fx(Gyf(x)Gg(x)), (v) yz(Rxyz xQg(z)x). 68 Wichtige abgeleitete Identitätstheoreme und -regeln: 1. Symmetrie: t1t2 / t2t1 Beweis: 1.t1t2 Präm t1t1 = 2. t1t1 t2t1 xt aus 1 (für A -> (xt1)) 3. t1t1 Id 4. t2t1 MP 2,3 (xt1)[t1/x] 2. Transitivität: t1t2, t2t3 /t1t3. Übung 6.2: Beweisen Sie die Transitivität von . 3. (Ext): | {titi' : 1≤i≤n} A[t1/x1,…,tn/xn] A[t1'/x1,…, tn'/xn]) Beweisskizze: Richtung von :zuerst ersetzen wir die Variablen x1,…,xn in A durch neue Variablen z1,…,zn die nicht in A, oder in t1, , tn vorkommen, und erhalten A*. Dann führen wir die sukzessive Substitution zu A*: A*[t1/z1], A*[t1/z1][t2/z2], …, A*[t1/z1]…[tn/zn] durch. A*[t1/z1]…[tn/zn] ist identisch mit A und A*[t1'/z1]…[tn'/zn] ist identisch mit A[t1'/x1,…, tn'/xn]). A[t1/x1,…,tn/xn] A[t1'/x1,…, tn'/xn]) wird impliziert durch { titi' : 1≤i≤n} via (Ext) und AL. Richtung von : folgt aus der Symmetrie von und AL. QED. Übung 6.3 Formalisieren und beweisen Sie: a) Peter ist der Älteste des Teams. Peter ist nicht älter als Pit. Pit gehört zum Team. daher: Pit ist Peter a*) Peter ist der Älteste des Teams. Peter ist nicht älter als Pit. Pit gehört zum Team und ist schwarzhaarig. Daher: Peter ist schwarzhaarig 69 b) Everybody loves my baby. But my baby don't love nobody but me. Daher. Everybody loves me. c) Peter ist der einzige, der mehr trinkt als Hans. Klaus ist Raucher. Peter ist Nichtraucher. Daher: Klaus trinkt nicht mehr als Hans. [Aufgaben mit Funktionszeichen:] d) Uwe ist der Vater von Tom. Peters einziger Bruder ist der Vater von Tom. Also ist Peters einzige Bruder Uwe. e) Uwe ist der Vater von Tom. Der Vater von Tom ist ein Bruder von Peter. Also ist Uwe ein Bruder von Peter. Übung 6.4 Beweisen Sie: a) x(xt) diskutieren Sie die Bedeutung für b) | Ft x(Fxxt) Ontologie und Wissenschaftstheorie c) | Ft x(xt Fx) Anm.: Ein Satz wird essentiell quantifiziert genannt gdw er quantifiziert ist und nicht L-äquivalent mit einem singulären Satz. (Gleiches gilt für "essentiell universell" und "essentiell existentiell"). Hinweis: Wir dürfen die Symmetrie und Transitivität der verwenden, und zwar sowohl als Axiom wie als Regel. Als Regel spart man den AL-Schritt des MP. Ausserdem: Wenn man Axiome verwendet, braucht man die Formulierung mit Allquantoren, um die Variablenbedingung (wenn nötig) formulieren zu können. Wenn man Regeln verwendet, braucht man keine keine Allquantoren. Beispiel Symmetrie: i) xy(xy yx) Sym [hier als Axiom verwendet, weil auf nichts bezogen) oder i) t1t2 ii) t2t1 Sym i) [hier als Regel verwendet weil auf vorige Prämisse bezogen] 70 Analog für Transitivität: i) xyz(xy yz xz) Trans (als Axiom) oder i) t1t2 t2t3 ii) t1t3 Trans i) als Regel mit einer Prämisse oder i) t1t2 ii) t2t3 iii) t1t3 Trans i), ii) als Regel mit 2 Prämissen Hinweis/Nachtrag: Zum Umgang für Definitionen (da in den folgenden Kapiteln viele Definitionen eingeführt werden). Beispiel: (pq) def (pq)(qp) Wir verwenden Definitionsschritte in Beweisen in Form eines Schrittes, und Ersetzen Definiendum durch Definiens, oder Definiens durch Definiendum. Beispiel: i) (pq)(qp) ... ii) pq Def aus i) oder i) pq ... ii) (pq)(qp) Def (invers) aus i) Dies kann auf zweilerlei Weisen gerechtfertigt werden: Entweder metasprachlich: "pq " wird als metasprachliche Abkürzung for "(pq)(qp)" angesehen. Oder objektsprachlich: "pq" wird als objektsprachlicher definierter Ausdruck angesehen. Dann sind obige Beweise als eine abkürzende Regelschreibweise zu verstehen, in denen die Definition "(pq) (pq)(qp))" durch zwei Regeln erweitert wird: "(pq)(qp) / pq" und "(pq)(pq)(qp)". 71 7. Äquivalenz- und Ordnungsrelationen Wir sprechen im folgenden öfters über die Relationszeichen R und die dadurch ausgedrückten Relationen v(R); und benutzen als Notation: R steht abkürzend für v(R), a für v(a), f für v(f), usw. Definition (Äquivalenzrelation, Gleichheitsrelation): R bezeichnet eine Äquivalenzrelation über dem Bereich D, bzw. R ist eine Äquivalenzrelation, gdw R zweistellig ist und gilt: (Wir schreiben auch R.) 1. Reflexivität: xRxx 2. Symmetrie: xy(Rxy Ryx) 3. Transitivität: xyz(Rxy Ryz Rxz) Eine spezielle Äquivalenzrelation: Die Identitäts- (oder diagonale) Relation, ausgedrückt durch : v() = {<x,x>: xD}, bzw. v() = '='. Identität '=' ist die feinste Äquivalenzrelation über D. Definition einer Partition bzw. Zerlegung: Eine Partition (Zerlegung, Klassifikation) einer Menge D ist eine Klasse P(D) von paarweise disjunkten und zusammen erschöpfenden Teilmengen von D. P(D) =D. bezeichnet X die Vereinigung aller Mengen D.h. es gilt: für alle x, y P(D), xy = , und Anm.: für X eine Klasse von Mengen, in X Bild: 72 Definition von Äquivalenzklassen: Wenn R eine Äquivalenzrelation über D ist, dann bezeichnet 1. Für jedes aD, [a]R =df {bD: <a,b>R} die R-Äquivalenzklasse von a (in D), oder die Äquivalenzklasse von a modulo R. 2. D/R =df {[a]R: aD} = die R-Partition von D. Übung 7.0: Beweise: Die Mengen in {[a]R: aD} sind disjunkt. Äquivalenzklassen sind eine wichtige Konstruktionsmethode in Philosophie, Ontologie, und Mathematik (Bertrand Russell). Beispiele: Entität identifiziert mit der Äquivalenzklasse von: Mathematik: Rationale Zahl Klasse aller Erweiterungen einer Bruchzahl Reelle Zahl Klasse aller Folgen rationaler Zahlen mit gleichem Grenzwert Kardinalzahl Klasse gleichmächtiger Mengen Logik: Proposition Klasse logisch äquivalenter Sätze Ontologie: Universal Klasse alle typidentischen Tropen (= Eigenschaftsinstanzen) Physik: Zeitpunkt Klasse zeitgleicher Punktereignisse Raumpunkt Maximale Klasse von sich überdeckenden Körpern Weltlinie: Klasse aller genidentischen Ereignisse Übung 7.1: Welche der folgenden Relationen ist eine Äquivalenzrelation? Erläutern Sie wieso (bzw. wieso nicht): x lebt weit weg von y, x hat dasselbe Geschlecht wie y, x ist ein Geschwister von y, x ist ein Nachbar von y, x hat dieselbe Farbe wie y, x hat annähernd dasselbe Gewicht, wie y. 73 Übung 7.1*: Beweise: logische Äquivalenz ist eine Äquivalenzrelation. Übung 7.2: Für eine gegebene Menge D, welche ist die gröbste Äquivalenzrelation (extensional die umfassendste) und welche ist die feinste (extensional die kleinste) Äquivalenzrelation über D, und was sind die korrespondierende Partition von D? Hinweis: Sie dürfen abkürzungshalber in der Übung (nicht in der Klausur) statt der Axiome Reflexivität, Symmetrie und Transitivität, die entsprechenden Regeln verwenden, und sparen dadurch Schritte. Reflexivität: i) t R t Refl von R Symmetrie: i) t R t' ii) t' R t Sym R 1 analog für Transitivität 74 Definition von partiellen Ordnungsrelationen: 1. Eine strikt partielle Ordnung über D ist eine binäre Relation R über D, die die folgenden Konditionen erfüllt: schreibe auch <R statt R Prototyp: < [a. Irreflexivität: x Rxx folgt aus b! ] Übung 7.3* b. Asymmetrie: xy(Rxy Ryx) c. Transitivität (wie oben) 2. Eine schwach partielle Ordnung über D ist eine binäre Relation R über D, die folgendes erfüllt: Prototyp: schreibe R a. Reflexivität (wie oben: xRxx) b. Antisymmetrie (schwache Asymmetrie): xy(Rxy xy)Ryx) d.h.: xy(Rxy Ryx xy) Hinweis: optionale Klammern: (xy) statt xy c. Transitivität. Wir schreiben x <R y für Rxy als strikt partielle Ordnung, und x ≤R y für Rxy als schwach partielle Ordnung. 1) Strikte und schwache Ordnungen sind wechselseitig definierbar: xy( x ≤R y x <R y xy). xy(x <R y x ≤R y xy). 2) Grösser-und-Kleiner ordnung sind interdefinierbar: xy(x <R y y >R x) xy(x R y y R x) Wenn in Beweisen von Definitionen Gebrauch gemacht wird, muss klargestellt werden, was jeweils als Grundbegriff verwendet wird (, , < oder >). 75 Definition von totalen Ordnungen: 1. Eine strikt partielle Ordnung R über D ist eine strikt totale sog. lineare Ordnung gdw sie zusätzlich schwache Konnektivität erfüllt: xy(x <R y y <R x x y). 2. Eine schwach partielle Ordnung R über A ist eine schwach totale (oder lineare) Ordnung gdw sie zusätzlich Konnektivität erfüllt: xy(x R y y R x). Hinweis: In einer nur partiellen (strikten) Ordnung können Elemente unvergleichbar sein. Sie können als gerichtete Pfade eines gerichteten azyklischen Graphen dargestellt werden. Bild: Totale Ordnungen haben keine unvergleichbaren Elemente – ihre Struktur ist linear Bild: Quasi-Ordnungen: In empirischen Anwendungen, haben wir normalerweise keine (partiellen oder totalen) Ordnungen, sondern (partielle oder totale) Quasi-Ordnungen: hierbei können zwei verschiedene Objekte den selben Rang auf der Ordinalskala haben. Dann gilt weder a < b, b < a noch ab. Definitionen und Fakten bezüglich (schwacher) Quasi-Ordnungen: 1. R über D ist eine schwache partielle Quasi-Ordnung g.d.w. R reflexiv und transitiv ist. hi d e f g ab c 76 2. R über D ist eine schwache totale quasi-Ordnung g.d.w. R reflexiv, transitiv und konnex ist. hi d e f g ab c 3. Wir definieren die Relation R der Ranggleichheit durch: Ded.: xy(x R y x ≤R y y ≤R x). Hinweis: R ist eine Äquivalenzrelation s. Übung 4. Wir definieren eine strikte Quasi-Ordnung durch: Def.: xy(x <R y x ≤R y y ≤R x). 5. Wir können jede Quasi-Ordnung über D in eine Ordnung über den Äquivalenzklasssen von D bezügl. R umwandeln. Hinweis: Bei Quasi-Ordnungen fungiert entweder (bzw. ) als Grundbegriff, oder < und (> und ). Denn ist nicht durch < sdefinierbar, wohl aber durch . Übersicht über Arten von Ordnungen: zunehmende logische Stärke partielle Quasi-Ordnung partielle Ordnung totale Quasi-Ordnung Totale Ordnung jeweilige Version: schwach strikt 77 Hinweis: Wie bei den Äquivalenzrelationen dürfen wir auch bei Ordnungsrelationen abkürtzungshalber (nicht in der Klausur) statt der Axiome der Irreflexivität bzw. Reflexivität, Asymmetrie bzw. Antisymmetrie, und Transitivität, die entsprechenden Regeln verwenden. Übung 7.3* Beweise die Irreflexivität: x Rxx von strikten partieller Ordnungen aus der Asymmetrie. Übung 7.3: Welche der folgenden Relationen ist (i) eine Quasi-Ordnungsrelation oder eine Ordnungsrelation - und wenn eines von beiden, ist sie (ii) strikt oder schwach, und (iii) partiell oder total? x wiegt mehr als y (physische Dinge), x ist mehr Geld wert als y, x ist annähernd 20 cm größer als y, x ist mindestens 20 cm größer als y, Ich mag Person x mehr als Person y, Handlung x is moralisch zu bevorzugen gegenüber Handlung y. - Anhand von |: x ist ein Teiler von y, x ist kein Teiler von y. Übung 7.4: Betrachten Sie folgende Quasi-Ordnung R über D = {a,b,c,d}: R = {a≤a, a≤b, a≤c, a≤d, b≤b, b≤c, b≤d c≤c, c≤b, c≤d, d≤d}. Konstruieren Sie die Äquivalenzklassen bezügl. R und die totale Ordnung über D/R. Übung 7.5: Beweisen Sie: (a) Ist R eine schwache partielle Quasi-Ordnung, dann ist R (definiert) eine Äquivalenzrelation. --- (b) >R (definiert) ist irrflexiv und asymmetrisch. Übung 7.5* Beweisen Sie: (a) xy(x>y xy), (b) x,y,z: x>y yz x>z Übung 7.6: Formalisieren Sie und beweisen Sie, unter Berücksichtigung der Eigenschaften der Relationen: 1) Peter ist genauso alt wie Hans. Ute ist nicht genauso alt wie Peter. Daher: Ute ist nicht genauso alt wie Hans. 2) Peter ist älter als Udo. Hugo ist jünger als Udo. Paul ist gleich alt wie Hugo. Daher 78 ist Peter älter als Paul. Übung 7.7: Sind folgende Schlüsse gültig? Falls ungültig, versuche man ein Gegenmodell zu konstruieren, von dem man ausserdem zeigt, dass die Axiome für Quasiordnungen darin erfüllt sind. 1) Susi ist gleich groß wie Hanna. Hanna ist kleiner als Lena. Susi ist kleiner als Maria. Also sind Lena und Maria gleich gross. 1*) Susi ist grösser als Hanna. Lena ist kleiner als Hanna. Susi ist gleich groß wie Maria. Also ist Maria grösser als Lena. 2) Susi ist grösser als Hanna. Hanna ist kleiner als Lena. Also sind Lena und Susi gleich gross. 3) Susi ist grösser als Hanna. Hanna gleich groß wie Lena. Susi ist gleich groß wie Maria. Also ist Maria grösser als Lena. 79 8. Zahlquantoren und definite Deskriptionen Ausdrücke für Zahlen: Teil von Frege’s Programm, "Logizismus" Rekapituliere: {Ai: 1in} = {A1,,An} = A1A2An nx =def x1…xn{xixj): 1≤i<j≤n} D hat mindestens n Elemente Lies: Es gibt ein x1, x2,,xn sodass diese x-e alle voneinander verschieden sind, d.h. x1 verschieden von x2, x1 verschieden von x3. usw. Zum Verständnis der Indizes: Indexbedingung ausgeschrieben: nx = def x1…xn{xixj: 1j jn 1i in i<j} Die Indexmengen 1i<jn laufen über n(n1)/2 Paare: (n1) + (n2)++1 = i=1n1 i = n(n1)/2 nach Gaussscher Summenformel. Bzw. alle Möglichkeiten 2 aus n Elementen herauszugreifen= (n-über-2) = n(n1)/2. Ein Beispiel für n= 4: 4x = i=1: j=2 j=3, j=4 i=2: j=3, j=4 i=3, j=4 x1x2x3x4(x1x2 x1x3x1x4 x2x3x2x4 x3x4) nxFx = def x1…xn({Fxi:1≤i≤n} {xixj :1≤i<j≤n } ) Es gibt mindestens n Fs, oder v(F) hat mindestens n Elemente Beachte: Die Formel x1…xn({Fxi:1≤i≤n} könnte auch in einem D mit nur einem Individuum d wahr sein, wenn alle xi auf d referieren. nx = def x1…xn+1({xixj :1≤i<j≤n} {xixn+1 |:1≤i≤n}) D hat höchstens n Eemente Lies: Für alle x1, x2,,xn, xn+1 gilt: wenn die Variablen x1, x2 ,…,xn voneinander verschiedene Individuen bezeichnen, dann bezeichnet die Variable xn+1 eines der von x1 bis xn bezeichneten Individuen. 80 nxFx = def x1…xn+1({Fxi:1≤i≤n+1} {xi xj) :1≤i<j≤n} {xixn+1 |:1≤i≤n}) Es gibt höchstens n Fs, oder v(F) hat höchstens n Elemente !nx =def nx nx D hat genau n Elemente !nxFx =def nxFx nxFx Es gibt genau n Fs, oder v(F) hat genau n Elemente Insbesondere: !xFx = def !1xFx. Nach Übung 8e) unten, !xFx xy(Fx (Fyxy)) Und nach Übung 8f), !xFx xy(Fy xy). Russell's Definition Übung 8.1 (schwer!): Beweisen Sie, einmal informell-semantisch, dann syntaktisch: Frege's Idee der Reduktion von Arithmetik auf Logik: a) x(Fx Gx) nxFx mxGx (n+m)x(FxGx) a')nxFx mxGx max(n,m)x(FxGx) b) nxFx mxGx (n+m)x(FxGx) c) x(Fx Gx) n!xFx !mxGx !(n+m)x(FxGx). Dies deckt aber nur den finiten Teil der Arithmetik ab. Wir können nicht über „alle“ natürlichen Zahlen in dieser Weise sprechen. (Grenzen des "Logizismus") Weiters, nur optional: d) !nx x1…xny( {xi xj) :1≤i<j≤n} {xiy | 1≤i≤n} ) e) !nxFx x1…xny({Fxi xixj): 1≤i<j≤n} (Fy {xiy : 1≤i≤n}) f) !nxFx x1…xny({xixj): 1≤i<j≤n} Fy {xiy: 1≤i≤n})) (Hinweis: Beweis von f aus e: Fxi über UI xi für y und Spezialfall: !xFx xy(Fy xy) (Russell) (Hinweis: daraus folgt xFx, aufgrund der UI-Instanz "Fxxx".) 81 Russell's Beseitigungsmethode für Eigennamen durch definite Beschreibung : Statt mit Namen kann man Individuen auch mit definiten Beschreibungen benennen. Russell’s „Eliminationsprogramm“: für jeden Namen "a" nimmt Russell eine definite Beschreibung F(x) an. Heisst auch „Jota-Operator“ Definition von Namen: a := xFx, vorausgesetzt !xFx ( dasjenige x, welches...) F kann ein sehr komplexes Prädikat Russell’s Ersetzung von definiten Beschreibungen - sei G eine komplexe Eigenschaft: (kontextuelle Definition = „G“ ist der Kontext in dem definiert wird) Ga = G( x(Fx)) =def x( y(Fy xy) Gx) x(FxGx y(Fy xy)) x(FxGx) !xFx. Hinweis: Wiedergabe von G( x(Fx)) alsx(FxGx) wäre nicht ganz korrekt, denn hier wird nur gesagt, dass "FxGx" eine definite Beschreibung ist, nicht, dass schon "Fx" eine ist. Es könnte ja zwei Fs geben, wobei nur eines davon ist G; dann wäre x(FxGx) wahr, aber x(FxGx) !xFxfalsch. Russells Definition G( x(Fx)) = x(y(Fy xy)) ist wichtig, um mit definiten Beschreibungen logisch umzugehen, auch wenn man nicht Russells Eliminationsprogramm für Eigennahmen annimmt (wie z.B. Saul Kripke), weil viele Individuen nicht durch Eigennamen, sondern durch definite Beschreibungen bezeichnet werden. Übung 8.2 (in der VL): (a) Gemäss der Theorie von Strawson sind Sätze wie "der gegenwärtige Kaiser von Deutschland ist kahlköpfig" weder wahr noch falsch (Wahrheitswertlücken). Was folgt aufgrund von Russells Methode für den Wahrheitswert dieses Satzes? Hinweis: Angenommen falsch ist: KK( xKDx) Die Falschheit von !xKDx x(KDxKKx)kann 2 Gründe haben: !xKDy ist falsch oder !xKDy ist wahr, aberKKx) ist falsch für x ist die innere Negation (s. unten) wahr. xKDx. Im letzteren Fall 82 (b) Diskutieren Sie die resultierende Ambiguität von "Ga" anhand des Beispiels: "der gegenwärtige Kaiser von Deutschland ist nicht kahlköpfig " – was sind die zwei möglichen Lesarten in Russell's Theorie der Namen? KK( xKDx) x(!y(KDyyx)KKx) äußere Negation (logische Lesart) oder x(!y(KDyyx)KKx) innere Negation (intuitive Lesart) 8.3: Sind folgende Argumente gültig? Wenn ja, formalisieren und beweisen Sie. Wenn nein, konstruieren Sie ein Gegenmodell. a) Peter liebt Ute. Ute liebt jemanden, der sie liebt. Daher: Ute liebt Peter. b) Peter ist der Liebhaber von Ute. Ute liebt jemanden, der sie liebt. Daher: Ute liebt Peter. c) Peter ist der Liebhaber von Ute. Daher: Ute liebt Peter. [fehlt hier eine Prämisse?] d) Ute hat einen Liebhaber, aber Peter ist er nicht. Ute liebt nur solche, die sie lieben. Daher: Ute liebt nicht Peter. e) Der Autor der KrV ist nicht der Autor des Faust. Kant ist der Autor der KrV. Daher: Kant hat nicht den Faust geschrieben. f) Die Eltern einer Person sind niemals mit der Person identisch. Daher sind Peter, Peters Mutter, Peters Oma und Peters Urgroßoma mindestens vier Personen. g) Die Eltern einer Person sind niemals mit der Person identisch. Daher sind Peter, Peters Mutter, Peters Oma und Peters Urgroßoma mindestens zwei Personen. h) Die Nachfahren einer Person sind niemals mit der Person identisch. Daher sind Peter, Peters Mutter, Peters Oma und Peters Urgroßoma mindestens vier Personen. Verwende als Zusatzprämissen: xy(ExyNyx), und Transitivität von N. 83 9. Informelle und formelle Mengenlehre Eine Menge = eine 'Sammlung' von Individuen (beliebiger Art), die selbst als Individuum betrachtet wird. Eine Menge lässt sich charakterisieren wenn endlich, rein extensional, durch Auflisten ihrer Elemente: {a1,,an} durch eine gemeinsame Eigenschaft: {x: Px} = die Menge aller Objekte x, für die "Px" gilt. durch eine rekursive Definition: z.B. die natürlichen Zahlen: 0 |N, und wenn n|N, dann (n+1) |N; sonst nichts. Ein Objekt, das keine Menge ist: ein Urelement. Wichtige Charakteristiken von Mengen: sie sind invariant gegenüber Permutationen und Wiederholung ihrer Elemente: {a,b} = {b,a} = {a,a,a,b,b} etc. Sprache der informellen Mengenlehre terminologische Konventionen: A,B (A1, A2) stehen für beliebige Mengen ; a,b (a1,) … stehen für Urelemente. Variablen x, y (x1, x2,) variieren über Mengen oder Urelemente. Ausnahme von der Groß-/Klein-Konvention: f, g (f1,) für Funktionen Die einzigen Prädikate der Sprache der Mengenlehre sind die logische Relation "=" der Identität und die primitive (in der PL nicht-logische, aber im weiteren Sinne logisch-mathematische) Relation "": Bekannte Notationen: a A a A kurz für nicht a A a b für a = b. a,b A für aA und bA. =def (oder =:) für Identität per Definition {xA: Px} ist Abkürzung für {x: xA Px} x,y: Pxy oder x,y(Pxy)für xyPxy xA: Pxfür x(Ax Px) 84 Übersetzung der informellen Spache in die formale Sprache der PL: Man ersetzt: x = y y = {x: A} durch x y durch z(zy z{x:A}) y {x: A} durch A[y/x] y {x1,,xn} durch y x1 y xn "x ist eine Menge" durch (für n=0: ) y(xy). Man schreibe Großbuchstaben jeglicher Art in Variablen um: x, y, z, xi. Immer die richtigen Quantoren hinzufügen. Beispiel: Man beweist {x: Px} = {x: Qx}, indem man x(Px Qx) beweist! Überführungschritte: z(z{x:Px} z{x: Qx}) z(PzQz). Axiom 1: Naives Komprehensions--Axiom: (Frege's Formalisierung der Cantorschen Mengenlehre) Für alle (komplexen) Prädikate P: x(x = {y: P(y)}). bzw: x(x = {y: A(y)}). Hinweis: {a1,,an} = {x: x=a1 x=an} Px := x=a1 x=an Axiom 2 der naiven Mengenlehre: Axiom der Extensionalität: Für alle Mengen A und B: wenn für alle x, x A xB, dann A = B. A,B( x(x A xB) A=B). Die andere Richtung folgt bereits aus dem logischen Extensionalitätsaxiom Ext: z.B. wenn A=B, dann x(x A xB). Extensionsgleiche und doch unterschiedliche Eigenschaften: {x : x ist ein lebender Organismus} = {x: x's Reproduktion basiert auf RNS/DNS} Wichtige Notation: Eine prädikatenlogische Theorie ist einfach eine Menge von nicht logisch wahren (d.h. synthetischen) Sätzen, die als Axiome einer Theorie angesehen werden, (ihre "Eigenaxiome") plus die daraus folgenden logischen Kosequenzen oder Theoreme. Z.B. ist die naive Mengenlehre eine PL-Theorie mit der speziellen binären Relation . 85 Russell's Antinomie: Russell (1903) zeigt, dass das naive Komprehensionsaxiom nicht generell zutrifft: Die Annahme der Existenz einer Menge R := {x : x x} führt zu einem Widerspruch. Um dies zu sehen, frage man sich ob R R? wenn R R, dann R R. nd wenn R R, dann R R. Widerspruch! Führt zur: Axiomatische Mengenlehre, z.B. nach Zermelo-Fraenkel: man ersetzt naives Komprehensionsaxiom durch schwächeren Axiome Ausgehend von gewissen Mengen, z.B. die leere Menge (oder die Menge gewisser Urelemente) darf man weitere Mengen bilden. Der Rest der Mengenlehre sind Definitionen (machen wir zuerst): Definition (Teilmenge): B A gdw x(xB xA). (B ist in A enthalten). Def.: Echte Teilmenge: B A gdw B A und B ≠ A. Formal.: x(xB xA) x(xA xB). B A Definition (Vereinigungsmenge): AB := {x: xA xB} = die Vereinigung von A und B (Skizzen zeichnen!) Formal.: x(xAB xA xB) Definition (Schnittmenge): AB := {x: xA xB} = die Schnittmenge von A und B Formal.: x(xAB xA xB) Definition ( relatives und absolutes Komplement): A B := {x: xA und x B} (auch: A \ B) ( = A Bc ) 86 Die mengentheoretische Differenz A minus B = das 'relative' Komplement von B in Bezug auf A. Formal: x(xAB xA xB) Ac =df {x: x A} ('absolutes' Komplement von A; relativ zu einem Objektbereich D) ( = D A). Formal: x(xAc xA) Definition (Potenzmenge): |P(A) := {x: x A} = Potenzmenge von A (Menge aller Teilmengen) Formal.: x(x|P(A) y(yx yA)). Definiton: |A| := die Kardinalität der Menge A = die Anzahl von A's Elementen. (Beachte: |{a,a}| = |{a}| = 1.) Definition: Leere Menge : x (xxx). Formal.: x: x (Denn es gilt PL-Axiom: x(x=x) ). Übungen 9.1: Nehmen Sie die folgenden zwei Mengen an, beide sind Teilmengen eines Objektbereichs D, auf die sich das absolute Komplement bezieht: D 4 9.2 Zeigen Sie auf, auf welche Teilmengen der Grundmenge (1,2,3,4) sich die folgenden Mengen erstrecken: AB, AB, AB, BA. Ac, Bc, AcBc, AcBc. 87 9.3 Welche Menge ist AAc? Welche Menge ist AAc? Welche Menge ist AAc? Welche Menge ist AA? Erläutern Sie warum A. 9.4. Was ist die Vereinigung von {1,2,3} und {4,5,3}? 9.5. Beweisen Sie: (a) (A B) A. (b) A AB. (c) AB A. 9.6. Es seien A = {1,3,4,5,6}, B = {3,5,7,8}, C = {2,3,6,9}. Konstruieren Sie AB, BC, AB, AC, (AB)(AC), AB, (AB)C, A(BC), (AB)(BC). 9.7. Konstruieren Sie alle Mengen von |P({1,2,3}). 9.8. Beweisen Sie durch Einsetzung der Definitionen, im Kalkül Ä der AL, unter Benutzung der Definitionen: (a) A Ac = All-Menge = {x:x=x} (Objektbereich), (b) AAc = leere Menge = {x:xx}, (c) (AB)c = (AcBc), (d) (AB)c = (AcBc), (e) (Ac)c) = A, (f) A(BC) = (AB)(AC), (g) A – B = AB c 9.9. Reflektieren Sie die Ergebnisse aus (9.8): welche Beziehung besteht zwischen den Operatoren c der Mengenlehre und den Konnektiven der Aussagenlogik? Relationen und Funktionen Definition (cartesisches Produkt): hatten wir schon A B = {<x,y>: xA yB} Achtung: nicht kommutativ. Formal: x(xAB yz(x <y,z> xA yB). Übungen 9.10. Schreiben Sie die Menge {1,3,4} {2,4,6} auf. 9.11 Zeigen Sie: A (BC) = (AB)(AC). Zeigen Sie, dass A(BC) = (AB) (AC ) nicht gilt. 88 Definition Relationen, Funktionen hatten wir schon informell erklärt Formal: f:AB besagt x(xf (yz(x <y,z> xA yB) y(yA !z<y,z>f). dom(f) = A (Argumentebereich) ran(f) = {y: x(y)f(x)} (Wertebereich) Wichtige weitere Begriffe: f:AB ist a) eine Funktion von A auf B, oder eine surjektive Funktion, gdw ran(f)=B. b) eine injektive Funktion, oder eine eins-zu-eins (1:1) Funktion gdw sie linkseindeutig ist, d.h. gdw z(zB !y<y,z>f). c) eine bijektive Funktion gdw sie surjektiv und injektiv ist. Wir schreiben auch f:AB. Übungen: 9.12 Zeichnen Sie (den Graph der) binäre(n) Relationen x > y (größer-als), x=y, und x < y über {1,2,3,4}2 auf und zwar in Form einer Matrix mit Zeilen 1,2,3,4 und Spalten 1,2,3,4. Interpretieren Sie die 'Geometrie' des resultierenden Bildes. 9.13 Welche der folgenden Relationen ist eine Funktion: (a) {<n,m>|2: m = 2n }, (b) {<x,y>: y ist die Mutter von x}, (c) {<x,y>: y ist der Sohn von x}, (d) {<n,n+1>: n|}, {<x,y>: y ist der Hauptwohnsitz von Person x}. 9.14 Welche der folgenden Funktionen sind injektiv, surjektiv, bijektiv: (a) f(n) = n+1 über den natürlichen Zahlen |, (b) f(n) = n+1 über den ganzen Zahlen, (c) f(x) = die Mutter von x, über Menschen, (d) f(x) = der Ehemann von x, über verheiratete Personen. 89 Axiomatische Mengenlehre nach Zermelo-Fraenkel Eine Klasse = Sammlung von Objekten/Individuen (irgendeiner Art). Eine Menge = eine Klasse, die als existentes Individuum angesehen wird; bzw. werden kann, ohne Widersprüche zu ergeben. Echte Klasse = Klasse, die keine Menge ist z.B. {x:xx} In der Semantik der reinen ZF-Mengenlehre gibt es nur Mengen, keine Urelemente. Axiome: Axiom 1: Extensionalitätsaxiom und Axiom 2: Paarmenge: Für alle x, y: {x,y} ist eine Menge. Formal in PL: x,yz: z {x,y} def xyz ( u(uz ux uy)) ) Theorem: Für jedes Individuum a ist {a} = {a,a} eine Menge, die Einermenge von a. Axiom 3: Teilmengen, Aussonderung: Ist B eine Menge und A(z) eine Formel, dann ist auch {zB: A(z)} eine Menge. xyz: zy (zx A(z)) für beliebige Formel A(z). Theorem: {z: zz} ist eine Menge, vorausgesetzt es gibt zumindest ein Individuum (Menge) Letzteres wird in klassischer Logik vorausgesetzt: x(x=x)Sonst eigenes Axiom. Theorem (Universum des Diskurses): Die Klasse aller Individuen und die Klasse aller Menge sind echte Klassen (weil sie {x:xx} als Unterklasse enthalten). Axiom 4: Vereinigungsmenge: Wenn A eine Menge von Mengen ist, dann ist es auch A xyz(zy u(zuux)). 90 Theorem (Vereinigung): A und B sind Mengen AB ist eine Menge . Beweis: Per Def. Vereinigungsmenge und Axiom Paarmenge. Theorem: a1,an Mengen, dann auch {a1,,an} Axiom 5. Potenzmenge: Wenn A eine Menge ist, dann ist |P(A) auch eine Menge. xz (z|P(x) y(y z yx)) Theorem: 1. AB ist eine Menge gdw sowohl A als auch B Mengen sind, sofern man wie in ZF üblich definiert: <a,b> =def {{a},{a,b}} (Kuratowski) 2. Ist A eine Menge und R eine n-stellige Relation über A, dann ist auch R Menge. 3. Funktion f ist eine Menge gdw sowohl dom(f) als auch ran(f) Mengen sind. Axiom 6: Ersetzung: Wenn f eine Funktion ist, und dom(f) eine Menge, dann ist auch ran(f) eine Menge. Hinweis: "f" muss zunächst keine Menge sein; nur eine Klasse, ausgedrückt durch eine Formel A; d.h. fxy für !yA(z,y) ): x: [z:zx!yA(z,y)] uz[zu z'(z'x A(z',z)]. Dabei wird implizit "f" quantifiziert, weil das Axiomenschema für beliebige A's gilt. 91 Konstruktion von Ordinalzahlen: Setzt sich von der leeren Menge als Anfangspunkt fort. | : Ord: 0 1 {} 1 = {0} 2 {, {}} 2 = {0, 1} 3 {, {}, {, {}} } 3 = {0,1,2} o+ = df o {o} Definition eines Nachfolgender-Ordinals 0 = {i : i|} Erstes Limesordinal, kleineste -Ordinalzahl (Stop) {} 0 0+1 = + = {} (Nachfolger-Ordinal) 0+2 = ++ = {} { {}} , zweites Limesordinal etc. Mit Hartog‘s Operation (o) = {o'Ord: o' ≤card o} überabzählbare Mengen. (Cantor's Diagnonalbeweis, s. unten) Axiom 7 Unendlichkeit: ist eine Menge. Formal.: x: x y(yx {y}x} z: (z y(yz {y}z}) xz} All diese Axiome sind voll akzeptiert. Zwei weitere Axiome werden häufig zusätzlich akzeptiert. 8. Auswahlaxiom: Für jede Menge A nicht-leerer Mengen gibt es eine Auswahlfunktion, d.h., eine Funktion f:A A d.h. xA: f(x) x. Theorem: AW ist äquivalent mit: Für jede Menge A gibt es eine Wohlordnung über A. 92 9. Axiom der Fundiertheit: Jede nicht-leere Menge hat ein -minimales Element. Konsequenzen: keine Menge enthält sich selbst a: a a es gibt keine -Zyklen a1…an a1 keine infinit absteigenden Ketten von -Sequenzen … an an-1 … a2 a1. Dieses Axiom ist unabhängig von den anderen Axiomen der Mengenlehre. Peter Aczel und Jon Barwise entwickelten eine Mengenlehre, die selbstenthaltende Mengen zulässt. (Wichtig für das so genannte Lügner-Paradox.) Cantors Diagonalbeweis: | |P(Nat) | > | Nat| : Jede Teilmenge natürlicher Zahlen kann durch eine unendliche Sequenz von 0en und 1en repräsentiert werden. 0 1 2 3 0 0 0 1 0 1 1 1 0 1 2 0 1 1 0 1 0 0 3 0 1 0 0 .... .... .... .... .... 1 .... Methode der Diagonalisierung abzählbare Liste kann in der Liste unmöglich enthalten sein, denn unterscheidet sich von Teilmenge Nr. i in Position i. 93 10. Metalogik: induktive Beweise (diese Seite evtl. überspringen) Die generelle Struktur einer rekursiven (induktiven) Definition: Gegeben: eine so genannte quasi-wohlgeordnete Menge A: Ihre Elemente sind angeordnet nach Rängen durch natürliche Zahlen (QuasiOrdnung): Elemente des Ranges 0, 1, 2, Rekursive Definition einer Eigenschaft C A auf A: Startklausel: C(a) ist definiert für alle Elemente a des Ranges 0. Rekursive Klausel(n): für alle Elemente xA des Ranges n wird der Besitz der Eigenschaft C definiert durch den Besitz der Eigenschaft C durch bestimmte Elemente y, deren Rang niedriger ist als n. Darauf bezieht sich: Axiom der starken Induktion. Spezialfall: C für Rang n wird definiert mit Hilfe von C für bestimmte Elemente vom Rang n1. Darauf bezieht sich: Axiom der schwachen Induktion. Wichtig: Auch wenn das Definiendum-Prädikat im Definiens auftaucht, führt eine rekursive Definition nicht in einen Zirkel oder infiniten Regress. Beispiel rekursiver Def: Startklausel: Adam und Eva waren Menschen. Rekursive Klausel: x ist ein Mensch wenn x's Eltern Menschen waren. Vgl. dazu die nicht-rekursive Def. (Aristoteles): Definiendum x ist ein Mensch Definiens df x ist ein rationales Tier Rekursive Definitionen benötigt man, um die fundamentale Beweistechnik der mathematischen Induktion anwenden zu können (nicht zu verwechseln mit empirischer bzw. Humeschen Induktion) 94 Naive Arithmetik: Vorausgehende Fakten über natürliche Zahlen: | - die Klasse aller natürlichen Zahlen 0, 1, 2, … i, j, n, n1, n2… variiert über Elemente von |. Fakten: 1. < ist eine strikte und totale (d.h. lineare) Ordnungsrelation < über |, und die korrespondierende schwache Ordnung über |. 2. 0 ist das kleinste Element von | : n|, n≥0. 3. Jedes n| hat genau einen direkten Nachfolger bzgl. <, n+1. 4. Jedes n| verschieden von 0 hat genau einen direkten Vorgänger bzgl. <, n-1. Hinweis: Axiome 3 und 4 folgen nicht aus 1, 2. es gibt dichte lineare Ordnungen ohne direkte Nachfolge und Vorgänger; z.B. rationale und relle Zahlen. Axiom der schwachen Induktion SI: Für jede Eigenschaft P: Start: P(0) nP(n) n (P(n) P(n+1) ) IH (Induktionshypothese) Induktionsschritt (IS) Anwendung der SI: Auf |N, oder auf einer beliebigen unendliche Menge, deren Elemente Ränge besitzen, indiziert durch natürliche Zahlen. Quasi-Ordnung: mehrere ranggleiche Elemente werden zugelassen. Die Eigenschaft P allquantifiziert dann über Elemente gleichen Rangs, d.h. xRang(n): P(x) xRang(n+1):P(x). Übungen 10.1. Beweisen Sie durch schwache Induktion nach n: wenn Menge A n Elemente hat, dann hat |P(A) 2n Elemente. 10.2 Beweisen Sie durch schwache Induktion, dass n i = i 0 n(n+1) . 2 95 Starke Induktion SI: Für jede Eigenschaft P: m<n: P(m)) P(n) nP(n) Diese Form wird in induktiven Beweisen der Metalogik häufig angewendet. Übung 10.3: zeige dass SI logisch mindestens so stark ist oder stärker als WI, indem man zeigt: Wenn A || A’, dann (AB)C (A’B)C Theorem: Schwache und Starke Induktion sind äquivalent. [evtl. überspringen] Beweis der Richtung: WI SI: [evtl. überspringen] Der Trick besteht darin, die Eigenschaft "y<x:Py" als komplexe Eigenschaft "Qx" zu betrachten und darüber schwache Induktion zu betreiben. In Schritten (6) und (14) wird das Antecedens der schwachen Induktion für die komplexe Eigenschaft "Q" schließlich etabliert. In den Schritten 4a bis 4e wird exemplarisch gezeigt, wie ein typischer informellmathematischer Schritt von (4) zu (5) in kleinere Einzelschritte zerlegt werden kann, die Regeln des PL-Kalküls entsprechen, welche wir erst im hinteren Teil dieses Skriptums im Detail entwickeln werden. Hinweis: In der Metalogik verwenden wir von nun an öfter das informelle wenndann "" statt des formellen wenn-dann "". Damit machen wir nur deutlich, dass das dieses wenn-dann zur Metasprache gehört. 96 (1) (Antecedens-SI:) x(y<xPy Px) (2) Qx : y<x:Py (3) x(Qx Px) (4) y: y < 0 4a yA yA 4b y:y<0 4c y < 0 4d A A B 4e (y<0 Py) (5) y<0: Py (6) Q(0) (7) Qa (8) y < a: Py (9) Pa (9a) y=a: Py (10) y (a+1): y < a y = a (11) y<(a+1): Py (12) Q(a+1) (13) Q(a) Q(a+1) (14) x(Q(x) Q(x+1)) (15) (Q(0) x(Qx Q(x+1)) xQx (16) xQx (17) xPx (18) x(y<xPy Px) xPx KB-Ann Definition (eliminierbare Prämisse) 1+2, Ersetz. von Äquival., Theorem PL Prämisse über |N PL-Theorem (beliebige A) MP 4, 4a-Instanz UI 4b AL-Theorem (beliebige A, B) MP 4c, 4d-Instanz UG 4e (mehrere PL-Schritten aus 4) Ersetz v. Äquival. aus (5) und (2) KB-Ann Ersetz Äquiv (2), (7) aus (3), (7) mit UI und MP PL-Schritt aus (9) Prämisse über |N durch PL-Schritte aus 8,9a,10 Ersetz Äquiv 2, 11 KB 7-12 UG 13, VB bzgl a erfüllt Präm. Weak. Ind. AL-Schritte aus 6,14 und 15 PL-Schritte aus 3, 16 KB 1-17, := Strong Ind. ************************Ende Beweis *********************** Weitere Metatheoreme der PL (induktive Beweise) Induktion über die Komplexität von Formeln: Start: für alle Atomformeln Induktive Schritte: wenn für A, B, dann für: A, AB , xA (AB, AB, xA --- definierbar) 97 Beweis des Theorems der Ersetzung von Äquivalenten, einmal semantisch, dann syntaktisch Theorem (Ersetzung von Äquivalenten): Semantisch: wenn || B C, dann || A A[C/B] ( Kurz: || B C || A A[C/B] ) Syntaktisch: | B C | A A[C/B] Beweis semantische Version, über Komplexität von A: (1) Start: A ist Atomformel Rt1tn. Dann ist die einzige Teilformel B von A, A selbst: || B C || B C weil B = C. (2) A hat die Form einer Negation A = D: Induktionshypothese IH: || B C || D D[C/B] Induktionsschritt IS: (a) wenn || D D[C/B], dann || D D[C/B]) Semantische Begründung: haben D und D[C/B] in jeder Zeile der Wahrheitstafel denselben Wahrheitswert, dann auch D und D[C/B] (W.wertfunktionalität von ), sowie (b) Syntaktische Ergänzung: und D[C/B] = (D)[C/B], denn in "" wird ja nichts ersetzt". Aus (a) und (b) folgt:: || D (D)[C/B] (3) A hat die Form einer Konjunktion A = DE Induktionshypothese IH: || B C || D D[C/B] sowie: || B C || E E[C/B] Induktionsschritt IS: (a) wenn || D D[C/B] und || E E[C/B] dann || (DE) D[C/B]) (E[C/B]) Semantische Begründung wie oben (Wahrheitswertfunktionalität): Haben in jeder Zeile der Wahrheitstafel sowohl D und D[C/B] wie auch E und E[C/B] denselben Wahrheitswert, dann auch (DE)und D[C/B]) (E[C/B]). (b) Wie oben: D[C/B]) (E[C/B]) = (D E)[C/B] Ergo: || (DE) (D E)[C/B] 98 (4) A hat Form einer Disjunktion A = DE: nicht nötig, weil definierbar mit und . Man könnte Beweis führen, wäre dann analog wie für Konjunktion. (5) A hat Form einer Implikation A = DE: Nicht nötig, weil definierbar. (6) A hat die Form eines Allsatzes A = xD: Induktionshypothese IH: || B C || D D[C/B] offene Formel Induktionsschritt IS: zu zeigen (a) || xD x(D[C/B]) || D D[C/B] ist gleichbedeutend mit: für alle D und für alle v über D: <D,v> D <D,v> D[C/B]. D.h. für alle D und für alle v[x:d] über D und für beliebiges dD: <D,v[x:d]> D <D,v[x:d]> D[C/B]. Somit für alle <D,v>: dD ( <D,v[x:d]> D <D,v[x:d]> D[C/B] ). F(d) G(d) Daher durch PL-Schluss in Metasprache (d(FdGd) / dFd dGd ): für alle <D,v>: (dD: <D,v[x:d]> D) (dD: <D,v[x:d]> D[C/B]). Daraus folgt per semantischer Wahrheitsregel für : für alle <D,v>: <D,v> xD <D,v> x(D[C/B]). (b) Syntaktisch: x(D[C/B]) = (xD)[C/B] denn in "x" wird nichts ersetzt. Aus (a) und (b) folgt für alle <D,v>: <D,v> xD <D,v> xD[C/B], d.h. || xD xD[C/B]. (7) A hat die Form eines Existenzsatzes A = xD: Weil durch und definierbar, separater Beweis nicht nötig. Aber möglich, dann analog wie für . Q.E.D. Übung 10.4: Man beweise die syntaktische Form des Theorems -- hier muss man die semantischen Wahrheitswertzeilen-Überlegungen durch deduktive Beweise ersetzen. Hinweis. Der syntaktische PL-Induktionsschritt ist einfacher als der semantische. 99 Induktiver Beweis des Koinzidenztheorems: Koinzidenz von Substitution und Bewertungswechsel Wenn die Substitution konfusionsfrei ist, dann: v(A[t/x]) = v[x:v(t)](A) besser: zuerst ohne Terme erklären, vereinfachen Beweis: In diesem Fall muss bei Termen angefangten werden: Wir zeigen: v(t‘[t/x]) = v[x:v(t)](t‘) für alle Terme t, t': 1. v(u[t/x]) := wenn u =x: = v(t) = v[x:v(t)](u) da u=x wenn ux: = v(u) = v[x:v(t)](u) da ux. 2. v( (ft1…tn)[t/x] ) = v( f(t1)[t/x] … (tn)[t/x] ) = v(f)(v(t1[t/x]), … ,v(tn[t/x])) = v[x:v(t)](f)(v[x:v(t)](t1),…,v[x:v(t)](tn)) nach IH und da v[x:v(t)](f) = v(f) = v[x:v(t)](ft1…tn). Nun für Formeln: 3. v((Rt1…tn)[t/x] = 1 v( R(t1)[t/x] … (tn)[t/x] ) = 1 ( v(t1[t/x]), … ,v(tn[t/x]) ) v(R) ( v[x:v(t)](t1),…,v[x:v(t)](tn) ) v(R) , da nach IH v[x:v(t)](ti) = v( ti[t/x] ) und da v[x:v(t)](R) = v(R) v[x:v(t)](Rt1…tn). 4. v((A)[t/x]) = v((A[t/x])) = 1 v(A[t/x]) = 1 v[x:t](A)(IH) = v[x:t](A). Analog für AB. v((AB)[t/x]) = 1 v( A[t/x]B[t/x] ) = 1 v(A[t/x])=1 v(B[t/x])=1 v[x:t](A)=1 v[x:t](B) = 1 (gemäß IH) v[x:t](AB) = 1. 5. Für zB: Wir nehmen an, dass t frei für x ist in zB, also z V(t). Wenn x=z: v((zB)[t/x]) = v(zB) = v[x:v(t)](zB), weil x nicht frei ist in zB (und Extensionalitätstheorem). Wenn xz: v((zB)[t/x] ) = 1 v(z(B[t/x]) ) = 1 d D: v[z:d](B[t/x]) = 1 d D: v[z:d, x: v[z:d](t)](B) = 1 nach IH d D: v[z:d, x:v(t)] (B) = 1 weil v[z:d](t) = v(t) da z V(t) v[x:v(t)] (zB) = 1. Q.E.D. 100 Optional: Übung 10.5 Beweise: Jede Formel A ist PL-äquivalent mit einer PNF(A). Beweis: Durch über Induktion über die Komplexität von A und die Anzahl von Quantoren einer PNF. Wir nehmen als eliminiert an. Optional: Übung 10.6: L1 = Sprache der PL L0 = Sprache der AL mit Ausssagevariablenmenge P Es sei v1 eine L1-Bewertung. Wir definieren die korrespondierende v0-Bewertung zu P durch: v0(p) = v1(s(p)). wobei s eine aussagenlogische Substitutionsfunkttion ist. wobei s: P L1 Beweise durch Induktion über Formelaufbau: Koinzidenzlemma für AL-PL: Für alle AL0: v0(A) = v1(s(A)). Damit beweist man folgendes AL-PL-Theorem (AL ist in PL enthalten): Ein Schluss | A ist PL- gültig, wenn er eine Substitututionsinstanz eines gültigen AL-Schlusses ist. Beweis: Es sei v1 eine L1-Bewertung. Wir definieren die korrespondierende v0Bewertung zu P durch: v0(p) = v1(s(p)). Per Kontraposition: Wenn es ein v1 gäbe, welches s() ||1 s(A) widerlegen würde, dann würde das gemäss Koinzidenzlemma definierte v0 aufgrund Koinzidenzlemma ||o A widerlegen (v0 aber v0(A)=0). QED. 101 11. Korrektheit der PL Zur Erinnerung: schwache Korrektheit: | A starke Korrektheit: | A || A. || A Theorem (Korrektheit): schwache und starke Korrektheit sind äquivalent. Beweis: Richtung : schw. Korr. folgt aus st. Korr. durch Setzung von = . Richtung : | A f | A (nach FIN) | (f) A (nach Ded.theorem, synt. Version) || f A (nach schwacher Korrektheit) f ||A (nach -Ded.theorem, semant. Version) - ||A (nach Mon für ||). Q.E.D. Induktion nach der Länge eines Beweises: Theorem (starke Korrektheit): S ist stark korrekt. Lemma L1: Alle S-Sequenzenaxiome von S (Basisregel in der Satzrepräsentation) sind gültige Schlüsse. Lemma L2: Alle Sequenzenregeln von S (Metaregeln in der Satzrepresentation) erhalten die Gültigkeit. Beweis des Lemmas: siehe Kapitel über Semantik. Wir haben zwei Dinge noch nicht bewiesen: Optional Übung 11.1: Gültigkeitserhaltung von UG: Beweisen sie: wenn ||A[a/x] mit a nicht in , A, dann || xA. Optional Übung 11.2: Gültigkeit von (Ext): Beweisen Sie diese durch Induktion über Formelkomplexität: t1t2 || A[t1/x] A[t2/x] (stärkere Version; ist einfacher !) 102 Beweis der starken Korrektheit: Durch Induktion über die Länge eines S* -Beweises < 1 | A1, … , n | An> von n| An. i sind Prämissenmengen Induktionsanfang: Wenn i | Ai ein Sequenzenaxiom (Basisregel) ist, dann ist es gültig, wegen des Lemmas L1. Induktionsschritt: Nehmen wir an, i | Ai ist abgeleitet aus vorigen Gliedern des Beweises, j | Aj und (möglicherweise) k | Ak (mit j, k < i) nach einer der Sequenzenregeln (Metaregeln). Gemäß Induktionshypothese sind j | Aj und k | Ak gültige Schlüsse. Also ist wegen des Lemmas L2 auch i | Ai ein gültiger Schluss. Q.E.D. Definition (Konsistenz): 1. Eine Prämissenmenge ist (einfach) konsistent gdw es kein A gibt, sodass | AA. 2. Verallgemeinert: eine Logik L wird (einfach) konsistent genannt gdw es kein A gibt, sodass | AA. Aus dem Theorem der Korrektheit folgt: die klassische Logik ist konsistent. Beweis: AA ist nicht L-wahr (sogar L-falsch), und daher aufgrund der Korrektheit, unbeweisbar. Optional Übung 11.3: Beweisen Sie: L ist (stark) korrekt jede semantisch erfüllbare Formelmenge ist konsistent. 103 12. Vollständigkeit der AL und der PL 12.1 Vollständigkeit der AL Zur Erinnerung: schwache Vollständigkeit: || A starke Vollständigkeit: || A | A | A. Starke Vollst. impliziert schwache (man setze = ). Schwache Vollst. impliziert nun nicht mehr automatisch die starke, weil || nicht per Definition finitär bzw. kompakt ist, so wie | (im Sinn von: wenn || A, dann folgt A schon aus einer endlichen Teilmenge von ). Erst aus dem Beweis der starken Vollständigkeit folgt die Kompaktheit von ||. Folgende einfache Umformungen der Vollständigkeitsbedingungen sind wichtig: Theorem (Konsistenzversion der Vollständigkeit, Gödel): 1. L ist schwach vollständig gdw jede konsistente Formel erfüllbar ist. 2. L ist stark vollständig gdw jede konsistente Formelmenge erfüllbar ist. Beweis: Theorem Nr. 2, durch Kontraposition. Richtung : Wir nehmen an ist nicht erfüllbar und zeigen, unter der Annnahme der starken Vollständigkeit, dass inkonsistent ist. Wenn unerfüllbar ist, dann || BB, also, nach st. Vollständigkeit, | BB, also ist inkonsistent. Richtung : Wir nehmen an, dass |-/- A, und zeigen, unter der Annahme, dass jede konsistente Formelmenge erfüllbar ist, dass ||-/- A. |-/- A impliziert, dass ,A konsistent ist, denn andernfalls , A | BB, was implizieren würde, dass | A nach kIB (!). Also ist A erfüllbar (weil wir annehmen, dass jede konsistente Formelmenge erfüllbar ist). Daher ||-/- A. Q.E.D. Für Theorem Nr.1 argumentieren wir wie für Nr.2, abgesehen davon, dass wir = {A} in , und in setzen. Q.E.D. 104 Kanonischer Vollständigkeitsbeweis: Gödel, Lindenbaum, Henkin Definition (maximal konsistente Formelmengen) ist maximal konsistent gdw konsistent ist und keine echte Erweiterung von d.h. kein sodass konsistent ist. Theorem (maximal konsistente Formelmengen): Angenommen ist maximal konsistent. Dann gilt für alle A: (Max |): | A gdw A deduktive Abgeschlossenheit (Max ): A oder A syntaktische Vollständigkeit (Max ): (AB) gdw (A ) oder (B ) Prim-heit (Max ): (AB) gdw (A ) und (B ) (Max ): (AB) gdw ( wenn A , dann B ) Anmerkung: Alle Max-Eigenschaften gelten auch in der intuitionistischen Logik. Übung 12.1: Beweisen Sie das Theorem über maximal konsistenter Formelmengen. Der Gödel-Henkin Vollständigkeitsbeweis vollzieht sich in zwei Schritten: Man zeige, dass jede konsistente Formelmenge in einer maximal konsistenten Formelmenge enthalten ist. Man zeige, dass jede maximal konsistente Formelmenge ein Modell hat. 105 Theorem (Lindenbaum-Lemma): Jedes konsistente kann zu einem maximal konsistenten erweitert werden. Beweis: Wir können alle Formeln effektiv aufzählen (siehe später). Ist eine solche Aufzählung gegeben, A0, A1, A2, ( i: |N L ) ( steht für bijektive Abb.) dann definieren wir rekursiv die folgende Aufzählung von aufsteigenden Erweiterungen von : 0 := n+1 : = n {An} wenn n{An} konsistent ist, andernfallsn. Es sei: = {i | i |N }. Wir zeigen, dass maximal konsistent ist: 1. ist konsistent: Indirekter Beweis: Wenn dem nicht so ist, dann | AA, also gibt es nach Fin ein finites f sodass f | AA. Sei n die Zahl der Formel in f mit der höchsten Nummer. Dann f n+1. Also n+1 | AA nach Mon, was der Definition widerspricht. 2. ist maximal konsistent: Indirekter Beweis: Andernfalls gibt es ein A sodass {A} konsistent ist. Sei n A's Nummer, also A = An. Da n , ist n{An} konsistent. Also An n+1 per Def. weshalb An , was unserer Annahme wiederspricht. Q.E.D. 106 Theorem (Wahrheitslemma): Jede maximal konsistente Formelmenge hat ein Modell (d.h. eine Bewertung v die all ihre Formeln wahr macht). Beweis: Wir definieren: für alle p v(p) = 1 gdw p Gödel-enkin-Modell. Mit dieser Definition zeigen wir durch Induktion nach der Komplexität von Formeln, dass: v A gdw A für jedes A L. (1) Für A eine Aussagenvariable gilt das Theorem per Definition. (2) A=B: v B gdw v B gdw B (nach IH) gdw B (nach Max ). (3) A=BC: v BC gdw v B und v C gdw B und C (nach IH) gdw (BC) (nach Max ). (4) A=BC: v BC gdw v B oder v C gdw B oder C (nach IH) gdw (BC) nach ax ). (5) A=(BC): v BC gdw (v B v C) gdw (B C ) (nach IH) gdw (BC) (nach Max). - Q.E.D. Anmerkung : Beachten Sie, dass im Beweis alle Max-Eigenschaften benutzt wurden. Jede Max-Eigenschaft benutzt wieder eine Kalkülregel. Generell gilt: in einem Vollständigkeitsbeweis müssen alle Regeln des Kalküls benutzt werden, andernfalls ist entweder der Vollständigkeitsbeweis inkorrekt, oder der Kalkül redundant. Theorem (starke Vollständigkeit): S ist stark (und damit schwach) vollständig. Beweis: Nehmen wir an, ist konsistent. Dann ist in einem maximal konsistenten enthalten (nach Lindenbaum-Lemma). hat ein Modell v nach Wahrheitslemma. v ist auch ein Modell von , da . Also ist erfüllbar. Also ist S* stark vollständig, gemäß der Konsistenz-Version. Q.E.D. 107 Theorem (Kompaktheit): Sei unendlich. 1. Schluss-Version: || A gdw für irgendeine finite Teilmenge f , f ||A. 2. Erfüllbarkeits-Version: ist erfüllbar gdw jede endliche Teilmenge von erfüllbar ist. Übung 12.2: Beweisen Sie die Kompaktheit (benutzen Sie die Endlichkeit von |, Korrektheit und Vollständigkeit). Da wir die Vollständigkeit bewiesen haben, folgt, dass alle Metatheoreme in semantischer und syntaktischer Version gültig sind: wir dürfen | und austauschen. 108 12.2 Vollständigkeit der Prädikatenlogik --> Wie für die AL im Henkin-Style. --> Die Idee: Wir konstruieren ein kanonisches Modell für max aus der Sprache heraus. Wir wünschen, die Vollständigkeit durch ein Wahrheitslemma zu beweisen, welches besagt, dass eine Formel in max ist gdw sie wahr ist im kanonischen Modell von max. Es gibt zwei Probleme: 1. Die Individuen des kanonischen Modells können nicht einfach syntaktische Terme sein. Denn wenn Identitätsformeln t1t2 enthält, dann v(t1)=v(t2). Aber t1 t2! (metasprachliche Bedeutung: t1 und t2 sind verschiedene Variablen). Lösung: wir verstehen die -Äquivalenzklassen [t] von Termen als unsere Objekte. 2. Wenn eine Formel der Form xA enthält, brauchen wir zumindest ein Objekt [a] in unserem Objektbereich, sodass v[x:[a]] xA wahr macht; wobei a eine Individuenkonstante ist. Eine Formelmenge, die diese Eigenschaft erfüllt, wird vollständig genannt. Lösung: wir nehmen eine neue Konstante a für jedes der unendlich vielen xA in max. Wir fügen eine unendliche Menge C* von neuen Konstanten zu L hinzu. Definition (-Vollständigkeit, Saturiertheit): ist vollständig gdw (xA A[t/x] für irgendein t ein Term 2. ist saturiert gdw maximal konsistent und vollständig ist. Übung optional 12.3: Beweisen Sie für maximal konsistentes : (xA A[t/x] für irgendein t T) (A[t/x] für alle tT xA ). (-Version der -Vollständigkeit) (-Version der -Vollständigkeit) Saturierte Formelmengen erfüllen alle Max-Eigenschaften, die wir in der AL bewiesen haben. 109 Saturierungstheorem: Jede konsistente Formelmenge in einer gegebenen Sprache L kann zu einer saturierten Formelmenge erweitert werden,in einer Sprache L*, die aus L durch das Hinzufügen einer unendliche Menge C+ neuer Konstanten entsteht. C* = C C + L* ist wie L, außer, dass sie C* satt C hat Saturierungslemma: Wenn xA konsistent ist und a nicht in oder xA vorkommt, dann ist auch {xA, A[a/x]} konsistent. Beweis: Andernfalls (i) {xA} | A[a/x] (nach iIB), woraus {xA} | xA (nach UG aus (i) da a nicht in {xA}), was bedeuten würde, dass {xA} inkonsistent ist (da xA = xA, per Def. ), was der Annahme widerspricht. Beweis Theorem: Wir konstruieren wie folgt, unter der Annahme einer gegebenen Nummerierung aller Formeln Ao, A1… in L* (!) und aller Konstanten in C + wie folgt: o := n+1 = : n {An, B[a/x]}, wobei a die erste Konstante in C+ C ( n,An) ist wenn n {An} konsistent ist und An die Form xB hat n {An} wenn n {An} konsistent ist und nicht die Form An xB hat n := wenn n{An} inkonsistent ist {i | i } Für jedes n, gibt es unendlich viele neue Konstanten die in C + C( n,An) verbleiben. 110 Wir beweisen, dass: eine saturierte Erweiterung von ist. , also ist eine Erweiterung von . ist konsistent: Nach dem Saturierungslemma wissen wir, dass für jedes n, n+1 konsistent sein muss, wenn n{An} konsistent ist; und wenn n{An} inkonsistent ist, ist n+1 per Def. konsistent. Also argumentieren wir wie im Vollständigkeitsbeweis der AL. 3. Dass maximal konsistent ist, zeigt man wie im Vollständigkeitsbeiweis der AL. 4. Dass -vollständig ist, gilt, da jede Formel xA eine feste Anzahl n in der Nummerierung hat und in diesem Schritt eine Formel der Form A[x/a] zu n hinzugefügt worden ist. Q.E.D. Theorem (kanonisches Modell): Jede saturierte Formelmenge hat ein Modell (das so genannte kanonische Modell, wie unten definiert). Beweis: Angenommen ist saturiert. Wir definieren: Definition des kanonischen Modells: Für jedes tT, t] =def {t': tt' } d.h. : [t] ist die Äquivalenzklasse von t bzgl. , wobei die Äquivalenzrelation über T ist, definiert durch t1 t2 gdw D =def {[t]: tT} D.h der kanonische t1t2 . Objektbereich besteht aus denÄquivalenzklasen von Termen bzgl. 1. v(x) = [x] für alle x V 2. v(a) = [a] für alle a C die kanonische Bewertungsfunktion 3. Für alle f F n, n > 0: v(f)([t1],…,[tn]) = [ft1…tn] (dies definiert v(f)) 4. Für alle R Rn, n >0: <[t1],…,[tn]> v(R) gdw Rt1…tn (dies definiert v(R)) 111 Wir müssen zeigen, dass unsere Definition von Bewertungsfunktionen für Äquivalenzklassen [t] für beliebige Wahlen von t' in [t] konsistent ist. Dafür müssen wir zeigen, dass bei jeder Wahl von t, t* [t] folgendes gilt: Wenn ti, ti* [t], dann: v(ft1…tn) = v(ft1*…tn*), und v(Rt1…tn) = v(Rt1*…tn*). Beweis: Gilt wegen des Extensionalitätsaxioms. Wenn ti, ti* [t], dann titi* , also | titi*, daher folgen | ft1…tn ft1*…tn* und | Rt1…tn Rt1*…tn* aufgrund von Ext. Wahrheitslemma: Es sei M = <D,v> das kanonische Modell von . Dann gilt für alle A: M A gdw A Beweis: A = Rt1…tn: per Definition. A = t1t2: t1t2 gdw t1,t2 [t1] gdw v(t1) = v(t2) = [t1] gdw M (t1t2). (2) A=B, A = BC, BC, BCwerden bewiesen wie in AL, durch die Eigenschaften Max|, Max und Max. (3) AxB: xB gdw t T: B[t/x] nach UI und Max|; nach -Vollständigkeit von in der -Version gdw t T: M B[t/x] (nach IH) gdw t T: v[x:[t] ](B) = 1 gdw d D: v[x:d](B) = 1 gdw M xB. (Koinzidenzlemma, da v(t)=[t]) (da D = T/) Q.E.D. Theorem (starke Vollständigkeit): S1 ist stark (und daher schwach) vollständig. Beweis: Wir argumentieren wie in AL: Eine gegebene, konsistente , kann erweitert werden zu einer saturierten (in erweitertem L*) nach dem Saturierungstheorem. und daher , sind damit erfüllt von dem kanonischen Modell nach dem kanonischen Modell-Theorem. Q.E.D. Theorem (Kompaktheit): S1 ist kompakt, d.h. für alle L (Erfüllbarkeitsversion): Jede endliche Teilmenge f von ist erfüllbar ist erfüllbar. 112 Beweis: Wie in der AL.