Einleitung Prinzipien von Programmiersprachen Vorlesung Wintersemester 2007 – 2013 Beispiel: mehrsprachige Projekte ein typisches Projekt besteht aus: • Datenbank: SQL Johannes Waldmann, HTWK Leipzig • Verarbeitung: Java 31. März 2014 • Oberfläche: HTML • Client-Code: Java-Script und das ist noch nicht die ganze Wahrheit: nenne weitere Sprachen, die üblicherweise in einem solchen Projekt vorkommen – Typeset by FoilTEX – – Typeset by FoilTEX – 1 Konzepte Sprache • Hierarchien (baumartige Strukturen) • wird benutzt, um Ideen festzuhalten/zu transportieren (Wort, Satz, Text, Kontext) – zusammengesetzte (arithmetische, logische) Ausdrücke – zusammengesetzte Anweisungen (Blöcke) – Klassen, Module • wird beschrieben durch – – – – Lexik Syntax Semantik Pragmatik • Typen beschreiben Daten • Namen stehen für Werte, Wiederverwendung • Flexibilität durch Parameter (Unterprogramme, Polymorphie) • natürliche Sprachen / formale Sprachen – Typeset by FoilTEX – 2 – Typeset by FoilTEX – 3 Paradigmen Ziele der LV Arbeitsweise: • imperativ • isoliert beschreiben Programm ist Folge von Befehlen (= Zuständsänderungen) • an Beispielen in (bekannten und unbekannten) Sprachen wiedererkennen • deklarativ (Programm ist Spezifikation) Ziel: – funktional (Gleichungssystem) – logisch (logische Formel über Termen) – Constraint (log. F. über anderen Bereichen) • verbessert die Organisation des vorhandenen Wissens • gestattet die Beurteilung und das Erlernen neuer Sprachen • objektorientiert (klassen- oder prototyp-basiert) • nebenläufig (nichtdeterministisch, explizite Prozesse) • hilft bei Entwurf eigener (anwendungsspezifischer) Sprachen • (hoch) parallel (deterministisch, implizit) – Typeset by FoilTEX – 4 – Typeset by FoilTEX – Beziehungen zu anderen LV 5 Organisation • Grundlagen der Informatik, der Programmierung: • Vorlesung strukturierte (imperative) Programmierung • Übungen (alle in Z423) • Softwaretechnik 1/2: Übungsgruppe wählen: https://autotool.imn. htwk-leipzig.de/cgi-bin/Super.cgi objektorientierte Modellierung und Programmierung, funktionale Programmierung und OO-Entwurfsmuster • Compilerbau: Implementierung von Syntax und Semantik Sprachen für bestimmte Anwendungen, mit bestimmten Paradigmen: • Prüfungszulassung: regelmäßiges und erfolgreiches Bearbeiten von Übungsaufgaben • Klausur: 120 min, ohne Hilfsmittel • Datenbanken, Computergrafik, künstliche Intelligenz, Web-Programmierung, parallele/nebenläufige Programmierung – Typeset by FoilTEX – Methoden, Konzepte, Paradigmen 6 – Typeset by FoilTEX – 7 Inhalt Literatur • http://www.imn.htwk-leipzig.de/˜waldmann/ edu/ws13/pps/folien/main/ (nach Sebesta: Concepts of Programming Languages) • Robert W. Sebesta: Concepts of Programming Languages, Addison-Wesley 2004, . . . • Konzepte: • Methoden: (3) Beschreibung von Syntax und Semantik – (5) Namen, Bindungen, Sichtbarkeiten – (6) Typen von Daten, Typen von Bezeichnern – (7) Ausdrücke und Zuweisungen, (8) Anweisungen und Ablaufsteuerung, (9) Unterprogramme Zum Vergleich/als Hintergrund: • Abelson, Sussman, Sussman: Structure and Interpretation of Computer Programs, MIT Press 1984 http://mitpress.mit.edu/sicp/ • Paradigmen: • Turbak, Gifford: Design Concepts of Programming Languages, MIT Press 2008 http://mitpress.mit.edu/catalog/item/ default.asp?ttype=2&tid=11656 – Typeset by FoilTEX – – (12) Objektorientierung ( (11) Abstrakte Datentypen ) – (15) Funktionale Programmierung 8 – Typeset by FoilTEX – 9 :set +t length $ takeWhile (== ’0’) $ reverse $ show $ produ 1. Anwendungsgebiete von Programmiersprachen, Kellermaschine in PostScript. wesentliche Vertreter 42 42 scale 7 9 translate .07 setlinewidth .5 setgra zu Skriptsprachen: finde die Anzahl der "*.java"-Dateien setgray}def 1 0 0 42 1 0 c 0 1 1{0 3 3 90 270 arc 0 unter $HOME/workspace, die den Bezeichner String arcn 270 90 c -2 2 4{-6 moveto 0 12 rlineto}for -5 2 enthalten. (Benutze eine Pipe aus drei Unix-Kommandos.) 9 0 rlineto}for stroke 0 0 3 1 1 0 c 180 rotate init Lösungen: Mit gv oder kghostview ansehen (Options: watch file). find workspace/ -name "*.java" | xargs grep -l String | wc -l Mit Editor Quelltext ändern. Finden Sie den Autor dieses find workspace/ -name "*.java" -exec grep -l String {} \; | wc -l Programms! 2. Maschinenmodelle (Bsp: Register, Turing, Stack, (Lösung: John Tromp, siehe auch Funktion) http://www.iwriteiam.nl/SigProgPS.html) funktionales Programmieren in Haskell 3. http://99-bottles-of-beer.net/ (top rated . . . ) (http://www.haskell.org/) ghci Übungen – Typeset by FoilTEX – 10 – Typeset by FoilTEX – 11 • geschachtelte arithmetische Ausdrücke in Java und C: vergleiche Bytecode mit Assemblercode Übung: Beispiele für Übersetzer Java: • vergleiche Assemblercode für Intel und Sparc (einloggen javac Foo.java # erzeugt Bytecode (Foo.class) auf kain, dann gcc wie oben) java Foo # führt Bytecode aus (JVM) gcc für Java (gcj): Einzelheiten der Übersetzung: gcj -c Foo.java # erzeugt Objektcode javap -c Foo # druckt Bytecode gcj -o Foo Foo.o --main=Foo # linken, wie oben C: • Assemblercode ansehen, vergleichen gcc -c bar.c # erzeugt Objekt(Maschinen)code (bar.o) gcc -o bar bar.o # linkt (lädt) Objektcode (Resultat: bar) gcj -S Foo.java # erzeugt Assemblercode (Foo.s) ./bar # führt gelinktes Programm aus • Kompatibilität des Bytecodes ausprobieren zwischen Einzelheiten: Sun-Java und GCJ (beide Richtungen) gcc -S bar.c # erzeugt Assemblercode (bar.s) Aufgaben: gcj -C Foo.java # erzeugt Class-File (Foo.class) – Typeset by FoilTEX – 12 Syntax von Programmiersprachen 13 Token-Typen Token-Typen sind üblicherweise Programme als Bäume • reservierte Wörter (if, while, class, . . . ) • ein Programmtext repräsentiert eine Hierarchie (einen Baum) von Teilprogrammen • Bezeichner (foo, bar, . . . ) • Die Semantik des Programmes wird durch Induktion über diesen Baum definiert. • In den Knoten des Baums stehen Token, • Literale für ganze Zahlen, Gleitkommazahlen, Strings, Zeichen • Trennzeichen (Komma, Semikolon) • Klammern (runde: paren(these)s, eckige: brackets, geschweifte: braces, spitze: angle brackets) • jedes Token hat einen Typ und einen Inhalt (eine Zeichenkette). • Operatoren (=, +, &&, . . . ) • diese Prinzip kommt aus der Mathematik (arithmetische Ausdrücke, logische Formeln) – Typeset by FoilTEX – – Typeset by FoilTEX – • Leerzeichen, Kommentare (whitespace) alle Token eines Typs bilden eine formale Sprache 14 – Typeset by FoilTEX – 15 Formale Sprachen Spezifikation formaler Sprachen man kann eine formale Sprache beschreiben durch: • ein Alphabet ist eine Menge von Zeichen, • ein Wort ist eine Folge von Zeichen, • algebraisch (Sprach-Operationen) Beispiele: • Generieren (Grammatik), Bsp: kontextfreie Grammatik, • Alphabet Σ = {a, b}, • Akzeptanz (Automat), Bsp: Kellerautomat, • Sprache L = Menge aller Wörter über Σ gerader Länge. • logisch (Eigenschaften), (p < r ∧ w[p] = a ∧ w[r] = c) w | ∀p, r : ⇒ ∃q : (p < q ∧ q < r ∧ w[q] = b) Bsp: reguläre Ausdrücke • eine formale Sprache ist eine Menge von Wörtern. • Wort w = ababaaab, • Sprache (Menge) aller Gleitkomma-Konstanten in C. – Typeset by FoilTEX – 16 Sprach-Operationen – Typeset by FoilTEX – 17 Reguläre Sprachen/Ausdrücke Aus Sprachen L1, L2 konstruiere: Die Menge E(Σ) der regulären Ausdrücke über einem Alphabet (Buchstabenmenge) Σ ist die kleinste Menge E, für die gilt: • Mengenoperationen – Vereinigung L1 ∪ L2, – Durchschnitt L1 ∩ L2, Differenz L1 \ L2; • Verkettung L1 · L2 = {w1 · w2 | w1 ∈ L1, w2 ∈ L2} S k • Stern (iterierte Verkettung) L∗1 = k≥0 L1 Def: Sprache regulär : ⇐⇒ kann durch diese Operationen aus endlichen Sprachen konstruiert werden. Satz: Durchschnitt und Differenz braucht man dabei nicht. • für jeden Buchstaben x ∈ Σ : x ∈ E (autotool: Ziffern oder Kleinbuchstaben) • das leere Wort ∈ E (autotool: Eps) • die leere Menge ∅ ∈ E (autotool: Empty) • wenn A, B ∈ E, dann – (Verkettung) A · B ∈ E (autotool: * oder weglassen) – (Vereinigung) A + B ∈ E (autotool: +) – (Stern, Hülle) A∗ ∈ E (autotool: ˆ*) Jeder solche Ausdruck beschreibt eine reguläre Sprache. – Typeset by FoilTEX – 18 Beispiele/Aufgaben zu regulären Ausdrücken Wir fixieren das Alphabet Σ = {a, b}. • alle Wörter, die mit a beginnen und mit b enden: aΣ b. ∗ • alle Wörter, die wenigstens drei a enthalten Σ∗aΣ∗aΣ∗aΣ∗ • alle Wörter mit gerade vielen a und beliebig vielen b? • Alle Wörter, die ein aa oder ein bb enthalten: Σ (aa ∪ bb)Σ ∗ ∗ • (Wie lautet das Komplement dieser Sprache?) – Typeset by FoilTEX – 19 Erweiterte reguläre Ausdrücke 1. zusätzliche Operatoren (Durchschnitt, Differenz, Potenz), die trotzdem nur reguläre Sprachen erzeugen Beispiel: Σ∗ \ (Σ∗abΣ∗)2 2. zusätzliche nicht-reguläre Operatoren Beispiel: exakte Wiederholungen L k := {wk | w ∈ L} beachte Unterschied zu Lk 3. Markierung von Teilwörtern, definiert (evtl. nicht-reguläre) Menge von Wörtern mit Positionen darin wenn nicht-reguläre Sprachen entstehen können, ist keine effiziente Verarbeitung (mit endlichen Automaten) möglich. auch reguläre Operatoren werden gern schlecht implementiert (http://swtch.com/˜rsc/regexp/regexp1.html) – Typeset by FoilTEX – 20 – Typeset by FoilTEX – Bemerkung zu Reg. Ausdr. Wie beweist man w ∈ L(X)? (Wort w gehört zur Sprache eines regulären Ausdrucks X) • wenn X = X1 + X2: beweise w ∈ L(X1) oder beweise w ∈ L(X2) • wenn X = X1 · X2: zerlege w = w1 · w2 und beweise w1 ∈ L(X1) und beweise w2 ∈ L(X2). • wenn X = X1∗: wähle einen Exponenten k ∈ N und beweise w ∈ L(X1k ) (nach vorigem Schema) Übungen Reg. Ausdr. • (Σ∗, ·, ) ist Monoid • . . . aber keine Gruppe, weil man im Allgemeinen nicht dividieren kann. Welche Relation ergibt sich als Teilbarkeit“: u | w := ∃v : u · v = w ” • Zeichne Hasse-Diagramme der Teilbarkeitsrelation – auf natürlichen Zahlen {0, 1, . . . , 10}, – auf Wörtern {a, b}≤2 • (Pow(Σ∗), ∪, ·, . . . , . . . ) ist Halbring. Beispiel für Distributivgesetz? Beispiel: w = abba, X = (ab ) . w = abb · a = ab2 · ab0 ∈ ab∗ · ab∗ ⊆ (ab∗)2 ⊆ (ab∗)∗. ∗ ∗ – Typeset by FoilTEX – 21 Welches sind jeweils die neutralen Elemente der Operationen? 22 – Typeset by FoilTEX – 23 Wort-Ersetzungs-Systeme (vgl. oben) Welche Relation auf Sprachen (Mengen) ergibt sich als Teilbarkeit“ bzgl. ∪ ? ” • Damit ab+c = ab · ac immer gilt, muß man a0 wie definieren? Berechnungs-Modell (Markov-Algorithmen) • Zustand (Speicherinhalt): Zeichenfolge (Wort) • Schritt: Ersetzung eines Teilwortes • Block-Kommentare und weitere autotool-Aufgaben • reguläre Ausdrücke für Tokenklassen in der Standard-Pascal-Definition http://www.standardpascal.org/iso7185. html#6.1Lexicaltokens Welche Notation wird für unsere Operatoren + und Stern benutzt? Was bedeuten die eckigen Klammern? – Typeset by FoilTEX – 24 • Id Formale Sprachen: Chomsky-Hierarchie Grammatik { terminale = mkSet "abc" (üblich: Kleinbuchst., Zif, variablen fern) = mkSet "SA" , start = ’S’ Variablen-Alphabet V , regeln = mkSet (üblich: Großbuchstaben) [ ("S", "abc") , ("ab", "aabbA") Startsymbol S ∈ V , ("Ab", "bA") , ("Ac", "cc") Regelmenge ] (Wort-Ersetzungs-System) } • (Typ 0) aufzählbare Sprachen (beliebige Grammatiken, Turingmaschinen) • (Typ 1) kontextsensitive Sprachen (monotone Grammatiken, linear beschränkte Automaten) • (Typ 2) kontextfreie Sprachen (kontextfreie Grammatiken, Kellerautomaten) • (Typ 3) reguläre Sprachen (rechtslineare Grammatiken, reguläre Ausdrücke, endliche Automaten) • Terminal-Alphabet Σ • – Typeset by FoilTEX – Grammatiken Grammatik G besteht aus: • Regelmenge R ⊆ Σ∗ × Σ∗ Regel-Anwendung: u →R v ⇐⇒ ∃x, z ∈ Σ∗, (l, r) ∈ R : u = x · l · z ∧ x · r · z = v. Beispiel: Bubble-Sort: {ba → ab, ca → ac, cb → bc} Beispiel: Potenzieren: ab → bba Aufgaben: gibt es unendlich lange Rechnungen für: R1 = {1000 → 0001110}, R2 = {aabb → bbbaaa}? Tokenklassen sind meist reguläre Sprachen. Programmiersprachen werden kontextfrei beschrieben (mit Zusatzbedingungen). R ⊆ (Σ ∪ V )∗ × (Σ ∪ V )∗ von G erzeugte Sprache: L(G) = {w | S →∗R w ∧ w ∈ Σ∗}. – Typeset by FoilTEX – Id Typ-3-Grammatiken – Typeset by FoilTEX – Id Sätze über reguläre Sprachen (= rechtslineare Grammatiken) jede Regel hat die Form Für jede Sprache L sind die folgenden Aussagen äquivalent: • Variable → Terminal Variable • es gibt einen regulären Ausdruck X mit L = L(X), • es gibt eine Typ-3-Grammatik G mit L = L(G), • Variable → Terminal • Variable → • es gibt einen endlichen Automaten A mit L = L(A). (vgl. lineares Gleichungssystem) Beispiele Beweispläne: • G1 = ({a, b}, {S, T }, S, {S → , S → aT, T → bS}) • Ausdruck → Automat (Teilbaum = Zustand) • Grammatik ↔ Automat (Variable = Zustand) • Automat → Ausdruck (dynamische Programmierung) • G2 = ({a, b}, {S, T }, S, {S → , S → aS, S → bT, T → aT, T → bS}) – Typeset by FoilTEX – LA(p, q, r) = alle Pfade von p nach r über Zustände ≤ q. Id – Typeset by FoilTEX – Kontextfreie Sprachen Id Klammer-Sprachen Def (Wdhlg): G ist kontextfrei (Typ-2), falls Abstraktion von vollständig geklammerten Ausdrücke mit ∀(l, r) ∈ R(G) : l ∈ V . zweistelligen Operatoren geeignet zur Beschreibung von Sprachen mit (4*(5+6)-(7+8)) ⇒ (()()) ⇒ aababb hierarchischer Struktur. Höhendifferenz: h : {a, b}∗ → Z : w 7→ |w|a − |w|b Anweisung -> Bezeichner = Ausdruck | if Ausdruck then Anweisung else Anweisung Präfix-Relation: u ≤ w : ⇐⇒ ∃v : u · v = w Ausdruck -> Bezeichner | Literal Dyck-Sprache: D = {w | h(w) = 0 ∧ ∀u ≤ w : h(u) ≥ 0} | Ausdruck Operator Ausdruck CF-Grammatik: G = ({a, b}, {S}, S, {S → , S → aSbS}) Bsp: korrekt geklammerte Ausdrücke: G = ({a, b}, {S}, S, {S → aSbS, S → }). Satz: L(G) = D. Beweis (Plan): Bsp: Palindrome: L(G) ⊆ D Induktion über Länge der Ableitung G = ({a, b}, {S}, S, {S → aSa, S → bSb, S → ). Bsp: alle Wörter w über Σ = {a, b} mit |w|a = |w|b D ⊆ L(G) Induktion über Wortlänge – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id (erweiterte) Backus-Naur-Form Übungen • Noam Chomsky: Struktur natürlicher Sprachen (1956) • John Backus, Peter Naur: Definition der Syntax von Algol (1958) • Beispiele Wort-Ersetzung (ab → baa, usw.) • Dyck-Sprache: Beweis L(G) ⊆ D (Induktionsbehauptung? Induktionsschritt?) Backus-Naur-Form (BNF) ≈ kontextfreie Grammatik <assignment> -> <variable> = <expression> <number> -> <digit> <number> | <digit> Erweiterte BNF • Dyck-Sprache: Beweis D ⊆ L(G) • CF-Grammatik für {w | w ∈ {a, b}∗, |w|a = |w|b} • Wiederholungen (Stern, Plus) <digit>ˆ+ • Auslassungen • CF-Grammatik für {w | w ∈ {a, b}∗, 2 · |w|a = |w|b} if <expr> then <stmt> [ else <stmt> ] kann in BNF übersetzt werden – Typeset by FoilTEX – Id – Typeset by FoilTEX – Ableitungsbäume für CF-Sprachen Id Ableitungsbäume (II) Def: ein geordneter Baum T mit Markierung m : T → Σ ∪ {} ∪ V ist Ableitungsbaum für eine CF-Grammatik G, wenn: Def: der Rand eines geordneten, markierten Baumes (T, m) ist die Folge aller Blatt-Markierungen (von links nach rechts). Beachte: die Blatt-Markierungen sind ∈ {} ∪ Σ, d. h. Terminalwörter der Länge 0 oder 1. Für Blätter: rand(b) = m(b), für innere Knoten: rand(k) = rand(k1) rand(k2) . . . rand(kn) Satz: w ∈ L(G) ⇐⇒ existiert Ableitungsbaum (T, m) für G mit rand(T, m) = w. • für jeden inneren Knoten k von T gilt m(k) ∈ V • für jedes Blatt b von T gilt m(b) ∈ Σ ∪ {} • für die Wurzel w von T gilt m(w) = S(G) (Startsymbol) • für jeden inneren Knoten k von T mit Kindern k1, k2, . . . , kn gilt (m(k), m(k1)m(k2) . . . m(kn)) ∈ R(G) (d. h. jedes m(ki) ∈ V ∪ Σ) • für jeden inneren Knoten k von T mit einzigem Kind k1 = gilt (m(k), ) ∈ R(G). – Typeset by FoilTEX – Id – Typeset by FoilTEX – Eindeutigkeit Assoziativität Def: G heißt eindeutig, falls ∀w ∈ L(G) genau ein Ableitungsbaum (T, m) existiert. Bsp: ist {S → aSb|SS|} eindeutig? (beachte: mehrere Ableitungen S →∗R w sind erlaubt, und wg. Kontextfreiheit auch gar nicht zu vermeiden.) • Definition: Operation ist assoziativ • Bsp: Plus ist nicht assoziativ (für Gleitkommazahlen) (Ü) • für nicht assoziativen Operator muß man festlegen, was x y z bedeuten soll: Die naheliegende Grammatik für arith. Ausdr. expr -> number | expr + expr | expr * expr ist mehrdeutig (aus zwei Gründen!) Auswege: ? ? ? (3 − 2) − 4 = 3 − 2 − 4 = 3 − (2 − 4) ? ? (3 ∗ ∗2) ∗ ∗4 = 3 ∗ ∗2 ∗ ∗4 = 3 ∗ ∗(2 ∗ ∗4) • . . . und dann die Grammatik entsprechend einrichten Id – Typeset by FoilTEX – Assoziativität (II) Id Präzedenzen X1 + X2 + X3 auffassen als (X1 + X2) + X3 Grammatik-Regeln Ausdruck -> Zahl | Ausdruck + Ausdruck ersetzen durch Ausdruck -> Summe Summe -> Summand | Summe + Summand Summand -> Zahl – Typeset by FoilTEX – ? (3 + 2) + 4 = 3 + 2 + 4 = 3 + (2 + 4) • Transformation zu eindeutiger Grammatik (benutzt zusätzliche Variablen) • Operator-Assoziativitäten und -Präzedenzen – Typeset by FoilTEX – Id ? ? (3 + 2) ∗ 4 = 3 + 2 ∗ 4 = 3 + (2 ∗ 4) Grammatik-Regel summand -> zahl erweitern zu summand -> zahl | produkt produkt -> ... (Assoziativität beachten) Id – Typeset by FoilTEX – Id Zusammenfassung Operator/Grammatik Übung Operator/Grammatik Ziele: Übung: • Klammern einsparen • Verhältnis von plus zu minus, mal zu durch? Festlegung: • Klammern? • trotzdem eindeutig bestimmter Syntaxbaum • unäre Operatoren (Präfix/Postfix)? • Assoziativität: bei Kombination eines Operators mit sich • Präzedenz: bei Kombination verschiedener Operatoren Realisierung in CFG: • Links/Rechts-Assoziativität ⇒ Links/Rechts-Rekursion • verschiedene Präzedenzen ⇒ verschiedene Variablen – Typeset by FoilTEX – Id – Typeset by FoilTEX – Semantik von Programmiersprachen Attributgrammatiken (I) • Attribut: Annotation an Knoten des Syntaxbaums. Statische und dynamische Semantik A : Knotenmenge → Attributwerte Semantik = Bedeutung (Bsp: N) • Attributgrammatik besteht aus: • statisch (kann zur Übersetzungszeit geprüft werden) – kontextfreier Grammatik G (Bsp: {S → e | mSS}) – für jeden Knotentyp (Terminal + Regel) eine Menge (Relation) von erlaubten Attribut-Tupeln (A(X0), A(X1), . . . , A(Xn)) für Knoten X0 mit Kindern [X1, . . . , Xn] Beispiele: – Typ-Korrektheit von Ausdrücken, – Bedeutung (Bindung) von Bezeichnern Hilfsmittel: Attributgrammatiken S → mSS , A(X0) + A(X3) = A(X2); S → e, A(X0) = A(X1); Terminale: A(e) = 1, A(m) = 0 • dynamisch (beschreibt Ausführung des Programms) operational, axiomatisch, denotational – Typeset by FoilTEX – Id Id – Typeset by FoilTEX – Id Donald E. Knuth Attributgrammatiken (II) ein Ableitungsbaum mit Annotationen ist korrekt bezüglich einer Attributgrammatik, wenn • The Art Of Computer Programming (1968, . . . ) (Band 3: Sortieren und Suchen) • zur zugrundeliegenden CF-Grammatik paßt • in jedem Knoten das Attribut-Tupel (von Knoten und Kindern) zur erlaubten Tupelmenge gehört • TEX, Metafont, Literate Programming (1983, . . . ) (Leslie Lamport: LATEX) Plan: • Attribut-Grammatiken • Baum beschreibt Syntax, Attribute beschreiben Semantik Ursprung: Donald Knuth: Semantics of Context-Free Languages, (Math. Systems Theory 2, 1968) technische Schwierigkeit: Attributwerte effizient bestimmen. (beachte: (zirkuläre) Abhängigkeiten) – Typeset by FoilTEX – • die Bezeichnung NP-vollständig“ ” • ... http://www-cs-faculty.stanford.edu/˜uno/ Id Arten von Attributen – Typeset by FoilTEX – Id Attributgrammatiken–Beispiele • synthetisiert: • Auswertung arithmetischer Ausdrücke (dynamisch) hängt nur von Attributwerten in Kindknoten ab • Bestimmung des abstrakten Syntaxbaumes • ererbt (inherited) • Typprüfung (statisch) hängt nur von Attributwerten in Elternknoten und (linken) Geschwisterknoten ab • Kompilation (für Kellermaschine) (statisch) Wenn Abhängigkeiten bekannt sind, kann man Attributwerte durch Werkzeuge bestimmen lassen. – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Regeln zur Typprüfung Konkrete und abstrakte Syntax . . . bei geschachtelten Funktionsaufrufen • konkreter Syntaxbaum = der Ableitungsbaum • Funktion f hat Typ A → B • abstrakter Syntaxbaum = wesentliche Teile des konkreten Baumes • Ausdruck X hat Typ A unwesentlich sind z. B. die Knoten, die zu Hilfsvariablen der Grammatik gehören. abstrakter Syntaxbaum kann als synthetisiertes Attribut konstruiert werden. E -> E + P E -> P ; ; • dann hat Ausdruck f (X) den Typ B Beispiel String x = "foo"; String y = "bar"; E.abs = new Plus(E.abs, P.abs) Boolean.toString (x.length() < y.length())); E.abs = P.abs (Curry-Howard-Isomorphie) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id cd pps/rechner ; make ; make test ; make clean Übung Attributgrammatiken/SableCC (dafür muß sablecc gefunden werden, also /usr/local/waldmann/bin im PATH sein) • SableCC: http://sablecc.org/ SableCC is a parser generator for building compilers, interpreters . . . , strictly-typed abstract syntax trees and tree walkers • Struktur: – rechner.grammar enthält Attributgrammatik, diese beschreibt die Konstruktion des abstrakten • Syntax einer Regel Syntaxbaumes (AST) aus dem Ableitungsbaum (konkreten Syntaxbaum) linke-seite { -> attribut-typ } – Eval.java = { zweig-name } rechte-seite { -> attribut-wert } enthält Besucherobjekt, dieses beschreibt die Attributierung der AST-Knoten durch Zahlen • Quelltexte: – Hauptprogramm in Interpreter.java git clone git://dfa.imn.htwk-leipzig.de/ws13-code/pps.git – bauen, testen, aufräumen: siehe Makefile – generierte Dateien in rechner/* Benutzung: – Typeset by FoilTEX – Id Multiplikation, Subtraktion, Klammern, Potenzen Kommentar: in Java fehlen: algebraische Datentypen, Pattern Matching, Funktionen höherer Ordnung. Deswegen muß SableCC das simulieren — das sieht nicht schön aus. Die richtige“ Lösung sehen Sie später im Compilerbau. ” Abstrakter Syntaxbaum, Interpreter: http://www.imn.htwk-leipzig.de/˜waldmann/ edu/ws11/cb/folien/main/node12.html, Kombinator-Parser: http://www.imn.htwk-leipzig.de/˜waldmann/ edu/ws11/cb/folien/main/node70.html Id Beispiel: 3 ∗ x + 1 ⇒ push 3, push x, mal, push 1, plus • Code für Konstante/Variable c : push c; • Code für Ausdruck x op y: code(x); code(y); op; • Ausführung eines Operators: holt beide Argumente vom Stack, schiebt Resultat auf Stack Der erzeugte Code ist synthetisiertes Attribut! Beispiele: Java-Bytecode (javac, javap), CIL (gmcs, monodis) – Typeset by FoilTEX – Id public static int g(int, int); Code: 0: iload_0 1: istore_2 2: iload_1 3: ifle 17 6: iload_2 7: iload_0 8: imul 9: istore_2 10: iload_1 11: iconst_1 12: isub 13: istore_1 Übungen (Stackmaschine) Schreiben Sie eine Java-Methode, deren Kompilation genau diesen Bytecode erzeugt: a) public static int h(int, int); Code: 0: iconst_3 1: iload_0 2: iadd 3: iload_1 4: iconst_4 5: isub 6: imul 7: ireturn b) – Typeset by FoilTEX – Id Ausdrücke → Kellermaschine • Aufgaben: – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id 14: goto 17: iload_2 18: ireturn Dynamische Semantik 2 • operational: beschreibt Wirkung von Anweisungen durch Änderung des Programmzustandes • denotational: ordnet jedem (Teil-)Programm einen Wert zu, Bsp: eine Funktion (höherer Ordnung). Beweis von Programmeigenschaften durch Term-Umformungen • axiomatisch (Bsp: Hoare-Kalkül): enthält Schlußregeln, um Aussagen über Programme zu beweisen – Typeset by FoilTEX – Id – Typeset by FoilTEX – Bsp: Operationale Semantik Id Denotationale Semantik Schleife while (B) A wird übersetzt in Sprungbefehle if (B) ... Beispiele (vervollständige!) Aufgabe: übersetze for(A; B; C) D in while! Vorteile denotationaler Semantik: • jedes (nebenwirkungsfreie) Unterprogramm ist eine Funktion von Argument nach Resultat • jede Anweisung ist eine Funktion von Speicherzustand nach Speicherzustand • Bedeutung eines Programmes = mathematisches Objekt • durch Term beschreiben, durch äquivalente Umformungen verarbeiten (equational reasoning) Vorteil deklarativer Programierung: Programmiersprache ist Beschreibungssprache – Typeset by FoilTEX – Id Beispiele Denotationale Semantik Unterprogramme definiert durch Gleichungssysteme. Sind diese immer eindeutig lösbar? Geben Sie geschlossenen arithmetischen Ausdruck für: f (x) = if x > 52 then x - 11 else f (f (x + 12)) beschreibt eine Zahl • jeder aussagenlogische Ausdruck (aus Variablen und Operatoren) beschreibt eine Funktion (von Variablenbelegung nach Wahrheitswert) t (x, y, z) = if x <= y then z else t ( t (x-1, , t (y-1, , t (z-1, • jeder reguläre Ausdruck beschreibt eine formale Sprache Id + 1 y, z) z, x) x, y) ) – Typeset by FoilTEX – Id Eiffel Axiomatische Semantik Notation für Aussagen über Programmzustände: { V } A { N } Bertrand Meyer, http://www.eiffel.com/ class Stack [G] feature count : INTEGER item : G is require not empty do ... end empty : BOOLEAN is do .. end full : BOOLEAN is do .. end put (x: G) is require not full do ... ensure not empty item = x count = old count + 1 Beispiel sinngemäß aus: B. Meyer: Object Oriented Software Construction, Prentice Hall 1997 • für jeden Zustand s, in dem Vorbedingung V gilt: • wenn Anweisung A ausgeführt wird, • und Zustand t erreicht wird, dann gilt dort Nachbedingung N Beispiel: { x >= 5 } y := x + 3 { y >= 7 } Gültigkeit solcher Aussagen kann man • beweisen (mit Hoare-Kalkül) • prüfen (testen) – Typeset by FoilTEX – Id Beispiel: Semantik von Unterprogr. • jeder arithmetische Ausdruck (aus Konstanten und Operatoren) – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Hoare-Kalkül Axiom für Schleifen Kalkül: für jede Anweisung ein Axiom, das die schwächste Vorbedingung (weakest precondition) beschreibt. Beispiele wenn { I and B } A { I }, dann { I } while (B) do A { I and not B } Beispiel: Eingabe int p, q; // p = P und q = Q int c = 0; // inv: p * q + c = P * Q while (q > 0) { ??? } // c = P * Q Moral: erst Schleifeninvariante (Spezifikation), dann Implementierung. • { N[x/E] } x := E { N } • { V und B } C { N } und { V und not B } D { N } => { V } if (B) then C else D { N } • Schleife . . . benötigt Invariante – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Typen Übungen (Invarianten) Ergänze das Programm: Eingabe: natürliche Zahlen a, b; // a = A und b = B int p = 1; int c = ???; // Invariante: cˆb * p = AˆB while (b > 0) { ??? b = abrunden (b/2); } Ausgabe: p; // p = AˆB – Typeset by FoilTEX – Warum Typen? • Typ ist Menge von Werten mit Operationen • für jede eigene Menge von Werten (Variablen) aus dem Anwendungsbereich benutze eine eigenen Typ • halte verschiedene Typen sauber getrennt, mit Hilfe der Programmiersprache • der Typ einer Variablen/Funktion ist ihre beste Dokumentation Id – Typeset by FoilTEX – Id Historische Entwicklung Überblick • keine Typen (alles ist int) • einfache (primitive) Typen – Zahlen, Wahrheitswerte, Zeichen – benutzerdefinierte Aufzählungstypen – Teilbereiche • vorgegebene Typen (Fortran: Integer, Real, Arrays) • benutzerdefinierte Typen (algebraische Datentypen; • zusammengesetzte (strukturierte) Typen Spezialfälle: enum, struct, class) Produkt (records) Summe (unions) rekursive Typen Potenz (Funktionen: Arrays, (Tree/Hash-)Maps, Unterprogramme) – Verweistypen (Zeiger) – – – – • abstrakte Datentypen (interface) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Aufzählungstypen Id Keine Aufzählungstypen können einer Teilmenge ganzer Zahlen zugeordnet werden • vorgegeben: int, char, boolean • nutzerdefiniert (enum) typedef enum { Mon, Tue, Wed, Thu, Fri, Sat, Sun } day; das ist nett gemeint, aber vergeblich: #define Mon 0 #define Tue 1 ... #define Sun 6 typedef int day; Designfragen: int main () { day x = Sat; day y = x * x; } • automatisch nach int umgewandelt? • automatisch von int umgewandelt? • eine Konstante in mehreren Aufzählungen möglich? – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Aufzählungstypen in C Aufzählungstypen in Java im wesentlichen genauso nutzlos: typedef enum { Mon, Tue, Wed, Thu, Fri, Sat, Sun } day; enum Day { Mon, Tue, Wed, Thu, Fri, Sat, Sun; public static void main (String [] argv) { for (Day d : Day.values ()) { System.out.println (d); } } int main () { day x = Sat; day y = x * x; } Übung: was ist in C++ besser? – Typeset by FoilTEX – } verhält sich wie Klasse (genauer: Schnittstelle mit 7 Implementierungen) siehe Übung (jetzt oder bei Objekten) Id – Typeset by FoilTEX – Teilbereichstypen in Ada Abgeleitete Typen in Ada with Ada.Text_Io; procedure Day is type Day is ( Mon, Tue, Thu, Fri, Sat, Sun ); subtype Weekday is Day range Mon .. Fri; X, Y : Day; begin X := Fri; Ada.Text_Io.Put (Day’Image(X)); Y := Day’Succ(X); Ada.Text_Io.Put (Day’Image(Y)); end Day; mit Bereichsprüfung bei jeder Zuweisung. einige Tests können aber vom Compiler statisch ausgeführt werden! – Typeset by FoilTEX – Id Id procedure Fruit is subtype Natural is Integer range 0 .. Integer’Last; type Apples is new Natural; type Oranges is new Natural; A : Apples; O : Oranges; I : Integer; begin -- nicht alles korrekt: A := 4; O := A + 1; I := A * A; end Fruit; Natural, Äpfel und Orangen sind isomorph, aber nicht zuweisungskompatibel. Sonderfall: Zahlenkonstanten gehören zu jedem abgeleiteten Typ. – Typeset by FoilTEX – Zusammengesetzte Typen Id Produkttypen (Records) Typ = Menge, Zusammensetzung = Mengenoperation: R=A×B×C Kreuzprodukt mit benannten Komponenten: typedef struct { A foo; B bar; C baz; } R; • Produkt (record, struct) • Summe (union, case class) • Rekursion • Potenz (Funktion) R x; ... B x.bar; ... erstmalig in COBOL (≤ 1960) Übung: Record-Konstruktion (in C, C++)? – Typeset by FoilTEX – Id Id Vereinigung mittels Interfaces Summen-Typen I repräsentiert die Vereinigung von A und B: interface I { } class A implements I { int foo; } class B implements I { String bar; } R=A∪B∪C disjunkte (diskriminierte) Vereinigung (Pascal) type tag = ( eins, zwei, drei ); type R = record case t : tag of eins : ( a_value : A ); zwei : ( b_value : B ); drei : ( c_value : C ); end record; nicht diskriminiert (C): typedef union { A a_value; B b_value; C c_value; } – Typeset by FoilTEX – – Typeset by FoilTEX – Notation dafür in Scala (http://scala-lang.org/) abstract class I case class A (foo : Int) extends I case class B (bar : String) extends I Verarbeitung durch Pattern matching def g (x : I): Int = x match { case A(f) => f + 1 case B(b) => b.length() } Id – Typeset by FoilTEX – Id Maßeinheiten in F# Rekursiv definierte Typen physikalische Größe = Maßzahl × Einheit. viele teure Softwarefehler durch Ignorieren der Einheiten. in F# (Syme, 200?), aufbauend auf ML (Milner, 197?) [<Measure>] type kg ;; let x = 1<kg> ;; x * x ;; [<Measure>] type s ;; let y = 2<s> ;; x * y ;; x + y ;; http://msdn.microsoft.com/en-us/library/ dd233243.aspx – Typeset by FoilTEX – Haskell (http://haskell.org/) data Tree a = Leaf a | Branch ( Tree a ) ( Tree a ) data List a = Nil | Cons a ( List a ) Java interface Tree<A> { } class Leaf<A> implements Tree<A> { A key } class Branch<A> implements Tree<A> { Tree<A> left, Tree<A> right } das ist ein algebraischer Datentyp, die Konstruktoren (Leaf, Nil) bilden die Signatur der Algebra, die Elemente der Algebra sind Terme (Bäume) Id – Typeset by FoilTEX – Potenz-Typen Id Felder (Arrays) B A := {f : A → B} (Menge aller Funktionen von A nach B) ist sinnvolle Notation, denn |B||A| = B A spezielle Realisierungen: Design-Entscheidungen: • Wertetabellen (Funktion mit endlichem Definitionsbereich) (Assoziative Felder, Hashmaps) • Index-Bereiche statisch oder dynamisch? • Felder (Definitionsbereich ist Aufzählungstyp) (Arrays) • Initialisierung? • Funktionen (Unterprogramme) • Bereichsprüfungen bei Indizierungen? • Allokation statisch oder dynamisch? • Zeichenketten (Strings) • mehrdimensionale Felder gemischt oder rechteckig? die unterschiedliche Notation dafür (Beispiele?) ist bedauerlich. – Typeset by FoilTEX – • welche Index-Typen erlaubt? (Zahlen? Aufzählungen?) Id – Typeset by FoilTEX – Felder in Java Felder in C int [][] feld = { {1,2,3}, {3,4}, {5}, {} }; for (int [] line : feld) { for (int item : line) { System.out.print (item + " "); } System.out.println (); } dynamische Dimensionierung und Allokation, Bereichsprüfungen. Nicht notwendig rechteckig. int main () { int a [10][10]; a[3][2] = 8; printf ("%d\n", a[2][12]); } statische Dimensionierung, dynamische Allokation, keine Bereichsprüfungen. Form: rechteckig, Adress-Rechnung: int [M][N]; a[x][y] ==> *(&a + (N*x + y)) – Typeset by FoilTEX – Id Felder in C# Id Das geht: int a [] = {1,2,3}; int b [] = {4,5}; int c [] = {6}; e = {a,b,c}; printf ("%d\n", e[1][1]); aber welches ist dann der Typ von e? (es ist nicht int e [][].) • int [][] a a in • Benutzung (Zugriff) • Initialisierung durch Array-Literal – Typeset by FoilTEX – – Typeset by FoilTEX – Nicht rechteckige Felder in C? Unterschiede zwischen • int [,] Id Id – Typeset by FoilTEX – Id Kosten der Bereichsüberprüfungen Dynamische Feldgrößen Designfrage: kann ein Feld (auch: String) seine Größe ändern? (C: wird sowieso nicht geprüft, Java: nein, Perl: ja) in Java: wenn man das will, dann will man statt Array eine LinkedList, statt String einen StringBuffer. wenn man mit Strings arbeitet, dann ist es meist ein Fehler: benutze Strings zwischen Programmen, aber niemals innerhalb eines Programms. es wird oft als Argument für C (und gegen Java) angeführt, daß die erzwungene Bereichsüberprüfung bei jedem Array-Zugriff so teuer sei. sowas sollte man erst glauben, wenn man es selbst gemessen hat. modernen Java-Compiler sind sehr clever und können theorem-prove away (most) subscript range checks das kann man auch in der Assembler-Ausgabe des JIT-Compilers sehen. ein einem Programm: benutze immer anwendungsspezifische Datentypen. . . . deren externe Syntax spiel überhaupt keine Rolle – Typeset by FoilTEX – Id Verweistypen – Typeset by FoilTEX – Id Verweis- und Wertsemantik in C# • Typ T , Typ der Verweise auf T . • für Objekte, deren Typ class ... ist: Verweis-Semantik (wie in Java) • Operationen: new, put, get, delete • ähnlich zu Arrays (das Array ist der Hauptspeicher) • für Objekte, deren Typ struct ... ist: • Java: alle nicht primitiven Typen sind Verweistypen, De-Referenzierung ist implizit Testfall: class s {public int foo; public string bar;} s x = new s(); x.foo = 3; x.bar = "bar"; s y = x; y.bar = "foo"; Console.WriteLine (x.bar); Wert-Semantik explizite Verweise in C, Pascal implizite Verweise: • C#: class ist Verweistyp, struct ist Werttyp – Typeset by FoilTEX – und dann class durch struct ersetzen Id – Typeset by FoilTEX – Algebraische Datentypen in Pascal, C Übung Typen Rekursion unter Verwendung von Verweistypen Pascal: type Tree = ˆ Node ; type Tag = ( Leaf, Branch ); type Node = record case t : Tag of Leaf : ( key : T ) ; Branch : ( left : Tree ; right : Tree ); end record; C: ähnlich, benutze typedef – Typeset by FoilTEX – • Teilbereichstypen und abgeleitete Typen in Ada (Vergleich mit dimensionierten Typen in F#) • Arrays in C (Assemblercode anschauen) • rechteckige und geschachtelte Arrays in C# • Wert/Verweis (struct/class) in C# Id – Typeset by FoilTEX – Bezeichner, Bindungen, Bereiche • ein Name bezeichnet einen unveränderlichen Wert X1 X x2n+1 e= , sin = (x 7→ (−1)n ) n! (2n + 1)! n≥0 n≥0 vereinfacht: Variable bezeichnet eine (logische) Speicherzelle genauer: Variable besitzt Attribute • auch n und x sind dabei lokale Konstanten (werden aber gern Variablen“ genannt) ” • auch die Variablen“ in Gleichungssystemen sind ” (unbekannte) Konstanten {x + y = 1 ∧ 2x + y = 1} Name Adresse Wert Typ Lebensdauer Sichtbarkeitsbereich in der Programmierung: • Variable ist Name für Speicherstelle (= konstanter Zeiger) • implizite Dereferenzierung beim Lesen und Schreiben Bindungen dieser Attribute statisch oder dynamisch – Typeset by FoilTEX – Id Namen in der Mathematik Variablen • • • • • • Id • Konstante: Zeiger auf schreibgeschützte Speicherstelle Id – Typeset by FoilTEX – Id Namen Typen für Variablen • welche Buchstaben/Zeichen sind erlaubt? • dynamisch (Wert hat Typ) • reservierte Bezeichner? • statisch (Name hat Typ) • Groß/Kleinschreibung? – deklariert (durch Programmierer) – inferiert (durch Übersetzer) z. B. var in C#3 • Konvention: long_name oder longName (camel-case) (Fortran: long name) im Zweifelsfall: Konvention der Umgebung einhalten Vor/Nachteile: Lesbarkeit, Sicherheit, Kosten • Konvention: Typ im Namen (schlecht, weil so Implementierungsdetails verraten werden) schlecht: myStack = ... besser: Stack<Ding> rest_of_input = ... – Typeset by FoilTEX – Id – Typeset by FoilTEX – Dynamisch getypte Sprachen Statisch getypte Sprachen Daten sind typisiert, Namen sind nicht typisiert. LISP, Clojure, PHP, Python, Perl, Javascript, . . . <html><body><script type="text/javascript"> var bar = true; var foo = bar ? [1,2] : function(x) {return 3*x;}; document.write (foo[0]); </script></body></html> – Typeset by FoilTEX – Id Daten sind typisiert, Namen sind typisiert • Programmierer muß Typen von Namen deklarieren: C, Java, . . . • Compiler inferiert Typen von Namen: ML, F#, Haskell, C# (var) Id – Typeset by FoilTEX – Id Typinferenz in C# Typdeklarationen public class infer { public static void Main (string [] argv) var arg = argv[0]; var len = arg.Length; System.Console.WriteLine (len); } } Beachte: das var in C# ist nicht das var aus Javascript. im einfachsten Fall (Java, C#): {Typname Variablenname [ = Initialisierung ] ; int [] a = { 1, 2, 3 }; Func<double,double> f = (x => sin(x)); gern auch komplizierter (C): dort gibt es keine Syntax für Typen, sondern nur für Deklarationen von Namen. double f (double x) { return sin(x); } int * p; double ( * a [2]) (double) ; Beachte: * und [] werden von außen nach innen “ ” angewendet Ü: Syntaxbäume zeichnen, a benutzen – Typeset by FoilTEX – Id Konstanten Id Lebensort und -Dauer von Variablen = Variablen, an die genau einmal zugewiesen wird • statisch (global, aber auch lokal:) • C: const (ist Attribut für Typ) int f (int x) { static int y = 3; y++; return x+y; } • Java: final (ist Attribut für Variable) Vorsicht: class C { int foo; } static void g (final C x) { x.foo ++; } • dynamisch – Stack { int x = ... } – Heap ∗ explizit (new/delete, malloc/free) ∗ implizit Merksatz: alle Deklarationen so lokal und so konstant wie möglich! (D. h. Attribute immutable usw.) – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Sichtbarkeit von Namen Überdeckungen = Bereich der Anweisungen/Deklarationen, in denen ein Name benutzt werden kann. • global • lokal: Block (und Unterblöcke) Üblich ist: Sichtbarkeit beginnt nach Deklaration und endet am Ende des umgebenden Blockes – Typeset by FoilTEX – Id Namen sind auch in inneren Blöcken sichtbar: int x; while (..) { int y; ... x + y ... } innere Deklarationen verdecken äußere: int x; while (..) { int x; ... x ... } – Typeset by FoilTEX – Id Ausdrücke Sichtbarkeit und Lebensdauer . . . stimmen nicht immer überein: Einleitung • static-Variablen in C-Funktionen • Ausdruck hat Wert (Zahl, Objekt, . . . ) (Ausdruck wird ausgewertet) • Anweisung hat Wirkung (Änderung des Programm/Welt-Zustandes) (Anweisung wird ausgeführt) sichtbar: in Funktion, Leben: Programm • lokale Variablen in Unterprogrammen sichtbar: innere Blöcke, Leben: bis Ende Unterpr. Vgl. Trennung (in Pascal, Ada) • Funktion (Aufruf ist Ausdruck) • Prozedur (Aufruf ist Anweisung) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Einleitung (II) Designfragen für Ausdrücke • in allen imperativen Sprachen gibt es Ausdrücke mit Nebenwirkungen • Präzedenzen (Vorrang) • Assoziativitäten (Gruppierung) (nämlich Unterprogramm-Aufrufe) • Ausdrücke dürfen (Neben-)Wirkungen haben? • in den rein funktionalen Sprachen gibt es keine (Neben-)Wirkungen, also keine Anweisungen • in welcher Reihenfolge treten die auf? (sondern nur Ausdrücke). • welche impliziten Typumwandlungen? • in den C-ähnlichen Sprachen ist = ein Operator, • explizite Typumwandlungen (cast)? (d. h. die Zuweisung ist syntaktisch ein Ausdruck) – Typeset by FoilTEX – Id • kann Programmierer Operatoren definieren? überladen? Id – Typeset by FoilTEX – Syntax von Ausdrücken Id Syntax von Konstanten • einfache Ausdrücke : Konstante, Variable Was druckt diese Anweisung? System.out.println ( 12345 + 5432l ); • zusammengesetzte Ausdrücke: dieses und einige der folgenden Beispiele aus: Joshua Bloch, Neil Gafter: Java Puzzlers, Addison-Wesley, 2005. – Operator-Symbol zwischen Argumenten – Funktions-Symbol vor Argument-Tupel wichtige Spezialfälle für Operatoren: • arithmetische, relationale, boolesche Wdhlg: Syntaxbaum, Präzedenz, Assoziativität. – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Der Plus-Operator in Java Überladene Operatornamen . . . addiert Zahlen und verkettet Strings. System.out.println ("foo" + 3 + 4); System.out.println (3 + 4 + "bar"); – Typeset by FoilTEX – aus praktischen Gründen sind arithmetische und relationale Operatornamen überladen (d. h.: ein Name für mehrere Bedeutungen) Überladung wird aufgelöst durch die Typen der Argumente. int x = 3; int y = 4; ... x + y ... double a; double b; ... a + b ... String p; String q; ... p + q ... Id Automatische Typanpassungen Id Implizite/Explizite Typumwandlungen in vielen Sprachen postuliert man eine Hierarchie von Zahlbereichstypen: byte ⊆ int ⊆ float ⊆ double im allgemeinen ist das eine Halbordnung. Operator mit Argumenten verschiedener Typen: (x :: int) + (y :: float) beide Argumente werden zu kleinstem gemeinsamen Obertyp promoviert, falls dieser eindeutig ist (sonst statischer Typfehler) (Halbordnung → Halbverband) – Typeset by FoilTEX – – Typeset by FoilTEX – Was druckt dieses Programm? long x = 1000 * 1000 * 1000 * 1000; long y = 1000 * 1000; System.out.println ( x / y ); Was druckt dieses Programm? System.out.println ((int) (char) (byte) -1); Moral: wenn man nicht auf den ersten Blick sieht, was ein Programm macht, dann macht es wahrscheinlich nicht das, was man will. Id Explizite Typumwandlungen – Typeset by FoilTEX – Id Der Verzweigungs-Operator Absicht: statt lieber if ( 0 == x % 2 ) { x = if ( 0 == x % 2 ) { x = x / 2; x / 2 } else { } else { x = 3 * x + 1; 3 * x + 1 } } ; historische Notation dafür x = ( 0 == x % 2 ) ? x / 2 : 3 * x + 1; ?/: ist ternärer Operator sieht gleich aus und heißt gleich (cast), hat aber verschiedene Bedeutungen: • Datum soll in anderen Typ gewandelt werden, Repräsentation ändert sich: double x = (double) 2 / (double) 3; • Programmierer weiß es besser (als der Compiler), Repräsentation ändert sich nicht: List books; Book b = (Book) books.get (7); . . . kommt nur vor, wenn man die falsche Programmiersprache benutzt (nämlich Java vor 1.5) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Verzweigungs-Operator(II) Relationale Operatoren (... ? ... : ... ) in C, C++, Java Anwendung im Ziel einer Zuweisung (C++): int main () { int a = 4; int b = 5; int c = 6; ( c < 7 ? a : b ) = 8; } – Typeset by FoilTEX – Id kleiner, größer, gleich,. . . Was tut dieses Programm (C? Java?) int a = -4; int b = -3; int c = -2; if (a < b < c) { printf ("aufsteigend"); } Id – Typeset by FoilTEX – Id Logische (Boolesche) Ausdrücke Noch mehr Quizfragen • und &&, || oder, nicht !, gleich, ungleich, kleiner, . . . • System.out.println ("H" + "a"); System.out.println (’H’ + ’a’); • nicht verwechseln mit Bit-Operationen &, | • char x = ’X’; int i = 0; System.out.print (true ? x : 0); System.out.print (false ? i : x); (in C gefährlich, in Java ungefährlich—warum?) • verkürzte Auswertung? Erklären durch Verweis auf Java Language Spec. int [] a = ...; int k = ...; if ( k >= 0 && a[k] > 7 ) { ... } (Ü: wie sieht das in Ada aus?) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Weitere Formen der Zuweisung Der Zuweisungs-Operator Syntax: (in C-ähnlichen Sprachen) • Algol, Pascal: Zuweisung :=, Vergleich = • verkürzte Zuweisung: a += b entsprechend für andere binäre Operatoren • Fortran, C, Java: Zuweisung =, Vergleich == Semantik der Zuweisung a = b: Ausdrücke links und rechts werden verschieden behandelt: • bestimme Adresse (lvalue) p von a • Inkrement/Dekrement • bestimme Wert (rvalue) v von b – Präfix-Version ++i, --j: Wert ist der geänderte – Suffix-Version i++, j--: Wert ist der vorherige • schreibe v auf p – Typeset by FoilTEX – – lvalue p von a wird bestimmt (nur einmal) – rvalue v von b wird bestimmt – Wert auf Adresse §p wird um v erhöht Id – Typeset by FoilTEX – Ausdrücke mit Nebenwirkungen Id Auswertungsreihenfolgen (side effect; falsche Übersetzung: Seiteneffekt) in C-ähnlichen Sprachen: Zuweisungs-Operatoren bilden Ausdrücke, d. h. Zuweisungen sind Ausdrücke und können als Teile von Ausdrücken vorkommen. Wert einer Zuweisung ist der zugewiesene Wert int a; int b; a = b = 5; // wie geklammert? Komma-Operator zur Verkettung von Ausdrücken (mit Nebenwirkungen) for (... ; ... ; i++,j--) { ... } Kritisch: wenn Wert des Ausdrucks von Auswertungsreihenfolge abhängt: int a; int b = (a = 5) + (a = 6); int d = 3; int e = (d++) - (++d); – Typeset by FoilTEX – – Typeset by FoilTEX – Id Auswertungsreihenfolge in C Sprachstandard (C99, C++) benutzt Begriff sequence point (Meilenstein): bei Komma, Fragezeichen, && und || • keine Nebenwirkungen: egal • mit Nebenwirkungen: – C, C++: Reihenfolge nicht spezifiziert, wenn Wert davon abhängt, dann ist Verhalten nicht definiert – Java, C#: Reihenfolge genau spezifiziert (siehe JLS) Id http://citeseerx.ist.psu.edu/viewdoc/ summary?doi=10.1.1.29.6755 die Nebenwirkungen zwischen Meilensteinen müssen unabhängig sein (nicht die gleiche Speicherstelle betreffen), ansonsten ist das Verhalten undefiniert (d.h., der Compiler darf machen, was er will) int x = 3; int y = ++x + ++x + ++x; vgl. Aussagen zu sequence points in http://gcc.gnu.org/readings.html Gurevich, Huggins: Semantics of C, – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Anweisungen(I) Programm-Ablauf-Steuerung Ausführen eines Programms im von-Neumann-Modell: Was? (Operation) Womit? (Operanden) Wohin? (Resultat) Wie weiter? (nächste Anweisung) strukturierte Programmierung: Definition Semantik: Anweisung hat Wirkung (Zustandsänderung), die bei Ausführung eintritt. abstrakte Syntax: • Nacheinander • einfache Anweisung: • außer der Reihe (Sprung, Unterprogramm, Exception) – Zuweisung – Unterprogramm-Aufruf • Verzweigung • zusammengesetzte Anweisung: • Wiederholung – Nacheinanderausführung (Block) – Verzweigung (zweifach: if, mehrfach: switch) – Wiederholung (Sprung, Schleife) – Typeset by FoilTEX – engl. control flow, falsche Übersetzung: Kontrollfluß; to control = steuern, to check = kontrollieren/prüfen Id – Typeset by FoilTEX – Id Verzweigungen (zweifach) Blöcke in den meisten Sprachen: if Bedingung then Anweisung1 [ else Anweisung2 ] Designfragen: Folge von (Deklarationen und) Anweisungen Designfrage: Blöcke • explizit (Klammern, begin/end) • implizit (if . . . then . . . end if) Designfrage: Deklarationen gestattet • was ist als Bedingung gestattet (gibt es einen Typ für Wahrheitswerte?) • am Beginn des (Unter-)Programms (Pascal) • dangling else – gelöst durch Festlegung (else gehört zu letztem if) – vermieden durch Block-Bildung (Perl, Ada) – tritt nicht auf, weil man else nie weglassen darf (vgl. ?/:) (Haskell) • am Beginn des Blocks (C) • an jeder Stelle des Blocks (C++, Java) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Mehrfach-Verzweigung Switch/break das macht eben in C, C++, Java nicht das, was man denkt: switch (index) { case 1 : odd ++; case 2 : even ++; default : printf ("wrong index %d\n", index); } C#: jeder Fall muß mit break (oder goto) enden. switch (e) { case c1 : s1 ; case c2 : s2 ; [ default : sn; ] } Designfragen: • • • • • • welche Typen für e? welche Werte für ci? Wertebereiche? was passiert, wenn mehrere Fälle zutreffen? was passiert, wenn kein Fall zutrifft (default?) (effiziente Kompilation?) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Kompilation Id Pattern Matching ein switch (mit vielen cases) wird übersetzt in: • Fallunterscheidung nach dem Konstruktor • (naiv) eine lineare Folge von binären Verzweigungen (if, elsif) • Bindung von lokalen Namen abstract class Term // Scala case class Constant (value : Int) extends Term case class Plus (left: Term, right : Term) extends Term def eval(t: Term): Int = { t match { case Constant(v) => v case Plus(l, r) => eval(l) + eval(r) } } • (semi-clever) einen balancierter Baum von binären Verzweigungen • (clever) eine Sprungtabelle Übung: • einen langen Switch (1000 Fälle) erzeugen (durch ein Programm!) • Assembler/Bytecode anschauen – Typeset by FoilTEX – Id Id – Typeset by FoilTEX – Id Anweisungen(II) Schleifen steuern durch. . . • Zähler Wiederholungen for p in 1 .. 10 loop .. end loop; • Maschine, Assembler: (un-)bedingter Sprung • Daten • strukturiert: Schleifen map (\x -> x*x) [1,2,3] ==> [1,4,9] Collection<String> c = new LinkedList<String> (); for (String s : c) { ... } Designfragen für Schleifen: • wie wird Schleife gesteuert? (Bedingung, Zähler, Daten, Zustand) • Bedingung • an welcher Stelle in der Schleife findet Steuerung statt (Anfang, Ende, dazwischen, evtl. mehreres) while ( x > 0 ) { if ( ... ) { x = ... } ... } • Zustand (Iterator, hasNext, next) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Termination Zählschleifen Idee: vor Beginn steht Anzahl der Durchläufe fest. Satz: Jedes Programm aus richtig realisiert ist das nur in Ada: for p in 1 .. 10 loop ... end loop; • Zuweisungen • Zähler p wird implizit deklariert • Zählschleifen • Verzweigungen terminiert (hält) für jede Eingabe. • Zähler ist im Schleifenkörper konstant Äquivalenter Begriff (für Bäume anstatt Zahlen): strukturelle Induktion (fold, Visitor, primitive Rekursion) Vergleiche (beide Punkte) mit Java, C++, C Satz: es gibt berechenbare Funktionen, die nicht primitiv rekursiv sind. Beispiel: Interpreter für primitiv rekursive Programme. – Typeset by FoilTEX – Id Datengesteuerte Schleifen Id Zustandsgesteuerte Schleifen Idee: führe für jeden Konstruktor eines algebraischen Datentyps (Liste, Baum) eine Rechnung/Aktion aus. foreach, Parallel.Foreach,... – Typeset by FoilTEX – – Typeset by FoilTEX – So: interface Iterator<T> { boolean hasNext(); T next (); } interface Iterable<T> { Iterator<T> iterator(); } for (T x : ...) { ... } Oder so: public interface IEnumerator<T> : IEnumerator { bool MoveNext(); T Current { get; } } interface IEnumerable<out T> : IEnumerable { IEnumerator<T> GetEnumerator() } foreach (T x in ...) { ... } (sieben Unterschiede . . . ) Id – Typeset by FoilTEX – Implizite Iteratoren in C# Id Schleifen mit Bedingungen using System.Collections.Generic; das ist die allgemeinste Form, ergibt (partielle) rekursive public class it { Funktionen, die terminieren nicht notwendig für alle public static IEnumerable<int> Data () { Argumente. yield return 3; Steuerung yield return 1; • am Anfang: while (Bedingung) Anweisung yield return 4; } • am Ende: do Anweisung while (Bedingung) public static void Main () { Weitere Änderung des Ablaufes: foreach (int i in Data()) { System.Console.WriteLine (i); • vorzeitiger Abbruch (break) } } } • vorzeitige Wiederholung (continue) • beides auch nicht lokal – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id vorzeitiges Verlassen Abarbeitung von Schleifen operationale Semantik durch Sprünge: while (B) A; ==> start : if (!B) goto end; A; goto start; end : skip; (das ist auch die Notation der autotool-Aufgabe) • . . . der Schleife while ( B1 ) { A1; if ( B2 ) break; A2; } • . . . des Schleifenkörpers while ( B1 ) { A1; if ( B2 ) continue; A2; } Ü: do A while (B); – Typeset by FoilTEX – Id – Typeset by FoilTEX – Geschachtelte Schleifen Id Sprünge manche Sprachen gestatten Markierungen (Labels) an Schleifen, auf die man sich in break beziehen kann: foo : for (int i = ...) { bar : for (int j = ...) { • bedingte, unbedingte (mit bekanntem Ziel) – Maschinensprachen, Assembler, Java-Bytecode – Fortran, Basic: if Bedingung then Zeilennummer – Fortran: dreifach-Verzweigung (arithmetic-if) if (...) break foo; • “computed goto” (Zeilennr. des Sprungziels ausrechnen) } } Wie könnte man das simulieren? – Typeset by FoilTEX – Id Sprünge und Schleifen Id Sprünge und Schleifen (Beweis) • man kann jedes while-Programm in ein goto-Programm übersetzen • und jedes goto-Programm in ein while-Programm . . . • . . . das normalerweise besser zu verstehen ist. • strukturierte Programmierung = jeder Programmbaustein hat genau einen Eingang und genau einen Ausgang • aber: vorzeitiges Verlassen von Schleifen • aber: Ausnahmen (Exceptions) – Typeset by FoilTEX – – Typeset by FoilTEX – Id Satz: zu jedem goto-Programm gibt es ein äquivalentes while-Programm. Beweis-Idee: 1 : A1, 2 : A2; .. 5: goto 7; .. ⇒ while (true) { switch (pc) { case 1 : A1 ; pc++ ; break; ... case 5 : pc = 7 ; break; ... } } Das nützt aber softwaretechnisch wenig, das übersetzte Programm ist genauso schwer zu warten wie das Original. – Typeset by FoilTEX – Schleifen und Unterprogramme Id Denotationale Semantik (I) zu jedem while-Programm kann man ein äquivalentes angeben, das nur Verzweigungen (if) und Unterprogramme benutzt. vereinfachtes Modell, damit Eigenschaften entscheidbar werden (sind die Programme P1, P2 äquivalent?) Syntax: Programme Beweis-Idee: while (B) A; ⇒ void s () { if (B) { A; s (); } } Anwendung: C-Programme ohne Schlüsselwörter. • Aktionen, – Typeset by FoilTEX – • Zustandsprädikate (in Tests) • Sequenz/Block, if, goto/while. Beispiel: while (B && !C) { P; if (C) Q; } Id – Typeset by FoilTEX – Id Auswertung der Umfrage Denotationale Semantik (II) Semantik des Programms P ist Menge der Spuren von P . http://www.imn.htwk-leipzig.de/˜waldmann/ edu/ws13/pps/umfrage/ • Spur = eine Folge von Paaren von Zustand und Aktion, • ein Zustand ist eine Belegung der Prädikatsymbole, • jede Aktion zerstört alle Zustandsinformation. Satz: Diese Spursprachen (von goto- und while-Programmen) sind regulär. Beweis: Konstruktion über endlichen Automaten. • Zustandsmenge = Prädikatbelegungen × Anweisungs-Nummer • Transitionen? (Beispiele) Damit ist Spur-Äquivalenz von Programmen entscheidbar. Beziehung zu tatsächlicher Äquivalenz? – Typeset by FoilTEX – Id Unterprogramme Id Parameter-Übergabe (Semantik) Datenaustausch zw. Aufrufer (caller) und Aufgerufenem (callee): über globalen Speicher #include <errno.h> extern int errno; oder über Parameter. Datentransport (entspr. Schüsselwörtern in Ada) Grundsätzliches Ein Unterprogramm ist ein benannter Block mit einer Schnittstelle. Diese beschreibt den Datentransport zwischen Aufrufer und Unterprogramm. • Funktion • in: (Argumente) vom Aufrufer zum Aufgerufenen – liefert Wert – Aufruf ist Ausdruck • out: (Resultate) vom Aufgerufenen zum Aufrufer • Prozedur • in out: in beide Richtungen – hat Wirkung, liefert keinen Wert (void) – Aufruf ist Anweisung – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Parameterübergabe Parameter-Übergabe (Implementierungen) häufig benutzte Implementierungen: • pass-by-value (Wert) • Pascal: by-value (default) oder by-reference (VAR) • copy in/copy out (Wert) • C: by-value (Verweise ggf. selbst herstellen) • pass-by-reference (Verweis) • C++ unterscheidet zwischen Zeigern (*, wie in C) und Referenzen (&, verweisen immer auf die gleiche Stelle, werden automatisch dereferenziert) • pass-by-name (textuelle Substitution) selten . . . Algol68, CPP-Macros . . . Vorsicht! • Java: primitive Typen und Referenz-Typen (= Verweise auf Objekte) by-value • C#: primitive Typen und struct by-value, Objekte by-reference, Schlüsselwort ref • Scala: by-value oder by-name – Typeset by FoilTEX – Id – Typeset by FoilTEX – Call-by-value, call-by-reference (C#) Id Call-by-name by value: formaler Parameter wird durch Argument-Ausdruck ersetzt. static void u (int x) { x = x + 1; } Algol(68): Jensen’s device int y = 3 ; u (y); sum (int i, int n; int f) { Console.WriteLine(y); // 3 int s = 0; by reference: for (i=0; i<n; i++) { s += f; } static void u (ref int x) { x = x + 1; } return s; int y = 3 ; u (ref y); } Console.WriteLine(y); // 4 int [10][10] a; int i; sum (i, 10, a[i][i]); Übung: ref/kein ref; struct (Werttyp)/class (Verweistyp) class C { public int foo } static void u (ref C x) { x.foo=4; x=new C{foo=5};} C y = new C {foo=3} ; C z = y; u (ref y); Console.WriteLine(y.foo + " " + z.foo); – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Call-by-name (Macros) Call-by-name in Scala #define thrice(x) 3*x // gefährlich thrice (4+y) ==> 3*4+y “the need for a preprocessor shows omissions in the language” • fehlendes Modulsystem (Header-Includes) • fehlende generische Polymorphie (⇒ Templates in C+) weitere Argumente: • mangelndes Vertrauen in optimierende Compiler (inlining) Parameter-Typ ist => T, entspr. eine Aktion, die ein T ” liefert“(in Haskell: IO T) call-by-name def F(b:Boolean,x: =>Int):Int = { if (b) x*x else 0 F(false,{print ("foo "); 3}) // res5: Int = 0 F(true,{print ("foo "); 3}) // foo foo res6: Int = 9 Man benötigt call-by-name zur Definition von Abstraktionen über den Programmablauf. Übung: If, While als Scala-Unterprogramm • bedingte Übersetzung – Typeset by FoilTEX – Id Bedarfsauswertung • [ error "foo" , 42 ] !! 0 [ error "foo" , 42 ] !! 1 length [ error "foo" , 42 ] let xs = "bar" : xs take 5 xs • Definition: das Argument wird bei seiner ersten Benutzung ausgewertet • wenn es nicht benutzt wird, dann nicht ausgewertet; wenn mehrfach benutzt, dann nur einmal ausgewertet • Fibonacci-Folge • das ist der Standard-Auswertungsmodus in Haskell: alle Funktionen und Konstruktoren sind lazy fib :: [ Integer ] fib = 0 : 1 : zipWith (+) fib ( tail fib ) da es keine Nebenwirkungen gibt, bemerkt man das zunächst nicht . . . • Primzahlen (Sieb des Eratosthenes) . . . und kann es ausnutzen beim Rechnen mit unendlichen Datenstrukturen (Streams) • Papier-Falt-Folge Id Id Bedarfsauswertung für eine lokale Konstante (Schlüsselwort lazy) def F(b:Boolean,x: =>Int):Int = { lazy val y = x; if (b) y*y else 0 } F(true,{print ("foo "); 3}) // foo res8: Int = 9 F(false,{print ("foo "); 3}) // res9: Int = 0 vgl. http: //mathworld.wolfram.com/DragonCurve.html Id Argumente/Parameter – Typeset by FoilTEX – Id Positionelle/benannte Argumente Üblich ist Zuordnung über Position void p (int height, String name) { ... } p (8, "foo"); in Ada: Zuordnung über Namen möglich procedure Paint (height : Float; width : Float); Paint (width => 30, height => 40); nach erstem benannten Argument keine positionellen mehr erlaubt • in der Deklaration benutzte Namen heißen (formale) Parameter, • bei Aufruf benutzte Ausdrücke heißen Argumente (. . . nicht: aktuelle Parameter, denn engl. actual = dt. tatsächlich) Designfragen bei Parameterzuordnung: • über Position oder Namen? gemischt? code smell: lange Parameterliste, refactoring: Parameterobjekt einführen allerdings fehlt (in Java) benannte Notation für Record-Konstanten. • defaults für fehlende Argumente? • beliebig lange Argumentlisten? – Typeset by FoilTEX – – Typeset by FoilTEX – Beispiele f. Bedarfsauswertung (Scala) let merge (x:xs) ys = x : merge ys xs let updown = 0 : 1 : updown let paper = merge updown paper take 15 paper – Typeset by FoilTEX – Id Beispiele f. Bedarfsauswertung (Haskell) • andere Namen: (call-by-need, lazy evaluation) – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Default-Werte Variable Argumentanzahl (C) C++: void p (int x, int y, int z = 8); p (3, 4, 5); p (3, 4); Default-Parameter müssen in Deklaration am Ende der Liste stehen wieso geht das eigentlich: #include <stdio.h> char * fmt = really_complicated(); printf (fmt, x, y, z); Anzahl und Typ der weiteren Argumente werden überhaupt nicht geprüft: Ada: extern int printf procedure P (X : Integer; Y : Integer := 8; Z : Integer); (__const char *__restrict __format, ...); P (4, Z => 7); Beim Aufruf nach weggelassenem Argument nur noch benannte Notation – Typeset by FoilTEX – Id – Typeset by FoilTEX – Variable Argumentanzahl (Java) Id Aufgaben zu Parameter-Modi (I) static void check (String x, int ... ys) { Erklären Sie den Unterschied zwischen (Ada) for (int y : ys) { System.out.println (y); } with Ada.Text_IO; use Ada.Text_IO; } procedure Check is procedure Sub (X: in out Integer; check ("foo",1,2); check ("bar",1,2,3,4); Y: in out Integer; letzter formaler Parameter kann für beliebig viele des Z: in out Integer) is gleichen Typs stehen. begin tatsächlich gilt int [] ys, Y := 8; Z := X; end; das ergibt leider Probleme bei generischen Typen Foo: Integer := 9; Bar: Integer := 7; begin Sub (Foo,Foo,Bar); Put_Line (Integer’Image(Foo)); – Typeset by FoilTEX – Id Put_Line (Integer’Image(Bar)); end Check; (in Datei Check.adb schreiben, kompilieren mit gnatmake Check.adb) und (C++) #include <iostream> – Typeset by FoilTEX – Id int bar = 7; sub (foo,foo,bar); std::cout << foo << std::endl; std::cout << bar << std::endl; } void sub (int & x, int & y, int & z) { y = 8; z = x; } int main () { int foo = 9; – Typeset by FoilTEX – Id – Typeset by FoilTEX – Lokale Unterprogramme Aufgaben zu Parameter-Modi (II) Durch welchen Aufruf kann man diese beiden Unterprogramme semantisch voneinander unterscheiden: Funktion (C++): (call by reference) void swap (int & x, int & y) { int h = x; x = y; y = h; } Makro (C): (call by name) #define swap(x, y) \ { int h = x; x = y; y = h; } • Unterprogramme sind wichtiges Mittel zur Abstraktion, das möchte man überall einsetzen • also sind auch lokale Unterprogramme wünschenswert (Konzepte Block und Unterprogramm sollen orthogonal sein) int f (int x) { int g (int y) { return y + 1; } return g (g (x)); } Kann man jedes der beiden von copy-in/copy-out unterscheiden? – Typeset by FoilTEX – Id Id – Typeset by FoilTEX – Id Frames, Ketten Statische und dynamische Sichtbarkeit Während ein Unterprogramm rechnet, stehen seine lokalen Daten in einem Aktivationsverbund (Frame). Jeder Frame hat zwei Vorgänger: Zugriff auf nichtlokale Variablen? (Bsp: Zugriff auf X in F) with Ada.Text_Io; use Ada.Text_Io; procedure Nest is X : Integer := 4; function F (Y: Integer) return Integer is begin return X + Y; end F; function G (X : Integer) return Integer is begin return F(3 * X); end G; begin Put_Line (Integer’Image (G(5))); end Nest; • dynamischer Vorgänger: (Frame des aufrufenden UP) benutzt zum Rückkehren • statischer Vorgänger (Frame des textuell umgebenden UP) benutzt zum Zugriff auf “fremde” lokale Variablen • statische Sichtbarkeit: textuell umgebender Block (Pascal, Ada, Scheme-LISP, Haskell . . . ) Jeder Variablenzugriff hat Index-Paar (i, j): im i-ten statischen Vorgänger der Eintrag Nr. j lokale Variablen des aktuellen UP: Index (0, j) • dynamische Sichtbarkeit: Aufruf-Reihenfolge ((Common-LISP), (Perl)) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Lokale Unterprogramme: Beispiel Flache Unterprogramme (C) Entwurfs-Entscheidung für C: with Ada.Text_Io; use Ada.Text_Io; procedure Nested is function F (X: Integer; Y: Integer) return Integer is function G (Y: Integer) return Integer is begin if (Y > 0) then return 1 + G(Y-1); else return X; end if; end G; begin return G (Y); end F; begin Put_Line (Integer’Image (F(3,2))); end Nested; – Typeset by FoilTEX – Id • jedes Unterprogramm ist global Folgerung: • leichte Implementierung: – dynamischer Vorgänger = der vorige Frame (auf dem Stack) – statischer Vorgänger: gibt es nicht • softwaretechnische Nachteile: globale Abstraktionen machen Programm unübersichtlich. Id – Typeset by FoilTEX – Id Lokale Unterprogramme in C# und Java Unterprogramme als Argumente in C# gibt es lokale Unterprogramme: int x = 3; Func <int,int> f = y => x + y; Console.WriteLine (f(4)); in Java gibt es keine lokalen Unterprogramme, aber innere Klassen, dabei ähnliche Fragen class C { class D { .. } } static int d ( Func<int,int> g ) { return g(g(1)); } static int p (int x) { Func<int,int> f = y => x + y; return d (f); } Betrachte Aufruf p(3). Das innere Unterprogramm f muß auf den p-Frame zugreifen, um den richtigen Wert des x zu finden. Dazu Closure konstruieren: f mit statischem Vorgänger. Wenn Unterprogramme als Argumente übergeben werden, steht der statische Vorgänger im Stack. (ansonsten muß man den Vorgänger-Frame auf andere Weise retten, siehe später) – Typeset by FoilTEX – – Typeset by FoilTEX – Id Unterprogramme als Resultate Id Lokale anonyme Unterprogramme static int x = 3; static Func<int,int> s (int y) { return z => x + y + z; } static void Main () { Func<int,int> p = s(4); Console.WriteLine (p(3)); } Wenn die von s(4) konstruierte Funktion p aufgerufen wird, dann wird der s-Frame benötigt, steht aber nicht mehr im Stack. ⇒ Die (Frames in den) Closures müssen im Heap verwaltet werden. historische Schreibweise: λab.2a + b (Alonzo Church: The Calculi of Lambda Conversion, 1941) vgl. Henk Barendregt: The Impact of the Lambda Calculus, 1997, ftp: //ftp.cs.ru.nl/pub/CompMath.Found/church.ps – Typeset by FoilTEX – – Typeset by FoilTEX – Id • int [] x = { 1,0,0,1,0 }; Console.WriteLine (x.Aggregate (0, (a, b) => 2*a + b)); http://code.msdn.microsoft.com/ LINQ-Aggregate-Operators-c51b3869 • foldl ( \ a b -> 2*a + b) 0 [1,0,0,1,0] Haskell (http://haskell.org/) Id Lokale Klassen (Java) Lokale Funktionen in Java 8 interface Function<T,R> { R apply(T t); } • static nested class: dient lediglich zur Gruppierung bisher (Java ≤ 7): class C { static class D { .. } .. } Function<Integer,Integer> f = new Function<Integer,Integer> () { • nested inner class: public Integer apply (Integer x) { return x*x; class C { class D { .. } .. } } } ; jedes D-Objekt hat einen Verweis auf ein C-Objekt (≈ System.out.println (f.apply(4)); statische Kette) (bezeichnet durch C.this) jetzt (Java 8): verkürzte Notation (Lambda-Ausdruck) für • local inner class: ( Zugriff auf lokale Variablen in m nur, Implementierung funktionaler Interfaces wenn diese final sind. Warum? ) Function<Integer,Integer> g = x -> x*x; System.out.println (g.apply(4)); class C { void m () { class D { .. } .. } } Anwendung u.a. in java.util.stream.Stream<T> – Typeset by FoilTEX – Id – Typeset by FoilTEX – Polymorphie Unterprogramme/Zusammenfassung in prozeduralen Sprachen: Übersicht • falls alle UP global: dynamische Kette reicht poly-morph = viel-gestaltig ein Bezeichner (z. B. Unterprogramm-Name) mit mehreren Bedeutungen Arten der Polymorphie: • lokale UP: benötigt auch statische Kette • lokale UP as Daten: benötigt Closures = (Code, statischer Link) • statische P. (Bedeutung wird zur Übersetzungszeit festgelegt): • UP als Argumente: Closures auf Stack – ad-hoc: Überladen von Bezeichnern – generisch: Bezeichner mit Typ-Parametern • UP als Resultate: Closures im Heap in objektorientierten Sprachen: ähnliche Überlegungen bei lokalen (inner, nested) Klassen. – Typeset by FoilTEX – • dynamische P. (Bedeutung wird zur Laufzeit festgelegt): – Implementieren (Überschreiben) von Methoden Id – Typeset by FoilTEX – Ad-Hoc-Polymorphie Id Generische Polymorphie parametrische Polymorphie: • ein Bezeichner ist überladen, wenn er mehrere (gleichzeitig sichtbare) Deklarationen hat • Klassen und Methoden können Typ-Parameter erhalten. • bei jeder Benutzung des Bezeichners wird die Überladung dadurch aufgelöst, daß die Deklaration mit dem jeweils (ad-hoc) passenden Typ ausgewählt wird Beispiel: Überladung im Argumenttyp: static void p (int x, int y) { static void p (int x, String y) { p (3, 4); p (3, "foo"); keine Überladung nur in Resultattyp, denn. . . static int f (boolean b) { ... static String f (boolean b) { ... • innerhalb der Implementierung der Klasse/Methode wird der formale Typ-Parameter als (unbekannter) Typ behandelt • bei der Benutzung der Klasse/Methode müssen alle Typ-Argumente angegeben werden ... } ... } (oder der Compiler inferiert diese in einigen Fällen) • separate Kompilation (auch von generischen Klassen) mit statischer Typprüfung } } – Typeset by FoilTEX – Id Bsp: Generische Methode in C# – Typeset by FoilTEX – Id Bsp: Generische Klasse in Java class C { static T id<T> (T x) { return x; } } class Pair<A,B> { final A first; final B second; Pair(A a, B b) { this.first = a; this.second = b; } } Pair<String,Integer> p = new Pair<String,Integer>("foo", 42); int x = p.second + 3; vor allem für Container-Typen (Liste, Menge, Keller, Schlange, Baum, . . . ) string foo = C.id<string> ("foo"); int bar = C.id<int> (42); – Typeset by FoilTEX – Id Id – Typeset by FoilTEX – Id Bsp: Generische Methode in Java Generische Fkt. höherer Ordg. class C { Anwendung: Sortieren mit Vergleichsfunktion als Parameter static <A,B> Pair<B,A> swap (Pair<A,B> p) { using System; class Bubble { return new Pair<B,A>(p.second, p.first); static void Sort<T> } } (Func<T,T,bool> Less, T [] a) { ... Pair<String,Integer> p = if (Less (a[j+1],a[j])) { ... } } new Pair<String,Integer>("foo", 42); public static void Main (string [] argv) { Pair<Integer,String> q = int [] a = { 4,1,2,3 }; C.<String,Integer>swap(p); Sort<int> ((int x, int y) => x <= y, a); Typargumente können auch inferiert werden: foreach (var x in a) Console.Write (x); } } Pair<Integer,String> q = C.swap(p); Ü: (allgemeinster) Typ und Implementierung einer Funktion Flip, die den Vergleich umkehrt: Sort<int> (Flip( (x,y)=> x <= y ), a) – Typeset by FoilTEX – Id Anonyme Typen (Wildcards) Wenn man einen generischen Typparameter nur einmal braucht, dann kann er ? heißen. List<?> x = Arrays.asList (new String[] {"foo","bar"}); Collections.reverse(x); System.out.println(x); jedes Fragezeichen bezeichnet einen anderen (neuen) Typ: List<?> x = Arrays.asList (new String[] {"foo","bar"}); List<?> y = x; y.add(x.get(0)); – Typeset by FoilTEX – Id Objekte, Methoden Dynamische Polymorphie (Objektorientierung) Definitionen ein Bezeichner mit mehreren Bedeutungen poly-morph = viel-gestaltig. Formen der Polymorphie: • ad-hoc: einfaches Überladen von Bezeichnern • parametrisch (und statisch): Typparameter für generische Klassen und Methoden • dynamisch: Auswahl der Methoden-Implementierung durch Laufzzeittyp des Objektes – Typeset by FoilTEX – Id (d. h. objektorientiert, aber ohne Klassen) Objekte, Attribute, Methoden: var o = { a : 3, m : function (x) { return x + this.a; } }; Vererbung zwischen Objekten: var p = { __proto__ : o }; Attribut (/Methode) im Objekt nicht gefunden ⇒ weitersuchen im Prototyp ⇒ . . . Prototyp des Prototyps . . . Übung: Überschreiben p.m = function (x) { return x + 2*this.a } var q = { __proto__ : p } q.a = 4 alert (q.m(5)) • Objekt ist Record, • einige Komponenten sind Unterprogramme. typedef struct { int x; int y; // Daten void (*print) (FILE *fp); // Verhalten } point; point *p; ... ; (*(p->print))(stdout); Anwendung: Datei-Objekte in UNIX (seit 1970) (Merksatz 1: all the world is a file) (Merksatz 2: those who do not know UNIX are doomed to re-invent it, poorly) Id – Typeset by FoilTEX – Id this Klassenbasierte Sprachen Motivation: Methode soll wissen, für welches Argument sie gerufen wurde typedef struct { int (*data)[3]; int (*method[5])(); } obj; obj *o; ... (*(o->method)[3])(o); gemeinsame Datenform und Verhalten von Objekten typedef struct { int (*method[5])(); } obj; obj *o; ... (*(o->method)[3])(); allgemein: Klasse: • Deklaration von Daten (Attributen) • Deklaration und Implementierung von Methoden int sum (obj *this) { return this->data[0] + this->data[1]; } jede Methode bekommt this als (verstecktes) erstes Argument Objekt: • tatsächliche Daten (Attribute) • Verweis auf Klasse (Methodentabelle) – Typeset by FoilTEX – Id Objektbasierte Sprachen (JavaScript) Motivation: Objekt = Daten + Verhalten. Einfachste Implementierung: – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Vererbung Dynamische Polymorphie (Beispiel) Def: Klasse D ist abgeleitet von Klasses C: • D kann Menge der Attribute- und Methodendeklarationen von C erweitern (aber nicht verkleinern oder ändern) • D kann Implementierungen von in C deklarierten Methoden übernehmen oder eigene festlegen (überschreiben). Anwendung: dynamische Polymorphie • Wo ein Objekt der Basisklasse erwartet wird (der statische Typ eines Bezeichners ist C), class C { int x = 2; int p () { return this.x + 3; } } C x = new C() ; int y = x.p (); Überschreiben: class E extends C { int p () { return this.x + 4; } } C x = // statischer Typ: C new E() ; // dynamischer Typ: E int y = x.p (); • kann ein Objekt einer abgeleiteten Klasse (D) benutzt werden (der dynamische Typ des Wertes ist D). – Typeset by FoilTEX – Id Vererbung bricht Kapselung Id Überschreiben und Überladen class C { void p () { ... q(); ... }; void q () { .. }; } Jetzt wird q überschrieben (evtl. auch unabsichtlich—in Java), dadurch ändert sich das Verhalten von p. class D extends C { void q () { ... } } Korrektheit von D abhängig von Implementierung von C ⇒ object-orientation is, by its very nature, anti-modular . . . http://existentialtype.wordpress.com/2011/ 03/15/teaching-fp-to-freshmen/ – Typeset by FoilTEX – – Typeset by FoilTEX – • Überschreiben: zwei Klassen, je eine Methode mit gleichem Typ • Überladen: eine Klasse, mehrere Methoden mit versch. Typen • C++: Methoden, die man überschrieben darf, virtual deklarieren • C#: Überschreiben durch override angezeigen, • Java: alle Methoden sind virtual, deswegen ist Überschreiben von Überladen schlecht zu unterscheiden: Quelle von Programmierfehlern • Java-IDEs unterstützen Annotation @overrides Id Equals richtig implementieren – Typeset by FoilTEX – Id Equals richtig implementieren (II) class C { . . . sondern so: final int x; final int y; public boolean equals (Object o) { C (int x, int y) { this.x = x; this.y = y; } if (! (o instanceof C)) return false; int hashCode () { return this.x + 31 * this.y;C }that = (C) o; } return this.x == that.x && this.y == that.y; } nicht so: Die Methode boolean equals(Object o) wird aus public boolean equals (C that) { HashSet aufgerufen. return this.x == that.x && this.y == that.y; } Sie muß deswegen überschrieben werden. Das boolean equals (C that) hat den Methodenamen nur überladen. – Typeset by FoilTEX – Id Id Typhierarchie als Halbordnung Statische Attribute und Methoden Durch extends/implements entsteht eine Halbordnung auf Typen Bsp. class C; class D extends C; class E extends C definiert Relation (≤) = {(C, C), (D, C), (D, D), (E, C), (E, E)} auf T = {C, D, E} Relation ≤2 auf T 2: (t1, t2) ≤2 (t01, t02) : ⇐⇒ t1 ≤ t01 ∧ t2 ≤ t02 es gilt (D, D) ≤2 (C, C); (D, D) ≤2 (C, D); (C, D) ≤2 (C, C); (E, C) ≤2 (C, C). für diese findet kein dynmischer Dispatch statt. (Beispiele—Puzzle 48, 54) Damit das klar ist, wird dieser Schreibstil empfohlen: • dynamisch: immer mit Objektnamen qualifiziert, auch wenn dieser this lautet, • statisch: immer mit Klassennamen qualifiziert (niemals mit Objektnamen) – Typeset by FoilTEX – – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Ad-Hoc-Polymorphie und Typhierarchie Vererbung und generische Polym. (I) Auflösung von p (new D(), new D()) bzgl. static void p (C x, D y); static void p (C x, C y); static void p (E x, C y); • Vererbung: jedes Objekt bringt seine eigene Implementierung mit • Generizität: (gemeinsame) Implementierung wird durch (Typ/Funktions)-Parameter festgelegt • bestimme die Menge P der zum Aufruf passenden Methoden interface I { void P (); } static void Q (IList<I> xs) { foreach (I x in xs) { x.P(); } } static void R<C> (Action<C> S, IList<C> xs) { foreach (C x in xs) { S(x); } } (für diese gilt: statischer Typ der Argumente ≤n Typ der formalen Parameter) • bestimme die Menge M der minimalen Elemente von P (Def: m ist minimal falls ¬∃p ∈ P : p < m) • M muß eine Einermenge sein, sonst ist Überladung nicht auflösbar – Typeset by FoilTEX – Id für gleichzeitige Behandlung mehrerer Objekte ist Vererbungspolymorphie meist ungeeignet (z. B. Object.equals(Object o) falsch, Comparable<T>.compareTo(T o) richtig) – Typeset by FoilTEX – Vererbung und generische Polym. (II) Id Generics und Subtypen • mit Sprachkonzepte Vererbung ist Erweiterung des Sprachkonzeptes Generizität wünschenswert: Warum geht das nicht: class C { } • beim Definition der Passung von parametrischen Typen sollte die Vererbungsrelation ≤ auf Typen berücksichtigt werden. class E extends C { void m () { } } List<E> x = new LinkedList<E>(); • Ansatz: wenn E ≤ C, dann auch List<E> ≤ List<C> List<C> y = x; // Typfehler Antwort: wenn das erlaubt wäre, dann: • ist nicht typsicher, siehe folgendes Beispiel • Modifikation: ko- und kontravariante Typparameter (List<E> ≤ List<in C>, List<C> ≤ List<out C>) – Typeset by FoilTEX – Id Obere Schranken für Typparameter • Java: <S super T> C#: class <T> where T : S { ... } als Argument ist jeder Typ T erlaubt, der S implementiert Als Argument ist jeder Typ S erlaubt, der Obertyp von T ist. static <T> int binarySearch (List<? extends T> list, T key, Comparator<? super T> c) Comparable<T> compareTo(T x); } extends Comparable<T>> (Collection<T> c) { .. } – Typeset by FoilTEX – Id Untere Schranken für Typparameter • Java: class<T extends S> { ... }, interface { int static <T T max – Typeset by FoilTEX – Id Wildcards und Bounds – Typeset by FoilTEX – Id variante generische Interfaces (C#) Kovarianz (in P), Kontravarianz (out P) class C {} class E : C {} List<? extends Number> z = Arrays.asList(new Double[]{1.0, 2.0}); z.add(new Double(3.0)); interface I<in P> { } class K<P> : I<P> { } I<C> x = new K<C>(); I<E> y = x; Unterscheidung: Schranken/Varianz: bei Schranken geht es um die Instantiierung (Wahl der Typargument) bei Varianz um den erzeugten Typ (seine Zuweisungskompatibilität) – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id Generics und Arrays Generics und Arrays (II) das gibt keinen Typfehler: class C { } class E extends C { void m () { } } warum ist die Typprüfung für Arrays schwächer als für Collections? Historische Gründe. Das sollte gehen: void fill (Object[] a, Object x) { .. } String [] a = new String [3]; fill (a, "foo"); Das sieht aber mit Generics besser so aus: . . . E [] x = { new E (), new E () }; C [] y = x; y [0] = new C (); x [0].m(); aber . . . (Übung) – Typeset by FoilTEX – Id Ergänzungen zu Typen Id Ungewöhnliche Typen (I) Daten-abhängige Typen (dependent types) – Typ ist anhängig von Daten, in Agda (http://wiki.portal.chalmers.se/agda/) data Nat : Set where zero : Nat ; suc : Nat -> Nat Vec : Nat -> Set -> Set vHead : {X : Set}->(n : Nat)->Vec (suc n) X -> X transpose : {m n : Nat}{X : Set} -> Vec m (Vec n X) -> Vec n (Vec m X) • • • • – Typeset by FoilTEX – (in klassischen Sprachen“ wie Haskell, Java,. . . ) ” Typreine gemischte Listen? data List a b = Nil | Cons a (List b a) x :: List String Bool desgl. in Java höhere statische Sicherheit Typkorrektheit nicht entscheidbar (Halteproblem!) Programmierer muß Typ v. Bezeichnern beweisen ähnlich in Coq http://coq.inria.fr/ – Typeset by FoilTEX – Id – Typeset by FoilTEX – Ungewöhnliche Typen (II) Id Ungewöhnliche Typen (II) vollständige (!) binäre Bäume data (,) a b = ( a, b ) -- geordnete Paare data Tree a = Leaf a | Branch (Tree (a,a)) vollständige (!) binäre Bäume - in C# x :: Tree Int x = Branch (Branch (Leaf • null-Zeiger verhindern durch where A : struct • data Tree a ersetzen durch Kompositum (interface Tree, class Leaf, class Branch) ... – Typeset by FoilTEX – • Konstruktor ⇒ statische Methoden, dafür Typargumente inferieren lassen Id Zusammenfassung Id Paradigmen von Prog.Spr. (Beispiele) • imperativ (Folge v. Zustandsänderungen) Themen • deklarativ (Spezifikation von Werten) • Methoden zur Beschreibung der – Syntax: reguläre Ausdrücke, kontextfreie Grammatiken – Semantik: operational, denotational, axiomatisch • Konzepte: – Typen, – Ausdrücke und Anweisungen (Wert und Wirkung), – Unterprogramme (als Daten) – Polymorphie (statisch, dynamisch) • Wechselwirkungen der Konzepte • Paradigmen: imperativ, funktional, objektorientert – Typeset by FoilTEX – – Typeset by FoilTEX – – funktional (Wertberechnung) – constraint (Wertbeschränkungen) – logisch (Resolution/Unifikation) • prozedural (benutzt Unterprogramme) • objekt(/klassen)-orientiert • nebenläufig, verteilt Id – Typeset by FoilTEX – Id Logische Programmierung (Bsp.) Constraint-Programmierung (Bsp: SAT) Programm (Fakten und Regeln) app([], YS, YS). app([X|XS], YS, [X|ZS]) :- app(XS, YS, ZS). (laden mit swipl -s app.pl) Anfrage (Formel mit freien Variablen) app(XS,YS,[1,2]). Antworten (Belegungen) XS = [] , YS = [1,2]; XS = [1], YS = [2]; XS = [1,2], YS = []; Progr.-Spr. Prolog: Alain Colmerauer, 1972 – Typeset by FoilTEX – Programm (aussagenlogische F. in konjunktiver NF): (x1 ∨ x2) ∧ (x2 ∨ x3) ∧ (x1 ∨ x2 ∨ x3) textuelle Syntax: p cnf 3 3 1 2 0 2 3 0 -1 -2 -3 0 (ausführen mit minisat f.cnf /dev/stdout) Antwort (erfüllende Belegung): SAT 1 -2 3 0 ist Notation für x1 = True, x2 = False, x3 = True SAT ist NP-vollständig, aber es gibt Verfahren, die in erstaunlich vielen Fällen Lösungen schnell finden. siehe http://minisat.se/ Id – Typeset by FoilTEX – Id autotool-Auswertung Constraint-Programmierung (Bsp: SMT) (satisfiability modulo theory) Programm (Constraint-System) Top Ten 100 81 60 59 (set-logic QF_NIA)(set-option :produce-models true) (declare-fun P () Int) (declare-fun Q () Int) (declare-fun R () Int) (declare-fun S () Int) (assert (and (< 0 P) (<= 0 Q) (< 0 R) (<= 0 S))) (assert (> (+ (* P S) Q) (+ (* R Q) S))) (check-sat)(get-value (P Q R S)) : : : : 5*98* 6*13* 6*67* 6*46* : : : : 3 1 1 1 1 2 1 1 1 1 1 1 2 1 2 1 3 1 1 1 1 (ausführen mit z3 p.smt2) Antwort (erfüllende Belegung): sat ((P 14) (Q 9) (R 11) (S 7)) siehe http://z3.codeplex.com/wikipage?title= Publications – Typeset by FoilTEX – Id – Typeset by FoilTEX – Testfragen Wie weiter? Anwendung und Vertiefung von Themen der PPS-Vorlesung z. B. in Vorlesungen Die folgende Grammatik G über dem Alphabet Σ = {w, f, u, i} soll Ausdrücke mit den Konstanten w, f und den binären Operatoren u, i beschreiben: • Programmverifikation u.a. axiomatische Semantik imperativer Programme G = (Σ, {E}, {E → w | f | EiE | EuE}, E). • Compilerbau Begründen Sie, daß G mehrdeutig ist. – Realisierung der Semantik durch ∗ Interpretation ∗ Transformation – abstrakte und konkrete Syntax (Parser) Punkte: 3 Gesucht ist eine zu G äquivalente eindeutige kontextfreie Grammatik G0, für deren Ableitungsbäume gilt: der Operator u ist linksassoziativ, der Operator i ist rechtsassoziativ, der Operator u bindet stärker als der • Constraint-Programmierung – Typeset by FoilTEX – Id Id – Typeset by FoilTEX – Operator i. Wie sieht unter diesen Bedingungen der abstrakte Syntaxbaum für f iwuf iw aus? • G3 = (Σ, {E, A, B}, {E → B | BuE, B → A | BiA, A → w | f }, E). Punkte: 3 Untersuchen Sie, ob G1, G2, G3 die gewünschten Eigenschaften erfüllen. (Falls nein: begründen, falls ja: konkreten Syntaxbaum für f iwuf iw angeben.) • Welches ist die Bedeutung der Aussageform {V }P {N } im Hoare-Kalkül? Punkte: 9 Id Punkte: 8 • G1 = (Σ, {E, A}, {E → A | AiE | EuA, A → w | f }, E). Geben Sie eine wahre und eine falsche Aussage dieser Form an. • G2 = (Σ, {E, A, B}, {E → B | BiE, B → A | BuA, A → w | f }, E). – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id falsch (bzw. wahr ). • Wodurch wird eine kontextfreie Grammatik zu einer Attributgrammatik erweitert? Nach welcher Regel bestimmt man, ob ein Ausdruck f(x) korrekt getypt ist? (Ohne Berücksichtigung von Vererbung oder Generizität.) • Geben Sie einen regulären Ausdruck für die Spursprache dieses Programms an. while (P) { A; if (Q) { B; } C; } Das Spur-Alphabet ist {A, B, C, P0, P1, Q0, Q1}, dabei bedeuten A : die Anweisung A wird ausgeführt, P0 (bzw. P1): der Ausdruck P wird ausgewertet und ergibt – Typeset by FoilTEX – Id • Potenz (vier verschiedene Realisierungen) • und x den Typ . . . hat hat, • dann ist der Typ von f(x) . . . . Wie werden die folgenden Operationen für Typen in Programmiersprachen realisiert? Punkte: 6 • Vereinigung: • Kreuzprodukt: – Typeset by FoilTEX – Id procedure Main is X : Integer := 3; Y : Integer := 2; procedure P (X : Integer) is procedure Q (Y : Integer) is procedure R (X : Integer) is begin Put_Line (Integer’Image (X+Y)); end R begin if Y > 0 then P(X-1); else R(X+Y); end i begin if X > 0 then Q(X-1); else P(X-Y); end if; begin P (X-1); end Main; Zeichnen Punkte: 2 Sie die Frames mit allen Einträgen und Verweisen zu dem Zeitpunkt direkt vor dem ersten Aufruf von Put_Line. Punkte: 1 – – – – In Java gibt es keine direkte Realisierung der Vereinigung, was wird stattdessen empfohlen? Für das Ada-Programm: with Ada.Text_Io; use Ada.Text_Io; – Typeset by FoilTEX – • Wenn f den Typ . . . Punkte: 4 Id – Typeset by FoilTEX – Id betrachten wir den Aufruf p(a[0], a[1]). Geben Sie die Ausführungsschritte sowie die resultierende Speicherbelegung an, falls zur Parameterübergabe benutzt wird: Punkte: 1 • Wertübergabe Wie wird auf die Werte von X und Y zugegriffen, die in Integer’Image(X+Y) benötigt werden? Für folgende Deklaration: Punkte: 2 VerweisÜbergabe int a [] = { 1,2,0 }; void p (int x, int y) { •a[y] = x; x = y; } – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id • p (new C(), new C()); Für die Deklarationen: class C { } class D extends C { } static void p (Object x, C y) { System.out.println ("1"); } static void p (D x, C y) { System.out.println ("2"); } static void p (C x, Object y) { System.out.println ("3"); } Beschreiben Sie, wie die Überladung für die folgenden Aufrufe aufgelöst wird: Punkte: 7 • p (new D(), new D()); – Typeset by FoilTEX – Id – Typeset by FoilTEX – Id