Algorithmus und Programm - Technische Universität Braunschweig

Algorithmus und Programm:
Vom Algorithmus zum Programm
1.1
1.2
1.3
1.4
Vom Algorithmus zum Programm
Programmiersprachen
Korrektheit, Komplexität und Entscheidbarkeit
Software-Grundlagen
1.1 Vom Algorithmus zum Programm
1-1
Algorithmusbegriff
Ein Algorithmus ist eine „Berechnungsvorschrift“. Die Aufgabe, die der Algorithmus
lösen soll, wird durch eine Spezifikation festgelegt.
• Die Berechnungsvorschrift wird durch einen endlichen Text kodiert.
• Sie beschreibt die auszuführenden Berechnungen „hinreichend präzise“.
• Die Berechnungen sind aus „elementaren“ Operationen aufgebaut und besitzen
Aus- und evtl. Eingabewerte.
Hierbei handelt es ich um eine sog. intuitive Definition. In der Informatik wird auch
eine formale Definition benötigt, zum Beispiel zum Nachweis, dass für ein bestimmtes
Problem kein Algorithmus existiert.
»Intuitiv heißt nicht erlernt.«
1.1 Vom Algorithmus zum Programm
(Bruce M. Hood)
1-2
Eigenschaften von Algorithmen
• Algorithmen sollen in der Regel terminieren, d. h. bei jeder Eingabe irgendwann zu
einem Ende führen. Es gibt Ausnahmen: z. B. Betriebssysteme oder sogenannte
„reaktive Systeme“.
• Die Terminierung wird in der Definition des Algorithmusbegriffs nicht verwendet.
Ein Grund hierfür ist zum Beispiel das Halteproblem (s. unten): Definitionen
müssen überprüfbar sein.
• Einen Algorithmus nennt man deterministisch, wenn er bei gleichen Eingabedaten
stets die gleiche Berechnung ausführt.
• Ein Algorithmus heißt determiniert, wenn er bei gleichen Eingabedaten stets die
gleichen Ausgabedaten liefert.
1.1 Vom Algorithmus zum Programm
1-3
Programm und Programmiersprache
Ein Programm ist die Formulierung eines Algorithmus mit seiner Datenbereiche in
einer Programmiersprache. Eine Programmiersprache erlaubt es, Algorithmen präzise
zu beschreiben. Insbesondere legt eine Programmiersprache
• die elementaren Operationen,
• die Möglichkeiten zu ihrer Kombination und
• die zulässigen Datenbereiche
eindeutig fest. Unter „programmieren“ versteht man den Vorgang des Erstellens eines
Programms.
1.1 Vom Algorithmus zum Programm
1-4
Grundlegende Aspekte der Algorithmenentwicklung
• Wie wird ein Algorithmus formuliert? Paradigma.
Beispiele für Paradigmen: imperativ, objektorientiert, funktional, logisch.
Es gibt weitere Paradigmen, diese vier sind aber die am häufigsten erwähnten.
Weitere Bezeichnungen für Paradigmen: hybrid, prozedural, deklarativ.
• Mit welchem Aufwand löst der Algorithmus das Problem? Komplexität.
Beispiele zur Komplexität: benötigte Rechenzeit oder verwendeter Speicherplatz.
• Erfüllt mein Algorithmus seine Spezifikation? Korrektheit.
Der Nachweis der Korrektheit wird Verifikation genannt.
• Wie werden Datentypen definiert? Abstrakte Datentypen.
ADT/Abstrakte Datentypen werden durch algebraische Methoden definiert.
1.1 Vom Algorithmus zum Programm
1-5
Grundlegende Aspekte der Algorithmenentwicklung
• Gibt es für das Problem einen Algorithmus? Berechenbarkeit/Entscheidbarkeit.
Zur Beantwortung dieser Frage wird eine formale Definition des
Algorithmenbegriffs benötigt. Beispiel: Turing-Maschine.
Alonzo Church stellte 1936 die folgende These auf, die bisher nicht widerlegt
wurde. Church’sche These:
Der intuitive Algorithmenbegriff wird durch
das Modell der Turing-Maschine adäquat definiert.
Die Church’sche These kann natürlich nicht bewiesen werden, da sie den intuitiven
Algorithmenbegriff verwendet. Über intuitive Dinge können keine formalen Beweise
geführt werden. Es wurde gezeigt, dass viele formale Algorithmusdefinitionen
äquivalent sind. Daher könnte in der Church’schen These die Turing-Maschine
durch etliche andere formale Definitionen des Algorithmus ersetzt werden.
1.1 Vom Algorithmus zum Programm
1-6
Grundlegende Aspekte der Algorithmenentwicklung
• Gibt es Vorgehensweisen für die Erstellung von Algorithmen?
Entwurf von Algorithmen.
Beispiele: Rekursion, Backtracking, Divide-and-Conquer, Greedy-Algorithmus, . . .
• Gibt es Algorithmen, die man häufig verwenden kann?
Standardalgorithmen.
Beispiele: Algorithmen zum Suchen und Sortieren, Algorithmen für konkrete
Datentypen (zum Beispiel: Graphen, Listen, Keller, Schlangen, . . . )
• Gibt es andere Definitionen des Algorithmenbegriffs?
Varianten des Algorithmenbegriffs.
Beispiele: nichtdeterministische, parallele, randomisierte Algorithmen.
1.1 Vom Algorithmus zum Programm
1-7
Paradigmen zur Formulierung von Algorithmen
In einem imperativen Algorithmus gibt es Variable, die verschiedene Werte annehmen
können. Die Menge aller Variablen und ihrer Werte sowie der Programmzähler
beschreiben den Zustand zu einem bestimmten Zeitpunkt. Ein Algorithmus bewirkt
eine Zustandstransformation.
Ein funktionaler Algorithmus formuliert die Berechnung durch Funktionen. Die
Funktionen können rekursiv sein; auch gibt es Funktionen höherer Ordnung.
In einem objektorientierten Algorithmus werden Datenstrukturen und Methoden zu
einer Klasse zusammengefasst. Von jeder Klasse können Objekte gemäß der
Datenstruktur erstellt und über die Methoden manipuliert werden.
Ein logischer (deduktiver) Algorithmus führt Berechnungen durch, indem er aus
Fakten und Regeln durch Ableitungen in einem logischem Kalkül Ziele beweist.
1.1 Vom Algorithmus zum Programm
1-8
Paradigmen zur Formulierung von Algorithmen
Aus einer übergeordneten Sichtweise werden die folgenden Kategorien unterschieden:
• Prozedurale Programmiersprachen: Es wird exakt angegeben, wie die Lösung eines
Problems ermittelt werden kann. Imperative Programmiersprachen fallen in diese
Kategorie.
• Deklarative Programmiersprachen: Im Gegensatz zum prozeduralen Paradigma
fragt man in der deklarativen Programmierung danach, was berechnet werden soll.
Es wird also nicht der Lösungsweg programmiert, sondern angegeben, welches
Ergebnis gewünscht ist. Deklarative Paradigmen beruhen auf mathematischen,
rechnerunabhängigen Theorien. Beispiele hierfür sind prädikative und – bis zu
einem gewissen Grade – auch funktionale Programmiersprachen.
Unter einem hybriden Paradigma versteht man die Mischung von Paradigmen.
1.1 Vom Algorithmus zum Programm
1-9
Beispiel: Algorithmus von Euklid
Der folgende, in einer imperativen Programmiersprache formulierte,
Algorithmus von Euklid
berechnet den größten gemeinsamen Teiler der Zahlen x , y ∈ N mit x > 0 und y ≥ 0:
a := x;
b := y;
while b
do r :=
a :=
b :=
od
# 0
a mod b;
b;
r
Anschließend gilt a = ggT(x , y ).
1.1 Vom Algorithmus zum Programm
1-10
Beispiel: Algorithmus von Euklid
Variable
r
a
b
z0
–
–
–
z1
–
36
–
z2
–
36
52
z5
36
52
36
z8
16
36
16
z11
4
16
4
z14
0
4
0
ggT(36, 52) = 4
Durchlaufene Zustände:
z0, z1, z2, ... , z14
Zustandstransformation:
z0 7−→ z14
1.1 Vom Algorithmus zum Programm
1-11
Datenstrukturen und Typsysteme
Programmiersprachen bieten die Möglichkeit, aus elementaren Datenbereichen
mithilfe von Konstruktoren komplexe Datenbereiche aufzubauen. Datenbereiche
werden häufig Datenstrukturen genannt.
• Elementare Datenstrukturen:
◦ Wertebereiche, Operationen
◦ boolean, char, cardinal, integer, real, enumeration
• Konstruktoren:
◦ array (Feld), record (Satz), set (Menge), pointer (Zeiger)
◦ Zeiger ermöglichen rekursive Datenstrukturen wie Listen, Bäume und Graphen.
• Typäquivalenz, Typanpassung, Typkompabilität, . . .
Die Aspekte, die die Datenbereiche betreffen, werden als Typsystem bezeichnet.
1.1 Vom Algorithmus zum Programm
1-12
Natürliche und künstliche Sprachen
• Sprache ist ein sich stets weiterentwickelndes, komplexes System von Lauten und
Zeichen zum Zwecke der Kommunikation. Es werden natürliche und künstliche
Sprachen unterschieden.
• Natürliche Sprachen sind historisch gewachsen. Hierzu zählen z. B. Deutsch,
Englisch und Französisch. Sie sind Ausdruck menschlichen Denkens, Fühlens und
Wollens und weisen im Unterschied zu künstlichen Sprachen Mehrdeutigkeiten auf.
• Künstliche Sprachen sind Zeichensysteme, die der Verständigung in einem eng
begrenzten Fachgebiets dienen, zum Beispiel Programmiersprachen. Sprachen wie
Esperanto sind ebenfalls künstliche Sprachen, die sich durch leichtere Schreibung
und Grammatik gegenüber natürlichen Sprachen auszeichnen.
aus Basiswissen Deutsch, Dudenverlag
1.1 Vom Algorithmus zum Programm
1-13
Sprachklassen der Informatik
Die Sprachen der Informatik werden typischerweise in zwei Klassen aufgeteilt:
• General Purpose Language (GPL)
• Domain Specific Language (DSL)
Meistens zählt man die Programmiersprachen zu den GPLs und Sprachen für spezielle
Anwendungen zu den DSLs.
Die Klasseneinteilung ist nicht in allen Quellen genau identisch. Eine mögliche
Beispiel-Einteilung finden Sie in einem Material der Veranstaltung.
1.1 Vom Algorithmus zum Programm
1-14
Sprachen der Informatik
Um Objekte mit Rechensystemen zu behandeln, müssen sie in eindeutigen – also
künstlichen – Sprachen beschrieben werden. Einige Beispiele sollen dies verdeutlichen:
• Algorithmen: Programmiersprachen (Java)
• Dokumente: Markup-Sprachen (Html, XML), Seitenbeschreibungssprachen
(Postscript)
• Modelle, Systeme: Modellierungssprachen (UML)
• Spezifikationen: Spezifikationssprachen (Z, VDM-SL)
• Datenbanken: Anfragesprachen (SQL)
1.1 Vom Algorithmus zum Programm
1-15
Folgerung
• In der Informatik hat man es mit einer Vielzahl von künstlichen Sprachen zu tun.
• Sie alle beschreiben Sachverhalte in einem relativ kleinen Kontext,
• dafür aber (hoffentlich) präzise, widerspruchsfrei und vollständig.
In dieser Vorlesung betrachten wir die Programmiersprache Java.
In anderen Veranstaltungen (z. B. „Programmieren für Fortgeschrittene“,
„Logik in der Informatik“) lernen Sie weitere Sprach(klass)en kennen.
Die theoretische Grundlagen der Programmiersprachen lernen Sie
in der Veranstaltung „Semantik von Programmiersprachen“ kennen.
1.1 Vom Algorithmus zum Programm
1-16
Algorithmus und Programm:
Programmiersprachen
1.1
1.2
1.3
1.4
Vom Algorithmus zum Programm
Programmiersprachen
Korrektheit, Komplexität und Entscheidbarkeit
Software-Grundlagen
1.2 Programmiersprachen
1-17
Entwicklung der Programmiersprachen
Edsger W. Dijkstra (niederländischer Informatiker, 1930–2002):
„Jeder Programmierer weiß, dass es nur eine einzig wahre Programmiersprache
gibt. Jede Woche eine neue.“
A. Weinert: Java für Ingenieure, 2001, Seite 7:
„Die Zahl der Programmiersprachen, die die Informatik in den letzten fünfzig
Jahren hervorgebracht hat, ist Legion. Ernst zu nehmende Schätzungen
sprechen von mehr als 20 000.“
Wenn Weinerts Schätzung zutrifft, sind es 7,7 Programmiersprachen pro Woche!
Zitat: Lisp ist nach Fortran die zweitälteste Sprache, die noch verbreitet ist.
1.2 Programmiersprachen
1-18
Entwicklung der Programmiersprachen
.
.
2000
C#
1995
JAVA
SCHEME (standard)
1990
OCCAM
C++
1985
CSP
ADA
1980
SMALLTALK80
MODULA−2
1975 C
• Algol68
• Modula-2
SCHEME
PASCAL
ALGOL68
LOGO
• Java/Scheme
BASIC
COBOL
ALGOL
FORTRAN
• Modula-2/Scheme
SIMULA
1965 PL/I
1955
• Algol
PROLOG
1970
1960
Programmiersprachen in der
Informatikausbildung
LISP
• Java
.
1.2 Programmiersprachen
1-19
Definition von Programmiersprachen
Die Lexik einer Programmiersprache bestimmt die textuellen Grundbausteine der
Programme. Solche Bausteine sind z. B. Schlüsselwörter, Zeichen und Bezeichner.
Sie werden beispielsweise durch Aufzählung oder reguläre Ausdrücke angegeben.
Die Syntax einer Programmiersprache beschreibt, wie aus den Grundbausteinen
vollständige Programme gebildet werden können. In den meisten Fällen wird die
Syntax einer Programmiersprache durch eine kontextfreie Grammatik festgelegt.
Die Bedeutung der syntaktisch korrekten Programme ist durch die Semantik der
Sprache gegeben. Sie kann beispielsweise mithilfe von Zustandsfolgen (operationelle
Semantik) oder durch Funktionen, die den syntaktischen Einheiten zugeordnet sind
(denotationale Semantik), definiert werden. Es gibt auch weitere Möglichkeiten.
Beispiele: axiomatische Semantik, algebraische Semantik.
Die Pragmatik einer Programmiersprache untersucht ihre Anwendbarkeit und
Nützlichkeit. Sie gehört nicht zur Definition der Sprache.
1.2 Programmiersprachen
1-20
Definition von Programmiersprachen: Kleines Beispiel
Lexik:
Schlüsselwörter: while, do, od, . . .
Zeichen: +, ;, :=, (, ), {, }, . . .
Bezeichner = Buchstabe · { Buchstabe, Ziffer }∗
Syntax:
<Anweisungsfolge>
<Anweisung>
<Zuweisung>
<While-Anweisung>
::=
::=
::=
::=
<Anweisung> ; <Anweisungsfolge> | <Anweisung>
<Zuweisung> | <While-Anweisung> | . . .
<Bezeichner> := <arithmetischer Ausdruck>
while <logischer Ausdruck> do <Anweisungsfolge> od
(Operationelle) Semantik:
Eine (partielle) Funktion f, die Zustände auf Zustände abbildet.
Ein Beispiel: f(z0) = z14 (s. Abschnitt 1.1)
1.2 Programmiersprachen
1-21
Klassifikation der Programmiersprachen
Die Programmiersprachen lassen sich grob in drei Klassen einteilen:
• Maschinensprachen
Bits und Bytes, für den menschlichen Leser kaum verständlich
• Maschinenorientierte Sprachen (Assembler)
stellen die Befehle in einem Mnemo-Code dar
ADDIC 23, R0
STO R0, #12004
• Problemorientierte Sprachen
imperative, funktionale, objektorientierte, deduktive Sprachen, Spezialsprachen
Ein Computer versteht nur Maschinensprachen!
1.2 Programmiersprachen
1-22
Implementierung von Programmiersprachen
Compiler übersetzen Quellprogramme aus problemorientierten Sprachen in äquivalente
Zielprogramme in Maschinensprachen:
cc -o prog prog.c
prog input output
Interpreter lesen das Programm ein und führen es aus. Die Eingabe kann während der
Ausführung oder durch eine Datei erfolgen.
scm prog.scm input output
Mischverfahren übersetzen das Programm zunächst mit einem Compiler in eine
Zwischensprache. Das übersetzte Programm wird anschließend interpretiert:
javac prog.java
java prog
Die Eingabe kann zum Beispiel über die Tastatur oder Dateien erfolgen.
Die Ausgabe kann zum Beispiel auf dem Bildschirm oder in Dateien geschehen.
1.2 Programmiersprachen
1-23
Implementierung von Programmiersprachen
Interpreter müssen das Programm bei jedem Lauf erneut analysieren. Dies bedeutet
einen gewissen Effizienzverlust.
Typisch, aber nicht zwingend:
• Compiler: C
• Interpreter: Scheme
• Mischverfahren: Java
• Compiler und Interpreter: Haskell
Compiler1 6= Compiler2
1.2 Programmiersprachen
Interpreter1 6= Interpreter2
1-24
Verarbeitung von Java-Programmen
• Zuerst wird ein Quellprogramm vom
Compiler in Bytecode übersetzt.
Java−Quellprogramm
javac
Java−Bytecode
java
VM für Windows
1.2 Programmiersprachen
java
VM für Linux
• Im zweiten Schritt wird der Bytecode
vom Interpreter ausgeführt. Der
Bytecode kann als Maschinencode der
sogenannten virtuellen Java-Maschine
(JVM) angesehen werden. Bytecode ist
portabel.
• Der Compiler ist maschinenunabhängig,
der Interpreter muss für jede Plattform
neu entwickelt werden.
1-25
Verarbeitung von Java-Programmen
• Interpretierter Code ist langsamer in der Ausführung als kompilierter Code, selbst
wenn dieser als Bytecode vorliegt.
• Prinzipiell könnten Java-Programme auch in Maschinensprachen übersetzt werden.
Dann könnte die Portierbarkeit verloren gehen.
• Eine Alternativlösung bieten Just-in-Time-Compiler (JIT). Ein JIT ist ein
Programm, das den Bytecode einzelner Methoden während der Ausführung in
Maschinencode der jeweiligen Plattform übersetzt. So kann die Methode beim
nächsten Aufruf deutlich schneller ausgeführt werden. Vorteilhaft ist, dass der
Bytecode nicht verändert wird und damit das übersetzte Programm portabel bleibt.
1.2 Programmiersprachen
1-26
Implementierung von Programmen
Warum muss man wissen, wie Programme umgesetzt werden?
Beispiel:
Java-Programm:
public static void main(String[] args) {
int z = 256*256*256*128+2147483647;
System.out.println(z*z);
}
Ausgabe:
1
Der korrekte Wert ist 4294967295.
Warum ist die Ausgabe 1?
1.2 Programmiersprachen
Kann ein Computer nicht rechnen?
1-27
Paradigmen und Programmiersprachen
Einige Programmiersprachen:
imperativ:
funktional:
prädikativ:
objektorientiert:
hybrid:
Algol, Algol68, Pascal, Ada, C, . . .
Lisp, Scheme, ML, Haskell, . . .
Prolog
Smalltalk, Eiffel, . . .
Java, C++, C# (imperativ, oo),
Scala (imperativ, oo, funktional), . . .
In der Regel lassen sich die Sprachen nicht eindeutig einem bestimmten Paradigma
zuordnen. Zum Beispiel gibt es in Scheme Variable und Zuweisungen, d. h. imperative
Konzepte. Java ist als „imperativ-basierte objektorientierte Programmiersprache“
(hybrides Paradigma) zu bezeichnen. C++ hingegen besitzt einen vollständigen
imperativen Kern, während Smalltalk eine strikt objektorientierte Programmiersprache
ist.
1.2 Programmiersprachen
1-28
Skriptsprachen
• Bei Skriptsprachen handelt es sich um übergeordnete Sprachen, um vorhandene
Programme oder Prozeduren kontrolliert ablaufen zu lassen.
• Skriptsprachen haben ihren Ursprung in den Kommandosprachen (Job Control
Language, JCL) von Betriebssystemen.
• Einfache Skriptsprachen sind die Shell-Skripts von Unix. Mächtigere Skriptsprachen
sind beispielsweise Perl, PHP, Python oder JavaScript.
• Skriptsprachen werden in der Regel interpretiert, nicht kompiliert.
1.2 Programmiersprachen
1-29
Dieses sind Versionen von Java
1992–1995
Januar
Anfang
Dezember
Januar
Mai
Februar
Ende
Dezember
Juli
März
1996
1997
1998
1999
2000
2002
2004
2006
2011
2014
Java-Vorläufer, zuerst unter dem Namen „Oak“.
Oak: Object Application Kernel, Eiche.
Neu: Applets (little applications)
JDK 1.0 (Java Development Kit)
JDK 1.1
JDK 1.2, wurde
umbenannt in „Java 2 Plattform“
Java 2, JDK 1.3
Java 2, JDK 1.4
Java 2, JDK 5.0 (interne Versionsnummer: 1.5.0) „Tiger“
Java Standard Edition 6 „Mustang“
Java Standard Edition 7 „Dolphin“
Java Standard Edition 8
Sprachen haben Versionen.
1.2 Programmiersprachen
1-30
Java-Versionen
Die installierte Version kann mit java -version ermittelt werden.
Bitte checken Sie Ihre Java-Version.
Achten Sie also darauf, dass Ihre Programme der Hausaufgaben auf Ihrem Computer
und auf dem von Ihnen benutzten TU-Computer ausgeführt werden können.
1.2 Programmiersprachen
1-31
Java-Beispiel
Dieses ist ein Beispiel für die Version Java 8.
Java 8 macht Schritte in die Richtung Funktionalität:
@FunctionalInterface
interface Funktion {
int rechnen (int x, int y);
}
Diese Prinzipien werden wir uns natürlich genauer anschauen.
1.2 Programmiersprachen
1-32
public class Test {
public static void main(String[] args) {
Funktion f = (a,b) -> a+b;
Funktion g = (a,b) -> a-b;
Funktion h = (a,b) -> a*b;
Funktion l = (a,b) -> a/b;
int a = 100;
int b = 25;
int w = f.rechnen(a,b);
int x = g.rechnen(a,b);
int y = h.rechnen(a,b);
int z = l.rechnen(a,b);
System.out.printf("%d + %d = %4d%n",a,b,w);
System.out.printf("%d - %d = %4d%n",a,b,x);
System.out.printf("%d * %d = %4d%n",a,b,y);
System.out.printf("%d / %d = %4d%n",a,b,z);
}
}
1.2 Programmiersprachen
1-33
Übersetzung, Ausführung und Ausgabe:
javac Test.java
java -ea Test
100
100
100
100
+
*
/
1.2 Programmiersprachen
25
25
25
25
= 125
=
75
= 2500
=
4
1-34
Algorithmus und Programm:
Korrektheit, Komplexität und Entscheidbarkeit
1.1
1.2
1.3
1.4
Vom Algorithmus zum Programm
Programmiersprachen
Korrektheit, Komplexität und Entscheidbarkeit
Software-Grundlagen
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-35
Spezifikation, Korrektheit und Verifikation
Die Spezifikation beschreibt die Anforderungen an ein Softwaresystem in einer
informellen, grafischen und/oder formalen Sprache. Eine Spezifikation sollte
vollständig und widerspruchsfrei sein.
Ein Softwaresystem, das eine Spezifikation erfüllt, heißt korrekt bezüglich dieser
Spezifikation. Man unterscheidet dabei zwischen partieller und totaler Korrektheit. Ein
Programm nennt man partiell korrekt, wenn die Spezifikation erfüllt, die Terminierung
von Programmläufen aber nicht notwendigerweise gewährleistet ist. Es heißt total
korrekt, wenn zusätzlich die Terminierung sichergestellt ist. Ein partiell korrektes
Programm liefert also keine falschen Ergebnisse.
Unter Verifikation versteht man den mathematischen Beweis der partiellen oder
totalen Korrektheit eines Programms.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-36
Korrektheit des Algorithmus von Euklid
Die Spezifikation besteht aus einer Vorbedingung und einer Nachbedingung:
Vorbedingung:
Nachbedingung:
x > 0 und y ≥ 0
a = ggT(x , y )
Der Algorithmus von Euklid ist für Eingaben x und y mit x > 0 und y ≥ 0 partiell
und total korrekt. Die Variable a enthält nach Programmende den Wert des größten
gemeinsamen Teilers von x und y .
Beweis unter Verwendung einer Schleifeninvarianten: s. Übung.
Mit der Definition ggT(0, 0) = 0 ist der Algorithmus von Euklid für alle Werte x und
y mit x ≥ 0 und y ≥ 0 partiell und total korrekt. Beweis: s. Übung.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-37
Test und Validierung
Der Test eines Programms ist der probeweise Ablauf des Programms. Damit der Test
aussagekräftig ist, müssen die Eingabedaten sorgfältig ausgewählt werden. Ein Test
kann nur die Anwesenheit von Fehlern, niemals aber deren Abwesenheit zeigen.
Als Validierung bezeichnet man den Test eines Softwaresystems unter Bedingungen,
wie sie im späteren Einsatz herrschen werden. Auch wenn das zu erstellende
Programm verifiziert wurde, kann auf eine Validierung nicht verzichtet werden, da ein
mathematischer Nachweis der Korrektheit beispielsweise nichts über das
Laufzeitverhalten des Programms oder die Auslastung von Leitungen aussagt.
Verifikation:
Validierung:
verus – wahr, facere – machen
validus – gesund, stark
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-38
Komplexität und O-Notation
• Unter Komplexität versteht man den Aufwand, den ein Algorithmus/Programm zur
Lösung einer Aufgabe benötigt. Damit ist in den meisten Fällen der erforderliche
Speicherplatz oder die Anzahl der durchgeführten Rechenschritte gemeint.
• Mathematisch wird die Komplexität eines Algorithmus/Programms in der Regel
durch eine Funktion f : N −→ R beschrieben. Die Größenordnung einer solchen
Funktion f wird häufig durch die sogenannte O-Notation nach oben abgeschätzt:
O(g) = {f : N −→ R | ∃c > 0, n0 > 0 ∀n ≥ n0. 0 ≤ f (n) ≤ cg(n)}
für eine Funktion g : N −→ R.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-39
Komplexität des Algorithmus von Euklid
Theorem. [G. Lamé, 1845] Es seien x , y und n mit x ≥ 0, y ≥ 0 und
0 ≤ x , y < n gegeben. Dann gilt: Der Algorithmus von Euklid benötigt höchstens
√ m
l
f (n) := logφ
5n −2
Divisionsschritte, wobei φ =
1
2
√ 1 + 5 ist.
Beispiel: ggt(36,52), n=53, f (n) = d9, 92288...e − 2 = 10 − 2 = 8.
Unter Verwendung der O-Notation erhalten wir: f (n) ∈ O(log(n)).
Man schreibt es auch in der Form: f (n) = O(log(n)).
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-40
Symbole zur Größenordnung von Funktionen
Es sei eine Funktion g : N −→ R gegeben.
O(g) = {f : N −→ R | ∃c > 0, n0 > 0 ∀n ≥ n0. 0 ≤ f (n) ≤ cg(n)}
Ω(g) = {f : N −→ R | ∃c > 0, n0 > 0 ∀n ≥ n0. 0 ≤ cg(n) ≤ f (n)}
Θ(g) = {f : N −→ R |
∃c1 > 0, c2 > 0, n0 > 0 ∀n ≥ n0. 0 ≤ c1g(n) ≤ f (n) ≤ c2g(n)}
o(g) = {f : N −→ R | ∀c > 0 ∃n0 > 0 ∀n ≥ n0. 0 ≤ f (n) < cg(n)}
ω(g) = {f : N −→ R | ∀c > 0 ∃n0 > 0 ∀n ≥ n0. 0 ≤ cg(n) < f (n)}
Diese Zeichen werden Landau-Symbole genannt. Sie beschreiben das asymptotische
Verhalten von Funktionen. Eine Übersicht finden Sie auf der Web-Seite dieser
Vorlesung. Dieses Thema wird in den Veranstaltungen Algorithmen und
Datenstrukturen und Diskrete Mathematik behandelt.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-41
Symbole zur Größenordnung von Funktionen
• 3000n2 + 7n + 23 ∈ Θ(n2)
Man schreibt meistens: 3000n2 + 7n + 23 = Θ(n2)
• 3000n2 + 7n + 23 ∈ O(n2)
• 3000n2 + 7n + 23 ∈ Ω(n2)
• 23 ∈ Θ(1)
• an x n + ... + a1x + a0 ∈ Θ(x n )
• Θ(logk (n)) = Θ(logl (n))
• 6n log2(n) + 8n + 12 ∈ Θ(n log(n))
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-42
Entscheidbarkeit
• Entscheidbarkeit von Problemen: Gibt es zu jedem Problem einen Algorithmus,
der es löst?
• Immer wieder kommt es vor, dass ein Computerprogramm plötzlich keine Reaktion
mehr zeigt („abstürzt“ oder „sich aufhängt“). Dahinter verbirgt sich häufig ein
Algorithmus, der für eine spezielle Eingabe nicht terminiert. Für kommerzielle
Software kann das sehr teuer werden.
• Die Suche nach dem Grund der Nichtterminierung kann sich sehr schwierig
gestalten. Daher liegt der Wunsch nahe, einen Algorithmus zu entwickeln, der
beliebige Algorithmen auf Terminierung testet. Diese Aufgabenstellung heißt
Halteproblem.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-43
Halteproblem 1
Das Halteproblem ist unentscheidbar. Wir zeigen die Aussage indirekt:
• Annahme: Es gibt einen Algorithmus
HALT(algorithmus a, eingabe e),
der für einen Algorithmus a und eine Eingabe e genau dann das Ergebnis true
liefert, wenn a bei Eingabe von e terminiert.
• Der Algorithmus TEST(algorithmus a) sei definiert durch
TEST(algorithmus a): while HALT(a,a) { ... }.
Das heißt, TEST(a) terminiert genau dann nicht, falls a bei Eingabe von a
terminiert.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-44
Halteproblem 2
Zwei Fälle können eintreten:
• 1. Fall: Der Aufruf HALT(TEST, TEST) liefert true.
In diesem Fall terminiert nach Definition von HALT der Aufruf TEST(TEST).
Hieraus folgt aus der Definition von TEST, dass der Aufruf TEST(TEST) nicht
terminiert, ein Widerspruch.
• 2. Fall: Der Aufruf HALT(TEST, TEST) liefert false.
In diesem Fall terminiert nach Definition von HALT der Aufruf TEST(TEST) nicht.
Hieraus folgt aus der Definition von TEST, dass der Aufruf TEST(TEST)
terminiert, ein Widerspruch.
Da in beiden Fällen ein Widerspruch auftritt, kann der Algorithmus HALT nicht
existieren.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-45
Halteproblem 3
Die beiden vorherigen Seiten
• Halteproblem 1 und
• Halteproblem 2
wurden dem Schulbuch
Peter Hubwieser, Patrick Löffler et al.: Informatik 5 – Lehrwerk für Gymnasien.
Ernst Klett Verlag, Stuttgart, Leipzig, 2010.
entnommen.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-46
Berechenbarkeit 1
• Eine Funktion f : A → Y heißt berechenbar, wenn es einen Algorithmus Af gibt,
der diese Funktion „realisiert“.
• Die Quadratfunktion f : N → N ist berechenbar, denn es gibt einen Algorithmus,
der für jede gegebene natürliche Zahl n das Quadrat n2 berechnet.
Ist es wirklich möglich, ganz lange Zahlen mit dem Computer zu bearbeiten?
• Es gibt überabzählbar viele Funktionen f : N → N, aber nur abzählbar viele
Algorithmen. Das heißt, fast keine Funktion ist berechenbar.
Wir werden den Satz von Rice kennenlernen.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-47
Berechenbarkeit 2
• Mithilfe des Berechenbarkeitsbegriffs lässt sich die Entscheidbarkeit formal
definieren: Eine Menge M ⊂ X heißt entscheidbar relativ zu X , wenn die
charakteristische Funktion
(
1, x ∈ M,
χM (x ) =
0, x ∈ X \ M,
berechenbar ist.
• Formulieren Sie das Halteproblem als charakteristische Funktion einer geeigneten
Menge.
Fazit: Es gibt unentscheidbare Probleme und nicht berechenbare Funktionen.
Mehr zu diesem Thema lernen Sie in den Modulen Theoretische Informatik.
1.3 Korrektheit, Komplexität und Entscheidbarkeit
1-48
Algorithmus und Programm:
Software-Grundlagen
1.1
1.2
1.3
1.4
Vom Algorithmus zum Programm
Programmiersprachen
Korrektheit, Komplexität und Entscheidbarkeit
Software-Grundlagen
1.4 Software-Grundlagen
1-49
Hardware
Für unsere Zwecke reicht das folgende einfache Modell vom Aufbau eines Rechners.
Details lernen Sie in den Modulen Technische Informatik, „Rechnernetze, ... kennen:
Zentraleinheit
Prozessor
Eingabewerk
Eingabegeräte
1.4 Software-Grundlagen
Hauptspeicher
Massenspeicher
Ausgabewerk
Ausgabegeräte
1-50
Software
• Zur Systemsoftware zählen alle Programme, die für den korrekten Ablauf von
Rechnern oder Rechnernetzen erforderlich sind.
• Die Anwendungssoftware wird zur Lösung von Problemen, die nicht ursächlich mit
Rechnern zu tun haben, eingesetzt.
• Softwarewerkzeuge unterstützen die Erstellung von System- und
Anwendungsprogrammen.
1.4 Software-Grundlagen
1-51
Systemsoftware
Zur Systemsoftware zählen alle Programme, die für den korrekten Ablauf von
Rechnern oder Rechnernetzen erforderlich sind:
• Betriebssysteme und ihre Komponenten
• Compiler, Interpreter
• Binder, Lader bzw. Bindelader
• Programme zur Verwaltung von Geräten
• Netzsoftware
• ...
1.4 Software-Grundlagen
1-52
Anwendungssoftware
Die Anwendungssoftware wird zur Lösung von Problemen, die nicht ursächlich mit
Rechnern zu tun haben, eingesetzt:
• Datenbankprogramme
• Conputeralgebrasysteme
• Office-Software: Textverarbeitung, Tabellenkalkulation, Präsentation, . . .
• E-Mail-Programme
• Internetsoftware: Browser, . . .
• Mediensoftware: Grafik-, Photo-, Audio-, Videoprogramme, . . .
• ...
1.4 Software-Grundlagen
1-53
Softwarewerkzeuge
Softwarewerkzeuge unterstützen die Erstellung von System- und
Anwendungsprogrammen:
• Modellbildung
• Programmierwerkzeuge
• Versionskontrolle
• Integrierte Entwicklungsumgebungen
• ...
1.4 Software-Grundlagen
1-54
Betriebssysteme
• Der Begriff Betriebssystem ist eine zusammenfassende Bezeichnung für alle
Programme, die die Ausführung der Benutzerprogramme, die Verteilung der
Betriebsmittel auf die einzelnen Benutzerprogramme und die Aufrechterhaltung der
Betriebsart (z. B. Stapelbetrieb, Dialogbetrieb) steuern und überwachen.
• Das Betriebssystem bietet seine Dienste dem Benutzer in einer textuellen oder
grafischen Oberfläche an.
1.4 Software-Grundlagen
1-55
Betriebssysteme
• Das Betriebssystem kann als eine Erweiterung der Maschine gesehen werden. Der
durchschnittliche Programmierer möchte in der Regel beispielsweise nicht die
Verwaltung einer Floppy-Disk programmieren, sondern deren Funktionalität als
Abstraktion auf hohem Niveau nutzen. In diesem Zusammenhang spricht man auch
von einer virtuellen Maschine.
• Das Betriebssystem arbeitet auch als Ressourcenmanager. Moderne Rechensysteme
bestehen aus Prozessoren, Speichern, Uhren, Platten, Terminals, Druckern,
Netzwerkschnittstellen und vielen weiteren Komponenten. Das Betriebssystem teilt
diese Ressourcen untern den verschiedenen Prozessen auf. Dieser Vorgang kann als
„Multiplexen in Zeit und Raum“ beschrieben werden.
1.4 Software-Grundlagen
1-56
Wichtige Betriebssysteme
• UNIX-Derivate
◦ BSD-Unix (Berkeley Software Distribution)
◦ AT&T, System V
◦ Linux (Linus Torvalds)
Distributionen für Linux: RedHat, Suse, Debian, Ubuntu, Knoppix, . . .
• Betriebssysteme der Fa. Microsoft
◦
◦
◦
◦
MS-DOS
Windows 3.x/95/98/Me
Windows NT, Windows 2000, Windows XP
Windows Vista, Windows 7, 8, 10
1.4 Software-Grundlagen
1-57
Oberflächen von Betriebssystemen
• Ein heutiges Betriebssystem stellt dem Benutzer die Fähigkeiten des Rechners über
eine textuelle Oberfläche (Shell) und/oder über eine grafische Oberfläche (GUI,
Graphical User Interface) zur Verfügung.
• Beispielsweise gibt es für Unix üblicherweise die Shells sh, bash, csh, tcsh, ksh und
einige weitere. Für Linux wurden die grafischen Oberflächen KDE und Gnome
entwickelt. Die Wahl der jeweiligen Oberfläche bleibt dem Benutzer überlassen.
1.4 Software-Grundlagen
1-58
Dateiverwaltung
Dateiverwaltungssystem
Komponente eines Betriebssystems, die den gesamten Platz auf externen Speichern
verwaltet. Zu den Aufgaben gehören die Lokalisierung von Dateien, die Zuweisung von
Speicherplatz und die Buchführung über die Verwendung des Speichers.
Editor
Komponente eines Dateiverwaltungssystems zum Bearbeiten von Texten oder Daten.
Verbreitete Editoren unter Unix sind vi, emacs, nedit und gedit. Notepad und
Wordpad sind solche für Windows.
1.4 Software-Grundlagen
1-59
Programmierwerkzeuge
• Änderungsverwaltung: diff, patch
• Versionsverwaltungsprogramme: rcs, cvs, svn
• Eingabeanalyse: lex, yacc
• Eingabeverarbeitung: awk
• Programmgenerierung: make
• ...
1.4 Software-Grundlagen
1-60
Programmierumgebungen
Programmierumgebungen sind Software-Systeme zur Unterstützung der
Programmentwicklung. Typische Bestandteile einer Programmierumgebung sind
• ein sprachspezifischer Editor (Texteditor),
• Compiler und/oder Interpreter,
• Binder, Lader bzw. Bindelader,
• Test- und Debughilfen,
• Quelltextformatierungstools,
• Archivierungswerkzeuge sowie
• Dokumentationsgeneratoren.
1.4 Software-Grundlagen
1-61
Integrierte Entwicklungsumgebungen
Eine Programmierumgebung wird auch integrierte Entwicklungsumgebung (IDE)
(integrated development environment) genannt. Integrierte Entwicklungsumgebungen
für Java sind beispielsweise
• NetBeans,
• Eclipse,
• IntelliJ IDEA,
• Borland JBuilder und
• Oracle JDeveloper.
Integrierte Entwicklungsumgebungen können ggf. auch für die Arbeit mit mehreren
Programmiersprachen geeignet sein.
1.4 Software-Grundlagen
1-62