Vorlesung Informatik I Universität Augsburg Wintersemester 2010/2011 Prof. Dr. Robert Lorenz Lehrprofessur für Informatik Programmieren in C – Der Compilierungsprozess 1 Aufbau eines C-Programms 1. Direktiven für den Präprozessor 2. Globale Vereinbarunen a. Globale Variablen b. Funktions-Prototypen 3. main-Funktion a. lokale Vereinbarungen b. Anweisungen 4. Funktions-Definitionen a. lokale Vereinbarungen b. Anweisungen 2 Aufbau eines C-Programms C-Programme sind Sammlungen von Funktionen Funktionen zerlegen Programme in kleinere, selbständige Einheiten erhöht Übersichtlichkeit und Wartbarkeit Alle benutzten Funktionen müssen zu Beginn deklariert werden 3 Aufteilung großer C-Programme Zur Modularisierung werden die Funktionen auf mehrere Quelldateien verteilt und getrennt übersetzt (genau einer der Dateien enthält die main-Funktion) Jede solche Datei sollte eine sinnvoll zusammenhängende Gruppe von Vereinbarungen enthalten. Die Deklarationen der Funktionen, die in mehreren Quelldateien benötigt werden, werden in Header-Dateien zusammengefasst (werden mit #include eingebunden) Mehrfach benötigten Vereinbarungen werden nur in wenigen Dateien verwaltet 4 Compilierungsprozess - Überblick Quellcode Präprozessor (erweiterter Quellcode) Compiler Assemblercode Assembler Bibliotheken Objektcode Linker ausführbarer Code 5 Inhalt Präprozessor Compiler Assembler Linker Bibliotheksfunktionen Das Programm gcc Große Programme 6 Präprozessor Konstanten deklarieren Die Präprozessor-Direktive #define <Name> <Zeichenkette> veranlasst den Präprozessor, jedes Vorkommen von <Name> im folgenden Quellcode durch <Zeichenkette> zu ersetzen Ausnahme: Keine Ersetzung in Namen und Zeichenketten <Name> kann im Programm als Konstante benutzt werden, deren Wert durch <Zeichenkette> gegeben ist 7 Präprozessor Konstanten deklarieren Beispiele für sinnvolle eigene Deklarationen: #define PI 3.14 #define TRUE 1 #define FALSE 0 #define MAX_BUFFER 1000 Konvention: Der Name der Konstante besteht aus Großbuchstaben und wird an keiner anderen Stelle benutzt 8 Präprozessor Konstanten deklarieren Vordefinierte Beispiele aus Header-Dateien: Wertebereichgrenzen von Datentypen (in limits.h, float.h) __LINE__ aktuelle Zeilennummer im Programmcode (num.) __FILE__ Dateiname (Zeichenkette) __DATE__ aktuelles Datum (Zeichenkette) __TIME__ aktuelle Zeit (Zeichenkette) (u.v.m….) 9 Präprozessor Konstanten deklarieren Vorteile: Konstanten muss man bei Bedarf nur einmal ändern Programm ist besser lesbar Vergleich zu globalen konstanten Variablen: Keine zusätzliche Variable nötig Konfiguration mehrerer Programme durch Deklaration in HeaderDatei möglich 10 Präprozessor Makros deklarieren Die Präprozessor-Direktive #define <Name>(<Parameternamen>) <Zeichenkette> veranlasst den Präprozessor zu folgendem: Ersetzt jedes Vorkommen von <Name>(<Argumente>) im Quellcode durch <Zeichenkette> Ersetzt jeden in <Zeichenkette> vorkommenden Namen aus <Parameternamen> durch zugehöriges Argument aus <Argumente> <Parameternamen>: Durch Komma getrennte Parameternamen <Argumente>: Durch Komma getrennte Ausdrücke <Name>(<Argumente>) kann im Programm als Aufruf einer Funktion, die durch <Zeichenkette> definiert ist, benutzt werden 11 Präprozessor Makros deklarieren Selbst definierte Beispiele: #define inhalt(r) PI*(r)*(r); „Aufruf“ im Code: double inhalt = inhalt(10); #define max(a,b) ( ((a) > (b)) ? (a) : (b)) ); „Aufruf“ im Code: scanf(“%i“,&x);int m=max(5*x,x*x); Vordefinierte Beispiele aus Headerdateien: Oft ist getchar ein Makro 12 Präprozessor Makros deklarieren Achtung: In <Zeichenkette> benutzte Operationszeichen können stärker binden als die Operatoren in einem für einen Parameternamen eingesetzten Ausdruck! Man muss dafür sorgen, dass der Ausdruck nach dem Einsetzen unbedingt zuerst ausgewertet wird Dazu unbedingt die in <Zeichenkette> vorkommenden Parameternamen klammern (Beispiel vorige Folie) 13 Präprozessor Makros deklarieren Vergleich zu Funktionen Parameter sind Datentyp-unabhängig: #define max(a,b) ( ((a) > (b)) ? (a) : (b)) ); Mögliche „Aufrufe“: int m = max(5,7); double m = max(5.0,7.5); 14 Präprozessor Makros deklarieren Vergleich zu Funktionen Es entsteht mehr Programmcode, da der „Funktionsrumpf“ für alle Vorkommen des „Funktionsnamens“ eingesetzt wird 15 Präprozessor Header-Dateien in den Code einfügen Die Anweisung #include <Header-Datei> veranlasst den Präprozessor, die angegebene Header-Datei in den Quellcode zu kopieren Es entsteht ein erweiterter Quellcode 16 Präprozessor Header-Dateien in den Code einfügen Eine Header-Datei ist eine Textdatei um Funktions-Prototypen zu deklarieren (kennen wir schon) Konstanten zu deklarieren (wie eben) Makros zu definieren (wie eben) Man kann (sollte) sich seine eigenen Header-Dateien schreiben Da die Header-Datei nur in den Quellcode kopiert wird, kann man doch alles auch gleich direkt in den Quellcode schreiben!? 17 Präprozessor Header-Dateien in den Code einfügen In einer Header-Dateien sammelt man Vereinbarungen und Funktionalitäten, die man immer wieder für einen bestimmten Anwendungsbereich braucht Ist beliebig oft in wiederverwendbar, ohne dass man alles in jedem Programm nochmal extra aufschreiben muss 18 Präprozessor Header-Dateien in den Code einfügen Beispiele: stdio.h (Standard Input Output): Unterstützung von Eingabe und Ausgabe math.h: Unterstützung mathematischer Funktionen und Konstanten string.h: Unterstützung bei der Verarbeitung von Zeichenketten 19 Präprozessor Header-Dateien selbst schreiben Textdatei mit Präprozessor-Direktiven schreiben Unter beliebigem Namen mit Endung .h abspeichern in: Programmverzeichnis include-Verzeichnis des Compilers In Quellcode einbinden durch Anweisung: include-Verzeichnis: #include <Headerdatei.h> (relative Pfadangaben erlaubt) Programmverzeichnis: #include “Headerdatei.h“ (relative und absolute Pfadangaben erlaubt) 20 Präprozessor Header-Dateien selbst schreiben Achtung: Es sind verschachtelte include-Anweisungen möglich Datei Header1.h enthält Direktive #include “Header2.h“ Dadurch kann es durch mehrfaches Einbinden von Direktiven zu Syntaxfehlern kommen Programm enthält Direktiven #include “Header1.h“ und #include “Header2.h“ Lösung: Bedingte Aktivierung von Direktiven 21 Präprozessor Header-Dateien selbst schreiben Bedingte Aktivierung von Direktiven Headerdateien sollten immer die folgende Form haben: #ifndef DATEINAME_H_INCLUDED #define DATEINAME_H_INCLUDED <Deklarationen> #endif 22 Präprozessor Header-Dateien selbst schreiben Bedingte Aktivierung von Direktiven #define Fasst Deklarationen unter einem Namen zusammen Name = Dateiname in Großbuchstaben + _ #ifndef Text einbinden, falls Name noch nicht exisitiert #ifdef Text einbinden, falls Name schon exisitiert ...#endif 23 Präprozessor Erstellen mehrteilger Programme 1. Zerlegung des Programms in funktionale allgemein wiederverwendbare Module 2. Für jedes Modul: Headerdatei erstellen Code-Datei erstellen mit eingebundenem Header 3. Programmdatei mit main-Funktion erstellen 4. Übersetzungsprozess (später) 24 Präprozessor Erstellen mehrteilger Programme - Beispiel Datei format.h: #ifndef FORMAT_H_INCLUDED #define FORMAT_H_INCLUDED void vspace(int n); void hspace(int n); #endif Analog für Sammlungen mathematischer Funktionen (Fakultät) oder Eingabefunktionalitäten (Eingabestrom leeren, Eingaben vom Benutzer verarbeiten,...) 25 Präprozessor Erstellen mehrteilger Programme - Beispiel Datei format.c: #include “format.h“ #include <stdio.h> void vspace(int n){ int i; for(i=1;i<=n;i++){printf("\n");} } void hspace(int n){ ... } 26 Präprozessor Erstellen mehrteilger Programme - Beispiel Datei programm.c: #include “format.h“ #include “eingabe.h“ #include “computations.h“ #include <stdio.h> int main(){ ... } 27 Compiler Zusammenfassung Überprüft den (erweiterten) Quellcode auf Syntaxfehler (lässt sich das Programm in Maschinensprache übersetzen?) Weist Variablen und Konstanten Speicherbereiche zu Übersetzt den Quellcode in Assemblercode (Assemblercode ist symbolischer=menschenlesbarer Maschinencode) 28 Assembler Überblick Übersetzt Assemblercode in Maschinencode Was jetzt noch fehlt? Zusammenführung von mehreren Quellcode-Dateien Integration von Bibliotheksfunktionen 29 Linker Überblick Bindet andere Dateien mit dem Hauptprogramm: Führt mehreren Quellcode-Dateien in einer Datei zusammen (man sagt, Quellcode-Dateien werden statisch (ein)gebunden) Fügt Informationen für den Zugriff auf Bibliotheksfunktionen ein (man sagt, Bibliotheksfunktionen werden dynamisch gebunden) 30 Linker Bibliotheksfunktionen werden in Header-Dateien also nur deklariert (aber nicht definiert) sind entweder vorübersetzte C-Programme oder direkt ausführbare Assembler-Programme werden mit dem Compiler installiert 31 Das Programm gcc Das Programm gcc umfasst die Ausführung von Preprozessor, Compiler, Assembler und Linker Mittels verschiedener Optionen (Kommandozeilenparameter) lassen sich diese Programme auch einzeln ausführen Mittels verschiedener Optionen lässt sich die Syntax-Kontrolle unterschiedlich detailliert ausführen 32 Das Programm gcc gcc – Optionenen: Syntaxkontrolle -ansi -pedantic z -W -Wall -Wextra -Wmain weist den Compiler an, den C89-Standard zu verwenden. bringt ihn weiterhin dazu, nichts außer dem C89-Standard zuzulassen schaltet zusätzliche Warnungen an. schaltet alle zusätzlichen Warnungen an. schaltet zusätzliche zusätzliche Warnungen an. schaltet zusätzlich Warnungen über eine falsch definierte main()-Funktion an. Man sollte ALLE Warnungen zum verstummen bringen, selbst wenn das Programm schon übersetzbar ist und läuft 33 Das Programm gcc gcc – Optionenen: Teile ausführen -E Preprozessor wird ausgeführt (nicht Compiler, Assembler, Linker) -S -c Ausgabe in Datei <Programmname>.i Compiler wird ausgeführt (nicht Assembler, Linker) Ausgabe in Datei <Programmname>.S Compiler und Assembler werden ausgeführt (nicht Linker) Ausgabe in Datei <Programmname>.o 34 Das Programm gcc gcc – Optionenen: weitere (Auswahl) -save-temps Zwischenergebnisse werden gespeichert --help Übersicht über Benutzung des Programms -o <name> Festlegung des Namens der Ausgabedatei -WI -stack <Bytes> Stackgröße erhöhen 35 Das Programm gcc Übersetzung mehrteilger Programme 1. Dateien ohne main-Funktion übersetzen in Objektcode gcc -ansi -pedantic -W -Wall -Wextra -c modul1.c 2. Datei mit main-Funktion übersetzen + mit Objetdateien linken gcc -ansi -pedantic -W -Wall -Wextra -Wmain modul1.o modul2.o programm.c -o Programm 36