Dienstag 15.5.2012

Mathematik für Informatiker B, SS 2012
Dienstag 15.5
$Id: korper.tex,v 1.19 2012/05/18 03:54:21 hk Exp $
§4
Körper
4.2
Der Körper der reellen Zahlen
In der letzten Sitzung hatten wir mit der Untersuchung angeordneter Körper begonnen. Insbesondere hatten wir obere und unterer Schranken von Teilmengen eines solchen Körpers K definiert, dies waren gerade Elemente des Körpers die größer-gleich
beziehungsweise kleiner-gleich als jedes Element der Teilmenge waren. Diese Schranken waren recht willkürlich ist a eine obere Schranke so ist auch jedes b ≥ a ebenfalls
ein obere Schranke. Von besonderen Interesse sind natürlich die besten“ oberen und
”
unteren Schranken, also die kleinste obere Schranke beziehungsweise die größte untere
Schranke. Diese Objekte stellen sich als wichtig heraus, und erhalten daher zunächst
einen eigenen Namen.
Sei also ein angeordneter Körper K gegeben. Sei A ⊆ K. Eine obere Schranke M
von A heißt Supremum von A, wenn sie die kleinste obere Schranke von A in K ist, es
soll also M ≤ M 0 für jede obere Schranke M 0 von A in K gelten. Man schreibt dann
M = sup A. Entsprechend heißt eine untere Schranke m von A das Infimum von A,
wenn sie die größte untere Schranke von A in K ist, wenn also m ≥ m0 für jede untere
Schranke m0 von A in K gilt. Man schreibt dann m = inf A.
Da all dies schon im letzten Semester dran war, wollen wir hier nur kurz einige
kleine Beispiele angeben. Wir werden den Begriff später noch einmal etwas genauer
wiederholen, sobald wir ihn etwas intensiver benutzen wollen.
Wir gehen jetzt einige Beispiele im angeordneten Körper K = Q durch.
1. Die Menge Q+ := {x ∈ Q|x > 0}, also der Positivbereich, ist nach unten aber
nicht nach oben beschränkt. Die unteren Schranken von Q+ sind genau die m ∈ Q
mit m ≤ 0, und die größte unter ihnen ist m = 0. Damit ist inf Q+ = 0 das
Infimum. Ein Supremum gibt es nicht, da es ja überhaupt keine oberen Schranken
gibt, also erst recht keine kleinste obere Schranke.
2. Die Menge Z der ganzen Zahlen ist in Q weder nach oben noch nach unten
beschränkt, sie hat also insbesondere auch weder Infimum noch Supremum.
3. Die Menge A := {x ∈ Q|1 < x < 2} ist nach oben und nach unten beschränkt,
etwa durch die untere Schranke m = 1 und die obere Schranke M = 2. Diese sind
offenbar auch Infimum und Supremum, also inf A = 1, sup A = 2.
4. Die Menge A := {x ∈ Q|x2 < 2} ist nach oben und unten beschränkt. Beispiels9-1
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
weise gilt für jedes x ∈ A stets x2 < 2 < 4 = 22 also auch
(x − 2) · (x + 2) = (x2 − 4) < 0,
also haben x − 2 und x + 2 verschiedenes Vorzeichen und wegen x − 2 < x + 2
bedeutet dies x − 2 < 0 < x + 2, d.h. −2 < x < 2. Diese Schranken sind aber
kein Supremum beziehungsweise Infimum, beispielsweise ist 3/2 eine kleine obere
Schranke. Tatsächlich hat A in Q weder Supremum noch Infimum. Dies wollen
wir hier nicht exakt beweisen, intuitiv ist Ihnen
hoffentlich klar was passiert,
√
Supremum beziehungsweise Infimum wären ± 2, aber diese sind keine rationalen
Zahlen.
Im Fall der rationalen Zahlen kann es also passieren, dass nach oben beschränkte
√ Mengen überhaupt keine kleinste obere Schranke besitzen, weil diese wie etwa 2 in Q
einfach fehlt. In den reellen Zahlen wird dieser Effekt nicht auftreten, und wir führen
zunächst einmal einen Namen für diese Eigenschaft der reellen Zahlen ein.
Definition 4.14: Ein angeordneter Körper heißt vollständig, wenn in ihm jede nicht
leere, nach oben beschränkte Menge ein Supremum besitzt.
Die Asymmetrie zwischen Supremum und Infimum in dieser Definition ist nur scheinbar, in einem vollständig angeordneten Körper K hat auch jede nicht leere, nach unten
beschränkte Menge A ⊆ K ein Infimum. Wir können nämlich zu A die Menge
B := {b ∈ K|b ist eine untere Schranke von A}
der unteren Schranken von A betrachten. Da A nach unten beschränkt ist, gibt es
überhaupt eine untere Schranke von A und damit ist B 6= ∅. Ist a ∈ A, so gilt x ≤ a
für jede untere Schranke x von A, d.h. für jedes x ∈ B. Damit ist jedes Element von A
eine obere Schranke von B, und wegen A 6= ∅ ist B insbesondere nach oben beschränkt.
Die Vollständigkeit von K liefert die Existenz des Supremums
s := sup B ∈ K,
und wir behaupten das s zugleich das Infimum von A ist. Ist a ∈ A so haben wir schon
festgehalten, dass a eine obere Schranke von B ist und da s die kleinste obere Schranke
von B ist, ist somit s ≤ a. Folglich ist s zumindest eine untere Schranke von A. Ist jetzt
t ∈ K eine beliebige untere Schranke von A, so ist t ∈ B da B ja gerade die Menge
der unteren Schranken von A war, und insbesondere ist t ≤ s. Damit ist s die größte
untere Schranke von A, d.h. das Infimum von A.
Damit ist die Symmetrie zwischen Supremum und Infimum wieder hergestellt. Wie
das letzte der obigen Beispiele zeigt, sind die rationalen Zahlen Q zwar angeordnet,
aber nicht vollständig angeordnet. Die reellen Zahlen sind dagegen vollständig angeordnet. Streng genommen beweist man die Existenz und Eindeutigkeit eines vollständig
angeordneten Körpers und definiert die reellen Zahlen dann als diesen Körper.
9-2
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
Satz 4.15 (Existenz und Eindeutigkeit der reellen Zahlen)
Es gibt bis auf Isomorphie genau einen angeordneten vollständigen Körper. Dieser wird
als der Körper R der reellen Zahlen bezeichnet.
Da dies etwas aufwändig ist, wollen wir diesen Satz hier nicht beweisen. Die Eindeutigkeit ist in Wahrheit kein großes Problem, und kann recht schnell basierend auf Lemma
12 bewiesen werden. Die Existenz wird durch explizite Konstruktion eines vollständig
angeordneten Körpers hergeleitet. Hierfür gibt es (mindestens) vier verschiedene, übliche Konstruktionsmethoden, aber in jeder dieser vier Methoden ist einiges an Details
abzuarbeiten.
Die reellen Zahlen sind eine Obermenge der rationalen Zahlen, was wir sowieso
nach Lemma 12 wissen, aber sehr viel größer als die rationalen Zahlen. Reelle Zahlen
lassen sich in Form von unendlichen Dezimalbrüchen darstellen. Tatsächlich ist dies der
Ansatzpunkt für eine der vier Konstruktionsmethoden. Wir werden uns im nächsten
Abschnitt kurz und vereinfachend mit der Darstellung reeller Zahlen im Computer
beschäftigen, die dann über gewisse Zifferndarstellungen“ erfolgt. Zuvor wollen wir
”
aber noch ein wichtiges Lemma beweisen, das sich in späteren Kapiteln als grundlegend
herausstellen wird.
Lemma 4.16 (Archimedische Eigenschaft von R)
Zu jedem x ∈ R mit x > 0 gibt es ein n ∈ N∗ mit 0 <
1
n
< x.
Beweis: Zunächst gilt für jedes n ∈ N∗ natürlich 1/n > 0, wir müssen uns also nur um
1/n < x kümmern. Angenommen es gäbe kein solches n ∈ N∗ , d.h. für jedes n ∈ N∗
gilt
1
1
≥ x, und somit n ≤ .
n
x
Dann ist 1/x eine obere Schranke von N∗ und N∗ ist in R nach oben beschränkt. Die
Vollständigkeit der reellen Zahlen ergibt die Existenz des Supremums s := sup N∗ .
Dann ist aber s − 1 ∈ R eine reelle Zahl mit s − 1 < s, und da s die kleinste obere
Schranke von N∗ ist, kann s − 1 keine obere Schranke von N∗ sein. Dies bedeutet das
es ein n ∈ N∗ mit s − 1 < n gibt. Dann ist aber auch n + 1 ∈ N∗ und mit Lemma
10.(c) folgt s = (s − 1) + 1 < n + 1. Andererseits ist s eine obere Schranke von N∗ , wir
müssen also auch n + 1 ≤ s haben, und dies ist ein Widerspruch. Dieser Widerspruch
beweist, dass es ein n ∈ N∗ mit 1/n < x geben muss.
4.2.1
Darstellung reeller Zahlen
Wir kommen nun kurz zur Darstellung reeller Zahlen im Computer. Hier gibt es zwei
übliche Methoden. Das erste ist die sogenannte Fixpunktarithmetik, hier verwendet
man Dezimalzahlen deren Nachkommastellen auf eine fest vorgegebene Stellenzahl begrenzt sind. Alle über diese Grenze hinausgehenden Dezimalziffern werden abgeschnitten, eventuell mit Rundung durch Modifikation der letzten gültigen Nachkommastelle.
9-3
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
Ein Vorteil dieses Verfahrens ist, dass man so mit ganzen Zahlen auskommt. Wollen
wir beispielsweise e = 3 Nachkommastellen haben, so können wir einfach ganze Zahlen
benutzen deren Wert als Tausendstel interpretiert wird, die Zahl 1.217 wird dann zu
1217 Tausendsteln. Es gibt einige Situationen in denen einem diese Art der Arithmetik
begegnen kann:
1. Bei diversen mit dem Geldverkehr befassten Anwendungen gibt es ziemlich genaue gesetzliche Vorgaben mit wievielen Nachkommastellen gerechnet werden
muss, wie die Rundung durchgeführt werden muss und so weiter. Hier ist man
oft praktisch gezwungen mit der einen oder anderen Form von Fixpunktarithmetik zu rechnen.
2. Bei einigen graphischen Anwendungen ist durch die Existenz von Pixeln von vornherein eine kleinstmögliche sichtbare Größe gegeben. Trotzdem kann es praktisch
sein die Bildschirmkoordinaten nicht als Pixelanzahlen zu beschreiben sondern
in realen Einheiten“, etwa in Millimetern. Die wirklich verschiedenen Koordi”
natengrößen unterscheiden sich dann in Vielfachen der Pixelgröße, was man als
Anlass zur Verwendung einer Fixpunktarithmetik nehmen kann.
3. Manchmal wird Fixpunktarithmetik verwendet um von den Details der Fließpunktrechnung unabhängig zu sein. Beispielsweise verwendet die Originalimplementation von TEX eine Fixpunktarithmetik. Diese wurde zu einer Zeit erstellt
als es noch eine wesentlich größere Prozessorvielfalt als heute gab, und die Implementierung der Fließpunktarithmetik auf verschiedenen Prozessoren konnte
sich in diversen Details unterscheiden. Um unabhängig vom verwendeten Rechner immer dieselbe Ausgabe zu erhalten, hat TEX daher seine eigene Arithmetik
implementiert. Dies ist aktuell kein großes Problem mehr, da es für die Implementierung von Fließpunktzahlen inzwischen allgemein befolgte Standards gibt.
Die praktisch wichtigere Zahldarstellung ist die schon erwähnte Darstellung reeller
Zahlen als Fließpunktzahlen, oder Fließkommazahlen wenn Ihnen der Name lieber ist.
Die Grundidee ist es Größenordnung und Genauigkeit etwas zu entkoppeln und reelle
Zahlen in der Form x = m·10k zu schreiben. Die sogenannte Mantisse m“ ist dabei für
”
die Genauigkeit und der Exponent k“ für die Größenordnung zuständig. Eine derartige
”
Darstellung ist natürlich nicht eindeutig, durch Änderung des Exponenten verschiebt
sich der Dezimalpunkt in der Mantisse
178.5308 · 101 = 17.85308 · 102 = 1785.308 · 100 = 17853.08 · 10−1 .
Dieses Verschieben des Dezimalpunktes gibt der Fließpunktarithmetik ihren Namen.
Um die Darstellung eindeutig zu machen, legt man sich jetzt auf die sogenannten
normalisierten Fließpunktzahlen fest, bei denen die Mantisse die Form m = ±0.X... hat,
wobei die erste Nachkommastelle X“ nicht Null ist. Für die reelle Zahl x = 0 ist eine
”
solche Darstellung nicht möglich, und die Null wird daher als ein Sonderfall behandelt.
Zur Addition normalisierter Fließpunktzahlen müssen die beiden Zahlen erst durch
9-4
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
Verschieben des Dezimalpunktes auf dieselbe Größenordnung gebracht werden, dann
können die Mantissen addiert werden und anschließend muss das Ergebnis eventuell
noch normalisiert werden. Als ein Beispiel zur Addition wollen wir einmal
0.34127 · 1019 + 0.41578 · 1021 = 0.0034127 · 1021 + 0.41578 · 1021
= (0.0034127 + 0.41578) · 1021 = 0.4191927 · 1021
rechnen. Entsprechend wird auch die Subtraktion gehandhabt. Bei einer vollständigen
Implementierung der Fließpunktaddition müssen auch noch die Vorzeichen berücksichtigt werden, so das Addition bei verschiedenen Vorzeichen in Wahrheit eine Subtraktion
ist. Multiplikation ist etwas einfacher da m1 10e1 · m2 10e2 = m1 m2 10e1 +e2 ist, man muss
also nur die Mantissen multiplizieren, die Exponenten addieren und anschließend das
Ergebnis normalisieren. Die Behandlung des Vorzeichens kann dann gesondert erfolgen.
Entsprechend sieht die Division aus, hier haben wir m1 10e1 /m2 10e2 = (m1 /m2 )·10e1 −e2 .
In einer realen Implementierung stehen für Mantisse und Exponent nur eine begrenzte, fest vorgegebene Zahl an Dezimalstellen zur Verfügung. Es bezeichne t die
Anzahl der Mantissenstellen und e die Exponentenstellen. Bei Addition und Multiplikation gehen einige Stellen mangels Platz verloren. Wir verwenden hier eine vereinfachte
Version der Fließpunktarithmetik und schneiden nicht mehr darstellbare Ziffern einfach
ab. Die wirklich verwendeten Implementationen sind etwas komplizierter, da anstelle
des einfachen Abschneidens von Stellen noch geeignete Rundungen durchgeführt werden. Rechnen wir etwa unser obiges Beispiel noch einmal mit t = 5 Mantissenstellen
und e = 3 Exponentenstellen. Bei der Angleichung der Exponenten verschwinden dann
Dezimalstellen durch 0.34127 · 1019 = 0.00341 · 1021 , wobei man das Gleichheitszeichen
hier nicht so wörtlich nehmen darf. Diesmal ergibt sich
0.34127 · 1019 + 0.41578 · 1021 = 0.00341 · 1021 + 0.41578 · 1021
= (0.0034127 + 0.41578) · 1021 = 0.41919 · 1021 .
Wir wollen noch ein zweites Beispiel betrachten bei dem eine anschließende Normalisierung nötig wird
0.99994·103 +0.70000·10−1 = 0.99994·103 +0.00007·103 = 1.00001·103 = 0.10000·104 .
Im Prinzip könnte diese Normalisierung zu einem Überlauf im Exponenten führen,
aber solche Möglichkeiten wollen wir hier ignorieren. Multiplikation und Division sind
dann etwas komplizierter, und hier gibt es auch verschiedene Varianten wie diese mit
begrenzter Mantissenlänge implementiert werden müssen. Ein Unterschied liegt darin ob Zwischenergebnisse immer mit der fixierten Mantissenlänge gerechnet werden
müssen, oder ob für diese auch größere Zahlen erlaubt sind, typischerweise die doppelte Stellenzahl. In realen Rechnern ist die Wahl der Methode inzwischen, wie schon
bemerkt, standardisiert, hier wollen wir uns ruhig beide Möglichkeiten offenhalten. Als
ein Beispiel wollen wir einmal mit der Mantissenlänge t = 4 das Produkt
0, 7189 100 · 0, 1700 · 101
9-5
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
rechnen. Führen wir die übliche schriftliche Multiplikation aus, so wird 0, 7189 100 ·
0, 1700 101 = 7189 · 17 10−5 und
7189 · 1700
7189
+50323
122213
das normalisierte Ergebnis ist also
0, 7189 100 · 0, 1700 · 101 =“ 0.1222 · 101 .
”
Die Verschiebung in den Vorkommabereich haben wir dabei nur der Übersichtlichkeit
halber durchgeführt. Hier haben wir mit Zwischenergebnissen gerechnet die länger
als die Mantissenlänge t = 4 waren, dies hat hier allerdings auf das Ergebnis keinen
Einfluss. Wir wollen uns auch noch ein Beispiel anschauen, bei dem tatsächlich ein
Unterschied auftritt, nämlich 0, 9999 · 0, 9999 beide mit Exponent 0, und wieder in
Mantissenlänge t = 4. Wir zeigen die Rechnung links mit erweiterter Mantisse und
rechts mit sofortigen Streichen überzähliger Dezimalstellen
9999 · 9999 · 10−8
89991
+ 89991
+ 89991
+ 89991
99980001 · 10−8 =“ 0.9998
”
9999 · 9999
8999
+ 899
+ 89
+ 8
9995 · 10−4 =“ 0.9995
”
Hier tritt also tatsächlich ein Unterschied in der letzten Dezimalstelle auf. Wir wollen
auch noch ein Beispiel einer Division vorführen, und hier nehmen wir
0.1214 · 102 : 0.7189 · 101 =
1234
· 101 .
7189
Wir rechnen wieder mit der Mantissenlänge t = 4, und betrachten zwei mögliche Varianten. Links erlauben wir für Zwischenergebnisse eine zusätzliche Stelle in der Mantisse,
und rechts bleiben wir strikt bei t = 4 Dezimalstellen.
1214 : 7189 = 0.1688
− 7189
4951
− 43134
6366
− 57512
6148
− 57512
3968
496
· 10−1 = 1 · 10−1 + 718
· 10−1
=“1 · 10 + 496
· 10−2
71
”
= 1 · 10−1 + 6 · 10−2 + 70
· 10−2
71
=“1 · 10−1 + 6 · 10−2 + 70
· 10−3 = 0.17,
7
”
1214
=“ 1214
7189 ”
718
−1
9-6
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
links haben wir also das Ergebnis 0.1688 · 101 und rechts die deutlich schlechtere Näherung 0.1700 · 101 .
In realen Computern wird normalerweise eine binäre Fließpunktarithmetik anstelle
der bisher behandelten dezimalen Arithmetik benutzt. Dies ist aber inhaltlich kein
wesentlicher Unterschied. Weiter werden diverse spezielle Zahlen“ unterstützt also
”
Werte für unendlich kleine und unendlich große Zahlen, ungültige Zahlen“ die als
”
Ergebnisse bei Rechenfehlern verwendet werden, es gibt sogar verschiedene Werte für
eine positive und eine negative Null, und so weiter. Derartige Details wollen wir hier
nicht behandeln.
Es gibt zwei standardisierte Größen für binäre Fließpunktzahlen. Dies sind zum
einen die 32-Bit Zahlen, typischerweise der Datentyp float in C.
float
±
Mantisse, t = 24 Bits
Exponent, e = 8 Bits
Das Vorzeichen nimmt dabei ein Bit in Anspruch. Im Exponenten wird kein Vorzeichen
verwendet, anstelle dessen werden negative Werte durch einen Offset realisiert. Bei e =
8 Bits haben wir 28 = 256 verschiedene Werte, und hierfür nimmt man die Zahlen von
−128 bis 127. Gespeichert werden diese mit dem Offset 27 = 128, d.h. der gespeicherte
Wert n meint n − 128 als Exponent. Wenn Sie oben mitgezählt haben benötigen wir t +
e = 32 Bits plus ein Vorzeichenbit und dies scheint eines zuviel zu sein. Das ist aber nur
eine Täuschung. Gespeichert werden ja normalisierte Fließpunktzahlen, also mit erster
Nachkommastelle ungleich Null. Im Binärsystem ist die erste Nachkommastelle einer
normalisierten Fließpunktzahl damit immer gleich Eins, und diese sowieso festgelegte
Eins wird einfach nicht mitgespeichert. Von den t = 24 Mantissenbits werden also nur
die hinteren 23 wirklich im Speicher abgelegt, und damit kommt man auf insgesamt 32
Bits für einen float Wert.
Die zweite Standardgröße sind 64 Bit große Fließpunktzahlen, typischerweise der
Datentyp double in C. Hier hat man
double
±
Mantisse, t = 53 Bits
Exponent, e = 11 Bits
Das oben für float gesagte trifft entsprechend auch auf double zu. Man mag sich
fragen warum die Mantisse so viel großzügiger bedacht wird als der Exponent, aber
dies hat gute Gründe. Zu große oder zu kleine Werte im Exponenten kann man in
der Regel vermeiden indem das Ausgangsproblem vorher passend skaliert wird, beispielsweise durch Wahl geeigneter Einheiten oder durch Übergang zu Logarithmen
und ähnlichen. Dies funktioniert nur nicht wenn zugleich Werte von sich stark unterscheidenden Größenordnungen auftreten, was glücklicherweise nicht so oft passiert.
Ungenaues Rechnen in der Mantisse kann man dagegen durch nichts ausgleichen. Spezielle Prozessoren bieten oft auch noch diverse andere Fließpunkttypen an, aber so
etwas soll hier nicht mehr besprochen werden.
4.3
Der Körper der komplexen Zahlen
Nachdem wir uns im letzten Teilabschnitt die reellen Zahlen ein wenig angeschaut
haben, kommen wir nun zum letzten der grundlegenden Zahlbereiche, den sogenannten
9-7
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
komplexen Zahlen. Wir beginnen mit einer eher operativen Einführung der komplexen
Zahlen bevor wir dann zu einer exakten Definition kommen. Das Ausgangsproblem zu
dessen Lösung die komplexen Zahlen ursprünglich eingeführt wurden ist die Lösung
der Gleichung dritten Grades
x3 + ax2 + bx + c = 0 (a, b, c ∈ R).
Analog zur quadratischen Ergänzung bei der quadratischen Gleichung kann man den
zweithöchsten Term zum Verschwinden bringen, hier durch die Ersetzung von x durch
x − a/3, und erhält die Normalform der Gleichung dritten Grades
x3 + px + q = 0 (p, q ∈ R).
Für diese Gleichung gibt es jetzt, entsprechend zur pq-Formel bei der quadratischen
Gleichung, eine explizite Lösungsformel, die sogenannte Formel von Cardano. Die volle Cardano-Formel beschreibt alle drei Lösungen unserer Gleichung, aber für unsere
Zwecke reicht es die erste, und auch einfachste, dieser drei Lösungen hinzuschreiben.
Diese Lösung ist gegeben als
√
3
p
D
2p
x=
−√
mit
D
:=
−108q
+
12
12p3 + 81q 2 .
3
6
D
Wir wollen uns als ein konkretes Beispiel einmal den Beginn der Rechnung für die
Gleichung
20
7
x3 − x +
=0
3
27
anschauen. Hier ist p = −7/3 und q = 20/27. Damit wird
12p3 + 81q 2 = −108 = −36 · 3,
also
√
√
D = −80 + 12 −108 = −80 + 72 −3.
Das scheint also gar nicht zu funktionieren, eine Wurzel aus −3 gibt es nun einmal
nicht. Der Trick an der Cardano-Formel ist es dieses Detail zu ignorieren, und einfach
weiter zu rechnen. Der weitere Verlauf spielt für uns keine Rolle und soll hier nicht
vorgeführt werden. Als Endergebnis ergibt sich x = 1/3, und dies ist tatsächlich eine
Lösung unserer Gleichung dritten Grades. Wir haben hier also mit der rein reellen
Gleichung
7
20
x3 − x +
=0
3
27
begonnen, √
und sind bei der reellen Lösung x = 1/3 gelandet. Nur zwischendurch ist so
etwas wie −3 in der Rechnung aufgetaucht, ist aber am Ende wieder verschwunden.
Man bezeichnet den Zahlbereich der durch Erweiterung von R um Wurzeln negativer
Zahlen entsteht als die komplexen Zahlen. Im Kontext der Cardano-Formel spielt es keinerlei Rolle ob die komplexen Zahlen logisch überhaupt stichhaltig sind, am Ende kann
9-8
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
man ja einfach nachschauen ob die erhaltene reelle Zahl tatsächlich eine Lösung ist.
Hier sind die komplexen Zahlen also nur ein obskurer Rechentrick, sie tauchen zwischendurch geisterhaft auf und verschwinden am Ende wieder. Aus dieser Zeit stammt auch
die Redeweise von den Wurzeln negativer Zahlen als den sogenannten imaginären Zahlen, denn als reiner Rechentrick betrachtet haben die komplexen Zahlen ja tatsächlich
etwas imaginäres“.
”
Bevor wir zu einer formalen Definition kommen, wollen wir erst einmal noch etwas
auf der vagen Basis komplexe Zahlen = Reelle Zahlen + Wurzeln negativer Zahlen“
”
weiterrechnen. Zunächst beachte das wir gar nicht die Wurzeln aller negativen Zahlen
hinzunehmen müssen, es reichht völlig eine Wurzel aus −1 zu haben. Denn dann können
wir beispielsweise auch
p
√
√
√
−3 = (−1) · 3 = −1 · 3
√
rechnen. Man nennt√i := −1 daher die imaginäre Einheit“. Alleine mit dem Hin”
zunehmen von i = −1 ist es aber nicht getan, es muss ja auch Zahlen wie 2 + i,
1/(3 + 2i) und so weiter geben. Wir wollen uns klarmachen das man mit komplexen
Zahlen der Form a + ib mit a, b ∈ R auskommt. Schauen wir uns zunächst einmal die
Potenzen der imaginären Einheit i an
i2 = −1, i3 = i2 · i = −i, i4 = (i2 )2 = (−1)2 = 1, i5 = i4 · i = 1 · i, . . .
Wegen i4 = 1 wiederholen sich die Potenzen von i jetzt im Viererrythmus. Ein allgemeiner polynomialer Ausdruck in i mit reellen Koeffizienten wird also zu
a0 + a1 i + a2 i2 + a3 i3 + a4 i4 + a5 i5 + · · · = a0 + a1 i − a2 − a3 i + a4 + a5 i + · · ·
= (a0 − a2 + a4 − · · · ) + (a1 − a3 + a5 − · · · )i,
diese Ausdrücke haben also immer die Form a + ib. Wie sieht es jetzt mit Quotienten
aus? Dabei ist 1/i leicht zu sehen, es ist ja
i · (−i) = −i2 = 1 =⇒
1
= −i,
i
aber schon so etwas wie 1/(1 + i) ist nicht so
√ einfach. Hier führt aber derselbe Trick
wie bei der obigen Umformung von 1/(1 − 3 3 i) zum Ziel, es ist
1
1−i
1−i
1−i
1 1
=
=
=
= − i.
2
1+i
(1 + i) · (1 − i)
1−i
2
2 2
Dieselbe Rechung funktioniert auch im allgemeinen Fall, sind a, b ∈ R mit a + ib 6= 0,
also (a, b) 6= (0, 0), so ist
1
a − ib
a − ib
a
b
=
= 2
= 2
− 2
i.
2
2
a + ib
(a + ib)(a − ib)
a +b
a +b
a + b2
Solange es nur um die Grundrechenarten geht, können wir uns bei den komplexen
Zahlen also auf die Menge
C = {a + ib|a, b ∈ R}
9-9
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
beschränken. Addition und Multiplikation dieser Zahlen sind dann durch die Formeln
(a1 + ib1 ) + (a2 + ib2 ) = (a1 + a2 ) + i(b1 + b2 ),
(a1 + ib1 ) · (a2 + ib2 ) = a1 a2 + ia1 b2 + ib1 a2 + i2 b1 b2
= (a1 a2 − b1 b2 ) + i(a1 b2 + b1 a2 )
für alle a1 , a2 , b1 , b2 ∈ R gegeben. Auch kompliziertere Rechenoperationen
√ sind in C
leicht möglich, als ein Beispiel √hierfür wollen wir einmal die Wurzel i berechnen.
Hierzu machen wir den Ansatz i = a + ib. Dass a + ib die Wurzel aus i ist, bedeutet
das das Quadrat von a + ib gleich i sein muss, also
!
(a + ib)2 = a2 − b2 + 2abi = i, also a2 − b2 = 0 und 2ab = 1.
Die Bedingung a2 = b2 bedeutet b = ±a, und eingesetzt in die zweite Bedingung
erhalten wir ±2a2 = 1. Also ist nur das Pluszeichen möglich, d.h. b = a, und wir
brauchen a2 = 1/2, und somit
r
√
1
1√
1√
1√
a=b=
2 =⇒ i = ±
2+
2i .
=
2
2
2
2
Wir kommen jetzt zur formalen Definition der
komplexen Zahlen. Diese wird die komplexen Zahlen nicht nur auf eine sichere Grundlage stellen,
sondern auch ein geometrisches Verständnis der
komplexen Zahlen ermöglichen. Wir werden zum
Beispiel sehen das das Ziehen komplexer Wurzeln y=1
nicht nur möglich sondern auch vergleichsweise einfach ist. Die Grundidee ist es die komplexe Zahl
z = a + ib als den Punkt (a, b) ∈ R2 der Ebene zu
interpretieren
C = R2 , a + ib = (a, b).
z=(2, 1)=2+i
x=2
Als Punktmenge definieren wir also C := R2 . In diesem Zusammenhang nennt man die
Ebene R2 manchmal auch die Gaußsche Zahlenebene“. Damit lassen sich geometrische
”
Begriffe auf die komplexen Zahlen anwenden, wir können beispielsweise die Länge |z|
eine komplexen Zahl z = a + ib als ihren Abstand zum Nullpunkt definieren, und nach
dem Satz des Phythagoras ist dann explizit
√
|z| = a2 + b2 .
9-10