Dienstag 15.5.2012

Werbung
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
$Id: korper.tex,v 1.19 2012/05/18 03:54:21 hk Exp $
§4
Körper
4.2
Der Körper der reellen Zahlen
In der letzten Sitzung hatten wir mit der Untersuchung angeordneter Körper begonnen. Insbesondere hatten wir obere und unterer Schranken von Teilmengen eines solchen Körpers K definiert, dies waren gerade Elemente des Körpers die größer-gleich
beziehungsweise kleiner-gleich als jedes Element der Teilmenge waren. Diese Schranken waren recht willkürlich ist a eine obere Schranke so ist auch jedes b ≥ a ebenfalls
ein obere Schranke. Von besonderen Interesse sind natürlich die besten“ oberen und
”
unteren Schranken, also die kleinste obere Schranke beziehungsweise die größte untere
Schranke. Diese Objekte stellen sich als wichtig heraus, und erhalten daher zunächst
einen eigenen Namen.
Sei also ein angeordneter Körper K gegeben. Sei A ⊆ K. Eine obere Schranke M
von A heißt Supremum von A, wenn sie die kleinste obere Schranke von A in K ist, es
soll also M ≤ M 0 für jede obere Schranke M 0 von A in K gelten. Man schreibt dann
M = sup A. Entsprechend heißt eine untere Schranke m von A das Infimum von A,
wenn sie die größte untere Schranke von A in K ist, wenn also m ≥ m0 für jede untere
Schranke m0 von A in K gilt. Man schreibt dann m = inf A.
Da all dies schon im letzten Semester dran war, wollen wir hier nur kurz einige
kleine Beispiele angeben. Wir werden den Begriff später noch einmal etwas genauer
wiederholen, sobald wir ihn etwas intensiver benutzen wollen.
Wir gehen jetzt einige Beispiele im angeordneten Körper K = Q durch.
1. Die Menge Q+ := {x ∈ Q|x > 0}, also der Positivbereich, ist nach unten aber
nicht nach oben beschränkt. Die unteren Schranken von Q+ sind genau die m ∈ Q
mit m ≤ 0, und die größte unter ihnen ist m = 0. Damit ist inf Q+ = 0 das
Infimum. Ein Supremum gibt es nicht, da es ja überhaupt keine oberen Schranken
gibt, also erst recht keine kleinste obere Schranke.
2. Die Menge Z der ganzen Zahlen ist in Q weder nach oben noch nach unten
beschränkt, sie hat also insbesondere auch weder Infimum noch Supremum.
3. Die Menge A := {x ∈ Q|1 < x < 2} ist nach oben und nach unten beschränkt,
etwa durch die untere Schranke m = 1 und die obere Schranke M = 2. Diese sind
offenbar auch Infimum und Supremum, also inf A = 1, sup A = 2.
4. Die Menge A := {x ∈ Q|x2 < 2} ist nach oben und unten beschränkt. Beispiels9-1
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
weise gilt für jedes x ∈ A stets x2 < 2 < 4 = 22 also auch
(x − 2) · (x + 2) = (x2 − 4) < 0,
also haben x − 2 und x + 2 verschiedenes Vorzeichen und wegen x − 2 < x + 2
bedeutet dies x − 2 < 0 < x + 2, d.h. −2 < x < 2. Diese Schranken sind aber
kein Supremum beziehungsweise Infimum, beispielsweise ist 3/2 eine kleine obere
Schranke. Tatsächlich hat A in Q weder Supremum noch Infimum. Dies wollen
wir hier nicht exakt beweisen, intuitiv ist Ihnen
hoffentlich klar was passiert,
√
Supremum beziehungsweise Infimum wären ± 2, aber diese sind keine rationalen
Zahlen.
Im Fall der rationalen Zahlen kann es also passieren, dass nach oben beschränkte
√ Mengen überhaupt keine kleinste obere Schranke besitzen, weil diese wie etwa 2 in Q
einfach fehlt. In den reellen Zahlen wird dieser Effekt nicht auftreten, und wir führen
zunächst einmal einen Namen für diese Eigenschaft der reellen Zahlen ein.
Definition 4.14: Ein angeordneter Körper heißt vollständig, wenn in ihm jede nicht
leere, nach oben beschränkte Menge ein Supremum besitzt.
Die Asymmetrie zwischen Supremum und Infimum in dieser Definition ist nur scheinbar, in einem vollständig angeordneten Körper K hat auch jede nicht leere, nach unten
beschränkte Menge A ⊆ K ein Infimum. Wir können nämlich zu A die Menge
B := {b ∈ K|b ist eine untere Schranke von A}
der unteren Schranken von A betrachten. Da A nach unten beschränkt ist, gibt es
überhaupt eine untere Schranke von A und damit ist B 6= ∅. Ist a ∈ A, so gilt x ≤ a
für jede untere Schranke x von A, d.h. für jedes x ∈ B. Damit ist jedes Element von A
eine obere Schranke von B, und wegen A 6= ∅ ist B insbesondere nach oben beschränkt.
Die Vollständigkeit von K liefert die Existenz des Supremums
s := sup B ∈ K,
und wir behaupten das s zugleich das Infimum von A ist. Ist a ∈ A so haben wir schon
festgehalten, dass a eine obere Schranke von B ist und da s die kleinste obere Schranke
von B ist, ist somit s ≤ a. Folglich ist s zumindest eine untere Schranke von A. Ist jetzt
t ∈ K eine beliebige untere Schranke von A, so ist t ∈ B da B ja gerade die Menge
der unteren Schranken von A war, und insbesondere ist t ≤ s. Damit ist s die größte
untere Schranke von A, d.h. das Infimum von A.
Damit ist die Symmetrie zwischen Supremum und Infimum wieder hergestellt. Wie
das letzte der obigen Beispiele zeigt, sind die rationalen Zahlen Q zwar angeordnet,
aber nicht vollständig angeordnet. Die reellen Zahlen sind dagegen vollständig angeordnet. Streng genommen beweist man die Existenz und Eindeutigkeit eines vollständig
angeordneten Körpers und definiert die reellen Zahlen dann als diesen Körper.
9-2
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
Satz 4.15 (Existenz und Eindeutigkeit der reellen Zahlen)
Es gibt bis auf Isomorphie genau einen angeordneten vollständigen Körper. Dieser wird
als der Körper R der reellen Zahlen bezeichnet.
Da dies etwas aufwändig ist, wollen wir diesen Satz hier nicht beweisen. Die Eindeutigkeit ist in Wahrheit kein großes Problem, und kann recht schnell basierend auf Lemma
12 bewiesen werden. Die Existenz wird durch explizite Konstruktion eines vollständig
angeordneten Körpers hergeleitet. Hierfür gibt es (mindestens) vier verschiedene, übliche Konstruktionsmethoden, aber in jeder dieser vier Methoden ist einiges an Details
abzuarbeiten.
Die reellen Zahlen sind eine Obermenge der rationalen Zahlen, was wir sowieso
nach Lemma 12 wissen, aber sehr viel größer als die rationalen Zahlen. Reelle Zahlen
lassen sich in Form von unendlichen Dezimalbrüchen darstellen. Tatsächlich ist dies der
Ansatzpunkt für eine der vier Konstruktionsmethoden. Wir werden uns im nächsten
Abschnitt kurz und vereinfachend mit der Darstellung reeller Zahlen im Computer
beschäftigen, die dann über gewisse Zifferndarstellungen“ erfolgt. Zuvor wollen wir
”
aber noch ein wichtiges Lemma beweisen, das sich in späteren Kapiteln als grundlegend
herausstellen wird.
Lemma 4.16 (Archimedische Eigenschaft von R)
Zu jedem x ∈ R mit x > 0 gibt es ein n ∈ N∗ mit 0 <
1
n
< x.
Beweis: Zunächst gilt für jedes n ∈ N∗ natürlich 1/n > 0, wir müssen uns also nur um
1/n < x kümmern. Angenommen es gäbe kein solches n ∈ N∗ , d.h. für jedes n ∈ N∗
gilt
1
1
≥ x, und somit n ≤ .
n
x
Dann ist 1/x eine obere Schranke von N∗ und N∗ ist in R nach oben beschränkt. Die
Vollständigkeit der reellen Zahlen ergibt die Existenz des Supremums s := sup N∗ .
Dann ist aber s − 1 ∈ R eine reelle Zahl mit s − 1 < s, und da s die kleinste obere
Schranke von N∗ ist, kann s − 1 keine obere Schranke von N∗ sein. Dies bedeutet das
es ein n ∈ N∗ mit s − 1 < n gibt. Dann ist aber auch n + 1 ∈ N∗ und mit Lemma
10.(c) folgt s = (s − 1) + 1 < n + 1. Andererseits ist s eine obere Schranke von N∗ , wir
müssen also auch n + 1 ≤ s haben, und dies ist ein Widerspruch. Dieser Widerspruch
beweist, dass es ein n ∈ N∗ mit 1/n < x geben muss.
4.2.1
Darstellung reeller Zahlen
Wir kommen nun kurz zur Darstellung reeller Zahlen im Computer. Hier gibt es zwei
übliche Methoden. Das erste ist die sogenannte Fixpunktarithmetik, hier verwendet
man Dezimalzahlen deren Nachkommastellen auf eine fest vorgegebene Stellenzahl begrenzt sind. Alle über diese Grenze hinausgehenden Dezimalziffern werden abgeschnitten, eventuell mit Rundung durch Modifikation der letzten gültigen Nachkommastelle.
9-3
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
Ein Vorteil dieses Verfahrens ist, dass man so mit ganzen Zahlen auskommt. Wollen
wir beispielsweise e = 3 Nachkommastellen haben, so können wir einfach ganze Zahlen
benutzen deren Wert als Tausendstel interpretiert wird, die Zahl 1.217 wird dann zu
1217 Tausendsteln. Es gibt einige Situationen in denen einem diese Art der Arithmetik
begegnen kann:
1. Bei diversen mit dem Geldverkehr befassten Anwendungen gibt es ziemlich genaue gesetzliche Vorgaben mit wievielen Nachkommastellen gerechnet werden
muss, wie die Rundung durchgeführt werden muss und so weiter. Hier ist man
oft praktisch gezwungen mit der einen oder anderen Form von Fixpunktarithmetik zu rechnen.
2. Bei einigen graphischen Anwendungen ist durch die Existenz von Pixeln von vornherein eine kleinstmögliche sichtbare Größe gegeben. Trotzdem kann es praktisch
sein die Bildschirmkoordinaten nicht als Pixelanzahlen zu beschreiben sondern
in realen Einheiten“, etwa in Millimetern. Die wirklich verschiedenen Koordi”
natengrößen unterscheiden sich dann in Vielfachen der Pixelgröße, was man als
Anlass zur Verwendung einer Fixpunktarithmetik nehmen kann.
3. Manchmal wird Fixpunktarithmetik verwendet um von den Details der Fließpunktrechnung unabhängig zu sein. Beispielsweise verwendet die Originalimplementation von TEX eine Fixpunktarithmetik. Diese wurde zu einer Zeit erstellt
als es noch eine wesentlich größere Prozessorvielfalt als heute gab, und die Implementierung der Fließpunktarithmetik auf verschiedenen Prozessoren konnte
sich in diversen Details unterscheiden. Um unabhängig vom verwendeten Rechner immer dieselbe Ausgabe zu erhalten, hat TEX daher seine eigene Arithmetik
implementiert. Dies ist aktuell kein großes Problem mehr, da es für die Implementierung von Fließpunktzahlen inzwischen allgemein befolgte Standards gibt.
Die praktisch wichtigere Zahldarstellung ist die schon erwähnte Darstellung reeller
Zahlen als Fließpunktzahlen, oder Fließkommazahlen wenn Ihnen der Name lieber ist.
Die Grundidee ist es Größenordnung und Genauigkeit etwas zu entkoppeln und reelle
Zahlen in der Form x = m·10k zu schreiben. Die sogenannte Mantisse m“ ist dabei für
”
die Genauigkeit und der Exponent k“ für die Größenordnung zuständig. Eine derartige
”
Darstellung ist natürlich nicht eindeutig, durch Änderung des Exponenten verschiebt
sich der Dezimalpunkt in der Mantisse
178.5308 · 101 = 17.85308 · 102 = 1785.308 · 100 = 17853.08 · 10−1 .
Dieses Verschieben des Dezimalpunktes gibt der Fließpunktarithmetik ihren Namen.
Um die Darstellung eindeutig zu machen, legt man sich jetzt auf die sogenannten
normalisierten Fließpunktzahlen fest, bei denen die Mantisse die Form m = ±0.X... hat,
wobei die erste Nachkommastelle X“ nicht Null ist. Für die reelle Zahl x = 0 ist eine
”
solche Darstellung nicht möglich, und die Null wird daher als ein Sonderfall behandelt.
Zur Addition normalisierter Fließpunktzahlen müssen die beiden Zahlen erst durch
9-4
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
Verschieben des Dezimalpunktes auf dieselbe Größenordnung gebracht werden, dann
können die Mantissen addiert werden und anschließend muss das Ergebnis eventuell
noch normalisiert werden. Als ein Beispiel zur Addition wollen wir einmal
0.34127 · 1019 + 0.41578 · 1021 = 0.0034127 · 1021 + 0.41578 · 1021
= (0.0034127 + 0.41578) · 1021 = 0.4191927 · 1021
rechnen. Entsprechend wird auch die Subtraktion gehandhabt. Bei einer vollständigen
Implementierung der Fließpunktaddition müssen auch noch die Vorzeichen berücksichtigt werden, so das Addition bei verschiedenen Vorzeichen in Wahrheit eine Subtraktion
ist. Multiplikation ist etwas einfacher da m1 10e1 · m2 10e2 = m1 m2 10e1 +e2 ist, man muss
also nur die Mantissen multiplizieren, die Exponenten addieren und anschließend das
Ergebnis normalisieren. Die Behandlung des Vorzeichens kann dann gesondert erfolgen.
Entsprechend sieht die Division aus, hier haben wir m1 10e1 /m2 10e2 = (m1 /m2 )·10e1 −e2 .
In einer realen Implementierung stehen für Mantisse und Exponent nur eine begrenzte, fest vorgegebene Zahl an Dezimalstellen zur Verfügung. Es bezeichne t die
Anzahl der Mantissenstellen und e die Exponentenstellen. Bei Addition und Multiplikation gehen einige Stellen mangels Platz verloren. Wir verwenden hier eine vereinfachte
Version der Fließpunktarithmetik und schneiden nicht mehr darstellbare Ziffern einfach
ab. Die wirklich verwendeten Implementationen sind etwas komplizierter, da anstelle
des einfachen Abschneidens von Stellen noch geeignete Rundungen durchgeführt werden. Rechnen wir etwa unser obiges Beispiel noch einmal mit t = 5 Mantissenstellen
und e = 3 Exponentenstellen. Bei der Angleichung der Exponenten verschwinden dann
Dezimalstellen durch 0.34127 · 1019 = 0.00341 · 1021 , wobei man das Gleichheitszeichen
hier nicht so wörtlich nehmen darf. Diesmal ergibt sich
0.34127 · 1019 + 0.41578 · 1021 = 0.00341 · 1021 + 0.41578 · 1021
= (0.0034127 + 0.41578) · 1021 = 0.41919 · 1021 .
Wir wollen noch ein zweites Beispiel betrachten bei dem eine anschließende Normalisierung nötig wird
0.99994·103 +0.70000·10−1 = 0.99994·103 +0.00007·103 = 1.00001·103 = 0.10000·104 .
Im Prinzip könnte diese Normalisierung zu einem Überlauf im Exponenten führen,
aber solche Möglichkeiten wollen wir hier ignorieren. Multiplikation und Division sind
dann etwas komplizierter, und hier gibt es auch verschiedene Varianten wie diese mit
begrenzter Mantissenlänge implementiert werden müssen. Ein Unterschied liegt darin ob Zwischenergebnisse immer mit der fixierten Mantissenlänge gerechnet werden
müssen, oder ob für diese auch größere Zahlen erlaubt sind, typischerweise die doppelte Stellenzahl. In realen Rechnern ist die Wahl der Methode inzwischen, wie schon
bemerkt, standardisiert, hier wollen wir uns ruhig beide Möglichkeiten offenhalten. Als
ein Beispiel wollen wir einmal mit der Mantissenlänge t = 4 das Produkt
0, 7189 100 · 0, 1700 · 101
9-5
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
rechnen. Führen wir die übliche schriftliche Multiplikation aus, so wird 0, 7189 100 ·
0, 1700 101 = 7189 · 17 10−5 und
7189 · 1700
7189
+50323
122213
das normalisierte Ergebnis ist also
0, 7189 100 · 0, 1700 · 101 =“ 0.1222 · 101 .
”
Die Verschiebung in den Vorkommabereich haben wir dabei nur der Übersichtlichkeit
halber durchgeführt. Hier haben wir mit Zwischenergebnissen gerechnet die länger
als die Mantissenlänge t = 4 waren, dies hat hier allerdings auf das Ergebnis keinen
Einfluss. Wir wollen uns auch noch ein Beispiel anschauen, bei dem tatsächlich ein
Unterschied auftritt, nämlich 0, 9999 · 0, 9999 beide mit Exponent 0, und wieder in
Mantissenlänge t = 4. Wir zeigen die Rechnung links mit erweiterter Mantisse und
rechts mit sofortigen Streichen überzähliger Dezimalstellen
9999 · 9999 · 10−8
89991
+ 89991
+ 89991
+ 89991
99980001 · 10−8 =“ 0.9998
”
9999 · 9999
8999
+ 899
+ 89
+ 8
9995 · 10−4 =“ 0.9995
”
Hier tritt also tatsächlich ein Unterschied in der letzten Dezimalstelle auf. Wir wollen
auch noch ein Beispiel einer Division vorführen, und hier nehmen wir
0.1214 · 102 : 0.7189 · 101 =
1234
· 101 .
7189
Wir rechnen wieder mit der Mantissenlänge t = 4, und betrachten zwei mögliche Varianten. Links erlauben wir für Zwischenergebnisse eine zusätzliche Stelle in der Mantisse,
und rechts bleiben wir strikt bei t = 4 Dezimalstellen.
1214 : 7189 = 0.1688
− 7189
4951
− 43134
6366
− 57512
6148
− 57512
3968
496
· 10−1 = 1 · 10−1 + 718
· 10−1
=“1 · 10 + 496
· 10−2
71
”
= 1 · 10−1 + 6 · 10−2 + 70
· 10−2
71
=“1 · 10−1 + 6 · 10−2 + 70
· 10−3 = 0.17,
7
”
1214
=“ 1214
7189 ”
718
−1
9-6
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
links haben wir also das Ergebnis 0.1688 · 101 und rechts die deutlich schlechtere Näherung 0.1700 · 101 .
In realen Computern wird normalerweise eine binäre Fließpunktarithmetik anstelle
der bisher behandelten dezimalen Arithmetik benutzt. Dies ist aber inhaltlich kein
wesentlicher Unterschied. Weiter werden diverse spezielle Zahlen“ unterstützt also
”
Werte für unendlich kleine und unendlich große Zahlen, ungültige Zahlen“ die als
”
Ergebnisse bei Rechenfehlern verwendet werden, es gibt sogar verschiedene Werte für
eine positive und eine negative Null, und so weiter. Derartige Details wollen wir hier
nicht behandeln.
Es gibt zwei standardisierte Größen für binäre Fließpunktzahlen. Dies sind zum
einen die 32-Bit Zahlen, typischerweise der Datentyp float in C.
float
±
Mantisse, t = 24 Bits
Exponent, e = 8 Bits
Das Vorzeichen nimmt dabei ein Bit in Anspruch. Im Exponenten wird kein Vorzeichen
verwendet, anstelle dessen werden negative Werte durch einen Offset realisiert. Bei e =
8 Bits haben wir 28 = 256 verschiedene Werte, und hierfür nimmt man die Zahlen von
−128 bis 127. Gespeichert werden diese mit dem Offset 27 = 128, d.h. der gespeicherte
Wert n meint n − 128 als Exponent. Wenn Sie oben mitgezählt haben benötigen wir t +
e = 32 Bits plus ein Vorzeichenbit und dies scheint eines zuviel zu sein. Das ist aber nur
eine Täuschung. Gespeichert werden ja normalisierte Fließpunktzahlen, also mit erster
Nachkommastelle ungleich Null. Im Binärsystem ist die erste Nachkommastelle einer
normalisierten Fließpunktzahl damit immer gleich Eins, und diese sowieso festgelegte
Eins wird einfach nicht mitgespeichert. Von den t = 24 Mantissenbits werden also nur
die hinteren 23 wirklich im Speicher abgelegt, und damit kommt man auf insgesamt 32
Bits für einen float Wert.
Die zweite Standardgröße sind 64 Bit große Fließpunktzahlen, typischerweise der
Datentyp double in C. Hier hat man
double
±
Mantisse, t = 53 Bits
Exponent, e = 11 Bits
Das oben für float gesagte trifft entsprechend auch auf double zu. Man mag sich
fragen warum die Mantisse so viel großzügiger bedacht wird als der Exponent, aber
dies hat gute Gründe. Zu große oder zu kleine Werte im Exponenten kann man in
der Regel vermeiden indem das Ausgangsproblem vorher passend skaliert wird, beispielsweise durch Wahl geeigneter Einheiten oder durch Übergang zu Logarithmen
und ähnlichen. Dies funktioniert nur nicht wenn zugleich Werte von sich stark unterscheidenden Größenordnungen auftreten, was glücklicherweise nicht so oft passiert.
Ungenaues Rechnen in der Mantisse kann man dagegen durch nichts ausgleichen. Spezielle Prozessoren bieten oft auch noch diverse andere Fließpunkttypen an, aber so
etwas soll hier nicht mehr besprochen werden.
4.3
Der Körper der komplexen Zahlen
Nachdem wir uns im letzten Teilabschnitt die reellen Zahlen ein wenig angeschaut
haben, kommen wir nun zum letzten der grundlegenden Zahlbereiche, den sogenannten
9-7
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
komplexen Zahlen. Wir beginnen mit einer eher operativen Einführung der komplexen
Zahlen bevor wir dann zu einer exakten Definition kommen. Das Ausgangsproblem zu
dessen Lösung die komplexen Zahlen ursprünglich eingeführt wurden ist die Lösung
der Gleichung dritten Grades
x3 + ax2 + bx + c = 0 (a, b, c ∈ R).
Analog zur quadratischen Ergänzung bei der quadratischen Gleichung kann man den
zweithöchsten Term zum Verschwinden bringen, hier durch die Ersetzung von x durch
x − a/3, und erhält die Normalform der Gleichung dritten Grades
x3 + px + q = 0 (p, q ∈ R).
Für diese Gleichung gibt es jetzt, entsprechend zur pq-Formel bei der quadratischen
Gleichung, eine explizite Lösungsformel, die sogenannte Formel von Cardano. Die volle Cardano-Formel beschreibt alle drei Lösungen unserer Gleichung, aber für unsere
Zwecke reicht es die erste, und auch einfachste, dieser drei Lösungen hinzuschreiben.
Diese Lösung ist gegeben als
√
3
p
D
2p
x=
−√
mit
D
:=
−108q
+
12
12p3 + 81q 2 .
3
6
D
Wir wollen uns als ein konkretes Beispiel einmal den Beginn der Rechnung für die
Gleichung
20
7
x3 − x +
=0
3
27
anschauen. Hier ist p = −7/3 und q = 20/27. Damit wird
12p3 + 81q 2 = −108 = −36 · 3,
also
√
√
D = −80 + 12 −108 = −80 + 72 −3.
Das scheint also gar nicht zu funktionieren, eine Wurzel aus −3 gibt es nun einmal
nicht. Der Trick an der Cardano-Formel ist es dieses Detail zu ignorieren, und einfach
weiter zu rechnen. Der weitere Verlauf spielt für uns keine Rolle und soll hier nicht
vorgeführt werden. Als Endergebnis ergibt sich x = 1/3, und dies ist tatsächlich eine
Lösung unserer Gleichung dritten Grades. Wir haben hier also mit der rein reellen
Gleichung
7
20
x3 − x +
=0
3
27
begonnen, √
und sind bei der reellen Lösung x = 1/3 gelandet. Nur zwischendurch ist so
etwas wie −3 in der Rechnung aufgetaucht, ist aber am Ende wieder verschwunden.
Man bezeichnet den Zahlbereich der durch Erweiterung von R um Wurzeln negativer
Zahlen entsteht als die komplexen Zahlen. Im Kontext der Cardano-Formel spielt es keinerlei Rolle ob die komplexen Zahlen logisch überhaupt stichhaltig sind, am Ende kann
9-8
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
man ja einfach nachschauen ob die erhaltene reelle Zahl tatsächlich eine Lösung ist.
Hier sind die komplexen Zahlen also nur ein obskurer Rechentrick, sie tauchen zwischendurch geisterhaft auf und verschwinden am Ende wieder. Aus dieser Zeit stammt auch
die Redeweise von den Wurzeln negativer Zahlen als den sogenannten imaginären Zahlen, denn als reiner Rechentrick betrachtet haben die komplexen Zahlen ja tatsächlich
etwas imaginäres“.
”
Bevor wir zu einer formalen Definition kommen, wollen wir erst einmal noch etwas
auf der vagen Basis komplexe Zahlen = Reelle Zahlen + Wurzeln negativer Zahlen“
”
weiterrechnen. Zunächst beachte das wir gar nicht die Wurzeln aller negativen Zahlen
hinzunehmen müssen, es reichht völlig eine Wurzel aus −1 zu haben. Denn dann können
wir beispielsweise auch
p
√
√
√
−3 = (−1) · 3 = −1 · 3
√
rechnen. Man nennt√i := −1 daher die imaginäre Einheit“. Alleine mit dem Hin”
zunehmen von i = −1 ist es aber nicht getan, es muss ja auch Zahlen wie 2 + i,
1/(3 + 2i) und so weiter geben. Wir wollen uns klarmachen das man mit komplexen
Zahlen der Form a + ib mit a, b ∈ R auskommt. Schauen wir uns zunächst einmal die
Potenzen der imaginären Einheit i an
i2 = −1, i3 = i2 · i = −i, i4 = (i2 )2 = (−1)2 = 1, i5 = i4 · i = 1 · i, . . .
Wegen i4 = 1 wiederholen sich die Potenzen von i jetzt im Viererrythmus. Ein allgemeiner polynomialer Ausdruck in i mit reellen Koeffizienten wird also zu
a0 + a1 i + a2 i2 + a3 i3 + a4 i4 + a5 i5 + · · · = a0 + a1 i − a2 − a3 i + a4 + a5 i + · · ·
= (a0 − a2 + a4 − · · · ) + (a1 − a3 + a5 − · · · )i,
diese Ausdrücke haben also immer die Form a + ib. Wie sieht es jetzt mit Quotienten
aus? Dabei ist 1/i leicht zu sehen, es ist ja
i · (−i) = −i2 = 1 =⇒
1
= −i,
i
aber schon so etwas wie 1/(1 + i) ist nicht so
√ einfach. Hier führt aber derselbe Trick
wie bei der obigen Umformung von 1/(1 − 3 3 i) zum Ziel, es ist
1
1−i
1−i
1−i
1 1
=
=
=
= − i.
2
1+i
(1 + i) · (1 − i)
1−i
2
2 2
Dieselbe Rechung funktioniert auch im allgemeinen Fall, sind a, b ∈ R mit a + ib 6= 0,
also (a, b) 6= (0, 0), so ist
1
a − ib
a − ib
a
b
=
= 2
= 2
− 2
i.
2
2
a + ib
(a + ib)(a − ib)
a +b
a +b
a + b2
Solange es nur um die Grundrechenarten geht, können wir uns bei den komplexen
Zahlen also auf die Menge
C = {a + ib|a, b ∈ R}
9-9
Mathematik für Informatiker B, SS 2012
Dienstag 15.5
beschränken. Addition und Multiplikation dieser Zahlen sind dann durch die Formeln
(a1 + ib1 ) + (a2 + ib2 ) = (a1 + a2 ) + i(b1 + b2 ),
(a1 + ib1 ) · (a2 + ib2 ) = a1 a2 + ia1 b2 + ib1 a2 + i2 b1 b2
= (a1 a2 − b1 b2 ) + i(a1 b2 + b1 a2 )
für alle a1 , a2 , b1 , b2 ∈ R gegeben. Auch kompliziertere Rechenoperationen
√ sind in C
leicht möglich, als ein Beispiel √hierfür wollen wir einmal die Wurzel i berechnen.
Hierzu machen wir den Ansatz i = a + ib. Dass a + ib die Wurzel aus i ist, bedeutet
das das Quadrat von a + ib gleich i sein muss, also
!
(a + ib)2 = a2 − b2 + 2abi = i, also a2 − b2 = 0 und 2ab = 1.
Die Bedingung a2 = b2 bedeutet b = ±a, und eingesetzt in die zweite Bedingung
erhalten wir ±2a2 = 1. Also ist nur das Pluszeichen möglich, d.h. b = a, und wir
brauchen a2 = 1/2, und somit
r
√
1
1√
1√
1√
a=b=
2 =⇒ i = ±
2+
2i .
=
2
2
2
2
Wir kommen jetzt zur formalen Definition der
komplexen Zahlen. Diese wird die komplexen Zahlen nicht nur auf eine sichere Grundlage stellen,
sondern auch ein geometrisches Verständnis der
komplexen Zahlen ermöglichen. Wir werden zum
Beispiel sehen das das Ziehen komplexer Wurzeln y=1
nicht nur möglich sondern auch vergleichsweise einfach ist. Die Grundidee ist es die komplexe Zahl
z = a + ib als den Punkt (a, b) ∈ R2 der Ebene zu
interpretieren
C = R2 , a + ib = (a, b).
z=(2, 1)=2+i
x=2
Als Punktmenge definieren wir also C := R2 . In diesem Zusammenhang nennt man die
Ebene R2 manchmal auch die Gaußsche Zahlenebene“. Damit lassen sich geometrische
”
Begriffe auf die komplexen Zahlen anwenden, wir können beispielsweise die Länge |z|
eine komplexen Zahl z = a + ib als ihren Abstand zum Nullpunkt definieren, und nach
dem Satz des Phythagoras ist dann explizit
√
|z| = a2 + b2 .
9-10
Herunterladen