Kapitel 0 Einführung in die Lineare Algebra und die mathematische

Kapitel 0
Einführung in die Lineare
Algebra und die mathematische
Sprache
Zum Einstieg gehen wir dieser Ausgangsfrage nach:
Welche Lösungen hat das folgende lineare Gleichungssystem?
(∗)
2x1 +
−x1 +
x1
2x1 +
x2
x2 +
+
2x2 +
−2x2 −
6x3
3x3
9x3
3x3
−
−
+
−
+
3x4
2x4
2x4
3x4
7x4
= −1
= 3
= 6
= 8
= 4
Wir betrachten einige mögliche Antwortreaktionen auf diese Frage:
1. Antwortversuch: Das System hat mehr Gleichungen als Unbekannte, ist
”
daher überbestimmt und besitzt keine Lösung.“
Ist das korrekt?
Zwar werden wir nach einiger Zeit feststellen, daß ein solcher Begriff des
Überbestimmt-Seins“, der sich auf den Vergleich der Anzahlen der Glei”
chungen und der Unbekannten gründet, für die Frage nach Lösbarkeit bzw.
nach den Lösungen eines linearen Gleichungssystems vollständig untauglich
ist. Jedoch haben wir diese Einsichten hier noch nicht und lassen den 1. Antwortversuch zunächst in unentschieden-ratloser Offenheit stehen; allerdings
nicht lange: Betrachten wir einmal den
2. Antwortversuch: Durch x1 = 1, x2 = 0, x3 = 1, x4 = 1 ist eine Lösung
”
gegeben.“
1
Ist das korrekt?
In der Tat ist dies leicht zu überprüfen und als zutreffend einsehbar:
Beweis der Aussage: Es gilt
2·1 +
−1 +
1
2·1 +
0
0 +
+
2·0 +
−2 · 0 −
6·1
3·1
9·1
3·1
−
−
+
−
+
3·1
2·1
2·1
3·1
7·1
= −1
= 3
= 6
= 8
= 4
1
Der 2. Antwortversuch ist also eine wahre Aussage. Damit sieht man
aber unmittelbar, daß der oben noch offengelassene 1. Antwortversuch eine falsche Aussage ist: Wir haben gesehen, daß es eine Lösung des Gleichungssystems gibt, und daher ist die Behauptung falsch, daß es keine Lösung
besitze. Wir können damit auch festhalten:
Daß ein lineares Gleichungssystem mehr Gleichungen als Unbekannte hat,
bedeutet keineswegs, daß es unlösbar ist.
Wir betrachten noch weitere Reaktionen auf die Ausgangsfrage:
3. Antwortversuch: Durch x1 = − 34 , x2 = 53 , x3 = 0, x4 = 0 ist eine Lösung
”
gegeben.“
Ist das korrekt?
Zwar sind die ersten beiden Gleichungen des Gleichungssystems damit erfüllt,
die anderen drei jedoch nicht. Eine Lösung muß aber alle Gleichungen des
Gleichungssystems erfüllen. Also ist der 3. Antwortversuch eine falsche Aussage.
Wir führen eine Schreibweise für Lösungskandidaten“ des Gleichungssy”
stems ein. Prinzipiell liefert jede Liste von 4 Zahlen a1 , a2 , a3 , a4 einen
Kandidaten für eine Lösung: Man überprüft, ob nach Einsetzen von a1 für
x1 , a2 für x2 , a3 für x3 , a4 für x4 alle Gleichungen erfüllt sind. Die Reihenfolge, in der die Elemente ai dastehen, ist natürlich von großem Belang; denn
nur durch sie weiß man, welcher Wert für die jeweilige Unbekannte xj einzusetzen ist. Um eine Liste von Objekten (hier in unserem Beispiel: Zahlen)
anzugeben, deren Reihenfolge wichtig ist, benutzt man die sogenannte
Tupelschreibweise“: (a1 , a2 , a3 , a4 ) (im Falle von 4 Objekten in der Liste,
”
bei anderen Listenumfängen entsprechend).
1
Wir verwenden dieses Zeichen “ stets, um das Ende eines Beweises zu kennzeichnen.
”
Auf eine sehr lange Tradition kann statt dessen die zu diesem Zweck ebenfalls übliche
Abkürzung q.e.d.“ (für quod erat demonstrandum“, Lateinisch für was zu beweisen
”
”
”
war“) zurückblicken.
2
So ist etwa (1, 0, 1, 1) (s. 2. Antwortversuch) eine Lösung, dagegen (− 34 , 35 , 0, 0)
(s. 3. Antwortversuch) keine Lösung des linearen Gleichungssystems (∗).
Kann es außer (1, 0, 1, 1) weitere Lösungen geben? Unter Verwendung der
eben eingeführten Tupel-Schreibweise formulieren wir den
7
22
, 0) (anders geschrieben: ( 58 , −21
, 15
, 0)) ist
4. Antwortversuch: (1 35 , −4 15 , 1 15
5
”
eine Lösung“.
Einsetzen zeigt (prinzipiell wie beim Beweis der Aussage im 2. Antwortversuch, nur rechnerisch etwas unangenehmer), daß dies tatsächlich eine wahre
Aussage ist. D. h. das Gleichungssystem ist nicht nur lösbar, sondern hat
mindestens zwei verschiedene Lösungen!2
Der 2. und der 4. Antwortversuch enthalten damit zwar inhaltlich wahre Aussagen, beantworten die Ausgangsfrage aber jeweils beide nicht erschöpfend.
Natürlich ist darüber hinaus auch ganz und gar nicht sicher, ob es neben
den beiden angegebenen vielleicht nicht noch eine Vielzahl anderer gibt.3 Es
stellt sich so insgesamt das
Problem: Wie erhält man alle Lösungen des Gleichungssystems (∗) ?
Gesucht ist die Menge aller Lösungen. Die intuitive Vorstellung einer Menge
ist die einer Gesamtheit von Objekten“: Sozusagen durch einen Akt der
”
”
Zusammenfassung“ wird aus vorgegebenen Objekten ein neues Objekt geschaffen: die Menge, die sich aus den vorgegebenen Objekten konstituiert.
Die Beziehung zwischen einem von diesen, genannt x, und der vorerwähnten
Menge, genannt M, wird ausgedrückt durch die Schreibweise x ∈ M“, gele”
sen: x ist ein Element von M“. Man beachte, daß der Elementbegriff ein sog.
”
Relativbegriff ist, d. h. er ist nicht für sich allein, sondern nur mit Bezug auf
eine Menge sinnvoll. Es ist sinnlos, von einem Objekt auszusagen, es sei ein
”
Element“. Stets ist anzugeben, von welcher Menge das Objekt ein Element
ist. Zum Beispiel besteht die Menge der Lösungen unseres Gleichungssystems
aus Objekten, die wir in der Form (a1 , a2 , a3 , a4 ) schreiben, wobei die ai Zahlen sind. Nur, welche dieser Objekte tatsächlich Lösungen sind und welche
nicht, das ist gerade die Frage.
Beispiele
(1) Sei M die Menge unserer Ziffern. Die Elemente von M sind 0, 1, 2, 3, 4,
5, 6, 7, 8, 9.
2
Ein in Schulen häufig betrachteter Typus von linearen Gleichungssystemen ist stets
eindeutig lösbar, was aber nicht zu der sich möglicherweise unwillkürlich einstellenden
Fehlmeinung führen darf, daß dies generell so wäre. Das ist, wie unser Beispiel zeigt, ganz
und gar falsch.
3
Dies ist tatsächlich so, wie in der weiteren Folge erkannt werden wird.
3
(2) Sei M die Menge der (positiven) Teiler von 12. Die Elemente von M sind
1, 2, 3, 4, 6, 12.
(3) Sei M die Menge der ganzen Zahlen. (Die Standard-Bezeichnung für diese
Menge lautet: Z) Deren Elemente sind: . . . , −3, −2, −1, 0, 1, 2, . . .
Für diese Vorlesung gilt: Unter der Menge der natürlichen Zahlen verstehen
wir die Menge der Elemente 1, 2, 3, . . . (also die Menge der positiven ganzen
Zahlen). Die Standard-Bezeichnung für diese Menge in dieser Vorlesung lautet: N. 4
Ein weiterer wichtiger Zahlbereich ist der Bereich Q der rationalen Zahlen,
also der Zahlen, die sich als Bruch zweier ganzer Zahlen darstellen lassen.
Zur Angabe von Mengen bedarf es einer Schreibweise, aus der klar hervorgeht,
welche Objekte die Elemente der jeweils betrachteten Menge sind. Enthält
eine Menge M nur wenige Elemente a1 , . . . , ak , die man alle auflisten kann,
so kann man M in folgender Form angeben:
M = {a1 , . . . , ak }
Für die Angabe einer Menge ist die Verwendung der geschwungenen Klammern {“ , }“ das Erkennungsmerkmal. Z. B. gilt im Beispiel (1) : M =
”
”
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, im Beispiel (2) : M = {1, 2, 3, 4, 6, 12}. Bei der Auflistung der Elemente von M innerhalb der geschweiften Klammern (auch
Mengenklammern“ genannt) ist die Reihenfolge unwichtig und ein mehr”
faches Vorkommen eines Elementes von M in der Liste ist für die Bedeutung von M ebenfalls unwichtig. Bei der zuvor betrachteten Art der
Auflistung, die durch die Tupel-Schreibweise (siehe S. 2) bezeichnet wird, ist
dies ganz und gar anders. Zur Verdeutlichung stellen wir die Unterschiede an
einem einfachen Beispiel heraus:
(1, 2, 3, 1) =
6
(1, 2, 1, 3) =
6
(1, 2, 3),
{1, 2, 3, 1} = {1, 2, 1, 3} = {1, 2, 3}.
Will man zum Ausdruck bringen, daß eine Menge M nicht mehr und nicht
weniger als n Elemente besitzt (wo n eine natürliche Zahl ist), so benutzt man
4
In einer anderen, ebenfalls weit verbreiteten Tradition wird N für die Menge der nichtnegativen ganzen Zahlen geschrieben, also im (einzigen) Unterschied zu unserer Setzung
auch 0 als natürliche Zahl, mithin als Element von N aufgefaßt. Dieser Tradition folgen
wir in dieser Vorlesung jedoch nicht. Für uns gilt: 0 6∈ N. – Man mag schon dieser Stelle
entnehmen, daß Mathematiker bezüglich der Wahl ihrer Bezeichnungen und Schreibweisen frei sind: Eine Bezeichnung bzw. eine Schreibweise kann nicht richtig oder falsch sein,
sondern nur zweckmäßig oder unzweckmäßig, sprechend oder nichtssagend, natürlich oder
irreführend!
4
dafür die Sprechweise: M hat genau n Elemente“. Ohne das Wort genau“
”
”
hingegen entsteht in mathematischen Kontexten ein veränderter Sinn: M
”
hat n Elemente“ bedeutet dasselbe wie: M hat mindestens n Elemente“; es
”
können also genau n Elemente oder auch mehr sein. In der Umgangssprache
ist eine so präzise Festlegung nicht gegeben. Um zu sagen, daß M entweder
genau n oder weniger als n Elemente hat, verwendet man, wie in der Umgangssprache gewohnt, die Sprechweise: M hat höchstens n Elemente“.
”
Nur für Mengen mit wenigen Elementen ist die bisher betrachte Schreibweise, die eine konkrete Auflistung der Elemente bedeutet, tatsächlich möglich.
Ganz und gar ausgeschlossen ist sie jedenfalls, wenn die betrachtete Menge unendlich viele Elemente enthält. Daher bedarf es einer umfassenderen
Möglichkeit der Mengenangabe. Man knüpft die Zugehörigkeit eines Objektes a zu einer Menge M (also die Entscheidung über die Frage, ob a ∈ M“
”
gilt) an das Erfülltsein einer sog. definierenden Eigenschaft. Sei zum Beispiel
G die Menge aller geraden (ganzen) Zahlen. Dann können wir G beschreiben
durch
G = {a|a ∈ Z und 2 teilt a},
gelesen: G ist die Menge aller Objekte a, für die gilt: a ist eine ganze Zahl,
”
und 2 teilt a.“ Die definierende Eigenschaft besteht in diesem Fall aus zwei
durch und“ verbundene Bedingungen. Ebenso für die Menge U aller unge”
raden Zahlen:
U = {a|a ∈ Z und 2 teilt nicht a}.
Allgemein hat diese Art der Mengenbeschreibung die Form
M = {a|E(a)},
wobei E eine aus Bedingungen an ein (variables) Objekt bestehende Eigenschaft ist. Ist diese bei vorliegendem Objekt a erfüllt (d. h. die Aussage E(a)
ist wahr), so ist a ein Element von M. Ist sie nicht erfüllt (d. h. die Aussage
E(a) ist falsch), so ist a kein Element von M. Z. B. wurde zur Beschreibung der Menge U als definierende Eigenschaft, die für ein Objekt a über die
Zugehörigkeit zu U entscheidet, verwendet:
a ∈ Z und 2 teilt nicht a
Dabei bezeichnet a die Variable,
für die man ein zu testendes Objekt einzu√
setzen hat. Etwa für a = 2 ist E(a) falsch, da bereits die erste Bedingung
(Element von Z zu sein) nicht erfüllt ist. Auch für a = 6 ist E(a) falsch, da
zwar die erste Bedingung, nicht aber die zweite erfüllt ist: Es ist nicht wahr,
daß 2 die Zahl a nicht teilt. Für a = 7 dagegen ist E(a) wahr, da 7 sowohl
5
Element von Z ist als auch nicht durch 2 geteilt werden kann.
Sei nun L die Menge der Lösungen des linearen Gleichungssystems (∗). Wir
schreiben die Elemente von L in der Tupelschreibweise (a1 , a2 , a3 , a4 ), wobei
die ai Zahlen sind; aber durch welche Eigenschaft E wird aus der Gesamtheit
aller dieser Objekte gerade die gewünschte Menge L ausgesondert? Wählen
wir für E die Eigenschaft, daß bei Einsetzen der ai für die xi alle 5 Gleichungen von (∗) erfüllt sein müssen, so ist natürlich nichts gewonnen. Gesucht ist
dagegen eine Eigenschaft, die so formuliert ist, daß ihre Überprüfung direkt,
d. h. ohne das Involvieren von (∗) leicht möglich ist.
Die Idee, die wir dazu verfolgen werden, besteht hierin: Statt des Systems
(∗) betrachten wir ein etwas einfacheres, verändertes lineares Gleichungssystem, das aber dieselbe Lösungsmenge hat. Ein solcher Schritt, der von (∗)
zu einem einfacheren Gleichungssystem führt, wird dann so lange erneut angewandt, bis man schließlich zu einem Gleichungssystem gelangt ist, dessen
Lösungsmenge man ohne Rechnung ablesen kann. Wenn man weiß, daß die
Lösungsmengen aller nach und nach betrachteten Gleichungssysteme dieselben sind, hat man damit (∗) gelöst. Wir geben ein Gleichungssystem (∗∗)
an, das aus (∗) durch einen ersten Vereinfachungsschritt der oben gemeinten
Art entstanden ist:
2x1 +
(∗∗)
x1
2x1
x2
x2 +
+
+
2x2 +
−2x2 −
− 3x4
9x3
3x3 + 2x4
9x3 − 3x4
3x3 + 7x4
= −1
= 9
= 6
= 8
= 4
Nur die zweite der 5 Gleichungen ist gegenüber (∗) verändert, und zwar ist
sie additiv aus den Gleichungen 2 und 3 aus (∗) entstanden: Die Summe der
Terme auf der linken Seite der Gleichungen sowie die der Zahlen 3 und 6
auf der rechten Seite wurde gebildet. Sei L′ die Lösungsmenge von (∗∗). Wie
zeigt man, daß L = L′ gilt?
Wieder gibt die Frage Anlaß zu einem Exkurs von fundamentaler Bedeutung,
in dem es um die allgemeine Frage geht, wie man überhaupt Gleichheiten
von Mengen beweisen kann. Seien M, M ′ beliebige Mengen. Da diese jeweils
durch die ihnen zugehörigen Elemente gegeben sind, besagt die Gleichheit
M = M ′ offenbar, daß M und M ′ genau dieselben Elemente enthalten. Dies
aber bedeutet zweierlei:
(i) Jedes Element von M ist auch ein Element von M ′ ,
(ii) Jedes Element von M ′ ist auch ein Element von M.
6
Für das alleinige Erfüllt-Sein der Bedingung (i) schreiben wir in dieser Vorlesung5 : M ⊆ M ′ , gelesen: M ist eine Teilmenge von M ′ (entsprechend für
(ii): M ′ ⊆ M). Als Beispiele führen wir an:
N ⊆ Z,
{−1, 1} ⊆ Z,
Z ⊆ Z, aber {−1, 1} 6⊆ N,
wobei das Zeichen 6⊆“ – wie bereits die Notation nahelegt – bedeuten soll:
”
ist nicht Teilmenge von“, (auch: ist keine Teilmenge von“).6 Unter Ver”
”
wendung unseres Symbols für die Teilmengenbeziehung erhalten wir also aus
dem zuvor Gesagten das
Gleichheitskriterium M = M ′ bedeutet: M ⊆ M ′ und M ′ ⊆ M.
Damit zerfällt grundsätzlich der Beweis einer Gleichheit zweier gegebener
Mengen M, M ′ stets in zwei Teile: 1) Man zeigt: M ⊆ M ′ , 2) Man zeigt:
M ′ ⊆ M.
Gilt M ⊆ M ′ , aber M 6= M ′ , so schreiben wir in dieser Vorlesung dafür :
M ⊂ M ′ (gelesen: M ist eine echte Teilmenge von M ′“). Zum Beispiel gelten
”
die Aussagen
N ⊂ Z,
{−1, 1} ⊂ Z, aber Z 6⊂ Z,
{−1, 1} 6⊂ N,
wobei natürlich wieder ⊂
6 “ zur Negation verwandt wird.
”
Man beachte: Für jede Menge M ist die Aussage M ⊆ M wahr. Daß die
naiv erwartete Aussage M = M auch wahr ist und manchem natürlicher“
”
erscheinen mag, widerspricht dem in keiner Weise: Zu den Teilmengen von M
gehört eben auch M selbst. Dagegen ist bei dem für diese Vorlesung gültigen
Gebrauch der eingeführten Zeichen für jede Menge M die Aussage M ⊂ M
falsch, da eine echte Teilmenge von M kraft Definition von M verschieden
sein muß.
Weiter ist bei der Aussage M 6⊂ M ′ zu beachten, daß das Nichterfülltsein
der echten Teilmengenbeziehung ⊂“ zwei wesentlich verschiedene Gründe
”
haben kann: Zum Beispiel gilt Z 6⊂ Z, weil Z (zwar eine Teilmenge von Z,
aber) nicht von Z verschieden ist. Dagegen gilt {−1, 1} 6⊂ N, weil {−1, 1}
(zwar von N verschieden, aber) keine Teilmenge von N ist.7
Einer anderen Tradition nach wird dafür statt dessen M ⊂ M ′“ geschrieben; dies hat
”
jedoch bei uns eine andere Bedeutung, wie oben in Kürze ausgeführt wird.
6
Die Aussage: M ⊆ M ′ ist nicht erfüllt“ nennt man die Negation der Aussage M ⊆
”
”
′
M . In der Logik nennt man allgemein die Aussage, daß eine gegebene Aussage A nicht
erfüllt ist, die Negation der Aussage A. Letztere wird in Zeichen ausgedrückt durch ¬A“.
”
7
Sind A, B Aussagen, so wird in der Logik die Aussage, die das gleichzeitige Erfülltsein
von A und B ausdrückt, in der Form A ∧ B (gelesen: A und B“) notiert. Die Negation
”
”
5
7
Klar zu unterscheiden sind die Bedeutungen von ∈“ ( ist ein Element von“)
”
”
und ⊆“ ( ist eine Teilmenge von“): Zum Beispiel gelten die Aussagen
”
”
3 ∈ N,
{2, 3, 4} ⊆ N,
{3} ⊆ N, aber {3} 6∈ N,
3 6⊆ N,
wobei wieder analog zu dem vorher Gesagten mit 6∈“ bzw. 6⊆“ das negiert
”
”
wird, was ∈“ bzw. ⊆“ an dieser Stelle zum Ausdruck bringen würde. Ele”
”
mente einer Menge M sind die Objekte selbst, aus deren Gesamtheit sich M
konstituiert. Teilmengen von M dagegen sind Mengen, die man durch Zusammenfassung, durch eine Auswahl gewisser Elemente von M erhält.
Wir kehren nun zu der Betrachtung der Lösungsmengen L (von (∗)), L′ (von
(∗∗)) zurück und wollen mit Hilfe unseres Gleichheitskriteriums die Gleichheit L = L′ einsehen. Danach gibt es zwei Inklusionen zu beweisen:
1. Teil. Wir zeigen: L ⊆ L′ .
Wir müssen nachweisen, daß jedes Element von L auch ein Element von L′
ist. Sei also ein beliebiges Element von L gegeben. Wir wissen, daß wir dies
prinzipiell in der Form (a1 , a2 , a3 , a4 ) (wobei die ai Zahlen sind) annehmen
dürfen. Zu zeigen ist, daß (a1 , a2 , a3 , a4 ) jetzt auch eine Lösung von (∗∗) ist.
Daß zunächst die 1., 3., 4. und 5. Gleichung von (∗∗) erfüllt ist, ist klar, weil
diese Gleichungen genauso im System (∗) vorkommen.
Zu zeigen bleibt: (A) a2 + 9a3 = 9.
Es gilt nach Voraussetzung (da ja (a1 , a2 , a3 , a4 ) Lösung von (∗) ist und folglich insbesondere die 2. und 3. Gleichung in (∗) erfüllen muß):
−a1 + a2 + 6a3 − 2a4
a1
+ 3a3 + 2a4
= 3
= 6
Daraus folgt: (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6 = 9.
Andererseits gilt: (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = a2 + 9a3 .
Aus beidem zusammen folgt: a2 + 9a3 = 9. Also gilt (A), und damit ist der
1. Teil beendet.
Zwar gibt das Aufgeschriebene genau wieder, jedoch ist der wiederholte Zeilenbeginn mit dem langen Term (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 )
¬(A ∧ B) bedeutet daher, daß (wenigstens) eine der beiden Aussagen A, B nicht erfüllt
ist; dabei kann es sein, daß sogar beide nicht erfüllt sind. Mit anderen Worten, ¬(A ∧ B)
bedeutet dasselbe wie ¬A oder ¬B“, wobei oder“ in dem Sinne benutzt wird, daß sich
”
”
die beiden Alternativen nicht gegenseitig ausschließen. Dafür verwendet man in der Logik
die Schreibweise ¬A ∨ ¬B.
8
etwas umständlich. Wir können den gemachten Schluß in einer einzigen Zeile
zusammenfassen durch
a2 + 9a3 = (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6 = 9.
Daß wir in Wahrheit, ausgehend von der Summe der beiden geklammerten Terme, einmal nach rechts“, einmal nach links“ gerechnet haben, ist
”
”
für die Korrektheit des angegebenen Schlusses unerheblich: Die angegebenen
Gleichheiten sind wahre Aussagen, und das ist das einzig Entscheidende. Es
ist dagegen nicht für die Korrektheit des Beweises relevant, ob erkennbar ist,
wie man auf die Gleichungen gekommen ist. Es muß nur im Kontext das
Erfülltsein der Gleichung (für den Leser zumutbar) zu verifizieren sein; dies
war oben offensichtlich der Fall.8
2. Teil. Wir zeigen: L′ ⊆ L.
Sei jetzt (a1 , a2 , a3 , a4 ) ∈ L′ .9 Es gilt nach Voraussetzung (da ja (a1 , a2 , a3 , a4 )
Lösung von (∗∗) ist und folglich insbesondere die 2. und 3. Gleichung in (∗∗)
erfüllen muß):
−a1 + a2 + 6a3 − 2a4 = (a2 + 9a3 ) − (a1 + 3a3 + 2a4 ) = 9 − 6 = 3.
Vor.
Es folgt: (a1 , a2 , a3 , a4 ) ∈ L.
Natürlich enthält der Beweis des 2. Teils ähnlich ausführliche Überlegungen
8
Dennoch sei auf einen Unterschied in der Verwendung der Gleichheitszeichen hingewiesen: Die Gleichungen
a2 + 9a3 = (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ), 3 + 6 = 9
sind Folgen unserer gewohnten Rechengesetze (mit Termen bzw. Zahlen). Dagegen ist bei
der Gleichung
(−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6
überhaupt nicht gerechnet worden, sondern es wurde schlicht verwandt, daß nach unserer
Voraussetzung (Lösungs-Eigenschaft von (a1 , a2 , a3 , a4 )!) der erste Term den Wert 3, der
zweite den Wert 6 hat. Um mitzuteilen, daß an dieser Stelle die Voraussetzung benutzt
wurde und nicht nur eine unmittelbar einleuchtende Term-Umformung, kann man den
Leser darauf hinweisen, etwa folgendermaßen:
a2 + 9a3 = (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6 = 9.
Vor.
9
Der 1. Teil ist abgeschlossen. Daß dort die Bedeutung von (a1 , a2 , a3 , a4 ) am Beweisausgangspunkt eine andere war – nämlich zu L zu gehören – hat nun, nach Beendigung
des 1. Teils, keine Bedeutung mehr. Die Variablen a1 , a2 , a3 , a4 stehen für den 2. Teil der
Beweisformulierung wieder neu“ zur Verfügung, wovon wir Gebrauch machen.
”
9
wie der des 1. Teils. Jedoch ist die komprimierte Form, wenn man sie in der
Denkweise des 1. Teils liest, als Beweis vollständig ausreichend. Mathematische Beweise sollten knapp, ohne unnötiges Beiwerk sein, damit der Kern des
Gedankens stets ohne Verhüllungen ersichtlich wird. Daher ist die Formulierung des 2. Teils vorzuziehen, auch wenn beim ersten Lesen die des 1. Teils
leichter verstehbar erscheinen sollte.
Der gerade durchgeführte Schluß hängt nicht von den konkreten Zahlen ab,
die in unseren Gleichungssystemen auftreten, und wird in seiner allgemeinen
Form zu einer wichtigen Regel bei der Behandlung beliebiger linearer Gleichungssysteme. Wir müssen nur mit Variablen das durchführen, was bei dem
beendeten Beweis mit Zahlen gerechnet wurde:
Proposition über die elementaren Gleichungssystem-Umformungen
Seien m, n ∈ N, und seien c11 , c12 ,. . . , c1n , c21 , c22 ,. . . , c2n ,. . . , cmn , b1 ,. . . ,bm
rationale Zahlen, 1 ≤ i < m. Sei L die Lösungsmenge des linearen Gleichungssystems
(∗)
c11 x1 + · · · +
c1n xn = b1
..
..
..
..
.
.
.
.
ci1 x1 + · · · +
cin xn = bi
ci+1,1 x1 + · · · + ci+1,n xn = bi+1
..
..
..
..
.
.
.
.
cm1 x1 + · · · +
cmn xn = bm
.
(1) Sei L′ die Lösungsmenge des linearen Gleichungssystems
(∗∗)
c11 x1 + · · · +
c1n xn =
b1
..
..
..
..
.
.
.
.
(ci1 + ci+1,1 )x1 + · · · + (cin + ci+1,n )xn = bi + bi+1
ci+1,1 x1 + · · · +
ci+1,n xn =
bi+1
..
..
..
..
.
.
.
.
cm1 x1 + · · · +
cmn xn =
bm
.
Dann gilt: L = L′ .
(2) Sei d eine rationale Zahl 6= 0 und L′′ die Lösungsmenge des linearen
Gleichungssystems
10
c11 x1 + · · · +
c1n xn = b1
..
..
..
..
.
.
.
.
dci1 x1 + · · · + dcin xn = dbi
ci+1,1 x1 + · · · + ci+1,n xn = bi+1
..
..
..
..
.
.
.
.
cm1 x1 + · · · +
cmn xn = bm
.
Dann gilt: L = L′′ .
(3) Sei L′′′ die Lösungsmenge eines linearen Gleichungssystems, das aus (∗)
durch Veränderung der Reihenfolge der Gleichungen entsteht. Dann gilt:
L = L′′′ .
Beweis. (1) 1. Teil: L ⊆ L′ : Sei (a1 , . . . , an ) ∈ L. Dann folgt:
ci1 a1 + · · · +
cin an = bi
ci+1,1 a1 + · · · + ci+1,n an = bi+1 ,
also auch
(ci1 + ci+1,1 )a1 + · · · + (cin + ci+1,n )an
= (ci1 a1 + · · · + cin an ) + (ci+1,1 a1 + · · · + ci+1,n an ) = bi + bi+1 .
Da alle außer der i-ten Gleichung in (∗) und (∗∗) dieselben sind, folgt:
(a1 , . . . , an ) ∈ L′ .
2. Teil: L′ ⊆ L: Sei (a1 , . . . , an ) ∈ L′ . Dann folgt:
(ci1 + ci+1,1 )a1 + · · · + (cin + ci+1,n )an = bi + bi+1
ci+1,1 a1 + · · · + ci+1,n an = bi+1 ,
also auch
ci1 a1 + · · · + cin an
= (ci1 + ci+1,1 )a1 + · · · + (cin + ci+1,n )an − (ci+1,1 a1 + · · · + ci+1,n an )
= (bi + bi+1 ) − bi+1 = bi .
Da alle außer der i-ten Gleichung in (∗∗) und (∗) dieselben sind, folgt:
(a1 , . . . , an ) ∈ L′ .
(2) 1. Teil: L ⊆ L′′ : Sei (a1 , . . . , an ) ∈ L. Dann folgt: ci1 a1 + · · · + cin an = bi ,
also auch dci1 a1 + · · · + dcin an = dbi . Da alle außer der i-ten Gleichung in
beiden Systemen dieselben sind, folgt: (a1 , . . . , an ) ∈ L′′ .
11
2. Teil: L′′ ⊆ L: Sei (a1 , . . . , an ) ∈ L′′ . Dann folgt: dci1 a1 + · · · + dcin an = dbi .
Da d 6= 0 gilt, können wir die Zahl d1 bilden und erhalten durch Multiplikation: ci1 a1 +· · ·+cin an = d1 (dci1 a1 +· · ·+dcin an ) = 1d ·dbi = bi . Da alle außer der
i-ten Gleichung in beiden Systemen dieselben sind, folgt: (a1 , . . . , an ) ∈ L.
(3) Trivial.
Es soll gleich gezeigt werden, wie man mit Hilfe der drei in der Proposition
bewiesenen Regeln das gegebene Gleichungssystem (∗) in ein sehr leicht überschaubares Gleichungssystem verwandeln kann, aus dem man die Lösungsmenge schnell ablesen kann. Zunächst wollen wir aber eine weitere Schreibweise einführen, mit der lineare Gleichungssysteme sparsamer“ erfaßt wer”
den können als in der durch (∗) gegebenen Darstellung. Alle Schritte, die die
Proposition durchzuführen erlaubt, verändern nur die Koeffizienten cij der
Unbekannten und die Werte bi auf der rechten Seite, während die Unbekannten xj stereotyp an denselben Stellen nur abgeschrieben werden, ebenso wie
die Gleichheitszeichen. Um das Gleichheitssystem zu erfassen, genügt es also,
die Werte cij und bi in folgendem rechteckigen Schema wiederzugeben:


c11 · · · c1n b1
 ..
..
.. 
 .
.
. 
cm1 · · · cmn bm
Dem Übergang von (∗) zu (∗∗) im konkreten Fall
entspricht in dieser Schreibweise die Umformung



2 1
2
1
0 −3 −1
0 1

−1 1
6
−2
3




1
0
3
2
6
 → 1 0

2 2
2
2
9 −3 8 
0 −2
0 −2 −3 7
4
unseres Ausgangsbeispiels

0 −3 −1
9
0
9

3
2
6

9 −3 8 
−3 7
4
Wir wissen dank Teil (3) der Proposition, daß das Ersetzen einer Zeile dieses
Schemas durch die Zeile aus den Summenwerten mit den jeweiligen Werten
der folgenden Zeile (gemäß Teil (1) der Proposition) auch bezüglich einer beliebigen anderen Zeile vorgenommen werden kann, ohne daß sich die Lösungsmenge dabei verändert. Multiplizieren wir gemäß Teil (2) der Proposition die
Werte der 3. Zeile mit −2 und addieren dann einerseits diese zu denen der
4. Zeile, andererseits auch zu denen der 1. Zeile, so erhalten wir:


0 1 −6 −7 −13
0 1
9
0
9 


3
2
6 
→
,
1 0
0 2
3 −7 −4 
0 −2 −3 7
4
12
wobei wir die Multiplikation mit −2 (in der 3. Zeile) durch eine weitere
Anwendung des Teils (2), nämlich die nachträgliche Multiplikation mit − 12 ,
wieder rückgängig gemacht haben. Die bisherigen Anwendungen der Proposition haben dazu geführt, daß in der äußersten linken Spalte nunmehr
einmal der Wert 1 und ansonsten nur Nullen stehen. Ein solches Ziel verfolgen wir anschließend auch bezüglich der 2. Spalte. Bevor wir aber stereotyp
die analogen Rechnungen vornehmen, lassen wir uns eine auffällige Besonderheit nicht entgehen: Addiert man nämlich die Werte der ersten beiden Zeilen
(an den sich entsprechenden Stellen), so ergibt sich gerade die 4. Zeile, und
diese stimmt bis auf das Vorzeichen mit der 5. Zeile überein. Durch unsere
Proposition erlaubt diese Beobachtung die Umformungen

0
0

→
1
0
0
2
1
0
0
0



0 0 −15 −7 −22
3 −7 −4
0 1 9
0
9 
9 0
9





2
6 
3 2
6  → 1 0 3

0 0 0
0
0 
0 0
0
0 0 0
0
0
0 0
0



7
7
0 0 1 15
1 15
1 0
1
0 1 0 −4 −4 1 
0 1
5
5


3
3 
0 0
1
0
0
1
→
→
5
5 


0 0 0 0
0 0
0 
0 0 0 0
0
0 0

3
3
1
0
5
5
0 −4 15 −4 51 

7
7 
1 15
1 15
.
0 0
0 
0 0
0
D. h. unser anfangs gegebenes lineares Gleichungssystem ist lösungsgleich zu
dem linearen Gleichungssystem
x1
x2
x3
+ 53 x4
− 4 51 x4
7
+ 15
x4
= 1 53
= −4 15
7
= 1 15
x1
, d. h. x2
x3
= 1 53 − 35 x4
= −4 51 + 4 15 x4
7
7
− 15
x4
= 1 15
.
Dieses Gleichungssystem ist bei beliebigem Wert d für x4 erfüllbar; allerdings
sind die Werte für x1 , x2 , x3 mit der Wahl von d (für x4 ) eindeutig festgelegt:
Jede Lösung hat die Form
3 3
1
1
7
7
(1 − d, −4 + 4 d, 1 − d, d)
5 5
5
5
15 15
mit einer rationalen Zahl d, und jede Wahl von d führt auf die eben beschriebene Weise tatsächlich zu einer Lösung.
7
, 0), die
Die Wahl von d = 0 führt zu der speziellen Lösung (1 53 , −4 15 , 1 15
von d = 1 dagegen zu der speziellen Lösung (1, 0, 1, 1). Das sind genau
die beiden Lösungen aus dem 4. bzw. 2. Antwortversuch“ vom Beginn des
”
13
Kapitels, die sich somit als zwei singuläre Fälle einer unendlichen Menge
von Lösungen erweisen. Die gesamte Lösungsmenge haben wir inzwischen
vollständig beschrieben.
Wir wollen die Darstellung der Lösungen aber übersichtlicher gestalten als
bisher. Dazu werden uns folgende Setzungen von Nutzen sein, durch die wir
in der Lage sein werden, Objekte der Form (a1 , . . . , an ) allgemein zu addie”
ren“ bzw. auch mit rationalen Zahlen zu multiplizieren“:
”
Für alle Zahlen a1 , . . . , an , a′1 , . . . , a′n , d definieren wir:
(a1 , . . . , an ) + (a′1 , . . . , a′n ) := (a1 + a′1 , . . . , an + a′n ),
d · (a1 , . . . , an ) := (da1 , . . . , dan ).
Unter Benutzung dieser Festlegungen (im Falle n = 4) können wir unsere
allgemeine Lösung wie folgt umformen:
3 3
1
1
7
7
(1 − d, −4 + 4 d, 1 − d, d)
5 5
5
5
15 15
1
7
3 1
7
3
= (1 , −4 , 1 , 0) + d · (− , 4 , − , 1).
5
5 15
5 5
15
Sind a1 , a2 , a3 , a4 rationale Zahlen, so ist (a1 , a2 , a3 , a4 ) genau dann10 eine
Lösung des Gleichungssystems aus unserer Ausgangsfrage, wenn es ein d ∈ Q
gibt mit der Eigenschaft
3
1
7
3 1
7
(a1 , a2 , a3 , a4 ) = (1 , −4 , 1 , 0) + d · (− , 4 , − , 1).
5
5 15
5 5
15
Wir können damit unsere (unendliche) Lösungsmenge L in der auf S. 5 eingeführten Art beschreiben:
L = {(a1 , a2 , a3 , a4 )|a1 , a2 , a3 , a4 ∈ Q, und es gibt ein d ∈ Q mit
3
1
7
3 1
7
(a1 , a2 , a3 , a4 ) = (1 , −4 , 1 , 0) + d · (− , 4 , − , 1)}.
5
5 15
5 5
15
7
, 0) die
Alle Lösungen erhält man, indem man zu der Lösung (1 35 , −4 15 , 1 15
3
1
7
sämtlichen rationalen Vielfachen“ von (− 5 , 4 5 , − 15 , 1) addiert, im Sinne
”
der obigen Definition. Wir schreiben für die Menge aller dieser rationalen
”
7
Vielfachen“, also für die Menge der Elemente der Form d · (− 53 , 4 51 , − 15
, 1)
kurz
3 1
7
(− , 4 , − , 1) Q
5 5
15
10
d. h.: jedenfalls dann, aber auch in keinem anderen Fall!
14
und verwenden dies für die folgende abgekürzte Schreibweise für die Lösungsmenge L:
3 1
3
1
7
7
L = (1 , −4 , 1 , 0) + (− , 4 , − , 1) Q ,
5
5 15
5 5
15
wobei wir das Zeichen +, das eigentlich nur zwischen zwei Objekten des Typs
(a1 , . . . , an ) erklärt ist, in veränderter Form verwandt11 haben: zwischen einem Objekt des angegebenen Typs und einer ganzen Menge M von solchen
Objekten. Darunter soll die Menge aller Summen verstanden werden, die
man aus (a1 , . . . , an ) und einem der Elemente von M bilden kann.
7
, 1) Q einfacher schreiben in der
Wir können die Menge (− 53 , 4 51 , − 15
Form (−9, 63, −7, 15) Q , denn die Menge aller rationalen Vielfachen von
7
(− 53 , 4 51 , − 15
, 1) ist zugleich auch die Menge aller rationalen Vielfachen von
7
, 1).
15 · (− 35 , 4 51 , − 15
7
Während in der obigen Darstellung von L das Objekt (1 53 , −4 15 , 1 15
, 0) uns
schon (nämlich als eine spezielle Lösung
des gegebenen Gleichungssystems)
7
bekannt ist, besitzt bislang die Menge (− 35 , 4 15 , − 15
, 1) Q für uns noch
keine griffige Deutung bezüglich unseres Ausgangssystems. Wählen wir aber
7
ein rationales Vielfaches von (− 53 , 4 15 , − 15
, 1) für (x1 , x2 , x3 , x4 ) und setzen
in die linken Seiten der Gleichungen unseres Ausgangssystems ein, so ergeben
sich auf der rechten Seite nicht etwa die
stehenden Zahlen
−1, 3, 6, 8,
dort
3
1
7
4, sondern jedesmal 0. D. h. die Menge (− 5 , 4 5 , − 15 , 1) Q enthält12 lauter
Lösungen des veränderten Gleichungssystems
(∗)0
2x1 +
−x1 +
x1
2x1 +
x2
x2 +
+
2x2 +
−2x2 −
6x3
3x3
9x3
3x3
−
−
+
−
+
3x4
2x4
2x4
3x4
7x4
=
=
=
=
=
0
0
0
0
0
.
Dieses nennen wir das zu (∗) gehörige homogene lineare Gleichungssystem.
Allgemein legen wir fest:
Definition Sei (∗) wie in der Proposition gegeben. Gilt dann b1 = · · · =
bm = 0, so heißt das lineare Gleichungssystem (∗) homogen, andernfalls inhomogen. Zu jedem beliebigen linearen Gleichungssystem (∗) erhält man das
11
drastisch gesagt: mißbraucht“
”
In der Tat handelt es sich sogar um die genaue Lösungsmenge des homogenen Systems.
Das haben wir an dieser Stelle jedoch noch nicht bewiesen, sondern nur eine der dazu
einzusehenden Mengeninklusionen.
12
15
zugehörige homogene lineare Gleichungssystem (∗)0 , indem man in (∗) jeden
der Werte b1 , . . . , bm durch 0 ersetzt.
Die Lösungsmengen homogener linearer Gleichungssysteme haben interessante Eigenschaften, die man im Falle von inhomogenen linearen Gleichungssystemen nicht vorfindet: Sind nämlich (a1 , . . . , an ) und (a′1 , . . . , a′n ) beides
Lösungen eines homogenen linearen Gleichungssystems, so ergibt sich beim
Einsetzen der ai (für die jeweilige Unbekannte xi ) sowie auch beim Einsetzen der a′i auf der rechten Seite jeder Gleichung stets der Wert 0, also beim
Einsetzen von ai + a′i ebenfalls (da 0+0=0). Dasselbe ist bei gegebenem
rationalen Faktor d festzustellen, wenn man statt ai stets dai einsetzt (da
d · 0 = 0). Auch ist ein homogenes lineares Gleichungssystem stets lösbar, da
ja (0, . . . , 0) offensichtlich eine Lösung ist. (Man nennt sie die triviale Lösung
des Gleichungssystems.) Damit erhalten wir:
Bemerkung Sei L0 die Lösungsmenge eines homogenen linearen Gleichungssystems
(1) Gilt (a1 , . . . , an ) ∈ L0 und (a′1 , . . . , a′n ) ∈ L0 , so gilt auch
(a1 , . . . , an ) + (a′1 , . . . , a′n ) ∈ L0 .
(2) Gilt (a1 , . . . , an ) ∈ L0 , so gilt für alle d ∈ Q auch d · (a1 , . . . , an ) ∈ L0 .
(3) (0, . . . , 0) ∈ L0 .
Mit ähnlichen Überlegungen erhalten wir das folgende wichtige Hauptergebnis über den Zusammenhang zwischen der Lösungsmenge eines linearen
Gleichungssystems und der des zugehörigen homogenen linearen Gleichungssystems:
Satz Seien m, n ∈ N, und seien c11 , c12 ,. . . , c1n , c21 , c22 ,. . . , c2n ,. . . , cmn ,
b1 ,. . . ,bm rationale Zahlen. Sei L die Lösungsmenge des linearen Gleichungssystems
(∗)
c11 x1 + · · · + c1n xn = b1
..
..
..
..
.
.
.
.
cm1 x1 + · · · + cmn xn = bm
und L0 die Lösungsmenge des zugehörigen homogenen linearen Gleichungssystems. Ist (ã1 , . . . , ãn ) eine Lösung von (∗), so gilt die Gleichheit
L
=
(ã1 , . . . , ãn ) + L0 ,
d. h. man erhält jedes Element von L, indem man zu der speziellen Lösung
(ã1 , . . . , ãn ) jedes Element von L0 addiert.
16
Beweis. 1. Teil: Wir zeigen L ⊆ (ã1 , . . . , ãn ) + L0 :
Sei (a1 , . . . , an ) ∈ L. Dann ist sowohl (ã1 , . . . , ãn ) als auch (a1 , . . . , an ) eine
Lösung von (∗). Es folgt:
c11 (a1 − ã1 ) + · · · +
..
.
c1n (an − ãn ) =
..
.
b1 − b1
cm1 (a1 − ã1 ) + · · · + cmn (an − ãn ) = bm − bm
= 0
..
.
.
= 0
Setzen wir also (h1 , . . . , hn ) := (a1 , . . . , an )−(ã1 , . . . , ãn ) 13 , so gilt: (h1 , . . . , hn )
∈ L0 . Es folgt:
(a1 , . . . , an ) = (ã1 , . . . , ãn )+(h1 , . . . , hn ) ∈ (ã1 , . . . , ãn )+L0 .
2. Teil: Wir zeigen (ã1 , . . . , ãn ) + L0 ⊆ L:
Sei (a1 , . . . , an ) ∈ (ã1 , . . . , ãn )+L0 . Dann gibt es eine Lösung (h1 , . . . , hn ) des
zu (∗) gehörigen homogenen linearen Gleichungssystems mit der Eigenschaft
(a1 , . . . , an ) = (ã1 , . . . , ãn )+(h1 , . . . , hn ) = (ã1 + h1 , . . . , ãn + hn ).
Es folgt:
c11 a1 + · · · + c1n an = c11 (ã1 + h1 ) + · · · + c1n (ãn + hn ) = b1 + 0 = b1
..
..
,
.
.
cm1 a1 + · · · + cmn an = cm1 (ã1 + h1 ) + · · · + cmn (ãn + hn ) = bm + 0 = bm
also (a1 , . . . , an ) ∈ L.
Folgerung Ein lineares Gleichungssystem, das lösbar ist, hat eine eindeutig
bestimmte Lösung genau dann, wenn das zugehörige homogene lineare Gleichungssystem nur die triviale Lösung (0, . . . , 0) hat.
Ist nämlich (ã1 , . . . , ãn ) eine nach Voraussetzung gegebene Lösung, so ist diese nach dem Satz genau dann die einzige, wenn L0 nur das Element (0, . . . , 0)
enthält.
Man beachte, daß die Darstellung von L gemäß unserem Satz in der Form
(ã1 , . . . , ãn ) + L0 immer gilt, wenn nur (ã1 , . . . , ãn ) irgendeine Lösung von (∗)
ist. Daher können wir in der bisherigen Darstellung, die wir für die Lösungsmenge unseres Ausgangsbeispiels gewonnen haben, die spezielle Lösung
7
, 0) durch irgendeine andere ersetzen. Insbesondere gilt auch:14
(1 53 , −4 15 , 1 15
L = (1, 0, 1, 1) + (−9, 63, −7, 15) Q .
13
Natürlich soll das bedeuten: (a1 , . . . , an )+(−ã
1 , . . . , −ãn ) Daß die noch unbewiesene Inklusion L0 ⊆ (−9, 63, −7, 15) Q gilt, wenden wir hierbei
an. Wie sähe ein Beweis dafür aus?
14
17
Ein unlösbares lineares Gleichungssystem läßt sich auf einfachste Weise angeben, z. B. durch
x = 0
x = 1
Eine Menge, die (wie die Lösungsmenge in diesem Beispiel) kein Element
enthält, wird leer genannt. Zum Beispiel ist auch die Menge M := {z|z ∈ N
und z < 0} leer. Wir überlegen nun:
Bemerkung Ist X eine leere Menge, so gilt X ⊆ Y für jede Menge Y .
Beweis. Seien also X, Y Mengen, dabei X leer. Wäre die Aussage X ⊆ Y
falsch, so müßte es ein Element von X geben, das nicht in Y liegt. Da X leer
ist, enthält X aber überhaupt kein Element. Daher kann die Aussage X ⊆ Y
nicht falsch, also nur wahr sein, d. h. es gilt X ⊆ Y .
Erstmalig haben wir hier eine Aussage indirekt bewiesen: Statt eine Aussage
A in ihrer gegebenen Form ins Visier zu nehmen, zeigt man dabei, daß die
Negation von A, also die Aussage ¬A, falsch ist. Dann kann nämlich A nicht
ebenfalls falsch sein; und dies bedeutet, daß A wahr ist. Der Schluß beruht
auf dem Prinzip, daß es zu A ist wahr“ und A ist falsch“ keine (dritte)
”
”
Alternative gibt (tertium non datur).
Folgerung Je zwei leere Mengen sind gleich.
Beweis. Seien M, M ′ leere Mengen. Nach der Bemerkung (mit X := M,
Y := M ′ ) gilt M ⊆ M ′ . Eine zweite Anwendung der Bemerkung (nämlich
X := M ′ , Y := M) ergibt aber auch: M ′ ⊆ M. Es folgt: M = M ′ .
D. h. in welchem mathematischen Kontext auch immer sich irgendeine Menge als leer erweist, so ist sie damit stets ein eindeutig bestimmtes Objekt
der Mathematik: die leere Menge“. Dadurch ist auch gerechtfertigt, für sie
”
ein von dem jeweiligen Zusammenhang unabhängiges Symbol zu verwenden;
dafür ist das Zeichen ∅ üblich.15
Zwischen den bislang eingeführten Schreibweisen für Lösungen eines linearen Gleichungssystems (nämlich als Tupel) und der Matrizenschreibweise als
ein lineares Gleichungssystem eindeutig festlegendes Zahlenschema sind offenkundig natürliche Beziehungen vorhanden: Im Falle unseres Ausgangsbeispiels etwa,
15
In der Bemerkung und in der Folgerung geht es um die eindeutige Bestimmtheit, nicht
aber um die Existenz einer leeren Menge. Wie jedoch die vorgenannten Beispiele bereits
nahelegen, ist diese ein für die mathematische Begriffswelt unverzichtbares Postulat. Wir
betrachten in aller Folge die leere Menge als ein gegebenes grundlegendes Objekt der
Mathematik.
18
2x1 +
−x1 +
x1
2x1 +
x2
x2 +
+
2x2 +
−2x2 −
6x3
3x3
9x3
3x3
−
−
+
−
+
3x4
2x4
2x4
3x4
7x4
= −1
= 3
= 6
= 8
= 4
∼

2
1
0 −3 −1
−1 1
6 −2 3 



0
3
2
6
C :=  1
,
2
2
9 −3 8 
0 −2 −3 7
4

entnehmen wir der Matrix in Form ihrer Zeilen“ fünf 5-Tupel:
”
C1 : = (2, 1, 0, −3, −1) heißt die erste Zeile von C,
C2 : = (−1, 1, 6, −2, 3) heißt die zweite Zeile von C,
..
.
Ebenso erhalten wir durch senkrechtes Lesen“
”
1
C : = (2, −1, 1, 2, 0) heißt die erste Spalte von C,
C 2 : = (1, 1, 0, 2, −2) heißt die zweite Spalte von C,
..
.
Daß die Matrix C in diesem Fall genauso viele Zeilen wie Spalten hat, ist eine
im allgemeinen nicht zu erwartende Besonderheit. Man nennt solche Matrizen
quadratisch. Unserer quadratischen Matrix C entnehmen wir durch schräges
”
Abwärtslesen“ noch ein weiteres in späteren Zusammenhängenden gelegentlich eine Rolle spielendes Tupel: (2, 1, 3, −3, 4), die sogenannte Hauptdiagonale
von C. Zunächst sind für uns die Zeilen einer Matrix am wichtigsten:
Sei ein beliebiges lineares Gleichungssystem (∗) mit den Bezeichnungen wie
in unserer Proposition gegeben. Da man jede Matrix durch Angabe ihrer
Zeilen beschreiben kann, geben wir in Kurzform auch die zu (∗) gehörige
Matrix

 

c11 · · · c1n b1
C1
 ..


.
.
..
..  wieder durch  ... 
C : = .
.
cm1 · · · cmn bm
Cm
Anläßlich der Angabe unserer Lösungsmengen hatten wir eine Addition“ +
”
von Tupeln (gleicher Länge) und eine Multiplikation“ · zwischen rationa”
len Zahlen und Tupeln kennengelernt. Nun werden wir feststellen, daß diese
19
Festlegungen bestens geeignet sind, die in der Proposition behandelten elementaren Umformungen eines linearen Gleichungssystems in Umformungen
der zugehörigen Matrix zu übertragen. Wir erhalten nämlich durch Anwendung unserer Proposition die Einsicht:
Für beliebige i, j ∈ {1, . . . , m} mit i 6= j gilt: Ersetzt man die i-te Zeile Ci
durch Ci +d · Cj (für irgendein d ∈ Q) und nennt die so entstehende Matrix
C ′ , so sind C, C ′ lösungsgleich.
Sind nämlich i, j ∈ {1, . . . , m} und etwa i < j (der Fall i > j verläuft
analog), so ist die Behauptung im Falle d = 0 trivial (da dann C = C ′ ),
und im Falle d 6= 0 gibt die folgende Kette wieder, wie man durch sukzessive Anwendungen der Proposition unter Lösungsgleichheit von C nach C ′
gelangt:








C1
C1
C1
C1
..
..
 .. 
 .. 




 . 
 . 




.
.








 Ci 
 Ci 
Ci +d · Cj 
Ci +d · Cj 
 . 






..
 → d · Cj  →  d · Cj  → 
 → C′
.
C→
.
.
 (3)  .  (1) 



(2) 
(3)
..
d · C 
 .. 


 d · C  (2)
.






j
j 
 . 
 . 




..
..
 .. 
 .. 




.
.
Cm
Cm
Cm
Cm
Ganz unmittelbar aus der Proposition erhält man, daß eine Zeile durch ihr dfaches ersetzt werden darf, sofern d eine rationale Zahl 6= 0 ist, und daß man
die Reihenfolge der Zeilen beliebig ändern darf, ohne daß sich die Lösungsmenge des zugehörigen Gleichungssystems ändert. Unter einer elementaren
Zeilenumformung einer Matrix C aus rationalen Zahlen verstehen wir eine
der folgenden Operationen:
(i) Ersetzen von Ci durch Ci +d · Cj (d ∈ Q, j 6= i),
(ii) Ersetzen von Cj durch d · Cj (d ∈ Q, d 6= 0 (!)),
(iii) Veränderung der Reihenfolge der Zeilen von C.
Vermöge der oben festgehaltenen Einsicht erhalten wir aus unserer Proposition über die elementaren Gleichungssystem-Umformungen daher:
Proposition von den elementaren Zeilenumformungen einer Matrix
Entsteht eine Matrix D aus einer Matrix C durch eine elementare Zeilenumformung, so sind C und D lösungsgleich.
Natürlich bleibt die Lösungsgleichheit erhalten, wenn man nun nacheinander solche elementaren Zeilenumformungen vornimmt. Wir tun jetzt genau
20
das, indem wir einen Algorithmus formulieren, durch den wir jede beliebige
Matrix rationaler Zahlen auf eine bestimmte Endgestalt bringen; dieser läßt
sich die Lösungsmenge dann ohne weiteres entnehmen:
Algorithmus durch elementare Zeilenumformungen
Ausgangssituation: Gegeben sei eine Matrix C aus rationalen Zahlen cij .
1. Falls C eine Nullmatrix16 ist, ist der Algorithmus hier beendet.
2. Andernfalls sei s die kleinste natürliche Zahl mit der Eigenschaft, daß
die Spalte C s ein Element 6= 0 enthält. Sei dann r die kleinste Zahl mit
der Eigenschaft crs 6= 0.
(a) Vermöge (ii) ersetzen wir Cr durch c1rs · Cr ; dadurch entsteht eine
Matrix mit einer 1 an der Stelle des früheren Elementes crs .
(b) Vermöge (i) mit j : =r können wir dann alle Zeilen mit Zeilenindizes > r durch Zeilen ersetzen, deren s-te Komponente 0 ist.
(c) Vermöge (iii) verschieben wir die r-te Zeile ganz nach oben und
erhalten dadurch eine Matrix D, bei der die ersten s Spalten nur
Nullen enthalten, mit Ausnahme des s-ten Elementes der ersten
Zeile; dieses ist 1.
3. Falls C nur eine Zeile enthält, ist der Algorithmus hier beendet.
4. Andernfalls sei C ′ die ( Rest“)-Matrix, die sich aus D durch Streichen
”
der 1. Zeile und der ersten s Spalten ergibt, und man fahre (innerhalb
der Matrix C) mit der Matrix C ′ gemäß 1. und 2. fort.
Da bei jeder Durchführung der Punkte 1. – 4. entweder der Algorithmus
terminiert oder sich die Zahl der Zeilen der weiter zu betrachtenden Matrix
um 1 reduziert, kann die Anzahl der algorithmischen Schritte (gezählt durch
den jeweils einleitenden Sprung zur Entscheidung 1.) nicht die Zahl der Zeilen
von C übersteigen.
Ist C keine Nullmatrix, so hat die aus
entstehende Matrix D die Gestalt:

0 ... 0 1

0 . . . 0 0
.
.. ..
 ..
. .

0 ... 0 0
16
C nach Durchlauf der Teile von 2.
· ... ·
· ...
..
. C′
· ...


· 
,
.. 
. 

·
Darunter verstehen wir eine Matrix, bei der sämtliche Elemente cij gleich 0 sind.
21
also nach Abschluß des gesamten Algorithmus:

0 ... 0 1 · ... · · · ...

0 0 ... 0 1 · ...


..

.

.. ..
 ..
..
.
.
. .
.
.
.
 ..
.. ..
... 0 0 ... 0 1 ·


O
0 0


.. ..

. .
0 ... ... 0 0 ...
0 0
...
0 0
*

... ·
. . . ·

.. 
.

.. 
.

. . . ·


. . . 0
.. 
.
... 0
Man sagt, daß eine Matrix dieser Art Zeilenstufenform hat: Eine Matrix A
mit m Zeilen und l Spalten hat Zeilenstufenform, wenn es eine nichtnegative
ganze Zahl k ≤ m und natürliche Zahlen j1 , j2 , . . . , jk ∈ {1, . . . , l} mit j1 <
j2 < · · · < jk gibt, so daß gilt:
Ai = (0, . . . , 0, 1, · · · ) für alle i ∈ {1, . . . , k},
| {z }
ji
Ak+1 = · · · = Am = (0, . . . , 0).
Im Falle k = m gibt es dann keine Nullzeilen in der Matrix. Im Falle jk = l ist
die k-te Zeile die letzte Zeile, die keine Nullzeile ist, und sieht folgendermaßen
aus:
Ak = (0, . . . , 0, 1) falls jk = l
In diesem Fall ist das zu A gehörige lineare Gleichungssystem unlösbar, da
seine letzte (nichttriviale) Gleichung offenbar unerfüllbar ist. In jedem anderen Fall ist das Gleichungssystem lösbar: Sind ai,k+1, . . . , ail die rationalen
Zahlen, für die gilt:
Ai = (0, . . . , 0, 1, ai,k+1, . . . , ail ),
n: = l − 1, bi : =ai,l für alle i ≤ m, so hat das zu A gehörige lineare Gleichungssystem dieselben Lösungen wie das System
xjk = bk − akn xn − · · · − ak,jk +1 xjk +1
..
.
xj1 = b1 − a1n xn − · · · − a1,j1 +1 xj1 +1
Hierin sind offensichtlich die Unbekannten xi mit i 6∈ {j1 , . . . , jk } beliebig
wählbar und die übrigen dann eindeutig bestimmt. Es gilt also:
Proposition über Gleichungssysteme von Zeilenstufenform Hat eine
Matrix A Zeilenstufenform, genau k Zeilen 6= (0, . . . , 0) und genau n + 1
22
Spalten, so ist das zugehörige lineare Gleichungssystem (in n Unbekannten)
entweder unlösbar oder es lassen sich genau n − k der Unbekannten frei
wählen.
Die Bestimmung der Lösungen vereinfacht sich noch, wenn man zuvor die
Zeilenstufenform vermöge Zeilenumformungen vom Typ (i) so verfeinert, daß
für jedes i ≤ k die ji -te Spalte statt der Werte a1,ji , . . . , ai−1,ji nur Nullen
enthält.
Bezüglich unseres Ausgangsbeispiels etwa sieht man, daß sich die zweite auf
S. 13 gegebene Matrix zwar in die Zeilenstufenform


1 0 3 2
6
0 1 9 0
9 


0 0 1 − 7 − 22 
15
15 

0 0 0 0
0 
0 0 0 0
0
bringen läßt, jedoch ist es geschickter, die verfeinerte Zeilenstufenform (siehe
die letzte auf S. 13 angegebene Matrix) anzustreben, bei der nicht nur unterhalb, sondern auch oberhalb der 1en in den ersten drei Spalten jeder Wert 0
ist.
Wir betrachten dazu noch ein abschließendes Beispiel: Die ZeilenstufenformMatrix


1 2 3 5 −1 −2 1 b1
0 0 0 1 −2 −3 −1 b2 



0 0
1
2 b3 
O
0
1 b4
bringen wir durch elementare Zeilenumformungen in folgende verfeinerte
Form:


1 2 3 0 9 0 0 b1 − 5b2 − 13b3 + 20b4
0 0 0 1 −2 0 0

b2 + 3b3 − 5b4

,


0 0 1 0
b3 − 2b4
O
0 1
b4
was dem linearen Gleichungssystem
x7
x6
x4
x1
=
=
=
=
b4
b3 − 2b4
b2 + 3b3 − 5b4 + 2x5
b1 − 5b2 − 13b3 + 20b4 − 9x5 − 3x3 − 2x2
23
entspricht. Jede Lösung hat also die Gestalt
(b1 − 5b2 − 13b3 + 20b4 − 9f − 3e − 2d, d, e, b2 + 3b3 − 5b4 + 2f, f, b3 − 2b4 , b4 )
mit geeigneten d, e, f ∈ Q, d. h. die Lösungsmenge ist
L = (b1 − 5b2 − 13b3 + 20b4 , 0, 0, b2 + 3b3 − 5b4 , 0, b3 − 2b4 , b4 )
+h(−2, 1, 0, 0, 0, 0, 0)iQ+h(−3, 0, 1, 0, 0, 0, 0)iQ+h(−9, 0, 0, 2, 1, 0, 0)iQ
Einige Elemente mathematischer
Ausdrucksweise
Wir stellen im folgenden einige Elemente mathematischer Ausdrucksweise
zusammen, zunächst einige Symbole aus dem Bereich der Logik. Seien A, B
Aussagen. Es bedeuten:
A∧B
:
A und B; sowohl A als auch B gilt.
A∨B
:
A oder B; wenigstens eine der Aussagen A, B gilt.
¬A
:
nicht A; A gilt nicht.
A⇒B
:
Aus A folgt B; wenn A, so B.
A⇔B
:
A ist gleichwertig (äquivalent) zu B; (A ⇒ B) ∧ (B ⇒ A).
∀...
(∗) :
Für alle . . . gilt (∗).
∃...
(∗) :
Es gibt ein . . . mit der Eigenschaft (∗).
Man beachte, daß bei der umgangssprachlichen Übertragung des Symbols
∀“ das Wort gilt“ bereits durch das Symbol mit ausgedrückt wird; ebenso
”
”
ist mit der Eigenschaft“ bereits durch das Symbol ∃“ mit erfaßt. Es handelt
”
”
sich also nicht um Abkürzungen für für alle“ bzw. es gibt“, auch wenn
”
”
man diese Art der Verwendung häufig antreffen kann. Tatsächlich sind die
Quantoren ∀“, ∃“ Bestandteile einer formalen Sprache, nämlich der der
”
”
Prädikatenlogik, in der für sie auch eine klare Grammatik“ festgelegt ist.
”
Will man sie nicht nur als willkommene Abkürzungen“, sondern in jenem
”
Sinne korrekt verwenden, so sollte man beachten:
• Die Zeichen ∀“, ∃“ leiten stets eine Aussage ein, stehen also stets am
”
”
Beginn, nie am Ende einer formalisierten Aussage.
24
• Auf die Zeichen ∀“, ∃“ muß zwingend eine freie Variable folgen, nie”
”
mals eine Konstante oder ein Term, der eine funktionale Abhängigkeit
ausdrückt.17
Wir stellen uns in der Folge auf den Standpunkt, daß in einer formalisierten
Zeile auch die Grammatik der Sprache, in der die Formalisierung vorgenommen wird, beachtet werden soll. D. h. wir halten es für einen guten Stil, in
Formelzeilen auf umgangssprachliche Elemente möglichst ganz zu verzichten
und zumindest die beiden genannten grammatikalischen Regeln“ für den
”
Gebrauch der All- und Existenzquantoren zu respektieren. Das schließt Formulierungen wie etwa x2 ≥ 0 ∀x ∈ Q“ oder ∃sin x ∈ R cos(sin x) = 12“
”
”
aus; nach dem zuvor Gesagten gilt dies auch z. B. für ∀x ∈ Q gilt x2 ≥ 0“,
”
∃x ∈ R mit cos(sin x) = 21“. (Unterstrichen ist jeweils der Stein des An”
”
stoßes“.) Dagegen erlauben wir uns in der Regel, bei den Variablen, die auf
ein Quantorensymbol folgen, in Form von Elementzugehörigkeit den Bereich
anzugeben, über den sich die Variable erstrecken darf. Bei einer quantorisierten Aussage trennen wir optisch den Quantorenteil (der den Beginn der
Aussage ausmacht) von der sogenannten Kernformel“ durch einen gewissen
”
Abstand, nicht jedoch durch ein umgangssprachliches Wort. Mit diesen stilistischen Abmachungen konform wären also z. B. die folgenden Fassungen des
inhaltlich in den kritisierten Formulierungen Gemeinten:
∀x ∈ Q
x2 ≥ 0 ,
∃x ∈ R
cos(sin x) =
1
2
.
Schon diese Beispiele zeigen aber, daß man den Inhalt auch dann u. U. verstehen kann, wenn man gegen die geschilderte Grammatik verstößt. So kommt
es, daß in anderen mathematischen Darstellungen durchaus eine abweichende
( lockerere“) stilistische Wahl getroffen werden kann, ohne daß die Korrekt”
heit des inhaltlich Mitgeteilten davon beeinträchtigt wird. Tatsache ist, daß
stilistisch gelockerte“ mathematische Texte sogar häufig anzutreffen sind.
”
Da wir jedoch keinen Vorteil darin sehen, uns über die aus der Logik bekannte Grammatik hinwegzusetzen, schließen wir uns solchen abweichenden
stilistischen Entscheidungen im Grundsatz nicht an.
Weiter stellen wir einige mengentheoretische Konzepte zusammen, die wenigstens zum Teil wohlbekannt sein dürften. Auch hier ist allerdings die Verwendung der Schreibweisen nicht ganz einheitlich. Für beliebige Mengen S,
T wird gesetzt:
17
Im Volkston: Nach einem Quantor hat ein nackter Buchstabe“ zu folgen wie x, A,
”
ϕ . . . – kein geschminkter“ wie etwa x−1 , A2 , ϕij . Ganz und gar dem Sinn eines
”
Quantors widersprechend ist eine Zusammenstellung wie ∃1 ∈ N“ oder ∃0 ∈ Z“.
”
”
25
S ∩ T := {x|x ∈ S ∧ x ∈ T } (Durchschnitt von S und T )
S ∪ T := {x|x ∈ S ∨ x ∈ T } (Vereinigung von S und T )
S r T := {x|x ∈ S ∧ x ∈
/ T } ( S ohne T“, Differenzmenge von T in S)
”
Zur Bildung der Differenzmenge von T in S braucht T keineswegs in S enthalten zu sein. Gilt aber T ⊆ S, so wird S r T auch das mengentheoretische
Komplement von T in S genannt. Unter der mengentheoretischen Differenz von
S und T versteht man die Menge
S△T := (S ∪ T ) r (S ∩ T ).
In der bekannten geometrischen Veranschaulichung der Mengen S, T :
S
T
SrT
S∩T
T rS
findet sich S ∪T als die gesamte umgrenzte Fläche, S△T dagegen als dieselbe
unter Aussparung des S und T gemeinsamen Teils S ∩ T repräsentiert. Die
mengentheoretische Differenz ist von den hier erwähnten Konzepten das von
der geringsten Relevanz. Jedoch sei ohne Beweis die folgende bemerkenswerte
nichttriviale Eigenschaft erwähnt: Für beliebige Mengen S, T , U gilt:
(S△T )△U = S△(T △U)
Eine ganz besonders wichtige Operation besteht in der Bildung der sogenannten Potenzmenge einer Menge M, definiert durch
P(M) := {T |T ⊆ M}.
Die Elemente von P(M) sind genau die Teilmengen von M. Zum Beispiel
gilt:
P({1, 2, 3}) = {1, 2, 3}, {1, 2}, {1, 3}, {2, 3}, {1}, {2}, {3}, ∅ .
26
Unsere Bemerkung auf S. 18 besagt: ∅ ∈ P(M) für jede Menge M. Insbesondere gilt – eben deswegen nämlich – P(M) 6= ∅ für jede Menge M. Wir
setzen
P′ (M) := P(M) r {∅}
für jede Menge M, d. h. P′ (M) ist die Menge der nichtleeren Teilmengen von
M. Im Falle M = ∅ gilt P′ (M) = ∅, in jedem anderen wegen ∅ =
6 M ∈ P(M)
′
jedenfalls M ∈ P (M).
Bemerkung 1 Für beliebige Mengen M, N gilt stets P(M) 6= P′ (N),
da die erste Menge ∅ als Element enthält, die zweite hingegen nicht. – Ein
wichtiges Konstruktionsprinzip interessanter mathematischer Objekte sieht
nun so aus, daß man zunächst zu einer vorgegebenen Menge M die Potenzmenge bildet und anschließend daraus eine gewisse Auswahl von Elementen
(also von Teilmengen von M) trifft, d. h. man bildet Mengen, deren Elemente gewisse Teilmengen von M sind. Betrachtet man eine Menge X, deren
Elemente gewisse zuvor gegebene Mengen T1 , T2 , . . . sind, so kann man sich
diesen Übergang als ein Betreten eines höher gelegenen Stockwerks“ vorstel”
len: Man denke sich die Elemente der Mengen T1 , T2 , . . . im Erdgeschoß eines
Gebäudes angesiedelt, über dem die umfassenden Mengen Ti im ersten Stock
thronen. Macht man nun die Mengen Ti zu Elementen einer neuen Menge X,
so gleicht dies dem Betreten eines 2. Stockwerks. Allgemein kann man nach
Erreichen eines gewissen höheren Stockwerks stets dort angesiedelte Mengen zu Elementen einer neuen Menge machen, die dann in diesem Bild im
nächsthöheren Stockwerk angesiedelt ist. Wie jedes Bild, so hat auch dieses
vom Hochhaus der Mengen“ seine Schwächen; es könnte aber bei einem er”
sten Zugang jedenfalls zu einer halbwegs anschaulichen und zur Orientierung
nützlichen Vorstellung verhelfen.
Zum Beispiel enthält die Menge Q unendlich viele Elemente (die Brüche).
Die im nächsthöheren Stockwerk gelegene“ Menge {Q} dagegen enthält ein
”
einziges Element: Q.
Sei nun M eine Menge, deren Elemente selbst Mengen sind.18 Wir setzen
dann:
[
M := {x|∃T ∈ M x ∈ T } (Vereinigung über M)
und im Falle M 6= ∅
\
M := {x|∀T ∈ M
x ∈ T } (Durchschnitt über M).
18
Dieser Relativsatz ist natürlich unnötig, da wir ja, sofern nicht anderes gesagt wird,
ohnehin nur Mengen als mathematische Objekte in Betracht ziehen. Er dient lediglich als
Hilfe für den, dem diese Sichtweise ungewohnt ist.
27
Im Falle M = ∅ ist die Bedingung ∀T ∈ M x ∈ T“ für jede Menge
x
S
”
erfüllt, ∃T ∈ M x ∈ T“ hingegen für keine Menge x. Daher gilt: ∅ = ∅,
”
während der Durchschnitt über ∅ (für die Vorstellung: der Durchschnitt über
ein System von Mengen, dem überhaupt keine Menge angehört) jede Menge
als Element enthalten müßte. An dieser Stelle gelangen wir an die Grenzen
unseres naiven Mengenkonzeptes: Die blauäugige“ Weise, mit der wir bislang
”
mit Mengen umgegangen sind, verschweigt nämlich einen wichtigen Punkt:
Man darf keineswegs auf beliebige Weise Mengen zu neuen Mengen zusammenfassen, wenn man sich nicht in Widersprüche verstricken will. Ohne auf
die hiermit verbundenen nichttrivialen Untersuchungen genauer einzugehen,
bemerken wir nur, daß es jedenfalls keine Menge gibt, die sämtliche Mengen
(also auch sich selbst!) als Elemente enthielte. Auf ein für solche Einsichten notwendiges rigoroses Studium axiomatischer Mengenlehre kann hier nur
verwiesen werden. Hierin liegt jedoch der Grund dafür, daß der Durchschnitt
über eine Menge M nur für nichtleeres M definiert ist.
Der Zusammenhang zum gewöhnlichen“ Durchschnitt bzw. zur gewöhnli”
”
chen“ Vereinigung zweier Mengen (siehe S. 26) ist klar, denn offensichtlich
gilt:
T
S
Bemerkung 2 Gilt M = {S, T }, so folgt: M = S ∩ T ,
M = S ∪ T. Im speziellen Fall S = T (in dem also M einelementig ist) ergibt dies:
T
S
Bemerkung 3 Für jede Menge S gilt: {S} = S = {S}.
Die Vereinigungsmenge aller Teilmengen einer Menge M ist offensichtlich M,
ebenso wie die Vereinigungsmenge aller nichtleeren Teilmengen von M:
S
S
Bemerkung 4 Für jede Menge M gilt:
P(M) = M = P′ (M).
28
Kapitel 1
Urpaare, Funktionen,
Relationen
1.1 Definition (Urpaar, Komponenten) Ein Urpaar ist eine 2-elementige
Menge p, für die gilt: Es gibt Mengen A, B mit P(A), P′ (B) ∈ p.
Nach Bemerkung 1 auf S. 27 hat dann p genau die Elemente P(A), P′ (B).
Dabei sind die Mengen A, B eindeutig bestimmt; es gilt:
1.1.1 Ist p = {P(A), P′ (B)} und sind C, D Mengen mit P(C), P′ (D) ∈ p,
so folgt A = C, B = D.
Beweis: Da P(A) das (einzige) Element von p ist, das ∅ als Element enthält,
und da auch ∅ ∈ P(C) gilt, folgt P(A) = P(C); aus der ersten der beiden
Gleichungen in Bemerkung 4 (S. 28) erhalten wir nun A = C. Mit der zweiten
Gleichung derselben Bemerkung folgt ebenso B = D.
Die eindeutig bestimmte Menge A mit P(A) ∈ p heißt die erste Komponente,
die eindeutig bestimmte Menge B mit P′ (B) ∈ p die zweite Komponente des
Urpaars p. Für das Urpaar mit der ersten Komponente A und der zweiten
Komponente B schreiben wir
(A; B).
Damit besagt 1.1.1:
1.1.1’ (A; B) = (C; D) ⇒ A = C ∧ B = D für alle Mengen A, B, C, D.
D. h. durch die rein mengentheoretische Konstruktion in Definition 1.1 entstand ein mathematisches Objekt, durch das Mengen A, B – die auch dieselben sein dürfen – unter Berücksichtigung ihrer Reihenfolge aufgeführt werden.
Ist p ein Urpaar, so schreiben wir p1 für die erste, p2 für die zweite Komponente von p, also: p = (p1 ; p2 ).
29
1.2 Definition (Vorbereich, Nachbereich, Funktion, Abbildung, Bild, Wertemenge, Identität, injektiv, surjektiv, bijektiv, Teilmengenfunktion, Umkehrung, vollständiges Urbild, disjunkt) Sei ϕ eine Menge von Urpaaren. Wir
nennen
V (ϕ) := {x|∃p ∈ ϕ x = p1 } den Vorbereich,
N(ϕ) := {y|∃p ∈ ϕ y = p2 } den Nachbereich
von ϕ.
1.2.1 Beispiel Sei ϕ0 := {(1; 1), (1; 2), (2; 3), (0; 4)}. Dann gilt: V (ϕ0 ) =
{0, 1, 2}, N(ϕ0 ) = {1, 2, 3, 4}.
ϕ heißt eine Funktion (oder Abbildung), wenn es zu jedem x ∈ V (ϕ) genau
ein y ∈ N(ϕ) gibt mit (x; y) ∈ ϕ. Ist dies der Fall, so benutzen wir auch die
Sprechweise ϕ ordnet dem Element x das Element y zu“, nennen y das Bild
”
von x unter ϕ und schreiben dafür:
y = xϕ
(Rechtsschreibweise für Abbildungen).
Andere gebräuchliche Schreibweisen sind die aus historischen Gründen weitest verbreitete Linksschreibweise ϕ(x) sowie die Exponentenschreibweise xϕ .
ϕ0 ist keine Funktion, da es zu dem Element 1 ∈ V (ϕ0 ) mehr als ein Element y ∈ N(ϕ0 ) gibt mit (1; y) ∈ ϕ0 , nämlich y = 1 und y = 2. Die zweite
Komponente ist also nicht eindeutig durch die erste Komponente bestimmt.
1.2.2 Beispiele ϕ1 := {(1; 1), (2; 3), (0; 4)} und ϕ2 := {(1; 3), (2; 3), (0; 4)}
sind Funktionen.
Ist ϕ eine Funktion, so heißt V (ϕ) der Definitionsbereich und N(ϕ) das Bild
(oder die Bildmenge) von ϕ. Jede Menge Y mit N(ϕ) ⊆ Y heißt eine Wertemenge für ϕ. Hat eine Funktion ϕ den Definitionsbereich X und ist Y
eine Wertemenge für ϕ, so heißt ϕ eine Abbildung von X nach (oder: in) Y .
Schreibweise dafür:
ϕ:X →Y
Ordnet ϕ dem Element x ∈ X das Element y ∈ Y zu, so schreiben wir:
ϕ : x 7→ y.
Häufig definiert man Abbildungen durch Angabe von Definitionsbereich,
Wertemenge und Elementzuordnung unter Verwendung beider Pfeil-Schreib”
weisen“, zum Beispiel:
ϕ:
Z → N0
x 7→ x2
30
Für jede Menge X verstehen wir unter der Identität auf X die Funktion
idX :
X → X
x 7→ x,
also: idX = {(x; x)|x ∈ X}.
Eine Funktion heißt injektiv, wenn für alle x, x′ ∈ V (ϕ) gilt:
x 6= x′ ⇒ xϕ 6= x′ ϕ
(bzw. als Kontraposition gleichwertig dazu : xϕ = x′ ϕ ⇒ x = x′ ). Von
unseren obigen Beispielen ist ϕ1 injektiv, ϕ2 nicht.
Seien nun X, Y vorgegebene Mengen und ϕ eine Abbildung von X nach Y . ϕ
heißt surjektiv, wenn die Menge der Bilder unter ϕ ganz Y ergibt, d. h. wenn
gilt:
∀y ∈ Y ∃x ∈ X xϕ = y.
Man beachte: Die Aussage ϕ ist surjektiv“ ist nur sinnvoll in bezug auf eine
”
zuvor gegebene Wertemenge Y . Dagegen ist die Injektivität von ϕ allein an
der Menge ϕ von Urpaaren zu entscheiden. Statt ϕ ist surjektiv“ sagt man
”
auch: ϕ ist eine Abbildung auf Y “. ϕ heißt eine Bijektion von X auf Y (als
”
Adjektiv: bijektiv), wenn ϕ injektiv und surjektiv ist. X heißt gleichmächtig
zu Y , wenn es eine Bijektion von X auf Y gibt.
1.2.3 Beispiele (
ϕ : N → N, k 7→ 2k ist injektiv, aber nicht surjektiv.
k − 1 falls k 6= 1
ist surjektiv, aber nicht injektiv.
ψ : N → N, k 7→
1
falls k = 1
(
−2k
falls k ≤ 0
ist bijektiv.
ω : Z → N0 , k 7→
2k − 1 falls k > 0
Für endliche Mengen X, Y bedeutet die Gleichmächtigkeit, daß X, Y gleich
viele Elemente besitzen.
Mit einer beliebigen Menge ϕ von Urpaaren sind auf natürliche Weise gewisse
andere Mengen von Urpaaren verbunden, die in manchen (auch unseren)
Kontexten eine Rolle spielen werden und daher hier eingeführt seien. Sei
X := V (ϕ), Y := N(ϕ). Ist T ⊆ V (ϕ), so setzen wir
ϕ|T := {p|p ∈ ϕ, p1 ∈ T }.
Ist ϕ eine Funktion, so offensichtlich auch ϕ|T . Sie hat den Definitionsbereich
T und heißt die Einschränkung (oder Restriktion) von ϕ auf T .
31
Sei nun wieder ϕ beliebig, X := V (ϕ), Y := N(ϕ). Wir setzen
xϕ+ := {y|y ∈ Y, (x; y) ∈ ϕ} für jedes x ∈ X
und
ϕ⊆ := {(S; T )|S ⊆ X, T ⊆ Y, T =
[
x∈S
xϕ+ }.
1.2.4 Ist ϕ eine Menge von Urpaaren, X := V (ϕ), Y := N(ϕ), so ist ϕ+
eine Funktion von X in P′ (Y ) und ϕ⊆ eine Funktion von P(X) in P(Y ). Wir nennen ϕ⊆ die zu ϕ gehörige Teilmengenfunktion. Für alle T ⊆ X gilt
T ϕ⊆ = {y|y ∈ Y, ∃x ∈ T
(x; y) ∈ ϕ},
insbesondere {x}ϕ⊆ = {xϕ} für alle x ∈ V (ϕ). Durch Vertauschung der
Komponentenreihenfolge bei den zu ϕ gehörigen Urpaaren erhalten wir
ϕ−1 := {(y; x)|(x; y) ∈ ϕ}
und nennen diese Menge von Urpaaren die Umkehrung von ϕ. Davon klar zu
unterscheiden ist die Menge von Urpaaren
ϕ− := (y; T )|y ∈ N(ϕ), T = {x|(x; y) ∈ ϕ}
(gelesen: ϕ-invers“). Im Gegensatz zu ϕ−1 ist ϕ− stets eine Funktion (und
”
zwar von Y in P′ (X)); dies ergibt sich durch Anwendung von 1.2.4 auf ϕ−1 ,
denn es gilt: ϕ− = (ϕ−1 )+ .
1.2.5
S − Ist ϕ eine Menge von Urpaaren, X := V (ϕ), Y := N(ϕ), so gilt:
yϕ = X.
y∈Y
Beweis: Die Inklusion ⊆“ ist klar.
S Zu− ”⊇“: Sei x ∈ X und z ∈ Y mit
”
−
(x; z) ∈ ϕ. Dann gilt: x ∈ zϕ ⊆
yϕ .
y∈Y
Ist ϕ eine Funktion, y ∈ N(ϕ), so nennt man yϕ− das vollständige Urbild von
y unter ϕ. 1
1.2.6 Ist ϕ eine Funktion, so gilt: ∀y, y ′ ∈ N(ϕ) y 6= y ′ ⇒ yϕ− ∩y ′ ϕ− = ∅.
Insbesondere ist die Funktion ϕ− dann injektiv.
Bisweilen erweitert man den Vorbereich von ϕ− auf eine beliebige Wertemenge W für
ϕ, indem man für alle y ∈ W r N (ϕ) setzt: yϕ− := ∅.
1
32
Beweis: Seien y, y ′ ∈ N(ϕ) und yϕ− ∩ y ′ ϕ− 6= ∅. (Zu zeigen ist: y = y ′) Sei
x ∈ yϕ− ∩ y ′ ϕ− . Dann folgt: y = xϕ = y ′ .
1.2.7 Beispiel Sei ϕ : Z → N0 , z 7→ z 2 . Dann ist N(ϕ) die Menge der
Quadratzahlen, und es gilt: 0ϕ− = {0}, 1ϕ− = {1, −1}, 4ϕ− = {2, −2},
9ϕ− = {3, −3},. . . .
Zwei Mengen A, B heißen disjunkt, wenn gilt: A ∩ B = ∅. Damit besagt
1.2.6: Je zwei verschiedene vollständige Urbilder unter einer Funktion ϕ sind
disjunkt. Daher nennt man die Vereinigung in 1.2.5 bei gegebener Funktion
ϕ auch eine disjunkte Vereinigung.
1.3 Definition (Partition, kanonische Projektion, charakteristische Funktion) Sei X eine Menge und M ⊆ P(X). M heißt eine Partition von X, wenn
gilt:
(o) ∅ ∈
/ M,
S
(i) M = X,
(ii) Je zwei verschiedene zu M gehörige Mengen sind disjunkt.
1.3.1 Beispiele (1) {Z r N0 , {0}, N} ist eine Partition von Z.
(2) Ist G die Menge der geraden, U die Menge der ungeraden ganzen Zahlen,
so ist {G, U} eine Partition von Z.
(3) Ist M eine endliche Menge, n die Anzahl ihrer Elemente, so sei für alle
k ∈ N0 gesetzt: Tk := {S|S ⊆ M, S enthält genau k Elemente}. Dann
ist {Tk |k ∈ n ∪ {0}} eine Partition von P(M).
Aus 1.2.4, 1.2.5 und 1.2.6 erhalten wir:
1.4 Proposition Ist ϕ eine Funktion, so ist die Menge der vollständigen
Urbilder der Elemente von N(ϕ) eine Partition von V (ϕ).
Für diese Partition der ϕ-Urbilder“ verwenden wir die Bezeichnung X/ϕ.
”
Nach Definition ist X/ϕ die Bildmenge der Abbildung ϕ− , und nach 1.2.6
ist ϕ− injektiv. Es folgt:
1.4.1 (Folgerung aus 1.4) Für jede Funktion ϕ mit dem Vorbereich X ist
ϕ− eine Bijektion von N(ϕ) auf die Partition X/ϕ.
33
Sei nun M eine beliebige Partition einer Menge X. Wir setzen
ϕM := {(x; T )|x ∈ X, T ∈ M ∧ x ∈ T }.
Da je zwei verschiedene Elemente von M disjunkt sind, gibt es zu jedem
x ∈ X höchstens ein T ∈ M mit x ∈ T . Da die Vereinigung über M ganz
X ergibt, gibt es zu jedem x ∈ X ein T ∈ M mit x ∈ T . Also ist ϕM eine
Funktion von X in M. Da jede Menge T ∈ M nach (o) nichtleer ist, also
ein Element x enthält, gilt (x; T ) ∈ ϕM , also ist das Bild der Funktion ϕM
gleich M:
1.4.2 Ist M eine Partition einer Menge X, so ist ϕM eine Abbildung von
X auf M.
Die Abbildung ϕM heißt die kanonische Projektion von X auf M.
Sei zum Beispiel M die Partition {G, U} aus 1.3.1(2). Dann gilt: U = 1ϕM =
(−1)ϕM = 3ϕM = (−3)ϕM = . . . , G = 0ϕM = 2ϕM = (−2)ϕM = 4ϕM =
(−4)ϕM = . . . .
Für jede Teilmenge T einer Menge X heißt
χT :
X → {0, 1}
(
1 falls x ∈ T
x 7→
0 falls x ∈
6 T
die charakteristische Funktion bezüglich der Teilmenge T von X. Für die Menge U in 1.3.1(2) erhalten wir zum Beispiel:
(
1 falls x ungerade
χU : Z → {0, 1}, x 7→
.
0 falls x gerade
Die Partition Z/χU ist die Menge {G, U}. Allgemein gilt für jede Teilmenge
T einer Menge X: X/χT = {T, X r T }.
1.5 Definition (Komposition) Seien ϕ, ψ Mengen von Urpaaren. Dann heißt
ϕψ := {(x; z)|x ∈ V (ϕ), z ∈ N(ψ), ∃y ∈ N(φ)∩V (ψ) (x; y) ∈ ϕ∧(y; z) ∈ ψ}
die Komposition von ϕ mit ψ. Der Definition entnimmt man unmittelbar die
folgenden beiden Bemerkungen:
1.5.1 V (ϕψ) = {x|x ∈ V (ϕ), ∃y ∈ V (ψ) (x; y) ∈ ϕ}
34
1.5.2 idV (ϕ) ⊆ ϕϕ−1 , idN (ϕ) ⊆ ϕ−1 ϕ.
1.5.3 Sind ϕ, ψ Funktionen, so ist auch ϕψ eine Funktion, und für alle
x ∈ V (ϕψ) gilt: x(ϕψ) = (xϕ)ψ. Genau dann gilt V (ϕ) = V (ϕψ), wenn
N(ϕ) ⊆ V (ψ).
V (ϕ)
N (ϕ)
ϕ
x
V (ψ)
✲
N (ψ)
ψ
y
✲
z
Die Gleichung x(ϕψ) = (xϕ)ψ besagt, daß erst ϕ, dann ψ auszuführen ist“.
”
Deswegen nennt man ϕψ auch die Hintereinanderausführung von ϕ und ψ.2
Zum Beweis der Funktions-Eigenschaft von ϕψ sei x ∈ V (ϕψ), und seien z,
z ′ ∈ N(ψ) mit (x; z), (x; z ′ ) ∈ ϕψ. Dann gibt es y, y ′ ∈ N(ϕ) ∩ V (ψ) mit
(x; y) ∈ ϕ ∧ (y; z) ∈ ψ ∧ (x; y ′ ) ∈ ϕ ∧ (y ′; z ′ ) ∈ ψ. Da ϕ eine Funktion ist,
folgt y = y ′. Da ψ eine Funktion ist, folgt daraus z = z ′ .
Weiter zeigen wir: ∀x ∈ V (ϕψ) x(ϕψ) = (xϕ)ψ. Dazu sei x ∈ V (ϕψ),
y := xϕ, z := yψ. Es gilt: (xϕ)ψ = yψ = z und auch x ∈ V (ϕ), z ∈ N(ψ),
y ∈ N(ϕ) ∩ V (ψ), (x; y) ∈ ϕ ∧ (y; z) ∈ ψ, d. h. (x; z) ∈ ϕψ, also x(ϕψ) = z.
Die Inklusion V (ϕψ) ⊆ V (ϕ) ist klar. Daher gilt:
V (ϕ) = V (ϕψ) ⇔ ∀x ∈ V (ϕ) xϕ ∈ V (ψ) ⇔ N(ϕ) ⊆ V (ψ).
1.5.4 Sind ϕ, ψ, ω Funktionen, so gilt (ϕψ)ω = ϕ(ψω).
Denn für alle x ∈ V ((ϕψ)ω) gilt: x((ϕψ)ω) = (x(ϕψ))ω = ((xϕ)ψ)ω =
(xϕ)(ψω) = x(ϕ(ψω)) vermöge durchgehender Anwendungen von 1.5.3; desgleichen auch für alle x ∈ V (ϕ(ψω)): Man lese dieselbe Zeile von rechts nach
links. Insbesondere folgt: V ((ϕψ)ω) = V (ϕ(ψω)).
1.5.5 Seien X, Y , Z Mengen, ϕ : X → Y , ψ : Y → Z Abbildungen.
(1) Sind ϕ, ψ injektiv, so auch ϕψ.
(2) Sind ϕ, ψ surjektiv, so auch ϕψ.
(3) Sind ϕ, ψ bijektiv, so auch ϕψ.
2
Man beachte: Bei Verwendung der Links-Schreibweise für Abbildungen (siehe S. 30)
schreibt man dafür ψ ◦ ϕ, gelesen: ψ nach ϕ“. Durch den sprachlichen Trick der Verwen”
dung der Präposition nach wird die Ungunst neutralisiert, daß bei Links-Schreibweise die
später auszuführende Funktion leider als erste zu notieren ist. Es gilt also: ψ ◦ ϕ = ϕψ.
35
(4) Ist ϕψ injektiv, so ist ϕ injektiv.
(5) Ist ϕψ surjektiv, so ist ψ surjektiv.
Beweis. (1) Sind x, x′ ∈ X mit x(ϕψ) = x′ (ϕψ), so folgt aus 1.5.3: (xϕ)ψ =
(x′ ϕ)ψ, also xϕ = x′ ϕ aufgrund der Injektivität von ψ und daraus x = x′
aufgrund der Injektivität von ϕ.
(2) Sei z ∈ Z. Da ψ surjektiv ist, gibt es ein y ∈ Y mit yψ = z. Da ϕ surjekiv
ist, gibt es ein x ∈ X mit xϕ = y. Aus 1.5.3 folgt: x(ϕψ) = (xϕ)ψ = yψ = z.
(3) ist nach (1) und (2) klar.
(4) Seien x, x′ ∈ X mit xϕ = x′ ϕ. Dann folgt aus 1.5.3: x(ϕψ) = (xϕ)ψ =
(x′ ϕ)ψ = x′ (ϕψ), also x = x′ wegen der Injektivität von ϕψ.
(5) Sei z ∈ Z. Nach Voraussetzung gibt es dann ein x ∈ X mit x(ϕψ) = z.
Sei y := xϕ. Dann gilt: y ∈ Y ∧ yψ = (xϕ)ψ = x(ϕψ) = z.
1.6 Proposition (Kennzeichnung der Bijektionen) Seien X, Y Mengen, ϕ
eine Abbildung von X in Y . Es sind äquivalent:
(i) ϕ ist eine Bijektion von X auf Y ,
(ii) ϕϕ−1 = idX ∧ ϕ−1 ϕ = idY ,
(iii) ∃α, β ∈ X Y
ϕα = idX ∧ βϕ = idY
Zusatz Ist ϕ eine Bijektion und sind α, β wie in (iii), so folgt: α = ϕ−1 = β.
Wir nennen diese Funktion dann die Umkehrfunktion von ϕ. Wie (ii) lehrt,
ist 1.6(iii) auch für ϕ−1 anstelle von ϕ erfüllt (nämlich mit α := β := ϕ). Die
Implikation 1.6((iii)⇒(i)) ergibt nun, daß ϕ−1 eine Bijektion von Y auf X
ist. Ist X gleichmächtig zu Y , so ist also auch Y gleichmächtig zu X. Man
sagt in diesem Falle daher kurz: X, Y sind gleichmächtig.“
”
Beweis von 1.6. (i)⇒(ii) Da ϕ surjektiv ist, gilt N(ϕ) = Y . Dank 1.5.2 sind
daher nur noch die Inklusionen ϕϕ−1 ⊆ idX , ϕ−1 ϕ ⊆ idY einzusehen.
Seien x, x′ ∈ X mit (x; x′ ) ∈ ϕϕ−1 . Dann gibt es ein y ∈ Y mit (x; y) ∈ ϕ,
(y; x′ ) ∈ ϕ−1 . Es folgt: (x′ ; y) ∈ ϕ, also x = x′ wegen der Injektivität von ϕ.
Weiter seien y, y ′ ∈ Y mit (y; y ′) ∈ ϕ−1 ϕ. Dann gibt es ein x ∈ X mit
(y; x) ∈ ϕ−1 , (x; y ′) ∈ ϕ. Es folgt (x; y) ∈ ϕ und somit y = y ′ aufgrund der
Funktionseigenschaft von ϕ.
(ii)⇒(iii) Wir möchten α := β := ϕ−1 setzen und müssen nur noch einsehen,
daß die Umkehrung ϕ−1 von ϕ eine Funktion von Y nach X ist. Sind y ∈ Y
36
und x, x′ ∈ X mit (y; x), (y; x′) ∈ ϕ−1 , so folgt (x; y), (x′ ; y) ∈ ϕ, also x = x′
wegen der Injektivität von ϕ.
(iii)⇒(i) Da idX trivialerweise injektiv ist, folgt aus 1.5.5(4) die Injektivität
von ϕ. Da idY surjektiv ist, folgt aus 1.5.5(5) die Surjektivität von ϕ.
Beweis des Zusatzes: Seien α, β ∈ X Y mit ϕα = idX , βϕ = idY . Nach 1.6
und 1.5.4 gilt dann:
α = idY α = (ϕ−1 ϕ)α =ϕ−1 (ϕα) = ϕ−1 idX = ϕ−1 =
= idY ϕ−1 = (βϕ)ϕ−1 = β(ϕϕ−1 ) = β idX = β.
Wir kombinieren nun die beiden Bemerkungen 1.4.1 und 1.4.2: Sei ϕ eine
Abbildung einer Menge X in eine Menge Y , M := X/ϕ. Nach 1.4 ist dann
M eine Partition von X.
Nach 1.4.2 ist die kanonische Projektion ϕM : X → M surjektiv.
Nach 1.4.1 ist die Invers-Funktion ϕ− : N(ϕ) → M bijektiv.
Sei nun ϕ := (ϕ− ) −1 (die Umkehrfunktion von ϕ− gemäß 1.6, Zusatz). Dann
ist ϕ eine bijektive Abbildung M → N(ϕ), also insbesondere eine injektive
Abbildung M → Y .
Für alle x ∈ X gilt: (xϕM )ϕ = xϕ, denn (xϕ)ϕ −1 = (xϕ)ϕ− = xϕM , also
xϕ = ((xϕ)ϕ −1 )ϕ = (xϕM )ϕ, d. h. es gilt:
ϕM ϕ = ϕ.
X
...
...
Y
...
.......
..
ϕ
✲y
✸
...
ϕM
M := X/ϕ
N (ϕ)
ϕ
...
s•
yϕ−
Wir konkretisieren dieses Bild noch durch ein simples Beispiel, die Funktion
ϕ : Z → N0 , x 7→ x2 .
Der Bildbereich N(ϕ) ist dann die Menge der Quadratzahlen, die wir hier
mit Q bezeichnen. Bildgleich unter ϕ sind Elemente von Z genau dann, wenn
sie sich höchstens um das Vorzeichen unterscheiden, also z. B. 2 und −2:
37
Z
...
N0
3. −3.
ϕ
2
..
-2
...
·5
✲ ·4
✸
...
ϕM
M := Z/ϕ
...
•
·9
Q
ϕ
{3, −3}
s•
{2, −2}
Jede Funktion ϕ ist Hintereinanderausführung der surjektiven Abbildung
ϕM : X → M und der injektiven Abbildung ϕ : M → Y .
Damit erhalten wir als Folgerung aus den Bemerkungen 1.4.1 und 1.4.2:
1.7 Proposition (Homomorphiesatz für Mengen) Ist ϕ eine surjektive Abbildung einer Menge X auf eine Menge Y , so ist
{(T ; y)|T ∈ X/ϕ, ∀x ∈ T
xϕ = y}
eine Bijektion von X/ϕ auf Y . Insbesondere sind X/ϕ und Y gleichmächtig.
Denn {(y; T )|T ∈ X/ϕ, ∀x ∈ T xϕ = y} = ϕ− , folglich ist die in 1.7
angegebene Menge von Urpaaren gleich ϕ, also eine Bijektion von X/ϕ auf
N(ϕ) = Y .
Ist zum Beispiel P′fin (N) die Menge der nichtleeren endlichen Teilmengen von
N und
ϕ : P′fin (N) → N, T 7→ max T,
so ist ϕ eine surjektive Abbildung und nϕ− = {T |∃S ∈ P(n − 1) T =
S ∪ {n}} für alle n ∈ N, denn dies ist die Menge aller Teilmengen von N,
deren Maximum n ist. Es ist also die Partition von P′fin (N), die aus diesen
Mengen nϕ− (n ∈ N) besteht, gleichmächtig zu N. Da für jedes n ∈ N die
Menge nϕ− endlich3 ist, läßt sich darüber hinaus zeigen, daß damit sogar
P′fin (N) selbst zu N gleichmächtig ist. Zu N gleichmächtige Mengen heißen
abzählbar.4
1.8 Definition (Folge, Tupel, geordnetes Paar, Matrix) Seien X, Y Mengen. Für die Menge aller Abbildungen von X nach Y schreiben wir Y X .
Aus 1.8.4 erhalten wir die genaue Anzahl der Elemente: 2n−1 .
Es gibt Autoren, die auch endliche Mengen als abzählbar bezeichnen. In deren Sprachgebrauch werden die zu N gleichmächtigen Mengen zur Unterscheidung abzählbar unendlich
genannt.
3
4
38
Von besonderer Bedeutung sind Funktionen, deren Definitionsbereich eine
Teilmenge von Z ist: Unter einer allgemeinen Folge über Y verstehen wir eine Abbildung einer Teilmenge T von Z in Y , und wir verwenden dafür die
Schreibweise (yj )j∈T (wobei yj das Bild von j ∈ T in Y bezeichnet). Im wichtigen Fall T = N heißt (yj )j∈T eine (Standard-)Folge über Y .5
Ein anderer wichtiger Fall liegt vor, wenn T = n für ein n ∈ N gilt. Jede
Abbildung (yj )j∈n heißt ein n-Tupel über Y . Üblich ist dafür die Schreibweise (y1 , . . . , yn ) (wobei wieder yj das Bild von j ∈ n bezeichnet und die
j-te Komponente des n-Tupels heißt); sie ist uns schon bei der Bestimmung
der Lösungen linearer Gleichungssysteme begegnet. So ist etwa (−1, 0, 1) begrifflich nichts anderes als die Funktion {(1; −1), (2; 0), (3; 1)} (unter Verwendung von Pfeilen für die Element-Zuordnung geschrieben: 1 7→ −1, 2 7→ 0,
3 7→ 1). Es ist also
Y N die Menge aller (Standard-)Folgen über Y ,
Y n die Menge aller n-Tupel über Y .
Bei letzterem ist es üblich, den Haken“ wegzulassen, d. h. man schreibt Y n
”
statt Y n .
Ein besonders wichtiger Spezialfall ist durch n = 2 gegeben: Ein 2-Tupel
über Y heißt auch ein geordnetes Paar über Y .
Der Name erinnert nicht zufällig an die Urpaare. In der Tat haben auch die
geordneten Paare die zu 1.1.1’ analoge typische Paar-Eigenschaft“:
”
1.8.1 (a, b) = (c, d) ⇒ a = c ∧ b = d für alle Mengen a, b, c, d.
Gilt nämlich (a, b) = (c, d) und schreiben wir τ für das geordnete Paar (a, b)
(Y := {a, b}), so gilt nach Definition eines 2-Tupels: a = 1τ = c, b = 2τ = d.
Sind M, N Mengen, so setzen wir Y := M ∪ N und
M × N := {(a, b)|a ∈ M, b ∈ N} (⊆ Y 2 ).
Diese Menge heißt das cartesische Produkt6 von M mit N.
5
Dies ist ein vor allem für die Belange der Analysis fundamentaler Begriff. Ihm liegt
die Vorstellung zugrunde, daß gewisse Elemente von Y (die sich dabei allerdings auch
wiederholen dürfen) mit natürlichen Zahlen durchnumeriert“ werden: y1 , y2 , y3 , . . . . Ist
”
in einem mathematischen Kontext ohne weiteren Kommentar von einer Folge die Rede, so
kann man davon ausgehen, daß eine Standard-Folge im oben definierten Sinn oder aber
eine Abbildung mit dem Definitionsbereich N0 gemeint ist. Man nennt allgemeiner eine
Abbildung ϕ einer Menge I in Y bisweilen auch eine Indizierung durch die Indexmenge“
”
I. Das Urpaar (Y ; ϕ) heißt dann eine Familie. Man schreibt Familien in der Regel in der
Form (yi )i∈I , was die Anlehnung an den Folgenbegriff signalisiert.
6
nach René Descartes ( Cartesius“), 1596-1650
”
39
1.8.2 |M × N| = |M| · |N| falls M, N endliche Mengen sind.
Beweis durch Induktion nach |M|: Ist |M| = 0, so folgt M = ∅, also auch
M × N = ∅ und damit |M × N| = |∅| = 0 = 0 · |N| = |M| · |N|. Sei nun
|M| > 0, a ∈ M, M ′ := M r {a}, und es gelte |M ′ × N| = |M ′ | · |N|
(Induktions-Voraussetzung). Für jedes b ∈ N sei definiert: τb := (a, b). Dann
gilt für alle b ∈ N: τb 6∈ M ′ × N, und weiter M × N = (M ′ × N) ∪ {τb |b ∈ N},
also wegen der Disjunktheit dieser Vereinigung
|M × N| = |M ′ × N| + |{(a, b)|b ∈ N}| = |M ′ | · |N| + |N| = |M| · |N|.
Unter einer (M × N)-Matrix über einer Menge X verstehen wir eine Abbildung von M ×N in X. In dem wichtigen Fall M = m, N = n (m, n ∈ N) läßt
man wieder den Haken“ fort und schreibt: (m × n)-Matrix (statt (m × n)”
Matrix).7 Eine (m × n)-Matrix wird häufig in der Form (aij )(i,j)∈m×n bzw.
(aij ) i∈m geschrieben (wobei, analog zu dem Vorherigen, aij für das Bild von
j∈n
(i, j) in X steht).
Jede (m×n)-Matrix A hat m Zeilen“ A1 , . . . , Am und n Spalten“ A1 , . . . , An ,
”
”
definiert als n-Tupel (∼ Zeilen) bzw. m-Tupel (∼ Spalten) über X wie in unseren Setzungen in Kapitel 0, S. 12ff.8
Schließlich beweisen wir zwei wichtige, aufeinander aufbauende klassische
Anzahlformeln:
1.8.3 |Y X | = |Y ||X| , falls X, Y endliche Mengen sind.
Beweis durch vollständige Induktion nach |X|: Ist |X| = 0, also X = ∅, so
gibt es genau eine Abbildung von X in Y , nämlich ∅ (die leere Menge von
Urpaaren). In der Tat ist dann |Y X | = |Y ∅ | = 1 = |Y |0 = |Y ||X| .9 Sei nun
X eine endliche Menge 6= ∅, x ∈ X, X ′ := X r {x}, und es gelte bereits
′
′
′
|Y X | = |Y ||X | (Induktions-Voraussetzung). Für jedes ϕ ∈ Y X und y ∈ Y
sei definiert: ϕy := ϕ ∪ {(x; y)}. Dann ist die Abbildung
′
Y X × Y → Y X , (ϕ, y) 7→ ϕy
7
Man beachte den erheblichen Unterschied zu Kapitel 0: Dort haben wir lediglich
Schreibweisen eingeführt und zugehörige Vorstellungen entwickelt. Hier hingegen erhalten die mit Tupel“ bzw. Matrix“ benannten Gegenstände ihren Platz im systematischen
”
”
Aufbau der mathematischen Begriffswelt.
8
Formal: Ist A eine (m × n)-Matrix über X, i ∈ m, j ∈ n, so heißt das n-Tupel
((i, 1)A, . . . , (i, n)A) die i-te Zeile Ai , das m-Tupel ((1, j)A, . . . , (m, j)A) die j-te Spalte Aj
von A.
9
U. a. an dieser Stelle zeigt sich, wie vernünftig es ist, daß wirklich jede nullte Potenz“
”
0
x durch 1 definiert ist, also auch 00 . Dies bewährt sich (als Randfall) in eigentlich jeder
kombinatorischen Anzahlformel, die eine Potenz als Term enthält.
40
bijektiv: Jede Funktion von X nach Y erhält man auf eindeutige Weise,
indem man eine Funktion von X ′ nach Y dadurch ergänzt, daß man auch
′
noch dem Element x einen Wert in Y zuweist. Es folgt: |Y X | = |Y X ×Y | =
1.8.2
′
|Y X | · |Y | = |Y ||X| .
1.8.4 Für jede Menge X ist {(T ; χT )|T ⊆ X}
auf {0, 1}X . Ist also X endlich, so gilt:
10
eine Bijektion von P(X)
|P(X)| = 2|X| .
Denn zum einen sind zwei Teilmengen gleich, wenn sie dieselbe charakteristische Funktion besitzen, nämlich jeweils gleich dem vollständigen Urbild
von 1. Zum anderen erhält man bei gegebener Funktion ϕ von X in {0, 1}
durch das vollständige Urbild von 1 eine Teilmenge T von X mit χT = ϕ. Die
angegebene Funktion ist also sowohl injektiv wie auch surjektiv. Die Formel
im endlichen Fall folgt nun direkt aus 1.8.3.
1.9 Definition (Relation, reflexiv, symmetrisch, transitiv, teilt, Kongruenz,
Äquivalenz-Relation) Eine Relation ist eine Menge von Paaren. Seien X, Y
Mengen. Unter einer Relation zwischen X und Y versteht man eine Teilmenge
von X × Y . Für uns wird hier ausschließlich der Spezialfall X = Y von
Interesse sein. Eine Relation zwischen X und X wird eine Relation auf X
genannt. Für jede Relation S heißt S ∩ (X × X) die von S auf X induzierte
Relation.
1.9.1 Beispiel Sei X := N, R := {(x, y)|x, y ∈ N, ∃n ∈ N y = x + n}.
Offenbar liegt ein Paar (x, y) natürlicher Zahlen genau dann in R, wenn x
echt kleiner als y ist. Daher heißt diese Relation die Kleiner-Relation auf N.
Sie gehört zu den aus Schulzeiten altgewohnten Gegenständen, wird allerdings nicht nur für natürliche Zahlen, sondern allgemeiner für reelle Zahlen
betrachtet (was in der obigen Definition ausdrücklich nicht geschehen ist!). R
ist die von der (auf der Menge der reellen Zahlen gegebenen) Relation < auf
N induzierte Relation.11 Bildet man bei geordneten Paaren wie bei Urpaaren
nun die Umkehrung, so wird aus < die Relation größer“, geschrieben: >.
”
Die Gewohnheit, z. B. 3 < 5“ statt (3, 5) ∈<“ zu schreiben, läßt auch die
”
”
allgemeine Konvention folgender Schreibweise als natürlich erscheinen: Ist R
10
Zur Definition von χT siehe 1.3.
Baut man systematisch die Zahlbereiche vom Mengenbegriff aus auf und hat auf N
erklärt, was +“ bedeuten soll – Teil eines Themas, das uns noch im nächsten Kapitel
”
bevorsteht, – so kann man kleiner“ wörtlich als unsere obige Relation R definieren; d. h.
”
im systematischen Aufbau erhält kleiner“ erst dadurch seinen Platz in der Begriffswelt.
”
11
41
eine Relation, so schreiben wir xRy statt (x, y) ∈ R.
Eine Relation R heißt auf einer Menge X
reflexiv, wenn gilt: ∀x ∈ X
12
xRx
symmetrisch, wenn gilt: ∀x, x′ ∈ X
transitiv, wenn gilt: ∀x, x′ , x′′ ∈ X
(xRx′ ⇒ x′ Rx)
(xRx′ , x′ Rx′′ ⇒ xRx′′ ).
Zum Beispiel sind die Relationen < und > auf der Menge der reellen Zahlen,
also erst recht auf N, transitiv, aber weder reflexiv noch symmetrisch, dagegen die (die Gleichheit zulassende) Kleiner-oder-gleich“-Relation ≤ reflexiv
”
und transitiv, aber sie ist nicht symmetrisch. Weiter ist die Relation 6=, Un”
gleichheit“, symmetrisch, aber nicht reflexiv und nicht transitiv; es gilt z. B.
1 6= 2 und 2 6= 1, aber nicht 1 6= 1.
Ein besonders wichtiges Beispiel einer Relation auf der Menge Z der ganzen
Zahlen erhält man durch die Setzung
| := {(x, y)|x, y ∈ Z, ∃z ∈ Z y = xz}.
Dies ist die Teiler-Relation auf Z, kurz: teilt“.
”
| ist reflexiv, denn für alle x ∈ Z gilt x = x · 1, also x|x. | ist transitiv; sind
nämlich x, y, v ∈ Z mit x|y, y|v, so gibt es z, z ′ ∈ Z mit y = xz, v = yz ′ , so
daß folgt: v = xzz ′ , mithin x|v. | ist nicht symmetrisch, denn z. B. gilt 2|6,
aber nicht 6|2. (Für x teilt nicht y“ schreibt man: x ∤ y.)
”
Die Relation | ist Grundlage für eine wichtige Sorte von Relationen auf Z,
von der wir zunächst ein Beispiel betrachten: Wir setzen
≡:= {(x, y)|x, y ∈ Z, 3|x − y}.
3
Diese Relation heißt die Kongruenz modulo 3. Sie ist reflexiv, da für jedes
x ∈ Z die Differenz x − x, also die Zahl 0, von jeder ganzen Zahl geteilt
wird, also auch von 3. Sie ist symmetrisch, da für alle x, y ∈ Z die Gleichung
y − x = −(x − y) gilt, also 3|x − y genau dann gilt, wenn 3|y − x. Weiter
12
Ohne den relativierenden Bezug auf X nennt man R (absolut) reflexiv, symmetrisch
bzw. transitiv, wenn die angegebenen Implikationen für die gesamte Komponentenmenge
von R (d. h. die Menge aller bei den zu R gehörigen Paaren vorkommenden Komponenten)
erfüllt sind. Ist R im absoluten Sinne symmetrisch bzw. transitiv, so ist R auch auf jeder
Menge X symmetrisch bzw. transitiv. Man beachte aber: Die Reflexivität überträgt sich
nur auf solche Mengen X, die in der Komponentenmenge von R enthalten sind ! Als Extremfall sei erwähnt: Die leere Relation ∅ ist symmetrisch und transitiv auf jeder Menge,
aber reflexiv nur auf der Menge X = ∅.
42
ist sie auch transitiv: Sind x, y, z ∈ Z und gilt x ≡ y, y ≡ z, d. h. 3|x − y,
3
3|y − z, so folgt: 3|(x − y) + (y − z) = x − z, d. h. x ≡ z.
3
3
Für welche x ∈ Z gilt x ≡ 0, 1, . . . ?
3
x ≡ 0 ⇔ 3|x − 0 ⇔ ∃z ∈ Z x = 3z.
3
Für die Menge dieser Elemente x schreiben wir kurz 3Z.
x ≡ 1 ⇔ 3|x − 1 ⇔ ∃z ∈ Z x = 3z + 1.
3
Für die Menge dieser Elemente x schreiben wir entsprechend 3Z + 1. Ebenso
versteht es sich, daß wir 3Z + 2 für die Menge der ganzen Zahlen x mit x ≡ 2
3
schreiben. Die Bedingung x ≡ 3 ist gleichwertig zu x ≡ 0, wurde also schon
3
3
behandelt, wie überhaupt jede weitere Kongruenz x ≡ j für irgendein j ∈ Z.
3
Die Menge der x, die eine solche Kongruenz erfüllen, ist eine der drei Mengen
3Z, 3Z + 1, 3Z + 2: Es gilt 3Z + j = 3Z + i für dasjenige i ∈ {0, 1, 2}, für das
gilt: j ≡ i. Jede ganze Zahl liegt also in genau einer der Mengen
3
3Z :
{ . . . , −9, −6, −3, 0, 3, 6, 9, 12, . . . }
3Z + 1 : { . . . , −8, −5, −2, 1, 4, 7, 10, 13, . . . }
3Z + 2 : { . . . , −7, −4, −1, 2, 5, 8, 11, 14, . . . }
Diese bilden daher eine Partition von Z.
Eine Relation R auf einer Menge X heißt eine Äquivalenz-Relation auf X,
wenn R reflexiv, symmetrisch und transitiv ist. Zum Beispiel ist ≡ eine
3
Äquivalenz-Relation auf Z. Allgemein beweist man dies bei gegebenem k ∈ Z
genauso wie im Falle k = 3 für die Kongruenz modulo k: 13
≡:= {(x, y)|x, y ∈ Z, k|x − y}.
k
1.9.2 Für jedes k ∈ Z gilt: ≡ ist eine Äquivalenz-Relation auf Z.
k
1.9.3 Ist ϕ eine Abbildung einer Menge X in eine Menge Y , so setzen wir
∼ϕ := {(x, x′ )|x, x′ ∈ X, xϕ = x′ ϕ}.
Dann ist ∼ϕ eine Äquivalenz-Relation auf X:
13
Man beachte, daß ≡ die All-Relation“ Z × Z, ≡ dagegen die Gleichheits-Relation auf
”
1
0
Z ist. Negative Werte für k haben keine eigenständige Bedeutung, denn es gilt ≡= ≡ für
k
alle k ∈ Z.
43
−k
Denn für alle x ∈ X gilt xϕ = xϕ, d. h. ∼ϕ ist reflexiv; weiter bedeutet
(x, x′ ) ∈∼ϕ dasselbe wie (x′ , x) ∈∼ϕ , nämlich xϕ = x′ ϕ, d. h. ∼ϕ ist symmetrisch; schließlich folgt genauso simpel auch die Transitivität von ∼ϕ .
Ist nun ∼ eine beliebige Relation auf einer Menge X, x0 ∈ X, so setzen wir
[x0 ]∼ := {x|x ∈ X, x ∼ x0 }.
Trivial ist
1.9.4 ∼ reflexiv ⇔ ∀x0 ∈ X
x0 ∈ [x0 ].
Ist ∼ eine Äquivalenz-Relation, so heißt [x0 ]∼ die Äquivalenzklasse von x0 .
Jedes Element x ∈ [x0 ]∼ heißt ein Repräsentant der Äquivalenzklasse von x0 .
Eine Teilmenge T von X heißt eine Äquivalenzklasse bezüglich ∼, wenn es ein
x0 ∈ X gibt mit T = [x0 ]∼ .
1.9.5 Beispiele (1) Kongruenzklassen:
[0]≡ = 3Z,
[1]≡ = 3Z + 1,
3
[2]≡ = 3Z + 2,
3
3
= [3]≡ = [6]≡ = . . .
= [4]≡ = [7]≡ = . . .
= [5]≡ = [8]≡ = . . .
= [−3]≡ = [−6]≡ = . . .
= [−2]≡ = [−5]≡ = . . .
= [−1]≡ = [−4]≡ = . . .
3
3
3
3
3
3
3
3
3
3
3
3
Allgemein: [0]≡ = kZ, [1]≡ = kZ+1, . . . , [k−1]≡ = kZ+(k−1) = kZ+(−1)
k
k
k
(2) Vollständige Urbilder: Sei ϕ eine Abbildung einer Menge X in eine Menge
Y . Die Äquivalenzklassen bezüglich ∼ϕ (siehe 1.9.3) sind die vollständigen
Urbilder yϕ− mit y ∈ N(ϕ).
Zum Beweis von (2) seien x0 , x ∈ X. Es gilt: x ∈ [x0 ]∼ϕ ⇔ x ∼ϕ x0 ⇔ xϕ =
x0 ϕ. Setzen wir y := x0 ϕ− , so folgt: [x0 ]∼ϕ = yϕ− .
Insbesondere ergibt nun 1.4: Die Menge der Äquivalenzklassen bezüglich ∼ϕ
ist die Partition X/ϕ der ϕ-Urbilder.
1.9.6 Ist ∼ Äquivalenz-Relation auf einer Menge X, so gilt für alle x0 , x ∈ X
x ∈ [x0 ]∼ ⇔ [x]∼ = [x0 ]∼
Beweis. Es gelte zunächst x ∈ [x0 ]∼ , also x ∼ x0 . Für beliebiges y ∈ X folgt
dann aus der Transitivität von ∼
y ∈ [x]∼ ⇒ y ∼ x ⇒ y ∼ x0 .
44
Weil wegen der Symmetrie von ∼ auch x0 ∼ x gilt, folgt wieder mit der
Transitivität auch
y ∈ [x0 ]∼ ⇒ y ∼ x0 ⇒ y ∼ x.
Also gilt [x]∼ = [x0 ]∼ . – Für die Umkehrung ist nur zu bemerken, daß nach
1.9.4 x ∈ [x]∼ gilt.
1.10 Satz Sei X eine Menge.
(1) Sei ∼ eine Äquivalenz-Relation auf X. Dann ist die Menge der Äquivalenzklassen bezüglich ∼ eine Partition von X.
(2) Sei M eine Partition von X. Dann ist
∼:= {(x, x′ )|x, x′ ∈ X, ∃T ∈ M x ∈ T, x′ ∈ T }
eine Äquivalenz-Relation auf X und M die Menge ihrer Äquivalenzklassen.
Für die Menge der Äquivalenzklassen zu einer Äquivalenz-Relation ∼ schreiben wir X/ ∼.
Beweis. (1) Wir haben die drei definierenden Eigenschaften einer Partition
(siehe 1.3) nachzuweisen:
(o) Ist T ∈ X/∼, so gibt es ein x0 ∈ X mit T = [x0 ]∼ , nach 1.9.4 also x0 ∈ T ,
damit T 6= ∅.
S
S
(i) Sei x ∈ X. Nach 1.9.4 gilt: x ∈ [x]∼ ⊆ X/∼. Es folgt: X ⊆ X/∼,
also Gleichheit.
(ii) Seien S, T ∈ X/∼ mit S ∩ T 6= ∅, x ∈ S ∩ T . Durch Anwendung von
1.9.6 auf S und T erhalten wir: S = [x]∼ = T.
(2) Wir haben zunächst für ∼ die drei definierenden Eigenschaften einer
Äquivalenz-Relation nachzuweisen:
S
Reflexivität: Sei x ∈ X. Wegen M = X gibt es ein T ∈ M mit x ∈ T .
Also gilt (x, x) ∈ ∼.
Symmetrie: Seien x, x′ ∈ X mit (x, x′ ) ∈ ∼. Dann gibt es ein T ∈ M mit
x ∈ T , x′ ∈ T . Es folgt: (x′ , x) ∈ ∼.
Transitivität: Seien x, x′ , x′′ ∈ X mit (x, x′ ) ∈ ∼, (x′ , x′′ ) ∈ ∼. Dann gibt
es ein T ∈ M mit x, x′ ∈ T und ein S ∈ M mit x′ , x′′ ∈ S. Dann gilt
x′ ∈ S ∩ T , also S = T , aufgrund der paarweisen Disjunktheit der Elemente
von M. Da also x, x′′ ∈ T , folgt (x, x′′ ) ∈ ∼.
45
Gilt T ∈ M und x ∈ T , so ist (x, x′ ) ∈ ∼ gleichwertig zu x′ ∈ T ; also gilt
[x]∼ = T . Daher ist jedes T ∈ M eine Äquivalenzklasse bezüglich ∼. Ist umgekehrt S eine Äquivalenzklasse
bezüglich ∼, so S 6= ∅. Ist x ∈ S, so gibt es
S
ein T ∈ M mit x ∈ T (da M = X). Da T eine Äquivalenzklasse bezüglich
∼ ist, folgt aus 1.9.6: S = [x]∼ = T ∈ M.
Damit besteht zwischen Äquivalenz-Relationen auf X und Partitionen von
X eine bijektive Entsprechung.
Folgerung Sei k ∈ N. Die Menge der Kongruenzklassen modulo k ist eine
k-elementige Partition von Z. Es gilt: Z/≡ = {kZ, kZ+1, . . . , kZ+(k −1)}.
k
Schließlich streifen wir einen weiteren wichtigen Spezialfall des Relationsbegriffs, den der Ordnungsrelation:
1.11 Definition (strikt antisymmetrisch, vergleichbar, Striktordnung, totale (lineare) Ordnung) Sei X eine Menge. Eine Relation R heißt auf X strikt
antisymmetrisch, wenn gilt:
∀a, b ∈ X
(a, b) 6∈ R ∨ (b, a) 6∈ R,
d. h. wenn niemals zugleich (a, b) ∈ R und (b, a) ∈ R gilt. Eine auf X transitive, strikt antisymmetrische Relation heißt eine strikte Ordnung (oder Striktordnung oder strikte Ordnungsrelation) auf X.
Zum Beispiel sind auf N die Relationen < ( echt kleiner“), > ( echt größer“)
”
”
und k( := {(x, y)|x, y ∈ N, x|y ∧ x 6= y}) ( echter Teiler von“) Striktordnun”
gen.
Ein Element v ∈ X heißt vergleichbar bezüglich einer Relation R auf X, wenn
für alle a ∈ X r {v} gilt: (a, v) ∈ R ∨ (v, a) ∈ R. Ist R eine strikte Ordnung
auf X und jedes Element von X vergleichbar bezüglich R, so heißt R eine
totale (oder lineare) Striktordnung auf X.
Von den genannten Striktordnungen auf N sind < und > totale Ordnungen,
k dagegen nicht; z. B. gilt weder 2k3 noch 3k2.
Eine (gewöhnliche) Ordnung auf X erhält man, indem man eine Striktordnung auf X mit der Gleichheit auf X vereinigt. D. h. eine Striktordnung R
auf X induziert eine (gewöhnliche) Ordnung R auf X durch die Setzung
∀x, y ∈ X
(xRy
: ⇔ xRy ∨ x = y).
R ist die kleinste reflexive Relation auf X, die R enthält. Die naheliegendsten Beispiele auf N sind die Ordnungen ≤, ≥, |. Dabei sind wieder die
46
ersten beiden totale Ordnungen, die letzte nicht. Relationen, die reflexiv, antisymmetrisch und transitiv sind, dennt man auch teilweise Ordnungen, zur
Unterscheidung von totalen Ordnungen, in denen die Bedingung der Vergleichbarkeit erfüllt sein muß. Ist (X; R) eine geordnete Menge, so heißt eine
Teilmenge K von X eine Kette, wenn (K; R) eine total geordnete Menge ist.
Aufbau der wichtigsten Begriffe
→ : wird begrifflich weiterentwickelt zu“
”
↓ : wird spezialisiert zu“
”
Urpaar →
Funktion, Y X
↓
n-Tupel (X = n)
↓
geordnetes Paar (n = 2), M × N
47
→ Relation
↓
(i) Äquivalenz-Relation↔Partition
(ii) Ordnungsrelation
Kapitel 2
Verknüpfungen
2.1 Definition Seien A, B Mengen. Unter einer Verknüpfung zwischen A und
B verstehen wir eine Funktion ϕ mit A × B ⊆ V (ϕ). 1
2.1.1 Beispiele Sei n ∈ N.
(1) ϕ : Q × Qn → Qn , (a, (b1 , . . . , bn )) 7→ (ab1 , . . . , abn ) ist eine Verknüpfung
zwischen Q und Qn und erinnert an Kapitel 0, S. 14, wo wir für das
Bildelement die Schreibweise
a · (b1 , . . . , bn )
verwendet haben.
(2) ϕ : Qn × Qn → Q, ((a1 , . . . , an ), (b1 , . . . , bn )) 7→ a1 b1 + · · · + an bn . Diese
Verknüpfung zwischen Qn und Qn heißt das Standardskalarprodukt von
Qn .
(3) Seien X, Y , Z beliebige Mengen. Dann erhalten wir vermöge der Komposition von Abbildungen eine Verknüpfung HEA zwischen Y X und Z Y :
HEA : Y X × Z Y → Z X ,
(α, β) 7→ αβ,
(wobei die Bezeichnung HEA an Hinter-Einander-Ausführung erinnern soll).
Besonders wichtig und häufig sind Fälle, in denen sowohl A = B als auch
(A × A)ϕ ⊆ A gilt. Dann nennt man ϕ eine Verknüpfung auf der Menge A.2
1
Wir weisen darauf hin, daß unsere Definition nicht verlangt, daß A × B der genaue
Definitionsbereich von ϕ ist! Ist dies jedoch der Fall, so ist eine Verknüpfung ϕ zwischen
A und B nichts anderes als eine (A × B)-Matrix über X, wenn X eine den Bildbereich
von ϕ enthaltende Menge ist (s. S. 40).
2
Das Wort auf“ bedeutet hier nicht, daß ϕ surjektiv sein muß!
”
48
Die in der Schule als Grundrechenarten“ bezeichneten Verknüpfungen +
”
und · sind Beispiele für Verknüpfungen auf N, auf Z, auf Q, auf R. Ist A
endlich, so läßt sich eine Verknüpfung auf A konkret in Matrix-Schreibweise
angeben, wobei die Elemente von A oberhalb der Spalten und vor Beginn
der Zeilen (üblicherweise in derselben Reihenfolge) aufgelistet werden. Am
Schnittpunkt der Zeile zu dem Element a ∈ A mit der Spalte zu dem Element
b ∈ A wird das Element (a, b)ϕ notiert, wodurch die sog. Verknüpfungsta”
fel“ zu ϕ entsteht.3 Hat A zum Beispiel genau zwei Elemente G, U – die
Bezeichnung soll an gerade“, ungerade“ denken lassen –, so können wir
”
”
in naheliegender Weise zwei Verknüpfungen #, · durch die folgenden Verknüpfungstafeln definieren:
Addition“:
”
# G U
G G U
U U G
,
Multiplikation“:
”
· G U
G G G
U G U
Ist ϕ irgendeine Verknüpfung auf einer Menge A und sind a, b, c ∈ A mit
(a, b)ϕ = c, so schreibt man dafür üblicherweise aϕb = c, d. h. der Name ϕ
wird zu einem Verknüpfungssymbol“, und aus diesem Grunde wählt man als
”
Bezeichnungen für Verknüpfungen statt eines (griechischen oder lateinischen)
Buchstabens meist Zeichen wie ◦, •, +, ·.
(3) +̇ : Qn × Qn → Qn ,
(a1 , . . . , an )+̇(b1 , . . . , bn ) = (a1 + b1 , . . . , an + bn )
(4) Ist A = P(X) für eine Menge X, so sind ∩, ∪, △ Verknüpfungen auf A.
Eine Verknüpfung ◦ auf A heißt assoziativ auf A 4 , wenn für alle a, b, ∈ A
gilt: (a ◦ b) ◦ c = a ◦ (b ◦ c); kommutativ auf A, wenn für alle a, b ∈ A gilt:
a ◦ b = b ◦ a.
Ein Element e ∈ A heißt neutral in (A; ◦) (auch: in A bezüglich ◦), wenn für
alle a ∈ A gilt: a ◦ e = a = e ◦ a.5
Beispielsweise (siehe (4)) sind bei beliebiger gegebener Menge X die Verknüpfungen ∩, ∪, △ auf P(X) assoziativ und kommutativ.6 Bezüglich jeder
der drei Verknüpfungen gibt es in P(X) ein neutrales Element: X ist neutral
3
Man vergleiche mit der in Fußnote 1 erwähnten Sichtweise einer Verknüpfung.
Gilt V (◦) = A × A, so nennt man ◦ kurz assoziativ (statt assoziativ auf A). Entsprechendes gilt bezüglich der Kommutativität.
5
Das Entscheidende an der Neutralität ist, daß das Verknüpfen mit einem beliebigen
Element von A das letztere unverändert läßt. Die daraus folgende schwächere Eigenschaft,
daß e mit jedem a ∈ A vertauschbar ist, sollte nicht etwa zu einer verfehlten Assoziation
mit dem Kommutativgesetz verleiten.
6
Die Assoziativität von △ ist eine keineswegs offensichtliche Übungsaufgabe!
4
49
bezüglich ∩, ∅ ist neutral sowohl bezüglich ∪ als auch bezüglich △. In N gibt
es bezüglich + kein neutrales Element, während bezüglich · das Element 1
neutral ist. Man verifiziert unmittelbar:
2.1.2 Die zu einer Verknüpfung ◦ auf A gehörige Teilmengenfunktion7 ◦⊆
ist eine Verknüpfung auf P(A). Ist ◦ assoziativ (bzw. kommutativ) auf A, so
ist ◦⊆ assoziativ (bzw. kommutativ) auf P(A). Ist e ∈ A neutral bezüglich
◦, so ist {e} neutral in P(A) bezüglich ◦⊆ .
2.1.3 Ist ◦ irgendeine Verknüpfung auf A, so gibt es in A höchstens ein
neutrales Element bezüglich ◦.
Beweis. Seien e, f ∈ A neutrale Elemente bezüglich ◦. Dann gilt:
e = e ◦ f = f,
die erste Gleichung wegen der Neutralität von f , die zweite wegen der Neutralität von e. Es folgt: e = f .
2.2 Definition (Magma, Trägermenge, unitär, Halbgruppe, Semigruppe, Monoid, Gruppe) Ein Magma ist ein Urpaar (A; ◦), bei dem ◦ eine Verknüpfung
auf A ist. A heißt die Trägermenge des Magmas. Ein Magma (A; ◦) heißt assoziativ, wenn ◦ assoziativ auf A; kommutativ, wenn ◦ kommutativ auf A ist;
unitär, wenn es in A ein bezüglich ◦ neutrales Element gibt. Eine Halbgruppe
(auch: Semigruppe) ist ein assoziatives Magma. Ein Monoid ist eine unitäre
Halbgruppe.
Zum Beispiel ist (N; +) eine kommutative Halbgruppe, aber kein Monoid,
während (N0 ; +) ein kommutatives Monoid (mit dem neutralen Element 0)
ist. (Z; ·) ist ein kommutatives Monoid (mit dem neutralen Element 1), ebenso (Q; ·).
Ist (A; ◦) ein unitäres Magma mit neutralem Element e und sind a, b ∈ A
mit a ◦ b = e = b ◦ a, so heißt b invers zu a (bezüglich ·). Trivialerweise gilt
für beliebige Elemente a, b der Trägermenge eines unitären Magmas:
2.2.1 Ist b invers zu a, so ist a invers zu b.
Zwar formal inkorrekt, aber bequem und ohne sonderliche Gefahr von Mißverständnissen üblich ist es, kurz Element eines Magmas“ statt Element
”
”
der Trägermenge eines Magmas“ sagen. Ein Element a ∈ A heißt invertierbar
in (A; ◦), wenn es in A ein zu a (bezüglich ◦) inverses Element gibt.
7
Siehe S. 32. Zwar ist ◦⊆ auf P(A × A) erklärt, doch ist für uns nur von Interesse, daß
P(A) × P(A) darin enthalten ist (siehe Fußnote 1).
50
Zum Beispiel ist bei gegebener Menge X in (P(X); ∩) das neutrale Element
X auch das einzige invertierbare Element. Gibt es nämlich zu S ⊆ X ein
T ⊆ X mit S ∩ T = X, so folgt S = T = X. In (P(X); ∪) ist ähnlich ∅ das
einzige invertierbare Element. In (P(X); △) dagegen ist jedes Element invertierbar, und zwar invers zu sich selbst, denn für alle T ⊆ X gilt: T △T = ∅.
Sehr leicht lassen sich bereits unitäre Magmen mit 3-elementiger Trägermenge definieren, in der es zu einem Element sogar mehr als ein inverses Element
gibt. Solche Magmen sind dann jedoch jedenfalls nicht assoziativ, denn es
gilt:
2.2.2 In einem Monoid gibt es zu jedem Element höchstens ein inverses
Element.
Beweis. Sei (A; ◦) ein Monoid, e sein neutrales Element, a ∈ A, und seien b,
b′ ∈ A invers zu a. Wir berechnen auf zweifache Weise das Produkt b ◦ a ◦ b′ :
(b ◦ a) ◦ b′ = e ◦ b′ = b′ ,
b ◦ (a ◦ b′ ) = b ◦ e = b.
Da die Terme auf der linken Seite wegen der Assoziativität von ◦ gleich sind,
müssen auch die rechten Seiten gleich sein, d. h. b = b′ .
Wenn es also in einem Monoid zu einem Element a ein inverses Element gibt,
so ist dieses eindeutig bestimmt. Auf dieser Einsicht beruht die folgende
Konvention für die Schreibweise inverser Elemente in Monoiden (A; ◦): Bezeichnet man ◦ als Multiplikation“, so schreibt man a−1 für das zu einem
”
invertierbaren Element a inverse Element in (A; ◦). Bezeichnet man ◦ als Ad”
dition“, so schreibt man −a für das zu a inverse Element (auch genannt: das
”
Inverse zu a“) in (A; ◦). Das neutrale Element wird als die Eins“ (Schreib”
weise: 1A ) bzw. als die Null“ (Schreibweise: 0A ) des Monoids bezeichnet,
”
je nachdem man für die Verknüpfung die multiplikative oder die additive
Sprechweise benutzt.8
2.2.3 Seien a, b invertierbare Elemente eines Monoids. Dann folgt:
(1) a−1 ist invertierbar, und zwar gilt: (a−1 )−1 = a,
(2) a ◦ b ist invertierbar, und zwar gilt: (a ◦ b)−1 = b−1 ◦ a−1 .
8
Gebräuchlich ist es, für kommutative Verknüpfungen das Zeichen +, für beliebige
Verknüpfungen – die aber im Spezialfall natürlich ebenfalls kommutativ sein dürfen –
dagegen · oder ◦ zu verwenden.
51
Beweis. (1) ist nur eine Neuformulierung von 2.2.1, während (2) aus der
Gleichungskette
(a ◦ b) ◦ (b−1 ◦ a−1 ) = ((a ◦ b) ◦ b−1 ) ◦ a−1 = (a ◦ (b ◦ b−1 )) ◦ a−1 =
= (a ◦ e) ◦ a−1 = a ◦ a−1 = e = · · · = (b−1 ◦ a−1 ) ◦ (a ◦ b)
folgt.
Eine Gruppe ist ein Monoid, in dem jedes Element invertierbar ist. Kommutative Gruppen nennt man auch abelsche Gruppen9 .
Zum Beispiel sind (N0 ; +), (Z; ·), (Q; ·) kommutative Monoide, aber keine
Gruppen, ebenso (P(X); ∩), (P(X); ∪) bei gegebener nichtleerer Menge X.
Dagegen sind (Z; +), (Q; +), (Q r {0}; ·) abelsche Gruppen. Für jede Menge
X ist auch (P(X); △) eine abelsche Gruppe, und zwar mit der Besonderheit,
daß jedes Element gleich seinem Inversen ist.
2.3 Proposition Für jede Menge X gilt:
(1) (X X ; HEA) ist ein Monoid (mit idX als neutralem Element),
(2) SX := {ϕ|ϕ ∈ X X , ϕ bijektiv} ist (bezüglich der Verknüpfung HEA) eine
Gruppe.
Die Gruppe (SX ; HEA) heißt die symmetrische Gruppe auf X. Die Elemente
von SX heißen Permutationen von X.
Beweis. (1) Nach Beispiel (3) in 2.1.1 ist HEA eine Verknüpfung auf X X und
nach 1.5.4 assoziativ. Ferner gilt: ϕidX = ϕ = idX ϕ.
(2) Nach 1.5.5(3) ist HEA eine Verknüpfung auf SX und nach (1) assoziativ.
Wegen idX ∈ SX ist SX Monoid mit neutralem Element idX . Ist ϕ ∈ SX , so
nach dem Zusatz zu 1.6 auch die Umkehrfunktion von ϕ, und deren Komposition mit ϕ ergibt – von links wie von rechts – idX ; also ist sie invers zu
ϕ.10
Im häufig betrachteten Spezialfall X = n (für ein n ∈ N) schreibt man Sn
(statt Sn ). Eine Permutation von n ist ein bijektives n-Tupel über n. In
natürlicher Weise schreibt man Permutationen ϕ ∈ Sn daher als sog. Bildzeile:
(1ϕ, 2ϕ, . . . , nϕ),
9
nach Niels Hendrik Abel (1802 – 1829), norwegischer Algebraiker
Die früher eingeführte Schreibweise ϕ−1“ für die Umkehrfunktion von ϕ ist also mit
”
der in 2.2 eingeführten Schreibweise für inverse Elemente konsistent.
10
52
häufig aber auch als Zweizeiler, in dem die obere Zeile die Elemente 1, . . . , n
in ihrer natürlichen Reihenfolge, die untere dagegen in der durch ϕ permutierten Reihenfolge wiedergibt; es stehen hierbei also stets Urbild und Bild
übereinander:
1 2 ... n
1ϕ 2ϕ . . . nϕ.
Für n ≥ 3 ist die Gruppe (Sn ; HEA) nicht kommutativ, denn zum Beispiel
gilt: 11
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
=
6=
=
3 1 2
2 1 3
3 2 1
1 3 2
2 1 3
3 1 2
Wir geben eine Verknüpfungstafel der Gruppe S3 an:
HEA id3
id3
α
β
ρ
σ
τ
id3
α
β
ρ
σ
τ
α= 1 2 3
2 3 1
α
β
id3
σ
τ
ρ
β= 1 2 3
3 1 2
β
id3
α
τ
ρ
σ
ρ= 1 2 3
2 1 3
ρ
τ
σ
id3
β
α
σ= 1 2 3
3 2 1
σ
ρ
τ
α
id3
β
τ= 1 2 3
1 3 2
τ
σ
ρ
β
α
id3
Verknüpft man Elemente der Teilmenge {id3 , α, β}, so liegt das Ergebnis
stets wieder in {id3 , α, β}; dies ist der Verknüpfungstafel unmittelbar zu entnehmen. Auch die folgenden Teilmengen haben offenbar diese Eigenschaft:
{id3 , ρ},
{id3 , σ},
{id3 , τ },
ferner trivialerweise auch S3 selbst und {id3 }. Diese Teilmengen sind also
Trägermengen von Magmen (bezüglich der Verknüpfung HEA), und zwar sogar
von Gruppen, wie leicht zu sehen. Eine leichte Übungsaufgabe ist es zu zeigen,
daß die eben genannten Teilmengen die einzigen mit dieser Eigenschaft sind.
2.4 Definition (abgeschlossen, Teilmagma, Teilhalbgruppe, Teilmonoid, Teilgruppe, Untermagma, Untermonoid, Untergruppe) Sei (A; ◦) ein Magma,
T ⊆ A. T heißt (bezüglich ◦) abgeschlossen, wenn ◦ eine Verknüpfung auf
11
Warnung: Autoren, die die Linksschreibweise von Abbildungen verwenden, erlauben
sich bisweilen, bei der Komposition von Permutationen, das Zeichen ◦ ( nach“!) aus Be”
quemlichkeit wegzulassen. Die irritierende Konsequenz ist leider, daß die Komposition
dann wie hier notiert wird, die Ergebnisse gegenüber der von uns angegebenen Rechnung
aber vertauscht erscheinen! Darauf sollte man beim Lesen in der Literatur gefaßt sein.
53
T ist (d. h. (T × T )◦⊆ ⊆ T ). Eine abgeschlossene Teilmenge heißt auch ein
Teilmagma oder ein Untermagma von (A; ◦). T nennen wir eine Teilhalbgruppe
bzw. ein Teilmonoid bzw. eine Teilgruppe von (A; ◦), wenn (T ; ◦) eine Halbgruppe bzw. ein Monoid bzw. eine Gruppe ist.
Eine Teilhalbgruppe einer Halbgruppe (A; ◦) nennt man eine Unterhalbgruppe
von (A; ◦), ein Teilmonoid T eines Monoids (A; ◦) mit 1T = 1A ein Untermonoid von (A; ◦). Eine Teilgruppe einer Gruppe (A; ◦) wird eine Untergruppe
von (A; ◦) genannt; in diesem Fall stimmen die neutralen Elemente von (T ; ◦)
und (A; ◦) automatisch überein:
2.4.1 Ist T eine Teilgruppe einer Gruppe (A; ◦), so gilt 1T = 1A . Gilt a ∈ T ,
so hat a in (G; ◦) dasselbe Inverse wie in (T ; ◦).
Beweis: Sei x das Inverse von 1T in der Gruppe (A; ◦). Es gilt:
1A = 1T ◦ x = (1T ◦ 1T ) ◦ x = 1T ◦ (1T ◦ x) = 1T ◦ 1A = 1T .
Wegen 1T = 1A ist das Inverse von a ∈ T in (T ; ◦) auch ein Inverses in (A; ◦).
Dieses ist aber nach 2.2.2 eindeutig bestimmt.
Zum Beispiel ist N Unterhalbgruppe (aber kein Teilmonoid) von (Z; +) und
Untermonoid von (Z; ·). Die Menge −N der negativen ganzen Zahlen ist eine
Unterhalbgruppe von (Z; +), nicht jedoch von (Z; ·). Nach 2.3 ist für jede
Menge X die Menge SX der Permutationen von X eine Teilgruppe des Monoids (X X ; HEA), und zwar mit demselben neutralen Element, also auch ein
Untermonoid.
Ohne Gefahr von Mißverständnissen erlauben wir uns im Fall einer Teilgruppe T eines unitären Magmas (A; ◦) mit 1T = 1A , von einer Untergruppe zu
sprechen, auch wenn (A; ◦) keine Gruppe ist. Im Gegensatz zu dem äußerst
wichtigen Begriff der Untergruppe hat der oben aus rein systematischem
Grund eingeführte Begriff der Teilgruppe kaum eine Bedeutung in klassischen algebraischen Theorien.
Die einelementige Teilmenge {0} ist Untergruppe von (Z; +), sowie Teilgruppe, aber keine Untergruppe von (Z; ·). Allgemein ist in einem Magma (A; ◦)
eine einelementige Teilmenge {x} genau dann ein Teilmagma, wenn gilt:
x ◦ x = x. Ein Element x mit dieser Eigenschaft heißt idempotent (oder: ein
”
Idempotent“ von (A; ◦)). Die Idempotenten von (Z; ·) sind 0 und 1, während
0 das einzige Idempotent von (Z; +) ist. In einer Gruppe ist das neutrale
Element stets das einzige Idempotent, wie aus der Gleichung x ◦ x = x durch
Multiplikation mit x−1 sofort folgt.
2.4.2 Ist T ein unitäres Teilmagma eines Magmas (A; ◦), so ist T ein idempotentes Element des Magmas (P(A); ◦⊆ ).
54
Denn T ◦⊆ T ⊆ T , weil T unter ◦ abgeschlossen ist, und T = {1T } ◦⊆ T ⊆
T ◦⊆ T.
2.4.3 Sei x ein Idempotent einer Semigruppe (A; ◦) und M(x) := {y|y ∈
A, y ◦ x = y = x ◦ y}. Dann ist M(x) ein Teilmonoid von (A; ◦) mit dem
neutralen Element x.
Nach Voraussetzung über x gilt x ∈ M(x), und für alle y, z ∈ M(x) gilt:
(y ◦ z) ◦ x = y ◦ (z ◦ x) = y ◦ z = (x ◦ y) ◦ z = x ◦ (y ◦ z),
also y ◦ z ∈ M(x). Nach Definition von M(x) ist x neutral in (M(x); ◦). Da
◦ assoziativ auf A ist, folgt die Behauptung.
2.5 Proposition Sei (M; ◦) ein Monoid und E die Menge der invertierbaren
Elemente von (M; ◦). Dann ist E eine Untergruppe von (M; ◦).
Beweis. Sei e das neutrale Element von (M; ◦). Nach 2.2.3(2) ist E bezüglich
◦ abgeschlossen. Da ◦ auf M assoziativ ist, ist ◦ auch auf E assoziativ. Die
Gleichung e = e ◦ e zeigt, daß e ∈ E gilt; also ist e auch neutral in (E; ◦)
und letzteres somit ein Monoid. Gilt a ∈ E, so liegt nach 2.2.3(1) das in M
existierende Inverse a−1 ebenfalls in E. Daher ist in (E; ◦) jedes Element von
E invertierbar.
Die Gruppe (E; ◦) in 2.5 heißt die Einheitengruppe des Monoids (M; ◦).
Zur Hervorhebung des Bezuges zu (M; ◦) wird ihre Trägermenge auch mit
E(M; ◦) bezeichnet.
Zum Beispiel gilt: E(Z; ·) = {1, −1} (neutral: 1), E(Z; +) = Z (neutral: 0),
E(Q; ·) = Q r {0} (neutral: 1), E(X X ; HEA) = SX (neutral: idX ).
Eine besonders interessante Einheitengruppe gerät durch die Kombination
von 2.4.2 und 2.4.3, ausgehend von einer abelschen Gruppe (A; +), ins Blickfeld: Jede Untergruppe T von (A; +) ist ein Idempotent von (P(A); +⊆ ), so
daß nach 2.4.3 M(T ) ein Teilmonoid von (P(A); +⊆ ) ist. Die Gruppe dessen
invertierbarer Elemente beschreibt
2.6 Proposition Sei T eine Untergruppe einer abelschen Gruppe (A; +).
Dann besteht die Gruppe der invertierbaren Elemente des Teilmonoids M(T )
von (P(A); +⊆ ) aus den Teilmengen T + a mit a ∈ A.12 Jedes Element von
M(T ) ist Vereinigung einer Menge invertierbarer Elemente von (M(T ); +⊆ )
12
Dabei steht T + a für T +⊆ {a}, besteht also aus den Elementen x ∈ A, zu denen es
ein y ∈ T gibt mit x = y + a.
55
Beweis. Sei X ∈ M(T
S ). Dann gilt T +⊆ X = X, folglich T + b ⊆ X für alle
b ∈ X und X = b∈X (T + b), da (nach 2.4.1) b = 0A + b ∈ T + b für alle
b ∈ X.
Sei nun E die Menge der invertierbaren Elemente des Monoids (M(T ); +⊆ ).
Für alle a ∈ T gilt dann (unter Verwendung der Kommutativität von + an
der mit (∗) markierten Stelle)
(T +a)+⊆ (T +(−a)) = T +⊆ {a}+⊆ T +⊆ {−a} = T +⊆ T +⊆ {a}+⊆ {−a} = T
(∗)
und vermöge Anwendung desselben mit −a statt a auch
(T + (−a)) +⊆ (T + a) = T,
also T + a ∈ E. (Die Schlußaussage in 2.6 ist damit insbesondere schon
bewiesen.) Sei X ∈ E und Y das Inverse zu X in (E; +⊆ ). Dann folgt
[
[
[
T = X +⊆ Y =
(T + b) +⊆
(T + b′ ) =
T + b + b′ ,
b∈X
b′ ∈Y
(∗)
(b,b′ )∈X×Y
also b + b′ ∈ TSfür alle b ∈ X, b′ ∈ Y . Ist also c ein beliebiges Element von Y ,
so folgt X = b∈X (T + b) ⊆ T + (−c). Für alle b ∈ X gibt es also ein t ∈ T
mit b = t + (−c),
S woraus T + b = T + t + (−c) = T + (−c) folgt. Mit a := −c
gilt also X = b∈X (T + b) = T + a.
2.7 Definition (Restklasse, Faktorgruppe) Sei (A; +) eine abelsche Gruppe
und T eine Untergruppe von (A; +). Unter einer Restklasse von (A; +) nach
T versteht man eine Teilmenge X von A, zu der es ein a ∈ A gibt mit
X = T + a. Für jedes a ∈ A heißt T + a die Restklasse von a modulo T . Mit
A/T wird die Menge aller Restklassen von (A; +) nach T bezeichnet. Nach
2.6 ist (A/T ; +⊆ ) eine Gruppe. Diese heißt die Faktorgruppe von (A; +) nach
56
T.
13
Für alle a, b ∈ A gilt:
(T + a) +⊆ (T + b) = T + (a + b).
Untergruppen von Gruppen werden durch das folgende gleichermaßen einfache wie wichtige Kriterium gekennzeichnet:
2.8 Proposition (Untergruppenkriterium) Sei (G; ◦) eine Gruppe,
T ⊆ G. Es sind äquivalent:
(i) T ist eine Untergruppe von (G; ◦),
(ii) T 6= ∅
∧
∀a, b ∈ T
a ◦ b−1 ∈ T .14
Folgerung T
Ist M eine nichtleere Menge von Untergruppen einer Gruppe G,
so ist auch M eine Untergruppe von G.
Beweis. (i)⇒(ii) Es gelte (i). T hat ein neutrales Element, also gilt T 6= ∅.
Sind a, b ∈ T , so (mit 2.4.1) auch b−1 ∈ T , also aufgrund der Abgeschlossenheit von T auch a ◦ b−1 ∈ T .
(ii)⇒(i) Es gelte (ii). Es ist T 6= ∅, sei also c ∈ T . Nach Voraussetzung (mit
a = b = c) gilt dann c ◦ c−1 ∈ T , d. h. 1G ∈ T . Sind a, b ∈ T , so gilt daher
zunächst auch 1G ◦ b−1 ∈ T , also b−1 ∈ T. Weiter gilt dann a ◦ (b−1 )−1 ∈ T ,
nach 2.2.3(1) heißt das a ◦ b ∈ T . Also ist (T ; ◦) ein Monoid. Da mit b ∈ T
auch b−1 = 1G ◦ b−1 ∈ T gilt, ist (T ; ◦) eine Gruppe.
Zur Folgerung: Sei T
M eine nichtleere Menge von Untergruppen einer Gruppe G. Wir zeigen: M erfüllt (ii): Für alle T ∈ M gilt 1G ∈ T nach 2.4.1,
13
Bei genauem Hinsehen stellt man leicht fest, daß statt der Kommutativität von (A; +)
für die gesamte Konstruktion der Faktorgruppe nach T nur die wesentlich schwächere Eigenschaft der Untergruppe T eingeht, die im Beweis von 2.6 an der durch (∗) gekennzeichneten Stelle benutzt wird: T +⊆ {a} = {a} +⊆ T , bequemer“ geschrieben: T + a = a + T
”
für alle a ∈ T . Ist also (A; ◦) eine beliebige Gruppe und T eine Untergruppe mit der
Eigenschaft
(∗)
∀a ∈ A
T ◦ a = a ◦ T,
so ist die Menge A/T der Restklassen T ◦ a mit a ∈ A eine Teilgruppe von (P(A); ◦⊆ ),
die die Faktorgruppe von (A; ◦) nach T genannt wird. Die Untergruppen T mit der Eigenschaft (∗) spielen daher in der Gruppentheorie eine besonders wichtige Rolle; sie werden
Normalteiler von (A; ◦) genannt. In abelschen Gruppen ist natürlich jede Untergruppe ein
Normalteiler. In der Gruppe (S3 ; HEA) dagegen (siehe S. 53 sind die drei 2-elementigen
Untergruppen keine Normalteiler, die drei übrigen dagegen sind Normalteiler.
14
Bei additiver Schreibweise nimmt (ii) die Form an: T 6= ∅ ∧ ∀a, b ∈ T a − b ∈ T ,
wobei a − b := a + (−b). Die Subtraktion“ ist keine Verknüpfung von eigenständiger
”
Bedeutung, sondern wird (in abelschen Gruppen) wie angegeben auf die Addition und die
Inversenbildung zurückgeführt.
57
T
T
also: 1G ∈ M. Sind a, b T
∈ M, so a ◦ b−1 ∈ T für alle
T T ∈ M (nach
2.8(i)⇒(ii)), also a ◦ b−1 ∈ M. Damit wird 2.8(ii) von M erfüllt. Die
Behauptung folgt somit aus 2.8.
2.8.1 Beispiel Für alle k ∈ Z ist kZ eine Untergruppe von (Z; +).
Denn 0 ∈ kZ, und wenn a, b ∈ kZ, so k|a, k|b und damit auch: k|(a − b),
d. h. a − b ∈ kZ. 15
2.9 Proposition (Fundamentalbeispiel einer Gruppenkonstruktion)
Sei (G; ◦) eine Gruppe und X eine Menge. Auf der Menge GX definieren wir
˙ indem wir für alle ϕ, ψ ∈ GX setzen:
eine Verknüpfung ◦,
˙ : X → G, x 7→ xϕ ◦ xψ.
ϕ◦ψ
˙ eine Gruppe. Genau dann ist (GX ; ◦)
˙ abelsch, wenn (G; ◦)
Dann ist (GX ; ; ◦)
abelsch ist.
Beweis. ◦˙ ist assoziativ: Sind ϕ, ψ, ω ∈ GX , so gilt für alle x ∈ X:
˙ ◦ω)
˙ = x(ϕ◦ψ)
˙ ◦ xω = (xϕ ◦ xψ) ◦ xω
x((ϕ◦ψ)
˙ = x(ϕ◦(ψ
˙ ◦ω)).
˙
= xϕ ◦ (xψ ◦ xω) = xϕ ◦ x(ϕ◦ω)
◦ass.
˙ ◦ω
˙ = ϕ◦(ψ
˙ ◦ω).
˙
Es folgt: (ϕ◦ψ)
Bezeichnet e das neutrale Element von (G; ◦), so ist die Funktion ε : X → G,
˙ Ist ϕ ∈ GX , so gilt für alle x ∈ X
x 7→ e, neutral in (GX ; ◦):
˙ = xϕ ◦ xε = xϕ ◦ e = xϕ = e ◦ xϕ = xε ◦ xϕ = x(ε◦ϕ).
˙
x(ϕ◦ε)
˙ ein Monoid. Sei ϕ ∈ GX . Wir definieren ϕ̄ : X → G,
Also ist (GX ; ◦)
−1
x 7→ (xϕ) . Dann ist ϕ̄ zu ϕ invers, denn für alle x ∈ X gilt:
˙
x(ϕ◦˙ ϕ̄) = xϕ ◦ (xϕ)−1 = e = (xϕ)−1 ◦ xϕ = x(ϕ̄◦ϕ),
˙ Ist ◦ auf G kommutativ, so folgt für alle ϕ, ψ ∈ GX ,
also gilt: ϕ◦˙ ϕ̄ = ε = ϕ̄◦ϕ.
x∈X
˙
˙
x(ϕ◦)ψ)
= xϕ ◦ xψ = xψ ◦ xϕ = x(ψ ◦ϕ),
15
Es ist übrigens nicht schwer einzusehen, daß diese Untergruppen auch die einzigen
Untergruppen von (Z; +) sind: Die triviale Untergruppe {0} hat die Form kZ, da man nur
k = 0 zu setzen braucht. Ist T eine Untergruppe 6= {0} von (Z; +), so enthält T eine von 0
verschiedene, damit aber auch eine natürliche Zahl (da zu einer ganzen Zahl a 6= 0 entweder
a oder −a in N liegt). Setzt man nun k := min(T ∩ N), so folgt mittels vollständiger
Induktion für alle n ∈ N leicht kn ∈ T , damit aber aufgrund der Abgeschlossenheit von
T gegen Inversenbildung auch kZ ⊆ T . Ist jetzt t ∈ T und z ∈ Z minimal mit kz ≥ t, so
folgt 0 ≤ kz − t < k und kz − t ∈ T , nach Wahl von k also kz − t = 0, d. h. t = kz ∈ kZ.
58
˙ = ψ ◦ϕ.
˙ Ist umgekehrt ◦˙ auf GX kommutativ und sind a, b ∈ G, so
also ϕ◦ψ
sei ϕ : X → G, x 7→ a, ψ : X → G, x 7→ b. Dann folgt:
˙ = x(ψ ◦ϕ)
˙ = xψ ◦ xϕ = b ◦ a.
a ◦ b = xϕ ◦ xψ = x(ϕ◦ψ)
1. Spezialfall: n ∈ N, X = n, also GX = Gn . Die Menge der n-Tupel über
G ist bezüglich komponentenweiser Verknüpfung eine Gruppe.
2. Spezialfall: m, n ∈ N, X = m × n, also GX = Gm×n . Die Menge der
(m × n)-Matrizen über G ist bezüglich komponentenweiser Verknüpfung eine
Gruppe.
2.10 Definition (direkte Summe, direktes Produkt, direkte Zerlegung, direkter Summand, direkter Faktor) Seien (A; ◦), (B; ◦ ) Magmen. Für alle a,
A
a′ ∈ A, b, b′ ∈ B setzen wir
B
(a, b) ◦ (a′ , b′ ) := (a ◦ a′ , b ◦ b′ ).
A
B
Das Magma (A × B; ◦) heißt bei additiver Sprechweise die direkte Summe
(und wird dann häufig in der Form A ⊕ B geschrieben), bei multiplikativer
Sprechweise das direkte Produkt von (A; ◦) mit (B; ◦ ). Trivial ist:
A
B
2.10.1 Ist T ein Teilmagma von (A; ◦) und S ein Teilmagma von (B; ◦ ), so
A
B
ist T × S ein Teilmagma von (A × B; ◦).
Die Teilmagmen von (A×B; ◦) entstehen jedoch i. a. keineswegs alle auf diese
Weise! Vor dem katastrophalen Irrtum, dies zu denken, kann nicht deutlich
genug gewarnt werden. Wir betrachten einige Beispiele mit A = B = Q und
der Addition als Verknüpfung (auf Q bzw. Q2 ):
2.10.2 Beispiele (1) Q × {0}, {0} × Q sind Teilmagmen von (Q2 ; +) nach
2.10.1 (sogar Untergruppen). Betrachtet man die Funktion ϕ : Q → Q2 ,
c 7→ (c, 0), so gilt:
(i) ϕ ist eine Bijektion von Q auf Q × {0}.
(ii) Sind a, a′ , b ∈ Q mit a + a′ = b, so folgt aϕ + a′ ϕ = bϕ,
denn (a, 0)+(a′, 0) = (a+a′ , 0+0) = (a+a′ , 0). Man nennt eine Abbildung
ϕ mit (1i),(1ii) einen Isomorphismus von (Q; +) auf (Q × {0}; +).
(2) Sei U := {(a, a)|a ∈ Q}. Dann ist U eine Untergruppe von (Q2 ; +) und
ϕ : Q → U, a 7→ (a, a), ist ein Isomorphismus von (Q; +) auf (U; +). Die
Untergruppe U hat nicht die Form T × S mit T , S ⊆ Q.
59
(3) Sei V := {(a, −a)|a ∈ Q}. Da + kommutativ ist, ist V eine Untergruppe
von (Q2 ; +), denn für alle a, a′ ∈ Q gilt
(a, −a) + (a′ , −a′ ) = (a + a′ , (−a) + (−a′ )) = (a + a′ , −(a′ + a))
= (a + a′ , −(a + a′ )).
Es ist also ϕ : Q → V , a 7→ (a, −a) ein Isomorphismus von (Q; +) auf
(V ; +). Auch V hat nicht die Form T × S mit T , S ⊆ Q.
Es gilt: U ∩ V = {(0, 0)}, denn für ein a ∈ Q folgt aus a = −a offenbar a = 0.
Weiter gilt U +⊆ V = Q2 : Ist nämlich x ∈ Q2 , so existieren r, s ∈ Q mit
x = (r, s). Setzen wir a := r+s
, b := r−s
, so folgt
2
2
r + s r − s r + s r − s
= (r, s) = x.
+
,
−
2
2
2
2
(a, a) + (b, −b) =
Offenbar gilt auch: (Q×{0})∩({0}×Q) = {(0, 0)}, (Q×{0})+⊆ ({0}×Q) =
Q2 .
Gewisse Phänomene aus diesen Beispielen sind von allgemeinem Charakter:
2.10.3 Besitzen (A; ◦), (B; ◦ ) neutrale Elemente eA bzw. eB , so ist (eA , eB )
A
B
neutral in (A × B; ◦).
2.10.4 Sind (A; ◦), (B; ◦ ) Gruppen, so ist auch (A × B; ◦) eine Gruppe.
A
B
Denn nach 2.10.3 ist (eA , eB ) neutral bezüglich ◦, und zu (a, b) ∈ A × B ist
(a−1 , b−1 ) invers.
Additiv schreibt man (bei gegebenen Gruppen (A; +), (B; +))
A⊕B
für die Gruppe (A × B; ◦).
Sei (G; ◦) eine Gruppe. Unter einer 2-teiligen direkten Zerlegung von (G; ◦)
versteht man eine Menge {Y, Z} von Untergruppen Y , Z von (G; ◦) mit den
Eigenschaften:
(i) Für alle y ∈ Y , z ∈ Z gilt: y ◦ z = z ◦ y.16
(ii) Für jedes x ∈ G gibt es genau ein Paar (y, z) mit y ∈ Y , z ∈ Z, so daß
gilt: x = y ◦ z.
16
Für diese Bedingung wird auch die Formulierung verwandt: Y , Z sind miteinander
”
elementweise vertauschbar“. Sie besagt nichts über die Vertauschbarkeit zweier Elemente,
die beide zu Y bzw. beide zu Z gehören.
60
Sei 1G das neutrale Element von (G; ◦). Wir nennen {{1G }, G} die triviale
direkte Zerlegung von (G; ◦). Ist Y eine Untergruppe von (G; ◦), zu der es
eine Untergruppe Z von (G; ◦) gibt, so daß {Y, Z} eine direkte Zerlegung
von (G; ◦) ist, so heißt Y bei additiver Sprechweise ein direkter Summand, bei
multiplikativer Sprechweise ein direkter Faktor von (G; ◦). Wir beweisen eine
Äquivalenz zu (ii):
2.10.5 (ii)⇔ Y ◦⊆ Z = G, Y ∩ Z = {1G }
Die Gleichung Y ◦⊆ Z = G bedeutet, daß es zu jedem x ∈ G Elemente y ∈ Y ,
z ∈ Z gibt mit y ◦ z = x. Gilt Y ∩ Z = {1G } und sind y, y ′ ∈ Y , z, z ′ ∈ Z
mit y ◦ z = y ′ ◦ z ′ , so folgt
y ′−1 ◦ y = z ′ ◦ z −1 ,
| {z } | {z }
∈Z
∈Y
wegen Y ∩ Z = {1G } also y ′−1 ◦ y = 1G = z ′ ◦ z −1 und damit y = y ′, z = z ′ .
Gilt dagegen Y ∩ Z 6= {1G } und ist 1G 6= x ∈ Y ∩ Z, so sind (x, 1G ) und
(1G , x) beides Paare, deren Komponentenprodukt jeweils gleich x ist. Wegen
x 6= 1G gilt (x, 1G ) 6= (1G , x), also ist die Eindeutigkeitsbedingung in (ii)
verletzt. Damit gilt die Eindeutigkeit genau dann, wenn Y ∩ Z = {1G }. Die Bedingung (i) gilt in abelschen Gruppen (G; ◦) trivialerweise. In unseren
obigen Beispielen gilt daher, daß {U, V } sowie {Q × {0}, {0} × Q} 2-teilige
direkte Zerlegungen von (Q2 ; +) sind.17 U, V , Q × {0}, {0} × Q sind also Beispiele für direkte Summanden von (Q2 ; +). Diese Untergruppen sind
sämtlich zu (Q; +) isomorph.
2.11 Definition (Isomorphismus, Monomorphismus, Epimorphismus, Endomorphismus, Automorphismus) Sind (A; ◦), (B; ·) Magmen, so versteht
man unter einem Isomorphismus von (A; ◦) auf (B; ·) eine Abbildung ϕ :
A → B mit
(i) ϕ ist bijektiv,
(ii) ∀x, y ∈ A (x ◦ y)ϕ = xϕ · yϕ.
Gibt es einen Isomorphismus von (A; ◦) auf (B; ·), so heißt (A; ◦) isomorph
zu (B; ·). Schreibweise dafür: (A; ◦) ∼
= (B; ·). Gilt (ii), so heißt ϕ ein Homomorphismus von (A; ◦) in (B; ·). Ein injektiver Homomorphismus heißt ein
17
Die erste dieser Aussagen wird falsch, wenn man darin Q durch Z ersetzt, die zweite
nicht. – Man erkennt leicht, daß auch {U, {0} × Q}, {V, {0} × Q}, {U, Q × {0}) und {V, Q ×
{0}) 2-teilige direkte Zerlegungen von (Q2 ; +) sind.
61
Monomorphismus, ein surjektiver Homomorphismus ein Epimorphismus. Unter einem Endomorphismus von (A; ◦) versteht man einen Homomorphismus
von (A; ◦) in (A; ◦). Ist dieser gleichzeitig eine Bijektion von A auf sich, so
nennt man ihn einen Automorphismus von (A; ◦).
2.11.1 Beispiel (siehe 2.9, 1. Spezialfall) Sei (G; ◦) eine Gruppe, e ihr neutrales Element, n ∈ N und j ∈ n. Wir setzen
Gj := {(e, . . . , e, g, e, . . . , e)|g ∈ G} = {ϕ|ϕ ∈ Gn , ∀i ∈ n r {j} iϕ = e} .
| {z } | {z }
j−1
n−j
˙ Setzen wir nämlich
Dann ist Gj ein direkter Summand von (Gn ; ◦).
G(j) := {(g1 , . . . , gj−1, e, gj+1, . . . , gn }|gi ∈ G} = {ϕ|ϕ ∈ Gn , jϕ = e} ,
˙ Die Abbildungen
so ist {Gj , G(j) } eine 2-teilige direkte Zerlegung von (Gn ; ◦).
G → Gj ,
und
Gn−1 → G(j) ,
g 7→ (e, . . . , e, g, e, . . . , e)
| {z } | {z }
j−1
n−j
(x1 , . . . , xn−1 ) 7→ (x1 , . . . , xj−1 , e, xj , . . . , xn−1 )
sind Isomorphismen (bezüglich der jeweils zugehörigen Gruppenverknüpfungen). Sei
ω : G → Gn , g 7→ (g, . . . , g),
˙ und ω ein IsomorphisU := Bild ω. Dann ist U eine Untergruppe von (Gn ; ◦)
˙ Ist (G; ◦) abelsch, so ist {U, G(j) } für jedes j ∈ n
mus von (G; ◦) auf (U; ◦).
˙
eine 2-teilige direkte Zerlegung von (Gn ; ◦).
2.11.2 Seien (A; ◦), (B; ◦ ) Gruppen, 1A bzw. 1B ihre neutralen Elemente,
A
B
G := A × B und ◦ wie in 2.10. Sei
A∗ := {(a, 1B )|a ∈ A}, B ∗ := {(1A , b)|b ∈ B}.
Dann ist {A∗ , B ∗ } eine 2-teilige direkte Zerlegung von (G; ◦), und
ϕ : A → A∗ , a 7→ (a, 1B ),
sind Isomorphismen.
62
ψ : B → B ∗ , b 7→ (1A , b)
Beweis. Seien y ∈ A∗ , z ∈ B ∗ . Dann existieren a ∈ A, b ∈ B mit y = (a, 1B ),
z = (1A , b). Es folgt:
y ◦ z = (a, 1B ) ◦ (1A ; b) = (a, b) = (1A , b) ◦ (a, 1B ) = z ◦ y.
Ist x ∈ G, so gibt es a ∈ A, b ∈ B mit x = (a, b) = (a, 1B ) ◦ (1A , b), es gilt
also: G = A∗ ◦⊆ B ∗ . Weiter gilt A∗ ∩ B ∗ = {(1A , 1B )}. Mit 2.10.5 folgt nun
die erste Behauptung. Für alle a, a′ ∈ A gilt
(a ◦ ϕ = (a ◦ a′ , 1B ) = (a, 1B ) ◦ (a′ , 1B ) = aϕ ◦ a′ ϕ.
A
A
Also ist ϕ ein Homomorphismus, und die Bijektivität von ϕ ist aufgrund der
Definition von A∗ klar. Ebenso ist auch ψ ein Isomorphismus.
In umgekehrter Richtung gilt:
2.11.3 Ist {Y, Z} eine 2-teilige direkte Zerlegung einer Gruppe (G; ·), so
gilt (Y × Z; ◦) ∼
= (G; ·), und zwar ist ϕ : Y × Z → G, (y, z) 7→ y · z, ein
Isomorphismus.
Beweis. Seien y, y ′ ∈ Y , z, z ′ ∈ Z. Es gilt:
((y, z) ◦ (y ′ , z ′ ))ϕ = (y · y ′ , z · z ′ )ϕ = (y · y ′ ) · (z · z ′ ) = y · (y ′ · z) · z ′
= y · (z · y ′) · z ′ = (y · z) · (y ′ · z ′ ) = (y, z)ϕ · (y ′, z ′ )ϕ.
Also ist ϕ ein Homomorphismus. Nach 2.10.5 gilt Y ·⊆ Z = G, woraus die
Surjektivität von ϕ folgt. Aus der Eindeutigkeitsaussage in 2.10,(ii), folgt die
Injektivität von ϕ.
2.12 Definition (Distributiv(-Gesetze), Doppelmagma, Algebra, Trägergruppe, Ring, unitär, Null-Element, Eins-Element) Seien Magmen (A; +),
A
(B; +), (C; +) gegeben. (Wir verwenden für die Verknüpfungen hier die adB
ditive Schreibweise, da unsere hauptsächlichen Anwendungen im Folgenden
sich auf abelsche Gruppen beziehen werden. Zunächst wird aber über die Verknüpfungen auf A, B, C noch nichts Einschränkendes vorausgesetzt.) Eine
Verknüpfung · zwischen A und B mit A ·⊆ B ⊆ C heißt distributiv, wenn die
folgenden beiden Bedingungen gelten:
(D1 )
∀a ∈ A ∀b, b′ ∈ B
a · (b + b′ ) = a · b + a · b′
(D2 )
∀a, a′ ∈ A ∀b ∈ B
(a + a′ ) · b = a · b + a′ · b
B
A
Dabei heißt (D1 ) das Links-Distributivgesetz, (D2 ) das Rechts-Distributivgesetz.
63
2.12.1 Besitzt A ein bezüglich + neutrales Element 0A und ist (C; +) eine
A
Gruppe mit dem neutralen Element 0C , so folgt aus (D2 ) für alle b ∈ B
(1) 0A · b = 0C ,
(2) (−a) · b = −(a · b) für alle bezüglich + invertierbaren Elemente a ∈ A.
A
Beweis. (1) Für alle b ∈ B gilt 0A · b = (0A + 0A ) · b = 0A · b + 0A · b, also
A
0C = 0A · b + (−(0A · b)) = 0A · b + 0A · b + (−(0A · b)) = 0A · b.
(2) Ist a ∈ A bezüglich + invertierbar, so folgt für alle b ∈ B
A
a · b + (−a) · b = (a + (−a)) · b = 0A · b = 0C ,
(1)
also die Behauptung.
Natürlich gilt ebenso:
2.12.2 Besitzt B ein bezüglich + neutrales Element 0B und ist (C; +) eine
B
Gruppe mit dem neutralen Element 0C , so folgt aus (D1 ) für alle a ∈ A
(1) a · 0B = 0C ,
(2) a · (−b) = −(a · b) für alle bezüglich + invertierbaren Elemente b ∈ B.
B
Eine wichtige Sorte algebraischer Strukturen ergibt sich durch die Spezialisierung A = B = C, + = + = +. Sind +, · zunächst irgendwelche VerA
B
knüpfungen auf der Menge A, so nennen wir ((A; +); ·) ein Doppelmagma.
Interessante Doppelmagmen entstehen, wenn zwischen den Verknüpfungen +
und · gewisse Beziehungen gelten: Ist (A; +) eine abelsche Gruppe und · eine
distributive Verknüpfung auf A, so heißt das Doppelmagma ((A; +); ·) eine
Algebra. Dann wird (A; +) die Trägergruppe der Algebra und · ihre Multipli”
kation“ genannt. Ist · kommutativ auf A, so heißt die Algebra kommutativ;
ebenso heißt die Algebra assoziativ, wenn · auf A assoziativ ist.18 Assoziative
Algebren heißen auch Ringe. Das additiv neutrale Element 0A einer Algebra
((A; +); ·) heißt das Null-Element (auch die Null“) der Algebra. Eine Alge”
bra ((A; +); ·) wird unitär genannt, wenn sie ein neutrales Element 1A 6= 0A
bezüglich · enthält; dieses heißt dann das Eins-Element (auch die Eins“) der
”
18
Daß diese Spezifikation sich nur auf die Multiplikation der Algebra beziehen kann, ist
deswegen klar, weil ja die Verknüpfung + ohnehin stets kommutativ und assoziativ auf A
ist.
64
Algebra.19
Zum Beispiel ist ((Z; +); ·) ein kommutativer unitärer Ring; allgemeiner gilt
dies für ((Zn ; +̇); ·) (n ∈ N), wobei die Verknüpfungen komponentenweise zu
verstehen sind. Auch ((Q; +); ·), ((R; +); ·) sind kommutative unitäre Ringe.
Dagegen ist ((N; +); ·) kein Ring, weil (N; +) keine Gruppe ist.
Aus 2.12.1 und 2.12.2 folgt
2.12.3 Ist ((A; +); ·) eine Algebra, so gilt für alle a, b ∈ A
(1) 0A · a = 0A = a · 0A ,
(2) (−a) · b = −(a · b) = a · (−b).
2.13 Definition (Körper) Ein Körper ist ein kommutativer unitärer Ring
((A; +); ·), in dem jedes Element 6= 0A ein multiplikativ Inverses besitzt. Ein
Doppelmagma ((A; +); ·) ist also genau dann ein Körper, wenn (A; +) und
(A r {0A }; ·) abelsche Gruppen sind und · distributiv ist. Zum Beispiel sind
((Q; +)·), ((R; +)·) Körper, jedoch ist ((Z; +)·) kein Körper, da (Z r {0}; ·)
keine Gruppe ist.
Es gibt jedoch auch Körper ganz anderer Bauart: Setzen wir nämlich etwa
A := {G, U} und definieren zwei Verknüpfungen #, · auf A wie auf S. 49, so
ist (A; #) eine abelsche Gruppe (0A = G) und (A r {G}; ·) ebenfalls (und
zwar mit der 1-elementigen Trägermenge {U}). Ein Produkt a·b mit a, b ∈ A
ist gleich G, wenn a = G gilt, und gleich b, wenn a = U gilt; daraus folgt
sofort die Distributivität der Multiplikation ·. Also ist ((A; #); ·) ein Körper,
der genau zwei Elemente enthält: 0A = G 6= U = 1A .
Wir schreiben im folgenden [x] für die Kongruenzklasse einer ganzen Zahl x
modulo 3 (siehe 1.9) und setzen K := Z/≡. Dann gilt: K = {[0], [1], [2]}.
3
Zusätzlich zu der uns schon bekannten Verknüpfung +⊆ definieren wir (per
Verknüpfungstafel) eine Multiplikation • auf K:
+⊆
[0]
[1]
[2]
[0]
[0]
[1]
[2]
[1]
[1]
[2]
[0]
[2]
[2]
[0]
[1]
•
[0]
[1]
[2]
,
[0]
[0]
[0]
[0]
[1]
[0]
[1]
[2]
[2]
[0]
[2]
[1]
,
Dann ist (K; +⊆ ) die Faktorgruppe von (Z; +) nach der Untergruppe 3Z
(s. 2.7), und für alle x, y ∈ Z gilt [x] • [y] = [xy]. Aus dieser Regel folgt sehr
19
Die Gleichheit 1A = 0A würde bedeuten: A = {0A }. Eine nur aus dem Null-Element
bestehende Algebra wird also nicht zu den unitären Algebren gezählt.
65
schnell, daß • distributiv ist, durch Zurückführung auf die Distributivität der
Multiplikation in Z: Für alle x, x′ , y ∈ Z gilt
([x] +⊆ [x′ ]) • [y] = [(x + x′ )y] = [xy + x′ y] = [x] • [y] +⊆ [x′ ] • [y].
Betrachten wir nun Kr{[0]}, so erhalten wir dafür die folgende Verknüpfungstafel:
• [1] [2]
[1] [1] [2] .
[2] [2] [1]
Wir wissen aber schon, daß dies die Verknüpfungstafel einer abelschen Gruppe ist, denn wie ein Vergleich mit der Verknüpfungstafel für die additive
Gruppe ({G, U}; #) des gerade oben zuvor betrachteten Körpers (siehe S. 49)
lehrt, ist die Abbildung [1] 7→ G, [0] 7→ U ein Isomorphismus von (K; •) auf
({G, U}; #).20 Daher ist ((K; +⊆ ); •) ein Körper.21 Es gilt: 0K = [0], 1K = [1].
Die Multiplikation • stimmt, wenn nur einer der Faktoren von [0] verschieden
ist, mit dem Teilmengenprodukt ·⊆ überein. Man sollte jedoch beachten, daß
laut Definition [0] • [0] = [0], dagegen [0] ·⊆ [0] = 9Z 6= [0] gilt. Es handelt
sich bei • also nicht um das Teilmengenprodukt!
Wir sind es von den in der Schule behandelten Zahlbereichen gewohnt, daß
Quadrate keine negativen Zahlen sein können, insbesondere daß −1 kein
Quadrat ist. Es gibt aber Körper, in denen letzteres der Fall ist: Ein Beispiel
dafür ist bereits der oben betrachtete 2-elementige Körper A = {G, U}, denn
in diesem gilt die merkwürdige Gleichung −1A = 1A = (1A )2 . In unserem 3elementigen Körper ((K; +̇); •) hingegen gilt:
−1K = [2] 6= x2 für alle x ∈ K,
denn [0]2 = [0], [1]2 = [1] = [2]2 . Wir stellen nun eine Konstruktion vor,
bei der man, ausgehend von einem beliebigen Körper ((K; +); ·), in dem
20
Natürlich läßt sich die Gruppen-Eigenschaft der winzigen Struktur ({[1], [2]}; •) auch
sehr leicht direkt einsehen. Dennoch ist der oben vorgeschlagene Weg der weit elegantere:
Er vermeidet jegliches Rechnen, sondern verwendet nur die Tatsache, dasß ein Magma,
das zu einer Gruppe isomorph ist, selbst eine Gruppe ist – eine ohnehin unverzichtbare
Einsicht, die mit klarem Verständnis des Isomorphiebegriffs sich als Trivialität ausnimmt.
21
Ersetzt man die Zahl 3 durch eine beliebige natürliche Zahl k > 1, so erhält man
entsprechend stets einen kommutativen unitären Ring mit der Trägermenge Z/≡, also mit
k
genau k Elementen. Ein Körper entsteht dabei genau dann, wenn k eine Primzahl ist. Wir
beweisen diese Aussage hier nicht, möchten aber darauf hinweisen, daß für die Entstehung
des drei-elementigen Körpers in der obigen Konstruktion die Tatsache entscheidend ist,
daß 3 eine Primzahl ist! – Wählt man statt dessen k = 2, so erhält man übrigens einen zu
(({G, U }; #); ·) isomorphen Körper.
66
die Gleichung x2 = −1K unlösbar ist, einen Körper ((L; +̇); ◦) gewinnt, in
dem die Gleichung x2 = −1L lösbar ist; dabei wird L eine zu K isomorphe
Teilstruktur enthalten:
Sei also ((K; +); ·) zunächst ein beliebiger Körper. Wir setzen L := K 2 und
definieren zwei Verknüpfungen auf L:
(a, b)+̇(c, d) :=
(a + c, b + d)
(a, b) ◦ (c, d) := (a · c − b · d, a · d + b · c)
für alle a, b, c, d ∈ K. Durch überraschungsloses Nachrechnen verifiziert
man, daß dann ((L; +̇); ◦) ein kommutativer unitärer Ring mit 0L = (0K , 0K ),
1L = (1K , 0K ) ist. Ferner ist die Abbildung
ϕ : K → L,
a 7→ (a, 0K )
ein Monomorphismus sowohl bezüglich der Additionen +, +̇ als auch bezüglich
der Multiplikationen ·, ◦. Es ist Bild ϕ = K × {0K }, letzteres also ein
Teil-Doppelmagma von ((L; +̇); ◦), das zu ((K; +); ·) (bezüglich beider Verknüpfungen) isomorph ist: Es ist ein zu ((K; +); ·) isomorpher Teilkörper von
((L; +̇); ◦). Es gilt:
(0K , 1K )2 = (−1K , 0K ) = −1L ,
also ist die Gleichung x2 = −1L in ((L; +̇); ◦) lösbar.
Wenn nun bereits K ein Element c enthält mit c2 = −1K , so folgt, daß auch
(c, 0K )2 = −1L gilt, also
(c, 1K ) ◦ (c, −1K ) = ((c, 0K )+̇(0K , 1K )) ◦ ((c, 0K ) − (0K , 1K )) = 0L ,
d. h. L r {0L } ist nicht multiplikativ abgeschlossen, insbesondere keine Gruppe. Also ist dann ((L; +̇); ◦) kein Körper.
Sei nun die Gleichung x2 = −1K in ((K; +)·) unlösbar. Sind dann a, b ∈ K
mit (a, b) 6= 0L , so folgt a2 + b2 6= 0K : Im Falle b 6= 0K erhielten wir
sonst nämlich zunächst die Gleichung a2 = −b2 und daraus den Widerspruch (a · b−1 )2 = −1K , im Falle a 6= 0K entsprechend den Widerspruch
(a−1 · b)2 = −1K . Nun zeigt die Gleichung
(a, b) ◦ (a · (a2 + b2 )−1 , −b · (a2 + b2 )−1 ) = (1K , 0K ) = 1L ,
daß (a, b) in (L r {0L }; ◦) invertierbar ist. Also ist ((L; +̇); ◦) ein Körper. Bezeichnet man das Element (0K , 1K ) mit i und schreibt man für (a, 0K ) ◦ (b, c)
kurz a(b, c), so läßt sich jedes Element von L eindeutig in der Form a1L +̇bi
67
mit a, b ∈ K schreiben.
Im Falle von R als Startkörper wird der hier konstruierte Körper komplexer Zahlkörper genannt. Er ist aufgrund zahlreicher Eigenschaften, die weder ihrer Art nach noch viel weniger hinsichtlich ihrer Relevanz für enorm
viele Kontexte hier diskutiert werden können, eines der zentralen mathematischen Objekte. Doch schon in dem sehr viel bescheideneren“ Fall des
”
Körpers mit 3-elementiger Trägermenge K (s. o.) ergibt sich durch die Konstruktion immerhin die bemerkenswerte Tatsache, daß es einen Körper mit
9 (= 32 ) Elementen gibt. Die weiterführenden Fragen in dieser Richtung sind
ein klassisches Thema der Algebra und werden in der späteren gleichnamigen
Vorlesung ausführlich behandelt.
Nachdem wir damit Ringe und Körper kennengelernt haben, lohnt sich ein
zweiter Blick auf Früheres: Wo wir uns aus Gründen der Konkretheit bzw.
Vertrautheit mit Konzepten unter Bezugnahme auf den rationalen Zahlkörper
((Q; +); ·) beschäftigt haben, läßt sich nämlich häufig Q durch die Trägermenge eines beliebigen kommutativen unitären Ringes K ersetzen, in gewissen
Fällen aber auch nur“ durch die eines Körpers K: Werden in den Nach”
weisen nur die allgemeinen Ringgesetze verwendet, so gilt das Behandelte in
der vollen Allgemeinheit eines beliebigen Ringes; benutzt man jedoch in den
Schlußweisen multiplikativ Inverse von 0 verschiedener Zahlen (d−1 bzw. d1
für d ∈ Qr{0}), so gilt das Behandelte jedenfalls noch für Körper. An keiner
Stelle haben wir die konkrete Gestalt der Elemente von Q als Brüche verwandt, sondern – aus der inzwischen erreichten allgemeineren Optik heraus
– nur Ringgesetze bzw. Körpergesetze.
Einen Körper anstelle des Bereichs der rationalen Zahlen benötigen in Kapitel 0 die Proposition über die elementaren Gleichungssystem-Umformungen
(S. 10), entsprechend auch die Proposition von den elementaren Zeilenumformungen einer Matrix (S. 20) und der Algorithmus durch elementare Zeilenumformungen (S. 21).
Dagegen genügt ein kommutativer unitärer Ring anstelle des Bereichs der rationalen Zahlen im Falle der Bemerkung und des Satzes in Kapitel 0 (S. 16)
sowie in den Beispielen 2.1.1(1), (2), (3), 2.10.2(1), (2) (3). Man beachte aber,
daß bei den abschließenden Aussagen in 2.10.2 Brüche mit dem Nenner 2
gebildet werden. Will man diese also in allgemeinerer Form erhalten, so muß
in dem betrachteten kommutativen unitären Ring ((K; +); ·) zumindest das
Element 1K + 1K (welches ja die Rolle der rationalen Zahl 2 übernimmt)
multiplikativ invertierbar sein. Wir haben schon darauf hingewiesen, daß das
für K = Z nicht der Fall ist (Fußnote 17). Inzwischen kennen wir aber sogar einen Körper, für den dies nicht gilt: In dem oben betrachteten Körper
68
mit 2-elementiger Trägermenge A = {G, U} gilt 1A #1A = U#U = G = 0A ,
nicht invertierbar! Bei einem kommutativen unitären Ring ((K; +); ·), in dem
1K = −1K gilt, fallen die Untergruppen U, V in 2.10.2(2), (3) zusammen.22
22
Unser aus 2 Elementen bestehender Körper ist nur das kleinste aus einer riesigen
Palette von Beispielen dafür.
69
Index
Abbildung, 30
abgeschlossene Teilmenge, 53
abzählbar, 38
abzählbar unendlich, 38
Äquivalenz-Relation, 43
Äquivalenzklasse, 44
Algebra, 64
assoziative, 64
kommutative, 64
unitäre, 64
antisymmetrisch, strikt, 46
Automorphismus, 61
Beweis, indirekter, 18
Bijektion, 31
bijektiv, 31
Bild
einer Menge, 30
eines Elements, 30
Bildmenge, 30
charakteristische Funktion, 34
Definitionsbereich, 30
disjunkt, 33
Distributivgesetz
Links-, 63
Rechts-, 63
Doppelmagma, 64
Einheitengruppe, 55
Eins-Element, 64
Einschränkung, 31
Element von, 3
elementare Zeilenumformung, 20
Endomorphismus, 61
Epimorphismus, 61
Faktor
direkter, 60
Faktorgruppe, 56
Familie, 39
Folge
allgemeine, 39
Standard-, 39
Funktion, 30
gleichmächtig, 31
Gleichungssystem
homogenes, 15
inhomogenes, 15
Gruppe, 52
abelsche, 52
symmetrische, 52
Halbgruppe, 50
Hauptdiagonale (einer Matrix), 19
Hintereinanderausführung, 35
Homomorphismus, 61
idempotent, 54
Identität, 31
Indizierung, 39
injektiv, 31
inverses Element, 50
invertierbar, 50
isomorph, 61
Isomorphismus, 59, 61
kanonische Projektion, 34
70
Kette, 47
Kleiner-Relation, 41
Körper, 64
Komplement, mengentheoretisches, 26
komplexer Zahlkörper, 67
Komponente
eines Urpaars, 29
eines n-Tupels, 39
Komposition, 34
Kongruenz, 42
leere Menge, 18
Magma, 50
assoziatives, 50
kommutatives, 50
unitäres, 50
Matrix
(M × N)-, (m × n)-, 40
quadratische, 19
mengentheoretische Differenz, 26
Monoid, 50
Monomorphismus, 61
Nachbereich, 30
Negation, 7
neutrales Element, 49
nicht (log.), 7
Normalteiler, 56
Null-Element, 64
oder (log.), 8
Ordnung, 46
strikte, 46
teilweise, 47
Paar, geordnetes, 39
Partition, 33
Permutation, 52
Potenzmenge, 26
Produkt
cartesisches, 39
direktes, 59
reflexiv, 42
Relation, 41
Repräsentant, 44
Restriktion, 31
Ring, 64
Semigruppe, 50
Spalte einer Matrix, 40
Standardskalarprodukt, 48
Striktordnung, 46
lineare, 46
totale, 46
Summand
direkter, 60
Summe
direkte, 59
surjektiv, 31
symmetrisch, 42
TeilGruppe, 54
Halbgruppe, 54
Magma, 54
Monoid, 54
Teiler-Relation, 42
Teilmenge von, 7
Teilmengenfunktion, 32
Trägergruppe, 64
Trägermenge, 50
transitiv, 42
Tupel, 39
Umkehrfunktion, 36
Umkehrung, 32
und (log.), 7
UnterGruppe, 54
Halbgruppe, 54
Magma, 54
Monoid, 54
71
Urbild, vollständiges, 32
Urpaar, 29
vergleichbar, 46
Verknüpfung
assoziative, 49
auf einer Menge, 48
distributive, 63
kommutative, 49
zwischen Mengen, 48
Vorbereich, 30
Wertemenge, 30
Zeile einer Matrix, 40
Zeilenstufenform einer Matrix, 22
verfeinerte, 23
Zerlegung
2-teilige direkte, 60
triviale direkte, 60
72