Kapitel 0 Einführung in die Lineare Algebra und die mathematische

Werbung
Kapitel 0
Einführung in die Lineare
Algebra und die mathematische
Sprache
Zum Einstieg gehen wir dieser Ausgangsfrage nach:
Welche Lösungen hat das folgende lineare Gleichungssystem?
(∗)
2x1 +
−x1 +
x1
2x1 +
x2
x2 +
+
2x2 +
−2x2 −
6x3
3x3
9x3
3x3
−
−
+
−
+
3x4
2x4
2x4
3x4
7x4
= −1
= 3
= 6
= 8
= 4
Wir betrachten einige mögliche Antwortreaktionen auf diese Frage:
1. Antwortversuch: Das System hat mehr Gleichungen als Unbekannte, ist
”
daher überbestimmt und besitzt keine Lösung.“
Ist das korrekt?
Zwar werden wir nach einiger Zeit feststellen, daß ein solcher Begriff des
Überbestimmt-Seins“, der sich auf den Vergleich der Anzahlen der Glei”
chungen und der Unbekannten gründet, für die Frage nach Lösbarkeit bzw.
nach den Lösungen eines linearen Gleichungssystems vollständig untauglich
ist. Jedoch haben wir diese Einsichten hier noch nicht und lassen den 1. Antwortversuch zunächst in unentschieden-ratloser Offenheit stehen; allerdings
nicht lange: Betrachten wir einmal den
2. Antwortversuch: Durch x1 = 1, x2 = 0, x3 = 1, x4 = 1 ist eine Lösung
”
gegeben.“
1
Ist das korrekt?
In der Tat ist dies leicht zu überprüfen und als zutreffend einsehbar:
Beweis der Aussage: Es gilt
2·1 +
−1 +
1
2·1 +
0
0 +
+
2·0 +
−2 · 0 −
6·1
3·1
9·1
3·1
−
−
+
−
+
3·1
2·1
2·1
3·1
7·1
= −1
= 3
= 6
= 8
= 4
1
Der 2. Antwortversuch ist also eine wahre Aussage. Damit sieht man
aber unmittelbar, daß der oben noch offengelassene 1. Antwortversuch eine falsche Aussage ist: Wir haben gesehen, daß es eine Lösung des Gleichungssystems gibt, und daher ist die Behauptung falsch, daß es keine Lösung
besitze. Wir können damit auch festhalten:
Daß ein lineares Gleichungssystem mehr Gleichungen als Unbekannte hat,
bedeutet keineswegs, daß es unlösbar ist.
Wir betrachten noch weitere Reaktionen auf die Ausgangsfrage:
3. Antwortversuch: Durch x1 = − 34 , x2 = 53 , x3 = 0, x4 = 0 ist eine Lösung
”
gegeben.“
Ist das korrekt?
Zwar sind die ersten beiden Gleichungen des Gleichungssystems damit erfüllt,
die anderen drei jedoch nicht. Eine Lösung muß aber alle Gleichungen des
Gleichungssystems erfüllen. Also ist der 3. Antwortversuch eine falsche Aussage.
Wir führen eine Schreibweise für Lösungskandidaten“ des Gleichungssy”
stems ein. Prinzipiell liefert jede Liste von 4 Zahlen a1 , a2 , a3 , a4 einen
Kandidaten für eine Lösung: Man überprüft, ob nach Einsetzen von a1 für
x1 , a2 für x2 , a3 für x3 , a4 für x4 alle Gleichungen erfüllt sind. Die Reihenfolge, in der die Elemente ai dastehen, ist natürlich von großem Belang; denn
nur durch sie weiß man, welcher Wert für die jeweilige Unbekannte xj einzusetzen ist. Um eine Liste von Objekten (hier in unserem Beispiel: Zahlen)
anzugeben, deren Reihenfolge wichtig ist, benutzt man die sogenannte
Tupelschreibweise“: (a1 , a2 , a3 , a4 ) (im Falle von 4 Objekten in der Liste,
”
bei anderen Listenumfängen entsprechend).
1
Wir verwenden dieses Zeichen “ stets, um das Ende eines Beweises zu kennzeichnen.
”
Auf eine sehr lange Tradition kann statt dessen die zu diesem Zweck ebenfalls übliche
Abkürzung q.e.d.“ (für quod erat demonstrandum“, Lateinisch für was zu beweisen
”
”
”
war“) zurückblicken.
2
So ist etwa (1, 0, 1, 1) (s. 2. Antwortversuch) eine Lösung, dagegen (− 34 , 35 , 0, 0)
(s. 3. Antwortversuch) keine Lösung des linearen Gleichungssystems (∗).
Kann es außer (1, 0, 1, 1) weitere Lösungen geben? Unter Verwendung der
eben eingeführten Tupel-Schreibweise formulieren wir den
7
22
, 0) (anders geschrieben: ( 58 , −21
, 15
, 0)) ist
4. Antwortversuch: (1 35 , −4 15 , 1 15
5
”
eine Lösung“.
Einsetzen zeigt (prinzipiell wie beim Beweis der Aussage im 2. Antwortversuch, nur rechnerisch etwas unangenehmer), daß dies tatsächlich eine wahre
Aussage ist. D. h. das Gleichungssystem ist nicht nur lösbar, sondern hat
mindestens zwei verschiedene Lösungen!2
Der 2. und der 4. Antwortversuch enthalten damit zwar inhaltlich wahre Aussagen, beantworten die Ausgangsfrage aber jeweils beide nicht erschöpfend.
Natürlich ist darüber hinaus auch ganz und gar nicht sicher, ob es neben
den beiden angegebenen vielleicht nicht noch eine Vielzahl anderer gibt.3 Es
stellt sich so insgesamt das
Problem: Wie erhält man alle Lösungen des Gleichungssystems (∗) ?
Gesucht ist die Menge aller Lösungen. Die intuitive Vorstellung einer Menge
ist die einer Gesamtheit von Objekten“: Sozusagen durch einen Akt der
”
”
Zusammenfassung“ wird aus vorgegebenen Objekten ein neues Objekt geschaffen: die Menge, die sich aus den vorgegebenen Objekten konstituiert.
Die Beziehung zwischen einem von diesen, genannt x, und der vorerwähnten
Menge, genannt M, wird ausgedrückt durch die Schreibweise x ∈ M“, gele”
sen: x ist ein Element von M“. Man beachte, daß der Elementbegriff ein sog.
”
Relativbegriff ist, d. h. er ist nicht für sich allein, sondern nur mit Bezug auf
eine Menge sinnvoll. Es ist sinnlos, von einem Objekt auszusagen, es sei ein
”
Element“. Stets ist anzugeben, von welcher Menge das Objekt ein Element
ist. Zum Beispiel besteht die Menge der Lösungen unseres Gleichungssystems
aus Objekten, die wir in der Form (a1 , a2 , a3 , a4 ) schreiben, wobei die ai Zahlen sind. Nur, welche dieser Objekte tatsächlich Lösungen sind und welche
nicht, das ist gerade die Frage.
Beispiele
(1) Sei M die Menge unserer Ziffern. Die Elemente von M sind 0, 1, 2, 3, 4,
5, 6, 7, 8, 9.
2
Ein in Schulen häufig betrachteter Typus von linearen Gleichungssystemen ist stets
eindeutig lösbar, was aber nicht zu der sich möglicherweise unwillkürlich einstellenden
Fehlmeinung führen darf, daß dies generell so wäre. Das ist, wie unser Beispiel zeigt, ganz
und gar falsch.
3
Dies ist tatsächlich so, wie in der weiteren Folge erkannt werden wird.
3
(2) Sei M die Menge der (positiven) Teiler von 12. Die Elemente von M sind
1, 2, 3, 4, 6, 12.
(3) Sei M die Menge der ganzen Zahlen. (Die Standard-Bezeichnung für diese
Menge lautet: Z) Deren Elemente sind: . . . , −3, −2, −1, 0, 1, 2, . . .
Für diese Vorlesung gilt: Unter der Menge der natürlichen Zahlen verstehen
wir die Menge der Elemente 1, 2, 3, . . . (also die Menge der positiven ganzen
Zahlen). Die Standard-Bezeichnung für diese Menge in dieser Vorlesung lautet: N. 4
Ein weiterer wichtiger Zahlbereich ist der Bereich Q der rationalen Zahlen,
also der Zahlen, die sich als Bruch zweier ganzer Zahlen darstellen lassen.
Zur Angabe von Mengen bedarf es einer Schreibweise, aus der klar hervorgeht,
welche Objekte die Elemente der jeweils betrachteten Menge sind. Enthält
eine Menge M nur wenige Elemente a1 , . . . , ak , die man alle auflisten kann,
so kann man M in folgender Form angeben:
M = {a1 , . . . , ak }
Für die Angabe einer Menge ist die Verwendung der geschwungenen Klammern {“ , }“ das Erkennungsmerkmal. Z. B. gilt im Beispiel (1) : M =
”
”
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, im Beispiel (2) : M = {1, 2, 3, 4, 6, 12}. Bei der Auflistung der Elemente von M innerhalb der geschweiften Klammern (auch
Mengenklammern“ genannt) ist die Reihenfolge unwichtig und ein mehr”
faches Vorkommen eines Elementes von M in der Liste ist für die Bedeutung von M ebenfalls unwichtig. Bei der zuvor betrachteten Art der
Auflistung, die durch die Tupel-Schreibweise (siehe S. 2) bezeichnet wird, ist
dies ganz und gar anders. Zur Verdeutlichung stellen wir die Unterschiede an
einem einfachen Beispiel heraus:
(1, 2, 3, 1) =
6
(1, 2, 1, 3) =
6
(1, 2, 3),
{1, 2, 3, 1} = {1, 2, 1, 3} = {1, 2, 3}.
Will man zum Ausdruck bringen, daß eine Menge M nicht mehr und nicht
weniger als n Elemente besitzt (wo n eine natürliche Zahl ist), so benutzt man
4
In einer anderen, ebenfalls weit verbreiteten Tradition wird N für die Menge der nichtnegativen ganzen Zahlen geschrieben, also im (einzigen) Unterschied zu unserer Setzung
auch 0 als natürliche Zahl, mithin als Element von N aufgefaßt. Dieser Tradition folgen
wir in dieser Vorlesung jedoch nicht. Für uns gilt: 0 6∈ N. – Man mag schon dieser Stelle
entnehmen, daß Mathematiker bezüglich der Wahl ihrer Bezeichnungen und Schreibweisen frei sind: Eine Bezeichnung bzw. eine Schreibweise kann nicht richtig oder falsch sein,
sondern nur zweckmäßig oder unzweckmäßig, sprechend oder nichtssagend, natürlich oder
irreführend!
4
dafür die Sprechweise: M hat genau n Elemente“. Ohne das Wort genau“
”
”
hingegen entsteht in mathematischen Kontexten ein veränderter Sinn: M
”
hat n Elemente“ bedeutet dasselbe wie: M hat mindestens n Elemente“; es
”
können also genau n Elemente oder auch mehr sein. In der Umgangssprache
ist eine so präzise Festlegung nicht gegeben. Um zu sagen, daß M entweder
genau n oder weniger als n Elemente hat, verwendet man, wie in der Umgangssprache gewohnt, die Sprechweise: M hat höchstens n Elemente“.
”
Nur für Mengen mit wenigen Elementen ist die bisher betrachte Schreibweise, die eine konkrete Auflistung der Elemente bedeutet, tatsächlich möglich.
Ganz und gar ausgeschlossen ist sie jedenfalls, wenn die betrachtete Menge unendlich viele Elemente enthält. Daher bedarf es einer umfassenderen
Möglichkeit der Mengenangabe. Man knüpft die Zugehörigkeit eines Objektes a zu einer Menge M (also die Entscheidung über die Frage, ob a ∈ M“
”
gilt) an das Erfülltsein einer sog. definierenden Eigenschaft. Sei zum Beispiel
G die Menge aller geraden (ganzen) Zahlen. Dann können wir G beschreiben
durch
G = {a|a ∈ Z und 2 teilt a},
gelesen: G ist die Menge aller Objekte a, für die gilt: a ist eine ganze Zahl,
”
und 2 teilt a.“ Die definierende Eigenschaft besteht in diesem Fall aus zwei
durch und“ verbundene Bedingungen. Ebenso für die Menge U aller unge”
raden Zahlen:
U = {a|a ∈ Z und 2 teilt nicht a}.
Allgemein hat diese Art der Mengenbeschreibung die Form
M = {a|E(a)},
wobei E eine aus Bedingungen an ein (variables) Objekt bestehende Eigenschaft ist. Ist diese bei vorliegendem Objekt a erfüllt (d. h. die Aussage E(a)
ist wahr), so ist a ein Element von M. Ist sie nicht erfüllt (d. h. die Aussage
E(a) ist falsch), so ist a kein Element von M. Z. B. wurde zur Beschreibung der Menge U als definierende Eigenschaft, die für ein Objekt a über die
Zugehörigkeit zu U entscheidet, verwendet:
a ∈ Z und 2 teilt nicht a
Dabei bezeichnet a die Variable,
für die man ein zu testendes Objekt einzu√
setzen hat. Etwa für a = 2 ist E(a) falsch, da bereits die erste Bedingung
(Element von Z zu sein) nicht erfüllt ist. Auch für a = 6 ist E(a) falsch, da
zwar die erste Bedingung, nicht aber die zweite erfüllt ist: Es ist nicht wahr,
daß 2 die Zahl a nicht teilt. Für a = 7 dagegen ist E(a) wahr, da 7 sowohl
5
Element von Z ist als auch nicht durch 2 geteilt werden kann.
Sei nun L die Menge der Lösungen des linearen Gleichungssystems (∗). Wir
schreiben die Elemente von L in der Tupelschreibweise (a1 , a2 , a3 , a4 ), wobei
die ai Zahlen sind; aber durch welche Eigenschaft E wird aus der Gesamtheit
aller dieser Objekte gerade die gewünschte Menge L ausgesondert? Wählen
wir für E die Eigenschaft, daß bei Einsetzen der ai für die xi alle 5 Gleichungen von (∗) erfüllt sein müssen, so ist natürlich nichts gewonnen. Gesucht ist
dagegen eine Eigenschaft, die so formuliert ist, daß ihre Überprüfung direkt,
d. h. ohne das Involvieren von (∗) leicht möglich ist.
Die Idee, die wir dazu verfolgen werden, besteht hierin: Statt des Systems
(∗) betrachten wir ein etwas einfacheres, verändertes lineares Gleichungssystem, das aber dieselbe Lösungsmenge hat. Ein solcher Schritt, der von (∗)
zu einem einfacheren Gleichungssystem führt, wird dann so lange erneut angewandt, bis man schließlich zu einem Gleichungssystem gelangt ist, dessen
Lösungsmenge man ohne Rechnung ablesen kann. Wenn man weiß, daß die
Lösungsmengen aller nach und nach betrachteten Gleichungssysteme dieselben sind, hat man damit (∗) gelöst. Wir geben ein Gleichungssystem (∗∗)
an, das aus (∗) durch einen ersten Vereinfachungsschritt der oben gemeinten
Art entstanden ist:
2x1 +
(∗∗)
x1
2x1
x2
x2 +
+
+
2x2 +
−2x2 −
− 3x4
9x3
3x3 + 2x4
9x3 − 3x4
3x3 + 7x4
= −1
= 9
= 6
= 8
= 4
Nur die zweite der 5 Gleichungen ist gegenüber (∗) verändert, und zwar ist
sie additiv aus den Gleichungen 2 und 3 aus (∗) entstanden: Die Summe der
Terme auf der linken Seite der Gleichungen sowie die der Zahlen 3 und 6
auf der rechten Seite wurde gebildet. Sei L′ die Lösungsmenge von (∗∗). Wie
zeigt man, daß L = L′ gilt?
Wieder gibt die Frage Anlaß zu einem Exkurs von fundamentaler Bedeutung,
in dem es um die allgemeine Frage geht, wie man überhaupt Gleichheiten
von Mengen beweisen kann. Seien M, M ′ beliebige Mengen. Da diese jeweils
durch die ihnen zugehörigen Elemente gegeben sind, besagt die Gleichheit
M = M ′ offenbar, daß M und M ′ genau dieselben Elemente enthalten. Dies
aber bedeutet zweierlei:
(i) Jedes Element von M ist auch ein Element von M ′ ,
(ii) Jedes Element von M ′ ist auch ein Element von M.
6
Für das alleinige Erfüllt-Sein der Bedingung (i) schreiben wir in dieser Vorlesung5 : M ⊆ M ′ , gelesen: M ist eine Teilmenge von M ′ (entsprechend für
(ii): M ′ ⊆ M). Als Beispiele führen wir an:
N ⊆ Z,
{−1, 1} ⊆ Z,
Z ⊆ Z, aber {−1, 1} 6⊆ N,
wobei das Zeichen 6⊆“ – wie bereits die Notation nahelegt – bedeuten soll:
”
ist nicht Teilmenge von“, (auch: ist keine Teilmenge von“).6 Unter Ver”
”
wendung unseres Symbols für die Teilmengenbeziehung erhalten wir also aus
dem zuvor Gesagten das
Gleichheitskriterium M = M ′ bedeutet: M ⊆ M ′ und M ′ ⊆ M.
Damit zerfällt grundsätzlich der Beweis einer Gleichheit zweier gegebener
Mengen M, M ′ stets in zwei Teile: 1) Man zeigt: M ⊆ M ′ , 2) Man zeigt:
M ′ ⊆ M.
Gilt M ⊆ M ′ , aber M 6= M ′ , so schreiben wir in dieser Vorlesung dafür :
M ⊂ M ′ (gelesen: M ist eine echte Teilmenge von M ′“). Zum Beispiel gelten
”
die Aussagen
N ⊂ Z,
{−1, 1} ⊂ Z, aber Z 6⊂ Z,
{−1, 1} 6⊂ N,
wobei natürlich wieder ⊂
6 “ zur Negation verwandt wird.
”
Man beachte: Für jede Menge M ist die Aussage M ⊆ M wahr. Daß die
naiv erwartete Aussage M = M auch wahr ist und manchem natürlicher“
”
erscheinen mag, widerspricht dem in keiner Weise: Zu den Teilmengen von M
gehört eben auch M selbst. Dagegen ist bei dem für diese Vorlesung gültigen
Gebrauch der eingeführten Zeichen für jede Menge M die Aussage M ⊂ M
falsch, da eine echte Teilmenge von M kraft Definition von M verschieden
sein muß.
Weiter ist bei der Aussage M 6⊂ M ′ zu beachten, daß das Nichterfülltsein
der echten Teilmengenbeziehung ⊂“ zwei wesentlich verschiedene Gründe
”
haben kann: Zum Beispiel gilt Z 6⊂ Z, weil Z (zwar eine Teilmenge von Z,
aber) nicht von Z verschieden ist. Dagegen gilt {−1, 1} 6⊂ N, weil {−1, 1}
(zwar von N verschieden, aber) keine Teilmenge von N ist.7
Einer anderen Tradition nach wird dafür statt dessen M ⊂ M ′“ geschrieben; dies hat
”
jedoch bei uns eine andere Bedeutung, wie oben in Kürze ausgeführt wird.
6
Die Aussage: M ⊆ M ′ ist nicht erfüllt“ nennt man die Negation der Aussage M ⊆
”
”
′
M . In der Logik nennt man allgemein die Aussage, daß eine gegebene Aussage A nicht
erfüllt ist, die Negation der Aussage A. Letztere wird in Zeichen ausgedrückt durch ¬A“.
”
7
Sind A, B Aussagen, so wird in der Logik die Aussage, die das gleichzeitige Erfülltsein
von A und B ausdrückt, in der Form A ∧ B (gelesen: A und B“) notiert. Die Negation
”
”
5
7
Klar zu unterscheiden sind die Bedeutungen von ∈“ ( ist ein Element von“)
”
”
und ⊆“ ( ist eine Teilmenge von“): Zum Beispiel gelten die Aussagen
”
”
3 ∈ N,
{2, 3, 4} ⊆ N,
{3} ⊆ N, aber {3} 6∈ N,
3 6⊆ N,
wobei wieder analog zu dem vorher Gesagten mit 6∈“ bzw. 6⊆“ das negiert
”
”
wird, was ∈“ bzw. ⊆“ an dieser Stelle zum Ausdruck bringen würde. Ele”
”
mente einer Menge M sind die Objekte selbst, aus deren Gesamtheit sich M
konstituiert. Teilmengen von M dagegen sind Mengen, die man durch Zusammenfassung, durch eine Auswahl gewisser Elemente von M erhält.
Wir kehren nun zu der Betrachtung der Lösungsmengen L (von (∗)), L′ (von
(∗∗)) zurück und wollen mit Hilfe unseres Gleichheitskriteriums die Gleichheit L = L′ einsehen. Danach gibt es zwei Inklusionen zu beweisen:
1. Teil. Wir zeigen: L ⊆ L′ .
Wir müssen nachweisen, daß jedes Element von L auch ein Element von L′
ist. Sei also ein beliebiges Element von L gegeben. Wir wissen, daß wir dies
prinzipiell in der Form (a1 , a2 , a3 , a4 ) (wobei die ai Zahlen sind) annehmen
dürfen. Zu zeigen ist, daß (a1 , a2 , a3 , a4 ) jetzt auch eine Lösung von (∗∗) ist.
Daß zunächst die 1., 3., 4. und 5. Gleichung von (∗∗) erfüllt ist, ist klar, weil
diese Gleichungen genauso im System (∗) vorkommen.
Zu zeigen bleibt: (A) a2 + 9a3 = 9.
Es gilt nach Voraussetzung (da ja (a1 , a2 , a3 , a4 ) Lösung von (∗) ist und folglich insbesondere die 2. und 3. Gleichung in (∗) erfüllen muß):
−a1 + a2 + 6a3 − 2a4
a1
+ 3a3 + 2a4
= 3
= 6
Daraus folgt: (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6 = 9.
Andererseits gilt: (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = a2 + 9a3 .
Aus beidem zusammen folgt: a2 + 9a3 = 9. Also gilt (A), und damit ist der
1. Teil beendet.
Zwar gibt das Aufgeschriebene genau wieder, jedoch ist der wiederholte Zeilenbeginn mit dem langen Term (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 )
¬(A ∧ B) bedeutet daher, daß (wenigstens) eine der beiden Aussagen A, B nicht erfüllt
ist; dabei kann es sein, daß sogar beide nicht erfüllt sind. Mit anderen Worten, ¬(A ∧ B)
bedeutet dasselbe wie ¬A oder ¬B“, wobei oder“ in dem Sinne benutzt wird, daß sich
”
”
die beiden Alternativen nicht gegenseitig ausschließen. Dafür verwendet man in der Logik
die Schreibweise ¬A ∨ ¬B.
8
etwas umständlich. Wir können den gemachten Schluß in einer einzigen Zeile
zusammenfassen durch
a2 + 9a3 = (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6 = 9.
Daß wir in Wahrheit, ausgehend von der Summe der beiden geklammerten Terme, einmal nach rechts“, einmal nach links“ gerechnet haben, ist
”
”
für die Korrektheit des angegebenen Schlusses unerheblich: Die angegebenen
Gleichheiten sind wahre Aussagen, und das ist das einzig Entscheidende. Es
ist dagegen nicht für die Korrektheit des Beweises relevant, ob erkennbar ist,
wie man auf die Gleichungen gekommen ist. Es muß nur im Kontext das
Erfülltsein der Gleichung (für den Leser zumutbar) zu verifizieren sein; dies
war oben offensichtlich der Fall.8
2. Teil. Wir zeigen: L′ ⊆ L.
Sei jetzt (a1 , a2 , a3 , a4 ) ∈ L′ .9 Es gilt nach Voraussetzung (da ja (a1 , a2 , a3 , a4 )
Lösung von (∗∗) ist und folglich insbesondere die 2. und 3. Gleichung in (∗∗)
erfüllen muß):
−a1 + a2 + 6a3 − 2a4 = (a2 + 9a3 ) − (a1 + 3a3 + 2a4 ) = 9 − 6 = 3.
Vor.
Es folgt: (a1 , a2 , a3 , a4 ) ∈ L.
Natürlich enthält der Beweis des 2. Teils ähnlich ausführliche Überlegungen
8
Dennoch sei auf einen Unterschied in der Verwendung der Gleichheitszeichen hingewiesen: Die Gleichungen
a2 + 9a3 = (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ), 3 + 6 = 9
sind Folgen unserer gewohnten Rechengesetze (mit Termen bzw. Zahlen). Dagegen ist bei
der Gleichung
(−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6
überhaupt nicht gerechnet worden, sondern es wurde schlicht verwandt, daß nach unserer
Voraussetzung (Lösungs-Eigenschaft von (a1 , a2 , a3 , a4 )!) der erste Term den Wert 3, der
zweite den Wert 6 hat. Um mitzuteilen, daß an dieser Stelle die Voraussetzung benutzt
wurde und nicht nur eine unmittelbar einleuchtende Term-Umformung, kann man den
Leser darauf hinweisen, etwa folgendermaßen:
a2 + 9a3 = (−a1 + a2 + 6a3 − 2a4 ) + (a1 + 3a3 + 2a4 ) = 3 + 6 = 9.
Vor.
9
Der 1. Teil ist abgeschlossen. Daß dort die Bedeutung von (a1 , a2 , a3 , a4 ) am Beweisausgangspunkt eine andere war – nämlich zu L zu gehören – hat nun, nach Beendigung
des 1. Teils, keine Bedeutung mehr. Die Variablen a1 , a2 , a3 , a4 stehen für den 2. Teil der
Beweisformulierung wieder neu“ zur Verfügung, wovon wir Gebrauch machen.
”
9
wie der des 1. Teils. Jedoch ist die komprimierte Form, wenn man sie in der
Denkweise des 1. Teils liest, als Beweis vollständig ausreichend. Mathematische Beweise sollten knapp, ohne unnötiges Beiwerk sein, damit der Kern des
Gedankens stets ohne Verhüllungen ersichtlich wird. Daher ist die Formulierung des 2. Teils vorzuziehen, auch wenn beim ersten Lesen die des 1. Teils
leichter verstehbar erscheinen sollte.
Der gerade durchgeführte Schluß hängt nicht von den konkreten Zahlen ab,
die in unseren Gleichungssystemen auftreten, und wird in seiner allgemeinen
Form zu einer wichtigen Regel bei der Behandlung beliebiger linearer Gleichungssysteme. Wir müssen nur mit Variablen das durchführen, was bei dem
beendeten Beweis mit Zahlen gerechnet wurde:
Proposition über die elementaren Gleichungssystem-Umformungen
Seien m, n ∈ N, und seien c11 , c12 ,. . . , c1n , c21 , c22 ,. . . , c2n ,. . . , cmn , b1 ,. . . ,bm
rationale Zahlen, 1 ≤ i < m. Sei L die Lösungsmenge des linearen Gleichungssystems
(∗)
c11 x1 + · · · +
c1n xn = b1
..
..
..
..
.
.
.
.
ci1 x1 + · · · +
cin xn = bi
ci+1,1 x1 + · · · + ci+1,n xn = bi+1
..
..
..
..
.
.
.
.
cm1 x1 + · · · +
cmn xn = bm
.
(1) Sei L′ die Lösungsmenge des linearen Gleichungssystems
(∗∗)
c11 x1 + · · · +
c1n xn =
b1
..
..
..
..
.
.
.
.
(ci1 + ci+1,1 )x1 + · · · + (cin + ci+1,n )xn = bi + bi+1
ci+1,1 x1 + · · · +
ci+1,n xn =
bi+1
..
..
..
..
.
.
.
.
cm1 x1 + · · · +
cmn xn =
bm
.
Dann gilt: L = L′ .
(2) Sei d eine rationale Zahl 6= 0 und L′′ die Lösungsmenge des linearen
Gleichungssystems
10
c11 x1 + · · · +
c1n xn = b1
..
..
..
..
.
.
.
.
dci1 x1 + · · · + dcin xn = dbi
ci+1,1 x1 + · · · + ci+1,n xn = bi+1
..
..
..
..
.
.
.
.
cm1 x1 + · · · +
cmn xn = bm
.
Dann gilt: L = L′′ .
(3) Sei L′′′ die Lösungsmenge eines linearen Gleichungssystems, das aus (∗)
durch Veränderung der Reihenfolge der Gleichungen entsteht. Dann gilt:
L = L′′′ .
Beweis. (1) 1. Teil: L ⊆ L′ : Sei (a1 , . . . , an ) ∈ L. Dann folgt:
ci1 a1 + · · · +
cin an = bi
ci+1,1 a1 + · · · + ci+1,n an = bi+1 ,
also auch
(ci1 + ci+1,1 )a1 + · · · + (cin + ci+1,n )an
= (ci1 a1 + · · · + cin an ) + (ci+1,1 a1 + · · · + ci+1,n an ) = bi + bi+1 .
Da alle außer der i-ten Gleichung in (∗) und (∗∗) dieselben sind, folgt:
(a1 , . . . , an ) ∈ L′ .
2. Teil: L′ ⊆ L: Sei (a1 , . . . , an ) ∈ L′ . Dann folgt:
(ci1 + ci+1,1 )a1 + · · · + (cin + ci+1,n )an = bi + bi+1
ci+1,1 a1 + · · · + ci+1,n an = bi+1 ,
also auch
ci1 a1 + · · · + cin an
= (ci1 + ci+1,1 )a1 + · · · + (cin + ci+1,n )an − (ci+1,1 a1 + · · · + ci+1,n an )
= (bi + bi+1 ) − bi+1 = bi .
Da alle außer der i-ten Gleichung in (∗∗) und (∗) dieselben sind, folgt:
(a1 , . . . , an ) ∈ L′ .
(2) 1. Teil: L ⊆ L′′ : Sei (a1 , . . . , an ) ∈ L. Dann folgt: ci1 a1 + · · · + cin an = bi ,
also auch dci1 a1 + · · · + dcin an = dbi . Da alle außer der i-ten Gleichung in
beiden Systemen dieselben sind, folgt: (a1 , . . . , an ) ∈ L′′ .
11
2. Teil: L′′ ⊆ L: Sei (a1 , . . . , an ) ∈ L′′ . Dann folgt: dci1 a1 + · · · + dcin an = dbi .
Da d 6= 0 gilt, können wir die Zahl d1 bilden und erhalten durch Multiplikation: ci1 a1 +· · ·+cin an = d1 (dci1 a1 +· · ·+dcin an ) = 1d ·dbi = bi . Da alle außer der
i-ten Gleichung in beiden Systemen dieselben sind, folgt: (a1 , . . . , an ) ∈ L.
(3) Trivial.
Es soll gleich gezeigt werden, wie man mit Hilfe der drei in der Proposition
bewiesenen Regeln das gegebene Gleichungssystem (∗) in ein sehr leicht überschaubares Gleichungssystem verwandeln kann, aus dem man die Lösungsmenge schnell ablesen kann. Zunächst wollen wir aber eine weitere Schreibweise einführen, mit der lineare Gleichungssysteme sparsamer“ erfaßt wer”
den können als in der durch (∗) gegebenen Darstellung. Alle Schritte, die die
Proposition durchzuführen erlaubt, verändern nur die Koeffizienten cij der
Unbekannten und die Werte bi auf der rechten Seite, während die Unbekannten xj stereotyp an denselben Stellen nur abgeschrieben werden, ebenso wie
die Gleichheitszeichen. Um das Gleichheitssystem zu erfassen, genügt es also,
die Werte cij und bi in folgendem rechteckigen Schema wiederzugeben:


c11 · · · c1n b1
 ..
..
.. 
 .
.
. 
cm1 · · · cmn bm
Dem Übergang von (∗) zu (∗∗) im konkreten Fall
entspricht in dieser Schreibweise die Umformung



2 1
2
1
0 −3 −1
0 1

−1 1
6
−2
3




1
0
3
2
6
 → 1 0

2 2
2
2
9 −3 8 
0 −2
0 −2 −3 7
4
unseres Ausgangsbeispiels

0 −3 −1
9
0
9

3
2
6

9 −3 8 
−3 7
4
Wir wissen dank Teil (3) der Proposition, daß das Ersetzen einer Zeile dieses
Schemas durch die Zeile aus den Summenwerten mit den jeweiligen Werten
der folgenden Zeile (gemäß Teil (1) der Proposition) auch bezüglich einer beliebigen anderen Zeile vorgenommen werden kann, ohne daß sich die Lösungsmenge dabei verändert. Multiplizieren wir gemäß Teil (2) der Proposition die
Werte der 3. Zeile mit −2 und addieren dann einerseits diese zu denen der
4. Zeile, andererseits auch zu denen der 1. Zeile, so erhalten wir:


0 1 −6 −7 −13
0 1
9
0
9 


3
2
6 
→
,
1 0
0 2
3 −7 −4 
0 −2 −3 7
4
12
wobei wir die Multiplikation mit −2 (in der 3. Zeile) durch eine weitere
Anwendung des Teils (2), nämlich die nachträgliche Multiplikation mit − 12 ,
wieder rückgängig gemacht haben. Die bisherigen Anwendungen der Proposition haben dazu geführt, daß in der äußersten linken Spalte nunmehr
einmal der Wert 1 und ansonsten nur Nullen stehen. Ein solches Ziel verfolgen wir anschließend auch bezüglich der 2. Spalte. Bevor wir aber stereotyp
die analogen Rechnungen vornehmen, lassen wir uns eine auffällige Besonderheit nicht entgehen: Addiert man nämlich die Werte der ersten beiden Zeilen
(an den sich entsprechenden Stellen), so ergibt sich gerade die 4. Zeile, und
diese stimmt bis auf das Vorzeichen mit der 5. Zeile überein. Durch unsere
Proposition erlaubt diese Beobachtung die Umformungen

0
0

→
1
0
0
2
1
0
0
0



0 0 −15 −7 −22
3 −7 −4
0 1 9
0
9 
9 0
9





2
6 
3 2
6  → 1 0 3

0 0 0
0
0 
0 0
0
0 0 0
0
0
0 0
0



7
7
0 0 1 15
1 15
1 0
1
0 1 0 −4 −4 1 
0 1
5
5


3
3 
0 0
1
0
0
1
→
→
5
5 


0 0 0 0
0 0
0 
0 0 0 0
0
0 0

3
3
1
0
5
5
0 −4 15 −4 51 

7
7 
1 15
1 15
.
0 0
0 
0 0
0
D. h. unser anfangs gegebenes lineares Gleichungssystem ist lösungsgleich zu
dem linearen Gleichungssystem
x1
x2
x3
+ 53 x4
− 4 51 x4
7
+ 15
x4
= 1 53
= −4 15
7
= 1 15
x1
, d. h. x2
x3
= 1 53 − 35 x4
= −4 51 + 4 15 x4
7
7
− 15
x4
= 1 15
.
Dieses Gleichungssystem ist bei beliebigem Wert d für x4 erfüllbar; allerdings
sind die Werte für x1 , x2 , x3 mit der Wahl von d (für x4 ) eindeutig festgelegt:
Jede Lösung hat die Form
3 3
1
1
7
7
(1 − d, −4 + 4 d, 1 − d, d)
5 5
5
5
15 15
mit einer rationalen Zahl d, und jede Wahl von d führt auf die eben beschriebene Weise tatsächlich zu einer Lösung.
7
, 0), die
Die Wahl von d = 0 führt zu der speziellen Lösung (1 53 , −4 15 , 1 15
von d = 1 dagegen zu der speziellen Lösung (1, 0, 1, 1). Das sind genau
die beiden Lösungen aus dem 4. bzw. 2. Antwortversuch“ vom Beginn des
”
13
Kapitels, die sich somit als zwei singuläre Fälle einer unendlichen Menge
von Lösungen erweisen. Die gesamte Lösungsmenge haben wir inzwischen
vollständig beschrieben.
Wir wollen die Darstellung der Lösungen aber übersichtlicher gestalten als
bisher. Dazu werden uns folgende Setzungen von Nutzen sein, durch die wir
in der Lage sein werden, Objekte der Form (a1 , . . . , an ) allgemein zu addie”
ren“ bzw. auch mit rationalen Zahlen zu multiplizieren“:
”
Für alle Zahlen a1 , . . . , an , a′1 , . . . , a′n , d definieren wir:
(a1 , . . . , an ) + (a′1 , . . . , a′n ) := (a1 + a′1 , . . . , an + a′n ),
d · (a1 , . . . , an ) := (da1 , . . . , dan ).
Unter Benutzung dieser Festlegungen (im Falle n = 4) können wir unsere
allgemeine Lösung wie folgt umformen:
3 3
1
1
7
7
(1 − d, −4 + 4 d, 1 − d, d)
5 5
5
5
15 15
1
7
3 1
7
3
= (1 , −4 , 1 , 0) + d · (− , 4 , − , 1).
5
5 15
5 5
15
Sind a1 , a2 , a3 , a4 rationale Zahlen, so ist (a1 , a2 , a3 , a4 ) genau dann10 eine
Lösung des Gleichungssystems aus unserer Ausgangsfrage, wenn es ein d ∈ Q
gibt mit der Eigenschaft
3
1
7
3 1
7
(a1 , a2 , a3 , a4 ) = (1 , −4 , 1 , 0) + d · (− , 4 , − , 1).
5
5 15
5 5
15
Wir können damit unsere (unendliche) Lösungsmenge L in der auf S. 5 eingeführten Art beschreiben:
L = {(a1 , a2 , a3 , a4 )|a1 , a2 , a3 , a4 ∈ Q, und es gibt ein d ∈ Q mit
3
1
7
3 1
7
(a1 , a2 , a3 , a4 ) = (1 , −4 , 1 , 0) + d · (− , 4 , − , 1)}.
5
5 15
5 5
15
7
, 0) die
Alle Lösungen erhält man, indem man zu der Lösung (1 35 , −4 15 , 1 15
3
1
7
sämtlichen rationalen Vielfachen“ von (− 5 , 4 5 , − 15 , 1) addiert, im Sinne
”
der obigen Definition. Wir schreiben für die Menge aller dieser rationalen
”
7
Vielfachen“, also für die Menge der Elemente der Form d · (− 53 , 4 51 , − 15
, 1)
kurz
3 1
7
(− , 4 , − , 1) Q
5 5
15
10
d. h.: jedenfalls dann, aber auch in keinem anderen Fall!
14
und verwenden dies für die folgende abgekürzte Schreibweise für die Lösungsmenge L:
3 1
3
1
7
7
L = (1 , −4 , 1 , 0) + (− , 4 , − , 1) Q ,
5
5 15
5 5
15
wobei wir das Zeichen +, das eigentlich nur zwischen zwei Objekten des Typs
(a1 , . . . , an ) erklärt ist, in veränderter Form verwandt11 haben: zwischen einem Objekt des angegebenen Typs und einer ganzen Menge M von solchen
Objekten. Darunter soll die Menge aller Summen verstanden werden, die
man aus (a1 , . . . , an ) und einem der Elemente von M bilden kann.
7
, 1) Q einfacher schreiben in der
Wir können die Menge (− 53 , 4 51 , − 15
Form (−9, 63, −7, 15) Q , denn die Menge aller rationalen Vielfachen von
7
(− 53 , 4 51 , − 15
, 1) ist zugleich auch die Menge aller rationalen Vielfachen von
7
, 1).
15 · (− 35 , 4 51 , − 15
7
Während in der obigen Darstellung von L das Objekt (1 53 , −4 15 , 1 15
, 0) uns
schon (nämlich als eine spezielle Lösung
des gegebenen Gleichungssystems)
7
bekannt ist, besitzt bislang die Menge (− 35 , 4 15 , − 15
, 1) Q für uns noch
keine griffige Deutung bezüglich unseres Ausgangssystems. Wählen wir aber
7
ein rationales Vielfaches von (− 53 , 4 15 , − 15
, 1) für (x1 , x2 , x3 , x4 ) und setzen
in die linken Seiten der Gleichungen unseres Ausgangssystems ein, so ergeben
sich auf der rechten Seite nicht etwa die
stehenden Zahlen
−1, 3, 6, 8,
dort
3
1
7
4, sondern jedesmal 0. D. h. die Menge (− 5 , 4 5 , − 15 , 1) Q enthält12 lauter
Lösungen des veränderten Gleichungssystems
(∗)0
2x1 +
−x1 +
x1
2x1 +
x2
x2 +
+
2x2 +
−2x2 −
6x3
3x3
9x3
3x3
−
−
+
−
+
3x4
2x4
2x4
3x4
7x4
=
=
=
=
=
0
0
0
0
0
.
Dieses nennen wir das zu (∗) gehörige homogene lineare Gleichungssystem.
Allgemein legen wir fest:
Definition Sei (∗) wie in der Proposition gegeben. Gilt dann b1 = · · · =
bm = 0, so heißt das lineare Gleichungssystem (∗) homogen, andernfalls inhomogen. Zu jedem beliebigen linearen Gleichungssystem (∗) erhält man das
11
drastisch gesagt: mißbraucht“
”
In der Tat handelt es sich sogar um die genaue Lösungsmenge des homogenen Systems.
Das haben wir an dieser Stelle jedoch noch nicht bewiesen, sondern nur eine der dazu
einzusehenden Mengeninklusionen.
12
15
zugehörige homogene lineare Gleichungssystem (∗)0 , indem man in (∗) jeden
der Werte b1 , . . . , bm durch 0 ersetzt.
Die Lösungsmengen homogener linearer Gleichungssysteme haben interessante Eigenschaften, die man im Falle von inhomogenen linearen Gleichungssystemen nicht vorfindet: Sind nämlich (a1 , . . . , an ) und (a′1 , . . . , a′n ) beides
Lösungen eines homogenen linearen Gleichungssystems, so ergibt sich beim
Einsetzen der ai (für die jeweilige Unbekannte xi ) sowie auch beim Einsetzen der a′i auf der rechten Seite jeder Gleichung stets der Wert 0, also beim
Einsetzen von ai + a′i ebenfalls (da 0+0=0). Dasselbe ist bei gegebenem
rationalen Faktor d festzustellen, wenn man statt ai stets dai einsetzt (da
d · 0 = 0). Auch ist ein homogenes lineares Gleichungssystem stets lösbar, da
ja (0, . . . , 0) offensichtlich eine Lösung ist. (Man nennt sie die triviale Lösung
des Gleichungssystems.) Damit erhalten wir:
Bemerkung Sei L0 die Lösungsmenge eines homogenen linearen Gleichungssystems
(1) Gilt (a1 , . . . , an ) ∈ L0 und (a′1 , . . . , a′n ) ∈ L0 , so gilt auch
(a1 , . . . , an ) + (a′1 , . . . , a′n ) ∈ L0 .
(2) Gilt (a1 , . . . , an ) ∈ L0 , so gilt für alle d ∈ Q auch d · (a1 , . . . , an ) ∈ L0 .
(3) (0, . . . , 0) ∈ L0 .
Mit ähnlichen Überlegungen erhalten wir das folgende wichtige Hauptergebnis über den Zusammenhang zwischen der Lösungsmenge eines linearen
Gleichungssystems und der des zugehörigen homogenen linearen Gleichungssystems:
Satz Seien m, n ∈ N, und seien c11 , c12 ,. . . , c1n , c21 , c22 ,. . . , c2n ,. . . , cmn ,
b1 ,. . . ,bm rationale Zahlen. Sei L die Lösungsmenge des linearen Gleichungssystems
(∗)
c11 x1 + · · · + c1n xn = b1
..
..
..
..
.
.
.
.
cm1 x1 + · · · + cmn xn = bm
und L0 die Lösungsmenge des zugehörigen homogenen linearen Gleichungssystems. Ist (ã1 , . . . , ãn ) eine Lösung von (∗), so gilt die Gleichheit
L
=
(ã1 , . . . , ãn ) + L0 ,
d. h. man erhält jedes Element von L, indem man zu der speziellen Lösung
(ã1 , . . . , ãn ) jedes Element von L0 addiert.
16
Beweis. 1. Teil: Wir zeigen L ⊆ (ã1 , . . . , ãn ) + L0 :
Sei (a1 , . . . , an ) ∈ L. Dann ist sowohl (ã1 , . . . , ãn ) als auch (a1 , . . . , an ) eine
Lösung von (∗). Es folgt:
c11 (a1 − ã1 ) + · · · +
..
.
c1n (an − ãn ) =
..
.
b1 − b1
cm1 (a1 − ã1 ) + · · · + cmn (an − ãn ) = bm − bm
= 0
..
.
.
= 0
Setzen wir also (h1 , . . . , hn ) := (a1 , . . . , an )−(ã1 , . . . , ãn ) 13 , so gilt: (h1 , . . . , hn )
∈ L0 . Es folgt:
(a1 , . . . , an ) = (ã1 , . . . , ãn )+(h1 , . . . , hn ) ∈ (ã1 , . . . , ãn )+L0 .
2. Teil: Wir zeigen (ã1 , . . . , ãn ) + L0 ⊆ L:
Sei (a1 , . . . , an ) ∈ (ã1 , . . . , ãn )+L0 . Dann gibt es eine Lösung (h1 , . . . , hn ) des
zu (∗) gehörigen homogenen linearen Gleichungssystems mit der Eigenschaft
(a1 , . . . , an ) = (ã1 , . . . , ãn )+(h1 , . . . , hn ) = (ã1 + h1 , . . . , ãn + hn ).
Es folgt:
c11 a1 + · · · + c1n an = c11 (ã1 + h1 ) + · · · + c1n (ãn + hn ) = b1 + 0 = b1
..
..
,
.
.
cm1 a1 + · · · + cmn an = cm1 (ã1 + h1 ) + · · · + cmn (ãn + hn ) = bm + 0 = bm
also (a1 , . . . , an ) ∈ L.
Folgerung Ein lineares Gleichungssystem, das lösbar ist, hat eine eindeutig
bestimmte Lösung genau dann, wenn das zugehörige homogene lineare Gleichungssystem nur die triviale Lösung (0, . . . , 0) hat.
Ist nämlich (ã1 , . . . , ãn ) eine nach Voraussetzung gegebene Lösung, so ist diese nach dem Satz genau dann die einzige, wenn L0 nur das Element (0, . . . , 0)
enthält.
Man beachte, daß die Darstellung von L gemäß unserem Satz in der Form
(ã1 , . . . , ãn ) + L0 immer gilt, wenn nur (ã1 , . . . , ãn ) irgendeine Lösung von (∗)
ist. Daher können wir in der bisherigen Darstellung, die wir für die Lösungsmenge unseres Ausgangsbeispiels gewonnen haben, die spezielle Lösung
7
, 0) durch irgendeine andere ersetzen. Insbesondere gilt auch:14
(1 53 , −4 15 , 1 15
L = (1, 0, 1, 1) + (−9, 63, −7, 15) Q .
13
Natürlich soll das bedeuten: (a1 , . . . , an )+(−ã
1 , . . . , −ãn ) Daß die noch unbewiesene Inklusion L0 ⊆ (−9, 63, −7, 15) Q gilt, wenden wir hierbei
an. Wie sähe ein Beweis dafür aus?
14
17
Ein unlösbares lineares Gleichungssystem läßt sich auf einfachste Weise angeben, z. B. durch
x = 0
x = 1
Eine Menge, die (wie die Lösungsmenge in diesem Beispiel) kein Element
enthält, wird leer genannt. Zum Beispiel ist auch die Menge M := {z|z ∈ N
und z < 0} leer. Wir überlegen nun:
Bemerkung Ist X eine leere Menge, so gilt X ⊆ Y für jede Menge Y .
Beweis. Seien also X, Y Mengen, dabei X leer. Wäre die Aussage X ⊆ Y
falsch, so müßte es ein Element von X geben, das nicht in Y liegt. Da X leer
ist, enthält X aber überhaupt kein Element. Daher kann die Aussage X ⊆ Y
nicht falsch, also nur wahr sein, d. h. es gilt X ⊆ Y .
Erstmalig haben wir hier eine Aussage indirekt bewiesen: Statt eine Aussage
A in ihrer gegebenen Form ins Visier zu nehmen, zeigt man dabei, daß die
Negation von A, also die Aussage ¬A, falsch ist. Dann kann nämlich A nicht
ebenfalls falsch sein; und dies bedeutet, daß A wahr ist. Der Schluß beruht
auf dem Prinzip, daß es zu A ist wahr“ und A ist falsch“ keine (dritte)
”
”
Alternative gibt (tertium non datur).
Folgerung Je zwei leere Mengen sind gleich.
Beweis. Seien M, M ′ leere Mengen. Nach der Bemerkung (mit X := M,
Y := M ′ ) gilt M ⊆ M ′ . Eine zweite Anwendung der Bemerkung (nämlich
X := M ′ , Y := M) ergibt aber auch: M ′ ⊆ M. Es folgt: M = M ′ .
D. h. in welchem mathematischen Kontext auch immer sich irgendeine Menge als leer erweist, so ist sie damit stets ein eindeutig bestimmtes Objekt
der Mathematik: die leere Menge“. Dadurch ist auch gerechtfertigt, für sie
”
ein von dem jeweiligen Zusammenhang unabhängiges Symbol zu verwenden;
dafür ist das Zeichen ∅ üblich.15
Zwischen den bislang eingeführten Schreibweisen für Lösungen eines linearen Gleichungssystems (nämlich als Tupel) und der Matrizenschreibweise als
ein lineares Gleichungssystem eindeutig festlegendes Zahlenschema sind offenkundig natürliche Beziehungen vorhanden: Im Falle unseres Ausgangsbeispiels etwa,
15
In der Bemerkung und in der Folgerung geht es um die eindeutige Bestimmtheit, nicht
aber um die Existenz einer leeren Menge. Wie jedoch die vorgenannten Beispiele bereits
nahelegen, ist diese ein für die mathematische Begriffswelt unverzichtbares Postulat. Wir
betrachten in aller Folge die leere Menge als ein gegebenes grundlegendes Objekt der
Mathematik.
18
2x1 +
−x1 +
x1
2x1 +
x2
x2 +
+
2x2 +
−2x2 −
6x3
3x3
9x3
3x3
−
−
+
−
+
3x4
2x4
2x4
3x4
7x4
= −1
= 3
= 6
= 8
= 4
∼

2
1
0 −3 −1
−1 1
6 −2 3 



0
3
2
6
C :=  1
,
2
2
9 −3 8 
0 −2 −3 7
4

entnehmen wir der Matrix in Form ihrer Zeilen“ fünf 5-Tupel:
”
C1 : = (2, 1, 0, −3, −1) heißt die erste Zeile von C,
C2 : = (−1, 1, 6, −2, 3) heißt die zweite Zeile von C,
..
.
Ebenso erhalten wir durch senkrechtes Lesen“
”
1
C : = (2, −1, 1, 2, 0) heißt die erste Spalte von C,
C 2 : = (1, 1, 0, 2, −2) heißt die zweite Spalte von C,
..
.
Daß die Matrix C in diesem Fall genauso viele Zeilen wie Spalten hat, ist eine
im allgemeinen nicht zu erwartende Besonderheit. Man nennt solche Matrizen
quadratisch. Unserer quadratischen Matrix C entnehmen wir durch schräges
”
Abwärtslesen“ noch ein weiteres in späteren Zusammenhängenden gelegentlich eine Rolle spielendes Tupel: (2, 1, 3, −3, 4), die sogenannte Hauptdiagonale
von C. Zunächst sind für uns die Zeilen einer Matrix am wichtigsten:
Sei ein beliebiges lineares Gleichungssystem (∗) mit den Bezeichnungen wie
in unserer Proposition gegeben. Da man jede Matrix durch Angabe ihrer
Zeilen beschreiben kann, geben wir in Kurzform auch die zu (∗) gehörige
Matrix

 

c11 · · · c1n b1
C1
 ..


.
.
..
..  wieder durch  ... 
C : = .
.
cm1 · · · cmn bm
Cm
Anläßlich der Angabe unserer Lösungsmengen hatten wir eine Addition“ +
”
von Tupeln (gleicher Länge) und eine Multiplikation“ · zwischen rationa”
len Zahlen und Tupeln kennengelernt. Nun werden wir feststellen, daß diese
19
Festlegungen bestens geeignet sind, die in der Proposition behandelten elementaren Umformungen eines linearen Gleichungssystems in Umformungen
der zugehörigen Matrix zu übertragen. Wir erhalten nämlich durch Anwendung unserer Proposition die Einsicht:
Für beliebige i, j ∈ {1, . . . , m} mit i 6= j gilt: Ersetzt man die i-te Zeile Ci
durch Ci +d · Cj (für irgendein d ∈ Q) und nennt die so entstehende Matrix
C ′ , so sind C, C ′ lösungsgleich.
Sind nämlich i, j ∈ {1, . . . , m} und etwa i < j (der Fall i > j verläuft
analog), so ist die Behauptung im Falle d = 0 trivial (da dann C = C ′ ),
und im Falle d 6= 0 gibt die folgende Kette wieder, wie man durch sukzessive Anwendungen der Proposition unter Lösungsgleichheit von C nach C ′
gelangt:








C1
C1
C1
C1
..
..
 .. 
 .. 




 . 
 . 




.
.








 Ci 
 Ci 
Ci +d · Cj 
Ci +d · Cj 
 . 






..
 → d · Cj  →  d · Cj  → 
 → C′
.
C→
.
.
 (3)  .  (1) 



(2) 
(3)
..
d · C 
 .. 


 d · C  (2)
.






j
j 
 . 
 . 




..
..
 .. 
 .. 




.
.
Cm
Cm
Cm
Cm
Ganz unmittelbar aus der Proposition erhält man, daß eine Zeile durch ihr dfaches ersetzt werden darf, sofern d eine rationale Zahl 6= 0 ist, und daß man
die Reihenfolge der Zeilen beliebig ändern darf, ohne daß sich die Lösungsmenge des zugehörigen Gleichungssystems ändert. Unter einer elementaren
Zeilenumformung einer Matrix C aus rationalen Zahlen verstehen wir eine
der folgenden Operationen:
(i) Ersetzen von Ci durch Ci +d · Cj (d ∈ Q, j 6= i),
(ii) Ersetzen von Cj durch d · Cj (d ∈ Q, d 6= 0 (!)),
(iii) Veränderung der Reihenfolge der Zeilen von C.
Vermöge der oben festgehaltenen Einsicht erhalten wir aus unserer Proposition über die elementaren Gleichungssystem-Umformungen daher:
Proposition von den elementaren Zeilenumformungen einer Matrix
Entsteht eine Matrix D aus einer Matrix C durch eine elementare Zeilenumformung, so sind C und D lösungsgleich.
Natürlich bleibt die Lösungsgleichheit erhalten, wenn man nun nacheinander solche elementaren Zeilenumformungen vornimmt. Wir tun jetzt genau
20
das, indem wir einen Algorithmus formulieren, durch den wir jede beliebige
Matrix rationaler Zahlen auf eine bestimmte Endgestalt bringen; dieser läßt
sich die Lösungsmenge dann ohne weiteres entnehmen:
Algorithmus durch elementare Zeilenumformungen
Ausgangssituation: Gegeben sei eine Matrix C aus rationalen Zahlen cij .
1. Falls C eine Nullmatrix16 ist, ist der Algorithmus hier beendet.
2. Andernfalls sei s die kleinste natürliche Zahl mit der Eigenschaft, daß
die Spalte C s ein Element 6= 0 enthält. Sei dann r die kleinste Zahl mit
der Eigenschaft crs 6= 0.
(a) Vermöge (ii) ersetzen wir Cr durch c1rs · Cr ; dadurch entsteht eine
Matrix mit einer 1 an der Stelle des früheren Elementes crs .
(b) Vermöge (i) mit j : =r können wir dann alle Zeilen mit Zeilenindizes > r durch Zeilen ersetzen, deren s-te Komponente 0 ist.
(c) Vermöge (iii) verschieben wir die r-te Zeile ganz nach oben und
erhalten dadurch eine Matrix D, bei der die ersten s Spalten nur
Nullen enthalten, mit Ausnahme des s-ten Elementes der ersten
Zeile; dieses ist 1.
3. Falls C nur eine Zeile enthält, ist der Algorithmus hier beendet.
4. Andernfalls sei C ′ die ( Rest“)-Matrix, die sich aus D durch Streichen
”
der 1. Zeile und der ersten s Spalten ergibt, und man fahre (innerhalb
der Matrix C) mit der Matrix C ′ gemäß 1. und 2. fort.
Da bei jeder Durchführung der Punkte 1. – 4. entweder der Algorithmus
terminiert oder sich die Zahl der Zeilen der weiter zu betrachtenden Matrix
um 1 reduziert, kann die Anzahl der algorithmischen Schritte (gezählt durch
den jeweils einleitenden Sprung zur Entscheidung 1.) nicht die Zahl der Zeilen
von C übersteigen.
Ist C keine Nullmatrix, so hat die aus
entstehende Matrix D die Gestalt:

0 ... 0 1

0 . . . 0 0
.
.. ..
 ..
. .

0 ... 0 0
16
C nach Durchlauf der Teile von 2.
· ... ·
· ...
..
. C′
· ...


· 
,
.. 
. 

·
Darunter verstehen wir eine Matrix, bei der sämtliche Elemente cij gleich 0 sind.
21
also nach Abschluß des gesamten Algorithmus:

0 ... 0 1 · ... · · · ...

0 0 ... 0 1 · ...


..

.

.. ..
 ..
..
.
.
. .
.
.
.
 ..
.. ..
... 0 0 ... 0 1 ·


O
0 0


.. ..

. .
0 ... ... 0 0 ...
0 0
...
0 0
*

... ·
. . . ·

.. 
.

.. 
.

. . . ·


. . . 0
.. 
.
... 0
Man sagt, daß eine Matrix dieser Art Zeilenstufenform hat: Eine Matrix A
mit m Zeilen und l Spalten hat Zeilenstufenform, wenn es eine nichtnegative
ganze Zahl k ≤ m und natürliche Zahlen j1 , j2 , . . . , jk ∈ {1, . . . , l} mit j1 <
j2 < · · · < jk gibt, so daß gilt:
Ai = (0, . . . , 0, 1, · · · ) für alle i ∈ {1, . . . , k},
| {z }
ji
Ak+1 = · · · = Am = (0, . . . , 0).
Im Falle k = m gibt es dann keine Nullzeilen in der Matrix. Im Falle jk = l ist
die k-te Zeile die letzte Zeile, die keine Nullzeile ist, und sieht folgendermaßen
aus:
Ak = (0, . . . , 0, 1) falls jk = l
In diesem Fall ist das zu A gehörige lineare Gleichungssystem unlösbar, da
seine letzte (nichttriviale) Gleichung offenbar unerfüllbar ist. In jedem anderen Fall ist das Gleichungssystem lösbar: Sind ai,k+1, . . . , ail die rationalen
Zahlen, für die gilt:
Ai = (0, . . . , 0, 1, ai,k+1, . . . , ail ),
n: = l − 1, bi : =ai,l für alle i ≤ m, so hat das zu A gehörige lineare Gleichungssystem dieselben Lösungen wie das System
xjk = bk − akn xn − · · · − ak,jk +1 xjk +1
..
.
xj1 = b1 − a1n xn − · · · − a1,j1 +1 xj1 +1
Hierin sind offensichtlich die Unbekannten xi mit i 6∈ {j1 , . . . , jk } beliebig
wählbar und die übrigen dann eindeutig bestimmt. Es gilt also:
Proposition über Gleichungssysteme von Zeilenstufenform Hat eine
Matrix A Zeilenstufenform, genau k Zeilen 6= (0, . . . , 0) und genau n + 1
22
Spalten, so ist das zugehörige lineare Gleichungssystem (in n Unbekannten)
entweder unlösbar oder es lassen sich genau n − k der Unbekannten frei
wählen.
Die Bestimmung der Lösungen vereinfacht sich noch, wenn man zuvor die
Zeilenstufenform vermöge Zeilenumformungen vom Typ (i) so verfeinert, daß
für jedes i ≤ k die ji -te Spalte statt der Werte a1,ji , . . . , ai−1,ji nur Nullen
enthält.
Bezüglich unseres Ausgangsbeispiels etwa sieht man, daß sich die zweite auf
S. 13 gegebene Matrix zwar in die Zeilenstufenform


1 0 3 2
6
0 1 9 0
9 


0 0 1 − 7 − 22 
15
15 

0 0 0 0
0 
0 0 0 0
0
bringen läßt, jedoch ist es geschickter, die verfeinerte Zeilenstufenform (siehe
die letzte auf S. 13 angegebene Matrix) anzustreben, bei der nicht nur unterhalb, sondern auch oberhalb der 1en in den ersten drei Spalten jeder Wert 0
ist.
Wir betrachten dazu noch ein abschließendes Beispiel: Die ZeilenstufenformMatrix


1 2 3 5 −1 −2 1 b1
0 0 0 1 −2 −3 −1 b2 



0 0
1
2 b3 
O
0
1 b4
bringen wir durch elementare Zeilenumformungen in folgende verfeinerte
Form:


1 2 3 0 9 0 0 b1 − 5b2 − 13b3 + 20b4
0 0 0 1 −2 0 0

b2 + 3b3 − 5b4

,


0 0 1 0
b3 − 2b4
O
0 1
b4
was dem linearen Gleichungssystem
x7
x6
x4
x1
=
=
=
=
b4
b3 − 2b4
b2 + 3b3 − 5b4 + 2x5
b1 − 5b2 − 13b3 + 20b4 − 9x5 − 3x3 − 2x2
23
entspricht. Jede Lösung hat also die Gestalt
(b1 − 5b2 − 13b3 + 20b4 − 9f − 3e − 2d, d, e, b2 + 3b3 − 5b4 + 2f, f, b3 − 2b4 , b4 )
mit geeigneten d, e, f ∈ Q, d. h. die Lösungsmenge ist
L = (b1 − 5b2 − 13b3 + 20b4 , 0, 0, b2 + 3b3 − 5b4 , 0, b3 − 2b4 , b4 )
+h(−2, 1, 0, 0, 0, 0, 0)iQ+h(−3, 0, 1, 0, 0, 0, 0)iQ+h(−9, 0, 0, 2, 1, 0, 0)iQ
Einige Elemente mathematischer
Ausdrucksweise
Wir stellen im folgenden einige Elemente mathematischer Ausdrucksweise
zusammen, zunächst einige Symbole aus dem Bereich der Logik. Seien A, B
Aussagen. Es bedeuten:
A∧B
:
A und B; sowohl A als auch B gilt.
A∨B
:
A oder B; wenigstens eine der Aussagen A, B gilt.
¬A
:
nicht A; A gilt nicht.
A⇒B
:
Aus A folgt B; wenn A, so B.
A⇔B
:
A ist gleichwertig (äquivalent) zu B; (A ⇒ B) ∧ (B ⇒ A).
∀...
(∗) :
Für alle . . . gilt (∗).
∃...
(∗) :
Es gibt ein . . . mit der Eigenschaft (∗).
Man beachte, daß bei der umgangssprachlichen Übertragung des Symbols
∀“ das Wort gilt“ bereits durch das Symbol mit ausgedrückt wird; ebenso
”
”
ist mit der Eigenschaft“ bereits durch das Symbol ∃“ mit erfaßt. Es handelt
”
”
sich also nicht um Abkürzungen für für alle“ bzw. es gibt“, auch wenn
”
”
man diese Art der Verwendung häufig antreffen kann. Tatsächlich sind die
Quantoren ∀“, ∃“ Bestandteile einer formalen Sprache, nämlich der der
”
”
Prädikatenlogik, in der für sie auch eine klare Grammatik“ festgelegt ist.
”
Will man sie nicht nur als willkommene Abkürzungen“, sondern in jenem
”
Sinne korrekt verwenden, so sollte man beachten:
• Die Zeichen ∀“, ∃“ leiten stets eine Aussage ein, stehen also stets am
”
”
Beginn, nie am Ende einer formalisierten Aussage.
24
• Auf die Zeichen ∀“, ∃“ muß zwingend eine freie Variable folgen, nie”
”
mals eine Konstante oder ein Term, der eine funktionale Abhängigkeit
ausdrückt.17
Wir stellen uns in der Folge auf den Standpunkt, daß in einer formalisierten
Zeile auch die Grammatik der Sprache, in der die Formalisierung vorgenommen wird, beachtet werden soll. D. h. wir halten es für einen guten Stil, in
Formelzeilen auf umgangssprachliche Elemente möglichst ganz zu verzichten
und zumindest die beiden genannten grammatikalischen Regeln“ für den
”
Gebrauch der All- und Existenzquantoren zu respektieren. Das schließt Formulierungen wie etwa x2 ≥ 0 ∀x ∈ Q“ oder ∃sin x ∈ R cos(sin x) = 12“
”
”
aus; nach dem zuvor Gesagten gilt dies auch z. B. für ∀x ∈ Q gilt x2 ≥ 0“,
”
∃x ∈ R mit cos(sin x) = 21“. (Unterstrichen ist jeweils der Stein des An”
”
stoßes“.) Dagegen erlauben wir uns in der Regel, bei den Variablen, die auf
ein Quantorensymbol folgen, in Form von Elementzugehörigkeit den Bereich
anzugeben, über den sich die Variable erstrecken darf. Bei einer quantorisierten Aussage trennen wir optisch den Quantorenteil (der den Beginn der
Aussage ausmacht) von der sogenannten Kernformel“ durch einen gewissen
”
Abstand, nicht jedoch durch ein umgangssprachliches Wort. Mit diesen stilistischen Abmachungen konform wären also z. B. die folgenden Fassungen des
inhaltlich in den kritisierten Formulierungen Gemeinten:
∀x ∈ Q
x2 ≥ 0 ,
∃x ∈ R
cos(sin x) =
1
2
.
Schon diese Beispiele zeigen aber, daß man den Inhalt auch dann u. U. verstehen kann, wenn man gegen die geschilderte Grammatik verstößt. So kommt
es, daß in anderen mathematischen Darstellungen durchaus eine abweichende
( lockerere“) stilistische Wahl getroffen werden kann, ohne daß die Korrekt”
heit des inhaltlich Mitgeteilten davon beeinträchtigt wird. Tatsache ist, daß
stilistisch gelockerte“ mathematische Texte sogar häufig anzutreffen sind.
”
Da wir jedoch keinen Vorteil darin sehen, uns über die aus der Logik bekannte Grammatik hinwegzusetzen, schließen wir uns solchen abweichenden
stilistischen Entscheidungen im Grundsatz nicht an.
Weiter stellen wir einige mengentheoretische Konzepte zusammen, die wenigstens zum Teil wohlbekannt sein dürften. Auch hier ist allerdings die Verwendung der Schreibweisen nicht ganz einheitlich. Für beliebige Mengen S,
T wird gesetzt:
17
Im Volkston: Nach einem Quantor hat ein nackter Buchstabe“ zu folgen wie x, A,
”
ϕ . . . – kein geschminkter“ wie etwa x−1 , A2 , ϕij . Ganz und gar dem Sinn eines
”
Quantors widersprechend ist eine Zusammenstellung wie ∃1 ∈ N“ oder ∃0 ∈ Z“.
”
”
25
S ∩ T := {x|x ∈ S ∧ x ∈ T } (Durchschnitt von S und T )
S ∪ T := {x|x ∈ S ∨ x ∈ T } (Vereinigung von S und T )
S r T := {x|x ∈ S ∧ x ∈
/ T } ( S ohne T“, Differenzmenge von T in S)
”
Zur Bildung der Differenzmenge von T in S braucht T keineswegs in S enthalten zu sein. Gilt aber T ⊆ S, so wird S r T auch das mengentheoretische
Komplement von T in S genannt. Unter der mengentheoretischen Differenz von
S und T versteht man die Menge
S△T := (S ∪ T ) r (S ∩ T ).
In der bekannten geometrischen Veranschaulichung der Mengen S, T :
S
T
SrT
S∩T
T rS
findet sich S ∪T als die gesamte umgrenzte Fläche, S△T dagegen als dieselbe
unter Aussparung des S und T gemeinsamen Teils S ∩ T repräsentiert. Die
mengentheoretische Differenz ist von den hier erwähnten Konzepten das von
der geringsten Relevanz. Jedoch sei ohne Beweis die folgende bemerkenswerte
nichttriviale Eigenschaft erwähnt: Für beliebige Mengen S, T , U gilt:
(S△T )△U = S△(T △U)
Eine ganz besonders wichtige Operation besteht in der Bildung der sogenannten Potenzmenge einer Menge M, definiert durch
P(M) := {T |T ⊆ M}.
Die Elemente von P(M) sind genau die Teilmengen von M. Zum Beispiel
gilt:
P({1, 2, 3}) = {1, 2, 3}, {1, 2}, {1, 3}, {2, 3}, {1}, {2}, {3}, ∅ .
26
Unsere Bemerkung auf S. 18 besagt: ∅ ∈ P(M) für jede Menge M. Insbesondere gilt – eben deswegen nämlich – P(M) 6= ∅ für jede Menge M. Wir
setzen
P′ (M) := P(M) r {∅}
für jede Menge M, d. h. P′ (M) ist die Menge der nichtleeren Teilmengen von
M. Im Falle M = ∅ gilt P′ (M) = ∅, in jedem anderen wegen ∅ =
6 M ∈ P(M)
′
jedenfalls M ∈ P (M).
Bemerkung 1 Für beliebige Mengen M, N gilt stets P(M) 6= P′ (N),
da die erste Menge ∅ als Element enthält, die zweite hingegen nicht. – Ein
wichtiges Konstruktionsprinzip interessanter mathematischer Objekte sieht
nun so aus, daß man zunächst zu einer vorgegebenen Menge M die Potenzmenge bildet und anschließend daraus eine gewisse Auswahl von Elementen
(also von Teilmengen von M) trifft, d. h. man bildet Mengen, deren Elemente gewisse Teilmengen von M sind. Betrachtet man eine Menge X, deren
Elemente gewisse zuvor gegebene Mengen T1 , T2 , . . . sind, so kann man sich
diesen Übergang als ein Betreten eines höher gelegenen Stockwerks“ vorstel”
len: Man denke sich die Elemente der Mengen T1 , T2 , . . . im Erdgeschoß eines
Gebäudes angesiedelt, über dem die umfassenden Mengen Ti im ersten Stock
thronen. Macht man nun die Mengen Ti zu Elementen einer neuen Menge X,
so gleicht dies dem Betreten eines 2. Stockwerks. Allgemein kann man nach
Erreichen eines gewissen höheren Stockwerks stets dort angesiedelte Mengen zu Elementen einer neuen Menge machen, die dann in diesem Bild im
nächsthöheren Stockwerk angesiedelt ist. Wie jedes Bild, so hat auch dieses
vom Hochhaus der Mengen“ seine Schwächen; es könnte aber bei einem er”
sten Zugang jedenfalls zu einer halbwegs anschaulichen und zur Orientierung
nützlichen Vorstellung verhelfen.
Zum Beispiel enthält die Menge Q unendlich viele Elemente (die Brüche).
Die im nächsthöheren Stockwerk gelegene“ Menge {Q} dagegen enthält ein
”
einziges Element: Q.
Sei nun M eine Menge, deren Elemente selbst Mengen sind.18 Wir setzen
dann:
[
M := {x|∃T ∈ M x ∈ T } (Vereinigung über M)
und im Falle M 6= ∅
\
M := {x|∀T ∈ M
x ∈ T } (Durchschnitt über M).
18
Dieser Relativsatz ist natürlich unnötig, da wir ja, sofern nicht anderes gesagt wird,
ohnehin nur Mengen als mathematische Objekte in Betracht ziehen. Er dient lediglich als
Hilfe für den, dem diese Sichtweise ungewohnt ist.
27
Im Falle M = ∅ ist die Bedingung ∀T ∈ M x ∈ T“ für jede Menge
x
S
”
erfüllt, ∃T ∈ M x ∈ T“ hingegen für keine Menge x. Daher gilt: ∅ = ∅,
”
während der Durchschnitt über ∅ (für die Vorstellung: der Durchschnitt über
ein System von Mengen, dem überhaupt keine Menge angehört) jede Menge
als Element enthalten müßte. An dieser Stelle gelangen wir an die Grenzen
unseres naiven Mengenkonzeptes: Die blauäugige“ Weise, mit der wir bislang
”
mit Mengen umgegangen sind, verschweigt nämlich einen wichtigen Punkt:
Man darf keineswegs auf beliebige Weise Mengen zu neuen Mengen zusammenfassen, wenn man sich nicht in Widersprüche verstricken will. Ohne auf
die hiermit verbundenen nichttrivialen Untersuchungen genauer einzugehen,
bemerken wir nur, daß es jedenfalls keine Menge gibt, die sämtliche Mengen
(also auch sich selbst!) als Elemente enthielte. Auf ein für solche Einsichten notwendiges rigoroses Studium axiomatischer Mengenlehre kann hier nur
verwiesen werden. Hierin liegt jedoch der Grund dafür, daß der Durchschnitt
über eine Menge M nur für nichtleeres M definiert ist.
Der Zusammenhang zum gewöhnlichen“ Durchschnitt bzw. zur gewöhnli”
”
chen“ Vereinigung zweier Mengen (siehe S. 26) ist klar, denn offensichtlich
gilt:
T
S
Bemerkung 2 Gilt M = {S, T }, so folgt: M = S ∩ T ,
M = S ∪ T. Im speziellen Fall S = T (in dem also M einelementig ist) ergibt dies:
T
S
Bemerkung 3 Für jede Menge S gilt: {S} = S = {S}.
Die Vereinigungsmenge aller Teilmengen einer Menge M ist offensichtlich M,
ebenso wie die Vereinigungsmenge aller nichtleeren Teilmengen von M:
S
S
Bemerkung 4 Für jede Menge M gilt:
P(M) = M = P′ (M).
28
Kapitel 1
Urpaare, Funktionen,
Relationen
1.1 Definition (Urpaar, Komponenten) Ein Urpaar ist eine 2-elementige
Menge p, für die gilt: Es gibt Mengen A, B mit P(A), P′ (B) ∈ p.
Nach Bemerkung 1 auf S. 27 hat dann p genau die Elemente P(A), P′ (B).
Dabei sind die Mengen A, B eindeutig bestimmt; es gilt:
1.1.1 Ist p = {P(A), P′ (B)} und sind C, D Mengen mit P(C), P′ (D) ∈ p,
so folgt A = C, B = D.
Beweis: Da P(A) das (einzige) Element von p ist, das ∅ als Element enthält,
und da auch ∅ ∈ P(C) gilt, folgt P(A) = P(C); aus der ersten der beiden
Gleichungen in Bemerkung 4 (S. 28) erhalten wir nun A = C. Mit der zweiten
Gleichung derselben Bemerkung folgt ebenso B = D.
Die eindeutig bestimmte Menge A mit P(A) ∈ p heißt die erste Komponente,
die eindeutig bestimmte Menge B mit P′ (B) ∈ p die zweite Komponente des
Urpaars p. Für das Urpaar mit der ersten Komponente A und der zweiten
Komponente B schreiben wir
(A; B).
Damit besagt 1.1.1:
1.1.1’ (A; B) = (C; D) ⇒ A = C ∧ B = D für alle Mengen A, B, C, D.
D. h. durch die rein mengentheoretische Konstruktion in Definition 1.1 entstand ein mathematisches Objekt, durch das Mengen A, B – die auch dieselben sein dürfen – unter Berücksichtigung ihrer Reihenfolge aufgeführt werden.
Ist p ein Urpaar, so schreiben wir p1 für die erste, p2 für die zweite Komponente von p, also: p = (p1 ; p2 ).
29
1.2 Definition (Vorbereich, Nachbereich, Funktion, Abbildung, Bild, Wertemenge, Identität, injektiv, surjektiv, bijektiv, Teilmengenfunktion, Umkehrung, vollständiges Urbild, disjunkt) Sei ϕ eine Menge von Urpaaren. Wir
nennen
V (ϕ) := {x|∃p ∈ ϕ x = p1 } den Vorbereich,
N(ϕ) := {y|∃p ∈ ϕ y = p2 } den Nachbereich
von ϕ.
1.2.1 Beispiel Sei ϕ0 := {(1; 1), (1; 2), (2; 3), (0; 4)}. Dann gilt: V (ϕ0 ) =
{0, 1, 2}, N(ϕ0 ) = {1, 2, 3, 4}.
ϕ heißt eine Funktion (oder Abbildung), wenn es zu jedem x ∈ V (ϕ) genau
ein y ∈ N(ϕ) gibt mit (x; y) ∈ ϕ. Ist dies der Fall, so benutzen wir auch die
Sprechweise ϕ ordnet dem Element x das Element y zu“, nennen y das Bild
”
von x unter ϕ und schreiben dafür:
y = xϕ
(Rechtsschreibweise für Abbildungen).
Andere gebräuchliche Schreibweisen sind die aus historischen Gründen weitest verbreitete Linksschreibweise ϕ(x) sowie die Exponentenschreibweise xϕ .
ϕ0 ist keine Funktion, da es zu dem Element 1 ∈ V (ϕ0 ) mehr als ein Element y ∈ N(ϕ0 ) gibt mit (1; y) ∈ ϕ0 , nämlich y = 1 und y = 2. Die zweite
Komponente ist also nicht eindeutig durch die erste Komponente bestimmt.
1.2.2 Beispiele ϕ1 := {(1; 1), (2; 3), (0; 4)} und ϕ2 := {(1; 3), (2; 3), (0; 4)}
sind Funktionen.
Ist ϕ eine Funktion, so heißt V (ϕ) der Definitionsbereich und N(ϕ) das Bild
(oder die Bildmenge) von ϕ. Jede Menge Y mit N(ϕ) ⊆ Y heißt eine Wertemenge für ϕ. Hat eine Funktion ϕ den Definitionsbereich X und ist Y
eine Wertemenge für ϕ, so heißt ϕ eine Abbildung von X nach (oder: in) Y .
Schreibweise dafür:
ϕ:X →Y
Ordnet ϕ dem Element x ∈ X das Element y ∈ Y zu, so schreiben wir:
ϕ : x 7→ y.
Häufig definiert man Abbildungen durch Angabe von Definitionsbereich,
Wertemenge und Elementzuordnung unter Verwendung beider Pfeil-Schreib”
weisen“, zum Beispiel:
ϕ:
Z → N0
x 7→ x2
30
Für jede Menge X verstehen wir unter der Identität auf X die Funktion
idX :
X → X
x 7→ x,
also: idX = {(x; x)|x ∈ X}.
Eine Funktion heißt injektiv, wenn für alle x, x′ ∈ V (ϕ) gilt:
x 6= x′ ⇒ xϕ 6= x′ ϕ
(bzw. als Kontraposition gleichwertig dazu : xϕ = x′ ϕ ⇒ x = x′ ). Von
unseren obigen Beispielen ist ϕ1 injektiv, ϕ2 nicht.
Seien nun X, Y vorgegebene Mengen und ϕ eine Abbildung von X nach Y . ϕ
heißt surjektiv, wenn die Menge der Bilder unter ϕ ganz Y ergibt, d. h. wenn
gilt:
∀y ∈ Y ∃x ∈ X xϕ = y.
Man beachte: Die Aussage ϕ ist surjektiv“ ist nur sinnvoll in bezug auf eine
”
zuvor gegebene Wertemenge Y . Dagegen ist die Injektivität von ϕ allein an
der Menge ϕ von Urpaaren zu entscheiden. Statt ϕ ist surjektiv“ sagt man
”
auch: ϕ ist eine Abbildung auf Y “. ϕ heißt eine Bijektion von X auf Y (als
”
Adjektiv: bijektiv), wenn ϕ injektiv und surjektiv ist. X heißt gleichmächtig
zu Y , wenn es eine Bijektion von X auf Y gibt.
1.2.3 Beispiele (
ϕ : N → N, k 7→ 2k ist injektiv, aber nicht surjektiv.
k − 1 falls k 6= 1
ist surjektiv, aber nicht injektiv.
ψ : N → N, k 7→
1
falls k = 1
(
−2k
falls k ≤ 0
ist bijektiv.
ω : Z → N0 , k 7→
2k − 1 falls k > 0
Für endliche Mengen X, Y bedeutet die Gleichmächtigkeit, daß X, Y gleich
viele Elemente besitzen.
Mit einer beliebigen Menge ϕ von Urpaaren sind auf natürliche Weise gewisse
andere Mengen von Urpaaren verbunden, die in manchen (auch unseren)
Kontexten eine Rolle spielen werden und daher hier eingeführt seien. Sei
X := V (ϕ), Y := N(ϕ). Ist T ⊆ V (ϕ), so setzen wir
ϕ|T := {p|p ∈ ϕ, p1 ∈ T }.
Ist ϕ eine Funktion, so offensichtlich auch ϕ|T . Sie hat den Definitionsbereich
T und heißt die Einschränkung (oder Restriktion) von ϕ auf T .
31
Sei nun wieder ϕ beliebig, X := V (ϕ), Y := N(ϕ). Wir setzen
xϕ+ := {y|y ∈ Y, (x; y) ∈ ϕ} für jedes x ∈ X
und
ϕ⊆ := {(S; T )|S ⊆ X, T ⊆ Y, T =
[
x∈S
xϕ+ }.
1.2.4 Ist ϕ eine Menge von Urpaaren, X := V (ϕ), Y := N(ϕ), so ist ϕ+
eine Funktion von X in P′ (Y ) und ϕ⊆ eine Funktion von P(X) in P(Y ). Wir nennen ϕ⊆ die zu ϕ gehörige Teilmengenfunktion. Für alle T ⊆ X gilt
T ϕ⊆ = {y|y ∈ Y, ∃x ∈ T
(x; y) ∈ ϕ},
insbesondere {x}ϕ⊆ = {xϕ} für alle x ∈ V (ϕ). Durch Vertauschung der
Komponentenreihenfolge bei den zu ϕ gehörigen Urpaaren erhalten wir
ϕ−1 := {(y; x)|(x; y) ∈ ϕ}
und nennen diese Menge von Urpaaren die Umkehrung von ϕ. Davon klar zu
unterscheiden ist die Menge von Urpaaren
ϕ− := (y; T )|y ∈ N(ϕ), T = {x|(x; y) ∈ ϕ}
(gelesen: ϕ-invers“). Im Gegensatz zu ϕ−1 ist ϕ− stets eine Funktion (und
”
zwar von Y in P′ (X)); dies ergibt sich durch Anwendung von 1.2.4 auf ϕ−1 ,
denn es gilt: ϕ− = (ϕ−1 )+ .
1.2.5
S − Ist ϕ eine Menge von Urpaaren, X := V (ϕ), Y := N(ϕ), so gilt:
yϕ = X.
y∈Y
Beweis: Die Inklusion ⊆“ ist klar.
S Zu− ”⊇“: Sei x ∈ X und z ∈ Y mit
”
−
(x; z) ∈ ϕ. Dann gilt: x ∈ zϕ ⊆
yϕ .
y∈Y
Ist ϕ eine Funktion, y ∈ N(ϕ), so nennt man yϕ− das vollständige Urbild von
y unter ϕ. 1
1.2.6 Ist ϕ eine Funktion, so gilt: ∀y, y ′ ∈ N(ϕ) y 6= y ′ ⇒ yϕ− ∩y ′ ϕ− = ∅.
Insbesondere ist die Funktion ϕ− dann injektiv.
Bisweilen erweitert man den Vorbereich von ϕ− auf eine beliebige Wertemenge W für
ϕ, indem man für alle y ∈ W r N (ϕ) setzt: yϕ− := ∅.
1
32
Beweis: Seien y, y ′ ∈ N(ϕ) und yϕ− ∩ y ′ ϕ− 6= ∅. (Zu zeigen ist: y = y ′) Sei
x ∈ yϕ− ∩ y ′ ϕ− . Dann folgt: y = xϕ = y ′ .
1.2.7 Beispiel Sei ϕ : Z → N0 , z 7→ z 2 . Dann ist N(ϕ) die Menge der
Quadratzahlen, und es gilt: 0ϕ− = {0}, 1ϕ− = {1, −1}, 4ϕ− = {2, −2},
9ϕ− = {3, −3},. . . .
Zwei Mengen A, B heißen disjunkt, wenn gilt: A ∩ B = ∅. Damit besagt
1.2.6: Je zwei verschiedene vollständige Urbilder unter einer Funktion ϕ sind
disjunkt. Daher nennt man die Vereinigung in 1.2.5 bei gegebener Funktion
ϕ auch eine disjunkte Vereinigung.
1.3 Definition (Partition, kanonische Projektion, charakteristische Funktion) Sei X eine Menge und M ⊆ P(X). M heißt eine Partition von X, wenn
gilt:
(o) ∅ ∈
/ M,
S
(i) M = X,
(ii) Je zwei verschiedene zu M gehörige Mengen sind disjunkt.
1.3.1 Beispiele (1) {Z r N0 , {0}, N} ist eine Partition von Z.
(2) Ist G die Menge der geraden, U die Menge der ungeraden ganzen Zahlen,
so ist {G, U} eine Partition von Z.
(3) Ist M eine endliche Menge, n die Anzahl ihrer Elemente, so sei für alle
k ∈ N0 gesetzt: Tk := {S|S ⊆ M, S enthält genau k Elemente}. Dann
ist {Tk |k ∈ n ∪ {0}} eine Partition von P(M).
Aus 1.2.4, 1.2.5 und 1.2.6 erhalten wir:
1.4 Proposition Ist ϕ eine Funktion, so ist die Menge der vollständigen
Urbilder der Elemente von N(ϕ) eine Partition von V (ϕ).
Für diese Partition der ϕ-Urbilder“ verwenden wir die Bezeichnung X/ϕ.
”
Nach Definition ist X/ϕ die Bildmenge der Abbildung ϕ− , und nach 1.2.6
ist ϕ− injektiv. Es folgt:
1.4.1 (Folgerung aus 1.4) Für jede Funktion ϕ mit dem Vorbereich X ist
ϕ− eine Bijektion von N(ϕ) auf die Partition X/ϕ.
33
Sei nun M eine beliebige Partition einer Menge X. Wir setzen
ϕM := {(x; T )|x ∈ X, T ∈ M ∧ x ∈ T }.
Da je zwei verschiedene Elemente von M disjunkt sind, gibt es zu jedem
x ∈ X höchstens ein T ∈ M mit x ∈ T . Da die Vereinigung über M ganz
X ergibt, gibt es zu jedem x ∈ X ein T ∈ M mit x ∈ T . Also ist ϕM eine
Funktion von X in M. Da jede Menge T ∈ M nach (o) nichtleer ist, also
ein Element x enthält, gilt (x; T ) ∈ ϕM , also ist das Bild der Funktion ϕM
gleich M:
1.4.2 Ist M eine Partition einer Menge X, so ist ϕM eine Abbildung von
X auf M.
Die Abbildung ϕM heißt die kanonische Projektion von X auf M.
Sei zum Beispiel M die Partition {G, U} aus 1.3.1(2). Dann gilt: U = 1ϕM =
(−1)ϕM = 3ϕM = (−3)ϕM = . . . , G = 0ϕM = 2ϕM = (−2)ϕM = 4ϕM =
(−4)ϕM = . . . .
Für jede Teilmenge T einer Menge X heißt
χT :
X → {0, 1}
(
1 falls x ∈ T
x 7→
0 falls x ∈
6 T
die charakteristische Funktion bezüglich der Teilmenge T von X. Für die Menge U in 1.3.1(2) erhalten wir zum Beispiel:
(
1 falls x ungerade
χU : Z → {0, 1}, x 7→
.
0 falls x gerade
Die Partition Z/χU ist die Menge {G, U}. Allgemein gilt für jede Teilmenge
T einer Menge X: X/χT = {T, X r T }.
1.5 Definition (Komposition) Seien ϕ, ψ Mengen von Urpaaren. Dann heißt
ϕψ := {(x; z)|x ∈ V (ϕ), z ∈ N(ψ), ∃y ∈ N(φ)∩V (ψ) (x; y) ∈ ϕ∧(y; z) ∈ ψ}
die Komposition von ϕ mit ψ. Der Definition entnimmt man unmittelbar die
folgenden beiden Bemerkungen:
1.5.1 V (ϕψ) = {x|x ∈ V (ϕ), ∃y ∈ V (ψ) (x; y) ∈ ϕ}
34
1.5.2 idV (ϕ) ⊆ ϕϕ−1 , idN (ϕ) ⊆ ϕ−1 ϕ.
1.5.3 Sind ϕ, ψ Funktionen, so ist auch ϕψ eine Funktion, und für alle
x ∈ V (ϕψ) gilt: x(ϕψ) = (xϕ)ψ. Genau dann gilt V (ϕ) = V (ϕψ), wenn
N(ϕ) ⊆ V (ψ).
V (ϕ)
N (ϕ)
ϕ
x
V (ψ)
✲
N (ψ)
ψ
y
✲
z
Die Gleichung x(ϕψ) = (xϕ)ψ besagt, daß erst ϕ, dann ψ auszuführen ist“.
”
Deswegen nennt man ϕψ auch die Hintereinanderausführung von ϕ und ψ.2
Zum Beweis der Funktions-Eigenschaft von ϕψ sei x ∈ V (ϕψ), und seien z,
z ′ ∈ N(ψ) mit (x; z), (x; z ′ ) ∈ ϕψ. Dann gibt es y, y ′ ∈ N(ϕ) ∩ V (ψ) mit
(x; y) ∈ ϕ ∧ (y; z) ∈ ψ ∧ (x; y ′ ) ∈ ϕ ∧ (y ′; z ′ ) ∈ ψ. Da ϕ eine Funktion ist,
folgt y = y ′. Da ψ eine Funktion ist, folgt daraus z = z ′ .
Weiter zeigen wir: ∀x ∈ V (ϕψ) x(ϕψ) = (xϕ)ψ. Dazu sei x ∈ V (ϕψ),
y := xϕ, z := yψ. Es gilt: (xϕ)ψ = yψ = z und auch x ∈ V (ϕ), z ∈ N(ψ),
y ∈ N(ϕ) ∩ V (ψ), (x; y) ∈ ϕ ∧ (y; z) ∈ ψ, d. h. (x; z) ∈ ϕψ, also x(ϕψ) = z.
Die Inklusion V (ϕψ) ⊆ V (ϕ) ist klar. Daher gilt:
V (ϕ) = V (ϕψ) ⇔ ∀x ∈ V (ϕ) xϕ ∈ V (ψ) ⇔ N(ϕ) ⊆ V (ψ).
1.5.4 Sind ϕ, ψ, ω Funktionen, so gilt (ϕψ)ω = ϕ(ψω).
Denn für alle x ∈ V ((ϕψ)ω) gilt: x((ϕψ)ω) = (x(ϕψ))ω = ((xϕ)ψ)ω =
(xϕ)(ψω) = x(ϕ(ψω)) vermöge durchgehender Anwendungen von 1.5.3; desgleichen auch für alle x ∈ V (ϕ(ψω)): Man lese dieselbe Zeile von rechts nach
links. Insbesondere folgt: V ((ϕψ)ω) = V (ϕ(ψω)).
1.5.5 Seien X, Y , Z Mengen, ϕ : X → Y , ψ : Y → Z Abbildungen.
(1) Sind ϕ, ψ injektiv, so auch ϕψ.
(2) Sind ϕ, ψ surjektiv, so auch ϕψ.
(3) Sind ϕ, ψ bijektiv, so auch ϕψ.
2
Man beachte: Bei Verwendung der Links-Schreibweise für Abbildungen (siehe S. 30)
schreibt man dafür ψ ◦ ϕ, gelesen: ψ nach ϕ“. Durch den sprachlichen Trick der Verwen”
dung der Präposition nach wird die Ungunst neutralisiert, daß bei Links-Schreibweise die
später auszuführende Funktion leider als erste zu notieren ist. Es gilt also: ψ ◦ ϕ = ϕψ.
35
(4) Ist ϕψ injektiv, so ist ϕ injektiv.
(5) Ist ϕψ surjektiv, so ist ψ surjektiv.
Beweis. (1) Sind x, x′ ∈ X mit x(ϕψ) = x′ (ϕψ), so folgt aus 1.5.3: (xϕ)ψ =
(x′ ϕ)ψ, also xϕ = x′ ϕ aufgrund der Injektivität von ψ und daraus x = x′
aufgrund der Injektivität von ϕ.
(2) Sei z ∈ Z. Da ψ surjektiv ist, gibt es ein y ∈ Y mit yψ = z. Da ϕ surjekiv
ist, gibt es ein x ∈ X mit xϕ = y. Aus 1.5.3 folgt: x(ϕψ) = (xϕ)ψ = yψ = z.
(3) ist nach (1) und (2) klar.
(4) Seien x, x′ ∈ X mit xϕ = x′ ϕ. Dann folgt aus 1.5.3: x(ϕψ) = (xϕ)ψ =
(x′ ϕ)ψ = x′ (ϕψ), also x = x′ wegen der Injektivität von ϕψ.
(5) Sei z ∈ Z. Nach Voraussetzung gibt es dann ein x ∈ X mit x(ϕψ) = z.
Sei y := xϕ. Dann gilt: y ∈ Y ∧ yψ = (xϕ)ψ = x(ϕψ) = z.
1.6 Proposition (Kennzeichnung der Bijektionen) Seien X, Y Mengen, ϕ
eine Abbildung von X in Y . Es sind äquivalent:
(i) ϕ ist eine Bijektion von X auf Y ,
(ii) ϕϕ−1 = idX ∧ ϕ−1 ϕ = idY ,
(iii) ∃α, β ∈ X Y
ϕα = idX ∧ βϕ = idY
Zusatz Ist ϕ eine Bijektion und sind α, β wie in (iii), so folgt: α = ϕ−1 = β.
Wir nennen diese Funktion dann die Umkehrfunktion von ϕ. Wie (ii) lehrt,
ist 1.6(iii) auch für ϕ−1 anstelle von ϕ erfüllt (nämlich mit α := β := ϕ). Die
Implikation 1.6((iii)⇒(i)) ergibt nun, daß ϕ−1 eine Bijektion von Y auf X
ist. Ist X gleichmächtig zu Y , so ist also auch Y gleichmächtig zu X. Man
sagt in diesem Falle daher kurz: X, Y sind gleichmächtig.“
”
Beweis von 1.6. (i)⇒(ii) Da ϕ surjektiv ist, gilt N(ϕ) = Y . Dank 1.5.2 sind
daher nur noch die Inklusionen ϕϕ−1 ⊆ idX , ϕ−1 ϕ ⊆ idY einzusehen.
Seien x, x′ ∈ X mit (x; x′ ) ∈ ϕϕ−1 . Dann gibt es ein y ∈ Y mit (x; y) ∈ ϕ,
(y; x′ ) ∈ ϕ−1 . Es folgt: (x′ ; y) ∈ ϕ, also x = x′ wegen der Injektivität von ϕ.
Weiter seien y, y ′ ∈ Y mit (y; y ′) ∈ ϕ−1 ϕ. Dann gibt es ein x ∈ X mit
(y; x) ∈ ϕ−1 , (x; y ′) ∈ ϕ. Es folgt (x; y) ∈ ϕ und somit y = y ′ aufgrund der
Funktionseigenschaft von ϕ.
(ii)⇒(iii) Wir möchten α := β := ϕ−1 setzen und müssen nur noch einsehen,
daß die Umkehrung ϕ−1 von ϕ eine Funktion von Y nach X ist. Sind y ∈ Y
36
und x, x′ ∈ X mit (y; x), (y; x′) ∈ ϕ−1 , so folgt (x; y), (x′ ; y) ∈ ϕ, also x = x′
wegen der Injektivität von ϕ.
(iii)⇒(i) Da idX trivialerweise injektiv ist, folgt aus 1.5.5(4) die Injektivität
von ϕ. Da idY surjektiv ist, folgt aus 1.5.5(5) die Surjektivität von ϕ.
Beweis des Zusatzes: Seien α, β ∈ X Y mit ϕα = idX , βϕ = idY . Nach 1.6
und 1.5.4 gilt dann:
α = idY α = (ϕ−1 ϕ)α =ϕ−1 (ϕα) = ϕ−1 idX = ϕ−1 =
= idY ϕ−1 = (βϕ)ϕ−1 = β(ϕϕ−1 ) = β idX = β.
Wir kombinieren nun die beiden Bemerkungen 1.4.1 und 1.4.2: Sei ϕ eine
Abbildung einer Menge X in eine Menge Y , M := X/ϕ. Nach 1.4 ist dann
M eine Partition von X.
Nach 1.4.2 ist die kanonische Projektion ϕM : X → M surjektiv.
Nach 1.4.1 ist die Invers-Funktion ϕ− : N(ϕ) → M bijektiv.
Sei nun ϕ := (ϕ− ) −1 (die Umkehrfunktion von ϕ− gemäß 1.6, Zusatz). Dann
ist ϕ eine bijektive Abbildung M → N(ϕ), also insbesondere eine injektive
Abbildung M → Y .
Für alle x ∈ X gilt: (xϕM )ϕ = xϕ, denn (xϕ)ϕ −1 = (xϕ)ϕ− = xϕM , also
xϕ = ((xϕ)ϕ −1 )ϕ = (xϕM )ϕ, d. h. es gilt:
ϕM ϕ = ϕ.
X
...
...
Y
...
.......
..
ϕ
✲y
✸
...
ϕM
M := X/ϕ
N (ϕ)
ϕ
...
s•
yϕ−
Wir konkretisieren dieses Bild noch durch ein simples Beispiel, die Funktion
ϕ : Z → N0 , x 7→ x2 .
Der Bildbereich N(ϕ) ist dann die Menge der Quadratzahlen, die wir hier
mit Q bezeichnen. Bildgleich unter ϕ sind Elemente von Z genau dann, wenn
sie sich höchstens um das Vorzeichen unterscheiden, also z. B. 2 und −2:
37
Z
...
N0
3. −3.
ϕ
2
..
-2
...
·5
✲ ·4
✸
...
ϕM
M := Z/ϕ
...
•
·9
Q
ϕ
{3, −3}
s•
{2, −2}
Jede Funktion ϕ ist Hintereinanderausführung der surjektiven Abbildung
ϕM : X → M und der injektiven Abbildung ϕ : M → Y .
Damit erhalten wir als Folgerung aus den Bemerkungen 1.4.1 und 1.4.2:
1.7 Proposition (Homomorphiesatz für Mengen) Ist ϕ eine surjektive Abbildung einer Menge X auf eine Menge Y , so ist
{(T ; y)|T ∈ X/ϕ, ∀x ∈ T
xϕ = y}
eine Bijektion von X/ϕ auf Y . Insbesondere sind X/ϕ und Y gleichmächtig.
Denn {(y; T )|T ∈ X/ϕ, ∀x ∈ T xϕ = y} = ϕ− , folglich ist die in 1.7
angegebene Menge von Urpaaren gleich ϕ, also eine Bijektion von X/ϕ auf
N(ϕ) = Y .
Ist zum Beispiel P′fin (N) die Menge der nichtleeren endlichen Teilmengen von
N und
ϕ : P′fin (N) → N, T 7→ max T,
so ist ϕ eine surjektive Abbildung und nϕ− = {T |∃S ∈ P(n − 1) T =
S ∪ {n}} für alle n ∈ N, denn dies ist die Menge aller Teilmengen von N,
deren Maximum n ist. Es ist also die Partition von P′fin (N), die aus diesen
Mengen nϕ− (n ∈ N) besteht, gleichmächtig zu N. Da für jedes n ∈ N die
Menge nϕ− endlich3 ist, läßt sich darüber hinaus zeigen, daß damit sogar
P′fin (N) selbst zu N gleichmächtig ist. Zu N gleichmächtige Mengen heißen
abzählbar.4
1.8 Definition (Folge, Tupel, geordnetes Paar, Matrix) Seien X, Y Mengen. Für die Menge aller Abbildungen von X nach Y schreiben wir Y X .
Aus 1.8.4 erhalten wir die genaue Anzahl der Elemente: 2n−1 .
Es gibt Autoren, die auch endliche Mengen als abzählbar bezeichnen. In deren Sprachgebrauch werden die zu N gleichmächtigen Mengen zur Unterscheidung abzählbar unendlich
genannt.
3
4
38
Von besonderer Bedeutung sind Funktionen, deren Definitionsbereich eine
Teilmenge von Z ist: Unter einer allgemeinen Folge über Y verstehen wir eine Abbildung einer Teilmenge T von Z in Y , und wir verwenden dafür die
Schreibweise (yj )j∈T (wobei yj das Bild von j ∈ T in Y bezeichnet). Im wichtigen Fall T = N heißt (yj )j∈T eine (Standard-)Folge über Y .5
Ein anderer wichtiger Fall liegt vor, wenn T = n für ein n ∈ N gilt. Jede
Abbildung (yj )j∈n heißt ein n-Tupel über Y . Üblich ist dafür die Schreibweise (y1 , . . . , yn ) (wobei wieder yj das Bild von j ∈ n bezeichnet und die
j-te Komponente des n-Tupels heißt); sie ist uns schon bei der Bestimmung
der Lösungen linearer Gleichungssysteme begegnet. So ist etwa (−1, 0, 1) begrifflich nichts anderes als die Funktion {(1; −1), (2; 0), (3; 1)} (unter Verwendung von Pfeilen für die Element-Zuordnung geschrieben: 1 7→ −1, 2 7→ 0,
3 7→ 1). Es ist also
Y N die Menge aller (Standard-)Folgen über Y ,
Y n die Menge aller n-Tupel über Y .
Bei letzterem ist es üblich, den Haken“ wegzulassen, d. h. man schreibt Y n
”
statt Y n .
Ein besonders wichtiger Spezialfall ist durch n = 2 gegeben: Ein 2-Tupel
über Y heißt auch ein geordnetes Paar über Y .
Der Name erinnert nicht zufällig an die Urpaare. In der Tat haben auch die
geordneten Paare die zu 1.1.1’ analoge typische Paar-Eigenschaft“:
”
1.8.1 (a, b) = (c, d) ⇒ a = c ∧ b = d für alle Mengen a, b, c, d.
Gilt nämlich (a, b) = (c, d) und schreiben wir τ für das geordnete Paar (a, b)
(Y := {a, b}), so gilt nach Definition eines 2-Tupels: a = 1τ = c, b = 2τ = d.
Sind M, N Mengen, so setzen wir Y := M ∪ N und
M × N := {(a, b)|a ∈ M, b ∈ N} (⊆ Y 2 ).
Diese Menge heißt das cartesische Produkt6 von M mit N.
5
Dies ist ein vor allem für die Belange der Analysis fundamentaler Begriff. Ihm liegt
die Vorstellung zugrunde, daß gewisse Elemente von Y (die sich dabei allerdings auch
wiederholen dürfen) mit natürlichen Zahlen durchnumeriert“ werden: y1 , y2 , y3 , . . . . Ist
”
in einem mathematischen Kontext ohne weiteren Kommentar von einer Folge die Rede, so
kann man davon ausgehen, daß eine Standard-Folge im oben definierten Sinn oder aber
eine Abbildung mit dem Definitionsbereich N0 gemeint ist. Man nennt allgemeiner eine
Abbildung ϕ einer Menge I in Y bisweilen auch eine Indizierung durch die Indexmenge“
”
I. Das Urpaar (Y ; ϕ) heißt dann eine Familie. Man schreibt Familien in der Regel in der
Form (yi )i∈I , was die Anlehnung an den Folgenbegriff signalisiert.
6
nach René Descartes ( Cartesius“), 1596-1650
”
39
1.8.2 |M × N| = |M| · |N| falls M, N endliche Mengen sind.
Beweis durch Induktion nach |M|: Ist |M| = 0, so folgt M = ∅, also auch
M × N = ∅ und damit |M × N| = |∅| = 0 = 0 · |N| = |M| · |N|. Sei nun
|M| > 0, a ∈ M, M ′ := M r {a}, und es gelte |M ′ × N| = |M ′ | · |N|
(Induktions-Voraussetzung). Für jedes b ∈ N sei definiert: τb := (a, b). Dann
gilt für alle b ∈ N: τb 6∈ M ′ × N, und weiter M × N = (M ′ × N) ∪ {τb |b ∈ N},
also wegen der Disjunktheit dieser Vereinigung
|M × N| = |M ′ × N| + |{(a, b)|b ∈ N}| = |M ′ | · |N| + |N| = |M| · |N|.
Unter einer (M × N)-Matrix über einer Menge X verstehen wir eine Abbildung von M ×N in X. In dem wichtigen Fall M = m, N = n (m, n ∈ N) läßt
man wieder den Haken“ fort und schreibt: (m × n)-Matrix (statt (m × n)”
Matrix).7 Eine (m × n)-Matrix wird häufig in der Form (aij )(i,j)∈m×n bzw.
(aij ) i∈m geschrieben (wobei, analog zu dem Vorherigen, aij für das Bild von
j∈n
(i, j) in X steht).
Jede (m×n)-Matrix A hat m Zeilen“ A1 , . . . , Am und n Spalten“ A1 , . . . , An ,
”
”
definiert als n-Tupel (∼ Zeilen) bzw. m-Tupel (∼ Spalten) über X wie in unseren Setzungen in Kapitel 0, S. 12ff.8
Schließlich beweisen wir zwei wichtige, aufeinander aufbauende klassische
Anzahlformeln:
1.8.3 |Y X | = |Y ||X| , falls X, Y endliche Mengen sind.
Beweis durch vollständige Induktion nach |X|: Ist |X| = 0, also X = ∅, so
gibt es genau eine Abbildung von X in Y , nämlich ∅ (die leere Menge von
Urpaaren). In der Tat ist dann |Y X | = |Y ∅ | = 1 = |Y |0 = |Y ||X| .9 Sei nun
X eine endliche Menge 6= ∅, x ∈ X, X ′ := X r {x}, und es gelte bereits
′
′
′
|Y X | = |Y ||X | (Induktions-Voraussetzung). Für jedes ϕ ∈ Y X und y ∈ Y
sei definiert: ϕy := ϕ ∪ {(x; y)}. Dann ist die Abbildung
′
Y X × Y → Y X , (ϕ, y) 7→ ϕy
7
Man beachte den erheblichen Unterschied zu Kapitel 0: Dort haben wir lediglich
Schreibweisen eingeführt und zugehörige Vorstellungen entwickelt. Hier hingegen erhalten die mit Tupel“ bzw. Matrix“ benannten Gegenstände ihren Platz im systematischen
”
”
Aufbau der mathematischen Begriffswelt.
8
Formal: Ist A eine (m × n)-Matrix über X, i ∈ m, j ∈ n, so heißt das n-Tupel
((i, 1)A, . . . , (i, n)A) die i-te Zeile Ai , das m-Tupel ((1, j)A, . . . , (m, j)A) die j-te Spalte Aj
von A.
9
U. a. an dieser Stelle zeigt sich, wie vernünftig es ist, daß wirklich jede nullte Potenz“
”
0
x durch 1 definiert ist, also auch 00 . Dies bewährt sich (als Randfall) in eigentlich jeder
kombinatorischen Anzahlformel, die eine Potenz als Term enthält.
40
bijektiv: Jede Funktion von X nach Y erhält man auf eindeutige Weise,
indem man eine Funktion von X ′ nach Y dadurch ergänzt, daß man auch
′
noch dem Element x einen Wert in Y zuweist. Es folgt: |Y X | = |Y X ×Y | =
1.8.2
′
|Y X | · |Y | = |Y ||X| .
1.8.4 Für jede Menge X ist {(T ; χT )|T ⊆ X}
auf {0, 1}X . Ist also X endlich, so gilt:
10
eine Bijektion von P(X)
|P(X)| = 2|X| .
Denn zum einen sind zwei Teilmengen gleich, wenn sie dieselbe charakteristische Funktion besitzen, nämlich jeweils gleich dem vollständigen Urbild
von 1. Zum anderen erhält man bei gegebener Funktion ϕ von X in {0, 1}
durch das vollständige Urbild von 1 eine Teilmenge T von X mit χT = ϕ. Die
angegebene Funktion ist also sowohl injektiv wie auch surjektiv. Die Formel
im endlichen Fall folgt nun direkt aus 1.8.3.
1.9 Definition (Relation, reflexiv, symmetrisch, transitiv, teilt, Kongruenz,
Äquivalenz-Relation) Eine Relation ist eine Menge von Paaren. Seien X, Y
Mengen. Unter einer Relation zwischen X und Y versteht man eine Teilmenge
von X × Y . Für uns wird hier ausschließlich der Spezialfall X = Y von
Interesse sein. Eine Relation zwischen X und X wird eine Relation auf X
genannt. Für jede Relation S heißt S ∩ (X × X) die von S auf X induzierte
Relation.
1.9.1 Beispiel Sei X := N, R := {(x, y)|x, y ∈ N, ∃n ∈ N y = x + n}.
Offenbar liegt ein Paar (x, y) natürlicher Zahlen genau dann in R, wenn x
echt kleiner als y ist. Daher heißt diese Relation die Kleiner-Relation auf N.
Sie gehört zu den aus Schulzeiten altgewohnten Gegenständen, wird allerdings nicht nur für natürliche Zahlen, sondern allgemeiner für reelle Zahlen
betrachtet (was in der obigen Definition ausdrücklich nicht geschehen ist!). R
ist die von der (auf der Menge der reellen Zahlen gegebenen) Relation < auf
N induzierte Relation.11 Bildet man bei geordneten Paaren wie bei Urpaaren
nun die Umkehrung, so wird aus < die Relation größer“, geschrieben: >.
”
Die Gewohnheit, z. B. 3 < 5“ statt (3, 5) ∈<“ zu schreiben, läßt auch die
”
”
allgemeine Konvention folgender Schreibweise als natürlich erscheinen: Ist R
10
Zur Definition von χT siehe 1.3.
Baut man systematisch die Zahlbereiche vom Mengenbegriff aus auf und hat auf N
erklärt, was +“ bedeuten soll – Teil eines Themas, das uns noch im nächsten Kapitel
”
bevorsteht, – so kann man kleiner“ wörtlich als unsere obige Relation R definieren; d. h.
”
im systematischen Aufbau erhält kleiner“ erst dadurch seinen Platz in der Begriffswelt.
”
11
41
eine Relation, so schreiben wir xRy statt (x, y) ∈ R.
Eine Relation R heißt auf einer Menge X
reflexiv, wenn gilt: ∀x ∈ X
12
xRx
symmetrisch, wenn gilt: ∀x, x′ ∈ X
transitiv, wenn gilt: ∀x, x′ , x′′ ∈ X
(xRx′ ⇒ x′ Rx)
(xRx′ , x′ Rx′′ ⇒ xRx′′ ).
Zum Beispiel sind die Relationen < und > auf der Menge der reellen Zahlen,
also erst recht auf N, transitiv, aber weder reflexiv noch symmetrisch, dagegen die (die Gleichheit zulassende) Kleiner-oder-gleich“-Relation ≤ reflexiv
”
und transitiv, aber sie ist nicht symmetrisch. Weiter ist die Relation 6=, Un”
gleichheit“, symmetrisch, aber nicht reflexiv und nicht transitiv; es gilt z. B.
1 6= 2 und 2 6= 1, aber nicht 1 6= 1.
Ein besonders wichtiges Beispiel einer Relation auf der Menge Z der ganzen
Zahlen erhält man durch die Setzung
| := {(x, y)|x, y ∈ Z, ∃z ∈ Z y = xz}.
Dies ist die Teiler-Relation auf Z, kurz: teilt“.
”
| ist reflexiv, denn für alle x ∈ Z gilt x = x · 1, also x|x. | ist transitiv; sind
nämlich x, y, v ∈ Z mit x|y, y|v, so gibt es z, z ′ ∈ Z mit y = xz, v = yz ′ , so
daß folgt: v = xzz ′ , mithin x|v. | ist nicht symmetrisch, denn z. B. gilt 2|6,
aber nicht 6|2. (Für x teilt nicht y“ schreibt man: x ∤ y.)
”
Die Relation | ist Grundlage für eine wichtige Sorte von Relationen auf Z,
von der wir zunächst ein Beispiel betrachten: Wir setzen
≡:= {(x, y)|x, y ∈ Z, 3|x − y}.
3
Diese Relation heißt die Kongruenz modulo 3. Sie ist reflexiv, da für jedes
x ∈ Z die Differenz x − x, also die Zahl 0, von jeder ganzen Zahl geteilt
wird, also auch von 3. Sie ist symmetrisch, da für alle x, y ∈ Z die Gleichung
y − x = −(x − y) gilt, also 3|x − y genau dann gilt, wenn 3|y − x. Weiter
12
Ohne den relativierenden Bezug auf X nennt man R (absolut) reflexiv, symmetrisch
bzw. transitiv, wenn die angegebenen Implikationen für die gesamte Komponentenmenge
von R (d. h. die Menge aller bei den zu R gehörigen Paaren vorkommenden Komponenten)
erfüllt sind. Ist R im absoluten Sinne symmetrisch bzw. transitiv, so ist R auch auf jeder
Menge X symmetrisch bzw. transitiv. Man beachte aber: Die Reflexivität überträgt sich
nur auf solche Mengen X, die in der Komponentenmenge von R enthalten sind ! Als Extremfall sei erwähnt: Die leere Relation ∅ ist symmetrisch und transitiv auf jeder Menge,
aber reflexiv nur auf der Menge X = ∅.
42
ist sie auch transitiv: Sind x, y, z ∈ Z und gilt x ≡ y, y ≡ z, d. h. 3|x − y,
3
3|y − z, so folgt: 3|(x − y) + (y − z) = x − z, d. h. x ≡ z.
3
3
Für welche x ∈ Z gilt x ≡ 0, 1, . . . ?
3
x ≡ 0 ⇔ 3|x − 0 ⇔ ∃z ∈ Z x = 3z.
3
Für die Menge dieser Elemente x schreiben wir kurz 3Z.
x ≡ 1 ⇔ 3|x − 1 ⇔ ∃z ∈ Z x = 3z + 1.
3
Für die Menge dieser Elemente x schreiben wir entsprechend 3Z + 1. Ebenso
versteht es sich, daß wir 3Z + 2 für die Menge der ganzen Zahlen x mit x ≡ 2
3
schreiben. Die Bedingung x ≡ 3 ist gleichwertig zu x ≡ 0, wurde also schon
3
3
behandelt, wie überhaupt jede weitere Kongruenz x ≡ j für irgendein j ∈ Z.
3
Die Menge der x, die eine solche Kongruenz erfüllen, ist eine der drei Mengen
3Z, 3Z + 1, 3Z + 2: Es gilt 3Z + j = 3Z + i für dasjenige i ∈ {0, 1, 2}, für das
gilt: j ≡ i. Jede ganze Zahl liegt also in genau einer der Mengen
3
3Z :
{ . . . , −9, −6, −3, 0, 3, 6, 9, 12, . . . }
3Z + 1 : { . . . , −8, −5, −2, 1, 4, 7, 10, 13, . . . }
3Z + 2 : { . . . , −7, −4, −1, 2, 5, 8, 11, 14, . . . }
Diese bilden daher eine Partition von Z.
Eine Relation R auf einer Menge X heißt eine Äquivalenz-Relation auf X,
wenn R reflexiv, symmetrisch und transitiv ist. Zum Beispiel ist ≡ eine
3
Äquivalenz-Relation auf Z. Allgemein beweist man dies bei gegebenem k ∈ Z
genauso wie im Falle k = 3 für die Kongruenz modulo k: 13
≡:= {(x, y)|x, y ∈ Z, k|x − y}.
k
1.9.2 Für jedes k ∈ Z gilt: ≡ ist eine Äquivalenz-Relation auf Z.
k
1.9.3 Ist ϕ eine Abbildung einer Menge X in eine Menge Y , so setzen wir
∼ϕ := {(x, x′ )|x, x′ ∈ X, xϕ = x′ ϕ}.
Dann ist ∼ϕ eine Äquivalenz-Relation auf X:
13
Man beachte, daß ≡ die All-Relation“ Z × Z, ≡ dagegen die Gleichheits-Relation auf
”
1
0
Z ist. Negative Werte für k haben keine eigenständige Bedeutung, denn es gilt ≡= ≡ für
k
alle k ∈ Z.
43
−k
Denn für alle x ∈ X gilt xϕ = xϕ, d. h. ∼ϕ ist reflexiv; weiter bedeutet
(x, x′ ) ∈∼ϕ dasselbe wie (x′ , x) ∈∼ϕ , nämlich xϕ = x′ ϕ, d. h. ∼ϕ ist symmetrisch; schließlich folgt genauso simpel auch die Transitivität von ∼ϕ .
Ist nun ∼ eine beliebige Relation auf einer Menge X, x0 ∈ X, so setzen wir
[x0 ]∼ := {x|x ∈ X, x ∼ x0 }.
Trivial ist
1.9.4 ∼ reflexiv ⇔ ∀x0 ∈ X
x0 ∈ [x0 ].
Ist ∼ eine Äquivalenz-Relation, so heißt [x0 ]∼ die Äquivalenzklasse von x0 .
Jedes Element x ∈ [x0 ]∼ heißt ein Repräsentant der Äquivalenzklasse von x0 .
Eine Teilmenge T von X heißt eine Äquivalenzklasse bezüglich ∼, wenn es ein
x0 ∈ X gibt mit T = [x0 ]∼ .
1.9.5 Beispiele (1) Kongruenzklassen:
[0]≡ = 3Z,
[1]≡ = 3Z + 1,
3
[2]≡ = 3Z + 2,
3
3
= [3]≡ = [6]≡ = . . .
= [4]≡ = [7]≡ = . . .
= [5]≡ = [8]≡ = . . .
= [−3]≡ = [−6]≡ = . . .
= [−2]≡ = [−5]≡ = . . .
= [−1]≡ = [−4]≡ = . . .
3
3
3
3
3
3
3
3
3
3
3
3
Allgemein: [0]≡ = kZ, [1]≡ = kZ+1, . . . , [k−1]≡ = kZ+(k−1) = kZ+(−1)
k
k
k
(2) Vollständige Urbilder: Sei ϕ eine Abbildung einer Menge X in eine Menge
Y . Die Äquivalenzklassen bezüglich ∼ϕ (siehe 1.9.3) sind die vollständigen
Urbilder yϕ− mit y ∈ N(ϕ).
Zum Beweis von (2) seien x0 , x ∈ X. Es gilt: x ∈ [x0 ]∼ϕ ⇔ x ∼ϕ x0 ⇔ xϕ =
x0 ϕ. Setzen wir y := x0 ϕ− , so folgt: [x0 ]∼ϕ = yϕ− .
Insbesondere ergibt nun 1.4: Die Menge der Äquivalenzklassen bezüglich ∼ϕ
ist die Partition X/ϕ der ϕ-Urbilder.
1.9.6 Ist ∼ Äquivalenz-Relation auf einer Menge X, so gilt für alle x0 , x ∈ X
x ∈ [x0 ]∼ ⇔ [x]∼ = [x0 ]∼
Beweis. Es gelte zunächst x ∈ [x0 ]∼ , also x ∼ x0 . Für beliebiges y ∈ X folgt
dann aus der Transitivität von ∼
y ∈ [x]∼ ⇒ y ∼ x ⇒ y ∼ x0 .
44
Weil wegen der Symmetrie von ∼ auch x0 ∼ x gilt, folgt wieder mit der
Transitivität auch
y ∈ [x0 ]∼ ⇒ y ∼ x0 ⇒ y ∼ x.
Also gilt [x]∼ = [x0 ]∼ . – Für die Umkehrung ist nur zu bemerken, daß nach
1.9.4 x ∈ [x]∼ gilt.
1.10 Satz Sei X eine Menge.
(1) Sei ∼ eine Äquivalenz-Relation auf X. Dann ist die Menge der Äquivalenzklassen bezüglich ∼ eine Partition von X.
(2) Sei M eine Partition von X. Dann ist
∼:= {(x, x′ )|x, x′ ∈ X, ∃T ∈ M x ∈ T, x′ ∈ T }
eine Äquivalenz-Relation auf X und M die Menge ihrer Äquivalenzklassen.
Für die Menge der Äquivalenzklassen zu einer Äquivalenz-Relation ∼ schreiben wir X/ ∼.
Beweis. (1) Wir haben die drei definierenden Eigenschaften einer Partition
(siehe 1.3) nachzuweisen:
(o) Ist T ∈ X/∼, so gibt es ein x0 ∈ X mit T = [x0 ]∼ , nach 1.9.4 also x0 ∈ T ,
damit T 6= ∅.
S
S
(i) Sei x ∈ X. Nach 1.9.4 gilt: x ∈ [x]∼ ⊆ X/∼. Es folgt: X ⊆ X/∼,
also Gleichheit.
(ii) Seien S, T ∈ X/∼ mit S ∩ T 6= ∅, x ∈ S ∩ T . Durch Anwendung von
1.9.6 auf S und T erhalten wir: S = [x]∼ = T.
(2) Wir haben zunächst für ∼ die drei definierenden Eigenschaften einer
Äquivalenz-Relation nachzuweisen:
S
Reflexivität: Sei x ∈ X. Wegen M = X gibt es ein T ∈ M mit x ∈ T .
Also gilt (x, x) ∈ ∼.
Symmetrie: Seien x, x′ ∈ X mit (x, x′ ) ∈ ∼. Dann gibt es ein T ∈ M mit
x ∈ T , x′ ∈ T . Es folgt: (x′ , x) ∈ ∼.
Transitivität: Seien x, x′ , x′′ ∈ X mit (x, x′ ) ∈ ∼, (x′ , x′′ ) ∈ ∼. Dann gibt
es ein T ∈ M mit x, x′ ∈ T und ein S ∈ M mit x′ , x′′ ∈ S. Dann gilt
x′ ∈ S ∩ T , also S = T , aufgrund der paarweisen Disjunktheit der Elemente
von M. Da also x, x′′ ∈ T , folgt (x, x′′ ) ∈ ∼.
45
Gilt T ∈ M und x ∈ T , so ist (x, x′ ) ∈ ∼ gleichwertig zu x′ ∈ T ; also gilt
[x]∼ = T . Daher ist jedes T ∈ M eine Äquivalenzklasse bezüglich ∼. Ist umgekehrt S eine Äquivalenzklasse
bezüglich ∼, so S 6= ∅. Ist x ∈ S, so gibt es
S
ein T ∈ M mit x ∈ T (da M = X). Da T eine Äquivalenzklasse bezüglich
∼ ist, folgt aus 1.9.6: S = [x]∼ = T ∈ M.
Damit besteht zwischen Äquivalenz-Relationen auf X und Partitionen von
X eine bijektive Entsprechung.
Folgerung Sei k ∈ N. Die Menge der Kongruenzklassen modulo k ist eine
k-elementige Partition von Z. Es gilt: Z/≡ = {kZ, kZ+1, . . . , kZ+(k −1)}.
k
Schließlich streifen wir einen weiteren wichtigen Spezialfall des Relationsbegriffs, den der Ordnungsrelation:
1.11 Definition (strikt antisymmetrisch, vergleichbar, Striktordnung, totale (lineare) Ordnung) Sei X eine Menge. Eine Relation R heißt auf X strikt
antisymmetrisch, wenn gilt:
∀a, b ∈ X
(a, b) 6∈ R ∨ (b, a) 6∈ R,
d. h. wenn niemals zugleich (a, b) ∈ R und (b, a) ∈ R gilt. Eine auf X transitive, strikt antisymmetrische Relation heißt eine strikte Ordnung (oder Striktordnung oder strikte Ordnungsrelation) auf X.
Zum Beispiel sind auf N die Relationen < ( echt kleiner“), > ( echt größer“)
”
”
und k( := {(x, y)|x, y ∈ N, x|y ∧ x 6= y}) ( echter Teiler von“) Striktordnun”
gen.
Ein Element v ∈ X heißt vergleichbar bezüglich einer Relation R auf X, wenn
für alle a ∈ X r {v} gilt: (a, v) ∈ R ∨ (v, a) ∈ R. Ist R eine strikte Ordnung
auf X und jedes Element von X vergleichbar bezüglich R, so heißt R eine
totale (oder lineare) Striktordnung auf X.
Von den genannten Striktordnungen auf N sind < und > totale Ordnungen,
k dagegen nicht; z. B. gilt weder 2k3 noch 3k2.
Eine (gewöhnliche) Ordnung auf X erhält man, indem man eine Striktordnung auf X mit der Gleichheit auf X vereinigt. D. h. eine Striktordnung R
auf X induziert eine (gewöhnliche) Ordnung R auf X durch die Setzung
∀x, y ∈ X
(xRy
: ⇔ xRy ∨ x = y).
R ist die kleinste reflexive Relation auf X, die R enthält. Die naheliegendsten Beispiele auf N sind die Ordnungen ≤, ≥, |. Dabei sind wieder die
46
ersten beiden totale Ordnungen, die letzte nicht. Relationen, die reflexiv, antisymmetrisch und transitiv sind, dennt man auch teilweise Ordnungen, zur
Unterscheidung von totalen Ordnungen, in denen die Bedingung der Vergleichbarkeit erfüllt sein muß. Ist (X; R) eine geordnete Menge, so heißt eine
Teilmenge K von X eine Kette, wenn (K; R) eine total geordnete Menge ist.
Aufbau der wichtigsten Begriffe
→ : wird begrifflich weiterentwickelt zu“
”
↓ : wird spezialisiert zu“
”
Urpaar →
Funktion, Y X
↓
n-Tupel (X = n)
↓
geordnetes Paar (n = 2), M × N
47
→ Relation
↓
(i) Äquivalenz-Relation↔Partition
(ii) Ordnungsrelation
Kapitel 2
Verknüpfungen
2.1 Definition Seien A, B Mengen. Unter einer Verknüpfung zwischen A und
B verstehen wir eine Funktion ϕ mit A × B ⊆ V (ϕ). 1
2.1.1 Beispiele Sei n ∈ N.
(1) ϕ : Q × Qn → Qn , (a, (b1 , . . . , bn )) 7→ (ab1 , . . . , abn ) ist eine Verknüpfung
zwischen Q und Qn und erinnert an Kapitel 0, S. 14, wo wir für das
Bildelement die Schreibweise
a · (b1 , . . . , bn )
verwendet haben.
(2) ϕ : Qn × Qn → Q, ((a1 , . . . , an ), (b1 , . . . , bn )) 7→ a1 b1 + · · · + an bn . Diese
Verknüpfung zwischen Qn und Qn heißt das Standardskalarprodukt von
Qn .
(3) Seien X, Y , Z beliebige Mengen. Dann erhalten wir vermöge der Komposition von Abbildungen eine Verknüpfung HEA zwischen Y X und Z Y :
HEA : Y X × Z Y → Z X ,
(α, β) 7→ αβ,
(wobei die Bezeichnung HEA an Hinter-Einander-Ausführung erinnern soll).
Besonders wichtig und häufig sind Fälle, in denen sowohl A = B als auch
(A × A)ϕ ⊆ A gilt. Dann nennt man ϕ eine Verknüpfung auf der Menge A.2
1
Wir weisen darauf hin, daß unsere Definition nicht verlangt, daß A × B der genaue
Definitionsbereich von ϕ ist! Ist dies jedoch der Fall, so ist eine Verknüpfung ϕ zwischen
A und B nichts anderes als eine (A × B)-Matrix über X, wenn X eine den Bildbereich
von ϕ enthaltende Menge ist (s. S. 40).
2
Das Wort auf“ bedeutet hier nicht, daß ϕ surjektiv sein muß!
”
48
Die in der Schule als Grundrechenarten“ bezeichneten Verknüpfungen +
”
und · sind Beispiele für Verknüpfungen auf N, auf Z, auf Q, auf R. Ist A
endlich, so läßt sich eine Verknüpfung auf A konkret in Matrix-Schreibweise
angeben, wobei die Elemente von A oberhalb der Spalten und vor Beginn
der Zeilen (üblicherweise in derselben Reihenfolge) aufgelistet werden. Am
Schnittpunkt der Zeile zu dem Element a ∈ A mit der Spalte zu dem Element
b ∈ A wird das Element (a, b)ϕ notiert, wodurch die sog. Verknüpfungsta”
fel“ zu ϕ entsteht.3 Hat A zum Beispiel genau zwei Elemente G, U – die
Bezeichnung soll an gerade“, ungerade“ denken lassen –, so können wir
”
”
in naheliegender Weise zwei Verknüpfungen #, · durch die folgenden Verknüpfungstafeln definieren:
Addition“:
”
# G U
G G U
U U G
,
Multiplikation“:
”
· G U
G G G
U G U
Ist ϕ irgendeine Verknüpfung auf einer Menge A und sind a, b, c ∈ A mit
(a, b)ϕ = c, so schreibt man dafür üblicherweise aϕb = c, d. h. der Name ϕ
wird zu einem Verknüpfungssymbol“, und aus diesem Grunde wählt man als
”
Bezeichnungen für Verknüpfungen statt eines (griechischen oder lateinischen)
Buchstabens meist Zeichen wie ◦, •, +, ·.
(3) +̇ : Qn × Qn → Qn ,
(a1 , . . . , an )+̇(b1 , . . . , bn ) = (a1 + b1 , . . . , an + bn )
(4) Ist A = P(X) für eine Menge X, so sind ∩, ∪, △ Verknüpfungen auf A.
Eine Verknüpfung ◦ auf A heißt assoziativ auf A 4 , wenn für alle a, b, ∈ A
gilt: (a ◦ b) ◦ c = a ◦ (b ◦ c); kommutativ auf A, wenn für alle a, b ∈ A gilt:
a ◦ b = b ◦ a.
Ein Element e ∈ A heißt neutral in (A; ◦) (auch: in A bezüglich ◦), wenn für
alle a ∈ A gilt: a ◦ e = a = e ◦ a.5
Beispielsweise (siehe (4)) sind bei beliebiger gegebener Menge X die Verknüpfungen ∩, ∪, △ auf P(X) assoziativ und kommutativ.6 Bezüglich jeder
der drei Verknüpfungen gibt es in P(X) ein neutrales Element: X ist neutral
3
Man vergleiche mit der in Fußnote 1 erwähnten Sichtweise einer Verknüpfung.
Gilt V (◦) = A × A, so nennt man ◦ kurz assoziativ (statt assoziativ auf A). Entsprechendes gilt bezüglich der Kommutativität.
5
Das Entscheidende an der Neutralität ist, daß das Verknüpfen mit einem beliebigen
Element von A das letztere unverändert läßt. Die daraus folgende schwächere Eigenschaft,
daß e mit jedem a ∈ A vertauschbar ist, sollte nicht etwa zu einer verfehlten Assoziation
mit dem Kommutativgesetz verleiten.
6
Die Assoziativität von △ ist eine keineswegs offensichtliche Übungsaufgabe!
4
49
bezüglich ∩, ∅ ist neutral sowohl bezüglich ∪ als auch bezüglich △. In N gibt
es bezüglich + kein neutrales Element, während bezüglich · das Element 1
neutral ist. Man verifiziert unmittelbar:
2.1.2 Die zu einer Verknüpfung ◦ auf A gehörige Teilmengenfunktion7 ◦⊆
ist eine Verknüpfung auf P(A). Ist ◦ assoziativ (bzw. kommutativ) auf A, so
ist ◦⊆ assoziativ (bzw. kommutativ) auf P(A). Ist e ∈ A neutral bezüglich
◦, so ist {e} neutral in P(A) bezüglich ◦⊆ .
2.1.3 Ist ◦ irgendeine Verknüpfung auf A, so gibt es in A höchstens ein
neutrales Element bezüglich ◦.
Beweis. Seien e, f ∈ A neutrale Elemente bezüglich ◦. Dann gilt:
e = e ◦ f = f,
die erste Gleichung wegen der Neutralität von f , die zweite wegen der Neutralität von e. Es folgt: e = f .
2.2 Definition (Magma, Trägermenge, unitär, Halbgruppe, Semigruppe, Monoid, Gruppe) Ein Magma ist ein Urpaar (A; ◦), bei dem ◦ eine Verknüpfung
auf A ist. A heißt die Trägermenge des Magmas. Ein Magma (A; ◦) heißt assoziativ, wenn ◦ assoziativ auf A; kommutativ, wenn ◦ kommutativ auf A ist;
unitär, wenn es in A ein bezüglich ◦ neutrales Element gibt. Eine Halbgruppe
(auch: Semigruppe) ist ein assoziatives Magma. Ein Monoid ist eine unitäre
Halbgruppe.
Zum Beispiel ist (N; +) eine kommutative Halbgruppe, aber kein Monoid,
während (N0 ; +) ein kommutatives Monoid (mit dem neutralen Element 0)
ist. (Z; ·) ist ein kommutatives Monoid (mit dem neutralen Element 1), ebenso (Q; ·).
Ist (A; ◦) ein unitäres Magma mit neutralem Element e und sind a, b ∈ A
mit a ◦ b = e = b ◦ a, so heißt b invers zu a (bezüglich ·). Trivialerweise gilt
für beliebige Elemente a, b der Trägermenge eines unitären Magmas:
2.2.1 Ist b invers zu a, so ist a invers zu b.
Zwar formal inkorrekt, aber bequem und ohne sonderliche Gefahr von Mißverständnissen üblich ist es, kurz Element eines Magmas“ statt Element
”
”
der Trägermenge eines Magmas“ sagen. Ein Element a ∈ A heißt invertierbar
in (A; ◦), wenn es in A ein zu a (bezüglich ◦) inverses Element gibt.
7
Siehe S. 32. Zwar ist ◦⊆ auf P(A × A) erklärt, doch ist für uns nur von Interesse, daß
P(A) × P(A) darin enthalten ist (siehe Fußnote 1).
50
Zum Beispiel ist bei gegebener Menge X in (P(X); ∩) das neutrale Element
X auch das einzige invertierbare Element. Gibt es nämlich zu S ⊆ X ein
T ⊆ X mit S ∩ T = X, so folgt S = T = X. In (P(X); ∪) ist ähnlich ∅ das
einzige invertierbare Element. In (P(X); △) dagegen ist jedes Element invertierbar, und zwar invers zu sich selbst, denn für alle T ⊆ X gilt: T △T = ∅.
Sehr leicht lassen sich bereits unitäre Magmen mit 3-elementiger Trägermenge definieren, in der es zu einem Element sogar mehr als ein inverses Element
gibt. Solche Magmen sind dann jedoch jedenfalls nicht assoziativ, denn es
gilt:
2.2.2 In einem Monoid gibt es zu jedem Element höchstens ein inverses
Element.
Beweis. Sei (A; ◦) ein Monoid, e sein neutrales Element, a ∈ A, und seien b,
b′ ∈ A invers zu a. Wir berechnen auf zweifache Weise das Produkt b ◦ a ◦ b′ :
(b ◦ a) ◦ b′ = e ◦ b′ = b′ ,
b ◦ (a ◦ b′ ) = b ◦ e = b.
Da die Terme auf der linken Seite wegen der Assoziativität von ◦ gleich sind,
müssen auch die rechten Seiten gleich sein, d. h. b = b′ .
Wenn es also in einem Monoid zu einem Element a ein inverses Element gibt,
so ist dieses eindeutig bestimmt. Auf dieser Einsicht beruht die folgende
Konvention für die Schreibweise inverser Elemente in Monoiden (A; ◦): Bezeichnet man ◦ als Multiplikation“, so schreibt man a−1 für das zu einem
”
invertierbaren Element a inverse Element in (A; ◦). Bezeichnet man ◦ als Ad”
dition“, so schreibt man −a für das zu a inverse Element (auch genannt: das
”
Inverse zu a“) in (A; ◦). Das neutrale Element wird als die Eins“ (Schreib”
weise: 1A ) bzw. als die Null“ (Schreibweise: 0A ) des Monoids bezeichnet,
”
je nachdem man für die Verknüpfung die multiplikative oder die additive
Sprechweise benutzt.8
2.2.3 Seien a, b invertierbare Elemente eines Monoids. Dann folgt:
(1) a−1 ist invertierbar, und zwar gilt: (a−1 )−1 = a,
(2) a ◦ b ist invertierbar, und zwar gilt: (a ◦ b)−1 = b−1 ◦ a−1 .
8
Gebräuchlich ist es, für kommutative Verknüpfungen das Zeichen +, für beliebige
Verknüpfungen – die aber im Spezialfall natürlich ebenfalls kommutativ sein dürfen –
dagegen · oder ◦ zu verwenden.
51
Beweis. (1) ist nur eine Neuformulierung von 2.2.1, während (2) aus der
Gleichungskette
(a ◦ b) ◦ (b−1 ◦ a−1 ) = ((a ◦ b) ◦ b−1 ) ◦ a−1 = (a ◦ (b ◦ b−1 )) ◦ a−1 =
= (a ◦ e) ◦ a−1 = a ◦ a−1 = e = · · · = (b−1 ◦ a−1 ) ◦ (a ◦ b)
folgt.
Eine Gruppe ist ein Monoid, in dem jedes Element invertierbar ist. Kommutative Gruppen nennt man auch abelsche Gruppen9 .
Zum Beispiel sind (N0 ; +), (Z; ·), (Q; ·) kommutative Monoide, aber keine
Gruppen, ebenso (P(X); ∩), (P(X); ∪) bei gegebener nichtleerer Menge X.
Dagegen sind (Z; +), (Q; +), (Q r {0}; ·) abelsche Gruppen. Für jede Menge
X ist auch (P(X); △) eine abelsche Gruppe, und zwar mit der Besonderheit,
daß jedes Element gleich seinem Inversen ist.
2.3 Proposition Für jede Menge X gilt:
(1) (X X ; HEA) ist ein Monoid (mit idX als neutralem Element),
(2) SX := {ϕ|ϕ ∈ X X , ϕ bijektiv} ist (bezüglich der Verknüpfung HEA) eine
Gruppe.
Die Gruppe (SX ; HEA) heißt die symmetrische Gruppe auf X. Die Elemente
von SX heißen Permutationen von X.
Beweis. (1) Nach Beispiel (3) in 2.1.1 ist HEA eine Verknüpfung auf X X und
nach 1.5.4 assoziativ. Ferner gilt: ϕidX = ϕ = idX ϕ.
(2) Nach 1.5.5(3) ist HEA eine Verknüpfung auf SX und nach (1) assoziativ.
Wegen idX ∈ SX ist SX Monoid mit neutralem Element idX . Ist ϕ ∈ SX , so
nach dem Zusatz zu 1.6 auch die Umkehrfunktion von ϕ, und deren Komposition mit ϕ ergibt – von links wie von rechts – idX ; also ist sie invers zu
ϕ.10
Im häufig betrachteten Spezialfall X = n (für ein n ∈ N) schreibt man Sn
(statt Sn ). Eine Permutation von n ist ein bijektives n-Tupel über n. In
natürlicher Weise schreibt man Permutationen ϕ ∈ Sn daher als sog. Bildzeile:
(1ϕ, 2ϕ, . . . , nϕ),
9
nach Niels Hendrik Abel (1802 – 1829), norwegischer Algebraiker
Die früher eingeführte Schreibweise ϕ−1“ für die Umkehrfunktion von ϕ ist also mit
”
der in 2.2 eingeführten Schreibweise für inverse Elemente konsistent.
10
52
häufig aber auch als Zweizeiler, in dem die obere Zeile die Elemente 1, . . . , n
in ihrer natürlichen Reihenfolge, die untere dagegen in der durch ϕ permutierten Reihenfolge wiedergibt; es stehen hierbei also stets Urbild und Bild
übereinander:
1 2 ... n
1ϕ 2ϕ . . . nϕ.
Für n ≥ 3 ist die Gruppe (Sn ; HEA) nicht kommutativ, denn zum Beispiel
gilt: 11
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
=
6=
=
3 1 2
2 1 3
3 2 1
1 3 2
2 1 3
3 1 2
Wir geben eine Verknüpfungstafel der Gruppe S3 an:
HEA id3
id3
α
β
ρ
σ
τ
id3
α
β
ρ
σ
τ
α= 1 2 3
2 3 1
α
β
id3
σ
τ
ρ
β= 1 2 3
3 1 2
β
id3
α
τ
ρ
σ
ρ= 1 2 3
2 1 3
ρ
τ
σ
id3
β
α
σ= 1 2 3
3 2 1
σ
ρ
τ
α
id3
β
τ= 1 2 3
1 3 2
τ
σ
ρ
β
α
id3
Verknüpft man Elemente der Teilmenge {id3 , α, β}, so liegt das Ergebnis
stets wieder in {id3 , α, β}; dies ist der Verknüpfungstafel unmittelbar zu entnehmen. Auch die folgenden Teilmengen haben offenbar diese Eigenschaft:
{id3 , ρ},
{id3 , σ},
{id3 , τ },
ferner trivialerweise auch S3 selbst und {id3 }. Diese Teilmengen sind also
Trägermengen von Magmen (bezüglich der Verknüpfung HEA), und zwar sogar
von Gruppen, wie leicht zu sehen. Eine leichte Übungsaufgabe ist es zu zeigen,
daß die eben genannten Teilmengen die einzigen mit dieser Eigenschaft sind.
2.4 Definition (abgeschlossen, Teilmagma, Teilhalbgruppe, Teilmonoid, Teilgruppe, Untermagma, Untermonoid, Untergruppe) Sei (A; ◦) ein Magma,
T ⊆ A. T heißt (bezüglich ◦) abgeschlossen, wenn ◦ eine Verknüpfung auf
11
Warnung: Autoren, die die Linksschreibweise von Abbildungen verwenden, erlauben
sich bisweilen, bei der Komposition von Permutationen, das Zeichen ◦ ( nach“!) aus Be”
quemlichkeit wegzulassen. Die irritierende Konsequenz ist leider, daß die Komposition
dann wie hier notiert wird, die Ergebnisse gegenüber der von uns angegebenen Rechnung
aber vertauscht erscheinen! Darauf sollte man beim Lesen in der Literatur gefaßt sein.
53
T ist (d. h. (T × T )◦⊆ ⊆ T ). Eine abgeschlossene Teilmenge heißt auch ein
Teilmagma oder ein Untermagma von (A; ◦). T nennen wir eine Teilhalbgruppe
bzw. ein Teilmonoid bzw. eine Teilgruppe von (A; ◦), wenn (T ; ◦) eine Halbgruppe bzw. ein Monoid bzw. eine Gruppe ist.
Eine Teilhalbgruppe einer Halbgruppe (A; ◦) nennt man eine Unterhalbgruppe
von (A; ◦), ein Teilmonoid T eines Monoids (A; ◦) mit 1T = 1A ein Untermonoid von (A; ◦). Eine Teilgruppe einer Gruppe (A; ◦) wird eine Untergruppe
von (A; ◦) genannt; in diesem Fall stimmen die neutralen Elemente von (T ; ◦)
und (A; ◦) automatisch überein:
2.4.1 Ist T eine Teilgruppe einer Gruppe (A; ◦), so gilt 1T = 1A . Gilt a ∈ T ,
so hat a in (G; ◦) dasselbe Inverse wie in (T ; ◦).
Beweis: Sei x das Inverse von 1T in der Gruppe (A; ◦). Es gilt:
1A = 1T ◦ x = (1T ◦ 1T ) ◦ x = 1T ◦ (1T ◦ x) = 1T ◦ 1A = 1T .
Wegen 1T = 1A ist das Inverse von a ∈ T in (T ; ◦) auch ein Inverses in (A; ◦).
Dieses ist aber nach 2.2.2 eindeutig bestimmt.
Zum Beispiel ist N Unterhalbgruppe (aber kein Teilmonoid) von (Z; +) und
Untermonoid von (Z; ·). Die Menge −N der negativen ganzen Zahlen ist eine
Unterhalbgruppe von (Z; +), nicht jedoch von (Z; ·). Nach 2.3 ist für jede
Menge X die Menge SX der Permutationen von X eine Teilgruppe des Monoids (X X ; HEA), und zwar mit demselben neutralen Element, also auch ein
Untermonoid.
Ohne Gefahr von Mißverständnissen erlauben wir uns im Fall einer Teilgruppe T eines unitären Magmas (A; ◦) mit 1T = 1A , von einer Untergruppe zu
sprechen, auch wenn (A; ◦) keine Gruppe ist. Im Gegensatz zu dem äußerst
wichtigen Begriff der Untergruppe hat der oben aus rein systematischem
Grund eingeführte Begriff der Teilgruppe kaum eine Bedeutung in klassischen algebraischen Theorien.
Die einelementige Teilmenge {0} ist Untergruppe von (Z; +), sowie Teilgruppe, aber keine Untergruppe von (Z; ·). Allgemein ist in einem Magma (A; ◦)
eine einelementige Teilmenge {x} genau dann ein Teilmagma, wenn gilt:
x ◦ x = x. Ein Element x mit dieser Eigenschaft heißt idempotent (oder: ein
”
Idempotent“ von (A; ◦)). Die Idempotenten von (Z; ·) sind 0 und 1, während
0 das einzige Idempotent von (Z; +) ist. In einer Gruppe ist das neutrale
Element stets das einzige Idempotent, wie aus der Gleichung x ◦ x = x durch
Multiplikation mit x−1 sofort folgt.
2.4.2 Ist T ein unitäres Teilmagma eines Magmas (A; ◦), so ist T ein idempotentes Element des Magmas (P(A); ◦⊆ ).
54
Denn T ◦⊆ T ⊆ T , weil T unter ◦ abgeschlossen ist, und T = {1T } ◦⊆ T ⊆
T ◦⊆ T.
2.4.3 Sei x ein Idempotent einer Semigruppe (A; ◦) und M(x) := {y|y ∈
A, y ◦ x = y = x ◦ y}. Dann ist M(x) ein Teilmonoid von (A; ◦) mit dem
neutralen Element x.
Nach Voraussetzung über x gilt x ∈ M(x), und für alle y, z ∈ M(x) gilt:
(y ◦ z) ◦ x = y ◦ (z ◦ x) = y ◦ z = (x ◦ y) ◦ z = x ◦ (y ◦ z),
also y ◦ z ∈ M(x). Nach Definition von M(x) ist x neutral in (M(x); ◦). Da
◦ assoziativ auf A ist, folgt die Behauptung.
2.5 Proposition Sei (M; ◦) ein Monoid und E die Menge der invertierbaren
Elemente von (M; ◦). Dann ist E eine Untergruppe von (M; ◦).
Beweis. Sei e das neutrale Element von (M; ◦). Nach 2.2.3(2) ist E bezüglich
◦ abgeschlossen. Da ◦ auf M assoziativ ist, ist ◦ auch auf E assoziativ. Die
Gleichung e = e ◦ e zeigt, daß e ∈ E gilt; also ist e auch neutral in (E; ◦)
und letzteres somit ein Monoid. Gilt a ∈ E, so liegt nach 2.2.3(1) das in M
existierende Inverse a−1 ebenfalls in E. Daher ist in (E; ◦) jedes Element von
E invertierbar.
Die Gruppe (E; ◦) in 2.5 heißt die Einheitengruppe des Monoids (M; ◦).
Zur Hervorhebung des Bezuges zu (M; ◦) wird ihre Trägermenge auch mit
E(M; ◦) bezeichnet.
Zum Beispiel gilt: E(Z; ·) = {1, −1} (neutral: 1), E(Z; +) = Z (neutral: 0),
E(Q; ·) = Q r {0} (neutral: 1), E(X X ; HEA) = SX (neutral: idX ).
Eine besonders interessante Einheitengruppe gerät durch die Kombination
von 2.4.2 und 2.4.3, ausgehend von einer abelschen Gruppe (A; +), ins Blickfeld: Jede Untergruppe T von (A; +) ist ein Idempotent von (P(A); +⊆ ), so
daß nach 2.4.3 M(T ) ein Teilmonoid von (P(A); +⊆ ) ist. Die Gruppe dessen
invertierbarer Elemente beschreibt
2.6 Proposition Sei T eine Untergruppe einer abelschen Gruppe (A; +).
Dann besteht die Gruppe der invertierbaren Elemente des Teilmonoids M(T )
von (P(A); +⊆ ) aus den Teilmengen T + a mit a ∈ A.12 Jedes Element von
M(T ) ist Vereinigung einer Menge invertierbarer Elemente von (M(T ); +⊆ )
12
Dabei steht T + a für T +⊆ {a}, besteht also aus den Elementen x ∈ A, zu denen es
ein y ∈ T gibt mit x = y + a.
55
Beweis. Sei X ∈ M(T
S ). Dann gilt T +⊆ X = X, folglich T + b ⊆ X für alle
b ∈ X und X = b∈X (T + b), da (nach 2.4.1) b = 0A + b ∈ T + b für alle
b ∈ X.
Sei nun E die Menge der invertierbaren Elemente des Monoids (M(T ); +⊆ ).
Für alle a ∈ T gilt dann (unter Verwendung der Kommutativität von + an
der mit (∗) markierten Stelle)
(T +a)+⊆ (T +(−a)) = T +⊆ {a}+⊆ T +⊆ {−a} = T +⊆ T +⊆ {a}+⊆ {−a} = T
(∗)
und vermöge Anwendung desselben mit −a statt a auch
(T + (−a)) +⊆ (T + a) = T,
also T + a ∈ E. (Die Schlußaussage in 2.6 ist damit insbesondere schon
bewiesen.) Sei X ∈ E und Y das Inverse zu X in (E; +⊆ ). Dann folgt
[
[
[
T = X +⊆ Y =
(T + b) +⊆
(T + b′ ) =
T + b + b′ ,
b∈X
b′ ∈Y
(∗)
(b,b′ )∈X×Y
also b + b′ ∈ TSfür alle b ∈ X, b′ ∈ Y . Ist also c ein beliebiges Element von Y ,
so folgt X = b∈X (T + b) ⊆ T + (−c). Für alle b ∈ X gibt es also ein t ∈ T
mit b = t + (−c),
S woraus T + b = T + t + (−c) = T + (−c) folgt. Mit a := −c
gilt also X = b∈X (T + b) = T + a.
2.7 Definition (Restklasse, Faktorgruppe) Sei (A; +) eine abelsche Gruppe
und T eine Untergruppe von (A; +). Unter einer Restklasse von (A; +) nach
T versteht man eine Teilmenge X von A, zu der es ein a ∈ A gibt mit
X = T + a. Für jedes a ∈ A heißt T + a die Restklasse von a modulo T . Mit
A/T wird die Menge aller Restklassen von (A; +) nach T bezeichnet. Nach
2.6 ist (A/T ; +⊆ ) eine Gruppe. Diese heißt die Faktorgruppe von (A; +) nach
56
T.
13
Für alle a, b ∈ A gilt:
(T + a) +⊆ (T + b) = T + (a + b).
Untergruppen von Gruppen werden durch das folgende gleichermaßen einfache wie wichtige Kriterium gekennzeichnet:
2.8 Proposition (Untergruppenkriterium) Sei (G; ◦) eine Gruppe,
T ⊆ G. Es sind äquivalent:
(i) T ist eine Untergruppe von (G; ◦),
(ii) T 6= ∅
∧
∀a, b ∈ T
a ◦ b−1 ∈ T .14
Folgerung T
Ist M eine nichtleere Menge von Untergruppen einer Gruppe G,
so ist auch M eine Untergruppe von G.
Beweis. (i)⇒(ii) Es gelte (i). T hat ein neutrales Element, also gilt T 6= ∅.
Sind a, b ∈ T , so (mit 2.4.1) auch b−1 ∈ T , also aufgrund der Abgeschlossenheit von T auch a ◦ b−1 ∈ T .
(ii)⇒(i) Es gelte (ii). Es ist T 6= ∅, sei also c ∈ T . Nach Voraussetzung (mit
a = b = c) gilt dann c ◦ c−1 ∈ T , d. h. 1G ∈ T . Sind a, b ∈ T , so gilt daher
zunächst auch 1G ◦ b−1 ∈ T , also b−1 ∈ T. Weiter gilt dann a ◦ (b−1 )−1 ∈ T ,
nach 2.2.3(1) heißt das a ◦ b ∈ T . Also ist (T ; ◦) ein Monoid. Da mit b ∈ T
auch b−1 = 1G ◦ b−1 ∈ T gilt, ist (T ; ◦) eine Gruppe.
Zur Folgerung: Sei T
M eine nichtleere Menge von Untergruppen einer Gruppe G. Wir zeigen: M erfüllt (ii): Für alle T ∈ M gilt 1G ∈ T nach 2.4.1,
13
Bei genauem Hinsehen stellt man leicht fest, daß statt der Kommutativität von (A; +)
für die gesamte Konstruktion der Faktorgruppe nach T nur die wesentlich schwächere Eigenschaft der Untergruppe T eingeht, die im Beweis von 2.6 an der durch (∗) gekennzeichneten Stelle benutzt wird: T +⊆ {a} = {a} +⊆ T , bequemer“ geschrieben: T + a = a + T
”
für alle a ∈ T . Ist also (A; ◦) eine beliebige Gruppe und T eine Untergruppe mit der
Eigenschaft
(∗)
∀a ∈ A
T ◦ a = a ◦ T,
so ist die Menge A/T der Restklassen T ◦ a mit a ∈ A eine Teilgruppe von (P(A); ◦⊆ ),
die die Faktorgruppe von (A; ◦) nach T genannt wird. Die Untergruppen T mit der Eigenschaft (∗) spielen daher in der Gruppentheorie eine besonders wichtige Rolle; sie werden
Normalteiler von (A; ◦) genannt. In abelschen Gruppen ist natürlich jede Untergruppe ein
Normalteiler. In der Gruppe (S3 ; HEA) dagegen (siehe S. 53 sind die drei 2-elementigen
Untergruppen keine Normalteiler, die drei übrigen dagegen sind Normalteiler.
14
Bei additiver Schreibweise nimmt (ii) die Form an: T 6= ∅ ∧ ∀a, b ∈ T a − b ∈ T ,
wobei a − b := a + (−b). Die Subtraktion“ ist keine Verknüpfung von eigenständiger
”
Bedeutung, sondern wird (in abelschen Gruppen) wie angegeben auf die Addition und die
Inversenbildung zurückgeführt.
57
T
T
also: 1G ∈ M. Sind a, b T
∈ M, so a ◦ b−1 ∈ T für alle
T T ∈ M (nach
2.8(i)⇒(ii)), also a ◦ b−1 ∈ M. Damit wird 2.8(ii) von M erfüllt. Die
Behauptung folgt somit aus 2.8.
2.8.1 Beispiel Für alle k ∈ Z ist kZ eine Untergruppe von (Z; +).
Denn 0 ∈ kZ, und wenn a, b ∈ kZ, so k|a, k|b und damit auch: k|(a − b),
d. h. a − b ∈ kZ. 15
2.9 Proposition (Fundamentalbeispiel einer Gruppenkonstruktion)
Sei (G; ◦) eine Gruppe und X eine Menge. Auf der Menge GX definieren wir
˙ indem wir für alle ϕ, ψ ∈ GX setzen:
eine Verknüpfung ◦,
˙ : X → G, x 7→ xϕ ◦ xψ.
ϕ◦ψ
˙ eine Gruppe. Genau dann ist (GX ; ◦)
˙ abelsch, wenn (G; ◦)
Dann ist (GX ; ; ◦)
abelsch ist.
Beweis. ◦˙ ist assoziativ: Sind ϕ, ψ, ω ∈ GX , so gilt für alle x ∈ X:
˙ ◦ω)
˙ = x(ϕ◦ψ)
˙ ◦ xω = (xϕ ◦ xψ) ◦ xω
x((ϕ◦ψ)
˙ = x(ϕ◦(ψ
˙ ◦ω)).
˙
= xϕ ◦ (xψ ◦ xω) = xϕ ◦ x(ϕ◦ω)
◦ass.
˙ ◦ω
˙ = ϕ◦(ψ
˙ ◦ω).
˙
Es folgt: (ϕ◦ψ)
Bezeichnet e das neutrale Element von (G; ◦), so ist die Funktion ε : X → G,
˙ Ist ϕ ∈ GX , so gilt für alle x ∈ X
x 7→ e, neutral in (GX ; ◦):
˙ = xϕ ◦ xε = xϕ ◦ e = xϕ = e ◦ xϕ = xε ◦ xϕ = x(ε◦ϕ).
˙
x(ϕ◦ε)
˙ ein Monoid. Sei ϕ ∈ GX . Wir definieren ϕ̄ : X → G,
Also ist (GX ; ◦)
−1
x 7→ (xϕ) . Dann ist ϕ̄ zu ϕ invers, denn für alle x ∈ X gilt:
˙
x(ϕ◦˙ ϕ̄) = xϕ ◦ (xϕ)−1 = e = (xϕ)−1 ◦ xϕ = x(ϕ̄◦ϕ),
˙ Ist ◦ auf G kommutativ, so folgt für alle ϕ, ψ ∈ GX ,
also gilt: ϕ◦˙ ϕ̄ = ε = ϕ̄◦ϕ.
x∈X
˙
˙
x(ϕ◦)ψ)
= xϕ ◦ xψ = xψ ◦ xϕ = x(ψ ◦ϕ),
15
Es ist übrigens nicht schwer einzusehen, daß diese Untergruppen auch die einzigen
Untergruppen von (Z; +) sind: Die triviale Untergruppe {0} hat die Form kZ, da man nur
k = 0 zu setzen braucht. Ist T eine Untergruppe 6= {0} von (Z; +), so enthält T eine von 0
verschiedene, damit aber auch eine natürliche Zahl (da zu einer ganzen Zahl a 6= 0 entweder
a oder −a in N liegt). Setzt man nun k := min(T ∩ N), so folgt mittels vollständiger
Induktion für alle n ∈ N leicht kn ∈ T , damit aber aufgrund der Abgeschlossenheit von
T gegen Inversenbildung auch kZ ⊆ T . Ist jetzt t ∈ T und z ∈ Z minimal mit kz ≥ t, so
folgt 0 ≤ kz − t < k und kz − t ∈ T , nach Wahl von k also kz − t = 0, d. h. t = kz ∈ kZ.
58
˙ = ψ ◦ϕ.
˙ Ist umgekehrt ◦˙ auf GX kommutativ und sind a, b ∈ G, so
also ϕ◦ψ
sei ϕ : X → G, x 7→ a, ψ : X → G, x 7→ b. Dann folgt:
˙ = x(ψ ◦ϕ)
˙ = xψ ◦ xϕ = b ◦ a.
a ◦ b = xϕ ◦ xψ = x(ϕ◦ψ)
1. Spezialfall: n ∈ N, X = n, also GX = Gn . Die Menge der n-Tupel über
G ist bezüglich komponentenweiser Verknüpfung eine Gruppe.
2. Spezialfall: m, n ∈ N, X = m × n, also GX = Gm×n . Die Menge der
(m × n)-Matrizen über G ist bezüglich komponentenweiser Verknüpfung eine
Gruppe.
2.10 Definition (direkte Summe, direktes Produkt, direkte Zerlegung, direkter Summand, direkter Faktor) Seien (A; ◦), (B; ◦ ) Magmen. Für alle a,
A
a′ ∈ A, b, b′ ∈ B setzen wir
B
(a, b) ◦ (a′ , b′ ) := (a ◦ a′ , b ◦ b′ ).
A
B
Das Magma (A × B; ◦) heißt bei additiver Sprechweise die direkte Summe
(und wird dann häufig in der Form A ⊕ B geschrieben), bei multiplikativer
Sprechweise das direkte Produkt von (A; ◦) mit (B; ◦ ). Trivial ist:
A
B
2.10.1 Ist T ein Teilmagma von (A; ◦) und S ein Teilmagma von (B; ◦ ), so
A
B
ist T × S ein Teilmagma von (A × B; ◦).
Die Teilmagmen von (A×B; ◦) entstehen jedoch i. a. keineswegs alle auf diese
Weise! Vor dem katastrophalen Irrtum, dies zu denken, kann nicht deutlich
genug gewarnt werden. Wir betrachten einige Beispiele mit A = B = Q und
der Addition als Verknüpfung (auf Q bzw. Q2 ):
2.10.2 Beispiele (1) Q × {0}, {0} × Q sind Teilmagmen von (Q2 ; +) nach
2.10.1 (sogar Untergruppen). Betrachtet man die Funktion ϕ : Q → Q2 ,
c 7→ (c, 0), so gilt:
(i) ϕ ist eine Bijektion von Q auf Q × {0}.
(ii) Sind a, a′ , b ∈ Q mit a + a′ = b, so folgt aϕ + a′ ϕ = bϕ,
denn (a, 0)+(a′, 0) = (a+a′ , 0+0) = (a+a′ , 0). Man nennt eine Abbildung
ϕ mit (1i),(1ii) einen Isomorphismus von (Q; +) auf (Q × {0}; +).
(2) Sei U := {(a, a)|a ∈ Q}. Dann ist U eine Untergruppe von (Q2 ; +) und
ϕ : Q → U, a 7→ (a, a), ist ein Isomorphismus von (Q; +) auf (U; +). Die
Untergruppe U hat nicht die Form T × S mit T , S ⊆ Q.
59
(3) Sei V := {(a, −a)|a ∈ Q}. Da + kommutativ ist, ist V eine Untergruppe
von (Q2 ; +), denn für alle a, a′ ∈ Q gilt
(a, −a) + (a′ , −a′ ) = (a + a′ , (−a) + (−a′ )) = (a + a′ , −(a′ + a))
= (a + a′ , −(a + a′ )).
Es ist also ϕ : Q → V , a 7→ (a, −a) ein Isomorphismus von (Q; +) auf
(V ; +). Auch V hat nicht die Form T × S mit T , S ⊆ Q.
Es gilt: U ∩ V = {(0, 0)}, denn für ein a ∈ Q folgt aus a = −a offenbar a = 0.
Weiter gilt U +⊆ V = Q2 : Ist nämlich x ∈ Q2 , so existieren r, s ∈ Q mit
x = (r, s). Setzen wir a := r+s
, b := r−s
, so folgt
2
2
r + s r − s r + s r − s
= (r, s) = x.
+
,
−
2
2
2
2
(a, a) + (b, −b) =
Offenbar gilt auch: (Q×{0})∩({0}×Q) = {(0, 0)}, (Q×{0})+⊆ ({0}×Q) =
Q2 .
Gewisse Phänomene aus diesen Beispielen sind von allgemeinem Charakter:
2.10.3 Besitzen (A; ◦), (B; ◦ ) neutrale Elemente eA bzw. eB , so ist (eA , eB )
A
B
neutral in (A × B; ◦).
2.10.4 Sind (A; ◦), (B; ◦ ) Gruppen, so ist auch (A × B; ◦) eine Gruppe.
A
B
Denn nach 2.10.3 ist (eA , eB ) neutral bezüglich ◦, und zu (a, b) ∈ A × B ist
(a−1 , b−1 ) invers.
Additiv schreibt man (bei gegebenen Gruppen (A; +), (B; +))
A⊕B
für die Gruppe (A × B; ◦).
Sei (G; ◦) eine Gruppe. Unter einer 2-teiligen direkten Zerlegung von (G; ◦)
versteht man eine Menge {Y, Z} von Untergruppen Y , Z von (G; ◦) mit den
Eigenschaften:
(i) Für alle y ∈ Y , z ∈ Z gilt: y ◦ z = z ◦ y.16
(ii) Für jedes x ∈ G gibt es genau ein Paar (y, z) mit y ∈ Y , z ∈ Z, so daß
gilt: x = y ◦ z.
16
Für diese Bedingung wird auch die Formulierung verwandt: Y , Z sind miteinander
”
elementweise vertauschbar“. Sie besagt nichts über die Vertauschbarkeit zweier Elemente,
die beide zu Y bzw. beide zu Z gehören.
60
Sei 1G das neutrale Element von (G; ◦). Wir nennen {{1G }, G} die triviale
direkte Zerlegung von (G; ◦). Ist Y eine Untergruppe von (G; ◦), zu der es
eine Untergruppe Z von (G; ◦) gibt, so daß {Y, Z} eine direkte Zerlegung
von (G; ◦) ist, so heißt Y bei additiver Sprechweise ein direkter Summand, bei
multiplikativer Sprechweise ein direkter Faktor von (G; ◦). Wir beweisen eine
Äquivalenz zu (ii):
2.10.5 (ii)⇔ Y ◦⊆ Z = G, Y ∩ Z = {1G }
Die Gleichung Y ◦⊆ Z = G bedeutet, daß es zu jedem x ∈ G Elemente y ∈ Y ,
z ∈ Z gibt mit y ◦ z = x. Gilt Y ∩ Z = {1G } und sind y, y ′ ∈ Y , z, z ′ ∈ Z
mit y ◦ z = y ′ ◦ z ′ , so folgt
y ′−1 ◦ y = z ′ ◦ z −1 ,
| {z } | {z }
∈Z
∈Y
wegen Y ∩ Z = {1G } also y ′−1 ◦ y = 1G = z ′ ◦ z −1 und damit y = y ′, z = z ′ .
Gilt dagegen Y ∩ Z 6= {1G } und ist 1G 6= x ∈ Y ∩ Z, so sind (x, 1G ) und
(1G , x) beides Paare, deren Komponentenprodukt jeweils gleich x ist. Wegen
x 6= 1G gilt (x, 1G ) 6= (1G , x), also ist die Eindeutigkeitsbedingung in (ii)
verletzt. Damit gilt die Eindeutigkeit genau dann, wenn Y ∩ Z = {1G }. Die Bedingung (i) gilt in abelschen Gruppen (G; ◦) trivialerweise. In unseren
obigen Beispielen gilt daher, daß {U, V } sowie {Q × {0}, {0} × Q} 2-teilige
direkte Zerlegungen von (Q2 ; +) sind.17 U, V , Q × {0}, {0} × Q sind also Beispiele für direkte Summanden von (Q2 ; +). Diese Untergruppen sind
sämtlich zu (Q; +) isomorph.
2.11 Definition (Isomorphismus, Monomorphismus, Epimorphismus, Endomorphismus, Automorphismus) Sind (A; ◦), (B; ·) Magmen, so versteht
man unter einem Isomorphismus von (A; ◦) auf (B; ·) eine Abbildung ϕ :
A → B mit
(i) ϕ ist bijektiv,
(ii) ∀x, y ∈ A (x ◦ y)ϕ = xϕ · yϕ.
Gibt es einen Isomorphismus von (A; ◦) auf (B; ·), so heißt (A; ◦) isomorph
zu (B; ·). Schreibweise dafür: (A; ◦) ∼
= (B; ·). Gilt (ii), so heißt ϕ ein Homomorphismus von (A; ◦) in (B; ·). Ein injektiver Homomorphismus heißt ein
17
Die erste dieser Aussagen wird falsch, wenn man darin Q durch Z ersetzt, die zweite
nicht. – Man erkennt leicht, daß auch {U, {0} × Q}, {V, {0} × Q}, {U, Q × {0}) und {V, Q ×
{0}) 2-teilige direkte Zerlegungen von (Q2 ; +) sind.
61
Monomorphismus, ein surjektiver Homomorphismus ein Epimorphismus. Unter einem Endomorphismus von (A; ◦) versteht man einen Homomorphismus
von (A; ◦) in (A; ◦). Ist dieser gleichzeitig eine Bijektion von A auf sich, so
nennt man ihn einen Automorphismus von (A; ◦).
2.11.1 Beispiel (siehe 2.9, 1. Spezialfall) Sei (G; ◦) eine Gruppe, e ihr neutrales Element, n ∈ N und j ∈ n. Wir setzen
Gj := {(e, . . . , e, g, e, . . . , e)|g ∈ G} = {ϕ|ϕ ∈ Gn , ∀i ∈ n r {j} iϕ = e} .
| {z } | {z }
j−1
n−j
˙ Setzen wir nämlich
Dann ist Gj ein direkter Summand von (Gn ; ◦).
G(j) := {(g1 , . . . , gj−1, e, gj+1, . . . , gn }|gi ∈ G} = {ϕ|ϕ ∈ Gn , jϕ = e} ,
˙ Die Abbildungen
so ist {Gj , G(j) } eine 2-teilige direkte Zerlegung von (Gn ; ◦).
G → Gj ,
und
Gn−1 → G(j) ,
g 7→ (e, . . . , e, g, e, . . . , e)
| {z } | {z }
j−1
n−j
(x1 , . . . , xn−1 ) 7→ (x1 , . . . , xj−1 , e, xj , . . . , xn−1 )
sind Isomorphismen (bezüglich der jeweils zugehörigen Gruppenverknüpfungen). Sei
ω : G → Gn , g 7→ (g, . . . , g),
˙ und ω ein IsomorphisU := Bild ω. Dann ist U eine Untergruppe von (Gn ; ◦)
˙ Ist (G; ◦) abelsch, so ist {U, G(j) } für jedes j ∈ n
mus von (G; ◦) auf (U; ◦).
˙
eine 2-teilige direkte Zerlegung von (Gn ; ◦).
2.11.2 Seien (A; ◦), (B; ◦ ) Gruppen, 1A bzw. 1B ihre neutralen Elemente,
A
B
G := A × B und ◦ wie in 2.10. Sei
A∗ := {(a, 1B )|a ∈ A}, B ∗ := {(1A , b)|b ∈ B}.
Dann ist {A∗ , B ∗ } eine 2-teilige direkte Zerlegung von (G; ◦), und
ϕ : A → A∗ , a 7→ (a, 1B ),
sind Isomorphismen.
62
ψ : B → B ∗ , b 7→ (1A , b)
Beweis. Seien y ∈ A∗ , z ∈ B ∗ . Dann existieren a ∈ A, b ∈ B mit y = (a, 1B ),
z = (1A , b). Es folgt:
y ◦ z = (a, 1B ) ◦ (1A ; b) = (a, b) = (1A , b) ◦ (a, 1B ) = z ◦ y.
Ist x ∈ G, so gibt es a ∈ A, b ∈ B mit x = (a, b) = (a, 1B ) ◦ (1A , b), es gilt
also: G = A∗ ◦⊆ B ∗ . Weiter gilt A∗ ∩ B ∗ = {(1A , 1B )}. Mit 2.10.5 folgt nun
die erste Behauptung. Für alle a, a′ ∈ A gilt
(a ◦ ϕ = (a ◦ a′ , 1B ) = (a, 1B ) ◦ (a′ , 1B ) = aϕ ◦ a′ ϕ.
A
A
Also ist ϕ ein Homomorphismus, und die Bijektivität von ϕ ist aufgrund der
Definition von A∗ klar. Ebenso ist auch ψ ein Isomorphismus.
In umgekehrter Richtung gilt:
2.11.3 Ist {Y, Z} eine 2-teilige direkte Zerlegung einer Gruppe (G; ·), so
gilt (Y × Z; ◦) ∼
= (G; ·), und zwar ist ϕ : Y × Z → G, (y, z) 7→ y · z, ein
Isomorphismus.
Beweis. Seien y, y ′ ∈ Y , z, z ′ ∈ Z. Es gilt:
((y, z) ◦ (y ′ , z ′ ))ϕ = (y · y ′ , z · z ′ )ϕ = (y · y ′ ) · (z · z ′ ) = y · (y ′ · z) · z ′
= y · (z · y ′) · z ′ = (y · z) · (y ′ · z ′ ) = (y, z)ϕ · (y ′, z ′ )ϕ.
Also ist ϕ ein Homomorphismus. Nach 2.10.5 gilt Y ·⊆ Z = G, woraus die
Surjektivität von ϕ folgt. Aus der Eindeutigkeitsaussage in 2.10,(ii), folgt die
Injektivität von ϕ.
2.12 Definition (Distributiv(-Gesetze), Doppelmagma, Algebra, Trägergruppe, Ring, unitär, Null-Element, Eins-Element) Seien Magmen (A; +),
A
(B; +), (C; +) gegeben. (Wir verwenden für die Verknüpfungen hier die adB
ditive Schreibweise, da unsere hauptsächlichen Anwendungen im Folgenden
sich auf abelsche Gruppen beziehen werden. Zunächst wird aber über die Verknüpfungen auf A, B, C noch nichts Einschränkendes vorausgesetzt.) Eine
Verknüpfung · zwischen A und B mit A ·⊆ B ⊆ C heißt distributiv, wenn die
folgenden beiden Bedingungen gelten:
(D1 )
∀a ∈ A ∀b, b′ ∈ B
a · (b + b′ ) = a · b + a · b′
(D2 )
∀a, a′ ∈ A ∀b ∈ B
(a + a′ ) · b = a · b + a′ · b
B
A
Dabei heißt (D1 ) das Links-Distributivgesetz, (D2 ) das Rechts-Distributivgesetz.
63
2.12.1 Besitzt A ein bezüglich + neutrales Element 0A und ist (C; +) eine
A
Gruppe mit dem neutralen Element 0C , so folgt aus (D2 ) für alle b ∈ B
(1) 0A · b = 0C ,
(2) (−a) · b = −(a · b) für alle bezüglich + invertierbaren Elemente a ∈ A.
A
Beweis. (1) Für alle b ∈ B gilt 0A · b = (0A + 0A ) · b = 0A · b + 0A · b, also
A
0C = 0A · b + (−(0A · b)) = 0A · b + 0A · b + (−(0A · b)) = 0A · b.
(2) Ist a ∈ A bezüglich + invertierbar, so folgt für alle b ∈ B
A
a · b + (−a) · b = (a + (−a)) · b = 0A · b = 0C ,
(1)
also die Behauptung.
Natürlich gilt ebenso:
2.12.2 Besitzt B ein bezüglich + neutrales Element 0B und ist (C; +) eine
B
Gruppe mit dem neutralen Element 0C , so folgt aus (D1 ) für alle a ∈ A
(1) a · 0B = 0C ,
(2) a · (−b) = −(a · b) für alle bezüglich + invertierbaren Elemente b ∈ B.
B
Eine wichtige Sorte algebraischer Strukturen ergibt sich durch die Spezialisierung A = B = C, + = + = +. Sind +, · zunächst irgendwelche VerA
B
knüpfungen auf der Menge A, so nennen wir ((A; +); ·) ein Doppelmagma.
Interessante Doppelmagmen entstehen, wenn zwischen den Verknüpfungen +
und · gewisse Beziehungen gelten: Ist (A; +) eine abelsche Gruppe und · eine
distributive Verknüpfung auf A, so heißt das Doppelmagma ((A; +); ·) eine
Algebra. Dann wird (A; +) die Trägergruppe der Algebra und · ihre Multipli”
kation“ genannt. Ist · kommutativ auf A, so heißt die Algebra kommutativ;
ebenso heißt die Algebra assoziativ, wenn · auf A assoziativ ist.18 Assoziative
Algebren heißen auch Ringe. Das additiv neutrale Element 0A einer Algebra
((A; +); ·) heißt das Null-Element (auch die Null“) der Algebra. Eine Alge”
bra ((A; +); ·) wird unitär genannt, wenn sie ein neutrales Element 1A 6= 0A
bezüglich · enthält; dieses heißt dann das Eins-Element (auch die Eins“) der
”
18
Daß diese Spezifikation sich nur auf die Multiplikation der Algebra beziehen kann, ist
deswegen klar, weil ja die Verknüpfung + ohnehin stets kommutativ und assoziativ auf A
ist.
64
Algebra.19
Zum Beispiel ist ((Z; +); ·) ein kommutativer unitärer Ring; allgemeiner gilt
dies für ((Zn ; +̇); ·) (n ∈ N), wobei die Verknüpfungen komponentenweise zu
verstehen sind. Auch ((Q; +); ·), ((R; +); ·) sind kommutative unitäre Ringe.
Dagegen ist ((N; +); ·) kein Ring, weil (N; +) keine Gruppe ist.
Aus 2.12.1 und 2.12.2 folgt
2.12.3 Ist ((A; +); ·) eine Algebra, so gilt für alle a, b ∈ A
(1) 0A · a = 0A = a · 0A ,
(2) (−a) · b = −(a · b) = a · (−b).
2.13 Definition (Körper) Ein Körper ist ein kommutativer unitärer Ring
((A; +); ·), in dem jedes Element 6= 0A ein multiplikativ Inverses besitzt. Ein
Doppelmagma ((A; +); ·) ist also genau dann ein Körper, wenn (A; +) und
(A r {0A }; ·) abelsche Gruppen sind und · distributiv ist. Zum Beispiel sind
((Q; +)·), ((R; +)·) Körper, jedoch ist ((Z; +)·) kein Körper, da (Z r {0}; ·)
keine Gruppe ist.
Es gibt jedoch auch Körper ganz anderer Bauart: Setzen wir nämlich etwa
A := {G, U} und definieren zwei Verknüpfungen #, · auf A wie auf S. 49, so
ist (A; #) eine abelsche Gruppe (0A = G) und (A r {G}; ·) ebenfalls (und
zwar mit der 1-elementigen Trägermenge {U}). Ein Produkt a·b mit a, b ∈ A
ist gleich G, wenn a = G gilt, und gleich b, wenn a = U gilt; daraus folgt
sofort die Distributivität der Multiplikation ·. Also ist ((A; #); ·) ein Körper,
der genau zwei Elemente enthält: 0A = G 6= U = 1A .
Wir schreiben im folgenden [x] für die Kongruenzklasse einer ganzen Zahl x
modulo 3 (siehe 1.9) und setzen K := Z/≡. Dann gilt: K = {[0], [1], [2]}.
3
Zusätzlich zu der uns schon bekannten Verknüpfung +⊆ definieren wir (per
Verknüpfungstafel) eine Multiplikation • auf K:
+⊆
[0]
[1]
[2]
[0]
[0]
[1]
[2]
[1]
[1]
[2]
[0]
[2]
[2]
[0]
[1]
•
[0]
[1]
[2]
,
[0]
[0]
[0]
[0]
[1]
[0]
[1]
[2]
[2]
[0]
[2]
[1]
,
Dann ist (K; +⊆ ) die Faktorgruppe von (Z; +) nach der Untergruppe 3Z
(s. 2.7), und für alle x, y ∈ Z gilt [x] • [y] = [xy]. Aus dieser Regel folgt sehr
19
Die Gleichheit 1A = 0A würde bedeuten: A = {0A }. Eine nur aus dem Null-Element
bestehende Algebra wird also nicht zu den unitären Algebren gezählt.
65
schnell, daß • distributiv ist, durch Zurückführung auf die Distributivität der
Multiplikation in Z: Für alle x, x′ , y ∈ Z gilt
([x] +⊆ [x′ ]) • [y] = [(x + x′ )y] = [xy + x′ y] = [x] • [y] +⊆ [x′ ] • [y].
Betrachten wir nun Kr{[0]}, so erhalten wir dafür die folgende Verknüpfungstafel:
• [1] [2]
[1] [1] [2] .
[2] [2] [1]
Wir wissen aber schon, daß dies die Verknüpfungstafel einer abelschen Gruppe ist, denn wie ein Vergleich mit der Verknüpfungstafel für die additive
Gruppe ({G, U}; #) des gerade oben zuvor betrachteten Körpers (siehe S. 49)
lehrt, ist die Abbildung [1] 7→ G, [0] 7→ U ein Isomorphismus von (K; •) auf
({G, U}; #).20 Daher ist ((K; +⊆ ); •) ein Körper.21 Es gilt: 0K = [0], 1K = [1].
Die Multiplikation • stimmt, wenn nur einer der Faktoren von [0] verschieden
ist, mit dem Teilmengenprodukt ·⊆ überein. Man sollte jedoch beachten, daß
laut Definition [0] • [0] = [0], dagegen [0] ·⊆ [0] = 9Z 6= [0] gilt. Es handelt
sich bei • also nicht um das Teilmengenprodukt!
Wir sind es von den in der Schule behandelten Zahlbereichen gewohnt, daß
Quadrate keine negativen Zahlen sein können, insbesondere daß −1 kein
Quadrat ist. Es gibt aber Körper, in denen letzteres der Fall ist: Ein Beispiel
dafür ist bereits der oben betrachtete 2-elementige Körper A = {G, U}, denn
in diesem gilt die merkwürdige Gleichung −1A = 1A = (1A )2 . In unserem 3elementigen Körper ((K; +̇); •) hingegen gilt:
−1K = [2] 6= x2 für alle x ∈ K,
denn [0]2 = [0], [1]2 = [1] = [2]2 . Wir stellen nun eine Konstruktion vor,
bei der man, ausgehend von einem beliebigen Körper ((K; +); ·), in dem
20
Natürlich läßt sich die Gruppen-Eigenschaft der winzigen Struktur ({[1], [2]}; •) auch
sehr leicht direkt einsehen. Dennoch ist der oben vorgeschlagene Weg der weit elegantere:
Er vermeidet jegliches Rechnen, sondern verwendet nur die Tatsache, dasß ein Magma,
das zu einer Gruppe isomorph ist, selbst eine Gruppe ist – eine ohnehin unverzichtbare
Einsicht, die mit klarem Verständnis des Isomorphiebegriffs sich als Trivialität ausnimmt.
21
Ersetzt man die Zahl 3 durch eine beliebige natürliche Zahl k > 1, so erhält man
entsprechend stets einen kommutativen unitären Ring mit der Trägermenge Z/≡, also mit
k
genau k Elementen. Ein Körper entsteht dabei genau dann, wenn k eine Primzahl ist. Wir
beweisen diese Aussage hier nicht, möchten aber darauf hinweisen, daß für die Entstehung
des drei-elementigen Körpers in der obigen Konstruktion die Tatsache entscheidend ist,
daß 3 eine Primzahl ist! – Wählt man statt dessen k = 2, so erhält man übrigens einen zu
(({G, U }; #); ·) isomorphen Körper.
66
die Gleichung x2 = −1K unlösbar ist, einen Körper ((L; +̇); ◦) gewinnt, in
dem die Gleichung x2 = −1L lösbar ist; dabei wird L eine zu K isomorphe
Teilstruktur enthalten:
Sei also ((K; +); ·) zunächst ein beliebiger Körper. Wir setzen L := K 2 und
definieren zwei Verknüpfungen auf L:
(a, b)+̇(c, d) :=
(a + c, b + d)
(a, b) ◦ (c, d) := (a · c − b · d, a · d + b · c)
für alle a, b, c, d ∈ K. Durch überraschungsloses Nachrechnen verifiziert
man, daß dann ((L; +̇); ◦) ein kommutativer unitärer Ring mit 0L = (0K , 0K ),
1L = (1K , 0K ) ist. Ferner ist die Abbildung
ϕ : K → L,
a 7→ (a, 0K )
ein Monomorphismus sowohl bezüglich der Additionen +, +̇ als auch bezüglich
der Multiplikationen ·, ◦. Es ist Bild ϕ = K × {0K }, letzteres also ein
Teil-Doppelmagma von ((L; +̇); ◦), das zu ((K; +); ·) (bezüglich beider Verknüpfungen) isomorph ist: Es ist ein zu ((K; +); ·) isomorpher Teilkörper von
((L; +̇); ◦). Es gilt:
(0K , 1K )2 = (−1K , 0K ) = −1L ,
also ist die Gleichung x2 = −1L in ((L; +̇); ◦) lösbar.
Wenn nun bereits K ein Element c enthält mit c2 = −1K , so folgt, daß auch
(c, 0K )2 = −1L gilt, also
(c, 1K ) ◦ (c, −1K ) = ((c, 0K )+̇(0K , 1K )) ◦ ((c, 0K ) − (0K , 1K )) = 0L ,
d. h. L r {0L } ist nicht multiplikativ abgeschlossen, insbesondere keine Gruppe. Also ist dann ((L; +̇); ◦) kein Körper.
Sei nun die Gleichung x2 = −1K in ((K; +)·) unlösbar. Sind dann a, b ∈ K
mit (a, b) 6= 0L , so folgt a2 + b2 6= 0K : Im Falle b 6= 0K erhielten wir
sonst nämlich zunächst die Gleichung a2 = −b2 und daraus den Widerspruch (a · b−1 )2 = −1K , im Falle a 6= 0K entsprechend den Widerspruch
(a−1 · b)2 = −1K . Nun zeigt die Gleichung
(a, b) ◦ (a · (a2 + b2 )−1 , −b · (a2 + b2 )−1 ) = (1K , 0K ) = 1L ,
daß (a, b) in (L r {0L }; ◦) invertierbar ist. Also ist ((L; +̇); ◦) ein Körper. Bezeichnet man das Element (0K , 1K ) mit i und schreibt man für (a, 0K ) ◦ (b, c)
kurz a(b, c), so läßt sich jedes Element von L eindeutig in der Form a1L +̇bi
67
mit a, b ∈ K schreiben.
Im Falle von R als Startkörper wird der hier konstruierte Körper komplexer Zahlkörper genannt. Er ist aufgrund zahlreicher Eigenschaften, die weder ihrer Art nach noch viel weniger hinsichtlich ihrer Relevanz für enorm
viele Kontexte hier diskutiert werden können, eines der zentralen mathematischen Objekte. Doch schon in dem sehr viel bescheideneren“ Fall des
”
Körpers mit 3-elementiger Trägermenge K (s. o.) ergibt sich durch die Konstruktion immerhin die bemerkenswerte Tatsache, daß es einen Körper mit
9 (= 32 ) Elementen gibt. Die weiterführenden Fragen in dieser Richtung sind
ein klassisches Thema der Algebra und werden in der späteren gleichnamigen
Vorlesung ausführlich behandelt.
Nachdem wir damit Ringe und Körper kennengelernt haben, lohnt sich ein
zweiter Blick auf Früheres: Wo wir uns aus Gründen der Konkretheit bzw.
Vertrautheit mit Konzepten unter Bezugnahme auf den rationalen Zahlkörper
((Q; +); ·) beschäftigt haben, läßt sich nämlich häufig Q durch die Trägermenge eines beliebigen kommutativen unitären Ringes K ersetzen, in gewissen
Fällen aber auch nur“ durch die eines Körpers K: Werden in den Nach”
weisen nur die allgemeinen Ringgesetze verwendet, so gilt das Behandelte in
der vollen Allgemeinheit eines beliebigen Ringes; benutzt man jedoch in den
Schlußweisen multiplikativ Inverse von 0 verschiedener Zahlen (d−1 bzw. d1
für d ∈ Qr{0}), so gilt das Behandelte jedenfalls noch für Körper. An keiner
Stelle haben wir die konkrete Gestalt der Elemente von Q als Brüche verwandt, sondern – aus der inzwischen erreichten allgemeineren Optik heraus
– nur Ringgesetze bzw. Körpergesetze.
Einen Körper anstelle des Bereichs der rationalen Zahlen benötigen in Kapitel 0 die Proposition über die elementaren Gleichungssystem-Umformungen
(S. 10), entsprechend auch die Proposition von den elementaren Zeilenumformungen einer Matrix (S. 20) und der Algorithmus durch elementare Zeilenumformungen (S. 21).
Dagegen genügt ein kommutativer unitärer Ring anstelle des Bereichs der rationalen Zahlen im Falle der Bemerkung und des Satzes in Kapitel 0 (S. 16)
sowie in den Beispielen 2.1.1(1), (2), (3), 2.10.2(1), (2) (3). Man beachte aber,
daß bei den abschließenden Aussagen in 2.10.2 Brüche mit dem Nenner 2
gebildet werden. Will man diese also in allgemeinerer Form erhalten, so muß
in dem betrachteten kommutativen unitären Ring ((K; +); ·) zumindest das
Element 1K + 1K (welches ja die Rolle der rationalen Zahl 2 übernimmt)
multiplikativ invertierbar sein. Wir haben schon darauf hingewiesen, daß das
für K = Z nicht der Fall ist (Fußnote 17). Inzwischen kennen wir aber sogar einen Körper, für den dies nicht gilt: In dem oben betrachteten Körper
68
mit 2-elementiger Trägermenge A = {G, U} gilt 1A #1A = U#U = G = 0A ,
nicht invertierbar! Bei einem kommutativen unitären Ring ((K; +); ·), in dem
1K = −1K gilt, fallen die Untergruppen U, V in 2.10.2(2), (3) zusammen.22
22
Unser aus 2 Elementen bestehender Körper ist nur das kleinste aus einer riesigen
Palette von Beispielen dafür.
69
Index
Abbildung, 30
abgeschlossene Teilmenge, 53
abzählbar, 38
abzählbar unendlich, 38
Äquivalenz-Relation, 43
Äquivalenzklasse, 44
Algebra, 64
assoziative, 64
kommutative, 64
unitäre, 64
antisymmetrisch, strikt, 46
Automorphismus, 61
Beweis, indirekter, 18
Bijektion, 31
bijektiv, 31
Bild
einer Menge, 30
eines Elements, 30
Bildmenge, 30
charakteristische Funktion, 34
Definitionsbereich, 30
disjunkt, 33
Distributivgesetz
Links-, 63
Rechts-, 63
Doppelmagma, 64
Einheitengruppe, 55
Eins-Element, 64
Einschränkung, 31
Element von, 3
elementare Zeilenumformung, 20
Endomorphismus, 61
Epimorphismus, 61
Faktor
direkter, 60
Faktorgruppe, 56
Familie, 39
Folge
allgemeine, 39
Standard-, 39
Funktion, 30
gleichmächtig, 31
Gleichungssystem
homogenes, 15
inhomogenes, 15
Gruppe, 52
abelsche, 52
symmetrische, 52
Halbgruppe, 50
Hauptdiagonale (einer Matrix), 19
Hintereinanderausführung, 35
Homomorphismus, 61
idempotent, 54
Identität, 31
Indizierung, 39
injektiv, 31
inverses Element, 50
invertierbar, 50
isomorph, 61
Isomorphismus, 59, 61
kanonische Projektion, 34
70
Kette, 47
Kleiner-Relation, 41
Körper, 64
Komplement, mengentheoretisches, 26
komplexer Zahlkörper, 67
Komponente
eines Urpaars, 29
eines n-Tupels, 39
Komposition, 34
Kongruenz, 42
leere Menge, 18
Magma, 50
assoziatives, 50
kommutatives, 50
unitäres, 50
Matrix
(M × N)-, (m × n)-, 40
quadratische, 19
mengentheoretische Differenz, 26
Monoid, 50
Monomorphismus, 61
Nachbereich, 30
Negation, 7
neutrales Element, 49
nicht (log.), 7
Normalteiler, 56
Null-Element, 64
oder (log.), 8
Ordnung, 46
strikte, 46
teilweise, 47
Paar, geordnetes, 39
Partition, 33
Permutation, 52
Potenzmenge, 26
Produkt
cartesisches, 39
direktes, 59
reflexiv, 42
Relation, 41
Repräsentant, 44
Restriktion, 31
Ring, 64
Semigruppe, 50
Spalte einer Matrix, 40
Standardskalarprodukt, 48
Striktordnung, 46
lineare, 46
totale, 46
Summand
direkter, 60
Summe
direkte, 59
surjektiv, 31
symmetrisch, 42
TeilGruppe, 54
Halbgruppe, 54
Magma, 54
Monoid, 54
Teiler-Relation, 42
Teilmenge von, 7
Teilmengenfunktion, 32
Trägergruppe, 64
Trägermenge, 50
transitiv, 42
Tupel, 39
Umkehrfunktion, 36
Umkehrung, 32
und (log.), 7
UnterGruppe, 54
Halbgruppe, 54
Magma, 54
Monoid, 54
71
Urbild, vollständiges, 32
Urpaar, 29
vergleichbar, 46
Verknüpfung
assoziative, 49
auf einer Menge, 48
distributive, 63
kommutative, 49
zwischen Mengen, 48
Vorbereich, 30
Wertemenge, 30
Zeile einer Matrix, 40
Zeilenstufenform einer Matrix, 22
verfeinerte, 23
Zerlegung
2-teilige direkte, 60
triviale direkte, 60
72
Herunterladen