Springer-Lehrbuch Springer-Verlag Berlin Heidelberg GmbH Siegfried Bosch lineare Algebra Springer Professor Dr. Siegfried Bosch Universităt Miinster Mathematisches Institut EinsteinstraBe 62 48149 Miinster, Deutschland e-mai!: [email protected] Mathematics Subject Classification (2000): 15-01 Die Deutsche Bibliothek - CIP-Einheitsaufnahme Bosch, Siegfried: Lineare Algebra / Siegfried Bosch. (Springer-Lehrbuch) ISBN 3-540-41853-9 ISBN 978-3-540-41853-5 ISBN 978-3-662-08378-9 (eBook) DOI 10.1007/978-3-662-08378-9 Dieses Werk ist urheberrechtlich geschiilzt. Die dadurch begriindeten Rechte, insbesondere die der Ubersetzung, des Nachdrucks. des Vortrags. der Entnahmevon Abbildungen und TabelIen. der Funksendung, der MikroverfiImung oder der Vervielfâltigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen. bleiben. auch bei nur auszugsweiser Verwertung. vorbehalten. Eine Vervielfâltigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zuHissig. Sie ist grundsătzlich vergiitungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. http://www.springer.de © Springer-Verlag Berlin Heidelberg 2001 UrspriingIich erschienen bei Springer-Verlag Berlin HeideIberg New York 2001 Die Wiedergabe von Gebrauchsnamen, Handelsnamen. Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme. daB solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wăren und daher von jedermann benulzt werden diirften. Satz: Datenerstellung durch den Autor unter Verwendung eines TEX-Makropakets Einbandgestaltung: design & production GmbH, Heidelberg Gedruckt auf săurefreiem Papier SPIN: 10831445 44/3142Ck - 5 43 2 1 o Vorwort Die Mathematik ist eine Wissenschaft, die sich heutzutage in einem ăuBerst und schillernden Gewand prăsentiert. Daher stellt sich zwangslău­ fig die Frage, welche Bereiche fiir die ersten Schritte im Vordergrund stehen sollten, wenn man ein Studium der Mathematik aufnehmen mochte. Natiirlich hat sich die Art der Ausbildung mit der Zeit gewandelt. In kontinuierlicher Weise sind grundlegende Einsichten, die im Rahmen der Erforschung aktueller Probleme zutage getreten sind, mit in die Lehre eingeflossen. Dabei geht es in der Mathematik keineswegs um komplizierte Details, sondern vielmehr um oftmals wiederkehrende tragende Grundmuster, die sich als wichtig erwiesen haben und die ihrerseits bereits auf elementarem Niveau an sinnvollen Beispielen studiert werden konnen. So hat es sich bewăhrt, die Mathematikausbildung an Universităten mit je einer Einfiihrung in die Infinitesimalrechnung und die Lineare Algebra zu beginnen, meist in zwei getrennten Vorlesungen. Beide Gebiete ergănzen sich gegenseitig und beinhalten in idealer Weise eine Vielzahl interessanter mathematischer Grundmuster. Ja, man kann mit Recht sagen, daB die Methoden der Infinitesimalrechnung und der Linearen Algebra grundlegend fiir so gut wie alle anderen Bereiche der Mathematik sind. Der Text dieses Bandes rcprăsentiert das Pensum einer zwei-semestrigen Einfiihrungsvorlesung zur Linearen Algebra, eine Vorlesung, die ich mehrfach an der Universităt Miinster gehalten habe. Die meisten Studierenden verfiigen bereits iiber gewisse Vorkenntnisse zur Linearen Algebra, wenn sie sich fiir ein Mathematikstudium entscheiden, etwa was die Vektorrechnung oder das Losen linearer Gleichungssysteme angeht. Sie sind dagegen aller Erfahrung nach weniger mit den allgemeinen Begriffsbildungen der Linearen Algebra vertraut, die diese Theorie so universell einsatzfăhig machen. Man kann sicherlich sagen, daB diese abstrakte Seite der Linearen Algebra fiir viele Studierende neue und ungewohnte Schwierigkeiten aufwirft. Ich habe mich dafiir entschieden, diese Schwierigkeiten nicht zu kaschieren, sondern ihre Uberwindung gezielt in den Vordergrund zu stellen. Deshalb wird in diesem Text von Anfang an groBer Wert auf eine klare und systematische, aber dennoch behutsame Entwicklung der in der Linearen Algebra iiblichen theoretischen Begriffsbildungen gelegt. Ad-hocLosungen, die bei spăteren Uberlegungen oder Verallgemeinerungen revidiert werden miiBten, werden nach Moglichkeit vermieden. Erst wenn die theoretische Seite eines Themenkomplexes geklărt ist, erfolgt die Behandlung der zugeMrigen Rechenverfahren, unter Ausschopfung des vollen Leistungsumfangs. vielfăltigen VI Vorwort Nun ist allerdings eine Theorie wie die Lineare Algebra, die sich in betrăchtlichem MaBe von ihren ursprunglichen geometrischen Wurzeln entfernt hat, nur schwerlich zu verdauen, wenn nicht gleichzeitig erklărt wird, warum man in dieser oder jener Weise vorgeht, was die zugeharige Strategie ist, oder an welche Hauptanwendungsfălle man mit einer gewissen Definition denkt. Um solche Fragen abzudecken, wird in einer Vorlesung neben der rein stofflichen Seite in erheblichem MaBe auch das zugeharige motivierende Umfeld erlăutert. In Lehrbuchern ist diese Komponente oftmals nur in geringem MaBe realisiert, da ansonsten ein permanenter Wechsel zwischen der logisch-stringenten mathematischen Vorgehensweise und mehr oder weniger heuristisch-anschaulichen Uberlegungen erforderlich wăre, was natiirlich fur die Einheitlichkeit und Ubersichtlichkeit der Darstellung nicht farderlich ist. In dem vorliegenden Text wird nun jedes Kapitel mit einer Reihe von "Vorbemerkungen" eingeleitet, deren ZieI es ist, das motivierende Umfeld des jeweiligen Kapitels zu beleuchten. Ausgehend vom momentanen Kenntnisstand eines Lesers werden die zu behandelnden Hauptfragestellungen einschlieBlich des zugeharigen geometrischen Hintergrunds (soweit gegeben) erlăutert und daruber hinaus magliche Lasungsansătze und Lasungsstrategien, die Art der erhaltenen Lasung, wie auch die hiermit verbundenen Schwierigkeiten diskutiert. Es wird empfohlen, die Vorbemerkungen wăhrend des Studiums eines Kapitels je nach Bedarf mehrfach zu konsultieren, um graBtmaglichen Nutzen aus ihnen zu ziehen. Ausdrucklich machte ich aber darauf hinweisen, daB es sich bei diesen EinfUhrungen zu einem groBen Teil um Plausibilitătsbetrachtungen handelt. Diese sind daher nicht mit der ublichen mathematischen Prăgnanz abgefaBt, und sie sind infolgedessen auch nicht Teil des eigentlichen Lehrstoffes. Der stoffliche Umfang des Buches bietet nur wenig Besonderheiten. Es werden Vektorrăume und ihre linearen Abbildungen, Matrizen unei lineare Gleichungssysteme, Determinanten, Polynome, Eigenwert- und Normalformentheorie sowie euklidische und unităre Vektorrăume behandelt. Ein Abschnitt uber ăuBere Produkte (mit einem Stern * gekennzeichnet), in dem als Anwendung der allgemeine Laplacesche Entwicklungssatz fUr Determinanten bewiesen wird, ist optional. Die Herleitung der Normalformen fUr Endomorphismen von Vektorrăumen erfolgt, der Gesamtstrategie des Buches folgend, im Rahmen von Moduln uber Hauptidealringen, wobei solche Moduln allerdings erst zu Beginn von Abschnitt 6.3 eingefUhrt werden. Wer sich hier auf die elementare Seite der Normalformentheorie beschrănken machte, kann im AnschluB an die Abschnitte 6.1 (Eigenwerte und Eigenvektoren) und 6.2 (Minimalpolynom und charakteristisches Polynom) auch gleich zu den euklidischen und unităren Vektorrăumen in Kapitel 7 ubergehen. Zum SchluB bleibt mir noch die angenehrne Aufgabe, fUr die rnannigfache Hilfe zu danken, die ich beim Schreiben dieses Buches erfahren habe. Meine Harer, denen fruhere Versionen des Textes als Vorlesungsskript zur VerfUgung standen, haben mich auf manche Unstimrnigkeit aufmerksam gemacht und mir eine Reihe von Verbesserungsvorschlăgen genannt. Mein Sohn Thomas hat mieh dazu ermutigt, aus dem Skript nun doch endlieh einmal ein Bueh entstehen zu Vorwort VII lassen. Frau G. Hakuba hat mir geholfen, einige Măngel in der Texterfassung zu beheben. Herr Dr. S. Engelhard, Herr A. John und teilweise auch Herr M. Jacob haben das Manuskript in kritischer Weise durchgesehen. Herrn Engelhard und Herrn Kollegen Prof. Dr. J. Elstrodt danke ich ftir eine Reihe ntitzlicher Vorschlăge und Ideen. SchlieBlich gilt mein Dank dem Springer-Verlag, der ftir eine makellose Herstellung dieses Bandes gesorgt hat, und hier ganz besonders Herrn C. Heine, der mir eine detaillierte Liste mit Anmerkungen eines (mir unbekannten) Referenten hat zukommen lassen. Auch diesem Referenten danke ich fUr seine hilfreichen Hinweise und Anregungen. Mtinster, im Mai 2001 Siegfried Bosch Inhalt 1 Vektorraume . . . . . . . . . . 1.1 Mengen und Abbildungen 1.2 Gruppen... 1.3 K6rper........... 1.4 Vektorraume........ 1.5 Linear unabhangige Systeme und Basen von Vektorraumen 1.6 Direkte Summen 1 9 12 16 25 31 43 2 Lineare Abbildungen . 2.1 Grundbegriffe.. 2.2 Quotientenvektorraume. 2.3 Der Dualraum . 49 55 63 73 3 Matrizen . . . . . . 83 3.1 Lineare Abbildungen und Matrizen 88 3.2 Das GauBsche Eliminationsverfahren und der Rang einer Matrix 97 3.3 Matrizenringe und invertierbare Matrizen . 107 3.4 Basiswechsel........ 113 3.5 Lineare Gleichungssysteme 117 4 Determinanten . . . . . . . . . 4.1 Permutationen . . . . . . 4.2 Determinantenfunktionen 4.3 Determinanten von Matrizen und Endomorphismen 4.4 Die Cramersche Regel 4.5 ĂuBere Produkte* . 127 130 135 140 147 150 5 Polynome . . . . . . . . 5.1 Ringe . . . . . . . 5.2 Teilbarkeit in Integritatsringen . 5.3 Nullstellen von Polynomen 161 162 172 181 6 Normalformentheorie . . . . . 6.1 Eigenwerte und Eigenvektoren 6.2 Minimalpolynom und charakteristisches Polynom 185 188 195 X Inhalt 6.3 Der Elementarteilersatz. . . . . . . . . . . . . . . . . 6.4 Endlich erzeugte Moduln liber Hauptidealringen . . . 6.5 Allgemeine und Jordansche Normalform fUr Matrizen 202 214 219 235 238 7 Euklidische und unitii.re Vektorrăume 7.1 Sesquilinearformen . . . . . . . . 7.2 Orthogonalităt . . . . . . . . . . 7.3 Sesquilinearformen und Matrizen 7.4 Die adjungierte Abbildung . . . . 7.5 Selbstadjungierte Abbildungen, Isometrien 261 Symbolverzeichnis . . . . . . 273 Namen- und Sachverzeichnis 279 243 250 255 1. Vektorrăume Vorbemerkungen Konkrete geometrische Fragestellungen in der Ebene oder im drei-dimensionalen Raum waren vielfach Ausgangspunkt bedeutender mathematischer Entwicklungen. Als Hilfsmittel zur Behandlung solcher Fragen wurden beispielsweise geometrische Konstruktionsverfahren mittels Zirkel und Lineal entwickelt. Eine andere Strategie besteht darin, geometrische Fragen in rechnerische Probleme umzusetzen, um durch "Ausrechnen" zu Lasungen zu gelangen. Dies ist das Vorgehen der analytischen Geometrie, die 1637 von Rene Descartes in seinem beriihmten Werk "La Geometrie" begriindet wurde. Ein GroBteil der rechnerischen Methoden der analytischen Geometrie wiederum wird heute in erweiterter Form unter dem Begriff der Linearen Algebra zusammengefaBt. Wir wollen im folgenden etwas năher auf die grundlegenden Ideen des Descartes'schen Ansatzes eingehen. Hierzu betrachten wir eine Ebene E (etwa in dem uns umgebenden drei-dimensionalen Raum), zeichnen einen Punkt von E als sogenannten Nullpunkt O aus und wăhlen dann ein Koordinatensystem mit Koordinatenachsen x und y, die sich im Nullpunkt O schneiden. Identifizieren wir die Achsen x und y jeweils noch mit der Menge ~ der reellen Zahlen, so lassen sich die Punkte P von E als Paare reeller Zahlen interpretieren: y YI .......... 0 P = Xl (Xl, yt) X In der Tat, ist P ein Punkt in E, so konstruiere man die Parallele zu y durch P. Diese schneidet die Achse X in einem Punkt Xl. Entsprechend schneidet die Parallele zu X durch P die Achse y in einem Punkt yl, so daB man aus P das Koordinatenpaar (Xl, YI) erhălt. Umgekehrt IăBt sich P aus dem Paar (Xl, YI) in einfacher Weise zuriickgewinnen, und zwar als Schnittpunkt der Parallelen zu Y durch Xl und der Parallelen zu X durch Yl. Genauer stellt man fest, daB die Zuordnung P f--t (Xl, Yl) eine umkehrbar eindeutige Beziehung zwischen S. Bosch, Lineare Algebra © Springer-Verlag Berlin Heidelberg 2001 2 1. Vektorrăume den Punkten von E und den Paaren reeller Zahlen darstellt und man deshalb wie behauptet eine Identifizierung E = ~2 = Menge aller Paare reeller Zahlen vornehmen kann. Natiirlich hăngt diese Identifizierung von der Wahl des Nullpunktes Osowie der Koordinatenachsen x und Y ab. Wir haben in obiger Abbildung ein rechtwinkliges Koordinatensystem angedeutet. Im Prinzip brauchen wir jedoch an dieser Stelle noch nichts iiber Winkel zu wissen. Es geniigt, wenn wir als Koordinatenachsen zwei verschiedene Geraden x und Y durch den Nullpunkt Overwenden. Genaueres hierzu werden wir noch in den Vorbemerkungen zu Kapitel 2 besprechen. Es solI nun auch die Identifizierung der beiden Koordinatenachsen x und Y mit der Menge ~ der reellen Zahlen noch etwas genauer beleuchtet werden. Durch Festlegen des Nullpunktes ist auf x und Y jeweils die Streckungsabbildung mit Zentrum O und einer reellen Zahl als Streckungsfaktor definiert. Wăhlen wir etwa einen von O verschiedenen Punkt Ix E x aus und bezeichnen mit a· Ix das Bild von Ix unter der Streckung mit Faktor a, so besteht x gerade aus allen Punkten a·I x , wobei adie reellen Zahlen durchlăuft. Genauer k6nnen wir sagen, daB die Zuordnung a f----+ a· Ix eine umkehrbar eindeutige Beziehung zwischen den reellen Zahlen und den Punkten van x erklărt. Nach Auswahl je eines von O verschiedenen Punktes Ix E x und entsprechend Iy E Y sind daher x und Y auf natiirliche Weise mit der Menge ~ der rellen Zahlen zu identifizieren, wabei die Punkte O, Ix E x bzw. O, Iy E Y den reellen Zahlen O und 1 entsprechen. Die M6glichkeit der freien Auswahl der Punkte Ix E x und ly E Y wie auch die Verwendung nicht natwendig rechtwinkliger Kaardinatensysteme machen allerdings auf ein Problem aufmerksam: Der Abstand van Punkten in E wird unter der Identifizierung E = ~2 nicht notwendig dem auf ~2 iiblichen euklidischen Abstand entsprechen, der fiir Punkte PI = (XI, YI) und P2 = (X2, Y2) durch d(PI, P2) = V(XI - X2)2 + (YI - Y2)2 gegeben ist. Eine korrekte Reflektierung van Abstănden auf E ist jedach mit Hilfe der spăter nach zu diskutierenden Skalarprodukte moglich. In der Mathematik ist man stets darum bestrebt, bei der Analyse von Phănamenen und Problemen, fiir die man sich interessiert, zu gewissen "einfachen Grundstrukturen" zu gelangen, die fiir das Bild, das sich dem Betrachter bietet, verantwortlich sind. SolchermaBen als wichtig erkannte Grundstrukturen untersucht man dann oftmals 10sge16st von der eigentlichen Problematik, um herauszufinden, welche Auswirkungen diese haben; man spricht von einem Modell, das man untersucht. Modelle haben den Vorteil, daB sie in der Regel leichter zu iiberschauen sind, aber manchmal auch den Nachteil, daB sie den eigentlich zu untersuchenden Sachverhalt moglicherweise nur in Teilaspekten beschreiben konnen. In unserem Falle liefert der Descartes'sche Ansatz die Erkenntnis, daB Punkte von Geraden, Ebenen ader des drei-dimensianalen Raums mittels Kaardinaten zu beschreiben sind. Hierauf gesttitzt konnen wir, wie wir gesehen haben, Vorbemerkungen 3 die Menge JR2 aller Paare reeller Zahlen als Modell einer Ebene ansehen. Entsprechend bildet die Menge JR3 aller Tripel reeller Zahlen ein Modell des dreidimensionalen Raums, sowie naturlich JR = JRl ein Modell einer Geraden. Die Untersuchung solcher Modelle fuhrt uns zum zentralen Thema dieses Kapitels, nămlich zu den Vektorrăumen. Vektorrăume beinhalten als fundamentale Struktur zwei Rechenoperationen, zum einen die Multiplikation von Skalaren (in unserem Falle reellen Zahlen) mit Vektoren, was man sich als einen StreckungsprozeB vorstellen kann, und zum anderen die Addition von Vektoren. Wir wollen dies mit den zugehărigen geometrischen Konsequenzen einmal am Beispiel einer Ebene E und ihrem ModellJR2 erlăutern. Wir beginnen mit der skalaren Multiplikation. Fur a E JR, bezeichnet man mit das Produkt von a und P, wobei sich in E folgendes Bild ergibt: y 0p Die Multiplikation von Punkten PE Emit einem Skalar a E lR ist folglich zu interpretieren als Streckungsabbildung mit Streckungszentrum O und Streckungsfaktor a. Besonders instruktiv lăBt sich dies beschreiben, wenn man die Punkte P E E als "Vektoren" im Sinne gerichteter Strecken oF auffaBt. Vektoren sind somit charakterisiert durch ihre Lănge und ihre Richtung (auBer fUr den Nullvektor 00, der keine bestimmte Richtung besitzt). Der Vektor a· oF geht dann aus oF hervor, indem man ihn mit a streckt, d. h. seine Lănge mit a (oder, besser, mit dem Betrag laI) multipliziert und ansonsten die Richtung des Vektors beibehălt bzw. invertiert, je nachdem ob a 2': O oder a < O gilt: y 4 1. Vektorrăume Als weitere Rechenoperation betrachten wir die Addition von Punkten in JR2. Fiir setzt man was in E mittels folgender Skizze verdeutlicht werden mbge: y x Auch die Beschreibung der Addition in E gestaltet sich instruktiver, wenn man den Vektorstandpunkt im Sinne gerichteter Strecken zugrundelegt. Allerdings sollte man dabei zulassen, daB Vektoren als gerichtete Strecken parallel zu sich selbst verschoben und somit vom Koordinatenursprung als ihrem natiirlichen FuBpunkt gelbst werden kbnnen. Die Summe der Vektoren OFI und OF2 ergibt sich dann als Vektor OF, wobei P derjenige Endpunkt ist, den man erhălt, indem man beide Vektoren miteinander kombiniert, also den Vektor OFI in O anlegt und den Vektor OF2 im Endpunkt PI von OFI , etwa wie folgt: y Dabei zeigt die obige Parallelogrammkonstruktion, daB sich das Ergebnis der Addition nicht ăndert, wenn man alternativ den Vektor OF2 in O anlegt und Vorbemerkungen 5 ansehlieBend den Vektor OPI im Endpunkt von aP2 • Die Addition von Vektoren hăngt daher nicht von der Reihenfolge der Summanden ab, sie ist kommutativ. Es mag etwas verwirrend wirken, wenn wir die Elemente des JR2 einerseits als Punkte, sowie andererseits aueh als (versehiebbare) Vektoren im Sinne geriehteter Strecken interpretieren. Im Prinzip konnte man eine begrifHiche Trennung zwisehen Punkten und Vektoren vornehmen, indem man den einem Punkt PE JR2 zugeordneten Vektor OF als Translation Q ~ P+Q interpretiert, d. h. als Abbildung von JR2 nach lR.2, die einem Element Q E JR2 das Element P + Q als Bild zuordnet. Wir wollen von dieser Mogliehkeit allerdings keinen Gebraueh machen, da eine Trennung der Begriffe fUr unsere Zweeke keine Vorteile bringt und die Dinge lediglieh komplizieren wiirde. Als năehstes wollen wir besprechen, daB die Addition von Punkten und Vektoren in JR2 bzw. E auf natiirliche Weise aueh eine Subtraktion nach sieh zieht. Fur Po = (xo, Yo) E JR2 setzt man -Po = -(xo,Yo):= (-1)· (xo,Yo) = (-xo,-Yo) und nennt dies das negative oder inverse Element zu Po. Dieses ist in eindeutiger Weise eharakterisiert als Element Q E JR2, welehes der Gleichung Po + Q = O genugt. Die Subtraktion zweier Elelente PI = (XI, YI) und Po = (xo, Yo) in JR2 wird dann in naheliegender Weise auf die Addition zuruekgefUhrt, und zwar dureh Legen wir wieder den Vektorstandpunkt in E zugrunde, so entsteht also - aPo aus dem Vektor OPo dureh Invertieren seiner Riehtung, wobei die Lănge erhalten bleibt. Damit IăBt sich die Differenz zweier Vektoren OPI und OPo wie folgt illustrieren: Y YI Yo Xo Xl X Insbesondere erkennt man, daB die Summe der Vektoren OPo und OPI - aPo gerade den Vektor aPI ergibt, was eine sinnvoll definierte Addition bzw. Subtraktion naturlieh ohnehin leisten sollte. Allgemeiner kann man Summen des Typs 6 1. Vektorraume mit unterschiedlichen Skalaren o: E lR bilden. Der Punkt P liegt dann fUr Po =1- P1 stets auf der Geraden G, die durch Po und P1 festgelegt ist, und zwar durchlăuft P ganz G, wenn o: ganz lR durchlăuft: Yl x Die Gerade in E bzw. lR2 , welche die gegebenen Punkte Po und P1 enthălt, wird daher durch die Gleichung G = {Po + t . (Pl - Po) ; tE lR} beschrieben. Sind zwei solche Geraden G = {Po + t· (Pl - Po); tE lR}, G' = {P~ + t· (Pt - P~); tE lR} mit Po =1- P1 und P~ =1- P{ gegeben, so sind diese genau dann parallel, wenn P1 - Po ein skalares Vielfaches von P{ - P~ ist, bzw. umgekehrt, wenn P{ - P~ ein skalares Vielfaches von P1 - Po ist. Ist letzteres nicht der FalI, so besitzen G und G' genau einen Schnittpunkt, wobei eine Berechnung dieses Schnittpunktes auf die L6sung eines sogenannten linearen Gleichungssystems fuhrt, welches aus 2 Gleichungen mit 2 Unbekannten, nămlich den Koordinaten des Schnittpunktes von G und G' besteht. Die L6sung von Gleichungssystemen dieses Typs wird uns noch ausfUhrlich in Kapitel 3 beschăftigen. Die vorstehenden Uberlegungen lassen sich ohne Probleme auf den dreidimensionalen Raum und sein ModelllR3 verallgemeinern. Beispielsweise ist fUr zwei Punkte Po, P1 E lR3 wiederum G = {Po + t· (Pl - Po); tE lR} die durch Po und P1 bestimmte Gerade im ]R3. Fur Punkte Po, Plo P2 E man mit Pt := Pt - Po und P~ := P2 - Po entsprechend das Gebilde E = {Po betrachten: + s· Pt + t· P~; s, tE lR} ]R3 kann Vorbemerkungen 7 E o Wenn P{ kein Vielfaches von P~ und P~ kein Vielfaches von P{ ist, die Vektoren in O angetragen also nicht auf einer Geraden durch O liegen, so bezeichnet man P{ und P~ als linear unabhăngig. In diesem Falle erkennt man E als Ebene, ansonsten als Gerade oder auch nur als Punkt. Da die Vektoren P{ und P~ hier eine entscheidende Rolle spielen, sollten wir auch das Gebilde E' = {s . P{ + t . P~ ; s, t E lR} betrachten, welches durch Verschieben von E um den Vektor - OF entsteht: Im Rahmen der Vektorrăume nennt man E' den von P{ und P~ aujgespannien oder erzeugten linearen Unterrraum von lR3 . Allgemeiner kann man im lR 3 den von beliebig vielen Vektoren QI, ... ,Qr erzeugten linearen Unterraum U = {tIQI + ... + trQr; tl, ... ,tr E lR} betrachten. Fiir einen Vektor Q E ]R3 sagt man, daf3 Q linear van QI, ... ,Qr abhăngt, falls Q E U gilt. Folgende Fălle sind moglich: Fiir QI = ... = Qr = O besteht U nur aus dem Nullpunkt O. Ist aber einer der Vektoren Ql, ... ,Qr von O verschieden, etwa QI -=1- O, so enthălt U zumindest die durch QI gegebene Gerade G = {tQI; t E lR}. Gehoren auch Q2, ... ,Qr zu G, d. h. sind Q2, ... ,Qr linear abhăngig von QI, so stirnmt U mit G iiberein. Ist letzteres nicht der Fall und gilt etwa Q2 rf. G, so spannen QI und Q2 die Ebene E = {tI QI + t2Q2 ; tI, t 2 E ]R} auf, so daB U zumindest diese Ebene enthălt. Im Falle Q3, ... ,Qr E E, also wenn Q3,··· ,Qr linear von Ql, Q2 abhăngen, stirnmt U mit E iiberein. Ansonsten gibt es einen dieser Vektoren, etwa Q3, der nicht zu E geMrt. Die Vektoren QI, Q2, Q3 bilden dann sozusagen ein Koordinatensystem im ]R3, und man sieht daB U mit ganz lR3 iibereinstimmt, daB 8 1. Vektorrăume also alle Vektoren im jR3 linear von Ql, Q2, Q3 abhangen. Insbesondere ergibt sich, daB ein linearer Unterraum im jR3 entweder aus dem Nullpunkt, aus einer Geraden durch O, aus einer Ebene durch O oder aus ganz jR3 besteht. Das soeben eingefUhrte Konzept der linearen Abhiingigkeit von Vektoren ist ein ganz zentraler Punkt, der in diesem Kapitel ausfuhrlich im Rahmen der Vektorraume behandelt werden wird. Dabei nennt man ein System von Vektoren Ql, ... ,Qr linear unabhiingig, wenn keiner dieser Vektoren von den rest lichen linear abhiingt. Die oben durchgefUhrte Uberlegung zeigt beispielsweise, daB linear unabhangige Systeme im jR3 aus hOchstens 3 Elementen bestehen. Insbesondere werden uns linear unabhangige Systeme, so wie wir sie im obigen Beispiel fUr lineare Unterraume des jR3 konstruiert haben, gestatten, den Begriff des Koordinatensystems oder der Dimension im Kontext der Vektorraume zu prazisieren. Ais Verallgemeinerung linear unabhangiger Systeme von Vektoren werden wir schlieBlich noch sogenannte direkte Summen von linearen Unterraumen eines Vektorraums studieren. Wir haben bisher im Hinblick auf Vektorraume lediglich die Modelle jRn mit n = 1,2,3 betrachtet, wobei unser geometrisches Vorstellungsvermăgen in erheblichem MaBe bei unseren Argumentationen mit eingeflossen ist. Bei der Behandlung der Vektorraume in den nachfolgenden Abschnitten werden wir jedoch grundsatzlicher vorgehen, indem wir eine Reihe von Verallgemeinerungen zulassen und uns bei der Entwicklung der Theorie lediglich auf gewisse axiomatische Grundlagen stutzen. Zunachst beschranken wir uns bei dem zugrunde liegenden Skalarenbereich nicht auf die reellen Zahlen jR, sondern lassen beliebige Kărper zu. Kărper sind zu sehen als Zahlsysteme mit gewissen Axiomen fUr die Addition und MuItiplikation, die im wesentlichen den Regeln fUr das Rechnen mit den reellen Zahlen entsprechen. So kennt man neben dem Kărper jR der reellen Zahlen beispielsweise den Kărper Ql der rationalen Zahlen wie auch den Kărper eder komplexen Zahlen. Es gibt aber auch Kărper, die nur aus endlich vielen Elementen bestehen. Die Axiome eines Kărpers bauen auf denen einer Gruppe auf, denn ein Kărper bildet mit seiner Addition insbesondere auch eine Gruppe. So werden wir in diesem Kapitel nach gewissen Vorbereitungen uber Mengen zunachst Gruppen studieren, ausgehend von den zugehOrigen Gruppenaxiomen. Wir beschaftigen uns dann weiter mit Kărpern und deren Rechenregeln und gelangen anschlieBend zu den Vektorraumen. Vektorraume sind immer in Verbind ung mit einem entsprechenden Skalarenbereich zu sehen, dem zugehărigen Kărper; man spricht von einem Vektorraum uber einem Kărper K oder von einem K- Vektorraum. Ein K- Vektorraum V ist ausgerustet mit einer Addition und einer skalaren Multiplikation, d. h. fUr a, b E V und a E K sind die Summe a + b sowie das skalare Produkt a· a als Elemente von V erklart. Addition und skalare Multiplikation genugen dabei den sogenannten Vektorraumaxiomen, weIche bezuglich der Addition insbesondere die Gruppenaxiome enthalten. Prototyp eines K-Vektorraums ist fUr eine gegebene naturliche Zahl n die Menge 1.1 Mengen und Abbildungen 9 aller n- Tupel mit Komponenten aus K, wobei Addition und skalare Multiplikation durch (al,'" ,an) + (bl ,.·· ,bn) := (al + bl, ... ,an + bn), a· (al,'" ,an):= (aal,'" ,aan) gegeben sind. Insbesondere wird mit dieser Definition die oben angesprochene Reihe von Modellen jRn fUr n = 1,2,3 auf beliebige Dimensionen n verallgemeinert. Dies hat durchaus einen realen Hintergrund, denn um beispielsweise ein Teilchen im drei-dimensionalen Raum in zeitlicher Abhăngigkeit zu beschreiben, benotigt man neben den 3 răumlichen Koordinaten noch eine zusătzliche zeitliche Koordinate, so daB man sich im Crunde genommen im Vektorraum jR4 bewegt. In analoger Weise lassen sich Paare von Punkten im drei-dimensionalen Raum als Punkte des jR6 charakterisieren. 1.1 Mengen und Abbildungen Folgende Mengen werden wir in natiirlicher Weise als gegeben annehmen: o= leere Menge, N = {O, 1,2, ... } natiirliche Zahlen, Z = {O, ±1, ±2, ... } ganze Zahlen, Ql = {p/q; p, q E Z, q =1- O} rationale Zahlen, jR = reelle Zahlen. Es sei darauf hingewiesen, daB bei einer Menge, sofern wir sie in aufzăhlender Weise angeben, etwa X = {Xl"" ,Xn }, die Elemente Xl, ... ,Xn nicht notwendig paarweise verschieden sein miissen. Diese Konvention gilt auch fiir unendliche Mengen; man vergleiche hierzu etwa die obige Beschreibung von Ql. Wichtig fUr die Handhabung von Mengen sind gewisse Prozesse der Mengenbildung, auf die wir nachfolgend eingehen. (1) Teilmengen. - Es sei X eine Menge und P(x) eine Aussage, deren Ciiltigkeit (wahr oder falsch) man fUr Elemente X E X testen kann. Dann nennt man y = {x E X; P(x) ist wahr} ei ne Teilmenge von X und schreibt Y c X. Dabei ist auch Y = X zugelassen. Cilt allerdings Y =1- X, so nennt man Y eine echte Teilmenge von X. Beispielsweise ist jR>o := {x E jR; X> O} ei ne (echte) Teilmenge von R Fiir eine gegebene Menge X bilden die Teilmengen von X wiederum eine Menge, dic sogenannte Potenzmenge IŢ)(X). (2) Vereinigung und Durchschnitt. - Es sei X eine Menge und 1 eine Indexmenge, d. h. eine Menge, deren Elemente wir als Indizes verwenden wollen. Ist dann fiir jedes iEI eine Teilmenge Xi C X gegeben, so nennt man UXi := {X E X; es existiert ein iEI mit X E Xi} iEI 10 1. Vektorraume die Vereinigung der Mengen Xi, iEI, sowie n iEI Xi := {X E X ; X E Xi fUr alle iEI} den Durchschnitt dieser Mengen, wobei wir in beiden Făllen wiederum eine Teilmenge von X erhalten. Im Falle einer endliehen Indexmenge 1 = {1, ... , n} sehreibt man aueh Xl U .. . UXn statt UiEI Xi sowie Xl n ... nXn statt niEIXi. Zwei Teilmengen X', X" c X werden als disjunkt bezeiehnet, wenn ihr Durehsehnitt leer ist, also X' n X" = 0 gilt. Als Variante zur Vereinigung von Mengen Xi, iEI, kann man deren disjunkte Vereinigung IliEI Xi bilden. Hierunter versteht man die Gesamtheit aller Elemente, die in irgendeiner der Mengen Xi enthalten sind, wobei man allerdings fUr versehiedene Indizes i, j E 1 die Elemente von Xi als versehieden von allen Elementen aus X j ansieht. (3) Differenz von Mengen. - Sind Xl, X 2 Teilmengen einer Menge X, so heiBt die Differenz von Xl und X 2 . Aueh dies ist wieder eine Teilmenge von X, sogar von Xl. (4) Kartesisehes Produkt von Mengen. - Es seien Xl, ... , X n Mengen. Dann heiBt n II Xi := {(Xl> ... , X n ); Xl E Xl> ... , X n E Xn} i=l das karlesische Produkt der Mengen Xl, ... , X n , wobei man fUr dieses Produkt aueh die Notation Xl x ... X X n verwendet bzw. X n , falls Xl = ... = X n = X gilt. Die Elemente (Xl> ... , x n ) werden als n- Tupel mit Komponenten Xi E Xi, i = 1, ... , n, bezeiehnet. Es gilt genau dann (Xl, ... , x n ) = (x~, ... , x~) fur zwei n- Tupel, wenn man Xi = X~ fUr i = 1, ... , n hat. In ăhnlieher Weise IăBt sieh fUr eine Indexmenge 1 das kartesisehe Produkt iliEI Xi von gegebenen Mengen Xi, iEI, bilden. Man sehreibt die Elemente eines solchen Produktes als Familien (Xi)iEI von Elementen Xi E Xi und meint damit Tupel, deren Eintrăge mittels 1 indiziert werden. Sind die Xi Exemplare ein und derselben Menge X, so verwendet man statt iliEI Xi aueh die Notation Xl. Als năehstes kommen wir auf den Begriff der Abbildung zwisehen Mengen zu spreehen. Definition 1. Eine Abbildung f: X ----+ Y zwischen zwei Mengen X und Y ist eine Vorschrift, welche jedem X E X ein wohlbestimmtes Element y E Y zuordnet, das dann mit f(x) bezeichnet wird; man schreibt hierbei auch X 1----+ f(x). Dabei heiftt X der Definitionsbereieh und Y der Bild- oder Wertebereieh der Abbildung f. 1.1 Mengen und Abbildungen 11 Zu einer Menge X gibt es stets die identische Abbildung id x : X -----t X, x. Im iibrigen kann man beispielsweise ein kartesisches Produkt des Typs Xl auch als Menge aller Abbildungen 1 -----t X interpretieren. Im folgenden sei f: X -----t Y wieder eine Abbildung zwischen zwei Mengen. Ist g: Y -----t Z eine weitere Abbildung, so kann man f mit 9 komponieren; man erhălt als Resultat die Abbildung X 1----+ 9 of: X -----t Z, X 1----+ g(f(x)). Fiir Teilmengen M C X und N C Y bezeichnet man f(M) := {y E Y; es exist iert ein x E M mit y = f(x)} als das Bild von M unter r f sowie 1(N) := {x E X; f(x) E N} als das Urbild von N unter f; es handelt sich hierbei um Teilmengen von Y bzw. X. Besteht N aus nur einem einzigen Element y, also N = {y}, so schreibt man f-l(y) anstelle von f-l({y}). Weiter nennt man f injektiv, wenn aus x,x' E X mit f(x) = f(x') stets x = x' folgt, und surjektiv, wenn es zu jedem y E Y ein x E X mit f(x) = y gibt. SchlieBlich heiBt f bijektiv, wenn f injektiv und surjektiv zugleich ist. Man kann sagen, daB f genau dann injektiv ist, wenn das Urbild f-l(y) eines jeden Punktes y E Y entweder leer ist oder aus genau einem Punkt x E X besteht. Weiter ist f genau dann surjektiv, wenn fiir jedes y E Y das Urbild f-1(y) nicht leer ist. Somit ist f genau dann bijektiv, wenn fiir jedes Element y E Y das Urbild f-1(y) aus genau einem Punkt x besteht. Man kann dann zu f die sogenannte Umkehmbbildung g: Y -----t X betrachten. Sie ordnet einem Punkt y E Y das eindeutig bestimmte Element x E j-l(y) zu, und es gilt 9 o f = id x sowie j o 9 = id y . Statt g: Y -----t X schreibt man meist auch j-1: Y -----t X. Aufgaben 1. Es seien A, B, C Teilmengen einer Menge X. Man zeige: (i) (ii) (iii) (iv) An (B U C) = (A n B) U (A n C) Au (B n C) = (A U B) n (A U C) A - (B U C) = (A - B) n (A - C) A - (B n C) = (A - B) U (A - C) 2. Es sei f: X --+ Y eine Abbildung zwischen Mengen. Man zeige fUr Teilmengen M1,M2 C X und N 1,N2 C Y: (i) f(M 1 U M 2 ) = f(Md U f(M2 ) (ii) f(M1 n M 2 ) c f(Md n f(M2 ) 1 (N2) 1 (N1 U N2) = 1 (Nl) U (iii) r r r