Inverse Probleme PD Dr. Swanhild Bernstein, TU Bergakdemie Freiberg, Sommersemester 2007 Inhaltsverzeichnis Kapitel 1. Inverse Probleme und Fourier Transformation 1. Magnet-Resonanz-Tomographie 1.1. Grundprinzip 1.2. Mathematisches Modell 2. Fourier-Transformation 3. Inverse Streutheorie 4. Korrekt gestellte Probleme 4.1. Korrektheit linearer Probleme in Banachraumen 5. Sobolev-Raume und inkorrekt gestellte Probleme 5.1. Seil unter Eigenlast 5.2. Exponentielles Wachstum 5.3. Korrektheit inverser Probleme auf kompakten Mengen 5.4. Sobolev-Raume und kompakte Einbettungen 6. Computertomographie und Radon-Transformation 6.1. Das 2D-Problem 6.2. Die Radon-Transformation im R2 6.3. Inversionsformel fur die 2D Radon-Transformation 6.4. Die Radon-Transformation im R3 und Inversionsformel 7. Das Cauchy-Problem, Elektrokardiographie 7.1. Halbraum-Problem 7.1.1. Elektrokardiograsche Anwendung 7.1.2. Analytische Fortsetzung 7.2. Der allgemeine 2D-Fall 7.2.1. Die Laplace-Gleichung im Kreisring 7.2.2. Riemannscher Abbildungssatz 5 5 5 8 10 12 14 15 17 17 21 22 23 26 26 28 31 35 37 39 39 41 42 42 44 Kapitel 2. Identikationsprobleme in Hilbert-Raumen 1. Einige Grundbegrie der Hilbert-Raum-Theorie 1.1. Eigenschaften beschrankter linearer Operatoren in Hilbert-Raumen 1.2. Verallgemeinerte oder Moore-Penrose-Inverse 47 48 50 55 Kapitel 3. Regularisierungsmethoden 1. Heuristischer Zugang 2. Ein allgemeines Regularisierungsschema 2.1. Wahl des Regularisierungsparameters 2.2. Regularisierungsverfahren 2.3. Tikhonov-Regularisierung 2.4. Diskrepanzprinz 61 61 64 65 66 68 71 3 4 INHALTSVERZEICHNIS 2.5. Prinzip der Quasioptimalitat 2.6. Weitere Regularisierungsmethoden 2.6.1. Landweber-Iteration 2.6.2. Asymptotische Regularisierung 3. Anwendung der Tikhonov-Regularisierung auf nichtlineare Operatorgleichungen 3.1. Frechet-Ableitung 3.2. Parameteridentikation 3.3. Regularisierung nichtlinearer Operatorgleichungen 3.3.1. Diskretisierung 3.3.2. Levenberg-Marquardt-Methode 3.3.3. Nichtlineare Tikhonov-Regularisierung 75 79 79 82 83 83 85 86 86 87 88 KAPITEL 1 Inverse Probleme und Fourier Transformation In diesem Kapitel werden zunachst zwei Beispiele fur inverse Probleme eingefuhrt. Diese Probleme konnen mit Hilfe der Fourier-Transformation gelost werden. 1. Magnet-Resonanz-Tomographie 1.1. Grundprinzip. Entnommen aus: Wikipedia http://de.wikipedia.org/wiki/Magnetresonanztomographie sowie von der FH Hagenberg in Osterreich http://webster.fh-hagenberg.at/sta/wbackfri/Teaching/MBV/Vorlesung/Tomography.pdf Die physikalische Grundlage der Magnetresonanztomographie (MRT) bildet die Kernspinresonanz (engl. nuclear magnetic resonance, NMR). Hier nutzt man die Tatsache, dass Protonen sowie Neutronen einen Eigendrehimpuls (Spin) besitzen und Atomkerne dadurch ein magnetisches Moment erhalten. Ein Atomkern kann vom Standpunkt der klassischen Physik aus vereinfacht als ein magnetischer Kreisel angesehen werden. (Der Spin kann klassisch jedoch nicht korrekt beschrieben werden). Wird ein solcher rotierender Kern in ein statisches magnetisches Feld H0 gebracht, so richtet sich dieser nach H0 aus. Durch das Ausrichten beginnt der Kern mit einer Prazessionsbewegung d.h. die Rotationsachse des Kerns dreht sich um die Richtung des angelegten Magnetfeldes. Die Prazessionsbewegung tritt jedesmal dann auf, wenn der Kern aus seiner Ruhelage gebracht wird. Wird das auere Feld wieder abgestellt, so fallt der Kern in seine ursprungliche Lage (thermisches Gleichgewicht) zuruck. Wird ein zweites Feld (Transversalfeld) HT angelegt, welches senkrecht zum ersten steht, beginnt der Kern wieder zu prazidieren (bis sich ein Gleichgewichtszustand einstellt) ebenso wenn das Feld wieder abgestellt wird. Um die Kerne dauerhaft zur Prazession anzuregen, ist dieses zweite Feld ein hochfrequentes Wechselfeld (HF-Feld) und rotiert in der xy-Ebene. Das Magnetfeld H0 hat ublicherweise eine Starke von 2,0 - 3,0 Tesla, in experimentellen Geraten bis 9,4 Tesla (An der Universitat Zurich sogar bis 20 Tesla). Fur die Prazessionsbewegung des Kernspins existiert eine Resonanzfrequenz. Bei Atomkernen (aber auch beim Elektron) wird diese Eigenfrequenz Larmorfrequenz genannt. Diese ist abhangig von der Starke des eingepragten Magnetfeldes und vom Aufbau des Kerns. Durch die Wahl der Starke des ersten (statischen) Feldes H0 und die Wahl der Frequenz des Transversalfeldes HT kann sehr genau bestimmt werden, 5 6 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION welche Kerne in Resonanz geraten sollen. Durch diesen Resonanzeekt wird das makroskopische magnetische Moment m des Kerns um 90◦ in die xy-Ebene gekippt und rotiert prazidierend mit dem Transversalfeld. Der magnetische Fluss des rotierenden Dipols induziert in der Messspule eine Spannung. Der magnetische Fluss des rotierenden Dipols induziert in der Messspule eine Spannung. z Spule y mT x Φ U Wird das transversale Wechselfeld, welches das magnetische Moment m eines Kerns um 90◦ gekippt hat, abgeschaltet, so rotiert der Kern weiter in der xy-Ebene. Bringt man nun eine Spule in die Nahe des rotierenden magnetischen Moments, so wird in dieser eine Spannung induziert. Da die Messspulen gewohnlich normal auf der xy-Ebene stehen, ist die gemessene Spannung proportional zur Quermagnetisierung mT des magnetischen Momentes m. Mit einer Folge von HF-Impulsen des Transversalfeldes in einem Korper, der in einem starken Magnetfeld liegt, kann eine rotierende Quermagnetisierung MT erzeugt werden, welche sich aus den Quermagnetisierungen mT der einzelnen Kerne zusammensetzt. Diese Quermagnetisierung ist vom Ort und vom Gewebetyp abhangig. Das Ziel der MR-Tomographie ist die Erzeugung von Schichtbildern der Quermagnetisierung MT (x, y) mit der Dichte ρ = ρ(x, y, 0). Zum besseren Verstandnis wird hier das Prinzip der einfachsten, sogenannten Spinecho-Sequenz kurz skizziert. Eine SSequenzst in diesem Zusammenhang eine Kombination aus hochfrequenten Impulsen und Magnetfeldern bestimmter Frequenz bzw. Starke, die vielfach in jeder Sekunde in vorgegebener Reihenfolge ein- und ausgeschaltet werden. Zu Beginn steht der sogenannte Anregungsimpuls. Wird uber die Sendeantenne ein hochfrequenter Wellenimpuls der passenden Frequenz (Larmor-Frequenz) eingestrahlt, dann werden die Spinachsen quer zum aueren Magnetfeld ausgelenkt. Sie beginnen um die ursprungliche Achse zu kreisen. Wie bei einem Kreisel, welcher 1. MAGNET-RESONANZ-TOMOGRAPHIE 7 angestoen wird, nennt man diese Bewegung Prazession. Die prazidierenden Dipole bilden winzige Sender und strahlen die hochfrequente Energie ab, wahrend sie sich wieder aufrichten. Das hochfrequente Signal kann auerhalb des Korpers gemessen werden. Es zerfallt exponentiell, weil die Protonenspins aus dem Takt geraten und sich gegenseitig uberlagern. Die Zeit, nach der 63% des Signals zerfallen sind, nennt man T 2-Relaxationszeit (Spin-Spin-Relaxation). Diese Zeit hangt von der chemischen Bindung des Wasserstos ab; sie ist fur jede Gewebsart unterschiedlich. Tumorgewebe hat z. B. meist eine langere T 2-Zeit als normales Muskelgewebe. Eine T 2-gewichtete Messung stellt den Tumor darum heller als seine Umgebung dar. Durch geeignete Rephasierungs-Impulse kann man bewirken, dass die Spins zum Zeitpunkt der Messung wieder genau in der gleichen Phase sind. Die Signalstarke hangt dann nicht von der T2-Relaxationszeit ab, sondern von der sogenannten T 1Relaxationszeit (Spin-Gitter-Relaxation), die ein Ma fur die Geschwindigkeit ist, mit der sich die Quermagnetisierung wieder ruckbildet, also die ursprungliche Langsausrichtung der Spins zum aueren Magnetfeld wieder einstellt. Die T 1-Zeit ist ebenfalls gewebespezisch, aber deutlich (20×) langer als die T 2-Zeit. Die T 1-Zeit von Wasser betragt z. B. 2,5 Sekunden. T 1-gewichtete Messsequenzen erlauben wegen des starkeren Signals eine bessere Ortsauosung, aber einen geringeren Gewebekontrast als T 2-gewichtete Bilder. Eine Kernspintomographie umfasst stets T1- und T2-gewichtete Bildserien und daruber hinaus mindestens zwei raumliche Ebenen. Um die Signale den einzelnen Volumenelementen (Voxeln) zuordnen zu konnen, wird mit abgestuften Magnetfeldern (Gradientenfeldern) eine Ortskodierung erzeugt. Ein Gradient liegt bei der Anregung an und stellt sicher, dass nur eine einzelne Schicht des Korpers die passende Larmorfrequenz besitzt, also nur die Spins dieser Schicht ausgelenkt werden (Schichtselektionsgradient). Ein zweiter Gradient quer zum ersten wird nach der Anregung kurz eingeschaltet und bewirkt eine kontrollierte Dephasierung der Spins dergestalt, dass in jeder Bildzeile die Prazession der Spins eine andere Phasenlage hat (Phasenkodiergradient). Der dritte Gradient wird wahrend der Messung senkrecht zu den beiden anderen geschaltet; er sorgt dafur, dass die Spins jeder Bildspalte eine andere Prazessionsgeschwindigkeit haben, also eine andere Larmorfrequenz senden (Auslesegradient, Frequenzkodiergradient). Alle drei Gradienten zusammen bewirken also eine Kodierung des Signals in drei Raumebenen. Das empfangene Signal gehort zu einer bestimmten Schicht des Korpers und enthalt eine Kombination aus Frequenz- und Phasenkodierung, die der Computer mit einer Fourier-Transformation auosen kann. Bemerkung 1. Klopfgerausche: Zur Ortskodierung der Bildinformation wer- den dem Hauptmagnetfeld zusatzliche Gradientenfelder ( in x-, y- und z-Richtung) die dabei verwendeten Gradientenspulen werden innerhalb von uberlagert. Uber 8 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Millisekunden starke Magnetfelder auf- und abgebaut. Die entstehenden elektromagnetischen Krafte zerren dabei so stark an den Spulenverankerungen, dass laute klopfende bzw. hammernde Gerausche auftreten, die je nach gefahrener Sequenz unterschiedlich sind. Das Gerat arbeitet dabei fast wie ein Lautsprecher: Ein starker Magnet ist von durchossenen Spulen umgeben. 1.2. Mathematisches Modell. Das statische Magnetfeld in z -Richtung sei ~ 0 = H0 ~ez . H ~ 0 ausrichtet. Da Dies bewirkt, dass sich der Drehimpuls der Protonen parallel zu H ~ 0 als nach −H ~ 0 ausrichten, entsteht ein makroskopisches sich ein paar mehr nach H ~ , das in die gleiche Richtung wie H ~ 0 zeigt. magnetisches Moment M Nun wird ein magnetisches Wechselfeld ~ 1 (t) = 2H1 cos(ω0 t)~ex , H ~ 0 | f gepulst mit der Resonanzfrequenz der Atome (=Larmor-Frequenz) ω0 = γ|H ur die Zeit tp angelegt. Wobei γ das gyromagnetische Verhaltnis bezeichnet (= eine kreisel~ in die x − y -Ebene, bei Rotation um z. magnetische Konstante). Dadurch kippt M ~ bewirkt, das die Atome einer PrazissionsbeweDie Verzerrung der Richtung von M ~ 0 ausf gung um H uhren. 1. MAGNET-RESONANZ-TOMOGRAPHIE 9 ~ wieder zur Nach dem Abschalten des Wechselfeldes wandert M uck an seine ursprungliche Position. Es erfolgt dann eine Zunahme in z in der Zeit T 1 und eine Abnahme in x − y in der Zeit T 2. Die Richtungsanderung bewirkt, das in geeigneten Geraten, Spannungen induziert werden, die gemessen werden konnen. Dies heit FID-Signal (free induction decay). S(t) = ρ cos(ω0 t) e−t/T 2 . Dabei ist ρ die Dichte des magnetischen Moments und T 2 die Spin-Spin-Relaxationszeit. Das hochfrequente Signal kann auerhalb des Korpers gemessen werden. Es zerfallt exponentiell, weil die Protonenspins aus dem Takt geraten und sich gegenseitig uberlagern. Die Zeit, nach der 63% des Signals zerfallen sind, nennt man T 2-Relaxationszeit (Spin-Spin-Relaxation). Diese Zeit hangt von der chemischen Bindung des Wasserstos ab; sie ist fur jede Gewebsart unterschiedlich. Tumorgewebe hat z. B. meist eine langere T 2-Zeit als normales Muskelgewebe. Eine T 2-gewichtete Messung stellt den Tumor darum heller als seine Umgebung dar. Durch geeignete Rephasierungs-Impulse kann man bewirken, dass die Spins zum Zeitpunkt der Messung wieder genau in der gleichen Phase sind. Die Signalstarke hangt dann nicht von der T 2-Relaxationszeit ab, sondern von der sogenannten T 1Relaxationszeit (Spin-Gitter-Relaxation), die ein Ma fur die Geschwindigkeit ist, mit der sich die Quermagnetisierung wieder ruckbildet, also die ursprungliche Langsausrichtung der Spins zum aueren Magnetfeld wieder einstellt. Die T 1-Zeit ist ebenfalls gewebespezisch, aber deutlich (20×) langer als die T 2-Zeit. Die T 1-Zeit kann nicht mit einem um 90◦ gekippten hochfrequenten Wechselfeld bestimmt werden und wir betrachten sie deshalb nicht. Weil das menschliche Gewebe nicht homogen ist, konnen uberhaupt geeignete Bilder entstehen. Eine gute raumliche Auosung entsteht weil nur die Teile des Gewebes, ~ mit |H| ~ = γω0 benden, durch das Wechselfeld die sich im statischen Magnetfeld H ~ 1 (t) beeinusst werden. Es sei das statische Magnetfeld H ~ ~ 0 + Gz z ~ez H(z) =H 10 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION vorhanden. Davon werden nur Protonen im Schnitt mit z nahe bei 0 durch das ~ 1 (t) beeinusst (da |H ~ 0 | = γ ω0 vorausgesetzt wurde). Dies erlaubt es, Wechselfeld H R die mittlere Gewebedichte R2 ρ(x, y, 0) dx dy in der Ebene z = 0 abzubilden und ~ 0 bzw. ω0 in jeder beliebigen z -Ebene. durch Anderung von H Das reicht aber noch nicht aus um ρ(x, y, 0) zu bestimmen. Legen wir nun fur die Zeitdauer T ein statisches Magnetfeld ~ ~ 0 + Gy y~ez . H(y) =H Da die Frequenz der Prazession vom Magnetfeld abhangt, erzeugt die Magnetisierung eine Rotation an der Stelle y mit der Frequenz ω(y) = ω0 + γ Gy ~ez . Dadurch baut sich an der Stelle z wahrend der Zeit T eine Phasenverschiebung von T (ω(y) − ω0 ) = T γ Gy y auf. Wird das Feld Gy y~ez abgeschaltet, so rotieren die Kerne wieder mit der Frequenz ω0 , allerdings hangt die Phase nun von y ab. Dieser Teil der MRT wird deshalb Phasendekodierung genannt. Eine Messung des FID-Signals wurde nun ein Signal der Form Z S(t; T ) = eiω0 t eiγ Gy T y ρ(x, y, 0) dx dy R2 ergeben. Durch Variation der Zeitdauer T bzw. des Gradienten Gy kann man den Frequenzanteil in Abhangigkeit von y der Dichte ρ(x, y, 0) erhalten. Damit ist aber immer noch nicht die x-Abhangigkeit erhalten worden. Dafur wird nun wahrend der FID-Messung ein von x abhangiges statisches Magnetfeld zugeschaltet. Die Kerne prazisieren nun mit der x-abhangigen Frequenz ω(x) = ω0 + γ Gx x um die z -Achse. Damit ergibt sich das FID-Signal Z eiγ Gy T y ei(ω0 +γ Gx x)t ρ(x, y, 0) dx dy S(t; T ) = R2 bzw. mit ξ = γ Gx t und η = γ Gy T ergeben sich die verfugbaren Daten −iω0 ξ/(γ Gx ) D(ξ, η) = e S η ξ ; γGx ηGY Z = eiηy eiξx ρ(x, y, 0) dx dy. R2 Durch Variation von T (bzw. Gy ) und t (bzw. Gx ) erhalt man D(ξ, η) fur alle wesentlichen Werte von ξ und η. Folglich ist die Rekonstruktion der Dichte ρ(x, y, 0) aquivalent zur Inversion der Fourier-Transformation und man erhalt 1 ρ(x, y, 0) = (2π)2 Z e−i(ξx+ηy) D(ξ, η) dξ dη. R2 Die Rekonstruktion der Dichte des magnetischen Moments ist also nichts anderes als die Inversion der Fourier-Transformation. 2. Fourier-Transformation Wir wollen hier nur einige wichtige Eigenschaften der Fourier-Transformation wiederholen: 2. FOURIER-TRANSFORMATION 11 Es sei f (~x) eine komplex-wertige in L2 (Rn ), also eine messbare Funktion des Rn , die quadratisch integrierbar ist, d.h. Z 2 |f (~x)|2 d~x < ∞. ||f || = Rn Dann ist die Fourier-Transformation deniert als fˆ(~k) = F~x→~k f (~k) = Z ~ e−ik·~x f (~x) d~x. Rn Man kann zeigen, dass fˆ(~k) ∈ L2 (Rn ) ist und die Fourier-Transformation invertierbar auf L2 (Rn ) ist mit der Inversen f (~x) = h i −1 ˆ f F~k→~ x 1 (~x) = (2π)n Z ~ eik·~x fˆ(~k) d~k. Rn Der Raum L2 (Rn ) besitzt das Skalarprodukt Z hf, gi = f (~x)g(~x) d~x, Rn dabei bezeichnet g(~x) die komplex konjugierte Zahl zu g(~x). Fur die Fourier-Transformation gilt die Parsevalsche Gleichung (fˆ, ĝ) = (2π)n (f, g), insbesondere folgt hieraus ||fˆ|| = (2π)n/2 ||f ||. Dies bedeutet, dass die Fourier-Transformation und ihre Inverse (bis auf den Faktor (2π)n/2 ) Isometrien sind. Wichtige Eigenschaften: Ableitungen. Es sei α = (α1 , α2 , . . . , αn ) ein Multiindex mit nichtnegativen Komponenten αj ≥ 0 n P und |α| = αj sei die Lange des Multiindex. Dann sei i=1 n Y ∂ αi D = αi . ∂x i i=1 α Dann folgt fur die Fourier-Transformation n Y (ikj )αj F~x→~k [Dα f ] (~k) = ! F~x→~k f (~k). j=1 Faltung. Die Faltung zweier Funktionen ist deniert als Z (f ∗ g)(~x) = f (~x − ~y ) g(~y ) d~y . Rn 12 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Damit ergibt sich F~x→~k (f ∗ g) = F~x→~k f d.h. f[ ∗ g = fˆĝ, F~x→~k g , d.h. fˆ ∗ ĝ = (2π)nb(f g). F~x−1 (fˆ ∗ ĝ) = (2π)n f g, →~k Folglich diagonalisiert die Fourier-Transformation Dierentialoperatoren (Multiplikation im Fourier-Bild). Andererseits uberfuhrt die Fourier-Transformation das Produkt zweier Funktionen in die nicht lokale Faltung. 3. Inverse Streutheorie Wir betrachten die (ortlich) eindimensionale Wellengleichung 1 ∂2U ∂2U − = δ(t)δ(x − xs ), v 2 (x) ∂t2 ∂x2 t ∈ R, x ∈ R, mit Delta-Quellterm zur Zeit t = 0 und an der Stelle x = xs . Wie setzen Kausalitat voraus, d.h. U (x, t, xs ) = 0 fur t < 0 und weiterhin sei U beschrankt. Wir messen U (xs , txs ), d.h. das Geophon (Detektor zur Aufnahme hochfrequenter seismischer Bodenbewegungen) sich an der gleichen Stelle wie der Quellterm bendet, und wollen einige Annahmen uber v(x) machen. Das Problem soll im Frequenzbereich untersucht werden. Es sei u(x, ω; xs ) die kausale Fourier-Transformation von U (x, t; xs ) bezuglich der Zeit t : ∞ Z U (x, t; xs ) eiωt dt. u(x, ω; xs ) = 0 Diese Transformation kann wie folgt invertiert werden: 1 U (x, t; xs ) = 2π Z ∞ u(x, ω; xs ) e−iωt dω. −∞ Aufgrund der Abbildungseigenschaften der Fourier-Transformation ergibt sich aus der Wellengleichung fur U (x, t; xs ) die Helmholtz-Gleichung fur u(x, ω; xs ) : d2 u ω2 + u = −δ(x − xs ), dx2 v 2 (x) ω ∈ R, x ∈ R, diese wird auerdem mit den folgenden Ausstrahlungsbedinungen versehen: du iω ∓ u → 0, dx v(x) as x → ±∞. Weitere Annahmen: Wir setzen voraus, das v(x) auf (−∞, xs ) bekannt ist. (Bei der Rekonstruktion von Bodenprolen interessieren naturlich nur positive Tiefen). Weiterhin sei v(x) nahe" zu\ eine Konstante c auf (xs , ∞). Wie formulieren diese Eigenschaft als 1 v 2 (x) = 1 (1 + α(x)), c2 wobei α(x) als klein im Vergleich zu v(x). Das bedeutet, dass die Rekonstruktion von der Ausbreitungsgeschwindigkeit v(x) aus den Streudaten u(xs , ω; xs ) linearisiert 3. INVERSE STREUTHEORIE 13 wird. Die Linearisierung nimmt vereinfacht eine ortsunabhangige Geschwindigkeit c an. Der Vorteil dieser Annahme besteht darin, dass das daraus resultierende Problem einfach zu losen ist und eine explizite Losung besitzt unter der Voraussetzung, dass α(x) klein f ur groe |x| ist. Es sei ui (i=incident= einfallend) die Losung des ungestorten Problems d2 u ω2 u = −δ(x − xs ), + dx2 v 2 (x) du iω ∓ u → 0, dx v(x) as x → ±∞. Die Losung dieses Problems ist gegeben durch die Greensche Funktion der HelmholtzGleichung mit konstanten Koezienten. Sie lautet ui (x, ω; xs ) = G(x − xs , ω) = − c iω|x−xs |/c e 2iω wie man leicht nachrechnet. Die Ausstrahlungsbedingungen sind ebenfalls erfullt. Die Losung der Helmholtz-Gleichung sei nun als Uberlagerung der einfallenden Welle und der gestreuten (s=scattered) Welle dargestellt: u(x, ω; xs ) = ui (x, ω; xs ) + us (x, ω; xs ). Aus den Gleichungen fur u und ui ergibt sich, dass us die folgende Gleichung erfullen muss: d2 us ω 2 ω2 + u = − α(x)(ui + us ), s dx2 c2 c2 sowie entsprechende Aussrahlungsbedingungen. Nach dem Superpositionsprinzip ergibt sich die Losung us (x, ω; xs ) = ω 2 Z ∞ xs α(y) (us + ui )(y, ω; xs )G(x − y; ω) dy. c2 Wir haben bisher nicht ausgenutzt, dass α(x) als klein\ vorausgesetzt wurde. Die " obige Approximation ist die sogenannte Born-Approximation, aus ihr konnen wir schlieen, dass us klein von der Ordnung von α ist. Folglich ist αus klein von der Ordnung α2 und kann deshalb vernachlassigt werden. Setzen wir die Ausdrucke fur ui und die Greensche Funktion G ein, so ergibt sich mit ω = ck : 2 Z ∞ ck α(y) i k (2y−x−xs ) us x, , xs = − e2 dy 2 4 xs Z ∞ ck α(y) ik(y−xs ) und damit ist us xs , , xs = − e dy 2 4 xs Z ck α(y) iky ikxs ⇐⇒ −e us x, , xs = e dx. 2 4 R Damit ist die Berechnung von α(x) wieder eine Inversion der Fourier-Transformation und man erhalt Z α(x) = −eikxs 2 π e−ikx us xs , R ck , xs 2 dk. 14 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION 4. Korrekt gestellte Probleme Es seien X und Y Banach-Raume (vollstandige normierte Raume) und sei A ein im Allgemeinen nichtlinearer Operator von D ⊆ X nach Y. Fur jedes y ∈ Y soll das folgende Problem gelost werden: Man bestimme ein x so, dass A(x) = y, x ∈ D ⊆ X, y ∈ Y, ist. fur einen linearen Operator A ∈ L(X, Y ) Man bestimme ein x so, dass A(x) = y, x ∈ D ⊆ X, y ∈ Y, ist. Definition (1) (2) 1. Das Problem (1) bzw. (2) heit korrekt gestellt (gut ge- stellt, well-posed) nach Hadamard, wenn (1) zu jedem y ∈ Y gibt es eine Losung x ∈ D (Existenzbedinung), (2) diese Losung x ist in D eindeutig bestimmt (Eindeutigkeitsbedinung), und (3) stabil ist, d.h. die Losung x hangt stetig von der rechten Seite y ab (Stabilitatsbedingung). Ist eine der oben genannten Bedingungen nicht erfullt so heit das Probelm inkorrekt gestellt (schlecht gestellt, ill-posed). Mathematisch sind diese drei Eigenschaften erfullt, wenn die folgenden aquivalenten Bedingungen erfullt sind. 1. Das Problem (1) bzw. (2) ist korrekt gestellt, wenn (1) der Operator A : D ⊆ X → Y invertierbar ist (fur jedes y ∈ A(D) Satz ist A−1 y ∈ D ⊆ X deniert) und (2) der inverse Operator A−1 stetig ist bzw. im Fall des linearen Operators A, der lineare inverse Operator A−1 beschrankt ist (d.h., ||A−1 y||X ≤ C ||y||Y mit einer Konstanten C, die nur von A aber nicht von y ∈ Y abh angt). Aus den Eigenschaften der Fourier-Transformation als Abbildung von X = L2 (Rn ) nach Y = L2 (Rn ) folgt, dass die beiden in den Abschnitten 1. und 3. genannten Probleme korrekt gestellt sind, da die Fourier-Transformation invertierbar ist und die inverse Fourier-Transformation ein beschrankter Operator ist. Wir wollen auf die Stabilitat der Fourier-Transformation eingehen. Stabilitat bedeutet insbesondere Stabilitat bezuglich gestorter Daten. Dazu nehmen wir an, dass 4. KORREKT GESTELLTE PROBLEME 15 die gemessenen Daten gestort sind, d(~x) = f (~x) + N (~x) ˆ ~k) = fˆ(~k) + N̂ (~k), bzw. d( wobei bekannt sei, dass δ = ||N̂ || relativ klein (bezogen auf die wahren Werte fˆ(~k)) sind. Dann ist der Fehler in der Rekonstruktion der Daten ebenfalls von der Ordnung von δ in der X = L2 (Rn Norm. Denn es gilt −1 −1 ˆ −1 ˆ f || = ||F~k→~ (dˆ − fˆ)|| = (2π)−n/2 ||N̂ || = (2π)−n/2 δ. d − F~k→~ ||d − f || = ||F~k→~ x x x Mit anderen Worten, die Messfehler sind in der Rekonstruktion immer noch vorhanden, aber sie verfalschen die wahren Werte nicht zu stark. Bezogen auf das allgemeine Problem (2) bedeutet es, dass der Fehler zwischen zwei Losungen x1 und x2 , die zu den Daten y1 und y2 gehoren, gilt ||x1 − x2 ||X ≤ C ||y1 − y2 ||Y . Es sei darauf hingewiesen, dass die Wahl der Raume X bzw. Y sowie der entsprechenden Normen von Bedeutung ist, da die Denition und Beschrankheit des inversen Operators A−1 davon abhangt. 4.1. Korrektheit linearer Probleme in Banachräumen. neares Problem (2) korrekt gestellt? Es sei Wann ist ein li- N (A) = {x ∈ X : Ax = 0} der Kern oder auch Nullraum des Operators A. Der Kern bzw. Nullraum ist stets ein abgeschlossener Teilraum von X. Weiterhin bezeichnen wir mit R(A) = {y ∈ Y : y = Ax, x ∈ X} den Bildraum des Operators A. Der Bildraum ist ein Teilraum aber nicht notwendigerweise ein abgeschlossener Teilraum von Y. Interessanterweise ist die Stabilitatsbedingung der Korrekheitsdenition immer erfullt, wenn sowohl die Existenz- als auch die Eindeutigkeitsbedinung erfullt sind. Diesen Zusammenhang stellt der Satz uber die oene Abbildung her: Satz 2. Es sei A ∈ L(X, Y ) ein surjektiver beschrankter linearer Operator. Dann ist fur jede oene Teilmenge T von X auch die Bildmenge AT y = Ax, x ∈ T } eine oene Teilmenge von Y. = {y ∈ Y : Da der Operator genau dann stetig ist, wenn die Urbilder oener Mengen wieder oene Mengen sind, ergibt sich hieraus: Folgerung 1. Ist A ∈ L(X, Y ) ein surjektiver beschrankter linearer Ope- rator und auerdem noch injektiv, dann besitzt inversen Operator A−1 ∈ L(Y, X). A einen beschrankten linearen 16 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Ist nun der lineare Operator A injektiv und besitze ein abgeschlossenes Bild, d.h. R(A) = R(A). Als abgeschlossener Teilraum von Y ist der Bildraum Ỹ := R(A) selbst wieder ein Banach-Raum mit der von Y induzierten Norm. Somit ist der Operator à : L(X, Ỹ ) mit Ãx := Ax f ur alle x ∈ X surjektiv und existiert der stetige inverse −1 Operator à ∈ (Ỹ , X). Folglich ist die Stabilitatsbedingung erfullt und es gilt Satz 3. Der Operator A in der linearen Operatorgleichung (2) sei injek- tiv und habe einen abgeschlossenen Bildraum, dann ist die Stabilitatsbedingung der Korrektheitsdenition nach Hadamard erfullt. Da Y als Banachraum abgeschlossen ist, folgt aus der Existenzbedingung (fur alle y ∈ Y !) die Abgeschlossenheit des Bildraums. Folgerung 2. Erfullt die lineare Operatorgleichung (2) sowohl die Exi- stenz als auch die Eindeutigkeitsbedingung, so genugt sie auch der Stabilitatsbedingung, d.h. das Problem ist korrekt gestellt. Ist dagegen der Bildraum nicht abgeschlossen, d.h. es gilt R(A) 6= R(A), dann ist der inverse Operator A−1 : R(A) ⊂ Y → X nicht beschrankt, somit nicht stetig und die Stabilitatsbedingung verletzt. Ware namlich die Stabiltatsbedingung erfullt, so musste fur eine Folge yn → y0 6∈ R(A) in Y f ur n → ∞ mit yn = Axn ∈ R(A) die Abschatzung ||xn − xm ||X ≤ C||yn − ym ||Y gelten. Da {yn } als konvergente Folge eine Cauchy-Folge ist, ergibt sich aus obiger Abschatzung, dass auch {xn } eine Cauchy-Folge ist. Dann gibt es aber im Banachraum X ein Grenzelement x0 = lim xn , fur das wegen der Stetigkeit von A gilt n→∞ lim Axn = Ax0 = y0 . Dies widerspricht aber der Annahme y0 6∈ R(A). n→∞ Satz 4. Ist der Operator A der linearen Operatorgleichung (2) injektiv, besitzt aber keinen abgeschlossenen Bildraum, dann ist die Stabilitatsbedingung der Hadamardschen Korrektheitsdenition nicht erfullt und das Problem deshalb inkorrekt gestellt. 5. SOBOLEV-RAUME UND INKORREKT GESTELLTE PROBLEME 17 5. Sobolev-Räume und inkorrekt gestellte Probleme 5.1. Seil unter Eigenlast. Man stelle sich ein Seil vor, dass aus verschiedenen Materialen besteht, so dass seine Dichte eine veranderliche Groe ist. Dabei sei die Spannung T des Seils konstant und die vertikale Auslenkung klein im Vergleich zur Lange des Seils. Eine etwas ubertriebene Darstellung des Sachverhalts (wir haben kleine vertikale Auslenkung vorausgesetzt!!) sieht wie folgt aus: s s y(s) 0 1 Das inverse Problem besteht nun darin, die (Massen-)Dichte aus der Auslenkung y des Seils zu bestimmen. Wir bezeichnen die Dichte des Seils mit x(s) und konstruieren ein Modell fur die Masse-Auslenkungs-Relation: y = Kx. s t s 0 y(s) y(t) φ T 1 T δ F Dazu betrachten den Einuss einer in t konzentrierten Kraft F. Aufgrund des Kraftegleichgewichts gilt: T sin ϕ + T sin δ = F. Da die Auslenkungen als Klein vorausgesetzt wurden, ist sin δ ≈ tan δ und analog sin ϕ ≈ tan ϕ woraus sich F y(t) y(t) = sin δ + sin ϕ = tan δ + tan ϕ = + T t 1−t und damit y(t) = F t(1 − t). T Ist nun s < t, dann folgt aus der Ahnlichkeit der Dreiecke y(s) y(t) F = = (1 − t) s t T 18 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION bzw. y(s) = F s(1 − t). T Analog ergibt sich y(s) = F t(1 − s) f ur T s > t. D.h. unser Modell lautet nun ( y(s) = F k(s, t) mit k(s, t) = 1 t(1 − s), T 1 s(1 − t), T 0 ≤ t ≤ s, s ≤ t ≤ 1. Betrachten wir nun eine stetige Kraftverteilung erzeugt durch eine Dichtefunktion x = x(t), so ergibt sich der Einuss innitesimal kleiner Krafte auf die Auslenkung y(s) zu n X y(s) = lim n→∞ k(s, ti )x(ti )∆ti i=1 und nach Grenzubergang die Fredholmsche Integralgleichung Z y(s) = 1 k(s, t) x(t) dt. 0 Oensichtlich erfullt y(s) = k(s, t) x(t) dt das Randwertproblem R1 0 y 00 (s) + 1 x(s) = 0, T y(0) = y(1) = 0, erfullt, da 1 y (s) = T 0 Z s(1 − s)x(s) + 0 s 1 −tx(t) dt − s(1 − s)x(s) + (1 − t)x(t) dt s Z s Z 1 1 = −tx(t) dt + (1 − t)x(t) dt T 0 s Z und y 00 (s) = 1 1 (−sx(s) − (1 − s)x(s)) = − x(s). T T Auerdem ist y(0) = y(1) = 0. Wie man am folgenden Plot sieht bzw. auch schnell nachrechnet ist yε = ε(s − 1) sin s ε klein fur ε 1. Dargestellt ist die Funktion fur Werte ε = 0, 001; 0, 0025; 0, 004; 0, 0055; 0, 007; 0, 0085; 0, 01. und die Funktionswerte sind betragsmaig kleiner als 0,01. 5. SOBOLEV-RAUME UND INKORREKT GESTELLTE PROBLEME 19 Diese kleinen Werte fur die Auslenkung y erzeugen aber groe Werte fur die Dichte x, denn 1 s s−1 s x(s) = −y 00 (s) = −2 cos + sin . T ε ε ε Fur ε = 0, 055 erhalt man folgenden Funktionsverlauf: und dann fur ε = 0, 02 : Der Term (s−1) erzeugt oensichtlich beliebig groe Werte wenn ε → 0. Genauer fur ε π 1 s = ε 2 ist T x(s) = π2 − 1ε → ∞ f ur ε → 0. Folglich ist das inverse Problem der Rekonstruktion der Dichte x(s) aus den Daten y(s) beschrieben durch die Fredholmsche Integralgleichung 1. Art nicht korrekt bzw. inkorrekt gestellt. Warum ist dem so? Zur Erinnerung sei deniert: 20 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Definition 2. Ein linearer Operator A ∈ L(X, Y ), der zwischen den Banach- Raumen X und Y wirkt, heit vollstetig, wenn er jede in X beschrankte Teilmenge T ⊂ X in eine relativ kompakte Teilmenge AT = {y ∈ Y : y = Ax, x ∈ T } uberfuhrt. Fur vollstetige Operatoren und der Fredholmsche Integraloperator mit stetigem Kern ist vollstetig in Raumen stetiger Funktionen, gilt: Satz 5. Es sei A ∈ L(X, Y ) ein injektiver und vollstetiger linearer Operator, der zwischen den unendlich dimensionalen Banach-Raumen X und Y wirkt. Dann ist der unendlichdimensionale Bildraum R(A) des Operators A nicht abgeschlossen und der zu A inverse Operator A−1 : R(A) ⊂ Y → X unbeschr ankt. Ware namlich fur einen injektiven und vollstetigen linearen Operator A ∈ L(X, Y ) mit dim (X) = ∞ die Beziehung R(A) = R(A) oder damit gleichbedeutend der inverse Operator A−1 : R(A) ⊆ Y → X beschrankt, so ware ||A−1 y||X ≤ C ||y||Y bzw. ||x||X ≤ C ||Ax||Y . (3) Da es aber in jedem unendlich dimensionalen Banachraum immer eine beschrankte Teilmenge gibt, die nicht relativ kompakt ist, was bedeutet, dass eine unendliche Folge {xn } ⊂ T gibt, die keine konvergente Teilfolge und damit naturlich auch keine Cauchy-Folge als Teilfolge besitzt. Jedoch ist wegen der Vollstetigkeit von A die Bildmenge AT relativ kompakt und die Folge {Axn } ⊂ AT besitzt eine konvergente Teilfolge, die dann auch Cauchy-Folge ist. Dies widerspricht aber (3) und ist somit ausgeschlossen. Folgerung 3. Es sei X ein unendlich dimensionaler Banachraum und ein injektiver und vollstetiger Operator. Dann ist die Stabilitatsbedingung nicht erfullt und das lineare inverse Problem inkorrekt nach Hadamard. A ∈ L(X, Y ) Zur Erinnerung: Satz 6. Der lineare Fredholmsche Integraloperator A : C[a, b] → C[c, d] Z (Ax)(s) := b k(s, t) x(t) dt a c ≤ s ≤ d, 5. SOBOLEV-RAUME UND INKORREKT GESTELLTE PROBLEME 21 mit stetigem Kern k ∈ C([c, d] × [a, b]) ist ein vollstetiger Operator. Ebenso ist dieser Operator mit quadratisch integrierbarem Kern k ∈ L2 ((c, d) × (a, b)) als Abbildung A : L2 (a, b) → L2 (c, d) ein vollstetiger Operator. Bemerkung 2. Die lineare Fredholmsche Integralgleichung 2. Art Z b k(s, t) x(t) dt = y(s), x(s) + c ≤ s ≤ d, a als Operatorgleichung der Form x ∈ X, y ∈ Y, x + Ax = y, mit A ∈ L(X, Y ) und vollstetig mit korrekt nach Hadamard. ||A||L(X,Y ) ≤ 1 ist in diesen Raumen stets 5.2. Exponentielles Wachstum. Eines der einfachsten Anfangswertprobleme fur gewohnliche Dierentialgleichungen beschriebt ein ungebremstes Wachstum = exponentielles Wachstum: du = r(t) u dt mit der Anfangsbedingung u(0) = u0 > 0. Dabei wird der Wachstumsprozess durch den veranderlichen Parameter r(t) gesteuert. Wir wollen nun zeigen, dass die Bestimmung des Parameters r(t) ein im Allgemeinen inkorrekt gestelltes Problem ist. Dazu berechnen wir zunachst die Losung des AWP und daraus den funktionalen Zusammenhang von r(t) und u(t). Die Losung des AWP ist Rt u(t) = u0 e 0 r(s) ds Dies ist oensichtlich ein nichtlinearer Zusammenhang. Wir berechnen r(t) aus u(t); es ist t Z ln u(t) = ln u0 + r(s) ds und damit r(t) = (ln u(t))0 . 0 Zur Untersuchung der Stabilitat des inversen Problems betrachten wir die gestorten Daten: ε sin( uε (t) = u(t) e t ε2 ) bzw. ln uε (t) = ln u(t) + ε sin t ε2 Hier sind Werte fur die Storung eε sin( ε2 ) fur ε = 0, 01; 0, 025; 0, 04; 0, 055; 0, 07; 0, 085; 0, 1 dargestellt. Man sieht gut wie die Konstante Funktion 1 immer besser approximiert wird. t 22 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Dagegen wird der Fehler fur r(t) durch ε sin t ε2 0 1 = cos ε t ε2 sehr gro. Dass wird durch den Plot fur ε = 0, 05; 0, 1 veranschaulicht: Ein derartiges Verhalten ist fur Parameteridentikationsprobleme typisch! 5.3. Korrektheit inverser Probleme auf kompakten Mengen. Der die Ope- ratorgleichung beschreibende Operator sei linear oder auch nichtlinear. Wir betrachten das inverse Problem zu F (x) = y, x ∈ D ⊆ X, y ∈ Y mit dem nichtlinearen Operator F. (4) An sich inkorrekte inverse Probleme werden korrekt, wenn die zulassigen Losungen dieses Problems auf eine kompakte Menge eingeschrankt werden. Das ist die Aussage des Satz von Tichonov. Diese Vorgehensweise wird auch als deskriptive Regularisierung bezeichnet. Satz 7. (Satz von Tichonov) Es sei F : D ⊂ X → Y ein stetiger injekti- ver Operator, der aus dem Banach-Raum X in den Banach-Raum Y abbildet und dessen Denitionsbereich D eine kompakte Teilmenge von X darstellt. Dann ist auch der inverse Operator F −1 : F (D) ⊂ Y → D ⊂ X stetig. 5. SOBOLEV-RAUME UND INKORREKT GESTELLTE PROBLEME 23 Es sei y0 ein beliebiger Punkt mit y0 = F (x0 ), x0 ∈ D und {xn } ⊂ D sei eine Folge mit ||yn − y0 || = ||F (xn ) − F (x0 )||Y → 0 fur n → ∞. Da D als kompakte Menge in X sowohl relativ kompakt als auch abgeschlossen ist, existiert eine in X konvergente Teilfolge {xnk } mit lim x̃ ∈ D. Wegen der Stetigkeit k→∞ des Operators F gilt dann auch lim F (xnk ) = F (x̃) = F (x0 ) in Y. Da F ein injektiver k→∞ Operator ist folgt x̃ = x0 und damit ||xnk − x0 ||X → 0 fur k → ∞. Aus den bisherigen Uberlegungen folgt aber mehr noch ||xn − x0 ||X → 0 fur n → ∞, also die Folge {xn } konvergiert gegen x0 . Ware dem namlich nicht so, so musste es fur eine genugend kleine Zahl ε > 0 eine unendliche Teilfolge {xnl } geben mit ||xnl − x0 ||X > ε f ur alle l = 1, 2, . . . . Diese musste nun aber wegen der Injektivitat von F und der Kompaktheit von D eine gegen x0 konvergente Teilfolge besitzen, was oensichtlich ein Widerspruch ist. Folgerung 4. Es sei nichtlineare Operator F : D ⊂ X → Y in der Operator- gleichung (4) sei ein stetiger injektiver Operator, der aus dem Banach-Raum X in den Banach-Raum Y abbildet und dessen Denitionsbereich D eine kompakte Teilmenge von X darstellt. Dann ist die Stabilitatsbedingung der Korrekteitsdenition nach Hadamard erfullt. Schlielich gilt aufgrund obiger Uberlegungen auch: Satz 8. Besitzt die Operatorgleichung (4) zu einer speziellen rechten Seite eine eindeutig bestimmte Losung x0 ∈ D, wobei der Operator F stetig und der Denitionsbereich D kompakt ist, so gilt die Implikation F (xn ) → F (x0 ) in Y, xn ∈ D ⇒ xn → x0 in X. y0 In diesem Satz wurde die Forderung nach der Injektivitat von F durch die wesentlich schwachere Eigenschaft der eindeutigen Losbarkeit von (4) fur eine spezielle rechte Seite y0 abgeschwacht. 5.4. Sobolev-Räume und kompakte Einbettungen. Definition 3. Fur m ∈ N0 und 1 ≤ p ≤ ∞ besteht der Raum H m,p (Ω) aus allen Funktionen u ∈ Lp (Ω), die m-mal schwach dierenzierbar sind mit Ableitungen im Raum Lp (Ω). Die Raume H m,p werden mit den Sobolev-Normen 1/p ||u||m,p,Ω = X ||Dα u||pp,Ω , 1 ≤ p < ∞, |α|≤m ||u||m,∞,Ω = max ||Dα u||∞ , |α|≤m versehen. Der Raum H m,p (Ω). H0m,p (Ω) bezeichnet die Abschlieung von C0∞ (Ω) in der Norm von 24 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION 9. H m,p (Ω) ist ein Banach-Raum fur alle m ∈ N0 und 1 ≤ p ≤ ∞. Satz Hm, 2(Ω) ist ein Hilbert-Raum mit dem inneren Produkt X Z hu, vim = 0≤α≤m Dα u Dα v dx. Ω Die fur uns interessante Frage ist, welche Raume haben welche kompakten Teilraume. Aussagen dazu machen der Satz von Rellich-Kondrachov und der Satz von Morrey. Satz 10. (Satz von Rellich-Kondrachov) Es sei Ω ein Lipschitz-Gebiet. Dann np ist die Einbettung H 1,p (Ω) ,→ Lq (Ω) kompakt fur q < (n−p) . F ur gleiche Einbettung kompakt ohne eine Voraussetztung an ∂Ω. Beispiel H01,p (Ω) ist die 1. Fur n = 1 ist die obige Aussage sinnlos, da 1−p > 0 nur fur p < 1 erfullt ist. Fur n = 2 erhalt man, dass die Einbettung H 1,p (Ω) ,→ L2 (Ω) kompakt ist wenn 1 < p < 2 ist, analog gilt fur n = 3 H 1,p (Ω) ,→ L2 (Ω) ist kompakt fur 6 5 < p < 3. Satz 11. (Satz von Morrey) Es sei Ω ein Lipschitz-Gebiet und m ∈ N. Dann ist die Einbettung H m,p (Ω) ,→ C m−1,α (Ω) kompakt fur α < 1 − n/p. Beweis siehe Dobrowolski: Angewandte Funktionalanalysis . Bemerkung 3. Man beachte, dass die Einschrankung auf kompakte Teil- mengen das mathematische Modell verandert. Eine Losung in einem SobolevRaum hat andere Eigenschaften als eine Losung im Raum stetig dierenzierbarer Funktionen. Auerdem verandern sich die Normen= Abstandsbegri! Das wirkt sich auch auf die Stabilitat in der Weise aus, dass "geringe Abweichung\ im Sinne einer Norm in Raumen stetig dierenzierbarer Funktionen etwas anderes beutet als "geringe Abweichung\ im Sinne einer Lp (Ω)-Norm. Auch muss die Frage nach der Existenz einer Losung bei der Einschrankung auf eine kompakte Teilmenge berucksichtigt werden. Definition 4. Fur nicht ganzzahliges s = m + σ > 0, 0 < σ < 1 und 1 ≤ p < ∞ besteht der Raum H s,p (Ω) aus den Funktionen u ∈ H m,p (Ω) mit endlicher Norm ||u||s,p,Ω . Dabei ist |u|pσ,p,Ω |u(x) − u(y)|p dx dy, n+σp Ω Ω |x − y| X = ||u||m,p,Ω + |Dα u|pσ,p,Ω . Z Z = ||u||s,p,Ω |α|=m Satz 12. Fur den Raum H s,2 (Rn ), s ≥ 0, sind die Normen ||u||s,2,Rn und ||u||∗s,2,Rn Z 2 2 s |û(ξ)| (1 + |ξ| ) dξ := Rn 1/2 5. SOBOLEV-RAUME UND INKORREKT GESTELLTE PROBLEME 25 aquivalent. Dabei ist Z û(ξ) := die Fouriertransformierte von u. u(x) e−ix·ξ dx Rn Beweis siehe Wloka: Partielle Dierentialgleichungen. Wir wollen diese Hilbert-Raume nutzen um ein besseres Verstandnis fur inkorrekt gestellte Problem zu gewinnen. Dazu betrachten wir die inhomogene gewohnliche Dierentialgleichung: −u00 + u = f, x ∈ R. Gilt u, f ∈ L2 (R), dann konnen wir die Fouriertransformation zum Losen der GDGL nutzen: ω 2 û + û = (1 + ω 2 )û = fˆ ⇐⇒ û = Damit ist u=F −1 1 fˆ. (1 + ω 2 ) 1 1 −1 −1 ˆ f =F ∗F fˆ (1 + ω 2 ) (1 + ω 2 ) Wie man leicht nachrechnet, ist F −1 1 (1 + ω 2 ) 1 −|x| e 2 = und damit ist 1 u(x) = 2 Z e−|y−x| f (y) dy = (g ∗ f )(x) mit R 1 g(x) = e−|x| . 2 Da f ∈ L2 (R) ergibt sich, dass u nicht nur in L2 (R) sondern wegen û = (1 + ω 2 )fˆ, sogar in H 2,2 (R) liegt. Wir denieren den Operator A wie folgt 2 2 A : L (R) → L (R 1 mit Af := 2 Z e−|y−x| f (y) dy = u(x). R Dann ist der Operator A nicht invertierbar, da der inverse Operator formal durch A−1 u = −u00 +u geben ist. Jedoch ist f ur u ∈ L2 (R) der Ausdruck −u00 keine Funktion aus L2 (R) sondern eine Distribution in H −2,2 (R). Folglich ist das inverse Problem inkorrekt gestellt. Oensichtlich liegt das daran, dass die Raume \nicht passen\. Also passen wir die Raume an und betrachten folgendes Problem: à : L2 (R → H 2 (R), f 7→ Ãf = g ∗ f = u. Durch die Anderung der Raume ist der Operator à oensichtlich invertierbar mit −1 00 à = −u + u und der inverse Operator ist stetig. Dieses Problem ist somit korrekt gestellt. 26 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Bemerkung 4. Warum muss man sich trotzdem mit inkorrekt gestellten Pro- blem befassen? Das liegt daran, dass Daten i. Allg. nur gestort vorliegen. Das ist kein Problem, wenn die Abweichung klein in der H 2 -Norm ist. Leider ist aber die H 2 Norm starker als die L2 -Norm, da die H 2 -Norm auch Abweichungen in der Ableitung mit berucksichtigt, wogegen die L2 -Norm nur die Abweichung in den Daten selbst berucksichtigt. Ist die Abweichung aber nur in der L2 -Norm klein, so verstarkt der unbeschrankte inverse Operator Ã−1 die Abweichung beliebig stark! Beispiel 2. Ein typisches Beispiel hierfur ist der Operator h 2 i −1 −k e F f (x). Bf (x) = F~k→~ ~ ~ x→k x Oensichtlich bildet B den L2 (Rn ) auf sich selbst ab. Allerdings werden hohe Frequenzen durch e−k exponentiell geglattet, dass ist schneller als jede Integration (m Integrationen glatten hohe Frequenzen mit |k|−m ). Das heit nicht, dass B nie invertierbar ist. Fur hinreichend glatte Funktionen g(x) (z.B. wenn der Tr ager von ĝ(~k) kompakt ist), ist der inverse Operator 2 h 2 i −1 k B −1 g(x) = F~k→~ e F f (x). ~ ~ x→k x Fur hinreichend glatte Funktionen gilt damit BB −1 = B −1 B = I. Sind die Daten auch nur ein bisschen gestort, so wird dieser Fehler mit ek im Fourier-Bild aufgebauscht! Das hat ganz erhebliche Auswirkungen auf die Rekonstruktion. 2 6. Computertomographie und Radon-Transformation Dabei werden die Untersuchungsobjekte mit Hilfe von nicht strahlenden Quellen wie z.B. Rontgen- oder auch Elektronenstrahlen dargestellt. Rontgenstrahlen bestehen aus Photonen mit hinreichend groer Energie, so dass sie sich entlang gerade Linien bewegen bis sie auf einen Gegenstand treen und absorbiert werden. 6.1. Das 2D-Problem. Es bezeichne ~x ∈ R2 die ortliche Position und θ~ die ~ die Dichte der Rontgenstrahlen an der StelRichtung. Wir bezeichnen mit u(~x, θ) ~ Weiterhin sei a(~x) der lineare Dampfungskoezient. Die le ~x und der Richtung θ. ~ die folgende DieGeschwindigkeit wird auf 1 normiert, so dass die Dichte u(~x, θ) rentialgleichung erfullt: ~ + a(~x) u(~x, θ) ~ = 0, θ~ · ∇~x u(~x, θ) ~x ∈ Ω, θ~ ∈ S 1 . (5) Dabei sei der zu untersuchende Bereich Ω als konvex vorausgesetzt (im Bild nicht erfullt!). Wir identizieren die Einheitsrichtungen θ~ (dafur schreibt man θ~ ∈ S 1 ) mit dem Winkel θ, d.h. θ~ = (cos θ, sin θ)T . Der Advektionsoperator ist dann ∂ ∂ θ~ · ∇~x = cos θ + sin θ ∂x ∂y 6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION 27 ~ modelliert und modelliert die freie Konvektion der Rontgenstrahlen und a(~x) u(~x, θ) die Anzahl der absorbierten Photonen pro Langeneinheit an der Stelle ~x. Die Photonen werden am Rand des Gebiets Gebietes emmitiert und die Photonendichte hat die Form (6) ~ = δ(~x − ~x0 )δ(θ~ − θ~0 ), u(~x, θ) mit ~x0 ∈ ∂Ω und θ~0 zeigt in das Gebiet hinein (die Rontgenstrahlen werden in das Gebiet hingeschickt). x0 + s θ0 ∂Ω Ω x θ θ θ0 x0 n( x0 ) Das Randwertproblem (5),(6), das in geeigneten Koordinaten eine gewohnliche Differentialgleichung 1. Ordnung darstellt, besitzt die Losung Z s ~ ~ ~ u(~x0 + sθ0 , θ0 ) = exp − a(~x0 + tθ0 ) dt , s > 0, ~x0 + tθ~0 ∈ Ω, 0 an allen anderen Stellen. u(~x0 , θ~0 ) = 0 Die Intensitaten werden nun wiederum am Rand gemessen, d.h. wenn die Strahlung in ~x0 emmitiert wurde dann wird nach einer gewissen Zeit τ = τ (~x0 , θ~0 ) in ~x1 = ~x0 + τ θ~0 ankommen. Logaritmiert man nun die Messergebnisse, so verfugt man uber die Daten Z τ (~ x0 , θ~0 ) a(~x0 + tθ~0 ) dt. 0 Das sind Integrale uber den Dampfungskoezienten a entlang des Geradenstucks (~x0 , ~x1 ). Lasst man nun den Punkt ~x0 und die Richtung ~x0 variieren so erhalt man alle Integrale von a(~x) uber die Segmente bzw. da a(~x) durch Null auerhalb von Ω fortgesetzt werden kann, uber alle Geraden, die durch Ω verlaufen. Das entstehende 28 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Problem lautet also: Wie kann man die Funktion a(~x) aus den Integralen über a entlang aller Geraden im R2 rekonstruieren. F ur die praktische Anwendung stehen nur endlich viele Geraden zur Verfugung. Wie man damit umgeht und wie man die Geraden sinnvoll auswahlt, soll hier nicht diskutiert werden obwohl das fur die praktische Anwendung wesentlich ist. 6.2. Die Radon-Transformation im R2 . Zunachst wollen wir das Problem mathematisch sinnvoll beschreiben. Dazu sei O = (0, 0) Ursprung (cos θ, sin θ) = θ~ ∈ S 1 eine beliebige Einheitsrichtung und s ∈ R gebe den vorzeichenbehafteten Abstand der Geraden zum Ursprung. Dann gehoren alle Punkte ~x ∈ R2 mit ~x · θ~⊥ = s, ~ zur Geraden in Richtung mit θ~⊥ = (− sin θ, cos θ) der um 90o gedrehten Richtung θ, θ~ mit dem Abstand s zum Ursprung: g θ θ┴ O Wir denieren fur glatte Funktionen f (~x) in R2 die Radon-Transformation Rf (s, θ) fur (s, θ) ∈ Z = R × (0, 2π) als Z Rf (s, θ) = R ~⊥ ~ dt = f (sθ + tθ) Z f (~x)δ(s − ~x · θ~⊥ ) d~x. R2 Wie man sich leicht uberzeugt ist der Zylinder Z eine doppelte Uberdeckung des 2 Raums aller Geraden des R , da {~x · θ~⊥ = s} = {~x · (−θ~⊥ ) = −s}. Hieraus folgt insbesondere Rf (s, θ) = Rf (−s, θ + π). Es sei Rθ f (s) = Rf (s, θ). Dann gilt 6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION Satz 29 13 (Fourier-Scheiben-Satz) Fourier-Slice Theorem. Es sei f (~x) ∈ . ∞ 2 C0 (R ). Dann gilt fur alle θ~ ∈ S 1 d ˆ ~⊥ [Fs→σ Rθ f ] (σ) = R θ f (σ) = f (σ θ ), σ ∈ R. Beweis: Z −isσ d R θ f (σ) = Z e R f (~x)δ(s − ~x · θ~⊥ ) d~x ds = R2 Z ~⊥ σ e−i~x·θ f (~x) d~x = fˆ(σ θ~⊥ ). R2 # Auf diese Weise haben wir sogar eine Inversions- bzw. Rekonstruktionsformel gewonnen. Man muss nur Rθ f in der Variablen s Fourier-transformieren, um die Fouriertransformierte fˆ(σ θ~⊥ ) zu erhalten. Fur alle Richtungen θ~⊥ erhalt man dann die Fourier-Transformierte fˆ(~k), ~k ∈ R2 und Rekonstruktion erfolgt nun uber die Inversion der Fouriertransformierten. Lemma 1. Es sei f (~x) ∈ C0∞ (R2 ). Dann gilt Rθ ∂f d (s) = θi⊥ (Rθ f )(s). ∂xi ds Diese Formel ist aquivalent zur Formel uber das Verhalten der Fouriertransformierten unter Ableitungen. Beweis: Rθ Z Z ∂f ∂f ⊥ ⊥ ~ (~x) δ(s − ~x · θ ) d~x = θi (s) = f (~x)δ 0 (s − ~x · θ~⊥ ) d~x ∂xi ∂x 2 2 j R R Z ∂ d f (~x)δ(s − ~x · θ~⊥ ) d~x = θi⊥ (Rθ f )(s). = θi⊥ ∂s R2 ds # Wir betrachten nun die Abbildungseigenschaften der Radon-Transformation. Dazu sei χ(~x) ∈ C0∞ (R2 ) eine beliebig oft dierenzierbare Funktion mit kompaktem Trager. Weiterhin sei g(s, θ) ∈ H s (Z), falls ||g||2H s (Z) Z Z = 0 Dann gilt 2π R (1 + σ 2 )s |Fs→σ g(σ)|2 dσ dθ < ∞. 30 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Satz 14. Es sei f (~x) eine Funktion in H s (R2 ) fur s ∈ R+0 . Dann gelten die folgenden Abschatzungen: √ 2 ||f ||H s (R2 ) ≤ ||Rf ||H s+1/2 (Z) , ||R(χ f )||H s+1/2 (Z) ≤ Cχ ||χ f ||H s (R2 ) . Die Konstante Cχ hangt von der Funktion der Groe ihres Tragers ab. χ(~x) und insbesondere von 5. Die Aussage ist auch richtig fur Distributionen aus H s (R2 ) Bemerkung fur s ≤ 0. Wobei die Norm dieser Raume ebenfalls uber die Fouriertransformation deniert wird. \ ~⊥ Beweis: Aus dem Fourier-Scheiben-Satz ergibt sich R θ (w) = ŵ(σ θ ), was bedeu- tet, dass Z Z 2 \ 2 s+1/2 |ŵ(σ θ~⊥ )|2 (1 + σ 2 )s+1/2 dσ dθ dσ dθ = Rθ (w)(σ, θ) (1 + σ ) Z Z (1 + |~k|2 )s+1/2 ~ |ŵ(~k)|2 dk, |~k| R2 Z =2 wobei die Koordinatentransformation von Polar- zu kartesischen Koordinaten mit d~k = σ dσ dθ ausgef uhrt wurde und der Symmetrieeigenschaft fˆ(σ θ~⊥ ) = fˆ((−σ)(−θ~⊥ )). Die erste Ungleichung folgt nun wegen |~k|1 ≥ √ 1 ~ 2 mit w(~x) = f (~x). Die zweite Be1+|k| ziehung ist etwas komplizierter zu beweisen. Wir spalten das Integral auf in eine Integration uber den Bereich |~k| > 1 und eine Integration u ber den Einheitskreis q √ |~k| < 1. F ur |~k| > 1 ist 1 + |~k|2 ≤ 2|~k| und damit √ Z I1 ≤ 2 2 R2 √ |χcf (~k)|2 (1 + |~k|2 )s d~k ≤ 2 2 ||χ f ||2H s . Wegen |~k| < 1 ist Z 2π Z 1 2 ~ 2 s+1/2 c 2 (1 + |k| ) c ~ ~ 2 |χ f (k)| dk = χ f (σ, θ~⊥ ) (1 + σ 2 )s+1/2 dσ dθ ~ ~ |k| |k|<1 0 −1 Z 1 ≤ ||χcf ||2L∞ (R2 ) (1 + σ 2 )s+1/2 dσ ≤ C ||χcf ||2L∞ (R2 ) Z −1 Nun sei ψ eine auf R2 glatte beschrankte Funktion mit kompaktem Trager und ψ(~x) = ~ 1 auf dem Trager von χ, so dass ψ χ f = χ f ist und auerdem sei ψ~k (~x) = e−i~x·k ψ(~x). Mit Hilfe der Denition der Fouriertransformation, der Parsevalschen Gleichung und 6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION 31 der Cauchy-Schwarzschen-Ungleichung hf, giL2 ≤ ||f ||L2 ||g||L2 folgt Z Z 1 ~ χcf (ξ) ~ dξ~ ϕ~k (~x)(χ f )(~x) d~x = |χcf |(~k) = |ψ[ χ f |(~k) = ϕ c ( ξ) ~ (2π)2 R2 k R2 Z ~ ϕ c~k (ξ) 1 2 s/2 c ~ ~ ≤ ||ψ~ ||H −s (R2 ) ||χ f ||H s (R2 ) . (1 + |ξ| ) χ f ( ξ) d ξ = k (2π)2 R2 (1 + |ξ|2 )s/2 Da ψ eine glatte beschrankte Funktion mit kompaktem Trager ist, ist dies auch ψ~k fur alle ~k mit |~k| < 1, so dass ψ~k ∈ H −s (R2 ) fur alle s ∈ R und fur alle |~k| < 1 ist. Damit ergibt sich die 2. Behauptung. # 6.3. Inversionsformel für die 2D Radon-Transformation. Wir wollen nun eine explizite Rekonstruktionsformel ableiten. Dafur werden wir zunachst einige Operatoren betrachten und anschlieend die Inversionsformel daraus aufbauen. Als erstes betrachten wir den zur Radon-Transformation adjungierten (dualen) Operator R∗ im Raumpaar L2 (Z) und L2 (R2 ). Der adjungierte Operator ist deniert durch hg, Rf iZ = hR∗ g, f iR2 . Es ist Z 2π hg, Rf iZ = 0 Z = R2 2π Z Z Z Z g(s, θ) g(s, θ)(Rf )(s, θ) ds dθ = 0 R R Z Z 2π Z ⊥ g(s, θ)δ(s − ~x · θ ) ds dθ d~x = f (~x) 0 δ(s − ~x · θbot ) d~x ds dθ Z 2π g(~x · θ⊥ , θ) dθ d~x f (~x) R2 R2 R 0 = hR∗ g, f iR2 und folglich ∗ Z (R g)(~x) = 2π g(~x · θ⊥ , θ) dθ, ~x ∈ R2 . 0 Als weiteren Operator betrachten wir die Hilbert-Transformation: 1 Hf (t) = CH π Z R f (s) ds. t−s Dabei bedeutet CH , dass das Integral im Sinne des Cauchyschen Hauptwerts zu verstehen ist, d.h. 1 Hf (t) = lim π ε→0+ Z R\(t−ε, t+ε) f (s) ds. t−s Beide Operatoren sind lokal im Frequenz- bzw. Fourierbereich, in der Weise, dass ihre Fouriertransformierten zu Multiplikationen im Frequenzbereich fuhren. Was das konkret bedeutet zeigt das folgende Lemma: 32 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Lemma 2. Es gilt ~ ~ = 2π (Fs→σ g) −|ξ|, F~x→ξ~(R∗ g) (ξ) ~ |ξ| ⊥ ⊥ ~ ~ ξ ~ − ξ , + (Fs→σ g) |ξ|, ~⊥ ~⊥ ξ ξ (Ft→σ Hf ) (σ) = −i sign (σ)Ft→σ f (σ). Wir identizieren θ~ = (cos θ, sin θ) mit θ ∈ S 1 and θ ∈ (0, 2π), und analog g(θ) = ~ Setzt man nun voraus, dass g(s, θ) = g(−s, θ + π) ist, was f g(θ). ur das Bild der ~ = ĝ(−σ, −θ) ~ Radon-Transformation erfullt ist und was impliziert, dass ĝ(σ, θ) gilt, so kann man kurzer schreiben: ⊥ ~ ∗ g(ξ) ~ − ξ , ~ = 4π ĝ |ξ|, d R ~⊥ ~ |ξ| ξ d(σ) = −i sign (σ) fˆ(σ). Hf Beweis: Wir berechnen zunachst die Fouriertransformierte von R∗ g. Dabei be- nutzen wir Z ~x = sθ~⊥ + tθ~ und ∗ g(ξ) ~ = d R Z −i~ x·ξ~ Z e−itτ dt = 2π δ(τ ). −∞ 2π Z ~⊥ ∞ 2π ∞ Z Z ∞ ~ ~~ e−isξ·~x g(s, θ) ds dθ e−itξ·θ dt 0 −∞ −∞ R2 0 ! Z 2π Z 2π ~ ξ ~ dθ = ~ = ĝ(ξ~ · θ~⊥ , θ) 2πδ(ξ~ · θ) ĝ(ξ~ · θ~⊥ , θ) 2πδ |ξ| · θ~ dθ ~ | ξ| 0 0 ! !! ! Z 2π ~⊥ ~⊥ ~ 2π ξ − ξ 2π ξ ~ ~ = ĝ −|ξ|, + ĝ |ξ|, , ĝ(ξ~ · θ~⊥ , θ)δ · θ~ dθ = ~ ~ ~ ~ ~ |ξ| 0 |ξ| |ξ| |ξ| |ξ| g(~x · θ ) dθ d~x = e ~⊥ ⊥ ξ~ ξ −ξ~ ⊥ ~ ~ ~ da · θ = 0 ist fur |ξ|~ = ±θ und |ξ|~ = |ξ| ~ . Ist g = Rf so gilt ĝ −|ξ|, ~ −ξ~⊥ . F ĝ |ξ|, ur die Hilbert-Transformation betrachten wir zunachst ~ |ξ| ξ~ ~ |ξ| Z ∞ CH −∞ eiωx dx = iπ x fur ω > 0. Folglich ist Z ∞ CH −∞ ei(−ω)x dx = −CH x und oensichtlich ist Z ∞ CH −∞ Z ∞ −∞ 1 dx = 0 x eiωτ dτ = −iπ τ ξ~⊥ ~ |ξ| = 6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION 33 und insgesamt Z −iπ, σ > 0, ∞ −ixσ \ 1 e CH = CH dx = 0, σ = 0, = −iπ sign (σ). x x −∞ iπ, σ < 0 Damit ergibt sich fur Hf (t) = π1 CH x1 ∗ f (x) (t) nach dem Faltungssatz 1 \ 1 d (σ)fˆ(σ) = −i sign (σ)fˆ(σ). Hf (σ) = CH π x # Aus den obigen Berechnungen folgt insbesondere, dass H 2 = H ◦ H = −I gilt, wobei I der identische Operator ist. Satz 15. Es sei f (~x) eine glatte Funktion und bezeichne g(s, θ) = die Radon-Transformierte. Dann kann f explizit aus der Radon-Transformierten wie folgt rekonstruiert werden: Rf (s, θ) 1 ∗ R f (~x) = 4π ∂ Hg(s, θ) (~x). ∂s Dabei wird die Hilbert-Transformation auf die Variable s angewandt. Beweis: Es sei w(s, θ) = Da g(−s, θ + π) = g(s, θ) ist, gilt ∂ w(−s, θ + π) = ∂(−s) 1 CH π ∂ Hg(s, θ). ∂s Z ∞ ∂ g(t, θ) 1 g(−τ, θ) dt = CH dτ ∂(−s) π −∞ (−s) − t −∞ −s + τ Z ∞ ∂ 1 g(−τ, θ) =− (−1)CH dτ = w(s, θ). ∂s π s−τ −∞ Z ∞ Damit ist die Aussage des Satzes aquivalent zu ~⊥ 1 ~ = 1 4π ŵ |ξ|, ~ −ξ f (~x) = (R∗ w(s, θ))(~x) ⇐⇒ fˆ(ξ) ~ ~ 4π 4π |ξ| |ξ| ! . (7) Dabei bezeichnet ŵ die Fourier-Transformierte von w bezuglich der ersten Veranderlichen. Fur die Fourier-Transformierte von w bezuglich s gilt: ŵ(σ, θ) = Fs→σ ∂ Hg(s, θ) = (iσ)Fs→σ (Hg(s, θ)) = iσ(−i)sign (σ)ĝ(σ, θ) = |σ|ĝ(σ, θ), ∂s d.h. ŵ(σ, θ) = |σ|ĝ(σ, θ). 34 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Aufgrund der Denition von g und dem Fourier-Scheiben-Satz gilt: ~⊥ ~ −ξ ĝ |ξ|, ~ |ξ| ! ~⊥ ~ −ξ |ξ|, ~ |ξ| d =R θf ! ~⊥ ~ −ξ = fˆ |ξ| ~ |ξ| !⊥ ~ ~ ξ = fˆ |ξ| ~ |ξ| Damit ist (7) gezeigt und die Rekonstruktionsformel bewiesen. Bemerkung ! ~ = fˆ(ξ). # 6. Man konnte die Aussage des Satzes auch so darstellen: I= 1 ∗ ∂ 1 ∗∂ R HR = R H R, 4π ∂s 4π ∂s wobei I der identische Operator ist. Der zu Rθ : L2s (R → L~2x (R2 ), adjungierte Operator ergibt sich aus Z Z Z f (~x)δ(s − ~x · θ ) g(s) d~x ds = (Rθ f )(s) g(s) ds = zu Z ~⊥ R2 R g(~x · θ~⊥ ) f (~x) d~x, R2 R (Rθ∗ g)(~x) = g(~x · θ~⊥ . Wegen θ~⊥ · ∇(Rθ∗ g)(~x) = 2 X 2 θj⊥ j=1 und Rθ∗ X ∂ g(~x · θ~⊥ ) = (θj⊥ )2 g 0 (~x · θ~⊥ ) ∂xj j=1 ∂ g(s, θ) = g 0 (~x · θ~⊥ ), ∂s da s = ~x · θ~⊥ . Damit erhalten wir eine weitere Rekonstruktionsformel, namlich 0 bzw. 1 f (~x) = 4π 2π Z 1 f (~x) = 4π 2π Z 1 θ~⊥ · ∇Rθ∗ HRθ dθ = 4π 1 (Hg (~x · θ~⊥ , θ) dθ = 2 4π 0 0 2π Z Rθ∗ 0 Z 2π ∂ HRθ f dθ, ∂s d g(s, θ) ds x · θ~⊥ − s R ~ Z 0 ds dθ. Die letzte Formel entspricht im wesentlichen Radons ursprunglicher Inversionsformel. Um J. Radons Formel zu erhalten sei 1 F~x (q) = 2π Z 2π (Rf )(~x · θ~⊥ + q, θ) dθ 0 der Mittelwert von Rf uber alle Geraden, die einen Abstand q ≥ 0 von ~x haben. Dann gilt 1 f (~x) = − π Z 0 ∞ d F (q) x dq ~ q dq. 6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION 35 6.4. Die Radon-Transformation im R3 und Inversionsformel. Als RadonTransformation im R3 versteht man das folgende Problem: Die Radon-Transformierte ~ im von f ist das Integral von f (~x) uber alle moglichen Ebenen. Eine Ebene E(s, θ) R3 ist gegeben durch ihren Normalenvektoreinheitsvektor θ~ ∈ S 2 und dem Abstand s vom Ursprung. Oensichtlich hat man auch hier wieder eine doppelte Uberdeckung ~ = E(−s, −θ) ~ aufgrund der Ebenengleichung ~x · θ~ = s. Die in der Weise, dass E(s, θ) Radon-Transformation ist somit gegeben als Z Rf (s, θ) = f (~x) δ(~x · θ~ − s) d~x = Z f dσ. ~ E(s, θ) R3 Wie man leicht nachrechnet gilt damit vollig analog zum 2D Fall der Fourier-ScheibenSatz: c (σ, θ) ~ = fˆ(σ θ). ~ Rf Wie erlautern, was θ~ ∈ S 2 bedeutet: Jedes Element des R3 kann in Polarkoordinaten dargestellt werden als x1 = r sin θ2 sin θ1 , x2 = 2 sin θ2 cos θ1 , x3 = r cos θ2 , mit 0 ≤ r < ∞, 0 ≤ θ1 < 2π, 0 ≤ θ2 < π, d.h. wir identizieren θ~ √mit (θ1 , θ2 ) ∈ S 2 . 2 π 4 √ sin θ2 dθ1 dθ1 = Das ubliche Lebesgue-Ma auf S 2 ist dθ~ = Γ(3/2) sin θ dθ dθ = 2 1 1 3/2 2π π 2π 1 ~ sin θ2 dθ2 dθ1 und d~x = r2 dr dθ. 4π 2 Eine Inversionsformel ergibt sich nun wie folgt. Es sei S2 die obere Halbsphare, d.h. die Menge aller θ~ ∈ S 2 mit θ~ · ~ez > 0. Aus dem Fourier-Scheiben-Satz folgt mit entsprechender Parametrisierung 1 f (~x) = (2π)3 Z Z S2 2 ~x 2 ~ iσθ·~ fˆ(σ θ)e σ dσ dθ~ R Anwendung des Fourier-Scheiben-Satzes ergibt 1 = (2π)3 Z Z S2 2 ~x 2 c (σ θ)e ~ iσθ·~ Rf σ dσ dθ~ R ~ = g(s, θ), ~ wobei s = ~x · θ~ ist erhalt man und mit Rf (s, θ) 1 = (2π)2 Z S2 2 1 2π Z R 1 (−1) σ dσ dθ~ = 2 (2π)2 ~x 2 iσ θ·~ ~ ĝ(σ θ)e Z ~ dθ. ~ g 00 (θ~ · ~x, θ) S2 Dabei haben wir benutzt, dass die Fourier-Transformierte von −f 00 gerade −(iσ)2 fˆ = σ 2 fˆ ist. Somit lautet die Rekonstruktionsformel 1 f (~x) = − 2 8π Z ~ θ) ~ dθ. g 00 (~x · θ, S2 Analog zum 2D Fall kann man die folgenden Abbildungseigenschaften zeigen: 36 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Satz gilt 16. Es existiert eine Konstante Cχ unabhangig von f (~x), so dass √ 2 ||f ||H s (R3 ) ≤ ||Rf ||H s+1 (Z) , ||R(χ f )||H s+1 (Z) ≤ Cχ ||χ f ||H s (R3 ) , mit Z = R × S 2 und g(s, θ) ∈ H s (Z), falls ||g||2H s (Z) Z Z = S2 (1 + σ 2 )s |Fs→σ g(σ)|2 dσ dθ~ < ∞. R Bemerkung 7. Wenn wir die Radon-Transformation im R2 mit der im R3 Bemerkung 8. Die Inversion der 3D Radon-Transformation ist lokal, da- vergleichen, so ist die Transformation im R3 starker glattend als die im R2 , da in 3D die Radon-Transformation um eine volle Ableitung glattend ist wogegen im 2D Fall nur um eine halbe Ableitung geglattet wird. gegen ist das im 2D nicht der Fall. Mit "lokal\ ist hier das folgende gemeint: ~ auf den Ebenen Die Rekonstruktion von f (~x) hangt nur von den Werten g(s, θ) ~ ab, die durch ~x verlaufen (und einer beliebig kleinen Umgebung, so dass E(s, θ) ~ θ) ~ und die zweite Ableitung gebildet werden kann). Oensichtlich gilt ~x ∈ E(~x · θ, alle Ebenen, die durch ~x verlaufen sind von dieser Gestalt. Im 2D Fall beinhaltet die Inversionsformel die Hilbert-Transformation (einen singularen Integraloperator,) der im Unterschied zu Dierentialoperatoren nicht lokal ist. D.h. fur die Rekonstruktion von f an der Stelle ~x muss man die Integrale uber alle Geraden kennen und nicht nur die, die durch den Punkt ~x verlaufen. Definition heit mit 5. Das inverse Problem zu Ax = y, A : L2 (Rn ) → L2 (Rn ) mäßig inkorrekt gestellt, wenn es Konstanten C und α>0 gibt ||Af ||H α (Rn ) ≥ C ||f ||L2 (Rn ) . Insbesondere heit es maig inkorrekt gestellt von der Ordnung α, wenn α das kleinste α ≥ 0 mit dieser Eigenschaft ist. Gibt es kein α mit einer derartigen Eigenschaft, so heit das Problem stark inkorrekt gestellt. Folglich ist die Inversion der Radon-Transformation ein maig inkorrekt gestelltes Problem. In 2D ist die Ordnung 21 in 3D ist sie dagegen 1. 7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE 37 7. Das Cauchy-Problem, Elektrokardiographie Mit der so genannten Elektrokardiographie konnen elektrische Vorgange am Herzen und somit Storungen des Organs aufgezeichnet beziehungsweise sichtbar gemacht werden. Der Herzschlag wird durch eine Folge elektrischer Entladungen in Gang gehalten. Diese gehen von einem Nervenknoten im Herz, dem so genannten Sinusknoten, aus und panzen sich bis zu den Herzkammern fort. Mit Elektroden, die am Korper angebracht werden, kann man diese elektrischen Strome messen und aufzeichnen. Die so erhaltene Herzstromkurve\ nennt man Elek" trokardiogramm, besser bekannt unter seiner Abkurzung EKG\. " Jeder Pumpfunktion des Herzens geht eine elektrische Erregung voraus, die im Normalfall vom Sinusknoten ausgeht und uber das herzeigene Erregungsleitungssystem zu den Muskelzellen lauft. Diese elektrischen Potenzialanderungen am Herzen kann man an der Korperoberache ableiten und in der Zeitachse aufzeichnen. Es resultiert ein immer wiederkehrendes Bild der elektrischen Herzaktion. Mit dem EKG lassen sich vielfaltige Aussagen zu Eigenschaften und Erkrankungen des Herzens treen. Zu beachten ist, dass das Oberachen-EKG nur die elektrische Aktivitat des Herzmuskels anzeigt, nicht jedoch die tatsachliche Auswureistung widerspiegelt. Die folgende Beschreibung der physikalischen Vorgange ist entnommen: http://www.grundkurs-ekg.de/grundlagen/grundlagen.htm#grundlagen An den Zellmembranen von Herzmuskelzellen ( auch Muskel- und Nervenzellen) sind elektrische Potenziale nachweisbar, die aufgrund der Depolarisation und Repolarisation zyklisch auftreten. Die Depolarisation setzt sich von Zelle zu Zelle fort und wandert uber die Muskelfasern hinweg. In den folgenden Graken ist ein Muskelstrang abgebildet, der von links nach rechts depolarisiert wird. Die Animation ist entnommen: http://de.wikipedia.org/wiki/Elektrokardiogramm Durch Anklicken kann man die Animation starten bzw. stoppen. 38 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Ein erregter Muskelbezirk verhält sich gegenüber einem unerregten Bezirk elektrisch negativ, sie bilden einen Dipol, von dem ein elektrisches Feld ausgeht, das an der Körperoberfläche mit Elektroden registriert werden kann. Zwischen gleichmäßig erregten oder gleichmäßig unerregten Muskelbezirken ist kein Potenzialunterschied nachweisbar. ( kein Dipol = kein elektr. Feld = kein Ausschlag im EKG ) Die Muskelzellen befinden sich im Ruhepotenzialund haben extrazellulär eine positive Ladung. In der Umgebung ist kein elektrisches Feld messbar. Die Erregungswelle hat alle Zellen des Muskelstranges erfasst, alle Zellen sind depolarisiet und haben extrazellulär negative Ladung. In der Umgebung ist kein elektrisches Feld messbar. Der Muskelstrang wird von links nach rechts depolarisiert, es entsteht ein elektrischer Dipol, von dem ein elektrisches Feld ausgeht. Die Erregungswelle erzeugt einen positiven Ausschlag, wenn sie auf eine Elektrode zuläuft und einen negativen Ausschlag, wenn sie sich von einer Elektrode weg bewegt. Die zuerst erregten Zellen werden wieder repolarisiert, der Erregungsrückgang ist langsamer und länger, erzeugt eine flache, langgezogene Kurve und ist im Vergleich zur Depolarisation elektrisch entgegengesetzt. 7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE 39 Modelliert wird die ganze Sache nun wie folgt: Es sei Γ0 die auere Oberache, die eine geschlossene innere Oberache umschliet, wo das Potential gemessen wird, und sei Ω das Gebiet mit dem Rand ∂Ω = Γ1 ∪ Γ0 . Δu = 0 Γ1 Ω Γ0 Das elektrische Potential u erfullt die folgende Laplace-Gleichung: ∆u = 0, u = u1 , ∂u = 0, ∂~n in Ω, auf Γ1 , auf Γ1 . Die Funktion u1 beschreibt die Messwerte auf der Oberache Γ1 , die als isoliert angenommen wird, so dass ~n · ∇u = 0 auf Γ1 gilt. Aus den Messwerten wird nun u0 auf Γ0 bestimmt (Vorwartsaufgabe). 7.1. Halbraum-Problem. Die starke Inkorrektheit des inversen Problems lasst sich gut am Halbraum-Modell darstellen. 7.1.1. Elektrokardiograsche Anwendung. Dann lautet das Problem wie folgt: ∂2u ∂2u + = 0, ∂x2 ∂y 2 u(x, 0) = u0 (x), ∂u (x, 0) = g0 (x), ∂y x ∈ R, y > 0, x ∈ R, (8) x ∈ R. Gesucht ist u(x, y) fur eine parallele Gerade y = ρ > 0. Wir bezeichnen mit û(k, y) = (Fx→k u) (k, y) die Fourier-Transformierte bzgl. der x Variablen. Damit ergibt sich des folgende Anfangswertproblem einer gewohnlichen Dierentialgleichung fur û: ∂ 2 û = 0, ∂y 2 û(k, 0) = û0 (k), −k 2 û + ∂ û (k, 0) = ĝ0 (k), ∂y k ∈ R, y > 0, k ∈ R, k ∈ R. 40 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Die Losung ist dann ĝ0 (k) sinh(|k|y). |k| û(k, y) = û0 (k) cosh(|k|y) + Setzt man nun voraus, dass |k| û0 (k) + ĝ0 (k) = 0, so folgt û(k, y) = û0 (k)e−|k|y . Durch Anwendung der inversen Fourier-Transformation erhalt man die Losung: u(x, y) = Bemerkung 1 y u0 ∗ 2 π x + y2 1 (x) = π Z u0 (x − z) R z2 y dz. + y2 9. (i) Es gilt 1 2π Z e−y|k| eixk dk = R 1 y . 2 π x + y2 (ii) Die Kompatibilitatsbedinung |k|û0 (k) + ĝ0 (k) = entspricht |k| |k| kû0 (k) + ĝ0 (k) = 0 ⇐⇒ − (ik)û0 (k) = iĝ0 (k) k k (9) g0 (x) = −Hu00 (x), wobei H die Hilbert-Transformation ist. Ist die Kompatibilitatsbedinung erfullt, so besitzt das Problem (8) eine eindeutige Losung und ist korrekt gestellt, da Z 2 Z u (x, y) dx ≤ R u20 (x) dx, fur alle y > 0. R Dies folgt aus der Parsevalschen Gleichung. Ist die Kompatitbiltatsbedinung aber nicht erfullt, wie das z.B. bei der Elektrokardiographie der Fall ist, wo gilt g0 (x) = 0. In diesem Fall ergibt sich û(k, y) = û0 (k) cosh(|k|y). Folglich werden hohe Frequenzen exponentiell verstarkt fur y > 0. Nehmen wir an, dass das Potential fur y = y0 gesucht ist. Die Vorwartsaufgabe, wo wir u(x, y0 ) kennen und u(x, 0) = A[u(x, y0 )] zu bestimmen ist, ist korrekt gestellt, da (es gilt cosh(|k|y) ≥ 21 e|k|y ) ||Av||L2 (R) ≤ ||v||L2 (R) . Dagegen ist das inverse Problem, welches u0 (x) nach u(x, y0 ) abbildet stark inkorrekt gestellt, da cosh(|k|y) nach nicht durch C(1 + |k|2 )α/2 fur irgendein α beschrankt ist. D.h. der inverse Operator A−1 ist nur fur hinreichend glatte Funktionen deniert, genauer, sei Xy (R) = {u ∈ L2 (R) : cosh(|k|y)û(k) ∈ L2 (R)}. 7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE 41 Dann ist A ein stetiger Operator in L(L2 (R, Xy0 (R)) und der dazugehorige inverse Operator A−1 ist stetig in L(Xy0 (R), L2 (R) und lautet −1 A−1 u = Fk→x (cosh(|k|y)Fx→k u. 7.1.2. Analytische Fortsetzung. Die gleiche Vorgehensweise wie eben kann auf das Problem der analytischen Fortsetzung einer auf der reellen Achse analytischen Funktion angewandt werden. Definition 6. Eine auf einer oenen Teilmenge I ⊆ R denierte Funktion heit reell-analytisch, wenn g lokal in eine Potenzreihe entwickelbar ∞ P ist, d.h. fur jedes t0 ∈ I gibt es eine reelle Potenzreihe an (t − t0 )n mit an ∈ R, n=0 die in einer Umgebung von t0 die Funktion g darstellt. g : I → R, Definition 7. Eine komplexwertige Funktion f (z) = g(x, y) + ih(x, y) ist in z0 analytisch (oder holomorph), wenn ∂f ∂ ∂ = +i (g(x, y) + ih(x, y)) = 0. ∂z ∂x ∂y (10) Die Bedingung (10) ist aquivalent zu ∂g ∂h − = 0, ∂x ∂y ∂g ∂h + = 0. ∂x ∂y Dieses Cauchy-Riemann-System impliziert, dass g und h harmonische Funktionen sind, ∆g = ∆h = 0. Es sei f (z) = g(z) + ih(z) eine analytische Funktion mit den reell-wertigen Funktionen g und h. Die reell-wertigen Funktionen g und h seien entlang der reellen Achse Im (z) = 0 gegeben. Man bestimme f (z) aus g(x, 0) = g(x) und h(x, 0) = h(x). Wir identizieren z = x+iy und setzen voraus, dass g(x) und h(x) Distributionen aus S 0 sind, so dass ihre Fourier-Transformierten deniert sind. Dann muss das folgende Problem gelost werden: ∆g = 0, y > 0, ∂g ∂h (x, 0) = − (x, 0), ∂y ∂x g(x, 0) bekannt ∆h = 0, y > 0, ∂h ∂g (x, 0) = (x, 0), ∂y ∂x h(x, 0) bekannt. Die Losungen beider Probleme sind im Frequenzbereich gegeben durch ĝ(k, y) = ĝ(k, 0) cosh(|k|y) − i sign (k)ĥ(k, 0) sinh(|k|y); ĥ(k, y) = ĥ(k, 0) cosh(|k|y) + i sign (k)ĝ(k, 0) sinh(|k|y). 42 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION Das Problem ist korrekt gestellt, wenn die Kompatibilitatsbedingungen (9) erfullt sind, d.h. ∂h ∂g =H , ∂x ∂x ∂g ∂h = −H , ∂x ∂x wegen H 2 = −I sind beide Gleichungen aquivalent. Sind die Kompatibilitatsbedingungen erfullt, so ist das Problem stabil, ansonsten wachsen die hohen Frequenzen exponentiell mit y. Folglich ist das Problem der analytischen Fortsetzung stark inkorrekt. 7.2. Der allgemeine 2D-Fall. Wir wollen das elektrokardiograsche Problem r=1 in 2D fur relativ allgemeine Geometrien losen. Dazu benotigt man die Losung fur einen Kreisring und den Riemannschen Abbildungssatz. 7.2.1. Die Laplace-Gleichung im Kreisring. Wir betrachten zunachst einen Kreisring mit dem inneren Radius 1 und dem aueren Radius ρ > 1. Durch Streckung bzw. Stauchung kann daraus jeder Kreisring mit beliebigen Radien a und b gewonnen werden. r=ρ In Polarkoordinaten hat der Laplace-Operator die Gestalt: 1 ∂ ∆u = r ∂r ∂u r ∂r + 1 ∂2u . r2 ∂θ2 Macht man den Separationsansatz mit u(r, θ) = u(r, θ + 2π) : u(r, θ) = R(r)Θ(θ) und setzt diesen in die Dierentialgleichung ein, so folgt: 1 R00 (r) R0 (r) Θ00 (θ) 1 0 R (r)Θ(θ) + R00 (r)Θ(θ) + 2 Θ00 (θ) = 0 ⇐⇒ r2 +r =− = λ. r r R(r) R(r) Θ(θ) Folgt Θ00 (θ) + Θ(θ) = 0 mit Θ(θ) = Θ(θ + 2π) und ergibt λ = n2 und Θ(θ) = A cos(nθ) + B sin(nθ), n = 1, 2, . . . 7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE 43 und fur λ = 0 ist Θ(θ) = A = const eine Losung. Die gewohnliche Dierentialgleichung fur R ist eine Eulersche Dierentialgleichung und kann uber den Ansatz R(r) = rα gelost werden. Man erhalt α(α − 1) rα + α rα − n2 rα = 0, also α2 = n2 bzw. α = ±n. Damit wird R(r) = Crn + Dr−n und die separierte Losung bekommt die Gestalt u(r, θ) = (Crn + Dr−n )(A cos(nθ) + B sin(nθ)), n = 1, 2, . . . . Fur n = 0 brauchen wir neben R = const eine weitere linear unabhangige Losung und diese ist R(r) = ln r. Damit haben wir fur n = 0 die Losung u(r, θ) = C + D ln r. Alle Losungen sind harmonisch in der punktierten Ebene R2 \{0}. Weiterhin sind alle Funktionen endlich im Kreisring, d.h. die allgemeine Losung ist u(r, θ) = C0 + D0 ln r + ∞ X (Cn rn + Dn r−n )(An cos(nθ) + Bn sin(nθ)). n=1 Wegen u(1, θ) = u1 (θ) ergibt sich ∞ a0 X (an cos(nθ)+bn sin(nθ)), C0 + (Cn +Dn )(An cos(nθ)+Bn sin(nθ)) = u1 (θ) = + 2 n=1 n=1 ∞ X d.h. (Cn + Dn )An = an sowie (Cn + Dn )Bn = bn und mit ~n · ∇u = 0 auf r = 1 folgt ∞ X ∂u r (nCn rn − nDn r−n )(An cos(nθ) + Bn sin(nθ)) = D0 |r=1 + ∂r r=1 n=1 =0 r=1 ergibt sich D0 = 0 sowie Cn = Dn , n = 1, 2, . . . . Also ist ∞ a0 X u(r, θ) = + 2 n=1 rn + r−n 2 (an cos(nθ) + bn sin(nθ)), wobei 1 an = π Z 2π u1 (ϕ) cos(nϕ) dϕ 0 und 1 bn = π Z 2π u1 (ϕ) sin(nϕ) dϕ 0 die entsprechenden Koezienten der Fourierreihe von u1 (θ) sind. InRkomplexer Schreib 2π a0 1 1 −ikϕ weise ergibt sich wegen c0 = 2 und c±k = 2 (ak ∓ibk ) und ck = 2π 0 u1 (ϕ)e dϕ die Losung: n Z 2π ∞ X 1 r + r−n −inϕ u1 (ϕ)e dϕ einθ . u(r, θ) = 2π 4 0 n=−∞ Wie man leicht sieht wachst ein Fehler δ bei der Bestimmung der Fourier-Koezienten von u1 zu einem Fehler der Groe cδen ln ρ an der Stelle r = ρ 44 1. INVERSE PROBLEME UND FOURIER TRANSFORMATION im Fourierkoezienten der Losung u. Folglich kann der Fehler nicht durch Cnα fur irgendein α > 0 abgeschatzt werden, was bedeuten wurde, dass der Fehlerniveau α-mal abgeleitet w urde. Damit ist das Rekonstruktionsproblem stark inkorrekt. Bemerkung 10. Oftmals wird genau diese Beschrankung der Fehlerfortpan- zung mit Cn als Denition der maigen Inkorrektheit gewahlt. α 7.2.2. Riemannscher Abbildungssatz. Es sei Ω ein oenes glattes 2D Gebiet mit glattem Rand ∂Ω = Γ0 ∪ Γ1 , der aus 2 glatten und zusammenhangenden Teilen besteht, die auere Anteil sei mit Γ0 und die innere Anteil mit Γ1 bezeichnet. Wir konstruieren nun eine holomorphe Funktion Ψ(z), die Ω auf den Kreisring 1 < r < ρ abbildet. Konstruktionsidee: Es sei v die eindeutig bestimmte Losung des Dirichlet-Problems: ∆v = 0 in Ω, v |Γ0 = 1, v |Γ1 = 0. Es sei nun G = cv mit einem spater zu bestimmenden c = const. Dann gilt Z ∂G ∂G dx + dy = −c I= − ∂y ∂x Γ1 Z Γ1 ∂v ds > 0. ∂~n Nach dem Maximumprinzip harmonischer Funktionen nimmt, v sein Minimum und Maximum auf dem Rand an, d.h. es gilt 0 < v(z) < 1, und die Ableitung in Richtung der aueren Normalen muss negativ sein. Nun sei c so gewahlt, dass I = 2π gilt. Weiterhin sei H(z), die zu G(z) konjugiert harmonische Funktion, d.h. G(z) + iH(z) ist holomorph und G(z), H(z) sind harmonisch, welche gegeben ist durch Z z − H(z) = p ∂G ∂G dx + dy, ∂y ∂x wobei p ein beliebiger Punkt in Ω ist. Da G eine harmonische Funktion ist, ist das Integral wegunabhangig. Unmittelbar folgt, dass ∂H ∂G =− , ∂x ∂y ∂H ∂G = , ∂y ∂x was heit, dass G + iH holomorph ist in Ω. Dann ist auch Ψ(z) = eG(z)+iH(z) holomorph. Nun gilt: • Ψ(z) bildet Γ0 auf den Kreis |z| = ec ab und Γ1 auf den Einheitskreis |z| = 1. • Es ist ∆Ψ(z) = 0 in Ω, da Ψ holomorph ist. • Ψ ist ein Dieomorphismus zwischen Ω und dem Kreisring Kc = {z ∈ C : 1 ≤ |z| ≤ ec }. Deshalb kann das Problem fur Ω ersetzt werden durch das Losen der Laplace-Gleichung fur den Kreisring Kc mit den Rannbedingungen u1 (Ψ(z)) auf dem Einheitskreis und verschwindender Neumannscher Randbedingung. (Man kann zeigen, dass die Neumannsche Randbedingung unter der Abbildung Ψ invariant ist.) 7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE Bemerkung 45 11. Der Nachweis, dass diese Konstruktion die gewunschten Eigenschaften hat, kann dadurch erbracht werden, dass man zeigt, dass jedes 2-fach zusammenhangende Gebiet (mit glattem Rand) in der komplexen Ebene uber eine konforme Abbildung auf einen Kreisring abgebildet werden kann. (siehe z.B.: Y. Komatu, Existence Theorem of confomal mapping of doublyconnected domains, Ko dai Math. Sem. Rep., No.5-6, 1949 ) Eine weitergehende Aussage, die obige Konstruktion als Spezialfall ergibt, ist Theorem 10, Seite 255, aus: L.V. Ahlfors, Complex Analysis, An Introduction to the Theory of Analytic Functions of One Complex Variable, 3rd Edition, International Series in Pure and Applied Mathematics, McGraw-Hill, Inc, 1979. KAPITEL 2 Identifikationsprobleme in Hilbert-Räumen Bevor wir einige Begrie der Hilbert-Raum-Theorie wiederholen, wollen wir uns mit dem Begri der verallgemeinerten Inversen beschaftigen. Verallgemeinerte Inverse werden benotigt, wenn ein Problem nicht (z.B. ein uberbestimmtes Problem mit zu vielen Bedingungen) bzw. nicht eindeutig (z.B. ein unterbestimmtes Problem mit nicht genugend Bedingungen) losbar ist. Beispiel 3. \Minibeispiel\: Wir betrachten die lineare Abbildung T , die den Hilbert-Raum R3 in den Hilbert-Raum R3 abbildet und durch die Matrix 1 0 0 T = 0 0 0 0 0 1 gegeben ist. Wie man leicht sieht ist R(T ) = R2 , da die mittlere Komponente immer auf 0 abgebildet wird. Auch ist die Matrix naturlich nicht invertierbar, da die Determinante gleich Null ist. Genauso schnellsiehtman ein, dass das zugehorige Gleichungssystem fur jede rechte y1 Seite ~y = 0 y3 deutig!!) ist und fur y1 ~y = y2 , y2 ∈ R\{0}, y3 losbar (nicht ein- nicht losbar ist. Die verallgemei- nerte Inverse kann nun als sogenannte Kleinste-Quadrate-Losung (least-square solution) bestimmt werden. ~x ∈ R3 heit Kleinste-Quadrate-Lösung von T ~x = ~y , wenn ||T ~x − ~y || = inf{||T ~z − ~y ||, ~z ∈ R3 }. Fur unser Beispiel gilt Folglich sind 1/2 ||T z − y|| = (z1 − y1 )2 + y22 + (z3 − y3 )2 ≥ |y2 |. y1 alle ~z = z2 osungen. Das Kleinste-Quadrate-L y3 sind naturlich "zu viele\ Losungen. Deshalb verscharfen wir den Losungsbegri: ~x ∈ R3 heit Minimum-Norm-Lösung (best-approximate solution) von T ~x = ~y , 47 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 48 wenn ||~x|| = inf{||~z∗ || : ||T ~z∗ − ~y || = inf3 {||T ~z − ~y ||, ~z∗ ∈ R3 }. ~ z ∈R Die Minimum-Norm-Losung ~x in unserem Beispiel ist deshalb y1 ~x = 0 y3 die Minimum-Norm-Losung. Man beachte, dass auf diese Weise ein, im klassischen Sinne, nicht eindeutig losbares Problem und unlosbare Probleme die gleiche Minimum-Norm-Losung besitzen. Bemerkung 12. Man uberlege sich, dass die Kleinste-Quadrate-Losung = Minimum-Norm-Losung von gerade ~x = y1 +y5 2 y2 +y4 2 y3 1 0 0 0 1 0 1 0 1 0 0 0 1 0 0 x 1 x2 = x3 y1 y2 y3 y4 y5 ist. Hinweis: Minimierung von f (x1 , x2 , x3 ) = ||T x − y||2 = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 + (x2 − y4 )2 + (x1 − y5 )2 . 1. Einige Grundbegriffe der Hilbert-Raum-Theorie Ein reeller Hilbert-Raum H ist ein normierter Raum mit einem Skalarprodukt h, i, das die folgenden Eigenschaften besitzt: F ur alle x, y, z ∈ H und λ ∈ R gilt: (1) hx, xi ≥ 0 und hx, xi = 0 ⇐⇒ x = 0, (2) hx, yi = hy, xi, (3) hλx + y, zi = λhx, zi + hy, zi. Durch das Skalarprodukt wird eine Norm, die sogenannte induzierte Norm, bestimmt, p es ist ||x|| := hx, xi. Es gilt • die Cauchy-Schwarzsche Ungleichung: |hx, yi| ≤ ||x|| ||y|| f ur alle x, y ∈ H, • der Satz des Pythagoras: ||x + y||2 = ||x||2 + ||y||2 f ur alle x, y ∈ H. Definition rabel, 8. Ein metrischer (oder auch topologischer) Raum heit sepa- wenn er eine abzahlbare dichte Teilmenge besitzt. Lemma 3. Fur einen normierten Raum X sind aquivalent: 1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE 49 (1) X ist separabel, (2) Es gibt eine abzahlbare Menge A mit X = lin A. (X ist gleich der Ab- schlieung der linearen Hulle von A.) Beweis: D. Werner, Funktionalanalysis, Springer-Verlag, 4. Auage 2005, Seiten 28 und 29. Wir werden nur separable Hilbert-Raume betrachten. Separable Hilbert-Raume besitzen u.a. endliche oder abzahlbare Orthonormalsysteme, die eine Anwendung der Theorie der Fourierreihen und damit eine explizite Entwicklung von Elementen des Hilbert-Raumes sowie von Operatorbildern in eine Reihe ermoglichen. Wir bezeichnen mit T ⊥ := {x ∈ H : hx, zi = 0 f ur alle z ∈ T} das orthogonale Komplement T ⊥ einer Teilmenge T von H. Das orthogonale Komplement H1⊥ eines Teilraums H1 von H (d.h. die Teilmenge H1 ist ein Vektorraum) ist ein abgeschlossener Teilraum von H. Ist H1 (also der Teilraum selbst) ein abgeschlossener Teilraum von H, so kann H als orthogonale Summe H = H1 ⊕ H1⊥ dargestellt werden, d.h. fur jedes Element x ∈ H gibt es eindeutig bestimmte Elemente x1 ∈ H1 und x2 ∈ H1⊥ mit x = x1 + x2 . Eine Folge {en } ⊂ H heit Orthonormalsystem, wenn die Orthonormalitatsrelationen ( 1 f ur m = n, hem , en i = 0 f ur m 6= n, gelten. Das Orthonormalsystem heit vollständig, wenn sich jedes Element x ∈ H in eine konvergente Fourier-Reihe x= n X hx, en i en , n=1 entwickeln lasst, wobei fur alle x ∈ H die Parsevalsche Gleichung ∞ X hx, en i2 = ||x||2 n=1 erfullt ist. Ist das Orthonormalsystem nicht vollstandig, so gilt die Besselsche Ungleichung: ∞ X hx, en i2 ≤ ||x||2 n=1 Die Darstellung stetiger linearer Funktionale ergibt sich aus dem Satz von Riesz: Zu jedem stetigen linearen Funktional f ∈ L(H, R uber dem Hilbert-Raum H existiert ein eindeutig bestimmtes Element g ∈ H, so dass f (x) = hx, gi f ur alle x∈H 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 50 gilt. Unter allen Konstanten C mit |f (x)| ≤ C ||x|| f ur alle x∈H ist C = ||g|| der kleinstmogliche Wert. 1.1. Eigenschaften beschränkter linearer Operatoren in Hilbert-Räumen. Es seien X und Y separable reelle Hilbert-Raume und a ∈ L(X, Y ) ein stetiger linearer Operator. Uber die Beziehung hAu, viY = hu, A∗ viX fur alle u ∈ X und v ∈ Y lasst sich in eindeutiger Weise der zu A adjungierte Operator A∗ ∈ L(Y, X) denieren. Bemerkung 13. Der adjungierte Operator ist i.Allg. fur stetige lineare Abbil- dungen in Banach-Raumen erklart. Es gilt: Sei T : X → Y ein stetiger linearer Operator, der den Banach-Raum X in den Banch-Raum Y abbildet. Dann seiX 0 der Dualraum zu X und Y 0 der Dualraum zu Y. Fur jedes stetige lineare Funktional y0 ∈ Y 0 ist y0 (T x) wohldeniert. Nun ist der zu T adjungierte Operator T 0 deniert durch (T 0 y 0 )(x) := y 0 (T x). Dieser Operator ist linear und beschrankt, da (T 0 (c1 y10 +c2 y20 )(x) = (c1 y 0 +c2 y 0 )(T x) = c1 y 0 (T x)+c2 y20 (T x) = c1 (T 0 y10 )(x)+c2 (T 0 y20 )(x) und 0 0 0 0 |T y (x)| = |y (T x)| ≤ ||y ||Y also ||T 0 y0 ||X 0 0 |T 0 y 0 (x)| ≤ ||y 0 ||Y 0 · ||T ||L(X, Y ) , · ||T ||L(X, Y ) · ||x||X , ⇐⇒ ||x||X ≤ ||y 0 ||Y 0 · ||T ||L(X, Y ) und damit ist ||T 0 ||L(Y 0 , X 0 ) ≤ ||T ||L(X, y) . (Genauer: es gilt die Gleichheit.) Sind nun X und Y sogar Hilbert-Raume und JX : X → X 0 sowie JY : Y → Y 0 die Isometrien aus dem Rieszschen Darstellungssatz, so sei fur T ∈ L(X, Y ) T ∗ = JX−1 T 0 JY die Hilbert-Raum-Adjungierte zu T. Wie man leicht sieht gilt −1 0 Y Y 0 T X 0 JX X Y J→ → → und hT x, yiY = y 0 (T x) = (JY y)(T x) = (T 0 JY y)(x) = hx, JX−1 T 0 JY yiX = hx, T ∗ yi. T∗ ist wiederum ein linearer beschrankter Operator Y → X. 1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE 51 Zwischen den Nullraumen (Kernen) N (A) und N (A∗ ) sowie den Bildraumen R(A) und R(A∗ ) bestehen die Beziehungen: X = N (A) ⊕ R(A∗ ) und Y = R(A) ⊕ N (A∗ ). Definition 9. Seien X, Y Banach-R aume. T ∈ L(X, Y ) heit FredholmOperator, wenn N (T ) endlich dimensional und die Kodimension von R(T ), also codim Y R(T ), ebenfalls endlich ist. Die Ganze Zahl ind T = dim N (T ) − codim R(T ) heit Index des Fredholm-Operators. Bemerkung 14. Ist T ∈ L(X, Y ) ein Fredholm-Operator, so ist der adjun- gierte Operator T 0 ∈ L(Y 0 , X 0 ) ebenfalls ein Fredholm-Operator und es gilt dim N (T 0 ) = dim R(T ), Satz codim R(T 0 ) = dim N (T ) ⇒ ind T = −ind T 0 . 17. Riesz-Schauder. Sei X ein unendlich dimensionaler Banach- Raum und T ∈ K(X) ein vollstetiger (kompakter) Operator. Dann gilt (1) 0 ist ein Spektralwert von T. (2) Tλ = T − λI ist fur λ 6= 0 ein Fredholm-Operator vom Index Null, insbesondere ist jeder Spektralwert Eigenwert. (3) Es gibt hochstens abzahlbar viele Eigenwerte, die keinen Haufungspunkt haben auer eventuell Null. Als Folgerung ergibt sich die Fredholmsche Alternative: Es sei X ein Banach-Raum und T ∈ K(X) sowie λ 6= 0. Dann hat entweder die homogene Gleichung λx − T x = 0 nur die triviale Losung, und in diesem Fall ist die inhomogene Gleichung λx − T x = y fur jedes y ∈ X eindeutig losbar, oder es existieren n = dim N (λI − T ) < ∞ linear unabhangige Losungen der homogenen Gleichung, und auch die adjungierte Gleichung λx0 − T 0 x0 = 0 hat genau n linear unabhangige Losungen; in diesem Fall ist die inhomogene Gleichung genau dann losbar, wenn y ∈ (N (λI − T 0 ))⊥ ist. 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 52 Definition normal, wenn 10. Sei X ein Hilbert-Raum. Dann heit der Operator T ∈ L(X) T ∗T − T T ∗ = 0 gilt. Insbesondere sind selbstadjungierte Operatoren normal. Satz 18. Spektralsatz für vollstetige (kompakte) normale Operato- Ist X ein (komplexer) Hilbert-Raum und T ∈ K(X) normal, T 6= 0, so gilt: (1) Es gibt ein Orthonormalsystem {ek }k∈N mit N ⊂ N und 0 6= λk ∈ C, so dass T ek = λk ek f ur k ∈ N, σ(T )\{0} = {λk ; k ∈ N }, d.h. die Zahlen λk sind die von Null verschiedenen Eigenwerte von T mit Eigenvektoren ek . (Beachte: Werte λk konnen fur verschiedene k gleich sein!) Falls N unendlich ist, konvergiert λk → 0 f ur k → ∞. (2) Die Ordnung der Eigenwerte nλ = 1 fur alle k. ren. k (3) X = N (T ) ⊕ span {ek , k ∈ N }. P λk hx, ek iX ek f ur alle x ∈ X. (4) T x = k∈N (5) Ist T selbstadjungiert, d.h. T ∗ = T und positiv semidenit, d.h. hT x, xiX ≥ 0 Eigenwert. Bemerkung fur alle x ∈ X, so gilt σp (T ) ⊂ [0, ||T ||] und ||T || ist 15. 1. (5) ist eigentlich nur eine Folgerung, denn es gilt λ||x||2X = hλx, xiX = hT x, xiX = hx, T ∗ xiX = hx, T xiX = hx, λxiX = λ||x||2x , also λ = λ ≥ 0. 2. Insbesondere sind fur einen beliebigen Operator A ∈ (X, Y ) die Operatoren A∗ A ∈ L(X) und AA∗ ∈ L(Y ) selbstadjungiert bzw. normal. Beispiel 4. Fredholmsche Integralgleichung 2. Art in L2 [0, 1], Z −λf (s) + 1 k(s, t) f (t) dt = g(s), 0 mit λ 6= 0, kann man schreiben als (K − λI)f = g, 1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE 53 wobei K der von k(. .) erzeugte Integraloperator ist. Ist k symmetrisch, d.h. k(s, t) = k(t, s), und quadratisch integrierbar, dann ist K ein vollstetiger (kom- pakter) und selbstadjungierter Operator. Falls λ kein Eigenwert von K ist, dann ist (K − λI)−1 ein beschrankter linearer Operator und die Fredholmsche Integralgleichung 2. Art hat fur jedes g ∈ L2 [0, 1] eine eindeutig bestimmte Losung f = (K − λI)−1 g, in L2 [0, 1], die stetig von g abhangt. D.h. die Fredholmsche Integralgleichung 2. Art ist ein korrekt gestelltes Problem, wenn λ kein Eigenwert ist, d.h. wenn die homogene Gleichung keine nichttrivialen Losungen besitzt. Ist dagegen λ ein Eigenwert, so ist noch nichts verloren, denn dann gibt es eine Losung genau dann, wenn g ∈ R(K − λI) = N (K − λI)⊥ , d.h. wenn g orthogonal zu allen Eigenvektoren zum Eigenwert λ ist. In diesem Fall ist jede Funktion der Gestalt f= X hg, vi i 1 vi − P g + ψ, λi − λ λ i, i6=j mit λ = λj (der Term fur λi = λ steht nicht in der Summe), wobei ψ eine beliebe Funktion des Eigenraums N (K − λI) und P g die orthogonale Projektion von g auf N (K) ist. Was passiert im Fall der Fredholmschen Integralgleichung 1. Art, die ein stark inkorrektes Problem darstellt. Wir betrachten auch dieses Problem als Operatorgleichung Kf = g mit einem linearen vollstetigen (kompakten) Operator K : H1 → H2 aus dem HilbertRaum H1 in den Hilbert-Raum H2 . (K wird nicht als selbstadjungiert vorausgesetzt.) Dann sind, wie man leicht leicht nachvollzieht, sind K ∗ K und KK ∗ positiv semidenit in H1 bzw. H2 und besitzen die gleichen Eigenwerte λ1 ≥ λ2 ≥ . . . mit den dazugehorigen orthonormalen Eigenvektoren v1 , v2 , . . . . Dann ist die Menge der Eigenvektoren ein vollstandiges Orthonormalsystem in R(K ∗ K) = N (K)⊥ . Es sei nun √ µj = λj dann gilt K ∗ u j = µj v j und uj := µ−1 j Kvj und KvJ = µj uj und auerdem gilt KK ∗ uj = µj Kvj = µ2j uj = λj uj und wie man leicht nachpruft bilden die orthonormalen Eigenvektoren {uj } von KK ∗ eine vollstandiges Orthonormalsystem fur R(KK ∗ ) = N (K ∗ )⊥ . 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 54 Definition 11. Das System {vj , uj ; µj } heit singuläres System des Operators K ∈ K(H1 , H2 ). und die Werte µj heien Singulärwerte von K. Jedes f ∈ H1 hat die Darstellung f = Pf + ∞ X hf, vj ivj , j=1 wobei P die orthogonale Projektion von H1 auf N (K) ist. Folglich ist Kf = ∞ X µj hf, vj iuj . j=1 Diese Darstellung des Operators K heit Singulärwertzerlegung von K. Hat nun die Fredholmsche Integralgleichung 1. Ordnung Kf = g eine Losung f, dann ist g ∈ R(K) und 1 1 1 |hg, uj i|2 = |hKf, Kvj i|2 = |hf, vj i|2 . λj λj µj Mit Hilfe der Besselschen Ungleichung folgt hieraus ∞ ∞ ∞ X X |hg, uj i|2 X 1 2 = |hg, u i| = |hf, vj i|2 ≤ ||f ||2 < ∞. j 2 µ λ j j=1 j j=1 j=1 Ist umgekehrt g ∈ R(K) = N (K ∗ )⊥ und gilt ∞ ∞ X |hg, uj i|2 X 1 = |hg, uj i|2 < ∞, 2 µ λ j j=1 j j=1 dann ist jede Funktion der Form ∞ X hg, uj i f= vj + ϕ µj j=1 mit ϕ ∈ N (K) eine Losung von Kf = g. Damit haben wir die Satz 19. Picard-Bedinung. Sei K : H1 → H2 ein vollstetiger (kom- pakter) Operator mit dem singularen System g ∈ R(K) liegt genau dann in R(K), wenn gilt {vj , uj ; µj }. ∞ X |hg, uj i|2 < ∞. 2 µ j j=1 Ein Element 1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE 55 1.2. Verallgemeinerte oder Moore-Penrose-Inverse. Zu gegebenem g ∈ H2 suchen wir eine Losung der Gleichung Af = g, A ∈ L(H1 , H2 ). Als erstes suchen wir alle die Elemente f ∈ H1 fur die gilt ||Af − g||H2 ≤ ||Aϕ − g||H2 Satz valent: fur alle ϕ ∈ H1 . 20. Sei g ∈ H2 und A ∈ L(H1 , H2 ). Dann sind folgende Aussagen aqui- (1) f ∈ H1 erfullt Af = PR(A) g. (2) f ∈ H1 minimiert das Residuum: ||Af − g||H2 ≤ ||Aϕ − g||H2 fur alle ϕ ∈ H1 . (3) f ∈ H1 lost die Normalgleichung A∗ Af = A∗ g. Bemerkung 16. Die Normalgleichung verdankt ihren Namen der Tatsache, dass das Residuum Af − g senkrecht (normal) auf dem Bild von A steht: A∗ Af = A∗ g ⇐⇒ A∗ (Af − g) = 0 ⇐⇒ Af − g ∈ N (A∗ ) = R(A)⊥ . (11) Der Beweis des Satzes ist leicht nachzuvollziehen. Wenn wir also Losungen der Gleichung Af = g nden wollen, so mussen wir uns mit der Normalgleichung naher befassen. Es gilt Lemma 4. Sei g ∈ H2 . Dann gelten folgende Aussagen: (1) Die Menge der Losungen der Normalgleichung L(g) = {ϕ ∈ H1 : A∗ Aϕ = ist genau dann nicht leer, wenn g ∈ R(A) ⊕ R(A)⊥ liegt. (2) Die Menge L(g) ist abgeschlossen und konvex. A∗ g} Bemerkung 17. Im Allg. ist R(A) ⊕ R(A)⊥ 6= H2 . Sollte g ein Randelement von R(A) sein, dann hat die Normalgleichung keine Losung! Beweis: zu (1) des Lemmas: Sei ϕ ∈ L(g), dann folgt aus g = Aϕ + (g − Aϕ) ∈ R(A) ⊕ R(A)⊥ , wegen (11). Sei nun g ∈ R(A) ⊕ R(A)⊥ , dann existieren ein ϕ ∈ H1 und ein g̃ ∈ R(A)⊥ mit g = Aϕ + g̃. Wendet man nun auf diese Gleichung den Projektor PR(A) an, dann erhalt man PR(A) g = Aϕ, dann gilt aber auch A∗ Aϕ = A∗ g, d.h. ϕ ∈ L(g). Insbesondere ist L(g) nicht leer. zu (2): Abgeschlossenheit von L(g). Es sei {ϕn }n∈N ⊂ L(g) eine Folge, die gegen ϕ ∈ H1 konvergiert. Wegen A∗ g = lim A∗ Aϕn = A∗ Aϕ n→∞ gilt ϕ ∈ L(g) und somit ist L(g) abgeschlossen. Konvexitat: Sei λ ∈ [0, 1] und ϕ, ψ ∈ L(g). Dann A∗ A(λϕ + (1 − λ)ψ) = λA∗ Aϕ + (1 − λ)A∗ Aψ = λA∗ g + (1 − λ)A∗ g = A∗ g, 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 56 d.h. mit ϕ und ψ gehort auch die Verbindungsstrecke λϕ + (1 − λ)ψ zu L(g). Lemma # 5. Fur g ∈ R(A) ⊕ R(A)⊥ enthalt L(g) ein eindeutig bestimmtes Ele- ment f + mit minimaler Norm: ||f + ||H1 < ||ϕ||H1 fur alle ϕ ∈ L(g)\{f + }. Der Beweis folgt aus folgendem Satz, da L(g) eine abgeschlossene und konvexe Teilmenge des Hilbert-Raums H1 ist. Satz 21. Projektionssatz. Sei H ein Hilbert-Raum und L ⊂ H sei abge- schlossen und konvex, und sei x0 ∈ H. Dann existiert genau ein x ∈ L mit ||x − x0 ||H = inf ||y − x0 ||H . y∈L Beweis: siehe Werner, Funktionalanlysis. Definition tionsbereich 12. Die Abbildung A+ : D(A+ ) ⊂ H2 → H1 mit dem DeniD(A+ ) = R(A) ⊕ R(A)⊥ , die jedem Element g ∈ D(A+ ) das eindeutig bestimmte Element f + minimaler Norm aus L(g) zuordnet, heit verallgemeinerte Inverse oder Moore-Penrose-Inverse von A ∈ L(X, Y ). Das Element f + = A+ g heit Minimum-Norm-Lösung von Af = g. Wie bestimmt man die Moore-Penrose-Inverse? Satz 22. Sei g ∈ D(A+ ), dann ist f + = A+ g die eindeutig bestimmte Losung der Normalgleichung A∗ Af = A∗ g in N (A)⊥ . Beweisidee: A∗ Aϕ = 0 ⇐⇒ Aϕ = 0, da hA∗ Aϕ, ϕiH1 = 0 ⇐⇒ hAϕ, AϕiH2 = 0 ⇐⇒ Aϕ = 0. Folglich unterscheiden sich zwei Losungen der Normalgleichung nur um Elemente aus N (A), d.h. jede Losung hat die Gestalt f = ϕ + f0 mit ϕ ∈ N (A) beliebig und f0 ∈ N (A)⊥ eindeutig bestimmt. Dann gilt f ur die Norm inf ||f ||H1 = inf f ∈L(g) Bemerkung f ∈L(g) q q ||ϕ + f0 ||2H1 = inf ||ϕ||2H1 + ||f0 ||2H1 = ||f0 ||H1 . f ∈L(g) 18. In der Menge L(g) der Losungen der Normalgleichung haben wir die Losung mit minimaler Norm ausgezeichnet. Das war willkurlich. Mitunter ist es durchaus sinnvoll, eine Losung zu suchen, die den Abstand zu einem 1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE 57 bestimmten Element f∗ ∈ H1 minimiert. Es gibt nur eine derartige Losung, sie wird f∗ -Minimum-Norm-Losung genannt. Sie sei ebenfalls mit f + bezeichnet, dann gilt f + = A+ g + PN (A) f∗ . Satz 23. Die verallgemeinerte Inverse A+ von A ∈ L(H1 , H2 ) hat die folgenden Eigenschaften: (1) A+ ist genau dann auf ganz H2 deniert, wenn R(A) = R(A) gilt, also R(A) abgeschlossen ist, (2) R(A+ ) = N (A)⊥ , d.h. der Bildraum der verallgemeinerten Inversen ist das orthogonale Komplement vom Nullraum von A, (3) A+ ist linear, (4) A+ ist genau dann stetig, wenn das Bild von A abgeschlossen ist, d.h. R(A) = R(A). Beweis: (1) ist oensichtlich. (2) Aus Satz 22 folgt R(A+ ) ⊂ N (A)⊥ . Umkehrung: Sei ϕ ∈ N (A)⊥ . Fur g := Aϕ ist PR(A) g = Aϕ und nach Satz 20 folgt ϕ ∈ L(g). Sei nun ψ ∈ L(g) beliebig, dann ist A(ϕ − ψ) = 0 bzw. ϕ − ψ ∈ N (A). Wegen ϕ ∈ N (A)⊥ erhalt man mittels des Satzes des Pythagoras ||ψ||2H1 = ||ϕ||2H1 + ||ψ − ϕ||2H1 ≥ ||ϕ||2H1 . Also ist ϕ = A+ g das Element mit minimaler Norm und N (A)⊥ ⊂ R(A+ ). (3) Seien ϕ, ψ ∈ D(A+ ). Beiden Gleichungen AA+ ϕ = PR(A) ϕ, da A+ ϕ die verallgemeinerte Losung von Af = ϕ ist und damit die Normalgleichung lost (siehe Satz 20), und AA+ ψ = PR(A) ψ implizieren A(A+ ϕ + A+ ψ) = PR(A) (ϕ + ψ) = AA+ (ϕ + ψ). Analog A+ (αϕ) = αA+ ϕ fur α ∈ R bzw. C. (4) Sei A+ stetig. Da D(A+ ) dicht in H2 ist, konnen wir A+ stetig fortsetzen durch ein B ∈ L(H2 , H1 ), dass ABϕ = PR(A) ϕ fur alle ϕ ∈ H2 erfullt. Dann ist aber R(A) = R(PR(A) ) ⊆ R(A). Sei R(A) = R(A). Wir betrachten die lineare Abbildung  : N (A)⊥ → R(A) deniert durch ϕ 7→ Aϕ. Dann ist  bijektiv und beschrankt. Nach dem Satz uber die stetige Inverse existiert Â−1 und ist ebenfalls beschrankt. Somit durfen wir wie folgt abschatzen: ||A+ ϕ||H1 = ||Â−1 (ÂA∗ ϕ)||H1 ≤ ||Â−1 ||L(H2 , H1 ) ||ÂA+ ϕ||H2 = ||Â−1 ||L(H2 , H1 ) ||AA+ ϕ||H2 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 58 fur alle ϕ ∈ D(A+ ) = H2 . Schlielich folgt + ||ϕ||H2 ≥ ||PR(A) ϕ||H2 = ||AA+ ϕ||H2 ≥ ||Â−1 ||−1 L(H2 , H1 ) ||A ϕ||H1 fur alle ϕ ∈ H2 . Insgesamt erhalten wir damit ||A+ ||L(H2 , H1 ) ≤ ||Â−1 ||L(H2 , H1 ) und folglich A+ ∈ L(H2 , H1 ). # Satz 24. Die verallgemeinerte Inverse A+ von A ∈ L(H1 , H2 ) ist eindeutig durch die vier Moore-Penrose-Axiome charakterisiert: AA+ A = A, A+ AA+ = A+ , A+ A = PR(A∗ ) , AA+ = PR(A) . ohne Beweis. Durch den eingefuhrten verallgemeinerten Losungsbegri einer linearen Operatorgleichung, ist also nur noch der Fall von Interesse, wenn A+ unstetig ist. Definition 13. Die lineare Operatorgleichung Ax = y in den Hilbert- Raumen H1 und H2 heit korrekt (gestellt) nach Nashed, wenn der Bildraum des Operator A abgeschlossen ist. Ist der Bildraum nicht abgeschlossen, so heit die Operatorgleichung inkorrekt vom Typ I, falls A kein vollstetiger (kompakter) Operator ist, jedoch inkorrekt vom Typ II, wenn A ein vollstetiger (kompakter) Operator ist. Satz 25. Verallgemeinerte Inverse eines vollstetigen (kompakten) Operators. ist Sei K ∈ K(H1 , H2 ) mit singularem System {vj , uj ; µj }. Dann ∞ X 1 K g= hg, uj iH2 vj µ j j=1 + fur g ∈ D(K + ). Hat K ein endlich dimensionales Bild, dann ist K + stetig. Beweis: F ur g ∈ R(K) ⊕ R(K)⊥ existieren f ∈ H1 und ϕ ∈ R(K)⊥ mit g = Kf + ϕ. Wegen hg, uj iH2 = hKf, uj iH2 = µj hf, vj iH1 konvergiert die Reihe f˜ := ∞ ∞ X X 1 hg, uj iH2 vj = hf, vj iH1 vj . µ j j=1 j=1 1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE 59 Das Element f˜ liegt in N (K)⊥ (da Kvj = µj uj ) und erfullt die Normalgleichung bzgl. g: K ∗ K f˜ = ∞ ∞ X X 1 hg, uj iH2 µ2j vj = µj hg, uj iH2 vj = K ∗ g. µ j=1 j=1 j Die Behauptung folgt nun aus Satz 22. # Aus dieser Darstellung der verallgemeinerten Inversen K + eines vollstetigen (kompakten) Operators ersieht man, dass K + unbeschrankt ist, wenn R(K) unendlich dimensional ist. Dazu betrachten wir eine Storung von g der Form εun und erhalten als neue rechte Seite g ε = g + εun fur die gilt ||g ε − g||H2 = ε. Dann erhalt man ||K + g − K + g ε ||H1 = Beispiel ε → ∞ f ur µn n → ∞. 5. Kompakter Integraloperator K : L2 (0, 1) → L2 (0, 1) mit x Z 1 Z mit k(x, t) f (t) dt f (t)dt = Kf (x) = 0 0 ( k(x, t) = 1, 0 ≤ t ≤ x ≤ 1, 0, 0 ≤ x < t ≤ 1. Dann ist der adjungierte Operator Z ∗ 1 K g(x) = g(t) dt x und wir erhalten Z ∗ 1 Z K Kf (x) = ∗ Z 1 f (τ ) dτ dt. x Wir betrachten den Ansatz: Z t 0 t K Kf (x) = f (τ ) dτ dt = λf (x) x 0 fur ein λ > 0. Hieraus folgt zunachst f (1) = 0. Dierentation der Gleichung liefert Z x − f (τ ) dτ = λf 0 (x) 0 und damit f (0) = 0. Nochmaliges Dierenzieren fuhrt auf −f (x) = λf 00 (x) und wir haben ein Randwertproblem zur Bestimmung von λ und f gewonnen: 0 λf 00 (x) + f (x) = 0 fur x ∈ (0, 1), f 0 (0) = 0, f (1) = 0. Die allgemeine Losung dieser linearen Dierentialgleichung 2. Ordnung ist mit dem charakteristischen Polynom α2 = − λ1 f (x) = c1 cos 1 1 √ x + c2 sin √ x . λ λ 2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN 60 Aus den Randbedinungen erhalt man 1 f 0 (0) = c2 √ = 0, λ also c2 = 0 und die erste Bedinungung wird damit zu 1 0 = f (1) = c1 cos √ . λ Fur c1 gibt es nur die triviale Losung, also muss cos √1λ = 0 sein, d.h. 1 π 1 √ = (2j − 1) = (j − )π, j ∈ N. 2 2 λj √ Die Konstante c1 bestimmen wir so, dass c1 cos √1λj x = 1, d.h. c1 = 2. √ Weiterhin erhalten wir die Eigenfunktionen vj = 2 cos (j − 21 )πx . Aus den Singularwerten und den vj erhalten die uj via Z x√ √ 1 1 1 1 uj (x) = Kvj (x) = (j − )π 2 cos (j − )πt dt = 2 sin j − πx. µj 2 2 2 0 Die {uj }j∈N bilden eine Orthonormalbasis in L2 (0, 1), also gilt R(K) = L2 (0, 1). Wir formulieren die Picard-Bedingung: Eine Funktion g ∈ L2 (0, 1) ist in R(K) dann und nur dann, wenn ∞ X Z 2 Z 1 2 ∞ X 1 2 2 1 1 1 2 2 (j − ) π g(t)vj (t) dt = (j − ) 2π g(t) sin((j − )πt) dt < ∞. 2 2 2 0 0 j=1 j=1 Bemerkung 19. Im Beispiel sieht man, dass die Frequenz der singularen Funktionen mit kleiner werdenden Singularwerten zunimmt (sie oszillieren starker). Das ist typisch fur schlecht gestellte Probleme. Im Rekonstruktionsprozess mussen daher die Anteile der Losung zu kleinen Singularwerten gedampft werden, da sie besonders mit hochfrequentem Rauschen kontaminiert sind. KAPITEL 3 Regularisierungsmethoden 1. Heuristischer Zugang Wir hatten bereits festgestellt, das eine Fredholmsche Integralgleichung 2. Art ein korrekt gestelltes Problem darstellt, die Fredholmsche Integralgleichung 1. Art dagegen inkorrekt gestellt ist. Wenn wir also an Stelle der Fredholmschen Integralgeichung 1. Art eine geeignete Fredholmsche Integralgleichung 2. Art betrachten und der Fehler dabei klein\ bleibt, so hatten wir einen Weg gefunden aus inkorrekt ge" stellte Probleme auf korrekt gestellte zuruckzufuhren. Es sei K ein kompakter Operator, der zwischen den unendlich dimensionalen, separablen Hilbert-Raum H1 und H2 wirkt. Wir betrachten die Operatorgleichung Kx = y. Im Allgemeinen hat diese Gleichung wie wir gesehen hatten, keine eindeutig bestimmte Losung, deshalb suchen wir die verallgemeinerte Inverse bzw. die verallgemeinerte Losung. Wir setzen dabei voraus, dass y ∈ D(K + ) und wir wollen K + y approximieren. Dabei soll die Approximation stetig von y abhangen. Ziel der Regularisierung ist es, die Losung eines inkorrekt gestelltes Problem durch Losungen korrekt gestellter Probleme zu approximieren. Nun erfullt die verallgemeinerte Losung x = K + y die Normalgleichung, d.h. K ∗ Kx = K ∗ y, wobei K ∗ der zu K adjungierte Operator ist. Da K ∗ K ein selbstadjungiert, positivsemideniter Operator ist, sind alle seine Eigenwerte nichtnegativ und der einzige Haufungspunkt ist die Null. Ersetzen wir nun K ∗ K durch den Operator K ∗ K + αI mit α > 0, dann besitzt dieser Operator positive Eigenwerte λj +α. Auerdem besitzt der Operator K ∗ K +αI eine beschrankte Inverse, deshalb ist das Losen der Gleichung (K ∗ K + αI)xα = K ∗ y ein korrekt gestelltes Problem. Die eindeutig bestimmte Losung xα = (K ∗ K + αI)−1 K ∗ y heit Tikhonov Approximation zu K + y. 61 (12) 62 3. REGULARISIERUNGSMETHODEN Wir zeigen nun, dass xα → K + y fur α → 0. Dazu verwenden wir das singulare System {vj , uj , µj } f ur K. Dann ist {vj } ein vollstandiges Orthonormalsystem fur Np (K)⊥ und {uj } ein vollstandiges Orthonormalsystem f ur R(K), weiterhin gilt µj = λj → 0, und K ∗ u j = µj v j . Kvj = µj uj , Wegen (12) ist nun αxα = K ∗ y − K ∗ Kxα ∈ R(K ∗ ) ⊆ N (K)⊥ und kann deshalb als Reihe xα = ∞ X hxα , vj ivj j=1 dargestellt werden, analog ist ∗ K y= ∞ X ∗ hK y, vj ivj = j=1 ∞ X hy, Kvj ivj = ∞ X j=1 µj hy, uj ivj . j=1 Setzen wir dies in (12) ein, so folgt ∞ X (µ2j + α)hxα , vj ivj = j=1 ∞ X µj hy, uj ivj . j=1 Deshalb gilt hxα , vj i = und damit xα = ∞ X µj hy, vj i +α µ2j µj hy, uj ivj . +α µ2 j=1 j Nach Satz 25 ist die verallgemeinerte Losung der Operatorgleichung gerade + K y= ∞ X hy, uj ivj . j=1 Deshalb ist ||xα − K + y||2H1 = ∞ X j=1 α 2 µj (µj + α) 2 |hy, uj i|2 . Wegen α 2 µj (µj + α) 2 1 |hy, uj i| ≤ 2 |hy, uj i|2 µj 2 und ∞ X 1 |hy, uj i|2 = ||K + y||2H1 < ∞, 2 µ j=1 j kann man Integration und Grenzwertbildung α → 0 vertauschen und wir erhalten: lim ||xα − K + y||2H1 = 0. α→0 Da fur festes α > 0, der Operator (K ∗ K + αI)−1 K ∗ beschrankt ist, hangt xα stetig von y ab fur jedes feste α > 0. Im Allgemeinen ist die rechte Seite y aber nicht genau bekannt, sondern nur eine 1. HEURISTISCHER ZUGANG 63 gute\ Naherung fur y, deshalb nehmen wir an, dass die Schatzung y δ fur y der " Abschatzung ||y − y δ ||H2 ≤ δ mit bekannten Messfehler δ. Aus den bisherigen Ergebnissen folgt, dass die Approximationen xα gegen K + y konvergieren, wenn y der tatsachliche Wert ist. Klappt das auch noch mit y δ , d.h. verwenden wir anstelle von y die gestorten Daten y δ wie gut approximiert dann xδα die Werte xα ? Dazu betrachten wir: xδα − xα = (K ∗ K + αI)−1 K ∗ (y δ − y). Als Hilfsaussage benutzen wir, dass Lemma 6. Es ist (K ∗ K + αI)−1 K ∗ = K ∗ (KK ∗ + αI)−1 . Beweis: Wir betrachten die Dierenz der Operatoren: (K ∗ K + αI)−1 K ∗ − K ∗ (KK ∗ + αI)−1 Dann ist (K ∗ K + αI)−1 (K ∗ K + αI) (K ∗ K + αI)−1 K ∗ − K ∗ (KK ∗ + αI)−1 = (K ∗ K + αI)−1 K ∗ − (K ∗ K + αI)K ∗ (KK ∗ + αI)−1 = (K ∗ K + αI)−1 K ∗ − K ∗ (KK ∗ + αI)(KK ∗ + αI)−1 = O, d.h. (K ∗ K + αI)−1 K ∗ = K ∗ (KK ∗ + αI)−1 . # Wir konnen nun berechnen: ||xδα − xα ||2 = hK ∗ (KK ∗ + αI)−1 (y δ − y), K ∗ (KK ∗ + αI)−1 (y δ − y)i = h(KK ∗ + αI)−1 (y δ − y), KK ∗ (KK ∗ + αI)−1 (y δ − y)i Aus dem Spektralsatz folgt ||KK ∗ (KK ∗ + αI)−1 || ≤ 1 und ||(K ∗ K + αI)−1 || ≤ 1 α und damit konnen wir abschatzen: δ ||xδα − xα || ≤ √ . α Hieraus ersieht man das Grundproblem der Regularisierung inkorrekt gestellter Probleme. Fur festes δ wachst die Abschatzung fur α → 0 gegen unendlich, was die Instabilitat das Ausgangsproblems wiederspiegelt. Die Aufgabe besteht also darin, einen geeigneten Regularisirierungparameter α in Abhangigkeit vom Fehlerniveau δ zu wahlen. Man sagt deshalb 64 3. REGULARISIERUNGSMETHODEN Bemerkung 20. Die Wahl α(δ) erzeugt einen regulären Algorithmus bzw. die Regularisierung konvergiert fur das inkorrekt gestellte Problem, wenn ur δ → 0 α(δ) → 0 und xδα(δ) → K + y f gilt. Fur die Tikhonov-Regularisierung erhalten wir, δ ||xδα(δ) − K + y|| ≤ ||xδα(δ) − xα(δ) || + ||xα(δ) − K + y|| ≤ p α(δ) + ||xδα(δ) − xα(δ) || und da wir bereits gezeigt haben, dass xα(δ) → K + y fur α(δ) → 0, ist die Bedingung δ p α(δ) → 0 f ur δ → 0, hinreichend um die Konvergenz der Tikhonov-Regularisierung zu sichern. Beispiel 6. Wie sieht die Regularisierung aus? 2. Ein allgemeines Regularisierungsschema Definition 14. Eine Familie {Rα }α>0 von beschrankten linearen Opera- toren Rα ∈ L(H2 , H1 ) heit A+ , wenn lineare Regularisierung fur den Operator fur alle y ∈ R(A) gilt. Der Operator Rα heit linearer Regularisierungsoperator fur A+ mit dem Regularisierungsparameter α > 0. lim Rα y = A+ y α→0+ Die Operatoren Rα approximieren fur α → 0+ punktweise die Moore-Penrose-Inverse A+ . Lemma 7. Wenn der Wertebereich R(A) des Operators A ∈ L(H1 , H2 ) in H2 nicht abgeschlossen ist, und ist dann ist {Rα }α>0 eine lineare Regularisierung fur A+ , lim ||Rα ||L(H2 ,H1 ) = ∞. α→0+ Beweis: Indirekter Beweis: Wir nehmen an, dass es ein C mit ||Rα || ≤ C f ur + alle α > 0 gibt. Da {Rα }α>0 punktweise gegen A in R(A) konvergiert, ubertragt sich die Stetigkeit von Rα in R(A) auf A+ . Da A+ aber nur dann stetig ist, wenn R(A) abgeschlossen ist, erhalten wir einen Widerspruch und die Aussage ist bewiesen. # Wendet man die Operatoren Rα fur einen festen Wert α > 0 auf die Daten y bzw. 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 65 die gestorten Daten y δ an, so erhalt man die regularisierten Losungen xα := Rα y bzw. xδα := Rα y δ , die wegen der Beschranktheit von Rα stetig von den Daten abhangen. Dann gilt ||xδα −A+ y||H1 = ||Rα y δ −Rα y+Rα y−A+ y||H1 ≤ ||Rα ||L(H2 ,H1 ) ||y δ −y||H2 +||Rα y−A+ y||H1 und damit ||xδα − A+ y||H1 ≤ ||Rα ||L(H2 ,H1 ) δ + | {z } Datenfehler ||Rα y − A+ y||H1 . | {z } Approximationsfehler Aus dieser Abschatzung wird das Dilemma der Regularisierung sichtbar, fur α → 0+ konvergiert Rα y gegen A+ y, also strebt der Approximationsfehler gegen Null, dagegen wachst der Datenfehler uber alle Grenzen. Gesamtfehler Approximationsfehler αopt Datenfehler α 2.1. Wahl des Regularisierungsparameters. Die Wahl eines optimalen Regularisierungsparameters αopt wird auf der Grundlage eines Kompromisses zwischen Stabilitat und Approximation gewonnen. Leider hangt αopt von der Losung selbst ab und ist nicht anhand der Daten a priori bestimmbar. Frage: Gibt es fur eine Folge von Daten, deren Datenfehlerniveau δ gegen Null strebt, eine zugehorige Folge von Regularisierungsparametern α = α(δ), so dass such ||xα − A+ y||H1 → 0? 66 3. REGULARISIERUNGSMETHODEN Definition Operator 15. Es sei {Rα }α>0 eine lineare Regularisierung fur den A . Dann heit diese Regularisierung f ur eine Vorschrift α = α(δ, y ) zur Auswahl des positiven Regularisierungsparameters konvergent, wenn f ur alle y ∈ R(A) + δ lim sup{||Rα(δ, yδ ) y δ − A+ y|| : y δ ∈ Y, ||y δ − y||H2 ≤ δ} = 0 δ→0 gilt. Wir sprechen von einer a priori Parameterwahl, α = α(δ), wenn der Regularisierungsparameter α nur vom Datenfehlerniveau δ abhangig gemacht wird, andernfalls von einer a posterio Parameterwahl, bei der z.B. α so gewahlt werden kann, dass die aktuelle Defektnorm ||Axδα − y δ ||H2 einer gewunschten Groe entspricht, die von δ abhangen darf. Bemerkung 21. Als Babushinsky-Veto bezeichnet man die Nichtexistenz von konvergenten linearen Regularisierungen fur nach Nashed inkorrekte lineare Operatorgleichungen, bei denen mit α = α(yδ ) die Parameterwahlvorschrift nur von den Daten yδ abhangt, ohne das Datenfehlerniveau explizit zu berucksichtigen. Vorschriften zur Regularisierungsparameterwahl, die ohne Kenntnis von δ auskommen, liefern daher niemals konvergente lineare Regularisierungen. Satz 26. Eine lineare Regularisierung {Rα }α>0 fur A+ ist konvergent, wenn der Regularisierungsparameter α = α(δ) so gewahlt wird, dass lim α(δ) = 0 und lim ||Rα(δ) ||LH , H ) δ = 0 δ→0 δ→0 2 1 gilt. 2.2. Regularisierungsverfahren. Frage: Wie kann man konvergente lineare Re- gularisierungen konstruieren? Ausgangspunkt fur die Uberlegungen ist die Darstellung von K + y eines kompakten Operator K mit dim R(K) = ∞, als Reihe mit Hilfe der Singularwertzerlegung: ∞ X 1 A y= hy, uj iH2 vj , µ j j=1 + y ∈ R(A) und fuhren Filterfaktoren f (α, µj ) zur Dampfung der die Instabilitat verursachenden Vorfaktoren µ1j ein. 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA Satz 67 27. Es sei K ∈ L(H1 , H2 ) ein kompakter Operator mit singularem System {vj , uj ; µj }∞ j=1 . Dann ist die durch die Vorschrift ∞ X f (α, µj ) δ hy , uj iH2 vj , Rα y := µ j j=1 y δ ∈ H2 δ denierte Familie {Rα }α>0 von beschrankten linearen Operatoren aus L(H2 , H1 ) eine lineare Regularisierung f ur K + , wenn fur die Filterfunktion f gilt: (1) 0 ≤ f (α, µ) ≤ 1 fur alle α > 0 und 0 ≤ µ ≤ ||K||L(H , H ) , (2) |f (α, µ)| ≤ C(α)µ fur alle 0 ≤ µ ≤ ||K||L(H , H ) , (3) lim f (α, µ) = 1 fur alle 0 ≤ µ ≤ ||K||L(H , H ) . α→0 Dabei gilt ||Rα ||L(H , H ) ≤ C(α), und die Regularisierung ist konvergent fur eine a priori Parameterwahl α = α(δ), wenn aus δ → 0 die Grenzwertbeziehungen α(δ) → 0 und δC(α) → 0 folgen. 1 1 1 2 2 2 2 1 Beweis: F ur alle y δ ∈ Y gilt ||Rα y δ ||2H2 ∞ ∞ X X (f (α, µj ))2 δ 2 2 = hy , uj iH2 ≤ (C(α)) hy δ , uj i2H2 ≤ (C(α))2 ||y δ ||2H2 2 µj j=1 j=1 und folglich ist der Operator Rα beschr ankt mit ||Rα ||L(H2 , H1 ) ≤ C(α). Nun besitzt P∞ x ∈ H1 die Darstellung x = x0 + j=1 hx, vj ivj mit x0 ∈ N (K) und mit y = Kx ergibt sich Kx = ∞ X hx, vj iH1 Kvj = j=1 und damit ∞ X µj hx, vj iuj j=1 ∞ ∞ X X 1 1 hKx, uj ivj = µj hx, vj iH1 vj K Kx = µ µ j j j=1 j=1 + und ∞ X f (α, µj ) Rα (Kx) = µj hx, vj ivj . µj j=1 Deshalb konnen wir abschatzen: ||Rα y − K + y||2H1 = ||Rα Kx − K + Kx||2H1 = ∞ X (f (α, µj ) − 1)2 hx, vj i2H1 , j=1 Wegen ∞ X j=1 (f (α, µj ) − 1)2 hx, vj i2H1 ≤ ∞ X j=1 hx, vj i2H1 ≤ ||x||2H1 (13) 68 3. REGULARISIERUNGSMETHODEN ist das Majorantenkriterium anwendbar und wir konnen Grenzwertbildung und Summation vertauschen, d.h. aus lim f (α, µ) = 0 folgt lim ||Rα y − K + y||2H1 = 0 fur α→0+ α→0+ alle y ∈ R(K). Die Konvergenzaussage fur die Regularisierung ist dann eine direkte Folgerung aus Satz 26. # Bemerkung 22. Die Konvergenz des Approximationsfehlers lim ||Rα Kx − α→0 K + Kx||2H1 = 0 ist nicht gleichm aig fur alle x ∈ H1 . So existiert keine positive Funktion h(α) mit h(α) → 0, die eine Konvergenzrate bezuglich des Regularisierungsparameters α fur diese Komponente des Regularisierungsfehlers zum Ausdruck bringen wurde, derart dass fur ||Rα Kx − K + Kx||2H1 ≤ h(α)||x||H1 α>0 und alle x ∈ H1 . (14) Wegen (13) folgt aus (14) namlich supj∈N |f (α, µj ) − 1| ≤ h(α). Dies kann aber nicht gelten, denn mit j→0 lim µj = 0 folgt aus der Ungleichung |f (α, µ)| ≤ C(α)µ f ur alle α > 0 die Grenzwertbeziehung j→∞ lim f (α, µj ) = 0 und damit sup |f (α, µj )−1| = j∈N 1. Beispiel 7. Abgeschnittene oder abgebrochene Singularwertzerlegung. Als Naherung wird verwendet (α = n1 ) n X 1 hy, uj iH2 vj , xn = µ j=1 j d.h. ( f (α, µj ) = 1, 1 ≤ j ≤ n, 0, j > n. Wie man leicht sieht gilt 0 ≤ f (α, µj ) ≤ 1 und |f (α, µj )| ≤ µµ j fur alle j ∈ N. Auerdem ist limα→0 f (α, µj ) = limn→∞ f (α, µj ) = 1. Eshandelt sich deshalb um eine lineare Regularisierung. Wird n = n(δ) so gewahlt, dass n µ2n+1 ≤ δ < µ2n , dann gilt mit δ → 0 strebt n → ∞ bzw. α → 0 und δ · C(α) = δ · 1 µ2 < n = µn → 0 µn µn fur n → ∞. Also ist unter dieser Wahl von n die Regularisierung konvergent. 2.3. Tikhonov-Regularisierung. Beispiel legungen: 8. Tikhonov-Regularisierung. Es ist nach unseren bisherigen Uber∞ X Rα y δ = xδα = µj hy δ , uj ivj . +α µ2 j=1 j 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 69 Folglich sind die Filterfaktoren: µ2j f (α, µj ) = 2 . µj + α Wir uberprufen die Voraussetzungen des Satzes 14: µ (1) 0 ≤ f (α, µj ) = µ +α ≤ 1 fur alle α > 0 und j ∈ N. µ (2) |f (α, µj )| = µ +α ≤ √µ a , d.h. C(α) = 2√1 a . 2 j 2 j 2 j j 2 j µ2 j (3) limα→0+ f (α, µj ) = limα→0+ µ2 +α = 1. j Deshalb ist es eine lineare Regularisierung. Diese Regularisierung ist konvergent, wenn aus δ → 0 folgt α(δ) → 0 und C(α)δ → 0, d.h. wenn α(δ) → 0 und δ → 0 f ur δ → 0. α(δ) δ Folglich muss α mit δ gegen Null streben, aber nicht zu schnell, damit auch α(δ) gegen Null strebt. Weiterhin gilt: bei festem α > 0 fallt der Dampfungsfaktor f (α, µj ) umso kleiner aus, je groer j wird, da die Singularwerte µj eine fallende Nullfolge bilden. Die Summanden der Reihe 2 2 ∞ X 1 K y= hy, uj iH2 vj µ j=1 j + mit groem j werden bei der Regularisierung stark gedampft, dagegen bleiben die mit kleinem j wegen µ µ+α ≈ 1 fur genugend kleines α fast unverandert. Dies bedeutet, dass hochfrequente Anteile, z.B. Vielfache von sin ωt mit hoher Frequenz ω stark gedampft werden. Man rekonstruiert mit der Tikhonov Regularisierung die niederfrequenten Anteile recht genau und stabil in Bezug auf die gegebenen Daten, wahrend auf die hochfrequenten Anteile in der Naherungslosung mit zunehmender Frequenz immer mehr verzichtet wird. Das ist schlecht fur die Rekonstruktion hochfrequenter Anteile, gilt aber mehr oder weniger fur alle Standard-Regularisierungsverfahren. 2 j 2 j Folgerung 5. Die durch die Methode der Tikhonov-Regularisierung xδα := Rα y δ := (A∗ A + αI)−1 A∗ y δ denierte Operatorfamilie {Rα }α>0 ist eine lineare Regularisierung fur den Operator A+ mit ||Rα ||L(H , H ) ≤ 2√1 α . Genugt eine a priori Parameterwahl α = α(δ) den Bedinungen 2 1 α(δ) → 0 und δ2 →0 α(δ) fur δ → 0, so ist die Regularisierung auch konvergent. Wir wollen die Tikhonov-Regularisierung nun neu interpretieren, dafur benotigen wir folgende Aussage: 70 3. REGULARISIERUNGSMETHODEN Lemma 8. Ein selbstadjungierter Operator B ∈ L(H, H), der positiv denit ist, d.h. fur den fur alle x ∈ H gilt, besitzt einen stetigen inversen Operator B −1 ∈ L(H, H) mit hBx, xiH ≥ β||x||2H ||B −1 ||L(H, H) ≤ 1 . β Weiterhin ist fur jedes feste z ∈ H das Extremalproblem hBx, xiH − 2hx, ziH = min!, x ∈ H, aquivalent zur Operatorgleichung Bx = z, x ∈ H, und besitzt die eindeutig bestimmte Losung x = B −1 z. Anwendung auf die Tikhonov-Regularisierung: Setzt man B := A∗ A + αI, z := A∗ y δ so liefert β = α sofort die Korrektheit der Operatorgleichung (A∗ A + αI)x = A∗ y δ , x ∈ H1 , nach Hadamard. Weiterhin ist diese Operatorgleichung aquivalent zur Minimierung des Funktionals h(A∗ A + αI)x, xiH1 − 2hx, A∗ y δ iH1 = hA∗ Ax, xiH1 + αhx, xiH1 − 2hx, A∗ y δ iH1 = hAx, AxiH2 + α||x||2H1 − 2hAx, y δ iH2 = hAx, Ax − y δ iH2 − hAx, y δ iH2 + α||x||2H1 = hAx − y δ , Ax − y δ iH2 + α||x||2H1 + hy δ , Ax − y δ iH2 − hAx, y δ iH2 = ||Ax − y δ ||2H2 + α||x||2H1 − ||y δ ||2H2 , fur alle x ∈ H1 . (in reellen Hilbert-Raumen ). Der letzte Term ist konstant und kann deshalb weggelassen werden. Dann heit der folgende Ausdruck Tikhonov-Funktional Tα (x) := ||Ax − y δ ||2H2 + α||x||2H1 und xδα = Rα y δ = (A∗ A + αI)−1 A∗ y δ ist fur alle y δ ∈ H2 die eindeutig bestimmte Losung des Extremalproblems Tα (x) := ||Ax − y δ ||2H2 + α||x||2H1 = min! Die Theorie fur die Tikhonov-Regularisierung (wie wir sie bisher kennen und noch weiter kennenlernen werden) lasst sich ein Extremalproblem der Gestalt Tα (x) := ||Ax − y δ ||2H2 + αΩ(x) = min!, x ∈ H1 , 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 71 mit einem Sympathiefunktional ubertragen. Das Sympathiefunktional wird so konstruiert, dass Elemente x, die den Erwartungen an die Losung gut entsprechen ( sym" patisch sind\), kleinere Werte Ω(x) zugeordnet werden, wahrend unsympathischen\ " Elementen x groe Werte zugeordnet werden. Mogliche Sympathiefunktionale sind • Mochte man vorzugsweise Elemente x, die moglichst wenig von einem Referenzelement x∗ abweichen, so ist Ω(x) = ||x − x∗ ||X bzw. Ω(x) = ||x − x∗ ||2X im Hilbert-Raum ein geeignetes Funktional. Mit x∗ = 0 wird dabei speziell auf Elemente mit moglichst kleiner Norm zuruckgegrien. • F ur Raume glatter (dierenzierbarer, mehrfach dierenzierbarer) Funktionen x(t) (a ≤ t ≤ b) kommt haug ein Sympathiefunktional Ω(x) = ||x0 ||2L2 (a, b) b Z (x0 (t))2 dt = a zur Anwendung. Dahinter steckt der Gedanke, dass wenig oszillierende Losungen in der Regel bevorzugt werden. Eine im Mittel kleine Ableitung x0 tritt namlich nur fur Funktionen mit im Durchschnitt geringerer Schwankung auf. • Maximum-Entropie-Methode. Im Sinne des wahrscheinlichkeitsttheoretischen Konzepts der Entropie ist ein Sympathiefunktional der Gestalt Z Ω(x) = b x(t) log a x(t) dt x∗ (t) mit einer aus Zusatzinformationen resultierenden Referenzfunktion x∗ (t) > 0, a ≤ t ≤ b, motiviert. Dies ist eine Moglichkeit positive Losungen zu iterieren. Im Allgemeinen sind keine Algorithmen bekannt wie man die Positivitat einer Losung erreicht! Andererseits entsteht durch dieses in x(t) nichtlineare Sympathiefunktional ein nichtlineares Problem, das wesentlich aufwendiger zu losen ist als ein lineares Problem. Subjektive a priori Informationen sollten bei de Behandlung inverser Aufgaben aber so zuruckhaltend wie moglich eingesetzt werden. 2.4. Diskrepanzprinz. Wir betrachten eine weitere Eigenschaft der TikhonovRegularisierung. Die regularisierte Losung xδα hangt wegen der Beschranktheit des linearen Operators Rα stetig von den Daten y δ ab. Ebenso ist eine stetige Abhangig- keit vom Regularisierungsparameter festzustellen, da (A∗ A + αI)xδα = A∗ y δ und (A∗ A + (α + h)I)xδα+h = A∗ y δ mit α + h > 0, so gilt (A∗ A + αI)(xδα+h − xδα ) = −hxδα+h = h A∗ (Axδα+h − y δ ) α+h 72 3. REGULARISIERUNGSMETHODEN da hxδα+h + αxδα+h + A∗ Axδα+h = A∗ y δ ⇐⇒ xδα+h = − 1 A∗ (Axδα+h − y δ ) α+h und |h| ||(A∗ A + αI)−1 ||L(H1 , H1 ) ||A∗ ||L(H2 , H1 ) ||Axδα+h − y δ ||H2 α+h ||A||L(H1 , H2 ) |h| ≤ ||A||L(H1 , H2 ) ||xδα+h ||H1 + ||y δ ||H2 . α α+h ||xδα+h − xδα ||H1 ≤ Nun ist wegen Tα (xδα ) ≤ T (0) fur alle α > 0 auch (α + h)||xδα+h ||2H1 ≤ Tα+h (xδα+h ) ≤ ||y δ ||2H2 und damit ||xδα+h − xδα ||H1 ||A||L(H1 , H2 ) |h| ≤ α α+h ||A||L(H1 , H2 ) √ + 1 ||y δ ||H2 → 0 f ur α+h |h| → 0. Dann existiert wegen (A∗ A + αI) xδα+h − xδα = −xδα+h h sogar das Ableitungselement xδ − xδα dxδα = lim α+h ∈ H1 , h→0 dα h welches die Operatorgleichung (A∗ A + αI)x = −xδα lost und folglich die Darstellung dxδα = −(A∗ A + αI)−1 xδα dα besitzt. Die Losung hangt sogar stetig dierenzierbar von α ab! Fur die Herleitung sinnvoller Strategien einer a posteriori Parameterwahl bei der Tikhonov-Regularisierung ist es nutzlich, die Funktionen ϕ(α) := ||Axδα − y δ ||2H2 naher zu betrachten. und ψ(α) := ||xδα ||2H1 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 73 Es gilt 1 hAxδα+h − y δ , Axδα+h − y δ iH2 − hAxδα − y δ , Axδα − y δ iH2 h→0 h 1 = lim hAxδα+h − y δ − (Axδα − y δ ), Axδα+h − y δ iH2 h→0 h +hAxδα − y δ , Axδα+h − y δ iH2 − hAxδα − y δ , Axδα − y δ iH2 ϕ0 (α) = lim = lim hA(xδα+h − xα ), Axδα+h − y δ iH2 + hAxδα − y δ , A(xα+h − xα iH2 h→0 δ δ xα+h − xδα xα+h − xδα δ δ δ δ = lim hA , Axα+h − y iH2 + hAxα − y , A iH2 h→0 h h dxδ dxδ dxδα , Axδα − y δ iH2 = 2h α , A∗ (Axδα − y δ )iH1 = −2αh α , xδα iH1 . dα dα dα = 2hA Da (A∗ A + αI)xδα = A∗ y δ ⇐⇒ A∗ (Axδα − y δ ) = −αxδα . Wegen (A∗ A + αI) dxdαα = −xδα folgt δ δ 2 dxδα 2 dxδα dxδα ∗ 2 dxα ≥ 0, ϕ (α) = 2αh , (A A + αI) i = 2α + 2α A dα dα dα H1 dα H2 0 d.h. die Funktion ϕ(α) ist monoton wachsend und fur y δ 6∈ N (A∗ ) gilt dxδα dxδ 6= 0 y α 6= 0, dα dα 0 also ist insbesondere ϕ (α) > 0 und die Funktion ϕ(α) streng monoton wachsend. (A∗ A + αI)xδα 6= 0 y xδα 6= 0 y (A∗ A + αI) Andererseits ist δ 2 dxδα 2 dxα dxδα δ ≤ 0, ψ (α) = 2h , x iH = −2α − 2 A dα α 1 dα H1 dα H2 0 d.h. die Funktion ψ(α) ist monoton fallend, und fur y δ 6∈ N (A∗ ), gilt wegen ψ(α) < 0 wieder die strenge Monotonie. Wir setzen im weiteren N (A∗ ) = {0} voraus. Dann gilt mit ||y δ ||2H2 = ∞ X hy δ , vj i2 , j=1 die Beziehung ϕ(α) = ||Axδα −y δ ||2H2 = ∞ X j=1 2 ∞ X µ2j α2 δ 2 = hy δ , vj i2H2 ≤ ||y δ ||2H2 . − 1 hy , v i j H2 2 2 µ2j + α (µ + α) j j=1 Wegen der sich daraus ergebenden Vertauschbarkeit von Summation und Grenzwertbildung fur α → 0 bzw. α → ∞ in der Reihendarstellung folgt lim ϕ(α) = 0 und α→0 lim ϕ(α) = ||y δ ||2H2 . α→∞ (15) 74 3. REGULARISIERUNGSMETHODEN Definition 16. Gegeben seien ein Datenfehlerniveau δ > 0 und eine gestorte rechte Seite yδ ∈ H2 der linearen Operatorgleichung Ax = y mit exakter rechter Seite y ∈ R(A), mit (16) ||y δ − y||H2 ≤ δ < ||y δ ||H2 . Unter dem Diskrepanzprinzip nach Morozov verstehen wir dann die a posteriori Parameterwahl αdis = αdis (δ, yδ ) des Regularisierungsparameters α > 0 der Tikhonov-Regularisierung, die auf der Losung der Gleichung ||Axαdis − y δ ||H2 = δ beruht. Bemerkung • • • 23. Mit N (A∗ ) = {0} und (16) liefert das Diskrepanzprinzip wegen der strengen Monotonie und der Grenzwertbeziehung (15) immer einen eindeutig bestimmten Regularisierungsparameter αdis > 0. Interpretation: Unter den im Sinne von ||Ax − yδ ||H ≤ δ mit den Daten y δ vertr aglichen Elementen x sollten solche bevorzugt werden, bei denen die Ungleichung sogar als Gleichung gilt. Überregularisierung: In diesem Fall approximieren regularisierte L osunδ δ δ + gen xα mit ||Axα − y ||H < δ die verallgemeinerte Losung A y besser als xδα . Das Diskrepanzprinzip erzeugt in diesem Fall zu groe Regularisierungsparameter und damit zu glatte regularisierte Losungen. Unterregularisierung: Im Gegensatz dazu f uhren zu kleine Regularisierungparameter zu Naherungslosungen, die eine zu kleine Defektnorm ||Axδα − y δ ||H aufweisen und in der Regel st arker als gewunscht oszillieren. Motivation: Eine regularisierte Losung xδα mit ||Axδα − yδ ||H = δ lost das restringierte Extremalproblem 2 2 dis • 2 • dis ||x||H1 = min!, dis 2 (17) x ∈ H1 : ||Ax − y δ ||H2 ≤ δ. Beweis: W are namlich ||x̂||H1 < ||xδαdis ||H1 y δ ||H2 ≤ δ, so m usste auch fur ein x̂ ∈ H1 Tαdis (x̂) = ||Ax̂ − y δ ||2H2 + αdis ||x̂||2H1 < ||Axδαdis − y δ ||2H2 + αdis ||xδαdis ||2H1 = Tαdis (xδαdis ) mit ||Ax̂ − 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 75 gelten dies widerspricht aber der Eigenschaft Tα (xδα ) ≤ Tα (x) fur alle x ∈ H1 . Umgekehrt ist ubrigens auch jede Losung des restringierten Extremalproblems (17) eine regularisierte Losung. # dis • dis dis Wenn der Regularisierungsparameter uber das Diskrepanzprinzip bestimmt wird, so minimiert jede nach Tikhonov regularisierte Losung xδα das Sympathiefunktional Ω(x) = ||x||H unter allen mit den Daten vertraglichen Elementen x ∈ H1 , das sind diejenigen mit ||Ax−yδ ||H ≤ δ. Die Tikhonov-Regularisierung erzwingt also nicht nur Naherungslosungen, die stabil von den Daten abhangen, sondern sie beeinusst auch die Eigenschaften der Naherungslosung zielgerichtet. Insbesondere ist eine regularisierte Losung xδα mit ||xδα ||H = K auch Losung des Extremalproblems 1 dis 2 0 1 0 ||Ax − y δ ||H2 = min! x ∈ H1 , ||x||H1 ≤ K. Die regularisierten L osungen haben also minimale Defektnormen, wenn bei einer solchen Minimierung nur Elemente aus einer Kugel im Hilbert-Raum H1 mit festem Radius K>0 zugelassen werden. 2.5. Prinzip der Quasioptimalität. Dies ist ein weiteres Verfahren zur a po- steriori Wahl des Regularisierungsparameters bei der Tikhonov-Regularisierung. Aus der Gleichung (A∗ A + αI) dxδα = −xδα dα fur das Ableitungselement erhalt man die Beziehung α dxδα = −α(A∗ A + αI)−1 xδα . dα Die Wahl von αqo als Losung des Extremalproblems dxδα ξ(α) := α dα → min!, α > 0, H1 wird nun motiviert durch die auf der Neumannschen Reihe beruhenden und fur y ∈ R(A) g ultigen Gleichung + ∗ −1 A y = xα + α(A A + αI) xα + ∞ X αj (A∗ A + αI)−j xα , j=2 welche unter Vernachlassigung der unendlichen Summe (α ist klein\, αj ist noch " viel kleiner\) ohne Berucksichtigung von Datenfehlern die Dierenz ||xα − A+ y||H1 " klein bleibt, wenn ξ(α) minimiert wird. 76 3. REGULARISIERUNGSMETHODEN Satz 28. Unter den Voraussetzungen N (A∗ ) = {0} und ||y δ − y||H2 ≤ δ < ||y δ ||H2 ist die Tikhonov-Regularisierung xδα := (A∗ A + αI)−1 A∗ y δ mit dem Regularisierungsparameter αdis = αdis (δ, yδ ), die nach dem Diskrepanzprinzip ||Axαdis − y δ ||H2 = δ ausgewahlt werden, konvergente Regularisierung fur A+ . Definition 17. Eine Folge (xk )k∈N konvergiert schwach gegen x ∈ X, falls hxk , x0 i → hx, x0 i fur alle x0 ∈ X 0 . Eine Abbildung A ∈ L(X, Y ) ist schwach stetig, wenn aus stets folgt Axk * Ax (schwach). xk * x (schwach), Bemerkung 24. Der schwache Grenzwert ist eindeutig bestimmt. Die Norm Bemerkung 25. Aus der schwachen Konvergenz xk * x und der Normkon- ist unterhalb stetig bzgl. der schwachen Konvergenz, d.h. aus xk * x (schwach) in X fur k → ∞ folgt ||x|| ≤ lim inf ||xk ||. Beweis siehe H.W. Alt, Lineare Funkk→∞ tionalanalysis, Seite 213. vergenz ||xk || → ||x|| folgt die starke Konvergenz Raum H gilt xk → x, da im reellen Hilbert- ||xk − x||2 = hxk − x, xk − xiH = hxk , xk iH − hxk , xiH − hx, xk i + hx, xi = ||xk ||2H + ||x||2H − 2hxk , xi → 0 Bemerkung fur k → ∞. 26. In Banach-Raumen X, Y ist A genau dann stetig, wenn A schwach stetig ist. Nachweis uber Satz uber den abgeschlossenen Graphen. Satz 29. In einem reexiven Raum X besitzt jede beschrankte Folge eine schwach konvergente Teilfolge. Beweis: siehe D. Werner, Funktionalanlysis, Seite 107. Beweis: zu Satz 28: Wir betrachten Folgen δn → 0 und yn := y δn ∈ R(A) f ur n → ∞ sowie xn := xαdis (δn , yn ) . Der Satz ist bewiesen, wenn wir zeigen konnen, dass xn → A+ y gilt. 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 77 Es gilt ||Axn − yn ||H2 = δn und folglich Axn → y fur n → ∞. Weiterhin ist Tαdis (δn , yn ) (xn ) = ||Axn − yn ||2H2 + αdis (δn , yn )||xn ||2H1 = δn2 + αdis (δn , yn )||xn ||2H1 ≤ Tαdis (δn , yn ) (A+ y) = ||y − yn ||2H2 + αdis (δn , yn )||A+ y||2H1 ≤ δn2 + αdis (δn , yn )||A+ y||2H1 und damit ||xn ||H1 ≤ ||A+ y||H1 fur alle n. (18) Die Elemente xn sind also in H1 beschrankt und folglich gibt es eine schwach konvergente Teilfolge {xnk }k∈N mit xnk * x ∈ H1 . Wegen der schwachen Stetigkeit von A und der Eindeutigkeit des schwachen Grenzwerts gilt Ax = y. Dies impliziert, dass A∗ Ax = A∗ y, d.h. x lost die Normalgleichung und deshalb ist x = A+ y und damit insgesamt xn * A+ y. Wegen der Unterhalbstetigkeit der Norm bei schwacher Konvergenz folgt auerdem ||A+ y||H1 ≤ lim inf ||xn ||H1 ≤ lim sup ||xn ||H1 (18) ||A+ y||H1 ≤ n→∞ n→∞ Damit ist die Normkonvergenz ||xn ||H1 → ||A+ y||H1 nachgewiesen und letztlich die starke Konvergenz xn → A+ y. # Durch die Verwendung von Quelldarstellungen lassen sich Konvergenzraten erreichen, es gilt Satz 30. Unter den Voraussetzungen von Satz 28 gibt es eine Konstante so dass die auf der Grundlage des Diskrepanzprinzips gewonnenen regularisierten Losungen xδα mit αdis = αdis (δ, yδ ) der Abschatzung C > 0, dis √ ||xδαdis − A+ y||H1 ≤ C δ, genugen, falls die verallgemeinerte Losung stellung besitzt: A+ y = A∗ w, A+ y die folgende Quelldar- w ∈ H2 . Beweis: Im Beweis von Satz 28 ergab sich die Abschatzung: ||xδαdis ||X ≤ ||Ay + ||X . 78 3. REGULARISIERUNGSMETHODEN Dann gilt ||xδαdis − A+ y||2H1 = hxδαdis − A+ y, xδαdis − A+ yiH1 ≤ 2 ||A+ y||2H1 = hxδαdis , xδαdis iH1 − hxδαdis , A+ yiH1 − hA+ y, xδαdis iH1 + hA+ y, A+ yiH1 − hxδαdis , A+ yiH1 = 2hA+ y − xδαdis , A+ yiH1 = 2hA+ y − xδαdis , A∗ wiH1 = 2hA(A+ y − xδαdis ), wiH2 = 2hy − y δ , wiH1 + 2hy δ − Axδαdis , wiH2 ≤ 2 ||y − y δ ||H2 ||w||H2 + ||y δ − Axδαdis ||H2 ||w||H2 = 4||w||H2 δ, p √ d.h. ||xδαdis − A+ y||H1 ≤ C δ mit C = 2 ||w||H2 . Falls die Operatorgleichung Ax = y inkorrekt nach Nashed ist, so kann der Regularisierungsfehler ||xδαdis − A+ y||H1 des √ Diskrepanzprinzips fur δ → 0 auch nicht schneller als δ gegen Null streben. Jedoch gibt es Quelldarstellungen, die eine a priori Parameterwahl α = α(δ) ermoglichen, so dass sich der Regeularisierungsfehler proportional zu δ 2/3 verhalt. Satz 31. Es seien c und C positive Konstanten. Dann erhalt man fur die a priori Parameterwahl α = α(δ) = cδ2/3 eine Abschatzung ||xδαdis − A+ y||H1 ≤ Cδ 2/3 des Regularisierungsfehlers, wenn die verallgemeinerte Losung ner Quelldarstellung A+ y = A∗ Av, A+ y ei- v ∈ H1 genugt. Beweis: Wie wir bereits gesehen hatten, ist die Norm des Operators (A∗ A+αI)−1 A∗ A kleiner gleich 1. Dann folgt Rα y − A+ y = (A∗ A + αI)−1 A∗ A(A+ y) − A+ y = −α(A∗ A + αI)−1 (A+ y) = −α(A∗ A + αI)−1 A∗ Av und damit ||Rα y − A+ y||H1 ≤ α||v||H1 . Fur den Regularisierungsfehler erhalten wir deshalb ||xδα − A+ y||H1 ≤ ||Rα ||L(H2 , H1 ) δ + ||Rα y − A+ y||H1 1 ≤ ||Rα ||L(H2 , H1 ) δ + α||v||H1 ≤ √ δ + α||v||H1 , 2 α da ||Rα ||L(H2 , H1 ) ≤ 1 √ δ 2 α nach Folgerung 5. Mit α(δ) = cδ 2/3 ergibt sich ||xδα − A+ y||H1 ≤ Cδ 2/3 , 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA wobei C = 1 √ 2 c + c||v||H1 ist. Bemerkung 79 # 27. Es gilt auch ein sogenanntes Sättigungsprinzip, das be- sagt, dass fur nach Nashed inkorrekte lineare Operatorgleichungen keine a priori Parameterwahl exisitert, so dass der Fehler der Tikhonov-Regularisierung fur δ → 0 schneller als δ 2/3 gegen die verallgemeinerte L osung A+ y 6= 0 konvergiert. 2.6. Weitere Regularisierungsmethoden. Dies sind z.B. iterative Methoden wie die 2.6.1. Landweber-Iteration. Wir gehen von der Normalgleichung A∗ Ax = A∗ y aus und multiplizieren sie mit einem positiven Faktor ω und schreiben die Normalengleichung neu als x = x + ω(A∗ y − A∗ Ax). Die impliziert die folgende Iterationsvorschrift: Landweber-Iteration. Man bestimme die Losung der Fixpunktgleichung x = x + ω(A∗ y − A∗ Ax) durch die Iteration: xn+1 = (I − ωA∗ A)xn + ωA∗ y δ , x0 = 0, wobei 0 < ω < 2 ||A||2L(H 1 , H2 ) N ≥ n ≥ 0, (19) ist. Durch Induktion erhalt man fur die n-te Iterierte die Darstellung: xn = n−1 X (I − ωA∗ A)i ωA∗ y δ , n = 1, 2, . . . . i=0 (Aus x0 = folgt x1 = ωA∗ y δ folgt x2 = (I − ωA∗ A)ωA∗ y δ + ωA∗ y δ usw. usf.) Wir untersuchen die Konvergenz des Verfahrens. Wir betrachten zunachst den Fall y δ ∈ D(A+ ) = R(A)⊕R(A)⊥ . In diesem Fall ist die Normalgleichung losbar mit der Losung A+ y δ . Dann gilt wegen n−1 X (I − ωA∗ A)i ωA∗ A = I − (I − ωA∗ A)n i=0 (Hinweis: Es gilt an − bn = (a − b) n−1 P ! an−1−j bj j=0 1 − (1 − x)n = 1n − (1 − x)n = (1 − (1 − x)) n−1 X j=0 und damit ist ! 1n−1−j (1 − x)j = n−1 X j=0 (1 − x)j x.) 80 3. REGULARISIERUNGSMETHODEN die Beziehung + δ + δ A y − xn = A y − n−1 X ∗ ∗ δ i + δ n−1 X ∗ i=0 + δ (I − ωA A) ωA y = A y − i=0 (I − ωA∗ A)i ωA∗ A(A+ y δ ) = (I − I + (I − ωA A) )(A y ) = (I − ωA∗ A)n (A+ y δ ) n Wir benutzen das singulare System {vj , uj ; µj } mit A∗ Avj = µ2j vj und x ∈ H1 hat P die Darstellung x = ∞ k=0 hx, vk iH1 vk . Dann ist (I−ωA∗ A) ∞ X ! hx, vk iH1 vk = k=0 ∞ X hx, vk iH1 − ωµ2k hx, vk iH1 vk = (1−ωµ2k )hx, vk iH1 vk ∞ X k=0 k=0 und damit ∗ m (I − ωA A) x = ∞ X (1 − ωµ2k )m hx, vk iH1 vk , k=0 wobei die Faktoren (1 − nur dann gegen Null streben fur m → ∞, wenn 2 ur alle k ∈ N gilt. Es gilt |1 − ωµk | < 1 f ωµ2k )m |1 − ωµ2k | < 1 ⇐⇒ −1 < 1 − ωµ2k < 1 f ur alle k ⇐⇒ 0 < ω < 2 µ2k fur alle k ⇐⇒ 0 < ω < 2 2 = . 2 2 µ1 ||A||L(H1 ,H2 ) Somit erhalten wir insgesamt ||A+ y δ −xn ||H1 = ||(I−ωA∗ A)n (A+ y δ )||H1 ≤ ||(I−ωA∗ A)n ||L(H1 ,H1 ) ||(A+ y δ )||H1 → 0 f ur n → ∞. In diesem Fall konvergiert die Landweber-Iteration gegen das Element A+ y δ , welches wegen der Unbeschranktheit des Operators A+ auch fur kleine δ > 0 weit von der tatsachlichen verallgemeinerten Losung A+ y entfernt sein kann. Was passiert, wenn y δ 6∈ D(A+ ) = R(A)⊕R(A)⊥ ? Sei A dazu ein kompakter Operator mit dim R(A) = ∞. Dann ist xn = ∞ X n−1 X j=1 i=0 (1 − ωµ2j )i ωµj hy δ , uj iH2 vj = ∞ X 1 − (1 − ωµ2j )n j=1 µj hy δ , uj iH2 vj . Wegen 0 < 1 − ωµ2j < 1 strebt ||xn ||2H1 fur n → ∞ gegen die Reihe ∞ X hy δ , uj iH2 , 2 µ j j=1 die aber gegen ∞ divergiert, weil fur y δ 6∈ D(A+ ) = R(A) ⊕ R(A)⊥ die Picardsche Bedingung (siehe Satz 19) verletzt ist. Es macht also für inkorrekte Probleme keinen Sinn, eine möglichst große Zahl von Schritten der Landweber-Iteration auszuführen! Wir nehmen deshalb eine endliche Zahl N von Iterationsschritten, 2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA 81 wobei diese Zahl die Rolle des Regularisierungsparameters ubernimmt, d.h. es sei α := N1 . Mit xδα δ := RN y := xN := ∞ X 1 − (1 − ωµ2j )N j=1 µj δ hy , uj iH2 vj = ∞ X 1 − (1 − ωµ2j )1/α µj j=1 hy δ , uj iH2 vj erhalten wir die Filterfaktoren 1 ∈ N und 0 < µj ≤ ||A||L(H1 , H2 ) . α Damit gilt oensichtlich 0 < f (α, δ) < 1 und lim f (α, δ) = 1. Auch die 3. Bedingung f (α, δ) = 1 − (1 − ωµ2j )1/α fur α→0 des Satzes 27 fur die Konvergenz des Regularisierungsverfahrens ist erfullt, denn es gilt √ 1 − (1 − τ )N ≤ τ N f ur alle N ∈ N und 0 ≤ τ ≤ 1. Nachweis: Sei zunachst 0 ≤ τ ≤ N1 , dann ergibt die Bernoulli-Ungleichung (1 − τ )N ≥ √ 1 − N τ und damit N τ ≥ N τ ≥ 1 − (1 − τ )N . F ur τ ≥ N1 ist aber trivialerweise √ √ τ N ≥ 1 und damit 1 ≤ N τ + (1 − τ )N . Mit τ = ωµ2j ergibt sich damit √ √ N ωµj √ 1 ur alle N ∈ N und 0 < ω < 2 . = ωN f µj µj pω und C(α) := α die Ungleichung |f (α, δ)| ≤ C(α)µj fur alle µj 1 − (1 − ωµ2j )N ≤ µj So ist mit α = N1 erfullt. Das heit: Folgerung torfamilie 6. Die zur Methode der Landweber-Iteration denierte Opera- {RN }√N ∈N ist eine ||RN ||L(H1 ,H2 ) ≤ ωN . Sofern gungen lineare Regularisierung fur den Operator A+ mit eine a priori Parameterwahl N = N (δ) die Bedin- und δ2 N (δ) → 0 fur erfullt, ist diese Regularisierung auch konvergent. N (δ) → ∞ Bemerkung • • δ→0 28. Um eine Konvergenz der regularisierten Losungen xN (δ) gegen A+ y zu erreichen, muss fur δ → 0 die Zahl der Iterationsschritte zwar ins Unendliche wachsen, dies darf aber wegen δ2 N (δ) → 0 nicht zu schnell geschehen. Man kann auch sogenannte heuristische Strategien zur Wahl des Regularisierungsparameters N = α1 verwenden. Vorzugweise verwende man ein auf Iterationen zugeschnittenes Diskrepanzprinzip. Man wahlt dazu Ndis f ur eine gegebene Konstante τ > 1 so, dass ||AxNdis − y δ ||H2 ≤ τ δ < ||AxNdis −1 − y δ ||H2 P 2 2n δ 2 erfullt wird. Da ||Axn − yδ ||2H2 = ∞ ur n → j=1 (1 − ωσj ) hy , uj iH2 → 0 f δ ∞ gilt, ist f ur τ δ < ||y ||H2 der Regularisierungsparameter Ndis immer eindeutig bestimmt. 82 3. REGULARISIERUNGSMETHODEN • • Die Landweber-Iteration ist im Vergleich zur Tikhonov-Regularisierung und zur abgebrochenen Singularwertzerlegung mit sehr geringem aufwand zu losen, da weder Operatorgleichungen zu losen noch Eigenelemente bestimmt werden mussen. Auch das Diskrepanzprinzip ist kostengunstig, da es nur die Defektbestimmung der Iterierten von (19) erfordert. Wird als Startwert nicht x0 = 0 gewahlt, sondern x0 = f0 ∈ H1 , so wird A+ y + PN (A) f0 iteriert. 2.6.2. Asymptotische Regularisierung. Hier wird wieder die Normalgleichung gestort, diesmal aber durch Hinzufugen eines Ableitungsterms, d.h. Asymptotische Regularisierung. Man sucht die Losung der gewohnlichen Dierentialgleichung x0 (t) + A∗ Ax(t) = A∗ y δ unter der Anfangsbedingung x(0) = 0. Die Losungen dieses Anfangswertproblems sind Elemente x(t), t ≥ 0, des Hilbertraums H1 , deren Variable t als Zeit interpretiert werden kann. Fur den kompakten Operator A kann man unter Verwendung eines singularen Systems die Losungen als Reihe in der Form x(t) = ∞ X 1 − exp(−tµ2j ) µj j=1 hy δ , uj iH2 vj , t ≥ 0, darstellen. Man sieht sofort, dass es keinen Sinn macht diese Losungen fur groe Zeiten t zu bestimmen, denn fur t → ∞ strebt ||x(t)||2H1 wieder gegen die Reihe P∞ hyδ , uj i2H2 . Man wahlt in diesem Fall eine Endzeit T, die hier der Regularisiej=1 µ2j rungsparameter ist und betrachtet α := T1 . Als Filterfunktionen ergeben sich f (α, δ) = 1 − exp(− µ2j ) f ur α α > 0 und alle µj . Wegen 0 < f (α, δ) < 1, lim f (α, δ) = 1 und α→0 µ2 1 − exp − αj µj 1 ≤√ α (Man betrachte die Funktion exp(−x2 ) fur x ≥ 0, dann kann man mit dem Mittelwertsatz abschatzen: exp(−x2 ) − exp 0 exp(−x2 ) − 1 −2ξ = = −2ξ exp(−ξ 2 ) = x−0 x exp(ξ 2 ) 3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN 83 und damit 1 − exp(−x2 ) exp(−x2 ) − 1 2ξ 2ξ 2 = = 2ξ exp(−ξ ) = exp(ξ 2 ) ≤ 1 + ξ 2 ≤ 1. x x Deshalb ist C(α) = Folgerung √1 α und damit alle Bedingungen gema Satz 27 erfullt, somit gilt 7. Die zur Methode der asymptotischen Regularisierung gehori- ge Operatorfamilie {RT √ }T >0 ist eine lineare Regularisierung f ur den Operator + A mit ||RT ||L(H ,H ) ≤ T . Sofern eine a priori Parameterwahl T = T (δ) die Bedingungen T (δ) → ∞ und δ 2 T (δ) → 0 f ur δ → 0 erfullt, ist diese Regularisierung auch konvergent. Bemerkung 29. Es gibt einen Zusammenhang zwischen der Landweber-Iteration und der asymptotischen Regularisierung. "Diskretisiertman namlich die asymptotische Regularisierung mit tn := nω, xn := x(tn ), n = 0, 1, 2, . . . und ersetzt t ) = x(t ω)−x(t ) , so laudie Ableitung durch den Dierenzenquotienten x(tt )−x −t tet der Ansatz der asymptotischen Regularisierung: 1 2 ( n n+1 n+1 n n n+1 x(tn+1 ) − x(tn ) + A∗ Ax(tn ) = A∗ y δ , x(t0 ) = 0, ω ⇐⇒ xn+1 = x(tn+1 ) = x(tn ) + ωA∗ y δ − ωA∗ Ax(tn ) = (I − ωA∗ A)x(tn ) + ωA∗ y δ = (I − ωA∗ A)xn + ωA∗ y δ also die Landweber-Iteration. Bemerkung 30. Ein weiteres Standard-Verfahren auf das wir hier nicht eingehen ist die Regularisierung durch endlichdimensionale Approximation. 3. Anwendung der Tikhonov-Regularisierung auf nichtlineare Operatorgleichungen Wir betrachten das nichtlineare Identifikationsproblem F (x) = y, x ∈ D ⊆ H1 , (20) y ∈ H2 , wobei H1 und H2 unendlichdimensionale separable, reelle Hilbert-Raume und F ein nichtlinearer Operator ist. 3.1. Fréchet-Ableitung. Wir benotigen zunachst ein paar Begrie und Deni- tionen fur nichtlineare Operatoren. Definition Y 18. Seien X und Y normierte Raume, U ⊂ X oen und f : U → eine Abbildung: (1) F heit G^ateaux-dierenzierbar bei Operator T ∈ L(X, Y ) existiert mit 1 lim (F (x0 + hv) − F (x0 )) = T v h→0 h x0 ∈ U, falls ein stetiger linearer fur alle v ∈ X. (21) 84 3. REGULARISIERUNGSMETHODEN (2) F heit Fréchet-differenzierbar bei x0 ∈ U, falls die Konvergenz in (21) gleichmaig bezuglich v ∈ {x ∈ X : ||x||X ≤ 1}. (3) F heit G^ateaux- bzw. Frechet-dierenzierbar auf U, falls Stelle x0 ∈ U G^ateaux- bzw. Frechet-dierenzierbar ist. Bemerkung f an jeder 31. Man beachte, dass die Ableitung von F an einer Stelle ein linearer Operator ist, die Ableitung von F als Funktion ist eine operatorwertige Abbildung F 0 : U → L(X, Y ). Lemma 9. Mit den Bezeichnungen von Denition 18 ist eine Abbildung F : U → Y genau dann Fr echet-dierenzierbar T ∈ L(X, Y ) existiert mit F (x0 + u) = F (x0 ) + T u + r(u) bei x0 ∈ U, falls ein stetiger Operator mit r(u) = 0. ||u||→0 ||u|| lim In diesem Fall ist F 0 (x0 ) = T. Diese Aussagen ndet man in D. Werner, Funktionalanalysis, Seite 113. Beispiel 9. Wir betrachten die Hammersteinsche Integralgleichung 1 mit 2 F : D(F ) = H [0, 1] → L [0, 1] Z s F (x)(s) := (s − t)x3 (t) dt. 0 Dann ist F Frechet-dierenzierbar mit Z 0 (F (x)h)(s) = 3 s (s − t) x2 (t) h(t) dt. 0 Begrundung: Wenn F Frechet-Dierenzierbar ist, dann ist dierenzierbar und es gilt F auch G^ateaux- 1 d 0 lim (F (x + τ h) − F (x)) = F (x)h = F (x + τ h) , τ →0 τ dτ τ =0 fur die Hammersteinsche Integralgleichung heit das Z s Z s d 2 F (x + τ h) = (s − t)3(x(t) + τ h(t)) h(t) dt =3 (s − t)x2 (t) h(t) dt. dτ 0 0 τ =0 τ =0 Wie man leicht sieht ist F 0 (x) ein linearer Operator. Wir bestimmen F 0 (x)∗ in folgender Weise, wir bestimmen zunachst den L2 -Adjungierten Operator und dann ergibt sich F 0 (x)∗ daraus durch Anwendung des adjungierten Operators B ∗ zum Einbettungsoperator B : H 1 [0, 1] ,→ L2 [0, 1]. Es ist 0 Z hF (x)h1 , h2 iL2 = 1 Z 3 0 0 s Z 2 1 Z 1 (s − t)x (t) h(t) dt h2 (s) ds = 3 (s − t)x2 (t) h(t) h2 (s) ds dt 0 t Z 1 Z 1 = h1 (t) 3x2 (t) (s − t)h2 (s) ds dt = hh1 , (F 0 (x)∗ )L2 h2 iL2 0 t 3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN 85 mit dem L2 -adjungierten Operator 0 ∗ 1 Z 2 (t − s)h2 (t) dt (F (x) )L2 (s) = 3x (t) t und damit ist 0 ∗ (F (x) h)(s) = B ∗ Z 2 3x (t) 1 (t − s)h2 (t) dt . t 3.2. Parameteridentifikation. Diese nichtlinearen Probleme treten typischer Weise bei der Parameteridentikation auf, wobei das direkte Problem sehr wohl linear sein kann, das inverse Problem ist dann trotzdem nichtlinear. Wir wollen das an einem einfachen Beispiel erlautern: Beispiel 10. Wir betrachten das Anfangswertproblem y 0 − ay = f, y(0) = 2. Es hat wie man leicht nachrechnet die Losung at Z y(t) = e t −as e f (s) ds + 2 . 0 . . . ds + 1 = 2 und Probe: y(0) = e Z t Z t 0 at −as at −at at −as y − ay = ae e f (s) ds + 2 + e e f (t) − ae e f (s) ds + 2 = f (t). 0 R 0 0 0 0 Wir untersuchen nun das inverse Problem, d.h. wir wollen aus der Kenntnis der Losung den unbekannten Parameter a bestimmen. D.h. wir mussen die nichtlineare Operatorgleichung F (a) = y, mit at Z (F (a))(t) = e t −as e f (s) ds + 2 = y(t), t ≥ 0, 0 losen. Das Problem ist inkorrekt gestellt. Das sieht man daran, dass fur f (t) = 1 und die Losungen yn (t) = n1 sin(nt) + 2 stets ein Parameter an (t) existiert fur den yn (t) L osung des Anfangswertproblems ist. Wir betrachten also das Anfangswertproblem y 0 − a(t)y = 1, y(0) = 2, und fur yn (t) = n1 sin(nt) + 2 ist yn (0) = 2 und es muss deshalb gelten n an (t) cos(nt) − sin(nt) − 2an (t) = 1 ⇐⇒ n cos(nt) − an (t) sin(nt) − 2nan (t) = n n n n(cos(nt) − 1) cos(nt) − 1 . = ⇐⇒ an (t) (2 sin(nt) + 2n) = n (cos(nt) − 1) ⇐⇒ an (t) = sin(nt) 2(sin(nt) + n) 2 +1 n Es konvergiert zwar yn (t) fur n → ∞ gleichmaig in t gegen y(t) = 2, aber an (t) konvergiert nur fur t = 0. 86 3. REGULARISIERUNGSMETHODEN 3.3. Regularisierung nichtlinearer Operatorgleichungen. Wir betrachten die nichtlineare Operatorgleichung (20). 3.3.1. Diskretisierung. Die Diskretisierung fuhrt auf ein nichtlineares Gleichungssystem und dieses wird anschlieend regularisiert. Beispiel 11. Selbstfaltungsgleichung. Wie bekannt, ist die Wahrscheinlich- keitsdichte y einer Summe vom zwei stochastisch unabhangigen Zufallsgroen mit den Wahrscheinlichkeitsdichten u und v uber die Faltung Z ∞ u(s − t)v(t) dt, y(s) = −∞ < s < ∞, −∞ berechenbar. Gilt spezielle u(t) = v(t) = 0 fur t < 0 und x(t) := u(t) = v(t), d.h., die beiden summierten Zufallsgroen sind identisch verteilt und nehmen mit Wahrscheinlichkeit Eins positive Werte an, dann haben wir y(s) = 0 fur s < 0 und Z s x(s − t) x(t) dt, y(s) = 0 ≤ s < ∞. 0 Es sei nun die Funktion y(s) im Einheitsintervall s ∈ [0, 1] bekannt. Davon ausgehend soll die Dichte Funktion x(t) in eben diesem Intervall rekonstruiert werden. Dies ist ein nichtlineares Identikationsproblem. Es ist Z s x(s − t)x(t) dt = y(s), [F (x)](s) := 0 ≤ s ≤ 1, 0 mit H1 = H2 = L2 (0, 1). Vorgehensweise: 1) Unterteilen Einheitsintervall [0, 1] in n Teilintervalle Ij := [sj−1 , sj ] mit den Randpunkten sj := nj , j = 0, 1, 2, . . . und den Mittelpunkten tj := i−n , i = 1 2 1, 2, . . . . 2) Die Integrale Z sj x(sj − t)x(t) dt y(sj ) = 0 lassen sich mit Hilfe der Rechteckregel unter Verwendung von Funktionswerten in den Mittelpunkten der Teilintervalle durch die Summen j 1X x(sj − ti )x(ti ) n i=1 annahern. 3) Da in L2 (0, 1) Funktionswerte nicht punktweise deniert sind, substituiert man y(sj ) und auch x(ti ) durch gewichtete Durchschnitte Z yj := w1 (t)y(t) dt Ij bzw. Z xi := w2 (t)x(t) dt Ii 3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN 87 mit geeigneten Gewichtsfkt. w1 bzw. w2 mit I w1 (t) dt = I 4) Mit ~x = (x1 , x2 , . . . , xn )T und ~y = (y1 , y2 , . . . , yn )T sowie R R j i w2 (t) dt = 1. j 1X F (~x) := xj+1−i xi , n i=1 so lasst sich die inkorrekte nichtlineare Integralgleichung durch das entsprechende schlechtkonditionierte nichtlineare Gleichungssystem F (~x) = ~y , ~x ∈ D ⊆ Rn , (22) ~y ∈ Rn annahern, wobei D := {~x ∈ Rn : xi ≥ 0, i = 1, 2, . . . , n} als Denitionsbereich betrachtet werden soll, um negative Losungen auszuschlieen. 5) Die auf der Losung des nichtlinearen Optimierungsproblems Tα (x) := ||F (~x) − ~y δ ||2H2 + α||~x − ~x∗ ||2H1 = min!, x ∈ D, beruhende Tikhonov-Regularisierung liefert dann fur einen Referenzvektor und genugend groes α > 0 wieder stabile Naherungslosungen ~xδα von (22). ~x∗ 3.3.2. Levenberg-Marquardt-Methode. Wir betrachten wieder die nichtlineare Operatorgleichung (20): F (x) = y, x ∈ D ⊆ H1 , y ∈ H2 , wobei die rechte Seite nur bis auf das Fehlerniveau δ > 0 bekannt ist, d.h. ||y−y δ ||H2 ≤ δ. Wir suchen deshalb ein Element a∗ ∈ H1 , das ||F (x) − y||H2 minimiert. Vorgehensweise: 1) Als Startwert a0 ∈ D(F ) wird ein beliebiges zulassiges Element aus dem Denitonsbereich von F gewahlt und das direkte Problem F (a0 ) = y0 gelost. 2) Nun wird uberpruft, wie nahe y0 an y δ ist. Ist F Frechet-dierenzierbar, so gilt F (a0 + h) = F (a0 ) + F 0 (a0 )h + r(a0 ; h). Da F (a0 ) = y0 ist und wir mochten h so wahlen, dass F (a0 + h) = y δ ist, ergibt sich unter Vernachlassigung des Restglieds: y δ = y0 + F 0 (a0 )h ⇐⇒ F 0 (a0 )h = y δ − y0 . 88 3. REGULARISIERUNGSMETHODEN 3) Diese Operatorgleichung ist i. Allg. inkorrekt gestellt. Deshalb wird auf diese lineare Operatorgleichung (die Frechet-Ableitung ist ein linearer Operator!) die TikhonovRegularisierung angewandt und somit ist h die Losung der Gleichung: (F 0 (a0 )∗ F 0 (a0 ) + αI) h = F 0 (a0 )∗ (y δ − y0 ). 4) Nun wird a0 +h als neues a0 verwendet und mit Schritt 2) weitergemacht bis F (a0 ) nahe genug an y δ herankommt. Bemerkung 32. Anstelle der Tikhonov-Regularisierung kann auch die Landweber- Iteration verwendet werden, d.h. aδn := aδn−1 + F 0 (aδn−1 )∗ (y δ − F (aδn−1 )), n ∈ N, mit einem Startwert a0 . Bemerkung 33. Fur diese Iterationsmethoden gibt es keine globalen Konver- genzeigenschaften, da das Argument der Frechet-Ableitung sich in jedem Iterationsschritt andert. 3.3.3. Nichtlineare Tikhonov-Regularisierung. Wir suchen die x∗ -Minimum-NormLosung der Operatorgleichung F (x) = y zu einem gegebenen Referenzelement x∗ ∈ H1 . Die nach Tikhonov regularisierten Losungen xδα ∈ D werden dabei ausgehend von den gestorten Daten y δ ∈ H2 mit ||y δ − y||H2 ≤ δ als Losungen des regularisierten nichtlinearen Extremalproblems Tα (x) := ||F (x) − y δ ||2H2 + α||x − x∗ ||2H1 = min!, x ∈ D, (23) zu einem positiven Regularisierungsparameter α > 0 konstruiert. Voraussetzungen: (1) Der Denitionsbereich D ⊆ H1 sei konvex. (2) Der nichtlineare Operator F : D ⊆ H1 → H2 sei stetig und schwach abgeschlossen. Auerdem besitze F f ur alle x ∈ D eine Fréchet-Ableitung F 0 (x). (3) Zur exakten rechten Seite y ∈ H2 existiere wenigstens ein x0 ∈ H1 mit F (x0 ) = y. Definition 19. Ein nichtlinearer Operator F : H1 k D → H2 , heit schwach abgeschlossen, wenn f ur {xn } ⊂ D die schwache Konvergenz der Folgen xn * x0 in H1 und F (xn ) * y0 in H2 die Beziehungen x0 ∈ D und F (x0 ) = y0 nach sich ziehen. Es gilt insbesondere: 3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN 89 Lemma 10. Es sei F : H1 k D → H2 ein auf der oenen Menge S ⊆ D kompakter Operator, die im Punkt x0 ∈ S Frechet-dierenzierbar ist. Dann stellt die Frechet-Ableitung F 0 (x0 ) ∈ L(H1 , H2 ) ebenfalls einen kompakten Operator dar. Wir kommen nun zum regularisierten nichtlinearen Extremalproblem zuruck: Lemma 11. Unter den formulierten Voraussetzungen besitzt das regularisierte nichtlineare Extremalproblem (23) fur alle Losung xδα ∈ D. y δ ∈ H2 und α>0 wenigstens eine Beweis: Man bilde eine Folge {xn } ⊂ D, so dass Tα (xn ) ≤ inf Tα (x) + ηn und x∈D limn→∞ ηn = 0, dann sind auch die Folgen {||F (xn ) − y δ ||2H2 } und {||xn − x∗ ||2H1 } sowie wegen ||F (xn )||H2 − ||y δ ||H2 ≤ ||F (xn ) − y δ ||H2 auch {||F (xn )||H2 } und {||xn ||H1 } beschrankte Folgen. Deshalb gibt es eine schwach konvergente Teilfolge xnk * x ∈ D mit F (xnk ) → y. Wegen der schwachen Abgeschlossenheit von F gilt y = F (x) und damit ||x − x∗ ||H1 ≤ lim inf ||xnk − x∗ ||H1 k→∞ und ||F (x) − y δ ||H2 ≤ lim inf ||F (xnk ) − y δ ||H2 . k→∞ Wegen Tα (x) ≤ lim inf Tα (xn ) = inf Tα (x) k→∞ x∈D ist dann x = xδα eine Losung des Extremalproblems. # Analog zeigt man die Stabilitat der regularisierten Losungen xδα bezuglich kleiner Storungen in den Daten: Gilt y δn → y δ0 in H2 , so gibt es in der Folge regularisierter Losungen xδαn eine in H1 konvergente Teilfolge, und das Grenzelement jeder solchen konvergenten Teilfolge ist eine regularisierte Losung xδα0 . 90 3. REGULARISIERUNGSMETHODEN Satz dass 32. Die Regularisierungsparameter α = α(δ) seien derart gewahlt, δ2 → 0 f ur δ → 0 und α(δ) gilt. Dann hat unter den formulierten Voraussetzungen an F fur δn → 0 jede Folge xδα von Losungen des regularisierten Extremalproblems α(δ) → 0 n n Tα (x) := ||F (x) − y δ ||2H2 + α||x − x∗ ||2H1 = min!, x ∈ D, mit δ := δn , ||yδ − y||H ≤ δn , und α := αn = αn (δn ) eine in H1 konvergente Teilfolge, deren Grenzelement eine x∗ -Minimum-Norm-Losung der Operatorgleichung F (x) = y darstellt. n 2 Beweis: Es sei xmn eine x∗ -Minimum-Norm-Losung von F (x) = y. Dann gilt f ur die δn Elemente der Folge {xαn } regularisierter Losungen die Ungleichung: Tαn xδαnn = ||F xδαnn − y δn ||2H2 + αn ||xδαnn − x∗ ||2H1 ≤ n n Tαn (xmn ) = ||F xδmn − y δn ||2H2 + αn ||xδmn − x∗ ||2H1 ≤ δn2 + αn ||xmn − x∗ ||2H1 , δn } in H2 be{F x dann ist die Folge {F xδαnn − y δn } und mehr noch die Folge α n δnk schrankt, d.h. es gibt eine schwach konvergente Teilfolge F xαnk * y und wegen der Eindeutigkeit des schwachen Grenzwerts y = y. Insgesamt erhalt man daraus, δnk dass F xαnk * y und ||F xδαn − y||H2 − ||y − y δn ||H2 2 ≤ ||F xδαn − y δn ||2H ≤ δn2 + αn ||xmn − x∗ ||2H n n 2 1 also q ||F xδαnn − y||H2 ≤ δn2 + αn ||xmn − x∗ ||2H1 + δn → 0 fur n → ∞, also die schwache und Normkonvergenz und damit die Konvergenz F xδαnn → y fur n → ∞. Aus αn ||xδαnn − und lim x∗ ||2H1 2 δn α n→∞ n ≤ δn2 + αn ||xmn − x∗ ||2H1 ⇐⇒ ||xδαnn − x∗ ||2H1 δn2 ≤ + ||xmn − x∗ ||2H1 αn = 0 f ur n → ∞ gilt lim sup ||xδαnn − x∗ ||H1 ≤ ||xmn − x∗ ||H1 . n→∞ Da nun {xδαnn } beschrankt ist, haben wir eine schwach konvergente Teilfolge xαnnkk * x ∈ D f ur k → ∞. Die schwache Abgeschlossenheit von F liefert dann F (x) = y. δ 3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN 91 Wegen xαnnkk − x∗ * x − x∗ ist δ δn δn ||x − x∗ ||H1 ≤ lim inf ||xαnkk − x∗ ||H1 ≤ lim sup ||xαnkk − x∗ ||H1 ≤ ||xmn − x∗ ||H1 k→∞ k→∞ und somit x selbst x∗ -Minimum-Norm-Losung ist. (Im Allgemeinen ist x 6= xmn ! ) # Wie im Fall der linearen Tikhonov-Regularisierung lassen sich Konvergenzraten nur durch Quelldarstellungen erreichen. Es gilt Satz 33. Es sei xmn eine x∗ -Minimum-Norm-Losung der nichtlinearen Operatorgleichung (20) mit fur alle x ∈ D. Dann gilt unter den formulierten Voraussetzungen an den Operator F fur eine a priori Parameterwahl α = α(δ) ∼ δ, d.h. es gibt c1 , c2 > 0 mit c1 δ ≤ α(δ) ≤ c2 δ, f ur alle betrachteten δ > 0, die Fehlerabschatzung ||F 0 (x) − F 0 (xmn )||L(H1 , H2 ) ≤ L||x − xmn ||H1 (24) √ ||xδα − xmn ||H1 ≤ C δ fur eine Konstante C > 0, falls xmn eine Quelldarstellung der Gestalt xmn − x∗ = F 0 (xmn )∗ w, w ∈ H2 (25) mit (26) L||w||H2 < 1 erfullt. Beweis: Zunachst gilt wiederum Tα (xδα ) = ||F (xδα ) − y δ ||2H2 + α||xδα − x∗ ||2H1 ≤ Tα (xmn ) ≤ δ 2 + α||xmn − x∗ ||2H1 , welche ||F (xδα ) − y δ ||2H2 + α||xδα − xmn ||2H1 = = ||F (xδα ) − y δ ||2H2 + α||xδα − x∗ ||2H1 −α||xδα − x∗ ||2H1 + α||xδα − xmn ||2H1 ≤ ≤ δ 2 + α ||xmn − x∗ ||2H1 + ||xδα − xmn ||2H1 − ||xδα − x∗ ||2H1 = δ 2 + 2αhxmn − x∗ , xmn − xα δiH2 nach sich zieht. Wegen (24) und der Taylorreihenentwicklung F (xδα ) = F (xmn ) + F 0 (xmn )(xα − xmn ) + rαδ (xδα , xmn ) gilt ||rαδ ||H2 ≤ L2 ||xδα − xmn ||2H1 also ||F (xδα − F (xmn ) − F 0 (xmn )(xδα − xmn )||H2 ≤ L ||xα − xmn ||2H1 . 2 (grobe Begrundung: Sei f einfach eine Funktion, dann ist die Taylorreihe f (xδα ) = f (xmn ) + f 0 (xmn )(xα − xmn ) + rαδ (xδα , xmn ), 92 3. REGULARISIERUNGSMETHODEN wobei das Restglied 1 rαδ = f 00 (ξ)(xδα − xmn ) 2 Dann kann man approximieren: 1 00 1 f 0 (ξ) − f 0 (xmn ) δ L f (ξ)(xδα − xmn )2 ∼ (xα − xmn )2 / |xδα − xmn |2 . 2 2 ξ − xmn 2 Damit folgt unter Berucksichtigung der Quelldarstellung (25) ||F (xδα ) − y δ ||2H2 + α||xδα − xmn ||2H1 ≤ δ 2 + 2αhw, F 0 (xmn )(xmn − xδα )iH2 ≤ δ 2 + 2αhw, (y − y δ ) + (y δ − F (xδα )) + (F (xδα )−F (xmn ) − F 0 (xmn )(xδα − xmn ))iH2 ≤ δ 2 + 2αδ||w||H2 + 2α||w||H2 ||F (xδα ) − y δ ||H2 + αL||xδα − xmn ||2H1 . Dies wiederum liefert die Ungleichung (||F (xδα ) − y δ ||H2 − α||w||H2 )2 + α(1 − L||w||H2 )||xδα − xmn ||2H1 ≤ (δ + α||w||H1 )2 und schlielich wegen (26) δ + α||w||H2 ||xδα − xmn ||H1 ≤ √ p . α 1 − L||w||H2 Hieraus erhalt man mit c1 δ ≤ α ≤ c2 δ die Abschatzung √ √ δ(1 + c2 ||w||H2 ) ≤ C δ. ||xδα − xmn ||H1 ≤ √ p c1 1 − L||w||H2 # Bemerkung 34. Aus obigen Uberlegungen wird auch deutlich, dass wenn die Voraussetzungen des Satzes erfullt sind, es nur eine x∗ -Minimum-Norm-Losung xmn der Operatorgleichung F (x) = y geben kann.