The Lorenz Attractor

Werbung
Inverse Probleme
PD Dr. Swanhild Bernstein,
TU Bergakdemie Freiberg,
Sommersemester 2007
Inhaltsverzeichnis
Kapitel 1. Inverse Probleme und Fourier Transformation
1. Magnet-Resonanz-Tomographie
1.1. Grundprinzip
1.2. Mathematisches Modell
2. Fourier-Transformation
3. Inverse Streutheorie
4. Korrekt gestellte Probleme
4.1. Korrektheit linearer Probleme in Banachraumen
5. Sobolev-Raume und inkorrekt gestellte Probleme
5.1. Seil unter Eigenlast
5.2. Exponentielles Wachstum
5.3. Korrektheit inverser Probleme auf kompakten Mengen
5.4. Sobolev-Raume und kompakte Einbettungen
6. Computertomographie und Radon-Transformation
6.1. Das 2D-Problem
6.2. Die Radon-Transformation im R2
6.3. Inversionsformel fur die 2D Radon-Transformation
6.4. Die Radon-Transformation im R3 und Inversionsformel
7. Das Cauchy-Problem, Elektrokardiographie
7.1. Halbraum-Problem
7.1.1. Elektrokardiograsche Anwendung
7.1.2. Analytische Fortsetzung
7.2. Der allgemeine 2D-Fall
7.2.1. Die Laplace-Gleichung im Kreisring
7.2.2. Riemannscher Abbildungssatz
5
5
5
8
10
12
14
15
17
17
21
22
23
26
26
28
31
35
37
39
39
41
42
42
44
Kapitel 2. Identikationsprobleme in Hilbert-Raumen
1. Einige Grundbegrie der Hilbert-Raum-Theorie
1.1. Eigenschaften beschrankter linearer Operatoren in Hilbert-Raumen
1.2. Verallgemeinerte oder Moore-Penrose-Inverse
47
48
50
55
Kapitel 3. Regularisierungsmethoden
1. Heuristischer Zugang
2. Ein allgemeines Regularisierungsschema
2.1. Wahl des Regularisierungsparameters
2.2. Regularisierungsverfahren
2.3. Tikhonov-Regularisierung
2.4. Diskrepanzprinz
61
61
64
65
66
68
71
3
4
INHALTSVERZEICHNIS
2.5. Prinzip der Quasioptimalitat
2.6. Weitere Regularisierungsmethoden
2.6.1. Landweber-Iteration
2.6.2. Asymptotische Regularisierung
3. Anwendung der Tikhonov-Regularisierung auf nichtlineare Operatorgleichungen
3.1. Frechet-Ableitung
3.2. Parameteridentikation
3.3. Regularisierung nichtlinearer Operatorgleichungen
3.3.1. Diskretisierung
3.3.2. Levenberg-Marquardt-Methode
3.3.3. Nichtlineare Tikhonov-Regularisierung
75
79
79
82
83
83
85
86
86
87
88
KAPITEL 1
Inverse Probleme und Fourier Transformation
In diesem Kapitel werden zunachst zwei Beispiele fur inverse Probleme eingefuhrt.
Diese Probleme konnen mit Hilfe der Fourier-Transformation gelost werden.
1. Magnet-Resonanz-Tomographie
1.1. Grundprinzip. Entnommen aus: Wikipedia
http://de.wikipedia.org/wiki/Magnetresonanztomographie

sowie von der FH Hagenberg in Osterreich
http://webster.fh-hagenberg.at/sta/wbackfri/Teaching/MBV/Vorlesung/Tomography.pdf
Die physikalische Grundlage der Magnetresonanztomographie (MRT) bildet die Kernspinresonanz (engl. nuclear magnetic resonance, NMR). Hier nutzt man die Tatsache,
dass Protonen sowie Neutronen einen Eigendrehimpuls (Spin) besitzen und Atomkerne dadurch ein magnetisches Moment erhalten. Ein Atomkern kann vom Standpunkt
der klassischen Physik aus vereinfacht als ein magnetischer Kreisel angesehen werden.
(Der Spin kann klassisch jedoch nicht korrekt beschrieben werden).
Wird ein solcher rotierender Kern in ein statisches magnetisches Feld H0 gebracht,
so richtet sich dieser nach H0 aus. Durch das Ausrichten beginnt der Kern mit einer
Prazessionsbewegung d.h. die Rotationsachse des Kerns dreht sich um die Richtung
des angelegten Magnetfeldes. Die Prazessionsbewegung tritt jedesmal dann auf, wenn
der Kern aus seiner Ruhelage gebracht wird. Wird das auere Feld wieder abgestellt,
so fallt der Kern in seine ursprungliche Lage (thermisches Gleichgewicht) zuruck.
Wird ein zweites Feld (Transversalfeld) HT angelegt, welches senkrecht zum ersten
steht, beginnt der Kern wieder zu prazidieren (bis sich ein Gleichgewichtszustand
einstellt) ebenso wenn das Feld wieder abgestellt wird. Um die Kerne dauerhaft zur
Prazession anzuregen, ist dieses zweite Feld ein hochfrequentes Wechselfeld (HF-Feld)
und rotiert in der xy-Ebene. Das Magnetfeld H0 hat ublicherweise eine Starke von
2,0 - 3,0 Tesla, in experimentellen Geraten bis 9,4 Tesla (An der Universitat Zurich
sogar bis 20 Tesla).
Fur die Prazessionsbewegung des Kernspins existiert eine Resonanzfrequenz. Bei
Atomkernen (aber auch beim Elektron) wird diese Eigenfrequenz Larmorfrequenz
genannt. Diese ist abhangig von der Starke des eingepragten Magnetfeldes und vom
Aufbau des Kerns. Durch die Wahl der Starke des ersten (statischen) Feldes H0 und
die Wahl der Frequenz des Transversalfeldes HT kann sehr genau bestimmt werden,
5
6
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
welche Kerne in Resonanz geraten sollen. Durch diesen Resonanzeekt wird das makroskopische magnetische Moment m des Kerns um 90◦ in die xy-Ebene gekippt und
rotiert prazidierend mit dem Transversalfeld. Der magnetische Fluss des rotierenden Dipols induziert in der Messspule eine Spannung. Der magnetische Fluss des
rotierenden Dipols induziert in der Messspule eine Spannung.
z
Spule
y
mT
x
Φ
U
Wird das transversale Wechselfeld, welches das magnetische Moment m eines
Kerns um 90◦ gekippt hat, abgeschaltet, so rotiert der Kern weiter in der xy-Ebene.
Bringt man nun eine Spule in die Nahe des rotierenden magnetischen Moments, so
wird in dieser eine Spannung induziert. Da die Messspulen gewohnlich normal auf der
xy-Ebene stehen, ist die gemessene Spannung proportional zur Quermagnetisierung
mT des magnetischen Momentes m. Mit einer Folge von HF-Impulsen des Transversalfeldes in einem Korper, der in einem starken Magnetfeld liegt, kann eine rotierende
Quermagnetisierung MT erzeugt werden, welche sich aus den Quermagnetisierungen
mT der einzelnen Kerne zusammensetzt. Diese Quermagnetisierung ist vom Ort und
vom Gewebetyp abhangig.
Das Ziel der MR-Tomographie ist die Erzeugung von Schichtbildern der Quermagnetisierung MT (x, y) mit der Dichte ρ = ρ(x, y, 0).
Zum besseren Verstandnis wird hier das Prinzip der einfachsten, sogenannten
Spinecho-Sequenz kurz skizziert. Eine SSequenzst in diesem Zusammenhang eine
Kombination aus hochfrequenten Impulsen und Magnetfeldern bestimmter Frequenz
bzw. Starke, die vielfach in jeder Sekunde in vorgegebener Reihenfolge ein- und
ausgeschaltet werden.
Zu Beginn steht der sogenannte Anregungsimpuls. Wird uber die Sendeantenne
ein hochfrequenter Wellenimpuls der passenden Frequenz (Larmor-Frequenz) eingestrahlt, dann werden die Spinachsen quer zum aueren Magnetfeld ausgelenkt. Sie
beginnen um die ursprungliche Achse zu kreisen. Wie bei einem Kreisel, welcher
1. MAGNET-RESONANZ-TOMOGRAPHIE
7
angestoen wird, nennt man diese Bewegung Prazession. Die prazidierenden Dipole
bilden winzige Sender und strahlen die hochfrequente Energie ab, wahrend sie sich
wieder aufrichten.
Das hochfrequente Signal kann auerhalb des Korpers gemessen werden. Es zerfallt
exponentiell, weil die Protonenspins aus dem Takt geraten und sich gegenseitig uberlagern. Die Zeit, nach der 63% des Signals zerfallen sind, nennt man T 2-Relaxationszeit
(Spin-Spin-Relaxation). Diese Zeit hangt von der chemischen Bindung des Wasserstos ab; sie ist fur jede Gewebsart unterschiedlich. Tumorgewebe hat z. B. meist
eine langere T 2-Zeit als normales Muskelgewebe. Eine T 2-gewichtete Messung stellt
den Tumor darum heller als seine Umgebung dar.
Durch geeignete Rephasierungs-Impulse kann man bewirken, dass die Spins zum
Zeitpunkt der Messung wieder genau in der gleichen Phase sind. Die Signalstarke
hangt dann nicht von der T2-Relaxationszeit ab, sondern von der sogenannten T 1Relaxationszeit (Spin-Gitter-Relaxation), die ein Ma fur die Geschwindigkeit ist, mit
der sich die Quermagnetisierung wieder ruckbildet, also die ursprungliche Langsausrichtung der Spins zum aueren Magnetfeld wieder einstellt. Die T 1-Zeit ist ebenfalls
gewebespezisch, aber deutlich (20×) langer als die T 2-Zeit. Die T 1-Zeit von Wasser betragt z. B. 2,5 Sekunden. T 1-gewichtete Messsequenzen erlauben wegen des
starkeren Signals eine bessere Ortsauosung, aber einen geringeren Gewebekontrast
als T 2-gewichtete Bilder.
Eine Kernspintomographie umfasst stets T1- und T2-gewichtete Bildserien und
daruber hinaus mindestens zwei raumliche Ebenen.
Um die Signale den einzelnen Volumenelementen (Voxeln) zuordnen zu konnen,
wird mit abgestuften Magnetfeldern (Gradientenfeldern) eine Ortskodierung erzeugt.
Ein Gradient liegt bei der Anregung an und stellt sicher, dass nur eine einzelne Schicht
des Korpers die passende Larmorfrequenz besitzt, also nur die Spins dieser Schicht
ausgelenkt werden (Schichtselektionsgradient). Ein zweiter Gradient quer zum ersten
wird nach der Anregung kurz eingeschaltet und bewirkt eine kontrollierte Dephasierung der Spins dergestalt, dass in jeder Bildzeile die Prazession der Spins eine andere
Phasenlage hat (Phasenkodiergradient). Der dritte Gradient wird wahrend der Messung senkrecht zu den beiden anderen geschaltet; er sorgt dafur, dass die Spins jeder
Bildspalte eine andere Prazessionsgeschwindigkeit haben, also eine andere Larmorfrequenz senden (Auslesegradient, Frequenzkodiergradient).
Alle drei Gradienten zusammen bewirken also eine Kodierung des Signals in drei
Raumebenen. Das empfangene Signal gehort zu einer bestimmten Schicht des Korpers
und enthalt eine Kombination aus Frequenz- und Phasenkodierung, die der Computer
mit einer Fourier-Transformation auosen kann.
Bemerkung
1. Klopfgerausche: Zur Ortskodierung der Bildinformation wer-
den dem Hauptmagnetfeld zusatzliche Gradientenfelder ( in x-, y- und z-Richtung)
 die dabei verwendeten Gradientenspulen werden innerhalb von
uberlagert. Uber
8
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Millisekunden starke Magnetfelder auf- und abgebaut. Die entstehenden elektromagnetischen Krafte zerren dabei so stark an den Spulenverankerungen, dass
laute klopfende bzw. hammernde Gerausche auftreten, die je nach gefahrener
Sequenz unterschiedlich sind. Das Gerat arbeitet dabei fast wie ein Lautsprecher: Ein starker Magnet ist von durchossenen Spulen umgeben.
1.2. Mathematisches Modell. Das statische Magnetfeld in z -Richtung sei
~ 0 = H0 ~ez .
H
~ 0 ausrichtet. Da
Dies bewirkt, dass sich der Drehimpuls der Protonen parallel zu H
~ 0 als nach −H
~ 0 ausrichten, entsteht ein makroskopisches
sich ein paar mehr nach H
~ , das in die gleiche Richtung wie H
~ 0 zeigt.
magnetisches Moment M
Nun wird ein magnetisches Wechselfeld
~ 1 (t) = 2H1 cos(ω0 t)~ex ,
H
~ 0 | f
gepulst mit der Resonanzfrequenz der Atome (=Larmor-Frequenz) ω0 = γ|H
ur die
Zeit tp angelegt. Wobei γ das gyromagnetische Verhaltnis bezeichnet (= eine kreisel~ in die x − y -Ebene, bei Rotation um z.
magnetische Konstante). Dadurch kippt M
~ bewirkt, das die Atome einer PrazissionsbeweDie Verzerrung der Richtung von M
~ 0 ausf
gung um H
uhren.
1. MAGNET-RESONANZ-TOMOGRAPHIE
9
~ wieder zur
Nach dem Abschalten des Wechselfeldes wandert M
uck an seine ursprungliche Position. Es erfolgt dann eine Zunahme in z in der Zeit T 1 und eine Abnahme
in x − y in der Zeit T 2. Die Richtungsanderung bewirkt, das in geeigneten Geraten,
Spannungen induziert werden, die gemessen werden konnen. Dies heit FID-Signal
(free induction decay).
S(t) = ρ cos(ω0 t) e−t/T 2 .
Dabei ist ρ die Dichte des magnetischen Moments und T 2 die Spin-Spin-Relaxationszeit.
Das hochfrequente Signal kann auerhalb des Korpers gemessen werden. Es zerfallt
exponentiell, weil die Protonenspins aus dem Takt geraten und sich gegenseitig uberlagern. Die Zeit, nach der 63% des Signals zerfallen sind, nennt man T 2-Relaxationszeit
(Spin-Spin-Relaxation). Diese Zeit hangt von der chemischen Bindung des Wasserstos ab; sie ist fur jede Gewebsart unterschiedlich. Tumorgewebe hat z. B. meist
eine langere T 2-Zeit als normales Muskelgewebe. Eine T 2-gewichtete Messung stellt
den Tumor darum heller als seine Umgebung dar.
Durch geeignete Rephasierungs-Impulse kann man bewirken, dass die Spins zum
Zeitpunkt der Messung wieder genau in der gleichen Phase sind. Die Signalstarke
hangt dann nicht von der T 2-Relaxationszeit ab, sondern von der sogenannten T 1Relaxationszeit (Spin-Gitter-Relaxation), die ein Ma fur die Geschwindigkeit ist, mit
der sich die Quermagnetisierung wieder ruckbildet, also die ursprungliche Langsausrichtung der Spins zum aueren Magnetfeld wieder einstellt. Die T 1-Zeit ist ebenfalls
gewebespezisch, aber deutlich (20×) langer als die T 2-Zeit. Die T 1-Zeit kann nicht
mit einem um 90◦ gekippten hochfrequenten Wechselfeld bestimmt werden und wir
betrachten sie deshalb nicht.
Weil das menschliche Gewebe nicht homogen ist, konnen uberhaupt geeignete Bilder entstehen. Eine gute raumliche Auosung entsteht weil nur die Teile des Gewebes,
~ mit |H|
~ = γω0 benden, durch das Wechselfeld
die sich im statischen Magnetfeld H
~ 1 (t) beeinusst werden. Es sei das statische Magnetfeld
H
~
~ 0 + Gz z ~ez
H(z)
=H
10
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
vorhanden. Davon werden nur Protonen im Schnitt mit z nahe bei 0 durch das
~ 1 (t) beeinusst (da |H
~ 0 | = γ ω0 vorausgesetzt wurde). Dies erlaubt es,
Wechselfeld H
R
die mittlere Gewebedichte R2 ρ(x, y, 0) dx dy in der Ebene z = 0 abzubilden und
~ 0 bzw. ω0 in jeder beliebigen z -Ebene.

durch Anderung
von H
Das reicht aber noch nicht aus um ρ(x, y, 0) zu bestimmen. Legen wir nun fur
die Zeitdauer T ein statisches Magnetfeld
~
~ 0 + Gy y~ez .
H(y)
=H
Da die Frequenz der Prazession vom Magnetfeld abhangt, erzeugt die Magnetisierung
eine Rotation an der Stelle y mit der Frequenz ω(y) = ω0 + γ Gy ~ez . Dadurch baut
sich an der Stelle z wahrend der Zeit T eine Phasenverschiebung von T (ω(y) − ω0 ) =
T γ Gy y auf. Wird das Feld Gy y~ez abgeschaltet, so rotieren die Kerne wieder mit der
Frequenz ω0 , allerdings hangt die Phase nun von y ab. Dieser Teil der MRT wird
deshalb Phasendekodierung genannt. Eine Messung des FID-Signals wurde nun ein
Signal der Form
Z
S(t; T ) = eiω0 t
eiγ Gy T y ρ(x, y, 0) dx dy
R2
ergeben. Durch Variation der Zeitdauer T bzw. des Gradienten Gy kann man den
Frequenzanteil in Abhangigkeit von y der Dichte ρ(x, y, 0) erhalten. Damit ist aber
immer noch nicht die x-Abhangigkeit erhalten worden. Dafur wird nun wahrend der
FID-Messung ein von x abhangiges statisches Magnetfeld zugeschaltet. Die Kerne
prazisieren nun mit der x-abhangigen Frequenz ω(x) = ω0 + γ Gx x um die z -Achse.
Damit ergibt sich das FID-Signal
Z
eiγ Gy T y ei(ω0 +γ Gx x)t ρ(x, y, 0) dx dy
S(t; T ) =
R2
bzw. mit ξ = γ Gx t und η = γ Gy T ergeben sich die verfugbaren Daten
−iω0 ξ/(γ Gx )
D(ξ, η) = e
S
η
ξ
;
γGx ηGY
Z
=
eiηy eiξx ρ(x, y, 0) dx dy.
R2
Durch Variation von T (bzw. Gy ) und t (bzw. Gx ) erhalt man D(ξ, η) fur alle wesentlichen Werte von ξ und η. Folglich ist die Rekonstruktion der Dichte ρ(x, y, 0)
aquivalent zur Inversion der Fourier-Transformation und man erhalt
1
ρ(x, y, 0) =
(2π)2
Z
e−i(ξx+ηy) D(ξ, η) dξ dη.
R2
Die Rekonstruktion der Dichte des magnetischen Moments ist also nichts anderes als
die Inversion der Fourier-Transformation.
2. Fourier-Transformation
Wir wollen hier nur einige wichtige Eigenschaften der Fourier-Transformation
wiederholen:
2. FOURIER-TRANSFORMATION
11
Es sei f (~x) eine komplex-wertige in L2 (Rn ), also eine messbare Funktion des Rn ,
die quadratisch integrierbar ist, d.h.
Z
2
|f (~x)|2 d~x < ∞.
||f || =
Rn
Dann ist die Fourier-Transformation deniert als
fˆ(~k) = F~x→~k f (~k) =
Z
~
e−ik·~x f (~x) d~x.
Rn
Man kann zeigen, dass fˆ(~k) ∈ L2 (Rn ) ist und die Fourier-Transformation invertierbar
auf L2 (Rn ) ist mit der Inversen
f (~x) =
h
i
−1 ˆ
f
F~k→~
x
1
(~x) =
(2π)n
Z
~
eik·~x fˆ(~k) d~k.
Rn
Der Raum L2 (Rn ) besitzt das Skalarprodukt
Z
hf, gi =
f (~x)g(~x) d~x,
Rn
dabei bezeichnet g(~x) die komplex konjugierte Zahl zu g(~x). Fur die Fourier-Transformation
gilt die Parsevalsche Gleichung
(fˆ, ĝ) = (2π)n (f, g),
insbesondere folgt hieraus
||fˆ|| = (2π)n/2 ||f ||.
Dies bedeutet, dass die Fourier-Transformation und ihre Inverse (bis auf den Faktor
(2π)n/2 ) Isometrien sind.
Wichtige Eigenschaften: Ableitungen.
Es sei α = (α1 , α2 , . . . , αn ) ein Multiindex mit nichtnegativen Komponenten αj ≥ 0
n
P
und |α| = αj sei die Lange des Multiindex. Dann sei
i=1
n
Y
∂ αi
D =
αi .
∂x
i
i=1
α
Dann folgt fur die Fourier-Transformation
n
Y
(ikj )αj
F~x→~k [Dα f ] (~k) =
!
F~x→~k f (~k).
j=1
Faltung.
Die Faltung zweier Funktionen ist deniert als
Z
(f ∗ g)(~x) =
f (~x − ~y ) g(~y ) d~y .
Rn
12
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Damit ergibt sich
F~x→~k (f ∗ g) = F~x→~k f
d.h. f[
∗ g = fˆĝ,
F~x→~k g ,
d.h. fˆ ∗ ĝ = (2π)nb(f g).
F~x−1
(fˆ ∗ ĝ) = (2π)n f g,
→~k
Folglich diagonalisiert die Fourier-Transformation Dierentialoperatoren (Multiplikation im Fourier-Bild). Andererseits uberfuhrt die Fourier-Transformation das Produkt zweier Funktionen in die nicht lokale Faltung.
3. Inverse Streutheorie
Wir betrachten die (ortlich) eindimensionale Wellengleichung
1 ∂2U
∂2U
−
= δ(t)δ(x − xs ),
v 2 (x) ∂t2
∂x2
t ∈ R,
x ∈ R,
mit Delta-Quellterm zur Zeit t = 0 und an der Stelle x = xs . Wie setzen Kausalitat
voraus, d.h. U (x, t, xs ) = 0 fur t < 0 und weiterhin sei U beschrankt.
Wir messen U (xs , txs ), d.h. das Geophon (Detektor zur Aufnahme hochfrequenter
seismischer Bodenbewegungen) sich an der gleichen Stelle wie der Quellterm bendet,
und wollen einige Annahmen uber v(x) machen.
Das Problem soll im Frequenzbereich untersucht werden. Es sei u(x, ω; xs ) die
kausale Fourier-Transformation von U (x, t; xs ) bezuglich der Zeit t :
∞
Z
U (x, t; xs ) eiωt dt.
u(x, ω; xs ) =
0
Diese Transformation kann wie folgt invertiert werden:
1
U (x, t; xs ) =
2π
Z
∞
u(x, ω; xs ) e−iωt dω.
−∞
Aufgrund der Abbildungseigenschaften der Fourier-Transformation ergibt sich aus
der Wellengleichung fur U (x, t; xs ) die Helmholtz-Gleichung fur u(x, ω; xs ) :
d2 u
ω2
+
u = −δ(x − xs ),
dx2 v 2 (x)
ω ∈ R,
x ∈ R,
diese wird auerdem mit den folgenden Ausstrahlungsbedinungen versehen:
du
iω
∓
u → 0,
dx v(x)
as x → ±∞.
Weitere Annahmen:
Wir setzen voraus, das v(x) auf (−∞, xs ) bekannt ist. (Bei der Rekonstruktion von
Bodenprolen interessieren naturlich nur positive Tiefen). Weiterhin sei v(x) nahe"
zu\ eine Konstante c auf (xs , ∞). Wie formulieren diese Eigenschaft als
1
v 2 (x)
=
1
(1 + α(x)),
c2
wobei α(x) als klein im Vergleich zu v(x). Das bedeutet, dass die Rekonstruktion von
der Ausbreitungsgeschwindigkeit v(x) aus den Streudaten u(xs , ω; xs ) linearisiert
3. INVERSE STREUTHEORIE
13
wird. Die Linearisierung nimmt vereinfacht eine ortsunabhangige Geschwindigkeit c
an. Der Vorteil dieser Annahme besteht darin, dass das daraus resultierende Problem
einfach zu losen ist und eine explizite Losung besitzt unter der Voraussetzung, dass
α(x) klein f
ur groe |x| ist.
Es sei ui (i=incident= einfallend) die Losung des ungestorten Problems
d2 u
ω2
u = −δ(x − xs ),
+
dx2 v 2 (x)
du
iω
∓
u → 0,
dx v(x)
as x → ±∞.
Die Losung dieses Problems ist gegeben durch die Greensche Funktion der HelmholtzGleichung mit konstanten Koezienten. Sie lautet
ui (x, ω; xs ) = G(x − xs , ω) = −
c iω|x−xs |/c
e
2iω
wie man leicht nachrechnet. Die Ausstrahlungsbedingungen sind ebenfalls erfullt.

Die Losung der Helmholtz-Gleichung sei nun als Uberlagerung
der einfallenden
Welle und der gestreuten (s=scattered) Welle dargestellt:
u(x, ω; xs ) = ui (x, ω; xs ) + us (x, ω; xs ).
Aus den Gleichungen fur u und ui ergibt sich, dass us die folgende Gleichung erfullen
muss:
d2 us ω 2
ω2
+
u
=
−
α(x)(ui + us ),
s
dx2
c2
c2
sowie entsprechende Aussrahlungsbedingungen. Nach dem Superpositionsprinzip ergibt sich die Losung
us (x, ω; xs ) = ω
2
Z
∞
xs
α(y)
(us + ui )(y, ω; xs )G(x − y; ω) dy.
c2
Wir haben bisher nicht ausgenutzt, dass α(x) als klein\ vorausgesetzt wurde. Die
"
obige Approximation ist die sogenannte Born-Approximation, aus ihr konnen wir
schlieen, dass us klein von der Ordnung von α ist. Folglich ist αus klein von der
Ordnung α2 und kann deshalb vernachlassigt werden. Setzen wir die Ausdrucke fur
ui und die Greensche Funktion G ein, so ergibt sich mit ω = ck
:
2
Z ∞
ck
α(y) i k (2y−x−xs )
us x, , xs = −
e2
dy
2
4
xs
Z ∞
ck
α(y) ik(y−xs )
und damit ist us xs , , xs = −
e
dy
2
4
xs
Z
ck
α(y) iky
ikxs
⇐⇒ −e us x, , xs =
e dx.
2
4
R
Damit ist die Berechnung von α(x) wieder eine Inversion der Fourier-Transformation
und man erhalt
Z
α(x) = −eikxs
2
π
e−ikx us xs ,
R
ck
, xs
2
dk.
14
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
4. Korrekt gestellte Probleme
Es seien X und Y Banach-Raume (vollstandige normierte Raume) und sei A ein
im Allgemeinen nichtlinearer Operator von D ⊆ X nach Y. Fur jedes y ∈ Y soll das
folgende Problem gelost werden:
Man bestimme ein x so, dass A(x) = y, x ∈ D ⊆ X, y ∈ Y, ist.
fur einen linearen Operator A ∈ L(X, Y )
Man bestimme ein x so, dass A(x) = y, x ∈ D ⊆ X, y ∈ Y, ist.
Definition
(1)
(2)
1. Das Problem (1) bzw. (2) heit korrekt gestellt (gut ge-
stellt, well-posed) nach Hadamard, wenn
(1) zu jedem y ∈ Y gibt es eine Losung x ∈ D (Existenzbedinung),
(2) diese Losung x ist in D eindeutig bestimmt (Eindeutigkeitsbedinung), und
(3) stabil ist, d.h. die Losung x hangt stetig von der rechten Seite y
ab (Stabilitatsbedingung).
Ist eine der oben genannten Bedingungen nicht erfullt so heit das Probelm inkorrekt gestellt (schlecht gestellt, ill-posed).
Mathematisch sind diese drei Eigenschaften erfullt, wenn die folgenden aquivalenten
Bedingungen erfullt sind.
1. Das Problem (1) bzw. (2) ist korrekt gestellt, wenn
(1) der Operator A : D ⊆ X → Y invertierbar ist (fur jedes y ∈ A(D)
Satz
ist A−1 y ∈ D ⊆ X deniert) und
(2) der inverse Operator A−1 stetig ist bzw. im Fall des linearen
Operators A, der lineare inverse Operator A−1 beschrankt ist
(d.h., ||A−1 y||X ≤ C ||y||Y mit einer Konstanten C, die nur von
A aber nicht von y ∈ Y abh
angt).
Aus den Eigenschaften der Fourier-Transformation als Abbildung von X = L2 (Rn )
nach Y = L2 (Rn ) folgt, dass die beiden in den Abschnitten 1. und 3. genannten Probleme korrekt gestellt sind, da die Fourier-Transformation invertierbar ist und die
inverse Fourier-Transformation ein beschrankter Operator ist.
Wir wollen auf die Stabilitat der Fourier-Transformation eingehen. Stabilitat bedeutet insbesondere Stabilitat bezuglich gestorter Daten. Dazu nehmen wir an, dass
4. KORREKT GESTELLTE PROBLEME
15
die gemessenen Daten gestort sind,
d(~x) = f (~x) + N (~x)
ˆ ~k) = fˆ(~k) + N̂ (~k),
bzw. d(
wobei bekannt sei, dass δ = ||N̂ || relativ klein (bezogen auf die wahren Werte fˆ(~k))
sind. Dann ist der Fehler in der Rekonstruktion der Daten ebenfalls von der Ordnung
von δ in der X = L2 (Rn Norm. Denn es gilt
−1
−1 ˆ
−1 ˆ
f || = ||F~k→~
(dˆ − fˆ)|| = (2π)−n/2 ||N̂ || = (2π)−n/2 δ.
d − F~k→~
||d − f || = ||F~k→~
x
x
x
Mit anderen Worten, die Messfehler sind in der Rekonstruktion immer noch vorhanden, aber sie verfalschen die wahren Werte nicht zu stark.
Bezogen auf das allgemeine Problem (2) bedeutet es, dass der Fehler zwischen
zwei Losungen x1 und x2 , die zu den Daten y1 und y2 gehoren, gilt
||x1 − x2 ||X ≤ C ||y1 − y2 ||Y .
Es sei darauf hingewiesen, dass die Wahl der Raume X bzw. Y sowie der entsprechenden Normen von Bedeutung ist, da die Denition und Beschrankheit des inversen
Operators A−1 davon abhangt.
4.1. Korrektheit linearer Probleme in Banachräumen.
neares Problem (2) korrekt gestellt? Es sei
Wann ist ein li-
N (A) = {x ∈ X : Ax = 0}
der Kern oder auch Nullraum des Operators A. Der Kern bzw. Nullraum ist stets
ein abgeschlossener Teilraum von X. Weiterhin bezeichnen wir mit
R(A) = {y ∈ Y : y = Ax, x ∈ X}
den Bildraum des Operators A. Der Bildraum ist ein Teilraum aber nicht notwendigerweise ein abgeschlossener Teilraum von Y.
Interessanterweise ist die Stabilitatsbedingung der Korrekheitsdenition immer erfullt, wenn sowohl die Existenz- als auch die Eindeutigkeitsbedinung
erfullt sind.
Diesen Zusammenhang stellt der Satz uber die oene Abbildung her:
Satz
2. Es sei A ∈ L(X, Y ) ein surjektiver beschrankter linearer Operator.
Dann ist fur jede oene Teilmenge T von X auch die Bildmenge AT
y = Ax, x ∈ T } eine oene Teilmenge von Y.
= {y ∈ Y :
Da der Operator genau dann stetig ist, wenn die Urbilder oener Mengen wieder
oene Mengen sind, ergibt sich hieraus:
Folgerung
1. Ist A ∈ L(X, Y ) ein surjektiver beschrankter linearer Ope-
rator und auerdem noch injektiv, dann besitzt
inversen Operator A−1 ∈ L(Y, X).
A
einen beschrankten linearen
16
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Ist nun der lineare Operator A injektiv und besitze ein abgeschlossenes Bild, d.h.
R(A) = R(A). Als abgeschlossener Teilraum von Y ist der Bildraum Ỹ := R(A) selbst
wieder ein Banach-Raum mit der von Y induzierten Norm. Somit ist der Operator
à : L(X, Ỹ ) mit Ãx := Ax f
ur alle x ∈ X surjektiv und existiert der stetige inverse
−1
Operator à ∈ (Ỹ , X). Folglich ist die Stabilitatsbedingung erfullt und es gilt
Satz
3. Der Operator A in der linearen Operatorgleichung (2) sei injek-
tiv und habe einen abgeschlossenen Bildraum, dann ist die Stabilitatsbedingung der Korrektheitsdenition nach Hadamard erfullt.
Da Y als Banachraum abgeschlossen ist, folgt aus der Existenzbedingung (fur alle
y ∈ Y !) die Abgeschlossenheit des Bildraums.
Folgerung
2. Erfullt die lineare Operatorgleichung (2) sowohl die Exi-
stenz als auch die Eindeutigkeitsbedingung, so genugt sie auch der Stabilitatsbedingung, d.h. das Problem ist korrekt gestellt.
Ist dagegen der Bildraum nicht abgeschlossen, d.h. es gilt
R(A) 6= R(A),
dann ist der inverse Operator A−1 : R(A) ⊂ Y → X nicht beschrankt, somit nicht
stetig und die Stabilitatsbedingung verletzt. Ware namlich die Stabiltatsbedingung
erfullt, so musste fur eine Folge
yn → y0 6∈ R(A) in Y f
ur n → ∞ mit yn = Axn ∈ R(A)
die Abschatzung
||xn − xm ||X ≤ C||yn − ym ||Y
gelten. Da {yn } als konvergente Folge eine Cauchy-Folge ist, ergibt sich aus obiger
Abschatzung, dass auch {xn } eine Cauchy-Folge ist. Dann gibt es aber im Banachraum X ein Grenzelement x0 = lim xn , fur das wegen der Stetigkeit von A gilt
n→∞
lim Axn = Ax0 = y0 . Dies widerspricht aber der Annahme y0 6∈ R(A).
n→∞
Satz
4. Ist der Operator A der linearen Operatorgleichung (2) injektiv,
besitzt aber keinen abgeschlossenen Bildraum, dann ist die Stabilitatsbedingung der Hadamardschen Korrektheitsdenition nicht erfullt und
das Problem deshalb inkorrekt gestellt.

5. SOBOLEV-RAUME
UND INKORREKT GESTELLTE PROBLEME
17
5. Sobolev-Räume und inkorrekt gestellte Probleme
5.1. Seil unter Eigenlast. Man stelle sich ein Seil vor, dass aus verschiedenen
Materialen besteht, so dass seine Dichte eine veranderliche Groe ist. Dabei sei die
Spannung T des Seils konstant und die vertikale Auslenkung klein im Vergleich zur
Lange des Seils. Eine etwas ubertriebene Darstellung des Sachverhalts (wir haben
kleine vertikale Auslenkung vorausgesetzt!!) sieht wie folgt aus:
s
s
y(s)
0
1
Das inverse Problem besteht nun darin, die (Massen-)Dichte aus der Auslenkung y
des Seils zu bestimmen. Wir bezeichnen die Dichte des Seils mit x(s) und konstruieren ein Modell fur die Masse-Auslenkungs-Relation: y = Kx.
s
t
s
0
y(s)
y(t)
φ
T
1
T
δ
F
Dazu betrachten den Einuss einer in t konzentrierten Kraft F. Aufgrund des Kraftegleichgewichts gilt:
T sin ϕ + T sin δ = F.
Da die Auslenkungen als Klein vorausgesetzt wurden, ist sin δ ≈ tan δ und analog
sin ϕ ≈ tan ϕ woraus sich
F
y(t)
y(t)
= sin δ + sin ϕ = tan δ + tan ϕ =
+
T
t
1−t
und damit
y(t) =
F
t(1 − t).
T

Ist nun s < t, dann folgt aus der Ahnlichkeit
der Dreiecke
y(s)
y(t)
F
=
= (1 − t)
s
t
T
18
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
bzw.
y(s) =
F
s(1 − t).
T
Analog ergibt sich
y(s) =
F
t(1 − s) f
ur
T
s > t.
D.h. unser Modell lautet nun
(
y(s) = F k(s, t) mit
k(s, t) =
1
t(1 − s),
T
1
s(1 − t),
T
0 ≤ t ≤ s,
s ≤ t ≤ 1.
Betrachten wir nun eine stetige Kraftverteilung erzeugt durch eine Dichtefunktion
x = x(t), so ergibt sich der Einuss innitesimal kleiner Krafte auf die Auslenkung
y(s) zu
n
X
y(s) = lim
n→∞
k(s, ti )x(ti )∆ti
i=1
und nach Grenzubergang die Fredholmsche Integralgleichung
Z
y(s) =
1
k(s, t) x(t) dt.
0
Oensichtlich erfullt y(s) =
k(s, t) x(t) dt das Randwertproblem
R1
0
y 00 (s) +
1
x(s) = 0,
T
y(0) = y(1) = 0,
erfullt, da
1
y (s) =
T
0
Z
s(1 − s)x(s) +
0
s
1
−tx(t) dt − s(1 − s)x(s) +
(1 − t)x(t) dt
s
Z s
Z 1
1
=
−tx(t) dt +
(1 − t)x(t) dt
T
0
s
Z
und
y 00 (s) =
1
1
(−sx(s) − (1 − s)x(s)) = − x(s).
T
T
Auerdem ist y(0) = y(1) = 0. Wie man am folgenden Plot sieht bzw. auch schnell
nachrechnet ist
yε = ε(s − 1) sin
s
ε
klein fur ε 1. Dargestellt ist die Funktion fur Werte
ε = 0, 001; 0, 0025; 0, 004; 0, 0055; 0, 007; 0, 0085; 0, 01. und die Funktionswerte sind
betragsmaig kleiner als 0,01.

5. SOBOLEV-RAUME
UND INKORREKT GESTELLTE PROBLEME
19
Diese kleinen Werte fur die Auslenkung y erzeugen aber groe Werte fur die Dichte
x, denn
1
s s−1
s
x(s) = −y 00 (s) = −2 cos +
sin .
T
ε
ε
ε
Fur ε = 0, 055 erhalt man folgenden Funktionsverlauf:
und dann fur ε = 0, 02 :
Der Term (s−1)
erzeugt oensichtlich beliebig groe Werte wenn ε → 0. Genauer fur
ε
π
1
s = ε 2 ist T x(s) = π2 − 1ε → ∞ f
ur ε → 0. Folglich ist das inverse Problem der Rekonstruktion der Dichte x(s) aus den Daten y(s) beschrieben durch die Fredholmsche
Integralgleichung 1. Art nicht korrekt bzw. inkorrekt gestellt.
Warum ist dem so?
Zur Erinnerung sei deniert:
20
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Definition
2. Ein linearer Operator A ∈ L(X, Y ), der zwischen den Banach-
Raumen X und Y wirkt, heit vollstetig, wenn er jede in X beschrankte Teilmenge T ⊂ X in eine relativ kompakte Teilmenge AT = {y ∈ Y : y = Ax, x ∈ T }
uberfuhrt.
Fur vollstetige Operatoren und der Fredholmsche Integraloperator mit stetigem
Kern ist vollstetig in Raumen stetiger Funktionen, gilt:
Satz
5. Es sei A ∈ L(X, Y ) ein injektiver und vollstetiger linearer
Operator, der zwischen den unendlich dimensionalen Banach-Raumen X und Y wirkt. Dann ist der unendlichdimensionale Bildraum R(A)
des Operators A nicht abgeschlossen und der zu A inverse Operator
A−1 : R(A) ⊂ Y → X unbeschr
ankt.
Ware namlich fur einen injektiven und vollstetigen linearen Operator A ∈ L(X, Y )
mit dim (X) = ∞ die Beziehung R(A) = R(A) oder damit gleichbedeutend der
inverse Operator A−1 : R(A) ⊆ Y → X beschrankt, so ware
||A−1 y||X ≤ C ||y||Y
bzw. ||x||X ≤ C ||Ax||Y .
(3)
Da es aber in jedem unendlich dimensionalen Banachraum immer eine beschrankte
Teilmenge gibt, die nicht relativ kompakt ist, was bedeutet, dass eine unendliche
Folge {xn } ⊂ T gibt, die keine konvergente Teilfolge und damit naturlich auch keine
Cauchy-Folge als Teilfolge besitzt. Jedoch ist wegen der Vollstetigkeit von A die
Bildmenge AT relativ kompakt und die Folge {Axn } ⊂ AT besitzt eine konvergente
Teilfolge, die dann auch Cauchy-Folge ist. Dies widerspricht aber (3) und ist somit
ausgeschlossen.
Folgerung
3. Es sei X ein unendlich dimensionaler Banachraum und
ein injektiver und vollstetiger Operator. Dann ist die Stabilitatsbedingung nicht erfullt und das lineare inverse Problem inkorrekt
nach Hadamard.
A ∈ L(X, Y )
Zur Erinnerung:
Satz
6. Der lineare Fredholmsche Integraloperator A : C[a, b] → C[c, d]
Z
(Ax)(s) :=
b
k(s, t) x(t) dt
a
c ≤ s ≤ d,

5. SOBOLEV-RAUME
UND INKORREKT GESTELLTE PROBLEME
21
mit stetigem Kern k ∈ C([c, d] × [a, b]) ist ein vollstetiger Operator. Ebenso ist
dieser Operator mit quadratisch integrierbarem Kern k ∈ L2 ((c, d) × (a, b)) als
Abbildung A : L2 (a, b) → L2 (c, d) ein vollstetiger Operator.
Bemerkung
2. Die lineare Fredholmsche Integralgleichung 2. Art
Z
b
k(s, t) x(t) dt = y(s),
x(s) +
c ≤ s ≤ d,
a
als Operatorgleichung der Form
x ∈ X, y ∈ Y,
x + Ax = y,
mit A ∈ L(X, Y ) und vollstetig mit
korrekt nach Hadamard.
||A||L(X,Y ) ≤ 1
ist in diesen Raumen stets
5.2. Exponentielles Wachstum. Eines der einfachsten Anfangswertprobleme
fur gewohnliche Dierentialgleichungen beschriebt ein ungebremstes Wachstum =
exponentielles Wachstum:
du
= r(t) u
dt
mit der Anfangsbedingung u(0) = u0 > 0.
Dabei wird der Wachstumsprozess durch den veranderlichen Parameter r(t) gesteuert. Wir wollen nun zeigen, dass die Bestimmung des Parameters r(t) ein im Allgemeinen inkorrekt gestelltes Problem ist. Dazu berechnen wir zunachst die Losung des
AWP und daraus den funktionalen Zusammenhang von r(t) und u(t). Die Losung
des AWP ist
Rt
u(t) = u0 e
0
r(s) ds
Dies ist oensichtlich ein nichtlinearer Zusammenhang. Wir berechnen r(t) aus u(t);
es ist
t
Z
ln u(t) = ln u0 +
r(s) ds
und damit r(t) = (ln u(t))0 .
0
Zur Untersuchung der Stabilitat des inversen Problems betrachten wir die gestorten
Daten:
ε sin(
uε (t) = u(t) e
t
ε2
)
bzw. ln uε (t) = ln u(t) + ε sin
t
ε2
Hier sind Werte fur die Storung eε sin( ε2 ) fur ε = 0, 01; 0, 025; 0, 04; 0, 055; 0, 07; 0, 085; 0, 1
dargestellt. Man sieht gut wie die Konstante Funktion 1 immer besser approximiert
wird.
t
22
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Dagegen wird der Fehler fur r(t) durch
ε sin
t
ε2
0
1
= cos
ε
t
ε2
sehr gro. Dass wird durch den Plot fur ε = 0, 05; 0, 1 veranschaulicht:
Ein derartiges Verhalten ist fur Parameteridentikationsprobleme typisch!
5.3. Korrektheit inverser Probleme auf kompakten Mengen. Der die Ope-
ratorgleichung beschreibende Operator sei linear oder auch nichtlinear. Wir betrachten das inverse Problem zu
F (x) = y, x ∈ D ⊆ X, y ∈ Y
mit dem nichtlinearen Operator F.
(4)
An sich inkorrekte inverse Probleme werden korrekt, wenn die zulassigen Losungen
dieses Problems auf eine kompakte Menge eingeschrankt werden. Das ist die Aussage
des Satz von Tichonov. Diese Vorgehensweise wird auch als deskriptive Regularisierung bezeichnet.
Satz
7. (Satz von Tichonov) Es sei F : D ⊂ X → Y ein stetiger injekti-
ver Operator, der aus dem Banach-Raum X in den Banach-Raum Y abbildet und dessen Denitionsbereich D eine kompakte Teilmenge von X
darstellt. Dann ist auch der inverse Operator F −1 : F (D) ⊂ Y → D ⊂ X
stetig.

5. SOBOLEV-RAUME
UND INKORREKT GESTELLTE PROBLEME
23
Es sei y0 ein beliebiger Punkt mit y0 = F (x0 ), x0 ∈ D und {xn } ⊂ D sei eine Folge
mit ||yn − y0 || = ||F (xn ) − F (x0 )||Y → 0 fur n → ∞.
Da D als kompakte Menge in X sowohl relativ kompakt als auch abgeschlossen ist,
existiert eine in X konvergente Teilfolge {xnk } mit lim x̃ ∈ D. Wegen der Stetigkeit
k→∞
des Operators F gilt dann auch lim F (xnk ) = F (x̃) = F (x0 ) in Y. Da F ein injektiver
k→∞
Operator ist folgt x̃ = x0 und damit ||xnk − x0 ||X → 0 fur k → ∞.

Aus den bisherigen Uberlegungen
folgt aber mehr noch ||xn − x0 ||X → 0 fur n → ∞,
also die Folge {xn } konvergiert gegen x0 . Ware dem namlich nicht so, so musste
es fur eine genugend kleine Zahl ε > 0 eine unendliche Teilfolge {xnl } geben mit
||xnl − x0 ||X > ε f
ur alle l = 1, 2, . . . . Diese musste nun aber wegen der Injektivitat
von F und der Kompaktheit von D eine gegen x0 konvergente Teilfolge besitzen, was
oensichtlich ein Widerspruch ist.
Folgerung
4. Es sei nichtlineare Operator F : D ⊂ X → Y in der Operator-
gleichung (4) sei ein stetiger injektiver Operator, der aus dem Banach-Raum X
in den Banach-Raum Y abbildet und dessen Denitionsbereich D eine kompakte
Teilmenge von X darstellt. Dann ist die Stabilitatsbedingung der Korrekteitsdenition nach Hadamard erfullt.

Schlielich gilt aufgrund obiger Uberlegungen
auch:
Satz
8. Besitzt die Operatorgleichung (4) zu einer speziellen rechten Seite
eine eindeutig bestimmte Losung x0 ∈ D, wobei der Operator F stetig und
der Denitionsbereich D kompakt ist, so gilt die Implikation
F (xn ) → F (x0 ) in Y, xn ∈ D ⇒ xn → x0 in X.
y0
In diesem Satz wurde die Forderung nach der Injektivitat von F durch die wesentlich schwachere Eigenschaft der eindeutigen Losbarkeit von (4) fur eine spezielle
rechte Seite y0 abgeschwacht.
5.4. Sobolev-Räume und kompakte Einbettungen.
Definition
3. Fur m ∈ N0 und 1 ≤ p ≤ ∞ besteht der Raum H m,p (Ω) aus allen
Funktionen u ∈ Lp (Ω), die m-mal schwach dierenzierbar sind mit Ableitungen
im Raum Lp (Ω). Die Raume H m,p werden mit den Sobolev-Normen
1/p

||u||m,p,Ω = 
X
||Dα u||pp,Ω 
,
1 ≤ p < ∞,
|α|≤m
||u||m,∞,Ω = max ||Dα u||∞ ,
|α|≤m
versehen.
Der Raum
H
m,p
(Ω).
H0m,p (Ω)
bezeichnet die Abschlieung von
C0∞ (Ω)
in der Norm von
24
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
9. H m,p (Ω) ist ein Banach-Raum fur alle m ∈ N0 und 1 ≤ p ≤ ∞.
Satz
Hm, 2(Ω)
ist ein Hilbert-Raum mit dem inneren Produkt
X Z
hu, vim =
0≤α≤m
Dα u Dα v dx.
Ω
Die fur uns interessante Frage ist, welche Raume haben welche kompakten Teilraume.
Aussagen dazu machen der Satz von Rellich-Kondrachov und der Satz von Morrey.
Satz
10. (Satz von Rellich-Kondrachov) Es sei Ω ein Lipschitz-Gebiet. Dann
np
ist die Einbettung H 1,p (Ω) ,→ Lq (Ω) kompakt fur q < (n−p)
. F
ur
gleiche Einbettung kompakt ohne eine Voraussetztung an ∂Ω.
Beispiel
H01,p (Ω)
ist die
1. Fur n = 1 ist die obige Aussage sinnlos, da 1−p > 0 nur fur p < 1
erfullt ist. Fur n = 2 erhalt man, dass die Einbettung H 1,p (Ω) ,→ L2 (Ω) kompakt
ist wenn 1 < p < 2 ist, analog gilt fur n = 3 H 1,p (Ω) ,→ L2 (Ω) ist kompakt fur
6
5
< p < 3.
Satz
11. (Satz von Morrey) Es sei Ω ein Lipschitz-Gebiet und m ∈ N. Dann
ist die Einbettung H m,p (Ω) ,→ C m−1,α (Ω) kompakt fur α < 1 − n/p.
Beweis siehe Dobrowolski: Angewandte Funktionalanalysis .
Bemerkung
3. Man beachte, dass die Einschrankung auf kompakte Teil-
mengen das mathematische Modell verandert. Eine Losung in einem SobolevRaum hat andere Eigenschaften als eine Losung im Raum stetig dierenzierbarer Funktionen. Auerdem verandern sich die Normen= Abstandsbegri! Das
wirkt sich auch auf die Stabilitat in der Weise aus, dass "geringe Abweichung\
im Sinne einer Norm in Raumen stetig dierenzierbarer Funktionen etwas anderes beutet als "geringe Abweichung\ im Sinne einer Lp (Ω)-Norm.
Auch muss die Frage nach der Existenz einer Losung bei der Einschrankung
auf eine kompakte Teilmenge berucksichtigt werden.
Definition
4. Fur nicht ganzzahliges s = m + σ > 0, 0 < σ < 1 und 1 ≤ p < ∞
besteht der Raum H s,p (Ω) aus den Funktionen u ∈ H m,p (Ω) mit endlicher Norm
||u||s,p,Ω . Dabei ist
|u|pσ,p,Ω
|u(x) − u(y)|p
dx dy,
n+σp
Ω Ω |x − y|
X
= ||u||m,p,Ω +
|Dα u|pσ,p,Ω .
Z Z
=
||u||s,p,Ω
|α|=m
Satz
12. Fur den Raum H s,2 (Rn ), s ≥ 0, sind die Normen ||u||s,2,Rn und
||u||∗s,2,Rn
Z
2
2 s
|û(ξ)| (1 + |ξ| ) dξ
:=
Rn
1/2

5. SOBOLEV-RAUME
UND INKORREKT GESTELLTE PROBLEME
25
aquivalent. Dabei ist
Z
û(ξ) :=
die Fouriertransformierte von u.
u(x) e−ix·ξ dx
Rn
Beweis siehe Wloka: Partielle Dierentialgleichungen.
Wir wollen diese Hilbert-Raume nutzen um ein besseres Verstandnis fur inkorrekt
gestellte Problem zu gewinnen. Dazu betrachten wir die inhomogene gewohnliche
Dierentialgleichung:
−u00 + u = f,
x ∈ R.
Gilt u, f ∈ L2 (R), dann konnen wir die Fouriertransformation zum Losen der GDGL
nutzen:
ω 2 û + û = (1 + ω 2 )û = fˆ ⇐⇒ û =
Damit ist
u=F
−1
1
fˆ.
(1 + ω 2 )
1
1
−1
−1
ˆ
f =F
∗F
fˆ
(1 + ω 2 )
(1 + ω 2 )
Wie man leicht nachrechnet, ist
F
−1
1
(1 + ω 2 )
1 −|x|
e
2
=
und damit ist
1
u(x) =
2
Z
e−|y−x| f (y) dy = (g ∗ f )(x) mit
R
1
g(x) = e−|x| .
2
Da f ∈ L2 (R) ergibt sich, dass u nicht nur in L2 (R) sondern wegen û = (1 + ω 2 )fˆ,
sogar in H 2,2 (R) liegt. Wir denieren den Operator A wie folgt
2
2
A : L (R) → L (R
1
mit Af :=
2
Z
e−|y−x| f (y) dy = u(x).
R
Dann ist der Operator A nicht invertierbar, da der inverse Operator formal durch
A−1 u = −u00 +u geben ist. Jedoch ist f
ur u ∈ L2 (R) der Ausdruck −u00 keine Funktion
aus L2 (R) sondern eine Distribution in H −2,2 (R). Folglich ist das inverse Problem
inkorrekt gestellt.
Oensichtlich liegt das daran, dass die Raume \nicht passen\. Also passen wir die
Raume an und betrachten folgendes Problem:
à : L2 (R → H 2 (R),
f 7→ Ãf = g ∗ f = u.

Durch die Anderung
der Raume ist der Operator à oensichtlich invertierbar mit
−1
00
à = −u + u und der inverse Operator ist stetig. Dieses Problem ist somit korrekt
gestellt.
26
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Bemerkung
4. Warum muss man sich trotzdem mit inkorrekt gestellten Pro-
blem befassen?
Das liegt daran, dass Daten i. Allg. nur gestort vorliegen. Das ist kein Problem, wenn die Abweichung klein in der H 2 -Norm ist. Leider ist aber die H 2 Norm starker als die L2 -Norm, da die H 2 -Norm auch Abweichungen in der
Ableitung mit berucksichtigt, wogegen die L2 -Norm nur die Abweichung in den
Daten selbst berucksichtigt. Ist die Abweichung aber nur in der L2 -Norm klein,
so verstarkt der unbeschrankte inverse Operator Ã−1 die Abweichung beliebig
stark!
Beispiel
2. Ein typisches Beispiel hierfur ist der Operator
h 2
i
−1
−k
e
F
f
(x).
Bf (x) = F~k→~
~
~
x→k
x
Oensichtlich bildet B den L2 (Rn ) auf sich selbst ab. Allerdings werden hohe
Frequenzen durch e−k exponentiell geglattet, dass ist schneller als jede Integration (m Integrationen glatten hohe Frequenzen mit |k|−m ).
Das heit nicht, dass B nie invertierbar ist. Fur hinreichend glatte Funktionen
g(x) (z.B. wenn der Tr
ager von ĝ(~k) kompakt ist), ist der inverse Operator
2
h 2
i
−1
k
B −1 g(x) = F~k→~
e
F
f
(x).
~
~
x→k
x
Fur hinreichend glatte Funktionen gilt damit BB −1 = B −1 B = I. Sind die Daten
auch nur ein bisschen gestort, so wird dieser Fehler mit ek im Fourier-Bild
aufgebauscht! Das hat ganz erhebliche Auswirkungen auf die Rekonstruktion.
2
6. Computertomographie und Radon-Transformation
Dabei werden die Untersuchungsobjekte mit Hilfe von nicht strahlenden Quellen
wie z.B. Rontgen- oder auch Elektronenstrahlen dargestellt. Rontgenstrahlen bestehen aus Photonen mit hinreichend groer Energie, so dass sie sich entlang gerade
Linien bewegen bis sie auf einen Gegenstand treen und absorbiert werden.
6.1. Das 2D-Problem. Es bezeichne ~x ∈ R2 die ortliche Position und θ~ die
~ die Dichte der Rontgenstrahlen an der StelRichtung. Wir bezeichnen mit u(~x, θ)
~ Weiterhin sei a(~x) der lineare Dampfungskoezient. Die
le ~x und der Richtung θ.
~ die folgende DieGeschwindigkeit wird auf 1 normiert, so dass die Dichte u(~x, θ)
rentialgleichung erfullt:
~ + a(~x) u(~x, θ)
~ = 0,
θ~ · ∇~x u(~x, θ)
~x ∈ Ω, θ~ ∈ S 1 .
(5)
Dabei sei der zu untersuchende Bereich Ω als konvex vorausgesetzt (im Bild nicht
erfullt!). Wir identizieren die Einheitsrichtungen θ~ (dafur schreibt man θ~ ∈ S 1 ) mit
dem Winkel θ, d.h. θ~ = (cos θ, sin θ)T . Der Advektionsoperator ist dann
∂
∂
θ~ · ∇~x = cos θ
+ sin θ
∂x
∂y
6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION
27
~ modelliert
und modelliert die freie Konvektion der Rontgenstrahlen und a(~x) u(~x, θ)
die Anzahl der absorbierten Photonen pro Langeneinheit an der Stelle ~x.
Die Photonen werden am Rand des Gebiets Gebietes emmitiert und die Photonendichte hat die Form
(6)
~ = δ(~x − ~x0 )δ(θ~ − θ~0 ),
u(~x, θ)
mit ~x0 ∈ ∂Ω und θ~0 zeigt in das Gebiet hinein (die Rontgenstrahlen werden in das
Gebiet hingeschickt).
x0 + s θ0
∂Ω
Ω
x
θ
θ
θ0
x0
n( x0 )
Das Randwertproblem (5),(6), das in geeigneten Koordinaten eine gewohnliche Differentialgleichung 1. Ordnung darstellt, besitzt die Losung
Z s
~
~
~
u(~x0 + sθ0 , θ0 ) = exp −
a(~x0 + tθ0 ) dt ,
s > 0, ~x0 + tθ~0 ∈ Ω,
0
an allen anderen Stellen.
u(~x0 , θ~0 ) = 0
Die Intensitaten werden nun wiederum am Rand gemessen, d.h. wenn die Strahlung in
~x0 emmitiert wurde dann wird nach einer gewissen Zeit τ = τ (~x0 , θ~0 ) in ~x1 = ~x0 + τ θ~0
ankommen. Logaritmiert man nun die Messergebnisse, so verfugt man uber die Daten
Z
τ (~
x0 , θ~0 )
a(~x0 + tθ~0 ) dt.
0
Das sind Integrale uber den Dampfungskoezienten a entlang des Geradenstucks
(~x0 , ~x1 ). Lasst man nun den Punkt ~x0 und die Richtung ~x0 variieren so erhalt man
alle Integrale von a(~x) uber die Segmente bzw. da a(~x) durch Null auerhalb von Ω
fortgesetzt werden kann, uber alle Geraden, die durch Ω verlaufen. Das entstehende
28
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Problem lautet also:
Wie kann man die Funktion a(~x) aus den Integralen über a entlang aller
Geraden im R2 rekonstruieren. F
ur die praktische Anwendung stehen nur endlich
viele Geraden zur Verfugung. Wie man damit umgeht und wie man die Geraden
sinnvoll auswahlt, soll hier nicht diskutiert werden obwohl das fur die praktische
Anwendung wesentlich ist.
6.2. Die Radon-Transformation im R2 . Zunachst wollen wir das Problem
mathematisch sinnvoll beschreiben. Dazu sei O = (0, 0) Ursprung (cos θ, sin θ) = θ~ ∈
S 1 eine beliebige Einheitsrichtung und s ∈ R gebe den vorzeichenbehafteten Abstand
der Geraden zum Ursprung. Dann gehoren alle Punkte ~x ∈ R2 mit
~x · θ~⊥ = s,
~ zur Geraden in Richtung
mit θ~⊥ = (− sin θ, cos θ) der um 90o gedrehten Richtung θ,
θ~ mit dem Abstand s zum Ursprung:
g
θ
θ┴
O
Wir denieren fur glatte Funktionen f (~x) in R2 die Radon-Transformation Rf (s, θ)
fur (s, θ) ∈ Z = R × (0, 2π) als
Z
Rf (s, θ) =
R
~⊥
~ dt =
f (sθ + tθ)
Z
f (~x)δ(s − ~x · θ~⊥ ) d~x.
R2

Wie man sich leicht uberzeugt ist der Zylinder Z eine doppelte Uberdeckung
des
2
Raums aller Geraden des R , da
{~x · θ~⊥ = s} = {~x · (−θ~⊥ ) = −s}.
Hieraus folgt insbesondere
Rf (s, θ) = Rf (−s, θ + π).
Es sei
Rθ f (s) = Rf (s, θ).
Dann gilt
6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION
Satz
29
13 (Fourier-Scheiben-Satz) Fourier-Slice Theorem. Es sei f (~x) ∈
.
∞
2
C0 (R ).
Dann gilt fur alle θ~ ∈ S 1
d
ˆ ~⊥
[Fs→σ Rθ f ] (σ) = R
θ f (σ) = f (σ θ ),
σ ∈ R.
Beweis:
Z
−isσ
d
R
θ f (σ) =
Z
e
R
f (~x)δ(s − ~x · θ~⊥ ) d~x ds =
R2
Z
~⊥ σ
e−i~x·θ
f (~x) d~x = fˆ(σ θ~⊥ ).
R2
#
Auf diese Weise haben wir sogar eine Inversions- bzw. Rekonstruktionsformel gewonnen. Man muss nur Rθ f in der Variablen s Fourier-transformieren, um die Fouriertransformierte fˆ(σ θ~⊥ ) zu erhalten. Fur alle Richtungen θ~⊥ erhalt man dann die
Fourier-Transformierte fˆ(~k), ~k ∈ R2 und Rekonstruktion erfolgt nun uber die Inversion der Fouriertransformierten.
Lemma
1. Es sei f (~x) ∈ C0∞ (R2 ). Dann gilt
Rθ
∂f
d
(s) = θi⊥ (Rθ f )(s).
∂xi
ds
Diese Formel ist aquivalent zur Formel uber das Verhalten der Fouriertransformierten unter Ableitungen.
Beweis:
Rθ
Z
Z
∂f
∂f
⊥
⊥
~
(~x) δ(s − ~x · θ ) d~x = θi
(s) =
f (~x)δ 0 (s − ~x · θ~⊥ ) d~x
∂xi
∂x
2
2
j
R
R
Z
∂
d
f (~x)δ(s − ~x · θ~⊥ ) d~x = θi⊥ (Rθ f )(s).
= θi⊥
∂s R2
ds
#
Wir betrachten nun die Abbildungseigenschaften der Radon-Transformation. Dazu
sei χ(~x) ∈ C0∞ (R2 ) eine beliebig oft dierenzierbare Funktion mit kompaktem Trager.
Weiterhin sei g(s, θ) ∈ H s (Z), falls
||g||2H s (Z)
Z
Z
=
0
Dann gilt
2π
R
(1 + σ 2 )s |Fs→σ g(σ)|2 dσ dθ < ∞.
30
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Satz
14. Es sei f (~x) eine Funktion in H s (R2 ) fur s ∈ R+0 . Dann gelten
die folgenden Abschatzungen:
√
2 ||f ||H s (R2 ) ≤ ||Rf ||H s+1/2 (Z) ,
||R(χ f )||H s+1/2 (Z) ≤ Cχ ||χ f ||H s (R2 ) .
Die Konstante Cχ hangt von der Funktion
der Groe ihres Tragers ab.
χ(~x)
und insbesondere von
5. Die Aussage ist auch richtig fur Distributionen aus H s (R2 )
Bemerkung
fur s ≤ 0. Wobei die Norm dieser Raume ebenfalls uber die Fouriertransformation deniert wird.
\
~⊥
Beweis: Aus dem Fourier-Scheiben-Satz ergibt sich R
θ (w) = ŵ(σ θ ), was bedeu-
tet, dass
Z Z
2
\
2 s+1/2
|ŵ(σ θ~⊥ )|2 (1 + σ 2 )s+1/2 dσ dθ
dσ dθ =
Rθ (w)(σ, θ) (1 + σ )
Z
Z
(1 + |~k|2 )s+1/2 ~
|ŵ(~k)|2
dk,
|~k|
R2
Z
=2
wobei die Koordinatentransformation von Polar- zu kartesischen Koordinaten mit
d~k = σ dσ dθ ausgef
uhrt wurde und der Symmetrieeigenschaft fˆ(σ θ~⊥ ) = fˆ((−σ)(−θ~⊥ )).
Die erste Ungleichung folgt nun wegen |~k|1 ≥ √ 1 ~ 2 mit w(~x) = f (~x). Die zweite Be1+|k|
ziehung ist etwas komplizierter zu beweisen. Wir spalten das Integral auf in eine
Integration uber den Bereich
|~k| > 1 und eine Integration u
ber den Einheitskreis
q
√
|~k| < 1. F
ur |~k| > 1 ist 1 + |~k|2 ≤ 2|~k| und damit
√ Z
I1 ≤ 2 2
R2
√
|χcf (~k)|2 (1 + |~k|2 )s d~k ≤ 2 2 ||χ f ||2H s .
Wegen |~k| < 1 ist
Z 2π Z 1 2
~ 2 s+1/2
c
2 (1 + |k| )
c
~
~
2
|χ f (k)|
dk =
χ f (σ, θ~⊥ ) (1 + σ 2 )s+1/2 dσ dθ
~
~
|k|
|k|<1
0
−1
Z 1
≤ ||χcf ||2L∞ (R2 )
(1 + σ 2 )s+1/2 dσ ≤ C ||χcf ||2L∞ (R2 )
Z
−1
Nun sei ψ eine auf R2 glatte beschrankte Funktion mit kompaktem Trager und ψ(~x) =
~
1 auf dem Trager von χ, so dass ψ χ f = χ f ist und auerdem sei ψ~k (~x) = e−i~x·k ψ(~x).
Mit Hilfe der Denition der Fouriertransformation, der Parsevalschen Gleichung und
6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION
31
der Cauchy-Schwarzschen-Ungleichung hf, giL2 ≤ ||f ||L2 ||g||L2 folgt
Z
Z
1
~ χcf (ξ)
~ dξ~
ϕ~k (~x)(χ f )(~x) d~x =
|χcf |(~k) = |ψ[
χ f |(~k) = ϕ
c
(
ξ)
~
(2π)2 R2 k
R2
Z
~
ϕ
c~k (ξ)
1 2 s/2 c ~
~ ≤ ||ψ~ ||H −s (R2 ) ||χ f ||H s (R2 ) .
(1
+
|ξ|
)
χ
f
(
ξ)
d
ξ
=
k
(2π)2 R2 (1 + |ξ|2 )s/2
Da ψ eine glatte beschrankte Funktion mit kompaktem Trager ist, ist dies auch ψ~k
fur alle ~k mit |~k| < 1, so dass ψ~k ∈ H −s (R2 ) fur alle s ∈ R und fur alle |~k| < 1 ist.
Damit ergibt sich die 2. Behauptung.
#
6.3. Inversionsformel für die 2D Radon-Transformation. Wir wollen nun
eine explizite Rekonstruktionsformel ableiten. Dafur werden wir zunachst einige Operatoren betrachten und anschlieend die Inversionsformel daraus aufbauen. Als erstes
betrachten wir den zur Radon-Transformation adjungierten (dualen) Operator R∗ im
Raumpaar L2 (Z) und L2 (R2 ). Der adjungierte Operator ist deniert durch
hg, Rf iZ = hR∗ g, f iR2 .
Es ist
Z
2π
hg, Rf iZ =
0
Z
=
R2
2π
Z
Z
Z
Z
g(s, θ)
g(s, θ)(Rf )(s, θ) ds dθ =
0
R
R
Z
Z 2π Z
⊥
g(s, θ)δ(s − ~x · θ ) ds dθ d~x =
f (~x)
0
δ(s − ~x · θbot ) d~x ds dθ
Z 2π
g(~x · θ⊥ , θ) dθ d~x
f (~x)
R2
R2
R
0
= hR∗ g, f iR2
und folglich
∗
Z
(R g)(~x) =
2π
g(~x · θ⊥ , θ) dθ,
~x ∈ R2 .
0
Als weiteren Operator betrachten wir die Hilbert-Transformation:
1
Hf (t) = CH
π
Z
R
f (s)
ds.
t−s
Dabei bedeutet CH , dass das Integral im Sinne des Cauchyschen Hauptwerts zu
verstehen ist, d.h.
1
Hf (t) =
lim
π ε→0+
Z
R\(t−ε, t+ε)
f (s)
ds.
t−s
Beide Operatoren sind lokal im Frequenz- bzw. Fourierbereich, in der Weise, dass
ihre Fouriertransformierten zu Multiplikationen im Frequenzbereich fuhren. Was das
konkret bedeutet zeigt das folgende Lemma:
32
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Lemma
2. Es gilt


~
~ = 2π (Fs→σ g) −|ξ|,
F~x→ξ~(R∗ g) (ξ)
~
|ξ|



⊥
⊥
~
~
ξ
~ − ξ  ,
 + (Fs→σ g) |ξ|,
~⊥ ~⊥ ξ ξ (Ft→σ Hf ) (σ) = −i sign (σ)Ft→σ f (σ).
Wir identizieren θ~ = (cos θ, sin θ) mit θ ∈ S 1 and θ ∈ (0, 2π), und analog g(θ) =
~ Setzt man nun voraus, dass g(s, θ) = g(−s, θ + π) ist, was f
g(θ).
ur das Bild der
~ = ĝ(−σ, −θ)
~
Radon-Transformation erfullt ist und was impliziert, dass ĝ(σ, θ)
gilt, so kann man kurzer schreiben:


⊥
~
∗ g(ξ)
~ − ξ  ,
~ = 4π ĝ |ξ|,
d
R
~⊥ ~
|ξ|
ξ d(σ) = −i sign (σ) fˆ(σ).
Hf
Beweis: Wir berechnen zunachst die Fouriertransformierte von R∗ g. Dabei be-
nutzen wir
Z
~x = sθ~⊥ + tθ~ und
∗ g(ξ)
~ =
d
R
Z
−i~
x·ξ~
Z
e−itτ dt = 2π δ(τ ).
−∞
2π
Z
~⊥
∞
2π
∞
Z
Z
∞
~
~~
e−isξ·~x g(s, θ) ds dθ e−itξ·θ dt
0
−∞ −∞
R2
0
!
Z 2π
Z 2π
~
ξ
~ dθ =
~
=
ĝ(ξ~ · θ~⊥ , θ) 2πδ(ξ~ · θ)
ĝ(ξ~ · θ~⊥ , θ) 2πδ |ξ|
· θ~ dθ
~
|
ξ|
0
0
!
!!
!
Z 2π
~⊥
~⊥
~
2π
ξ
−
ξ
2π
ξ
~
~
=
ĝ −|ξ|,
+ ĝ |ξ|,
,
ĝ(ξ~ · θ~⊥ , θ)δ
· θ~ dθ =
~
~
~
~
~
|ξ| 0
|ξ|
|ξ|
|ξ|
|ξ|
g(~x · θ ) dθ d~x =
e
~⊥ ⊥
ξ~
ξ
−ξ~
⊥
~
~
~
da · θ = 0 ist fur |ξ|~ = ±θ und |ξ|~
= |ξ|
~ . Ist g = Rf so gilt ĝ −|ξ|,
~ −ξ~⊥ . F
ĝ |ξ|,
ur die Hilbert-Transformation betrachten wir zunachst
~
|ξ|
ξ~
~
|ξ|
Z
∞
CH
−∞
eiωx
dx = iπ
x
fur ω > 0.
Folglich ist
Z
∞
CH
−∞
ei(−ω)x
dx = −CH
x
und oensichtlich ist
Z
∞
CH
−∞
Z
∞
−∞
1
dx = 0
x
eiωτ
dτ = −iπ
τ
ξ~⊥
~
|ξ|
=
6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION
33
und insgesamt


Z
 −iπ, σ > 0,
∞ −ixσ
\
1
e
CH
= CH
dx =
0, σ = 0, = −iπ sign (σ).

x
x
−∞
 iπ, σ < 0
Damit ergibt sich fur Hf (t) = π1 CH x1 ∗ f (x) (t) nach dem Faltungssatz
1 \
1
d
(σ)fˆ(σ) = −i sign (σ)fˆ(σ).
Hf (σ) = CH
π
x
#
Aus den obigen Berechnungen folgt insbesondere, dass
H 2 = H ◦ H = −I
gilt, wobei I der identische Operator ist.
Satz
15. Es sei f (~x) eine glatte Funktion und bezeichne g(s, θ) =
die Radon-Transformierte. Dann kann f explizit aus der
Radon-Transformierten wie folgt rekonstruiert werden:
Rf (s, θ)
1 ∗
R
f (~x) =
4π
∂
Hg(s, θ) (~x).
∂s
Dabei wird die Hilbert-Transformation auf die Variable s angewandt.
Beweis: Es sei
w(s, θ) =
Da g(−s, θ + π) = g(s, θ) ist, gilt
∂
w(−s, θ + π) =
∂(−s)
1
CH
π
∂
Hg(s, θ).
∂s
Z ∞
∂
g(t, θ)
1
g(−τ, θ)
dt =
CH
dτ
∂(−s) π
−∞ (−s) − t
−∞ −s + τ
Z ∞
∂ 1
g(−τ, θ)
=−
(−1)CH
dτ = w(s, θ).
∂s π
s−τ
−∞
Z
∞
Damit ist die Aussage des Satzes aquivalent zu
~⊥
1
~ = 1 4π ŵ |ξ|,
~ −ξ
f (~x) =
(R∗ w(s, θ))(~x) ⇐⇒ fˆ(ξ)
~
~
4π
4π |ξ|
|ξ|
!
.
(7)
Dabei bezeichnet ŵ die Fourier-Transformierte von w bezuglich der ersten Veranderlichen. Fur die Fourier-Transformierte von w bezuglich s gilt:
ŵ(σ, θ) = Fs→σ
∂
Hg(s, θ) = (iσ)Fs→σ (Hg(s, θ)) = iσ(−i)sign (σ)ĝ(σ, θ) = |σ|ĝ(σ, θ),
∂s
d.h.
ŵ(σ, θ) = |σ|ĝ(σ, θ).
34
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Aufgrund der Denition von g und dem Fourier-Scheiben-Satz gilt:
~⊥
~ −ξ
ĝ |ξ|,
~
|ξ|
!
~⊥
~ −ξ
|ξ|,
~
|ξ|
d
=R
θf

!
~⊥
~ −ξ
= fˆ |ξ|
~
|ξ|
!⊥ 
~
~ ξ
 = fˆ |ξ|
~
|ξ|
Damit ist (7) gezeigt und die Rekonstruktionsformel bewiesen.
Bemerkung
!
~
= fˆ(ξ).
#
6. Man konnte die Aussage des Satzes auch so darstellen:
I=
1 ∗ ∂
1 ∗∂
R
HR =
R H R,
4π ∂s
4π
∂s
wobei I der identische Operator ist.
Der zu Rθ : L2s (R → L~2x (R2 ), adjungierte Operator ergibt sich aus
Z
Z
Z
f (~x)δ(s − ~x · θ ) g(s) d~x ds =
(Rθ f )(s) g(s) ds =
zu
Z
~⊥
R2
R
g(~x · θ~⊥ ) f (~x) d~x,
R2
R
(Rθ∗ g)(~x) = g(~x · θ~⊥ .
Wegen
θ~⊥ · ∇(Rθ∗ g)(~x) =
2
X
2
θj⊥
j=1
und
Rθ∗
X
∂
g(~x · θ~⊥ ) =
(θj⊥ )2 g 0 (~x · θ~⊥ )
∂xj
j=1
∂
g(s, θ) = g 0 (~x · θ~⊥ ),
∂s
da s = ~x · θ~⊥ . Damit erhalten wir eine weitere Rekonstruktionsformel, namlich
0
bzw.
1
f (~x) =
4π
2π
Z
1
f (~x) =
4π
2π
Z
1
θ~⊥ · ∇Rθ∗ HRθ dθ =
4π
1
(Hg (~x · θ~⊥ , θ) dθ = 2
4π
0
0
2π
Z
Rθ∗
0
Z
2π
∂
HRθ f dθ,
∂s
d
g(s, θ)
ds
x · θ~⊥ − s
R ~
Z
0
ds dθ.
Die letzte Formel entspricht im wesentlichen Radons ursprunglicher Inversionsformel. Um J. Radons Formel zu erhalten sei
1
F~x (q) =
2π
Z
2π
(Rf )(~x · θ~⊥ + q, θ) dθ
0
der Mittelwert von Rf uber alle Geraden, die einen Abstand q ≥ 0 von ~x haben.
Dann gilt
1
f (~x) = −
π
Z
0
∞ d F (q)
x
dq ~
q
dq.
6. COMPUTERTOMOGRAPHIE UND RADON-TRANSFORMATION
35
6.4. Die Radon-Transformation im R3 und Inversionsformel. Als RadonTransformation im R3 versteht man das folgende Problem: Die Radon-Transformierte
~ im
von f ist das Integral von f (~x) uber alle moglichen Ebenen. Eine Ebene E(s, θ)
R3 ist gegeben durch ihren Normalenvektoreinheitsvektor θ~ ∈ S 2 und dem Abstand s

vom Ursprung. Oensichtlich hat man auch hier wieder eine doppelte Uberdeckung
~ = E(−s, −θ)
~ aufgrund der Ebenengleichung ~x · θ~ = s. Die
in der Weise, dass E(s, θ)
Radon-Transformation ist somit gegeben als
Z
Rf (s, θ) =
f (~x) δ(~x · θ~ − s) d~x =
Z
f dσ.
~
E(s, θ)
R3
Wie man leicht nachrechnet gilt damit vollig analog zum 2D Fall der Fourier-ScheibenSatz:
c (σ, θ)
~ = fˆ(σ θ).
~
Rf
Wie erlautern, was θ~ ∈ S 2 bedeutet: Jedes Element des R3 kann in Polarkoordinaten
dargestellt werden als
x1 = r sin θ2 sin θ1 , x2 = 2 sin θ2 cos θ1 , x3 = r cos θ2 ,
mit 0 ≤ r < ∞, 0 ≤ θ1 < 2π, 0 ≤ θ2 < π, d.h. wir identizieren θ~ √mit (θ1 , θ2 ) ∈ S 2 .
2 π
4
√ sin θ2 dθ1 dθ1 =
Das ubliche Lebesgue-Ma auf S 2 ist dθ~ = Γ(3/2)
sin
θ
dθ
dθ
=
2
1
1
3/2
2π π
2π
1
~
sin θ2 dθ2 dθ1 und d~x = r2 dr dθ.
4π
2
Eine Inversionsformel ergibt sich nun wie folgt. Es sei S2 die obere Halbsphare, d.h.
die Menge aller θ~ ∈ S 2 mit θ~ · ~ez > 0. Aus dem Fourier-Scheiben-Satz folgt mit
entsprechender Parametrisierung
1
f (~x) =
(2π)3
Z
Z
S2
2
~x 2
~ iσθ·~
fˆ(σ θ)e
σ dσ dθ~
R
Anwendung des Fourier-Scheiben-Satzes ergibt
1
=
(2π)3
Z
Z
S2
2
~x 2
c (σ θ)e
~ iσθ·~
Rf
σ dσ dθ~
R
~ = g(s, θ),
~ wobei s = ~x · θ~ ist erhalt man
und mit Rf (s, θ)
1
=
(2π)2
Z
S2
2
1
2π
Z
R
1 (−1)
σ dσ dθ~ =
2 (2π)2
~x 2
iσ θ·~
~
ĝ(σ θ)e
Z
~ dθ.
~
g 00 (θ~ · ~x, θ)
S2
Dabei haben wir benutzt, dass die Fourier-Transformierte von −f 00 gerade −(iσ)2 fˆ =
σ 2 fˆ ist. Somit lautet die Rekonstruktionsformel
1
f (~x) = − 2
8π
Z
~ θ)
~ dθ.
g 00 (~x · θ,
S2
Analog zum 2D Fall kann man die folgenden Abbildungseigenschaften zeigen:
36
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Satz
gilt
16. Es existiert eine Konstante Cχ unabhangig von f (~x), so dass
√
2 ||f ||H s (R3 ) ≤ ||Rf ||H s+1 (Z) ,
||R(χ f )||H s+1 (Z) ≤ Cχ ||χ f ||H s (R3 ) ,
mit Z = R × S 2 und g(s, θ) ∈ H s (Z), falls
||g||2H s (Z)
Z
Z
=
S2
(1 + σ 2 )s |Fs→σ g(σ)|2 dσ dθ~ < ∞.
R
Bemerkung
7. Wenn wir die Radon-Transformation im R2 mit der im R3
Bemerkung
8. Die Inversion der 3D Radon-Transformation ist lokal, da-
vergleichen, so ist die Transformation im R3 starker glattend als die im R2 , da
in 3D die Radon-Transformation um eine volle Ableitung glattend ist wogegen
im 2D Fall nur um eine halbe Ableitung geglattet wird.
gegen ist das im 2D nicht der Fall. Mit "lokal\ ist hier das folgende gemeint:
~ auf den Ebenen
Die Rekonstruktion von f (~x) hangt nur von den Werten g(s, θ)
~ ab, die durch ~x verlaufen (und einer beliebig kleinen Umgebung, so dass
E(s, θ)
~ θ)
~ und
die zweite Ableitung gebildet werden kann). Oensichtlich gilt ~x ∈ E(~x · θ,
alle Ebenen, die durch ~x verlaufen sind von dieser Gestalt.
Im 2D Fall beinhaltet die Inversionsformel die Hilbert-Transformation (einen
singularen Integraloperator,) der im Unterschied zu Dierentialoperatoren nicht
lokal ist. D.h. fur die Rekonstruktion von f an der Stelle ~x muss man die Integrale uber alle Geraden kennen und nicht nur die, die durch den Punkt ~x
verlaufen.
Definition
heit
mit
5. Das inverse Problem zu Ax = y, A : L2 (Rn ) → L2 (Rn )
mäßig inkorrekt gestellt,
wenn es Konstanten
C
und
α>0
gibt
||Af ||H α (Rn ) ≥ C ||f ||L2 (Rn ) .
Insbesondere heit es maig inkorrekt gestellt von der Ordnung α, wenn
α das kleinste α ≥ 0 mit dieser Eigenschaft ist. Gibt es kein α mit einer
derartigen Eigenschaft, so heit das Problem stark inkorrekt gestellt.
Folglich ist die Inversion der Radon-Transformation ein maig inkorrekt gestelltes
Problem. In 2D ist die Ordnung 21 in 3D ist sie dagegen 1.
7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE
37
7. Das Cauchy-Problem, Elektrokardiographie
Mit der so genannten Elektrokardiographie konnen elektrische Vorgange am Herzen
und somit Storungen des Organs aufgezeichnet beziehungsweise sichtbar gemacht
werden. Der Herzschlag wird durch eine Folge elektrischer Entladungen in Gang
gehalten. Diese gehen von einem Nervenknoten im Herz, dem so genannten Sinusknoten, aus und panzen sich bis zu den Herzkammern fort.
Mit Elektroden, die am Korper angebracht werden, kann man diese elektrischen
Strome messen und aufzeichnen. Die so erhaltene Herzstromkurve\ nennt man Elek"
trokardiogramm, besser bekannt unter seiner Abkurzung EKG\.
"
Jeder Pumpfunktion des Herzens geht eine elektrische Erregung voraus, die im Normalfall vom Sinusknoten ausgeht und uber das herzeigene Erregungsleitungssystem
zu den Muskelzellen lauft. Diese elektrischen Potenzialanderungen am Herzen kann
man an der Korperoberache ableiten und in der Zeitachse aufzeichnen. Es resultiert
ein immer wiederkehrendes Bild der elektrischen Herzaktion. Mit dem EKG lassen
sich vielfaltige Aussagen zu Eigenschaften und Erkrankungen des Herzens treen. Zu
beachten ist, dass das Oberachen-EKG nur die elektrische Aktivitat des Herzmuskels anzeigt, nicht jedoch die tatsachliche Auswureistung widerspiegelt.
Die folgende Beschreibung der physikalischen Vorgange ist entnommen:
http://www.grundkurs-ekg.de/grundlagen/grundlagen.htm#grundlagen
An den Zellmembranen von Herzmuskelzellen ( auch Muskel- und Nervenzellen) sind
elektrische Potenziale nachweisbar, die aufgrund der Depolarisation und Repolarisation zyklisch auftreten. Die Depolarisation setzt sich von Zelle zu Zelle fort und
wandert uber die Muskelfasern hinweg. In den folgenden Graken ist ein Muskelstrang abgebildet, der von links nach rechts depolarisiert wird.
Die Animation ist entnommen:
http://de.wikipedia.org/wiki/Elektrokardiogramm
Durch Anklicken kann man die Animation
starten bzw. stoppen.
38
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Ein erregter Muskelbezirk verhält sich gegenüber einem unerregten Bezirk
elektrisch negativ, sie bilden einen Dipol, von dem ein elektrisches Feld ausgeht,
das an der Körperoberfläche mit Elektroden registriert werden kann.
Zwischen gleichmäßig erregten oder gleichmäßig unerregten Muskelbezirken ist
kein Potenzialunterschied nachweisbar.
( kein Dipol = kein elektr. Feld = kein Ausschlag im EKG )
Die Muskelzellen befinden sich im
Ruhepotenzialund haben extrazellulär
eine positive Ladung. In der Umgebung
ist kein elektrisches Feld messbar.
Die Erregungswelle hat alle Zellen
des Muskelstranges erfasst, alle
Zellen sind depolarisiet und haben
extrazellulär negative Ladung. In
der Umgebung ist kein elektrisches
Feld messbar.
Der Muskelstrang wird von links nach
rechts depolarisiert, es entsteht ein elektrischer Dipol, von dem ein elektrisches
Feld ausgeht. Die Erregungswelle erzeugt
einen positiven Ausschlag, wenn sie auf
eine Elektrode zuläuft und einen negativen
Ausschlag, wenn sie sich von einer
Elektrode weg bewegt.
Die zuerst erregten Zellen werden
wieder repolarisiert, der Erregungsrückgang ist langsamer und länger,
erzeugt eine flache, langgezogene Kurve
und ist im Vergleich zur Depolarisation
elektrisch entgegengesetzt.
7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE
39
Modelliert wird die ganze Sache nun wie folgt:
Es sei Γ0 die auere Oberache, die eine geschlossene innere Oberache umschliet,
wo das Potential gemessen wird, und sei Ω das Gebiet mit dem Rand ∂Ω = Γ1 ∪ Γ0 .
Δu = 0
Γ1
Ω
Γ0
Das elektrische Potential u erfullt die folgende Laplace-Gleichung:
∆u = 0,
u = u1 ,
∂u
= 0,
∂~n
in Ω,
auf Γ1 ,
auf Γ1 .
Die Funktion u1 beschreibt die Messwerte auf der Oberache Γ1 , die als isoliert
angenommen wird, so dass ~n · ∇u = 0 auf Γ1 gilt. Aus den Messwerten wird nun u0
auf Γ0 bestimmt (Vorwartsaufgabe).
7.1. Halbraum-Problem. Die starke Inkorrektheit des inversen Problems lasst
sich gut am Halbraum-Modell darstellen.
7.1.1. Elektrokardiograsche Anwendung. Dann lautet das Problem wie folgt:
∂2u ∂2u
+
= 0,
∂x2 ∂y 2
u(x, 0) = u0 (x),
∂u
(x, 0) = g0 (x),
∂y
x ∈ R, y > 0,
x ∈ R,
(8)
x ∈ R.
Gesucht ist u(x, y) fur eine parallele Gerade y = ρ > 0. Wir bezeichnen mit
û(k, y) = (Fx→k u) (k, y)
die Fourier-Transformierte bzgl. der x Variablen. Damit ergibt sich des folgende Anfangswertproblem einer gewohnlichen Dierentialgleichung fur û:
∂ 2 û
= 0,
∂y 2
û(k, 0) = û0 (k),
−k 2 û +
∂ û
(k, 0) = ĝ0 (k),
∂y
k ∈ R, y > 0,
k ∈ R,
k ∈ R.
40
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Die Losung ist dann
ĝ0 (k)
sinh(|k|y).
|k|
û(k, y) = û0 (k) cosh(|k|y) +
Setzt man nun voraus, dass
|k| û0 (k) + ĝ0 (k) = 0,
so folgt
û(k, y) = û0 (k)e−|k|y .
Durch Anwendung der inversen Fourier-Transformation erhalt man die Losung:
u(x, y) =
Bemerkung
1
y
u0 ∗
2
π x + y2
1
(x) =
π
Z
u0 (x − z)
R
z2
y
dz.
+ y2
9. (i) Es gilt
1
2π
Z
e−y|k| eixk dk =
R
1
y
.
2
π x + y2
(ii) Die Kompatibilitatsbedinung
|k|û0 (k) + ĝ0 (k) =
entspricht
|k|
|k|
kû0 (k) + ĝ0 (k) = 0 ⇐⇒ − (ik)û0 (k) = iĝ0 (k)
k
k
(9)
g0 (x) = −Hu00 (x),
wobei H die Hilbert-Transformation ist.
Ist die Kompatibilitatsbedinung erfullt, so besitzt das Problem (8) eine eindeutige
Losung und ist korrekt gestellt, da
Z
2
Z
u (x, y) dx ≤
R
u20 (x) dx,
fur alle y > 0.
R
Dies folgt aus der Parsevalschen Gleichung.
Ist die Kompatitbiltatsbedinung aber nicht erfullt, wie das z.B. bei der Elektrokardiographie der Fall ist, wo gilt g0 (x) = 0. In diesem Fall ergibt sich
û(k, y) = û0 (k) cosh(|k|y).
Folglich werden hohe Frequenzen exponentiell verstarkt fur y > 0. Nehmen wir an,
dass das Potential fur y = y0 gesucht ist. Die Vorwartsaufgabe, wo wir u(x, y0 )
kennen und u(x, 0) = A[u(x, y0 )] zu bestimmen ist, ist korrekt gestellt, da (es gilt
cosh(|k|y) ≥ 21 e|k|y )
||Av||L2 (R) ≤ ||v||L2 (R) .
Dagegen ist das inverse Problem, welches u0 (x) nach u(x, y0 ) abbildet stark inkorrekt
gestellt, da cosh(|k|y) nach nicht durch C(1 + |k|2 )α/2 fur irgendein α beschrankt ist.
D.h. der inverse Operator A−1 ist nur fur hinreichend glatte Funktionen deniert,
genauer, sei
Xy (R) = {u ∈ L2 (R) : cosh(|k|y)û(k) ∈ L2 (R)}.
7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE
41
Dann ist A ein stetiger Operator in L(L2 (R, Xy0 (R)) und der dazugehorige inverse
Operator A−1 ist stetig in L(Xy0 (R), L2 (R) und lautet
−1
A−1 u = Fk→x
(cosh(|k|y)Fx→k u.
7.1.2. Analytische Fortsetzung. Die gleiche Vorgehensweise wie eben kann auf
das Problem der analytischen Fortsetzung einer auf der reellen Achse analytischen
Funktion angewandt werden.
Definition
6. Eine auf einer oenen Teilmenge I ⊆ R denierte Funktion
heit reell-analytisch, wenn g lokal in eine Potenzreihe entwickelbar
∞
P
ist, d.h. fur jedes t0 ∈ I gibt es eine reelle Potenzreihe an (t − t0 )n mit an ∈ R,
n=0
die in einer Umgebung von t0 die Funktion g darstellt.
g : I → R,
Definition
7. Eine komplexwertige Funktion f (z) = g(x, y) + ih(x, y) ist in z0
analytisch (oder holomorph), wenn
∂f
∂
∂
=
+i
(g(x, y) + ih(x, y)) = 0.
∂z
∂x
∂y
(10)
Die Bedingung (10) ist aquivalent zu
∂g ∂h
−
= 0,
∂x ∂y
∂g ∂h
+
= 0.
∂x ∂y
Dieses Cauchy-Riemann-System impliziert, dass g und h harmonische Funktionen
sind, ∆g = ∆h = 0.
Es sei f (z) = g(z) + ih(z) eine analytische Funktion mit den reell-wertigen
Funktionen g und h. Die reell-wertigen Funktionen g und h seien entlang
der reellen Achse Im (z) = 0 gegeben. Man bestimme f (z) aus g(x, 0) = g(x)
und h(x, 0) = h(x).
Wir identizieren z = x+iy und setzen voraus, dass g(x) und h(x) Distributionen aus
S 0 sind, so dass ihre Fourier-Transformierten deniert sind. Dann muss das folgende
Problem gelost werden:
∆g = 0,
y > 0,
∂g
∂h
(x, 0) = − (x, 0),
∂y
∂x
g(x, 0) bekannt
∆h = 0,
y > 0,
∂h
∂g
(x, 0) =
(x, 0),
∂y
∂x
h(x, 0) bekannt.
Die Losungen beider Probleme sind im Frequenzbereich gegeben durch
ĝ(k, y) = ĝ(k, 0) cosh(|k|y) − i sign (k)ĥ(k, 0) sinh(|k|y);
ĥ(k, y) = ĥ(k, 0) cosh(|k|y) + i sign (k)ĝ(k, 0) sinh(|k|y).
42
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
Das Problem ist korrekt gestellt, wenn die Kompatibilitatsbedingungen (9) erfullt
sind, d.h.
∂h
∂g
=H ,
∂x
∂x
∂g
∂h
= −H ,
∂x
∂x
wegen H 2 = −I sind beide Gleichungen aquivalent. Sind die Kompatibilitatsbedingungen erfullt, so ist das Problem stabil, ansonsten wachsen die hohen Frequenzen
exponentiell mit y. Folglich ist das Problem der analytischen Fortsetzung stark inkorrekt.
7.2. Der allgemeine 2D-Fall. Wir wollen das elektrokardiograsche Problem
r=1
in 2D fur relativ allgemeine Geometrien losen. Dazu benotigt man die Losung fur
einen Kreisring und den Riemannschen Abbildungssatz.
7.2.1. Die Laplace-Gleichung im Kreisring. Wir betrachten zunachst einen Kreisring mit dem inneren Radius 1 und dem aueren Radius ρ > 1. Durch Streckung bzw.
Stauchung kann daraus jeder Kreisring mit beliebigen Radien a und b gewonnen werden.
r=ρ
In Polarkoordinaten hat der Laplace-Operator die Gestalt:
1 ∂
∆u =
r ∂r
∂u
r
∂r
+
1 ∂2u
.
r2 ∂θ2
Macht man den Separationsansatz mit u(r, θ) = u(r, θ + 2π) :
u(r, θ) = R(r)Θ(θ)
und setzt diesen in die Dierentialgleichung ein, so folgt:
1
R00 (r)
R0 (r)
Θ00 (θ)
1 0
R (r)Θ(θ) + R00 (r)Θ(θ) + 2 Θ00 (θ) = 0 ⇐⇒ r2
+r
=−
= λ.
r
r
R(r)
R(r)
Θ(θ)
Folgt
Θ00 (θ) + Θ(θ) = 0 mit
Θ(θ) = Θ(θ + 2π)
und ergibt
λ = n2
und Θ(θ) = A cos(nθ) + B sin(nθ),
n = 1, 2, . . .
7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE
43
und fur λ = 0 ist Θ(θ) = A = const eine Losung. Die gewohnliche Dierentialgleichung fur R ist eine Eulersche Dierentialgleichung und kann uber den Ansatz
R(r) = rα gelost werden. Man erhalt
α(α − 1) rα + α rα − n2 rα = 0,
also α2 = n2 bzw. α = ±n. Damit wird R(r) = Crn + Dr−n und die separierte Losung
bekommt die Gestalt
u(r, θ) = (Crn + Dr−n )(A cos(nθ) + B sin(nθ)),
n = 1, 2, . . . .
Fur n = 0 brauchen wir neben R = const eine weitere linear unabhangige Losung
und diese ist R(r) = ln r. Damit haben wir fur n = 0 die Losung
u(r, θ) = C + D ln r.
Alle Losungen sind harmonisch in der punktierten Ebene R2 \{0}. Weiterhin sind alle
Funktionen endlich im Kreisring, d.h. die allgemeine Losung ist
u(r, θ) = C0 + D0 ln r +
∞
X
(Cn rn + Dn r−n )(An cos(nθ) + Bn sin(nθ)).
n=1
Wegen u(1, θ) = u1 (θ) ergibt sich
∞
a0 X
(an cos(nθ)+bn sin(nθ)),
C0 +
(Cn +Dn )(An cos(nθ)+Bn sin(nθ)) = u1 (θ) = +
2 n=1
n=1
∞
X
d.h. (Cn + Dn )An = an sowie (Cn + Dn )Bn = bn und mit ~n · ∇u = 0 auf r = 1 folgt
∞
X
∂u r (nCn rn − nDn r−n )(An cos(nθ) + Bn sin(nθ))
= D0 |r=1 +
∂r r=1
n=1
=0
r=1
ergibt sich D0 = 0 sowie Cn = Dn , n = 1, 2, . . . . Also ist
∞
a0 X
u(r, θ) =
+
2
n=1
rn + r−n
2
(an cos(nθ) + bn sin(nθ)),
wobei
1
an =
π
Z
2π
u1 (ϕ) cos(nϕ) dϕ
0
und
1
bn =
π
Z
2π
u1 (ϕ) sin(nϕ) dϕ
0
die entsprechenden Koezienten der Fourierreihe von u1 (θ) sind.
InRkomplexer Schreib
2π
a0
1
1
−ikϕ
weise ergibt sich wegen c0 = 2 und c±k = 2 (ak ∓ibk ) und ck = 2π 0 u1 (ϕ)e
dϕ
die Losung:
n
Z 2π
∞ X
1
r + r−n
−inϕ
u1 (ϕ)e
dϕ
einθ .
u(r, θ) =
2π
4
0
n=−∞
Wie man leicht sieht wachst ein Fehler δ bei der Bestimmung der Fourier-Koezienten
von u1 zu einem Fehler der Groe
cδen ln ρ
an der Stelle r = ρ
44
1. INVERSE PROBLEME UND FOURIER TRANSFORMATION
im Fourierkoezienten der Losung u. Folglich kann der Fehler nicht durch Cnα fur
irgendein α > 0 abgeschatzt werden, was bedeuten wurde, dass der Fehlerniveau
α-mal abgeleitet w
urde. Damit ist das Rekonstruktionsproblem stark inkorrekt.
Bemerkung
10. Oftmals wird genau diese Beschrankung der Fehlerfortpan-
zung mit Cn als Denition der maigen Inkorrektheit gewahlt.
α
7.2.2. Riemannscher Abbildungssatz. Es sei Ω ein oenes glattes 2D Gebiet
mit glattem Rand ∂Ω = Γ0 ∪ Γ1 , der aus 2 glatten und zusammenhangenden Teilen
besteht, die auere Anteil sei mit Γ0 und die innere Anteil mit Γ1 bezeichnet.
Wir konstruieren nun eine holomorphe Funktion Ψ(z), die Ω auf den Kreisring 1 <
r < ρ abbildet.
Konstruktionsidee: Es sei v die eindeutig bestimmte Losung des Dirichlet-Problems:
∆v = 0
in Ω,
v |Γ0 = 1,
v |Γ1 = 0.
Es sei nun G = cv mit einem spater zu bestimmenden c = const. Dann gilt
Z
∂G
∂G
dx +
dy = −c
I=
−
∂y
∂x
Γ1
Z
Γ1
∂v
ds > 0.
∂~n
Nach dem Maximumprinzip harmonischer Funktionen nimmt, v sein Minimum und
Maximum auf dem Rand an, d.h. es gilt 0 < v(z) < 1, und die Ableitung in Richtung
der aueren Normalen muss negativ sein. Nun sei c so gewahlt, dass I = 2π gilt.
Weiterhin sei H(z), die zu G(z) konjugiert harmonische Funktion, d.h. G(z) + iH(z)
ist holomorph und G(z), H(z) sind harmonisch, welche gegeben ist durch
Z
z
−
H(z) =
p
∂G
∂G
dx +
dy,
∂y
∂x
wobei p ein beliebiger Punkt in Ω ist. Da G eine harmonische Funktion ist, ist das
Integral wegunabhangig. Unmittelbar folgt, dass
∂H
∂G
=−
,
∂x
∂y
∂H
∂G
=
,
∂y
∂x
was heit, dass G + iH holomorph ist in Ω. Dann ist auch
Ψ(z) = eG(z)+iH(z)
holomorph. Nun gilt:
• Ψ(z) bildet Γ0 auf den Kreis |z| = ec ab und Γ1 auf den Einheitskreis |z| = 1.
• Es ist ∆Ψ(z) = 0 in Ω, da Ψ holomorph ist.
• Ψ ist ein Dieomorphismus zwischen Ω und dem Kreisring Kc = {z ∈ C :
1 ≤ |z| ≤ ec }.
Deshalb kann das Problem fur Ω ersetzt werden durch das Losen der Laplace-Gleichung
fur den Kreisring Kc mit den Rannbedingungen u1 (Ψ(z)) auf dem Einheitskreis und
verschwindender Neumannscher Randbedingung. (Man kann zeigen, dass die Neumannsche Randbedingung unter der Abbildung Ψ invariant ist.)
7. DAS CAUCHY-PROBLEM, ELEKTROKARDIOGRAPHIE
Bemerkung
45
11. Der Nachweis, dass diese Konstruktion die gewunschten
Eigenschaften hat, kann dadurch erbracht werden, dass man zeigt, dass jedes
2-fach zusammenhangende Gebiet (mit glattem Rand) in der komplexen Ebene uber eine konforme Abbildung auf einen Kreisring abgebildet werden kann.
(siehe z.B.: Y. Komatu, Existence Theorem of confomal mapping of doublyconnected domains, Ko dai Math. Sem. Rep., No.5-6, 1949 )
Eine weitergehende Aussage, die obige Konstruktion als Spezialfall ergibt, ist
Theorem 10, Seite 255, aus: L.V. Ahlfors, Complex Analysis, An Introduction
to the Theory of Analytic Functions of One Complex Variable, 3rd Edition, International Series in Pure and Applied Mathematics, McGraw-Hill, Inc, 1979.
KAPITEL 2
Identifikationsprobleme in Hilbert-Räumen
Bevor wir einige Begrie der Hilbert-Raum-Theorie wiederholen, wollen wir uns
mit dem Begri der verallgemeinerten Inversen beschaftigen. Verallgemeinerte Inverse werden benotigt, wenn ein Problem nicht (z.B. ein uberbestimmtes Problem mit
zu vielen Bedingungen) bzw. nicht eindeutig (z.B. ein unterbestimmtes Problem mit
nicht genugend Bedingungen) losbar ist.
Beispiel
3. \Minibeispiel\: Wir betrachten die lineare Abbildung T , die den
Hilbert-Raum R3 in den Hilbert-Raum R3 abbildet und durch die Matrix

1 0 0


T = 0 0 0 
0 0 1

gegeben ist. Wie man leicht sieht ist R(T ) = R2 , da die mittlere Komponente
immer auf 0 abgebildet wird. Auch ist die Matrix naturlich nicht invertierbar,
da die Determinante gleich Null ist. Genauso schnellsiehtman ein, dass das
zugehorige Gleichungssystem fur jede rechte
y1

Seite ~y =  0 

y3

deutig!!) ist und fur

y1


~y =  y2  , y2 ∈ R\{0},
y3
losbar (nicht ein-
nicht losbar ist. Die verallgemei-
nerte Inverse kann nun als sogenannte Kleinste-Quadrate-Losung (least-square
solution) bestimmt werden.
~x ∈ R3 heit Kleinste-Quadrate-Lösung von T ~x = ~y , wenn
||T ~x − ~y || = inf{||T ~z − ~y ||, ~z ∈ R3 }.
Fur unser Beispiel gilt
Folglich sind
1/2
||T z − y|| = (z1 − y1 )2 + y22 + (z3 − y3 )2
≥ |y2 |.


y1

alle ~z =  z2 
osungen. Das
 Kleinste-Quadrate-L
y3
sind naturlich
"zu viele\ Losungen. Deshalb verscharfen wir den Losungsbegri:
~x ∈ R3 heit Minimum-Norm-Lösung (best-approximate solution) von T ~x = ~y ,
47

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
48
wenn
||~x|| = inf{||~z∗ || : ||T ~z∗ − ~y || = inf3 {||T ~z − ~y ||, ~z∗ ∈ R3 }.
~
z ∈R

Die Minimum-Norm-Losung ~x in unserem Beispiel ist deshalb

y1


~x =  0 
y3
die
Minimum-Norm-Losung.
Man beachte, dass auf diese Weise ein, im klassischen Sinne, nicht eindeutig
losbares Problem und unlosbare Probleme die gleiche Minimum-Norm-Losung
besitzen.
Bemerkung
12. Man uberlege sich, dass die Kleinste-Quadrate-Losung =
Minimum-Norm-Losung von








gerade ~x = 

y1 +y5
2
y2 +y4
2
y3
1
0
0
0
1
0
1
0
1
0
0
0
1
0
0





 x
1


 

  x2  = 



 x3
y1
y2
y3
y4
y5










ist.
Hinweis: Minimierung von
f (x1 , x2 , x3 ) = ||T x − y||2 = (x1 − y1 )2 + (x2 − y2 )2 +
(x3 − y3 )2 + (x2 − y4 )2 + (x1 − y5 )2 .
1. Einige Grundbegriffe der Hilbert-Raum-Theorie
Ein reeller Hilbert-Raum H ist ein normierter Raum mit einem Skalarprodukt
h, i, das die folgenden Eigenschaften besitzt: F
ur alle x, y, z ∈ H und λ ∈ R gilt:
(1) hx, xi ≥ 0 und hx, xi = 0 ⇐⇒ x = 0,
(2) hx, yi = hy, xi,
(3) hλx + y, zi = λhx, zi + hy, zi.
Durch das Skalarprodukt
wird eine Norm, die sogenannte induzierte Norm, bestimmt,
p
es ist ||x|| := hx, xi.
Es gilt
• die Cauchy-Schwarzsche Ungleichung: |hx, yi| ≤ ||x|| ||y|| f
ur alle x, y ∈
H,
• der Satz des Pythagoras: ||x + y||2 = ||x||2 + ||y||2 f
ur alle x, y ∈ H.
Definition
rabel,
8. Ein metrischer (oder auch topologischer) Raum heit sepa-
wenn er eine abzahlbare dichte Teilmenge besitzt.
Lemma
3. Fur einen normierten Raum X sind aquivalent:
1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE
49
(1) X ist separabel,
(2) Es gibt eine abzahlbare Menge A mit X = lin A. (X ist gleich der Ab-
schlieung der linearen Hulle von A.)
Beweis: D. Werner, Funktionalanalysis, Springer-Verlag, 4. Auage 2005, Seiten 28
und 29.
Wir werden nur separable Hilbert-Raume betrachten. Separable Hilbert-Raume besitzen u.a. endliche oder abzahlbare Orthonormalsysteme, die eine Anwendung der
Theorie der Fourierreihen und damit eine explizite Entwicklung von Elementen des
Hilbert-Raumes sowie von Operatorbildern in eine Reihe ermoglichen.
Wir bezeichnen mit
T ⊥ := {x ∈ H : hx, zi = 0 f
ur alle
z ∈ T}
das orthogonale Komplement T ⊥ einer Teilmenge T von H. Das orthogonale Komplement H1⊥ eines Teilraums H1 von H (d.h. die Teilmenge H1 ist ein Vektorraum)
ist ein abgeschlossener Teilraum von H. Ist H1 (also der Teilraum selbst) ein abgeschlossener Teilraum von H, so kann H als orthogonale Summe
H = H1 ⊕ H1⊥
dargestellt werden, d.h. fur jedes Element x ∈ H gibt es eindeutig bestimmte Elemente x1 ∈ H1 und x2 ∈ H1⊥ mit x = x1 + x2 .
Eine Folge {en } ⊂ H heit Orthonormalsystem, wenn die Orthonormalitatsrelationen
(
1 f
ur m = n,
hem , en i =
0 f
ur m 6= n,
gelten. Das Orthonormalsystem heit vollständig, wenn sich jedes Element x ∈ H
in eine konvergente Fourier-Reihe
x=
n
X
hx, en i en ,
n=1
entwickeln lasst, wobei fur alle x ∈ H die Parsevalsche Gleichung
∞
X
hx, en i2 = ||x||2
n=1
erfullt ist. Ist das Orthonormalsystem nicht vollstandig, so gilt die Besselsche Ungleichung:
∞
X
hx, en i2 ≤ ||x||2
n=1
Die Darstellung stetiger linearer Funktionale ergibt sich aus dem Satz von Riesz:
Zu jedem stetigen linearen Funktional f ∈ L(H, R uber dem Hilbert-Raum H existiert ein eindeutig bestimmtes Element g ∈ H, so dass
f (x) = hx, gi f
ur alle
x∈H

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
50
gilt. Unter allen Konstanten C mit
|f (x)| ≤ C ||x|| f
ur alle
x∈H
ist C = ||g|| der kleinstmogliche Wert.
1.1. Eigenschaften beschränkter linearer Operatoren in Hilbert-Räumen. Es seien X und Y separable reelle Hilbert-Raume und a ∈ L(X, Y ) ein stetiger

linearer Operator. Uber
die Beziehung
hAu, viY = hu, A∗ viX
fur alle u ∈ X und v ∈ Y
lasst sich in eindeutiger Weise der zu A adjungierte Operator A∗ ∈ L(Y, X) denieren.
Bemerkung
13. Der adjungierte Operator ist i.Allg. fur stetige lineare Abbil-
dungen in Banach-Raumen erklart. Es gilt: Sei T : X → Y ein stetiger linearer
Operator, der den Banach-Raum X in den Banch-Raum Y abbildet. Dann seiX 0
der Dualraum zu X und Y 0 der Dualraum zu Y. Fur jedes stetige lineare Funktional y0 ∈ Y 0 ist y0 (T x) wohldeniert. Nun ist der zu T adjungierte Operator
T 0 deniert durch
(T 0 y 0 )(x) := y 0 (T x).
Dieser Operator ist linear und beschrankt, da
(T 0 (c1 y10 +c2 y20 )(x) = (c1 y 0 +c2 y 0 )(T x) = c1 y 0 (T x)+c2 y20 (T x) = c1 (T 0 y10 )(x)+c2 (T 0 y20 )(x)
und
0 0
0
0
|T y (x)| = |y (T x)| ≤ ||y ||Y
also ||T 0 y0 ||X
0
0
|T 0 y 0 (x)|
≤ ||y 0 ||Y 0 · ||T ||L(X, Y ) ,
· ||T ||L(X, Y ) · ||x||X , ⇐⇒
||x||X
≤ ||y 0 ||Y 0 · ||T ||L(X, Y )
und damit ist
||T 0 ||L(Y 0 , X 0 ) ≤ ||T ||L(X, y) .
(Genauer: es gilt die Gleichheit.) Sind nun X und Y sogar Hilbert-Raume und
JX : X → X 0 sowie JY : Y → Y 0 die Isometrien aus dem Rieszschen Darstellungssatz, so sei fur T ∈ L(X, Y )
T ∗ = JX−1 T 0 JY
die Hilbert-Raum-Adjungierte zu T. Wie man leicht sieht gilt
−1
0
Y Y 0 T X 0 JX X
Y J→
→
→
und
hT x, yiY = y 0 (T x) = (JY y)(T x) = (T 0 JY y)(x) = hx, JX−1 T 0 JY yiX = hx, T ∗ yi.
T∗
ist wiederum ein linearer beschrankter Operator Y
→ X.
1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE
51
Zwischen den Nullraumen (Kernen) N (A) und N (A∗ ) sowie den Bildraumen R(A)
und R(A∗ ) bestehen die Beziehungen:
X = N (A) ⊕ R(A∗ ) und Y = R(A) ⊕ N (A∗ ).
Definition 9. Seien X, Y Banach-R
aume. T ∈ L(X, Y ) heit FredholmOperator, wenn N (T ) endlich dimensional und die Kodimension von R(T ), also
codim Y R(T ), ebenfalls endlich ist. Die Ganze Zahl
ind T = dim N (T ) − codim R(T )
heit Index des Fredholm-Operators.
Bemerkung
14. Ist T ∈ L(X, Y ) ein Fredholm-Operator, so ist der adjun-
gierte Operator T 0 ∈ L(Y 0 , X 0 ) ebenfalls ein Fredholm-Operator und es gilt
dim N (T 0 ) = dim R(T ),
Satz
codim R(T 0 ) = dim N (T )
⇒
ind T = −ind T 0 .
17. Riesz-Schauder. Sei X ein unendlich dimensionaler Banach-
Raum und T ∈ K(X) ein vollstetiger (kompakter) Operator. Dann gilt
(1) 0 ist ein Spektralwert von T.
(2) Tλ = T − λI ist fur λ 6= 0 ein Fredholm-Operator vom Index Null,
insbesondere ist jeder Spektralwert Eigenwert.
(3) Es gibt hochstens abzahlbar viele Eigenwerte, die keinen
Haufungspunkt haben auer eventuell Null.
Als Folgerung ergibt sich die
Fredholmsche Alternative: Es sei X ein Banach-Raum und T ∈ K(X)
sowie λ 6= 0. Dann hat entweder die homogene Gleichung
λx − T x = 0
nur die triviale Losung, und in diesem Fall ist die inhomogene Gleichung
λx − T x = y
fur jedes y ∈ X eindeutig losbar, oder es existieren n = dim N (λI − T ) <
∞ linear unabhangige Losungen der homogenen Gleichung, und auch die
adjungierte Gleichung
λx0 − T 0 x0 = 0
hat genau n linear unabhangige Losungen; in diesem Fall ist die inhomogene
Gleichung genau dann losbar, wenn y ∈ (N (λI − T 0 ))⊥ ist.

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
52
Definition
normal,
wenn
10. Sei X ein Hilbert-Raum. Dann heit der Operator T ∈ L(X)
T ∗T − T T ∗ = 0
gilt.
Insbesondere sind selbstadjungierte Operatoren normal.
Satz
18. Spektralsatz für vollstetige (kompakte) normale Operato-
Ist X ein (komplexer) Hilbert-Raum und T ∈ K(X) normal, T 6= 0,
so gilt:
(1) Es gibt ein Orthonormalsystem {ek }k∈N mit N ⊂ N und 0 6= λk ∈
C, so dass
T ek = λk ek f
ur k ∈ N, σ(T )\{0} = {λk ; k ∈ N },
d.h. die Zahlen λk sind die von Null verschiedenen Eigenwerte von T mit Eigenvektoren ek . (Beachte: Werte λk konnen fur
verschiedene k gleich sein!) Falls N unendlich ist, konvergiert
λk → 0 f
ur k → ∞.
(2) Die Ordnung der Eigenwerte nλ = 1 fur alle k.
ren.
k
(3) X = N (T ) ⊕ span {ek , k ∈ N }.
P
λk hx, ek iX ek f
ur alle x ∈ X.
(4) T x =
k∈N
(5) Ist T selbstadjungiert, d.h. T ∗ = T und positiv semidenit, d.h.
hT x, xiX ≥ 0
Eigenwert.
Bemerkung
fur alle
x ∈ X,
so gilt
σp (T ) ⊂ [0, ||T ||]
und
||T ||
ist
15. 1. (5) ist eigentlich nur eine Folgerung, denn es gilt
λ||x||2X = hλx, xiX = hT x, xiX = hx, T ∗ xiX = hx, T xiX = hx, λxiX = λ||x||2x ,
also λ = λ ≥ 0.
2. Insbesondere sind fur einen beliebigen Operator A ∈ (X, Y ) die Operatoren
A∗ A ∈ L(X) und AA∗ ∈ L(Y ) selbstadjungiert bzw. normal.
Beispiel
4. Fredholmsche Integralgleichung 2. Art in L2 [0, 1],
Z
−λf (s) +
1
k(s, t) f (t) dt = g(s),
0
mit λ 6= 0, kann man schreiben als
(K − λI)f = g,
1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE
53
wobei
K der von k(. .) erzeugte Integraloperator ist. Ist k symmetrisch, d.h.
k(s, t) = k(t, s), und quadratisch integrierbar, dann ist K ein vollstetiger (kom-
pakter) und selbstadjungierter Operator.
Falls λ kein Eigenwert von K ist, dann ist (K − λI)−1 ein beschrankter linearer
Operator und die Fredholmsche Integralgleichung 2. Art hat fur jedes g ∈ L2 [0, 1]
eine eindeutig bestimmte Losung
f = (K − λI)−1 g,
in L2 [0, 1], die stetig von g abhangt. D.h. die Fredholmsche Integralgleichung 2.
Art ist ein korrekt gestelltes Problem, wenn λ kein Eigenwert ist, d.h. wenn die
homogene Gleichung keine nichttrivialen Losungen besitzt. Ist dagegen λ ein
Eigenwert, so ist noch nichts verloren, denn dann gibt es eine Losung genau
dann, wenn
g ∈ R(K − λI) = N (K − λI)⊥ ,
d.h. wenn g orthogonal zu allen Eigenvektoren zum Eigenwert λ ist. In diesem
Fall ist jede Funktion der Gestalt
f=
X hg, vi i
1
vi − P g + ψ,
λi − λ
λ
i, i6=j
mit λ = λj (der Term fur λi = λ steht nicht in der Summe), wobei ψ eine beliebe
Funktion des Eigenraums N (K − λI) und P g die orthogonale Projektion von g
auf N (K) ist.
Was passiert im Fall der Fredholmschen Integralgleichung 1. Art, die ein stark
inkorrektes Problem darstellt. Wir betrachten auch dieses Problem als Operatorgleichung
Kf = g
mit einem linearen vollstetigen (kompakten) Operator K : H1 → H2 aus dem HilbertRaum H1 in den Hilbert-Raum H2 . (K wird nicht als selbstadjungiert vorausgesetzt.)
Dann sind, wie man leicht leicht nachvollzieht, sind K ∗ K und KK ∗ positiv semidenit in H1 bzw. H2 und besitzen die gleichen Eigenwerte λ1 ≥ λ2 ≥ . . . mit den
dazugehorigen orthonormalen Eigenvektoren v1 , v2 , . . . . Dann ist die Menge der Eigenvektoren ein vollstandiges Orthonormalsystem in R(K ∗ K) = N (K)⊥ . Es sei nun
√
µj =
λj
dann gilt
K ∗ u j = µj v j
und uj := µ−1
j Kvj
und KvJ = µj uj
und auerdem gilt
KK ∗ uj = µj Kvj = µ2j uj = λj uj
und wie man leicht nachpruft bilden die orthonormalen Eigenvektoren {uj } von KK ∗
eine vollstandiges Orthonormalsystem fur R(KK ∗ ) = N (K ∗ )⊥ .

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
54
Definition
11. Das System {vj , uj ; µj } heit singuläres System des
Operators K ∈ K(H1 , H2 ). und die Werte µj heien Singulärwerte von
K. Jedes f ∈ H1 hat die Darstellung
f = Pf +
∞
X
hf, vj ivj ,
j=1
wobei P die orthogonale Projektion von H1 auf N (K) ist. Folglich ist
Kf =
∞
X
µj hf, vj iuj .
j=1
Diese Darstellung des Operators
K
heit
Singulärwertzerlegung
von
K.
Hat nun die Fredholmsche Integralgleichung 1. Ordnung Kf = g eine Losung f, dann
ist g ∈ R(K) und
1
1
1
|hg, uj i|2 = |hKf, Kvj i|2 = |hf, vj i|2 .
λj
λj
µj
Mit Hilfe der Besselschen Ungleichung folgt hieraus
∞
∞
∞
X
X
|hg, uj i|2 X 1
2
=
|hg,
u
i|
=
|hf, vj i|2 ≤ ||f ||2 < ∞.
j
2
µ
λ
j
j=1 j
j=1
j=1
Ist umgekehrt g ∈ R(K) = N (K ∗ )⊥ und gilt
∞
∞
X
|hg, uj i|2 X 1
=
|hg, uj i|2 < ∞,
2
µ
λ
j
j=1 j
j=1
dann ist jede Funktion der Form
∞
X
hg, uj i
f=
vj + ϕ
µj
j=1
mit ϕ ∈ N (K) eine Losung von Kf = g. Damit haben wir die
Satz
19. Picard-Bedinung. Sei K : H1 → H2 ein vollstetiger (kom-
pakter) Operator mit dem singularen System
g ∈ R(K) liegt genau dann in R(K), wenn gilt
{vj , uj ; µj }.
∞
X
|hg, uj i|2
< ∞.
2
µ
j
j=1
Ein Element
1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE
55
1.2. Verallgemeinerte oder Moore-Penrose-Inverse. Zu gegebenem g ∈ H2
suchen wir eine Losung der Gleichung
Af = g,
A ∈ L(H1 , H2 ).
Als erstes suchen wir alle die Elemente f ∈ H1 fur die gilt
||Af − g||H2 ≤ ||Aϕ − g||H2
Satz
valent:
fur alle ϕ ∈ H1 .
20. Sei g ∈ H2 und A ∈ L(H1 , H2 ). Dann sind folgende Aussagen aqui-
(1) f ∈ H1 erfullt Af = PR(A) g.
(2) f ∈ H1 minimiert das Residuum: ||Af − g||H2 ≤ ||Aϕ − g||H2 fur alle
ϕ ∈ H1 .
(3) f ∈ H1 lost
die Normalgleichung
A∗ Af = A∗ g.
Bemerkung
16. Die Normalgleichung verdankt ihren Namen der Tatsache,
dass das Residuum Af − g senkrecht (normal) auf dem Bild von A steht:
A∗ Af = A∗ g ⇐⇒ A∗ (Af − g) = 0 ⇐⇒ Af − g ∈ N (A∗ ) = R(A)⊥ .
(11)
Der Beweis des Satzes ist leicht nachzuvollziehen.
Wenn wir also Losungen der Gleichung Af = g nden wollen, so mussen wir uns mit
der Normalgleichung naher befassen. Es gilt
Lemma
4. Sei g ∈ H2 . Dann gelten folgende Aussagen:
(1) Die Menge der Losungen der Normalgleichung L(g) = {ϕ ∈ H1 : A∗ Aϕ =
ist genau dann nicht leer, wenn g ∈ R(A) ⊕ R(A)⊥ liegt.
(2) Die Menge L(g) ist abgeschlossen und konvex.
A∗ g}
Bemerkung
17. Im Allg. ist R(A) ⊕ R(A)⊥ 6= H2 . Sollte g ein Randelement
von R(A) sein, dann hat die Normalgleichung keine Losung!
Beweis: zu (1) des Lemmas: Sei ϕ ∈ L(g), dann folgt aus g = Aϕ + (g − Aϕ) ∈
R(A) ⊕ R(A)⊥ , wegen (11). Sei nun g ∈ R(A) ⊕ R(A)⊥ , dann existieren ein ϕ ∈ H1
und ein g̃ ∈ R(A)⊥ mit g = Aϕ + g̃. Wendet man nun auf diese Gleichung den
Projektor PR(A) an, dann erhalt man PR(A) g = Aϕ, dann gilt aber auch A∗ Aϕ = A∗ g,
d.h. ϕ ∈ L(g). Insbesondere ist L(g) nicht leer.
zu (2): Abgeschlossenheit von L(g). Es sei {ϕn }n∈N ⊂ L(g) eine Folge, die gegen
ϕ ∈ H1 konvergiert. Wegen
A∗ g = lim A∗ Aϕn = A∗ Aϕ
n→∞
gilt ϕ ∈ L(g) und somit ist L(g) abgeschlossen.
Konvexitat: Sei λ ∈ [0, 1] und ϕ, ψ ∈ L(g). Dann
A∗ A(λϕ + (1 − λ)ψ) = λA∗ Aϕ + (1 − λ)A∗ Aψ = λA∗ g + (1 − λ)A∗ g = A∗ g,

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
56
d.h. mit ϕ und ψ gehort auch die Verbindungsstrecke λϕ + (1 − λ)ψ zu L(g).
Lemma
#
5. Fur g ∈ R(A) ⊕ R(A)⊥ enthalt L(g) ein eindeutig bestimmtes Ele-
ment f + mit minimaler Norm:
||f + ||H1 < ||ϕ||H1
fur alle
ϕ ∈ L(g)\{f + }.
Der Beweis folgt aus folgendem Satz, da L(g) eine abgeschlossene und konvexe
Teilmenge des Hilbert-Raums H1 ist.
Satz
21. Projektionssatz. Sei H ein Hilbert-Raum und L ⊂ H sei abge-
schlossen und konvex, und sei x0 ∈ H. Dann existiert genau ein x ∈ L mit
||x − x0 ||H = inf ||y − x0 ||H .
y∈L
Beweis: siehe Werner, Funktionalanlysis.
Definition
tionsbereich
12. Die Abbildung A+ : D(A+ ) ⊂ H2 → H1 mit dem DeniD(A+ ) = R(A) ⊕ R(A)⊥ ,
die jedem Element g ∈ D(A+ ) das eindeutig bestimmte Element f + minimaler Norm aus L(g) zuordnet, heit verallgemeinerte Inverse oder
Moore-Penrose-Inverse von A ∈ L(X, Y ).
Das Element f + = A+ g heit Minimum-Norm-Lösung von Af = g.
Wie bestimmt man die Moore-Penrose-Inverse?
Satz
22. Sei g ∈ D(A+ ), dann ist f + = A+ g die eindeutig bestimmte
Losung der Normalgleichung A∗ Af = A∗ g in N (A)⊥ .
Beweisidee: A∗ Aϕ = 0 ⇐⇒ Aϕ = 0, da
hA∗ Aϕ, ϕiH1 = 0 ⇐⇒ hAϕ, AϕiH2 = 0 ⇐⇒ Aϕ = 0.
Folglich unterscheiden sich zwei Losungen der Normalgleichung nur um Elemente
aus N (A), d.h. jede Losung hat die Gestalt f = ϕ + f0 mit ϕ ∈ N (A) beliebig und
f0 ∈ N (A)⊥ eindeutig bestimmt. Dann gilt f
ur die Norm
inf ||f ||H1 = inf
f ∈L(g)
Bemerkung
f ∈L(g)
q
q
||ϕ + f0 ||2H1 = inf
||ϕ||2H1 + ||f0 ||2H1 = ||f0 ||H1 .
f ∈L(g)
18. In der Menge L(g) der Losungen der Normalgleichung haben
wir die Losung mit minimaler Norm ausgezeichnet. Das war willkurlich. Mitunter ist es durchaus sinnvoll, eine Losung zu suchen, die den Abstand zu einem
1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE
57
bestimmten Element f∗ ∈ H1 minimiert. Es gibt nur eine derartige Losung, sie
wird f∗ -Minimum-Norm-Losung genannt. Sie sei ebenfalls mit f + bezeichnet,
dann gilt
f + = A+ g + PN (A) f∗ .
Satz
23. Die verallgemeinerte Inverse A+ von A ∈ L(H1 , H2 ) hat die
folgenden Eigenschaften:
(1) A+ ist genau dann auf ganz H2 deniert, wenn R(A) = R(A) gilt,
also R(A) abgeschlossen ist,
(2) R(A+ ) = N (A)⊥ , d.h. der Bildraum der verallgemeinerten Inversen ist das orthogonale Komplement vom Nullraum von A,
(3) A+ ist linear,
(4) A+ ist genau dann stetig, wenn das Bild von A abgeschlossen
ist, d.h. R(A) = R(A).
Beweis: (1) ist oensichtlich.
(2) Aus Satz 22 folgt R(A+ ) ⊂ N (A)⊥ . Umkehrung: Sei ϕ ∈ N (A)⊥ . Fur g := Aϕ ist
PR(A) g = Aϕ und nach Satz 20 folgt ϕ ∈ L(g). Sei nun ψ ∈ L(g) beliebig, dann ist
A(ϕ − ψ) = 0 bzw. ϕ − ψ ∈ N (A). Wegen ϕ ∈ N (A)⊥ erhalt man mittels des Satzes
des Pythagoras
||ψ||2H1 = ||ϕ||2H1 + ||ψ − ϕ||2H1 ≥ ||ϕ||2H1 .
Also ist ϕ = A+ g das Element mit minimaler Norm und N (A)⊥ ⊂ R(A+ ).
(3) Seien ϕ, ψ ∈ D(A+ ). Beiden Gleichungen AA+ ϕ = PR(A) ϕ, da A+ ϕ die verallgemeinerte Losung von Af = ϕ ist und damit die Normalgleichung lost (siehe Satz 20),
und AA+ ψ = PR(A) ψ implizieren
A(A+ ϕ + A+ ψ) = PR(A) (ϕ + ψ) = AA+ (ϕ + ψ).
Analog A+ (αϕ) = αA+ ϕ fur α ∈ R bzw. C.
(4) Sei A+ stetig. Da D(A+ ) dicht in H2 ist, konnen wir A+ stetig fortsetzen durch
ein B ∈ L(H2 , H1 ), dass ABϕ = PR(A) ϕ fur alle ϕ ∈ H2 erfullt. Dann ist aber
R(A) = R(PR(A) ) ⊆ R(A).
Sei R(A) = R(A). Wir betrachten die lineare Abbildung  : N (A)⊥ → R(A) deniert durch ϕ 7→ Aϕ. Dann ist  bijektiv und beschrankt. Nach dem Satz uber die
stetige Inverse existiert Â−1 und ist ebenfalls beschrankt. Somit durfen wir wie folgt
abschatzen:
||A+ ϕ||H1 = ||Â−1 (ÂA∗ ϕ)||H1 ≤ ||Â−1 ||L(H2 , H1 ) ||ÂA+ ϕ||H2 = ||Â−1 ||L(H2 , H1 ) ||AA+ ϕ||H2

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
58
fur alle ϕ ∈ D(A+ ) = H2 . Schlielich folgt
+
||ϕ||H2 ≥ ||PR(A) ϕ||H2 = ||AA+ ϕ||H2 ≥ ||Â−1 ||−1
L(H2 , H1 ) ||A ϕ||H1
fur alle ϕ ∈ H2 . Insgesamt erhalten wir damit ||A+ ||L(H2 , H1 ) ≤ ||Â−1 ||L(H2 , H1 ) und
folglich A+ ∈ L(H2 , H1 ).
#
Satz
24. Die verallgemeinerte Inverse A+ von A ∈ L(H1 , H2 ) ist eindeutig
durch die vier Moore-Penrose-Axiome charakterisiert:
AA+ A = A,
A+ AA+ = A+ ,
A+ A = PR(A∗ ) ,
AA+ = PR(A) .
ohne Beweis.
Durch den eingefuhrten verallgemeinerten Losungsbegri einer linearen Operatorgleichung, ist also nur noch der Fall von Interesse, wenn A+ unstetig ist.
Definition
13. Die lineare Operatorgleichung Ax = y in den Hilbert-
Raumen H1 und H2 heit korrekt (gestellt) nach Nashed, wenn der
Bildraum des Operator A abgeschlossen ist.
Ist der Bildraum nicht abgeschlossen, so heit die Operatorgleichung
inkorrekt vom Typ I, falls A kein vollstetiger (kompakter) Operator
ist, jedoch inkorrekt vom Typ II, wenn A ein vollstetiger (kompakter)
Operator ist.
Satz
25. Verallgemeinerte Inverse eines vollstetigen (kompakten)
Operators.
ist
Sei K ∈ K(H1 , H2 ) mit singularem System {vj , uj ; µj }. Dann
∞
X
1
K g=
hg, uj iH2 vj
µ
j
j=1
+
fur
g ∈ D(K + ).
Hat K ein endlich dimensionales Bild, dann ist K + stetig.
Beweis: F
ur g ∈ R(K) ⊕ R(K)⊥ existieren f ∈ H1 und ϕ ∈ R(K)⊥ mit g = Kf + ϕ.
Wegen hg, uj iH2 = hKf, uj iH2 = µj hf, vj iH1 konvergiert die Reihe
f˜ :=
∞
∞
X
X
1
hg, uj iH2 vj =
hf, vj iH1 vj .
µ
j
j=1
j=1
1. EINIGE GRUNDBEGRIFFE DER HILBERT-RAUM-THEORIE
59
Das Element f˜ liegt in N (K)⊥ (da Kvj = µj uj ) und erfullt die Normalgleichung bzgl.
g:
K ∗ K f˜ =
∞
∞
X
X
1
hg, uj iH2 µ2j vj =
µj hg, uj iH2 vj = K ∗ g.
µ
j=1
j=1 j
Die Behauptung folgt nun aus Satz 22.
#
Aus dieser Darstellung der verallgemeinerten Inversen K + eines vollstetigen (kompakten) Operators ersieht man, dass K + unbeschrankt ist, wenn R(K) unendlich
dimensional ist. Dazu betrachten wir eine Storung von g der Form εun und erhalten
als neue rechte Seite
g ε = g + εun
fur die gilt ||g ε − g||H2 = ε. Dann erhalt man
||K + g − K + g ε ||H1 =
Beispiel
ε
→ ∞ f
ur
µn
n → ∞.
5. Kompakter Integraloperator K : L2 (0, 1) → L2 (0, 1) mit
x
Z
1
Z
mit
k(x, t) f (t) dt
f (t)dt =
Kf (x) =
0
0
(
k(x, t) =
1, 0 ≤ t ≤ x ≤ 1,
0, 0 ≤ x < t ≤ 1.
Dann ist der adjungierte Operator
Z
∗
1
K g(x) =
g(t) dt
x
und wir erhalten
Z
∗
1
Z
K Kf (x) =
∗
Z
1
f (τ ) dτ dt.
x
Wir betrachten den Ansatz:
Z
t
0
t
K Kf (x) =
f (τ ) dτ dt = λf (x)
x
0
fur ein
λ > 0.
Hieraus folgt zunachst f (1) = 0. Dierentation der Gleichung liefert
Z
x
−
f (τ ) dτ = λf 0 (x)
0
und damit f (0) = 0. Nochmaliges Dierenzieren fuhrt auf −f (x) = λf 00 (x) und
wir haben ein Randwertproblem zur Bestimmung von λ und f gewonnen:
0
λf 00 (x) + f (x) = 0
fur
x ∈ (0, 1),
f 0 (0) = 0,
f (1) = 0.
Die allgemeine Losung dieser linearen Dierentialgleichung 2. Ordnung ist mit
dem charakteristischen Polynom α2 = − λ1
f (x) = c1 cos
1
1
√ x + c2 sin √ x .
λ
λ

2. IDENTIFIKATIONSPROBLEME IN HILBERT-RAUMEN
60
Aus den Randbedinungen erhalt man
1
f 0 (0) = c2 √ = 0,
λ
also c2 = 0 und die erste Bedinungung wird damit zu
1
0 = f (1) = c1 cos √ .
λ
Fur c1 gibt es nur die triviale Losung, also muss cos √1λ = 0 sein, d.h.
1
π
1
√ = (2j − 1) = (j − )π,
j ∈ N.
2
2
λj
√
Die Konstante c1 bestimmen wir so, dass c1 cos √1λj x = 1, d.h. c1 = 2.
√
Weiterhin erhalten wir die Eigenfunktionen vj = 2 cos (j − 21 )πx . Aus den
Singularwerten und den vj erhalten die uj via
Z x√
√
1
1
1
1
uj (x) = Kvj (x) = (j − )π
2 cos (j − )πt dt = 2 sin j −
πx.
µj
2
2
2
0
Die {uj }j∈N bilden eine Orthonormalbasis in L2 (0, 1), also gilt R(K) = L2 (0, 1).
Wir formulieren die Picard-Bedingung: Eine Funktion g ∈ L2 (0, 1) ist in R(K)
dann und nur dann, wenn
∞
X
Z
2
Z 1
2
∞
X
1 2 2 1
1
1
2
2
(j − ) π g(t)vj (t) dt =
(j − ) 2π g(t) sin((j − )πt) dt < ∞.
2
2
2
0
0
j=1
j=1
Bemerkung
19. Im Beispiel sieht man, dass die Frequenz der singularen
Funktionen mit kleiner werdenden Singularwerten zunimmt (sie oszillieren starker).
Das ist typisch fur schlecht gestellte Probleme. Im Rekonstruktionsprozess mussen
daher die Anteile der Losung zu kleinen Singularwerten gedampft werden, da
sie besonders mit hochfrequentem Rauschen kontaminiert sind.
KAPITEL 3
Regularisierungsmethoden
1. Heuristischer Zugang
Wir hatten bereits festgestellt, das eine Fredholmsche Integralgleichung 2. Art
ein korrekt gestelltes Problem darstellt, die Fredholmsche Integralgleichung 1. Art
dagegen inkorrekt gestellt ist. Wenn wir also an Stelle der Fredholmschen Integralgeichung 1. Art eine geeignete Fredholmsche Integralgleichung 2. Art betrachten und
der Fehler dabei klein\ bleibt, so hatten wir einen Weg gefunden aus inkorrekt ge"
stellte Probleme auf korrekt gestellte zuruckzufuhren.
Es sei K ein kompakter Operator, der zwischen den unendlich dimensionalen, separablen Hilbert-Raum H1 und H2 wirkt. Wir betrachten die Operatorgleichung
Kx = y.
Im Allgemeinen hat diese Gleichung wie wir gesehen hatten, keine eindeutig bestimmte Losung, deshalb suchen wir die verallgemeinerte Inverse bzw. die verallgemeinerte
Losung. Wir setzen dabei voraus, dass y ∈ D(K + ) und wir wollen K + y approximieren. Dabei soll die Approximation stetig von y abhangen.
Ziel der Regularisierung ist es, die Losung eines inkorrekt gestelltes Problem
durch Losungen korrekt gestellter Probleme zu approximieren.
Nun erfullt die verallgemeinerte Losung x = K + y die Normalgleichung, d.h.
K ∗ Kx = K ∗ y,
wobei K ∗ der zu K adjungierte Operator ist. Da K ∗ K ein selbstadjungiert, positivsemideniter Operator ist, sind alle seine Eigenwerte nichtnegativ und der einzige
Haufungspunkt ist die Null. Ersetzen wir nun K ∗ K durch den Operator K ∗ K + αI
mit α > 0, dann besitzt dieser Operator positive Eigenwerte λj +α. Auerdem besitzt
der Operator K ∗ K +αI eine beschrankte Inverse, deshalb ist das Losen der Gleichung
(K ∗ K + αI)xα = K ∗ y
ein korrekt gestelltes Problem. Die eindeutig bestimmte Losung
xα = (K ∗ K + αI)−1 K ∗ y
heit Tikhonov Approximation zu K + y.
61
(12)
62
3. REGULARISIERUNGSMETHODEN
Wir zeigen nun, dass xα → K + y fur α → 0. Dazu verwenden wir das singulare System
{vj , uj , µj } f
ur K. Dann ist {vj } ein vollstandiges Orthonormalsystem fur Np
(K)⊥ und
{uj } ein vollstandiges Orthonormalsystem f
ur R(K), weiterhin gilt µj = λj → 0,
und
K ∗ u j = µj v j .
Kvj = µj uj ,
Wegen (12) ist nun αxα = K ∗ y − K ∗ Kxα ∈ R(K ∗ ) ⊆ N (K)⊥ und kann deshalb als
Reihe
xα =
∞
X
hxα , vj ivj
j=1
dargestellt werden, analog ist
∗
K y=
∞
X
∗
hK y, vj ivj =
j=1
∞
X
hy, Kvj ivj =
∞
X
j=1
µj hy, uj ivj .
j=1
Setzen wir dies in (12) ein, so folgt
∞
X
(µ2j
+ α)hxα , vj ivj =
j=1
∞
X
µj hy, uj ivj .
j=1
Deshalb gilt
hxα , vj i =
und damit
xα =
∞
X
µj
hy, vj i
+α
µ2j
µj
hy, uj ivj .
+α
µ2
j=1 j
Nach Satz 25 ist die verallgemeinerte Losung der Operatorgleichung gerade
+
K y=
∞
X
hy, uj ivj .
j=1
Deshalb ist
||xα − K
+
y||2H1
=
∞ X
j=1
α
2
µj (µj + α)
2
|hy, uj i|2 .
Wegen
α
2
µj (µj + α)
2
1
|hy, uj i| ≤ 2 |hy, uj i|2
µj
2
und
∞
X
1
|hy, uj i|2 = ||K + y||2H1 < ∞,
2
µ
j=1 j
kann man Integration und Grenzwertbildung α → 0 vertauschen und wir erhalten:
lim ||xα − K + y||2H1 = 0.
α→0
Da fur festes α > 0, der Operator (K ∗ K + αI)−1 K ∗ beschrankt ist, hangt xα stetig
von y ab fur jedes feste α > 0.
Im Allgemeinen ist die rechte Seite y aber nicht genau bekannt, sondern nur eine
1. HEURISTISCHER ZUGANG
63
gute\ Naherung fur y, deshalb nehmen wir an, dass die Schatzung y δ fur y der
"
Abschatzung
||y − y δ ||H2 ≤ δ mit bekannten Messfehler δ.
Aus den bisherigen Ergebnissen folgt, dass die Approximationen xα gegen K + y konvergieren, wenn y der tatsachliche Wert ist. Klappt das auch noch mit y δ , d.h. verwenden wir anstelle von y die gestorten Daten y δ wie gut approximiert dann xδα die
Werte xα ? Dazu betrachten wir:
xδα − xα = (K ∗ K + αI)−1 K ∗ (y δ − y).
Als Hilfsaussage benutzen wir, dass
Lemma
6. Es ist
(K ∗ K + αI)−1 K ∗ = K ∗ (KK ∗ + αI)−1 .
Beweis: Wir betrachten die Dierenz der Operatoren:
(K ∗ K + αI)−1 K ∗ − K ∗ (KK ∗ + αI)−1
Dann ist
(K ∗ K + αI)−1 (K ∗ K + αI) (K ∗ K + αI)−1 K ∗ − K ∗ (KK ∗ + αI)−1
= (K ∗ K + αI)−1 K ∗ − (K ∗ K + αI)K ∗ (KK ∗ + αI)−1
= (K ∗ K + αI)−1 K ∗ − K ∗ (KK ∗ + αI)(KK ∗ + αI)−1 = O,
d.h. (K ∗ K + αI)−1 K ∗ = K ∗ (KK ∗ + αI)−1 .
#
Wir konnen nun berechnen:
||xδα − xα ||2 = hK ∗ (KK ∗ + αI)−1 (y δ − y), K ∗ (KK ∗ + αI)−1 (y δ − y)i
= h(KK ∗ + αI)−1 (y δ − y), KK ∗ (KK ∗ + αI)−1 (y δ − y)i
Aus dem Spektralsatz folgt
||KK ∗ (KK ∗ + αI)−1 || ≤ 1 und ||(K ∗ K + αI)−1 || ≤
1
α
und damit konnen wir abschatzen:
δ
||xδα − xα || ≤ √ .
α
Hieraus ersieht man das Grundproblem der Regularisierung inkorrekt gestellter Probleme. Fur festes δ wachst die Abschatzung fur α → 0 gegen unendlich, was die
Instabilitat das Ausgangsproblems wiederspiegelt. Die Aufgabe besteht also darin,
einen geeigneten Regularisirierungparameter α in Abhangigkeit vom Fehlerniveau δ
zu wahlen. Man sagt deshalb
64
3. REGULARISIERUNGSMETHODEN
Bemerkung
20. Die Wahl α(δ) erzeugt einen regulären Algorithmus bzw.
die Regularisierung konvergiert fur das inkorrekt gestellte Problem, wenn
ur δ → 0
α(δ) → 0 und xδα(δ) → K + y f
gilt.
Fur die Tikhonov-Regularisierung erhalten wir,
δ
||xδα(δ) − K + y|| ≤ ||xδα(δ) − xα(δ) || + ||xα(δ) − K + y|| ≤ p
α(δ)
+ ||xδα(δ) − xα(δ) ||
und da wir bereits gezeigt haben, dass xα(δ) → K + y fur α(δ) → 0, ist die Bedingung
δ
p
α(δ)
→ 0 f
ur
δ → 0,
hinreichend um die Konvergenz der Tikhonov-Regularisierung zu sichern.
Beispiel
6. Wie sieht die Regularisierung aus?
2. Ein allgemeines Regularisierungsschema
Definition
14. Eine Familie {Rα }α>0 von beschrankten linearen Opera-
toren Rα ∈ L(H2 , H1 ) heit
A+ , wenn
lineare Regularisierung
fur den Operator
fur alle y ∈ R(A)
gilt. Der Operator Rα heit linearer Regularisierungsoperator fur A+ mit
dem Regularisierungsparameter α > 0.
lim Rα y = A+ y
α→0+
Die Operatoren Rα approximieren fur α → 0+ punktweise die Moore-Penrose-Inverse
A+ .
Lemma
7. Wenn der Wertebereich R(A) des Operators A ∈ L(H1 , H2 ) in H2
nicht abgeschlossen ist, und ist
dann ist
{Rα }α>0
eine lineare Regularisierung fur
A+ ,
lim ||Rα ||L(H2 ,H1 ) = ∞.
α→0+
Beweis: Indirekter Beweis: Wir nehmen an, dass es ein C mit ||Rα || ≤ C f
ur
+
alle α > 0 gibt. Da {Rα }α>0 punktweise gegen A in R(A) konvergiert, ubertragt
sich die Stetigkeit von Rα in R(A) auf A+ . Da A+ aber nur dann stetig ist, wenn
R(A) abgeschlossen ist, erhalten wir einen Widerspruch und die Aussage ist bewiesen.
#
Wendet man die Operatoren Rα fur einen festen Wert α > 0 auf die Daten y bzw.
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
65
die gestorten Daten y δ an, so erhalt man die regularisierten Losungen
xα := Rα y
bzw.
xδα := Rα y δ ,
die wegen der Beschranktheit von Rα stetig von den Daten abhangen. Dann gilt
||xδα −A+ y||H1 = ||Rα y δ −Rα y+Rα y−A+ y||H1 ≤ ||Rα ||L(H2 ,H1 ) ||y δ −y||H2 +||Rα y−A+ y||H1
und damit
||xδα − A+ y||H1 ≤ ||Rα ||L(H2 ,H1 ) δ +
|
{z
}
Datenfehler
||Rα y − A+ y||H1 .
|
{z
}
Approximationsfehler
Aus dieser Abschatzung wird das Dilemma der Regularisierung sichtbar, fur α → 0+
konvergiert Rα y gegen A+ y, also strebt der Approximationsfehler gegen Null, dagegen
wachst der Datenfehler uber alle Grenzen.
Gesamtfehler
Approximationsfehler
αopt
Datenfehler
α
2.1. Wahl des Regularisierungsparameters. Die Wahl eines optimalen Regularisierungsparameters αopt wird auf der Grundlage eines Kompromisses zwischen Stabilitat und Approximation gewonnen. Leider hangt αopt von der Losung
selbst ab und ist nicht anhand der Daten a priori bestimmbar.
Frage: Gibt es fur eine Folge von Daten, deren Datenfehlerniveau δ gegen Null
strebt, eine zugehorige Folge von Regularisierungsparametern α = α(δ), so dass such
||xα − A+ y||H1 → 0?
66
3. REGULARISIERUNGSMETHODEN
Definition
Operator
15. Es sei {Rα }α>0 eine lineare Regularisierung fur den
A . Dann heit diese Regularisierung f
ur eine Vorschrift
α = α(δ, y ) zur Auswahl des positiven Regularisierungsparameters konvergent, wenn f
ur alle y ∈ R(A)
+
δ
lim sup{||Rα(δ, yδ ) y δ − A+ y|| : y δ ∈ Y, ||y δ − y||H2 ≤ δ} = 0
δ→0
gilt.
Wir sprechen von einer a priori Parameterwahl, α = α(δ), wenn der Regularisierungsparameter α nur vom Datenfehlerniveau δ abhangig gemacht wird, andernfalls
von einer a posterio Parameterwahl, bei der z.B. α so gewahlt werden kann, dass
die aktuelle Defektnorm ||Axδα − y δ ||H2 einer gewunschten Groe entspricht, die von
δ abhangen darf.
Bemerkung
21. Als Babushinsky-Veto bezeichnet man die Nichtexistenz
von konvergenten linearen Regularisierungen fur nach Nashed inkorrekte lineare Operatorgleichungen, bei denen mit α = α(yδ ) die Parameterwahlvorschrift
nur von den Daten yδ abhangt, ohne das Datenfehlerniveau explizit zu berucksichtigen. Vorschriften zur Regularisierungsparameterwahl, die ohne Kenntnis
von δ auskommen, liefern daher niemals konvergente lineare Regularisierungen.
Satz
26. Eine lineare Regularisierung {Rα }α>0 fur A+ ist konvergent,
wenn der Regularisierungsparameter α = α(δ) so gewahlt wird, dass
lim α(δ) = 0 und lim ||Rα(δ) ||LH , H ) δ = 0
δ→0
δ→0
2
1
gilt.
2.2. Regularisierungsverfahren. Frage: Wie kann man konvergente lineare Re-
gularisierungen konstruieren?

Ausgangspunkt fur die Uberlegungen
ist die Darstellung von K + y eines kompakten
Operator K mit dim R(K) = ∞, als Reihe mit Hilfe der Singularwertzerlegung:
∞
X
1
A y=
hy, uj iH2 vj ,
µ
j
j=1
+
y ∈ R(A)
und fuhren Filterfaktoren f (α, µj ) zur Dampfung der die Instabilitat verursachenden Vorfaktoren µ1j ein.
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
Satz
67
27. Es sei K ∈ L(H1 , H2 ) ein kompakter Operator mit singularem
System {vj , uj ; µj }∞
j=1 . Dann ist die durch die Vorschrift
∞
X
f (α, µj ) δ
hy , uj iH2 vj ,
Rα y :=
µ
j
j=1
y δ ∈ H2
δ
denierte Familie {Rα }α>0 von beschrankten linearen Operatoren aus
L(H2 , H1 ) eine lineare Regularisierung f
ur K + , wenn fur die Filterfunktion f gilt:
(1) 0 ≤ f (α, µ) ≤ 1 fur alle α > 0 und 0 ≤ µ ≤ ||K||L(H , H ) ,
(2) |f (α, µ)| ≤ C(α)µ fur alle 0 ≤ µ ≤ ||K||L(H , H ) ,
(3) lim f (α, µ) = 1 fur alle 0 ≤ µ ≤ ||K||L(H , H ) .
α→0
Dabei gilt ||Rα ||L(H , H ) ≤ C(α), und die Regularisierung ist konvergent
fur eine a priori Parameterwahl α = α(δ), wenn aus δ → 0 die Grenzwertbeziehungen α(δ) → 0 und δC(α) → 0 folgen.
1
1
1
2
2
2
2
1
Beweis: F
ur alle y δ ∈ Y gilt
||Rα y δ ||2H2
∞
∞
X
X
(f (α, µj ))2 δ
2
2
=
hy , uj iH2 ≤ (C(α))
hy δ , uj i2H2 ≤ (C(α))2 ||y δ ||2H2
2
µj
j=1
j=1
und folglich ist der Operator Rα beschr
ankt mit ||Rα ||L(H2 , H1 ) ≤ C(α). Nun besitzt
P∞
x ∈ H1 die Darstellung x = x0 + j=1 hx, vj ivj mit x0 ∈ N (K) und mit y = Kx
ergibt sich
Kx =
∞
X
hx, vj iH1 Kvj =
j=1
und damit
∞
X
µj hx, vj iuj
j=1
∞
∞
X
X
1
1
hKx, uj ivj =
µj hx, vj iH1 vj
K Kx =
µ
µ
j
j
j=1
j=1
+
und
∞
X
f (α, µj )
Rα (Kx) =
µj hx, vj ivj .
µj
j=1
Deshalb konnen wir abschatzen:
||Rα y − K
+
y||2H1
= ||Rα Kx − K
+
Kx||2H1
=
∞
X
(f (α, µj ) − 1)2 hx, vj i2H1 ,
j=1
Wegen
∞
X
j=1
(f (α, µj ) − 1)2 hx, vj i2H1 ≤
∞
X
j=1
hx, vj i2H1 ≤ ||x||2H1
(13)
68
3. REGULARISIERUNGSMETHODEN
ist das Majorantenkriterium anwendbar und wir konnen Grenzwertbildung und Summation vertauschen, d.h. aus lim f (α, µ) = 0 folgt lim ||Rα y − K + y||2H1 = 0 fur
α→0+
α→0+
alle y ∈ R(K). Die Konvergenzaussage fur die Regularisierung ist dann eine direkte
Folgerung aus Satz 26.
#
Bemerkung
22. Die Konvergenz des Approximationsfehlers lim ||Rα Kx −
α→0
K + Kx||2H1 = 0 ist nicht gleichm
aig fur alle x ∈ H1 . So existiert keine positive
Funktion h(α) mit h(α) → 0, die eine Konvergenzrate bezuglich des Regularisierungsparameters α fur diese Komponente des Regularisierungsfehlers zum
Ausdruck bringen wurde, derart dass
fur
||Rα Kx − K + Kx||2H1 ≤ h(α)||x||H1
α>0
und alle
x ∈ H1 .
(14)
Wegen (13) folgt aus (14) namlich supj∈N |f (α, µj ) − 1| ≤ h(α). Dies kann aber
nicht gelten, denn mit j→0
lim µj = 0 folgt aus der Ungleichung |f (α, µ)| ≤ C(α)µ f
ur
alle α > 0 die Grenzwertbeziehung j→∞
lim f (α, µj ) = 0 und damit sup |f (α, µj )−1| =
j∈N
1.
Beispiel
7. Abgeschnittene oder abgebrochene Singularwertzerlegung.
Als Naherung wird verwendet (α = n1 )
n
X
1
hy, uj iH2 vj ,
xn =
µ
j=1 j
d.h.
(
f (α, µj ) =
1, 1 ≤ j ≤ n,
0, j > n.
Wie man leicht sieht gilt 0 ≤ f (α, µj ) ≤ 1 und |f (α, µj )| ≤ µµ j fur alle j ∈ N.
Auerdem ist limα→0 f (α, µj ) = limn→∞ f (α, µj ) = 1. Eshandelt sich deshalb um
eine lineare Regularisierung. Wird n = n(δ) so gewahlt, dass
n
µ2n+1 ≤ δ < µ2n ,
dann gilt mit δ → 0 strebt n → ∞ bzw. α → 0 und
δ · C(α) = δ ·
1
µ2
< n = µn → 0
µn
µn
fur n → ∞. Also ist unter dieser Wahl von n die Regularisierung konvergent.
2.3. Tikhonov-Regularisierung.
Beispiel
legungen:

8. Tikhonov-Regularisierung. Es ist nach unseren bisherigen Uber∞
X
Rα y δ = xδα =
µj
hy δ , uj ivj .
+α
µ2
j=1 j
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
69
Folglich sind die Filterfaktoren:
µ2j
f (α, µj ) = 2
.
µj + α
Wir uberprufen die Voraussetzungen des Satzes 14:
µ
(1) 0 ≤ f (α, µj ) = µ +α ≤ 1 fur alle α > 0 und j ∈ N.
µ
(2) |f (α, µj )| = µ +α ≤ √µ a , d.h. C(α) = 2√1 a .
2
j
2
j
2
j
j
2
j
µ2
j
(3) limα→0+ f (α, µj ) = limα→0+ µ2 +α
= 1.
j
Deshalb ist es eine lineare Regularisierung. Diese Regularisierung ist konvergent, wenn aus δ → 0 folgt α(δ) → 0 und C(α)δ → 0, d.h. wenn α(δ) → 0 und
δ
→ 0 f
ur δ → 0.
α(δ)
δ
Folglich muss α mit δ gegen Null streben, aber nicht zu schnell, damit auch α(δ)
gegen Null strebt.
Weiterhin gilt: bei festem α > 0 fallt der Dampfungsfaktor f (α, µj ) umso kleiner
aus, je groer j wird, da die Singularwerte µj eine fallende Nullfolge bilden.
Die Summanden der Reihe
2
2
∞
X
1
K y=
hy, uj iH2 vj
µ
j=1 j
+
mit groem j werden bei der Regularisierung stark gedampft, dagegen bleiben
die mit kleinem j wegen µ µ+α ≈ 1 fur genugend kleines α fast unverandert.
Dies bedeutet, dass hochfrequente Anteile, z.B. Vielfache von sin ωt mit hoher
Frequenz ω stark gedampft werden.
Man rekonstruiert mit der Tikhonov Regularisierung die niederfrequenten Anteile recht genau und stabil in Bezug auf die gegebenen Daten, wahrend auf die
hochfrequenten Anteile in der Naherungslosung mit zunehmender Frequenz immer mehr verzichtet wird. Das ist schlecht fur die Rekonstruktion hochfrequenter
Anteile, gilt aber mehr oder weniger fur alle Standard-Regularisierungsverfahren.
2
j
2
j
Folgerung
5. Die durch die Methode der Tikhonov-Regularisierung
xδα := Rα y δ := (A∗ A + αI)−1 A∗ y δ
denierte Operatorfamilie {Rα }α>0 ist eine lineare Regularisierung fur den Operator A+ mit ||Rα ||L(H , H ) ≤ 2√1 α . Genugt eine a priori Parameterwahl α = α(δ)
den Bedinungen
2
1
α(δ) → 0
und
δ2
→0
α(δ)
fur
δ → 0,
so ist die Regularisierung auch konvergent.
Wir wollen die Tikhonov-Regularisierung nun neu interpretieren, dafur benotigen
wir folgende Aussage:
70
3. REGULARISIERUNGSMETHODEN
Lemma
8. Ein selbstadjungierter Operator B ∈ L(H, H), der positiv denit
ist, d.h. fur den
fur alle x ∈ H
gilt, besitzt einen stetigen inversen Operator B −1 ∈ L(H, H) mit
hBx, xiH ≥ β||x||2H
||B −1 ||L(H, H) ≤
1
.
β
Weiterhin ist fur jedes feste z ∈ H das Extremalproblem
hBx, xiH − 2hx, ziH = min!,
x ∈ H,
aquivalent zur Operatorgleichung
Bx = z,
x ∈ H,
und besitzt die eindeutig bestimmte Losung x = B −1 z.
Anwendung auf die Tikhonov-Regularisierung: Setzt man
B := A∗ A + αI,
z := A∗ y δ
so liefert β = α sofort die Korrektheit der Operatorgleichung
(A∗ A + αI)x = A∗ y δ ,
x ∈ H1 ,
nach Hadamard. Weiterhin ist diese Operatorgleichung aquivalent zur Minimierung
des Funktionals
h(A∗ A + αI)x, xiH1 − 2hx, A∗ y δ iH1 = hA∗ Ax, xiH1 + αhx, xiH1 − 2hx, A∗ y δ iH1
= hAx, AxiH2 + α||x||2H1 − 2hAx, y δ iH2 = hAx, Ax − y δ iH2 − hAx, y δ iH2 + α||x||2H1
= hAx − y δ , Ax − y δ iH2 + α||x||2H1 + hy δ , Ax − y δ iH2 − hAx, y δ iH2
= ||Ax − y δ ||2H2 + α||x||2H1 − ||y δ ||2H2 ,
fur alle x ∈ H1 .
(in reellen Hilbert-Raumen ). Der letzte Term ist konstant und kann deshalb weggelassen werden. Dann heit der folgende Ausdruck Tikhonov-Funktional
Tα (x) := ||Ax − y δ ||2H2 + α||x||2H1
und
xδα = Rα y δ = (A∗ A + αI)−1 A∗ y δ
ist fur alle y δ ∈ H2 die eindeutig bestimmte Losung des Extremalproblems
Tα (x) := ||Ax − y δ ||2H2 + α||x||2H1 = min!
Die Theorie fur die Tikhonov-Regularisierung (wie wir sie bisher kennen und noch
weiter kennenlernen werden) lasst sich ein Extremalproblem der Gestalt
Tα (x) := ||Ax − y δ ||2H2 + αΩ(x) = min!,
x ∈ H1 ,
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
71
mit einem Sympathiefunktional ubertragen. Das Sympathiefunktional wird so konstruiert, dass Elemente x, die den Erwartungen an die Losung gut entsprechen ( sym"
patisch sind\), kleinere Werte Ω(x) zugeordnet werden, wahrend unsympathischen\
"
Elementen x groe Werte zugeordnet werden. Mogliche Sympathiefunktionale sind
• Mochte man vorzugsweise Elemente x, die moglichst wenig von einem Referenzelement x∗ abweichen, so ist
Ω(x) = ||x − x∗ ||X
bzw. Ω(x) = ||x − x∗ ||2X im Hilbert-Raum
ein geeignetes Funktional. Mit x∗ = 0 wird dabei speziell auf Elemente mit
moglichst kleiner Norm zuruckgegrien.
• F
ur Raume glatter (dierenzierbarer, mehrfach dierenzierbarer) Funktionen
x(t) (a ≤ t ≤ b) kommt haug ein Sympathiefunktional
Ω(x) =
||x0 ||2L2 (a, b)
b
Z
(x0 (t))2 dt
=
a
zur Anwendung. Dahinter steckt der Gedanke, dass wenig oszillierende Losungen in der Regel bevorzugt werden. Eine im Mittel kleine Ableitung x0 tritt
namlich nur fur Funktionen mit im Durchschnitt geringerer Schwankung auf.
• Maximum-Entropie-Methode. Im Sinne des wahrscheinlichkeitsttheoretischen
Konzepts der Entropie ist ein Sympathiefunktional der Gestalt
Z
Ω(x) =
b
x(t) log
a
x(t)
dt
x∗ (t)
mit einer aus Zusatzinformationen resultierenden Referenzfunktion x∗ (t) >
0, a ≤ t ≤ b, motiviert. Dies ist eine Moglichkeit positive Losungen zu iterieren. Im Allgemeinen sind keine Algorithmen bekannt wie man die Positivitat
einer Losung erreicht!
Andererseits entsteht durch dieses in x(t) nichtlineare Sympathiefunktional ein nichtlineares Problem, das wesentlich aufwendiger zu losen ist als ein
lineares Problem.
Subjektive a priori Informationen sollten bei de Behandlung inverser Aufgaben aber
so zuruckhaltend wie moglich eingesetzt werden.
2.4. Diskrepanzprinz. Wir betrachten eine weitere Eigenschaft der TikhonovRegularisierung. Die regularisierte Losung xδα hangt wegen der Beschranktheit des
linearen Operators Rα stetig von den Daten y δ ab. Ebenso ist eine stetige Abhangig-
keit vom Regularisierungsparameter festzustellen, da
(A∗ A + αI)xδα = A∗ y δ
und (A∗ A + (α + h)I)xδα+h = A∗ y δ mit α + h > 0,
so gilt
(A∗ A + αI)(xδα+h − xδα ) = −hxδα+h =
h
A∗ (Axδα+h − y δ )
α+h
72
3. REGULARISIERUNGSMETHODEN
da
hxδα+h + αxδα+h + A∗ Axδα+h = A∗ y δ ⇐⇒ xδα+h = −
1
A∗ (Axδα+h − y δ )
α+h
und
|h|
||(A∗ A + αI)−1 ||L(H1 , H1 ) ||A∗ ||L(H2 , H1 ) ||Axδα+h − y δ ||H2
α+h
||A||L(H1 , H2 ) |h|
≤
||A||L(H1 , H2 ) ||xδα+h ||H1 + ||y δ ||H2 .
α
α+h
||xδα+h − xδα ||H1 ≤
Nun ist wegen Tα (xδα ) ≤ T (0) fur alle α > 0 auch
(α + h)||xδα+h ||2H1 ≤ Tα+h (xδα+h ) ≤ ||y δ ||2H2
und damit
||xδα+h
−
xδα ||H1
||A||L(H1 , H2 ) |h|
≤
α
α+h
||A||L(H1 , H2 )
√
+ 1 ||y δ ||H2 → 0 f
ur
α+h
|h| → 0.
Dann existiert wegen
(A∗ A + αI)
xδα+h − xδα
= −xδα+h
h
sogar das Ableitungselement
xδ − xδα
dxδα
= lim α+h
∈ H1 ,
h→0
dα
h
welches die Operatorgleichung
(A∗ A + αI)x = −xδα
lost und folglich die Darstellung
dxδα
= −(A∗ A + αI)−1 xδα
dα
besitzt. Die Losung hangt sogar stetig dierenzierbar von α ab!
Fur die Herleitung sinnvoller Strategien einer a posteriori Parameterwahl bei der
Tikhonov-Regularisierung ist es nutzlich, die Funktionen
ϕ(α) := ||Axδα − y δ ||2H2
naher zu betrachten.
und ψ(α) := ||xδα ||2H1
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
73
Es gilt
1
hAxδα+h − y δ , Axδα+h − y δ iH2 − hAxδα − y δ , Axδα − y δ iH2
h→0 h
1
= lim
hAxδα+h − y δ − (Axδα − y δ ), Axδα+h − y δ iH2
h→0 h
+hAxδα − y δ , Axδα+h − y δ iH2 − hAxδα − y δ , Axδα − y δ iH2
ϕ0 (α) = lim
= lim hA(xδα+h − xα ), Axδα+h − y δ iH2 + hAxδα − y δ , A(xα+h − xα iH2
h→0
δ
δ
xα+h − xδα
xα+h − xδα
δ
δ
δ
δ
= lim hA
, Axα+h − y iH2 + hAxα − y , A
iH2
h→0
h
h
dxδ
dxδ
dxδα
, Axδα − y δ iH2 = 2h α , A∗ (Axδα − y δ )iH1 = −2αh α , xδα iH1 .
dα
dα
dα
= 2hA
Da (A∗ A + αI)xδα = A∗ y δ ⇐⇒ A∗ (Axδα − y δ ) = −αxδα . Wegen (A∗ A + αI) dxdαα = −xδα
folgt
δ
δ 2
dxδα 2
dxδα
dxδα
∗
2 dxα ≥ 0,
ϕ (α) = 2αh
, (A A + αI)
i = 2α + 2α A
dα
dα
dα H1
dα H2
0
d.h. die Funktion ϕ(α) ist monoton wachsend und fur y δ 6∈ N (A∗ ) gilt
dxδα
dxδ
6= 0 y α 6= 0,
dα
dα
0
also ist insbesondere ϕ (α) > 0 und die Funktion ϕ(α) streng monoton wachsend.
(A∗ A + αI)xδα 6= 0 y xδα 6= 0 y (A∗ A + αI)
Andererseits ist
δ 2
dxδα 2
dxα dxδα δ
≤ 0,
ψ (α) = 2h
, x iH = −2α − 2 A
dα α 1
dα H1
dα H2
0
d.h. die Funktion ψ(α) ist monoton fallend, und fur y δ 6∈ N (A∗ ), gilt wegen ψ(α) < 0
wieder die strenge Monotonie.
Wir setzen im weiteren N (A∗ ) = {0} voraus.
Dann gilt mit
||y δ ||2H2 =
∞
X
hy δ , vj i2 ,
j=1
die Beziehung
ϕ(α) =
||Axδα −y δ ||2H2
=
∞ X
j=1
2
∞
X
µ2j
α2
δ
2
=
hy δ , vj i2H2 ≤ ||y δ ||2H2 .
−
1
hy
,
v
i
j H2
2
2
µ2j + α
(µ
+
α)
j
j=1
Wegen der sich daraus ergebenden Vertauschbarkeit von Summation und Grenzwertbildung fur α → 0 bzw. α → ∞ in der Reihendarstellung folgt
lim ϕ(α) = 0 und
α→0
lim ϕ(α) = ||y δ ||2H2 .
α→∞
(15)
74
3. REGULARISIERUNGSMETHODEN
Definition
16. Gegeben seien ein Datenfehlerniveau δ > 0 und eine
gestorte rechte Seite yδ ∈ H2 der linearen Operatorgleichung Ax = y mit
exakter rechter Seite y ∈ R(A), mit
(16)
||y δ − y||H2 ≤ δ < ||y δ ||H2 .
Unter dem Diskrepanzprinzip nach Morozov verstehen wir dann die
a posteriori Parameterwahl αdis = αdis (δ, yδ ) des Regularisierungsparameters α > 0 der Tikhonov-Regularisierung, die auf der Losung der
Gleichung
||Axαdis − y δ ||H2 = δ
beruht.
Bemerkung
•
•
•
23.
Mit N (A∗ ) = {0} und (16) liefert das Diskrepanzprinzip wegen der strengen Monotonie und der Grenzwertbeziehung (15) immer einen eindeutig
bestimmten Regularisierungsparameter αdis > 0.
Interpretation: Unter den im Sinne von ||Ax − yδ ||H ≤ δ mit den Daten
y δ vertr
aglichen Elementen x sollten solche bevorzugt werden, bei denen
die Ungleichung sogar als Gleichung gilt.
Überregularisierung: In diesem Fall approximieren regularisierte L
osunδ
δ
δ
+
gen xα mit ||Axα − y ||H < δ die verallgemeinerte Losung A y besser als
xδα . Das Diskrepanzprinzip erzeugt in diesem Fall zu groe Regularisierungsparameter und damit zu glatte regularisierte Losungen.
Unterregularisierung: Im Gegensatz dazu f
uhren zu kleine Regularisierungparameter zu Naherungslosungen, die eine zu kleine Defektnorm
||Axδα − y δ ||H aufweisen und in der Regel st
arker als gewunscht oszillieren.
Motivation: Eine regularisierte Losung xδα mit ||Axδα − yδ ||H = δ lost
das restringierte Extremalproblem
2
2
dis
•
2
•
dis
||x||H1 = min!,
dis
2
(17)
x ∈ H1 : ||Ax − y δ ||H2 ≤ δ.
Beweis: W
are namlich ||x̂||H1 < ||xδαdis ||H1
y δ ||H2 ≤ δ, so m
usste auch
fur ein
x̂ ∈ H1
Tαdis (x̂) = ||Ax̂ − y δ ||2H2 + αdis ||x̂||2H1
< ||Axδαdis − y δ ||2H2 + αdis ||xδαdis ||2H1 = Tαdis (xδαdis )
mit
||Ax̂ −
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
75
gelten dies widerspricht aber der Eigenschaft Tα (xδα ) ≤ Tα (x) fur
alle x ∈ H1 . Umgekehrt ist ubrigens auch jede Losung des restringierten
Extremalproblems (17) eine regularisierte Losung.
#
dis
•
dis
dis
Wenn der Regularisierungsparameter uber das Diskrepanzprinzip bestimmt wird, so minimiert jede nach Tikhonov regularisierte Losung
xδα das Sympathiefunktional Ω(x) = ||x||H unter allen mit den Daten
vertraglichen Elementen x ∈ H1 , das sind diejenigen mit ||Ax−yδ ||H ≤ δ.
Die Tikhonov-Regularisierung erzwingt also nicht nur Naherungslosungen, die stabil von den Daten abhangen, sondern sie beeinusst auch
die Eigenschaften der Naherungslosung zielgerichtet. Insbesondere ist
eine regularisierte Losung xδα mit ||xδα ||H = K auch Losung des Extremalproblems
1
dis
2
0
1
0
||Ax − y δ ||H2 = min!
x ∈ H1 , ||x||H1 ≤ K.
Die regularisierten L
osungen haben also minimale Defektnormen, wenn bei
einer solchen Minimierung nur Elemente aus einer Kugel im Hilbert-Raum
H1
mit festem Radius
K>0
zugelassen werden.
2.5. Prinzip der Quasioptimalität. Dies ist ein weiteres Verfahren zur a po-
steriori Wahl des Regularisierungsparameters bei der Tikhonov-Regularisierung. Aus
der Gleichung
(A∗ A + αI)
dxδα
= −xδα
dα
fur das Ableitungselement erhalt man die Beziehung
α
dxδα
= −α(A∗ A + αI)−1 xδα .
dα
Die Wahl von αqo als Losung des Extremalproblems
dxδα ξ(α) := α
dα → min!,
α > 0,
H1
wird nun motiviert durch die auf der Neumannschen Reihe beruhenden und fur
y ∈ R(A) g
ultigen Gleichung
+
∗
−1
A y = xα + α(A A + αI) xα +
∞
X
αj (A∗ A + αI)−j xα ,
j=2
welche unter Vernachlassigung der unendlichen Summe (α ist klein\, αj ist noch
"
viel kleiner\) ohne Berucksichtigung von Datenfehlern die Dierenz ||xα − A+ y||H1
"
klein bleibt, wenn ξ(α) minimiert wird.
76
3. REGULARISIERUNGSMETHODEN
Satz
28. Unter den Voraussetzungen N (A∗ ) = {0} und
||y δ − y||H2 ≤ δ < ||y δ ||H2
ist die Tikhonov-Regularisierung
xδα := (A∗ A + αI)−1 A∗ y δ
mit dem Regularisierungsparameter αdis = αdis (δ, yδ ), die nach dem Diskrepanzprinzip
||Axαdis − y δ ||H2 = δ
ausgewahlt werden, konvergente Regularisierung fur A+ .
Definition
17. Eine Folge (xk )k∈N konvergiert schwach gegen x ∈ X, falls
hxk , x0 i → hx, x0 i
fur alle
x0 ∈ X 0 .
Eine Abbildung A ∈ L(X, Y ) ist schwach stetig, wenn aus
stets folgt Axk * Ax (schwach).
xk * x
(schwach),
Bemerkung
24. Der schwache Grenzwert ist eindeutig bestimmt. Die Norm
Bemerkung
25. Aus der schwachen Konvergenz xk * x und der Normkon-
ist unterhalb stetig bzgl. der schwachen Konvergenz, d.h. aus xk * x (schwach)
in X fur k → ∞ folgt ||x|| ≤ lim
inf ||xk ||. Beweis siehe H.W. Alt, Lineare Funkk→∞
tionalanalysis, Seite 213.
vergenz ||xk || → ||x|| folgt die starke Konvergenz
Raum H gilt
xk → x,
da im reellen Hilbert-
||xk − x||2 = hxk − x, xk − xiH = hxk , xk iH − hxk , xiH − hx, xk i + hx, xi
= ||xk ||2H + ||x||2H − 2hxk , xi → 0
Bemerkung
fur
k → ∞.
26. In Banach-Raumen X, Y ist A genau dann stetig, wenn A
schwach stetig ist. Nachweis uber Satz uber den abgeschlossenen Graphen.
Satz
29. In einem reexiven Raum X besitzt jede beschrankte Folge eine
schwach konvergente Teilfolge.
Beweis: siehe D. Werner, Funktionalanlysis, Seite 107.
Beweis: zu Satz 28: Wir betrachten Folgen δn → 0 und yn := y δn ∈ R(A) f
ur
n → ∞ sowie xn := xαdis (δn , yn ) . Der Satz ist bewiesen, wenn wir zeigen konnen, dass
xn → A+ y gilt.
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
77
Es gilt ||Axn − yn ||H2 = δn und folglich Axn → y fur n → ∞. Weiterhin ist
Tαdis (δn , yn ) (xn ) = ||Axn − yn ||2H2 + αdis (δn , yn )||xn ||2H1
= δn2 + αdis (δn , yn )||xn ||2H1
≤ Tαdis (δn , yn ) (A+ y) = ||y − yn ||2H2 + αdis (δn , yn )||A+ y||2H1
≤ δn2 + αdis (δn , yn )||A+ y||2H1
und damit
||xn ||H1 ≤ ||A+ y||H1
fur alle n.
(18)
Die Elemente xn sind also in H1 beschrankt und folglich gibt es eine schwach konvergente Teilfolge {xnk }k∈N mit xnk * x ∈ H1 . Wegen der schwachen Stetigkeit von
A und der Eindeutigkeit des schwachen Grenzwerts gilt Ax = y. Dies impliziert,
dass A∗ Ax = A∗ y, d.h. x lost die Normalgleichung und deshalb ist x = A+ y und
damit insgesamt xn * A+ y. Wegen der Unterhalbstetigkeit der Norm bei schwacher
Konvergenz folgt auerdem
||A+ y||H1 ≤ lim inf ||xn ||H1 ≤ lim sup ||xn ||H1 (18)
||A+ y||H1
≤
n→∞
n→∞
Damit ist die Normkonvergenz ||xn ||H1 → ||A+ y||H1 nachgewiesen und letztlich die
starke Konvergenz xn → A+ y.
#
Durch die Verwendung von Quelldarstellungen lassen sich Konvergenzraten erreichen, es gilt
Satz
30. Unter den Voraussetzungen von Satz 28 gibt es eine Konstante
so dass die auf der Grundlage des Diskrepanzprinzips gewonnenen regularisierten Losungen xδα mit αdis = αdis (δ, yδ ) der Abschatzung
C > 0,
dis
√
||xδαdis − A+ y||H1 ≤ C δ,
genugen, falls die verallgemeinerte Losung
stellung besitzt:
A+ y = A∗ w,
A+ y
die folgende Quelldar-
w ∈ H2 .
Beweis: Im Beweis von Satz 28 ergab sich die Abschatzung: ||xδαdis ||X ≤ ||Ay + ||X .
78
3. REGULARISIERUNGSMETHODEN
Dann gilt
||xδαdis − A+ y||2H1 = hxδαdis − A+ y, xδαdis − A+ yiH1
≤ 2 ||A+ y||2H1
= hxδαdis , xδαdis iH1 − hxδαdis , A+ yiH1 − hA+ y, xδαdis iH1 + hA+ y, A+ yiH1
− hxδαdis , A+ yiH1 = 2hA+ y − xδαdis , A+ yiH1 = 2hA+ y − xδαdis , A∗ wiH1
= 2hA(A+ y − xδαdis ), wiH2 = 2hy − y δ , wiH1 + 2hy δ − Axδαdis , wiH2
≤ 2 ||y − y δ ||H2 ||w||H2 + ||y δ − Axδαdis ||H2 ||w||H2 = 4||w||H2 δ,
p
√
d.h. ||xδαdis − A+ y||H1 ≤ C δ mit C = 2 ||w||H2 . Falls die Operatorgleichung Ax = y
inkorrekt nach Nashed ist, so kann der Regularisierungsfehler
||xδαdis − A+ y||H1 des
√
Diskrepanzprinzips fur δ → 0 auch nicht schneller als δ gegen Null streben. Jedoch
gibt es Quelldarstellungen, die eine a priori Parameterwahl α = α(δ) ermoglichen, so
dass sich der Regeularisierungsfehler proportional zu δ 2/3 verhalt.
Satz
31. Es seien c und C positive Konstanten. Dann erhalt man fur
die a priori Parameterwahl α = α(δ) = cδ2/3 eine Abschatzung
||xδαdis − A+ y||H1 ≤ Cδ 2/3
des Regularisierungsfehlers, wenn die verallgemeinerte Losung
ner Quelldarstellung
A+ y = A∗ Av,
A+ y
ei-
v ∈ H1
genugt.
Beweis: Wie wir bereits gesehen hatten, ist die Norm des Operators (A∗ A+αI)−1 A∗ A
kleiner gleich 1. Dann folgt
Rα y − A+ y = (A∗ A + αI)−1 A∗ A(A+ y) − A+ y
= −α(A∗ A + αI)−1 (A+ y) = −α(A∗ A + αI)−1 A∗ Av
und damit
||Rα y − A+ y||H1 ≤ α||v||H1 .
Fur den Regularisierungsfehler erhalten wir deshalb
||xδα − A+ y||H1 ≤ ||Rα ||L(H2 , H1 ) δ + ||Rα y − A+ y||H1
1
≤ ||Rα ||L(H2 , H1 ) δ + α||v||H1 ≤ √ δ + α||v||H1 ,
2 α
da ||Rα ||L(H2 , H1 ) ≤
1
√
δ
2 α
nach Folgerung 5. Mit α(δ) = cδ 2/3 ergibt sich
||xδα − A+ y||H1 ≤ Cδ 2/3 ,
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
wobei C =
1
√
2 c
+ c||v||H1 ist.
Bemerkung
79
#
27. Es gilt auch ein sogenanntes Sättigungsprinzip, das be-
sagt, dass fur nach Nashed inkorrekte lineare Operatorgleichungen keine a priori
Parameterwahl exisitert, so dass der Fehler der Tikhonov-Regularisierung fur
δ → 0 schneller als δ 2/3 gegen die verallgemeinerte L
osung A+ y 6= 0 konvergiert.
2.6. Weitere Regularisierungsmethoden. Dies sind z.B. iterative Methoden
wie die
2.6.1. Landweber-Iteration. Wir gehen von der Normalgleichung A∗ Ax = A∗ y
aus und multiplizieren sie mit einem positiven Faktor ω und schreiben die Normalengleichung neu als x = x + ω(A∗ y − A∗ Ax). Die impliziert die folgende Iterationsvorschrift:
Landweber-Iteration. Man bestimme die Losung der Fixpunktgleichung
x = x + ω(A∗ y − A∗ Ax)
durch die Iteration:
xn+1 = (I − ωA∗ A)xn + ωA∗ y δ ,
x0 = 0,
wobei 0 < ω <
2
||A||2L(H
1 , H2 )
N ≥ n ≥ 0,
(19)
ist.
Durch Induktion erhalt man fur die n-te Iterierte die Darstellung:
xn =
n−1
X
(I − ωA∗ A)i ωA∗ y δ ,
n = 1, 2, . . . .
i=0
(Aus x0 = folgt x1 = ωA∗ y δ folgt x2 = (I − ωA∗ A)ωA∗ y δ + ωA∗ y δ usw. usf.) Wir
untersuchen die Konvergenz des Verfahrens. Wir betrachten zunachst den Fall y δ ∈
D(A+ ) = R(A)⊕R(A)⊥ . In diesem Fall ist die Normalgleichung losbar mit der Losung
A+ y δ . Dann gilt wegen
n−1
X
(I − ωA∗ A)i ωA∗ A = I − (I − ωA∗ A)n
i=0
(Hinweis: Es gilt an − bn = (a − b)
n−1
P
!
an−1−j bj
j=0
1 − (1 − x)n = 1n − (1 − x)n = (1 − (1 − x))
n−1
X
j=0
und damit ist
!
1n−1−j (1 − x)j
=
n−1
X
j=0
(1 − x)j x.)
80
3. REGULARISIERUNGSMETHODEN
die Beziehung
+ δ
+ δ
A y − xn = A y −
n−1
X
∗
∗ δ
i
+ δ
n−1
X
∗
i=0
+ δ
(I − ωA A) ωA y = A y −
i=0
(I − ωA∗ A)i ωA∗ A(A+ y δ )
= (I − I + (I − ωA A) )(A y ) = (I − ωA∗ A)n (A+ y δ )
n
Wir benutzen das singulare System {vj , uj ; µj } mit A∗ Avj = µ2j vj und x ∈ H1 hat
P
die Darstellung x = ∞
k=0 hx, vk iH1 vk . Dann ist
(I−ωA∗ A)
∞
X
!
hx, vk iH1 vk
=
k=0
∞
X
hx, vk iH1 − ωµ2k hx, vk iH1 vk =
(1−ωµ2k )hx, vk iH1 vk
∞
X
k=0
k=0
und damit
∗
m
(I − ωA A) x =
∞
X
(1 − ωµ2k )m hx, vk iH1 vk ,
k=0
wobei die Faktoren (1 −
nur dann gegen Null streben fur m → ∞, wenn
2
ur alle k ∈ N gilt. Es gilt
|1 − ωµk | < 1 f
ωµ2k )m
|1 − ωµ2k | < 1 ⇐⇒ −1 < 1 − ωµ2k < 1 f
ur alle k
⇐⇒ 0 < ω <
2
µ2k
fur alle k ⇐⇒ 0 < ω <
2
2
=
.
2
2
µ1
||A||L(H1 ,H2 )
Somit erhalten wir insgesamt
||A+ y δ −xn ||H1 = ||(I−ωA∗ A)n (A+ y δ )||H1 ≤ ||(I−ωA∗ A)n ||L(H1 ,H1 ) ||(A+ y δ )||H1 → 0 f
ur n → ∞.
In diesem Fall konvergiert die Landweber-Iteration gegen das Element A+ y δ , welches
wegen der Unbeschranktheit des Operators A+ auch fur kleine δ > 0 weit von der
tatsachlichen verallgemeinerten Losung A+ y entfernt sein kann.
Was passiert, wenn y δ 6∈ D(A+ ) = R(A)⊕R(A)⊥ ? Sei A dazu ein kompakter Operator
mit dim R(A) = ∞. Dann ist
xn =
∞ X
n−1
X
j=1 i=0
(1 −
ωµ2j )i ωµj hy δ ,
uj iH2 vj =
∞
X
1 − (1 − ωµ2j )n
j=1
µj
hy δ , uj iH2 vj .
Wegen 0 < 1 − ωµ2j < 1 strebt ||xn ||2H1 fur n → ∞ gegen die Reihe
∞
X
hy δ , uj iH2
,
2
µ
j
j=1
die aber gegen ∞ divergiert, weil fur y δ 6∈ D(A+ ) = R(A) ⊕ R(A)⊥ die Picardsche Bedingung (siehe Satz 19) verletzt ist. Es macht also für inkorrekte Probleme keinen Sinn, eine möglichst große Zahl von Schritten der Landweber-Iteration
auszuführen! Wir nehmen deshalb eine endliche Zahl N von Iterationsschritten,
2. EIN ALLGEMEINES REGULARISIERUNGSSCHEMA
81
wobei diese Zahl die Rolle des Regularisierungsparameters ubernimmt, d.h. es sei
α := N1 . Mit
xδα
δ
:= RN y := xN :=
∞
X
1 − (1 − ωµ2j )N
j=1
µj
δ
hy , uj iH2 vj =
∞
X
1 − (1 − ωµ2j )1/α
µj
j=1
hy δ , uj iH2 vj
erhalten wir die Filterfaktoren
1
∈ N und 0 < µj ≤ ||A||L(H1 , H2 ) .
α
Damit gilt oensichtlich 0 < f (α, δ) < 1 und lim f (α, δ) = 1. Auch die 3. Bedingung
f (α, δ) = 1 − (1 − ωµ2j )1/α
fur
α→0
des Satzes 27 fur die Konvergenz des Regularisierungsverfahrens ist erfullt, denn es
gilt
√
1 − (1 − τ )N ≤ τ N f
ur alle N ∈ N und 0 ≤ τ ≤ 1.
Nachweis: Sei zunachst
0 ≤ τ ≤ N1 , dann ergibt die Bernoulli-Ungleichung (1 − τ )N ≥
√
1 − N τ und damit N τ ≥ N τ ≥ 1 − (1 − τ )N . F
ur τ ≥ N1 ist aber trivialerweise
√
√
τ N ≥ 1 und damit 1 ≤ N τ + (1 − τ )N . Mit τ = ωµ2j ergibt sich damit
√ √
N ωµj √
1
ur alle N ∈ N und 0 < ω < 2 .
= ωN f
µj
µj
pω
und C(α) := α die Ungleichung |f (α, δ)| ≤ C(α)µj fur alle µj
1 − (1 − ωµ2j )N
≤
µj
So ist mit α = N1
erfullt. Das heit:
Folgerung
torfamilie
6. Die zur Methode der Landweber-Iteration denierte Opera-
{RN }√N ∈N ist eine
||RN ||L(H1 ,H2 ) ≤ ωN . Sofern
gungen
lineare Regularisierung fur den Operator A+ mit
eine a priori Parameterwahl N = N (δ) die Bedin-
und δ2 N (δ) → 0 fur
erfullt, ist diese Regularisierung auch konvergent.
N (δ) → ∞
Bemerkung
•
•
δ→0
28.
Um eine Konvergenz der regularisierten Losungen xN (δ) gegen A+ y zu
erreichen, muss fur δ → 0 die Zahl der Iterationsschritte zwar ins Unendliche wachsen, dies darf aber wegen δ2 N (δ) → 0 nicht zu schnell
geschehen.
Man kann auch sogenannte heuristische Strategien zur Wahl des Regularisierungsparameters N = α1 verwenden. Vorzugweise verwende man
ein auf Iterationen zugeschnittenes Diskrepanzprinzip. Man wahlt dazu
Ndis f
ur eine gegebene Konstante τ > 1 so, dass
||AxNdis − y δ ||H2 ≤ τ δ < ||AxNdis −1 − y δ ||H2
P
2 2n δ
2
erfullt wird. Da ||Axn − yδ ||2H2 = ∞
ur n →
j=1 (1 − ωσj ) hy , uj iH2 → 0 f
δ
∞ gilt, ist f
ur τ δ < ||y ||H2 der Regularisierungsparameter Ndis immer
eindeutig bestimmt.
82
3. REGULARISIERUNGSMETHODEN
•
•
Die Landweber-Iteration ist im Vergleich zur Tikhonov-Regularisierung
und zur abgebrochenen Singularwertzerlegung mit sehr geringem aufwand zu losen, da weder Operatorgleichungen zu losen noch Eigenelemente bestimmt werden mussen. Auch das Diskrepanzprinzip ist kostengunstig, da es nur die Defektbestimmung der Iterierten von (19)
erfordert.
Wird als Startwert nicht x0 = 0 gewahlt, sondern x0 = f0 ∈ H1 , so wird
A+ y + PN (A) f0 iteriert.
2.6.2. Asymptotische Regularisierung. Hier wird wieder die Normalgleichung
gestort, diesmal aber durch Hinzufugen eines Ableitungsterms, d.h.
Asymptotische Regularisierung. Man sucht die Losung der gewohnlichen
Dierentialgleichung
x0 (t) + A∗ Ax(t) = A∗ y δ
unter der Anfangsbedingung x(0) = 0. Die Losungen dieses Anfangswertproblems sind Elemente x(t), t ≥ 0, des Hilbertraums H1 , deren Variable t als
Zeit interpretiert werden kann.
Fur den kompakten Operator A kann man unter Verwendung eines singularen Systems die Losungen als Reihe in der Form
x(t) =
∞
X
1 − exp(−tµ2j )
µj
j=1
hy δ , uj iH2 vj ,
t ≥ 0,
darstellen. Man sieht sofort, dass es keinen Sinn macht diese Losungen fur groe
Zeiten t zu bestimmen, denn fur t → ∞ strebt ||x(t)||2H1 wieder gegen die Reihe
P∞ hyδ , uj i2H2
. Man wahlt in diesem Fall eine Endzeit T, die hier der Regularisiej=1
µ2j
rungsparameter ist und betrachtet α := T1 . Als Filterfunktionen ergeben sich
f (α, δ) = 1 − exp(−
µ2j
) f
ur
α
α > 0 und alle
µj .
Wegen 0 < f (α, δ) < 1, lim f (α, δ) = 1 und
α→0
µ2 1 − exp − αj
µj
1
≤√
α
(Man betrachte die Funktion exp(−x2 ) fur x ≥ 0, dann kann man mit dem Mittelwertsatz abschatzen:
exp(−x2 ) − exp 0
exp(−x2 ) − 1
−2ξ
=
= −2ξ exp(−ξ 2 ) =
x−0
x
exp(ξ 2 )
3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN
83
und damit
1 − exp(−x2 ) exp(−x2 ) − 1 2ξ
2ξ
2
=
= 2ξ exp(−ξ ) = exp(ξ 2 ) ≤ 1 + ξ 2 ≤ 1.
x
x
Deshalb ist C(α) =
Folgerung
√1
α
und damit alle Bedingungen gema Satz 27 erfullt, somit gilt
7. Die zur Methode der asymptotischen Regularisierung gehori-
ge Operatorfamilie {RT √
}T >0 ist eine lineare Regularisierung f
ur den Operator
+
A mit ||RT ||L(H ,H ) ≤ T . Sofern eine a priori Parameterwahl T = T (δ) die
Bedingungen
T (δ) → ∞ und δ 2 T (δ) → 0 f
ur δ → 0
erfullt, ist diese Regularisierung auch konvergent.
Bemerkung 29. Es gibt einen Zusammenhang zwischen der Landweber-Iteration
und der asymptotischen Regularisierung. "Diskretisiertman namlich die asymptotische Regularisierung mit tn := nω, xn := x(tn ), n = 0, 1, 2, . . . und ersetzt
t )
= x(t ω)−x(t ) , so laudie Ableitung durch den Dierenzenquotienten x(tt )−x
−t
tet der Ansatz der asymptotischen Regularisierung:
1
2
( n
n+1
n+1
n
n
n+1
x(tn+1 ) − x(tn )
+ A∗ Ax(tn ) = A∗ y δ ,
x(t0 ) = 0,
ω
⇐⇒ xn+1 = x(tn+1 ) = x(tn ) + ωA∗ y δ − ωA∗ Ax(tn )
= (I − ωA∗ A)x(tn ) + ωA∗ y δ = (I − ωA∗ A)xn + ωA∗ y δ
also die Landweber-Iteration.
Bemerkung 30. Ein weiteres Standard-Verfahren auf das wir hier nicht eingehen ist die Regularisierung durch endlichdimensionale Approximation.
3. Anwendung der Tikhonov-Regularisierung auf nichtlineare
Operatorgleichungen
Wir betrachten das nichtlineare Identifikationsproblem
F (x) = y,
x ∈ D ⊆ H1 ,
(20)
y ∈ H2 ,
wobei H1 und H2 unendlichdimensionale separable, reelle Hilbert-Raume und F ein
nichtlinearer Operator ist.
3.1. Fréchet-Ableitung. Wir benotigen zunachst ein paar Begrie und Deni-
tionen fur nichtlineare Operatoren.
Definition
Y
18. Seien X und Y normierte Raume, U ⊂ X oen und f : U →
eine Abbildung:
(1) F heit G^ateaux-dierenzierbar bei
Operator T ∈ L(X, Y ) existiert mit
1
lim (F (x0 + hv) − F (x0 )) = T v
h→0 h
x0 ∈ U,
falls ein stetiger linearer
fur alle
v ∈ X.
(21)
84
3. REGULARISIERUNGSMETHODEN
(2) F heit Fréchet-differenzierbar bei x0 ∈ U, falls die Konvergenz in (21)
gleichmaig bezuglich v ∈ {x ∈ X : ||x||X ≤ 1}.
(3) F heit G^ateaux- bzw. Frechet-dierenzierbar auf U, falls
Stelle x0 ∈ U G^ateaux- bzw. Frechet-dierenzierbar ist.
Bemerkung
f
an jeder
31. Man beachte, dass die Ableitung von F an einer Stelle ein
linearer Operator ist, die Ableitung von F als Funktion ist eine operatorwertige
Abbildung F 0 : U → L(X, Y ).
Lemma
9. Mit den Bezeichnungen von Denition 18 ist eine Abbildung F :
U → Y genau dann Fr
echet-dierenzierbar
T ∈ L(X, Y ) existiert mit
F (x0 + u) = F (x0 ) + T u + r(u)
bei x0 ∈ U, falls ein stetiger Operator
mit
r(u)
= 0.
||u||→0 ||u||
lim
In diesem Fall ist F 0 (x0 ) = T.
Diese Aussagen ndet man in D. Werner, Funktionalanalysis, Seite 113.
Beispiel
9. Wir betrachten die Hammersteinsche Integralgleichung
1
mit
2
F : D(F ) = H [0, 1] → L [0, 1]
Z
s
F (x)(s) :=
(s − t)x3 (t) dt.
0
Dann ist F Frechet-dierenzierbar mit
Z
0
(F (x)h)(s) = 3
s
(s − t) x2 (t) h(t) dt.
0
Begrundung: Wenn F Frechet-Dierenzierbar ist, dann ist
dierenzierbar und es gilt
F
auch G^ateaux-
1
d
0
lim (F (x + τ h) − F (x)) = F (x)h =
F (x + τ h)
,
τ →0 τ
dτ
τ =0
fur die Hammersteinsche Integralgleichung heit das
Z s
Z s
d
2
F (x + τ h)
=
(s − t)3(x(t) + τ h(t)) h(t) dt
=3
(s − t)x2 (t) h(t) dt.
dτ
0
0
τ =0
τ =0
Wie man leicht sieht ist F 0 (x) ein linearer Operator. Wir bestimmen F 0 (x)∗
in folgender Weise, wir bestimmen zunachst den L2 -Adjungierten Operator und
dann ergibt sich F 0 (x)∗ daraus durch Anwendung des adjungierten Operators B ∗
zum Einbettungsoperator B : H 1 [0, 1] ,→ L2 [0, 1]. Es ist
0
Z
hF (x)h1 , h2 iL2 =
1
Z
3
0
0
s
Z
2
1
Z
1
(s − t)x (t) h(t) dt h2 (s) ds =
3
(s − t)x2 (t) h(t) h2 (s) ds dt
0
t
Z 1
Z 1
=
h1 (t) 3x2 (t)
(s − t)h2 (s) ds dt = hh1 , (F 0 (x)∗ )L2 h2 iL2
0
t
3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN
85
mit dem L2 -adjungierten Operator
0
∗
1
Z
2
(t − s)h2 (t) dt
(F (x) )L2 (s) = 3x (t)
t
und damit ist
0
∗
(F (x) h)(s) = B
∗
Z
2
3x (t)
1
(t − s)h2 (t) dt .
t
3.2. Parameteridentifikation. Diese nichtlinearen Probleme treten typischer
Weise bei der Parameteridentikation auf, wobei das direkte Problem sehr wohl linear
sein kann, das inverse Problem ist dann trotzdem nichtlinear. Wir wollen das an einem
einfachen Beispiel erlautern:
Beispiel
10. Wir betrachten das Anfangswertproblem
y 0 − ay = f,
y(0) = 2.
Es hat wie man leicht nachrechnet die Losung
at
Z
y(t) = e
t
−as
e
f (s) ds + 2 .
0
. . . ds + 1 = 2 und
Probe: y(0) = e
Z t
Z t
0
at
−as
at −at
at
−as
y − ay = ae
e f (s) ds + 2 + e e f (t) − ae
e f (s) ds + 2 = f (t).
0
R
0
0
0
0
Wir untersuchen nun das inverse Problem, d.h. wir wollen aus der Kenntnis
der Losung den unbekannten Parameter a bestimmen. D.h. wir mussen die
nichtlineare Operatorgleichung
F (a) = y,
mit
at
Z
(F (a))(t) = e
t
−as
e
f (s) ds + 2 = y(t),
t ≥ 0,
0
losen. Das Problem ist inkorrekt gestellt. Das sieht man daran, dass fur f (t) = 1
und die Losungen yn (t) = n1 sin(nt) + 2 stets ein Parameter an (t) existiert fur den
yn (t) L
osung des Anfangswertproblems ist. Wir betrachten also das Anfangswertproblem
y 0 − a(t)y = 1,
y(0) = 2,
und fur yn (t) = n1 sin(nt) + 2 ist yn (0) = 2 und es muss deshalb gelten
n
an (t)
cos(nt) −
sin(nt) − 2an (t) = 1 ⇐⇒ n cos(nt) − an (t) sin(nt) − 2nan (t) = n
n
n
n(cos(nt) − 1)
cos(nt) − 1
.
= ⇐⇒ an (t) (2 sin(nt) + 2n) = n (cos(nt) − 1) ⇐⇒ an (t) =
sin(nt)
2(sin(nt) + n)
2
+1
n
Es konvergiert zwar yn (t) fur n → ∞ gleichmaig in t gegen y(t) = 2, aber an (t)
konvergiert nur fur t = 0.
86
3. REGULARISIERUNGSMETHODEN
3.3. Regularisierung nichtlinearer Operatorgleichungen. Wir betrachten
die nichtlineare Operatorgleichung (20).
3.3.1. Diskretisierung. Die Diskretisierung fuhrt auf ein nichtlineares Gleichungssystem und dieses wird anschlieend regularisiert.
Beispiel
11. Selbstfaltungsgleichung. Wie bekannt, ist die Wahrscheinlich-
keitsdichte y einer Summe vom zwei stochastisch unabhangigen Zufallsgroen
mit den Wahrscheinlichkeitsdichten u und v uber die Faltung
Z
∞
u(s − t)v(t) dt,
y(s) =
−∞ < s < ∞,
−∞
berechenbar. Gilt spezielle u(t) = v(t) = 0 fur t < 0 und x(t) := u(t) = v(t), d.h.,
die beiden summierten Zufallsgroen sind identisch verteilt und nehmen mit
Wahrscheinlichkeit Eins positive Werte an, dann haben wir y(s) = 0 fur s < 0
und
Z s
x(s − t) x(t) dt,
y(s) =
0 ≤ s < ∞.
0
Es sei nun die Funktion y(s) im Einheitsintervall s ∈ [0, 1] bekannt. Davon
ausgehend soll die Dichte Funktion x(t) in eben diesem Intervall rekonstruiert
werden. Dies ist ein nichtlineares Identikationsproblem. Es ist
Z
s
x(s − t)x(t) dt = y(s),
[F (x)](s) :=
0 ≤ s ≤ 1,
0
mit H1 = H2 = L2 (0, 1).
Vorgehensweise:
1) Unterteilen Einheitsintervall [0, 1] in n Teilintervalle Ij := [sj−1 , sj ] mit den
Randpunkten sj := nj , j = 0, 1, 2, . . . und den Mittelpunkten tj := i−n , i =
1
2
1, 2, . . . .
2) Die Integrale
Z
sj
x(sj − t)x(t) dt
y(sj ) =
0
lassen sich mit Hilfe der Rechteckregel unter Verwendung von Funktionswerten
in den Mittelpunkten der Teilintervalle durch die Summen
j
1X
x(sj − ti )x(ti )
n i=1
annahern.
3) Da in L2 (0, 1) Funktionswerte nicht punktweise deniert sind, substituiert
man y(sj ) und auch x(ti ) durch gewichtete Durchschnitte
Z
yj :=
w1 (t)y(t) dt
Ij
bzw.
Z
xi :=
w2 (t)x(t) dt
Ii
3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN
87
mit geeigneten Gewichtsfkt. w1 bzw. w2 mit I w1 (t) dt = I
4) Mit ~x = (x1 , x2 , . . . , xn )T und ~y = (y1 , y2 , . . . , yn )T sowie
R
R
j
i
w2 (t) dt = 1.
j
1X
F (~x) :=
xj+1−i xi ,
n i=1
so lasst sich die inkorrekte nichtlineare Integralgleichung durch das entsprechende schlechtkonditionierte nichtlineare Gleichungssystem
F (~x) = ~y ,
~x ∈ D ⊆ Rn ,
(22)
~y ∈ Rn
annahern, wobei
D := {~x ∈ Rn : xi ≥ 0, i = 1, 2, . . . , n}
als Denitionsbereich betrachtet werden soll, um negative Losungen auszuschlieen.
5) Die auf der Losung des nichtlinearen Optimierungsproblems
Tα (x) := ||F (~x) − ~y δ ||2H2 + α||~x − ~x∗ ||2H1 = min!,
x ∈ D,
beruhende Tikhonov-Regularisierung liefert dann fur einen Referenzvektor
und genugend groes α > 0 wieder stabile Naherungslosungen ~xδα von (22).
~x∗
3.3.2. Levenberg-Marquardt-Methode. Wir betrachten wieder die nichtlineare
Operatorgleichung (20):
F (x) = y,
x ∈ D ⊆ H1 ,
y ∈ H2 ,
wobei die rechte Seite nur bis auf das Fehlerniveau δ > 0 bekannt ist, d.h. ||y−y δ ||H2 ≤
δ. Wir suchen deshalb ein Element a∗ ∈ H1 , das ||F (x) − y||H2 minimiert.
Vorgehensweise:
1) Als Startwert a0 ∈ D(F ) wird ein beliebiges zulassiges Element aus dem Denitonsbereich von F gewahlt und das direkte Problem
F (a0 ) = y0
gelost.
2) Nun wird uberpruft, wie nahe y0 an y δ ist. Ist F Frechet-dierenzierbar, so gilt
F (a0 + h) = F (a0 ) + F 0 (a0 )h + r(a0 ; h).
Da F (a0 ) = y0 ist und wir mochten h so wahlen, dass F (a0 + h) = y δ ist, ergibt sich
unter Vernachlassigung des Restglieds:
y δ = y0 + F 0 (a0 )h ⇐⇒ F 0 (a0 )h = y δ − y0 .
88
3. REGULARISIERUNGSMETHODEN
3) Diese Operatorgleichung ist i. Allg. inkorrekt gestellt. Deshalb wird auf diese lineare Operatorgleichung (die Frechet-Ableitung ist ein linearer Operator!) die TikhonovRegularisierung angewandt und somit ist h die Losung der Gleichung:
(F 0 (a0 )∗ F 0 (a0 ) + αI) h = F 0 (a0 )∗ (y δ − y0 ).
4) Nun wird a0 +h als neues a0 verwendet und mit Schritt 2) weitergemacht bis F (a0 )
nahe genug an y δ herankommt.
Bemerkung
32. Anstelle der Tikhonov-Regularisierung kann auch die Landweber-
Iteration verwendet werden, d.h.
aδn := aδn−1 + F 0 (aδn−1 )∗ (y δ − F (aδn−1 )), n ∈ N,
mit einem Startwert a0 .
Bemerkung
33. Fur diese Iterationsmethoden gibt es keine globalen Konver-
genzeigenschaften, da das Argument der Frechet-Ableitung sich in jedem Iterationsschritt andert.
3.3.3. Nichtlineare Tikhonov-Regularisierung. Wir suchen die x∗ -Minimum-NormLosung der Operatorgleichung F (x) = y zu einem gegebenen Referenzelement x∗ ∈
H1 . Die nach Tikhonov regularisierten Losungen xδα ∈ D werden dabei ausgehend
von den gestorten Daten y δ ∈ H2 mit
||y δ − y||H2 ≤ δ
als Losungen des regularisierten nichtlinearen Extremalproblems
Tα (x) := ||F (x) − y δ ||2H2 + α||x − x∗ ||2H1 = min!,
x ∈ D,
(23)
zu einem positiven Regularisierungsparameter α > 0 konstruiert.
Voraussetzungen:
(1) Der Denitionsbereich D ⊆ H1 sei konvex.
(2) Der nichtlineare Operator F : D ⊆ H1 → H2 sei stetig und schwach abgeschlossen. Auerdem besitze F f
ur alle x ∈ D eine Fréchet-Ableitung
F 0 (x).
(3) Zur exakten rechten Seite y ∈ H2 existiere wenigstens ein x0 ∈ H1 mit
F (x0 ) = y.
Definition
19. Ein nichtlinearer Operator F : H1 k D → H2 , heit schwach
abgeschlossen, wenn f
ur {xn } ⊂ D die schwache Konvergenz der Folgen xn * x0
in H1 und F (xn ) * y0 in H2 die Beziehungen x0 ∈ D und F (x0 ) = y0 nach sich
ziehen.
Es gilt insbesondere:
3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN
89
Lemma
10. Es sei F : H1 k D → H2 ein auf der oenen Menge S ⊆ D
kompakter Operator, die im Punkt x0 ∈ S Frechet-dierenzierbar ist. Dann stellt
die Frechet-Ableitung F 0 (x0 ) ∈ L(H1 , H2 ) ebenfalls einen kompakten Operator
dar.
Wir kommen nun zum regularisierten nichtlinearen Extremalproblem zuruck:
Lemma
11. Unter den formulierten Voraussetzungen besitzt das regularisierte
nichtlineare Extremalproblem (23) fur alle
Losung xδα ∈ D.
y δ ∈ H2
und
α>0
wenigstens eine
Beweis: Man bilde eine Folge {xn } ⊂ D, so dass Tα (xn ) ≤ inf Tα (x) + ηn und
x∈D
limn→∞ ηn = 0, dann sind auch die Folgen
{||F (xn ) − y δ ||2H2 } und {||xn − x∗ ||2H1 }
sowie wegen ||F (xn )||H2 − ||y δ ||H2 ≤ ||F (xn ) − y δ ||H2 auch
{||F (xn )||H2 }
und {||xn ||H1 }
beschrankte Folgen. Deshalb gibt es eine schwach konvergente Teilfolge xnk * x ∈ D
mit F (xnk ) → y. Wegen der schwachen Abgeschlossenheit von F gilt y = F (x) und
damit
||x − x∗ ||H1 ≤ lim inf ||xnk − x∗ ||H1
k→∞
und
||F (x) − y δ ||H2 ≤ lim inf ||F (xnk ) − y δ ||H2 .
k→∞
Wegen
Tα (x) ≤ lim inf Tα (xn ) = inf Tα (x)
k→∞
x∈D
ist dann x = xδα eine Losung des Extremalproblems.
#
Analog zeigt man die Stabilitat der regularisierten Losungen xδα bezuglich kleiner
Storungen in den Daten: Gilt y δn → y δ0 in H2 , so gibt es in der Folge regularisierter
Losungen xδαn eine in H1 konvergente Teilfolge, und das Grenzelement jeder solchen
konvergenten Teilfolge ist eine regularisierte Losung xδα0 .
90
3. REGULARISIERUNGSMETHODEN
Satz
dass
32. Die Regularisierungsparameter α = α(δ) seien derart gewahlt,
δ2
→ 0 f
ur δ → 0
und
α(δ)
gilt. Dann hat unter den formulierten Voraussetzungen an F fur δn → 0
jede Folge xδα von Losungen des regularisierten Extremalproblems
α(δ) → 0
n
n
Tα (x) := ||F (x) − y δ ||2H2 + α||x − x∗ ||2H1 = min!,
x ∈ D,
mit δ := δn , ||yδ − y||H ≤ δn , und α := αn = αn (δn ) eine in H1 konvergente Teilfolge, deren Grenzelement eine x∗ -Minimum-Norm-Losung der
Operatorgleichung F (x) = y darstellt.
n
2
Beweis: Es sei xmn eine x∗ -Minimum-Norm-Losung von F (x) = y. Dann gilt f
ur die
δn
Elemente der Folge {xαn } regularisierter Losungen die Ungleichung:
Tαn xδαnn = ||F xδαnn − y δn ||2H2 + αn ||xδαnn − x∗ ||2H1 ≤
n
n
Tαn (xmn ) = ||F xδmn
− y δn ||2H2 + αn ||xδmn
− x∗ ||2H1 ≤ δn2 + αn ||xmn − x∗ ||2H1 ,
δn
} in H2 be{F
x
dann ist die Folge {F xδαnn − y δn } und mehr noch die Folge
α
n
δnk
schrankt, d.h. es gibt eine schwach konvergente Teilfolge F xαnk * y und wegen
der Eindeutigkeit
des schwachen Grenzwerts y = y. Insgesamt erhalt man daraus,
δnk
dass F xαnk * y und
||F xδαn − y||H2 − ||y − y δn ||H2 2 ≤ ||F xδαn − y δn ||2H ≤ δn2 + αn ||xmn − x∗ ||2H
n
n
2
1
also
q
||F xδαnn − y||H2 ≤ δn2 + αn ||xmn − x∗ ||2H1 + δn → 0
fur n → ∞, also die schwache und Normkonvergenz und damit die Konvergenz
F xδαnn → y
fur n → ∞.
Aus
αn ||xδαnn
−
und lim
x∗ ||2H1
2
δn
α
n→∞ n
≤
δn2
+ αn ||xmn −
x∗ ||2H1
⇐⇒
||xδαnn
−
x∗ ||2H1
δn2
≤
+ ||xmn − x∗ ||2H1
αn
= 0 f
ur n → ∞ gilt
lim sup ||xδαnn − x∗ ||H1 ≤ ||xmn − x∗ ||H1 .
n→∞
Da nun {xδαnn } beschrankt ist, haben wir eine schwach konvergente Teilfolge xαnnkk *
x ∈ D f
ur k → ∞. Die schwache Abgeschlossenheit von F liefert dann F (x) = y.
δ
3. ANWENDUNG DER TIKHONOV-REGULARISIERUNG AUF NICHTLINEARE OPERATORGLEICHUNGEN
91
Wegen xαnnkk − x∗ * x − x∗ ist
δ
δn
δn
||x − x∗ ||H1 ≤ lim inf ||xαnkk − x∗ ||H1 ≤ lim sup ||xαnkk − x∗ ||H1 ≤ ||xmn − x∗ ||H1
k→∞
k→∞
und somit x selbst x∗ -Minimum-Norm-Losung ist. (Im Allgemeinen ist x 6= xmn ! )
#
Wie im Fall der linearen Tikhonov-Regularisierung lassen sich Konvergenzraten nur
durch Quelldarstellungen erreichen. Es gilt
Satz
33. Es sei xmn eine x∗ -Minimum-Norm-Losung der nichtlinearen
Operatorgleichung (20) mit
fur alle x ∈ D.
Dann gilt unter den formulierten Voraussetzungen an den Operator F
fur eine a priori Parameterwahl α = α(δ) ∼ δ, d.h. es gibt c1 , c2 > 0 mit
c1 δ ≤ α(δ) ≤ c2 δ, f
ur alle betrachteten δ > 0, die Fehlerabschatzung
||F 0 (x) − F 0 (xmn )||L(H1 , H2 ) ≤ L||x − xmn ||H1
(24)
√
||xδα − xmn ||H1 ≤ C δ
fur eine Konstante C > 0, falls xmn eine Quelldarstellung der Gestalt
xmn − x∗ = F 0 (xmn )∗ w,
w ∈ H2
(25)
mit
(26)
L||w||H2 < 1
erfullt.
Beweis: Zunachst gilt wiederum
Tα (xδα ) = ||F (xδα ) − y δ ||2H2 + α||xδα − x∗ ||2H1 ≤ Tα (xmn ) ≤ δ 2 + α||xmn − x∗ ||2H1 ,
welche
||F (xδα ) − y δ ||2H2 + α||xδα − xmn ||2H1 =
= ||F (xδα ) − y δ ||2H2 + α||xδα − x∗ ||2H1 −α||xδα − x∗ ||2H1 + α||xδα − xmn ||2H1 ≤
≤ δ 2 + α ||xmn − x∗ ||2H1 + ||xδα − xmn ||2H1 − ||xδα − x∗ ||2H1 = δ 2 + 2αhxmn − x∗ , xmn − xα δiH2
nach sich zieht. Wegen (24) und der Taylorreihenentwicklung F (xδα ) = F (xmn ) +
F 0 (xmn )(xα − xmn ) + rαδ (xδα , xmn ) gilt ||rαδ ||H2 ≤ L2 ||xδα − xmn ||2H1 also
||F (xδα − F (xmn ) − F 0 (xmn )(xδα − xmn )||H2 ≤
L
||xα − xmn ||2H1 .
2
(grobe Begrundung: Sei f einfach eine Funktion, dann ist die Taylorreihe
f (xδα ) = f (xmn ) + f 0 (xmn )(xα − xmn ) + rαδ (xδα , xmn ),
92
3. REGULARISIERUNGSMETHODEN
wobei das Restglied
1
rαδ = f 00 (ξ)(xδα − xmn )
2
Dann kann man approximieren:
1 00
1 f 0 (ξ) − f 0 (xmn ) δ
L
f (ξ)(xδα − xmn )2 ∼
(xα − xmn )2 / |xδα − xmn |2 .
2
2
ξ − xmn
2
Damit folgt unter Berucksichtigung der Quelldarstellung (25)
||F (xδα ) − y δ ||2H2 + α||xδα − xmn ||2H1 ≤ δ 2 + 2αhw, F 0 (xmn )(xmn − xδα )iH2 ≤
δ 2 + 2αhw, (y − y δ ) + (y δ − F (xδα )) + (F (xδα )−F (xmn ) − F 0 (xmn )(xδα − xmn ))iH2 ≤
δ 2 + 2αδ||w||H2 + 2α||w||H2 ||F (xδα ) − y δ ||H2 + αL||xδα − xmn ||2H1 .
Dies wiederum liefert die Ungleichung
(||F (xδα ) − y δ ||H2 − α||w||H2 )2 + α(1 − L||w||H2 )||xδα − xmn ||2H1 ≤ (δ + α||w||H1 )2
und schlielich wegen (26)
δ + α||w||H2
||xδα − xmn ||H1 ≤ √ p
.
α 1 − L||w||H2
Hieraus erhalt man mit c1 δ ≤ α ≤ c2 δ die Abschatzung
√
√
δ(1 + c2 ||w||H2 )
≤ C δ.
||xδα − xmn ||H1 ≤ √ p
c1 1 − L||w||H2
#
Bemerkung

34. Aus obigen Uberlegungen
wird auch deutlich, dass wenn die
Voraussetzungen des Satzes erfullt sind, es nur eine x∗ -Minimum-Norm-Losung
xmn der Operatorgleichung F (x) = y geben kann.
Zugehörige Unterlagen
Herunterladen