1 Allgemeine Angaben - Universität Paderborn

Werbung
1
Allgemeine Angaben
Fortsetzungsantrag auf Gewährung einer Sachbeihilfe
1.1
Antragsteller
Martin Ziegler, Dr.rer.nat. (Dipl.-Math. Dipl.-Phys.)
wiss. Angestellter (derzeit bis 30.4.2008)
Geburtstag: 19.11.1968, Nationalität: deutsch
Geschäftszeichen des Vorantrags: Zi 1009/1-1
Fakultät V (Elektrotechnik, Informatik und Mathematik)
Universität Paderborn
Warburger Str. 100, 33095 Paderborn
Telefon: 05251/60-3067
Fax: 05251/60-6482
Email: [email protected]
Privat: Franziskanermauer 22, 33098 Paderborn, 05251/8785870
1.2
Thema
Real Hypercomputation:
Berechenbarkeitstheorie reeller Funktionen jenseits der Church-Turing Hypothese
1.3
Kennwort
Real Hypercomputation
1.4
Fachgebiet und Arbeitsrichtung
Theoretische Informatik, Berechenbarkeitstheorie und Rechenmodelle über reellen
Zahlen
1.5
Voraussichtliche Gesamtdauer
Das Vorhaben läuft und wird von der DFG gefördert seit Oktober 2005. Diese Förderung erstreckt sich, inklusive einer mit der DFG abgestimmten Aussetzung (April
2006 bis einschliesslich Oktober 2006 zur Wahrnehmung eines fremdfinanzierten
Aufenthalts am Japan Advanced Institute of Science and Technology), bis derzeit
Ende April 2008. Das Projekt soll noch bis April 2009 laufen; für diese weiteren 12
Monate beantrage ich hiermit Förderung durch die DFG.
1.6
Antragszeitraum
1.5.2008 – 30.4.2009
Das Schreiben der bisherigen Bewilligung ist datiert vom 18.5.2005. Die darin bewilligten Personal- und Sachmittel reichen voraussichtlich bis Ende April 2008.
1.7
Zusammenfassung
Bei Real Hypercomputation handelt es sich um die Synthese zweier moderner Forschungsgebiete: der Theorie des Rechnens über und mit reellen Zahlen einerseits,
andererseits der Entwicklung und Analyse von (diskreten) Rechenmodellen jenseits
der Church-Turing Hypothese. (Siehe auch den Abschnitt “Zusammenfassung” des
Erstantrags.)
1
Beispielsweise lassen sich die gängigen Modelle reellen Rechnens durch Orakelzugriff (z.B. auf das Halteproblem) erweitern und, in Analogie zur diskreten Theorie der Turing-Grade, deren jeweilige Fähigkeiten studieren und charakterisieren.
Darüber hinaus – und im wesentlichen Unterschied zum diskreten Fall – ergeben sich
in natürlicher Weise nicht-orakelartige Erweiterungen und so eine außerordentlich
reichhaltige Theorie. Auf der anderen Seite erlauben die so erweiterten Maschinen
einen Vergleich der (ansonsten unvergleichbaren) klassischen reellen Rechenmodelle.
Die Projektverlängerung hat zum einen eine Übertragung der bekannten diskreten Kolmogorov’schen Komplexitätstheorie zum Inhalt; zum anderen soll in der
Rekursiven Analysis der Nutzen beschränkter diskreter (und damit i.d.R. unberehenbarer) Zusatzinformation zu reellen Problemen bestimmt werden. Letzteres
hilft, numerisch instabile Aufgaben zu behandeln und steht überraschenderweise
in Zusammenhang zu ersterem.
2
Stand der Forschung, eigene Vorarbeiten
Grundsätzlich sei auf den entsprechenden Abschnitt des Erstantrags1 verwiesen, so
daß ich im Folgenden die seitdem entstandenen Neuerungen diskutiere.
2.1
Stand der Forschung
Der aktuelle Forschungsstand zum Gebiet Real Hypercomputation mit fremden und
eigenen Arbeiten ist in meiner Habilitationsschrift (Verfahren eröffnet am 10.9.2007)
ausführlich dargestellt [36]; ein kürzerer Überblicksartikel erschien als [33]; beide liegen dem Antrag als Anlage bei. (Literaturreferenzen beziehen sich auf Seiten 5ff. . . )
Zusätzlich ist für das Arbeitsprogramm des vorliegenden Fortsetzungsantrag,
neben dem bereits im Erstantrag angegebenen und den Standardbüchern [BCSS98]
und [Weih00], folgender Stand der Forschung relevant:
2.1.1
Kolmogorov-Komplexität
Ein bekanntes Maß für die Komprimierbarkeit langer Bitstrings x̄ ∈ {0, 1}∗ ist deren Kolmogorov-Komplexität K(x̄) ∈ N; formal: die minimale Beschreibungslänge
|hM i| einer Turingmaschine M , welche x̄ ausgibt und hält [LiVi97]. Wichtige Eigenschaften dieser Größe sind unter anderem:
a) ihre Unabhängigkeit, bis auf additive Konstanten, vom betrachteten Programmiersystem (d.h. der Gödelisierung h · i);
b) die Existenz unkomprimierbarer Instanzen x̄;
c) die Unberechenbarkeit (und sogar Turing-Vollständigkeit) der Funktion x̄ 7→
K(x̄)
d) Anwendungen in der Analyse von Algorithmen und dem Beweis (z.B. unterer)
Laufzeitschranken.
2.1.2
Topologische Komplexität von Funktionen
Der manchmal sogenannte Hauptsatz der Rekursiven Analysis besagt, daß jede berechenbare Funktion f : X → Y notwendig stetig ist; mit anderen Worten: das
Urbild f −1 [V ] ⊆ X einer offenen Menge V ⊆ Y is offen (in X), d.h. gehört zur
1 Dieser und weitere Anlagen wie beispielsweise eigene Publikationen sind verfügbar unter
http://www.upb.de/cs/ag-madh/WWW/ziegler/DFG/
2
Klasse Σ1 der Borel Hierarchie. Um für unstetige Funktionen das Abweichen von
dieser Bedingung zu messen, gibt es verschiedene Ansätze:
a) [Hert96] definiert f als zur d-ten Ebene der Unstetigkeit gehörend, falls der
folgende Prozeß nach d Schritten zur leeren Menge führt: Bilde die Teilmenge
X1 ⊆ X aller Unstetigkeitspunkte von f = f |X , dann die Menge X2 ⊆ X1
aller Unstetigkeitspunkte von f |X1 etc.
b) Borel-d-Meßbarkeit bedeutet, daß f −1 [V ] ⊆ X zur Klasse Σd gehört für jedes
offene V ⊆ Y ; vgl. [Brat05].
c) Weitere topologische Hierarchien wie Wadge etc. [Seli06]
2.1.3
Nichtuniform-berechenbare Analysis
Der o.g. Hauptsatz der Rekursiven Analysis schließt zahlreiche praktische Funktionen f (ebenso Funktionale und Operatoren) von der Berechenbarkeit alleine deshalb
aus, weil sie unstetig sind: Berechenbare Argumente x werden dennoch auf berechenbare Werte f (x) abgebildet, d.h. nichtuniform ist ein solches f berechenbar.
Konkrete und praxisrelevante Beispiele für letzteres sind wohlbekannt, z.B. in der
effektiven Funktionalanalysis [PERi89, First Main Theorem] oder [Brat03]. Andererseits ist hier der Grad2 der Nichtuniformität unbeschränkt.
2.1.4
Bibliotheken/Programme für exaktes reelles Rechnen
Gleitkommazahlen werden in den Genauigkeitsformaten float und double (und
ggf. noch ein weiteres) von gängiger Hardware unterstützt. Darüberhinausgehende
Mantissenlängen simulieren Bibliotheken wie MPFR oder GMP. In Verbindung mit
Intervall-Arithmetik erreicht man so jede gewünschte Ausgabepräzision — wenn nur
die Zwischenoperationen in hinreichend hoher Genauigkeit durchgeführt werden:
diese adaptiv zu bestimmen erfordert weitere Software. Für das Rechnen auf rationalen und algebraischen Zahlen sind hier primär LEDA [BKM*95] und Core [KLPY99]
zu nennen; sie nutzen sogenannte root bounds algorithmisch aus [BFMS00] und sind
sehr nützlich in der Algorithmischen Geometrie.
Basierend auf dem der Rekursiven Analysis zugrunde liegenden Rechenmodell
[BrHe98] können iRRAM [Muel01] und RealLib [Lamb05] auch transzendente Daten effizient verarbeiten. Ariadne [Coll07] soll sich besonders für dynamische Systeme (z.B. Approximation invarianter Mengen) eignen, MmxLib [vdHo06] legt den
Schwerpunkt auf das Lösen von Differentialgleichungen.
2.2
Eigene Vorarbeiten / Arbeitsbericht
Der aktuelle Forschungsstand zum Gebiet Real Hypercomputation mit fremden und
eigenen Arbeiten ist in meiner Habilitationsschrift (Verfahren eröffnet am 10.9.2007)
ausführlich dargestellt [36]; ein kürzerer Überblicksartikel erschien als [33].
Primäre Modelle reellen Rechnens sind die BCSS-Maschine (arithmetische Operationen und Vergleiche, exakt) und das der Rekursive Analysis (Approximation
durch rationale Folgen auf der Turing-, d.h. Typ-2 Maschine). Entsprechend fallen
die meisten Arbeiten zu reellen Hypercomputern in zwei Klassen: Erweiterungen des
einen (siehe Abschnitt 2.2.1) oder des anderen (siehe Abschnitte 2.2.2 und 2.2.3)
Modells.
Ein Vergleich der jeweils induzierten Arithmetischen Hierarchien (d.h. iterierten
Halte-Orakeln, vgl. Abschnitte 3.2.1 und 3.2.6 laut Arbeitsprogramm des Erstantrags) wird in [33] unternommen. [36, Kapitel 6] vergleicht u.a. die Mächtigkeit der
2 in
einem hier intuitiv gemeinten und in Abschnitt 3.2.13 präzisierten Sinn
3
(nicht-erweiterten sondern, um Trivialitäten zu vermeiden – vgl. Abschnitt 3.2.5
im Arbeitsprogramm des Vorantrags – sogar eingeschränkten) BCSS-Maschine mit
jenen einer Orakel Typ-2 Maschine. Als Synthese beider erweisen sich die sogenannten robust quasi-starken δ–Q–Analytischen Maschinen nach Chadzelek und
Hotz.
2.2.1
Eigene Vorarbeiten für das BCSS-Modell
Wie im diskreten Fall kommt es auch im Reellen vor, daß Unentscheidbarkeit ohne
Vollständigkeit (im Sinne von Reduzierbarkeit vom anstatt auf das Halteproblem)
einhergeht [24, 29]; vgl. Abschnitt 3.2.11 im Arbeitsprogramm des Erstantrags.
Anders als bei Turingmaschinen scheint diese Antwort von Posts Problem im BCSSFall jedoch sozusagen dermaßen ‘die Regel’ zu sein, daß man sich schon gehörig
anstrengen muß, um eine (‘natürliche’) BCSS-vollständige reelle Sprache zu konstruieren [34]; siehe auch [36, Kapitel 5.5].
[27] und [36, Kapitel 2.3.4] befassen sich mit genauer mit dem Mächtigkeitsgewinn, den zusätzliche reelle Konstanten einer BCSS-Maschine verschaffen. Beispielsweise erfordert die Äquivalenz zwischen Aufzählbarkeit und Semi-Entscheidbarkeit im
allgemeinen eine zusätzliche solche Konstante. Diese Überlegungen verallgemeinert
[36, Kapitel 5.2] auf Orakelmaschinen und insbesondere [36, Kapitel 5.4] auf
die Arithmetische BCSS-Hierarchie. Überraschenderweise gibt es hier (zugegebenermaßen artifizielle) Orakel, relativ zu denen Aufzählbarkeit nicht Entscheidbarkeit
impliziert, egal wie viele zusätzliche Konstanten man spendiert (Abschnitte 3.2.5
und 3.2.6 im Arbeitsprogramm des Vorantrags). Die (deterministische) Arithmetische BCSS-Hierarchie steht in engem Zusammenhang zur klassischen Borel-Hierarchie
topologischer Räume, wohingegen die von nichtdeterministischen BCSS-Maschinen
induzierte Hierarchie (vgl. Abschnitt 3.2.9 im Arbeitsprogramm des Erstrantrags)
in der projektiven Hierarchie leben [Cuck92].
2.2.2
Eigene Vorarbeiten in Rekursiver Analysis
Jede im Sinne der Rekursiven Analysis berechenbare Funktion ist notwendig stetig (“Hauptsatz”). Meine Arbeiten untersuchen verschiedene Ansätze, diese Einschränkung durch ‘Hypercomputation’ zu überwinden. Hierbei erweisen sich Orakelmaschinen als zu schwach [26], da der o.g. Hauptsatz aus rein informationstheoretischen Argumenten folgt. Erst
• eine Relaxierung des Approximationsbegriffs (z.B. von ‘mit’ zu ‘ohne Fehlerschranken’)
macht gewisse unstetige Funktionen berechenbar — ist allerdings nicht abgeschlossen unter Komposition. Dies hingegen gewährleisten nicht-deterministische Typ-2
Maschinen [28]; vgl. Abschnitt 3.2.2 im Arbeitsprogramm des Erstantrags. (Solche sind also, anders als im diskreten Fall, wesentlich mächtiger als deterministische.)
Die o.g. Relaxierung des Approximationsbegriffs läßt sich gemäß [30] interessanterweise äquivalent auch verstehen als
• informationstheoretische Variante des Halte-Orakels
oder als
• “Revising Computation” á la [Gold65, Putn65, Burg04, Schm02],
oder als
• Algorithmen für (unendliche) Datenströmen im sog. “Turnstile model ” [Muth05];
vergleiche [36, Kapitel 4.4]. Dies erlaubt [30] eine Charakterisierung der so hyperberechenbaren Funktionen in Termen effektiver Borel-Meßbarkeit [Brat05].
4
2.2.3
Realistische Hyperberechenbarkeit unstetiger Funktionen
Die Realisierbarkeit sowohl von nichtdeterministischen Maschinen wie auch von
Halte-Orakeln ist derzeit zumindest fraglich. Erheblich praxisrelevanter hingegen
ist der Ansatz, den die Arbeiten [18, 21, 32] verfolgen: nämlich die Einschränkung
der betrachteten Funktion f auf Teilbereiche Zi ⊆ dom(f ), auf welchen sie stetig
ist. [21] beispielsweise erlaubt die Einschränkung f |Z eines unstetigen Problems
f : R2 → N aus der algorithmischen Geometrie, um es so berechenbar—dafür
jedoch partiell zu machen.
Oder [18, Abschnitt 3.3] beweist formal, was die numerische Erfahrung schon
lange beobachtet: daß die Diagonalisierung symmetrischer Matrizen (Spektralsatz)
im Allgemeinen nicht berechenbar, bei Einschränkung auf nichtdegenerierte Eigenwerte (d.h. Multiplizität jeweils 1) jedoch schon. Ganz interessant: für Berechenbarkeit genügt es zu wissen, wie viele verschiedene Eigenwerte die gegebene Matrix
A ∈ Rn×n besitzt. [32, Abschnitt 5] gibt weitere Beispiele für natürliche unstetige
Probleme, welche nicht-uniform (d.h. für jedes einzelne Zi ) berechenbar werden.
2.2.4
Rapid Numerical Prototyping und empirische Stabilitätsanalyse
Auch hierfür, d.h. zusätzlich zu den in Abschnitt 2.1.4 angegebenen Anwendungsgebieten, eignen sich Systeme für exaktes reelles Rechnen (genauer: mit automatischer, Ausgabe-orientierter Genauigkeitsanpassung): Man implementiert fluchs den
interessierenden Algorithmus und läßt für relevante Beispieleingaben das Programm
selbst feststellen, welche Rechengenauigkeit es benötigt. Mittels der o.g. iRRAM hat
dies mein Student Sven Köhler in seiner Diplomarbeit [35] für die FFT-basierte
schnelle Polynommehrfachauswertung durchgeführt.
Eigene Publikationen3
[18] M. Ziegler, V. Brattka: “Computability in linear algebra”, S.187-211 in
Theoretical Computer Science Bd.326 (2004).
[19] C. Schindelhauer, K. Volbert, M. Ziegler: “Spanners, Weak Spanners,
and Power Spanners”, S.805-821 in Proc. 15th Annual International Symposium
on Algorithms and Computation (ISAAC’04), Springer LNCS Bd.3341.
[20] M. Ziegler, B. Fuchssteiner: “Nonlinear Reformulation of Heisenberg’s
Dynamics”, S.693-717 im International Journal of Theoretical Physics (IJTP)
Bd.44:7 (2005).
[21] M. Ziegler: “Stability versus Speed in a Computable Algebraic Model”, in
Proc. 5th Conference on Real Numbers and Computers (RNC5, 2003);
Vollversion: S.14-26 in Theoretical Computer Science Bd.351 (2006).
[22] M. Ziegler: “Effectively Open Real Functions”, S.827–849 im Journal of
Complexity Bd.22 (2006).
[23] M. Ziegler: “Computational Power of Infinite Quantum Parallelism”, S.20572071 im International Journal of Theoretical Physics (IJTP) Bd.44:11 (2005).
[24] K. Meer, M. Ziegler: “An Explicit Solution to Post’s Problem over the
Reals”, S.456-467 in Proc. 15th International Symposium on Fundamentals of
Computation Theory (FCT’05), Springer LNCS Bd.3623; siehe auch [29].
3 Nummerierung
fortgesetzt aus dem Erstantrag. . .
5
[25] S. Köhler, C. Schindelhauer, M. Ziegler: “On Approximating RealWord Halting Problems”, S.433-455 in Proc. 15th International Symposium on
Fundamentals of Computation Theory (FCT’05), Springer LNCS Bf.3623.
[26] M. Ziegler: “Computability and Continuity on the Real Arithmetic Hierarchy”, S.562-571 in Proc. CiE 2005: New Computational Paradigms, Springer
LNCS Bd.3526.
[27] K. Meer, M. Ziegler: “Uncomputability below the Real Halting Problem”,
S.368-377 in 2nd Conf. on Computability in Europe (CiE’06), Springer LNCS
Bd.3988.
[28] M. Ziegler: “Real Hypercomputation and Continuity”, S.177–206 in Theory
of Computing Systems vol.41 (2007).
[29] K. Meer, M. Ziegler: “An Explicit Solution to Post’s Problem over the
Reals”, Journal of Complexity vol.23 (2007).
[30] M. Ziegler: “Revising Type-2 Computation and Degrees of Discontinuity”,
S.255–274 in Proc. 3rd International Conference on Computability and Complexity in Analysis (CCA’06), Electronic Notes in Theoretical Computer Science
Bd.167 (2007).
[31] M.R. Emamy-K., M. Ziegler: “On the Coverings of the d-Cube for d ≤ 6”,
angenommen bei Discrete Applied Mathematics/Discrete Optimization, special
issue Proc. CTW 2005 ; erscheint vor. 2008.
[32] S. Le Roux, M. Ziegler: “Singular Coverings and Non-Uniform Notions of
Closed Set Computability”, S.169–185 in Proc. 4th International Conference
on Computability and Complexity in Analysis (CCA’07), Electronic Notes in
Theoretical Computer Science.
[33] M. Ziegler: “(Short) Survey of Real Hypercomputation” S.809–824 in Proc.
3rd Conference on Computability in Europe (CiE’07), Springer LNCS Bd.4497
(eingeladener Beitrag).
[34] K. Meer, M. Ziegler: “Real Computational Universality: The Word Problem for a Class of Groups with Infinite Presentation”, S.726–737 in Proc. 32nd
International Symposium on Mathematical Foundations of Computer Science
(MFCS 2007), Springer LNCS Bd.4708;
Vollversion eingereicht.
[35] S. Köhler: “Zur Praktikabilität schneller Polynomarithmetik”, Diplomarbeit
(2007).
[36] M. Ziegler: “Real Computability and Hypercomputation”, eingereicht als
Habilitationsschrift (September 2007).
[37] K. Lürwer-Brüggemeier, M. Ziegler: “On Faster Integer Calculations
using Non-Arithmetic Primitives”, eingereicht.
Weitere Referenzen
[BCdN06] P. Bürgisser, F. Cucker, P. de Naurois: “The Complexity of Semilinear Problems in Succinct Representation”, pp.197–235 in Computational Complexity vol.15 (2006).
6
[BCSS98] L. Blum, F. Cucker, M. Shub, S. Smale: “Complexity and Real
Computation”, Springer (1998).
[BFMS00] C. Burnikel, R. Fleischer, K. Mehlhorn, S. Schirra: “A Strong
and Easily Computable Separation Bound for Arithmetical Expressions
Involving Radicals”, pp.87–99 in Algorithmica vol.27 (2000).
[BKM*95] C. Burnikel, J. Könemann, K. Mehlhorn, S. Näher, S. Schirra,
C. Uhrig: “Exact Geometric Computation in LEDA”, pp.418–419 in
Proc. 11th Annual Symposium on Computational Geometry (SoCG’95).
[Brat03]
V. Brattka: “The Inversion Problem for Computable Linear Operators”, pp.391–402 in Proc. 20th Annual Symposium on Theoretical
Aspects of Computer Science (STACS 2003), Springer LNCS vol.2607.
[Brat05]
V. Brattka: “Effective Borel measurability and reducibility of functions”, pp.19–44 in Mathematical Logic Quarterly vol.51 (2005).
[BrHe98] V. Brattka, P. Hertling: “Feasible real random access machines”,
pp.490–526 in Journal of Complexity vol.14:4 (1998).
[BSS89]
L. Blum, M. Shub, S. Smale: “On a Theory of Computation and
Complexity over the Real Numbers: N P-Completeness, Recursive Functions, and Universal Machines”, pp.1–46 in Bulletin of the American
Mathematical Society (AMS Bulletin) vol.21 (1989).
[Burg04]
M. Burgin: “Algorithmic Complexity of Recursive and Inductive Algorithms”, pp.31–60 in Theoretical Computer Science vol.317 (2004).
[Coll07]
P. Collins: “Effective Computation for Nonlinear Systems”, pp.169–
178 in Proc. 3rd Conference on Computability in Europe (CiE 2007),
Springer LNCS vol.4497.
[Cuck92]
F. Cucker: “The arithmetical hierarchy over the reals”, pp.375–395 in
Journal of Logic and Computation vol.2(3) (1992).
[Gold65]
E.M. Gold: “Limiting Recursion”, pp.28–48 in Journal of Symbolic Logic vol.30:1 (1965).
[Hert96]
P. Hertling: “Topological Complexity with Continuous Operations”,
pp.315–338 in Journal of Complexity vol.12 (1996).
[vdHo06] J. van der Hoeven: “Effective real numbers in Mmxlib”, pp.138–145 in
Proc. International Symposium on Symbolic and Algebraic Computation
(ISSAC 2006).
[KLPY99] V. Karamcheti, C. Li, I. Pechtchanski, C.K. Yap: “A core library
for robust numeric and geometric computation”, pp.351–359 in Proc.
15th Annual Symposium on Computational Geometry (SoCG’99).
[Koep01] W.
Koepf:
“Besprechungen
zu
Büchern
der
Computeralgebra:
Klaus
Weihrauch
Computable
Analysis”,
p.29
in
Computeralgebra Rundbrief
vol.29
(2001),
http://www.fachgruppe-computeralgebra.de/CAR/CAR29/node19.html
[Lamb05] B. Lambov: “RealLib: an Efficient Implementation of Exact Real Arithmetic”, pp.81–98 in Mathematical Structures in Computer Science vol.17
(2007).
7
[LiVi97]
M. Li, P. Vitányi: “An Introduction to Kolmogorov Complexity and
Its Applications” (2nd Edition) Springer (1997).
[Muel01]
N. Müller: “The iRRAM: Exact Arithmetic in C++”, pp.222–252 in
Proc. 4th International Workshop on Computability and Complexity in
Analysis (CCA’2000), Springer LNCS vol.2064.
[Muth05] S. Muthukrishnan: “Data Streams: Algorithms and Applications”,
r
vol.1:2 of Foundations and Trends
in Theoretical Computer Science
(Editor: Madhu Sudan), now publishers (2005);
preliminary version:
http://www.cs.rutgers.edu/~muthu/stream-1-1.ps
[PERi89] M.B. Pour-El, J.I. Richards: “Computability in Analysis and Physics”, Springer (1989).
[Putn65]
H. Putnam: “Trial and Error Predicates”, pp.49–57 in Journal of Symbolic Logic vol.30:1 (1965).
[Schm02] J. Schmidhuber: “Hierarchies of Generalized Kolmogorov Complexities and Nonenumerable Universal Measures Computable in the Limit”,
pp.587–612 in International Journal of Foundations of Computer Science
vol.13:4 (2002).
[Seli06]
V. Selivanov: “Towards a Descriptive Set Theory for Domainlike Structures”, pp.258–282 in Theoretical Computer Science vol.365
(2006).
[Weih00]
K. Weihrauch: “Computable Analysis”, Springer (2000).
3
Ziele und Arbeitsprogramm
Unter Bezug auf die Ziele und das Arbeitsprogramm des Erstantrags wird im Folgenden dessen Nummerierung fortgesetzt. . .
3.1
Ziele
Die Verlängerung soll dazu dienen, das Projekt inhaltlich abzurunden und einige
im Erstantrag genannte Fragestellungen, die sich als besonders ergiebig erwiesen
haben, vertieft zu behandeln.
3.1.8
Ziel: Übertragung klassischer Rekursionstheorie ins BCSS-Modell
Die klassische Rekursions- und Berechenbarkeitstheorie ist zu einem wohlausgearbeiteten Gebiet gereift und reichhaltig sowohl an Struktur (z.B. der der TuringGrade) als auch an praxisrelevanten Ergebnissen (z.B. Hilberts 10. Problem, Wortproblem für Gruppen etc). Die BCSS- anstelle der Turingmaschine induziert bekanntlich [BSS89] eine ähnliche Theorie über R, die allerdings bei weitem nicht
auch nur annähernd so ausgearbeitet ist. Diesem Ziel möchte ich mich mit Abschnitt 3.2.12 des Arbeitsprogramms nähern.
3.1.9
Ziel: Behebung des Hauptkritikpunkts an der Rekursiven Analysis
Das der Rekursiven Analysis (vgl. Abschnitt 2.2.2) zugrundeliegende Modell (die
Turingmaschine mit dem semantischen Twist, unendliche Folgen von z.B. rationalen
Approximationen an z.B. reelle Zahlen ein- und auszugeben) gilt einerseits als das
8
realistischste reellen Rechnens, wird andererseits oftmals kritisiert [Koep01] wegen
der sich daraus ergebenden Implikationen: Eine berechenbare Funktion muß notwendig stetig sein, verlangt der bereits erwähnte ‘Hauptsatz’. Dieser Kritik möchte ich
begegnen mit der Untersuchung, ob und in wiefern (schwächste) Hyper computer in
der Lage sind, zumindest gewisse unstetige Funktionen effektiv auszuwerten; siehe
Abschnitten 3.2.13 und 3.2.14 des Arbeitsprogramms.
3.1.10
Ziel: Schwache Hypercomputer in die Praxis
Das Halteproblem H wird wohl auch auf Weiteres nicht praktisch gelöst werden
können. Andererseits gibt es Hypercomputer, die zwar mächtiger als die Turingmaschine aber echt schwächer als H sind: vgl. Posts Problem. Gerade über den reellen Zahlen ergeben sich solche Rechenmodelle sehr natürlich (z.B. Abschnitt 2.2.1)
und/oder sind, trotz ihrer Schwäche, überraschend nützlich und zudem numerisch
relevant. Diese zu realisieren zu wollen, klingt nur auf den ersten Blick vermessen:
siehe Abschnitt 3.2.15 des Arbeitsprogramms.
3.1.11
Ziel: Beziehungen zwischen Wissenschaftsgebieten
Berechenbarkeits- und Informationstheorie stehen schon lange in fruchtbarem Dialog; Sichtworte wie Kolmogorov-Komplexität, Zufälligkeit oder Martingale sind hier
beispielsweise zu nennen. Letztere werden bereits routinemäßig für reelle Zahlen
eingesetzt (z.B. von Jack Lutz, Peter Hertling, Rod Downey etc) im Sinne der Rekursiven Analysis. Diese wiederum steht in Beziehung zur Numerik (In/Stabilität ⇔ Un-/Stetigkeit) und zur Topologie (vgl. Abschnitt 2.1.2). Ich möchte
weiterhin Verbindungen zur Kolmogorov-Komplexität unendlicher Strings herstellen (Frage 3.3 in Abschnitt 3.2.13 des Arbeitsprogramms).
Über R gibt es andererseits das BCSS-Modell. Auch hier soll eine Kolmogorov’sche Komplexitätstheorie entwickelt werden (Abschnitte 3.2.12) in der Hoffnung auf Verwandtschaft zur Information-Based Complexity. Die Erfahrung aus
den bisherigen Arbeiten läßt vermuten, daß hier reelle Algebra eine wesentliche
Rolle spielen wird.
3.2
Arbeitsprogramm
Grob zusammengefaßt möchte ich
• den Fokus auf schwache (und daher realistischer e) Hypercomputer legen (Abschnitte 3.2.12 und 3.2.13),
• ausgewählte davon prototypisch implementieren (sic!, siehe Abschnitt 3.2.15)
und
• über bloße (hyper-)Berechenbarkeits- hinaus auch (hyper-)Komplexitätsaussagen gewinnen (Abschnitt 3.2.13).
Der letzte Punkt steht offenbar in Zusammenhang mit dem zweiten; und dieser wiederum mit dem ersteren. Dank der Vorarbeiten (Abschnitt 2.2) können sie simultan
angegangen werden.
3.2.12
BCSS-Gegenstücke klassischer Berechenbarkeitstheorie
Die Frage nach der Terminierung einer gegebenen (Kodierung einer) Turingmaschine ist das klassische, d.h. diskrete Halteproblem H und als solches unentscheidbar
durch eine Turingmaschine. Eine BCSS-Maschine hingegen kann dieses Problem
9
lösen; für sie unentscheidbar ist die Terminierung einer gegebenen (Kodierung einer) BCSS-Maschine: das reelle Halteproblem H.
In [34] haben wir, thematisch analog doch technisch aufwendig, die Unentscheidbarkeit und Vollständigkeit des klassischen Wortproblems für Gruppen auf
die BCSS-Welt übertragen. Andere über R = Z Turing-unentscheidbare Probleme hingegen werden über R = R BCSS-entscheidbar : die Lösbarkeit polynomieller
Gleichungssysteme (‘Hilberts Zehntes Problem’) über R[X] beispielsweise mittels
Tarskis Quantorenelimination. Dies zeigt, daß solche Übertragungen durchaus nichttrivial sein können.
I
Entsprechende Untersuchungen möchte ich für weitere klassisch-unentscheidbare
Probleme durchführen:
a) Radós Busy Beaver und Maximum Shift Funktionen Σ(n) und S(n);
b) die Kolmogorov-Komplexitätsfunktion;
c) Einfachzusammenhang gewisser Mannigfaltigkeiten.
I
Weiterhin stellt sich die Frage nach reellen Gegenstücken zu klassischen Resultaten
wie
d) Rekursionstheorem, Fixpunktsatz und Quines.
I
I
Bei a) und b) spielt die Zahl n der Zustände bzw. die Kodierungslänge einer Turingmaschine die wichtige Rolle eines Parameters. Ihr entspricht, zumal als Maß für
(nicht-)Uniformität, im BCSS-Milieu die Zahl der reellen Konstanten. Die BCSSKolmogorov-Komplexität einer endlichen Folge reeller Zahlen wird dann wohl im
Wesentlichen durch deren Transzendenzgrad bestimmt, ist also vermutlich BCSSunberechenbar; aber ist sie auch BCSS-vollständig? Dies scheint, zumal im Licht der
Diskussion aus Abschnitt 2.2.1, völlig offen und soll ein erstes Ziel meiner Forschung
werden.
Die Frage c) nach der BCSS-Entscheidbarkeit des Problems, ob eine gegebene
semi-lineare Menge einfachzusammenhängend ist, wurde in [BCdN06, Abschnitt 8]
aufgeworfen. Der Turing-Unentscheidbarkeitsbeweis für den Fall endlich-präsentierter Mannigfaltigkeiten basiert auf Reduktion vom Wortproblem; im Hinblick auf das
BCSS-Modell legt dies nahe, auf der (Vor-)Arbeit [34] aufzubauen zu versuchen.
3.2.13
Nichtuniform-berechenbare Analysis
Abschnitt 2.2.3 hat aus eigenen Vorarbeiten Beispiele natürlicher Funktionen (oder
Funktionale) f präsentiert, welche nicht-uniform berechenbar sind in dem Sinne,
daß f (x) für jedes x eine (gemäß Rekursiver Analysis und relativ zu x) berechenbare Zahl ist. Genauer scheiterte dort die uniforme Berechenbarkeit alleine aus Unstetigkeitsgründen: Den Resultaten (nicht jedoch deren i.d.R. grundverschiedenen
Beweisen!) lag nämlich folgendes gemeinsame Schema zugrunde:
Die Abbildung x 7→ f (x) wird berechenbar, sobald zusätzlich der ‘kanonischen’ kontinuierlichen Kodierung von x als Eingabe eine gewisse
diskrete Zusatzinformation über x beigefügt wird (welche die Maschine
aus Stetigkeitsgründen nämlich nicht selbst bestimmen kann).
Ein solchermaßen abgeschwächter Berechenbarkeitsbegriff
i) basiert also auf der Rekursiven Analysis als anerkannt realistischstes reelles
Rechenmodell,
ii) nimmt dabei der vorherrschenden Kritik [Koep01] am ‘Hauptsatz ’ den Wind
aus den Segeln,
10
iii) macht numerisch Sinn, wie im zweiten Absatz von von Abschnitt 2.2.3 erläutert,
iv) und ist praktisch realisierbar (da zu der ohnehin unendlichen Information über
x nur ein paar wenige zusätzliche Bits hinzuzufügen sind).
Frage 3.1 Wie viele Zusatzbits (gemäß iv) sind hinreichend und notwendig, um
ein nichtuniform berechenbares Problem zu lösen?
I
Diese möchte ich (asymptotisch) für die in Abschnitt 2.2.3 vorgestellten sowie für
einige weitere aus der Literatur bekannte Probleme angehen:
a) Spektralzerlegung symmetrischer n × n–Matrizen [18, Abschnitt 3.5] (Vermutung: Θ(log n) Bits);
b) Konvertierung von rationalen Approximationen mit Fehlerschranken (sog. CauchyDarstellung reeller Zahlen) in Binärdarstellung [Weih00, Theorem 4.1.13.2];
c) den effektiven Zwischenwertsatz [Weih00, Theorem 6.3.8.1] (“Jede berechenbare Funktion f : [0, 1] → R mit f (0) < 0 < f (1) besitzt eine berechenbare Nullstelle.”)
d) Finden eines berechenbaren Punktes in nichtleeren konvexen co-r.e. abgeschlossenen Mengen [32, Abschnitt 5].
Weitere solche Probleme ergeben sich naturgemäß im Verlauf der Forschung automatisch.
Methoden und Lösungsansätze: Die geplante Fragestellung steht in Beziehung
zu zahlreichen wohlbekannten Begriffen der Literatur auf. Man kann sie beispielsweise Auffassen als
Frage 3.2 In wie viele (nicht notwendig berechenbare) Bereiche X1 , . . . , XN muß
man dom(f ) zerlegen, damit die Einschränkungen f |Xi (i = 1, . . . , N ) jeweils berechenbar werden.
In der Tat besteht die diskrete Zusatzinformation dann in der Angabe, zusätzlich
zum Argument x für f , zu welchem Xi das x gehört. Frage 3.2 scheint Punkt a) in
Abschnitt 2.1.2 zu ähneln. Andererseits unterscheidet sich das hier angepeilte Maß
quantitativ wesentlich von den in Abschnitt 2.1.2 vorgestellten:
• Die charakteristische Funktion 1X : Rd → {0, 1} einer beliebigen Menge X ⊆
Rd ist mit nur einem Bit an Zusatzinformation berechenbar.
P
• Die konstante Funktion f : x 7→ n∈H 2−n ist topologisch beliebig gutartig
aber selbst mit beliebig (endlich) vielen Zusatzbits nicht berechenbar.
Andererseits kann man das Maß überraschenderweise zumindest asymptotisch äquivalent quantifizieren in Termen der relativen Kolmogorov-Komplexität (vgl. Abschnitt 2.1.1) unendlicher Zeichenketten:
Frage 3.3 Für ȳ, x̄ ∈ {0, 1}N bezeichne K(ȳ|x̄) die minimale Beschreibungslänge
einer Turingmaschine, welche ȳ ausgibt bei Eingabe von x̄; “∞” wenn keine solche
existiert. Fixiere F :⊆ {0, 1}N → {0, 1}N ; was ist dann supx̄∈dom(F ) K F (x̄)|x̄ ?
I
Hierbei ist F natürlich eine Realisierung der Funktion f aus Frage 3.1 oder 3.2.
Diese drei verschiedenen Sichtweisen (numerisch, topologisch, informationstheoretisch) auf die Fragestellung bringen mit sich eine Vielzahl an Methoden, die ich
zur Lösung der oben unter a)-d) genannten Probleme anwenden möchte.
11
3.2.14
I
Berechenbare diskret-wertige Funktionen
Der o.g. ‘Hauptsatz’ für berechenbare Funktionen über R besitzt bekannte Verallgemeinerungen auf andere Räume [Weih00, Theorem 3.2.11], um beispielsweise
auch mengenwertige Funktionen, Funktionale [Weih00, Theorem 6.3.2] oder Operatoren [Weih00, Theorem 6.4.3.2] zu erfassen. Er verbietet damit die Berechenbarkeit von Funktionen mit diskretem Wertebereich wie f : X → N — sofern deren
Definitionsbereich X zusammenhängend ist bezüglich der durch die (in der Regel
kanonischen) Kodierung der Elemente x ∈ X induzierten Topologie.
Gleichwohl letzteres oft der Fall ist, kann man es doch nicht a priori sehen; konkret waren wir sehr überrascht, als sich die Dimension eines homogenen Unterraums
von Rn als berechenbar herausstellte [18, Theorem 9iii].
Hier möchte ich weitere solche Beispiele für scheinbare ‘Gegenbeispiele’ zum
Hauptsatz finden. Für konkrete Kandidaten halte ich:
a) Die Windungszahl eines Weges γ : [0, 1] → R2
b) oder allgemeiner den Brouwer Grad d(f, Ω, p) einer Funktion f : Ω → Rn
c) bzw. die Anzahl (inkl. Multiplizität) der Pole einer analytischen Funktion;
d) die Dimension einer (irreduziblen) semi-algebraischen Varietät,
e) eventuell auch die Anzahl ihrer Zusammenhangskomponenten.
3.2.15
I
Implementierung von Hyper-Algorithmen
Der in Abschnitt 3.2.13 beschriebene Ansatz zur Berechnung reeller Funktionen,
Funktionale und Operatoren ist, wie dort bereits erwähnt, in hohem Maße realistisch: gleichwohl dem Gebiet Hyper computation zugehörig, sind beschränkt viele
Zusatzbits in der Regel (z.B. auf Grund von Hintergrundinformationen über die
Eingabe) leicht bereitzustellen; zudem ist das zugrundeliegende Rechenmodell der
Rekursiven Analysis ja bereits tatsächlich in Programme gegossen worden (Abschnitt 2.1.4).
Im vorliegenden Punkt des Arbeitsprogramms sollen daher die unter Abschnitten 3.2.13 und 3.2.14 entwickelten Algorithmen, ebenso wie die bereits gefundenen
(vgl. Abschnitt 2.2.3), implementiert und experimentell evaluiert werden. Gespannt
bin ich insbesondere auf das Abschneiden des o.g. Verfahrens zur Diagonalisierung
degenerierter Matrizen.
Als Grundlage ist die iRRAM angepeilt (vgl. Abschnitt 2.2.4). Sie muß dafür
zunächst auf das Rechnen mit Unterräumen (als Spezialfall abgeschlossener reeller
Mengen) erweitert werden – in Anlehnung an oder durch Kombination mit Ariadne.
3.3
Sonstige Angaben
— entfallen —
4
Beantragte Mittel
4.1
Personalkosten
Ich beantrage:
• 1 eigene Stelle (BAT IIa/TVL 13), 12 Monate Vollzeit;
• 8 Personenmonate SHK (19h/Woche).
12
Der Antragsteller hat am 11.11.2002 promoviert.
Als Hilfskraft soll mich Sven Köhler bei Arbeitspunkt 3.2.15 unterstützen.
Ergebnisse seiner Bachelorarbeit waren als [25] erschienen; in der gerade abgegebenen Diplomarbeit [35] hat er Erfahrungen mit Bibliotheken für reelles Rechnen
gesammelt (vgl Abschnitt 2.2.4).
4.1.1
Erklärung
Die Universität Paderborn stellt Herrn Ziegler im Falle der Bewilligung seines Antrags auf die Eigene Stelle befristet für die Dauer seiner Förderung durch die
Deutsche Forschungsgemeinschaft (DFG), höchstens aber für drei Jahre, als wissenschaftlichen Mitarbeiter ein. Sie stellt ihm für diesen Zeitraum die notwendige
Grundausstattung (z.B. Laborräume, Büroräume etc.) zur Verfügung. Es gelten die
an unserer Einrichtung einschlägigen Tarifvorschriften mit der Maßgabe, dass
a) sich die Arbeitspflicht von Herrn Ziegler auf sein von der DFG gefördertes
Forschungsvorhaben Zi 1009/1-1 und damit unmittelbar zusammenhängende
wissenschaftliche Dienstleistungen beschränkt und
b) der Arbeitgeber nicht durch dienstliche Anordnungen Einfluss auf die selbständige Bearbeitung des genannten Forschungsvorhabens nimmt.
(Datum und Unterschrift)
4.2
Wissenschaftliche Geräte
— entfallen —
4.3
Verbrauchsmaterial
— entfällt —
4.4
Reisen
Im Hinblick auf das beantragte Projekt sind u.a. folgende regelmäßige Konferenzen
thematisch relevant:
• Computability in Europe (CiE)
• Computability and Complexity in Analysis (CCA)
• Foundations of Computational Mathematics (FoCM)
• Mathematical Foundations of Computer Science (MFCS)
• Domains and Computability over Continuous Data Types
• International Colloqium on Algorithms, Logic, and Programming
(ICALP)
• Logic in Computer Science (LICS)
Zur Präsentation von Forschungsergebnissen auf ausgewählten dieser Kongresse
rechne ich, die bisherige Konferenzvortragsdichte (vgl. [24, 25, 26, 27, 30, 32, 33, 34],
dazu wichtige Workshops wie z.B. Domains VIII oder Dagstuhl Seminar 06021)
extrapolierend, mit voraussichtlich zwei inner- (Kosten: je ca. 500 Euro) und einer
außer-europäischen Reise (Kosten: ca. 1000 Euro) und beantrage daher an Mitteln:
2000 Euro
13
4.5
Publikationskosten
Zur Veröffentlichung (insbesondere der Arbeit [36]) beantrage ich einen Publikationskostenzuschuß in Höhe von 500 Euro.
4.6
Sonstige Kosten
— keine —
5
Voraussetzungen für die Durchführung des Vorhabens
5.1
Zusammensetzung der Arbeitsgruppe
Martin Ziegler, Dr. rer.nat.
Sven Köhler, cand.-inf.
5.2
Zusammenarbeit mit anderen Wissenschaftlern
Im Rahmen des Forschungsgebiets des Projekts arbeite ich insbesondere zusammen
mit
• Prof. Dr. Vasco Brattka (University of Cape Town, Südafrika)
• Prof. Dr. Peter Bürgisser (Universität Paderborn)
• Dr. Pieter Collins (CWI, Amsterdam)
• Prof. PhD Felipe Cucker (Hong Kong City University)
• Prof. Dr. Peter Hertling (Universität der Bundeswehr, München)
• Prof. Dr. Hajime Ishihara (JAIST, Japan)
• Prof. Dr. Ulrich Kohlenbach (Technische Universität Darmstadt)
• Prof. Dr. Klaus Meer (Universität Cottbus)
• Prof. Dr.-math. Friedhelm Meyer auf der Heide (Universität Paderborn)
• PD Dr. Norbert Müller (Universität Trier)
• Prof. Dr. Dieter Spreen (Universität Siegen)
• Prof. John V. Tucker (University of Wales Swansea, Großbritannien)
• Prof. Dr. Klaus Weihrauch (FernUniversität in Hagen)
• Prof. Chee K. Yap (Courant Institute, New York)
5.3
Arbeiten im Ausland und Kooperation mit ausländischen
Partnern
Die Kommunikation mit den im Ausland befindlichen der oben genannten Wissenschaftlern wird vorzugsweise über Email/Fax/Telefon bzw. während Treffen auf den
unter Abschnitt 4.4 genannten Konferenzen stattfinden; daher sind hierfür
— keine weiteren Mittel erforderlich. —
14
5.4
Apparative Ausstattung
Die Lehrstühle für Algebraische Komplexität und Algorithmische Algebra (Bürgisser) und für Algorithmen und Komplexität (Meyer auf der Heide) der Fakultät
V (Elektrotechnik, Informatik und Mathematik) der Universität Paderborn haben sich freundlicherweise bereiterklärt, einen Büro- und Computerarbeitsplatz zur
Verfügung zu stellen. Daher sind auch hierfür
— keine weiteren Mittel erforderlich. —
6
Erklärungen
6.1
Ein Antrag auf Finanzierung dieses Vorhabens wurde bei keiner anderen Stelle eingereicht. Wenn ich einen solchen Antrag stelle, werde ich die Deutsche Forschungsgemeinschaft unverzüglich benachrichtigen.
6.2
Dem Vertrauensmann der DFG an der Universität Paderborn, Prof. Dr.-math.
Friedhelm Meyer auf der Heide, ist dieser Antrag bekannt.
6.3
— entfällt —
7
Unterschrift
Paderborn, den 16. Oktober 2007
8
•
•
•
•
(Dr. Martin Ziegler)
Anlagen (elektronisch)
Lebenslauf und wissenschaftlicher Werdegang
(Short) Survey of Real Hypercomputation [33]
Habilitationsschrift [36] (eingereicht am 2.9.2007)
Webseite http://www.upb.de/cs/ag-madh/WWW/ziegler/DFG
15
Zugehörige Unterlagen
Herunterladen