1 Magisterarbeit „Kognitive Prinzipien melodischer Wahrnehmung“ Musikwissenschaftliches Institut der Universität zu Köln Von Elke Winkelhaus, Köln November 1999 7. Zusammenfassung der Ergebnisse mit Blick auf den aktuellen Forschungsstand Die Suche nach den grundlegenden kognitiven Prinzipien melodischer Wahrnehmung hat gezeigt, daß die Melodiewahrnehmung nicht isoliert untersucht werden darf, sondern immer im Rahmen einer ganzheitlichen musikalischen Wahrnehmung betrachtet werden muß. Die wesentlichen strukturellen Merkmale einer Melodie (v.a. Kontur, Intervall- und Akzentstruktur) werden stets in Abhängigkeit vom musikalischen Kontext sowie auf der Grundlage bereits vorhandenen musikalischen Wissens wahrgenommen. Die zentrale Frage der vorliegenden Arbeit, aufgrund welcher kognitiver Prinzipien beim Hörer die Wahrnehmung einer Melodie entsteht, wurde durch den Grundgedanken motiviert, daß das Gehörte nicht als Kopie akustischer Reizmuster, sondern als Produkt komplexer kognitiver Prozesse zu verstehen ist. „Das, was wir hören, d.h. als was wir das Gehörte auffassen, stellt [...] nicht eine Abbildung des physikalisch Gegebenen dar, sondern dessen Verarbeitung.“ (Gruhn 1989: 162) Der Prozeß des Musikhörens und –verstehens ist darauf ausgerichtet, die über das Gehör empfangene Flut von akustischen Informationen perzeptiv zu ordnen und auf der Basis des (bewußten oder unbewußten) Wissens, der Einstellung und Vorlieben zu kategorisieren und zu interpretieren. Musikalische Wahrnehmungsprozesse sind damit als Erkenntnisleistungen von individuellen, subjektiven Faktoren abhängig und nicht ausschließlich durch objektive Reizmuster determiniert. Das Erkennen von (melodischen) Gestalten, die nach perzeptiven Gruppierungsprinzipien organisiert werden, beruht immer schon auf einer Interpretationsleistung, in die der Hörer Erfahrungen, Wissen und Interessen einbringt. „Gestalt wird vom Hörer erst hergestellt; sie exisiert – was ihre Komplexität und ihre zeitliche Ausdehnung angeht – nur in dem Umfang, in dem sie vom Hörer als Ganzheit erfaßt werden kann.“ (Fricke 1993: 184) Erklingende Musik stellt sich als Zeitgestalt dar, die aus einer Vielzahl von hierarchischen und miteinander verwobenen Ebenen besteht, deren Zusammenhänge erst im „beziehenden Denken“ (Stumpf 1910: 341) des Rezipienten entstehen. Die 2 Melodiewahrnehmung richtet sich entsprechend auf zeitabhängige Klangbewegungsmuster, deren übergeordnete Beziehungsstrukturen im Rahmen interagierender Bottom-up- und Top-down-Prozesse verarbeitet werden. Die Fähigkeit, eben Erklungenes mit dem augenblicklich Gehörten in Beziehung zu setzen, um so überhaupt Gestalten wahrnehmen zu können, die Erwartungen auf den folgenden Verlauf erzeugen, setzt eine Hörweise voraus, die sich als „dynamische Aktivität“ (Kurth 1931: 259), als „dynamischer Prozeß“ (Leman 1991: 38) beschreiben läßt. Im Laufe der vorliegenden Arbeit ist deutlich geworden, welche kognitiven Prinzipien für die Melodiewahrnehmung im wesentlichen verantwortlich sind. Es wurde gezeigt, daß die Herstellung melodischer Beziehungsstrukturen vor allem von der Tonhöhen-, Kontur- und Rhythmuswahrnehmung abhängt. Die nähere Betrachtung und Diskussion einer Reihe experimenteller, musikpsychologischer Untersuchungen hat gezeigt, daß der Melodiewahrnehmung kognitive Prinzipien zugrundeliegen, die nicht nur für die Musik westlicher Kulturen gelten, sondern universellen Charakter besitzen. Hierzu zählen insbesondere die Prinzipien der Kategorien- und Ähnlichkeitsbildung, die Ordnungsgenerierung nach dem Prinzip der Setzung und Veränderung, das Sekundgangprinzip sowie die Gruppierung auf der Basis der Gestaltprinzipien. Vor allem die Dynamik musikalischer Hörprozesse, die nicht zuletzt aus der Wechselbeziehung zwischen diesen kognitiven Prinzipien resultiert, führt zu einer Komplexität der musikalischen Informationsverarbeitung, die Leman zufolge (1991: 43) den Einsatz intelligenter Computersysteme in der Musikforschung nötig macht. Die Entwicklung sogenannter Künstlicher Neuronaler Netze (KNN) hat dazu geführt, daß die menschliche Intelligenz nicht mehr nur aus der Perspektive logischer oder regelgestützter sondern auch dynamischer Systeme betrachtet wird. KNN bilden eine „bestimmte Klasse dynamischer Systeme“ (Leman 1991: 27), deren Architektur die im Gehirn vorgefundenen Nervenmechanismen simuliert beziehungsweise modelliert. In der Musik angewendete KNN haben u.a. zum Ziel, herauszufinden, wie zeitvariierende musikalische Informationen auf höheren Abstraktionsebenen eingefangen werden können, wie Merkmale über die Zeit gefunden und erkannt und wie zeitliche Beziehungen dargestellt werden können (vgl. Bharucha 1987 in West et al. 1991: 19/20). Bereits der klassische informationsverarbeitendes Symbolverarbeitungsansatz System betrachtet und hat den kognitive Menschen als Prozesse als Berechnungsprozesse auf- gefaßt, die mit Hilfe der Künstlichen Intelligenz modelliert 3 werden können (Newell & Simon 1976 in Strube 1996: 304ff.). Mit Hilfe des formalen Systems der Künstlichen Intelligenz können Informationen in symbolischer Form verarbeitet, das heißt assoziiert, organisiert, gespeichert, mit bereits vorhandenen Informationen verglichen und je nach Vergleichsresultat unterschiedlich bearbeitet werden (vgl. Fröhlich 1998: 228/229). „Im Symbolvberarbeitungsansatz bestand meistens eine Ähnlichkeit zwischen der mit musikwissenschaftlichen Mitteln analysierten und formal dargestellten Struktur (z.B. hierarchische Strukturbäume) und der Struktur der Repräsentation dieser musikalischen Struktur (hierarchische Repräsentationsstruktur).“ (Kleinen & Stoffer 1998: 1861) Innerhalb der Kognitionspsychologie und der Kognitiven Musikpsychologie vollzog sich Mitte der 1980er Jahren eine theoretische Umorientierung: angenommen wurde, daß neurale Prozesse nicht nur seriell und symbolisch, sondern zeitlich parallel ablaufen, und die Information nicht zentral oder hierarchisch, sondern distribuiert gespeichert wird. Als Hauptvertreter dieses sogenannten Parallelverarbeitungsansatzes (parallel distributed processing) beziehungsweise Konnektionistischen Ansatzes gelten James L. McClelland & David E. Rumelhart (1986), die eine Reihe konnektionistischer Modelle entwickelten. Parallelverarbeitungsmodelle orientieren sich an der Architektur von neuronalen Netzen, also mehrdimensional miteinander verbundenen Nervenbahnen im Gehirn. Der Konnektionismus unterscheidet sich von der Theorie der Symbolverarbeitung insbesondere dahingehend, daß die Architektur konnektionistischer Modelle aus vielen Verarbeitungseinheiten besteht, die im Vergleich zur Komplexität des Gesamtsystems relativ einfach sind und darüber hinaus keine bedeutungshaltigen Symbole sondern funktionelle Einheiten (units, nodes) darstellen (vgl. West et al. 1991: 16). Ein neuronales Netz besteht strukturell aus einer Verschaltung solcher funktionellen Einheiten zu einem Netzwerk. Die Informationsweiterleitung in diesem Netz erfolgt nach Prinzipien, die auch bei biologischen Nervenzellen (Neuronen) vorliegen: Über regelbare Eingangsgewichtungen erhält ein Neuron Informationen von vorgeschalteten Neuronen. Die Weiterleitung der Werte längs der Verbindungen im Netz hängt von der Stärke der Verknüpfungen zwischen den Neuronen ab, die durch wiederholte Aktivierung erlernt wird (vgl. McLeod et al. 1998: 14). Ein Neuron kann für jede Art von Information (z.B. für Tonhöhe, für ein rhythmisches Segment, für eine Frequenz etc.) stehen, die im Netzwerk verschlüsselt ist. Dabei führen Ähnlichkeitsbeziehungen, die beispielsweise durch die Transposition einer Melodie entstehen, nicht wie bei der 4 Symbolverarbeitung zu „strukturellen Ähnlichkeiten“ (Kleinen & Stoffer 1998: 1861) zwischen analysierten und repräsentierten Strukturen, sondern zu ähnlichen Aktivitätsmustern im Netzwerk. „Neuronale Netze können demnach im Prinzip alle dimensionalen oder kategorialen Diskriminationen musikalischer Art, zu denen ein Hörer fähig ist, abbilden.“ (Kleinen & Stoffer 1998: 1861) Hinsichtlich der musikpsychologischen Erforschung kognitiver Prinzipien der Melodiewahrnehmung bieten neuronale Netzwerkmodellierungen damit die Möglichkeit, nicht nur strukturelle sondern insbesondere auch funktionelle Merkmale der perzeptiven Organisation melodischer Beziehungsstrukturen berücksichtigen zu können. Darüber hinaus sind neuronale Netze dadurch lernfähig, daß sie die Stärke der Verbindungen zwischen den Verarbeitungseinheiten verändern können. Wird zum Beispiel die erste und fünfte Stufe eines Dreiklangs gespielt, so ergänzt beziehungsweise aktiviert das Netzwerk in Abhängigkeit vom musikalischen Kontext entweder die Dur- oder die Mollterz. Innerhalb eines neuronalen Netzes ist letztlich nicht das Layout der verschiedenen (hierarchischen) Ebenen der Verarbeitungseinheiten, sondern vielmehr das Muster der assoziativen Verbindungen zwischen diesen Einheiten (pattern of connectivity) von Bedeutung (vgl. Bharucha 1994: 232/233). Der Vorteil parallel verteilter Verarbeitungseinheiten bei der Modellierung der menschlichen Kognition besteht darin, die interagierenden Bottom-up- und Top-downProzesse der Verarbeitung im Hinblick auf das die Melodiewahrnehmung kennzeichnende „beziehende Denken“ (Stumpf 1910: 341) zu beschreiben. Die Fähigkeit zum „beziehenden Denken [Hören]“, zum „Heraushören“ (Mattusch 1995: 11) meint die aktive (Re-) Konstruktion der melodischen Gestalt auf der Basis bereits vorhandener (Hör-) Erfahrungen und bildet die Voraussetzung für die Melodiewahrnehmung, das heißt für das Erkennen von Ähnlichkeiten aufgrund struktureller sowie funktioneller Beziehungen.